🎙 Episodio 29. Cómo convertirse en un ninja del Big Data y la Inteligencia Artificial 

En el episodio de hoy de Un podcast ninja sobre Big Data vamos a hablar de qué hacer para convertirse en un ninja del Big Data, de la Inteligencia Artificial o de las dos cosas. O al menos os voy a contar algunas cosas que he aprendido y sigo aprendiendo yo en mi intento de transformarme en ninja del Big Data. 

Muchos de los emails que recibo son para preguntarme sobre formación en Ciencia de datos, Big Data y estas cosas… Másteres, formaciones profesionales, bootcamps, etc…

Y yo siempre respondo lo mismo… depende.

Esto es un campo tan amplio y que evoluciona tan rápido que es muy complicado mantener un programa de estudios actualizado y relevante.

Además, los avances se van construyendo sobre las cosas que ya hay.

Por poner un ejemplo, ChatGPT se construye sobre los modelos de lenguaje generativos y sobre técnicas de aprendizaje por refuerzo, que en sí mismas podrían ser temas para dos módulos de un plan de estudios.

Y a su vez la arquitectura de este modelo de lenguaje generativo es un tipo de arquitectura de todos los modelos de procesado del lenguaje natural que hay, en concreto la basada en transformers.

Y estos modelos de procesado de lenguaje natural se basan en redes neuronales profundas o deep learning que podrían de nuevo ser el foco de un módulo de estudio completo en un programa de estudios… etc

Para que os hagáis una idea, el tiempo estimado para completar la especialización en Deep Learning en Coursera, que es una plataforma de aprendizaje online, es de unas 160 horas, que podría ser equivalente a unos 6 créditos universitario más o menos, o sea que equivale a una asignatura completa.

Y esto es sólo una parte concreta dentro del Machine Learning, luego también está la analítica de datos para poder sacar información de los datos o la ingeniería de datos para saber gestionar la infraestructura para manejar todo esto y sin hablar ya de las matemáticas y la estadística necesarias para entender cómo funcionan las tripas de todos estos modelos de Machine Learning.

Vamos, que ser ninja de los datos no es algo que se consigue ni de la noche a la mañana, ni con un curso intensivo de 1, 3 ó 6 meses… eso sí, con este tipo de formaciones seguramente se pueden conseguir unas habilidades básicas de manera relativamente rápida y lo que es más importante, una visión global de todo el ecosistema que gira en torno a los datos para saber por dónde tirar después.

Así que, paciencia porque hay mucho camino por delante. Si no lo hubiera no existiría un grado universitario llamado Ciencia de datos con un plan de estudios de 4 años..

El grado sería la opción más clásica y tradicional, empiezas con una asignatura de matemáticas que apruebas con sangre, sudor y lágrimas, luego estadística, después cálculo, programación… y para cuando pasas de curso ya no sabes ni qué estás estudiando. 

Eso sí, se construye desde los fundamentos más fundamentales y es mucho más sencillo que te digan lo que tienes que aprender y te lo expliquen a tener que ir a buscarlo tú.

Peeero igual no hay mucha gente en la audiencia que esté decidiendo qué estudiar en la universidad o tenga 4 años por delante para dedicárselos a un grado.

Así que volvemos a formaciones para conseguir unas habilidades básicas y una visión global de todo el ecosistema para saber hacia dónde queremos ir y ya a partir de ahí tenemos internet y ganas. Podemos aprender casi cualquier cosa.

 Además los datos es algo completamente transversal y tienen la gran ventaja de que podéis elegir la industria que más os guste para aplicar vuestros conocimientos ninja. Salud, deporte, ventas, marketing... Cualquier industria. Cualquiera.

Incluso es bastante común la gente que domina un campo concreto y vitamina sus capacidades aprendiendo a sacar partido a los datos en su sector mediante aprendizaje automático o análisis de datos.

Estrategias de aprendizaje de Big Data e IA

Una vez que habéis decidido por dónde empezar hay dos estrategias para aprender casi cualquier cosa:

  • La estrategia en la que primero se aprende toda la teoría y luego se empieza a usar.
  • La estrategia en la que se comienza a implementar sin tener ni idea de lo que se está haciendo.

Cada una de estas estrategias tiene sus ventajas y sus inconvenientes y cada una de estas estrategias se adapta mejor a un tipo de persona diferente.

En cuanto a la estrategia basada en teoría, es la que tradicionalmente se utiliza en la enseñanza reglada, cursos, grados, másters, etc…

Estrategia basada en teoría

Primero me enseñan los conceptos y yo escucho lo más atentamente que puedo o tomas notas, después me ponen algún ejemplo sencillo y por último hay que estudiar para un examen. En mi caso, el 80% de las veces he olvidado todo lo estudiado al salir por la puerta del examen.

No sé si estoy sola en esto…

Lo bueno es que, como decía antes, los conceptos se van construyendo uno sobre otro, de más simples a más complejos. Luego, un día llegas a la vida real y te das cuenta de los agujeros que tiene tu conocimiento y toca reaprender algunas cosas.

Es un proceso en el que se tarda mucho en ver resultados, se tarda mucho en detectar los errores de concepto que tenemos o las cosas que creíamos entender bien pero en realidad no habíamos pillado.

Estrategia basada en la práctica

Y luego tenemos la estrategia de empezar a implementar cosas sin tener ni idea de lo que estamos haciendo.

Esto no es válido para cualquier campo... Imaginad  un cirujano aprendiendo medicina practicando directamente sobre pacientes. 

Lo bueno es que en Big Data sí se puede llevar a cabo sin poner en peligro la vida de nadie… eso sí, os advierto de que se vienen frustraciones por el camino.

 La idea es adquirir los conocimientos mínimos y ponerlos en práctica sin esperar a ser un crack de las matemáticas o dominar la teoría detrás del deep learning.

Al empezar a implementar pequeños proyectos enseguida os chocareis contra el muro de todo lo que no sabéis. Al principio será un muro altísimo pero no hay que abrumarse. Buscad la siguiente pieza que necesitais para seguir, el concepto que te falta para continuar, apréndedlo y proseguid.

De la misma manera que no hace falta tener conocimientos de mecánica para aprender a conducir, tampoco es necesario dominar toda la teoría antes de comenzar a trastear en el mundo de los datos.

Lo que sí va a hacer falta es conseguir unas bases de programación. El lenguaje que más os guste, aunque yo recomiendo Python por ser el más extendido en Ciencia de Datos. 

Y bueno también podéis seguir escuchando este podcast… aquí intento abordar todas las ramas del mundo de los datos desde cómo lo aplican las empresas, con ejemplos concretos como Starbucks o AirBnb, o casos de uso de distintos sectores como la política o la agricultura.

A veces hablamos más de Machine Learning y otras veces de análisis de datos o de ingeniería de datos.

Si os fijáis en qué episodios os van interesando más y cuáles menos podéis ir acotando el nicho en el que enfocaros.

Los 3 mandamientos para convertirse en ninja del Big Data

Y no olvidéis estos 3 mandamientos para convertiros en verdaderos ninjas del Big Data y del Machine Learning

  • Empezad por algún sitio. No hay un orden correcto. Cualquier formación que os dé una visión general de todas las ramas que hay, buscar en google, incluso la propia guía ninja del Big Data y el Machine Learning que podéis descargar en datos.ninja  puede ser un buen comienzo para saber qué os resulta más interesante dentro del campo de Big Data. 
  • No es necesario saberlo todo. Una vez sepáis lo básico, podéis comenzar a resolver problemas incluso cuando aún no os sintáis preparados. Podéis plantear un problema que os resulte interesante y empezar por entender lo mínimo necesario para continuar implementando el proyecto que hayais elegido y después profundizar.
  • Nunca dejéis de aprender. Ser un ninja del Big Data es una maratón. El Big Data, la Ciencia de Datos y el campo del Machine Learning están en constante evolución. Nuevas técnicas, nuevos modelos y nuevas herramientas aparecen cada día así que es un aprendizaje continuo.

Espero que os guste el episodio.

Si es así, no olvidéis dejar un «Me gusta» y algún comentario al episodio en Ivoox o una valoración de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuchéis el podcast. 

Recordad que si tenéis cualquier duda o pregunta podéis contactar conmigo a través del formulario de contacto o podemos seguir la conversación en Twitter.

Muchas gracias por estar ahí y os espero en el próximo episodio de Un Podcast Ninja sobre Big Data.

Accede a todo el contenido premium

Ya no necesitas pagar cientos de euros por un Bootcamp para convertirte en ninja de los datos. Por solo 17€/mes (o menos 🤯), obtén acceso al podcast premium, a todos los tutoriales y a los resúmenes de los libros más top sobre Machine Learning y Ciencia de datos y aprende a tu ritmo.
¡Empieza ahora!
Copyright © 2024  · Datos 🥷 · Todos los derechos reservados