馃帣 Episodio 29. C贸mo convertirse en un ninja del Big Data y la Inteligencia Artificial聽

En el episodio de hoy de Un podcast ninja sobre Big Data vamos a hablar de qu茅 hacer para convertirse en un ninja del Big Data, de la Inteligencia Artificial o de las dos cosas. O al menos os voy a contar algunas cosas que he aprendido y sigo aprendiendo yo en mi intento de transformarme en ninja del Big Data.聽

Muchos de los emails que recibo son para preguntarme sobre formaci贸n en Ciencia de datos, Big Data y estas cosas鈥 M谩steres, formaciones profesionales, bootcamps, etc鈥

Y yo siempre respondo lo mismo鈥 depende.

Esto es un campo tan amplio y que evoluciona tan r谩pido que es muy complicado mantener un programa de estudios actualizado y relevante.

Adem谩s, los avances se van construyendo sobre las cosas que ya hay.

Por poner un ejemplo, ChatGPT se construye sobre los modelos de lenguaje generativos y sobre t茅cnicas de aprendizaje por refuerzo, que en s铆 mismas podr铆an ser temas para dos m贸dulos de un plan de estudios.

Y a su vez la arquitectura de este modelo de lenguaje generativo es un tipo de arquitectura de todos los modelos de procesado del lenguaje natural que hay, en concreto la basada en transformers.

Y estos modelos de procesado de lenguaje natural se basan en redes neuronales profundas o deep learning que podr铆an de nuevo ser el foco de un m贸dulo de estudio completo en un programa de estudios鈥 etc

Para que os hag谩is una idea, el tiempo estimado para completar la especializaci贸n en Deep Learning en Coursera, que es una plataforma de aprendizaje online, es de unas 160 horas, que podr铆a ser equivalente a unos 6 cr茅ditos universitario m谩s o menos, o sea que equivale a una asignatura completa.

Y esto es s贸lo una parte concreta dentro del Machine Learning, luego tambi茅n est谩 la anal铆tica de datos para poder sacar informaci贸n de los datos o la ingenier铆a de datos para saber gestionar la infraestructura para manejar todo esto y sin hablar ya de las matem谩ticas y la estad铆stica necesarias para entender c贸mo funcionan las tripas de todos estos modelos de Machine Learning.

Vamos, que ser ninja de los datos no es algo que se consigue ni de la noche a la ma帽ana, ni con un curso intensivo de 1, 3 贸 6 meses鈥 eso s铆, con este tipo de formaciones seguramente se pueden conseguir unas habilidades b谩sicas de manera relativamente r谩pida y lo que es m谩s importante, una visi贸n global de todo el ecosistema que gira en torno a los datos para saber por d贸nde tirar despu茅s.

As铆 que, paciencia porque hay mucho camino por delante. Si no lo hubiera no existir铆a un grado universitario llamado Ciencia de datos con un plan de estudios de 4 a帽os..

El grado ser铆a la opci贸n m谩s cl谩sica y tradicional, empiezas con una asignatura de matem谩ticas que apruebas con sangre, sudor y l谩grimas, luego estad铆stica, despu茅s c谩lculo, programaci贸n鈥 y para cuando pasas de curso ya no sabes ni qu茅 est谩s estudiando. 

Eso s铆, se construye desde los fundamentos m谩s fundamentales y es mucho m谩s sencillo que te digan lo que tienes que aprender y te lo expliquen a tener que ir a buscarlo t煤.

Peeero igual no hay mucha gente en la audiencia que est茅 decidiendo qu茅 estudiar en la universidad o tenga 4 a帽os por delante para dedic谩rselos a un grado.

As铆 que volvemos a formaciones para conseguir unas habilidades b谩sicas y una visi贸n global de todo el ecosistema para saber hacia d贸nde queremos ir y ya a partir de ah铆 tenemos internet y ganas. Podemos aprender casi cualquier cosa.

聽Adem谩s los datos es algo completamente transversal y tienen la gran ventaja de que pod茅is elegir la industria que m谩s os guste para aplicar vuestros conocimientos ninja. Salud, deporte, ventas, marketing... Cualquier industria. Cualquiera.

Incluso es bastante com煤n la gente que domina un campo concreto y vitamina sus capacidades aprendiendo a sacar partido a los datos en su sector mediante aprendizaje autom谩tico o an谩lisis de datos.

Estrategias de aprendizaje de Big Data e IA

Una vez que hab茅is decidido por d贸nde empezar hay dos estrategias para aprender casi cualquier cosa:

  • La estrategia en la que primero se aprende toda la teor铆a y luego se empieza a usar.
  • La estrategia en la que se comienza a implementar sin tener ni idea de lo que se est谩 haciendo.

Cada una de estas estrategias tiene sus ventajas y sus inconvenientes y cada una de estas estrategias se adapta mejor a un tipo de persona diferente.

En cuanto a la estrategia basada en teor铆a, es la que tradicionalmente se utiliza en la ense帽anza reglada, cursos, grados, m谩sters, etc鈥

Estrategia basada en teor铆a

Primero me ense帽an los conceptos y yo escucho lo m谩s atentamente que puedo o tomas notas, despu茅s me ponen alg煤n ejemplo sencillo y por 煤ltimo hay que estudiar para un examen. En mi caso, el 80% de las veces he olvidado todo lo estudiado al salir por la puerta del examen.

No s茅 si estoy sola en esto鈥

Lo bueno es que, como dec铆a antes, los conceptos se van construyendo uno sobre otro, de m谩s simples a m谩s complejos. Luego, un d铆a llegas a la vida real y te das cuenta de los agujeros que tiene tu conocimiento y toca reaprender algunas cosas.

Es un proceso en el que se tarda mucho en ver resultados, se tarda mucho en detectar los errores de concepto que tenemos o las cosas que cre铆amos entender bien pero en realidad no hab铆amos pillado.

Estrategia basada en la pr谩ctica

Y luego tenemos la estrategia de empezar a implementar cosas sin tener ni idea de lo que estamos haciendo.

Esto no es v谩lido para cualquier campo... Imaginad  un cirujano aprendiendo medicina practicando directamente sobre pacientes. 

Lo bueno es que en Big Data s铆 se puede llevar a cabo sin poner en peligro la vida de nadie鈥 eso s铆, os advierto de que se vienen frustraciones por el camino.

 La idea es adquirir los conocimientos m铆nimos y ponerlos en pr谩ctica sin esperar a ser un crack de las matem谩ticas o dominar la teor铆a detr谩s del deep learning.

Al empezar a implementar peque帽os proyectos enseguida os chocareis contra el muro de todo lo que no sab茅is. Al principio ser谩 un muro alt铆simo pero no hay que abrumarse. Buscad la siguiente pieza que necesitais para seguir, el concepto que te falta para continuar, apr茅ndedlo y proseguid.

De la misma manera que no hace falta tener conocimientos de mec谩nica para aprender a conducir, tampoco es necesario dominar toda la teor铆a antes de comenzar a trastear en el mundo de los datos.

Lo que s铆 va a hacer falta es conseguir unas bases de programaci贸n. El lenguaje que m谩s os guste, aunque yo recomiendo Python por ser el m谩s extendido en Ciencia de Datos. 

Y bueno tambi茅n pod茅is seguir escuchando este podcast鈥 aqu铆 intento abordar todas las ramas del mundo de los datos desde c贸mo lo aplican las empresas, con ejemplos concretos como Starbucks o AirBnb, o casos de uso de distintos sectores como la pol铆tica o la agricultura.

A veces hablamos m谩s de Machine Learning y otras veces de an谩lisis de datos o de ingenier铆a de datos.

Si os fij谩is en qu茅 episodios os van interesando m谩s y cu谩les menos pod茅is ir acotando el nicho en el que enfocaros.

Los 3 mandamientos para convertirse en ninja del Big Data

Y no olvid茅is estos 3 mandamientos para convertiros en verdaderos ninjas del Big Data y del Machine Learning

  • Empezad por alg煤n sitio. No hay un orden correcto. Cualquier formaci贸n que os d茅 una visi贸n general de todas las ramas que hay, buscar en google, incluso la propia gu铆a ninja del Big Data y el Machine Learning que pod茅is descargar en datos.ninja聽 puede ser un buen comienzo para saber qu茅 os resulta m谩s interesante dentro del campo de Big Data.聽
  • No es necesario saberlo todo. Una vez sep谩is lo b谩sico, pod茅is comenzar a resolver problemas incluso cuando a煤n no os sint谩is preparados. Pod茅is plantear un problema que os resulte interesante y empezar por entender lo m铆nimo necesario para continuar implementando el proyecto que hayais elegido y despu茅s profundizar.
  • Nunca dej茅is de aprender. Ser un ninja del Big Data es una marat贸n. El Big Data, la Ciencia de Datos y el campo del Machine Learning est谩n en constante evoluci贸n. Nuevas t茅cnicas, nuevos modelos y nuevas herramientas aparecen cada d铆a as铆 que es un aprendizaje continuo.

Espero que os guste el episodio.

Si es as铆, no olvid茅is dejar un 芦Me gusta禄 y alg煤n comentario al episodio en Ivoox o una valoraci贸n de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuch茅is el podcast. 

Recordad que si ten茅is cualquier duda o pregunta pod茅is contactar conmigo a trav茅s del formulario de contacto o podemos seguir la conversaci贸n en Twitter.

Muchas gracias por estar ah铆 y os espero en el pr贸ximo episodio de Un Podcast Ninja sobre Big Data.

Bolet铆n Ninja

Suscr铆bete a la newsletter y recibe la gu铆a ninja del Big Data y la Inteligencia Artificial.

Gu铆a ninja del Big Data
Copyright 漏 2023  路 Datos 馃シ 路 Todos los derechos reservados