En el episodio de hoy de Un podcast ninja sobre Big Data hablamos de la importancia de la alfabetización en datos o data literacy, especialmente tras la cuarta revolución industrial.
Los datos son un pilar fundamental en la cuarta revolución industrial o industria 4.0, término que fue acuñado por el fundador del Foro Económico Mundial en 2016.
Primero llego el momento en el que las sociedades agrarias y rurales se transformaron en industriales y urbanas
Luego, en la segunda revolución industrial, fue cuando se empezó a usar la energía eléctrica para crear la producción en masa.
Además en esta también surgió el teléfono y el motor de combustión interna.
En la tercera ya aparecieron los dispositivos electrónicos, el ordenador personal, Internet…
Sin Internet y todos los dispositivos electrónicos que nos rodean no tendríamos todos estos datos que son el combustible que alimenta gran parte de la industria 4.0.
La computación en la nube, el Big Data, el Machine Learning, los modelos del lenguaje…
La era de los ninjas del big data y la Inteligencia Artificial.
Y de igual manera que hoy en día es una gran desventaja no manejarse bien con un ordenador o saber desenvolverse en Internet, empieza a ser importante adquirir habilidades relacionadas con los datos.
En inglés tienen un nombre para esto y es Data Literacy, que se traduce como alfabetización en datos.
¿Y en qué consiste esto de la alfabetización en datos o data literacy?
Pues básicamente en la habilidad de leer, escribir y entender los datos.
Esto no quiere decir ser un estadístico o un analista de datos consumado. De la misma manera que todos sabemos leer, escribir y entendemos lo que leemos y no somos literatos.
Sino en ser capaces de comunicarse utilizando datos y ser capaces de interpretarlos en contexto.
Muchas veces puedes saber mucho sobre datos pero si no sabes cómo funciona el entorno en el que viven esos datos, qué resultados tienen sentido y cuáles no, tu solución no será óptima.
Puede que ni siquiera sea buena.
Por eso es bueno contar con alguien que sepa del campo en el que se está intentando aplicar soluciones basadas en datos.
Si es para optimizar procesos de logística, pues que sepa de logística.
Si es para marketing, que sepa de marketing.
Y así.
¿Y qué mejor si ese experto, además de saber de lo suyo, sabe interpretar y comunicarse utilizando datos?
Pues en ese caso el analista, científico de datos o especialista en Machine Learning y él tendrán un idioma común para comunicarse.
Por un lado, el científico de datos o el equipo de datos necesita entender el contexto del negocio que envuelve a los datos que va a utilizar para crear su solución.
Y por el otro lado, el resto de empleados del negocio, especialmente los encargados de tomar decisiones, necesitan entender los datos relevantes en su trabajo del día a día.
Eso es lo que realmente hace que una organización sea data-driven o lo que es lo mismo, que se apoye en los datos para diseñar sus estrategias.
Es eso y no que sea capaz de capturar muchísimos datos y que tenga un equipo de datos de lo más potente.
Si los hallazgos y la información se queda en el departamento de datos o en un informe que se reparte al restos de áreas pero que nadie más es capaz de leer e interpretar pues es casi como si no se hubiera hecho nada.
En el entorno laboral, para que todo el mundo pueda alfabetizarse en datos es necesario tener acceso a los datos.
Como digo, muchas veces el acceso a los datos está limitado a los ninjas de los datos en la organización, a científicos de datos o analistas del equipo de datos.
Esto hace que el resto de empleados no puedan habituarse a explorar estos datos, a hacerse preguntas y poder buscar las respuestas en datos que estén a su alcance.
Si pudieran exponerse a los datos relacionados con su trabajo podrían aportar más valor en su puesto.
Por supuesto que no todo el mundo puede tener los mismos permisos sobre las bases de datos completas de una organización.
Para empezar una persona sin los conocimientos oportunos tocando donde no debe puede llevar a la corrupción de los datos.
O incluso a su destrucción.
Peeero igual un acceso de solo lectura, en plan se mira pero no se toca, sobre el subconjunto de datos que es relevante para un puesto pues podría ser positivo.
Además es necesario que la gente sea capaces de encontrar sentido en los datos a los que se enfrenta.
Ser capaces de entender visualizaciones y ver lo que esos datos están contando. Que cuando les llegue el informe mensual de lo que han estado haciendo desde el equipo de datos, puedan realmente entender qué está pasando, en qué les puede estar afectando a ellos y ver cómo pueden colaborar con lo que sea que diga el informe del equipo de datos sobre la organización.
Finalmente, otra capacidad a desarrollar es la de comunicar y discutir con los datos en la mano.
Argumentando decisiones basadas en datos en lugar de basarse únicamente en la intuición y en cómo se han hecho las cosas en el pasado.
Ahí es cuando realmente una empresa tiene una cultura del dato implantada. No cuando tiene un equipo de datos muy potente y un datacenter a rebosar de datos sino cuando el resto de sus empleados son también capaces de leer, escribir e interpretar datos.
Están alfabetizados en datos. Han desarrollado su data literacy.
¿Y para el resto de la población?
Pues aquí es incluso más importante y peliagudo.
Seguir ciegamente los datos no es nunca una buena idea.
Una cualidad fundamental para poder entender, interpretar y comunicarnos a través de los datos es el pensamiento crítico.
Ser capaces de plantearnos preguntas.
¿De dónde vienen estos datos?
¿Son datos válidos?
¿Están sesgados?
Esto pasa frecuentemente en las noticias y en los periódicos.
Se presentan gráficos engañosos “basados en datos”.
Un ejemplo es el gráfico que compara la rapidez en llegar al millón de usuarios de ChatGPT frente a otras aplicaciones también muy conocidas como Instagram, Netflix, etc…
Como sabéis, a finales de 2022 se lanzó ChatGPT que alcanzó el millón de usuarios en sólo 5 días pero lo comparan con Netflix que tardó 3.5 años en alcanzar la misma cifra de usuarios.
Aquí podría parecer que los de Netflix son unos mataos…
3 años y medio frente a 5 días… los datos hablan por sí mismos.
Peeero Netflix se lanzó en 1999 no en 2022.
Ahí aún ni había redes sociales, ni whatsapp, ni nada, las cosas se transmitían porque alguien que conocías te lo recomendaba o porque veías un anuncio en la tele, en algún periódico o en alguna valla publicitaria.
El alcance de un producto en 1999 y ahora no tiene que ver.
Además, Netflix se lanzó solo en EEUU y no a nivel mundial y es un producto de pago.
ChatGPT se lanzó en su versión gratuita que aún hoy sigue manteniendo.
¿Es comparable? yo diría que no… nos dice algo concluyente esa gráfica que por supuesto está basada en datos reales… mmm, complicado comparar ambas situaciones.
Así que es muy importante hacerse preguntas.
La próxima vez que veais conclusiones basadas en datos no olvidéis haceros preguntas en especial si es periodo electoral. Ahí se pueden usar los mismos datos para argumentar posiciones opuestas y es muy importante saber leer e interpretar los datos.
Espero que os guste el episodio.
Si es así, no olvidéis dejar un «Me gusta» y algún comentario al episodio en Ivoox o una valoración de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuchéis el podcast.
Recordad que si tenéis cualquier duda o pregunta podéis contactar conmigo a través del formulario de contacto o podemos seguir la conversación en Twitter.
Muchas gracias por estar ahí y os espero en el próximo episodio de Un Podcast Ninja sobre Big Data.