¿Qué es el Big Data?

Quizás has llegado hasta aquí porque últimamente oyes hablar de Big Data por todas partes. De cómo el Big Data va a cambiar el mundo tal y cómo lo conocemos.

... y en realidad tú no sabes muy bien de qué va eso del Big Data.

¿Es un invento revolucionario?

¿Es una tecnología extraterrestre?

¿Es magia negra?

Vamos a empezar por descartar el primero. Aunque el término “Big Data” comenzó a usarse a principios de los noventa, los seres humanos llevamos almacenando datos y tomando decisiones a partir de ellos desde tiempos inmemoriales.

En cualquier banco se apuntaba en cuadernos los datos sobre gastos, ingresos y créditos de los clientes y se decidía si prestarle o no más dinero a un cliente concreto a partir de esos datos.

Nada nuevo.

Sin embargo, el avance de la tecnología ha permitido que cada día se generen, procesen y se puedan almacenar más cantidad de datos porque, en principio (y solo en principio) cuantos más datos tengamos más informada será nuestra decisión en prácticamente cualquier campo.

Entonces… ¿Qué es el Big Data?

Definición de Big Data

El Big Data es el ecosistema que permite manejar volúmenes muy grandes de datos, tan grandes que tienen que repartirse entre varios ordenadores.

Además, los datos no paran de generarse y se tienen que poder tratar o almacenar a una velocidad alta.

Y, por si fuera poco, los datos que llegan no son todos iguales, algunos son registros con información estructurada, archivos de correo electrónico, imágenes, vídeos… son variados.

Volviendo al ejemplo del banco, imagínate a un empleado del banco del que hablaba antes tomando la decisión de conceder o no un préstamo a un cliente.

Sin embargo, esta vez no solo va a basar su decisión en los movimientos financieros de éste sino en todos los datos sobre la situación de todos los clientes de ese banco hasta ese mismo instante. Seguramente tomará una mejor decisión pero… ¿será capaz de tomarla por sí mismo?

Características principales del Big Data

De la definición seguro que intuyes varias características de un ecosistema de Big Data, conocidas también como las 3 Vs de Big Data:

  • Volumen: el volumen de los datos que tenemos es lo suficientemente grande como para que no podamos almacenarlos en una sola máquina ¡Y además no paran de crecer!
  • Velocidad: El procesamiento y el análisis de los datos se tiene que poder hacer en un tiempo  razonable. Si Google tardara media hora en ofrecerme el resultado en el buscador, cambiaría de buscador 🧐
  • Variedad: Los datos pueden ser de todo tipo. 

A lo largo de los años se han ido añadiendo otras Vs (si haces una búsqueda rápida en Google podrás llegar a encontrar hasta 10 Vs) pero para entender el concepto de Big Data las más importantes son Volumen, Velocidad y Variedad.

Analítica de datos y Big Data

Habíamos dejado a nuestro banquero agobiado analizando todos los datos históricos del banco. Tiene que entregarle la decisión sobre la solvencia de un cliente a su jefe hoy (...cosas de jefes) y, aunque tiene la experiencia suficiente en el sector como para poder formarse una opinión sobre un cliente a partir de algunos datos concretos, encontrar todos los patrones que llevan a un cliente a ser solvente o no en esa cantidad de datos en poco tiempo es imposible.

Las técnicas de análisis de datos (Data Analytics) permiten detectar patrones en los datos y así poder obtener soluciones a problemas concretos.

En este caso, saber si un cliente del banco es solvente o no.

No es necesario estar en un ecosistema de Big Data para realizar análisis de datos. Es decir, para aplicar Data Analytics no necesito muchísimos datos, simplemente necesito datos. 

Recuerda que nuestro banquero, llamemosle Paco, ya hacía su trabajo cuando únicamente tenía registros en cuadernos.

Sin embargo, la posibilidad de disponer de muchos más datos y ser capaces de procesarlos vitamina ese análisis,  resultando en una decisión más informada sobre cómo solucionar un problema concreto.

Inteligencia de Negocio y Big Data

Otro campo que suele mezclarse en el ecosistema de Big Data es la Inteligencia de Negocio (Business Intelligence). 

En este caso, se utilizan los datos para conocer el estado actual de un negocio en particular y asistir en la toma de decisiones estratégicas sobre el mismo. Es una manera de asistir a los responsables de la toma de decisiones a la hora de realizar su trabajo pero no predice que va a suceder, ni indica la decisión a tomar.

La Inteligencia de Negocio es descriptiva. 

Es por ello que las herramientas de Inteligencia de Negocio están muy relacionadas con la visualización de los datos.

Paco recibe una visita.

Margarita tiene que preparar los resultados de la situación actual del banco para que el comité ejecutivo decida la estrategia a seguir para seguir creciendo y necesita datos. Margarita está a cargo de elaborar la Inteligencia de Negocio.

Como sucedía con la Analítica de datos, la Inteligencia de Negocio existe sin Big Data ya que solo es necesario ser capaz de representar el estado del negocio a partir de lo que muestran los datos almacenados sobre el mismo.

Peeero, si se combina la Inteligencia de Negocio con el Big Data, los resultados que se obtienen son mucho más poderosos.

Y un gran poder conlleva una gran responsabilidad.

¿Para qué sirve el Big Data?

Hasta ahora, hemos visto como almacenar un montón de datos variados e intentar procesarlos para obtener resultados en un tiempo lo suficientemente bajo como para que Paco y Margarita no pierdan sus trabajos. De momento el Big Data sirve para complicar un poco la vida de Paco y Margarita.

La cuestión es… ¿servirá para algo más tener acceso a una cantidad tan brutal de datos? 🤔

Pues bien, cuando es posible acceder a la cantidad de datos necesaria como para encontrarnos en un entorno de Big Data, el valor añadido por este ecosistema podría compararse a intentar buscar la solución a un problema en un libro...

...o buscar en una biblioteca entera.

¿Y por qué no se ha construido esa “biblioteca de soluciones” hasta ahora si ya éramos conscientes del valor de los datos?

Básicamente, el coste de adquirir los sistemas de almacenamiento para guardar grandes cantidades de datos ha sido demasiado elevado.

Además, la tecnología disponible no era capaz de procesar volúmenes de información tan grandes a la velocidad adecuada y las soluciones para integrar los datos, mantenerlos actualizados y realizar copias de seguridad eran demasiado complejas.

Por suerte, esto ha ido cambiando en los últimos años 😊

Las herramientas Big Data y, por extensión, los ingenieros de Big Data, facilitan el trabajo de analistas de datos y consultores de Business Intelligence y aumentan la capacidad de gestionar cada vez cantidades más ingentes de datos.

Es decir, se encargan de mantener en orden y a punto los datos para que sea posible trabajar con ellos.

Aplicaciones de Big Data

Llegados a este punto parece que una aplicación clara de Big Data es en el campo de la Banca ¿verdad? 😬

Banca y Finanzas

Pues sí, una de las primeras industrias en adoptar soluciones Big Data ha sido la Banca. Disponen de muchos datos de sus clientes y de los medios para implementar Big Data.

A partir de la información demográfica de sus clientes, los movimientos bancarios, los productos bancarios que cada cliente adopta o rechaza, el banco es capaz de crear un perfil de cliente, conocer las relaciones entre sus clientes y ofrecer productos más adaptados a ese perfil que presentan mejores resultados de adopción.

Además, gracias a la implementación de Big Data, los bancos tienen la posibilidad de monitorizar la salud financiera de sus clientes e implementar mecanismos de detección de fraude y de blanqueo de capitales. 

Marketing

Un modelo claro de explotación de Big Data en marketing es Facebook. 

La red social dispone de una gran cantidad de datos sobre sus usuarios. A partir de estos datos los segmenta y ofrece a las empresas la posibilidad de dirigir sus anuncios a sus potenciales clientes. Clientes que realmente están interesados en sus productos y que tienen más posibilidades de acabar adquiriendo el producto o servicio anunciado.

Por ello, el objetivo principal de Facebook es que estés en Facebook. Cuanto más tiempo utilices la red social, más preciso será el perfil de cliente que tiene Facebook sobre ti, más anuncios verás y, por tanto, más dinero podrá facturar proveniente de los anuncios que te muestra.

En 2018, obtuvo un retorno por cada usuario europeo de 8,82 dólares y 27,61 dólares por cada usuario americano.

Es decir, aunque para el usuario Facebook sea una aplicación gratuita, obtiene ingresos a partir de sus datos, de ahí la famosa cita

“Cuando un producto es gratis es porque el producto eres tú”

Deporte

La industria del fútbol presenta varios casos de uso de Big Data. Durante los entrenamientos, es posible observar  que los jugadores llevan chalecos con dispositivos que recogen información sobre su estado físico, posición GPS y una infinidad de datos más. 

Prevención de lesiones

A partir de esos datos es posible conocer el estado físico del jugador y predecir futuras lesiones y, por tanto, actuar a tiempo.

Análisis de estrategia

Combinando los datos obtenidos a través de los dispositivos que llevan los jugadores con las imágenes tomadas por las cámaras en el campo es posible obtener una visión precisa de los movimientos de los jugadores y de las estrategias más eficaces para ganar un partido.

Fichajes

El estudio de los datos de rendimiento de los jugadores, el análisis de estrategia del equipo  y la observación de los movimientos de los jugadores por el campo resalta las posibles mejoras de resultados que podría aportar fichar a un determinado jugador.

Y, por lo tanto, la conformación de las plantillas se lleva a cabo de una manera mucho más eficiente.

Salud

El último ejemplo que traigo hoy es Big Data aplicado en el campo de la salud. 

¡Las aplicaciones son de todo tipo!

La asistencia en la detección de cáncer a partir del entrenamiento de algoritmos de aprendizaje automático que diferencian imágenes de células normales de otras con células cancerosas. Por ejemplo, Google  está trabajando en una aplicación que diferencia lunares benignos de los que tienen posibilidades de ser malignos utilizando únicamente el teléfono móvil. 

El diagnóstico predictivo de enfermedades basado en el historial del paciente, datos socioeconómicos, etc…Como ves, la explotación de grandes cantidades de datos tiene cabida en prácticamente todas las industrias 🙂

Accede a todo el contenido premium

Ya no necesitas pagar cientos de euros por un Bootcamp para convertirte en ninja de los datos. Por solo 17€/mes (o menos 🤯), obtén acceso al podcast premium, a todos los tutoriales y a los resúmenes de los libros más top sobre Machine Learning y Ciencia de datos y aprende a tu ritmo.
¡Empieza ahora!
Copyright © 2024  · Datos 🥷 · Todos los derechos reservados