18. Del gobierno del dato a dominar el mundo

Membresía requerida

Este contenido está disponible únicamente para suscriptores.

Puedes apuntarte a la plataforma en este enlace

¿Ya eres un ninja? Accede aquí

En este episodio del podcast premium debatimos sobre Gobierno del dato a raíz de la segunda sesión del Club de Lectura del libro Data Governance Handbook (puedes escuchar mi reflexión sobre la primera parte del libro aquí).

Desde qué significa realmente tener un dato "de calidad", hasta por qué es tan difícil ponerse de acuerdo en qué es un “cliente”, este episodio es una clase práctica de lo que ocurre cuando intentas llevar orden a un mundo de datos ya en marcha.

Gobernar datos cuando ya están en uso

La teoría del gobierno del dato suena bien: definir políticas, construir catálogos, garantizar trazabilidad, mejorar la calidad del dato…

Pero la realidad empieza cuando entras en una empresa donde los datos ya circulan, las decisiones ya se toman y el presupuesto está comprometido.

En la charla, hablamos sobre algo clave: implementar una estrategia de gobierno del dato desde cero es ideal, pero casi nunca pasa.

Lo habitual es lo contrario: aterrizas en medio del caos y tienes que poner orden mientras todo sigue funcionando.

Y ahí empiezan los verdaderos retos.

Metadatos, catálogos y confianza

Uno de los bloques centrales de la conversación es la importancia de los metadatos y cómo habilitan catálogos de datos que permiten buscar, descubrir y reutilizar información.

Tener un catálogo bien armado ahorra horas (o días) de trabajo, evita duplicidades y permite saber a quién preguntar cuando no entiendes un campo.

Pero no vale con una lista de nombres bonitos: necesitas lineage, definiciones, responsables y validaciones.

Porque sin confianza en los datos, nadie los usa.

Y si nadie los usa, todo el esfuerzo del gobierno del dato se va al traste.

Calidad del dato: más allá de los nulos

La calidad del dato no es solo asegurarse de que un campo no tenga valores vacíos.

Es definir qué reglas debe cumplir un conjunto de datos para ser considerado válido.

Eso incluye cosas como:

  • Fechas que tengan sentido
  • Rango de valores esperados
  • Reglas de negocio explícitas (por ejemplo, un cliente VIP tiene más de 1000 € de gasto)

Y no basta con definirlo.

Hay que monitorizarlo, visualizarlo y tomar decisiones en base a ello.

En el episodio, Raúl nos comparte cómo lo hacen en su empresa: con DBT, tests automatizados, criticidad por tabla y un sistema de alertas que se integra en el catálogo.

Operaciones invisibles (hasta que fallan)

El libro Data Governance Handbook nos cuenta que uno de los grupos más infravalorados es el de operaciones de datos (DataOps).

Son quienes orquestan pipelines, ajustan horarios, arreglan fallos y garantizan que los datos estén listos cuando se necesitan.

Pero como su trabajo solo se nota cuando algo va mal… muchas veces se quedan sin reconocimiento ni presupuesto.

Y sin operaciones fiables, no hay calidad del dato ni confianza que valga.

El gobierno del dato es un proceso vivo que hay que revisar, ajustar y volver a consensuar constantemente.

Si te interesa…

  • Cómo gestionar datos en entornos reales
  • Qué metadatos de verdad importan
  • Cómo hacer un catálogo útil
  • Qué estrategias usar para convencer a negocio
  • Por qué definir conceptos y un buen glosario de negocio es la base de todo

… este episodio te va a gustar.

Y si trabajas en datos y alguna vez te has preguntado por qué tus números no cuadran con los del otro equipo, quizás lo que necesitas no es más SQL, sino una buena conversación sobre qué significa “cliente”.

Accede a todo el contenido premium

Ya no necesitas pagar cientos de euros por un Bootcamp para convertirte en ninja de los datos. Por solo 17€/mes (o menos 🤯), obtén acceso al podcast premium, a todos los tutoriales y a los resúmenes de los libros más top sobre Machine Learning y Ciencia de datos y aprende a tu ritmo.
¡Empieza ahora!
Copyright © 2025  · Datos 🥷 · Todos los derechos reservados