Capítulo 7. Modelado dimensional en dbt

El modelado dimensional lleva décadas funcionando.

Tablas de hechos, dimensiones, claves subrogadas... son patrones probados que siguen siendo la base de la mayoría de data warehouses.

La pregunta es cómo implementarlos correctamente en dbt.

Este capítulo del libro Data Engineering with dbt te lo explica, con especial atención a algo que muchos tutoriales ignoran: cómo gestionar el histórico de las dimensiones sin perder la trazabilidad.

Lo que diferencia dimensiones de hechos (y por qué importa)

No todos los snapshots se configuran igual. Confundir dimensiones con hechos genera problemas sutiles que cuestan horas de debugging.

El capítulo detalla las diferencias clave:

cómo tratar eliminaciones,
qué incluir en el HASH_DIFF, y
por qué en dimensiones es imprescindible conservar todas las versiones históricas.

Un hecho de hace dos años necesita poder unirse a la dimensión que existía en ese momento.

De snapshot a dimensión consumible

Una vez tienes el snapshot capturando histórico, necesitas un modelo refinado que exponga solo la versión actual.

Veremos el patrón completo:

configuración del snapshot,
filtrado correcto, y
cómo dejar la dimensión lista para usar en marts.

Es un modelo simple, pero hacerlo bien desde el principio evita inconsistencias cuando el proyecto crece.

¿Estás ready? 🫡

¿Qué son los datos dimensionales?

Membresía requerida

Este contenido está disponible únicamente para suscriptores.

Puedes apuntarte a la plataforma en este enlace

¿Ya eres un ninja? Accede aquí

Accede a todo el contenido premium

Ya no necesitas pagar cientos de euros por un Bootcamp para convertirte en ninja de los datos. Por solo 17€/mes (o menos 🤯), obtén acceso al podcast premium, a todos los tutoriales y a los resúmenes de los libros más top sobre Machine Learning y Ciencia de datos y aprende a tu ritmo.

¡Empieza ahora!

👩🏻‍🦱 Sobre mí

💼 Aviso legal y cookies

📬 Contactar