El modelado dimensional lleva décadas funcionando.
Tablas de hechos, dimensiones, claves subrogadas... son patrones probados que siguen siendo la base de la mayoría de data warehouses.
La pregunta es cómo implementarlos correctamente en dbt.
Este capítulo del libro Data Engineering with dbt te lo explica, con especial atención a algo que muchos tutoriales ignoran: cómo gestionar el histórico de las dimensiones sin perder la trazabilidad.
No todos los snapshots se configuran igual. Confundir dimensiones con hechos genera problemas sutiles que cuestan horas de debugging.
El capítulo detalla las diferencias clave:
HASH_DIFF, yUn hecho de hace dos años necesita poder unirse a la dimensión que existía en ese momento.
Una vez tienes el snapshot capturando histórico, necesitas un modelo refinado que exponga solo la versión actual.
Veremos el patrón completo:
Es un modelo simple, pero hacerlo bien desde el principio evita inconsistencias cuando el proyecto crece.
¿Estás ready? 🫡