El modelado de datos en data warehouse es una de las habilidades más demandadas en el mundo de la ingeniería y análisis de datos.
Y, por supuesto, algo fundamental antes de empezar con dbt o cualquier otra herramienta.
Un buen modelo puede marcar la diferencia entre un sistema que escala y entrega valor, y uno que se convierte en un obstáculo para el negocio.
Este capítulo está pensado para ahorrarte ese camino.
Antes de hablar de arquitecturas, necesitas dominar los bloques básicos: entidades, tipos de claves (primarias, naturales, subrogadas, foráneas) y cardinalidad de relaciones. Parece básico, pero la diferencia entre un modelo que funciona y uno que genera duplicados o inconsistencias suele estar en estos detalles.
El capítulo cubre patrones que aparecen constantemente en proyectos reales: cabecera-detalle para facturas y pedidos, relaciones jerárquicas con CTEs recursivos, y sistemas de predicciones con datos históricos.
También explicamos dos trampas clásicas que nadie te cuenta hasta que te explotan en la cara: el fan trap y el chasm trap.
Dos errores de modelado que hacen que tus JOINs multipliquen datos incorrectamente o pierdas registros sin darte cuenta.
No basta con saber que estas arquitecturas existen: necesitas entender cuándo tiene sentido cada una, qué sacrificas con cada elección y qué pasa cuando tu empresa crece.
Comparamos todas las opciones con criterios concretos: normalización, facilidad para BI, escalabilidad, tiempo de implementación y flexibilidad ante cambios. Para que tomes decisiones informadas en lugar de seguir modas.
¡Vamos a por ello! 🫡