Capítulo 3. Modelado de datos

El modelado de datos en data warehouse es una de las habilidades más demandadas en el mundo de la ingeniería y análisis de datos.

Y, por supuesto, algo fundamental antes de empezar con dbt o cualquier otra herramienta.

Un buen modelo puede marcar la diferencia entre un sistema que escala y entrega valor, y uno que se convierte en un obstáculo para el negocio.

Este capítulo está pensado para ahorrarte ese camino.

Los fundamentos que marcan la diferencia

Antes de hablar de arquitecturas, necesitas dominar los bloques básicos: entidades, tipos de claves (primarias, naturales, subrogadas, foráneas) y cardinalidad de relaciones. Parece básico, pero la diferencia entre un modelo que funciona y uno que genera duplicados o inconsistencias suele estar en estos detalles.

Patrones y trampas del mundo real

El capítulo cubre patrones que aparecen constantemente en proyectos reales: cabecera-detalle para facturas y pedidos, relaciones jerárquicas con CTEs recursivos, y sistemas de predicciones con datos históricos.

También explicamos dos trampas clásicas que nadie te cuenta hasta que te explotan en la cara: el fan trap y el chasm trap.

Dos errores de modelado que hacen que tus JOINs multipliquen datos incorrectamente o pierdas registros sin darte cuenta.

¿Kimball, Inmon, Data Vault o Data Mesh?

No basta con saber que estas arquitecturas existen: necesitas entender cuándo tiene sentido cada una, qué sacrificas con cada elección y qué pasa cuando tu empresa crece.

Comparamos todas las opciones con criterios concretos: normalización, facilidad para BI, escalabilidad, tiempo de implementación y flexibilidad ante cambios. Para que tomes decisiones informadas en lugar de seguir modas.

¡Vamos a por ello! 🫡

Modelado de datos en Data Warehouse: guía completa

Membresía requerida

Este contenido está disponible únicamente para suscriptores.

Puedes apuntarte a la plataforma en este enlace

¿Ya eres un ninja? Accede aquí

Accede a todo el contenido premium

Ya no necesitas pagar cientos de euros por un Bootcamp para convertirte en ninja de los datos. Por solo 17€/mes (o menos 🤯), obtén acceso al podcast premium, a todos los tutoriales y a los resúmenes de los libros más top sobre Machine Learning y Ciencia de datos y aprende a tu ritmo.

¡Empieza ahora!

👩🏻‍🦱 Sobre mí

💼 Aviso legal y cookies

📬 Contactar