Desarrollar modelos en dbt es la parte fácil.
Lo complicado viene después: cómo llevar ese código a producción de forma controlada, repetible y sin sorpresas.
Este capítulo del libro Data Engineering with dbt cubre todo lo que necesitas para montar una estrategia de despliegue seria, desde la configuración de entornos hasta la generación automática de documentación.
El capítulo empieza por una distinción fundamental.
La mayor parte del capítulo se dedica a los jobs, y con razón.
Detalla el job por defecto que la mayoría de proyectos necesita, pero no se queda ahí.
También cubre jobs para cargas más frecuentes usando selectores de nodos, jobs de refresco completo con --full-refresh, y un job dedicado a ejecuciones especiales que mantiene la trazabilidad sin recurrir a comandos manuales fuera del entorno de desarrollo.
Hay cosas que dbt no gestiona automáticamente: permisos, tablas que ya no existen en el código, cambios en modelos incrementales.
Veremos cómo usar hooks y run-operations para cubrir estos huecos.
El capítulo cierra con las herramientas de documentación de dbt.
No es un extra: configurar un job que publique documentación y alertas de freshness es lo que convierte tu proyecto en algo profesional.
¡A por ello! 💪