
En esta sesión de la comunidad, María nos enseña paso a paso y en una horsa cómo ha construido un proyecto completo de Machine Learning desde cero hasta producción: desde el análisis exploratorio hasta una aplicación web desplegada en Hugging Face donde cualquiera puede predecir si un cliente se va a dar de baja.
Si alguna vez has terminado un notebook con unas gráficas y un modelo entrenado y te has preguntado "¿y ahora qué?", esta sesión responde exactamente a esa pregunta.
El caso de uso es un clásico: predecir el churn (abandono de clientes) en una empresa de telecomunicaciones.
Pero lo que hace diferente este proyecto es el recorrido completo que cubre: Exploración → Preprocesamiento → Entrenamiento → Explicabilidad → API → Testing → Despliegue
Todo organizado en notebooks separados por fase y con el código documentado en GitHub para que cualquiera pueda seguirlo.
María estructura el proyecto en notebooks independientes para cada etapa: uno para el análisis exploratorio, otro para el preprocesamiento, otro para el entrenamiento, otro para la explicabilidad y otro para la optimización.
Esta separación tiene ventajas claras:
Una de las partes más interesantes es cómo María registra cada entrenamiento en MLflow: parámetros, métricas, modelos guardados.
Si quieres saber más sobre MLFlow, puedes ver esta otra sesión.
Todo queda registrado y es fácil comparar qué configuración funcionó mejor sin volverse loco con hojas de cálculo o capturas de pantalla.
Después, utiliza Optuna para optimizar los hiperparámetros del XGBoost con 50 iteraciones automáticas.
El algoritmo va aprendiendo de cada prueba anterior para buscar la mejor combinación posible.
Entrenar un modelo que funcione está bien. Pero si no puedes explicar por qué toma las decisiones que toma, difícilmente vas a convencer a nadie en una empresa.
María utiliza SHAP para visualizar qué variables influyen más en la predicción de abandono y cómo lo hacen. Por ejemplo: los clientes con contrato mes a mes y con fibra óptica aparecen sistemáticamente como los de mayor riesgo.
En la sesión se comparan los gráficos de SHAP antes y después de la optimización con Optuna, y se ve cómo cambia el orden de importancia de las variables según el modelo utilizado.
Aquí es donde el proyecto da el salto que la mayoría de portfolios no dan. María construye una API de predicción con FastAPI que recibe los datos de un cliente en formato JSON y devuelve la probabilidad de abandono con un nivel de riesgo (alto, medio o bajo).
La API incluye validación de datos con Literal types, endpoint de salud para monitorización y documentación interactiva automática donde puedes probar las predicciones directamente desde el navegador.
Después empaqueta todo en Docker para que cualquiera pueda ejecutarlo sin instalar nada, implementa tests automatizados y configura un pipeline de CI/CD.
El paso final es Gradio: una interfaz web sencilla desplegada en Hugging Face donde introduces los datos de un cliente y obtienes la predicción al instante.
🎥 Si quieres ver cómo se construye un proyecto de Machine Learning extremo a extremo, con todas las herramientas que se usan en producción real (MLflow, Optuna, SHAP, FastAPI, Docker, Gradio), no te pierdas el vídeo completo y el repo con todo el código.
Lo encontrarás a continuación.