Proyecto completo de MACHINE LEARNING

En esta sesión de la comunidad, María nos enseña paso a paso y en una horsa cómo ha construido un proyecto completo de Machine Learning desde cero hasta producción: desde el análisis exploratorio hasta una aplicación web desplegada en Hugging Face donde cualquiera puede predecir si un cliente se va a dar de baja.

Si alguna vez has terminado un notebook con unas gráficas y un modelo entrenado y te has preguntado "¿y ahora qué?", esta sesión responde exactamente a esa pregunta.

Un proyecto de Machine Learning de principio a fin

El caso de uso es un clásico: predecir el churn (abandono de clientes) en una empresa de telecomunicaciones.

Pero lo que hace diferente este proyecto es el recorrido completo que cubre: Exploración → Preprocesamiento → Entrenamiento → Explicabilidad → API → Testing → Despliegue

  1. Análisis exploratorio con YData Profiling y visualizaciones propias
  2. Preprocesamiento con pipelines de Scikit-Learn reutilizables
  3. Entrenamiento y comparación de tres modelos
    • Regresión Logística,
    • Random Forest,
    • XGBoost
  4. Tracking de experimentos con MLflow
  5. Optimización de hiperparámetros con Optuna
  6. Explicabilidad del modelo con SHAP
  7. API de predicción con FastAPI
  8. Empaquetado con Docker y testing con CI/CD
  9. Despliegue de interfaz web con Gradio en Hugging Face

Todo organizado en notebooks separados por fase y con el código documentado en GitHub para que cualquiera pueda seguirlo.

Notebooks separados por fase: una buena práctica que marca la diferencia

María estructura el proyecto en notebooks independientes para cada etapa: uno para el análisis exploratorio, otro para el preprocesamiento, otro para el entrenamiento, otro para la explicabilidad y otro para la optimización.

Esta separación tiene ventajas claras:

  • Cada notebook tiene un objetivo concreto y se puede ejecutar de forma independiente
  • Los datos procesados se guardan en carpetas intermedias y se cargan en el siguiente paso
  • Si algo falla en el entrenamiento, no tienes que volver a ejecutar todo desde la exploración
  • Cualquier persona que abra el proyecto entiende inmediatamente la estructura

Tracking de experimentos con MLflow y optimización con Optuna

Una de las partes más interesantes es cómo María registra cada entrenamiento en MLflow: parámetros, métricas, modelos guardados.

Si quieres saber más sobre MLFlow, puedes ver esta otra sesión.

Todo queda registrado y es fácil comparar qué configuración funcionó mejor sin volverse loco con hojas de cálculo o capturas de pantalla.

Después, utiliza Optuna para optimizar los hiperparámetros del XGBoost con 50 iteraciones automáticas.

El algoritmo va aprendiendo de cada prueba anterior para buscar la mejor combinación posible.

Explicabilidad con SHAP: hacer que el modelo hable

Entrenar un modelo que funcione está bien. Pero si no puedes explicar por qué toma las decisiones que toma, difícilmente vas a convencer a nadie en una empresa.

María utiliza SHAP para visualizar qué variables influyen más en la predicción de abandono y cómo lo hacen. Por ejemplo: los clientes con contrato mes a mes y con fibra óptica aparecen sistemáticamente como los de mayor riesgo.

En la sesión se comparan los gráficos de SHAP antes y después de la optimización con Optuna, y se ve cómo cambia el orden de importancia de las variables según el modelo utilizado.

De un notebook a una app funcionando en la web

Aquí es donde el proyecto da el salto que la mayoría de portfolios no dan. María construye una API de predicción con FastAPI que recibe los datos de un cliente en formato JSON y devuelve la probabilidad de abandono con un nivel de riesgo (alto, medio o bajo).

La API incluye validación de datos con Literal types, endpoint de salud para monitorización y documentación interactiva automática donde puedes probar las predicciones directamente desde el navegador.

Después empaqueta todo en Docker para que cualquiera pueda ejecutarlo sin instalar nada, implementa tests automatizados y configura un pipeline de CI/CD.

El paso final es Gradio: una interfaz web sencilla desplegada en Hugging Face donde introduces los datos de un cliente y obtienes la predicción al instante.

🎥 Si quieres ver cómo se construye un proyecto de Machine Learning extremo a extremo, con todas las herramientas que se usan en producción real (MLflow, Optuna, SHAP, FastAPI, Docker, Gradio), no te pierdas el vídeo completo y el repo con todo el código.

Lo encontrarás a continuación.

Membresía requerida

Este contenido está disponible únicamente para suscriptores.

Puedes apuntarte a la plataforma en este enlace

¿Ya eres un ninja? Accede aquí

Accede a todo el contenido premium

Ya no necesitas pagar cientos de euros por un Bootcamp para convertirte en ninja de los datos. Por solo 17€/mes (o menos 🤯), obtén acceso al podcast premium, a todos los tutoriales y a los resúmenes de los libros más top sobre Machine Learning y Ciencia de datos y aprende a tu ritmo.
¡Empieza ahora!
Copyright © 2026  · Datos 🥷 · Todos los derechos reservados