El objetivo de estas sesiones en vídeo, con más de 7 horas de contenido práctico, es que aprendas a trabajar con un dataset paso a paso hasta resolver un problema real.
El resultado final puede ser un dashboard en el que analices el precio de la vivienda según distintas variables, un modelo predictivo que te permita estimar precios futuros con precisión, un sistema de recomendaciones para identificar oportunidades de inversión, o incluso un informe interactivo que detecte zonas con mayor potencial de crecimiento.
Lo más valioso es que vivirás la experiencia completa de un proyecto con datos reales, desde la exploración inicial hasta la implementación de soluciones prácticas, con una guía paso a paso para que aprendas haciendo.
En este curso en vídeo entrenamos un modelo de predicción del precio de la vivienda utilizando datos reales del portal inmobiliario Idealista, provenientes de anuncios de venta de viviendas en Madrid durante 2018.
¿Te has preguntado cómo comenzar a trabajar en proyectos reales de Machine Learning en el sector inmobiliario?
En esta sesión de la Comunidad Ninja abordamos paso a paso un análisis exploratorio de datos (EDA) utilizando un dataset de Idealista, la plataforma líder en el mercado inmobiliario español.
Durante esta sesión introductoria, descubrirás cómo:
La visualización con GeoPandas
y contextily
te permitirá ver de forma intuitiva dónde se concentran las viviendas más caras de Madrid (¡spoiler alert: cerca de La Castellana y en el Barrio Salamanca!😬).
Esta técnica, además de ofrecer resultados atractivos visualmente, proporciona insights prácticos muy valiosos.
Esta sesión es perfecta para quienes quieren aprender haciendo y paso a paso. Aprenderás a entender realmente los datos, cuestionar y verificar información, y tomar decisiones fundamentadas que pueden hacer toda la diferencia en tus análisis y modelos de Machine Learning.
Si en la sesión anterior hicimos un análisis exploratorio de nuestro dataset de Idealista en esta sesión comenzamos con la limpieza de datos.
Profundizamos en cómo transformar datos en bruto en información de calidad lista para el análisis y modelado.
Uno de los momentos clave de la sesión fue entender cómo tratar con viviendas repetidas en el dataset pero cuyas características no eran exactamente iguales.
¿Se deberían promediar sus precios o escoger otro método? Esta decisión influye significativamente en la calidad del modelo predictivo final y encontramos muchas de estas microdecisiones a lo largo del análisis.
Lo más importante es entender cómo estas pequeñas decisiones, aparentemente simples, pueden tener un gran impacto en los resultados del modelo.
Documentar y justificar cada decisión tomada durante el análisis es esencial para mantener un proceso claro y transparente que permita evaluar y mejorar los resultados continuamente.
Así que si quieres descubrir cómo tomar decisiones fundamentadas en la limpieza de datos y comprender su impacto en los modelos de Machine Learning, ¡no puedes perderte esta sesión!
En esta sesión de la Comunidad Ninja, nos sumergimos en uno de los pasos fundamentales antes de entrenar cualquier modelo de Machine Learning: el preprocesado de datos.
Utilizando un dataset real proporcionado por Idealista, exploramos cómo preparar tus datos para maximizar el rendimiento de nuestros modelos predictivos.
Si estás buscando una guía práctica y clara sobre cómo preprocesar datos de manera efectiva, especialmente en contextos inmobiliarios, esta sesión es para ti. No solo aprenderás técnicas avanzadas y prácticas, sino que también entenderás la importancia de cada pequeña decisión en el proceso, apoyado por una comunidad que aprende junta y en tiempo real.
Antes de adentrarnos en la fase del entrenamiento de nuestro modelo de Machine Learning para predecir el precio de la vivienda, realizamos una sesión especial de repaso llena de preguntas y respuestas.
Fue una oportunidad perfecta para afianzar todo lo aprendido hasta ese momento, resolver dudas comunes, y compartir trucos y consejos que nos ayudaran a sacar el máximo provecho al modelo.
¡Si quieres consolidar tu conocimiento y llegar con confianza al entrenamiento, esta sesión te encantará!
Por fin, después de varias sesiones y mucho trabajo previo, en esta sesión abordamos paso a paso cómo entrenar modelos de Machine Learning utilizando un dataset real de Idealista para predecir el precio de la vivienda.
Este vídeo es ideal para quienes buscan aprender haciendo, con decisiones en tiempo real y explicaciones claras al estilo datos.ninja 🥷.
RandomizedSearchCV
) y validación cruzada, fundamentales para optimizar el rendimiento del modelo.Una parte esencial de esta sesión fue entender cómo las decisiones tomadas durante el preprocesado afectan directamente al rendimiento final del modelo.
Por ejemplo, descubrimos cómo nuestra decisión de "capar" los precios de las viviendas por encima de cierto umbral limitaba drásticamente las predicciones del modelo.
Este tipo de detalles son fundamentales y es crucial documentarlos, ya que permiten ajustar y mejorar continuamente el proceso de Machine Learning.
Una sección destacada de esta sesión fue el uso avanzado de técnicas para ajustar hiperparámetros.
Utilizando métodos como RandomizedSearchCV
, exploramos cómo diferentes combinaciones de parámetros afectan al rendimiento del modelo XGBoost, uno de los más potentes en Machine Learning para datos tabulares.
Este proceso implica entrenar el modelo múltiples veces con diferentes configuraciones para encontrar la combinación óptima que maximice su rendimiento.
¿Quieres saber más? ¡No te pierdas esta sesión completa y comienza a dominar el entrenamiento y optimización de modelos de Machine Learning con datos reales desde cero!