Si trabajas en ciencia de datos, ingeniería de datos o machine learning, es probable que manejes múltiples scripts, modelos y datasets.
Sin un buen control de versiones, tu flujo de trabajo puede volverse un caos.
Aquí es donde entran Git y GitHub, herramientas esenciales para gestionar código, colaborar en proyectos y asegurar la reproducibilidad de tus modelos de machine learning.
En esta sesión de una hora de la Comunidad Ninja sobre GitHub para ciencia de datos y machine learning, aprenderás:
✔️ Cómo clonar un repositorio y trabajar en equipo.
✔️ Cómo usar ramas (git branch
) para desarrollar sin afectar la versión principal.
✔️ Cómo sincronizar cambios en el código con el equipo.
✔️ Cómo usar Git en VS Code y conectar Google Colab con GitHub.
Muchos científicos de datos comienzan sus proyectos trabajando con archivos .py
, .ipynb
o .csv
dispersos en diferentes carpetas.
Sin embargo, a medida que los proyectos crecen, es fundamental utilizar herramientas que permitan:
Git y GitHub te ayudan a gestionar de manera eficiente todo tu código y modelos, asegurando que cada versión de tu proyecto sea accesible y organizada.
GitHub es un sitio web que almacena repositorios Git y facilita la colaboración.
Durante la sesión, exploramos ejemplos de proyectos populares como Pandas, una librería esencial en Machine Learning y análisis de datos, donde miles de personas han contribuido a su desarrollo.
Durante la sesión también desglosamos los conceptos más importantes que necesitas dominar para trabajar con Git:
🔹 Repositorio: el lugar donde se almacena tu código y su historial.
🔹 Commit: una "foto" de los cambios en tu código.
🔹 Branch (rama): permite desarrollar nuevas funciones sin afectar la versión principal.
🔹 Merge: la forma de combinar los cambios de una rama con otra.
🔹 Pull & Push: traer cambios desde un repositorio remoto y enviar los tuyos.
Si aún no tienes cuenta en GitHub, este es el momento perfecto para crear una y comenzar a experimentar.
En la sesión, discutimos cómo clonar repositorios, hacer commits y trabajar en equipo de forma eficiente.
Además, preparamos un repositorio de prueba donde puedes practicar sin miedo a romper nada.
¡Es el espacio ideal para ensuciarte las manos y aprender con la práctica!
🎥 No olvides ver la sesión en vídeo, lo encontrarás a continuación: