9 - Ciclo de vida de un proyecto de Machine Learning

Lección 9 del curso Introducción al Machine Learning.

Introducción

En la lección anterior hablamos de los sets de entrenamiento, validación y prueba, con lo que tenemos todos los conceptos fundamentales para entender cómo funciona un proyecto de Machine Learning.

En esta lección veremos un ejemplo práctico que nos permitirá entender las fases involucradas en el desarrollo de un proyecto de Machine Learning.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

El problema a resolver

Supongamos que trabajamos para una empresa del sector inmobiliario que desea determinar si resulta viable invertir o no en la compra de propiedades en diferentes zonas de una ciudad. Es decir que dada una propiedad la idea es estimar su precio dadas algunas características como por ejemplo su ubicación, el número de habitaciones, la densidad de población de la zona, entre otras.

Fases del proyecto

Estas fases son muy similares a las vistas en el caso del [ciclo de vida de un proyecto en Ciencia de Datos], con algunas particularidades:

  1. Fase 1: traducir el problema del negocio al lenguaje del Machine Learning
  2. Fase 2: realizar la recolección de los datos
  3. Fase 3: limpieza de los datos
  4. Fase 4: análisis exploratorio de los datos
  5. Fase 5: Pre-procesamiento de los datos. Esta es una fase presente en todo proyecto de Machine Learning, que implica preparar los datos para que puedan ser procesados por el algoritmo de entrenamiento. En este caso las etapas a llevar a cabo en esta fase podrían ser la partición del set de datos (en entrenamiento, validación y prueba), el ajuste de unidades y escalamiento de los datos así como la conversión de datos categóricos del formato texto al formato numérico.
  6. Fase 6: extracción de características. Esta es también una fase que puede estar presente en un proyecto de Machine Learning y que consiste en seleccionar las características más relevantes o con mayor potencial o impacto para el futuro modelo a construir y además generar nuevas características resultado de la combinación de otras y que tengan el potencial de mejorar la predicción con el modelo a entrenar.
  7. Fase 7: Desarrollo del modelo, que implica el entrenamiento y validación de múltiples modelos y la selección y prueba del mejor modelo.
  8. Fase 8: despliegue del modelo, que busca llevar el modelo seleccionado a la etapa de producción para que pueda ser accesible por parte del usuario final.
  9. Fase 9: monitoreo y mantenimiento, que consiste en medir el desempeño del modelo y generar alertas en caso de que este caiga debajo de cierto umbral (monitoreo) y en actualizar periódicamente dicho modelo (mantenimiento) para mantener su desempeño en los niveles esperados.

Y generalmente este ciclo de vida se repite periódicamente, es decir que cada cierto tiempo, dependiendo de lo observado durante el monitoreo, tendremos que ejecutar todo el ciclo o parte de este para lograr mantener este desempeño.

Contenido exclusivo suscriptores

Recuerda suscribirte para acceder al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Conclusión

Con este ejemplo ya tenemos claras las principales fases que usualmente encontraremos en el desarrollo de un proyecto de Machine Learning, así que con esto culminamos este segundo módulo del curso.

En el último módulo finalizaremos el curso con las estrategias y la ruta de aprendizaje que sugiero para especializarnos en el Machine Learning.

Ver todas las lecciones de este curso