16 - Proyecto final: análisis de datos marketing bebida energizante - Parte 3: limpieza del set de datos
Lección 16 del curso Pandas Nivel Básico.
En la lección anterior vimos cómo realizar la exploración del set de datos para nuestro proyecto, una fase que nos permitió tener un panorama claro de las características del dataset y de los datos que resultarán relevantes para la extracción de los insights de interés.
En esta lección veremos otra de las fases de preparación de datos previa al análisis: la limpieza de los datos.
En particular, veremos cómo usar varias herramientas de Pandas vistas a lo largo de este curso para:
- Eliminar columnas irrelevantes del set de datos
- Reorganizar las columnas restantes
- Realizar el manejo de los datos faltantes
Veamos entonces cómo implementar cada una de estas etapas de limpieza.
Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online
Vimos cómo usar herramientas como drop
, info
y dropna
para determinar la estrategia de limpieza y llevar a cabo la eliminación de columnas irrelevantes y de los datos faltantes en nuestro dataset.
Y con esto ya hemos completado el pre-procesamiento de nuestro set de datos y estamos listos para la fase central de este proyecto, el análisis de los datos, que será el tema de la próxima lección.