14 - Proyecto final: análisis exploratorio de datos empresa de telecomunicaciones - Parte 2: los sets de datos

Lección 14 del curso Pandas Nivel Intermedio.

En la lección anterior vimos el planteamiento del problema que resolveremos en este proyecto de Análisis Exploratorio de Datos.

Lo que ocurre en este proyecto en particular es que la información no se encuentra almacenada en una única tabla y, por el contrario, está distribuida en múltiples sets de datos (todos en formato CSV).

En esta lección veremos en detalle estos sets de datos y definiremos cuáles de ellos resultarán útiles para el problema que queremos resolver.

Veamos entonces cuáles son estos sets de datos:

Contenido exclusivo suscriptores

Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Bien, ya hemos visto las características de cada uno de los sets de datos que tenemos disponibles para este proyecto.

Y vimos que la información requerida para realizar el Análisis Exploratorio de datos no se encuentra centralizada en un único DataFrame.

Sin embargo, podemos ver que los sets nx_metricas, info_cm e info_gplan contienen la mayor parte de la información necesaria para realizar el EDA, pero que esta información debe ser complementada con aquella proveniente de los sets nx_fechas y nx_ciudades.

Esta última conclusión resultará clave para la siguiente fase que consiste en la preparación de los datos y que será precisamente el tema de la próxima lección.

Ver todas las lecciones de este curso