15 - Proyecto final: análisis exploratorio de datos empresa de telecomunicaciones - Parte 3: preparación de los datos

Lección 15 del curso Pandas Nivel Intermedio.

En la lección anterior vimos los detalles de los sets de datos que usaremos para este proyecto final.

En esta lección nos enfocaremos en la fase de preparación o pre-procesamiento de los datos en donde tomaremos como punto de partida los DataFrames de referencia identificados en la lección anterior: nx_metricas, info_cm e info_gplan.

En particular, para cada uno de estos sets de datos:

  1. Realizaremos la fusión con los DataFrames nx_fechas y nx_ciudades para centralizar la información sólo en unas cuantas tablas
  2. Eliminaremos las columnas irrelevantes y organizaremos las columnas restantes
  3. Realizaremos el manejo de datos faltantes (de ser necesario)

Veamos entonces cómo implementar cada una de estas fases:

Contenido exclusivo suscriptores

Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien, acabamos de realizar la preparación de los datos. En particular, para cada uno de los DataFrames de referencia hemos hecho uso del método merge() de Pandas para complementar los datos presentes en estos DataFrames con la proveniente de las tablas nx_fechas y nx_ciudades.

Además, haciendo uso del método drop() hemos eliminado las columnas que no resultarán relevantes para el análisis y con el método info() hemos verificado que ninguno de los DataFrames resultantes contiene datos faltantes.

Así que en este punto ya tenemos los tres sets de datos preparados para realizar el análisis exploratorio de los datos que será precisamente el tema de la próxima lección.

Ver todas las lecciones de este curso