5 - Explotar un DataFrame (exploding)

Lección 5 del curso Pandas Nivel Avanzado.

En la lección anterior vimos cómo fundir un DataFrame para cambiar su estructura del formato ancho al formato largo.

En ocasiones tenemos DataFrames donde una de sus columnas contiene un listado de elementos en cada registro. Y en ocasiones resulta más conveniente que cada uno de estos elementos se convierta en una fila: es decir lo que queremos es explotar un DataFrame (En Inglés exploding).

Esto lo podemos hacer con el método explode() de Pandas que permite re-estructurar un DataFrame transformando cada elemento de un listado en una fila.

Al igual que con los métodos stack(), unstack() y melt() vistos anteriormente, explode() únicamente re-estructura el DataFrame (es decir que no incluye funciones de agregación).

Entendamos esto en detalle:

Contenido exclusivo suscriptores

Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Bien acabamos de ver el uso que podemos dar a explode() cuando queremos tomar los listados presentes en una celda y llevarlos a múltiples filas.

En esencia el procedimiento involucra dos pasos:

  1. Convertir cada celda al formato string (usando el atributo str) y luego almacenar el listado en una lista de Python usando el método split()
  2. Aplicar el método explode() al resultado anterior

Y con lo visto en este primer módulo ya tenemos las principales técnicas para la re-estructuración de DataFrames en Pandas.

Así que en el segundo módulo nos enfocaremos en las diferentes técnicas de procesamiento y visualización que nos ofrece Pandas al momento de operar sobre Series de Tiempo.

Y en la próxima lección comenzaremos entendiendo qué es una Serie de Tiempo y la forma como Pandas almacena las variables fecha y hora, fundamentales en una Serie de Tiempo.

Ver todas las lecciones de este curso