2 - Tablas Dinámicas a partir de DataFrames ('pivot tables')
Lección 2 del curso Pandas Nivel Avanzado.
En la lección anterior vimos qué son los DataFrames anchos y largos en Pandas, dos conceptos básicos que resultan fundamentales para las técnicas de re-estructuración de datos que veremos a partir de esta lección.
En esta lección hablaremos en detalle de la primera de estas técnicas: el uso de tablas dinámicas a través del método pivot_table()
que permite re-estructurar y agregar datos de un DataFrame para facilitar la interpretación y visualización de la información.
En ciertos casos este método funciona de manera similar al método groupby()
que vimos en el curso anterior. Sin embargo, pivot_table()
es mucho más flexible y permite re-estructurar nuestras tablas de datos de diversas maneras.
Entonces, a través de varios ejemplos prácticos, comenzaremos viendo las semejanzas que existen entre los métodos groupby()
y pivot_table()
y luego veremos en detalle las diferentes maneras de usar pivot_table()
para re-estructurar y agregar nuestras tablas de datos. Y al final cerraremos esta lección con un ejemplo práctico un poco más complejo.
Así que comencemos:

Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online
Bien, acabamos de ver que dependiendo del tipo de análisis o de información que queramos extraer, en ocasiones el uso de groupby()
y pivot_table()
resulta equivalente.
Sin embargo, vimos igualmente que pivot_table()
ofrece múltiples opciones adicionales, como la posibilidad de definir cuáles columnas usaremos como índice y como columnas del DataFrame resultante, y esto, combinado con diversas funciones de agregación nos permite en últimas tener mayor flexibilidad al momento de re-estructurar y resumir nuestros datos.
Habiendo visto esta primera técnica, en la siguiente lección nos enfocaremos en un segundo grupo de métodos para la re-estructuración de DataFrames: hablaremos en detalle de las técnicas para apilar y des-apilar tablas de datos en Pandas.