4 - Dividir un DataFrame en agrupaciones

Lección 4 del curso Pandas Nivel Intermedio.

En la lección anterior vimos cómo usar el método merge() para fusionar DataFrames en Pandas.

En este segundo módulo del curso nos enfocaremos en la operación Groupby que nos permite trabajar sobre agrupaciones de datos.

Groupby es un método muy versátil de Pandas que nos permite agrupar las filas de un DataFrame o los elementos de una Serie en sub-grupos y que resulta muy útil en diferentes proyectos de Ciencia de Datos y Machine Learning.

Además de generar estas agrupaciones nos permite realizar lo que se conoce como el proceso de split-apply-combine (dividir-aplicar-combinar):

En este segundo módulo del curso aprenderemos a usar Groupby para realizar este tipo de operaciones.

Y en esta lección comenzaremos con lo básico: vamos a entender cómo dividir un DataFrame en sub-grupos. Veremos que dichas particiones estarán almacenadas en un objeto de Pandas (es decir un tipo de dato) del cual también veremos sus principales métodos y atributos.

Así que comencemos:

Contenido exclusivo suscriptores

Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien acabamos de ver a través de varios ejemplos prácticos cómo usar el método groupby() de Pandas para generar sub-grupos a partir de un set de datos y usando uno o múltiples criterios.

Este método nos genera un tipo de dato Groupby que tiene asociados varios métodos y atributos que nos permiten explorar los grupos generados y realizar operaciones sobre los mismos.

De esta forma vimos cómo determinar el número de agrupaciones generadas y cómo a través de los métodos size(), first(), last(), nth() y get_group() podemos explorar el contenido de las agrupaciones o extraer una agrupación en particular.

En la próxima lección comenzaremos a enfocarnos en la segunda fase de las operaciones que nos permite llevar a cabo Groupby: aplicar. Es decir que comenzaremos a ver diferentes formas de aplicar diversas funciones a cada agrupación generada.

Y específicamente en esa próxima lección veremos como aplicar funciones de agregación a cada agrupación.

Ver todas las lecciones de este curso