3 - Fusionando DataFrames

Lección 3 del curso Pandas Nivel Intermedio.

En las lecciones anteriores hemos visto como usar join() y concat() para combinar DataFrames en Pandas. Sin embargo, estos métodos son relativamente limitados, bien sea por que funcionan sólo sobre una única orientación (como join()) o porque los DataFrames a combinar deben tener una estructura similar (como en el caso de concat()).

En esta lección hablaremos de merge() una función y a la vez un método que permite combinar DataFrames y Series en Pandas y que es más versátil y completa que join() y concat().

En particular, merge() nos permite realizar combinaciones de tablas de una forma muy similar a como se hace en las bases de datos relacionales (es decir usando combinaciones izquierdas, intersecciones y uniones, entre otras).

Además, dichas combinaciones se pueden realizar no sólo usando como referencia los índices de los DataFrames sino también una o múltiples columnas.

Veamos entonces en detalle las diferentes formas de usar merge():

Contenido exclusivo suscriptores

Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Acabamos de ver cómo usar merge(), que es un método y también una función en Pandas, para realizar diferentes tipos de combinaciones de DataFrames (también funciona para Series).

Vimos que en efecto este método/función es mucho más versátil que las alternativas ofrecidas por join() y concat() vistas anteriormente. En particular, nos permite realizar diferentes tipos de combinaciones (izquierda, intersección y unión) haciendo uso del argumento how y además es posible combinar DataFrames con estructuras totalmente diferentes.

Así que con esto cerramos este primer módulo del curso, donde hemos visto las principales herramientas de Pandas usadas en la combinación de datos.

En el segundo módulo del curso nos enfocaremos en una operación que generalmente usaremos en nuestros proyectos de Ciencia de Datos y Machine Learning: hablaremos de la operación groupby.

Y en la próxima lección veremos una introducción a esta operación y vamos a entender su forma básica de funcionamiento para dividir un DataFrame en agrupaciones.

Ver todas las lecciones de este curso