10 - Visualización con Matplotlib

Lección 10 del curso Pandas Nivel Intermedio.

En la lección anterior vimos en qué consiste la combinación de los resultados que obtenemos al momento de aplicar operaciones con Groupby.

En este tercer módulo del curso nos enfocaremos en las tres principales alternativas de visualización que existen en Pandas: usando Matplotlib, usando funciones propias de Pandas y usando la librería Seaborn.

Matplotlib es la librería base para la creación de gráficos en Python y de hecho Pandas está construida sobre esta librería.

Así que es posible tomar un DataFrame o una Serie y usar Matplotlib para generar gráficos. Esto tiene algunas ventajas y desventajas.

La principal ventaja de usar Matplotlib es que podremos personalizar las gráficas tanto como queramos (colores, tipo de letra, ubicación de cada elemento en la gráfica, etc.). Sin embargo, la principal desventaja es que en ocasiones se requerirán muchas líneas de código para lograr el resultado deseado.

Acá en la Academia Online está disponible el curso completo de Matplotlib para Ciencia de Datos y Machine Learning en donde se describe en detalle cada una de las técnicas de visualización de datos que pueden ser usadas directamente en Pandas.

En esta lección, en lugar de revisar cada una de estas técnicas, nos enfocaremos en recordar la idea general de generación de gráficas y luego repasaremos los principales tipos de gráfico que se pueden generar en Matplotlib y que son de interés al momento de usar Pandas.

Contenido exclusivo suscriptores

Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Acabamos de repasar los principales pasos involucrados al momento de generar un gráfico en Matplotlib: comenzamos generando un “lienzo” (objeto tipo Figure) y uno o más ejes (objetos tipo Axes) y luego sobre dicho(s) eje(s) dibujamos el gráfico deseado (de línea, de dispersión, de barras, etc.). Y posteriormente, accedemos a la variable que contiene dicho Axes y aplicamos diferentes métodos de Matplotlib para la personalización de la gráfica.

Usando esta sintaxis y los diferentes métodos disponibles en Matplotlib podemos generar una amplia variedad de gráficos de nuestros datos, incluyendo gráficos de barras de error, gráficos tipo boxplot, histogramas y gráficos de series de tiempo, así como diferentes gráficos de barras (simples, agrupadas y apiladas, por ejemplo).

En la próxima lección veremos una segunda alternativa de visualización: el uso de métodos propios de Pandas para la generación de gráficas.

Ver todas las lecciones de este curso