1 - Qué es Matplotlib y su importancia en la Ciencia de Datos y el Machine Learning

Lección 1 del curso Matplotlib para Ciencia de Datos y Machine Learning.

Introducción

En esta primera lección del curso comenzaremos entendiendo qué es Matplotlib, cómo se relaciona con el lenguaje de programación de Python y con otras librerías y porqué resulta siendo una librería fundamental en Ciencia de Datos y Machine Learning.

Video

En el canal de YouTube puedes ver el video completo de esta primera lección:

¿Qué es Matplotlib?

Comencemos dando una definición tomada del sitio oficial: “Matplotlib es una librería que permite crear visualizaciones estáticas, animadas e interactivas en Python”.

Y ahora desglosemos esta definición.

En primer lugar Matplotlib es una librería construida sobre Python, lo cual quiere decir que debemos instalarla para poder comenzar a usarla.

Y esta librería permite generar visualizaciones estáticas, que son los tipos de gráficas que más nos interesan en Ciencia de Datos y Machine Learning (especialmente gráficos 2D como gráficos de líneas, de dispersión, histogramas, datos categóricos, etc., que veremos en detalle a lo largo del curso).

Además de esto permite generar visualizaciones animadas e interactivas, que son opciones que no exploraremos en este curso pues no son tan relevantes en Ciencia de Datos y Machine Learning.

Matplotlib y su relación con Python

Matplotlib requiere como punto de partida el conocimiento de la programación en Python y adicionalmente tiene como dependencia la librería NumPy (también de Python).

En la Academia Online están disponibles los cursos Python Nivel Básico, Python Nivel Intermedio y Python Nivel Avanzado con los cuales podrás aprender a programar en este lenguaje, así como el curso NumPy para Ciencia de Datos y Machine Learning en donde aprenderás a usar esta librería.

Adicionalmente, Matplotlib nos permite interactuar con otras librerías comúnmente usadas en Ciencia de Datos y Machine Learning (como Pandas, TensorFlow, Scikit-Learn o Pytorch, entre otras) con lo cual podremos generar visualizaciones en las diferentes fases de desarrollo de nuestros proyectos.

Matplotlib y su importancia en Ciencia de Datos y Machine Learning

Matplotlib resulta fundamental en cualquier proyecto de Ciencia de Datos y Machine Learning, pues nos permite desarrollar visualizaciones que resultan esenciales en diferentes fases del ciclo de vida de estos proyectos.

En particular, en el ciclo de vida de un proyecto de Ciencia de Datos Matplotlib es una herramienta útil en las fases de limpieza de datos, análisis exploratorio de datos, análisis (descriptivo, explicativo, predictivo o prescriptivo) y en la comunicación de resultados.

Además, en el ciclo de vida de un proyecto de Machine Learning podemos usar Matplotlib como herramienta de visualización en las fases de limpieza de datos, análisis exploratorio de los datos, pre-procesamiento de datos y extracción de características y durante la construcción misma del modelo.

Conclusión

Muy bien, acabamos de ver una introducción a la librería Matplotlib y ya tenemos un panorama general de las principales características de esta librería, de su relación con el lenguaje de programación Python y otras librerías y de su importancia en la Ciencia de Datos y el Machine Learning.

Así que ya estamos listos para comenzar con todo el componente práctico del curso. Así que en la próxima lección veremos cómo instalar Matplotlib y cómo acceder a su documentación.

Ver todas las lecciones de este curso