4 - Lectura de un DataFrame y atributos básicos
Lección 4 del curso Pandas Nivel Básico.
En la lección anterior hablamos de las Series y los DataFrames, las dos estructuras de datos usadas en Pandas.
En este segundo módulo del curso nos enfocaremos en los DataFrames, que son simplemente tablas o arreglos bidimensionales de datos.
Además de esto, un DataFrame es un objeto en Python, así que asociado a este objeto tendremos unos atributos y unos métodos.
En esta lección veremos entonces cómo leer un DataFrame así como sus principales atributos.
En primer lugar veremos cómo leer un DataFrame usando la función read_csv
de Pandas y cómo usar diferentes parámetros de esta función para leer la totalidad de una tabla de datos o sólo parte de esta.
Y luego hablaremos de los atributos de un DataFrame que usaremos más comúnmente en nuestros proyectos de Ciencia de Datos y Machine Learning.
Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online
Acabamos de ver cómo leer un archivo CSV en un DataFrame de Pandas usando la función read_csv
y cómo usar los parámetros usecols
y nrows
para leer sólo una parte del archivo de datos.
Además vimos la utilidad de los atributos shape
, index
, columns
y values
que, junto con el método to_numpy()
, nos permite extraer información básica del set de datos y que puede resultar útil en etapas posteriores de procesamiento.
En la próxima lección veremos la versatilidad que ofrece Pandas, y en particular los DataFrames para el almacenamiento de diferentes tipos de datos provenientes del set de datos que estemos procesando. Así que hablaremos de los diferentes tipos de datos que podemos almacenar en un DataFrame.