6 - Gráficos de caja (boxplots)

Lección 6 del curso Estadística Descriptiva.

En el módulo anterior vimos dos sencillas técnicas que convencionalmente se usan para describir y caracterizar nuestros datos: las medidas de tendencia central y las medidas de variabilidad o dispersión.

Sin embargo, aunque estas medidas nos permiten tener una idea general del comportamiento de nuestros datos, no son por sí solas útiles pues son solo una medida global de dicho comportamiento.

En este tercer módulo del curso comenzaremos a ver técnicas más completas que, sumadas a las medidas de tendencia central y variabilidad, nos permitirán extraer información adicional al momento de analizar nuestros datos.

Así que en este módulo nos enfocaremos en el análisis univariado de variables numéricas, una técnica muy útil en el Análisis Exploratorio de Datos.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien, acabamos de ver qué son y cómo se utilizan los boxplots al momento de analizar las variables en nuestro set de datos.

En últimas un boxplot es simplemente una representación gráfica de la distribución de nuestros datos y toma como punto de partida el cálculo de la mediana y del rango intercuartiles (vistos en las dos lecciones anteriores) para obtener esta representación.

Y con este tipo de gráfico podemos no sólo ver los valores centrales y la dispersión de nuestros datos, sino que igualmente podemos ver su simetría y, algo clave en el Análisis Exploratorio de Datos, la presencia de outliers o valores extremos en la variable analizada.

En la próxima lección nos enfocaremos en una segunda herramienta gráfica usada en el Análisis Exploratorio de Datos y en el análisis univariado: los histogramas, que son una manera alternativa de visualizar la distribución de nuestros datos.

Ver todas las lecciones de este curso