11 - Comparación de datos numéricos vs. numéricos

Lección 11 del curso Estadística Descriptiva.

En los módulos anteriores hemos visto diferentes técnicas para el análisis univariado de variables tanto numéricas como categóricas. Por ejemplo, en el módulo anterior vimos cómo usar los gráficos de barras simples y las tablas de frecuencia para analizar variables categóricas de manera individual.

En este último módulo del curso nos enfocaremos en técnicas para el análisis bivariado (es decir por pares de variables) y multivariado (es decir de más de dos variables) que resultan también esenciales en la Estadística Descriptiva y específicamente en el Análisis Exploratorio de Datos.

Y como podemos tener datos tanto numéricos como categóricos podremos tener diferentes tipos de combinaciones al realizar el análisis. Así que en esta lección nos enfocaremos en las principales técnicas para realizar el análisis bivariado cuando queremos comparar variables numéricas.

Específicamente hablaremos de la correlación, de la matriz de correlación, de los gráficos de dispersión, los mapas hexagonales y las curvas de contorno, que son las principales técnicas de Análisis Exploratorio que podemos usar al comparar variables numéricas.

Al igual que en lecciones anteriores, por cada una de estas herramientas veremos qué es, cuándo usarla y un ejemplo práctico de uso enfocado al análisis exploratorio.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien, acabamos de ver las principales técnicas de Estadística Descriptiva que nos permiten analizar pares de variables numéricas.

La más sencilla de todas es la correlación que nos permite cuantificar el grado de relación entre pares de variables numéricas.

Sin embargo, cuando tenemos muchas variables numéricas lo más adecuado es primero calcular la matriz de correlación (entre todos los posibles pares de variables) y luego dibujar dicha matriz usando mapas de calor.

También podemos usar gráficos de dispersión cuando queremos ver en detalle relaciones entre pares específicos de variables, superponiendo al gráfico el coeficiente de correlación de Pearson.

Y cuando tenemos varios miles de registros resulta más conveniente visualizar relaciones entre pares de variables usando los mapas hexagonales o curvas de contorno (que arrojan resultados similares).

Así que ya hemos visto este primer grupo de técnicas para el análisis bivariado de variables numéricas.

En la próxima lección nos enfocaremos entonces en un segundo grupo de técnicas que nos permite realizar el análisis bivariado de variables categóricas es decir cuando queremos comparar datos categóricos vs. datos categóricos.

Ver todas las lecciones de este curso