12 - Comparación de datos categóricos vs. categóricos

Lección 12 del curso Estadística Descriptiva.

En la lección anterior vimos un primer grupo de técnicas para el análisis bivariado y específicamente vimos herramientas que nos permiten realizar la comparación de datos numéricos vs. numéricos.

En esta lección veremos técnicas de análisis bivariado que nos permiten realizar comparaciones entre pares de variables categóricas.

Y en particular hablaremos de las tres técnicas más utilizadas: las tablas de contingencia y los gráficos de barras agrupadas y apiladas.

Así que por cada una de estas herramientas veremos qué es, cuándo usarla y un ejemplo práctico de uso enfocado al análisis exploratorio de datos categóricos.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien acabamos de ver en detalle qué son y cómo usar las tablas de contingencia y los gráficos de barras agrupadas y apiladas.

Las tablas de contingencia nos permiten ver de manera tabular la relación entre pares de variables categóricas y podemos mostrar estas tablas usando conteos o porcentajes, siendo esta la opción que sugiero por ser más fácil de interpretar.

Es importante tener en cuenta que estos porcentajes se pueden calcular de forma absoluta (es decir normalizando los conteos individuales entre el número total de datos) o por filas o por columnas. Todo dependerá en últimas de las preguntas que queramos responder y de cuál formato facilite la interpretación.

Por otra parte, los gráficos de barras agrupadas o de barras apiladas son simplemente dos formas equivalentes de representar de manera gráfica una tabla de contingencia. Sin embargo, la ventaja de estos gráficos es que resultan más fáciles de interpretar que una tabla de contingencia.

Así que habiendo entendido qué son y cómo funcionan estas herramientas, en la próxima lección veremos otro grupo de herramientas que nos permitirán realizar el análisis bivariado de variables numéricas y categóricas.

Es decir veremos herramientas que nos permitirán realizar la comparación entre datos categóricos y datos numéricos.

Ver todas las lecciones de este curso