14 - Comparación de múltiples variables

Lección 14 del curso Estadística Descriptiva.

Hasta este punto hemos visto técnicas para el análisis univariado y bivariado de variables tanto numéricas como categóricas.

Por ejemplo, en la lección anterior vimos cómo usar los gráficos de caja (o boxplots, los histogramas y los gráficos de densidad para comparar datos categóricos vs. numéricos como parte del análisis bivariado.

En esta última lección del curso nos enfocaremos en el análisis multivariado, es decir en herramientas que nos permitirán realizar la comparación de múltiples variables (más de dos) de manera simultánea.

Y como veremos en un momento, para realizar este análisis podremos aprovechar varias de las herramientas que usamos en el análisis univariado y bivariado vistas hasta el momento.

Sin embargo, en el caso del múltiples variables la complejidad del análisis se incrementará, pues tendremos más variables para analizar simultáneamente.

Adicionalmente, la complejidad de este análisis dependerá del número y tipo de variables que queramos analizar simultáneamente, así que el éxito de este análisis dependerá del conocimiento que tengamos los datos, de nuestra creatividad y de la experiencia que tengamos realizando el Análisis Exploratorio.

Además, no existirá una única ruta para realizar este análisis pues el mismo dependerá de las características propias del set de datos.

Así que a continuación veremos un ejemplo práctico que nos permitirá entender los principales aspectos a tener en cuenta cuando queremos realizar el análisis multivariado de un set de datos.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien acabamos de ver, a través de un ejemplo práctico, los principales elementos a tener en cuenta cuando queremos comparar de manera simultánea más de dos variables.

En últimas, es importante tener en cuenta que no existe un único método de comparar múltiples (más de 3) variables sino que esto dependerá del número y tipo de variables que queramos comparar, de nuestra experiencia realizando análisis exploratorio de datos y de nuestra creatividad al momento de usar las diferentes herramientas aprendidas en este curso.

También es importante tener en cuenta que entre más variables queramos analizar simultáneamente, más difícil resultará el análisis y en ocasiones será necesario usar métodos más sofisticados.

Así que los felicito por haber llegado al final de este curso de Estadística Descriptiva donde hemos aprendido las diferentes herramientas para el análisis univariado, bivariado y multivariado de variables tanto categóricas como numéricas y que resultan fundamentales en el Análisis Exploratorio de Datos, que es una fase esencial en cualquier proyecto de Ciencia de Datos y Machine Learning.

Espero que les haya gustado este curso y los invito a contactarme y a dejarme sus comentarios sobre el curso y sus sugerencias para seguir mejorando el contenido de la Academia.

Y además los invito a continuar su proceso de formación tomando el siguiente curso en esta serie: “Estadística Inferencial: Fundamentos”.

Les envío un saludo y nos vemos en el próximo curso!

Ver todas las lecciones de este curso