1 - La covarianza

Lección 1 del curso Probabilidad Nivel Avanzado.

En este primer módulo del curso revisaremos los conceptos de covarianza y correlación que resultan esenciales en diferentes técnicas de uso común en Ciencia de Datos y Machine Learning.

Y específicamente en esta primera lección del curso vamos a entender el sencillo concepto de la covarianza que no sólo es la base de una amplia variedad de técnicas de regresión y clasificación usadas en Machine Learning, sino que además es la base del concepto de correlación (del cual hablaremos en la siguiente lección) y que es también de uso extendido en fases como el Análisis Exploratorio de Datos.

Entonces a continuación retomaremos los conceptos de media y desviación estándar de una variable aleatoria, de los cuales hablamos en el curso Probabilidad Nivel Intermedio, con lo cual podremos definir los conceptos de varianza y covarianza (los cuales están muy relacionados) para terminar viendo un sencillo ejemplo de cálculo de la covarianza así como algunas de sus limitaciones al momento de caracterizar el comportamiento de variables aleatorias.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien, acabamos de entender este sencillo concepto de la covarianza que en últimas es una operación que nos permite medir el grado de variación que existe entre pares de variables aleatorias.

A través de los diferentes ejemplos que acabamos de analizar pudimos ver cómo diferentes tipos de interacciones entre los datos pueden mostrar relaciones lineales positivas, negativas o ningún tipo de relación.

Además vimos que la principal limitación de la covarianza es el hecho de que depende de la escala misma de los datos. Es decir que a mayor escala de los datos mayor será el valor de la covarianza y viceversa. Y el problema de esta dependencia es que resulta difícil realizar comparaciones entre valores de covarianza.

Es a partir de esta limitación que surge el concepto de la correlación que se calcula de forma muy similar a la covarianza pero que resuelve este inconveniente de la escala. Así que en la próxima lección hablaremos en detalle de esta correlación.

Ver todas las lecciones de este curso