9 - Densidad de probabilidad y distribución acumulada

Lección 9 del curso Probabilidad Nivel Intermedio.

En el módulo anterior hablamos de las principales distribuciones de probabilidad para el caso de las variables aleatorias discretas, y allí vimos en detalle en qué consisten la distribución binomial y la distribución multinomial. Adicionalmente vimos de forma práctica cómo hacer uso de estas distribuciones y específicamente en la lección anterior vimos cómo usar de forma práctica la distribución multinomial para construir un sencillo modelo predictivo.

En este último módulo del curso seguiremos un enfoque similar pero orientado a las variables aleatorias continuas. En particular nos enfocaremos en la distribución de probabilidad más usada para este tipo de variables: la distribución gaussiana (también llamada distribución normal).

Pero antes de ver en detalle esta distribución, en esta lección nos enfocaremos en dos conceptos sencillos similares a los ya vistos en el caso de las variables aleatorias discretas: hablaremos de la función densidad de probabilidad y de la función de distribución acumulada.

Contenido exclusivo suscriptores

Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien, ya tenemos claro qué son las funciones densidad de probabilidad y de distribución acumulada, conceptos que se aplican para el caso de variables aleatorias continuas.

Vimos que en esencia son como el equivalente de las funciones de probabilidad de masa y de distribución acumulada que vimos para el caso de variables aleatorias discretas, con la diferencia de que para el caso de las variables aleatorias continuas en lugar de usar sumas para calcular probabilidades debemos hacer uso de integrales (de las cuales hablamos en detalle en el curso Cálculo para Ciencia de Datos y Machine Learning.)

Además, acabamos de ver algunos ejemplos sencillos de cálculo de probabilidades y de probabilidades acumuladas usando precisamente las integrales.

En la práctica, en proyectos de Ciencia de Datos y Machine Learning, no tendremos que resolver estas integrales manualmente y en su lugar usaremos librerías de Python que hacen ese cálculo por nosotros. Sin embargo es clave tener claro el proceso matemático que se da detrás de todo esto.

Así que teniendo claros todos estos conceptos ya estamos listos para comenzar a ver la parte central de este módulo. Entonces en la próxima lección veremos todos los detalles de la distribución Gaussiana (o normal), la distribución que más comúnmente encontraremos en la mayoría de los proyectos de Ciencia de Datos y Machine Learning a los que nos enfrentemos.

Ver todas las lecciones de este curso