1 - Variables aleatorias continuas y discretas

Lección 1 del curso Probabilidad Nivel Intermedio.

Cuando procesamos datos en un proyecto de Ciencia de Datos y Machine Learning, estos datos tienen un grado de incertidumbre.

Por ejemplo al generar un texto con un modelo de lenguaje lo que se hace es tratar de predecir la siguiente palabra más probable de acuerdo a la secuencia de texto recibida a la entrada; si estamos clasificando una imagen lo que hacemos es asignarle la categoría más probable; mientras que si estamos intentando predecir la temperatura en un lugar e instantes determinados habrá un rango de error en la temperatura predicha.

En esencia en la Ciencia de Datos y el Machine Learning debemos siempre tener en cuenta esta incertidumbre y por tanto debemos conocer herramientas de la Probabilidad para poder extraer información relevante de estos datos.

Y una herramienta muy usada cuando estamos procesando datos son las distribuciones de probabilidad, que nos permiten cuantificar ese grado de incertidumbre en los datos.

Y en este primer módulo del curso comenzaremos precisamente dando una introducción a lo que son las distribuciones de probabilidad.

Específicamente, en esta primera lección comenzaremos entendiendo qué es una variable aleatoria y qué son las variables aleatorias discretas y continuas, que son el punto de partida para posteriormente entender las distribuciones de probabilidad.

Para entender qué son estas variables aleatorias vamos a partir de algunos ejemplos intuitivos a partir de los cuales daremos una definición formal de lo que es una variable aleatoria en la parte final de esta lección.

Contenido exclusivo suscriptores

Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien, acabamos de ver qué es una variable aleatoria, que es simplemente una función que permite tomar los posibles eventos que obtendremos en nuestro experimento y convertirlos en números.

Y esos números generados pueden ser discretos o continuos y, por tanto, tendremos variables aleatorias discretas o continuas.

Y acá es importante resaltar el término “aleatoria” que quiere decir que se trata de eventos y cantidades numéricas que no son totalmente predecibles y que, por tanto, son gobernados por las leyes de la Probabilidad.

De hecho, la distribución de probabilidad lo que hace es asignar una probabilidad de ocurrencia (un número entre 0 y 1) a los diferentes valores que alcanza la variable aleatoria.

Así que las variables aleatorias son el punto de partida para entender las qué son las distribuciones de probabilidad, de las cuales vamos a hablar precisamente en la próxima lección.

Ver todas las lecciones de este curso