12 - El Teorema de Bayes

Noviembre 11, 2023 por Miguel Sotaquirá

Lección 12 del curso Probabilidad Nivel Básico.

En las últimas dos lecciones hablamos de los conceptos de la probabilidad condicional y los eventos independientes que nos permiten calcular la probabilidad cuando diferentes eventos pueden o no estar relacionados.

En esta lección introduciremos un concepto de gran importancia en la Ciencia de Datos pero especialmente en el Machine Learning: el teorema de Bayes.

Este teorema es simplemente una herramienta matemática que nos permite actualizar el cálculo de probabilidades cuando añadimos nueva información al experimento y es un concepto que se usa como punto de partida para diferentes técnicas de Machine Learning.

Así que en esta lección comenzaremos viendo un ejemplo de motivación y luego veremos una definición formal de este teorema de Bayes, para finalizar con varios ejemplos prácticos que nos permitirán interpretar el significado de este teorema.

Suscríbete y accede al código fuente y al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien, en este punto tenemos un teorema de gran importancia en la teoría de la Probabilidad: el teorema de Bayes.

Este teorema es simplemente una herramienta matemática que nos permite actualizar el valor de una probabilidad con base en nueva información, y para hacerlo hace uso de varios de los conceptos que hemos visto hasta el momento en el curso e introduce conceptos como la probabilidad “a priori” que es precisamente la probabilidad que queremos actualizar.

Este teorema es la base de varios métodos de importancia en el Machine Learning, como la clasificación con algoritmos “naive Bayes”, las Redes Bayesianas y algunas técnicas usadas en aprendizaje por refuerzo que hemos mencionado en otros cursos y que aprenderemos más adelante en otros tantos.

Pero en los ejemplos anteriores nos quedó una incógnita por resolver y era cómo determinar las probabilidades de ocurrencia asociadas al resultado positivo de la prueba o a que la palabra clave aparezca en un mensaje. Sin embargo, estas probabilidades son independientes de que la persona tenga o no la enfermedad (en el primer caso) o de que el mensaje sea o no spam (en el segundo caso).

Es decir que a pesar de que definimos y entendimos la idea del teorema de Bayes, aún nos falta un elemento adicional para poder usarlo en el cálculo de probabilidades.

Este elemento adicional nos permitirá precisamente calcular esas probabilidades independientes y se conoce como el teorema de la probabilidad total que será precisamente el tema de la próxima lección.

Ver todas las lecciones de este curso