1 - ¿Qué es la probabilidad?: definición intuitiva
Lección 1 del curso Probabilidad Nivel Básico.
Tabla de contenido
Introducción
En esta primera lección del curso comenzaremos dando una definición intuitiva de lo que es la Probabilidad a partir de varios ejemplos reales.
Video
En el canal de YouTube puedes ver el video completo de esta primera lección:
Ejemplos de motivación
Comencemos viendo algunos ejemplos de situaciones reales en donde aparece el concepto de Probabilidad. Esto nos servirá como punto de partida para ir construyendo una definición intuitiva.
Ejemplo 1: el clásico lanzamiento de la moneda
¡Este es el ejemplo clásico en la Probabilidad!
Cuando lanzamos una moneda lo que podemos esperar es que el 50% de las veces caiga en cara y el otro 50% en sello.
Pero acá lo importante es observar que no podemos tener total certeza antes del lanzamiento acerca de cuál de las dos caras caerá.
Ejemplo 2: el clima
Si miramos la predicción del clima en nuestra ciudad para mañana encontraremos algo que nos dice por ejemplo “a las 5 pm habrá un 70% de probabilidad de lluvia”.
Esto quiere decir que el servicio meteorológico, con base información histórica, en los datos que tiene actualmente, en patrones climatológicos “cree” que existen 7 posibilidades entre 10 de que llueva.
Sin embargo el servicio meteorológico no nos podrá asegurar con un 100% de certeza de que efectivamente va a llover.
Ejemplo 3: un examen diagnóstico
En diferentes pruebas diagnósticas usadas en medicina para la detección de enfermedades las pruebas pueden ser positivas (si se tiene la enfermedad) o negativas (si no se tiene la enfermedad).
Sin embargo, incluso la prueba más precisa tendrá un cierto grado de incertidumbre. Así, los fabricantes de la prueba generalmente nos indican unos porcentajes de acierto y desacierto.
Por ejemplo, en una prueba determinada el fabricante nos puede decir: si la prueba es positiva en el 95% de los casos usted podrá confiar en este resultado, pero existe una pequeña posibilidad de que en el 5% de los casos la prueba falle (y su resultado sea realmente negativo).
Esto quiere decir que la prueba no es 100% fiable y existe algún grado de incertidumbre en el diagnóstico que entrega.
Ejemplo 4: una acción en la bolsa
Cuando compramos una acción en la bolsa no tenemos manera de predecir con total certeza si en el futuro (corto o largo plazo) la acción subirá y ganaremos dinero o bajará y terminaremos perdiendo nuestra inversión.
Y esto se debe a que el valor de esta acción depende de factores como el mercado, la oferta y la demanda, el desempeño de la compañía e incluso de los mismos sentimientos de los compradores.
Y todo esto hace que exista un alto grado de incertidumbre en el comportamiento de esa acción a lo largo del tiempo.
Ejemplo 5: los atascos o embotellamientos
Cuando una persona se dirige al trabajo cada mañana tiene un tiempo estimado para llegar a su oficina.
Pero esa cantidad de tiempo es sólo una aproximación y con antelación no puede estar 100% seguro de que por ejemplo mañana requerirá 47 minutos para llegar al trabajo.
Es decir que en el camino se puede encontrar con diferentes elementos que pueden hacer que se requiera más tiempo en llegar (un accidente, lluvia, su vehículo se dañó, había más vehículos de los que se encuentra usualmente en el camino, etc.).
Es decir que en el nivel de tráfico vehicular hay un cierto grado de incertidumbre que impide a la persona saber con precisión cuánto tiempo le tomará ir de la casa al trabajo.
Algunas ideas básicas
Podemos sintetizar los ejemplos anteriores en varias ideas básicas:
- Hay situaciones en las que no podemos tener total certeza de que un evento o situación vaya a ocurrir (la moneda cae en cara, va a llover, el resultado de la prueba será negativo, la acción subirá, llegaré en 47 minutos al trabajo)
- Es decir que en muchos casos existe un grupo o conjunto de posibles eventos y, dependiendo del contexto, algunos tendrán mayor chance de ocurrir que otros.
- En el mundo real, y como veremos más adelante en la Ciencia de Datos y el Machine Learning, hay un alto grado de incertidumbre.
- Podemos cuantificar ese grado de incertidumbre asignando un número entre 0 y 1 o entre 0 y 100% para indicar qué tan seguros estamos de que un evento, dentro de un conjunto de eventos, llegue a ocurrir
La probabilidad: definición intuitiva
Teniendo en cuenta los ejemplos anteriores y las ideas que acabamos de resumir, podemos definir de manera intuitiva la Probabilidad como:
“Un campo de las Matemáticas que busca cuantificar la incertidumbre a partir de un conjunto de posibles eventos”
Desglosemos esta definición:
- Cuantificar se refiere a asignar un número a esa posibilidad de que una situación ocurra
- Incertidumbre quiere decir que en muchas situaciones no podemos tener certeza absoluta y por eso sólo podemos indicar la probabilidad de ocurrencia
- Conjunto de eventos: en una situación real podríamos tener un grupo de eventos cada uno con una probabilidad de ocurrencia asociada. Por ejemplo:
- En el caso de la moneda tenemos 2 eventos (cara o sello) cada uno con una probabilidad del 50%
- En el caso de la lluvia tenemos 2 eventos (llueve o no llueve) el primero con una probabilidad del 70% y el segundo con el 30%
- En el caso del examen diagnóstico tenemos una probabilidad del 95% de que si la prueba resulta positiva realmente sea positiva, y un 5% de que a pesar de indicar que es positiva resulte siendo negativa
- En el caso de la bolsa tenemos 2 eventos (la acción sube o baja) con, por ejemplo, probabilidades del 65% y del 35% respectivamente
- En el caso de los embotellamientos hay 2 eventos (habrá o no habrá embotellamiento) con, por ejemplo, probabilidades del 55% y del 45% respectivamente
Así que en este primer curso de Probabilidad lo que haremos será aprender los conceptos fundamentales que más adelante nos permitirán cuantificar ese grado de incertidumbre asociado a problemas de Ciencia de Datos y Machine Learning.
Conclusión
En este punto ya tenemos una idea intuitiva de lo que es la Probabilidad, así que en la próxima lección nos enfocaremos en la relación y la importancia que tiene la Probabilidad en la Ciencia de Datos y Machine Learning.