7 - La técnica del bootstrapping

Lección 7 del curso Estadística Inferencial Fundamentos.

En la lección anterior hablamos de los intervalos de confianza que, junto con el error estándar, son otra manera de cuantificar la incertidumbre en nuestras estimaciones.

Y hasta este punto estas y todas las demás técnicas que hemos visto hasta el momento parten de una condición ideal: debemos tener acceso a la población, es decir a la totalidad de los datos.

Pero ya sabemos que en la práctica esto no es viable y que sólo tendremos acceso a los datos recolectados (que en últimas son una muestra de la población).

Así que la pregunta es: ¿cómo podemos generar estimaciones confiables si tan sólo tenemos una muestra de la población?

La respuesta a esta pregunta está en la técnica de “bootstrapping” que veremos en detalle en esta lección.

Como veremos en un momento, el “bootstrapping” nos permite usar una muestra de la población para, con ligeras modificaciones a las técnicas vistas hasta el momento, lograr hacer estimaciones bastante fiables a partir de los datos que logremos recolectar.

Así que comenzaremos haciendo un repaso de la forma como idealmente se hacen estimaciones basadas en la población, luego veremos el principio de funcionamiento del “bootstrapping” así como un sencillo ejemplo que nos permitirá entender la idea básica del método.

Luego haremos una simulación para verificar que las estimaciones obtenidas con el “bootstrapping” son muy cercanas a las obtenidas si tuviésemos la población. Y finalizaremos la lección con un ejemplo práctico aplicado al análisis de un set de datos y con los principales aspectos a tener en cuenta al momento de usar el “bootstrapping”.

¡Así que comencemos!

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien acabamos de ver todos los detalles de la técnica del “bootstrapping” que es la herramienta que en últimas debemos usar al momento de realizar estimaciones a partir de los datos que recolectemos.

En esencia el “bootstrapping” hace uso del muestreo con reemplazo para crear artificialmente una distribución muestral a partir de estos datos recolectados, lo que nos permite aplicar las técnicas de estimación vistas hasta el momento y obtener resultados y estimaciones bastante cercanas a las que obtendríamos si tuviésemos acceso a toda la población.

Además, esta técnica se puede aplicar para estimar no sólo la media sino prácticamente cualquier estadística que nos resulte útil al momento de caracterizar nuestros datos. Y más adelante veremos que es la técnica a elegir cuando queramos realizar pruebas de hipótesis sobre nuestros datos.

Así que con esto ya hemos completado este primer módulo del curso donde hemos visto en qué consiste el muestreo, cómo construir una distribución muestral, en qué consiste la técnica del “bootstrapping” y cómo usar estas herramientas para generar estimaciones y cuantificar niveles de incertidumbre de las mismas a partir de los datos recolectados.

En el segundo módulo del curso veremos una introducción general a las pruebas de hipótesis y entenderemos todos los elementos involucrados en este tipo de pruebas que resultan fundamentales cuando queremos extraer información relevante de nuestros datos.

Y en la próxima lección comenzaremos con lo esencial: entendiendo ¿qué es una hipótesis y qué es una prueba de hipótesis?.

Ver todas las lecciones de este curso