1 - El muestreo y tipos de muestreo

Lección 1 del curso Estadística Inferencial Fundamentos.

En esta primera lección del curso vamos a entender qué son la población, la muestra y el muestreo y cuáles son las diferentes técnicas de muestreo que podemos usar dependiendo del propósito de nuestro proyecto.

Así que comenzaremos retomando la definición de Estadística Inferencial, vista en un curso anterior, lo que nos permitirá tener un contexto tanto de esta área de la Estadística como del curso.

Luego repasaremos los conceptos de población y muestra, vistos en el curso de Estadística Descriptiva y vamos a entender porque siempre tendremos acceso sólo a una parte del total de los datos (la muestra).

Veremos además que el hecho de trabajar con una muestra, y no con la totalidad de los datos, agregará incertidumbre a nuestro análisis.

Al final, veremos las diferentes técnicas de muestreo que existen (como el muestreo aleatorio, el muestreo aleatorio con reemplazo y el muestreo estratificado) y cuáles son los casos típicos de uso de cada una de estas técnicas en Ciencia de Datos y Machine Learning.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien, acabamos de ver que en la práctica es casi siempre imposible contar con la totalidad de los datos para nuestro proyecto y en su lugar tendremos un subconjunto de estos, que se conoce como la muestra.

Y esto implica que al momento de caracterizar nuestros datos (por ejemplo usando medidas de tendencia central o medidas de variabilidad) tendremos una estimación de estos valores, es decir una aproximación al valor real que tendría la población.

Además vimos en qué consisten las técnicas de muestreo aleatorio, muestreo aleatorio con reemplazo y muestreo estratificado y vimos las situaciones de uso más común de estas técnicas en la Ciencia de Datos y el Machine Learning.

Teniendo claros estos conceptos, en la próxima lección hablaremos del sesgo que es otro efecto indeseado pero que siempre estará presente al momento de trabajar sólo con una parte de los datos (la muestra) y no con la totalidad de los mismos (la población).

Ver todas las lecciones de este curso