Muestras

En muchas ocasiones, cuando se pretende realizar un estudio estadístico, no resulta factible analizar la totalidad de la población. Las causas pueden ser diversas: la población es muy numerosa, el proceso de toma de datos es destructivo (como es el caso de algunos controles de calidad de las fábricas), abarcar a toda la población llevaría demasiado tiempo, etc. En tales circunstancias es necesario elegir una muestra, que debe ser representativa de la población objetivo.

Para que una muestra sea representativa tiene que contener las características relevantes de la población aproximadamente en las mismas proporciones en que están incluidas en tal población. Para ello:

  • Cada unidad muestral debe tener asignada una probabilidad de entrar en la muestra.

  • El tamaño de la muestra debe ser el adecuado.

En esta aplicación vamos a resolver algunos problemas sobre selección de muestras a partir de una determinada población. La población está formada por 500 letras vocales, mayúsculas y minúsculas, distribuidas no uniformemente. La proporción de cada una de las letras en la población se muestra en la tabla de frecuencias izquierda.

De dicha población se seleccionan dos muestras. El método elegido para la selección de los elementos de la muestra 1 ha sido el muestreo aleatorio simple. Los elementos de la muestra 2 se selecciona mediante un procedimiento no aleatorio. Ambas muestras tienen el mismo tamaño, que se puede fijar mediante el deslizador Tamaño de la muestra. Al pulsar el botón nuevamuestra se renuevan los elementos de ambas muestras.

Usa la aplicación y responde:

  1. Compara la tabla de frecuencias de la población con las de cada una de las muestras. ¿Se reparten las letras en la misma proporción en las tres tablas? ¿Y las mayúsculas y minúsculas?

  2. Sin cambiar el tamaño de la muestra, pulsa varias veces el botón nuevamuestra y observa tras cada pulsación la variación de las tablas de frecuencias. ¿Consideras suficientemente representativa la muestra 1? ¿Y la muestra 2? ¿Por qué?

  3. Cambia ahora el tamaño de la muestra: fíjalo en n=10. Pulsa varias veces el botón nuevamuestra y observa tras cada pulsación las tablas de frecuencias. ¿Resulta representativa alguna de las muestras? ¿Por qué?

  4. Aumenta progresivamente el tamaño de las muestras y, para cada uno de sus valores, pulsa varias veces el botón nuevamuestra. Analiza las tablas de frecuencias. ¿Qué tamaño mínimo de muestra crees que es necesario para que la muestra 1 sea suficientemente representativa de la población? ¿En algún caso es representativa la muestra 2? ¿Por qué?

  5. En el caso de la muestra 1, a cada una de las letras que componen la población se le ha asignado un número, entre el 1 y el 500. A continuación se eligen, al azar, tantos elementos de la población como indica el tamaño de la muestra. ¿Podrías indicar alguna otra forma de seleccionar aleatoriamente la muestra, de modo que todos los elementos de la población tengan las mismas posibilidades de ser elegidos?

  6. En el caso de la muestra 2, a cada una de las letras que componen la población también se le ha asignado un número, entre el 1 y el 500. Sin embargo, en esta ocasión lo que se ha hecho es elegir al azar un número entre 1 y 100 y, a partir de dicho número, tomar tantos elementos como indica el tamaño de la muestra. ¿Por qué este método no garantiza la representatividad de la muestra?