Test de hipótesis para la media

de una distribución normal

Partimos de una determinada afirmación sobre el valor de la media de la población, que suponemos sigue la distribución normal, llamada hipótesis nula (H0) y, simultáneamente, planteamos una hipótesis que niegue la hipótesis nula, denominada hipótesis alternativa (H1). Se pueden presentar tres opciones:

opc

A continuación se determina la distribución de la media, considerando que la media de la población es el valor establecido en la hipótesis nula.  Se elige el nivel de significación α y se divide el intervalo de variación de la media en dos partes: el intervalo de aceptación y el intervalo de rechazo o región crítica. El intervalo de aceptación es tal que, supuesto que se cumple H0, la probabilidad de que la media de una única muestra esté incluida en dicho intervalo es igual a 1 - α y se denomina nivel de confianza. Complementariamente, la probabilidad de que una única muestra tenga una media incluida en el intervalo de rechazo o región crítica es α, y se denomina nivel de significación.

Cuando la zona crítica o de rechazo se corresponde gráficamente con las dos colas de la curva normal (primera de las tres opciones que se señalaron más arriba para la hipótesis alternativa), decimos que se trata de un cotraste bilateral o de dos colas (la probabilidad de cada una de las colas es α/2):

bilateral

Cuando la zona crítica se corresponde con una sola de las colas, se trata de un contraste unilateral o de una cola, que puede ser la izquierda o la derecha:

izq

Finalmente comprobamos si la media de la muestra cae dentro del intervalo de aceptación, en cuyo caso aceptamos la hipótesis nula, o cae dentro de la región crítica, en cuyo caso rechazamos la hipótesis nula y aceptamos la alternativa.

Al tomar una decisión estadística basada en un contraste de hipótesis pueden darse cuatro situaciones distintas:

  • Rechazamos H0 siendo verdadera.
  • Aceptamos H0 siendo verdadera.
  • Rechazamos H0 siendo falsa.
  • Aceptamos H0 siendo falsa.

En el segundo caso y en el tercero, la decisión es correcta, pero en los otros dos casos cometemos un error. Si rechazamos H0 siendo verdadera, cometemos un error denominado error de tipo I. Si aceptamos H0 siendo falsa, cometemos un error  denominado error de tipo II.

Utiliza la aplicación para encontrar la solución de los problemas que se plantean más abajo. Una vez introducidos los datos, en las casillas correspondientes, y elegido el tipo de contraste, pulsa el botón representa y comprueba si la proporción en la muestra cae en el intervalo de aceptación de la hipótesis nula o en la región crítica. Antes de introducir los datos del siguiente problema pulsa el botón otroproblema.

Usa la aplicación para resolver los siguientes problemas:

  1. Gracias a trabajos realizados por expertos, se sabe que la velocidad lectora media de los niños de 6 años es de 40 palabras por minuto, siendo la desviación típica 12. Hemos tomado una muestra aleatoria de 49 niños de 6 años y les hemos medido su velocidad lectora, resultando una media de 42 palabras por minuto. ¿Podemos afirmar que nuestra media es compatible con la de los expertos, a un nivel de confianza del 99 %?

  2. Una empresa asegura que las bombillas que fabrica tienen una duración media de 1600 h. A fin de contrastar este dato, se tomó una muestra de 100 bombillas, obteniéndose una duración media de 1570 h, con una desviación típica de 120 h. ¿Puede aceptarse la información de la empresa con un nivel de confianza del 95 %?

  3. Una máquina de café dispensa en cada taza un promedio de 20 cl, con una desviación típica de 2 cl. Se recoge una muestra de 50 cafés y se observa que la media del contenido de las tazas es de 19,5 cl. ¿Hay que llevar a reparar la máquina de café? Responde a la cuestión anterior considerando un nivel de significación de:

      1. α = 10 %
      2. α = 5 %
  4. Se supone que el nivel medio de colesterol en sangre de una población no supera las 160 u, con desviación típica de 20 u. Se toma una muestra de 50 individuos y la media muestral del nivel de colesterol es 165 u, por lo que parece que es mayor de lo supuesto. ¿Se rechazará la hipótesis con un nivel de significación del 2,5 %?

  5. Una encuesta, realizada a 64 empleados de una fábrica, concluyó que el tiempo medio de duración de un empleo en la misma era de 6,5 años, con una desviación típica de 4. ¿Sirve esta información para aceptar, con un nivel de significación del 5 %, que el tiempo medio de empleo en esa fábrica es menor o igual que 6? Justifica adecuadamente la respuesta.

  6. Un fabricante afirma que el peso medio de los yogures que vende es de 125 gr. Un cliente sospecha que vienen menos llenos. Para contrastarlo, toma una muestra aleatoria de 36 yogures y obtiene un peso medio de 124 gramos. Suponiendo que el peso de los yogures sigue una distribución normal con desviación típica 3 gramos,

      1. Plantea un test para contrastar la hipótesis de que el peso medio es el que dice el fabricante, frente a la alternativa de que es menor, tal como parecen indicar los datos.

      2. ¿A qué conclusión se llega en el contraste anterior para un nivel de significación del 5 %?

  7. La Concejalía de Juventud maneja el dato de que la edad a la que los hijos se independizan es una variable normal con media 29 años y desviación típica 3 años. Aunque la desviación típica no plantea dudas, sí se sospecha que la media ha descendido, sobre todo por la política de ayuda al empleo que ha llevado a cabo el ayuntamiento. Así, de un estudio reciente sobre 100 jóvenes que se acaban de independizar, se ha obtenido una media de 28,1 años de edad.

      1. Con un nivel de significación del 1 %, ¿puede defenderse que la edad media no ha disminuido, frente a que sí lo ha hecho como parecen indicar los datos? Plantea el contraste o test de hipótesis y resuélvelo.

      2. Explica, en este problema, en qué consisten cada uno de los errores del tipo I y II.

  8. En un centro universitario el gasto medio mensual en fotocopias por alumno hace cinco años era de 50 euros. En la actualidad la mayor parte del profesorado ha colgado una copia electrónica del material de clase en la página web del centro, lo que hace sospechar que dicho gasto habrá disminuido. Para comprobar esta hipótesis se seleccionan al azar 100 alumnos actuales, para los que se obtuvo que su gasto medio mensual en fotocopias era de 49 euros. Suponiendo que el gasto mensual en fotocopias sigue una distribución normal con desviación típica 4 euros,

      1. Plantea un test para contrastar la hipótesis de que el gasto medio no ha cambiado, frente a la alternativa de que sí es menor de 50 euros, tal como parecen indicarlos datos.

      2. ¿A qué conclusión se llega en el contraste anterior para un nivel de significación del 5 %?