Test de hipótesis para la proporción

de una distribución binomial

Partimos de determinada afirmación sobre el valor de cierta proporción en la población, a la que llamamos hipótesis nula (H0) y, simultáneamente, planteamos una hipótesis que niegue la hipótesis nula, denominada hipótesis alternativa (H1). Se pueden presentar tres opciones:

opc

A continuación se determina la distribución de las proporciones muestrales, que será la distribución normal de media p0 y desviación típica $\sqrt{\frac{p_0(1-p_0)}{n}}$, siendo n el tamaño de la muestra. Se elige el nivel de significación α y se divide el intervalo de variación de la media en dos partes: el intervalo de aceptación y el intervalo de rechazo o región crítica. El intervalo de aceptación es tal que, supuesto que se cumple H0, la probabilidad de que la proporción de una única muestra esté incluida en dicho intervalo es igual a 1 - α y se denomina nivel de confianza. Complementariamente, la probabilidad de que una única muestra tenga una proporción incluida en el intervalo de rechazo o región crítica es α, y se denomina nivel de significación.

Cuando la zona crítica o de rechazo se corresponde gráficamente con las dos colas de la curva normal (primera de las tres opciones que se señalaron más arriba para la hipótesis alternativa), decimos que se trata de un cotraste bilateral o de dos colas (la probabilidad de cada una de las colas es α/2):

bilateral

Cuando la zona crítica se corresponde con una sola de las colas, se trata de un contraste unilateral o de una cola, que puede ser la izquierda o la derecha:

izq

Finalmente comprobamos si la proporción de la muestra cae dentro del intervalo de aceptación, en cuyo caso aceptamos la hipótesis nula, o cae dentro de la región crítica, en cuyo caso rechazamos la hipótesis nula y aceptamos la alternativa.

Al tomar una decisión estadística basada en un contraste de hipótesis pueden darse cuatro situaciones distintas:

  • Rechazamos H0 siendo verdadera.
  • Aceptamos H0 siendo verdadera.
  • Rechazamos H0 siendo falsa.
  • Aceptamos H0 siendo falsa.

En el segundo caso y en el tercero, la decisión es correcta, pero en los otros dos casos cometemos un error. Si rechazamos H0 siendo verdadera, cometemos un error denominado error de tipo I. Si aceptamos H0 siendo falsa, cometemos un error  denominado error de tipo II.

Utiliza la aplicación para encontrar la solución de los problemas que se plantean más abajo. Una vez introducidos los datos, en las casillas correspondientes, y elegido el tipo de contraste, pulsa el botón representa y comprueba si la proporción en la muestra cae en el intervalo de aceptación de la hipótesis nula o en la región crítica. Antes de introducir los datos del siguiente problema pulsa el botón otroproblema.

Usa la aplicación para resolver los siguientes problemas:

  1. En las pasadas elecciones municipales, el 52 % de los votantes de una ciudad estaban a favor del alcalde. Una encuesta realizada recientemente indica que de 350 ciudadanos elegidos al azar, 198 están a favor del alcalde. ¿Se puede afirmar con un nivel de confianza del 90 % que el alcalde gana popularidad?

  2. Un dentista afirma que el 40 % de los niños de 10 años muestran indicios de caries dental. Tomada una muestra de 100 niños se observó que 32 tenían estos indicios. Se quiere saber si este resultado permite rechazar la afirmación del dentista con un nivel de significación del 5 %.

  3. En los cursos anteriores el porcentaje de alumnos universitarios que se traían comida de casa estaba en torno al 20 %. Tras la imposición este año de un cambio en los horarios, se sospechó que dicho porcentaje había aumentado significativamente, lo que obligaría a la instalación de más microondas y mesas en el comedor universitario. Para estudiar esto, se tomó una muestra de 1000 estudiantes elegidos al azar y se obtuvo que 310 de ellos traían comida de casa. Plantea un test para contrastar que el cambio en los horarios no ha cambiado el porcentaje de estudiantes que traen su comida de casa, frente a la alternativa de que sí ha hecho que dicho porcentaje sea mayor del 20 %, tal como parecen indicar los datos. ¿A qué conclusión se llega en el contraste anterior para un nivel de significación del 5 %?

  4. Según la ley electoral de cierto país, para obtener representación parlamentaria un partido político ha de conseguir en las elecciones un 5 % de los votos. Una encuesta realizada a 1000 ciudadanos con derecho a voto, elegidos al azar, cuando están próximas a celebrarse tales elecciones, revela que 36 de ellos votarán al partido A. ¿Puede estimarse, con un nivel de confianza del 95 %, que A tendrá representación parlamentaria? ¿Y con un nivel de significación del 1 %?

  5. Un laboratorio farmacéutico afirma que un calmante quita la jaqueca en 14 minutos en los casos corrientes. Con el fin de comprobar esta afirmación se eligen al azar 30 pacientes con jaqueca y en el experimento se toma como variable el tiempo que transcurre entre la administración del calmante y el momento en que desaparece la jaqueca, en minutos. Los resultados obtenidos en la muestra fueron 17 minutos de media y 7 minutos de desviación típica.

      1. ¿Podemos admitir como cierta la afirmación del laboratorio a un nivel de confianza del 95 %?

      2. Explica, en el contexto del problema, en qué consisten cada uno de los errores tipo I y tipo II.

  6. El 42 % de los escolares de cierto país suelen perder al menos un día de clase a causa de gripes y catarros. Sin embargo, un estudio sobre 1000 escolares revela que en el último curso hubo 450 en tales circunstancias. Las autoridades sanitarias defienden que el 42 % para toda la población escolar se ha mantenido.

      1. Contrasta, con un nivel de significación del 5 %, la hipótesis de las autoridades sanitarias, frente a que el porcentaje ha aumentado, como parecen indicar los datos, explicando claramente a qué conclusión se llega.

      2. ¿Cómo se llama la probabilidad de concluir erróneamente que el porcentaje se ha mantenido?

  7. Un canal de televisión considera que un programa es rentable cuando más del 16 % de los televisores encendidos están sintonizando dicho canal durante su emisión. Coincidiendo con el episodio piloto de una nueva serie, se seleccionan aleatoriamente 4000 de los televisores encendidos y se obtiene que 720 de ellos están sintonizando el canal. Plantea un test para contrastar que el episodio piloto no ha sido rentable, frente a la alternativa de que sí lo ha sido, tal como parecen indicar los datos. ¿A qué conclusión se llega con el contraste anterior para un nivel de significación del 5 %?

  8. Según cierto estudio realizado el año pasado, un 35 % de las familias con conexión a lnternet utilizaban habitualmente este medio para realizar sus operaciones bancarias. El estudio pronosticaba también que ese porcentaje aumentaría en los próximos meses. De una encuesta realizada recientemente a 125 usuarios de lnternet, 50 deciararon utilizarla habitualmente para realizar las citadas operaciones. Plantea un test para contrastar que la proporción del año pasado se ha mantenido, frente a que, como parece, se ha cumplido el pronóstico del estudio. ¿A qué conclusión se llega a un nivel de significación del 1 %?

  9. Inicialmente la sección de electrónica de un determinado supermercado era visitada por un 20 % de los clientes. Tras una reordenación del espacio, se seleccionaron aleatoriamente 1225 clientes, de los cuales 294 visitaron dicha sección. Plantea un test para contrastar que la reordenación no ha surtido el efecto esperado de aumentar el porcentaje de visitantes de la sección, frente a la alternativa de que sí lo ha hecho. ¿A qué conclusión se llega con el test anterior para un nivel significación del 1 %?