Intervalos de confianza
Varios temas en línea para
Matemáticas Finitas

      Página Principal
Índice de Temas en Línea
Ejercicios Para Este Tema
Todo Para Matemáticas Finitas
Todo Para Cálculo Aplicado
Todo Para Matemáticas Finitas & Cálculo Aplicado
Utilidad: Distribución Normal
Tabla: Distribución Normal
English

Intervalos de confianza para muestras grandes $(n >= 30)$

P Pregunto a $200$ estudiantes de Hofstra seleccionados al azar cuanto dinero gastaron para compras en internet durante la semana pasada. La media muestral para los $200$ estudiantes es de $\$42.35.$ Por lo tanto, puedes hacer la siguiente reclamación:
Los estudiantes de Hofstra gastaron un promedio de $\$42.35$ en compras por internet la semana pasada.
¿verdad?
R Incorrecto. Podría se el caso que los 200 estudiantes que seleccionaste son los más grándes compradores por internet de todos los estudiantes de Hoftra. En realidad, el promedio de todos los estudiantes de Hofstra (la media poblacional) podría ser muy diferente de la media muestral de $\$42.35.$ De hecho, nunca se sabe con absoluta certeza ni siquiera una aproximación de la media poblacional. Por ejemplo, ¿qué pasaría si un estudiante no encuestado ha gastado $\$10$ millones por internet la semana pasada? El efecto de la inclusión de aquel estudiante podría elevar la cifra media hasta más de $\$1,000.$

 

P Bien, entonces ¿Cuál es el punto de toma una media muestral, ya que no nos dice nada?
R Ve más despacio. Esto no nos dice nada en absoluto, sólo no da información con absoluta certeza (a menos que, por supuesto, la muestra consiste de toda la población). Sin embargo, cuanto mayor sea el tamaño muestral, lo más seguro que podemos estar de que la media poblacional se encuentra "bastante cercana" a la media muestral que obtuvimos. Esta idea de "confianza" en contra de "certeza" es lo que vamos hacer precisa aquí.

Para entender todo esto, debes saber algo sobre distribuciones muéstrales, donde aprendimos el siguiente.

Teorema del límite central Si la distrubución poblacional tiene una media $μ$ y desviación estándar $σ,$ entonces, para $n$ suficientemente grande, la distribución muestral de $\bar{x}$ es aproximadamente normal, con media

       $μ_{\bar{x}} = μ$

y desvición estándar

       $σ_{\bar{x}} =\frac{σ}{\sqrt{n}}.$

Ten en cuenta que, a medida que el tamaño muestral se hace más grande, la desvición estándar se hace más pequeño. De este modo, la media muestral tiende a estar muy cerca de la media poblacional, lo que resulta en una sola, reducción máxima $μ$ como se muestra en las curvas de distribución a continuación.

Nota Si la distribución (poblacional) $X$ ya era normal para empezar, entonces no importa el tamaño muestral, la distrubución muestral de $\bar{X}$ es exactamente normal. De este modo, el teorema del límite central es más útil para nosotros solamente cuando la distribución original de $X$ no es conocido por ser normal -- a menudo el caso en la práctica.

P ¿Qué tan grande debe ser el tamaño muestral n antes de que el teorema del límite central "entre en acción"?
R Al principio, no hay manera de saber esto, pero para fines más prácticos, utilizamos la siguiente regla general: Si $n > 30,$ entonces suponemos que n es suficientemente grande para que la distribución muestral sea aproximadamente normal.

 

P Bien ¿Qué tiene que ver esto con la pregunta original de cuanto gastaron los estudiantes por internet?
R Ya que el tamaño muestral fue $n = 200$ estudiantes, el teorema del límite central nos dice que la media muéstrales ($\$42.35$ fue solamente una de aquellas medias muéstrales) son distribuidas de una manera aproximadamente normal. Ahora, de nuestro conocimiento sobre distribuciones normales, podemos deducir:

$95.45%$ de las medias muéstrales se encuentran dentro de dos desviaciones estándares de la media poblacional (Ya que $P(μ - 2s  ≤  \bar{x}  ≤  μ+2s) = 0.9545)$
De este modo,
Si tomamos un gran número de medias muéstrales, entonces el $95.45%$ del tiempo, la distancia entre $\bar{x}$ y $μ$ será menos que dos desviaciones estándares (de la distrubición muestral) -- es decir, dentro de una distancia de $2σ/\sqrt{n}$ -- de $μ.$
O,
Si tomamos un gran número de medias muéstrales, entonces el $95.45%$ del tiempo, la media poblacional (desconocida) está entre
$\bar{x} - 2σ/\sqrt{n}$ y $\bar{x} + 2σ/\sqrt{n}.$

De este modo, llamamos al intervalo $[\bar{x} - 2σ/\sqrt{n},$  $\bar{x} + 2σ/\sqrt{n}]$ el intervalo de confianza del $95.45%$ para la media poblacional.

P Bien. ¿Cómo podemos obtener, digamos, el intervalo de confianza del $90%,$ o lo del $99%$?
R Todo lo que necesitamos saber es cuántas desviaciones estándares alrededor de la media incluirán $90%$ o $99%$ de las medias muéstrales. La siguiente imagen de la curva normal estándar muestra el valor-$z$ deseado para que se incluya un área total de $0.90$ (o $90%$) entre $z = -1.645$ y $z = 1.645:$

Llamamos a este valor $z$ $"z_{.05}"$ ya que el área de la cola a su derecha es $.05$ unidades, y podemos utilizar este valor en lugar de $2$ en la fórmula anterior:

Del mismo modo, para el intervalo de confianza del $99%,$ podemos consultar la siguiente imagen

y obtener:

Para una formula general, vamos a tomar $α = (100% -$ porcentaje de confianza):

Entonces el intervalo que queremos se da por la siguiente fórmula:

Muestras grandes $100(1-α)%$ Intervalo de confianza

$\bar{x} ± z_{α/2}\frac{σ}{\sqrt{n}}$

$\bar{x} =$ media muestral
$n =$ tamaño muestral
$σ =$ desviación estándar poblacional
$z_{α/2} =$ valor de $z$ con un área de $α/2$ a la derecha (obtenido a partir de una tabla).

Nota: Cuándo (como sea el caso frecuentemente) no sabemos la desviación estándar poblacional $σ,$ podemos aproximarla por la desviación estándar muestral $s,$ y obtenemos lo siguiente (buena) aproximación del intervalo de confianza:

$\bar{x} ± z_{α/2}\frac{s}{\sqrt{n}}$

Aquí está una pequeña tabla de valores de $z:$
$\color{blue}{z_{.1}}$$\color{blue}{z_{.05}}$$\color{blue}{z_{.025}}$$\color{blue}{z_{.01}}$$\color{blue}{z_{.005}}$$\color{blue}{z_{.001}}$$\color{blue}{z_{.0005}}$
$1.282$$1.645$$1.960$$2.326$$2.576$$3.090$$3.291$


Aquí esta un ejemplo donde puedes utilizar la fórmula anterior.

Ejemplo 1 Salsa picante

Tu compañia de salsa picante califica una escala de lo picoso de la salsa del $1$ al $20.$ Una muestra de $50$ botellas de salsa picante se degusta, y resulta una media de $12$ con una desviación estándar muestral de $2.5.$ Determina un intervalo de confianza del $95%$ para lo picoso de la salsa picante.

Solución

Rellena los siguientes valores y presiona "Verificar" (no presiona "Vistazo" a menos que sea absolutamente necesario...)

$\bar{x} =$  
$n =$  
$s =$  
$α =$  
$z_{α/2} =$  

Por lo tanto, el intervalo de confianza es de aproximadamente (redondeado a cuatro posiciones decimales):

$\bar{x} ± z_{α/2}\frac{s}{\sqrt{n}}$ $=$ [ ,     ]    
$\bar{x} - z_{α/2} s/\sqrt{n},$     $\bar{x} + z_{α/2} s/\sqrt{n}$
         


P ¿Cómo interpretamos este intervalo de confianza?
R Dice que, si pruebas repetidamente muestras aleatorias de $50$ botellas de salsa picante y calculas los intervalos de confianza cada vez, los intervalos de confianza que obtienes incluirá la media poblacional $95%$ del tiempo. En ese sentido, hay una probabilidad de $95%$ de que cualquier específico intervalo de confianza (como el anterior) actualmente contiene la media poblacional. Por lo tanto, podemos estar el $95%$ "seguros" que el picante medio de tu salsa se encuentra entre $11.307$ y $12.693.$

Lo siguiente es una simulación que genera un número de muestras aleatorias de tamaño $n = 30$ de una variable aleatoria distribuida uniformemente y tomando valores entre $0$ y $1$ (media $μ = 0.5$). Para cada muestra, la media y el intervalo de confianza del $90%$ se calculará automáticamente. La desviación estándar para una variable aleatoria distribuida uniformemente es dada por $σ = (b-a)/\sqrt{12} = (1-0) /\sqrt{12} ≈ 0.2887.$

Cada vez que un intervalo de confianza se calcula, se determinará si aquel intervalo contiene la media. Esto debe ocurre aproximadamente el $90%$ del tiempo.


Ejemplo 2 Ilustración de intervalos de confianza

Presiona "generar muestras" para abrir una ventana que da el número indicado de muestras de tamaño $n = 30$ junto con el intervalo de confianza del $90%,$ y si o no contiene la media poblacional $0.5.$ Si presionas "generar muestras", aproximadamente el $90%$ de los intervalo de confianza que aparecen debe contener la media poblacional de $0.5.$ De este modo, debe promediar $18$ "si's" para cada $20$ muestras.

Número de muestras:

Antes de seguir...Ten en cuenta que, ya que la distribución que usamos para las muestras no es normal (es uniforme), necesitamos muestras bastante grandes para garantizar que la distribución de las medias muéstrales es aproximadamente normal -- asumido en nuestra formulación de intervalos de confianza. Nota también que utilizamos la desviación estándar de población teórica en calcular cada intervalo en lugar de la desviación estándar muestral. Podríamos haber igualmente utilizado la desviación estándar muestral en su lugar.


Intervalos de confianza para muestras pequeñas $(n < 30)$

Cuando tratamos con muestras pequeñas, no podemos invocar el teorema del límite central. Por lo tanto, no podemos utilizar la fórmula para los intervalos de confianza a menos que sean muestras desde una variable aleatoria normalmente distribuida.

Sin embargo, hay una cuestión más: Si conocemos la desviación estándar poblacional $σ,$ entonces todo está bien, y podemos seguir adelante y utilizar la fórmula anterior para el intervalo de confianza para muestras pequeñas (suponiendo que estamos tomando muestras de una variable distribuida normalmente). Pero si, como suele ser el caso, no sabemos $σ,$ entonces si seguimos adelante y utilizamos en su lugar la desviación estándar muestral $s,$ es probable que obtengamos intervalos de confianza que son demasiado pequeños. La razón es que, mientras que la distribución muestral de $(\bar{x}-μ)/σ,$ es normal (siempre que $x$ es normal) la distribución muestral de $(\bar{x} - μ)/s$ no es normal (a menos que se trate de muestras grandes, en cuyo caso es aproximadamente normal).

P ¿Por qué hay que preocuparse de la distribución muestral de $(\bar{x}-μ)/s$?
R La razón que nos debemos preocupar es que, cuando utilizamos $s$ en lugar de $σ,$ entonces el cálculo del intervalo de confianza se basa en la probabilidad de que $\bar{x}$ está dentro de un cierto número de desviaciones estándar de la media $μ.$ Este número de desviaciones estándar es $(\bar{x}-μ)/σ.$ Entonces establecemos que equivale a valor$-z$ deseado y resolverlo para $\bar{x}$ para obtener el intervalo de confianza (después de dividir la desviación estándar por $\sqrt{n}$). Cuando utilizamos s en vez de $σ,$ no podemos utilizar un valor$-z,$ ya que la distribución de $(\bar{x}-μ)/s$ no es normal, pero se distribuye de acuerdo con la "distribución$-t$".

Resulta que, en lugar de utilizar $z_{α/2}$ en la fórmula, tenemos que utilizar $t_{α/2}.$ Además, obtenemos diferentes distribuciones $t$ para diferentes tamaños muéstrales, y utilizamos el valor de $t_{α/2}$ correspondiente a "$n-1$ grados de libertad", que podemos obtener de una tabla.

Muestra pequeña $100(1-α)%$ Intervalo de confianza

Cuando la desviación estándar poblacional α es conocida:

$\bar{x} ± z_{α/2}\frac{σ}{\sqrt{n}}$         Igual que la fórmula de muestras grandes

$\bar{x} =$ media muestral
$n =$ tamaño muestral
$σ =$ desviación estándar poblacional
$z_{α/2} =$ valor$-z$ con un área de $α/2$ a la derecha (obtenido a partir de una tabla).

Cuando se conoce solo la desviación estándar muestral $s:$
$\bar{x} ± t_{α/2}\frac{s}{\sqrt{n}}$         utilizamos t en lugar de z

$\bar{x} =$ media muestral
$n =$ tamaño muestral
$s =$desviación estándar muestral
$t_{α/2} =$ valor$-t$ con un área de $α/2$ a la derecha $(t_{α/2}$ puede ser obtenido a partir de una tabla.).

Vamos a probar esto en la variante siguiente de la "Salsa picante" ejemplo anterior.


Ejemplo 3 Más salsa picante

Cuando el gerente de su empresa se entero que el media picante de la salsa fue sólo $12,$ estaba furioso y pidió ajustes inmediatos a la receta, amenazando con despedir a toda la división de la salsa picante a menos que el medio picante aumentara sobre $13.$ El día de ayer, probóste muestras de 8 botellas al azar de la salsa nueva y encontró un medio picante de $13.5$ con una desviación estándar muestral de $0.75.$
(a) Calcula el intervalo de confianza del $95%$ para la media poblacional. Basado en la respuesta, ¿puedes estar el $95%$ seguro que el medio picante de la nueva salsa estará encima de $13$?
(b) Repita la parte (a) suponiendo que la desviación estándar muestral es de $0.58.$

Solución

(a) Rellena los siguiente valores y presiona "Verificar".

$\bar{x} =$  
$n =$  
$s =$  
$α =$  
$df =$         $df =$ grados de libertad $= n-1$
$t_{α/2} =$  

Por lo tanto, el intervalo de confianza es de aproximadamente (redondeado a cuatro posiciones decimales):

$\bar{x} ± z_{α/2}\frac{s}{\sqrt{n}}$ $=$ [ ,     ]    
$\bar{x} - t_{α/2} s/\sqrt{n},$     $\bar{x} + t_{α/2} s/\sqrt{n}$
         

Basado en la respuesta, nos damos cuenta que el intervalo de confianza $13.0.$ Por lo tanto, con un $95%$ de confianza la media mayor que $13.$

(b) El cálculo es casi idéntico al anterior, excepto para el valor $s = 0.58,$ que da el nuevo intervalo de confianza $[13.0150, 13.9850].$ Ya que este intervalo no contiene $13,$ podemos estar $95%$ seguro de que el medio picante de toda la salsa es mayor que $13.$

Página Principal
Índice de Temas en Línea
Ejercicios Para Este Tema
Todo Para Matemáticas Finitas
Todo Para Cálculo Aplicado
Todo Para Matemáticas Finitas & Cálculo Aplicado
Utilidad: Distribución Normal
Tabla: Distribución Normal

Última actualización: Julio, 2013
Derechos de autor © 2000 Stefan Waner y Steven R. Costenoble