lab03: Intervalos de confianza

XS3310 Teoría Estadística

Autor/a
Afiliación

Shu Wei Chou Chen

Escuela de Estadística (UCR)

Este documento ilustra de manera intuitiva, por medio de simulaciones, el concepto de los intervalos de confianza.

Suponga que la población sigue una distribución Poisson con \(\lambda=4\), y tenemos disponible muestras aleatorias de \(n=50\) personas. Simulamos \(K=1000\) muestras y calculamos intervalos de confianza de \(0.95\) para \(\lambda\) asumiendo muestras grandes.

Primero, generamos \(K=1000\) muestras independientes.

K <- 1000
n <- 50
X <- list()
for(i in 1:K){
  X[[i]] <- rpois(n,lambda=4)
}

1 IC asintótico con el teorema de Slutsky

Luego calculamos intervalo de confianza usando aproximación normal.

IC_pois <- function(X,alfa=0.05){
  xbarra <- mean(X)
  c(xbarra-qnorm(1-alfa/2)*sqrt(xbarra/n),
    xbarra+qnorm(1-alfa/2)*sqrt(xbarra/n))
}

IC_resultados=sapply(X,IC_pois)

A continuación vemos que se produce \(K=1000\) columnas de límite inferior y superior de cada intervalo de confianza. Se muestra los primeros \(5\) intervalos como ilustración.

dim(IC_resultados)
[1]    2 1000
row.names(IC_resultados) <- c("lim.inf","lim.sup")
IC_resultados[,1:5]
            [,1]     [,2]     [,3]     [,4]     [,5]
lim.inf 3.259675 3.315426 3.855944 3.296839 3.185393
lim.sup 4.340325 4.404574 5.024056 4.383161 4.254607

Verificamos que 933 de \(1000\) contiene al parámetro verdadero \(\lambda=4\).

sum(IC_resultados[1,]<4 & IC_resultados[2,]>4)
[1] 933

Es decir 93.3 \(\%\) contiene al parámetro \(\lambda\).

2 IC asintótico con la función estabilizadora de variancia

Por otro lado, se puede usar la función estabilizadora de variancia para encontrar el intervalo de confianza. A continuación utilizamos este método para ver cuántos de ellos contiene al parámetro \(\lambda=4\).

IC_pois2 <- function(X,alfa=0.05){
  xbarra <- mean(X)
  c((xbarra^(1/2)-qnorm(1-alfa/2)/(2*sqrt(n)))^2,
    (xbarra^(1/2)+qnorm(1-alfa/2)/(2*sqrt(n)))^2)
}

IC_resultados2=sapply(X,IC_pois2)

Verificamos que 932 de \(1000\) contiene al parámetro verdadero \(\lambda=4\).

sum(IC_resultados2[1,]<4 & IC_resultados2[2,]>4)
[1] 932

Es decir, utilizando el intervalo de confianza estabilizando la variancia asintótica, 93.2 \(\%\) contiene al parámetro \(\lambda\). Ambos resultados son muy próximos debido a que con \(n=50\) es suficientemente grande.

3 Muestra de tamaño 7

K <- 10000
n <- 7
X <- list()
for(i in 1:K){
  X[[i]] <- rpois(n,lambda=4)
}

IC_resultados1=sapply(X,IC_pois)
IC_resultados2=sapply(X,IC_pois2)
sum(IC_resultados1[1,]<4 & IC_resultados1[2,]>4)/K
[1] 0.9368
sum(IC_resultados2[1,]<4 & IC_resultados2[2,]>4)/K
[1] 0.9499