lab03: Intervalos de confianza

Curso: Teoría Estadística

Autor/a
Afiliación

Shu Wei Chou Chen

Escuela de Estadística (UCR)

Este documento ilustra de manera intuitiva, por medio de simulaciones, el concepto de los intervalos de confianza.

Suponga que la población sigue una distribución Poisson con \(\lambda=4\), y tenemos disponible muestras aleatorias de \(n=50\) personas. Simulamos \(K=1000\) muestras y calculamos intervalos de confianza de \(0.95\) para \(\lambda\) asumiendo muestras grandes.

Primero, generamos \(K=1000\) muestras independientes.

K <- 1000
n <- 50
X <- list()
for(i in 1:K){
  X[[i]] <- rpois(n,lambda=4)
}

1 IC asintótico con el teorema de Slutsky

Luego calculamos intervalo de confianza usando aproximación normal.

IC_pois <- function(X,alfa=0.05){
  xbarra <- mean(X)
  c(xbarra-qnorm(1-alfa/2)*sqrt(xbarra/n),
    xbarra+qnorm(1-alfa/2)*sqrt(xbarra/n))
}

IC_resultados=sapply(X,IC_pois)

A continuación vemos que se produce \(K=1000\) columnas de límite inferior y superior de cada intervalo de confianza. Se muestra los primeros \(5\) intervalos como ilustración.

dim(IC_resultados)
[1]    2 1000
row.names(IC_resultados) <- c("lim.inf","lim.sup")
IC_resultados[,1:5]
            [,1]     [,2]     [,3]     [,4]     [,5]
lim.inf 3.296839 3.520122 3.557384 3.613303 3.427026
lim.sup 4.383161 4.639878 4.682616 4.746697 4.532974

Verificamos que 953 de \(1000\) contiene al parámetro verdadero \(\lambda=4\).

sum(IC_resultados[1,]<4 & IC_resultados[2,]>4)
[1] 953

Es decir 95.3 \(\%\) contiene al parámetro \(\lambda\).

2 IC asintótico con la función estabilizadora de variancia

Por otro lado, se puede usar la función estabilizadora de variancia para encontrar el intervalo de confianza. A continuación utilizamos este método para ver cuántos de ellos contiene al parámetro \(\lambda=4\).

IC_pois2 <- function(X,alfa=0.05){
  xbarra <- mean(X)
  c((xbarra^(1/2)-qnorm(1-alfa/2)/(2*sqrt(n)))^2,
    (xbarra^(1/2)+qnorm(1-alfa/2)/(2*sqrt(n)))^2)
}

IC_resultados2=sapply(X,IC_pois2)

Verificamos que 955 de \(1000\) contiene al parámetro verdadero \(\lambda=4\).

sum(IC_resultados2[1,]<4 & IC_resultados2[2,]>4)
[1] 955

Es decir, utilizando el intervalo de confianza estabilizando la variancia asintótica, 95.5 \(\%\) contiene al parámetro \(\lambda\). Ambos resultados son muy próximos debido a que con \(n=50\) es suficientemente grande.

3 Muestra de tamaño 7

K <- 10000
n <- 7
X <- list()
for(i in 1:K){
  X[[i]] <- rpois(n,lambda=4)
}

IC_resultados1=sapply(X,IC_pois)
IC_resultados2=sapply(X,IC_pois2)
sum(IC_resultados1[1,]<4 & IC_resultados1[2,]>4)/K
[1] 0.9433
sum(IC_resultados2[1,]<4 & IC_resultados2[2,]>4)/K
[1] 0.9554