K <- 1000
n <- 50
X <- list()
for(i in 1:K){
X[[i]] <- rpois(n,lambda=4)
}lab03: Intervalos de confianza
Este documento ilustra de manera intuitiva, por medio de simulaciones, el concepto de los intervalos de confianza.
Suponga que la población sigue una distribución Poisson con \(\lambda=4\), y tenemos disponible muestras aleatorias de \(n=50\) personas. Simulamos \(K=1000\) muestras y calculamos intervalos de confianza de \(0.95\) para \(\lambda\) asumiendo muestras grandes.
Primero, generamos \(K=1000\) muestras independientes.
1 IC asintótico con el teorema de Slutsky
Luego calculamos intervalo de confianza usando aproximación normal.
IC_pois <- function(X,alfa=0.05){
xbarra <- mean(X)
c(xbarra-qnorm(1-alfa/2)*sqrt(xbarra/n),
xbarra+qnorm(1-alfa/2)*sqrt(xbarra/n))
}
IC_resultados=sapply(X,IC_pois)A continuación vemos que se produce \(K=1000\) columnas de límite inferior y superior de cada intervalo de confianza. Se muestra los primeros \(5\) intervalos como ilustración.
dim(IC_resultados)[1] 2 1000
row.names(IC_resultados) <- c("lim.inf","lim.sup")
IC_resultados[,1:5] [,1] [,2] [,3] [,4] [,5]
lim.inf 3.296839 3.520122 3.557384 3.613303 3.427026
lim.sup 4.383161 4.639878 4.682616 4.746697 4.532974
Verificamos que 953 de \(1000\) contiene al parámetro verdadero \(\lambda=4\).
sum(IC_resultados[1,]<4 & IC_resultados[2,]>4)[1] 953
Es decir 95.3 \(\%\) contiene al parámetro \(\lambda\).
2 IC asintótico con la función estabilizadora de variancia
Por otro lado, se puede usar la función estabilizadora de variancia para encontrar el intervalo de confianza. A continuación utilizamos este método para ver cuántos de ellos contiene al parámetro \(\lambda=4\).
IC_pois2 <- function(X,alfa=0.05){
xbarra <- mean(X)
c((xbarra^(1/2)-qnorm(1-alfa/2)/(2*sqrt(n)))^2,
(xbarra^(1/2)+qnorm(1-alfa/2)/(2*sqrt(n)))^2)
}
IC_resultados2=sapply(X,IC_pois2)Verificamos que 955 de \(1000\) contiene al parámetro verdadero \(\lambda=4\).
sum(IC_resultados2[1,]<4 & IC_resultados2[2,]>4)[1] 955
Es decir, utilizando el intervalo de confianza estabilizando la variancia asintótica, 95.5 \(\%\) contiene al parámetro \(\lambda\). Ambos resultados son muy próximos debido a que con \(n=50\) es suficientemente grande.
3 Muestra de tamaño 7
K <- 10000
n <- 7
X <- list()
for(i in 1:K){
X[[i]] <- rpois(n,lambda=4)
}
IC_resultados1=sapply(X,IC_pois)
IC_resultados2=sapply(X,IC_pois2)
sum(IC_resultados1[1,]<4 & IC_resultados1[2,]>4)/K[1] 0.9433
sum(IC_resultados2[1,]<4 & IC_resultados2[2,]>4)/K[1] 0.9554