Estimación por intervalo-1

XS3310 Teoría Estadística
I Semestre 2024

Prof. Shu Wei Chou Chen

Escuela de Estadística, UCR.

¿Qué vamos a discutir hoy?

Hemos visto hasta ahora sobre estimadores puntuales.
Ahora: Intervalos de confianza clásicos.

Estimación por Intervalo

Una estimación por intervalo para un parámetro desconocido \(\theta\) viene dada por un rango o intervalo que posee cierta probabilidad \(1-\alpha\) de contener a dicho parámetro.
Usualmente este concepto de confianza se interpreta diciendo que si obtenemos 100 intervalos entonces \(\alpha \%\) de ellos no van a incluir el valor del parámetro. Es decir, si tenemos 100 intervalos del \(95\%\) de confianza entonces se espera que 5 de ellos no incluyan el valor del parámetro, o que de 20 intervalos haya uno que no lo incluya.

Visualmente:

https://seeing-theory.brown.edu/frequentist-inference/es.html

Estimación por Intervalo

Ilustración de 30 muestras independientes

Estimación por Intervalo

Existen dos tipos de estimaciones por intervalos:

Intervalos bilaterales
Intervalos unilaterales

En el primer caso se tienen dos valores \(a\) y \(b\) que constituyen los límites inferior y superior del intervalo. Es decir, el intervalo \(\left[a, b\right]\) contiene el valor de \(\theta\) con una confianza del \((1-\alpha)\cdot 100\%\).

En el segundo caso, se determina solamente un límite, dependiendo del interés del estudio, que puede ser:

Intervalo unilateral inferior: de la forma \(\left[ a, +\infty \right)\)
Intervalo unilateral superior: de la forma \(\left( -\infty, b \right]\).

Nota: Los valores \(\pm \infty\) pueden ser sustituidos por el mínimo o máximo valor del dominio del parámetro de interés.

Técnica para estimaciones por intervalo

Existen varias técnicas para obtener estimaciones por intervalo.
En este curso nos enfocaremos en la técnica del pivote.

Técnica del pivote

Esta técnica consiste en definir una variable aleatoria, \(U\), que llamaremos pivote.

Definición 3.1: Sea \(X_{1}, X_{2}, ... , X_{n}\) una muestra aleatoria de una población que depende de un parámetro \(\theta\). Sea \(U(X_1,...,X_n,\theta)\) una variable aleatoria. \(U\) es una variable pivote, si cumple las siguientes condiciones:

\(U\) debe estar definido en términos de los elementos de la muestra aleatoria y del parámetro desconocido, donde el parámetro desconocido \(\theta\) sea la única cantidad desconocida.
La distribución de probabilidad de U debe ser conocida y no depender de \(\theta\).

Técnica del pivote

Ejemplo: Sea \(X_{1}, X_{2}, ... , X_{n}\) una muestra aleatoria tal que \(X_{j} \sim N(\mu, \sigma^2)\), donde \(\mu\) es deconocido y \(\sigma^2\) es conocido. Obtenga una variable aleatoria que funcione como un pivote.

Solución: Debemos encontrar una variable aleatoria que esté definida en términos de la muestra y de \(\mu\).

Una forma de resumir toda la información de la muestra en una sola variable aleatoria. Lo ideal sería utilizar un estadístico suficiente: \(\sum_{j=1}^{n} X_{j}\) es suficiente para estimar \(\mu\), por lo que podriamos usar alguna función de este estadístico en el pivote.
\(\overline{X}\) resume la información de la muestra aleatoria, pues está en términos de un estadístico suficiente y además sabemos que se distribuye \(N\left(\mu, \dfrac{\sigma^2}{n}\right)\). Ahora debemos encontrar alguna transformación de \(\overline{X}\) que incluya a \(\mu\) y cuya distribución no dependa de \(\mu\).

\(U = \dfrac{\overline{X} - \mu}{\dfrac{\sigma}{\sqrt{n}}}\), se distribuye \(N(0,1)\). \(U\) cumple con las propiedades de un pivote pues está definida en términos de la muestra y del parámetro desconocido \(\mu\) al igual que su distribución ya no depende de \(\mu\).

NOTA: \(U\) no es la única opción de pivote. Por ejemplo, \(U_1=\overline{X} - \mu\) es otra variable aleatoria que también cumple las condiciones para ser un pivote. Existe una infinidad de variables aleatorias que cumplen esta condición, pero como veremos más adelante algunas son más útiles que otras.

Ejercicio: Proponga otra variable pivote (diferente a \(U\) y a \(U_1\)).

Técnica del pivote

Una vez encontrada la variable pivote, el siguiente paso es encontrar un intervalo de confianza por medio de la técnica del pivote. Hay dos caminos:

Caso bilaterial: se requiere encontrar valores \(a\) y \(b\) tales que \(P(a \leq U \leq b) = 1-\alpha\) y por lo tanto también se cumple que \(P(U < a) + P(U > b) = \alpha\). Sin embargo, estas condiciones generan un número infinito de posibilidades para \(a\) y \(b\) por lo que se tiene que limitar de alguna manera. Para ello, se acostumbra utilizar la condición de cada una de las probabilidades de las “colas” sean iguales, es decir \(P(U < a) = P(U > b) = \dfrac{\alpha}{2}\).
Caso unilaterial: podemos tener un límite inferior o superior. Dependiendo del que nos interese y de la forma del pivote debemos encontrar un valor \(a\) o \(b\) que cumpla \(P(U \geq a) = 1-\alpha\) o \(P(U \leq b) = 1 -\alpha\). Finalmente, como \(U\) está en términos de la muestra aleatoria y del parámetro \(\theta\) entonces despejamos \(\theta\) dentro de la probabilidad y con esto obtenemos los límites inferiores y superiores.

Técnica del pivote

Nota:

Para el caso bilateral: \(\left[ P(a \leq U \leq b) = 1-\alpha\right]\), \(a\) y \(b\) representan el percentil \(\alpha/2\) y \(1-\alpha/2\), respectivamente, de la distribución de \(U\).
Para el caso unilateral: \(\left[ P(U \geq a) = 1-\alpha\right]\) o \(\left[ P(U \leq b) = 1 -\alpha\right]\), \(a\) y \(b\) representan el percentil \(\alpha\) y \(1-\alpha\), respectivamente, de la distribución de \(U\).

Ejemplo: Sea \(Y\) una variable aleatoria con distribución Exponencial con media \(\beta\) desconocida. Utilice este valor para construir un intervalo bilateral para \(\beta\) con una confianza del \(90\%\).

Solución: En este caso podemos utilizar como pivote \(U = \dfrac{Y}{\beta}\) ya que está en términos de la variable aleatoria y de \(\beta\) al igual que se puede demostrar que su distribución no depende de \(\beta\). En este caso \(U \sim Exp(1)\).

Nuestro siguiente paso es buscar los valores \(a\) y \(b\) tales que:

\(P(a \leq U \leq b) = 0.9 \quad y \quad P(U < a) = P(U > b) = 0.05\)

Recordemos que en el caso de una variable aleatoria continua \(P(U < a) = P(U \leq a) = F_{U}(a)\). Podemos usar nuestro conocimiento de la función de distribución de la exponencial para encontrar el valor de \(a\):

\(P(U < a) = F_{U}(a) = 1 - e^{-a} = 0.05, \quad \Rightarrow a = -\ln(0.95)\)

Podemos hacer lo mismo para encontrar el valor de \(b\):

\(P(U > b) = 1 - P(U \leq b) = 1 - F_{U}(b) = e^{-b} = 0.05, \quad \Rightarrow b = -\ln(0.05)\).

Nuestro último paso ahora es despejar el valor de \(\beta\) de la probabilidad que acumula \(0.90\): \[\begin{align*} P(a \leq U \leq b) &= P\left( -\ln(0.95) \leq \dfrac{Y}{\beta} \leq -\ln(0.05) \right) \\ &= P\left( \dfrac{-1}{\ln(0.95)} \geq \dfrac{\beta}{Y} \geq \dfrac{-1}{\ln(0.05)} \right) = P\left( \dfrac{-Y}{\ln(0.95)} \geq \beta \geq \dfrac{-Y}{\ln(0.05)} \right)\\ & = 0.90 \end{align*}\]

Por lo tanto tenemos que \(a = \dfrac{-Y}{\ln(0.05)}\) y \(b = \dfrac{-Y}{\ln(0.95)}\) por lo que podemos concluir que con una confianza del \(90\%\) el intervalo \(\left[ \dfrac{-Y}{\ln(0.05)}, \dfrac{-Y}{\ln(0.95)} \right]\) incluye el valor de \(\beta\).

set.seed(100)
beta = 5 
(y = rexp(1 , rate = 1/beta))

[1] 4.621058

Si observamos \(Y=\) 4.6211 de una distribución exponencial con \(\beta=5\), se obtiene el intervalo como sigue.

limite_inf = -y/log(0.05)
limite_sup = -y/log(0.95)
c(limite_inf,limite_sup)

[1]  1.542547 90.090882

Ejemplo: Sea \(X\) una variable aleatoria uniformemente distribuida en el intervalo \((0, \theta)\), con \(\theta\) desconocido. Determine un intervalo de confianza unilateral inferior para \(\theta\) del \(95\%\).

Solución: Primero debemos encontrar una cantidad pivote satisfactoria. En este caso podemos utilizar \(U = \dfrac{X}{\theta}\) como pivote ya que cumple ambas condiciones. Se puede demostrar que \(U \sim Unif(0,1)\) por medio de la segunda técnica de transformaciones:

Sea \(U = h(X) = \dfrac{X}{\theta}\), por lo tanto \(h^{-1}(U) = U\theta \quad \Rightarrow \dfrac{dh^{-1}(u)}{du} = \theta\)

Aplicando la técnica tenemos:

\(f_{U}(u) = f_{X}(u\theta) \cdot \theta = \dfrac{1}{\theta} \cdot \theta = 1\)

Al ser el dominio original \(0 < x < \theta\) al sustituir \(x\) por \(u\theta\) obtenemos el nuevo dominio: \(0 < u < 1\). Por lo tanto concluimos que \(U \sim Unif(0,1)\).

Ahora podemos usar esto para encontrar el valor de \(b\) tal que \(P(U \leq b) = 0.95\):

\(P(U \leq b) = F_{U}(b) = 0.95, \quad \Rightarrow b = 0.95\)

Con este valor podemos proceder a despejar el valor de \(\theta\) de esta probabilidad y obtener así el límite inferior de nuestro intervalo:

\(P(U \leq b) = P\left( \dfrac{X}{\theta} \leq 0.95 \right) = P\left( \theta \geq \dfrac{X}{0.95} \right) = 0.95\)

Por lo tanto podemos concluir que con un \(95\%\) de confianza el intervalo \(\left[ \dfrac{X}{0.95}, +\infty \right)\) incluye el valor de \(\theta\).

set.seed(100)
theta = 50 
(x = runif(1 , min=0, max = 50))

[1] 15.38831

Si observamos \(X=\) 15.3883 de una distribución uniforme con \((0,\theta=50)\), se obtiene el intervalo como sigue.

limite_inf = x/0.95
c(limite_inf,Inf)

[1] 16.19822      Inf

Ejemplo: Sea \(X_{1}, X_{2}, ... , X_{20}\) una muestra aleatoria tal que \(X_{j} \sim Exp(\beta)\). Determine un intervalo de confianza bilateral para \(\beta\) con una confianza del \((1-\alpha)\%\). Utilice como pivote una función de \(\sum_{j=1}^{20} X_{j}\).

Solución: Sabemos de antemano que \(T = \sum_{j=1}^{20} X_{j} \sim Gamma(\alpha = 20,\beta)\).

\(T\) no sirve como pivote pues su definición no depende de \(\beta\) y su función de distribución todavía depende de \(\beta\). Debemos encontrar alguna transformación de \(T\) que haga que se cumplan las dos condiciones.

Primera opción:

Recordemos que la función generadora de momentos de una Gamma \((\alpha,\beta)\) es \((1-\beta t)^{-\alpha}\). Por lo tanto, si \(U = \dfrac{T}{\beta}\) entonces,

\[m_{U}(t) = m_{T}\left(\dfrac{t}{\beta}\right) = \left(1-t\right)^{-20}\]

Esto quiere decir que \(U \sim Gamma(20,1)\) y por lo tanto se puede emplear como un pivote pues cumple las dos condiciones.

Ahora procedemos a encontrar los valores \(a\) y \(b\) tales que \(P(U < a) = P(U > b) = \dfrac{\alpha}{2}\). Como la Gamma no tiene una función de distribución en forma cerrada debemos proceder a integrar la función de densidad:

\[P(U < a) = \int_{0}^{a} \dfrac{u^{19}e^{-u}}{\Gamma(20)} du = \dfrac{\alpha}{2}\]

Esta integral es posible de calular a mano, pero su desarrollo necesita de 19 veces de “por partes” que hacen su cálculo extremadamente largo y tedioso.

Otra posibilidad es aprovechar algún software, si se sabe el valor de \(\alpha\). Por ejemplo, si \(\alpha=0.02\),

alpha = 0.02
qgamma(c(alpha/2,1-alpha/2),shape=20,scale = 1)

[1] 11.08213 31.84537

Luego, proceder con \[P( a < U < b) = \alpha\] \[\Rightarrow P\left( a < \frac{T}{\beta} < b \right) = \alpha\] Pero esta opción es tediosa y se necesita generar los percentiles para cada \(\alpha\) y todos los tamaños de muestra,\(n\).

La forma tradicional y elegante es hacer uso de tablas estadísticas que nos dan cuartiles para ciertas probabilidades. En este caso no tenemos una tabla para una Gamma con estos parámetros, pero sí tenemos para otra Gamma: la \(\chi^2\).

Segunda opción:

Afortunadamente existe una forma para pasar de cualquier Gamma a una \(\chi^2\):

Sea \(V = \dfrac{2T}{\beta}\) entonces,

\[m_{V}(t) = m_{T}\left(\dfrac{2t}{\beta}\right) = \left[1-\beta \left(\frac{2t}{\beta}\right)\right]^{-20} = \left(1-2t\right)^{-\frac{40}{2}}\]

Esta es la función generadora de momentos de una \(\chi^2\) con 40 grados de libertad, de la cuál sí tenemos tablas para encontrar cuantiles. Ahora si podemos proceder a encontrar los valores de \(a\) y \(b\), sabiendo que gráficamente lucen de la siguiente manera:

Cuantiles de una \(\chi^2\)-cuadrado con 40gl.

Denotando \(\chi^{2}_{p, 40}\) como el cuantil \(p\) de una distribución \(\chi^{2}\) con \(40\) grados de libertad, es decir, \[P\left(\chi^{2}_{40}< \chi^{2}_{p, 40} \right)=p\], tenemos los valores \(a\) y \(b\).

Podemos proceder a despejar \(\beta\) de la probabilidad que acumula \(1-\alpha\): \[P(a \leq V \leq b) = P\left( \chi^{2}_{\frac{\alpha}{2}, 40} \leq \frac{2T}{\beta} \leq \chi^{2}_{1-\frac{\alpha}{2}, 40} \right) = P\left( \frac{2T}{\chi^{2}_{1-\frac{\alpha}{2}, 40}} \leq \beta \leq \frac{2T}{\chi^{2}_{\frac{\alpha}{2}, 40}} \right) = 1 -\alpha\]

Por lo tanto, con una confianza de \((1-\alpha)\%\) el intervalo \(\left[ \frac{2\sum_{j=1}^{20} X_{j}}{\chi^{2}_{1-\frac{\alpha}{2}, 40}}, \frac{2\sum_{j=1}^{20} X_{j}}{\chi^{2}_{\frac{\alpha}{2}, 40}} \right]\) incluye el valor de \(\beta\).

Nota:

En la práctica, si usamos algún software, se debe tomar en cuenta cuál cola se usa. En R, si \(\alpha=0.05\)

alpha = 0.05
qchisq(c(alpha/2,1-alpha/2),df=40,lower.tail=TRUE)

[1] 24.43304 59.34171

Es decir,

\[a=\chi^{2}_{\frac{\alpha}{2}, 40}=\chi^{2}_{\frac{0.05}{2}, 40}=24.43\]

\[b=\chi^{2}_{\frac{1-\alpha}{2}, 40}=\chi^{2}_{1-\frac{0.05}{2}, 40} =59.34\]

Algunos libros, tablas estadísticas o softwares utilizan la notación de las probabilidades acumuladas de la cola derecha. Por ejemplo, utiliza \(\chi^{2}_{p, \nu}\) como el cuantil \(1-p\) de una distribución \(\chi^{2}\) con \(\nu\) grados de libertad, es decir, \[P\left(\chi^{2}_{\nu}> \chi^{2}_{p, \nu} \right)=p.\]

¿Qué discutimos hoy?

Estimación por intervalos, método del pivote