Tema 5: Modelos de series temporales

class: center, middle, inverse, title-slide

.title[
# Tema 5: Modelos de series temporales
]
.subtitle[
## Curso: Series Cronológicas
]
.author[
### Prof. Shu Wei Chou Chen
]
.institute[
### Posgrado en Estadística - Posgrado en Matemática (UCR)
]

---

# Contenido

1. Introducción
2. Proceso estacionario
3. Medidas de dependencia
4. Estimación
4. Observaciones sobre las series estacionarias.
5. Transformación y diferenciación de series.

---
# Introducción

- El principal objetivo del análisis de series temporales es construir modelos estadísticos o matemáticos que proporcionan una descripción de los datos muestreados.

- Además, sirve para realizar inferencia del comportamiento en el intervalo observado o a futuro.

---
# Introducción

- Considere una serie temporal como una secuencia de variables aleatorias 
`$$X_1,X_2,..,X_t,...$$`
- **Proceso estocástico:** una colección de variables aleatorias indexada por un conjunto `$\mathcal{T}$`, 
`$$\left\lbrace X_t, t \in \mathcal{T} \right\rbrace$$`

- Vamos a enfocar el caso cuando `$\mathcal{T}$` es un conjunto discreto, i.e. `$t=0,1,2,...$`.

<div class="figure" style="text-align: center">
<img src="timeseriesmodel.png" alt="Figura tomada en Morettin (2017)" width="50%" />
<p class="caption">Figura tomada en Morettin (2017)</p>
</div>

---
# Modelos de series temporales

- Un modelo de series temporales generalmente especifica la distribución conjunta de la secuencia `$X_t$`.
$$
	P\left(X_1\leq x_1, X_2\leq x_2,...,X_t \leq x_t \right)
$$
- Una observación de un proceso estocástico es una serie de valores observados en el tiempo y es llamada **una realización** de un proceso estocástico.

<div class="figure" style="text-align: center">
<img src="realizaciones.png" alt="Figura tomada en Morettin (2017)" width="50%" />
<p class="caption">Figura tomada en Morettin (2017)</p>
</div>

---
# Ruido blanco

.pull-left[
- Una colección de variables aleatorias no correlacionadas, `$w_t$`, con media 0 y variancia `$\sigma_w^2$`.

- Denotado por `$w_t \sim wn(0,\sigma_w^2)$`.

- Simulación de una colección de `$w_t \sim N(0,1)$` con `$T=500$`.

]
.pull-right[
<img src="presentacion_files/figure-html/unnamed-chunk-4-1.png" width="90%" />
]

---
# Medias móviles

.pull-left[
- Considere `$w_t \sim wn(0,\sigma_w^2)$`.

- Sea `$v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})$`

- Esta serie se ve más suave y presenta menos picos que el caso anterior.

]
.pull-right[
<img src="presentacion_files/figure-html/unnamed-chunk-5-1.png" width="90%" />
]

---
# Medias móviles

- ¿Qué pasaría si aumento el orden `$k$`?.

- Sea `$v_t=\frac{1}{m} \sum\limits_{j=-k}^k w_{t+j},$`

.pull-left[

- `$k=5$`
<img src="presentacion_files/figure-html/unnamed-chunk-6-1.png" width="90%" />

]
.pull-right[
- `$k=9$`
<img src="presentacion_files/figure-html/unnamed-chunk-7-1.png" width="90%" />
]

---
# Autoregresión

.pull-left[

- Sea `$w_t \sim wn(0,\sigma_w^2)$`.

- Considere un modelo AR(1): `$$X_t=\phi X_{t-1}+w_t$$`

- Veamos dos casos de `$\phi=0.9$` y `$-0.9$`.

]
.pull-right[
<img src="presentacion_files/figure-html/unnamed-chunk-8-1.png" width="100%" />
]

---
# Señal + ruido blanco

.pull-left[

- Muchos modelos series temporales asumen que existe una señal con alguna variación periódica, contaminada por un ruido aleatorio.

- Considere `$x_t=2 \cos \left( 2 \pi \frac{t+15}{50} \right)+ w_t$` para `$t=1,...,500$`.

- El modelo general `$A cos(2\pi \omega t + \phi)$` con amplitud `$A$`, frecuencia `$\omega$`, y fase `$\phi$`.

- El ejemplo anterior considera `$A=2$`, `$\omega=1/50$` (un ciclo cada 50 puntos en el tiempo) y `$\phi=2 \pi 15/50=0.6 \pi$`.

]
.pull-right[
<img src="presentacion_files/figure-html/unnamed-chunk-9-1.png" width="100%" style="display: block; margin: auto;" />
]

---
# Medidas de dependencia

- Una descripción completa de un modelo de series temporales es proporcionado por la distribución de probabilidad conjunta, i.e. dados tiempos arbitrarios `$t_1,...,t_n$` para `$n$` entero positivo y `$c_1,...,c_n$` n valores constantes:

$$
	F_{t_1,...,t_n}(c_1,...,c_n)=P\left(X_1\leq c_1, X_2\leq c_2,...,X_t \leq c_t \right).
$$
- Aunque esa distribución describe los datos globalmente, en la práctica, esa distribución multidimencional es dificil de conocer, excepto cuando es normal multivariado (¿por qué?)

- La distribución marginal en el tiempo `$t$`,
$$
F_t(x)=P(X \leq x).
$$
- La función densidad marginal en el tiempo `$t$`,
$$
f_t(x)= \frac{\partial F_t(x)}{\partial x}.
$$

---
# Medidas de dependencia

- **La función de media** para el tiempo `$t$` es definida por

`$$\mu_t= E(X_t)=\int_{-\infty}^\infty x f_t(x)dx$$`
- Considere el ejemplo de medias móviles: `$v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})$`

`$$E(v_t)=\frac{1}{3}\left[E(w_{t-1})+E(w_{t})+E(w_{t+1})\right]=0$$`
- Considere el ejemplo de la señal+ruido: `$x_t=2 \cos \left( 2 \pi \frac{t+15}{50} \right)+ w_t$`

`$$E(x_t)=2 \cos \left( 2 \pi \frac{t+15}{50} \right)+ E(w_t)=2 \cos \left( 2 \pi \frac{t+15}{50} \right)$$`

---
# Medidas de dependencia

- **La función de autocovariancia** es definida por

`$$\gamma_X(t,s)=\gamma(t,s)= Cov(X_t,X_s)=E\left[ (X_t-\mu_t)(X_s-\mu_s) \right]$$`

- Mide la dependencia lineal entre dos puntos de tiempo de la misma serie.

- **La función de variancia** en el tiempo `$t$` es definida por
`$$\gamma_X(t,t)=Var(X_t)$$`

- Considere el ejemplo del ruido blanco `$w_t$`:

$$
\gamma_w(t,s)=Cov(w_t,w_s)=\left\lbrace 
`\begin{aligned}
\sigma_w^2, & & t = s, \\
0, & &  t \neq s.
\end{aligned}`
\right. 
$$

---
# Medidas de dependencia

>**Propiedad: (Covariancia de combinaciones lineales)** Si U y V son combinaciones de variables aleatorias `$X_1,...,X_m$` y `$Y_1,...,Y_r$` con variancias finitas, respectivamente:
`$$U=\sum_{i=1}^{m} a_i X_i,~\text{y}~~~~~~V=\sum_{j=1}^{r} b_i Y_i.$$`
Entonces,
`$$Cov(U,V)=\sum_{i=1}^{m} \sum_{j=1}^{r} a_i b_j Cov(X_i,Y_j)$$`

---
# Ejemplo

- Considere el ejemplo de medias móviles: `$v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})$`
 
- La función de autocovariancia es definida por

`$\gamma_v(t,s)=\gamma_v(t,t+h)=Cov(v_{t},v_{t+h})$`

- Caso 1 `$(h=0)$`:

`$\gamma_v(t,t+0)=Cov(v_{t},v_{t+0})=Var(v_t)$`
  `$=\frac{1}{9}Var(w_{t-1}+w_{t}+w_{t+1})=\frac{3}{9} Var(w_t)=\frac{1}{3} \sigma_w^2.$`

- Caso 2 `$(h=1)$`:

`$\gamma_v(t,t+1)=Cov(v_{t},v_{t+1})$`
  `$=Cov\left[\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1}),\frac{1}{3}(w_{t}+w_{t+1}+w_{t+2})\right]$`
`$=\frac{1}{9}\left[ Cov(w_{t},w_{t})+Cov(w_{t+1},w_{t+1}) \right]$`
`$=\frac{2}{9}\sigma_w^2$`

- Caso 3 `$(h=-1)$`: Similarmente se obtiene `$\gamma_v(t,t-1)=\frac{2}{9}\sigma_w^2$`
  
---
# Ejemplo

- Caso 4 `$(h=2~o~h=-2)$`:

`$\gamma_v(t,t+2)=\gamma_v(t,t-2)=\frac{1}{9}\sigma_w^2$`
  
- Caso 5 `$(h>2~o~h<-2)$`:

`$\gamma_v(t,t+h)=0.$`

Entonces,
$$
\gamma_w(t,t+h)=\left\lbrace 
`\begin{aligned}
\frac{3}{9}\sigma_w^2, & & h = 0 \\
\frac{2}{9}\sigma_w^2, & &  |h| = 1 \\
\frac{1}{9}\sigma_w^2, & &  |h| = 2 \\
0, & &  |h| > 2,
\end{aligned}`
\right. 
$$

---
# Medidas de dependencia

- **La función de autocorrelación** es definida por

`$$\rho_X(t,s)=\frac{\gamma(t,s)}{\sqrt{\gamma(t,t)\gamma(s,s)}}$$`
- Considere el ejemplo del ruido blanco `$w_t$`:

$$
\rho_w(t,s)=\left\lbrace 
`\begin{aligned}
1, & & t = s, \\
0, & &  t \neq s.
\end{aligned}`
\right. 
$$

---
# Ejemplo

- Considere el ejemplo de medias móviles: `$v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})$`

- La función de autocorrelación:
$$
\rho_w(t,t+h)=\left\lbrace 
`\begin{aligned}
1, & & h = 0 \\
\frac{2}{3}, & &  |h| = 1 \\
\frac{1}{3}, & &  |h| = 2 \\
0, & &  |h| > 2,
\end{aligned}`
\right. 
$$

---
# Ejemplo

- Recuerden el ejmplo de señal: `$x_t=2 \cos \left( 2 \pi \frac{t+15}{50} \right)+ w_t$` para `$t=1,...,500$`. 
- Calculen la autocovariancia.

**Observaciones:**
- Aunque las medidas teóricas descritas (función de media, variancia, autocovariancia y autocorrelación) son importantes, pero no tenemos herramientas para calcularlas si solamente tenemos una realización del proceso en la práctica.

---
# Procesos estacionarios

**Definición:** Un **proceso estrictamente estacionario** es un proceso estocástico cuyo comportamiento de cada colección de valores
	`$$\left\lbrace X_{t_1},X_{t_2},...,X_{t_k} \right\rbrace$$`
	es idéntico a un conjunto bajo un cambio de tiempo
	`$$\left\lbrace X_{t_1+h},X_{t_2+h},...,X_{t_k+h} \right\rbrace.$$`
	Esto es,
	`$$P\left(X_{t_1} \leq c_1,...,X_{t_k} \leq c_k \right)=P\left(X_{t_1+h}\leq c_1,...,X_{t_k+h} \leq c_k \right)$$`
	para todo `$k=1,2,...$`, todo tiempo `$t_1,...,t_k$`, todos las constantes `$c_1,...,c_k$` y todos los cambios de tiempo `$h=0, \pm 1, \pm 2,...$`.

---
# Procesos estacionarios

**Definición:** Un **proceso débilmente estacionario** es un proceso con variancia finita tal que 
1. la función de la media es constante `$$\mu_t=E(X_t)=\mu$$`

2. La función de autocovariancia depende solamente de la diferencia de dos puntos `$t, t+h$`
 `$$\gamma(t,t+h)=Cov(X_t,X_{t+h})=Cov(X_0,X_h):=\gamma(h).$$`

Consecuentemente, la **función de autocorrelación** de un proceso estacionario es definido como

`$$\rho(h)=\frac{\gamma(t,t+h)}{\sqrt{\gamma(t+h,t+h)\gamma(t,t)}}=\frac{\gamma(h)}{\gamma(0)}.$$`
- En la práctica, se refiere simplemente a un proceso estacionario.

---
# Ejemplo

- Considere el ejemplo del ruido blanco `$w_t$`

`$$E(w_t)=0 ~~\text{para todo}~ t$$`.

$$
\gamma_w(t,t+h)=\left\lbrace 
`\begin{aligned}
\sigma_w^2, & & h = 0 \\
0, & &  h \neq 0,
\end{aligned}`
\right. 
$$

Entonces, `$w_t$` es estacionario.

---
# Ejemplo

- Considere el ejemplo de medias móviles: `$v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})$`
 
- La función de autocovariancia y la f. de autocorrelación están dadas por

$$
\gamma_w(t,t+h)=\left\lbrace 
`\begin{aligned}
\frac{3}{9}\sigma_w^2, & & h = 0 \\
\frac{2}{9}\sigma_w^2, & &  |h| = 1 \\
\frac{1}{9}\sigma_w^2, & &  |h| = 2 \\
0, & &  |h| > 2,
\end{aligned}`
\right. 
~~~\rho_w(t,t+h)=\left\lbrace 
`\begin{aligned}
1, & & h = 0 \\
\frac{2}{3}, & &  |h| = 1 \\
\frac{1}{3}, & &  |h| = 2 \\
0, & &  |h| > 2,
\end{aligned}`
\right. 
$$

- Se conculye que `$v_t$` es débilmente estacionario ya que la media es constante y `$\gamma_v(t,t+h)=\gamma_v(h)$` depende solamente de `$h$`.

---
# Estimación

- Aquí en adelante vamos a referir al concepto de estacionariedad débil con solamente **estacionariedad**.
- Si una serie es estacionaria, la media `$\mu_t=\mu$` es constante y podemos estimarla usando **la media muestral**

`$$\bar{X}=\frac{\sum\limits_{t=1}^T X_t}{T}$$`
- **Resultados teóricos:** Se puede probar que
`$$E\left[\bar{X}\right]=\mu$$`
$$ Var\left[\bar{X}\right]=\frac{1}{T} \sum_{h=-n}^n \left(1-\frac{|h|}{T} \right) \gamma_X(h) $$

---
# Estimación

- Para entender la idea de la autocorrelación, recuerde que la estimación de la covariancia y la autocorrelación de una muestra observada de dos variables `$X$` y `$Y$` con una muestra de `$n$` valores es

`$$s_{X,Y}=\frac{\sum\limits_{i=1}^{n} (X_{i}-\bar{X})(Y_{i}-\bar{Y})}{n}$$`
`$$r_{X,Y}=\frac{\sum\limits_{i=1}^{n} (X_{i}-\bar{X})(Y_{i}-\bar{Y})}{\sqrt{\sum\limits_{i=1}^{n} (X_{i}-\bar{X})^2 \sum\limits_{i=1}^{n} (Y_{i}-\bar{Y})^2}}$$`

---
# Estimación

- Suponga que tenemos las observaciones `$X_1,...,X_T$` de una serie `$X$`, considere la misma serie con un rezago, i.e. 
`$$X_2,...,X_{T-1},X_T$$`
`$$X_1...,X_{T-2},X_{T-1}$$`
- Podemos calcular la correlación como si fueran dos variables distintas:

`$$r_1=\frac{\sum\limits_{t=1}^{T-1} (X_{t+1}-\bar{X}_1)(X_{t}-\bar{X}_2)}{\sqrt{\sum\limits_{t=1}^{T-1} (X_{t+1}-\bar{X}_1)^2 \sum\limits_{t=1}^{T-1} (X_{t}-\bar{X}_2)^2}}$$`
donde `$\bar{X}_1$` es la media de los `$T-1$` últimos valores de la serie y `$\bar{X}_2$` es la media de los `$T-1$` primeros valores de la serie.

---
# Estimación

- Si la serie es estacionaria, 
  - `$\bar{X}_1$` y `$\bar{X}_2$` pueden ser reemplazadas por `$\bar{X}$`.
  - El denominador puede ser reemplazado por `$\sum\limits_{t=1}^{T} (X_{t}-\bar{X})^2$`.
  
- Entonces,  
`$$r_1=\frac{\sum\limits_{t=1}^{T-1} (X_{t+1}-\bar{X})(X_{t}-\bar{X})}{\sum\limits_{t=1}^{T} (X_{t}-\bar{X})^2}$$`
es la estimación de la autocorrelación de rezago `$h=1$`.

---
# Estimación

- Análogamente se puede calcular la autocorrelación muestral de rezago `$h$` con:

`$$r_h=\frac{\sum\limits_{t=1}^{T-h} (X_{t+h}-\bar{X})(X_{t}-\bar{X})}{\sum\limits_{t=1}^{T} (X_{t}-\bar{X})^2}$$`
para `$h=0,1,2,..., T-1$`.

- De forma análoga, se define `$r_h=r_{-h}$`

- Recuerde que la función de autocorrelación teórica es simétrica:

`$$\rho(h)=\rho(-h).$$`

---
# Estimación

- Entonces, **la función de autocovariancia muestral** es definida por
`$$\hat{\gamma}_X(h)=\frac{1}{T}\sum_{t=1}^{T-h} (X_{t+h}-\bar{X})(X_{t}-\bar{X}),$$`
con `$\hat{\gamma}_X(-h)=\hat{\gamma}_X(h)$` para `$h=0,1,...,T-1$`.

- **La función de autocorrelación muestral** es definida por
`$$\hat{\rho}_X(h)=r_X(h)=r_h=\frac{\hat{\gamma}_X(h)}{\hat{\gamma}_X(0)}$$`

`$$=\frac{\sum\limits_{t=1}^{T-h} (X_{t+h}-\bar{X})(X_{t}-\bar{X})}{\sum\limits_{t=1}^{T} (X_{t}-\bar{X})^2}$$`

---
# Estimación

**Propiedad:**

Si `$X_t$` tiene sus primeros 4 momentos finitos, y `$X_t$` es ruido blanco, entonces para `$T$` suficientemente grande, la función de autocorrelación muestral `$\hat{\rho}_X(h)=r_h, h=1,2,..., H$` donde `$H$` es un valor entero y fijo, es aproximadamente normal con media cero y desviación estándar
`$$\sigma_{\hat{\rho}_X(h)}=\frac{1}{\sqrt{T}}.$$`

**Nota:**

- Con este resultado, si se tiene un ruido blanco, entonces se espera que con aproximadamente 95% de confianza, las `$\hat{\rho}_X(h)$` deberían caer dentro del intervalo `$\left( \frac{-2}{\sqrt{T}},\frac{2}{\sqrt{T}} \right)$`.
puede estimar intervalos de confianza  e identificar aquellos rezagos que tienen autocorrelación significativa.
- En la práctica, se grafica los pares ordenados `$(h,r_h),h=1,2,...$` para visualizar la función de autocorrelación muestral. Este gráfico se denomina **correlograma**.

---
# Estimación

**Ejemplo de ruido blanco:**

.pull-left[
- Si `$w_t \sim wn(0,\sigma_w^2)$`, la función de autocorrelación es

$$
\rho_w(t,s)=\left\lbrace 
`\begin{aligned}
1, & & t = s \\
0, & &  t \neq s,
\end{aligned}`
\right. 
$$
o
$$
\rho_w(h)=\left\lbrace 
`\begin{aligned}
1, & & h = 0 \\
0, & &  h \neq 0,
\end{aligned}`
\right. 
$$

]
.pull-right[
La función de autocorrelación estimada de 500 observaciones de `$w_t \overset{\text{iid}}{\sim} N(0,1)$`.
<img src="presentacion_files/figure-html/unnamed-chunk-10-1.png" width="90%" />
]

---
# Estimación

**Ejemplo de medias móviles:**

.pull-left[

- Sea `$v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})$`

La función de autocorrelación es
$$
\rho_v(h)=\left\lbrace 
`\begin{aligned}
1, & & h = 0 \\
\frac{2}{3}, & &  |h| = 1 \\
\frac{1}{3}, & &  |h| = 2 \\
0, & &  |h| > 2,
\end{aligned}`
\right. 
$$
]
.pull-right[
<img src="presentacion_files/figure-html/unnamed-chunk-11-1.png" width="90%" />
]

---
# Ejemplos: sorteo navideño de 2008

- **Ejemplo 5.1 de Hernández (2011):** 135 números del sorteo de la lotería de Naividad de 2008 según el orden de extracción. Los números son muestreados aleatoriamente con reemplazo de una distribución uniforme discreta enteros entre 0 y 99.

.pull-left[
<img src="presentacion_files/figure-html/unnamed-chunk-12-1.png" width="90%" />
]
.pull-right[
<img src="presentacion_files/figure-html/unnamed-chunk-13-1.png" width="90%" />
]

---
# Ejemplos: pasajeros

La base de datos "AirPassenger" en R proporciona total de pasajeros mensuales de una aerolínea estadounidense de 1949 a 1960.

.pull-left[

<img src="presentacion_files/figure-html/unnamed-chunk-14-1.png" width="90%" style="display: block; margin: auto;" />
]
.pull-right[
<img src="presentacion_files/figure-html/unnamed-chunk-15-1.png" width="90%" style="display: block; margin: auto;" />
]

¿La serie es estacionaria?

.red[**Nota:**] ¿Qué pasa con la estimación de las autocorrelaciones?

---
# Ejemplos: contrayentes

Ejemplo 2.1 de Hernández (2011): Serie de número de contrayentes en los matrimonios celebrados en Costa Rica de 1978 a 1983.

.pull-left[

<img src="presentacion_files/figure-html/unnamed-chunk-16-1.png" width="90%" style="display: block; margin: auto;" />
]
.pull-right[
<img src="presentacion_files/figure-html/unnamed-chunk-17-1.png" width="90%" style="display: block; margin: auto;" />
]

¿La serie es estacionaria?

---
# Ejemplos: graduados del ITCR

- Ejemplo 3.2 de Hernández (2011): Serie de graduados del ITCR de 1975-2002.

.pull-left[

<img src="presentacion_files/figure-html/unnamed-chunk-18-1.png" width="90%" style="display: block; margin: auto;" />
]
.pull-right[
<img src="presentacion_files/figure-html/unnamed-chunk-19-1.png" width="90%" style="display: block; margin: auto;" />
]

¿La serie es estacionaria?

---
# Observaciones 
## Sobre el comportamiento de las series estacionarias

Generalmente en la práctica, las series estacionarias presentan las siguientes características:
- una media o nivel constante a lo largo del tiempo
- una variabilidad constante en el tiempo (con pequeñas variaciones)
- su función de autocorrelación generalmente decae rápidamente.

¡pero podría tener algunas excepciones!

---
# Transform. y diferenciación de series

- En la práctica, la mayoría de las series no son estacionarias.

- Si la variancia cambia con el nivel de la serie, se recomienda usar
`$$W_t=\ln X_t.$$`
- Otra transformación útil es la diferenciación de la serie:
`$$W_t=\nabla X_t = X_t-X_{t-1},~~t=2,...,T.$$`

---
# Transform. y diferenciación de series

- Ejemplo 3.2 de Hernández (2011): Serie de graduados del ITCR de 1975-2002.

.pull-left[
La serie original:

<img src="presentacion_files/figure-html/unnamed-chunk-20-1.png" width="50%" style="display: block; margin: auto;" /><img src="presentacion_files/figure-html/unnamed-chunk-20-2.png" width="50%" style="display: block; margin: auto;" />
]
.pull-right[
La serie con una diferencia:

<img src="presentacion_files/figure-html/unnamed-chunk-21-1.png" width="50%" style="display: block; margin: auto;" /><img src="presentacion_files/figure-html/unnamed-chunk-21-2.png" width="50%" style="display: block; margin: auto;" />
]

---
# Transform. y diferenciación de series

- Ejemplo del valor de cierre de Google (25/02/2013-13/02/2017)

.pull-left[
La serie original:

<img src="presentacion_files/figure-html/unnamed-chunk-22-1.png" width="50%" style="display: block; margin: auto;" /><img src="presentacion_files/figure-html/unnamed-chunk-22-2.png" width="50%" style="display: block; margin: auto;" />
]
.pull-right[
La serie con una diferencia:

<img src="presentacion_files/figure-html/unnamed-chunk-23-1.png" width="50%" style="display: block; margin: auto;" /><img src="presentacion_files/figure-html/unnamed-chunk-23-2.png" width="50%" style="display: block; margin: auto;" />
]

---
# Caminata aleatoria

Si una serie diferenciada resulta ser un ruido blanco `$\epsilon_t$`,

`$$W_t=\nabla X_t = X_t-X_{t-1}= \epsilon_t,$$`
entonces reordenando se tiene un modelo de **caminata aleatoria**:

`$$X_t= X_{t-1} + \epsilon_t$$`
Un modelo no estacionario ampliamente utilizado en datos económicos y financieros.

Presenta tendencias crecientes y decrecientes imprevistas a lo largo del tiempo.

---
# Caminata aleatoria

.pull-left[
Caminata aleatoria simulada:

<img src="presentacion_files/figure-html/unnamed-chunk-24-1.png" width="50%" style="display: block; margin: auto;" /><img src="presentacion_files/figure-html/unnamed-chunk-24-2.png" width="50%" style="display: block; margin: auto;" />
]
.pull-right[
La serie con una diferencia:

<img src="presentacion_files/figure-html/unnamed-chunk-25-1.png" width="50%" style="display: block; margin: auto;" /><img src="presentacion_files/figure-html/unnamed-chunk-25-2.png" width="50%" style="display: block; margin: auto;" />
]

---
# La función de autocorrelación parcial

- La autocorrelación parcial (f.a.c.p.) en el rezago `$h$` mide el grado de asociación lineal entre `$Z_t$` y `$Z_{t+h}$` cuando los efectos de los otros rezagos `$1,2,...,h-1$` han sido eliminados.
- Denotemos la función de autocorrelación parcial teórica de orden `$h$` por `$\rho_{hh}$` para `$h=1,2,...$` y la función de autocorrelación parcial muestral de orden `$h$` con `$r_{hh}$`, para `$h=1,2,...$`.
- Teóricamente la función de autocorrelación parcial de un proceso estacionario `$Z_t$`, denotado por `$\rho_{hh}$`, para `$h=1,2,...$` es 
`$$\rho_{11}=corr(Z_{t+1},Z_t)=\rho_1$$` 
`$$\text{y}~~ \rho_{hh}=corr\left[Z_{t+h}-\hat{Z}_{t+h}~,~Z_t-\hat{Z}_{t}\right],~~\text{para}~~ h \geq 2,$$`
donde   
`$\hat{Z}_{t+h}=\beta_1 Z_{t+h-1}+\beta_2 Z_{t+h-2}+...+\beta_{h-1} Z_{t+1}$` y  
`$\hat{Z}_{t}=\beta_1 Z_{t+1}+\beta_2 Z_{t+2}+...+\beta_{h-1} Z_{t+h-1}$`

---
# La función de autocorrelación parcial

- Si `$Z_t$` es un proceso gaussiano,

`$$\rho_{hh}=corr(Z_{t+h},Z_t|Z_{t+1},...,Z_{t+h-1}).$$`

i.e. es la correlación de una distribución normal bivariada `$(Z_{t+h},Z_t)$` condicional a `${Z_{t+1},...,Z_{t+h-1}}$` (¿Por qué?)

---
# Próximo tema

### Tema 6: Modelos ARIMA de Box&Jenkins.