Series cronológicas (SP-1633)

class: center, middle, inverse, title-slide

# Series cronológicas (SP-1633)
### Prof. Shu Wei Chou C.
### Posgrado en Estadística, UCR
### 20/08/2021

---

### Tema 1

### Introducción: procesos estocásticos y series de tiempo.

---
### Contenido

1. Consideraciones generales
2. Series continuas y discretas
3. Objetivos
4. Componentes de las series temporales
5. Modelos de series temporales
6. Medidas de dependencia
7. Procesos estacionarios

---
### Consideraciones generales

Una **serie temporal** (**serie cronológica** o **serie de tiempo**) es una colección de datos recolectados en el tiempo.

Ejemplos:
  - **Economía**:
      - exportaciones, ventas, tipo de cambio, bolsa de valores.
  - **Medicina**:
      - número de casos de una enfermedad, electrocardiograma de un paciente.
  - **Meteorología**: 
      - precipitación, temperatura
      - contaminación de una cierta partícula.
      - promedio anual de manchas solares
  - **Demografía**:
      - mortalidad, natalidad.
      
---
### Series temporales continuas y discretas

- Una series temporal **continua**: si las observaciones de la serie se registran para todo tiempo `$t$` en un intervalo de tiempo.
  - registro continuo de la temperatura.
  - registro continuo de marea en Puntarenas.

- Una series temporal **discreta**: si las observaciones de la serie se registran  sólo en momentos particulares. Puede ser equiespaciadas o no.
  - precipitación anual en San José.
  - número diario de casos nuevos de COVID19.

---
### Series temporales continuas y discretas

- El muestreo de una serie continua realizado en intervalos de tiempo iguales, `$\Delta t$`, en un intervalo de tiempo `$[0,T]$` produce una serie discreta equiespaciada de `$N=\frac{T}{\Delta t}$` puntos.
  - temperatura medida en cada hora.

- Otro caso es cuando se toma el valor de la serie acumulando (o agregando) valores en intervalos de tiempos iguales.
  - temperatura promedio de cada hora en una estación atmosférica.
  - precipitación mensual en un área específica.

- Ejemplos de la diapositiva 4:
  - ¿Cuáles son discretas y cuáles son continuas?

- En este curso, enfocamos en series discretas equiespaciadas.

---
### Ejemplos:

.pull-left[
<img src="clase-1_files/figure-html/unnamed-chunk-2-1.png" width="100%" />
Figura 1. Desviación de temperatura global promedio (1880-2015) en grados centígrados (periodo base 1951-1980)
]

.pull-right[
<img src="clase-1_files/figure-html/unnamed-chunk-3-1.png" width="100%" />
Figura 2. Grabación de "aaahhh" muestreada de 10.000 puntos por segundo con n = 1020.
]

---

### Objetivos del análisis de series temporales

- **Predicción:** pronosticar valores en el futuro. Puede ser de corto plazo (series de ventas y de producción) o largo plazo (series de población, series relacionadas al calendamiento global, etc.).
  
  - **Descripción:** describir por medio de gráficos o modelos el fenómeno. Verificar de existencia de tendencias, ciclos, estacionalidad. Encontrar periodicidad de los datos.
  
  - **Simulación:** generar posibles escenarios con condiciones estrictas.

- **Control de procesos:** mantener en control una cierta variable en el tiempo.

---
### Componentes de las series temporales

* Existe varios componentes en el comportamiento de series temporales:

1. **Tendencia:** comportamiento creciente o decreciente en largo plazo. Ej: crecimiento de población, ingresos por ventas.
  2. **Estacionalidad:** patrón o variaciones afectadas por repetición de una frecuencia dada (ej. semana, mes y año.). Consecuencia de cambios climáticos, comportamiento de la gente en el tiempo. Ej: venta de productos que dependen de la temporada, temperatura, pasajes de avión.

3. **Ciclo:** cuando los datos muestran subidas y bajadas de largo plazo, generalmente con frecuencia desconocida. Ej: ciclo económico, período de prosperidad alternando con período de recesión.

4. **Movimiento irregular o error:** variaciones en la serie que no siguen ningún patrón regular. Es el residuo que queda en una serie después de eliminar los componentes anteriores (tendencia-ciclo y estacionalidad).

---
### Ejemplo: pasajeros

La base de datos "AirPassenger" en R proporciona total de pasajeros mensuales de una aerolínea estadounidense de 1949 a 1960.

---
### Descomposición de series temporales
### Ejemplo: pasajeros

.pull-left[
<img src="clase-1_files/figure-html/unnamed-chunk-5-1.png" width="90%" />
]
.pull-right[
<img src="clase-1_files/figure-html/unnamed-chunk-6-1.png" width="90%" />
]

---
  
### Ejemplo: llegadas internacionales
  
La base de datos `fpp2::arrivals` tiene los datos de llegadas internacionales (en miles) a Australia de Japón, Nueva Zelanda, Reinos Unidos y Estados Unidos por cuatrimestre.

.pull-left[
<img src="clase-1_files/figure-html/unnamed-chunk-7-1.png" width="100%" />
]

.pull-right[
<img src="clase-1_files/figure-html/unnamed-chunk-8-1.png" width="100%" />
]

---
### Ejemplo: llegadas internacionales
  
<img src="clase-1_files/figure-html/unnamed-chunk-9-1.png" width="60%" style="display: block; margin: auto;" />

---

#### Ejemplo: promedio diario industrial Dow Jone (20 de abril, 2006 a 20 de abril, 2016)

---
### Técnicas estadísticas para el análisis de series temporales

- Descomposición de series temporales.
- Técnicas de suavizamiento exponencial.
- Regresión.
- Modelos ARIMA de Box-Jenkins.
- Modelos ARCH-GARCH.
- Análisis de intervención.
- Modelos Espacio de Estados.
- Modelos Multivariados.
- Modelos causales.
- Modelos no lineales.
- ...

---
### Modelos de series temporales

- El principal objetivo del análisis de series temporales es construir modelos matemáticos que proporciona una descripción de los datos muestreados.

- Además, sirve para realizar inferencia del comportamiento en el intervalo observado o a futuro.

---
#### Modelos de series temporales

- Considere una serie temporal como una secuencia de variables aleatorias 
`$$X_1,X_2,..,X_t,...$$`

- **Proceso estocástico:** una colección de variables aleatorias indexada por un conjunto `$\mathcal{T}$`, 
`$$\left\lbrace X_t, t \in \mathcal{T} \right\rbrace$$`

- Vamos a enfocar el caso cuando `$\mathcal{T}$` es un conjunto discreto, i.e. `$t=0,1,2,...$`.

<div class="figure" style="text-align: center">
<img src="timeseriesmodel.png" alt="Figura tomada en Morettin (2017)" width="50%" />
<p class="caption">Figura tomada en Morettin (2017)</p>
</div>

---
### Modelos de series temporales

- Un modelo de series temporales generalmente especifica la distribución conjunta de la secuencia `$X_t$`.
$$
	P\left(X_1\leq x_1, X_2\leq x_2,...,X_t \leq x_t \right)
$$
- Una observación de un proceso estocástico es una serie de valores observados en el tiempo y es llamada **una realización** de un proceso estocástico.

<div class="figure" style="text-align: center">
<img src="realizaciones.png" alt="Figura tomada en Morettin (2017)" width="50%" />
<p class="caption">Figura tomada en Morettin (2017)</p>
</div>

---

### Ruido blanco
.pull-left[
- Una colección de variables aleatorias no correlacionadas, `$w_t$`, con media 0 y variancia `$\sigma_w^2$`.

- Denotado por `$w_t \sim wn(0,\sigma_w^2)$`.

- Simulación de una colección de `$w_t \sim N(0,1)$` con `$T=500$`.

]
.pull-right[
<img src="clase-1_files/figure-html/unnamed-chunk-13-1.png" width="90%" />
]

---
### Medias móviles

.pull-left[
- Considere `$w_t \sim wn(0,\sigma_w^2)$`.

- Sea `$v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})$`

- Esta serie se ve más suave y presenta menos picos que el caso anterior.

]
.pull-right[
<img src="clase-1_files/figure-html/unnamed-chunk-14-1.png" width="90%" />
]

---
### Autoregresión

.pull-left[

- Sea `$w_t \sim wn(0,\sigma_w^2)$`.

- Considere un modelo AR(1): `$$X_t=\phi X_{t-1}+w_t$$`

- Veamos dos casos de `$\phi=0.9$` y `$-0.9$`.

]
.pull-right[
<img src="clase-1_files/figure-html/unnamed-chunk-15-1.png" width="100%" />
]

---
### Alguna función (señal) + ruido blanco

.pull-left[

- Muchos modelos series temporales asumen que existe una señal con alguna variación periódica, contaminada por un ruido aleatorio.

- Considere `$x_t=2 \cos \left( 2 \pi \frac{t+15}{50} \right)+ w_t$` para `$t=1,...,500$`.

- El modelo general `$A cos(2\pi \omega t + \phi)$` con amplitud `$A$`, frecuencia `$\omega$`, y fase `$\phi$`.

- El ejemplo anterior considera `$A=2$`, `$\omega=1/50$` (un ciclo cada 50 puntos en el tiempo) y `$\phi=2 \pi 15/50=0.6 \pi$`.

]
.pull-right[
<img src="clase-1_files/figure-html/unnamed-chunk-16-1.png" width="100%" style="display: block; margin: auto;" />
]

---
### Medidas de dependencia

- Una descripción completa de un modelo de series temporales es proporcionado por la distribución de probabilidad conjunta, i.e. dados tiempos arbitrarios `$t_1,...,t_n$` para `$n$` entero positivo y `$c_1,...,c_n$` n valores constantes:

$$
	F_{t_1,...,t_n}(c_1,...,c_n)=P\left(X_1\leq c_1, X_2\leq c_2,...,X_t \leq c_t \right)
$$
- Aunque esa distribución describe los datos globalmente, en la práctica, esa distribución multidimencional es dificil de conocer, excepto cuando es normal multivariado (¿por qué?)

- La distribución marginal en el tiempo `$t$`,
$$
F_t(x)=P(X \leq x)
$$
- La función densidad marginal en el tiempo `$t$`,
$$
f_t(x)= \frac{\partial F_t(x)}{\partial x}
$$
---
### Medidas de dependencia

- **La función de media** para el tiempo `$t$` es definida por

`$$\mu_t= E(X_t)=\int_{-\infty}^\infty f_t(x)dx$$`
- Considere el ejemplo de medias móviles: `$v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})$`

`$$E(v_t)=\frac{1}{3}(E(w_{t-1})+E(w_{t})+E(w_{t+1}))=0$$`
- Considere el ejemplo de la señal+ruido: `$x_t=2 \cos \left( 2 \pi \frac{t+15}{50} \right)+ w_t$`

`$$E(x_t)=2 \cos \left( 2 \pi \frac{t+15}{50} \right)+ E(w_t)=2 \cos \left( 2 \pi \frac{t+15}{50} \right)$$`

---
### Medidas de dependencia

- **La función de autocovariancia** es definida por

`$$\gamma_X(t,s)=\gamma(t,s)= Cov(X_t,X_s)=E\left[ (X_t-\mu_t)(X_s-\mu_s) \right]$$`
- Mide la dependencia lineal entre dos puntos de tiempo de la misma serie.

- **La función de variancia** en el tiempo `$t$` es definida por
`$$\gamma_X(t,t)=Var(X_t)$$`

- Considere el ejemplo del ruido blanco `$w_t$`:

$$
\gamma_w(t,s)=Cov(w_t,w_s)=\left\lbrace 
`\begin{aligned}
\sigma_w^2, & & t = s \\
0, & &  t \neq s,
\end{aligned}`
\right. 
$$

---
### Medidas de dependencia

- **La función de autocorrelación** es definida por

`$$\rho_X(t,s)=\frac{\gamma(t,s)}{\sqrt{\gamma(t,t)\gamma(s,s)}}$$`
- Considere el ejemplo del ruido blanco `$w_t$`:

$$
\rho_w(t,s)=\left\lbrace 
`\begin{aligned}
1, & & t = s \\
0, & &  t \neq s,
\end{aligned}`
\right. 
$$

---
### Procesos estacionarios

**Definición:**

Un **proceso estrictamente estacionario** es un proceso estocástico cuyo comportamiento de cada colección de valores
	`$$\left\lbrace X_{t_1},X_{t_2},...,X_{t_k} \right\rbrace$$`
	es idéntico a un conjunto bajo un cambio de tiempo
	`$$\left\lbrace X_{t_1+h},X_{t_2+h},...,X_{t_k+h} \right\rbrace.$$`
	Esto es,
	`$$P\left(X_{t_1} \leq c_1,...,X_{t_k} \leq c_k \right)=P\left(X_{t_1+h}\leq c_1,...,X_{t_k+h} \leq c_k \right)$$`
	para todo `$k=1,2,...$`, todo tiempo `$t_1,...,t_k$`, todos las constantes `$c_1,...,c_k$` y todos los cambios de tiempo `$h=0, \pm 1, \pm 2,...$`.

---
### Procesos estacionarios

**Definición:**

Un **proceso débilmente estacionario** es un proceso con variancia finita tal que 
1. la función de la media es constante `$$\mu_t=E(X_t)=\mu$$`

2. La función de autocovariancia depende solamente de la diferencia de dos puntos `$t, t+h$`
 `$$\gamma(t,t+h)=Cov(X_t,X_{t+h})=Cov(X_0,X_h):=\gamma(h).$$`

Consecuentemente, la **función de autocorrelación** de un proceso estacionario es definido como

`$$\rho(h)=\frac{\gamma(t,t+h)}{\sqrt{\gamma(t+h,t+h),\gamma(t,t)}}=\frac{\gamma(h)}{\gamma(0)}.$$`
- En la práctica, se refiere simplemente a un proceso estacionario.

---
### Ejemplo 1

- Considere el ejemplo del ruido blanco `$w_t$`

- `$E(w_t)=0$` para todo `$t$`.
  - 
  $$
\gamma_w(t,t+h)=\left\lbrace 
`\begin{aligned}
\sigma_w^2, & & h = 0 \\
0, & &  h \neq 0,
\end{aligned}`
\right. 
$$

Entonces, `$w_t$` es estacionario.

---
### Ejemplo 2

- Considere el ejemplo de medias móviles: `$v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})$`
 
- La función de autocovariancia es definida por

`$\gamma_v(t,t+h)=Cov(v_{t},v_{t+h})$`

- Caso 1 `$(h=0)$`:

`$\gamma_v(t,t+0)=Cov(v_{t},v_{t+0})=Var(v_t)$`
  `$=\frac{1}{9}Var(w_{t-1}+w_{t}+w_{t+1})=\frac{3}{9} Var(w_t)=\frac{1}{3} \sigma_w^2.$`

- Caso 2 `$(h=1)$`:

`$\gamma_v(t,t+1)=Cov(v_{t},v_{t+1})$`
  `$=Cov\left[\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1}),\frac{1}{3}(w_{t}+w_{t+1}+w_{t+2})\right]$`
`$=\frac{1}{9}\left[ Cov(w_{t},w_{t})+Cov(w_{t+1},w_{t+1}) \right]$`
`$=\frac{2}{9}\sigma_w^2$`

- Caso 3 `$(h=-1)$`: Similarmente se obtiene `$\gamma_v(t,t-1)=\frac{2}{9}\sigma_w^2$`
  
---
### Ejemplo 2

- Caso 4 `$(h=2~o~h=-2)$`:

`$\gamma_v(t,t+2)=\gamma_v(t,t-2)=\frac{1}{9}\sigma_w^2$`
  
- Caso 5 `$(h>2~o~h<-2)$`:

`$\gamma_v(t,t+h)=0.$`

Entonces,
$$
\gamma_w(t,t+h)=\left\lbrace 
`\begin{aligned}
\frac{3}{9}\sigma_w^2, & & h = 0 \\
\frac{2}{9}\sigma_w^2, & &  |h| = 1 \\
\frac{1}{9}\sigma_w^2, & &  |h| = 2 \\
0, & &  |h| > 2,
\end{aligned}`
\right. 
$$

---
### Ejemplo 2

La función de autocorrelación:
$$
\rho_w(t,t+h)=\left\lbrace 
`\begin{aligned}
1, & & h = 0 \\
\frac{2}{3}, & &  |h| = 1 \\
\frac{1}{3}, & &  |h| = 2 \\
0, & &  |h| > 2,
\end{aligned}`
\right. 
$$

Se conculye que `$v_t$` es débilmente estacionario ya que la media es constante y `$\gamma_v(t,t+h)=\gamma_v(h)$` depende solamente de `$h$`.

---
### Próximo tema

### Análisis exploratorio de series de tiempo. Introducción a R.

---

class: center, middle

## Thanks!

Slides created via the R package [**xaringan**](https://github.com/yihui/xaringan).

The chakra comes from [remark.js](https://remarkjs.com), [**knitr**](http://yihui.org/knitr), and [R Markdown](https://rmarkdown.rstudio.com).