class: center, middle, inverse, title-slide # Series cronológicas (SP-1633) ### Prof. Shu Wei Chou C. ### Posgrado en Estadística, UCR ### 20/08/2021 --- ### Tema 1 ### Introducción: procesos estocásticos y series de tiempo. --- ### Contenido 1. Consideraciones generales 2. Series continuas y discretas 3. Objetivos 4. Componentes de las series temporales 5. Modelos de series temporales 6. Medidas de dependencia 7. Procesos estacionarios --- ### Consideraciones generales Una **serie temporal** (**serie cronológica** o **serie de tiempo**) es una colección de datos recolectados en el tiempo. Ejemplos: - **Economía**: - exportaciones, ventas, tipo de cambio, bolsa de valores. - **Medicina**: - número de casos de una enfermedad, electrocardiograma de un paciente. - **Meteorología**: - precipitación, temperatura - contaminación de una cierta partícula. - promedio anual de manchas solares - **Demografía**: - mortalidad, natalidad. --- ### Series temporales continuas y discretas - Una series temporal **continua**: si las observaciones de la serie se registran para todo tiempo `\(t\)` en un intervalo de tiempo. - registro continuo de la temperatura. - registro continuo de marea en Puntarenas. - Una series temporal **discreta**: si las observaciones de la serie se registran sólo en momentos particulares. Puede ser equiespaciadas o no. - precipitación anual en San José. - número diario de casos nuevos de COVID19. --- ### Series temporales continuas y discretas - El muestreo de una serie continua realizado en intervalos de tiempo iguales, `\(\Delta t\)`, en un intervalo de tiempo `\([0,T]\)` produce una serie discreta equiespaciada de `\(N=\frac{T}{\Delta t}\)` puntos. - temperatura medida en cada hora. - Otro caso es cuando se toma el valor de la serie acumulando (o agregando) valores en intervalos de tiempos iguales. - temperatura promedio de cada hora en una estación atmosférica. - precipitación mensual en un área específica. - Ejemplos de la diapositiva 4: - ¿Cuáles son discretas y cuáles son continuas? - En este curso, enfocamos en series discretas equiespaciadas. --- ### Ejemplos: .pull-left[ <img src="clase-1_files/figure-html/unnamed-chunk-2-1.png" width="100%" /> Figura 1. Desviación de temperatura global promedio (1880-2015) en grados centígrados (periodo base 1951-1980) ] .pull-right[ <img src="clase-1_files/figure-html/unnamed-chunk-3-1.png" width="100%" /> Figura 2. Grabación de "aaahhh" muestreada de 10.000 puntos por segundo con n = 1020. ] --- ### Objetivos del análisis de series temporales - **Predicción:** pronosticar valores en el futuro. Puede ser de corto plazo (series de ventas y de producción) o largo plazo (series de población, series relacionadas al calendamiento global, etc.). - **Descripción:** describir por medio de gráficos o modelos el fenómeno. Verificar de existencia de tendencias, ciclos, estacionalidad. Encontrar periodicidad de los datos. - **Simulación:** generar posibles escenarios con condiciones estrictas. - **Control de procesos:** mantener en control una cierta variable en el tiempo. --- ### Componentes de las series temporales * Existe varios componentes en el comportamiento de series temporales: 1. **Tendencia:** comportamiento creciente o decreciente en largo plazo. Ej: crecimiento de población, ingresos por ventas. 2. **Estacionalidad:** patrón o variaciones afectadas por repetición de una frecuencia dada (ej. semana, mes y año.). Consecuencia de cambios climáticos, comportamiento de la gente en el tiempo. Ej: venta de productos que dependen de la temporada, temperatura, pasajes de avión. 3. **Ciclo:** cuando los datos muestran subidas y bajadas de largo plazo, generalmente con frecuencia desconocida. Ej: ciclo económico, período de prosperidad alternando con período de recesión. 4. **Movimiento irregular o error:** variaciones en la serie que no siguen ningún patrón regular. Es el residuo que queda en una serie después de eliminar los componentes anteriores (tendencia-ciclo y estacionalidad). --- ### Ejemplo: pasajeros La base de datos "AirPassenger" en R proporciona total de pasajeros mensuales de una aerolínea estadounidense de 1949 a 1960. <img src="clase-1_files/figure-html/unnamed-chunk-4-1.png" width="40%" style="display: block; margin: auto;" /> --- ### Descomposición de series temporales ### Ejemplo: pasajeros .pull-left[ <img src="clase-1_files/figure-html/unnamed-chunk-5-1.png" width="90%" /> ] .pull-right[ <img src="clase-1_files/figure-html/unnamed-chunk-6-1.png" width="90%" /> ] --- ### Ejemplo: llegadas internacionales La base de datos `fpp2::arrivals` tiene los datos de llegadas internacionales (en miles) a Australia de Japón, Nueva Zelanda, Reinos Unidos y Estados Unidos por cuatrimestre. .pull-left[ <img src="clase-1_files/figure-html/unnamed-chunk-7-1.png" width="100%" /> ] .pull-right[ <img src="clase-1_files/figure-html/unnamed-chunk-8-1.png" width="100%" /> ] --- ### Ejemplo: llegadas internacionales <img src="clase-1_files/figure-html/unnamed-chunk-9-1.png" width="60%" style="display: block; margin: auto;" /> --- #### Ejemplo: promedio diario industrial Dow Jone (20 de abril, 2006 a 20 de abril, 2016) <img src="clase-1_files/figure-html/unnamed-chunk-10-1.png" width="60%" style="display: block; margin: auto;" /> --- ### Técnicas estadísticas para el análisis de series temporales - Descomposición de series temporales. - Técnicas de suavizamiento exponencial. - Regresión. - Modelos ARIMA de Box-Jenkins. - Modelos ARCH-GARCH. - Análisis de intervención. - Modelos Espacio de Estados. - Modelos Multivariados. - Modelos causales. - Modelos no lineales. - ... --- ### Modelos de series temporales - El principal objetivo del análisis de series temporales es construir modelos matemáticos que proporciona una descripción de los datos muestreados. - Además, sirve para realizar inferencia del comportamiento en el intervalo observado o a futuro. --- #### Modelos de series temporales - Considere una serie temporal como una secuencia de variables aleatorias `$$X_1,X_2,..,X_t,...$$` - **Proceso estocástico:** una colección de variables aleatorias indexada por un conjunto `\(\mathcal{T}\)`, `$$\left\lbrace X_t, t \in \mathcal{T} \right\rbrace$$` - Vamos a enfocar el caso cuando `\(\mathcal{T}\)` es un conjunto discreto, i.e. `\(t=0,1,2,...\)`. <div class="figure" style="text-align: center"> <img src="timeseriesmodel.png" alt="Figura tomada en Morettin (2017)" width="50%" /> <p class="caption">Figura tomada en Morettin (2017)</p> </div> --- ### Modelos de series temporales - Un modelo de series temporales generalmente especifica la distribución conjunta de la secuencia `\(X_t\)`. $$ P\left(X_1\leq x_1, X_2\leq x_2,...,X_t \leq x_t \right) $$ - Una observación de un proceso estocástico es una serie de valores observados en el tiempo y es llamada **una realización** de un proceso estocástico. <div class="figure" style="text-align: center"> <img src="realizaciones.png" alt="Figura tomada en Morettin (2017)" width="50%" /> <p class="caption">Figura tomada en Morettin (2017)</p> </div> --- ### Ruido blanco .pull-left[ - Una colección de variables aleatorias no correlacionadas, `\(w_t\)`, con media 0 y variancia `\(\sigma_w^2\)`. - Denotado por `\(w_t \sim wn(0,\sigma_w^2)\)`. - Simulación de una colección de `\(w_t \sim N(0,1)\)` con `\(T=500\)`. ] .pull-right[ <img src="clase-1_files/figure-html/unnamed-chunk-13-1.png" width="90%" /> ] --- ### Medias móviles .pull-left[ - Considere `\(w_t \sim wn(0,\sigma_w^2)\)`. - Sea `\(v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})\)` - Esta serie se ve más suave y presenta menos picos que el caso anterior. ] .pull-right[ <img src="clase-1_files/figure-html/unnamed-chunk-14-1.png" width="90%" /> ] --- ### Autoregresión .pull-left[ - Sea `\(w_t \sim wn(0,\sigma_w^2)\)`. - Considere un modelo AR(1): `$$X_t=\phi X_{t-1}+w_t$$` - Veamos dos casos de `\(\phi=0.9\)` y `\(-0.9\)`. ] .pull-right[ <img src="clase-1_files/figure-html/unnamed-chunk-15-1.png" width="100%" /> ] --- ### Alguna función (señal) + ruido blanco .pull-left[ - Muchos modelos series temporales asumen que existe una señal con alguna variación periódica, contaminada por un ruido aleatorio. - Considere `\(x_t=2 \cos \left( 2 \pi \frac{t+15}{50} \right)+ w_t\)` para `\(t=1,...,500\)`. - El modelo general `\(A cos(2\pi \omega t + \phi)\)` con amplitud `\(A\)`, frecuencia `\(\omega\)`, y fase `\(\phi\)`. - El ejemplo anterior considera `\(A=2\)`, `\(\omega=1/50\)` (un ciclo cada 50 puntos en el tiempo) y `\(\phi=2 \pi 15/50=0.6 \pi\)`. ] .pull-right[ <img src="clase-1_files/figure-html/unnamed-chunk-16-1.png" width="100%" style="display: block; margin: auto;" /> ] --- ### Medidas de dependencia - Una descripción completa de un modelo de series temporales es proporcionado por la distribución de probabilidad conjunta, i.e. dados tiempos arbitrarios `\(t_1,...,t_n\)` para `\(n\)` entero positivo y `\(c_1,...,c_n\)` n valores constantes: $$ F_{t_1,...,t_n}(c_1,...,c_n)=P\left(X_1\leq c_1, X_2\leq c_2,...,X_t \leq c_t \right) $$ - Aunque esa distribución describe los datos globalmente, en la práctica, esa distribución multidimencional es dificil de conocer, excepto cuando es normal multivariado (¿por qué?) - La distribución marginal en el tiempo `\(t\)`, $$ F_t(x)=P(X \leq x) $$ - La función densidad marginal en el tiempo `\(t\)`, $$ f_t(x)= \frac{\partial F_t(x)}{\partial x} $$ --- ### Medidas de dependencia - **La función de media** para el tiempo `\(t\)` es definida por `$$\mu_t= E(X_t)=\int_{-\infty}^\infty f_t(x)dx$$` - Considere el ejemplo de medias móviles: `\(v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})\)` `$$E(v_t)=\frac{1}{3}(E(w_{t-1})+E(w_{t})+E(w_{t+1}))=0$$` - Considere el ejemplo de la señal+ruido: `\(x_t=2 \cos \left( 2 \pi \frac{t+15}{50} \right)+ w_t\)` `$$E(x_t)=2 \cos \left( 2 \pi \frac{t+15}{50} \right)+ E(w_t)=2 \cos \left( 2 \pi \frac{t+15}{50} \right)$$` --- ### Medidas de dependencia - **La función de autocovariancia** es definida por `$$\gamma_X(t,s)=\gamma(t,s)= Cov(X_t,X_s)=E\left[ (X_t-\mu_t)(X_s-\mu_s) \right]$$` - Mide la dependencia lineal entre dos puntos de tiempo de la misma serie. - **La función de variancia** en el tiempo `\(t\)` es definida por `$$\gamma_X(t,t)=Var(X_t)$$` - Considere el ejemplo del ruido blanco `\(w_t\)`: $$ \gamma_w(t,s)=Cov(w_t,w_s)=\left\lbrace `\begin{aligned} \sigma_w^2, & & t = s \\ 0, & & t \neq s, \end{aligned}` \right. $$ --- ### Medidas de dependencia - **La función de autocorrelación** es definida por `$$\rho_X(t,s)=\frac{\gamma(t,s)}{\sqrt{\gamma(t,t)\gamma(s,s)}}$$` - Considere el ejemplo del ruido blanco `\(w_t\)`: $$ \rho_w(t,s)=\left\lbrace `\begin{aligned} 1, & & t = s \\ 0, & & t \neq s, \end{aligned}` \right. $$ --- ### Procesos estacionarios **Definición:** Un **proceso estrictamente estacionario** es un proceso estocástico cuyo comportamiento de cada colección de valores `$$\left\lbrace X_{t_1},X_{t_2},...,X_{t_k} \right\rbrace$$` es idéntico a un conjunto bajo un cambio de tiempo `$$\left\lbrace X_{t_1+h},X_{t_2+h},...,X_{t_k+h} \right\rbrace.$$` Esto es, `$$P\left(X_{t_1} \leq c_1,...,X_{t_k} \leq c_k \right)=P\left(X_{t_1+h}\leq c_1,...,X_{t_k+h} \leq c_k \right)$$` para todo `\(k=1,2,...\)`, todo tiempo `\(t_1,...,t_k\)`, todos las constantes `\(c_1,...,c_k\)` y todos los cambios de tiempo `\(h=0, \pm 1, \pm 2,...\)`. --- ### Procesos estacionarios **Definición:** Un **proceso débilmente estacionario** es un proceso con variancia finita tal que 1. la función de la media es constante `$$\mu_t=E(X_t)=\mu$$` 2. La función de autocovariancia depende solamente de la diferencia de dos puntos `\(t, t+h\)` `$$\gamma(t,t+h)=Cov(X_t,X_{t+h})=Cov(X_0,X_h):=\gamma(h).$$` Consecuentemente, la **función de autocorrelación** de un proceso estacionario es definido como `$$\rho(h)=\frac{\gamma(t,t+h)}{\sqrt{\gamma(t+h,t+h),\gamma(t,t)}}=\frac{\gamma(h)}{\gamma(0)}.$$` - En la práctica, se refiere simplemente a un proceso estacionario. --- ### Ejemplo 1 - Considere el ejemplo del ruido blanco `\(w_t\)` - `\(E(w_t)=0\)` para todo `\(t\)`. - $$ \gamma_w(t,t+h)=\left\lbrace `\begin{aligned} \sigma_w^2, & & h = 0 \\ 0, & & h \neq 0, \end{aligned}` \right. $$ Entonces, `\(w_t\)` es estacionario. --- ### Ejemplo 2 - Considere el ejemplo de medias móviles: `\(v_t=\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1})\)` - La función de autocovariancia es definida por `\(\gamma_v(t,t+h)=Cov(v_{t},v_{t+h})\)` - Caso 1 `\((h=0)\)`: `\(\gamma_v(t,t+0)=Cov(v_{t},v_{t+0})=Var(v_t)\)` `\(=\frac{1}{9}Var(w_{t-1}+w_{t}+w_{t+1})=\frac{3}{9} Var(w_t)=\frac{1}{3} \sigma_w^2.\)` - Caso 2 `\((h=1)\)`: `\(\gamma_v(t,t+1)=Cov(v_{t},v_{t+1})\)` `\(=Cov\left[\frac{1}{3}(w_{t-1}+w_{t}+w_{t+1}),\frac{1}{3}(w_{t}+w_{t+1}+w_{t+2})\right]\)` `\(=\frac{1}{9}\left[ Cov(w_{t},w_{t})+Cov(w_{t+1},w_{t+1}) \right]\)` `\(=\frac{2}{9}\sigma_w^2\)` - Caso 3 `\((h=-1)\)`: Similarmente se obtiene `\(\gamma_v(t,t-1)=\frac{2}{9}\sigma_w^2\)` --- ### Ejemplo 2 - Caso 4 `\((h=2~o~h=-2)\)`: `\(\gamma_v(t,t+2)=\gamma_v(t,t-2)=\frac{1}{9}\sigma_w^2\)` - Caso 5 `\((h>2~o~h<-2)\)`: `\(\gamma_v(t,t+h)=0.\)` Entonces, $$ \gamma_w(t,t+h)=\left\lbrace `\begin{aligned} \frac{3}{9}\sigma_w^2, & & h = 0 \\ \frac{2}{9}\sigma_w^2, & & |h| = 1 \\ \frac{1}{9}\sigma_w^2, & & |h| = 2 \\ 0, & & |h| > 2, \end{aligned}` \right. $$ --- ### Ejemplo 2 La función de autocorrelación: $$ \rho_w(t,t+h)=\left\lbrace `\begin{aligned} 1, & & h = 0 \\ \frac{2}{3}, & & |h| = 1 \\ \frac{1}{3}, & & |h| = 2 \\ 0, & & |h| > 2, \end{aligned}` \right. $$ Se conculye que `\(v_t\)` es débilmente estacionario ya que la media es constante y `\(\gamma_v(t,t+h)=\gamma_v(h)\)` depende solamente de `\(h\)`. --- ### Próximo tema ### Análisis exploratorio de series de tiempo. Introducción a R. --- class: center, middle ## Thanks! Slides created via the R package [**xaringan**](https://github.com/yihui/xaringan). The chakra comes from [remark.js](https://remarkjs.com), [**knitr**](http://yihui.org/knitr), and [R Markdown](https://rmarkdown.rstudio.com).