Estadística Media Móvil Autorregressiva
Stata: Análisis de datos y análisis de series de tiempo de software estadístico usando Stata Este curso revisa métodos para el análisis de series de tiempo y muestra cómo realizar el análisis con Stata. El curso abarca métodos para la gestión de datos, estimación, selección de modelos, pruebas de hipótesis e interpretación. Para los problemas univariados, el curso abarca modelos de media móvil autorregresiva (ARMA), filtros lineales, modelos de memoria larga, modelos de componentes no observados y modelos generalizados autoregresivos condicionalmente heterocedásticos (GARCH). Para los problemas multivariantes, el curso abarca modelos vectoriales autorregresivos (VAR), cointegrando modelos VAR, modelos de espacio de estado, modelos de factores dinámicos y modelos GARCH multivariantes. Los ejercicios complementarán las conferencias y los ejemplos de Stata. Ofrecemos un descuento de 15 para inscripciones en grupo de tres o más participantes. Una revisión rápida de los elementos básicos del análisis de series de tiempo Gestión y resumen de datos de series temporales Modelos univariados Modelos ARMA de media móvil y autoregresivos Modelos ARMA estacionarios para datos no estacionarios Modelos estacionales multiplicativos Tendencias deterministas versus estocásticas Modelos autoregresivos condicionalmente heteroscedásticos Media móvil Modelo Pruebas para rupturas estructurales Nuevos modelos de conmutación de Markov Nueva Introducción a la predicción en Stata Filters Filtros lineales Una introducción rápida al dominio de la frecuencia El modelo univariante de los componentes no observados Modelos multivariantes Modelos vectoriales autorregresivos Un modelo para cointegrar variables Modelos espacio-estado Respuesta impulsiva y análisis de descomposición de varianza Nuevos modelos de factores dinámicos GARCH multivariable Una familiaridad general con Stata y un curso de posgrado en análisis de regresión o experiencia comparable.11.2: Modelos vectoriales autoregresivos Modelos VAR (p) Los modelos VAR (modelos vectoriales autorregresivos) se utilizan para series temporales multivariadas. La estructura es que cada variable es una función lineal de rezagos pasados de sí mismo y rezagos pasados de las otras variables. Como ejemplo, supongamos que medimos tres variables de series temporales diferentes, denotadas por (x), (x) y (x). El modelo vectorial autorregresivo de orden 1, denominado VAR (1), es el siguiente: Cada variable es una función lineal de los valores de retardo 1 para todas las variables del conjunto. En un modelo VAR (2), los valores de retraso 2 para todas las variables se añaden a los lados derechos de las ecuaciones, En el caso de tres x-variables (o series temporales) habría seis predictores en el lado derecho de cada ecuación , Tres términos de retraso 1 y tres plazos de retraso 2. En general, para un modelo VAR (p), los primeros p lags de cada variable en el sistema se utilizarían como predictores de regresión para cada variable. Los modelos VAR son un caso específico de los modelos VARMA más generales. Los modelos VARMA para series temporales multivariadas incluyen la estructura VAR arriba, junto con términos de media móvil para cada variable. De manera más general aún, se trata de casos especiales de modelos ARMAX que permiten la adición de otros predictores que están fuera del conjunto multivariado de interés principal. Aquí, como en la Sección 5.8 del texto, se centran bien en los modelos VAR. En la página 304, los autores se ajustan al modelo de la forma mathbf t Gamma mathbf t phi matemática mathbf t donde (mathbf t (1, t)) incluye términos para ajustar simultáneamente la constante y la tendencia. Se originó a partir de datos macroeconómicos en los que grandes cambios en los datos afectan permanentemente al nivel de la serie. Hay una diferencia no tan sutil aquí de las lecciones anteriores en que ahora estamos adaptando un modelo a los datos que no necesitan estar estacionarios. En las versiones anteriores del texto, los autores separaron la tendencia de cada serie usando una regresión lineal con t, el índice de tiempo, como la variable predictora. Los valores desestructurados para cada una de las tres series son los residuos de esta regresión lineal en t. La de-tendencia es útil conceptualmente porque quita la fuerza de dirección común que el tiempo puede tener en cada serie y ha creado stationarity como hemos visto en lecciones pasadas. Este enfoque da como resultado coeficientes similares, aunque ligeramente diferentes, ya que ahora estamos ajustando simultáneamente la intersección y la tendencia conjunta en un modelo OLS multivariado. La biblioteca R vars creada por Bernhard Pfaff tiene la capacidad de adaptarse a este modelo con tendencia. Veamos dos ejemplos: un modelo estacionario de diferencia y un modelo estacionario de tendencia. Diferencia - modelo estacionario El ejemplo 5.10 del texto es un modelo estacionario de diferencia en que las primeras diferencias son estacionarias. Debe examinar el código y el ejemplo del texto ajustando el modelo anterior: install. packages (vars) Si no está ya instalado install. packages (astsa) Si no está ya instalado biblioteca (vars) biblioteca (astsa) x cbind (cmort, tempr, Parte) plot. ts (x, main, xlab) resumen (VAR (x, p1, typeboth)) Los dos primeros comandos cargan los comandos necesarios de la biblioteca vars y los datos necesarios de nuestra biblioteca de textos. El comando cbind crea un vector de variables de respuesta (un paso necesario para las respuestas multivariantes). El comando VAR hace la estimación de los modelos AR usando mínimos cuadrados ordinarios, mientras que simultáneamente se ajusta a la tendencia, el intercepto y el modelo ARIMA. El argumento p 1 solicita una estructura AR (1) y ambos se ajustan a la constante ya la tendencia. Con el vector de respuestas, es realmente un VAR (1). A continuación se muestra la salida del comando VAR para la variable tempr (el texto proporciona la salida para cmort): Los coeficientes para una variable se muestran en la columna Estimar. El archivo .11 adjunto a cada nombre de variable indica que son variables de retardo 1. Usando la notación T la temperatura, ttime (recogida semanalmente), la tasa de mortalidad M, y la contaminación de P, la ecuación de la temperatura es el sombrero t 73.286 0.014 t 0,465 M - 0,361 T 0,099 P La ecuación para la contaminación es t 67,464 - 0,005 t - 0,125 M - 0,477 T 0,581 P. La matriz de covarianza de los residuos del VAR (1) para las tres variables se imprime por debajo de los resultados de la estimación. Las varianzas están en la diagonal y podrían usarse para comparar este modelo con VARs de orden superior. El determinante de esa matriz se utiliza en el cálculo de la estadística BIC que puede utilizarse para comparar el ajuste del modelo con el ajuste de otros modelos (véanse las fórmulas 5.89 y 5.90 del texto). Para más referencias sobre esta técnica véase Análisis de series temporales integradas y co-integradas con R por Pfaff y también Campbell y Perron 1991. En el Ejemplo 5.11 en la página 307, los autores dan resultados para un modelo VAR (2) para los datos de tasa de mortalidad . En R, se puede ajustar el modelo VAR (2) con el resumen de comandos (VAR (x, p2, typeboth)) La salida, tal como se muestra en el comando VAR, es la siguiente: Nuevamente, los coeficientes de una variable particular se listan en La columna Estimar. A modo de ejemplo, la ecuación estimada para la temperatura es la siguiente: 49.88 - .005 t - 0.109 M 0.261 T 0.051 P - 0.041 M 0.356 T 0.095 P Discutiremos estadísticas de criterios de información para comparar modelos VAR de diferentes órdenes en la tarea. Residuos también están disponibles para su análisis. Por ejemplo, si asignamos el comando VAR a un objeto titulado fitvar2 en nuestro programa, fitvar2 VAR (x, p2, typeboth) entonces tenemos acceso a los residuos de matriz (fitvar2). Esta matriz tendrá tres columnas, una columna de residuos para cada variable. Por ejemplo, podríamos usar para ver la ACF de los residuos para la tasa de mortalidad después de ajustar el modelo VAR (2). La siguiente es la ACF que resultó de la orden que acabamos de describir. Se ve bien para un ACF residual. (El punto grande al principio es la correlación sin importancia de retraso 0). Los dos comandos siguientes crearán ACFs para los residuos de las otras dos variables. También se parecen al ruido blanco. Podemos también examinar estas parcelas en la matriz de correlación cruzada proporcionada por acf (residuales (fitvar2)): Las gráficas a lo largo de la diagonal son las ACFs individuales para cada modelo de residuales que acabamos de comentar anteriormente. Además, ahora vemos las gráficas de correlación cruzada de cada conjunto de residuos. Idealmente, estos también se asemejarían al ruido blanco, sin embargo, vemos correlaciones cruzadas restantes, especialmente entre la temperatura y la contaminación. Como señalan nuestros autores, este modelo no capta adecuadamente la asociación completa entre estas variables en el tiempo. Modelo Trend-Estacionario Permite explorar un ejemplo donde los datos originales están estacionarios y examinar el código VAR ajustando el modelo anterior con una constante y una tendencia. Usando R, simulamos n 500 valores de muestra usando el modelo VAR (2) Usando el comando VAR explicado anteriormente: y1scan (var2daty1.dat) y2scan (var2daty2.dat) resumen (VAR (cbind (y1, y2), p2, typeboth) ) Se obtiene la siguiente salida: Las estimaciones son muy cercanas a los coeficientes simulados y la tendencia no es significativa, como se esperaba. Para los datos estacionarios, cuando no es necesario desviar, también puede usar el comando ar. ols para ajustar un modelo VAR: fitvar2 ar. ols (cbind (y1, y2), order2) En la primera matriz dada, lea a través de una fila para obtener Los coeficientes para una variable. Las comas precedentes, seguidas de 1 o 2, indican si los coeficientes son variables de retraso 1 o de retraso 2, respectivamente. Las intercepciones de las ecuaciones se dan en x. intercept una intercepción por variable. La matriz bajo var. pred da la matriz de varianza-covarianza de los residuos de la VAR (2) para las dos variables. Las varianzas están en la diagonal y podrían utilizarse para comparar este modelo con VARs de orden superior como se ha indicado anteriormente. Los errores estándar de los coeficientes AR son dados por el comando fitvar2asy. se. coef. La salida es Como con los coeficientes, lee a través de filas. La primera fila da los errores estándar de los coeficientes para las variables del retraso 1 que predicen y1. La segunda fila da los errores estándar para los coeficientes que predicen y2. Puede observar que los coeficientes están cerca de la orden VAR excepto la intercepción. Esto se debe a que ar. ols estima el modelo para x-media (x). Para coincidir con la intercepción proporcionada por el comando summary (VAR (cbind (y1, y2), p2, typeconst)), debe calcular la intercepción de la siguiente manera: En nuestro ejemplo, la intercepción para el modelo simulado para yt, 1 es igual a -0.043637 -2.733607 (1-0.29300.4523) 15.45479 (-0.1913-0.6365) 9.580768, y la ecuación estimada para yt, 1 Estimación con Minitab Para los usuarios de Minitab, está el flujo general de qué hacer. Lea los datos en columnas. Utilice la serie temporal gt Lag para crear las columnas retrasadas necesarias de los valores estacionarios. Utilizar Stat gt ANOVA gt General MANOVA. Introduzca la lista de variables de tiempo presentes como variables de respuesta. Introduzca las variables x retrasadas como covariables (y como el modelo). Haga clic en Resultados y seleccione Análisis univariado (para ver los coeficientes de regresión estimados para cada ecuación). Si lo desea, haga clic en Almacenamiento y seleccione Residuales y / o Ajustes. Navegación Hay una serie de enfoques para el modelado de series de tiempo. Describimos algunos de los enfoques más comunes a continuación. Tendencia, Descomposiciones Estacionales, Residuales Un enfoque consiste en descomponer las series temporales en un componente de tendencia, estacional y residual. El triple alisado exponencial es un ejemplo de este enfoque. Otro ejemplo, denominado loess estacional, se basa en mínimos cuadrados ponderados localmente y es discutido por Cleveland (1993). No discutimos el loess estacional en este manual. Métodos basados en la frecuencia Otro enfoque, comúnmente utilizado en aplicaciones científicas y de ingeniería, es analizar las series en el dominio de la frecuencia. Un ejemplo de este enfoque en el modelado de un conjunto de datos de tipo sinusoidal se muestra en el estudio de caso de deflexión de haz. La gráfica espectral es la principal herramienta para el análisis de frecuencia de series temporales. Modelos autoregresivos (AR) Un modelo común para el modelado de series temporales univariadas es el modelo autorregresivo (AR): Xt delta phi1 X phi2 X cdots phip X En, donde (Xt) es la serie temporal, (At) es ruido blanco y delta Izquierda (1 - sum p phii derecha) mu. Con (mu) denotando la media del proceso. Un modelo autorregresivo es simplemente una regresión lineal del valor actual de la serie contra uno o más valores previos de la serie. El valor de (p) se denomina el orden del modelo AR. Los modelos AR pueden ser analizados con uno de varios métodos, incluyendo técnicas lineales lineales por mínimos cuadrados. También tienen una interpretación directa. Modelos de media móvil (MA) Otro enfoque común para el modelado de modelos de series de tiempo univariados es el modelo de media móvil (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, donde (Xt) es la serie temporal ) Es la media de la serie, (A) son términos de ruido blanco, y (theta1,, ldots,, thetaq) son los parámetros del modelo. El valor de (q) se llama el orden del modelo MA. Es decir, un modelo de media móvil es conceptualmente una regresión lineal del valor actual de la serie contra el ruido blanco o choques aleatorios de uno o más valores anteriores de la serie. Se supone que los choques aleatorios en cada punto provienen de la misma distribución, normalmente una distribución normal, con ubicación a cero y escala constante. La distinción en este modelo es que estos choques aleatorios se propagan a los valores futuros de las series temporales. El ajuste de las estimaciones de MA es más complicado que con los modelos de AR porque los términos de error no son observables. Esto significa que los procedimientos de ajuste no lineales iterativos deben ser usados en lugar de mínimos cuadrados lineales. Los modelos MA también tienen una interpretación menos obvia que los modelos AR. A veces, el ACF y PACF sugieren que un modelo de MA sería una mejor elección de modelo y, a veces, ambos AR y MA términos se deben utilizar en el mismo modelo (véase la Sección 6.4.4.5). Tenga en cuenta, sin embargo, que los términos de error después de que el modelo sea apropiado deberían ser independientes y seguir las suposiciones estándar para un proceso univariante. Box y Jenkins popularizaron un enfoque que combina el promedio móvil y los enfoques autorregresivos en el libro Análisis de series temporales: previsión y control (Box, Jenkins y Reinsel, 1994). Aunque tanto los enfoques de media móvil como autoregresivos ya eran conocidos (y fueron investigados originalmente por Yule), la contribución de Box y Jenkins fue desarrollar una metodología sistemática para identificar y estimar modelos que pudieran incorporar ambos enfoques. Esto hace que los modelos de Box-Jenkins sean una clase poderosa de modelos. Las siguientes secciones discutirán estos modelos en detalle.
Comments
Post a Comment