Introdução a ARIMA: modelos não-sazonais: equação de previsão ARIMA (p, d, q): os modelos ARIMA são, na teoria, a classe mais geral de modelos para prever uma série de tempo que pode ser feita para ser 8220stação2008 por diferenciação (se necessário), talvez Em conjunto com transformações não-lineares, como log ou desinflando (se necessário). Uma variável aleatória que é uma série temporal é estacionária se suas propriedades estatísticas são todas constantes ao longo do tempo. Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ela muda de forma consistente. Isto é, seus padrões de tempo aleatório de curto prazo sempre parecem os mesmos em um sentido estatístico. A última condição significa que suas autocorrelações (correlações com seus próprios desvios anteriores da média) permanecem constantes ao longo do tempo, ou de forma equivalente, que seu espectro de potência permanece constante ao longo do tempo. Uma variável aleatória deste formulário pode ser visualizada (como de costume) como uma combinação de sinal e ruído, e o sinal (se um é aparente) pode ser um padrão de reversão média rápida ou lenta, ou oscilação sinusoidal, ou alternância rápida no signo , E também poderia ter um componente sazonal. Um modelo ARIMA pode ser visto como um 8220filter8221 que tenta separar o sinal do ruído, e o sinal é então extrapolado para o futuro para obter previsões. A equação de previsão de ARIMA para uma série de tempo estacionária é uma equação linear (isto é, regressão) em que os preditores consistem em atrasos da variável dependente e / ou atrasos dos erros de previsão. Isto é: valor previsto de Y uma constante e / ou uma soma ponderada de um ou mais valores recentes de Y e / ou uma soma ponderada de um ou mais valores recentes dos erros. Se os preditores consistem apenas em valores atrasados de Y. é um modelo autoregressivo puro (8220 self-regressed8221), que é apenas um caso especial de um modelo de regressão e que poderia ser equipado com um software de regressão padrão. Por exemplo, um modelo autoregressivo de primeira ordem (8220AR (1) 8221) para Y é um modelo de regressão simples no qual a variável independente é apenas Y rezagada por um período (LAG (Y, 1) em Statgraphics ou YLAG1 em RegressIt). Se alguns dos preditores são atrasos nos erros, um modelo ARIMA não é um modelo de regressão linear, porque não existe nenhuma maneira de especificar o erro 8222 do último erro82221 como uma variável independente: os erros devem ser computados numa base de período a período Quando o modelo é ajustado para os dados. Do ponto de vista técnico, o problema com o uso de erros atrasados como preditores é que as previsões do modelo8217s não são funções lineares dos coeficientes. Mesmo que sejam funções lineares dos dados passados. Assim, os coeficientes nos modelos ARIMA que incluem erros atrasados devem ser estimados por métodos de otimização não-linear (8220hill-climbing8221) ao invés de apenas resolver um sistema de equações. O acrônimo ARIMA significa Auto-Regressive Integrated Moving Average. Lags da série estacionada na equação de previsão são chamados quota de termos degressivos, os atrasos dos erros de previsão são chamados quotmoving termos de média, e uma série de tempo que precisa ser diferenciada para ser estacionada é uma versão quotintegratedquot de uma série estacionária. Modelos de caminhada aleatória e tendência aleatória, modelos autoregressivos e modelos de suavização exponencial são todos os casos especiais de modelos ARIMA. Um modelo ARIMA não-sazonal é classificado como um quot de quotARIMA (p, d, q), onde: p é o número de termos autorregressivos, d é o número de diferenças não-sazonais necessárias para a estacionaridade e q é o número de erros de previsão atrasados em A equação de predição. A equação de previsão é construída da seguinte forma. Primeiro, digamos a d ª diferença de Y. o que significa: Observe que a segunda diferença de Y (o caso d2) não é a diferença de 2 períodos atrás. Em vez disso, é a primeira diferença de primeira diferença. Que é o análogo discreto de uma segunda derivada, isto é, a aceleração local da série em vez da sua tendência local. Em termos de y. A equação geral de previsão é: Aqui, os parâmetros de média móvel (9528217s) são definidos de modo que seus sinais são negativos na equação, seguindo a convenção introduzida por Box e Jenkins. Alguns autores e software (incluindo a linguagem de programação R) os definem para que eles tenham sinais de mais. Quando os números reais estão conectados à equação, não há ambigüidade, mas é importante saber qual a convenção que seu software usa quando você está lendo a saída. Muitas vezes, os parâmetros são indicados por AR (1), AR (2), 8230 e MA (1), MA (2), 8230 etc. Para identificar o modelo ARIMA apropriado para Y. você começa por determinar a ordem de diferenciação (D) necessidade de estacionar a série e remover as características brutas da sazonalidade, talvez em conjunto com uma transformação estabilizadora de variância, como o registro ou a desinflação. Se você parar neste ponto e prever que a série diferenciada é constante, você ajustou apenas uma caminhada aleatória ou modelo de tendência aleatória. No entanto, a série estacionada ainda pode ter erros autocorrelacionados, sugerindo que alguns números de AR (p 8805 1) e / ou alguns termos de MA de número (q 8805 1) também são necessários na equação de previsão. O processo de determinação dos valores de p, d e q que são melhores para uma determinada série de tempo será discutido em seções posteriores das notas (cujos links estão no topo desta página), mas uma visualização de alguns tipos Os modelos ARIMA não-sazonais que são comumente encontrados são dados abaixo. Modelo autoregressivo de primeira ordem ARIMA (1,0,0): se a série estiver estacionada e autocorrelada, talvez ela possa ser predita como um múltiplo de seu próprio valor anterior, além de uma constante. A equação de previsão neste caso é 8230, que é regredida por si mesmo atrasada por um período. Este é um modelo 8220ARIMA (1,0,0) constante8221. Se a média de Y for zero, então o termo constante não seria incluído. Se o coeficiente de inclinação 981 1 for positivo e menor que 1 em magnitude (deve ser inferior a 1 em magnitude se Y estiver estacionário), o modelo descreve o comportamento de reversão média em que o valor do período 8217 seguinte deve ser previsto 981 1 vezes como Muito longe da média, já que esse valor do período é de $ 127. Se 981 1 for negativo, ele prevê um comportamento de reversão média com alternância de sinais, ou seja, ele também prevê que Y estará abaixo do período médio seguinte se estiver acima da média desse período. Em um modelo autoregressivo de segunda ordem (ARIMA (2,0,0)), haveria um termo Y t-2 também à direita e assim por diante. Dependendo dos sinais e das magnitudes dos coeficientes, um modelo ARIMA (2,0,0) pode descrever um sistema cuja reversão média ocorre de forma sinusoidalmente oscilante, como o movimento de uma massa em uma mola sujeita a choques aleatórios . ARIMA (0,1,0) caminhada aleatória: se a série Y não estiver estacionária, o modelo mais simples possível para ele é um modelo de caminhada aleatória, que pode ser considerado como um caso limitante de um modelo AR (1) no qual o autorregressivo O coeficiente é igual a 1, ou seja, uma série com reversão média infinitamente lenta. A equação de predição para este modelo pode ser escrita como: onde o termo constante é a mudança média do período para o período (ou seja, a derivação de longo prazo) em Y. Esse modelo poderia ser ajustado como um modelo de regressão sem intercepção em que o A primeira diferença de Y é a variável dependente. Uma vez que inclui (apenas) uma diferença não-sazonal e um termo constante, ela é classificada como um modelo quotARIMA (0,1,0) com constante. quot O modelo random-walk-without-drift seria um ARIMA (0,1, 0) modelo sem modelo ARADA constante (1,1,0) diferenciado do modelo autoregressivo de primeira ordem: se os erros de um modelo de caminhada aleatória forem autocorrelacionados, talvez o problema possa ser corrigido adicionando um atraso da variável dependente à equação de predição - - é Regressando a primeira diferença de Y em si mesma atrasada por um período. Isso produziria a seguinte equação de predição: que pode ser rearranjada para Este é um modelo autoregressivo de primeira ordem com uma ordem de diferenciação não-sazonal e um termo constante - ou seja. Um modelo ARIMA (1,1,0). ARIMA (0,1,1) sem alisamento exponencial simples constante: Outra estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples. Lembre-se de que, para algumas séries temporais não estacionárias (por exemplo, que exibem flutuações ruidosas em torno de uma média variando lentamente), o modelo de caminhada aleatória não funciona, bem como uma média móvel de valores passados. Em outras palavras, ao invés de tomar a observação mais recente como a previsão da próxima observação, é melhor usar uma média das últimas observações para filtrar o ruído e, com mais precisão, estimar a média local. O modelo de suavização exponencial simples usa uma média móvel ponderada exponencialmente de valores passados para alcançar esse efeito. A equação de predição para o modelo de suavização exponencial simples pode ser escrita em várias formas matematicamente equivalentes. Um dos quais é o chamado formulário 8220error correction8221, no qual a previsão anterior é ajustada na direção do erro que ele fez: porque e t-1 Y t-1 - 374 t-1 por definição, isso pode ser reescrito como : Que é uma equação de previsão ARIMA (0,1,1) sem constante constante com 952 1 1 - 945. Isso significa que você pode ajustar um alisamento exponencial simples especificando-o como um modelo ARIMA (0,1,1) sem Constante e o coeficiente estimado de MA (1) corresponde a 1-menos-alfa na fórmula SES. Lembre-se de que, no modelo SES, a idade média dos dados nas previsões de 1 período anterior é 1/945, o que significa que tenderão a atrasar as tendências ou os pontos de viragem em cerca de 1/945 períodos. Segue-se que a idade média dos dados nas previsões de 1 período de um ARIMA (0,1,1) - sem modelo constante é 1 / (1 - 952 1). Assim, por exemplo, se 952 1 0.8, a idade média é 5. Como 952 1 aborda 1, o modelo ARIMA (0,1,1) sem modelo constante torna-se uma média móvel de muito longo prazo e, como 952 1 Aproxima-se de 0, torna-se um modelo de caminhada aleatória sem drift. O que é a melhor maneira de corrigir a autocorrelação: adicionar termos AR ou adicionar termos MA Nos dois modelos anteriores discutidos acima, o problema dos erros auto-correlacionados em um modelo de caminhada aleatória foi reparado de duas formas diferentes: adicionando um valor atrasado da série diferenciada Para a equação ou adicionando um valor atrasado do erro de previsão. Qual abordagem é melhor Uma regra de ouro para esta situação, que será discutida com mais detalhes mais adiante, é que a autocorrelação positiva geralmente é melhor tratada adicionando um termo AR ao modelo e a autocorrelação negativa geralmente é melhor tratada adicionando um Termo MA. Nas séries temporais de negócios e econômicas, a autocorrelação negativa surge frequentemente como um artefato de diferenciação. (Em geral, a diferenciação reduz a autocorrelação positiva e pode até causar uma mudança de autocorrelação positiva para negativa). Assim, o modelo ARIMA (0,1,1), no qual a diferenciação é acompanhada por um termo MA, é mais usado do que um Modelo ARIMA (1,1,0). ARIMA (0,1,1) com alisamento exponencial constante e constante: ao implementar o modelo SES como modelo ARIMA, você realmente ganha alguma flexibilidade. Em primeiro lugar, o coeficiente estimado de MA (1) pode ser negativo. Isso corresponde a um fator de alisamento maior do que 1 em um modelo SES, que geralmente não é permitido pelo procedimento de montagem do modelo SES. Em segundo lugar, você tem a opção de incluir um termo constante no modelo ARIMA, se desejar, para estimar uma tendência média não-zero. O modelo ARIMA (0,1,1) com constante tem a equação de previsão: as previsões de um período anteriores deste modelo são qualitativamente similares às do modelo SES, exceto que a trajetória das previsões de longo prazo é tipicamente uma Linha inclinada (cuja inclinação é igual a mu) em vez de uma linha horizontal. ARIMA (0,2,1) ou (0,2,2) sem alisamento exponencial linear constante: modelos de alisamento exponencial linear são modelos ARIMA que utilizam duas diferenças não-sazonais em conjunto com os termos MA. A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma atrasada por dois períodos, mas é a primeira diferença da primeira diferença - isto é. A mudança de mudança de Y no período t. Assim, a segunda diferença de Y no período t é igual a (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. Uma segunda diferença de uma função discreta é análoga a uma segunda derivada de uma função contínua: mede a quotaccelerationquot ou quotcurvaturequot na função em um determinado ponto no tempo. O modelo ARIMA (0,2,2) sem constante prediz que a segunda diferença da série é igual a uma função linear dos dois últimos erros de previsão: o que pode ser rearranjado como: onde 952 1 e 952 2 são o MA (1) e MA (2) coeficientes. Este é um modelo de suavização exponencial linear geral. Essencialmente o mesmo que o modelo Holt8217s, e o modelo Brown8217s é um caso especial. Ele usa médias móveis exponencialmente ponderadas para estimar um nível local e uma tendência local na série. As previsões de longo prazo deste modelo convergem para uma linha reta cuja inclinação depende da tendência média observada no final da série. ARIMA (1,1,2) sem alisamento exponencial linear constante de tendência amortecida. Este modelo está ilustrado nos slides que acompanham os modelos ARIMA. Ele extrapola a tendência local no final da série, mas acha-se em horizontes de previsão mais longos para introduzir uma nota de conservadorismo, uma prática que tem suporte empírico. Veja o artigo em quotPor que a Tendência Damped funciona por Gardner e McKenzie e o artigo de QuotGolden Rulequot de Armstrong et al. para detalhes. Em geral, é aconselhável manter os modelos em que pelo menos um de p e q não é maior do que 1, ou seja, não tente se ajustar a um modelo como o ARIMA (2,1,2), pois isso provavelmente levará a uma superposição E quotcommon-factorquot questões que são discutidas em mais detalhes nas notas sobre a estrutura matemática dos modelos ARIMA. Implementação da planilha: os modelos ARIMA, como os descritos acima, são fáceis de implementar em uma planilha eletrônica. A equação de predição é simplesmente uma equação linear que se refere a valores passados de séries temporais originais e valores passados dos erros. Assim, você pode configurar uma planilha de previsão ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os erros (dados menos previsões) na coluna C. A fórmula de previsão em uma célula típica na coluna B seria simplesmente Uma expressão linear que se refere a valores nas linhas precedentes das colunas A e C, multiplicadas pelos coeficientes AR ou MA adequados armazenados em células em outro lugar na planilha. Modelos ARIMA sazonais gerais: (0,1,1) x (0,1,1 ) Etc. Esboço da modelagem ARIMA sazonal: a parte sazonal de um modelo ARIMA tem a mesma estrutura que a parte não sazonal: pode ter um fator AR, um fator MA e / ou uma ordem de diferenciação. Na parte sazonal do modelo, todos esses fatores operam em múltiplos de lag s (o número de períodos em uma estação). Um modelo ARIMA sazonal é classificado como um modelo ARIMA (p, d, q) x (P, D, Q), onde Pnumber de termos autorregressivos sazonais (SAR), Dnúmero de diferenças sazonais, termos Qnumber de média móvel sazonal (SMA) Ao identificar um modelo sazonal, o primeiro passo é determinar se é necessária ou não uma diferença sazonal, além de ou talvez em vez de uma diferença não sazonal. Você deve olhar para séries de séries temporais e parcelas ACF e PACF para todas as combinações possíveis de 0 ou 1 diferença não sazonal e 0 ou 1 diferença sazonal. Cuidado: nunca utilize mais de uma diferença sazonal, nem mais de DUAS diferenças totais (sazonal e não sazonal). Se o padrão sazonal é forte e estável ao longo do tempo (por exemplo, alto no verão e baixo no inverno, ou vice-versa), então você provavelmente deve usar uma diferença sazonal, independentemente de usar uma diferença não sazonal, já que isso Evite que o padrão sazonal seja superado nas previsões de longo prazo. Vamos adicionar isso à nossa lista de regras para identificar modelos. Regra 12: Se a série tiver um padrão sazonal forte e consistente, você deve usar uma ordem de diferenciação sazonal - mas nunca use mais do que uma ordem de diferenciação sazonal ou mais de 2 Ordens de diferenciação total (seasonalnonseasonal). A assinatura do SAR puro ou comportamento SMA puro é semelhante à assinatura de AR puro ou comportamento de MA puro, exceto que o padrão aparece em múltiplos de atraso na ACF e PACF. Por exemplo, um processo puro de SAR (1) tem picos no ACF em atrasos s, 2s, 3s, etc., enquanto o PACF corta após o atraso s. Por outro lado, um processo puro de SMA (1) tem picos no PACF em atrasos s, 2s, 3s, etc., enquanto o ACF corta após o atraso. Normalmente, uma assinatura de SAR ocorre quando a autocorrelação no período sazonal é positiva, enquanto que uma assinatura de SMA geralmente ocorre quando a autocorrelação sazonal é negativa. Daí: Regra 13: Se a autocorrelação no período sazonal é positiva. Considere adicionar um termo SAR ao modelo. Se a autocorrelação no período sazonal é negativa. Considere adicionar um termo SMA ao modelo. Tente evitar misturar os termos SAR e SMA no mesmo modelo, e evite usar mais do que um de qualquer tipo. Geralmente, um termo SAR (1) ou SMA (1) é suficiente. Você raramente encontrará um processo genuíno SAR (2) ou SMA (2), e ainda mais raramente tem dados suficientes para estimar 2 ou mais coeficientes sazonais sem o algoritmo de estimação entrar em um loop quotfeedback. Embora um modelo ARIMA sazonal pareça ter Apenas alguns parâmetros, lembre-se de que o backforecast exige a estimativa de uma ou duas estações de parâmetros implícitos para inicializá-lo. Portanto, você deve ter pelo menos 4 ou 5 temporadas de dados para se adequar a um modelo ARIMA sazonal. Provavelmente, o modelo ARIMA sazonal mais usado é o modelo (0,1,1) x (0,1,1) - isto é. Um modelo MA (1) xSMA (1) com uma diferença sazonal e não sazonal. Este é essencialmente um modelo de alocamento exponencial quotseasonal. Quando os modelos ARIMA sazonais são instalados em dados registrados, eles são capazes de rastrear um padrão sazonal multiplicativo. Exemplo: série AUTOSALE revisitada Lembre-se de que prevemos a série de vendas automáticas de varejo usando uma combinação de deflação, ajuste sazonal e suavização exponencial. Vamos agora tentar montar a mesma série com os modelos ARIMA sazonais, usando a mesma amostra de dados de janeiro de 1970 a maio de 1993 (281 observações). Como antes, trabalharemos com vendas automáticas deflacionadas - ou seja. Usaremos a série AUTOSALE / CPI como variável de entrada. Aqui estão as séries da série temporal e os gráficos ACF e PACF da série original, que são obtidos no procedimento de Previsão, traçando o quotresidual de um modelo ARIMA (0,0,0) x (0,0,0) com constante: O Quotsuspension bridgequot padrão na ACF é típico de uma série que é não estacionária e fortemente sazonal. Claramente precisamos de pelo menos uma ordem de diferenciação. Se tomarmos uma diferença não sazonal, as parcelas correspondentes são as seguintes: a série diferenciada (os resíduos de um modelo de caminhada com crescimento aleatório) parece mais ou menos estacionária, mas ainda há autocorrelação muito forte no período sazonal (Lag 12). Como o padrão sazonal é forte e estável, sabemos (da Regra 12) que queremos usar uma ordem de diferenciação sazonal no modelo. Aqui está o aspecto da imagem após uma diferença sazonal (apenas): a série estacionalmente diferenciada mostra um padrão muito forte de autocorrelação positiva, como lembramos da nossa tentativa anterior de se ajustar a um modelo de caminhada aleatória sazonal. Esta poderia ser uma assinatura de quotAR - ou poderia sinalizar a necessidade de outra diferença. Se tomarmos uma diferença sazonal e não sazonal, obtêm-se os seguintes resultados: estes são, obviamente, os resíduos do modelo de tendência aleatória sazonal que ajustamos nos dados de vendas de automóveis anteriormente. Agora vemos os sinais reveladores de overdifferencing suave. Os pontos positivos na ACF e no PACF tornaram-se negativos. Qual é a ordem correta de diferenciação Mais uma informação que pode ser útil é um cálculo das estatísticas de erro da série em cada nível de diferenciação. Podemos calculá-los ajustando os modelos ARIMA correspondentes, nos quais apenas as diferenças são usadas: os erros menores, tanto no período de estimação como no período de validação, são obtidos pelo modelo A, que usa uma diferença de cada tipo. Isso, juntamente com a aparência das parcelas acima, sugere fortemente que devemos usar uma diferença sazonal e não-sazonal. Note-se que, exceto o termo constante gratuitivel, o modelo A é o modelo de tendência aleatória sazonal (SRT), enquanto o modelo B é apenas o modelo de caminhada aleatória sazonal (SRW). Como observamos anteriormente, quando comparamos esses modelos, o modelo SRT parece se encaixar melhor do que o modelo SRW. Na análise a seguir, tentaremos melhorar esses modelos através da adição de termos ARIMA sazonais. Voltar ao topo da página. O modelo ARIMA (0,1,1) x (0,1,1) usado com freqüência: modelo SRT mais MA (1) e SMA (1) termos Retornando ao último conjunto de gráficos acima, observe que com uma diferença de Cada tipo existe um pico negativo no ACF no intervalo 1 e também um pico negativo no ACF no intervalo 12. Enquanto o PACF mostra um padrão de quotdecayquot mais gradual na vizinhança de ambos os atrasos. Ao aplicar nossas regras para identificar modelos ARIMA (especificamente, Regra 7 e Regra 13), podemos agora concluir que o modelo SRT seria melhorado pela adição de um termo MA (1) e também um termo SMA (1). Além disso, pela Regra 5, excluímos a constante, uma vez que duas ordens de diferenciação estão envolvidas. Se fizermos tudo isso, obtemos o modelo ARIMA (0,1,1) x (0,1,1). Qual é o modelo ARIMA sazonal mais utilizado. Sua equação de previsão é: onde 952 1 é o coeficiente MA (1) e 920 1 (capital theta-1) é o coeficiente SMA (1). Observe que este é apenas o modelo de tendência aleatória sazonal imaginado adicionando múltiplos dos erros nos laços 1, 12 e 13. Além disso, observe que o coeficiente do erro lag-13 é o produto do MA (1) e SMA (1) coeficientes. Este modelo é conceitualmente semelhante ao modelo Winters na medida em que efetivamente aplica alisamento exponencial ao nível, tendência e sazonalidade ao mesmo tempo, embora funda em bases teóricas mais sólidas, particularmente no que diz respeito ao cálculo de intervalos de confiança para previsões de longo prazo. Suas parcelas residuais neste caso são as seguintes: Embora uma pequena quantidade de autocorrelação permaneça no intervalo 12, a aparência geral das parcelas é boa. Os resultados de montagem do modelo mostram que os coeficientes estimados de MA (1) e SMA (1) (obtidos após 7 iterações) são realmente significativos: as previsões do modelo se assemelham ao modelo de tendência aleatória sazonal, ou seja, Eles retomam o padrão sazonal e a tendência local no final da série - mas eles são um pouco mais suaves na aparência, já que tanto o padrão sazonal como a tendência estão efetivamente sendo promediados (de um jeito de alívio exponencial) ao longo da última Poucas estações: o que esse modelo realmente está fazendo. Você pode pensar nisso da seguinte maneira. Em primeiro lugar, calcula a diferença entre o valor de cada mês8217 e uma média histórica 8220 ponderada exponencialmente 8221 para esse mês que é calculada aplicando alisamento exponencial aos valores que foram observados no mesmo mês em anos anteriores, onde a quantidade de alisamento é determinada pelo SMA (1 ) Coeficiente. Em seguida, aplica um alisamento exponencial simples a essas diferenças para prever o desvio da média histórica que será observada no próximo mês. O valor do coeficiente SMA (1) perto de 1.0 sugere que muitas estações de dados estão sendo usadas para calcular a média histórica de um determinado mês do ano. Lembre-se de que um coeficiente MA (1) em um modelo ARIMA (0,1,1) corresponde a 1-menos-alfa no modelo de suavização exponencial correspondente e que a idade média dos dados em uma previsão do modelo de suavização exponencial é 1 / alfa. O coeficiente SMA (1) tem uma interpretação semelhante em relação às médias entre as estações. Aqui seu valor de 0,91 sugere que a idade média dos dados utilizados para estimar o padrão sazonal histórico é um pouco mais de 10 anos (quase metade do comprimento do conjunto de dados), o que significa que um padrão sazonal quase constante está sendo assumido. O valor muito menor de 0,5 para o coeficiente MA (1) sugere que relativamente pouco alisamento está sendo feito para estimar o desvio atual da média histórica para o mesmo mês, então o próximo mês8217s predito desvio de sua média histórica será próximo aos desvios Da média histórica observada nos últimos meses. O modelo ARIMA (1,0,0) x (0,1,0) com constante: modelo SRW mais AR (1) termo O modelo anterior foi um modelo Seasonal Random Trend (SRT) afinado pela adição de MA ( 1) e SMA (1) coeficientes. Um modelo ARIMA alternativo para esta série pode ser obtido substituindo um termo AR (1) pela diferença não-sazonal, isto é, Adicionando um termo AR (1) ao modelo Seasonally Random Walk (SRW). Isso nos permitirá preservar o padrão sazonal no modelo enquanto reduz a quantidade total de diferenciação, aumentando assim a estabilidade das projeções de tendência se desejado. (Lembre-se de que, com apenas uma diferença sazonal, a série mostrou uma forte assinatura AR (1). Se fizermos isso, obtemos um modelo ARIMA (1,0,0) x (0,1,0) com constante, Que produz os seguintes resultados: O coeficiente AR (1) é realmente altamente significativo, e o RMSE é apenas 2,06, em comparação com 3,00 para o modelo SRW (Modelo B no relatório de comparação acima). A equação de previsão para este modelo é: O termo adicional no lado direito é um múltiplo da diferença sazonal observada no último mês, que tem o efeito de corrigir a previsão do efeito de um ano excepcionalmente ruim ou ruim. Aqui 981 1 denota o coeficiente AR (1), cujo valor estimado é 0,73. Assim, por exemplo, se as vendas no mês passado fossem X dólares antes das vendas um ano antes, então a quantidade 0.73X seria adicionada à previsão para este mês. 956 denota o CONSTANT na equação de previsão, cujo valor estimado é 0,20. O MEAN estimado, cujo valor é 0,75, é o valor médio da série estacionalmente diferenciada, que é a tendência anual nas previsões de longo prazo deste modelo. A constante é (por definição) igual aos tempos médios 1 menos o coeficiente AR (1): 0,2 0,75 (1 8211 0,73). O gráfico de previsão mostra que o modelo realmente faz um trabalho melhor do que o modelo SRW de rastreamento de alterações cíclicas (ou seja, anos invulgarmente bons ou maus): No entanto, o MSE para este modelo ainda é significativamente maior que o que obtivemos para o ARIMA (0, 1,1) x (0,1,1) modelo. Se olharmos para os lotes de resíduos, vemos margem para melhorias. Os resíduos ainda mostram algum sinal de variação cíclica: o ACF eo PACF sugerem a necessidade de coeficientes MA (1) e SMA (1): uma versão melhorada: ARIMA (1,0,1) x (0,1,1) Com constante Se adicionarmos os termos indicados MA (1) e SMA (1) ao modelo anterior, obtemos um modelo ARIMA (1,0,1) x (0,1,1) com constante, cuja equação de previsão é This É quase o mesmo que o modelo ARIMA (0,1,1) x (0,1,1), exceto que ele substitui a diferença não-sazonal por um termo AR (1) (uma diferença quotparcial) e incorpora um termo constante que representa o Tendência a longo prazo. Por isso, esse modelo assume uma tendência mais estável do que o modelo ARIMA (0,1,1) x (0,1,1), e essa é a principal diferença entre eles. Os resultados do ajuste do modelo são os seguintes: Observe que o coeficiente AR (1) estimado (981 1 na equação do modelo) é 0,96, que é muito próximo de 1,0 mas não tão próximo quanto sugerir que ele deve ser substituído Uma primeira diferença: seu erro padrão é 0,02, portanto é cerca de 2 erros padrão de 1,0. As outras estatísticas do modelo (os coeficientes estimados de MA (1) e SMA (1) e as estatísticas de erro nos períodos de estimativa e validação) são, de outro modo, quase idênticos aos do ARIMA (0,1,1) x (0,1 , 1) modelo. (Os coeficientes estimados de MA (1) e SMA (1) são 0,45 e 0,91 neste modelo versus 0,48 e 0,91 no outro.) O MEU estimado de 0,68 é a tendência prevista a longo prazo (aumento anual médio). Este é essencialmente o mesmo valor que foi obtido no modelo (1,0,0) x (0,1,0) com constante. O erro padrão da média estimada é 0,26, portanto a diferença entre 0,75 e 0,68 não é significativa. Se a constante não fosse incluída neste modelo, seria um modelo de tendência amortecida: a tendência em suas previsões a muito longo prazo seria gradualmente achatada. As previsões pontuais deste modelo parecem bastante semelhantes às do modelo (0,1,1) x (0,1,1), porque a tendência média é semelhante à tendência local no final da série. No entanto, os intervalos de confiança para este modelo se ampliam um pouco menos rapidamente devido a sua suposição de que a tendência é estável. Observe que os limites de confiança para as previsões de dois anos seguem agora dentro das linhas da grade horizontal em 24 e 44, enquanto que aqueles do modelo (0,1,1) x (0,1,1) não: ARIMA sazonal Versus suavização exponencial e ajuste sazonal: agora podemos comparar o desempenho dos dois melhores modelos ARIMA contra modelos de suavização exponencial simples e linear acompanhados de ajuste sazonal multiplicativo e o modelo Winters, como mostrado nos slides de previsão com ajuste sazonal: as estatísticas de erro para As previsões de um período de antecedência para todos os modelos são extremamente próximas neste caso. É difícil escolher um 8220winner8221 com base nestes números sozinho. Voltar ao topo da página. Quais são os tradeoffs entre os vários modelos sazonais? Os três modelos que usam o ajuste sazonal multiplicativo tratam da sazonalidade de forma explícita - ou seja. Os índices sazonais são apresentados como uma parte explícita do modelo. Os modelos ARIMA lidam com a sazonalidade de forma mais implícita - não podemos facilmente ver na saída do ARIMA como a média de dezembro, digamos, difere da média de julho. Dependendo se é considerado importante isolar o padrão sazonal, isso pode ser um fator na escolha entre os modelos. Os modelos ARIMA têm a vantagem de que, uma vez que foram inicializados, eles têm menos peças quotmoving que os modelos de suavização e ajuste exponencial e, como tal, podem ser menos propensos a superar os dados. Os modelos ARIMA também possuem uma teoria subjacente mais sólida em relação ao cálculo de intervalos de confiança para previsões de horizonte mais longo que os outros modelos. Existem diferenças mais dramáticas entre os modelos em relação ao comportamento de suas previsões e intervalos de confiança para previsões de mais de 1 período no futuro. É aqui que os pressupostos que são feitos em relação às mudanças na tendência e nos padrões sazonais são muito importantes. Entre os dois modelos ARIMA, um (modelo A) estima uma tendência variável no tempo, enquanto o outro (modelo B) incorpora uma tendência média a longo prazo. (Poderíamos, se desejássemos, aplastar a tendência de longo prazo no modelo B suprimindo o termo constante). Entre os modelos de ajuste exponencial-alisamento-mais-ajuste, um (modelo C) assume uma tendência plana, enquanto o outro ( Modelo D) assume uma tendência variável no tempo. O modelo Winters (E) também assume uma tendência variável no tempo. Os modelos que assumem uma tendência constante são relativamente mais confiantes em suas previsões de longo prazo do que os modelos que não, e isso geralmente se refletirá na medida em que os intervalos de confiança para as previsões se ampliem em horizontes de previsão mais longos. Modelos que não assumem tendências variáveis no tempo geralmente têm intervalos de confiança mais estreitos para previsões de horizonte mais longo, mas mais estreito não é melhor, a menos que essa suposição esteja correta. Os dois modelos de suavização exponencial combinados com o ajuste sazonal assumem que o padrão sazonal permaneceu constante ao longo dos 23 anos na amostra de dados, enquanto os outros três modelos não. Na medida em que o padrão sazonal representa a maior parte da variação mês a mês nos dados, é certo que é preciso prever o que acontecerá vários meses no futuro. Se acredita que o padrão sazonal tenha mudado lentamente ao longo do tempo, outra abordagem seria apenas usar um histórico de dados mais curto para ajustar os modelos que estimam índices sazonais fixos. Para o registro, aqui estão as previsões e 95 limites de confiança para maio de 1995 (24 meses adiante) que são produzidos pelos cinco modelos: as previsões pontuais são realmente surpreendentemente próximas umas das outras, em relação à largura de todos os intervalos de confiança. A previsão do ponto SES é a mais baixa, porque é o único modelo que não assume uma tendência ascendente no final da série. O modelo ARIMA (1,0,1) x (0,1,1) c tem os limites de confiança mais estreitos, porque assume menos variação de tempo nos parâmetros do que os outros modelos. Além disso, a previsão de pontos é ligeiramente maior que a dos outros modelos, porque esta é uma extrapolação de uma tendência de longo prazo ao invés de uma tendência de curto prazo (ou tendência zero). O modelo Winters é o menos estável dos modelos e sua previsão, portanto, tem os limites de confiança mais amplos, como ficou evidente nas parcelas de previsão detalhadas para os modelos. E as previsões e os limites de confiança do modelo ARIMA (0,1,1) x (0,1,1) e aqueles do modelo de ajuste LESseasonal são praticamente idênticos Para registrar ou não registrar algo que ainda não fizemos, mas Pode ter, é incluir uma transformação de log como parte do modelo. Os modelos ARIMA sazonais são modelos inerentemente aditivos, portanto, se quisermos capturar um padrão sazonal multiplicativo. Devemos fazê-lo registrando os dados antes de montar o modelo ARIMA. (Em Statgraphics, precisamos apenas especificar quotNatural Logquot como uma opção de modelagem - não é grande coisa). Neste caso, a transformação de deflação parece ter feito um trabalho satisfatório de estabilizar as amplitudes dos ciclos sazonais, então não existe Parece ser um motivo convincente para adicionar uma transformação de logs, tanto quanto as tendências a longo prazo estão em causa. Se os resíduos mostraram um aumento acentuado da variação ao longo do tempo, poderíamos decidir o contrário. Ainda há uma questão de saber se os erros desses modelos têm uma variação consistente em meses do ano. Se eles não gostem, então os intervalos de confiança para as previsões podem tender a ser muito largos ou muito estreitos de acordo com a estação. Os parcelas de tempo residual versus tempo não mostram um problema óbvio a este respeito, mas para ser completo, seria bom analisar a variação de erro por mês. Se houver um problema, uma transformação de log pode corrigi-lo. Voltar ao topo da página.
No comments:
Post a Comment