Saturday 12 August 2017

Média Móvel Auto Intensiva Excel


ARMA Unplugged Esta é a primeira entrada em nossa série de tutoriais desconectados, nos quais aprofundamos os detalhes de cada um dos modelos de séries temporais com os quais você já está familiarizado, destacando os pressupostos subjacentes e conduzindo suas intuições. Nesta questão, abordamos o modelo ARMA como uma pedra angular na modelagem de séries temporais. Ao contrário dos problemas de análise anteriores, começaremos aqui com a definição do processo ARMA, indicar as entradas, saídas, parâmetros, restrições de estabilidade, premissas e finalmente desenhar algumas diretrizes para o processo de modelagem. Antecedentes Por definição, a média móvel auto-regressiva (ARMA) é um processo estocástico estacionário composto por somas de Excel autorregressivo e componentes de média móvel. Alternativamente, em uma formulação simples: Pressupostos Vamos olhar mais de perto para a formulação. O processo ARMA é simplesmente uma soma ponderada das observações e choques de resultados passados, com poucos pressupostos fundamentais: o que esses pressupostos significam que um processo estocástico é uma contrapartida de um processo determinista que descreve a evolução de uma variável aleatória ao longo do tempo. No nosso caso, a variável aleatória é O processo ARMA somente captura a correlação serial (ou seja, auto-correlação) entre as observações. Em palavras simples, o processo ARMA resume os valores das observações passadas, não seus valores quadrados ou seus logaritmos, etc. A dependência de ordem superior exige um processo diferente (por exemplo, ARCHGARCH, modelos não-lineares, etc.). Existem inúmeros exemplos de um processo estocástico em que os valores passados ​​afetam os atuais. Por exemplo, em um escritório de vendas que recebe PDOs de forma contínua, alguns são realizados como vendas vencidas, algumas como vendas perdidas e algumas derrubadas no próximo mês. Como resultado, em qualquer mês, alguns dos casos de vendas vencidas se originam como PDOs ou são vendas repetidas dos meses anteriores. Quais são os choques, inovações ou termos de erro Esta é uma pergunta difícil, e a resposta não é menos confusa. Ainda assim, vamos tentar: em palavras simples, o termo de erro em um determinado modelo é um balde catch-all para todas as variações que o modelo não explica. Ainda perdeu Vamos usar um exemplo. Para um processo de preço de ações, existem possivelmente centenas de fatores que impulsionam a atualização do nível de preços, incluindo: Dividendos e anúncios divididos Relatórios trimestrais de ganhos Atividades de fusão e aquisição (MampA) Eventos legais, por exemplo, A ameaça de ação coletiva. Outros Um modelo, por design, é uma simplificação de uma realidade complexa, então, o que quer que deixemos fora do modelo, é incluído automaticamente no termo de erro. O processo ARMA assume que o efeito coletivo de todos esses fatores age mais ou menos como o ruído gaussiano. Por que nos preocupamos com os choques passados ​​Ao contrário de um modelo de regressão, a ocorrência de um estímulo (por exemplo, choque) pode afetar o nível atual e possivelmente os níveis futuros. Por exemplo, um evento corporativo (por exemplo, atividade MampA) afeta o preço das ações da empresa subjacente, mas a mudança pode levar algum tempo para ter seu impacto total, já que os participantes do mercado absorvem as informações disponíveis e reagem de acordo. Isso levanta a questão: não os valores passados ​​da saída já tenham os erros antes da informação SIM, o histórico de choques já é contabilizado nos níveis de saída passados. Um modelo ARMA pode ser representado apenas como um modelo auto-regressivo puro (AR), mas o requisito de armazenamento de tal sistema em infinito. Este é o único motivo para incluir o componente MA: para economizar em armazenamento e simplificar a formulação. Novamente, o processo ARMA deve ser estacionário para a variância marginal (incondicional) existir. Nota: Na minha discussão acima, não faço uma distinção entre a mera ausência de uma raiz unitária na equação característica e a estacionaridade do processo. Eles estão relacionados, mas a ausência de uma unidade de raiz não é uma garantia de estacionaria. Ainda assim, a raiz da unidade deve estar dentro do círculo da unidade para ser exata. Conclusão Vamos recapitular o que fizemos até agora. Primeiro examinamos um processo ARMA estacionário, juntamente com sua formulação, insumos, suposições e requisitos de armazenamento. Em seguida, mostramos que um processo ARMA incorpora seus valores de saída (auto-correlação) e choques que experimentou anteriormente na saída atual. Finalmente, mostramos que o processo ARMA estacionário produz uma série de tempo com uma média e variância estavel a longo prazo. Em nossa análise de dados, antes de propor um modelo ARMA, devemos verificar a suposição de estacionararia e os requisitos de memória finita. No caso de a série de dados exibir uma tendência determinista, precisamos remover (de-tendência) primeiro e, em seguida, usar os resíduos para ARMA. No caso de o conjunto de dados exibir uma tendência estocástica (por exemplo, caminhada aleatória) ou sazonalidade, precisamos entreter ARIMASARIMA. Finalmente, o correlograma (ou seja, o ACFPACF) pode ser usado para avaliar o requisito de memória do modelo, devemos esperar que ACF ou PACF se desintequem rapidamente após alguns atrasos. Caso contrário, isso pode ser um sinal de não-estacionaridade ou um padrão de longo prazo (por exemplo, ARFIMA). PREÇOARARIM com o Excel e R Olá hoje, vou encaminhá-lo através de uma introdução ao modelo ARIMA e seus componentes também. Como uma breve explicação do método Box-Jenkins de como os modelos ARIMA são especificados. Por fim, criei uma implementação do Excel usando R, que I8217ll mostra como configurar e usar. Modelos de média móvel auto-agressiva (ARMA) O modelo de média móvel autoregressiva é usado para modelar e prever processos estacionários, estocásticos em séries temporais. É a combinação de duas técnicas estatísticas desenvolvidas anteriormente, os modelos Autoregressive (AR) e Moving Average (MA) e foi descrito originalmente por Peter Whittle em 1951. George E. P. Box e Gwilym Jenkins popularizaram o modelo em 1971, especificando etapas discretas para identificação, estimativa e verificação do modelo. Este processo será descrito posteriormente para referência. Começamos por apresentar o modelo ARMA por seus vários componentes, os modelos AR e MA e, em seguida, apresentar uma generalização popular do modelo ARMA, a ARIMA (Promover a Mudança Integrada Autoregressiva) e as etapas de previsão e especificação do modelo. Por fim, vou explicar uma implementação do Excel que eu criei e como usá-la para fazer suas previsões de séries temporais. Modelos Autoregressivos O modelo Autoregressivo é usado para descrever processos aleatórios e processos de variação de tempo e especifica que a variável de saída depende linearmente de seus valores anteriores. O modelo é descrito como: Onde estão os parâmetros do modelo, C é constante e é um termo de ruído branco. Essencialmente, o que o modelo descreve é ​​para qualquer valor determinado. Isso pode ser explicado por funções de seu valor anterior. Para um modelo com um parâmetro. É explicado pelo seu valor passado e erro aleatório. Para um modelo com mais de um parâmetro, por exemplo. É dado por. E erro aleatório. Modelo de média móvel O modelo de média móvel (MA) é usado frequentemente para modelar séries temporais univariadas e é definido como: é a média das séries temporais. São os parâmetros do modelo. São os termos de erro de ruído branco. É a ordem do modelo de média móvel. O modelo de média móvel é uma regressão linear do valor atual da série em comparação com os termos no período anterior. Por exemplo, um modelo MA de. É explicado pelo erro atual no mesmo período e o valor do erro passado. Para um modelo de ordem 2 (), é explicado pelos dois últimos valores de erro, e. Os termos AR () e MA () são usados ​​no modelo ARMA, que agora será introduzido. Modelo Médio Autoregressivo Os modelos Modelo Mover Autoregressivo usam dois polinômios, AR () e MA () e descrevem um processo estocástico estacionário. Um processo estacionário não muda quando deslocado no tempo ou no espaço, portanto, um processo estacionário tem média e variância constantes. O modelo ARMA é frequentemente referido em termos de seus polinômios, ARMA (). A notação do modelo está escrita: Selecionar, estimar e verificar o modelo é descrito pelo processo Box-Jenkins. Método Box-Jenkins para identificação de modelo A seguir, é mais um esboço do método Box-Jenkins, pois o processo real de encontrar esses valores pode ser bastante irresistível sem um pacote estatístico. A folha do Excel incluída nesta página determina automaticamente o modelo de melhor ajuste. O primeiro passo do método Box-Jenkins é a identificação do modelo. O passo inclui a identificação da sazonalidade, a diferenciação, se necessário, e a determinação da ordem e do traçado das funções de autocorrelação e autocorrelação parcial. Após o modelo ser identificado, o próximo passo é estimar os parâmetros. A estimativa de parâmetros usa pacotes estatísticos e algoritmos de computação para encontrar os melhores parâmetros de ajuste. Uma vez escolhidos os parâmetros, o último passo é verificar o modelo. A verificação do modelo é feita testando para ver se o modelo está em conformidade com uma série temporária univariada estacionária. Deve também confirmar que os resíduos são independentes uns dos outros e exibem média e variância constantes ao longo do tempo, o que pode ser feito realizando um teste de Ljung-Box ou novamente plotando a autocorrelação e a autocorrelação parcial dos resíduos. Observe que o primeiro passo envolve a verificação da sazonalidade. Se os dados que você está trabalhando contiver tendências sazonais, você 8220difference8221 para tornar os dados estacionários. Este passo de diferenciação generaliza o modelo ARMA para um modelo ARIMA ou Média Mover Integrada Autoregressiva, onde 8216Integrated8217 corresponde ao passo de diferenciação. Modelos de média móvel integrada autoregressiva O modelo ARIMA tem três parâmetros. Para definir o modelo ARMA para incluir o termo de diferenciação, começamos por rearranjar o modelo ARMA padrão para separar do somatório. Onde está o operador de atraso e. São parâmetros de média autorregressiva e móvel, e os termos de erro, respectivamente. Agora fazemos a suposição o primeiro polinômio da função, tem uma raiz unitária de multiplicidade. Podemos então reescrevê-lo para o seguinte: O modelo ARIMA expressa a factorização polinomial com e nos dá: Por fim, generalizamos o modelo adicionalmente, adicionando um termo de deriva, que define o modelo ARIMA como ARIMA () com deriva. Com o modelo agora definido, podemos visualizar o modelo ARIMA como duas partes separadas, uma não estacionária e outra estacionada de sentido amplo (a distribuição de probabilidade conjunta não muda quando deslocada no tempo ou no espaço). O modelo não estacionário: o modelo estacionário de sentido amplo: agora, as previsões podem ser feitas com o uso de um método de previsão autoadressivo generalizado. Agora que discutimos os modelos ARMA e ARIMA, passamos agora a como podemos usá-los em aplicativos práticos para fornecer previsões. Eu criei uma implementação com o Excel usando R para fazer previsões ARIMA, bem como uma opção para executar a simulação Monte Carlo no modelo para determinar a probabilidade das previsões. Implementação do Excel e como usar Antes de usar a folha, você deve baixar o R ​​e o RExcel no site Statconn. Se você já tiver instalado R, você pode simplesmente baixar o RExcel. Se você não tiver instalado R, você pode baixar RAndFriends que contém a versão mais recente do R e do RExcel. Por favor note, o RExcel funciona apenas no Excel 32 bits pela sua licença não comercial. Se você tiver o 64bit Excel instalado, você terá que obter uma licença comercial da Statconn. Recomenda-se baixar o RAndFriends, pois faz a instalação mais rápida e fácil, no entanto, se você já possui R e gostaria de instalá-lo manualmente, siga estes próximos passos. Instalando manualmente o RExcel Para instalar o RExcel e os outros pacotes para fazer com que o R funcione no Excel, abra primeiro R como um Administrador clicando com o botão direito do mouse no. exe. No console R, instale o RExcel digitando as seguintes instruções: Os comandos acima irão instalar o RExcel em sua máquina. O próximo passo é instalar o rcom, que é outro pacote da Statconn para o pacote RExcel. Para instalar isso, digite os seguintes comandos, que também instalarão automaticamente rscproxy a partir da versão R 2.8.0. Com estes pacotes instalados, você pode passar para definir a conexão entre R e Excel. Embora não seja necessário para a instalação, um pacote acessível para download é Rcmdr, desenvolvido por John Fox. Rcmdr cria menus R que podem se tornar menus no Excel. Esse recurso vem por padrão com a instalação do RAndFriends e disponibiliza vários comandos R no Excel. Digite os seguintes comandos em R para instalar o Rcmdr. Podemos criar o link para R e Excel. Nota nas versões recentes do RExcel, esta conexão é feita com um simples clique duplo do arquivo. bat fornecido ActivateRExcel2010, portanto, você só precisa seguir estas etapas se você instalou R e RExcel manualmente ou se, por algum motivo, a conexão não for feita durante A instalação do RAndFriends. Criar a conexão entre R e Excel Abra um novo livro no Excel e navegue até a tela de opções. Clique em Opções e em Add-Ins. Você deve ver uma lista de todos os complementos ativos e inativos que você possui atualmente. Clique no botão Ir na parte inferior. Na caixa de diálogo Complementos, você verá todas as referências de complemento que você fez. Clique em Procurar. Navegue até a pasta RExcel, geralmente localizada em C: Program FilesRExcelxls ou algo semelhante. Encontre o suplemento RExcel. xla e clique nele. O próximo passo é criar uma referência para que as macros usando o R funcionem corretamente. No seu documento do Excel, digite Alt F11. Isso abrirá o editor Excels VBA. Vá para Tools - gt References e encontre a referência RExcel, RExcelVBAlib. RExcel agora deveria estar pronto para usar Usando a Folha do Excel Agora que R e o RExcel estão configurados corretamente, é hora de fazer alguma previsão. Abra a folha de previsão e clique em Carregar Servidor. Isto é para iniciar o servidor RCom e também carregar as funções necessárias para fazer a previsão. Uma caixa de diálogo será aberta. Selecione o arquivo itall. R incluído na folha. Este arquivo contém as funções que a ferramenta de previsão usa. A maioria das funções incluídas foi desenvolvida pelo Professor Stoffer na Universidade de Pittsburgh. Eles estendem as capacidades de R e nos fornecem alguns gráficos de diagnóstico úteis, juntamente com a nossa saída de previsão. Há também uma função para determinar automaticamente os melhores parâmetros de ajuste do modelo ARIMA. Após o servidor carregar, insira seus dados na coluna Dados. Selecione o alcance dos dados, clique com o botão direito do mouse e selecione Gama de nomes. Nomeie o intervalo como Dados. Em seguida, defina a frequência dos seus dados na célula C6. Freqüência refere-se aos períodos de tempo de seus dados. Se for semanal, a freqüência seria 7. Mensalmente seria 12, enquanto trimestralmente seria 4, e assim por diante. Insira os períodos adiante para prever. Note-se que os modelos ARIMA tornam-se bastante imprecisos após várias previsões sucessivas de frequência. Uma boa regra geral não deve exceder 30 passos, já que qualquer coisa que não seja confiável. Isso também depende do tamanho do seu conjunto de dados. Se você tem dados limitados disponíveis, recomenda-se escolher um número menor para a frente. Depois de inserir seus dados, nomeá-lo e definir a freqüência desejada e avançar para prever, clique em Executar. Pode demorar um pouco para que a previsão seja processada. Uma vez concluído, você terá valores previstos para o número que você especificou, o erro padrão dos resultados e dois gráficos. A esquerda é o valor previsto traçado com os dados, enquanto o direito contém diagnósticos úteis com resíduos padronizados, a autocorrelação dos resíduos, um gráfico gg dos resíduos e um gráfico de estatísticas Ljung-Box para determinar se o modelo está bem instalado. Eu não vou entrar em detalhes demais sobre como você procura um modelo bem equipado, mas no gráfico ACF você não quer nenhum (ou muito) dos pontos de atraso que atravessam a linha azul pontilhada. No gráfico de gg, quanto mais círculos passam pela linha, mais normalizado e melhor ajustado é o modelo. Para conjuntos de dados maiores, isso pode atrair muitos círculos. Por fim, o teste de Ljung-Box é um artigo em si, no entanto, quanto mais círculos estão acima da linha azul pontilhada, melhor será o modelo. Se o resultado do diagnóstico não parecer bom, você pode tentar adicionar mais dados ou começar em um ponto diferente do alcance que deseja prever. Você pode facilmente limpar os resultados gerados clicando nos botões Limpar valores previstos. E é isso. Atualmente, a coluna de data não faz nada além da sua referência, mas não é necessário para a ferramenta. Se eu encontrar tempo, eu vou voltar e adicione isso para que o gráfico exibido mostre a hora correta. Você também pode receber um erro ao executar a previsão. Isso geralmente é devido à função que encontra os melhores parâmetros é incapaz de determinar a ordem correta. Você pode seguir as etapas acima para tentar organizar seus dados melhor para que a função funcione. Espero que você se aproveite da ferramenta. Isso me salvou muito tempo no trabalho, já que agora eu tenho que fazer é inserir os dados, carregar o servidor e executá-lo. Eu também espero que isso mostre o quão incrível R pode ser, especialmente quando usado com um front-end como o Excel. O código, a planilha do Excel e o arquivo. bas também estão no GitHub aqui. Introdução para ARIMA: modelos não-sazonais. Equação de previsão ARIMA (p, d, q): os modelos ARIMA são, em teoria, a classe mais geral de modelos para prever uma série de tempo que Pode ser feito para ser 8220stationary8221 por diferenciação (se necessário), talvez em conjunção com transformações não-lineares, como registro ou desinflação (se necessário). Uma variável aleatória que é uma série temporal é estacionária se suas propriedades estatísticas são todas constantes ao longo do tempo. Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ela muda de forma consistente. Ou seja, seus padrões de tempo aleatório de curto prazo sempre parecem os mesmos em um sentido estatístico. A última condição significa que suas autocorrelações (correlações com seus próprios desvios anteriores da média) permanecem constantes ao longo do tempo, ou de forma equivalente, que seu espectro de potência permanece constante ao longo do tempo. Uma variável aleatória deste formulário pode ser vista (como de costume) como uma combinação de sinal e ruído, e o sinal (se um é aparente) pode ser um padrão de reversão média rápida ou lenta, ou oscilação sinusoidal, ou alternância rápida no signo , E também poderia ter um componente sazonal. Um modelo ARIMA pode ser visto como um 8220filter8221 que tenta separar o sinal do ruído, e o sinal é então extrapolado para o futuro para obter previsões. A equação de previsão de ARIMA para uma série de tempo estacionária é uma equação linear (isto é, regressão) em que os preditores consistem em atrasos da variável dependente ou atrasos dos erros de previsão. Isto é: valor previsto de Y uma constante ou uma soma ponderada de um ou mais valores recentes de Y e uma soma ponderada de um ou mais valores recentes dos erros. Se os preditores consistem apenas em valores atrasados ​​de Y. é um modelo autoregressivo puro (8220 self-regressed8221), que é apenas um caso especial de um modelo de regressão e que pode ser equipado com o software de regressão padrão. Por exemplo, um modelo autoregressivo de primeira ordem (8220AR (1) 8221) para Y é um modelo de regressão simples no qual a variável independente é apenas Y rezagada em um período (LAG (Y, 1) em Statgraphics ou YLAG1 em RegressIt). Se alguns dos preditores são atrasos dos erros, um modelo ARIMA não é um modelo de regressão linear, porque não existe nenhuma maneira de especificar o erro 8222 do último período8217s como uma variável independente: os erros devem ser computados numa base de período a período Quando o modelo é ajustado aos dados. Do ponto de vista técnico, o problema com o uso de erros atrasados ​​como preditores é que as previsões do modelo8217s não são funções lineares dos coeficientes. Mesmo que sejam funções lineares dos dados passados. Assim, os coeficientes nos modelos ARIMA que incluem erros atrasados ​​devem ser estimados por métodos de otimização não-linear (8220hill-climbing8221) em vez de apenas resolver um sistema de equações. O acrônimo ARIMA significa Auto-Regressive Integrated Moving Average. Lags da série estacionada na equação de previsão são chamados quota de termos degressivos, os atrasos dos erros de previsão são chamados de termos de média de quotmoving, e uma série de tempo que precisa ser diferenciada para ser estacionada é dito ser uma versão quotintegratedquot de uma série estacionária. Modelos aleatórios e de tendência aleatória, modelos autoregressivos e modelos de suavização exponencial são todos os casos especiais de modelos ARIMA. Um modelo ARIMA não-sazonal é classificado como quotARIMA (p, d, q) quot model, onde: p é o número de termos autorregressivos, d é o número de diferenças não-sazonais necessárias para a estacionaridade e q é o número de erros de previsão atrasados ​​em A equação de predição. A equação de previsão é construída da seguinte forma. Primeiro, digamos a d ª diferença de Y. o que significa: Observe que a segunda diferença de Y (o caso d2) não é a diferença de 2 períodos atrás. Em vez disso, é a primeira diferença da primeira diferença. Que é o análogo discreto de uma segunda derivada, isto é, a aceleração local da série em vez da sua tendência local. Em termos de y. A equação geral de previsão é: Aqui, os parâmetros de média móvel (9528217s) são definidos de modo que seus sinais são negativos na equação, seguindo a convenção introduzida pela Box e Jenkins. Alguns autores e software (incluindo a linguagem de programação R) os definem de modo que eles tenham sinais de mais. Quando os números reais estão conectados à equação, não há ambigüidade, mas é importante saber qual a convenção que seu software usa quando você está lendo a saída. Muitas vezes, os parâmetros são indicados por AR (1), AR (2), 8230 e MA (1), MA (2), 8230 etc. Para identificar o modelo ARIMA apropriado para Y. você começa por determinar a ordem de diferenciação (D) a necessidade de estacionar a série e remover as características brutas da sazonalidade, talvez em conjunto com uma transformação estabilizadora de variância, como registro ou desinflação. Se você parar neste ponto e prever que a série diferenciada é constante, você ajustou apenas uma caminhada aleatória ou modelo de tendência aleatória. No entanto, a série estacionada ainda pode ter erros autocorrelacionados, sugerindo que alguns números de AR (p 8805 1) e outros termos do número MA (q 8805 1) também são necessários na equação de previsão. O processo de determinação dos valores de p, d e q que são melhores para uma determinada série temporal será discutido em seções posteriores das notas (cujos links estão no topo desta página), mas uma prévia de alguns tipos Dos modelos ARIMA não-sazonais que são comumente encontrados são dados abaixo. Modelo autoregressivo de primeira ordem ARIMA (1,0,0): se a série estiver estacionada e autocorrelada, talvez possa ser predita como um múltiplo de seu próprio valor anterior, além de uma constante. A equação de previsão neste caso é 8230, que é regredida por si mesma atrasada por um período. Este é um modelo 8220ARIMA (1,0,0) constante8221. Se a média de Y for zero, então o termo constante não seria incluído. Se o coeficiente de inclinação 981 1 for positivo e menor que 1 em magnitude (deve ser inferior a 1 em magnitude se Y estiver estacionário), o modelo descreve o comportamento de reversão média em que o valor do período 8217 seguinte deve ser previsto 981 1 vez como Muito longe da média, já que este valor do período 8217s. Se 981 1 é negativo, ele prevê comportamento de reversão média com alternância de sinais, ou seja, ele também prevê que Y estará abaixo do período médio seguinte se estiver acima da média deste período. Em um modelo autoregressivo de segunda ordem (ARIMA (2,0,0)), haveria um termo Y t-2 também à direita e assim por diante. Dependendo dos sinais e das magnitudes dos coeficientes, um modelo ARIMA (2,0,0) pode descrever um sistema cuja reversão média ocorre de forma sinusoidalmente oscilante, como o movimento de uma massa em uma mola sujeita a choques aleatórios . ARIMA (0,1,0) caminhada aleatória: se a série Y não é estacionária, o modelo mais simples possível para isso é um modelo de caminhada aleatória, que pode ser considerado como um caso limitante de um modelo AR (1) no qual o autorregressivo O coeficiente é igual a 1, ou seja, uma série com reversão média infinitamente lenta. A equação de predição para este modelo pode ser escrita como: onde o termo constante é a mudança média de período para período (ou seja, a derivação de longo prazo) em Y. Esse modelo poderia ser ajustado como um modelo de regressão sem intercepção em que o A primeira diferença de Y é a variável dependente. Uma vez que inclui (apenas) uma diferença não-sazonal e um termo constante, esta é classificada como um modelo quotARIMA (0,1,0) com constante. O modelo aleatório-sem-atrasado seria um ARIMA (0,1, 0) modelo sem constante ARIMA (1,1,0) modelo autoregressivo de primeira ordem diferenciado: se os erros de um modelo de caminhada aleatória forem autocorrelacionados, talvez o problema possa ser corrigido adicionando um atraso da variável dependente à equação de predição - - é Ao regredir a primeira diferença de Y em si mesma atrasada por um período. Isso produziria a seguinte equação de predição: que pode ser rearranjada para Este é um modelo autoregressivo de primeira ordem com uma ordem de diferenciação não-sazonal e um termo constante - ou seja. Um modelo ARIMA (1,1,0). ARIMA (0,1,1) sem alisamento exponencial constante e simples: outra estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples. Lembre-se de que, para algumas séries temporais não estacionárias (por exemplo, as que exibem flutuações ruidosas em torno de uma média variando lentamente), o modelo de caminhada aleatória não funciona, bem como uma média móvel de valores passados. Em outras palavras, ao invés de tomar a observação mais recente como a previsão da próxima observação, é melhor usar uma média das últimas observações para filtrar o ruído e estimar com maior precisão a média local. O modelo de suavização exponencial simples usa uma média móvel ponderada exponencialmente de valores passados ​​para alcançar esse efeito. A equação de predição para o modelo de suavização exponencial simples pode ser escrita em várias formas matematicamente equivalentes. Um dos quais é o chamado formulário 8220error correction8221, em que a previsão anterior é ajustada na direção do erro que ele fez: porque e t-1 Y t-1 - 374 t-1 por definição, isso pode ser reescrito como : Que é uma equação de previsão ARIMA (0,1,1) sem constante com 952 1 1 - 945. Isso significa que você pode ajustar um alisamento exponencial simples especificando-o como um modelo ARIMA (0,1,1) sem Constante e o coeficiente estimado MA (1) corresponde a 1-menos-alfa na fórmula SES. Lembre-se que, no modelo SES, a idade média dos dados nas previsões de 1 período anterior é de 1 945. O que significa que tenderão a atrasar tendências ou pontos de viragem em cerca de 1 945 períodos. Segue-se que a idade média dos dados nas previsões de 1 período de um ARIMA (0,1,1) - sem modelo constante é 1 (1 - 952 1). Assim, por exemplo, se 952 1 0,8, a idade média é 5. Como 952 1 aborda 1, o ARIMA (0,1,1) - sem modelo constante torna-se uma média móvel de muito longo prazo, e como 952 1 Aproxima-se de 0, torna-se um modelo de caminhada aleatória sem drift. What8217s é a melhor maneira de corrigir a autocorrelação: adicionar termos AR ou adicionar termos MA. Nos dois modelos anteriores discutidos acima, o problema dos erros auto-correlacionados em um modelo de caminhada aleatória foi consertado de duas maneiras diferentes: adicionando um valor atrasado da série diferenciada Para a equação ou adicionando um valor atrasado do erro de previsão. Qual abordagem é melhor Uma regra de ouro para esta situação, que será discutida com mais detalhes mais adiante, é que a autocorrelação positiva geralmente é melhor tratada adicionando um termo AR ao modelo e a autocorrelação negativa geralmente é melhor tratada adicionando um Termo MA. Nas séries temporais econômicas e econômicas, a autocorrelação negativa surge frequentemente como um artefato da diferenciação. (Em geral, a diferenciação reduz a autocorrelação positiva e pode até causar uma mudança de autocorrelação positiva para negativa). Assim, o modelo ARIMA (0,1,1), em que a diferenciação é acompanhada por um termo MA, é mais freqüentemente usado do que um Modelo ARIMA (1,1,0). ARIMA (0,1,1) com alisamento exponencial constante e constante: ao implementar o modelo SES como modelo ARIMA, você realmente ganha alguma flexibilidade. Em primeiro lugar, o coeficiente estimado de MA (1) pode ser negativo. Isso corresponde a um fator de alisamento maior que 1 em um modelo SES, que normalmente não é permitido pelo procedimento de montagem do modelo SES. Em segundo lugar, você tem a opção de incluir um termo constante no modelo ARIMA, se desejar, para estimar uma tendência média não-zero. O modelo ARIMA (0,1,1) com constante tem a equação de previsão: as previsões de um período anteriores deste modelo são qualitativamente similares às do modelo SES, exceto que a trajetória das previsões de longo prazo é tipicamente uma Linha inclinada (cuja inclinação é igual a mu) em vez de uma linha horizontal. ARIMA (0,2,1) ou (0,2,2) sem alisamento exponencial linear constante: modelos de alisamento exponencial linear são modelos ARIMA que utilizam duas diferenças não-sazonais em conjunto com os termos MA. A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma atrasada por dois períodos, mas é a primeira diferença da primeira diferença - isto é. A mudança de mudança de Y no período t. Assim, a segunda diferença de Y no período t é igual a (Y t-Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. Uma segunda diferença de uma função discreta é análoga a uma segunda derivada de uma função contínua: mede a quotaccelerationquot ou quotcurvaturequot na função em um determinado ponto no tempo. O modelo ARIMA (0,2,2) sem constante prediz que a segunda diferença da série é igual a uma função linear dos dois últimos erros de previsão: o que pode ser rearranjado como: onde 952 1 e 952 2 são o MA (1) e MA (2) coeficientes. Este é um modelo de suavização exponencial linear geral. Essencialmente o mesmo que o modelo Holt8217s, e o modelo Brown8217s é um caso especial. Ele usa médias móveis exponencialmente ponderadas para estimar um nível local e uma tendência local na série. As previsões de longo prazo deste modelo convergem para uma linha reta cuja inclinação depende da tendência média observada no final da série. ARIMA (1,1,2) sem alisamento exponencial linear constante de tendência amortecida. Este modelo está ilustrado nos slides que acompanham os modelos ARIMA. Ele extrapola a tendência local no final da série, mas acha-se em horizontes de previsão mais longos para introduzir uma nota de conservadorismo, uma prática que tem suporte empírico. Veja o artigo em quotPor que a Tendência Damped funciona por Gardner e McKenzie e o artigo do quotGolden Rulequot de Armstrong et al. para detalhes. Em geral, é aconselhável manter os modelos em que pelo menos um de p e q não é maior do que 1, ou seja, não tente se ajustar a um modelo como o ARIMA (2,1,2), pois isso provavelmente levará a uma superposição E quotcommon-factorquot questões que são discutidas em mais detalhes nas notas sobre a estrutura matemática dos modelos ARIMA. Implementação da planilha: os modelos ARIMA, como os descritos acima, são fáceis de implementar em uma planilha eletrônica. A equação de predição é simplesmente uma equação linear que se refere a valores passados ​​de séries temporais originais e valores passados ​​dos erros. Assim, você pode configurar uma planilha de previsão ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os erros (dados menos previsões) na coluna C. A fórmula de previsão em uma célula típica na coluna B seria simplesmente Uma expressão linear que se refere a valores nas linhas precedentes das colunas A e C, multiplicadas pelos coeficientes apropriados de AR ou MA armazenados em células em outro lugar na planilha.

No comments:

Post a Comment