Friday 22 December 2017

Moving average forecasting in r


R - Abordagens de Previsão para Previsão editar ARIMA (Média de Mudança Integrada AutoRegresiva) ETS (modelo de espaço de estado de suavização exponencial) Vamos discutir como esses métodos funcionam e como usá-los. Visão geral do pacote de previsão editar Exponencial Suavização editar Nomes AKA: média móvel ponderada exponencialmente (EWMA) Equivalente ao modelo ARIMA (0,1,1) sem termo constante Usado para dados suavizados para apresentação faz previsões média móvel simples: as observações passadas são ponderadas igualmente exponencialmente Suavização: atribui pesos exponencialmente decrescentes ao longo do tempo Fórmula xt - sequência de dados brutos st - saída do algoritmo de suavização exponencial (estimativa do próximo valor de x) - fator de suavização. 0160lt160160lt1601.Coosing right maneira não formal de escolher a técnica estatística pode ser usada para otimizar o valor de (por exemplo, OLS) quanto maior o fechamento obtém a previsão ingênua (as mesmas portas que as séries originais com um período de atraso) Double Exponential Suavização editar Simples O alisamento exponencial não funciona bem quando há uma tendência (haverá sempre um viés) O suavização exponencial dupla é um grupo de métodos que tratam do problema. Suavização exponencial de Holt-Winters e, para tgt 1, por onde é o fator de suavização de dados. 0160lt160160lt1601, e é o fator de alisamento da tendência. 0160lt160160lt1601. Saída F tm - uma estimativa do valor de x no tempo tm, mgt0 com base nos dados brutos até o horário t A edição tripla de suavização exponencial leva em consideração as mudanças sazonais, bem como as tendências sugeridas pela primeira vez pelo aluno Holts, Peter Winters, em 1960 Input Xt - sequência de dados brutos de observações t 1601600 L comprimento um ciclo de mudança sazonal O método calcula: uma linha de tendência para os índices sazonais de dados que pesam os valores na linha de tendência com base em onde esse ponto de tempo cai no ciclo de comprimento L. S t representa o valor suavizado da parte constante para o tempo t. Bt representa a seqüência das melhores estimativas da tendência linear que se sobrepõem às mudanças sazonais ct é a seqüência de fatores de correção sazonais ct é a proporção esperada da tendência prevista a qualquer momento t mod L no ciclo que as observações realizam para Inicializar os índices sazonais c tL deve haver pelo menos um ciclo completo nos dados. A saída do algoritmo é novamente escrita como F tm. Uma estimativa do valor de x no tempo tm, mgt0 com base nos dados brutos até o momento t. O alisamento exponencial triplo é dado pelas fórmulas onde é o fator de suavização de dados. 0160lt160160lt1601, é o factor de suavização da tendência. 0160lt160160lt1601, e é o fator de alívio da mudança sazonal. 0160lt160160lt1601. A fórmula geral para a estimativa da tendência inicial b 0 é: Definir as estimativas iniciais para os índices sazonais c i para i 1,2. L é um pouco mais envolvido. Se N for o número de ciclos completos presentes em seus dados, então: Note que A j é o valor médio de x no jésimo ciclo de seus dados. ETS edit Substituir parâmetros edit 8.4 Modelos médios em movimento Ao invés de usar valores passados ​​da variável de previsão em uma regressão, um modelo de média móvel usa erros de previsão passados ​​em um modelo semelhante a regressão. Y c e theta e theta e dots theta e, onde et é ruído branco. Nós nos referimos a isso como um modelo de MA (q). Claro, não observamos os valores de et, portanto, não é realmente regressão no sentido usual. Observe que cada valor de yt pode ser pensado como uma média móvel ponderada dos últimos erros de previsão. No entanto, os modelos de média móvel não devem ser confundidos com o alisamento médio móvel que discutimos no Capítulo 6. Um modelo de média móvel é usado para prever valores futuros, ao passo que o alavanca média móvel é usada para estimar o ciclo de tendência dos valores passados. Figura 8.6: Dois exemplos de dados de modelos em média móveis com diferentes parâmetros. Esquerda: MA (1) com y t 20e t 0.8e t-1. Direito: MA (2) com t e t - e t-1 0.8e t-2. Em ambos os casos, e t é normalmente distribuído ruído branco com zero médio e variância um. A Figura 8.6 mostra alguns dados de um modelo MA (1) e um modelo MA (2). Alterando os parâmetros theta1, dots, thetaq resulta em diferentes padrões de séries temporais. Tal como acontece com os modelos autorregressivos, a variância do termo de erro e só alterará a escala da série, e não os padrões. É possível escrever qualquer modelo AR (p) estacionário como modelo MA (infty). Por exemplo, usando a substituição repetida, podemos demonstrar isso para um modelo AR (1): begin yt amp phi1y et amp phi1 (phi1y e) et amp phi12y phi1 e et phi13y phi12e phi1e phi1e e amptext end Provided -1 lt phi1 lt 1, o valor de phi1k ficará menor quando k for maior. Então, eventualmente, obtemos et et phi1 e phi12 e phi13 e cdots, um processo MA (infty). O resultado inverso é válido se impomos algumas restrições nos parâmetros MA. Então, o modelo MA é chamado de inversível. Ou seja, podemos escrever qualquer processo de MA (q) inversível como um processo AR (infty). Os modelos invertidos não são simplesmente para nos permitir converter de modelos MA para modelos AR. Eles também têm algumas propriedades matemáticas que os tornam mais fáceis de usar na prática. As restrições de invertibilidade são semelhantes às restrições de estacionaria. Para um modelo MA (1): -1lttheta1lt1. Para um modelo MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1 - theta2 lt 1. Condições mais complicadas mantêm-se para qge3. Mais uma vez, R cuidará dessas restrições ao estimar os modelos. Na prática, a média móvel proporcionará uma boa estimativa da média da série temporal se a média for constante ou lentamente mudando. No caso de uma média constante, o maior valor de m dará as melhores estimativas da média subjacente. Um período de observação mais longo significará os efeitos da variabilidade. O objetivo de fornecer um m menor é permitir que a previsão responda a uma mudança no processo subjacente. Para ilustrar, propomos um conjunto de dados que incorpora mudanças na média subjacente das séries temporais. A figura mostra a série temporal usada para ilustração juntamente com a demanda média da qual a série foi gerada. A média começa como uma constante em 10. Começando no tempo 21, ela aumenta em uma unidade em cada período até atingir o valor de 20 no tempo 30. Então, torna-se constante novamente. Os dados são simulados adicionando à média, um ruído aleatório de uma distribuição Normal com média zero e desvio padrão 3. Os resultados da simulação são arredondados para o inteiro mais próximo. A tabela mostra as observações simuladas usadas para o exemplo. Quando usamos a tabela, devemos lembrar que em qualquer momento, apenas os dados passados ​​são conhecidos. As estimativas do parâmetro do modelo, para três valores diferentes de m, são mostradas em conjunto com a média das séries temporais na figura abaixo. A figura mostra a estimativa média móvel da média em cada momento e não a previsão. As previsões mudariam as curvas médias móveis para a direita por períodos. Uma conclusão é imediatamente aparente da figura. Para as três estimativas, a média móvel está atrasada por trás da tendência linear, com o atraso crescente com m. O atraso é a distância entre o modelo e a estimativa na dimensão temporal. Por causa do atraso, a média móvel subestima as observações à medida que a média está aumentando. O viés do estimador é a diferença em um momento específico no valor médio do modelo e o valor médio previsto pela média móvel. O viés quando a média está aumentando é negativo. Para uma média decrescente, o viés é positivo. O atraso no tempo e o viés introduzido na estimativa são funções de m. Quanto maior o valor de m. Maior a magnitude do atraso e do viés. Para uma série de crescimento contínuo com tendência a. Os valores de lag e tendência do estimador da média são dados nas equações abaixo. As curvas de exemplo não combinam essas equações porque o modelo de exemplo não está aumentando continuamente, antes ele começa como uma constante, muda para uma tendência e depois se torna constante novamente. Também as curvas de exemplo são afetadas pelo ruído. A previsão média móvel de períodos no futuro é representada pela mudança das curvas para a direita. O atraso e o desvio aumentam proporcionalmente. As equações abaixo indicam o atraso e a polarização de um período de previsão para o futuro em relação aos parâmetros do modelo. Novamente, essas fórmulas são para uma série de tempo com uma tendência linear constante. Não devemos nos surpreender com esse resultado. O estimador da média móvel é baseado na suposição de uma média constante, e o exemplo tem uma tendência linear na média durante uma parcela do período de estudo. Uma vez que as séries em tempo real raramente obedecerão exatamente aos pressupostos de qualquer modelo, devemos estar preparados para esses resultados. Também podemos concluir a partir da figura que a variabilidade do ruído tem o maior efeito para m menores. A estimativa é muito mais volátil para a média móvel de 5 do que a média móvel de 20. Temos os desejos conflitantes de aumentar m para reduzir o efeito da variabilidade devido ao ruído e diminuir m para tornar a previsão mais sensível às mudanças Em média. O erro é a diferença entre os dados reais e o valor previsto. Se a série temporal é verdadeiramente um valor constante, o valor esperado do erro é zero e a variância do erro é composta por um termo que é uma função e um segundo termo que é a variância do ruído,. O primeiro termo é a variância da média estimada com uma amostra de observações m, assumindo que os dados provêm de uma população com um meio constante. Este termo é minimizado fazendo m o maior possível. Um grande m faz com que a previsão não responda a uma mudança nas séries temporais subjacentes. Para tornar as previsões sensíveis às mudanças, queremos m o mais pequeno possível (1), mas isso aumenta a variação do erro. A previsão prática requer um valor intermediário. Previsão com o Excel O suplemento de previsão implementa as fórmulas de média móvel. O exemplo abaixo mostra a análise fornecida pelo suplemento para os dados da amostra na coluna B. As primeiras 10 observações são indexadas -9 a 0. Comparadas com a tabela acima, os índices do período são deslocados em -10. As primeiras dez observações fornecem os valores de inicialização para a estimativa e são usadas para calcular a média móvel para o período 0. A coluna MA (10) (C) mostra as médias móveis calculadas. O parâmetro médio móvel m está na célula C3. A coluna Fore (1) (D) mostra uma previsão para um período no futuro. O intervalo de previsão está na célula D3. Quando o intervalo de previsão é alterado para um número maior, os números na coluna Fore são deslocados para baixo. A coluna Err (1) (E) mostra a diferença entre a observação e a previsão. Por exemplo, a observação no tempo 1 é 6. O valor previsto feito a partir da média móvel no tempo 0 é 11,1. O erro então é -5.1. O desvio padrão eo desvio médio médio (MAD) são calculados nas células E6 e E7, respectivamente.

No comments:

Post a Comment