Centered moving average even period
Ao calcular uma média móvel em execução, colocar a média no período de tempo médio faz sentido No exemplo anterior, calculamos a média dos três primeiros períodos de tempo e colocá-lo próximo ao período 3. Poderíamos ter colocado a média no meio da Intervalo de tempo de três períodos, ou seja, próximo ao período 2. Isso funciona bem com períodos de tempo ímpares, mas não é tão bom para mesmo períodos de tempo. Então, onde colocamos a primeira média móvel quando M 4 Tecnicamente, a Média Móvel cairá em t 2,5, 3,5. Para evitar esse problema, suavizamos as MAs usando M 2. Assim, suavizamos os valores suavizados Se nós formos uma média de um número par de termos, precisamos suavizar os valores suavizados A tabela a seguir mostra os resultados usando M 4.David, Sim, MapReduce é Para operar em uma grande quantidade de dados. E a idéia é que, em geral, o mapa e as funções de redução não devem se preocupar com quantos mapeadores ou quantos redutores existem, essa é apenas a otimização. Se você pensar cuidadosamente sobre o algoritmo que eu postei, você pode ver que não importa qual mapeador obtém que partes dos dados. Cada registro de entrada estará disponível para cada operação de redução que precisar dele. Ndash Joe K Sep 18 12 at 22:30 No melhor de minha compreensão média móvel não é muito bem mapeia para MapReduce paradigma desde seu cálculo é essencialmente deslizando janela sobre dados classificados, enquanto MR é o processamento de intervalos não intersected de dados classificados. A solução que vejo é a seguinte: a) Para implementar particionador personalizado para ser capaz de fazer duas partições diferentes em duas execuções. Em cada corrida, seus redutores obterão diferentes faixas de dados e calcularão a média móvel quando apropriado. Eu tentarei ilustrar: Na primeira execução, os dados para os redutores devem ser: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Aqui você vai cacluate média móvel para alguns Qs. Na próxima execução seus redutores devem obter dados como: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 E caclulate o resto de médias móveis. Então você precisará agregar resultados. Ideia de particionador personalizado que terá dois modos de operação - cada vez dividindo em intervalos iguais, mas com algum deslocamento. Em um pseudocódigo ele ficará assim. Partição (keySHIFT) / (MAXKEY / numOfPartitions) onde: SHIFT será retirado da configuração. MAXKEY valor máximo da chave. Eu suponho para a simplicidade que começam com zero. RecordReader, IMHO não é uma solução, uma vez que é limitado a divisão específica e não pode deslizar sobre divide limites. Outra solução seria implementar lógica personalizada de dividir dados de entrada (é parte do InputFormat). Pode ser feito para fazer 2 slides diferentes, semelhante ao particionamento. Respondidas set 17 12 at 8: 59Moving Médias e centrado Mover médias Um par de pontos sobre sazonalidade em uma série de tempo repetir urso, mesmo que eles parecem óbvias. Um deles é que o termo 8220season8221 não se refere necessariamente às quatro estações do ano que resultam da inclinação do eixo Earth8217s. Na análise preditiva, 8220season8221 muitas vezes significa exatamente isso, porque muitos dos fenômenos que estudamos variam com a progressão da primavera até o inverno: vendas de equipamentos de inverno ou verão, incidência de certas doenças generalizadas, eventos climáticos causados pela localização do Fluxo de jato e mudanças na temperatura da água no oceano Pacífico oriental, e assim por diante. Da mesma forma, eventos que ocorrem regularmente podem atuar como estações meteorológicas, embora tenham apenas uma ligação tênue com os solstícios e equinócios. Mudanças de oito horas em hospitais e fábricas muitas vezes se expressam na incidência de ingestões e gastos de energia lá, uma estação é de oito horas de duração e as estações ciclo todos os dias, e não todos os anos. As datas de vencimento dos impostos indicam o início de uma inundação de dólares nos tesouros municipais, estaduais e federais, a estação pode ter um ano de duração (impostos sobre o rendimento das pessoas físicas), seis meses (impostos sobre a propriedade em muitos estados), trimestral ), e assim por diante. É um pouco estranho que tenhamos a palavra 8220season8221 para referir-nos geralmente ao período de tempo regularmente recorrente, mas não há um termo geral para o período de tempo durante o qual ocorre uma volta completa das estações. 8220Cycle8221 é possível, mas em analítica e previsão, esse termo geralmente é usado para significar um período de comprimento indeterminado, como um ciclo econômico. Na ausência de um termo melhor, eu usei o período que inclui 8222 neste capítulo e nos subseqüentes. Isso não é apenas reflexão terminológica. As maneiras pelas quais identificamos as estações e o período de tempo durante o qual as estações se transformam têm implicações reais, embora muitas vezes menores, sobre como medimos seus efeitos. As seções a seguir discutem como alguns analistas variam a maneira como calculam as médias móveis, de acordo com o número de temporadas é ímpar ou mesmo. Usando médias móveis em vez de médias simples Suponha que uma grande cidade está considerando a realocação de sua polícia de trânsito para melhor lidar com a incidência de condução, enquanto deficientes, que a cidade acredita que tem vindo a aumentar. Quatro semanas atrás, nova legislação entrou em vigor, legalizando a posse e uso recreativo de maconha. Desde então, o número diário de detenções de tráfego para DWI parece estar tendendo para cima. Complicando questões é o fato de que o número de prisões parece pico nas sextas-feiras e sábados. Para ajudar a planejar as necessidades de mão-de-obra no futuro, você gostaria de prever qualquer tendência subjacente que esteja sendo estabelecida. Você também gosta de tempo a implantação de seus recursos para ter em conta qualquer sazonalidade relacionada com o fim de semana que acontece. A Figura 5.9 tem os dados relevantes com os quais você tem que trabalhar. Figura 5.9 Com este conjunto de dados, cada dia da semana constitui uma estação. Mesmo observando apenas o gráfico da Figura 5.9. Você pode dizer que a tendência do número de prisões diárias é para cima. You8217ll tem que planejar para expandir o número de agentes de trânsito, e espero que a tendência de níveis logo em breve. Além disso, os dados confirmam a noção de que mais detenções ocorrem rotineiramente às sextas-feiras e aos sábados, então sua alocação de recursos precisa abordar esses picos. Mas você precisa para quantificar a tendência subjacente, para determinar quantos adicionais polícia você tem que trazer. Você também precisa quantificar o tamanho esperado dos picos de fim de semana, para determinar quantos policiais adicionais você precisa assistindo para drivers erráticos naqueles dias. O problema é que, como de ainda você don8217t saber quanto do aumento diário é devido à tendência e quanto é devido ao efeito fim de semana. Você pode começar por detrending a série de tempo. Mais cedo neste capítulo, em 8220Simple Seasonal Averages, 8221 você viu um exemplo de como desviar uma série de tempo para isolar os efeitos sazonais usando o método de médias simples. Nesta seção você verá como fazer isso usando médias móveis, provavelmente, a abordagem de médias móveis é usada com mais freqüência na análise preditiva do que a abordagem de médias simples. Existem várias razões para a maior popularidade das médias móveis, entre elas, que a abordagem das médias móveis não pede que você colapse seus dados no processo de quantificação de uma tendência. Lembre-se que o exemplo anterior tornou necessário colapsar médias trimestrais para médias anuais, calcular uma tendência anual e, em seguida, distribuir um quarto da tendência anual em cada trimestre no ano. Esse passo era necessário para eliminar a tendência dos efeitos sazonais. Em contraste, a abordagem de médias móveis permite que você detrend a série de tempo sem recorrer a esse tipo de maquinação. A Figura 5.10 mostra como a abordagem das médias móveis funciona no exemplo atual. Figura 5.10 A média móvel no segundo gráfico esclarece a tendência subjacente. A Figura 5.10 adiciona uma coluna de média móvel, e uma coluna para períodos sazonais específicos. Para o conjunto de dados da Figura 5.9. Ambas as adições requerem alguma discussão. Os picos em prisões que ocorrem nos fins de semana dá-lhe razão para acreditar que você está trabalhando com as estações que repetem uma vez por semana. Portanto, comece por obter a média para o período abrangente, ou seja, as primeiras sete temporadas, de segunda a domingo. A fórmula para a média na célula D5, a primeira média móvel disponível, é a seguinte: Essa fórmula é copiada e colada para baixo através da célula D29, então você tem 25 médias móveis com base em 25 execuções de sete dias consecutivos. Observe que, para mostrar as primeiras e as últimas observações na série de tempo, eu tenho escondido linhas de 10 a 17. Você pode exibi-los, se você quiser, neste livro capítulo8217s, disponível no site do editor8217s. Faça uma seleção múltipla de linhas visíveis 9 e 18, clique com o botão direito do mouse em um de seus cabeçalhos de linha e escolha Unhide no menu de atalho. Quando você oculta linhas de uma planilha de trabalho, como fez na Figura 5.10. Qualquer dados mapeados nas linhas ocultas também está oculto no gráfico. Os rótulos do eixo x identificam apenas os pontos de dados que aparecem no gráfico. Como cada média móvel na Figura 5.10 engloba sete dias, nenhuma média móvel é emparelhada com as três primeiras ou três últimas observações reais. Copiar e colar a fórmula na célula D5 um dia para a célula D4 é executado fora das observações 8212não há observação registrada na célula C1. Da mesma forma, não há média móvel registrada abaixo da célula D29. Copiar e colar a fórmula em D29 em D30 exigiria uma observação na célula C33, e nenhuma observação está disponível para o dia em que a célula representaria. Seria possível, naturalmente, encurtar o comprimento da média móvel para, digamos, cinco em vez de sete. Fazer assim significaria que as fórmulas de média móvel na Figura 5.10 poderiam começar na célula D4 em vez de D5. No entanto, neste tipo de análise, você quer que a duração da média móvel seja igual ao número de estações: sete dias em uma semana para eventos que se repetem semanalmente implica uma média móvel de comprimento sete e quatro trimestres em um ano para eventos que Recur anualmente implica uma média móvel de comprimento quatro. Em linhas semelhantes, geralmente quantificamos os efeitos sazonais de tal forma que eles totalizam a zero dentro do período abrangente. Como você viu na primeira seção deste capítulo, em médias simples, isso é feito calculando a média de (digamos) os quatro trimestres em um ano, e subtraindo a média para o ano de cada figura trimestral. Assim fazendo garante que o total dos efeitos sazonais é zero. Por sua vez, that8217s útil porque ele coloca os efeitos sazonais em um efeito footing8212a verão de 11 é tão longe da média como um efeito de inverno de 821111. Se você quiser média de cinco estações em vez de sete para obter a sua média móvel, você8217re melhor Off encontrar um fenômeno que se repete a cada cinco temporadas em vez de cada sete. No entanto, quando você toma a média dos efeitos sazonais mais tarde no processo, essas médias não são susceptíveis de somar a zero. É necessário, nesse ponto, recalibrar ou normalizar. As médias para que sua soma seja zero. Quando isso é feito, as médias sazonais médias expressam o efeito em um período de tempo de pertencer a uma estação particular. Uma vez normalizadas, as médias sazonais são denominadas os índices sazonais que este capítulo já mencionou várias vezes. Compreendendo Sazonais Específicos A Figura 5.10 também mostra o que são chamados de sazonalidade específica na coluna E. Eles são os que ficaram depois de subtrair a média móvel da observação real. Para ter uma noção do que os sazonais específicos representam, considere a média móvel na célula D5. É a média das observações em C2: C8. Os desvios de cada observação da média móvel (por exemplo, C2 8211 D5) são garantidos para somar a zero 8212 que é uma característica de uma média. Portanto, cada desvio expressa o efeito de estar associado a esse dia particular naquela semana particular. É um período sazonal específico, então específico, porque o desvio se aplica a essa segunda-feira ou terça-feira e assim por diante, e sazonal, porque neste exemplo tratamos cada dia como se fosse uma estação no período abrangente de uma semana. Como cada temporada específica mede o efeito de estar naquela época em relação à média móvel para esse grupo de (aqui) sete temporadas, você pode, em seguida, classificar os períodos sazonais específicos para uma determinada temporada (por exemplo, todas as sextas-feiras na sua estação). Séries temporais) para estimar que season8217s geral, em vez de efeito específico. Essa média não é confundida por uma tendência subjacente na série temporal, porque cada estação específica expressa um desvio de sua própria média móvel particular. Alinhando as Médias Móveis Há também a questão de alinhar as médias móveis com o conjunto de dados original. Na Figura 5.10. Alinhei cada média móvel com o ponto médio da gama de observações que inclui. Assim, por exemplo, a fórmula na célula D5 faz a média das observações em C2: C8 e alinhei-a com a quarta observação, o ponto médio da faixa média, colocando-a na linha 5. Esta disposição é denominada média móvel centrada . E muitos analistas preferem alinhar cada média móvel com o ponto médio das observações que médias. Tenha em mente que, neste contexto, 8220midpoint8221 refere-se ao meio de um período de tempo: quinta-feira é o ponto médio de segunda-feira a domingo. Ele não se refere à mediana dos valores observados, embora, obviamente, possa funcionar dessa maneira na prática. Outra abordagem é a média móvel à direita. Nesse caso, cada média móvel está alinhada com a observação final de que ela média 8212 e, portanto, trilhas por trás de seus argumentos. Este é frequentemente o arranjo preferido se você quiser usar uma média móvel como uma previsão, como é feito com suavização exponencial, porque sua média móvel final ocorre coincidente com a observação disponível final. Centered Moving Averages with Even Numbers of Seasons Normalmente, adotamos um procedimento especial quando o número de estações é mesmo em vez de estranho. Esse é o típico estado de coisas: tendem a haver números pares de estações no período abrangente para épocas típicas, como meses, trimestres e períodos quadrienais (para as eleições). A dificuldade com um número par de estações é que não há ponto médio. Dois não é o ponto médio de um intervalo começando em 1 e terminando em 4, e nenhum é 3 se pode ser dito ter um, seu ponto médio é 2.5. Seis não é o ponto médio de 1 a 12, e nem é 7 seu ponto médio puramente teórico é 6,5. Para agir como se houvesse um ponto médio, você precisará adicionar uma camada de média sobre as médias móveis. Consulte a Figura 5.11. Figura 5.11 O Excel oferece várias maneiras de calcular uma média móvel centrada. A idéia por trás dessa abordagem para obter uma média móvel centrada em um ponto médio existente, quando há um número par de estações, é puxar esse ponto médio para a frente por meia temporada. Você calcula uma média móvel que seria centrada em, digamos, o terceiro ponto no tempo se cinco estações em vez de quatro constituíam uma volta completa do calendário. Isso é feito tomando duas médias móveis consecutivas e fazendo a média deles. Assim, na Figura 5.11. Existe uma média móvel na célula E6 que calcula a média dos valores em D3: D9. Como existem quatro valores sazonais em D3: D9, a média móvel em E6 é considerada como centrada na estação imaginária 2,5, meio ponto aquém da primeira temporada candidata disponível, 3. (As estações 1 e 2 não estão disponíveis como pontos médios para Falta de dados para a média antes da primeira temporada). Note-se, no entanto, que a média móvel na célula E8 média os valores em D5: D11, o segundo através do quinto na série temporal. Essa média é centrada no (imaginário) ponto 3.5, um período completo à frente da média centrada em 2,5. Ao calcular a média das duas médias móveis, então o pensamento vai, você pode puxar o ponto central da primeira média móvel para a frente por meio ponto, de 2,5 para 3. That8217s o que as médias na coluna F da Figura 5.11 fazer. A célula F7 fornece a média das médias móveis em E6 e E8. E a média em F7 é alinhada com o terceiro ponto de dados na série de tempo original, na célula D7, para enfatizar que a média é centrada nessa temporada. Se você expandir a fórmula na célula F7, bem como as médias móveis nas células E6 e E8, você verá que ele se torna uma média ponderada dos primeiros cinco valores na série de tempo, com o primeiro eo quinto valor dado um peso De 1 e o segundo a quarto valores dado um peso de 2. Isso nos leva a uma maneira mais rápida e simples de calcular uma média móvel centrada com um número par de estações. Ainda na Figura 5.11. Os pesos são armazenados na gama H3: H11. Esta fórmula retorna a primeira média móvel centrada, na célula I7: Essa fórmula retorna 13.75. Que é idêntico ao valor calculado pela fórmula de média dupla na célula F7. Fazendo a referência aos pesos absolutos, por meio dos sinais de dólar em H3: H11. Você pode copiar a fórmula e colá-lo para baixo, na medida do necessário para obter o resto das médias móveis centradas. Detrender a série com médias móveis Quando você tiver subtraído as médias móveis das observações originais para obter os valores sazonais específicos, você removeu a tendência subjacente da série. O que é deixado nos sazonais específicos é normalmente uma série estacionária, horizontal, com dois efeitos que fazem com que os sazonais específicos partam de uma linha absolutamente reta: os efeitos sazonais e erro aleatório nas observações originais. A Figura 5.12 mostra os resultados para este exemplo. Figura 5.12 Os efeitos sazonais específicos para sexta-feira e sábado permanecem claros na série detrended. O gráfico superior na Figura 5.12 mostra as observações diárias originais. Tanto a tendência ascendente geral como os picos sazonais de fim de semana são claros. O gráfico inferior mostra os dados sazonais específicos: o resultado de desviar da série original com um filtro de média móvel, conforme descrito anteriormente em 8220. Compreendendo Sazonais Específicos.8221 Você pode ver que a série detrended é agora praticamente horizontal (uma linha de tendência linear para os sazonais específicos Tem uma ligeira descida), mas os picos sazonais de sexta e sábado ainda estão no lugar. O próximo passo é ultrapassar os sazonais específicos para os índices sazonais. Consulte a Figura 5.13. Figura 5.13 Os efeitos sazonais específicos são primeiro calculados pela média e depois normalizados para atingir os índices sazonais. Na Figura 5.13. Os sais sazonais específicos na coluna E são rearranjados na forma tabular ilustrada na gama H4: N7. O objetivo é simplesmente facilitar o cálculo das médias sazonais. Essas médias são mostradas em H11: N11. No entanto, os números em H11: N11 são médias, não desvios de uma média, e portanto podemos esperar que eles somem a zero. Nós ainda precisamos ajustá-los para que eles expressam desvios de um grande meio. Essa grande média aparece na célula N13, e é a média das médias sazonais. Podemos chegar aos índices sazonais subtraindo a grande média em N13 de cada uma das médias sazonais. O resultado está na gama H17: N17. Esses índices sazonais deixam de ser específicos a uma determinada média móvel, como é o caso dos dados sazonais específicos na coluna E. Como eles são baseados em uma média de cada instância de uma determinada estação, eles expressam o efeito médio de uma determinada estação em todo o período Quatro semanas na série de tempo. Além disso, são medidas de uma estação, um dia em que as prisões de trânsito são visíveis em relação à média de um período de sete dias. Podemos agora usar esses índices sazonais para dessazonalizar a série. Utilizaremos a série dessazonalizada para obter previsões por meio de regressão linear ou método Holt8217s de suavização de séries tendenciosas (discutido no Capítulo 4). Então nós simplesmente somamos os índices sazonais de volta às previsões para reseasonalize eles. Tudo isso aparece na Figura 5.14. Figura 5.14 Depois de ter os índices sazonais, os toques finais aplicados aqui são os mesmos do método de médias simples. As etapas ilustradas na Figura 5.14 são em grande parte as mesmas que as das Figuras 5.6 e 5.7. Discutido nas seções a seguir. Desestacionando as Observações Subtraia os índices sazonais das observações originais para dessazonalizar os dados. Você pode fazer isso como mostrado na Figura 5.14. Em que as observações originais e os índices sazonais são organizados como duas listas começando na mesma linha, colunas C e F. Este arranjo torna um pouco mais fácil de estruturar os cálculos. Você também pode fazer a subtração como mostrado na Figura 5.6. Em que as observações trimestrais originais (C12: F16), os índices trimestrais (C8: F8) e os resultados dessazonalizados (C20: F24) são mostrados em formato tabular. Esse arranjo torna um pouco mais fácil de se concentrar nos índices sazonais e os trimestrais dessazonalizados. Previsão das Observações desestacionalizadas Na Figura 5.14. As observações dessazonalizadas estão na coluna H e na Figura 5.7 estão na coluna C. Independentemente de você desejar usar uma abordagem de regressão ou uma abordagem de suavização da previsão, é melhor organizar as observações dessazonalizadas em uma lista de uma única coluna. Na Figura 5.14. As previsões estão na coluna J. A seguinte fórmula de matriz é inserida no intervalo J2: J32. Anteriormente neste capítulo, eu apontei que se você omitir o argumento x-values dos argumentos de função TREND () function8217s, o Excel fornece os valores padrão 1. 2. N. Onde n é o número de valores y. Na fórmula dada anteriormente, H2: H32 contém 31 valores y. Como o argumento normalmente contendo os valores x está faltando, o Excel fornece os valores padrão 1. 2. 31. Esses são os valores que nós gostaríamos de usar de qualquer maneira, na coluna B, então a fórmula como dado é equivalente a TREND (H2: H32, B2: B32). E essa é a estrutura usada em D5: D24 da Figura 5.7: Fazendo a Previsão de Um Passo Ahead Até agora, você arranjou previsões das séries temporais dessazonalizadas de t 1 a t 31 na Figura 5.14. E de t 1 a t 20 na Figura 5.7. Estas previsões constituem informações úteis para vários fins, incluindo a avaliação da exactidão das previsões através de uma análise RMSE. Mas seu objetivo principal é prever, pelo menos, o próximo, ainda não observado período de tempo. Para conseguir isso, você pode primeiro prever a partir da função TREND () ou PROJ. LIN () se você estiver usando a regressão, ou da fórmula de suavização exponencial se você usar o método Holt8217s. Em seguida, você pode adicionar o índice sazonal associado à previsão de regressão ou suavização, para obter uma previsão que inclua a tendência eo efeito sazonal. Na Figura 5.14. Você obtém a previsão de regressão na célula J33 com esta fórmula: Nesta fórmula, os valores de y em H2: H32 são os mesmos que nas outras fórmulas de TREND () na coluna J. Assim são os valores de x (padrão) de 1 Até 32. Agora, porém, você fornece um novo valor x como o terceiro argumento de function8217s, que você diz para TREND () procurar na célula B33. It8217s 32. O próximo valor de t. E Excel retorna o valor 156.3 na célula J33. A função TREND () na célula J33 está dizendo ao Excel, na verdade, 8220Cálculo da equação de regressão para os valores em H2: H32 regrediu nos valores t de 1 a 31. Aplicar essa equação de regressão para o novo valor de x de 32 e retornar o resultado.8221 Você encontrará a mesma abordagem na célula D25 da Figura 5.7. Onde a fórmula para obter a previsão um passo adiante é esta: Adicionando os índices sazonais Voltar Na etapa final é reseasonalize as previsões, adicionando os índices sazonais para as previsões de tendência, reverter o que você fez quatro passos para trás quando você subtraiu o Índices das observações originais. Isso é feito na coluna F na Figura 5.7 e na coluna K na Figura 5.14. Não esqueça de adicionar o índice sazonal apropriado para a previsão de um passo à frente, com os resultados mostrados na célula F25 na Figura 5.7 e na célula K33 na Figura 5.14. Você pode encontrar gráficos de três representações dos dados de detenção de tráfego na Figura 5.15. A série dessazonalizada, a previsão linear a partir dos dados dessazonalizados, e as previsões reseasonalized. Observe que as previsões incorporam tanto a tendência geral dos dados originais quanto os picos de sexta-feira / sábado. Na segunda coluna desta tabela, é mostrada uma média móvel de ordem 5, fornecendo uma estimativa do ciclo de tendência. O primeiro valor nesta coluna é a média das cinco primeiras observações (1989-1993) o segundo valor na coluna 5-MA é a média dos valores 1990-1994 e assim por diante. Cada valor na coluna 5-MA é a média das observações no período de cinco anos centrado no ano correspondente. Não há valores para os dois primeiros anos ou últimos dois anos porque não temos duas observações de cada lado. Na fórmula acima, a coluna 5-MA contém os valores de hat com k2. Para ver como é a estimativa do ciclo tendencial, traçamos o gráfico juntamente com os dados originais da Figura 6.7. Lote 40 elecsales, principal quotResidential vendas de eletricidade, ylab quotGWhquot. Observe como a tendência (em vermelho) é mais suave do que os dados originais e captura o movimento principal da série de tempo sem todas as flutuações menores. O método da média móvel não permite estimativas de T em que t está próximo das extremidades da série, portanto, a linha vermelha não se estende para os bordos do gráfico em qualquer lado. Mais tarde usaremos métodos mais sofisticados de estimativa de tendência-ciclo que permitem estimativas próximas aos pontos finais. A ordem da média móvel determina a suavidade da estimativa de tendência-ciclo. Em geral, uma ordem maior significa uma curva mais suave. O gráfico a seguir mostra o efeito da alteração da ordem da média móvel para os dados de vendas de eletricidade residencial. As médias móveis simples como estas são normalmente de ordem ímpar (por exemplo, 3, 5, 7, etc.). Isto é assim que são simétricas: numa média móvel de ordem m2k1, existem k observações anteriores, k observações posteriores e a observação do meio Que são médias. Mas se m fosse uniforme, não seria mais simétrico. Médias móveis de médias móveis É possível aplicar uma média móvel a uma média móvel. Uma razão para fazer isso é fazer uma média móvel de ordem uniforme simétrica. Por exemplo, podemos pegar uma média móvel de ordem 4 e, em seguida, aplicar outra média móvel de ordem 2 aos resultados. Na Tabela 6.2, isto foi feito para os primeiros anos dos dados da produção de cerveja trimestral australiana. Beer2 lt - window 40 ausbeer, início 1992 41 ma4 ltm 40 beer2, ordem 4. center FALSE 41 ma2x4 ltm 40 beer2, ordem 4. center TRUE 41 A notação 2times4-MA na última coluna significa um 4-MA Seguido por um 2-MA. Os valores na última coluna são obtidos tomando uma média móvel de ordem 2 dos valores na coluna anterior. Por exemplo, os dois primeiros valores na coluna 4-MA são 451,2 (443410420532) / 4 e 448,8 (410420532433) / 4. O primeiro valor na coluna 2times4-MA é a média destes dois: 450,0 (451.2448.8) / 2. Quando um 2-MA segue uma média móvel de ordem par (como 4), é chamado de média móvel centrada de ordem 4. Isto é porque os resultados são agora simétricos. Para ver que este é o caso, podemos escrever o 2times4-MA da seguinte forma: begin hat amp frac Bigfrac (y y y y) frac (y y y y) Big frac fray frac14y frac14y frac14y frac18y. Fim É agora uma média ponderada das observações, mas é simétrica. Outras combinações de médias móveis também são possíveis. Por exemplo, um 3 x 3 MA é frequentemente utilizado e consiste numa média móvel de ordem 3 seguida por outra média móvel de ordem 3. Em geral, uma ordem par MA deve ser seguida por uma ordem par MA para torná-lo simétrico. Similarmente, uma ordem ímpar MA deve ser seguida por uma ordem ímpar MA. Estimativa do ciclo de tendência com dados sazonais O uso mais comum de médias móveis centradas é estimar o ciclo de tendência a partir de dados sazonais. Considere o 2x4-MA: fracasso do chapéu frac14y frac14y frac14y frac18y. Quando aplicado a dados trimestrais, cada trimestre do ano recebe igual peso, uma vez que o primeiro eo último termo se aplicam ao mesmo trimestre em anos consecutivos. Conseqüentemente, a variação sazonal será média e os valores resultantes de hat t terão pouca ou nenhuma variação sazonal restante. Obter-se-ia um efeito semelhante utilizando uma mistura de 2 x 8-MA ou 2 x 12-MA. Em geral, uma m-MA 2x é equivalente a uma média móvel ponderada de ordem m1 com todas as observações tomando peso 1 / m, exceto para o primeiro e último termos que tomam pesos 1 / (2m). Portanto, se o período sazonal é par e de ordem m, use um m-MA de 2x para estimar o ciclo tendencial. Se o período sazonal é ímpar e de ordem m, use um m-MA para estimar o ciclo de tendência. Em particular, um 2 x 12-MA pode ser usado para estimar o ciclo de tendência de dados mensais e um 7-MA pode ser usado para estimar a tendência-ciclo de dados diários. Outras escolhas para a ordem do MA normalmente resultarão em estimativas de ciclo de tendência sendo contaminadas pela sazonalidade nos dados. Exemplo 6.2 Fabricação de equipamento elétrico A Figura 6.9 mostra uma 2 x 12-MA aplicada ao índice de ordens de equipamentos elétricos. Observe que a linha lisa não mostra sazonalidade é quase o mesmo que o ciclo de tendência mostrado na Figura 6.2 que foi estimado usando um método muito mais sofisticado do que as médias móveis. Qualquer outra escolha para a ordem da média móvel (exceto 24, 36, etc.) teria resultado em uma linha suave que mostra algumas flutuações sazonais. Plot 40 elecequip, ylab quotNovas ordens indicequot. Col quotgrayquot, main quotred 41 Química média ponderada As médias combinadas das médias móveis resultam em médias móveis ponderadas. Por exemplo, o 2x4-MA discutido acima é equivalente a um 5-MA ponderado com pesos dados por frac, frac, frac, frac, frac. Em geral, uma m-MA ponderada pode ser escrita como hat t sum k aj y, onde k (m-1) / 2 e os pesos são dados por a, dots, ak. É importante que todos os pesos somem a um e que sejam simétricos para que aj a. O m-MA simples é um caso especial onde todos os pesos são iguais a 1 / m. Uma grande vantagem das médias móveis ponderadas é que elas produzem uma estimativa mais suave do ciclo tendencial. Em vez das observações que entram e que deixam o cálculo no peso cheio, seus pesos são aumentados lentamente e então lentamente diminuídos resultando em uma curva mais lisa. Alguns conjuntos específicos de pesos são amplamente utilizados. Algumas delas são dadas na Tabela 6.3.é uma declaração de futuro. É uma base para o planejamento, não é para prever apenas a demanda, requer uma mistura hábil de arte e ciência, assume que o sistema subjacente continuará a existir no futuro e raramente é perfeito. As previsões para grupos de itens tendem a ser mais precisas do que as previsões para itens individuais, porque os erros de previsão entre itens de um grupo geralmente têm um efeito de cancelamento. A precisão das previsões diminui à medida que o período de tempo coberto pela previsão aumenta. Elementos de uma boa previsão: O horizonte de previsão deve cobrir o tempo necessário para implementar possíveis mudanças. O grau de precisão deve ser indicado. A previsão deve ser confiável deve trabalhar consistentemente. A previsão deve ser expressa em unidades significativas. A previsão deve ser por escrito. A previsão deve ser simplesmente para entender e usar, ou consistente com dados históricos intuitivamente. Determinar a finalidade da previsão. Qual é o seu propósito e quando será necessário Estabelecer um horizonte de tempo. Selecione uma técnica de previsão. Reunir e analisar dados. Prepare a previsão. Monitorar a previsão. Opiniões executivas, principalmente para planejamento de longo prazo e introdução de novos produtos. A visão de uma pessoa pode prevalecer. Compostos de contato direto com o cliente. Incapaz de distinguir entre o que os clientes gostariam de fazer eo que eles realmente vão fazer. Poderia excessivamente influenciado por recentes experiências de vendas. Baixas vendas podem levar a estimativas baixas. Conflito de interesses. Estimativas de vendas baixas levam a um melhor desempenho de vendas. Dados de ponto de vendas ou ponto de vendas (POS). Caro e demorado. Possível existência de padrões irracionais. Baixas taxas de resposta. Opiniões de gerentes e funcionários. Método de Delphi (Rand Corp. 1948): Os gerentes e funcionários completam uma série de questionários, cada um desenvolvido a partir do anterior, para alcançar uma previsão consensual. Oslash Previsão tecnológica. Oslash Previsão de longo prazo de uma única vez. Os dados Oslash são caros para obter. 2.1.2 Previsões estatísticas (séries temporais) s É extremamente importante traçar dados e examiná-los antes de fazer qualquer análise ou previsão. Uma previsão de demanda deve ser baseada em uma série de tempo de demanda passada em vez de vendas ou remessa. Tendência: Um movimento ascendente ou descendente de dados em longo prazo. Sazonalidade: variações regulares de curto prazo relacionadas com o tempo, férias ou outros fatores. Ciclo: variação em forma de onda que dura mais de um ano. Variação Irregular: Causado por circunstâncias incomuns, não refletindo comportamento típico. Variação aleatória: variação residual após todos os outros comportamentos são contabilizados. Previsão ingénua A previsão para qualquer período é igual ao valor real do período anterior8217s. Previsão de tempo. E os dados reais no tempo. Middot Rápido e fácil de preparar. Middot Fácil de entender. Middot Pode ser aplicado a dados com sazonalidade e tendência. Previsão de tempo, intervalo de tempo, dados reais no tempo, estação / tendência constante dependente, e uma temporada / período de tempo de tendência. O aumento da precisão de outros métodos precisa justificar o recurso adicional necessário para alcançar essa precisão. (Ponderada) Média móvel A média móvel usa um número dos valores de dados reais mais recentes na geração de uma previsão. Refere-se ao período mais recente, número de períodos (pontos de dados) na média móvel, valor real com a idade. Peso de. E média móvel das previsões mais recentes. Middot Fácil de computar e entender. Middot A previsão média móvel se atrasa e suaviza a previsão real. Middot O número de pontos de dados na média determina a sua sensibilidade a cada novo ponto de dados: quanto menos pontos de dados em uma média, mais responsiva a média tende a ser. Middot Os pesos podem ser adicionados a valores na média para tornar a média resultante mais responsiva a alguns pontos de dados recentes. No entanto, pesos envolvem o uso de tentativa e erro para encontrar pesos adequados. Suavização exponencial A suavização exponencial é um método de média ponderada com base na previsão anterior mais uma porcentagem de seu erro de previsão. Previsão de período, previsão de período, constante de suavização,. E demanda real ou vendas por período. Valores comumente utilizados entre 0,05 e 0,50. Valores baixos de são utilizados quando a média subjacente tende a ser valores mais elevados estáveis são utilizados quando a média subjacente é susceptível de alteração. A previsão média móvel ou ingênua pode ser usada para gerar a previsão inicial para suavização exponencial. Um simples enredo de dados pode muitas vezes revelar a existência ea natureza de uma tendência. Tendências lineares são bastante comuns e mais fáceis de trabalhar. Linear Trend especificou o número de períodos de tempo, previsão de período, valor de at. E inclinação da linha. Usando dados históricos, ambos os coeficientes podem ser computados como número de períodos e valor de tempo. Tendência Ajustada Suavização Exponencial (Double Smoothing) suavizada previsão, estimativa de tendência atual, onde e estão alisando constantes, e. A sazonalidade é movimento regular em valores de série que podem ser ligados a eventos recorrentes. Também é aplicado a padrões diários, semanais, mensais e outros padrões regulares recorrentes nos dados. Se uma série de dados tende a variar em torno de um valor médio, a sazonalidade é expressa em termos dessa média se a tendência estiver presente, a sazonalidade é expressa em termos do valor da tendência. Existem dois modelos de sazonalidade: aditivo e multiplicativo. Na prática, as empresas usam o modelo multiplicativo muito mais freqüentemente do que o modelo aditivo. O modelo sazonal mais simples é uma variação da técnica naiumlve descrita para médias. No modelo multiplicativo, as percentagens sazonais são referidas como parentes sazonais ou índices sazonais. Parentes sazonais são usados em dessazonalizar dados ou incorporar sazonalidade em uma previsão. A dessazonalização dos dados é realizada dividindo cada ponto de dados pelo seu correspondente relativo sazonal. A incorporação da sazonalidade pode ser realizada da seguinte maneira: 1. Obtenha estimativas de tendência para períodos desejados usando uma equação de tendência. 2. Adicionar sazonalidade às estimativas de tendência multiplicando estas estimativas de tendência pelos parentes sazonais correspondentes. Um método comumente usado para computar parentes sazonais envolve a computação de uma média móvel centrada. Por exemplo, suponha os seguintes dados de séries temporais: A média de 3 períodos é 42,67. Como uma média centrada, é posicionada no período 2. A relação da demanda no período 2 com esta média centrada é uma estimativa do parente sazonal no período 2. Como a relação é 46 / 42.671.08, a série é de cerca de 8 Acima da média nesse ponto. Geralmente é necessário calcular os índices sazonais para um número de estações e média deles para alcançar uma estimativa razoável de sazonalidade para qualquer estação. Por exemplo, a relação estimada de sexta-feira da seguinte tabela é (1,36 1,40 1,33) / 3 1,36. Quando o número de períodos para calcular a média móvel centrada é uniforme, é necessário um passo adicional, porque o meio de um conjunto par se situa entre dois períodos. O passo adicional requer a tomada de uma média móvel de 2 períodos centrada da média móvel centrada em número par (ver problema 5 do Capítulo 3). Os ciclos são movimento ascendente e descendente semelhante a variações sazonais mas de maior duração, e. Dois a seis anos entre picos. É difícil projetar ciclos de dados passados, porque pontos de viragem são difíceis de identificar. Uma média móvel curta ou uma abordagem ingênua pode ser de algum valor. Alta correlação de uma previsão com as principais variáveis pode ser útil no cálculo da previsão. Regressão linear simples A regressão linear simples fornece uma equação linear de duas variáveis, que minimiza a soma de derivações verticais quadradas de pontos de dados da linha. A equação é predita / variável dependente, preditor / variável independente, inclinação da linha e valor de. quando . Os coeficientes e da linha são calculados usando as duas equações seguintes: número de observações emparelhadas. A linha de regressão é a melhor para ser usada para o intervalo de valores observados. A correlação mede a força ea direção da relação entre duas variáveis. A correlação pode variar de 82111.00 a 1.00. Middot Uma correlação de 1,00 indica que as mudanças em uma variável são sempre acompanhadas por aumentos no outro middot A correlação de 82111.00 indica que aumentos em uma variável são correspondidos por diminuições no outro middot A correlação perto de zero indica pouca relação linear entre duas variáveis . A correlação de duas variáveis pode ser calculada usando a seguinte equação: O quadrado do coeficiente de correlação,. Fornece uma medida de quão bem uma regressão linha 8220fits8221 os dados. Os valores variam de 0 a 1.00. Quanto mais perto estiver de 1,00, melhor o ajuste. Indica a porcentagem de variação na variável dependente que pode ser contabilizada no modelo pela variável independente. Um alto valor de. Digamos 0,80 ou mais, indica que a variável independente é um bom preditor de valores da variável dependente. Um baixo valor de. Dizer 0,25 ou menos, indica um preditivo pobre. Middot Um valor entre 0,25 e 0,80 indica um predicador moderado. Middot As variações em torno da linha são aleatórias. Nenhum padrão, como ciclos ou tendências, deve ser aparente, quando a linha e os dados são plotados. Middot Os desvios em torno da linha devem ser normalmente distribuídos: uma concentração de valores próximo da linha com uma pequena proporção de grandes desvios suporta a suposição de normalidade. Middot As melhores previsões são feitas dentro do intervalo de valores observados. Middot Sempre trace os dados para verificar se uma relação linear é apropriada. Middot Os dados podem depender do tempo. Verifique isso representando a variável dependente em função do tempo se os padrões aparecerem, use a análise de séries temporais em vez da regressão ou use o tempo como uma variável independente como parte de uma análise de regressão múltipla. Middot Uma pequena correlação pode implicar que outras variáveis são importantes. Middot Regressão linear simples aplica-se apenas à relação linear com uma variável independente. Middot Um precisa de uma quantidade considerável de dados para estabelecer a relação --- na prática, 20 ou mais observações. Middot Todas as observações são ponderadas igualmente. Quando um modelo linear é inadequado ou mais de uma variável preditora está envolvida, você pode querer considerar a regressão curvilínea. A previsão de regressão múltipla aumenta substancialmente os requisitos de dados. Recomenda-se ponderar o custo adicional eo esforço contra a melhoria potencial na precisão da previsão. É importante incluir uma indicação de até que ponto a previsão pode desviar-se do valor da variável que realmente ocorre. Isso proporcionará ao usuário da previsão uma melhor perspectiva sobre o quão longe uma previsão pode ser. Isso também fornece um tomador de decisão uma medida de precisão para usar como base para comparação, ao escolher entre diferentes técnicas. 2.2.1 Precisão de previsão O erro de previsão é definido como a diferença entre real e previsão, ou seja, duas medidas comumente usadas são middot Desvio absoluto médio (MAD) middot Erro quadrático médio (MSE) A diferença entre essas duas medidas é que MAD pondera todos os erros Uniformemente, e MSE pesos erros de acordo com seus valores quadrados. Para o uso dessas medidas, MAD ou MSE, um gerente poderia comparar os resultados de suavização exponencial com valores de .1. 2 e .3, e selecione aquele que produz o menor MAD ou MSE para um dado conjunto de dados. 2.2.2 Controle de Previsão É necessário monitorar erros de previsão para assegurar que a previsão esteja funcionando adequadamente ao longo do tempo. Isso geralmente é realizado comparando erros de previsão com valores predefinidos ou com limites de ação. Como ilustrado abaixo. Possíveis fontes de erros de previsão: middot a omissão de uma variável importante, middot uma mudança repentina ou inesperada na variável (causada por fenômenos climáticos severos ou outros fenômenos de natureza, escassez temporária ou quebra, catástrofe ou eventos semelhantes), aparência middot de uma nova Variável, middot sendo usado incorretamente, dados middot sendo mal interpretados, e middot variação aleatória. Dois métodos comuns no controle / monitoramento de previsão são o sinal de rastreamento eo gráfico de controle. Sinal de rastreamento Um sinal de rastreamento focaliza a proporção do erro de previsão acumulado para o MAD correspondente: O sinal de rastreamento geralmente varia de para. Para a maior parte, vamos usar limites de. Que são aproximadamente comparáveis a três limites de desvio padrão. Valores dentro dos limites sugerem --- mas não garantem --- que a previsão está funcionando adequadamente. MAD pode ser atualizado usando a seguinte equação de suavização exponencial: Gráfico de controle O gráfico de controle define os limites como múltiplos da raiz quadrada de MSE. Suposições básicas são middot Os erros de previsão são distribuídos aleatoriamente em torno de uma média de zero, e middot A distribuição de erros é normal. A raiz quadrada de MSE é usada na prática como uma estimativa do desvio padrão da distribuição de erros. Ou seja, para uma distribuição normal, 95 dos erros se enquadram dentro. E aproximadamente 99.7 dos erros se enquadram dentro. Erros fora destes limites devem ser considerados como evidência de que é necessária uma ação corretiva. Traçar os erros com a ajuda de um gráfico de controle pode ser muito informativo. Um gráfico ajuda você a visualizar o processo e permite que você verifique possíveis padrões, erros não aleatórios, dentro do limite que sugere que uma melhor previsão é possível. A abordagem do gráfico de controle é geralmente superior à abordagem do sinal de rastreamento. A principal fraqueza da abordagem do sinal de rastreamento é o uso de erros cumulativos: os erros individuais podem ser obscurecidos de modo que grandes erros positivos e negativos se anulam. Dois fatores mais importantes são custo e precisão. De um modo geral, quanto maior a precisão, maior o custo, por isso é importante para ponderar custo-precisão trade-offs com cuidado. Ao decidir entre alternativas de previsão, o gerente de operações precisa considerar o desempenho histórico de uma previsão, e middot a capacidade de uma previsão para responder às mudanças. Diretriz de seleção do método de previsão: fatores de previsão, por faixa de previsão Manter informações precisas e atualizadas sobre preço, demanda e outras variáveis pode ter um impacto significativo na precisão da previsão. As previsões que cobrem prazos curtos tendem a ser mais precisas do que previsões de longo prazo. A gestão pode optar por dedicar esforços a encurtar o horizonte temporal da previsão. Isso exigiria flexibilidade nas operações para responder a tal previsão.
Comments
Post a Comment