Uma maneira realmente boa de encontrar periodicidade em qualquer série regular de dados é inspecionar seu espectro de energia após a remoção de qualquer tendência geral. A remoção preliminar da tendência (e diferenciação opcional para remover a correlação serial) é essencial para evitar períodos de confusão com outros comportamentos. O espectro de potência é a transformada de Fourier discreta da função de autocovariância de uma versão adequadamente suavizada da série original. Se você pensar nas séries temporais como amostragem de uma forma de onda física, você pode estimar quanto da potência total das ondas é transportada dentro de cada freqüência. O espectro de potência (ou periodograma) representa a potência versus a frequência. Cíclicos (isto é, padrões repetitivos ou sazonais) aparecerão como grandes picos localizados em suas freqüências. Como exemplo, considere esta série temporal (simulada) de resíduos de uma medição diária tomada por um ano (365 valores). Os valores flutuam em torno de 0 sem quaisquer tendências evidentes, mostrando que todas as tendências importantes foram removidas. A flutuação parece aleatória: nenhuma periodicidade é aparente. Heres outro lote dos mesmos dados, desenhado para nos ajudar a ver possíveis padrões periódicos. Se você olhar realmente difícil, você pode ser capaz de discernir um padrão ruidoso, mas repetitivo que ocorre 11 a 12 vezes. As sequências longas de valores acima de zero e abaixo de zero sugerem pelo menos alguma autocorrelação positiva, mostrando que esta série não é completamente aleatória. Aqui está o periodograma, mostrado para freqüências de até 91 (um quarto do comprimento total da série). Foi construído com uma janela de Welch e normalizado à área da unidade (para o periodogram inteiro, não apenas a parte mostrada aqui). O poder parece ruído branco (pequenas flutuações aleatórias) mais dois picos proeminentes. Eles são difíceis de perder, não são maiores. O maior ocorre em um período de 12 eo menor em um período de 52. Este método tem assim detectado um ciclo mensal e um ciclo semanal nestes dados. Isso é realmente tudo o que há para ele. Para automatizar a detecção de ciclos (sazonalidade), basta verificar o periodograma (que é uma lista de valores) para máximos locais relativamente grandes. É hora de revelar como esses dados foram criados. Os valores são gerados a partir de uma soma de duas ondas senoidais, uma com frequência 12 (de amplitude quadrada 3/4) e outra com frequência 52 (de amplitude quadrática 1/4). Estes são o que os picos no periodograma detectado. Sua soma é mostrada como a espessa curva preta. Iid O ruído normal de variância 2 foi então adicionado, como mostrado pelas barras cinzentas claras que se estendem desde a curva preta até os pontos vermelhos. Este ruído introduziu os wiggles de baixo nível na parte inferior do periodograma, que de outra forma seria apenas um 0. O total de dois terços da variação total dos valores é não periódica e aleatória, o que é muito ruidoso: é por isso que a sua Tão difícil de distinguir a periodicidade apenas olhando para os pontos. No entanto (em parte porque há tantos dados) encontrar as freqüências com o periodograma é fácil eo resultado é claro. Instruções e bons conselhos para periodogramas de computação aparecem no site Numerical Recipes: procure a seção sobre estimativa do espectro de potência usando a FFT. R tem código para estimativa de periodograma. Essas ilustrações foram criadas no Mathematica 8, o periodograma foi computado com sua função de Fourier. A assumptionquotafter a remoção de qualquer trendquotis geral do calcanhar de Aquiles, como pode haver muitas tendências de tempo, muitas mudanças de nível, todos os quais foram excluídos em seu exemplo. A idéia de que as séries de entrada são deterministas na natureza voa no Face à possível presença de estrutura sazonal e regular da ARIMA. Os Valores Únicos Incomuns não-tratados distorcerão qualquer esquema de identificação baseado em periodograma devido a uma tendência descendente para as estimativas do periodograma que produzem significância. Se os efeitos semanais e / ou mensais mudaram em algum ponto no passado, o procedimento baseado no periodograma falharia ndash IrishStat Sep 29 11 at 0:06 Irlandês Eu acho que seu comentário pode exagerar um pouco. É mais elementar para procurar e tratar quotUnusual One-Time Valuesquot (aka outliers), por isso só vale a pena mencionar para enfatizar que alguns estimadores de séries temporais podem ser sensíveis a outliers. O termo "determinista", em detrimento da natureza, desvirtua as idéias básicas: ninguém supõe que haja determinismo (como evidenciado pela enorme quantidade de ruído na simulação). A simulação incorpora um sinal periódico definido como modelo - sempre aproximado na realidade - apenas para ilustrar a conexão entre o periodograma ea sazonalidade. Sim, mudanças na sazonalidade podem obscurecer o periodograma (e o acf, etc.), especialmente mudanças na freqüência (improvável) ou na fase (possível). As referências no meu post dar uma solução para lidar com isso: eles recomendam o uso de uma janela em movimento para estimativa periodograma. Há uma arte para isso, e claramente há armadilhas, de modo que muita análise de séries de tempo vai beneficiar de tratamento especializado, como você defende. Mas a questão pergunta se existem outros métodos para detectar sazonalidade e, inegavelmente, o periodograma é uma opção estatisticamente poderosa, computacionalmente eficiente e facilmente interpretável. Ndash whuber 9830 Sep 29 11 at 16:46 No meu mundo usando senos / cosenos são efeitos quotdeterministicquot muito como mês do ano indicadores. O ajuste de qualquer modelo pré-especificado restringe os valores ajustados a um padrão especificado pelo usuário, muitas vezes sub-padrão. Os dados devem ser quotlistened para ajudar o analista / software de computador avançado discernir efetivamente entre entradas fixas e estocásticas n. b. Refiro-me a ARIMA retarda as estruturas como quotdrivers estocásticos ou adaptáveis como os valores ajustados ajustar / adaptar-se a mudanças na história da série. Na minha opinião a utilização do periodograma quotoversellsquot simples modelagem estatística ndash IrishStat Sep 29 11 at 17:44 whuber Repetindo a mesma coisa pode não ser útil. No entanto, pode ser bom também para corrigir o parágrafo abaixo do periodograma para dizer que os picos estão localizados em uma quotfrequency ofquot 12 e 52 vezes por ano, e não quotperiod dequot. Corrigir o enredo também para dizer quotfrequencyquot em vez de quotperiodquot pode ser agradável também se você acha que não é muito irritante. Ndash Celelibi 11 de outubro at 15:29 A sazonalidade pode e muitas vezes muda ao longo do tempo, assim, as medidas sumárias podem ser bastante inadequadas para detectar a estrutura. É necessário testar a transitoriedade nos coeficientes ARIMA e, muitas vezes, mudanças nos manequins sazonais. Por exemplo, em um horizonte de 10 anos pode ter havido efeito de junho para os primeiros k anos, mas nos últimos 10 k anos há evidências de um efeito de junho. Um efeito composto simples de junho pode não ser significativo, pois o efeito não foi constante ao longo do tempo. De forma semelhante, um componente ARIMA sazonal pode também ter mudado. Deve-se ter cuidado para incluir mudanças de nível local e / ou tendências de tempo locais, assegurando ao mesmo tempo que a variância dos erros permaneceu constante ao longo do tempo. Não se devem avaliar transformações como GLS / mínimos quadrados ponderados ou transformações de potência como logs / raízes quadradas, etc. sobre os dados originais, mas sobre os erros de um modelo tentativo. As suposições gaussianas não têm nada a ver com os dados observados, mas tudo a ver com os erros do modelo. Isso se deve aos pressupostos dos testes estatísticos que utilizam a razão de uma variável chi-quadrada não-central para uma variável chi-quadrado central. Se você quis postar uma série do exemplo de seu mundo eu estaria contente de fornecer-lhe ea lista uma análise completa que conduz à deteção da estrutura seasonal. Respondeu Sep 27 11 at 18:36 Charlies resposta é boa, e é onde começar Id. Se você não quiser usar gráficos ACF, você pode criar k-1 variáveis dummy para os k períodos de tempo presentes. Então você pode ver se as variáveis dummy são significativas em uma regressão com as variáveis dummy (e provavelmente um termo de tendência). Se os seus dados são trimestrais: o manequim Q2 é 1 se este é o segundo trimestre, senão 0 manequim Q3 é 1 se este é o terceiro trimestre, senão 0 manequim Q4 é 1 se este é o quarto trimestre, senão 0 Nota trimestre 1 é o Caso base (todos os 3 dummies zero) Você pode querer verificar também a decomposição de séries temporais no Minitab - muitas vezes chamado de decomposição clássica. No final, você pode querer usar algo mais moderno, mas este é um lugar simples para começar. Eu sou um pouco novo para R eu mesmo, mas a minha compreensão da função ACF é que se a linha vertical vai acima da linha tracejada superior ou abaixo da linha tracejada inferior, há alguma autorregressão (incluindo a sazonalidade) . Tente criar um vetor de seno. Ajustar senos / cosenos etc pode ser útil para algumas séries de tempo física / elétrica, mas você deve estar ciente de MSB. Modelo de Especificação Bias. Ndash IrishStat Sep 28 11 at 14:31 Autoregression não implica sazonalidade. Ndash Jens Nov 22 13 at 12:32 Sua resposta 2017 Stack Exchange, IncMetaTrader 4 - Econometria de Sistemas de Negociação EURUSD One-Step-Ahead Forecast Introdução O artigo centra-se na previsão one-step-ahead para EURUSD usando EViews software e uma avaliação adicional de previsão Resultados por meio do programa em EViews e um Expert Advisor desenvolvido em MQL4. É construído sobre o artigo Analisando os Indicadores Parâmetros Estatísticos cujas proposições serão utilizadas sem quaisquer esclarecimentos adicionais. 1. Construindo um Modelo O artigo anterior terminou com a análise da seguinte equação de regressão: EURUSD C (1) EURUSDHP (1) C (2) D (EURUSDHP (1)) C (3) D (EURUSDHP A equação foi resultado da implementação da decomposição gradual das cotações de preços iniciais. A idéia por trás dele é baseada na separação de um componente determinístico das citações iniciais e uma análise mais adicional do residual resultante. Vamos começar a construir um modelo para o EUR / USD H1 nas barras durante um período de uma semana de 12 de setembro de 2017 a 17 de setembro de 2017. 1.1. Análise das cotações iniciais do EURUSD Começamos com a análise da série EURUSD inicial para planejar o próximo passo. Primeiro, vamos criar um arquivo contendo aspas para análise posterior em EViews. Para isso, uso um indicador sobreposto a um gráfico relevante para gerar um arquivo necessário com aspas. O script do indicador é mostrado abaixo e na minha opinião não precisa de comentários. Depois de definir as datas especificadas acima, eu obtive o arquivo de citações consistindo de 119 linhas, a última linha sendo Previsão, 0 é onde a previsão futura será. Tenha em mente que estou usando os preços abertos. Observe também que as aspas no arquivo estão dispostas na ordem oposta à de MQL 4, ou seja, como nas linguagens de programação. O indicador, obviamente, gera o arquivo quotes. txt na pasta de terminais expertfiles. O Expert Advisor que será analisado abaixo levará o arquivo de citações da pasta especificada ao operar em modos DEMO ou REAL. No entanto, quando usado no modo de teste, este arquivo deve estar localizado na pasta testerfiles, por isso estou colocando manualmente quotes. txt Na pasta testerfiles do terminal. Aqui está o gráfico: Fig. 1. EURUSD H1 gráfico de cotações Podemos observar uma ou várias tendências, mas nosso objetivo é prever a estabilidade futura do sistema de negociação. Portanto, realizaremos uma análise para a estacionaridade das cotações iniciais do EUR / USD H1. Vamos calcular a estatística descritiva: Fig. 2. Estatística descritiva A estatística descritiva sugere que: Há uma inclinação para a direita (deve ser 0 enquanto que temos 0.244950) A probabilidade de nossas citações iniciais para ser distribuído normalmente é 9.64. Visualmente, o histograma certamente nada tem a ver com a distribuição normal, mas a probabilidade de 9.64 dá origem a certas ilusões. Vamos demonstrá-lo em comparação com a teoria: Fig. 3. Histograma EURUSD em comparação com a curva de distribuição normal teórica Podemos verificar visualmente que as cotações EURUSD 1 estão longe de serem normalmente distribuídas. No entanto, ainda é cedo para tirar uma conclusão como podemos ver a tendência sugerindo a presença de uma componente determinística nas citações, enquanto a presença de tal componente pode distorcer completamente as características estatísticas da variável aleatória (aspas). Vamos calcular a função de autocorrelação das aspas. Ele aparece da seguinte maneira: Fig. 4. Função de autocorrelação das cotações EURUSDH1 Ao traçar o gráfico, obtivemos uma probabilidade da falta de correlação entre os retornos - é diferente de zero para os 16 primeiros atrasos. O gráfico e a probabilidade sugerem claramente que existe correlação entre os desfasamentos em EURUSDH1, ou seja, as cotações consideradas contêm uma componente determinística. Se o componente determinístico for subtraído das citações iniciais, que características estatísticas o resíduo terá Para este propósito, aplicaremos um teste de raiz unitária para ver se é mais prospectivo trabalhar com a primeira diferença (residual) das citações iniciais. Tabela 1. Teste de raiz unitária O teste acima mostra que: A probabilidade de que as citações iniciais tenham uma raiz unitária (a primeira diferença é normalmente distribuída) é 41 A estatística de DW (Durbin-Watson) é um pouco mais de 2,2 que também sugere que a primeira A diferença é normalmente distribuída. Conclusão: seria razoável desacelerar a série de preços e, em seguida, analisar o residual de detrending. O filtro Hodrick-Prescott será utilizado para separar o componente determinístico das cotações EURUSD, por analogia com o artigo anterior. O número 10 nos nomes das séries denota o parâmetro lambda no filtro Hodrick-Prescott. Com base na teoria por trás desta ferramenta, o valor lambda é de grande importância para o resultado que parece ser o seguinte: 5. O resultado de suavização usando o filtro de Hodrick-Prescott Usaremos a equação do artigo anterior que nas notações de EViews aparece da seguinte maneira: C (1) HP (-1) C (2) D (HP (-1) ) C (3) D (HP (-2)), ou seja, nesta equação, levamos em conta a componente determinística eo ruído, através do qual queremos dizer a diferença entre as aspas iniciais e sua componente determinística. Após a análise do modelo atual das citações iniciais, obtemos os seguintes parâmetros de equação de regressão: Tabela 2. Estimação da equação de regressão A probabilidade de 39 do coeficiente ser zero se 1D (-1) é certamente extremamente desagradável. Vamos deixar tudo como é, já que o exemplo que vamos fornecer é para fins de demonstração. Tendo obtido as estimativas de equação de regressão (estimativa dos coeficientes de equação), podemos avançar para a previsão de um passo à frente. O resultado é o seguinte: A fig. 6. Previsão EURUSD de um passo em frente (às 12 horas da segunda-feira) 1.3. Estimativa de resíduos a partir da equação de regressão Vamos realizar uma análise limitada do resíduo a partir da equação de regressão. Este residual foi obtido subtraindo os valores calculados utilizando a equação de regressão das cotações iniciais do EUR / USD. Deixe-me lembrar que as características deste residual nos ajudarão a estimar a estabilidade futura do sistema de comércio. Em primeiro lugar, realizaremos um teste para a análise de correlações entre os retornos no residual: Fig. 7. Função de autocorrelação do residual Infelizmente, as correlações entre os atrasos ainda estão presentes e sua presença coloca dúvidas sobre a análise estatística. O próximo teste que vamos realizar é o teste de normalidade do residual. O resultado aparece da seguinte maneira: Fig. 8. Histograma do resíduo da equação de regressão A probabilidade de o resíduo ser normalmente distribuído é 25.57, que é uma grande figura. Vamos realizar testes de heterocedasticidade do residual. Os resultados são os seguintes: A probabilidade de que a heterocedasticidade do tipo GARCH esteja ausente é 16,08 A probabilidade de ausência da heterocedasticidade geral dos brancos é 0,0066 Conclusões: seguindo a diferenciação, obtivemos um residual com uma probabilidade de ser normalmente distribuída e uma quase - Zero de probabilidade de estar livre de correlações e podemos rejeitar estritamente a hipótese de que a heteroscedasticidade geral dos brancos está ausente. Isto implica que o nosso modelo é bastante crua e requer que eliminemos as correlações entre os atrasos a serem posteriormente testados para a heterocedasticidade mais uma vez e modelemos tal heterocedasticidade no caso de ela estar presente. Como meu objetivo é demonstrar o desenvolvimento do sistema de negociação baseado na previsão, vou continuar os cálculos para obter as características que são de interesse para os comerciantes - lucro ou perda. 2. Estimativa de resultados de previsão Ao negociar, estamos interessados em lucro em vez de erro de previsão que deve ser tomado como uma ferramenta de análise auxiliar para a comparação de diferentes modelos, mas não mais do que isso. Para estimar os resultados da previsão, um programa na linguagem EViews foi escrito. Ele compara os movimentos incrementais reais das cotações EURUSD com os previstos. Se estes incrementos coincidem, há lucro se eles não, há perda. Além disso, calculamos o lucro que representa a soma de todos os incrementos coincidentes com os incrementos previstos ea perda respectiva. A relação lucro / perda é designada como um fator de lucro. Em seguida, calculamos a proporção de incrementos rentáveis para não lucrativos (lucro / prejuízo). O número de negociações de perda consecutivas ea razão de perda em negociações de perda consecutivas para lucro (fator de recuperação) também é calculada. O programa na linguagem EViews para estimativa de resultados de modelagem em termos de sistema de negociação consiste no programa principal e duas sub-rotinas. O programa principal é o seguinte: Assume-se que o número dos programas principais é igual ao número de sub-rotinas contendo modelos (veja abaixo), isto é feito para simplificar o trabalho. A alteração no modelo requer uma alteração em duas linhas do programa principal relacionada com a alteração no nome da sub-rotina para o modelo. A sub-rotina que contém o modelo (equação de regressão): O número de sub-rotinas deve ser igual ao número de modelos. Para outro modelo, o nome da sub-rotina e, naturalmente, os nomes no programa principal devem ser alterados. Sub-rotina que calcula parâmetros de lucro / perda para o modelo: Os resultados dos programas simples acima em EViews para nossa equação são os seguintes: Tabela 3. Resultados de estimativa de rentabilidade em EViews O resultado é infeliz: a perda é três vezes maior que o lucro. E isso apesar do valor de erro de previsão otimista de 19 pips. O modelo precisa ser melhorado, mas eu não vou fazê-lo aqui no artigo vou continuar trabalhando nele no fórum, juntamente com todos aqueles que desejam participar no desenvolvimento de um modelo rentável. Até agora, as cotações EURUSDH1 foram analisadas utilizando ferramentas EViews. No entanto, parece ser muito tentador aplicar os resultados da previsão em um Expert Advisor do MetaTrader 4 terminal. Vamos agora considerar a troca de dados entre EViews e MetaTrader 4 e, em seguida, mais uma vez analisar os resultados usando um Expert Advisor em MetaTrader 4. 3. Troca de dados entre EViews e MetaTrader 4 Troca de dados entre EViews e MetaTrader 4 neste artigo é implementado Usando arquivos. txt. O algoritmo de troca parece ser o seguinte: MetaTrader 4 Expert Advisor: Inicia a operação em resposta a um comando do Expert Advisor Executa um programa de cálculo de previsão para o arquivo de cotações quotes. txt obtido do Expert Advisor Salva os resultados da previsão no EViewsForecast. Txt. MetaTrader 4 Expert Advisor: Após a conclusão da geração dos resultados em EViews. Lê o arquivo de previsão Decide a entrada ou saída de uma posição. Algumas palavras sobre a localização dos arquivos. Arquivos do terminal do MetaTrader 4 são colocados em suas pastas padrão: um Expert Advisor na pasta especialista e indicador (que não é necessário para o teste) na pasta expertindicators. Todos esses estão localizados no diretório do terminal. O Expert Advisor é instalado juntamente com outros Expert Advisors. Arquivos para troca entre o Expert Advisor e EViews estão localizados em arquivos especializados durante a operação do Expert Advisor e na pasta testerfiles ao testar o Expert Advisor. O arquivo enviado pelo Expert Advisor para EViews é chamado cotações. Txt independentemente do símbolo selecionado e do tempo. Portanto, o Expert Advisor pode ser anexado a qualquer símbolo enquanto o passo de previsão deve ser especificado nos parâmetros do Expert Advisor no início. EViews retorna o arquivo chamado EVIEWSFORECAST. txt. O arquivo de trabalho EViews worf. wf1 é colocado no diretório do terminal. Os diretórios especificados nos programas EViews anexados ao artigo provavelmente não corresponderão aos diretórios disponíveis em seus computadores. Eu instalei esses programas na pasta raiz do disco. Em EViews, você terá que obter um identificador no diretório padrão ou especificar seus próprios diretórios (eu não use os diretórios padrão utilizados pelo próprio EViews). 4. MQL4 Expert Advisor O algoritmo de operação do Expert Advisor é simplificado ao máximo: O Expert Advisor está ligado ao tempo M1 de qualquer símbolo. Uma etapa de previsão em minutos é especificada nos parâmetros do Expert Advisor. A etapa de previsão padrão é 60 minutos (1). Ao anexar o Expert Advisor à M1, você terá a oportunidade de visualizar melhor os resultados dos testes, já que o gráfico de teste pode ser comprimido ao mudar para um período de tempo mais longo Para fins de previsão em EViews. O Expert Advisor gera o arquivo. txt com o número de barras (observações) conforme especificado nos parâmetros do Expert Advisor Se a previsão for maior que o preço atual, uma posição longa será aberta Se a previsão for menor que o preço atual, Abre-se uma posição curta O Expert Advisor não abre mais do que uma posição (sem adicionar a uma posição) Independentemente da previsão, fecha a posição anterior e abre a nova. O algoritmo para a abertura de posições coincide com o algoritmo para calcular o lucro / perda no programa em EViews. O volume da posição a ser aberta é de 0,1 lote. As perdas de parada e as ordens de lucro não são usadas (elas são definidas em 100 pips, Expert Advisor tem um código para colocar paradas em intervalos de erro de previsão) Um gráfico é desenhado mostrando o valor de previsão e duas linhas em um intervalo padrão de erro de previsão. Ao visualizar o gráfico a partir do testador em prazos mais curtos do que aquela para a qual o Expert Advisor foi anexado, tenha em mente que a linha de previsão é deslocada para trás, ou seja, a previsão desenhada é a previsão em que o preço atual deve chegar ao final Do período. O Expert Advisor é anexado ao tempo M1 enquanto no testador, o gráfico é melhor visualizado no M5. O código-fonte do MQL4 Expert Advisor para negociação EURUSD não é fornecido neste artigo devido ao seu volume (cerca de 600 linhas). Ele pode ser encontrado em EvewsMT4.mq4 no arquivo EViewsMetaTrader4.zip anexado ao artigo. 5. Expert Advisor Testando Resultados Execute o Expert Advisor no testador no tempo M1. Os parâmetros de entrada são mostrados abaixo. FIG. 9. Parâmetros de entrada do Expert Advisor Um fragmento do gráfico de teste é demonstrado abaixo: Fig. 10. Testes do Expert Advisor no modo de visualização Os resultados do teste do Expert Advisor que usa previsões de uma hora (passo) à frente são mostrados abaixo. Relatório de Teste de Estratégia Fig. 11. Expert Advisor Testando resultados Os resultados são melhores do que aqueles obtidos em EViews. Observe que o cálculo de resultados em EViews eo testador é diferente em termos de dados de entrada. EViews usa 118 barras e calcula a previsão a partir da 3 barra à esquerda como a previsão de um passo em frente está gradualmente movendo-se para o final do período de tempo aumentando o número de barras usadas na estimativa da equação de regressão. O Expert Advisor desloca a janela de 118 barras e calcula a previsão na barra 119, isto é, a equação de regressão é sempre estimada em 118 barras desde que EViews expande a janela dentro da amostra eo Expert Advisor desloca a janela de largura fixa. O Expert Advisor nos ajuda a produzir uma tabela de estimativa de modelo estendida. Embora a tabela acima consistisse em uma única linha, ela agora contém 117 linhas - para cada data para a qual a previsão foi produzida. A tabela é a seguinte: Início da amostra Fim da amostra Lucro da amostra Perda da amostra Quantia de perdas P / F nas observações Tabela 4. Resultados dos testes em EViews A tabela sugere que o nosso modelo (tão primitivo e inacabado) é Praticamente sem esperança. Precisa de melhorias. Vamos plotar os gráficos das duas colunas: P / F em pips e P / F em observações. FIG. 12. Gráficos modelo modelo de lucro na amostra de 118 barras Este gráfico representa a dependência de fatores de lucro sobre o número de barras na análise. Existe uma tendência de alta evidente. Vamos verificar os resultados na amostra de 238 barras. O gráfico desenhado é o seguinte: Fig. 13. Modelo de gráficos de fator de lucro na amostra de 236 barras O fato de que os gráficos de fatores de lucro diferem sugere que o modelo é instável. Conclusão O artigo abordou o uso de previsões de um passo à frente produzidas por EViews para o desenvolvimento do Expert Advisor no MetaTrader 4. O resultado negativo que obtivemos indica que a construção de um modelo em EViews é uma tarefa bastante complicada que, no entanto, aparece Para ser mais potencialmente produtivo do que o desenvolvimento intuitivo de Expert Advisors. Regression Analysis O objetivo da análise de regressão é descrever a relação entre duas variáveis com base em dados observados e prever o valor da variável dependente com base no valor da variável independente. Mesmo que possamos fazer tais previsões, isso não implica que possamos reivindicar qualquer relação causal entre as variáveis independentes e dependentes. Definição 1. Se y é uma variável dependente e x é uma variável independente, então o modelo de regressão linear fornece uma previsão de y de x da forma em que x é a porção determinística do modelo e é o erro aleatório. Admitimos ainda que para qualquer valor dado de x o erro aleatório é normalmente e independentemente distribuído com média zero. Observação. Na prática, construiremos o modelo de regressão linear a partir dos dados da amostra usando o método dos mínimos quadrados. Assim, buscamos coeficientes a e b tais que para os dados em nossa amostra teremos onde i é o valor de y predito pelo modelo em x i. Assim, o termo de erro para o modelo é dado pelo Exemplo 1. Para cada valor de x nos dados de amostra do Exemplo 1 de Teste de Hipótese de Amostra para Correlação. Encontre o valor previsto correspondente a x. Isto é, o valor de y na linha de regressão correspondente a x. Também encontrar a expectativa de vida prevista de homens que fumam 4, 24 e 44 cigarros com base no modelo de regressão. Figura 1 Obtenção dos valores previstos para os dados no Exemplo 1 Os valores previstos podem ser obtidos utilizando o facto de que para qualquer i. O ponto (x i. I) fica na linha de regressão e então i a bx i. Por exemplo. A célula K5 na Figura 1 contém a fórmula I5E4E5, em que I5 contém o primeiro valor x 5, E4 contém a inclinação b e E5 contém a intercepção y (referindo-se à planilha na Figura 1 do Método de Mínimos Quadrados). Em alternativa, este valor pode ser obtido utilizando a fórmula PREVISÃO (I5, J5: J19, I5: I19). De fato, os valores de y previstos podem ser obtidos, como uma única unidade, usando a fórmula de matriz TREND. Isso é feito destacando o intervalo K5: K19 e inserindo a fórmula de matriz TREND (J5: J19, I5: I19) seguida de pressionar Ctrl-Shft-Enter. Os valores previstos para x4, 24 e 44 podem ser obtidos de um modo semelhante utilizando qualquer um dos três métodos definidos acima. A segunda forma da fórmula TREND pode ser usada. Por exemplo. Para obter os valores previstos de 4, 24 e 44 (armazenados em N19: N21), destaque gama O19: O21, introduza a fórmula de matriz TREND (N19: N21, J5: J19, I5: I19) e prima Ctrl-Shft - Entrar. Observe que essas abordagens produzem valores previstos mesmo para valores de x que não estão na amostra (como 24 e 44). A expectativa de vida prevista para os homens que fumam 4, 24 e 44 cigarros é de 83,2, 70,6 e 58,1 anos, respectivamente. Definição 2. Usamos a seguinte terminologia: O Residual é o termo de erro da Definição 1. Também definimos os graus de liberdade df T. Df Reg. Df Res. A soma dos quadrados SS T. SS Reg. SS Res e os quadrados médios MS T. MS Reg. MS Re s como se segue: Observação. SS T é a variabilidade total de y (por exemplo, a variabilidade da esperança de vida no Exemplo 1 de Teste de Hipótese de Amostra para Correlação). SS Reg representa a variabilidade de y que pode ser explicada pelo modelo de regressão (isto é, a variabilidade na expectativa de vida que pode ser explicada pelo número de cigarros fumados) e, portanto, pela Propriedade 1, SS Res expressa a variabilidade de y que não pode ser Explicado pelo modelo de regressão. Assim SS Reg / SS T representa a porcentagem da variabilidade de y que pode ser explicada pelo modelo de regressão. Acontece que este é igual ao coeficiente de determinação. Observação: Observe que para um tamanho de amostra de 100, um coeficiente de correlação tão baixo quanto .197 resultará na hipótese nula de que o coeficiente de correlação populacional é 0 sendo rejeitado (pelo Teorema 1 de Um Teste de Hipótese de Amostra para Correlação). Mas quando o coeficiente de correlação r .197, então r 2 .039, o que significa que a variância do modelo SS Reg é menor que 4 da variância total SS T que é uma associação bastante pequena. Considerando que este efeito é significativo, certamente não é muito grande. Observação. A partir da propriedade 2, vemos que o coeficiente de determinação r 2 é uma medida da precisão da predicação do modelo de regressão linear. R 2 tem um valor entre 0 e 1, com 1 indicando um ajuste perfeito entre o modelo de regressão linear e os dados. Definição 3. O erro padrão da estimativa é definido como Observação. A segunda asserção na Propriedade 4 pode ser reformulada como Para amostras grandes 1 e assim Note que se r .5, então o que indica que o erro padrão da estimativa é ainda 86.6 do erro padrão que não fator em qualquer informação sobre x ou seja, tendo Informações sobre x somente reduzem o erro em 13,4. Mesmo se r .9, então s y. x .436s y. Que indica que a informação sobre x reduz o erro padrão (sem informação sobre x) apenas por um pouco mais de 50. a) As somas dos valores de y são iguais à soma dos valores ie b) A média dos valores de y e O valor de correlação de y com é o valor absoluto do coeficiente de correlação de x com y ie f) O coeficiente de determinação de y com É o mesmo que o coeficiente de correlação de x com y ie Observação. Clique aqui para as provas das várias propriedades descritas acima. Amanda Steele diz: Gostaria de receber alguma orientação - Estou ajudando com um estudo destinado a avaliar se uma pontuação pré-operatória em uma certa escala (pontuações contínuas de 1-100) pode prever resultados pós-operatórios (também pontuado em escalas contínuas de 1-100) . Isso parece uma situação de regressão bastante direta para mim, mas usando o pacote realstats parece-me estar em problemas, pois tenho uma variável independente (pontuação pré-operatória) e múltiplas variáveis dependentes (pontuação pós-operatória). Você pode sugerir uma estratégia de análise Amanda, Você pode múltiplas regressões, uma para cada variável dependente. Isto deve ser suficiente se houver pouca correlação entre as variáveis dependentes. Alternativamente, você pode usar a regressão linear múltipla multivariada. A saída inicial é idêntica à de regressões múltiplas separadas, mas análises adicionais são realizadas. O Real Statistics Resource Pack doesn8217t apoiar esta segunda etapa ainda. Charles Caro Charles, Tenho uma amostra de 30 para medir os fatores que restringem a adoção da tecnologia. Estou pensando em executar análise de regressão para taxa de adoção (se for mais de 50 considerados como 1 e menos de 50 é 0, tendo 50 por cento de adoção como limite). Para medir os fatores constrangedores. Eu usei a escala de likert de 5 pontos. (Altamente significativo a menos significativo) e já extraíram variáveis importantes usando a análise de componentes principais. Agora, que tipo de análise de regressão devo usar para medir a importância relativa de cada um dos fatores. Linear ou múltiplo. Quando você diz 8220multiple8221 eu suponho que você quer dizer 8220 regressão linear múltipla8221, o que significa apenas que você tem mais de uma variável independente. Quando você tem apenas uma variável independente muitas vezes o termo regressão linear 8222 ou 8220 simples regressão linear 8221 é usado. Uma vez que você diz que tem múltiplos fatores, muitas vezes você usaria a regressão linear múltipla. Uma vez que seu resultado (variável dependente) pode ser visto como dicotômico (0 ou 1), você pode achar que a regressão logística dá um melhor ajuste para os dados. Você pode comparar valores AIC para isso.
No comments:
Post a Comment