Overfitting

negociação algorítmica : Overfitting
O que é Overfitting?

O sobreajuste é um erro de modelagem que ocorre quando uma função é muito próxima de um conjunto limitado de pontos de dados. A super adaptação do modelo geralmente assume a forma de criar um modelo excessivamente complexo para explicar as idiossincrasias nos dados em estudo.

Na realidade, os dados frequentemente estudados apresentam algum grau de erro ou ruído aleatório. Portanto, tentar fazer com que o modelo esteja em conformidade muito próximo a dados ligeiramente imprecisos pode infectar o modelo com erros substanciais e reduzir seu poder preditivo.

[Importante: Os profissionais de finanças devem sempre estar cientes dos perigos de ajustar um modelo com base em dados limitados.]

Entendendo o sobreajuste

Por exemplo, um problema comum é usar algoritmos de computador para pesquisar bancos de dados extensos de dados históricos do mercado, a fim de encontrar padrões. Dado estudo suficiente, muitas vezes é possível desenvolver teoremas elaborados que parecem prever coisas como retornos no mercado de ações com grande precisão.

No entanto, quando aplicados a dados fora da amostra, esses teoremas podem ser apenas a super adequação de um modelo ao que na realidade eram apenas ocorrências aleatórias. Em todos os casos, é importante testar um modelo em relação a dados que estão fora da amostra usada para desenvolvê-lo.

Principais Takeaways

  • O sobreajuste é um erro de modelagem que ocorre quando uma função é muito próxima de um conjunto limitado de pontos de dados.
  • Os profissionais financeiros sempre devem estar cientes dos perigos de sobrescrever um modelo com base em dados limitados.
Compare contas de investimento Nome do provedor Descrição Divulgação do anunciante × As ofertas que aparecem nesta tabela são de parcerias das quais a Investopedia recebe remuneração.

Termos relacionados

Por que a significância estatística é importante A significância estatística se refere a um resultado que provavelmente não ocorrerá aleatoriamente, mas provavelmente atribuível a uma causa específica. mais Como funciona a suavização de dados A suavização de dados é feita usando um algoritmo para remover o ruído de um conjunto de dados. Isso permite que padrões importantes se destaquem. A suavização de dados pode ser usada para ajudar a prever tendências, como as encontradas nos preços dos títulos. mais Amostra Uma amostra é uma versão menor e gerenciável de um grupo maior. As amostras são usadas em testes estatísticos quando o tamanho da população é muito grande. mais Heterocedasticidade Nas estatísticas, a heterocedasticidade ocorre quando os desvios padrão de uma variável, monitorados por um período específico de tempo, são inconstantes. mais Leitura sobre amostragem aleatória estratificada A amostragem aleatória estratificada é um método de amostragem que envolve a divisão de uma população em grupos menores, conhecidos como estratos. mais Como funcionam as amostras aleatórias simples Uma amostra aleatória simples é um subconjunto de uma população estatística na qual cada membro do subconjunto tem uma probabilidade igual de ser escolhido. Uma amostra aleatória simples deve ser uma representação imparcial de um grupo. mais Links de parceiros
Recomendado
Deixe O Seu Comentário