Principal » negociação algorítmica » Teste de hipóteses em finanças: conceito e exemplos

Teste de hipóteses em finanças: conceito e exemplos

negociação algorítmica : Teste de hipóteses em finanças: conceito e exemplos

Seu consultor de investimentos propõe um plano mensal de investimentos de renda que promete um retorno variável a cada mês. Você investirá apenas se tiver uma renda média mensal de US $ 180. Seu orientador também informa que, nos últimos 300 meses, o esquema teve retornos de investimento com um valor médio de US $ 190 e um desvio padrão de US $ 75. Você deve investir nesse esquema? O teste de hipóteses é útil para essa tomada de decisão.

Este artigo pressupõe a familiaridade dos leitores com os conceitos de uma tabela de distribuição normal, fórmula, valor-p e noções básicas relacionadas de estatística.

O que é o teste de hipóteses?

O teste de hipóteses ou significância é um modelo matemático para testar uma reivindicação, ideia ou hipótese sobre um parâmetro de interesse em um determinado conjunto populacional, usando dados medidos em um conjunto amostral. Os cálculos são realizados em amostras selecionadas para reunir informações mais decisivas sobre as características de toda a população, o que permite uma maneira sistemática de testar afirmações ou idéias sobre todo o conjunto de dados.

Aqui está um exemplo simples: uma diretora da escola relata que os alunos de sua escola obtêm uma média de 7 em cada 10 exames. Para testar essa "hipótese", registramos marcas de, digamos, 30 alunos (amostra) de toda a população estudantil da escola (digamos 300) e calculamos a média dessa amostra. Podemos então comparar a média da amostra (calculada) com a média da população (relatada) e tentar confirmar a hipótese.

Para dar outro exemplo, o retorno anual de um fundo mútuo específico é de 8%. Suponha que o fundo mútuo exista há 20 anos. Tomamos uma amostra aleatória de retornos anuais do fundo mútuo por, digamos, cinco anos (amostra) e calculamos sua média. Em seguida, comparamos a média da amostra (calculada) com a média da população (reivindicada) para verificar a hipótese.

Os critérios de tomada de decisão devem ser baseados em certos parâmetros dos conjuntos de dados.

Existem metodologias diferentes para o teste de hipóteses, mas as mesmas quatro etapas básicas estão envolvidas:

Etapa 1: Definir a Hipótese

Geralmente, o valor relatado (ou as estatísticas da reivindicação) é declarado como a hipótese e presume-se verdadeiro. Para os exemplos acima, a hipótese será:

  • Exemplo A: Os alunos da escola obtêm uma média de 7 em cada 10 exames.
  • Exemplo B: O retorno anual do fundo mútuo é de 8% ao ano.

Essa descrição declarada constitui a “ Hipótese nula (H 0 ) ” e é assumida verdadeira - a maneira como um réu em um julgamento por júri é considerado inocente até que se prove o contrário pelas provas apresentadas no tribunal. Da mesma forma, o teste de hipóteses começa declarando e assumindo uma "hipótese nula" e, em seguida, o processo determina se é provável que a suposição seja verdadeira ou falsa.

O ponto importante a ser observado é que estamos testando a hipótese nula porque há um elemento de dúvida sobre sua validade. Qualquer informação que esteja contra a hipótese nula declarada é capturada na Hipótese Alternativa (H 1 ). Para os exemplos acima, a hipótese alternativa será:

  • Os alunos obtêm uma média que não é igual a 7.
  • O retorno anual do fundo mútuo não é igual a 8% ao ano.

Em outras palavras, a hipótese alternativa é uma contradição direta da hipótese nula.

Como em um julgamento, o júri assume a inocência do réu (hipótese nula). O promotor deve provar o contrário (hipótese alternativa). Da mesma forma, o pesquisador deve provar que a hipótese nula é verdadeira ou falsa. Se o promotor não provar a hipótese alternativa, o júri deve deixar o réu ir (baseando a decisão na hipótese nula). Da mesma forma, se o pesquisador não provar uma hipótese alternativa (ou simplesmente não faz nada), a hipótese nula é assumida como verdadeira.

Etapa 2: definir os critérios

Os critérios de tomada de decisão devem se basear em certos parâmetros dos conjuntos de dados e é aí que a conexão com a distribuição normal entra em cena.

De acordo com o postulado estatístico padrão sobre a distribuição amostral, “Para qualquer tamanho de amostra n, a distribuição amostral de X̅ é normal se a população X da qual a amostra é coletada é normalmente distribuída.” Portanto, as probabilidades de todas as outras amostras possíveis significam que pode-se selecionar são normalmente distribuídos.

Por exemplo, determine se o retorno médio diário de qualquer ação listada na bolsa XYZ, em torno do dia de ano novo, é superior a 2%.

H 0 : Hipótese nula: média = 2%

H 1 : Hipótese alternativa: média> 2% (é isso que queremos provar)

Pegue a amostra (digamos, 50 ações do total de 500) e calcule a média da amostra.

Para uma distribuição normal, 95% dos valores estão dentro de dois desvios padrão da média da população. Portanto, essa distribuição normal e suposição de limite central para o conjunto de dados da amostra nos permite estabelecer 5% como um nível de significância. Faz sentido, pois, sob essa premissa, há menos de 5% de probabilidade (100-95) de obter valores extremos que estão além de dois desvios-padrão da média da população. Dependendo da natureza dos conjuntos de dados, outros níveis de significância podem ser obtidos em 1%, 5% ou 10%. Para cálculos financeiros (incluindo finanças comportamentais), 5% é o limite geralmente aceito. Se encontrarmos cálculos que vão além dos dois desvios padrão usuais, temos um forte caso de discrepâncias para rejeitar a hipótese nula.

Graficamente, é representado da seguinte maneira:

No exemplo acima, se a média da amostra for muito maior que 2% (por exemplo, 3, 5%), rejeitamos a hipótese nula. A hipótese alternativa (média> 2%) é aceita, o que confirma que o retorno médio diário das ações está de fato acima de 2%.

No entanto, se a média da amostra provavelmente não for significativamente maior que 2% (e permanecer em, digamos, cerca de 2, 2%), NÃO PODEMOS rejeitar a hipótese nula. O desafio vem de como decidir casos tão próximos. Para concluir a partir de amostras e resultados selecionados, é necessário determinar um nível de significância que permita concluir sobre a hipótese nula. A hipótese alternativa permite estabelecer o nível de significância ou o conceito de "valor crítico" para decidir casos tão próximos.

De acordo com a definição padrão do livro, “Um valor crítico é um valor de corte que define os limites além dos quais menos de 5% da média da amostra pode ser obtida se a hipótese nula for verdadeira. As médias da amostra obtidas além de um valor crítico resultarão na decisão de rejeitar a hipótese nula. "No exemplo acima, se definimos o valor crítico como 2, 1% e a média calculada chega a 2, 2%, rejeitamos a hipótese nula. Um valor crítico estabelece uma demarcação clara sobre aceitação ou rejeição.

Etapa 3: calcular a estatística

Essa etapa envolve o cálculo das figuras necessárias, conhecidas como estatísticas de teste (como média, escore z, valor p etc.) para a amostra selecionada. (Vamos falar sobre isso em uma seção posterior.)

Etapa 4: chegar a uma conclusão

Com o (s) valor (es) calculado (s), decida a hipótese nula. Se a probabilidade de obter uma média da amostra for menor que 5%, a conclusão é rejeitar a hipótese nula. Caso contrário, aceite e retenha a hipótese nula.

Tipos de erros

Pode haver quatro resultados possíveis na tomada de decisões com base em amostras, com relação à aplicabilidade correta para toda a população:

Decisão de Reter


Decisão de rejeitar


Aplica-se a toda a população


Corrigir


Incorreta

(Erro TIPO 1 - a)


Não se aplica a toda a população


Incorreta

(Erro TIPO 2 - b)


Corrigir


Os casos "corretos" são aqueles em que as decisões tomadas nas amostras são realmente aplicáveis ​​a toda a população. Os casos de erros surgem quando se decide reter (ou rejeitar) a hipótese nula com base nos cálculos amostrais, mas essa decisão não se aplica realmente a toda a população. Esses casos constituem erros tipo 1 (alfa) e tipo 2 (beta), conforme indicado na tabela acima.

Selecionar o valor crítico correto permite eliminar os erros alfa do tipo 1 ou limitá-los a um intervalo aceitável.

Alfa denota o erro no nível de significância e é determinado pelo pesquisador. Para manter o nível padrão de significância ou confiança de 5% para os cálculos de probabilidade, isso é mantido em 5%.

De acordo com as referências e definições de tomada de decisão aplicáveis:

  • “Esse critério (alfa) geralmente é definido em 0, 05 (a = 0, 05) e comparamos o nível alfa com o valor p. Quando a probabilidade de um erro do tipo I for menor que 5% (p <0, 05), decidimos rejeitar a hipótese nula; caso contrário, mantemos a hipótese nula. ”
  • O termo técnico usado para essa probabilidade é valor-p . É definido como “a probabilidade de obter um resultado amostral, uma vez que o valor declarado na hipótese nula é verdadeiro. O valor de p para obter um resultado amostral é comparado ao nível de significância ".
  • Um erro Tipo II, ou erro beta, é definido como "a probabilidade de reter incorretamente a hipótese nula, quando na verdade não é aplicável a toda a população".

Mais alguns exemplos demonstrarão esse e outros cálculos.

Exemplo 1

Existe um esquema de investimento de renda mensal que promete retornos mensais variáveis. Um investidor só investirá nele se tiver a garantia de uma renda mensal média de US $ 180. Ele tem uma amostra de retornos de 300 meses, com média de US $ 190 e desvio padrão de US $ 75. Ele ou ela deve investir neste esquema ">

Vamos configurar o problema. O investidor investirá no esquema se tiver certeza do retorno médio desejado de US $ 180.

H 0 : Hipótese nula: média = 180

H 1 : Hipótese alternativa: média> 180

Método 1: Abordagem de valor crítico

Identifique um valor crítico X L para a média da amostra, que é grande o suficiente para rejeitar a hipótese nula - ou seja, rejeite a hipótese nula se a média da amostra> = valor crítico X L

P (identifique um erro alfa do tipo I) = P (rejeite H 0, considerando que H 0 é verdadeiro),

Isso seria alcançado quando a média da amostra exceder os limites críticos.

= P (dado que H 0 é verdadeiro) = alfa

Graficamente, aparece da seguinte maneira:

Tomando alfa = 0, 05 (ou seja, nível de significância de 5%), Z 0, 05 = 1, 645 (da tabela Z ou da tabela de distribuição normal)

=> X L = 180 + 1, 645 * (75 / sqrt (300)) = 187, 12

Como a média da amostra (190) é maior que o valor crítico (187, 12), a hipótese nula é rejeitada e a conclusão é que o retorno mensal médio é de fato superior a US $ 180, para que o investidor possa considerar investir nesse esquema.

Método 2: usando estatísticas de teste padronizadas

Também se pode usar o valor padronizado z.

Estatística de teste, Z = (média da amostra - média da população) / (std-dev / sqrt (número de amostras).

Em seguida, a região de rejeição se torna o seguinte:

Z = (190-180) / (75 / sqrt (300)) = 2, 309

Nossa região de rejeição no nível de significância de 5% é Z> Z 0, 05 = 1.645.

Como Z = 2.309 é maior que 1.645, a hipótese nula pode ser rejeitada com uma conclusão semelhante mencionada acima.

Método 3: Cálculo do valor P

Nosso objetivo é identificar P (média da amostra> = 190, quando média = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2, 309) = 0, 0084 = 0, 84%

A tabela a seguir para inferir cálculos de valor p conclui que há evidências confirmadas de que os retornos mensais médios são maiores que 180:

valor p


Inferência


Menos de 1%


Evidência confirmada apoiando hipótese alternativa


entre 1% e 5%


Fortes evidências apoiando hipóteses alternativas


entre 5% e 10%


Fraca evidência apoiando hipótese alternativa


superior a 10%


Nenhuma evidência apoiando hipótese alternativa


Exemplo 2

Um novo corretor da bolsa (XYZ) alega que suas taxas de corretagem são mais baixas do que as do seu corretor da bolsa atual (ABC). Os dados disponíveis em uma empresa de pesquisa independente indicam que a média e o desvio padrão de todos os clientes de corretores da ABC são US $ 18 e US $ 6, respectivamente.

Uma amostra de 100 clientes da ABC é obtida e as taxas de corretagem são calculadas com as novas taxas do corretor XYZ. Se a média da amostra for de US $ 18, 75 e o padrão std-dev for o mesmo (US $ 6), será possível fazer alguma inferência sobre a diferença na fatura média da corretora entre a ABC e a XYZ broker "

H 0 : Hipótese nula: média = 18

H 1 : Hipótese alternativa: média 18 (é isso que queremos provar.)

Região de rejeição: Z <= - Z 2, 5 e Z> = Z 2, 5 (assumindo nível de significância de 5%, divida 2, 5 em cada um dos lados).

Z = (média da amostra - média) / (std-dev / sqrt (número de amostras))

= (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25

Esse valor Z calculado fica entre os dois limites definidos por:

- Z 2, 5 = -1, 96 e Z 2, 5 = 1, 96.

Isso conclui que não há evidências suficientes para inferir que existe alguma diferença entre as taxas do seu corretor existente e do novo corretor.

Como alternativa, o valor p = P (Z1.25)

= 2 * 0, 1056 = 0, 2112 = 21, 12% que é maior que 0, 05 ou 5%, levando à mesma conclusão.

Graficamente, é representado pelo seguinte:

Pontos de crítica para o método de teste hipotético:

  • Um método estatístico baseado em suposições
  • Propenso a erros, conforme detalhado em termos de erros alfa e beta
  • A interpretação do valor-p pode ser ambígua, levando a resultados confusos

A linha inferior

O teste de hipóteses permite que um modelo matemático valide uma reivindicação ou idéia com um certo nível de confiança. No entanto, como a maioria das ferramentas e modelos estatísticos, ele é limitado por algumas limitações. O uso desse modelo para a tomada de decisões financeiras deve ser considerado com um olhar crítico, mantendo todas as dependências em mente. Métodos alternativos como a inferência bayesiana também merecem ser explorados para análises semelhantes.

Compare contas de investimento Nome do provedor Descrição Divulgação do anunciante × As ofertas que aparecem nesta tabela são de parcerias das quais a Investopedia recebe remuneração.
Recomendado
Deixe O Seu Comentário