Principal » negociação algorítmica » Estatística não paramétrica

Estatística não paramétrica

negociação algorítmica : Estatística não paramétrica
O que são estatísticas não paramétricas?

Estatísticas não paramétricas referem-se a um método estatístico no qual os dados não são necessários para ajustar uma distribuição normal. As estatísticas não paramétricas usam dados geralmente ordinais, o que significa que não se baseiam em números, mas em uma classificação ou ordem das sortes. Por exemplo, uma pesquisa com preferências do consumidor variando de gostar a não gostar seria considerada um dado ordinal.

A estatística não paramétrica inclui estatística descritiva não paramétrica, modelos estatísticos, inferência e testes estatísticos. A estrutura do modelo de modelos não paramétricos não é especificada a priori, mas é determinada a partir dos dados. O termo não paramétrico não pretende implicar que tais modelos carecem completamente de parâmetros, mas que o número e a natureza dos parâmetros são flexíveis e não são previamente fixados. Um histograma é um exemplo de uma estimativa não paramétrica de uma distribuição de probabilidade.

Compreendendo estatísticas não paramétricas

Nas estatísticas, as estatísticas paramétricas incluem parâmetros como média, mediana, desvio padrão, variância etc. Essa forma de estatística usa os dados observados para estimar os parâmetros da distribuição. Sob estatísticas paramétricas, supõe-se que os dados correspondam a uma distribuição normal com parâmetros desconhecidos μ (média da população) e σ 2 (variação da população), que são estimados usando a média da amostra e a variação da amostra.

As estatísticas não paramétricas não assumem o tamanho da amostra ou se os dados observados são quantitativos.

As estatísticas não paramétricas não pressupõem que os dados sejam extraídos de uma distribuição normal. Em vez disso, a forma da distribuição é estimada sob essa forma de medição estatística. Embora existam muitas situações em que uma distribuição normal possa ser assumida, também existem alguns cenários em que não será possível determinar se os dados serão normalmente distribuídos.

Exemplos de estatísticas não paramétricas

No primeiro exemplo, considere que um pesquisador que deseja uma estimativa do número de bebês nascidos na América do Norte com olhos castanhos pode decidir coletar uma amostra de 150.000 bebês e executar uma análise no conjunto de dados. A medida que eles derivam será usada como uma estimativa de toda a população de bebês com olhos castanhos nascidos no ano seguinte.

Para um segundo exemplo, considere um pesquisador diferente que queira saber se dormir cedo ou tarde está relacionado à frequência com que alguém adoece. Assumindo que a amostra é escolhida aleatoriamente na população, pode-se considerar normal a distribuição do tamanho da amostra da frequência da doença. No entanto, um experimento que mede a resistência do corpo humano a uma cepa de bactérias não pode ser considerado como tendo uma distribuição normal.

Isso ocorre porque dados da amostra selecionados aleatoriamente podem ser resistência à tensão. Por outro lado, se o pesquisador considerar fatores como composição genética e etnia, ele pode descobrir que um tamanho de amostra selecionado usando essas características pode não ser resistente à cepa. Portanto, não se pode assumir uma distribuição normal.

Esse método é útil quando os dados não têm uma interpretação numérica clara e é melhor usá-los com dados que possuem uma classificação das sortes. Por exemplo, um teste de avaliação de personalidade pode ter uma classificação de suas métricas definida como discordo totalmente, discordo, indiferente, concordo e concordo totalmente. Nesse caso, métodos não paramétricos devem ser usados.

Considerações Especiais

Estatísticas não paramétricas ganharam valor devido à sua facilidade de uso. À medida que a necessidade de parâmetros é aliviada, os dados se tornam mais aplicáveis ​​a uma variedade maior de testes. Esse tipo de estatística pode ser usado sem a média, tamanho da amostra, desvio padrão ou estimativa de quaisquer outros parâmetros relacionados quando nenhuma dessas informações estiver disponível.

Como as estatísticas não paramétricas fazem menos suposições sobre os dados de amostra, seu aplicativo tem escopo mais amplo que as estatísticas paramétricas. Nos casos em que o teste paramétrico é mais apropriado, os métodos não paramétricos serão menos eficientes. Isso ocorre porque os resultados obtidos a partir de estatísticas não paramétricas têm um grau de confiança menor do que se os resultados fossem obtidos usando estatísticas paramétricas.

Principais Takeaways

  • As estatísticas não paramétricas são fáceis de usar, mas não oferecem a precisão exata de outros modelos estatísticos.
  • Esse tipo de análise é mais adequado ao considerar a ordem de algo, onde, mesmo que os dados numéricos sejam alterados, os resultados provavelmente permanecerão os mesmos.
Compare contas de investimento Nome do provedor Descrição Divulgação do anunciante × As ofertas que aparecem nesta tabela são de parcerias das quais a Investopedia recebe remuneração.

Termos relacionados

Entendendo a distribuição T A distribuição AT é um tipo de função de probabilidade que é apropriado para estimar parâmetros populacionais para amostras pequenas ou variações desconhecidas. mais Como funciona a distribuição de amostragem Uma distribuição de amostragem é uma distribuição de probabilidade de uma estatística obtida através de um grande número de amostras retiradas de uma população específica. mais Como o teste de Wilcoxon é usado O teste de Wilcoxon, que se refere ao teste Rank Sum ou ao teste Signed Rank, é um teste não paramétrico que compara dois grupos emparelhados. mais Método não paramétrico O método não paramétrico refere-se a um tipo de estatística que não exige que os dados analisados ​​atendam a certas suposições ou parâmetros. mais Definição do teste T Um teste t é um tipo de estatística inferencial usada para determinar se há uma diferença significativa entre as médias de dois grupos, o que pode estar relacionado em determinadas características. mais Intervalo de confiança Um intervalo de confiança mede a probabilidade de um parâmetro populacional cair entre dois valores definidos. mais Links de parceiros
Recomendado
Deixe O Seu Comentário