Principal » líderes de negócios » Definição Estatística do Chi Square (χ2)

Definição Estatística do Chi Square (χ2)

líderes de negócios : Definição Estatística do Chi Square (χ2)
O que é uma estatística do Chi Square?

Um quadrado de chi ( χ 2 ) estatística é um teste que mede como as expectativas se comparam aos dados reais observados (ou resultados do modelo). Os dados usados ​​no cálculo de uma estatística do qui-quadrado devem ser aleatórios, brutos, mutuamente exclusivos, extraídos de variáveis ​​independentes e extraídos de uma amostra grande o suficiente. Por exemplo, os resultados do lançamento de uma moeda 100 vezes atendem a esses critérios.

Os testes do qui-quadrado são frequentemente usados ​​no teste de hipóteses.

A fórmula para o quadrado de Chi é

χc2 = Oi (Oi-Ei) 2Eiwhere: c = graus de liberdadeO = valor (es) observado (s) E = valor (es) observado (s) \ começo {alinhado} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {onde:} \\ & c = \ text {graus de liberdade} \\ & O = \ text {valor (es) observado (s)} \\ & E ​​= \ text {valor esperado )} \\ \ end {alinhado} χc2 = iEi (Oi −Ei) 2 onde: c = graus de liberdadeO = valor (es) observado (s) E = valor (es) esperado (s)

O que uma estatística do quadrado de Chi diz a você?

Existem dois tipos principais de testes do qui-quadrado: o teste da independência, que faz uma pergunta de relacionamento, como "Existe uma relação entre gênero e notas no SAT?"; e o teste de qualidade do ajuste, que pergunta algo como "Se uma moeda for lançada 100 vezes, ela subirá cara 50 vezes e coroa 50 vezes?"

Para esses testes, os graus de liberdade são utilizados para determinar se uma determinada hipótese nula pode ser rejeitada com base no número total de variáveis ​​e amostras no experimento.

Por exemplo, ao considerar os alunos e a escolha do curso, um tamanho de amostra de 30 ou 40 alunos provavelmente não é grande o suficiente para gerar dados significativos. Obter resultados iguais ou semelhantes em um estudo usando uma amostra de 400 ou 500 alunos é mais válido.

Em outro exemplo, considere jogar uma moeda 100 vezes. O resultado esperado do lançamento de uma moeda justa 100 vezes é que as caras vão subir 50 vezes e as caudas vão subir 50 vezes. O resultado real pode ser que as cabeças subam 45 vezes e as caudas subam 55 vezes. A estatística do qui quadrado mostra quaisquer discrepâncias entre os resultados esperados e os resultados reais.

Principais Takeaways

  • Um quadrado de chi (χ 2 ) estatística é um teste que mede como as expectativas se comparam aos dados reais observados.
  • Existem dois tipos principais de testes do qui-quadrado: o teste de independência para dados e testes de qualidade de ajuste para um modelo.
  • Esses testes podem ser usados ​​para determinar se uma determinada hipótese nula pode ser rejeitada no teste de hipótese.

Exemplo de um teste qui-quadrado

Imagine que uma pesquisa aleatória foi realizada entre 2.000 eleitores diferentes, homens e mulheres. As pessoas que responderam foram classificadas por gênero e se eram republicanas, democratas ou independentes. Imagine uma grade com as colunas rotuladas republicana, democrata e independente e duas linhas rotuladas masculino e feminino. Suponha que os dados dos 2.000 participantes sejam os seguintes:

RepublicanoDemocrataIndependenteTotal
Masculino400300100800
Fêmea5006001001200
Total9009002002000

O primeiro passo para calcular a estatística chi ao quadrado é encontrar as frequências esperadas. Eles são calculados para cada "célula" na grade. Como existem duas categorias de gênero e três categorias de visão política, existem seis frequências totais esperadas. A fórmula para a frequência esperada é:

E (r, c) = n (r) × c (r) onde: r = linha na perguntac = coluna em questão = total correspondente \ begin {alinhado} & E (r, c) = \ frac {n (r) \ times c (r)} {n} \\ & \ textbf {onde:} \\ & r = \ text {linha em questão} \\ & c = \ text {coluna em questão} \\ & n = \ text {total correspondente } \\ \ end {alinhado} E (r, c) = nn (r) × c (r) onde: r = linha na questãoc = coluna na questão = total total correspondente

Neste exemplo, as frequências esperadas são:

  • E (1, 1) = (900 x 800) / 2.000 = 360
  • E (1, 2) = (900 x 800) / 2.000 = 360
  • E (1, 3) = (200 x 800) / 2.000 = 80
  • E (2, 1) = (900 x 1.200) / 2.000 = 540
  • E (2, 2) = (900 x 1.200) / 2.000 = 540
  • E (2, 3) = (200 x 1.200) / 2.000 = 120

Em seguida, esses são valores usados ​​para calcular a estatística chi ao quadrado usando a seguinte fórmula:

Qui-quadrado = ∑ [O (r, c) −E (r, c)] 2E (r, c) onde: O (r, c) = dados observados para a linha e coluna especificadas \ begin {alinhado} & \ text {Qui-quadrado} = \ sum \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {onde:} \\ & O (r, c) = \ text {dados observados para a linha e coluna especificadas} \\ \ end {alinhado} Qui-quadrado = ∑E (r, c) [O (r, c) −E (r, c)] 2 em que: O (r, c) = dados observados para a linha e coluna especificadas

Neste exemplo, a expressão para cada valor observado é:

  • O (1, 1) = (400 - 360) 2/360 = 4, 44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • O (1, 3) = (100 - 80) 2/80 = 5
  • O (2, 1) = (500 - 540) 2/540 = 2, 96
  • O (2, 2) = (600-540) 2/540 = 6, 67
  • O (2, 3) = (100 - 120) 2/120 = 3, 33

A estatística do chi ao quadrado é então igual à soma desses valores, ou 32, 41. Podemos então olhar para uma tabela estatística do qui quadrado para ver, dados os graus de liberdade em nossa configuração, se o resultado é estatisticamente significativo ou não.

Compare contas de investimento Nome do provedor Descrição Divulgação do anunciante × As ofertas que aparecem nesta tabela são de parcerias das quais a Investopedia recebe remuneração.

Termos relacionados

Graus de liberdade Definição Graus de liberdade refere-se ao número máximo de valores logicamente independentes, que são valores que têm liberdade para variar, na amostra de dados. mais Definição do teste T Um teste t é um tipo de estatística inferencial usada para determinar se há uma diferença significativa entre as médias de dois grupos, o que pode estar relacionado em determinadas características. mais O que a correlação inversa nos diz Uma correlação inversa, também conhecida como correlação negativa, é uma relação contrária entre duas variáveis, de forma que elas se movem em direções opostas. mais Como funciona o desvio padrão residual O desvio padrão residual é um termo estatístico usado para descrever a diferença nos desvios padrão dos valores observados versus os valores previstos, conforme mostrado pelos pontos em uma análise de regressão. mais Como funciona a análise de variância (ANOVA) A análise de variância (ANOVA) é uma ferramenta de análise estatística que separa a variabilidade total encontrada em um conjunto de dados em dois componentes: fatores aleatórios e sistemáticos. mais Correlação Correlação é uma medida estatística de como dois títulos se movem um em relação ao outro. mais Links de parceiros
Recomendado
Deixe O Seu Comentário