Teste T

O que é um teste T?

Um teste t é um tipo de estatística inferencial usada para determinar se há uma diferença significativa entre as médias de dois grupos, o que pode estar relacionado em certas características. É usado principalmente quando os conjuntos de dados, como o conjunto de dados registrado como resultado do lançamento de uma moeda 100 vezes, seguem uma distribuição normal e podem ter variações desconhecidas. Um teste t é usado como uma ferramenta de teste de hipóteses, que permite testar uma suposição aplicável a uma população.

Um teste t examina a estatística t, os valores da distribuição t e os graus de liberdade para determinar a probabilidade de diferença entre dois conjuntos de dados. Para realizar um teste com três ou mais variáveis, é preciso usar uma análise de variância.

1:38

Teste T

Explicando o teste T

Essencialmente, um teste t nos permite comparar os valores médios dos dois conjuntos de dados e determinar se eles vieram da mesma população. Nos exemplos acima, se coletássemos uma amostra de alunos da classe A e outra amostra de alunos da classe B, não esperaríamos que eles tivessem exatamente a mesma média e desvio padrão. Da mesma forma, as amostras colhidas no grupo controle alimentado com placebo e as colhidas no grupo prescrito pelo medicamento devem ter uma média e desvio padrão ligeiramente diferentes.

Matematicamente, o teste t pega uma amostra de cada um dos dois conjuntos e estabelece a declaração do problema assumindo uma hipótese nula de que as duas médias são iguais. Com base nas fórmulas aplicáveis, determinados valores são calculados e comparados com os valores padrão, e a hipótese nula assumida é aceita ou rejeitada de acordo.

Se a hipótese nula se qualificar para ser rejeitada, isso indica que as leituras de dados são fortes e não são por acaso. O teste t é apenas um dos muitos testes usados para esse fim. Os estatísticos também devem usar outros testes além do teste t para examinar mais variáveis e testes com amostras maiores. Para um tamanho de amostra grande, os estatísticos usam um teste z. Outras opções de teste incluem o teste do qui-quadrado e o teste f.

Existem três tipos de testes t, e eles são classificados como testes t dependentes e independentes.

Principais Takeaways

Um teste t é um tipo de estatística inferencial usada para determinar se há uma diferença significativa entre as médias de dois grupos, o que pode estar relacionado em certas características.
O teste t é um dos muitos testes usados para fins de teste de hipótese em estatística.
O cálculo de um teste t requer três valores de dados principais. Eles incluem a diferença entre os valores médios de cada conjunto de dados (chamado diferença média), o desvio padrão de cada grupo e o número de valores de dados de cada grupo.
Existem vários tipos diferentes de teste t que podem ser executados dependendo dos dados e do tipo de análise necessária.

Resultados ambíguos dos testes

Considere que um fabricante de medicamentos quer testar um medicamento recém-inventado. Ele segue o procedimento padrão de experimentar o medicamento em um grupo de pacientes e administrar um placebo a outro grupo, chamado grupo controle. O placebo administrado ao grupo controle é uma substância sem valor terapêutico pretendido e serve como referência para medir como o outro grupo, que recebe o medicamento real, responde.

Após o teste do medicamento, os membros do grupo controle alimentado com placebo relataram um aumento na expectativa de vida média de três anos, enquanto os membros do grupo que recebeu o novo medicamento relataram um aumento na expectativa de vida média de quatro anos. A observação instantânea pode indicar que o medicamento está realmente funcionando, pois os resultados são melhores para o grupo que o utiliza. No entanto, também é possível que a observação seja devido a uma ocorrência casual, especialmente uma surpreendente sorte. Um teste t é útil para concluir se os resultados estão realmente corretos e aplicáveis a toda a população.

Em uma escola, 100 alunos da classe A obtiveram uma média de 85% com um desvio padrão de 3%. Outros 100 alunos pertencentes à classe B obtiveram uma média de 87%, com um desvio padrão de 4%. Embora a média da classe B seja melhor que a da classe A, pode não ser correto concluir que o desempenho geral dos alunos da classe B é melhor do que o dos alunos da classe A. Isso ocorre porque, junto com o significa que o desvio padrão da classe B também é maior que o da classe A. Isso indica que suas porcentagens extremas, nos lados inferior e superior, foram muito mais difundidas em comparação com a classe A. Um teste t pode ajudar a determinar qual classe se saiu melhor.

Premissas do Teste T

A primeira suposição feita em relação aos testes t diz respeito à escala de medição. A suposição para um teste t é que a escala de medida aplicada aos dados coletados segue uma escala contínua ou ordinal, como as pontuações de um teste de QI.
A segunda suposição é a de uma amostra aleatória simples, de que os dados são coletados de uma parcela representativa e selecionada aleatoriamente da população total.
A terceira suposição é que os dados, quando plotados, resultam em uma distribuição normal, curva de distribuição em forma de sino.
A quarta suposição é que um tamanho de amostra razoavelmente grande é usado. Um tamanho de amostra maior significa que a distribuição dos resultados deve se aproximar de uma curva em forma de sino normal.
A suposição final é a homogeneidade da variância. Existe variação homogênea ou igual quando os desvios padrão das amostras são aproximadamente iguais.

Cálculo de testes T

O cálculo de um teste t requer três valores de dados principais. Eles incluem a diferença entre os valores médios de cada conjunto de dados (chamado diferença média), o desvio padrão de cada grupo e o número de valores de dados de cada grupo.

O resultado do teste t produz o valor t. Esse valor t calculado é então comparado com um valor obtido de uma tabela de valores críticos (denominada Tabela de Distribuição T). Essa comparação ajuda a determinar a probabilidade da diferença entre as médias ocorrerem por acaso ou se os conjuntos de dados realmente têm diferenças intrínsecas. O teste t questiona se a diferença entre os grupos representa uma diferença verdadeira no estudo ou se é provavelmente uma diferença estatística sem sentido.

Tabelas de distribuição T

A tabela de distribuição T está disponível nos formatos de uma cauda e duas caudas. O primeiro é usado para avaliar casos que têm um valor fixo ou faixa com uma direção clara (positiva ou negativa). Por exemplo, qual é a probabilidade de o valor de saída permanecer abaixo de -3 ou obter mais de sete ao lançar um par de dados? O último é usado para análise de limite de intervalo, como perguntar se as coordenadas estão entre -2 e +2.

Os cálculos podem ser realizados com programas de software padrão que suportam as funções estatísticas necessárias, como as encontradas no MS Excel.

Valores-T e graus de liberdade

O teste t produz dois valores como saída: valor t e graus de liberdade. O valor t é uma razão da diferença entre a média dos dois conjuntos de amostras e a diferença que existe nos conjuntos de amostras. Embora o valor do numerador (a diferença entre a média dos dois conjuntos de amostras) seja fácil de calcular, o denominador (a diferença que existe nos conjuntos de amostras) pode se tornar um pouco complicado, dependendo do tipo de valores de dados envolvidos. O denominador da razão é uma medida da dispersão ou variabilidade. Valores mais altos do valor t, também chamados de pontuação t, indicam que existe uma grande diferença entre os dois conjuntos de amostras. Quanto menor o valor t, maior a semelhança entre os dois conjuntos de amostras.

Um grande escore t indica que os grupos são diferentes.
Um pequeno escore t indica que os grupos são semelhantes.

Graus de liberdade refere-se aos valores em um estudo que tem liberdade para variar e são essenciais para avaliar a importância e a validade da hipótese nula. A computação desses valores geralmente depende do número de registros de dados disponíveis no conjunto de amostras.

Teste T correlacionado (ou emparelhado)

O teste t correlacionado é realizado quando as amostras normalmente consistem em pares correspondentes de unidades semelhantes ou quando há casos de medidas repetidas. Por exemplo, pode haver casos em que os mesmos pacientes são testados repetidamente - antes e depois de receber um tratamento específico. Nesses casos, cada paciente está sendo usado como uma amostra de controle contra si próprio.

Esse método também se aplica aos casos em que as amostras são relacionadas de alguma maneira ou possuem características correspondentes, como uma análise comparativa envolvendo filhos, pais ou irmãos. Os testes t correlacionados ou emparelhados são de um tipo dependente, pois envolvem casos em que os dois conjuntos de amostras estão relacionados.

A fórmula para calcular o valor te graus de liberdade para um teste t emparelhado é:

Mean1 e mean2 são os valores médios de cada um dos conjuntos de amostras, enquanto var1 e var2 representam a variação de cada um dos conjuntos de amostras.

Os dois tipos restantes pertencem aos testes t independentes. As amostras desses tipos são selecionadas independentemente uma da outra, ou seja, os conjuntos de dados nos dois grupos não se referem aos mesmos valores. Eles incluem casos como um grupo de 100 pacientes sendo divididos em dois conjuntos de 50 pacientes cada. Um dos grupos se torna o grupo controle e recebe um placebo, enquanto o outro grupo recebe o tratamento prescrito. Isso constitui dois grupos de amostras independentes que não são pareados entre si.

Teste T de variância igual (ou agrupada)

O teste t de variância igual é usado quando o número de amostras em cada grupo é o mesmo ou a variância dos dois conjuntos de dados é semelhante. A fórmula a seguir é usada para calcular o valor te graus de liberdade para o teste t de variância igual:

Valor T = média1-média2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2 onde: mean1 e mean2 = valores médios de cada um dos conjuntos de amostrasvar1 e var2 = variância de cada um dos conjuntos de amostras n1 e n2 = Número de registros em cada conjunto de amostras \ begin {align} e \ text {T-value} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ times var1 ^ 2 + (n2 - 1) \ times var2 ^ 2} {n1 + n2 - 2}} \ times \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { em que:} \\ & mean1 \ text {e} mean2 = \ text {Valores médios de cada} \\ & \ text {dos conjuntos de amostras} \\ & var1 \ text {e} var2 = \ text {Variação de cada uma das conjuntos de amostras} \\ & n1 \ text {e} n2 = \ text {Número de registros em cada conjunto de amostras} \\ \ end {alinhado} Valor T = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 mean1 - mean2 onde: mean1 e mean2 = valores médios de cada um dos conjuntos de amostrasvar1 e var2 = variância de cada um dos conjuntos de amostrasn1 e n2 = número de registros em cada amostra definir

Graus de liberdade = n1 + n2−2 onde: n1 e n2 = Número de registros em cada conjunto de amostras \ begin {alinhado} & \ text {Graus de liberdade} = n1 + n2 - 2 \\ & \ textbf {onde:} \\ & n1 \ text {e} n2 = \ text {Número de registros em cada conjunto de amostras} \\ \ end {alinhado} Graus de liberdade = n1 + n2-2 onde: n1 e n2 = Número de registros em cada conjunto de amostras O que outras pessoas estão dizendo

Teste T de variação desigual

O teste t de variação desigual é usado quando o número de amostras em cada grupo é diferente e a variação dos dois conjuntos de dados também é diferente. Esse teste também é chamado de teste t de Welch. A fórmula a seguir é usada para calcular o valor te graus de liberdade para um teste t de variação desigual:

Valor T = média1 - média2var12n1 + var22n2 onde: média1 e média2 = Valores médios de cada um dos conjuntos de amostrasvar1 e var2 = Variação de cada um dos conjuntos de amostrasn1 e n2 = Número de registros em cada conjunto de amostras \ begin {alinhado} & \ text {T-value} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {onde:} \ \ & mean1 \ text {e} mean2 = \ text {Valores médios de cada} \\ & \ text {dos conjuntos de amostras} \\ & var1 \ text {e} var2 = \ text {Variação de cada um dos conjuntos de amostras} \ \ & n1 \ text {e} n2 = \ text {Número de registros em cada conjunto de amostras} \\ \ end {align} Valor T = n1var12 + n2var22 mean1-mean2 em que: mean1 e mean2 = valores médios de cada um dos conjuntos de amostrasvar1 e var2 = Variação de cada um dos conjuntos de amostrasn1 e n2 = Número de registros em cada conjunto de amostras

Graus de liberdade = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1 onde: var1 e var2 = variância de cada um dos conjuntos de amostrasn1 en2 = número de registros em cada conjunto de amostras \ begin {alinhados } & \ text {Graus de liberdade} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ right) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ right) ^ 2} {n1 - 1} + \ frac {\ left (\ frac {var2 ^ 2} {n2} \ right) ^ 2} {n2 - 1}} \\ & \ textbf {where:} \\ & var1 \ text {e} var2 = \ text {Variação de cada um dos conjuntos de amostras} \\ & n1 \ text {e} n2 = \ text {Número de registros em cada conjunto de amostras } \\ \ end {alinhado} Graus de liberdade = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 onde: var1 e var2 = variância de cada dos conjuntos de amostras n1 e n2 = Número de registros em cada conjunto de amostras

Determinando o teste T correto a ser usado

O fluxograma a seguir pode ser usado para determinar qual teste t deve ser usado com base nas características dos conjuntos de amostras. Os principais itens a serem considerados incluem se os registros de amostra são semelhantes, o número de registros de dados em cada conjunto de amostras e a variação de cada conjunto de amostras.

Imagem por Julie Bang © Investopedia 2019

Exemplo de teste T de variação desigual

Suponha que estamos fazendo uma medição diagonal das pinturas recebidas em uma galeria de arte. Um grupo de amostras inclui 10 pinturas, enquanto o outro inclui 20 pinturas. Os conjuntos de dados, com os valores correspondentes de média e variação, são os seguintes:

	Conjunto 1	Conjunto 2
	19, 7	28, 3
	20, 4	26, 7
	19, 6	20, 1
	17, 8	23, 3
	18, 5	25, 2
	18, 9	22, 1
	18, 3	17, 7
	18, 9	27, 6
	19, 5	20, 6
	21, 95	13, 7
		23, 2
		17, 5
		20, 6
		18
		23, 9
		21, 6
		24, 3
		20, 4
		23, 9
		13, 3
Significar	19, 4	21, 6
Variação	1.4	17.1

Embora a média do conjunto 2 seja maior que a do conjunto 1, não podemos concluir que todas as pinturas tenham um comprimento médio em torno de 21, 6 unidades, pois a variação do conjunto 2 é significativamente maior que o conjunto 1. Isso é por acaso, ou existem realmente diferenças na população total de todas as pinturas recebidas na galeria de arte ">

Como o número de registros de dados é diferente (n1 = 10 en2 = 20) e a variação também é diferente, o valor t e os graus de liberdade são calculados para o conjunto de dados acima, usando a fórmula mencionada no teste T de variação desigual. seção.

O valor t é -2, 24787. Como o sinal de menos pode ser ignorado ao comparar os dois valores t, o valor calculado é 2, 24787.

O valor dos graus de liberdade é 24, 38 e é reduzido para 24, devido à definição da fórmula que exige o arredondamento do valor para o menor valor possível.

Sempre que uma distribuição normal é assumida, pode-se especificar um nível de probabilidade (nível alfa, nível de significância, p ) como critério de aceitação. Na maioria dos casos, um valor de 5% pode ser assumido.

Usando o valor do grau de liberdade como 24 e um nível de significância de 5%, uma olhada na tabela de distribuição do valor t fornece um valor de 2, 064. A comparação desse valor com o valor calculado de 2.247 indica que o valor t calculado é maior que o valor da tabela em um nível de significância de 5%. Portanto, é seguro rejeitar a hipótese nula de que não há diferença entre médias. O conjunto da população tem diferenças intrínsecas, e elas não são por acaso.

Compare contas de investimento Nome do provedor Descrição Divulgação do anunciante × As ofertas que aparecem nesta tabela são de parcerias das quais a Investopedia recebe remuneração.

Termos relacionados

Como funciona a análise de variância (ANOVA) A análise de variância (ANOVA) é uma ferramenta de análise estatística que separa a variabilidade total encontrada em um conjunto de dados em dois componentes: fatores aleatórios e sistemáticos. mais Entendendo a distribuição T A distribuição AT é um tipo de função de probabilidade apropriada para estimar parâmetros populacionais para amostras pequenas ou variações desconhecidas. mais Graus de liberdade Definição Graus de liberdade refere-se ao número máximo de valores logicamente independentes, que são valores que têm liberdade para variar, na amostra de dados. mais Como funciona o desvio padrão residual O desvio padrão residual é um termo estatístico usado para descrever a diferença nos desvios padrão dos valores observados versus os valores previstos, conforme mostrado pelos pontos em uma análise de regressão. mais Como a estatística do qui-quadrado funciona Uma estatística do qui-quadrado (χ2) é um teste que mede como as expectativas se comparam aos dados reais observados (ou resultados do modelo). Os dados usados no cálculo de uma estatística do qui-quadrado devem ser aleatórios, brutos, mutuamente exclusivos, extraídos de variáveis independentes e extraídos de uma amostra grande o suficiente. mais Como o teste de Wilcoxon é usado O teste de Wilcoxon, que se refere ao teste Rank Sum ou ao teste Signed Rank, é um teste não paramétrico que compara dois grupos emparelhados. mais Links de parceiros

← Propagação para a frente

A história do Uber →

Recomendado

Deixe O Seu Comentário