Testes estatísticos simples no Excel

O Excel é uma ferramenta de maior acessibilidade em comparação aos softwares estatísticos, e possui diversas funções para cálculo de testes estatísticos. No entanto, para sua utilização é preciso que o pesquisador tenha certa familiaridade com estatística e com as fórmulas do Excel (em oposição ao SPSS, por exemplo, que apresenta menus práticos em que basta clicar para efetuar o teste).

Esse primeiro texto propõe-se a apresentar para pesquisadores que não conhecem tão bem as fórmulas do excel o passo-a-passo de como calcular e interpretar o resultado. Ressalta-se, no entanto, que mais importante que calcular um teste estatístico corretamente é saber se ele é apropriado ou não para responder seu objetivo de pesquisa – neste caso, é melhor procurar um profissional para auxiliá-lo nessa decisão.

As fórmulas desse texto consideram o Excel versão 2010.

Teste T para duas populações independentes

O teste T para duas populações independentes é comumente utilizado para testar se a média de duas populações é significativamente diferente, maior ou menor quanto a certa variável, utilizando amostras para tomar esta decisão. Por exemplo, podemos ter interesse saber se a idade média de homens e mulheres consumidores de um certo produto é significativamente diferente.

Para aplicar o teste T, precisamos nos certificar se as variáveis de interesse seguem distribuição normal e se suas variâncias são homogêneas (o que não será abordado neste texto) e como resultados, comumente vamos querer duas informações: a estatística de teste e o p-valor.

Para calcular o teste, primeiramente deve-se ajustar os dados no seguinte formato:

Para o cálculo do p-valor do teste quiquadrado, usa-se a fórmula T.TEST (em português, TESTE.T), informando como parâmetros, nesta ordem: as observações da variável no 1º grupo; as observações da variável no 2º grupo; a informação de que o teste é unilateral (1) ou bilateral (2); e o tipo de teste, se pareado (1), de populações independentes com variâncias iguais (2), ou de populações independentes com variâncias iguais (3).

Esclarecendo, os testes unilaterais testam a hipótese de que uma população tem média maior ou menor (especificando qual hipótese) que a outra, enquanto os testes bilaterais  avaliam se uma população tem média  diferente (sem especificar se maior ou menor) Da outra. No presente caso queremos fazer um teste bilateral, então o argumento informado na fórmula é 2.

Já quanto ao tipo de teste, foi previamente declarado que nossas populações são independentes, e idealmente teremos que realizar um teste complementar para definir se as variâncias das populações são iguais ou não. No caso, usaremos o teste que não assume variâncias iguais, então o argumento informado na fórmula é 3.

Já para calcular a estatística de teste T, usa-se a fórmula T.INV.2T (em português, INV.T.BC). Caso tivéssemos realizado um teste unilateral, usaríamos a fórmula T.INV (em português, INV.T).

Informa-se como parâmetros o p-valor recém calculado e os graus de liberdade. Relembrando o conceito estatístico, o total de graus de liberdade do teste T é calculado da seguinte forma: (qtde respostas no grupo1 + qtde respostas no grupo2 – 2). Neste caso, temos 11 respostas em cada grupo, resultando em (11 + 11 – 2) = 20 graus de liberdade.

Obtendo os resultados, passamos para a interpretação. O pesquisador deve ter definido previamente o nível de confiança desejado de seus resultados. Caso tenha definido um nível de confiança de 95%, observar-se-á o p-valor calculado e, caso este seja inferior a 0,05, será rejeitada a hipótese nula de que as médias dos grupos são iguais. No caso apresentado, com p-valor 0,028, rejeitamos a hipótese nula e aceitamos a hipótese alternativa de que há sim, diferença na média desses grupos.

Teste Quiquadrado

O teste quiquadrado é comumente utilizado para avaliar associação entre duas variáveis categóricas. Por exemplo, numa mesma população, podemos ter interesse em avaliar se há associação entre o gênero (masculino / feminino) e o fato do indivíduo de trabalhar (sim / não). Temos interesse em obter duas informações: a estatística do teste quiquadrado e o p-valor, para tomar a decisão, com certo nível de confiança, sobre se há ou não associação entre essas variáveis na população, com base numa amostra.

Para calcular o teste, primeiramente deve-se ajustar os dados no seguinte formato:

Os dados apresentam o resultado observado na amostra. Para o teste, é necessário calcular o resultado esperado caso não houvesse associação. Ele é calculado para cada categoria de resposta possível (Masculino Sim, Masculino Não, Feminino Sim, Feminino Não), multiplicando o total de cada coluna ou linha correspondente, e dividindo pelo total geral, usando as fórmulas aritméticas do Excel, conforme exemplo:

 

Caso seja calculado corretamente, as somas das colunas e linhas dos valores observados será exatamente igual a do valor observado.

Para o cálculo do p-valor do teste quiquadrado, usa-se a fórmula CHISQ.TEST (em português, TESTE.QUIQUA), informando como parâmetros os valores observados, e depois os valores esperados.

 

Já para calcular a estatística de teste quiquadrado, usa-se a fórmula CHIST.INV.RT (em português, INV.QUIQUA.CD) informando como parâmetros o p-valor recém calculado e os graus de liberdade. Relembrando o conceito estatístico, o total de graus de liberdade do teste quiquadrado é calculado da seguinte forma: (qtde categorias da variável1 – 1) x (qtde categorias da variável2 – 1). Neste caso, temos 2 categorias para a variável Trabalha e 2 categorias para a variável Gênero, resultando em (2-1) x (2-1) = 1 grau de liberdade.

 

Obtendo os resultados, resta interpretá-los. O pesquisador deve ter definido previamente o nível de confiança desejado de seus resultados. Caso tenha definido um nível de confiança de 95%, observar-se-á o p-valor calculado e, caso este seja inferior a 0,05, será rejeitada a hipótese nula de que não há associação entre as variáveis. No caso apresentado, com p-valor 0,018, rejeitamos a hipótese nula e aceitamos a hipótese alternativa de que há sim, associação entre o gênero e o fato da pessoa trabalhar.

Fonte: Blog PosGraduando

16 de maio de 2017

Publicado por Priscila Jacobsen