Estatística: Teste Exato de Fisher e Teste de Qui-Quadrado usando R (2024)

No post de hoje vamos falar sobre dois testes muito utilizados na Bioestatística: o teste exato de Fisher e o teste de Qui-Quadrado. Aqui, serão apresentados conceitos básicos desses dois testes, bem como funções de pacotes da linguagem R, as quais são amplamente utilizadas devido a sua simplicidade. Essas funções serão aplicadas em exemplos, os quais usam dados e situações fictícias, a fim de elucidar a aplicabilidade.

Estatística: Teste Exato de Fisher e Teste de Qui-Quadrado usando R (3)

O Teste Exato de Fisher é utilizado em tabelas de contingência 2x2 para comparar 2 grupos de duas amostras independentes, em outras palavras, tem como objetivo testar se a variável da linha e a variável da coluna são independentes (H0: a variável da linha e a variável de coluna são independentes). Além disso, esse teste fornece valor-p exato e não exige técnica de aproximação. O valor-p do teste exato de Fisher é preciso para todos os tamanhos amostrais, enquanto os resultados provenientes do teste qui-quadrado que examina as mesmas hipóteses podem ser imprecisos quando o número de células é pequeno. Ademais, o teste exato de Fisher é baseado na distribuição hipergeométrica. Portanto, o valor-p é condicional sobre os totais marginais da tabela.

Para realizar o teste exato de Fisher existe uma função no R chamada fisher.test, a qual faz parte do pacote stats. Essa função é simples de utilizar, para entender como utilizá-la, veja o exemplo abaixo, no qual vamos verificar ao nível de 5% de significância se a proporção de A é maior na população X quando comparado com a população Y:

Os parâmetros dessa análise são:

(a) uma matriz 2x2 no formato de uma tabela de contingência; (b) o parâmetro “alternative” indica a hipótese alternativa do teste realizado, também são válidos os valores “less” e “two.sided”; (c) o parâmentro “conf.int” indica que o intervalo de confiança deve ser construído para a razão de chances; e (d) o parâmetro “conf.level” indica o nível de confiança a ser utilizado para a construção do intervalo.

A hipótese a ser testada é:

𝐻o: proporção de “A” na população X é igual a proporção de “A” na população Y.

𝐻1: proporção de “A” na população X é maior que a proporção de “A” na população Y.

Considerando o resultado demonstrado acima:

São apresentados o p-valor do teste, a hipótese alternativa em consideração, o intervalo de confiança construído baseado na hipótese alternativa e a estimativa da razão de chances com base na tabela de contingência. Podendo ser concluído que não há evidências para rejeitar Ho (p=0,50), ou seja, não há evidências de que “A” na população X seja maior que o número de “A” na população Y.

É um teste de hipóteses que se destina a encontrar um valor da dispersão para duas variáveis categóricas nominais e avaliar a associação existente entre variáveis qualitativas. O teste de Qui-Quadrado é considerado um teste não paramétrico, pois não depende de parâmetros populacionais (média e variância). O princípio básico deste teste é comparar proporções, ou seja, possíveis divergências entre as frequências observadas e esperadas para um certo evento.

O teste de Qui-Quadrado pode ser utilizado para: (a) verificar se a frequência com que um determinado acontecimento observado em uma amostra se desvia significativamente ou não da frequência com que ele é esperado; e (b) comparar a distribuição de diversos acontecimentos em diferentes amostras, a fim de avaliar se as proporções observadas destes eventos mostram ou não diferenças significativas ou se as amostras diferem significativamente quanto às proporções desses acontecimentos.

Condições para realizar o teste de Qui-Quadrado:

  • Os grupos devem ser independentes;
  • Os itens de cada grupo são selecionados aleatoriamente;
  • As observações devem ser frequências ou contagens;
  • Cada observação pertence a uma e somente uma categoria;
  • A amostra deve ser relativamente grande (pelo menos 5 observações em cada célula e, no caso de poucos grupos, pelo menos 10. Exemplo: em tabelas 2x 2).

Para exemplificar como realizar o teste de Qui-Quadrado, abaixo temos o número observado de pessoas que foram internadas num hospital. As contagens foram feitas num período de 40 horas. O funcionário responsável pelo setor afirma que o processo descrito, seguem uma distribuição de Poisson com média igual a 3.2. Iremos testar com α=0.05.

Os parâmetros dessa exemplo são:

(a) um vetor com os dados observados, o segundo parâmetro (p) é um vetor com as probabilidades esperadas (sob 𝐻o).

A hipótese a ser testada é:

Ho: O número de internações seguem distribuição de Poisson (3.2)

H1: O número de internações não seguem distribuição de Poisson (3.2)

Considerando o resultado demonstrado acima:

É apresentada a estatística de teste calculada, o número de graus de liberdade ‘df’ e o p-valor do teste. A partir disso, vemos que não há evidências para rejeitar Ho (p=0,925), ou seja, não refutamos a ideia que os dados seguem uma distribuição de Poisson (3.2).

Estatística: Teste Exato de Fisher e Teste de Qui-Quadrado usando R (2024)
Top Articles
Latest Posts
Article information

Author: Annamae Dooley

Last Updated:

Views: 5355

Rating: 4.4 / 5 (65 voted)

Reviews: 80% of readers found this page helpful

Author information

Name: Annamae Dooley

Birthday: 2001-07-26

Address: 9687 Tambra Meadow, Bradleyhaven, TN 53219

Phone: +9316045904039

Job: Future Coordinator

Hobby: Archery, Couponing, Poi, Kite flying, Knitting, Rappelling, Baseball

Introduction: My name is Annamae Dooley, I am a witty, quaint, lovely, clever, rich, sparkling, powerful person who loves writing and wants to share my knowledge and understanding with you.