2.2   Alguns métodos estatísticos na análise de dados epidemiológicos.
Formulação e teste de hipoteses em amostras grandes. Formulação e teste de hipoteses em amostras pequenas .

Introdução
O presente capítulo tem como objectivo introduzir alguns métodos de análise de dados epidemiológicos.
Na análise dos dados devem observar-se os seguintes aspectos:

1. Tentar compreender o problema a ser estudado, a forma como foram obtidos os dados e as possíveis anormalidades.

2. Evitar a tentação de utilizar métodos estatisticos complicados.

3. Ser cuidadoso nas inferências. Mostrar os resultados de forma simples e concisa.

4. Ter em contas de que não existe hipótese nula exatamente verdadeira. O resultado do teste de hipóteses depende de:
- a magnitude com que a hipótese nula é incorrecta.
- a variabilidade natural na população estudada e
- o tamanho da amostra observada.

5. Ter em conta que é sempre possível obter um resultado estatisticamente significativo escolhendo uma amostra suficientemente grande. Portanto o estudo não é completo se não existir informação sobre a magnitude dos efeitos  que o teste detectou. Só com base nesta magnitude é possível avaliar sob o ponto de vista económico o valor do tratamento, mudança do método de maneio etc.

 1. Formulação e teste de hipoteses em amostras grandes

Um dos objectivos em estudos epidemiológicos é comparar duas populações diferentes da mesma espécie. Por exemplo podemos estar interessados se uma doença existe com a mesma prevalência em dois sistemas de maneio ou regimes profilacticos diferentes, ou podemos querer testar os benefícios económicos de antihelminticos verificando se os animais tratados ganharam mais peso ou mais rapidamente peso que os não tratados. Pode-se querer comparar médias ou proporções.

Testes estatisticos comuns

1.1 Teste para a diferença de duas médias.
 
 

 G. tratado G. n/tratado  Total
Número de animais 
50 
63 
113
Media
6.0
5.3
 
Desvio padrão 
1.6
1.9
 

 

1. Calcule a diferença entre as médias  (MD) 6.0-5.3= 0.7 kg
 

2. Calcule o erro padrão da diferença das médias SEMD  = [  (nt-1)St2+ (nu-1) Su2 x (1/nt+ 1/nu)]1/2
                                                                                                      nt +nu-2
 

nt, nu = número de tratados e não tratados
St, Su = Desvio padrão do grupo tratado e do grupo não tratado.

SEMD =0.34

Hipóteses:

Hipótese nula --->  não há diferença!

Hipótese alternativa de um lado (one sided alternative hypothesis).

O grupo tratado tem possivelmente um valor superior que o grupo não tratado.

Hipótese alternativa dos dois lados( two-sided experimental hypothesis).

Há uma diferença mas não interessa de que lado está i.e superior ou inferior.

Teste estatístico Z = MD/SEMD  = 0.7/0.34 = 2.059

Valor de Z é comparado com os valores críticos usados para comparar médias ou proporções em grandes amostras.
 
 

Nivel  de significância
10%
5%
  1%
 0.1%
Um lado
1.28
  1.64
 2.33 
 3.09
Dois lados
1.64 
1.96
 2.58
3.30

Se Z<1.28 (um lado) diferença não significativa.
Se Z>1.28 mas <1.64  diferença signitifativa ao nível de 10% mas não significativa a 5% e assim por diante. Quanto maior for o valor de Z mais significante é o resultado.
O nível de significancia é a probabilidade da diferença ser ao acaso.  Se há 5% de probabilidade de que a diferença é um efeito ao acaso, nós podemos estar 95% certos de que a diferença é um efeito real. Z= 2.059 i.e >1.64 mas < 2.33 então significativa a 5%.

1.2  Teste para a diferença de duas proporções.

Suponha que duas grandes manadas  estão sob dois sistemas de maneio diferentes e pertende verificar se as diferenças na frequência de uma determinada infecção são estatisticamente significativas.
 
 
No. Animais Susceptíveis  No. Animais Infectados  Taxa de Ataque
Manada 1
45 
18 
18/45
Manada 2
58
15
15/58
Total
103
33
33/103

P= No. total de animais infectados/tamanho da amostra 33/103
n1 e n2= tamanhos das amostras.

Isto é um teste para os dois lados (interessa-nos saber se existe diferença i.e se ela é significativa).

Se Z< 1.64 diferença não significativa.
Se Z> 1.64<1.96 a diferença é significativa a 10% mas não significativa a 5%. etc.

O teste estatístico (Z) para a hipotese de trabalho de taxas de ataque iguais para as duas manadas é obtido da seguinte forma:

Z=    Diferença entre as taxas de ataque- 1/2 (1/n1+1/n2)
                                [ P(1-P) (1/n1+1/n2)]½
 
 

 Z=   (0.4000-0.2586)-1/2(1/45+1/58)      = 1.31
      [0.3204 x 0.6796 x (1/45 +1/58)]½
 

Z< 1.64  (Tabela 1) Diferença não significativa. i.e as diferenças aparentes nas taxas de ataque ocorreram ao acaso.
Por outras palavras o método de maneio não influenciou significativamente  a frequência da doença.

2.Formulação e teste de hipoteses em pequenas amostras.

1. Quando se comparam duas prevalências ou taxas de ataque  tem que haver pelo menos 5 casos observados nos dois grupos para o teste ser válido.

2. Quando se comparam taxas ou proporções entre vários grupos com o X ² todos os valores esperados tem que ser superiores a 5.

3. Quando se comparam duas médias o tamanho das duas amostras somado tem de ser superior a 40. Se é inferior os calculos podem ser feitos mas o valor do teste estatístico (t) tem que ser comparado com o valor crítico em que estão incluidos o graus de liberdade que para este teste é nt+nu-2. Os valores críticos de t (Tabela 2) são diferentes dos usados para o teste em grandes amostras.

Ex:  Suponha que a experiência anterior foi realizada em dois grupos pequenos de 23 porcos tratados e 19 não tratados. A média para os dois grupos era 6.1 e 5.4 respectivamente sendo os desvios padrões de 1.72 e 1.64.
 

1. Calcule a diferença entre as médias  (MD) 6.1-5.4= 0.7 kg
 
 
 

2. Calcule o SEMD =  [   (nt-1)St2+ (nu-1) Su2 x (1/nt+ 1/nu)]½
                                            nt +nu-2
 

nt, nu = número de tratados e não tratados
St, Su = SD Desvio padrão do grupo tratado e do grupo não tratado.
SEMD = 0.522
Df= nt+nu-2 = 40

2. teste estatístico    t = MD/ SEMD = 0.7/0.522= 1.34

3. Compare o valor do teste estatistico t com os da tabela considerando os Df (n1+n2-2) ao nível de significancia desejado.
Valor de t estatistico (critico) é 1.68 (um lado) então as diferenças não são significativas (t=1.34<tc= 1.64) a este nível (5%).

 Pagina anterior
 Pagina seguinte