Home Up

 

1)      COEFICIENTE DE CORRELAÇÃO:

 

A razão entre a variação explicada por uma reta de regressão pela variância total dos dados é chamada de coeficiente de determinação.  Essa razão é sempre um número não-negativo que chamamos de r2. A quantidade r, chamada de coeficiente de correlação,  é dada por:

 

, onde r varia entre -1 e 1                            (1)

 

Usando o fato de que o desvio-padrão de Y é dado por:

 

Substituindo em 1

           ou                                                       (2)

 

Para o caso das correlações lineares, a quantidade r é a mesma não importando se X ou Y são consideradas variáveis independentes. Assim, r é uma boa medida da correlação linear entre 2 variáveis.

 

TESTE DE HIPÓTESE DO COEFICIENTE DE CORRELAÇÃO

 

Os N pares de valores (X,Y) de duas variáveis pode ser pensado como amostras de uma população de todos pares possíveis. Uma vez que duas variáveis são envolvidas, isto é chamado de uma POPULAÇÃO BIVARIADA, a qual supomos possumir uma distribuição bivariada normal. Podemos pensar em uma populaçã teórica de coeficientes de correlação, denotados por ρ, a qual é estimada por um coeficiente de correlação r. Testes de significância ou hipótese com respeito aos vários valores de ρ requerem o conhecimento das distribuições amostrais de r. Para ρ = 0 esta distribuição é simétrica, e a estatística envolvendo a distribuição de Student pode ser usada. Para ρ ≠0, a distribuição é ‘skewed’ (alongada). Nestes casos uma transformação desenvolvida por Fisher produz uma estatística que é aproximadamente normalmente distribuída. Os seguintes testes resumem os procedimentos envolvidos:

 

1)      Teste de Hipótese para ρ = 0. Aqui usamos a estatística de Student :

 

                     (3)

 

Que tem distribuição de t-Student com ν = N-2 graus de liberdade

---------------------------------------------------------------------------------------------------------------------

Exemplo 1 (Ex. 14.1 Coleção Schaum, Statistica, terceira Edição):

Um coeficiente de correlação baseado em uma amostra de tamanho 18 foi calculado como 0.32. Podemos concluir que aos níveis de significância de (a) 0.05 e (b) 0.01 a correspondente correlação populacional difere de zero?

Solução: Queremos decidir sobre a hipótese Ho: ρ = 0 e H1: ρ > 0.

=                                        (4)

a) Usando o teste da distribuição uni-lateral (ONE-TAILED TEST) da distribuição de Student (clique aqui para ver a distribuição) ao nível de 0.05, rejeitaremos Ho se t > t.95 = 1.75 para (18-2) = 16 graus de liberdade (PRESTEM ATENÇÃO NA TABELA QUE ESTIVEREM USANDO PARA TER CERTEZA QUE SE TRATA DE ONE-TAIL). NOTEM QUE A NOMENCLATURA PODE APARECER TAMBÉM EM ALGUNS CASOS COMO t0.05. ). Assim, não podemos rejeitar Ho ao nível de 0.05 (O que isso quer dizer?)

 

b) Uma vez que não podemos rejeitar Ho ao nível de 0.05, o que esperaríamos concluir ao nível de 0.01?

-----------------------------------------------------

2) Teste de Hipótese : ρ = ρo ≠ 0. Aqui usamos o fato de que a estatística:

                                (5)

Onde e= 2.71828..., é aproximadamente normalmente distribuída com média e desvio-padrão dado por:

                  com                   (6)

 

As equações 5 e 6 podem também ser utilizado\as para encontrar limites de confiança para o coeficiente de correlação.

Exemplo 2 (Ex. 14.33 Coleção Schaum)

Um coeficiente de correlação ode uma amostra de tamanho 24 foi calculada como sendo r=0.75. Ao nível de 0.05 de significância, podemos rejeitar a hipótese que o coeficiente de correlação da população é tão pequeno quanto (a) ρ=0.60 e (b) ρ=0.50

Solução

a)

 

Assim, 

 Usando a distribuição normal para um teste UNILATERAL (uma só cauda ou one-tail test) ao nível de 0.05 de significância, rejeitaríamos a hipótese apenas se z fosse maior que 1.64. Esse valor foi encontrado na tabela onde a área correspondeu a 0.45. Como se trata de um teste ao nível de 0.05, a área total de aceitação da hipótese Ho corresponde a 0.95. A área total sob a curva normal é igual a 1. Se você estiver utilizando uma tabela com area sob a curva para z variando de 0 a Z a área total sob a curva nesse intervalo (0-z) é igual a 0.5. O valor de corte para a aceitação ou rejeição da hipótese Ho deve ocorrer em 0.50 – 0.05 = 0.45. Se você procurar esse valor na tabela, verá que corresponde a um z= 1.64.  Assim não podemos rejeitar a hipótese que a correlação da população seja tão pequena quanto 0.60.

 

b) O que podemos dizer sobre o valor igual a 0.50?

aula .doc 

 

Home ] Up ]

Send mail to leila@model.iag.usp.br with questions or comments about this web site.
Last modified: 11/08/05