|
|
|
|
CONTINUAÇÃO EOF ANALYSIS – PARTE II
II – ALGUMAS PROPRIEDADES DAS COMPONENTES PRINCIPAIS (JJ)
1) TRANSFORMAÇÕES: Se você deseja transformar um conjunto
de variáveis x por uma transformação linear do tipo
Contudo, o fato de U ser ortonormal não é uma condição suficiente para que as variáveis transformadas sejam NÃO-CORRELACIONADAS! Apenas a solução deste vetor característico ira produzir um Sz que é uma matriz diagonal como L produzindo novas variáveis que são não-correlacionadas.
2) INTERPRETAÇÃO DAS COMPONENTES PRINCIPAIS.
Os coeficientes do Primeiro auto-vetor, 0.7236 e 0.6902 (PC1), são aproximadamente iguais e ambos positivos, indicando que para a primeira PC, z1 é uma média ponderada de ambas variáveis. Isto está relacionado à variabilidade que x1 e x2 têm em comum. Em outras palavras, as temperaturas do posto-1 e posto-2 estão bem correlacionadas. O primeiro auto-vetor representa a variabilidade deste processo. Suponha que a temperatura do posto-2 fosse anti-correlacionada com a temperatura do posto-1 (isto é, temperatura do posto-1 baixa correspondendo a temperatura do posto-1 alta e vice-versa). Se isso ocorresse, os coeficientes do primeiro auto-vetor teriam sinais opostos.
Os coeficientes para o segundo auto-vetor, -0.6902 e 0.7236 são também aproximadamente iguais, exceto pelo sinal. Assim, a PC-2 (ou z2), neste caso particular, representaria a diferença nas medidas para os dois postos.
Como se trata de um problema simplificado, com duas variáveis, de acordo com Pearson, o primeiro auto-vetor corresponde a ‘linha de melhor ajuste’, enquanto o segundo auto-vetor corresponderia a ‘linha de pior ajuste’. Lembre-se que a aplicação das componentes principais no referido exemplo foi feita de forma que queríamos conhecer a variação conjunta dos dois postos. O primeiro auto-vetor simplesmente representa esta variação conjunta. 3) MEDIDAS GENERALIZADAS E COMPONENTES DE VARIABILIDADE (JJ)
Tendo em mente que um dos objetivos da analise multivariada é o de resumir os resultados com o menor número possível de variáveis, existem 2 quantidades para medir a variabilidade global para o conjunto de dados. Estas quantidades são :
Uma propriedade útil da PCA é que a variabilidade total especificada por qualquer uma das medidas (as variáveis originais ou as PCs) é preservada. Ou seja:
Isto é, o determinante da matriz de covariância dos dados originais é igual ao produto dos auto-valores. No caso do exemplo, | S | = 0.1250 = (1.4465)(0.0864)= l1l2
Isto é, a soma das variâncias originais é igual a soma dos auto-valores. Para o exemplo dado:
=1.4465+0.0864 = l1+ l2
A segunda identidade é particularmente útil porque mostra que os auto-valores (os quais, lembrem, são as variâncias das componentes) podem estar relacionados com as variâncias dos dados!
Uma informação importante para guardar na cabeça para o futuro:
No caso do exemplo, % PC1 (ou z1) = 1.4465/1.5329 = 0.944 e %PC2(ou z2)=0.864/1.5329 = 0.056. Em outras palavras, ~ 94% da variância total dos dados está associada, ou explicada, pela primeira componente (a qual mostra que as duas medidas andam juntas e podem ser inter-relacionadas). Notem que tanto os auto-valores como auto-vetores são estimativas amostrais. Este é um problema que está presente na maioria das vezes que usamos PCA.
4) CORRELAÇÃO DAS COMPONENTES PRINCIPAIS COM AS VARIÁVEIS ORIGINAIS:
A correlação entre as variáveis originais e cada PC pode ser muito útil para propósitos diagnósticos. A correlação do i-ésimo PC, zi, com a j-ésima variável, xj, é igual a:
Para encontrarmos a correlação entre o primeiro auto-vetor e a primeira variável (Temperatura do Posto-1) o resultado é:
Para o exemplo, as correlações tornam-se:
Onde cada linha representa a variável e as colunas o auto-vetor. Ou seja, a primeira variável (temperatura no posto-1) tem correlação de 0.974 com o primeiro auto-vetor e correlação de -0.227 com o segundo auto-vetor. A segunda variável (temperatura no posto-2) possui correlação de 0.969 com o primeiro auto-vetor e 0.248 com o segundo auto-vetor. Em ambos casos a correlação foi maior com o primeiro auto-vetor, o que é esperado porque o primeiro auto-vetor explica a maior parte da variância dos dados (aproximadamente 94% da variância total). Note que se você somar as correlações ao quadrado em cada linha, esta soma é igual a 1. Não confunda também variável com observação (estas são obtidas no tempo).
Podemos pensar em muitas outras possibilidades de utilização deste método, principalmente se considerarmos um problema de mais variáveis. Suponha, por exemplo, que para a região de São Paulo, estejamos fazendo diversas medidas de variáveis meteorológicas e de poluentes, por exemplo. Podemos querer saber se o O3 está bem relacionado com o SO2 ou com o particulado, e como a concentração destes gases se relaciona com parâmetros meteorológicos como vento, pressão, temperatura e umidade. Um problema desse tipo teria 7 variáveis. Existem 7 auto-vetores possíveis para explicar a variação conjunta destas variáveis. Entretanto, podemos estar interessados em apenas trabalhar com um conjunto de auto-vetores que expliquem até 95% da variância total. Nesse caso, ao invés de utilizarmos os 7 auto-vetores (ou 7 componentes) poderíamos reduzir o problema a apenas às 3 primeiras componentes (se estas explicassem 95% da variância total, nossa hipótese inicial). Nesse caso, ao calcularmos a correlação entre as 3 primeiras PCs e as 7 variáveis, poderíamos encontrar para cada PC quais variáveis andam juntas, quais andam em sentido oposto e quais não possuem relação alguma umas com as outras. Este raciocínio pode ser usado para variações no espaço, e veremos isso adiante.
5) INVERSÃO DO MODELO DE COMPONENTE PRINCIPAL
Uma outra propriedade interessante da PCA é o fato de que a equação :
pode ser invertida tal que as variáveis originais podem ser pensadas como uma função das componentes principais:
Por que U é ortonormal e então U-1=U’ . Isto significa que, dados os z-scores, os valores das variáveis originais podem ser univocamente determinados. Correspondendo a primeira observação, os z-scores 0.48 e 0.51, quando substituídos em 10.29 produz o seguinte:
Dito de uma outra maneira, cada variável é formada de uma combinação linear de componentes principais (PCs). No caso de x1, para a primeira observação:
e
CONSIDERAÇÕES SOBRE A SEPARAÇÃO DOS AUTO-VALORES (Discussão detalhada no artigo North et al. 1982) O erro amostral do auto-valor λ é dado por: onde N = número de eventos INDEPENDENTES Assim, os principais passos para se afirmar que os auto-valores encontrados são independentes são os seguintes: 1) Determinem o número de eventos independentes da sua amostra. Isto pode depender um pouco do seu próprio bom-senso e do que você está estudando. Por exemplo, se estamos estudando padrões associados à ZCAS e estamos usando dados diários, os eventos que ocorrem em seqüência não podem ser considerados independente (supondo que a ZCAS é caracterizada por persistência). Assim, independentes serão os eventos que estiverem separados entre si por alguns dias (por exemplo, 2 dias). Se estivermos estudando especificamente padrões de ENSO observados em dados mensais, temos que considerar independentes os eventos que não pertencerem a um mesmo ciclo do fenômeno. 2) Determinar o valor de δλ e plotar em um gráfico como no exemplo:
3) Com a plotagem acima, pode-se perceber se os auto-valores são ou não independentes, se as barras de erros não se interceptarem.
LER O ARTIGO (CASTANHO AND ARTAXO 2001 ) COM O OBJETIVO DE INTERPRETAR OS RESULTADOS DE UMA APLICACAO DE PCA (ANALISE DE FATORES) DE ACORDO COM A TEORIA VISTA EM SALA DE AULA. |
|
Send mail to
leila@model.iag.usp.br with
questions or comments about this web site.
|