Home Up

 

Exemplo didatico
Exercicios

 

APLICAÇÃO DA PCA PARA CAMPOS (WI)

 

A grande maioria das aplicações de PCA para os dados atmosféricos envolve análise de campos como geopotencial, temperaturas, OLR, precipitação. Neste caso, o conjunto de dados consiste de múltiplas observações de um campo (ou mesmo um conjunto de campos).

 

Estas observações consistem de séries temporais (por exemplo, observações diárias do geopotencial de 500hPa medidas no Hemisfério Sul).

Uma forma de ver estes dados é como uma coleção de K séries temporais mutuamente correlacionadas que foram amostradas a cada ponto de grade ou estação.

 

Assim, a finalidade da PCA para este tipo de dado é usualmente explorar, ou expressar sucintamente, as variações conjuntas no espaço e no tempo deste conjunto de variáveis.

 

Embora os dados provenientes de campos estejam distribuídos num espaço bi-dimensional, os dados destas localizações (ou pontos de grade) observados em um determinado tempo t devem ser arranjados em um vetor unidimensional  x.  

 

Isto é, independente do arranjo geográfico, cada local é designado um número (ou uma posição se pensarmos em um vetor) de 1 a K, a qual se refere a um elemento apropriado do vetor de dados transposto xT=[x1,x2,x3,...,xk]. Nesta aplicação mais comum da PCA para campos, as matrizes de dados [X] e [X-Xmed] = x’ (não confundir a apóstrofe com o símbolo de transposta) são dimensionalizada como (n x K), ou (tempo x espaço), uma vez que os dados em K localidades no espaço foram amostrados em n diferentes tempos.

 

Para enfatizar que o dado original consiste de K séries temporais, a análise das Eqs. 10.21 e 10.22 ficam escritas com o índice de tempo explícito:

 

    (10.30a)

 

ou, na forma escalar,

 

,   m=1,..., M.   (10.30b)

 

Aqui o índice de tempo t vai de 1 a n. As equações acima enfatizam que, se os dados x consistem de um conjunto de séries temporais, entao as componentes principais z são também séries temporais. As séries temporais das componentes principais, zm(t), podem muito bem exibir correlações seriais (correlação entre si através do tempo). Contudo, cada série temporal das componentes serão não-correlacionadas com a série temporal de todos os componentes principais.

Quando os K elementos de x correspondem à medidas em diferentes locais no espaço, os auto-vetores podem ser mostrados graficamente de uma forma informativa. Note que cada auto-vetor contém exatamente K elementos, e que estes elementos têm uma correspondência um-a-um com cada uma das K localizações que advém do produto escalar a partir do qual a correspondente componente principal é calculada (Eq. 10.30).

 

Cada elemento de auto-vetor ukm  pode ser plotado no mapa em uma mesma localização conforme seu valor correspondente do dado x’k, e este “campo” dos elementos dos auto-vetores podem ser mostrados com contornos alisados na mesma forma que mostramos variáveis meteorológicas. Tais mapas mostram claramente quais localizações estão contribuindo mais fortemente para as respectivas componentes principais. Visto de uma outra forma, tais mapas indicam a distribuição geográfica das anomalias dos dados simultâneas, representadas pela correspondente componente principal. Estes mapas geográficos dos auto-vetores são também interpretados como representantes de modos não-correlacionados de variabilidade do campo a partir do qual a PCA foi extraída.

 

 

 

 

Fig. 10. 1 Primeira EOF (PC) obtida para o campo de anomalia diária do geopotencial em 700hPa. Números e seus respectivos contornos indicam o coeficiente de regressão (equivalente neste caso a correlação) com os K dados originais que deram origem a esta PC. Explicação da variância total dos dados: 25% (Extraído de Carvalho et al. (2003))

 

Esta figura mostra o resultado da aplicação de componentes principais obtidas de dados de anomalias diárias do geopotencial de 700hPa observados a sul de 20S. Os contornos tracejados indicam correlações negativas com os dados originais, enquanto os contornos com linhas cheias indicam correlação positiva com os dados originais. Assim, o que a primeira EOF está indicando é que existe uma relação oposta entre o geopotencial sobre a Antártida e em uma estrutura anular aproximadamente entre 40 e 50 S. Este comportamento indica uma troca de massa entre o  pólo e latitudes médias. Esta estrutura é conhecida como Oscilação Antártica ou Modo Anular do Hemisfério Sul (existe um paralelo no Hemisfério Norte, também conhecido como Oscilação do Ártico)

 

Assim, o sinal positivo da primeira componente (semelhante raciocínio ao que fizemos com o cálculo de PCA obtido para o conjunto de dados observados na estação de medidas do IAG) mostra uma relação com o mesmo sinal observado na Fig. 10.1: isto é, baixo geopotencial sobre a Antártida e alto em latitudes médias.

 

Se considerarmos a primeira PC com o sinal negativo, então estaremos considerando uma situação oposta: isto é, geopotencial alto nos pólos e baixo em latitudes médias.

 

No artigo de Wallace e Gutzler (1981) encontramos alguns outros exemplos de aplicações de PCA para campos que se tornaram conhecidos como padrões de teleconectividade (Pacific North American – PNA).

No Artigo de Mo and Higgins (1998) encontramos exemplos de aplicacao de EOFs para os campos que foram identificados como Pacific South American - PSA.

 

Outra aplicação interessante diz respeito ao uso das EOF para identificar a propagação do fenômeno conhecido como Oscilação de Madden e Julian (MJO).  Na figura 10.2 vemos um exemplo onde a MJO foi identificada nos dados de OLR filtrados em 20-70 dias. As duas primeiras componentes foram obtidas (PC1 e PC2) e cada uma delas pode ser considerada um padrão espacial típico que identifica uma fase de propagação do fenômeno. Repare que quando a PC2 é negativa, temos a fase da MJO que mostra um sinal sobre a ZCAS. Note que a figura 10.2 é diferente da Fig. 10.1 no seguinte sentido. A Fig. 10.2 foi obtida como uma composição de todos os dias em que as componentes foram observadas acima (ou abaixo) de 1 desvio padrão da média das PCs (ou scores) obtidos como na Eq. 10.30.

 

 

 

  • EXERCICIO DE APLICACAO

Este exercicio deve ser feito em grupo de 2-3 pessoas. Conforme discutido em sala de aula, rode o programa EOF.IDL5.6.ESPACO.EXAMPLE.pro  para selecionar a regiao dos dados de OLR filtrados que voce vai calcular a componente principal. Os dados que serao usados sao as anomalias de OLR na banda de frequencia de 20-90 dias (intrasazonal). Calcule as componentes principais, gere figuras postcript e interprete os resultados obtidos. O programa ira salvar um arquivo que contem os coeficientes temporais das duas primeiras componentes. Analise esses coeficientes no excel  procurando datas que correspondam aos casos tipicos das componentes. Discuta seu raciocinio.

 

Home ] Up ] Exemplo didatico ] Exercicios ]

Send mail to leila@model.iag.usp.br with questions or comments about this web site.
Last modified: 11/08/05