Home Up

 

EOF NO ESPAÇO : EXEMPLIFICAÇÃO PARA A COMPREENSÃO DO EXERCÍCIO

 

 

a)      imagine que você tenha  campos de anomalias de OLR em uma dada região em dois períodos distintos, dados por:

tempo t-1                     tempo-2

Cada número nessas matrizes representa um valor em cada um dos K pontos de grade (no caso temos (3x3 pontos de grade).

 

A nova matriz que iremos considerar para fazer a PC deve ser da seguinte forma (note que o exemplo não vale se estivermos trabalhando com programação em IDL que inverte linhas com colunas. O exemplo vale para programação em FORTRAN):

 

 

 

 

Note que os valores de anomalias dos pontos de grade de um único tempo estão todos em uma mesma coluna. Assim sendo, temos 2 colunas correspondendo aos dois tempos em que observamos as imagens.

 

Para simplificar o problema, vamos dizer que estamos considerando apenas quatro pontos de grade dos campos no tempo t1 e t2 (só para não ter que refazer tudo novamente):

 

Tempo -1          Tempo 2

 

implica na matriz:

 

 

 

Como determinar a matriz de covariância nesse caso?

 

Multiplicando x’ pela transposta x’T:

Note que x’ tem dimensão (pontos de grade) vs (tempo), ou seja  4 linhas e 2 colunas, e a transposta é (tempo) x (pontos de grade), ou seja 4 colunas e 2 linhas.

=

 

 

Veja que o que estamos fazendo é calcular na diagonal a variância no espaço no tempo t e somar com essa variância no tempo t+Dt . Simetricamente à diagonal, estamos calculando a covariância entre um determinado ponto de grade com a do vizinho no tempo t e somando com a covariância nos mesmos pontos de grade anteriores, só que agora para o tempo t+Dt. Assim, a informação que S nos fornece leva em consideração tanto as relações entre pontos de grade no espaço em um determinado tempo como as mesmas relações num tempo posterior. Essa matriz de covariância final tem 4x4 elementos.

 

A pergunta: Quantos autovetores/autovalores podem ser extraídos nesse caso?

 

Baseado no que foi visto anteriormente, o número de autovetores e autovalores associados à matriz de covariância (ou correlação se dividíssemos pelo desvio-padrão) seria igual a 4 (Por que?).

 

Este é o número de pontos de grade que temos no nosso problema. Assim sendo, num problema desse tipo, o número de componentes principais (ou de EOFs) é o mesmo que o número de pontos de grade que estamos considerando. Assim sendo, se utilizamos reanálises para calcular EOFs, esperamos encontrar 73x144 = 10512 autovetores. Obviamente, as componentes que nos interessam serão, digamos, as primeiras 20, que explicam a maior parte da variância total dos dados.

 

Conforme vimos anteriormente, quando determinamos os coeficientes dos auto-vetores (ou loadings) temos um número igual ao de variáveis que geraram as componentes. Lembrem-se que tínhamos 2 postos, 2 autovalores, 2 autovetores ou componentes e cada um deles possuía 2 elementos relacionados com cada um dos postos. Estes elementos eram justamente os co-senos dos ângulos entre o autovetor (ou a PC) e o posto. Posteriormente, os co-senos foram ‘transformados’ em correlações com os postos.

 

Analogamente, cada componente possui um número de elementos igual ao número de pontos de grade. Dessa forma, podemos tomar esses elementos e criarmos um mapa com os ‘loadings’ ou ‘weights’ (pesos). No caso de variáveis distintas, é a tabela de ‘pesos’ ou de ‘correlações’ com as variáveis que nos conta a importância de cada uma delas para aquela dada componente.

 

A matriz dos autovetores é dada pelos seguintes coeficientes (são os co-senos do ângulo que a variável faz com o autovetor na direção positiva do mesmo)

Eigenvectors of correlation matrix (dca_may98_station_sta) Active variables only

 

Factor 1

Factor 2

Factor 3

Factor 4

Factor 5

Factor 6

Tmed

-0.567243

0.178473

0.127103

-0.113451

-0.145115

0.772203

Tmax

-0.552983

0.050610

-0.166444

-0.518448

-0.337774

-0.530156

Tmin

-0.463787

0.258201

0.375882

0.667406

0.123517

-0.340967

precip

0.197762

-0.041274

0.899228

-0.367973

-0.103538

-0.066719

vel(m/s)

0.335016

0.597626

-0.057441

0.169551

-0.706022

0.009659

velmax

0.077457

0.734886

-0.054254

-0.329784

0.583444

-0.042829

 

A contribuição de cada variável para a componente (notem que a soma das contribuições em coluna é ~ igual a 1)

Variable contributions, based on correlations (dca_may98_station_sta)

 

Factor 1

Factor 2

Factor 3

Factor 4

Factor 5

Factor 6

Tmed

0.321765

0.031853

0.016155

0.012871

0.021058

0.596298

Tmax

0.305791

0.002561

0.027704

0.268788

0.114091

0.281065

Tmin

0.215099

0.066668

0.141288

0.445431

0.015257

0.116258

precip

0.039110

0.001704

0.808611

0.135404

0.010720

0.004451

vel(m/s)

0.112236

0.357157

0.003299

0.028747

0.498467

0.000093

velmax

0.006000

0.540058

0.002943

0.108758

0.340407

0.001834

 

 

No exemplo que vimos em sala de aula com variáveis distintas, a tabela de correlações indicou a correlação de cada variável com o respectivo auto-vetor (uma outra forma de avaliar o problema, de maneira mais direta)

 

Factor-variable correlations (factor loadings), based on corre (dca_may98_station_sta) lations

 

Factor 1

Factor 2

Factor 3

Factor 4

Factor 5

Factor 6

Tmed

-0.957387

0.230177

0.130018

-0.060082

-0.056173

0.082216

Tmax

-0.933319

0.065272

-0.170261

-0.274563

-0.130751

-0.056446

Tmin

-0.782775

0.333003

0.384503

0.353449

0.047813

-0.036303

precip

0.333780

-0.053232

0.919850

-0.194874

-0.040079

-0.007104

vel(m/s)

0.565437

0.770761

-0.058759

0.089792

-0.273298

0.001028

velmax

0.130732

0.947786

-0.055498

-0.174649

0.225849

-0.004560

 

Imagine, por exemplo, que cada variável da tabela fosse um ponto de grade e que cada valor a ela associado a um dado fator (ou componente) fosse plotado em um mapa. Analogamente ao caso das variáveis, os sinais positivos e negativos que aparecerão nos mapas indicarão as regiões com correlações positivas/negativas ou até mesmo sem correlações para aquela dada componente ou EOF.

Da mesma forma que podemos encontrar os z-scores para as variáveis, podemos encontrá-las para os campos. Nesse caso, teremos uma série temporal para cada componente. Esta série temporal dos z-scores é que nos conta a importância de cada uma das componentes ao longo do tempo (obviamente, dentro do intervalo de tempo dos dados que geraram as PCs).

 

Uma vez conhecido o padrão espacial associado a cada uma das componentes, podemos através dos z-scores saber que dias (no caso de dados diários) aquele padrão é mais ou menos típico. Nesse caso, temos a possibilidade de, por exemplo, fazer composições de dados naquelas datas, separando os z-scores com mais (ou menos) 1 desvio padrão. Claro que essa é uma escolha arbitrária, você pode ter qualquer outro critério de separação, podendo até mesmo não levar em conta o desvio-padrão (por exemplo, usar os percentis).

Este procedimento, o de usar o desvio-padrão, foi efetuado para as composições de dados de  OLR mostradas na aula anterior, para o caso de identificação de fases de propagação da MJO.

 

Outra forma interessante de visualizar os campos é, ao invés de determinar o mapa dos loadings, fazer uma regressão entre a série temporal de cada ponto de grade e a série dos z-scores daquela componente em questão. O coeficiente de correlação entre as duas series e'  uma informação bastante útil.

  

COMPLICADORES:

  •  Na maioria das vezes, temos mais pontos no espaço do que pontos no tempo. Nesse caso, e conveniente inverter a matriz de covariância (ou correlação) . Nesse caso, os coeficientes dos autovetores uij são coeficientes temporais. O auto-vetor final e'  equivalente ao z-score calculado anteriormente. Para observarmos quais são as características espaciais das componentes (ou EOFs) temos então que projetar os dados nos auto-vetores. No fundo, inverter o que foi feito anteriormente.

 

Home ] Up ]

Send mail to leila@model.iag.usp.br with questions or comments about this web site.
Last modified: 11/08/05