|
|
|
|
ANÁLISE DE ONDELETAS (WAVELET)
Sites importantes para essa investigação:
1) http://paos.colorado.edu/research/wavelets/ 2) http://www.ptr.poli.usp.br/ltg/pos/index.html (Apostila preparada por Augusto Barbosa (IAG/USP) e Denizar Blitzkow (Poli) disponivel site Poli) (powerpoint preparado por Augusto Barbosa (IAG/USP) com aspectos diversos - clique aqui) 3) http://www.cosy.sbg.ac.at/~uhl/wav.html 4) http://www.stats.bris.ac.uk/pub/reports/Wavelets/Wavelets.html 5) http://www.engineering.ucsb.edu/~farge/ 6) http://www.amara.com/current/wavelet.html (Bom para iniciantes) 7) http://www.ecs.syr.edu/faculty/lewalle/tutor/tutor.html (Bom para iniciantes) É FORTEMENTE RECOMENDADO QUE OS ESTUDANTES LEIAM COM ATENÇÃO O ARTIGO COLOCADO DISPONÍVEL NO SITE-1 “A PRACTICAL GUIDE TO WAVELET ANALYSIS” POR CHRISTOPHER TORRENCE E GILBERT COMPO (1998). ESTE ARTIGO FORNECE UM EXCELENTE GUIA E TAMBÉM ABORDA COM SIMPLICIDADE DIVERSAS QUESTÕES SOBRE AS ONDELETAS. O TEXTO A SEGUIR ESTA BASEADO NESSE ARTIGO E NO SITE-1. ALEM DISSO, OUTROS SITES INTERESSANTES SÃO MENCIONADOS NO SITE-1, BEM COMO IMPORTANTES REFERÊNCIAS PARA UM APROFUNDAMENTO NO TÓPICO. AGRADECEMOS A COLABORAÇÃO DA ESTUDANTE DE DOUTORADO MICHELLE REBOITA (INICIO NO PROGRAMA USP EM 2004) PELO MATERIAL ILUSTRATIVO ELABORADO PARA A COMPREENSÃO DA APLICAÇÃO DAS ONDELETAS EM METEOROLOGIA. A DISSERTAÇÃO DE MESTRADO DA MICHELLE CONTEM ALGUNS EXEMPLOS DE APLICAÇÃO DAS ONDELETAS. SE VOCÊ QUISER CONHECÊ-LA CLIQUE AQUI (ARQUIVO .pdf DE ~ 17 MB)
Idéias gerais e Motivação:
Fig. 1 (Extraída do site 1, produzido por Torrence e Compo) mostra a temperatura média da superfície do mar (TSM) sobre a região Niño 3 no Pacífico Este. A curva azul é a TSM filtrada com um filtro passa-banda (apenas períodos maiores que 12 meses estão retidos). O fundo amarelo limitado por uma curva é a variância-móvel de 15 anos, plotada no ponto médio de um período de 15 anos. (note que a curva não esta sendo plotada nem nos primeiros 15 anos e nem nos últimos 15 anos). A curva foi reproduzida de cabeça para baixo também para mostrar o “envelope” de variância (uma vez que para seu cálculo são considerados os sinais positivos e negativos do ENSO).
O que sinais na natureza como esse podem indicar?
1) Não estacionaridade (notem como a variância- móvel depende do tempo) 2) Enquanto séries temporais podem exibir sinais periódicos dominantes, estes podem variar tanto em AMPLITUDE quanto em FREQÜÊNCIA em longos períodos de tempo.
Para a TSM da Fig. 1 é claro que o modo de variabilidade mais importante é o ENSO (indicado pelos picos mais intensos que aparecem numa escala temporal de 2-7 anos. Note ainda que flutuações interdecadais também estão superpostas a estas (como percebemos estas flutuações na Fig. 1?). São justamente estas flutuações interdecadais que possuem o efeito de modular a amplitude e freqüência de ocorrência dos eventos El Niño. Por exemplo, o ENSO teve maior variância durante 1880-1920 e também desde 1950, com um período relativamente ‘quieto’ durante as décadas 1920-1950.
Notem, entretanto, que o fenômeno El Niño é definitivamente um sinal irregular ou aperiódico!
1) Métodos para análise de estacionaridade/ não estacionaridade
1.1) Um jeito simples de analisar a não-estacionaridade de séries temporais seria calcular estatísticas como médias e variâncias para diferentes intervalos de períodos (digamos, janelas no tempo) e ver se são estatisticamente distintas (isto é, fazer testes de hipóteses para responder se as diferenças são ou não estatisticamente distintas)
Pontos fracos desse tipo de análise de variância:
i. Localização no tempo. A forma da curva é altamente dependente do comprimento da janela usada. Quinze anos foram escolhidos como um compromisso entre o muito alisado (por exemplo, uma janela no tempo de 30 anos) e o pouco alisado (uma janela de 5 anos). Um método ideal seria aquele que permitisse janelas de diferentes tamanhos dependendo da escala que estivéssemos interessados em analisar. ii. Localização em freqüência. A variância móvel não contém informação alguma sobre a freqüência do sinal periódico, apenas sua amplitude (apenas se a janela é apropriadamente escolhida). iii. A escolha de uma janela fixa para a análise da variância. Uma desvantagem dessa escolha é a forma de caixa que a função da janela pode ter, a qual poderia introduzir efeitos de bordas. Mesmo variando-se o tamanho da janela e repetindo a análise para várias larguras da mesma (por exemplo, gerando uma figura mostrando a variância versus o tamanho da janela), ainda assim, não evitaríamos o efeito caixa-preta, isto é, não sabemos o que está acontecendo dentro da caixa, apenas recuperamos a energia média .
1.2) Outra alternativa seria aplicar uma transformada de Fourier móvel (ou em janela – em inglês windowed Fourier transform – WFT), usando um certo tamanho de janela e deslizando a mesma ao longo do tempo, de forma a calcular a FFT para cada tempo usando apenas os dados dentro daquela janela. Isto iria resolver o problema ii, isto é, a localização da freqüência.
Pontos fracos da análise de WFT:
iv. Dependência do tamanho da janela. Pode-se com o método localizar freqüências periódicas, porém estas vão depender do tamanho da janela usada na série temporal. v. Tratamento inconsistente de diferentes freqüências. Este é considerado o pior problema: para baixas freqüências (períodos maiores) existem tão poucas oscilações dentro da janela que a localização da freqüência é perdida. Por outro lado, existem tantas oscilações em alta-freqüência que a localização da freqüência também fica perdida. vii. Decomposição do sinal em componentes senoidais. Este é outro problema desse método, isto é, a WFT sempre assume que o sinal pode ser decomposto em componentes senoidais, o que nem sempre é ideal.
Solução possível para o impasse: Uso de análise de Ondeletas (Wavelets). Por que? A Análise de Wavelets tenta resolver este problema decompondo as séries temporais no espaço de tempo e freqüência simultaneamente. Assim, podem-se obter informações tanto da amplitude de qualquer sinal “periódico” dentro da série e como esta amplitude varia com o tempo.
Só para dar o gostinho com o que vem para frente, veja o exemplo de uma análise de Ondeleta na Fig. 2 (vamos entrar em mais detalhes ao longo do texto). O que vemos na Fig. 3a é a série temporal bruta dos dados de TSM obtidos no Niño3 (5ºS - 5ºN, 90º W-150ºW). Na Fig. 2b observa-se um espectro de energia (no caso, o espectro da ondeleta) o qual indica a amplitude observada (níveis de cores) no tempo (eixo das abscissas) de acordo com o período (equivalente à freqüência) que contribuiu para a série temporal mostrada na Fig. 2a. Se estivéssemos usando a transformada de Fourier (FFT) para obter o espectro como vimos em sala de aula, apenas poderíamos conhecer o espectro global do sinal da TSM, indicando quais freqüências (ou períodos que possuem maior potência para esse sinal. Não poderíamos saber quando o mesmo ocorreu. O uso da WFT também teria desvantagens e limitações, conforme discutido acima.
Fig. 2 (a) Série temporal da TSM. (b) Espectro de potência da ondeleta, usando a ondeleta de Morlet (veja discussão adiante) (Extraída do site (1) de Torrence e Compo).
2) A análise de Ondeletas
Fig. 3 (Extraída do site-1 de Torrence e Compo) (a) Ondeleta de Morlet, de largura e amplitude arbitrarias. (b) Construção da ondeleta de Morlet (linha azul tracejada) como uma curva seno (linha verde) modulada por uma Gaussiana (em vermelho).
O que a Fig. 3 (construída por Torrence e Compo) mostra é um exemplo de um “pacote” de onda, de duração finita e com uma freqüência específica. Alguém poderia imaginar usar esta forma como uma função de janela para a análise da variância, por exemplo. É justamente esta função que é chamada de ‘ONDELETA’. Esta ondeleta tem a vantagem de incorporar uma onda de um certo período e possuir extensão finita. Além disso, uma função para ser admissível como uma ondeleta precisa ter média zero e estar localizada tanto no espaço de tempo e de freqüência (Torrence e Compo 1998). De fato, a ondeleta mostrada na figura 3a (a qual é chamada de ondeleta de Morlet) nada mais é do que uma onda seno multiplicada por um envelope Gaussiano!
Assumindo que a largura total da ondeleta é por volta de 15 anos, podemos encontrar a correlação entre esta curva e os primeiros 15 anos da nossa série temporal mostrada na Fig. 1. Este simples número fornece uma medida da projeção deste pacote de onda durante o período 1876-1890, isto é, quanto de amplitude os 15 anos considerados se assemelham à onda seno com esta largura (freqüência). Deslizando esta ondeleta ao longo da nossa série temporal podemos construir uma nova série das projeções das amplitudes versos o tempo.
Como mudar a escala da ondeleta? Podemos variar a “escala” da ondeleta mudando a sua largura. Esta é a real vantagem da análise de ondeleta em relação ao espectro móvel de Fourier. Para uma janela de uma certa largura, deslizar a FFT é ajustar diferentes números de onda, isto é, pode haver muitas ondas de alta-frequência dentro da janela, enquanto a mesma janela pode apenas conter algumas poucas (ou menos que uma) onda de baixa-frequência. A análise de ondeleta SEMPRE usa uma onda com a EXATA MESMA FORMA, apenas o tamanho das escala aumenta ou diminui com o tamanho da janela. Para visualizar melhor o que está sendo dito, imagine que fixamos a forma da ondeleta e vamos ampliando o seu tamanho (dando um Zoom).
Nós vimos na parte inicial do curso que além da periodicidade de qualquer sinal, é importante também obter informações sobre a fase. Na prática, a ondeleta de Morlet mostrada na Fig. 3a é definida como o produto entre uma onda exponencial complexa e um envelope Gaussiano:
Onde y é o valor da ondeleta para um parâmetro de “tempo” não-dimensional h e wo é a freqüência (Torrence e Compo, 1998). O envelope Gaussiano é definido pela segunda exponencial do produto da Eq. 1, enquanto a onda exponencial complexa é a primeira exponencial. Esta é a função de wavelet básica.
2.1 Como mudar o tamanho global e como ‘deslizar’ a ondeleta no tempo
A transformação em escala da ondeleta (também chamada de scaled wavelet – ondeleta escalonada) é definida como:
onde s é o parâmetro de dilatação usado para mudar a escala, e n é ao parâmetro de translação usado para deslizar no tempo. O fator s-1/2 é a normalização para manter constante o total da energia da ondeleta escalonada. Assim sendo, suponha que você possua uma série temporal X, com valores xn, com o índice n significando o tempo. Cada valor é separado no tempo por um intervalo de tempo constante dt. A transformada de ondeleta Wn(s) é, portanto, o produto interno (também chamado de convolução) da função da ondeleta com nossa série temporal original. Esse raciocínio é semelhante ao processo que fazemos no caso da FFT (neste caso, uma função de senos e co-senos). Assim, a transformada Wn é definida como:
O (*) denota complexo conjugado . Quanto à notação, reparem que y significa a função de ondeleta (Fig. 3a) enquanto Wn é a transformada de ondeleta.
Notem que a somatória de Wn(s) é feita em n’, variando de 0 a N-1 (n’ é o índice do tempo, com N igual ao número de pontos no tempo). Variando a escala da ondeleta s e transladando ao longo do índice de tempo localizado n, pode-se construir uma figura bidimensional (v. Fig. 2) mostrando a amplitude versos a escala e como a mesma varia com o tempo (notem que n’ é diferente de n, onde n indica a translação no tempo). Vejam que Wn é obtido para cada escala s a qual é usualmente tomada como múltiplos da mais baixa freqüência possível. O subscrito 0 foi removido de y para indicar que esta y foi normalizada (veja Torrence e Compo 1998 para maiores detalhes). De qualquer maneira, é importante ressaltar que a normalização é feita para que as escalas possam ser comparáveis umas com as outras e para que a transformada de ondeleta tenha unidade de energia.
Assim, voltando à Fig. 2, vemos que a mesma mostra a potência (o valor absoluto ao quadrado) da transformada de ondeleta (de Morlet) para a TSM do Niño3. O valor absoluto ao quadrado fornece informação da potência relativa a uma certa escala e um certo tempo. Um plote da amplitude e fase mostraria a oscilações das ondeletas individuais ao invés de apenas a magnitude das mesmas.
Se você comparar as Figs. 1 e 3 verá que fica agora muito mais claro notar que existe uma potência muito maior em 2-7 anos de ENSO tanto durante os períodos iniciais quanto finais do século. Além disso, podemos agora ver a presença de oscilações de 16 anos assim como potências em mais baixas freqüências. As transformadas de ondeleta também fornecem informação da mudança de freqüência que podem ter ocorrido. Assim, de 1960-1990 a banda de 2-7 anos do ENSO parece ter sofrido uma fraca oscilação do período entre eventos, de 3 anos em 1965 para aproximadamente 5 anos no início dos anos 80. Pode-se dizer o mesmo antes de 1910 e aproximadamente entre 1910 e 1920.
2.2 Fase, Amplitude e Espectro de Potência da Ondeleta
Pelo fato da função de ondeleta
y ser
em geral complexa, a transformada de ondeleta Wn(s) também é complexa. A
transformada pode então ser dividida em parte real R
Amplitude:
Fase:
Espectro da
ondeleta:
2.3 Escalas e Cálculo da transformada de Ondeleta: Algoritmos
Para calcular a ondeleta temos primeiro que considerar a sua forma. Não existe apenas a ondeleta de Morlet (v. Discussão em Torrence e Compo 1998). A escolha da ondeleta de Morlet deve-se às seguintes razões:
1) é comumente usada 2) é simples 3) parece com uma onda
Chamamos também as funções de ondeleta de ondeleta-mãe (mother wavelet). Para a transformada de Morlet , a ondeleta mãe é :
¨ Precisamos primeiro escolher o número de onda wo, o qual fornece o número de oscilações dentro da própria ondeleta. Uma condição para a transformada de ondeleta é que a média da ondeleta tem que ser igual a zero. Na prática, se você escolhe wo=6, então os erros devido a médias não iguais a zero são menores que os erros típicos de arredondamento (ver explicação em Farge 1992). ¨ O próximo passo é escolher o conjunto de parâmetros de escala s, tal que possamos adequadamente amostrar todas as freqüências presentes na nossa série temporal. Precisamos primeiro escolher a menor escala resolvível, so, como um múltiplo de nossa resolução temporal dt. Para os dados de TSM do Niño3, temos dados sazonais. Como temos quatro estações num ano, o intervalo representado em termos de ano é dt=0.25 anos. A menor ondeleta que podemos possivelmente resolver possui período 2xdt = 0.5 ano (lembrem-se da idéia da freqüência de Nyquist vista anteriormente). As escalas mais longas (períodos mais longos) são escolhidos como múltiplos dessa menor escala,
A escolha de um dj suficientemente pequeno depende da largura do espaço espectral da função de ondeleta. Para a ondeleta de Morlet, dj ~ 0.5 é o maior valor que ainda fornece adequada amostragem em escala, enquanto para outras ondeletas um valor ainda maior pode ser usado. Valores menores de dj fornecem resolução mais fina. No exemplo de Torrence e Compo (1998) foi usado o valor 1/8 (0.125).
2.4 Espectro teórico, nível de significância e cone de influência
A figura acima, extraída de Torrence e Compo (1998), mostra o espectro de potência de Fourier obtido para os dados de TSM do Niño 3 (curva cheia). A curva tracejada abaixo indica o espectro de fundo como um ruído vermelho (lembrem-se das aulas anteriores) enquanto que a curva tracejada superior é o nível de confiança de 95% (equivalente ao nível de significância do teste de hipótese de 5%) do espectro. Podemos fazer raciocínio similar no caso das Ondeletas. Nesse caso, estaremos falando em ESPECTRO LOCAL DA ONDELETA, DEFINIDO COMO UMA FATIA VERTICAL NA FIG. 1b. Lembrem-se que para assumirmos o ruído de fundo como ruído vermelho no caso de Fourier, tínhamos que calcular a autocorrelação e verificar se para lag=1 a mesma é diferente de zero (no caso do exemplo, ~ 0.7). Nesse caso, assumimos que o espectro de fundo para a Fourier é um ruído vermelho. Torrence e Compo (1998) mostram com simulações de Monte Carlo que o espectro de fundo da ondeleta de Morlet é também o ruído vermelho obtido para Fourier mostrado na Fig. 3 indicada acima.
A obtenção do intervalo de confiança para o espectro de ondeleta segue raciocínio análogo ao que foi feito para o espectro de Fourier (veja discussão em Torrence e Compo 1998, pág. 70. ATENÇÃO À ERRATA: A EQ. 17 DE TORRENCE E COMPO 1998 NÃO DEVE APARECER ½ MULTIPLICANDO O TERMO DA DIREITA). Cone de influência.
Notem na Fig.1 do artigo de Torrence e Compo (1998) que existe uma região com linhas cruzadas. O cone de influencia (COI) é a região do espectro de ondeleta na qual os efeitos das bordas tornam-se importantes. Isto porque estamos tratando com series finitas e erros irão ocorrer no começo e no fim do espectro de ondeletas, conforme a transformada de Fourier assume que o dado é cíclico. Uma solução é incluir zeros nas bordas da série. Pode-se incluir zeros e depois removê-los. No estudo de Torrence e Compo (1998) a série é adicionada um tanto de zeros para que o comprimento da mesma N atinja a potencia de 2 mais próxima, assim limitando os efeitos de borda e aumentando a eficiência do cálculo da transformada de Fourier.
O powerpoint a seguir foi elaborado pela aluna de doutorado Michelle Reboita para uma melhor compreensão da aplicação da ferramenta estudada. Neste powerpoint, o estudante pode acompanhar aspectos teóricos e aplicações praticas. O assunto e' parte da tese de doutoramento da aluna (2004). Clique aqui para baixar o arquivo *************************************************************************************************** EXERCÍCIO:
Figura abaixo: extraida de Torrence e Compo 1998
Detalhes e dicas sobre algoritmos
É possível calcular a transformada de wavelet no domínio do tempo usando a Eq. 3. Entretanto, é muito mais simples usar o fato de que a transformada de ondeleta é a convolução entre duas funções x e y, e proceder à transformada de ondeleta no espaço de Fourier usando a transformada rápida de Fourier (FFT). Ou seja, no domínio de Fourier, a transformada de ondeleta é simplesmente:
onde ^ indica a transformada de Fourier (FT), dada por:
Para usar esta fórmula, a FT da função de ondeleta deverá ser conhecida analiticamente. Além disso, as ondeletas precisam ser normalizadas como:
Diferente da convolução, o método de FFT permite o cálculo de todos os n pontos simultaneamente, e pode ser eficientemente programado usando qualquer pacote que calcule FFT (Fortran, IDL, C, etc.)
Assim, os principais passos para calcular a transformada de ondeleta para uma série temporal são:
1) Escolher a ondeleta – mãe (Morlet é a mais usada) 2) Encontrar a transformada de Fourier da ondeleta – mãe 3) Encontrar a transformada de Fourier da série temporal 4) Escolher uma escala mínima so, e todas as outras escalas. 5) Para cada escala: a) Usando a equação 12 (no caso de escolher Morlet), calcular a ondeleta – ‘filha’ para aquela escala b) Normalizar a ondeleta – filha com a divisão pela raiz quadrada do total da variância da ondeleta (o total de (y)2 deve ser igual a 1, preservando assim a variância da série temporal) c) Multiplicar pela FT da sua série temporal d) Usar a Eq. 10, e inverter a transformada para o espaço real (isto é, determinar as amplitudes pela escala e no tempo) 6) Fazer um mapa com contornos de amplitude.
|
Send mail to
leila@model.iag.usp.br with
questions or comments about this web site.
|