ウェーブレット変換

ウェーブレット変換ウェーブレットへんかん: wavelet transformation)は、周波数解析の手法の一つ。基底関数として、ウェーブレット関数を用いる。フーリエ変換によって周波数特性を求める際に失われる時間領域の情報を、この変換においては残すことが可能である。フーリエ変換でも窓関数を用いる窓フーリエ変換で時間領域の情報は残せたが、窓幅を周波数に合わせて固定する必要があるため、広い周波数領域の解析には向かなかった。ウェーブレット変換では、基底関数の拡大縮小を行うので、広い周波数領域の解析が可能である。しかし、不確定性原理によって精度には限界がある。フーリエ変換では、N をデータのサイズとしたときに N logNオーダー計算量が増える(O(N logN))が、ウェーブレット変換では O(N) の計算量でできる利点がある。

VP6JPEG 2000信号解析量子力学フラクタル等の多くの分野に応用されている。

基本概念

基本的には、小さい波(ウェーブレット)を拡大縮小、平行移動して足し合わせることで、与えられた入力の波形を表現しようとする手法。ある信号が与えられた時に、時間的に局在した周波数成分を知りたい場合でも、フーリエ解析においては、サイン波、コサイン波を拡大縮小して足し合わせることで入力を表現しようとしていたが、波が局在化していないため、時系列の情報が失われていた。

フーリエ変換の式 ( F f ) ( ω ) = 1 2 π d t e i ω t f ( t ) {\displaystyle ({\mathfrak {F}}f)(\omega )={\frac {1}{\sqrt {2\pi }}}\int dt\,e^{-i\omega t}f(t)} に窓を掛け、 ( T win f ) ( ω , t ) = 1 2 π d τ g ( τ t ) e i ω τ f ( τ ) {\displaystyle (T^{\text{win}}f)(\omega ,t)={\frac {1}{\sqrt {2\pi }}}\int d\tau \,g(\tau -t)e^{-i\omega \tau }f(\tau )} とするのがフーリエ変換における局在化の一般的な手法である。この場合、周波数によって窓の幅が変わることがない。そのため、例えば sin ( α t ) + δ ( t t 1 ) {\displaystyle \sin(\alpha t)+\delta (t-t_{1})} の様な波を解析しようとした場合、広い窓を取るとサイン波の周波数ははっきりとするが、パルスの波の情報はぼやける。逆に窓を狭くすればパルスの波ははっきりとするが、サイン波の周波数が見えにくくなるといったことがおこる。

ウェーブレット変換では、周波数に合わせてウェーブレットの幅が変化するので、周波数解像度が格段に良くなる。

ウェーブレット変換は連続量を扱う連続ウェーブレット変換が基本だが、計算機上では連続量を扱うのが難しい。このため信号を無理やり連続ウェーブレット変換の式に従って計算すると、かなりの情報が失われ、逆変換ができなくなる。そこで、逆変換を考慮した形のウェーブレット変換を離散ウェーブレット変換という。

連続ウェーブレット変換は逆変換を持たないものの、離散ウェーブレット変換よりも緻密な解析ができるという特徴がある。離散ウェーブレット変換は一度変換した情報を加工して逆変換することで、ノイズの除去などに応用することができる。

連続ウェーブレット変換

ウェーブレットは以下の許容条件を満たす。即ち、 ψ ^ {\displaystyle {\hat {\psi }}} ψ {\displaystyle \psi } のフーリエ変換として、

C ψ = 2 π d ξ | ξ | 1 | ψ ^ ( ξ ) | 2 < {\displaystyle C_{\psi }=2\pi \int d\xi \left|\xi \right|^{-1}\left|{\hat {\psi }}(\xi )\right|^{2}<\infty }

もし ψ L 1 ( R ) {\displaystyle \psi \in L^{1}(\mathbf {R} )} ならば、そのフーリエ変換 ψ ^ {\displaystyle {\hat {\psi }}} は連続であり、上の許容条件は ψ ^ ( 0 ) = 0 {\displaystyle {\hat {\psi }}(0)=0} つまり d x ψ ( x ) = 0 {\displaystyle \int dx\,\psi (x)=0} の時にのみ満たされる。 この許容条件を満たすウェーブレットに対しウェーブレット変換が以下の様に定義される。

( T wav f ) ( a , b ) := d x | a | 1 / 2 f ( x ) ψ ( x b a ) ¯ {\displaystyle (T^{\text{wav}}f)(a,b):=\int dx\left|a\right|^{-1/2}f(x){\overline {\psi \left({\frac {x-b}{a}}\right)}}}

ここで、 a {\displaystyle a} はscale、 b {\displaystyle b} はtranslationを表す。 ψ ( x ) {\displaystyle \psi (x)} を、マザーウェーブレットと言う。

元の関数は、以下の式で得られる。

f ( x ) = C ψ 1 d a d b   a 2 ( T wav f ) ( a , b ) ψ ( x b a ) {\displaystyle f(x)=C_{\psi }^{-1}\int _{-\infty }^{\infty }da\int _{-\infty }^{\infty }db~a^{-2}(T^{\text{wav}}f)(a,b)\psi \left({\frac {x-b}{a}}\right)}

例えばウェーブレットにはメキシカンハット関数(英語版) ψ ( t ) = ( 1 t 2 ) exp ( t 2 / 2 ) {\displaystyle \psi (t)=(1-t^{2})\exp(-t^{2}/2)} や、 変形ガウシアン ψ ( x ) = π 1 / 4 ( e i x π ( 2 / ln 2 ) 1 / 2 e i x π 2 ( 2 / ln 2 ) ) e x 2 / 2 {\displaystyle \psi (x)=\pi ^{-1/4}(e^{-ix\pi (2/\ln 2)^{1/2}}-e^{-ix\pi ^{2}(2/\ln 2)})e^{-x^{2}/2}} などがある。

連続ウェーブレット変換は、FFT(高速フーリエ変換)を用いて計算できる。数値計算で連続ウェーブレット変換を求める場合、スケールパラメータ a {\displaystyle a} を変化させながら、マザーウェーブレット ψ ( x ) {\displaystyle \psi (x)} と信号 f ( x ) {\displaystyle f(x)} のフーリエ変換を計算し、畳み込みを計算した後、逆フーリエ変換によって時間領域に戻す事で連続ウェーブレット変換を求める事が出来る。

離散ウェーブレット変換

詳細は「離散ウェーブレット変換」を参照

離散ウェーブレット変換は、元信号を高周波成分と低周波成分に分解し、分解された低周波成分をまた高周波成分と低周波成分に分解するという処理を繰り返し行うことと等価である。そのため多重解像度解析とも呼ばれる。離散ウェーブレット変換は可逆変換であるため、変換そのものに圧縮効果は無いが、変換画像の効率的な符号化方式が開発されたため画像圧縮方式であるJPEG 2000に利用されるようになった。

連続ウェーブレット変換で用いたウェーブレットに対し、 ψ m , n ( x ) = a 0 m / 2 ψ ( a 0 m x n b 0 ) {\displaystyle \psi _{m,n}(x)=a_{0}^{-m/2}\psi (a_{0}^{-m}x-nb_{0})} として離散化を行う。但し a 0 > 1 , b 0 > 0 , m Z , n Z {\displaystyle a_{0}>1,b_{0}>0,m\in \mathbf {Z} ,n\in \mathbf {Z} } とする。 a 0 , b 0 {\displaystyle a_{0},b_{0}} の値はウェーブレットに対して適切に選ぶ事になる。この場合連続ウェーブレット変換と異なり、単位の分解公式を用いる事が出来ないため、別の方法で元の関数を復元する必要がある。

離散ウェーブレット変換例(ハールウェーブレット)

ψ ( x ) = { 1 ( 0 < x < 1 ) 1 ( 1 < x < 0 ) 0 ( otherwise ) {\displaystyle \psi (x)={\begin{cases}1&(0<x<1)\\-1&(-1<x<0)\\0&({\text{otherwise}})\end{cases}}}

をマザーウェーブレットとして用いるならアルゴリズムは

for freq in 適当な範囲:
  for pos in データの範囲:
    sum = 0
    for t in データの範囲:
      sum += data[t] * phi((t-pos)/freq)
    result[pos][freq] = sum / sqrt(freq)

となるが、tについてのイテレーションに関してphiが明らかに0になる範囲を省くことができるので実際には

for freq in 適当な範囲:
  for pos in データの範囲:
    sum = 0
    for t in range(pos-freq, pos+freq):
      if t < pos:
        sum += data[t]
      else:
        sum -= data[t]
      result[pos][freq] = sum / sqrt(freq)

となる。これがフーリエ解析より計算量が少なくて済むことの大きな原因である。(アルゴリズムの解説のための擬似コードであり添え字の範囲チェックなどがないことに注意)

多重解像度解析とウェーブレット変換

詳細は「多重解像度解析」を参照

多重解像度解析とは、2倍毎の解像度のウェーブレットを用いて解析する手法。

正規直交ウェーブレット変換の構成法

  1. Riesz基底を成す ϕ {\displaystyle \phi } を、 ϕ {\displaystyle \phi } とそのフーリエ変換が適度に速く減衰し d x ϕ ^ ( x ) 0 {\displaystyle \int dx\,{\hat {\phi }}(x)\neq 0} と成るように取る。
  2. 直交化をする。即ち、新たな関数 ϕ ^ ( ξ ) = ϕ ^ ( ξ ) { 2 π l ϕ ^ ( ξ + 2 π l ) 2 } {\displaystyle {\hat {\phi ^{\ast }}}(\xi )={\hat {\phi }}(\xi )\left\{2\pi \sum _{l}\mid {\hat {\phi }}(\xi +2\pi l)\mid ^{2}\right\}} を作る。
  3. ϕ j , n = 2 j / 2 ϕ ( 2 j x n ) {\displaystyle \phi _{j,n}^{\ast }=2^{j/2}\phi ^{\ast }(2^{j}x-n)} に対し、 ϕ = n h n ϕ 1 , n {\displaystyle \phi ^{\ast }=\sum _{n}h_{n}^{\ast }\phi _{1,n}^{\ast }} を満たす h n {\displaystyle h_{n}^{\ast }} を用いて、 ψ = n ( 1 ) n h n + 1 ϕ ( 2 x n ) {\displaystyle \psi =\sum _{n}(-1)^{n}h_{-n+1}^{\ast }\phi ^{\ast }(2x-n)} とする。

関連項目

典拠管理データベース: 国立図書館 ウィキデータを編集
  • ドイツ
  • 日本
  • チェコ
可逆
エントロピー符号
辞書式(英語版)
その他
音声
理論
コーデック
画像
理論
手法
  • チェインコード(英語版)
  • DCT
  • EZW(英語版)
  • フラクタル
  • KLT(英語版)
  • ピラミッド(英語版)
  • RLE
  • SPIHT(英語版)
  • ウェーブレット
映像
理論
コーデック(英語版)
理論