ウェーブレット変換

ウェーブレット変換（ウェーブレットへんかん、英: wavelet transformation）は、周波数解析の手法の一つ。基底関数として、ウェーブレット関数を用いる。フーリエ変換によって周波数特性を求める際に失われる時間領域の情報を、この変換においては残すことが可能である。フーリエ変換でも窓関数を用いる窓フーリエ変換で時間領域の情報は残せたが、窓幅を周波数に合わせて固定する必要があるため、広い周波数領域の解析には向かなかった。ウェーブレット変換では、基底関数の拡大縮小を行うので、広い周波数領域の解析が可能である。しかし、不確定性原理によって精度には限界がある。フーリエ変換では、N をデータのサイズとしたときに N logN のオーダーで計算量が増える(O(N logN))が、ウェーブレット変換では O(N) の計算量でできる利点がある。

VP6、JPEG 2000、信号解析、量子力学、フラクタル等の多くの分野に応用されている。

基本概念

基本的には、小さい波（ウェーブレット）を拡大縮小、平行移動して足し合わせることで、与えられた入力の波形を表現しようとする手法。ある信号が与えられた時に、時間的に局在した周波数成分を知りたい場合でも、フーリエ解析においては、サイン波、コサイン波を拡大縮小して足し合わせることで入力を表現しようとしていたが、波が局在化していないため、時系列の情報が失われていた。

フーリエ変換の式 $({\mathfrak {F}}f)(\omega )={\frac {1}{\sqrt {2\pi }}}\int dt\,e^{-i\omega t}f(t)$ に窓を掛け、 $(T^{\text{win}}f)(\omega ,t)={\frac {1}{\sqrt {2\pi }}}\int d\tau \,g(\tau -t)e^{-i\omega \tau }f(\tau )$ とするのがフーリエ変換における局在化の一般的な手法である。この場合、周波数によって窓の幅が変わることがない。そのため、例えば $\sin(\alpha t)+\delta (t-t_{1})$ の様な波を解析しようとした場合、広い窓を取るとサイン波の周波数ははっきりとするが、パルスの波の情報はぼやける。逆に窓を狭くすればパルスの波ははっきりとするが、サイン波の周波数が見えにくくなるといったことがおこる。

ウェーブレット変換では、周波数に合わせてウェーブレットの幅が変化するので、周波数解像度が格段に良くなる。

ウェーブレット変換は連続量を扱う連続ウェーブレット変換が基本だが、計算機上では連続量を扱うのが難しい。このため信号を無理やり連続ウェーブレット変換の式に従って計算すると、かなりの情報が失われ、逆変換ができなくなる。そこで、逆変換を考慮した形のウェーブレット変換を離散ウェーブレット変換という。

連続ウェーブレット変換は逆変換を持たないものの、離散ウェーブレット変換よりも緻密な解析ができるという特徴がある。離散ウェーブレット変換は一度変換した情報を加工して逆変換することで、ノイズの除去などに応用することができる。

連続ウェーブレット変換

ウェーブレットは以下の許容条件を満たす。即ち、 ${\hat {\psi }}$ を $\psi$ のフーリエ変換として、

C_{\psi }=2\pi \int d\xi \left|\xi \right|^{-1}\left|{\hat {\psi }}(\xi )\right|^{2}<\infty

もし $\psi \in L^{1}(\mathbf {R} )$ ならば、そのフーリエ変換 ${\hat {\psi }}$ は連続であり、上の許容条件は ${\hat {\psi }}(0)=0$ つまり $\int dx\,\psi (x)=0$ の時にのみ満たされる。この許容条件を満たすウェーブレットに対しウェーブレット変換が以下の様に定義される。

(T^{\text{wav}}f)(a,b):=\int dx\left|a\right|^{-1/2}f(x){\overline {\psi \left({\frac {x-b}{a}}\right)}}

ここで、 $a$ はscale、 $b$ はtranslationを表す。 $\psi (x)$ を、マザーウェーブレットと言う。

元の関数は、以下の式で得られる。

f(x)=C_{\psi }^{-1}\int _{-\infty }^{\infty }da\int _{-\infty }^{\infty }db~a^{-2}(T^{\text{wav}}f)(a,b)\psi \left({\frac {x-b}{a}}\right)

例えばウェーブレットにはメキシカンハット関数（英語版） $\psi (t)=(1-t^{2})\exp(-t^{2}/2)$ や、変形ガウシアン $\psi (x)=\pi ^{-1/4}(e^{-ix\pi (2/\ln 2)^{1/2}}-e^{-ix\pi ^{2}(2/\ln 2)})e^{-x^{2}/2}$ などがある。

連続ウェーブレット変換は、FFT(高速フーリエ変換)を用いて計算できる。数値計算で連続ウェーブレット変換を求める場合、スケールパラメータ $a$ を変化させながら、マザーウェーブレット $\psi (x)$ と信号 $f(x)$ のフーリエ変換を計算し、畳み込みを計算した後、逆フーリエ変換によって時間領域に戻す事で連続ウェーブレット変換を求める事が出来る。

離散ウェーブレット変換

詳細は「離散ウェーブレット変換」を参照

離散ウェーブレット変換は、元信号を高周波成分と低周波成分に分解し、分解された低周波成分をまた高周波成分と低周波成分に分解するという処理を繰り返し行うことと等価である。そのため多重解像度解析とも呼ばれる。離散ウェーブレット変換は可逆変換であるため、変換そのものに圧縮効果は無いが、変換画像の効率的な符号化方式が開発されたため画像圧縮方式であるJPEG 2000に利用されるようになった。

連続ウェーブレット変換で用いたウェーブレットに対し、 $\psi _{m,n}(x)=a_{0}^{-m/2}\psi (a_{0}^{-m}x-nb_{0})$ として離散化を行う。但し $a_{0}>1,b_{0}>0,m\in \mathbf {Z} ,n\in \mathbf {Z}$ とする。 $a_{0},b_{0}$ の値はウェーブレットに対して適切に選ぶ事になる。この場合連続ウェーブレット変換と異なり、単位の分解公式を用いる事が出来ないため、別の方法で元の関数を復元する必要がある。

離散ウェーブレット変換例(ハールウェーブレット)

\psi (x)={\begin{cases}1&(0<x<1)\\-1&(-1<x<0)\\0&({\text{otherwise}})\end{cases}}

をマザーウェーブレットとして用いるならアルゴリズムは

for freq in 適当な範囲:
  for pos in データの範囲:
    sum = 0
    for t in データの範囲:
      sum += data[t] * phi((t-pos)/freq)
    result[pos][freq] = sum / sqrt(freq)

となるが、tについてのイテレーションに関してphiが明らかに0になる範囲を省くことができるので実際には

for freq in 適当な範囲:
  for pos in データの範囲:
    sum = 0
    for t in range(pos-freq, pos+freq):
      if t < pos:
        sum += data[t]
      else:
        sum -= data[t]
      result[pos][freq] = sum / sqrt(freq)

となる。これがフーリエ解析より計算量が少なくて済むことの大きな原因である。（アルゴリズムの解説のための擬似コードであり添え字の範囲チェックなどがないことに注意）

多重解像度解析とウェーブレット変換

詳細は「多重解像度解析」を参照

多重解像度解析とは、2倍毎の解像度のウェーブレットを用いて解析する手法。

正規直交ウェーブレット変換の構成法

Riesz基底を成す $\phi$ を、 $\phi$ とそのフーリエ変換が適度に速く減衰し $\int dx\,{\hat {\phi }}(x)\neq 0$ と成るように取る。
直交化をする。即ち、新たな関数 ${\hat {\phi ^{\ast }}}(\xi )={\hat {\phi }}(\xi )\left\{2\pi \sum _{l}\mid {\hat {\phi }}(\xi +2\pi l)\mid ^{2}\right\}$ を作る。
$\phi _{j,n}^{\ast }=2^{j/2}\phi ^{\ast }(2^{j}x-n)$ に対し、 $\phi ^{\ast }=\sum _{n}h_{n}^{\ast }\phi _{1,n}^{\ast }$ を満たす $h_{n}^{\ast }$ を用いて、 $\psi =\sum _{n}(-1)^{n}h_{-n+1}^{\ast }\phi ^{\ast }(2x-n)$ とする。

関連項目

典拠管理データベース: 国立図書館	ドイツ日本チェコ

データ圧縮方式

可逆

エントロピー符号	一進法算術 Asymmetric numeral systems（英語版）ゴロムハフマン適応型（英語版）正準（英語版） MH レンジシャノンシャノン・ファノシャノン・ファノ・イライアス（英語版）タンストール（英語版）ユニバーサル（英語版）指数ゴロム（英語版）フィボナッチ（英語版）ガンマレーベンシュタイン（英語版）
辞書式（英語版）	BPE Deflate Lempel-Ziv LZ77 LZ78 LZFSE LZH LZJB（英語版） LZMA LZO LZRW（英語版） LZS（英語版） LZSS LZW LZWL（英語版） LZX LZ4 ROLZ（英語版）統計型（英語版） Brotli Snappy Zstandard
その他	BWT CTW（英語版） Delta DMC（英語版） MTF PAQ PPM RLE

音声

理論	ビットレート平均(ABR) 固定(CBR) 可変(VBR) コンパンディング畳み込みダイナミックレンジレイテンシ（英語版）標本化定理標本化音質音声符号化サブバンド符号化変換符号化知覚符号化
コーデック	A-law μ-law ACELP ADPCM CELP DPCM フーリエ変換 LPC LAR LSP MDCT 音響心理学 WLPC

画像

理論	クロマサブサンプリング符号化ツリーユニット（英語版）色空間圧縮アーティファクト解像度マクロブロックピクセル PSNR 量子化（英語版）標準テストイメージ（英語版）
手法	チェインコード（英語版） DCT EZW（英語版）フラクタル KLT（英語版）ピラミッド（英語版） RLE SPIHT（英語版）ウェーブレット

映像

理論	ビットレート平均(ABR) 固定(CBR) 可変(VBR) 画面解像度フレームフレームレートインターレース映像品質（英語版）
コーデック（英語版）	重複変換（英語版） DCT デブロッキングフィルタ（英語版）フレーム間予測