シャノン符号化

曖昧さ回避 シャノン・ファノ符号化」あるいは「シャノン・ファノ・イライアス符号化」とは異なります。

シャノン符号化(シャノンふごうか、Shannon coding)は、クロード・シャノンによって考案された、可逆圧縮の方法である。

概要

記号の(推定もしくは実際の)出現確率に基づく接頭符号を使用している。同じ接頭符号でも、常に最短の符号長を表すことができるハフマン符号に比べ、シャノン符号化は最適化されていない。シャノン・ファノ符号化とは同程度かそれより劣る。

シャノン符号化は接頭符号の最初のもので、1948年のシャノンの記事『通信の数学的理論』でシャノンの情報源符号化定理の証明のために用いられた[1]

この符号化法は情報理論の分野に進歩をもたらした。そして、シャノン符号化を元にして多くの符号化が生み出された(シャノン・ファノ符号化、ハフマン符号、算術符号など)我々の日々の生活はデジタルデータに大きく影響されているが、これは、シャノン符号化やその後継の符号化の恩恵なくしては不可能である。

符号化の原理

  1. 記号を出現確率の高い順に並べる。
  2. それぞれの記号について、その1つ前の記号までの累積の確率を求める。( i = k i 1 p k ( x ) {\displaystyle \sum \limits _{i=k}^{i-1}p_{k}(x)} )
  3. 2.の値を二進数にする。
  4. 3.の値の l i = log 2 p i ( x ) {\displaystyle l_{i}=\left\lceil -\log _{2}p_{i}(x)\right\rceil } 桁までをその記号の符号とする( x {\displaystyle \lceil x\rceil } 切り上げを意味する)。

以下の表は、a1-6の記号の符号化の様子を示したものである。liは-2の累乗を示し、二進数による累積確率の小数点以下のこの桁までを符号とする。第5列は二進数による累積確率を示す。最終列がその記号の符号である。

ai p(ai) li i-1までのpiの合計 p(ai)(二進数) 結果
a1 0.36 2 0.0 0.0000 00
a2 0.18 3 0.36 0.0100 010
a3 0.18 3 0.54 0.1000 100
a4 0.12 4 0.72 0.1011 1011
a5 0.09 4 0.84 0.1101 1101
a6 0.07 4 0.93 0.1110 1110

出典

  1. ^ "A Mathematical Theory of Communication" http://cm.bell-labs.com/cm/ms/what/shannonday/shannon1948.pdf

外部リンク

可逆
エントロピー符号
  • 一進法
  • 算術
  • Asymmetric numeral systems(英語版)
  • ゴロム
  • ハフマン
    • 適応型(英語版)
    • 正準(英語版)
    • MH
  • レンジ
  • シャノン
  • シャノン・ファノ
  • シャノン・ファノ・イライアス(英語版)
  • タンストール(英語版)
  • ユニバーサル(英語版)
    • 指数ゴロム(英語版)
    • フィボナッチ(英語版)
    • ガンマ
    • レーベンシュタイン(英語版)
辞書式(英語版)
その他
音声
理論
コーデック
画像
理論
手法
映像
理論
コーデック(英語版)
理論