シャノン符号化

「シャノン・ファノ符号化」あるいは「シャノン・ファノ・イライアス符号化」とは異なります。

シャノン符号化（シャノンふごうか、Shannon coding）は、クロード・シャノンによって考案された、可逆圧縮の方法である。

概要

記号の（推定もしくは実際の）出現確率に基づく接頭符号を使用している。同じ接頭符号でも、常に最短の符号長を表すことができるハフマン符号に比べ、シャノン符号化は最適化されていない。シャノン・ファノ符号化とは同程度かそれより劣る。

シャノン符号化は接頭符号の最初のもので、1948年のシャノンの記事『通信の数学的理論』でシャノンの情報源符号化定理の証明のために用いられた^[1]。

この符号化法は情報理論の分野に進歩をもたらした。そして、シャノン符号化を元にして多くの符号化が生み出された（シャノン・ファノ符号化、ハフマン符号、算術符号など）我々の日々の生活はデジタルデータに大きく影響されているが、これは、シャノン符号化やその後継の符号化の恩恵なくしては不可能である。

記号を出現確率の高い順に並べる。
それぞれの記号について、その1つ前の記号までの累積の確率を求める。( $\sum \limits _{i=k}^{i-1}p_{k}(x)$ )
2.の値を二進数にする。
3.の値の $l_{i}=\left\lceil -\log _{2}p_{i}(x)\right\rceil$ 桁までをその記号の符号とする（ $\lceil x\rceil$ は切り上げを意味する）。

以下の表は、a_1-6の記号の符号化の様子を示したものである。l_iは-2の累乗を示し、二進数による累積確率の小数点以下のこの桁までを符号とする。第5列は二進数による累積確率を示す。最終列がその記号の符号である。

a_i	p(a_i)	l_i	i-1までのp_iの合計	p(a_i)（二進数）	結果
a₁	0.36	2	0.0	0.0000	00
a₂	0.18	3	0.36	0.0100	010
a₃	0.18	3	0.54	0.1000	100
a₄	0.12	4	0.72	0.1011	1011
a₅	0.09	4	0.84	0.1101	1101
a₆	0.07	4	0.93	0.1110	1110

^ "A Mathematical Theory of Communication" http://cm.bell-labs.com/cm/ms/what/shannonday/shannon1948.pdf

エントロピー符号	一進法算術 Asymmetric numeral systems（英語版）ゴロムハフマン適応型（英語版）正準（英語版） MH レンジシャノンシャノン・ファノシャノン・ファノ・イライアス（英語版）タンストール（英語版）ユニバーサル（英語版）指数ゴロム（英語版）フィボナッチ（英語版）ガンマレーベンシュタイン（英語版）
辞書式（英語版）	BPE Deflate Lempel-Ziv LZ77 LZ78 LZFSE LZH LZJB（英語版） LZMA LZO LZRW（英語版） LZS（英語版） LZSS LZW LZWL（英語版） LZX LZ4 ROLZ（英語版）統計型（英語版） Brotli Snappy Zstandard
その他	BWT CTW（英語版） Delta DMC（英語版） MTF PAQ PPM RLE

理論	ビットレート平均(ABR) 固定(CBR) 可変(VBR) コンパンディング畳み込みダイナミックレンジレイテンシ（英語版）標本化定理標本化音質音声符号化サブバンド符号化変換符号化知覚符号化
コーデック	A-law μ-law ACELP ADPCM CELP DPCM フーリエ変換 LPC LAR LSP MDCT 音響心理学 WLPC

理論	クロマサブサンプリング符号化ツリーユニット（英語版）色空間圧縮アーティファクト解像度マクロブロックピクセル PSNR 量子化（英語版）標準テストイメージ（英語版）
手法	チェインコード（英語版） DCT EZW（英語版）フラクタル KLT（英語版）ピラミッド（英語版） RLE SPIHT（英語版）ウェーブレット

理論	ビットレート平均(ABR) 固定(CBR) 可変(VBR) 画面解像度フレームフレームレートインターレース映像品質（英語版）
コーデック（英語版）	重複変換（英語版） DCT デブロッキングフィルタ（英語版）フレーム間予測