Code Excited Linear Prediction

Code Excited Linear Prediction（CELP、セルプ）は線形予測符号・ベクトル量子化・合成による分析を組み合わせた音声符号化アルゴリズムである。直訳すると「符号励振線形予測」。

CELPは当時の既存の低ビットレートのアルゴリズム（RELP、LPC、ヴォコーダーのFS-1015など）に比べて格段に優れた音質を示した。様々な派生が生まれ（ACELP、RCELP、LD-CELP、VSELPなど）、現在最も広く使われている音声符号化アルゴリズムである。CELPはこのアルゴリズムのクラスを指す用語であり、特定のコーデックを指す用語ではない。

概要

「音声符号化#CELP」、「RCELP#概要」、「ACELP#技術」、「MPEG-4 CELP#アルゴリズム」、および「MPEG-4 CELP#CELP コアエンコーダ」も参照

CELPアルゴリズムは次の考え方に基づいている:

線形予測符号 (LPC) に基づく音源フィルタモデル
- 声帯相当の音源 (励起信号): 線形予測残差
- 声道相当のフィルタ:　　　線形予測フィルタ
ベクトル量子化 (VQ) とコードブックによる符号化:
線形予測フィルタに入力される音源 (励起信号) を、適応型 (ピッチ成分) と固定型 (残差成分成分) のコードブックで符号化
合成による分析 (AbS: Analysis-by-Synthesis):
聴覚的重み付けドメイン上の閉ループ内でコードブックを探索して符号化

CELPは1985年に米AT&Tの Schroeder と Atal が提案した^[1]。2人が1983年に行った最初のシミュレーションでは、スーパーコンピュータCray-1を使って、1秒間の音声を符号化するのに150秒かかった。その後コードブックの実装方法を改善し、コンピュータの性能向上もあり、携帯電話などでもこのアルゴリズムが使えるようになった。

CELP デコーダ

CELPデコーダは、適応型コードブック (ピッチ成分) と固定型コードブック (残差成分) からエンコード信号で指定された要素を取出し、指定ゲインを掛けて加算して、励振信号 (excitation) $e[n]$ を得る。

e[n]=g_{a}\cdot e_{a}[n]+g_{f}\cdot e_{f}[n]\,

ここで、 $e_{a}[n]$ は適応型コードブックの成分、 $e_{f}[n]$ は固定型コードブックの成分、 $g_{a},g_{b}$ は各々のゲインである。固定型コードブックはベクトル量子化辞書であり、コーデック内に固定的に記述されている。このコードブックは代数的な形式で格納する場合 (ACELP) と、そのままの形で格納する場合 (Speex) がある。適応型コードブックには、励振信号の過去の時系列が格納され、人間の声などの周期的な信号を効率的に符号化できる。

励振信号を整形する合成フィルタには、たとえば $1/A(z)$ という形の全極モデルを使用し、ここで $A(z)$ は線形予測（レビンソン再帰）で得られる予測フィルタであり、線形予測係数 (LPC)はエンコード信号で指定される。全極フィルタを使うのは、人間の声道をうまく表現でき、また計算も容易だからである。

CELP エンコーダ

CELPの基本原理は「合成による分析」(AbS; Analysis-by-Synthesis) と呼ばれ、閉ループ内で行われるデコード信号 (synthesis) の聴覚的最適化を通じて、エンコード (analysis) が行なわれることを意味する。理論上、最善のCELPストリームは、可能なあらゆるビットの組み合わせを試行し、最もよく聞こえるデコード済み信号を選択することで得られる。しかし、それは利用可能なハードウェアの計算能力を超えており、「最もよく聞こえる」ものを選ぶということは人間の介在を必要とするため、現実的ではない。

限られた計算リソースを使ってリアルタイムにエンコードを行うため、単純な聴覚的重み付け関数 W(z) を使い、より小さくより扱いやすい逐次探索でCELP探索を実施する。通常、エンコードは次の順序で実施する。

線形予測係数 (LPC) を計算しベクトル量子化（通常、線スペクトル対 (LSP) に変換後）
適応型コードブックを探索し、その成分を除去
固定型コードブックを探索

雑音の重み付け

最近の音声コーデックの多くは、音響心理学を応用して符号化雑音が可聴帯域外の周波数領域になるようにしている。例えば、振幅の大きい周波数帯域にある雑音はマスキングされる。そのため、CELPは誤差を聴覚的重み付けの上で最小化する。重み付け関数 W(z) は、帯域幅拡張 (bandwidth expansion) を使ったLPCフィルタに基づいている。

W(z)={\frac {A(z/\gamma _{1})}{A(z/\gamma _{2})}}

ここで $\gamma _{1}>\gamma _{2}$ である。

脚注

[脚注の使い方]

^ "We describe in this paper a code-excited linear predictive coder" p.937 of M.R. Schroeder and B.S. Atal. (1985). Code-excited linear prediction (CELP): High quality speech at very low bit rates. IEEE Proc. ICASSP, pp.937-940, 1985.

参考文献

B.S. Atal, "The History of Linear Prediction," IEEE Signal Processing Magazine, vol. 23, no. 2, March 2006, pp. 154–161.
M. R. Schroeder and B. S. Atal, "Code-excited linear prediction (CELP): high-quality speech at very low bit rates," in Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), vol. 10, pp. 937–940, 1985.
Jean-Marc Valin, "Speex: A Free Codec For Free Speech," Xiph.Org Foundation
山根淳、「CELP音声符号化」、Ricoh Technical Report No.23、1997年9月。PDF

外部リンク

Speex documentation
CELP 1016A and LPC 10e - リファレンス実装
Linear Predictive Coding (LPC)

データ圧縮方式

可逆

エントロピー符号	一進法算術 Asymmetric numeral systems（英語版）ゴロムハフマン適応型（英語版）正準（英語版） MH レンジシャノンシャノン・ファノシャノン・ファノ・イライアス（英語版）タンストール（英語版）ユニバーサル（英語版）指数ゴロム（英語版）フィボナッチ（英語版）ガンマレーベンシュタイン（英語版）
辞書式（英語版）	BPE Deflate Lempel-Ziv LZ77 LZ78 LZFSE LZH LZJB（英語版） LZMA LZO LZRW（英語版） LZS（英語版） LZSS LZW LZWL（英語版） LZX LZ4 ROLZ（英語版）統計型（英語版） Brotli Snappy Zstandard
その他	BWT CTW（英語版） Delta DMC（英語版） MTF PAQ PPM RLE

音声

理論	ビットレート平均(ABR) 固定(CBR) 可変(VBR) コンパンディング畳み込みダイナミックレンジレイテンシ（英語版）標本化定理標本化音質音声符号化サブバンド符号化変換符号化知覚符号化
コーデック	A-law μ-law ACELP ADPCM CELP DPCM フーリエ変換 LPC LAR LSP MDCT 音響心理学 WLPC

画像

理論	クロマサブサンプリング符号化ツリーユニット（英語版）色空間圧縮アーティファクト解像度マクロブロックピクセル PSNR 量子化（英語版）標準テストイメージ（英語版）
手法	チェインコード（英語版） DCT EZW（英語版）フラクタル KLT（英語版）ピラミッド（英語版） RLE SPIHT（英語版）ウェーブレット

映像

理論	ビットレート平均(ABR) 固定(CBR) 可変(VBR) 画面解像度フレームフレームレートインターレース映像品質（英語版）
コーデック（英語版）	重複変換（英語版） DCT デブロッキングフィルタ（英語版）フレーム間予測

理論

情報量
複雑性
非可逆
量子化
レート歪み（英語版）
冗長性
情報理論の年表（英語版）

マルチメディア圧縮フォーマット

動画ファイルフォーマット

ISO/IEC	MJPEG Motion JPEG 2000 MPEG-1 MPEG-2 Part 2（英語版） MPEG-4 Part 2/ASP（英語版） Part 10/AVC MPEG-H Part 2/HEVC MPEG-I VVC
ITU-T	H.120（英語版） H.261 H.262 H.263 H.264 H.265 DV H.266
SMPTE	VC-1 VC-2 (Dirac) VC-3 VC-5（英語版）
AOMedia	AV1
IETF	VP8
SAC	AVS（英語版）
その他	Apple Video（英語版） Bink（英語版） DVI（英語版） EVC（英語版） GIFアニメーション Microsoft Video 1（英語版） MSU Lossless（英語版） OMS Video（英語版） ProRes 422 ProRes 4444 RTVideo（英語版） SheerVideo（英語版） Smacker（英語版） Snow Sorenson Video, Spark（英語版） VP6 VP9 WMV YULS（英語版） XVC Xvid
可逆圧縮	FFV1（英語版） Ut Video Codec Suite
開発停止	Zlib Cinepak Daala Huffyuv Lagarith（英語版） RealVideo RMP4 Indeo Microsoft MPEG-4 QuickTime Pixlet Animation（英語版） Graphics（英語版） Theora Thor VP3 VP7 XEB XVD

音声ファイルフォーマット

ISO/IEC	MPEG-1 Layer III (MP3) MPEG-1 Layer II Multichannel（英語版） MPEG-1 Layer I（英語版） AAC HE-AAC AAC-LD（英語版） MPEG Surround（英語版） MPEG-4 ALS MPEG-4 SLS MPEG-4 DST MPEG-4 HILN MPEG-4 HVXC MPEG-4 CELP MPEG-D USAC（英語版） MPEG-H 3D Audio（英語版）
ITU-T	G.711 (A-law, µ-law) G.718 G.719 G.721 G.722 G.722.1 G.722.2 G.723 G.723.1 G.726 G.728 G.729 G.729.1
IETF	Opus iLBC Vorbis
3GPP	AMR AMR-WB AMR-WB+ EVRC EVRC-B（英語版） EVS GSM-HR GSM-FR GSM-EFR
ETSI	AC-3 AC-4（英語版） DTS
SAC	AVS（英語版） DRA（英語版）
その他	ADPCM ALAC Codec 2（英語版） FLAC Monkey's Audio OptimFROG（英語版） PCM WavPack TAK MQA（英語版）
開発停止	ACELP Asao（英語版） ATRAC CELT iSAC（英語版） La Musepack MT9（英語版） OSQ（英語版） PASC QCELP（英語版） RealAudio RCELP RTAudio（英語版） SD2 SHN SILK（英語版） Siren（英語版） SMV Speex SVOPC（英語版） VMR-WB TTA TwinVQ VSELP（英語版） WMA
Bluetooth	SBC (codec)（英語版） aptX LDAC LC3

画像ファイルフォーマット

IEC, ISO, ITU-T, W3C, IETF	CCITT Group 4（英語版） GIF HEIF HEVC JBIG JBIG2 JPEG JPEG-LS JPEG 2000 JPEG XR JPEG XT（英語版） JPEG XL Lossless JPEG PNG TIFF TIFF/EP（英語版） TIFF/IT（英語版）
その他	APNG AVIF BPG DjVu DNG EXR FLIF（英語版） ICER（英語版） ILBM JPEG Network Graphics MNG PCX PGF（英語版） QTVR（英語版） TGA WBMP WebP

マルチメディアコンテナフォーマット

ISO/IEC	MPEG-ES（英語版） MPEG-PES（英語版） MPEG-PS（英語版） MPEG-TS ISO base media file format（英語版） MPEG-4 Part 14 (MP4) Motion JPEG 2000 MPEG-21 Part 9 MPEG media transport（英語版）
ITU-T	H.222.0 T.802
IETF	RTP Ogg
SMPTE	GXF（英語版） MXF
3GPP	3GP and 3G2（英語版） 3GP 3G2
その他	AMV ASF AIFF AVI AU BPG Bink（英語版） Smacker（英語版） BMP DivX Media Format DPX DSM EVO（英語版） Flash Video (FLV) IFF M2TS（英語版） Matroska WebM QuickTime File Format（英語版） (MOV) RatDVD RealMedia RIFF WAV MOD and TOD（英語版） VOB, IFO and BUP（英語版）