Kompresja bezstratna

Ten artykuł od 2021-02 zawiera treści, przy których brakuje odnośników do źródeł.

Należy dodać przypisy do treści niemających odnośników do źródeł. Dodanie listy źródeł bibliograficznych jest problematyczne, ponieważ nie wiadomo, które treści one uźródławiają.
Sprawdź w źródłach: Encyklopedia PWN • Google Books • Google Scholar • Federacja Bibliotek Cyfrowych • BazHum • BazTech • RCIN • Internet Archive (texts / inlibrary)
Dokładniejsze informacje o tym, co należy poprawić, być może znajdują się w dyskusji tego artykułu.
Po wyeliminowaniu niedoskonałości należy usunąć szablon {{Dopracować}} z tego artykułu.

Kompresja bezstratna (ang. lossless compression) – metoda kompresji informacji do postaci zawierającej zmniejszoną liczbę bitów, gwarantująca możliwość odtworzenia informacji z postaci skompresowanej do identycznej postaci pierwotnej.

Najważniejszym twierdzeniem o kompresji bezstratnej jest twierdzenie o zliczaniu.

Twierdzenie o zliczaniu (counting theorem)

Niemożliwe jest skonstruowanie funkcji, przekształcającej odwracalnie każdą informację na informację (czyli funkcji kompresji bezstratnej), która nie wydłuża jakiejś informacji o przynajmniej 1 bit, chyba że nie kompresuje ona żadnej informacji.

Dowód:

Załóżmy, że dana funkcja kompresuje choć jedną wiadomość do długości N bitów z dowolnej większej długości.

Jest X wiadomości o długości nie większej od N bitów.

Jeśli żadna z wiadomości zawierających nie więcej niż N bitów nie została wydłużona, to w wyniku otrzymujemy przynajmniej X+1 wiadomości o długości nie większej niż N bitów.

Ponieważ X jest skończone, to X+1>X, a więc jest to sprzeczne z założeniem, że takich wiadomości jest X. Co należało udowodnić.

Skonstruowanie funkcji, która wydłuża o nie więcej niż 1 bit, jest trywialne. Dla dowolnej funkcji f(x), niech f′(x) będzie:

dla f(x) zawierającego mniej bitów niż x: f′(x)=<0,f(x)>;
dla f(x) zawierającego więcej bitów niż x: f′(x)=<1,x>;
dla f(x) zawierającego tyle samo bitów co x: f′(x)=<0,f(x)> lub f′(x)=<1,x> (nie ma to znaczenia).

Algorytmy kompresji bezstratnej

Algorytmy kompresji bezstratnej dobrze kompresują „typowe” dane, czyli takie w których występuje znaczna nadmiarowość informacji (redundancja).

Pewne rodzaje danych są bardzo trudne lub niemożliwe do skompresowania:

strumienie liczb losowych (niemożliwe do skompresowania)
strumienie liczb pseudolosowych (trudne do skompresowania, choć teoretycznie łatwe)
dane skompresowane za pomocą tego samego lub innego algorytmu (w praktyce trudne)

Najczęściej używane metody kompresji bezstratnej można podzielić na słownikowe i statystyczne, choć wiele metod lokuje się pośrodku:

metody słownikowe poszukują dokładnych wystąpień danego ciągu znaków, np. zastępują 'the ' krótszą ilością bitów niż jest potrzebna na zakodowanie 4 niezwiązanych znaków. Jednak znajomość symbolu 'the ' nie pociąga za sobą usprawnień w kompresowaniu 'they ' czy 'then '.
metody statystyczne używają mniejszej ilości bitów dla częściej występujących symboli, w przypadku praktycznie wszystkich oprócz najprostszych metod, prawdopodobieństwa zależą od kontekstu. A więc np. dla 'h' występującego po 't' używają mniejszej ilości bitów niż dla innych znaków w tym kontekście.

Popularne metody

kodowanie Shannona, Shannona-Fano, Huffmana, arytmetyczne
LZ77, LZ78 i pochodne (LZSS, LZP, LZW, LZMW)
RLE
PPM
transformata Burrowsa-Wheelera, Move To Front

Zobacz też

Linki zewnętrzne

Testy różnych metod kompresji (ang.)
Optymalizacja PNG (pol.)
Przetwarzanie sygnałów cyfrowych. dsp.agh.edu.pl. [zarchiwizowane z tego adresu (2016-08-19)]. (materiały dydaktyczne AGH)

Formaty kompresji danych audiowizualnych

Obrazy

IEC, ISO, ITU-T, W3C, IETF	BMP GIF JBIG HDP JPEG JPEG 2000 JPEG XL MNG PCX PGF PNG SVG TIFF XPM HEVC
Pozostałe	APNG BPG DjVu EXR FLIF ICER MNG PGF QTVR WBMP WebP

Video

ISO/IEC	MPEG-1 MPEG-2 MPEG-4 ASP H.264 (MPEG-4 AVC) H.265/HEVC H.266/VVC MPEG-5 Part1 EVC Part2 LC EVC MJPEG
ITU-T	H.120 H.261 H.262 H.263 H.264 H.265 H.266
SMPTE	VC-1 VC-2 VC-3 VC-5
Pozostałe	Apple Video AV1 AVS Bink Video Cinepak Daala Dirac DV DVI FFV1 HuffYUV Indeo Lagarith Pixlet ProRes QuickTime RealVideo RTVideo SheerVideo Smacker Theora Thor VP3 VP6 VP7 VP8 VP9 WMV XEB YULS

Audio

ISO/IEC	MP1 MP2 MP3 AAC AAC+
ITU-T	G.711 G.718 G.719 G.722 G.722.1 G.722.2 G.723 G.723.1 G.726 G.728 G.729 G.729.1
IETF	Opus iLBC
3GPP	AMR AMR-WB AMR-WB+ EVRC EVRC-B GSM-HR GSM-FR GSM-EFR
Pozostałe	ACELP AC-3 AC-4 ALAC Asao ATRAC CELT Codec2 DRA DTS FLAC iSAC Monkey’s Audio TTA MT9 Musepack OptimFROG OSQ QCELP RCELP RealAudio RTAudio SD2 SHN SILK Siren SMV Speex SVOPC TwinVQ VMR-WB Vorbis VSELP WavPack WMA MQA aptX

Kontenery

ISO/IEC	MPEG-ES MPEG-PS MPEG-TS ISO Motion JPEG 2000 MPEG-21 MPEG MP4 M4A
ITU-T	H.222.0 T.802
IETF	RTP
Pozostałe	3GP AMV ASF AIFF AVI AU BPG BMP DivX EVO Flash Video GXF IFF M2TS Matroska WebM MXF Ogg QuickTime RatDVD RealMedia WAV MOD VOB IFO BUP 22.2 E-AC-3 GSM RealAudio TAK TTA