Kodowanie Shannona-Fano

Kodowanie Shannona-Fano – nazwa obejmująca metody kompresji bezstratnej wynalezione równolegle przez Claude’a Shannona i Szablon:Link-interwiki (opublikowane odpowiednio w 1948^[1]^[2] i 1949^[3]).

Nazwa „Shannon-Fano” może w zależności od publikacji (oraz kontekstu) obejmować obie metody, metodę FanoSzablon:Odn lub metodę Shannona^[4]^[5].

Kodowanie te dla dyskretnego źródła danych znajduje kod prefiksowy o zbliżonych do optymalnych kodach. Metoda Fano osiąga zazwyczaj słowa kodowe krótsze o 1 bit od metody kodowania Shannona Szablon:Odn.

Kodowanie Shannona-Fano jest używane w kompresorze ZIP, przy wybranej metodzie kompresji implode^[6].

Algorytm tworzenia słów kodowych

Algorytm przedstawia się następującoSzablon:Odn:

s – ciąg symboli ze zbioru $S$ posortowanych według prawdopodobieństw $p_{i}$
funkcja Shannon-Fano(s) (metoda Fano):
- Jeśli s zawiera dwa symbole, do słowa kodu dla pierwszego symbolu dopisz 0, do słowa kodu dla drugiego symbolu dopisz 1.
- W przeciwnym razie, jeśli s zawiera więcej niż dwa symbole, podziel je na dwa podciągi s1 i s2 tak, żeby różnica między sumą prawdopodobieństw symboli w s1 i s2 była jak najmniejsza. Do słów kodu dla symboli z s1 dopisz 0, do kodów dla symboli z s2 dopisz 1. Wywołaj rekurencyjnie funkcje: Shannon-Fano(s1) oraz Shannon-Fano(s2).

Przykład

Niech $S = {a, b, c, d},$ $p = {0, 45; 0, 3; 0, 2; 0, 05} .$

Początkowo ciąg $s = a b c d$ (porządek według nierosnącego prawdopodobieństwa).

Składa się z więcej niż 2 symboli, zatem trzeba go podzielić. Możliwe są następujące sytuacje:

$s_{1} = a,$ $s_{2} = b c d;$ różnica prawdopodobieństw 0,1;
$s_{1} = a b,$ $s_{2} = c d;$ różnica prawdopodobieństw 0,5;
$s_{1} = a b c,$ $s_{2} = d;$ różnica prawdopodobieństw 0,9.

Wybierana jest pierwsza para, ponieważ różnica prawdopodobieństw podciągów s1 i s2 jest wtedy najmniejsza. Do słów kodu dla symboli z $s_{1} = a$ dopisz 0, do słów kodu dla symboli z $s_{2} = b c d$ dopisz 1:

a = 0
b = 1
c = 1
d = 1

Teraz wywoływana jest funkcja Shannon-Fano $(s_{1})$ – ten ciąg ma długość 1 i nie jest już dalej przetwarzany. Następnie wykonywane jest Shannon-Fano $(s_{2})$ – $s_{2}$ jest dłuższy niż 2 i musi zostać podzielony.

Sytuacja jest podobna jak w poprzednim kroku, bo $s_{12} = b$ i $s_{22} = c d .$ Do słów kodu dla symboli z $s_{12} = b$ dopisywane są 0, do słów kodu dla symboli z $s_{22} = c d$ dopisywane są 1:

a = 0
b = 10
c = 11
d = 11

Wywoływana jest funkcja Shannon-Fano $(s_{12})$ – ten ciąg ma długość 1, nie jest już dalej przetwarzany. Następnie wykonywane jest Shannon-Fano $(s_{22})$ – $s_{22}$ ma długość 2, więc tutaj kodowanie kończy się – do słowa kodu pierwszego symbolu $(c)$ dopisywane jest 0, a do słowa kodu drugiego kodu $(d)$ dopisywana jest 1:

a = 0
b = 10
c = 110
d = 111

Średnia długość kodu $L_{k} = 1 \cdot 0, 45 + 2 \cdot 0, 3 + 3 \cdot 0, 2 + 3 \cdot 0, 05 = 1, 8 .$ W tym przypadku efektywność kodowania wynosi $\frac{H (S)}{L_{k}} \cdot 100 % = \frac{1, 72}{1, 80} \cdot 100 % = 95 % .$ Dla tych samych danych efektywność kodowania Shannona wynosi zaledwie $73, 2 % .$

Zobacz też

Przypisy

Szablon:Przypisy

Bibliografia

Szablon:Cytuj książkę

↑ Szablon:Cytuj
↑ Szablon:Cytuj
↑ Szablon:Cytuj
↑ Szablon:Cytuj
↑ Szablon:Cytuj
↑ http://www.pkware.com/documents/casestudies/APPNOTE.TXT (dostęp 2008-09-20).

[1] Szablon:Cytuj

[2] Szablon:Cytuj

[3] Szablon:Cytuj

[4] Szablon:Cytuj

[5] Szablon:Cytuj

[6] ttp://www.pkware.com/documents/casestudies/APPNOTE.TXT (dostęp 2008-09-20).

[1]

[2]

[3]

[4]

[5]

[6]

Kodowanie Shannona-Fano

Spis treści

Algorytm tworzenia słów kodowych

Przykład

Zobacz też

Przypisy

Bibliografia

Menu nawigacyjne

Kodowanie Shannona-Fano

Algorytm tworzenia słów kodowych

Przykład

Zobacz też

Przypisy

Bibliografia

Menu nawigacyjne

Szukaj