Sequitur

Sequitur – algorytm kompresji, który znajduje dla podanego tekstu opisującą go gramatykę bezkontekstową; następnie gramatyka jest kompresowana konwencjonalnymi metodami. Metoda została opracowana w 1996 roku przez Craiga Nevill-Manninga oraz Iana Wittena (patrz sekcja linki zewnętrzne).

Sequitur dla danych tekstowych, charakteryzujących się dużą powtarzalnością umożliwia uzyskanie dobrego stopnia kompresji. Ponadto można ją zaimplementować, tak aby działała w czasie liniowym (liczba operacji wprost proporcjonalna do długości tekstu). Wada: kodowany jest cały tekst, nie ma możliwości kompresowania strumienia danych.

Algorytm kodowania

Na gramatykę nakłada dwa ograniczenia:

żadna para sąsiednich symboli (terminalnych i nieterminalnych) nie występuje więcej niż raz,
każda produkcja wykorzystywana jest co najmniej dwa razy.

Algorytm składa się z dwóch głównych kroków:

rozszerzenie gramatyki – dopisywanie kolejnych symboli wejściowych do produkcji startowej (tu ozn. $S$ ),
modyfikacja gramatyki – jeśli któreś z ograniczeń zostanie złamane.

Po rozszerzeniu gramatyki może zostać złamane pierwsze ograniczenie, co powoduje konieczność dodania nowej produkcji. Np. po dopisaniu symbolu $b$ do produkcji $S \to a b c d a$ przyjmie ona postać – $S \to \underline{a b} c d \underline{a b} .$ Powtarza się para $a b,$ stąd zostaje dodana nowa produkcja $A \to a b,$ a startowa przyjmuje postać $S \to A c d A .$

Z kolei drugie ograniczenie może zostać złamane po dodaniu nowej produkcji, gdy zastępuje ona wystąpienia innej produkcji. Np. po dopisaniu symbolu $c,$ produkcja startowa przyjmuje postać $S \to \underline{A c} d \underline{A c},$ dodawana jest nowa reguła $B \to A c .$ Gramatyka ma teraz postać:

$S \to B d B,$
$A \to a b,$
$B \to A c,$

produkcja druga $(A)$ jest wykorzystywana tylko raz (w produkcji 3, $B$ ). Po jej usunięciu gramatyka zostaje uproszczona do:

$S \to B d B,$
$B \to a b c .$

Zobacz też

LZ78
LZW

Linki zewnętrzne

Szablon:Cytuj stronę

Sequitur

Algorytm kodowania

Zobacz też

Linki zewnętrzne

Menu nawigacyjne

Szukaj