AV Translation Services - Home Page

TRANSLATION SAMPLE

Language pair:
Field:

Encoding:
Wordcount (source):
English - Serbian (Latin)
Information Technology

Central European (Windows 1250)
314
 
 

Adaptive compression

The Lempel-Ziv and related algorithms convert variable-length strings of input symbols into fixed-length (or predictable length) codes. The symbol strings are selected so that all have almost equal probability of occurrence. Consequently, strings of frequently occurring symbols will contain more symbols than a string having infrequent symbols (see example in Table 1). This form of compression is effective at exploiting character frequency redundancy, character repetitions, and high-usage pattern redundancy. However, it is not generally effective on positional redundancy.

This type of algorithm is adaptive in the sense that it starts with an empty table of symbol strings and builds the table during both the compression and decompression processes. These are one-pass procedures that require no prior information about the input data statistics and execute in time proportional to the length of the message. This adaptivity results in poor compression during the initial portion of each message; as a result, the message must be most long enough for the procedure to build enough symbol frequency experience to achieve good compression over the full message. On the other hand, most finite implementations of an adaptive algorithm lose the ability to adapt after a certain amount of the message is processed. If the message is not homogeneous and its redundancy characteristics shift during the message, then compression efficiency declines if the message length significantly exceeds the adaptive range of the compression implementation.

The compression procedure discussed here is called the LZW method. A variation on the Lempel-Ziv procedure, it retains the adaptive properties of Lempel-Ziv and achieves about the same compression ratios in normal commercial computer applications. LZW is distinguished by its very simple logic, which yields relatively inexpensive implementations and the potential for very fast execution. A typical LZW implementation operates at under three clock cycles per symbol and achieves acceptably good compression on messages in the magnitude of ten thousand characters in length.
 

Adaptivna kompresija

Lempel-Ziv i srodni algoritmi konvertuju stringove ulaznih simbola promenljive dužine u kodove fiksne (ili predvidive) dužine. Stringovi simbola se biraju tako da svi imaju skoro istu verovatnoću pojavljivanja. Prema tome, stringovi često pojavljivanih simbola će sadržati više simbola nego string koji sadrži retko korišćene simbole (vidi primer u tabeli 1). Ovaj vid kompresije je efektivan prilikom korišćenja redundancije učestanosti karaktera, ponavljanja karaktera i redundancije često korišćenih obrazaca. Međutim, nije posebno efektivna na pozicionu redundanciju.

Ovaj tip algoritma je adaptivan u smislu da počinje praznom tabelom simboličkih stringova i gradi tabelu i za vreme kompresije i za vreme dekompresije. Ovo su jednoprolazne procedure koje ne zahtevaju prethodnu informaciju o statistici ulaznih podataka i izvršavaju se u vremenu proporcionalnom dužini poruke. Ova adaptivnost rezultira lošom kompresijom za vreme početnog dela svake poruke; kao rezultat toga, poruka mora biti dovoljno dugačka da bi procedura imala dovoljan broj slučaja učestanosti simbola da ostvari dobru kompresiju celom dužinom poruke. Sa druge strane, većina konačnih implementacija nekog adaptivnog algoritma gubi sposobnost prilagođavanja nakon što se obradi određeni deo poruke. Ako poruka nije homogena i ako se njena redundantna karakteristika menja tokom poruke, tada efikasnost kompresije opada ako dužina poruke značajnije prelazi granicu adaptivnosti te implementacije kompresije.

Procedura kompresije koja je ovde opisana se naziva LZW metoda. Kao varijanta Lempel-Ziv procedure ona zadržava adaptivne karakteristike Lempel-Ziv metode i postiže otprilike iste stepene kompresije u normalnim komercijalnim aplikacijama. LZW metoda se odlikuje veoma jednostavnom logikom koja omogućava relativno jeftinu primenu i potencijal za veoma brzo izvršavanje. Tipična LZW implementacija troši tri ciklusa kloka po simbolu i postiže prihvatljivo dobru kompresiju poruka čija je dužina reda veličine deset hiljada karaktera.

AV Translation Services - home page

© 2001 Aleksander Vasiljević
feedback - other samples - home page