Abstract
Text-compression problems are considered where substrings are substitued by code-words according to a static dictionary such that the original text is encoded by a shorter code sequence. We introduce a new efficient on-line heuristic which locally maximizes the compaction ratio. The worst-case behaviour of this fractional greedy heuristic is investigated for several types of dictionaries.
Zusammenfassung
Es werden Text-Komprimierungsprobleme behandelt, bei denen Teilworte durch Codeworte ersetzt werden, sodaß der ursprüngliche Text durch eine kürzere Codesequenz repräsentiert wird. Das geschieht mit Hilfe eines statischen Wörterbuchs. Wir führen eine neue effiziente on-line Heuristik ein, welche die lokale Komprimierungsrate maximiert. Von diesem fractional greedy Verfahren wird das Verhalten im schlechtesten Fall für verschiedene Typen von Wörterbüchern untersucht.
Similar content being viewed by others
References
Békési, J., Galambos G., Pferschy, U., Woeginger, G. J.: Greedy algorithms for on-line data compression. Report 276-93, Mathematical Institute, TU Graz, Austria 1993.
Gonzalez-Smith, M. E., Storer, J. A.: Parallel algorithms for data compression. J. ACM32, 344–373 (1985).
Katajainen, J., Raita, T.: An analysis of the longest matching and the greedy heuristic in text encoding. J. ACM39, 281–294 (1992).
Schuegraf, E. J., Heaps, H. S.: A comparison of algorithms for data base compression by use of fragments as language elements. Inf. Stor. Ret.10, 309–319 (1974).
Ziv, J., Lempel, A.: A universal algorithm for sequential data compression. IEEE Trans. Inf. Theory23, 337–343 (1977).
Author information
Authors and Affiliations
Additional information
This research was partially supported by the Christian Doppler Laboratorium für Diskrete Optimierung and by the Fonds zur Förderung der wissenschaftlichen Forschung, Project P8971-PHY.
Rights and permissions
About this article
Cite this article
Békési, J., Galambos, G., Pferschy, U. et al. The fractional greedy algorithm for data compression. Computing 56, 29–46 (1996). https://doi.org/10.1007/BF02238290
Received:
Issue Date:
DOI: https://doi.org/10.1007/BF02238290