DE10131801B4 - Verfahren zur Datenkompression und Navigationssystem - Google Patents

Verfahren zur Datenkompression und Navigationssystem Download PDF

Info

Publication number
DE10131801B4
DE10131801B4 DE2001131801 DE10131801A DE10131801B4 DE 10131801 B4 DE10131801 B4 DE 10131801B4 DE 2001131801 DE2001131801 DE 2001131801 DE 10131801 A DE10131801 A DE 10131801A DE 10131801 B4 DE10131801 B4 DE 10131801B4
Authority
DE
Germany
Prior art keywords
literal
sequences
length
control codes
lzss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE2001131801
Other languages
English (en)
Other versions
DE10131801A1 (de
Inventor
Arnd Braun
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE2001131801 priority Critical patent/DE10131801B4/de
Priority to GB0212613A priority patent/GB2378868A/en
Priority to FR0207994A priority patent/FR2826804B1/fr
Priority to JP2002187725A priority patent/JP4191438B2/ja
Publication of DE10131801A1 publication Critical patent/DE10131801A1/de
Application granted granted Critical
Publication of DE10131801B4 publication Critical patent/DE10131801B4/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • H03M7/3086Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing a sliding window, e.g. LZ77
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Verfahren zur Datenkompression und/oder Datendekompression nach einem Verfahren des LZSS-Typs unter Verwendung von folgenden Steuercodes: – eines ersten Steuercodes für Literalsequenzen, wobei die Literalsequenzen eine einer oberen Schranke (S1) für die Länge der Literalsequenzen entsprechende erste maximale Länge haben, – eines zweiten Steuercodes für einen Zeiger für einen Rückverweis auf eine zu komprimierende Literalsequenz, wobei der Rückverweis eine zweite maximale Länge und die zu kopierende Literalsequenz eine dritte maximale Länge haben, wobei zur Feststellung der ersten maximalen Länge die Häufigkeitsverteilung der Längen der Literalsequenzen in einem mittels Steuercodes ohne Längenbegrenzung durchgeführten LZSS-Verfahren codierten Musterdatensatz verwendet wird.

Description

  • Die Erfindung betrifft ein Verfahren zur Datenkompression und/oder Datendekompression nach einem auf einem Verfahren des LZSS-Typs basierenden Verfahrens. sowie ein entsprechendes elektronisches System, insbesondere ein Navigationssystem.
  • Verfahren des LZSS-Typs sind aus der US-A-487 6541 sowie aus T. C. Bell in „Better OPM/L Text Compression, „IEEE Trans. On Communications”, Vol. COM-34, No. 12. Dec., 1986 bekannt.
  • Bei dem LZSS-Verfahren handelt es sich um eine Weiterentwicklung des Lempel Ziv Verfahrens.
  • Bei Anwendung des LZSS-Verfahrens wird in den zuletzt übertragenen Zeichen innerhalb eines Datenfensters einer bestimmten Länge nach einer Zeichenkette gesucht, die mit den nächsten zu übertragenden Zeichen übereinstimmt. Wird eine solche Zeichenkette gefunden, dann wird diese durch einen Rückverweis ersetzt.
  • Für die entsprechende Codierung werden zwei unterschiedliche Steuercodes verwendet. Der Steuercode „L” zeigt an, dass als nächstes eine Anzahl „echter” Zeichen, sogenannte Literals, übertragen werden. Dagegen zeigt der Steuercode „C” an, dass aus den schon übertragenen Zeichen eine Zeichenkette kopiert werden soll:
  • F(s)
    – Datenfenster, in dem nach gleichen Zeichenketten gesucht wird. Es umfasst eine Anzahl von s Zeichen vor der aktuellen Leseposition im Eingabedatenstrom.
    L(n)
    – Steuerzeichen zur Angabe, dass nachfolgend eine Anzahl von n Literals, das heißt, eine Literalsequenz der Länge n übertragen wird.
    C(p, n)
    – Steuerzeichen, zur Identifikation einer zu kopierenden vorausgegangenen Literalsequenz, d. h. gehe p Zeichen zurück und kopiere von dort n Zeichen.
  • Die 1 zeigt ein Beispiel für die Codierung einer Zeichenkette 1 nach dem aus dem Stand der Technik bekannten LZSS-Verfahrens. Das Ergebnis der Codierung ist die Zeichenkette 2 der 1, wobei es sich bei den Zeichen in Fettschrift um Literals handelt.
  • Ferner sind aus dem Stand der Technik verschiedene Varianten des LZSS-Verfahrens bekannt, beispielsweise LZSS mit adaptiver arithmetischer Codierung und LZSS mit adaptiver Hoffman-Codierung. Eine Übersicht hierüber findet sich in dem Proseminar „Redundanz”, Vortrag 5, Maximilian Hrabowski (http://goethe.ira.uka.de/seminare/redundanz/vortrag05/#LZSS). Weitere Darstellungen des LZSS-Verfahrens finden sich unter http://ttrip1.fhworms.de/sem/ws95_96/kompressionsalgorithmen/node19.html und http://ttrip1.fh-worms.de/sem/ws95_96/kompressionsalgorithmen/node20.html.
  • Aus der US-A-5 502 439 ist ein Verfahren zur Kompression binärer Daten nach dem LZSS-Verfahren bekannt. Dabei wird ein Puffer in einem Speicher mit wahlfreiem Zugriff für die vorübergehende Speicherung sogenannter Flag-Bits, die bei der Durchführung des LZSS-Verfahrens generiert werden, verwendet. Weitere Verfahren des LZSS-Typs sind aus US-A-5 701 125 , US-A-5 673 042 und US-A-5 867 114 bekannt.
  • Die EP 0 903 865 A1 befasst sich mit einem Verfahren und einem Gerät zur Datenkompression. Dabei wird ein Eingangsdatenstrom aus Quellsymbolen kodiert, um eine Ausgangssequenz von Zeigern zu erhalten. Dabei wird eine LITERAL-Sequenz verwendet.
  • Die Schrift von CRAFT; D. J.: A fast hardware data compression algorithm and some algorithmic extensions. In: IBM Journal. Of Research and Development, Nov. 1998 befasst sich mit einer Datenkompression unter Verwendung von ALDC-Hardware Implementierungen.
  • Die EP 0 582 907 A2 befasst sich mit einer Datenkompressionsvorrichtung, die die Suche nach übereinstimmenden Zeichenketten und Huffman Verschlüsselung verwendet.
  • Die Schrift SALOMON, D.: Data Compression: The Complete Reference”, New York, NY: Springer, US, ISBN: 0-387-98280-9, S. 101–162 u. 357–360 befasst sich mit einer Kompression von Daten.
  • Der Erfindung liegt die Aufgabe zu Grunde, ein verbessertes Verfahren des LZSS-Typs und ein entsprechendes verbessertes Computerprogrammprodukt sowie elektronisches System zu schaffen.
  • Die der Erfindung zu Grunde liegende Aufgabe wird jeweils mit den Merkmalen der unabhängigen Patentansprüche gelöst. Bevorzugte Weiterbildungen der Erfindung sind in den abhängigen Ansprüchen angegeben.
  • Das erfindungsgemäße Verfahren des LZSS-Typs ermöglicht eine besonders schnelle Datendekompression bei gleichzeitiger guter Kompressionsrate. In einer bevorzugten Ausführungsform der Erfindung werden hierzu die Steuercodes für die Durchführung des LZSS-Verfahrens in Abhängigkeit von der Auftretenshäufigkeit unterschiedlicher Längen von Literalsequenzen, Längen von zu kopierenden Literalsequenzen und den Längen von Rückverweisen festgelegt.
  • Nach einer weiteren bevorzugten Ausführungsform werden jeweils Mengen von Steuercodes gebildet, die zur Erreichung einer weiteren Kompression ihrerseits beispielsweise Hoffman-codiert werden können.
  • Gemäß einer weiteren Ausführungsform der Erfindung erfolgen die Rückverweise nur in einem Byte-Raster, welches durch die Breite des verwendeten Datenbusses bzw. des verwendeten Prozessors vorgegeben ist. Hierdurch wird die Verarbeitungsgeschwindigkeit bei der Dekompression nochmals gesteigert. Ebenso wird hierdurch auch die Kompressionsrate erhöht.
  • Von besonderem Vorteil ist die Anwendung des erfindungsgemäßen Verfahrens für ein elektronisches System, beispielsweise ein Navigationssystem. Bei bekannten Navigationssystemen werden im Allgemeinen CDs für die Speicherung der Navigationsdatenbanken verwendet. Um möglichst viele Navigationsdaten auf einer CD unterzubringen, ist es vorteilhaft, die Navigationsdaten nach einem erfindungsgemäßen Verfahren zu komprimieren. Die Geschwindigkeit der Datenkompression ist dabei praktisch zweitrangig, da diese nur einmal und nicht im laufenden Betrieb, erfolgt.
  • Für den praktischen Einsatz des Navigationssystems ist dagegen die Dekompressionsgeschwindigkeit von großer Bedeutung, da ständig beim Betrieb des Navigationssystems Navigationsdaten zu dekomprimieren sind, um die Routenplanung und Positionsbestimmung vorzunehmen. Auch insofern ist das erfindungsgemäße Verfahren besonders vorteilhaft, da es eine besonders schnelle Datendekompression ermöglicht.
  • Im Weiteren wird die Erfindung anhand eines bevorzugten Ausführungsbeispiels mit Bezug auf die Zeichnungen näher erläutert. Es zeigen:
  • 1 die Codierung einer Zeichensequenz nach dem Stand der Technik,
  • 2 ein Flussdiagramm einer Ausführungsform des erfindungsgemäßen Verfahrens,
  • 3 die prozentuale Verteilung von Literalsequenzen und der Länge von Rückverweisen in einem Musterdatensatz,
  • 4 eine Ausführungsform für die Bestimmung von Mengen von Steuercodes,
  • 5 die Codierung einer Zeichenkette mittels der Steuerungscodes der 4,
  • 6 die Umcodierung der codierten Zeichenkette der 5 mittels eines weiteren Steuercodes,
  • 7 ein Blockdiagramm eines erfindungsgemäßen elektronischen Systems.
  • Das Verfahren der 2 dient zur Ermittlung von Steuercodes für die Anwendung in einer Ausführungsform des erfindungsgemäßen Verfahrens. Dazu wird in dem Schritt 20 zunächst ein Musterdatensatz eingegeben, der in dem Schritt 21 einer Codierung mittels eines an sich aus dem Stand der Technik bekannten LZSS-Verfahrens unterzogen wird. Als Musterdatensatz kann ein typischer Datensatz oder auch ein tatsächlicher Datensatz verwendet werden.
  • In dem Schritt 22 wird das durch die Ausführung des Schritt 21 erhaltene Kompressionsergebnis einer statistischen Analyse unterzogen. Dazu wird beispielsweise die Häufigkeitsverteilung der unterschiedlichen Längen von in dem Kompressionsergebnis vorkommenden Literalsequenzen festgestellt, sowie auch die Häufigkeitsverteilungen der Längen von Rückverweisen und der Längen von bei der Anwendung des Schritts 21 kopierten Literalsequenzen.
  • Zur Optimierung der Dekompressionsgeschwindigkeit werden im Nachfolgenden maximale Längen festgelegt. Hierzu wird zunächst in dem Schritt 23 eine obere Schranke S1 für die Länge der Literalsequenzen ermittelt, so dass X% der in dem Kompressionsergebnis des Schritt 21 beinhalteten Literale eine Länge ≤ S1 aufweisen. X% kann beispielsweise als 95% angenommen werden.
  • Entsprechend wird in dem Schritt 24 eine obere Schranke S2 für die Länge der Rückverweise ermittelt, so dass Y% der Rückverweise eine Länge aufweisen, die ≤ der oberen Schranke S2 ist. Auch hier kann Y% wieder als 95% gewählt werden.
  • Schließlich wird in dem Schritt 25 noch eine obere Schranke S3 für die Länge der kopierten Literale in dem Kompressionsergebnis des Schritts 21 ermittelt, so dass Z% der kopierten Literalsequenzen eine Länge ≤ der oberen Schranke 33 aufweisen. Z% kann wiederum als 95% gewählt werden.
  • In dem Schritt 26 werden die für die Codierung der unterschiedlichen Längen jeweils erforderlichen Bitanzahlen ermittelt, das heißt, es werden die Anzahl der Bits B1 zur Codierung von S1 unterschiedlichen Längen von Literalsequenzen, die Anzahl von Bits B2 zur Codierung von S2 unterschiedlichen Längen von Rückverweisen und die Anzahl von Bits B3 zur Codierung von S3 unterschiedlichen Längen zu kopierender Literalsequenzen ermittelt.
  • Aufgrund der Ergebnisse des Schritts 26 erfolgt in dem Schritt 27 die Festlegung der Steuercodes. Die Unterscheidung zwischen einem L und einem C Steuercode erfolgt durch die erste Bitposition – in dem betrachteten Beispiel 0 für den Steuercode L und 1 für den Steuercode C.
  • In dem Steuercode L folgen danach eine Anzahl von B1 Bitpositionen X zur Kodierung der Länge n der nachfolgenden Literalsequenz. In dem Steuercode C folgen nach der führenden 1 zunächst eine Anzahl B2 von Bitpositionen X für die Codierung der unterschiedlichen Längen von Rückverweisen und danach eine Anzahl von B3 von Bitpositionen Y zur Codierung der unterschiedlichen Zeichenlängen der zu kopierenden Literalsequenzen.
  • Für einen Musterdatensatz wurden dabei beispielsweise folgende Werte ermittelt: S1 = 128, S2 = 4096 und S3 = 32. Daraus ergibt sich B1 = 7, B2 = 12 und B3 = 5.
  • Die Tabellen der 3 zeigen, dass ein hoher Prozentsatz der Daten nur einen kleinen Teil der möglichen Steuerungscodes ausnutzt.
  • Bei dem untersuchten Musterdatensatz hatten Literalsequenzen der Länge 1 einen Anteil von 50% an den vorkommenden Steuerzeichen L; Literalsequenzen einer Länge von 2 bis 8 einen Anteil von 25% und Literalsequenzen von > 8 bis zu der oberen Schranke S1 einen Anteil von 25%.
  • Entsprechend hatten Rückverweise mit zu kopierenden Literalsequenzen einer Länge von 1 bis 8 einen Anteil von 70% an den Steuerungscodes C. Ferner haben Rückverweise mit einer Länge des Zeigers p zwischen 1 und 32 Positionen einen Anteil von 50% der Steuerungscodes C, Rückverweise einer Länge zwischen 33 und 512 Positionen einen Anteil von 25% und Rückverweise einer Länge von > 512 bis zu der oberen Schranke einen Anteil von 25%.
  • Entsprechend werden gemäß der Darstellung der 4 zwei unterschiedliche Mengen von Steuerungscodes L und C gebildet. Für die Steuerungscodes L sind dies die Codes L1, L2 und L3 jeweils für einen Längenbereich der Literalsequenzen von 1, 2 bis 9 und 10 bis 265. Die für die Steuerungscodes L1, L2 und L3 jeweils erforderliche Anzahl von Bits B1 beträgt dabei 0, 3 bzw. 8. In dem hier betrachteten Beispiel wird der Steuerungscode L1 als 001, der Steuerungscode L2 als 010 und der Steuerungscodes L3 als 011 codiert; die jeweilige Länge für die Codierung eines Steuerungscodes beträgt daher in diesem Fall je drei Bit.
  • Die Darstellung der 4 beinhaltet ferner die Codierung für die Steuerungscodes C. In dem betrachteten Beispiel werden sechs Steuerungscodes C1 bis C6 entsprechend der Verteilung der Rückverweise der 3 gebildet. Der Steuerungscode C1 wird dabei als 1001 codiert, der Steuerungscode C2 als 1010 usw..
  • Die Anzahl der für die Codierung jedes der Steuerungscodes C verwendeten Bits ist gleichbleibend vier; alternativ kann jedoch die Codierung der Steuerungscodes L und C auch beispielsweise nach einem Huffman-Verfahren erfolgen, wobei die Auftretenswahrscheinlichkeit eines bestimmten Codes gemäß der Tabelle der 3 berücksichtigt wird.
  • Nachdem mit der Tabelle 3 die Anzahl der Codes, und ihre Größe, bestimmt wurde, wird die Häufigkeit der einzelnen Codes an der Gesamtheit der auftretenden Codes bestimmt und nach dieser Häufigkeit die Huffman-Codes vergeben.
  • Wenn die Literal-Codes 40% aller Codes ausmachen und die Copy-Codes mit kurzer Zeichenkette 70% aller Copy-Codes, ergibt sich mit Tabelle 3 folgende Verteilung:
    Code Häufigkeit
    L1 20%
    L2 10%
    L3 10%
    C1 21%
    C2 10,5%
    C3 10,5%
    C4 9%
    C5 4,5%
    C6 4,5%
  • In diesem Fall ergeben sich unterschiedliche Code-Längen, wobei der Code mit der höchsten Häufigkeit die kürzeste Codierung erhält. In dem betrachteten Beispiel ist dies der Code C1.
  • Der Steuerungscode C1 kommt für einen Rückverweis mit einem Zeiger in dem Wertebereich 2 bis 33 Zeichen auf eine Literalsequenz einer Länge von 2 bis 5 Zeichen zur Anwendung. Dabei ist zu berücksichtigen, dass ein Rückverweis nur dann stattfindet, wenn die Länge des Rückverweises mindestens zwei Zeichen beträgt und die Länge der zu kopierenden Literalsequenz, auf die rückverwiesen wird, mindestens zwei ist. Entsprechend beträgt die Anzahl von Bits zur Codierung des Wertebereichs des Zeigers („Pointer”) fünf und die Anzahl von Bits für die Codierung des Wertebereichs 2 bis 5 der Länge der zu kopierenden Literalsequenzen zwei Bits. Entsprechende Zuordnungen finden sich in der Tabelle der 4 auch für die Steuerungscodes C2 bis C6.
  • Wenn die Zeichen in der zu komprimierenden Sequenz in einem Byteraster angeordnet sind, beispielsweise einer Breite von zwei oder vier Bytes, kann die Datenkompression weiter optimiert werden, in dem nur die tatsächlich vorkommenden Zeigerlängen in den Steuercodes C abgebildet werden. Beispielsweise lässt sich die Bitanzahl für die Codierung der Zeigerlänge in dem Steuercode C1 für Daten in einem Zweibyteraster von fünf auf vier Bit reduzieren, da ungeradzahlige Rückverweise per Definition nicht vorkommen können. Bei einem Raster von Vierbytelänge lässt sich entsprechend eine Reduktion um ein weiteres Bit erzielen. Das Vorliegen von Daten in einem Byteraster wird auch als Alignment bezeichnet. Das Alignment der Daten überträgt sich entsprechend auf die Rückverweise.
  • Die 5 zeigt die Codierung der Sequenz 1 (vgl. 1) nach einem erfindungsgemäßen Verfahren mittels der Steuerungscodes der 4. Es resultiert dabei das Kompressionsergebnis 3.
  • Ein Nachteil bei dem Kompressionsergebnis 3 ist, dass die in dem Kompressionsergebnis 3 beinhalteten Literalsequenzen wegen der bitorientierten Codierung der Befehle nicht mehr an Bytegrenzen ausgerichtet sind und deshalb entsprechend geshiftet werden müssen.
  • Um diesen Nachteil zu beheben, werden die Steuerungsbefehle und die Literalsequenzen bei der Codierung zunächst in zwei Datenströme getrennt. Der Datenstrom der Literalsequenzen ist dabei byteorientiert. Der Datenstrom der Steuerungscodes ist bitorientiert.
  • Nachdem die beiden Datenströme vollständig vorliegen, können sie wieder in einen einzigen Datenstrom zusammengeführt werden, in dem die beiden Datenströme beispielsweise aneinandergehängt werden. Die Trennung der beiden Datenströme wird in dem durch Aneinanderhängen entstandenen Datenstrom durch einen weiteren Steuercode gekennzeichnet. Dieser kann etwa an den Anfang des resultierenden Datenstroms gestellt werden, um von dort die Trennung zwischen den Datenströmen zu referenzieren.
  • Die 6 zeigt ein entsprechendes Beispiel, in dem das Kompressionsergebnis 3 der 5 umcodiert wird. Zunächst erfolgt eine Aufteilung des Kompressionsergebnisses 3 in einen Datenstrom 4 von Steuerungscodes und in einen Datenstrom 5 von Literalsequenzen.
  • Durch Aneinanderhängen der Datenströme 4 und 5 entsteht der resultierende Datenstrom 6. Diesem ist ein Zeiger Z(n) vorangestellt, der auf das erste Zeichen des Datenstroms 5 zeigt.
  • Die 7 zeigt ein Blockdiagramm eines Navigationssystems 7, welches einen CD-ROM Abspieler 8 beinhaltet. Das Navigationssystem 7 hat ferner einen Mikroprozessor 9 sowie Speicherbereiche 10, 11 und 12. Auf einer CD-ROM des CD-ROM Abspielers 8 befinden sich nach einem erfindungsgemäßen Verfahren komprimierte Navigationsdaten.
  • Sequenzen solcher Navigationsdaten werden von dem Navigationssystem von dem CD-ROM Abspieler 8 abgefragt und zu dem Navigationssystem 7 übertragen. Bei Empfang eines Datenstroms entsprechend dem Datenstrom 6 der 6 teilt der Mikroprozessor 9 den empfangenen Datenstrom in einem ersten Datenstrom von Steuercodes und in einem zweiten Datenstrom von Literalsequenzen auf, wobei dies unter Verwendung des vorangestellten Zeigers Z(n) erfolgt.
  • Die Steuercodedatensequenz wird in dem Speicherbereich 10 abgelegt, die Literalsequenzen in dem Speicherbereich 11. Zur Decodierung muss der Mikroprozessor 9 dann lediglich die Steuercodes in dem Speicherbereich 10 abarbeiten und dabei auf die Literalsequenzen in dem Speicherbereich 11 zugreifen. Nach Ausführung eines Steuercodes ermittelte Dekompressionsergebnisse werden dann nacheinander in dem Speicherbereich 12 abgelegt, ohne dass Shift-Operationen notwendig sind. Aufgrund dessen lässt sich eine sehr schnelle Decodierung in dem Navigationssystem 7 erreichen, so dass während der Fahrt beispielsweise auf Routenänderungen und dergleichen sehr schnell reagiert werden kann.
  • Eine weitere Beschleunigung der Dekompression lässt sich erreichen, wenn bei der Kompression nur Rückverweise einer Zeigerlänge, die größer als die Länge der zu kopierenden Literalsequenz ist, zugelassen werden. Beispielsweise wird ein Rückverweis C4 (17, 20) dann aufgespalten in C4 (17, 17) C4 (17, 3). Dies führt zu einer Einsparung von Prozessorleistung.
  • Wenn die zu komprimierenden Daten besondere Strukturen beinhalten, kann durch weitere ergänzende Methoden und ggf. weitere Steuercodes eine nochmalige Verbesserung der Kompressionsrate bzw. der Dekompressionszeit erzielt werden:
    • – Einige Datenstrukturen haben Bereiche, in denen eine lange Folge gleicher Zeichen auftritt; diese Sequenzen können zusätzlich vorab mit einem RUN-LENGTH-ENCODING Verfahren codiert werden.
    • – Wenn sich zeigt, dass Steuerungscodesequenzen mehrfach hintereinander wiederholt auftreten, können diese mit einem Wiederholungskommando codiert werden. Der Vorteil ist, dass die entsprechende Steuerungscodesequenz nur einmal decodiert werden muss.

Claims (13)

  1. Verfahren zur Datenkompression und/oder Datendekompression nach einem Verfahren des LZSS-Typs unter Verwendung von folgenden Steuercodes: – eines ersten Steuercodes für Literalsequenzen, wobei die Literalsequenzen eine einer oberen Schranke (S1) für die Länge der Literalsequenzen entsprechende erste maximale Länge haben, – eines zweiten Steuercodes für einen Zeiger für einen Rückverweis auf eine zu komprimierende Literalsequenz, wobei der Rückverweis eine zweite maximale Länge und die zu kopierende Literalsequenz eine dritte maximale Länge haben, wobei zur Feststellung der ersten maximalen Länge die Häufigkeitsverteilung der Längen der Literalsequenzen in einem mittels Steuercodes ohne Längenbegrenzung durchgeführten LZSS-Verfahren codierten Musterdatensatz verwendet wird.
  2. Verfahren nach Anspruch 1, bei dem zur Festlegung der zweiten maximalen Länge die Häufigkeitsverteilung der Längen der Zeiger in einem mittels eines LZSS-Verfahrens ohne Längenbeschränkung ermittelten komprimierten Datensatzes verwendet wird.
  3. Verfahren nach Anspruch 1 oder 2, bei dem zur Festlegung der dritten maximalen Länge die Häufigkeitsverteilung der Längen von zu kopierenden Literalsequenzen in einem mittels eines LZSS-Verfahren ohne Längenbeschränkung ermittelten komprimierten Datensatzes eines Musterdatensatzes verwendet wird.
  4. Verfahren nach einem der vorhergehenden Ansprüche 1 bis 3, bei dem zur Durchführung des LZSS-Verfahrens eine erste Menge erster Steuercodes und eine zweite Menge zweiter Steuercodes verwendet wird.
  5. Verfahren nach Anspruch 4, bei dem die erste Menge jeweils einen ersten Steuercode für Literalsequenzen innerhalb eines bestimmten Wertebereichs beinhaltet.
  6. Verfahren nach Anspruch 5, bei dem die ersten und die zweiten Steuercodes nach der Auftretentenshäufigkeit der Literalsequenzen bzw. der Häufigkeit des Auftretens von Rückweisen in den betreffenden Wertebereichen nach einem Huffman-Verfahren codiert sind.
  7. Verfahren nach einem der vorhergehenden Ansprüche 4, 5 oder 6, bei dem die zweite Menge je einen Steuercode für einen Wertebereich des Zeigers und einen Wertebereich der zu kopierenden Literalsequenz aufweist.
  8. Verfahren nach Anspruch 7, wobei die zweiten Steuercodes Huffmanncodiert sind.
  9. Verfahren nach Anspruch 7 oder 8, bei dem der Wertebereich des Zeigers byteweise oder in Vielfachen einer Bytelänge aufgeteilt ist.
  10. Verfahren nach einem der vorhergehenden Ansprüche 1 bis 9, bei dem die ersten und zweiten Steuercodes und die Literals in zwei voneinander getrennten Abschnitten des Kompressionsergebnisses abgelegt werden und ein dritter Steuercode zur Identifizierung der Trennung dient.
  11. Computerprogrammprodukt auf einem computerlesbaren Medium oder einer über ein Computernetzwerk ladbaren Datei mit Programmmitteln zur Durchführung eines Verfahrens nach einem der vorhergehenden Ansprüche 1 bis 10, wenn das Computerprogramm auf einem elektronischen System, vorzugsweise einem Navigationssystem, ausgeführt wird.
  12. Elektronisches System, vorzugsweise Navigationssystem, mit Mitteln zur Durchführung der Verfahrensschritte nach einem der vorhergehenden Ansprüche 1 bis 10.
  13. Elektronisches System, vorzugsweise Navigationssystem, nach Anspruch 12 mit einem ersten Speicherbereich (10) zum Ablegen von Steuercodes, einem zweiten Speicherbereich (11) zum Ablegen von Literalsequenzen und einem dritten Speicherbereich (12) zum Ablegen von kopierten Literalsequenzen.
DE2001131801 2001-06-30 2001-06-30 Verfahren zur Datenkompression und Navigationssystem Expired - Lifetime DE10131801B4 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE2001131801 DE10131801B4 (de) 2001-06-30 2001-06-30 Verfahren zur Datenkompression und Navigationssystem
GB0212613A GB2378868A (en) 2001-06-30 2002-05-31 Data Compression
FR0207994A FR2826804B1 (fr) 2001-06-30 2002-06-27 Procede de compression de donnees et systeme de navigation
JP2002187725A JP4191438B2 (ja) 2001-06-30 2002-06-27 データ圧縮方法およびデータ伸長方法、該方法を実施するためのコンピュータプログラム製品と電子システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2001131801 DE10131801B4 (de) 2001-06-30 2001-06-30 Verfahren zur Datenkompression und Navigationssystem

Publications (2)

Publication Number Publication Date
DE10131801A1 DE10131801A1 (de) 2003-01-16
DE10131801B4 true DE10131801B4 (de) 2013-03-07

Family

ID=7690186

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2001131801 Expired - Lifetime DE10131801B4 (de) 2001-06-30 2001-06-30 Verfahren zur Datenkompression und Navigationssystem

Country Status (4)

Country Link
JP (1) JP4191438B2 (de)
DE (1) DE10131801B4 (de)
FR (1) FR2826804B1 (de)
GB (1) GB2378868A (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602008002583D1 (de) * 2008-07-21 2010-10-28 Sony Comp Entertainment Europe Datenkomprimierung und -dekomprimierung
JP2013214832A (ja) * 2012-03-30 2013-10-17 Fujitsu Ltd 圧縮及び伸長システム、圧縮装置、伸長装置、圧縮及び伸長方法、圧縮プログラム及び伸長プログラム
JP6609404B2 (ja) 2014-07-22 2019-11-20 富士通株式会社 圧縮プログラム、圧縮方法および圧縮装置
KR101890365B1 (ko) * 2017-07-26 2018-08-21 국방과학연구소 압축된 데이터의 오류를 검출하는 방법 및 장치
CN110868222B (zh) * 2019-11-29 2023-12-15 中国人民解放军战略支援部队信息工程大学 Lzss压缩数据误码检测方法及装置
JP7475319B2 (ja) 2021-11-16 2024-04-26 株式会社日立製作所 ストレージシステム及びストレージシステムにおけるデータ処理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0582907A2 (de) * 1992-08-10 1994-02-16 Stac Electronics, Inc. Verfahren und Vorrichtung zur Datenkomprimierung unter Verwendung von Zeichenkettenanpassung-Suche und Huffmankodierung
EP0903865A1 (de) * 1997-09-19 1999-03-24 International Business Machines Corporation Verfahren und Vorrichtung zur Datenkompression

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3397431B2 (ja) * 1994-03-16 2003-04-14 富士通株式会社 データ圧縮方法および装置ならびにデータ復元方法および装置
US5502439A (en) * 1994-05-16 1996-03-26 The United States Of America As Represented By The United States Department Of Energy Method for compression of binary data
US5867114A (en) * 1996-02-29 1999-02-02 Mitel Corporation Method and apparatus for performing data compression
US5877711A (en) * 1997-09-19 1999-03-02 International Business Machines Corporation Method and apparatus for performing adaptive data compression

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0582907A2 (de) * 1992-08-10 1994-02-16 Stac Electronics, Inc. Verfahren und Vorrichtung zur Datenkomprimierung unter Verwendung von Zeichenkettenanpassung-Suche und Huffmankodierung
EP0903865A1 (de) * 1997-09-19 1999-03-24 International Business Machines Corporation Verfahren und Vorrichtung zur Datenkompression

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CRAFT, D.J.: A fast hardware data compression algorithm and some algorithmic extensions. In: IBM Journal of Research and Development, Nov. 1998 *
SALOMON, D.: "Data Compression: The Complete Reference", New York, NY: Springer, US, ISBN: 0-387-98280-9, S. 101-162 u. 357-360 *

Also Published As

Publication number Publication date
JP4191438B2 (ja) 2008-12-03
GB0212613D0 (en) 2002-07-10
GB2378868A (en) 2003-02-19
DE10131801A1 (de) 2003-01-16
FR2826804B1 (fr) 2004-10-15
JP2003046392A (ja) 2003-02-14
FR2826804A1 (fr) 2003-01-03

Similar Documents

Publication Publication Date Title
DE69935811T3 (de) Frequenzbereichsaudiodekodierung mit Entropie-code Moduswechsel
DE69725215T2 (de) Verfahren und Vorrichtung zur Komprimierung und Dekomprimierung von Schrifttypen
DE69726661T2 (de) Verfahren und vorrichtung zur kodierung eines digitalen informationssignales
DE10301362B4 (de) Blockdatenkompressionssystem, bestehend aus einer Kompressionseinrichtung und einer Dekompressionseinrichtung, und Verfahren zur schnellen Blockdatenkompression mit Multi-Byte-Suche
DE69838074T2 (de) Verfahren und vorrichtung zur gleichzeitigen verschlüsselung und komprimierung von daten
DE19742417B4 (de) Vorrichtung und Verfahren zur Durchführung von M-fachem Maschinenendzustands-Entropiekodieren bzw. Entropiekodieren mit einer Maschine mit finitem Zustand
DE69722085T2 (de) Verfahren und Vorrichtung zur Komprimierung und Dekomprimierung von Botschaften
DE19622045C2 (de) Datenkomprimierungs- und Datendekomprimierungsschema unter Verwendung eines Suchbaums, bei dem jeder Eintrag mit einer Zeichenkette unendlicher Länge gespeichert ist
DE10196890B4 (de) Verfahren zum Ausführen einer Huffman-Decodierung
DE69834695T2 (de) Verfahren und Vorrichtung zur Datenkompression
DE3485824T2 (de) Verfahren zur datenkompression.
DE69433620T2 (de) Datenkomprimierungsverfahren
DE10196847B4 (de) Ein Verfahren zum Erzeugen von Huffman-Code-Längeninformationen
DE60128146T2 (de) System und verfahren zum komprimieren und dekomprimieren von daten in echtzeit
DE10131801B4 (de) Verfahren zur Datenkompression und Navigationssystem
EP1323313B1 (de) Verfahren und anordnung zum übertragen eines vektors
DE19907728C2 (de) Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
EP2823568B1 (de) Verfahren zur codierung eines datenstroms
DE19907729C2 (de) Verfahren und Vorrichtung zum Erzeugen eines Datenstroms aus Codeworten variabler Länge und Verfahren und Vorrichtung zum Lesen eines Datenstroms aus Codeworten variabler Länge
DE19653133C2 (de) System und Verfahren zur pre-entropischen Codierung
DE4432436C2 (de) Datenkompressionsverfahren und Vorrichtung zum Komprimieren von Daten
DE102006047465A1 (de) Verfahren und Vorrichtung zur Kompression und Dekompression digitaler Daten auf elektronischem Wege unter Verwendung einer Kontextgrammatik
EP0456893A2 (de) Verfahren zur Datenkompression
EP1186175A1 (de) Verfahren und vorrichtung zur komprimierung und dekomprimierung von daten
WO2014114506A1 (de) Verfahren zur kompression von quelldaten unter nutzung von symmetrien und einrichtung zur durchführung des verfahrens

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final

Effective date: 20130608

R084 Declaration of willingness to licence
R071 Expiry of right