KR100359118B1 - 균일 엔트로피 데이터에 대한 비손실 압축방법 - Google Patents

균일 엔트로피 데이터에 대한 비손실 압축방법 Download PDF

Info

Publication number
KR100359118B1
KR100359118B1 KR1020010014309A KR20010014309A KR100359118B1 KR 100359118 B1 KR100359118 B1 KR 100359118B1 KR 1020010014309 A KR1020010014309 A KR 1020010014309A KR 20010014309 A KR20010014309 A KR 20010014309A KR 100359118 B1 KR100359118 B1 KR 100359118B1
Authority
KR
South Korea
Prior art keywords
symbol
data stream
value
data
compression
Prior art date
Application number
KR1020010014309A
Other languages
English (en)
Other versions
KR20010067760A (ko
Inventor
김대순
Original Assignee
주식회사 아름테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아름테크놀로지 filed Critical 주식회사 아름테크놀로지
Priority to KR1020010014309A priority Critical patent/KR100359118B1/ko
Publication of KR20010067760A publication Critical patent/KR20010067760A/ko
Priority to US10/100,365 priority patent/US20020167429A1/en
Priority to PCT/KR2002/000447 priority patent/WO2002075928A2/en
Application granted granted Critical
Publication of KR100359118B1 publication Critical patent/KR100359118B1/ko

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 기존의 비손실 데이터 압축 방식에서는 압축이 불가능한 균일 엔트로피 데이터, 즉 데이터 내부에서 발생할 수 있는 2진 코드조합의 발생 확률이 동일한 데이터 포맷(MPEG, JPEG, ZIP, ARJ 등)에 대한 압축을 가능하게 하는 새로운 압축 방식을 제공한다. 본 발명은 종래의 비손실 압축 알고리즘이 사용하는 룩업 테이블(Look-up table) 구성 및 복원을 위한 여분(Redundancy) 데이터의 추가없이 균일 엔트로피 데이터가 갖는 특성, 즉 데이터의 조합이 불규칙적인 성질을 이용하여 데이터 스트림의 2진 정보 값을 수정한 후 사전(Dictionary) 압축을 통하여 균일 엔트로피 데이터에 대한 압축을 가능하게 한다.

Description

균일 엔트로피 데이터에 대한 비손실 압축방법{LOSSLESS DATA COMPRESSION METHOD FOR UNIFORM ENTROPY DATA}
본 발명은 데이터 압축방법에 관한 것이며, 특히 균일한 엔트로피 특성을 갖는 데이터 스트림에 대한 비손실 압축 방식에 관한 것이다.
디지틀 정보통신의 근간이 되는 데이터 압축방식은 크게 손실(Lossy)압축과 비손실(Lossless)압축의 2가지로 크게 나누어진다. 손실압축은 영상 및 음성정보 등의 데이터 중에서 사람의 감각기관으로 인지하지 못하는 데이터를 제거하여 정보를 압축하는 방법으로서 영상데이터 압축에 사용되는 MPEG, JPEG, 음성데이터 압축에 사용되는 MP3, AC3 등이 있다. 손실압축은 비손실 압축에 대비하여 상대적으로 좋은 압축률 특성을 갖지만 데이터를 복원했을 경우 원본 데이터의 일부 성분이 손실되므로 영상, 음성처리에 사용되는 특수한 시스템을 제외한 일반 저장장치, 메모리소자 등에는 적용이 불가능하다. 비손실 압축은 주로 문서 등의 비균일 엔트로피 데이터 정보에 사용되는 압축방식으로서 렘펠-지프(Lempel-Ziv), 허프만 코딩 방식들이 있고 이를 상용화한 WinZip, ARC, PKZIP 등의 압축 유틸리티가 일반 개인용 컴퓨터에서 광범위하게 사용되고 있다. 그러나 이와같은 기존의 비손실 압축방식은 균일 엔트로피 데이터(데이터 안에서 나타날 수 있는 이진 조합수가 균일함)인 MPEG, JPEG, MP3, AC3, ZIP 등의 데이터에 대해서는 압축이 불가능하다.
현재 디지틀 정보통신 및 정보기기의 대부분은 MPEG등의 손실 압축방식을 통하여 제작된 2진 정보를 기본으로 사용하고 있다. 그 예로 디지틀 방송의 경우 위성, 지상파, 케이블 TV 모두 MPEG 포맷의 2진정보를 사용하고 있으며 DVD, VCD 및 MP3 플레이어 등도 손실 압축된 데이터를 이용하고 있다. 상대적으로 비손실 압축방식은 균일 엔트로피 데이터의 압축이 불가능하다는 압축방법의 근본적인 한계 때문에 시스템으로의 하드웨어적 구현은 거의 전무한 실정이며 일부 압축 소프트웨어(WinZip, ARJ) 등을 통해 개인용 컴퓨터에서 제한적으로 이용되고 있다. 예를 들어 개인용 컴퓨터의 주메모리, HDD, FDD 및 CD-RW 등에 입력되는 정보는 균일 엔트로피 데이터인 MPEG 등과 비균일 엔트로피 데이터인 문서파일 등이 혼재되어 있으므로 비손실 압축방식을 적용할 수 없고, 만일 이를 이용하여 압축할 경우에는 오히려 데이터 량이 증가할 수 있는 문제가 있다.
따라서, 본 발명의 목적은 균일한 엔트로피 특성을 갖는 데이터를 비손실 압축 방식으로 압축하기 위한 새로운 방법을 제공하는 데 있다.
본 발명은 기존의 비손실 데이터 압축 방식에서는 압축이 불가능한 균일 엔트로피 데이터, 즉 데이터 내부에서 발생할 수 있는 2진 코드조합의 발생 확률이 동일한 데이터(MPEG, JPEG, ZIP, ARJ 등)에 대한 압축을 가능하게 하는 새로운 압축 방식을 제공한다. 본 발명은 기존의 비손실 압축 알고리즘이 사용하는 룩업 테이블(Look-up table) 방식 등이 갖는 단점, 즉 데이터 스트림의 국부구간(Temporal Period)에 대한 압축이 룩업 테이블 구성 및 복원을 위한 여분(Redundancy) 데이터의 추가에 의해 불가능하다는 점에 착안하여 룩업 테이블 및 여분 데이터를 제거하고 균일 엔트로피 데이터가 갖는 특성, 즉 데이터의 조합이 불규칙적인 성질을 이용하여 데이터 스트림의 2진 정보 값을 수정한 후 사전(Dictionary) 압축을 통하여 균일 엔트로피 데이터에 대한 압축을 가능하게 한다.
본 발명에 따르면, 임의의 균일 엔트로피 데이터 스트림 X X = { X1, X2, X3, ···, Xm} 라 가정하고, 여기서 심볼 "Xi"의 비트 크기는 "n"비트이며, 2개의 "n" 비트 레지스터를 상태 레지스터 R = { A1, A2, A3, ···, An}, 기준 레지스터 B = { B1, B2, B3, ···, Bn}로 정의할 때, 레지스터 R B 는 n개 심볼을 가진 레지스터이고, 각 심볼은 서로 다른 값을 가지며 압축이 수행되기 전 두 레지스터의 값은 동일한 것으로 가정하고, 상태 레지스터 B 를 이용하여 출력된 데이터 스트림 C C = { C1, C2, C3, ···, Cm} 라고 할 때, 상기 데이터 스트림 X 에 대한 비손실 데이터 압축방법이:
(a) 상기 데이터 스트림 C 의 제1의 심볼 C1에 입력 데이터 스트림 X 의 제1의 심볼 값인 X1을 입력한 후 X1과 같은 값을 갖는 상태 레지스터 R 의 심볼 Ai를 An+1의 위치로 이동시키는 단계,
(b) 입력 데이터 스트림 X 의 제2의 입력 심볼인 X2와 같은 값을 갖는 상태 레지스터 R 의 심볼값을 찾고 이에 상응하는 기준 레지스터 B 의 값을 C2에 저장하는 단계,
(c) 입력 데이터 스트림 X 의 각 심볼에 대해 상기 단계(b)의 동작을 Xm까지 반복하여 수행하고 출력 데이터 스트림 C 에 저장하는 단계,
(d) 출력 데이터 스트림 C 를 비손실 압축 알고리즘을 이용하여 압축하는 단계를 포함하는 균일 엔트로피 정보에 대한 비손실 데이터 압축방법이 제공된다.
본 발명의 다른 양상에 따르면, 상기 단계 (d)에서 압축의 결과로 출력된 데이터 스트림 C 를 입력으로 받아 상태 레지스터 R 및 기준 레지스터 B 를 이용하여 레지스터에 저장하고, 상기 레지스터 R B 는 압축 동작시에 사용한 값으로 동일하게 초기화시켜 입력 데이터 스트림 X 를 복원하는 방법이:
(e) 압축된 데이터 스트림을 상기 압축 단계(d)에서 사용한 방식으로 복원하여 데이터 스트림 C 를 추출하는 단계와,
(f) 데이터 스트림 X 의 첫째 심볼 X1에 데이터 스트림 C 의 제1의 심볼 값인 C1을 입력한 후 C1과 같은 값을 갖는 상태 레지스터 R 의 심볼 Ai를 An+1의 위치로 이동시키는 단계와,
(g) 제2의 입력 심볼인 C2와 같은 값을 갖는 기준 레지스터 B 의 심볼값을 찾고 이에 상응하는 상태 레지스터 R 의 값을 X2에 저장하는 단계와, 그리고
(h) 입력 데이터 스트림 C 의 각 심볼에 대해 상기 단계(f)의 동작을 Cm까지 반복하여 수행하고 데이터 스트림 X 에 저장하는 단계로 이루어진 비손실 데이터 복원방법이 제공된다.
본 발명의 비손실 압축방식을 이용할 경우 메모리 소자(SRAM, DRAM, Flash-ROM), HDD, FDD 및 DVD, CD-RW 등의 저장매체의 용량을 30%정도 증대시킬 수 있으며, 디지틀 TV, IMT-2000등의 채널 대역폭을 30%이상 절감할 수 있다. 예를 들어 현재 9.4 GByte의 DVD 저장매체는 13 GByte의 데이터를 저장할 수 있으며, 6 MHz 디지틀 TV 방송 채널은 약 4 MHz로 채널 대역폭 감소가 가능하다.
도 1a는 비균일 엔트로피 특성을 가지는 데이터 스트림의 일 예에 대해 종래의 비손실 압축방식을 적용했을 경우의 2진 허프만 트리를 나타낸 도면.
도 1b는 균일 엔트로피 특성을 갖는 데이터 스트림의 일 예에 대해 종래의 비손실 압축방식을 적용했을 경우의 2진 허프만 트리를 나타낸 도면.
도 2는 본 발명의 비손실 압축방법이 적용되는 압축기의 블록 다이어그램.
도 3은 본 발명에 따라 압축된 데이터 스트림을 복원하는 복원기의 블록 다이어그램.
도 1a 및 도 1b를 참조하여 종래의 비손실 데이터 압축방식에 대해 설명한다.
현재 알려져 있는 비손실 데이터 압축방식은 허프만 코딩(Huffman Coding),산술 코딩(Arithmetic Coding), 사전 코딩(Dictionary Coding), 렘펠-지프(Lempel-Ziv) 등 다양한 방법들이 있으며, 이들 중 대표적인 허프만 코드를 이용하여 기존의 비손실 데이터 압축방식을 설명한다.
예를 들어 다음과 같이 16개의 알파벳 문자로 이루어진 데이터 스트림 "S" 를 가정하면:
S= { a, b, c, a, d, b, a, c, e, a, b, a, c, a, b, a }
S는 "a, b, c, d, e"의 5가지 문자가 서로 다른 발생빈도를 가지고 구성되어 있으며, 이를 확률로 표시하면,
P(a) = 7/16, P(b) = 4/16, P(c) = 3/16, P(d) = 1/16, P(e) = 1/16 로 표현된다.
이와 같이 데이터 스트림의 구성코드들이 서로 다른 발생빈도를 가지고 구성될 때는 허프만 코드 방식으로 각 문자에 대한 코드 할당이 가능하고 이를 이용하여 압축이 가능해진다. 상기 데이터 스트림 S에 대한 2진 허프만 트리를 도 1a에 나타내었다.
도 1a의 허프만 트리를 이용하여 데이터 스트림 "S"의 각 문자에 대한 코드를 부과할 경우 다음의 표 1과 같다.
상기 표 1에서 할당한 코드에 따라 데이터 스트림S의 심볼당 평균 비트 크기를 "ι"로 가정하면,
ι= 0.4375 ×1 + 0.25 ×2 + 0.1875 ×3 + 0.0625 ×4 + 0.0625 ×4 = 2비트/심볼(2 bits/symbol)
로서, 단위 문자(심볼) 당 2비트의 2진 코드가 필요하게 된다. 허프만 트리를 사용하지 않을 경우에는 심볼이 5개이므로 단위 심볼당 3비트가 필요하고 데이터 스트림S는 "3 ×16 = 48비트"이며 허프만 트리로 압축할 경우에는 단위 심볼당 2비트가 소요되므로 "2 ×16 = 32비트" 의 길이로서 약 35%의 데이터 스트림 압축효과를 갖게 된다.
상기와 같이, 데이터 스트림 "S" 는 각 문자들의 발생빈도가 서로 상이한 비균일 엔트로피 특성을 가지며, 이러한 경우 상기 허프만 코딩 등의 비손실 압축방식으로 데이터를 압축할 수 있다.
다음은 데이터 스트림이 균일 엔트로피 특성을 갖는 경우, 즉 데이터 스트림안에서 각 심볼이 발생할 수 있는 확률이 균일한 경우에 대해 설명한다. 균일 엔트로피 특성의 데이터 스트림을 다음과 같이 가정하면:
S'= { a, d, c, b, d, a, b, c, a, c, d, b, c, d, b, a }
S'는 "a, b, c, d"의 4 개 문자가 같은 발생빈도, 즉 균일 엔트로피 특성을 가지며 각 문자별 발생 확률은,
P(a) = 0.25, P(b) = 0.25, P(c) = 0.25, P(d) = 0.25
로 표시된다.
상기 데이터 스트림S'에 대한 2진 허프만 트리를 도 1b에 나타내었다.
이 허프만 트리를 이용하여 데이터 스트림S'의 각 문자에 대한 코드를 부과할 경우 표 2와 같다.
상기 표 2에서 할당한 코드에 따라 데이터 스트림S'의 심볼당 평균 비트 크기를 "ι'"로 가정하면,
ι'= 0.25 ×1 + 0.25 ×2 + 0.25 ×3 + 0.25 ×3 = 2.25비트/심볼(bits/symbol)
로서, 단위 문자(심볼) 당 2.25 비트의 2진 코드가 필요하게 된다. 허프만 트리를 사용하지 않을 경우에는 심볼이 4개이므로 단위 심볼당 2비트가 필요하고 데이터 스트림S'는 "2 ×16 = 32비트"이며 허프만 트리로 압축할 경우에는 단위 심볼당 2.25비트가 소요되므로 "2.25 ×16 = 36비트"의 길이로서 허프만 트리로 압축했을 때 오히려 데이터 스트림의 길이가 늘어나는 결과를 갖는다. 이와 같이 균일한 엔트로피 특성을 갖는 데이터는 허프만 코딩 등의 기존 비손실 압축방식을 적용했을 때 오히려 데이터 량이 증가한다.
본 발명에 따른 비손실 데이터 압축방식을 이하 설명한다.
본 발명의 비손실 압축 알고리즘은 종래 방식과 달리 연속된 2진 정보 스트림의 상관관계와 랜덤 발생 성향을 이용하여 국부구간(Temporal Period)의 균일 엔트로피 특성을 비균일 엔트로피 특성으로 데이터 스트림의 성질을 변환하여 압축을 가능하게 한다.
본 발명에 따른 압축방법이 적용되는 압축기 및 압축된 데이터 스트림을 복원하는 복원기의 블록 다이어그램을 도 2 및 도 3에 나타내었다.
도 2에서, 본 발명이 적용되는 압축기는 상태 레지스터(R)의 값들 중 입력 데이터 스트림 X의 단위 입력 심볼과 동일한 값의 심볼을 검출하는 심볼 비교기(10)와, 심볼 비교기(10)에서 검출된 심볼에 상응하는 기준 레지스터(B)의 위치값(번지)을 생성하는 번지 비교기(20)와, 출력 데이터 스트림 C를 비손실 압축 알고리즘을 이용하여 압축하는 데이터 스트림 발생기(30)를 포함한다.
도 3을 참조하면, 본 발명의 방법이 적용되는 복원기는 상기 압축방법으로 압축된 출력 데이터 스트림 C를 입력받아 각 단위 입력 심볼과 동일한 값을 갖는 기준 레지스터(B)의 위치값을 생성하는 번지 비교기(20')와, 번지 비교기(20')에서 출력된 심볼 위치 정보와 동일한 번지의 상태 레지스터(R) 값을 비교 출력하는 심볼 비교기(10')와, 복원 데이터 스트림을 생성하는 데이터 스트림 발생기(30')를 포함한다.
본 발명의 압축 방식에 대해 압축(Compression) 및 복원(Decompression)으로 나누어 구체적으로 설명한다.
압축 알고리즘
임의의 균일 엔트로피 데이터 스트림 X 는 다음 식으로 표시할 수 있다.
X = { X1, X2, X3, ···, Xm}
심볼 "Xi"의 비트 크기는 "n"비트이며, 아래와 같이 2개의 "n" 비트 레지스터를 정의하면,
상태 레지스터: R = { A1, A2, A3, ···, An}
기준 레지스터: B = { B1, B2, B3, ···, Bn}
레지스터 R B 는 n개 심볼을 가진 레지스터이고, 각 심볼은 서로 다른 값을 가지며 압축이 수행되기 전 두 레지스터의 값은 동일한 것으로 가정한다. 압축이 일어나면서 상태 레지스터 R 의 값은 입력 데이터 스트림 X 의 값에 의해 변환되지만 기준 레지스터 B 의 값은 변하지 않는다. 상태 레지스터 R 를 이용하여 출력된 데이터 스트림은 다음 식으로 표현될 수 있다.
C = { C1, C2, C3, ···, Cm}
다음은 압축이 이루어지는 순서별 각 단계에 대한 설명이다.
① 데이터 스트림 C 의 첫번째 심볼 C1에 데이터 스트림 X 의 첫번째 심볼 값인 X1을 입력한 후 X1과 같은 값을 갖는 상태 레지스터 R 의 심볼 Ai를 An+1의 위치로 이동시킨다. 이때 상태 레지스터 R 의 심볼 배열은,
R = { A1, A2, A3, ···, Ai-1, Ai+1, ···, An-1, An, Ai}
와 같다.
② 2번째 입력 심볼인 X2와 같은 값을 갖는 상태 레지스터 R 의 심볼값을 찾고 이에 상응하는 기준 레지스터 B 의 값을 C2에 저장한다. 예를 들어 X2의 값이 A3와 동일한 경우 C2는 A3의 위치에 상응하는 기준 레지스터의 값인 B3를 갖게 된다. 이때 상태 레지스터 R 의 심볼 배열은,
R = { A1, A2, A4, ···, Ai-1, Ai+1, ···, An-1, An, Ai,A3}
와 같다.
③ 입력 데이터 스트림 X 의 각 심볼에 대해 상기 2번의 동작을 Xm까지 반복하여 수행하고 데이터 스트림 C 에 저장한다.
④ 비균일 엔트로피 데이터인 데이터 스트림 C 를 압축 알고리즘(Huffman, Arithmetic 및 Dictionary 등)을 이용하여 압축한다.
복원 알고리즘
복원(Decompression) 동작시에는 상기 압축에서 결과로 출력된 데이터 스트림 C 를 입력으로 받아 상태 레지스터 R 및 기준 레지스터 B 를 이용하여 레지스터 에 저장하게 된다.
레지스터 R B 는 압축 동작시에 사용한 값으로 동일하게 초기화시킨다.
다음은 복원이 이루어지는 순서별 각 단계를 설명한다.
① 압축된 데이터 스트림을 상기한 압축동작의 ④항에서 사용한 방식으로 복원하여 데이터 스트림 C 를 추출한다.
② 데이터 스트림 X 의 첫째 심볼 X1에 데이터 스트림 C 의 첫 번째 심볼 값인 C1을 입력한 후 C1과 같은 값을 갖는 상태 레지스터 R 의 심볼 Ai를 An+1의 위치로 이동시킨다. 이때 상태 레지스터 R 의 심볼 배열은,
R = { A1, A2, A3, ···, Ai-1, Ai+1, ···, An-1, An, Ai}
와 같다.
③ 2번째 입력 심볼인 C2와 같은 값을 갖는 기준 레지스터의 심볼값을 찾고 이에 상응하는 상태 레지스터의 값을 X2에 저장한다. 예를 들어 C2의 값이 B3와 동일한 경우 X2는 B3의 위치에 상응하는 기준 레지스터의 값인 A3를 갖게 된다. 이때 상태 레지스터 R 의 심볼 배열은,
R = { A1, A2, A4, ···, Ai-1, Ai+1, ···, An-1, An, Ai,A3}
와 같다.
④ 입력 데이터 스트림 C 의 각 심볼에 대해 상기 2번의 동작을 Cm까지 반복하여 수행하고 데이터 스트림 X 에 저장하여 복원동작을 완료한다.
설명의 단순화를 위해 데이터 스트림의 발생가능 심볼을 4개로 가정하여 상기 설명한 P = 0.25 인 균일 엔트로피 데이터 스트림 " S' " 에 대해 본 발명의 알고리즘을 적용, 예시적으로 설명한다.
S' = X = { a, d, c, b, d, a, b, c, a, c, d, b, c, d, b, a }
S' 는 입력으로 사용되는 데이터 스트림으로서 상기 설명한 X 와 동일하다.
다음의 표 3 및 표 4는 데이터 스트림 X 를 입력으로 사용한 본 발명의 압축및 복원 사이클별 압축 순서이다.
표 3에서 알 수 있는 바와 같이 기존 비손실 압축방식으로는 압축이 불가능한 균일 엔트로피 데이터 스트림X는 본 발명의 압축 방식을 통하여 압축이 가능한 비균일 엔트로피 데이터로 변환된다. 본 발명의 압축 기법을 통하여 출력된 데이터 스트림 C 의 각 심볼당 엔트로피는 다음의 표 5와 같다.
상기한 본 발명의 복원 방식에 의해 추출된 데이터 스트림X'은 표 4에서 알 수 있는 바와 같이 원본 입력 데이터 스트림X와 동일한 값을 가지며, 정확한 압축 및 복원이 비손실 방식으로 이루어짐을 확인할 수 있다.
본 발명의 비손실 압축방식은 기존 압축 기술에서는 불가능한 손실 및 비손실 데이터 압축된 정보의 추가 압축이 가능하고 정보의 특성을 알 수 없는 랜덤 데이터 입력에 대한 압축을 가능하게 하여 현재 손실/비손실 데이터 압축정보를 사용하고 있는 디지틀 시스템, 즉 DVD, HDD, FDD, CD-RW, DRAM, SRAM, Flash-ROM 등의 데이터 저장용량을 증대시킬 수 있고 방송 및 통신 채널(Digital TV, IMT-2000, ADSL, PCS) 등의 전파 채널에 대한 대역폭 절감이 가능하다.

Claims (6)

  1. 임의의 균일 엔트로피 데이터 스트림 X X = { X1, X2, X3, ···, Xm} 라 가정하고, 여기서 심볼 "Xi"의 비트 크기는 "n"비트이며, 2개의 "n" 비트 레지스터를 상태 레지스터 R = { A1, A2, A3, ···, An}, 기준 레지스터 B = { B1, B2, B3, ···, Bn}라고 정의할 때, 레지스터 R B 는 n개 심볼을 가진 레지스터이며 각 심볼은 서로 다른 값을 가지며 압축이 수행되기 전 두 레지스터의 값은 동일한 것으로 가정하고, 상태 레지스터 B 를 이용하여 출력된 데이터 스트림 C C = { C1, C2, C3, ···, Cm} 라고 할 때, 상기 데이터 스트림 X 에 대한 비손실 데이터 압축방법이:
    (a) 상기 데이터 스트림 C 의 제1의 심볼 C1에 입력 데이터 스트림 X 의 제1의 심볼 값인 X1을 입력한 후 X1과 같은 값을 갖는 상태 레지스터 R 의 심볼 Ai를 An+1의 위치로 이동시키는 단계,
    (b) 입력 데이터 스트림 X 의 제2의 입력 심볼인 X2와 같은 값을 갖는 상태 레지스터 R 의 심볼값을 찾고 이에 상응하는 기준 레지스터 B 의 값을 C2에 저장하는 단계,
    (c) 입력 데이터 스트림 X 의 각 심볼에 대해 상기 단계(b)의 동작을 Xm까지 반복하여 수행하고 출력 데이터 스트림 C 에 저장하는 단계, 및
    (d) 출력 데이터 스트림 C 를 비손실 압축 알고리즘을 이용하여 압축하는 단계를 포함하는 균일 엔트로피 정보에 대한 비손실 데이터 압축 방법.
  2. 제 1 항에 있어서, 상기 단계 (a)에서 상태 레지스터 R 의 심볼 배열은,
    R = { A1, A2, A3, ···, Ai-1, Ai+1, ···, An-1, An, Ai}와 같은 것을 특징으로 하는 균일 엔트로피 정보에 대한 비손실 데이터 압축 방법.
  3. 제 1 항에 있어서, 상기 단계 (b)에서 X2의 값이 A3와 동일한 경우 C2는 A3의 위치에 상응하는 기준 레지스터 B 의 값인 B3를 갖게 되고 이때 상태 레지스터 R 의 심볼 배열은,
    R = { A1, A2, A4, ···, Ai-1, Ai+1, ···, An-1, An, Ai,A3}와 같은 것을 특징으로 하는 균일 엔트로피 정보에 대한 비손실 데이터 압축 방법.
  4. 제 1 항의 단계 (d)에서 압축의 결과로 출력된 데이터 스트림 C 를 입력으로 받아 상태 레지스터 R 및 기준 레지스터 B 를 이용하여 레지스터 X 에 저장하고, 상기 레지스터 R B 는 압축 동작시에 사용한 값으로 동일하게 초기화시켜 입력 데이터 스트림 X 를 복원하는 방법이:
    (e) 압축된 데이터 스트림을 상기 압축 단계(d)에서 사용한 방식으로 복원하여 데이터 스트림 C 를 추출하는 단계와,
    (f) 데이터 스트림 X 의 첫째 심볼 X1에 데이터 스트림 C 의 제1의 심볼 값인 C1을 입력한 후 C1과 같은 값을 갖는 상태 레지스터 R 의 심볼 Ai를 An+1의 위치로 이동시키는 단계와,
    (g) 제2의 입력 심볼인 C2와 같은 값을 갖는 기준 레지스터 B 의 심볼값을 찾고 이에 상응하는 상태 레지스터 R 의 값을 X2에 저장하는 단계와, 그리고
    (h) 입력 데이터 스트림 C 의 각 심볼에 대해 상기 단계(f)의 동작을 Cm까지 반복하여 수행하고 데이터 스트림 X 에 저장하는 단계로 이루어진 비손실 데이터 복원방법.
  5. 제 4 항에 있어서, 상기 단계 (f)에서 상태 레지스터 R 의 심볼 배열은,
    R = { A1, A2, A3, ···, Ai-1, Ai+1, ···, An-1, An, Ai}와 같은 것을 특징으로 하는 비손실 데이터 복원방법.
  6. 제 4 항에 있어서, 상기 단계 (g)에서 제2의 입력 심볼 C2의 값이 B3와 동일한 경우 X2는 B3의 위치에 상응하는 기준 레지스터 B 의 값인 A3를 갖게 되고, 이때 상태 레지스터 R 의 심볼 배열은,
    R = { A1, A2, A4, ···, Ai-1, Ai+1, ···, An-1, An, Ai,A3}와 같은 것을 특징으로 하는 비손실 데이터 복원방법.
KR1020010014309A 2001-03-20 2001-03-20 균일 엔트로피 데이터에 대한 비손실 압축방법 KR100359118B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020010014309A KR100359118B1 (ko) 2001-03-20 2001-03-20 균일 엔트로피 데이터에 대한 비손실 압축방법
US10/100,365 US20020167429A1 (en) 2001-03-20 2002-03-18 Lossless data compression method for uniform entropy data
PCT/KR2002/000447 WO2002075928A2 (en) 2001-03-20 2002-03-18 Lossless data compression method for uniform entropy data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010014309A KR100359118B1 (ko) 2001-03-20 2001-03-20 균일 엔트로피 데이터에 대한 비손실 압축방법

Publications (2)

Publication Number Publication Date
KR20010067760A KR20010067760A (ko) 2001-07-13
KR100359118B1 true KR100359118B1 (ko) 2002-11-04

Family

ID=19707137

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010014309A KR100359118B1 (ko) 2001-03-20 2001-03-20 균일 엔트로피 데이터에 대한 비손실 압축방법

Country Status (3)

Country Link
US (1) US20020167429A1 (ko)
KR (1) KR100359118B1 (ko)
WO (1) WO2002075928A2 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060069857A1 (en) * 2004-09-24 2006-03-30 Nec Laboratories America, Inc. Compression system and method
US9292594B2 (en) * 2010-03-10 2016-03-22 Novell, Inc. Harvesting relevancy data, including dynamic relevancy agent based on underlying grouped and differentiated files
JP6003059B2 (ja) * 2012-01-05 2016-10-05 株式会社リコー 画像処理装置および画像処理方法、ならびに、画像形成装置
CN111723256A (zh) * 2020-06-03 2020-09-29 开普云信息科技股份有限公司 一种基于信息资源库的政务用户画像构建方法及其***
CN112821894A (zh) * 2020-12-28 2021-05-18 湖南遥昇通信技术有限公司 一种基于加权概率模型的无损压缩方法和无损解压方法
CN115622569B (zh) * 2022-11-30 2023-03-10 中国人民解放军国防科技大学 基于字典压缩算法的数字波形压缩方法、装置和设备
CN116610265B (zh) * 2023-07-14 2023-09-29 济南玖通志恒信息技术有限公司 一种商务信息咨询***的数据存储方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835034A (en) * 1995-07-18 1998-11-10 Hewlett-Packard Company System and method for lossless image compression
US5870036A (en) * 1995-02-24 1999-02-09 International Business Machines Corporation Adaptive multiple dictionary data compression
KR0185843B1 (ko) * 1995-08-31 1999-05-01 배순훈 무손실 복호화기
KR0185844B1 (ko) * 1995-08-31 1999-05-01 배순훈 무손실 복호화 방법 및 그 장치
KR100219217B1 (ko) * 1995-08-31 1999-09-01 전주범 무손실 부호화 장치
KR20000031178A (ko) * 1998-11-04 2000-06-05 구자홍 무손실 부호화 방법 및 장치
US6154572A (en) * 1996-03-28 2000-11-28 Microsoft, Inc. Table based compression with embedded coding

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4833718A (en) * 1986-11-18 1989-05-23 First Byte Compression of stored waveforms for artificial speech
US5333212A (en) * 1991-03-04 1994-07-26 Storm Technology Image compression technique with regionally selective compression ratio
US5341440A (en) * 1991-07-12 1994-08-23 Earl Joseph G Method and apparatus for increasing information compressibility
US5406279A (en) * 1992-09-02 1995-04-11 Cirrus Logic, Inc. General purpose, hash-based technique for single-pass lossless data compression
US5298896A (en) * 1993-03-15 1994-03-29 Bell Communications Research, Inc. Method and system for high order conditional entropy coding
DE19524808A1 (de) * 1995-07-07 1997-01-09 Thomson Brandt Gmbh Verfahren, Encoder und Decoder zur Resynchronisierung auf einen fehlerbehafteten Datenstrom
SE512613C2 (sv) * 1996-12-30 2000-04-10 Ericsson Telefon Ab L M Metod och organ för informationshantering
US6154155A (en) * 1999-03-08 2000-11-28 General Electric Company General frame-based compression method

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870036A (en) * 1995-02-24 1999-02-09 International Business Machines Corporation Adaptive multiple dictionary data compression
US5835034A (en) * 1995-07-18 1998-11-10 Hewlett-Packard Company System and method for lossless image compression
KR0185843B1 (ko) * 1995-08-31 1999-05-01 배순훈 무손실 복호화기
KR0185844B1 (ko) * 1995-08-31 1999-05-01 배순훈 무손실 복호화 방법 및 그 장치
KR100219217B1 (ko) * 1995-08-31 1999-09-01 전주범 무손실 부호화 장치
US6154572A (en) * 1996-03-28 2000-11-28 Microsoft, Inc. Table based compression with embedded coding
KR20000031178A (ko) * 1998-11-04 2000-06-05 구자홍 무손실 부호화 방법 및 장치

Also Published As

Publication number Publication date
KR20010067760A (ko) 2001-07-13
WO2002075928A2 (en) 2002-09-26
US20020167429A1 (en) 2002-11-14
WO2002075928A3 (en) 2002-12-05

Similar Documents

Publication Publication Date Title
JP3541930B2 (ja) 符号化装置及び復号化装置
US10033405B2 (en) Data compression systems and method
KR20070086661A (ko) 선택적 압축과 복원 및 압축 데이터에 대한 데이터 포맷을위한 장치 및 방법
US9094041B2 (en) Encoding method, information processing apparatus, and recording medium
US20030018647A1 (en) System and method for data compression using a hybrid coding scheme
CN112398484A (zh) 一种编码方法及相关设备
US6668092B1 (en) Memory efficient variable-length encoding/decoding system
KR100359118B1 (ko) 균일 엔트로피 데이터에 대한 비손실 압축방법
JP2005521324A (ja) 損失のないデータの圧縮および圧縮解除方法および装置
Asolkar et al. Review of data compression and different techniques of data compression
KR100330437B1 (ko) 균일 및 비균일 엔트로피 데이터에 대한 비손실 데이터압축/압축 해제 시스템 및 방법
KR100686354B1 (ko) 가변 트리를 이용한 허프만 복호화 방법 및 장치
Pasumarthi et al. EHTC: An Enhanced Huffman Tree Coding Algorithm and its FPGA Implementation
KR100462603B1 (ko) 영상 데이타 압축 및 복원 방법 및 장치
Garba et al. Analysing Forward Difference Scheme on Huffman to Encode and Decode Data Losslessly
Usibe et al. Noise Reduction in Data Communication Using Compression Technique
GB2365284A (en) Data compression system which selects compressed output from one of two different compression schemes
Dixit et al. DATA COMPRESSION TECHNIQUES
JP2002344326A (ja) 合成インデックスによるデータ圧縮方法及び圧縮データの完全復元方法
Seena et al. Implementation of Data Compression using Huffman Coding
Nayak et al. A MODIFIED APPROACH TO LOSSLESS DATA COMPRESSION METHOD
Singh et al. A STUDY OF VARIOUS STANDARDS FOR TEXT COMPRESSION TECHNIQUES
Stern An algorithm for the construction of a critical clustered exponential code for use in image data compression

Legal Events

Date Code Title Description
A201 Request for examination
G15R Request for early publication
A302 Request for accelerated examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee