KR960025207A - Lzw를 이용한 완성형 한글의 데이타 압축방법 - Google Patents

Lzw를 이용한 완성형 한글의 데이타 압축방법 Download PDF

Info

Publication number
KR960025207A
KR960025207A KR1019940039802A KR19940039802A KR960025207A KR 960025207 A KR960025207 A KR 960025207A KR 1019940039802 A KR1019940039802 A KR 1019940039802A KR 19940039802 A KR19940039802 A KR 19940039802A KR 960025207 A KR960025207 A KR 960025207A
Authority
KR
South Korea
Prior art keywords
lzw
compression method
string
data compression
character
Prior art date
Application number
KR1019940039802A
Other languages
English (en)
Other versions
KR0144633B1 (ko
Inventor
서두원
Original Assignee
김준성
사단법인 고등기술연구원 연구조합
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김준성, 사단법인 고등기술연구원 연구조합 filed Critical 김준성
Priority to KR1019940039802A priority Critical patent/KR0144633B1/ko
Publication of KR960025207A publication Critical patent/KR960025207A/ko
Application granted granted Critical
Publication of KR0144633B1 publication Critical patent/KR0144633B1/ko

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • H03M7/3088Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing the use of a dictionary, e.g. LZ78
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4031Fixed length to variable length coding
    • H03M7/4037Prefix coding
    • H03M7/4043Adaptive prefix coding
    • H03M7/4062Coding table adaptation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6011Encoder aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

LZW를 이용한 데이타 압축 방식에서, 일반적으로 사용되는 1바이트 영문전용 압축방식을 변형하여, 2바이트 한글에 대하여도 높은 데이타 압축률을 가질 수 있도록 LZW 압축 알고리즘에 사용되는 딕셔너리 트리(dictionary tree)와 내부 테이블을 재구성하여 압축률을 증가 시킨다.

Description

LZW를 이용한 완성형 한글의 데이타 압축방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 LZW를 이용한 데이타 압축방법의 흐름선도, 제2도의 a는 종래의 LZW를 이용한 데이타 압축방법의 기본 알고리즘의 초기 내부 테이블 구조 도해도, 제2도의 b는 본 발명의 LZW를 이용한 데이타 압축방법의 한글인식 알고리즘의 초기 내부 테이블 구조 도해도.

Claims (3)

  1. 데이타 전송속도를 향상시키기 위한 데이타 압축용 LZW 압축 방법에서, 7비트 ASCⅡ코드용 노드와한글코드용 노드를 딕셔너리 초기에 초기화 시키는 단계와, 입력문자를 읽어 스트링(w)을 취하고, 다음 입력 문자를 읽어 캐릭터 (k)를 취하는 단계와, 상기 스트링(w)과 캐릭터(k)가 딕셔너리 트리에 존재하는 가를 판단하여, 존재하면, 스트링과캐릭터를 새로운 스트링으로 하고, 존재하지 않으면, 스트링 W에 할당한 부호어를 출력하여, 딕셔너리 트리에 대한 새로운 노드를 생성하여 부호어를 할당한 후, 캐릭터(k)을 새로운 스트링으로취하는 단계를 포함하는 LZW를 이용한 데이타 압축방법.
  2. 제1항에 있어서, 상기 7비트 ASCⅡ코드용 노드와 한글 코드용 노드를 딕셔너리 초기에 초기화 시키는 단계에서 7비트 ASCⅡ코드용 노드는 128개이며, 한글 코드용 노드는 2350개인 것을 특징으로 하는 LZW를 이용한 데이타 압축방법.
  3. 제1항 또는 제2항에 있어서, 상기 한글 코드용 노드를 위해 2바이트 한글 코드용 압축 방법을 이용하는 것을 특징으로 하는 LZW를 이용한 데이타 압축방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019940039802A 1994-12-30 1994-12-30 Lzw를 이용한 완성형 한글의 데이타 압축방법 KR0144633B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940039802A KR0144633B1 (ko) 1994-12-30 1994-12-30 Lzw를 이용한 완성형 한글의 데이타 압축방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940039802A KR0144633B1 (ko) 1994-12-30 1994-12-30 Lzw를 이용한 완성형 한글의 데이타 압축방법

Publications (2)

Publication Number Publication Date
KR960025207A true KR960025207A (ko) 1996-07-20
KR0144633B1 KR0144633B1 (ko) 1998-08-17

Family

ID=19405823

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940039802A KR0144633B1 (ko) 1994-12-30 1994-12-30 Lzw를 이용한 완성형 한글의 데이타 압축방법

Country Status (1)

Country Link
KR (1) KR0144633B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100320686B1 (ko) * 1999-12-31 2002-01-19 김기영 한글 데이터의 압축 및 복원방법
KR100755533B1 (ko) * 2005-07-25 2007-09-06 주식회사 팬택 캐릭터 셋 생성 방법 및 그 장치

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100418349B1 (ko) * 2001-09-05 2004-02-11 (주) 한국인프라 데이터 압축 및 복원 방법
KR100453142B1 (ko) 2002-10-17 2004-10-15 주식회사 팬택 이동통신 단말기에서의 사운드 압축 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100320686B1 (ko) * 1999-12-31 2002-01-19 김기영 한글 데이터의 압축 및 복원방법
KR100755533B1 (ko) * 2005-07-25 2007-09-06 주식회사 팬택 캐릭터 셋 생성 방법 및 그 장치

Also Published As

Publication number Publication date
KR0144633B1 (ko) 1998-08-17

Similar Documents

Publication Publication Date Title
Nevill-Manning et al. Compression by induction of hierarchical grammars
EP0294950B1 (en) A method of facilitating computer sorting
US4814746A (en) Data compression method
KR940008494A (ko) 가변길이 부호 디코더
US5585793A (en) Order preserving data translation
KR910013000A (ko) 온라인 문자 인식 장치
JPS59231683A (ja) データ圧縮方法
US5225833A (en) Character encoding
KR960025207A (ko) Lzw를 이용한 완성형 한글의 데이타 압축방법
EP0647034B1 (en) A variable word length code decoding method, and a decoder for performing the same
KR960024895A (ko) 데이타 압축해제 방법, 데이타 압축 방법 및 메모리의 양을 감소시키는 방법
Teahan et al. Preprocessing for PPM: compressing UTF-8 encoded natural language text
JPS6268325A (ja) 文章圧縮・伸展方式
KR970056108A (ko) 조합형 한글의 압축방법
JPH0546357A (ja) テキストデータの圧縮方法および復元方法
Ng et al. Dynamic word based text compression
Ong et al. Compressing Chinese text files using an adaptive Huffman coding scheme and a static dictionary of character pairs
Zipstein Data compression with factor automata
US20040117774A1 (en) Linguistic dictionary and method for production thereof
JP3115066B2 (ja) 辞書検索方法
JP3236747B2 (ja) データ伸長方式
JP2001168727A (ja) 情報処理装置および方法、並びに記録媒体
Revuz et al. DZ A text compression algorithm for natural languages
Ainon Storing text using integer codes
Ong et al. A semi-adaptive arithmetic coding scheme for Chinese textual data

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee