KR960025207A - Lzw를 이용한 완성형 한글의 데이타 압축방법 - Google Patents
Lzw를 이용한 완성형 한글의 데이타 압축방법 Download PDFInfo
- Publication number
- KR960025207A KR960025207A KR1019940039802A KR19940039802A KR960025207A KR 960025207 A KR960025207 A KR 960025207A KR 1019940039802 A KR1019940039802 A KR 1019940039802A KR 19940039802 A KR19940039802 A KR 19940039802A KR 960025207 A KR960025207 A KR 960025207A
- Authority
- KR
- South Korea
- Prior art keywords
- lzw
- compression method
- string
- data compression
- character
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
- H03M7/3088—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing the use of a dictionary, e.g. LZ78
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
- H03M7/4031—Fixed length to variable length coding
- H03M7/4037—Prefix coding
- H03M7/4043—Adaptive prefix coding
- H03M7/4062—Coding table adaptation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6011—Encoder aspects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
LZW를 이용한 데이타 압축 방식에서, 일반적으로 사용되는 1바이트 영문전용 압축방식을 변형하여, 2바이트 한글에 대하여도 높은 데이타 압축률을 가질 수 있도록 LZW 압축 알고리즘에 사용되는 딕셔너리 트리(dictionary tree)와 내부 테이블을 재구성하여 압축률을 증가 시킨다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 LZW를 이용한 데이타 압축방법의 흐름선도, 제2도의 a는 종래의 LZW를 이용한 데이타 압축방법의 기본 알고리즘의 초기 내부 테이블 구조 도해도, 제2도의 b는 본 발명의 LZW를 이용한 데이타 압축방법의 한글인식 알고리즘의 초기 내부 테이블 구조 도해도.
Claims (3)
- 데이타 전송속도를 향상시키기 위한 데이타 압축용 LZW 압축 방법에서, 7비트 ASCⅡ코드용 노드와한글코드용 노드를 딕셔너리 초기에 초기화 시키는 단계와, 입력문자를 읽어 스트링(w)을 취하고, 다음 입력 문자를 읽어 캐릭터 (k)를 취하는 단계와, 상기 스트링(w)과 캐릭터(k)가 딕셔너리 트리에 존재하는 가를 판단하여, 존재하면, 스트링과캐릭터를 새로운 스트링으로 하고, 존재하지 않으면, 스트링 W에 할당한 부호어를 출력하여, 딕셔너리 트리에 대한 새로운 노드를 생성하여 부호어를 할당한 후, 캐릭터(k)을 새로운 스트링으로취하는 단계를 포함하는 LZW를 이용한 데이타 압축방법.
- 제1항에 있어서, 상기 7비트 ASCⅡ코드용 노드와 한글 코드용 노드를 딕셔너리 초기에 초기화 시키는 단계에서 7비트 ASCⅡ코드용 노드는 128개이며, 한글 코드용 노드는 2350개인 것을 특징으로 하는 LZW를 이용한 데이타 압축방법.
- 제1항 또는 제2항에 있어서, 상기 한글 코드용 노드를 위해 2바이트 한글 코드용 압축 방법을 이용하는 것을 특징으로 하는 LZW를 이용한 데이타 압축방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940039802A KR0144633B1 (ko) | 1994-12-30 | 1994-12-30 | Lzw를 이용한 완성형 한글의 데이타 압축방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940039802A KR0144633B1 (ko) | 1994-12-30 | 1994-12-30 | Lzw를 이용한 완성형 한글의 데이타 압축방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR960025207A true KR960025207A (ko) | 1996-07-20 |
KR0144633B1 KR0144633B1 (ko) | 1998-08-17 |
Family
ID=19405823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019940039802A KR0144633B1 (ko) | 1994-12-30 | 1994-12-30 | Lzw를 이용한 완성형 한글의 데이타 압축방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR0144633B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100320686B1 (ko) * | 1999-12-31 | 2002-01-19 | 김기영 | 한글 데이터의 압축 및 복원방법 |
KR100755533B1 (ko) * | 2005-07-25 | 2007-09-06 | 주식회사 팬택 | 캐릭터 셋 생성 방법 및 그 장치 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100418349B1 (ko) * | 2001-09-05 | 2004-02-11 | (주) 한국인프라 | 데이터 압축 및 복원 방법 |
KR100453142B1 (ko) | 2002-10-17 | 2004-10-15 | 주식회사 팬택 | 이동통신 단말기에서의 사운드 압축 방법 |
-
1994
- 1994-12-30 KR KR1019940039802A patent/KR0144633B1/ko not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100320686B1 (ko) * | 1999-12-31 | 2002-01-19 | 김기영 | 한글 데이터의 압축 및 복원방법 |
KR100755533B1 (ko) * | 2005-07-25 | 2007-09-06 | 주식회사 팬택 | 캐릭터 셋 생성 방법 및 그 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR0144633B1 (ko) | 1998-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nevill-Manning et al. | Compression by induction of hierarchical grammars | |
EP0294950B1 (en) | A method of facilitating computer sorting | |
US4814746A (en) | Data compression method | |
KR940008494A (ko) | 가변길이 부호 디코더 | |
US5585793A (en) | Order preserving data translation | |
KR910013000A (ko) | 온라인 문자 인식 장치 | |
JPS59231683A (ja) | データ圧縮方法 | |
US5225833A (en) | Character encoding | |
KR960025207A (ko) | Lzw를 이용한 완성형 한글의 데이타 압축방법 | |
EP0647034B1 (en) | A variable word length code decoding method, and a decoder for performing the same | |
KR960024895A (ko) | 데이타 압축해제 방법, 데이타 압축 방법 및 메모리의 양을 감소시키는 방법 | |
Teahan et al. | Preprocessing for PPM: compressing UTF-8 encoded natural language text | |
JPS6268325A (ja) | 文章圧縮・伸展方式 | |
KR970056108A (ko) | 조합형 한글의 압축방법 | |
JPH0546357A (ja) | テキストデータの圧縮方法および復元方法 | |
Ng et al. | Dynamic word based text compression | |
Ong et al. | Compressing Chinese text files using an adaptive Huffman coding scheme and a static dictionary of character pairs | |
Zipstein | Data compression with factor automata | |
US20040117774A1 (en) | Linguistic dictionary and method for production thereof | |
JP3115066B2 (ja) | 辞書検索方法 | |
JP3236747B2 (ja) | データ伸長方式 | |
JP2001168727A (ja) | 情報処理装置および方法、並びに記録媒体 | |
Revuz et al. | DZ A text compression algorithm for natural languages | |
Ainon | Storing text using integer codes | |
Ong et al. | A semi-adaptive arithmetic coding scheme for Chinese textual data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |