JP6531398B2 - プログラム - Google Patents
プログラム Download PDFInfo
- Publication number
- JP6531398B2 JP6531398B2 JP2015008076A JP2015008076A JP6531398B2 JP 6531398 B2 JP6531398 B2 JP 6531398B2 JP 2015008076 A JP2015008076 A JP 2015008076A JP 2015008076 A JP2015008076 A JP 2015008076A JP 6531398 B2 JP6531398 B2 JP 6531398B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character code
- unit
- string
- compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/146—Coding or compression of tree-structured data
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M5/00—Conversion of the form of the representation of individual digits
- H03M5/02—Conversion to or from representation by pulses
- H03M5/04—Conversion to or from representation by pulses the pulses having two levels
- H03M5/14—Code representation, e.g. transition, for a given bit cell depending on the information in one or more adjacent bit cells, e.g. delay modulation code, double density code
- H03M5/145—Conversion to or from block codes or representations thereof
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
ことを目的とする。1つの側面では、伸長処理および文字コード変換処理の処理時間を短縮することを目的とする。
また、上述の圧縮処理の対象となるデータは、上述の通り、CJK文字のみに限定されるものでない。CJK文字と英数字とが混ざったデータであってもよいし、画像・音声などのデータに対して上述の圧縮処理を用いてもよい。
第1の文字コードによる文字データ列が、一または複数の文字を含む文字列の単位で圧縮符号化された圧縮ファイルを入力し、
前記圧縮ファイルに含まれ、前記文字データ列の圧縮符号化の単位それぞれに関連づけられた圧縮情報それぞれを、当該圧縮符号化の単位の前記第1の文字コード表記に対応する情報から、当該圧縮符号化の単位の第2の文字コード表記に対応する情報にそれぞれ変換し、
前記圧縮符号化された前記文字データ列の圧縮符号化の単位それぞれ、および、前記変換された前記文字データ列の圧縮符号化の単位それぞれに関連づけられた圧縮情報それぞれから、変換圧縮ファイルを生成する、
処理を行わせることを特徴とするプログラム。
前記第1の文字コードによる文字データ列の圧縮符号化の単位に関連づけられた圧縮情報の識別子が第1識別子であるか第2識別子であるかを判定し、
前記圧縮情報の識別子が第1識別子である場合には、前記圧縮情報から得られる前記第1の文字コード表記に対応する文字データ列への位置を特定し、前記第1の文字コード表記の文字データ列を記憶する第1文字コード表を前記第2の文字コード表記の文字データ列を記憶する第2文字コード表に置換した文字コード表と前記特定した位置とを基にして、前記圧縮情報を前記第1の文字コード表記に対応する情報から前記第2の文字コード表記に対応する情報に変換する
処理を実行させることを特徴とする付記1に記載のプログラム。
前記圧縮ファイルに含まれ、前記文字データ列の圧縮符号化の単位それぞれに関連づけられた圧縮情報それぞれを、当該圧縮符号化の単位の前記第1の文字コード表記に対応する情報から、当該圧縮符号化の単位の第2の文字コード表記に対応する情報にそれぞれ変換する変換部と、
前記圧縮符号化された前記文字データ列の圧縮符号化の単位それぞれ、および、前記変換された前記文字データ列の圧縮符号化の単位それぞれに関連づけられた圧縮情報それぞれから、変換圧縮ファイルを生成する生成部と、
を有することを特徴とする装置。
前記第1の文字コードによる文字データ列の圧縮符号化の単位に関連づけられた圧縮情報の識別子が第1識別子であるか第2識別子であるかを判定する判定部を含み、
前記判定部によって前記圧縮情報の識別子が第1識別子であると判定された場合には、前記圧縮情報から得られる前記第1の文字コード表記に対応する文字データ列への位置を特定し、前記第1の文字コード表記の文字データ列を記憶する第1文字コード表を前記第2の文字コード表記の文字データ列を記憶する第2文字コード表に置換した文字コード表と前記特定した位置とを基にして、前記圧縮情報を前記第1の文字コード表記に対応する情報から前記第2の文字コード表記に対応する情報に変換する
ことを特徴とする付記4に記載の装置。
第1の文字コードによる文字データ列が、一または複数の文字を含む文字列の単位で圧縮符号化された圧縮ファイルを入力し、
前記圧縮ファイルに含まれ、前記文字データ列の圧縮符号化の単位それぞれに関連づけられた圧縮情報それぞれを、当該圧縮符号化の単位の前記第1の文字コード表記に対応する情報から、当該圧縮符号化の単位の第2の文字コード表記に対応する情報にそれぞれ変換し、
前記圧縮符号化された前記文字データ列の圧縮符号化の単位それぞれ、および、前記変換された前記文字データ列の圧縮符号化の単位それぞれに関連づけられた圧縮情報それぞれから、変換圧縮ファイルを生成する、
処理を実行することを特徴とする変換方法。
前記第1の文字コードによる文字データ列の圧縮符号化の単位に関連づけられた圧縮情報の識別子が第1識別子であるか第2識別子であるかを判定し、
前記圧縮情報の識別子が第1識別子である場合には、前記圧縮情報から得られる前記第1の文字コード表記に対応する文字データ列への位置を特定し、前記第1の文字コード表記の文字データ列を記憶する第1文字コード表を前記第2の文字コード表記の文字データ列を記憶する第2文字コード表に置換した文字コード表と前記特定した位置とを基にして、前記圧縮情報を前記第1の文字コード表記に対応する情報から前記第2の文字コード表記に対応する情報に変換する
処理を実行することを特徴とする付記6に記載の変換方法。
文字のデータ列および該文字のデータ列に対応する圧縮符号を対応付けた第1辞書と、圧縮対象の文字のデータ列とを基にして、圧縮対象の文字のデータ列が前記第1辞書に登録されているか否かを判定し、
前記圧縮対象の文字のデータ列が前記第1辞書に登録されている場合には、前記第1辞書に登録された前記圧縮対象の文字のデータ列に対応する圧縮符号に、前記圧縮対象の文字のデータ列を圧縮し、
前記圧縮対象の文字のデータ列が前記第1辞書に登録されていない場合には、前記圧縮対象の文字のデータ列を第2辞書に登録し、登録位置に基づく情報に、前記圧縮対象の文字のデータ列を圧縮する
処理を実行させることを特徴とする圧縮プログラム。
前記圧縮対象の文字のデータ列が前記第1辞書に登録されている場合には、前記第1辞書に登録された前記圧縮対象の文字のデータ列に対応する圧縮符号に、前記圧縮対象の文字のデータ列を圧縮する第1圧縮部と、
前記圧縮対象の文字のデータ列が前記第1辞書に登録されていない場合には、前記圧縮対象の文字のデータ列を第2辞書に登録し、登録位置に基づく情報に、前記圧縮対象の文字のデータ列を圧縮する第2圧縮部と、
を有することを特徴とする圧縮装置。
100a 圧縮部
100b 伸長部
100c 記憶部
200 文字コードテーブル
Claims (3)
- コンピュータに、
第1の文字コードによる文字データ列が、一または複数の文字を含む文字列の単位で圧縮符号化された圧縮ファイルを入力し、
前記圧縮ファイルに含まれ、前記文字データ列の圧縮符号化の単位それぞれに関連づけられた圧縮情報それぞれを、当該圧縮符号化の単位の前記第1の文字コード表記に対応する伸長文字コード列から、当該圧縮符号化の単位の第2の文字コード表記に対応する伸長文字コード列にそれぞれ変換し、
前記圧縮符号化された前記文字データ列の圧縮符号化の単位それぞれ、および、前記変換された前記文字データ列の圧縮符号化の単位それぞれに関連づけられた圧縮情報それぞれから、変換圧縮ファイルを生成する、
処理を行わせることを特徴とするプログラム。 - 前記変換する処理は、
前記第1の文字コードによる文字データ列の圧縮符号化の単位に関連づけられた圧縮情報の識別子が第1識別子であるか第2識別子であるかを判定し、
前記圧縮情報の識別子が第1識別子である場合には、前記圧縮情報から得られる前記第1の文字コード表記に対応する文字データ列への位置を特定し、前記第1の文字コード表記の文字データ列を記憶する第1文字コード表を前記第2の文字コード表記の文字データ列を記憶する第2文字コード表に置換した文字コード表と前記特定した位置とを基にして、前記圧縮情報を前記第1の文字コード表記に対応する情報から前記第2の文字コード表記に対応する情報に変換することを特徴とする請求項1に記載のプログラム。 - 前記圧縮情報の識別子が第2識別子である場合には、前記圧縮情報に含まれる登録位置に基づく情報に示される位置の情報を基にして、前記圧縮情報を前記第1の文字コード表記に対応する情報から前記第2の文字コード表記に対応する情報に変換することを特徴とする請求項2に記載のプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015008076A JP6531398B2 (ja) | 2015-01-19 | 2015-01-19 | プログラム |
CN201610017815.XA CN105808513B (zh) | 2015-01-19 | 2016-01-12 | 转换装置和转换方法 |
US14/995,711 US9425821B2 (en) | 2015-01-19 | 2016-01-14 | Converting device and converting method |
KR1020160004816A KR101748982B1 (ko) | 2015-01-19 | 2016-01-14 | 매체에 저장된 프로그램 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015008076A JP6531398B2 (ja) | 2015-01-19 | 2015-01-19 | プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016134751A JP2016134751A (ja) | 2016-07-25 |
JP6531398B2 true JP6531398B2 (ja) | 2019-06-19 |
Family
ID=56408599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015008076A Active JP6531398B2 (ja) | 2015-01-19 | 2015-01-19 | プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9425821B2 (ja) |
JP (1) | JP6531398B2 (ja) |
KR (1) | KR101748982B1 (ja) |
CN (1) | CN105808513B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017017738A1 (ja) * | 2015-07-24 | 2017-02-02 | 富士通株式会社 | 符号化プログラム、符号化装置、及び符号化方法 |
JP2017135613A (ja) * | 2016-01-28 | 2017-08-03 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
JP6686639B2 (ja) * | 2016-03-31 | 2020-04-22 | 富士通株式会社 | 符号化プログラム、符号化装置、符号化方法、復号化プログラム、復号化装置および復号化方法 |
CN106850141A (zh) * | 2017-01-20 | 2017-06-13 | 济南浪潮高新科技投资发展有限公司 | 一种使用deflate算法的物理信息***数据无损压缩传输方法 |
CN106897259A (zh) * | 2017-02-28 | 2017-06-27 | 郑州云海信息技术有限公司 | 一种基于windows平台的ascii码和字符串的转换方法 |
JP7210130B2 (ja) | 2017-04-07 | 2023-01-23 | 富士通株式会社 | 符号化プログラム、符号化方法および符号化装置 |
CN110110299B (zh) * | 2019-04-28 | 2023-04-07 | 腾讯科技(上海)有限公司 | 文本变换方法、装置以及服务器 |
US11502705B2 (en) * | 2019-06-21 | 2022-11-15 | Sap Se | Advanced database decompression |
CN113138968A (zh) * | 2020-01-20 | 2021-07-20 | 普天信息技术有限公司 | 日志压缩方法及日志解压缩方法 |
US20210105466A1 (en) * | 2020-12-18 | 2021-04-08 | Intel Corporation | Offloading video coding processes to hardware for better density-quality tradeoffs |
CN113162628B (zh) * | 2021-04-26 | 2022-03-18 | 深圳希施玛数据科技有限公司 | 一种数据编码方法、数据解码方法、终端和存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63127328A (ja) | 1986-11-18 | 1988-05-31 | Mitsubishi Electric Corp | コ−ド変換装置 |
JP2612343B2 (ja) * | 1989-08-09 | 1997-05-21 | 富士通株式会社 | データ圧縮方式 |
JPH03157021A (ja) * | 1989-11-15 | 1991-07-05 | Hitachi Ltd | データ圧縮制御方式 |
US5442350A (en) * | 1992-10-29 | 1995-08-15 | International Business Machines Corporation | Method and means providing static dictionary structures for compressing character data and expanding compressed data |
WO1997010556A1 (en) * | 1995-09-13 | 1997-03-20 | Apple Computer, Inc. | Unicode converter |
JP3566441B2 (ja) | 1996-01-30 | 2004-09-15 | シャープ株式会社 | テキスト圧縮用辞書作成装置 |
JP3277792B2 (ja) | 1996-01-31 | 2002-04-22 | 株式会社日立製作所 | データ圧縮方法および装置 |
JPH10326273A (ja) * | 1997-03-26 | 1998-12-08 | Fujitsu Ltd | データ圧縮装置及びデータ復元装置及びデータ圧縮方法及びデータ復元方法及びプログラム記録媒体 |
JP2000269822A (ja) * | 1999-03-12 | 2000-09-29 | Fujitsu Ltd | データ圧縮装置、及びデータ復元装置 |
US6606040B2 (en) * | 2001-02-13 | 2003-08-12 | Mosaid Technologies, Inc. | Method and apparatus for adaptive data compression |
JP3832807B2 (ja) | 2001-06-28 | 2006-10-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ処理方法及びその手法を用いたエンコーダ、デコーダ並びにxmlパーサ |
JP4446102B2 (ja) * | 2006-04-12 | 2010-04-07 | 株式会社エクサ | データ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラム |
US8125364B2 (en) | 2007-08-13 | 2012-02-28 | Nec Corporation | Data compression/decompression method |
-
2015
- 2015-01-19 JP JP2015008076A patent/JP6531398B2/ja active Active
-
2016
- 2016-01-12 CN CN201610017815.XA patent/CN105808513B/zh active Active
- 2016-01-14 US US14/995,711 patent/US9425821B2/en active Active
- 2016-01-14 KR KR1020160004816A patent/KR101748982B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
JP2016134751A (ja) | 2016-07-25 |
CN105808513B (zh) | 2019-01-01 |
US20160211863A1 (en) | 2016-07-21 |
KR101748982B1 (ko) | 2017-06-19 |
CN105808513A (zh) | 2016-07-27 |
KR20160089279A (ko) | 2016-07-27 |
US9425821B2 (en) | 2016-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6531398B2 (ja) | プログラム | |
JP6742692B2 (ja) | 符号化プログラムおよび伸長プログラム | |
JP6641857B2 (ja) | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置 | |
US10360183B2 (en) | Encoding device, encoding method, decoding device, decoding method, and computer-readable recording medium | |
JP6686639B2 (ja) | 符号化プログラム、符号化装置、符号化方法、復号化プログラム、復号化装置および復号化方法 | |
JP6540308B2 (ja) | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置 | |
JP6834327B2 (ja) | 符号化プログラム、符号化装置および符号化方法 | |
US11055328B2 (en) | Non-transitory computer readable medium, encode device, and encode method | |
JP6032292B2 (ja) | 圧縮プログラム、圧縮装置、伸張プログラムおよび伸張装置 | |
US9479195B2 (en) | Non-transitory computer-readable recording medium, compression method, decompression method, compression device, and decompression device | |
WO2014030189A1 (ja) | 圧縮プログラム、圧縮方法、圧縮装置、伸張プログラム、伸張方法、伸張装置およびデータ転送システム | |
WO2014030180A1 (ja) | 格納プログラム、格納方法、格納装置、伸張プログラム、伸張方法及び伸張装置 | |
JP6032291B2 (ja) | 圧縮プログラム、圧縮装置、伸張プログラム、伸張装置およびシステム | |
JP6135788B2 (ja) | 圧縮プログラム、圧縮方法、圧縮装置、伸張プログラム、伸張方法、伸張装置およびデータ転送システム | |
JP2016134754A (ja) | 変換処理プログラム、情報処理装置および変換処理方法 | |
JP2017195628A (ja) | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法及び復号化装置 | |
JP2016171589A (ja) | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法及び復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180911 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190506 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6531398 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |