JP6507682B2 - 符号化プログラム、符号化方法および符号化装置 - Google Patents
符号化プログラム、符号化方法および符号化装置 Download PDFInfo
- Publication number
- JP6507682B2 JP6507682B2 JP2015017852A JP2015017852A JP6507682B2 JP 6507682 B2 JP6507682 B2 JP 6507682B2 JP 2015017852 A JP2015017852 A JP 2015017852A JP 2015017852 A JP2015017852 A JP 2015017852A JP 6507682 B2 JP6507682 B2 JP 6507682B2
- Authority
- JP
- Japan
- Prior art keywords
- date
- time
- notation
- code
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/14—Conversion to or from non-weighted codes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
最初に、図1を用いて、実施例1にかかる符号化装置10が実施する日時表記文字列の圧縮処理の概要について説明する。図1は、日時表記文字列の圧縮の流れを概略的に示した図である。図1の例では、符号化装置10が、圧縮処理の対象である対象ファイル1に含まれる「He went out at yesterday 3:00pm」を圧縮する場合を例に説明する。符号化装置10は、対象ファイル1から日付や時刻を表記する日時表記文字列を検索する。ここで、日時表記には、複数の表記形式がある。そこで、例えば、符号化装置10は、様々な表記形式で日時の表記に使用される記号、数値、単語、文字等を検索し、該当箇所の前後の文字列の表記形式を判別して日時表記文字列を検索する。日時の表記に使用される記号としては、例えば、日付の区切り使用される「/」や時刻の区切り使用される「:」などが挙げられる。日時の表記に使用される単語としては、「yesterday」や「tomorrow」、「ago」、「am」、「pm」などが挙げられる。図1の例では、符号化装置10は、「pm」や「yesterday」を検索して、「yesterday」および「3:00pm」の日時表記文字列を検索する。
次に、図2を用いて、実施例1にかかる符号化装置10が実施する日時の検索処理の概要について説明する。図2は、日時検索の流れを概略的に示した図である。図2の例では、符号化装置10のファイル検索部50が検索対象の日付の入力を受け付ける。図2の例では、「2/14」の入力を受け付けている。ファイル検索部50は、入力された日付に対応する単語コードをビットフィルタ30の日時部30Bから取得する。なお、ファイル検索部50は、入力された日付の表記を正規化して単語コードを取得する。例えば、「2/14」を「02/14」と表記を正規化して単語コードを取得する。図2の例では、「2/14」に対応する単語コード「C720E1h」が取得されている。ファイル検索部50は、動的辞書31を参照し、単語コード「C720E1h」をコードに含む圧縮符号を検索する。図2の例では、圧縮符号「A005h」のコード「CA1101C720E1h」が「C720E1h」を含んでいる。このコード「CA1101C720E1h」の「CA1101」部分は、相対日時「yesterday」に対応するコードである。「CA1101C720E1h」の「C720E1」部分は、絶対日時「02/14」に対応するコードである。図2の例では、圧縮符号「A005h」が検索される。ファイル検索部50は、ビットマップインデックス32を参照して、検索された圧縮符号を含むファイルを特定する。図2の例では、圧縮符号「A005h」がインデックスの値が「2」のファイルに含まれると特定される。すなわち、符号化装置10は、相対日時表現で日時が記録されたファイルを絶対日時表現の日時で検索できる。
次に、符号化装置10の構成について説明する。図3は、符号化装置の構成の一例を示す図である。符号化装置10は、対象ファイル1の圧縮などの符号化を行う装置である。符号化装置10は、例えば、パーソナルコンピュータ、サーバコンピュータなどのコンピュータや、タブレット端末、スマートフォンなどの情報処理装置である。符号化装置10は、1台のコンピュータとして実装してもよく、また、複数台のコンピュータによるクラウドとして実装することもできる。なお、本実施例では、符号化装置10を1台のコンピュータとした場合を例として説明する。図3に示すように、符号化装置10は、記憶部20と、制御部21とを有する。なお、符号化装置10は、コンピュータや情報処理装置が有する上記の機器以外の他の機器を有してもよい。
月日表記パターン:3バイト(C7000*h〜C7FFF*h)
時刻表記パターン:4バイト(C80000**h〜C9FFFF**h)
「*」は、日時表記文字列の表記形式により定まる。
本実施例に係る符号化装置10が実行する各種の処理について説明する。最初に、本実施例に係る符号化装置10が対象ファイル1を符号化して圧縮する圧縮処理の流れについて説明する。図10Aおよび図10Bは、圧縮処理の手順の一例を示すフローチャートである。この圧縮処理は、所定のタイミング、例えば、対象ファイル1を指定して圧縮開始を指示する所定操作が行われたタイミングで実行される。
上述してきたように、本実施例に係る符号化装置10は、対象ファイル1から少なくとも日付または時刻を表記する日時表記文字列を検索する。符号化装置10は、日時表記文字列の検索該当に応じて、日時表記文字列を特定の日時表記フォーマットに変換した正規化日時表記および日時表記文字列を識別する識別符号を含む変換日時符号を生成する。符号化装置10は、変換日時符号および日時表記文字列を対応づけたビットフィルタ30に基づき、対象ファイル1を変換し出力する。これにより、符号化装置10は、検索対象のテキストデータに変更を加えることなく、異なる日時表現の文字列をまとめて検索させることができる。
図12は、符号化装置のハードウェア構成を示す図である。図12の例が示すように、コンピュータ400は、各種演算処理を実行するCPU401と、ユーザからのデータ入力を受け付ける入力装置402と、モニタ403とを有する。また、コンピュータ400は、記憶媒体からプログラム等を読み取る媒体読取装置404と、他の装置と接続するためのインターフェース装置405と、他の装置と無線により接続するための無線通信装置406とを有する。また、コンピュータ400は、各種情報を一時記憶するRAM407と、ハードディスク装置408とを有する。また、各装置401〜408は、バス409に接続される。
2 圧縮ファイル
10 符号化装置
20 記憶部
21 制御部
30 ビットフィルタ
30A 単語部
30B 日時部
31 動的辞書
32 ビットマップインデックス
40 圧縮部
41 検索部
42 生成部
43 登録部
44 格納部
45 ファイルライト部
50 ファイル検索部
51 受付部
52 取得部
53 特定部
Claims (7)
- コンピュータに、
入力テキストデータから少なくとも日付または時刻を表記する日時表記文字列を検索し、
日時表記文字列の検索該当に応じて、前記日時表記文字列を特定の日時表記フォーマットに変換した正規化日時表記と、前記日時表記文字列の表記パターンを識別する識別符号とを含む変換日時符号を生成し、
前記変換日時符号および前記日時表記文字列を対応づけた変換情報に基づき、前記入力テキストデータを変換し出力する
処理を実行させることを特徴とする符号化プログラム。 - 前記正規化日時表記は、前記日付または時刻を一意に特定可能に表記される絶対日時表記である
ことを特徴とする請求項1に記載の符号化プログラム。 - 前記正規化日時表記は、基準となる日付または時刻からの相対日時で表記される相対日時表記である
ことを特徴とする請求項1に記載の符号化プログラム。 - 前記生成する処理は、前記正規化日時表記に対応し、日時順の付与されたコードを含む変換日時符号を生成する
ことを特徴とする請求項1に記載の符号化プログラム。 - コンピュータに、
前記入力テキストデータの出現した日時表記文字列に対して動的に圧縮符号を割り当て、日時表記文字列の正規化日時表記に対応付けて当該日時表記文字列の圧縮符号を辞書に登録する処理をさらに実行させ、
前記出力する処理は、前記入力テキストデータの日時表記文字列を前記辞書に登録された当該日時表記文字列の圧縮符号に変換して出力する
ことを特徴とする請求項1〜3の何れか1項に記載の符号化プログラム。 - 入力テキストデータから少なくとも日付または時刻を表記する日時表記文字列を検索し、
日時表記文字列の検索該当に応じて、前記日時表記文字列を特定の日時表記フォーマットに変換した正規化日時表記と、前記日時表記文字列の表記パターンを識別する識別符号とを含む変換日時符号を生成し、
前記変換日時符号および前記日時表記文字列を対応づけた変換情報に基づき、前記入力テキストデータを変換し出力する
処理をコンピュータが実行することを特徴とする符号化方法。 - 入力テキストデータから少なくとも日付または時刻を表記する日時表記文字列を検索する検索部と、
前記検索部により検索された日時表記文字列の検索該当に応じて、前記日時表記文字列を特定の日時表記フォーマットに変換した正規化日時表記と、前記日時表記文字列の表記パターンを識別する識別符号とを含む変換日時符号を生成する生成部と、
前記生成部により生成された前記変換日時符号および前記日時表記文字列を対応づけた変換情報に基づき、前記入力テキストデータを変換し出力する出力部と、
を有することを特徴とする符号化装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015017852A JP6507682B2 (ja) | 2015-01-30 | 2015-01-30 | 符号化プログラム、符号化方法および符号化装置 |
US15/010,735 US9419649B1 (en) | 2015-01-30 | 2016-01-29 | Encoding method and encoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015017852A JP6507682B2 (ja) | 2015-01-30 | 2015-01-30 | 符号化プログラム、符号化方法および符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016143200A JP2016143200A (ja) | 2016-08-08 |
JP6507682B2 true JP6507682B2 (ja) | 2019-05-08 |
Family
ID=56554872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015017852A Active JP6507682B2 (ja) | 2015-01-30 | 2015-01-30 | 符号化プログラム、符号化方法および符号化装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9419649B1 (ja) |
JP (1) | JP6507682B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6737117B2 (ja) * | 2016-10-07 | 2020-08-05 | 富士通株式会社 | 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 |
JP7003433B2 (ja) * | 2017-04-07 | 2022-01-20 | 富士通株式会社 | 変更検出プログラム、変更検出方法および変更検出装置 |
JP7003443B2 (ja) * | 2017-05-16 | 2022-01-20 | 富士通株式会社 | 符号化プログラム、符号化装置および符号化方法 |
CN109241167B (zh) * | 2018-09-18 | 2022-03-25 | 四川爱联科技股份有限公司 | 基于bs架构的表格数据导入方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07244669A (ja) | 1994-03-04 | 1995-09-19 | Mitsubishi Electric Corp | 文書検索方式 |
JP3628160B2 (ja) | 1997-11-06 | 2005-03-09 | 日本電信電話株式会社 | 日時表現正規化装置及び日時表現正規化プログラムを記録した記録媒体 |
JP3597370B2 (ja) * | 1998-03-10 | 2004-12-08 | 富士通株式会社 | 文書処理装置および記録媒体 |
JP2000090093A (ja) * | 1998-09-08 | 2000-03-31 | Hitachi Software Eng Co Ltd | 全文検索方法及び全文検索システム並びに全文検索プログラムを記録した記録媒体 |
JP2002278988A (ja) * | 2001-03-15 | 2002-09-27 | Just Syst Corp | 語句列変換装置、検索装置、語句列変換方法、検索方法、ならびに、記録媒体 |
JP2003050795A (ja) | 2001-08-06 | 2003-02-21 | Hitachi Ltd | 時間情報表示システム |
JP4193549B2 (ja) * | 2003-04-01 | 2008-12-10 | 沖電気工業株式会社 | 日時表現正規化装置と方法 |
JP2010073086A (ja) * | 2008-09-22 | 2010-04-02 | Brother Ind Ltd | コンテンツ出力装置、コンテンツ出力システム、コンテンツ出力方法及びコンテンツ出力プログラム |
JP5204803B2 (ja) * | 2010-05-10 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | データ処理装置、入力支援方法及びプログラム |
JP5648360B2 (ja) * | 2010-08-09 | 2015-01-07 | 富士通株式会社 | 文字列検索装置、文字列検索方法および文字列検索プログラム |
US9535904B2 (en) * | 2014-03-26 | 2017-01-03 | Microsoft Technology Licensing, Llc | Temporal translation grammar for language translation |
-
2015
- 2015-01-30 JP JP2015017852A patent/JP6507682B2/ja active Active
-
2016
- 2016-01-29 US US15/010,735 patent/US9419649B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20160226520A1 (en) | 2016-08-04 |
JP2016143200A (ja) | 2016-08-08 |
US9419649B1 (en) | 2016-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9509334B2 (en) | Non-transitory computer-readable recording medium, compression method, decompression method, compression device and decompression device | |
US20160006456A1 (en) | Compression device, compression method, dictionary generation device, dictionary generation method, decompression device, decompression method, information processing system, and recording medium | |
JP6476647B2 (ja) | 圧縮プログラム、圧縮装置、圧縮方法、伸長プログラム、伸長装置および伸長方法 | |
JP6507682B2 (ja) | 符号化プログラム、符号化方法および符号化装置 | |
JP2016110587A (ja) | 圧縮プログラムおよび検索プログラム | |
US10872060B2 (en) | Search method and search apparatus | |
US20220277139A1 (en) | Computer-readable recording medium, encoding device, index generating device, search device, encoding method, index generating method, and search method | |
CN112199951A (zh) | 一种事件信息生成的方法及装置 | |
US20170017619A1 (en) | Encoding method and information processing device | |
EP3236368A1 (en) | Encoding processing program, encoding processing device, encoding processing method, decoding processing program, decoding processing device, and decoding processing method | |
JP6805720B2 (ja) | データ検索プログラム、データ検索装置およびデータ検索方法 | |
US9219497B2 (en) | Compression device, compression method, and recording medium | |
US10942934B2 (en) | Non-transitory computer-readable recording medium, encoded data searching method, and encoded data searching apparatus | |
EP3404839A1 (en) | Encoding program, encoding device, and encoding method | |
JP2016018279A (ja) | 文書ファイル検索プログラム、文書ファイル検索装置、文書ファイル検索方法、文書情報出力プログラム、文書情報出力装置及び文書情報出力方法 | |
JP2019121166A (ja) | インデックス生成プログラム、インデックス生成装置およびインデックス生成方法 | |
JP2018182466A (ja) | 符号化プログラム、符号化方法および符号化装置 | |
JP2019121861A (ja) | 符号化プログラム、動的辞書の生成プログラム、符号化方法、動的辞書の生成方法、符号化装置および復号化装置 | |
US10318483B2 (en) | Control method and control device | |
JP6512294B2 (ja) | 圧縮プログラム、圧縮方法および圧縮装置 | |
JP6361472B2 (ja) | 対応情報生成プログラム、対応情報生成装置及び対応情報生成方法 | |
JP7200474B2 (ja) | 変換補助装置、変換補助システム、変換補助方法及びコンピュータプログラム | |
JP2006040058A (ja) | 文書分類装置 | |
JPH01286020A (ja) | プログラム検索方式 | |
JP4061283B2 (ja) | 字句をデータに変換する装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6507682 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |