JP5288617B2 - 文書管理システム、文書管理方法及びコンピュータプログラム - Google Patents
文書管理システム、文書管理方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP5288617B2 JP5288617B2 JP2009117572A JP2009117572A JP5288617B2 JP 5288617 B2 JP5288617 B2 JP 5288617B2 JP 2009117572 A JP2009117572 A JP 2009117572A JP 2009117572 A JP2009117572 A JP 2009117572A JP 5288617 B2 JP5288617 B2 JP 5288617B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- divided
- registered
- color information
- document data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
図1は、本実施形態における文書管理システムの構成図である。この文書管理システム1は、コンピュータ本体10と、ハードディスク等の外部記憶装置20と、キーボード等から成る入力装置30と、例えばOCRやUSBメモリ等からの読取機構等から成る文書データ取込装置40と、液晶ディスプレイ等の表示装置50とを備えて構成される。
[入出力制御部]
入出力(I/O)制御部11は、入力装置30からの処理の指示や検索語等の入力の受付、文書データ取込装置40からの文書データの取込、表示装置50への処理内容又は処理結果の出力、外部記憶装置20へのデータ登録及びその読み出しを制御する。
キーワード管理部12は、対象となる文書データ中に出現するキーワードとそのキーワードを色によって強調表示させるための色情報とを関連付けてキーワードテーブル21に登録する。この処理は、ユーザから1つ以上のキーワードとそのキーワードを着色するための色情報とを受け付けることにより行う。受け付けたキーワード毎に、「01」、「02」・・・のような連続番号でキーワードIDを割り当て、受け付けた色情報をキーワードIDと関連付けて登録する。
このようにして登録されたキーワードテーブル21の登録例を図2に示す。図2の例では、キーワードID「01」で識別されるキーワード「認識」については「赤」で着色表示することを表している。同様に、キーワードID「02」で識別されるキーワード「画像」については「黄」、キーワードID「03」で識別されるキーワード「障害」については「緑」、キーワードID「04」で識別されるキーワード「センサ」については「紫」で着色表示することを表している。
類義語管理部13は、キーワードテーブル21に登録された全キーワードを対象として、それぞれ類義語辞書26の検索により類義語を取得し、取得した類義語毎に、検索元キーワードのキーワードIDとの組にして、類義語テーブル22に登録する。
類義語テーブル22の登録例を図3に示す。図3の例では、キーワードID「01」つまり検索元キーワードが「認識」であり、類義語辞書26から「識別」及び「特定」という類義語が検索により得られたため、キーワードID「01」と類義語「識別」、及びキーワードID「01」と類義語「特定」を類義語テーブル22に登録されている。
同様に、検索元キーワードが「画像」であり、類義語辞書26から「イメージ」、「静止画」、「フレーム」という類義語が検索により得られたため、それぞれ、検索元キーワード「画像」のキーワードID「02」との組として類義語テーブル22に登録されている。他の検索元キーワードについても同様の手順で類義語テーブル22に類義語が登録される。
文書管理部14は、文書データの取込、分割、編集、保存及び読み出しを行う。
すなわち、文書データを文書データ取込装置40より取り込み、文書IDと共に、文書DB25に格納する。取り込んだ文書データを、便宜上「元文書データ」と称する。文書IDには、通し番号を用いる。
例えば文書ID「001」で識別される文書データが、図4のようなものであったとすると、文書分割部14で分割された分割文書データについての分割文書テーブルの内容は、図5のようになる。図5の例では、文書ID「001」の文書データから分割した分割文書データに分割ID「1」、「2」・・・が割り当てられ、文書ID及び各分割IDの組で識別される領域に、分割文書データの内容が関連付けられて記憶されている。
スペクトル管理部15は、分割文書データ毎に、キーワードが存在するかどうかを所定の順序(例えばキーワード登録順)で調べる。具体的には、図6に示す手順で、スペクトル表示パターンを出力し、スペクトルテーブル24に登録する。
すなわち、全分割文書データを対象として、それぞれ、キーワードテーブル21に登録されたキーワードが存在するかどうかを調べる(ステップS101)。キーワードが存在する場合(ステップS101:Yes)、あるいはキーワードは存在しないが、当該キーワードのキーワードIDに対する類義語が類義語テーブル22に存在する場合(ステップS101:No、S102:Yes)は、キーワードテーブル21においてそのキーワードIDに関連付けられた色情報を出力する(ステップS103)。
一方、キーワードも類義語も存在しない場合(ステップS101:No、S102:No)は、未使用色を出力する(ステップS104)。未使用色は、キーワードテーブル21において指定しない色であればどのような色であっても良いが、本例では説明の都合上、「黒」とした。すべての分割文書データにおいてキーワードが残存する場合はステップS101の処理に戻り(ステップS105:No)、全キーワードの探索が終了した時点で処理を終える(ステップS105:Yes)。
同じ元文書データで分割IDが2の分割文書データ(段落0015)についても、最初に、登録されたキーワード「認識」411が出現し、次いで、2番目に登録されたキーワード「画像」415も出現するが、その他のキーワードは存在しないので、出力される色はいずれも「黒」となる。
なお、キーワードに代えて類義語を用いた場合、本例のようにキーワードとその類義語のスペクトル表示パターンにおける位置を同じとしても良いが、両者を区別しても良い。
表示制御部16は、文書データ(元文書データ及び分割文書データ)とスペクトル表示パターンを表示装置50に表示させるための制御を行う。具体的には、キーワードテーブル21に登録されたキーワード、スペクトルテーブル24に登録されたスペクトル表示パターン、文書DB25に格納された文書データを取得し、指定したキーワードの強調表示に加え、文書データ、及び、その文書データにおけるスペクトル表示パターンを1つの組として、1又は複数の文書データを表示装置50に並列に表示できるようにする。
スペクトル評価部17は、キーワードテーブル21に登録されているキーワードの類義語を並べたスペクトル表示パターンと、各分割文書データのスペクトルテーブル24のスペクトル表示パターンとの距離を算出し、各分割文書データ毎に最も距離が短いスペクトル表示パターンを与える分割文書データの分割IDを特定する。
距離尺度の例としては、例えば、等しい文字数を持つ二つの文字列に対して、対応する位置にある文字同士が、異なった場合の個数を距離として与えるハミング距離を用いても良い。図2を例にとると、赤黄緑紫青のスペクトル表示パターンとの距離が最も短いスペクトル表示パターンを与える分割文書の分割IDを特定する。特定された分割IDは、対応するスペクトル表示位置と共に表示制御部17に伝達される。
なお、指定キーワードに最も類似したスペクトル位置をユーザに通知する形態を採用しても良い。
次に、本実施形態における文書管理システム1の動作を説明する。
ここでは、表示装置50に、二つの特許文献を同時に表示させ、一方の特許文献(第1文書データ)の記述内容に類似する内容が記述された他方の特許文献(第2文書データ)の領域を表示装置50上で強調表示させることにより、特許文献間の関連度を視覚的に把握できるようにしたインタフェースの例を示す。
図9は、この場合に文書管理システム1が実行する処理の手順説明図、図10は、表示装置50における画面表示例である。
「特許文献1,2をそれぞれの分割文書データの相対位置情報と共に並列に並べる」とは、図10の例では、第1文書領域520の隣の領域を、特許文献1の1つの分割文書データについて1列となるスペクトル表示パターンを分割文書データの数だけ表示するための第1スペクトル領域530とし、その隣を第2文書領域540とし、さらにその隣を、特許文献2について1つの分割文書データについて1列となるスペクトル表示パターンを分割文書データの数だけ表示するための表示するための第2スペクトル領域550として並べることをいう。第1スペクトル領域530にはスペクトル表示パターンのエレメント531〜535が形成されており、第2スペクトル領域550にも同じ数のエレメント551〜555が形成されている。
キーワードの強調表示は、例えばHTML文書であればフォントの属性値で色情報を指定することにより、着色することにより行う。他方、分割領域の相対位置情報の強調表示は、例えば図10において矩形線で区切られた位置536,556が特定できるように他の色で着色したり、あるいはカーソルを重畳表示することにより行う。
そのため、特許文献1、2の関係の対比を、視覚的に、迅速に把握することができるため、文献対比に要する時間を著しく短縮化することできる。
本実施形態の文書管理システム1は、また、指定したキーワードが対比先の文書データに存在しない場合は、類義語辞書26を用いた類義語展開を行うようにしたので、指定キーワードに対応した意味区間の所在を容易に把握することもできるようになる。
以上の説明では、第1文書データ及び第2文書データの双方を分割して、スペクトル領域も文書データ数にあわせて2つ形成した場合の例について説明したが、分割は第2文書データのみについて行うようにしても良い。
また、図9の説明では、キーワード群及び固有の色情報をキーワードテーブル21に登録した後に、文書データを分割するようにしたが、この処理は、逆であっても良い。
また、本実施形態では、スペクトル表示パターンを5つの色の組み合わせで説明したが、これは指定されたキーワードを5つにしたためなので、色の組み合わせ数は、キーワードの数に応じて任意に変更が可能なものである。
また、以上の説明では、各キーワードの入力領域511〜515に対する表示色を予め定められたものとしたが、利用者が表示色を画面上で設定するようにしても良い。
さらに、指定したキーワードに対する類義語についても、利用者が画面上で設定できるようにし、指定した類義語だけが強調表示されるようにしても良い。
Claims (5)
- 所定順に並ぶ複数のキーワード及び各キーワードに関連付けられた色情報の入力を受け付け、受け付けたキーワード毎に、当該キーワードを識別するためのキーワードIDと前記色情報とを関連付けて第1テーブルに登録するキーワード管理手段と、
指定された文書データを所定領域毎に分割するとともに、各分割領域中に、前記第1テーブルに登録されたキーワードが存在するかどうかをサーチし、存在する場合は当該キーワードについて前記第1テーブルに登録されている色情報、存在しない場合は未登録の色情報を前記所定順に並べたスペクトルパターンを分割領域毎に生成し、生成したスペクトルパターンを、当該分割領域を識別するための分割IDと関連付けて第2テーブルに登録するスペクトル管理手段と、
前記文書データを所定の表示装置に表示する際に、当該文書データのうち前記第1テーブルに登録されたキーワードを当該キーワードに固有となる色情報で強調表示するとともに、前記第2テーブルに前記分割IDと関連付けて登録されているスペクトルパターンを、当該分割IDにより識別される分割領域の相対位置情報と共に表示させる制御手段と、
を備えて成る、文書管理システム。 - 前記第1テーブルに登録されたキーワードの類義語を当該キーワードについてのキーワードIDと関連付けて第3テーブルに登録する類義語管理手段をさらに備えており、
前記スペクトル管理手段は、
前記第1テーブルに登録されたキーワードは存在しないが前記第3テーブルに当該キーワードのキーワードIDに関連付けられた類義語が存在する分割領域のスペクトルパターンを当該キーワードに固有の色情報に基づいて作成する、
請求項1記載の文書管理システム。 - 前記第1テーブルに登録された各色情報のパターンと、前記第2テーブルに登録されているすべてのスペクトルパターンとの類似度を判別し、最も類似度の高いスペクトルパターンに関連付けられている分割IDの分割領域を特定する類似領域検索手段をさらに備えてなる、
請求項2記載の文書管理システム。 - 表示装置に接続される文書管理システムが実行する方法であって、
前記表示装置に、第1文書データ及び第2文書データを表示させる段階と、
表示された第1文書データの記述内容を特徴付けるために所定順に並べられた複数のキーワード及び各キーワードに関連付けられた色情報の入力を受け付け、受け付けたキーワード毎に、当該キーワードを識別するためのキーワードIDと前記色情報とを関連付けて第1テーブルに登録する段階と、
前記第2文書データを所定領域毎に分割するとともに、各分割領域中に、前記第1テーブルに登録されたキーワードが存在するかどうかをサーチし、存在する場合は当該キーワードについて前記第1テーブルに登録されている色情報、存在しない場合は未登録の色情報を前記所定順に並べたスペクトルパターンを分割領域毎に生成し、生成したスペクトルパターンを、当該分割領域を識別するための分割IDと関連付けて第2テーブルに登録する段階と、
前記第1テーブルに登録された各色情報のパターンと、前記第2テーブルに登録されているすべてのスペクトルパターンとの類似度を判別し、最も類似度の高いスペクトルパターンに関連付けられている分割IDの分割領域を特定する段階と、
特定した分割領域の文書データのうち前記第1テーブルに登録されたキーワードを当該キーワードに固有となる色情報で強調表示するとともに、前記第2テーブルに前記分割IDと関連付けて登録されているスペクトルパターンを、当該分割IDにより識別される分割領域の相対位置情報と共に前記表示装置に表示させる段階とを有する、
スペクトルパターンによる文書管理方法。 - 第1テーブル及び第2テーブルを有するコンピュータを、
所定順に並ぶ複数のキーワード及び各キーワードに関連付けられた色情報の入力を受け付け、受け付けたキーワード毎に、当該キーワードを識別するためのキーワードIDと前記色情報とを関連付けて前記第1テーブルに登録するキーワード管理手段、
指定された文書データを所定領域毎に分割するとともに、各分割領域中に、前記第1テーブルに登録されたキーワードが存在するかどうかをサーチし、存在する場合は当該キーワードについて前記第1テーブルに登録されている色情報、存在しない場合は未登録の色情報を前記所定順に並べたスペクトルパターンを分割領域毎に生成し、生成したスペクトルパターンを、当該分割領域を識別するための分割IDと関連付けて前記第2テーブルに登録するスペクトル管理手段、及び、
前記文書データを所定の表示装置に表示する際に、当該文書データのうち前記第1テーブルに登録されたキーワードを当該キーワードに固有となる色情報で強調表示するとともに、前記第2テーブルに前記分割IDと関連付けて登録されているスペクトルパターンを、当該分割IDにより識別される分割領域の相対位置情報と共に表示する表示制御手段、として機能させる、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009117572A JP5288617B2 (ja) | 2009-05-14 | 2009-05-14 | 文書管理システム、文書管理方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009117572A JP5288617B2 (ja) | 2009-05-14 | 2009-05-14 | 文書管理システム、文書管理方法及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010267062A JP2010267062A (ja) | 2010-11-25 |
JP5288617B2 true JP5288617B2 (ja) | 2013-09-11 |
Family
ID=43363985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009117572A Expired - Fee Related JP5288617B2 (ja) | 2009-05-14 | 2009-05-14 | 文書管理システム、文書管理方法及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5288617B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5678256B2 (ja) * | 2011-05-16 | 2015-02-25 | アイビーリサーチ株式会社 | 知的財産管理装置 |
JP6301278B2 (ja) * | 2015-03-30 | 2018-03-28 | 新日鉄住金ソリューションズ株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN111125432B (zh) * | 2019-12-25 | 2023-07-11 | 重庆能投渝新能源有限公司石壕煤矿 | 一种视频匹配方法及基于该方法的培训快速匹配*** |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0581327A (ja) * | 1991-09-19 | 1993-04-02 | Fujitsu Ltd | 情報検索支援処理装置 |
JPH05274314A (ja) * | 1992-03-25 | 1993-10-22 | Canon Inc | 文書処理装置 |
JPH07146872A (ja) * | 1993-11-22 | 1995-06-06 | Nippon Steel Corp | 文書検索装置 |
JPH08255163A (ja) * | 1995-03-16 | 1996-10-01 | Fuji Xerox Co Ltd | 文書検索装置 |
JP2005063283A (ja) * | 2003-08-19 | 2005-03-10 | Ricoh Co Ltd | 文書ブラウズ装置、文書ブラウズ方法、プログラムおよび記録媒体 |
US7793230B2 (en) * | 2006-11-30 | 2010-09-07 | Microsoft Corporation | Search term location graph |
-
2009
- 2009-05-14 JP JP2009117572A patent/JP5288617B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010267062A (ja) | 2010-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4461769B2 (ja) | 文書検索・閲覧手法及び文書検索・閲覧装置 | |
US20140304579A1 (en) | Understanding Interconnected Documents | |
US9384268B2 (en) | Information processing device, information processing method and computer program for highlighting content in an electronic document | |
JPH07282063A (ja) | 機械翻訳装置 | |
JP6514268B2 (ja) | 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法 | |
WO2019240926A1 (en) | Sql query formatting by examples | |
JP5288617B2 (ja) | 文書管理システム、文書管理方法及びコンピュータプログラム | |
JP2008077634A (ja) | モバイル機器におけるフォーム自動記入方法および装置 | |
KR101069278B1 (ko) | 청구항 시각화 장치 및 방법 | |
JP6044800B2 (ja) | 色評価装置、色評価方法及びコンピュータ・プログラム | |
JP2007279978A (ja) | 文書検索装置及び文書検索方法 | |
JP2006277127A (ja) | 修正プログラムの比較方法 | |
CN112149402B (zh) | 文档对比方法、装置、电子设备和计算机可读存储介质 | |
JP2004157668A (ja) | 検索システム、検索方法および検索プログラム | |
JP6114090B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JP5826148B2 (ja) | 図面管理サーバ及びこれを用いた図面管理システム | |
JP2008176625A (ja) | 文字認識結果の管理装置およびその方法並びにコンピュータプログラム | |
KR20100115048A (ko) | 복사 문서 판별 시스템 및 그 방법 | |
JP2014044555A (ja) | 画像処理装置、画像処理システム及びプログラム | |
JP2005316881A (ja) | 図面検索のためのプログラム、図面検索装置及び図面検索結果表示方法 | |
JP2008065577A (ja) | 文書検索システム、文書検索プログラム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP6048492B2 (ja) | 色彩情報記憶装置、色彩情報記憶方法およびコンピュータ・プログラム | |
JP2004295301A (ja) | 文書検索装置 | |
JP2010262578A (ja) | 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム | |
JP4462508B2 (ja) | 情報処理装置並びに定義情報生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130603 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5288617 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |