JP2007011721A - 文書検索装置 - Google Patents

文書検索装置 Download PDF

Info

Publication number
JP2007011721A
JP2007011721A JP2005192243A JP2005192243A JP2007011721A JP 2007011721 A JP2007011721 A JP 2007011721A JP 2005192243 A JP2005192243 A JP 2005192243A JP 2005192243 A JP2005192243 A JP 2005192243A JP 2007011721 A JP2007011721 A JP 2007011721A
Authority
JP
Japan
Prior art keywords
document
search
business
unit
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005192243A
Other languages
English (en)
Inventor
Eiichi Yamaguchi
榮一 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2005192243A priority Critical patent/JP2007011721A/ja
Publication of JP2007011721A publication Critical patent/JP2007011721A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 利用者にとってより参考になる文書を効率よく検索できる、文書検索装置を提供する。
【解決手段】 文書検索装置10は、検索条件を入力する検索条件入力部1と、文書データベース2に格納された文書の文書名、前記文書の文書カテゴリ情報を格納する文書属性格納部3と、文書データベース2、及び、文書属性格納部3を参照して、検索条件入力部1から入力された検索条件に基づいて文書を抽出する文書抽出部6と、文書抽出部6で抽出された文書名を出力する検索結果出力部7とを備える。文書抽出部6は、まず文書データベース2、文書属性格納部3を参照して、検索条件入力部1から入力された文書キーワード、文書カテゴリに基づいて文書を抽出する。更には、抽出された文書と同一の文書カテゴリに属する他の文書を抽出する。抽出された文書情報は、業務フェーズの順序に基づいて表示部に出力される。
【選択図】 図1

Description

本願発明は文書検索装置に関する。
文書を業務プロセスと関連づけて管理する文書管理装置としては、例えば、特許文献1などに開示されている。
特開2003−296369号公報
しかしながら、従来の文書検索装置には、以下のような問題があった。(1)類似の業務が複数あった場合、複数業務の文書が検索結果として表示されるが、どの業務がより必要とする業務に近いのか判断できない。(2)類似の業務が複数あった場合、複数の文書が検索結果として表示されるが、どの文書がより業務に役立つ文書か判断できない。
そこで、本発明は、利用者にとってより参考になる文書を効率よく検索できる、文書検索装置を提供することを目的とする。
請求項1は、文書を格納する文書データベースから所定の文書を検索する文書検索装置であって、検索条件を入力する検索条件入力部と、文書データベースに格納された文書の文書名、文書がどの業務において作成されたのかを表す業務カテゴリ情報、文書が前記業務のどのフェーズで作成されたのかを表す業務フェーズ情報、を格納する文書属性格納部と、文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、業務カテゴリ、及び業務フェーズに該当する文書を抽出する該当文書抽出部と、文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、及び業務カテゴリに該当するもので、前記第1文書抽出部で抽出されなかった文書を抽出する関連文書抽出部と、該当文書抽出部で抽出された文書に関する情報と、関連文書抽出部で抽出された文書に関する情報と、を業務フェーズの順序に基づいて出力する検索結果出力部を備える。
請求項1の文書検索装置によれば、検索結果の文書(=該当文書)と、その文書に業務で関連する文書(=関連文書)を出力するので、文書検索装置の利用者は、該当文書が作られた背景情報を知ることができる。これにより、例えば上記検索で該当文書が多く検出された場合、どの該当文書が本当に必要な文書であるかを把握することができる。また、関連文書を表示することにより、利用者の該当文書の理解に役立てることができる。
請求項2は、文書を格納する文書データベースから所定の文書を検索する文書検索装置であって、検索条件を入力する検索条件入力部と、文書データベースに格納された文書の文書名、文書がどの業務において作成されたのかを表す業務カテゴリ情報、を格納する文書属性格納部と、文書データベースに格納された文書数を、作成者ごと、文書カテゴリごとに管理する格納文書数管理部と、格納文書数管理部において、業務カテゴリにおける作成文書数が所定数以上である作成者を該業務カテゴリの専門家と判定する、専門家判定部と、文書データベースに格納された各文書にアクセスしたアクセス者を管理するアクセス者管理部と、文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、及び業務カテゴリに該当する文書を抽出する文書抽出部と、文書抽出部で抽出された文書に関する情報を、前記専門家判定部が専門家と判定したアクセス者によるアクセス回数に基づいて出力する検索結果出力部を備える。
請求項2の文書検索装置によれば、専門家が頻繁に使用している文書の順番を表示するので、文書検索装置の利用者は、どの文書がより業務に役に立つのかを容易に判断することができる。
本願発明によれば、利用者にとってより参考になる文書を効率よく検索できる、文書検索装置を提供することができる。例えば、文書が作られた背景情報や、専門家が参照した文書の情報を表示することで、利用者はどの文書が本当に必要な文書かを知ることができる。
(文書検索装置10の構成)
本願発明の文書検索装置の構成例を説明する。図1を参照して、文書検索装置10は、検索結果入力部1、文書データベース2、文書属性格納部3、格納文書数管理部4、操作履歴管理部5、文書抽出部6、検索結果出力部7、を有している。この文書検索装置10は、例えばサーバ型の電子計算機により実現される。
検索結果入力部1は、文書検索装置10の利用者からの検索条件入力を受け付ける。利用者とは、利用者は、例えば文書検索装置10とネットワークで接続された端末から検索条件入力を行う。
文書データベース2は、様々な文書のデータを蓄積、保存するデータベースである。
文書属性格納部3は、文書データベース2に保存されている文書の属性情報を格納している。図2は、文書属性格納部3内に記憶されているデータの例を示す図である。属性情報とは、例えば、文書の文書名、文書が作成された業務を示す業務カテゴリ情報、文書が作成されたフェーズを示す業務フェーズ情報、文書の作成者名などである。なお、これらのデータは、作成文書の文書DBへの登録時に作成者により入力される。或いは、文書データベース2への登録時に、作成された文書のデータに基づいて自動的に文書属性格納部3の情報が作成されるものであってもよい。
格納文書数管理部4は、文書データベース2に保存されている文書の数を管理する。図3は、格納文書数管理部4内に記憶されているデータの例を示す図である。例えば、業務カテゴリごと、作成者ごとの文書数を管理している。
操作履歴管理部5は、文書データベース2の各文書に対するアクセス履歴などを管理する。図4は、操作履歴管理部5内に記憶されているデータの例を示す図である。この操作履歴管理部5には、アクセス者に関する情報の他、文書データベース2の各文書へのアクセス回数、及び、専門家の文書データベース2の各文書へのアクセスした回数が記録されている。また、図示していないが、操作履歴管理部5は、アクセス履歴を詳細に記録していても良い。
この文書管理装置10においては、特定の業務カテゴリに属する文書を多く作成した作成者を専門家と定義している。例えば、図3を参照して、業務カテゴリ「AAA」における専門家は、作成文書数が多いX課長、Y主任である。作成文書数が少ないZ社員、B社員は、専門家ではないと判断される。従って、図4の表における「専門家のアクセス回数」とは、このケースではX課長とY主任のアクセス回数の合計のことを指している。
文書抽出部6は、文書データベース2、文書属性格納部3、格納文書数管理部4などを参照して、検索結果入力部1から入力された検索条件に適合する文書を、文書データベース2から抽出する。
検索結果出力部7は、文書抽出部6により抽出された文書に関する情報を出力する。出力先は、例えば、この文書検索装置10の利用者の端末である。
図5は、利用者の端末の表示部に表示される検索条件入力画面の例を示したものである。検索条件入力画面には、文書キーワードを入力するためのテキストボックス11、業務カテゴリを入力するためのテキストボックス12、業務フェーズを入力するためのテキストボックス13、検索ボタン14が表示されている。また、検索の種類を指定するためのチェックボックス15a〜cも表示されている。
文書キーワードとは、例えば、文書データベース2の文書内に登場するキーワード、単語、或いは字句である。業務カテゴリは、文書属性格納部3における文書管理単位である業務カテゴリに対応し、業務フェーズは文書属性格納部3の業務フェーズに対応するものである。
また、検索の種類を指定するためのチェックボックスは3種類ある。チェックボックス15aにより指定される「通常検索」とは、テキストボックス11から入力された文書キーワードを含み、かつ、テキストボックス12から入力された業務カテゴリに属する文書(以後、これを「該当文書」と呼ぶ)を検索するものである。
チェックボックス15bにより指定される「関連文書検索」とは、上記の該当文書、及び、該当文書と同じ業務カテゴリに属する他の文書(以後、これを「関連文書」と呼ぶ)を検索するものである。
また、チェックボックス15cにより指定される「専門家参照文書検索」とは、上記の該当文書検索、或いは、関連文書検索でヒットした文書のうち、専門家が多くアクセスした文書を検索するものである。
(文書検索の処理例1)
図6は、文書検索装置10により文書検索が行われるときの処理フローの一例を示すものである。
ステップS10では、検索条件入力部10が、利用者による検索条件の入力を受け付ける。この例では、利用者は、文書キーワードとして、「YYYY」を、業務カテゴリとして「AAA」を、業務フェーズとして「結果」を入力したものとする。
ステップS12では、文書抽出部6が、検索条件入力画面のテキストボックス11から入力された文書キーワード「YYYY」を含む文書を文書データベース2から抽出する。なお、この例では、図7で示すように、「111.doc」「112.doc」「119.doc」の3文書が、文書データベース2の文書中に「YYYY」という字句を含むものであったとする。
ステップS14では、文書抽出部6が、文書属性格納部3を参照して、検索条件入力画面のテキストボックス12から入力された業務カテゴリに当てはまり、かつ、テキストボックス13から入力された業務フェーズにも当てはまる文書を、文書データベース2から抽出する。
ステップS16では、上記ステップS12、及びステップS14の両方でヒットした文書を抽出する。このステップS16で抽出された文書が上記で定義した「該当文書」に相当するが、この例では、該当案件は1件もないものとする。
ステップS18では、チェックボックス15からの入力に応じて処理が分岐される。利用者が関連文書検索を選択した場合(チェックボックス15bがONの場合)、ステップS20へ進む。ステップS20では、文書抽出部6が、文書属性格納部3を参照して、ステップS16で抽出された文書の業務カテゴリと同じ業務カテゴリに属する他の文書(以後、これを「関連文書」と呼ぶ)を抽出する。
そしてステップS22では、文書抽出部6が抽出した結果が、検索結果出力部7を介して、利用者の端末の表示部に表示される。
図8は、このときに、表示部に表示される検索結果画面を示すものである。関連文書が業務のどのフェーズで作成されたものなのかが一目瞭然で分かるように表示されている。
この検索では、利用者が希望する、「文書キーワード:YYYY、業務カテゴリ:AAA、業務フェーズ:結果」に該当する案件はなく、この検索結果画面に表示されている文書名は全て関連文書名である。また、下線付きで表示されている文書名「111.doc」「112.doc」「119.doc」は、業務フェーズは異なるものの、「文書キーワード:YYYY、業務カテゴリ:AAA、」に該当する案件である。このことから、「結果」フェーズの文書には「YYYY」というキーワードは登場しないものの、他のフェーズの文書には「YYYY」というキーワードが登場していることから、「結果」フェーズの文書「130.doc」「140.doc」「150.doc」のうちのいずれかは、「YYYY」に関連する記載がある可能性が考えられ、これらの文書の中に利用者が知りたい情報が記載されている可能性がある。
ここで、このように、「結果」フェーズには文書キーワード「YYYY」が含まれている文書が1つもないのに対し、他のフェーズには文書キーワード「YYYY」が含まれている文書があるケースとは、例えば、以下のようなものが考えられる。第1には、文書作成者によって用語の使い方が異なり、同じ意味の事柄を表すのに異なる単語を用いている場合である。第2には、業務の状況が変化してしまい、初期の「調査」フェーズや、「計画」フェーズでの業務ターゲットが、「結果」フェーズでの業務ターゲットではなくなった場合が考えられる。
一方、利用者が通常検索を選択した場合(チェックボックス15aがONの場合)、ステップS24へ進む。このとき、利用者の端末の表示部には、図9のように、利用者端末の表示画面には、「該当案件はありません」という文字が表示される。
なお、この検索結果画面は、HTML文書により構成されていてもよい。このとき、利用者は、文書名の箇所をクリックすると、文書データベース2にアクセスして、文書の内容を閲覧することが可能である。
また、上記の検索例では「該当文書」は1件もヒットしなかったが、仮に「実施」フェーズを対象に検索した場合(テキストボックス13に「実施」と入力した場合)、「119.doc」が「該当文書」としてヒットする。このとき、図10で示すように、利用者端末の表示画面には、「119.doc」は他の文書名よりも大きな文字サイズで表示される。
(文書検索の処理例2)
上記の文書検索装置10を用いた検索処理の他の例を説明する。図11は、文書検索装置10により文書検索が行われるときの他の処理フロー例である。
ステップS30では、検索条件入力部10が、利用者による検索条件の入力を受け付ける。図12は、このときの入力画面を示すものである。ここでは、利用者はテキストボックス12に業務カテゴリのみを入力し、テキストボックス11への文書キーワード、テキストボックス13への業務フェーズ入力しなかったものと仮定する。また、チェックボックス15については、チェックボックス15cのみを選択(専門家参照文書検索を選択)したものとして、以後の説明を行う。
ステップS32では、文書抽出部6が、文書属性格納部3を参照して、検索条件入力画面のテキストボックス12から入力された業務カテゴリに該当する文書を、文書データベース2から抽出する。
ステップS34では、文書抽出部6が、操作履歴管理部5を参照して、専門家がアクセスした回数に基づいて、ステップS32で抽出された文書に対して順序づけを行う。
そして、ステップS36では、検索結果出力部7は、抽出された文書の文書名を、その順序づけに従って出力する。
図13は、検索結果出力部7の出力を利用者の端末の表示部に表示させた検索結果画面である。検索結果画面では、「111.doc」「112.doc」「120.doc」「116.doc」「113.doc」が、専門家が多くアクセスした文書であるとして、表示されている。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施の形態の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
例えば、専門家の定義方法としては、上記のように「単一の業務カテゴリ内における作成文書数が多い人」を専門家とする以外にも、「類似する複数の業務カテゴリにおける作成文書数が多い人」を専門家と定義しても良い。
符号の説明
1 検索結果入力部
2 文書データベース
3 文書属性格納部
4 格納文書数管理部
5 操作履歴管理部
6 文書抽出部
7 検索結果出力部
文書検索装置10の構成を示す図である。 文書属性格納部3内に記憶されているデータの例を示す図である。 格納文書数管理部4内に記憶されているデータの例を示す図である。 操作履歴管理部5内に記憶されているデータの例を示す図である。 利用者の端末の表示部に表示される検索条件入力画面の例を示したものである。 文書検索装置10により文書検索が行われるときの処理フローを示すものである。 ステップS12においてヒットした文書である。 表示部に表示される検索結果画面を示すものである。 表示部に表示される検索結果画面を示すものである。 表示部に表示される検索結果画面を示すものである。 文書検索装置10により文書検索が行われるときの処理フローである。 ステップS30での入力画面を示すものである。。 文書検索装置10により文書検索が行われるときの処理フローである。

Claims (2)

  1. 文書を格納する文書データベースから所定の文書を検索する文書検索装置であって、
    検索条件を入力する検索条件入力部と、
    文書データベースに格納された文書の文書名、文書がどの業務において作成されたのかを表す業務カテゴリ情報、文書が前記業務のどのフェーズで作成されたのかを表す業務フェーズ情報、を格納する文書属性格納部と、
    文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、業務カテゴリ、及び業務フェーズに該当する文書を抽出する該当文書抽出部と、
    文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、及び業務カテゴリに該当するもので、該当文書抽出部で抽出されなかった他の文書を抽出する関連文書抽出部と、
    該当文書抽出部で抽出された文書に関する情報と、関連文書抽出部で抽出された文書に関する情報と、を業務フェーズの順序に基づいて出力する検索結果出力部を備えた、文書検索装置。
  2. 文書を格納する文書データベースから所定の文書を検索する文書検索装置であって、
    検索条件を入力する検索条件入力部と、
    文書データベースに格納された文書の文書名、文書がどの業務において作成されたのかを表す業務カテゴリ情報、を格納する文書属性格納部と、
    文書データベースに格納された文書数を、作成者ごと、文書カテゴリごとに管理する格納文書数管理部と、
    格納文書数管理部において、業務カテゴリにおける作成文書数が所定数以上である作成者を該業務カテゴリの専門家と判定する、専門家判定部と、
    文書データベースに格納された各文書にアクセスしたアクセス者を管理するアクセス者管理部と、
    文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、及び業務カテゴリに該当する文書を抽出する文書抽出部と、
    文書抽出部で抽出された文書に関する情報を、前記専門家判定部が専門家と判定したアクセス者によるアクセス回数に基づいて出力する検索結果出力部を備えた、文書検索装置。

JP2005192243A 2005-06-30 2005-06-30 文書検索装置 Pending JP2007011721A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005192243A JP2007011721A (ja) 2005-06-30 2005-06-30 文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005192243A JP2007011721A (ja) 2005-06-30 2005-06-30 文書検索装置

Publications (1)

Publication Number Publication Date
JP2007011721A true JP2007011721A (ja) 2007-01-18

Family

ID=37750125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005192243A Pending JP2007011721A (ja) 2005-06-30 2005-06-30 文書検索装置

Country Status (1)

Country Link
JP (1) JP2007011721A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009025264A1 (ja) * 2007-08-20 2009-02-26 Nec Corporation ファイル管理装置、ファイル管理システム、ファイル管理方法及びプログラム
JP2009181479A (ja) * 2008-01-31 2009-08-13 Japan Digital Laboratory Co Ltd データ管理システムおよび方法並びにプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009025264A1 (ja) * 2007-08-20 2009-02-26 Nec Corporation ファイル管理装置、ファイル管理システム、ファイル管理方法及びプログラム
JP2009181479A (ja) * 2008-01-31 2009-08-13 Japan Digital Laboratory Co Ltd データ管理システムおよび方法並びにプログラム

Similar Documents

Publication Publication Date Title
US7769771B2 (en) Searching a document using relevance feedback
JP2001075969A (ja) 画像管理検索装置、画像管理検索方法及び記憶媒体
US20090313539A1 (en) Information processor, information processing method, and recording medium
JP3803961B2 (ja) データベース生成装置、データベース生成処理方法及びデータベース生成プログラム
JPH08305616A (ja) データ管理システム
US20070185832A1 (en) Managing tasks for multiple file types
US8612431B2 (en) Multi-part record searches
US8423574B2 (en) Method and system for managing tags
JP2001256255A (ja) データ検索装置及びデータ検索方法
JP2005202714A (ja) 文書検索システム
JP2008234078A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理プログラムを記録した記録媒体
JP2007011721A (ja) 文書検索装置
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
JP2011086156A (ja) 漏洩情報追跡システムおよび漏洩情報追跡プログラム
JP2009146013A (ja) コンテンツ検索方法及び装置並びにプログラム
JP2000163439A (ja) 電子ファイル検索装置および電子ファイル検索方法
JP2812357B2 (ja) データベース検索システム
JP2005056223A (ja) テキストデータ検索システム、その方法及びそのプログラム
JP2006338114A (ja) データ管理装置およびデータ管理方法
JP3933407B2 (ja) 文書処理装置、文書処理方法および文書処理プログラムが格納された記憶媒体
JP2004030021A (ja) 文書処理装置および方法
JPH06195386A (ja) データ検索装置
JP2005275929A (ja) Csvデータ提供システム
JP7284371B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2010097296A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム