JP2006039811A - ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置 - Google Patents

ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置 Download PDF

Info

Publication number
JP2006039811A
JP2006039811A JP2004216982A JP2004216982A JP2006039811A JP 2006039811 A JP2006039811 A JP 2006039811A JP 2004216982 A JP2004216982 A JP 2004216982A JP 2004216982 A JP2004216982 A JP 2004216982A JP 2006039811 A JP2006039811 A JP 2006039811A
Authority
JP
Japan
Prior art keywords
document
word
documents
document management
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004216982A
Other languages
English (en)
Other versions
JP2006039811A5 (ja
JP4525224B2 (ja
Inventor
Masao Nukaga
雅夫 額賀
Shigehisa Kawabe
惠久 川邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004216982A priority Critical patent/JP4525224B2/ja
Publication of JP2006039811A publication Critical patent/JP2006039811A/ja
Publication of JP2006039811A5 publication Critical patent/JP2006039811A5/ja
Application granted granted Critical
Publication of JP4525224B2 publication Critical patent/JP4525224B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 利便性を向上できるドキュメント管理装置を提供する。
【解決手段】 複数のドキュメントを保持するドキュメント保持手段にアクセス可能に接続されたドキュメント管理装置であって、当該保持されているドキュメントの少なくとも一部を対象ドキュメント群として選出させ、当該対象ドキュメント群に含まれる個々のドキュメントから所定の単語群を抽出させ、各単語が含まれているドキュメントの数に基づいて、上記単語群に含まれる単語の少なくとも一部を検索用キーワード候補として選択させて、当該選択した検索用キーワード候補を所定の検索処理に供するドキュメント管理装置である。
【選択図】 図1

Description

本発明は、複数のドキュメント群から、ドキュメントを検索するドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置に関する。
従来から、文書などのドキュメントをデータベースに登録しておき、当該文書中に含まれる単語をキーワードとしてドキュメントを全文検索する装置が用いられている。
例えば特許文献1に開示されている技術によると、かかる検索における場合に、利用者が適切な検索結果を得るまでに繰り返し検索をやり直す手間を削減するため、所定の文書をデータベースに予め登録し、所定の検索条件に関連する文書をこのデータベースから取り出す場合、所定の検索条件を用いた検索によって得られた文書中に存在する単語をピックアップし、次回の検索時に追加すべき新たな検索語の候補として、上記ピックアップされた単語を提示する。
特開平9−218881号公報
しかしながら、上記従来の検索技術によると、例えば各検索条件に応じて得られる検索の結果に配慮されていないので、検索語の候補としてピックアップされた単語を選択して検索しても、検索結果のドキュメント数が「0」であるという事態も想定されるなど、利便性が低い。
本発明は上記実情に鑑みて為されたもので、利便性を向上できるドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置を提供することを、その目的の一つとする。
上記従来例の問題点を解決するための本発明は、ドキュメント管理プログラムであって、複数のドキュメントを保持するドキュメント保持手段にアクセス可能に接続されたコンピュータに、当該保持されているドキュメントの少なくとも一部を対象ドキュメント群として選出する対象選出手段と、当該対象ドキュメント群に含まれる個々のドキュメントから所定の単語群を抽出する単語抽出手順と、各単語が含まれているドキュメントの数とに基づいて、前記単語群に含まれる単語の少なくとも一部を検索用キーワード候補として選択する選択手順と、を実行させ、当該選択した検索用キーワード候補を所定の検索処理に供することを特徴としている。
ここで前記選択手順においては、前記各単語が含まれているドキュメント数が、所定の値の範囲にある場合に、前記単語群に含まれる単語の少なくとも一部を検索用キーワード候補として選択することとしてもよい。
また前記選択された検索用キーワード候補を単語同士の相関値と、各単語が含まれているドキュメントの数とに基づいて、グループ化し、検索条件の候補として利用者に提示されることとしてもよい。
なお、グループ化は排他的に(つまり、一つの単語は直接には一つのグループにのみ含まれるように)行ってもよい。
単語のグループ化あるいは、単語グループの上位のグループへのグループ化においては、検索用キーワード候補に関係するドキュメントの検索の結果として得られるドキュメントの数が、予め定めたドキュメント数条件を満足する場合に、グループ化することとしてもよい。
さらに前記ドキュメント数条件は、前記対象ドキュメントの数に対する、前記検索の結果として得られるドキュメントの数の割合が、予め定めた値の範囲にあるとの条件であることとしてもよいし、さらに前記値の範囲は、グループ化のレベルに応じて異なることとしてもよい。
また、前記キーワード候補の提示時には、各検索条件の候補による検索の結果得られるドキュメントの数に関する情報を併せて提示させることとしてもよい。
さらに、前記ドキュメント保持手段は、ドキュメントを分類して保持しており、前記対象選出手段は、前記分類の少なくとも一部を特定する情報の入力を受けて、当該特定された分類に含まれるドキュメントを対象ドキュメントとして選出することとしてもよい。
また、本発明の一態様に係るドキュメント管理方法は、複数のドキュメントを保持するドキュメント保持手段にアクセス可能に接続されたコンピュータを用い、当該保持されている個々のドキュメントから、単語群を抽出する工程と、各単語が含まれているドキュメントの数に基づいて、前記単語群に含まれる単語の少なくとも一部を検索用キーワード候補として選択する選択工程と、を実行させ、当該選択した検索用キーワード候補を所定の検索処理に供することを特徴としている。
さらに本発明の別の態様に係るドキュメント管理装置は、複数のドキュメントを保持するドキュメント保持手段にアクセス可能に接続されたドキュメント管理装置であって、当該保持されている個々のドキュメントから、単語群を抽出する手段と、各単語が含まれているドキュメントの数に基づいて、前記単語群に含まれる単語の少なくとも一部を検索用キーワード候補として選択する手段と、を含み、当該選択した検索用キーワード候補が所定の検索処理に供されることを特徴としている。
本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係るドキュメント管理装置1は、図1に示すように、ネットワークを介して、ドキュメント保持手段としてのドキュメントデータベース2と、通信可能に接続されている。またこのドキュメント管理装置1は、図1に示すように制御部11と、記憶部12と、操作部13と、表示部14と、通信部15とを含んで構成されている。
制御部11は、CPUなどを用いて実現でき、記憶部12に格納されているプログラムに従って動作している。本実施の形態では、制御部11は、ドキュメントデータベース2に格納されているドキュメントの一部を対象ドキュメント群として選出しておき、この対象ドキュメント群に含まれる各ドキュメントから所定の単語群を抽出する。そして当該単語群に含まれる単語同士の相関値を例えば係り受け解析の結果から演算する。また、各単語の出現頻度(対象ドキュメント群に含まれるドキュメントのうち、各単語の現れるドキュメントの数)を演算し、この出現頻度に基づいて単語群に含まれる単語の少なくとも一部を検索用キーワード候補として選択する処理を行う。また、出現頻度と相関値に基づいて単語群を再帰的にグループ化し、各レベルの単語グループを検索用キーワード候補とする。制御部11は、さらに当該選択した検索用キーワード候補を所定の検索処理に供する。これらの制御部11の処理の具体的な内容については、後に詳しく述べる。記憶部12は、RAM(Random Access Memory)や、ROM(Read Only Memory)等のメモリ素子、並びにハードディスク等によって実現できる。この記憶部12は、制御部11によって実行されるプログラムが保持されている。また、この記憶部12は、制御部11の処理の過程で利用される種々のデータを保持するワークメモリとしても動作する。
操作部13は、マウスやキーボード等によって実現できる。この操作部13は、利用者の操作を受け入れて、当該操作の内容を制御部11に出力する。表示部14は、ディスプレイ等であり、制御部11から入力される指示に従って情報を表示出力する。通信部15は、ネットワークに接続されており、制御部11から入力される指示に従って、ネットワークを介してデータを送信出力する。またこの通信部15は、ネットワークを介して到来するデータを受信して制御部11に出力する。
ドキュメントデータベース2は、ドキュメントの実体データを保持している。本実施の形態のドキュメントデータベース2は、各ドキュメントを階層ディレクトリ構造を用いて分類して格納している。例えば利用者は、新たにドキュメントを格納する際には、予め定められた階層ディレクトリ構造に含まれる、いずれかのディレクトリに関連づけて(つまりそのディレクトリに分類して)、当該ドキュメントを格納する。
ここで制御部11の処理の内容について説明する。本実施の形態の制御部11は、対象ドキュメント群を選出する選出処理と、単語群を抽出する単語群抽出処理と、単語間の相関値を演算する相関値演算処理と、単語の組み合わせの出現頻度を演算する出現頻度演算処理と、単語の組み合わせから検索用キーワード候補を選択するキーワード選択処理と、選択した検索用キーワード候補を階層的にグループ化するクラスタリング処理と、この階層的にグループ化された検索用キーワード候補を利用者に提示する提示処理とを実行している。また、提示した検索用キーワードの選択操作を受け入れて、当該選択された検索用キーワードに基づく検索処理を実行する。
以下、これら各処理の内容について説明する。制御部11は、操作部13を介して利用者から検索の対象とするディレクトリの指定操作を受けて、当該ディレクトリ以下(当該ディレクトリより下位の階層にあるディレクトリ以下をも含む)のドキュメントを対象ドキュメント群として選出する(選出処理)。
制御部11は、対象ドキュメント群に含まれる各ドキュメントについて、それぞれに含まれる文章から単語を抽出する。具体的には、各ドキュメントを順次、処理対象として選択しながら、選択対象となったドキュメントに含まれる文章に対して、形態素解析処理を行って単語のリストを生成し、さらにこのリストから重複する単語を除去する処理を行う。さらに制御部11は、この抽出した単語のうち、予め定められた一般単語群(いわゆるストップワードの群)に含まれる単語を取り除く。
一例として、「ナレッジマネジメントのツールは、EIPやSFA、CRMツールなどとともに、発展を続けているところである。」との文章については、「ナレッジマネジメント/の/ツール/は/EIP/や/SFA/CRM/ツール/など/と/とも/に/発展/を/続けて/いる/ところ/である/。」のように分割されて、単語のリストが生成される。ここから重複する単語を除去すると、「ナレッジマネジメント/の/ツール/は/EIP/や/SFA/CRM/など/と/とも/に/発展/を/続けて/いる/ところ/である/。」のように重複する「ツール」という単語が除去される。次に、一般単語群に含まれる、助詞(「の」や「は」の類い)や、どの文章にも現れ得ると想定される単語(例えば「発展」、「続けて」の類い)を除去して、「ナレッジマネジメント/ツール/EIP/SFA/CRM」が単語群抽出処理の抽出結果として得られることになる。
さらに制御部11は、得られた単語群のリストに含まれる各単語について、当該単語を含む対象ドキュメントの数(DF(Document Frequency)、いわば出現頻度)を調べ、単語出現頻度情報として記憶部12に格納する。そして制御部11は、このドキュメントの数(DF)が全対象ドキュメントの数に占める割合が所定の値を超えているときには、当該単語をリストから除去してもよい。例えば、上記の例の場合に、単語「ツール」を含む対象ドキュメントの数DFが、対象ドキュメントの総数Nに占める割合DF/Nが例えば0.5(50%)を超えている場合は、当該単語「ツール」を各ドキュメントの単語リストから除去することとしてもよい。
制御部11は、こうして得られる単語群のリストを、それぞれ抽出元のドキュメントを特定する情報に関連づけて、記憶部12に格納する。
制御部11は、次に、ドキュメントごとに得られた単語群のリストに含まれる各単語について、単語同士の相関値を演算する。ここで相関値は、例えば係り受けの分析処理によって演算できる。具体的には、骨格構造解析などの方法(例えば兵藤安昭,池田尚志:表層的情報とN近傍ブロック化手法による 日本語長文の骨格構造解析,情報処理学会論文誌,Vol.36,No.9,pp2091−2101(1995))が知られており、相関値の演算方法は当該知られている方法を用いることができるので、ここでの詳細な説明を省略する。この処理により、図2に示すように、単語群に含まれる任意の単語ペアに関する相関値が演算される。
制御部11は、ここで、相関値を参照しながら単語の組み合わせを生成する。具体的には、まず、相関の大きい順に単語をグループ化する。ただし、グループ化した単語のDF/Nが所定値を超える場合はそのグループ化を行わない。また、グループに含まれる単語の数が所定値、例えば10語を超える場合はそのグループ化を行わない。DF/Nあるいはグループに含まれる単語の数の制約によりグループ化できなくなるまでグループ化が続く。あるいは、予めしきい値を定め、グループ内の単語の組み合わせの内、相関値が最も低いものが、しきい値を超えるもののみをグループ化してもよい。
同様の処理を語のグループに対して再帰的に行い、リストに含まれる最上位のグループが所定値、例えば10グループ以下になるようにする。グループを上位のグループにまとめる場合は、DF/Nの上限値を上げるようにする。同様に、相関の下限値を設定している場合は、相関の下限値を下げるようにする。
具体的に、図3(a)に例示するように単語AからDについての相関値が演算されているとすると、ここから例えばしきい値「0.5」以上の相関値となっている単語の組み合わせを相関値の大きい順に取り出してグループ化する。まず、最も相関値の大きい単語Bと単語Dがグループになる。次に単語Aと単語Bのグループ化を考えるが、単語Aと単語Dの相関値がしきい値より小さいのでグループ化しない。次に単語Cと単語Dのグループ化を考えるが、単語Bと単語Cの相関値はしきい値以上なので、単語B・単語C・単語Dがグループ化される。
制御部11は、こうして得られた単語の組み合わせをキーワード候補として記憶部12に格納する。
そして、制御部11は、全てのレベルの全ての単語グループについて、そのグループに含まれる単語のいずれかを含む旨の検索条件による検索を行い、その結果として得られるドキュメントの数(ヒット数)を調べ、当該ドキュメントの数が予め定めたドキュメント数条件を満足しない単語グループは作成しない。
具体的にドキュメント数条件は、対象ドキュメントの数(N)に対する、ヒット数(DF)の割合が、予め定めた値の範囲にある、つまり
MIN<DF/N<MAX
との条件である。
ここでMINを設けたのは、検索の結果として得られるドキュメントの数が「0」になることを防止するためのものであるが、検索の結果がない場合があっても構わないときには、MINを「0」に設定しておけばよい。
制御部11は、上記ドキュメント数条件を満足する単語あるいは単語グループのリストを、キーワード候補として記憶部12に格納する。
キーワード候補が単語グループである場合は、ドキュメント数条件はグループのレベルに応じて異なることとしてもよい。例えば、単一の単語であれば、MAXを「0.5」とし、グループのレベル(階層位置)が上がるたびにMAXを逓増させて、単語を直接含むグループ(第1階層)の場合「0.75」、単語を直接含むグループを更にグループ化したもの(第2階層)の場合「0.875」、さらにそのグループをグループ化したもの(第3階層)の場合「0.9375」…としてもよい。
制御部11は、このようにして対象ドキュメントに現実に含まれる単語をグループ化し、利用者に提示するのである。すなわち制御部11は、上記処理によって得られた単語リストを表示部14に表示する。具体的には、制御部11は、図4(a)に示すように単語リストの一覧と、検索ボタンとを表示部14に表示する。利用者が、この単語リストの一覧から単語あるいは単語グループをマウスクリック操作などで選択し、さらに検索ボタンをクリックすると、制御部11は、当該操作を受け入れて、選択した単語あるいは単語グループに係る検索条件に基づく検索結果(検索の結果となるドキュメントの一覧など)を表示部14に提示する。
また、キーワード候補が選択されたときに、当該キーワード候補が、単語グループである場合は、当該単語グループを構成する単語あるいは単語サブグループの一覧をさらに提示してもよい(図4(b))。図4(b)では、A,B,Cからなる単語グループが、A,Bと、A,Cとの各単語グループのグループ化によって得られたものである場合を示している。この場合「A,B,C」の検索条件が選択されると、「A,B」の検索条件と、「A,C」の検索条件とが個別に提示される。利用者がここで提示された「A,B」の検索条件を選択して、検索ボタンをクリックすると、制御部11は、選択した「A,B」の検索条件に基づく検索結果(検索の結果となるドキュメントの一覧など)を表示部14に提示する。
さらに制御部11は、提示する検索条件ごとに、各検索条件による検索の結果得られるドキュメントの数に関する情報を併せて提示してもよい。例えば、検索条件の一覧に、当該情報を関連づけて提示する例を図5に示す。また、図5の例では、選択した単語等を検索条件の単位としてさらに任意の単語を利用者が追加する(選択した検索条件に対して論理和(OR)、論理積(AND)などの条件で組み合わせる)ことができるようにしている。
さらに図5の例において、「AND検索」ボタンがクリックされると、制御部11は、検索条件の一覧を複数提示して、複数の検索条件の論理積により新たな検索条件を生成して検索指示ができるようにしている。なお、図5の例において複数の検索条件を論理和によって合成して新たな検索条件を生成する場合は、検索条件の一覧から当該論理和によって結合する複数の検索条件をそれぞれ選択すればよい。このように検索条件同士の論理和、論理積を指定した場合も、当該指定された条件での検索結果のドキュメント数に関する情報を提示してもよい。
さらに図5の例においては、検索の対象となるディレクトリを選択するためのインタフェースを併せて提示している(X)。このインタフェースにて検索の対象となるディレクトリが指定されるたびに、当該指定されたディレクトリに含まれるドキュメントを対象ドキュメントとして検索条件を生成するための上記処理が行われ、生成された検索条件が提示されることになる。
さらに、図5に示した例のように、利用者が任意の単語を入力できるようにしている場合には、利用者が単語を入力したときに、対象ドキュメントのうち、当該入力した単語を含むドキュメントの数に関する情報を提示してもよい。例えば入力された単語に関する出現頻度情報が記憶部12に格納されているときには、当該情報を参照して、当該単語の出現頻度(DF)が予め定めた頻度しきい値未満であるときには、「この語はヒット数が少ないか、またはヒットしません」のような案内を表示する。
また、上記頻度しきい値未満でないときには、当該出現頻度の値(DFの値)を表示してもよい(図6)。さらに、利用者が単語を入力したときに、提示した検索条件に当該単語が含まれているときには、入力された単語の代わりに、検索条件に含まれる単語を選択した状態としてもよい(図7)。なお、図7の例では入力欄に入力された単語が表示されたままとなっているが、検索条件に含まれる単語を選択した状態とした後、この入力欄の内容を削除して、入力欄を空としてもよい。
また、検索の結果を提示する方法として、制御部11は、検索の対象として選択されたディレクトリ以下にあるディレクトリ(当該選択されたディレクトリのすぐ下位にあるディレクトリ)または、ドキュメントの一覧を提示し、検索条件を満足するドキュメントや、検索条件を満足するドキュメントを含む(さらに下位のディレクトリに内包されている場合を含む)ディレクトリと、それ以外のドキュメントやディレクトリとは区別して、強調表示してもよい(図8)。図8では、検索条件を満足するドキュメントや、検索条件を満足するドキュメントを内包するディレクトリを網掛けして強調する例を示しているが、このほか、文字色や背景色を変更したり、点滅させるなど、表示態様を異ならせて強調表示してもよい。
本実施の形態によると、検索の対象となるドキュメント群に実際に含まれる単語に基づいて検索用キーワード候補が提示され、また、当該提示される検索用キーワード候補に応じて得られる検索の結果に配慮されている。このため、有為な検索操作を容易に行うことができるよう支援され、利便性が向上できる。
本発明の実施の形態に係るドキュメント管理装置の構成例、およびそのドキュメントデータベースへの接続例を表すブロック図である。 相関値の演算結果の格納例を表す説明図である。 相関値から単語の組み合わせを生成する例を表す説明図である。 検索条件の提示例を表す説明図である。 検索条件の提示の別の例を表す説明図である。 検索のための語を任意に入力したときの画面例を表す説明図である。 検索のための語を任意に入力したときの別の画面例を表す説明図である。 検索結果の提示の例を表す説明図である。
符号の説明
1 ドキュメント管理装置、2 ドキュメントデータベース、11 制御部、12 記憶部、13 操作部、14 表示部、15 通信部。

Claims (10)

  1. 複数のドキュメントを保持するドキュメント保持手段にアクセス可能に接続されたコンピュータに、
    当該保持されているドキュメントの少なくとも一部を対象ドキュメント群として選出する対象選出手段と、
    当該対象ドキュメント群に含まれる個々のドキュメントから所定の単語群を抽出する単語抽出手順と、
    各単語が含まれているドキュメントの数に基づいて、前記単語群に含まれる単語の少なくとも一部を検索用キーワード候補として選択する選択手順と、
    を実行させ、
    当該選択した検索用キーワード候補を所定の検索処理に供することを特徴とするドキュメント管理プログラム。
  2. 請求項1に記載のドキュメント管理プログラムにおいて、
    前記選択手順においては、前記各単語が含まれているドキュメント数が、所定の値の範囲にある場合に、前記単語群に含まれる単語の少なくとも一部を検索用キーワード候補として選択することを特徴とするドキュメント管理プログラム。
  3. 請求項1または2に記載のドキュメント管理プログラムにおいて、
    前記選択された検索用キーワード候補を単語群に含まれる単語同士の相関値に基づいて階層的にグループ化するクラスタリング手順を、さらにコンピュータに実行させ、
    当該階層的な単語グループの各階層ごとに、当該階層以下に含まれる単語が、検索条件の単位として利用者に提示されることを特徴とするドキュメント管理プログラム。
  4. 請求項3に記載のドキュメント管理プログラムにおいて、
    前記クラスタリング手順においては、前記検索用キーワード候補の組み合わせのうち、当該組み合わせに係る検索用キーワード候補に関係するドキュメントの検索の結果として得られるドキュメントの数が、予め定めたドキュメント数条件を満足する場合に、当該組み合わせに係る検索用キーワード候補に関係するドキュメントを検索するための単語グループを表す情報を生成させることを特徴とするドキュメント管理プログラム。
  5. 請求項4に記載のドキュメント管理プログラムにおいて、
    前記ドキュメント数条件は、前記対象ドキュメントの数に対する、前記検索の結果として得られるドキュメントの数の割合が、予め定めた値の範囲にあるとの条件であることを特徴とするドキュメント管理プログラム。
  6. 請求項5に記載のドキュメント管理プログラムにおいて、
    前記値の範囲は、単語グループの階層位置に応じて異なることを特徴とするドキュメント管理プログラム。
  7. 請求項3から6のいずれか一項に記載のドキュメント管理プログラムにおいて、
    前記単語グループの提示時には、各単語グループに含まれる単語のいずれかを含むとの検索条件とする検索の結果得られるドキュメントの数に関する情報を併せて提示させることを特徴とするドキュメント管理プログラム。
  8. 請求項1から7のいずれか一項に記載のドキュメント管理プログラムにおいて、
    前記ドキュメント保持手段は、ドキュメントを分類して保持しており、前記対象選出手段は、前記分類の少なくとも一部を特定する情報の入力を受けて、当該特定された分類に含まれるドキュメントを対象ドキュメントとして選出することを特徴とするドキュメント管理プログラム。
  9. 複数のドキュメントを保持するドキュメント保持手段にアクセス可能に接続されたコンピュータを用い、
    当該保持されている個々のドキュメントから、単語群を抽出する工程と、
    各単語が含まれているドキュメントの数に基づいて、前記単語群に含まれる単語の少なくとも一部を検索用キーワード候補として選択する選択工程と、
    を実行させ、
    当該選択した検索用キーワード候補を所定の検索処理に供することを特徴とするドキュメント管理方法。
  10. 複数のドキュメントを保持するドキュメント保持手段にアクセス可能に接続されたドキュメント管理装置であって、
    当該保持されている個々のドキュメントから、単語群を抽出する手段と、
    各単語が含まれているドキュメントの数に基づいて、前記単語群に含まれる単語の少なくとも一部を検索用キーワード候補として選択する手段と、
    を含み、
    当該選択した検索用キーワード候補が所定の検索処理に供されることを特徴とするドキュメント管理装置。
JP2004216982A 2004-07-26 2004-07-26 ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置 Expired - Fee Related JP4525224B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004216982A JP4525224B2 (ja) 2004-07-26 2004-07-26 ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004216982A JP4525224B2 (ja) 2004-07-26 2004-07-26 ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置

Publications (3)

Publication Number Publication Date
JP2006039811A true JP2006039811A (ja) 2006-02-09
JP2006039811A5 JP2006039811A5 (ja) 2007-08-09
JP4525224B2 JP4525224B2 (ja) 2010-08-18

Family

ID=35904765

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004216982A Expired - Fee Related JP4525224B2 (ja) 2004-07-26 2004-07-26 ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置

Country Status (1)

Country Link
JP (1) JP4525224B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009181166A (ja) * 2008-01-29 2009-08-13 Toshiba Corp 文書処理装置、方法及びプログラム
WO2010035412A1 (ja) * 2008-09-25 2010-04-01 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
WO2015011774A1 (ja) * 2013-07-22 2015-01-29 株式会社野村総合研究所 検索システム、検索プログラム、および検索条件入力方法
JP2017162190A (ja) * 2016-03-09 2017-09-14 富士通株式会社 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10334106A (ja) * 1997-05-27 1998-12-18 Fuji Xerox Co Ltd 関連語提示装置及び関連語提示用プログラムを記録した媒体
JPH1125108A (ja) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム
JP2000227917A (ja) * 1999-02-05 2000-08-15 Agency Of Ind Science & Technol シソーラスブラウジングシステムと方法およびその処理プログラムを記録した記録媒体
JP2001101199A (ja) * 1999-09-29 2001-04-13 Fuji Xerox Co Ltd 文書処理装置
JP2002123544A (ja) * 2000-10-13 2002-04-26 Tokyo Electric Power Co Inc:The 検索前処理装置、文書検索装置、検索前処理方法及び文書検索方法
JP2003271621A (ja) * 2002-03-19 2003-09-26 Fuji Xerox Co Ltd 分類結果表示装置及び分類結果表示方法、分類結果表示プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10334106A (ja) * 1997-05-27 1998-12-18 Fuji Xerox Co Ltd 関連語提示装置及び関連語提示用プログラムを記録した媒体
JPH1125108A (ja) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム
JP2000227917A (ja) * 1999-02-05 2000-08-15 Agency Of Ind Science & Technol シソーラスブラウジングシステムと方法およびその処理プログラムを記録した記録媒体
JP2001101199A (ja) * 1999-09-29 2001-04-13 Fuji Xerox Co Ltd 文書処理装置
JP2002123544A (ja) * 2000-10-13 2002-04-26 Tokyo Electric Power Co Inc:The 検索前処理装置、文書検索装置、検索前処理方法及び文書検索方法
JP2003271621A (ja) * 2002-03-19 2003-09-26 Fuji Xerox Co Ltd 分類結果表示装置及び分類結果表示方法、分類結果表示プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009181166A (ja) * 2008-01-29 2009-08-13 Toshiba Corp 文書処理装置、方法及びプログラム
WO2010035412A1 (ja) * 2008-09-25 2010-04-01 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
US8612202B2 (en) 2008-09-25 2013-12-17 Nec Corporation Correlation of linguistic expressions in electronic documents with time information
JP5387577B2 (ja) * 2008-09-25 2014-01-15 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
WO2015011774A1 (ja) * 2013-07-22 2015-01-29 株式会社野村総合研究所 検索システム、検索プログラム、および検索条件入力方法
JP6002328B2 (ja) * 2013-07-22 2016-10-05 株式会社野村総合研究所 検索システム、検索プログラム、および検索条件入力方法
JP2017162190A (ja) * 2016-03-09 2017-09-14 富士通株式会社 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法

Also Published As

Publication number Publication date
JP4525224B2 (ja) 2010-08-18

Similar Documents

Publication Publication Date Title
US20080021891A1 (en) Searching a document using relevance feedback
JP2003167914A (ja) マルチメディア情報検索方法、プログラム、記録媒体及びシステム
JP2005122295A (ja) 関係図作成プログラム、関係図作成方法、および関係図作成装置
JP2010003015A (ja) 文書検索システム
US20100257177A1 (en) Document rating calculation system, document rating calculation method and program
CN109857853B (zh) 基于电子书的搜索方法、电子设备及计算机存储介质
JP6533876B2 (ja) 商品情報表示システム、商品情報表示方法、及びプログラム
JP3584848B2 (ja) 文書処理装置、項目検索装置及び項目検索方法
JPH11102377A (ja) データベースからドキュメントを検索する方法および装置
JP5324677B2 (ja) 類似文書検索支援装置及び類似文書検索支援プログラム
JP4525224B2 (ja) ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置
JP2014102625A (ja) 情報検索システム、プログラム、および方法
JP4569179B2 (ja) ドキュメント検索装置
JP2000020538A (ja) 情報検索方法、情報検索装置および情報検索プログラム記憶媒体
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JP4389102B2 (ja) 技術文献検索システム
JP4426893B2 (ja) 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
JP5326781B2 (ja) 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム
JP4247026B2 (ja) キーワード頻度算出方法及びそれを実行するプログラム
JP2004334690A (ja) 文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体
JP2000090110A (ja) 全文検索方法、装置、および全文検索プログラムを記録した記録媒体
JP2003178057A (ja) フレーズ生成装置、フレーズ生成方法、及びプログラム
JP5262190B2 (ja) 入力補完装置、及び入力補完プログラム
JP4248828B2 (ja) 文書処理装置、文書処理方法及び記録媒体
JP2010501927A (ja) コンテンツ検索システムを搭載した情報端末機

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070625

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070625

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071112

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100524

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4525224

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140611

Year of fee payment: 4

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees