JP2008027134A - 文書管理装置及び文書管理方法ならびに文書管理方法を実行するプログラム - Google Patents

文書管理装置及び文書管理方法ならびに文書管理方法を実行するプログラム Download PDF

Info

Publication number
JP2008027134A
JP2008027134A JP2006198216A JP2006198216A JP2008027134A JP 2008027134 A JP2008027134 A JP 2008027134A JP 2006198216 A JP2006198216 A JP 2006198216A JP 2006198216 A JP2006198216 A JP 2006198216A JP 2008027134 A JP2008027134 A JP 2008027134A
Authority
JP
Japan
Prior art keywords
document
user
search
index
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006198216A
Other languages
English (en)
Inventor
Shuichi Morisawa
秀一 森澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006198216A priority Critical patent/JP2008027134A/ja
Publication of JP2008027134A publication Critical patent/JP2008027134A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 登録時のユーザ負担を軽くしつつ検索時の効率を上げる。
【解決手段】 ユーザの指定したキーワードに基づいて文書やフォルダなどのアイテムを検索し、検索の結果抽出されたアイテムを表示して当該アイテムに対するユーザの操作を受け付けることができる検索結果表示手段と、検索結果表示手段で示されたアイテムに対してユーザが操作を行った場合に実行された操作があらかじめ登録された操作のいずれかであることを判定する対象操作判定手段と、対象操作判定手段で判定された判定結果が正しい場合に検索で指定されたキーワードから当該アイテムに関連するものを抽出するキーワード抽出手段と、キーワード抽出手段により抽出されたキーワードを当該アイテムのインデックスとして登録するインデックス登録手段などから構成される。
【選択図】 図3

Description

本発明は、入力された文書画像にキーワードを付与して管理する文書画像管理装置、文書画像管理方法、文書画像検索装置、文書画像検索方法、文書画像管理システムおよび文書管理プログラムを記録した記録媒体に関するものである。
コンピュータの急激な普及に伴って、人々の扱う電子情報が急激に増加してきている。これら多量の電子情報のうちのあるものは、いわゆる文書管理システムにて管理されていることが多く見られる。
文書管理システムに文書を登録する場合、属性検索時の便を考慮してユーザインデックスを付与することが一般的であるが、この操作は文書登録者にとって煩わしい。ついついユーザインデックスなしに文書を登録してしまいがちであるが、その結果あとでその文書を検索する際は、作成日や作成者などシステムが自動的に付与する属性を頼りにするか、あるいは全文検索を行うしか手段がない。
しかるに、これらの手段で検索した結果には、ユーザが探していたものとは異なる文書、いわゆるノイズが大量に混じってしまうことが多く、所望する文書を短時間に探し出すことは困難となる。
また、適切なユーザインデックスが付与されていないと、ユーザが文書の内容を手軽に判断するための材料としてサムネールやプレビューしかなくなるが、サムネール作成に失敗した文書やプレビューを作成できない文書の場合にはその手段が絶たれるため、文書の内容確認のためにはわざわざダウンロードを行って適当なアプリケーションを起動し、文書を開く手間を余儀なくされる。
一方で、全文検索用のインデックスを作成する言語処理の際に、重要語と思われる単語を統計的に抽出し、それらをユーザインデックスとして勝手に付与する技術も考えられるが、付与された単語がユーザにとっては必ずしも検索時に有効でない場合もあり、属性検索時にかえって逆効果になる恐れもあった。
たとえば特許文献1では、入力手段からテキストデータとして入力された文書データ、あるいは、イメージデータ入力手段からイメージデータとして入力された文書をテキストデータ記憶領域に格納する。そして、単語抽出手段によってテキストデータ記憶領域に格納されたテキストデータに基づいて得られて単語記憶領域に格納された単語を、出現回数検出手段によって出現回数順に並べ変え、同じ出現回数の単語について強調回数検出手段によって強調回数順に並べ変える。そうすると、キーワード・文書名作成手段は、上記並べ変えが終了した単語のうち上位所定数の単語をキーワードとして文書データに付与するようにしている。この方法によれば、入力文書に数多く出現する複数の単語をキーワードとして選出して当該文書に付加しているため、当該文書に出現しない単語は、キーワードとして付加されることはないので、検索精度の面から問題があった。
検索のためのインデックス付けを効果的に行う、もしくは容易にするための手助けを行うような発明としては、従来これ以外にも以下のようなものが存在した。
特許文献2では、文を含むオブジェクト(文書データやフォルダ等)がその属性情報(検索キー、書誌情報、コメント、アイコン等)を付加して登録されたデータベースから、設定された設定属性情報に基づいて所望のオブジェクトを検索する検索装置において、上記属性情報とこの属性情報の類似属性情報とが対応付けられて格納された属性情報辞書と、上記オブジェクトの上記文中における特定の語を基本属性情報として抽出する基本属性情報抽出手段と、上記抽出された基本属性情報に基づいて、上記属性情報辞書を参照して当該基本属性情報の類似属性情報を検出する類似属性情報検出手段と、得られた当該基本属性情報とこの基本属性情報の類似属性情報を当該オブジェクトに付加する属性情報付加手段を備えたことを特徴とする検索装置が提案されている。
上記構成によれば、自動的にオブジェクトの基本属性情報とその基本属性情報の類似属性情報とが求められて、当該オブジェクトに付加されるため、当該オブジェクトに付加されている基本属性情報とその類似属性情報とに基づいて、精度の高い検索処理が行われる。
特許文献3では、文書をデジタル画像として入力し、該文書画像を複数のフォルダで管理する文書画像管理方法であって、前記フォルダ毎に予め所定のキーワードを設定しておき、前記フォルダに格納された前記文書画像に対して、前記設定されたキーワードを付与することを特徴とする文書画像管理方法が提案されている。
具体的な操作としては、文書画像をGUI画面上でアイコン表示し、前記文書アイコンをフォルダにドロップすることにより、前記文書画像に対して前記設定されたキーワードを付与するものである。
また特許文献3の発明においては、文書検索時に、キーワード付きフォルダを表示し、選択されたフォルダに関連するキーワードを用いて文書を検索する文書画像検索方法も併せて提案されており、検索時に使用したキーワードを付けたフォルダを作成したり、フォルダに関連するキーワードを用いて文書を検索し、続けて他のフォルダを選択してそのフォルダに関連するキーワードを用いて絞り込み検索を行った後、これらの検索時に使用したキーワードを付けたフォルダを作成したりすることが可能となっている。
特開平6-282571号公報 特開平11-272706号公報 特開2000-067066号公報
しかしながら、上述した従来の技術では、特許文献1のようにインデックス付けを完全に自動化することはできても、そのために検索精度の面や自動付与されるキーワードとユーザが検索時に実際に使用したい語とのずれなどが発生する恐れなどで不安な点が見受けられた。
また特許文献2ではインデックス付けを完全に自動化しなおかつ検索時の精度も向上させるために考案されたものであるが、当該発明を実施するために属性情報辞書を作成する必要が発生し、この作業はかなりの時間と労力を要する作業となり、簡単に実現できるものではなかった。さらに当該発明においては、自動的に付与されるキーワードは、オブジェクトに含まれる文中からピックアップされた単語と、その単語から属性情報辞書により検索された関連語のみであるから、ユーザが文書検索時に使用するキーワードと意味的、形式的に齟齬が生じる可能性があった。
また特許文献3の発明では、あらかじめ所定のフォルダに対してキーワードを設定しておく必要があり、その部分は人手による作業が発生するため、煩わしさを回避することはできなかった。
上記のような背景により、文書の登録時にも検索時にもユーザに過度の負担を強いず、かつ検索時にはユーザが意図した文書を効率よく検索できるという、使いやすい文書管理システムのためには、検索を行うユーザの視点に基づいた適切なユーザインデックスを自動的に付与してくれる発明が望まれていた。
上述した課題を解決するために、本発明は、
文書をデジタル画像として入力し、該文書画像を該文書画像より抽出された属性情報とともに管理する文書画像管理方法であって、
ユーザの指定したキーワードに基づいて文書やフォルダなどのアイテムを検索し、検索の結果抽出されたアイテムを表示して当該アイテムに対するユーザの操作を受け付けることができる検索結果表示手段と、
前記検索結果表示手段で示されたアイテムに対してユーザが操作を行った場合に実行された操作があらかじめ登録された操作のいずれかであることを判定する対象操作判定手段と、
前記対象操作判定手段で判定された判定結果が正しい場合に検索で指定されたキーワードから当該アイテムに関連するものを抽出するキーワード抽出手段と、
前記キーワード抽出手段により抽出されたキーワードを当該アイテムのインデックスとして登録するインデックス登録手段と、
を有することを特徴とする。
また本発明は上述した課題を解決するために、
前記インデックス登録手段により付与されるキーワードはユーザごとに固有であり、当該ユーザ以外のユーザには表示されないことを特徴とするインデックスを有する。
また本発明は上述した課題を解決するために、
前記インデックス登録手段は1個のアイテムに対し複数個のキーワードを付与することを特徴とするインデックスを有する。
また本発明は上述した課題を解決するために、
前記対象操作判定手段で該当すると判定された場合に対象操作に応じて前記インデックス登録手段によりキーワードが付与されるインデックスを変更することを特徴とするインデックス登録手段を有する。
また本発明は上述した課題を解決するために、
ユーザが前記アイテムに対して行う操作の種別をシステムに登録するための対象操作登録手段を持ち、前記対象操作判定手段が判定のために参照する条件は前記対象操作登録手段によりユーザ単位に設定することが可能なことを特徴とする。
文書登録時にユーザインデックスを設定しなくても、検索でヒットして操作するとシステムインデックスが自動付与されることにより、以下のような効果が得られる。
ユーザが検索で使用した実用的な単語がシステムインデックスとして付与されるので、文書登録時に適切なインデックスを考えたり、入力したりする面倒な作業から解放される。
操作を繰り返すうちに、文書の検索において属性検索だけで全文検索と同じ効果が得られるようになるため、ノイズの少ない効率的な検索が可能となり、目的の文書に短時間で到達できるようになる。
過去の検索時のキーワードは、ユーザにとっての文書の特質を表すものと考えられるため、いちいち文書の内容を表示させなくても文書のプロパティ画面を表示してシステムインデックスを見るだけで文書の内容を適切に判断できる。これはサムネールやプレビューを持たない文書に対してとりわけ有効である。
さらには、自動的に付与されるシステムインデックスを複数持ち、操作種別ごとにことなるシステムインデックスを関連づけるようにし、ユーザが行った操作ごとに値を付与するインデックスを切り替えることにより、次回に同じユーザが検索を行う際には指定するキーワードとあわせて行った操作を手がかりとして属性検索を行うことができ、ユーザの検索時の効率をさらに向上させるという効果も期待できる。
(実施例1)
図1は、本発明における文書管理システムを実現するための基本構成を示した図である。
108は検索部であり、ユーザからの検索リクエストに応じてアイテム及びインデックス格納部109に格納されたアイテムから適合するものを検索し、検索結果表示手段101に渡す。アイテムを検索する際の対象や検索アルゴリズムの違いにより、検索には大きく分けて4つの種類が存在する。1つ目は属性検索と呼ぶべきものであり、2つ目はいわゆる全文検索と呼ばれているもの、3つ目はいわゆる概念検索と称されるところのもの、そして4つ目は類似検索と呼ぶべきものである。そこで、これらの検索方法の概要について順に説明する。
属性検索はアイテムの持つ様々な属性をユーザが検索キーワードとして指定するものであり、属性検索が実行されるとシステムは検索キーワードに一致する属性を持ったアイテムをアイテム及びインデックス格納部109の中から検索する。
属性は大きく2種類に分類され、文書の登録時にシステムが自動的に作成するいわゆる書誌情報と呼ばれるものと、ユーザが指定するものとに分けられる。ユーザが指定する属性には、ユーザが必要に応じて文書の登録時もしくは登録後の任意のタイミングでキーワードとして付与することのできるユーザインデックスと呼ばれるものと、任意の文字列を自由に指定できるコメントとに分けられる。
文書が有する属性のうちの書誌情報の例としては、文書名、拡張子などによって決まる文書タイプ、URL、作成者、作成日、ページ数、バージョン数、サイズ、更新日時、属性更新日時、アクセス日時、アクセス権設定などがある。またフォルダが有する属性のうちの書誌情報としては、フォルダ名、URL、作成者、作成日、フォルダ管理者、サイズ、文書数、更新日時、属性更新日時、アクセス日時、メール通知設定、初期表示設定、保存期限設定、アクセス権設定などが考えられる。
ユーザインデックスは単にインデックスとも呼ばれ、管理者であるユーザがあらかじめインデックスの種類とタイプを定義しておき、文書の登録時に、または登録後の任意のタイミングにて、文書プロパティを編集する権限を有する任意のユーザが検索時の便宜を考慮して好みの値を設定できるようになっている。
図4は、管理者ユーザがインデックスを定義するときの画面例を示したものである。この例ではインデックス名が「新聞名」というインデックスを管理者ユーザが定義しているところを示している。
文書登録時の設定およびフォルダ登録時の設定は、設定する項目をプルダウンメニューで選択するようになっており、それぞれ「任意」「推奨」「必須」のうちから選択することができる。たとえば、文書登録時の設定に対して「任意」を選択し、フォルダ登録時の設定に対して「必須」を選択した場合、文書を登録するときには、インデックス名が「新聞名」に相当するインデックスに対しては値を設定しても設定しなくてもどちらでもよいが、フォルダを作成するときには、インデックス名が「新聞名」に相当するインデックスに対して必ず値を設定しなければならない、という設定がなされることになる。またこれら2つの設定に対して「推奨」を選択した場合には、文書の登録またはフォルダ作成時にそれらのインデックス名が「新聞名」に相当するインデックス値をなるべく設定するよう推奨する、という管理者の意図を表した設定となる。
インデックスタイプは、「完全選択型」「選択型(ユーザによる自由入力可)」「数値型」「日付型」「文字列型」のうちから選択するようになっている。
「完全選択型」または「選択型(ユーザによる自由入力可)」を選択した場合には、管理者があらかじめ用意したいと考える選択肢を設定することができ、選択肢欄に選択肢としたい文字列を入力して追加ボタンを押すと選択肢一覧の中に追加される。そのため文書を登録するかまたはフォルダを作成するユーザは、インデックスタイプが完全選択型」または「選択型(ユーザによる自由入力可)」に設定されたインデックスに対して値を設定する際には、管理者ユーザによりここで定義され、プルダウンメニュー等で一覧が表示される選択肢の中から選択して設定することができる。
なお「完全選択型」は、管理者ユーザがあらかじめ用意した選択肢の中からしか値を設定できず、文書登録またはフォルダ作成を行なうユーザが独自に決めた値を設定することはできない設定である。また他方の「選択型(ユーザによる自由入力可)」は、管理者ユーザがあらかじめ用意した選択肢から値を選択して設定することも可能だが、文書登録またはフォルダ作成を行なうユーザが自由に値を入力することも可能となる設定であり、ユーザにより独自に入力された値については、次回からは選択肢の中に表示されるため、次回には選択肢として選択可能となる。
「数値型」「日付型」「文字列型」はそれぞれ、数値、年月日、文字列を表現するためのインデックスであることを示し、さらに「数値型」を選択した場合には小数部の桁数を指定することが可能となっている。
図5は、図4で上述のようにして定義されたインデックスの一覧を表示する画面の例を示したものである。ここでは上述した「新聞名」というインデックスのほかに「カテゴリ」「朝刊夕刊」というインデックス名のインデックスが管理者ユーザにより作成されていることを示しており、それぞれの文書登録時の設定、フォルダ作成時の設定、インデックスタイプは図に示したように設定されている。また詳細ボタンを押下することにより、各インデックスの選択肢の情報などが表示される。以上述べたのが属性および属性検索の概要である。
次に全文検索についてその概要を簡単に説明する。全文検索は、文書の内容に含まれる語をキーワードとして指定して検索するもので、そのためには文書の中身についてOCR処理を行ってそこに含まれる文字列をテキストとして抽出し、その後言語解析により適当な長さの文字列かまたは言語辞書を参照しながら単語ごとに区切ってインデックスを作成する作業が前もって必要となる。このように各文書のテキストからそこに含まれる一定長の文字列や単語をインデックスファイルに登録しておくことにより、検索時にはユーザが指定したキーワードを含む文書をすばやく検索することができる。
3つ目の概念検索であるが、これは文書に含まれる単語の類似性に基づき、検索要求された文章の意図を推測、同様の概念を含む文書を探し出すものであり、同一の単語が含まれていなくても、概念的に近似の文書を探し出すことができ、ユーザの意図する的確な文書を検索できる。具体的には、例えば『モバイル関連機器の市場規模』という検索要求がなされたとすると、「モバイル」「機器」「市場」のキーワードに基づいて文書概念ベクトルが生成され、各ベクトル間の類似判定がなされるため、キーワードを含まなくとも内容全体が類似している文書が検索される。
最後に類似検索であるが、これはある文書をキーとしてそれに内容的に近い文書を検索するものであり、検索アルゴリズム的には上述した概念検索の中で用いられるベクトル空間モデルの手法により実現されていることが一般的である。
図1にもどって、このように検索部108はユーザの検索方式の指定に従って、上述したとおり3つの異なる方式により検索を実行してその結果を検索結果表示手段101に渡す。
図6は、検索結果表示手段101が検索部108により渡された検索結果の内容を表示した画面の例を示すものである。
画面上部には、機能ボタン601が配置されている。これらは検索結果の中に表示されたアイテム、すなわちユーザの検索条件にヒットした文書やフォルダに対する操作を実行するためのもので、ここではプロパティ表示、プレビュー、コピー、移動、ダウンロード、チェックアウト、チェックイン、類似検索、印刷、削除の各機能が実行できるようになっている。これらのボタンの押下により、後述する操作実行部107により選択された操作の実行が行われる。
プロパティ表示ボタンは、検索結果の中から選択した文書またはフォルダのプロパティを表示するためのものである。ここでプロパティとは、文書やフォルダの持つ属性や各インデックスに付与されたインデックス値、その文書やフォルダに対する権限を定義したアクセス権設定情報の総称である。図7はプロパティ画面の例を示したものである。
プレビューボタンは、検索結果の中から選択した文書の内容を表示するためのものであり、ユーザが参照したい文書をユーザのクライアントPCにダウンロードして開くことなしに、文書管理サーバ上で文書の内容を確認することができる。
コピーボタンは選択した文書またはフォルダをコピーするものであり、また移動ボタンは選択した文書またはフォルダを別の場所に移動するものである。
ダウンロードボタンは、選択した文書をユーザのローカル環境にダウンロードするものである。
チェックアウトボタンは、文書を他のユーザが更新できないように一時的にロックするもので、ユーザが編集等の作業を行う際に他のユーザによる更新を防ぐ目的のためのものである。
チェックインボタンは、チェックアウトされた文書に対して版を追加する操作のためのものであり、ユーザはチェックアウトした文書に対してチェックイン操作で編集後の文書または新規の文書を指定することにより、当該文書の新しいバージョンとして版を追加することができる。
類似検索ボタンは、選択した文書に内容または画像の特徴などが類似した文書を検索するためのもので、検索結果より任意の一文書を選択して類似検索を実行すると、それに類似した文書の一覧が検索結果表示手段101により再び画面上に図6と同様に表示される。
印刷ボタンは、選択した文書の内容を文書管理サーバとネットワークで接続された印刷装置に対して印刷を実行させるものである。
削除ボタンは、選択した文書またはフォルダをごみ箱に入れる操作を行う。
続いて図6の602はフォルダツリーを表しており、文書管理システム上でユーザが参照する権限を有するすべてのフォルダ構成が表示される。この図では、ユーザが検索を実行した時点で開いていたフォルダのフォルダ名が「支店」であることを示している。
603は検索結果を表示する部分であり、ユーザが指定した検索条件に合致した文書やフォルダの一覧が表示される。ここで各アイテムの左端に置かれた「□」はいわゆるチェックボックスと呼ばれるもので、上述した機能ボタン601を実行する前にその対象とするアイテムを選択するためにチェックするものである。名前は文書またはフォルダの名称、フォルダパスはその文書またはフォルダが格納されているフォルダ階層上の位置を示し、以下各アイテムの書誌情報等が表示されている。
再び図1に戻って、107は操作実行部であり、検索結果表示手段101が表示する検索結果画面から選択された操作を実行する。
105は対象操作登録手段である。本手段により文書管理システム全体の管理者は、検索結果表示画面から検索結果に対してユーザによりなされた操作のうち、どの操作をインデックス付与の対象とするかをあらかじめ設定しておくことができる。すなわち、ここで検索結果表示画面より選択されたアイテムに対して、ここで登録された操作がユーザにより実行された場合には、当該アイテムのシステムインデックス値として、検索時にユーザにより指定されたキーワードが後述するキーワード抽出手段により抽出されて設定されることになる。
図2は、前記対象操作登録手段105により対象操作を登録する際のフローを示した図である。まず文書管理システムの管理者は対象操作登録画面を開く(ステップ201)。そこで文書管理システム管理者は対象操作を選択する(ステップ202)。
図10は対象操作登録画面の例を示したものである、ここでは対象操作として「ダウンロード」「類似検索」「印刷」の3つの操作が設定されていることを示している。
最後に文書管理システム管理者は選択した操作を対象操作として登録する(ステップ203)。
106は対象操作種別記憶部であり、前記対象操作登録手段105で設定された対象操作を記憶しておくためのものである。
なおここでは対象操作の登録は文書管理システム全体の管理者が行うという前提、すなわち設定された対象操作はシステム全体で一通りであるとしたが、対象操作の登録の権限を一般のユーザに委譲することにより、ユーザ一人一人が自分に併せて登録する操作を互いに異なるように設計することも可能である。
図8はこのようにしてシステムインデックス値が付与された文書のインデックス情報の例を示したものである。この例では、まずユーザがキーワードとして「会議」という文字列を指定して全文検索を実行し、ヒットした文書の一覧が検索結果表示画面に表示された中から、図13に示した内容を持った文書を選択して機能ボタン601の中から「ダウンロード」を実行した場合を想定している。図13に示された内容のとおり、本文中に「会議」という文字列が含まれているため、本文書はユーザの検索条件に当てはまる、すなわち指定されたキーワードにマッチするため、検索結果の一覧に本文書が含まれることになる。
なおシステムインデックスの内容は、複数個の値を持つことができ、またユーザごとに固有の値を持って当該ユーザ以外には設定された値が見えないように設計することも可能である。さらにシステムによって自動付与されたシステムインデックス値は当該ユーザの操作により任意のタイミングで自由に削除することも可能である。
図1に戻って、102は対象操作判定手段であり、前記操作実行部107により実行された操作の種別が、前記対象操作種別記憶部106に記憶された操作の中にあるか否かを判定するためのものである。
103はキーワード抽出手段であり、前記対象操作判定手段102により判定された結果が正しい場合に、前記操作実行部107により実行された検索処理においてユーザから指定された検索キーワードを抽出し一時的に記憶しておくためのものである。
104はインデックス登録手段であり、前記キーワード抽出手段103により記憶されたユーザの検索キーワードを前記検索結果表示手段101から選択され実行対象となった文書のシステムインデックスに値として登録するためのものである。
109はアイテム及びインデックス格納部であり、ユーザにより作成されたフォルダの情報や登録された文書の内容、また検索用の各種インデックス情報を格納しておくためのものである。
次に図3のフローチャートを参照しながら、本発明の動作について順を追って説明する。検索を行いたいユーザはまず。文書管理システムのメイン画面から検索ボタンの押下等の操作により検索画面を表示する(ステップ301)。そこでユーザはキーワードの入力欄に好みのキーワードを入力する(ステップ302)。
図9はキーワード入力欄にユーザがキーワードを入力した画面の例を示すものである。この例では、ユーザは3つのキーワード「温暖化」「環境問題」「京都会議」を指定し、これらのキーワードのOR検索で全文検索を実行するところを示している。ここで「OR検索」かつ「全文検索」を実行するとは、各キーワード入力欄で指定したキーワードのうちの少なくともいずれか1つを文書本文中に含む文書をすべて検索する要求を意味している。したがって本検索の結果としては、文書本文に「温暖化」または「環境問題」または「京都会議」のいずれかの語句を少なくとも1つは含むような文書がヒットすることになる。
このようにしてユーザがキーワードおよび検索条件を入力すると、図9の実行ボタンを押下することにより検索を実行する(ステップ303)。システムは前記検索部108により検索を実行し、前記検索結果表示手段101に検索結果を表示する(ステップ304)。
図15は、図9で示した検索キーワードおよび検索条件により検索を実行した結果を表示した例を示したものである。この画面は図6で示した検索結果表示画面のうちで右下部分を占める検索結果のフレームのみを示している。ここでは4つの文書がヒットしており、各文書の文書名はそれぞれ「国連軍縮会議議事録第95号」「オゾンホールについて」「新聞記事抜粋1210」「青年会だより」となっている。また各文書の文書管理システム内での格納場所を示すフォルダパスや作成者、作成日などの属性情報は、それぞれ図に示すとおりとなっている。
次にユーザは検索結果として示された各アイテムに対して何らかの操作を行うためアイテムのいずれかを選択するか、または本検索結果を放棄するかの、いずれかの行動を取ることになる。もしユーザが本結果に納得ができず、別のキーワードまたは検索条件により再び検索を再実行するか、あるいは検索を終了したい場合には、図6の戻るボタンを押下することでメイン画面に戻る(ステップ305の分岐NO)ことで図3での本処理を終了する。
他方、ユーザが本検索結果に対して何らかのアクションを行いたい場合には、まず操作を行う対象であるアイテムを選択する必要がある(ステップ305の分岐YES)。そこでまずユーザは検索結果である各アイテムの内容を確認したいと考え、文書のプレビューを行った場合の手順を説明する。
ユーザは図15に示した検索結果の一覧の中から、先頭の文書である「国連軍縮会議議事録第95号」の前のチェックボックスにチェックし、同じく検索結果表示画面内にある機能ボタン(図6の601)からプレビューボタンを押下する。するとプレビュー画面が表示され、文書「国連軍縮会議議事録第95号」の内容が表示される。図11はこのようにして表示された本文書の内容を示したものである。本文書の本文中には「京都会議」という語句が含まれているため、図9で指定したキーワードのうちのひとつにヒットしたことがわかる。
ここでシステムはプレビュー機能を実行したあとで本操作がシステムインデックス自動付与処理の対象操作であるかどうかを判定する(ステップ306)。ここでは対象操作として先に説明した図10のように登録されていると、今回ユーザにより実行されたプレビューは対象操作ではないため、ステップ307およびステップ308は処理を行わずに、ステップ309にあるように単にプレビュー操作を実行するだけとなる。そして上述したように当該文書のプレビューを実行し、プレビュー画面がユーザにより閉じられると、元の検索結果表示画面に戻る(ステップ309〜ステップ305)。
ユーザはプレビュー機能により本文書の内容を確認したあと、次に検索結果の一覧の中から、二番目の文書である「オゾンホールについて」を選択し同様にプレビューを行ったとする(ステップ305の分岐YES)。図12は本文書の内容を示したものであり、ここでは本文中に「温暖化」および「環境問題」という検索キーワードで指定された2つの語句がそれぞれ含まれているため、検索結果に出現したものである。ここでも前回と同様にシステムインデックス自動付与処理の対象でない操作が実行されたため、ステップ306での判定結果はNOとなり、ステップ309を処理したあと再びステップ305に戻る。
同様にユーザは検索結果の一覧の中から、三番目の文書である「新聞記事抜粋1210」(図13参照)と四番目の文書である「青年会だより」(図14参照)のプレビューをそれぞれ実行したあと、次に検索結果の一覧から三番目の文書である「新聞記事抜粋1210」を選択して図6の機能ボタン601からダウンロードボタンを押下したとする。システムはユーザにダウンロードダイアログを表示してユーザにダウンロード先を指定させ、ダウンロードを実行するとともに、ダウンロード操作がシステムインデックス自動付与処理の対象操作であるかどうかを判定する(ステップ306)。図10によれば本操作は対象操作として登録されているため、ステップ306の判定はYESとなり、ステップ307に進む。
ここではユーザが検索キーワードとして指定した語句の中から、システムインデックス自動付与処理の対象操作である操作を行った文書にインデックス値として登録するための候補を決定する処理を行う。図9の例では検索方法として全文検索が行われているので、検索キーワードとして指定されたすべての語句をシステムインデックスに付与する候補と決定される。決定の手法は検索方法の違いやAND検索かまたはOR検索であるかの違いによってアルゴリズムを変更することが可能である。さらには、当該文書のユーザインデックスに付与されたすべてのインデックス値と比較して、それらと重複するものについてはシステムインデックスとして付与しないなどの方法も考えられる。あるいはまた、検索キーワードが当該文書の本文に含まれている場合に、文書中でその語句が一定値以上の重要度を持っているときに限りシステムインデックスとして付与することも考えられる。この場合の語句の重要度の算出方法としては、文書の自動分類技術で用いられるような日本語解析処理および統計的処理を行うのが一般的であると考えられる。
そしてステップ308において、ステップ307で決定された候補を当該文書のシステムインデックスの値として付与する処理が行われる。図16は本処理が行われた直後の当該文書のインデックス情報を示している。ここでは、ユーザが検索時に指定した3つのキーワード「温暖化」「環境問題」「京都会議」がすべて、ダウンロード操作がなされた文書のシステムインデックスの内容として追加されていることを表している。
(実施例2)
ここでは請求項4に記載の発明に関して実施例を述べる。
図17は対象操作登録手段105により対象操作を登録する際のフローを示した図である。ここでステップ1701、ステップ1702については図2の201〜202と同じであるため説明を省略する。ステップ1703では、ステップ1702で指定した各操作に対応するシステムインデックス名を指定する。すなわち、対象操作のそれぞれに対して、その操作が行われた場合に検索キーワードを値に付与するシステムインデックスを区別できるようになる。
図18は対象操作として選択された各操作に対して、それぞれが関連するシステムインデックスの名前を定義する画面の例を示したものである。ここでは図10のとおりに対象操作が選択されたとすると、インデックス名指定画面には3つの操作「ダウンロード」「類似検索」「印刷」のそれぞれに対して関連付けるシステムインデックス名を入力するようになる。図ではそれぞれのシステムインデックス名として「インデックス1」「インデックス2」「インデックス3」とユーザによって入力されたところを示している。
そしてステップ1704で対象操作登録を実行することにより本処理を終了する。
続いてこれらのシステムインデックスに値が付与される処理について、再び図3を参照しながら説明する。ユーザが検索画面図9のようにキーワードを指定して検索した結果、図15のような検索結果が得られたとする。そしてユーザは二番目の文書「オゾンホールについて」を選択して機能ボタン601より印刷を実行したとする。
すると図3のステップ306で印刷が対象操作であると判断されるため、検索キーワードよりインデックス候補を抽出し(ステップ307)、印刷に対応したシステムインデックスである「インデックス3」の当該文書の持つ値としてここで抽出したインデックス候補を付与する。
図19はこのようにしてキーワードが付与されたあとの当該文書のインデックス情報を示したものである。インデックス名「朝刊夕刊」「カテゴリ」「新聞名」の3つのインデックスはユーザ自身で値を付与するユーザインデックスであり、これはすでに図のとおり値が付与されているとする。一方、「インデックス1」「インデックス2」「インデックス3」の3つのインデックスは、図18で指定したシステムインデックスであり、ユーザが検索結果画面より対象操作をして登録された操作を行ったときにシステムにより自動的に値が付与されるべきものである。ここではユーザが当該文書に対して印刷操作を行ったので、これに定義づけられた「インデックス3」の値として、抽出されたインデックス候補である「温暖化」「環境問題」「京都会議」の3つの語句が付与されたことを示している。
以上説明したように、実施例2では対象操作として登録された各操作に固有のシステムインデックスに対して値が自動的に付与されるため、次回に同じユーザが検索を行う際には指定するキーワードとあわせて行った操作を手がかりとして属性検索を行うことが可能となり、ユーザの検索時の効率をさらに向上させることができる。
本発明の基本構成を示す図である。 インデックス自動付与対象となる操作を登録する際のフローを示す図である。 本発明の基本動作の流れを示すフローチャートである。 インデックスを新規に定義する画面の例を示した図である。 定義されたインデックスの一覧を表示する画面の例を示した図である。 検索結果表示画面の例を示す図である。 文書のプロパティ画面の例を示す図である。 文書のインデックス情報の例を示す図である。 検索画面の例を示す図である。 対象操作の設定画面の例を示す図である。 文書のプレビューを行った画面の例である。 文書のプレビューを行った画面の例である。 文書のプレビューを行った画面の例である。 文書のプレビューを行った画面の例である。 検索結果表示画面に検索結果が表示された例を示す図である。 システムインデックスに値が追加された例を示す図である。 実施例2における対象操作登録のフローチャートである。 実施例2におけるインデックス名指定画面の例である。 キーワードが付与されたあとのインデックス情報を示す図である。
符号の説明
101 検索結果表示手段
102 対象操作判定手段
103 キーワード抽出手段
104 インデックス登録手段
105 対象操作登録手段
106 対象操作種別記憶部
107 操作実行部
108 検索部
109 アイテム及びインデックス格納部
601 機能ボタン
602 フォルダツリー表示部
603 検索結果表示部

Claims (5)

  1. 文書をデジタル画像として入力し、該文書画像を該文書画像より抽出された属性情報とともに管理する文書画像管理方法であって、
    ユーザの指定したキーワードに基づいてアイテムを検索し、検索の結果抽出されたアイテムを表示して当該アイテムに対するユーザの操作を受け付けることができる検索結果表示手段と、
    前記検索結果表示手段で示されたアイテムに対してユーザが操作を行った場合に実行された操作があらかじめ登録された操作のいずれかであることを判定する対象操作判定手段と、
    前記対象操作判定手段で判定された判定結果が正しい場合に検索で指定されたキーワードから当該アイテムに関連するものを抽出するキーワード抽出手段と、
    前記キーワード抽出手段により抽出されたキーワードを当該アイテムのインデックスとして登録するインデックス登録手段と、
    を持つことを特徴とする文書管理システム。
  2. 前記インデックス登録手段により付与されるキーワードはユーザごとに固有であり、当該ユーザ以外のユーザには表示されないことを特徴とする請求項1に記載の文書管理システム。
  3. 前記インデックス登録手段は1個のアイテムに対し複数個のキーワードを付与することを特徴とする請求項1に記載の文書管理システム。
  4. 前記対象操作判定手段で該当すると判定された場合に対象操作に応じて前記インデックス登録手段によりキーワードが付与されるインデックスを変更することを特徴とする請求項1に記載の文書管理システム。
  5. ユーザが前記アイテムに対して行う操作の種別をシステムに登録するための対象操作登録手段を持ち、前記対象操作判定手段が判定のために参照する条件は前記対象操作登録手段によりユーザ単位に設定することが可能な請求項1に記載の文書管理システム。
JP2006198216A 2006-07-20 2006-07-20 文書管理装置及び文書管理方法ならびに文書管理方法を実行するプログラム Withdrawn JP2008027134A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006198216A JP2008027134A (ja) 2006-07-20 2006-07-20 文書管理装置及び文書管理方法ならびに文書管理方法を実行するプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006198216A JP2008027134A (ja) 2006-07-20 2006-07-20 文書管理装置及び文書管理方法ならびに文書管理方法を実行するプログラム

Publications (1)

Publication Number Publication Date
JP2008027134A true JP2008027134A (ja) 2008-02-07

Family

ID=39117708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006198216A Withdrawn JP2008027134A (ja) 2006-07-20 2006-07-20 文書管理装置及び文書管理方法ならびに文書管理方法を実行するプログラム

Country Status (1)

Country Link
JP (1) JP2008027134A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009271583A (ja) * 2008-04-30 2009-11-19 Murata Mach Ltd 通信端末装置
JP2010140136A (ja) * 2008-12-10 2010-06-24 Konica Minolta Business Technologies Inc 画像処理装置、画像データ管理方法、およびコンピュータプログラム
JP2011014092A (ja) * 2009-07-06 2011-01-20 Ufit Co Ltd グループウェアサイト内のコンテンツの検索システム
US11593386B2 (en) 2020-03-13 2023-02-28 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium
CN116629804A (zh) * 2023-06-06 2023-08-22 河北华正信息工程有限公司 一种信访督查跟踪管理***及管理方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009271583A (ja) * 2008-04-30 2009-11-19 Murata Mach Ltd 通信端末装置
JP2010140136A (ja) * 2008-12-10 2010-06-24 Konica Minolta Business Technologies Inc 画像処理装置、画像データ管理方法、およびコンピュータプログラム
JP4645731B2 (ja) * 2008-12-10 2011-03-09 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像データ管理方法、およびコンピュータプログラム
JP2011014092A (ja) * 2009-07-06 2011-01-20 Ufit Co Ltd グループウェアサイト内のコンテンツの検索システム
US11593386B2 (en) 2020-03-13 2023-02-28 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium
CN116629804A (zh) * 2023-06-06 2023-08-22 河北华正信息工程有限公司 一种信访督查跟踪管理***及管理方法
CN116629804B (zh) * 2023-06-06 2024-01-09 河北华正信息工程有限公司 一种信访督查跟踪管理***及管理方法

Similar Documents

Publication Publication Date Title
JP3870666B2 (ja) 文書検索方法および装置並びにその処理プログラムを記録した記録媒体
US8069173B2 (en) Information processing apparatus and method of controlling the same, information processing method, and computer program
JP2010086455A (ja) 検索条件指定装置、検索条件指定方法及びプログラム
JP2008027134A (ja) 文書管理装置及び文書管理方法ならびに文書管理方法を実行するプログラム
US20080140608A1 (en) Information Managing Apparatus, Method, and Program
KR102463120B1 (ko) 문서 다운로드시 사용자 맞춤형 파일명 생성 기능을 제공하는 특허 문서 검색 서버 및 이를 이용한 특허 문서 검색 방법
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JP2005011055A (ja) 電子帳票設計管理方法及び装置並びに処理プログラムと記録媒体
JP2009093581A (ja) 類義語検索管理システム
JP7340952B2 (ja) テンプレート検索システムおよびテンプレート検索方法
JP2004046870A (ja) 情報単位群操作装置
JP6287192B2 (ja) 情報処理装置、情報処理方法、プログラム
JP2004157965A (ja) 検索支援装置、検索支援方法、プログラムおよび記録媒体
JPH117452A (ja) ネットワークを介した情報収集方法および装置と該方法を実施するプログラムを記録した記録媒体
JP3933407B2 (ja) 文書処理装置、文書処理方法および文書処理プログラムが格納された記憶媒体
JP2009123067A (ja) 用語辞書生成方法、用語辞書生成装置、プログラム、および記録媒体
JP2002163273A (ja) 文書管理方法およびシステム
JP2004234582A (ja) 辞書構築方法,システム及び画面
JPH07175811A (ja) 電子文書管理装置
JP6521118B2 (ja) 情報処理装置、情報処理方法、プログラム
JP2010097296A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム
JP2001028007A (ja) ファイル管理装置及び記録媒体
KR101802284B1 (ko) 파일 저장위치의 추상화 저장방법과 이를 위한 추상화 저장시스템
JP2004288151A (ja) 操作履歴管理装置、操作履歴管理方法、および操作履歴管理プログラム
JP2003173343A (ja) 文書管理装置及び文書表示方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20091006