JP5247177B2 - 文書管理装置、文書管理方法およびプログラム - Google Patents

文書管理装置、文書管理方法およびプログラム Download PDF

Info

Publication number
JP5247177B2
JP5247177B2 JP2008029583A JP2008029583A JP5247177B2 JP 5247177 B2 JP5247177 B2 JP 5247177B2 JP 2008029583 A JP2008029583 A JP 2008029583A JP 2008029583 A JP2008029583 A JP 2008029583A JP 5247177 B2 JP5247177 B2 JP 5247177B2
Authority
JP
Japan
Prior art keywords
document
information
user
index
user characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008029583A
Other languages
English (en)
Other versions
JP2009187485A (ja
Inventor
紀子 松澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008029583A priority Critical patent/JP5247177B2/ja
Priority to US12/365,749 priority patent/US20090204607A1/en
Publication of JP2009187485A publication Critical patent/JP2009187485A/ja
Application granted granted Critical
Publication of JP5247177B2 publication Critical patent/JP5247177B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は文書管理方法、文書管理装置、情報処理装置および文書管理システムに関する。例えば、ユーザの所属部門や役職などの特性を用いて、文書データの登録時に後で文書データを検索する際に用いるインデックス情報を設定するなどの文書データの管理を行う技術に関するものである。
現在の文書管理システムでは、インデックス情報のうちカテゴリはあらかじめ管理者が設定しておき、文書登録時にインデックス名に対応するインデックス値を設定するものが多い。また、インデックス値に関しては、管理者があらかじめ入力したものから一般ユーザが選択して設定するか、もしくは、一般ユーザが任意に入力した入力値を設定するというシステムが多い。ここで、インデックス情報には、カテゴリ(インデックスの項目/項目名を指す)とインデックス値(インデックスの項目に対して設定する値を指す)とが含まれる、と定義する。
ユーザは、このように文書データに設定したインデックス情報を利用して文書データの検索を行い、所望の文書データを特定することが可能となる。
しかし、上述したような一般ユーザの使い方では、必ずしもユーザが設定するインデックス情報が統一のとれた文字列とは限らない。例えば、類似の文字列で、意味は同じであるが同じ文字列ではない場合(“文書保存”と“文書登録”のような表現の違いなど)は、インデックス情報による検索を行ってもヒットしない文書が存在する場合がある。
また、一般ユーザがインデックス情報による検索を行う際、ユーザには直接関係ない文書(他部門の作成した文書で参照不可に設定された文書など)もヒットするというシステムも存在する。この場合は、ユーザが実際にヒットした文書の中から当文書を開こうとした際に、アクセス権がないことが判明する場合がある。
そこで、上記問題を解決するための従来例として、スキャンデータにOCR処理を施して、その結果からインデックス情報を取得する際に、適切なインデックス情報を採用するために、次のようなシステムが提案されている。まず、OCR処理の結果として得た言葉が、一般的に使用されている言葉であるか否かを“言語データベース”を使用して判断する。次に、過去に採用された言葉であるかを“知識データベース”を使用して判断する。その結果、適切なインデックス情報であると決定した場合に、インデックス情報として採用する(特許文献1を参照)。
また、上記問題を解決するための別の従来例として、ユーザ認証を行い、さらにユーザに検索キーワードとしてインデックス情報を入力させて、その入力されたインデックス情報による検索を行う。その際、ユーザのアクセス権のある文書のみを検索対象にするなどの処理で、ユーザのアクセス権を考慮した検索を提供するシステムが提案されている(特許文献2を参照)。
特開2006−172083公報 特開2001−344245公報
文書管理システムに文書登録する際のインデックス情報を設定する目的の1つとして、「保存した文書や情報の再利用」が挙げられる。ここで、システム上に登録された文書データなので再利用する対象者は文書の登録者のみでなく、システム利用者の全てである。しかし、システムに登録された文書データは、システム利用者の全てにとって同じ重要性を持つとは限らない。例えば、特に同じ業務に携わり、同じ組織に所属するような登録者が登録した文書データは、登録者とよく似たユーザ特性をもつ他のユーザにとって、業務上とても関連のある文書データであり、再利用が促進されることが望まれる。
しかし、文書に設定するインデックス情報に関して、文書データを登録するユーザによってまちまちな用語が用いられた場合は、検索時にヒットしない文書データがあり、この目的を達成しづらくなってしまう。
さらに、複合機等で紙データをスキャンし、インデックス情報を付与して文書管理システムに保存する場合には、複合機上の小さなユーザインタフェース(UI)画面でのインデックス情報の設定は非常に手間が掛る。そのため、入力に時間がかかってしまったり、入力ミスの可能性があったりする。
前記特許文献1においては、文書情報から、システムを利用する全てのユーザが過去に使用した履歴がある用語を用いて、インデックス情報の設定を行うことが出来る。しかし、部門やプロジェクトなどの自分に近いユーザに限定した履歴を使用する方法については言及されていないため、担当分野が異なるユーザが過去に使用した用語でもインデックス情報に設定されてしまうことになる。
また、前記特許文献2においては、ユーザのアクセス権に従った検索となるため、登録時に1つ1つの文書にアクセス権を設定しておかなければならない。また、ユーザが複数プロジェクトに関わっていてアクセス権の範囲が広い場合に、特定のプロジェクトや部署などに関連する文書のみを検索したいという場合には、複数ヒットした文書からユーザが欲しい文書を更に探さなければならない。
本発明は、上記課題を解決するために、ユーザの特性を用いて自動的にインデックス候補情報を収集することができる文書管理装置、文書管理方法およびプログラムを提供する。
上記課題を解決するために、本発明の文書管理装置は、文書の登録を指定したユーザを特定するユーザ特性情報を取得するユーザ特性情報取得手段と、前記文書の文書情報を取得する文書情報取得手段と、前記ユーザ特性情報取得手段によって得られたユーザ特性情報と、前記文書情報取得手段によって得られた文書情報と、前記ユーザ特性情報取得手段によって得られたユーザ特性情報と所定の項目が一致するユーザ特性情報を持つ他のユーザの履歴情報とに基づき、前記文書に付与するためのインデックス候補情報を生成するインデックス候補情報生成手段と、前記インデックス候補情報生成手段が生成したインデックス候補情報を出力するインデックス候補情報出力手段と、前記インデックス候補情報出力手段が出力したインデックス候補情報から該ユーザにより選択されたインデックス情報を受信するインデックス情報受信手段と、前記インデックス情報受信手段により受信した前記インデックス情報を前記文書情報取得手段により取得した文書情報に対応する文書に関連づけて登録する文書登録手段とを有することを特徴とする。
本発明により、ユーザの特性を設定しておくことで、ユーザがインデックス情報の統一性を意識する必要が無くとも、自動的にそのユーザに関連するインデックス候補情報を検索して収集することができる。
また、これによって、一般ユーザが検索を行う際に、指定する検索キーワードとして文字列の表現を複数設定する必要がなくなる。
さらに、インデックス候補情報を選択可能にユーザインタフェースとして表示することで、複合機等の小さな画面上でもインデックス情報を1つ1つ入力する必要がなくなる。
以下、本発明の実施形態について、添付図面を用いて説明する。
<本実施形態の文書管理システムの構成例>
図1は、本実施形態に係る文書管理システムのシステム構成図である。本発明においては、例えばユーザA及びユーザBに対して文書管理システムの機能を提供するための文書管理アプリケーションを、ウェブサービス(Webアプリケーション)として提供する。
図1では、本実施形態に係る文書管理システムには、以下の機器がネットワークを介して接続されている。ユーザAがウェブブラウザを介して文書管理システムの機能を提供するためのWebアプリケーションにアクセスするためのClientPC10が接続されている。また、本実施形態に係る文書管理システムのWebアプリケーションを提供するWebアプリケーションサーバPC20が接続されている。また、本システムにアクセスするユーザの情報を管理するユーザ管理サービスサーバPC30が接続されている。また、文書を保存/管理する機能を有する文書管理サービスサーバPC40が接続されている。また、ユーザBがUI(本実施形態では、内部的にはブラウザを使用してUIを表示していることとする)を介してアクセスするスキャナ機能やプリンタ機能,ファクシミリ機能などを有する画像形成装置である複合機50が接続されている。
ここで、WebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及び文書管理サービスサーバPC40は、別々に配置されている構成例を示しているが、これらに機能が1つのPCにおいて構成されても構わない。また、ユーザAがClientPC10を操作する構成としているが、前記3つのサーバPCのいずれか、もしくは全てと同じPCで操作しても構わない。更に、ユーザBが複合機50を操作する構成としているが、スキャナがClientPC10に接続されている構成であっても構わない。
なお、本実施形態に係る文書管理システムは、ユーザAがブラウザを介してアクセスする構成、および、ユーザBが複合機のUIを介してアクセスする構成としている。しかし、図示しない専用のクライアントアプリケーションをClientPC10および複合機50に配置し、ユーザAおよびユーザBがそれを操作する構成であっても構わない。この場合、WebアプリケーションサーバPC20ではなく、文書管理サービスサーバPC40と専用クライアントアプリケーションが通信する構成でも構わない。
<本実施形態のPCのハードウェア構成例>
図2は、本実施形態に係る文書管理システムを構成する各PCのハードウェア構成例を示している。図2に示されるハードウェア構成例は、一般的な情報処理装置のハードウェア構成に相当するものとし、本実施形態の各PCには一般的な情報処理装置のハードウェア構成を適用できる。
図2において、CPU100は、ROM102のプログラム用ROMに記憶された、或いはハードディスク109からRAM101にロードされたOSやアプリケーション等のプログラムを実行する。ここで、OSとはコンピュータ上で稼動するオペレーティングシステムの略語であり、以下オペレーティングシステムのことをOSと呼ぶ。後述する各フローチャートの処理はこのOSの管理の下でのプログラムの実行により実現できる。RAM101は、CPU100の主メモリ、ワークエリア等として機能する。キーボードコントローラ103は、キーボード107や図示しないポインティングデバイスからのキー入力を制御する。ディスプレイコントローラ104は、各種ディスプレイ108の表示を制御する。ディスクコントローラ105は、各種データを記憶するハードディスク(HD)109やフロッピー(登録商標)ディスク(FD)等におけるデータアクセスを制御する。NC106はネットワークに接続されて、ネットワークに接続された他の機器との通信制御処理を実行する。
<本実施形態の文書管理システムのソフトウェア構成例>
図3は、本実施形態に係る文書管理システムの一例を示すソフトウェア構成例を示す図である。図3は、WebアプリケーションサーバPC20、ユーザ管理サービスサーバPC30、及び文書管理サービスサーバPC40内のソフトウェア構成を示している。
図3で、WebアプリケーションサーバPC20にあるメイン制御部200は、本実施形態に係る文書管理システムの全体を制御し、後述する各部に対する指示及び管理を行う。データ送受信部201は、ClientPC10および複合機50においてユーザがブラウザを介して出した命令を受け取り、メイン制御部200より指示を受けた結果を、ClientPC10および複合機50に返答する。セッション記憶部202は、ClientPC10および複合機50においてユーザがブラウザを介して本文書管理システムにアクセスすると、同一ユーザからのアクセスであることを示すためのセッション情報を生成する。更に、ユーザが本文書管理システムへのアクセスをやめる(ログアウト)、もしくは自動タイムアウトなどでセッションが切れるまでの間、繰り返し使用する各種情報をセッション情報と関連付けて保持する。WebUI生成部203は、メイン制御部200より指示を受け、状況に応じたWebUI(HTML)を生成する。ここで、WebUI生成部が生成するWebUIは、HTMLだけに限定するものではなく、Java(登録商標)Scriptなどのスクリプト言語が埋まっていても構わない。
次に、ユーザ管理サービスサーバPC30にあるユーザ情報操作部300は、メイン制御部200からの指示に従い、ユーザ情報記憶部301に保存されている本文書管理システムにアクセス可能なユーザ及びユーザ特性の抽出、編集などの操作を行う。ここで、ユーザ管理に関して、本文書管理システム独自の管理ではなく、既知の技術であるActiveDirectory、LDAPなどとユーザ情報操作部300が連携し、ユーザ情報記憶部301においてはユーザ特性のみを保存しても構わない。
次に、文書管理サービスサーバPC40にある文書情報操作部400は、メイン制御部200からの指示に従い、文書情報記憶部401に保存されている文書の実体及びインデックス情報を含む文書属性の登録、保存、抽出、編集などの操作を行う。文書検索部402は、メイン制御部200からの指示に従い、文書を検索するための方法を決定し、文書情報操作部400を介して文書情報記憶部401より検索結果を取得する。比較部403は、メイン制御部200からの指示に従い、文書属性とユーザ特性との比較を行い、更に、必要に応じて文書情報操作部400を介して文書情報記憶部401に保存されている文書の属性の重み付けを変更する。文書分類部404は、メイン制御部200からの指示に従い、文書属性のカウント(重み付け)値から分類分けを実行し、その結果をメイン制御部200に返す。文書情報取得部405は、メイン制御部200からの指示に従い、データ送受信部201が受信した文書データに対して、OCR処理等の画像処理を行い、文書情報を取得する。インデックス候補情報生成部406は、メイン制御部200からの指示に従い、ユーザ情報操作部300および文書情報取得部405から得られる情報を使用して、インデックス候補情報を生成する。メール生成部407は、メイン制御部200からの指示に従い、ユーザ情報操作部300および文書情報取得部405から得られる情報を使用して、文書登録結果等を通知するためのメールヘッダや本文を生成する。生成したメールは、メイン制御部200がデータ送受信部201を介して送信を行う、または、メール生成部407にて送信を行う。
<本文書管理システムの実施形態1の処理例>
以下、本発明の実施形態1に係る文書管理システムの各ステップにおける処理について、図1乃至図19を用いて具体的に説明する。
(ログイン及びユーザ特性登録処理)
ユーザAが、ClientPC10のブラウザを介して本文書管理システムの機能を提供するためのWebアプリケーションにアクセス(ログイン)し、初めてログインした際にはユーザ特性を入力し、本文書管理システムにて保存する処理である。
図4は、本文書管理システムにおけるログイン及びユーザ特性登録処理のシステム動作の概要である。図5は、ログイン及びユーザ特性登録処理時の本文書管理システムにおける処理の流れの例を示すフローチャートである。かかるフローチャートは、WebアプリケーションサーバPC20にあるメイン制御部200による処理である。以下、図4及び図5を用いて、ログイン及びユーザ特性登録処理を詳細に説明する。
ステップS100において、ユーザAがClientPC10のブラウザを介して本文書管理システムの機能を提供するためのWebアプリケーションのトップページにアクセスする。すると、メイン制御部200は、データ送受信部201にて受信したリクエストを受けて、WebUI生成部203に依頼し、トップページの生成を行う。続いて、データ送受信部201を介して、本文書管理システムのトップページをレスポンスとしてClientPC10に返し、ClientPC10のウェブブラウザ上でトップページを表示する。
次に、ステップS101において、ステップS100により表示されたトップページにてユーザAがログイン情報を入力すると、メイン制御部200は、データ送受信部201にて受信したユーザAのログイン情報を受ける。メイン制御部200は、ユーザ情報操作部300に問い合わせ、ログインしたユーザAがユーザ情報記憶部301に登録されたユーザか否かを確認する。その結果、ユーザ情報記憶部301にユーザAが存在しない、もしくはパスワードが間違っている場合、メイン制御部200は、ステップS102において、WebUI生成部203に依頼しログイン失敗エラーページの生成を行う。続いて、データ送受信部201を介してClientPC10にレスポンスとして返し、ClientPC10のウェブブラウザ上でログイン失敗エラーページを表示する。
ステップS101の判定によりユーザ情報記憶部301にユーザAが登録済みの場合、メイン制御部200は、次にステップS103において、セッション記憶部202においてセッション情報を生成する。続いて、ユーザ情報記憶部300に問い合わせ、ユーザ情報記憶部301にユーザAのユーザ特性が登録されているか否かを確認する。なお、セッション情報を生成するタイミングは、ここに限定しない。
ステップS103においてユーザAのユーザ特性が登録されていない場合、メイン制御部200は、ステップS104において、WebUI生成部203に依頼してユーザ特性入力ページの生成を行う。続いて、データ送受信部201を介して、ユーザ特性入力ページをClientPC10にレスポンスとして返し、ClientPC10のウェブブラウザ上で表示する。次に、ステップS105において、ステップS104により表示されたユーザ特性入力ページにてユーザAがユーザ特性を入力する。メイン制御部200は、データ送受信部201を介してユーザAのユーザ特性を受信し、ユーザ特性情報取得を行なう(図4のプロセスP11参照)。
続いて、ユーザ情報操作部300に指示し、ユーザ情報記憶部301にユーザAのユーザ特性として登録する(図4のプロセスP12参照)。この際、メイン制御部200は、セッション記憶部202に対しても、生成済みのセッション情報とともにユーザ特性を保持することを指示する。これにより、毎回ユーザAのユーザ特性情報をユーザ情報記憶部301より取得することがなくなるため、処理速度を向上させることができる。
図6は、ユーザ特性、及びユーザ情報記憶部301に保存されているユーザ特性テーブル60の一例を示す図である。
各ユーザ名61に対応するユーザ特性としては、所属部署62、役職63、課内担当64、プロジェクト65、プロジェクト内での業務66、メールアドレス67、類似ユーザ68、ランキング設定69、インデックス設定履歴70などがある。かかるユーザ特性は、後述する文書自動収集処理において利用される。ここで、類似ユーザ68は、類似ユーザの情報を収集する際、どの所定キーをきっかけに類似ユーザを特定するかを指定する。また、ランキング設定69は、文書情報の例として、OCR抽出による文字列での頻出回数を数えた際に、ランキング何位までの情報を保存するかを指定する。また、インデックス設定履歴70は、得られた文書情報に対応して、その文書に設定されたインデックス情報の履歴情報である。
なお、ユーザ特性としては、これら以外の情報が含まれていても構わない。更に、ユーザ特性の項目として複数の値が含まれていても構わない。例えば、複数のプロジェクトに関わるユーザの場合には、複数選択できるほうが良い。また、前記ユーザ特性入力ページでは、ユーザ特性の項目を自由にユーザが入力できるのではなく、選択できる形状であることが望ましい。このためには、本文書管理システムを導入するユーザ環境に応じて、導入先の管理者などが事前に適切な選択項目を設定しておくことが望ましい。
ステップS103でユーザ特性が登録済みかあるいはステップS105でユーザ特性が登録されると、次にステップS106において、後述するユーザAのユーザ特性に応じた文書自動収集処理が実行される。次に、メイン制御部200は、ステップS107において、ステップS106によりユーザAのユーザ特性に応じて収集、分類分けされた表示内容とあわせ、WebUI生成部203にユーザAのページを生成させる。続いて、データ送受信部201を介してClientPC10にレスポンスとして返し、ClientPC10のウェブブラウザ上でユーザAのページを表示する。
なお、文書自動収集処理の説明において詳細に示すが、図13はステップS107でClientPC10に表示されるユーザAのページの一例を示すものであり、ユーザ特性に応じて収集、分類分けされた表示内容が含まれている。
(文書登録処理)
あるユーザが、ClientPC10のブラウザを介して本文書管理システムの機能を提供するためのWebアプリケーションにアクセス(ログイン)し、文書を指定して、本文書管理システムに登録する処理である。もしくは、複合機50のUIを介して本文書管理システムのWebアプリケーションにアクセスし、文書を指定して本文書管理システムに登録する処理である。
図7は、本文書管理システムにおける文書登録処理のシステム動作の概要である。図8は、文書処理時の本文書管理システムにおける処理の流れを示すフローチャートである。また、図14は、文管理システムに対して、文書データを登録する際の処理の概要を説明したものである。
以下、図7、図8、及び図14を用いて詳細に説明する。ただし、ここでの説明はClientPC10からの文書登録(図7のプロセスP20)についてのみ述べるが、ClientPC10からの登録対象文書を複合機50でスキャンによって得られた画像データの文書に置き換えることが可能である。
ステップS200−S203は、WebアプリケーションサーバPC20にあるメイン制御部200の処理である。
ステップS200において、ユーザ(ユーザ名を例えば「原口和夫」として以下説明する)がClientPC10のブラウザを介して本文書管理システムの機能を提供するためのWebアプリケーションにログインする(図14のプロセスP21)。ログイン処理は、図5を用いて、ログイン及びユーザ特性登録処理時の本文書管理システムにおける処理の流れを示した通りである。
ステップS200により表示されたユーザ「原口和夫」のページにて文書登録を実行すると、メイン制御部200は、次にステップS201において、データ送受信部201を介して文書(文書名を「Doc1」とする)を受信する(図14のプロセスP24)。続いて、一旦セッション記憶部202においてセッション情報と関連付けて保存する。かかる処理は、クライアントの文書送信処理とサーバの文書受信処理を含む。
メイン制御部200は、ステップS202において、ステップS200によりセッション記憶部202に保持されているユーザ「原口和夫」のユーザ特性を取得する。なお、図14のプロセスP22,P23に示すように、メイン制御部200は、ユーザ情報操作部300に指示し、ユーザ情報記憶部301よりユーザ「原口和夫」のユーザ特性と所定キーの一致する類似ユーザのユーザ特性を取得しても良い。
次に、メイン制御部200は、ステップS203において、ステップS201およびS202で取得した登録文書とユーザ特性をデータ送受信部201を介して文書管理サービスサーバ40へ送信する(図14のプロセスP25)。ここでは、登録文書とユーザ特性を送信することを想定して説明しているが、図14に図示しないが、ユーザ管理サービスサーバPC30から文書管理サービスサーバPC40へ直接送信する、という実施系でも構わない。
次のステップS204−S207は、文書管理サービスサーバPC40にある各部の処理である。
ステップS204において、文書管理サービスサーバPC40は、WebアプリケーションサーバPC20から、上記ステップS201およびS202で取得した登録文書とユーザ特性を受信する。次に、ステップS205において、文書情報取得部405は、ステップS201で取得した登録文書からOCR処理、または、全文検索等により文字列を抽出するなどの画像処理を施し、文書情報を取得する。なお、前述した画像処理に加えて、文書に既に設定されている属性等を取得しても構わない。
次に、ステップS206において、ステップS202で取得したユーザ特性とステップS205で取得した文書情報をもとに、インデックス候補情報を生成する。インデックス候補情報の生成ステップの詳細は、図16に従い後述する。次に、文書管理サービスサーバPC40は、ステップS207において、図14のプロセスP26に示すように、インデックス候補情報をデータ送受信部201を介してメイン制御部200に送信する。
次のステップS208−S211は、WebアプリケーションサーバPC20にあるメイン制御部200の処理である。
ステップS208において、メイン制御部200は、文書管理サービスサーバPC40からインデックス候補情報を受信する。次に、メイン制御部200は、ステップS209において、受信したインデックス候補情報を使ってWebUI生成部203にインデックス情報設定ページを生成させる。続いて、データ送受信部201を介してClientPC10にそのインデックス候補情報に基づくインデックス情報設定ページに関する情報を出力する。ClientPC10のウェブブラウザ上でインデックス情報設定ページを表示される(図14のプロセスP27)。かかる処理は、サーバにおけるインデックス候補情報出力処理またはインデックス候補情報送信処理または表示指示処理、クライアントにおけるインデックス候補情報受信処理及びインデックス候補情報表示処理を含む。
次に、ステップS210において、メイン制御部200は、ClientPC10のインデックス情報設定ページでユーザにより指定されたインデックス情報を、データ送受信部201を介して受信する(図14のプロセスP28)。かかる処理は、クライアントにおけるインデックス情報送信処理、サーバにおけるインデックス情報受信処理を含む。
次に、ステップS211において、図14のプロセスP29に示すように、メイン制御部200は、ステップS210で取得したインデックス情報をデータ送受信部201を介して文書管理サービスサーバPC40へ送信する。
次のステップS212−S214は、文書管理サービスサーバPC40にある各部の処理である。
ステップS212において、文書管理サービスサーバPC40は、ステップS211でデータ送受信部201を介して送信されたインデックス情報を受信する。次に、ステップS213において、文書情報操作部400に指示して、前記ステップS201によりセッション記憶部202に保存した文書Doc1を文書情報記憶部401に保存する。これは、ステップS202によりセッション記憶部202により取得したユーザ「原口和夫」のユーザ特性、および、ステップS210により取得したインデックス情報を、文書Doc1の属性として保存するものである。例えば、図7に示すように、文書登録した文書Doc1には、インデックス情報と共にユーザ「原口和夫」のユーザ特性が関連付けられている。
ここで、文書を登録するユーザは、後述する文書自動収集処理により自動的に分類分けがなされるため、本文書管理システムの保存場所を指定する必要はなくなるため、保存場所を決定する作業から解放される。
次に、ステップS214において、文書管理サービスサーバ40は、図14のプロセスP30に示すように、ステップS213において保存した文書情報とインデックス情報とをメイン制御部200へ送信する。
次のステップS215−S216は、WebアプリケーションサーバPC20にあるメイン制御部200の処理である。
ステップS215において、メイン制御部200は、ステップS214で文書管理サービスサーバPC40が送信した文書情報とインデックス情報とを受信する。次に、ステップS216において、受信した文書情報とインデックス情報とを、ステップS105によりユーザ情報記憶部301に保存した「原口和夫」のユーザ特性の一部とする。そして、図14のプロセスP31に示すように、ユーザ情報操作部300を介してユーザ情報記憶部301に保存する。
なお、ここでは文書登録ごとにユーザ情報記憶部301に保存する処理を述べている。しかし、メイン制御部200は、セッション記憶部202に保持されている「原口和夫」のユーザ特性を更新し、複数の文書登録が終了した時点でユーザ情報記憶部301にまとめて保存しても構わない。また、ステップS216において保存する文書情報は、文書中の全てのOCR抽出文字列、全文検索による抽出文字列などの文書情報全体を保存しても構わない。しかし、必要以上の記憶領域の容量を必要としないため、図6に示すユーザ特性のランキング設定に応じて、文書中のOCR抽出文字列の頻出回数の上位だけを保存することが望ましい。
(文書属性重み付け処理)
あるユーザが、ClientPC10のブラウザを介して本文書管理システムの機能を提供するためのWebアプリケーションにアクセス(ログイン)し、文書にアクセスする。ここで、アクセスとは閲覧、印刷、もしくはコピーなどの操作を含むが、本実施形態においては、閲覧を例にして説明する。
図9は、本文書管理システムにおける文書属性重み付け処理のシステム動作の概要である。図10は、文書属性重み付け処理時の本文書管理システムにおける処理の流れの例を示すフローチャートである。以下、図9及び図10を用いて詳細に説明する。なお、文書属性重み付け処理は、WebアプリケーションサーバPC20のメイン制御部200が、文書管理サービスサーバPC40の各部に処理を指示しながら実行される。しかしながら、図10には、煩雑さを避けるために上記図8のように指示のやり取りは省略をし、メイン制御部200の処理のみを図示している。
ステップS300において、ユーザ(このユーザ名を「高沢亜美」とする)がClientPC10のブラウザを介して本文書管理システムの機能を提供するためのWebアプリケーションにログインする。ログイン処理は、図5を用いて、ログイン及びユーザ特性登録処理時の本文書管理システムにおける処理の流れを示した通りである。
次に、ステップS301において、ステップS300により表示されたユーザ「高沢亜美」のページにて、所望の文書を選択して閲覧を実行する。すると、メイン制御部200は、データ送受信部201にて受信した文書(文書名を、ユーザ「原口和夫」が上記登録処理で登録した「Doc1」とする)を一旦セッション記憶部202においてセッション情報と関連付けて保存する。この際、データ送受信部201にて受信したユーザ「高沢亜美」が閲覧するために指定した文書を特定する情報は、文書名を特定するものではなく、文書を特定するIDであっても構わない。
次に、メイン制御部200は、ステップS302において、ステップS300によりセッション記憶部202に保持されているユーザ「高沢亜美」のユーザ特性を取得する。なお、メイン制御部200は、ユーザ情報操作部300に指示し、ユーザ情報記憶部301よりユーザ「高沢亜美」のユーザ特性を取得しても良い。
次に、ステップS303において、メイン制御部200は、ステップS301によりセッション記憶部202に保存した文書Doc1の文書属性を保存する。このとき、メイン制御部200が、文書情報操作部400に指示して、文書情報記憶部401より文書Doc1の文書属性を取得し、セッション記憶部202にセッション情報と関連付けて保存する。
次に、メイン制御部200は、比較部403に指示して、ステップS304において、文書属性とユーザ「高沢亜美」のユーザ特性との各項目を抽出する。ここで、文書属性は、ステップS303により取得しセッション記憶部202に保存した文書Doc1の文書属性であり、ユーザ特性は、ステップS302により取得したユーザ「高沢亜美」のユーザ特性である。具体的には、文書Doc1の文書属性の1番目の項目“所属部署”の値は“設計1”であり、ユーザ「高沢亜美」のユーザ特性の1番目の項目“所属部署”の値も“設計1”である。次に、ステップS305において、ステップS304により抽出した文書属性とユーザ特性の項目に対して、比較部403は、両項目の値が等しいか否かを比較する。
ステップS306において、ステップS305により比較部403が文書属性とユーザ特性の両項目の値が等しいと判断した場合、ステップS307の処理を実行する。ステップS307において、比較部403は、文書情報操作部400に依頼し、文書情報記憶部401に保存されている文書Doc1の文書属性の重み付けを更新する。具体的には、図9のように、文書Do1の文書属性の項目“所属部署”の重み付けをカウントアップする。なお、本実施形態においては、比較部403において比較した結果を、項目毎に文書情報記憶部401に保存されている文書属性の重み付けを更新するようにしたが、全項目を比較した結果をまとめて反映するようにしても良い。
次に、ステップS306により比較部403が文書属性とユーザ特性の両項目の値が異なると判断した場合、ステップS308において、文書属性の次の項目が存在するか確認する。具体的には、文書Doc1の文書属性の2番目の項目として“役職”が存在するため、ステップS304以降の処理が続行される。
ステップS304からS308までの処理を繰り返し、文書Doc1の文書属性の項目を最後まで抽出し、ユーザ特性の全項目と比較をし終えると、文書属性重み付け処理は終了する。
図9において、文書Doc1を登録した直後の文書属性の重み付け91と、ユーザ「高沢亜美」、「横尾俊樹」及び「幸田新」が文書Doc1を閲覧した後の、文書Doc1の文書属性の重み付け92の変化結果とを示している。この結果、文書属性の項目“所属部署”の重み値より、“プロジェクト”の重み値の方が上回ることになる。つまり、文書Doc1は、所属部署である“設計1”よりも、プロジェクトである“文書管理”に関連性が高くなる。従って、後述する文書自動収集処理の分類分け時に、“プロジェクト”もしくはプロジェクトである“文書管理”との関連性が高いと自動的に判断できるようになる。
このように、文書管理システムを利用するユーザの文書閲覧などの文書に対するアクセスによって、文書に付与されている各属性のうち、より文書自体と関連度の高いと思われる属性に重み付けする。これにより、ユーザとの関連性のある文書の自動収集(検索)が可能となる。
(文書自動収集処理)
ユーザAが、ClientPC10のブラウザを介して本文書管理システムの機能を提供するためのWebアプリケーションにアクセス(ログイン)する(図11のプロセスP31)。すると、自動的に文書収集処理が走り、ClientPC10のウェブブラウザ上に取得した文書リストを表示する。図11は、本文書管理システムにおける文書自動収集処理のシステム概要であり、図12は、文書自動収集処理時の本文書管理システムにおける処理の流れを示すフローチャートである。以下、図11及び図12を用いて詳細に説明する。なお、図12の文書自動収集処理のフローチャートは、ユーザAが本文書管理システムにログインした後からのステップを示す。なお、文書自動収集処理は、WebアプリケーションサーバPC20のメイン制御部200が、文書管理サービスサーバPC40の各部に処理を指示しながら実行される。しかしながら、図12には、煩雑さを避けるために上記図8のように指示のやり取りは省略をし、メイン制御部200の処理のみを図示している。
ステップS400において、セッション記憶部202に保持されているユーザAのユーザ特性を、メイン制御部200は取得する。なお、図11のプロセスP32に示すように、メイン制御部200は、ユーザ情報操作部300に指示し、ユーザ情報記憶部301よりユーザAのユーザ特性を取得しても良い。
次に、ステップS401において、ステップS400により取得したユーザ特性により、メイン制御部200は文書検索部402に文書検索を指示する(図11のプロセスP33)。続いて、文書検索部402は、ユーザ特性の各項目の値をキーワードとして“OR(論理和)”の条件で、文書情報操作部400に指示して、文書情報記憶部401より条件に一致する文書を検索する。具体的には、ユーザA(「原口和夫」)の場合、ユーザ特性である“設計1”、“文書管理”、“インストーラ”などをキーワードにして検索を行う。かかる文書抽出処理では、更に類似のユーザに関連する文書を検索結果として抽出してもよい。
次に、ステップS402において、ステップS401により文書検索部402が条件に一致する文書を発見できなかった場合、ステップS403を実行する。ステップS403において、メイン制御部200は、WebUI生成部203に依頼し、ユーザ特性に一致する文書が見つからなかったことを通知するエラーページを生成する。続いて、データ送受信部201を介して、ClientPC10にレスポンスとして返し、ClientPC10のウェブブラウザ上でエラーページを表示する。
ステップS402により文書検索部402が条件に一致する文書を発見できた場合、ステップS404において、メイン制御部200は検索結果の文書リストを取得する。続いて、文書情報操作部400を介して、文書情報記憶部401より検索結果の文書リストのうち、ユーザAがアクセス可能な文書のみを抽出する。
次に、ステップS405において、ステップS404によりユーザAがアクセス可能な文書を抽出できなかった場合、ステップS403を実行する。ステップS403において、メイン制御部200は、WebUI生成部203に依頼し、ユーザがアクセス可能な文書リストが見つからなかったことを通知するエラーページを生成する。続いて、データ送受信部201を介して、ClientPC10にレスポンスとして返し、ClientPC10のウェブブラウザ上でエラーページを表示する。
ステップS405によりユーザ特性に従った検索により発見され、かつユーザAがアクセスできる文書リストを抽出できた場合、ステップS406に進む。ステップS406において、メイン制御部200は、文書分類部404に指示し、文書リストにおける全文書に対して、各文書の文書属性のうち最大カウント(重み付け)数となる項目を確認する。
次に、ステップS407において、文書分類部404にて、確認された文書リストの各文書に対して、文書属性の最大カウント(重み付け)数となった項目毎に分類分けを行う。具体的には、ある文書の文書属性のうち、“所属部署”が最大カウント(重み付け)数となった場合、その文書は所属部署である“設計1”の分類となる。
次に、ステップS408において、ステップS407で文書分類部404により分類分けされた文書リスト(図11の1101参照)をメイン制御部200が受ける(図11のプロセスP34)。次に、WebUI生成部203に依頼し、ユーザ特性に応じて自動的に収集されて分類分けされた文書リストを表示するページを生成する(図11の1102参照)。続いて、データ送受信部201を介して、ClientPC10にレスポンスとして返し、ClientPC10のウェブブラウザ上で各ユーザのログイン後のページとして表示する(図11のプロセスP35)。
(文書収集結果の表示画面例)
図13は、本文書管理システムにおけるClientPC10のログイン後の文書収集結果を表示するユーザインタフェースの一例(UI)の一例である。
文書の表示領域1202において、ユーザAの特性に応じて、分類分けされ文書収集結果が表示されている。具体的には、所属部署である“設計1”、担当プロジェクトである“文書管理”、担当プロジェクト内での業務である“インストーラ”のエリアに自動収集し、分類分けされた文書リストが表示される。
図13においては、新着文書の表示やUIのカスタマイズを行う、またはユーザに関連性の高いフォルダリンクの選択などを行うユーザ領域1201や、文書の操作やコントロールなどを行うための表示1203が表示されている。
なお、図13でユーザインタフェースの一例として示したWebUI(HTML)に関して、その形態、構成、およびコントロールは限定されたものではない。更に、必要となる機能を実現するためHTMLが生成されればどのような形態であっても構わない。
(インデックス候補情報生成処理)
図8に示すように、ユーザAが、ClientPC10のブラウザを介して本文書管理システムの機能を提供するためのWebアプリケーションにアクセス(ログイン)し、文書登録を実行する。すると、自動的にインデックス候補情報生成処理(図8のステップS206参照)が走る。これにより、ClientPC10のウェブブラウザ上で登録対象文書に設定するためのインデックス候補情報を表示することが可能となる(図14のプロセスP27参照)。
図15は、本文書管理システムにおけるインデックス候補情報生成の際に使用するデータの一例である。また、図16、図17および図18は、本文書管理システムにおける文書登録時のインデックス候補情報生成処理の流れを示すフローチャートである。本実施形態においては、文書管理サービスサーバPC40において処理が行われている。
以下、図16を用いて図8のステップS206の処理を詳細に説明する。なお、図16は、図8の処理において、ユーザ特性情報および文書情報は取得していることを前提としている。かかるインデックス候補情報生成処理は、主に文書管理サービスサーバPC40のインデックス候補情報生成部406で実行される。
ステップS500において、ステップS202およびS203において取得したユーザ特性情報と文書情報とを比較し、一致するものがあるか否かを判断する。ここでは、ユーザ「原口和夫」が文書登録を実行したとして、ステップS500での比較処理について具体例を用いて説明する。ステップS500の比較処理は、ユーザ「原口和夫」のユーザ特性情報と登録対象文書から得られた文書情報とを単純比較する。「設計1」、「文書管理」というキーワードがそれに当する。例えば、図15の(a)の例は、ステップS205で取得した、登録文書から取得した文書情報1501である。図6に示すユーザ「原口和夫」のユーザ特性の中で、文書情報と一致するものは、「設計1」、「文書管理」である。
ステップS500において一致する情報があると判断した場合、ステップS501において、その情報をインデックス候補情報に追加する処理を実行する。インデックス候補情報に追加する処理は、図17において後述する。
次に、ステップS502において、インデックス候補情報生成部406は、ユーザ情報操作部300に指示して、ステップS202で取得したユーザ特性と所定キーが一致する類似のユーザ特性を持つユーザ情報を取得する(図14のプロセスP23)。ここでは、類似のユーザと判断する基準は、図6のユーザ特性テーブルの“類似ユーザ”キー(複数設定可能)に設定された所定キーを基準に“OR”で比較する。そして、一致したユーザが類似ユーザ特性をもつユーザ(以下、類似ユーザ)であると判断している。
なお、ここで挙げているのは一例であり、他のキーワードを使用して類似ユーザを特定しても構わない。また、直接ユーザを指定して、ユーザBのユーザ特性は参照する(類似ユーザとみなす)が、ユーザCのユーザ特性は参照しない(類似ユーザとみなさない)、という指定をしても構わない。
図6及び図15の例では、ユーザ「原口和夫」の類似ユーザの検索キーは「プロジェクト」であり、プロジェクトキーがユーザ「原口和夫」と一致するユーザ「高沢亜美」および「横尾俊樹」が類似ユーザであると判断される。
次に、ステップS503において、インデックス候補情報生成部406はユーザ情報操作部300に指示して、ステップS502で取得した類似ユーザのユーザ特性を検索し、インデックス設定履歴を保持しているか否かを判断する。インデックス設定履歴情報(図15の(b)の1502/1503参照)を保持している場合、ステップS504において、その履歴情報を取得してセッション記憶部202に保存する。
この際、参照する履歴情報が大量の場合、絞り込んでも構わない。例として、類似ユーザのユーザ特性に関して、インデックス設定履歴情報の保存された日付を元に、期間や季節に応じて参照するインデックス設定履歴情報の絞込みを行うことがあげられる。また、あらかじめ文字列を指定しておくことでOCR処理や全文検索により、前記あらかじめ指定された文字列が抽出された場合など、ある特定の文書情報が検出された場合に、インデックス候補情報から排除してもよい。もしくは、インデックス候補情報における優先度を変更するとしても構わない。
次に、ステップS505において、ステップS202で取得した文書情報と、ステップS504で取得した類似ユーザのインデックス設定履歴情報とを比較し、一致するものがあるか否かを判断する。この比較により、ステップS502で取得した特性ユーザをさらに絞り込むことになる。
図15の(b)の例では、ユーザ「原口和夫」の文書情報で“議事録”が、ユーザ「横尾俊樹」のインデックス設定履歴情報の文書情報と一致しているが、ユーザ「高沢亜美」のインデックス設定情報には一致するキーワードがない。つまり、ユーザ「原口和夫」のインデックス候補情報生成処理において、参考とするべき類似ユーザは「横尾俊樹」である。ここでは、参考とするべき類似ユーザを1人として説明しているが、複数人いても構わない。
次に、ステップS506(図17において後述)において、ステップS505で取得した類似ユーザのインデックス設定履歴情報を、インデックス候補情報に追加する。
なお、図15の(c)の例では、図19において表示されているUIにおいて、ユーザによってインデックス情報1504が指定される。図8のステップS210及びS211では、この指定されたインデックス情報が取得され、文書管理サービスサーバPC40に送信されることになる。
(インデックス候補情報の追加処理)
図17を用いて、図16のS501およびS506のインデックス候補情報の追加処理を説明する。
ステップS601において、インデックス候補情報生成部406は、文書登録処理においてインデックス候補情報を一時的に管理するためのリストが既にインデックス候補情報生成部406の備えるリスト記憶部(不図示)に保持されているかを判断する。保持されていないと判断した場合、リスト記憶部に空のインデックス候補情報を管理するためのリストを作成する等、新規にインデックス候補情報を作成するための準備を行う(S602)。その後、ステップS603に移行する。
次に、ステップS603において、リスト記憶部に保持されたインデックス候補情報のリストにこれから追加しようとしているインデックス候補情報が、既に存在するか否かを確認する。存在していない場合に限り、ステップS604において、インデックス候補情報をインデックス候補情報のリストに追加する。
(インデックス設定履歴情報の保存処理)
図18は、図8のステップS216でのインデックス設定履歴情報をユーザ特性テーブルに保存する処理のフローチャートである。保存先は、セッション記憶部202でも構わないし、ユーザ情報操作部300を介してユーザ情報記憶部301でも構わない。かかる処理は、主にWebアプリケーションサーバPC20のメイン制御部200で実行される。
ステップS700において、メイン制御部200は、ステップS210においてインデックス情報を取得したか否かを判断する。取得した場合に限り、ステップS701において、セッション記憶部300に保持されたユーザ特性のうちからランキング設定情報を取得する(図6参照)。次に、ステップS702において、ステップS701において取得したランキング設定に応じて、セッション記憶部300乃至ユーザ情報記憶部301に保持するための文書情報を特定する。
なお、本実施形態では、ランキング設定を、登録文書から取得できた文書情報の一部に限定して履歴を保持することを目的に利用している。しかし、別の限定方法を用いて、文書情報の履歴を保持しても構わないし、文書情報の全てを保持しても構わない。
(文書の登録およびインデックス情報の設定画面例)
図19は、図13の操作/コントロール領域1203に表示された「登録」ボタンを押下された際に表示する、文書の登録およびインデックス情報の設定を行うためのユーザインタフェース(UI)の一例である。
ユーザ領域1301のユーザが、文書登録領域1302にWindows(登録商標)フォルダ等からのファイルのドラック&ドロップを行うと、ClientPC10は内部的に文書をWebアプリケーションサーバ20に送信する。その後、ステップS204にて生成したインデックス候補情報を取得し、インデックス情報の設定領域1303の選択肢としてユーザに提示する。ユーザはこの選択肢のリストから所望のキーワードを指定して文書登録を行う。1304は操作/コントロール領域であるが、ここでは詳説しない。
ここでは、選択文書のフォーカスが移った場合、または、ユーザがログアウトした場合に指定したインデックス情報を保存することを想定しているが、ボタン等を用意して保存するタイミングをユーザが意識的に指示しても構わない。また、ユーザが設定可能なインデックス情報として、ここでは選択肢からの指定する例しか挙げていないが、ユーザが所望する選択肢には存在しないキーワードを入力するための手段を提供していても構わない。
(インデックス情報による検索の条件設定/検索指示画面例)
図20は、図13の操作/コントロール領域1203に表示された「絞込み検索」ボタンを押下された際に表示する、インデックス情報による検索の条件設定/検索を実行するためのユーザインタフェース(UI)の一例である。
検索条件の設定領域1402において、ユーザのアクセス可能な文書に設定されたインデックス情報を表示する。
検索結果の表示領域1403は、検索条件の設定領域1402で指定したインデックス情報による検索を実行した場合に、それらが設定された文書を検索結果として表示する領域である。
ユーザ領域1401および操作/コントロール領域1401については、詳説しない。
<本文書管理システムの実施形態2の処理例>
本発明の実施形態2を、図1乃至図18、さらに図21に基づき説明する。
実施形態1に係る文書管理システムの処理と異なるのは、図1に図示しないメールサーバからClientPC10または複合機50に添付ファイル付きのメールが送信された場合である。このとき、自動的にインデックス候補情報からインデックス情報が選択され、かつ、添付された文書に対するインデックス情報として付与された状態で文書管理システムに自動的に保存されることである。
(メール受信後の自動インデックス情報付与処理)
図21は、本発明の実施形態2に係る文書管理システムにおける添付ファイル付きメールを受信した際に、添付ファイルをインデックス情報付きで自動保存する時の本文書管理システムにおける処理の流れを示すフローチャートである。
以下、図21を用いて詳細に説明する。また、ここでの説明は、ClientPC10を用いて行うが、複合機50に置き換えた構成としても構わない。
ステップS800において、データ送受信部201が有する電子メール機能(不図示)により、ClientPC10または複合機50からの図示しないメールサーバを経由した、添付ファイル付きのメールを受信する。このメール受信の際に、メイン制御部200は、データ送受信部201を介して、ClientPC10または複合機50からの受信メールの送信元アドレスと添付ファイルを取得する。
ここでは、取得する情報を送信元アドレスとしているが、ユーザが特定できる情報があれば、メールヘッダ、メール本文の情報等のそのほかの情報であっても構わない。
ステップS801−S802の処理は、WebアプリケーションサーバPC20で実行される。
次にステップS801では、ステップS800により取得した送信元アドレスを用いて、メイン制御部200が、ユーザ情報操作部300に検索を指示して、送信元アドレスを有するユーザを特定する。ここで特定されたユーザのユーザ特性情報を、メイン制御部200が取得する。
ステップS802では、メイン制御部200は、ステップS800およびS801で取得した登録文書(添付ファイル)とユーザ特性を、データ送受信部201を介して文書管理サービスサーバPC40へ送信する。
ステップS803−S809の処理は、文書管理サービスサーバPC40で実行される。
ステップS803において、文書管理サービスサーバPC40は、WebアプリケーションサーバPC20から登録文書とユーザ特性を受信する。次に、ステップS804において、文書情報取得部405は、登録文書からOCR処理、または、全文検索等により文字列を抽出するなどの画像処理を施し、文書情報を取得する。なお、前述した画像処理に加えて、文書に既に設定されている属性等を取得しても構わない。また、文書情報を取得する処理の対象は、ステップS800で受信した添付ファイルを想定しているが、メール本文でも構わないし、メールヘッダやその他の情報を含んでいても構わない。
次に、ステップS805において、受信したユーザ特性とステップS804で取得した文書情報をもとに、インデックス候補情報を生成する。インデックス候補情報の生成ステップの詳細は、図16などを参照して前述したとおりである。
次に、ステップS806において、インッデクス候補情報生成部406がインッデクス候補情報の中からインデックス情報を決定する。本ステップS806においては、インデックス候補情報の中から任意にインデックス情報を選択することになる。その決定の際には、何らかの重み付けをして優先度を決定し、それに従ったインデックス情報を選択する。本実施形態においては、例えば、図16のステップS504〜ステップS506で追加されるインッデクス候補情報をインデック情報として選択する。これにより、文書に対して過去に用いられたことのあるインデックス情報を自動付与でき、文書登録者以外であっても後で文書の検索がされやすい、さらに再利用がされやすいインデックス付与が行えることになる。尚、全てのインデックス候補情報をインデックス情報として決定する、ということでも構わない。かかる処理は、インデックス情報生成処理あるいはインデックス情報選択処理を含む。
次に、ステップS807において、文書情報操作部400は、ステップS803で受信した登録する文書(添付ファイル)にステップS804で決定したインデックス情報を属性として設定し、文書情報記憶部401に保存する。
ステップS808において、メール生成部407は、上述の送信元アドレスに対して、添付ファイルを登録した旨が本文に記載された電子メールを作成する。ここで、メール本文に記載する文書情報としては、登録した添付ファイルのファイル名、保存フォルダ、保存日時、インデックス情報の設定値などが挙げられる。また、メール本文に限らず、情報をメール添付するということでも構わない。次に、ステップS809において、文書管理サービスサーバ40は、文書情報とインデックス情報と作成された電子メールの情報を、メイン制御部200へ送信する。
ステップS810−S812の処理は、WebアプリケーションサーバPC20のメイン制御部200が実行する。
ステップS810において、メイン制御部200は、文書情報とインデックス情報と作成された電子メールの情報を受信する。次に、ステップS811において、受信した文書情報とインデックス情報を送信元アドレスで特定したユーザのユーザ特性情報の一部とする。そして、メイン制御部200は、このユーザ特性情報をユーザ情報操作部300に指示してユーザ情報記憶部301に保存する。
ステップS812において、メイン制御部200は、データ送受信部201を介して、ステップS810で受信した電子メールをメール機能を用いて、送信元アドレスへ文書登録完了のメールとしてメール送信する。
ここで、メール本文に記載する情報として、更には、ステップS806において生成されたインッデクス候補情報もメール本文の情報に含めても良い。これにより、ユーザが後日、既に登録された文書のインデックス情報を変更しようとした際に、その設定の参考情報として有用な情報が提供されることになる。
本実施形態2の処理により、ユーザは添付ファイル付きのメールを受信しただけで、自動的にインデックス候補情報の中からインデックス情報が付与された文書として文書管理システムに文書登録ができる。このため、より手間のかからない文書登録が可能となる。特に、複合機50に添付ファイル付きメールが送信された場合、一度ClientPC10に転送したり、複合機50内の記憶装置に保存したりすることなく、文書登録を行うことが可能となる。
また、本発明は、複数の機器(例えばホストコンピュータ、インターフェース機器、プリンタなど)から構成されるシステムあるいは統合装置に適用しても、ひとつの機器からなる装置に適用してもよい。
又、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはu CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
又、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけではない。そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行う。このような処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
本実施形態に係る文書管理システムのシステム概念図である。 本実施形態に係る文書管理システムのPCのハードウェア構成図である。 本実施形態に係る文書管理システムのソフトウェア構成図である。 本実施形態に係る文書管理システムにおけるログイン及びユーザ特性登録処理の概要図である。 本実施形態に係る文書管理システムにおけるログイン及びユーザ特性登録処理を示すフローチャートである。 本実施形態に係る文書管理システムにおけるユーザ特性テーブル構成の一例を示す図である。 本実施形態に係る文書管理システムにおける文書登録処理の概要図である。 実施形態1に係る文書管理システムにおける文書登録処理の流れを示すフローチャートである。 本実施形態に係る文書管理システムにおける文書アクセス時の重み付け処理の概要図である。 本実施形態に係る文書管理システムにおける文書アクセス時の重み付け処理の流れを示すフローチャートである。 本実施形態に係る文書管理システムにおけるログイン時の文書収集処理の概要図である。 本実施形態に係る文書管理システムにおけるログイン時の文書収集処理の流れを示すフローチャートである。 本実施形態に係る文書管理システムにおけるログイン後の文書収集結果を表示するユーザインタフェースの一例を示す図である。 本実施形態に係る文書管理システムにおける文書登録処理の概要図である。 本実施形態に係る文書管理システムにおけるインデックス候補情報生成の一例を示す図である。 本実施形態に係る文書管理システムにおける文書登録時のインデックス候補情報生成処理の流れを示すフローチャートである。 本実施形態に係る文書管理システムにおけるインデックス候補情報生成時のインデックス候補情報の追加処理の流れを示すフローチャートである。 本の実施形態に係る文書管理システムにおける文書登録時のインデックス設定履歴情報の保存処理の流れを示すフローチャートである。 本実施形態に係る文書管理システムにおける文書登録/インデックス情報登録を行うユーザインタフェースの一例を示す図である。 本実施形態に係る文書管理システムにおける登録文書のインデックス情報の検索による絞込みを行うユーザインタフェースの一例を示す図である。 実施形態2に係る文書管理システムにおける添付ファイル付きメールを受信した際に、添付ファイルをインデックス情報付きで自動保存する時の処理の流れを示すフローチャートである。

Claims (13)

  1. 文書の登録を指定したユーザを特定するユーザ特性情報を取得するユーザ特性情報取得手段と、
    前記文書の文書情報を取得する文書情報取得手段と、
    前記ユーザ特性情報取得手段によって得られたユーザ特性情報と、前記文書情報取得手段によって得られた文書情報と、前記ユーザ特性情報取得手段によって得られたユーザ特性情報と所定の項目が一致するユーザ特性情報を持つ他のユーザの履歴情報とに基づき、前記文書に付与するためのインデックス候補情報を生成するインデックス候補情報生成手段と、
    前記インデックス候補情報生成手段が生成したインデックス候補情報を出力するインデックス候補情報出力手段と、
    前記インデックス候補情報出力手段が出力したインデックス候補情報から該ユーザにより選択されたインデックス情報を受信するインデックス情報受信手段と、
    前記インデックス情報受信手段により受信した前記インデックス情報を前記文書情報取得手段により取得した文書情報に対応する文書に関連づけて登録する文書登録手段と
    を有することを特徴とする文書管理装置。
  2. 前記文書情報取得手段は、文書中のOCR抽出文字列のうちから頻出回数の上位のOCR抽出文字列を文書情報として取得することを特徴とする請求項1に記載の文書管理装置。
  3. 前記インデックス候補情報生成手段は、前記ユーザ特性情報取得手段によって得られたユーザ特性情報の項目と前記文書情報取得手段によって得られた文書情報の項目とを比較して、一致した項目を前記インデックス候補情報に追加し、更に、前記ユーザ特性情報取得手段によって得られたユーザ特性情報と所定の項目が一致するユーザ特性情報を持つ他のユーザの履歴情報から文書の登録時に設定したインデックス情報を取得し、前記取得したインデックス情報を前記インデックス候補情報に追加することにより、前記インデックス候補情報を生成することを特徴とする請求項1に記載の文書管理装置。
  4. 前記インデックス候補情報出力手段は、前記インデックス候補情報を選択可能なユーザインタフェースとしてユーザの情報処理装置に表示させる表示指示手段を有することを特徴とする請求項1に記載の文書管理装置。
  5. 前記文書登録手段は、さらに、前記インデックス情報に関連づけて前記ユーザ特性情報取得手段によって得られた前記ユーザ特性情報を前記文書に設定して登録することを特徴とする請求項1に記載の文書管理装置。
  6. 前記ユーザ特性情報取得手段によって得られたユーザ特性情報と前記文書登録手段により登録した前記文書に前記インデックス情報に関連づけて設定したユーザ特性情報とを比較し、所定の項目が一致するユーザ特性情報を有する文書を前記ユーザに関連する文書として抽出する文書抽出手段を更に有することを特徴とする請求項に記載の文書管理装置。
  7. 文書管理システムのユーザ特性情報取得手段が、文書の登録を指定したユーザを特定するユーザ特性情報を取得するユーザ特性情報取得工程と、
    前記文書管理システムの文書情報取得手段が、前記文書の文書情報を取得する文書情報取得工程と、
    前記文書管理システムのインデックス候補情報生成手段が、前記ユーザ特性情報取得工程で得られたユーザ特性情報と前記文書情報取得工程で得られた文書情報と、前記ユーザ特性情報取得工程で得られたユーザ特性情報と所定の項目が一致するユーザ特性情報を持つ他のユーザの履歴情報とに基づき、前記文書に付与するためのインデックス候補情報を生成するインデックス候補情報生成工程と、
    前記文書管理システムのインデックス候補情報出力手段が、前記インデックス候補情報生成工程で生成したインデックス候補情報を出力するインデックス候補情報出力工程と、
    前記文書管理システムのインデックス情報受信手段が、前記インデックス候補情報出力工程で出力したインデックス候補情報から該ユーザにより選択されたインデックス情報を受信するインデックス情報受信工程と、
    前記文書管理システムの文書登録手段が、前記インデックス情報受信工程で受信した前記インデックス情報を前記文書情報取得工程で取得した文書情報に対応する文書に関連づけて登録する文書登録工程とを有することを特徴とする文書管理方法。
  8. 前記文書情報取得工程では、文書中のOCR抽出文字列のうちから頻出回数の上位のOCR抽出文字列を文書情報として取得することを特徴とする請求項に記載の文書管理方法。
  9. 前記インデックス候補情報生成工程は、前記ユーザ特性情報取得工程で得られたユーザ特性情報の項目と前記文書情報取得工程で得られた文書情報の項目とを比較して、一致した項目を前記インデックス候補情報に追加し、更に、前記ユーザ特性情報取得工程で得られたユーザ特性情報と所定の項目が一致するユーザ特性情報を持つ他のユーザの履歴情報から文書の登録時に設定したインデックス情報を取得し、前記取得したインデックス情報を前記インデックス候補情報に追加することにより、前記インデックス候補情報を生成することを特徴とする請求項に記載の文書管理方法。
  10. 前記インデックス候補情報出力工程は、前記インデックス候補情報を選択可能なユーザインタフェースとしてユーザの情報処理装置に表示させる表示指示工程を有することを特徴とする請求項に記載の文書管理方法。
  11. 前記文書登録工程では、さらに、前記インデックス情報に関連づけて前記ユーザ特性情報取得手段によって得られた前記ユーザ特性情報を前記文書に設定して登録することを特徴とする請求項に記載の文書管理方法。
  12. 前記ユーザ特性情報取得工程で得られたユーザ特性情報と前記文書登録工程で登録した前記文書に前記インデックス情報に関連づけて設定したユーザ特性情報とを比較し、所定の項目が一致するユーザ特性情報を有する文書を前記ユーザに関連する文書として抽出する文書抽出工程を更に有することを特徴とする請求項11に記載の文書管理方法。
  13. コンピュータを、
    文書の登録を指定したユーザを特定するユーザ特性情報を取得するユーザ特性情報取得手段、
    前記文書の文書情報を取得する文書情報取得手段、
    前記ユーザ特性情報取得手段によって得られたユーザ特性情報と、前記文書情報取得手段によって得られた文書情報と、前記ユーザ特性情報取得手段によって得られたユーザ特性情報と所定の項目が一致するユーザ特性情報を持つ他のユーザの履歴情報とに基づき、前記文書に付与するためのインデックス候補情報を生成するインデックス候補情報生成手段、
    前記インデックス候補情報生成手段が生成したインデックス候補情報を出力するインデックス候補情報出力手段、
    前記インデックス候補情報出力手段が出力したインデックス候補情報から該ユーザにより選択されたインデックス情報を受信するインデックス情報受信手段、
    前記インデックス情報受信手段により受信した前記インデックス情報を前記文書情報取得手段により取得した文書情報に対応する文書に関連づけて登録する文書登録手段、
    として機能させるためのプログラム。
JP2008029583A 2008-02-08 2008-02-08 文書管理装置、文書管理方法およびプログラム Active JP5247177B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008029583A JP5247177B2 (ja) 2008-02-08 2008-02-08 文書管理装置、文書管理方法およびプログラム
US12/365,749 US20090204607A1 (en) 2008-02-08 2009-02-04 Document management method, document management apparatus, information processing apparatus, and document management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008029583A JP5247177B2 (ja) 2008-02-08 2008-02-08 文書管理装置、文書管理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2009187485A JP2009187485A (ja) 2009-08-20
JP5247177B2 true JP5247177B2 (ja) 2013-07-24

Family

ID=40939776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008029583A Active JP5247177B2 (ja) 2008-02-08 2008-02-08 文書管理装置、文書管理方法およびプログラム

Country Status (2)

Country Link
US (1) US20090204607A1 (ja)
JP (1) JP5247177B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4826664B2 (ja) * 2009-08-25 2011-11-30 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置
JP5811708B2 (ja) * 2010-09-30 2015-11-11 ブラザー工業株式会社 画像処理システム、画像処理方法、中継装置、及び、中継プログラム。
JP5970782B2 (ja) * 2011-02-28 2016-08-17 株式会社リコー 情報処理装置および情報処理方法
WO2012169379A1 (ja) * 2011-06-09 2012-12-13 Shindo Tatsuya 文書共有システム
US8996350B1 (en) 2011-11-02 2015-03-31 Dub Software Group, Inc. System and method for automatic document management
CN103870279B (zh) * 2014-03-20 2017-03-15 中国工商银行股份有限公司 一种基于信息元的文档生成方法及***
JP6539993B2 (ja) * 2014-11-17 2019-07-10 株式会社リコー 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム
JP7210920B2 (ja) * 2018-07-23 2023-01-24 富士フイルムビジネスイノベーション株式会社 情報処理装置およびプログラム
JP7292988B2 (ja) 2019-06-17 2023-06-19 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
JP2021149439A (ja) * 2020-03-18 2021-09-27 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000222435A (ja) * 1999-02-04 2000-08-11 Nippon Telegr & Teleph Corp <Ntt> 情報資源検索装置及び情報資源検索プログラムを記録した記録媒体、キー情報付与方法及び装置、並びに、キー情報付与プログラムを記録した記録媒体
JP2000298669A (ja) * 1999-04-12 2000-10-24 Just Syst Corp 文書作成装置、文書作成方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6985948B2 (en) * 2000-03-29 2006-01-10 Fujitsu Limited User's right information and keywords input based search query generating means method and apparatus for searching a file
JP4245364B2 (ja) * 2003-02-03 2009-03-25 株式会社リコー キーワード抽出装置、プログラム、及び記録媒体
CN1777890A (zh) * 2003-03-12 2006-05-24 东洋工程株式会社 支持使用关键字的数据注册/搜索的设备、以及报告预备支持设备和程序
US7516146B2 (en) * 2003-05-15 2009-04-07 Microsoft Corporation Fast adaptive document filtering
JP4587478B2 (ja) * 2004-08-31 2010-11-24 キヤノン株式会社 文書提供システムおよび文書管理サーバ
JP2006092027A (ja) * 2004-09-21 2006-04-06 Fuji Xerox Co Ltd 文字認識装置、文字認識方法および文字認識プログラム
US7533155B2 (en) * 2005-03-30 2009-05-12 Ricoh Company, Ltd. System and method for managing documents with multiple network applications
US7831913B2 (en) * 2005-07-29 2010-11-09 Microsoft Corporation Selection-based item tagging
US20070078832A1 (en) * 2005-09-30 2007-04-05 Yahoo! Inc. Method and system for using smart tags and a recommendation engine using smart tags
JP2007179179A (ja) * 2005-12-27 2007-07-12 Hino Motors Ltd 文書情報管理装置
US20070250531A1 (en) * 2006-04-24 2007-10-25 Document Advantage Corporation System and Method of Web Browser-Based Document and Content Management
US8135725B2 (en) * 2006-08-11 2012-03-13 Yahoo! Inc. System and method for providing tag-based relevance recommendations of bookmarks in a bookmark and tag database
US20080097843A1 (en) * 2006-10-19 2008-04-24 Hari Menon Method of network merchandising incorporating contextual and personalized advertising
US8151204B2 (en) * 2006-11-29 2012-04-03 Siemens Medical Solutions Usa, Inc. Document viewing and management system
US20080313541A1 (en) * 2007-06-14 2008-12-18 Yahoo! Inc. Method and system for personalized segmentation and indexing of media

Also Published As

Publication number Publication date
JP2009187485A (ja) 2009-08-20
US20090204607A1 (en) 2009-08-13

Similar Documents

Publication Publication Date Title
JP5247177B2 (ja) 文書管理装置、文書管理方法およびプログラム
JP5129640B2 (ja) 出力装置とその制御方法
US7328245B1 (en) Remote retrieval of documents
EP2144429B1 (en) Information processing apparatus, image input apparatus, document distribution system, and control method therefor
JP5473230B2 (ja) 文書管理方法、文書管理装置、文書管理システム、およびプログラム
CN100545846C (zh) 文档搜索设备和方法
US9116927B2 (en) Methods and apparatuses for publication of unconsciously captured documents
US7428578B1 (en) Remotely initiated document transmission
US20110225505A1 (en) User Specific Focus Parameters
JP5290591B2 (ja) 文書管理装置、方法、プログラム、並びに、文書管理システム
CN103678168B (zh) 浏览器装置、浏览器***以及图像形成装置
JP2012085176A (ja) 画像形成装置、情報機器およびコンピュータプログラム
US7640576B2 (en) Print system, apparatus, and method for performing printing based on document information stored in document server
US20110047450A1 (en) Method of providing document box as web page and image forming apparatus to perform the same
JP5572990B2 (ja) 電子データを管理するシステム、装置及び方法
JP2011203964A (ja) 文書管理システム及び方法
JP2017135561A (ja) 受信した画像データを扱う画像処理装置、画像処理方法、及びプログラム
US20040049475A1 (en) System and method for globally providing document access history information
JP2000285039A (ja) デバイス検索装置及びその方法並びにそれを実現するためのコンピュータプログラムを記録した記録媒体
JP4645731B2 (ja) 画像処理装置、画像データ管理方法、およびコンピュータプログラム
US8375457B2 (en) Document management device, document management method and storage medium
JP5581660B2 (ja) 文書管理システム、文書管理装置、インタフェース装置及び文書管理方法
JP2009075849A (ja) 情報処理装置、情報処理方法、そのプログラム及び記憶媒体
JP2005032109A (ja) 文書データ管理装置,文書データアクセス用プログラム,文書データ管理プログラム
JP2008146588A (ja) 文書管理システム、サーバ、文書管理方法、文書管理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130409

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3