JP2004030614A - Information distribution system - Google Patents
Information distribution system Download PDFInfo
- Publication number
- JP2004030614A JP2004030614A JP2003127277A JP2003127277A JP2004030614A JP 2004030614 A JP2004030614 A JP 2004030614A JP 2003127277 A JP2003127277 A JP 2003127277A JP 2003127277 A JP2003127277 A JP 2003127277A JP 2004030614 A JP2004030614 A JP 2004030614A
- Authority
- JP
- Japan
- Prior art keywords
- information
- profile
- user
- feature
- distribution system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、情報配信システム、より詳細には、プリンタやコピー機などの情報機器の使用履歴を用いて、ユーザの情報ニーズを特定し、その情報ニーズに適した情報を情報源から収集し、ユーザに対して配信する情報配信システムに関する。
【0002】
【従来の技術】
オフィス環境において、例えば、インターネットや社内文書管理サーバにuploadされる情報を必要とするユーザを特定し、特定したユーザに対して情報をタイムリーに配信することが求められる。従来方式によると、例えば、下記のような手順に沿って、このような情報配信を実現していた。
(1)ユーザが手動で自分の必要とする情報のジャンルやキーワードを入力し、システムに格納されている自分のプロファイルに登録する。
(2)システムは、新しい情報がuploadされていると、該当するプロファイルを探して、そのプロファイルの所有者に対して、その新しい情報を配信する。
【0003】
しかしながら、このように手動によりプロファイルを作成・修正する方式には、例えば、下記に示すような幾つかの問題点がある。
・ユーザにキーワード入力の手間をかける。
・ユーザは自分の情報ニーズを表現するのに適切なキーワードが思い付かない場合がある。
・情報ニーズが変化する際に、ユーザが手動でプロファイルを修正しない限り、その変化がタイムリーにシステムに反映されない。
【0004】
また、例えば、特開2000−105764号公報(情報フィルタリングシステム)に記載の発明は、プロファイルの生成にユーザが適合と判定した文書情報を利用し、この文書情報に基づいて新たにユーザプロファイルを作成し、ユーザプロファイル間の関係を格納、管理することにより、ユーザの興味の変化に対応した文書情報を表示するようにしたものである。また、特開2001−160067号公報(類似文書検索方法および該類似文書検索方法を利用した推薦記事通知サービス)に記載の発明は、Web推薦記事通知サービスシステムにおいて、ユーザプロファイルと記事の類似度を複数の方法で算出、判別分析して決定するもので、プロファイルの生成にユーザが参照した結果をフィードバックするようにしたものである。また、特開2001−350786号公報(マーケティング支援システムおよびマーケティング支援方法)に記載の発明は、プロファイルの生成にユーザが作成した電子文書を解析し、プロファイルの陳腐化を防止するとともに、プロファイル構築の負担を軽減するようにしたものである。
【0005】
さらに、特開平11−66081号公報(プロファイル取得システム、情報提供システム、プロファイル取得方法及び媒体)には、プロファイルの取得のためにユーザが作成、参照、引用した文書を利用したものが開示されており、また、特開平11−45284号公報(プロファイルの作成方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体)には、プロファイルの作成のためにユーザが検索に使った検索条件と検索結果を利用したものが開示されている。
【0006】
上記従来技術はいずれもプロファイルの自動生成を目的としたものであるが、プロファイルの自動生成のベースとなる情報の取得手段が異なっている。しかしながら、その情報の取得手段として、例えば、プリンタ、コピー機、スキャナ、ファクシミリ、デジタル複合機といったオフィスで使用される情報機器を用いたものはこれまで存在しなかった。オフィスで使用される情報機器の中で、例えば、プリンタを用いて文書をプリントしたり、コピー機を用いてコピーしたりするということは、その人と文書に書かれている情報との関連性を示すと考えられる。例えば、ユーザが会議に配布するための資料をプリントする→その文書に書かれている情報はユーザ本人の仕事に必要とされている情報である。また、ユーザが論文誌の論文をコピーする→その文書(論文)に書かれている情報はユーザ本人が興味を持っている情報である。
【0007】
【発明が解決しようとする課題】
本発明は、上述のごとき実情に鑑みてなされたものであり、ユーザが使用する情報機器の使用履歴を用いて、自動的にプロファイルを生成・修正することにより、ユーザに負担をかけずに各種情報を配信できるようにすること、を目的としてなされたものである。
【0008】
【課題を解決するための手段】
請求項1の発明は、ユーザに情報を配信するためのサーバ装置と、ユーザが使用する情報機器とがネットワークを介して接続された情報配信システムにおいて、前記サーバ装置は、ユーザが使用する端末装置とネットワークを介して接続され、ユーザに関するプロファイル情報を登録するためのプロファイルDBにアクセス可能とし、前記情報機器を操作したユーザのID情報,操作日時,操作種類,操作対象文書のテキスト情報のいずれか複数を少なくとも含む操作履歴をユーザ毎に記録する操作履歴記録手段と、該記録されたテキスト情報に基づいて特徴情報を抽出する特徴抽出手段と、該抽出した特徴情報に対して重み付けし、該重み付けした特徴情報を該当ユーザのプロファイル情報に含めて前記プロファイルDBに登録するプロファイリング手段と、各種の情報を収集する情報収集手段と、前記プロファイルDBに登録されたプロファイル情報の中から、前記収集した情報に該当するプロファイル情報を抽出し、該抽出したプロファイル情報を有するユーザに対して前記収集した情報を配信する情報配信手段とを有することを特徴としたものである。
【0009】
請求項2の発明は、請求項1の発明において、前記サーバ装置は、前記情報配信手段により配信した情報がユーザによって参照された場合に、ユーザのID情報,参照日時,参照時間,参照対象情報のテキスト情報のいずれか複数を少なくとも含む参照履歴をユーザ毎に記録する参照履歴記録手段を有し、前記特徴抽出手段は、該参照履歴記録手段により記録されたテキスト情報に基づいて特徴情報を抽出し、前記プロファイリング手段は、該抽出した特徴情報に対して重み付けし、該重み付けした特徴情報に基づいて該当ユーザのプロファイル情報を修正することを特徴としたものである。
【0010】
請求項3の発明は、請求項1または2の発明において、前記特徴抽出手段は、前記操作履歴記録手段又は参照履歴記録手段により記録されたテキスト情報を言語解析して特徴情報を抽出し、前記プロファイリング手段は、前記操作履歴記録手段により記録された操作履歴又は前記参照履歴記録手段により記録された参照履歴に応じて前記抽出した特徴情報に対して重み付けし、該重み付けした特徴情報を該当ユーザのプロファイル情報に含めて前記プロファイルDBに登録することを特徴としたものである。
【0011】
請求項4の発明は、請求項1ないし3のいずれか1の発明において、前記プロファイリング手段は、前記プロファイルDBに登録されたユーザの中から、少なくとも1以上の共通したプロファイル情報を有するユーザを抽出し、該抽出したユーザをグループ化し、該グループ化したユーザに応じた共通プロファイルを生成し、該生成した共通プロファイルをグループ別に前記プロファイルDBに登録することを特徴としたものである。
【0012】
請求項5の発明は、請求項1ないし4のいずれか1の発明において、前記プロファイリング手段は、前記プロファイルDBに登録されたグループに新規ユーザを追加する際に、前記プロファイルDBに登録された共通プロファイルを用いて、前記新規ユーザが有するプロファイル情報を初期化できるようにしたことを特徴としたものである。
【0013】
【発明の実施の形態】
本発明は、例えば、プリンタやコピー機などの情報機器(以下、オフィス機器という)の使用履歴を用いて、ユーザの情報ニーズを特定し、その特定した情報ニーズに適した情報を各種の情報源から定期的、もしくは新しく情報を取得する度に収集し、該当ユーザに配信するシステムに関する提案であって、(1)オフィス機器の使用履歴を用いること、(2)利用者の情報ニーズを記述するプロファイルの生成と修正を自動的に行うこと、をその目的としている。これによって、利用者の負担を強いることなく、タイムリーにユーザの情報ニーズを特定することができる。ここでオフィス機器とは、例えば、パソコン,プリンタ,コピー機,ファクシミリ,スキャナ,デジタル複合機など、オフィス環境において使用される情報機器全般のことをいうものとする。
【0014】
図1は、本発明を適用するオフィス環境の一例を示した図で、図中、1はオフィス内で構築されたLAN、2はインターネット、10はユーザが使用する端末装置、11は社内文書を管理するための社内文書管理サーバ、12はプリンタ、13はコピー機、14はファクシミリ、15はスキャナ、16はデジタル複合機である。このような典型的なオフィス環境においては、インターネット2や社内文書管理サーバ11にuploadされる情報を、その情報を必要とするユーザが使用する端末装置10にタイムリーに配信することが求められる。
【0015】
図2は、本発明が適用される情報配信システムのモジュール構成例を説明するための図で、図中、20はユーザに情報を配信するためのサーバ装置で、該サーバ装置20は、操作履歴記録手段20a,特徴抽出手段20b,プロファイリング手段20c,情報収集手段20d,情報配信手段20e,参照履歴記録手段20fを有し、21はユーザに関するプロファイル情報を登録するためのプロファイルDB、22は各種情報を格納した情報源DB、30はユーザ(又はユーザが使用する端末装置)である。本実施形態において、プロファイルDB21はサーバ装置20と同じ場所に設置されているものとする。ここで、サーバ装置20の設置場所は、例えば、ユーザ側や、情報配信サービスを提供する外部のサービスプロバイダ側等いずれの場所でもよく、各端末装置や、オフィス機器にネットワークを介して接続されていればよい。また、本情報配信システムの実施形態は、サーバ装置20にプロファイルDB21が物理的に含まれている形態や、ネットワークを介して接続され、物理的に離散している形態のどちらの形態もとることができる。また、情報源DB22は、例えばWebサイトや、グループウェア上において各種情報を格納するものである。
【0016】
本実施形態におけるサーバ装置20は、ユーザが使用する端末装置30とネットワークを介して接続され、プロファイルDB21及び情報源DB22にアクセス可能とする。
【0017】
図2に示したシステム構成例における操作履歴記録手段20aは、プリンタやコピー機など各種オフィス機器がユーザによって使用される度に、下記のような操作履歴を取る。この操作履歴記録手段20aは、サーバ装置20側、又はオフィス機器(例えば、デジタル複合機16など)側のいずれに設けてもよい。
・誰が(ユーザ(操作者)のID情報)
・何時(プリントやコピーなどの操作が実施された日時)
・操作種類(print/copy/scan/faxなどの操作の種別)
・操作対象文書の本文テキスト情報(copy、scan、faxの場合、文書にOCRをかけて、本文テキスト情報を得る。)
【0018】
特徴抽出手段20bは、操作履歴記録手段20aと参照履歴記録手段20fで得られた本文テキスト情報を言語解析して、特徴情報を抽出し、プロファイリング手段20cに渡す。
【0019】
プロファイリング手段20cは、特徴抽出手段20bで抽出した特徴情報を該当ユーザの情報ニーズを表すものとして、例えば、特徴情報の出現する頻度、操作の種類および情報の閲覧時間などで重みづけを行い、そのユーザのプロファイルに含めてプロファイルDB21に登録する。さらに、各ユーザのプロファイルの共通部分から、ユーザグループの共通プロファイルを生成・修正する。グループに新しいメンバを追加する時には、この共通プロファイルで新人のプロファイルを初期化することができる。
【0020】
情報収集手段20dは、情報源DB22から各種の情報を横断的に、定期的に、または情報源DB22に新しい情報がuploadされる度に、新しい情報を収集してきて、情報配信手段20eに渡す。
【0021】
情報配信手段20eは、情報収集手段20dから新しい情報が渡されると、プロファイルDB21に登録されたすべてのユーザのプロファイルから該当するプロファイルを探し出す。該当プロファイルの所有者全員に、その新しい情報を配信する。
【0022】
参照履歴記録手段20fは、情報配信手段20eから配信された情報を個々のユーザが参照する度に下記のような参照履歴を取って、特徴抽出手段20bに渡す。この参照履歴記録手段20fは、サーバ装置20側、又はユーザが使用する端末装置30側のいずれに設けてもよい。
・誰が(ユーザのID情報)
・何時(配信された情報をユーザが参照した日時)
・閲覧(参照)時間(配信された情報をユーザが閲覧した時間)
・参照対象情報の本文テキスト情報
【0023】
次に、図2に示す情報配信システムによる情報配信処理の手順の一例について説明する。まず、サーバ装置20は、個々のユーザがオフィス機器(プリンタ12,コピー機13,ファクシミリ14,スキャナ15,デジタル複合機16など)を使用する度に、ユーザ毎に操作履歴を取る(S1)。この操作履歴には、上述したごとく、誰が、何時、操作種類(print/copy/scan/fax)、操作対象文書の本文テキスト情報(copy、scan、faxの場合、文書にOCRをかけて、本文テキスト情報を得る。)を少なくとも含むものとする。
【0024】
次に、本文テキスト情報を言語解析して、文書の特徴情報を抽出する(S2)。この抽出した特徴情報をユーザの情報ニーズを表すものとして、特徴情報が出現する頻度や操作の種類などで重みづけを行い、そのユーザのプロファイルに含めてプロファイルDB21に登録する(S3)。次に、情報源DB22から定期的、または情報源DB22に新しい情報がuploadされる度に、プロファイルDB21に登録されたすべてのユーザのプロファイルから、uploadされた情報に合致するプロファイルを探し出す(S4)。そして、該当するプロファイルの所有者全員に、その新しい情報を配信する(S5)。
【0025】
さらに、サーバ装置20は、上記S5において配信した情報を個々のユーザが参照したかどうかの参照履歴を取る(S6)。この参照履歴には、上述したごとく、誰が、何時、閲覧(参照)時間、その参照対象情報の本文テキスト情報を少なくとも含むものとする。この参照履歴に含まれる本文テキスト情報に対して自然言語処理などをかけて、情報の特徴情報を抽出する(S7)。この特徴情報をユーザの情報ニーズを表すものとして、例えば、特徴情報の出現する頻度や、閲覧(参照)時間の長さなどで重みづけを行い、そのユーザのプロファイルを修正する(S8)。
【0026】
また、各ユーザのプロファイルの共通部分から、ユーザグループの共通プロファイルを生成・修正する(S9)。グループに新しいメンバを追加する時には、この共通プロファイルで自分のプロファイルを初期化することができる。
【0027】
本発明によると、ユーザはプロファイルの入力の手間をかけずに、欲しい情報が自動的に配信されてくるので、情報収集の効率が向上する。また、ユーザの情報収集スキルに関係なく、所望の情報ニーズを表す適切な特徴情報が思い付かなくても、高度な情報収集が可能になる。また、ユーザの情報ニーズの変化がタイムリーにシステムに反映される上、ユーザに対して負担をかけることがない。また、前述したようなオフィス機器に対して新たな付加価値を与えることができる。
【0028】
図3は、デジタル複合機(以下、MFPという)が配置されているオフィスにおいて情報配信システムを構築した場合の実施形態の一例を説明するための図で、図中、40はユーザに情報を配信するためのサーバ装置で、該サーバ装置40は、プロファイルエンジン40a、情報配信収集手段40bを有し、41はユーザに関するプロファイル情報を登録したプロファイルDBである。サーバ装置40は、MFP16とネットワークを介して接続され、プロファイルDB41にアクセス可能とする。まず、MFP16側でlogging処理を行う。
【0029】
図4は、MFP16におけるlogging処理の一例を説明するためのフローチャートである。まず、ユーザ30がMFP16を操作する(print、copy、scan、fax、etc)度に(ステップS11)、MFP16は、その操作種類がprintかどうか判断し(ステップS12)、操作種類がprintの場合(YESの場合)、MFP16は、例えば、操作者ID、現在時刻、操作種類、操作対象文書の本文テキスト情報などを少なくとも含む操作履歴を取得する。上記ステップS12で操作種類がprintではなく、copy、scan、faxのいずれかの場合(NOの場合)、文書にOCRをかけて、本文テキスト情報を得る(ステップS14)。この際に、社員証などをMFP16に通してから処理を行うといった工夫をすれば、操作者を容易に特定することができる。次に、上記ステップS12にて取得した操作履歴が直ちにプロファイルエンジン40aに渡される(ステップS13)。ユーザの操作が終了したかどうか判断し(ステップS15)、操作が終了した場合(YESの場合)、そのまま終了し、操作が終了していない場合(NOの場合)、ステップS11に戻りMFP16に対して操作を行う。
【0030】
図5は、プロファイリングエンジン40aにおける処理の一例を説明するためのフローチャートである。まず、プロファイルエンジン40aは、新規ユーザ登録が有るかどうかを判断し(ステップS21)、新規ユーザ登録がある場合(YESの場合)、後述する共通ユーザプロファイルで、その新規ユーザのプロファイルを初期化してプロファイルDB21に登録する(ステップS23)。新規ユーザ登録がない場合(NOの場合)、ステップS22に移行する。次に、MFP16より操作履歴が送られてきたか、又は情報配信収集手段40bより閲覧(参照)履歴が送られてきたかを確認し(ステップS22)、両方の履歴が送られてきていない場合(NOの場合)、ステップS21に戻り、継続して履歴の確認を行う。また、ステップS22でいずれかの履歴が送られてきた場合(YESの場合)、取得した本文テキスト情報に自然言語処理をかけ、特徴情報を抽出する(ステップS24)。
【0031】
ここで、上記ステップS24において、本文テキスト情報(以下、本例において文書dという)に対して、例えば形態素解析などの自然語処理をかけた上で、公知の特徴情報抽出技術、例えば、キーワード抽出技術を利用して、特徴情報{kd1,kd2,…,kdn}を抽出する。次に、抽出した特徴情報の出現頻度や、履歴の種類(例えば、閲覧、print、copy、scan、faxなど)等に基づき、抽出した特徴情報に重みをつける(ステップS25)。これは、例えば、閲覧した文書の特徴情報の重みを10に、printした文書の特徴情報の重みを8に、copyした文書なら重みを9に、faxなら2に設定する。この重みはユーザによって異なる設定が可能である。最後に、これらの重み付き特徴情報{(kd1,wd1),(kd2,wd2),…,(kdn,wdn)}をこのユーザのプロファイルに登録する(ステップS26)。ここでユーザのプロファイルには、下記のような情報が含まれるものとする。
プロファイル情報:(UserID,(keyword1,weight1),(keyword2,weight2),…,(keyowordN,weightN))
【0032】
ここで、プロファイルDB41に登録する際に、キーワード:kdiがプロファイルに既に登録されているかどうかによって、異なる重み計算を行う。
(1)kdiが既に登録され、kdi=keywordjの場合
weightj= wj+α×wdi ・・・式(1)
つまり、kdiの重みを既存の重みに加算する。αは既定係数である。
(2)kdiが新規特徴情報の場合
weightN+1= α×wdi ・・・式(2)
つまり、kdiを新規特徴情報keywordN+1として登録する。
(3){kd1,kd2,…,kdn}にないプロファイルにある特徴情報wkがある場合
weightk = wk−β ・・・式(3)
つまり、文書dの特徴情報に含まれない、プロファイルに登録されている特徴情報の重みをβ分減らす。
【0033】
これら重み付き特徴情報をプロファイルDB41に登録終了後(ステップS26)、全ユーザのプロファイルの共通特徴情報を抽出し、共通プロファイルとして登録する(ステップS27)。この際、共通特徴情報の重みを、全てのユーザのプロファイルにおける、この特徴情報の重みの最小重みとする。次に、全ユーザのプロファイルの共通特徴情報を登録したかどうか判断し(ステップS28)、共通特徴情報を登録した場合(YESの場合)、そのまま終了し、登録していない場合(NOの場合)、ステップS21に戻り処理を繰り返す。
なお、以上には、特徴情報がキーワードであることを想定して説明したが、キーワードの代りにフレーズまたはアウトライン情報などであってもよい。
【0034】
図6は、情報配信収集手段40bにおける処理の一例を説明するためのフローチャートである。情報配信収集手段40bは、下記の2つの機能を有する。
・新規情報を該当ユーザに配信する。
・配信した情報が閲覧された際の閲覧履歴をプロファイリングエンジン40aに渡す。
【0035】
まず、情報配信収集手段40bは、情報源(例えば、Webサイト、Notesなど)のアクセスログをモニタすることにより、配信した情報が閲覧されたかどうか判断し(ステップS31)、配信した情報がアクセス(閲覧)された場合(YESの場合)、閲覧履歴(ユーザID、アクセス時刻、アクセスした情報の本文テキスト情報など)をプロファイリングエンジン40aに渡す(ステップS33)。配信した情報がアクセス(閲覧)されない場合(NOの場合)、ステップS32に移行する。
【0036】
一方、情報配信収集手段40bは、情報源における情報の登録状況をモニタすることにより、新規情報があるかどうか判断し(ステップS32)、新規情報が登録された場合(YESの場合)、プロファイルDB41に登録されたプロファイルと照合し、該当ユーザがあるかどうか検索し(ステップS34)、該当ユーザがある場合(YESの場合)、そのユーザに対して上記新規情報を配信する(ステップS35)。上記ステップS32及びステップS34において、NOの場合は、ステップS31に戻りアクセスログのモニタを継続して行う。さらに、情報配信収集手段40bは、配信した情報がユーザによって参照された際に生成される参照ログをプロファイルエンジン40aに渡して、プロファイルエンジン40aがこれをベースに各ユーザのプロファイルの修正を行う。
【0037】
【発明の効果】
本発明によると、ユーザが使用する情報機器の使用履歴を用いて、自動的にプロファイルを生成・修正することにより、ユーザに負担をかけずに各種情報を配信することができる。
【図面の簡単な説明】
【図1】本発明を適用するオフィス環境の一例を示した図である。
【図2】本発明が適用される情報配信システムのモジュール構成例を説明するための図である。
【図3】デジタル複合機が配置されているオフィスにおいて情報配信システムを構築した場合の実施形態の一例を説明するための図である。
【図4】MFPにおけるlogging処理の一例を説明するためのフローチャートである。
【図5】プロファイリングエンジンにおける処理の一例を説明するためのフローチャートである。
【図6】情報配信収集手段における処理の一例を説明するためのフローチャートである。
【符号の説明】
1…LAN、2…インターネット、10…端末装置、11…社内文書管理サーバ、12…プリンタ、13…コピー機、14…ファクシミリ、15…スキャナ、16…デジタル複合機(MFP)、20,40…サーバ装置、20a…操作履歴記録手段、20b…特徴抽出手段、20c…プロファイリング手段、20d…情報収集手段、20e…情報配信手段、20f…参照履歴記録手段、21,41…プロファイルDB、22…情報源DB、30…ユーザ(端末装置)、40a…プロファイルエンジン、40b…情報配信収集手段。[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention uses an information distribution system, more specifically, a use history of an information device such as a printer or a copier to identify a user's information needs, and collects information suitable for the information needs from an information source, The present invention relates to an information delivery system for delivering to a user.
[0002]
[Prior art]
In an office environment, for example, it is required to specify a user who needs information uploaded to the Internet or an in-house document management server, and to deliver the information to the specified user in a timely manner. According to the conventional method, for example, such information distribution is realized according to the following procedure.
(1) The user manually inputs the genre and keyword of the information he or she needs, and registers it in his or her profile stored in the system.
(2) When new information is uploaded, the system searches for a corresponding profile and distributes the new information to the owner of the profile.
[0003]
However, such a method of manually creating and modifying a profile has some problems as described below, for example.
-It takes time for the user to enter keywords.
-Users may not come up with keywords that are appropriate for expressing their information needs.
When information needs change, the changes are not timely reflected in the system unless the user manually modifies the profile.
[0004]
Also, for example, the invention described in Japanese Patent Application Laid-Open No. 2000-107564 (information filtering system) uses document information determined by a user as suitable for generating a profile, and newly creates a user profile based on the document information. Then, by storing and managing the relationship between the user profiles, the document information corresponding to the change in the user's interest is displayed. Further, the invention described in Japanese Patent Application Laid-Open No. 2001-160067 (similar document search method and recommended article notification service using the similar document search method) provides a Web recommended article notification service system that determines the similarity between a user profile and an article. This is determined by calculation and discriminant analysis by a plurality of methods, and the result of the user's reference in generating the profile is fed back. Further, the invention described in Japanese Patent Application Laid-Open No. 2001-350786 (marketing support system and marketing support method) analyzes an electronic document created by a user to generate a profile, thereby preventing profile obsolescence and creating a profile. This is to reduce the burden.
[0005]
Further, Japanese Patent Application Laid-Open No. 11-66081 (profile acquisition system, information providing system, profile acquisition method, and medium) discloses a document using a document created, referred to, or cited by a user for acquiring a profile. Japanese Patent Application Laid-Open No. H11-45284 (a computer-readable recording medium that records a method for creating a profile and a program for causing a computer to execute each step of the method) is disclosed in Japanese Patent Application Laid-Open No. 11-45284. Discloses a search condition and a search result used in a search.
[0006]
All of the above-mentioned prior arts aim at automatic generation of profiles, but differ in the means for acquiring information which is the basis for automatic generation of profiles. However, as a means for acquiring the information, there has not been a device using an information device used in an office such as a printer, a copier, a scanner, a facsimile, and a digital multifunction peripheral. Among the information devices used in offices, for example, printing a document using a printer or copying using a copier means that the person is related to the information written in the document. It is considered to show. For example, the user prints a material to be distributed to the conference → the information described in the document is information required for the job of the user himself / herself. In addition, the user copies a paper in a paper journal. → Information written in the document (paper) is information that the user himself is interested in.
[0007]
[Problems to be solved by the invention]
The present invention has been made in view of the above circumstances, and automatically generates and corrects a profile using the use history of an information device used by a user. The purpose is to enable distribution of information.
[0008]
[Means for Solving the Problems]
The invention according to
[0009]
According to a second aspect of the present invention, in the first aspect of the invention, when the information distributed by the information distributing means is referred to by the user, the server device transmits the user ID information, reference date and time, reference time, and reference target information. Reference history recording means for recording, for each user, a reference history including at least one of the plurality of text information, wherein the feature extraction means extracts feature information based on the text information recorded by the reference history recording means. The profiling means weights the extracted characteristic information, and corrects profile information of the user based on the weighted characteristic information.
[0010]
According to a third aspect of the present invention, in the first or second aspect of the invention, the feature extracting unit extracts a feature information by performing a linguistic analysis on the text information recorded by the operation history recording unit or the reference history recording unit. The profiling unit weights the extracted feature information according to the operation history recorded by the operation history recording unit or the reference history recorded by the reference history recording unit, and assigns the weighted feature information to the corresponding user. It is characterized in that it is included in profile information and registered in the profile DB.
[0011]
According to a fourth aspect of the present invention, in the first aspect of the present invention, the profiling means extracts a user having at least one or more common profile information from the users registered in the profile DB. Then, the extracted users are grouped, a common profile corresponding to the grouped users is generated, and the generated common profile is registered in the profile DB for each group.
[0012]
According to a fifth aspect of the present invention, in the invention according to any one of the first to fourth aspects, when the profiling means adds a new user to a group registered in the profile DB, the profiling means registers the common user registered in the profile DB. It is characterized in that the profile information possessed by the new user can be initialized using a profile.
[0013]
BEST MODE FOR CARRYING OUT THE INVENTION
For example, the present invention specifies the information needs of a user by using the usage history of information devices (hereinafter, referred to as office devices) such as printers and copiers, and outputs information suitable for the specified information needs to various information sources. This is a proposal for a system that collects information every time or new information is acquired and distributes it to the relevant user, and (1) uses the usage history of office equipment, and (2) describes the information needs of the user. Its purpose is to automatically generate and modify profiles. Thus, the information needs of the user can be specified in a timely manner without imposing a burden on the user. Here, the office equipment refers to all information equipment used in an office environment, such as a personal computer, a printer, a copier, a facsimile, a scanner, and a digital multifunction peripheral.
[0014]
FIG. 1 is a diagram showing an example of an office environment to which the present invention is applied. In the figure, 1 is a LAN constructed in the office, 2 is the Internet, 10 is a terminal device used by a user, and 11 is a company document.
[0015]
FIG. 2 is a diagram for explaining an example of a module configuration of an information distribution system to which the present invention is applied. In the figure,
[0016]
The
[0017]
The operation
・ Who (user (operator) ID information)
・ What time (date and time when operations such as printing and copying were performed)
Operation type (operation type such as print / copy / scan / fax)
-Body text information of the operation target document (in the case of copy, scan, fax, OCR is applied to the document to obtain body text information)
[0018]
The
[0019]
The
[0020]
The
[0021]
When new information is passed from the
[0022]
The reference history recording unit 20f obtains the following reference history every time the individual user refers to the information distributed from the information distribution unit 20e, and transfers it to the
・ Who (user ID information)
・ When (date and time when the user referred to the distributed information)
・ Browsing (reference) time (time when the user browsed the distributed information)
-Body text information of reference target information [0023]
Next, an example of a procedure of an information distribution process by the information distribution system illustrated in FIG. 2 will be described. First, the
[0024]
Next, linguistic analysis of the body text information is performed to extract feature information of the document (S2). The extracted feature information is expressed as the information needs of the user, weighted by the frequency of occurrence of the feature information, the type of operation, and the like, and included in the profile of the user and registered in the profile DB 21 (S3). Next, periodically, or every time new information is uploaded to the
[0025]
Further, the
[0026]
Further, the common profile of the user group is generated and corrected from the common part of the profile of each user (S9). When adding a new member to a group, you can initialize your own profile with this common profile.
[0027]
According to the present invention, desired information is automatically distributed without the user having to input a profile, thereby improving the efficiency of information collection. Also, regardless of the information collection skill of the user, advanced information collection becomes possible even if appropriate characteristic information representing desired information needs cannot be conceived. In addition, changes in the information needs of the user are reflected in the system in a timely manner, and no burden is imposed on the user. Further, new added value can be given to the office equipment as described above.
[0028]
FIG. 3 is a diagram for explaining an example of an embodiment in which an information distribution system is constructed in an office where a digital multifunction peripheral (hereinafter, referred to as an MFP) is arranged. In the figure,
[0029]
FIG. 4 is a flowchart illustrating an example of the logging processing in MFP 16. First, each time the
[0030]
FIG. 5 is a flowchart for explaining an example of the processing in the
[0031]
Here, in step S24, the body text information (hereinafter, referred to as document d in the present example) is subjected to natural language processing such as morphological analysis, and is then subjected to a known feature information extraction technique, for example, keyword extraction. Using technology, feature information {k d1 , k d2 ,..., K dn } is extracted. Next, the extracted feature information is weighted based on the appearance frequency of the extracted feature information, the type of history (for example, browsing, print, copy, scan, fax, etc.) (step S25). For example, the weight of the feature information of the viewed document is set to 10, the weight of the feature information of the printed document is set to 8, the weight is set to 9 for the copied document, and to 2 for the fax. This weight can be set differently for each user. Finally, the weighted feature information {( kd1 , wd1 ), ( kd2 , wd2 ),..., ( Kdn , wdn )} is registered in the profile of this user (step S26). Here, it is assumed that the user's profile includes the following information.
Profile information: (UserID, (keyword 1 , weight 1 ), (keyword 2 , weight 2 ), ..., (keyword N , weight N ))
[0032]
Here, when registering in the profile DB 41, different weight calculations are performed depending on whether or not the keyword: k di is already registered in the profile.
(1) When k di is already registered and k di = keyword j , weight j = w j + α × w di (1)
That is, the weight of k di is added to the existing weight. α is a predetermined coefficient.
(2) When k di is new feature information weight N + 1 = α × w di (2)
That is, registers the k di as the new characteristic information keyword N + 1.
(3) When there is feature information w k in a profile that is not in {k d1 , k d2 ,..., K dn }, weight k = w k −β (3)
That is, the weight of the feature information registered in the profile that is not included in the feature information of the document d is reduced by β.
[0033]
After registering these weighted feature information in the profile DB 41 (step S26), the common feature information of the profiles of all users is extracted and registered as a common profile (step S27). At this time, the weight of the common feature information is set to the minimum weight of the feature information in the profiles of all users. Next, it is determined whether or not the common feature information of the profiles of all the users has been registered (step S28). , Returning to step S21 and repeating the processing.
Although the description has been made assuming that the characteristic information is a keyword, a phrase or outline information may be used instead of the keyword.
[0034]
FIG. 6 is a flowchart for explaining an example of the processing in the information distribution collection unit 40b. The information distribution collecting means 40b has the following two functions.
・ Distribute new information to the relevant users.
-Pass the browsing history when the distributed information was browsed to the
[0035]
First, the information distribution collecting means 40b determines whether or not the distributed information has been viewed by monitoring the access log of the information source (for example, Web site, Notes, etc.) (step S31). If it has been browsed (YES), the browsing history (user ID, access time, text information of the accessed information, etc.) is passed to the
[0036]
On the other hand, the information distribution collection unit 40b determines whether there is new information by monitoring the registration status of the information in the information source (step S32), and when the new information is registered (in the case of YES), the profile DB 41 The new information is delivered to the user (step S34). If the user is found (step S34), the new information is delivered to the user (step S35). In the case of NO in the above steps S32 and S34, the process returns to step S31 to continuously monitor the access log. Further, the information distribution collection unit 40b passes a reference log generated when the distributed information is referred to by the user to the
[0037]
【The invention's effect】
According to the present invention, various information can be distributed without burdening the user by automatically generating and correcting the profile using the usage history of the information device used by the user.
[Brief description of the drawings]
FIG. 1 is a diagram showing an example of an office environment to which the present invention is applied.
FIG. 2 is a diagram illustrating an example of a module configuration of an information distribution system to which the present invention is applied.
FIG. 3 is a diagram illustrating an example of an embodiment when an information distribution system is constructed in an office where a digital multifunction peripheral is arranged.
FIG. 4 is a flowchart illustrating an example of a logging process in an MFP.
FIG. 5 is a flowchart illustrating an example of a process in a profiling engine.
FIG. 6 is a flowchart illustrating an example of a process in an information distribution collection unit.
[Explanation of symbols]
DESCRIPTION OF
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003127277A JP2004030614A (en) | 2002-05-08 | 2003-05-02 | Information distribution system |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002133232 | 2002-05-08 | ||
JP2003127277A JP2004030614A (en) | 2002-05-08 | 2003-05-02 | Information distribution system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004030614A true JP2004030614A (en) | 2004-01-29 |
Family
ID=31190144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003127277A Pending JP2004030614A (en) | 2002-05-08 | 2003-05-02 | Information distribution system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004030614A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008502052A (en) * | 2004-06-02 | 2008-01-24 | ヤフー! インコーポレイテッド | Content management system for user behavior targeting |
CN100426282C (en) * | 2004-09-22 | 2008-10-15 | 夏普株式会社 | Image processing apparatus and image processing system |
JP2012173861A (en) * | 2011-02-18 | 2012-09-10 | Fuji Xerox Co Ltd | Content automatic updating system, image forming apparatus, and proxy server |
-
2003
- 2003-05-02 JP JP2003127277A patent/JP2004030614A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008502052A (en) * | 2004-06-02 | 2008-01-24 | ヤフー! インコーポレイテッド | Content management system for user behavior targeting |
JP2011040086A (en) * | 2004-06-02 | 2011-02-24 | Yahoo Inc | Content management system for user behavior targeting |
CN100426282C (en) * | 2004-09-22 | 2008-10-15 | 夏普株式会社 | Image processing apparatus and image processing system |
JP2012173861A (en) * | 2011-02-18 | 2012-09-10 | Fuji Xerox Co Ltd | Content automatic updating system, image forming apparatus, and proxy server |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4908094B2 (en) | Information processing system, information processing method, and information processing program | |
JP3936862B2 (en) | Recommendation system and recommendation method | |
US6327590B1 (en) | System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis | |
US20060250631A1 (en) | Printing control apparatus and printing control method | |
EP1638026A1 (en) | An individually personalized customized report document system | |
CA2339812A1 (en) | Document delivery system for automatically printing a document on a printing device | |
US8370384B2 (en) | Information processing apparatus, file management method, program, and storage medium | |
US7403990B2 (en) | Information distribution system | |
US20080243818A1 (en) | Content-based accounting method implemented in image reproduction devices | |
JP2009187376A (en) | File management device, file management method, and program | |
JP2008276437A (en) | Image forming apparatus, advertisement display method and computer program | |
US8451477B2 (en) | Image forming apparatus, printing method, publicized information aggregating apparatus and method, and computer-readable storage medium for computer program | |
JP2004030614A (en) | Information distribution system | |
JP4274450B2 (en) | Printing system, information storage medium, printing method, and print server | |
JP2007128370A (en) | Document management server, document management system, document management method, and document management program | |
US20030009391A1 (en) | System for electronically submitting and monitoring copy reproduction jobs | |
US20040098273A1 (en) | Customization apparatus and method | |
JP3844751B2 (en) | Content management system, content management method, program, and recording medium | |
KR20090053109A (en) | Apparatus for creating semantic metadata of image and method thereof, and system for offering semantic metadata of image using that and method thereof | |
JP2002279080A (en) | Method for providing news story scrap | |
JP2005275764A (en) | Information service method and system | |
JP4660423B2 (en) | Image forming system and image forming method | |
JP2007172234A (en) | Image processing history management device | |
JP2010226549A (en) | Individual information distribution system, individual information distribution server, and image forming apparatus | |
Cevasco | An overview of the prototype information dissemination system (PRIDES) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090421 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090618 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090714 |