JP2008140377A - 情報検索装置、方法およびプログラム - Google Patents

情報検索装置、方法およびプログラム Download PDF

Info

Publication number
JP2008140377A
JP2008140377A JP2007262885A JP2007262885A JP2008140377A JP 2008140377 A JP2008140377 A JP 2008140377A JP 2007262885 A JP2007262885 A JP 2007262885A JP 2007262885 A JP2007262885 A JP 2007262885A JP 2008140377 A JP2008140377 A JP 2008140377A
Authority
JP
Japan
Prior art keywords
information
search
unit
input
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007262885A
Other languages
English (en)
Other versions
JP5223284B2 (ja
Inventor
Matulic Fabrice
マートリッチ ファブリス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2007262885A priority Critical patent/JP5223284B2/ja
Priority to US11/935,615 priority patent/US8726178B2/en
Priority to CN2007101695258A priority patent/CN101178725B/zh
Publication of JP2008140377A publication Critical patent/JP2008140377A/ja
Application granted granted Critical
Publication of JP5223284B2 publication Critical patent/JP5223284B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】入力する情報から、ネットワーク上のデータベース装置を介してデジタル情報を検索して取得する文書検索装置を提供する。
【解決手段】文書検索装置10は、画像形成装置に組み込まれており、スキャナ1により読み込んだ原稿画像に対して、領域分割部11は文字領域とその他の領域とを分割する。キーワード抽出部12は文字と解析された領域からキーワードを抽出し、検索部13はキーワードによってネットワーク4上の他のデータベース装置5を検索し、関連する文書情報を取得する。表示制御部14は、取得した検索情報をモニタ15b上に表示させる。
【選択図】 図1

Description

本発明は、ネットワーク上の情報を検索する情報検索装置、方法およびプログラムに関するものである。
従来、文書を検索する情報検索装置としては、PCを使用して、すでに登録されている登録文書に対してキーワードとなる文字列を文字コードでキーワードとして入力し、格納しているデジタルデータと参照して情報を取得する方式が知られていた。
例えば、特許文献1に記載された技術では、検索対象文書とは別に管理されている複数のスケジュール情報を取得し、取得した複数のスケジュール情報を表示し、表示された複数のスケジュール情報中から一つのスケジュール情報が選択されると、選択されたスケジュール情報からキーワードにする文字列を抽出し、抽出された文字列をキーワードとして検索対象文書中のデジタル文書を検索する。
特開2000−231568号公報
特許文献1の技術は、複数のスケジュール情報に対して、そのうちのいずれかを選択した場合に、関連する文書を検索して表示するというものだった。しかしながら、実際に現実世界に存在する一般的な情報は、デジタルベースの情報よりもデジタル化される以前の例えば新聞雑誌などのように印刷媒体などの情報がはるかに多い。上記の特許文献1の技術は、このように現実世界に非常に多く存在するデジタル化以前の情報に対して関連する情報を検索することは不可能であるという問題があった。
また、デジタル文書を検索して取得するのであれば、取得したデジタル文書を再利用することも望まれている。
本発明はこのような問題を解決するためになされ、その目的は、非デジタル情報を取得して自動的にネットワーク上に格納されたデジタル情報を検索して取得することができるとともに取得したデジタル情報の再利用を図ることができる情報検索装置、情報検索方法、およびその方法をコンピュータに実行させるプログラムを提供することである。
上述した課題を解決し、目的を達成するために、本発明にかかる情報検索装置は、入力部により入力された入力情報を表示する第1画面と検索指定または検索結果を表示する第2画面とを表示可能であり、前記第1画面または前記第2画面からの利用者よる入力操作が可能な表示入力装置と、前記入力情報を、前記入力情報を構成する情報の属性に基づいて、複数の領域に分割する領域分割部と、前記入力情報から、分割された領域単位に検索キーを抽出する抽出部と、分割された領域を前記第1画面に表示し、前記第1画面の前記領域を指定して前記第2画面に移動する入力を受け付ける表示入力制御部と、前記第2画面に移動された前記領域の情報に含まれる前記検索キーに基づいてネットワークを介して検索対象情報を検索する検索部と、を備え、前記表示入力制御部は、検索された前記検索対象情報を表示することを特徴とする。
また、本発明は、上記情報検索装置で実行される情報検索方法およびプログラムである。
本発明によれば、入力情報を構成する情報の属性に基づいて、複数の領域に分割し、入力情報から、分割された領域単位に検索キーを抽出し、分割された領域を第1画面に表示し、第1画面の前記領域を指定して第2画面に移動する入力を受け付け、第2画面に移動された前記領域の情報に含まれる検索キーに基づいてネットワークを介して検索対象情報を検索し、検索された検索対象情報を表示することで、入力情報から自動的に原稿に関連する検索対象情報を検索してその検索結果を表示することができ、利用者にとって簡便になるとともに検索結果として表示された検索対象情報の再利用を図ることができるという効果を奏する。
以下に添付図面を参照して、この発明にかかる情報検索装置、方法およびプログラムの最良な実施の形態を、実施の形態1〜10、および変形例1〜3に沿って詳細に説明する。
(1.実施の形態1)
実施の形態1による文書検索装置は、画像形成装置に組み込まれて、スキャンした原稿から自動的に文字情報を読み出しキーワードを抽出し、このキーワードによってネットワーク上の他のデータベース装置を検索して関連する文書情報を取得して、表示する。このように、この文書検索装置が組み込まれた画像形成装置は、原稿をスキャンするだけで、煩雑なキーボード操作の必要なく、容易に原稿に記載された内容に関連する情報をネットワーク上のデータベースから取得することができる。以下、画像形成装置に組み込まれた構成として、文書検索装置を説明する。
図1は実施の形態1による文書検索装置を備えた画像形成装置の機能的ブロック図である。画像形成装置は、スキャナ1、画像処理部2、画像出力部3、および文書検索装置10を備える。また、画像形成装置は、ネットワーク4を介してデータベース装置5に接続する。
文書検索装置10は、領域分割部11、キーワード抽出部12、検索部13、表示制御部14、操作表示部15、および入出力部16を備える。スキャナ1によって読み込まれた原稿画像情報は、画像形成装置の有する画像処理部2によって、デジタル変換、ガンマ変換など画像処理特有の処理を施され、例えばビットマップイメージのような画像情報として入出力部16を介して文書検索装置10に受信される。操作表示部15は、情報を表示するモニタ15b、および各種の設定を受け付ける操作部15aを有する。
領域分割部11は、スキャナ1が読み取って入出力部16が受信した原稿情報を文字領域と文字情報以外の領域とに分割する。領域分割部11は、入力する情報を解析し、文書情報を構成する要素である文書構成要素を抽出する。文書構成要素とは、例えば、読み取った原稿の段落、写真画像、図表、あるいは見出しなど、一定の領域を情報が占めていて、文書を構成している要素である。
領域分割部11は、文書構成要素の属性を解析し、属性ごとの分割領域を取得する。即ち、文字情報の分割領域、図表情報の分割領域、写真などの画像情報の分割領域、およびその他の分割領域に分ける。
図2は、領域分割部11の機能的ブロック図である。領域分割部11は、領域識別部11aおよび属性解析部11bを有する。領域識別部11aは、スキャンされた文書データの各領域を識別する。領域識別部11aは、スキャンされた情報を、原稿における情報の領域ごとに識別する。一般的に、文字属性の場合は段落ごと、写真画像および図表画像属性の場合はそれぞれ写真画像および図表画像ごとに領域を形成している。このように情報として形成されている領域を識別して分割する。
領域識別部11aは、文書データの濃度変化、エッジ部の検出、および中間調領域の検出などを検出して文書データの領域を識別する。領域識別部11aは、例えば、濃度差の検出によって文字であると判定した部分が連続した状態であることを検知して、文字領域を識別する。また、中間調画素が連続することを検出して、写真画像の領域であると識別することができる。また、エッジ部と、濃淡の差が激しいことを検出することによって、図表画像の領域であることを識別できる。それ以外については、文字、写真、および図表の組み合わせ、あるいはそれ以外であると判定し、領域識別処理を施す。これらは公知技術であるので詳細な説明を省略する。
属性解析部11bは、領域識別部11aによって識別される領域の情報が文字、写真画像、中間調画像、図表画像、およびその他の画像のうちいずれの属性の情報であるかを解析する。この結果、識別される領域がその領域ごとに属性解析されるため、属性ごとに領域分割されることになる。属性ごとに領域分割された要素は文書構成要素となる。
図3は、属性解析部11bの機能的ブロック図である。属性解析部11bは、レイアウト解析部11b1と、文字認識部11b2とを有する。レイアウト解析部11b1は、領域識別部11aによって抽出された文書構成要素に対して、文書中におけるレイアウト構造を解析する処理を施す。レイアウト解析部11b1が行うレイアウト解析は、例えばエッジ検出、中間調検出、画素位置の検出などの検出情報を、公知のアルゴリズムに当てはめて、それぞれの分割領域のレイアウトを解析する。
図4は、文字認識部11b2の機能的ブロック図である。文字認識部11b2は、文字切り出し部11b21、スプラインベクトル変換部11b22、および光学的読取(OCR)部11b23、を有する。
文字認識部11b2は、属性解析部11bによって文字属性であると解析された文書構成要素に対して、文字認識処理を施して文字要素を機械処理可能なフォーマットに変換する。
文字切り出し部11b21は、濃淡検出によって文字を切り出す。文字切り出し部11b21を有することによって、正確に文字を切り出して文字解析を行うことができる。
スプラインベクトル変換部11b22は、切り出された文字に対してスプライン整形処理を施す。スプラインベクトル変換部11b22によって、文字の表示をより滑らかにすることができる。
OCR部11b23は、画像として読み取られ、スプライン整形処理を施された文字に対して、光学的読み取りを行って文字認識処理を施す。OCR部11b23は、文字認識処理によって文字画像をテキスト情報として抽出する。
文字認識部11b2は、文字要素を機械処理可能なフォーマットに変換するので、キーワード抽出部が行うキーワード抽出処理を正確で迅速なものとし得る。ここで文字認識処理は、公知のアルゴリズムを適用することによって可能である。
操作表示部15は、図1に示すように、操作者による操作入力を受け付ける操作部15a、および入力情報や検索結果情報を表示するモニタ15bを有する。
表示制御部14は、領域分割部11が、情報の属性によって分割した分割領域を、モニタ15bに表示させる。さらに、領域分割部11は、操作表示部15の操作部15aが受け付ける操作者による属性についての設定入力によって、分割領域の属性を決定する構成とすることができる。例えば、操作者が表示された画面から操作者自身の判断によって、領域分割部11によって解析されて表示された文字画像は実は写真画像であると判断して、操作者が写真画像である旨の入力を行った場合、領域分割部11は、この写真画像である属性の入力を受け付けて写真画像であると設定する。
また、操作表示部15から、文字読み取りのミス等に対して操作者の判断によって修正入力が受け付けられた場合、文字認識部11b2は、受け付けた修正の文字情報を設定する。これによって、分割された領域である文書構成要素の属性を、操作者の入力によって変更することができ、また文字の読み取りミスも修正することができる。
図5は、キーワード抽出部12の機能的ブロック図である。キーワード抽出部12は、キーワード辞書12aを有する。キーワード辞書12aは、特定の文字情報をキーワードとしてメモリに格納している。
キーワード抽出部12は、文字領域の文字列を形態素解析により形態素ごとの文字列に分割する。そして、キーワード抽出部12は、形態素ごとの文字列とキーワード辞書12aに格納されているキーワードと比較し、一致するか否かを判定する。一致した場合、キーワード抽出部12は、一致した文字列をキーワード候補として抽出する。また、キーワード抽出部12は、キーワード辞書12aによって抽出されたキーワード候補に対して、レイアウト解析で得られたレイアウトおよび出現頻度などの条件を加味したアルゴリズムによってキーワードをさらに絞り込んで判定することもできる。
検索部13は、キーワード抽出部12が抽出したキーワード、およびキーワードによる検索命令情報を、入出力部16を介してネットワーク4に接続されているWeb上のデータベース装置5に送信する。
ネットワーク4上のデータベース装置5は、キーワード情報および検索命令情報を受信した場合、キーワードに基づいて検索を実行し、実行して得た検索結果の情報をHTML(HyperText Markup Language)形式で、ネットワーク4を介して文書検索装置10に対して送信する。文書検索装置10は、データベース装置5がネットワーク4を経由して送信してくる検索結果の情報を、入出力部16を介して受信する。
表示制御部14は、データベース装置5からの検索結果情報をHTML形式のファイルで受信し、モニタ15bに表示させる。ここで、表示制御部14は、検索結果の情報を、モニタ15b上にWebブラウザビューワで表示させる。これによって操作者は、通常のPC(パーソナルコンピュータ)を利用したWeb上の検索のように、検索結果を操作表示部15のモニタ15bにおいてブラウザ形式で視認することができる。
図6は、操作表示部15を示す模式図である。操作表示部15において操作部15aは押下ボタン、接触入力、テンキー方式などによって、操作者からの操作を受け付ける。モニタ15bは、スキャナが読み取った画像、各種の設定項目、および検索結果を表示する。モニタ15bは、また、接触による設定、およびドラッグアンドドロップ操作などの手動による接触入力を受け付ける。
モニタ15bは、ここで、左右に異なる画面を並列して表示している。全体の表示画面601のうち左側の画面610は、スキャナで読み取った原稿画像を表示したものである。右側の画面630は、データベース装置5から受信した検索結果情報を、表示したものである。
ここで、左側の画面610は、領域分割部11がスキャナ1で読み取った情報を属性により領域分割し、表示制御部14がモニタ15b上に表示している。例えば分割領域611、612は、写真による画像領域である。分割領域613は、文字情報による領域である。
キーワード抽出部12は、領域分割部11によって領域分割された情報のうちの文字情報からキーワードを抽出し、検索部13がキーワードに基づいてWeb上のデータベース装置5で検索を行わせる。画面610における文字情報の分割領域において、キーワードである「森」、「紙」、「パルプ」、および「材料」という言葉が抽出されたことが示されている。
図7は、入力情報および検索結果情報をモニタで表示した一例の模式図である。左側の画面710は、スキャナ1が読み取った画面である。領域分割部11によって、読み取られた情報は属性に従って領域に分割される。ここで、写真画像711、文字画像712などのように属性に従って領域分割されて表示される。
ここで表示制御部14は、分割領域の周囲に枠を描くようにして表示させている。表示制御部14は、枠で示した表示ではなく領域自体を点滅させて表示させ、あるいは影を付けて表示させることにしてもよい。どのような表示形態であっても、分割領域であることを強調した態様で表示することが望ましい。
また、表示制御部14は、キーワード抽出部12によって抽出されたキーワードに対して、キーワードの周囲を枠で表示させ、点滅させて表示させ、あるいは影を付けて表示させることが望ましい。抽出されたキーワードであることを強調した態様で表示し、操作者によって視認しやすいからである。
ここで、文書検索装置10は、スキャナ1によって、読み取ると同時に検索部13が検索動作を開始する構成としても良い。そして、読み取った画像を表示しない構成とすることもできる。読み取る原稿は手元にあって、重要なのは取得された検索結果情報である場合が多いため、簡略で見易い表示となるからである。
今、右側の画面730は、検索された結果の情報を表示している。しかし、最初スキャナで情報を読み込んだ時は、この部分には検索結果情報は取得されていないので、表示されていなく、ただ、検索画面である表示がなされている。
検索を開始させる操作入力として、特定の文字領域、例えば領域712に対して、操作者の指先などによる接触入力によって、右側の検索画面にドラッグアンドドロップ操作し、このドラッグアンドドロップ操作によってドラッグされる分割領域におけるキーワードに基づいて検索を開始する構成とすることができる。
また、複数の文字領域、例えば領域712および713が選択され、選択された状態で検索画面730にドラッグアンドドロップ操作されることによって、同様に選択された領域から抽出されたキーワードに基づいて検索動作を開始する構成とすることができる。これによって、分割領域の選択とキーワード抽出を連続した操作で実行できて、作業能率が高まるからである。
ここで、操作表示部15は、モニタに表示された分割領域に対して、検索指定としての選択の指定、および選択された指定の解除を受け付ける。表示制御部14は、操作表示部15が選択を受け付けた領域を、選択前とは異なった態様で表示させることが望ましい。操作者からの選択により分割領域が指定されて選択された分割領域からキーワード検索を行うことによって、より絞り込んだ的確な検索機能を実行することができるからである。
この場合、操作表示部15は、人間の指、スタイラスペンなどの接触入力、およびマウスによる入力によって操作を受け付けることが望ましい。より人間の日常的な操作に近い操作方式が可能となるからである。
また、特定の分割領域を指定しない場合は、キーワード抽出部12は、読み込んだ情報全てからキーワードを抽出する構成とする。これにより、特に分割領域を指定しない場合は、読み込んだ全体から関連する情報を自動的に検索して取得することができるからである。
画面730は、検索部13がキーワードに基づいてWeb上のデータベース装置5が検索した情報を受信して、表示制御部14がブラウザ形式で表示している。
(実施の形態1による文書検索手順)
図8は、実施の形態1による文書検索手順を説明するフローチャートである。入出力部16は、スキャナ1からの読み込み情報を受信したか否かを検出し(ステップS101)、検出した場合(ステップS101のYes)、入出力部16は、検出した読み込み情報を領域分割部11に送信する。
領域分割部11は、スキャナ1からのビットマップイメージなどの読み込み情報に対して、領域識別処理を施す(ステップS102)。そして、領域分割部11は、識別された領域について、領域を構成する情報の属性を解析する。即ち、文字、写真、図表、その他種々の組み合わせからなる領域であることを解析し、当該分割領域の情報の属性を解析する(ステップS103)。
ここで、特に、領域分割部11は、文字情報による分割領域を特定する(ステップS104)。キーワードを抽出するためである。
表示制御部14は、入力情報をモニタに表示する設定であるか、表示しない設定であるかを判定する(ステップS105)。入力情報をモニタに表示しない設定である場合(ステップS105のNo)、表示制御部14は、入力情報をモニタに表示せずに、キーワード抽出部12は、読み込んだ情報全てからキーワードを抽出する(ステップS109)。
一方、表示制御部14は、入力情報をモニタに表示する設定であると判定した場合(ステップS105のYes)、表示制御部14は、入力情報をモニタに表示する(ステップS106)。例えば図7の画面701における左側の画面710である。
操作表示部15は、分割領域の指定を受け付けたか否かを検出し(ステップS107)、操作者からの指定入力を受け付けなかった場合(ステップS107のNo)、読み込んだ情報全てからキーワードを検出する(ステップS109)。
操作表示部15は、分割領域の指定を受け付けた場合(ステップS107のYes)、キーワード抽出部12は、指定された分割領域からキーワードを抽出する。指定された分割領域を操作者の指などで右の検索画面にドラッグアンドドロップ操作されて検索動作を開始するようにしても良い(ステップS108)。
検索部13は、抽出されたキーワードに基づいてWeb上で検索を行う。即ち、検索部13は、抽出されたキーワードおよび該キーワードによる検索命令情報を、Web上のデータベース装置5に送信し、受信するデータベース装置5に当該キーワードによる検索を実行させる。データベース装置5は、検索結果情報をネットワーク4を介して文書検索装置10に送信する(ステップS110)。
入出力部16がWeb上からの検索結果を受信した場合(ステップS111のYes)、表示制御部14は、検索結果情報をモニタの例えば図7の画面730のように、モニタ15b上に検索結果画面として表示する(ステップS112)。
このようにして、実施の形態1による文書検索装置10は、スキャナで読み込んだ原稿の情報に対して領域分割、文字情報の解析、キーワードの抽出、Web上での検索、そして検索結果の表示を1つのアプリケーションで実行することができる。
ここで、スキャナで読み込んだ画像と、検索した情報とを操作表示部15の表示画面に並列して表示させることによって、もとの原稿画像と、この原稿に基づいて自動的にWeb上で検索された結果とを、対比して観察することができる。
ここで、表示制御部14は、検索部13が新たに検索を行った場合、新たな検索結果を更新して表示することが望ましい。ユーザの利便性のためである。
また、スキャナで読み込む画像を表示しない構成とすることもできる。読み込んで、検索結果だけを見たい場合には、モニタ15bでの表示を簡略なものとして、検索結果のみを表示することによって簡明な表示とすることができる。
このように、実施の形態1の文書検索装置10が組み込まれた画像形成装置は、原稿をスキャンするだけで、煩雑なキーボード操作の必要なく、容易に原稿に記載された内容に関連する情報を、ネットワーク上に豊富に存在するデータベース装置から取得することができるので、簡易な操作によって原稿内容に関連する情報を電子媒体の形でネットワーク装置から取得することができる。
このように本実施の形態では、入力情報を構成する情報の属性に基づいて、複数の領域に分割し、入力情報から、分割された領域単位に検索キーを抽出し、分割された領域をに左側の画面(第1の画面)に表示し、当該画面の領域を指定して検索画面(第2の画面)に移動する入力を受け付け、検索画面に移動された領域の情報に含まれる検索キーに基づいてネットワークを介して検索対象の文書を検索し、検索された文書を検索画面に表示しているので、入力情報から自動的に原稿に関連する検索対象の文書を検索してその検索結果を表示することができ、利用者にとって簡便になるとともに検索結果として表示された検索対象の文書の再利用を図ることができる。
(情報入力の方式)
図9は、文書検索装置に情報入力する他の装置を示す図である。入出力部16には、被写体の撮像情報を取得するCCD(Charge Coupled Device)カメラ1aを接続する構成とすることができる。領域分割部11は、CCDカメラ1aが撮像した撮像情報を受け付けて領域分割し、この撮像情報から抽出されたキーワードに基づいて関連する情報をネットワークから検索することができる。
また、入出力部16には、手書き情報を文字として受け付ける手書き入力タブレット1bを接続する構成とすることができる。領域分割部11はこの手書き入力タブレット1bから手書き入力する情報を領域分割し、OCR機能を実行して文字認識した情報から抽出されたキーワードに基づいて、関連する情報をネットワーク上から検索することができる。また、手書き入力タブレット1bから文字入力を受け付けてキーワードを設定したり、文字情報に対して修正を加えたりすることができる。
また、入出力部16は、CD(Compact Disc)、DVD(Digital Versatile Disc)、CF(Compact Flash)カード、およびSD(Secure Digital)メモリカード等の記憶媒体を読み込みまた書き込むカードリーダ・ライタ1cを接続することができる。領域分割部11は、これらの記録媒体に格納された情報を入力して領域分割し、この読み込み情報から抽出されるキーワードに基づいて関連する情報をネットワークから検索することができる。
以上は、情報の入力方式について説明したが、出力についても同様である。即ち、検索部13によって検索して取得した検索結果情報を、上記の記憶手段であるCD、DVD、CFカード、およびSDカード等の記憶媒体にカードリーダ・ライタによって書き込む構成とすることができる。
さらに、入出力部16は、ネットワーク4経由で情報を入力し、検索してその検索結果を入出力部16からネットワーク4経由で送信することもできる。また、検索結果を画像出力部3を介して記録紙などに画像出力することもできる。
(キーワード検索について)
ここで、キーワード辞書12aに格納されているキーワードは、アクセスの度にアクセス回数がカウントされ、該キーワードとアクセス数情報とが関連付けられて格納されることが望ましい。これによって、アクセス頻度順に配列することによって、より迅速にキーワードを抽出することができる。
また、キーワード辞書12aは、それぞれのキーワードを分野ごとに分類して格納しておくことが望ましい。より高速の検索が可能になるからである。
また、キーワード抽出部12は、キーワード抽出処理を実行するごとに、所定の回数および所定の文法的条件を満たす文字列情報については、キーワード辞書12aに登録することが望ましい。キーワードは、時間とともに、あるいは検索する文書情報の種類とともに、新たに出現し、あるいは出現頻度が変化するからである。
また、キーワード抽出部12は、分割領域の文字情報の中から出現頻度が所定のしきい値を超えるものを、キーワードとして抽出することが望ましい。出現頻度の低い文字情報は、一般的にキーワードでない可能性が高いからである。
また、操作表示部15は、抽出しようとするキーワードの数の設定入力を受け付ける構成とすることができる。キーワードの数を調整することによって、絞り込み検索、その逆に拡散した範囲の検索が可能になるからである。
また、キーワード抽出部12は、文字領域の単語数が設定されたキーワードの数よりも少ない場合、文字として表れている当該単語をキーワードとして抽出することが望ましい。これは、例えば、写真や図表の多い原稿に対してキーワード検索を行う場合、短い見出しだけの場合もあるからである。このような場合は、検出されている文字全てをキーワードとして選択することによって、適切なキーワード検索が可能になる。
(画像形成装置への適用)
図10は、実施の形態1による文書検索装置を備える画像形成装置の画像形成動作を説明する図である。画像形成装置の画像形成動作については、公知技術であるので、以下、簡略な説明にとどめる。
ここで、画像形成装置は、デジタル複写機である。デジタル複写機100は本体110、大量記録紙供給装置(以下LCT)111、ソート、穴あけ、ステイプルなどを行うフィニッシャー112を備え、本体110の上部には原稿を載置し読み取るための自動原稿供給装置(以下ADFと称する)113、および読み取りのためのモード、複写倍率の設定、給紙段の設定、フィニッシャー112で後処理の設定、オペレータに対する表示などを行う操作部114を備えている。操作部114は、操作表示部15を兼ねることができる。
本体110の下側には給紙部115があり、フィニッシャー112には排紙部117を備えている。デジタル複写機100の内部は露光光学系、給紙搬送系、現像系、定着系、排紙系等のデジタル複写機の公知の機構、制御装置が内蔵されており、複写機としての動作を実現している。
原稿をADF113の上に載置し、操作部114上のコピー開始キーを押下することにより、ADF113の下の図示しないコンタクトガラス上に原稿が供給され、その原稿を図示しない照明系、結像光学系により読み取る。通常の画像形成動作においては、このまま読み取った画像データに対して様々な補正・処理を行った後、その画像データに基づいて書き込み系においてレーザーダイオードによりビームを照射し、図示しない感光体へ静電潜像を形成する。
実施の形態1による文書検索装置を備えるデジタル複写機100では、上記の動作によって読み取られた画像情報に対して、領域分割部11、キーワード抽出部12、検索部13、および表示制御部14がそれぞれ既に説明した機能を実行して検索結果情報をモニタ15bに表示する。
その後はいわゆる電子写真のプロセスを経て、操作部114により指示されて給紙部115または116から給紙した記録紙にコピー画像を形成し、あるいは取得された検索情報を印刷し、フィニッシャー112にてソート、穴あけ、ステイプルなどの後処理を行った後、排紙部117に排出する。
(2.実施の形態2)
図11は、実施の形態2による文書検索装置20の機能的ブロック図である。実施の形態2による文書検索装置20は、URL(Uniform Resource Locator)アクセス部27をさらに備え、検索部13が取得する検索情報からURL(Uniform Resource Locator)情報を抽出し、抽出したURLへアクセスして当該URLに公開されている情報をダウンロードする。表示制御部24は、URLアクセス部27がURLからダウンロードした情報を、モニタ15bにブラウザ表示させる。
図12は、検索結果画面のURLをクリックして得られダウンロード情報を表示した模式図である。抽出したキーワードによってWeb上から得られた情報の多くは、URL情報を含んでいる。検索結果情報は、モニタ15bの右側の画面1210に表示される。ここで表示されている例えばURL1211を接触入力によってダブルクリックすると、モニタ15bはこの操作入力を受け付ける。URLアクセス部27は、入出力部16を介して受け付けられたURLにアクセスし、当該URLにアップされている情報をダウンロードして左側の画面1220にブラウザ表示する。
画面1210で表示された検索情報の文章の欄外にURLが表示されている場合も同様に、ダブルクリックでURLにアップされている情報をダウンロードして表示する構成とする。
このように、URLアクセス部27が、検索結果に表れたURL情報に基づいて、URLに公開されている情報をネットワーク4を介して取得することによって、より詳細な検索情報を取得することができる。
(3.実施の形態3)
図13は、実施の形態3による文書検索装置の機能的ブロック図である。実施の形態3による文書検索装置は、操作表示部35の操作部35aは、表示される複数のキーワードの組み合わせの指定を受け付け、検索部33は、受け付けたキーワードの組み合わせに従って検索する命令情報を生成し、キーワードと関連付けてデータベース装置5に送信する。これによって、検索の範囲を広げたり、狭めたり、あるいは広げた範囲の中で絞り込むなど、操作者の必要に応じた検索範囲を設定して、この設定に応じた検索結果を取得することができる。
ここで、操作部35aは、表示される複数のキーワードに対して、and検索およびor検索の指定を受け付ける。また、and検索およびor検索の組み合わせの指定を受け付ける。このような検索範囲の指定を、検索部33は、検索命令情報として生成することによって、より精密な検索動作が可能になる。
あるいは、操作部35aは、複数の分割領域の指定を受け付け、受け付けた分割領域の組み合わせ指定を受け付ける。例えば、図7における文字領域712と文字領域713をand結合して、両方の領域において共通に抽出されるキーワードについて、検索部33は検索を実行する。or検索については、両方の領域のいずれかに含まれるキーワードについて検索処理を施す。このように、領域単位の組み合わせによって、領域で抽出されるキーワードを組み合わせて検索を実行することができるので、領域単位でキーワードを絞り込みあるいは検索範囲を広げるという、より自由度の高いかつ絞り込みが可能な検索を実行することができる。
検索部33は、このように分割領域の組み合わせを設定しても、この分割領域から抽出されるキーワードについて組み合わせ検索命令を検索命令情報として記述することによって、可能となる。しかし、操作者の設定操作としては、分割領域だけの選択指定であるので、キーワードそのものをいちいち組み合わせ設定する必要がないので、この設定方式は利便性が高いものとなる。
ここで、操作表示部35は、キーフレーズの選択入力を受け付ける構成とすることができる。これは、キーフレーズ自体が重要なキーワードとなっている場合があり、このような選択入力を受け付けることができれば、より的確な検索が可能となるからである。そして、検索部13は、受け入れられたキーフレーズによって検索を行う。キーフレーズ検索の実施技術としては、例えば、複数のキーワードの順番を固定してand検索することによって実施可能である。
ここで、モニタ15bに表示された画像の近傍にある文字領域に対する指定が受け付けられた場合、指定が受け付けられたテキスト領域におけるキーワードを抽出し、抽出されたキーワードを画像に関連付けしてこのキーワードに基づいて検索する。このような検索方式によって、画像に関連して抽出されたキーワードに基づいて検索することができる。
例えば、図7において、写真画像領域711を通過するように指で複数の分割領域を接触しながら移動することによって、写真画像711に関する文字の分割領域を指定し、右側の検索画面730にドラッグアンドドロップ操作をすることによって、この指定された分割領域からキーワードを抽出して検索することができる。
検索結果の画面としては、この場合、画像711を右側の検索結果の画面に表示して、この写真画像に関連して検索して得られた情報を並列する形で表示することによって、写真画像711に関連する検索結果の情報であることを、明確に表示することができる。
(4.実施の形態4)
図14は、実施の形態4による文書検索装置40の機能的ブロック図である。実施の形態4は、スキャナで読み込んだ画像情報と、データベース装置5から受信する検索結果の情報とが一致したものか否かを判定する同一性判定部47を備える。そして、表示制御部44は、同一性判定部47がスキャナで読み込んだ画像と受信した検索情報とが一致したと判定した場合、当該一致した検索結果を他の検索結果と異なる態様でモニタ15b上に表示させる。
同一性判定部47は、読み込んだ画像における所定数の文字列と、取得するHTML形式の文字列とを比較する。この比較は、文字コードの一致を比較するので、内容的な一致の判定が容易に可能である。即ち、キーワード検索して取得した情報に対して、当該キーワードの前後の所定の文字列を対比することによって、一致したか否かを判定することができる。
この構成によって、例えばスキャナ1で読み込んだ新聞記事を、Web上で検索して該当する記事を電子データの形式で取得できた場合、当該電子データであることを表示することができるので、スキャナ1で読み込むことによって該当する同一内容の電子データを取得できた場合はその旨が表示されるので、実質的にアナログ情報からデジタル情報に変換することができる利便性の高い文書検索装置となる。
(変形例1)
ここで、実施の形態4の変形例1として、データベース装置5が受信したキーワードを含む原稿画像と検索結果情報とが一致したか否かを判定し、一致した場合に、一致した旨の情報を返信する場合、同一性判定部47を備えずに、表示制御部44が、一致したことを示す旨の情報を検索結果情報とともに表示させる。
ここでは、検索部13は、キーワードとともに該キーワードの前後の所定の文字列を送信する。データベース装置5においては、キーワード検索して取得した情報に対して、受信する当該キーワードの前後の所定の文字列を対比することによって、検索して得た情報と一致したか否かを判定することができる。そして、一致した時はその旨の情報を検索結果とともに返信する。
この構成によって、例えば、スキャナ1で読み込んだ新聞記事をWeb上で検索して該当する記事を電子データの形式で取得できた場合、当該電子データであることを表示することができるので、スキャナ1で読み取った内容のものと同一内容の電子情報を、Webから取得することができる。この際に、文書検索装置側においては、同一性判定部47を必要としない構成とすることができる。
(5.実施の形態5)
実施の形態5による文書検索装置においては、表示制御部が、複数のキーワードを表示部にトグルボタン(ウィジェット)でツールバー形式で表示させ、操作部15aは、表示されるトグルボタンからキーワードの選択を受け付ける。そして、検索部13は、受け付けられたトグルボタンに対応するキーワードに基づいて検索機能を実行する。実施の形態5による文書検索装置の機能的ブロック図は、図14を参照する。ここで、トグルボタンは、キーワードを指定するための画面構成要素である。
図15−1は、実施の形態5による文書検索装置において、抽出されたキーワードをトグルボタンで表示した一例の模式図である。表示制御部44は、モニタ15b上に、左側に読み込んだ情報を領域分割して表示した画面1510を表示する。この読み込み画面1510には、キーワード抽出部12が抽出したキーワードを、トグルボタンでツールバー1520内に収める態様で表示する。そして、モニタ15b上のツールバー1520内に表示されたキーワード1521〜1524のうちから、例えば接触入力によって選択が指定されたキーワードに対して、検索部13が検索し、検索結果を表示制御部44が右側の検索結果画面1530として表示する。
ここで、ツールバー1520に表示されるキーワードのトグルボタンは、複数を選択してand検索、あるいはor検索を指定する構成とすることができる。
また、ユーザが新たにキーワードを入力して、入力されたキーワードを指定する新たなトグルボタンとしてツールバー1520に追加して表示することもできる。この場合、キーワードの入力は任意に行うことができる。また、入出力部16として、手書き情報を文字として受け付ける手書き入力タブレット1bを接続して用いる場合には、ユーザが手書き入力タブレット1bから入力した手書き描画によるキーワードを文字認識して、新たなキーワードとして用いても良い。
例えば、任意の画面で、ユーザは、手書き入力の指示を所定のボタンを指定することにより行う。これにより、表示制御部44は、モニタ15bに図15−2に示すキーワード手書き入力画面を表示する。そして、ユーザは手書き入力タブレット1bから、この画面の手書き入力フィールにキーワードとして追加したい文字を手書きで描画する。そして、手書きで入力された画像に対し文字認識を施す文字認識部を設け、文字認識部は、手書きで入力された画像を文字認識してキーワードを出力する。キーワードとして出力された文字は、キーワード手書き入力画面の文字認識結果に表示される。そして、文字認識結果が正しければ、ユーザはOKボタンを指定する。これにより、手書き入力され、かつ文字認識されたキーワードのトグルボタンがツールバー1530に追加されることになる。
一方、文字認識結果が誤っていれば、ユーザはキャンセルボタンを指定する。これにより、キーワード手書き入力画面は消去される。このため、再度、手書き入力の指示を行う必要がある。
(変形例2)
図16は、変形例2による文書検索装置が、検索結果をトグルボタン表示する一例の模式図である。変形例2による文書検索装置では、表示制御部44は、表示された検索結果情報を、トグルボタンの態様でモニタ15bに表示させる。そして、このトグルボタンをクリックすることによって、トグルボタンで表現されている検索情報が画面全体に表示される(不図示)構成とすることができる。
右側の画面1610は、検索された結果情報である。左側の画面1620において表示されているトグルボタン1621〜1624は、検索結果の画面1610において表示されているそれぞれの検索情報に対応するトグルボタンである。さらに、例えば、トグルボタン1621をクリックすることによって、該当する検索結果の○○新聞の記事が、左側の画面トグルボタンの下部分に全面的に展開されて表示される(不図示)。
この変形例2による文書検索装置によって、検索結果の一覧をトグルボタンを使用することによって見易く表示することができる。また、特定のトグルボタンを選択して該トグルボタンに対応するもとの検索情報の詳細を表示させることができる。この場合、読み取った原稿画像、あるいはトグルボタンの一覧表示は最小化することによって、画面から直接には視認されない態様で、モニタ15bの表示から隠すことが可能な構成としても良い。
ここで、特に、表示制御部44は、検索部によって検索された情報のうちURL(Uniform Resource Locator)情報を、トグルボタンにより表示させる。そして、トグルボタンで表現されたURL情報をクリックすることによって、当該URLにアクセスして情報をダウンロードする構成とすることができる。
またここで、表示制御部44は、検索情報のうちから、ドラッグアンドドロップ操作で左の画面にドロップしたものについてのみトグルボタン表現する構成とすることができる。このように、操作者が必要と判断した情報のみをトグルボタン表示させることによって、簡略な表示とすることができる。
(6.実施の形態6)
図17は実施の形態6による文書検索装置の機能的ブロック図である。実施の形態6による文書検索装置60は、入出力部66が、検索部13によって検索された情報のうちURL情報を、他のネットワークで接続する情報処理装置、例えばパーソナルコンピュータ(PC)6に送信する。ネットワークを介して接続するPC6は、検索結果情報のうちURL情報を自動的に受信することができ、ネットワーク上の情報を共有することができる。
すでに、実施の形態5による文書検索装置において、表示制御部44は、検索部13によって検索された情報のうちURL情報を、トグルボタンにより表示させる例を説明したが、入出力部66は、このトグルボタンで表現されたURL情報を、PC6に送信する構成とすることができる。これによってネットワークを介して接続するPC6は、検索して取得したURL情報をネットワーク上で共有することができる。トグルボタンで表現されたURL情報の送信は、操作部15aからの操作入力によって送信しても良く、あるいはツールバーに入った時点で自動的に送信する構成としても良い。
また、実施の形態6による文書検索装置60は、取得した検索結果情報を保持する保持部67を、さらに備え、入出力部66は、保持部67に保持された検索結果情報をPC6に送信する。この構成によって、ネットワークを介して接続するPC6は、検索結果情報を自動的に受信することができ、ネットワーク上の情報を共有することができる。
PC6は、受信して共有するトグルボタン、トグルボタンに対応する情報、あるいは検索結果情報を、ツールバー形式でPC6のモニタ画面に表示することが望ましい。また、表示されたトグルボタンなどから、ドラッグアンドドロップ操作によってオープンしているアプリケーションに挿入する構成とすることが望ましい。これによって、ネットワークで接続する情報機器間で、検索された情報を共有して自由に使用することができるからである。
図18は、実施の形態6による文書検索装置よって検索された結果情報を表示する一例の模式図である。ここで、表示制御部64は、検索結果情報のそれぞれをトグルボタン情報で示し、コンテンツバーに収める態様で表示させている。画面1810は検索結果を表示している。トグルボタンバー1820は、検索された情報を表現するトグルボタン1821〜1824を収める形で表示するコンテンツバーである。
ここで、入出力部66は、検索情報トグルボタンバー1820に収められたトグルボタン1821〜1824およびそれぞれに対応する検索情報を、他のPC6に送信する。ネットワークを介して接続するPC6は、検索結果情報を示すトグルボタンおよび対応する検索情報を自動的に受信することができ、検索情報をネットワーク上で共通に表示して、かつ共有することができる。
トグルボタン情報を受信するPC6は、受信するトグルボタンを図18に示すツールバー形式で表示させる。検索されて共有する情報を使用する自由度が高まるからである。
(7.実施の形態7)
図19は、実施の形態7による文書検索装置の機能的ブロック図である。実施の形態7による文書検索装置70は、モニタ15bで表示する検索結果に対して、操作表示部15からの編集操作を受け付けて編集処理を施す編集部77を、さらに備え、表示制御部74は、編集部77によって編集処理を施された画面をモニタ15bに表示する。また、編集部77によって、編集された内容を電子メール情報に生成する電子メール生成部78を有する。
入出力部76は、編集部77によって編集され、表示制御部74に表示されている編集結果情報を出力する。これによって、編集結果を表示しながら編集し、編集した結果を他の用途に使用することができる。電子メール生成部78は、編集部77によって受け付けられた編集画面を、電子メールとして生成し、入出力部76は、生成された電子メールを送信する。
図20は、実施の形態7による文書検索装置において、検索結果を編集して生成した電子メールを表示する模式図である。ここで、左側の画面2010は検索結果を表示している。このうち画像2011を電子メール編集画面の添付ファイル欄にドラッグアンドドロップし、文字領域2012を文字編集画面にドラッグアンドドロップする。この操作によって、電子メール生成部78は、電子メール編集画面2020において文字情報2021を有し、画像情報2022が添付された電子メールファイルを生成する。
ここで、電子メールファイルとしては、XMLファイル、HTMLファイル、テキストファイルなど、どのような形式でも良い。また、画像情報については、電子メール本体に添付する添付ファイル形式で送信することができる。また、電子メール生成部78は、表示される電子メール編集画面の内容を、MIME(Multipurpose Internet Mail Extensions)変換によって電子メールを生成することもできる。
このように実施の形態7による文書検索装置は、単一のアプリケーションによって、スキャナ1によって読み込み、自動的にキーワードを抽出してWeb上で検索し、検索した結果を表示して操作者が編集を加えた内容を、電子メールとして送信することができる利便性の高いものとなる。
(8.実施の形態8)
図21は、実施の形態8による文書検索装置の機能的ブロック図である。実施の形態8による文書検索装置は、領域分割部11によって分割された画像領域から当該画像情報の特徴量を抽出する画像特徴量抽出部87を、さらに備え、検索部83は、抽出された特徴量情報および検索命令情報をネットワークを介してデータベース装置85に送信し、データベース装置85が特徴量情報と検索命令情報に基づいて検索した画像情報を、表示制御部84は検索結果としてモニタ15bに表示させる。
画像特徴量算出部87は、領域分割部11によって画像情報であると解析された分割領域の画像情報に対して、例えば画像のパターンから算出される特徴量、色彩から算出される特徴量、およびコントラストから算出される特徴量を取得する。あるいは、画像に関連する文字情報から抽出する特徴量を取得する。
画像特徴量算出部87が取得したこれらの画像特徴量は、当該画像の検索キーとなるベクトル値である。検索部83は、この画像情報について取得したベクトル値を当該画像の特徴量情報として、入出力部86からネットワーク4を介してデータベース装置85に送信する。
データベース装置85は、画像検索機能として、例えば、受信する画像特徴量のベクトル値を、保有する画像情報の中から、このベクトル空間において設定された距離が最短となる画像情報を選び出し、検索された画像情報として文書検索装置80に送信する。このような画像検索技術は公知のものであるので詳細な説明は省略する。
図22は、実施の形態8の文書検索装置80が検索した画像情報を表示する画面の模式図である。スキャナ1で読み込まれた情報を表示した左側の画面2210から、領域分割部11が写真画像2211および2212を画像情報による分割領域と解析し、検索部83は、写真画像2211および2212の画像特徴量を算出する。算出された画像特徴量はベクトル値である。
データベース装置85の画像検索機能によって、検索対象の画像特徴量ベクトルと最短距離にある画像が選択されて、検索画像情報として送信される。モニタ15b上に表示される右側の画面2220は、データベース装置85が画像検索して送信してきた情報を受信して、表示制御部84が表示させたものである。
この構成によって、スキャナで読み取った原稿画像から自動的に画像特徴量を取得し、該画像情報の特徴量に基づいてネットワーク上で画像を検索して、検索された画像情報をダウンロードして画像表示することができる。即ち、実施の形態8による文書検索装置によると、画像を読み取るだけで、ネットワーク上から関連する画像情報を取得することができる。
この場合、表示制御部84は、スキャナにより入力した画像情報、および検索部83の検索によって取得した画像情報を、既に説明したように並列する態様でモニタ15bに表示させることが望ましい。画像の検索は、文字の検索に比較して、特徴量という不確定な要素の大きな量によって検索するため、結果の画像情報を並列して視認できるようにする場合の利便性は高いからである。
(変形例3)
変形例3による文書検索装置は、複数の検索方式を備え、複数の検索方式によって検索した結果情報を取得して表示する。ここで、複数の検索方式を実行する各部の機能・動作については、既述の図21を参照しながら説明する。
検索部83は、文書情報については、抽出されたキーワードを使用して検索し、画像情報については画像特徴量算出部87によって取得された画像特徴量を使用して検索する。さらに、検索部83は、データベース装置85において文書情報を検索する場合における検索対象となる文書情報の範囲を限定する検索命令情報を生成する。
ここで、限定された範囲とは、例えば、文字情報の検索対象として、新聞記事、週刊誌記、あるいは一般のWeb上に公開されている情報などの範囲に限定することである。データベース装置85は、この検索対象を限定する命令情報を受信して、限定された検索範囲において文書情報を検索する。また、画像については、実施の形態8で既に説明した画像検索方式によって検索する。
図23は、変形例3による文書検索装置が検索した結果を表示する一例の模式図である。スキャナで読み込んだ画像が左側に領域分割されて表示されるのは、これまでに説明した例と同様である。ここで、操作者によってこの画面が、右側の検索画面2320にドラッグアンドドロップ操作される。
操作者によって、Web検索画面2321にドラッグされると、Web上の情報が検索され、取得された場合、表示される。ニュース検索画面2322にドラッグされると、ニュース記事の情報が検索され、取得された場合、表示される。画像検索画面2323にドラッグされると、画像情報が検索され、取得された場合、表示される。それぞれの検索結果情報が表示されることについては、既に述べた通りであるので図示を省略する。
ここで、操作部表示部15は、選択を受け付けた領域を表示された複数の検索方式へドラッグアンドドロップする操作を受け付けて、検索部83が、モニタ15bに表示された複数の検索方式に対応する領域へのドラッグアンドドロップ操作に対応した検索方式で検索を開始する。
ここで、文字情報による検索結果および画像情報による検索結果を並行して表示する構成とすることができる。これによって、文書情報と画像情報という異なる属性の情報でありながらも、内容的に同じものを並行して検索結果を表示することによって、文字および画像のような異なる属性であっても同じ検索テーマの情報を対比して表示することができる。
(9.実施の形態9)
実施の形態9による文書検索装置が実施の形態1と異なる点は、パーソナル・コンピュータ(PC)として実施した点である。PCにあっては、例えば、PCにプリンタドライバをインストールし、印刷出力すべき情報をモニタ画面に表示させ、モニタ画面において表示された分割領域への設定入力、あるいはマウスとポインターを使用する設定入力によって指定し、指定された分割領域のキーワードを抽出し、このキーワードによってネットワーク上で検索し、得られた検索結果情報を表示する。
図24は、実施の形態9によるPCの機能的ブロック図である。PC90は、入出力インタフェースを兼ねる入出力部96、キーボード95a1、マウス95a2、モニタ95b、HDD7、および画像出力3を備える。画像出力部3は、画像出力の処理を施すと共に、インタフェースの機能を有し、各種の出力装置が接続可能である。ここでは一例として、画像出力3にプリンタ6’が接続されているものとする。図中同じ符号は、今までと同様の構成である。以後、異なる符号の構成について主に説明する。
PC90は領域分割部91、キーワード検出部92、検索部93、および表示制御部94を備える。これらの各部が実行する文書検索機能は、PCの有するCPU(不図示)が文書検索プログラムをHDD7から読み出してRAM(不図示)上に展開して、実行する。
入出力部96は、ここでは、PDL(Page Description Language、ページ記述言語)で記述されたデータを入力する。PDL言語は、テキスト、図表、ビットマップのような画像データなどに分類されてデータが記述されている。従って、領域分割部91は、各々の領域において、PDL言語による記述を読み取ることによって、テキストや画像などのデータの属性情報を取得できる。そして領域分割部91は、読み取った情報の属性および、この属性ごとの領域を読み取ることによって属性ごとの領域に分割することができる。
例えば、PDLデータの例として、
72 72 moveto
/Times-Bolditalic 24 selectfont
(Taro Yamada)
show
showpage
というデータを受け取った場合、表示制御部94は、この文字列をPDL言語によって、位置(72,72)からタイムズボールドイタリックフォント24を選択して、「Taro Yamada」という表示がなされることを読み取る。
あるいは、
newpath
144 72 moveto
144 432 lineto
stroke
showpage
というデータを受け取った場合、表示制御部94は、この文字列をPDL言語によって、位置(144,72)から位置(144,432)まで直線を引く、という表示がなされることを読み取る。
したがって、領域分割機能をPCで実行する場合は、これまでの実施の形態におけるように画像情報から各領域の属性を解析して文字認識機能を実行する必要はない。PCに適用した場合、PDL言語によって記述された情報を読み取ることによって、これまでの実施の形態よりもはるかに簡単に属性ごとの領域分割を実行できる。
表示制御部94は、このようにPDL言語によるデータを読み取り属性ごとに領域分割し、モニタ95b上に分割して表示させる。モニタ95bに表示された分割領域に対しては、キーボード95a1、マウス95a2、あるいはモニタ95b上からの接触入力などの入力を介して操作者は領域の選択設定や、命令を入力することができる。
キーワード検出部92がキーワードを検出し、検索部93がネットワーク4を介してデータベースサーバであるデータベース装置5に、キーワードと該検索命令と送信して検索させ、検索結果を受信して表示制御部94がモニタ95bに表示させる動作は、実施の形態1による説明と同様である。また、PDL言語で読み取った入力情報と、検索後の情報とを並列して表示させる態様も、既に実施の形態において説明したのと同様である。
モニタ95b上で検索結果情報が表示された場合、画像出力部3が、操作者からのキーボード95a1などからの印刷出力命令を受け付けると、ドライバプログラムによってプリンタ6’による出力処理を施し、検索情報を表示された形態で印刷出力する。あるいは、既述のように、画面を見ながら検索結果情報から電子メールを編集し、編集された電子メールを送信する構成とすることもできる。
図25は、実施の形態9による文書検索手順を説明するフローチャートである。領域分割部91は、PDL言語による情報を受信してPDL言語による記述に従って情報の属性と領域とを読み取る(ステップS201)。そして、領域分割部91は、PDL言語によって読み取った属性と領域によって、情報を属性に従って領域に分割する(ステップS202)。これ以降の手順は、実施の形態1におけるステップS104と同様であるので説明を省略する。
このように、実施の形態9によるPCは、PDL言語によるデータを受け取ると、PDL言語による記述を読み取って領域ごとの属性を読み取り、属性ごとに領域分割し、文字情報からキーワードを抽出して検索する。従って、PDL言語で記述した情報を入力した場合、煩雑なキーボード操作の必要なく、容易に原稿に記載された内容に関連する情報を、ネットワーク上に豊富に存在するデータベース装置から取得することができるので、簡易な操作によって原稿内容に関連する情報を電子媒体の形で取得することができるPCを提供できる。
但し、PDL言語による情報だけに限られず、他の形態の情報、例えば情報の属性と領域の既述をアプリケーションによって読み取ることができる形態の情報であれば、このアプリケーションを使用することによって、容易に属性に従って領域分割をすることができる。
(10.実施の形態10)
実施の形態10による携帯電話は、CCDカメラ、および情報を表示するモニタを有する携帯電話機であって、CCDカメラが撮影した画像情報からキーワードを抽出してネットワーク上で情報を検索し、該検索された情報を受信してモニタで表示させる。
図26は、実施の形態10による携帯電話機の機能的ブロック図である。携帯電話機150は、CCDカメラ151、画像処理部152、領域分割部161、キーワード抽出部162、検索部163、表示制御部164、モニタ165b、操作部165a、入出力部166、およびアンテナ153を備える。
CCDカメラ151によって撮影された撮影画像情報は、画像処理部152によって、デジタル変換、ガンマ変換など画像処理特有の処理を施され、例えばビットマップイメージのような画像情報として入出力部166を介して領域分割部161に受信される。
領域分割部161が、受信した画像情報から文字および文字以外の情報に領域分割する動作については、すでに説明したように、撮像装置による画像から領域分割する動作と同様であり、さらにキーワード抽出部162がキーワード抽出する動作も同様であり、また検索部163がキーワードに基づいて検索する動作についても同様であり、また表示制御部164が検索結果情報を受信してモニタ165bに表示する動作についても同様であるので、ここでは説明を省略する。
ここでは、携帯電話であるので、入出力部166は、アンテナ153を介してネットワーク上の情報を授受する。また入出力部166は、イヤフォーンを介して音声情報を出力し、またスピーカを介して音声情報を取得し、またアンテナ153を介して通信回線上で例えばCELP(Code Excited Linear Prediction)方式の音声変換によって通信を行う。
実施の形態10による携帯電話機は、この構成によってCCDカメラ151によって撮影し、撮影された画像からキーワードを抽出してネットワーク上4で検索し、検索結果をモニタ165b上で表示することができる利便性の高いものとなる。
あるいは、検索部163において、画像特徴量算出機能を備えて、撮影した画像をネットワーク上のデータベース装置5で検索させて検索された画像情報を受信して、検索された画像を表示する構成とすることもできる。
(文書検索装置を組み込んだ画像形成装置のハードウェア構成など)
図27は、実施の形態1による文書検索装置を備える画像形成装置のハードウェア構成を示すブロック図である。この画像形成装置は、ファックスやスキャナなどの複合的機能を備える複合機(MFP)として構成されている。図に示すように、このMFPは、コントローラ1210とエンジン部1260とをPCI(Peripheral Component Interconnect)バスで接続した構成となる。コントローラ1210は、MFP全体の制御、画像表示制御、各種制御、画像処理制御、文書検索制御など、FCUI/F1230、操作部1220からの入力を制御するコントローラである。エンジン部1260は、PCIバスに接続可能な画像処理エンジンなどであり、例えば取得した画像データに対して誤差拡散やガンマ変換などの画像処理部分が含まれる。
コントローラ1210は、CPU1211と、ノースブリッジ(NB)1213と、システムメモリ(MEM−P)1212と、サウスブリッジ(SB)1214と、ローカルメモリ(MEM−C)1217と、ASIC(Application Specific Integrated Cercuit)1216と、ハードディスクドライブ1218とを有し、ノースブリッジ1213とASIC1216との間をAGP(Accelerated Graphics Port)バス1215で接続した構成となる。また、MEM−P1212は、ROM(Read Only Memory)1212aと、RAM(Random Access Memory)1212bとをさらに有する。
CPU1211は、MFPの全体制御を行うものであり、NB1213、MEM−P1212およびSB1214からなるチップセットを有し、このチップセットを介して他の機器と接続される。
NB1213は、CPU1211とMEM−P1212、SB1214、AGPバス1215とを接続するためのブリッジであり、MEM−P1212に対する読み書きなどを制御するメモリコントローラと、PCIマスタおよびAGPターゲットとを有する。
MEM−P1212は、プログラムやデータの格納用メモリ、プログラムやデータの展開用メモリなどとして用いるシステムメモリであり、ROM1212aとRAM1212bとからなる。ROM1212aは、プログラムやデータの格納用メモリとして用いる読み出し専用のメモリであり、RAM1212bは、プログラムやデータの展開用メモリ、画像処理時の画像描画メモリなどとして用いる書き込みおよび読み出し可能なメモリである。
SB1214は、NB1213とPCIデバイス、周辺デバイスとを接続するためのブリッジである。このSB1214は、PCIバスを介してNB1213と接続されており、このPCIバスには、FCUI/F1230なども接続される。
ASIC1216は、マルチメディア情報処理用のハードウェア要素を有するマルチメディア情報処理用途向けのIC(Integrated Circuit)であり、AGPバス1215、PCIバス、HDD1218およびMEM−C1217をそれぞれ接続するブリッジの役割を有する。
このASIC1216は、PCIターゲットおよびAGPマスタと、ASIC1216の中核をなすアービタ(ARB)と、MEM−C1217を制御するメモリコントローラと、ハードウェアロジック等により画像データの回転などを行う複数のDMAC(Direct Memory Access Controller)と、エンジン部1260との間でPCIバスを介してUSB(Universal Serial Bus)1240、IEEE(the Institute of Electrical and Electronics Engineers)1394インタフェース1250が接続される。
MEM−C1217は、送信用画像バッファ、符号バッファとして用いるローカルメモリであり、HDD1218は、画像データの蓄積、プログラムの蓄積、フォントデータの蓄積、フォームの蓄積を行うためのストーレジである。
AGPバス1215は、グラフィック処理を高速化するために提案されたグラフィックスアクセラレータカード用のバスインタフェースであり、MEM−P1212に高スループットで直接アクセスすることにより、グラフィクスアクセラレータカードを高速にするものである。
ASIC1216に接続する操作部(タッチパネル)1220は、操作者からの操作入力を受け付けて、ASIC1216に受け付けられた操作入力情報を送信する。
なお、実施の形態1のMFPで実行される文書検索プログラムは、ROM等に予め組み込まれて提供される。
実施の形態1のMFPで実行される文書検索プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
さらに、実施の形態1によるMFPで実行される文書検索プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、実施の形態1のMFPで実行される画像表示プログラムおよび画像形成プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
実施の形態のMFPで実行される文書検索プログラムは、上述した各部(領域分割部11、キーワード抽出部12、検索部13、および表示制御部14など)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記ROMから文書検索プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、領域分割部11、キーワード抽出部12、検索部13、および表示制御部14などが主記憶装置上に生成されるようになっている。
(文書検索機能を実行するPCのハードウェア構成など)
図28は、実施の形態9によるパーソナルコンピュータ(PC)のハードウェア構成を示す図である。実施の形態9によるPCは、図28に示すように、CPU(Central Processing Unit)2301などの制御装置と、ROM(Read Only Memory)2302やRAM(Random Access Memory)2303などの記憶装置と、HDD(Hard Disk Drive)、CD(Compact Disk)ドライブ装置等の外部記憶装置2304と、モニタ等の表示装置2305と、キーボードやマウス等の入力装置2306と、通信I/F2307と、これらを接続するバス2308を備えており、通常のコンピュータを利用したハードウェア構成となっている。
実施の形態9によるPCで実行される文書検索プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、実施の形態9によるPCで実行される文書検索プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、実施の形態9によるPCで実行される文書検索プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。また、実施の形態による文書検索プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
実施の形態9によるPCで実行される文書検索プログラムは、上述した各部(領域分割部11、キーワード抽出部12、検索部13、および表示制御部14など)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から情報抽出プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、領域分割部11、キーワード抽出部12、検索部13、および表示制御部14などが主記憶装置上に生成されるようになっている。
以上、本発明について実施の形態として、画像形成装置、PC、および携帯電話機として説明したが、説明した実施の形態あるいは変形例は説明のための一例であって、本発明はここに説明したこれらの具体例に限定されるものではない。
以上のように、本発明にかかる情報検索装置、方法およびプログラムは、文書検索技術に有用であり、特に、非デジタル情報からデジタル情報を取得する技術に適している。
実施の形態1による文書検索装置を備えた画像形成装置の機能的ブロック図である。 領域分割部11の機能的ブロック図である。 属性解析部11bの機能的ブロック図である。 文字認識部11b2の機能的ブロック図である。 キーワード抽出部12の機能的ブロック図である。 操作表示部15を示す模式図である。 入力情報および検索結果情報をモニタで表示した一例の模式図である。 実施の形態1による文書検索手順を説明するフローチャートである。 文書検索装置に情報入力する他の装置を示す図である。 実施の形態1による文書検索装置を備える画像形成装置の画像形成動作を説明する図である。 実施の形態2による文書検索装置20の機能的ブロック図である。 検索結果画面のURLをクリックして得られダウンロード情報を表示した模式図である。 実施の形態3による文書検索装置の機能的ブロック図である。 実施の形態4による文書検索装置40の機能的ブロック図である。 実施の形態5による文書検索装置において、抽出されたキーワードをトグルボタンで表示した一例の模式図である。 キーワード手書き入力画面の一例を示す模式図である。 変形例2による文書検索装置が、検索結果をトグルボタンで表示する一例の模式図である。 実施の形態6による文書検索装置の機能的ブロック図である。 実施の形態6による文書検索装置よって検索された結果情報を表示する一例の模式図である。 実施の形態7による文書検索装置の機能的ブロック図である。 実施の形態7による文書検索装置において、検索結果を編集して生成した電子メールを表示する模式図である。 実施の形態8による文書検索装置の機能的ブロック図である。 実施の形態8の文書検索装置80が検索した画像情報を表示する画面の模式図である。 変形例3による文書検索装置が検索した結果を表示する一例の模式図である。 実施の形態9によるPCの機能的ブロック図である。 実施の形態9による文書検索手順を説明するフローチャートである。 実施の形態10による携帯電話機の機能的ブロック図である。 実施の形態1による文書検索装置を備える画像形成装置のハードウェア構成を示すブロック図である。 実施の形態9によるパーソナルコンピュータ(PC)のハードウェア構成を示す図である。
符号の説明
1 スキャナ
2 画像処理部
3 画像出力部
4 ネットワーク
5 データベース装置
10 文書検索装置
11 領域分割部
12 キーワード抽出部
13 検索部
14 表示制御部
15 操作表示部
15a 操作部
15b モニタ

Claims (16)

  1. 入力部により入力された入力情報を表示する第1画面と検索指定または検索結果を表示する第2画面とを表示可能であり、前記第1画面または前記第2画面からの利用者よる入力操作が可能な表示入力装置と、
    前記入力情報を、前記入力情報を構成する情報の属性に基づいて、複数の領域に分割する領域分割部と、
    前記入力情報から、分割された領域単位に検索キーを抽出する抽出部と、
    分割された領域を前記第1画面に表示し、前記第1画面の前記領域を指定して前記第2画面に移動する入力を受け付ける表示入力制御部と、
    前記第2画面に移動された前記領域の情報に含まれる前記検索キーに基づいてネットワークを介して検索対象情報を検索する検索部と、を備え、
    前記表示入力制御部は、検索された前記検索対象情報を表示することを特徴とする情報検索装置。
  2. 前記領域分割部は、前記入力情報を、文字領域と文字情報以外の領域とに分割し、
    前記抽出部は、分割された前記文字領域の文字情報から前記検索キーとして、キーワードを抽出し、
    前記検索部は、前記第2画面に移動された前記領域の情報に含まれる前記キーワードに基づいてネットワークを介して前記検索対象情報を検索することを特徴とする請求項1に記載の情報検索装置。
  3. 前記表示入力制御部は、さらに、抽出した前記キーワードを指定するための画面構成要素である指示情報を、前記第1画面に表示することを特徴とする請求項2に記載の情報検索装置。
  4. 前記検索部は、前記第1画面から利用者により前記指示情報を指示された場合に、前記指示情報で指定される前記キーワードに基づいてネットワークを介して前記検索対象情報を検索することを特徴とする請求項3に記載の情報検索装置。
  5. 前記表示入力制御部は、複数の前記キーワードが抽出された場合、抽出した複数の前記キーワードのそれぞれを指定するための画面構成要素である複数の指示情報を、前記第1画面に表示し、
    前記検索部は、前記第1画面から利用者により複数の前記指示情報を指示された場合に、複数の前記指示情報で指定される複数の前記キーワードを用いたand検索またはor検索によりネットワークを介して前記検索対象情報を検索することを特徴とする請求項4に記載の情報検索装置。
  6. 前記表示入力制御部は、さらに、利用者により新たなキーワードの入力を受付け、受け付けた前記新たなキーワードを前記指示情報として前記第1画面に表示することを特徴とする請求項3に記載の情報検索装置。
  7. 画像の文字認識を行う文字認識部を更に備え、
    前記表示入力制御部は、前記新たなキーワードの入力を利用者による手書き描画によって受付け、
    前記文字認識部は、前記手書き描画による画像に文字認識を施して前記キーワードして出力することを特徴とする請求項5に記載の情報検索装置。
  8. 前記領域分割部は、前記入力情報を、画像領域と画像情報以外の領域とに分割し、
    前記抽出部は、分割された前記画像領域の画像情報から前記検索キーとして、前記画像の特徴量を抽出し、
    前記検索部は、前記第2画面に移動された前記領域の画像情報の前記特徴量に基づいてネットワークを介して前記検索対象情報を検索することを特徴とする請求項1に記載の情報検索装置。
  9. 前記表示入力制御部は、さらに、前記第1画面に表示された前記領域に対して、選択、および選択の解除を受け付け、選択を受け付けた領域を、選択前とは異なった態様で前記表示入力装置に表示させ、
    前記抽出部は、選択を受け付けられた前記領域の情報から前記検索キーを抽出することを特徴とする請求項1に記載の情報検索装置。
  10. 前記検索部は、複数の検索方式による検索が可能であり、
    前記表示入力部は、前記表示入力装置に前記複数の検索方式を表示させ、
    前記表示入力制御部は、さらに、選択を受け付けた領域を該表示された複数の検索方式へ移動する入力を受け付け、
    前記検索部、移動により指定された前記検索方式で前記検索対象情報を検索することを特徴とする請求項1に記載の情報検索装置。
  11. 前記表示入力制御部は、前記第1画面の前記領域を指定して前記第2画面に移動する入力を、前記領域の指定から前記第2画面までの移動の間のタッチ入力により受け付けることを特徴とする請求項1に記載の情報検索装置。
  12. 前記表示入力制御部は、前記第1画面の前記領域を指定して前記第2画面に移動する入力を、ポインティングデバイスによるドラッグアンドドロップ操作入力により受け付けることを特徴とする請求項1に記載の情報検索装置。
  13. 前記入力情報は、前記入力部として原稿をスキャンして画像を読み込む画像読取装置かにより読み込まれた画像情報であることを特徴とする請求項1に記載の情報検索装置。
  14. 前記入力情報は、前記入力部として画像を撮像する撮像装置により撮像された画像情報であることを特徴とする請求項1に記載の情報検索装置。
  15. 情報検索装置で実行される情報検索方法であって、
    前記情報検索装置は、入力部により入力された入力情報を表示する第1画面と検索指定または検索結果を表示する第2画面とを表示可能であり、前記第1画面または前記第2画面からの利用者よる入力操作が可能な表示入力装置を備え、
    領域分割部が、前記入力情報を、前記入力情報を構成する情報の属性に基づいて、複数の領域に分割する領域分割ステップと、
    抽出部が、前記入力情報から、分割された領域単位に検索キーを抽出する抽出部と、
    表示入力制御が、分割された領域を前記第1画面に表示し、前記第1画面の前記領域を指定して前記第2画面に移動する入力を受け付ける表示入力制御ステップと、
    検索部が、前記第2画面に移動された前記領域の情報に含まれる前記検索キーに基づいてネットワークを介して検索対象情報を検索する検索ステップと、を含み、
    前記表示入力制御ステップは、検索された前記検索対象情報を表示することを特徴とする情報検索方法。
  16. 請求項15に記載の方法をコンピュータに実行させるプログラム。
JP2007262885A 2006-11-10 2007-10-09 情報検索装置、方法およびプログラム Expired - Fee Related JP5223284B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007262885A JP5223284B2 (ja) 2006-11-10 2007-10-09 情報検索装置、方法およびプログラム
US11/935,615 US8726178B2 (en) 2006-11-10 2007-11-06 Device, method, and computer program product for information retrieval
CN2007101695258A CN101178725B (zh) 2006-11-10 2007-11-09 用于信息检索的设备和方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006305835 2006-11-10
JP2006305835 2006-11-10
JP2007262885A JP5223284B2 (ja) 2006-11-10 2007-10-09 情報検索装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2008140377A true JP2008140377A (ja) 2008-06-19
JP5223284B2 JP5223284B2 (ja) 2013-06-26

Family

ID=39404980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007262885A Expired - Fee Related JP5223284B2 (ja) 2006-11-10 2007-10-09 情報検索装置、方法およびプログラム

Country Status (2)

Country Link
JP (1) JP5223284B2 (ja)
CN (1) CN101178725B (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055259A (ja) * 2008-08-27 2010-03-11 Konica Minolta Business Technologies Inc 画像処理装置、画像処理プログラム及び画像処理方法
JP2010218322A (ja) * 2009-03-18 2010-09-30 Nec Corp 携帯通信端末及びそれに用いる通信先情報取得方法並びにそのプログラム
WO2011039848A1 (ja) * 2009-09-29 2011-04-07 株式会社 東芝 関心領域抽出装置及びプログラム
JP2011090427A (ja) * 2009-10-21 2011-05-06 Fujifilm Corp ドキュメント閲覧システム及びその制御方法
JP4712118B1 (ja) * 2010-08-12 2011-06-29 ヤフー株式会社 携帯端末、アプリケーション選択方法及びプログラム
JP2011165092A (ja) * 2010-02-12 2011-08-25 Nippon Telegr & Teleph Corp <Ntt> 文書画像関連情報提供装置、及び文書画像関連情報取得システム
CN102246171A (zh) * 2008-12-11 2011-11-16 微软公司 提供具有搜索结果的最近历史
JP2014013584A (ja) * 2010-05-28 2014-01-23 Yahoo Inc ウェブクエリにおけるオンライン手書き認識のためのシステム及び方法
US9361859B2 (en) 2013-09-02 2016-06-07 Kabushiki Kaisha Toshiba Information processing device, method, and computer program product
US9678661B2 (en) 2013-07-24 2017-06-13 Kyocera Document Solutions Inc. Retrieval device for retrieving data specific information used for identifying data of a data group
JP2018538616A (ja) * 2015-11-18 2018-12-27 グーグル エルエルシー モバイルデバイス上での擬似ハイパーリンク
JP2020119590A (ja) * 2017-06-01 2020-08-06 株式会社インタラクティブソリューションズ 検索用資料情報記憶装置
US10970646B2 (en) 2015-10-01 2021-04-06 Google Llc Action suggestions for user-selected content
US11704136B1 (en) 2014-07-11 2023-07-18 Google Llc Automatic reminders in a mobile environment
US11887390B2 (en) 2020-07-14 2024-01-30 Ricoh Company, Ltd. Information processing apparatus, information processing system, information processing method, and non-transitory recording medium
US12026593B2 (en) 2020-10-15 2024-07-02 Google Llc Action suggestions for user-selected content

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930311B (zh) * 2009-02-18 2018-10-09 谷歌有限责任公司 执行与再现文档关联的动作的方法、移动设备和可读介质
KR101721535B1 (ko) * 2009-12-01 2017-03-31 삼성전자주식회사 팝업 표시 방법 및 장치
JP2011216071A (ja) * 2010-03-15 2011-10-27 Sony Corp 情報処理装置、情報処理方法及びプログラム
CN103020084A (zh) * 2011-09-23 2013-04-03 联想(北京)有限公司 一种数据显示方法、装置及电子设备
CN103092972A (zh) * 2013-01-24 2013-05-08 华为技术有限公司 基于线索对象的搜索方法及装置
WO2019090772A1 (zh) * 2017-11-13 2019-05-16 华为技术有限公司 一种终端的图像处理方法及装置
CN108520254B (zh) * 2018-03-01 2022-05-10 腾讯科技(深圳)有限公司 一种基于格式化图像的文本检测方法、装置以及相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003050817A (ja) * 2001-08-07 2003-02-21 Canon Inc 情報処理装置及びその方法
JP2006018630A (ja) * 2004-07-02 2006-01-19 Canon Inc データ検索方法及び装置、プログラム、コンピュータ可読メモリ

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1329323A (zh) * 2001-07-31 2002-01-02 郭根龙 证件自动扫描识别与管理方法及其***
JP4349183B2 (ja) * 2004-04-01 2009-10-21 富士ゼロックス株式会社 画像処理装置および画像処理方法
JP2006146628A (ja) * 2004-11-22 2006-06-08 Hitachi Ltd 内容画像による文書検索方法および装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003050817A (ja) * 2001-08-07 2003-02-21 Canon Inc 情報処理装置及びその方法
JP2006018630A (ja) * 2004-07-02 2006-01-19 Canon Inc データ検索方法及び装置、プログラム、コンピュータ可読メモリ

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055259A (ja) * 2008-08-27 2010-03-11 Konica Minolta Business Technologies Inc 画像処理装置、画像処理プログラム及び画像処理方法
US9093074B2 (en) 2008-08-27 2015-07-28 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing program and image processing method
CN102246171A (zh) * 2008-12-11 2011-11-16 微软公司 提供具有搜索结果的最近历史
JP2012511779A (ja) * 2008-12-11 2012-05-24 マイクロソフト コーポレーション 検索結果を伴う最近の履歴を提供すること
JP2010218322A (ja) * 2009-03-18 2010-09-30 Nec Corp 携帯通信端末及びそれに用いる通信先情報取得方法並びにそのプログラム
WO2011039848A1 (ja) * 2009-09-29 2011-04-07 株式会社 東芝 関心領域抽出装置及びプログラム
JP5367833B2 (ja) * 2009-09-29 2013-12-11 株式会社東芝 関心領域抽出装置及びプログラム
US9141706B2 (en) 2009-09-29 2015-09-22 Kabushiki Kaisha Toshiba Region-of-interest extraction apparatus and method
JP2011090427A (ja) * 2009-10-21 2011-05-06 Fujifilm Corp ドキュメント閲覧システム及びその制御方法
JP2011165092A (ja) * 2010-02-12 2011-08-25 Nippon Telegr & Teleph Corp <Ntt> 文書画像関連情報提供装置、及び文書画像関連情報取得システム
JP2014013584A (ja) * 2010-05-28 2014-01-23 Yahoo Inc ウェブクエリにおけるオンライン手書き認識のためのシステム及び方法
WO2012020753A1 (ja) * 2010-08-12 2012-02-16 ヤフー株式会社 携帯端末、サーバ、システム、アプリケーション選択方法、アプリケーション選択プログラム配信方法、プログラム及び記録媒体
JP2012039581A (ja) * 2010-08-12 2012-02-23 Yahoo Japan Corp 携帯端末、アプリケーション選択方法及びプログラム
JP4712118B1 (ja) * 2010-08-12 2011-06-29 ヤフー株式会社 携帯端末、アプリケーション選択方法及びプログラム
US9678661B2 (en) 2013-07-24 2017-06-13 Kyocera Document Solutions Inc. Retrieval device for retrieving data specific information used for identifying data of a data group
US9361859B2 (en) 2013-09-02 2016-06-07 Kabushiki Kaisha Toshiba Information processing device, method, and computer program product
US11704136B1 (en) 2014-07-11 2023-07-18 Google Llc Automatic reminders in a mobile environment
US10970646B2 (en) 2015-10-01 2021-04-06 Google Llc Action suggestions for user-selected content
JP2018538616A (ja) * 2015-11-18 2018-12-27 グーグル エルエルシー モバイルデバイス上での擬似ハイパーリンク
US10733360B2 (en) 2015-11-18 2020-08-04 Google Llc Simulated hyperlinks on a mobile device
JP2020119590A (ja) * 2017-06-01 2020-08-06 株式会社インタラクティブソリューションズ 検索用資料情報記憶装置
JP2021073590A (ja) * 2017-06-01 2021-05-13 株式会社インタラクティブソリューションズ 検索用資料情報記憶装置
JP7313069B2 (ja) 2017-06-01 2023-07-24 株式会社インタラクティブソリューションズ 検索用資料情報記憶装置
US11887390B2 (en) 2020-07-14 2024-01-30 Ricoh Company, Ltd. Information processing apparatus, information processing system, information processing method, and non-transitory recording medium
US12026593B2 (en) 2020-10-15 2024-07-02 Google Llc Action suggestions for user-selected content

Also Published As

Publication number Publication date
JP5223284B2 (ja) 2013-06-26
CN101178725A (zh) 2008-05-14
CN101178725B (zh) 2011-08-17

Similar Documents

Publication Publication Date Title
JP5223284B2 (ja) 情報検索装置、方法およびプログラム
US8726178B2 (en) Device, method, and computer program product for information retrieval
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
US9060085B2 (en) Image forming apparatus, electronic mail delivery server, and information processing apparatus
US7797150B2 (en) Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP2007034847A (ja) 検索装置及び検索方法
JP2007286864A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2007042106A (ja) 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム
JP2006085298A (ja) 画像処理装置、画像処理方法
US8255832B2 (en) Image processing device, image processing method, and storage medium
JP2010072842A (ja) 画像処理装置および画像処理方法
US11243670B2 (en) Information processing system, information processing apparatus, information processing method and non-transitory computer readable medium
US8458139B2 (en) Image processing apparatus, control method thereof, program, and storage medium
EP2884425B1 (en) Method and system of extracting structured data from a document
JP2007141159A (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
US20090327246A1 (en) Information processing apparatus, information processing method and medium storing program thereof
US8339622B2 (en) Image processing apparatus and integrated document generating method
US10853002B2 (en) Filling blank areas on a page with print data for printing
US11146705B2 (en) Character recognition device, method of generating document file, and storage medium
JP5077105B2 (ja) 画像処理装置、画像処理プログラム及び画像処理システム
JP4811133B2 (ja) 画像形成装置及び画像処理装置
JP2006093917A (ja) 画像読取装置および画像処理装置、画像形成装置
JP6601143B2 (ja) 印刷装置
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160322

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees