JP2002024258A - 画像取得装置および画像取得方法ならびに画像取得処理プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

画像取得装置および画像取得方法ならびに画像取得処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2002024258A
JP2002024258A JP2000207925A JP2000207925A JP2002024258A JP 2002024258 A JP2002024258 A JP 2002024258A JP 2000207925 A JP2000207925 A JP 2000207925A JP 2000207925 A JP2000207925 A JP 2000207925A JP 2002024258 A JP2002024258 A JP 2002024258A
Authority
JP
Japan
Prior art keywords
document
image
documents
break
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000207925A
Other languages
English (en)
Other versions
JP4023075B2 (ja
Inventor
Masahiro Kato
雅弘 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2000207925A priority Critical patent/JP4023075B2/ja
Publication of JP2002024258A publication Critical patent/JP2002024258A/ja
Application granted granted Critical
Publication of JP4023075B2 publication Critical patent/JP4023075B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storing Facsimile Image Data (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 自動給紙機能を持つイメージスキャナにより
不特定な複数の文書を読み取るとき、文書区切り用原稿
を用いることなく、複数の文書の画像データを文書単位
で取得できるようにすること。 【解決手段】 画像入力部10で複数の文書の原稿を読
み取って画像データを生成し、画像格納部20に格納す
る。つぎに、特徴量算出部30は画像格納部20に格納
されているすべての画像データから文書区切り判定に必
要な特徴量を算出する。文書区切り判定部40では、特
徴量算出部30で画像データから算出した特徴量に基づ
き文書区切りを判定する。表示部80に表示された文書
区切り判定結果が所望の結果と異なる場合、入力部70
を通して文書区切りを修正する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自動給紙機能を持
つイメージスキャナにより複数の文書の原稿を読み取る
ときに、文書区切り用原稿を用いることなく、各文書の
区切りを判定して原稿画像を取得する画像取得装置およ
び画像取得方法ならびに画像取得処理プログラムを記録
したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】近年、1枚以上の紙原稿からなる文書を
複数部にわたり効率的に電子化する場合、自動給紙機能
を持つイメージスキャナを用いて当該原稿を連続的に読
み取る処理が広く行われている。この際、読み取った原
稿画像データを文書毎に管理するためには、文書と文書
との間を何らかの手段を用いて検出する必要がある。こ
のようなニーズに対し、従来から幾つかのアプローチが
提案されている。
【0003】例えば、特開平1−162474号公報で
は、複数の文書原稿を読み取る前に文書間にあらかじめ
特定の文書区切り用原稿を挿入しておくことで、イメー
ジスキャナで連続的に原稿を読み取った場合でもこの文
書区切り用原稿を認識し、原稿の画像を文書単位に登録
する電子ファイル装置について示している。
【0004】また、特開平7−287747号公報で
は、あらかじめ文書区切りとなる原稿の裏面に文書区切
りマークを付加しておくことで、原稿の裏表両面をイメ
ージスキャナで読み取り、この文書区切りマークを認識
して文書の登録を行う電子ファイル装置について示して
いる。
【0005】また別のアプローチとして、特開平10−
21380号公報では、イメージスキャナで読み取った
画像データからあらかじめ設定しておいた文字認識エリ
ア部分を切り出し、文字認識し、この文字認識結果に基
づき文書の区切りを判定する電子ファイル装置について
示している。
【0006】
【発明が解決しようとする課題】しかしながら、前記文
書区切り用原稿を用いて文書の区切りを判定する方法で
は、読み取る原稿の種類に依存しないという大きな利点
がある反面、原稿を読み取る作業を行う毎に、文書の数
に応じた文書区切り用原稿を準備して各文書間に挿入し
なければならず、文書数が増すに従いユーザの作業負担
も増大してしまうという問題点がある。
【0007】また、文書区切りとなる原稿の裏面に文書
区切りマークを付加する方法では、文書区切り用原稿を
挿入する手間がないという利点はあるが、読み取り対象
の原稿に加筆できない制限があったり、もともと原稿の
両面に情報が記載されている場合には当該マークを付加
することができず、このような原稿から構成される文書
に対しては利用できないという問題点がある。
【0008】更に、文字認識を利用する方法では、原稿
のあらかじめ定められた位置にタイトルや総頁数など、
文書区切りを判定する際に利用可能な条件を満たす文字
列が存在する必要があり、任意の原稿に対して利用でき
るものではなく、どちらかといえば定型の文書に適した
方法であり、非定形文書に対しては利用が難しいという
問題点がある。
【0009】本発明は上記の事情に鑑みてなされたもの
であり、自動給紙機能を持つイメージスキャナにより不
特定な複数の文書を読み取るとき、文書区切り用原稿を
用いることなく複数の文書の画像データを文書単位で取
得できる画像取得装置および画像取得方法ならびに画像
取得処理プログラムを記録したコンピュータ読み取り可
能な記録媒体の提供を目的としている。
【0010】
【課題を解決するための手段】上述の目的を達成するた
めの本発明による画像処理装置は以下の横成を備える。
すなわち、本願請求項1に係る発明は、複数文書分の原
稿を順次読み取る原稿画像読取手段と、原稿画像読取手
段で読み取った原稿画像の特徴量を算出する特徴量算出
手段と、特徴量算出手段により算出した原稿画像の特徴
量に基づいて、原稿画像読取手段で読み取って得た原稿
画像の文書区切りを判定する文書区切り判定手段とを備
えている。これにより、あらかじめ文書区切り用原稿を
各文書間に挿入したり、文書区切りとなる原稿に手を加
えたりすることなく文書の区切りが判定できるため、ユ
ーザに強いる負担を大幅に軽減することができる。
【0011】また、本願請求項2に係る発明は、複数文
書分の原稿を順次読み取る原稿画像読取手段と、原稿画
像読取手段に読み取らせる文書数を入力する文書数入力
手段と、原稿画像読取手段で読み取って得た原稿画像の
特徴量を算出する特徴量算出手段と、文書数入力手段に
より入力された文書数と特徴量算出手段により算出した
原稿画像の特徴量とに基づいて、原稿画像読取手段で読
み取って得た原稿画像の文書区切りを判定する文書区切
り判定手段とを備えている。これにより、前記請求項1
に係る発明の利点に加え、あらかじめ文書の数がわかる
ことから、より精度の高い文書区切り判定を行うことが
可能となる。
【0012】また、本願請求項3に係る発明は、特徴量
算出手段で複数の特徴量を算出するものである。これに
より、不特定種類の文書を読み取って文書区切り判定を
行う場合でも、単一の特徴量を用いる場合に比べて、よ
り精度の高い文書区切り判定を行うことができる。
【0013】また、本願請求項4に係るの発明は、文書
区切り判定手段が、特徴量算出手段において原稿画像か
ら算出した複数の特徴量から文書を区切るのに適した特
徴量を選択して、文書の区切りを判定するものである。
これにより、文書の種類によっては文書区切り判定時に
不必要となる特徴量を除外することで、文書区切り判定
処理自体を高速化するだけではなく、不必要な特徴量が
文書区切り判定に及ぼす悪影響を避けることができる。
【0014】また、本願請求項5に係る発明は、文書区
切り判定手段で選択した、文書を区切るのに適した特徴
量を、任意の文書種類名と対応させて登録する文書種類
登録手段をさらに有するものである。これにより、一度
文書区切り判定処理を実施した種類の文書であれば、後
に同種の文書を読み取る際に、登録した文書種類名を指
定するだけで常に文書区切り判定に最適な特徴量を選択
できるようになり、その都度特徴量を選択する方式に比
べ大幅に処理時間を省くことができる。また、原稿の一
部が汚れている揚合があるなど、原稿を読み込む際の外
的要因が変動したとても選択される特徴量は常に一定で
あることから、安定した文書区切り判定結果を得ること
ができる。
【0015】また、本願請求項6に係る発明は、文書区
切り判定手段が、特徴量算出手段において各原稿画像か
ら算出した榎数の特徴量に対し、文書を区切るのにそれ
ぞれ適した重み付けを行った後で文書の区切りを判定す
ることを特徴としている。これにより、文書の種類が多
種多様な場合でも、各特徴量を絶妙に用いて統合的判定
を実施することができるため、より精度の高い文書区切
り判定を行うことができる。
【0016】また、本願請求項7に係る発明は、文書区
切り判定手段が設定した、文書を区切るのに最も適した
特徴量毎の重み付けを、任意の文書種類名と対応させて
登録する文書種類登録手段をさらに有するものである。
これにより、一度文書区切り判定処理を実施した種顛の
文書であれば、後に同種の文書を読み取る際に、登録し
た文書種類名を指定するだけで常に各特徴量に対して文
書区切り判定に最適な重み付けができるようになり、処
理時間短縮効果、および安定した文書区切り判定を得る
効果が期待できる。
【0017】また、本願請求項8に係る発明は、文書区
切り判定手段が判定した文書の区切り判定結果を表示
し、表示された判定結果に応じてユーザによる文書区切
り位置の修正を行う文書区切り修正手段をさらに有する
ものである。これにより、仮に文書区切り判定結果が所
望の結果と異なっていた場合でも、簡単に文書区切りを
修正することができる。
【0018】また、本願請求項9に係る発明は、文書区
切り判定手段が判定した文書の区切り判定結果を表示
し、表示された判定結果に応じてユーザによる文書区切
り位置の修正を行う文書区切り修正手段をさらに有し、
この文書区切り修正手段において、ユーザが一部の文書
区切りに修正を加えた際に、当該修正された文書区切り
を算出するのに適した特徴量を選択し、当該選択された
特徴量に応じて、残りの文書区切りを再判定するもので
ある。これにより、仮に文書区切り判定結果の修正が必
要な場合でも、ユーザが文書区切りを1個所修正するだ
けで、その修正を反映させる場合に有効な特徴量を逆算
し、逆算された特徴量に基づいて他の修正が必要と判断
される文書区切りを自動的に修正させることができるた
め、ユーザに強いる負担を大幅に軽減することができ
る。
【0019】また、本願請求項10に係る発明は、文書
区切り判定手段が判定した文書の区切り判定結果を表示
し、表示された判定結果に応じてユーザによる文書区切
り位置の修正を行う文書区切り修正手段をさらに有し、
この文書区切り修正手段において、ユーザが一部の文書
区切りに修正を加えた際に、当該修正された文書区切り
を算出するのに適したそれぞれの特徴量に対する重み付
けの係数を算出し、当該算出された係数により重み付け
られた特徴量を用いて、残りの文書区切りを再判定する
ものである。これにより、仮に文書区切り判定結果の修
正が必要な湯合でも、ユーザが文書区切りを1個所修正
するだけで、その修正を反映させる場合に有効な各特徴
量への重み係数を逆算し、逆算された係数により重み付
けされた特徴量に基づいて他の修正が必要と判断される
文書区切りを自動的に修正させることができるため、ユ
ーザに強いる負担を大幅に軽減することができる。
【0020】また、本願請求項11に係る発明は、文書
区切り修正手段が、1個所の文書区切りに対して複数の
文書区切り候補を提示するものである。これにより、仮
に文書区切りの修正が必要な場合でも、ユーザは修正候
補を選択するだけであるため、文書区切りの修正処理に
おけるユーザに強いる負担を大幅に軽減することができ
る。
【0021】また、本願請求項12に係る発明は、読み
取る文書の種類を入力する文書種類入力手段をさらに有
し、特徴量算出手段が、この文書種類入力手段で入力さ
れた文書の種類に応じて特徴量を算出するものである。
これにより、あらかじめ読み取る文書の種類が明らかな
湯合には、文書種類名を指定するだけで常に当該種類の
文書区切り判定に必要な特徴量だけを算出できるように
なり、不必要な特徴量を算出する時間を省くことができ
る。
【0022】また、本願請求項13に係る発明は、読み
取る文書の種顛を入力する文書種類入力手段をさらに有
し、文書区切り判定手段が、この文書種類入力手段で入
力された文書の種類に応じて特徴量を選択するものであ
る。これにより、あらかじめ読み取る文書の種類が明ら
かな場合には、文書種類名を指定するだけで常に当該種
類の文書区切り判定に適した特徴量を選択できるように
なるだけでなく、特徴量の選択に要する時間を省くこと
ができる。さらに、原稿の一部が汚れている場合がある
など、原稿を読み込む際の外的要因が変動したとても選
択される特徴量は常に一定であることから、常に安定し
た文書区切り判定結果を得ることができる。
【0023】また、本願請求項14に係る発明は、読み
取る文書の種顛を入力する文書種類入力手段をさらに有
し、文書区切り判定手段が、この文書種類入力手段で入
力された文書の種類に応じて特徴量毎の重み付けを変更
するものである。これにより、あらかじめ読み取る文書
の種類が明らかな湯合には、文書種類名を指定するだけ
で常に各特徴量に対して文書区切り判定に最適な重み付
けができるようになるだけでなく、各特徴量に対する重
み係数を計算する時間を省くことができる。
【0024】また、本願請求項15に係る発明は、文書
区切り判定手段が、特徴量算出手段で算出した特徴量か
ら構成されるパターン空間において、各画像データから
算出した特徴量に対応するサンプルをクラスタリング
し、得られたクラスタの数に応じて文書区切り数を設定
するものである。これにより、各クラスタが1つの文書
を表しているような場合には、精度の高い文書区切り判
定が可能となる。
【0025】また、本願請求項16に係る発明は、文書
区切り判定手段が、特徴量算出手段で算出した特徴量か
ら構成されるパターン空間において、各画像データから
算出した特徴量に対応するサンプルをクラスタリング
し、任意のクラスタに属するサンプルに対応する画像デ
ータを文書区切りであると判断するものである。これに
より、文書の表紙画像のように、あるクラスタが文書区
切りとして利用することが可能な画像から棉成されてい
るような場合には、このクラスタを利用して文書区切り
判定が可能となる。
【0026】また、本願請求項17に係る発明は、文書
区切り判定手段が、特徴量算出手段で算出した原稿の画
像データの特徴量の値を原稿画像読取手段で原稿を読み
取った順序に並べたとき、任意の原稿の画像データから
算出した特徴量の値と、その直前に読み取った原稿もし
くは直後に読み取った原稿の少なくともどちらか一方の
画像データから算出した特徴量の値とを比較して、その
差分が所定のしきい値よりも大きな場合に当該画像デー
タを文書区切りであると判断するものである。これによ
り、文書区切り判定に用いる特徴量が1種類である場合
にも、その特徴量が文書の区切りを判定するのに適した
ものであれば、簡単に文書の区切りを判定できる。
【0027】また、本願請求項18に係る発明は、特徴
量算出手段で算出される特徴量が原稿画像の空間周波数
情報であることを特徴としている。これにより、例えば
原稿のスクリーン線数を特徴量として利用することがで
きる。
【0028】また、本願請求項19に係る発明は、特徴
量算出手段で算出される特徴量が原稿画像の濃度情報で
あることを特徴としている。これにより、例えば原稿を
カラーで読み取った場合には、RGB各プレーン画像の
画素の濃度値を判定することで、原稿の配色を特徴量と
して利用することができる。
【0029】また、本願請求項20に係る発明は、特徴
量算出手段で算出される特徴量が原稿のレイアウト情報
であることを特徴としている。これにより、例えば原稿
の画像データを解析して得られる文字や写真の配置情
報、文字の組み方向、1行/1列の文字数、文字のサイ
ズ/書体などを特徴量として利用することができる。
【0030】また、本願請求項21に係る発明は、複数
文書分の原稿を順次読み取る原稿画像読取手段と、原稿
画像読取手段で読み取って得た原稿画像の特徴量を算出
する特徴量算出手段と、特徴量算出手段で算出した原稿
画像の特徴量に基づいて、原稿画像読取手段で読み取っ
て得た原稿画像の文書区切りを判定する文書区切り判定
手段と、原稿画像読み取り手段で読み取って得た原稿画
像を、文書区切り判定手段で判定した文書区切りに応じ
てそれぞれの文書毎に区切り、各文書に対応した原稿画
像を個別の電子ファイルとして格納する文書格納手段と
を備えている。これにより、あらかじめ文書区切り用原
稿を各文書間に挿入したり、文書区切りとなる原稿に手
を加えたりすることなく文書の区切りが判定できるた
め、複数の文書を的確に区分けしてその区分けした文書
毎に電子ファイルとして格納できるようになる。
【0031】また、本願請求項22に係る発明は、複数
文書分の原稿を順次読み取る行程と、読み取って得た原
稿画像の特徴量を算出する行程と、算出した原稿画像の
特徴量に基づいて、原稿画像における複数文書の文書区
切りを判定する行程とを備えた画像取得方法である。こ
れにより、あらかじめ文書区切り用原稿を各文書間に挿
入したり、文書区切りとなる原稿に手を加えたりするこ
となく文書の区切りが判定できるため、ユーザに強いる
負担を大幅に軽減することができる。
【0032】また、本願請求項23に係る発明は、複数
文書の原稿読み取りを行うにあたり、その読み取る文書
の文書数を入力する行程と、複数文書分の原稿を順次読
み取る行程と、読み取って得た原稿画像の特徴量を算出
する行程と、入力された文書数と算出された原稿画像の
特徴量とに基づいて、原稿画像における複数文書の文書
区切りを判定する行程とを備えた画像取得方法である。
これにより、前記請求項22に係る発明の利点に加え、
あらかじめ文書の数がわかることから、より精度の高い
文書区切り判定を行うことが可能となる。
【0033】また、本願請求項24に係る発明は、複数
文書分の原稿を順次読み取る行程と、読み取って得た原
稿画像の特徴量を算出する行程と、算出された原稿画像
の特徴量に基づいて、原稿画像における複数文書の文書
区切りを判定する行程と、原稿画像を、判定した文書区
切りに応じてそれぞれの文書毎に区切り、各文書に対応
した原稿画像を個別の電子ファイルとして格納する行程
とを備える画像取得方法である。これにより、あらかじ
め文書区切り用原稿を各文書間に挿入したり、文書区切
りとなる原稿に手を加えたりすることなく文書の区切り
が判定できるため、複数の文書を的確に区分けしてその
区分けした文書毎に電子ファイルとして格納できるよう
になる。
【0034】また、本願請求項25に係る発明は、複数
文書分の原稿を順次読み取る手順と、読み取って得た原
稿画像の特徴量を算出する手順と、算出した原稿画像の
特徴量に基づいて、原稿画像における複数文書の文書区
切りを判定する手順とをコンピュータに実行させる画像
取得処理プログラムを記録したコンピュータ読み取り可
能な記録媒体である。これらの手順の実行により、あら
かじめ文書区切り用原稿を各文書間に挿入したり、文書
区切りとなる原稿に手を加えたりすることなく文書の区
切りが判定できるため、ユーザに強いる負担を大幅に軽
減することができる。
【0035】また、本願請求項26に係る発明は、複数
文書の原稿読み取りを行うにあたり、その読み取る文書
の文書数を入力する手順と、複数文書分の原稿を順次読
み取る手順と、読み取って得た原稿画像の特徴量を算出
する手順と、入力された文書数と算出された原稿画像の
特徴量とに基づいて、原稿画像における複数文書の文書
区切りを判定する手順とをコンピュータに実行させる画
像取得処理プログラムを記録したコンピュータ読み取り
可能な記録媒体である。これらの手順の実行により、前
記請求項25に係る発明の利点に加え、あらかじめ文書
の数がわかることから、より精度の高い文書区切り判定
を行うことが可能となる。
【0036】また、本願請求項27に係る発明は、複数
文書分の原稿を順次読み取る手順と、読み取って得た原
稿画像の特徴量を算出する手順と、算出された原稿画像
の特徴量に基づいて、原稿画像における複数文書の文書
区切りを判定する手順と、原稿画像を、判定した文書区
切りに応じてそれぞれの文書毎に区切り、各文書に対応
した原稿画像を個別の電子ファイルとして格納する手順
とをコンピュータに実行させる画像取得処理プログラム
を記録したコンピュータ読み取り可能な記録媒体であ
る。これらの手順の実行により、あらかじめ文書区切り
用原稿を各文書間に挿入したり、文書区切りとなる原稿
に手を加えたりすることなく文書の区切りが判定できる
ため、複数の文書を的確に区分けしてその区分けした文
書毎に電子ファイルとして格納できるようになる。
【0037】
【発明の実施の形態】本発明の実施形態について、図面
を参照して詳細に説明する。図1は、本発明の一実施形
態に係る画像取得装置を説明する概略構成図である。す
なわち、本実施形態の画像取得装置は、画像入力部1
0、画像格納部20、特徴量算出部30、文書区切り判
定部40、文書格納部50、文書区切り修正部60、入
力部70、表示部80、本装置全体の動作を制御する制
御部90、および各部を結ぶバス100を備えている。
【0038】画像入力部10は、自動給紙機能を持つイ
メージスキャナを備え、複数の文書の原稿を読み取り、
画像データ(原稿画像)として入力する。本装置のイメ
ージスキャナは、原稿の両面およびカラー原稿の読み取
りが可能であるものとする。なお、イメージスキャナは
本装置専用に接続されたものでもよいし、ネットワーク
スキャナとして稼動しているものを1ユーザとして利用
してもよい。
【0039】画像格納部20は、画像入力部10で入力
した原稿の画像データを順次格納する。画像データを専
用に格納する画像メモリであってもよいし、様々な演算
処理を行うために利用されるRAMやハードディスク、
リムーバルディスクなど汎用の記録媒体であってもよ
い。
【0040】特徴量算出部30は、画像入力部10で入
力中の画像データ、またはあらかじめ画像格納部20に
格納している画像データから、文書区切り判定に必要な
特徴量を算出する。
【0041】文書区切り判定部40は、特徴量算出部3
0で画像データから算出した特徴量に基づき、文書区切
りとなる画像データを判定する。
【0042】文書格納部50は、画像格納部20に格納
している画像データを、文書区切り判定部40による文
書区切り判定に従って文書単位で電子データとして格納
する。なお、文書格納部50は、画像格納部20と同様
に、画像データを専用に格納する画像メモリであっても
よいし、様々な演算処理を行うために利用されるRAM
やハードディスク、リムーバルディスクなど汎用の記録
媒体であってもよい。また、画像データ自体を格納する
ことなく、画像格納部20に格納している画像データを
文書単位で扱えるようにするための情報だけを格納する
ようにしてもよい。
【0043】文書区切り修正部60は、文書区切り判定
部40で判定した文書区切りがユーザの所望するもので
はなかった場合に、これを修正する。より具体的には、
まず文書区切り判定部40による文書区切り判定結果を
表示部80を通してユーザに表示し、ユーザに文書区切
りの修正が必要かどうかを尋ねる。ユーザは表示部80
で表示された文書区切り判定結果を参照し、文書区切り
修正部60に対して入力部70を通して適切な指示を与
える。
【0044】入力部70は、本装置を利用するユーザに
よるキーボードやマウス等からの一連の指示操作を受け
付け、表示部80は、本装置を利用するユーザに対して
その都度必要な情報を表示する。すなわち、入力部70
と表示部80が本装置とユーザとの間のインタフエース
の核となる。
【0045】制御部90は、本実施形態に係る装置全体
の制御を行う。
【0046】つぎに、図1に示す画像取得装置全体の動
作(画像取得方法)を図2に示すフローチャートを用い
て説明する。
【0047】まず、ステップS101においてユーザに
より読み取り文書数が指定されたかどうかを判定する。
ここで、ユーザにより読み取り文書数が指定された場合
にはその値を保持する(ステップS102)。
【0048】保存した文書数は、後に文書区切り判定で
利用する。ユーザによる読み取り文書数の指定がない場
合には、後の文書区切り判定処理で、文書区切りを判定
すると同時に文書数を判定する(ステップS103)。
【0049】つづいて、ステップS104においてユー
ザにより文書区切り判定処理時に利用する画像データの
特徴量について指示があったかどうかを判定する。ユー
ザによる指示があった場合、その旨を文書区切り判定処
理時の条件として設定する(ステップS105)。
【0050】特徴量の指示方法として、例えば画像デー
タに利用されている色相、スクリーン線数といった定量
的に表現が可能なものや、原稿のレイアウトや文字の組
み方向などいわば定性的なものを選択、または重み付け
を行って利用するようにしてもよい。また、直接これら
の特徴量を指定するのではなく、頻繁に利用される文書
の種類をあらかじめ登録しておき、これら文書の種類に
応じて特徴量の利用方法を変えてもよい。
【0051】図3は、文書区切り判定処理に利用する画
像データの特徴量に関する指示の一例として、ユーザに
対し表示部80を通して当該指示を促す例を示す図であ
る。図3(a)および(b)では、本装置で読み取り対
象とする文書が定型文書であれ非定型文書であれ、あら
かじめ特定できるような場合の利用を想定したものであ
り、文書の種類を指定することで間接的に特徴量の利用
方法を決定する。
【0052】図3(a)では表紙がほぼ定型であるよう
な種類の文書を選択し、図3(b)では非定型で製品カ
タログのような種類の文書を選択している例を示してい
る。これに対し、図3(c)では文書区切りの判定に利
用する特徴量として画像データの色相やレイアウト構造
といった項目を直接指定する例を示している。
【0053】ステップS104でユーザによる文書区切
り判定処理に利用する特徴量の指示がなかった場合に
は、所定の特徴量を用いて統合的に文書区切りを判定す
ることとする(ステップS106)。
【0054】つぎに、ステップS107では、画像入力
部10が複数文書分の原稿を読み取り、画像データを生
成する。このとき、1枚の原稿につき両面を読み取った
湯合には2枚の画像データを生成し、片面だけを読み取
った場合には1枚の画像データを生成する。そして、生
成した画像データを原稿を読み取った順序に従い画像格
納部20に格納する。
【0055】なお、原稿を読み取る際に原稿の両面を読
み取るかもしくは片面だけを読み取るかは、ユーザがそ
の都度指定してもよいし、本装置による原稿読み取りの
際の既定値としてあらかじめどちらか一方を設定してお
いてもよい。
【0056】つぎに、ステップS108では、ステップ
S107で入力したすべての画像データから特徴量を算
出する。特徴量算出部30は、画像格納部20に格納さ
れている画像を順次取得し、特徴量を算出する。この特
徴量を算出する処理に比較的長い時間を要するようであ
れば、表示部80に特徴量算出処理の詳細な途中経過を
表示するようにしてもよい。なお、各画像から算出する
特徴量は、ステップS105およびステップS106で
導かれたものである。
【0057】つぎに、ステップS109では、ステップ
S108で算出した特徴量に基づき、ステップS107
で入力した複数の文書の区切りを算出する。このとき、
ステップS102で入力する文書数がユーザにより指定
されている湯合には、この文書数を文書区切りを判断す
るために利用する。
【0058】なお、ステップ8108の特徴量算出処理
と同様、文書区切り判定処理に比較的長い時間を要する
ようであれば、表示部80に文書区切り判定処理の詳細
な途中経過を表示するようにしてもよい。
【0059】そして、算出した文書区切りは表示部80
を通してユーザに通知する。ステップS109の文書区
切り判定処理については詳細を後述する。
【0060】ステップS110では、ユ←ザが表示部8
0に表示されたステップS109による文書の区切り判
定結果を所望のものかどうか判定し、その結果を入力部
70を通して本装置に伝える。
【0061】ステップS109による文書区切りの判定
結果が所望のものではなく修正が必要であると判断した
湯合、ステップS111で文書区切りの修正処理を実施
する。
【0062】ここでは、ユーザがすべての文書区切りを
手動で修正してもよいし、ユーザが最初の文書区切りに
修正を加えた場合、この修正された文書区切りを算出す
るのに最も適した特徴量や、各特徴量に対する重み付け
の係数を逆算して、この結果に基づいてユーザの手を煩
わせることなく残りの文書区切りを再判定させるように
してもよい。
【0063】そして、入力した文書原稿すべてについて
正しく文書区切りの判定が完了した時点で、原稿画像デ
ータを文書単位で格納する(ステップS112)。な
お、上述のとおり、画像データ自体を格納することな
く、画像格納部20に格納している画像データを文書単
位で扱えるようにするための情報だけを格納するように
してもよい。
【0064】また、所望の文書区切りがすべて得られた
時点で、それぞれの文書区切りを算出するのに利用した
一連の特徴量や、特徴量に対する重み付けの係数に対
し、ステップS105で再利用できるように任意の文書
種類名を付加して記録するなどしてもよい。
【0065】つぎに、ステップS109で示す文書区切
り判定の動作の詳細について、図4のフローチャートを
用いて説明する。まず、ステップS201では、ステッ
プS101と同様にユーザにより読み取り文書数が指定
されたかどうかを判定する。
【0066】ここで、ユーザにより読み取り文書数が指
定された場合には、後にステップS108で算出した特
徴量から構成されるパターン空間において実施する、ク
ラスタリングにおける最大クラスタ数を当該読み取り文
書数に設定する(ステップS202)。
【0067】ステップS201でユーザにより読み取り
文書数が指定されていないと判断した場合には、続くス
テップ8203でステップS104と同様にユーザによ
り文書区切り判定処理時に利用する画像データの特徴量
について指示があったかどうかを判定する。
【0068】ステップS203で、ユーザにより文書区
切り判定処理時に利用する画像データの特徴量について
指示があった場合、その指示と実際に読み取った原稿の
数から前記最大クラスタ数を所定値に設定する(ステッ
プS204)。逆に、ユーザからは何も指示を与えられ
ていない場合には、前記最大クラスタ数を実際に読み取
った原稿数に設定する(ステップS205)。
【0069】つぎに、ステップS105で各特徴量に対
して重み付けを行うような設定が選択された湯合、ステ
ップS206で算出した各特徴量に対して重み付けを実
施する。
【0070】つぎに、ステップS207で各特徴量を軸
としたパターン空間において、各原稿の画像データから
算出した特徴量の値を持つサンプル群に対してクラスタ
リングを実施する。このとき、結果として得られるクラ
スタの最大数がステップS202、ステップS204、
またはステップS205で設定した最大値を超えないよ
うにする。
【0071】ステップS208では、ステップS207
で実施したクラスタリングの結果が良好かどうか判定す
る。
【0072】図5は、このクラスタリング結果の良否判
定の様子をわかりやすく説明するために、2つの特徴量
(X1、X2)を軸とするパターン空間におけるサンプル
の分布例を示す図である。
【0073】図5(a)は、良好にクラスタリングがで
きる例であり、例ではクラスタリングによりω1および
ω2という2つのクラスタが得られる様子を示してい
る。これに対し、図5(b)ではX1、X2という特徴量
からなるパターン空間では、同図中のサンプルに対し適
当なクラスタリングが困難である例を示している。
【0074】つぎに、ステップS208でクラスタリン
グが良好であると判定した場合、ステップS209では
得られたクラスタの中で、文書の区切りとなり得る画像
データのサンプルから構成されるクラスタが存在するか
どうかを判定する。
【0075】例えば、図5(a)におけるクラスタω1
に属すサンプルがクラスタ内でほぼ原稿の読み取り順に
連続しており、クラスタω2に属すサンプルがクラスタ
内で原稿の読み取り順に不連続であるような場合、クラ
スタω2に属すサンプルは例えば複数の文書を読み取っ
た際の表紙原稿画像のように、数ページに一度出現する
文書の区切りに相当する原稿のものである可能性があ
る。
【0076】ここでは、クラスタω2に属すサンプルが
このような文書区切りを表すものであると判定する(ス
テップS210)。これにより、同図の例では3つの文
書が存在することになる。
【0077】これに対し、図5(a)におけるクラスタ
ω1およびω2に属すサンプルがそれぞれのクラスタ内で
原稿の読み取り順に連続しているような場合、どちらか
のクラスタが文書区切りを表すものであるという判断は
できない。このような場合、ω1およびω2という2つの
クラスタ自体がそれぞれ文書を表していると考えるほう
が妥当である。
【0078】また、得られたクラスタの数がステップS
102で設定された文書数と一致する場合も、上記と同
様にそれぞれのクラスタ自体が個別の文書を表している
と考えるほうが妥当な場合がある。
【0079】ここでは文書の区切りとなる原稿として、
各クラスタから読み取られた順序が最も先であるサンプ
ル、もしくは最も後であるサンプルに相当する画像デー
タを文書区切りであると設定する(ステップS21
1)。これにより、同図の例では2つの文書が存在する
ことになる。
【0080】一方、図5(b)に示すように、ステップ
S208でクラスタリングが困難、またはクラスタリン
グの結果が良好ではないと判断した場合、各特徴量に対
する重み付けを変更して再クラスタリング処理が可能か
どうか判断する(ステップS212)。
【0081】ここで、各特徴量に対する重み付けを変更
することで再クラスタリング処理が可能であると判断し
た場合には、ステップS206に戻って各特徴量に対す
る重み付けを変更した後、ステップS207以降の処理
を再実施する。この判断、および各特徴量に対する重み
付けの変更は入力部70を通してユーザが手動で実施し
てもよいし、あらかじめ設定しておいた手続きに沿って
自動化してもよい。
【0082】ステップS212において、各特徴量に対
する重み付けを変更して再クラスタリング処理を実施す
ることは困難であると判定した湯合、ステップS213
において1枚の原稿を1つの文書と設定するか、読み取
ったすべての原稿を1つの文書として設定する。これら
は、入力部70を通してその都度指示してもよいし、初
期値としてこのような状況になった場合にはどちらか一
方を設定しておいてもよい。
【0083】なお、図5では、パターン空間におけるク
ラスタリングの例として、特徴量X 1およびX2を用いて
説明したが、ステップS105における特徴量の指定方
法によっては、より多くの特徴量を用いたり、逆に特徴
量が1種類となる場合がある。
【0084】特徴量が1種類の場合はパターン空間にお
けるクラスタリング処理を行うことなく、図6に示すよ
うに当該特徴量とステップS107における原稿の読み
取り順序との関係から比較的簡単に文書区切りが判定で
きる。
【0085】例えば、いま図6において特徴量X1が画
像データのレイアウト構造をある規則に従い数値化した
ものであると仮定する。このとき、図6(a)はサンプ
ルS1およびS7で表されるページを表紙またはそれに
準ずるページであり、それ以外のサンプルはほぼ同一の
レイアウト構造を持つページを表しているような2つの
文書が存在する例であるといえる。
【0086】また、図6(b)はサンプルS1〜S8と
サンプルS9〜S7で表される2つの異なるレイアウト
横造を持つ文書が存在する例であるといえる。このよう
に、図6(a)および(b)では、どちらも特徴量X1
においてしきい値THを設定することで、文書の区切り
となる原稿を判定できるわけである。
【0087】なお、本発明では、上記動作を画像取得処
理プログラムとしてコンピュータで読み取り可能な記録
媒体(例えば、CD−ROM)に記録するようにしても
よい。
【0088】
【発明の効果】以上説明したように本発明によれば、自
動給紙機能を持つイメージスキャナにより不特定な複数
の文書を読み取るとき、文書区切り用原稿を用いること
なく複数の文書の画像データを文書単位で取得できるよ
うになる。これにより、大量の文書を竜子化する際に発
生するユーザの負担を大幅に軽減することができるよう
になる。また、文書の種類に応じて文書区切りを判定す
るための特徴量や特徴量に対する重みを変更するので、
あらかじめ文書区切りマーク等の所定の記号や文字列を
原稿に付加することなく様々な種類の文書に対応できる
ようになる。
【図面の簡単な説明】
【図1】 本実施形態に係る画像処理装置を説明する概
略構成図である。
【図2】 画像処理装置全体の動作を説明するフローチ
ャートである。
【図3】 特徴量指示時の表示例を示す図である。
【図4】 文書区切り判定の動作を説明するフローチャ
ートである。
【図5】 文書区切り判定を行う際の、複数の特徴量を
用いたクラスタリングを示す図である。
【図6】 文書区切り判定を行う際の、単一の特徴量を
用いたしきい値処理を説明する図である。
【符号の説明】
10…画像入力部、20…画像格納部、30…特徴量算
出部、40…文書区切り判定部、50…文書格納部、6
0…文書区切り修正部、70…入力部、80…表示部、
90…制御部、100…バス
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06T 7/00 250 G06T 7/00 250 H04N 1/21 H04N 1/21 Fターム(参考) 5B009 SA00 5B050 BA10 BA16 EA04 EA09 FA02 FA13 GA08 5B075 ND07 NR12 PP02 PP03 PP04 PQ02 UU06 5C073 AA06 AB02 5L096 AA02 BA18 CA21 FA81 GA51 JA11 MA07

Claims (27)

    【特許請求の範囲】
  1. 【請求項1】 複数文書分の原稿を順次読み取る原稿画
    像読取手段と、 前記原稿画像読取手段で読み取って得た原稿画像の特徴
    量を算出する特徴量算出手段と、 前記特徴量算出手段により算出した原稿画像の特徴量に
    基づいて、前記原稿画像読取手段で読み取って得た原稿
    画像の文書区切りを判定する文書区切り判定手段とを備
    えたことを特徴とする画像取得装置。
  2. 【請求項2】 複数文書分の原稿を順次読み取る原稿画
    像読取手段と、 前記原稿画像読取手段に読み取らせる文書数を入力する
    文書数入力手段と、 前記原稿画像読取手段で読み取って得た原稿画像の特徴
    量を算出する特徴量算出手段と、 前記文書数入力手段により入力された文書数と前記特徴
    量算出手段により算出した原稿画像の特徴量とに基づい
    て、前記原稿画像読取手段で読み取って得た原稿画像の
    文書区切りを判定する文書区切り判定手段とを備えたこ
    とを特徴とする画像取得装置。
  3. 【請求項3】 前記特徴量算出手段は複数の特徴量を算
    出することを特徴とする請求項1または請求項2記載の
    画像取得装置。
  4. 【請求項4】 前記文書区切り判定手段は、前記特徴量
    算出手段が原稿画像から算出した複数の特徴量から、文
    書を区切るのに適した特徴量を選択して文書の区切りを
    判定することを特徴とする請求項3に記載の画像取得装
    置。
  5. 【請求項5】 前記文書区切り判定手段が選択した、文
    書を区切るのに適した特徴量を、任意の文書種類名と対
    応させて登録する文書種類登録手段を有することを特徴
    とする請求項4記載の画像取得装置。
  6. 【請求項6】 前記文書区切り判定手段は、前記特徴量
    算出手段が各原稿画像から算出した複数の特徴量に対
    し、文書を区切るのにそれぞれ適した重み付けを行った
    後で文書の区切りを判定することを特徴とする請求項3
    記載の画像取得装置。
  7. 【請求項7】 前記文書区切り判定手段が設定した、文
    書を区切るのに最も適した特徴量毎の重み付けを、任意
    の文書種類名と対応させて登録する文書種類登録手段を
    有することを特徴とする請求項6記載の画像取得装置。
  8. 【請求項8】 前記文書区切り判定手段が判定した文書
    の区切り判定結果を表示し、表示された判定結果に応じ
    てユーザによる文書区切り位置の修正を行う文書区切り
    修正手段を有することを特徴とする請求項1または請求
    項2記載の画像取得装置。
  9. 【請求項9】 前記文書区切り判定手段が判定した文書
    の区切り判定結果を表示し、表示された判定結果に応じ
    てユーザによる文書区切り位置の修正を行う文書区切り
    修正手段を有し、 前記文書区切り修正手段は、ユーザが一部の文書区切り
    に修正を加えた際に、当該修正された文書区切りを算出
    するのに適した特徴量を選択し、当該選択された特徴量
    に応じて、残りの文書区切りを再判定することを特徴と
    する請求項3記載の画像取得装置。
  10. 【請求項10】 前記文書区切り判定手段が判定した文
    書の区切り判定結果を表示し、表示された判定結果に応
    じてユーザによる文書区切り位置の修正を行う文書区切
    り修正手段を有し、 前記文書区切り修正手段は、ユーザが一部の文書区切り
    に修正を加えた際に、当該修正された文書区切りを算出
    するのに適したそれぞれの特徴量に対する重み付けの係
    数を算出し、当該算出された係数により重み付けられた
    特徴量を用いて、残りの文書区切りを再判定することを
    特徴とする請求項3記載の画像取得装置。
  11. 【請求項11】 前記文書区切り修正手段は、1個所の
    文書区切りに対して複数の文書区切り候補を提示するこ
    とを特徴とする請求項8から請求項10のうちいずれか
    1項に記載の画像取得装置。
  12. 【請求項12】 読み取る文書の種類を入力する文書種
    類入力手段を有し、 前記特徴量算出手段は、前記文書種類入力手段により入
    力された文書の種類に応じて特徴量を算出することを特
    徴とする請求項1または請求項2記載の画像取得装置。
  13. 【請求項13】 読み取る文書の種類を入力する文書種
    類入力手段を有し、 前記文書区切り判定手段は、前記文書種類入力手段によ
    り入力された文書の種類に応じて特徴量を選択すること
    を特徴とする請求項3記載の画像取得装置。
  14. 【請求項14】 読み取る文書の種類を入力する文書種
    類入力手段を有し、 前記文書区切り判定手段は、前記文書種類入力手段によ
    り入力された文書の種類に応じて特徴量毎の重み付けを
    変更することを特徴とする請求項3記載の画像取得装
    置。
  15. 【請求項15】 前記文書区切り判定手段は、前記特徴
    量算出手段で算出した特徴量から構成されるパターン空
    間において、各画像データから算出した特徴量に対応す
    るサンプルをクラスタリングし、得られたクラスタの数
    に応じて文書区切り数を設定することを特徴とする請求
    項1または請求項2記載の画像取得装置。
  16. 【請求項16】 前記文書区切り判定手段は、前記特徴
    量算出手段で算出した特徴量から構成されるパターン空
    間において、各画像データから算出した特徴量に対応す
    るサンプルをクラスタリングし、任意のクラスタに属す
    るサンプルに対応する画像データを文書区切りであると
    判断することを特徴とする請求項1または請求項2記載
    の画像取得装置。
  17. 【請求項17】 前記文書区切り判定手段は、前記特徴
    量算出手段で算出した特徴量の値を前記原稿画像読取手
    段で原稿を読み取った順序に並べたとき、任意の原稿の
    画像データから算出した特徴量の値と、その直前に読み
    取った原稿もしくは直後に読み取った原稿の少なくとも
    どちらか一方の画像データから算出した特徴量の値とを
    比較して、その差分が所定のしきい値よりも大きな場合
    に、当該画像データを文書区切りであると判断すること
    を特徴とする請求項1または請求項2記載の画像取得装
    置。
  18. 【請求項18】 前記特徴量算出手段で算出される特徴
    量は、原稿画像の空間周波数情報であることを特徴とす
    る請求項1または請求項2記載の画像取得装置。
  19. 【請求項19】 前記特徴量算出手段で算出される特徴
    量は、原稿画像の濃度情報であることを特徴とする請求
    項1または請求項2記載の画像取得装置。
  20. 【請求項20】 前記特徴量算出手段で算出される特徴
    量は、原稿のレイアウト情報であることを特徴とする請
    求項1または請求項2記載の画像取得装置。
  21. 【請求項21】 複数文書分の原稿を順次読み取る原稿
    画像読取手段と、 前記原稿画像読取手段で読み取って得た原稿画像の特徴
    量を算出する特徴量算出手段と、 前記特徴量算出手段で算出した原稿画像の特徴量に基づ
    いて、前記原稿画像読取手段で読み取って得た原稿画像
    の文書区切りを判定する文書区切り判定手段と、 前記原稿画像読み取り手段で読み取って得た原稿画像
    を、前記文書区切り判定手段で判定した文書区切りに応
    じてそれぞれの文書毎に区切り、各文書に対応した原稿
    画像を個別の電子ファイルとして格納する文書格納手段
    とを備えることを特徴とする画像取得装置。
  22. 【請求項22】 複数文書分の原稿を順次読み取る行程
    と、 読み取って得た原稿画像の特徴量を算出する行程と、 算出した前記原稿画像の特徴量に基づいて、前記原稿画
    像における複数文書の文書区切りを判定する行程とを備
    えたことを特徴とする画像取得方法。
  23. 【請求項23】 複数文書の原稿読み取りを行うにあた
    り、その読み取る文書の文書数を入力する行程と、 前記複数文書分の原稿を順次読み取る行程と、 読み取って得た原稿画像の特徴量を算出する行程と、 入力された前記文書数と算出された前記原稿画像の特徴
    量とに基づいて、前記原稿画像における複数文書の文書
    区切りを判定する行程とを備えたことを特徴とする画像
    取得方法。
  24. 【請求項24】 複数文書分の原稿を順次読み取る行程
    と、 読み取って得た原稿画像の特徴量を算出する行程と、 算出された前記原稿画像の特徴量に基づいて、前記原稿
    画像における複数文書の文書区切りを判定する行程と、 前記原稿画像を、判定した前記文書区切りに応じてそれ
    ぞれの文書毎に区切り、各文書に対応した原稿画像を個
    別の電子ファイルとして格納する行程とを備えることを
    特徴とする画像取得方法。
  25. 【請求項25】 複数文書分の原稿を順次読み取る手順
    と、 読み取って得た原稿画像の特徴量を算出する手順と、 算出した前記原稿画像の特徴量に基づいて、前記原稿画
    像における複数文書の文書区切りを判定する手順とをコ
    ンピュータに実行させる画像取得処理プログラムを記録
    したコンピュータ読み取り可能な記録媒体。
  26. 【請求項26】 複数文書の原稿読み取りを行うにあた
    り、その読み取る文書の文書数を入力する手順と、 前記複数文書分の原稿を順次読み取る手順と、 読み取って得た原稿画像の特徴量を算出する手順と、 入力された前記文書数と算出された前記原稿画像の特徴
    量とに基づいて、前記原稿画像における複数文書の文書
    区切りを判定する手順とをコンピュータに実行させる画
    像取得処理プログラムを記録したコンピュータ読み取り
    可能な記録媒体。
  27. 【請求項27】 複数文書分の原稿を順次読み取る手順
    と、 読み取って得た原稿画像の特徴量を算出する手順と、 算出された前記原稿画像の特徴量に基づいて、前記原稿
    画像における複数文書の文書区切りを判定する手順と、 前記原稿画像を、判定した前記文書区切りに応じてそれ
    ぞれの文書毎に区切り、各文書に対応した原稿画像を個
    別の電子ファイルとして格納する手順とをコンピュータ
    に実行させる画像取得処理プログラムを記録したコンピ
    ュータ読み取り可能な記録媒体。
JP2000207925A 2000-07-10 2000-07-10 画像取得装置 Expired - Fee Related JP4023075B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000207925A JP4023075B2 (ja) 2000-07-10 2000-07-10 画像取得装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000207925A JP4023075B2 (ja) 2000-07-10 2000-07-10 画像取得装置

Publications (2)

Publication Number Publication Date
JP2002024258A true JP2002024258A (ja) 2002-01-25
JP4023075B2 JP4023075B2 (ja) 2007-12-19

Family

ID=18704608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000207925A Expired - Fee Related JP4023075B2 (ja) 2000-07-10 2000-07-10 画像取得装置

Country Status (1)

Country Link
JP (1) JP4023075B2 (ja)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011714A (ja) * 2004-06-24 2006-01-12 Canon Inc 画像処理装置及びその制御方法、プログラム
JP2008241905A (ja) * 2007-03-26 2008-10-09 Kyocera Mita Corp 印字条件切り替え装置及び画像形成装置
JP2009163475A (ja) * 2008-01-04 2009-07-23 Fuji Xerox Co Ltd 情報処理装置、情報処理システム、および情報処理プログラム
JP2010034734A (ja) * 2008-07-28 2010-02-12 Kyocera Mita Corp 画像処理装置
JP2010061551A (ja) * 2008-09-05 2010-03-18 Canon Marketing Japan Inc 申請書類電子化システム、申請書類電子化方法、及び、プログラム
JP2010135962A (ja) * 2008-12-03 2010-06-17 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2010136006A (ja) * 2008-12-03 2010-06-17 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2011258215A (ja) * 2005-01-11 2011-12-22 Xerox Corp 自動的ドキュメント選択方法
JP2013235608A (ja) * 2006-12-06 2013-11-21 Darnell Jones Marion 共有される知的財産権の利益を管理するためにコンピュータで実行される方法
US8855375B2 (en) 2012-01-12 2014-10-07 Kofax, Inc. Systems and methods for mobile image capture and processing
US8885229B1 (en) 2013-05-03 2014-11-11 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
US9141926B2 (en) 2013-04-23 2015-09-22 Kofax, Inc. Smart mobile application development platform
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US9311531B2 (en) 2013-03-13 2016-04-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US9396388B2 (en) 2009-02-10 2016-07-19 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
JP2017046278A (ja) * 2015-08-28 2017-03-02 京セラドキュメントソリューションズ株式会社 画像処理装置
US9747269B2 (en) 2009-02-10 2017-08-29 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US9910829B2 (en) 2003-12-19 2018-03-06 Kofax, Inc Automatic document separation
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US11800032B2 (en) 2021-10-01 2023-10-24 Canon Kabushiki Kaisha Apparatus, information processing method, and storage medium

Cited By (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9910829B2 (en) 2003-12-19 2018-03-06 Kofax, Inc Automatic document separation
JP2006011714A (ja) * 2004-06-24 2006-01-12 Canon Inc 画像処理装置及びその制御方法、プログラム
JP4510535B2 (ja) * 2004-06-24 2010-07-28 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP2011258215A (ja) * 2005-01-11 2011-12-22 Xerox Corp 自動的ドキュメント選択方法
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
JP2013235608A (ja) * 2006-12-06 2013-11-21 Darnell Jones Marion 共有される知的財産権の利益を管理するためにコンピュータで実行される方法
JP2008241905A (ja) * 2007-03-26 2008-10-09 Kyocera Mita Corp 印字条件切り替え装置及び画像形成装置
JP4492701B2 (ja) * 2008-01-04 2010-06-30 富士ゼロックス株式会社 情報処理装置、情報処理システム、および情報処理プログラム
US8451461B2 (en) 2008-01-04 2013-05-28 Fuji Xerox Co., Ltd. Information processor, information processing system, and computer readable medium
JP2009163475A (ja) * 2008-01-04 2009-07-23 Fuji Xerox Co Ltd 情報処理装置、情報処理システム、および情報処理プログラム
JP2010034734A (ja) * 2008-07-28 2010-02-12 Kyocera Mita Corp 画像処理装置
JP2010061551A (ja) * 2008-09-05 2010-03-18 Canon Marketing Japan Inc 申請書類電子化システム、申請書類電子化方法、及び、プログラム
CN101753752A (zh) * 2008-12-03 2010-06-23 富士施乐株式会社 图像处理设备和执行图像处理的方法
JP2010136006A (ja) * 2008-12-03 2010-06-17 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2010135962A (ja) * 2008-12-03 2010-06-17 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8736912B2 (en) 2008-12-03 2014-05-27 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer readable medium
US8749854B2 (en) 2008-12-03 2014-06-10 Fuji Xerox Co., Ltd. Image processing apparatus, method for performing image processing and computer readable medium
CN101753752B (zh) * 2008-12-03 2014-07-23 富士施乐株式会社 图像处理设备和执行图像处理的方法
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9747269B2 (en) 2009-02-10 2017-08-29 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9396388B2 (en) 2009-02-10 2016-07-19 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9158967B2 (en) 2012-01-12 2015-10-13 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US8879120B2 (en) 2012-01-12 2014-11-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9165188B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US9165187B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US10664919B2 (en) 2012-01-12 2020-05-26 Kofax, Inc. Systems and methods for mobile image capture and processing
US8971587B2 (en) 2012-01-12 2015-03-03 Kofax, Inc. Systems and methods for mobile image capture and processing
US8855375B2 (en) 2012-01-12 2014-10-07 Kofax, Inc. Systems and methods for mobile image capture and processing
US9342742B2 (en) 2012-01-12 2016-05-17 Kofax, Inc. Systems and methods for mobile image capture and processing
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
US10657600B2 (en) 2012-01-12 2020-05-19 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9514357B2 (en) 2012-01-12 2016-12-06 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US10127441B2 (en) 2013-03-13 2018-11-13 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9754164B2 (en) 2013-03-13 2017-09-05 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9996741B2 (en) 2013-03-13 2018-06-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9311531B2 (en) 2013-03-13 2016-04-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US10146803B2 (en) 2013-04-23 2018-12-04 Kofax, Inc Smart mobile application development platform
US9141926B2 (en) 2013-04-23 2015-09-22 Kofax, Inc. Smart mobile application development platform
US9253349B2 (en) 2013-05-03 2016-02-02 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
US9584729B2 (en) 2013-05-03 2017-02-28 Kofax, Inc. Systems and methods for improving video captured using mobile devices
US8885229B1 (en) 2013-05-03 2014-11-11 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US9946954B2 (en) 2013-09-27 2018-04-17 Kofax, Inc. Determining distance between an object and a capture device based on captured image data
US9747504B2 (en) 2013-11-15 2017-08-29 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
JP2017046278A (ja) * 2015-08-28 2017-03-02 京セラドキュメントソリューションズ株式会社 画像処理装置
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US11800032B2 (en) 2021-10-01 2023-10-24 Canon Kabushiki Kaisha Apparatus, information processing method, and storage medium

Also Published As

Publication number Publication date
JP4023075B2 (ja) 2007-12-19

Similar Documents

Publication Publication Date Title
JP2002024258A (ja) 画像取得装置および画像取得方法ならびに画像取得処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP7013182B2 (ja) 情報処理装置、情報処理方法およびプログラム
US7272269B2 (en) Image processing apparatus and method therefor
US8203748B2 (en) Image processing apparatus, control method therefor, and program
JP4968882B2 (ja) 画像検索装置、画像検索方法およびプログラム
JP2010074405A (ja) 画像処理装置および画像処理方法
US20100011287A1 (en) Apparatus and method for editing document layout and storage medium
US8611666B2 (en) Document image processing apparatus, document image processing method, and computer-readable recording medium having recorded document image processing program
US20060023235A1 (en) Image processing apparatus, image forming apparatus, method for searching processed document, program for searching processed document, and recording medium
JP4811133B2 (ja) 画像形成装置及び画像処理装置
JP4386275B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP7102284B2 (ja) ファイル管理装置、ファイル管理方法、及びプログラム
JP4817882B2 (ja) 画像処理方法及び画像処理装置
US20030237054A1 (en) Concept for automated scatter proofing of content elements used in personalized print jobs
JP3912463B2 (ja) 論理構造抽出装置及び論理構造抽出方法
JP6700705B2 (ja) 振り分けシステム、情報処理方法、及びプログラム
JP5009864B2 (ja) 候補画像表示方法および装置ならびにプログラム
JP4241115B2 (ja) 文書ファイリング装置
US8004712B2 (en) Image processing apparatus and method
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP2001016470A (ja) 画像処理装置
US10084939B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2002027228A (ja) 画像処理のための装置、方法及び記録媒体
JP2010010947A (ja) 画像処理装置、画像処理方法、プログラム、および記録媒体
JP2002109470A (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070605

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070924

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101012

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111012

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121012

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121012

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131012

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees