JP4023075B2 - Image acquisition device - Google Patents

Image acquisition device Download PDF

Info

Publication number
JP4023075B2
JP4023075B2 JP2000207925A JP2000207925A JP4023075B2 JP 4023075 B2 JP4023075 B2 JP 4023075B2 JP 2000207925 A JP2000207925 A JP 2000207925A JP 2000207925 A JP2000207925 A JP 2000207925A JP 4023075 B2 JP4023075 B2 JP 4023075B2
Authority
JP
Japan
Prior art keywords
document
feature amount
image
reading
delimiter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000207925A
Other languages
Japanese (ja)
Other versions
JP2002024258A (en
Inventor
雅弘 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2000207925A priority Critical patent/JP4023075B2/en
Publication of JP2002024258A publication Critical patent/JP2002024258A/en
Application granted granted Critical
Publication of JP4023075B2 publication Critical patent/JP4023075B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、自動給紙機能を持つイメージスキャナにより複数の文書の原稿を読み取るときに、文書区切り用原稿を用いることなく、各文書の区切りを判定して原稿画像を取得する画像取得装置に関する。
【0002】
【従来の技術】
近年、1枚以上の紙原稿からなる文書を複数部にわたり効率的に電子化する場合、自動給紙機能を持つイメージスキャナを用いて当該原稿を連続的に読み取る処理が広く行われている。この際、読み取った原稿画像データを文書毎に管理するためには、文書と文書との間を何らかの手段を用いて検出する必要がある。このようなニーズに対し、従来から幾つかのアプローチが提案されている。
【0003】
例えば、特開平1−162474号公報では、複数の文書原稿を読み取る前に文書間にあらかじめ特定の文書区切り用原稿を挿入しておくことで、イメージスキャナで連続的に原稿を読み取った場合でもこの文書区切り用原稿を認識し、原稿の画像を文書単位に登録する電子ファイル装置について示している。
【0004】
また、特開平7−287747号公報では、あらかじめ文書区切りとなる原稿の裏面に文書区切りマークを付加しておくことで、原稿の裏表両面をイメージスキャナで読み取り、この文書区切りマークを認識して文書の登録を行う電子ファイル装置について示している。
【0005】
また別のアプローチとして、特開平10−21380号公報では、イメージスキャナで読み取った画像データからあらかじめ設定しておいた文字認識エリア部分を切り出し、文字認識し、この文字認識結果に基づき文書の区切りを判定する電子ファイル装置について示している。
【0006】
【発明が解決しようとする課題】
しかしながら、前記文書区切り用原稿を用いて文書の区切りを判定する方法では、読み取る原稿の種類に依存しないという大きな利点がある反面、原稿を読み取る作業を行う毎に、文書の数に応じた文書区切り用原稿を準備して各文書間に挿入しなければならず、文書数が増すに従いユーザの作業負担も増大してしまうという問題点がある。
【0007】
また、文書区切りとなる原稿の裏面に文書区切りマークを付加する方法では、文書区切り用原稿を挿入する手間がないという利点はあるが、読み取り対象の原稿に加筆できない制限があったり、もともと原稿の両面に情報が記載されている場合には当該マークを付加することができず、このような原稿から構成される文書に対しては利用できないという問題点がある。
【0008】
更に、文字認識を利用する方法では、原稿のあらかじめ定められた位置にタイトルや総頁数など、文書区切りを判定する際に利用可能な条件を満たす文字列が存在する必要があり、任意の原稿に対して利用できるものではなく、どちらかといえば定型の文書に適した方法であり、非定形文書に対しては利用が難しいという問題点がある。
【0009】
本発明は上記の事情に鑑みてなされたものであり、自動給紙機能を持つイメージスキャナにより不特定な複数の文書を読み取るとき、文書区切り用原稿を用いることなく複数の文書の画像データを文書単位で取得できる画像取得装置および画像取得方法ならびに画像取得処理プログラムを記録したコンピュータ読み取り可能な記録媒体の提供を目的としている。
【0010】
【課題を解決するための手段】
上述の目的を達成するための本発明による画像処理装置は以下の横成を備える。すなわち、本願請求項1に係る発明は、複数文書分の原稿を順次読み取る原稿画像読取手段と、原稿画像読取手段で読み取って得た原稿画像の複数の特徴量を算出する特徴量算出手段と、特徴量算出手段により算出した原稿画像の特徴量に基づいて、原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段と、文書区切り判定手段が判定した文書の区切り判定結果を表示し、表示された判定結果に応じてユーザによる文書区切り位置の修正を行う文書区切り修正手段とを有し、文書区切り修正手段が、ユーザが一部の文書区切りに修正を加えた際に、当該修正された文書区切りを算出するのに適したそれぞれの特徴量に対する重み付けの係数を算出し、当該算出された係数により重み付けられた特徴量を用いて、残りの文書区切りを再判定するものである。これにより、あらかじめ文書区切り用原稿を各文書間に挿入したり、文書区切りとなる原稿に手を加えたりすることなく文書の区切りが判定できるため、ユーザに強いる負担を大幅に軽減することができる。また、不特定種類の文書を読み取って文書区切り判定を行う場合でも、単一の特徴量を用いる場合に比べて、より精度の高い文書区切り判定を行うことができる。また、仮に文書区切り判定結果の修正が必要な湯合でも、ユーザが文書区切りを1個所修正するだけで、その修正を反映させる場合に有効な各特徴量への重み係数を逆算し、逆算された係数により重み付けされた特徴量に基づいて他の修正が必要と判断される文書区切りを自動的に修正させることができるため、ユーザに強いる負担を大幅に軽減することができる。
【0011】
また、本願請求項2に係る発明は、複数文書分の原稿を順次読み取る原稿画像読取手段と、原稿画像読取手段に読み取らせる文書数を入力する文書数入力手段と、原稿画像読取手段で読み取って得た原稿画像の複数の特徴量を算出する特徴量算出手段と、文書数入力手段により入力された文書数と特徴量算出手段により算出した原稿画像の特徴量とに基づいて、原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段と、文書区切り判定手段が判定した文書の区切り判定結果を表示し、表示された判定結果に応じてユーザによる文書区切り位置の修正を行う文書区切り修正手段とを有し、文書区切り修正手段が、ユーザが一部の文書区切りに修正を加えた際に、当該修正された文書区切りを算出するのに適したそれぞれの特徴量に対する重み付けの係数を算出し、当該算出された係数により重み付けられた特徴量を用いて、残りの文書区切りを再判定するものである。これにより、前記請求項1に係る発明の利点に加え、あらかじめ文書の数がわかることから、より精度の高い文書区切り判定を行うことが可能となる。また、不特定種類の文書を読み取って文書区切り判定を行う場合でも、単一の特徴量を用いる場合に比べて、より精度の高い文書区切り判定を行うことができる。また、仮に文書区切り判定結果の修正が必要な湯合でも、ユーザが文書区切りを1個所修正するだけで、その修正を反映させる場合に有効な各特徴量への重み係数を逆算し、逆算された係数により重み付けされた特徴量に基づいて他の修正が必要と判断される文書区切りを自動的に修正させることができるため、ユーザに強いる負担を大幅に軽減することができる。
【0012】
また、本願請求項3に係る発明は、複数文書分の原稿を順次読み取る原稿画像読取手段と、原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、特徴量算出手段により算出した原稿画像の特徴量に基づいて、原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、文書区切り判定手段が、特徴量算出手段で算出した特徴量から構成されるパターン空間において、各画像データから算出した特徴量に対応するサンプルをクラスタリングし、得られたクラスタの数に応じて文書区切り数を設定するものである。これにより、あらかじめ文書区切り用原稿を各文書間に挿入したり、文書区切りとなる原稿に手を加えたりすることなく文書の区切りが判定できるため、ユーザに強いる負担を大幅に軽減することができる。また、各クラスタが1つの文書を表しているような場合には、精度の高い文書区切り判定が可能となる。
【0013】
また、本願請求項4に係る発明は、複数文書分の原稿を順次読み取る原稿画像読取手段 と、原稿画像読取手段に読み取らせる文書数を入力する文書数入力手段と、原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、文書数入力手段により入力された文書数と特徴量算出手段により算出した原稿画像の特徴量とに基づいて、原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、文書区切り判定手段が、特徴量算出手段で算出した特徴量から構成されるパターン空間において、各画像データから算出した特徴量に対応するサンプルをクラスタリングし、得られたクラスタの数に応じて文書区切り数を設定するものである。これにより、あらかじめ文書の数がわかることから、より精度の高い文書区切り判定を行うことが可能となる。また、各クラスタが1つの文書を表しているような場合には、精度の高い文書区切り判定が可能となる。
【0014】
また、本願請求項5に係る発明は、複数文書分の原稿を順次読み取る原稿画像読取手段と、原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、特徴量算出手段により算出した原稿画像の特徴量に基づいて、原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、文書区切り判定手段が、特徴量算出手段で算出した特徴量から構成されるパターン空間において、各画像データから算出した特徴量に対応するサンプルをクラスタリングし、任意のクラスタに属するサンプルに対応する画像データを文書区切りであると判断するものである。これにより、あらかじめ文書区切り用原稿を各文書間に挿入したり、文書区切りとなる原稿に手を加えたりすることなく文書の区切りが判定できるため、ユーザに強いる負担を大幅に軽減することができる。また、文書の表紙画像のように、あるクラスタが文書区切りとして利用することが可能な画像から棉成されているような場合には、このクラスタを利用して文書区切り判定が可能となる。
【0015】
また、本願請求項6に係る発明は、複数文書分の原稿を順次読み取る原稿画像読取手段と、原稿画像読取手段に読み取らせる文書数を入力する文書数入力手段と、原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、文書数入力手段により入力された文書数と特徴量算出手段により算出した原稿画像の特徴量とに基づいて、原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、文書区切り判定手段が、特徴量算出手段で算出した特徴量から構成されるパターン空間において、各画像データから算出した特徴量に対応するサンプルをクラスタリングし、任意のクラスタに属するサンプルに対応する画像データを文書区切りであると判断するものである。これにより、あらかじめ文書の数がわかることから、より精度の高い文書区切り判定を行うことが可能となる。また、文書の表紙画像のように、あるクラスタが文書区切りとして利用することが可能な画像から棉成されているような場合には、このクラスタを利用して文書区切り判定が可能となる。
【0016】
また、本願請求項7に係る発明は、複数文書分の原稿を順次読み取る原稿画像読取手段と、原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、特徴量算出手段により算出した原稿画像の特徴量に基づいて、原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、文書区切り判定手段が、特徴量算出手段で算出した特徴量の値を原稿画像読取手段で原稿を読み取った順序に並べたとき、任意の原稿の画像データから算出した特徴量の値と、その直前に読み取った原稿もしくは直後に読み取った原稿の少なくともどちらか一方の画像データから算出した特徴量の値とを比較して、その差分が所定のしきい値よりも大きな場合に、当該画像データを文書区切りであると判断するものである。これにより、あらかじめ文書区切り用原稿を各文書間に挿入したり、文書区切りとなる原稿に手を加えたりすることなく文書の区切りが判定できるため、ユーザに強いる負担を大幅に軽減することができる。また、文書区切り判定に用いる特徴量が1種類である場合にも、その特徴量が文書の区切りを判定するのに適したものであれば、簡単に文書の区切りを判定できる。
【0017】
また、本願請求項8に係る発明は、複数文書分の原稿を順次読み取る原稿画像読取手段と、原稿画像読取手段に読み取らせる文書数を入力する文書数入力手段と、原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、文書数入力手段により入力された文書数と特徴量算出手段により算出した原稿画像の特徴量とに基づいて、原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、文書区切り判定手段が、特徴量算出手段で算出した特徴量の値を原稿画像読取手段で原稿を読み取った順序に並べたとき、任意の原稿の画像データから算出した特徴量の値と、その直前に読み取った原稿もしくは直後に読み取った原稿の少なくともどちらか一方の画像データから算出した特徴量の値とを比較して、その差分が所定のしきい値よりも大きな場合に、当該画像データを文書区切りであると判断するものである。これにより、あらかじめ文書の数がわかることから、より精度の高い文書区切り判定を行うことが可能となる。また、文書区切り判定に用いる特徴量が1種類である場合にも、その特徴量が文書の区切りを判定するのに適したものであれば、簡単に文書の区切りを判定できる。
0018
【発明の実施の形態】
本発明の実施形態について、図面を参照して詳細に説明する。図1は、本発明の一実施形態に係る画像取得装置を説明する概略構成図である。すなわち、本実施形態の画像取得装置は、画像入力部10、画像格納部20、特徴量算出部30、文書区切り判定部40、文書格納部50、文書区切り修正部60、入力部70、表示部80、本装置全体の動作を制御する制御部90、および各部を結ぶバス100を備えている。
0019
画像入力部10は、自動給紙機能を持つイメージスキャナを備え、複数の文書の原稿を読み取り、画像データ(原稿画像)として入力する。本装置のイメージスキャナは、原稿の両面およびカラー原稿の読み取りが可能であるものとする。なお、イメージスキャナは本装置専用に接続されたものでもよいし、ネットワークスキャナとして稼動しているものを1ユーザとして利用してもよい。
0020
画像格納部20は、画像入力部10で入力した原稿の画像データを順次格納する。画像データを専用に格納する画像メモリであってもよいし、様々な演算処理を行うために利用されるRAMやハードディスク、リムーバルディスクなど汎用の記録媒体であってもよい。
0021
特徴量算出部30は、画像入力部10で入力中の画像データ、またはあらかじめ画像格納部20に格納している画像データから、文書区切り判定に必要な特徴量を算出する。
0022
文書区切り判定部40は、特徴量算出部30で画像データから算出した特徴量に基づき、文書区切りとなる画像データを判定する。
0023
文書格納部50は、画像格納部20に格納している画像データを、文書区切り判定部40による文書区切り判定に従って文書単位で電子データとして格納する。なお、文書格納部50は、画像格納部20と同様に、画像データを専用に格納する画像メモリであってもよいし、様々な演算処理を行うために利用されるRAMやハードディスク、リムーバルディスクなど汎用の記録媒体であってもよい。また、画像データ自体を格納することなく、画像格納部20に格納している画像データを文書単位で扱えるようにするための情報だけを格納するようにしてもよい。
0024
文書区切り修正部60は、文書区切り判定部40で判定した文書区切りがユーザの所望するものではなかった場合に、これを修正する。より具体的には、まず文書区切り判定部40による文書区切り判定結果を表示部80を通してユーザに表示し、ユーザに文書区切りの修正が必要かどうかを尋ねる。ユーザは表示部80で表示された文書区切り判定結果を参照し、文書区切り修正部60に対して入力部70を通して適切な指示を与える。
0025
入力部70は、本装置を利用するユーザによるキーボードやマウス等からの一連の指示操作を受け付け、表示部80は、本装置を利用するユーザに対してその都度必要な情報を表示する。すなわち、入力部70と表示部80が本装置とユーザとの間のインタフエースの核となる。
0026
制御部90は、本実施形態に係る装置全体の制御を行う。
【0027】
つぎに、図1に示す画像取得装置全体の動作(画像取得方法)を図2に示すフローチャートを用いて説明する。
0028
まず、ステップS101においてユーザにより読み取り文書数が指定されたかどうかを判定する。ここで、ユーザにより読み取り文書数が指定された場合にはその値を保持する(ステップS102)。
0029
保存した文書数は、後に文書区切り判定で利用する。ユーザによる読み取り文書数の指定がない場合には、後の文書区切り判定処理で、文書区切りを判定すると同時に文書数を判定する(ステップS103)。
0030
つづいて、ステップS104においてユーザにより文書区切り判定処理時に利用する画像データの特徴量について指示があったかどうかを判定する。ユーザによる指示があった場合、その旨を文書区切り判定処理時の条件として設定する(ステップS105)。
0031
特徴量の指示方法として、例えば画像データに利用されている色相、スクリーン線数といった定量的に表現が可能なものや、原稿のレイアウトや文字の組み方向などいわば定性的なものを選択、または重み付けを行って利用するようにしてもよい。また、直接これらの特徴量を指定するのではなく、頻繁に利用される文書の種類をあらかじめ登録しておき、これら文書の種類に応じて特徴量の利用方法を変えてもよい。
0032
図3は、文書区切り判定処理に利用する画像データの特徴量に関する指示の一例として、ユーザに対し表示部80を通して当該指示を促す例を示す図である。図3(a)および(b)では、本装置で読み取り対象とする文書が定型文書であれ非定型文書であれ、あらかじめ特定できるような場合の利用を想定したものであり、文書の種類を指定することで間接的に特徴量の利用方法を決定する。
0033
図3(a)では表紙がほぼ定型であるような種類の文書を選択し、図3(b)では非定型で製品カタログのような種類の文書を選択している例を示している。これに対し、図3(c)では文書区切りの判定に利用する特徴量として画像データの色相やレイアウト構造といった項目を直接指定する例を示している。
0034
ステップS104でユーザによる文書区切り判定処理に利用する特徴量の指示がなかった場合には、所定の特徴量を用いて統合的に文書区切りを判定することとする(ステップS106)。
0035
つぎに、ステップS107では、画像入力部10が複数文書分の原稿を読み取り、画像データを生成する。このとき、1枚の原稿につき両面を読み取った湯合には2枚の画像データを生成し、片面だけを読み取った場合には1枚の画像データを生成する。そして、生成した画像データを原稿を読み取った順序に従い画像格納部20に格納する。
0036
なお、原稿を読み取る際に原稿の両面を読み取るかもしくは片面だけを読み取るかは、ユーザがその都度指定してもよいし、本装置による原稿読み取りの際の既定値としてあらかじめどちらか一方を設定しておいてもよい。
0037
つぎに、ステップS108では、ステップS107で入力したすべての画像データから特徴量を算出する。特徴量算出部30は、画像格納部20に格納されている画像を順次取得し、特徴量を算出する。この特徴量を算出する処理に比較的長い時間を要するようであれば、表示部80に特徴量算出処理の詳細な途中経過を表示するようにしてもよい。なお、各画像から算出する特徴量は、ステップS105およびステップS106で導かれたものである。
0038
つぎに、ステップS109では、ステップS108で算出した特徴量に基づき、ステップS107で入力した複数の文書の区切りを算出する。このとき、ステップS102で入力する文書数がユーザにより指定されている湯合には、この文書数を文書区切りを判断するために利用する。
0039
なお、ステップ8108の特徴量算出処理と同様、文書区切り判定処理に比較的長い時間を要するようであれば、表示部80に文書区切り判定処理の詳細な途中経過を表示するようにしてもよい。
0040
そして、算出した文書区切りは表示部80を通してユーザに通知する。ステップS109の文書区切り判定処理については詳細を後述する。
0041
ステップS110では、ユ←ザが表示部80に表示されたステップS109による文書の区切り判定結果を所望のものかどうか判定し、その結果を入力部70を通して本装置に伝える。
0042
ステップS109による文書区切りの判定結果が所望のものではなく修正が必要であると判断した湯合、ステップS111で文書区切りの修正処理を実施する。
0043
ここでは、ユーザがすべての文書区切りを手動で修正してもよいし、ユーザが最初の文書区切りに修正を加えた場合、この修正された文書区切りを算出するのに最も適した特徴量や、各特徴量に対する重み付けの係数を逆算して、この結果に基づいてユーザの手を煩わせることなく残りの文書区切りを再判定させるようにしてもよい。
0044
そして、入力した文書原稿すべてについて正しく文書区切りの判定が完了した時点で、原稿画像データを文書単位で格納する(ステップS112)。なお、上述のとおり、画像データ自体を格納することなく、画像格納部20に格納している画像データを文書単位で扱えるようにするための情報だけを格納するようにしてもよい。
0045
また、所望の文書区切りがすべて得られた時点で、それぞれの文書区切りを算出するのに利用した一連の特徴量や、特徴量に対する重み付けの係数に対し、ステップS105で再利用できるように任意の文書種類名を付加して記録するなどしてもよい。
0046
つぎに、ステップS109で示す文書区切り判定の動作の詳細について、図4のフローチャートを用いて説明する。まず、ステップS201では、ステップS101と同様にユーザにより読み取り文書数が指定されたかどうかを判定する。
0047
ここで、ユーザにより読み取り文書数が指定された場合には、後にステップS108で算出した特徴量から構成されるパターン空間において実施する、クラスタリングにおける最大クラスタ数を当該読み取り文書数に設定する(ステップS202)。
0048
ステップS201でユーザにより読み取り文書数が指定されていないと判断した場合には、続くステップ8203でステップS104と同様にユーザにより文書区切り判定処理時に利用する画像データの特徴量について指示があったかどうかを判定する。
0049
ステップS203で、ユーザにより文書区切り判定処理時に利用する画像データの特徴量について指示があった場合、その指示と実際に読み取った原稿の数から前記最大クラスタ数を所定値に設定する(ステップS204)。逆に、ユーザからは何も指示を与えられていない場合には、前記最大クラスタ数を実際に読み取った原稿数に設定する(ステップS205)。
0050
つぎに、ステップS105で各特徴量に対して重み付けを行うような設定が選択された湯合、ステップS206で算出した各特徴量に対して重み付けを実施する。
0051
つぎに、ステップS207で各特徴量を軸としたパターン空間において、各原稿の画像データから算出した特徴量の値を持つサンプル群に対してクラスタリングを実施する。このとき、結果として得られるクラスタの最大数がステップS202、ステップS204、またはステップS205で設定した最大値を超えないようにする。
0052
ステップS208では、ステップS207で実施したクラスタリングの結果が良好かどうか判定する。
0053
図5は、このクラスタリング結果の良否判定の様子をわかりやすく説明するために、2つの特徴量(X1、X2)を軸とするパターン空間におけるサンプルの分布例を示す図である。
0054
図5(a)は、良好にクラスタリングができる例であり、例ではクラスタリングによりω1およびω2という2つのクラスタが得られる様子を示している。これに対し、図5(b)ではX1、X2という特徴量からなるパターン空間では、同図中のサンプルに対し適当なクラスタリングが困難である例を示している。
0055
つぎに、ステップS208でクラスタリングが良好であると判定した場合、ステップS209では得られたクラスタの中で、文書の区切りとなり得る画像データのサンプルから構成されるクラスタが存在するかどうかを判定する。
0056
例えば、図5(a)におけるクラスタω1に属すサンプルがクラスタ内でほぼ原稿の読み取り順に連続しており、クラスタω2に属すサンプルがクラスタ内で原稿の読み取り順に不連続であるような場合、クラスタω2に属すサンプルは例えば複数の文書を読み取った際の表紙原稿画像のように、数ページに一度出現する文書の区切りに相当する原稿のものである可能性がある。
0057
ここでは、クラスタω2に属すサンプルがこのような文書区切りを表すものであると判定する(ステップS210)。これにより、同図の例では3つの文書が存在することになる。
0058
これに対し、図5(a)におけるクラスタω1およびω2に属すサンプルがそれぞれのクラスタ内で原稿の読み取り順に連続しているような場合、どちらかのクラスタが文書区切りを表すものであるという判断はできない。このような場合、ω1およびω2という2つのクラスタ自体がそれぞれ文書を表していると考えるほうが妥当である。
0059
また、得られたクラスタの数がステップS102で設定された文書数と一致する場合も、上記と同様にそれぞれのクラスタ自体が個別の文書を表していると考えるほうが妥当な場合がある。
0060
ここでは文書の区切りとなる原稿として、各クラスタから読み取られた順序が最も先であるサンプル、もしくは最も後であるサンプルに相当する画像データを文書区切りであると設定する(ステップS211)。これにより、同図の例では2つの文書が存在することになる。
0061
一方、図5(b)に示すように、ステップS208でクラスタリングが困難、またはクラスタリングの結果が良好ではないと判断した場合、各特徴量に対する重み付けを変更して再クラスタリング処理が可能かどうか判断する(ステップS212)。
0062
ここで、各特徴量に対する重み付けを変更することで再クラスタリング処理が可能であると判断した場合には、ステップS206に戻って各特徴量に対する重み付けを変更した後、ステップS207以降の処理を再実施する。この判断、および各特徴量に対する重み付けの変更は入力部70を通してユーザが手動で実施してもよいし、あらかじめ設定しておいた手続きに沿って自動化してもよい。
0063
ステップS212において、各特徴量に対する重み付けを変更して再クラスタリング処理を実施することは困難であると判定した湯合、ステップS213において1枚の原稿を1つの文書と設定するか、読み取ったすべての原稿を1つの文書として設定する。これらは、入力部70を通してその都度指示してもよいし、初期値としてこのような状況になった場合にはどちらか一方を設定しておいてもよい。
0064
なお、図5では、パターン空間におけるクラスタリングの例として、特徴量X1およびX2を用いて説明したが、ステップS105における特徴量の指定方法によっては、より多くの特徴量を用いたり、逆に特徴量が1種類となる場合がある。
0065
特徴量が1種類の場合はパターン空間におけるクラスタリング処理を行うことなく、図6に示すように当該特徴量とステップS107における原稿の読み取り順序との関係から比較的簡単に文書区切りが判定できる。
0066
例えば、いま図6において特徴量X1が画像データのレイアウト構造をある規則に従い数値化したものであると仮定する。このとき、図6(a)はサンプルS1およびS7で表されるページを表紙またはそれに準ずるページであり、それ以外のサンプルはほぼ同一のレイアウト構造を持つページを表しているような2つの文書が存在する例であるといえる。
0067
また、図6(b)はサンプルS1〜S8とサンプルS9〜S7で表される2つの異なるレイアウト横造を持つ文書が存在する例であるといえる。このように、図6(a)および(b)では、どちらも特徴量X1においてしきい値THを設定することで、文書の区切りとなる原稿を判定できるわけである。
0068
なお、本発明では、上記動作を画像取得処理プログラムとしてコンピュータで読み取り可能な記録媒体(例えば、CD−ROM)に記録するようにしてもよい。
0069
【発明の効果】
以上説明したように本発明によれば、自動給紙機能を持つイメージスキャナにより不特定な複数の文書を読み取るとき、文書区切り用原稿を用いることなく複数の文書の画像データを文書単位で取得できるようになる。これにより、大量の文書を竜子化する際に発生するユーザの負担を大幅に軽減することができるようになる。また、文書の種類に応じて文書区切りを判定するための特徴量や特徴量に対する重みを変更するので、あらかじめ文書区切りマーク等の所定の記号や文字列を原稿に付加することなく様々な種類の文書に対応できるようになる。
【図面の簡単な説明】
【図1】 本実施形態に係る画像処理装置を説明する概略構成図である。
【図2】 画像処理装置全体の動作を説明するフローチャートである。
【図3】 特徴量指示時の表示例を示す図である。
【図4】 文書区切り判定の動作を説明するフローチャートである。
【図5】 文書区切り判定を行う際の、複数の特徴量を用いたクラスタリン
グを示す図である。
【図6】 文書区切り判定を行う際の、単一の特徴量を用いたしきい値処理を説明する図である。
【符号の説明】
10…画像入力部、20…画像格納部、30…特徴量算出部、40…文書区切り判定部、50…文書格納部、60…文書区切り修正部、70…入力部、80…表示部、90…制御部、100…バス
[0001]
BACKGROUND OF THE INVENTION
  The present invention acquires a document image by determining the separation of each document without using a document separation document when reading a plurality of document documents by an image scanner having an automatic paper feed function.For image acquisition deviceRelated.
[0002]
[Prior art]
  In recent years, when a document composed of one or more paper originals is efficiently digitized over a plurality of copies, a process of continuously reading the originals using an image scanner having an automatic paper feed function has been widely performed. At this time, in order to manage the read original image data for each document, it is necessary to detect between the documents using some means. Several approaches have been proposed for such needs.
[0003]
  For example, in Japanese Patent Application Laid-Open No. 1-162474, a specific document separation document is inserted between documents in advance before reading a plurality of document documents. An electronic file device that recognizes a document separation document and registers an image of the document in document units is shown.
[0004]
  In Japanese Patent Application Laid-Open No. 7-287747, a document separator mark is added to the back side of a document to be a document separator in advance, so that both the front and back sides of the document are read by an image scanner, and the document separator mark is recognized. This shows an electronic file device that performs registration.
[0005]
  As another approach, Japanese Patent Laid-Open No. 10-21380 discloses a character recognition area portion set in advance from image data read by an image scanner, character recognition, and document separation based on the character recognition result. An electronic file device to be determined is shown.
[0006]
[Problems to be solved by the invention]
  However, the method of determining a document separation using the document separation document has a great advantage that it does not depend on the type of document to be read. However, every time a document is read, the document separation according to the number of documents is performed. Therefore, there is a problem in that the work burden on the user increases as the number of documents increases.
[0007]
  In addition, the method of adding a document separator mark to the back side of a document to be used as a document separator has the advantage that there is no need to insert a document separator document, but there are restrictions that cannot be added to the original to be scanned, When information is described on both sides, the mark cannot be added, and there is a problem that it cannot be used for a document composed of such a manuscript.
[0008]
  Furthermore, in the method using character recognition, a character string that satisfies the conditions that can be used when determining a document break, such as a title and the total number of pages, must exist at a predetermined position of the document. However, it is a method suitable for a standard document and difficult to use for a non-standard document.
[0009]
  The present invention has been made in view of the above circumstances, and when reading an unspecified plurality of documents by an image scanner having an automatic paper feed function, the image data of the plurality of documents is converted into a document without using a document separator. It is an object of the present invention to provide an image acquisition device, an image acquisition method, and a computer-readable recording medium on which an image acquisition processing program is recorded.
[0010]
[Means for Solving the Problems]
  In order to achieve the above object, an image processing apparatus according to the present invention comprises the following composition. That is, the invention according to claim 1 of the present application is a document image reading unit that sequentially reads a plurality of documents, and a document image obtained by reading the document image reading unit.pluralA feature amount calculating unit that calculates a feature amount; a document delimiter determining unit that determines a document delimiter of a document image read by the document image reading unit based on the feature amount of the document image calculated by the feature amount calculating unit;A document delimiter determining unit that displays the document delimiter determination result determined by the document delimiter determining unit and corrects the document delimiter position by the user according to the displayed determination result. Calculates a weighting coefficient for each feature value that is suitable for calculating the corrected document break when correcting some document breaks, and the feature weighted by the calculated coefficient Is used to re-determine the remaining document breaks.This makes it possible to determine a document break without inserting a document break manuscript between each document in advance or modifying the original document that is to be a document break, thereby greatly reducing the burden on the user. .Even when an unspecified type of document is read and document delimitation is determined, document delimiter determination can be performed with higher accuracy than when a single feature amount is used. In addition, even if it is necessary to correct the document break determination result, the user only needs to correct one document break, and the weighting factor for each feature amount effective for reflecting the correction is back-calculated. Therefore, it is possible to automatically correct a document break that is determined to require other correction based on the feature amount weighted by the coefficient, so that the burden imposed on the user can be greatly reduced.
[0011]
  According to the second aspect of the present invention, the document image reading means for sequentially reading the documents for a plurality of documents, the document number input means for inputting the number of documents to be read by the document image reading means, and the document image reading means Of the obtained manuscript imagepluralA document image obtained by reading by a document image reading unit based on a feature amount calculation unit for calculating a feature amount, the number of documents input by the document number input unit, and a feature amount of the document image calculated by the feature amount calculation unit Document delimiter judging means for determining the document delimiter ofA document delimiter determining unit that displays the document delimiter determination result determined by the document delimiter determining unit and corrects the document delimiter position by the user according to the displayed determination result. Calculates a weighting coefficient for each feature value that is suitable for calculating the corrected document break when correcting some document breaks, and the feature weighted by the calculated coefficient Is used to re-determine the remaining document breaks.Thereby, in addition to the advantage of the invention according to the first aspect, since the number of documents is known in advance, it is possible to perform document break determination with higher accuracy.Even when an unspecified type of document is read and document delimitation is determined, document delimiter determination can be performed with higher accuracy than when a single feature amount is used. In addition, even if it is necessary to correct the document break determination result, the user only needs to correct one document break, and the weighting factor for each feature amount effective for reflecting the correction is back-calculated. Therefore, it is possible to automatically correct a document break that is determined to require other correction based on the feature amount weighted by the coefficient, so that the burden imposed on the user can be greatly reduced.
[0012]
  The invention according to claim 3 of the present application isA document image reading unit that sequentially reads a plurality of documents, a feature amount calculation unit that calculates a feature amount of the document image obtained by reading the document image reading unit, and a feature amount of the document image calculated by the feature amount calculation unit And a document space determining means for determining a document break of a document image obtained by reading with the document image reading means, and the document space determining means includes a pattern space constituted by the feature amount calculated by the feature amount calculating means. In FIG. 2, samples corresponding to the feature amounts calculated from each image data are clustered, and the number of document breaks is set according to the number of obtained clusters. This makes it possible to determine a document break without inserting a document break manuscript between each document in advance or modifying the original document that is to be a document break, thereby greatly reducing the burden on the user. . In addition, when each cluster represents one document, it is possible to determine a document break with high accuracy.
[0013]
  The invention according to claim 4 of the present application isDocument image reading means for sequentially reading documents for a plurality of documents A document number input unit that inputs the number of documents to be read by the document image reading unit, a feature amount calculation unit that calculates a feature amount of the document image obtained by reading by the document image reading unit, and a document number input unit. A document delimiter determining unit that determines a document delimiter of the original image obtained by reading by the original image reading unit based on the number of documents and the feature amount of the original image calculated by the feature amount calculating unit. Means clustering the samples corresponding to the feature values calculated from each image data in the pattern space composed of the feature values calculated by the feature value calculation means, and set the number of document breaks according to the number of obtained clusters To do. Thereby, since the number of documents can be known in advance, it is possible to perform document break determination with higher accuracy. In addition, when each cluster represents one document, it is possible to determine a document break with high accuracy.
[0014]
  The invention according to claim 5 of the present application isA document image reading unit that sequentially reads a plurality of documents, a feature amount calculation unit that calculates a feature amount of the document image obtained by reading the document image reading unit, and a feature amount of the document image calculated by the feature amount calculation unit And a document space determining means for determining a document break of a document image obtained by reading with the document image reading means, and the document space determining means includes a pattern space constituted by the feature amount calculated by the feature amount calculating means. In FIG. 5, samples corresponding to the feature amounts calculated from each image data are clustered, and image data corresponding to samples belonging to an arbitrary cluster is determined to be a document break. This makes it possible to determine a document break without inserting a document break manuscript between each document in advance or modifying the original document that is to be a document break, thereby greatly reducing the burden on the user. . Further, when a certain cluster is generated from an image that can be used as a document break, such as a cover image of a document, the document break can be determined using this cluster.
[0015]
  The invention according to claim 6 of the present application isDocument image reading means for sequentially reading documents for a plurality of documents, document number input means for inputting the number of documents to be read by the document image reading means, and a feature for calculating the feature amount of the document image read by the document image reading means Based on the amount calculation means, the number of documents input by the document number input means, and the feature amount of the original image calculated by the feature amount calculation means, the document delimiter of the original image read by the original image reading means is determined. A document delimiter determining unit, wherein the document delimiter determining unit clusters samples corresponding to the feature amount calculated from each image data in a pattern space composed of the feature amount calculated by the feature amount calculating unit, It is determined that the image data corresponding to the sample belonging to the cluster is a document break. Thereby, since the number of documents can be known in advance, it is possible to perform document break determination with higher accuracy. Further, when a certain cluster is generated from an image that can be used as a document break, such as a cover image of a document, the document break can be determined using this cluster.
[0016]
  The invention according to claim 7 of the present application isA document image reading unit that sequentially reads a plurality of documents, a feature amount calculation unit that calculates a feature amount of the document image obtained by reading the document image reading unit, and a feature amount of the document image calculated by the feature amount calculation unit And a document delimiter determining unit for determining a document delimiter of the original image obtained by reading with the original image reading unit, and the document delimiter determining unit reads the feature value calculated by the feature amount calculating unit. When the document is arranged in the order in which the originals are read, it is calculated from the feature value calculated from the image data of any original and the image data of at least one of the original read immediately before or the original read immediately after The feature value is compared, and if the difference is larger than a predetermined threshold value, it is determined that the image data is a document delimiter. This makes it possible to determine a document break without inserting a document break manuscript between each document in advance or modifying the original document that is to be a document break, thereby greatly reducing the burden on the user. . Even when there is only one type of feature amount used for document delimitation determination, document delimitation can be easily determined if the feature amount is suitable for determining document delimitation.
[0017]
  The invention according to claim 8 of the present application isDocument image reading means for sequentially reading documents for a plurality of documents, document number input means for inputting the number of documents to be read by the document image reading means, and a feature for calculating the feature amount of the document image read by the document image reading means Based on the amount calculation means, the number of documents input by the document number input means, and the feature amount of the original image calculated by the feature amount calculation means, the document delimiter of the original image read by the original image reading means is determined. A document delimiter determining unit, and the document delimiter determining unit calculates from the image data of an arbitrary document when the feature amount values calculated by the feature amount calculating unit are arranged in the order of reading the document by the document image reading unit. The feature value is compared with the feature value calculated from the image data of at least one of the document read immediately before or the document read immediately after. If greater than a predetermined threshold value is to determine the the image data is a document separator. Thereby, since the number of documents can be known in advance, it is possible to perform document break determination with higher accuracy. Even when there is only one type of feature amount used for document delimitation determination, document delimitation can be easily determined if the feature amount is suitable for determining document delimitation.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
  Embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a schematic configuration diagram illustrating an image acquisition apparatus according to an embodiment of the present invention. That is, the image acquisition apparatus according to the present embodiment includes an image input unit 10, an image storage unit 20, a feature amount calculation unit 30, a document segment determination unit 40, a document storage unit 50, a document segment correction unit 60, an input unit 70, and a display unit. 80, a control unit 90 that controls the operation of the entire apparatus, and a bus 100 that connects the units.
[0019]
  The image input unit 10 includes an image scanner having an automatic paper feed function, reads originals of a plurality of documents, and inputs them as image data (original images). The image scanner of this apparatus is capable of reading both sides of a document and a color document. Note that the image scanner may be connected exclusively to the apparatus, or may be used as one user that is operating as a network scanner.
[0020]
  The image storage unit 20 sequentially stores the image data of the document input by the image input unit 10. It may be an image memory that stores image data exclusively, or a general-purpose recording medium such as a RAM, a hard disk, or a removable disk that is used for performing various arithmetic processes.
[0021]
  The feature amount calculation unit 30 calculates a feature amount necessary for document delimitation determination from image data being input by the image input unit 10 or image data stored in the image storage unit 20 in advance.
[0022]
  The document delimiter determination unit 40 determines image data to be a document delimiter based on the feature amount calculated from the image data by the feature amount calculation unit 30.
[0023]
  The document storage unit 50 stores the image data stored in the image storage unit 20 as electronic data in units of documents according to the document delimitation determination by the document delimitation determination unit 40. As with the image storage unit 20, the document storage unit 50 may be an image memory dedicated to storing image data, or may be a RAM, a hard disk, a removable disk, or the like used for performing various arithmetic processes. A general-purpose recording medium may be used. Further, only the information for enabling the image data stored in the image storage unit 20 to be handled in document units may be stored without storing the image data itself.
[0024]
  The document break correction unit 60 corrects the document break determined by the document break determination unit 40 when the document break is not desired by the user. More specifically, first, the document break determination result by the document break determination unit 40 is displayed to the user through the display unit 80, and the user is asked whether the document break correction is necessary. The user refers to the document break determination result displayed on the display unit 80 and gives an appropriate instruction to the document break correction unit 60 through the input unit 70.
[0025]
  The input unit 70 receives a series of instruction operations from a keyboard or mouse by a user using the apparatus, and the display unit 80 displays necessary information each time for the user using the apparatus. That is, the input unit 70 and the display unit 80 are the core of the interface between the apparatus and the user.
[0026]
  The control unit 90 controls the entire apparatus according to the present embodiment.
[0027]
  Next, the operation (image acquisition method) of the entire image acquisition apparatus shown in FIG. 1 will be described with reference to the flowchart shown in FIG.
[0028]
  First, in step S101, it is determined whether the number of read documents is designated by the user. Here, if the number of read documents is designated by the user, that value is held (step S102).
[0029]
  The number of saved documents is used later for document delimiter determination. If the user does not specify the number of documents to be read, the document separator is determined in the subsequent document separator determination process, and at the same time the number of documents is determined (step S103).
[0030]
  Subsequently, in step S104, it is determined whether or not there has been an instruction regarding the feature amount of the image data used at the time of document delimitation determination processing by the user. If there is an instruction from the user, that fact is set as a condition at the time of document separation determination processing (step S105).
[0031]
  For the feature amount instruction method, for example, selectable or weighted ones that can be expressed quantitatively, such as the hue used in the image data, the number of screen lines, or the qualitative ones such as the layout of the original or the direction of the text. You may make it use it. Instead of directly designating these feature quantities, frequently used document types may be registered in advance, and the feature quantity utilization method may be changed in accordance with these document types.
[0032]
  FIG. 3 is a diagram illustrating an example of prompting the user through the display unit 80 as an example of an instruction related to the feature amount of the image data used for the document break determination process. In FIGS. 3A and 3B, it is assumed that the document to be read by the apparatus can be specified in advance whether it is a standard document or an atypical document, and the document type is specified. To indirectly determine how to use the feature.
[0033]
  FIG. 3A shows an example in which a type of document whose cover is almost fixed is selected, and FIG. 3B shows an example in which a non-standard type of document such as a product catalog is selected. On the other hand, FIG. 3C shows an example in which items such as the hue and layout structure of image data are directly specified as feature quantities used for document delimitation determination.
[0034]
  If there is no instruction for the feature amount used for the document delimitation determination process by the user in step S104, the document delimiter is determined using a predetermined feature amount in an integrated manner (step S106).
[0035]
  In step S107, the image input unit 10 reads a plurality of documents, and generates image data. At this time, two sheets of image data are generated when both sides are read for one document, and one sheet of image data is generated when only one side is read. Then, the generated image data is stored in the image storage unit 20 in the order in which the document is read.
[0036]
  Incidentally, reading or only one or single-sided reading both sides of a document when reading the document, the user may specify each time, to assign a previously either as a default value when the document reading by the device You may keep it.
[0037]
  In step S108, feature amounts are calculated from all the image data input in step S107. The feature amount calculation unit 30 sequentially acquires images stored in the image storage unit 20 and calculates feature amounts. If it takes a relatively long time to calculate the feature amount, the display unit 80 may display the detailed progress of the feature amount calculation process. Note that the feature amount calculated from each image is derived in step S105 and step S106.
[0038]
  Next, in step S109, based on the feature amount calculated in step S108, the division of the plurality of documents input in step S107 is calculated. At this time, if the number of documents input in step S102 is specified by the user, this number of documents is used to determine the document delimiter.
[0039]
  As in the case of the feature amount calculation process in step 8108, if a relatively long time is required for the document delimiter determination process, the detailed progress of the document delimiter determination process may be displayed on the display unit 80.
[0040]
  Then, the calculated document break is notified to the user through the display unit 80. Details of the document break determination processing in step S109 will be described later.
[0041]
  In step S110, it is determined whether or not the document delimiter determination result in step S109 displayed on the display unit 80 is desired, and the result is transmitted to the apparatus through the input unit 70.
[0042]
  When it is determined that the determination result of the document break in step S109 is not a desired result and correction is necessary, the document break correction process is performed in step S111.
[0043]
  Here, the user may manually correct all document breaks, or if the user makes corrections to the first document break, the feature quantity most suitable for calculating this modified document break, The weighting coefficient for each feature amount may be calculated backward, and the remaining document breaks may be re-determined based on this result without bothering the user.
[0044]
  Then, when the document separation determination is correctly completed for all input document originals, the original image data is stored in units of documents (step S112). Note that, as described above, only the information for enabling the image data stored in the image storage unit 20 to be handled in units of documents may be stored without storing the image data itself.
[0045]
  Further, when all desired document breaks are obtained, a series of feature amounts used to calculate the respective document breaks and weighting coefficients for the feature amounts can be reused in step S105. A document type name may be added and recorded.
[0046]
  Next, details of the operation for document separation determination shown in step S109 will be described with reference to the flowchart of FIG. First, in step S201, it is determined whether the number of read documents is designated by the user as in step S101.
[0047]
  Here, when the number of read documents is designated by the user, the maximum number of clusters in clustering, which is executed in the pattern space composed of the feature values calculated in step S108 later, is set as the number of read documents (step S202). ).
[0048]
  If it is determined in step S201 that the number of documents to be read is not specified by the user, in the next step 8203, it is determined whether or not the user has instructed the feature amount of the image data to be used at the time of document delimiter determination processing as in step S104. To do.
[0049]
  In step S203, when the user gives an instruction about the feature amount of the image data used at the time of document separation determination processing, the maximum number of clusters is set to a predetermined value from the instruction and the number of actually read originals (step S204). . On the other hand, when no instruction is given from the user, the maximum number of clusters is set to the number of originals actually read (step S205).
[0050]
  Next, when the setting for weighting each feature amount is selected in step S105, weighting is performed on each feature amount calculated in step S206.
[0051]
  Next, in step S207, clustering is performed on a sample group having a feature value calculated from the image data of each document in the pattern space with each feature value as an axis. At this time, the maximum number of clusters obtained as a result is prevented from exceeding the maximum value set in step S202, step S204, or step S205.
[0052]
  In step S208, it is determined whether the result of clustering performed in step S207 is good.
[0053]
  FIG. 5 shows two feature amounts (X1, X2It is a figure which shows the example of sample distribution in the pattern space centering on ().
[0054]
  FIG. 5A shows an example in which clustering can be performed satisfactorily.1And ω2The two clusters are obtained. On the other hand, in FIG.1, X2In the pattern space consisting of the feature quantities, an example is shown in which it is difficult to perform appropriate clustering on the samples in the figure.
[0055]
  Next, when it is determined in step S208 that the clustering is good, in step S209, it is determined whether or not there is a cluster composed of image data samples that can be a document delimiter among the obtained clusters.
[0056]
  For example, the cluster ω in FIG.1Samples in the cluster are almost continuous in the document reading order, and the cluster ω2If the sample belonging to is discontinuous in the order of reading in the cluster, the cluster ω2There is a possibility that the sample belonging to the document belongs to an original corresponding to a break of a document that appears once in several pages, such as a cover original image when a plurality of documents are read.
[0057]
  Here, cluster ω2It is determined that the sample belonging to (1) represents such a document break (step S210). As a result, there are three documents in the example of FIG.
[0058]
  On the other hand, the cluster ω in FIG.1And ω2If the samples belonging to are consecutive in the original reading order in each cluster, it cannot be determined that one of the clusters represents a document break. In such a case, ω1And ω2It is more appropriate to think that the two clusters themselves represent documents.
[0059]
  Also, when the number of obtained clusters matches the number of documents set in step S102, it may be more appropriate to consider that each cluster itself represents an individual document as described above.
[0060]
  Here, as the document serving as a document delimiter, the image data corresponding to the first sample in the order read from each cluster or the latest sample is set as the document delimiter (step S211). As a result, two documents exist in the example of FIG.
[0061]
  On the other hand, as shown in FIG. 5B, when it is determined in step S208 that clustering is difficult or the result of clustering is not good, it is determined whether re-clustering processing is possible by changing the weighting for each feature amount. (Step S212).
[0062]
  Here, when it is determined that the re-clustering process is possible by changing the weighting for each feature amount, the process returns to step S206 to change the weighting for each feature amount, and then repeats the processing from step S207 onward. To do. This determination and weighting change for each feature amount may be manually performed by the user through the input unit 70, or may be automated according to a preset procedure.
[0063]
  In step S212, it is determined that it is difficult to perform the reclustering process by changing the weighting for each feature amount. In step S213, one document is set as one document, or all the scanned documents are read. Set the document as one document. These may be instructed each time through the input unit 70, or one of them may be set as an initial value when such a situation occurs.
[0064]
  In FIG. 5, as an example of clustering in the pattern space, the feature amount X1And X2However, depending on the method of designating feature amounts in step S105, more feature amounts may be used, or conversely, there may be one type of feature amount.
[0065]
  When there is only one type of feature amount, it is possible to determine a document break relatively easily from the relationship between the feature amount and the document reading order in step S107 as shown in FIG. 6 without performing clustering processing in the pattern space.
[0066]
  For example, in FIG.1Assume that the layout structure of image data is digitized according to a certain rule. At this time, FIG. 6A shows a page represented by samples S1 and S7 as a cover page or a page equivalent thereto, and the other samples represent two documents representing pages having substantially the same layout structure. It can be said that this is an example.
[0067]
  FIG. 6B is an example in which there are documents having two different layout layouts represented by samples S1 to S8 and samples S9 to S7. Thus, in FIGS. 6A and 6B, the feature amount X is both.1By setting the threshold value TH in, it is possible to determine the original document that becomes the document break.
[0068]
  In the present invention, the above operation may be recorded as a computer-readable recording medium (for example, a CD-ROM) as an image acquisition processing program.
[0069]
【The invention's effect】
  As described above, according to the present invention, when a plurality of unspecified documents are read by an image scanner having an automatic paper feed function, image data of a plurality of documents can be acquired in units of documents without using a document separator. It becomes like this. As a result, it is possible to significantly reduce the burden on the user that occurs when converting a large amount of documents into a dragon. In addition, since the feature amount for determining the document delimiter and the weight for the feature amount are changed according to the document type, various types of documents can be used without adding a predetermined symbol or character string such as a document delimiter mark to the document in advance. Be able to handle documents.
[Brief description of the drawings]
FIG. 1 is a schematic configuration diagram illustrating an image processing apparatus according to an embodiment.
FIG. 2 is a flowchart for explaining the operation of the entire image processing apparatus.
FIG. 3 is a diagram illustrating a display example when a feature amount is instructed.
FIG. 4 is a flowchart illustrating an operation for determining a document break.
FIG. 5 shows clustering using a plurality of feature amounts when performing document delimitation determination.
FIG.
FIG. 6 is a diagram illustrating threshold processing using a single feature amount when performing document break determination.
[Explanation of symbols]
  DESCRIPTION OF SYMBOLS 10 ... Image input part, 20 ... Image storage part, 30 ... Feature-value calculation part, 40 ... Document delimitation determination part, 50 ... Document storage part, 60 ... Document delimitation correction part, 70 ... Input part, 80 ... Display part, 90 ... Control unit, 100 ... Bus

Claims (8)

複数文書分の原稿を順次読み取る原稿画像読取手段と、
前記原稿画像読取手段で読み取って得た原稿画像の複数の特徴量を算出する特徴量算出手段と、
前記特徴量算出手段により算出した原稿画像の特徴量に基づいて、前記原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段と
前記文書区切り判定手段が判定した文書の区切り判定結果を表示し、表示された判定結果に応じてユーザによる文書区切り位置の修正を行う文書区切り修正手段とを有し、
前記文書区切り修正手段は、ユーザが一部の文書区切りに修正を加えた際に、当該修正された文書区切りを算出するのに適したそれぞれの特徴量に対する重み付けの係数を算出し、当該算出された係数により重み付けられた特徴量を用いて、残りの文書区切りを再判定する
ことを特徴とする画像取得装置。
Document image reading means for sequentially reading documents for a plurality of documents;
Feature quantity calculating means for calculating a plurality of feature quantities of a document image obtained by reading by the document image reading means;
A document delimiter determining unit that determines a document delimiter of a document image obtained by reading by the document image reading unit based on the feature amount of the document image calculated by the feature amount calculating unit ;
A document delimiter determining unit that displays a document delimiter determination result determined by the document delimiter determining unit and corrects a document delimiter position by a user according to the displayed determination result;
The document delimiter correcting unit calculates a weighting coefficient for each feature amount suitable for calculating the corrected document delimiter when the user corrects a part of the document delimiters. An image acquisition apparatus characterized by re-determining a remaining document break using a feature amount weighted by a coefficient .
複数文書分の原稿を順次読み取る原稿画像読取手段と、
前記原稿画像読取手段に読み取らせる文書数を入力する文書数入力手段と、
前記原稿画像読取手段で読み取って得た原稿画像の複数の特徴量を算出する特徴量算出手段と、
前記文書数入力手段により入力された文書数と前記特徴量算出手段により算出した原稿画像の特徴量とに基づいて、前記原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段と
前記文書区切り判定手段が判定した文書の区切り判定結果を表示し、表示された判定結果に応じてユーザによる文書区切り位置の修正を行う文書区切り修正手段とを有し、
前記文書区切り修正手段は、ユーザが一部の文書区切りに修正を加えた際に、当該修正された文書区切りを算出するのに適したそれぞれの特徴量に対する重み付けの係数を算出し、当該算出された係数により重み付けられた特徴量を用いて、残りの文書区切りを再判定する
ことを特徴とする画像取得装置。
Document image reading means for sequentially reading documents for a plurality of documents;
A document number input means for inputting the number of documents to be read by the document image reading means;
Feature quantity calculating means for calculating a plurality of feature quantities of a document image obtained by reading by the document image reading means;
Document delimiter for determining the document delimiter of the document image obtained by reading by the document image reading unit based on the number of documents input by the document number input unit and the feature amount of the document image calculated by the feature amount calculating unit. A determination means ;
A document delimiter determining unit that displays a document delimiter determination result determined by the document delimiter determining unit and corrects a document delimiter position by a user according to the displayed determination result;
The document delimiter correcting unit calculates a weighting coefficient for each feature amount suitable for calculating the corrected document delimiter when the user corrects a part of the document delimiters. An image acquisition apparatus characterized by re-determining a remaining document break using a feature amount weighted by a coefficient .
複数文書分の原稿を順次読み取る原稿画像読取手段と、
前記原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、
前記特徴量算出手段により算出した原稿画像の特徴量に基づいて、前記原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、
前記文書区切り判定手段は、前記特徴量算出手段で算出した特徴量から構成されるパターン空間において、各画像データから算出した特徴量に対応するサンプルをクラスタリングし、得られたクラスタの数に応じて文書区切り数を設定する
ことを特徴とする画像取得装置。
Document image reading means for sequentially reading documents for a plurality of documents;
A feature amount calculating means for calculating a feature amount of an original image obtained by reading by the original image reading means;
A document delimiter determining unit that determines a document delimiter of a document image obtained by reading by the document image reading unit based on the feature amount of the document image calculated by the feature amount calculating unit;
The document delimiter determining unit clusters the samples corresponding to the feature amounts calculated from each image data in the pattern space constituted by the feature amounts calculated by the feature amount calculating unit, and according to the number of obtained clusters. Set the number of document breaks
An image acquisition apparatus characterized by that .
複数文書分の原稿を順次読み取る原稿画像読取手段と、
前記原稿画像読取手段に読み取らせる文書数を入力する文書数入力手段と、
前記原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、
前記文書数入力手段により入力された文書数と前記特徴量算出手段により算出した原稿画像の特徴量とに基づいて、前記原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、
前記文書区切り判定手段は、前記特徴量算出手段で算出した特徴量から構成されるパターン空間において、各画像データから算出した特徴量に対応するサンプルをクラスタリングし、得られたクラスタの数に応じて文書区切り数を設定する
ことを特徴とする画像取得装置。
Document image reading means for sequentially reading documents for a plurality of documents;
A document number input means for inputting the number of documents to be read by the document image reading means;
A feature amount calculating means for calculating a feature amount of an original image obtained by reading by the original image reading means;
Document delimiter for determining a document delimiter of a document image read by the document image reading unit based on the number of documents input by the document number input unit and the feature amount of the document image calculated by the feature amount calculating unit Determination means,
The document delimiter determining unit clusters the samples corresponding to the feature amounts calculated from each image data in the pattern space constituted by the feature amounts calculated by the feature amount calculating unit, and according to the number of obtained clusters. Set the number of document breaks
An image acquisition apparatus characterized by that .
複数文書分の原稿を順次読み取る原稿画像読取手段と、
前記原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、
前記特徴量算出手段により算出した原稿画像の特徴量に基づいて、前記原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、
前記文書区切り判定手段は、前記特徴量算出手段で算出した特徴量から構成されるパターン空間において、各画像データから算出した特徴量に対応するサンプルをクラスタリングし、任意のクラスタに属するサンプルに対応する画像データを文書区切りであると判断する
ことを特徴とする画像取得装置。
Document image reading means for sequentially reading documents for a plurality of documents;
A feature amount calculating means for calculating a feature amount of an original image obtained by reading by the original image reading means;
A document delimiter determining unit that determines a document delimiter of a document image obtained by reading by the document image reading unit based on the feature amount of the document image calculated by the feature amount calculating unit;
The document delimiter determining unit clusters samples corresponding to the feature amount calculated from each image data in a pattern space constituted by the feature amount calculated by the feature amount calculating unit, and corresponds to a sample belonging to an arbitrary cluster. Judge that image data is a document separator
An image acquisition apparatus characterized by that .
複数文書分の原稿を順次読み取る原稿画像読取手段と、
前記原稿画像読取手段に読み取らせる文書数を入力する文書数入力手段と、
前記原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、
前記文書数入力手段により入力された文書数と前記特徴量算出手段により算出した原稿画像の特徴量とに基づいて、前記原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、
前記文書区切り判定手段は、前記特徴量算出手段で算出した特徴量から構成されるパターン空間において、各画像データから算出した特徴量に対応するサンプルをクラスタリングし、任意のクラスタに属するサンプルに対応する画像データを文書区切りであると判断する
ことを特徴とする画像取得装置。
Document image reading means for sequentially reading documents for a plurality of documents;
A document number input means for inputting the number of documents to be read by the document image reading means;
A feature amount calculating means for calculating a feature amount of an original image obtained by reading by the original image reading means;
Document delimiter for determining a document delimiter of a document image read by the document image reading unit based on the number of documents input by the document number input unit and the feature amount of the document image calculated by the feature amount calculating unit Determination means,
The document delimiter determining unit clusters samples corresponding to the feature amount calculated from each image data in a pattern space constituted by the feature amount calculated by the feature amount calculating unit, and corresponds to a sample belonging to an arbitrary cluster. Judge that image data is a document separator
An image acquisition apparatus characterized by that .
複数文書分の原稿を順次読み取る原稿画像読取手段と、
前記原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、
前記特徴量算出手段により算出した原稿画像の特徴量に基づいて、前記原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、
前記文書区切り判定手段は、前記特徴量算出手段で算出した特徴量の値を前記原稿画像読取手段で原稿を読み取った順序に並べたとき、任意の原稿の画像データから算出した特徴量の値と、その直前に読み取った原稿もしくは直後に読み取った原稿の少なくともどちらか一方の画像データから算出した特徴量の値とを比較して、その差分が所定のしきい値よりも大きな場合に、当該画像データを文書区切りであると判断する
ことを特徴とする画像取得装置。
Document image reading means for sequentially reading documents for a plurality of documents;
A feature amount calculating means for calculating a feature amount of an original image obtained by reading by the original image reading means;
A document delimiter determining unit that determines a document delimiter of a document image obtained by reading by the document image reading unit based on the feature amount of the document image calculated by the feature amount calculating unit;
The document delimiter determining unit, when arranging the feature value calculated by the feature value calculating unit in the order of reading the document by the document image reading unit, When the feature value calculated from the image data of at least one of the document read immediately before or the document read immediately after is compared and the difference is larger than a predetermined threshold value, the image Determine that the data is a document break
An image acquisition apparatus characterized by that .
複数文書分の原稿を順次読み取る原稿画像読取手段と、
前記原稿画像読取手段に読み取らせる文書数を入力する文書数入力手段と、
前記原稿画像読取手段で読み取って得た原稿画像の特徴量を算出する特徴量算出手段と、
前記文書数入力手段により入力された文書数と前記特徴量算出手段により算出した原稿画像の特徴量とに基づいて、前記原稿画像読取手段で読み取って得た原稿画像の文書区切りを判定する文書区切り判定手段とを有し、
前記文書区切り判定手段は、前記特徴量算出手段で算出した特徴量の値を前記原稿画像読取手段で原稿を読み取った順序に並べたとき、任意の原稿の画像データから算出した特徴量の値と、その直前に読み取った原稿もしくは直後に読み取った原稿の少なくともどちらか一方の画像データから算出した特徴量の値とを比較して、その差分が所定のしきい値よりも大きな場合に、当該画像データを文書区切りであると判断する
ことを特徴とする画像取得装置。
Document image reading means for sequentially reading documents for a plurality of documents;
A document number input means for inputting the number of documents to be read by the document image reading means;
A feature amount calculating means for calculating a feature amount of an original image obtained by reading by the original image reading means;
Document delimiter for determining a document delimiter of a document image read by the document image reading unit based on the number of documents input by the document number input unit and the feature amount of the document image calculated by the feature amount calculating unit Determination means,
The document delimiter determining unit, when arranging the feature value calculated by the feature value calculating unit in the order of reading the document by the document image reading unit, When the feature value calculated from the image data of at least one of the document read immediately before or the document read immediately after is compared and the difference is larger than a predetermined threshold value, the image Determine that the data is a document break
An image acquisition apparatus characterized by that .
JP2000207925A 2000-07-10 2000-07-10 Image acquisition device Expired - Fee Related JP4023075B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000207925A JP4023075B2 (en) 2000-07-10 2000-07-10 Image acquisition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000207925A JP4023075B2 (en) 2000-07-10 2000-07-10 Image acquisition device

Publications (2)

Publication Number Publication Date
JP2002024258A JP2002024258A (en) 2002-01-25
JP4023075B2 true JP4023075B2 (en) 2007-12-19

Family

ID=18704608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000207925A Expired - Fee Related JP4023075B2 (en) 2000-07-10 2000-07-10 Image acquisition device

Country Status (1)

Country Link
JP (1) JP4023075B2 (en)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8693043B2 (en) 2003-12-19 2014-04-08 Kofax, Inc. Automatic document separation
JP4510535B2 (en) * 2004-06-24 2010-07-28 キヤノン株式会社 Image processing apparatus, control method therefor, and program
US7760372B2 (en) * 2005-01-11 2010-07-20 Xerox Corporation Method for automated document selection
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US8885229B1 (en) 2013-05-03 2014-11-11 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
AU2007328004A1 (en) * 2006-12-06 2008-06-12 Marion Darnell Jones System of fractional ownership of intellectual property
JP4800249B2 (en) * 2007-03-26 2011-10-26 京セラミタ株式会社 Printing condition switching device and image forming apparatus
JP4492701B2 (en) * 2008-01-04 2010-06-30 富士ゼロックス株式会社 Information processing apparatus, information processing system, and information processing program
JP5205161B2 (en) * 2008-07-28 2013-06-05 京セラドキュメントソリューションズ株式会社 Image processing device
JP5435915B2 (en) * 2008-09-05 2014-03-05 キヤノンマーケティングジャパン株式会社 Application document digitizing system, application document digitizing method, program, and image forming apparatus, image forming method, and program
JP4793429B2 (en) * 2008-12-03 2011-10-12 富士ゼロックス株式会社 Image processing apparatus and image processing program
JP4780184B2 (en) * 2008-12-03 2011-09-28 富士ゼロックス株式会社 Image processing apparatus and image processing program
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9311531B2 (en) 2013-03-13 2016-04-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
JP6354705B2 (en) * 2015-08-28 2018-07-11 京セラドキュメントソリューションズ株式会社 Image processing device
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
JP2023053602A (en) 2021-10-01 2023-04-13 キヤノン株式会社 Apparatus, information processing method, and program

Also Published As

Publication number Publication date
JP2002024258A (en) 2002-01-25

Similar Documents

Publication Publication Date Title
JP4023075B2 (en) Image acquisition device
US8537426B2 (en) Image processing method, image processing apparatus, and computer-readable storage medium for computer program for generating an integrated duplicate by printing images of a plurality of documents on a single sheet of recording paper or a plurality of continuously-fed sheets of recording paper
US20100251110A1 (en) Document processing apparatus, control method therefor, and computer-readable storage medium storing program for the control method
JP5152031B2 (en) Image processing apparatus and computer program
US7346673B1 (en) Method and apparatus for selecting a device and a computer product
JP2002236569A (en) Method for digitally printing composite document
JP2017177428A (en) Data processing device and program
JP4682747B2 (en) Document processing apparatus, rule data generation method and program
JP4675861B2 (en) Printing apparatus, computer program for controlling printing apparatus, and method for controlling printing apparatus
US8004712B2 (en) Image processing apparatus and method
JP4505106B2 (en) Accumulation printing method and image forming apparatus
JP2010130500A (en) Image reading apparatus, image reading method and image reading program
JP2006184594A (en) Image processor
JP7314627B2 (en) CONTROL DEVICE, IMAGE FORMING APPARATUS, CONTROL METHOD AND CONTROL PROGRAM
JP2002077567A (en) Imaging apparatus, imaging method and medium recording program for imaging method on computer
JP2001202362A (en) Character editing processor
JP2002027228A (en) Equipment and method of processing image, and recording medium
JP2002185763A (en) Digital copying machine
KR101370337B1 (en) Printing method capable of easily finding modified content from original data and recordable medium recorded with the same
JP7069759B2 (en) Form creation support device, form creation support method, and form creation support program
JP2006268792A (en) Apparatus and method for image processing
JP2004280691A (en) Document filing device
JP4006096B2 (en) Printer system, information processing method, and medium on which print output control program is recorded
JP2023170130A (en) Information processing device, information processing method, and program
JP2007208780A (en) Image forming apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070605

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070924

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101012

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111012

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121012

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121012

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131012

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees