JP3508658B2 - 文書画像取得装置、取得方法、取得プログラム記録媒体 - Google Patents

文書画像取得装置、取得方法、取得プログラム記録媒体

Info

Publication number
JP3508658B2
JP3508658B2 JP33217399A JP33217399A JP3508658B2 JP 3508658 B2 JP3508658 B2 JP 3508658B2 JP 33217399 A JP33217399 A JP 33217399A JP 33217399 A JP33217399 A JP 33217399A JP 3508658 B2 JP3508658 B2 JP 3508658B2
Authority
JP
Japan
Prior art keywords
document
area
image
detected
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP33217399A
Other languages
English (en)
Other versions
JP2001148010A (ja
Inventor
敬嗣 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP33217399A priority Critical patent/JP3508658B2/ja
Publication of JP2001148010A publication Critical patent/JP2001148010A/ja
Application granted granted Critical
Publication of JP3508658B2 publication Critical patent/JP3508658B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文書画像取得装置及
び文書画像取得方法並びに文書画像取得プログラムを記
録した記録媒体に関し、特にカメラ等の非接触型の画像
入力装置を用いて文書領域を検出する文書画像取得装置
及び文書画像取得方法並びに文書画像取得プログラムを
記録した記録媒体に関する。
【0002】
【従来の技術】従来の文書画像取得装置の一例が、本願
出願人による特許出願である特願平11−110125
号の明細書に記載されている。この従来の文書画像取得
装置の外観構成が図18に示されている。この従来の文
書画像取得装置は、カメラ等の非接触型でかつ一定時間
間隔で画像を取得するスキャナからなる画像入力部10
1と文書画像取得部102からなる。この文書画像取得
装置は机の上に、オペレータが手304で持ってきた文
書303を検出して、その文書の画像を取得することを
目的とする。
【0003】この従来の文書画像取得装置の処理内容が
図19に示されている。この従来の文書画像取得装置に
おいて、画像入力部101は、例えば1秒に10枚のス
ピードで画像を入力し、文書画像取得部202に転送す
る。入力される画像は、図20に示されているように、
手304で持った文書303である。この画像の形式の
一例が図21に示されている。この画像については、一
般的なカラー画像の形式である赤画像、緑画像、青画像
と別に白黒の濃淡画像が保持される。白黒濃淡画像は、
赤画像、緑画像、青画像から生成することができるの
で、必ずしも必要ではない。
【0004】各画像は、画素の2次元配列として表現さ
れ、横にM画素、縦にN画素の計M×N画素からなると
する。画像での座標は、左上を原点として、右方向に行
くほどX座標が大きくなるものとし、下方向に行くほど
Y座標が大きくなるものとする。
【0005】文書画像取得部202は、画像記憶部10
3、手文書分離部104、動作候補生成部106、文書
領域候補生成部105、文書領域決定部208及び文書
画像生成部110から構成され、動作して得た結果の文
書画像を端子111から出力する。
【0006】手文書分離部104は上記特願平11−1
10125号明細書中の動き検出部、静止検出部、手領
域検出部及び手領域除去部の動作を行うものとする。つ
まり手文書分離部104は、ある時刻と次の時刻で別々
に入力された画像から、画像内に変化があるか否かを判
定し、また変化のある部分を記録した画像を差分画像と
する。また手文書分離部104は、動きが一定時間以上
なくなったところで静止と判定する。さらに手文書分離
部104は、予め定義された手の色と類似色の領域を検
出し、動きがあると検出された部分と重なっている部分
を本当の手の領域として検出する。そして手文書分離部
104は、その検出された手領域と1つ前の時刻で検出
された手領域の2つの手領域を、上記差分画像から除去
して、手に関する部分を削除した画像を生成し、文書領
域とする。
【0007】また、動作候補生成部106は、上記特願
平11−110125号明細書中の手動作特徴検出部、
文書動作特徴検出部及びページ捲り文書移動判定部の処
理を実施する。つまり、動作候補生成部106は、上記
手領域に基づいて手の動作に関する特徴を抽出し、また
上記文書領域に基づいて文書の動作に関する特徴を抽出
する。さらに動作候補生成部106は、これら特徴量に
基づいて、一連の画像で表現されている手の動作がペー
ジを捲っているものなのか、文書をつかんで移動させて
いるものなのかを判定する。
【0008】同様に、文書領域候補生成部105及び文
書領域決定部208で、上記特願平11−110125
号明細書中の文書領域判定部の処理を実施する。つまり
文書領域候補生成部105及び文書領域決定部208
は、予めページ捲りの場合の画像と文書移動の場合の画
像を生成しておき、文書の存在する範囲(文書範囲)を
選定する。
【0009】さらに、文書画像生成部110は、上記特
願平11−110125号の明細書での文書画像生成部
と同じ処理を実施する。つまり文書画像生成部110
は、上記文書範囲に従って、画像記憶部103内に記憶
されている画像から文書の部分を切出し、端子111か
ら送出する。
【0010】以上のような構成からなる従来の装置の動
作について詳細に説明する。まず、画像記憶部103に
蓄積された画像は、手文書分離部104に転送される。
手文書分離部104では、入力された画像と前時刻での
画像との差から動作が停止しているかどうかを判定する
と共に、動きがある場合には、動きの部分から手とそれ
以外に分離する。
【0011】手以外の部分がしきい値以上の面積を持つ
場合に、それを文書領域とする。手領域と文書領域を動
作候補生成部106に転送し、文書領域を文書領域候補
生成部105にも転送する。動作候補生成部106で
は、動きが始まってから停止するまでの、手動作特徴、
例えば動作の平均方向等を抽出する。また、文書領域に
ついても、面積変化や移動方向等の文書動作特徴を抽出
する。さらに動作候補生成部106では、手動作特徴と
文書動作特徴からページ捲り動作及び文書移動動作につ
いての認識スコアを計算する。同時に文書領域候補生成
部105では、各時刻で検出された文書領域から、ペー
ジ捲りを仮定した場合の文書領域画像と文書移動を仮定
した場合の文書領域画像を生成する。
【0012】文書領域決定部208では、動作候補生成
部106から入力された認識スコアに基づいて、入力し
た画像がページ捲りに関するものか文書移動に関するも
のかの判定を行い、ページ捲りと判定した場合には文書
領域候補生成部105から入力したページ捲りを仮定し
た場合の文書領域画像から文書領域を決定する。また、
文書移動と判定した場合には、文書領域候補生成部10
5から入力した文書移動を仮定した場合の文書領域画像
から文書領域を決定する。決定した文書領域を文書画像
生成部110に転送する。文書画像生成部110では、
文書領域決定部208から転送された領域を画像記憶部
103に記憶された画像から切取り、端子111から結
果の文書画像として出力する。
【0013】
【発明が解決しようとする課題】しかしながら上述した
従来の文書画像取得装置では次のような問題を起こすこ
とがある。すなわち、動作候補生成部106で生成され
た手動作特徴と文書動作からのみ、ページ捲りか文書移
動かの判定をしている。そのため、実際にはありえない
判定をすることがある。例えば、その時点以前に文書を
他の場所から移動して、文書が画像中に写されていなか
ったにもかかわらず、ページ捲りと判定されることは誤
りである。
【0014】また、1つの文書が移動された後に、別の
文書が移動されて、前の文書の一部を覆い隠すように置
かれた場合に、前の文書がページ捲りされることはな
い。つまり、前の文書がページ捲りされた位置にページ
捲り文書を検出することは誤りであると見なせる。
【0015】同様に、1つの文書が移動されて、その領
域が判定された後に、ページ捲りがその周辺に判定され
る場合には、ページ捲り後の文書の領域のサイズは、検
出済みの移動文書の領域の2倍か移動文書の1倍のサイ
ズであるはずである。従って、それ以外のサイズのペー
ジ捲り文書を検出した場合には領域判定の誤りが起こっ
たか、ページ捲り文書移動の判定を誤っていると見なせ
る。
【0016】つまり、以上のような判定誤りが生じる
と、文書動作の判定を正しく行えないという欠点があ
る。
【0017】本発明は上述した従来技術の欠点を解決す
るためになされたものであり、その目的は過去のページ
捲りや文書移動の履歴を利用して、ページ捲りか文書移
動を判定して、ページ捲りまたは文書移動後の文書の領
域を検出した後に、その領域の文書画像を取得できる文
書画像取得装置及び文書画像取得方法並びに文書画像取
得プログラムを記録した記録媒体を提供することであ
る。
【0018】
【課題を解決するための手段】本発明による文書画像取
得装置は、非接触型の画像入力装置を用いて一定時間間
隔で画像を入力し、この入力した画像から文書画像を取
得する文書画像取得装置であって、過去に検出し取得し
た文書画像が入力画像中のどこに写っているかを記憶す
る文書領域マップ記憶部と、前記画像入力装置から入力
された画像中から新たな文書を検出する文書領域候補生
成部と、その新たな文書領域を発生せしめるに至った文
書の動きの候補を検出する動作候補生成部と、前記文書
領域候補生成部から出力される文書領域の特徴と、前記
動作候補生成部から出力される動作の種類とその特徴量
と、前記文書領域マップ記憶部に記憶した過去に検出し
た文書画像の特徴とを参照して、検出された文書領域の
妥当性を判定する領域可能性検証部と、前記領域可能性
検証部での判定結果から新たに検出した文書の領域を決
定する文書領域決定部と、前記文書領域決定部の出力か
ら検出した文書画像を生成する文書画像生成部とを含む
ことを特徴とする。
【0019】本発明による他の文書画像取得装置は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得装置であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶しさらにその文
書を出現させるに至った動作の種類を保持する文書領域
マップ記憶部と、前記画像入力装置から入力された画像
中から新たな文書を検出する文書領域候補生成部と、そ
の新たな文書領域を発生せしめるに至った文書の動きの
候補を検出する動作候補生成部と、前記文書領域候補生
成部から出力される文書領域の特徴と、前記動作候補生
成部から出力される動作の種類とその特徴量と、前記文
書領域マップ記憶部に記憶した過去に検出した文書画像
の特徴とを参照して、検出された文書領域の妥当性を判
定する領域可能性検証部と、前記領域可能性検証部での
判定結果から新たに検出した文書の領域を決定する文書
領域決定部と、前記文書領域決定部の出力から検出した
文書画像を生成する文書画像生成部とを含むことを特徴
とする。
【0020】本発明による他の文書画像取得装置は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得装置であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶しさらにその文
書を出現させるに至った動作の種類およびその重なり順
位を保持する文書領域マップ記憶部と、前記画像入力装
置から入力された画像中から新たな文書を検出する文書
領域候補生成部と、その新たな文書領域を発生せしめる
に至った文書の動きの候補を検出する動作候補生成部
と、前記文書領域候補生成部から出力される文書領域の
特徴と、前記動作候補生成部から出力される動作の種類
とその特徴量と、前記文書領域マップ記憶部に記憶した
過去に検出した文書画像の特徴とを参照して、検出され
た文書領域の妥当性を判定する領域可能性検証部と、前
記領域可能性検証部での判定結果から新たに検出した文
書の領域を決定する文書領域決定部と、前記文書領域決
定部の出力から検出した文書画像を生成する文書画像生
成部とを含むことを特徴とする。
【0021】本発明による他の文書画像取得装置は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得装置であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶する文書領域マ
ップ記憶部と、前記画像入力装置から入力された画像中
から新たな文書を検出する文書領域候補生成部と、その
新たな文書領域を発生せしめるに至った文書の動きの候
補を検出する動作候補生成部と、前記文書領域候補生成
部から出力される文書領域の特徴と、前記動作候補生成
部から出力される動作の種類とその特徴量と、前記文書
領域マップ記憶部に記憶した過去に検出した文書画像の
特徴とを参照して、検出された文書領域の妥当性を判定
する領域可能性検証部と、前記領域可能性検証部での判
定結果から新たに検出した文書の領域を決定する文書領
域決定部と、前記文書領域決定部の出力から検出した文
書画像を生成する文書画像生成部とを含み、前記文書領
域決定部は前記領域可能性検証部において合致するルー
ルがなかった場合に前記文書の領域の再検出を実行する
ことを特徴とする。
【0022】本発明による他の文書画像取得装置は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得装置であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶しさらにその文
書を出現させるに至った動作の種類およびその重なり順
位を保持する文書領域マップ記憶部と、前記画像入力装
置から入力された画像中から新たな文書を検出する文書
領域候補生成部と、その新たな文書領域を発生せしめる
に至った文書の動きの候補を検出する動作候補生成部
と、前記文書領域候補生成部から出力される文書領域の
特徴と、前記動作候補生成部から出力される動作の種類
とその特徴量と、前記文書領域マップ記憶部に記憶した
過去に検出した文書画像の特徴とを参照して、検出され
た文書領域の妥当性を判定する領域可能性検証部と、前
記領域可能性検証部での判定結果から新たに検出した文
書の領域を決定する文書領域決定部と、前記文書領域決
定部の出力から検出した文書画像を生成する文書画像生
成部とを含み、前記文書画像生成部は新たに検出した文
書の領域を出力すると共に、既に検出した文書の領域も
出力することを特徴とする。
【0023】本発明による他の文書画像取得装置は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得装置であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶しさらにその文
書を出現させるに至った動作の種類およびその重なり順
位を保持する文書領域マップ記憶部と、前記画像入力装
置から入力された画像中から新たな文書を検出する文書
領域候補生成部と、その新たな文書領域を発生せしめる
に至った文書の動きの候補を検出する動作候補生成部
と、前記文書領域候補生成部から出力される文書領域の
特徴と、前記動作候補生成部から出力される動作の種類
とその特徴量と、前記文書領域マップ記憶部に記憶した
過去に検出した文書画像の特徴とを参照して、検出され
た文書領域の妥当性を判定する領域可能性検証部と、前
記領域可能性検証部での判定結果から新たに検出した文
書の領域を決定する文書領域決定部と、前記文書領域決
定部の出力から検出した文書画像を生成する文書画像生
成部とを含み、前記文書画像生成部は新たに検出した文
書の領域を出力すると共に、その文書の領域の近辺に存
在する既に検出した文書の領域も出力することを特徴と
する。
【0024】本発明による他の文書画像取得装置は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得装置であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶しさらにその文
書を出現させるに至った動作の種類およびその重なり順
位を保持する文書領域マップ記憶部と、前記画像入力装
置から入力された画像中から新たな文書を検出する文書
領域候補生成部と、その新たな文書領域を発生せしめる
に至った文書の動きの候補を検出する動作候補生成部
と、前記文書領域候補生成部から出力される文書領域の
特徴と、前記動作候補生成部から出力される動作の種類
とその特徴量と、前記文書領域マップ記憶部に記憶した
過去に検出した文書画像の特徴とを参照して、検出され
た文書領域の妥当性を判定する領域可能性検証部と、前
記領域可能性検証部での判定結果から新たに検出した文
書の領域を決定する文書領域決定部と、前記文書領域決
定部の出力から検出した文書画像を生成する文書画像生
成部とを含み、前記文書画像生成部は新たに検出した文
書の領域を出力すると共に、その文書の領域が上に重な
った既検出文書の領域も出力することを特徴とする。
【0025】本発明による他の文書画像取得方法は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得方法であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶する文書領域マ
ップ記憶ステップと、前記画像入力装置から入力された
画像中から新たな文書を検出する文書領域候補生成ステ
ップと、その新たな文書領域を発生せしめるに至った文
書の動きの候補を検出する動作候補生成ステップと、前
記文書領域候補生成ステップから出力される文書領域の
特徴と、前記動作候補生成ステップから出力される動作
の種類とその特徴量と、前記文書領域マップ記憶ステッ
プに記憶した過去に検出した文書画像の特徴とを参照し
て、検出された文書領域の妥当性を判定する領域可能性
検証ステップと、前記領域可能性検証ステップでの判定
結果から新たに検出した文書の領域を決定する文書領域
決定ステップと、前記文書領域決定ステップの出力から
検出した文書画像を生成する文書画像生成ステップとを
含むことを特徴とする。
【0026】本発明による他の文書画像取得方法は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得方法であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶しさらにその文
書を出現させるに至った動作の種類を保持する文書領域
マップ記憶ステップと、前記画像入力装置から入力され
た画像中から新たな文書を検出する文書領域候補生成ス
テップと、その新たな文書領域を発生せしめるに至った
文書の動きの候補を検出する動作候補生成ステップと、
前記文書領域候補生成ステップから出力される文書領域
の特徴と、前記動作候補生成ステップから出力される動
作の種類とその特徴量と、前記文書領域マップ記憶部に
記憶した過去に検出した文書画像の特徴とを参照して、
検出された文書領域の妥当性を判定する領域可能性検証
ステップと、前記領域可能性検証ステップでの判定結果
から新たに検出した文書の領域を決定する文書領域決定
ステップと、前記文書領域決定ステップの出力から検出
した文書画像を生成する文書画像生成ステップとを含む
ことを特徴とする。
【0027】本発明による他の文書画像取得方法は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得方法であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶しさらにその文
書を出現させるに至った動作の種類およびその重なり順
位を保持する文書領域マップ記憶ステップと、前記画像
入力装置から入力された画像中から新たな文書を検出す
る文書領域候補生成ステップと、その新たな文書領域を
発生せしめるに至った文書の動きの候補を検出する動作
候補生成ステップと、前記文書領域候補生成ステップか
ら出力される文書領域の特徴と、前記動作候補生成ステ
ップから出力される動作の種類とその特徴量と、前記文
書領域マップ記憶ステップに記憶した過去に検出した文
書画像の特徴とを参照して、検出された文書領域の妥当
性を判定する領域可能性検証ステップと、前記領域可能
性検証ステップでの判定結果から新たに検出した文書の
領域を決定する文書領域決定ステップと、前記文書領域
決定ステップの出力から検出した文書画像を生成する文
書画像生成ステップとを含むことを特徴とする。
【0028】本発明による他の文書画像取得方法は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得方法であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶する文書領域マ
ップ記憶ステップと、前記画像入力装置から入力された
画像中から新たな文書を検出する文書領域候補生成ステ
ップと、その新たな文書領域を発生せしめるに至った文
書の動きの候補を検出する動作候補生成ステップと、前
記文書領域候補生成ステップから出力される文書領域の
特徴と、前記動作候補生成ステップから出力される動作
の種類とその特徴量と、前記文書領域マップ記憶ステッ
プに記憶した過去に検出した文書画像の特徴とを参照し
て、検出された文書領域の妥当性を判定する領域可能性
検証ステップと、前記領域可能性検証ステップでの判定
結果から新たに検出した文書の領域を決定する文書領域
決定ステップと、前記文書領域決定ステップの出力から
検出した文書画像を生成する文書画像生成ステップとを
含み、前記文書領域決定ステップは前記領域可能性検証
ステップにおいて合致するルールがなかった場合に前記
文書の領域の再検出を実行することを特徴とする。
【0029】本発明による他の文書画像取得方法は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得方法であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶しさらにその文
書を出現させるに至った動作の種類およびその重なり順
位を保持する文書領域マップ記憶ステップと、前記画像
入力装置から入力された画像中から新たな文書を検出す
る文書領域候補生成ステップと、その新たな文書領域を
発生せしめるに至った文書の動きの候補を検出する動作
候補生成ステップと、前記文書領域候補生成ステップか
ら出力される文書領域の特徴と、前記動作候補生成ステ
ップから出力される動作の種類とその特徴量と、前記文
書領域マップ記憶ステップに記憶した過去に検出した文
書画像の特徴とを参照して、検出された文書領域の妥当
性を判定する領域可能性検証ステップと、前記領域可能
性検証ステップでの判定結果から新たに検出した文書の
領域を決定する文書領域決定ステップと、前記文書領域
決定ステップの出力から検出した文書画像を生成する文
書画像生成ステップとを含み、前記文書画像生成ステッ
プは新たに検出した文書の領域を出力すると共に、既に
検出した文書の領域も出力することを特徴とする。
【0030】本発明による他の文書画像取得方法は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得方法であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶しさらにその文
書を出現させるに至った動作の種類およびその重なり順
位を保持する文書領域マップ記憶ステップと、前記画像
入力装置から入力された画像中から新たな文書を検出す
る文書領域候補生成ステップと、その新たな文書領域を
発生せしめるに至った文書の動きの候補を検出する動作
候補生成ステップと、前記文書領域候補生成ステップか
ら出力される文書領域の特徴と、前記動作候補生成ステ
ップから出力される動作の種類とその特徴量と、前記文
書領域マップ記憶ステップに記憶した過去に検出した文
書画像の特徴とを参照して、検出された文書領域の妥当
性を判定する領域可能性検証ステップと、前記領域可能
性検証ステップでの判定結果から新たに検出した文書の
領域を決定する文書領域決定ステップと、前記文書領域
決定ステップの出力から検出した文書画像を生成する文
書画像生成ステップとを含み、前記文書画像生成ステッ
プは新たに検出した文書の領域を出力すると共に、その
文書の領域の近辺に存在する既に検出した文書の領域も
出力することを特徴とする。非接触型の画像入力装置を
用いて一定時間間隔で画像を入力し、この入力した画像
から文書画像を取得する文書画像取得方法であって、過
去に検出し取得した文書画像が入力画像中のどこに写っ
ているかを記憶しさらにその文書を出現させるに至った
動作の種類およびその重なり順位を保持する文書領域マ
ップ記憶ステップと、前記画像入力装置から入力された
画像中から新たな文書を検出する文書領域候補生成ステ
ップと、その新たな文書領域を発生せしめるに至った文
書の動きの候補を検出する動作候補生成ステップと、前
記文書領域候補生成ステップから出力される文書領域の
特徴と、前記動作候補生成ステップから出力される動作
の種類とその特徴量と、前記文書領域マップ記憶ステッ
プに記憶した過去に検出した文書画像の特徴とを参照し
て、検出された文書領域の妥当性を判定する領域可能性
検証ステップと、前記領域可能性検証ステップでの判定
結果から新たに検出した文書の領域を決定する文書領域
決定ステップと、前記文書領域決定ステップの出力から
検出した文書画像を生成する文書画像生成ステップとを
含み、前記文書画像生成ステップは新たに検出した文書
の領域を出力すると共に、その文書の領域の近辺に存在
する既に検出した文書の領域も出力することを特徴とす
る。
【0031】本発明による他の文書画像取得方法は、非
接触型の画像入力装置を用いて一定時間間隔で画像を入
力し、この入力した画像から文書画像を取得する文書画
像取得方法であって、過去に検出し取得した文書画像が
入力画像中のどこに写っているかを記憶しさらにその文
書を出現させるに至った動作の種類およびその重なり順
位を保持する文書領域マップ記憶ステップと、前記画像
入力装置から入力された画像中から新たな文書を検出す
る文書領域候補生成ステップと、その新たな文書領域を
発生せしめるに至った文書の動きの候補を検出する動作
候補生成ステップと、前記文書領域候補生成ステップか
ら出力される文書領域の特徴と、前記動作候補生成ステ
ップから出力される動作の種類とその特徴量と、前記文
書領域マップ記憶ステップに記憶した過去に検出した文
書画像の特徴とを参照して、検出された文書領域の妥当
性を判定する領域可能性検証ステップと、前記領域可能
性検証ステップでの判定結果から新たに検出した文書の
領域を決定する文書領域決定ステップと、前記文書領域
決定ステップの出力から検出した文書画像を生成する文
書画像生成ステップとを含み、前記文書画像生成ステッ
プは新たに検出した文書の領域を出力すると共に、その
文書の領域が上に重なった既検出文書の領域も出力する
ことを特徴とする。
【0032】本発明による文書画像取得プログラムを記
録した記録媒体は、コンピュータによって非接触型の画
像入力装置を制御して一定時間間隔で画像を入力し、こ
の入力した画像から文書画像を取得する文書画像取得プ
ログラムを記録した記録媒体であって、該プログラムは
過去に検出し取得した文書画像が入力画像中のどこに写
っているかを記憶する文書領域マップ記憶ステップと、
前記画像入力装置から入力された画像中から新たな文書
を検出する文書領域候補生成ステップと、その新たな文
書領域を発生せしめるに至った文書の動きの候補を検出
する動作候補生成ステップと、前記文書領域候補生成ス
テップから出力される文書領域の特徴と、前記動作候補
生成ステップから出力される動作の種類とその特徴量
と、前記文書領域マップ記憶ステップに記憶した過去に
検出した文書画像の特徴とを参照して、検出された文書
領域の妥当性を判定する領域可能性検証ステップと、前
記領域可能性検証ステップでの判定結果から新たに検出
した文書の領域を決定する文書領域決定ステップと、前
記文書領域決定ステップの出力から検出した文書画像を
生成する文書画像生成ステップとを含むことを特徴とす
る。
【0033】本発明による他の文書画像取得プログラム
を記録した記録媒体は、コンピュータによって非接触型
の画像入力装置を制御して一定時間間隔で画像を入力
し、この入力した画像から文書画像を取得する文書画像
取得プログラムを記録した記録媒体であって、該プログ
ラムは過去に検出し取得した文書画像が入力画像中のど
こに写っているかを記憶しさらにその文書を出現させる
に至った動作の種類を保持する文書領域マップ記憶ステ
ップと、前記画像入力装置から入力された画像中から新
たな文書を検出する文書領域候補生成ステップと、その
新たな文書領域を発生せしめるに至った文書の動きの候
補を検出する動作候補生成ステップと、前記文書領域候
補生成ステップから出力される文書領域の特徴と、前記
動作候補生成ステップから出力される動作の種類とその
特徴量と、前記文書領域マップ記憶部に記憶した過去に
検出した文書画像の特徴とを参照して、検出された文書
領域の妥当性を判定する領域可能性検証ステップと、前
記領域可能性検証ステップでの判定結果から新たに検出
した文書の領域を決定する文書領域決定ステップと、前
記文書領域決定ステップの出力から検出した文書画像を
生成する文書画像生成ステップとを含むことを特徴とす
る。
【0034】本発明による他の文書画像取得プログラム
を記録した記録媒体は、コンピュータによって非接触型
の画像入力装置を制御して一定時間間隔で画像を入力
し、この入力した画像から文書画像を取得する文書画像
取得プログラムを記録した記録媒体であって、該プログ
ラムは過去に検出し取得した文書画像が入力画像中のど
こに写っているかを記憶しさらにその文書を出現させる
に至った動作の種類およびその重なり順位を保持する文
書領域マップ記憶ステップと、前記画像入力装置から入
力された画像中から新たな文書を検出する文書領域候補
生成ステップと、その新たな文書領域を発生せしめるに
至った文書の動きの候補を検出する動作候補生成ステッ
プと、前記文書領域候補生成ステップから出力される文
書領域の特徴と、前記動作候補生成ステップから出力さ
れる動作の種類とその特徴量と、前記文書領域マップ記
憶ステップに記憶した過去に検出した文書画像の特徴と
を参照して、検出された文書領域の妥当性を判定する領
域可能性検証ステップと、前記領域可能性検証ステップ
での判定結果から新たに検出した文書の領域を決定する
文書領域決定ステップと、前記文書領域決定ステップの
出力から検出した文書画像を生成する文書画像生成ステ
ップとを含むことを特徴とする。
【0035】本発明による他の文書画像取得プログラム
を記録した記録媒体は、コンピュータによって非接触型
の画像入力装置を制御して一定時間間隔で画像を入力
し、この入力した画像から文書画像を取得する文書画像
取得プログラムを記録した記録媒体であって、該プログ
ラムは過去に検出し取得した文書画像が入力画像中のど
こに写っているかを記憶する文書領域マップ記憶ステッ
プと、前記画像入力装置から入力された画像中から新た
な文書を検出する文書領域候補生成ステップと、その新
たな文書領域を発生せしめるに至った文書の動きの候補
を検出する動作候補生成ステップと、前記文書領域候補
生成ステップから出力される文書領域の特徴と、前記動
作候補生成ステップから出力される動作の種類とその特
徴量と、前記文書領域マップ記憶ステップに記憶した過
去に検出した文書画像の特徴とを参照して、検出された
文書領域の妥当性を判定する領域可能性検証ステップ
と、前記領域可能性検証ステップでの判定結果から新た
に検出した文書の領域を決定する文書領域決定ステップ
と、前記文書領域決定ステップの出力から検出した文書
画像を生成する文書画像生成ステップとを含み、前記文
書領域決定ステップは前記領域可能性検証ステップにお
いて合致するルールがなかった場合に前記文書の領域の
再検出を実行することを特徴とする。
【0036】本発明による他の文書画像取得プログラム
を記録した記録媒体は、コンピュータによって非接触型
の画像入力装置を制御して一定時間間隔で画像を入力
し、この入力した画像から文書画像を取得する文書画像
取得プログラムを記録した記録媒体であって、該プログ
ラムは過去に検出し取得した文書画像が入力画像中のど
こに写っているかを記憶しさらにその文書を出現させる
に至った動作の種類およびその重なり順位を保持する文
書領域マップ記憶ステップと、前記画像入力装置から入
力された画像中から新たな文書を検出する文書領域候補
生成ステップと、その新たな文書領域を発生せしめるに
至った文書の動きの候補を検出する動作候補生成ステッ
プと、前記文書領域候補生成ステップから出力される文
書領域の特徴と、前記動作候補生成ステップから出力さ
れる動作の種類とその特徴量と、前記文書領域マップ記
憶ステップに記憶した過去に検出した文書画像の特徴と
を参照して、検出された文書領域の妥当性を判定する領
域可能性検証ステップと、前記領域可能性検証ステップ
での判定結果から新たに検出した文書の領域を決定する
文書領域決定ステップと、前記文書領域決定ステップの
出力から検出した文書画像を生成する文書画像生成ステ
ップとを含み、前記文書画像生成ステップは新たに検出
した文書の領域を出力すると共に、既に検出した文書の
領域も出力することを特徴とする。
【0037】本発明による他の文書画像取得プログラム
を記録した記録媒体は、コンピュータによって非接触型
の画像入力装置を制御して一定時間間隔で画像を入力
し、この入力した画像から文書画像を取得する文書画像
取得プログラムを記録した記録媒体であって、該プログ
ラムは過去に検出し取得した文書画像が入力画像中のど
こに写っているかを記憶しさらにその文書を出現させる
に至った動作の種類およびその重なり順位を保持する文
書領域マップ記憶ステップと、前記画像入力装置から入
力された画像中から新たな文書を検出する文書領域候補
生成ステップと、その新たな文書領域を発生せしめるに
至った文書の動きの候補を検出する動作候補生成ステッ
プと、前記文書領域候補生成ステップから出力される文
書領域の特徴と、前記動作候補生成ステップから出力さ
れる動作の種類とその特徴量と、前記文書領域マップ記
憶ステップに記憶した過去に検出した文書画像の特徴と
を参照して、検出された文書領域の妥当性を判定する領
域可能性検証ステップと、前記領域可能性検証ステップ
での判定結果から新たに検出した文書の領域を決定する
文書領域決定ステップと、前記文書領域決定ステップの
出力から検出した文書画像を生成する文書画像生成ステ
ップとを含み、前記文書画像生成ステップは新たに検出
した文書の領域を出力すると共に、その文書の領域の近
辺に存在する既に検出した文書の領域も出力することを
特徴とする。
【0038】本発明による他の文書画像取得プログラム
を記録した記録媒体は、コンピュータによって非接触型
の画像入力装置を制御して一定時間間隔で画像を入力
し、この入力した画像から文書画像を取得する文書画像
取得プログラムを記録した記録媒体であって、該プログ
ラムは過去に検出し取得した文書画像が入力画像中のど
こに写っているかを記憶しさらにその文書を出現させる
に至った動作の種類およびその重なり順位を保持する文
書領域マップ記憶ステップと、前記画像入力装置から入
力された画像中から新たな文書を検出する文書領域候補
生成ステップと、その新たな文書領域を発生せしめるに
至った文書の動きの候補を検出する動作候補生成ステッ
プと、前記文書領域候補生成ステップから出力される文
書領域の特徴と、前記動作候補生成ステップから出力さ
れる動作の種類とその特徴量と、前記文書領域マップ記
憶ステップに記憶した過去に検出した文書画像の特徴と
を参照して、検出された文書領域の妥当性を判定する領
域可能性検証ステップと、前記領域可能性検証ステップ
での判定結果から新たに検出した文書の領域を決定する
文書領域決定ステップと、前記文書領域決定ステップの
出力から検出した文書画像を生成する文書画像生成ステ
ップとを含み、前記文書画像生成ステップは新たに検出
した文書の領域を出力すると共に、その文書の領域が上
に重なった既検出文書の領域も出力することを特徴とす
る。
【0039】要するに、本発明では、手と文書とを分離
し、手領域と文書領域の動きから動作候補を生成し、動
いている文書領域の画像から文書領域の候補を生成する
文書画像取得装置において、過去に検出した文書領域を
記憶しておき、その時点での生成された文書領域の妥当
性を検証し、その検証の結果に従って文書領域を判定
し、決定された領域に基づいて文書画像を生成している
のである。このように、その時点以前の文書移動やペー
ジ捲りの履歴をページ捲りか文書移動かの判定に利用す
ることで、過去に検出された文書領域と照らし合わせて
矛盾のある動作の判定を排除し、正しい文書の領域を検
出することができるのである。
【0040】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。なお、以下の説明に
おいて参照する各図においては、他の図と同等部分には
同一符号が付されている。
【0041】図1は、本発明による文書画像取得装置の
実施の一形態を示すブロック図である。同図において、
文書画像取得装置は、画像を撮影する画像入力部101
と、撮影した画像から文書画像を取得する文書画像取得
部102とから構成されている。
【0042】なお、文書画像取得装置の外観は上述した
図18に示されている従来の文書画像取得装置の外観と
同様で、カメラ等の非接触型でかつ一定時間間隔で画像
を取得するスキャナからなる画像入力部101と、文書
画像を取得する文書画像取得部102とから構成されて
いる。
【0043】文書画像取得部102は、画像を記憶する
画像記憶部103と、ある時刻と次の時刻で別々に入力
された画像から、画像内に変化があるかを判定し、動き
があると検出された部分から手領域を検出する手文書分
離部104と、前時刻での手領域とその時刻での手領域
から、手領域の動きに関する特徴を抽出して、さらに前
時刻での文書領域とその時刻での文書領域から、文書領
域の動きに関する特徴を抽出する動作候補生成部106
と、動作候補生成部106から転送された手領域の位置
と、手文書分離部104から転送された文書領域画像か
ら、文書動作の種類の毎に、文書領域画像を生成する文
書領域候補生成部105と、文書領域マップを記憶する
文書領域マップ記憶部107と、文書領域候補生成部1
05から入力された、文書動作の種類毎の文書領域画像
から、各文書動作毎の文書領域を選択する文書領域決定
部108と、各文書動作の種類について、文書領域マッ
プと検証ルールを用いて、各文書動作の妥当性を検証す
る領域可能性検証部109と、文書領域決定部108か
ら転送された文書領域の範囲に従って、画像記憶部10
3内に記憶されている画像から文書の部分を切出す文書
画像生成部110とを含んで構成されている。
【0044】ここで、図1において、画像入力部101
は、その前方にある情景を一定時間間隔、例えば1秒間
に30枚で撮影し、画像として順次、文書画像取得部1
02に転送する。画像入力部101から取得された画像
は、画像記憶部103に転送され記憶される。記憶され
る画像は、例えば、上述した図20に示されているよう
に、手304で持った文書303である。この画像の形
式については、上述した図21にされているように、一
般的なカラー画像の形式である赤画像、緑画像、青画像
と別に白黒の濃淡画像が保持される。白黒濃淡画像は、
赤画像、緑画像、青画像から生成することができるの
で、必ずしも必要ではない。
【0045】各画像は、画素の2次元配列として表現さ
れ、横にM画素、縦にN画素の計M×N画素からなると
する。画像での座標は、左上を原点として、右方向に行
くほどX座標が大きくなるものとし、下方向に行くほど
Y座標が大きくなるものとする。
【0046】画像記憶部103に記憶された画像は、手
文書分離部104と文書画像生成部110に転送され
る。
【0047】手文書分離部104では、ある時刻と次の
時刻で別々に入力された画像から、画像内に変化がある
かを判定し、動きがあると検出された部分から手領域を
検出して、動作候補生成部106に転送する。さらに、
手文書分離部104は、動きのある部分から、手領域を
除去して、残った部分を文書領域画像として、文書領域
候補生成部105と動作候補生成部106に転送する。
【0048】動作候補生成部106では、前時刻での手
領域とその時刻での手領域から、手領域の動きに関する
特徴を抽出して、さらに前時刻での文書領域とその時刻
での文書領域から、文書領域の動きに関する特徴を抽出
する。手領域の特徴と文書領域の特徴とから、予め定め
られた複数の文書動作の動作スコアを求めて、文書領域
決定部108に転送する。同時に、動作スコアを求める
元となった動作特徴も文書領域決定部108に転送す
る。
【0049】なお本実施例では、予め定められた複数の
文書動作を、右手によるページ捲り、左手によるページ
捲り、右手による文書移動、左手による文書移動とそれ
以外の動作としたが、これ以外のものを加えても、本質
的に変わりはない。文書動作をそれぞれ、右手ページ捲
り、左手ページ捲り、右手文書移動、左手文書移動と呼
ぶ。また、動作候補生成部106では、現時刻での手領
域の位置を求めて、文書領域候補生成部105に転送す
る。
【0050】文書領域候補生成部105では、動作候補
生成部106から転送された手領域の位置と、手文書分
離部104から転送された文書領域画像から、文書動作
の種類の毎に、文書領域画像を生成して、文書領域決定
部108に転送する。
【0051】文書領域決定部108では、文書領域候補
生成部105から入力された、文書動作の種類毎の文書
領域画像から、各文書動作毎の文書領域を選択する。選
択した文書領域と、動作候補生成部106から入力され
た文書動作の種類毎の動作スコアとその動作特徴を領域
可能性検証部109に転送する。
【0052】領域可能性検証部109では、各文書動作
の種類について、文書領域マップと検証ルールを用い
て、各文書動作の妥当性を検証する。もし、妥当なルー
ルを検出できなかった場合には、その文書動作の種類に
関する動作スコアと文書領域を修正する。これを全ての
文書動作の種類について実行する。ここで、文書領域マ
ップは文書領域マップ記憶部107から読込んで利用す
る。また、検証ルールは、領域可能性検証部109に記
憶されているものとする。全ての処理が終了した後に、
動作スコアと文書領域を文書領域決定部108に転送す
る。
【0053】本実施例では、図2及び図3に示されてい
るような2種類の文書領域マップを用いた。図2は、カ
メラが入力する領域全体の中で検出された文書の番号を
検出された領域に書き込んだマップである。図2に示さ
れている例では1番、2番、3番の3枚の文書が既に検
出されて、3番の文書領域の上に、少し重なるように1
番の文書領域が検出され、さらにその上に重なるように
2番の文書領域が検出されたことを示している。この状
況を、表形式で表したものが図3に示されている例であ
る。表には領域番号、左上座標、右下座標、重なりの順
位、直前の文書動作の種類を記憶する。これ以外にも、
文書領域決定に利用された文書動作の特徴量や文書領域
画像を記憶しても良い。
【0054】また、検証ルールの一例が図4に示されて
いる。検証ルールの項目としては、ルール番号、文書動
作の種類、手の動き方向、その文書動作の関わる元の文
書の直前動作、その文書が検出された領域の位置サイズ
と元の文書の位置サイズの関係、元の文書に重なる文書
の位置が記載されている。本実施例での検証ルールは、
許容される状態が記載されており、表内に記載されたど
の検証ルールにも合致しない状態が検出された場合に
は、その状態を矛盾した状態と見なす。図4中に記載さ
れている*は、特定の条件がないことを示している。こ
こで、文書動作の元文書とは、文書動作が起こされた文
書の元の位置の文書をさす。
【0055】例えば、ページ捲り動作では、基本的に場
所は変わらないので、ページ捲り後と同じ位置にあった
文書である。文書移動動作では、移動された文書が元あ
った位置の文書をさす。
【0056】また、ここで(x1,y1)はその検出文
書領域の左上座標、(x2,y2)はその検出文書領域
の右下座標、(xp1,yp1),(xp2,yp2)
はその検出文書の動作前の領域の左上座標と右下座標と
する。その一例が図5に示されている。また、(xq
1,yq1),(xq2,yq2)は、その検出文書領
域の動作前の文書領域に重なる文書の左上座標と右下座
標とする。その一例が図6に示されている。
【0057】文書領域決定部108では、領域可能性検
証部109から入力された動作スコアの中で最大値を選
択し、それに対応する動作の種類を現時点まででの連続
する動きを表す動作の種類と決定すると共に、その動作
に対応する文書領域を選択し、文書画像生成部110に
転送する。
【0058】文書画像生成部110では、文書領域決定
部108から転送された文書領域の範囲に従って、画像
記憶部103内に記憶されている画像から文書の部分を
切出し、端子111から送出する。さらに、文書動作が
文書移動であったと判定された場合には、移動した文書
が元あった位置の文書領域を、画像記憶部103から切
出し、端子111から別の検出文書画像として送出して
も良い。また、検出した文書領域の出力と共に、文書領
域マップは文書マップの内の幾つかの文書領域を併せて
出力しても良い。
【0059】本発明の文書画像取得装置の構成は以上の
通りであるが、その動作について図1及び図7のフロー
チャートを参照して説明する。
【0060】まず、ステップs1−1で装置を起動した
直後に、ステップs1−2で全体初期化を実施すると共
に、文書領域マップ記憶部107をクリアする。
【0061】次に、端子112からの制御信号を受ける
と、図7中でのステップs1−3に進み、手文書分離部
104、動作候補生成部106、文書領域候補生成部1
05を初期化する。
【0062】次にステップs1−4では画像入力を開始
し、画像入力部101で入力した画像を画像記憶部10
3に転送して蓄積する。さらに、図7中のステップs1
−5で手文書分離部104を作動させる。手文書分離部
104では、画像記憶部103から画像を取り込んで、
差分画像を生成し、差分要素が存在する場合には、画像
に動きがあったとみなし、数時刻に亙って動きが検出で
きなかった場合には、動作停止と判定する。動きが検出
されている間は、図7中のステップs1−4からステッ
プs1−7までを繰返し実行する。さらに手文書分離部
104は、差分要素の中から手領域を検出して、動作候
補生成部106に転送する。また、差分画像から手領域
を除去した文書領域画像を生成して、文書領域候補生成
部105と動作候補生成部106に転送する。
【0063】上記の繰返し実行の中で図7中のステップ
s1−5に続いて、ステップs1−6では、動作候補生
成部106と文書領域候補生成部105を起動する。
【0064】動作候補生成部106を起動すると、手文
書分離部104から入力した手領域と文書領域画像のデ
ータを用いて、手領域の動きに関する特徴と文書領域の
動きに関する特徴を抽出する。さらに、動作候補生成部
106では、手領域の特徴と文書領域の特徴とから、各
文書動作の動作スコアを求めて、文書領域決定部108
に転送する。同時に、累積手移動方向も文書領域決定部
108に転送する。ここで累積手移動方向とは、手が動
き始めてから止まるまでの方向に相当する。また、動作
候補生成部106では、現時刻での手領域の位置を求め
て、文書領域候補生成部105に転送する。
【0065】さらに、ステップs1−6では、文書領域
候補生成部105を起動する。動作候補生成部106か
ら転送された手領域の位置と、手文書分離部104から
転送された文書領域画像から、文書動作の種類の毎に、
動作開始から停止まで累積した文書領域画像を生成し
て、文書領域決定部108に転送する。
【0066】次に、ステップs1−7では、手文書分離
部104において動作停止が検出されたかを判定し、動
作停止が検出されていない場合には、ステップs1−4
に戻って、ステップs1−4からステップs1−7まで
を繰返す。動作停止が判定された場合には、図7のステ
ップs1−8に進む。
【0067】図7のステップs1−8では、文書領域決
定部108と領域可能性検証部109を起動する。文書
領域決定部108では、文書領域候補生成部105から
入力された、文書動作の種類毎の文書領域画像から、各
文書動作毎の文書領域を選択する。選択した文書領域
と、動作候補生成部106から入力された文書動作の種
類毎の動作スコアとその動作特徴を領域可能性検証部1
09に転送する。
【0068】領域可能性検証部109では、各文書動作
の種類について、文書領域マップと検証ルールを用い
て、各文書動作の妥当性を検証する。もし、妥当なルー
ルを検出できなかった場合には、その文書動作の種類に
関する動作スコアと文書領域を修正する。これを全ての
文書動作の種類について実行する。結果の、動作スコア
と文書領域を文書領域決定部108に転送する。
【0069】文書領域決定部108では、領域可能性検
証部109から入力された動作スコアの中で最大値を選
択し、それに対応する動作の種類を現時点まででの連続
する動きを表す動作の種類と決定すると共に、その動作
に対応する文書領域を選択し、文書画像生成部110に
転送する。
【0070】文書画像生成部110では、文書領域決定
部108から転送された文書領域の範囲に従って、画像
記憶部103内に記憶されている画像から文書の部分を
切出し、端子111から送出する。この際に、文書領域
マップ記憶部107から文書領域マップを読出して、検
出した文書画像と共に出力することも可能である。ま
た、検出した文書画像の位置に近い文書領域を文書領域
マップ記憶部107から読出して、検出した文書画像と
共に出力することも可能である。同様に、検出した文書
画像に重なりのある文書領域を文書領域マップ記憶部1
07から読出して、検出した文書画像と共に出力するこ
とも可能である。
【0071】続いて、ステップs1−9に進み、文書領
域決定部108での領域マップ修正処理を実施する。ス
テップs1−8で決定された文書領域と文書動作に従っ
て、領域マップを修正する。
【0072】図7のステップs1−10では、図1中の
端子112から割込み信号があるかどうかを判定して、
割込み信号があれば、全体の処理を終了して、その文書
画像取得装置を停止する。もし、割込み信号がなけれ
ば、図7のステップs1−3に戻って、ステップs1−
3からステップs1−9までの処理を実施して、次の文
書動作の検出と文書画像の取得を実施する。
【0073】続いて、各部の構成の詳細と、その動作を
説明する。
【0074】図8を参照すると、同図には、図1に示さ
れている手文書分離部104の一実施例の詳細が示され
ている。また、図9には、図8に示されている手文書分
離部104の動作のフローチャートが示されている。
【0075】図8において、手文書分離部104は、動
き検出部401と手領域検出部402と文書領域検出部
403と制御部404とからなる。動き検出部401の
動作は、例えば、上記特願平11−110125号の明
細書中の動き検出部、静止検出部、手領域検出部及び手
領域除去部の動作に相当する。これらについては先述し
た通りであり、当業者が容易に実施できる。
【0076】図7のステップs1−3の手文書分離の初
期化処理では、図9のステップs4−2を実行して、動
作カウンタkを0とする。動作カウンタkは、動きが検
出されなかった連続する画像フレームの数をカウントす
るために利用される。
【0077】図7のステップs1−5では、手文書分離
部104でのステップs4−3からs4−15までを実
施する。ステップs4−3で、画像記憶部101から現
時刻での濃淡画像Iとカラー画像Cを読込む。画像I
は、各座標(x、y)での値の配列として表現されてい
るものとする。
【0078】ステップs4−4では、現時刻での画像I
と前時刻での画像I’とから差分画像Fを生成する。差
分画像Fの座標(x、y)での値は次の式(1)と式
(2)とで求める。 F(x,y)= 1 もし |I(x,y)−I’(x,y)|≧しきい値1の 場合 …(1) F(x,y)= 0 もし |I(x,y)−I’(x,y)|<しきい値1の 場合 …(2)
【0079】ただし、本実施例では、しきい値1を10
としたが、その値はどのようなものでもよい。また、|
Z|はZの絶対値を表す。以上の式(1)と式(2)と
を全ての座標(x、y)について実施してFを計算した
後に、全ての(x、y)でのF(x、y)の値の総和を
求めて差分量dとする。
【0080】続いて、ステップs4−5に進んで、差分
量dが予め定めた差分量のしきい値dAと比較して、も
ししきい値dAより大きければステップs4−6に進
む。さもなければ、動きが検出されなかったものとして
ステップs4−12に進む。本実施例では、dAを10
0としたが、どのような値でも良い。
【0081】ステップs4−6では、動作停止カウンタ
kを0に設定して、動作を検出していることを記憶す
る。続いて、ステップs4−7では、図8中の手領域検
出部402を起動して、手領域を検出する。手領域検出
部402では、読込まれたカラー画像Cの画素の中か
ら、手領域の色として予め定められた色cに近い画素を
全て選択する。色が近いとは、次の式(3)の条件を満
たしたものをさす。 H(x,y)=1 もし |C(x,y)−c|<しきい値2の時 H(x,y)=0 上記以外の時 …(3)
【0082】本実施例では、しきい値2を50とした
が、この値はどのようなものでも良い。また、手の色c
は、予め手の色を測定して記録してある。さらに、手領
域検出部402では、全ての座標(x、y)について次
の式(4)を実行して、手領域Hを生成する。 H(x,y)=H(x,y)×F(x,y) …(4)
【0083】続いて、ステップs4−8に進み、図8中
の文書領域検出部403を起動する。文書領域検出部4
03は、手領域検出部402で求められた手領域Hと、
動き検出部401で求められた差分画像Fから次の式
(5)を全ての座標(x、y)で実行することにより、
文書領域画像Bを生成する。 B(x,y)=F(x,y)−H(x,y) …(5) これは、差分画像Fから手領域Hを除去したことに相当
する。
【0084】次にステップs4−9に進んで、求めた手
領域Hと文書領域画像Bを端子405を通して、動作候
補生成部106に転送する。次のステップs4−10で
は、文書領域画像Bを上記端子405を通して、文書領
域候補生成部105に転送する。さらに、ステップs4
−11では、現時刻画像Iを前時刻画像I’に変更す
る。つまり、全ての画素(x、y)において、次の式
(6)を行う。 I’(x,y)=I(x,y) …(6) その後、ステップs4−3に戻って同様の処理を画像が
入力されるたびに繰返して実行する。
【0085】ステップs4−5において、動き検出部4
01での差分量dがしきい値dA以下であった場合に
は、ステップs4−12に進む。ステップs4−12で
は、動作停止カウンタを1つ増やして、ステップs4−
13に進む。ステップs4−13では、動作停止カウン
タkがしきい値kAより大きいかどうかを調べる。も
し、kがしきい値kA以下の場合には、ステップs4−
3に戻り、前述の処理を繰返す。もし、kがしきい値k
Aよりも大きくなった場合には、所定時間以上動作が停
止したものとして、動作停止判定として、動き検出部4
01は停止信号を制御部404に転送して、ステップs
4−14に進む。本実施例ではkAを10としたが、こ
の値はどのようなものでも良い。
【0086】ステップs4−14では、制御部404は
動作停止検出と判定して、静止信号を動作候補生成部1
06と文書領域候補生成部105に送信すると共に、文
書領域決定部108を起動する。その後、ステップs4
−15に進んで、手文書分離部104を停止する。
【0087】次に、図10を参照すると、同図には、図
1中の動作候補生成部106の一実施例の詳細な構成が
示されている。また、図11には、図10に示されてい
る動作候補生成部106の動作のフローチャートが示さ
れている。
【0088】動作候補生成部106は、文書動作特徴検
出部601と手動作特徴検出部602と文書動き判定部
603とからなる。動作候補生成部106の動作は、例
えば、上記特願平11−110125号明細書中の文書
動作特徴検出部、手動作特徴検出部及びページ捲り文書
移動判定部の動作に相当する。これらについては先述し
た通りであり、当業者が容易に実施できる。
【0089】図7のステップs1−3の動作候補生成部
の初期化においては、図11のステップs6−1から処
理が開始され、まずステップs6−2を実行する。本実
施例では、文書動作として、右手ページ捲り、左手ペー
ジ捲り、右手文書移動、左手文書移動、それ以外の5種
類としているが、これ以外のものがあっても本質的に変
わりはない。この文書動作のスコアをここで初期化し
て、全て0の値にする。また、動作スコアを計算する上
で必要となる右手移動量(hvx1、hvy1)、左手
移動量(hvx2、hvy2)と文書移動量(bvx、
bvy)、文書面積BA、文書面積変化量BA’を初期
化して、全て0にする。また、右手及び左手の累積手移
動量(ax1,ay1),(ax2,ay2)を0にす
る。
【0090】次に、図7のステップs1−6において動
作候補生成部106を起動した後に、図11のステップ
s6−3からステップs6−15までを実施する。ま
ず、ステップs6−3において、手文書分離部104か
ら端子405を通して、手領域画像Hを読込み、手動作
特徴検出部602に転送する。続いて、ステップs6−
4に進み、手動作特徴検出部602において、手領域を
右手部と左手部に分離する。本実施例では、手領域の横
幅がしきい値3より大きい場合に、両手をまとめて手領
域として検出したものと見なして、横方向に半分に分離
する。その後、左半分及び右半分で別々に外接矩形を求
めて、それらの領域サイズの再計算を実施して、右側の
領域を右手領域、左側の領域を左手領域とする。
【0091】もし、初期の手領域の横方向のサイズがし
きい値3より小さい場合には、1つの領域を右手領域と
左手領域の両方とみなして以降の処理を実施する。本実
施例では、手領域判定のしきい値3を100画素とした
が、この値は本質的なものではない。また、手領域を右
手領域と左手領域に分離する方法に関しては、上記の方
法に限るものではない。
【0092】続いて、ステップs6−5に進んで、右手
領域の位置と左手領域の位置を求める。各手の領域の位
置とは、各領域内において最もy座標が小さくなる画
素、つまり最も上の画素の位置を手の位置とする。右手
位置を(hx1、hy1)として、左手位置を(hx
2、hy2)とする。
【0093】ステップs6−6では、両手の移動量を計
算する。前時刻での右手及び左手の位置をそれぞれ(p
hx1、phy1)、(phx2、phy2)として、
各手の移動量(hvx1、hvy1)、(hvx2、h
vy2)を次の式(7)に従って計算で求める。 hvx1=hx1−phx1 hvy1=hx1−phy1 hvx2=hx2−phx2 hvy2=hy2−phy2 …(7)
【0094】さらに、手動作特徴検出部602は求めた
移動量(hvx1、hvy1)、(hvx2、hvy
2)を文書動き判定部603に転送する。この計算後、
(hx1、hy1)を(phx1、phy1)に代入し
て記憶する。同様に、(hx2、hy2)を(phx
2、phy2)に代入して記憶する。さらに、ステップ
s6−6’では、累積手移動量を求める。つまり、右手
の累積手移動量(ax1,ay1)に右手移動量(hv
x1、hvy1)を加算する。また、左手の累積手移動
量(ax2,ay2)に左手移動量(hvx2、hvy
2)を加算する。
【0095】次に、ステップs6−7に進み、文書動作
特徴検出部601を起動する。まず、ステップs6−7
では、端子405を通して手文書分離部104から、文
書領域画像Bを読込む。次のステップs6−8では、文
書領域画像Bでの画素値1を持つ領域の最小外接矩形を
求める。
【0096】ステップs6−9で、文書動作特徴検出部
601は外接矩形の中心位置(Bx,By)を求める。
次に、ステップs6−10で、文書動作特徴検出部60
1は外接矩形の面積を求めて、BAとする。また、前時
刻での文書領域の外接矩形の面積をpBAとして、その
差を面積変化量BA’をBA−pBAなる計算に従って
求めて定める。さらに、文書動作特徴検出部601は、
前時刻での文書領域の位置(pBx,pBy)と現時刻
での位置(Bx,By)を用いて式(8)に従って、文
書移動量を求める。 bvx=Bx−pBx bvy=By−pBy …(8) この計算後、(Bx,By)を(pBx,pBy)に代
入して記憶する。
【0097】ステップs6−11において、文書動作特
徴検出部601は現時刻で求めた特徴(bvx、bv
y)、BA,BA’を文書動き判定部603に転送す
る。また、手動作特徴検出部602は、両手の移動量
(hvx1、hvy1)、(hvx2、hvy2)を文
書動き判定部603に転送する。文書動き判定部603
では、手動作特徴検出部602から入力された各手の動
作特徴と文書動作特徴検出部601から入力された文書
の動きに関する特徴から文書動作のスコアを求める。
【0098】まず、右手移動量(hvx1、hvy1)
と文書移動量(bvx、bvy)とから方向余弦t1を
求める。また、左手移動量(hvx2、hvy2)と文
書移動量(bvx、bvy)とから方向余弦t2を求め
る。
【0099】次に文書移動量(bvx、bvy)の各要
素の絶対値を比較して、|bvx|が|bvy|より大
きく、かつ面積変化量の絶対値|BA’|がしきい値4
より大きい場合に、ページ捲り動作と仮判定する。この
際に、上記t1がt2より大きい場合に、右手ページ捲
りスコアに1加える。上記t1がt2以下の場合には、
左手ページ捲りスコアに1加える。また、文書移動量
(bvx、bvy)の各要素の絶対値を比較して、|b
vx|が|bvy|以下であるか、または面積変化量の
絶対値|BA’|がしきい値4以下である場合に、文書
移動動作と仮判定する。この場合に、上記t1が上記t
2よりも大きい場合に、右手文書移動スコアに1加え
る。また、上記t1が上記t2以下の場合に、左手文書
移動スコアに1加える。
【0100】なお、本実施例では、しきい値4を10と
したがどのような値でも良い。さらに、本発明において
は、文書動作スコアの求め方は本質的な問題ではなく、
どのようなものでも良い。
【0101】次にステップs6−12に進んで、文書の
中心位置(Bx,By)、右手位置、左手位置を文書領
域候補生成部105に転送する。
【0102】続いて、ステップs6−13に進んで、手
文書分離部104から静止信号の入力があるかを調べ、
静止信号があった場合にはステップs6−14に進む。
静止信号がない場合には、ステップs6−3に戻って、
ステップs6−3からステップs6−13までを画像が
入力されるたびに、静止信号の入力があるまで繰返す。
静止信号を検出した場合には、ステップs6−14に進
んで、全ての動作スコアと累積手移動量を文書領域決定
部108に転送して、動作候補生成部106を停止す
る。
【0103】図12を参照すると、同図には、図1中に
示されている文書領域候補生成部105の一実施例の詳
細な構成が示されている。また、図13には、図12に
示されている文書領域候補生成部105の動作のフロー
チャートが示されている。
【0104】文書領域候補生成部105は、文書領域記
憶部501と動作文書領域判定部502と初期動作文書
領域記憶部503と初期動作文書領域判定部504から
なる。文書領域候補生成部105における文書領域記憶
部501、動作文書領域判定部502及び初期動作文書
領域判定部504の動作は、例えば、上記特願平11−
110125号明細書中の文書領域判定部の一部の動作
に相当する。これらについては先述した通りであり、当
業者が容易に実施できる。
【0105】図7のステップs1−3での初期化処理で
は、図13のステップs5−1から処理が開始され、ま
ずステップs5−2での文書領域記憶部501内のペー
ジ捲り領域画像Mと右手文書移動領域画像Rと左手文書
移動領域画像Lをクリアする。図7のステップs1−6
での文書領域候補生成部起動では、図13のステップs
5−3からステップs5−13までを実行する。
【0106】まずステップs5−3では、端子405を
通して、手文書分離部104から文書領域画像Bを読込
み、文書領域記憶部501に記憶する。この際に文書領
域画像の面積BAが始めてしきい値6を超えた時の文書領
域画像B を初期動作文書領域Boとして初期動作文書領
域記憶部503に記憶する。本実施例ではしきい値6の
値を50としたが、この値は本質的なものではなく、ど
のような値でも良い。
【0107】次にステップs5−4では、動作候補生成
部106から右手位置(hx1、hy1)と左手位置
(hx2、hy2)を読込み、右手位置(hx1、hy
1)をPrとして文書領域記憶部501に記憶する。ま
た、左手位置(hx2、hy2)をPlとして文書領域
記憶部501に記憶する。
【0108】ステップs5−5では、文書領域画像Bを
ページ捲り領域画像Mに加算して文書領域記憶部501
に記憶する。ここで画像同士の加算とは、同じ座標同士
の値を加算することになり、M(x,y)=M(x,
y)+B(x,y)を全ての(x、y)で実行すること
とする。
【0109】ステップs5−6では、前時刻での右手位
置Pr’が現時刻での右手位置Prになるように右手文
書移動領域画像Rを平行移動する。Pr’を(hx
1’、hy1’)とすると、次の式(9)で平行移動後
の右手文書移動領域画像Rを求める。 R(x,y)=R(x+hx1−hx1’、y+hy1−hy1’)…(9)
【0110】以上の計算を全ての(x、y)について実
施する。ステップs5−6の最後に、現時刻での右手位
置Prを前時刻右手位置Pr’に代入する。その後ステ
ップs5−7に進み、文書領域画像Bを右手文書移動領
域画像Rに加算して文書領域記憶部501に記憶する。
この加算の方法はステップs5−5と同じである。
【0111】ステップs5−8では、前時刻での左手位
置Pl’が現時刻での左手位置Plになるように左手文
書移動領域画像Lを平行移動する。Pl’を(hx
2’、hy2’)とすると、次の式(10)で平行移動
後の左手文書移動領域画像Lを求める。 L(x,y)=L(x+hx2−hx2’、y+hy2−hy2’)…(10)
【0112】以上の計算を全ての(x、y)について実
施する。ステップs5−8の最後に、現時刻での左手位
置Plを前時刻での左手位置Pl’に代入する。その後
ステップs5−9に進み、文書領域画像Bを左手文書移
動領域画像Lに加算して文書領域記憶部501に記憶す
る。この加算の方法はステップs5−5と同じである。
【0113】次にステップs5−10に進んで、手文書
分離部104から静止信号が入力されているかをチェッ
クする。静止信号がない場合には、ステップs5−3に
戻って、s5−3からs5−9までを繰返し実行する。
もし、静止信号があった場合には、ステップs5−11
に進んで、ページ捲り領域画像M、右手文書移動領域画
像R,左手文書移動領域画像Lを文書領域決定部108
に転送する。
【0114】また、ステップs5−12で、ページ捲り
領域画像Mを動作文書領域判定部502に転送し、Mか
ら文書領域位置を判定して、それを文書領域決定部10
8に転送する。Mから文書領域を判定するには、Mの画
素のうち、しきい値5を超える値を持つ画素の外接矩形
により定める。ただし、本実施例ではしきい値5を5と
したが、この値はどのような値でも良い。この手順によ
りページ捲り領域画像Mからページ捲り領域位置を求め
る。
【0115】また、右手文書移動領域画像Rを動作文書
領域判定部502に転送して、Rから文書領域位置を上
記Mの場合と同様にして判定して、それを文書領域決定
部108に転送する。さらに、左手文書移動領域画像L
を動作文書領域判定部502に転送して、Lから文書領
域位置を上記Mの場合と同様にして判定して、それを文
書領域決定部108に転送する。
【0116】次に、ステップs5−13において、初期
動作文書領域記憶部503から初期動作文書領域画像B
oを読出し、初期動作文書領域判定部504に転送し、
そこで外接矩形を求めて、初期動作文書領域として、文
書領域決定部108に転送する。その後ステップs5−
14に進んで文書領域候補生成部を停止する。
【0117】図14を参照すると、同図には、図1に示
されている文書領域決定部108と領域可能性検証部1
09の一実施例の詳細な構成が示されている。また、図
15には、図14に示されている文書領域決定部108
及び領域可能性検証部109の動作を示すフローチャー
トが示されている。文書領域決定部108は、図7のフ
ローチャートでは、ステップs1−8で起動される。
【0118】図15のステップs8−1でこれが起動さ
れた後に、ステップs8−2で、動作候補生成部106
で生成された右手ページ捲りスコアと右手の累積手移動
量を入力し、文書動作情報バッファ801に記憶する。
また、左手ページ捲りスコアと左手の累積手移動量を入
力し、文書動作情報バッファ801に記憶する。また、
右手文書移動スコアと右手の累積手移動量を入力し、文
書動作情報バッファ801に記憶する。また、左手文書
移動スコアと左手の累積手移動量を読込み、文書動作情
報バッファ801に記憶する。
【0119】次に、ステップs8−3に進んで、文書領
域候補生成部105からページ捲り領域位置を入力し
て、文書動作情報バッファ801に記憶する。また、文
書領域候補生成部105から右手文書移動領域位置を入
力して、文書動作情報バッファ801に記憶する。さら
に、文書領域候補生成部105から左手文書移動領域位
置を入力して、文書動作情報バッファ801に記憶す
る。また、初期動作文書領域判定部508から初期動作
文書領域の位置を入力して、決定制御部802に記憶す
る。
【0120】次に、ステップs8−4に進んで、文書領
域候補生成部105からページ捲り文書領域画像、右手
移動文書領域画像及び左手移動文書領域画像を取得す
る。次に、ステップs8−5からステップs8−11ま
でを、右手ページ捲り動作、左手ページ捲り動作、右手
文書移動動作、左手文書移動動作の4種類の文書動作に
ついて繰返し実行する。
【0121】まず、右手ページ捲り動作について実行す
る。決定制御部802は、ステップs8−6で文書動作
情報バッファ801から、ページ捲り領域画像とページ
捲り領域の位置、右手の累積手移動量を読出し、領域可
能性検証部109に転送する。また、決定制御部802
内に記憶している初期動作文書領域の位置を領域可能性
検証部109に転送する。その後、領域可能性検証部1
09を起動して、検証対象とした文書動作が全ての検証
ルールと不一致であったか、合致するルールがあったか
の結果を決定制御部802に転送する。
【0122】ステップs8−9で、領域可能性検証部1
09の出力が合致するルールがあったことを示すもので
ある場合には、ステップs8−11に進む。もし、領域
可能性検証部109の出力が、全ての検証ルールと不一
致であったことを示すものである場合には、ステップs
8−10に進み、決定制御部802は当該文書動作、こ
の場合には右手によるページ捲り動作に関する文書動作
スコアからしきい値7だけ減じて、再度文書動作情報バ
ッファ801に記憶する。本実施例では、しきい値7を
30としたがこの値はどのようなものでも良い。その
後、ステップs8−11に進む。
【0123】ステップs8−11では、全ての文書動作
について検証したかを調べる。以上の例では、右手によ
るページ捲り動作を調べただけなので、次にはステップ
s8−5に戻って、左手によるページ捲り動作について
検証を実施するために、ステップs8−5からステップ
s8−10までを実行して、結果の文書動作スコアを文
書動作情報バッファ801に記憶する。同様に、右手文
書移動と左手文書移動についてもステップs8−5から
ステップs8−10までを実行する。
【0124】全ての文書動作についての検証が終了した
後に、ステップs8−12に進み、決定制御部802
は、文書動作情報バッファ801から、それぞれの動作
スコアを読出し、最大値を選択する。最大値を与えた文
書動作を、動作開始から動作停止までの一連の動作に関
する文書動作の種類と決定する。ステップs8−13で
は、決定した文書動作に関する文書領域を文書動作情報
バッファ801から読出し、文書画像生成部109に転
送する。
【0125】次にステップs8−14に進んで、決定し
た文書動作、それに関する文書領域を文書領域マップ1
07に書込む。この際に、既に文書領域マップ107に
登録されている文書領域の順位には1を加えて、新しい
順位とし、新たに登録する文書領域の順位を1とする。
【0126】この終了後、ステップs8−15に進んで
文書領域決定部108と領域可能性検証部109の動作
を停止する。
【0127】次に、領域可能性検証部109の動作につ
いて、図16を用いて説明する。
【0128】図15のステップs8−6で領域可能性検
証部109が起動されると、図16のステップs9−1
からステップs9−2に進み、検証を行う文書動作の種
類を特定する。本説明では、文書動作の種類を文書動作
Dとする。本実施例では、文書動作Dは、右手ページ捲
り、左手ページ捲り、右手文書移動、左手文書移動のう
ちのいずれかであるが、これ以外でも本質的に何も変わ
りはない。
【0129】ステップs9−3で、文書領域決定部10
8の決定制御部802から、領域可能性検証部109
は、文書動作Dに関する文書領域画像、文書領域の位
置、累積手移動量を、初期動作文書領域Boの位置を読
込んで記憶する。
【0130】ステップs9−4では、累積手移動量から
手の動き方向を計算する。本実施例では、累積手移動量
は2次元のベクトル値として表現されているので、三角
関数を用いることで、方向角度に変換する。また、単純
に上方向、右方向、下方向、左方向と予め定めた方向の
種類に分類しても変わりはない。
【0131】次にステップs9−5に進み、文書動作D
がページ捲りに関するものの場合にはステップs9−6
に進む。もし、文書動作Dが文書移動に関するものの場
合には、ステップs9−7に進む。ステップs9−6で
は、当該文書動作の対象となった文書が、当該文書動作
が起こる前にあった領域を文書領域マップから求める。
ページ捲りでは文書はほとんど移動しないので、検出さ
れた文書動作D後の領域に近似または包含する領域を文
書領域マップ記憶部107から複数検出する。ここで便
宜的にそれらの集合をGとする。
【0132】また、「文書領域Aと文書領域Bが近似す
る」とは、文書領域Aの左上座標と文書領域Bの左上座
標の距離がしきい値8以下であり、かつ、文書領域Aの
右下座標と文書領域Bの右下座標の距離がしきい値8以
下であることとする。本実施例ではしきい値8を20と
したが、この値はどのようなものでも良い。
【0133】また、「文書領域Aが文書領域Bを包含す
る」とは、文書領域Aの左上座標(xA1,xA1)と
文書領域Bの左上座標(xB1,yB1)と文書領域A
の右下座標(xA2,yA2)と文書領域Bの右下座標
(xB2,yB2)に次の式(11)の関係がある場合
とする。 xA1−しきい値9<xB1 yA1−しきい値9<yB1 xA2+しきい値9>xB2 yA2+しきい値9>yB2 …(11) なお、本実施例ではしきい値9を10としたが、どのよ
うな値でも良い。
【0134】次に上記集合G中の文書領域から初期動作
領域Boを包含する文書領域を選択して集合Zとする。
ここでも「包含する」とは上記式(11)の定義を用い
る。集合Zを動作の元文書領域の集合として、ステップ
s9−8に進む。
【0135】ステップs9−7では、文書動作Dを文書
移動とした場合の当該文書動作が起こる前に当該文書あ
った領域を文書領域マップから求める。この場合は、文
書領域マップ記憶部107から、初期動作文書領域Bo
を包含する文書領域を検出して、その集合をZとする。
この場合も、「包含する」とは式(11)の定義を用い
た。集合Zを求めたら、それを動作の元文書領域の集合
として、ステップs9−8に進む。
【0136】ステップs9−8では、動作の元文書領域
の集合Zに含まれる個々の文書領域について、文書領域
マップ記憶部107から、当該文書領域の上に重なって
いる文書領域の集合を求める。当該文書領域をBiとし
た時に、それに重なる文書領域の集合をW(Bi)とす
る。
【0137】ステップs9−9では、動作の元文書領域
の集合Zに含まれる個々の文書領域について、文書領域
マップ記憶部107から、当該文書領域に関する動作の
種類を求める。当該文書領域をBiとした時に、それに
関する動作の種類をV(Bi)とする。
【0138】ステップs9−11では、文書動作Dとス
テップs9−4で求めた手の動き方向と領域の位置と
で、図4に示されている検証ルールの中で合致するかど
うかを調べるルールを選択する。さらに、上記動作の元
文書領域の集合Zから1つの要素Biを取り出し、動作
の元文書領域Biに対する全ての重なり領域W(Bi)
と動作の元文書領域Biの動作の種類とから、上記選択
した検証ルールの内で合致するルールがあるかを調べ
る。もし、合致する検証ルールがあった場合にはステッ
プs9−12を介してステップs9−13に進む。そし
て、検証ルールに合致したとして、その際の動作の元文
書領域Biを決定制御部805に転送して、領域可能性
検証部109を停止する。
【0139】もし、ステップs9−11を実行して合致
する検証ルールがなかった場合には、別の動作の元文書
領域を集合Zから選択してステップs9−11とステッ
プs9−12を実行する。もし、集合Z中の全ての動作
の元文書領域を検証しても合致する検証ルールを検出で
きなかった場合には、ステップs9−15に進んで、全
検証ルールに不一致という判定結果を決定制御部805
に転送して、領域可能性検証部109を停止する。
【0140】ステップs9−14では、全ての動作元領
域をチェックしたかを調べる。全ての動作元領域をチェ
ックするまでステップs9−10からステップs9−1
4までを実行する。
【0141】この説明では、検証を行う集合Z中の要素
は適当に選択しているが、集合Z中の要素である文書領
域は、文書領域マップにおいて順位がつけられており、
順位の番号が小さい文書領域から順に選択して、検証を
実施しても良い。
【0142】以上に、領域可能性検証部109の1つの
文書動作に関する動作を説明したが、図15のステップ
s8−5からステップs8−11に述べたように、領域
可能性検証部109は全ての文書動作について、上述の
手順を実行する。
【0143】次に、本願発明における文書領域決定部1
08の別の実施例を図14及び図17を用いて説明す
る。文書領域決定部108の構成は、前述の実施例と同
じであり、動作の手順が異なる。
【0144】図17に示されているステップs8−1か
らステップs8−15までは、図15に示されている文
書領域決定処理の手順と同じである。図15に示されて
いる文書領域決定処理の手順と異なるのはステップs8
−11の次に、ステップs8−16が入り、ステップs
8−11で全動作に関して検証ルールをチェックしたこ
とを確認した後に、ステップs8−16において合致し
た検証ルールがあったかを調べる。もし、合致した検証
ルールがあった場合には、図15に示されている文書領
域決定処理の手順と同様に、ステップs8−12に進ん
で、文書動作を決定する。
【0145】一方、ステップs8−16において合致す
る検証ルールがなかった場合にはステップs8−17に
進み、文書領域候補生成部105において生成した文書
領域の位置が不適切であったと見なして、ステップs8
−4で取得済みである各文書動作に関する文書領域画像
から再度文書領域の位置を判定して、ステップs8−5
に戻って再びステップs8−5からステップs8−11
までを全ての文書動作の種類について実施する。その後
ステップs8−16を実施して、合致する検証ルールが
あったか、既に一定回数文書領域の位置の判定を行って
いるかを調べて、条件に合った場合にはステップs8−
12に進む。もし、条件に合わなかった場合は、ステッ
プs8−16の条件を満たすまでステップs8−5から
ステップs8−11及びステップs8−17を繰返す。
【0146】ここで、ステップs8−17における文書
領域の再計算の一実施例として、図13のステップs5
−11からステップs5−13までの手順と同じものを
利用することができる。ただし、そこで利用する判定し
きい値であるしきい値5の値を変更する。一実施例とし
て、ステップs8−17を繰返すたびに、しきい値5の
値に2ずつ加えて変更するものが考えられる。この場
合、しきい値5の変更方法はどのようなものでも良い。
また、ステップs8−17を繰返すたびに、領域の判定
手段自体を変更する実施例も考えられる。
【0147】例えば、図13のステップs5−11から
ステップs5−13までの手順では、入力する文書領域
画像の各画素をしきい値5と比較して、しきい値5より
大きな値を持っている画素の集合の外接矩形を求める文
書領域の位置と定めた。このとき、しきい値5より大き
な値を持っている画素の集合から、連結領域を求め、そ
の最大面積を持つ連結領域の外接矩形を文書領域の位置
と定めることもできる。このように領域の位置の判定手
段を複数準備しておき、ステップs8−17を実行する
たびに、それらから1つを選択して実行する実施例も考
えられる。
【0148】なお、先述した図7の処理を実現するため
のプログラムを記録した記録媒体を用意し、これを用い
て図1の各部を制御すれば、上述と同様の文書画像取得
動作を行うことができることは明白である。この記録媒
体には、図1中に示されていない半導体メモリ、磁気デ
ィスク装置の他、種々の記録媒体を用いることができ
る。
【0149】また、同記録媒体に記録されているプログ
ラムによってコンピュータを制御すれば、上述と同様に
文書画像取得動作を行うことができることは明白であ
る。この記録媒体には、半導体メモリ、磁気ディスク装
置の他、種々の記録媒体を用いることができる。
【0150】
【発明の効果】以上説明したように本発明は、過去に検
出された文書領域と照らし合わせて矛盾のある動作の判
定を排除することにより、ページ捲りか文書移動かの判
定を間違えた場合にも、既に検出してある文書領域を加
味して、正しく文書動作の判定を実施できるという効果
がある。
【0151】また、過去に検出された文書領域と照らし
合わせて矛盾のある動作の判定を排除することにより、
ありえない文書領域の判定結果を検出して、文書領域の
再検出を行い、文書領域マップ記憶手段と領域可能性検
証部で受理できる、それらしい領域を選定できるため、
文書の領域を間違えて検出した場合にも、文書領域を再
検出して、ありえそうな領域を検出できるという効果が
ある。
【図面の簡単な説明】
【図1】本発明の実施の一形態による文書画像取得装置
の構成を示すブロック図である。
【図2】文書領域マップの一例を示す図である。
【図3】文書領域マップの一例を示す図である。
【図4】検証ルールの例を示す図である。
【図5】文書動作と検出した文書領域と当該動作の元文
書領域の説明図である。
【図6】動作の元文書領域とその上に重なる文書領域の
説明図である。
【図7】本願発明の文書画像取得装置の動作を示すフロ
ーチャートである。
【図8】手文書分離部の構成を示す図である。
【図9】手文書分離部の動作を示すフローチャートであ
る。
【図10】動作候補生成部の構成を示す図である。
【図11】動作候補生成部の動作を示すフローチャート
である。
【図12】文書領域候補生成部の構成を示す図である。
【図13】文書領域候補生成部の動作を示すフローチャ
ートである。
【図14】文書領域決定部の構成を示す図である。
【図15】文書領域決定部の動作を示すフローチャート
である。
【図16】領域可能性検証部の動作を示すフローチャー
トである。
【図17】文書領域決定部の別の動作を示すフローチャ
ートである。
【図18】文書画像取得装置の外観を示す図である。
【図19】従来の文書画像取得装置の構成を示すブロッ
ク図である。
【図20】画像入力部によって入力される1枚の画像の
例を示す図である。
【図21】画像入力部によって入力される画像の構成を
示す図である。
【符号の説明】
101 画像入力部 102、202 文書画像取得部 103 画像記憶部 104 手文書分離部 105 文書領域候補生成部 106 動作候補生成部 107 文書領域マップ記憶部 108、208 文書領域決定部 109 領域可能性検証部部 110 文書画像生成部 111、112、405 端子 303 文書 304 手 401 動き検出部 402 手領域検出部 403 文書領域検出部 404 制御部 501 文書領域記憶部 502 動作文書領域判定部 503 初期動作文書領域記憶部 504 初期動作文書領域判定部 601 文書動作特徴検出部 602 手動作特徴検出部 603 文書動き判定部 801 文書動作情報バッファ 802 決定制御部
フロントページの続き (56)参考文献 特開 平10−162134(JP,A) 特開 平10−285334(JP,A) 特開 平10−304145(JP,A) 中川忠勝外2名,デスク映像のシーン 解析による文書管理,電子情報通信学会 技術研究報告PRMU98−150〜175, 1998年12月18日,Vol. 98, N o. 490,pp. 25−32 (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 - 7/60 G06K 9/00 - 9/82 H04N 1/40 H04N 5/222 - 5/257

Claims (21)

    (57)【特許請求の範囲】
  1. 【請求項1】 非接触型の画像入力装置を用いて一定時
    間間隔で画像を入力し、この入力した画像から文書画像
    を取得する文書画像取得装置であって、過去に検出し
    得した文書画像が入力画像中のどこに写っているかを記
    憶する文書領域マップ記憶部と、前記画像入力装置から
    入力された画像中から新たな文書を検出する文書領域候
    補生成部と、その新たな文書領域を発生せしめるに至っ
    た文書の動きの候補を検出する動作候補生成部と、前記
    文書領域候補生成部から出力される文書領域の特徴と、
    前記動作候補生成部から出力される動作の種類とその特
    徴量と、前記文書領域マップ記憶部に記憶した過去に検
    出した文書画像の特徴とを参照して、検出された文書領
    域の妥当性を判定する領域可能性検証部と、前記領域可
    能性検証部での判定結果から新たに検出した文書の領域
    を決定する文書領域決定部と、前記文書領域決定部の出
    力から検出した文書画像を生成する文書画像生成部とを
    含むことを特徴とする文書画像取得装置。
  2. 【請求項2】 非接触型の画像入力装置を用いて一定時
    間間隔で画像を入力し、この入力した画像から文書画像
    を取得する文書画像取得装置であって、過去に検出し
    得した文書画像が入力画像中のどこに写っているかを記
    憶しさらにその文書を出現させるに至った動作の種類を
    保持する文書領域マップ記憶部と、前記画像入力装置か
    ら入力された画像中から新たな文書を検出する文書領域
    候補生成部と、その新たな文書領域を発生せしめるに至
    った文書の動きの候補を検出する動作候補生成部と、前
    記文書領域候補生成部から出力される文書領域の特徴
    と、前記動作候補生成部から出力される動作の種類とそ
    の特徴量と、前記文書領域マップ記憶部に記憶した過去
    に検出した文書画像の特徴とを参照して、検出された文
    書領域の妥当性を判定する領域可能性検証部と、前記領
    域可能性検証部での判定結果から新たに検出した文書の
    領域を決定する文書領域決定部と、前記文書領域決定部
    の出力から検出した文書画像を生成する文書画像生成部
    とを含むことを特徴とする文書画像取得装置。
  3. 【請求項3】 非接触型の画像入力装置を用いて一定時
    間間隔で画像を入力し、この入力した画像から文書画像
    を取得する文書画像取得装置であって、過去に検出し
    得した文書画像が入力画像中のどこに写っているかを記
    憶しさらにその文書を出現させるに至った動作の種類お
    よびその重なり順位を保持する文書領域マップ記憶部
    と、前記画像入力装置から入力された画像中から新たな
    文書を検出する文書領域候補生成部と、その新たな文書
    領域を発生せしめるに至った文書の動きの候補を検出す
    る動作候補生成部と、前記文書領域候補生成部から出力
    される文書領域の特徴と、前記動作候補生成部から出力
    される動作の種類とその特徴量と、前記文書領域マップ
    記憶部に記憶した過去に検出した文書画像の特徴とを参
    照して、検出された文書領域の妥当性を判定する領域可
    能性検証部と、前記領域可能性検証部での判定結果から
    新たに検出した文書の領域を決定する文書領域決定部
    と、前記文書領域決定部の出力から検出した文書画像を
    生成する文書画像生成部とを含むことを特徴とする文書
    画像取得装置。
  4. 【請求項4】 非接触型の画像入力装置を用いて一定時
    間間隔で画像を入力し、この入力した画像から文書画像
    を取得する文書画像取得装置であって、過去に検出し
    得した文書画像が入力画像中のどこに写っているかを記
    憶する文書領域マップ記憶部と、前記画像入力装置から
    入力された画像中から新たな文書を検出する文書領域候
    補生成部と、その新たな文書領域を発生せしめるに至っ
    た文書の動きの候補を検出する動作候補生成部と、前記
    文書領域候補生成部から出力される文書領域の特徴と、
    前記動作候補生成部から出力される動作の種類とその特
    徴量と、前記文書領域マップ記憶部に記憶した過去に検
    出した文書画像の特徴とを参照して、検出された文書領
    域の妥当性を判定する領域可能性検証部と、前記領域可
    能性検証部での判定結果から新たに検出した文書の領域
    を決定する文書領域決定部と、前記文書領域決定部の出
    力から検出した文書画像を生成する文書画像生成部とを
    含み、前記文書領域決定部は前記領域可能性検証部にお
    いて合致するルールがなかった場合に前記文書の領域の
    再検出を実行することを特徴とする文書画像取得装置。
  5. 【請求項5】 非接触型の画像入力装置を用いて一定時
    間間隔で画像を入力し、この入力した画像から文書画像
    を取得する文書画像取得装置であって、過去に検出し
    得した 文書画像が入力画像中のどこに写っているかを記
    憶しさらにその文書を出現させるに至った動作の種類お
    よびその重なり順位を保持する文書領域マップ記憶部
    と、前記画像入力装置から入力された画像中から新たな
    文書を検出する文書領域候補生成部と、その新たな文書
    領域を発生せしめるに至った文書の動きの候補を検出す
    る動作候補生成部と、前記文書領域候補生成部から出力
    される文書領域の特徴と、前記動作候補生成部から出力
    される動作の種類とその特徴量と、前記文書領域マップ
    記憶部に記憶した過去に検出した文書画像の特徴とを参
    照して、検出された文書領域の妥当性を判定する領域可
    能性検証部と、前記領域可能性検証部での判定結果から
    新たに検出した文書の領域を決定する文書領域決定部
    と、前記文書領域決定部の出力から検出した文書画像を
    生成する文書画像生成部とを含み、前記文書画像生成部
    は新たに検出した文書の領域を出力すると共に、既に検
    出した文書の領域も出力することを特徴とする文書画像
    取得装置。
  6. 【請求項6】 非接触型の画像入力装置を用いて一定時
    間間隔で画像を入力し、この入力した画像から文書画像
    を取得する文書画像取得装置であって、過去に検出し
    得した文書画像が入力画像中のどこに写っているかを記
    憶しさらにその文書を出現させるに至った動作の種類お
    よびその重なり順位を保持する文書領域マップ記憶部
    と、前記画像入力装置から入力された画像中から新たな
    文書を検出する文書領域候補生成部と、その新たな文書
    領域を発生せしめるに至った文書の動きの候補を検出す
    る動作候補生成部と、前記文書領域候補生成部から出力
    される文書領域の特徴と、前記動作候補生成部から出力
    される動作の種類とその特徴量と、前記文書領域マップ
    記憶部に記憶した過去に検出した文書画像の特徴とを参
    照して、検出された文書領域の妥当性を判定する領域可
    能性検証部と、前記領域可能性検証部での判定結果から
    新たに検出した文書の領域を決定する文書領域決定部
    と、前記文書領域決定部の出力から検出した文書画像を
    生成する文書画像生成部とを含み、前記文書画像生成部
    は新たに検出した文書の領域を出力すると共に、その文
    書の領域の近辺に存在する既に検出した文書の領域も出
    力することを特徴とする文書画像取得装置。
  7. 【請求項7】 非接触型の画像入力装置を用いて一定時
    間間隔で画像を入力し、この入力した画像から文書画像
    を取得する文書画像取得装置であって、過去に検出し
    得した文書画像が入力画像中のどこに写っているかを記
    憶しさらにその文書を出現させるに至った動作の種類お
    よびその重なり順位を保持する文書領域マップ記憶部
    と、前記画像入力装置から入力された画像中から新たな
    文書を検出する文書領域候補生成部と、その新たな文書
    領域を発生せしめるに至った文書の動きの候補を検出す
    る動作候補生成部と、前記文書領域候補生成部から出力
    される文書領域の特徴と、前記動作候補生成部から出力
    される動作の種類とその特徴量と、前記文書領域マップ
    記憶部に記憶した過去に検出した文書画像の特徴とを参
    照して、検出された文書領域の妥当性を判定する領域可
    能性検証部と、前記領域可能性検証部での判定結果から
    新たに検出した文書の領域を決定する文書領域決定部
    と、前記文書領域決定部の出力から検出した文書画像を
    生成する文書画像生成部とを含み、前記文書画像生成部
    は新たに検出した文書の領域を出力すると共に、その文
    書の領域が上に重なった既検出文書の領域も出力する
    とを特徴とする文書画像取得装置。
  8. 【請求項8】 非接触型の画像入力装置を用いて一定時
    間間隔で画像を入力し、この入力した画像から文書画像
    を取得する文書画像取得方法であって、過去に検出し
    得した文書画像が入力画像中のどこに写っているかを記
    憶する文書領域マップ記憶ステップと、前記画像入力装
    置から入力された画像中から新たな文書を検出する文書
    領域候補生成ステップと、その新たな文書領域を発生せ
    しめるに至った文書の動きの候補を検出する動作候補生
    成ステップと、前記文書領域候補生成ステップから出力
    される文書領域の特徴と、前記動作候補生成ステップか
    ら出力される動作の種類とその特徴量と、前記文書領域
    マップ記憶ステップに記憶した過去に検出した文書画像
    の特徴とを参照して、検出された文書領域の妥当性を判
    定する領域可能性検証ステップと、前記領域可能性検証
    ステップでの判定結果から新たに検出した文書の領域を
    決定する文書領域決定ステップと、前記文書領域決定ス
    テップの出力から検出した文書画像を生成する文書画像
    生成ステップとを含むことを特徴とする文書画像取得方
    法。
  9. 【請求項9】 非接触型の画像入力装置を用いて一定時
    間間隔で画像を入力し、この入力した画像から文書画像
    を取得する文書画像取得方法であって、過去に検出し
    得した文書画像が入力画像中のどこに写っているかを記
    憶しさらにその文書を出現させるに至った動作の種類を
    保持する文書領域マップ記憶ステップと、前記画像入力
    装置から入力された画像中から新たな文書を検出する文
    書領域候補生成ステップと、その新たな文書領域を発生
    せしめるに至った文書の動きの候補を検出する動作候補
    生成ステップと、前記文書領域候補生成ステップから出
    力される文書領域の特徴と、前記動作候補生成ステップ
    から出力される動作の種類とその特徴量と、前記文書領
    域マップ記憶部に記憶した過去に検出した文書画像の特
    徴とを参照して、検出された文書領域の妥当性を判定す
    る領域可能性検証ステップと、前記領域可能性検証ステ
    ップでの判定結果から新たに検出した文書の領域を決定
    する文書領域決定ステップと、前記文書領域決定ステッ
    プの出力から検出した文書画像を生成する文書画像生成
    ステップとを含むことを特徴とする文書画像取得方法。
  10. 【請求項10】 非接触型の画像入力装置を用いて一定
    時間間隔で画像を入力し、この入力した画像から文書画
    像を取得する文書画像取得方法であって、過去に検出し
    取得した文書画像が入力画像中のどこに写っているかを
    記憶しさらにその文書を出現させるに至った動作の種類
    およびその重なり順位を保持する文書領域マップ記憶ス
    テップと、前記画像入力装置から入力された画像中から
    新たな文書を検出する文書領域候補生成ステップと、そ
    の新たな文書領域を発生せしめるに至った文書の動きの
    候補を検出する動作候補生成ステップと、前記文書領域
    候補生成ステップから出力される文書領域の特徴と、前
    記動作候補生成ステップから出力される動作の種類とそ
    の特徴量と、前記文書領域マップ記憶ステップに記憶し
    た過去に検出した文書画像の特徴とを参照して、検出さ
    れた文書領域の妥当性を判定する領域可能性検証ステッ
    プと、前記領域可能性検証ステップでの判定結果から新
    たに検出した文書の領域を決定する文書領域決定ステッ
    プと、前記文書領域決定ステップの出力から検出した文
    書画像を生成する文書画像生成ステップとを含むことを
    特徴とする文書画像取得方法。
  11. 【請求項11】 非接触型の画像入力装置を用いて一定
    時間間隔で画像を入力し、この入力した画像から文書画
    像を取得する文書画像取得方法であって、過去に検出し
    取得した文書画像が入力画像中のどこに写っているかを
    記憶する文書領域マップ記憶ステップと、前記画像入力
    装置から入力された画像中から新たな文書を検出する文
    書領域候補生成ステップと、その新たな文書領域を発生
    せしめるに至った文書の動きの候補を検出する動作候補
    生成ステップと、前記文書領域候補生成ステップから出
    力される文書領域の特徴と、前記動作候補生成ステップ
    から出力される動作の種類とその特徴量と、前記文書領
    域マップ記憶ステップに記憶した過去に検出した文書画
    像の特徴とを参照して、検出された文書領域の妥当性を
    判定する領域可能性検証ステップと、前記領域可能性検
    証ステップでの判定結果から新たに検出した文書の領域
    を決定する文書領域決定ステップと、前記文書領域決定
    ステップの出力から検出した文書画像を生成する文書画
    像生成ステップとを含み、前記文書領域決定ステップは
    前記領域可能性検証ステップにおいて合致するルールが
    なかった場合に前記文書の領域の再検出を実行すること
    を特徴とする文書画像取得方法。
  12. 【請求項12】 非接触型の画像入力装置を用いて一定
    時間間隔で画像を入力し、この入力した画像から文書画
    像を取得する文書画像取得方法であって、過去に検出し
    取得した文書画像が入力画像中のどこに写っているかを
    記憶しさらにその文書を出現させるに至った動作の種類
    およびその重なり順位を保持する文書領域マップ記憶ス
    テップと、前記画像入力装置から入力された画像中から
    新たな文書を検出する文書領域候補生成ステップと、そ
    の新たな文書領域を発生せしめるに至った文書の動きの
    候補を検出する動作候補生成ステップと、前記文書領域
    候補生成ステップから出力される文書領域の特徴と、前
    記動作候補生成ステップから出力される動作の種類とそ
    の特徴量と、前記文書領域マップ記憶ステップに記憶し
    た過去に検出した文書画像の特徴とを参照して、検出さ
    れた文書領域の妥当性を判定する領域可能性検証ステッ
    プと、前記領域可能性検証ステップでの判定結果から新
    たに検出した文書の領域を決定する文書領域決定ステッ
    プと、前記文書領域決定ステップの出力から検出した文
    書画像を生成する文書画像生成ステップとを含み、前記
    文書画像生成ステップは新たに検出した文書の領域を出
    力すると共に、既に検出した文書の領域 も出力すること
    を特徴とする文書画像取得方法。
  13. 【請求項13】 非接触型の画像入力装置を用いて一定
    時間間隔で画像を入力し、この入力した画像から文書画
    像を取得する文書画像取得方法であって、過去に検出し
    取得した文書画像が入力画像中のどこに写っているかを
    記憶しさらにその文書を出現させるに至った動作の種類
    およびその重なり順位を保持する文書領域マップ記憶ス
    テップと、前記画像入力装置から入力された画像中から
    新たな文書を検出する文書領域候補生成ステップと、そ
    の新たな文書領域を発生せしめるに至った文書の動きの
    候補を検出する動作候補生成ステップと、前記文書領域
    候補生成ステップから出力される文書領域の特徴と、前
    記動作候補生成ステップから出力される動作の種類とそ
    の特徴量と、前記文書領域マップ記憶ステップに記憶し
    た過去に検出した文書画像の特徴とを参照して、検出さ
    れた文書領域の妥当性を判定する領域可能性検証ステッ
    プと、前記領域可能性検証ステップでの判定結果から新
    たに検出した文書の領域を決定する文書領域決定ステッ
    プと、前記文書領域決定ステップの出力から検出した文
    書画像を生成する文書画像生成ステップとを含み、前記
    文書画像生成ステップは新たに検出した文書の領域を出
    力すると共に、その文書の領域の近辺に存在する既に検
    出した文書の領域も出力することを特徴とする文書画像
    取得方法。
  14. 【請求項14】 非接触型の画像入力装置を用いて一定
    時間間隔で画像を入力し、この入力した画像から文書画
    像を取得する文書画像取得方法であって、過去に検出し
    取得した文書画像が入力画像中のどこに写っているかを
    記憶しさらにその文書を出現させるに至った動作の種類
    およびその重なり順位を保持する文書領域マップ記憶ス
    テップと、前記画像入力装置から入力された画像中から
    新たな文書を検出する文書領域候補生成ステップと、そ
    の新たな文書領域を発生せしめるに至った文書の動きの
    候補を検出する動作候補生成ステップと、前記文書領域
    候補生成ステップから出力される文書領域の特徴と、前
    記動作候補生成ステップから出力される動作の種類とそ
    の特徴量と、前記文書領域マップ記憶ステップに記憶し
    た過去に検出した文書画像の特徴とを参照して、検出さ
    れた文書領域の妥当性を判定する領域可能性検証ステッ
    プと、前記領域可能性検証ステップでの判定結果から新
    たに検出した文書の領域を決定する文書領域決定ステッ
    プと、前記文書領域決定ステップの出力から検出した文
    書画像を生成する文書画像生成ステップとを含み、前記
    文書画像生成ステップは新たに検出した文書の領域を出
    力すると共に、その文書の領域が上に重なった既検出文
    書の領域も出力することを特徴とする文書画像取得方
    法。
  15. 【請求項15】 コンピュータによって非接触型の画像
    入力装置を制御して一定時間間隔で画像を入力し、この
    入力した画像から文書画像を取得する文書画像取得プロ
    グラムを記録した記録媒体であって、該プログラムは
    去に検出し取得した文書画像が入力画像中のどこに写っ
    ているかを記憶する文書領域マップ記憶ステップと、前
    記画像入力装置から入力された画像中から新たな文書を
    検出する文書領域候補生成ステップと、その新たな文書
    領域を発生せしめるに至った文書の動きの候補を検出す
    る動作候補生成ステップと、前記文書領域候補生成ステ
    ップから出力される文書領域の特徴と、前記動作候補生
    成ステップから出力される動作の種類とその特徴量と、
    前記文書領域マップ記憶ステップに記憶した過去に検出
    した文書画像の特徴とを参照して、検出された文書領域
    の妥当性を判定する領域可能性検証ステップと、前記領
    域可能性検証ステップでの判定結果から新たに検出した
    文書の領域を決定する文書領域決定ステップと、前記文
    書領域決定ステップの出力から検出した文書画像を生成
    する文書画像生成ステップとを含むことを特徴とする記
    録媒体。
  16. 【請求項16】 コンピュータによって非接触型の画像
    入力装置を制御して一定時間間隔で画像を入力し、この
    入力した画像から文書画像を取得する文書画像取得プロ
    グラムを記録した記録媒体であって、該プログラムは
    去に検出し取得した文書画像が入力画像中のどこに写っ
    ているかを記憶しさらにその文書を出現させるに至った
    動作の種類を保持する文書領域マップ記憶ステップと、
    前記画像入力装置から入力された画像中から新たな文書
    を検出する文書領域候補生成ステップと、その新たな文
    書領域を発生せしめるに至った文書の動きの候補を検出
    する動作候補生成ステップと、前記文書領域候補生成ス
    テップから出力される文書領域の特徴と、前記動作候補
    生成ステップから出力される動作の種類 とその特徴量
    と、前記文書領域マップ記憶部に記憶した過去に検出し
    た文書画像の特徴とを参照して、検出された文書領域の
    妥当性を判定する領域可能性検証ステップと、前記領域
    可能性検証ステップでの判定結果から新たに検出した文
    書の領域を決定する文書領域決定ステップと、前記文書
    領域決定ステップの出力から検出した文書画像を生成す
    る文書画像生成ステップとを含むことを特徴とする記録
    媒体。
  17. 【請求項17】 コンピュータによって非接触型の画像
    入力装置を制御して一定時間間隔で画像を入力し、この
    入力した画像から文書画像を取得する文書画像取得プロ
    グラムを記録した記録媒体であって、該プログラムは
    去に検出し取得した文書画像が入力画像中のどこに写っ
    ているかを記憶しさらにその文書を出現させるに至った
    動作の種類およびその重なり順位を保持する文書領域マ
    ップ記憶ステップと、前記画像入力装置から入力された
    画像中から新たな文書を検出する文書領域候補生成ステ
    ップと、その新たな文書領域を発生せしめるに至った文
    書の動きの候補を検出する動作候補生成ステップと、前
    記文書領域候補生成ステップから出力される文書領域の
    特徴と、前記動作候補生成ステップから出力される動作
    の種類とその特徴量と、前記文書領域マップ記憶ステッ
    プに記憶した過去に検出した文書画像の特徴とを参照し
    て、検出された文書領域の妥当性を判定する領域可能性
    検証ステップと、前記領域可能性検証ステップでの判定
    結果から新たに検出した文書の領域を決定する文書領域
    決定ステップと、前記文書領域決定ステップの出力から
    検出した文書画像を生成する文書画像生成ステップとを
    含むことを特徴とする記録媒体。
  18. 【請求項18】 コンピュータによって非接触型の画像
    入力装置を制御して一定時間間隔で画像を入力し、この
    入力した画像から文書画像を取得する文書画像取得プロ
    グラムを記録した記録媒体であって、該プログラムは
    去に検出し取得した文書画像が入力画像中のどこに写っ
    ているかを記憶する文書領域マップ記憶ステップと、前
    記画像入力装置から入力された画像中から新たな文書を
    検出する文書領域候補生成ステップと、その新たな文書
    領域を発生せしめるに至った文書の動きの候補を検出す
    る動作候補生成ステップと、前記文書領域候補生成ステ
    ップから出力される文書領域の特徴と、前記動作候補生
    成ステップから出力される動作の種類とその特徴量と、
    前記文書領域マップ記憶ステップに記憶した過去に検出
    した文書画像の特徴とを参照して、検出された文書領域
    の妥当性を判定する領域可能性検証ステップと、前記領
    域可能性検証ステップでの判定結果から新たに検出した
    文書の領域を決定する文書領域決定ステップと、前記文
    書領域決定ステップの出力から検出した文書画像を生成
    する文書画像生成ステップとを含み、前記文書領域決定
    ステップは前記領域可能性検証ステップにおいて合致す
    るルールがなかった場合に前記文書の領域の再検出を実
    行することを特徴とする記録媒体。
  19. 【請求項19】 コンピュータによって非接触型の画像
    入力装置を制御して一定時間間隔で画像を入力し、この
    入力した画像から文書画像を取得する文書画像取得プロ
    グラムを記録した記録媒体であって、該プログラムは
    去に検出し取得した文書画像が入力画像中のどこに写っ
    ているかを記憶しさらにその文書を出現させるに至った
    動作の種類およびその重なり順位を保持する文書領域マ
    ップ記憶ステップと、前記画像入力装置から入力された
    画像中から新たな文書を検出する文書領域候補生成ステ
    ップと、その新たな文書領域を発生せしめるに至った文
    書の動きの候補を検出する動作候補生成ステップと、前
    記文書領域候補生成ステップから出力される文書領域の
    特徴と、前記動作候補生成ステップから出力される動作
    の種類とその特徴量と、前記文書領域マップ記憶ステッ
    プに記憶した過去に検出した文書画像の特徴とを参照し
    て、検出された文書領域の妥当性を判定する領域可能性
    検証ステップと、前記領域可能性検証ステップでの判定
    結果から新たに検出した文書の領域を決定する文書領域
    決定ステップと、前記文書領域決定ステップの出力から
    検出した文書画像を生成する文書画像生成ステップとを
    含み、前記文書画像生成ステップは新たに検出した文書
    の領域を出力すると共に、既に検出した文書の領域も出
    力することを特徴とする記録媒体。
  20. 【請求項20】 コンピュータによって非接触型の画像
    入力装置を制御して一定時間間隔で画像を入力し、この
    入力した画像から文書画像を取得する文書画像取得プロ
    グラムを記録した記録媒体であって、該プログラムは
    去に検出し取得した文書画像が入力画像 中のどこに写っ
    ているかを記憶しさらにその文書を出現させるに至った
    動作の種類およびその重なり順位を保持する文書領域マ
    ップ記憶ステップと、前記画像入力装置から入力された
    画像中から新たな文書を検出する文書領域候補生成ステ
    ップと、その新たな文書領域を発生せしめるに至った文
    書の動きの候補を検出する動作候補生成ステップと、前
    記文書領域候補生成ステップから出力される文書領域の
    特徴と、前記動作候補生成ステップから出力される動作
    の種類とその特徴量と、前記文書領域マップ記憶ステッ
    プに記憶した過去に検出した文書画像の特徴とを参照し
    て、検出された文書領域の妥当性を判定する領域可能性
    検証ステップと、前記領域可能性検証ステップでの判定
    結果から新たに検出した文書の領域を決定する文書領域
    決定ステップと、前記文書領域決定ステップの出力から
    検出した文書画像を生成する文書画像生成ステップとを
    含み、前記文書画像生成ステップは新たに検出した文書
    の領域を出力すると共に、その文書の領域の近辺に存在
    する既に検出した文書の領域も出力することを特徴とす
    る記録媒体。
  21. 【請求項21】 コンピュータによって非接触型の画像
    入力装置を制御して一定時間間隔で画像を入力し、この
    入力した画像から文書画像を取得する文書画像取得プロ
    グラムを記録した記録媒体であって、該プログラムは
    去に検出し取得した文書画像が入力画像中のどこに写っ
    ているかを記憶しさらにその文書を出現させるに至った
    動作の種類およびその重なり順位を保持する文書領域マ
    ップ記憶ステップと、前記画像入力装置から入力された
    画像中から新たな文書を検出する文書領域候補生成ステ
    ップと、その新たな文書領域を発生せしめるに至った文
    書の動きの候補を検出する動作候補生成ステップと、前
    記文書領域候補生成ステップから出力される文書領域の
    特徴と、前記動作候補生成ステップから出力される動作
    の種類とその特徴量と、前記文書領域マップ記憶ステッ
    プに記憶した過去に検出した文書画像の特徴とを参照し
    て、検出された文書領域の妥当性を判定する領域可能性
    検証ステップと、前記領域可能性検証ステップでの判定
    結果から新たに検出した文書の領域を決定する文書領域
    決定ステップと、前記文書領域決定ステップの出力から
    検出した文書画像を生成する文書画像生成ステップとを
    含み、前記文書画像生成ステップは新たに検出した文書
    の領域を出力すると共に、その文書の領域が上に重なっ
    た既検出文書の領域も出力することを特徴とする記録媒
    体。
JP33217399A 1999-11-24 1999-11-24 文書画像取得装置、取得方法、取得プログラム記録媒体 Expired - Fee Related JP3508658B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33217399A JP3508658B2 (ja) 1999-11-24 1999-11-24 文書画像取得装置、取得方法、取得プログラム記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33217399A JP3508658B2 (ja) 1999-11-24 1999-11-24 文書画像取得装置、取得方法、取得プログラム記録媒体

Publications (2)

Publication Number Publication Date
JP2001148010A JP2001148010A (ja) 2001-05-29
JP3508658B2 true JP3508658B2 (ja) 2004-03-22

Family

ID=18251986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33217399A Expired - Fee Related JP3508658B2 (ja) 1999-11-24 1999-11-24 文書画像取得装置、取得方法、取得プログラム記録媒体

Country Status (1)

Country Link
JP (1) JP3508658B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4407244B2 (ja) * 2003-11-11 2010-02-03 ソニー株式会社 ロボット装置及びその物体学習方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
中川忠勝外2名,デスク映像のシーン解析による文書管理,電子情報通信学会技術研究報告PRMU98−150〜175,1998年12月18日,Vol. 98, No. 490,pp. 25−32

Also Published As

Publication number Publication date
JP2001148010A (ja) 2001-05-29

Similar Documents

Publication Publication Date Title
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
JP3475849B2 (ja) 文書画像取得装置および文書画像取得方法
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US5091964A (en) Apparatus for extracting a text region in a document image
CN111126266B (zh) 文本处理方法、文本处理***、设备及介质
CN114419632A (zh) 一种ocr训练样本生成方法、装置及***
JPH032979A (ja) 画像修正方法及び装置
JP3508658B2 (ja) 文書画像取得装置、取得方法、取得プログラム記録媒体
CN115019324A (zh) 文本扫描的交互方法、装置、计算机设备和存储介质
JP2006227824A (ja) 図面認識方法および装置
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JPH05324830A (ja) 画像中の物体輪郭追跡方法および輪郭抽出装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP2908495B2 (ja) 文字画像抽出装置
CN114663414B (zh) 一种基于unet卷积神经网络的岩矿识别提取***及方法
JP2002170077A (ja) 文字認識装置及び文字認識方法
CN117953514A (zh) 一种图像中校对符号的检测和语义还原方法、***
JP2023042451A (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JPH03269689A (ja) 文書読み取り装置
JPH0689328A (ja) 画像編集装置
CN117893388A (zh) 水印识别方法及装置
JPH08221518A (ja) 光学文字読取装置
KR20230068672A (ko) 전자 회로도 영상의 자동인식 및 네트리스트 변환 방법
JPH0696274A (ja) 文字等の認識方法
JPH0271379A (ja) 画像処理装置

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031215

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080109

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090109

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100109

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110109

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110109

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130109

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130109

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees