JP2001034763A - 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法 - Google Patents

文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法

Info

Publication number
JP2001034763A
JP2001034763A JP2000053079A JP2000053079A JP2001034763A JP 2001034763 A JP2001034763 A JP 2001034763A JP 2000053079 A JP2000053079 A JP 2000053079A JP 2000053079 A JP2000053079 A JP 2000053079A JP 2001034763 A JP2001034763 A JP 2001034763A
Authority
JP
Japan
Prior art keywords
document
title
document image
tag information
character size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000053079A
Other languages
English (en)
Inventor
Hirosuke Monobe
裕亮 物部
Atsutsugu Hirose
篤嗣 広瀬
Akito Umebayashi
明人 梅林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000053079A priority Critical patent/JP2001034763A/ja
Publication of JP2001034763A publication Critical patent/JP2001034763A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 文書画像からタイトル領域やユーザが付した
マークを抽出して文書タグ情報として利用する。 【解決手段】 先ず、タイトル領域抽出手段が所定の抽
出判定値より大きい領域平均文字サイズの領域をタイト
ル領域として抽出する。これにより1つの文書画像から
複数のタイトル領域を抽出できる。次に、ユーザが入力
画像に付したマークをマーク抽出手段が抽出し、このマ
ークの特徴値を算出手段が算出する。そしてこの特徴値
と標準タグ情報の属性値に基づいて、文書タグ情報付与
手段が上記入力画像に付与すべき文書タグ情報を、上記
標準タグ情報の中から選択する。これにより文書画像に
対して文書タグ情報を自動的に付与することが可能とな
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像を画像デ
ータとして記憶・管理する文書画像処理装置と文書画像
処理方法に関し、特に、上記文書画像からタイトル領域
やユーザが付したマークを抽出して文書タグ情報として
利用する上記装置と方法に関するものである。
【0002】
【従来の技術】データ記憶装置の容量が著しく増加して
きたことに伴って、スキャナ等から読み込んだ紙文書を
画像データである文書画像として記憶・管理する文書画
像処理装置が急速に普及してきている。
【0003】このような文書画像処理装置では、データ
記憶装置に記憶された複数の文書画像の中から所望の文
書画像を検索できるようにするため各文書画像にタイト
ルやキーワード等の文書タグ情報となる文字列を対応付
けて登録するようにしている。
【0004】この文書タグ情報を概念的に示したものが
図19である。この図に示すように、文書タグ情報、例
えば「極秘」191、「A社」192、「99年度」1
93、「新車」194は文書画像190に対してキーワ
ード的な役割を果たしている。このように各文書画像に
複数の文書タグ情報を付与しておくと、これら複数の文
書タグ情報から絞り込みを行うことにより、必要な文書
画像を素早く検索することができる。
【0005】従来このような文書タグ情報は、文書画像
を記憶する際にユーザが手入力していた。しかしなが
ら、上記の文書タグ情報の入力作業をユーザが行うこと
は、文書数が多くなると作業量が膨大になるため現実的
でない。そこで、近年では、文書画像に対して文字認識
を行い、この認識結果である文字列を文書タグ情報とす
ることによって、人手を介さずに文書タグ情報を付与で
きるようにした装置も出現している。
【0006】例えば、特開平8−147313号公報で
はマークシート用紙を利用する手法が開示されている。
この手法では、先ず、ユーザが所定のフォーマットのマ
ークシート用紙に記載された、文書画像に付与したい文
書タグ情報のチェック欄に印を付ける。そして、このマ
ークシートを、紙文書より先に文書画像処理装置に読み
取らせることにより、予め登録されている文書タグ情報
の候補の中から付与すべき文書タグ情報を指定するので
ある。この手法によれば、キーボードやポインティング
デバイス等の入力装置を用いることなく、登録する文書
画像に対して文書タグ情報を自動的に付与することがで
きる。
【0007】ところで、文書画像を効率良く検索するた
めには、適切な文書タグ情報を付与しておくことが重要
である。すなわち、ディスプレイに一覧表示された複数
の文書タグ情報の中から所望の文書画像に対応する文書
タグ情報を特定するのが一般的な検索形態であるが、こ
のような文書タグ情報を迅速に特定するためには、各文
書タグ情報が文書の内容を端的に表した内容でなければ
ならない。
【0008】特開平8−202859号公報では、タイ
トル文字列が属する領域(以下「タイトル領域」とい
う。)を文書画像から抽出した後、このタイトル領域画
像に対して文字認識を行い、この認識結果であるタイト
ル文字列を文書タグ情報とする方法を提案している。タ
イトル文字列は文書の内容を端的に表した内容であるた
め、このようなタイトル領域抽出方法を採用した文書画
像処理装置によれば所望の文書画像に対応する文書タグ
情報を迅速に特定できる。
【0009】
【発明が解決しようとする課題】上記特開平8−202
859号公報のタイトル領域抽出方法では、タイトル文
字が当該文書画像に属する全ての文字の中で最も大きい
サイズであるという観点から、文書画像を複数の領域
(隣接する文字矩形相互を統合した領域)に分割して各
領域内の平均文字サイズを算出し、この平均文字サイズ
が最も大きい領域をタイトル領域として抽出するように
している。従って、このようなタイトル領域抽出方法に
よって抽出されるタイトル領域の数は、1つの文書画像
につき当然1つとなる。
【0010】しかしながら、近似した内容の複数の文書
が存在する場合、タイトルも近似した内容となるのが通
常であるため、上記従来のタイトル領域抽出方法には、
近似した内容の文書が多数存在する場合所望の文書画像
に対応する文書タグ情報を迅速に特定できないという問
題があった。
【0011】上記問題を回避するため紙文書を作成する
段階で似た内容のタイトルを付けないようにしてもよい
が、このような準備作業をユーザに要求することは好ま
しくない。
【0012】一方、マークシートを利用する上記特開平
8−147313号公報の手法では、画像管理装置をソ
フトウェア的に構築するときに、全ての文書タグ情報の
項目を記載したマークシート用紙の形式、読み取りの処
理等を定義する必要があるため、非常に手間がかかる。
また、後から新しい文書タグ情報の候補を追加登録する
場合には、文書タグ情報の項目が変化するため、上記の
マークシート用紙の形式、読み取りの処理等を作り直す
必要が生じる。
【0013】更に、マークシート用紙を利用する場合に
は、常に同一の用紙を用いてチェック欄に印を付けるだ
けであるので、ユーザにとってはどの文書タグ情報を付
与したかが視覚的に分かりにくく、入力ミスを起こしや
すいという問題もあった。
【0014】本発明は上記のような事情に基づいて提案
されたものであって、1つの文書画像から複数のタイト
ル領域やユーザが付したマークを抽出して文書タグ情報
として利用できる文書画像処理装置、その文書タイトル
抽出方法及び文書タグ情報付与方法を提供することを目
的とするものである。
【0015】
【課題を解決するための手段】本発明は上記目的を達成
するために以下のような手段を採用している。
【0016】第1に、図1に示すように、文書画像を複
数の領域に分割する領域分割手段103と、該領域分割
手段103によって分割された各領域について領域平均
文字サイズを算出した後、該領域平均文字サイズに基づ
いて全領域の中からタイトル領域を抽出するタイトル領
域抽出手段104とを備えた文書画像処理装置におい
て、次の手段を採用する。
【0017】先ず、上記タイトル領域抽出手段104
が、全領域の文字の平均高さに相当する全平均文字サイ
ズを算出した後、該全平均文字サイズに抽出パラメータ
を乗算した抽出判定値と上記領域平均文字サイズとを比
較し、上記抽出判定値より大きい領域平均文字サイズの
領域をタイトル領域として抽出するようにしている。こ
のようにすれば、上記抽出判定値より大きい領域平均文
字サイズの領域であればタイトル領域として抽出される
ため、1つの文書画像から複数のタイトル領域を抽出で
きることになる。
【0018】また、上記タイトル領域抽出手段104
が、複数段階の抽出パラメータを用いて複数段階の上記
抽出判定値を算出するようにしてもよい。このようにす
れば、複数段階の抽出判定値に基づいて抽出判定がなさ
れることになるため、タイトル領域だけでなくサブタイ
トル領域(タイトル文字より若干小さなサイズの文字か
らなるサブタイトル文字列が属する領域)をも抽出でき
る。
【0019】更に、上記タイトル領域抽出手段104
が、領域平均文字サイズの最大値を全平均文字サイズで
除算した値に基づいて上記複数段階の抽出パラメータを
決定するようにしてもよい。抽出パラメータを固定値と
するのではなく領域平均文字サイズの最大値等に基づい
て算出した方が良好な抽出判定値が得られる。
【0020】上記全平均文字サイズ、領域平均文字サイ
ズを求めるについて、所定割合より大きい文字および所
定割合より小さい文字を除外したトリム平均を用いると
により精度を上げることができる。
【0021】また抽出された上記タイトル領域に含まれ
る文字の画像は、文字認識手段105により文字コード
列であるタイトル文字列に変換することができる。そし
て修正手段112によりこのタイトル文字列を修正する
ことにより、ユーザは文書画像のタイトルを適宜変更す
ることができる。
【0022】第2に、図12に示すように、紙文書を読
み取って文書画像を生成、記憶する文書画像処理におい
て、先ず、標準タグ情報(文書タグ情報の候補)を、こ
の標準タグ情報の属性値とともに予め蓄積しておく標準
タグ情報蓄積手段1215を設ける。
【0023】次に、ユーザが紙文書上に付した特定のマ
ークを抽出するマーク抽出手段1205を設ける。ここ
でマークとはスタンプ、シール、イラスト、一定の筆跡
による署名等、ユーザが紙文書を識別することを意図し
て付すマーク一般を指す。
【0024】また、抽出された上記マークを構成する画
素の分布に基づいて、このマークの特徴を表す特徴値を
算出する算出手段120Aを設ける。
【0025】そして、上記属性値と上記特徴値を比較し
て、最も類似度の高い標準タグ情報を選択し、上記文書
画像に対して付与する文書タグ情報付与手段1208を
設ける。
【0026】以上により、ユーザが書類の整理に際して
日常的に用いるマークを基に、文書画像に対して文書タ
グ情報を自動的に付与することが可能となり、オフィス
等における文書管理が簡便に行える。
【0027】
【発明の実施の形態】(実施の形態1)以下に本発明の
実施の形態を図面に従って詳細に説明する。実施の形態
1、2、3及び4では1つの紙文書から複数のタイトル
を抽出する文書画像処理装置に関して説明する。
【0028】図1は、本発明を適用した文書画像処理装
置の概略機能ブロック図であり、以下、その構成を文書
画像登録手順とともに説明する。
【0029】まず、例えばスキャナ等の文書画像入力手
段101が紙文書を光電変換して多値画像データである
文書画像108aを得、該文書画像は画像処理手段11
1aで記憶に適した処理(例えば圧縮処理)がなされて
記憶手段108の文書画像エリアAaに登録される。も
ちろん画像処理手段111aを設けないで多値画像デー
タのまま文書画像エリアAaに登録しておいてもよい。
【0030】上記文書画像入力手段101よりの文書画
像は上記画像処理手段111aに入力されるとともに、
画像処理手段111bにも入力されここで2値画像デー
タに変換されて画像メモリ107に格納される。このよ
うに画像メモリ107に文書画像が格納された状態で、
文字矩形生成手段102は上記画像メモリ107に記憶
された文書画像を参照して、以下のラベリング処理を行
う。このラベリング処理とは、注目する黒画素(以下
「注目画素」という。)の上、右上、右、右下、下、左
下、左、左上の8方向に隣接する画素のうち黒画素につ
いて当該注目画素と同一のラベル値(識別情報)を与え
る処理である。すなわち、図7に示すようにW1・W2
・W3・W4・W6・W7・W8・W9の8画素が注目
画素W5に連結する場合、文字矩形生成手段2は、黒画
素であるW2・W3・W8に注目画素W5と同一のラベ
ル値を与える。このようなラベリング処理を行うことに
よって、文書画像内の黒画素連結成分(連続する黒画
素)毎に同一ラベル値を与えることができる。
【0031】次いで、文字矩形生成手段102は、上記
のように同一ラベル値を与えた黒画素連結成分を切り出
すことによって文字矩形を生成し、この文字矩形を領域
分割手段3に渡す。ここで、文字矩形とは黒画素連結成
分の外接矩形を意味する。尚、文字によっては1つの黒
画素連結成分で構成されていない場合もあり、このこと
を考慮して、上記ラベリング処理を行う前に文書画像中
の黒画素領域を膨張させる処理をしておくこともでき
る。すなわち、注目する黒画素に隣接する8個の画素を
黒画素に変換するという処理であり、この処理を適切な
回数(通常2、3回)だけ施すことにより、黒画素の領
域が拡大され1つの文字内で分離していた黒画素連結成
分を1つに結合することができる。このような処理を行
った上で、上記ラベリング処理を行うことにより、上記
文字矩形を正しく文字毎に生成することが可能となる。
【0032】上記文字矩形生成手段102の処理が終わ
ると領域分割手段103は、各文字矩形について近傍を
調べ、相互に隣接する文字矩形を統合することによって
文書画像の領域を分割する。例えば図8に示す文字矩形
C1〜C12を受けた領域分割手段103は、文字矩形
C1〜C4・C5〜C9・C10〜C12をそれぞれ統
合することによって文書画像を領域E1・E2・E3に
分割する。このような領域分割処理を行うことによっ
て、文書画像の領域を文字列毎に分割することができ
る。なお、文字矩形が相互に隣接している状態であるの
か、あるいは、行間であるのか等の区別は文字間、行間
に関する適当な閾値を用いて判定するようにしている。
【0033】以上の結果、文書画像内における全ての文
字サイズ(後述する)・分割された領域数・各領域内の
文字矩形の数などの情報が得られる。本発明では、分割
された各領域に対して1から始まる通し番号を付すとと
もに各領域に属する文字矩形に対しても1から始まる通
し番号を付すようにしており、以下、n番目の領域内の
文字矩形数をNumChar n 、n番目の領域内におけるm番
目の文字サイズをSizeCharn , m と表す。
【0034】ところで図9に示すように、文字矩形の幅
W1〜W4および面積A1〜A4は同一ポイント数の文
字フォントを使用している場合であっても文字の種類に
依存して大きく変動するのに対して、文字矩形の高さH
1〜H4はこのような変動が小さい。従って本発明で
は、文字フォントのポイント数が比較的正確に反映され
る“文字矩形の高さ”を上記文字サイズとして採用する
ようにしている。
【0035】ここで、タイトル領域抽出手段104は、
上記のように分割された全領域のうち所定の領域のみを
タイトル領域として抽出する。以下、このタイトル領域
抽出処理を図2に示すフローチャートに従って説明す
る。
【0036】まず、タイトル領域抽出手段104は各領
域について領域平均文字サイズを算出する(図2、ステ
ップ1)。この領域平均文字サイズとは1領域に属する
全ての文字サイズの平均値であり、n番目の領域におけ
る領域平均文字サイズSizeReg n は、当該領域に属する
全ての文字サイズSizeCharn , m の加算値を当該領域内
の文字数NumChar n で除算した値となる。この関係を次
式に示す。
【0037】
【数1】
【0038】次いで、上記のように算出した各領域の領
域平均文字サイズSizeReg n と領域内の文字数NumChar
n とから、文書画像内の全平均文字サイズSizeAll を次
式によって算出する(図2、ステップ2)。
【0039】
【数2】
【0040】なお、領域平均文字サイズSizeReg n およ
び全平均文字サイズSizeAll の算出方法は上記した方法
に限定されるものではなく、例えば、後に説明するトリ
ム平均(最小値側および最大値側から所定割合例えば1
0%のデータを除外したうえで平均値を算出する方法)
を採用することもできる。
【0041】ここで、タイトル領域抽出手段104は、
以下に示す抽出判定式が成立するか否かに基づいてタイ
トル領域の抽出判定を行う。
【0042】
【数3】
【0043】すなわち、上記のように算出した全平均文
字サイズSizeAll に抽出パラメータαを乗算した値(抽
出判定値)と各領域の領域平均文字サイズSizeReg n
を比較し、この抽出判定式が成立する領域のみをタイト
ル領域として抽出する(図2、ステップ3→4→5)。
なお、抽出パラメータαは1.0 より大きな定数とし、1.
2 程度の値とするのが好ましい。
【0044】以上の手順を繰り返し全ての領域について
抽出判定が行われると(図2、ステップ3で“N
O”)、タイトル領域抽出処理を終了し、ここで抽出さ
れた各タイトル領域画像108bは記憶手段108のタ
イトルエリアAbに登録される。
【0045】次いで、文字認識手段105は、上記のよ
うに抽出されたタイトル領域画像を文書画像から切り出
し、このタイトル領域画像に対して文字認識を行うこと
によって文字コード列であるタイトル文字列を得る。こ
こで得られたタイトル文字列は修正手段112を介して
表示制御手段110に渡され、タイトル領域画像ととも
に図示しないディスプレイにリスト表示され、ユーザに
提示される(図10(I) 参照)。
【0046】ユーザは表示された上記タイトル領域画像
及びタイトル文字列を確認し、このタイトル文字列を表
示された通りに登録したい場合は、指示入力手段109
により登録を指示する。するとこのタイトル文字列が上
記文字認識手段105から文書登録手段106に渡され
る。
【0047】一方、上記タイトル文字列に変更・修正を
加えたいときは、ユーザは上記指示入力手段109のポ
インティングデバイスにより、表示されたこのタイトル
文字列を例えばダブルクリックする。修正手段112は
このダブルクリックに基づいて、上記表示制御手段11
0に対して、例えば、ディスプレイ上の上記タイトル文
字列を点滅させ、また、カーソルを上記文字列内に表示
させるよう指示する。そしてユーザは上記指示入力手段
109のキーボードを操作し、修正文字列を上記修正手
段112に入力して上記カーソル以降の文字列を修正文
字列で置き換える。このようにして修正された文字列は
上記修正手段112から上記文字認識手段105に入力
され、上記タイトル文字列の修正が行われる。そして上
記と同様、ユーザが上記指示入力手段109により登録
を指示すると、この修正後のタイトル文字列が上記文字
認識手段105から上記文書登録手段106に渡され
る。
【0048】尚、上記確認及び修正の処理を設けない場
合は、上記文字認識手段105が認識した内容をディス
プレイに表示しないでそのまま文書登録手段106に渡
すことになる。
【0049】上記タイトル文字列を受けた文書登録手段
106は、記憶手段108での文書画像108aの格納
ポインタ、上記タイトル領域画像108bの格納ポイン
タ・上記タイトル文字列・文書画像内におけるタイトル
領域の位置およびサイズからなる登録情報を記憶手段1
08上のテーブルエリアAcに形成された登録情報管理
テーブル108c(図5参照)に登録する。ここで、上
記文書画像108aの格納ポインタは上記記憶手段10
8の文書画像エリアAaより得られ、上記タイトル画像
108bの格納ポインタは上記記憶手段108のタイト
ルエリアAbより得られ、更に、タイトル領域の位置と
サイズは文字認識手段105より得られることになる。
【0050】このように登録情報管理テーブル108c
が生成されると、以降に、キーボードやポインティング
デバイス等からなる指示入力手段109より文書画像の
検索が指示入力されると、表示制御手段110は、上記
のように記憶されたタイトル領域画像およびタイトル文
字列を上記ディスプレイにリスト表示する(図10(I)
)。
【0051】そして上記リスト表示からユーザが所望の
タイトル(タイトル領域画像またはタイトル文字列)が
上記指示入力手段109により選択すると、上記表示制
御手段110はこのタイトルに対応する文書画像を上記
ディスプレイに表示する。このとき、図10(II)に示す
ように、矩形枠Fで囲むなどして文書画像内におけるタ
イトル領域を明示するのが好ましい。このような矩形枠
Fは、登録情報管理テーブル108cに登録されている
タイトル領域の位置およびサイズに基づいて生成でき
る。
【0052】また、上記のようにディスプレイに表示さ
れたリストからいずれか1つを選択する方法に加えて、
指示入力手段109より特定の文書タグ情報を入力し、
該文書タグ情報に該当するタイトルが登録情報管理テー
ブル108cに登録されているとき、対応する文書画像
を表示するようにしてもよいことはもちろんである。
【0053】以上のように本実施の形態によれば、抽出
判定値より大きい領域平均文字サイズの領域であればタ
イトル領域として抽出する構成としているため、1つの
文書画像から複数のタイトル領域を抽出できる。従っ
て、似た内容の文書が多数存在する場合であっても、所
望の文書画像に対応する文書タグ情報(タイトル)を迅
速に特定できる。
【0054】なお、上記の説明では、タイトル領域抽出
処理において抽出判定式の成立する領域が存在しなかっ
た場合の手順については言及していないが、このような
場合には、タイトル領域が抽出されなかった旨をディス
プレイ表示するとともに文書タグ情報となる文字列を入
力するようユーザに対して要求し、この要求に対してユ
ーザが文字列を入力すると、この文字列を当該文書画像
のタイトル文字列として用いるようにしている。
【0055】(実施の形態2)上記実施の形態1では、
抽出判定値より大きい領域平均文字サイズの領域であれ
ば、領域平均文字サイズの大小を区別することなく同様
にタイトル領域として抽出する構成としている。従っ
て、タイトル文字より若干小さなサイズの文字からなる
サブタイトル文字列はリスト表示せずタイトル文字列の
みをリスト表示する処理など、領域平均文字サイズの大
小に基づいた適切な処理を行うことができない。本実施
の形態では、複数段階の抽出パラメータを用いて複数段
階の抽出判定値を算出するとともにレベル属性(抽出し
た段階を示す情報)と対応付けてタイトル領域を抽出す
る構成とすることによって上記した問題を解消してお
り、以下、その構成を実施の形態1と異なる点のみ説明
する。
【0056】上記実施の形態1と同様の手順で領域平均
文字サイズSizeReg n および全平均文字サイズSizeAll
を算出したタイトル領域抽出手段104は、以下に示す
複数段階の抽出判定式が成立するか否かに基づいて複数
段階の抽出判定を行う。
【0057】
【数4】
【0058】上式におけるαp は、p段階(レベルp)
の抽出パラメータであり、〔数5〕の条件を満たすよう
に値を設定しておく。例えば、5段階の抽出判定を行う
場合には、α1=1.5 、α2=1.3 、α3=1.2 、α4=1.15、
α5=1.1 程度とするのが好ましい。
【0059】
【数5】
【0060】図3に示すフローチャートを用いて説明す
ると、タイトル領域抽出手段104は、レベル1から順
に全レベルの抽出判定を行い(図3、ステップ14→1
5→14)、全レベルにおいて抽出判定式が成立しなか
った場合には、この領域をタイトル領域として抽出せ
ず、次の領域について抽出判定を行う(図3、ステップ
14→13→14→15)。一方、いずれかのレベルに
おいて抽出判定式が成立した場合には、この領域を当該
レベルのタイトル領域として(上記レベル属性を対応付
けて)抽出した後、次の領域について抽出判定を行う
(図3、ステップ15→16→13→14→15)。
【0061】以上の手順を繰り返し全ての領域について
抽出判定が行われると(図3、ステップ13で“N
O”)、タイトル領域抽出処理を終了する。
【0062】なお、抽出判定式の成立する領域が存在し
なかった場合ユーザが入力した文字列をタイトル文字列
として用いる点は上記実施の形態1と同様であり、この
タイトル文字列のレベル属性はレベル1、全レベル数も
1としている。
【0063】また、抽出された上記タイトル文字列を変
更・修正できる点についても実施の形態1と同様であ
る。
【0064】図6は、本実施の形態における登録情報管
理テーブル108cの説明図であり、上記実施の形態1
において示した構成(フィールド501〜505)に
「レベル属性」フィールド601と「全レベル数」フィ
ールド602とを加えた構成としている。そして文書登
録手段106は、例えば5段階の抽出判定においてレベ
ル1で抽出された領域がある場合、この領域に対応する
「全レベル数」フィールド602には“5”を、「レベ
ル属性」フィールド601には“1”をそれぞれ登録す
る。
【0065】図11は、本実施の形態の検索時において
ディスプレイに表示される内容を示す図であり、上段に
リスト表示するタイトルのレベル属性を指示入力手段1
09より範囲指定できるようにしている。そして、表示
制御手段110は、登録情報管理テーブル108cの
「レベル属性」フィールド601と「全レベル数」フィ
ールド602とを参照することによって上記のように指
定された範囲内のタイトルのみをディスプレイにリスト
表示する。
【0066】以上のように本実施の形態によれば、複数
段階の抽出パラメータを用いて複数段階の抽出判定値を
算出するとともにレベル属性と対応付けてタイトル領域
を抽出する構成としているため、サブタイトル文字列は
リスト表示せずタイトル文字列のみをリスト表示する処
理など領域平均文字サイズの大小に基づいて、異なる処
理を行うことができる。
【0067】(実施の形態3)上記実施の形態2では、
複数段階の抽出パラメータを予め設定する(固定値とす
る)構成としているが、このような抽出パラメータは入
力された文書画像の特性に応じて決定するのが好まし
い。本実施の形態では、領域平均文字サイズの最大値を
全平均文字サイズで除算した値に基づいて複数段階の抽
出パラメータを決定する(図4、ステップ23参照)よ
うにしており、以下、その構成を実施の形態2と異なる
点のみ説明する。
【0068】上記の実施の形態2と同様の手順で領域平
均文字サイズSizeReg n および全平均文字サイズSizeAl
l を算出したタイトル領域抽出手段4は、まず、領域平
均文字サイズの最大値max {SizeReg n }を全平均文字
サイズSizeAll で除算した値α1 を次式によって算出す
る。
【0069】
【数6】
【0070】次いで、タイトル領域抽出手段4は、上記
のように算出したα1 と当該抽出判定の全レベル数P(P
>=1)とから、各レベルの抽出パラメータαp を次式によ
って決定する。
【0071】
【数7】
【0072】例えばα1 が1.5 で5段階の抽出判定を行
う場合、各レベルの抽出パラメータα1 〜α5 は以下の
ようになる。
【0073】
【数8】
【0074】このように〔数7〕によれば、上記のよう
に算出したα1 から1.0 の間で等間隔になるように各レ
ベルの抽出パラメータαp を決定することができる。
【0075】以降の手順は、上記のように決定した抽出
パラメータを用いて抽出判定を行う点を除いて実施の形
態2と同様であるため説明を省略する。
【0076】ただし上記した方法には、文書画像内にタ
イトル領域が存在しない場合、α1が例えば1.03など1.0
付近の値となるため本文の領域をタイトル領域として
誤抽出してしまうという不具合がある。そこで本発明で
は、例えば1.05など所定値以下となる抽出パラメータは
採用しないようにしている。
【0077】また、各レベル間の抽出パラメータの差が
例えば0.03など所定値以下となると、良好な抽出判定が
できないため、上記抽出パラメータの差が上記所定値
(0.03)となるように抽出パラメータの設定値を修正す
るようにしている。すなわち上記の場合、α1 から順に
0.03ずつ減算した値を各レベルの抽出パラメータとして
設定する。
【0078】以上の結果全レベル数Pが減少する場合も
あるが、このような場合には、実際のレベル数(全レベ
ル数Pから減少レベル数を減じた値)を全レベル数Pと
して登録情報管理テーブル108cの「全レベル数」フ
ィールド602に設定する。
【0079】以上のように本実施の形態によれば、抽出
パラメータを固定値とするのではなく、入力された文書
画像の特性に応じて決定する構成としているため良好な
抽出判定を行うことができる。
【0080】(実施の形態4)上記の各実施の形態にお
いては、全平均文字サイズの算出に比較的サイズの大き
いタイトル領域の文字も算入され、また、サイズの小さ
いコンマ、ピリオド、句読点も算入されるので、精度が
低くなる傾向がある。そこで、文書画像の全文字から、
所定割合(例えば90%)より大きいサイズの文字と、
所定割合(例えば10%)より小さいサイズの文字を除
外した文字から全平均文字サイズを算出する、いわゆる
トリム平均を利用する。更に、領域平均文字サイズを算
出するときにも、同様の問題が発生するところから、領
域平均文字サイズの算出についても上記トリム平均を用
いることもできる。
【0081】これによって、全平均文字サイズ、および
領域平均文字サイズとも、ピリオド、コンマ、句読点を
除外した文字サイズを求めることができ、より精度の高
い値が得られることになる。
【0082】ここで、上記各実施の形態では領域平均文
字サイズより、全平均文字サイズを算出しているが、同
じ方法をこのトリム平均を用いる場合に適用すると、領
域毎にサイズの大きい文字と小さい文字を除外すること
になるため、全平均文字サイズの算出においてタイトル
領域に含まれるすべての文字を除外することができな
い。従ってここでは、全平均文字サイズを算出するとき
に、あらためて文書画像中の全文字を対象として処理を
行っている。
【0083】但し、このトリム平均を用いる方式を使用
するにしても、上記抽出パラメータとして、実施の形態
1の所定値、あるいは実施の形態2、3の段階値のいず
れを用いてもよいことはもちろんである。
【0084】なお、上記の各実施の形態の説明では、文
書画像となる文書の枚数については言及していないが、
紙文書の枚数は特に限定されるものではない。すなわ
ち、1枚であっても複数枚であっても、各頁に同じ抽出
パラメータを用いる限り同様の効果が得られる。特に、
実施の形態2、3においては、複数頁に対して同じ抽出
パラメータ用いることにより、論文データのように複数
頁にわたる単一文書から、タイトル、サブタイトルを正
しく抽出することができる。
【0085】また、上記の説明では、文字矩形の高さを
文字サイズとして採用することとしているが、文字矩形
の幅・面積を文字サイズとして採用してもよい。
【0086】尚、図1の説明において、記憶手段108
の前段と画像メモリ107の前段に画像処理手段111
a、111bを設けて、タイトル抽出用の文書画像は2
値画像データを用い、記憶手段108の文書画像エリア
Aaに登録される文書画像データとして、圧縮画像ある
いは多値画像データを用いることができるようになって
いる。これによって、上記のように抽出されたタイトル
に基づく検索処理の結果得られた文書画像をカラーで表
示する等の多様な表示方法が可能となる。
【0087】(実施の形態5)以下、実施の形態5及び
6ではユーザが紙文書に付したマークを文書タグ情報と
して自動的に付与する文書画像処理装置に関して説明す
る。
【0088】先ず、紙文書を構成するいずれかのページ
にタイトルやキーワード等よりなるマークがユーザによ
って付される。ここで、マークとはスタンプ、シール、
イラスト、一定の筆跡による署名等、ユーザが紙文書を
識別することを意図して付すマーク一般を指すこととす
る。
【0089】本発明の文書画像処理装置に、多数のペー
ジからなる紙文書を記憶させるにあたって、この紙文書
のどのページに上記マークが付されているかを判別する
必要がある。この際、上記紙文書の全ページを検索して
上記マークを検出する方法も考えられるが、検出処理に
時間がかかるという問題がある。
【0090】このような問題を解決する方法としては、
例えば、1ページ目のみに上記マークの検出を行うよ
う、予め文書画像処理装置に設定しておくことなどが挙
げられる。
【0091】本発明の実施の形態においては、図13
(b)に示すように、上記マークを付したページ(「以
下「文書タグ情報指定ページ」と呼ぶ)21、24に対
しては、右下の特定位置に特定の2次元コード画像26
を記載することによって、この文書タグ情報指定ページ
を判別することにしている。
【0092】図1は本発明の実施の形態5による文書画
像処理装置のブロック図であり、以下、この文書画像処
理装置の行う処理の手順について説明する。
【0093】先ず、画像入力手段1201では、スキャ
ナやディジタル複合機などの光電変換装置を用いて紙文
書を電子化し、文書画像として入力する。ここでは、図
13に示すように、入力画像22及び23に文書タグ情
報指定ページ21に付された「極秘」「A社」「99年
度」の文書タグ情報を、入力画像25に文書タグ情報指
定ページ24に付された「極秘」「B社」の文書タグ情
報を付与することとする。そして、画像入力手段120
1には、文書タグ情報指定ページ21、入力画像22、
23、文書タグ情報指定ページ24、入力画像25の順
に入力するようにしておく。
【0094】ここで入力された文書画像は、一旦、画像
メモリ1202に格納され、更に、画像データ圧縮処理
手段1203においてデータ圧縮が施された後、記憶手
段1210の画像記憶領域1211に記憶される。この
とき、記憶された各文書画像を特定できるように、それ
ぞれの文書画像に画像IDを付与し、この画像IDを図
13(a)に示す登録管理テーブル1212の「画像I
D」フィールド121に格納する。また、記憶手段12
10の画像記憶領域1211に記憶された画像データへ
のポインタ情報を、登録画像管理テーブル1212の
「画像データへのポインタ」フィールド122に格納す
る。
【0095】また、画像メモリ1202に格納された上
記文書画像は、画像2値化処理手段1204において2
値化された後、マーク抽出手段1205にも送られる。
このマーク抽出手段1205では、先ず、画像右下の予
め決められた位置に特定の2次元コード画像が存在する
か否かを判定することによって、入力された各文書画像
が文書タグ情報指定ページであるかどうかを判定する。
【0096】このとき、文書タグ情報指定ページと判断
された文書画像に関しては、上記登録画像管理テーブル
1212の「文書タグ情報指定ページフラグ」フィール
ド123に「1」を、そうでない場合には「0」を格納
する。このフラグは上記文書画像がマークのみが付され
た文書タグ情報指定ページであって、紙文書の文書とし
ての内容を含んでいないことを識別するために用いられ
る。例えば、後述する方法によって文書画像に対して文
書タグ情報が付与された後は、このフラグに基づいて、
文書タグ情報指定ページに該当する文書画像を削除する
ようにすれば、メモリ資源の節約になる。
【0097】そして、ある文書タグ情報指定ページが入
力されてから次の文書タグ情報指定ページが入力される
までに入力された全ての文書画像に対して、同一のマー
ク管理グループ番号を付与する。更に、このマーク管理
グループ番号を上記登録画像管理テーブル1212の
「マーク管理グループ番号」フィールド125に格納す
る。ここで、同一のマーク管理グループ番号が付与され
た文書画像には、同一の文書タグ情報が付与されること
を意味している。
【0098】次に、上記の処理によって文書タグ情報指
定ページと判断された文書画像から、マーク抽出手段1
205がマークを抽出する処理について説明する。
【0099】先ず、文書タグ情報指定ページのうち、上
記2次元コードが付された領域を除く全ての領域に対し
て、実施の形態1で説明したラベリング処理を行う。そ
してラベリング処理で得られた複数の黒画素連結成分の
うち、相互の距離が特定の閾値よりも小さい成分に関し
ては統合して1つの領域とする。このようにして得られ
た各領域は、図16に示すように、それぞれ各マークの
領域41〜43に対応しており、これらの領域を抽出す
ることによって、各マーク画像を得ることができる。
【0100】ここで、各文書タグ情報指定ページから抽
出されたマークの個数を、上記登録画像管理テーブル1
212の「マーク数」フィールド124に格納する。
【0101】また、抽出された各マーク画像の情報を管
理するために、各マーク画像にマークIDを付与し、図
14に示すような、マーク管理テーブル1213の「マ
ークID」フィールド131に格納する。更に、各マー
クが付されていた文書タグ情報指定ページのマーク管理
グループ番号を、上記マーク管理テーブル1213の
「マーク管理グループ番号」フィールド132に格納す
る。また、各文書タグ情報指定ページから抽出されたマ
ーク画像の該文書タグ情報指定ページ内での位置、サイ
ズ(幅、高さ)の情報を、それぞれ上記マーク管理テー
ブル1213の「位置」フィールド134、「サイズ」
フィールド135に格納する。
【0102】本実施の形態では、最初の文書タグ情報指
定ページと、次の文書タグ情報指定ページとの間に入力
された文書画像には同一のマーク管理グループ番号を付
与し、上記文書画像を上記最初の文書タグ情報指定ペー
ジに付随する一連の文書画像として管理している。この
他にも文書タグ情報指定ページの次に入力された特定の
文書画像にのみにマーク管理グループ番号を付与し、そ
の他の文書画像にはマーク管理グループ番号を付与しな
い管理方法も考えられる。これは例えば上記特定の文書
画像に目次を付けたい場合などに利用される管理方法で
ある。
【0103】次に、算出手段120Aの特徴量算出手段
1206では、マーク抽出手段1205において抽出さ
れた各マーク画像の特徴を表す数値を算出する。ここで
はこの数値として、公知の技術であるモーメント・イン
バリアント(Moment Invariants )における特徴量を利
用する。以下、このモーメント・インバリアントについ
て簡単に説明する。
【0104】i,jを画素の座標、I(i,j)をその
画素値、即ち、黒画素についてはI=1、白画素につい
てはI=0の値を持つ関数とする。そして〔数9〕で定
義されるmpqを(p+q)次のモーメントと呼ぶ。
【0105】
【数9】
【0106】ここで、この mpqを用いると、2次元画像
の重心(x,y)は〔数10〕で表される。
【0107】
【数10】
【0108】このようにして算出された重心に基づい
て、〔数11〕で定義されるμpqを中心モーメントと言
う。
【0109】
【数11】
【0110】そしてこの中心モーメントに基づき、〔数
12〕によって以下のように算出される数値M1〜M6を、
当該2次元画像の(モーメント・インバリアントにおけ
る)特徴量と定義する。
【0111】
【数12】
【0112】これらの特徴量は当該2次元画像が回転や
平行移動した場合にも不変となるため、本発明の実施の
形態のように、ユーザが手作業で特定のマークを用紙の
上に付すような場合において、このマークを特徴付ける
のに有効な数値となるのである。
【0113】このように特徴量算出手段1206により
算出された特徴量は、算出手段120Aの類似度算出手
段1207に渡され、この特徴量と各標準タグ情報の属
性値との類似度が算出される。この方法を説明するため
に、以下では先ず、各標準タグ情報の管理方法及び各標
準タグ情報の属性値を算出する方法について説明する。
【0114】上記の標準タグ情報とは具体的にはユーザ
の使用が予測されるマーク(以下「標準マーク」と呼
ぶ)に関連付けられたデータであり、入力画像に対して
キーワード的な役割を果たす文字列等の文書タグ情報の
候補である。この標準タグ情報を、図15(a)に示す
ような、標準タグ情報管理テーブル1214の「標準タ
グ情報」フィールド141に格納する。また、上記標準
マークの画像データは標準タグ情報蓄積手段1215に
格納されており、更に、この画像データへのポインタが
上記標準タグ情報管理テーブル1214の「標準マーク
へのポインタ」フィールド142に格納されている。ま
た、上記特徴量算出手段1206はこれら標準マークの
モーメント・インバリアントにおける6つの特徴量を算
出し、これら特徴量を標準タグ情報管理テーブル121
4の「属性値(M1 〜M6) 」フィールドに格納する。即
ち、この特徴量が、各標準マークの属性値となるのであ
る。
【0115】このようにして算出された各標準マークの
属性値と、入力画像から抽出されたマーク画像の上記モ
ーメント・インバリアントにおける特徴量との距離を
〔数13〕(最小2乗法)によって算出する。
【0116】
【数13】
【0117】ここで、M1〜M6は上記標準マークの属性
値、m1〜m6は抽出されたマーク画像の特徴量を表してい
る。上式によって算出された距離Lの値が小さいほど、
抽出されたマーク画像と標準タグ情報との類似度が高い
ことを示している。
【0118】次に文書タグ情報決定手段1208では、
上記類似度算出手段1207において算出された類似度
が最大となる標準マークを特定し、この標準マークの標
準タグ情報を入力された文書画像の文書タグ情報として
選択し、この文書画像に付与する。さらに、この文書タ
グ情報をマーク管理テーブル1213の「文書タグ情
報」フィールド133に格納する。
【0119】以上の処理を適用することにより、入力さ
れた各文書画像に自動的に文書タグ情報を付与すること
ができる。ここで得られた各テーブルの情報を用いる
と、次の手順に従って画像の検索を行うことができる。
【0120】先ず、ユーザが検索に使用する文書タグ情
報を指定すると、この文書タグ情報に関連付けられてい
るマーク管理グループ番号をマーク管理テーブル121
3から特定することができる。さらに、上記マーク管理
グループ番号が付与されている文書画像の画像IDおよ
びこの文書画像データへのポインタの情報を、登録画像
管理テーブル1212から特定することができる。ここ
で特定された文書画像が、ユーザの指定した文書タグ情
報に関連付けられている画像となる。また、複数の文書
タグ情報を指定することにより、検索したい画像データ
を絞り込むこともできる。
【0121】次に、類似度算出手段1207において算
出された類似度が最大となる文書タグ情報に関しても、
抽出されたマーク画像との距離Lが予め指定された閾値
よりも大きかった場合には、このマーク画像に関連付け
るべき既存の文書タグ情報は存在せず、新規の標準マー
クが入力されたものと判断する。この場合、マーク管理
テーブル1213の「位置」フィールド134、「サイ
ズ」フィールド135および登録画像管理テーブル12
12の「画像データへのポインタ」フィールド122の
情報に基づいてマーク画像を表示し、ユーザに対してこ
の新規の標準マークを関連付けておく文書タグ情報を登
録するように促す。
【0122】ここで入力された文書タグ情報を、新たに
標準タグ情報管理テーブル1214の「標準タグ情報」
フィールド141に格納する。また、上記の新規に入力
された標準マークの画像データを以降の検索処理に利用
するために標準タグ情報蓄積手段1215に格納し、こ
のマーク画像データへのポインタ情報を標準タグ情報管
理テーブル1214の「マーク画像へのポインタ」フィ
ールド142に格納する。さらに、この新規の標準マー
クのモーメント・インバリアントにおける特徴量を算出
し、標準タグ情報管理テーブル1214の「属性値(M1
〜M6) 」フィールド143に格納する。
【0123】以上のように、ユーザは新しいマーク画像
と文書タグ情報を入力するだけで、新規の標準タグ情報
を登録することができる。
【0124】なお、上記の説明において、図14、図1
5(a)では、標準マークが関連付けられている標準タ
グ情報を、当該標準マークに使用されている文字列にし
ているが、これらは必ずしも文字列に限定する必要はな
い。すなわち、標準タグ情報管理テーブル1214にお
いて、各標準マークに任意の標準タグ情報を関連付ける
ことが可能である。
【0125】例えば、上述のような文字列による標準タ
グ情報の代わりに、各標準マークの縮小画像を標準タグ
情報としてそれぞれの標準マークに関連付けておき、こ
の縮小画像を検索用シートに印刷しておく。そしてこの
検索用シートの縮小画像をスキャナで読み取らせること
により、所望の文書画像の検索を行うようにすることも
可能である。
【0126】更に、図13および図16の説明図では、
全ての入力画像の中から文書タグ情報指定ページを特定
するために2次元コードを用いたが、1次元コード等を
用いても良い。他にも、文書タグ情報指定ページを特定
するための手段としては、2次元コード画像の替わりに
特定のマークを使用する方法や、特定カラーの用紙を使
用する方法、あるいは特定の形状やサイズの用紙を使用
する方法等によっても同様の効果が期待できる。
【0127】また、全ての入力画像に同一の文書タグ情
報を付与する場合には、1枚目に入力する画像だけが文
書タグ情報指定ページ画像であると定義して文書画像処
理装置を構築することも可能である。この場合、1枚目
に入力される画像だけが文書タグ情報指定ページである
と分かっているので、2次元コード画像等を用いて文書
タグ指定画像を特定する処理は必要なくなり、全体の処
理を簡略化することができる。
【0128】勿論、2次元コード画像等を用いずに、紙
文書の全てのページを検索してマークを抽出する方法も
可能である。この際に、ユーザが付したマークとは別
に、紙文書中の例えば「極秘」等の文字をマークとして
抽出してしまうことも起こり得る。このような場合には
当該文字も一つの上記のマークの1つとして登録画像管
理テーブル1213に追加すればよい。
【0129】なお、上記の説明ではモーメント・インバ
リアントにおける特徴量を用いてマーク画像と標準タグ
情報との関連付けを行ったが、2つの画像を重ねて一致
する黒画素の割合を比較するテンプレートマッチングを
用いて関連付けを行っても同様の効果が期待できる。
【0130】また、1つの標準タグ情報に複数の標準マ
ークを関連付けておくこともできる。これは、標準タグ
情報管理テーブル1214において、同一の標準タグ情
報を複数登録しておき、それぞれに異なる標準マークを
関連付けることによって実現できる。この場合、異なる
マークの付された紙文書を入力して、この入力された文
書画像に同一の文書タグ情報を付与することができる。
【0131】逆に、1つの標準マークが複数の標準タグ
情報に関連付けられるようにすることもできる。これ
は、標準タグ情報管理テーブル1214において、異な
る標準タグ情報に同一の標準マークを関連付けることに
よって実現できる。この場合、1つのマークの付された
紙文書を入力して、この入力された文書画像に複数の文
書タグ情報を付与することができる。
【0132】(実施の形態6)本実施の形態では、登録
する紙文書の余白部分に押されたマークを抽出すること
により、文書画像に文書タグ情報を付与する形態とす
る。以下、図12を参照しながら実施の形態5と異なる
点についてのみ説明する。
【0133】まず、画像入力手段1201では、実施の
形態5と同様、ユーザが入力した紙文書を電子化して文
書画像を得る。ここでは、図17(b)に示すように、
文書画像31および32に「極秘」「A社」「99年
度」の文書タグ情報を、文書画像33に「極秘」「B
社」の文書タグ情報を付与することとする。このため
に、各画像の余白部分には、それぞれ付与したい文書タ
グ情報に関連付けられているマークが付されている。
【0134】ここで得られた画像データは、一旦、画像
メモリ1202に格納され、さらに画像データ圧縮処理
手段1203においてデータが圧縮された後、記憶手段
1210の画像記憶領域1211に格納される。ここで
格納された画像データの情報として、図17(a)に示
すように登録画像管理テーブル1212’の「画像I
D」フィールド121’および「画像データへのポイン
タ」フィールド122’に、それぞれ必要な情報を格納
することについては、実施の形態5と同様である。
【0135】また、画像メモリ1202の画像は、画像
2値化処理手段1204において2値化された後、マー
ク抽出手段1205’に送られる。本実施の形態では、
マーク画像の領域を確実に抽出することができるよう
に、図17(b)に示すような枠付きのマークを使用
し、上記マーク抽出手段1205’が以下の処理によっ
て各マークの抽出を行う。
【0136】まず、各2値画像の黒画素に対して上述の
ラベリング処理を行い、さらに同一のラベル値が付与さ
れた黒画素連結成分毎に外接矩形のサイズを算出してお
く。このとき、マークの枠の部分に対応する黒画素連結
成分の外接矩形サイズは、入力画像内の各文字のサイズ
に比べると十分大きいが、マークは書類の余白部分に納
まるように押す必要があることから、極端に大きなサイ
ズになることもない。この性質を利用し、上記ラベリン
グ処理によって得られた黒画素連結成分のうち、外接矩
形の占める領域の大きさが、指定された2つの閾値の間
に納まる領域だけを抽出する。すなわち、高さおよび幅
の大きさが、それぞれある閾値〔余白のサイズ(高さ、
幅)として通常考えられる最小サイズ〕よりも大きく、
且つ、別のある閾値〔余白のサイズとして通常考えられ
る最大サイズ〕よりも小さくなるような黒画素連結成分
の領域だけを抽出することによって、各マーク画像の領
域を抽出することができる。
【0137】上記の処理によって、各文書画像から抽出
されたマークの個数を、それぞれ登録画像管理テーブル
1212’の「マーク数」フィールド124’に格納す
る。また、抽出された各マーク画像にマークIDを付与
し、このマークIDを図18に示すようなマーク管理テ
ーブル1213’の「マークID」フィールド131’
に格納する。また、各マークが付されていた入力画像の
画像ID、マークが付されていたおよびマークのサイズ
に関する情報を、それぞれマーク管理テーブル121
3’の「画像ID」「位置」「サイズ」の各フィールド
132’、134’、135’に格納する。
【0138】なお、本実施の形態ではマークの付された
画像にのみ文書タグ情報を付与することとしている。こ
の他にも、最初のマークの付された画像から、次のマー
クが付された画像までの間に入力された画像を、上記最
初のマークの付された画像に付随する一連の文書画像と
して管理したい場合には、上記実施の形態5と同様にに
マーク管理グループ番号を付与して管理する方法を採用
することもできる。
【0139】以下、算出手段120A(特徴量算出手段
1206、類似度算出手段1207)、文書タグ情報決
定手段1208では、それぞれ実施の形態5と同様、公
知の技術であるモーメント・インバリアントの特徴量に
基づいて、各マーク画像に関連付けられている文書タグ
情報を特定する。そして、特定された文書タグ情報をマ
ーク管理テーブル1213’の「文書タグ情報」フィー
ルド133’に格納する。
【0140】以上の処理を用いることにより、登録した
い紙文書の余白部分にマークを押して入力するだけで、
自動的に検出して文書タグ情報を付与することが可能に
なる。この場合、実施の形態5で用いた文書タグ情報指
定ページは不要であり、登録したい書類だけを入力する
ことになる。また上述のように、登録画像管理テーブル
1212’及びマーク管理テーブル1213’は、実施
の形態5における登録画像管理テーブル1212及びマ
ーク管理テーブル1213よりも簡単な構成となってい
る。
【0141】勿論、本実施の形態においても、実施の形
態5と同様、マーク抽出の処理を速めるために、マーク
の付されたページに2次元コード等を付与しておく方法
を採用することもできる。
【0142】また、本実施の形態では、紙文書の内容が
記載されている面の余白部分にマークを押して入力した
が、両面を読み取ることができるスキャナ等を利用する
場合には、書類の裏面にマークを押して入力する場合に
も同様の効果が期待できる。
【0143】更に、上記のマークは枠を持つものとした
が、この枠は必須のものではない。枠がない場合にも、
通常マークは紙文書本文中の文字よりも大きな黒画素連
結成分から構成されると考えられるので、本実施の形態
が適用できる。
【0144】
【発明の効果】以上説明したように、第1に、本発明に
よれば、抽出判定値より大きい領域平均文字サイズの領
域をタイトル領域として抽出するようにしているため、
1つの文書画像から複数のタイトル領域を抽出できる。
また、複数段階の抽出パラメータに基づいて複数段階の
抽出判定をすることもでき、更に、この複数段階の抽出
パラメータを入力された文書画像の特性に応じて決定で
きる。また、全平均文字サイズの算出、あるいは領域平
均文字サイズの算出に、大きい方の所定割合と小さい方
の所定割合に属する文字を除外して算出するトリム平均
を用いると、より精度を上げることができる。
【0145】更に、第2に、本発明によれば、キーボー
ドやポインティングデバイス等を用いることなく、マー
ク処理された書類を文書画像処理装置に入力するだけ
で、自動的に入力画像に文書タグ情報を付与することが
できる。ここで付与された文書タグ情報を利用すること
によって文書画像を検索することができるため、文書画
像処理装置を効率良く管理、運用することができるよう
になる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における文書画像処理装
置の概略機能ブロック図である。
【図2】実施の形態1におけるタイトル領域抽出処理の
フローチャートである。
【図3】実施の形態2におけるタイトル領域抽出処理の
フローチャートである。
【図4】実施の形態3におけるタイトル領域抽出処理の
フローチャートである。
【図5】実施の形態1における登録情報管理テーブルの
説明図である。
【図6】実施の形態2における登録情報管理テーブルの
説明図である。
【図7】ラベリング処理の説明図である。
【図8】領域分割処理の説明図である。
【図9】文字矩形の高さ・幅・面積の関係を示す図であ
る。
【図10】実施の形態1の検索時においてディスプレイ
に表示される内容を示す図である。
【図11】実施の形態2の検索時においてディスプレイ
に表示される内容を示す図である。
【図12】本発明の実施の形態5及び6における文書画
像処理装置の概略機能ブロック図である。
【図13】本発明の実施の形態5における登録画像管理
テーブルの説明図である。
【図14】本発明の実施の形態5におけるマーク管理テ
ーブルの説明図である。
【図15】文書タグ情報管理テーブルの説明図である。
【図16】マーク画像の抽出結果に関する説明図であ
る。
【図17】本発明の実施の形態6における登録画像管理
テーブルの説明図である。
【図18】本発明の実施の形態6におけるマーク管理テ
ーブルの説明図である。
【図19】文書タグ情報の概念を示す説明図である。
【符号の説明】
101 画像入力手段 102 文字矩形生成手段 103 領域分割手段 104 タイトル領域抽出手段 105 文字認識手段 106 文書登録手段 107 画像メモリ 108 記憶手段 108a 文書画像 108b タイトル領域画像 108c 登録情報管理テーブル 109 指示入力手段 110 表示制御手段 111a,111b 画像処理手段 112 修正手段 1201 画像入力手段 1202 画像メモリ 1203 画像データ圧縮処理手段 1204 画像2値化処理手段 1205,1205’ マーク抽出手段 120A 算出手段 1206 特徴量算出手段 1207 類似度算出手段 1208 文書タグ情報付与手段 1210 記憶手段 1211 画像記憶領域 1212,1212’ 登録画像管理テーブル 1213,1213’ マーク管理テーブル 1214 標準タグ情報管理テーブル 1215 標準タグ情報蓄積手段
フロントページの続き (72)発明者 梅林 明人 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5B050 BA10 BA16 DA06 EA01 EA03 EA04 EA07 5B075 ND07 NK31 NK39 NR03 NR12 5L096 BA17 EA35 EA43 FA44 FA59 FA64 GA15 GA34 HA08 JA03 JA11

Claims (29)

    【特許請求の範囲】
  1. 【請求項1】 紙文書を読み取って文書画像を生成する
    画像入力手段と、該文書画像を複数の領域に分割する領
    域分割手段と、該領域分割手段によって分割された各領
    域について文字の平均サイズに相当する領域平均文字サ
    イズを算出した後、該領域平均文字サイズに基づいて全
    領域の中からタイトル領域を抽出するタイトル領域抽出
    手段とを備えた文書画像処理装置において、 全領域の文字の平均サイズに相当する全平均文字サイズ
    を算出した後、該全平均文字サイズに抽出パラメータを
    乗算した抽出判定値と上記領域平均文字サイズとを比較
    し、上記抽出判定値より大きい領域平均文字サイズの領
    域をタイトル領域として抽出する上記タイトル領域抽出
    手段を備えたことを特徴とする文書画像処理装置。
  2. 【請求項2】 上記領域平均文字サイズと全平均文字サ
    イズとを、文字の平均高さに基づいて算出する上記タイ
    トル領域抽出手段を備える、請求項1に記載の文書画像
    処理装置。
  3. 【請求項3】 上記領域平均文字サイズと全平均文字サ
    イズとを、文字の平均幅に基づいて算出する上記タイト
    ル領域抽出手段を備える、請求項1に記載の文書画像処
    理装置。
  4. 【請求項4】 上記領域平均文字サイズと全平均文字サ
    イズとを、文字の平均面積に基づいて算出する上記タイ
    トル領域抽出手段を備える、請求項1に記載の文書画像
    処理装置。
  5. 【請求項5】 上記タイトル領域抽出手段が、複数段階
    の抽出パラメータを用いて複数段階の上記抽出判定値を
    算出する請求項1に記載の文書画像処理装置。
  6. 【請求項6】 上記タイトル領域抽出手段が、複数段階
    の抽出パラメータを用いて複数段階の上記抽出判定値を
    算出するとともに、抽出した段階を示すレベル属性を対
    応付けてタイトル領域を抽出する請求項1に記載の文書
    画像処理装置。
  7. 【請求項7】 上記タイトル領域抽出手段が、領域平均
    文字サイズの最大値を全平均文字サイズで除算した値に
    基づいて上記複数段階の抽出パラメータを決定する請求
    項2または3に記載の文書画像処理装置。
  8. 【請求項8】 上記タイトル領域抽出手段が、上記全平
    均文字サイズおよび領域平均文字サイズを、所定割合よ
    り大きい文字および所定割合より小さい文字を除外した
    文字より算出するトリム平均を用いる、請求項1に記載
    の文書画像処理装置。
  9. 【請求項9】 抽出された上記タイトル領域の文字列を
    修正する修正手段を備える、請求項1に記載の文書画像
    処理装置。
  10. 【請求項10】 上記文書画像が複数頁の文書画像であ
    る、請求項1に記載の文書画像処理装置。
  11. 【請求項11】 紙文書を読み取って文書画像を生成す
    る画像入力処理と、該文書画像を複数の領域に分割する
    分割処理と、各領域について文字の平均サイズに相当す
    る領域平均文字サイズを算出する算出処理と、該領域平
    均文字サイズに基づいて全領域の中からタイトル領域を
    抽出するタイトル抽出処理とを備える文書画像処理装置
    の文書タイトル抽出方法において、 全領域の文字の平均サイズに相当する全平均文字サイズ
    を算出する上記算出処理と、該全平均文字サイズに抽出
    パラメータを乗算した抽出判定値と上記領域平均文字サ
    イズとを比較する比較処理と、上記抽出判定値より大き
    い領域平均文字サイズの領域をタイトル領域として抽出
    する上記タイトル抽出処理とを備えることを特徴とす
    る、文書画像処理装置の文書タイトル抽出方法。
  12. 【請求項12】 上記領域平均文字サイズと全平均文字
    サイズとを、文字の平均高さに基づいて算出する上記算
    出処理を備える、請求項11に記載の文書タイトル抽出
    方法。
  13. 【請求項13】 上記領域平均文字サイズと全平均文字
    サイズとを、文字の平均幅に基づいて算出する上記算出
    処理を備える、請求項11に記載の文書タイトル抽出方
    法。
  14. 【請求項14】 上記領域平均文字サイズと全平均文字
    サイズとを、文字の平均面積に基づいて算出する上記算
    出処理を備える、請求項11に記載の文書タグ情報の抽
    出方法。
  15. 【請求項15】 上記タイトル抽出処理が、複数段階の
    抽出パラメータを用いて複数段階の上記抽出判定値を算
    出する請求項14に記載の文書画像処理装置の文書タイ
    トル抽出方法。
  16. 【請求項16】 複数段階の抽出パラメータを用いて複
    数段階の上記抽出判定値を算出するとともに、抽出した
    段階を示すレベル属性を対応付けてタイトル領域を抽出
    する上記タイトル抽出処理を備える、請求項14に記載
    の文書画像処理装置の文書タイトル抽出方法。
  17. 【請求項17】 領域平均文字サイズの最大値を全平均
    文字サイズで除算した値に基づいて上記複数段階の抽出
    パラメータを決定する上記タイトル抽出処理を備える、
    請求項15または16に記載の文書画像処理装置の文書
    タイトル抽出方法。
  18. 【請求項18】 所定割合より大きい文字および所定割
    合より小さい文字を除外した文字の平均値を算出するト
    リム平均を用いて全平均文字サイズおよび領域平均文字
    サイズを算出する上記タイトル抽出処理を備える、請求
    項11に記載の文書画像処理装置の文書タイトル抽出方
    法。
  19. 【請求項19】 抽出された上記タイトル領域の文字列
    を修正する修正処理を備える、請求項11に記載の文書
    画像処理装置の文書タイトル抽出方法。
  20. 【請求項20】 上記文書画像が複数頁の文書画像であ
    る、請求項11に記載の文書画像処理装置の文書タイト
    ル抽出方法。
  21. 【請求項21】 紙文書を読み取って生成した文書画像
    を複数の領域に分割するとともに、各領域について文字
    の平均サイズに相当する領域平均文字サイズと全領域の
    文字の平均サイズに相当する全平均文字サイズとを算出
    し、該全平均文字サイズに抽出パラメータを乗算した抽
    出判定値と上記領域平均文字サイズとを比較して、上記
    抽出判定値より大きい領域平均文字サイズの領域をタイ
    トル領域として抽出するプログラムを記録した、記録媒
    体。
  22. 【請求項22】 紙文書を読み取って文書画像を生成す
    る画像入力手段と、該文書画像を記憶する記憶手段とを
    備える文書画像処理装置において、 標準タグ情報を該標準タグ情報の属性値とともに蓄積し
    ておく標準タグ情報蓄積手段と、 上記紙文書上にユーザが付した特定のマークを抽出する
    マーク抽出手段と、 上記特定のマークを構成する画素の分布に基づいて該マ
    ークの特徴を表す特徴値を算出する算出手段と、 上記属性値と特徴値とに基づき、特定の標準タグ情報を
    選択して上記文書画像に付与する文書タグ情報付与手段
    とを備えることを特徴とする、文書画像処理装置。
  23. 【請求項23】 上記マーク抽出手段が特定の用紙上の
    上記特定のマークを抽出する、請求項22に記載の文書
    画像処理装置。
  24. 【請求項24】 上記マーク抽出手段が、2次元コード
    を付した用紙を上記特定の用紙として判別する、請求項
    23に記載の文書画像処理装置。
  25. 【請求項25】 上記マーク抽出手段が上記紙文書の余
    白上の上記特定のマークを抽出する、請求項22に記載
    の文書画像処理装置。
  26. 【請求項26】 上記紙文書が複数頁からなる、請求項
    22に記載の文書画像処理装置。
  27. 【請求項27】 紙文書を読み取って生成した文書画像
    の文書タグ情報を付与する文書画像処理装置の文書タグ
    情報付与方法において、 標準タグ情報を該標準タグ情報の属性値とともに蓄積し
    ておく文書タグ情報蓄積処理と、 上記紙文書上にユーザが付した特定のマークを抽出する
    マーク抽出処理と、 上記マークの画素の分布に基づいて該マークの特徴を表
    す数値を算出する算出処理と、 上記属性値と特徴値とに基づき、特定の標準タグ情報を
    選択して上記文書画像に付与する文書タグ情報付与処理
    とを備えることを特徴とする、文書画像処理装置の文書
    タグ情報付与方法。
  28. 【請求項28】 上記紙文書が複数頁からなる、請求項
    27に記載の文書画像処理装置の文書タグ情報付与方
    法。
  29. 【請求項29】 紙文書を読み取って文書画像を生成す
    る際に、該紙文書上にユーザが付したの特定のマークを
    抽出し、該マークの画素の分布に基づいた該マークの特
    徴を表す数値を算出するとともに、該数値に基づいて文
    書タグ情報の候補の中から上記文書画像に付与する文書
    タグ情報を選択するプログラムが記録された、記録媒
    体。
JP2000053079A 1999-03-01 2000-02-29 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法 Withdrawn JP2001034763A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000053079A JP2001034763A (ja) 1999-03-01 2000-02-29 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP5215699 1999-03-01
JP11-52156 1999-05-14
JP11-133849 1999-05-14
JP13384999 1999-05-14
JP2000053079A JP2001034763A (ja) 1999-03-01 2000-02-29 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法

Publications (1)

Publication Number Publication Date
JP2001034763A true JP2001034763A (ja) 2001-02-09

Family

ID=27294564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000053079A Withdrawn JP2001034763A (ja) 1999-03-01 2000-02-29 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法

Country Status (1)

Country Link
JP (1) JP2001034763A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006350959A (ja) * 2005-06-20 2006-12-28 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2007124153A (ja) * 2005-10-26 2007-05-17 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法、および画像処理プログラム
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image
JP2012216094A (ja) * 2011-03-31 2012-11-08 Fujifilm Corp 校正装置、校正方法及びプログラム
JP2017194832A (ja) * 2016-04-20 2017-10-26 京セラドキュメントソリューションズ株式会社 画像処理装置
JP2022104498A (ja) * 2020-12-28 2022-07-08 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006350959A (ja) * 2005-06-20 2006-12-28 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2007124153A (ja) * 2005-10-26 2007-05-17 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法、および画像処理プログラム
JP4661525B2 (ja) * 2005-10-26 2011-03-30 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法、および画像処理プログラム
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image
JP2012216094A (ja) * 2011-03-31 2012-11-08 Fujifilm Corp 校正装置、校正方法及びプログラム
JP2017194832A (ja) * 2016-04-20 2017-10-26 京セラドキュメントソリューションズ株式会社 画像処理装置
JP2022104498A (ja) * 2020-12-28 2022-07-08 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム

Similar Documents

Publication Publication Date Title
US7035463B1 (en) Document image processor, method for extracting document title, and method for imparting document tag information
CN109543501B (zh) 图像处理装置、图像处理方法和存储介质
Yanikoglu et al. Pink Panther: a complete environment for ground-truthing and benchmarking document page segmentation
Shahab et al. An open approach towards the benchmarking of table structure recognition systems
US7519226B2 (en) Form search apparatus and method
JP4266695B2 (ja) 画像処理装置及び画像処理方法
JP2776295B2 (ja) 画像インデックス生成方法及び画像インデックス生成装置
Xi et al. A video text detection and recognition system
US8520941B2 (en) Method and system for document image classification
JP5492205B2 (ja) 印刷媒体ページの記事へのセグメント化
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
EP1107169A2 (en) Method and apparatus for performing document structure analysis
JP6569500B2 (ja) 画像処理装置及び画像処理方法
US20110043869A1 (en) Information processing system, its method and program
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP7433887B2 (ja) 画像を処理するための装置、プログラム、画像処理方法
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
JP3851742B2 (ja) 帳票処理方法及び装置
US20100131841A1 (en) Document image layout apparatus
CN109685061A (zh) 适用于结构化的数学公式的识别方法
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
US6968501B2 (en) Document format identification apparatus and method
JP2001034763A (ja) 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法
US20010043742A1 (en) Communication document detector

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090708

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090916