JPH0757040A - Ocr付きファイリング装置 - Google Patents

Ocr付きファイリング装置

Info

Publication number
JPH0757040A
JPH0757040A JP5202253A JP20225393A JPH0757040A JP H0757040 A JPH0757040 A JP H0757040A JP 5202253 A JP5202253 A JP 5202253A JP 20225393 A JP20225393 A JP 20225393A JP H0757040 A JPH0757040 A JP H0757040A
Authority
JP
Japan
Prior art keywords
character
recognition
dictionary
area
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5202253A
Other languages
English (en)
Inventor
Yutaka Katsuyama
裕 勝山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5202253A priority Critical patent/JPH0757040A/ja
Publication of JPH0757040A publication Critical patent/JPH0757040A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明はOCR付きファイリング装置に関
し、文字認識用の認識辞書に対し、ファイル装置に保存
されている文字の認識結果を基に、常に学習を行うこと
により、認識辞書の認識性能を向上させることを目的と
する。 【構成】 画像入力部2Aと、入力画像を解析して属性
の異なる領域に分離する文書構造解析部4と、認識辞書
9を用いて文字認識を行う文字認識部5と、ファイル装
置7を備えた装置において、ファイル装置に格納された
文字領域内の文字データを対象とし、単語辞書、及び文
法を用いて文章解析処理を行い、誤認識文字を抽出し
て、その正解文字情報を求める文章解析処理部24を設
け、誤認識文字に関する情報を基に、文字認識部5が認
識辞書9の更新処理を行うことにより、認識辞書の最適
化を可能にした。また、文章解析処理、認識辞書更新処
理を、常時、バックグラウンド処理として実行可能に構
成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、OCR付きファイリン
グ装置に関する。この装置は、例えば、新聞の切り抜き
等の文書をスキャナで読み取り、入力画像を文字領域、
図表領域、写真領域等の属性の異なる領域に分離してフ
ァイル装置に格納すると共に、文字領域については文字
認識を行い、認識結果のデータも前記ファイル装置に格
納する機能を備えた装置である。
【0002】また、この装置では、ファイル装置に蓄積
したデータに対し、キーワード検索等を行うことによ
り、データの再編集等ができるようになっている。
【0003】
【従来の技術】図9は、従来技術の説明図であり、図9
中、1はOCR付きファイリング装置、2はスキャナ、
3はイメージメモリ、4は文書構造解析部、5は文字認
識部、7はファイル装置、8はキーワード検索部、9は
認識辞書、10はディスプレイを示す。
【0004】従来、OCR付きファイリング装置とし
て、例えば、図9に示したような装置が知られていた。
図示のように、このOCR付きファイリング装置1に
は、スキャナ2、イメージメモリ3、文書構造解析部
4、文字認識部5、ファイル装置7、キーワード検索部
8、ディスプレイ10等が設けてある。また、前記文字
認識部5には、文字認識処理で使用する認識辞書9が設
けてある。
【0005】この装置では、例えば、新聞の切り抜き等
の文書を入力し、その入力画像(イメージデータ)か
ら、本文、見出し等の「文字領域」、「図表領域」、
「写真領域」を抽出して自動的に分離し、ファイル装置
に格納する。また、「文字領域」については文字認識処
理を行い、その文字データも、ファイル装置に格納す
る。具体的には次の通りである。
【0006】先ず、スキャナ2で文書の読み取りを行
い、入力画像(イメージデータ)を2値化して、イメー
ジメモリ3に格納する。次に、イメージメモリ3に格納
した入力画像に対し、文書構造解析部4が、自動解析を
行い、「文字領域」、「図表領域」、「写真領域」を識
別して自動的に分離し、ファイル装置7に格納(ファイ
リング)する。
【0007】また、前記分離した「文字領域」は、文字
認識部5へ送り、文字認識を行う。この場合、文字認識
部5では、認識辞書9を用いて、前記の「文字領域」に
対し、文字認識処理を行い、認識結果のデータ(文字コ
ード)もファイル装置7に格納(ファイリング)する。
【0008】なお、前記ファイル装置7へのデータ格納
時には、文書構造解析部4で文書解析処理を行った際に
得られた各領域毎の属性データ等(本文、見出し、図
表、写真等に関する情報)も一緒に格納しておく。
【0009】このようにしてファイル装置7に蓄積した
データに対し、キーワード検索部8からキーワードを入
力して、キーワードによる文字データの検索ができるよ
うになっている。このキーワード検索で一致したデータ
があれば、その画像情報、及び属性データ等をディスプ
レイ10で表示する。
【0010】
【発明が解決しようとする課題】上記のような従来のも
のにおいては、次のような課題があった。検索対象とな
る文字データを生成する文字認識機能は、完璧な認識が
行われず、数%程度の誤りが生じるのが普通である。こ
のため、本来の情報には、キーワードがあるにも係わら
ず、検索に失敗し、検索できなくなる場合がある。
【0011】本発明は、このような従来の課題を解決
し、文字認識処理に使用する認識辞書に対して、ファイ
ル装置に保存されている文字の認識結果を基に、常に学
習を行うことにより、認識辞書の認識性能を向上させる
ことを目的とする。
【0012】
【課題を解決するための手段】図1は本発明の原理説明
図であり、図1中、図9と同じものは、同一符号で示し
てある。また、2Aは画像入力部、24は文章解析処理
部、25は単語辞書/文法部を示す。
【0013】本発明は上記の課題を解決するため、次の
ように構成した。 :文書画像を入力する画像入力部2Aと、入力した文
書画像を解析して、異なる属性の領域(文字領域、図表
領域、写真領域)に分離し、各種情報を抽出する文書構
造解析部4と、前記分離された領域の内、文字領域を対
象とし、認識辞書9を用いて文字認識を行う文字認識部
5と、前記各部で得られた文書データ(画像データ、文
字データ等)を格納するファイル装置7を備えたOCR
付きファイリング装置において、前記ファイル装置7に
格納された文書データの内、文字領域内の文字データを
対象として文章解析処理を行い、誤認識文字を抽出し
て、その正解文字情報を求める文章解析処理部24を設
け、前記誤認識文字に関する情報を基に、文字認識部5
が認識辞書9の更新処理を行うことにより、認識辞書の
最適化を可能にしたOCR付きファイリング装置。
【0014】:構成において、単語辞書、及び文法
情報を格納した単語辞書/文法部25を設け、単語辞書
/文法部25の単語辞書、及び文法を使用して、前記文
章解析処理部24による文章解析処理を行うOCR付き
ファイリング装置。
【0015】:構成において、文字認識部5による
認識辞書更新処理を行う際、前記誤認識文字に関する情
報を基に、誤認識文字に対応する画像データを切り出し
て特徴量を求め、該特徴量を基に、認識辞書9の更新処
理を行うOCR付きファイリング装置。
【0016】:構成において、内部処理をマルチタ
スクとすることにより、文章解析処理部24による文章
解析処理、及び文字認識部5による認識辞書更新処理
を、他の処理等とは関係なく、常時、バックグラウンド
ジョブとして実行可能にしたOCR付きファイリング装
置。
【0017】
【作用】上記構成に基づく本発明の作用を、図1に基づ
いて説明する。 :文書データを入力して、ファイル装置に保存する場
合には、次のように処理を行う。
【0018】先ず、画像入力部2Aで文書を読み込み、
画像を入力する。入力画像は、一旦イメージメモリ3に
格納した後、文書構造解析部4が文書解析処理を行う。
この時、文書構造解析部4は、イメージメモリ3上のデ
ータを走査して、「文字領域」と「図表領域」と「写真
領域」を抽出して分離する。また、前記各領域につい
て、領域の数、位置、横幅、縦高さ等の情報を抽出す
る。そして、これらのデータはファイル装置7へ転送し
て格納する。
【0019】また、前記処理で「文字領域」と判定した
場合には、文字認識部5で認識辞書9を用いて、文字認
識処理を行い、認識結果のデータも、ファイル装置7へ
転送して格納する。このようにして、ファイル装置7に
は、画像データと、文字データを格納する。
【0020】:バックグラウンドジョブによる認識辞
書の最適化処理の説明 バックグラウンドジョブによる認識辞書の最適化処理
は、次のようにして行う。
【0021】まず、文章解析処理部24は、ファイル装
置7に格納されている文字領域内の文字データを対象と
して、文章解析処理を行う。この場合、文章解析処理部
24では、単語辞書/文法部25の単語辞書、及び文法
を使用して、文章解析処理を行い、誤認識している文字
を抽出すると共に、文字の正解情報を求め、文字認識部
5へ送る。
【0022】その後、文字認識部5では、ファイル装置
7から、誤認識した文字に対応する画像データを切り出
し、特徴量に変換する。文字認識部5では、変換した特
徴量と、認識辞書9に格納してあるカテゴリの特徴量か
ら、辞書が認識に最適となるように、認識辞書9の更新
を行う。
【0023】以上の処理を、バックグラウンドジョブと
して、常に行うことにより、認識辞書に対する学習を行
って認識辞書の最適化を行うことができる。その結果、
認識辞書の認識性能を向上させることができる。
【0024】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図2〜図8は、本発明の実施例を示した図であ
り、図2〜図8中、図1、図9と同じものは、同一符号
で示してある。
【0025】また、11はCPU(中央処理装置)、1
2、13は入/出力制御部(以下単に「I/O」とい
う)、14はメモリ、17は光ディスク装置入/出力制
御部(以下、単に「光ディスク装置I/O」という)、
18は光ディスク装置、21はイメージ処理部、22は
整合部(または照合部)、23はキーワード記録/検索
部を示す。
【0026】§1:OCR付きファイリング装置の構成
説明・・・図2参照 図2は実施例の装置構成図である。図示のように、OC
R付きファイリング装置1には、CPU11、I/O1
2、13、スキャナ2、イメージメモリ3、ディスプレ
イ10、メモリ14、光ディスク装置I/O17、光デ
ィスク装置18、文書構造解析部4、文字認識部5、キ
ーワード記録/検索部23、文章解析処理部24、単語
辞書/文法部25を設ける。
【0027】また、前記文字認識部5には、イメージ処
理部21、整合部22、認識辞書9を設ける。前記各部
の機能等は、次の通りである。 (1) :CPU11は、OCR付きファイリング装置内
で、各種の制御を行うプロセッサである。
【0028】(2) :I/O12、13は、スキャナ2、
及びディスプレイの各入/出力制御を行うものである。 (3) :スキャナ2は、光学的に文書を読み取って、文書
画像を入力するものである。
【0029】(4) :ディスプレイ10は、各種情報の表
示を行うものである。 (5) :光ディスク装置I/O17は、光ディスク装置1
8の入/出力制御を行うものである。
【0030】(6) :光ディスク装置18は、データの記
録、及び再生の可能なファイル装置(例えば、光磁気デ
ィスク装置)である。 (7) :文書構造解析部4は、入力画像を解析して、「文
字領域」、「図表領域」、「写真領域」等の各領域に分
離したり、各領域毎の座標を検知したりするものである
(詳細は後述する)。
【0031】(8) :イメージ処理部21は、文字認識部
5において、文字認識処理を行う際のイメージデータ
(画像データ)の処理、例えば、特徴抽出処理等を行う
ものである。
【0032】(9) :整合部22は、イメージ処理部21
で処理した情報(特徴量等)を、認識辞書9と比較し
て、文字認識処理を行うものである。 (10):キーワード記録/検索部23は、文字データのキ
ーワードを光ディスク装置18に記録したり、光ディス
ク装置18に格納されている文字データを対象として、
キーワード検索を行ったりするものである。
【0033】(11):文章解析処理部24は、光ディスク
装置18内の文字データについて、単語辞書/文法部2
5の情報を用いて、文章解析処理を行うものである(詳
細は後述する)。
【0034】(12):単語辞書/文法部25は、単語辞
書、及び文章解析を行う場合に必要な文法情報を格納し
たものである。 (13):メモリ14はワーク用のメモリである。
【0035】§2:光ディスク装置内のデータの説明・
・・図2参照 光ディスク装置18に格納するデータとしては、例え
ば、:ファイル番号、:画像情報、:全領域数、
:画像領域数、:文字領域数等である。
【0036】前記:画像情報は、画像データ、バイナ
リコード列等で構成され、「横幅」、「縦高さ」等の情
報であり、:画像領域数は、「画像領域番号」と、
「画像領域開始位置」、「横幅」、「縦高さ」等からな
る。
【0037】また、前記:文字領域数は、「文字領域
内容」、「属性」からなり、「属性」は、「縦書き/横
書き」、「領域の開始位置」、「横幅」、「縦高さ」、
「画像領域との関係」等の情報からなる。
【0038】§3:文書データ保存手順の説明・・・図
2参照 以下、図2に基づいて、文書データ保存手順を説明す
る。 (1) :先ず、装置が起動すると、CPU11は、スキャ
ナ2を起動して、文書を読み込み、画像の入力を開始す
る。入力画像(イメージデータ)は、2値化した後、一
旦イメージメモリ3に格納する。
【0039】(2) :次に、CPU11は、文書構造解析
部4を起動し、イメージメモリ3内の入力画像(イメー
ジデータ)を解析する。この時、文書構造解析部4は、
イメージメモリ3上のデータを走査して、「文字領域」
と「図表領域」と「写真領域」を抽出して分離する。ま
た、前記各領域について、領域の数、位置、横幅、縦高
さの各情報を抽出する。
【0040】そして、これらのデータはCPU11の制
御により、光ディスク装置18へ転送して媒体(光ディ
スク)に格納する。この場合、「文字領域」について
は、その内容が、「縦書き」か、「横書き」かを自動判
定し、その情報も光ディスク装置18に格納する。
【0041】更に、写真や、図表等の側の文字領域につ
いては、例えば、ヒストグラム計算と、閾値による判定
により、その写真や図表の説明文の属性を判定し、光デ
ィスク装置18へ転送して媒体(光ディスク)に格納す
る。
【0042】すなわち、「図表領域」及び「写真領域」
からなる「画像領域」と、「文字領域」との関係を自動
判定し(画像領域と文字領域が、或る閾値以内の距離
で、画像領域の大きさに比べて、文字領域が十分小さい
等の条件判定で判定し)、「画像領域」の説明文である
と判定した「文字領域」については、その情報も光ディ
スク装置18に格納する。
【0043】なお、前記処理で「文字領域」と判定した
場合には、該当する領域について、文字認識部5による
文字認識処理を行い、光ディスク装置18に格納する。 (3) :前記文書構造解析部4による解析処理において、
「文字領域」と判定された領域については、CPU11
が文字認識部5を起動して文字認識処理を行う。
【0044】この場合、文字認識部5では、イメージメ
モリ3上の前記「文字領域」と判定した領域の範囲だけ
を対象として、イメージ処理部21がイメージ処理(特
徴抽出等)を行い、整合部22が、認識辞書9を用い
て、文字認識処理を行う。
【0045】(4) :前記文字認識部5による文字認識処
理が終了すると、前記文書構造解析部4で得られた属性
と共に、認識結果の文字データ(文字コード等)を、光
ディスク装置18に格納する。この場合、光ディスク装
置18内では、「画像データ」と「文字データ」は、2
つで1対をなすように管理される。
【0046】(5) :前記各処理を、例えば、読み込む文
書の1頁ごとに処理し、オペレータが指定した文書の単
位が終了するまで、繰り返す。 §4:キーワード検索手順の説明・・・図2参照 光ディスク装置に格納したデータについて、キーワード
検索する場合には、次のようにして行う。
【0047】(1) :先ず、キーボード等の入力手段によ
り、検索したい文書データに含まれていると思われるキ
ーワードを入力する。 (2) :キーワード記録/検索部23では、前記入力され
たキーワードを基に、光ディスク装置18に格納されて
いる文字データ部分全てを対象として、全文検索を行
う。この時、文字データ部分の中に、キーワードが存在
したら、そのファイルだけを、以降の検索の対象とす
る。
【0048】(3) :前記処理を繰り返して行い、多数の
ファイルから検索しようとしているファイルの候補を絞
り込み、候補が少なくなったら、オペレータの指示によ
り、文字データに対応している画像データを抽出する。
【0049】そして、CPU11の制御により、検索結
果のデータをディスプレイ10へ送って表示する。オペ
レータは、この表示画面を見て、目的のファイルであっ
たかどうかを確認する。
【0050】(4) :目的のファイルであった場合には、
プリントアウト、別ディスク装置へのデータ転送、FA
X送信等の手段により、前記データを出力する。 §5:文書構造検索手順の説明・・・図2参照 (1) :先ず、オペレータは、表示された文書構造キーワ
ードから、1つを選択、又はキー入力し、それを使用し
て検索を起動する。この時、CPU11は、キーワード
記録/検索部23を起動する。
【0051】(2) :キーワード記録/検索部23は、光
ディスク装置18に格納されている全文書の文字データ
を検索し、前記文書構造キーワードの含まれているもの
だけを以降の対象とする。
【0052】(3) :前記処理を繰り返して行い、多数の
ファイルから、検索しようとしているファイルの候補を
絞り込む。そして、候補が少なくなったら、オペレータ
の指示により、文字データに対応している画像データを
抽出する。
【0053】そして、CPU11の制御により、検索結
果のデータをディスプレイ10へ送って表示する。オペ
レータは、この表示画面を見て、目的のファイルであっ
たかどうかを確認する。
【0054】(4) :目的のファイルであった場合には、
プリントアウト、別ディスク装置へのデータ転送、FA
X送信等の手段により、前記データを出力する。 §6:バックグラウンドジョブによる辞書の最適化処理
(自動辞書更新処理)の説明・・・図2参照 バックグラウンドジョブによる認識辞書の最適化処理
(自動辞書更新処理)は、次のようにして行う。
【0055】(1) :CPU11により文章解析処理部2
4が起動されると、該文章解析処理部24では、光ディ
スク装置18に格納されているファイルの文字データ領
域内の文字データを読み出し、メモリ14に格納する。
【0056】(2) :この時、このファイルの画像情報
の、この文字領域を表す画像データを、メモリ14に格
納する。 (3) :文章解析処理部24では、メモリ14上の文字デ
ータに、単語辞書/文法部25の単語辞書、及び文法を
使用して、文章解析処理を行い、誤認識している文字を
抽出する。
【0057】そして、その位置、及びこの領域の最初か
ら何文字目かの情報を、前記メモリ14に記憶してお
く。また、この文字の正しいカテゴリを前記メモリ14
に記憶しておく。
【0058】(4) :次に、CPU11では、メモリ14
上にある誤認識した文字に関する情報を用い、光ディス
ク装置18から、誤認識した文字に対応する画像データ
(原画像データ)を切り出して文字認識部5へ送り、文
字認識部5を起動する。
【0059】(5) :文字認識部5では、イメージ処理部
21が、前記切り出した画像データから特徴量を抽出す
る。そして、文字認識部5では、前記抽出した特徴量
と、認識辞書9に格納してあるカテゴリの特徴量から、
辞書が認識に最適となるように、認識辞書の更新を行
う。
【0060】なお、認識辞書の更新処理としては、次の
ような方法がある(いずれも従来から使用されている方
法である)。 :辞書の正しい文字のカテゴリの特徴量と、誤認識し
た文字の特徴量とを、加重平均する方法。
【0061】:辞書内の全カテゴリの特徴量を対象
に、誤認識した文字の特徴量とで、クラスタリングを行
い、最も近いカテゴリを探す。そして、そのカテゴリ
が、誤認識した文字の正しいカテゴリでなかった場合
は、誤認識した文字の特徴量を、新たな文字の辞書に追
加する方法。
【0062】以上の処理を、光ディスク装置18に格納
されているファイルの全てを対象として行い、認識辞書
に対して学習を行う。 §7:文書データの説明と、文書構造解析部の処理説明
・・・図3参照 図3は文書データの説明図である。以下、図3を参照し
ながら、光ディスク装置に格納された文書データ(画像
データ、及び文字データ)、及び文書構造解析部の処理
を説明する。
【0063】前記のように、新聞の切り抜き等の文書
(活字文書)をスキャナ2で入力した後、2値化処理を
行い、イメージデータとして、イメージメモリ3に格納
する。この場合の2値化処理としては、次の通りであ
る。
【0064】例えば、読み込み濃度のヒストグラムをと
り、その最大頻度を含む頻度よりも、少し濃い濃度を閾
値とする処理を行う。最近では、スキャナ本体に付属す
る2値化アルゴリズムを利用するのが普通である。
【0065】これは、可変閾値をユーザが設定するもの
から、自動露出度測定によって読み込むライン毎に、閾
値を変化させて、成るべく背景濃度と図柄の濃度を区別
するようにするものである。
【0066】前記のようにして入力した文書データは、
図示のように、「文字領域1」、「文字領域2」、「文
字領域3」、「図表領域1」、「写真領域1」等で構成
されている。すなわち、文字が集まり、その外接が矩形
をなす「文字領域」、写真の外接を矩形で囲んだ「写真
領域」、画の外接が矩形をなす「図表領域」である。
【0067】ところで、前記文書構造解析部4では、以
下の3つの処理を行う。 :文書の中の「文字領域」、「写真領域」、「図表領
域」の各領域毎に座標、大きさを求め、それらを記憶す
る。
【0068】:「文字領域」と判定した領域では、更
に、その領域内の文字列(行)の方向から、縦書き、横
書きの判定を行い、それも記憶する。 :「写真領域」や、「図表領域」内にある文字領域に
ついては、写真、または図表と前記文字領域との近さ
が、或る一定閾値より小さければ、その写真、又は図表
の説明文であると判定し、その情報も記憶する。
【0069】§8:文書データの各領域抽出処理の説明
・・・図4参照 図4は領域抽出/判定処理フローチャートである。以
下、図4に基づいて、領域抽出/判定処理を説明する。
なお、S1〜S9は各処理番号を示す。
【0070】この処理は、文書を入力してイメージメモ
リ3に格納した入力画像(イメージデータ)を走査し
て、「文字領域」、「図表領域」、及び「写真領域」の
抽出を行う文書構造解析部4の処理である。
【0071】先ず、黒画素の塊の輪郭追跡から、それの
外接矩形の座標を求める(S1)。次に、矩形の高さの
ヒストグラムを求め、閾値以上の高さで、ヒストグラム
の山が途切れる所まで、文字部分と判断する(S2)。
そして、この範囲に入った矩形だけを抽出する(S
3)。この場合、小さな矩形だけが残る。
【0072】前記小さな矩形相互が閾値以下の距離にあ
り、それを1つにまとめて大きな矩形を形成する場合に
は、2つの小さな矩形の統合を行い1つの矩形とする。
この処理を繰り返して行い、大きな文字矩形領域を作
り、メモリ14に記憶する(S4)。
【0073】その後、原画像から前記文字矩形領域を取
り除き(S5)、残った画像から、先ず、線で構成され
ている部分を抽出する。これには、例えば、3×3の線
分検出マスクで画像を走査して、線分と思われる所をチ
ェックする。
【0074】線分と思われる所が多くある領域内で、黒
画素で連続している部分を「図表領域」として記憶する
(S6)。前記処理終了後、原画像から「図表領域」を
取り除き(S7)、残った画像は、「写真領域」と見な
して、連続する黒画素の外接矩形を求め、記憶する(S
8)。そして、前記各領域で重なりが出た場合には、
「文字領域」を優先して重なりを除く処理を行う(S
9)。
【0075】§9:文字領域の縦書き/横書き判定処理
の説明・・・図5参照 図5は文字領域の縦書き/横書き判定処理フローチャー
トである。以下、図5に基づいて、領域抽出/判定処理
を説明する。
【0076】なお、S11〜S14は各処理番号を示
す。また、この処理は、前記文書構造解析部4が行う処
理である。先ず、文字領域内にある、文字を表す黒画素
の外接矩形の並びを調査する(S11)。そして、矩形
の座標を、横書きを仮定して、矩形列を横に走査する。
この走査により、左上点座標、右上点座標の上下座標
が、或る閾値の範囲内に収まれば、横書きと判定する
(S12)。
【0077】同じようにして、矩形の座標を、縦書きを
仮定して、矩形列を縦に走査して、左上点座標、右上点
座標の左右の座標が、或る閾値の範囲内に収まれば、縦
書きと判定する(S13)。
【0078】また、どちらか片方の判定の場合には、そ
れを採用する。両方の判定が出た場合には、隣の矩形と
の平均距離が近い方を選択する(S14)。 §10:文書データの説明・・・図6参照 図6は文書データの説明図である。図示の文書データ例
は、光ディスク装置18に格納されている文書データの
1例である。
【0079】この例では、文書データは、「ページ」、
「写真領域」、「図表領域」、「文字領域」のそれぞれ
が、リスト構造となっている。これは、各要素が、幾つ
であるか、事前に予測がつかないためである。認識結果
の文字は、図の構造体の中に格納されるので、原画像
(入力画像)の中の、どの部分の文字領域の中の、どの
文字の認識した結果かが、特定できるようになっている
(文字IDが付されているため)。
【0080】文書データ例の各項目は次の通りである。 :「struct BOOK 」の項の「struct PAGE *page;」は
最初のページのデータへのポインタ、「struct IMAGE *
image;」は画像データへのポインタを示す。
【0081】:「struct PAGE 」の項の「struct PAG
E *page;」は次のページのデータへのポインタ」、「st
ruct PHOTO *photo;」は最初の写真領域のデータへのポ
インタ、「struct PICTURE *picture;」は最初の図表領
域のデータへのポインタ、「struct CHAR *char;」は最
初の文字領域のデータへのポインタを示す。
【0082】:「struct PHOTO」の項の「struct PHO
TO *photo;」は次の写真領域のデータへのポインタ」、
「int x1,y1,x2,y2;」は写真領域の矩形座標(左上、右
下)、「int beside; 」は説明文の文字領域番号を示
す。
【0083】:「struct PICTURE」の項の「struct P
ICTURE *picture;」は次の図表領域のデータへのポイン
タ、「int x1,y1,x2,y2;」は図表領域の矩形座標(左
上、右下)、「int beside; 」は説明文の文字領域番号
を示す。
【0084】:「struct CHAR 」の項の「struct CHA
R *char;」は次の文字領域のデータへのポインタ、「in
t x1,y1,x2,y2;」は文字領域の矩形座標(左上、右
下)、「struct CHARS *chars;」は認識結果文字列情報
へのポインタを示す。
【0085】:「struct CHARS」の項の「struct CHA
RS *chars;」は次の認識結果文字列情報へのポインタ、
「int x1,y1,x2,y2;」は文字を構成する画像の矩形座標
(左上、右下)、「int ID; 」は文字領域内での文字を
特定する文字ID、「int code; 」はこの文字のコード
(認識結果)を示す。
【0086】:「struct IMAGE」の項の「int x1,y1,
x2,y2;」は画像の範囲、「char image[1000000 ];」
は画像情報中身(2値化されたもの)を示す。 §11:バックグラウンドジョブ1の説明・・・図7参
照 図7はバックグラウンドジョブの説明図1であり、Aは
単語辞書の構造例、Bは単語辞書を使用した誤認識文字
検知処理フローチャートである。
【0087】:単語辞書の説明・・・図7A参照 図7Aに示したように、単語辞書/文法部25の単語辞
書は、複数の単語の集合で構成されている。単語の並べ
順は、JISで規定された順序とする。
【0088】この場合、各単語は特定のコード(0等)
で区切られている。例えば、図示のように「亜細亜,
0,亜熱帯,0,・・・・」のように構成されている。 :単語辞書を使用した誤認識文字検知処理の説明・・
・図7B参照 以下、図7Bに基づいて、文章解析処理部24による単
語辞書を使用した誤認識文字検知処理を説明する。な
お、S21〜S26は各処理番号を示す。
【0089】先ず、光ディスク装置18に格納されてい
る認識結果の文字列の中から、漢字が連続している箇所
を抽出する(S21)。そして、抽出した文字列に対し
て、単語辞書と比較する(S22)。
【0090】その結果、両者が一致しない場合には(S
23)、抽出文字列はそのまま(S24)とし、前記処
理(S21)から繰り返す。しかし、一致した場合(一
致度が、閾値より大きい場合)には(S23)、単語内
で、単語辞書と抽出文字列との違っている箇所を探し
て、その文字の「文字ID」を求める。また、その部分
の正しい文字コードを単語辞書から求める(S25)。
次に、「文字ID」及び正解コードをメモリ14へ格納
して(S26)処理を終了する。
【0091】なお前記処理を行う際、文章解析処理部2
4では、単語辞書/文法部25の文法も使用して解析処
理を行う。 §12:バックグラウンドジョブ2の説明・・・図8参
照 図8はバックグラウンドジョブの説明図2であり、Aは
認識辞書の構造例、Bは認識辞書更新処理フローチャー
トである。
【0092】:認識辞書の構造例の説明・・・図8A
参照 認識辞書は、図示のように、「文字コード」と、「特徴
量」の組みの集合である。例えば、文字「亜」の文字コ
ードは、「3021」であり、その特徴量は、3,5,
7,90,3,・・・となっている。
【0093】また、文字「唖」の文字コードは、「30
22」であり、その特徴量は、1,4,7,8,45
3,・・・となっている。 :認識辞書更新処理の説明・・・図8B参照 以下、図8Bに基づいて、認識辞書更新処理を説明す
る。なお、S31〜S35は各処理番号を示す。
【0094】この処理は文章解析処理部24による文章
解析処理で得られた情報(誤認識文字に関する情報)を
基に、文字認識部5が行う処理である。文字認識部5の
イメージ処理部21では、先ず、文章解析処理部24が
格納した文字ID、正解コードをメモリ14から取り出
す(S31)。そして、画像情報から、文字IDにあた
る部分を取り出し、特徴量ベクトルを生成する(S3
2)。このようにして特徴量ベクトルを得たら、これを
「更新用特徴量ベクトル」とする(S33)。
【0095】次に、認識辞書9の中で、正解コードの辞
書特徴量ベクトルを、重み付きで足して、正規化する
(S34)。そして、更新後の特徴量ベクトルを、新し
い辞書ベクトルとする(S35)。
【0096】
【発明の効果】以上説明したように、本発明によれば次
のような効果がある。 :蓄積されている大量の文書データから学習し、最適
化された認識辞書を使用するため、文字認識精度が向上
する。
【0097】:辞書更新処理をバックグラウンドジョ
ブとして行うので、ユーザが意識することなく、また、
ユーザが本装置を使用していない時でも、認識辞書の最
適化が可能となる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】実施例の装置構成図である。
【図3】実施例における文書データの説明図である。
【図4】実施例における領域抽出/判定処理フローチャ
ートである。
【図5】実施例における文字領域の縦書き/横書き判定
処理フローチャートである。
【図6】実施例における文書データの説明図である。
【図7】実施例におけるバックグラウンドジョブの説明
図1である。
【図8】実施例におけるバックグラウンドジョブの説明
図2である。
【図9】従来技術の説明図である。
【符号の説明】
2A 画像入力部 3 イメージメモリ 4 文書構造解析部 5 文字認識部 7 ファイル装置 9 認識辞書 24 文章解析処理部 25 単語辞書/文法部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文書画像を入力する画像入力部(2A)
    と、 入力した文書画像を解析して、異なる属性の領域(文字
    領域、図表領域、写真領域)に分離し、各種情報を抽出
    する文書構造解析部(4)と、 前記分離された領域の内、文字領域を対象とし、認識辞
    書(9)を用いて文字認識を行う文字認識部(5)と、 前記各部で得られた文書データ(画像データ、文字デー
    タ等)を格納するファイル装置(7)を備えたOCR付
    きファイリング装置において、 前記ファイル装置(7)に格納された文書データの内、
    文字領域内の文字データを対象として文章解析処理を行
    い、誤認識文字を抽出して、その正解文字情報を求める
    文章解析処理部(24)を設け、 前記誤認識文字に関する情報を基に、文字認識部(5)
    が認識辞書(9)の更新処理を行うことにより、認識辞
    書の最適化を可能にしたことを特徴とするOCR付きフ
    ァイリング装置。
  2. 【請求項2】 請求項1記載のOCR付きファイリング
    装置において、 単語辞書、及び文法情報を格納した単語辞書/文法部
    (25)を設け、 単語辞書/文法部(25)の単語辞書、及び文法を使用
    して、前記文章解析処理部(24)による文章解析処理
    を行うことを特徴としたOCR付きファイリング装置。
  3. 【請求項3】 請求項1記載のOCR付きファイリング
    装置において、 文字認識部(5)による認識辞書更新処理を行う際、 前記誤認識文字に関する情報を基に、誤認識文字に対応
    する画像データを切り出して特徴量を求め、 該特徴量を基に、認識辞書(9)の更新処理を行うこと
    を特徴としたOCR付きファイリング装置。
  4. 【請求項4】 請求項1記載のOCR付きファイリング
    装置において、 内部処理をマルチタスクとすることにより、 文章解析処理部(24)による文章解析処理、及び文字
    認識部(5)による認識辞書更新処理を、他の処理等と
    は関係なく、常時、バックグラウンドジョブとして実行
    可能にしたことを特徴とするOCR付きファイリング装
    置。
JP5202253A 1993-08-16 1993-08-16 Ocr付きファイリング装置 Pending JPH0757040A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5202253A JPH0757040A (ja) 1993-08-16 1993-08-16 Ocr付きファイリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5202253A JPH0757040A (ja) 1993-08-16 1993-08-16 Ocr付きファイリング装置

Publications (1)

Publication Number Publication Date
JPH0757040A true JPH0757040A (ja) 1995-03-03

Family

ID=16454490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5202253A Pending JPH0757040A (ja) 1993-08-16 1993-08-16 Ocr付きファイリング装置

Country Status (1)

Country Link
JP (1) JPH0757040A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314963A (ja) * 1995-05-18 1996-11-29 Power Reactor & Nuclear Fuel Dev Corp 情報検索方法および情報利用方法
JPH10289288A (ja) * 1997-04-16 1998-10-27 Canon Inc 画像処理方法及び装置
JP2007509418A (ja) * 2003-10-24 2007-04-12 マイクロソフト コーポレーション 手書き認識をパーソナル化するシステムと方法
JP2012053844A (ja) * 2010-09-03 2012-03-15 Denso Corp 手書文字入力システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314963A (ja) * 1995-05-18 1996-11-29 Power Reactor & Nuclear Fuel Dev Corp 情報検索方法および情報利用方法
JPH10289288A (ja) * 1997-04-16 1998-10-27 Canon Inc 画像処理方法及び装置
JP2007509418A (ja) * 2003-10-24 2007-04-12 マイクロソフト コーポレーション 手書き認識をパーソナル化するシステムと方法
JP2012053844A (ja) * 2010-09-03 2012-03-15 Denso Corp 手書文字入力システム

Similar Documents

Publication Publication Date Title
JP4332356B2 (ja) 情報検索装置及び方法並びに制御プログラム
CA2077274C (en) Method and apparatus for summarizing a document without document image decoding
JP2973944B2 (ja) 文書処理装置および文書処理方法
JP3183577B2 (ja) 画像内容を復号することなく文書画像中の意味的に重要な画像を選択するための方法
EP0677812B1 (en) Document storage and retrieval system
JP3289968B2 (ja) 電子的文書処理のための装置および方法
EP0854433B1 (en) Caption and photo extraction from scanned document images
KR100412317B1 (ko) 문자인식/수정방법및장치
JP2713622B2 (ja) 表形式文書読取装置
JP2004348591A (ja) 文書検索方法及び装置
JPS61267177A (ja) 文書画像追加情報の蓄積方法
JP3727974B2 (ja) 画像処理装置及び方法
JP2001092852A (ja) 文書検索システム操作方法、検索キー生成方法、文書管理システム、文書照会システム、文書アーカイブ・システム操作方法、文書データベース閲覧方法及び記憶媒体
US20060045340A1 (en) Character recognition apparatus and character recognition method
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2004334341A (ja) 文書検索装置、文書検索方法及び記録媒体
JPH0757040A (ja) Ocr付きファイリング装置
JPH08180068A (ja) 電子ファイリング装置
JP7172343B2 (ja) 文書検索用プログラム
JP3979288B2 (ja) 文書検索装置および文書検索プログラム
JP3727422B2 (ja) 文字認識装置及びその方法
JP2000137728A (ja) 文書解析装置及びプログラム記録媒体
JP2000259847A (ja) 情報検索方法、装置および記録媒体
JP4328511B2 (ja) パターン認識装置、パターン認識方法、プログラムおよび記憶媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20001107