JPH08263587A - 文書入力方法および文書入力装置 - Google Patents

文書入力方法および文書入力装置

Info

Publication number
JPH08263587A
JPH08263587A JP7061404A JP6140495A JPH08263587A JP H08263587 A JPH08263587 A JP H08263587A JP 7061404 A JP7061404 A JP 7061404A JP 6140495 A JP6140495 A JP 6140495A JP H08263587 A JPH08263587 A JP H08263587A
Authority
JP
Japan
Prior art keywords
character
character string
image
document
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7061404A
Other languages
English (en)
Inventor
Junichi Kubota
淳市 久保田
Yoshimoto Yamamoto
喜大 山本
Yukie Shoda
幸恵 庄田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7061404A priority Critical patent/JPH08263587A/ja
Publication of JPH08263587A publication Critical patent/JPH08263587A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 入力された文書画像を短時間で正しく認識
し、認識結果を容易に修正することができるとともに、
罫線枠に対して釣り合いの取れた文字サイズで印刷する
ことができる文書入力装置を提供する。 【構成】 CPU120は、尤度水準一時記憶部705
の尤度水準以上の尤度306を有する候補文字コード3
05の組み合わせから、文法的に解釈可能な補正結果3
08を生成し、所定数の認識列に対して補正結果308
が生成される毎に、補正結果308の第1候補をディス
プレイ106に表示する。CPU120は、オペレータ
による修正後の補正結果308と、最も尤度306の高
い候補文字コード305からなる同一認識列とを比較
し、文字認識の精度を算出する。算出された前記精度が
精度水準一時記憶部703の精度水準より低ければ、尤
度水準一時記憶部705内の尤度の基準値を変更する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像として読み取った
文書を、ワードプロセッサ、パーソナルコンピュータ等
のコンピュータ制御による文字認識を用いて文字コード
として入力する文書入力方法および文書入力装置に関す
る。
【0002】
【従来の技術】文書を効率的に入力するためOCR(O
ptical CharacterReader)や手
書き文字認識装置が開発、利用されている。このような
OCRあるいは手書き文字認識装置では、紙面などに書
かれた文字を画像として読み取り、その画像を1文字単
位に切り出して文字特徴を抽出し、抽出した文字特徴か
らその画像が表す文字を認識する。このような文字認識
において、例えば、漢字などの文字を認識する場合、漢
字などは類似文字が極めて多いために、文字単位の認識
処理では正解率に限界があり、文字認識過程で認識誤り
が発生する。この認識誤りを補正するため、認識結果と
単語辞書とを照合し、認識結果として得られた文字の並
びが日本語として適切か否かを判断することによって、
認識誤り補正処理が行われる。このような認識誤り補正
処理の例が、丹羽、萱島による学会報告「電子情報通信
学会技術報告PRU91−135 文字認識後処理法と
後処理による効果の分析」などに開示されている。前記
学会報告では、文字認識過程で発生する認識誤りを、7
0%の誤り訂正率で補正することができた例について言
及されており、このような方法による認識誤り補正処理
が、認識結果として入力される日本語文書の正解率を高
めるのに有用であることが判る。
【0003】
【発明が解決しようとする課題】しかしながら、日本語
の帳票(ここで、「帳票」とは、帳簿、伝票、届け出用
紙など、必要事項を記入するための空欄を設けて印刷し
た事務用紙をいう。)、レポート、パンフレット等の文
書に多く見られるように、文字が所定の枠内あるいは所
定の区間内に一定間隔で配置された、すなわち、文字が
均等割りつけされた日本語文書を画像から文字コードに
変換して入力する場合、従来の認識誤り補正処理では、
文字と文字との間の空白を単語区切りと見なしてしま
い、単語辞書との照合がうまくいかず、補正処理の効果
を十分に発揮することができなかった。
【0004】さらに、前述のような均等割付された文字
列を、各文字が紙面上のどの位置に配置されていたかを
示すレイアウト情報を残したまま文字認識する場合、認
識結果として得られた文字コードを前記レイアウト情報
とは別に管理していたため、入力結果の文字列を修正す
る場合、修正の手間がかかるという問題があった。具体
的には、例えば、「備考」が均等割付されて「備」と
「考」との間に空白が入っていたとき、従来の文書入力
装置では、「備」と「考」とに分割された文字認識をし
てしまう。この場合、「備考」という文字列を「その
他」に変更したいとき、「備」を「そ」に、「考」を
「他」にと認識結果である個別の文字毎に修正し、さら
にその間の空白に「の」を一文字追加するという手間が
かかってしまう。
【0005】また、帳票枠内文字のように、レイアウト
上は縦書きと横書きの両方の解釈が成り立つ場合、認識
しようとする文字列の方向が判別できない上、前記文字
列方向について間違った解釈をすると、補正処理の効果
が発揮できないという問題があった。また、住所表示を
画像から文字コードとして入力する場合、住所表示には
類似字形の地名が多くあることから、そのような地名を
認識誤りし易いという問題があった。
【0006】また、コピーされた原稿などが入力される
場合、コピーむら等のため原稿の一部が薄くなり、文字
認識率が大幅に低下することがある。従来の認識誤り補
正処理では、このような場合にも画一的な処理をしてい
たため、画質の悪化などのため文字認識性能の大幅な低
下が生じた場合に、必ずしも最適な候補を提示すること
ができなかった。逆に、原稿の画質が良く、はじめから
認識率が高い場合にも、最悪の場合を想定した認識誤り
補正処理を行っていたので、後処理に長い時間を要して
いた。
【0007】また、従来の文書入力装置では、文書入力
装置に予め設定されていた印字文字サイズでそのまま印
刷してしまうので、認識結果として得られた文字を、設
定された罫線枠に比べて釣り合いの悪い文字サイズで印
刷することがあった。上記課題に鑑みて、本発明は、均
等割り付けされた文字、文字列方向がどちらともとれる
帳票枠内文字、住所表示中の地名および印字画質の悪い
原稿中の文字など、文書の種別や原稿の状態にかかわら
ず、文書を正しく認識し、認識後の文字の修正を容易に
行うことができるとともに、認識誤り補正処理にかかる
時間を短縮し、設定された罫線枠に対して釣り合いの取
れたサイズの文字を印刷することができる文書入力装置
を提供することを目的とする。
【0008】
【課題を解決するための手段】上記課題に鑑みて、本発
明の請求項1記載の文書入力装置は、1つの文字の画像
の文字認識結果として、文字コードの複数の候補を、そ
の確からしさを示す尤度と対応付けて記憶する文字コー
ド候補記憶手段と、前記尤度のあらかじめ定める尤度基
準値を記憶する尤度基準記憶手段と、取り込まれた文書
の画像中の文字列を表す同一の文字列画像について、前
記尤度基準記憶手段内の前記尤度基準値以上の尤度を有
する前記文字コードの候補の組み合わせから、文法的に
正しく解釈することができる文字列の複数の候補を生成
する文字列候補生成手段と、前記文字列画像に対応して
生成された前記文字列の候補に対して、同一の前記文字
列画像について生成された文字列の候補のうち、所定の
候補を表示する表示手段と、前記文字列画像に対応して
生成された前記文字列の候補に対して、オペレータから
の修正指示を入力する入力手段と、前記文字列画像に対
応して生成された前記文字列の候補に対して、前記修正
指示に従って、誤って認識されている文字コードを、正
しい文字コードに修正する修正手段と、前記修正手段に
よる修正の後、前記文字列画像に対応する修正後の文字
列と、同一文字列画像に対応する最も尤度の高い文字コ
ードの候補からなる文字列とを比較する比較手段と、前
記比較手段による比較の後、前記比較結果に基づいて、
前記両者の間で相違する文字数と前記一方の文字列に含
まれる文字数との割合から、文字認識の正解率を算出す
る正解率算出手段と、前記正解率のあらかじめ定める正
解率基準値を記憶する正解率基準記憶手段と、前記正解
率が算出された後、算出された正解率が、前記正解率基
準値と比較して所定の条件を満足する場合には、算出さ
れた正解率に応じて尤度基準記憶手段内の前記尤度基準
値を変更する尤度基準値変更手段とを備える。
【0009】請求項2記載の文書入力装置は、1つの文
字の画像の文字認識結果として、文字コードの複数の候
補を、その確からしさを示す尤度と対応付けて記憶する
文字コード候補記憶手段と、前記尤度のあらかじめ定め
る尤度基準値を記憶する尤度基準記憶手段と、取り込ま
れた文書の画像中の文字列を表す同一の文字列画像につ
いて、前記尤度基準記憶手段内の前記尤度基準値以上の
尤度を有する前記文字コードの候補の組み合わせから、
文法的に正しく解釈することができる文字列の複数の候
補を生成する文字列候補生成手段と、前記文字列画像に
対応して生成された前記文字列の候補に対して、同一の
前記文字列画像について生成された文字列の候補のう
ち、所定の候補を表示する表示手段と、前記文字列画像
に対応して生成された前記文字列の候補に対して、オペ
レータからの修正指示を入力する入力手段と、前記入力
手段から入力された修正指示を計数する修正指示計数手
段と、前記修正指示数のあらかじめ定める修正指示数基
準値を記憶する修正指示基準記憶手段と、前記文字列画
像に対応して生成された前記文字列の候補に対して、前
記修正指示に従って、誤って認識されている文字コード
を、正しい文字コードに修正する修正手段と、前記修正
手段による修正の後、計数された修正指示数が、前記修
正指示基準記憶手段に記憶されている修正指示数基準値
と比較して所定の条件を満足する場合には、計数された
修正指示数に応じて尤度基準記憶手段内の前記尤度基準
値を変更する尤度基準値変更手段とを備える。
【0010】請求項3記載の文書入力装置は、一行の文
字列を表す文字列画像から切り出された1文字の画像
と、それに隣接する1文字の画像との間の空白を検出す
る空白検出手段と、検出された空白が所定の大きさより
大きい場合、前記1文字の画像とそれに隣接する1文字
の画像とは、それぞれ、異なる単語に属する文字である
と識別する単語識別手段と、取り込まれた文書の画像中
の所定の領域内の文字列画像について、前記単語識別手
段の識別結果を無効とする単語識別限定手段とを備え
る。
【0011】請求項4記載の文書入力装置は、取り込ま
れた文書の画像から切り出された1文字の画像の文字認
識結果として文字コードの複数の候補を記憶する文字コ
ード候補記憶手段と、取り込まれた文書の画像中の文字
列を表す同一の文字列画像について、前記文字コードの
候補を組み合わせ、文法的に正しく解釈することができ
る文字列の複数の候補を生成する文字列候補生成手段
と、生成された文字列の候補を格納する文字列候補記憶
手段と、1つの文字列画像に対応する所定の文字列の候
補を、前記文字列候補記憶手段から読み出して、識別さ
れた罫線枠内に均等割り付けして表示する表示手段とを
備える。
【0012】請求項5記載の文書入力装置は、取り込ま
れた文書の画像から切り出された1文字の画像の文字認
識結果として文字コードの複数の候補を記憶する文字コ
ード候補記憶手段と、取り込まれた文書の画像内の画像
領域と空白領域との分布に基づいて、取り込まれた文書
の画像内の文字列の方向が縦横いずれの方向であるかを
識別する文字列方向識別手段と、取り込まれた文書の画
像内の画像領域と空白領域との分布からは、文字列の方
向が縦横いずれの方向であるとも解釈できる場合、前記
両方向について、それぞれ、文字列を表す同一の文字列
画像について、前記文字コードの候補を組み合わせ、文
法的に正しく解釈することができる文字列の複数の候補
を生成する文字列候補生成手段と、前記縦方向の文字列
画像について生成された文字列の候補のうちの所定の候
補と、前記横方向の文字列画像について生成された文字
列の候補のうちの所定の候補とを比較して、前記所定の
候補が予め定める条件を満足する方の文字列方向および
その文字列の候補を有効と判定する文字列方向判定手段
とを備える。
【0013】請求項6記載の文書入力装置は、取り込ま
れた文書の画像内の罫線枠を識別する罫線枠識別手段
と、取り込まれた文書の画像から切り出された1文字の
画像の文字認識結果として、文字コードの複数の候補
を、当該文字の画像の前記文書の画像内における位置お
よび文字サイズとともに記憶する文字コード候補記憶手
段と、取り込まれた文書の画像中の文字列を表す同一の
文字列画像について、前記文字コードの候補の組み合わ
せから、文法的に正しく解釈することができる文字列の
複数の候補を生成する文字列候補生成手段と、生成され
た文字列の候補のうちの所定の候補を、識別された前記
罫線枠内に印字する際、当該文字列の候補内の前記文字
コードの候補が対応する画像の文字サイズを調べ、印字
することができる印字フォントサイズの中から、調べた
文字サイズに最も近い印字フォントサイズを選択する印
字文字サイズ選択手段と、識別された罫線枠を印字する
とともに、生成された文字列の候補のうちの所定の候補
を、印字された罫線枠内に、選択された印字文字サイズ
で印字する印字手段とを備える。
【0014】請求項7記載の文書入力装置は、請求項6
記載の文書入力装置において、前記文字コード候補記憶
手段を参照して、前記文字列の候補内の前記文字コード
の候補が対応する画像の前記文書の画像内における位置
を調べ、当該文字の画像を挟む上下の空白領域の大きさ
を算出する上下間隔算出手段と、前記文字コード候補記
憶手段を参照して、前記文字列の候補内の前記文字コー
ドの候補が対応する画像の前記文書の画像内における位
置を調べ、当該文字の画像を挟む左右の空白領域の大き
さを算出する左右間隔算出手段と、選択される印字フォ
ントサイズの上下方向の大きさが、算出された上下の空
白領域の大きさと比べて所定の大きさを越えないよう、
選択される印字フォントサイズの上下方向の大きさを限
定する上下サイズ限定手段と、選択される印字フォント
サイズの左右方向の大きさが、算出された左右の空白領
域の大きさと比べて所定の大きさを越えないよう、選択
される印字フォントサイズの左右方向の大きさを限定す
る左右サイズ限定手段とを備え、前記印字文字サイズ選
択手段は、前記上下サイズ限定手段と前記左右サイズ限
定手段とによって限定された印字フォントサイズの中か
ら、調べた文字サイズに最も近い印字フォントサイズを
選択する。
【0015】請求項8記載の文書入力装置は、取り込ま
れた文書の画像から切り出された1文字の画像の文字認
識結果として文字コードの複数の候補を記憶する文字コ
ード候補記憶手段と、文字列を表す同一の文字列画像に
ついて、前記文字コードの候補を組み合わせ、用語とし
て正しく解釈することができる文字列の複数の候補を、
所定の優先順位とともに生成する文字列候補生成手段
と、生成された文字列の候補の中から、特定の文字コー
ドを識別し、その文字コードを含む文字列の候補および
当該文字列の候補と同一文字列画像について生成された
文字列の候補が表す用語の属性を判定する属性判定手段
と、相互に関連した属性を有する用語同士を対応付けて
格納する属性間対応用語記憶手段と、あらかじめ定める
属性別に、属性が判定された前記文字列の候補を前記優
先順位とともに格納する属性別文字列候補記憶手段と、
前記属性別文字列候補記憶手段に格納されている文字列
の候補であって、前記属性間対応用語記憶手段に格納さ
れている用語の属性を表すものについて、前記各文字列
の候補をキーとして、前記前記属性間対応用語記憶手段
から対応する用語を検索する用語検索手段と、前記属性
別文字列候補記憶手段に格納されている文字列の候補の
うち、相互に関連した他の属性の文字列の候補をキーと
する前記用語検索手段の検索結果と共通する文字列の候
補の優先順位を高める優先順位変更手段とを備える。
【0016】請求項9記載の文書入力方法は、取り込ま
れた文書の画像中の文字列を表す同一の文字列画像につ
いて、前記尤度基準記憶部に格納されている尤度基準値
以上の尤度を有する前記文字コードの候補の組み合わせ
から、文法的に正しく解釈することができる文字列の複
数の候補を生成する文字列候補生成ステップと、前記文
字列画像に対応して生成された前記文字列の候補に対し
て、同一の前記文字列画像について生成された文字列の
候補のうち、所定の候補を表示する表示ステップと、前
記文字列画像に対応して生成された前記文字列の候補に
対して、オペレータからの修正指示を入力する入力ステ
ップと、前記文字列画像に対応して生成された前記文字
列の候補に対して、前記修正指示に従って、誤って認識
されている文字コードを、正しい文字コードに修正する
修正ステップと、前記修正の後、前記文字列画像に対応
する修正後の文字列と、同一文字列画像に対応する最も
尤度の高い文字コードの候補からなる文字列とを比較す
る比較ステップと、前記比較の後、前記比較結果に基づ
いて、前記両者の間で相違する文字数と前記一方の文字
列に含まれる文字数との割合から、文字認識の正解率を
算出する正解率算出ステップと、前記正解率が算出され
た後、算出された正解率が、前記正解率基準記憶部に格
納されている正解率基準値と比較して所定の条件を満足
する場合には、算出された正解率に応じて尤度基準記憶
部内の前記尤度基準値を変更し、前記文字列候補生成ス
テップに戻る尤度基準値変更ステップとを備える。
【0017】請求項10記載の文書入力方法は、取り込
まれた文書の画像中の文字列を表す同一の文字列画像に
ついて、前記尤度基準記憶部内の前記尤度基準値以上の
尤度を有する前記文字コードの候補の組み合わせから、
文法的に正しく解釈することができる文字列の複数の候
補を生成する文字列候補生成ステップと、前記文字列画
像に対応して生成された前記文字列の候補に対して、同
一の前記文字列画像について生成された文字列の候補の
うち、所定の候補を表示する表示ステップと、前記文字
列画像に対応して生成された前記文字列の候補に対し
て、オペレータからの修正指示を入力する入力ステップ
と、入力された修正指示を計数する修正指示計数ステッ
プと、前記文字列画像に対応して生成された前記文字列
の候補に対して、前記修正指示に従って、誤って認識さ
れている文字コードを、正しい文字コードに修正する修
正ステップと、前記修正の後、計数された修正指示数
が、前記修正指示基準記憶部に記憶されている修正指示
数基準値と比較して所定の条件を満足する場合には、計
数された修正指示数に応じて尤度基準記憶部内の前記尤
度基準値を変更する尤度基準値変更ステップとを備え
る。
【0018】請求項11記載の文書入力方法は、一行の
文字列を表す文字列画像から切り出された1文字の画像
と、それに隣接する1文字の画像との間の空白を検出す
る空白検出ステップと、検出された空白が所定の大きさ
より大きい場合、前記1文字の画像とそれに隣接する1
文字の画像とは、それぞれ、異なる単語に属する文字で
あると識別する単語識別ステップと、取り込まれた文書
の画像中の所定の領域内の文字列画像について、前記識
別結果を無効とする単語識別限定ステップとを備える。
【0019】請求項12記載の文書入力方法は、取り込
まれた文書の画像中の文字列を表す同一の文字列画像に
ついて、前記文字コードの候補を組み合わせ、文法的に
正しく解釈することができる文字列の複数の候補を生成
する文字列候補生成ステップと、生成された文字列の候
補を文字列候補記憶部に格納する文字列候補格納ステッ
プと、1つの文字列画像に対応する所定の文字列の候補
を、前記文字列候補記憶部から読み出して、識別された
罫線枠内に均等割り付けして表示する表示ステップとを
備える。
【0020】請求項13記載の文書入力方法は、取り込
まれた文書の画像内の画像領域と空白領域との分布に基
づいて、取り込まれた文書の画像内の文字列の方向が縦
横いずれの方向であるかを識別する文字列方向識別ステ
ップと、取り込まれた文書の画像内の画像領域と空白領
域との分布からは、文字列の方向が縦横いずれの方向で
あるとも解釈できる場合、前記両方向についてそれぞ
れ、文字列を表す同一の文字列画像について、前記文字
コードの候補の組み合わせから、文法的に正しく解釈す
ることができる文字列の複数の候補を生成する文字列候
補生成ステップと、前記縦方向の文字列画像について生
成された文字列の候補のうちの所定の候補と、前記横方
向の文字列画像について生成された文字列の候補のうち
の所定の候補とを比較して、前記所定の候補が予め定め
る条件を満足する方の文字列方向およびその文字列の候
補を有効と判定する文字列方向判定ステップとを備え
る。
【0021】請求項14記載の文書入力方法は、取り込
まれた文書の画像内の罫線枠を識別する罫線枠識別ステ
ップと、取り込まれた文書の画像中の文字列を表す同一
の文字列画像について、前記文字コードの候補の組み合
わせから、文法的に正しく解釈することができる文字列
の複数の候補を生成する文字列候補生成ステップと、生
成された文字列の候補のうちの所定の候補を、識別され
た前記罫線枠内に印字する際、当該文字列の候補内の前
記文字コードの候補が対応する画像の文字サイズを調
べ、印字することができる印字フォントサイズの中か
ら、調べた文字サイズに最も近い印字フォントサイズを
選択する印字文字サイズ選択ステップと、識別された罫
線枠を印字するとともに、生成された文字列の候補のう
ちの所定の候補を、印字された罫線枠内に、選択された
印字文字サイズで印字する印字ステップとを備える。
【0022】請求項15記載の文書入力方法は、請求項
14記載の文書入力方法において、前記罫線枠識別ステ
ップの後、前記文字コード候補記憶部を参照して、前記
文字列の候補内の前記文字コードの候補が対応する画像
の前記文書の画像内における位置を調べ、当該文字の画
像を挟む上下の空白領域の大きさを算出する上下間隔算
出ステップと、前記文字コード候補記憶部を参照して、
前記文字列の候補内の前記文字コードの候補が対応する
画像の前記文書の画像内における位置を調べ、当該文字
の画像を挟む左右の空白領域の大きさを算出する左右間
隔算出ステップと、選択される印字フォントサイズの上
下方向の大きさが、算出された上下の空白領域の大きさ
と比べて所定の大きさを越えないよう、選択される印字
フォントサイズの上下方向の大きさを限定する上下サイ
ズ限定ステップと、選択される印字フォントサイズの左
右方向の大きさが、算出された左右の空白領域の大きさ
と比べて所定の大きさを越えないよう、選択される印字
フォントサイズの左右方向の大きさを限定する左右サイ
ズ限定ステップとを備える。
【0023】請求項16記載の文書入力方法は、文字列
を表す同一の文字列画像について、前記文字コードの候
補を組み合わせ、用語として正しく解釈することができ
る文字列の複数の候補を、所定の優先順位とともに生成
する文字列候補生成ステップと、生成された文字列の候
補の中から、特定の文字コードを識別し、その文字コー
ドを含む文字列の候補および当該文字列の候補と同一文
字列画像について生成された文字列の候補が表す用語の
属性を判定する属性判定ステップと、あらかじめ定める
属性別に、属性が判定された前記文字列の候補を前記優
先順位とともに属性別文字列候補記憶部に格納する属性
別文字列候補格納ステップと、前記属性別文字列候補記
憶部に格納されている文字列の候補であって、前記属性
間対応用語記憶部に格納されている用語の属性を表すも
のについて、前記各文字列の候補をキーとして、前記前
記属性間対応用語記憶部から対応する用語を検索する用
語検索ステップと、前記属性別文字列候補記憶部に格納
されている文字列の候補のうち、相互に関連した他の属
性の文字列の候補をキーとする前記検索結果と共通する
文字列の候補の優先順位を高める優先順位変更ステップ
とを備える。
【0024】
【作用】本発明に従えば、請求項1記載の文書入力装置
において、文字コード候補記憶手段は、1つの文字の画
像の文字認識結果として、文字コードの複数の候補を、
その確からしさを示す尤度と対応付けて記憶する。尤度
基準記憶手段は、前記尤度のあらかじめ定める尤度基準
値を記憶する。文字列候補生成手段は、取り込まれた文
書の画像中の文字列を表す同一の文字列画像について、
前記尤度基準記憶手段内の前記尤度基準値以上の尤度を
有する前記文字コードの候補の組み合わせから、文法的
に正しく解釈することができる文字列の複数の候補を生
成する。表示手段は、前記文字列画像に対応して生成さ
れた前記文字列の候補に対して、同一の前記文字列画像
について生成された文字列の候補のうち、所定の候補を
表示する。入力手段は、前記文字列画像に対応して生成
された前記文字列の候補に対して、オペレータからの修
正指示を入力する。修正手段は、前記文字列画像に対応
して生成された前記文字列の候補に対して、前記修正指
示に従って、誤って認識されている文字コードを、正し
い文字コードに修正する。比較手段は、前記修正手段に
よる修正の後、前記文字列画像に対応する修正後の文字
列と、同一文字列画像に対応する最も尤度の高い文字コ
ードの候補からなる文字列とを比較する。正解率算出手
段は、前記比較手段による比較の後、前記比較結果に基
づいて、前記両者の間で相違する文字数と前記一方の文
字列に含まれる文字数との割合から、文字認識の正解率
を算出する。正解率基準記憶手段は、前記正解率のあら
かじめ定める正解率基準値を記憶する。尤度基準値変更
手段は、前記正解率が算出された後、算出された正解率
が、前記正解率基準値と比較して所定の条件を満足する
場合には、算出された正解率に応じて尤度基準記憶手段
内の前記尤度基準値を変更する。
【0025】従って、本発明によれば、前記文字列画像
に対応して生成された前記文字列の候補に対して、前記
正解率で表される文字認識の精度を算出し、算出された
文字認識の精度に応じて、前記文字列候補生成手段が組
み合わせに用いる文字コードの候補の数を限定するの
で、文字認識精度の変動に適応した文字列候補生成処理
を行うことができる。すなわち、認識対象となる文書の
原稿が、何度もコピーされて文字のかすれや汚れを生じ
た原稿であって、文字認識精度が低いときには、前記文
字列候補生成手段が組み合わせに用いる文字コードの候
補の数を多くすることによって、生成される文字列の候
補の正解率を高めることができる。また、認識対象とな
る文書の原稿が鮮明な画像で得られた場合のように、文
字認識精度が高いときには、前記文字列候補生成手段が
組み合わせに用いる文字コードの候補の数を少なくする
ことによって、前記文字列候補生成手段の文字列候補生
成速度を短縮することができ、結果的に、文書入力装置
全体の処理時間を短縮することができる。
【0026】請求項2記載の文書入力装置において、文
字コード候補記憶手段は、1つの文字の画像の文字認識
結果として、文字コードの複数の候補を、その確からし
さを示す尤度と対応付けて記憶する。尤度基準記憶手段
は、前記尤度のあらかじめ定める尤度基準値を記憶す
る。文字列候補生成手段は、取り込まれた文書の画像中
の文字列を表す同一の文字列画像について、前記尤度基
準記憶手段内の前記尤度基準値以上の尤度を有する前記
文字コードの候補の組み合わせから、文法的に正しく解
釈することができる文字列の複数の候補を生成する。表
示手段は、前記文字列画像に対応して生成された前記文
字列の候補に対して、同一の前記文字列画像について生
成された文字列の候補のうち、所定の候補を表示する。
入力手段は、前記文字列画像に対応して生成された前記
文字列の候補に対して、オペレータからの修正指示を入
力する。修正指示計数手段は、前記入力手段から入力さ
れた修正指示を計数する。修正指示基準記憶手段は、前
記修正指示数のあらかじめ定める修正指示数基準値を記
憶する。修正手段は、前記文字列画像に対応して生成さ
れた前記文字列の候補に対して、前記修正指示に従っ
て、誤って認識されている文字コードを、正しい文字コ
ードに修正する。尤度基準値変更手段は、前記修正手段
による修正の後、計数された修正指示数が、前記修正指
示基準記憶手段に記憶されている修正指示数基準値と比
較して所定の条件を満足する場合には、計数された修正
指示数に応じて尤度基準記憶手段内の前記尤度基準値を
変更する。
【0027】従って、本発明によれば、計数された修正
指示数に応じて尤度基準記憶手段内の前記尤度基準値を
変更するので、請求項1における正解率を算出する手間
が省け、より容易に上記効果を得ることができる。請求
項3記載の文書入力装置において、空白検出手段は、一
行の文字列を表す文字列画像から切り出された1文字の
画像と、それに隣接する1文字の画像との間の空白を検
出する。単語識別手段は、検出された空白が所定の大き
さより大きい場合、前記1文字の画像とそれに隣接する
1文字の画像とは、それぞれ、異なる単語に属する文字
であると識別する。単語識別限定手段は、取り込まれた
文書の画像中の所定の領域内の文字列画像について、前
記単語識別手段の識別結果を無効とする。
【0028】従って、本発明によれば、罫線枠内の文字
間の空白による単語区切りを無視することにより、均等
割付された文字も、単語の途中で分割されることなく正
しく認識することができ、認識誤り補正効果を十分発揮
することができる。請求項4記載の文書入力装置におい
て、文字コード候補記憶手段は、取り込まれた文書の画
像から切り出された1文字の画像の文字認識結果として
文字コードの複数の候補を記憶する。罫線枠識別手段
は、取り込まれた文書の画像内の罫線枠を識別する。文
字列候補生成手段は、取り込まれた文書の画像中の文字
列を表す同一の文字列画像について、前記文字コードの
候補を組み合わせ、文法的に正しく解釈することができ
る文字列の複数の候補を生成する。文字列候補記憶手段
は、生成された文字列の候補を格納する。表示手段は、
1つの文字列画像に対応する所定の文字列の候補を、前
記文字列候補記憶手段から読み出して、識別された罫線
枠内に均等割り付けして表示する。
【0029】従って、本発明によれば、識別された罫線
枠内に均等割り付けして表示されている所定の文字列の
候補は、前記文字列候補記憶手段内に文字列として格納
されているので、均等割り付けされて表示された文字列
を修正する際に、文字列を単位として修正することがで
きる。このため、オペレータは、従来のように1文字毎
に修正指示を入力する必要がなく、均等割り付け表示さ
れた文字列を容易に修正することができる。
【0030】請求項5記載の文書入力装置において、文
字コード候補記憶手段は、取り込まれた文書の画像から
切り出された1文字の画像の文字認識結果として文字コ
ードの複数の候補を記憶する。文字列方向識別手段は、
取り込まれた文書の画像内の画像領域と空白領域との分
布に基づいて、取り込まれた文書の画像内の文字列の方
向が縦横いずれの方向であるかを識別する。文字列候補
生成手段は、取り込まれた文書の画像内の画像領域と空
白領域との分布からは、文字列の方向が縦横いずれの方
向であるとも解釈できる場合、前記両方向について、そ
れぞれ、文字列を表す同一の文字列画像について、前記
文字コードの候補を組み合わせ、文法的に正しく解釈す
ることができる文字列の複数の候補を生成する。文字列
方向判定手段は、前記縦方向の文字列画像について生成
された文字列の候補のうちの所定の候補と、前記横方向
の文字列画像について生成された文字列の候補のうちの
所定の候補とを比較して、前記所定の候補が予め定める
条件を満足する方の文字列方向およびその文字列の候補
を有効と判定する。
【0031】従って、取り込まれた文書の画像内の画像
領域と空白領域との分布からは、文字列の方向が縦横い
ずれの方向であるとも解釈できる場合には、一旦、両方
向について文字列の候補を生成した上、前記文字列方向
判定手段が、他の判断基準に従って、文字列の方向を判
定するので、より正確に文字列の方向を判定することが
できる。従って、認識誤り補正処理の効果を、十分得る
ことができる。
【0032】請求項6記載の文書入力装置において、罫
線枠識別手段は、取り込まれた文書の画像内の罫線枠を
識別する。文字コード候補記憶手段は、取り込まれた文
書の画像から切り出された1文字の画像の文字認識結果
として、文字コードの複数の候補を、当該文字の画像の
前記文書の画像内における位置および文字サイズととも
に記憶する。文字列候補生成手段は、取り込まれた文書
の画像中の文字列を表す同一の文字列画像について、前
記文字コードの候補の組み合わせから、文法的に正しく
解釈することができる文字列の複数の候補を生成する。
印字文字サイズ選択手段は、生成された文字列の候補の
うちの所定の候補を、識別された前記罫線枠内に印字す
る際、当該文字列の候補内の前記文字コードの候補が対
応する画像の文字サイズを調べ、印字することができる
印字フォントサイズの中から、調べた文字サイズに最も
近い印字フォントサイズを選択する。印字手段は、識別
された罫線枠を印字するとともに、生成された文字列の
候補のうちの所定の候補を、印字された罫線枠内に、選
択された印字文字サイズで印字する。
【0033】従って、本発明によれば、印字された罫線
枠内に、生成された文字列の候補のうちの所定の候補
を、取り込まれた文書の画像から切り出された文字の画
像の文字サイズに最も近い印字フォントサイズで印字す
ることができる。すなわち、本発明によれば、印字され
た罫線枠内に、生成された文字列の候補のうちの所定の
候補を、認識対象の文書中に印字されていた文字サイズ
に応じた印字フォントサイズで印字することができる。
【0034】請求項7記載の文書入力装置では、請求項
6記載の文書入力装置において、上下間隔算出手段は、
前記文字コード候補記憶手段を参照して、前記文字列の
候補内の前記文字コードの候補が対応する画像の前記文
書の画像内における位置を調べ、当該文字の画像を挟む
上下の空白領域の大きさを算出する。左右間隔算出手段
は、前記文字コード候補記憶手段を参照して、前記文字
列の候補内の前記文字コードの候補が対応する画像の前
記文書の画像内における位置を調べ、当該文字の画像を
挟む左右の空白領域の大きさを算出する。上下サイズ限
定手段は、選択される印字フォントサイズの上下方向の
大きさが、算出された上下の空白領域の大きさと比べて
所定の大きさを越えないよう、選択される印字フォント
サイズの上下方向の大きさを限定する。左右サイズ限定
手段は、選択される印字フォントサイズの左右方向の大
きさが、算出された左右の空白領域の大きさと比べて所
定の大きさを越えないよう、選択される印字フォントサ
イズの左右方向の大きさを限定する。前記印字文字サイ
ズ選択手段は、前記上下サイズ限定手段と前記左右サイ
ズ限定手段とによって限定された印字フォントサイズの
中から、調べた文字サイズに最も近い印字フォントサイ
ズを選択する。
【0035】従って、本発明によれば、上記効果に加え
て、印字された罫線枠内に、生成された文字列の候補の
うちの所定の候補を、罫線枠に対して釣り合いがとれた
文字サイズで印刷することができる。請求項8記載の文
書入力装置において、文字コード候補記憶手段は、取り
込まれた文書の画像から切り出された1文字の画像の文
字認識結果として文字コードの複数の候補を記憶する。
文字列候補生成手段は、文字列を表す同一の文字列画像
について、前記文字コードの候補を組み合わせ、用語と
して正しく解釈することができる文字列の複数の候補
を、所定の優先順位とともに生成する。属性判定手段
は、生成された文字列の候補の中から、特定の文字コー
ドを識別し、その文字コードを含む文字列の候補および
当該文字列の候補と同一文字列画像について生成された
文字列の候補が表す用語の属性を判定する。属性間対応
用語記憶手段は、相互に関連した属性を有する用語同士
(例えば、住所名と郵便番号、社員名と社員番号など)
を対応付けて格納する。属性別文字列候補記憶手段は、
あらかじめ定める属性別に、属性が判定された前記文字
列の候補を前記優先順位とともに格納する。用語検索手
段は、前記属性別文字列候補記憶手段に格納されている
文字列の候補であって、前記属性間対応用語記憶手段に
格納されている用語の属性を表すものについて、前記各
文字列の候補(例えば、郵便番号あるいは社員番号の候
補)をキーとして、前記前記属性間対応用語記憶手段か
ら対応する用語(例えば、住所名あるいは社員名)を検
索する。優先順位変更手段は、前記属性別文字列候補記
憶手段に格納されている文字列の候補のうち、相互に関
連した他の属性の文字列の候補(例えば、郵便番号ある
いは社員番号の候補)をキーとする前記用語検索手段の
検索結果(例えば、住所名あるいは社員名)と共通する
文字列の候補(例えば、住所名あるいは社員名の候補)
の優先順位を高める。
【0036】従って、本発明によれば、同一の属性を表
す用語の中で、例えば、「大田」と「太田」のように、
それぞれに正しい用語であるが類似字形を多く含むため
に認識誤りを生じやすい文字列を多く含んでいる住所表
示、氏名などの用語を認識する場合、上記検索結果との
照合を行うことにより、より正確な認識誤り補正結果を
得ることができる。
【0037】請求項9記載の文書入力方法において、予
め定める尤度基準値と予め定める正解率基準値とを、そ
れぞれ尤度基準記憶部と正解率基準記憶部とに予め格納
しておき、文字列候補生成ステップは、取り込まれた文
書の画像中の文字列を表す同一の文字列画像について、
前記尤度基準記憶部に格納されている尤度基準値以上の
尤度を有する前記文字コードの候補の組み合わせから、
文法的に正しく解釈することができる文字列の複数の候
補を生成する。表示ステップは、前記文字列画像に対応
して生成された前記文字列の候補に対して、同一の前記
文字列画像について生成された文字列の候補のうち、所
定の候補を表示する。入力ステップは、前記文字列画像
に対応して生成された前記文字列の候補に対して、オペ
レータからの修正指示を入力する。修正ステップは、前
記文字列画像に対応して生成された前記文字列の候補に
対して、前記修正指示に従って、誤って認識されている
文字コードを、正しい文字コードに修正する。比較ステ
ップは、前記修正の後、前記文字列画像に対応する修正
後の文字列と、同一文字列画像に対応する最も尤度の高
い文字コードの候補からなる文字列とを比較する。正解
率算出ステップは、前記比較の後、前記比較結果に基づ
いて、前記両者の間で相違する文字数と前記一方の文字
列に含まれる文字数との割合から、文字認識の正解率を
算出する。尤度基準値変更ステップは、前記正解率が算
出された後、算出された正解率が、前記正解率基準記憶
部に格納されている正解率基準値と比較して所定の条件
を満足する場合には、算出された正解率に応じて尤度基
準記憶部内の前記尤度基準値を変更し、前記文字列候補
生成ステップに戻る。
【0038】従って、本発明によれば、請求項1記載の
本発明と同様の効果を得ることができる。請求項10記
載の文書入力方法において、予め定める尤度基準値と予
め定める修正指示数基準値とを、それぞれ尤度基準記憶
部と修正指示基準記憶部とに格納しておき、文字列候補
生成ステップは、取り込まれた文書の画像中の文字列を
表す同一の文字列画像について、前記尤度基準記憶部内
の前記尤度基準値以上の尤度を有する前記文字コードの
候補の組み合わせから、文法的に正しく解釈することが
できる文字列の複数の候補を生成する。表示ステップ
は、前記文字列画像に対応して生成された前記文字列の
候補に対して、同一の前記文字列画像について生成され
た文字列の候補のうち、所定の候補を表示する。入力ス
テップは、前記文字列画像に対応して生成された前記文
字列の候補に対して、オペレータからの修正指示を入力
する。修正指示計数ステップは、入力された修正指示を
計数する。修正ステップは、前記文字列画像に対応して
生成された前記文字列の候補に対して、前記修正指示に
従って、誤って認識されている文字コードを、正しい文
字コードに修正する。尤度基準値変更ステップは、前記
修正の後、計数された修正指示数が、前記修正指示基準
記憶部に記憶されている修正指示数基準値と比較して所
定の条件を満足する場合には、計数された修正指示数に
応じて尤度基準記憶部内の前記尤度基準値を変更する。
【0039】従って、本発明によれば、請求項2記載の
本発明と同様の効果を得ることができる。請求項11記
載の文書入力方法において、空白検出ステップは、一行
の文字列を表す文字列画像から切り出された1文字の画
像と、それに隣接する1文字の画像との間の空白を検出
する。単語識別ステップは、検出された空白が所定の大
きさより大きい場合、前記1文字の画像とそれに隣接す
る1文字の画像とは、それぞれ、異なる単語に属する文
字であると識別する。単語識別限定ステップは、取り込
まれた文書の画像中の所定の領域内の文字列画像につい
て、前記識別結果を無効とする。
【0040】従って、本発明によれば、請求項3記載の
本発明と同様の効果を得ることができる。請求項12記
載の文書入力方法において、罫線枠識別ステップは、取
り込まれた文書の画像内の罫線枠を識別する。文字列候
補生成ステップは、取り込まれた文書の画像中の文字列
を表す同一の文字列画像について、前記文字コードの候
補を組み合わせ、文法的に正しく解釈することができる
文字列の複数の候補を生成する。文字列候補格納ステッ
プは、生成された文字列の候補を文字列候補記憶部に格
納する。表示ステップは、1つの文字列画像に対応する
所定の文字列の候補を、前記文字列候補記憶部から読み
出して、識別された罫線枠内に均等割り付けして表示す
る。
【0041】従って、本発明によれば、請求項4記載の
本発明と同様の効果を得ることができる。請求項13記
載の文書入力方法において、文字列方向識別ステップ
は、取り込まれた文書の画像内の画像領域と空白領域と
の分布に基づいて、取り込まれた文書の画像内の文字列
の方向が縦横いずれの方向であるかを識別する。文字列
候補生成ステップは、取り込まれた文書の画像内の画像
領域と空白領域との分布からは、文字列の方向が縦横い
ずれの方向であるとも解釈できる場合、前記両方向につ
いてそれぞれ、文字列を表す同一の文字列画像につい
て、前記文字コードの候補の組み合わせから、文法的に
正しく解釈することができる文字列の複数の候補を生成
する。文字列方向判定ステップは、前記縦方向の文字列
画像について生成された文字列の候補のうちの所定の候
補と、前記横方向の文字列画像について生成された文字
列の候補のうちの所定の候補とを比較して、前記所定の
候補が予め定める条件を満足する方の文字列方向および
その文字列の候補を有効と判定する。
【0042】従って、本発明によれば、請求項5記載の
本発明と同様の効果を得ることができる。請求項14記
載の文書入力方法において、文字の画像を文字認識しな
がら、文字コードの複数の候補を当該文字の画像の前記
文書の画像内における位置および文字サイズとともに文
字コード候補記憶部に予め格納し、罫線枠識別ステップ
は、取り込まれた文書の画像内の罫線枠を識別する。文
字列候補生成ステップは、取り込まれた文書の画像中の
文字列を表す同一の文字列画像について、前記文字コー
ドの候補の組み合わせから、文法的に正しく解釈するこ
とができる文字列の複数の候補を生成する。印字文字サ
イズ選択ステップは、生成された文字列の候補のうちの
所定の候補を、識別された前記罫線枠内に印字する際、
当該文字列の候補内の前記文字コードの候補が対応する
画像の文字サイズを調べ、印字することができる印字フ
ォントサイズの中から、調べた文字サイズに最も近い印
字フォントサイズを選択する。印字ステップは、識別さ
れた罫線枠を印字するとともに、生成された文字列の候
補のうちの所定の候補を、印字された罫線枠内に、選択
された印字文字サイズで印字する。
【0043】従って、本発明によれば、請求項6記載の
本発明と同様の効果を得ることができる。請求項15記
載の文書入力方法では、請求項14記載の文書入力方法
において、上下間隔算出ステップは、前記罫線枠識別ス
テップの後、前記文字コード候補記憶部を参照して、前
記文字列の候補内の前記文字コードの候補が対応する画
像の前記文書の画像内における位置を調べ、当該文字の
画像を挟む上下の空白領域の大きさを算出する。左右間
隔算出ステップは、前記文字コード候補記憶部を参照し
て、前記文字列の候補内の前記文字コードの候補が対応
する画像の前記文書の画像内における位置を調べ、当該
文字の画像を挟む左右の空白領域の大きさを算出する。
上下サイズ限定ステップは、選択される印字フォントサ
イズの上下方向の大きさが、算出された上下の空白領域
の大きさと比べて所定の大きさを越えないよう、選択さ
れる印字フォントサイズの上下方向の大きさを限定す
る。左右サイズ限定ステップは、選択される印字フォン
トサイズの左右方向の大きさが、算出された左右の空白
領域の大きさと比べて所定の大きさを越えないよう、選
択される印字フォントサイズの左右方向の大きさを限定
する。
【0044】従って、本発明によれば、請求項7記載の
本発明と同様の効果を得ることができる。請求項16記
載の文書入力方法において、相互に関連した属性を有す
る用語同士を対応付けて属性間対応用語記憶部に予め格
納し、文字列候補生成ステップは、文字列を表す同一の
文字列画像について、前記文字コードの候補を組み合わ
せ、用語として正しく解釈することができる文字列の複
数の候補を、所定の優先順位とともに生成する。属性判
定ステップは、生成された文字列の候補の中から、特定
の文字コードを識別し、その文字コードを含む文字列の
候補および当該文字列の候補と同一文字列画像について
生成された文字列の候補が表す用語の属性を判定する。
属性別文字列候補格納ステップは、あらかじめ定める属
性別に、属性が判定された前記文字列の候補を前記優先
順位とともに属性別文字列候補記憶部に格納する。用語
検索ステップは、前記属性別文字列候補記憶部に格納さ
れている文字列の候補であって、前記属性間対応用語記
憶部に格納されている用語の属性を表すものについて、
前記各文字列の候補をキーとして、前記前記属性間対応
用語記憶部から対応する用語を検索する。優先順位変更
ステップは、前記属性別文字列候補記憶部に格納されて
いる文字列の候補のうち、相互に関連した他の属性の文
字列の候補をキーとする前記検索結果と共通する文字列
の候補の優先順位を高める。
【0045】従って、本発明によれば、請求項8記載の
本発明と同様の効果を得ることができる。
【0046】
【実施例】図1は、本発明の第1実施例である文書入力
装置100のハードウェア構成を示すブロック図であ
る。文書入力装置100は、CPU120、メモリ制御
ユニット兼用バス制御ユニット102、主記憶101、
ローカルバス104、グラフィクス制御ユニット10
5、ディスプレイ106、SCSI(Small Co
mputer System Interface)制
御ユニット107、ハードディスク装置108、スキャ
ナー109、バスブリッジ回路110、外部バス11
1、入出力制御ユニット112、キーボード113、プ
リンタ114およびマウス115を備える。なお、文書
入力装置100の主要部は、例えば、パーソナルコンピ
ュータPanacomV24(CF−V2411RWE
松下電器)などの汎用パーソナルコンピュータによっ
て実現され、その構成要素である個々の入出力装置等
は、各々、市販されている標準品でよい。演算装置(C
PU)101は、メモリ制御ユニット兼用バス制御ユニ
ット102を介して、主記憶101およびローカルバス
104と結合されている。
【0047】主記憶101は、CPU120が実行する
ためのプログラムおよび各入出力ディスク装置から入力
されたデータを格納するとともに、処理途中のデータを
一時記憶することによってCPU120の作業場所を提
供する。図2は、文書入力装置100の認識結果を格納
するために主記憶101上に設けられる記憶領域の区分
と、その記憶内容とを示す説明図である。図2の左側に
示すように、主記憶101上には、画像情報記憶部20
1、ブロック管理情報記憶部202、表示データ記憶部
203および認識列管理部204の各記憶領域が設けら
れる。
【0048】画像情報記憶部201は、例えば、スキャ
ナー109などから読み込まれた、入力対象となる文書
の画像を記憶する。ブロック管理情報記憶部202は、
文書入力処理における各段階で作成される、図2の右側
に示すような後述のブロック管理情報210を記憶す
る。表示データ記憶部203は、例えば、認識対象とし
てスキャナー109から入力された画像およびその認識
結果などの表示データを記憶する。
【0049】認識列管理部204は、認識列ごとに作成
される後述の各認識列管理情報301を記憶する。前記
認識対象ブロックは、スキャナー109から入力された
画像中において、認識対象として指定された矩形領域を
いい、前記認識列は、指定された認識対象ブロックに含
まれる、例えば、一行の文字列に相当する画像をいう。
【0050】ブロック管理情報210は、スキャナー1
09から入力された画像中において、認識対象テキスト
として指定された、それぞれの認識対象ブロックに対応
して作成され、各ブロック管理情報210は、画像位置
情報211、罫線枠情報212、文字列方向213およ
び認識列管理部アドレス214からなる。画像位置情報
211は、そのブロック管理情報210によって管理さ
れる認識対象ブロックのブロック識別番号と、当該認識
対象ブロックが画像情報記憶部201に記憶されている
画像情報、すなわち、スキャナー109から入力された
前記画像情報中で位置する座標を示す。
【0051】罫線枠情報212は、当該認識対象ブロッ
ク内の罫線枠の有無を示す。文字列方向213は、当該
認識対象ブロック内において、文字列の方向が縦である
か横であるかを示す。ただし、ある認識対象ブロックに
ついて、文字列方向が縦方向と横方向との両方に解釈が
成り立つ場合には、それぞれの場合に対応して、2つの
後述する認識列管理情報301が生成される。
【0052】認識列管理部アドレス214は、認識列管
理部204内において、当該認識対象ブロック内に含ま
れる認識列分の認識列管理情報301が記憶されている
記憶領域の先頭アドレスを示す。図3は、認識列管理部
204に記憶される認識列管理情報301のデータフォ
ーマットを示す説明図である。
【0053】認識列管理部204には、1つの認識対象
ブロックに含まれるそれぞれの認識列にたいして作成さ
れた認識列管理情報301が、各認識対象ブロック毎に
記憶される。各認識列管理情報301は、図3に示すよ
うに、当該認識列に含まれる各文字毎に作成された認識
文字情報302と当該認識列に対して得られた補正結果
308とからなる。
【0054】認識文字情報302は、当該認識列におけ
る1文字毎の認識結果を示し、文字位置情報303、区
切り情報304および候補文字情報307からなる。候
補文字情報307は、候補文字コード305とその尤度
306とからなる。文字位置情報303は、当該認識文
字情報302に対応する画像の当該認識対象ブロック内
における位置を、例えば、認識対象ブロックの左上隅を
座標(0,0)とするビットマップ上の矩形領域を表す
位置座標で示す。
【0055】区切り情報304は、文字位置情報303
で示された位置のテキスト画像が単語あるいは文節の末
尾であるか否かを示す。例えば、当該テキスト画像の直
後に全角文字以上の大きさの空白があれば「1」、なけ
れば「0」が書き込まれる。これにより、例えば、一般
文書においては、空白で大きく間の離れた段組レイアウ
トの行を一つの行として解釈する誤りを取り除くことが
できる。なお、ここでは、単語区切りを有効とする空白
の大きさは、全角文字以上としたが、倍角文字以上とし
てもよいし、3倍角文字以上としてもよいし、4倍角以
上としてもよい。
【0056】候補文字コード305は、認識結果として
得られた候補文字の文字コードを示す。尤度306は、
文字位置情報303で示された位置の画像から抽出され
た文字認識用特徴と、文書入力装置100が別途保有す
る活字認識用辞書との照合の結果得られた候補文字コー
ド305の確からしさを示す。尤度306の算出方法
は、従来の文字認識における方法と同様であるので、説
明を省略する。
【0057】補正結果308は、認識列毎に作成され、
複数の候補からなる。補正結果308は、1文字毎の認
識結果である候補文字コード305を、単語辞書を参照
しながら組み合わせて生成された、文節として解釈可能
な複数の文節解釈に対して、従来の形態素解析、文法検
定などに従って、補正が加えられた結果である補正結果
を示す。また、補正結果確定部213によって確定され
た認識列は、補正結果308の第1候補として記憶され
る。
【0058】図4は、主記憶101上に設けられる単語
辞書記憶部412の記憶領域区分を示す説明図である。
単語辞書記憶部412には、認識誤り補正に用いる各種
照合用辞書およびテーブルが格納される。単語辞書記憶
部412には、辞書管理情報記憶部401、一般辞書部
402、固有名詞辞書部403、帳票用語辞書部40
4、郵便番号−住所照合テーブル部405および電話番
号−住所照合テーブル部406が設けられる。
【0059】辞書管理情報記憶部401には、一般辞書
アドレス記憶部407、固有名詞辞書アドレス記憶部4
08、帳票用語辞書アドレス記憶部409、郵便番号テ
ーブルアドレス記憶部410および電話番号テーブルア
ドレス記憶部411が設けられ、認識誤り補正に用いる
後述の各種照合用辞書およびテーブルが格納されている
単語辞書記憶部412内のアドレスを一括して保持す
る。
【0060】一般辞書部402は、自立語および付属語
などをトライ構造で収録した単語辞書など、一般文書の
補正に用いられる一般辞書を記憶する。固有名詞辞書部
403は、会社名、部署名および個人名など、固有名詞
を収録し、名刺の補正に用いられる後述の固有名詞辞書
を記憶する。帳票用語辞書部404は、帳票に高頻度で
出現する帳票用語を収録し、帳票形式入力の際の補正に
用いられる後述の帳票用語辞書を記憶する。
【0061】郵便番号−住所照合テーブル部405は、
郵便番号に対応して、その地域の住所表示に用いられる
住所名データを収録した、郵便番号−住所照合テーブル
を記憶する。電話番号−住所照合テーブル部406は、
電話番号の市外番号、および市内局番号にその地域の住
所表示に用いられる住所名データを収録した、電話番号
−住所照合テーブルを記憶する。
【0062】一般辞書アドレス記憶部407は、単語辞
書記憶部412内の一般辞書部402のアドレスを記憶
する。固有名詞辞書アドレス記憶部408は、単語辞書
記憶部412内の固有名詞辞書部403のアドレスを記
憶する。帳票用語辞書アドレス記憶部409は、単語辞
書記憶部412内の帳票用語辞書部404のアドレスを
記憶する。
【0063】郵便番号テーブルアドレス記憶部410
は、単語辞書記憶部412内の郵便番号−住所照合テー
ブル部405のアドレスを記憶する。電話番号テーブル
アドレス記憶部411は、単語辞書記憶部412内の電
話番号−住所照合テーブル部406のアドレスを記憶す
る。図5は、主記憶101上に設けられる名刺データ認
識結果一時記憶部501の記憶領域区分を示す説明図で
ある。
【0064】名刺データ認識結果一時記憶部501は、
氏名記憶部502、所属団体名記憶部503、所属部署
名記憶部504、住所記憶部505、電話番号記憶部5
06および郵便番号記憶部507を備え、名刺入力処理
における認識結果を一時記憶する。氏名記憶部502
は、名刺に印字された画像から読み取られた、第1候補
から第5候補までの氏名の補正結果308を記憶する。
【0065】所属団体名記憶部503、名刺に印字され
た画像から読み取られた、第1候補から第5候補までの
所属団体名の補正結果308を記憶する。所属部署名記
憶部504、名刺に印字された画像から読み取られた、
第1候補から第5候補までの所属部署名の補正結果30
8を記憶する。住所記憶部505、名刺に印字された画
像から読み取られた、第1候補から第5候補までの住所
の補正結果308を記憶する。
【0066】電話番号記憶部506、名刺に印字された
画像から読み取られた、第1候補から第5候補までの電
話番号の補正結果308を記憶する。郵便番号記憶部5
07、名刺に印字された画像から読み取られた、第1候
補から第5候補までの郵便番号の補正結果308を記憶
する。図6は、主記憶101上に設けられる名簿情報記
憶部601の記憶領域区分を示す説明図である。
【0067】名簿情報記憶部601は、個人別に登録さ
れた名簿情報608を記憶する。各名簿情報608は、
氏名領域602、所属団体名領域603、所属部署名領
域604、住所領域605、電話番号領域606および
郵便番号領域607を備え、文書入力装置100に登録
された名簿情報を記憶する。氏名領域602は、登録さ
れた個人名を記憶する。
【0068】所属団体名領域603は、当該個人が所属
する団体名を記憶する。所属部署名領域604は、当該
個人が所属する部署名を記憶する。住所領域605は、
当該個人の住所を記憶する。電話番号領域606は、当
該個人の電話番号を記憶する。郵便番号領域607は、
前記住所の郵便番号を記憶する。
【0069】図7は、主記憶101上に設けられる作業
領域700の記憶領域区分を示す説明図である。作業領
域700は、文書種別一時記憶部701、ブロック番号
一時記憶部702、精度水準記憶部703、操作水準記
憶部704、尤度水準記憶部705、補正用辞書アドレ
ス記憶部706、修正キー頻度記憶部707および処理
用バッファ708を備え、認識処理および認識補正処理
の各段階で生成された各種変数、中間処理結果を記憶す
る。
【0070】文書種別一時記憶部701は、現在認識対
象となっている文書の種別を記憶する。ブロック番号一
時記憶部702は、現在認識対象となっている認識対象
ブロックの識別番号を記憶する。精度水準記憶部703
は、文字認識結果の精度の基準値として予め定められた
精度水準を記憶する。前記文字認識結果の精度は、文字
認識結果である候補文字コード305の第1候補を並べ
て得られる文字列と、最終確定した文字列との比較照合
の結果、一致した文字数と照合された文字数との割合で
表される。
【0071】操作水準記憶部704は、例えば、オペレ
ータが補正結果308を修正する際に次の候補の表示を
指示するために用いる後退キーや、間違って認識された
文字を書き直すために用いる削除キーなど、キーボード
113の中の修正指示用のキーについて、その打鍵数の
基準値として予め定められた操作水準を記憶する。尤度
水準記憶部705は、文字認識結果である候補文字コー
ド305の尤度306の下限値として予め定められた尤
度水準を記憶する。
【0072】補正用辞書アドレス記憶部706は、文書
入力装置100が現在使用している補正用辞書のアドレ
スを3つまで記憶する。修正キー頻度記憶部707は、
表示された補正結果308を修正するために用いられた
後退キー、削除キーなどの打鍵回数を逐次記録する。処
理用バッファ708は、文書入力装置100が認識処理
および認識補正処理の各段階で生成した中間的な処理結
果を記憶する。
【0073】メモリ制御ユニット兼用バス制御ユニット
102は、CPU120と主記憶101およびローカル
バス104との間のデータの伝送を制御する。ローカル
バス104は、データ伝送路である。ローカルバス10
4には、グラフィクス制御ユニット105を介してディ
スプレイ106が結合され、SCSI制御ユニット10
7を介してハードディスク装置108、スキャナー10
9が結合されている。
【0074】グラフィクス制御ユニット105は、CP
U120による処理結果などのデータを、例えば、ビッ
トマップデータで表される表示データに変換するととも
に、ディスプレイ106を制御して前記表示データを表
示面に表示させる。ディスプレイ106は、例えば、ビ
ットマップデータで表される表示データを表示する。
【0075】SCSI制御ユニット107は、多種の入
出力装置を接続することが可能で、複数の計算機から入
出力装置を共有することができる小型機用汎用インター
フェースである。ハードディスク装置108は、内部に
備える磁気ディスクにデータを格納する。
【0076】スキャナー109は、例えば、印刷物等に
光を走査しながら照射し、その反射光の光量を検出する
ことによって紙面等に印刷されたデータを読み取る。さ
らに、バスブリッジ回路110によってローカルバス1
04に結合された外部バス111には、入出力制御ユニ
ット112を介して、キーボード113、プリンタ11
4、マウス115などが結合されている。バスブリッジ
回路110は、ローカルバス104と外部バス111と
を接続して相互にデータの伝送を行わせる接続部であ
る。
【0077】外部バス111は、キーボード113、プ
リンタ114、マウス115などの外部入出力装置から
のデータを伝送する伝送路である。入出力制御ユニット
112は、キーボード113、プリンタ114、マウス
115などの低速入出力装置を制御して前記各入出力装
置を外部バス111に接続する。
【0078】キーボード113は、複数のキーを備え、
押下されたキーに対応するキー信号を出力する。プリン
タ114は、CPU120の処理結果などを紙面に印字
することによって出力する。マウス115は、ローラお
よびクリックキーを備え、前記ローラの回転に対応した
カーソル制御信号を出力し、クリックキーが押下される
とクリック信号を出力する。
【0079】CPU120は、メモリ制御ユニット兼用
バス制御ユニット102を介して、主記憶101とデー
タのやり取りを行う。CPU120は、主記憶101に
格納されている手順プログラムを実行し、前記各入出力
装置を制御することによって、後述する本実施例の文書
入力装置100を実現する。以下、文書入力装置10
0、すなわち、CPU120の処理手順を、フローチャ
ートおよび具体例を参照しながら説明する。以下の説明
では、本実施例の文書入力装置100において使用され
る各種変数は、予め初期化されているものとして説明す
る。
【0080】図8は、CPU120の処理手順の全体の
概要を示すフローチャートである。図9は、文書入力処
理の初期段階における表示画面およびデータの具体例を
示す説明図である。オペレータが、スキャナー109か
ら入力を意図した文書を読み込ませると(ステップS8
01)、CPU120は、図9(a)に示すメニュー画
面をディスプレイ106に表示させ、スキャナー109
から入力された文書が「帳票形式」か「名刺」か「一般
文書」かをオペレータに尋ねる(ステップS802)。
【0081】CPU120は、オペレータからの応答に
従い、後の処理を分岐する(ステップS803)。な
お、ここでは、オペレータがメニュー画面から入力され
た文書の種別を入力することとしたが、スキャナー10
9から読み込まれた文書の大きさ、罫線枠の有無などか
ら、CPU120が前記文書種別を認識するようにして
もよい。
【0082】ステップS803において、『一般文書』
が前記メニュー画面で選択されると、CPU120は、
一般的な文章を対象とした一般辞書を格納している一般
辞書部402のアドレスを、辞書管理情報記憶部401
内の一般辞書アドレス記憶部407から読み出して、補
正用辞書アドレス記憶部706に記憶させる(ステップ
S804)。
【0083】CPU120は、後述の、一般文書向けの
テキスト認識入力処理および認識誤り補正処理を行う。
これにおいて、CPU120は、所定数、例えば、4つ
の認識列について補正結果308が得られるごとに、前
記補正結果308の第1候補を認識対象となったテキス
ト画像とともに、ディスプレイ106に表示させ、文書
入力装置100が別途保有するテキスト編集プログラム
を起動する。オペレータは、表示された補正結果308
について、キーボード113などを用いて認識誤り箇所
を正しい文字に修正し、修正が完了すれば、確認の入力
を行う。CPU120は、前記修正結果に基づいて、次
の文字列について認識誤り補正処理を行う。このように
して、CPU120は、所定数の認識列ごとに前記認識
誤り補正処理と補正結果の修正処理とを繰り返し、すべ
ての文字について前記処理を終了すると、認識入力され
た文書を、必要があれば印刷して、文書入力を完了する
(ステップS805)。この際、CPU120は、オペ
レータが補正結果308の修正のため使用した、キーボ
ード113の中の後退キーと削除キーとの打鍵を監視
し、打鍵の度に修正キー頻度記憶部707の値をインク
リメントする。
【0084】ステップS803において、『名刺』が前
記メニュー画面で選択されると、CPU120は、名
刺、住所録など固有名詞を対象とした、補正用の固有名
詞辞書を格納している固有名詞辞書部403のアドレス
を、辞書管理情報記憶部401内の固有名詞辞書アドレ
ス記憶部408から読み出して、補正用辞書アドレス記
憶部706に記憶させる(ステップS807)。
【0085】次いで、CPU120は、後述の、名刺向
けのテキスト認識入力を行ったのち(ステップS80
8)、認識した名刺データを、名簿情報記憶部601内
に記憶されている名簿情報と照合し、同一個人名が名簿
情報記憶部601内に記憶されていない名刺データにつ
いては、新規名簿情報として名簿情報記憶部601に新
規登録する。また、同一個人名が名簿情報記憶部601
内に記憶されているが他の部分が異なる名刺データにつ
いては、前記名刺データからの情報によって前記名簿情
報を更新する(ステップS809)。
【0086】ステップS803において、『帳票形式』
が前記メニュー画面で選択されると、CPU120は、
一般辞書を格納する一般辞書部402に加えて、帳票に
高頻度で出現する帳票用語を収録した帳票用語辞書を格
納する帳票用語辞書部404のアドレスを、辞書管理情
報記憶部401内の一般辞書アドレス記憶部407と帳
票用語辞書アドレス記憶部409とから読み出して、補
正用辞書アドレス記憶部706に記憶させる(ステップ
S810)。
【0087】次いで、CPU120は、罫線枠で囲われ
たブロックと、空白で囲われたテキスト領域ブロックと
を帳票から抽出するとともに、抽出された前記両者を、
それぞれ、罫線枠ブロック、一般ブロックとして個別に
ブロック管理情報210を作成し、ブロック管理情報記
憶部202に記憶させる(ステップS811)。なお、
罫線枠ブロックであるか、一般ブロックであるかは、ブ
ロック管理情報210内の罫線枠情報212の項目に書
き込まれる。また、これらの手法は、「表の構造理解の
ための罫線抽出と領域分け 電子情報通信学会技術研究
報告Vol.90 No.235(PRU90 68−
80)p33−38」や「空白領域情報を用いた文書画
像の領域分割 電子情報通信学会春季大会講演論文集
D−568 p7−410(1992)」等に記載され
た方式を用いており、またこの詳細手順は本発明の主眼
でもないので、詳細な説明を省略する。
【0088】CPU120は、前記罫線枠ブロック、前
記一般ブロック毎に、内部のテキスト文字と、文字列方
向を認識したのち(ステップS812)、各ブロック内
で認識された文字列に、認識された文字列方向と対応し
た均等割付情報を付与する(ステップS813)。な
お、ステップS812およびステップS813の処理に
ついては、後に詳述する。
【0089】図10は、図8に示したステップS805
におけるテキスト認識処理の内容を詳細に説明するフロ
ーチャートである。CPU120は、図9(b)に示す
ように、スキャナー109から入力された文書を、ディ
スプレイ106に表示させる。オペレータは、ディスプ
レイ106に表示された文書の画像を確認しながら、マ
ウス115を用いて、前記認識対象ブロックを指定する
(ステップS1001)。図9(b)において網掛けさ
れた部分は、ステップS1001においてオペレータに
指定された認識対象ブロックの一例を示す。
【0090】CPU120は、指定された認識対象ブロ
ック内の画像を、横方向と縦方向に写像したヒストグラ
ムを基にして、当該認識対象ブロック内の文字領域およ
びその文字方向を推定する。具体的には、CPU120
は、横方向と縦方向に写像した画像のヒストグラムを生
成し、画像および空白領域に周期性があって画像と画像
との間隔の狭い方向を文字方向と推定する。推定された
文字列方向およびステップS1001において指定され
た認識対象ブロックの画像の位置は、それぞれ、ブロッ
ク管理情報210内の文字列方向213および画像位置
情報203の各項目に書き込まれる。さらに、CPU1
20は、前記表示データ記憶部203および文字列方向
213に基づいて、当該認識対象ブロックに含まれてい
る各認識列に対応した画像を切り出すとともに、前記各
認識列に含まれている1文字分の画像を切り出す。切り
出された各文字に対応する画像の位置は、認識文字情報
302の文字位置情報303の項目に書き込まれる(ス
テップS1002)。
【0091】図9(c)は、ステップS1002の処理
によって、図9(b)に示した認識対象ブロック内から
切り出された4個の認識列を示す。従って、図9(b)
に示した認識対象ブロック内の画像に対して、4個の認
識列管理情報301が作成されるとともに、各認識列管
理情報301内には、当該認識列に含まれる文字数分、
例えば、認識列2については32個の認識文字情報30
2が作成され、前記認識列管理部204に記憶される。
【0092】次いで、CPU120は、文字位置情報3
03で示される位置の画像から、文字識別用特徴を抽出
した上、抽出した前記文字識別用特徴と文書入力装置1
00が別途保有する活字認識用辞書とを比較照合し、類
似度が高いものから順に、第1位から第10位までの候
補文字コード305を、尤度306とともに生成する
(ステップS1003)。
【0093】生成された候補文字コード305および尤
度306は、認識文字情報302内の候補文字情報30
7として、認識列管理部204に格納される。この単位
文字認識手法は、「National Tehchni
cal report vol.35 No.1(Fe
b.1989)」等に記載された手法であり、本発明の
主眼ではないので、説明を省略する。この結果、認識列
管理部204に、各認識文字に関する認識文字情報30
2が格納される。また、このとき、CPU120は、文
字領域の間の空白領域が全角幅以上の大きさである場合
には、前記文字領域間の空白領域を単語あるいは文節の
区切りとして有効とし、そうでない場合には無効とす
る。CPU120は、有効な前記空白による単語区切り
を直後に有する画像には、対応した認識文字情報302
の区切り情報304に「1」を書き込み、そうでない画
像には、前記区切り情報304に「0」を書き込む。
【0094】図11は、文字認識処理により生成された
認識文字情報302および認識誤り補正後に表示される
表示画面の具体例を示す説明図である。図11(a)
は、ステップS1003において、CPU120が、図
9(c)に示した認識列3の中で20文字目に相当する
画像を、「日」と認識したときの認識文字情報302の
内容の一例を示す。
【0095】次いで、CPU120は、文字認識結果の
適合率を上げ、不要な後処理照合を減らすため、候補文
字情報307内の候補文字コード305のうち、第5位
以下の候補文字コード305であって、その尤度306
が、尤度水準記憶部705に記憶されている尤度水準よ
り低いものを、候補文字情報307から取り除く(ステ
ップS1004)。図11(a)に示した認識文字情報
302の例では、例えば、前記尤度水準が「40」の場
合、その尤度306が「40」より低い第8位候補から
第10位候補までが候補文字情報307から取り除か
れ、候補文字情報307内の認識文字候補は、第1位候
補から第7位候補の7つに限定される。なお、ステップ
S1004の処理については、後にさらに詳述する。
【0096】CPU120は、認識列管理情報301に
対応する認識列単位で、候補文字情報307内の候補文
字コード305を、補正用辞書アドレス記憶部706で
指定された補正用辞書と文字列照合しながら配列し、所
定の優先順位に従って、文節として解釈可能な文節の並
びからなる補正結果を、補正結果308に書き込む(ス
テップS1005)。なお、ステップS1005の処理
については、後にさらに詳述する。
【0097】CPU120は、連続する所定数の、例え
ば、4つの認識列に対応する補正結果308が書き込ま
れる毎に(ステップS1006)、後述の補正結果修正
処理を行い(ステップS1007)、この段階で、まだ
認識残りのブロックが存在し、認識入力が完了していな
い場合(ステップS1008)、ステップS1003の
処理に戻り、そうでない場合、ステップS1007の処
理と同様、後述の補正結果修正処理を行った後、処理を
終了する(ステップS1009)。
【0098】図10(a)は、ステップS1007およ
びステップS1009に示した前記補正結果修正処理の
具体的な処理手順を示す。CPU120は、補正結果3
08の第1候補を、認識対象ブロックの画像とともに、
ディスプレイ106に表示し、文書入力装置100が別
途格納しているテキスト編集機能を起動する。図11
(b)は、このときのディスプレイ106の表示例を示
す。図11(b)に示す表示画面の上半分は認識対象ブ
ロックの画像を示し、表示画面の下半分は補正結果30
8の第1位候補からなる補正結果を示す。オペレータ
は、表示された補正結果308が間違っている場合、起
動されたテキスト編集機能により、キーボード113を
用いて、表示された補正結果308の中で間違っている
箇所の文字を修正する(ステップS1011)。この
際、CPU120は、オペレータが補正結果308の修
正のため使用した、キーボード113の中の後退キーと
削除キーとの打鍵を監視し、打鍵の度に修正キー頻度記
憶部707の値をインクリメントする。
【0099】オペレータが修正を完了し、補正結果30
8の確定指示をキーボード113から入力すると、CP
U120は、認識列管理部204に記憶されている候補
文字情報307から候補文字コード305の第1候補を
取り出して得られた文字列と、最終確定された文字列と
を比較照合し、前記文字列同士の一致の度合いを算出す
る。すなわち、CPU120は、以下の式に基づいて、
精度rを算出する(ステップS1012)。
【0100】 r/100=(一致した文字数)/(照合した文字数) CPU120は、算出された精度rと、精度水準記憶部
703内に記憶されている予め定められた精度水準とを
比較し(ステップS1013)、算出された精度rが前
記精度水準よりも低い場合、尤度水準記憶部705内の
尤度水準を10%低い値に変更し、処理を終了する(ス
テップS1014)。なお、ここでは、算出された精度
rが前記精度水準記憶部703内に記憶されている精度
水準よりも低い場合についてだけ説明したが、逆に、算
出された精度rが前記精度水準記憶部703内に記憶さ
れている精度水準よりも高い場合には、尤度水準記憶部
705内の尤度水準を10%高い値に変更するようにし
てもよい。
【0101】なお、以上では、上記のように算出された
精度rと、前記精度水準記憶部703内に記憶されてい
る精度水準とを比較し、その比較結果に基づいて、尤度
水準記憶部705内の尤度水準を変更する場合について
説明したが、別の基準値をもとに尤度水準記憶部705
内の尤度水準を変更してもよい。具体的には、ステップ
S1011の処理において説明したように、CPU12
0は、オペレータが補正結果308を修正する際に用い
たキーボード113の中の後退キーと削除キーとの打鍵
数を、その都度、修正キー頻度記憶部707内に計数し
ている。これにより、オペレータが修正を完了し、補正
結果308の確定指示をキーボード113から入力する
と、CPU120は、修正キー頻度記憶部707内に記
憶されている打鍵数と、操作水準記憶部704内に記憶
されている操作水準とを比較し、修正キー頻度記憶部7
07内に記憶されている打鍵数が前記操作水準より大き
い場合には、尤度水準記憶部705内の尤度水準を10
%低い値に変更するようにしてもよい。また、同様に、
修正キー頻度記憶部707内に記憶されている打鍵数が
前記操作水準より小さい場合には、尤度水準記憶部70
5内の尤度水準を10%高い値に変更するようにしても
よい。これにより、精度rを算出するまでもなく、容易
に文字認識の精度を判断することができる。
【0102】図12は、図10のステップS1004に
おける候補文字限定処理を説明するフローチャートであ
る。CPU120は、限定開始候補番号Nを「5」に設
定する(ステップS1201)。CPU120は、第N
位候補である候補文字コード305を尤度306ととも
に、認識列管理部204に記憶されている候補文字情報
307から取り出し(ステップS1202)、取り出さ
れた尤度306が、尤度水準記憶部705に記憶されて
いる尤度水準と比較して小さいか否かを判定する(ステ
ップS1203)。小さい場合、候補文字情報307内
の第N位以下の候補の尤度306の値を「0」にしてこ
の候補を無効にし、候補文字限定処理を終了する(ステ
ップS1204)。
【0103】小さくない場合、Nをインクリメントし
(ステップS1205)、Nの値を最大候補数である
「10」と比較して(ステップS1206)、Nの値が
「10」以下である場合、ステップS1202の処理に
戻る。そうでなければ終了する。なお、変数Nは、処理
用バッファ708の領域に記憶される。図13は、図1
0のステップS1005における認識誤り補正処理を説
明するフローチャートである。
【0104】CPU120は、解釈開始点を認識列管理
部204に格納された認識列の先頭位置に設定する(ス
テップS1301)。CPU120は、認識列管理部2
04内の候補文字情報307に格納された候補文字コー
ド305を、補正用辞書アドレス記憶部706で指定さ
れる一般辞書と照合し、解釈開始点から始まり、日本語
の文法として成り立つ文節解釈を生成する(ステップS
1302)。なお、ステップS1302の処理について
は、後に詳述する。
【0105】次に、CPU120は、各認識列の中で、
処理し残した文字列があるか否かを判定する(ステップ
S1303)。処理し残した文字列があれば、次の解釈
開始点を設定したのち、ステップS1302の処理に戻
り、設定した解釈開始点から次の文節解釈を求める(ス
テップS1304)。処理し残した文字列がなければ、
処理対象となっている認識列について、文節として解釈
が可能な文節解釈の組み合わせからなる、すべての文節
解釈列が生成されたので、CPU120は、生成された
文節解釈列を、文節解釈数が少ないものから順に並べ
る。また、生成された文節解釈列の中に、それを構成す
る文節解釈数が同じ文節解釈列がある場合には、各文節
解釈列を構成する各候補文字コード305の尤度306
の値の和(以下、「認識尤度得点」という。)が大きい
方を先にして並べる。CPU120は、このようにして
並べられた各文節解釈列に、並びの順に優先順位を付け
る(ステップS1305)。
【0106】例えば、「現在/7は/日常的な」という
文節解釈列は、文節解釈の数が3であるが、「現在では
/日常的な」という候補は文節解釈の数が2なので、後
者の方が優先順が高い。また、例えば、「現在では/日
常的な」という文節解釈列の認識尤度得点は、「現」、
「在」、「で」、「は」、「日」、「常」、「的」、
「な」の各候補文字コード305の尤度306の値の合
計である。これに対して、「現在では/白樺的な」とい
う文節解釈列は、「現」、「在」、「で」、「は」、
「白」、「樺」、「的」、「な」の各候補文字コード3
05の尤度306の値の合計となる。これらの認識尤度
得点の差により、生成された文節解釈列の中で、最終的
に、第1候補が「現在では/日常的な」、第2候補が
「現在では/白樺的な」、第3候補が「現在/7は/日
常的な」という順位がつく。なお、この解釈開始点も処
理用バッファ708に記憶される変数であり、例えば、
文節解釈の先頭文字の文字位置情報303で表される。
【0107】図13(b)は、図13(a)のステップ
S1302における文節解釈生成処理をさらに詳細に説
明するフローチャートである。CPU120は、解釈開
始点で指定された文字位置情報303に対応する候補文
字情報307を参照し、候補文字コード305に格納さ
れた認識文字候補を補正用辞書アドレス記憶部706で
指定された誤り補正用辞書と照合しながら、1文字ずつ
並べ、自立語として解釈可能な自立語候補をすべて生成
する(ステップS1311)。生成された自立語候補は
中間バッファとして確保された処理用バッファ708に
格納される。なお、ここで用いる辞書検索の手法は、
「文字認識における自然言語処理 情報処理 Vol.
34 No.10 pp.1274−1280(199
3)」などに記載された探索方式を基にしたもので、ト
ライ構造の辞書を状態遷移によってデジタル検索するこ
とにより辞書検索の高速化を図っている。
【0108】自立語の検索が終わると、CPU120
は、対象自立語番号nを「1」に設定した上で(ステッ
プS1312)、ステップS1311で生成された第n
番目の自立語について、次の解釈開始点を起点として、
それに続く文字列を、付属語辞書と照合する(ステップ
S1313)。前記付属語辞書には、自立語辞書と同
様、トライ構造で付属語が収録されている。また、CP
U120は、前記自立語辞書に基づいて、自立語と付属
語の接続、付属語同士の接続の検定を行い、日本語の文
法として成り立つものだけを付属語解釈として残す。こ
れらの、文法検定処理などは、従来のかな漢字変換など
でも用いられている手法であり、その詳細は本発明の主
眼ではないので、説明を省略する。以上の結果、一文節
として解釈できる文節解釈が、前記処理用バッファ70
8上に生成される。
【0109】CPU120は、対象自立語番号nをイン
クリメントしたのち(ステップS1314)、対象自立
語番号nの自立語候補が、まだ、生成された自立語候補
のうちの最終候補でないと判定すると(ステップS13
15)、ステップS1313の処理に戻り、上記と同様
に、次の自立語候補について、それに続く文字列の付属
語辞書照合を行う。
【0110】なお、上記ステップS1311およびステ
ップS1313の文節解釈生成処理における辞書照合で
は、認識文字情報302内の区切り情報304の単語区
切り情報が有効(すなわち「1」)になっている場合、
CPU120は、この単語区切りを有する候補文字コー
ド305を語尾として完結する自立語候補、付属語候補
および文節解釈だけを有効とし、その他を無効とする。
【0111】図14は、図8のステップS808におけ
る名刺テキスト認識処理を説明するフローチャートであ
る。CPU120は、図10のステップS1002にお
ける認識対象領域抽出処理と同様に、スキャナー109
から読み取られた名刺の画像から、横方向、縦方向に写
像したヒストグラムに基づいて、名刺上のテキスト領域
を抽出する(ステップS1401)。
【0112】CPU120は、図10のステップS10
03における認識候補生成処理で説明した一般文書の場
合と同様に、1文字に対応する画像について、それぞれ
第10位までの候補文字コード305と尤度306との
組を生成し、認識列管理部204に格納する(ステップ
S1402)。次いで、CPU120は、基本的には図
13(a)に示した処理手順と同様の手順で認識誤り補
正処理を行い、その補正結果を名刺データ認識結果一時
記憶部501に格納する(ステップS1403)。この
際、利用する辞書は、補正用辞書アドレス記憶部706
にアドレスが記憶されている固有名詞辞書である。な
お、ステップS1403の処理については、後に詳述す
る(ステップS1403)。
【0113】CPU120は、名刺データ認識結果一時
記憶部501に格納された各名刺データの第1候補を、
認識対象ブロックの画像とともに、ディスプレイ106
に表示し、文書入力装置100が別途格納しているテキ
スト編集機能を起動する。オペレータは、前記表示画面
を見ながら、補正結果修正処理を行う(ステップS14
04)。
【0114】図14(b)は、図14(a)のステップ
S1403における名刺認識誤り補正処理を、より詳細
に説明するフローチャートである。CPU120は、図
13(a)に示した処理手順と同様の手順で認識誤り補
正を行う。この結果は、補正結果308に格納される
(ステップS1411)。この際、さらに、CPU12
0は、その補正結果308に含まれている「〒」などの
郵便番号マークや、「TEL」、「FAX」等の属性識
別文字列や、固有名詞辞書に格納された単語に付いてい
る、地名、人名、部署名を表す品詞情報を手がかりにし
て、その補正結果308が、「氏名」、「所属団体
名」、「所属部署名」、「住所」、「電話番号」、「F
AX番号」のいずれを表すデータであるかを推定し、名
刺データ認識結果一時記憶部501内の該当する記憶領
域に、前記補正結果308の第1候補から第5候補まで
を格納する。図15は、名刺入力処理における表示画面
およびデータの具体例を示す説明図である。図15
(a)は、CPU120に認識され、固有名詞辞書を参
照して認識誤り補正処理が行われた結果、名刺データ認
識結果一時記憶部501の氏名記憶部502に格納され
た人名データの例を示す。
【0115】次に、CPU120は、郵便番号記憶部5
07に格納された郵便番号候補をキーとして、郵便番号
に対応して郵便番号−住所照合テーブル部405内に格
納されている住所名データを取り出し、作業領域700
内の処理用バッファ708に格納する(ステップS14
12)。同様に、CPU120は、電話番号記憶部50
6に格納された電話番号をキーとして、電話番号に対応
して電話番号−住所照合テーブル部406内に格納され
ている住所名データを取り出し、作業領域700内の処
理用バッファ708に格納する(ステップS141
3)。
【0116】次いで、CPU120は、電話番号−住所
照合テーブル部406内に格納されている住所名データ
および郵便番号−住所照合テーブル部405内に格納さ
れている住所名データと、住所記憶部505内に格納さ
れている住所名データとを照合する(ステップS141
4、ステップS1415)。その結果、前記住所名デー
タに共通する住所名データが存在する場合、それを住所
記憶部505の住所に再設定する。すなわち、CPU1
20は、住所記憶部505に格納されている住所名デー
タのうち、処理用バッファ708に取り出された住所名
データと共通する住所名データだけを、住所記憶部50
5に格納する。また、同様に、電話番号記憶部506に
格納されている電話番号データのうち、前記住所名デー
タと対応する電話番号データだけを、電話番号記憶部5
06に格納し、郵便番号記憶部507に格納されている
郵便番号データのうち、前記住所名データと対応する郵
便番号データだけを、郵便番号記憶部507に格納する
(ステップS1416)。なお、ステップS1416で
は、処理用バッファ708に取り出された住所名データ
と共通する住所名データだけを住所記憶部505に格納
し、当該住所名データに対応する電話番号データだけを
電話番号記憶部506に、対応する郵便番号データだけ
を郵便番号記憶部507に格納するようにしたが、この
方法に限らず、該当する前記各データの優先順位を1ず
つ繰り上げてもよいし、前記各データに該当しない住所
名データ、電話番号データおよび郵便番号データを、住
所記憶部505、電話番号記憶部506および郵便番号
記憶部507内で無効とするようにしてもよい。
【0117】前記照合の結果、共通する住所名データが
存在しない場合、CPU120は、住所名データ、郵便
番号データまたは電話番号データのいずれかに間違いが
あることをディスプレイ106に表示させ、警告する
(ステップS1417)。具体的には、例えば、住所記
憶部505に格納されている第1位候補が「八尾市太田
新町」で、第2位候補が「七尾市大田新町」であると
き、前者の郵便番号は「581」、後者のそれは「92
6」、前者の市外番号は「0729」、後者のそれは
「0767」である。郵便番号記憶部507に格納され
ている郵便番号の候補に、「926」しか現れていない
場合には、住所記憶部505に格納されている第1候補
「八尾市太田新町」は、住所記憶部505内の候補から
除かれる。
【0118】なお、上記では、入力された文書が名刺の
場合に、郵便番号および電話番号と住所との関係から住
所名データを照合したが、郵便番号および電話番号と住
所との関係に限らず、社員名と社員番号との関係など、
関連性の有る他の固有名詞同士を対応づけて予め記憶し
ておき、照合に用いるようにしてもよい。また、入力さ
れた文書が名刺である場合に限らず、製品名と型番、書
籍名とISBN番号など、同様にして照合することによ
り、それらに対応する文字列を正しく認識することがで
きる。
【0119】図16は、図8のステップS809におけ
る名簿更新処理の手順を説明するフローチャートであ
る。CPU120は、氏名記憶部502から前記氏名デ
ータを取り出し、名簿情報記憶部601の氏名領域60
2に格納されている氏名データと比較し、一致する氏名
データを検索する(ステップS1601)。
【0120】名簿情報記憶部601の氏名領域602内
に該当する氏名データがない場合は(ステップS160
2)、名刺データ認識結果一時記憶部501内の当該候
補データを、新たな名簿情報としてディスプレイ106
に表示させ、ステップS1606の処理に移る(ステッ
プS1603)。図15(b)は、このときにディスプ
レイ106に表示される新規名簿情報の具体例を示す。
このとき、オペレータは、例えば、図15(b)に示し
た表示画面を見ながら、マウス115を操作し、表示画
面内の所定の領域にカーソルを位置させてクリックする
ことにより、CPU120に対して、表示された新規名
簿情報の追加、あるいは、表示された各項目の修正など
を指示することができる。
【0121】氏名領域602内に該当する氏名データが
存在する場合は(ステップS1602)、CPU120
は、名刺データ認識結果一時記憶部501の各名刺デー
タと、検索された前記氏名データに対応する名簿情報記
憶部601内の各名簿情報とを照合する。すなわち、C
PU120は、所属団体名記憶部503と所属団体名領
域603、所属部署名記憶部504と所属部署名領域6
04、住所記憶部505と住所領域605、電話番号記
憶部506と電話番号領域606および郵便番号記憶部
507と郵便番号領域607をそれぞれ、照合する。照
合の結果、全て一致している場合は、修正の必要がない
とみなして、処理を終了する(ステップS1604)。
名刺データ認識結果一時記憶部501の各名刺データ
と、検索された前記氏名データに対応する名簿情報記憶
部601内の各名簿情報とに、一部でも異なる情報があ
れば、該当する名刺データ認識結果一時記憶部501の
名刺データと、名簿情報記憶部601内の名簿情報と
を、ディスプレイ106に対照表示させ、オペレータの
確認を求める(ステップS1605)。図15(c)
は、このときディスプレイ106に表示される、前記対
象表示画面の具体例を示す。また、このとき、オペレー
タは、例えば、図15(b)に示した表示画面と同様、
図15(c)に示した表示画面を見ながら、マウス11
5を操作し、表示画面内の所定の領域にカーソルを位置
させてクリックすることにより、CPU120に対し
て、表示された名簿データによる名簿情報の修正、ある
いは、表示された各項目の修正などを指示することがで
きる。
【0122】CPU120は、オペレータから修正を指
示する入力があれば(ステップS1606)、文書入力
装置100が別途保有しているテキスト編集機能を起動
する。オペレータは、前記テキスト編集機能用いて、表
示された名刺データの内容を修正する。CPU120
は、オペレータによって修正された名刺データを、名刺
データ認識結果一時記憶部501内の該当する記憶部に
格納する(ステップS1607)。ステップS1606
において、オペレータから、名刺データの内容が妥当で
あることを示す入力があった場合は、名刺データ認識結
果一時記憶部501に格納されている名刺データで、名
簿情報記憶部601に格納されている名簿情報を書き換
える(ステップS1608)。
【0123】図17は、図8のステップS812におけ
る帳票テキスト認識処理の手順を説明するフローチャー
トである。CPU120は、処理対象ブロック番号Mを
「1」に設定する(ステップS1701)。次いで、C
PU120は、ブロック管理情報210の画像位置情報
203に基づいて、画像情報記憶部201から、第M認
識対象ブロック内の画像情報を取り出し、当該画像情報
に含まれるテキストを文字認識する(ステップS170
2)。この手順は、図10のステップS1003におけ
る認識候補生成処理と同様の手順で行われる。
【0124】CPU120は、横方向と縦方向に写像し
た画像のヒストグラムを生成し、画像および空白領域に
周期性があって画像と画像との間隔の狭い方向が文字方
向と推定する。図18は、帳票形式入力処理において入
力されるテキスト画像と、その文字列方向の推定方法と
の具体例を示す説明図である。図18(a)は、1つの
認識対象ブロック内の文字画像の配置と、その横方向お
よび縦方向の写像との一例を示す。縦方向は、文字の間
隔に見られるはずの空白領域が不規則であるので、この
場合は文字列方向は横方向であると推定する(ステップ
S1703)。図18(b)は、1つの認識対象ブロッ
ク内の文字画像の配置と、その横方向および縦方向の写
像との他の例を示す。一方、図18(a)の例に比べ
て、図18(b)のような帳票形式の場合は、どちらの
方向にも文字間隔は同じであるので、縦方向にも横方向
にも文字列の方向が考えられる。
【0125】CPU120は、縦方向の文字列方向が解
釈できるか否かを判定し(ステップS1704)、解釈
できる場合は、認識列管理部204内に、文字列方向2
13を「縦」とし、縦方向の認識列と対応したブロック
管理情報210を生成し(ステップS1705)、解釈
できない場合は、ステップS1707の処理に移る。C
PU120は、横方向の文字列方向が解釈できるか否か
を判定し(ステップS1706)、解釈できる場合、認
識列管理部204内に、文字列方向213を「横」と
し、横方向の認識列と対応したブロック管理情報210
を生成し(ステップS1707)、横方向の文字列方向
が解釈できない場合、ステップS1708の処理に移
る。
【0126】次いで、CPU120は、選択された文書
種別が帳票形式であるため、均等割付された表内タイト
ル中の空白による単語区切りを無視する。具体的には、
区切り情報304の単語区切り情報を、例えば「0」に
し、無効にする(ステップS1708)。これにより、
均等割り付けされた表内タイトル中の文字列が、均等割
り付けによる空白によって、誤って単語に区切られるこ
とを防止することができる。
【0127】CPU120は、図13(a)に示した手
順と同様に、認識誤り補正処理を行う。ただし、ここで
は、補正用辞書アドレス記憶部706に記憶されている
一般辞書部402内の一般辞書と、帳票用語辞書部40
4内の帳票用語辞書とを参照する(ステップS170
9)。この段階で、同一領域の画像に対して、文字列方
向を縦方向と解釈したブロック管理情報210と、文字
列方向を横方向と解釈したブロック管理情報210とが
生成されている場合、CPU120は、各々の補正結果
308の第1候補に含まれる文節解釈の総数を比較する
(ステップS1710)。例えば、図18(b)に示し
たテキスト画像において、文字列方向を横と解釈した場
合では、文節解釈として「銀行」と「振込」が得られ、
その合計は2になるが、文字列方向を縦と解釈した場合
は、「銀」、「振」、「行進」(「込」を「進」と誤っ
て補正したとき)の3になることがある。
【0128】この結果、CPU120は、文節解釈の総
数が少ない方の文字列方向の解釈を採用し、採用されな
かった文字列方向解釈のブロック管理情報210は無効
にされる(ステップS1711、ステップS171
2)。最後に、CPU120は、処理対象ブロック番号
Mをインクリメントした上(ステップS1713)、最
終認識対象ブロックまでこの処理を繰り返す(ステップ
S1714)。
【0129】図19は、図8のステップS813に示し
た印刷位置設定処理を説明するフローチャートである。
以下では、帳票テキストの認識処理が完了した後、各認
識対象ブロック内における認識文字の印刷位置を設定す
る処理の手順を示す。CPU120は、まず処理対象ブ
ロック番号Mを「1」に設定し(ステップS190
1)、第M認識対象ブロックと対応する認識列管理部2
04のブロック管理情報210を参照する(ステップS
1902)。
【0130】次いで、CPU120は、罫線枠情報21
2が「1」である認識対象ブロックについては、認識列
ごとに、補正結果308の先頭文字と末尾文字とに対応
する各候補文字情報307の区切り情報304に、それ
ぞれ、均等割付開始制御情報と均等割付終了制御情報と
を付与する。具体的には、例えば、均等割付開始制御情
報および均等割付終了制御情報として、区切り情報30
4にそれぞれ、「1」を設定する(ステップS190
3)。なお、ステップS1903では、罫線枠内の文字
列をすべて均等割り付けするよう、各認識列に均等割付
開始制御情報および均等割付終了制御情報を付与した
が、本発明の均等割り付け対象は、前記認識列に限定さ
れない。例えば、まず、1つの認識列に含まれている文
字の文字位置情報303から、その認識列内で連続する
文字画像の文字間隔を算出し、原稿の認識列内の文字列
が均等割り付けされているか否かを判断するとともに、
前記判断結果に従って、文字列が均等割り付けされてい
る認識列については、均等割付開始制御情報および均等
割付終了制御情報を付与するようにしてもよい。
【0131】CPU120は、処理対象ブロック番号M
をインクリメントしながら(ステップS1904)、ス
テップS1902からステップS1904までの処理を
認識対象ブロックが終了するまで繰り返す(ステップS
1905)。図20は、入力された帳票を印刷する処理
の手順を示すフローチャートである。以下では、認識文
字の印刷位置の設定処理が完了した後、例えば、認識結
果がディスプレイ106に表示され、オペレータから認
識結果の印刷を指示する入力があった場合の帳票印刷処
理の手順を示す。
【0132】CPU120は、表示データ記憶部203
をクリアし、処理対象ブロック番号Mを「1」に設定す
る(ステップS2001)。CPU120は、第M認識
対象ブロックと対応する画像位置情報203、罫線枠情
報204、文字列方向213を参照し(ステップS20
02)、罫線枠があるかないかの判定を行い(ステップ
S2003)、ある場合は、表示データ記憶部203上
で、画像位置情報203と対応する位置に罫線枠を書き
込む(ステップS2004)。
【0133】CPU120は、処理対象認識列番号Lを
「1」に設定する(ステップS2005)。CPU12
0は、第L認識列内の文字と対応する認識文字情報30
2の文字位置情報303情報を参照し、プリンタ114
の印字フォントサイズの中からそれと最も近い印字フォ
ントサイズを選択する。例えば、プリンタ114の印字
フォントが16×16、24×24、32×32、48
×48で、文字位置情報303の座標値から算出された
文字サイズが35×34である場合、CPU120は、
プリンタ114の印字フォントサイズと、算出された文
字サイズとの差の絶対値が最も小さい印字フォントサイ
ズである32×32を選択する(ステップS200
6)。同時に、CPU120は、選択された文字サイズ
が、所定の基準値で定められる許容範囲内にあるか否か
を判定し、必要な場合は再設定する。具体的には、選択
された文字サイズの文字高が、行間隔もしくは罫線枠と
の間隔より3倍以上大きいときは3倍までにとどめる。
選択された文字サイズの文字幅が、文字間隔もしくは罫
線枠との間隔よりも3倍以上大きいときは3倍までにと
どめる。
【0134】CPU120は、第L認識列と対応する認
識列管理部204の認識列管理情報301を参照し、参
照した第L認識列の補正結果308に含まれている文字
に対応した区切り情報304に、前記均等割付制御情報
が付与されている場合(ステップS2007)、補正結
果308の先頭文字と対応する文字位置情報303と、
末尾文字と対応する文字位置情報303とを参照し、こ
の文字間に補正結果308の残りの文字列を、以下のよ
うにして均等間隔に配置する。
【0135】すなわち、オペレータからの入力により印
刷指定されたとき、CPU120は、この均等割り付け
情報が付与された部分は、認識対象ブロックの幅総ドッ
ト数をW、1文字の印字ドット数をC、文字数をnと
し、以下の式から文字間隔幅iを求め、印字する。i=
(W−n*C)/(C+1)例えば、認識対象ブロック
の幅総ドット数180ドットに、印字ドット数24ドッ
トの文字を5文字印刷する場合、文字間隔幅iは、以下
のように10ドット幅となる。
【0136】 i=(180−5*24)/(5+1)=(180−120)/6 =60/6=10 CPU120は、これを1つの認識対象ブロック内の全
認識列に対して繰り返し、終了すると次の認識対象ブロ
ックの処理に移る(ステップS2009、ステップS2
010)。さらに、CPU120は、上記ステップS2
002からステップS2010までの処理を、全認識対
象ブロックに対して行う(ステップS2011、ステッ
プS2012)。
【0137】以上のように本実施例によれば、一般文書
を入力する場合、候補文字情報307の中から文字認識
結果の第1候補を取り出して得られた文字列と、オペレ
ータの確認により最終確定された文字列とを比較照合
し、文字認識の精度を求め、これに応じて文字認識候補
の候補数を変えることにより、文字認識精度の変動に適
応した認識誤り補正処理を行うことができる。
【0138】具体的には、本実施例によれば、認識対象
となる文書の原稿が、何度もコピーされて文字のかすれ
や汚れを生じた原稿であって、文字認識精度が低いとき
には、認識誤り補正処理に用いる候補文字コード305
の候補数を多くして、認識誤り補正処理の補正の精度を
高めることができる。また、本実施例によれば、認識対
象となる文書の原稿が鮮明な画像で得られた場合のよう
に、文字認識精度が高いときには、認識誤り補正処理に
用いる候補文字コード305の候補数を少なくして、認
識誤り補正処理に要する時間を短縮し、結果的に、文書
入力装置100全体の処理時間を短縮することができ
る。
【0139】さらに、オペレータが表示された補正結果
308を修正するために用いた修正用のキーの打鍵数を
予め定めた操作水準と比較することにより、大まかにで
はあるが、前記文字認識の精度を判断することができ
る。これにより、候補文字情報307の中から文字認識
結果の第1候補を取り出して得られた文字列と、オペレ
ータの確認により最終確定された文字列とを1文字ずつ
比較照合して精度を算出するという手間が省け、容易に
上記効果を得ることができる。
【0140】また、帳票形式入力の場合、文字間の短い
空白による区切りを無視することにより、均等割付され
た文字も、単語の途中で分割されることなく正しく辞書
照合することができ、辞書照合による誤り補正効果を十
分発揮することができる。また、文書入力装置100
は、原稿内の文字レイアウトを文字位置情報303とし
て記憶し、認識誤り補正処理によって得られた補正結果
308を文節解釈の並びからなる認識列を単位として記
憶する。従って、表示された補正結果308内の文字列
を訂正する場合にも、1つの文節解釈を単位として訂正
することができ、誤って文字認識された文字を1文字ず
つ訂正するわずらわしさをなくすことができる。ただ
し、帳票形式入力で、罫線枠内に均等割り付けして表示
された文字列を訂正する場合、訂正後の文字列を罫線枠
内に均等割り付けして表示させるために、文字列の先頭
文字と末尾文字とに均等割り付け情報を付与する必要が
ある。
【0141】また、本実施例によれば、文書入力装置1
00は、縦方向と横方向の両方の文字列方向の解釈がで
きるとき、当該認識対象ブロックについて、両方向の認
識列解釈を生成し、辞書照合による認識誤り補正処理の
結果を比較することにより正しい文字列方向の解釈を求
めることができ、文字列の方向が決まらず、そのため認
識誤り補正の効果が発揮されないといった問題点を解決
することができる。
【0142】また、本実施例によれば、帳票形式入力の
場合、画像上の文字位置情報303および画像位置情報
211に基づいて、印字文字サイズを設定し、設定され
る印字文字サイズの範囲を制限することにより、罫線枠
内の文字が著しくバランスの悪い文字サイズで印字され
てしまうという問題点を解決することができる。また、
本実施例によれば、名刺入力の場合、郵便番号や電話番
号を手掛かりとして補正結果として得られた住所候補等
を制限することにより、地名認識の補正効果を高め、類
字形文字を多く含んだ地名の認識正解率が低いという問
題点を解決することができる。また、本実施例によれ
ば、郵便番号および電話番号と住所名との関係に限ら
ず、また、名刺入力の場合に限らず、同様にして、固有
名詞および一般名詞などの用語の正しい補正結果308
を得ることができる。
【0143】
【発明の効果】従って、請求項1記載の本発明によれ
ば、所定数の前記文字列画像に対する前記文字列の候補
が生成される毎に、前記正解率で表される文字認識の精
度を算出し、算出された文字認識の精度に応じて、前記
文字列候補生成手段が組み合わせに用いる文字コードの
候補の数を限定するので、文字認識精度の変動に適応し
た文字列候補生成処理を行うことができる。すなわち、
認識対象となる文書の原稿が、何度もコピーされて文字
のかすれや汚れを生じた原稿であって、文字認識精度が
低いときには、前記文字列候補生成手段が組み合わせに
用いる文字コードの候補の数を多くすることによって、
生成される文字列の候補の正解率を高めることができ
る。また、認識対象となる文書の原稿が鮮明な画像で得
られた場合のように、文字認識精度が高いときには、前
記文字列候補生成手段が組み合わせに用いる文字コード
の候補の数を少なくすることによって、前記文字列候補
生成手段の文字列候補生成速度を短縮することができ、
結果的に、文書入力装置全体の処理時間を短縮すること
ができる。
【0144】従って、請求項2記載の本発明によれば、
計数された修正指示数に応じて尤度基準記憶手段内の前
記尤度基準値を変更するので、請求項1における正解率
を算出する手間が省け、より容易に上記効果を得ること
ができる。従って、請求項3記載の本発明によれば、罫
線枠内の文字間の空白による単語区切りを無視すること
により、均等割付された文字も、単語の途中で分割され
ることなく正しく認識することができ、認識誤り補正効
果を十分発揮することができる。
【0145】従って、請求項4記載の本発明によれば、
識別された罫線枠内に均等割り付けして表示されている
所定の文字列の候補は、前記文字列候補記憶手段内に文
字列として格納されているので、修正の際に、文字列を
単位として修正することができる。このため、オペレー
タは、従来のように1文字毎に修正指示を入力する必要
がなく、均等割り付け表示された文字列を容易に修正す
ることができる。
【0146】従って、請求項5記載の本発明によれば、
取り込まれた文書の画像内の画像領域と空白領域との分
布からは、文字列の方向が縦横いずれの方向であるとも
解釈できる場合には、一旦、両方向について文字列の候
補を生成した上、前記文字列方向判定手段が、他の判断
基準に従って、文字列の方向を判定するので、より正確
に文字列の方向を判定することができる。従って、認識
誤り補正処理の効果を、十分得ることができる。
【0147】従って、請求項6記載の本発明によれば、
印字された罫線枠内に、生成された文字列の候補のうち
の所定の候補を、取り込まれた文書の画像から切り出さ
れた文字の画像の文字サイズに最も近い印字フォントサ
イズで印字することができる。すなわち、本発明によれ
ば、印字された罫線枠内に、生成された文字列の候補の
うちの所定の候補を、認識対象の文書中に印字されてい
た文字サイズに応じた印字フォントサイズで印字するこ
とができる。
【0148】従って、請求項7記載の本発明によれば、
上記効果に加えて、印字された罫線枠内に、生成された
文字列の候補のうちの所定の候補を、罫線枠に対して釣
り合いがとれた文字サイズで印刷することができる。従
って、請求項8記載の本発明によれば、同一の属性を表
す用語の中で、例えば、「大田」と「太田」のように、
それぞれに正しい用語であるが類似字形を多く含むため
に認識誤りを生じやすい文字列を多く含んでいる住所表
示、氏名などの用語を認識する場合、上記検索結果との
照合を行うことにより、より正確な認識誤り補正結果を
得ることができる。
【0149】従って、請求項9記載の本発明によれば、
請求項1記載の本発明と同様の効果を得ることができ
る。従って、請求項10記載の本発明によれば、請求項
2記載の本発明と同様の効果を得ることができる。従っ
て、請求項11記載の本発明によれば、請求項3記載の
本発明と同様の効果を得ることができる。
【0150】従って、請求項12記載の本発明によれ
ば、請求項4記載の本発明と同様の効果を得ることがで
きる。従って、請求項13記載の本発明によれば、請求
項5記載の本発明と同様の効果を得ることができる。従
って、請求項14記載の本発明によれば、請求項6記載
の本発明と同様の効果を得ることができる。
【0151】従って、請求項15記載の本発明によれ
ば、請求項7記載の本発明と同様の効果を得ることがで
きる。従って、請求項16記載の本発明によれば、請求
項8記載の本発明と同様の効果を得ることができる。
【図面の簡単な説明】
【図1】本発明の第1実施例である文書入力装置100
のハードウェア構成を示すブロック図である。
【図2】文書入力装置100の認識結果を格納するため
に主記憶101上に設けられる記憶領域の区分と、その
記憶内容とを示す説明図である。
【図3】認識列管理部204に記憶される認識列管理情
報301のデータフォーマットを示す説明図である。
【図4】主記憶101上に設けられる単語辞書記憶部4
12の記憶領域区分を示す説明図である。
【図5】主記憶101上に設けられる名刺データ認識結
果一時記憶部501の記憶領域区分を示す説明図であ
る。
【図6】主記憶101上に設けられる名簿情報記憶部6
01の記憶領域区分を示す説明図である。
【図7】主記憶101上に設けられる作業領域の記憶領
域区分を示す説明図である。
【図8】CPU120の処理手順の全体の概要を示すフ
ローチャートである。
【図9】文書入力処理の初期段階における表示画面およ
びデータの具体例を示す説明図である。
【図10】図8に示したステップS805におけるテキ
スト認識処理の内容を詳細に説明するフローチャートで
ある。
【図11】文字認識処理により生成された認識文字情報
302および認識誤り補正後に表示される表示画面の具
体例を示す説明図である。
【図12】図10のステップS1004における候補文
字限定処理を説明するフローチャートである。
【図13】図10のステップS1005における認識誤
り補正処理を説明するフローチャートである。
【図14】図8のステップS808における名刺テキス
ト認識処理を説明するフローチャートである。
【図15】名刺入力処理における表示画面およびデータ
の具体例を示す説明図である。
【図16】図8のステップS809における名簿更新処
理の手順を説明するフローチャートである。
【図17】図8のステップS812における帳票テキス
ト認識処理の手順を説明するフローチャートである。
【図18】帳票形式入力処理において入力されるテキス
ト画像と、その文字列方向の推定方法との具体例を示す
説明図である。
【図19】図8のステップS813に示した印刷位置設
定処理を説明するフローチャートである。
【図20】入力された帳票を印刷する処理の手順を示す
フローチャートである。
【符号の説明】
100 文書入力装置 101 主記憶 102 バス制御ユニット 104 ローカルバス 105 グラフィクス制御ユニット 106 ディスプレイ 107 SCSI制御ユニット 108 ハードディスク装置 109 スキャナー 110 バスブリッジ回路 111 外部バス 112 入出力制御ユニット 113 キーボード 114 プリンタ 115 マウス 120 CPU

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 取り込んだ文書の画像に含まれる文字の
    画像を文字認識し、画像として取り込んだ文書を、認識
    結果として得られた文字コードからなる文書として入力
    する文書入力装置であって、 1つの文字の画像の文字認識結果として、文字コードの
    複数の候補を、その確からしさを示す尤度と対応付けて
    記憶する文字コード候補記憶手段と、 前記尤度のあらかじめ定める尤度基準値を記憶する尤度
    基準記憶手段と、 取り込まれた文書の画像中の文字列を表す同一の文字列
    画像について、前記尤度基準記憶手段内の前記尤度基準
    値以上の尤度を有する前記文字コードの候補の組み合わ
    せから、文法的に正しく解釈することができる文字列の
    複数の候補を生成する文字列候補生成手段と、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、同一の前記文字列画像について生成された文
    字列の候補のうち、所定の候補を表示する表示手段と、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、オペレータからの修正指示を入力する入力手
    段と、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、前記修正指示に従って、誤って認識されてい
    る文字コードを、正しい文字コードに修正する修正手段
    と、 前記修正手段による修正の後、前記文字列画像に対応す
    る修正後の文字列と、同一文字列画像に対応する最も尤
    度の高い文字コードの候補からなる文字列とを比較する
    比較手段と、 前記比較手段による比較の後、前記比較結果に基づい
    て、前記両者の間で相違する文字数と前記一方の文字列
    に含まれる文字数との割合から、文字認識の正解率を算
    出する正解率算出手段と、 前記正解率のあらかじめ定める正解率基準値を記憶する
    正解率基準記憶手段と、 前記正解率が算出された後、算出された正解率が、前記
    正解率基準値と比較して所定の条件を満足する場合に
    は、算出された正解率に応じて尤度基準記憶手段内の前
    記尤度基準値を変更する尤度基準値変更手段とを備える
    ことを特徴とする文書入力装置。
  2. 【請求項2】 取り込んだ文書の画像に含まれる文字の
    画像を文字認識し、画像として取り込んだ文書を、認識
    結果として得られた文字コードからなる文書として入力
    する文書入力装置であって、 1つの文字の画像の文字認識結果として、文字コードの
    複数の候補を、その確からしさを示す尤度と対応付けて
    記憶する文字コード候補記憶手段と、 前記尤度のあらかじめ定める尤度基準値を記憶する尤度
    基準記憶手段と、 取り込まれた文書の画像中の文字列を表す同一の文字列
    画像について、前記尤度基準記憶手段内の前記尤度基準
    値以上の尤度を有する前記文字コードの候補の組み合わ
    せから、文法的に正しく解釈することができる文字列の
    複数の候補を生成する文字列候補生成手段と、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、同一の前記文字列画像について生成された文
    字列の候補のうち、所定の候補を表示する表示手段と、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、オペレータからの修正指示を入力する入力手
    段と、 前記入力手段から入力された修正指示を計数する修正指
    示計数手段と、 前記修正指示数のあらかじめ定める修正指示数基準値を
    記憶する修正指示基準記憶手段と、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、前記修正指示に従って、誤って認識されてい
    る文字コードを、正しい文字コードに修正する修正手段
    と、 前記修正手段による修正の後、計数された修正指示数
    が、前記修正指示基準記憶手段に記憶されている修正指
    示数基準値と比較して所定の条件を満足する場合には、
    計数された修正指示数に応じて尤度基準記憶手段内の前
    記尤度基準値を変更する尤度基準値変更手段とを備える
    ことを特徴とする文書入力装置。
  3. 【請求項3】 取り込んだ文書の画像に含まれる文字の
    画像を文字認識し、画像として取り込んだ文書を、認識
    結果として得られた文字コードからなる文書として入力
    する文書入力装置であって、 一行の文字列を表す文字列画像から切り出された1文字
    の画像と、それに隣接する1文字の画像との間の空白を
    検出する空白検出手段と、 検出された空白が所定の大きさより大きい場合、前記1
    文字の画像とそれに隣接する1文字の画像とは、それぞ
    れ、異なる単語に属する文字であると識別する単語識別
    手段と取り込まれた文書の画像中の所定の領域内の文字
    列画像について、前記単語識別手段の識別結果を無効と
    する単語識別限定手段とを備えることを特徴とする文書
    入力装置。
  4. 【請求項4】 取り込んだ文書の画像に含まれる文字の
    画像を文字認識し、画像として取り込んだ文書を、認識
    結果として得られた文字コードからなる文書として入力
    する文書入力装置であって、 取り込まれた文書の画像から切り出された1文字の画像
    の文字認識結果として文字コードの複数の候補を記憶す
    る文字コード候補記憶手段と、 取り込まれた文書の画像内の罫線枠を識別する罫線枠識
    別手段と、 取り込まれた文書の画像中の文字列を表す同一の文字列
    画像について、前記文字コードの候補を組み合わせ、文
    法的に正しく解釈することができる文字列の複数の候補
    を生成する文字列候補生成手段と、 生成された文字列の候補を格納する文字列候補記憶手段
    と、 1つの文字列画像に対応する所定の文字列の候補を、前
    記文字列候補記憶手段から読み出して、識別された罫線
    枠内に均等割り付けして表示する表示手段とを備えるこ
    とを特徴とする文書入力装置。
  5. 【請求項5】 取り込んだ文書の画像に含まれる文字の
    画像を文字認識し、画像として取り込んだ文書を、認識
    結果として得られた文字コードからなる文書として入力
    する文書入力装置であって、 取り込まれた文書の画像から切り出された1文字の画像
    の文字認識結果として文字コードの複数の候補を記憶す
    る文字コード候補記憶手段と、 取り込まれた文書の画像内の画像領域と空白領域との分
    布に基づいて、取り込まれた文書の画像内の文字列の方
    向が縦横いずれの方向であるかを識別する文字列方向識
    別手段と、 取り込まれた文書の画像内の画像領域と空白領域との分
    布からは、文字列の方向が縦横いずれの方向であるとも
    解釈できる場合、前記両方向について、それぞれ、文字
    列を表す同一の文字列画像について、前記文字コードの
    候補を組み合わせ、文法的に正しく解釈することができ
    る文字列の複数の候補を生成する文字列候補生成手段
    と、 前記縦方向の文字列画像について生成された文字列の候
    補のうちの所定の候補と、前記横方向の文字列画像につ
    いて生成された文字列の候補のうちの所定の候補とを比
    較して、前記所定の候補が予め定める条件を満足する方
    の文字列方向およびその文字列の候補を有効と判定する
    文字列方向判定手段とを備えることを特徴とする文書入
    力装置。
  6. 【請求項6】 取り込んだ文書の画像に含まれる文字の
    画像を文字認識し、画像として取り込んだ文書を、認識
    結果として得られた文字コードからなる文書として入力
    する文書入力装置であって、 取り込まれた文書の画像内の罫線枠を識別する罫線枠識
    別手段と、 取り込まれた文書の画像から切り出された1文字の画像
    の文字認識結果として、文字コードの複数の候補を、当
    該文字の画像の前記文書の画像内における位置および文
    字サイズとともに記憶する文字コード候補記憶手段と、 取り込まれた文書の画像中の文字列を表す同一の文字列
    画像について、前記文字コードの候補の組み合わせか
    ら、文法的に正しく解釈することができる文字列の複数
    の候補を生成する文字列候補生成手段と、 生成された文字列の候補のうちの所定の候補を、識別さ
    れた前記罫線枠内に印字する際、当該文字列の候補内の
    前記文字コードの候補が対応する画像の文字サイズを調
    べ、印字することができる印字フォントサイズの中か
    ら、調べた文字サイズに最も近い印字フォントサイズを
    選択する印字文字サイズ選択手段と、 識別された罫線枠を印字するとともに、生成された文字
    列の候補のうちの所定の候補を、印字された罫線枠内
    に、選択された印字文字サイズで印字する印字手段とを
    備えることを特徴とする文書入力装置。
  7. 【請求項7】 請求項6記載の文書入力装置において、 前記文字コード候補記憶手段を参照して、前記文字列の
    候補内の前記文字コードの候補が対応する画像の前記文
    書の画像内における位置を調べ、当該文字の画像を挟む
    上下の空白領域の大きさを算出する上下間隔算出手段
    と、 前記文字コード候補記憶手段を参照して、前記文字列の
    候補内の前記文字コードの候補が対応する画像の前記文
    書の画像内における位置を調べ、当該文字の画像を挟む
    左右の空白領域の大きさを算出する左右間隔算出手段
    と、 選択される印字フォントサイズの上下方向の大きさが、
    算出された上下の空白領域の大きさと比べて所定の大き
    さを越えないよう、選択される印字フォントサイズの上
    下方向の大きさを限定する上下サイズ限定手段と、 選択される印字フォントサイズの左右方向の大きさが、
    算出された左右の空白領域の大きさと比べて所定の大き
    さを越えないよう、選択される印字フォントサイズの左
    右方向の大きさを限定する左右サイズ限定手段とを備
    え、 前記印字文字サイズ選択手段は、前記上下サイズ限定手
    段と前記左右サイズ限定手段とによって限定された印字
    フォントサイズの中から、調べた文字サイズに最も近い
    印字フォントサイズを選択することを特徴とする文書入
    力装置。
  8. 【請求項8】 取り込んだ文書の画像に含まれる文字の
    画像を文字認識し、画像として取り込んだ文書を、認識
    結果として得られた文字コードからなる文書として入力
    する文書入力装置であって、 取り込まれた文書の画像から切り出された1文字の画像
    の文字認識結果として文字コードの複数の候補を記憶す
    る文字コード候補記憶手段と、 文字列を表す同一の文字列画像について、前記文字コー
    ドの候補を組み合わせ、用語として正しく解釈すること
    ができる文字列の複数の候補を、所定の優先順位ととも
    に生成する文字列候補生成手段と、 生成された文字列の候補の中から、特定の文字コードを
    識別し、その文字コードを含む文字列の候補および当該
    文字列の候補と同一文字列画像について生成された文字
    列の候補が表す用語の属性を判定する属性判定手段と、 相互に関連した属性を有する用語同士を対応付けて格納
    する属性間対応用語記憶手段と、 あらかじめ定める属性別に、属性が判定された前記文字
    列の候補を前記優先順位とともに格納する属性別文字列
    候補記憶手段と、 前記属性別文字列候補記憶手段に格納されている文字列
    の候補であって、前記属性間対応用語記憶手段に格納さ
    れている用語の属性を表すものについて、前記各文字列
    の候補をキーとして、前記前記属性間対応用語記憶手段
    から対応する用語を検索する用語検索手段と、 前記属性別文字列候補記憶手段に格納されている文字列
    の候補のうち、相互に関連した他の属性の文字列の候補
    をキーとする前記用語検索手段の検索結果と共通する文
    字列の候補の優先順位を高める優先順位変更手段とを備
    えることを特徴とする文書入力装置。
  9. 【請求項9】 予め定める尤度基準値と予め定める正解
    率基準値とを、それぞれ尤度基準記憶部と正解率基準記
    憶部とに格納しておき、取り込んだ文書の画像に含まれ
    る文字の画像を文字認識しながら、1つの文字の画像の
    文字認識結果として、文字コードの複数の候補を、その
    確からしさを示す尤度と対応付けて文字コード候補記憶
    部に格納し、画像として取り込んだ文書を、認識結果と
    して得られた文字コードからなる文書として入力する文
    書入力方法であって、 取り込まれた文書の画像中の文字列を表す同一の文字列
    画像について、前記尤度基準記憶部に格納されている尤
    度基準値以上の尤度を有する前記文字コードの候補の組
    み合わせから、文法的に正しく解釈することができる文
    字列の複数の候補を生成する文字列候補生成ステップ
    と、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、同一の前記文字列画像について生成された文
    字列の候補のうち、所定の候補を表示する表示ステップ
    と、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、オペレータからの修正指示を入力する入力ス
    テップと、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、前記修正指示に従って、誤って認識されてい
    る文字コードを、正しい文字コードに修正する修正ステ
    ップと、 前記修正の後、前記文字列画像に対応する修正後の文字
    列と、同一文字列画像に対応する最も尤度の高い文字コ
    ードの候補からなる文字列とを比較する比較ステップ
    と、 前記比較の後、前記比較結果に基づいて、前記両者の間
    で相違する文字数と前記一方の文字列に含まれる文字数
    との割合から、文字認識の正解率を算出する正解率算出
    ステップと、 前記正解率が算出された後、算出された正解率が、前記
    正解率基準記憶部に格納されている正解率基準値と比較
    して所定の条件を満足する場合には、算出された正解率
    に応じて尤度基準記憶部内の前記尤度基準値を変更し、
    前記文字列候補生成ステップに戻る尤度基準値変更ステ
    ップとを備えることを特徴とする文書入力方法。
  10. 【請求項10】 予め定める尤度基準値と予め定める修
    正指示数基準値とを、それぞれ尤度基準記憶部と修正指
    示基準記憶部とに格納しておき、取り込んだ文書の画像
    に含まれる文字の画像を文字認識しながら、1つの文字
    の画像の文字認識結果として、文字コードの複数の候補
    を、その確からしさを示す尤度と対応付けて文字コード
    候補記憶部に格納し、画像として取り込んだ文書を、認
    識結果として得られた文字コードからなる文書として入
    力する文書入力方法であって、 取り込まれた文書の画像中の文字列を表す同一の文字列
    画像について、前記尤度基準記憶部内の前記尤度基準値
    以上の尤度を有する前記文字コードの候補の組み合わせ
    から、文法的に正しく解釈することができる文字列の複
    数の候補を生成する文字列候補生成ステップと、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、同一の前記文字列画像について生成された文
    字列の候補のうち、所定の候補を表示する表示ステップ
    と、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、オペレータからの修正指示を入力する入力ス
    テップと、 入力された修正指示を計数する修正指示計数ステップ
    と、 前記文字列画像に対応して生成された前記文字列の候補
    に対して、前記修正指示に従って、誤って認識されてい
    る文字コードを、正しい文字コードに修正する修正ステ
    ップと、 前記修正の後、計数された修正指示数が、前記修正指示
    基準記憶部に記憶されている修正指示数基準値と比較し
    て所定の条件を満足する場合には、計数された修正指示
    数に応じて尤度基準記憶部内の前記尤度基準値を変更す
    る尤度基準値変更ステップとを備えることを特徴とする
    文書入力方法。
  11. 【請求項11】 取り込んだ文書の画像に含まれる文字
    の画像を文字認識し、画像として取り込んだ文書を、認
    識結果として得られた文字コードからなる文書として入
    力する文書入力方法であって、 一行の文字列を表す文字列画像から切り出された1文字
    の画像と、それに隣接する1文字の画像との間の空白を
    検出する空白検出ステップと、 検出された空白が所定の大きさより大きい場合、前記1
    文字の画像とそれに隣接する1文字の画像とは、それぞ
    れ、異なる単語に属する文字であると識別する単語識別
    ステップと、 取り込まれた文書の画像中の所定の領域内の文字列画像
    について、前記識別結果を無効とする単語識別限定ステ
    ップとを備えることを特徴とする文書入力方法。
  12. 【請求項12】 取り込まれた文書の画像から切り出さ
    れた1文字の画像を文字認識しながら、認識結果として
    文字コードの複数の候補を文字コード候補記憶部に格納
    し、画像として取り込んだ文書を、認識結果として得ら
    れた文字コードからなる文書として入力する文書入力方
    法であって、 取り込まれた文書の画像内の罫線枠を識別する罫線枠識
    別ステップと、 取り込まれた文書の画像中の文字列を表す同一の文字列
    画像について、前記文字コードの候補を組み合わせ、文
    法的に正しく解釈することができる文字列の複数の候補
    を生成する文字列候補生成ステップと、 生成された文字列の候補を文字列候補記憶部に格納する
    文字列候補格納ステップと、 1つの文字列画像に対応する所定の文字列の候補を、前
    記文字列候補記憶部から読み出して、識別された罫線枠
    内に均等割り付けして表示する表示ステップとを備える
    ことを特徴とする文書入力方法。
  13. 【請求項13】 取り込んだ文書の画像に含まれる文字
    の画像を文字認識しながら、1文字の画像の文字認識結
    果として文字コードの複数の候補を文字コード候補記憶
    部に格納し、画像として取り込んだ文書を、認識結果と
    して得られた文字コードからなる文書として入力する文
    書入力方法であって、 取り込まれた文書の画像内の画像領域と空白領域との分
    布に基づいて、取り込まれた文書の画像内の文字列の方
    向が縦横いずれの方向であるかを識別する文字列方向識
    別ステップと、 取り込まれた文書の画像内の画像領域と空白領域との分
    布からは、文字列の方向が縦横いずれの方向であるとも
    解釈できる場合、前記両方向についてそれぞれ、文字列
    を表す同一の文字列画像について、前記文字コードの候
    補の組み合わせから、文法的に正しく解釈することがで
    きる文字列の複数の候補を生成する文字列候補生成ステ
    ップと、 前記縦方向の文字列画像について生成された文字列の候
    補のうちの所定の候補と、前記横方向の文字列画像につ
    いて生成された文字列の候補のうちの所定の候補とを比
    較して、前記所定の候補が予め定める条件を満足する方
    の文字列方向およびその文字列の候補を有効と判定する
    文字列方向判定ステップとを備えることを特徴とする文
    書入力方法。
  14. 【請求項14】 取り込んだ文書の画像に含まれる文字
    の画像を文字認識しながら、1文字の画像の文字認識結
    果として、文字コードの複数の候補を当該文字の画像の
    前記文書の画像内における位置および文字サイズととも
    に文字コード候補記憶部に格納し、画像として取り込ん
    だ文書を、認識結果として得られた文字コードからなる
    文書として入力する文書入力方法であって、 取り込まれた文書の画像内の罫線枠を識別する罫線枠識
    別ステップと、 取り込まれた文書の画像中の文字列を表す同一の文字列
    画像について、前記文字コードの候補の組み合わせか
    ら、文法的に正しく解釈することができる文字列の複数
    の候補を生成する文字列候補生成ステップと、 生成された文字列の候補のうちの所定の候補を、識別さ
    れた前記罫線枠内に印字する際、当該文字列の候補内の
    前記文字コードの候補が対応する画像の文字サイズを調
    べ、印字することができる印字フォントサイズの中か
    ら、調べた文字サイズに最も近い印字フォントサイズを
    選択する印字文字サイズ選択ステップと、識別された罫
    線枠を印字するとともに、生成された文字列の候補のう
    ちの所定の候補を、印字された罫線枠内に、選択された
    印字文字サイズで印字する印字ステップとを備えること
    を特徴とする文書入力方法。
  15. 【請求項15】 請求項14記載の文書入力方法におい
    て、 前記罫線枠識別ステップの後、前記文字コード候補記憶
    部を参照して、前記文字列の候補内の前記文字コードの
    候補が対応する画像の前記文書の画像内における位置を
    調べ、当該文字の画像を挟む上下の空白領域の大きさを
    算出する上下間隔算出ステップと、 前記文字コード候補記憶部を参照して、前記文字列の候
    補内の前記文字コードの候補が対応する画像の前記文書
    の画像内における位置を調べ、当該文字の画像を挟む左
    右の空白領域の大きさを算出する左右間隔算出ステップ
    と、 選択される印字フォントサイズの上下方向の大きさが、
    算出された上下の空白領域の大きさと比べて所定の大き
    さを越えないよう、選択される印字フォントサイズの上
    下方向の大きさを限定する上下サイズ限定ステップと、 選択される印字フォントサイズの左右方向の大きさが、
    算出された左右の空白領域の大きさと比べて所定の大き
    さを越えないよう、選択される印字フォントサイズの左
    右方向の大きさを限定する左右サイズ限定ステップとを
    備えることを特徴とする文書入力方法。
  16. 【請求項16】 相互に関連した属性を有する用語同士
    を対応付けて属性間対応用語記憶部に予め格納し、取り
    込んだ文書の画像に含まれる文字の画像を文字認識しな
    がら、1文字の画像の文字認識結果として文字コードの
    複数の候補を文字コード候補記憶部に格納し、画像とし
    て取り込んだ文書を、認識結果として得られた文字コー
    ドからなる文書として入力する文書入力方法であって、 文字列を表す同一の文字列画像について、前記文字コー
    ドの候補を組み合わせ、用語として正しく解釈すること
    ができる文字列の複数の候補を、所定の優先順位ととも
    に生成する文字列候補生成ステップと、 生成された文字列の候補の中から、特定の文字コードを
    識別し、その文字コードを含む文字列の候補および当該
    文字列の候補と同一文字列画像について生成された文字
    列の候補が表す用語の属性を判定する属性判定ステップ
    と、 あらかじめ定める属性別に、属性が判定された前記文字
    列の候補を前記優先順位とともに属性別文字列候補記憶
    部に格納する属性別文字列候補格納ステップと、 前記属性別文字列候補記憶部に格納されている文字列の
    候補であって、前記属性間対応用語記憶部に格納されて
    いる用語の属性を表すものについて、前記各文字列の候
    補をキーとして、前記前記属性間対応用語記憶部から対
    応する用語を検索する用語検索ステップと、 前記属性別文字列候補記憶部に格納されている文字列の
    候補のうち、相互に関連した他の属性の文字列の候補を
    キーとする前記検索結果と共通する文字列の候補の優先
    順位を高める優先順位変更ステップとを備えることを特
    徴とする文書入力方法。
JP7061404A 1995-03-20 1995-03-20 文書入力方法および文書入力装置 Pending JPH08263587A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7061404A JPH08263587A (ja) 1995-03-20 1995-03-20 文書入力方法および文書入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7061404A JPH08263587A (ja) 1995-03-20 1995-03-20 文書入力方法および文書入力装置

Publications (1)

Publication Number Publication Date
JPH08263587A true JPH08263587A (ja) 1996-10-11

Family

ID=13170175

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7061404A Pending JPH08263587A (ja) 1995-03-20 1995-03-20 文書入力方法および文書入力装置

Country Status (1)

Country Link
JP (1) JPH08263587A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009128797A (ja) * 2007-11-27 2009-06-11 Nippon Telegr & Teleph Corp <Ntt> 頻度補正装置とその方法、それらを用いた情報抽出装置と情報抽出方法、それらのプログラム
JP2010066981A (ja) * 2008-09-10 2010-03-25 Ricoh Co Ltd 画像処理装置、画像処理方法、制御プログラム及び記録媒体
JP2014164689A (ja) * 2013-02-27 2014-09-08 Kyocera Document Solutions Inc 検索システム利用装置
US8861862B2 (en) 2011-08-03 2014-10-14 Sharp Kabushiki Kaisha Character recognition apparatus, character recognition method and program
JP2019164687A (ja) * 2018-03-20 2019-09-26 富士ゼロックス株式会社 情報処理装置
JP2021064122A (ja) * 2019-10-11 2021-04-22 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2021170276A (ja) * 2020-04-16 2021-10-28 株式会社ミラボ 情報処理装置、及びプログラム
CN114637845A (zh) * 2022-03-11 2022-06-17 上海弘玑信息技术有限公司 模型测试方法、装置、设备和存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009128797A (ja) * 2007-11-27 2009-06-11 Nippon Telegr & Teleph Corp <Ntt> 頻度補正装置とその方法、それらを用いた情報抽出装置と情報抽出方法、それらのプログラム
JP2010066981A (ja) * 2008-09-10 2010-03-25 Ricoh Co Ltd 画像処理装置、画像処理方法、制御プログラム及び記録媒体
US8861862B2 (en) 2011-08-03 2014-10-14 Sharp Kabushiki Kaisha Character recognition apparatus, character recognition method and program
JP2014164689A (ja) * 2013-02-27 2014-09-08 Kyocera Document Solutions Inc 検索システム利用装置
JP2019164687A (ja) * 2018-03-20 2019-09-26 富士ゼロックス株式会社 情報処理装置
JP2021064122A (ja) * 2019-10-11 2021-04-22 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2021170276A (ja) * 2020-04-16 2021-10-28 株式会社ミラボ 情報処理装置、及びプログラム
CN114637845A (zh) * 2022-03-11 2022-06-17 上海弘玑信息技术有限公司 模型测试方法、装置、设备和存储介质
CN114637845B (zh) * 2022-03-11 2023-04-14 上海弘玑信息技术有限公司 模型测试方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
US9092423B2 (en) Retrieving electronic documents by converting them to synthetic text
US7742642B2 (en) System and method for automated reading of handwriting
EP0844583B1 (en) Method and apparatus for character recognition
JP3292388B2 (ja) 文書画像の復号なしに文書を要約するための方法と装置
US9158833B2 (en) System and method for obtaining document information
US5350303A (en) Method for accessing information in a computer
JP4260790B2 (ja) ファイリング・検索装置およびファイリング・検索方法
US20130156302A1 (en) Handwritten word spotter system using synthesized typed queries
JP3452774B2 (ja) 文字認識方法
JPH0773190A (ja) ペンベースコンピューターシステム用絵文字ネーミング
JPH03161891A (ja) 表形式文書読取装置
US20150310269A1 (en) System and Method of Using Dynamic Variance Networks
Pantke et al. An historical handwritten arabic dataset for segmentation-free word spotting-hadara80p
Nagy Disruptive developments in document recognition
JPH08263587A (ja) 文書入力方法および文書入力装置
Nagy et al. Adaptive and interactive approaches to document analysis
JP3159087B2 (ja) 文書照合装置および方法
JP3727422B2 (ja) 文字認識装置及びその方法
JPH10198683A (ja) 文書画像分類方法
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
JP3015137B2 (ja) 手書文字認識装置
JP3780023B2 (ja) 文字認識装置及びその方法
JP2904849B2 (ja) 文字認識装置
Srihari et al. Written Language Input
Wille The facit project