JPH06215184A - 抽出領域のラベリング装置 - Google Patents

抽出領域のラベリング装置

Info

Publication number
JPH06215184A
JPH06215184A JP5249966A JP24996693A JPH06215184A JP H06215184 A JPH06215184 A JP H06215184A JP 5249966 A JP5249966 A JP 5249966A JP 24996693 A JP24996693 A JP 24996693A JP H06215184 A JPH06215184 A JP H06215184A
Authority
JP
Japan
Prior art keywords
document
area
paragraph
connection
areas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5249966A
Other languages
English (en)
Inventor
Taiji Mori
泰二 森
Yasuo Hongo
保夫 本郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP5249966A priority Critical patent/JPH06215184A/ja
Publication of JPH06215184A publication Critical patent/JPH06215184A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 文書画像から抽出した段落領域のラベリング
精度を向上する。 【構成】 最初に、入力された文書画像から段落領域を
抽出するとともに(S11)、抽出された領域の属性を
判別し(S12)、属性が文字である段落領域について
の物理構造を解析・抽出して探索木を作成する(S1
3)。次に、属性が見出しである段落領域を挟む位置の
文書段落領域を検索して対象領域とし(S14)、抽出
された各対象領域について、字下げ・改行の有無を検索
する(S15)。また、各段落領域が相互に接続する可
能性のある近接領域を検索し(S16)、さらに、各段
落領域間の接続難易度をそれぞれ計算することにより
(S17)、対象の文書段落領域の接続方向を判別する
(S18)。得られた接続方向に基づき各文書段落領域
の接続を行い、抽出領域をラベリングする(S19)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置に入力さ
れた文書画像から文字領域を抽出した後に、抽出領域を
ラベリングする抽出領域のラベリング装置に関する。
【0002】
【従来の技術】従来の文字認識装置における文字領域の
抽出およびラベリングは、図12に示すフローチャート
のように行われている。図では、最初に文書画像が2値
画像データとして入力されると(S21)、ぼかし等の
処理を施した後、その周辺部のゴミ等を除去し(S2
2)、段組構造を判定する(S23)。次いで、縦書き
・横書きを判定してから(S24)、行ブロックの抽出
および行ブロックのラベリングを行う(S25,2
6)。さらに、段ブロックの抽出をした後に(S2
7)、段ブロックのラベリングを行う(S28)。この
段ブロックのラベリングでは、段落の物理的な位置関係
から探索木を作成し、予め設定されたルールに基づいて
枝を検索して段落の接続順を決定していた。
【0003】
【発明が解決しようとする課題】しかしながら、このよ
うな段落のラベリング方法では、新聞等の複雑な構造を
有する文書に対して、必ずしも妥当なラベリングが行わ
れるとは限らない。例えば、図13に示すような新聞記
事の場合、見出しが文字領域を区分するセパレータと
して認識されてしまうと、その前後の段落,および
、は見出しを飛び越して接続されることがなく、
誤ってラベリングされてしまう。同様に、図14に示す
ような新聞記事の場合、見出しがセパレータとして認
識されてしまうと、その前後の段落,および、
は見出しを飛び越して接続されることがなく、誤って
ラベリングされてしまうという問題があった。本発明は
上記問題点を解決するためになされたもので、その目的
とするところは、見出しをセパレータとして認識するこ
となく常に正確にラベリングすることのできる抽出領域
のラベリング装置を提供することにある。
【0004】
【課題を解決するための手段】上記目的を達成するため
に、第1の発明は、文書画像から抽出された段落領域の
属性が文書であるか否かを判別する手段と、属性が文書
であると判別された文書段落領域から探索木を作成する
手段と、属性が文書でないと判別された非文書段落領域
の前後に位置しかつ他の文書段落領域との接続が可能な
文書段落領域の組合わせを探索木から検索する手段と、
検索された文書段落領域ごとに最終行の行末空白および
先頭行の行頭空白を検出する手段と、文書段落領域の先
頭および末尾の空白の有無から接続の組合わせごとに文
書段落領域間の接続の難易度を算出する手段と、文書段
落領域間の接続の組合わせごとの接続難易度を比較して
非文書段落領域前後の文書段落領域の接続方向を判別す
る手段と、判別された接続方向に基づき各文書段落領域
のラベリングを行う手段とを備えたことを特徴とする。
【0005】第2の発明は、文書画像から抽出された段
落領域の属性が文書であるか否かを判別する手段と、属
性が文書であると判別された文書段落領域から探索木を
作成する手段と、属性が文書でないと判別された非文書
段落領域の前後に位置しかつ他の文書段落領域との接続
が可能な文書段落領域の組合わせを探索木から検索する
手段と、検索された文書段落領域ごとに文字認識を行う
手段と、文書段落領域の先頭および末尾の認識結果を接
続の組み合わせごとに比較して両者の接続の適不適から
文書段落領域間の接続の難易度を算出する手段と、文書
段落領域間の接続の組合わせごとの接続難易度を比較し
て非文書段落領域前後の文書段落領域の接続方向を判別
する手段と、判別された接続方向に基づき各文書段落領
域のラベリングを行う手段とを備えたことを特徴とす
る。
【0006】第3の発明は、第1の発明に、第2の発明
における文字認識手段および接続難易度算出手段を備
え、文書段落領域間の接続の組合わせごとの接続難易度
を接続方向別に比較し、接続難易度の値の差が所定値以
下であれば、第2の発明の文字認識手段および接続難易
度算出手段により接続難易度を求めるようにしたことを
特徴とする。
【0007】
【作用】第1の発明においては、文書画像から抽出され
た段落領域の属性が文書であるか否かが判別され、属性
が文書であると判別された文書段落領域から探索木が作
成される。属性が文書でないと判別された非文書段落領
域の前後に位置しかつ他の文書段落領域との接続が可能
な文書段落領域の組合わせが探索木から検索される。次
いで、検索された文書段落領域ごとに最終行の行末空白
および先頭行の行頭空白が検出され、空白の有無から接
続の組合わせごとに文書段落領域間の接続の難易度が算
出される。さらに、算出された接続難易度が比較されて
非文書段落領域前後の文書段落領域の接続方向が判別さ
れ、その接続方向に基づき各文書段落領域のラベリング
が行われる。
【0008】第2の発明においては、文書画像から抽出
された段落領域の属性が文書であるか否かが判別され、
属性が文書であると判別された文書段落領域から探索木
が作成される。属性が文書でないと判別された非文書段
落領域の前後に位置しかつ他の文書段落領域との接続が
可能な文書段落領域の組合わせが探索木から検索され
る。次いで、検索された文書段落領域ごとに文字認識が
行われ、文書段落領域の先頭および末尾の認識結果が接
続の組み合わせごとに比較され、両者の接続の適不適か
ら文書段落領域間の接続の難易度が算出される。さら
に、算出された接続難易度が比較されて非文書段落領域
前後の文書段落領域の接続方向が判別され、その接続方
向に基づき各文書段落領域のラベリングが行われる。
【0009】第3の発明においては、第1の発明に、第
2の発明における文字認識手段および接続難易度算出手
段が備えられており、文書段落領域間の接続の組合わせ
ごとの接続難易度が接続方向別に比較され、接続難易度
の値の差が所定値以下であれば、第2の発明の文字認識
手段および接続難易度算出手段により接続難易度が求め
られる。
【0010】
【実施例】以下、図に沿って本発明の実施例を説明す
る。図1は第1の発明の実施例の処理動作を示すフロー
チャートである。図において、最初に、入力された文書
画像から段落領域を抽出するとともに(S11)、抽出
された領域の属性を判別する(S12)。ここで判別さ
れる属性としては、文書、見出し、図、写真等がある。
次いで、属性が文書である段落領域についての物理構造
を解析・抽出する(S13)。ここで抽出された物理構
造より探索木が作成される。
【0011】さらに、属性が文書ではなく見出し等であ
る段落領域を挟む位置の文書段落領域を検索して対象領
域とする(S14)。このように探索木を検索すると、
例えば図2に示されるように、見出し領域1にかかる2
段に、それぞれ前後して位置する文書段落領域2〜5が
抽出される。次に、抽出された各対象領域について、字
下げ・改行の有無を検索する(S15)。具体的には、
内蔵する行の座標や投影等の画像処理により、段落領域
先頭の字下げと段落領域最後の改行による空白を検出し
てマークする。また、各段落領域が接続する可能性のあ
る近接領域を検索する(S16)。この近接領域の検索
は図3のように行われる。
【0012】図では、見出し領域6の前の段落領域7
が、見出し領域6を飛び越す場合に文書段落領域8へ接
続され、飛び越さない場合に段落領域9へ接続される。
同様にして、見出し領域6の後の段落領域8の接続先に
ついても、文書段落領域9へ接続される場合と文書段落
領域10へ接続される場合がある。つまり、見出し領域
6がセパレータとして機能する場合は、文書段落領域7
〜12等の接続方向がそれぞれ縦方向となるが、見出し
領域6がセパレータとして機能しない場合の接続方向は
それぞれ横方向となる。
【0013】次に、各段落領域間の接続の組み合わせご
とに接続難易度を計算する(S17)。具体的には図4
に示すように、前の文書段落領域が改行で終了し後の文
書段落領域が字下げで始まっている場合は接続の可能性
が大であるから接続難易度を+1とし、前の文書段落領
域が改行で終了し後の文書段落領域に字下げがない場合
は接続の可能性が小であるから接続難易度を−1とす
る。また、前の文書段落領域に改行がなく、後の文書段
落領域に字下げがある場合は接続の可能性が小であるか
ら接続難易度を−1とする。
【0014】さらに、両文書段落領域とも空白がない場
合は接続関係が不明であるものとして接続難易度を0と
する。また、これ以外にも、両文書段落領域に空白がな
くしかもその間に見出しが位置している場合は、両者が
接続される可能性が極めて高いものとして接続難易度を
1.5とする。その理由は、見出しがセパレータである
なら後の文書段落領域にも必ず字下げがあるはずだから
である。さらに、上述した以外にも、文書段落領域の配
置上のルールにより接続難易度を設定することが可能で
ある。
【0015】次いで、得られた接続難易度を対象の文書
段落領域の中の見出しの前または後における縦方向、お
よび見出しをまたぐ横方向ごとにそれぞれ累積し、その
縦と横の累積値を比較することにより対象の文書段落領
域の接続方向を判別する(S18)。その結果、得られ
た接続方向に基づいて、各文書段落領域の接続を行い、
抽出領域のラベリングを終了する(S19)。上述した
実施例の方法で図13の文書段落領域をラベリングした
結果が図5となる。この第1の発明の実施例では、文書
段落領域の間に見出しがある場合でも、その前後の文書
段落領域の空白の有無により接続方向が比較的高速に判
定されて正しくラベリングが行われるようになる。
【0016】次に、第2の発明の実施例について説明す
る。図6は第2の発明の実施例の処理動作を示すフロー
チャートである。図において、最初に、入力された文書
画像から段落領域を抽出するとともに(S31)、抽出
された領域の属性を判別する(S32)。ここで判別さ
れる属性としては、文書、見出し、図、写真等がある。
次いで、属性が文書である段落領域についての物理構造
を解析・抽出して、探索木を作成する(S33)。図7
は、図14に示す文書画像から作成された探索木を示
す。図中のHは文書段落領域であるところの本文領域
を、Mは見出し領域を表す。
【0017】さらに、属性が文書である領域について順
次文字認識を行い(S34)、得られた文字コードを段
落領域情報等とともにメモリに記憶する(S35)。次
に、探索木より、図、写真、見出し等の本文以外の領域
を検索し、着目領域とする(S36)。さらに着目領域
が本文領域に挟まれているか否かによりセパレータであ
るか否かを判別し(S37)、挟まれていなければ着目
領域がセパレータであるものとしてS43へ進みラベリ
ングを行う(S38Yes)。
【0018】挟まれていれば(S38No)、着目領域
に隣接する本文領域を探索木より検索し(S39)、さ
らに検索された本文領域相互間における接続の可能性を
検索する(S40)。これらの近接領域の検索は第1の
発明の実施例と同様に図3のように行われる。次に、検
索により得られた本文領域間の接続難易度を求める(S
41)。ここで求められる接続難易度とは、S34にお
いて領域ごとに認識された文章を言語処理技術を用いて
単語に分割し、次いで、段落間をまたぐ単語について予
め用意した単語辞書との照合結果および文法ルールによ
る文法チェックの結果を接続確率等のように数値化し接
続難易度としたものである。図8は、これらの接続難易
度計算の処理順を示したフローチャートである。
【0019】また、他にも本文領域末尾の文字の文字種
(英数、カタカナ)が、対応する本文領域先頭の文字の
文字種と一致しているか否かによっても接続難易度が得
られる。さらには、括弧が開いたまま終わっている領域
は、閉じ括弧から始まる領域に接続する可能性が大きい
ように、括弧記号がある場合の位置関係からも接続難易
度が得られる。これらの方法により、図14の文書画像
について、見出し領域の前後の文書領域について接続難
易度を求めると、図9のようになる。これらの結果か
ら、図14の文書画像について文書領域間の接続難易度
を図示すると、図10のようになる。図中の実線は難易
度+1を、破線は難易度0を表す。
【0020】次に、得られた接続難易度を、着目領域を
またぐ方向(横方向)と着目領域に従う方向(縦方向)
にそれぞれ累積し、得られた累積値を比較することで接
続方向を判別する(S42)。すなわち、着目領域をま
たぐ方向の接続難易度の累積値が大きければ、着目領域
はセパレータとして機能しないものと判別される。次に
得られた接続方向に基づき、本文領域間の接続がなされ
抽出領域のラベリングを終了する(S43)。これらの
処理により図14の文書画像をラベリングした結果が図
11となる。
【0021】この第2の発明の実施例では、文書段落領
域の間に見出しがある場合でも、その前後の文書段落領
域の文字を認識して接続難易度を算出することにより、
接続方向が確実に判定されて正しくラベリングが行われ
るようになる。なお、第2の発明の実施例では、言語処
理の対象とする部分を段落領域の比較対象となる先頭と
末尾に限定することで処理の高速化が可能になる。さら
には、図6のフローチャートにおけるS33とS34、
S34とS36〜S40は並列処理が可能であるので処
理速度をさらに高速にすることも可能である。また、S
34では全ての本文領域について文字認識をしている
が、S40で接続の可能性ありとされた本文領域につい
てのみ文字認識をすればさらに高速化が可能である。
【0022】次に、第3の発明の実施例について説明す
る。前述した第2の発明の実施例では、接続難易度を算
出する際に単語辞書を参照するためにメモリのアクセス
時間が長くなり、高速化に限界がある。そこで第3の発
明では、処理速度を増すため、第1の発明および第2の
発明でそれぞれ求めた接続難易度を用いて接続方向を判
定してラベリングするようにした。つまり、通常は第1
の発明により比較的高速で接続難易度を求めて接続方向
を判定するが、第1の発明の接続難易度だけでは充分に
判定できない場合に第2の発明で求めた接続難易度によ
り接続方向を判定してラベリングするようにしたもので
ある。それにより、確実で高速なラベリングが可能にな
る。
【0023】
【発明の効果】以上述べたように第1の発明によれば、
見出し段落領域前後に位置する文書段落領域の先頭およ
び末尾の空白の有無から文書段落領域間の接続の難易度
が算出されて、見出し段落領域前後の文書段落領域の接
続方向が判別される。それにより、新聞等の構造が複雑
な文書であっても、見出しをセパレータとして誤認識す
ることなく高速にラベリングすることができる。
【0024】第2の発明によれば、見出し段落領域前後
に位置する文書段落領域の先頭および末尾の認識結果を
互いに比較して文書段落領域間の接続の難易度を算出す
ることにより、見出し段落領域前後の文書段落領域の接
続方向が判別される。それにより、新聞等の構造が複雑
な文書であっても、見出しをセパレータとして誤認識す
ることなく正確にラベリングすることができる。
【0025】第3の発明によれば、第1の発明と第2の
発明を組み合わせ、通常は比較的処理速度の速い第1の
発明により文書段落領域間の接続難易度を求めて接続方
向を判別する。さらに、第1の発明では方向ごとの接続
難易度の値に明瞭な差が認められない場合に、第2の発
明を用いて文書段落領域の文字を認識して接続難易度を
再度求めることにより高精度に接続難易度を求めて接続
方向を判別する。その結果、入力文書画像から抽出され
た文書領域を高速でかつ高精度にラベリングすることが
可能になる。
【図面の簡単な説明】
【図1】第1の発明の実施例の処理動作を示すフローチ
ャートである。
【図2】第1の発明の実施例におけるラベリング対象の
段落領域の説明図である。
【図3】第1の実施例において接続可能な近接領域を検
索する説明図である。
【図4】第1の実施例において各段落領域間の接続難易
度を示す説明図である。
【図5】第1の実施例において文書画像をラベリングし
た結果を示す説明図である。
【図6】第2の発明の実施例の処理動作を示すフローチ
ャートである。
【図7】第2の実施例において文書画像から作成された
探索木を示す図である。
【図8】第2の実施例の接続難易度計算の処理順を示し
たフローチャートである。
【図9】第2の実施例において得られた接続難易度の一
例を図である。
【図10】第2の実施例において得られた接続難易度を
文書画像に示した図である。
【図11】第2の実施例において文書画像をラベリング
した結果を示す説明図である。
【図12】従来の処理例を示すフローチャートである。
【図13】従来のラベリング結果を示した図である。
【図14】従来のラベリング結果を示した図である。
【符号の説明】
1 見出し領域 2〜5 文書段落領域 6 見出し領域 7〜12 文書段落領域

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文書画像から抽出された段落領域の属性
    が文書であるか否かを判別する手段と、 属性が文書であると判別された文書段落領域から探索木
    を作成する手段と、 属性が文書でないと判別された非文書段落領域の前後に
    位置しかつ他の文書段落領域との接続が可能な文書段落
    領域の組合わせを探索木から検索する手段と、 検索された文書段落領域ごとに最終行の行末空白および
    先頭行の行頭空白を検出する手段と、 文書段落領域の先頭および末尾の空白の有無から接続の
    組合わせごとに文書段落領域間の接続の難易度を算出す
    る手段と、 文書段落領域間の接続の組合わせごとの接続難易度を比
    較して非文書段落領域前後の文書段落領域の接続方向を
    判別する手段と、 判別された接続方向に基づき各文書段落領域のラベリン
    グを行う手段と、 を備えたことを特徴とする抽出領域のラベリング装置。
  2. 【請求項2】 文書画像から抽出された段落領域の属性
    が文書であるか否かを判別する手段と、 属性が文書であると判別された文書段落領域から探索木
    を作成する手段と、 属性が文書でないと判別された非文書段落領域の前後に
    位置しかつ他の文書段落領域との接続が可能な文書段落
    領域の組合わせを探索木から検索する手段と、 検索された文書段落領域ごとに文字認識を行う手段と、 文書段落領域の先頭および末尾の認識結果を接続の組み
    合わせごとに比較して両者の接続の適不適から文書段落
    領域間の接続の難易度を算出する手段と、 文書段落領域間の接続の組合わせごとの接続難易度を比
    較して非文書段落領域前後の文書段落領域の接続方向を
    判別する手段と、 判別された接続方向に基づき各文書段落領域のラベリン
    グを行う手段と、 を備えたことを特徴とする抽出領域のラベリング装置。
  3. 【請求項3】 請求項1記載の抽出領域のラベリング装
    置において、請求項2記載の抽出領域のラベリング装置
    における文字認識手段および接続難易度算出手段を備
    え、文書段落領域間の接続の組合わせごとの接続難易度
    を接続方向別に比較し、接続難易度の値の差が所定値以
    下であれば、請求項2記載の文字認識手段および接続難
    易度算出手段により接続難易度を求めることを特徴とす
    る抽出領域のラベリング装置。
JP5249966A 1992-09-17 1993-09-10 抽出領域のラベリング装置 Withdrawn JPH06215184A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5249966A JPH06215184A (ja) 1992-09-17 1993-09-10 抽出領域のラベリング装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP27378492 1992-09-17
JP4-273784 1992-09-17
JP5249966A JPH06215184A (ja) 1992-09-17 1993-09-10 抽出領域のラベリング装置

Publications (1)

Publication Number Publication Date
JPH06215184A true JPH06215184A (ja) 1994-08-05

Family

ID=26539571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5249966A Withdrawn JPH06215184A (ja) 1992-09-17 1993-09-10 抽出領域のラベリング装置

Country Status (1)

Country Link
JP (1) JPH06215184A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08315159A (ja) * 1995-05-18 1996-11-29 Canon Inc 画像処理装置及び画像処理方法
WO2000036530A1 (fr) * 1998-12-15 2000-06-22 Matsushita Electric Industrial Co., Ltd. Methode de recherche et dispositif correspondant, support enregistre
JP2009500755A (ja) * 2005-07-01 2009-01-08 マイクロソフト コーポレーション 文書視覚構造の文法的な解析
JP2009193603A (ja) * 1995-06-07 2009-08-27 Eistream Technologies Inc 走査された及びリアルタイムの手書き文字の識別を行う文字認識システム
US11151472B2 (en) 2017-03-31 2021-10-19 At&T Intellectual Property I, L.P. Dynamic updating of machine learning models
JP2022017202A (ja) * 2020-07-13 2022-01-25 ネクストヴイピーユー(シャンハイ)カンパニー リミテッド レイアウト解析方法、読取り支援デバイス、回路および媒体
US11367296B2 (en) 2020-07-13 2022-06-21 NextVPU (Shanghai) Co., Ltd. Layout analysis

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08315159A (ja) * 1995-05-18 1996-11-29 Canon Inc 画像処理装置及び画像処理方法
JP2009193603A (ja) * 1995-06-07 2009-08-27 Eistream Technologies Inc 走査された及びリアルタイムの手書き文字の識別を行う文字認識システム
WO2000036530A1 (fr) * 1998-12-15 2000-06-22 Matsushita Electric Industrial Co., Ltd. Methode de recherche et dispositif correspondant, support enregistre
US7130487B1 (en) 1998-12-15 2006-10-31 Matsushita Electric Industrial Co., Ltd. Searching method, searching device, and recorded medium
JP2009500755A (ja) * 2005-07-01 2009-01-08 マイクロソフト コーポレーション 文書視覚構造の文法的な解析
US8249344B2 (en) 2005-07-01 2012-08-21 Microsoft Corporation Grammatical parsing of document visual structures
US11151472B2 (en) 2017-03-31 2021-10-19 At&T Intellectual Property I, L.P. Dynamic updating of machine learning models
JP2022017202A (ja) * 2020-07-13 2022-01-25 ネクストヴイピーユー(シャンハイ)カンパニー リミテッド レイアウト解析方法、読取り支援デバイス、回路および媒体
US11367296B2 (en) 2020-07-13 2022-06-21 NextVPU (Shanghai) Co., Ltd. Layout analysis

Similar Documents

Publication Publication Date Title
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
KR100412317B1 (ko) 문자인식/수정방법및장치
JP3919617B2 (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
JPH06215184A (ja) 抽出領域のラベリング装置
JP3589007B2 (ja) 文書ファイリングシステムおよび文書ファイリング方法
JPH0785080A (ja) 全文書検索システム
JP2870375B2 (ja) 文章訂正装置
JP3071745B2 (ja) 文字認識結果の後処理方法
JP3157557B2 (ja) 文字認識装置
JPH0528324A (ja) 英文字認識装置
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JP2746345B2 (ja) 文字認識の後処理方法
JP2560959B2 (ja) 文字認識後処理方式
JPH0256086A (ja) 文字認識の後処理方法
JP3151866B2 (ja) 英文字認識方法
JPH0573713A (ja) 文字読取装置
JPH087046A (ja) 文書認識装置
JPH06301822A (ja) 文字認識後処理方式
JP3116453B2 (ja) 英文字認識装置
JP2890241B2 (ja) 光学的文字認識装置
JP3033904B2 (ja) 文字認識後処理方法
JP2969751B2 (ja) 文字認識処理方式
JPH0318987A (ja) 辞書登録方法
JPH11143983A (ja) 文字認識装置、文字認識方法及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20001128