JPS63143684A - 文字認識装置における認識結果修正方法 - Google Patents

文字認識装置における認識結果修正方法

Info

Publication number
JPS63143684A
JPS63143684A JP61291300A JP29130086A JPS63143684A JP S63143684 A JPS63143684 A JP S63143684A JP 61291300 A JP61291300 A JP 61291300A JP 29130086 A JP29130086 A JP 29130086A JP S63143684 A JPS63143684 A JP S63143684A
Authority
JP
Japan
Prior art keywords
word
character
spelling
words
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61291300A
Other languages
English (en)
Inventor
Toshiaki Morita
森田 敏昭
Minehiro Konya
峰弘 紺矢
Hideaki Tanaka
秀明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP61291300A priority Critical patent/JPS63143684A/ja
Publication of JPS63143684A publication Critical patent/JPS63143684A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は文字認識装置における認識結果修正方法に関
する。
(技術背景) 文書の文字情報をコンピュータ処理により認識する文字
認識装置として、認識しようとする文字情報、例えば英
数字を光電変換し、該光電変換された電気信号を1文字
単位で切り出し、認識部において所定の認識論理に従っ
て1文字ずつ認識を行う、光学式文字読取装置(OCR
)が知られている。
この種の文字認識装置において、従来は認識された文字
の正続率が低くて疑わしいと判定、いわゆるリジェクト
(否定)された場合、陰極線管(CRT)等を用いた表
示部にリジェクトされた文字のみが点滅又は反転表示さ
れ、操作者は咳表示を見ながら当該リジェクI・文字を
原稿と照合して確認しつつキーボード等の修正手段を介
してリジェクト文字の修正を行っていた。
しかしながら、リジェクトされた文字が、例えばrfi
41J等の接触文字とか、rlli−t、「oO」等で
あると、1文字のみのイメージ表示によっては操作者は
正しく判断することが困難でいちいち原稿と照合しなけ
ればならず、修正作業に多大な手間を要し、作業能率が
良くないという欠点があった。
(解決しようとする課題) この発明は上記欠点を解消して文字認識装置における認
識結果の修正を非常に能率的に行えるようにした認識結
果修正方法を提供することを目的とする。
(構成) 上記目的を達成するために、この発明の認識結果修正方
法は、認識部において1文字毎に認識された結果を修正
するにあたり、上記認識部からの認識された文字列を単
語毎に切り出し、切り出された単語毎にスペルチェック
処理を行い、リジェクトされた文字を含む単語の全文字
を表示部にイメージ表示することを特徴とするものであ
る。
以下に、本発明を添付図面とともに説明する。
(実施例) 第1図は本発明の認識結果修正方法を適用出来る光学式
文字読取装置(OCR)のブロック図を示す。
第1図において、1は入力部で、この入力部1は例えば
C0D(電荷結合デバイス)を用いた光電変換式イメー
ジキャスナ−2と画像メモリ3を有する。このイメージ
キ千スナ−2は図示しない原稿台に載置された文書の、
例えば英数文字画像を読み取って光電変換し、該文字画
像を表す電気信号を画像メモリ3に格納する。
5は例えばマイクロコンピュータを用いた文字認識部で
、図示しないROM(リード・オンリー・メモリ)に格
納された認識論理式にしたがって入力部1からの文字情
報の認識を行う。
文字認識部5の1行切り出し部6において、画像メモリ
3内の画像信号は公知の方法で1行単位で切り出し、い
わゆる、セグメンテーションが行なわれ、この切り出さ
れた文字情報が1行メモリ7に蓄積される。
この1行メモリ7に蓄積された文字情報は、1文字切り
出し部8において例えば画像濃淡ヒストグラム等を用い
て解析された各文字間の間隔情報に基づき1文字毎切り
出される。そしてこの切り出された各文字は、■文字認
識部9において所定の英数字を記憶した文字辞書10を
参照しつつ1文字単位で認識され、単語メモリ11へ送
られる。一方、上記1行メモリ7からの文字情報出力は
同時に単語切り出し部12にも送られ、この単語切り出
し部12において抽出された単語間の区切り情報に基づ
き、上記1文字認識部9からの各文字が上記単語メモリ
11において単語単位で蓄積される。
15は単語のスペルチェックおよびスペルコレクト処理
を行う言語処理部で、スペルチェック部16、単語辞書
I7およびスペルコレクト14I8から構成される。
上記単語メモリ11から言語処理部15のスペルチェッ
ク部16に逐次単語が読み出され、このスペルチェック
部16において読み出された単語に対するスペルチェッ
ク処理が行なわれる。このスペルチェック処理は単語メ
モリ11から読み出された単語が予め所定の英単語を記
憶した単語辞書17内に蓄積されたものと完全に一致し
たものが存在するかどうかを判定して行なわれる。
このスペルチェック部16における1回目のスペルチェ
ック結果が“ノー”と判定、即ちリジェクト(否定)さ
れると、スペルコレクト部18が作動する。
このスペルコレクト部18は上記1文字認識部9におけ
る各文字の認識率データ等に基づいて当該リジェクトさ
れた単語を構成する文字のうち認識率の低い文字の修正
を行って複数の単語候補を選定する。例えば、正続率の
高い順に第1位から第5位までの5つの単語候補の選定
が行なわれる。この単語候補を選定する処理は本明細書
においてコレクト処理という。
上記コレクト処理により選定された全ての単語候補がス
ペルチェック部16においてリジェクト(否定)される
と、当該認識結果を表す単語の存在する可能性がないと
して当該単語がリジェクトされる。
20は文字認識結果の表示及び該結果データの出力を行
う出力部である。この出力部20の出力メモリ21に上
記スペルチェック部16における処理結果、即ち認識処
理結果が記憶され、該認識結果は例えば陰極線管(CR
T)を用いた表示部22に表示されるとともに、例えば
翻訳機、ワードプロセッサ等の当該認識装置の外部の機
器24に送出される。上記出力メモリ21はギーボード
等を用いたスペル修正手段23と接続され、操作者は該
スペル修正手段23を介して上記表示部22の表示画面
に映し出された単語の文字画像を見ながらそのスペルを
随意に修正できるようになっている。
次に、本発明の認識結果修正方法を第2図の動作フロー
ヂャートとともに説明する。
ステップS。において、当該読取装置の図示しない原稿
台に読み取り対象の原稿、例えば、手書き英文書をセッ
トして認識操作を開始すると、ステップSlにおいて上
記イメージキャスナ−2を介して上記文書面の画像読み
取りが行なわれ、読み取られた文字情報を表す信号が画
像メモリ3に入力される。
ステップS、において、上記画像メモリ3内の画像情報
が読み出され、1行切り出し部6において公知の方法で
1行単位で切り出し又はセグメンテーションが行なわれ
、次いでステップS3において文字情報の1文字単位で
の切り出しが行なわれる。ステップS4において切り出
された1文字は単語の区切りに相当するものであるかど
うかの判定が行なわれる。“ノー”であればステップS
5において当該1文字の認識が実行され、再びステップ
S3を実行して次の1文字の切り出しが行なわれ、再び
ステップS4の判定が実行される。一方、ステップS4
の判定が゛′イエス”であれば、ステップS6において
当該切り出された1文字が単語の区切りに相当するもの
である、即ち上記ステップS3〜S5の繰り返しにより
認識された全ての文字が1つの単語を構成するものとし
て単語メモリ11に格納される。
ステップS7において、上記単語メモリ11から1単語
づつ読み出されてスペルチェック処理が行なわれる。こ
のスペルチェック処理を実行した結果、ステップS8に
おいてスペルチェックがOKかどうか、即ち、当該単語
の全文字と完全に符号した単語が単語辞書17内に存在
するかどうかの判定が行なわれる。この判定が゛イエス
”であれば、ステップS9において当該スペルチェック
が第1回目のものであるかどうかが判定される。このス
ペルチェックが第1回目のものであれば当該単語が正し
く認識されたとしてステップSlにおいて当該単語イメ
ージの通常表示が実行される一方、第1回目のものでな
ければ当該単語が完全に正しく認識されたとはいえない
が、正続率の高いものとしてステップS 13において
当該単語イメージにアンダーラインを付したアンダーラ
イン表示が実行される。
一方、ステップS8においてスペルチェックがOKでは
なく“ノー”と判定されるとコレクト処理を行って単語
候補の選定が行なわれ、ステップS、。において次の単
語候補が有るかどうかの判定、即ち次位の認識率の単語
候補が存在するかどうかの判定が行なわれる。次の単語
候補が存在しなければ“ノー”と判定されてステップS
11において当該単語が単語辞書17に存在せず、当該
認識された単語には誤認識された可能性が極めて高い文
字を含むとしてそのイメージの反転表示が行なわれる。
この反転表示の一例を第3図に示す。一方、次の単語候
補が存在すれば再びステップS6に戻り、該単語候補に
関してステップS6〜S8が実行される。
次いで、ステップS 14において当該単語の認識処理
が終了したかどうかが判定され、“ノー”であれば再び
ステップS3に戻り、ステップS3以降が実行される一
方、“イエス”であれば1次の認識処理が終了したとし
てステップ5lliに進む。
ステップSll+において、操作者が修正手段23にお
ける図示しない修正開始指令キーを操作すると、ステッ
プS8において少なくとも1回“ノー”と判定、即ち、
リジェクト(否定)され、したがって表示部22におい
て反転表示およびアンダーライン表示された単語の文字
全体のイメージ表示が行なわれる。このイメージ表示の
1例を第4図に示す。
このように、文書の認識処理においてスペルチェックに
掛かったりジェクト文字を含む単語の全文字のイメージ
が表示部22に表示され、よって操作者はりジェクト文
字をいちいち原稿と照合して確認することもなくイメー
ジ表示された単語の文字配列等に基づいて簡単に適正な
文字を見い出して迅速に綴りの修正を行うことが出来る
以上認識結果の修正処理の完了後、操作者は修正手段2
3における図示しない終了キーを操作し、これで当該認
識処理は終了する。
なお、上記実施例においては認識対象の文字は英数字と
したが適宜な認識論理式を用いることにより、漢字・か
な文字に対しても適用可能である。
(効果) 以上の説明から明らかなように、本発明によれば認識さ
れた文字列を単語単位でスペルチェック処理を行い、ス
ペルチェックに掛かったりジェクト文字を含む単語全体
のイメージを表示部に表示するようにしたから、操作者
は単に表示画面を見ながらいちいち原稿と照合して確認
する必要もなく当該単語の綴りの誤りを迅速かつ簡単に
検出して修正することが出来、したがって当該認識処理
を高能率的に実行することが出来る。
【図面の簡単な説明】
第1図は本発明の方法を適用できる光学式文字読取装置
のブロック図、 第2図は本発明の方法を使用した上記第1図の装置の動
作フローチャート、 第3図は第1図の装置の表示部における反転表示の1例
を示す図、 第4図は本発明を使用した際の表示部におけるイメージ
表示の1例を示す図である。 1・・・人力部、5・・・認識部、 6・・4行切り出し部、8・・・弓文字切り出し部、9
・・弓文字認識部、IO・・・文字辞書、12・・・単
語切り出し部、】5・・・言語処理部、16・・・スペ
ルチェック部、17・・・単語辞書、18・・・スペル
コレクト部、20・・・出力部、22・・・表示部、2
3・・・修正手段、24・・・外部機器。

Claims (1)

    【特許請求の範囲】
  1. (1)認識部において1文字毎に認識された結果を修正
    するにあたり、 上記認識部からの認識された文字列を単語毎に切り出し
    、 切り出された単語毎にスペルチェック処理を行い、リジ
    ェクトされた文字を含む単語の全文字を表示部にイメー
    ジ表示することを特徴とする文字認識装置における認識
    結果修正方法。
JP61291300A 1986-12-05 1986-12-05 文字認識装置における認識結果修正方法 Pending JPS63143684A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61291300A JPS63143684A (ja) 1986-12-05 1986-12-05 文字認識装置における認識結果修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61291300A JPS63143684A (ja) 1986-12-05 1986-12-05 文字認識装置における認識結果修正方法

Publications (1)

Publication Number Publication Date
JPS63143684A true JPS63143684A (ja) 1988-06-15

Family

ID=17767105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61291300A Pending JPS63143684A (ja) 1986-12-05 1986-12-05 文字認識装置における認識結果修正方法

Country Status (1)

Country Link
JP (1) JPS63143684A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0435349A2 (en) * 1989-12-28 1991-07-03 Fujitsu Limited Document revising system for use with document reading and translating system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0435349A2 (en) * 1989-12-28 1991-07-03 Fujitsu Limited Document revising system for use with document reading and translating system
US5222160A (en) * 1989-12-28 1993-06-22 Fujitsu Limited Document revising system for use with document reading and translating system

Similar Documents

Publication Publication Date Title
US7106905B2 (en) Systems and methods for processing text-based electronic documents
JP3139521B2 (ja) 自動言語決定装置
US6154579A (en) Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
JP2835178B2 (ja) 文書読取装置
JPS63143684A (ja) 文字認識装置における認識結果修正方法
JPH0991371A (ja) 文字表示装置
JPS63146187A (ja) 文字認識装置
JPS63143685A (ja) 文字認識装置における認識結果表示方法
JP2001147990A (ja) 画像データ処理装置及び方法並びにこれに利用される記憶媒体
JP2890788B2 (ja) 文書認識装置
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JP2746345B2 (ja) 文字認識の後処理方法
JPH02230484A (ja) 文字認識装置
JP2887823B2 (ja) 文書認識装置
JPH01277989A (ja) 文字列パターン読み取り装置
JP2000020638A (ja) 文字列方向判別方法
JP3064508B2 (ja) 文書認識装置
JPH04252390A (ja) 文字認識結果の後処理方法
JPH02292691A (ja) 文字認識装置
JPH0863545A (ja) 文字認識処理装置における文字方向および行方向決定方法
JP2000200323A (ja) オンライン手書き漢字認識装置
JPH0713999A (ja) 表認識装置
JPH0520492A (ja) 文書認識修正装置
JPH05298488A (ja) 光学的文字読取装置
JPH11143983A (ja) 文字認識装置、文字認識方法及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体