JP3221968B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3221968B2
JP3221968B2 JP07660193A JP7660193A JP3221968B2 JP 3221968 B2 JP3221968 B2 JP 3221968B2 JP 07660193 A JP07660193 A JP 07660193A JP 7660193 A JP7660193 A JP 7660193A JP 3221968 B2 JP3221968 B2 JP 3221968B2
Authority
JP
Japan
Prior art keywords
word
candidate
unit
character
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07660193A
Other languages
English (en)
Other versions
JPH06290308A (ja
Inventor
真 久島
浩一 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP07660193A priority Critical patent/JP3221968B2/ja
Publication of JPH06290308A publication Critical patent/JPH06290308A/ja
Application granted granted Critical
Publication of JP3221968B2 publication Critical patent/JP3221968B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、迅速かつ正確に帳票
または文書を処理できるようにした操作性の良い文字認
識装置に関する。
【0002】
【従来の技術】従来より、手書き文字の認識率を向上さ
せるために、知識辞書が用いられている。知識辞書が保
持する情報は、認識対象とする単語の情報、文脈情報、
およびその他の情報である。文字認識装置の利用者は新
たにこれらの情報を登録することも可能である。以下、
知識辞書の単語情報を利用した従来の文字認識技術とし
て、例えば文献1:昭和57年電子通信学会総合全国大
会講演論文集 分冊5ー326頁に開示されている技術
につき説明する。
【0003】まず帳票または文書の所定領域を光学的に
走査し紙面からの光信号を光電変換して帳票または文書
の画像データを得る。そして画像データから認識対象と
なる文字のパタンを切り出す。この切り出した文字パタ
ンに基づき認識対象となる文字の認識を行ない、認識結
果として一つまたは複数個の候補文字を得る。そして知
識処理一単位分の文字に関して、各文字毎に得た1つま
たは複数個の候補文字を組み合わせて文字列を作り、文
字列の各候補文字毎に付された候補順位または類似度を
用いて文字列および単語情報の単語の間の類似度を算出
し、この類似度が最大となる文字列を選択する。そして
この文字列に対応する単語情報の単語を表示する。但
し、当該文字列の類似度が所定の閾値以下となる場合に
は、候補順位が1位となる候補文字を組み合わせてでき
る文字列を表示する。
【0004】知識処理結果を訂正する際には、当該文字
列との類似度が所定の閾値以上になった単語情報の単語
群を候補単語として表示し、その中に正しい単語が含ま
れていればそれを選択することにより訂正を行なう。
【0005】
【発明が解決しようとする課題】上記文字認識技術で
は、候補単語を表示する際に、(1)最初から存在した
単語情報の単語が候補単語として出力される場合と、
(2)利用者が登録した単語情報の単語が候補単語とし
て出力される場合が考えられるが、利用者は目的に応じ
て必要性の高い単語情報を登録するのであるから(2)
の場合の単語は(1)の場合の単語より正解である可能
性が高い。それにもかかわらず(1)、(2)のケース
の単語の表示を同一としていた。従って、オペレーター
は候補単語の表示を一瞥しただけでは正解である可能性
が高い単語を発見することはできないので、表示されて
いる全ての単語を注意深く観察して正解単語を選択する
必要があり、このため訂正、確認等の編集作業に多くの
時間を要し、単位時間当たりに処理できる帳票または文
書の枚数が少なくなるという問題があった。
【0006】この発明の目的は上述した従来の問題点を
解決し、表示された候補単語の中から正解単語を選択す
る作業を従来よりも行ない易くして操作性を改良した文
字認識装置を提供することにある。
【0007】
【課題を解決するための手段】本発明は前記課題を解決
するために、量子化された帳票または文書の画像データ
から切り出した文字パタンの認識結果を出力する認識部
と、単語情報を知識辞書へ登録するための単語登録部
と、前記知識辞書を用いて前記認識結果に基づく知識処
理結果及び候補単語を出力する後処理部と、前記後処理
結果を編集する結果編集部と、前記候補単語を表示する
表示部と、正解単語を入力する入力部を備えて成る文字
認識装置において、前記表示部を、当該候補単語が当該
知識辞書に最初から存在した単語情報の単語である場合
と、前記単語登録部で登録された単語情報の単語である
場合とでその単語の表示方法を変化させるようにしたこ
とを特徴とする。
【0008】
【作用】この発明によれば、候補単語から正解を選択す
る際の表示部の表示は、知識辞書に最初から存在した単
語情報の単語が候補単語として出力された場合と、単語
登録部で登録された単語情報の単語が候補単語として出
力された場合とで変化し、候補単語を選択する作業にお
いて最初から知識辞書に存在した単語情報の単語と、利
用者が登録した単語情報の単語とを簡単に見分けること
ができるので、オペレーターは正解の可能性の高い候補
単語を瞬時に発見し訂正、確認等の作業を行える。従っ
て前記課題が解決されるのである。
【0009】
【実施例】以下、図面を参照しこの発明の実施例につき
説明する。尚、図面はこの発明が理解できる程度に概略
的に示されているにすぎず、従って各構成成分の形状、
配設位置、寸法、入出力信号および接続関係を図示例に
限定するものではない。
【0010】図1はこの発明の一実施例の説明に供する
機能ブロック図である。この実施例の文字認識装置10
は、量子化された帳票または文書の画像データから文字
パタンを切り出し、この切り出した文字パタンの認識結
果を出力する認識部12と、文字認識装置の利用者が希
望する単語情報を登録する単語登録部14と、知識辞書
に基づき認識結果の知識処理結果及び候補単語を出力す
る後処理部16と、知識処理結果を訂正、確認する結果
編集部18と、知識処理結果及び候補単語を表示する表
示部20と、正解単語を入力する入力部22を備え、さ
らにこれら単語登録部14、結果編集部18、表示部2
0、及び入力部22の動作を制御する制御部24を備え
て成る。また図1において26は帳票または文書の量子
化された画像データを出力する光電変換部であり、28
は光電変換部26からの画像データを格納する画像メモ
リである。
【0011】図2は帳票の一例を示す図であり、同図に
おいて30は住所が記載される帳票の例、及び32は文
字記載領域を指定する記入枠である。
【0012】図3は候補単語の選択の一例を示す図であ
り、同図において34は表示画面、36は帳票、38は
訂正する文字列領域、40はカーソル位置、42は候補
単語表示枠、44は表示方法が変化している利用者登録
単語を示す。
【0013】以下、図1、図2、及び図3を参照し、本
実施例につきより詳細に説明する。光電変換部26は帳
票または文書上の所定の読取り範囲を光学的に走査し、
帳票または文書からの光信号Lを光電変換して白黒2値
に量子化された画像データを出力し、画像メモリ28は
この画像データを格納する。
【0014】認識部12は画像メモリ28の画像データ
から文字パタンを切り出し、この切り出した文字パタン
から認識対象となる文字に関する各種特徴を抽出する。
そして切り出した文字パタンの特徴を標準文字パタンの
特徴と照合し、文字認識結果及び候補順位を出力する。
ひとつの文字に関して1個または複数個の候補文字が認
識結果として得られ、候補文字が1個の場合には候補順
位1を当該候補文字に付して出力し、また候補文字が複
数個の場合には各候補文字毎に定めた候補順位を候補文
字に付して出力する。
【0015】単語登録部14は文字認識装置の利用者が
希望する単語情報を知識辞書へ追加登録する。知識辞書
の単語情報には単語登録部で登録された単語情報と、最
初から用意されている一般の単語情報とを区別できるよ
うな情報を付加しておく。以後この情報を単語登録情報
と呼ぶ。
【0016】後処理部16は認識部12からの認識結果
に基づき単語情報を用いた知識処理を行う。後処理部1
6は知識処理一単位文の文字の認識結果(例えば図2に
示す帳票30において都道府県名の記載領域の認識結
果)を入力すると、知識処理一単位分の各文字の候補文
字を組み合わせてできる文字列を単語情報の単語と照合
し、候補文字から成る文字列に対応する単語が単語情報
の中に存在するか否か調べる。そして組み合わせてでき
た文字列の中から単語情報の単語と合致する文字列Aを
検出したら、文字列Aの評価値Jを算出する。ここでS
は文字列の各候補文字に付された候補順位の和及びNは
文字列を構成する文字の総個数を示すものとすれば、評
価値Jを例えば、J=S÷Nと表わすことができる。
【0017】単語及び文字列Aが合致するか否かの判定
は、例えば、単語及び文字列Aの対応する位置の文字の
文字コードが全部一致するか否かによって行なう。そし
て知識処理一単位分についてできた文字列の全てを単語
情報と照合し終えたときに文字列Aの中から評価値Jが
最小となる文字列Aを知識処理結果として選択する。ま
た所定の評価値以下の単語情報を文字列Aの候補単語と
して選択する。この文字列Aを候補単語と共に結果編集
部18へ送出する。
【0018】また知識処理一単位文の文字列全てを単語
情報の単語と照合し終えたときに文字列Aを1個だけ検
出していたら、当該文字列Aを知識処理結果として選択
し、選択した文字列Aを結果編集部18へ送出する。
【0019】また知識処理一単位分の文字列全てを単語
情報の単語と照合し終えたときに文字列Aを1個も検出
していなければ、知識処理一単位分の各文字の候補順位
が1位の候補文字を組み合わせてできる文字列Aを知識
処理結果として選択し、選択した文字列Aを結果編集部
18へ送出する。
【0020】結果編集部18は後処理部16から送出さ
れた文字列Aの候補単語が存在する場合は、文字列A及
び候補単語を制御部24へ送出する。そして制御部24
は文字列A、候補単語及び単語登録情報に応じた候補単
語の表示指示を表示部20へ送出する。このとき当該候
補単語が単語登録部で登録された単語情報の単語でない
場合は、第一の色で表示する指示を、単語登録部で登録
された単語情報の単語である場合は第一の色と異なる第
二の色で表示する指示を送出する。さらに表示部20は
表示指示で指定された方法で文字列A及び候補単語を表
示する(例えば図3に示す表示画面34)。ここで、オ
ペレータは表示画面中の文字列Aが誤りか否かを判断
し、誤りであれば候補単語の中から正解単語を選択す
る。もし候補単語中に正解単語が存在しない場合は、キ
ーボード等により正解単語を入力する。
【0021】また結果編集部18は文字列Aの候補単語
が存在しない場合は、文字列Aを制御部24を介して表
示部20へ送出し、表示部20はこの文字列Aを表示す
る。ここでオペレータは表示画面中の文字列Aが誤りか
否かを判断し、誤りであればキーボード等により正解単
語を入力する。そして結果編集部18は入力部22及び
制御部24を介して上述の正解単語を受取り、誤った文
字列と交換する。また、表示部20に表示された文字列
Aがオペレータによって正解であると判断された場合
は、結果編集部18は文字列Aをそのまま出力する。
【0022】この発明は上述した実施例にのみ限定され
るものではなく、従って各構成成分の構成、動作、処理
内容、入出力信号及び数値的条件を任意好適に変更して
よい。例えば上述した実施例では単語登録部において利
用者は一般知識辞書に単語情報を追加登録したが、もう
1つの利用者専用の知識辞書を用意してそこに必要な単
語情報を登録するようにしてもよい。
【0023】さらに上述した実施例では評価値Jとし
て、文字列の各候補文字に付された候補順位の和Sを文
字列を構成する文字の総個数Nで割った値を用いたが、
候補順位の和Sにかえて各候補順位に対して対応した得
点(例えば候補順位1に対して100点、候補順位2に
対して90点を対応付けるというように候補順位が下が
るにつれて低くなる得点を対応付ける)の和を用いるよ
うにしてもよい。或いは候補順位の和Sにかえて文字列
の各候補文字の出現頻度(この場合出現頻度はあらかじ
め認識部が保有する)の和を用いるようにしてもよい。
或いは候補順位の和Sにかえて、候補文字と当該候補文
字に対応する文字パタンとの間の類似度を求め文字列の
各候補文字の前記類似度の和を用いてもよい。或いは候
補文字の和Sにかえて候補文字の辞書マトリクスと当該
候補文字に対応する文字パタンの特徴量との間の距離を
求め文字列の各候補文字の前記距離の和を用いるように
してもよい。或いは候補順位の和Sにかえて、文字列の
各候補文字の出現頻度の和と候補順位の和を用いるよう
にしてもよい。
【0024】また表示部の表示方法を上述のもののほ
か、例えば異なる色、異なる輝度、ブリンキング及びア
ンダーラインのうちのいずれか一つまたは複数を用い
て、表示を変化させるようにしてもよい。
【0025】また後処理部は、単語情報を用いた知識処
理を上述のほかつぎに述べるように行ってもよい。候補
文字から成る文字列に対応する単語が単語情報の中に存
在するか否か調べるため、知識処理一単位文の文字列を
単語情報の単語と照合し、これら文字列及び単語の間の
類似度或いは不一致度を算出する。文字列に対応する単
語として例えば文字列との類似度が所定の閾値を越える
単語或いは文字列との不一致度が所定の閾値を越えない
単語を検出する。そして、 (1)類似度が所定の閾値を越える文字列或いは不一致
度が所定の閾値を越えない文字列を検出した場合には、
この検出した文字列のうち最大の類似度或いは最小の不
一致度を検出し、この最大の類似度或いは最小の不一致
度の文字列に対応する単語情報の単語を知識処理結果、
及びこの最大の類似度或いは最小の不一致度を知識処理
の評価値として出力する。 (2)知識処理一単位分の文字列のすべてを単語情報の
単語と照合し終えても類似度が所定の閾値を越える文字
列、或いは不一致度が所定の閾値を越えない文字列を1
個も検出できなっかた場合には、候補順位が1位となる
候補文字の組み合わせの文字列を知識処理結果、及び類
似度のあらかじめ定めた下限値或いは不一致度のあらか
じめ定めた上限値を評価値として出力する。 これら類似度の下限値及び不一致度の上限値は候補文字
から成る文字列に対応する単語が単語情報のなかに存在
しなかったことを表わす。
【0026】さらに上述した実施例では単語情報を用い
た知識処理の例につき説明したが文脈情報そのほかの知
識情報を用いた知識処理を行なう文字認識装置にこの発
明を適用してもよい。
【0027】
【発明の効果】上述したようにこの発明によれば、候補
単語から正解を選択する際の表示部の表示は、知識辞書
に最初から存在した単語情報の単語が候補単語として出
力された場合と、単語登録部で登録された単語情報の単
語が候補単語として出力された場合とで変化し、候補単
語を選択する作業において最初から知識辞書に存在した
単語情報の単語と、利用者が登録した単語情報の単語と
を簡単に見分けることができるので、オペレーターは正
解の可能性の高い候補単語を瞬時に発見し訂正、確認等
の作業を行える。その結果、帳票または文書の訂正、確
認の処理に要する時間が短縮される。従って、高速かつ
迅速に帳票または文書を処理できる操作性の良い文字認
識装置を提供できる。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示す機能ブロック図で
ある。
【図2】帳票の一例を示す図である。
【図3】候補単語選択の一例を示す図である。
【符号の説明】
10 文字認識装置 12 認識部 14 単語登録部 16 後処理部 18 結果編集部 20 表示部 22 入力部 24 制御部 26 光電変換部 28 画像メモリ
フロントページの続き (56)参考文献 特開 平3−58182(JP,A) 特開 平3−99386(JP,A) 特開 昭63−143685(JP,A) 特開 平1−145789(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/72 G06K 9/03

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 量子化された帳票または文書の画像デー
    タから切り出した文字パタンの認識結果を出力する認識
    部と、単語情報を知識辞書へ登録するための単語登録部
    と、前記知識辞書を用いて前記認識結果に基づく知識処
    理結果及び候補単語を出力する後処理部と、前記後処理
    結果を編集する結果編集部と、前記候補単語を表示する
    表示部と、正解単語を入力する入力部を備えて成る文字
    認識装置において、 前記表示部を、当該候補単語が当該知識辞書に最初から
    存在した単語情報の単語である場合と、前記単語登録部
    で登録された単語情報の単語である場合とでその単語の
    表示方法を変化させるようにしたことを特徴とする文字
    認識装置。
JP07660193A 1993-04-02 1993-04-02 文字認識装置 Expired - Fee Related JP3221968B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07660193A JP3221968B2 (ja) 1993-04-02 1993-04-02 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07660193A JP3221968B2 (ja) 1993-04-02 1993-04-02 文字認識装置

Publications (2)

Publication Number Publication Date
JPH06290308A JPH06290308A (ja) 1994-10-18
JP3221968B2 true JP3221968B2 (ja) 2001-10-22

Family

ID=13609852

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07660193A Expired - Fee Related JP3221968B2 (ja) 1993-04-02 1993-04-02 文字認識装置

Country Status (1)

Country Link
JP (1) JP3221968B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5107157B2 (ja) * 2008-06-30 2012-12-26 富士通フロンテック株式会社 文字認識プログラム、文字認識装置および文字認識方法
JP4661924B2 (ja) * 2008-09-12 2011-03-30 カシオ計算機株式会社 辞書機能を備えた電子機器およびプログラム
JP7421384B2 (ja) * 2020-03-19 2024-01-24 株式会社Pfu 情報処理装置、修正候補表示方法、及びプログラム

Also Published As

Publication number Publication date
JPH06290308A (ja) 1994-10-18

Similar Documents

Publication Publication Date Title
JP3427692B2 (ja) 文字認識方法および文字認識装置
JP3221968B2 (ja) 文字認識装置
US5233672A (en) Character reader and recognizer with a specialized editing function
US11042695B2 (en) Information processing apparatus and non-transitory computer readable medium for generating input screen information
JP2003242441A (ja) 帳票処理方法および装置並びにプログラム
JP3190603B2 (ja) 文字読み取り装置、その読み取り方法および記録媒体
JP3455643B2 (ja) 文字認識装置における学習辞書の更新方法及び文字認識装置
JP3930466B2 (ja) 文字認識装置、文字認識プログラム
JP3221969B2 (ja) 文字認識装置
KR950001061B1 (ko) 문서인식 수정장치
JP2954968B2 (ja) 光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法
JPS594358Y2 (ja) 文字修正における文字制御装置
JPH07182441A (ja) 文字認識装置
JP2687902B2 (ja) 文書画像認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JPH06282690A (ja) 文字認識装置
JPH05120471A (ja) 文字認識装置
JPS58125183A (ja) 光学文字読取装置における認識不能文字表示方法
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH06333083A (ja) 光学式文字読取装置
JPH07239901A (ja) 光学式読み取り装置における文字修正方法
JPH01134584A (ja) 文字認識装置
JP2006330780A (ja) 文字認識装置および文字認識プログラム
JPH05120472A (ja) 文字認識装置
JPH0636067A (ja) 文字読取装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010724

LAPS Cancellation because of no payment of annual fees