JPH04151786A - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JPH04151786A
JPH04151786A JP2277160A JP27716090A JPH04151786A JP H04151786 A JPH04151786 A JP H04151786A JP 2277160 A JP2277160 A JP 2277160A JP 27716090 A JP27716090 A JP 27716090A JP H04151786 A JPH04151786 A JP H04151786A
Authority
JP
Japan
Prior art keywords
pattern
dictionary
feature
image information
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2277160A
Other languages
English (en)
Inventor
Masateru Sakata
坂田 正輝
Toshiaki Ninomiya
寿朗 二宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Engineering Co Ltd
Original Assignee
Hitachi Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Engineering Co Ltd filed Critical Hitachi Engineering Co Ltd
Priority to JP2277160A priority Critical patent/JPH04151786A/ja
Publication of JPH04151786A publication Critical patent/JPH04151786A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はパターン認識装置に係り、特に、文字図形等の
文字種パターンあるいは音声情報に関するパターンを認
識するに好適なパターン認識装置に関する。
〔従来の技術〕
例えば、漢字の印刷或いは手書き文字を認識する場合一
般に入力文字の特徴を抽出し、これを辞書と比較して認
識している。この場合、不特定の筆者或いは書体に共用
の汎用辞書を使用するが、筆者或いは書体間の類似度が
それほど高くないと、筆者或いは書体間の差異の吸収が
難しく、認識率を高めることが出来ないが、認識のため
の辞書が膨大なものとなり、認識速度が低下すると共に
認識率が低下する。
そのため従来では、文字認識を例に取れば、特開昭63
−155390号公報に見られるように文字辞書をその
書体毎に用意し、書体判別を行う手段や、あるいは、音
声認識では話者側、また、手書き文字認識では筆者別の
専用辞書を用意するといった手段が取られてきた。しか
しながら、筆者或いは書体は非常に多数存在するために
、このような手段では、一般に辞書が膨大なものとなり
現実的でない。
特開昭63−216390号公報では、光学的文字認識
装置において、認識結果が誤っている文字について文字
の修正をおこなうに際し、その修正した文字の画像イメ
ージの特徴を辞書に反映させ、その後の文字について、
修正済の辞書を用いて再認識させて自動修正を行わせる
ことを提案している。しかし、このような方式では辞書
が装置の使用者の筆者或いは書体に次第に特化されてし
まい、不特定の筆者に対応し切れなくなるという問題が
有る。
特開平1−173273号公報では、文字または音声の
認識方式において、不特定多数の者に対して認識を行う
とき、多数の筆者の書き擲に応じたテンプレートを辞書
内に用意し、あらがしめ指定した特定文字をサンプル記
入させることにより、その個人に最も適したパターンの
テンプレートを選択してテンポラリ辞書として使用する
という認識辞書の選択学習方式を提案している。しかし
、本方式は辞書の選択方式についての提案であって、本
質的には、認識に必要な辞書の構成方式の問題を解決し
ている訳ではない。
また、特開平1−241689号公報では、使用頻度の
高い文字種を格納した第1の辞書と、使用頻度の低い文
字種を格納する第2の辞書とを有する辞書部とを用意し
、読み取り情報を第1の辞書に格納された文字種に基づ
き認識処理し、認識結果が誤認識又は認識不能であった
場合には読取り対象文字を、第2の辞書に格納された文
字種に基づき再認識処理する方法を提案している。しか
し、この方法においては階層構造をなす辞書に含まれる
文字種が固定されているため、ユーザの使用目的に応じ
て変化する文字種の出現頻度に対応することが出来ず、
ユーザによっては一定の文字が使用頻度が高いにもかか
わらず、使用頻度の低い文字種を格納する第2の辞書に
おかれたり、あるいはその逆に、一定の文字が使用頻度
が低いにもかかわらず、使用頻度の高い文字種を格納す
る第1の辞書におかれたりするなどの問題点が有った。
また、特開平1−267790号公報では、汎用文字認
識部と個人用文字認識部を備えた文字認識方法において
、個人用文字認識部の認識辞書を汎用文字認識部の認識
辞書により初期化する方式を提案している。しかし、こ
の方式は、個人用文字認識部の認識辞書が汎用文字認識
部の認識辞書の複製として作成されるため、個人用文字
認識部の認識辞書の中には、特定のユーザが高頻度に使
用しない文字種が多数台まれることとなり、辞書サイズ
が不必要に増大し、また、認識率・認識速度に関して不
利に寄与する結果となっている。さらに、認識実行時は
両者からの結果を付き合わせる方式であるため、常に汎
用文字認識部と個人用文字認識部を同時に実行する必要
が有り、装置構成上2倍の負荷が必要とされる。
〔発明が解決しようとする課題〕
以上のように、これらの方法においては、いずれも不特
定多数の筆者、書体の文字あるいは不特定多数の話者の
音声の認識辞書の現実的な構成方式が提案されていない
という問題点が有った。
一般に、不特定多数の筆者、書体の文字あるいは不特定
多数の話者の音声認識辞書は、多数の筆者、書体あるい
は話者のデータを収集して、これらのデータを平均化し
て作成される。しかし、平均化した辞書は、特定の筆者
、書体あるいは話者の辞書に比して認識率において劣る
のが普通である。そこで、特定の筆者、書体あるいは話
者の辞書部の認識率を実現するような不特定多数の筆者
、書体の文字または不特定多数の音声の認識辞書の構成
方式が必要とされている。
本発明の目的は、不特定のユーザの文字種あるいは音声
に関するパターンを迅速に認識することができるパター
ン認識装置を提供することにある。
〔課題を解決するための手段〕
前記目的を達成するために、本発明は、第1の装置とし
て、ユーザ固有の文字種群のうち特定のものの特徴パタ
ーンを格納する初読用辞書と、各ユーザ共通の文字種群
についての特徴パターンを格納する再読用辞書と、文字
種に関する画像情報を入力する画像情報入力手段と、画
像情報入力手段の入力による画像情報から文字種のパタ
ーンを生成するパターン生成手段と、パターン生成手段
の生成によるパターンから入力文字種の特徴を抽出する
特徴抽出手段と、特徴抽出手段により抽出された入力文
字種の特徴パターンと前記両辞書のうち少くとも一方の
辞書に格納された文字種群の特徴パターンと比較照合す
るパターン認識制御手段と、パターン認識制御手段の認
識結果を画像表示する表示手段とを備え、前記パターン
認識制御手段は、入力文字種の特徴パターンと初読用辞
書の特徴パターン群とを照合して辞書の中に入力文字種
に相当する特徴パターンが存在するか否かを判定する第
1判定部と、第1判定部により肯定の判定結果が得られ
たときに辞書の中から入力文字種に相当する特徴パター
ンを抽出する第1パターン抽出部と、第1パターン抽出
部の抽出した特徴パターンの文字種に関する画像情報を
出力する第1画像情報出力部と、第1判定部により否定
の判定結果が得られたときに入力文字種の特徴パターン
と再読用辞書の特徴パターン群とを照合して辞書の中に
入力文字種に相当する特徴パターンが存在するか否かを
判定する第2判定部と、第2判定部により肯定の判定結
果が得られたときに辞書の中から入力文字種に相当する
特徴パターンを抽出する第2パターン抽出部と、第2パ
ターン抽出部の抽出した特徴パターンの文字種に関する
画像情報を出力する第2画像情報出力部と、第2パター
ン抽出部の抽出による特徴パターンを初読用辞書に複写
するパターン複写部と、第2判定部により否定の判定結
果が得られたときに、この判定結果に関する画像情報を
出力する第2画像情報出力部とから構成されているパタ
ーン認識装置を構成したものである。
第2の装置として、ユーザ固有の音声情報のうち特定の
ものの特徴パターンを格納する初読用辞書と、各ユーザ
共通の音声情報についての特徴パターンを格納する再読
用辞書と、音声情報を入力する音声情報入力手段と、音
声情報入力手段の入力による音声情報から音声に関する
パターンを生成するパターン生成手段と、パターン生成
手段の生成によるパターンから音声の特徴を抽出する特
徴抽出手段と、特徴抽出手段により抽出された音声の特
徴パターンと前記両辞書のうち少くとも一方の辞書に格
納された音声の特徴パターンとを比較照合するパターン
認識制御手段と、パターン認識制御手段の認識結果を画
像表示する表示手段とを備え、前記パターン認識制御手
段は、入力音声の特徴パターンと初読用辞書の特徴パタ
ーン群とを照合して辞書の中に入力音声に相当する特徴
パターンが存在するか否かを判定する第1判定部と、第
1判定部により肯定の判定結果がえられたときに辞書の
中から入力音声に相当する特徴パターンを抽出する第1
パターン抽出部と、第1パターン抽出部の抽出した特徴
パターンの音声に関する画像情報を出力する第1画像情
報出力部と、第1判定部により否定の判定結果がえら得
たときに入力音声の特徴パターンと再読用辞書の特徴パ
ターン群とを照合して辞書の中に入力音声に相当する特
徴パターンが存在するか否かを判定する第2判定部と、
第2判定部により肯定の判定結果が得られたときに辞書
の中から入力音声に相当する特徴パターンを抽出する第
2パターン抽出部と、第2パターン抽出部の抽出した特
徴パターンの音声に関する画像情報を出力する第2画像
情報出力部と、第2パターン抽出部の抽出による特徴パ
ターンを初読用辞書に複写するパターン複写部と、第2
判定部により否定の判定結果が得られたときに、この判
定結果に関する画像情報を出力する第3画像情報出力部
とから構成されているパターン記憶装置を構成したもの
である。
第1または第2の装置を含む第3の装置として、初読用
辞書として複数の辞書を備えていると共に操作に応じ照
合用辞書として前記辞書を順次指定する初読用辞書選択
手段を備えているパターン認識装置を構成したものであ
る。
第1または第2の装置を含む第4の装置として、再読用
辞書として複数の辞書を備えていると共に、操作に応じ
て照合用辞書として前記辞書を順次指定する再読用辞書
選択手段を備えているパターン認識装置を構成したもの
である。
第1または第2の装置を含む第5の装置として、切続用
#書として複数の辞書を備えていると共に、操作に応じ
照合用辞書として前記辞書を順次指定する初読用辞書選
択手段を備え、再読用辞書として複数の辞書を備えてい
ると共に、操作に応じ照合用辞書として前記辞書を順次
指定する再読用辞書選択手段を備えているパターン認識
装置を構成したものである。
第1〜第5の装置のうちいずれか一つの装置を含む第6
の装置として、第1画像情報出力部と第2画像情報出力
部は、抽出された特徴パターンの格納元の辞書を特定す
る情報を画像情報に付して出力してなるパターン認識装
置を構成したものである。
第1〜第6の装置のうちいずれか一つの装置を含む第7
の装置として、認識対象パターンに対して修正された特
徴パターンを初読用辞書へ格納する特徴パターン入力手
段を備えているパターン認識装置を構成したものである
〔作用〕
認識対象の文字種に関する情報が入力されると、この入
力文字種に関する画像情報がパターンに変換され、この
パターンと初読用辞書に格納された特定パターンとの照
合がまず行われる。そして初読用辞書に入力文字種に相
当する特徴パターンが存在するときにはその特徴パター
ンに関する画像情報が表示され、初読用辞書内に入力文
字種に関する特徴パターンが存在しないときには入力文
字種の特徴パターンと再読用辞書の特徴パターン群との
照合が行われる。そして再読用辞書内に入力文字種に関
する特徴パターンが存在するときには。
この入力文字種に関する画像情報が表示されると共に再
読用辞書内に存在した特徴パターンを初読用辞書に複写
し、初読用辞書内の特徴パターンを特定なものの特定パ
ターン群の集合として順次拡張し、再読用辞書に対する
認識処理を低減させる。
これにより初読用辞書に対する認識処理等で認識対象文
字種に対する認識を行うことが可能となり、初読用辞書
が最適化され、認識率の向上および認識速度の向上を図
ることができる。音声情報に対しても同様な処理が行わ
れるため、音声情報に対しても認識率の向上および認識
速度の向上を図ることができる。
また初読用辞書として複数の辞書を備えたり、あるいは
再読用辞書として複数の辞書を備えたりすれば、多くの
情報の中から認識対象パターンを選択することができ認
識率の向上を図ることができる。
また認識処理において必要なパターンが得られないとき
に、認識対象パターンに対して修正された特定パターン
を初読用辞書へ格納する学習処理を行えば初読用辞書を
最適化することが可能となる。
〔実施例〕 以下、本発明の一実施例を図面に基づいて説明する。
第1図において、パターン認識装置はキーボード10、
認識制御部11.スキャナ12、イメージバッファ13
、前処理部14、特徴抽出部15、大分類用辞書部16
、中分類用辞書17、小分類用辞書部18、CRT19
を備えて構成されており、各辞書部16.17.18は
それぞれ切続用大分類用辞書16A、切続用中分類用辞
書17A、切続用小分類用辞書18A、再読用大分類用
辞書16B、再読用中分類用辞書17B、再読用小分類
用辞書18Bに階層化されている。
キーボード10は各種の情報および指令を入力する入力
手段として構成されており、キーボード10の操作ボタ
ンが操作されると、この操作ボタンに従った指令が認識
制御部11を介して各部に伝送されると共にCRT19
の画面上に操作内容が画像表示されるようになっている
。スキャナ12は認識制御部11からの指令に従って、
帳票上の文字を光学的に走査し、走査により得られた画
像情報を出力する画像情報入力手段として構成されてお
り、画像情報がイメージバッファ13に格納されるよう
になっている。イメージバッファ13に格納された画像
情報は前処理部14により文字の切り出しおよび正規化
処理等の前処理が施され、スキャナ12の操作による入
力文字のパターンが生成されるようになっている。すな
わちイメージバッファ13、前処理部14は画像情報か
ら文字のパターンを生成するパターン生成手段として構
成されている。そして前処理部14で生成されたパター
ンは特徴抽出部15に転送され、切り出された文字の特
徴が抽出される。すなわち特徴抽出部15は入力文字の
特徴を抽出する特徴抽出手段として構成されている。
辞書部16,17.18のうち初読用辞書16A、17
A、18Aにはユーザ固有の文字、図形などの文字種群
のうち特定のものの特徴パターンとして1例えば筆者あ
るいは書体毎に固有な特徴パターンとして使用頻度の高
い特徴パターンを大分類、中分類、小分類に分割した大
分類のものが初読用辞書16Aに、中分類のものが初読
用辞書]、7A、小分類のものが初読用辞書18Aにそ
れぞれ格納されている。一方、再読用辞書16B。
17B、18Bには、各ユーザ共通の文字種群の特徴パ
ターンとして、例えば筆者あるいは書体間で共通な特徴
を有する文字の特徴パターンを大分類、中分類、小分類
に分割した時の大分類のものが再読用辞書16Bに、中
分類のものが再読用辞書17B、小分類のものが再読用
辞書18Bにそれぞれ格納されている。すなわち各再読
用辞書16B、17B、18Bには、多数の筆者あるい
は書体のデータを集取して、これらのデータを平均化し
て作成された特徴パターン群のデータが格納されている
。また辞書16A、16Bには文字の外部構造に関する
特徴パターンが格納され、辞書17A、17Bには文字
の内部構造に関する特徴パターンが格納され、辞書18
A、18Bには文字の位相構造に関する特徴パターンが
格納されている。
認識制御部11は、パターン認識制御手段として、入力
文字種の特徴パターンと初読用辞書16A、17A、1
8Aの特徴パターン群とを照合して辞書の中に入力文字
種に相当する特徴パターンが存在するか否かを判定する
第1判定部と、第1判定部により肯定の判定結果が得ら
れたときに辞書の中から入力文字種に相当する特徴パタ
ーンを抽出する第1パターン抽出部と、第1パターン抽
出部の抽出した特徴パターンの文字種に関する画像情報
を出力する画像情報出力部と、第1判定部に指定の判定
結果が得られたときに入力文字種の特徴パターンと再読
用辞書16B、17B、18Bの特徴パターン群とを照
合して辞書の中に入力文字種に相当する特徴パターンが
存在するが否かを判定する第2判定部と、第2判定部に
より肯定の判定結果が得られたときに辞書の中から入力
文字種に相当する特徴パターンを抽出する第2パターン
抽出部と、第2パターン抽出部の抽出した特徴パターン
の文字種に関する画像情報を出力する第2画像情報出力
部と、第2パターン抽出部の抽出による特徴パターンを
初読用辞書16A、17A、18Aに複写するパターン
複写部と、第2判定部により否定の判定結果が得られた
ときにこの判定結果に関する画像情報を出力する第3画
像情報出力部を備えて構成されている。更にキーボード
10からの指令に応じ照合用辞書として各初読用辞書1
6A、17A、18Aを順次指定する初読用辞書選択手
段と、照合用辞書として再読用辞書16B、17B、1
8Bを順次指定する再読用辞書選択手段を構成するよう
になっている。更に認識対象パターンに対して修正され
た特徴パターンを初読用辞書16A、17A、18Aへ
格納する学習処理を実行するための特徴パターン入力手
段を構成するようになっている。
以上の構成において、操作者の操作によりキーボード1
0から指令が発せられると、スキャナ12により帳票上
の文字列が光学的に走査され、この文字列に関する画像
情報がイメージバッファ13に入力される。この画像情
報は前処理部14で文字の切り出しと大きさの正規化が
施され、文字パターンが生成される。そして切り出され
た文字の特徴が特徴コードとして特徴抽出部15で抽出
される。この後認識判定部11の処理により特徴抽出部
]5で抽出された文字の特徴パターンに関する特徴コー
ドと初読用辞書1.6A、17A、18Aに格納された
特徴パターンに関する特徴コードとの比較照合が行われ
る。ここで両者の特徴コードの比較照合を行う場合、両
者のコード間の相違度合いを゛′距離″として、この距
離の値に従って候補文字の絞り込みを行う。すなわち、
初読用辞書16Aから順番に初読用辞書17A、18A
を照合し、入力文字の特徴コードに相当する特徴コード
がいずれかの辞書に存在するか否かの処理を実行する。
そして一定のしきい値以下の距離を有する候補文字が存
在する場合には、入力文字と距離の最も近い文字を認識
結果文字とし、以下距離順に少数の候補文字を切続結果
として出力する。
更に認識結果文字および候補文字にはそれらがいずれか
の初読用辞書から出力されたかを特定するための情報を
画像情報に付して出力する。
一方、初読用辞書16A、17A、18A内に入力文字
の特徴コードに相当する特徴コードが存在しないときに
は、再読用辞書16B’、17B。
18B内の特徴コートを順次参照する処理を実行する。
このときも、前述の処理と同様に、一定のしきい値以下
の距離を有する候補文字が存在するときには、入力文字
と距離の最も近い文字を認識結果文字として、以下距離
の順に少数の候補文字を再読結果として出力する。更に
再読結果によって得られた文字の特徴コードをそれぞれ
初読用辞書16A、17A、18Aに複写する。例えば
、再読用辞書16Bから候補文字が選択されたときには
、この候補文字の特徴コードを初読用辞書16Aに複写
する。更に認識結果文字および候補文字には、それらの
文字が選択された辞書を特定するための識別情報が画像
情報に付加されて出力される。
また再読処理によっても一定のしきい値以下の距離を有
する候補文字が存在しないときには、認識不能として画
像情報にリジェクト符号を付して出力する。そして各再
読結果に関する画像情報はCRT19の画面上に画像表
示される。
切続結果あるいは再読結果がCRT19の画面上に表示
される場合、識別結果文字および候補文字に付加された
識別情報が表示されるため、画像表示された文字が切続
結果により得られた文字か再読結果によって得られた文
字であるかを操作者が識別することができる。そして操
作者は、CRT19の画面上に画像表示された内容から
、バタン認識の結果を確認し、認識結果が正しい場合に
はそのままとし、誤読の場合には候補文字群および読み
取り対象イメージを表示させ、候補カテゴリ内に正しい
文字が存在するときはその文字を選択し、候補カテゴリ
内に正しい文字が存在しないあるいはりジェクトである
場合には正しい文字を、例えば文字コードとして入力す
れば誤読の修正を行うことができる。
このとき、認識対象パターンに対して修正された特徴パ
ターンを初読用辞書16A、17A、18Aへ格納する
学習処理を実行する。この学習処理は初読用辞書16A
、17A、18Aにもカテゴリの新規追加として実行さ
れ、新たに追加された文字コードが既に存在する場合に
は、カテゴリへの重ね合わせとして、例えば新旧画情報
の論理和として実行される。この結果、認識対象文字の
再読を行うまでは、初読用辞書16A、17A。
18Aに入っていない文字の情報が再読後は辞書に入っ
ていることと成り、次の文字が帳票に表れた場合には再
読処理が不要となる。このため、初期状態の辞書に含ま
れる文字種を十分少くしておいても、このプロセスを適
度に繰り返すことにより、最終的には初読用辞書16A
、17A、18Aに必要とされる使用頻度の高い文字種
の特徴パターンを格納することができる。
このように、本実施例によれば、初読用辞書16A、1
7A、18Aから使用頻度の高い特徴パターンが順次成
長しながら格納されるため、初読用辞書16A、17A
、18Aによる認識率が向上し、OCRシステムとして
の認識率および認識速度の向上を図ることが可能となる
なお、操作者が修正作業を行う場合には、キーボードの
10の一つの操作ボタンに、例えば「再読」を割り当て
、このキーボタンの押し下げ信号および修正作業を行う
場合には、キーボード10の一つの操作ボタンに、例え
ば「再読」を割り当て、このキーボタンの押し下げ信号
および修正を行う文字についての情報を入力することに
よって実行される。そして更に操作者がシステムの起動
時にユーザ辞書作成モードとユーザ辞書実行モードのう
ちユーザ辞書作成モードが指定されたときにのみ学習処
理が行われるようになっている。このようなモードの指
定によって学習処理の実行を選択するようにすれば、操
作者が辞書の実行状態を明確に把握して作業を行うこと
ができる。
また上記実施例において、切続用の辞書として、筆者あ
るいは書体に応じた辞書を分類毎に用意すれば、操作者
の使用目的に応じて任意の辞書を選択することが出来、
○CRシステムとしての認識率および認識速度を更に向
上させることが可能となる。この場合の初読用辞書の選
択例が第2図に示されている。
また、操作者が修正作業を行う場合、操作メニューの1
つに、例えば「学習」を割り当て、このメニューの選択
により学習を行うか行わないかを選択させることも可能
であり、「学習」の指定をCRT19の画面上にメニュ
ーにより実現した例が第3図に示されている。この場合
、指定はメニューにより割り当てられたファンクション
キーおよびマウス等のポインティングデイバイスによっ
て実行される。
また前記実施例においては、文字、図形等の文字種のパ
ターンを認識するものについて述べたが、音声情報を認
識するものにも前記実施例を適用することができる。
例えば、スキャナ12の代りにマイクロホン等の音声入
力装置を用い、イメージバッファ13の代りに音声人カ
バソファを用いる。そして、音声入力装置により入力さ
れた音声信号を音声周波数の時間変化を表わしたパター
ンであるTSP(T−ime Spectrum Pa
ttern)として表現し、これをTSPのピーク近傍
を(1)、その他を(0)とする2値パターンに変換す
る処理を行う。2値パターン(Binary Time
 Spectrum Pattern)は文字認識の2
値化イメージと同様に取り扱うことが可能であり、この
2値化された音声情報は前処理部14で音節体の切り落
としと、音節間の正規化が施され、切り出された音節の
特徴が特徴コードとして特徴抽出部15で抽出される。
この後の処理は文字種パターンのd識処理と同じ処理を
実行することにより、音声パターンの認識を行うことが
できる。
〔発明の効果〕
以上説明したように、本発明によれば、使用頻度の高い
特徴パターンを初読用辞書に格納すると共に入力文字あ
るいは入力音声に相当する特徴パターンが再読用辞書か
ら抽出されたときには再読用辞書の特徴パターンを初読
用辞書に複写するようにしたため、初読用辞書が最適化
され、再読用辞書を認識するための処理が低減されるの
で、認識率の向上および認識速度の向上を図ることが可
能となる。
また再読辞書が原型通りに保存され、学習により劣化す
る危険がなくかつ切続辞書の内容が更新されても再読用
辞書の内容を再利用することができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す全体構成図、第2図は
初読用辞書の選択用画面の表示例を示す図、第3図は「
学習J指定をCRT上の画面のメニューにより実現した
表示例を示す図で・ある。 10・・・キーボード、11・・・認識制御部、12・
・・スキャナ、13・・・イメージバッファ、14・・
・前処理部、15・・・特徴抽出部、16A・・・切続
用大分類用辞書、 16B・・・再読用大分類用辞書、 17A・・・切続用中分類用辞書、 17B・・・再読用中分類用辞書、 18A・・・切続用小分類用辞書、 18B・・再読用小分類用辞書、 19・・・CRT。

Claims (1)

  1. 【特許請求の範囲】 1、ユーザ固有の文字種群のうち特定のものの特徴パタ
    ーンを格納する初読用辞書と、各ユーザ共通の文字種群
    についての特徴パターンを格納する再読用辞書と、文字
    種に関する画像情報を入力する画像情報入力手段と、画
    像情報入力手段の入力による画像情報から文字種のパタ
    ーンを生成するパターン生成手段と、パターン生成手段
    の生成によるパターンから入力文字種の特徴を抽出する
    特徴抽出手段と、特徴抽出手段により抽出された入力文
    字種の特徴パターンと前記両辞書のうち少くとも一方の
    辞書に格納された文字種群の特徴パターンと比較照合す
    るパターン認識制御手段と、パターン認識制御手段の認
    識結果を画像表示する表示手段とを備え、前記パターン
    認識制御手段は、入力文字種の特徴パターンと初読用辞
    書の特徴パターン群とを照合して辞書の中に入力文字種
    に相当する特徴パターンが存在するか否かを判定する第
    1判定部と、第1判定部により肯定の判定結果が得られ
    たときに辞書の中から入力文字種に相当する特徴パター
    ンを抽出する第1パターン抽出部と、第1パターン抽出
    部の抽出した特徴パターンの文字種に関する画像情報を
    出力する第1画像情報出力部と、第1判定部により否定
    の判定結果が得られたときに入力文字種の特徴パターン
    と再読用辞書の特徴パターン群とを照合して辞書の中に
    入力文字種に相当する特徴パターンが存在するか否かを
    判定する第2判定部と、第2判定部により肯定の判定結
    果が得られたときに辞書の中から入力文字種に相当する
    特徴パターンを抽出する第2パターン抽出部と、第2パ
    ターン抽出部の抽出した特徴パターンの文字種に関する
    画像情報を出力する第2画像情報出力部と、第2パター
    ン抽出部の抽出による特徴パターンを初読用辞書に複写
    するパターン複写部と、第2判定部により否定の判定結
    果が得られたときに、この判定結果に関する画像情報を
    出力する第2画像情報出力部とから構成されているパタ
    ーン認識装置。 2、ユーザ固有の音声情報のうち特定のものの特徴パタ
    ーンを格納する初読用辞書と、各ユーザ共通の音声情報
    についての特徴パターンを格納する再読用辞書と、音声
    情報を入力する音声情報入力手段と、音声情報入力手段
    の入力による音声情報から音声に関するパターンを生成
    するパターン生成手段と、パターン生成手段の生成によ
    るパターンから音声の特徴を抽出する特徴抽出手段と、
    特徴抽出手段により抽出された音声の特徴パターンと前
    記両辞書のうち少くとも一方の辞書に格納された音声の
    特徴パターンとを比較照合するパターン認識制御手段と
    、パターン認識制御手段の認識結果を画像表示する表示
    手段とを備え、前記パターン認識制御手段は、入力音声
    の特徴パターンと初読用辞書の特徴パターン群とを照合
    して辞書の中に入力音声に相当する特徴パターンが存在
    するか否かを判定する第1判定部と、第1判定部により
    肯定の判定結果がえられたときに辞書の中から入力音声
    に相当する特徴パターンを抽出する第1パターン抽出部
    と、第1パターン抽出部の抽出した特徴パターンの音声
    に関する画像情報を出力する第1画像情報出力部と、第
    1判定部により否定の判定結果がえら得たときに入力音
    声の特徴パターンと再読用辞書の特徴パターン群とを照
    合して辞書の中に入力音声に相当する特徴パターンが存
    在するか否かを判定する第2判定部と、第2判定部によ
    り肯定の判定結果が得られたときに辞書の中から入力音
    声に相当する特徴パターンを抽出する第2パターン抽出
    部と、第2パターン抽出部の抽出した特徴パターンの音
    声に関する画像情報を出力する第2画像情報出力部と、
    第2パターン抽出部の抽出による特徴パターンを初読用
    辞書に複写するパターン複写部と、第2判定部により否
    定の判定結果が得られたときに、この判定結果に関する
    画像情報を出力する第3画像情報出力部とから構成され
    ているパターン記憶装置。 3、初読用辞書として複数の辞書を備えていると共に、
    操作に応じ照合用辞書として前記辞書を順次指定する初
    読用辞書選択手段を備えている請求項1または2記載の
    パターン認識装置。 4、再読用辞書として複数の辞書を備えていると共に、
    操作に応じて照合用辞書として前記辞書を順次指定する
    再読用辞書選択手段を備えている請求項1または2記載
    のパターン認識装置。 5、初読用辞書として複数の辞書を備えていると共に、
    操作に応じ照合用辞書として前記辞書を順次指定する初
    読用辞書選択手段を備え、再読用辞書として複数の辞書
    を備えていると共に、操作に応じ照合用辞書として前記
    辞書を順次指定する再読用辞書選択手段を備えている請
    求項1または2記載のパターン認識装置。 6、第1画像情報出力部と第2画像情報出力部は、抽出
    された特徴パターンの格納元の辞書を特定する情報を画
    像情報に付して出力してなる請求項1、2、3、4また
    は5記載のパターン認識装置。 7、認識対象パターンに対して修正された特徴パターン
    を初読用辞書へ格納する特徴パターン入力手段を備えて
    いる請求項1、2、3、4、5または6記載のパターン
    認識装置。
JP2277160A 1990-10-16 1990-10-16 パターン認識装置 Pending JPH04151786A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2277160A JPH04151786A (ja) 1990-10-16 1990-10-16 パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2277160A JPH04151786A (ja) 1990-10-16 1990-10-16 パターン認識装置

Publications (1)

Publication Number Publication Date
JPH04151786A true JPH04151786A (ja) 1992-05-25

Family

ID=17579641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2277160A Pending JPH04151786A (ja) 1990-10-16 1990-10-16 パターン認識装置

Country Status (1)

Country Link
JP (1) JPH04151786A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7581180B2 (en) * 2000-05-12 2009-08-25 Sony Corporation Portable terminal, method for inputting the information, method and apparatus for dictionary retrieval and medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7581180B2 (en) * 2000-05-12 2009-08-25 Sony Corporation Portable terminal, method for inputting the information, method and apparatus for dictionary retrieval and medium

Similar Documents

Publication Publication Date Title
JP3183577B2 (ja) 画像内容を復号することなく文書画像中の意味的に重要な画像を選択するための方法
KR100412317B1 (ko) 문자인식/수정방법및장치
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
WO2007002377A2 (en) Handwriting recognition using neural networks
JP2000353215A (ja) 文字認識装置および文字認識プログラムを記録した記録媒体
JPS63155386A (ja) 帳票デ−タ読取装置
JPH09190505A (ja) 文字認識装置及びその方法
Zeki The segmentation problem in arabic character recognition the state of the art
US5621818A (en) Document recognition apparatus
JPH11194793A (ja) 音声ワープロ
US6035062A (en) Character recognition method and apparatus
JPH04151786A (ja) パターン認識装置
JP3727422B2 (ja) 文字認識装置及びその方法
JP3266687B2 (ja) マーク認識方法
Amin Recognition of printed Arabic text using machine learning
JP2001092924A (ja) パターン認識方法および装置
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JPS60173688A (ja) パタ−ン処理装置
JPH0757040A (ja) Ocr付きファイリング装置
JP2660998B2 (ja) 日本語処理装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPS6061875A (ja) パターン認識装置における標準パターン作成方法
JPH08305851A (ja) 手書き記号認識システム
JPH07107698B2 (ja) 文字認識方法
JPH11120294A (ja) 文字認識装置および媒体