JPH01180083A - Device for recognizing character of plural font - Google Patents

Device for recognizing character of plural font

Info

Publication number
JPH01180083A
JPH01180083A JP63004168A JP416888A JPH01180083A JP H01180083 A JPH01180083 A JP H01180083A JP 63004168 A JP63004168 A JP 63004168A JP 416888 A JP416888 A JP 416888A JP H01180083 A JPH01180083 A JP H01180083A
Authority
JP
Japan
Prior art keywords
font
character
memory
minimum distance
processors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63004168A
Other languages
Japanese (ja)
Inventor
Hiroyuki Kami
上 博行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63004168A priority Critical patent/JPH01180083A/en
Publication of JPH01180083A publication Critical patent/JPH01180083A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To easily prepare a dictionary by executing font determination by comparing minimum distance values discriminated by means of dictionaries prepared at every font. CONSTITUTION:A memory controller 4 sends four-font collating programs in a memory 3 to exclusive processors 5-8. Then one of the character-string picture and the data of character segmenting position of a memory 2 are transferred to the memory 3. Thereafter, collating processes are executed at each font at the processors 5-8 and the minimum distance value to each character picture stored in the memory 3 is outputted to the memory 3 so as to collate a sentence of a designated character number. Upon completion of the collation, a general purpose processor 1 finds the mean minimum distance value at every font from the received minimum distance values and adopts the font having the minimum distance value as the font. Then the processors 5-8 execute collating programs in parallel with each other and output collated results to the memory 3. After the collation is completed, completion data are returned to the processor 1. Upon receiving the completion data, the processor 1 receives the collated results stored in the memory 3.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は複数フォント文字認識装置に関し、特にフォン
ト別の認識辞書を使った照合結果がらフォントを確定後
文字読み取りを行なう複数フォント文字認識装置に関す
る。
[Detailed Description of the Invention] [Industrial Application Field] The present invention relates to a multi-font character recognition device, and more particularly to a multi-font character recognition device that reads characters after determining the font based on the matching results using a recognition dictionary for each font. .

〔従来の技術〕[Conventional technology]

複数フォント文字の認識方法として、複数個の単一フォ
ント読み収り機構で得られた各々の読み取り結果に対し
て単語照合を用いて最終結果を決定することで複数フォ
ントを認識する方法〔例えば、アイ イー イー イー
 トランザクションズ オン コンピューターズ 第C
−27巻 第8号  721 頁 (IEEETR人N
5ACTIONS  ON  COMPUTERS V
OL、C−27,NO,8,PP、721)の“^Mu
ltifontWord Recognition S
ystem for Po5tal Address 
Reading  ”、(参考文献1)〕複数のフォン
トで共通な特徴を用いて認識する方法〔例えば、アイイ
ー イー イー トランザクションズ オンパタン ア
ナリシス アンド マシン インテリジェンス 第PA
MI−9巻 第2号 274頁 (I  E  E  
E  TRANSACTIONS  ON  PATT
I!RN  ANALYSISAND  MACHIN
E  IN置LIGENCE、VOL、PAMI−9,
NO,2゜PP、274>の”On the Reco
gnition of Pr1nted Charac
ters of Any Font and 5ize
 ”、(参考文献2)等が知られている。
As a method for recognizing multiple font characters, there is a method for recognizing multiple fonts by determining the final result using word matching for each reading result obtained by a plurality of single font reading mechanisms [e.g. IE Transactions on Computers Part C
-Volume 27, No. 8, Page 721 (IEEETR Person N
5 ACTIONS ON COMPUTERS V
OL, C-27, NO, 8, PP, 721) “^Mu
ltifontWord Recognition S
system for Po5tal Address
Reading”, (Reference 1)] Recognition method using common characteristics of multiple fonts [For example, IE Transactions On-Pattern Analysis and Machine Intelligence Part PA
MI-Volume 9 No. 2 Page 274 (IEE
E TRANSACTIONS ON PATT
I! RN ANALYSIS AND MACHIN
E IN LIGENCE, VOL, PAMI-9,
“On the Reco” by NO, 2゜PP, 274>
gnition of Pr1nted Charac
ters of Any Font and 5ize
”, (Reference document 2), etc. are known.

また、電子通信学会、パターン認識と理解研究会資料P
RU86−76の「階層化判別法とその文字認識システ
ムPC−OCRjは、分割した辞書に対する整合処理と
最大整合量の文字カテゴリの検出処理とにイメージバイ
ブラインドプロセッサを用い、各プロセッサからの文字
カテゴリの整合量を比較し最終結果を得るに汎用プロセ
ッサを使った複数プロセッサ構成の文字認識装置である
く参考文献3)。
In addition, the Institute of Electronics and Communication Engineers, Pattern Recognition and Understanding Study Group Materials P
RU86-76's "Hierarchical discriminant method and its character recognition system PC-OCRj uses an image-by-blind processor for matching processing for divided dictionaries and processing for detecting character categories with the maximum matching amount, and uses character categories from each processor. Reference 3) is a multi-processor character recognition device that uses a general-purpose processor to compare the amount of matching and obtain the final result.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

参考文献1はシングルフォント読み取りを基本にしてい
るので辞書作成は容易となるが、文書の文字認識装置と
しては照合すべき単語数が多くなり、大規模な装置とな
ってしまうという問題点がある。また参考文献2のよう
な方法は文字認識辞書を小さくできる可能性があるが、
認識辞書作成に時間がかかり、また認識性能の向上を計
りにくいという問題点がある。
Reference 1 is based on single font reading, which makes it easy to create a dictionary, but as a document character recognition device, there is a problem that the number of words to be collated increases, resulting in a large-scale device. . Also, the method described in Reference 2 has the possibility of reducing the size of the character recognition dictionary, but
There are problems in that it takes time to create a recognition dictionary and it is difficult to measure the improvement in recognition performance.

〔問題点を解決するための手段〕[Means for solving problems]

本発明の第一の発明は、複数のプロセッサとフォント別
の認識辞書とを備えた文字認識装置において、まづ読み
取り範囲内の数文字分の入力文字画像に対する各フォン
トの認識辞書での距離値による整合処理を複数個の判定
用プロセッサで行い、制御用プロセッサでは前記数文字
分の最小距離値の平均値を計算し各フォントでの平均値
の比較により値の最小となるフォントを選ぶフォント決
定を行い、次に選択したフォントの認識辞書での読み取
り範囲内の文字画像に対する整合処理を複数個の判定用
プロセッサで並列に行うことを備えて構成される。
A first aspect of the present invention is that in a character recognition device equipped with a plurality of processors and recognition dictionaries for each font, first, distance values in the recognition dictionary of each font are calculated for input character images of several characters within a reading range. The matching process is performed by multiple determination processors, and the control processor calculates the average value of the minimum distance values for the several characters, and then selects the font with the minimum value by comparing the average values for each font. Font determination Then, a plurality of determination processors perform matching processing for character images within the reading range in the recognition dictionary of the selected font in parallel.

本発明の第二の発明は、複数のプロセッサとフォント別
の認識辞書とを備えた文字認識装置において、まず読み
取り範囲内の数文字分の入力文字画像に対する各フォン
トの認識辞書での距離値による整合処理を複数個の判定
用プロセッサで行い、制御用プロセッサでは前記数文字
分の判定結果のうちで特定カテゴリ以外の最小距離値の
平均値を計算し各フォントでの平均値の比較により値の
最小となるフォントを選ぶフォント決定を行い、次に選
択したフォントの認識辞書での読み取り範囲内の文字画
像に対する整合処理を複数個の判定用プロセッサで並列
に行うことを備えて構成される。
A second aspect of the present invention is a character recognition device equipped with a plurality of processors and a recognition dictionary for each font, which first uses a distance value in the recognition dictionary of each font for an input character image of several characters within a reading range. Matching processing is performed by multiple judgment processors, and the control processor calculates the average value of the minimum distance values other than the specific category among the judgment results for the several characters, and calculates the value by comparing the average values for each font. The present invention is configured to perform font determination by selecting the smallest font, and then perform matching processing for character images within the reading range of the recognition dictionary of the selected font in parallel using a plurality of determination processors.

〔作用〕[Effect]

文書が認識対象で節あるいは一行を読み取りの単位とす
ると、各単位内では単一フォント文字が使われることが
多い。シングルフォント読み取りは辞書作成が容易で認
識性能の向上を計りやすいことから、節あるいは一行を
単位としてまず読み取り単位内の文字フォントを決定し
、その後で選択されたフォントの認識辞書による文字認
識(シングルフォント文字認識)を行なうという方法を
採用することで、認識性能の向上が計りやすいマルチフ
ォント文字認識方式とすることが可能となる。フォント
の決定方法としては、各フォントの認識辞書での照合結
果を用いる方法が考えられる。参考文献3の判別分析法
は辞書作成に用いた学習バタンと異なる形の文字を判定
すると判定結果が多きな最小距離値となる性質を持って
いる。
When a document is to be recognized and the unit of reading is a section or line, a single font character is often used within each unit. Since single font reading is easy to create a dictionary and improve recognition performance, first determine the character font within the reading unit for each clause or line, and then perform character recognition (single font reading) using a recognition dictionary for the selected font. By adopting a method of performing font character recognition), it is possible to create a multi-font character recognition method that can easily improve recognition performance. A possible method for determining fonts is to use the results of matching each font in a recognition dictionary. The discriminant analysis method in Reference Document 3 has the property that when a character having a shape different from the learning button used for dictionary creation is determined, the minimum distance value yields a large number of determination results.

そこで、フォントごとに作成した辞書で判定した最小距
離値を比較すると、フォント決定が可能となる。ところ
で、入力文字バタンはその文字の印字状態や画像入力部
の状態あるいは画像の正規化により、学習に用いた文字
バタンとは完全には一致しないと考えられる。それ故、
−個のみの最小距離値によるフォント選択では誤ったフ
ォント決定が起こる可能性が高い。また、特定のカテゴ
リはフォントでの字形の違いは少ないので、フォント決
定に利用できない場合がある。第4図は、−フォントの
文字データに対していくつかのフォントの認識辞書で照
合して得られた最小距離値の例である。この図では、英
小字のi、1や記号のカンマ、プラス等は、別フォント
での距離値は小さいので、フォント決定には利用できな
い。
Therefore, by comparing the minimum distance values determined using dictionaries created for each font, the font can be determined. By the way, it is thought that the input character stamp does not completely match the character stamp used for learning due to the printing state of the character, the state of the image input section, or the normalization of the image. Therefore,
Font selection based on only - minimum distance values is likely to result in incorrect font determination. Further, since there are few differences in the shape of fonts in a specific category, it may not be possible to use the font for determining the font. FIG. 4 is an example of the minimum distance value obtained by comparing the character data of the - font with recognition dictionaries of several fonts. In this figure, the distance values for the small English letters i and 1 and the symbols comma and plus are small in other fonts, so they cannot be used for font determination.

従って、読み取り単位内の数文字の判定結果である最小
距離値の平均値を使うと、確実なフォント決定が可能と
なる。また、判定結果から特定カテゴリを除いて最小距
離値の平均値をとることでフォント決定がより確実とな
る。
Therefore, by using the average value of the minimum distance values, which are the results of determination of several characters within a reading unit, reliable font determination becomes possible. Furthermore, by excluding specific categories from the determination results and taking the average value of the minimum distance values, font determination becomes more reliable.

参考文献3のシングルフォント文字認識方法は、線形判
別分析での特徴変換により識別率を保持したままで特徴
量のデータ長が短くできるために、距離計算の照合時間
を短縮できる。またプロセッサ間でデータを高速に転送
することができるので、照合プログラムをデータとする
ことで、各フォントに対する照合プログラムの入れ替え
が可能となり、参考文献1のようなフォント別のハード
ウェアを用意しなくても、前述のマルチフォント文字認
識方式を実現できる。
In the single font character recognition method of Reference 3, the data length of the feature amount can be shortened while maintaining the identification rate through feature conversion using linear discriminant analysis, so the matching time for distance calculation can be shortened. In addition, since data can be transferred between processors at high speed, by using the collation program as data, it is possible to replace the collation program for each font, eliminating the need to prepare hardware for each font as in Reference 1. However, the multi-font character recognition method described above can be realized.

〔実施例〕〔Example〕

以下、本願発明の実施例を図面を参照して説明する。 Embodiments of the present invention will be described below with reference to the drawings.

第1図は、本W!4発明の一実施例である文字認識装置
における処理を流れ図で表わしたものである。また第3
図は、本願発明の詳細な説明を容易にするための5個の
プロセッサを用いた文字認識装置である。これは前記参
考文献3と類似の構成となっている。
Figure 1 shows the book W! 4 is a flowchart showing processing in a character recognition device according to an embodiment of the invention. Also the third
The figure shows a character recognition device using five processors to facilitate detailed explanation of the present invention. This has a similar configuration to Reference Document 3 mentioned above.

参考文献3での文字切出し後の本願発明による文字認識
フローを次に簡単に説明する。まず、切出された文字画
像からの文字外接枠を求め、得られた外接枠から文字画
像の中心位置を決定する。
The character recognition flow according to the present invention after character extraction in Reference Document 3 will be briefly described next. First, a character circumscribing frame is obtained from the extracted character image, and the center position of the character image is determined from the obtained circumscribing frame.

次に得られた中心位置からあらかじめ定めた距離だけ離
れた位置をリサンプリング位置とし、各リサンプリング
位置とその周囲の位置とにおける画像とガウス形フィル
タとの相関計算により得られた値を初期ベクトルの要素
とする。従って、複数のリサンプリング位置におけるガ
ウス形フィルタとの相関により求まった値から、初期ベ
クトルが作られる。一方、あらかじめ多数の学習データ
の各々から作られた初期ベクトルを線形判別分析という
統計処理により、線形判別分析の変換行列を用意してお
く、前記−文字の画像から作られた初期ベクトルと前記
変換行列との積により得られるベクトルを、特徴ベクト
ルとする。最後に前記特徴ベクトルと文字認識辞書であ
る予め用意された各カテゴリのベクトルとの距離を計算
し、最小距離値となる前記文字認識辞書のカテゴリ名を
判定結果とする。
Next, a position a predetermined distance away from the obtained center position is set as a resampling position, and the value obtained by calculating the correlation between the image and the Gaussian filter at each resampling position and surrounding positions is used as the initial vector. element. Therefore, an initial vector is created from values determined by correlation with a Gaussian filter at a plurality of resampling positions. On the other hand, a transformation matrix for linear discriminant analysis is prepared by performing a statistical process called linear discriminant analysis on the initial vectors created from each of a large number of learning data in advance. Let the vector obtained by multiplying with the matrix be the feature vector. Finally, the distance between the feature vector and the vector of each category prepared in advance in the character recognition dictionary is calculated, and the category name of the character recognition dictionary having the minimum distance value is determined as the determination result.

第3図において、1は文字認識処理を制御する汎用プロ
セッサ、2は1の汎用プロセッサを動かすプログラムや
読み取り範囲内の文字列画像や文字切り出し位置等のデ
ータを記憶するメモリ、3はプログラム・文字列画像・
認識辞書・照合結果・特徴値等のデータを記憶するメモ
リ、4は1の汎用プロセッサからの制御によりメモリ2
と3との間でデータの授受を行ったり、メモリ3と専用
プロセッサ5および8との間でデータの授受を行うメモ
リコントローラである。また5がら8はパイプラインに
つなぐことができる専用プロセッサである。メモリ2に
は1の汎用プロセッサが行う制御プログラム・文字列画
像・文字切り出し位置のデータが既に記憶されていると
する。またメモリ3には専用プロセッサ5から8で実行
できるフォント別の照合プログラムと認識辞書とが記憶
されているとする。
In Fig. 3, 1 is a general-purpose processor that controls character recognition processing, 2 is a memory that stores programs that run the general-purpose processor 1 and data such as character string images and character extraction positions within the reading range, and 3 is a program/character Column image/
Memory 4 stores data such as recognition dictionaries, matching results, feature values, etc. Memory 2 is controlled by the general-purpose processor 1.
This is a memory controller that exchanges data between the memory 3 and the dedicated processors 5 and 8, and between the memory 3 and the dedicated processors 5 and 8. In addition, 5 to 8 are dedicated processors that can be connected to a pipeline. It is assumed that the memory 2 has already stored data on a control program executed by one general-purpose processor, character string images, and character cutting positions. It is also assumed that the memory 3 stores font-specific collation programs and recognition dictionaries that can be executed by the dedicated processors 5 to 8.

本願発明の第一の実施例である第1図の流れ図の処理は
、メモリ2の制御プログラムのもとに汎用プロセッサ1
にて行う。なお、以下の0内の番号は、流れ図の番号に
対応している。
The process of the flowchart in FIG. 1, which is the first embodiment of the present invention, is carried out by the general-purpose processor
It will be held at Note that the numbers within 0 below correspond to the numbers in the flowchart.

まず、照合プログラムのロード開始データをメモリコン
トローラ4に送ると(101)、メモリコントローラ4
はメモリ3にある4フオントの照合プログラムをデータ
として専用プロセッサ5〜8に送る。次に、メモリ2の
一つの文字列画像と文字切り出し位置とのデータをメモ
リコントローラ4を介してメモリ3に転送しく102)
、転送終了データを受は取ると照合開始データをメモリ
コントローラ4に送る(103)。メモリコントローラ
4が照合開始データを専用プロセッサ5〜8に送ると、
専用プロセッサ5〜8では各フォントでの照合処理が実
行され、メモリ3に記憶している各文字画像に対する照
合結果である最小距離値をメモリ3に出力し、指定文字
数文の照合終了後、その終了データがメモリコントロー
ラ4を介して汎用プロセッサ1に返される。照合終了デ
ータを受は取ると、汎用プロセッサ1は、メモリコント
ローラ4を介してメモリ3に記憶されている各文字の照
合結果である各フォントに対する最小距離値を受は取る
(104)、汎用プロセッサ1は、受は取った最小距離
値からフォントごとの平均最小距離値を求め(105)
、最小となる平均最小距離値のフォントを求めるフォン
トと決定する(106)。
First, when the load start data of the verification program is sent to the memory controller 4 (101), the memory controller 4
sends the 4-font collation program stored in the memory 3 as data to dedicated processors 5-8. Next, the data of one character string image and the character cutting position in the memory 2 is transferred to the memory 3 via the memory controller 4 (102).
, after receiving the transfer end data, sends verification start data to the memory controller 4 (103). When the memory controller 4 sends verification start data to the dedicated processors 5 to 8,
The dedicated processors 5 to 8 execute the matching process for each font, output the minimum distance value that is the matching result for each character image stored in the memory 3 to the memory 3, and after finishing matching the specified number of characters, the End data is returned to the general-purpose processor 1 via the memory controller 4. After receiving the matching completion data, the general-purpose processor 1 receives the minimum distance value for each font that is the matching result of each character stored in the memory 3 via the memory controller 4 (104). 1, the receiver calculates the average minimum distance value for each font from the minimum distance value taken (105)
, the font with the smallest average minimum distance value is determined as the desired font (106).

次に、汎用プロセッサ1は、メモリ3にある照合プログ
ラムの内から選択したフォントの照合プログラムのロー
ド開始データをメモリコントローラ4に送る(107)
、メモリコントローラ4はメモリ3に記憶されている照
合プログラム2をデータとして専用プロセッサ5〜8に
送る。さらに、照合開始データをメモリコントローラ4
を介して、専用プロセッサ5〜8までに送るとく108
)、専用プロセッサ5〜8は照合処理プログラムを並列
に実行し、メモリ4に記憶している文字位置の画像に対
する照合結果をメモリ3に出力し、照合終了後、その終
了データがメモリコントローラ4を介して汎用プロセッ
サ1に返される。
Next, the general-purpose processor 1 sends load start data for a font matching program selected from among the matching programs stored in the memory 3 to the memory controller 4 (107).
, the memory controller 4 sends the verification program 2 stored in the memory 3 to the dedicated processors 5 to 8 as data. Furthermore, the verification start data is sent to the memory controller 4.
108 to be sent to dedicated processors 5 to 8 via
), the dedicated processors 5 to 8 execute the matching processing program in parallel, and output the matching result for the image at the character position stored in the memory 4 to the memory 3. After the matching is completed, the finished data is sent to the memory controller 4. is returned to the general-purpose processor 1 via the

照合終了データを受は取ると、汎用プロセッサ4は、メ
モリコントローラ4を介してメモリ3に記憶している照
合結果を受は取る(109)。
Upon receiving the verification completion data, the general-purpose processor 4 receives the verification results stored in the memory 3 via the memory controller 4 (109).

第2図は、本M発明の第二の実施例である文字認識装置
における処理を流れ図で表わしたものである。第2図の
流れ図の処理は、第1図と同様にメモリ2の制御プログ
ラムのもとに汎用プロセッサ1にて行う。
FIG. 2 is a flowchart showing the processing in a character recognition device which is a second embodiment of the present invention. The processing shown in the flowchart of FIG. 2 is performed by the general-purpose processor 1 under the control program of the memory 2, similar to that of FIG.

まず、照合プログラムのロード開始データをメモリコン
トローラ4に送ると(101)、メモリコントローラ4
はメモリ3にある4フオントの照合プログラムをデータ
として専用プロセッサ5〜8に送る。次に、メモリ2の
一つの文字列画像と文字切り出し位置とのデータをメモ
リコントローラ4を介してメモリ3に転送しく102)
、転送終了データを受は取ると照合開始データをメモリ
コントローラ4に送る(103)。メモリコントローラ
4が照合開始データを専用プロセッサ5〜8に送ると、
専用プロセッサ5〜8では各フォントでの照合処理が実
行され、メモリ3に記憶している各文字画像に対する照
合結果である最小距離値をメモリ3に出力し、指定文字
数文の照合終了後、その終了データがメモリコントロー
ラ4を介して汎用プロセッサ1に返される。照合終了デ
ータをを受は取ると、汎用プロセッサ1は、メモリコン
トローラ4を介してメモリ3に記憶されている各文字の
照合結果である各フォントに対する最小距離値を受は取
る(104)。汎用プロセッサ1は、受は取った最小距
離値のカテゴリから特定のカテゴリの最小距離値を除い
てフォントごとの平均最小距離値を求め(105A)=
最小となる平均最小距離値のフォントを求めるフォント
と決定する(106)。
First, when the load start data of the verification program is sent to the memory controller 4 (101), the memory controller 4
sends the 4-font collation program stored in the memory 3 as data to dedicated processors 5-8. Next, the data of one character string image and the character cutting position in the memory 2 is transferred to the memory 3 via the memory controller 4 (102).
, after receiving the transfer end data, sends verification start data to the memory controller 4 (103). When the memory controller 4 sends verification start data to the dedicated processors 5 to 8,
The dedicated processors 5 to 8 execute the matching process for each font, output the minimum distance value that is the matching result for each character image stored in the memory 3 to the memory 3, and after finishing matching the specified number of characters, the End data is returned to the general-purpose processor 1 via the memory controller 4. Upon receiving the verification completion data, the general-purpose processor 1 receives the minimum distance value for each font, which is the verification result of each character stored in the memory 3 via the memory controller 4 (104). The general-purpose processor 1 calculates the average minimum distance value for each font by excluding the minimum distance value of a specific category from the categories of minimum distance values taken (105A) =
The font with the smallest average minimum distance value is determined as the desired font (106).

次に、汎用プロセッサ1は、メモリ3にある照合プログ
ラムの内から選択したフォントの照合プログラムのロー
ド開始データをメモリコントローラ4を送る(107)
。メモリコントローラ4はメモリ3に記憶されている照
合プログラム2をデ−夕として専用プロセッサ5〜8に
送る。さらに、照合開始データをメモリコントローラ4
を介して、専用プロセッサ5〜8までに送ると(108
)、専用プロセッサ5〜8は照合処理プログラムを並列
に実行し、メモリ4に記憶している文字位置の画像に対
する照合結果をメモリ3に出力し、照合終了後、その終
了データがメモリコントローラ4を介して汎用プロセッ
サ1に返される。
Next, the general-purpose processor 1 sends load start data for a font matching program selected from among the matching programs in the memory 3 to the memory controller 4 (107).
. The memory controller 4 sends the collation program 2 stored in the memory 3 to dedicated processors 5-8 as data. Furthermore, the verification start data is sent to the memory controller 4.
When sent to dedicated processors 5 to 8 via (108
), the dedicated processors 5 to 8 execute the matching processing program in parallel, and output the matching result for the image at the character position stored in the memory 4 to the memory 3. After the matching is completed, the finished data is sent to the memory controller 4. is returned to the general-purpose processor 1 via the

照合終了データを受は取ると、汎用プロセッサ1は、メ
モリコントローラ4を介してメモリ3に記憶している照
合結果を受は取る(109)。
Upon receiving the verification completion data, the general-purpose processor 1 receives the verification results stored in the memory 3 via the memory controller 4 (109).

本願発明は、読み取り可能なフォントは4フオントに限
定されるものではなく、専用プロセッサで行なう照合プ
ログラムを順次入れ換えることで、より多フォントに対
応でき、また専用プロセッサはプログラマブルな信号処
理プロセッサ等を使って行うこともできる。
The present invention is capable of handling a larger number of fonts by sequentially replacing the collation program executed by a dedicated processor, and the readable fonts are not limited to 4 fonts. You can also do it by

〔発明の効果〕〔Effect of the invention〕

以上説明したように本願発明によれば、フォント決定に
はシングルフォント辞書での照合結果を使うので、フォ
ント判定用の特殊な特徴が不用であり、フォント選択後
は判別分析法によるシングルフォント認識で読み取りを
行なうので辞書作成が簡単になるという効果がある。
As explained above, according to the present invention, the results of matching with a single font dictionary are used for font determination, so special features for font determination are not required, and after font selection, single font recognition using discriminant analysis is performed. Since reading is performed, it has the effect of simplifying dictionary creation.

【図面の簡単な説明】[Brief explanation of the drawing]

? 第1図の第2図とはそれぞれ本願発明の複数フォント文
字認識装置の第一および第二の実施例での処理を説明す
る流れ図、第3図は本願発明を説明するためのマルチフ
ォント文字認識装置の一例を示すブロック図、第4図は
あるフォントのデータに対するフォントが同じ場合と異
なる場合との照合結果であるカテゴリ別の最小距離値の
分布の一例である。 1・・・汎用プロセッサ、2・3・・・メモリ、4・・
・メモリコントローラ、5〜8・・・専用プロセッサ。
? 1 and 2 are flowcharts for explaining the processing in the first and second embodiments of the multi-font character recognition device of the present invention, respectively, and FIG. 3 is a multi-font character recognition for explaining the present invention. FIG. 4, a block diagram showing an example of the apparatus, is an example of the distribution of minimum distance values by category, which is the result of matching data of a certain font with the same font and with different fonts. 1...General-purpose processor, 2.3...Memory, 4...
-Memory controller, 5 to 8...dedicated processor.

Claims (3)

【特許請求の範囲】[Claims] (1)複数のプロセッサとフォント別の認識辞書とを備
えた文字認識装置において、まづ読み取り範囲内の数文
字分の入力文字画像に対する各フォントの認識辞書での
距離値による整合処理を複数個の判定用プロセッサで行
い、制御用プロセッサでは前記数文字分の最小距離値の
平均値を計算し各フォントでの平均値の比較により値の
最小となるフォントを選ぶフォント決定を行い、次に選
択したフォントの認識辞書での読み取り範囲内の文字画
像に対する整合処理を複数個の判定用プロセッサで並列
に行うことを備えて成ることを特徴とする複数フォント
文字認識装置。
(1) In a character recognition device equipped with multiple processors and recognition dictionaries for each font, first, multiple matching processes are performed using distance values in the recognition dictionary for each font for input character images of several characters within the reading range. The control processor calculates the average value of the minimum distance values for the several characters, compares the average values for each font, selects the font with the minimum value, and then selects the font. 1. A multi-font character recognition device, characterized in that a plurality of determination processors perform matching processing for character images within a reading range of a font recognition dictionary in parallel.
(2)複数のプロセッサとフォント別の認識辞書とを備
えた文字認識装置において、まず読み取り範囲内の数文
字分の入力文字画像に対する各フォントの認識辞書での
距離値による整合処理を複数個の判定用プロセッサで行
い、制御用プロセッサでは前記数文字分の判定結果のう
ちで特定カテゴリ以外の最小距離値の平均値を計算し各
フォントでの平均値の比較により値の最小となるフォン
トを選ぶフォント決定を行い、次に選択したフォントの
認識辞書での読み取り範囲内の文字画像に対する整合処
理を複数個の判定用プロセッサで並列に行うことを備え
て成ることを特徴とする複数フォント文字認識装置。
(2) In a character recognition device equipped with multiple processors and recognition dictionaries for each font, first, a matching process is performed using distance values in the recognition dictionary for each font for input character images of several characters within the reading range. This is done by the judgment processor, and the control processor calculates the average value of the minimum distance values other than the specific category among the judgment results for the several characters, and selects the font with the minimum value by comparing the average values of each font. A multi-font character recognition device characterized by determining a font and then performing matching processing for character images within a reading range in a recognition dictionary of the selected font in parallel using a plurality of determination processors. .
(3)文字画像のリサンプリング点におけるガウス形フ
ィルタで検出して並べた初期ベクトルを線形判別分析に
よる特徴変換で変換し得られる特徴ベクトルを整合処理
に用いた特許請求の範囲第1項または第2項記載の複数
フォント文字認識装置。
(3) Claims 1 or 3, in which feature vectors obtained by converting initial vectors detected and arranged using a Gaussian filter at resampling points of a character image by feature conversion using linear discriminant analysis are used for matching processing. The multi-font character recognition device according to item 2.
JP63004168A 1988-01-11 1988-01-11 Device for recognizing character of plural font Pending JPH01180083A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63004168A JPH01180083A (en) 1988-01-11 1988-01-11 Device for recognizing character of plural font

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63004168A JPH01180083A (en) 1988-01-11 1988-01-11 Device for recognizing character of plural font

Publications (1)

Publication Number Publication Date
JPH01180083A true JPH01180083A (en) 1989-07-18

Family

ID=11577208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63004168A Pending JPH01180083A (en) 1988-01-11 1988-01-11 Device for recognizing character of plural font

Country Status (1)

Country Link
JP (1) JPH01180083A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0582490A2 (en) * 1992-08-07 1994-02-09 R.R. DONNELLEY & SONS COMPANY Converting bitmap data into page definition language commands

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0582490A2 (en) * 1992-08-07 1994-02-09 R.R. DONNELLEY & SONS COMPANY Converting bitmap data into page definition language commands
EP0582490A3 (en) * 1992-08-07 1995-02-15 Donnelley & Sons Co Converting bitmap data into page definition language commands.
US5659638A (en) * 1992-08-07 1997-08-19 R. R. Donnelley & Sons Company Method and system for converting bitmap data into page definition language commands

Similar Documents

Publication Publication Date Title
WO2020015076A1 (en) Facial image comparison method and apparatus, computer device, and storage medium
JP3155577B2 (en) Character recognition method and device
EP0539749B1 (en) Handwriting recognition system and method
US6556712B1 (en) Methods and apparatus for handwriting recognition
US5675665A (en) System and method for word recognition using size and placement models
Khan et al. Urdu character recognition using principal component analysis
US5920644A (en) Apparatus and method of recognizing pattern through feature selection by projecting feature vector on partial eigenspace
JP3761937B2 (en) Pattern recognition method and apparatus, and computer control apparatus
CN116225956A (en) Automated testing method, apparatus, computer device and storage medium
JPH01180083A (en) Device for recognizing character of plural font
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
JPH01321591A (en) Character recognizing device
Khan et al. Isolated handwritten pashto characters recognition using KNN classifier
Shao et al. An NMF-based method for the fingerprint orientation field estimation
JP2590414B2 (en) Fuzzy pattern recognition method
JPH06251156A (en) Pattern recognizing device
JP3754118B2 (en) Pattern recognition apparatus and pattern recognition method
JP3280577B2 (en) Character recognition device
JPH09179935A (en) Character recognition device and control method therefor
Yasin et al. A Comparative Analysis on Nastaliq Style Urdu Character Recognition
JPH0540852A (en) Pattern recognizing device
JP3760040B2 (en) Character recognition method, character recognition device, and information recording medium
JP2001118073A (en) Device and method for recognizing pattern
JP2013246721A (en) Character string recognition device, character string recognition program, and storage medium
JPS62257583A (en) Character recognizing system