JPH09190496A - Device for recognizing character and its method - Google Patents

Device for recognizing character and its method

Info

Publication number
JPH09190496A
JPH09190496A JP8002925A JP292596A JPH09190496A JP H09190496 A JPH09190496 A JP H09190496A JP 8002925 A JP8002925 A JP 8002925A JP 292596 A JP292596 A JP 292596A JP H09190496 A JPH09190496 A JP H09190496A
Authority
JP
Japan
Prior art keywords
vector
color
input
definition
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8002925A
Other languages
Japanese (ja)
Other versions
JP2871570B2 (en
Inventor
Shinji Sase
慎治 佐瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8002925A priority Critical patent/JP2871570B2/en
Publication of JPH09190496A publication Critical patent/JPH09190496A/en
Application granted granted Critical
Publication of JP2871570B2 publication Critical patent/JP2871570B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve the free degree of slip design and the versatility of a character recognizing device. SOLUTION: A picture input part 201 outputs the respective picture elements of a color picture in an inputted slip as three-dimensional input vectors which are expressed by the respective level values of red, green and blue. A slip definision setting part 203 outputs a definition vector which orthogonally crosses with a printing color vector expressed by the respective level values of red, green and blue, which indicate drop-out color in the slip. Then, a gray picture generating part operates the inner product of the definition vector and the input vector for every picture element so as to generate a dropped-out gray picture. A character or a sign, etc., in the slip is recognized based on the gray picture.

Description

【発明の詳細な説明】Detailed Description of the Invention

【発明の属する技術分野】本発明は、光学的に文字を読
み取る文字認識装置およびその方法に関し、特に任意の
色で印刷された帳票上に記入あるいは印刷された文字を
読み取る文字認識装置およびその方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device and method for optically reading characters, and more particularly to a character recognition device and method for reading characters printed or printed on a form printed in an arbitrary color. Regarding

【0001】[0001]

【従来の技術】従来、帳票の読取効率および読取精度を
向上させるために、ドロップアウトカラーで印刷された
帳票上の文字を読み取る文字認識装置が提案されてい
る。しかしながら、ドロップアウトカラーは、予め定め
られた単色、一般的には、赤系の色であるため、他の印
刷色を有する帳票を適用する場合や、新たに帳票を設計
する際に、大きく制限されることになり、ドロップアウ
トカラーの利用が、帳票設計の自由度および文字認識装
置の汎用性を狭める大きな原因となっている。例えば、
現在、広く用いられている流通系の複写伝票では、その
印刷色が、1枚目から順に、青、緑黄、灰、茶である
が、これらの帳票を1台の文字認識装置で取り扱うこと
は非常に困難である。
2. Description of the Related Art Heretofore, in order to improve reading efficiency and reading accuracy of a form, a character recognition device for reading characters on a form printed in dropout color has been proposed. However, since the dropout color is a predetermined single color, generally a red color, there is a large limitation when applying a form with another printing color or when designing a new form. Therefore, the use of the dropout color is a major cause of narrowing the flexibility of the form design and the versatility of the character recognition device. For example,
Currently, the printing colors of widely used copy slips are blue, green yellow, gray, and brown in order from the first sheet, but these forms should be handled by a single character recognition device. Is very difficult.

【0002】そのような技術背景に基づき、様々な印刷
色の帳票を文字認識装置に適用するための方法が、従来
から数多く提案されている。
Based on such a technical background, a number of methods for applying forms of various printing colors to a character recognition device have been conventionally proposed.

【0003】第1の方法は、帳票の印刷色をドロップア
ウトすることなく、すなわち、ドロップアウトカラーで
印刷された帳票の特徴を利用することなく、入力された
全体画像に対し、文字切出し処理の際に、印刷色による
枠等を取り除く方法である。しかしながら、この方法で
は、枠と文字が重なった場合に、これらを高精度に分離
することは困難であり、結果として、認識率を向上させ
ることはできない。
The first method is to perform character cutout processing on an input entire image without dropping out the print color of the form, that is, without utilizing the characteristics of the form printed in the dropout color. At this time, it is a method of removing a frame or the like depending on the print color. However, with this method, when the frame and the character overlap, it is difficult to separate them with high accuracy, and as a result, the recognition rate cannot be improved.

【0004】また、第2の方法は、カラーフィルタ等を
複数設け、複数の印刷色をドロップアウトする方法であ
る。この方法においても、複数のカラーフィルタにより
ドロップアウト可能な印刷色の帳票にしか対応できず、
依然として、適用可能な印刷色に制限がある。さらに、
ドロップアウトカラーを増加させるためには、より多く
のカラーフィルタ等を設置する必要があり、装置が高価
かつ大型になってしまう。
The second method is a method in which a plurality of color filters are provided and a plurality of print colors are dropped out. Even with this method, it is possible to handle only print color forms that can be dropped out using multiple color filters.
Still, there are limits to the print colors that can be applied. further,
In order to increase the dropout color, it is necessary to install more color filters and the like, which makes the device expensive and large.

【0005】さらに、第3の方法は、特開平5−283
14号公報に開示されているように、赤・緑・青の3枚
の画像を作成し、作成された画像に対し個々に文字切出
し処理を行った後、切り出された3つの画像からドロッ
プアウトカラーによって必要な画像を取捨選択する方法
である。この方法においても、ドロップアウトカラー
は、赤系、緑系および青系に限られており、例えば、こ
れらの中間色をドロップアウトカラーとすることはでき
ない。
Further, the third method is disclosed in Japanese Patent Laid-Open No. 5-283.
As disclosed in Japanese Patent Publication No. 14, gazettes, three images of red, green, and blue are created, and character cutting processing is individually performed on the created images, and then dropout is performed from the cut three images. This is a method of selecting necessary images according to color. Also in this method, the dropout color is limited to red, green, and bluish colors, and for example, an intermediate color between them cannot be a dropout color.

【0006】[0006]

【発明が解決しようとする課題】従来の文字認識装置で
は、ドロップアウトカラーの指定色に制限があり、装置
自体の汎用性および帳票設計の自由度が限られたものと
なっている。さらに、ドロップアウトカラーの指定色を
増加させることにより、装置が高価になるとともに、大
型化してしまうという問題点もある。
In the conventional character recognition device, the specified color of the dropout color is limited, and the versatility of the device itself and the degree of freedom in designing the form are limited. Further, there is a problem that the device becomes expensive and becomes large in size by increasing the designated color of the dropout color.

【0007】[0007]

【課題を解決するための手段】上記問題点を解決するた
めに、本発明の文字認識装置は、入力される読取対象の
カラー画像の各画素を3原色それぞれのレベル値で表さ
れる3次元の入力ベクトルとして出力し、所定色を示す
3原色それぞれのレベル値で表される3次元ベクトルと
直交する定義ベクトルと入力ベクトルとの内積を1画素
毎にとることによって、カラー画像中の所定色を除去す
るものである。
In order to solve the above problems, the character recognition apparatus of the present invention is a three-dimensional type in which each pixel of an input color image to be read is represented by a level value of each of three primary colors. Output as an input vector of the predetermined color, and the inner product of the input vector and the definition vector orthogonal to the three-dimensional vector represented by the level value of each of the three primary colors indicating the predetermined color Is to be removed.

【0008】[0008]

【発明の実施の形態】次に、本発明の第1の実施形態に
ついて図面を参照して詳細に説明する。
Next, a first embodiment of the present invention will be described in detail with reference to the drawings.

【0009】本発明の第1の実施形態は、3原色の各色
毎のレベル値により示される3次元ベクトルを、入力帳
票の画像に対し、1画素毎に得る。一方、帳票上のドロ
ップアウトしたい印刷色に応じて所定のベクトルを予め
登録しておく。この所定のベクトルは、ドロップアウト
したい印刷色を示す3原色の濃度レベル値により示され
る3次元ベクトルと内積をとると0を出力するような、
すなわちドロップアウト印刷色を示す3次元ベクトルと
垂直な3次元ベクトルである。そして、入力されたベク
トルと予め登録された所定のベクトルとの内積を1画素
毎に算出することによって、印刷色をドロップアウト
し、他の色成分で記載された文字等を抽出するものであ
る。
In the first embodiment of the present invention, a three-dimensional vector indicated by the level value of each of the three primary colors is obtained for each pixel in the image of the input form. On the other hand, a predetermined vector is registered in advance according to the print color desired to be dropped out on the form. This predetermined vector outputs 0 when the dot product is taken with the three-dimensional vector indicated by the density level values of the three primary colors indicating the print color to be dropped out,
That is, it is a three-dimensional vector perpendicular to the three-dimensional vector indicating the dropout print color. Then, by calculating the inner product of the input vector and the predetermined vector registered in advance for each pixel, the print color is dropped out, and the characters and the like described in other color components are extracted. .

【0010】まず、図1を参照して、本実施形態の原理
について説明する。
First, the principle of the present embodiment will be described with reference to FIG.

【0011】赤(R)・緑(G)・青(B)の表現によ
るカラー画像は、通常、RGB3次元上のベクトルとし
て表される。図1中、文字色ベクトル101は、読取対
象を走査することによって得られるカラー画像のうち認
識対象である文字等に相当する画素の色成分を示すRG
Bの3次元ベクトルである。また、印刷色ベクトル10
2は、カラー画像のうちドロップアウトカラーの画素の
色成分をRGBの3次元ベクトルである。ここで、定義
ベクトル103は、印刷色ベクトル102と直交するR
GB3次元上のベクトルとして定義される。なお、図1
中の各軸は、各色成分の濃度レベルの大きさを示すもの
である。
A color image represented by red (R), green (G), and blue (B) is usually represented as a vector in three-dimensional RGB. In FIG. 1, a character color vector 101 is an RG indicating a color component of a pixel corresponding to a character or the like to be recognized in a color image obtained by scanning the reading target.
It is a three-dimensional vector of B. Also, the print color vector 10
Reference numeral 2 is a RGB three-dimensional vector representing the color components of the dropout color pixels in the color image. Here, the definition vector 103 is R which is orthogonal to the print color vector 102.
It is defined as a vector on the GB three dimensions. FIG.
Each axis in the figure shows the magnitude of the density level of each color component.

【0012】そして、読取対象を走査することによって
得られるカラー画像の各画素の色成分を示す3次元ベク
トルと定義ベクトル103との内積をとると、ドロップ
アウトカラーの画素との内積出力は0となり、一方、文
字画素との内積出力は所定のスカラー値となる。したが
って、入力カラー画像の個々の画素と定義ベクトル10
3との内積演算を行うことによって、ドロップアウトと
同様の効果を得ることができる。
Then, when the inner product of the three-dimensional vector indicating the color component of each pixel of the color image obtained by scanning the object to be read and the definition vector 103 is calculated, the inner product output of the pixel of the dropout color becomes 0. On the other hand, the inner product output with the character pixel has a predetermined scalar value. Therefore, each pixel of the input color image and the definition vector 10
By performing the inner product calculation with 3, the same effect as the dropout can be obtained.

【0013】ところで、3次元空間では、任意の色成分
を示すベクトルに対する垂直なベクトルは、面を構成す
るため、この条件だけでは、定義ベクトル103を一意
に定めることはできない。そこで、本実施形態では、定
義ベクトル103を、印刷色ベクトル102と直交する
ベクトルのうち、文字色ベクトル101との内積が最大
となるようなベクトルとして定義している。こうするこ
とにより、読取対象における文字色とドロップアウトカ
ラーの差異が最も明確になる。
By the way, in the three-dimensional space, a vector perpendicular to a vector indicating an arbitrary color component constitutes a surface, and therefore the definition vector 103 cannot be uniquely determined only by this condition. Therefore, in the present embodiment, the definition vector 103 is defined as a vector having a maximum inner product with the character color vector 101 among the vectors orthogonal to the print color vector 102. By doing so, the difference between the character color and the dropout color in the read object becomes the most clear.

【0014】実際には、ドロップアウトしたい色と読み
取るべき色に基づいて、およその定義ベクトル103を
作成し、実験により微調整を施して最適な定義ベクトル
103を作成する。
In practice, an approximate definition vector 103 is created on the basis of the color to be dropped out and the color to be read, and the optimum definition vector 103 is created by fine adjustment through experiments.

【0015】この定義ベクトル103は、ドロップアウ
トしたい色および読み取るべき色の組合せに応じて、そ
れぞれ最適なベクトルが予め記憶手段に登録されてい
る。そして、実際の認識処理の際に、ドロップアウトカ
ラーおよび読取対象カラーに基づいて、登録された複数
の定義ベクトル103の中から検索された最適な定義ベ
クトル103が、前述の内積演算に用いられる。
As the definition vector 103, optimum vectors are registered in advance in the storage means in accordance with the combination of the color desired to be dropped out and the color to be read. Then, in the actual recognition process, the optimum definition vector 103 retrieved from the plurality of registered definition vectors 103 based on the dropout color and the color to be read is used for the above inner product calculation.

【0016】図2は、本発明の第1の実施形態の構成を
示すブロック図であり、画像入力部201は、読取対象
である帳票等を光学的に走査してカラー画像を赤(R)
・緑(G)・青(B)それぞれの多値デジタル画像とし
て得るものである。このカラー画像の各画素は、通常、
RGBの3次元上のベクトルとして表される。ここで、
前述と同様に、読み取るべき対象を構成する画素を示す
ベクトルを文字色ベクトル101とし、ドロップアウト
したい色画素を示すベクトルを印刷色ベクトル102と
する。カラー画像は、市販の汎用カラースキャナで得ら
れるレベルでよく、また、画素の分解能は、読取対象文
字の大きさに合わせて適宜選択すればよい。各画素の多
値情報は、各色それぞれ6bit程度あれば本実施形態
を実現可能である。
FIG. 2 is a block diagram showing the configuration of the first embodiment of the present invention, in which the image input unit 201 optically scans a form or the like to be read to obtain a red (R) color image.
It is obtained as a multi-valued digital image of each of green (G) and blue (B). Each pixel of this color image is usually
It is represented as a three-dimensional vector of RGB. here,
Similarly to the above, the vector indicating the pixel forming the target to be read is the character color vector 101, and the vector indicating the color pixel to be dropped out is the print color vector 102. The color image may be at a level obtained by a commercially available general-purpose color scanner, and the pixel resolution may be appropriately selected according to the size of the character to be read. The present embodiment can be realized if the multi-valued information of each pixel is about 6 bits for each color.

【0017】帳票定義設定部203は、読取対象に印刷
されたドロップアウト色に対応させるように所定のベク
トル、すなわち前述の定義ベクトル103が登録された
格納手段を備える。図3は、格納手段に登録された定義
ベクトル103の格納形式を示す図であり、印刷色、す
なわちドロップアウトカラーと文字色との組合せに応じ
て最適な定義ベクトル103が登録されている。さら
に、帳票定義設定部203は、帳票上のドロップアウト
したい印刷色および読み取るべき文字色を設定入力する
手段を備える。そして、設定入力された印刷色および文
字色に基づいて、最適な定義ベクトル103を格納手段
から検索し出力する。
The form definition setting unit 203 includes a storage unit in which a predetermined vector, that is, the above-described definition vector 103 is registered so as to correspond to the dropout color printed on the reading target. FIG. 3 is a diagram showing a storage format of the definition vector 103 registered in the storage means, in which the optimum definition vector 103 is registered according to the combination of the print color, that is, the dropout color and the character color. Further, the form definition setting unit 203 includes means for setting and inputting a print color to be dropped out and a character color to be read on the form. Then, the optimum definition vector 103 is retrieved from the storage means and output based on the print color and the character color that have been set and input.

【0018】グレー画像作成部202は、画像入力部2
01から出力されるカラー画像の各画素を示す入力ベク
トルと帳票定義設定部203から出力される定義ベクト
ル103との内積を、1画素毎に算出する。すなわち、
印刷色ベクトル102によって示される画素に対しては
0が内積結果として出力され、文字色ベクトル101に
よって示される画素に対しては所定のスカラー値が内積
結果として出力される。そして、内積出力で示される各
画素により構成されるグレー画像を作成する。
The gray image creating unit 202 includes an image input unit 2
The inner product of the input vector indicating each pixel of the color image output from 01 and the definition vector 103 output from the form definition setting unit 203 is calculated for each pixel. That is,
0 is output as the inner product result for the pixel indicated by the print color vector 102, and a predetermined scalar value is output as the inner product result for the pixel indicated by the character color vector 101. Then, a gray image composed of each pixel indicated by the inner product output is created.

【0019】2値化部204は、グレー画像に対し、所
定の閾値を用いて2値化処理を施し、白黒の2値画像を
得る。切出部205は、2値化部204により得られた
2値画像に対し、読み取るべき文字を1文字毎に切り出
す切出し処理を行う。認識部206は、1文字毎に切り
出された文字画像を認識する。ここで、2値化部20
4、切出部205および認識部206に関しては、従来
から多くの手法が提案されており、しかも、本実施形態
において、特に、その手法を限定する必要もないことか
ら、その詳細な説明は省略する。
The binarizing unit 204 binarizes the gray image using a predetermined threshold value to obtain a black and white binary image. The cutout unit 205 performs a cutout process on the binary image obtained by the binarization unit 204 to cut out a character to be read for each character. The recognition unit 206 recognizes the character image cut out for each character. Here, the binarization unit 20
4. Regarding the cutout unit 205 and the recognition unit 206, many techniques have been proposed in the past, and further, in the present embodiment, there is no particular need to limit the techniques, and therefore detailed description thereof is omitted. To do.

【0020】次に、本実施形態の動作について詳細に説
明する。
Next, the operation of this embodiment will be described in detail.

【0021】画像入力部201により、読取対象が光学
的に走査され、画素毎に、赤・緑・青の多値デジタル情
報が3次元入力ベクトルとして生成される。一方、帳票
定義設定部203には、予め定義ベクトル103が登録
されている。そして、読取対象上のドロップアウトカラ
ー(印刷色)および文字色とを設定入力することによっ
て、帳票定義設定部203から、所定の定義ベクトル1
03が出力される。
The image input unit 201 optically scans the object to be read, and multivalued digital information of red, green, and blue is generated as a three-dimensional input vector for each pixel. On the other hand, the definition vector 103 is registered in advance in the form definition setting unit 203. Then, by setting and inputting the dropout color (printing color) and the character color on the reading target, the predetermined definition vector 1 is set from the form definition setting unit 203.
03 is output.

【0022】グレー画像作成部202では、画像入力部
201から出力される入力ベクトルと帳票定義設定部2
03から出力される定義ベクトル103との内積が1画
素毎に演算され、その内積出力からなるグレー画像が生
成される。
In the gray image creating unit 202, the input vector output from the image input unit 201 and the form definition setting unit 2
The inner product with the definition vector 103 output from No. 03 is calculated for each pixel, and a gray image formed from the inner product output is generated.

【0023】具体的には、画像入力部201から出力さ
れるカラー画像のi番目の画素の赤出力をRi、緑出力
をGi、青出力をBiとし、帳票定義設定部203から
出力される定義ベクトル103を(rn,gn,bn
(n=1、2、3・・・)とすると、グレー画像作成部
202で生成されるグレー画像のi番目の画素のスカラ
ー値Miは、 Mi=(Ri・rn+Gi・gn+Bi・bn)/N として算出される。ここで、Nは、定義ベクトル103
の大きさを示すものであり、グレー画像作成部202で
内積演算される前に算出される。なお、この定義ベクト
ル103の大きさNは、帳票定義設定部203内の格納
手段に定義ベクトル103に対応させて予め登録してお
いてもよい。
More specifically, the definition output from the form definition setting unit 203 is Ri, where the red output of the i-th pixel of the color image output from the image input unit 201 is Ri, the green output is Gi, and the blue output is Bi. Let the vector 103 be (r n , g n , b n )
When (n = 1,2,3 ···), the scalar value Mi of the i-th pixel of the gray image generated by the gray image creation section 202, Mi = (Ri · r n + Gi · g n + Bi · It is calculated as b n ) / N. Here, N is the definition vector 103
Is calculated before the inner product is calculated in the gray image creating unit 202. The size N of the definition vector 103 may be registered in advance in the storage means in the form definition setting unit 203 in association with the definition vector 103.

【0024】グレー画像作成部202で生成されたグレ
ー画像は、メモリやハードディスク等の記憶媒体上に保
持され、2値化部204では、このグレー画像に対し2
値化処理が施される。この2値化画像に対して、切出部
205による文字切出処理および認識部206による文
字認識処理が行われる。なお、2値化処理、文字切出処
理および文字認識処理に関しては、従来から多くの手法
が提案されており、本実施形態では、これらの公知の技
術を適用することが可能であることから、この処理に関
する詳細な説明は省略する。なお、本実施形態で、様々
な従来手法の適用と可能とした要因として、グレー画像
の画素のスカラー値が、通常の文字認識装置における直
接の濃淡画像入力値と同等の性質を有していることが挙
げられる。
The gray image generated by the gray image creating unit 202 is held on a storage medium such as a memory or a hard disk, and the binarization unit 204 outputs 2 to the gray image.
Value conversion processing is performed. The character cutting process by the cutting unit 205 and the character recognition process by the recognition unit 206 are performed on the binarized image. It should be noted that many techniques have been conventionally proposed for the binarization process, the character cutting process, and the character recognition process, and these known techniques can be applied in the present embodiment. Detailed description of this process is omitted. In the present embodiment, as a factor that makes it possible to apply various conventional methods, the scalar value of the pixel of the gray image has the same property as the direct grayscale image input value in a normal character recognition device. It can be mentioned.

【0025】なお、本実施形態では、帳票上のドロップ
アウトカラーおよび文字色を予め設定入力することによ
って一意的に定義される定義ベクトル103を用いてい
るが、定義ベクトル103はドロップアウトカラーを示
すベクトルと直交してさえいれば、ドロップアウトカラ
ーを除去することができる。したがって、定義ベクトル
103としてドロップアウトカラーを示すベクトルと直
交する任意のベクトルを予め登録しておくように構成し
てもかまわない。その場合には、帳票を読み取る前にド
ロップアウトカラーを設定入力するだけで、所望の定義
ベクトル103を検索することが可能となる。
In the present embodiment, the definition vector 103 uniquely defined by preset inputting the dropout color and the character color on the form is used, but the definition vector 103 indicates the dropout color. Dropout colors can be removed as long as they are orthogonal to the vector. Therefore, an arbitrary vector orthogonal to the vector indicating the dropout color may be registered as the definition vector 103 in advance. In that case, it is possible to search for the desired definition vector 103 simply by setting and inputting the dropout color before reading the form.

【0026】また、本実施形態では、帳票上のドロップ
アウトカラーおよび文字色を設定入力するように構成さ
れているが、色自体を設定入力する構成では、利用者に
とって、微妙に異なる色を区別して設定入力することは
困難である。しかしながら、帳票の印刷色は、通常、印
刷会社毎に予め決められており、しかも、その印刷色に
は所定のカラーコードが付与されている。また、文字色
についても、ボールペン・鉛筆等の色や、複写帳票の2
枚目以降の青系のインク色等に限られており、それらに
も予めカラーコードを付与しておく。そして、帳票定義
設定部203内の格納手段には、図4に示すように、印
刷色のカラーコードと文字色のカラーコードとの組合せ
毎に所望の定義ベクトル103を登録することによっ
て、利用者は、予め定義されたカラーコードを設定入力
するだけで、本実施形態を動作させることが可能とな
る。なお、このカラーコードは、印刷会社毎に独自に設
定されているケースがある。そのような場合には、図4
に示す格納手段を印刷会社毎に用意し、利用者が、カラ
ーコードだけでなく、まず、印刷会社コードを設定入力
するようにすれば、印刷会社毎に対応した所望の定義ベ
クトル103を出力することが可能となり、さらに、操
作性が向上する。
Further, in the present embodiment, the dropout color and the character color on the form are set and input. However, in the configuration in which the color itself is set and input, the user can distinguish a subtly different color. It is difficult to set and enter separately. However, the printing color of the form is usually predetermined for each printing company, and the printing color is given a predetermined color code. Also, regarding the character color, the color of ballpoint pens, pencils, etc.
It is limited to the blue-based ink colors and the like after the first sheet, and a color code is also given to them in advance. Then, as shown in FIG. 4, the desired definition vector 103 is registered in the storage means in the form definition setting unit 203 for each combination of the color code of the print color and the color code of the character color, so that the user Can operate the present embodiment only by setting and inputting a predefined color code. The color code may be set uniquely for each printing company. In such a case, FIG.
If the storage means shown in is prepared for each printing company and the user sets and inputs not only the color code but also the printing company code, the desired definition vector 103 corresponding to each printing company is output. This makes it possible to improve the operability.

【0027】また、本実施形態では、グレー画像を算出
するための演算式中に、定義ベクトル103の大きさN
による除算が含まれているが、定義ベクトル103の大
きさNは、様々な値をとるため、演算が複雑になってし
まう場合がある。そこで、定義ベクトル103を、その
大きさが所望の値になるように、変換した後、内積演算
を行うことにより、この演算の処理時間を短縮すること
ができる。
In this embodiment, the size N of the definition vector 103 is included in the arithmetic expression for calculating the gray image.
However, since the size N of the definition vector 103 takes various values, the calculation may be complicated. Therefore, by converting the definition vector 103 so that its magnitude becomes a desired value, and then performing the inner product operation, the processing time of this operation can be shortened.

【0028】すなわち、前述の定義ベクトル103(r
n,gn,bn)を、次式を用いて、大きさN’のベクト
ル(rn’,gn’,bn’)に変換する。
That is, the definition vector 103 (r
n , g n , b n ) is converted into a vector (r n ', g n ', b n ') of size N'using the following equation.

【0029】rn’=(N’/N)・rnn’=(N’/N)・gnn’=(N’/N)・bn この変換された定義ベクトル103を用いると、グレー
画像のi番目の画素のスカラー値Miは、 Mi=(Ri・rn+Gi・gn+Bi・bn)/N’ により算出される。ここで、N’は、一定値であるた
め、演算処理が効率化される。さらに、入力ベクトルを
構成するRi,Gi,Biや定義ベクトル103を構成
するrn,gn,bnを8bitのデータとし、このN’
を216=65536とすると、2進数演算においては実
際に除算を実施する必要はなく、分母の下位16bit
を切り捨てることにより、Miを算出することができ
る。したがって、演算処理速度の向上やハードウェア規
模の節減が可能となる。
[0029] The r n '= (N' / N) · r n g n '= (N' / N) · g n b n '= (N' / N) · b n defined vector 103 this conversion using the scalar values Mi for the i-th pixel of the gray image is calculated by Mi = (Ri · r n + Gi · g n + Bi · b n) / n '. Here, since N ′ is a constant value, the calculation processing is made efficient. Further, Ri, Gi, Bi forming the input vector and r n , g n , b n forming the definition vector 103 are set as 8-bit data, and this N '
Is 2 16 = 65536, it is not necessary to actually perform division in the binary number operation, and the lower 16 bits of the denominator are
Mi can be calculated by rounding down. Therefore, it is possible to improve the calculation processing speed and reduce the hardware scale.

【0030】次に、本発明の第2の実施形態について図
5を参照して説明する。
Next, a second embodiment of the present invention will be described with reference to FIG.

【0031】本実施形態は、帳票の印刷色および文字色
を利用者が予め設定入力するのではなく、画像入力部2
01から出力されるカラー画像のうち、帳票上の所定の
エリア部分のカラー画像を構成する画素を示すRGBベ
クトルに基づいて、定義ベクトル103を算出あるいは
検索し、その定義ベクトル103を用いてグレー画像を
作成するものである。
In this embodiment, the user does not preset and input the print color and the character color of the form, but the image input unit 2
Of the color images output from 01, the definition vector 103 is calculated or searched based on the RGB vector indicating the pixels forming the color image of the predetermined area portion on the form, and the gray image is calculated using the definition vector 103. Is to create.

【0032】図5を参照すると、画像入力部201で得
られるカラー画像が、グレー画像作成部202だけでな
く、帳票定義設定部501に出力されている。帳票定義
設定部501では、帳票上の所定のエリア部分のカラー
画像を構成する画素を示すRGBベクトルに基づいて、
所望の定義ベクトル103をグレー画像作成部202に
出力する。なお、それ以外の点に関しては、前述の第1
の実施形態と同様の構成であるため、説明は省略する。
Referring to FIG. 5, the color image obtained by the image input unit 201 is output not only to the gray image creating unit 202 but also to the form definition setting unit 501. In the form definition setting unit 501, based on the RGB vector indicating the pixels forming the color image of the predetermined area portion on the form,
The desired definition vector 103 is output to the gray image creating unit 202. Regarding the other points, the above-mentioned first
Since the configuration is similar to that of the above embodiment, the description thereof will be omitted.

【0033】帳票には、予め定義ベクトル103を決定
するためのエリアが設けられる。そのエリアには、少な
くともドロップアウトカラーで所定のマークが印刷され
ている。帳票定義設定部501では、画像入力部201
から出力されるカラー画像のうちこのエリアの画像を構
成する画素を示すRGBベクトルを抽出する。さらに、
このRGBベクトルと直交するような任意のベクトルす
なわち定義ベクトル103を算出し、グレー画像作成部
202に出力する。
The form has an area for determining the definition vector 103 in advance. A predetermined mark is printed in the area in at least a dropout color. In the form definition setting unit 501, the image input unit 201
The RGB vector indicating the pixels forming the image of this area is extracted from the color image output from. further,
An arbitrary vector that is orthogonal to the RGB vector, that is, the definition vector 103 is calculated and output to the gray image creating unit 202.

【0034】また、帳票定義設定部501内に、任意の
ベクトルと直交するようなベクトルを定義ベクトル10
3として予め登録しておき、前述のRGBベクトルに基
づいて、所望の定義ベクトル103を検索して出力する
ように構成してもよい。
In the form definition setting unit 501, a vector that is orthogonal to an arbitrary vector is defined by the definition vector 10.
3 may be registered in advance and the desired definition vector 103 may be searched and output based on the RGB vector described above.

【0035】本実施形態によれば、利用者が、予め帳票
の印刷色等を設定入力する必要がないため、操作性が向
上する。さらに、異なる印刷色の帳票が多数混在してい
るような場合であっても、その都度、印刷色を設定する
必要がないため、処理効率が大幅に向上する。
According to this embodiment, the user does not need to set and input the print color of the form in advance, so that the operability is improved. Further, even when a large number of forms with different print colors are mixed, it is not necessary to set the print color each time, so the processing efficiency is significantly improved.

【0036】次に、本発明の第3の実施形態について図
6を参照して説明する。
Next, a third embodiment of the present invention will be described with reference to FIG.

【0037】本実施形態は、画像入力部201で得られ
たカラー画像を表示する手段を備え、その表示されたカ
ラー画像を参照して、認識結果を修正するものである。
In this embodiment, a means for displaying the color image obtained by the image input unit 201 is provided, and the recognition result is corrected by referring to the displayed color image.

【0038】図6を参照すると、画像入力部201で得
られたカラー画像は、グレー画像作成部202に出力さ
れるとともに、カラー画像保持部601で保持される。
この際、カラー画像保持部601には、グレー画像作成
部202で作成されるグレー画像と画素単位で互いに対
応が付くように、カラー画像が格納される。カラー画像
保持部601に格納されたカラー画像は、カラー画像表
示部603で表示される。一方、利用者は、カラー画像
表示部603で表示されたカラー画像を参照して、修正
データ入力部604により、認識部206で認識された
帳票の認識結果を修正する。このカラー画像表示部60
3と修正データ入力部604により修正端末602が構
成される。
Referring to FIG. 6, the color image obtained by the image input unit 201 is output to the gray image creating unit 202 and held by the color image holding unit 601.
At this time, a color image is stored in the color image holding unit 601 so as to correspond to the gray image created by the gray image creating unit 202 on a pixel-by-pixel basis. The color image stored in the color image holding unit 601 is displayed on the color image display unit 603. On the other hand, the user refers to the color image displayed on the color image display unit 603, and uses the correction data input unit 604 to correct the recognition result of the form recognized by the recognition unit 206. This color image display unit 60
3 and the correction data input unit 604 form a correction terminal 602.

【0039】文字認識に関し、100%の認識率を実現
することはほぼ不可能であるため、通常、文字認識装置
には、修正端末602が備えられる。修正端末602で
は、修正すべきイメージが画面上に表示され、利用者
は、そのイメージを参照して認識結果を修正する。本実
施形態では、帳票の文字枠等がドロップアウトされてい
ないカラー画像を修正参照用に表示しているために、表
示されている文字枠を参照することによって、修正位置
を特定しやすいという利点がある。さらに、白黒の濃淡
画像や2値画像と比べても、文字枠と文字線との区別が
つきやすいく、利用者の負担が軽減されるとともに、正
確な修正処理が可能となる。
Regarding character recognition, since it is almost impossible to achieve a recognition rate of 100%, the character recognition device is usually equipped with a correction terminal 602. At the correction terminal 602, the image to be corrected is displayed on the screen, and the user refers to the image and corrects the recognition result. In the present embodiment, since the color image in which the character frame of the form is not dropped out is displayed for correction reference, it is easy to identify the correction position by referring to the displayed character frame. There is. Further, compared to a grayscale image or a binary image of black and white, it is easy to distinguish between the character frame and the character line, the burden on the user is reduced, and accurate correction processing is possible.

【0040】[0040]

【発明の効果】以上説明したように、本発明の文字認識
装置は、多種類のドロップアウトカラーを1台の装置で
簡単な構成で実現することができる。特に、従来では、
実現困難であった赤、緑、青等の中間色をドロップアウ
トすることが可能となり、しかも、設定可能なドロップ
アウロカラーの種類に制約がなく、したがって、帳票の
設計自由度の向上および文字認識装置の汎用性の向上を
実現することができる。
As described above, the character recognition apparatus of the present invention can realize various types of dropout colors with a single device. In particular, in the past,
It is possible to drop out intermediate colors such as red, green, and blue that were difficult to achieve, and there are no restrictions on the types of drop auro colors that can be set. Therefore, the degree of freedom in designing forms and the character recognition device are improved. The versatility of can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理を示すベクトル図である。FIG. 1 is a vector diagram showing the principle of the present invention.

【図2】本発明の第1の実施形態の構成を示すブロック
図である。
FIG. 2 is a block diagram showing a configuration of a first exemplary embodiment of the present invention.

【図3】図2における帳票定義設定部内に備えられる格
納手段の格納形式の一例を示す図である。
FIG. 3 is a diagram showing an example of a storage format of a storage means provided in the form definition setting unit in FIG.

【図4】図2における帳票定義設定部内に備えられる格
納手段の格納形式の他の例を示す図である。
FIG. 4 is a diagram showing another example of a storage format of a storage means provided in the form definition setting unit in FIG.

【図5】本発明の第2の実施形態の構成を示すブロック
図である。
FIG. 5 is a block diagram showing a configuration of a second exemplary embodiment of the present invention.

【図6】本発明の第3の実施形態の構成を示すブロック
図である。
FIG. 6 is a block diagram showing a configuration of a third exemplary embodiment of the present invention.

【符号の説明】[Explanation of symbols]

101 文字色ベクトル 102 印刷色ベクトル 103 定義ベクトル 201 画像入力部 202 グレー画像作成部 203、501 帳票定義設定部 204 2値化部 205 切出部 206 認識部 601 カラー画像保持部 602 修正端末 603 カラー画像表示部 604 修正データ入力部 101 character color vector 102 printing color vector 103 definition vector 201 image input unit 202 gray image creation unit 203, 501 form definition setting unit 204 binarization unit 205 cropping unit 206 recognition unit 601 color image holding unit 602 correction terminal 603 color image Display unit 604 Correction data input unit

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 入力される読取対象のカラー画像の各画
素を3原色それぞれのレベル値で表される3次元の入力
ベクトルとして出力する手段と、 所定色を示す前記3原色それぞれのレベル値で表される
3次元ベクトルと直交する定義ベクトルと前記入力ベク
トルとの内積を1画素毎にとることによって、前記カラ
ー画像中の前記所定色を除去する手段とを備えることを
特徴とする文字認識装置。
1. A means for outputting each pixel of an input color image to be read as a three-dimensional input vector represented by a level value of each of the three primary colors, and a level value of each of the three primary colors indicating a predetermined color. A character recognition device comprising: means for removing the predetermined color in the color image by taking an inner product of a definition vector orthogonal to the three-dimensional vector represented and the input vector for each pixel. .
【請求項2】 赤・緑・青のそれぞれの読取対象の画像
を多値で入力し、その多値カラー画像の各画素を赤・緑
・青それぞれのレベル値で表される3次元の入力ベクト
ルとして出力する画像入力手段と、 任意の色を示す赤・緑・青それぞれのレベル値で表され
る3次元ベクトルと直交する定義ベクトルを予め保持
し、前記読取対象上で除去したい所定色に対応した前記
定義ベクトルを出力する手段と、 前記入力ベクトルと前記定義ベクトルとの内積を1画素
毎に演算して、前記所定色を除去する手段と、 前記所定色が除去された画像に基づいて、読取対象上の
文字あるいは記号を認識する手段とを備えることを特徴
とする文字認識装置。
2. A three-dimensional input in which red, green, and blue images to be read are input in multivalues, and each pixel of the multivalued color image is represented by level values in red, green, and blue. An image input means for outputting as a vector and a definition vector orthogonal to a three-dimensional vector represented by each level value of red, green, and blue indicating an arbitrary color are held in advance, and a predetermined color to be removed on the reading target is set. Based on the means for outputting the corresponding definition vector, the means for calculating the inner product of the input vector and the definition vector for each pixel to remove the predetermined color, and the image from which the predetermined color has been removed. , A character recognition device comprising means for recognizing a character or a symbol on an object to be read.
【請求項3】 前記読取対象の多値カラー画像に基づい
て前記所定色を特定することを特徴とする前記請求項2
に記載の文字認識装置。
3. The predetermined color is specified based on the multivalued color image to be read.
The character recognition device according to 1.
【請求項4】 前記入力ベクトルの大きさを予め定めら
れた大きさの入力ベクトルに変換する手段をさらに備
え、 所定の大きさに変換された前記入力ベクトルと前記定義
ベクトルとの内積を1画素毎に演算することを特徴とす
る前記請求項2に記載の文字認識装置。
4. A means for converting the size of the input vector into an input vector of a predetermined size, wherein the inner product of the input vector converted into a predetermined size and the definition vector is one pixel. The character recognition device according to claim 2, wherein the character recognition device is operated for each.
【請求項5】 前記入力ベクトルを構成する赤・緑・青
それぞれのレベル値および前記定義ベクトルを構成する
各成分の値を8bitのデータとし、 変換された前記入力ベクトルの大きさを216とすること
を特徴とする前記請求項4に記載の文字認識装置。
5. The level value of each of red, green, and blue constituting the input vector and the value of each component constituting the definition vector are set as 8-bit data, and the size of the converted input vector is set as 2 16 . The character recognition device according to claim 4, wherein the character recognition device comprises:
【請求項6】 前記読取対象の多値カラー画像を表示す
る手段と、 表示された前記多値カラー画像に基づいて、前記読取対
象上の文字あるいは記号の認識結果を修正する手段とを
さらに備えることを特徴とする文字認識装置。
6. The apparatus further comprises means for displaying the multivalued color image to be read, and means for correcting the recognition result of the character or symbol on the object to be read based on the displayed multivalued color image. A character recognition device characterized by the above.
【請求項7】 入力される読取対象のカラー画像の各画
素を3原色それぞれのレベル値で表される3次元の入力
ベクトルとして出力し、 所定色を示す前記3原色それぞれのレベル値で表される
3次元ベクトルと直交する定義ベクトルと前記入力ベク
トルとの内積を1画素毎にとることによって、前記カラ
ー画像中の前記所定色を除去するを備えることを特徴と
する文字認識方法。
7. Each pixel of a color image to be read that is input is output as a three-dimensional input vector represented by the level value of each of the three primary colors and is represented by the level value of each of the three primary colors indicating a predetermined color. A character recognition method comprising removing the predetermined color in the color image by taking an inner product of a definition vector orthogonal to a three-dimensional vector and the input vector for each pixel.
JP8002925A 1996-01-11 1996-01-11 Character recognition apparatus and method Expired - Fee Related JP2871570B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8002925A JP2871570B2 (en) 1996-01-11 1996-01-11 Character recognition apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8002925A JP2871570B2 (en) 1996-01-11 1996-01-11 Character recognition apparatus and method

Publications (2)

Publication Number Publication Date
JPH09190496A true JPH09190496A (en) 1997-07-22
JP2871570B2 JP2871570B2 (en) 1999-03-17

Family

ID=11542924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8002925A Expired - Fee Related JP2871570B2 (en) 1996-01-11 1996-01-11 Character recognition apparatus and method

Country Status (1)

Country Link
JP (1) JP2871570B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010225013A (en) * 2009-03-25 2010-10-07 Hitachi Omron Terminal Solutions Corp Serial number recognition device, paper sheet processor, automatic transaction processor, and serial number recognition method
JP2014063347A (en) * 2012-09-21 2014-04-10 Toshiba Corp Character reader and paper sheet processing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010225013A (en) * 2009-03-25 2010-10-07 Hitachi Omron Terminal Solutions Corp Serial number recognition device, paper sheet processor, automatic transaction processor, and serial number recognition method
JP2014063347A (en) * 2012-09-21 2014-04-10 Toshiba Corp Character reader and paper sheet processing device

Also Published As

Publication number Publication date
JP2871570B2 (en) 1999-03-17

Similar Documents

Publication Publication Date Title
JP3258122B2 (en) Image processing device
KR100477656B1 (en) Method and apparatus for improvement of digital image quality
JP4604100B2 (en) Image processing method, image processing apparatus, image forming apparatus, program, and storage medium
EP0369702A2 (en) Image processing apparatus and method
JP2007299210A (en) Image processing apparatus, image forming apparatus, image reading apparatus, and image processing method
JPH08279896A (en) Document generating method
JP4362538B2 (en) Image processing apparatus, image forming apparatus, image transmitting apparatus, image reading apparatus, image processing system, image processing method, image processing program, and recording medium thereof
JP4582204B2 (en) Image processing apparatus, image conversion method, and computer program
JP3749282B2 (en) Image processing device
JP4582200B2 (en) Image processing apparatus, image conversion method, and computer program
JPH07322057A (en) Increase of resolution of binary input picture and its increasing device together with improvement of appearance ofbinary input picture
JP4140519B2 (en) Image processing apparatus, program, and recording medium
JP4312524B2 (en) Manga line image forming method, apparatus and computer program
JP2871570B2 (en) Character recognition apparatus and method
JP2006031245A (en) Image processing method and image processor by profile tracking of digital image
JP7451159B2 (en) Image processing device, image processing method, and program
JP2001283212A (en) Method of base interpolation by vector transformation
JP4571758B2 (en) Character recognition device, character recognition method, image processing device, image processing method, and computer-readable recording medium
JP4973603B2 (en) Image processing apparatus and image processing program
JP2896919B2 (en) Image processing device
US11831834B2 (en) Information processing apparatus, method, and product performing multiplexing processing by different methods with respect to printing and non-printing areas
JP3961730B2 (en) Form processing apparatus, form identification method, and recording medium
JPH05342340A (en) Method for picture processing and device therefor
JPH03225477A (en) Image processor
EP0263584A2 (en) Scan-in polygonal extraction of video images

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19981208

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080108

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090108

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100108

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110108

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees