JPH06176193A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH06176193A
JPH06176193A JP4328203A JP32820392A JPH06176193A JP H06176193 A JPH06176193 A JP H06176193A JP 4328203 A JP4328203 A JP 4328203A JP 32820392 A JP32820392 A JP 32820392A JP H06176193 A JPH06176193 A JP H06176193A
Authority
JP
Japan
Prior art keywords
color
image
unit
scanning
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4328203A
Other languages
Japanese (ja)
Inventor
Hiroyuki Harashima
裕之 原島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4328203A priority Critical patent/JPH06176193A/en
Publication of JPH06176193A publication Critical patent/JPH06176193A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

PURPOSE:To remove a restriction on color to be used for paper to be processed. CONSTITUTION:The device is provided with a scanning section 10 detecting color picture by optically scanning paper to be processed, sheet buffer 20 to store color pictures detected by the scanning section 10, histogram counting section 30 counting the frequency to be used by color, color storage section 40 storing information representing color where the frequency to be used counted by the section 30 exceeds the set threshold value, binary section 50 converting binary picture into the color picture stored in a sheet buffer 20 based on the color stored in the section 40, and character recognition section 60 recognizing characters on the binary picture obtained by the section 50.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、複数の色が使用された
用紙に記録された文字の読取りを行なう光学的文字読取
装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reader for reading characters recorded on a sheet of paper having a plurality of colors.

【0002】[0002]

【従来の技術】一般に、帳票等に記入された文字等の読
取りを行なう光学的文字読取装置は、黒色を有効(文字
データ)、白色を無効(背景)とする白黒(2値)画像
を処理の対象としている。そのため、帳票等に対して光
学的走査を行なって画像を検出する走査部(光電変換
部)では、あるしきい値に基づいて、白/黒に対応する
2値化が行なわれている。
2. Description of the Related Art Generally, an optical character reader for reading characters written on a form or the like processes a black and white (binary) image in which black is valid (character data) and white is invalid (background). The target of. Therefore, in the scanning unit (photoelectric conversion unit) that optically scans a form or the like to detect an image, binarization corresponding to white / black is performed based on a certain threshold value.

【0003】このため、光学的文字読取装置の処理対象
とされる帳票に文字記入枠や読取りの不要な文字等を印
刷するために用いられる色は、光学的文字読取装置(の
走査部におけるしきい値理論)では白色と判定される
色、すなわちドロップアウトカラーと呼ばれる色が使用
される。このドロップアウトカラーは、走査部において
使用される光源の波長に応じて決定される。
For this reason, the color used for printing a character entry frame or a character that does not need to be read on a form to be processed by the optical character reading device has a color in the scanning part of the optical character reading device. In the threshold theory), a color determined to be white, that is, a color called a dropout color is used. This dropout color is determined according to the wavelength of the light source used in the scanning section.

【0004】従って、光学的文字読取装置用の帳票であ
れば、不要な背景等の色印刷はドロップアウトされ、記
入された読取り対象とする文字(文字データ)のみが検
出されて文字認識処理に供される。
Therefore, in the case of a form for an optical character reading device, unnecessary color printing of the background or the like is dropped out, and only the written characters (character data) to be read are detected for character recognition processing. Be served.

【0005】[0005]

【発明が解決しようとする課題】このように従来の光学
的文字読取装置では、使用する光源により、ドロップア
ウトカラーが決定されるため、帳票に使用できる色が制
限されてしまう。このことは、帳票に対して、強調など
の色を利用した効果的な印刷等ができなくなることに通
ずる。
As described above, in the conventional optical character reader, the dropout color is determined by the light source used, so that the colors that can be used for the form are limited. This leads to the fact that the form cannot be effectively printed using colors such as highlighting.

【0006】これに対し、カラー画像を出力することが
可能な走査部(光電変換部)を設けることが考えられる
が、色に関する情報は、例えば3色光源で8ビット/色
とすると、256の3乗(約1677万)通りあり、膨
大な量となる。このため、帳票全体にわたり、正確に色
を識別することは、処理量の増加となり、処理速度の低
下を招いてしまう。
On the other hand, it is conceivable to provide a scanning unit (photoelectric conversion unit) capable of outputting a color image. However, if the color information is 8 bits / color for a three-color light source, for example, 256 There are cubes (about 16.77 million), which is a huge amount. For this reason, accurately identifying the color over the entire form increases the processing amount and lowers the processing speed.

【0007】また、必ずしもカラー画像として出力する
必要がない帳票が処理の対象とする場合、例えば2値画
像で処理可能な場合であっても、色情報が付加されるた
めにデータ量が膨大となり、データ転送を含むデータ処
理に多くの時間を要してしまう。本発明は前記のような
点に鑑みてなされたもので、処理対象とする用紙に用い
られる色に制限がない光学的文字読取装置を提供するこ
とを目的とする。
Further, when a form that is not necessarily output as a color image is to be processed, for example, even if it can be processed with a binary image, the color information is added, resulting in an enormous amount of data. However, it takes a lot of time to process data including data transfer. The present invention has been made in view of the above points, and an object of the present invention is to provide an optical character reading device that does not limit the colors used for the paper to be processed.

【0008】[0008]

【課題を解決するための手段】本発明は、処理対象とす
る用紙を光学的に走査することによってカラー画像を検
出する走査手段と、前記走査手段によって検出されたカ
ラー画像を格納するための画像格納手段と、前記画像格
納手段に格納されたカラー画像について、色毎に出現頻
度を計数する計数手段と、前記計数手段によって計数さ
れた出現頻度が、予め設定されたしきい値を越える色を
示す情報を記憶するための色記憶手段と、前記色記憶手
段に記憶された基づいて、前記画像格納手段に格納され
たカラー画像を2値画像に変換する2値化手段と、前記
2値化手段によって得られた2値画像について、文字認
識を行なう文字認識手段とを具備したことを第1の特徴
とする。
According to the present invention, there is provided a scanning means for detecting a color image by optically scanning a sheet to be processed, and an image for storing the color image detected by the scanning means. The storage means, the counting means for counting the appearance frequency of each color in the color image stored in the image storage means, and the color whose appearance frequency counted by the counting means exceeds a preset threshold value. Color storage means for storing the information shown, binarization means for converting the color image stored in the image storage means into a binary image based on the color storage means, and the binarization A first feature is that the binary image obtained by the means is provided with character recognition means for performing character recognition.

【0009】また本発明は、処理対象とする用紙を光学
的に走査することによってカラー画像を検出する走査手
段と、前記走査手段によって検出されたカラー画像を格
納するための画像格納手段と、前記画像格納手段に格納
されたカラー画像中の所定の領域について、色毎に出現
頻度を計数する計数手段と、前記計数手段によって計数
された出現頻度が、予め設定されたしきい値を越える色
を示す情報を記憶するための色記憶手段と、前記色記憶
手段に記憶された基づいて、前記画像格納手段に格納さ
れたカラー画像の前記領域の部分を2値画像に変換する
2値化手段と、前記画像格納手段に格納されたカラー画
像、または前記2値化手段によって得られた2値画像を
選択的に出力する出力制御手段とを具備したことを第2
の特徴とする。
According to the present invention, a scanning means for detecting a color image by optically scanning a sheet to be processed, an image storing means for storing the color image detected by the scanning means, and For a predetermined area in the color image stored in the image storage means, a counting means for counting the appearance frequency for each color, and a color for which the appearance frequency counted by the counting means exceeds a preset threshold value Color storage means for storing the information shown, and binarization means for converting the portion of the area of the color image stored in the image storage means into a binary image based on the color storage means. A color image stored in the image storage means or an output control means for selectively outputting the binary image obtained by the binarization means.
It is a feature of.

【0010】また本発明は、処理対象とする用紙を光学
的に走査することによってカラー画像を検出する走査手
段と、前記走査手段によって検出されたカラー画像を格
納するための画像格納手段と、前記画像格納手段に格納
されたカラー画像中の所定の領域内に存在する色を識別
する色識別手段と、前記色識別手段によって識別された
色に基づいて、前記画像格納手段に格納されたカラー画
像を2値画像に変換する色フィルタ手段と、前記フィル
タ手段によって得られた2値画像について、文字認識を
行なう文字認識手段とを具備したことを第3の特徴とす
る。
According to the present invention, scanning means for detecting a color image by optically scanning a sheet to be processed, image storing means for storing the color image detected by the scanning means, and A color identification unit for identifying a color existing in a predetermined area in the color image stored in the image storage unit, and a color image stored in the image storage unit based on the color identified by the color identification unit A third feature is that the color filter means for converting the image into a binary image and the character recognizing means for recognizing the binary image obtained by the filter means are provided.

【0011】[0011]

【作用】このような構成によれば、OCR帳票等を光学
的に走査することによって得られたカラー画像から色毎
に出現頻度が計数され、この計数値に基づいて2値画像
が生成される。すなわち、一般には、帳票の背景に用い
られる色は出現頻度が高く、また認識の対象外の色であ
る。従って、出現頻度が所定のしきい値を越える色を認
識対象外としてカラー画像を2値化することにより、帳
票に用いられる色がどのような色であっても、認識対象
とする画像(文字の部分を含む)が得られる。
According to this structure, the appearance frequency is counted for each color from the color image obtained by optically scanning the OCR form, and the binary image is generated based on this count value. . That is, generally, the color used for the background of the form has a high appearance frequency and is a color that is not a target of recognition. Therefore, by binarizing a color image by excluding a color whose appearance frequency exceeds a predetermined threshold as a recognition target, an image to be recognized (a character Is included).

【0012】また、カラー画像中の特定の領域につい
て、背景の部分が無効となるように2値化し、この2値
画像とカラー画像とを選択的に出力可能とすることによ
り、帳票に複数の色が用いられていても、後段の処理内
容に応じた画像が得られる。
Further, a specific area in the color image is binarized so that the background portion becomes invalid, and the binary image and the color image can be selectively output, so that a plurality of sheets can be output on the form. Even if colors are used, an image can be obtained according to the processing content of the subsequent stage.

【0013】また、帳票に設けられた所定の領域内の色
が、カラー画像からドロップアウトされて2値画像が得
られるので、帳票に複数の色を用い、かつ任意の色をド
ロップアウトさせることができる。
Further, since the color in the predetermined area provided on the form is dropped out from the color image to obtain the binary image, it is possible to use a plurality of colors for the form and drop out any color. You can

【0014】[0014]

【実施例】以下、図面を参照して本発明の実施例を説明
する。図1は第1実施例に係わる光学的文字読取装置の
構成を示すブロック図である。図1に示すように、第1
実施例の光学的文字読取装置は、走査部10、シートバ
ッファ20、ヒストグラム計数部30、色記憶部40、
2値化部50、文字認識部60、制御部70、及び操作
部80によって構成されている。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the arrangement of the optical character reading apparatus according to the first embodiment. As shown in FIG.
The optical character reader according to the embodiment includes a scanning unit 10, a sheet buffer 20, a histogram counting unit 30, a color storage unit 40,
The binarization unit 50, the character recognition unit 60, the control unit 70, and the operation unit 80 are included.

【0015】走査部10は、処理対象とする用紙等をカ
ラー画像として光学的に走査し、カラー画像信号をシー
トバッファ20に出力するものである。シートバッファ
20は、走査部10における光学的走査によって得られ
たカラー画像を、例えば1用紙分格納するものである。
The scanning unit 10 optically scans a sheet or the like to be processed as a color image and outputs a color image signal to the sheet buffer 20. The sheet buffer 20 stores the color image obtained by the optical scanning in the scanning unit 10 for one sheet, for example.

【0016】ヒストグラム計数部30は、シートバッフ
ァ20に格納されたカラー画像について、色毎に出現頻
度(画素数)を計数してヒストグラムを生成する。色記
憶部40は、ヒストグラム計数部30によって生成され
たヒストグラムの値が、予め設定された所定のしきい値
を越える場合に、該当する色を用紙の背景部分の色とし
て記憶するためのものである。
The histogram counting section 30 counts the appearance frequency (the number of pixels) of each color of the color image stored in the sheet buffer 20 to generate a histogram. The color storage unit 40 is for storing the corresponding color as the color of the background portion of the paper when the value of the histogram generated by the histogram counting unit 30 exceeds a predetermined threshold value set in advance. is there.

【0017】2値化部50は、色記憶部40に記憶され
た色を背景、すなわち認識対象外の値(“0”)とし、
その他の文字等の部分を“1”として、シートバッファ
20に格納されたカラー画像を2値化して2値画像を生
成する。
The binarization unit 50 sets the color stored in the color storage unit 40 as a background, that is, a value (“0”) that is not a recognition target,
The color image stored in the sheet buffer 20 is binarized to generate a binary image with other characters and the like set to "1".

【0018】文字認識部60は、2値化部50によって
得られた2値画像について文字認識を行なう。制御部7
0は、走査部10から入力されたカラー画像から背景の
色を検出し記憶する処理や、文字認識を行なう処理な
ど、装置全体の制御を司るものである。制御部70は、
モード記憶部70aを有し、このモード記憶部70aに
実行すべき処理モード(記憶モード、認識モード)を記
憶する。操作部80は、制御部70に対する処理モード
の指示等を入力するものである。次に、第1実施例の動
作について説明する。
The character recognition unit 60 performs character recognition on the binary image obtained by the binarization unit 50. Control unit 7
Reference numeral 0 controls the entire apparatus, such as processing for detecting and storing the background color from the color image input from the scanning unit 10 and processing for character recognition. The control unit 70
It has a mode storage unit 70a, and stores the processing mode (storage mode, recognition mode) to be executed in this mode storage unit 70a. The operation unit 80 is for inputting a processing mode instruction or the like to the control unit 70. Next, the operation of the first embodiment will be described.

【0019】まず、処理対象とする用紙は、走査部10
において光学的に走査され、カラー画像として検出され
る。検出されたカラー画像は、シートバッファ20に格
納される。
First, the sheet to be processed is the scanning unit 10.
In the optical scanning, it is detected as a color image. The detected color image is stored in the sheet buffer 20.

【0020】ここで、制御部70は、処理モードが、記
憶モードであるか認識モードであるかを判別する。記憶
モードでは、文字が記入されていない帳票の処理を行な
い、帳票の文字認識の対象とならない背景色の記憶が行
なわれる。認識モードでは、記憶モードで背景色が記憶
されている帳票に記入された文字について認識される。
Here, the control unit 70 determines whether the processing mode is the storage mode or the recognition mode. In the storage mode, a form in which characters are not written is processed, and a background color that is not a target for character recognition of the form is stored. In the recognition mode, the characters written on the form whose background color is stored in the storage mode are recognized.

【0021】処理モードが記憶モードであることが、操
作部80から与えられるか、または制御情報により指示
されると、制御部70は、次のように動作を制御する。
ヒストグラム計数部30は、シートバッファ20に格納
されたカラー画像を読み出して色毎に出現頻度を計数
し、図2に示すようなヒストグラムを生成する。
When the operation unit 80 gives an instruction that the processing mode is the storage mode or the control information indicates that the control unit 70 controls the operation as follows.
The histogram counting unit 30 reads the color image stored in the sheet buffer 20 and counts the appearance frequency for each color to generate a histogram as shown in FIG.

【0022】色記憶部40は、ヒストグラム計数部30
によって生成されたヒストグラムを読出し、予め設定さ
れた所定のしきい値を越える計数値を持つ色が存在する
か判別する。計数値が、しきい値以下の場合には、ノイ
ズと判別して処理対象から除外する。色記憶部40は、
しきい値を越えた色を、帳票の背景の色(文字認識の対
象とならない色)として記憶する。ここで、異なる背景
色をもつ複数の帳票について前述のような処理を施すこ
とにより、多種の色を記憶することもできる。次に、処
理モードが認識モードである場合、制御部70は、次の
ように動作を制御する。この時、走査部10によって、
文字が記入された帳票のカラー画像が入力され、シート
バッファ20に格納されているものとする。
The color storage section 40 includes a histogram counting section 30.
The histogram generated by is read, and it is determined whether or not there is a color having a count value exceeding a preset predetermined threshold value. If the count value is less than or equal to the threshold value, it is determined as noise and is excluded from the processing target. The color storage unit 40 is
The color that exceeds the threshold is stored as the background color of the form (the color that is not the target of character recognition). Here, various colors can be stored by performing the above-described processing on a plurality of forms having different background colors. Next, when the processing mode is the recognition mode, the control unit 70 controls the operation as follows. At this time, the scanning unit 10
It is assumed that the color image of the form in which the characters are written is input and stored in the sheet buffer 20.

【0023】2値化部50は、シートバッファ20に格
納されたカラー画像について、色記憶部40に記憶され
た背景の色と同じ色の部分を白(“0”)、他の部分を
黒(“1”)として2値化し、文字認識部60に出力す
る。文字認識部60は、2値化部50によって得られた
2値画像から黒(“1”)の部分を文字として切り出
し、文字認識処理を行なう。
The binarization unit 50 of the color image stored in the sheet buffer 20 is white (“0”) in the same color portion as the background color stored in the color storage unit 40 and black in the other portions. It is binarized as (“1”) and output to the character recognition unit 60. The character recognition unit 60 cuts out a black (“1”) portion as a character from the binary image obtained by the binarization unit 50, and performs character recognition processing.

【0024】このようにして、記憶モードにおいて、シ
ートバッファ20に格納されたカラー画像から文字認識
の対象としない背景の色が記憶され、この背景の色を参
照して2値化処理を行なうので、帳票にドロップアウト
カラーとして用いられる色に制限がなくなる。
Thus, in the storage mode, the background color that is not the target of character recognition is stored from the color image stored in the sheet buffer 20, and the binarization processing is performed with reference to this background color. , There are no restrictions on the colors used as dropout colors in the form.

【0025】なお、背景色を記憶するために、記憶モー
ドでは文字が記入されていない帳票に対して処理を施す
ものとして説明したが、通常、文字の部分(面積)は背
景の部分と比較して十分に少ないので、ヒストグラム値
を判別するためのしきい値を、文字の色に対応するヒス
トグラム値が越えない値にしておくことで、文字が記入
された帳票から背景色のみを記憶することもできる。
In addition, in order to store the background color, it has been explained that the processing is performed on the form in which no characters are written in the storage mode, but normally the character part (area) is compared with the background part. Since the threshold value for distinguishing the histogram value is set to a value that does not exceed the histogram value corresponding to the character color, only the background color is stored from the form in which the character is entered. You can also

【0026】また、ヒストグラム計数部30は、厳密に
色毎に画素数を計数するのではなく、例えば赤色系、緑
色系、茶色系などのように、ある程度の色範囲毎にヒス
トグラムを生成するようにしても良い。次に、第2実施
例について説明する。
Further, the histogram counting unit 30 does not strictly count the number of pixels for each color, but generates a histogram for each color range such as red, green, and brown. You can Next, a second embodiment will be described.

【0027】第2実施例における光学的文字読取装置
は、複数の色が用いられた帳票について、部分的にカラ
ー画像または2値画像として出力し、後段の処理(文字
認識)等に供するものである。第2実施例の光学的文字
読取装置は、第1実施例と同一の構成となっている。た
だし、ヒストグラム計数部30は、制御部70が有する
領域情報に従って、シートバッファ20に格納されたカ
ラー画像の対応する領域について色毎に出現頻度(画素
数)を計数してヒストグラムを生成する。
The optical character reader according to the second embodiment partially outputs, as a color image or a binary image, a form in which a plurality of colors are used for subsequent processing (character recognition) or the like. is there. The optical character reader of the second embodiment has the same structure as that of the first embodiment. However, the histogram counting unit 30 counts the appearance frequency (the number of pixels) for each color in the corresponding region of the color image stored in the sheet buffer 20 according to the region information included in the control unit 70 to generate a histogram.

【0028】また、制御部70のモード記憶部70aに
は、文字認識部60にカラー画像を出力するのか、ある
いは2値画像を出力するのかを示す出力モード(カラー
モード、2値化モード)が、処理モードの他にさらに記
憶される。次に、第2実施例の動作について説明する。
The mode storage unit 70a of the control unit 70 has an output mode (color mode or binarization mode) indicating whether to output a color image or a binary image to the character recognition unit 60. Further stored in addition to the processing mode. Next, the operation of the second embodiment will be described.

【0029】まず、処理対象とする用紙は、走査部10
において光学的に走査され、カラー画像として検出され
る。検出されたカラー画像は、シートバッファ20に格
納される。
First, the sheet to be processed is the scanning unit 10.
In the optical scanning, it is detected as a color image. The detected color image is stored in the sheet buffer 20.

【0030】ここで、制御部70は、処理モードが記憶
モードである場合、領域情報によって特定される領域の
カラー画像をヒストグラム計数部30に出力する。ヒス
トグラム計数部30は、色毎に出現頻度を計数し、ヒス
トグラムを生成する。
Here, when the processing mode is the storage mode, the control section 70 outputs the color image of the area specified by the area information to the histogram counting section 30. The histogram counting unit 30 counts the appearance frequency for each color and generates a histogram.

【0031】なお、領域情報は、帳票の座標位置を操作
部80を介して指示することにより設定したり、シート
バッファ20に格納された画像を表示装置(図示せず)
に表示させてポインティングデバイスによって指定する
ことにより設定することができる。ただし、設定方法
は、特に限定されるものではない。
The area information is set by instructing the coordinate position of the form via the operation unit 80, or the image stored in the sheet buffer 20 is displayed on a display device (not shown).
It can be set by displaying it on the screen and designating with a pointing device. However, the setting method is not particularly limited.

【0032】色記憶部40は、ヒストグラム計数部30
によって生成されたヒストグラムを読出し、予め設定さ
れた所定のしきい値を越える計数値を持つ色が存在する
か判別する。計数値が、しきい値以下の場合には、ノイ
ズと判別して処理対象から除外する。色記憶部40は、
しきい値を越えた色を、帳票の背景の色(文字認識の対
象とならない色)として記憶する。次に、処理モードが
認識モードである場合、制御部70は、次のように動作
を制御する。
The color storage section 40 includes a histogram counting section 30.
The histogram generated by is read, and it is determined whether or not there is a color having a count value exceeding a preset predetermined threshold value. If the count value is less than or equal to the threshold value, it is determined as noise and is excluded from the processing target. The color storage unit 40 is
The color that exceeds the threshold is stored as the background color of the form (the color that is not the target of character recognition). Next, when the processing mode is the recognition mode, the control unit 70 controls the operation as follows.

【0033】2値化部50は、シートバッファ20中
の、領域情報によって指定される領域のカラー画像につ
いて、色記憶部40に記憶された背景の色と同じ色の部
分を白(“0”)、他の部分を黒(“1”)として2値
化する。
The binarizing unit 50 whites ("0") the portion of the color image of the area designated by the area information in the sheet buffer 20, the portion having the same color as the background color stored in the color storage unit 40. ), The other part is binarized as black (“1”).

【0034】ここで、制御部70は、領域情報と出力モ
ードに基づいて、画像データを出力させる。出力モード
がカラーモードである場合は、シートバッファ20に格
納されたカラー画像を出力する。また、出力モードが2
値化モードの場合は、領域情報が示す領域の2値画像を
出力する。
Here, the control unit 70 outputs the image data based on the area information and the output mode. When the output mode is the color mode, the color image stored in the sheet buffer 20 is output. Also, the output mode is 2
In the case of the binarization mode, a binary image of the area indicated by the area information is output.

【0035】このようにして、領域情報によって指定さ
れたカラー画像中の領域は、記憶モードにおいて記憶さ
れた認識の対象としない背景の色に基づいて2値化さ
れ、出力モードが2値化モードの場合に出力される。す
なわち、走査部10によって検出されたカラー画像中
で、処理対象が2値画像で十分な領域に対しては、必要
な情報を残すようにして2値化処理が施される。従っ
て、指定された領域の画像データ量が削減されるため、
データ転送に必要な時間が短縮される。次に、第3実施
例について説明する。
In this way, the area in the color image designated by the area information is binarized based on the background color that is not the object of recognition stored in the storage mode, and the output mode is the binarization mode. Is output when. That is, in the color image detected by the scanning unit 10, a binarization process is performed so that necessary information is left in a region where the processing target is a binary image. Therefore, the amount of image data in the specified area is reduced,
The time required for data transfer is reduced. Next, a third embodiment will be described.

【0036】図3は第3実施例に係わる光学的文字読取
装置の構成を示すブロック図である。図3に示すよう
に、第3実施例の光学的文字読取装置は、走査部10
0、シートバッファ200、色フィルタ部300、色識
別部400、制御部500、及び文字認識部600によ
って構成されている。
FIG. 3 is a block diagram showing the arrangement of an optical character reading apparatus according to the third embodiment. As shown in FIG. 3, the optical character reading device according to the third embodiment includes a scanning unit 10.
0, the sheet buffer 200, the color filter unit 300, the color identification unit 400, the control unit 500, and the character recognition unit 600.

【0037】走査部100は、処理対象とする用紙等を
カラー画像として光学的に走査し、カラー画像信号をシ
ートバッファ200に出力するものである。シートバッ
ファ200は、走査部100における光学的走査によっ
て得られたカラー画像を、例えば1用紙分格納するもの
である。
The scanning section 100 optically scans a sheet or the like to be processed as a color image and outputs a color image signal to the sheet buffer 200. The sheet buffer 200 stores the color image obtained by the optical scanning in the scanning unit 100, for example, for one sheet.

【0038】色フィルタ部300は、シートバッファ2
00に格納されたカラー画像を、後述する制御部500
により指定される1色以上の色を示す色情報に従い、認
識対象としない無効(白色“0”)として出力するもの
である。色識別部400は、シートバッファ200に格
納されたカラー画像から、後述する制御部500から指
定される色識別領域内の色を識別するものである。
The color filter unit 300 includes the sheet buffer 2
00, the color image stored in
According to the color information indicating one or more colors designated by, the output is made as invalid (white “0”) which is not a recognition target. The color identification section 400 identifies a color within a color identification area designated by the control section 500, which will be described later, from the color image stored in the sheet buffer 200.

【0039】制御部500は、走査部100から入力さ
れたカラー画像から色識別領域内の色を検出する処理
や、特定の色を無効にする処理など、装置全体の制御を
司るものである。文字認識部600は、色フィルタ部3
00を介して入力された2値画像について文字認識を行
なうものである。次に、第3実施例の動作について説明
する。
The control unit 500 controls the entire apparatus such as a process of detecting a color in the color identification area from a color image input from the scanning unit 100 and a process of invalidating a specific color. The character recognition unit 600 includes a color filter unit 3
The character recognition is performed on the binary image input via 00. Next, the operation of the third embodiment will be described.

【0040】第3実施例における光学的文字読取装置
は、帳票内に設定された所定の狭い領域(色識別領域と
称する)に、ドロップアウトカラーとすべき色が印刷さ
れることで、自動的に色識別領域内の色と同じ色をドロ
ップアウトするものである。
The optical character reading apparatus according to the third embodiment automatically prints a color to be a dropout color in a predetermined narrow area (referred to as a color identification area) set in a form, thereby automatically The same color as the color in the color identification area is dropped out.

【0041】まず、処理対象とする用紙は、走査部10
において光学的に走査され、カラー画像として検出され
る。検出されたカラー画像は、シートバッファ20に格
納される。
First, the paper to be processed is the scanning unit 10.
In the optical scanning, it is detected as a color image. The detected color image is stored in the sheet buffer 20.

【0042】制御部500は、図示しないホストコンピ
ュータ等から予め与えられる、色識別領域を示す情報に
応じて、色識別部400に色識別領域を指定する。色識
別部400は、シートバッファ200に格納されたカラ
ー画像の、指定された色識別領域を走査し、色識別領域
内に存在する色の全てを識別する。色識別部400は、
色識別領域内に存在する色を示す全ての色についての色
情報を制御部500に出力する。
The control section 500 specifies the color identification area in the color identification section 400 in accordance with the information indicating the color identification area, which is given in advance from a host computer (not shown) or the like. The color identification unit 400 scans the designated color identification area of the color image stored in the sheet buffer 200 and identifies all the colors existing in the color identification area. The color identification unit 400 is
The color information about all the colors indicating the colors existing in the color identification area is output to the control unit 500.

【0043】制御部500は、色識別部40からの色情
報に従い、無効(白色“0”)とすべき色を、色フィル
タ部300に指示する。この時、無効とすべき色が2色
以上ある場合には、全ての色を指定する。
The control section 500 instructs the color filter section 300 which color should be invalidated (white "0") according to the color information from the color identification section 40. At this time, if there are two or more colors to be invalidated, all the colors are designated.

【0044】色フィルタ部300は、シートバッファ2
00に格納されたカラー画像を、制御部500によって
指定された色を“0”、その他の色を“1”として2値
化する。色フィルタ部300によって2値化された2値
画像は、文字認識部600に出力される。文字認識部6
00は、与えられた2値画像について文字認識を行な
い、認識結果を出力する。
The color filter unit 300 includes the sheet buffer 2
The color image stored in 00 is binarized with the color designated by the control unit 500 being "0" and the other colors being "1". The binary image binarized by the color filter unit 300 is output to the character recognition unit 600. Character recognition unit 6
00 performs character recognition on the given binary image and outputs the recognition result.

【0045】このようにして、帳票内に設けられた色識
別領域に記録された色をドロップアウトさせた2値画像
を生成するので、任意の色、数のドロップアウトカラー
を用いることができ、帳票に対する印刷色の制限が無く
なる。
In this way, since the binary image in which the colors recorded in the color identification area provided in the form are dropped out is generated, it is possible to use an arbitrary number of dropout colors, There is no restriction on the print color for the form.

【0046】[0046]

【発明の効果】以上のように本発明によれば、処理対象
とする用紙に用いられる色に制限を無くすことが可能と
なるものである。
As described above, according to the present invention, it is possible to eliminate restrictions on the colors used for the paper to be processed.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1実施例及び第2実施例に係わる光
学的文字読取装置の構成を示すブロック図。
FIG. 1 is a block diagram showing a configuration of an optical character reading device according to first and second embodiments of the present invention.

【図2】第1実施例及び第2実施例においてヒストグラ
ム計数部30が生成するヒストグラムの一例を示す図。
FIG. 2 is a diagram showing an example of a histogram generated by a histogram counting section 30 in the first and second embodiments.

【図3】本発明の第3実施例に係わる光学的文字読取装
置の構成を示すブロック図。
FIG. 3 is a block diagram showing the configuration of an optical character reading device according to a third embodiment of the invention.

【符号の説明】[Explanation of symbols]

10…走査部、20…シートバッファ、30…ヒストグ
ラム計数部、40…色記憶部、50…2値化部、60…
文字認識部、70…制御部、70a…モード記憶部、8
0…操作部、300…色フィルタ部、400…色識別
部。
10 ... Scanning unit, 20 ... Sheet buffer, 30 ... Histogram counting unit, 40 ... Color storage unit, 50 ... Binarizing unit, 60 ...
Character recognition unit, 70 ... Control unit, 70a ... Mode storage unit, 8
0 ... Operation part, 300 ... Color filter part, 400 ... Color identification part.

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 処理対象とする用紙を光学的に走査する
ことによってカラー画像を検出する走査手段と、 前記走査手段によって検出されたカラー画像を格納する
ための画像格納手段と、 前記画像格納手段に格納されたカラー画像について、色
毎に出現頻度を計数する計数手段と、 前記計数手段によって計数された出現頻度が、予め設定
されたしきい値を越える色を示す情報を記憶するための
色記憶手段と、 前記色記憶手段に記憶された基づいて、前記画像格納手
段に格納されたカラー画像を2値画像に変換する2値化
手段と、 前記2値化手段によって得られた2値画像について、文
字認識を行なう文字認識手段と、 を具備したことを特徴とする光学的文字読取装置。
1. A scanning means for detecting a color image by optically scanning a sheet to be processed, an image storing means for storing the color image detected by the scanning means, and the image storing means. Counting means for counting the appearance frequency for each color of the color image stored in, and a color for storing information indicating a color in which the appearance frequency counted by the counting means exceeds a preset threshold value. Storage means, binarization means for converting the color image stored in the image storage means into a binary image based on the storage in the color storage means, and a binary image obtained by the binarization means And a character recognition means for recognizing characters, and an optical character reading device.
【請求項2】 処理対象とする用紙を光学的に走査する
ことによってカラー画像を検出する走査手段と、 前記走査手段によって検出されたカラー画像を格納する
ための画像格納手段と、 前記画像格納手段に格納されたカラー画像中の所定の領
域について、色毎に出現頻度を計数する計数手段と、 前記計数手段によって計数された出現頻度が、予め設定
されたしきい値を越える色を示す情報を記憶するための
色記憶手段と、 前記色記憶手段に記憶された基づいて、前記画像格納手
段に格納されたカラー画像の前記領域の部分を2値画像
に変換する2値化手段と、 前記画像格納手段に格納されたカラー画像、または前記
2値化手段によって得られた2値画像を選択的に出力す
る出力制御手段と、 を具備したことを特徴とする光学的文字読取装置。
2. A scanning unit for detecting a color image by optically scanning a sheet to be processed, an image storing unit for storing the color image detected by the scanning unit, and the image storing unit. For a predetermined area in the color image stored in, counting means for counting the appearance frequency for each color, and information indicating a color whose appearance frequency counted by the counting means exceeds a preset threshold value. A color storage means for storing; a binarization means for converting a part of the area of the color image stored in the image storage means into a binary image based on the color storage means stored in the color storage means; An optical character reader comprising: an output control unit for selectively outputting a color image stored in a storage unit or a binary image obtained by the binarization unit. .
【請求項3】 処理対象とする用紙を光学的に走査する
ことによってカラー画像を検出する走査手段と、 前記走査手段によって検出されたカラー画像を格納する
ための画像格納手段と、 前記画像格納手段に格納されたカラー画像中の所定の領
域内に存在する色を識別する色識別手段と、 前記色識別手段によって識別された色に基づいて、前記
画像格納手段に格納されたカラー画像を2値画像に変換
する色フィルタ手段と、 前記フィルタ手段によって得られた2値画像について、
文字認識を行なう文字認識手段と、 を具備したことを特徴とする光学的文字読取装置。
3. A scanning unit for detecting a color image by optically scanning a sheet to be processed, an image storing unit for storing the color image detected by the scanning unit, and the image storing unit. A color identification unit for identifying a color existing in a predetermined area in the color image stored in the color image, and the color image stored in the image storage unit based on the color identified by the color identification unit. Color filter means for converting into an image, and a binary image obtained by the filter means,
An optical character reading device comprising: a character recognition unit for recognizing characters.
JP4328203A 1992-12-08 1992-12-08 Optical character reader Pending JPH06176193A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4328203A JPH06176193A (en) 1992-12-08 1992-12-08 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4328203A JPH06176193A (en) 1992-12-08 1992-12-08 Optical character reader

Publications (1)

Publication Number Publication Date
JPH06176193A true JPH06176193A (en) 1994-06-24

Family

ID=18207607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4328203A Pending JPH06176193A (en) 1992-12-08 1992-12-08 Optical character reader

Country Status (1)

Country Link
JP (1) JPH06176193A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009159185A (en) * 2007-12-26 2009-07-16 Hitachi Computer Peripherals Co Ltd Drop out color treatment method and its apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009159185A (en) * 2007-12-26 2009-07-16 Hitachi Computer Peripherals Co Ltd Drop out color treatment method and its apparatus
JP4654237B2 (en) * 2007-12-26 2011-03-16 日立コンピュータ機器株式会社 Dropout color processing device

Similar Documents

Publication Publication Date Title
US5335292A (en) Document processing system and method
JP2007081458A (en) Image processing apparatus and control method of image processing apparatus
JP2845370B2 (en) Character recognition method
JPH06176193A (en) Optical character reader
JPH06203204A (en) Character recognition device
JPH06131495A (en) Image information extraction system
JPH1021316A (en) Mark reader and its method
JPH08123901A (en) Character extraction device and character recognition device using this device
JP2001222717A (en) Document image recognition method and system, and computer readable recording medium
JPH06111057A (en) Optical character reader
JPH06111060A (en) Optical character reader
JP2637498B2 (en) Image signal processing device
JPS5949671A (en) Optical character reader
JP2001109842A (en) Optical character, reader
JPH0528314A (en) Optical character reader
JP2925275B2 (en) Optical character reader
JPH06176194A (en) Optical character reader
JP2936766B2 (en) Image input device
JPH02123486A (en) Optical character reader
JPH0437967A (en) Optical character reader
JP4578004B2 (en) Scanner and binarization method by controlling light source color of scanner
JP2906608B2 (en) Optical character reader
JPH04260977A (en) Image reader
JPH05274473A (en) Optical character reader
JP2925300B2 (en) Optical character reader