JP2675891B2 - OCR system - Google Patents

OCR system

Info

Publication number
JP2675891B2
JP2675891B2 JP2063997A JP6399790A JP2675891B2 JP 2675891 B2 JP2675891 B2 JP 2675891B2 JP 2063997 A JP2063997 A JP 2063997A JP 6399790 A JP6399790 A JP 6399790A JP 2675891 B2 JP2675891 B2 JP 2675891B2
Authority
JP
Japan
Prior art keywords
width
full
image data
kana
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2063997A
Other languages
Japanese (ja)
Other versions
JPH03266090A (en
Inventor
敏子 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2063997A priority Critical patent/JP2675891B2/en
Publication of JPH03266090A publication Critical patent/JPH03266090A/en
Application granted granted Critical
Publication of JP2675891B2 publication Critical patent/JP2675891B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、光学文字読み取り装置の読み取りリーダの
表示及び修正方法に関するものである。
Description: TECHNICAL FIELD The present invention relates to a display and correction method for a reading reader of an optical character reading device.

[従来の技術] 第6図(a)は第1の従来の帳票例を説明する図であ
る。図において、(1a)はANK帳票、(2)はANK帳票
(1a)の所定の記録領域(以下第1フィールドという)
に記載されたカナ文字であり、ア、イ、ウ、エとして記
載されているとする。
[Prior Art] FIG. 6 (a) is a diagram illustrating a first conventional form example. In the figure, (1a) is the ANK form and (2) is the predetermined recording area of the ANK form (1a) (hereinafter referred to as the first field).
It is assumed that the characters are written in Kana and are written as a, a, u, and d.

(3)はANK帳票(1a)の下の所定の領域(以下第2
フィールドという)に記載された数字であり、この場合
は。1、2、3、4、5、6の数字が記載されたとす
る。
(3) is a predetermined area under the ANK form (1a) (hereinafter referred to as the second area).
Field)), in this case. It is assumed that the numbers 1, 2, 3, 4, 5, 6 are described.

また、このANK文字は例えば1文字枠5mm×7mmとす
る。
Further, this ANK character is, for example, one character frame 5 mm × 7 mm.

なお、ANK帳票(1a)は例えば、営業店のOCRに挿入さ
れ、記載されたANK文字等がビデオデータに変換された
ほぼ全角のANKイメージデータとして、また認識したANK
文字を半角のANK認識データとして送信されるものであ
る。
Note that the ANK form (1a) is, for example, inserted into the OCR of a sales office, and the written ANK characters and the like are converted into video data as almost full-width ANK image data.
Characters are transmitted as half-width ANK recognition data.

第6図(b)は地区センターのワークステーションに
表示される第1の従来の画面例を説明する図である。
FIG. 6 (b) is a diagram illustrating a first conventional screen example displayed on the workstation of the district center.

図において、(4)はワークステーションの表示画
面、(5a)はワークステーションの画面の第1のフィー
ルドに表示され、認識された半角のカナ文字(以下半角
の認識カナ文字という)、(6a)は半角の認識カナ文字
(5a)の上に表示されたほぼ全角のカナ文字、(7a)は
第2のフィールドに表示された認識された半角の数字
(以下半角の認識数字という)、(8a)は半角の認識数
字(7a)の上に表示されたほぼ全角の数字である。
In the figure, (4) is the display screen of the workstation, (5a) is the one-byte kana character recognized in the first field of the workstation screen (hereinafter referred to as the half-width recognized kana character), (6a) Is the full-width kana character displayed on the half-width recognized kana character (5a), (7a) is the recognized half-width number (hereinafter referred to as the half-width recognized number) displayed on the second field, (8a ) Is an almost full-width number displayed above the half-width recognized number (7a).

また、ワークステーションの表示は全て同一色で例え
ば緑色で表示されている。すなわち、営業店から送信さ
れるイメージデータをそのまま表示し、認識データを半
角にし、同一色で表示することを示すものである。
Further, the displays of the workstations are all displayed in the same color, for example, green. That is, it means that the image data transmitted from the sales office is displayed as it is, the recognition data is half-width, and is displayed in the same color.

そして、地区センターのオペレータは(b)図に表示
されたほぼ全角のカナ文字(6a)と半角の認識カナ文字
(5a)とを目視で確認し、ほぼ全角のカナ文字(6a)が
ア、イ、ウ、エと表示されているのに、下の半角の認識
カナ文字(5a)が例えばア、イ、ウ、□と表示され、読
取不能文字□があれば、オペレータはほぼ全角のカナ文
字(6a)のア、イ、ウ、エを見て、下の半角の認識カナ
文字(5a)の□にキーボードを操作してエと入力し、修
正していた。
Then, the operator of the district center visually confirms the almost full-width kana character (6a) and the half-width recognized kana character (5a) displayed in FIG. (B), and the almost full-width kana character (6a) is Even though the letters a, u, and d are displayed, the lower half-width recognition kana characters (5a) are displayed as a, i, u, and □. I looked at the letters (6a) a, a, u, and d, and operated the keyboard to the half-width recognition kana character (5a) □, and entered d to make corrections.

第7図(a)は第2の従来の帳票例を説明する図であ
る。
FIG. 7 (a) is a diagram for explaining a second conventional form example.

図において、(2b)は漢字仮名帳票(1b)の第1のフ
ィールドに記載された漢字であり、例えば日本語と記載
されたとする。(3a)は第2のフィールドに記載された
仮名文字であり、例えばひらがなと記載されたとする。
この場合は1文字枠8mm×8mmとする。また、表示は全て
同一の色であり、例えば緑色である。
In the figure, (2b) is the kanji described in the first field of the kanji kana form (1b), and is assumed to be written in Japanese, for example. (3a) is a kana character written in the second field, and is assumed to be written as, for example, hiragana.
In this case, one character frame is 8mm x 8mm. Further, the displays are all the same color, for example, green.

なお、漢字仮名帳票(1b)の漢字(2a)及び仮名文字
(3a)は営業店のOCRに挿入され、記載された漢字(2
a)及び仮名文字(3a)がビデオデータに変換された漢
字イメージデータ及び仮名イメージデータとして送信さ
れ、そのイメージデータが地区センターのMCUにて認識
されて全角の漢字認識データ及び全角の仮名文字認識デ
ータとされるものである。
The kanji (2a) and kana (3a) in the kanji kana form (1b) are inserted in the OCR of the sales office and the kanji (2
a) and kana characters (3a) are transmitted as kanji image data and kana image data converted into video data, and the image data is recognized by the MCU of the district center and full-width kanji recognition data and full-width kana character recognition It is the data.

第7図(b)は第2の従来の画面例を説明する図であ
る。
FIG. 7 (b) is a diagram illustrating a second conventional screen example.

図において、(5b)はワークステーションの画面の第
1のフィールドに表示した全角の認識漢字、(6b)は全
角の認識漢字(5b)の上に表示されたほぼ全角の漢字、
(7b)は第2のフィールドに表示され、全角の認識仮名
文字、(8b)は全角の認識仮名文字(7b)の上に表示さ
れたほぼ全角の仮名文字である。
In the figure, (5b) is the full-width recognized kanji displayed in the first field of the workstation screen, (6b) is the full-width recognized kanji displayed on the full-width recognized kanji (5b),
(7b) is a full-width recognized kana character displayed in the second field, and (8b) is a substantially full-width kana character displayed on the full-width recognized kana character (7b).

この第7図(b)は漢字(2b)又は仮名文字(3a)は
認識されて全角で表示され、そのイメージデータである
漢字及び仮名文字はほぼ全角で表示されることを示し、
かつ両方の位置が少しずれることがある場合を示し、読
取不能文字□をオペレータが比較して修正することを示
すものである。
FIG. 7 (b) shows that kanji (2b) or kana (3a) is recognized and displayed in full-width, and the image data, kanji and kana, are displayed in almost full-width.
In addition, the case where both positions are slightly deviated is shown, and the operator compares and corrects the unreadable character □.

すなわち、単に帳票に記入された文字をイメージデー
タとして送信し、ほぼ全角で表示すると共に認識した半
角または全角の文字を上下又は左右に並べて表示し、読
み取り不能文字が生じた場合に、オペレータが認識文字
の読取り不能文字を修正させたり、読取り不能文字がな
い場合でも、誤読の有無を目視で確認させたりしてい
た。
That is, the characters entered on the form are simply transmitted as image data and displayed in almost full-width and the recognized half-width or full-width characters are displayed vertically or horizontally, and when an unreadable character occurs, the operator recognizes it. They were able to correct unreadable characters, and even if there were no unreadable characters, they were visually inspected for misreading.

また、特公昭57−46106には読取不能文字が生じた場
合に、読取った全文字のビデオパターンと全文字の読取
結果をビデオパターンに対応させて表示して、読取不能
文字を修正する開示があるが、ビデオパターンと読取結
果の文字の大きさが相違しているので、上記と同様に読
取り文字を修正するのに一々対応させて修正しなければ
ならなかった。
In addition, Japanese Patent Publication No. 57-46106 discloses that when unreadable characters occur, the video patterns of all the read characters and the reading results of all the characters are displayed in correspondence with the video patterns to correct the unreadable characters. However, since the video pattern and the character size of the read result are different, the read character had to be corrected one by one in the same manner as described above.

[発明が解決しようとする課題] 上記のような従来のOCRシステムでは、地区センター
のワークステーションの画面には認識した文字を半角又
は全角で表示すると共にほぼ全角のイメージデータとを
対応させて表示するので、その両方の文字の位置がずれ
て表示され、かつ同一色で表示されるため、読取り不能
文字を直観的に読みにくいという問題点があった。
[Problems to be Solved by the Invention] In the conventional OCR system as described above, the recognized characters are displayed in half-width or full-width on the screen of the workstation in the district center and are displayed in correspondence with the image data of almost full-width. As a result, the positions of both characters are displayed in different positions and are displayed in the same color, which makes it difficult to intuitively read unreadable characters.

本発明は、かかる問題点を解決するためになされたも
ので、認識した文字の大きさと対応するイメージデータ
の表示の大きさを同じにして位置を合わせ、かつ読取り
不能文字のあったフィールドを色替え表示することによ
り、前述した問題点を解決し、操作性の良い信頼性の高
いOCRシステムを提供することを目的とする。
The present invention has been made in order to solve such a problem, in which the size of the recognized character and the display size of the corresponding image data are set to be the same and the positions are aligned, and the field having the unreadable character is colored. It is an object of the present invention to solve the above-mentioned problems by providing a replacement display and to provide an OCR system with good operability and high reliability.

[課題を解決するための手段] 本発明に係るOCRシステムは、文字が記載された帳票
に光を照射し、その反射光をイメージデータに変換して
出力するOCRと、OCRから出力されたイメージデータが格
納されるメモリと、OCRから出力されたイメージデータ
を認識し、認識データとして出力する認識手段と、メモ
リに格納されたイメージデータを全角の大きさに拡大又
は縮小し、全角イメージデータとして出力する拡大縮小
手段と、認識手段から認識データが入力すると、全角の
表示データに変換する変換手段と、拡大縮小手段から入
力する全角イメージデータと変換手段から入力する認識
データとを対応させて表示すると共に、認識手段で認識
できない読取不能文字がある場合は少なくとも該当箇所
を全角イメージデータと色替え表示する表示手段とを備
えたものである。
[Means for Solving the Problem] An OCR system according to the present invention is an OCR that irradiates a form in which characters are written with light, converts the reflected light into image data and outputs the image data, and an image output from the OCR. The memory that stores the data, the recognition unit that recognizes the image data output from the OCR, and outputs it as recognition data, and the image data that is stored in the memory is expanded or reduced to full-width size to obtain full-width image data. Enlargement / reduction means for outputting, conversion means for converting recognition data from the recognition means to full-width display data, and full-width image data input from the enlargement / reduction means and recognition data input from the conversion means are displayed in association with each other. In addition, if there is an unreadable character that cannot be recognized by the recognition means, display means for displaying at least the relevant portion in full color image data and in different colors. It is provided with.

[作用] 本発明においては、OCRから帳票に記載された文字の
イメージデータが出力されると、イメージデータをメモ
リに格納して、認識手段により認識して認識データとし
て変換手段に出力する。
[Operation] In the present invention, when the image data of the characters described in the form is output from the OCR, the image data is stored in the memory, recognized by the recognition means, and output as recognition data to the conversion means.

変換手段は認識データが入力すると、全角の表示デー
タに変換し、そして、拡大縮小手段がメモリに格納され
たイメージデータを全角の大きさに拡大又は縮小し、全
角イメージデータとして出力すると、表示手段が拡大縮
小手段から入力する全角イメージデータと変換手段から
入力する認識データとを対応させて表示すると共に、認
識手段で認識できない読取不能文字がある場合は少なく
とも該当箇所を全角イメージデータと相違するように色
替え表示する。
When the recognition data is input, the conversion means converts it into full-width display data, and the enlarging / reducing means enlarges or reduces the image data stored in the memory to full-width size and outputs it as full-width image data. Displays the full-width image data input from the enlarging / reducing means and the recognition data input from the converting means in correspondence with each other, and if there is an unreadable character that cannot be recognized by the recognizing means, at least the corresponding portion is different from the full-width image data. Change color to display.

[実施例] 第1図は本発明の一実施例を示すOCRシステムの概略
構成図である。
[Embodiment] FIG. 1 is a schematic configuration diagram of an OCR system showing an embodiment of the present invention.

図において、(10)は営業店のOCR装置(以下営業店O
CRという)であり、帳票がANK文字であれば半角のANK認
識データを出力すると共にANKイメージデータとして送
信し、また、漢字仮名文字及び縦書文字であればイメー
ジデータのみを送信するものである。
In the figure, (10) is the OCR device of the sales office (hereinafter, sales office O
If the form is ANK characters, it outputs half-width ANK recognition data and sends it as ANK image data, and if it is Kanji kana characters or vertical writing characters, only image data is sent. .

(11a)は後述するID番号が記載されたANK文字帳票
(以下ID付ANK帳票という)、(11b)はID付漢字仮名文
字帳票、(11c)はID付縦書帳票、(12)は営業店OCR
(10)からのイメージデータ及びANK認識データ等を送
信する公衆通信網、(13)は営業店OCR(10)と地区セ
ンターとの通信の制御を行う通信制御部、(14)はANK
認識データ及びイメージデータを判別し、それぞれ別に
出力する読取判別手段、(15)は漢字認識手段であり、
読取判別手段(14)から出力される漢字のイメージデー
タをハードディスク(以下HDという)に格納されている
漢字認識辞書により認識し、全角の漢字認識データ(6
b)として出力するものである。
(11a) is an ANK character form with an ID number described later (hereinafter referred to as ANK form with ID), (11b) is a kanji and kana character form with ID, (11c) is a vertical form with ID, and (12) is sales. Store OCR
A public communication network for transmitting image data and ANK recognition data from (10), (13) a communication control unit for controlling communication between the sales office OCR (10) and the district center, and (14) ANK.
Reading discrimination means for discriminating recognition data and image data and outputting them separately, (15) is kanji recognition means,
The Kanji image data output from the reading discrimination means (14) is recognized by the Kanji recognition dictionary stored in the hard disk (hereinafter referred to as HD), and full-width Kanji recognition data (6
It is output as b).

(16)は第1のメモリであり、読取文字判別手段(1
4)から出力されるイメージデータを格納する領域及びA
NK文字認識データ、漢字認識データを格納する領域を有
したものである。
Reference numeral (16) is a first memory, which is a read character discriminating means (1
4) Area for storing the image data output from and A
It has an area for storing NK character recognition data and Chinese character recognition data.

(17)はID番号判別手段であり、第1のメモリに格納
されたイメージデータからID番号を読み、その番号に応
じて、後述する認識データ倍角手段にANK認識データを
出力し、イメージデータ圧縮手段に、漢字仮名文字等の
イメージデータを出力し、イメージデータ拡大手段に縦
書きのイメージデータを出力するものである。
(17) is an ID number discriminating means, which reads the ID number from the image data stored in the first memory, and outputs ANK recognition data to the recognition data multiplying means (to be described later) according to the number to compress the image data. The image data such as kanji and kana characters is outputted to the means, and the vertically written image data is outputted to the image data expanding means.

(18)はID番号判別手段(17)から出力される半角の
ANK認識データを全角にしてワークステーションに出力
する認識データ倍角手段、(19)は漢字仮名文字のイメ
ージデータを圧縮するイメージデータ圧縮手段、(20)
は縦書きのイメージデータを拡大するイメージデータ拡
大手段である。
(18) is a half-width character output from the ID number discrimination means (17).
Recognition data doubling means for converting ANK recognition data into full width and outputting to workstation, (19) is image data compression means for compressing image data of kanji and kana characters, (20)
Is an image data enlarging means for enlarging vertically written image data.

(21)はワークステーションの第2のメモリであり、
認識データ倍角手段(18)、イメージデータ圧縮手段
(19)、イメージデータ拡大手段(20)、ID番号判別手
段(17)から出力されるデータが格納されるものであ
る。
(21) is the second memory of the workstation,
The data output from the recognition data multiplying means (18), the image data compressing means (19), the image data expanding means (20) and the ID number discriminating means (17) are stored.

(22)は識別色付加手段であり、第2のメモリに格納
されたイメージデータが表示されるフィールドを例えば
白色にし、認識データであれば緑色にし、また認識され
てない読取不能文字がある認識データがあれば、そのフ
ィールドを黄色にするものである。
(22) is an identification color adding means, for example, the field in which the image data stored in the second memory is displayed is white, the recognition data is green, and the unrecognized unrecognized characters are recognized. If there is data, it will make that field yellow.

(23)は識別色付加手段(22)から出力されるイメー
ジデータまたは認識データをCRT(24)に表示させる画
像メモリ、(25)は少なくとも確認キー、修正キを有し
たキーボード、(26)は修正手段であり、キーボード
(25)から入力される修正キーに応じて画像メモリ(2
3)の認識データを修正するものである。
(23) is an image memory for displaying the image data or recognition data output from the identification color adding means (22) on the CRT (24), (25) is at least a confirmation key, a keyboard having a correction key, and (26) is It is a correction means, and the image memory (2
It corrects the recognition data of 3).

(24)はCRTであり、特にイメージデータを画面に表
示するときは標準ではX軸.Y軸共に一定間隔でデータを
描画して表示し、圧縮時にはこの抽出間隔を大きくし、
拡大時には抽出間隔間を小さくし、表示のデータ量を調
整し表示するイメージデータの大きさを変えるものであ
る。
(24) is a CRT, and especially when displaying image data on the screen, the standard is to draw and display the data at fixed intervals on both the X and Y axes, and at the time of compression, increase the extraction interval,
At the time of enlargement, the extraction interval is reduced, the amount of display data is adjusted, and the size of image data to be displayed is changed.

(27)はキーボード(25)の確認キーが押されると画
像メモリの認識データを半角にして通信制御部(28)を
介してホスト装置に出力させる送信出力手段である。
Reference numeral (27) is a transmission output means for making the recognition data in the image memory half-width and outputting it to the host device via the communication control unit (28) when the confirmation key of the keyboard (25) is pressed.

第2図(a)は本実施例に用いるANK帳票を説明する
図である。
FIG. 2 (a) is a diagram for explaining the ANK form used in this embodiment.

図において、(2)〜(11a)は上記と同様なもので
あり、(30)はID付ANK帳票(11a)にANK文字を記載し
たことを示すID番号(以下ANK文字番号という)であ
る。また、このID番号を001とする。
In the figure, (2) to (11a) are the same as above, and (30) is an ID number (hereinafter referred to as ANK character number) indicating that ANK characters are written on the ANK form with ID (11a). . Also, this ID number is set to 001.

第2図(b)は本発明を用いてID付ANK帳票を表示し
た図である。
FIG. 2 (b) is a view showing an ANK form with ID using the present invention.

図において、(6aa)は第6図(b)で説明したほぼ
全角のカナ文字(6a)を白色にしたほぼ全角の白色カナ
文字、(8aa)は第6図(b)で説明したほぼ全角の数
字(8a)を白色にしたほぼ全角の白色数字、(31)は全
角の認識黄色カナ文字であり、カナ文字(2)を認識し
て全角にし、読取不能文字がある場合に黄色で表示さ
れ、読取不能文字がなければ緑色で表示されるものであ
る。
In the figure, (6aa) is a nearly full-width white kana character in which the almost full-width kana character (6a) described in FIG. 6 (b) is white, and (8aa) is almost the full-width kana character described in FIG. 6 (b). Number (8a) in white is almost full-width white number, (31) is full-width recognized yellow kana character, and kana character (2) is recognized to full-width and displayed in yellow when there are unreadable characters If there is no unreadable character, it is displayed in green.

(32)は全角の認識緑色数字であり、数字(3)を認
識し、全角にした数字を緑色にした数字であり、読取不
能文字がある場合に黄色で表示されるものである。
(32) is a full-width recognized green number, which is a number obtained by recognizing the number (3) and making the full-width number green, and is displayed in yellow when there are unreadable characters.

第3図(a)は本発明に用いるID付漢字仮名帳票を説
明する図である。図において、(2a)〜(11a)は上記
と同様であり、(33)はID付漢字仮名帳票(11b)に漢
字仮名文字を記載したことを示すID番号(以下漢字仮名
番号という)であり、番号を002とする。
FIG. 3 (a) is a diagram for explaining the kanji kana kana form with ID used in the present invention. In the figure, (2a) to (11a) are the same as above, and (33) is an ID number (hereinafter referred to as Kanji Kana number) indicating that the Kanji Kana character is written in the Kanji Kana form with ID (11b). , And the number is 002.

第3図(b)は本発明を用いてID付漢字仮名帳票を表
示した図である。図において、(5bb)は第7図(b)
で説明した全角の認識漢字(5b)を緑色にした全角の認
識緑色漢字であり、読取不能文字がある場合に黄色で表
示されるものである。
FIG. 3 (b) is a diagram showing a kanji kana kana form with ID using the present invention. In the figure, (5bb) is FIG. 7 (b).
The full-width recognition Kanji (5b) described in 1. is a full-width recognition green Kanji and is displayed in yellow when there are unreadable characters.

(34)は漢字(2a)のほぼ全角のイメージデータを全
角に圧縮し、白で表示した漢字イメージデータ(以下圧
縮した漢字という)である。
(34) is Kanji image data (hereinafter referred to as compressed Kanji) displayed in white by compressing almost full-width image data of Kanji (2a) into full-width characters.

(35)は仮名文字(3a)のほぼ全角のイメージデータ
を圧縮し、白色で表示したイメージデータ(以下圧縮し
た仮名文字という)である。(36)は全角の認識黄色仮
名文字であり、仮名文字(3a)を認識して全角にし、読
取不能文字がある場合に黄色で表示され、読取不能文字
がなければ緑色で表示されるものである。
(35) is the image data in which almost full-width image data of the kana character (3a) is compressed and displayed in white (hereinafter referred to as compressed kana character). (36) is a full-width recognized yellow kana character, which is recognized as a full-width kana character (3a) and is displayed in yellow when there are unreadable characters and green when there are no unreadable characters. is there.

第4図(a)はID付縦書帳票を説明する図であり、
(37)はID付縦書帳票(11c)に縦書帳票であることを
示すID番号(以下縦書番号という)である。この番号を
003とする。
FIG. 4 (a) is a diagram for explaining a vertical book with ID,
Reference numeral (37) is an ID number (hereinafter referred to as vertical writing number) indicating that the vertical writing form with ID (11c) is a vertical writing form. This number
003.

第4図(b)は本発明によるID付縦書帳票を説明する
図である。図において、(38)は緑色で表示された認識
した全角の縦書文字(以下全角の認識縦書文字とい
う)、(39)は縦書を拡大したイメージデータ(以下拡
大した縦書文字という)である。
FIG. 4 (b) is a view for explaining a vertical form book with ID according to the present invention. In the figure, (38) is the recognized full-width vertical writing characters displayed in green (hereinafter referred to as full-width recognized vertical writing characters), and (39) is the image data obtained by enlarging the vertical writing (hereinafter referred to as enlarged vertical writing characters). Is.

上記のように構成されたOCRシステムについて以下に
動作を説明する。
The operation of the OCR system configured as above will be described below.

初めに第2図(a)のID付ANK帳票(11a)を営業店OC
R(10)に入力した場合について説明する。
First, the ANK form (11a) with ID in Fig. 2 (a) is used by the sales office OC.
The case of inputting into R (10) will be explained.

営業店のオペレータは、営業店OCR(10)にID付ANK帳
票(11a)をセットし、キーボード(図示せず)で帳票
の読取り指示を行うと、営業店OCR(10)は帳票を吸引
し、カナ文字(2)、ANK帳票番号(30)(001)及び数
字(3)を読み、そしてカナ文字(2)及び数字(3)
を認識し、半角で公衆通信網(12)を介して地区センタ
ーの通信制御部(13)に送信すると共にカナ文字
(2)、ANK帳票番号(30)及び数字(3)をイメージ
データとして地区センターに出力する。
When the operator of the sales office sets the ANK form (11a) with ID on the sales office OCR (10) and gives an instruction to read the form using a keyboard (not shown), the sales office OCR (10) sucks the form. , Kana character (2), ANK form number (30) (001) and number (3), and Kana character (2) and number (3)
Is transmitted to the communication control unit (13) of the district center via the public communication network (12) in half-width and the Kana character (2), ANK form number (30) and number (3) are used as image data in the district. Output to the center.

通信制御部(13)は営業店OCR(10)と地区センター
とが通信中でなければ、送信されたカナ文字(2)、AN
K帳票番号(30)及び数字(3)のANKイメージデータと
認識した半角のANK認識データを読取文字判別手段(1
4)に出力し、読取文字判別手段(14)はイメージデー
タがANKイメージデータであれば、第1のメモリのイメ
ージデータ領域に格納し、半角のANK認識データを認識
データ格納領域に出力する。次に、フローチャートを用
いて動作を説明する。
The communication control unit (13) sends the transmitted Kana characters (2), AN unless the sales office OCR (10) is communicating with the district center.
Half-width ANK recognition data recognized as K form number (30) and number (3) ANK image data is read character discrimination means (1
When the image data is ANK image data, the read character discriminating means (14) stores it in the image data area of the first memory and outputs half-width ANK recognition data to the recognition data storage area. Next, the operation will be described using a flowchart.

第5図は本発明の動作を説明するフローチャートであ
り、上記の図を用いて説明する。
FIG. 5 is a flow chart for explaining the operation of the present invention, which will be described with reference to the above figures.

ID番号判別手段(17)は第1のメモリ(16)のイメー
ジデータのID番号を読み(S1)、ID番号を判別し(S
3)、ANK文字番号(30)(001)であれば、認識した半
角のANK認識データ認識データ全角手段(18)に出力し
(S5)、ほぼ全角のANKイメージデータを第2のメモリ
(21)に出力する(S7)。この場合は、半角のカナ文字
認識データ及び半角の数字認識データとカナ文字イメー
ジデータ及び数字イメージデータを出力する。
The ID number discriminating means (17) reads the ID number of the image data of the first memory (16) (S1) and discriminates the ID number (S1).
3), if the ANK character number (30) (001), it outputs the recognized half-width ANK recognition data to the recognition data full-width means (18) (S5), and outputs the full-width ANK image data to the second memory (21). )) (S7). In this case, half-width kana character recognition data, half-width numeral recognition data, kana character image data, and numeral image data are output.

次に、認識データ全角手段(18)は半角のANK認識デ
ータが入力すると、その認識データを全角に変換して第
2のメモリ(21)に格納する(S9)。
Next, when the half-width ANK recognition data is input, the recognition data full-width means (18) converts the recognition data into full-width and stores it in the second memory (21) (S9).

次に、識別色付加手段(22)は第2のメモリに格納さ
れたほぼ全角のANK文字イメージデータと全角にされたA
NK認識データを比較し(S11)、読取不能文字がないか
を判断する(S13)。
Next, the identification color adding means (22) stores the full-width ANK character image data and the full-width A stored in the second memory.
The NK recognition data are compared (S11), and it is determined whether there are unreadable characters (S13).

そして、第2図(b)に示す読取不能文字があれば、
そのANK認識データに読取不能文字があることが一目で
判断できるようにANK認識データを表示するフィールド
を黄色にし(S15)、読取不能文字がなければ、ANK認識
データを表示するフィールドを緑色にし(S17)、さら
にイメージデータを表示するフィールドを白色にし(S1
9)、画像メモリ(23)を介してCRT(24)に第2図
(b)に示すように表示する。
If there is an unreadable character shown in FIG. 2 (b),
The field displaying the ANK recognition data is colored yellow (S15) so that it can be determined at a glance that the ANK recognition data has unreadable characters. If there are no unreadable characters, the field displaying the ANK recognition data is colored green ( S17), and the field displaying the image data is made white (S1
9), it is displayed on the CRT (24) through the image memory (23) as shown in FIG. 2 (b).

そして、CRT(24)には第2図(b)に示すように、
ほぼ全角の白色カナ文字(6aa)と全角の認識黄色カナ
文字(31)の表示位置が対応して表示されるので、地区
センターのオペレータは一目で読取不能文字があること
が分かり、全角の認識黄色カナ文字(31)の上のほぼ全
角の白色カナ文字(6aa)エを見て、キーボード(25)
を操作しカーソルを全角の認識黄色カナ文字(31)の□
に合わせてエを入力すると、修正手段(26)が画像メモ
リ(23)のカーソルの位置にエを書込み、CRTに表示す
る。
Then, as shown in FIG. 2 (b), the CRT (24)
Almost full-width white kana characters (6aa) and full-width recognition yellow kana characters (31) are displayed in correspondence with each other, so the operator at the district center can recognize that there are unreadable characters at a glance, and recognize full-width characters. Look at the full-width white kana characters (6aa) d above the yellow kana characters (31) and the keyboard (25)
Operate the cursor to recognize full-width characters. □ of yellow kana characters (31)
Then, the correction means (26) writes D at the cursor position in the image memory (23) and displays it on the CRT.

そして、オペレータが修正されたことを確認し、確認
キーを押してMCUのHDに修正された認識データを格納さ
せると共に通信制御部(28)を介してホスト装置に送信
する。
Then, the operator confirms the correction, and presses the confirmation key to store the corrected recognition data in the HD of the MCU and transmit it to the host device via the communication control unit (28).

従って、オペレータは読取不能文字を容易に見つける
ことができ、その修正も容易になる。
Therefore, the operator can easily find the unreadable character and correct it.

次に、第3図(a)のID付漢字仮名帳票が営業点OCR
(10)に挿入され、MCUの第1のメモリ(16)に漢字(2
a)、仮名文字(3a)及び漢字仮名番号(33)のイメー
ジデータが格納され、かつ全角の漢字認識データ、仮名
認識データが格納されると、ステップS1と同様にID番号
判別手段(17)はID番号を読み、ステップS3で漢字仮名
番号(33)(002)と判断すれば、漢字(2a)及び仮名
文字(3a)のイメージデータをイメージデータ圧縮手段
(19)に出力し(S21)し、全角の漢字認識データ、仮
名認識データを第2メモリ(21)に出力する(S23)。
Next, the Kanji Kana form with ID in Fig. 3 (a) is the operating point for OCR.
It is inserted in (10) and the Chinese character (2
a), image data of kana kana (3a) and kanji kana number (33) are stored, and full-width kanji recognition data and kana recognition data are stored, ID number discrimination means (17) similar to step S1 Reads the ID number, and if it determines that it is the kanji kana number (33) (002) in step S3, it outputs the image data of the kanji (2a) and kana (3a) to the image data compression means (19) (S21). Then, the full-width kanji recognition data and kana recognition data are output to the second memory (21) (S23).

すると、イメージデータ圧縮手段(19)は漢字(2a)
及び仮名文字(3a)のほぼ全角のイメージデータを全角
に圧縮して第2のメモリ(21)に出力する(S)。そし
て、上記説明のステップS11に制御を移し、識別色付加
手段(22)の説明と同様に相違する色にし第3図(b)
のようにCRT(24)に全角の圧縮した漢字(34)と全角
の認識緑色漢字(5bb)を対応する位置に表示し、さら
に全角の圧縮した仮名文字(35)と全角の認識黄色仮名
文字(36)を表示するので、上記と同様にオペレータは
読取不能文字を容易に見つけることができ、その修正も
容易になる。
Then, the image data compression means (19) uses the kanji (2a)
Also, the image data of almost full width of the kana character (3a) is compressed to full width and output to the second memory (21) (S). Then, the control is shifted to step S11 in the above description, and the different color is set as in the description of the identification color adding means (22).
The full-width compressed kanji (34) and full-width recognized green kanji (5bb) are displayed at the corresponding positions on the CRT (24), and the full-width compressed kana characters (35) and full-width recognized yellow kana characters are displayed. Since (36) is displayed, similarly to the above, the operator can easily find the unreadable character, and the correction thereof becomes easy.

次に、第4図(a)に示すID付縦書帳票(11c)が挿
入され、第1のメモリ(16)に縦書文字のイメージデー
タと認識データが格納されるとると、ID番号判別手段
(17)はイメージデータ拡大手段(20)に縦書文字のイ
メージデータを出力し(S27)、全角の縦書認識データ
を第2のメモリ(21)に出力する(S29)、すると、イ
メージデータ拡大手段(20)は縦書文字のイメージデー
タを拡大して(S31)、制御をステップS11に移す。
Next, if the vertical writing form with ID (11c) shown in FIG. 4 (a) is inserted and the image data of vertical writing characters and the recognition data are stored in the first memory (16), the ID number determination is performed. The means (17) outputs the image data of vertical writing characters to the image data enlarging means (20) (S27), and outputs the full-width vertical writing recognition data to the second memory (21) (S29). The data enlarging means (20) enlarges the image data of vertically written characters (S31), and shifts the control to step S11.

第2のメモリ(21)に出力され上記と同様な処理をし
て、第4図(b)に示すように全角の認識縦書文字(3
8)と全角の拡大縦書文字(39)をCRT(24)に表示する
ので上記と同様にオペレータは読取不能文字を容易に見
つけることができ、その修正も容易になる。
It is output to the second memory (21) and processed in the same manner as described above, and as shown in FIG. 4 (b), full-width recognized vertical writing characters (3
Since the 8) and full-width enlarged vertical writing characters (39) are displayed on the CRT (24), the operator can easily find the unreadable characters and correct the same as above.

なお、上記実施例では帳票を区別するIDを番号として
例示したが、本発明ではそれに限定されるものではな
く、他の同様な機能を有するもの、例えばバーコード等
を用いてもよい。
In the above embodiment, the ID for distinguishing the form is exemplified as a number, but the present invention is not limited to this, and one having another similar function, for example, a barcode or the like may be used.

[発明の効果] 以上のように本発明によれば、帳票に記載された文字
をイメージデータと認識データにし、その認識データを
全角の表示データに変換すると共に、イメージデータを
全角の大きさに拡大又は縮小して対応させて表示すると
共に、認識できない読取不能文字がある認識データを、
少なくとも該当箇所を全角イメージデータと相違するよ
うに色替え表示することにより、認識データとイメージ
データの表示位置が合うようにしたので、容易に読取不
能文字が分かり、かつ容易に修正できるという効果がえ
られている。
[Effects of the Invention] As described above, according to the present invention, characters written on a form are converted into image data and recognition data, the recognition data is converted into full-width display data, and the image data is reduced to full-width size. Enlarged or reduced and displayed correspondingly, recognition data with unreadable characters that can not be recognized,
The display position of the recognition data matches the display position of the image data by changing the color of at least the relevant part so that it is different from the full-width image data, so it is easy to understand the unreadable characters and easily correct it. It is obtained.

【図面の簡単な説明】 第1図は本発明の一実施例を示すOCRシステムの概略構
成図、第2図(a)は本実施例に用いるANK帳票を説明
する図、第2図(b)は本発明を用いてID付ANK帳票を
表示した図、第3図(a)は本発明に用いるID付漢字仮
名帳票を説明する図、第3図(b)は本発明を用いてID
付漢字仮名帳票を表示した図、第4図(a)はID付縦書
帳票を説明する図、第4図(b)は本発明によるID付縦
書帳票を説明する図、第5図は本発明の動作を説明する
フローチャート、第6図(a)は第1の従来の帳票例を
説明する図、第6図(b)は第1の従来の画面例を説明
する図、第7図(a)は第2の従来の帳票例を説明する
図、第7図(b)は第2の従来の画面例を説明する図、
第7図(b)は第2の従来の画面例を説明する図であ
る。 図において、(1a)はANK帳票、(2a)はカナ文字、(2
b)は漢字、(3a)は仮名文字、(3a)は数字、(4)
はワークステーションの表示画面、(5a)は半角の認識
カナ文字、(5b)は全角の認識漢字、(5bb)は全角の
認識緑色漢字、(6a)はほぼ全角のカナ文字、(6aa)
はほぼ全角の白色カナ文字、(6b)はほぼ全角の漢字、
(7a)は半角の認識数字、(7b)は全角の認識仮名文
字、(8a)はほぼ全角の数字、(8aa)はほぼ全角の白
色数字、(8b)はほぼ全角の仮名文字、(10)は営業店
OCR、(11a)はID付ANK帳票、(11b)はID付漢字仮名文
字帳票、(11c)はID付縦書帳票、(12)は公衆通信
網、(13)は通信制御部、(14)は読取判別手段、(1
5)は漢字認識手段、(16)は第1のメモリ、(17)はI
D番号判別手段、(18)は認識データ倍角手段、(19)
はイメージデータ圧縮手段、(20)はイメージデータ拡
大手段、(21)は第2のメモリ、(22)は識別色付加手
段、(23)は画像メモリ、(24)はCRT、(25)はキー
ボード、(26)は修正手段、(27)は送信出力手段、
(30)はANK文字番号、(31)は全角の認識黄色カナ文
字、(32)全角の認識緑色数字、(33)は漢字仮名番
号、(34)は圧縮した漢字、(35)は圧縮した仮名文
字、(36)は全角の認識黄色仮名文字、(37)は縦書番
号、(38)は全角の認識縦書文字、(39)は拡大した縦
書文字である。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a schematic configuration diagram of an OCR system showing an embodiment of the present invention, FIG. 2 (a) is a diagram explaining an ANK form used in this embodiment, and FIG. 2 (b). ) Is a diagram showing an ANK form with ID using the present invention, FIG. 3 (a) is a diagram explaining a kanji kana form with ID used in the present invention, and FIG. 3 (b) is an ID using the present invention.
FIG. 4 (a) shows a vertical kana kana form with ID, FIG. 4 (a) shows a vertical kana kana form with ID, FIG. 4 (b) shows a vertical kana kana form with ID according to the present invention, and FIG. 6 is a flowchart for explaining the operation of the present invention, FIG. 6 (a) is a diagram for explaining a first conventional form example, FIG. 6 (b) is a diagram for explaining a first conventional screen example, and FIG. FIG. 7A is a diagram illustrating a second conventional form example, and FIG. 7B is a diagram illustrating a second conventional screen example.
FIG. 7 (b) is a diagram illustrating a second conventional screen example. In the figure, (1a) is the ANK form, (2a) is the Kana character, and (2
b) kanji, (3a) kana, (3a) numbers, (4)
Is the display screen of the workstation, (5a) is half-width kana characters, (5b) is full-width kanji characters, (5bb) is full-width green kanji characters, (6a) is almost full-width kana characters, (6aa)
Is almost full-width white kana, (6b) is almost full-width kanji,
(7a) is half-width recognized number, (7b) is full-width recognized kana character, (8a) is almost full-width number, (8aa) is almost full-width white number, (8b) is almost full-width kana character, (10 ) Is a branch
OCR, (11a) ANK form with ID, (11b) Kanji and Kana character form with ID, (11c) Vertical writing form with ID, (12) Public communication network, (13) Communication controller, (14) ) Is the reading discrimination means, (1
5) is kanji recognition means, (16) is the first memory, (17) is I
D number discriminating means, (18) is recognition data doubling means, (19)
Is an image data compressing means, (20) is an image data expanding means, (21) is a second memory, (22) is an identification color adding means, (23) is an image memory, (24) is a CRT, and (25) is Keyboard, (26) correction means, (27) transmission output means,
(30) is ANK character number, (31) is full-width recognized yellow kana character, (32) is full-width recognized green number, (33) is kanji kana number, (34) is compressed kanji, (35) is compressed Kana characters, (36) are full-width recognized yellow kana characters, (37) is vertical writing number, (38) is full-width recognized vertical writing character, and (39) is enlarged vertical writing character.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】文字が記載された帳票に光を照射し、その
反射光をイメージデータに変換して出力するOCRと、 前記OCRから出力されたイメージデータが格納されるメ
モリと、 前記OCRから出力されたイメージデータを認識し、認識
データとして出力する認識手段と、 前記メモリに格納されたイメージデータを全角の大きさ
に拡大又は縮小し、全角イメージデータとして出力する
拡大縮小手段と、 前記認識手段から認識データが入力すると、全角の表示
データに変換する変換手段と、 前記拡大縮小手段から入力する全角イメージデータと変
換手段から入力する認識データとを対応させて表示する
と共に、前記認識手段で認識できない読取不能文字があ
る場合は少なくとも該当箇所を前記全角イメージデータ
と色替え表示する表示手段と を有したことを特徴とするOCRシステム。
1. An OCR for irradiating light on a form in which characters are written, converting the reflected light into image data and outputting the image data, a memory for storing the image data output from the OCR, and the OCR. A recognition unit for recognizing the output image data and outputting it as recognition data; a scaling unit for enlarging or reducing the image data stored in the memory to a full-width size and outputting it as full-width image data; When the recognition data is input from the means, the conversion means for converting to the full-width display data, the full-width image data input from the enlarging / reducing means and the recognition data input from the converting means are displayed in association with each other, and the recognition means If there are unreadable characters that cannot be recognized, at least the relevant part shall have a display means for displaying the full-width image data in different colors. OCR system according to claim.
JP2063997A 1990-03-16 1990-03-16 OCR system Expired - Fee Related JP2675891B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2063997A JP2675891B2 (en) 1990-03-16 1990-03-16 OCR system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2063997A JP2675891B2 (en) 1990-03-16 1990-03-16 OCR system

Publications (2)

Publication Number Publication Date
JPH03266090A JPH03266090A (en) 1991-11-27
JP2675891B2 true JP2675891B2 (en) 1997-11-12

Family

ID=13245415

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2063997A Expired - Fee Related JP2675891B2 (en) 1990-03-16 1990-03-16 OCR system

Country Status (1)

Country Link
JP (1) JP2675891B2 (en)

Also Published As

Publication number Publication date
JPH03266090A (en) 1991-11-27

Similar Documents

Publication Publication Date Title
US6040825A (en) Input/display integrated information processing device
JP2675891B2 (en) OCR system
US6930789B1 (en) Image processing method, apparatus, system and storage medium
US5233672A (en) Character reader and recognizer with a specialized editing function
JP3770812B2 (en) Branch terminal for financial institutions
JPS63316285A (en) Character recognizing device
JP2928042B2 (en) Information transmission method using portable FAX / OCR terminal
JPS583075A (en) Character correcting method in recognizing device for mixture of pattern and character
JPS63115283A (en) Method for displaying corrected picture of recognition result in character recognition device
JPH0668067A (en) Input device
JPS6326789A (en) Character recognizing device
JPS63293690A (en) Character recognizing system
JPH0413727Y2 (en)
JPH09114918A (en) Optical character reader
JP2963042B2 (en) Character recognition result display method and character recognition device
JPS61198376A (en) Optical character reader
JPH08243507A (en) Postal matter processor and image display method
JP3221969B2 (en) Character recognition device
JPH08321870A (en) Callnumber originating device of communication equipment
JPH02289066A (en) Document generator
JPS6292080A (en) Pattern recognizing device
KR20080044658A (en) Extraction system of template and method thereof
JPH0612403A (en) Input device
JPH0581467A (en) Method and device for image processing
JPH05108868A (en) Picture processing method and device thereof

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees