JP2667958B2 - Character pattern recognition and correction device - Google Patents

Character pattern recognition and correction device

Info

Publication number
JP2667958B2
JP2667958B2 JP6094703A JP9470394A JP2667958B2 JP 2667958 B2 JP2667958 B2 JP 2667958B2 JP 6094703 A JP6094703 A JP 6094703A JP 9470394 A JP9470394 A JP 9470394A JP 2667958 B2 JP2667958 B2 JP 2667958B2
Authority
JP
Japan
Prior art keywords
character
information
pattern
layout
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6094703A
Other languages
Japanese (ja)
Other versions
JPH06342482A (en
Inventor
康雄 黒須
修 国崎
彰三 門田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP6094703A priority Critical patent/JP2667958B2/en
Publication of JPH06342482A publication Critical patent/JPH06342482A/en
Application granted granted Critical
Publication of JP2667958B2 publication Critical patent/JP2667958B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は漢字OCR等の文字読取
装置に係り、特に認識に際して不読または誤読が発生し
た場合、これを容易に修正することができる文字パター
ン認識修正装置に関する。 【0002】 【従来の技術】OCRとは帳票上に印刷あるいは手書き
された文字を光電変換等の手段により走査し、得られた
画像データを分析し、認識することによって如何なる文
字であるかを判断し、対応する文字コードを発生する装
置である。ところが、この種の装置においては帳票の汚
れ、印字品質あるいは手書き書体の乱れ等によって読取
不能の文字や誤読が発生する。このような場合は普通オ
ペレータが表示画面と帳票とを参照しながらキー操作に
よって正しい文字コードを入力し、先に発生した文字コ
ードをこれに置き換える作業が行われる。しかしなが
ら、この修正方法は、表示画面上の文字と帳票上の文字
との対応が取りにくく作業効率が悪いという欠点があ
る。 【0003】そこで、作業の装置は、特開昭59−16
0273号公報記載のように、ディスプレイには読取結
果の文字コードに対応するキャラクタデータと、帳票の
濃淡画像データを同時に表示する様になっていた。ま
た、従来の製品では、濃淡画像の替わりに2値画像デー
タを同時に表示するものも多く見受けられた。 【0004】 【発明が解決しようとする課題】この方法は、複数行分
の文字パターン情報の表示が可能であり、修正作業を効
果的に行うことができる。しかしながら、次の2点につ
いては配慮されていなかった。第1点は、OCRの漢字
化に伴い、記入文字サイズが大きくなり、ひいては帳票
サイズが大型化する傾向にある。 【0005】このため、画像データの解像度を落したと
しても、ディスプレイ上に1枚分の原画像を表示するこ
とが困難になる。また第2の点として、装置の低価格化
に伴い、従来の表示修正機能付OCRと異なり、認識機
能のみをOCRが分担し、認識結果の表示修正はパーソ
ナルコンピュータなどの上位機を用いるタイプが主流を
占める傾向にある。一方、OCRからデータを受け取る
ための上位機の通信機能は低速なシリアルインターフェ
イスのものが多い。したがって、コードデータとは異な
り、データ量の多い画像データを修正装置に合わせて高
速に転送することが困難となり、修正効率の向上を実現
することが不可能であった。 【0006】本発明の目的は、上記従来技術の課題を解
決すべく、文字パターン認識結果と帳票1枚分の文字枠
や罫線等の相互位置関係を表わすレイアウト画面を表示
し、レイアウト表示を参照しながら文字パターン認識結
果に基づく文字パターンにおける部分的な候補文字群か
ら指定することによって容易に修正できるようにした文
字パターン認識修正装置を提供することにある。 【0007】 【課題を解決するための手段】本発明は、上記の目的を
達成するためになされたものであり、文字パターンとそ
の文字パターンを囲む文字枠や罫線等の配列で表わされ
たレイアウト情報とを有する帳票から前記文字パターン
とその文字パターンを囲むレイアウト情報とを画像信号
として入力する入力手段と、前記帳票上の前記レイアウ
ト情報を認識し、当該レイアウト情報をコード情報とし
て格納する格納手段と、該格納手段に格納されたコード
情報から得られるフォーマット情報に基づいて前記入力
手段で入力された前記画像信号から文字パターンの画像
信号を切り出し、当該切り出した画像信号から文字パタ
ーンを認識し、当該文字パターンを文字コード情報とし
て格納する認識手段と、該認識手段により認識されて格
納された文字コード情報から変換された文字パターンと
前記格納手段に格納されたコード情報から変換された前
記帳票1枚分の文字枠や罫線等の配列で表わされたレイ
アウト情報とを同一画面の異なった領域に対応させて表
示すると共に、前記文字パターンに対して部分的に候補
文字群を当該同一画面に表示する表示手段と、該表示手
段に表示されたレイアウト情報と文字パターンとに基づ
いて前記表示された候補文字群から所望の文字を指定す
ることによって前記文字パターンを少なくとも部分的に
修正する修正手段とを備えたことを特徴とする文字パタ
ーン認識修正装置にある。 【0008】 【作用】上記構成により、格納手段に格納されたコード
化されたフォーマット情報を用いてレイアウト画面が構
成できるので、従来の文字イメージを用いる際に課題と
なった以下の点が解決できるばかりでなく、パーソナル
コンピュータなどの上位機に文字イメージを格納するメ
モリを用意する必要をなくすことができる。すなわち、
本発明によれば、文字パターン認識結果の候補文字群か
らの表示修正時にレイアウト画面を作成するフォーマッ
ト情報はデータ量の少ないコード情報であるため、多量
の文字イメージデータを低速なシリアルインターフェー
スを介して転送する必要がなくなり、たとえフォーマッ
ト情報を転送したとしてもリアルタイムの文字読み取り
結果の修正が可能となる。またレイアウト画面は単純な
形の記号や図形から構成されているため、文字イメージ
を圧縮して表示する場合と異なり、イメージ処理を経る
ことなく帳票一枚分の画面を容易に表示することができ
る。更に、この効果は多数項目を手書き漢字などで記入
する大型化した帳票において顕著に表れることとなる。 【0009】 【実施例】先ず、本発明に係る文字パターンの認識修正
の原理を図1、図2を用いて説明する。本発明は文字読
み取りの対象となる入力帳票1(図1)の画像信号を読
み取り、パターン認識して、そのコード情報を得るとと
もに、結果修正用のパーソナルコンピュータ91に格納
されているフォーマット情報から帳票のレイアウト画面
を得るものであり、パーソナルコンピュータのディスプ
レイ2(図2)には読み取り結果の文字コードに対応す
る文字パターン22と入力帳票の2次元イメージに対応
するレイアウト画面21とを同時に表示するようにした
ものである。即ち、本発明では読み取り結果などのキャ
ラクタデータはレイアウト画面を見ることにより帳票上
の何れの文字を修正すべきか即座に判断でき、修正デー
タを容易にキー入力することが可能となる。なお、帳票
上の文字を読み取るための文字枠の位置や読み取るべき
字種を指定する情報及びレイアウト表示に用いる罫線な
どの位置情報を指すフォーマット情報は、通常OCR4
1のメモリ容量の制約からパーソナルコンピュータ91
などの上位機側のフォーマット格納部7に格納されてお
り、必要に応じてOCR41側へ転送される。 【0010】さらに本発明によれば、次の方式がより有
効となる。即ち、レイアウトが面21上でディスプレイ
に表示されている読み取り結果の文字パターン22に対
応する部分領域23のみを色調あるいは輝度を変えて表
示(図2の斜線部分)する機能を追加する。すなわち、
ディスプレイ上に表示された修正すべき読み取り結果
が、帳票上のいずれの位置に相当するかを色調あるいは
輝度を変えて表示する。従って、オペレータは入力帳票
の該当する領域を参照することにより更に容易に修正デ
ータをキー入力することが可能である。 【0011】さらに、読み取り結果の文字コードに対応
する文字パターンのカーソル位置をレイアウト画面へ反
映させたり、あるいはカーソル位置に相当する候補文字
群24等を表示することにより更に修正が容易になるこ
とはいうまでもない。ここで候補文字群とは、文字読み
取りの結果、確からしさの高い文字群を指し、例えば、
門を入力すると門に類似した間聞問等が候補文字群とみ
て出力される。 【0012】次に、本発明の具体的実施例について図面
により説明する。 【0013】図3は本発明による一実施例の構成を示す
ブロック図である。 【0014】図3において、帳票3に記入された文字群
はOCR41の文字観測部4においてラスタスキャンに
より走査された光電変換され2値化される。更に文字観
測部4においてこの得られた画像信号の1文字分がフォ
ーマット格納部7に格納されたフォーマット情報に従っ
て切り出され、認識部5に送られる。この認識部5では
文字認識が行なわれ、そのキャラクタコードが結果バッ
ファ6に蓄えられる。結果バッファ6に蓄えられたキャ
ラクタコードは上位のパーソナルコンピュータ91の要
求に応じてパーソナルコンピュータ91の記憶領域上に
作成された結果バッファ9に転送される。一方、文字の
切り出しに用いられるフォーマット情報は、上位のパー
ソナルコンピュータ91によって作成される上に、OC
R41のメモリ容量の制約から通常はパーソナルコンピ
ュータ91のフォーマット格納部13に格納されてお
り、必要に応じてOCR41のフォーマット格納部7に
転送される。従って、入力帳票3のフォーマット情報は
表示修正に用いる上位のパーソナルコンピュータ91の
フォーマット格納部13に蓄えられている。このフォー
マット格納部13に蓄えられた入力帳票3のフォーマッ
ト情報はレイアウト作成部14に送られる。レイアウト
作成部14では、フォーマット情報を基に図2に示され
たレイアウト画面21を作成する。このイメージ信号
と、前記結果バッファにおいてフォーマッディングされ
たキャラクタコードの出力信号は画面作成部10に送ら
れる。画面作成部10において両者は合成され、ビデオ
信号に変換された上でディスウレイ11に送られる。こ
のディスプレイ11上では図2に示したように画面の右
側に認識結果のキャラクタが出力されており、画面の右
側に帳票1枚分のレイアウトが表示されている。オペレ
ータは入力帳票とレイアウト画面を参照して、右側の表
示データをキーボード12を操作して修正する。この場
合、レイアウト画面と認識結果の表示領域は左右逆であ
っても差しつかえない。また必要に応じて任意の場所に
レイアウト画面を表示または消去することも可能であ
る。 【0015】図4は認識コントローラ8と表示修正コン
トローラ15の動作例を示すフローチャートである。ま
ず、認識コントローラ8は文字観測部4を駆動し、帳票
1枚分の文字群をスキャンして2値化する(31)。こ
の2値化信号の1文字分がフォーマット格納部7のフォ
ーマット情報に従って切り出され、認識部5に送られ
る。次に認識コントローラ8が認識部5を駆動させる
と、認識部5は1文字づつ順次認識処理を実行し、その
認識結果を結果バッファ6に収容する(32)。この様
にして、帳票1枚分あるいは1行分の文字認識が終了す
ると、認識コントローラ8はその旨を表示修正コントロ
ーラ15は結果バッファ6の内容を結果バッファ9に転
送させると共に、レイアウト作成部14を駆動させ、フ
ォーマット格納部13に収容されている入力帳票のフォ
ーマット情報からレイアウト画面を作成する。ここでレ
イアウト画面は認識終了前に、予め作成しても差しつか
えない。次に表示修正コントローラ15が画面作成部1
0を駆動させると、結果バッファ9に格納された認識結
果をディスプレイ11の右側に表示し、レイアウト作成
部14で作成されたレイアウト画面を左側に表示する
(33)。即ち、ディスクプレイ11の画面においてそ
の右側に帳票1枚分あるいは1行分の認識結果が表示さ
れ、左側には帳票1枚分のレイアウトが表示される。こ
こで、認識結果を全部表示できない場合、認識結果の一
部を表示し、指示に応じてスクロールされることは言う
までもない。更に、認識結果の表示領域をレイアウト画
面上に反映させるため、表示領域の色調や輝度を変える
などして、操作性の向上を図る変形も可能である。この
表示領域の色調や輝度を変化させる機構については、従
来公知のハード、ソフトから極めて容易に構成できるこ
とは言うをまたない。例えば、日立パーソナルコンピュ
ータB16のBASIC.V2説明P115〜P119
をみられたい。 【0016】オペレータがこの表示結果を見て、認識結
果に誤りやリジェクト文字を発見した場合は、キーボー
ド12の打鍵により、修正信号を表示修正コントローラ
15に与える。表示修正コントローラ15は、ディスプ
レイ11上の表示結果を書き換えると共に、結果バッフ
ァ9の内容を正しく書き換える(34)。このように、
オペレータはレイアウト画面を見ることにより、その位
置情報から対応する帳票上の正しい文字を容易に参照す
ることができるので、その文字に対応するキーボード1
2のキーを用いて容易に訂正することが可能となる。 【0017】図5は本発明による他の実施例を示すブロ
ック図である。 【0018】図5は、図3の実施例に比べて更に記憶装
置16を表示修正コントローラ15に接続した例であ
る。この例では帳票を読み取る毎にオペレータが修正を
施すことなく次々に帳票を読み取り、認識結果と修正に
必要を候補文字の文字コードおよびフォーマット情報の
ID番号を記憶装置16に格納する。次に複数枚の帳票
処理終了後、記憶装置16の内容を読み出し、ディスプ
レイ11に表示しながらオペレータが修正する。このよ
うに本実施例では一括修正が可能であり、システムの使
用効率が格段に向上する。 【0019】以上のように本実施例によれば、コード情
報であるフォーマット情報を用いて入力帳票イメージを
表示するため、多量の文字イメージデータをOCRとパ
ーソナルコンピュータ間の低速なシリアルインターフェ
ースを介して転送する必要がなくなり、リアルタイムの
文字認識結果の修正が可能となる。また、結果修正補助
画面としてレイアウト画面を表示するため、文字イメー
ジそのものを用いる場合と異なり、帳票1枚分の画面を
容易に表示することができる。 【0020】更に、この効果は多数項目を手書き漢字な
どで記入する大型化した帳票において顕著に表れる。 【0021】 【発明の効果】本発明によれば、認識結果の文字パター
ンの表示と、その文字パターンの部分的候補文字群の表
示と、文字パターンを囲む文字枠や罫線等の配列で表わ
されたレイアウト情報とが同一画面で同時に表示できる
ので、多項目が記載された帳票のいずれの部分を修正す
べきかを容易に判断可能となり、オペレータの修正時の
負担が著しく軽減することができる。また、文字コード
情報から変換された文字パターンと、格納手段に格納さ
れたコード情報から変換された帳票1枚分の文字枠や罫
線等の配列で表わされたレイアウト情報とを同一画面の
異なった領域に対応させて表示するようにしているた
め、文字イメージを圧縮して表示する場合と異なり、レ
イアウト画面は単純な形の記号や図形から構成されてい
ることから、実際の帳票とほぼ同一の帳票一枚分の画面
を容易に表示することができ、より一層、オペレータの
修正時の負担を軽減することができる。また、この効果
は、多数項目を手書き漢字などで記入する大型化した帳
票において顕著に表れる。更に、本発明は、格納手段に
格納されたデータ量の少ないコード情報としてのフォー
マット情報を用いてレイアウト情報を表示するため、1
行分あるいは1頁分の文字イメージをコード化して実時
間で転送し表示して修正することもできる効果を奏す
る。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character reading device such as a kanji OCR, and in particular, when reading or misreading occurs during recognition, it can be easily corrected. The present invention relates to a character pattern recognition / correction device. 2. Description of the Related Art OCR is a method in which characters printed or handwritten on a form are scanned by means such as photoelectric conversion, and the obtained image data is analyzed and recognized to determine what kind of character is. And a device that generates a corresponding character code. However, in this type of apparatus, unreadable characters and erroneous readings occur due to stains on the form, printing quality, disorder of the handwritten font, and the like. In such a case, the operator normally inputs a correct character code by key operation while referring to the display screen and the form, and replaces the previously generated character code with this. However, this correction method has a drawback in that it is difficult to make correspondence between the characters on the display screen and the characters on the form, and the working efficiency is poor. Therefore, a work device is disclosed in Japanese Patent Laid-Open No. 59-16.
As described in Japanese Patent Application No. 0273, character data corresponding to a character code of a read result and gray image data of a form are simultaneously displayed on a display. In addition, many conventional products simultaneously display binary image data instead of grayscale images. According to this method, a plurality of lines of character pattern information can be displayed, and a correction operation can be performed effectively. However, no consideration was given to the following two points. The first point is that with the conversion of kanji to OCR, the size of characters to be entered tends to increase, and eventually the form size tends to increase. [0005] For this reason, even if the resolution of the image data is reduced, it becomes difficult to display one original image on the display. Secondly, unlike the conventional OCR with a display correction function, the OCR is responsible for only the recognition function and the display correction of the recognition result is performed using a higher-level device such as a personal computer, unlike the conventional OCR with a display correction function. It tends to dominate the mainstream. On the other hand, the communication function of the host machine for receiving data from the OCR is often a low-speed serial interface. Therefore, unlike the code data, it is difficult to transfer image data having a large amount of data at high speed in accordance with the correction device, and it has not been possible to realize an improvement in correction efficiency. An object of the present invention is to display a layout screen showing a mutual positional relationship between a character pattern recognition result and a character frame, ruled line or the like for one sheet in order to solve the above-mentioned problems of the prior art, and refer to the layout display. It is another object of the present invention to provide a character pattern recognition / correction device which can be easily corrected by designating a partial candidate character group in a character pattern based on a character pattern recognition result. The present invention has been made to achieve the above object, and is represented by an array of character patterns and character frames, ruled lines, etc. surrounding the character patterns. Input means for inputting the character pattern and layout information surrounding the character pattern as an image signal from a form having layout information; and a storage for recognizing the layout information on the form and storing the layout information as code information. Means and the image information of the character pattern is cut out from the image signal input by the input means based on the format information obtained from the code information stored in the storage means, and the character pattern is recognized from the cut out image signal. Recognizing means for storing the character pattern as character code information; The character pattern converted from the generated character code information and the layout information represented by the arrangement of the character frames, ruled lines, etc. for one sheet converted from the code information stored in the storage means are displayed on the same screen. Based on the display means for displaying the candidate characters in a part of the character pattern on the same screen while displaying them corresponding to different areas, based on the layout information and the character pattern displayed on the display means. Correction means for at least partially correcting the character pattern by designating a desired character from the displayed candidate character group. With the above construction, since the layout screen can be constructed by using the coded format information stored in the storage means, it is possible to solve the following points which are problems when the conventional character image is used. In addition, it is possible to eliminate the need to prepare a memory for storing character images in a host machine such as a personal computer. That is,
According to the present invention, since the format information for creating the layout screen at the time of display correction from the candidate character group of the character pattern recognition result is the code information having a small amount of data, a large amount of character image data is transmitted via the low-speed serial interface. There is no need to transfer the data, and even if the format information is transferred, it is possible to correct the character reading result in real time. Also, since the layout screen is composed of simple symbols and figures, it is possible to easily display a screen for one form without performing image processing, unlike when compressing and displaying character images. . Further, this effect is remarkable in a large-sized form in which a large number of items are filled in with handwritten kanji or the like. First, the principle of character pattern recognition and correction according to the present invention will be described with reference to FIGS. The present invention reads the image signal of the input form 1 (FIG. 1) which is the object of character reading, recognizes the pattern, obtains the code information thereof, and the form information stored in the personal computer 91 for the result correction. In order to obtain the layout screen of the personal computer, the character pattern 22 corresponding to the character code of the read result and the layout screen 21 corresponding to the two-dimensional image of the input form are simultaneously displayed on the display 2 (FIG. 2) of the personal computer. It was made. That is, according to the present invention, the character data such as the read result can be immediately judged which character on the form should be corrected by looking at the layout screen, and the corrected data can be easily keyed in. It should be noted that the format information indicating the position of the character frame for reading the characters on the form, the character type to be read, and the position information such as the ruled lines used for the layout display is usually OCR4.
Due to the limitation of the memory capacity of 1, the personal computer 91
The data is stored in the format storage unit 7 of the host machine, and is transferred to the OCR 41 as necessary. Further, according to the present invention, the following method is more effective. That is, a function is added in which only the partial area 23 corresponding to the read-out character pattern 22 displayed on the display on the surface 21 is changed in shade or shade (hatched portion in FIG. 2). That is,
The position on the form to which the read result to be corrected displayed on the display corresponds is displayed by changing the color tone or luminance. Therefore, the operator can input the correction data more easily by referring to the corresponding area of the input form. Further, the cursor position of the character pattern corresponding to the character code of the read result may be reflected on the layout screen, or the candidate character group 24 corresponding to the cursor position may be displayed to make the correction easier. Needless to say. Here, the candidate character group refers to a character group having high probability as a result of character reading, for example,
When the gate is input, the interrogation similar to the gate is output as a candidate character group. Next, specific embodiments of the present invention will be described with reference to the drawings. FIG. 3 is a block diagram showing the configuration of an embodiment according to the present invention. In FIG. 3, the character group written on the form 3 is photoelectrically converted by the raster scanning in the character observing unit 4 of the OCR 41 and binarized. Further, in the character observing section 4, one character of the obtained image signal is cut out according to the format information stored in the format storage section 7 and sent to the recognizing section 5. The recognition unit 5 performs character recognition, and the character code is stored in the result buffer 6. The character code stored in the result buffer 6 is transferred to the result buffer 9 created in the storage area of the personal computer 91 in response to a request from the host personal computer 91. On the other hand, the format information used for character extraction is created by
The data is normally stored in the format storage unit 13 of the personal computer 91 due to the limitation of the memory capacity of the R41, and is transferred to the format storage unit 7 of the OCR 41 as needed. Therefore, the format information of the input form 3 is stored in the format storage unit 13 of the personal computer 91 used for display correction. The format information of the input form 3 stored in the format storage unit 13 is sent to the layout creating unit 14. The layout creating unit 14 creates the layout screen 21 shown in FIG. 2 based on the format information. The image signal and the output signal of the character code formatted in the result buffer are sent to the screen creation unit 10. The two are combined in the screen creation unit 10, converted into a video signal, and sent to the display 11. On the display 11, as shown in FIG. 2, the character of the recognition result is output on the right side of the screen, and the layout for one form is displayed on the right side of the screen. The operator corrects the display data on the right side by operating the keyboard 12 with reference to the input form and the layout screen. In this case, the layout screen and the display area of the recognition result may be reversed left and right. It is also possible to display or delete the layout screen at an arbitrary place as needed. FIG. 4 is a flowchart showing an operation example of the recognition controller 8 and the display correction controller 15. First, the recognition controller 8 drives the character observing unit 4 to scan and binarize a character group for one form (31). One character of the binary signal is cut out according to the format information in the format storage unit 7 and sent to the recognition unit 5. Next, when the recognition controller 8 drives the recognizing unit 5, the recognizing unit 5 executes the recognition process sequentially one character at a time, and stores the recognition result in the result buffer 6 (32). In this way, when the character recognition for one form or one line is completed, the recognition controller 8 displays that fact, and the correction controller 15 transfers the contents of the result buffer 6 to the result buffer 9 and the layout creating unit 14 Is driven, and a layout screen is created from the format information of the input form stored in the format storage unit 13. Here, the layout screen may be created before the recognition is completed. Next, the display correction controller 15 operates the screen creation unit 1.
When 0 is driven, the recognition result stored in the result buffer 9 is displayed on the right side of the display 11, and the layout screen created by the layout creating unit 14 is displayed on the left side (33). That is, the recognition result for one form or one line is displayed on the right side of the screen of the disc play 11, and the layout for one form is displayed on the left side. Here, when the entire recognition result cannot be displayed, it is needless to say that a part of the recognition result is displayed and scrolled according to the instruction. Further, in order to reflect the display area of the recognition result on the layout screen, a modification for improving the operability by changing the color tone and the luminance of the display area is possible. It goes without saying that the mechanism for changing the color tone and the brightness of the display area can be configured very easily using conventionally known hardware and software. For example, BASIC. V2 Description P115-P119
I want to see. When the operator sees this display result and finds an error or a reject character in the recognition result, the correction signal is given to the display correction controller 15 by tapping the keyboard 12. The display correction controller 15 rewrites the display result on the display 11 and correctly rewrites the contents of the result buffer 9 (34). in this way,
By looking at the layout screen, the operator can easily refer to the correct character on the corresponding form from the position information, so that the keyboard 1 corresponding to the character can be referred to.
The correction can be easily performed using the 2 key. FIG. 5 is a block diagram showing another embodiment according to the present invention. FIG. 5 shows an example in which a storage device 16 is further connected to the display correction controller 15 as compared with the embodiment of FIG. In this example, each time the form is read, the form is read by the operator without making a correction, and the recognition result and the character code of the candidate character and the ID number of the format information necessary for the correction are stored in the storage device 16. Next, after the processing of a plurality of forms is completed, the contents of the storage device 16 are read out and corrected by the operator while being displayed on the display 11. As described above, in this embodiment, batch correction is possible, and the use efficiency of the system is significantly improved. As described above, according to the present embodiment, since the input form image is displayed by using the format information which is the code information, a large amount of character image data is transmitted through the low speed serial interface between the OCR and the personal computer. This eliminates the need for transfer, and enables correction of the real-time character recognition result. Further, since the layout screen is displayed as the result correction auxiliary screen, unlike the case where the character image itself is used, a screen for one form can be easily displayed. Further, this effect is prominent in a large-sized form in which a large number of items are filled in with handwritten kanji or the like. According to the present invention, a character pattern of a recognition result is displayed, a partial candidate character group of the character pattern is displayed, and the character pattern and the ruled line surrounding the character pattern are arranged. Since the layout information and the layout information can be displayed simultaneously on the same screen, it is possible to easily determine which part of the form in which multiple items are described to be corrected, and the burden on the operator at the time of correction can be significantly reduced. Further, the character pattern converted from the character code information and the layout information represented by the arrangement of the character frames, ruled lines, etc. for one form converted from the code information stored in the storage means are different on the same screen. Since the layout screen is displayed in correspondence with different areas, unlike the case of compressing and displaying character images, the layout screen is composed of simple symbols and figures, so it is almost the same as the actual form. Can easily be displayed on a screen corresponding to one form, and the burden on the operator at the time of correction can be further reduced. In addition, this effect is prominent in a large-sized form in which a large number of items are entered with handwritten kanji or the like. Further, according to the present invention, the layout information is displayed by using the format information as the code information having a small data amount stored in the storage means.
There is an effect that a character image for a line or a page can be coded, transferred in real time, displayed, and corrected.

【図面の簡単な説明】 【図1】本発明に係る原理を示した図である。 【図2】本発明に係る原理を示した図である。 【図3】本発明に係る一実施例を示したブロック図であ
る。 【図4】本発明に係るコントローラ動作の流れを示すチ
ャート図出ある。 【図5】本発明に係る他の実施例を示したブロック図で
ある。 【符号の説明】 1…帳票 2…ディスプレイ 21…帳票レイアウト表示部 22…認識結果表示
部 23…認識結果表示領域 24…候補文字表示
部 3…入力帳票 4…文字観測部 6…結果バッファ 7…フォーマット格
納部 8…認識コントローラ 91…パーソナルコン
ピュータ 10…画面作成部 11…ディスプレイ 12…キーボード 13…フォーマット
格納部 14…レイアウト作成部 15…表示修正コン
トローラ 16…記憶装置 101…外部記憶装置
ヘの出力端子
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a diagram showing a principle according to the present invention. FIG. 2 is a diagram showing a principle according to the present invention. FIG. 3 is a block diagram showing an embodiment according to the present invention. FIG. 4 is a chart showing a flow of a controller operation according to the present invention. FIG. 5 is a block diagram showing another embodiment according to the present invention. [Description of Signs] 1 ... Form 2 ... Display 21 ... Form Layout Display Section 22 ... Recognition Result Display Section 23 ... Recognition Result Display Area 24 ... Candidate Character Display Section 3 ... Input Form 4 ... Character Observation Section 6 ... Result Buffer 7 ... Format storage unit 8 Recognition controller 91 Personal computer 10 Screen creation unit 11 Display 12 Keyboard 13 Format storage unit 14 Layout creation unit 15 Display correction controller 16 Storage device 101 Output terminal to external storage device

───────────────────────────────────────────────────── フロントページの続き (72)発明者 門田 彰三 神奈川県小田原市国府津2880株式会社日 立製作所小田原工場内 (56)参考文献 特開 昭55−157072(JP,A) 特開 昭59−144935(JP,A) 特開 昭60−32069(JP,A) 特開 昭58−114171(JP,A) 特開 昭59−105181(JP,A) 特開 昭60−66294(JP,A)   ────────────────────────────────────────────────── ─── Continuation of front page    (72) Inventor Shozo Kadota               2880 Kozu, Odawara, Kanagawa Japan               Tate Manufacturing Odawara Factory                (56) References JP-A-55-157072 (JP, A)                 JP-A-59-144935 (JP, A)                 JP-A-60-32069 (JP, A)                 JP 58-114171 (JP, A)                 JP-A-59-105181 (JP, A)                 JP-A-60-66294 (JP, A)

Claims (1)

(57)【特許請求の範囲】 1.文字パターンとその文字パターンを囲む文字枠や罫
線等の配列で表わされたレイアウト情報とを有する帳票
から前記文字パターンとその文字パターンを囲むレイア
ウト情報とを画像信号として入力する入力手段と、 前記帳票上の前記レイアウト情報を認識し、当該レイア
ウト情報をコード情報として格納する格納手段と、 該格納手段に格納されたコード情報から得られるフォー
マット情報に基づいて前記入力手段で入力された前記画
像信号から文字パターンの画像信号を切り出し、当該切
り出した画像信号から文字パターンを認識し、当該文字
パターンを文字コード情報として格納する認識手段と、 該認識手段により認識されて格納された文字コード情報
から変換された文字パターンと前記格納手段に格納され
たコード情報から変換された前記帳票1枚分の文字枠や
罫線等の配列で表わされたレイアウト情報とを同一画面
の異なった領域に対応させて表示すると共に、前記文字
パターンに対して部分的に候補文字群を当該同一画面に
表示する表示手段と、 該表示手段に表示されたレイアウト情報と文字パターン
とに基づいて前記表示された候補文字群から所望の文字
を指定することによって前記文字パターンを少なくとも
部分的に修正する修正手段とを備えたことを特徴とする
文字パターン認識修正装置。
(57) [Claims] Character patterns and character frames and rules surrounding the character patterns
From a form having layout information represented by an array of lines and the like, a layer surrounding the character pattern and the character pattern.
Input means for inputting and out information as an image signal, recognizing the layout information on the form, the Leia
Storage means for storing out information as the code information, the image input by the input means based on the format information obtained from the code information stored in said storage means
Cut out image signal of a character pattern from the image signal, the switching
The character pattern is recognized from the output image signal and the character
Recognizing means for storing a pattern as character code information; and a character pattern converted from the character code information recognized and stored by the recognizing means and the one-sheet form converted from the code information stored in the storing means. Character box or
Same layout as layout information represented by an array of ruled lines
Different and displays in correspondence to the region, the display means and the layout information displayed on the display means and characters that partially candidate character group to the character pattern to <br/> displayed on the same screen with A character pattern recognition / correction device, comprising: correction means for at least partially correcting the character pattern by designating a desired character from the displayed candidate character group based on the pattern.
JP6094703A 1994-05-09 1994-05-09 Character pattern recognition and correction device Expired - Fee Related JP2667958B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6094703A JP2667958B2 (en) 1994-05-09 1994-05-09 Character pattern recognition and correction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6094703A JP2667958B2 (en) 1994-05-09 1994-05-09 Character pattern recognition and correction device

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP60231164A Division JPH0762859B2 (en) 1985-10-18 1985-10-18 Character pattern recognition and correction device

Publications (2)

Publication Number Publication Date
JPH06342482A JPH06342482A (en) 1994-12-13
JP2667958B2 true JP2667958B2 (en) 1997-10-27

Family

ID=14117535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6094703A Expired - Fee Related JP2667958B2 (en) 1994-05-09 1994-05-09 Character pattern recognition and correction device

Country Status (1)

Country Link
JP (1) JP2667958B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55157072A (en) * 1979-05-07 1980-12-06 Fujitsu Ltd Control system for document data
JPS5932069A (en) * 1982-08-17 1984-02-21 Mitsubishi Electric Corp Optical character reader
JPS59144935A (en) * 1983-02-04 1984-08-20 Ricoh Co Ltd Formation machine of document
JPS6066294A (en) * 1983-09-20 1985-04-16 松下電器産業株式会社 Wordprocessor

Also Published As

Publication number Publication date
JPH06342482A (en) 1994-12-13

Similar Documents

Publication Publication Date Title
EP0298446B1 (en) Full page graphics image display data reduction
US4566039A (en) Facsimile system
JPH06245056A (en) Extending and smoothing processor of picture data
JP2667958B2 (en) Character pattern recognition and correction device
US5563964A (en) Method and apparatus for processing a plurality of designated areas of an image
JPH06268842A (en) Picture processor
JPH0762859B2 (en) Character pattern recognition and correction device
US20020126300A1 (en) Automatic reverse method for reversing the black-and-white monochrome image, and printer unit using the same
JPH0256874B2 (en)
JP3313463B2 (en) Image processing device
JP2854344B2 (en) How to display mixed mode documents
JPH0124319B2 (en)
JPH05151350A (en) Method for correcting position distortion of image data
JPH08223410A (en) Document image input method
JP3568564B2 (en) Document reading system and method of determining size of read document
JP2954218B2 (en) Image processing method and apparatus
JP2721415B2 (en) Character image extraction method
JP2734628B2 (en) Character recognition device
JPH0259500B2 (en)
JP2683711B2 (en) How to recognize / correct character / symbol data
JP2564521B2 (en) Computer terminal
JP3221969B2 (en) Character recognition device
JP2011205473A (en) Image reading apparatus and printing system employing the same
JPS6126717B2 (en)
JPH054381A (en) Image recording device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees