JPH04242873A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH04242873A
JPH04242873A JP2418460A JP41846090A JPH04242873A JP H04242873 A JPH04242873 A JP H04242873A JP 2418460 A JP2418460 A JP 2418460A JP 41846090 A JP41846090 A JP 41846090A JP H04242873 A JPH04242873 A JP H04242873A
Authority
JP
Japan
Prior art keywords
unreadable
characters
data
character
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2418460A
Other languages
Japanese (ja)
Inventor
Kazuko Hattori
服部 和子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP2418460A priority Critical patent/JPH04242873A/en
Publication of JPH04242873A publication Critical patent/JPH04242873A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To emphasize unreadable character image parts by displaying the image of a peripheral character string (the entire line) including the unreadable characters at the time of correcting the data read by the optical reader. CONSTITUTION:When there is an unreadable character in slip data prepared by a slip data preparation part 2, unreadable character information is prepared from the one line of reading result in the slip data. In a correction processing part 4, slip data including the unreadable characters is stored in a temporary storage part 41, and the line image including the unreadable characters is read out to a line image storage part 44. Further, these data are displayed on a display part 42 as the entire line, and the unreadable character image part is emphasized to be displayed by an emphasis information preparation part 45.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は、光学的文字読取装置に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reading device.

【0002】0002

【従来の技術】光学的文字読取装置は、大量の伝票など
をコンピュータ処理する場合に、オペレータがキーボー
ドから入力するかわりに、機械(OCR装置)にその伝
票を直接読み取らせて入力するのに使われる。その場合
、不特定多数の人々により記入された伝票であるため、
人間が読んでも識別できない文字があるように、機械で
も認識できない文字(すなわち不読文字)が生じる。そ
の不読文字を修正するため、一般に光学的文字読取装置
では、不読文字のイメージ認識結果と一緒に画面表示す
ることが多い。図6は、そのような表示形式の例である
2. Description of the Related Art Optical character reading devices are used when processing a large number of documents on a computer, allowing a machine (OCR device) to directly read and input the documents, instead of an operator inputting them from a keyboard. be exposed. In that case, since the slip was filled out by an unspecified number of people,
Just as there are characters that humans cannot read and identify, there are also characters that cannot be recognized by machines (i.e., illegible characters). In order to correct the unreadable characters, optical character reading devices generally display the image recognition result of the unreadable characters on the screen together with the result. FIG. 6 is an example of such a display format.

【0003】従来の光学的文字読取装置の一例を図4に
示す。図において、1は光学的に走査したデータを文字
として判定する認識部、2はシステム内で処理しやすい
内部形式にデータを加工する帳票データ作成部、3は位
置帳票分の不読文字イメージを全部収集する不読イメー
ジ収集部、4は不読文字を修正する修正処理部、5は認
識結果を入力データとして貯える記録部である。
An example of a conventional optical character reading device is shown in FIG. In the figure, 1 is a recognition unit that determines optically scanned data as characters, 2 is a form data creation unit that processes the data into an internal format that is easy to process within the system, and 3 is an image of unreadable characters for position forms. Reference numeral 4 designates an unreadable image collection unit that collects all characters, numeral 4 represents a correction processing unit that corrects unreadable characters, and numeral 5 represents a recording unit that stores recognition results as input data.

【0004】制御動作は、加工された帳票データを元に
して不読文字がある場合は、図5に示したフローチャー
トに従い、行番号,フィールド番号,フィールド内文字
位置などの不読文字情報を作成し、全不読文字のイメー
ジを収集し、文字イメージ保管部43に文字イメージを
読み出すと同時に、帳票データ一時保管部41に保管さ
れた不読文字を含む帳票データとともに表示部42に表
示し、キーボード46から修正データを入力し、その入
力されたデータを書き込む動作を不読文字がなくなるま
で順次繰り返すのが普通である。
[0004] The control operation is to create unreadable character information such as line number, field number, and character position in the field according to the flowchart shown in FIG. 5 if there is an unreadable character based on the processed form data. Collect images of all unreadable characters, read out the character images to the character image storage section 43, and display them on the display section 42 together with the form data including the unreadable characters stored in the form data temporary storage section 41; Normally, correction data is input from the keyboard 46 and the operation of writing the input data is repeated one after another until there are no more illegible characters.

【0005】[0005]

【発明が解決しようとする課題】上述した従来の光学的
文字読取装置においては、図6に示すように、不読文字
そのもののイメージしか見ることができず、前後の文字
が誤読していた場合には、排出された帳票と見比べなけ
ればならず、帳票と見比べる際、どこの行のどこの部分
の文字なのかわかりにくいなどの欠点があった。
[Problem to be Solved by the Invention] In the conventional optical character reading device described above, as shown in FIG. 6, only the image of the unreadable character itself can be seen, and if the characters before and after are misread. This method had drawbacks such as having to compare it with the ejected form, and when comparing it with the form, it was difficult to tell which line and part of the characters belonged.

【0006】本発明の目的は、以上の欠点を解消して、
帳票と見比べなくても不読文字を含む行のイメージ全体
を見ながら前後関係を考えて修正することができ、不読
文字の文字位置が一目でわかる修正処理をもつ光学的文
字読取装置を提供することにある。
[0006] The purpose of the present invention is to eliminate the above-mentioned drawbacks, and
Provides an optical character reading device that can correct the line containing unreadable characters by looking at the entire image of the line and considering the context without comparing it to a form, and allows correction processing that allows you to see the position of unreadable characters at a glance. It's about doing.

【0007】[0007]

【課題を解決するための手段】前記目的を達成するため
、本発明に係る光学的文字読取装置においては、帳票上
の読取対象文字を光学的に走査し、あらかじめ定められ
た位置に記入もしくは、印字された文字を認識せしめ、
認識不能の文字(不読文字)を修正する際に、不読文字
イメージを表示する光学的文字読取装置において、デー
タを光学的文字読取装置で処理しやすい内部形式に加工
する帳票データ作成部と、不読文字を含む行イメージを
収集する不読イメージ収集部と、帳票データ作成部及び
不読イメージ収集部からのデータに基づいて不読文字を
含む周辺文字列のイメージを表示し、不読文字イメージ
の部分を強調表示する修正処理部とを有するものである
[Means for Solving the Problems] In order to achieve the above object, the optical character reading device according to the present invention optically scans the characters to be read on a form and writes or writes them in a predetermined position. Recognize printed characters,
When correcting unrecognizable characters (unreadable characters), an optical character reading device that displays an image of unreadable characters includes a form data creation unit that processes data into an internal format that is easy to process by the optical character reading device; , displays images of surrounding character strings including unreadable characters based on data from the unreadable image collection unit that collects line images including unreadable characters, the form data creation unit, and the unreadable image collection unit, and The image processing apparatus includes a correction processing section that highlights a portion of a character image.

【0008】また、前記修正処理部は、一時保管部と、
行イメージ保管部と、表示部と、強調情報作成部とを有
し、一時保管部は、不読文字を含む帳票データを保管す
るものであり、行イメージ保管部は、前記不読イメージ
収集部から最初の不読文字を含む行のイメージを保管す
るものであり、強調情報作成部は、不読文字部分を強調
する情報を作成するものであり、表示部は、一時保管部
,行イメージ保管部,強調情報作成部からのデータを合
成して表示するものである。
[0008] Furthermore, the correction processing section includes a temporary storage section;
It has a line image storage section, a display section, and an emphasis information creation section, the temporary storage section stores form data including unreadable characters, and the line image storage section stores the form data including unreadable characters. The emphasis information creation section creates information that emphasizes the unreadable characters, and the display section stores the image of the line containing the first unreadable character.The display section stores the image of the line containing the first unreadable character. This section combines and displays data from the emphasis information creation section and the emphasis information creation section.

【0009】また、記憶部を有し、該記憶部は、正しく
認識された帳票データ及び修正された帳票データを入力
データとして記憶するものである。
[0009] The apparatus also includes a storage section, and the storage section stores correctly recognized form data and corrected form data as input data.

【0010】0010

【作用】帳票上の読取対象文字を光学的に走査し、あら
かじめ定められた位置に記入もしくは、印字された文字
を認識し、認識不能の文字(不読文字)を修正する際に
、不読文字を含む周辺文字列(行全体)のイメージを表
示し、不読文字イメージの部分を枠囲い、又は色違いで
強調表示する。
[Operation] Optically scans the characters to be read on the form, recognizes the characters written or printed at predetermined positions, and when correcting unrecognized characters (unreadable characters) An image of the surrounding character string (the entire line) including the character is displayed, and the part of the unreadable character image is framed or highlighted in a different color.

【0011】[0011]

【実施例】以下、本発明の詳細な実施例について図面を
参照して説明する。図1は、本発明の一実施例の光学的
文字読取装置のブロック図である。図において、1はデ
ータを文字として判定する認識部、2はデータを光学的
文字読取装置で処理しやすい内部形式に加工する帳票デ
ータ作成部である。3は不読文字を含む行イメージを収
集する不読イメージ収集部、4は修正処理部で後述する
修正処理を行う修正処理部、5は正しく認識された帳票
データ及び修正された帳票データを入力データとして記
憶する記録部である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Detailed embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram of an optical character reading device according to an embodiment of the present invention. In the figure, 1 is a recognition unit that determines data as characters, and 2 is a form data creation unit that processes data into an internal format that is easy to process with an optical character reader. 3 is an unreadable image collection unit that collects line images containing unreadable characters; 4 is a correction processing unit that performs correction processing to be described later; 5 is inputted with correctly recognized form data and corrected form data. This is a recording unit that stores data as data.

【0012】次に、この光学的文字読取装置での不読文
字の修正処理の内容を説明する帳票データ作成部2で作
成された帳票データに不読文字があると、不読イメージ
収集部3へ進み、図2のフローチャートに従い、帳票デ
ータ内の1行分の読み取り結果から不読文字情報(行番
号,フィールド番号,フィールド内文字位置)を作成し
、その情報から不読文字の有無をチェックし、不読文字
があれば、その行の行イメージを保管する。不読文字が
無ければ、次の行の不読文字情報作成に移る処理を読み
取り対象行数分繰り返す。不読イメージの収集が終了す
ると、修正処理部4では、不読を含む帳票データを一時
保管部41に保管するとともに表示部42に与えて、こ
れを表示させる。
Next, if there are unreadable characters in the form data created by the form data creation section 2, the unreadable image collection section 3 Proceed to step 2 and create unreadable character information (line number, field number, character position within the field) from the reading result of one line in the form data according to the flowchart in Figure 2, and check the presence or absence of unreadable characters from this information. If there are any unreadable characters, the line image of that line is saved. If there are no unreadable characters, the process of creating unreadable character information for the next line is repeated for the number of lines to be read. When the collection of unreadable images is completed, the correction processing unit 4 stores the form data including the unreadable data in the temporary storage unit 41 and provides it to the display unit 42 for display.

【0013】また、不読イメージ収集部3から最初の不
読文字を含む行のイメージを行イメージ保管部44へ読
み出し、表示部42に与えて、表示させる。あわせて、
強調情報作成部45で最初の不読文字部分の枠囲い情報
を作成し、これも表示させる(図3参照)。
Further, the image of the line containing the first unreadable character is read from the unreadable image collection unit 3 to the line image storage unit 44, and is provided to the display unit 42 for display. In addition,
The emphasis information creation unit 45 creates frame information for the first unreadable character portion and displays this as well (see FIG. 3).

【0014】カーソルを帳票データ内の不読文字位置に
あて、キーボードから修正データの入力を待つ。図6は
、このような表示形式を示している。キーボード46か
らデータが入力されると、一時保管部41に結果が書き
込まれ、行イメージ上の枠囲いは、同一行内の不読文字
へ移り、カーソルも帳票データ上を移動する。同一行内
に不読がない場合は、次の不読文字を含む行イメージを
不読イメージ収集部3から行イメージ保管部44へ読み
出し表示部42に与えて表示し、同様の処理を行う。 これらの処理を不読文字が全て修正されるまで繰り返す
The cursor is placed on an unreadable character position in the form data and the user waits for correction data to be input from the keyboard. FIG. 6 shows such a display format. When data is input from the keyboard 46, the result is written to the temporary storage section 41, the frame on the line image moves to an unreadable character in the same line, and the cursor also moves over the form data. If there is no unreadable character in the same line, a line image containing the next unreadable character is read out from the unreadable image collection section 3 to the line image storage section 44 and is displayed on the display section 42, and the same processing is performed. These processes are repeated until all unreadable characters are corrected.

【0015】[0015]

【発明の効果】以上の説明で明らかなように本発明の光
学的文字読取装置によれば、行データのイメージ全体を
見ることができ、不読文字の文字位置と読取結果の位置
を一目で対応付けられ、帳票と見比べなくても不読文字
の前後関係を見ながら修正することができるという効果
がある。
[Effects of the Invention] As is clear from the above description, the optical character reading device of the present invention allows the entire image of line data to be seen, and the character position of unreadable characters and the position of the reading result to be determined at a glance. This has the effect of making it possible to make corrections while looking at the context of unreadable characters without having to compare them with the form.

【図面の簡単な説明】[Brief explanation of the drawing]

【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing one embodiment of the present invention.

【図2】図1に示した不読イメージ収集部のフローチャ
ートである。
FIG. 2 is a flowchart of an unreadable image collection unit shown in FIG. 1;

【図3】図1に示した実施例の表示部の表示形式を示す
説明図である。
FIG. 3 is an explanatory diagram showing the display format of the display section of the embodiment shown in FIG. 1;

【図4】従来例を示すブロック図である。FIG. 4 is a block diagram showing a conventional example.

【図5】図4に示した不読イメージ収集部のフローチャ
ートである。
FIG. 5 is a flowchart of the unreadable image collection unit shown in FIG. 4;

【図6】従来例の表示部の表示形式を示す説明図である
FIG. 6 is an explanatory diagram showing a display format of a conventional display unit.

【符号の説明】[Explanation of symbols]

1  認識部 2  帳票データ作成部 3  不読イメージ収集部 4  修正処理部 5  記録部 41  帳票データ一時保管部 42  表示部 43  文字イメージ保管部 1 Recognition part 2. Form data creation department 3 Unreadable image collection department 4 Correction processing section 5 Recording Department 41 Temporary form data storage department 42 Display section 43 Character image storage section

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】  帳票上の読取対象文字を光学的に走査
し、あらかじめ定められた位置に記入もしくは、印字さ
れた文字を認識せしめ、認識不能の文字(不読文字)を
修正する際に、不読文字イメージを表示する光学的文字
読取装置において、データを光学的文字読取装置で処理
しやすい内部形式に加工する帳票データ作成部と、不読
文字を含む行イメージを収集する不読イメージ収集部と
、帳票データ作成部及び不読イメージ収集部からのデー
タに基づいて不読文字を含む周辺文字列のイメージを表
示し、不読文字イメージの部分を強調表示する修正処理
部とを有することを特徴とする光学的文字読取装置。
[Claim 1] When characters to be read on a form are optically scanned, characters written or printed in predetermined positions are recognized, and unrecognized characters (unreadable characters) are corrected, In an optical character reading device that displays images of unreadable characters, there is a form data creation unit that processes data into an internal format that is easy to process by the optical character reading device, and an unreadable image collection unit that collects line images that include unreadable characters. and a correction processing unit that displays images of surrounding character strings including unreadable characters based on data from the form data creation unit and the unreadable image collection unit, and highlights portions of the unreadable character images. An optical character reading device featuring:
【請求項2】  前記修正処理部は、一時保管部と、行
イメージ保管部と、表示部と、強調情報作成部とを有し
、一時保管部は、不読文字を含む帳票データを保管する
ものであり、行イメージ保管部は、前記不読イメージ収
集部から最初の不読文字を含む行のイメージを保管する
ものであり、強調情報作成部は、不読文字部分を強調す
る情報を作成するものであり、表示部は、一時保管部,
行イメージ保管部,強調情報作成部からのデータを合成
して表示するものであることを特徴とする請求項1に記
載の光学的文字読取装置。
2. The correction processing section includes a temporary storage section, a line image storage section, a display section, and an emphasis information creation section, and the temporary storage section stores form data including unreadable characters. The line image storage unit stores the image of the line containing the first unreadable character from the unreadable image collection unit, and the emphasis information creation unit creates information that emphasizes the unreadable character part. The display section is a temporary storage section,
2. The optical character reading device according to claim 1, wherein data from a line image storage section and an emphasis information creation section are combined and displayed.
【請求項3】  記憶部を有し、該記憶部は、正しく認
識された帳票データ及び修正された帳票データを入力デ
ータとして記憶するものであることを特徴とする請求項
1に記載の光学的文字読取装置。
3. The optical system according to claim 1, further comprising a storage section, the storage section storing correctly recognized form data and corrected form data as input data. Character reading device.
JP2418460A 1990-12-28 1990-12-28 Optical character reader Pending JPH04242873A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2418460A JPH04242873A (en) 1990-12-28 1990-12-28 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2418460A JPH04242873A (en) 1990-12-28 1990-12-28 Optical character reader

Publications (1)

Publication Number Publication Date
JPH04242873A true JPH04242873A (en) 1992-08-31

Family

ID=18526296

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2418460A Pending JPH04242873A (en) 1990-12-28 1990-12-28 Optical character reader

Country Status (1)

Country Link
JP (1) JPH04242873A (en)

Similar Documents

Publication Publication Date Title
JP3001065B2 (en) How to create a program
JPH04242873A (en) Optical character reader
JPH08329187A (en) Document reader
JP3255503B2 (en) Form image processing device
JPH0991385A (en) Character recognition dictionary adding method and terminal ocr device using same
JPH0384681A (en) Input processing method for business card information
JPH05303661A (en) Acquring/displaying device for partial image data
JPS61198376A (en) Optical character reader
JPH117493A (en) Character recognition processor
JP2649807B2 (en) Character reader
JPH0696272A (en) Business form format definition body generating device
JPS63316189A (en) Optical character recognition device
JP3006294B2 (en) Optical character reader
JP2001052111A (en) Document input method, recording medium recording document input program and document input device
JP4081074B2 (en) Form processing apparatus, form processing method, and form processing program
JPS6326789A (en) Character recognizing device
JPH0554178A (en) Character recognizing device and slip for correction
JP2003085477A (en) Character recognizing device and correcting method of character recognition result
JP3037888B2 (en) Information processing device
JPS61198377A (en) Optical character reader
JPH021354A (en) Recording device
JPH1091719A (en) Method for managing character recognition state
JPS61198375A (en) Optical character reader
JP2001084330A (en) Mark correction confirming system and method and program recording medium for confirmation
JPS61198378A (en) Optical character reader