JPS6072084A - Read position designating method in printing chinese character ocr device - Google Patents

Read position designating method in printing chinese character ocr device

Info

Publication number
JPS6072084A
JPS6072084A JP58179018A JP17901883A JPS6072084A JP S6072084 A JPS6072084 A JP S6072084A JP 58179018 A JP58179018 A JP 58179018A JP 17901883 A JP17901883 A JP 17901883A JP S6072084 A JPS6072084 A JP S6072084A
Authority
JP
Japan
Prior art keywords
read position
original
reading position
read
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58179018A
Other languages
Japanese (ja)
Inventor
Akira Toda
明 戸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP58179018A priority Critical patent/JPS6072084A/en
Publication of JPS6072084A publication Critical patent/JPS6072084A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To execute read at a high speed with an original having a similar form by designating and storing in advance a read position on the original by using a digitizer when designating the read position of the original. CONSTITUTION:The read position of the original placed on the digitizer 41 is designated by a pen 42, and stored in a memory 44 through an interface 43. This read position information is displayed as the numerical value of a coordinate on a CRT through an interface 46 by a CPU45. A keyboard 48 is provided in order to correct or add the numerical value of the read position information through the interface 46. The read position information in the memory 44 is stored in a floppy disk 50 by a floppy driver 49. The left upper corner of the original 1 coincides with the original point ''0'' of a read position coordinate, and a position on the original 1 designated by the pen 42 is recognized as an X coordinate and a Y coordinate from this original point ''0''.

Description

【発明の詳細な説明】 この発明は、印刷漢字OCR装置の読取り位置を予め指
定することによって、能率よく漢字の読取りを行なうだ
めの印刷漢字OCRにおける読取り位置指定方法に関す
る。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a method for specifying a reading position in a printed kanji OCR for efficiently reading kanji by specifying the reading position of a printed kanji OCR device in advance.

印刷漢字OCR装置9は、第1図に示すように漢字、か
な混合文の書かれた原稿の読取り位置を指定する読取り
位置指定部4と、原稿の指定された位置の内容を光学ス
キャナで読み取る機構走査部5と、認識のための文字パ
ターンを記憶した辞書メモリ7と、機構走査部5によっ
て読み取られた文字情報に必要な前処理を施し、辞書メ
モリ7に記憶された文字パターンとの類似度を計算する
前処理φ認識部6と1機構走査部5.前処理・認識部6
及び辞書メモリ7のタイミングを制御し、類似度値から
読取り結果を定めて磁気テープlOに文字コートとじて
出力する制御装置8とで成っており、原稿に対してその
読取り位置を読取り位置指定部4で指定すると、原稿の
その部分の内容だけが機構走査部5で読み取られて文字
情報とじて前処理・認識部6へ送られる。前処理・認識
部6ではこの文字情報に適当な前処理を行なった後、辞
tlメモリ7から候補文字の文字パターンを取り出して
この文字情報との類似度を計算する。制御装置8は、候
補文字パターンと文字情報との類似度値から読取り結果
を定め、これを磁気テープIOの文字コートとして出力
するようになっている。
As shown in FIG. 1, the printing kanji OCR device 9 includes a reading position specifying section 4 that specifies the reading position of a manuscript containing mixed kanji and kana sentences, and an optical scanner that reads the contents of the designated position of the manuscript. Similarity between the mechanical scanning section 5, the dictionary memory 7 that stores character patterns for recognition, and the character patterns stored in the dictionary memory 7 after performing necessary preprocessing on the character information read by the mechanical scanning section 5 A pre-processing φ recognition unit 6 and a mechanism scanning unit 5 for calculating the degree. Preprocessing/recognition unit 6
and a control device 8 that controls the timing of the dictionary memory 7, determines the reading result from the similarity value, and outputs it to the magnetic tape IO as a character coat. 4, only the content of that part of the document is read by the mechanical scanning section 5 and sent to the preprocessing/recognition section 6 as character information. The preprocessing/recognition unit 6 performs appropriate preprocessing on this character information, then extracts the character pattern of the candidate character from the dictionary memory 7 and calculates the degree of similarity with this character information. The control device 8 determines a reading result from the similarity value between the candidate character pattern and the character information, and outputs this as a character code of the magnetic tape IO.

そして、印刷、[程に使う場合には、この文字コートは
別置の割イリ原稿供給システト19からのテープ11の
文字の大きさ1位置等の割伺情報と共に編集R12に入
力され、これら入力データに基づいて編集機12は原稿
で与えられた所(pの文章を編集する。編集結果は−・
U記憶装置としての磁気テープ13に記憶され、この記
憶データは明朝体、ゴシフク体等の文字体から構成され
ているフォントメモリ14のデータと共に演算装置(C
PU)15に入力される。このN9装置15は指定人力
された文字の大きさ9位置及び文字体に従ってl J:
L分の文章の大きさ9位置等を演算して形成し、これを
順次ページメモリ16に記tQさせる。こうして、ペー
ジメモリj6に記tQされた各1頁分の文く?データは
レーザビームプリンタ17にり′えられ、ここで版下1
8が作成されて印刷−1,程に送付されるようになって
いる。
Then, when used for printing, this character code is input to the editor R12 together with the character code such as the size and position of the characters on the tape 11 from the separate document supply system 19. Based on the data, the editing machine 12 edits the text at the location (p) given in the manuscript.The editing result is -.
This storage data is stored on a magnetic tape 13 as a storage device, and this storage data is stored in a computing device (C
PU) 15. This N9 device 15 is designed according to the designated character size, position and font.
The size and nine positions of L sentences are calculated and formed, and these are sequentially recorded in the page memory 16. In this way, each one-page sentence written in page memory j6 is written? The data is input to the laser beam printer 17, where the printing plate 1 is printed.
8 is created and sent to print-1.

以−I−のような印刷漢字0CR9において、原稿トの
文字の存在する位置が一定枠内に限られた類似の11:
式で、かつ多;+1の数枚の処理を必要とするような証
票類、商品・部品リスト、人事情報9名簿等の場合、予
め原稿上の読取り位置を指定して記憶しておけば他の部
分の読取時間が省略され、俺率のよい読み取りがif能
となり、他の書式に対してもその都度読取り位置を指定
して記憶しておけば、多種類の書式に対しても対処する
ことができる。また、このようにして多量の原稿を処理
した結果、予め指定した枠の読取り位置からはずれた文
字のために読取り不能となった原稿に対しては、そのよ
うな原稿ごとに個別に読取り位置を指定することができ
れば便利である。よって、この発明の目的は上述のよう
な機能を持つ印刷漢字OCR装置における読取り位置指
定方法を提供することにある。
Similar 11: In printed kanji 0CR9 such as I-I-, the position of the character in the manuscript G is limited to a certain frame:
In the case of documents, product/parts lists, personnel information lists, etc. that require the processing of several sheets, it is possible to specify and memorize the reading position on the manuscript in advance. The reading time for the part is omitted, making it possible to read with a high rate of readability, and if you specify and memorize the reading position for other formats each time, you can deal with many types of formats. be able to. In addition, as a result of processing a large number of originals in this way, if the originals become unreadable due to characters that are outside the reading position of the pre-specified frame, the reading position can be set individually for each such original. It would be convenient if it could be specified. Therefore, an object of the present invention is to provide a method for specifying a reading position in a printing Kanji OCR device having the above-mentioned functions.

以下にこの発明を説明する。This invention will be explained below.

この発明の方法は、上述の印刷漢字OCR装置9の読取
り位置指定の際、ディジタイザを用いて予め原稿]−の
読取り位置を指定して記憶しておくことにより、類似書
式の多数枚の原稿に対して、また、多種類の原稿に対し
ても効率良く対処し得るようにしたものである。
In the method of the present invention, when specifying the reading position of the above-mentioned printed kanji OCR device 9, by specifying and storing the reading position of the original using a digitizer in advance, the reading position of the printed kanji OCR device 9 can be specified and stored. On the other hand, it is also possible to efficiently deal with many types of originals.

第2図はこの発1′!11の実施例の概略構成図であり
、ディジタイザ4191−におかれた原稿の読取り位1
゛r1はペン42によって指定され、インタフェース4
3を介してメモリ44に記憶される。この読取り位置す
、冒・μをCPU(Central Processi
ng Unit)45はインタフェース46を介してC
RT47 、、l:の座標の数値として表示する。キー
ボード48はインタフェース46を介してこのような読
取り位置情報の1a値を訂1[−シたり、J0加したり
するたS月こ設けられており、メモリ46内の10L取
り位置情報は完全なものになるとフロンピートライ/’
:49によってフロッピーディスク50に記憶されるよ
うになっている。
Figure 2 shows this shot 1'! 11 is a schematic configuration diagram of the eleventh embodiment, and the reading position 1 of a document placed on a digitizer 4191-
゛r1 is specified by the pen 42 and the interface 4
3 and stored in the memory 44. This reading position is transferred to the CPU (Central Processing).
ng Unit) 45 via the interface 46
It is displayed as a numerical value of the coordinates of RT47,, l:. The keyboard 48 is provided with a keyboard for correcting or adding J0 to the 1a value of such reading position information through the interface 46, and the 10L reading position information in the memory 46 is completely When it comes to things, Fronpy Try/'
:49 to be stored on the floppy disk 50.

このような構成において、第3図に示すようにディジタ
イザ41のカイ)・51に原稿lはその1−辺と11辺
を接して置かれる。このことによって原稿lの左、1.
隅が読取り位置座標の原点0に一致し、ペン42で指定
する原稿lトの位置はこの原点0からのX座標、Y座標
としてディジタイザ41に認識され、インターフェース
43を介してメモ944内に記憶される。なお、読取り
位置の指定方法としては、例えば行の先頭の位置をペン
42で指定することによりその行全体を指定する方法や
行の最初の文字の位置と最後の文字の位置をペン42で
指定することによってその行を指定する方法や、読取り
位置の枠をペン42でなぞる方法などかある。CPU4
5はメモリ44内に記憶された読取り(6置情報をイン
タフェース4Gを介してGRT47にX、Y座標の数値
として表示させる。オペレータはこのCRT47の画面
を見てディジタイザ41で人力された読取り位置情報を
確認し、必要があればキーポー1:48によってこれを
訂正あるいは追加する。このような訂!1−1追加情報
があれば、これによってCPt145はメモリ44内の
読取り位置情報を書き換えて完全なものにする。そして
、読取り位置情報の指定が終わると、オペレータのキー
ボード48からの指示によってCPU45はフロッピー
ドライバ49を作動させてメモリ44内の読取り位置情
報をフロッピーディスク50に書き込む。そして、この
フロンピーディスク50の読取り位置情報は印刷漢字O
CR装置9の機構走査部に送られて、対応する原稿lの
必要部分だけか能率よく読み取られることになる。
In such a configuration, as shown in FIG. 3, the original l is placed on the edge 51 of the digitizer 41 with its 1st and 11th sides touching. As a result, the left side of manuscript l, 1.
The corner coincides with the origin 0 of the reading position coordinates, and the position of the document specified with the pen 42 is recognized by the digitizer 41 as the X and Y coordinates from this origin 0, and is stored in the memo 944 via the interface 43. be done. The reading position can be specified by, for example, specifying the entire line by specifying the starting position of the line with the pen 42, or specifying the position of the first character and the last character of the line with the pen 42. There are two methods: specifying the line by clicking the line, or tracing the frame of the reading position with the pen 42. CPU4
5 displays the reading position information stored in the memory 44 on the GRT 47 as X and Y coordinate values via the interface 4G. If necessary, the CPt 145 rewrites the read position information in the memory 44 and completes it. When the reading position information is specified, the CPU 45 operates the floppy driver 49 in response to an instruction from the operator's keyboard 48 to write the reading position information in the memory 44 onto the floppy disk 50. The reading position information of the P disk 50 is the printed kanji O
It is sent to the mechanical scanning section of the CR device 9, and only the necessary portions of the corresponding document 1 are efficiently read.

以−1−のようにこの発明によれば予め原稿−にの必要
部分だけを読み取るように読取り位置を指定できるので
、多種類の書式を指定してこれを記tl しておけば多
種類の書式の原稿に対してその都度読取り位置を指定す
る手間を省け、能率のよい多数□枚の類似原稿の高速読
取りがIjf能となるでけでなく、文字の位置がずれた
例外的な原稿に対しても個別に簡単に対処しうろことは
り能となる利点がある。
As described in -1- above, according to the present invention, it is possible to specify the reading position in advance so that only the necessary parts of the document are read. Not only does it save you the trouble of specifying the reading position for each formatted document each time, it makes it possible to efficiently read many similar documents at high speed. There is also the advantage that scales and scales can be easily dealt with individually.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は印刷漢字OCR装置の概略構成図、第2図はこ
の発明の実施例の概略構成図、第3図は原稿のディジタ
イザ1−の位置を示す図である。 l・・・原稿、4・・・読撮り位置指定部、5・・・機
構走査部、6・・・前処理・認識部、7・・・辞書メモ
リ、8・・・制御装置、9・・・印刷漢字OCR装置、
12・・・編集機、14・・・フォントメモリ、15・
・・CPU、 I8・・・ページメモリ、17・・・レ
ーザビームプリンタ、19・・・割付原稿供給システム
、41・・・ディジタイザ、42・・・ペン、43.4
El・・・インタフェース、44・・・メモリ、45・
・・CPU、47・・・CRT、48・・・キーボード
、49・・・フロッピードライ/へ、50・・・フロッ
ピーディスク、51・・・カイト。 出順人代理人 安 形 tiil 正 射 l 図 第 2 @ 第 3 図
FIG. 1 is a schematic block diagram of a printed Chinese character OCR apparatus, FIG. 2 is a schematic block diagram of an embodiment of the present invention, and FIG. 3 is a diagram showing the position of a digitizer 1- for a manuscript. l... Original document, 4... Reading position designation unit, 5... Mechanism scanning unit, 6... Preprocessing/recognition unit, 7... Dictionary memory, 8... Control device, 9...・Printing kanji OCR device,
12... Editing machine, 14... Font memory, 15.
...CPU, I8...Page memory, 17...Laser beam printer, 19...Layout document supply system, 41...Digitizer, 42...Pen, 43.4
El...Interface, 44...Memory, 45.
...CPU, 47...CRT, 48...Keyboard, 49...Floppy dryer/to, 50...Floppy disk, 51...Kite. Figure 2 @ Figure 3

Claims (1)

【特許請求の範囲】[Claims] jψ字、かな混合文の書かれた原稿を読み取って認識ち
る印刷漢字OCR装置において、前記原稿の112℃取
り位置指定の際、ディジタイザを用いて前記原稿−にの
読取り位置を予め指定して記tQ しておくことにより
、XII似11V式の原稿に対して高速の読取りを行な
い得るようにしたことを特徴とする印刷漢字OCR装置
における読取り位置指定方法。
In a printed kanji OCR device that reads and recognizes a manuscript in which jψ characters and kana mixed sentences are written, when specifying a 112°C reading position on the manuscript, a digitizer is used to specify and record the reading position on the manuscript in advance. A method for specifying a reading position in a printed kanji OCR device, characterized in that by setting tQ, high-speed reading can be performed on an XII-like 11V type manuscript.
JP58179018A 1983-09-27 1983-09-27 Read position designating method in printing chinese character ocr device Pending JPS6072084A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58179018A JPS6072084A (en) 1983-09-27 1983-09-27 Read position designating method in printing chinese character ocr device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58179018A JPS6072084A (en) 1983-09-27 1983-09-27 Read position designating method in printing chinese character ocr device

Publications (1)

Publication Number Publication Date
JPS6072084A true JPS6072084A (en) 1985-04-24

Family

ID=16058671

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58179018A Pending JPS6072084A (en) 1983-09-27 1983-09-27 Read position designating method in printing chinese character ocr device

Country Status (1)

Country Link
JP (1) JPS6072084A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5725075A (en) * 1980-07-23 1982-02-09 Toshiba Corp Optical character read device
JPS5752969A (en) * 1980-09-16 1982-03-29 Fuji Xerox Co Ltd Device for inputting coordinate value of picture processor
JPS5768968A (en) * 1980-10-17 1982-04-27 Canon Inc Method and apparatus for image procession

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5725075A (en) * 1980-07-23 1982-02-09 Toshiba Corp Optical character read device
JPS5752969A (en) * 1980-09-16 1982-03-29 Fuji Xerox Co Ltd Device for inputting coordinate value of picture processor
JPS5768968A (en) * 1980-10-17 1982-04-27 Canon Inc Method and apparatus for image procession

Similar Documents

Publication Publication Date Title
US5133024A (en) Image data bank system with selective conversion
JP2003018393A (en) Image processing system
JPS58208865A (en) Document producing device
JPS6072084A (en) Read position designating method in printing chinese character ocr device
JPH0438005B2 (en)
JPS61240361A (en) Documentation device with hand-written character
JP2974346B2 (en) Kanji processing device
JPH02282883A (en) Recognizing system for handwriting input
JPS5971528A (en) Original forming machine
JP2682873B2 (en) Recognition device for tabular documents
JP2616669B2 (en) Brush typeface creation system
JP3012269B2 (en) Printing control device
JPH0392896A (en) Dot pattern generating device
JPH1031471A (en) Method and device for printing and displaying foreign languages including english script and arabic using computer
JPH06314321A (en) Image data base system, control ledger and editing method
JPH11191136A (en) Device and method for processing image
JPH09259225A (en) Character recognizing and converting method and character data processor
JPH08132684A (en) Braille block copy output system and braille block copy outputting method
JPS61198378A (en) Optical character reader
JPH08161308A (en) Document processor
JPH0156430B2 (en)
JPH0782488B2 (en) Document editing device
JPH03147017A (en) Image processor
JPS6320673A (en) Document processor
JPS6360493A (en) Document processor