JPS5878267A - Character cutting system - Google Patents

Character cutting system

Info

Publication number
JPS5878267A
JPS5878267A JP56175621A JP17562181A JPS5878267A JP S5878267 A JPS5878267 A JP S5878267A JP 56175621 A JP56175621 A JP 56175621A JP 17562181 A JP17562181 A JP 17562181A JP S5878267 A JPS5878267 A JP S5878267A
Authority
JP
Japan
Prior art keywords
pattern
character
buffer
signal
mask signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56175621A
Other languages
Japanese (ja)
Inventor
Toru Suzuki
透 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP56175621A priority Critical patent/JPS5878267A/en
Publication of JPS5878267A publication Critical patent/JPS5878267A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

PURPOSE:To cut characters surely with a simple constitution, by tracking line edges and obtaining a mask signal from this data and using this signal for the read of patterned character patterns. CONSTITUTION:A region is scanned from its one side end, and line edge tracking is started from a point where the first black bit is detected, and line edge data is generated. A controlling circuit 107 regards a part, which is surrounded by line edge data and one side end of the cut region, as a character pattern and writes black bits in a pattern buffer 111 up to the rightmost address of each scanning line. Next, the circuit 107 transmits a mask signal 112, which is significant in parts where the pattern exists, in order of S1, S2-Sn in respect to addresses C1, C2-Cn in the main scanning direction of the character pattern of the buffer 111 and outputs a read/write signal 110 synchronously with this transmission, and the character pattern is cut and transferred from a pattern buffer 106 to the buffer 111.

Description

【発明の詳細な説明】 この発明は、光学的文字読取装置(以下OCRと称す−
)に適用される文字切出方式に関する。
DETAILED DESCRIPTION OF THE INVENTION This invention is an optical character reading device (hereinafter referred to as OCR).
) regarding the character extraction method applied to

従来、文字の切り出し方式としては、第1図のように、
予め文字切出領域を定めてこれを行う手法が知られてい
る。
Conventionally, as a method for cutting out characters, as shown in Figure 1,
A method is known in which a character extraction area is determined in advance and this is performed.

即ち、第1図のようK11l上のイメージ「0゜人、ア
、十」が、指定された文字枠100内にあるときは、そ
の垂直方向の射影101は重さならない。
That is, as shown in FIG. 1, when the image "0° person, a, ten" on K11l is within the designated character frame 100, its vertical projection 101 is not heavy.

このため、これらの文字を切り出す際には、予め文字枠
100のピッチによシ定められた周期Tと切出領域tと
を肴するパルス信号Pの、領域tの中間点から切り出す
。これによって通常は切り出しが十分・行なわれうる。
Therefore, when these characters are cut out, they are cut out from the midpoint of the region t of the pulse signal P that serves the period T predetermined by the pitch of the character frame 100 and the cutout region t. This usually allows for sufficient cutting.

ところが第2図に示すように、文字枠100から夫々「
工」「オ」の一部がはみ出し、これら文字の射影101
が重なって切れ目がなくなっている場合には、パルス信
号Pの切出領域tの中間点で切り出しを行いえない。
However, as shown in FIG.
Part of the letters ``工'' and ``o'' protrudes, and projection of these characters 101
If they overlap and there is no cut, it is not possible to cut out the pulse signal P at the midpoint of the cutout region t.

そこで、従来の切り出しの手法としては、例えば「工」
と「オ」の中間部分を、図において紘、横方向の走査を
縦方向に繰シ返えし玉、各横方向の「白jビットの続く
ツイン中のいずれかの点を集合させ良切り出し線を作成
して、この切シ出し線に沿って切り出しを行うことが知
られている。
Therefore, as a conventional cutting method, for example,
In the figure, the middle part of "O" and "O" are scanned in the horizontal direction and then repeated in the vertical direction. It is known to create a line and perform cutting along this cutting line.

しかしながら、いずれの手法も切シ出し線を求めるため
の演算をしなけれとならないことや、そのための附属回
路を設けなけ・ればならない点を改良することが求めら
れゐ。
However, in both methods, it is necessary to perform calculations to obtain the cutting line, and an auxiliary circuit must be provided for this purpose, so improvements are required.

そこで、本発明の第10目的は、文字射影が重り合一)
えときに、確実に大手切出を行いつる方式を提供するこ
とである。tfl、、、第2の目的は、第1の目的を複
雑な演算を行なった夛、回路を複雑にすることなしに行
いうる方式を提供することである。
Therefore, the tenth object of the present invention is to
The purpose is to provide a method for reliably making large cuts and hanging when cutting. tfl..., The second objective is to provide a system that can accomplish the first objective without complicating the circuit, even though it requires complex calculations.

このような目的を実現する丸め、本発明で祉、銀縁追跡
を行いそのデータからマスク信号を得て、これをパター
ン化され丸文字パターン読み出しの除用いるようにした
In order to achieve this purpose, the present invention performs rounding, traces the silver edge, obtains a mask signal from the data, and uses this for reading out the patterned round character pattern.

以下、図面を参照して、実施例を説明する。Examples will be described below with reference to the drawings.

第3図は、OCRの□回路中、本発明が適用される要部
のブロック図であゐ。
FIG. 3 is a block diagram of the main parts of the OCR circuit to which the present invention is applied.

図において、103は前処理回路を示し、この前処理回
路103は、帳票イメージを電気信号に変換し九2次元
パターン104を入力して、帳票上の汚れやゴミ等から
発生されたノイズを除去し、パターン信号105として
パターンバッファ106及び制御回路107へ送る機能
を有する。
In the figure, 103 indicates a preprocessing circuit, and this preprocessing circuit 103 converts the form image into an electrical signal, inputs a 92-dimensional pattern 104, and removes noise generated from dirt, dust, etc. on the form. It has a function of sending the pattern signal 105 to the pattern buffer 106 and the control circuit 107.

パターンバッファ106はRAMであって、前処理囲路
103から送られるパターン信号105を帳票上の文字
2文字分以上格納できる容量を持つ、そして、このパタ
ーンバッファ106は、制御回路107に制御されて書
き込み、読み出しの制御が行なわれる。
The pattern buffer 106 is a RAM and has a capacity that can store the pattern signal 105 sent from the preprocessing circuit 103 for two or more characters on the form.The pattern buffer 106 is controlled by the control circuit 107. Writing and reading are controlled.

コノハターンパソファ106かも読み出されたデータ1
08は、ANDゲート109及び制御回路107へ送ら
れる構成となっている。
Data 1 read out from Konohata Pasofa 106
08 is configured to be sent to an AND gate 109 and a control circuit 107.

制御回路107 B Read / Wr ite信号
110を用イテ、パターンバッファ106及びパターン
バッファ111を制御するとともに、マスク信号112
をANDゲ−) 109へ出力してANDゲー) 10
9の開閉を制御する。まえ、このような機能の他にプロ
セッサとしての演算機能を有し、また内部レジスタを数
個具備しているものとする。
Control circuit 107 uses read/write signal 110 to control pattern buffer 106 and pattern buffer 111, and also controls mask signal 112.
AND game) Output to 109 and AND game) 10
Controls the opening and closing of 9. In addition to these functions, it is assumed that the processor has an arithmetic function as a processor, and also has several internal registers.

ANDゲート109の出力信号113はパターンバッフ
ァ111へ入力される構成となっている。このパターン
バッファ111は、帳票上の文字がパターン化されたデ
ータを1文字分以上格納できる容量を持つ、そして、こ
のパターンバッフ y 111から、制御回路107が
出力するRead /Write信号110によって読
み出されたデータ114は図示せぬ認識部と制御回路1
07とに出力される構成となっている。
The output signal 113 of the AND gate 109 is configured to be input to a pattern buffer 111. This pattern buffer 111 has a capacity to store data in which characters on a form are patterned for one character or more, and data is read from this pattern buffer 111 by a Read/Write signal 110 outputted from the control circuit 107. The generated data 114 is sent to a recognition unit (not shown) and a control circuit 1.
07.

このような構成の回路を用いて、本発明の方式が実現さ
れる。以下、111.2図に示した「工」「オ」を切9
出す場合を例として動作の説明をする。
The system of the present invention is realized using a circuit having such a configuration. Hereinafter, the "ENG" and "O" shown in Figure 111.2 will be cut 9.
The operation will be explained using an example where the command is issued.

2次元パターン104は、前処理囲路103でノイズを
除去され、データ105となって、パターンバッファ1
06に格納される。同時に、データ105は制御回路1
07に入力される。制御回路107は、このデータ10
5を基に1第1図、第2図に示す如き射影101を自己
のレジスタに作成する。
The two-dimensional pattern 104 is subjected to noise removal in the preprocessing circuit 103, becomes data 105, and is stored in the pattern buffer 1.
It is stored in 06. At the same time, data 105 is transmitted to control circuit 1
07 is input. The control circuit 107 uses this data 10
5, a projection 101 as shown in FIGS. 1 and 2 is created in its own register.

しかしながら、予め定められている文字切出領域tによ
って切り出しを行なわんとして、制御囲路107が、切
り出し信号と射影101を比較しても、文字切出領域型
には、射影101の切れ目が存在しないので、本発明の
方式を用いる。
However, even if the control circuit 107 compares the extraction signal and the projection 101 in an attempt to perform extraction using a predetermined character extraction area t, there is a break in the projection 101 in the character extraction area type. Therefore, the method of the present invention is used.

つまLパターンバッファ106の文字切出領域tには、
第4図のようにパターン(O印で示す)が格納されてい
る。そこで、制御回路107は「工」を切り出すために
、(う第4図に示す文字切出領域tの1側端から矢印X
方向に走査し、初めて黒ビットが見つかる点(a)から
銀縁追跡を行う、この結果線数データが作成される。即
ち、第5図に示すような方向ベクトルの各方向に、数値
1〜8を割シ付けておき、まず(a)から出発してベク
トル値「1」の方向からベクトル値「8」の方向へ右回
シヘ黒ビットを探し、最初に発見された黒ビットへ進む
、同様の動作を〈夛か見し、再び切出領域tの1儒端で
ある矢印Xへ戻ゐ、更に同様に、切出領域tのIIII
l端である矢印X上の(b)から再び銀縁追跡をし、矢
印Xへ戻る動作をする。
In the character cutting area t of the Tsume L pattern buffer 106,
As shown in FIG. 4, patterns (indicated by O marks) are stored. Therefore, the control circuit 107 starts from the 1st end of the character cutting area t shown in FIG.
The silver edge is traced from the point (a) where a black bit is found for the first time. As a result, line number data is created. That is, numerical values 1 to 8 are assigned to each direction of the direction vector as shown in FIG. Turn clockwise to search for a black bit, proceed to the first black bit found, repeat the same operation, and then return to arrow III of cutout area t
The silver edge is traced again from (b) on the arrow X, which is the l end, and the movement returns to the arrow X.

このようにしながら、制御回路107は、第6図め×で
示される細緻データをRead /Write信号11
0を用いてRAMであるパターンバッファ111に書き
込む。
While doing this, the control circuit 107 sends the detailed data indicated by × in FIG. 6 to the Read/Write signal 11.
0 is used to write into the pattern buffer 111 which is a RAM.

ここで、制御回路107は、ハ声−ンバッファ111を
各縦方向のアドレス毎に走査し、各主走査ラインの最右
端の黒ビット(第6図の■で示す)のアドレスを図示せ
ぬレジスタへ格納しておく、そして、制御回路107は
、ここで、線繊データと切出領域内の1側端である矢印
Xが囲む部分を文字パターンと見なす、即ち、制御回路
107a、パターンバッファ111に、前述の動作で求
めた最右端(図の■印)のアドレスまで、黒ビットを主
走査方向へ書き込む、このようにして、できたパターン
バッファ111のパターンを第7図に示す。
Here, the control circuit 107 scans the tone buffer 111 for each address in the vertical direction, and stores the address of the rightmost black bit (indicated by ■ in FIG. 6) of each main scanning line in a register (not shown). Then, the control circuit 107 considers the line fiber data and the part surrounded by the arrow X, which is one end of the cutout area, as a character pattern, that is, the control circuit 107a and the pattern buffer 111 Then, black bits are written in the main scanning direction up to the rightmost address (indicated by ■ in the figure) obtained in the above operation. The pattern of the pattern buffer 111 thus created is shown in FIG.

次に、制御回路107は、第7図に示したパターンバッ
ファ1110文字パターンの主走査方向の各アドレスc
1.c、、c、−−−cnについて、パターンの存在す
る部分を有意とするマスク信号S、 、 S、 。
Next, the control circuit 107 controls each address c in the main scanning direction of the character pattern in the pattern buffer 1110 shown in FIG.
1. For c,,c,---cn, a mask signal S, , S, which makes the part where the pattern exists significant.

5l−−s、を作り出す、つまp1制御回路107は、
アドレスCxs C,、cs−−−Cnの夫々に91い
て第7図の文字パターンを縦方向に走査して、黒ビット
が存在する部分を有意(第7図の斜線で示される部分が
Hレベル)としてマスク信号112をSI。
5l--s, the p1 control circuit 107 is,
Addresses Cxs C, cs---Cn are each 91, and the character pattern in Figure 7 is scanned in the vertical direction, and the portions where black bits exist are significant (the shaded portions in Figure 7 are at H level). ) as the mask signal 112 as SI.

’%−8m、−−−,5nOI[で送り出し、との送出
に同期させて、Read /Write信号110を出
力して、文字パターンをパターンバッファ106がらパ
ターンバッファ111へ転送する際に使用する。これに
よりて1パターンバツフア111の切出領域tに相応す
るアドレスには、第7図のような「オ」から分離された
部分のパターンが格納される。
The read/write signal 110 is output in synchronization with the transmission of '%-8m, ---, 5nOI[, and is used when transferring the character pattern from the pattern buffer 106 to the pattern buffer 111. As a result, the pattern of the part separated from "O" as shown in FIG. 7 is stored in the address corresponding to the cutout area t of the one-pattern buffer 111.

つtv1第8第8罠囚されるような文字パターンがパタ
ーンバッファ106に格納されているから、制御回路1
07は、このパターンをANDゲー)109を介してパ
ターンバッファ111へ転送する際に、マスク信号11
2を、アドレスd1.d、、−−−,dnのときは、全
て″″H″H″レベル、そして、切出領域Bc到ると(
つtシアドレスc、 I (’l + −−−*へに到
ると)マスク信号81 、82* s、、 −−−+ 
Snを出力して、「工」のパターンだけ通過させる。
Since the character pattern that will trap the control circuit 106 is stored in the pattern buffer 106, the control circuit 1
07 is the mask signal 11 when transferring this pattern to the pattern buffer 111 via the AND game) 109.
2 at address d1. When d,,---,dn, everything is at the "H" level, and when the cutting area Bc is reached (
tSear address c, I (When reaching 'l + ---*) Mask signal 81, 82* s,, ---+
Output Sn and allow only the pattern of "technique" to pass.

これによって、パターンバッファ111に紘、第8図(
均に示されるようなパターン「工」が転送されたことに
なる。
As a result, the pattern buffer 111 is filled with data (see FIG. 8).
This means that the pattern ``Work'' as shown in Hitoshi was transferred.

仁のようにして、得られた1文字分のパターンは、デー
タ114として図示せぬ認識部へ送られ認識される。
The pattern for one character thus obtained is sent as data 114 to a recognition unit (not shown) and recognized.

i九、文字パターン「オ」をパターンバッファ106か
らパターンバッファ111へ転送する際Ka、先ずアド
レスCw1g−Cs−−−−、Onのときに1「工」を
転送する際に用いたマスク信号S1. S、 。
i9, when transferring the character pattern "O" from the pattern buffer 106 to the pattern buffer 111, Ka, first address Cw1g-Cs----, mask signal S1 used when transferring 1 "work" when it is On; .. S.

Sl、−−−、Snを第9図のように反転させたiスフ
信号S、j、 5/、 86. + −+ 、 f3i
、を作[、Read/Write信号110と同期させ
て、ANDゲート109へ出力する。更に、アドレス偽
以後について紘、マスク信号112を常時rHJレベル
としておき、パターンの転送をすれd良い。
i-suffix signal S, j, 5/, 86.Sl, ---, Sn is inverted as shown in FIG. + −+ , f3i
, is generated and output to the AND gate 109 in synchronization with the Read/Write signal 110. Furthermore, after the address is false, the mask signal 112 is always kept at the rHJ level, so that the pattern can be transferred quickly.

このようにすることによって、文字パターン「オ」につ
いても切夛出しができる。
By doing this, the character pattern "o" can also be cut out.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、従来の切り出し方式を説明すゐ丸めの概念図
、第2図は、従来の方式において文字パターンが重なっ
た場合を説明するための概念図、第3図は本発明の方式
を実現する回路のブロック図、第4図は切出領域のパタ
ーンを示すブロック図、籐5図は細緻追跡に用いるベク
トルの説明図、菖6因乃至第91Qa本発明の詳細な説
明するための概念図である。 103・・・前処塩回路 106 、111・・・パターンバッファ107・・・
制御回路 109・・・ANDゲート 特許出願人 東京芝浦電気株式会社 代理人弁運士 則  近  憲  佑 (壷1か1名) 第1図 第2図 第3図 第4図 竿5図 第6図 第8 (A) 第9 (B)
Fig. 1 is a conceptual diagram of rounding to explain the conventional extraction method, Fig. 2 is a conceptual diagram to explain the case where character patterns overlap in the conventional method, and Fig. 3 is a conceptual diagram of the method of the present invention. Figure 4 is a block diagram of the circuit to be realized, Figure 4 is a block diagram showing the pattern of the cutout area, Figure 5 is an explanatory diagram of vectors used for fine tracking, Iris 6 to 91Qa Concept for detailed explanation of the present invention It is a diagram. 103... Pretreatment salt circuit 106, 111... Pattern buffer 107...
Control circuit 109...AND gate patent applicant Tokyo Shibaura Electric Co., Ltd. Agent Kensuke Chika (one person or one person) Figure 1 Figure 2 Figure 3 Figure 4 Pole Figure 5 Figure 6 8th (A) 9th (B)

Claims (1)

【特許請求の範囲】[Claims] 予め文字切出領域を定めて文字切出を行う方式前記−域
内の1側端から縁縁追跡を行ない線繊データを作成し、
該線繊データと前記領域内の1゜側端が囲む部分を文字
パターンとみなし、該文字パターンの横方向の各アドレ
スにおいて前記ノ(ターンの存在する縦方向の部分を有
意とするマスク信号を作9出し、このマスク信号を前記
領域内の文字パターンを読み出す際にアドレスに対応さ
せて使用し、マスク信号の有意な部分についての文字パ
ターンを作成することによって文字を切出す文字切出方
式。
Method for cutting out characters by predetermining a character cutting area.
The part surrounded by the line fiber data and the 1° side edge in the area is regarded as a character pattern, and a mask signal that makes the vertical part where the turn exists significant is generated at each address in the horizontal direction of the character pattern. 9, the character cutting method uses this mask signal in correspondence with an address when reading out a character pattern in the area, and cuts out a character by creating a character pattern for a significant part of the mask signal.
JP56175621A 1981-11-04 1981-11-04 Character cutting system Pending JPS5878267A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56175621A JPS5878267A (en) 1981-11-04 1981-11-04 Character cutting system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56175621A JPS5878267A (en) 1981-11-04 1981-11-04 Character cutting system

Publications (1)

Publication Number Publication Date
JPS5878267A true JPS5878267A (en) 1983-05-11

Family

ID=15999282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56175621A Pending JPS5878267A (en) 1981-11-04 1981-11-04 Character cutting system

Country Status (1)

Country Link
JP (1) JPS5878267A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61196379A (en) * 1985-02-27 1986-08-30 Hitachi Ltd Character segmenting method
JPH02255995A (en) * 1988-04-28 1990-10-16 Seiko Epson Corp Character segmenting method
JPH04500422A (en) * 1989-06-02 1992-01-23 イーストマン・コダック・カンパニー Method and apparatus for identifying unrecognizable characters in an optical character recognition device
JPH07319998A (en) * 1988-04-28 1995-12-08 Seiko Epson Corp Method for segmenting character

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61196379A (en) * 1985-02-27 1986-08-30 Hitachi Ltd Character segmenting method
JPH02255995A (en) * 1988-04-28 1990-10-16 Seiko Epson Corp Character segmenting method
JPH07319998A (en) * 1988-04-28 1995-12-08 Seiko Epson Corp Method for segmenting character
JP2570415B2 (en) * 1988-04-28 1997-01-08 セイコーエプソン株式会社 Character extraction method
JPH04500422A (en) * 1989-06-02 1992-01-23 イーストマン・コダック・カンパニー Method and apparatus for identifying unrecognizable characters in an optical character recognition device

Similar Documents

Publication Publication Date Title
JP2812982B2 (en) Table recognition method
Maitre et al. A dynamic programming algorithm for elastic registration of distorted pictures based on autoregressive model
JPS5878267A (en) Character cutting system
KR910000203B1 (en) Picture processing apparatus
KR910000202B1 (en) Picture processing apparatus
JPS5813066A (en) Picture size contracting system
RU2153235C2 (en) Method for tracking object and device which implements said method
JP4044469B2 (en) Automatic tracking system and automatic tracking method
JP2848407B2 (en) Mobile vehicle environment recognition device
JP2989617B2 (en) Mobile vehicle environment recognition device
JPH0734229B2 (en) Video recognition device
JP2938217B2 (en) Image processing device
JPH08194825A (en) Outline information extracting device
JPH0425980A (en) Noise removing method
JPH06223183A (en) Outline tracing method
JPS59202574A (en) Character cutting system of character recognizing device
JP3093950B2 (en) Outline information extracting device and method
JPS6175483A (en) Character reader
JPS641827B2 (en)
JPS59165108A (en) Industrial robot
JPH02195430A (en) Character segmenting circuit
JPH0221629B2 (en)
JPS6091481A (en) Polygonal line approximating system
JPH01160167A (en) Picture signal processing method
JPS59149558A (en) Processing system for extraction of apex of closed region