JPS61117670A - Character cutting-out processing system - Google Patents

Character cutting-out processing system

Info

Publication number
JPS61117670A
JPS61117670A JP59238873A JP23887384A JPS61117670A JP S61117670 A JPS61117670 A JP S61117670A JP 59238873 A JP59238873 A JP 59238873A JP 23887384 A JP23887384 A JP 23887384A JP S61117670 A JPS61117670 A JP S61117670A
Authority
JP
Japan
Prior art keywords
character
circumscribed rectangle
circumscribed
cut out
rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59238873A
Other languages
Japanese (ja)
Inventor
Michiko Iwasaki
岩崎 美知子
Mitsuo Ishii
石井 光雄
Yasukazu Ito
伊藤 能一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59238873A priority Critical patent/JPS61117670A/en
Publication of JPS61117670A publication Critical patent/JPS61117670A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To cut out accurately a circumscribed rectangle corresponding to one character by calculating a circumscribed rectangle circumscribing a picture element group and uniting this circumscribed rectangle and another circumscribed rectangle adjacent to it to generate a new circumscribed rectangle if said calculated circumscribed rectangle is smaller than one character. CONSTITUTION:A picture input part 1 scans characters hand-written on a circuit diagram or the like by a scanner and converts them to picture signals and inputs them to a character cutting-out part 2. The character cutting-out part 2 extracts successively picture elements connected to picture elements constituting characters from picture signals inputted from the picture input part 1 and calculates a circumscribed rectangle circumscribing this picture element group to cut out a rectangular area when a character exists. In this case, if one character described on the circuit diagram is cut out as, for example, two circumscribed rectangles because of partial blur or the like, they are united to generate another circumscribed rectangle. Thus, the circumscribed rectangle corresponding to one character is cut out accurately even if one character is cut out as plural circumscribed rectangles.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字切り出し処理方式、特に回路図等に手書き
等された文字列を文字単位に外接矩形の形に切り出す際
に、当該文字がかすれたり等して分離された状態であっ
ても、当該分離された文字を統括した形の外接矩形を切
り出すように構成した文字切り出し処理方式に関するも
のである。
[Detailed Description of the Invention] [Industrial Application Field] The present invention relates to a character extraction processing method, especially when a character string handwritten on a circuit diagram or the like is extracted character by character into a circumscribed rectangle. The present invention relates to a character extraction processing method configured to extract a circumscribing rectangle that integrates the separated characters even if they are separated due to various reasons.

(従来の技術と発明が解決しようとする問題点〕従来、
回路図等に手書き等された文字をスキャナーによって走
査して画像信号の形に変換した後、計算機システムを用
いて文字認識が行われているが、当該認識を行うに当た
っては、当番亥文字を1偏重位に正確に切り出すことが
必要となる。
(Problems to be solved by conventional techniques and inventions) Conventionally,
Characters handwritten on circuit diagrams, etc. are scanned by a scanner and converted into image signals, and then character recognition is performed using a computer system. It is necessary to accurately cut out the eccentric weight position.

しかし、手書き等された文字を1偏重位に正確に切り出
すために、ある文字の画素に連結して0る全ての画素群
に外接する外接矩形を算出し、当該外接矩形を1文字に
対応する領域として区切っていた。このため、例えば前
記回路図上で文字がかすれていたために、1文字が2個
の外接矩形の形に分離されて切り出されてしまうという
問題点があった。
However, in order to accurately cut out a handwritten character with an emphasis on 1, we calculate a circumscribed rectangle that circumscribes all the pixel groups that are 0 connected to the pixels of a certain character, and make the circumscribed rectangle correspond to one character. It was divided into areas. For this reason, for example, because the characters are blurred on the circuit diagram, there is a problem in that one character is separated into two circumscribed rectangles and cut out.

(問題点を解決するための手段〕 本発明は、前記問題点を解決するために、回路図等に手
書き等された文字を構成するある画素に連結した他の全
ての画素群に外接する形の外接矩形を夏山し、該算出し
た外接矩形が1文字に相当する大きさよりも小さい場合
に、隣接する他の外接矩形とを総合した形の新たな外接
矩形を生成することにより、正確に1文字に対応する外
接矩形を切り出すようにしている。そのため、本発明の
文字切り出し処理方式は、文字列を文字単位に切り出す
文字切り出し処理方式において、前記文字列を画像信号
の形に変換する画像入力部と、1亥画像入力部によって
変換された画像信号中から文字を構成する画素に連結し
ている画素を順次抽出して当該文字を構成する画素群に
外接する外接矩形を生成する文字切り出し部と、該文字
切り出し部によって生成された外接矩形が1個の文字を
分離した形の幅をもつものであるか台かを判別する文字
幅判別部と、該文字幅判別部によって前記外接矩形が1
11IIの文字を分離した幅ともつものでないことが判
明した場合に、当該外接矩形に隣接する他の外接矩形を
検出して統合すべきか否かを判別する左右・上下文字統
合部と、該左右・上下文字統合部によって統合すること
が判明した前記外接矩形の鮒を一体とした新たな外接矩
形を生成する文字抽出部とを備えることを特徴としてい
る。
(Means for Solving the Problems) In order to solve the above problems, the present invention provides a form that circumscribes all other pixel groups connected to a certain pixel that constitutes a character handwritten on a circuit diagram, etc. , and if the calculated circumscribed rectangle is smaller than the size equivalent to one character, a new circumscribed rectangle that is a composite of the other adjacent circumscribed rectangles is generated, so that exactly 1 A circumscribed rectangle corresponding to a character is cut out.Therefore, in the character cutout processing method of the present invention, a character string is cut out character by character. and a character cutting unit that sequentially extracts pixels connected to pixels constituting a character from the image signal converted by the image input unit and generates a circumscribing rectangle circumscribing a group of pixels constituting the character. , a character width determination unit that determines whether the circumscribed rectangle generated by the character cutting unit has the width of one character separated or a width, and the character width determination unit determines whether the circumscribed rectangle is 1
11II characters do not have separate widths, a left/right/top/bottom character integration unit that detects other circumscribed rectangles adjacent to the circumscribed rectangle and determines whether they should be integrated; - A character extraction unit that generates a new circumscribed rectangle that integrates the circumscribed rectangles found to be integrated by the upper and lower character integration unit.

〔実施例〕〔Example〕

以下図面を参照しつつ本発明の実施例を詳細に説明する
Embodiments of the present invention will be described in detail below with reference to the drawings.

第1図は本発明の1実施例構成図、第2図ないし第6図
は第1図図示本発明の1実施例構成の動作を説明する動
作説明図、第7図および第8図は第1図図示本発明のl
実施例構成の動作を説明するフロチャートを示す。
FIG. 1 is a configuration diagram of one embodiment of the present invention, FIGS. 2 to 6 are operation explanatory diagrams explaining the operation of the configuration of one embodiment of the present invention shown in FIG. 1 Figure Illustrating the present invention
A flowchart illustrating the operation of the embodiment configuration is shown.

図中、lは画像入力部、2は文字切り出し部、3はゴミ
処理部、4は文字幅判別部、5は左右上下文字統合部、
6は文字列分割部、7は文字抽出部を表す。
In the figure, l is an image input section, 2 is a character cutting section, 3 is a dust processing section, 4 is a character width discrimination section, 5 is a left, right, top and bottom character integration section,
6 represents a character string division section, and 7 represents a character extraction section.

第1図において、図中画像入力部lは回路図等に手書き
等された文字をスキャナーによって走査し、画像信号の
形に変換して文字切り出し部2に入力するためのもので
ある。
In FIG. 1, an image input section 1 is used to scan characters handwritten on a circuit diagram or the like using a scanner, convert them into an image signal, and input the converted image signals to a character cutting section 2.

図中文字切り出し部2は、後述する如く前記画像入力部
lから入力された画像信号中から文字を構成する画素に
連結した他の画素を順次抽出し、当該抽出した画素群に
外接する形のいわゆる外接矩形を夏山して文字が存在す
る矩形領域を切り出すためのものである。この際、回路
図上に記述された1個の文字が部分的にかずれたり等し
て例えば211の外接矩形の形で切り出された場合には
、後述する如くして例えば2個の外接矩形の形で切り出
されたものを統合して新たな1個の外接矩形の形に生成
している。以下本発明の構成および動作を順次詳細に説
明する。
As will be described later, the character extraction section 2 in the figure sequentially extracts other pixels connected to the pixels constituting the character from the image signal input from the image input section 1, and extracts a shape circumscribing the extracted pixel group. This is for cutting out a rectangular area in which characters exist by extracting a so-called circumscribed rectangle. At this time, if one character written on the circuit diagram is partially shifted or cut out in the form of a circumscribed rectangle of 211, for example, two circumscribed rectangles are cut out as described later. The parts cut out in the form are integrated to generate a new circumscribed rectangle. The configuration and operation of the present invention will be explained in detail below.

図中ゴミ処理部3は、後述する如<1iii像入力部l
によって画像信号の形に変換された文字中に文字を構成
しないような微小な画素が存在する場合に、当Xji微
小な画素を削除していわゆるゴミを取り除くためのもの
である。
In the figure, the dust processing unit 3 includes an image input unit l as described below.
When there are minute pixels that do not form a character in the characters converted into an image signal by Xji, the purpose is to delete the minute pixels and remove so-called dust.

図中文字幅判別部4は、後述する如く文字切り出し部2
によって切り出された外接矩形の横幅(X軸方向の幅)
および縦幅(X軸方向の幅)が予め定めた1文字に対応
する横幅および縦幅に比し、小さい、はぼ同じ位、ある
いは大きいか否かを判別するためのものである。該判別
を行うことによって文字切り出し部2によって切り出さ
れた外接矩形が、■文字を複数個に分離した形で切り出
されたもの、1文字に対応する形で切り出されたもの、
あるいは複数文字(例えば2文字)に対応する形で切り
出されたものか否かを判別することができる。
In the figure, the character width determination section 4 is connected to the character cutting section 2 as described later.
Width (width in the X-axis direction) of the circumscribed rectangle cut out by
This is for determining whether the vertical width (width in the X-axis direction) is smaller, approximately the same, or larger than the horizontal and vertical widths corresponding to a predetermined character. The circumscribed rectangle cut out by the character cutting unit 2 by performing this discrimination is: (1) A circumscribed rectangle cut out in a form in which a character is separated into a plurality of pieces, a circumscribed rectangle cut out in a form corresponding to a single character,
Alternatively, it is possible to determine whether the cutout corresponds to a plurality of characters (for example, two characters).

図中左右・上下文字統合部5は、後述する如く前記文字
幅判別部4によって1文字を複数個の形に分離して切り
出された外接矩形の対を検出するためのものである0例
えば当初切り出された外接矩形の横方向(′#i方向)
の幅が規定の幅の例えは半分以下の場合に、当該統合す
べき外接矩形の対を見つける処理を行う、該処理は、隣
接する他の外接矩形を見つけて当初の外接矩形と当該隣
接する外接矩形とを統合した新たな外接矩形の幅が、前
記規定の幅とほぼ等しいと判別された時に統合すべき外
接矩形の対が検出されたこととする形で行われる。これ
により、分離した形で切り出された複数の外接矩形の対
が検出されることとなる。
The left/right/top/bottom character integration section 5 in the figure is for detecting a pair of circumscribed rectangles cut out by separating one character into a plurality of shapes by the character width discriminating section 4, as will be described later. Horizontal direction of the cut out circumscribed rectangle ('#i direction)
For example, if the width of the specified width is less than half of the specified width, a process is performed to find a pair of circumscribed rectangles to be combined. When it is determined that the width of a new circumscribed rectangle obtained by integrating the circumscribed rectangles is approximately equal to the predetermined width, it is determined that a pair of circumscribed rectangles to be integrated has been detected. As a result, pairs of circumscribed rectangles cut out in separate shapes are detected.

図中文字列分割部6は、後述する如く文字幅判別部4に
よって切り出された外接矩形が祖敗の文字を含むものと
して切り出された場合に、当該外接矩形を文字毎に分割
する最適の位lを算出するためのものである。
In the figure, the character string dividing unit 6 determines the optimal position for dividing the circumscribed rectangle into each character when the circumscribed rectangle cut out by the character width determination unit 4 is cut out as including a character of ``Zoba'' as described later. This is for calculating l.

図中文字抽出部7は、前記左右・上下文字統合部5によ
って検出された統合すべき外接矩形の対を1個の外接矩
形の形に統合したり、あるいは前記文字列分割部6によ
って分割すべき位置として算出された位置で当該外接矩
形を複数個の外接矩形の形に分割したりするためのもの
である。これにより、回路図上に記述された1文字に対
応する外接矩形が、夫々正確に切り出されることとなる
The character extraction unit 7 in the figure integrates the pairs of circumscribed rectangles to be integrated detected by the left/right/top/bottom character integration unit 5 into one circumscribed rectangle, or divides them by the character string division unit 6. This is for dividing the circumscribed rectangle into a plurality of circumscribed rectangles at the position calculated as the exponent position. As a result, each circumscribed rectangle corresponding to one character written on the circuit diagram is accurately cut out.

以下第2図ないし第8図を用いて第1図図示構成の動作
を詳細に説明する。
The operation of the configuration shown in FIG. 1 will be explained in detail below using FIGS. 2 to 8.

第2図は1個の文字“j′が横方向(×方向)に分離し
た場合に統合した形の外接矩形を切り出すための動作を
説明する動作説明図を示す。
FIG. 2 is an explanatory diagram illustrating an operation for cutting out a circumscribed rectangle that is integrated when one character "j' is separated in the horizontal direction (x direction).

第2図(イ)は回路図上に手書きされた1個の文字“J
”を示す、該文字“J′は、図示の如(左右方向(×方
向)に部分的にかすれており、第1図図中画像入力部l
によって画像(8号の形に変換されたものを示す。
Figure 2 (a) shows a single character “J” handwritten on the circuit diagram.
As shown in the figure, the character "J' indicating " is partially faded in the left-right direction (x direction),
The image (converted to the form of No. 8 is shown).

第2図(ロ)は第2図(イ)図示かすれた文字”J゛に
対して外接する2個の外接矩形(l)および(2)の形
で切り出されたものを示す、該生成はM1図図中中字切
り出し部2によって行われる。これは、図中外接矩形f
l+の右方向(文字列方向)に距離゛α”以内に他の外
接矩形であろ外接矩形(2)が存在していたため、統合
の対象とすべく切り出されたものである。該距離“α°
は予め与えられた値であり、当該距離“α″以内距醪に
ある他の外接矩形が後述する統合の対象とされる。また
、外接矩形u+、iよびI2)は、夫々横方向および縦
方向に夫々m、Xn、およびmよ×口□の大きさとしC
切り出される。
FIG. 2(b) shows two circumscribed rectangles (l) and (2) that circumscribe the character "J" shown in FIG. 2(a), cut out. This is done by the middle character cutout section 2 in the figure M1.This is done by the circumscribed rectangle f in the figure.
Since there was another circumscribed rectangle (2) within a distance ゛α” in the right direction (character string direction) of l+, it was cut out to be the object of integration.The distance “α” °
is a predetermined value, and other circumscribed rectangles within the distance “α” are the targets of integration, which will be described later. In addition, the circumscribed rectangles u+, i, and I2) have sizes m, Xn, and m y x mouth □ in the horizontal and vertical directions, respectively.
It is cut out.

第2図(ハ)は第2図(ロ)図中外接矩形il+および
(2)を統合して1個の文字″J”に対応する形の外接
矩形(3)を生成したものを示す、これにより、例えば
回路図上で1個の文字の一部が消えることによって、2
個の外接矩形tl+および(2)の形で切り出されたも
のが、自動的に1個の外接矩形(3)の形に統合される
こととなる。
FIG. 2(C) shows a result of integrating the circumscribed rectangles il+ and (2) in FIG. 2(B) to generate a circumscribed rectangle (3) corresponding to one character "J". As a result, for example, if a part of one character disappears on the circuit diagram, two
The circumscribed rectangles tl+ and those cut out in the form of (2) are automatically integrated into the form of one circumscribed rectangle (3).

第3図は1個の数字“0”の上部に更に横棒が記述され
た数字を切り出す場合の動作を説明する動作説明図を示
す。
FIG. 3 is an explanatory diagram illustrating the operation when cutting out a number in which a horizontal bar is written above a single number "0".

第3図(イ)は回路図上に手書きされた1個の数字°0
゛の上部に横棒が記述された例を示す。
Figure 3 (a) shows a single number °0 handwritten on the circuit diagram.
An example is shown in which a horizontal bar is written at the top of ゛.

第3図(ロ)は第3図(イ)図示上部に横棒が記述され
た数字“O”に対して外接する2個の外接矩形+41お
よび(5)の形で切り出されたものを示す。
Figure 3 (b) shows two circumscribed rectangles +41 and (5) cut out from the number "O" with a horizontal bar written at the top of the figure in figure 3 (a). .

これは、図中外接矩形(4)の上下刃向、距離”β”の
位置に池の外接矩形である外接矩形(5)が存在したた
め、統合の対象とすべく切り出されたものである。該距
離“β”は、予め与えられた(直であり、統合の対象と
する外接矩形間の最長距離を表°4゜尚、外接矩形(4
)および(5)は、夫々横方向および縦方向に夫々m、
Xn、およびm%Xnsの大きさとして切り出される。
This is because a circumscribed rectangle (5), which is a circumscribed rectangle of a pond, existed at a distance “β” in the vertical direction of the circumscribed rectangle (4) in the figure, so it was cut out to be an object of integration. The distance "β" is given in advance (direct), and represents the longest distance between the circumscribed rectangles to be integrated.
) and (5) are respectively m in the horizontal and vertical directions,
It is cut out as a size of Xn and m%Xns.

第3図(ハ)は第3図図中外接矩形(4)および(5)
を統合して1個の数字に対応する外接矩形(6)を生成
したものを示す、これにより、例えば回路図上で1個の
文字の上下方向に横棒等の文字が存在した場合に2個の
外接矩形(4)および(5)の形で切り出されたものが
、自動的に1個の外接矩形(6)の形に統合されること
となる。
Figure 3 (c) shows the circumscribed rectangles (4) and (5) in Figure 3.
This shows that a circumscribed rectangle (6) corresponding to one number is generated by integrating the 2 numbers.For example, if there are characters such as horizontal bars above and below one character on the circuit diagram, 2 The pieces cut out in the form of the circumscribed rectangles (4) and (5) are automatically integrated into the form of the single circumscribed rectangle (6).

第4図および第5図は2文字が横方向あるいは縦方向に
1個の外接矩形の形で切り出された場合に、夫々の文字
毎に分別するための動作を説明する動作説明図である。
FIGS. 4 and 5 are operation explanatory diagrams illustrating an operation for separating each character when two characters are cut out in the form of one circumscribed rectangle in the horizontal or vertical direction.

第4図(イ)は回路図上に記述された相互に接触した文
字”AB”を自像(8号の形に変換したものを示す。
FIG. 4(a) shows the letters "AB" written on the circuit diagram that are in contact with each other converted into a self-portrait (number 8).

第4図(ロ)は、第1図図中文字切り出し部2が第4図
(イ)図示相互に接触した文字”AB”′に対して切り
出した1個の外接矩形(7)を示す0図中当該外接矩形
(7)の大きさは、2mtXnyの形で表される。
FIG. 4(b) shows one circumscribed rectangle (7) cut out by the character cutting part 2 in FIG. In the figure, the size of the circumscribed rectangle (7) is expressed in the form 2mtXny.

第4図(ハ)は、第1図図中文字列分割部6か第4図(
ロ)図中の相互に接触した文字“AB”のほぼ中央付近
であってかつ縦方向に黒の画素の最も少ない位置で左右
に分′Ip1するための位置を検出する状態を示す0図
中°α″1よ、前記中央付近から左右に最小の画素が存
在する領域を検出するために走査する範囲を示す。
Figure 4 (c) shows whether the character string division part 6 in Figure 1 or Figure 4 (
b) Figure 0 shows a state in which the position for horizontally moving Ip1 is detected near the center of the mutually touching letters "AB" in the figure and at the position where there are the least number of black pixels in the vertical direction. °α″1 indicates the range to be scanned to detect the area where the minimum pixel exists on the left and right sides from the vicinity of the center.

第4図(ニ)は、第1因図中文字抽出部7が最小の黒画
素の存在する横方向の位置で相互に接触した文字“AB
゛を夫々外接矩形(8)および(9)の形に分別した状
態を示す、これにより、文字“A“および“B”毎に外
接矩形(8)および(9)が夫々生成されることとなる
FIG. 4(d) shows that the character extraction unit 7 in the first causal diagram is the character "AB" that is in contact with each other at the horizontal position where the minimum black pixel exists.
゛ is divided into circumscribed rectangles (8) and (9), respectively. As a result, circumscribed rectangles (8) and (9) are generated for each character “A” and “B”, respectively. Become.

第5図(イ)は縦方向に相互に接触した文字”FH”を
画像信号の形に変換したものを示す。
FIG. 5(a) shows characters "FH" touching each other in the vertical direction converted into an image signal.

第5図(ロ)は、第1図図中文字切り出し部2が第5図
(イ)図示相互に接触した文字”FH’に対して切り出
した1個の外接矩形(IIをボ4゛1図中当該外接矩形
Qlの大きさは、m、ox20.。の形で切り出される
FIG. 5(b) shows one circumscribed rectangle (II is a box 41) cut out by the character cutout part 2 in FIG. In the figure, the size of the circumscribed rectangle Ql is cut out in the form of m, ox20.

第5図(ハ)は、第1図図中文字列分割部6か第5図(
ロ)図中の相互に接触した文字“Fll”のほぼ中央付
近であってかつ横方向に男の1!!j素の最も少ない上
下(縦)方向に分割するための位置を検出する状態を示
す9図中“β゛は、前記中央付近から最小の画素が存在
する領域を検出するために上下に夫々走査する範囲を示
す。
Figure 5 (c) shows whether the character string division part 6 in Figure 1 or Figure 5 (
b) It is located approximately in the center of the letters “Fll” that touch each other in the figure, and is located horizontally as a man’s 1! ! In Figure 9, which shows the state of detecting the position for dividing in the vertical (vertical) direction with the smallest number of j pixels, "β" indicates the state in which scanning is performed upward and downward from near the center to detect the area where the smallest number of pixels exists. Indicates the range.

第5図(ニ)は、第1図図中文字抽出部7が横方向に対
°して最小の黒画素の存在する縦方向の位置で相互に接
触した文字”FH”を夫々独立した文字“F”および“
H”に対応する外接矩形(11)および(12)の形に
分割した状態を示す、これにより、文字毎に外接矩形(
11)および(12)が生成されることとなる。
FIG. 5(D) shows that the character extraction unit 7 in FIG. “F” and “
This shows a state in which each character is divided into circumscribed rectangles (11) and (12) corresponding to ``H''.
11) and (12) will be generated.

第6図はゴミ除去処理の動作を説明する動作説明図を示
す。
FIG. 6 shows an operation explanatory diagram for explaining the operation of dust removal processing.

第6図(イ)は文字“A”の近傍に微細なゴミ状の黒画
素が存在する場合の画像信号を示す。
FIG. 6(a) shows an image signal when there are fine dust-like black pixels in the vicinity of the letter "A".

第6図(ロ)は、第1図図中文字切り出し部2が第6図
(イ)図示ゴミ状の黒画素を内包した形の外接矩形(1
3)および微小な外接矩形(14)を切り出し状態を示
す、この際、微小な外接矩形(14)は当該矩形が例え
ば切り出そうとする文字に含まれる最小の文字を構成す
る画素よりも小さい場合に切り出しが行われる0図中当
該外接矩形(13)および(14)の大きさは、m12
x n 、、およびmla×n+aの形で切り出される
FIG. 6(b) shows that the character cutout portion 2 in FIG. 1 is a circumscribed rectangle (1
3) and a minute circumscribed rectangle (14) are shown to show the state of cutting out, in this case, the minute circumscribed rectangle (14) is smaller than the pixels constituting the smallest character included in the character to be cut out, for example. In this case, the size of the circumscribed rectangles (13) and (14) in the 0 diagram that is cut out is m12
x n , and mla×n+a.

第6図(ハ)は、第1図図中文字列分割部6が第6図(
ロ)図中ゴミ状の黒画素が存在する文字“A”から当該
ゴミ状の黒画素を除去した外接矩形(15)を示す、こ
れにより、文字中あるいは近傍に存在するゴミ状の黒画
素の除去処理が実行されることとなる。
FIG. 6(C) shows that the character string division part 6 in FIG.
b) Indicates a circumscribing rectangle (15) obtained by removing the dust-like black pixels from the character "A" in which the dust-like black pixels exist in the figure. Removal processing will be executed.

次に、第712Iおよび第8図を用いて第1図図示構成
の動作を更に詳細に説明する。
Next, the operation of the configuration shown in FIG. 1 will be explained in more detail using FIG. 712I and FIG.

図中■は黒!1!i素を発見する状態を示す、これは、
スキャン等を行って第2図(イ)図示の如き文字を構成
する黒画素を発見することを意味する。
■ in the diagram is black! 1! This shows the state of discovering the i-element, which is
This means performing a scan or the like to discover the black pixels that make up the characters as shown in FIG. 2(a).

図中■は塗りつぶしの追跡をイ〒う状態を示す。■ in the figure indicates a state in which fill tracking is enabled.

これは、第2図(イ)図中の途切れた文字“J”のいず
れかの黒画素に連結している他の黒画素を順次追跡する
ことを意味する。
This means that other black pixels connected to any black pixel of the interrupted letter "J" in FIG. 2(a) are sequentially traced.

図中■は外接矩形の幅(m、口)を算出する状態を示す
、これは、状態■で黒画素を順次追跡して検出した全て
の画素群に外接する形のいわゆる外接矩形の横幅(×方
向の幅m)8よび縦幅(Y方向の幅n)を算出すること
を意味する。
In the figure, ■ indicates a state in which the width (m, mouth) of a circumscribed rectangle is calculated. This means calculating the width (m)8 in the x direction and the vertical width (width n in the Y direction).

図中■はレジスタNoに”0”を初!lII値として設
定する状態を示す。
■ in the figure indicates "0" in the register number for the first time! This shows the state set as the lII value.

図中■は、状態■で追跡して求めた外接矩形の左右方向
の幅(m)が、所定の文字に対応する輻(M)の半分以
下(図示m<M/2) 、はぼ等しい([iJ pH:
 m−1M ) 、あるいは1.5倍以上(1小m >
 M” M / 2 )のいずれであるかを判別づる状
態を示す、そして、夫々の状態に応して状態■、状態@
あるいは状態0以下を実行「る。
In the figure, ■ indicates that the horizontal width (m) of the circumscribed rectangle obtained by tracking in state ■ is less than half the radius (M) corresponding to a predetermined character (m<M/2 in the figure), and is approximately equal. ([iJ pH:
m-1M) or 1.5 times or more (1 small m>
M” M / 2), and depending on each state, state ■, state @
Or execute state 0 or lower.

図中■は、追跡して求めた外接矩形の左右方向の幅(m
)が半分以下の場合に実(〒され、レジスタNoに格納
されている内容が“1“であるか否かを判別する状態を
示す、YESの場合には状態@を実行する。Noの場合
には状態■を実行する。
■ in the figure indicates the horizontal width (m) of the circumscribed rectangle obtained by tracking.
) is less than half, it is executed, and indicates a state to determine whether the content stored in the register No. is "1". If YES, execute the state @. If NO Execute state ■.

図中■は、当該外接矩形からX方向に距離“α”離れた
位置以内に存在する他の画素を探索する状態を示す、こ
れは、状態■で判別した外接矩形のX方向の幅が規定の
幅(M)の半分以下であるので、統合すべき対となる予
定の外接矩形を求めるために、当該外接矩形から距離“
α″離れた位置以内に存在する他の画素を探索すること
を意味する。
In the figure, ■ indicates a state in which another pixel existing within a position a distance “α” away from the circumscribed rectangle in the X direction is searched. This means that the width in the X direction of the circumscribed rectangle determined in state ■ is specified. Since the width (M) is less than half of the width (M) of
This means searching for other pixels existing within a position α″ away.

図中■は、状態■で距離“α°離れた位置以内に他の外
接矩形があるか否かを判別する状態を示す、YESの場
合には状態■で当該黒画素に連結する他の全ての画素を
追跡して当該全ての画素を内包する形の外接矩形を求め
た後、状Li@を実行する。また、Noの場合には状態
0を実行する。
In the figure, ■ indicates a state in which it is determined whether there are other circumscribed rectangles within a position separated by a distance of α° in state ■.If YES, all other circumscribed rectangles connected to the black pixel in state ■ are determined. After tracing the pixels of , and finding a circumscribed rectangle that includes all the pixels, the state Li@ is executed.If the answer is No, the state 0 is executed.

図中[相]は、外接矩形の幅(m、n)を修正する状態
を示す、これは、状態■で求めた外接矩形と元の外接矩
形とに外接する新たな外接矩形の形に修正することを意
味する。
In the figure, [phase] indicates a state in which the width (m, n) of the circumscribed rectangle is corrected. This is corrected to the shape of a new circumscribed rectangle that circumscribes the circumscribed rectangle obtained in state ■ and the original circumscribed rectangle. It means to do.

図中Oは、レジスタNOに°l“を設定する状態を示す
、これは、例えば状態■で外接矩形から距離“α”離れ
た位置以内に他の画素が見つからない場合、あるいは他
の画素が見つかったけれども当該見つかった外接矩形と
元の外接矩形とを統合した形の新たな外接矩形がなおも
規定の幅(M)の半分以下である場合例えばゴミ等の外
接矩形の場合に、繰り返して状態■ないし[株]を実行
しないようにするためである。
In the figure, O indicates a state in which °l" is set in register NO. For example, in state ■, if no other pixel is found within a distance "α" from the circumscribed rectangle, or if another pixel is If a new circumscribed rectangle is found, but the new circumscribed rectangle that is a combination of the found circumscribed rectangle and the original circumscribed rectangle is still less than half of the specified width (M), for example, in the case of a circumscribed rectangle such as garbage, repeat the process. This is to prevent the state ■ or [stock] from being executed.

図中◎は、状態■で現在処理を行っている外接矩形の幅
(m)が規定の幅(M)とほぼ等しいことが判明したの
で、当該外接矩形の暢(m)を確定して登録する状態を
示す、液状態@を終了した後、続いて上下方向に対して
の処理として第8図図中[株]を実行する。
◎ in the figure indicates that the width (m) of the circumscribed rectangle currently being processed is almost equal to the specified width (M) in state ■, so the width (m) of the circumscribed rectangle is determined and registered. After completing the liquid state @, which indicates the state in which the liquid is present, "[Stock]" in FIG. 8 is executed as a process for the vertical direction.

図中Oは、状態■で現在処理を行っている外接矩形の幅
(m)が規定の暢(M)に比較して1゜5倍以上である
ことが判明したので、当該外接矩形の幅(m>を横方向
に分割する処理を行う状態を示す。該分割処理は、第4
図を用いて既述した如(、第4図(ハ)図示外接矩形の
ほぼ中央(中心)位置で夫々左右方向に距離“α”の範
囲内で縦方向の黒画素の頻度が最小となる位置を算出し
、咳算出した位置で外接矩形に分割することによって行
われる。
O in the figure indicates that the width (m) of the circumscribed rectangle currently being processed in state ■ is found to be 1°5 times or more compared to the specified width (M), so the width of the circumscribed rectangle is (m>) in the horizontal direction. The division process is performed in the fourth
As already described using the figure (Fig. 4 (c)), the frequency of black pixels in the vertical direction becomes minimum within the range of distance "α" in the left and right directions at approximately the center (center) position of the illustrated circumscribed rectangle. This is done by calculating the position and dividing into circumscribed rectangles at the calculated positions.

第8図図中0は、上下方向の幅(n)が規定幅(N)の
1.5倍以上であるか否かを判別する状嘘を示す、15
倍以下の場合には状B[相]を実行する。1.5倍以上
の場合には状Boを実行する。
In FIG. 8, 0 indicates a condition for determining whether the vertical width (n) is 1.5 times or more the specified width (N), 15
If it is less than double, execute phase B [phase]. If it is 1.5 times or more, execute Bo.

図中0)は、外接矩形の上下方向の幅(n)が規定幅(
N)の1.5倍以上であるので、第5図を用いて説明し
た如く縦方向の分υ1処理を実行する状態を示す。
0) in the figure means that the vertical width (n) of the circumscribed rectangle is the specified width (
Since it is 1.5 times or more of N), a state in which vertical division υ1 processing is executed as explained using FIG. 5 is shown.

図中[相]は、外接矩形の上下方向の幅(n)が規定幅
(N)の1.5(ia以ドであるので、当該外接矩形の
上方向および下方向に夫々距離°β“離れた位置以内に
他の黒画素が存在する場合には、当該黒画素に連結して
いる他の黒画素を追跡して外接矩形のY方向の幅を算出
する状態を示す、そして、当該求めた外接矩形と元の外
接矩形とに外接する形の新たな外接矩形を算出し、該算
出した外接矩形のY方向の幅が規定幅以内にある場合に
状態Oで当該新たな外接矩形のY方向の幅(n)を確定
して登録する。
In the figure, [phase] means that the vertical width (n) of the circumscribed rectangle is less than 1.5 (ia) of the specified width (N), so the distance ° β " If there are other black pixels within a distant position, it indicates a state in which the width of the circumscribed rectangle in the Y direction is calculated by tracking other black pixels connected to the black pixel, and the width of the circumscribed rectangle in the Y direction is calculated. A new circumscribed rectangle that circumscribes the original circumscribed rectangle and the original circumscribed rectangle is calculated, and if the width of the calculated circumscribed rectangle in the Y direction is within the specified width, the Y of the new circumscribed rectangle is calculated in state O. The width (n) in the direction is determined and registered.

以上の如くして1個の文字がかすれたりした等して、X
方向およびY方向に分離した複数個の外接矩形の形で切
り出されたとしても、元の1個の文字に対応した外接矩
形に修正されることとなる。
As mentioned above, one character may be blurred, etc., and the
Even if the character is cut out in the form of a plurality of circumscribed rectangles separated in the direction and the Y direction, the circumscribed rectangle will be modified to correspond to one original character.

〔発明の効果〕〔Effect of the invention〕

以上説明した如く、本発明によれば、rf!J路図等に
手書き等された文字を構成する成る画素に連結した他の
全ての画素群に外接する形の外接矩形を算出し、該算出
した外接矩形が1文字に相当°4る大きさよりも小さい
場合に隣接する他の外接矩形とを総合した新たな外接矩
形を生成しているため、たとえ文字の一部分がかすれた
りした等のためにDi数個の外接矩形の形で切り出され
たとしても、正確に1文字に対応する外接矩形を切り出
すことができる。
As explained above, according to the present invention, RF! Calculate a circumscribed rectangle that circumscribes all other pixel groups connected to the pixels constituting a character handwritten on a J road map, etc., and make sure that the calculated circumscribed rectangle has a size of 4 degrees corresponding to one character. If Di is small, a new circumscribed rectangle is generated by combining other neighboring circumscribed rectangles, so even if a part of the character is blurred or the like, it is cut out in the form of several circumscribed rectangles. It is also possible to cut out a circumscribed rectangle that exactly corresponds to one character.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明のl実施例構成−、第2図ないし第6図
は第11ii0図示本発明の1実施例構成の動作を説明
する動作説明図、第7図および第8図は第1図図示本発
明の1実施例構成の動作を説明するフロチャートを示す
。 図中、lは画像入力部、2は文字切り出し部、3はゴミ
処理部、4は文字幅判別部、5は左右・上下文字統合部
、6は文字列分割部、7は文字抽出部を表す。
FIG. 1 shows the configuration of an embodiment of the present invention, FIGS. 1 is a flowchart illustrating the operation of one embodiment of the present invention; FIG. In the figure, l is an image input section, 2 is a character cutting section, 3 is a garbage processing section, 4 is a character width discrimination section, 5 is a left/right/top/bottom character integration section, 6 is a character string division section, and 7 is a character extraction section. represent.

Claims (1)

【特許請求の範囲】[Claims] 文字列を文字単位に切り出す文字切り出し処理方式にお
いて、前記文字列を画像信号の形に変換する画像入力部
と、該画像入力部によって変換された画像信号中から文
字を構成する画素に連結している画素を順次抽出して当
該文字を構成する画素群に外接する外接矩形を生成する
文字切り出し部と、該文字切り出し部によって生成され
た外接矩形が1個の文字を分離した形の幅をもつもので
あるか否かを判別する文字幅判別部と、該文字幅判別部
によって前記外接矩形が1個の文字を分離した幅をもつ
ものでないことが判明した場合に、当該外接矩形に隣接
する他の外接矩形を検出して統合すべきか否かを判別す
る左右・上下文字統合部と、該左右・上下文字統合部に
よって統合することが判明した前記外接矩形の対を一体
とした新たな外接矩形を生成する文字抽出部とを備える
ことを特徴とする文字切り出し処理方式。
A character extraction processing method for cutting out a character string into character units includes: an image input unit that converts the character string into an image signal; a character extraction section that sequentially extracts pixels contained in the character and generates a circumscribing rectangle that circumscribes a group of pixels constituting the character; and a circumscribing rectangle generated by the character extraction section has a width equivalent to separating one character. a character width determination unit that determines whether the circumscribed rectangle is adjacent to the circumscribed rectangle; A new circumscription that integrates a left/right/top/bottom character integration unit that detects other circumscribed rectangles and determines whether they should be integrated, and a pair of circumscribed rectangles that are found to be integrated by the left/right/top/bottom character integration unit. A character extraction processing method comprising: a character extraction unit that generates a rectangle.
JP59238873A 1984-11-13 1984-11-13 Character cutting-out processing system Pending JPS61117670A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59238873A JPS61117670A (en) 1984-11-13 1984-11-13 Character cutting-out processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59238873A JPS61117670A (en) 1984-11-13 1984-11-13 Character cutting-out processing system

Publications (1)

Publication Number Publication Date
JPS61117670A true JPS61117670A (en) 1986-06-05

Family

ID=17036528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59238873A Pending JPS61117670A (en) 1984-11-13 1984-11-13 Character cutting-out processing system

Country Status (1)

Country Link
JP (1) JPS61117670A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6375983A (en) * 1986-09-19 1988-04-06 Alps Electric Co Ltd Picture dividing system
JPS63250787A (en) * 1987-04-08 1988-10-18 Fuji Electric Co Ltd Method for segmentating character
JPS63257082A (en) * 1987-04-15 1988-10-24 Hitachi Seiko Ltd Character string extracting method
JPH01271890A (en) * 1988-04-22 1989-10-30 Nec Corp Optical character reading device
JPH01292486A (en) * 1988-05-19 1989-11-24 Sony Corp Device for recognizing character
JP2007241356A (en) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd Image processor and image processing program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58197581A (en) * 1982-05-12 1983-11-17 Nec Corp Method and device for recognizing character and figure
JPS6057860B2 (en) * 1982-04-29 1985-12-17 ロバ−ト・カシユ− Protective tube for preventing internal contamination in livestock gynecological syringes

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057860B2 (en) * 1982-04-29 1985-12-17 ロバ−ト・カシユ− Protective tube for preventing internal contamination in livestock gynecological syringes
JPS58197581A (en) * 1982-05-12 1983-11-17 Nec Corp Method and device for recognizing character and figure

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6375983A (en) * 1986-09-19 1988-04-06 Alps Electric Co Ltd Picture dividing system
JPS63250787A (en) * 1987-04-08 1988-10-18 Fuji Electric Co Ltd Method for segmentating character
JPS63257082A (en) * 1987-04-15 1988-10-24 Hitachi Seiko Ltd Character string extracting method
JPH01271890A (en) * 1988-04-22 1989-10-30 Nec Corp Optical character reading device
JPH01292486A (en) * 1988-05-19 1989-11-24 Sony Corp Device for recognizing character
JP2007241356A (en) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd Image processor and image processing program

Similar Documents

Publication Publication Date Title
JP3253356B2 (en) Document image area identification method
US6917706B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP3950777B2 (en) Image processing method, image processing apparatus, and image processing program
KR970017047A (en) Apparatus and method for extracting a title from a document image
JPH10143604A (en) Device for extracting pattern
JP3411472B2 (en) Pattern extraction device
JPH0256708B2 (en)
EP1449153B1 (en) Character separation method and device for recognition
JPS61117670A (en) Character cutting-out processing system
JPH0256707B2 (en)
Tang et al. Text line segmentation based on matched filtering and top-down grouping for handwritten documents
JP2868134B2 (en) Image processing method and apparatus
JPH0410087A (en) Base line extracting method
JP3607753B2 (en) Document image region dividing method and apparatus, and column type discrimination method and apparatus
JPH03126181A (en) Area dividing method for document image
JP3187895B2 (en) Character area extraction method
JPH06187489A (en) Character recognizing device
JP3095470B2 (en) Character recognition device
JPH02273884A (en) Detecting and correcting method for distortion of document image
JP3517077B2 (en) Pattern extraction device and method for extracting pattern area
JPS63136179A (en) Character segmenting device
JP2003271973A (en) Method and program for image processing
JP2917394B2 (en) Character recognition device and character segmentation method
JPH03160582A (en) Method for separating ruled line and character in document picture data
JPH0417086A (en) Method for segmenting character