JPS5822478A - 文字切り出し装置 - Google Patents

文字切り出し装置

Info

Publication number
JPS5822478A
JPS5822478A JP56121732A JP12173281A JPS5822478A JP S5822478 A JPS5822478 A JP S5822478A JP 56121732 A JP56121732 A JP 56121732A JP 12173281 A JP12173281 A JP 12173281A JP S5822478 A JPS5822478 A JP S5822478A
Authority
JP
Japan
Prior art keywords
signal
character
generated
counter
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56121732A
Other languages
English (en)
Other versions
JPH039505B2 (ja
Inventor
Nobuhiko Mori
森 宣彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP56121732A priority Critical patent/JPS5822478A/ja
Publication of JPS5822478A publication Critical patent/JPS5822478A/ja
Publication of JPH039505B2 publication Critical patent/JPH039505B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、f、学文字MJIf装置(OCa)で用いら
れる1文字切り出し装置に関するものである。
従来、0CILで用いられる帳票Kd、41図に示すよ
5に、同じ大−会さの文字記入枠が、等間mK。
OCBで検知されない色(ドー、プ・アウト・カラー)
で印刷されて8す、e入省は、この枠内に1文字ずつ正
確に記入する必要がありた。このように、同じ大きさの
文字枠が等間−に並べられてい4e)は、帳票ノlli
像(OCIiL内tlkK@ミ込A、り後、その画像か
ら文字を1文字ずつ切り出す時に用いる、文字切り出し
装置の制約からである。
しかし、決められた文字枠内に複雑な文字を正確に書き
入れる事は、記入者に、とって大きな負担となりていた
。それでも、0CILで読み坂る文字種が数字、英字、
カナ文字、記号等の範囲だけの場合は、文字の複雑さに
それはど大きな違いがないので、このような方法でも何
とか対応できたものの。
漢字とひらがなが鹿った日本文を耽むockLKなると
、−すべての文字を同じ大きさの文字枠内K11l<事
は大変&IIIIlになりてくる。つまり、大部分の文
字が自然な間隔で並ぶように1文字枠の大きさt設定す
ると、時々表われる複雑な漢字が大変−きづらく、逆に
、最も複雑な漢字が楽に−げるように文字枠の大きさt
Ilf定すると、大鄭分を占めるひらがな等の簡単な構
造の文字の部分が間延びし、かつ限られた場所に書ける
文字数が大幅に減少してしまう。このようK、従来の文
字切り出し装置では、文字が等間隔で並んでいる事を前
提として文字の切り出しを行っている為、構造の簡単な
文字と複雑な文字を同一の大きさに脩く必要があり、漢
字かな漏り文では大きな問題となっている。
本発明の目的は、このような問題を解決し、大きさの違
5文字を自在に切り出せる文字切り出し装置を提供する
事にある。
本発明によルば、あらかじめc4j制された文字枠を基
準として文字が記入された帳票のaii*を光学的に得
る手段と、皺画像t”を気傭号に変換し、画像信号とす
る手段と、d−像信号から文字枠の位置t−検知する手
段と、該文字枠の位−を4隼とし九一定範囲の画像信号
を一方向に圧縮して、−次元の圧縮図形f:得る手段と
、該圧縮図形のあらかじめ定められた部分に図形が有る
かf:tj14べ、文字枠数信号を発生する手段と、該
文字枠数信号に従って一文字を切り出す手段とを有する
、文字切り出し装置が得られる。
以下本発明の詳細を、図面を参照して説明する。
第2図、第3図、第4図は、本発明による文字切り出し
装置の第1の実施例を示すブロック図である。また、第
5図は第2図、第3図、薬4図に示す各信号の波形を示
すタイムチャートである。
さらに、第6図、M7図は文字枠数の指定を説明するた
めの図である。第2図において、帳9743 HCは文
字枠を基準としてOCRで読み取るべき文字が記入され
ている。各文字枠の上部には第6図に示すように点線l
が文字枠と共にドロップ・アウト・カラーで印刷されて
おり、文字記入時に、この点線より上に文字部分を彎(
か否カ)で使用する文字枠数t−指定する拳ができる。
つまり、第61の例では、1文字t−1つの文字枠内1
c1N<時は点線より下に書き、2つの文字枠を使って
書く吋は点線より上にはみ出して書いている。点線より
上pcはみ出して書いた時に使用する文字枠数は、あう
かじめ決めておけばいくらでもよく、第7図は1.5、
枠を使用する揚台の一例である。第7図の一点鎖線2は
、枠の中心線を示す。このようにして書かれた文字の切
り出しは、各文字毎に高さを測って幅を決定すればよい
ので、容易に正確に行う事ができる。以後の説明は、第
6図に示した方法で文字が記入されているものとして行
う。第2図において帳票3には各文字枠の左下にタイミ
ング、マーク4がOCBで検知される色で印刷されてい
る。
帳票の移動方向は5で示される方向である。光源6で帳
票が照射され、その反射光がレンズ7で果められ、12
8ビ、トの一次元充電変換貞子8の上に帳票の像が結ば
れる。光電変換素子8では、像の明るさの信号を電気信
号に&洟し、その電気信号を増11169に送り、スラ
イサioで2M1信号に変換し、128ビ、トのシフト
・レジスタ11に入力する。128ビ、トのシフト・レ
ジスタは2個直列につながれてJす、その内容は信号8
)INFTPが発生する毎に順次1つずつ下にシフトさ
れる。帳票上の各行の処理の最初に発生する信号GI9
Tで、これらのシフト・レジスタの内容は0にクリアー
される。光電変換素子8ρ1ら1列の信号が取り出され
る時の順番は、帳票上では、12で示した下から上の方
向である。シフト・レジスタ11には。
タイミング・マーク検知部があり、その1例を点線で囲
んだ13内に示す、13において0は白の点、lは黒の
点、Δは白と黒のどちらでもよい点を示す。タイミング
・マークが検m−Jれると、信号″1’MARK を発
生する。タイミング・マークの位置が判ると、−律信号
上の文字枠の位置を計算により求める事ができるが、こ
こでは図中のyの長文字砕の下端の位置の情報がちょう
どスライサlOの出力INDATムとじて得られるよ)
にしている。
#43図において、フリ、プ・フロ、プ14[,1各文
字切り出しの11k初に発生する信号CATでリセ、ト
され、信号砿RKでセットされる。カウンタ15は信号
C8Tでクリアーされ、信号TMARK が発生した後
の、各列の画曹信号のIk初に発生する信号板けO数を
数えるが、2まで数えると信号W8TfLを発生し、そ
こで計数を中止する。このカウンタ15は、クイj/グ
マークが!!11知されてから文字枠の左端に至るまで
の列数をカウントするもので、ここでは2列であると設
定されている。
力クンタ16は信号087でクリアーされ、信号T紘1
区が発生した後の信号8CLOCKO故を数える。信号
801.OCKは第4図のアンドグー)17の出力であ
るが、信号8HIPTPを信号J13NDでゲートし、
文字切り出し中だけ発生するよ5Kしたものである。カ
ウンタ16は7ビ、トのカウンタであり、信号I’MA
RK が発生してからカウントを曲始するので、信号I
 NDATAが文字枠の下端の部分の信号の時Oとなり
、その位置から64個の信号INDAT人を得た時、最
上位ビットが1となる。ここでは文字枠の高さを64ビ
ツト長に合わせてGするので、文字枠内の画像信号を得
る為には、カウンタ16の最上位ビットがOの間だけ信
号INI)AT人を記憶すればよい事になる。メモリ1
8は信号I NDATAを記憶するものでカウンタ15
が信号W8TRを発生した後、カウンタ16の最上位ビ
ットが00間だけ信号8CLOCKより信号W)LIT
BPt作り、その信号に同期して信号INDATAを記
憶する。カラ/り19はメモリ18のアドレスカウンタ
で、信号C8Tでクリアーされ死後、メモリ18.ζデ
ータが1つ4IIき込まれる毎にlが刃口見られてゆく
。第4図においてシフトレジスタ20Fi64ビ、トの
シフトレジスタであり、メモリ18に記憶される画像信
号を横方向に圧縮した圧縮図形を作成′する。シフト・
レジスタ20は信号C8Tでクリアされ、信号WルI’
l’WPで1ビ。
ト・シフトされる。入力信号とじては、自身の出力信号
と15号INDATAとのオフを用い/)。カウンタ2
1は信号C8Tでクリアーされ、1を号WSTルが発生
し死後の信号RJTの数を数えるが、これはメモリ18
に記憶されるth像僅号の列数上チェ、りするものであ
る。文字枠のst’zここでは30列であるので、カウ
ンタ21の内容が29に達した詩、信号比30を頻生じ
、この時、圧縮図形を記憶し九シフト・レジスタ2Gの
上部(1m6図の文字枠における点線より上の一分)に
黒ビットがないと信号F’RAMINが発生して、アン
ド・ゲート23のアンドがとれ、信号RflTに同期し
てフリ、グ・フロップ22がセットされ、信号ENDが
発生して文字切り出しが終る。しかし、シフト・レジス
タ20の上部に黒ビットがあると、ここで文字切り出し
は行われず、さらにカウンタ21の内容が63に達し信
号比64を発生するまでメモリ18に画像信号が記憶さ
れる。フリ、プ・フロップ22は信号C8Tでリセット
される。切り出された文字のIj!i像信号はメモ!7
18に記憶されており、文字認識はこの画像信号を用い
て行う事ができる。
第6図に示した数字は、各文字枠の縦横のビット長であ
る。第5図値各1d号のタイム・チャートである。
s8図は不発明の第2の実施例を示すグーツク図であり
、先に第2図〜縞4図を用いて説明した第1の実/#A
例と違っている部分のみ全示したものであ勘。編9図、
第10図はこの第2の実施例に対応する文字枠数の指定
を説明するための図である。第8因は、第4図の信号F
ルAn RNを発生するゲートとシフト・レジスタ20
の部分に相当する。
先に説明した実施例では、1文字が占有する文字枠数を
文字の高さにより指定したが、ここで示す実施例では、
文字の幅により指定している。帳票上にあらかじめ印刷
された文字枠への文字記入法は次のようである。
第9図に示すように1つの文字を1つの文字枠内に書く
時は、枠間金白30にかからないように★き、2つの文
字枠を使って書く時は、その間の枠間金白に文字線がか
り)るようにして書く。この場合も、使用する文字枠数
は、あらかじめ決めておけばいくらでもよく第10図、
′i1.5枠t−1I2!用する場合の一例である。こ
の場合の文字切り出しJま、枠間余由に文字部分がある
か否かtmへて文字の−を決定rればLいので、4易に
正4に行う事ができる。以後の説明(よ、第9図に示し
た方法で文字が記入されているものとし°CC50 第8図において、フリ、プ・)p、プ311i谷列の画
像信号の最初に発生する信号R8Tでリセ。
トされ、メモリ18に*き込み信号WRI’l’i!P
で画像信号INDAT人を書き込んでいる間に1(1)
を書き込むとセットされる。つまりクリップ・フロップ
31は、1列中に黒があるか否かを記憶している事にな
る。シフト・レジスタ32/i各文字の切り出しの最初
に発生する信号CATでクリアーされ、信号RBTの立
上りに同期しで、フリ、プ・フロップ31の出力を順次
記憶する。1つの文字枠とその後の枠間余白の一部分の
゛層成をメモリ18に記憶した時、このシフト・レジス
タ32の出力を調べ、枠間余白に相当する部分ンζ黒部
分がない場合、つまりオア・ゲート33の出力F kL
kMB Nが1の場合、そこでメモリへの記憶全中止し
て1文字を切り出し、PRAMENがOの場合、2つの
文字枠の領域を記憶し終rまで、メモリ18へのii!
i像信号の記憶を続行する。
以上で詳しく説明したように、本発明による文字切り出
しg&置を用いると、1文字が占有する文字枠数が9変
の場合でも容易に正確に文字の切り出しができるので、
帳票への文字記入者は、各文字の構造の複雑さに応じて
使用する文字枠数を変える事ができ、複雑な文字がdl
Fき易く、かつ簡単な文字の所で間延びがせず、限られ
た場所に多くの文字を書く事ができるようになる。
【図面の簡単な説明】
第1図は1つの文字枠内に1文字を書く方法の一例を示
す図、第2図、第3図、第4図は本発明の第1の実施例
を示すプp、り図、第5図は第2図、第3図、M4図の
各信号の波形を示すタイムチャー)、 MX6図と第7
図は文字の高ざで1文字が占有する文字枠数を指定する
例を説明するための図、第8図は本発明の第2の実施例
のを示すもので第2図〜第4図で示した装置との州道す
る点を示したグρ、り凶、第9区と第10図は、第2の
実施例に対応する枠間余白における文字41 v仔無で
1文字が占有する文字枠数を指定する例を説明するため
の図である。 図に寝いて、lは文字枠内の領域を分割する潟の点線、
2紘文字枠の中心を示した一点鎖線、3は帳票、4はタ
イ4ング・マーク、5は帳票の移動方向、6は光源、7
はレンズ、8は一次元光・電変換素子、9は増幅器、1
0はスライサ、11はシフト、レジスタ、12は帳票上
での1列のt#信号の入力される順番、13はタイミン
グ・マークを検知する為のマスク、14,22/よフリ
、プ・7g、プ、15,16,19.21はカクンタ、
18はメモリ、20はシフトレジスタ、17゜23はア
ンド・ゲート、31は7す、プ・フp。 プ、32はシフト・レジネタ、33はノア・ゲート、3
0 rよ枠間余白である。 才1目 オ6図      オフ圓 t9図      710胆

Claims (1)

  1. 【特許請求の範囲】 あらかじめ印刷された文字枠を基準として文字が記入さ
    れた帳票の画像を光学的に得る手段と。 威画曽を電気信号に蛮換し、画像信号とする手段と、該
    −像信号から文字枠の位置を検知する手段と、跋文生粋
    の位111iを基準とした一定範囲の画像信号を一方向
    に圧縮しC1−1元の圧−図形を得る手段と、該圧1I
    I11!1形のあらかじめ芝められた部分に図形がイる
    かt調べ、又字枠鋏信号を発生する手段と、該文字枠数
    信号に従って一文字を切り出す手段とを奮する事を特徴
    とする文字切り出し装置。
JP56121732A 1981-08-03 1981-08-03 文字切り出し装置 Granted JPS5822478A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56121732A JPS5822478A (ja) 1981-08-03 1981-08-03 文字切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56121732A JPS5822478A (ja) 1981-08-03 1981-08-03 文字切り出し装置

Publications (2)

Publication Number Publication Date
JPS5822478A true JPS5822478A (ja) 1983-02-09
JPH039505B2 JPH039505B2 (ja) 1991-02-08

Family

ID=14818506

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56121732A Granted JPS5822478A (ja) 1981-08-03 1981-08-03 文字切り出し装置

Country Status (1)

Country Link
JP (1) JPS5822478A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6358515B2 (en) 1997-01-30 2002-03-19 Senju Pharmaceutical Co., Ltd. Hydroquinone derivatives

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6358515B2 (en) 1997-01-30 2002-03-19 Senju Pharmaceutical Co., Ltd. Hydroquinone derivatives

Also Published As

Publication number Publication date
JPH039505B2 (ja) 1991-02-08

Similar Documents

Publication Publication Date Title
US3665450A (en) Method and means for encoding and decoding ideographic characters
US3238501A (en) Optical scanning pen and codedcharacter reading system
US4228507A (en) Methods and means for reproducing non-alphabetic characters
US2894247A (en) Character recognition device
JPH0157836B2 (ja)
GB1141682A (en) Teaching apparatus
US3798421A (en) Double field code reading system
JPS5822478A (ja) 文字切り出し装置
US3408483A (en) Readout for space coded data
US4490789A (en) Method and means for reproducing non-alphabetic characters
JPS59149526A (ja) フイ−ルド内文書編集処理装置
US3500323A (en) Handwritten character recognition apparatus
GB1257142A (ja)
FI60322C (fi) Kodnings- och kodtolkningsapparat i form av en skrivmaskin
JPH0132556B2 (ja)
US4066350A (en) Character display and input device
US3827025A (en) Reading machine employing a two-dimensional multiple snapshot process
GB958756A (en) Reading-device for an information bearer
US3735505A (en) Response card and qualitative response analyzer and method
US3732401A (en) Code reading apparatus
US2195865A (en) Printing control mechanism
JPH0432433B2 (ja)
GB1201403A (en) Number and symbol display system
JP2878772B2 (ja) 光学的文字読取装置
JPS5713575A (en) Display system of chinese language