JPS58123169A - 文字行切出し方式 - Google Patents

文字行切出し方式

Info

Publication number
JPS58123169A
JPS58123169A JP57005206A JP520682A JPS58123169A JP S58123169 A JPS58123169 A JP S58123169A JP 57005206 A JP57005206 A JP 57005206A JP 520682 A JP520682 A JP 520682A JP S58123169 A JPS58123169 A JP S58123169A
Authority
JP
Japan
Prior art keywords
character
line
character line
buffer memory
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57005206A
Other languages
English (en)
Other versions
JPH0461395B2 (ja
Inventor
Sueji Miyahara
末治 宮原
Seiichiro Naito
内藤 誠一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57005206A priority Critical patent/JPS58123169A/ja
Publication of JPS58123169A publication Critical patent/JPS58123169A/ja
Publication of JPH0461395B2 publication Critical patent/JPH0461395B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (11発明の属する分野の説明 本発明は、帳票上に書き込まれている文字を、自己走査
形半導体イメージセンサ等の光電変換器によシ走査して
、文字バタン情報をバッファメモリに格納し、この中か
ら文字行を正確に切出す行読取に関するものであシ、帳
票または@票上の文字行が傾斜したtま入力された場合
でも、その傾斜に影響されないようにして、目的とする
文字行を抽出する文字切出し方式に関するものである。
(2)  従来の技術の説明 従来、この種の文字行読取装置は、一般に第1図に示す
ように、多数の文字行人!、λM * ’l e・・・
が印字又は手書きされた帳票lを、紙送り機構によシ文
字行に直角なY方向に送るか、またはこの帳票を固定し
ておき、光電変換器の方を逆Y方向に送り、送りを停止
させた後、光電変挾器を文字行と並行な方向に文字行に
沿って移動することによシ、文字行を2次元的に走査し
、文字バタン情報を光電変換して、第2図に示すような
バッファメモリ2に臀き込み、格納するよう構成されて
いた。なお、第1図のYlは走査領域、第2図のMは周
辺分布を示す。
この様な走査方式では、帳票への各文字行の書き込み方
、文字行を書き込んだ帳票の裁断の仕方、行読取装置へ
の帳票のセットの仕方、送)機構や走査機構の設定の仕
方、帳票の紙質等に厳しい制約を加えない限シ、文字行
を読み取るべく走査した時に、目的行と走査方向との間
に傾斜が生じ、目的行が傾斜してバッファメモリ2上に
書き込まれることが起る。そのため、個性と目的行とを
分離することが固層になることが多かった。
従来は、このような文字行の傾斜による影響を除去する
ため、各文字行の両端にラインマークを付与し、ライン
マーク間を結ぶ直線上に文字行が存在するものと仮定し
て5文字行の切出しを行う方法や、@票の裁断の寸法精
度を厳しくしてやヤ百し、目的行と走査方向Xとの間に
傾斜が生じないようにする方法をとっていた。
しかしながら、各文字行の両端にラインマーりを付与す
る方法は、多数の行を含む既存文書等の読取を目的とす
る場合、ラインマークの記入のために多くの人手を要す
ることと、帳票の大きさが植々変化する場合の2インマ
ークの検出をいかにするかが問題となる。ま九裁断に高
い精度を要求すること#′i、装置を利用する場合、不
便なものとなり、0CRKFi適用できない場合が生じ
てい大。
(3)発明の目的 本発明は、これらの欠点を除去する情め、バッファメモ
リに書き込まれた文字バタン情報の周辺分布を用いて、
読取対象とする文字行を精度よ〈切出すことを目的とし
喪ものである。
以下、本発明の実施例を、図面を参照して説明する。
(4)発明の構成および作用の説明 第3図は、本発明の実施例であって、1o#′i光電変
換部、20Fiバタンメモリ部、2Hそoバッファメモ
!J、30t;を文字バタン情報の分割数指示部、4(
1周辺分布作成部、50#i行切出し領域算出部、60
は行切出し部、  70は出力端子である。
動作において、第1図で示すような帳票1の目□ 釣行A1を含む領域Y1を光電変換部10の光電変換器
で走査し、光電変換信号をバタンメモリ部2oのバッフ
ァメモリ2に格納する。
@埴Y1の走査が完了すると、分割数指示部30では、
あらかじめ決められた分割数でバッファメモリ20文字
バタン情報を分割するか、あるいは分割数1すなわち分
割を行わない場合から出発して、1−次分割数を増加し
1周辺分布の状態がある条件、すなわち1周辺分布の黒
画素行領域と白画素行領域とが検出でき、かつそれら領
域の出現周期が文字行周期に#1ぼ等しいか、黒画素行
領域の鳩さが文字の萬さにはは等しいという条件、を満
足するまで、分割数を増すよう指示する。
周辺分布作処部40では1分割数指示部30の指令に従
って1文字バタン情報を行方向に分割し、分割した領域
ごとに周辺分布を作成するとともに、周辺分布の中心と
文字行の存在位置との関係から文字行の傾斜方向を検出
する。  □ 第4図は、バッファメモリ2を2分割(Pl。
Pg)l、、分割された領域ごとに求めた周辺分布(M
u * M2)の例を示す6周辺分布は、バッファメモ
リ2上の文字バタン情報を分割された領域ごとに走査し
てY軸上に投影し、あるしきい値以上の黒点が存在する
画素行を黒画素領域(Mu 、Msa 。
M幼、 Mtl ) %そうでないものを白画素行領域
(Mll 、Mts 、Mat 、Mu 、Mss )
として、2種の領域で構成される。
また、傾斜方向は、周辺分布Mllを形成する文字行が
周辺分布Mnを形成する文字行に連接しているが、周辺
分布Muを形成する文字行に連接していゐかを、周辺分
布の重な〕および周辺分布の中心点間の距離を求めるこ
と(黒画素の周辺分布がバッファメモリ2の枠に接して
いないものを対象とする)によって知ることができる。
すなわち、Y軸に投影して求められる周辺分布Mts 
I M14 # Mtl 8 MMの中心点をyu @
 Yj4 # Yu1 @ y諷とすると、領域Plに
おける周辺分布1dxsを形成する文字行はこの周辺分
布と重なル合う2つの周辺分布M、、M、が形成する文
字行が、領域PIkおける連接文字行候補の周辺分布と
なシ、周辺分布の中心点間の距離l Yxs−Yu l
 a l Yu −Yes lを調べ、距離の近い方が
連接する文字行とみなす、これによ如1周辺分布Muを
形成する文字行に連接する文字行は、周辺分布Maを形
成する文字行であることが分かる。
これによル、目的とする文字行の周辺分布の中心点の位
置が領域Pl(左側)ではYu、領域Ps (右側)で
はYesとなり、Y鎗とYuとの大小関係から、目的と
する文字行ム1が、右上シの傾斜である仁とを知ること
ができる。
行切出し領域算出部50i11、分割数指示部3oから
の分割数の情報と5周辺分布作成部4oからの周辺分布
および文字行の傾斜方向の情報とから、切出し領域を算
出する。
菓4図を例にとると、両側に白画素行領域MuとMl、
が両級した黒画素行領域Ml露と同じく内@に白画素領
域MxtとM襲、およびM襲とM鰭が隣接した黒画累行
憤域M、 、 ms4とが文字行周期とほぼ等しh周期
で現われるため、これらが文字行の候補として検出され
1文字行が右上)傾斜である情報とを合わせれば、Mu
とM、とを完全な′1つの文字行として検出することが
可能となる。この結果、領域P1では周辺分布M、を作
成した範囲が、そして領域P3では周辺分布Mmを作成
し九範囲が、目的とする切出し領域となル、それらのバ
ッファメモリ2土ノア )”L’ス(ms、 i、 a
m、 aa )>jヒ(111−・I ’?# ’I 
)が算出できる。
なお、完全な文字行人102つの黒I11素行領域Mu
とMfiのY座標における中心Y、とyuとをそれぞれ
求め、その中心yuとY鯰との差Ys−Y■−Y諺を求
める。また文字行A1のX座標軸における周辺分布をN
および領蛾P重とPsの黒画素列領域をそれぞれNu 
、 Ngとし%NilとN、のxg標における中心Xl
lとXl!とを求め、その中心x1jとxlと0差X!
5−X1!−xuを求める。さらに%Y、とX!との比
Zll−Y、/X、を求めると、これが文字行AX(D
X軸に対する傾斜量となplその極性が傾斜方向として
算出できる。
行切出し部60Fi、行切出し領域算出部5oからの情
報をもとに、バタンメモリ部2o内のバッファメモリ2
から、完全な文字行を切出し、出方端子70に出力する
本実施例の文字行切出し方式#−i、このようにして、
@票を光電変換器で走査する際に帳票にスキューが生じ
てバッファメモリ2に文字バタン情報が傾斜して格納さ
れた場合でも、目的とする文字行を精度よく読敗ること
ができる。また、文字行A1について求めた傾斜量と傾
斜方向とは、バッファメモリ2から文字バタン情報を読
出して文字認織部へ送出する際に、文字パタンの傾きを
補正するのに使用できる。
なお、この方法は、帳票の全面を走査光電変換した後1
文字行を切出す文字行の読みRtシ方式についても、そ
のtt容易に適用することができる。
(5)効果の説明 以上鮨明したように、帳票上の文字を光電変換して必要
な文字行を読み取る際に、文字行の傾斜量と鵠き方向を
精度よく検出でき、また、目的行を−クなく切出すこと
ができるから、 OCRやファクタi9で人力され丸文
字の読取等における行切出しにおいて、帳票あるいは帳
票上の文字行が傾斜したままメモリに入力された場合で
も、柔軟に対処し得る。
また、読取対象を拡大できるとともに、ラインマークを
文字行ごとに付与することや文字行の両端に付与する必
要がなく、またツインマークの記入精度、帳票の裁断精
度等に余裕が生じ、装蟹の操作が容易になる。
さらに、最初の目的行の走査において、文字行の傾斜量
と傾斜方向とを検出し、これを以後の文字行の傾斜量と
傾斜方向として使用することもできるので5行数の多い
帳票においても、各行をずれなく正確かつ速い速度で読
取ることができる。
【図面の簡単な説明】
第1図は一般的な文字行切出゛し方式の概要説明図、第
2図はバッファメモリに文字バタン情報が格納された状
態および傾きが生じ九文字行の周辺分布を示す説明図、
第3図は本発明の一実施例を示すブロック図、第4図は
本実施例における文字行の切出しを説明する丸めの説明
図である。 図において、2けパックアメモリ、10#i光電変換部
、20Fiバタンメモリ部、30は分割数指示部。 40は周辺分布作成部、50は行切出し領域算出部、6
0t′i行切出し部、70は出力端子、At 、 As
は文字行、Mr 、 Msは行方向の周辺分布、Nは列
方向の周辺分布%Yes 、 Yz*は目的行の黒u[
行領緘の中心、Xu、Xuは目的行の黒画素列領域の中
心をそれぞれ示す。 特許出願人  日本電信電話公社 代理人弁理士  森 1) 寛 :: ■ 1 酊 肯 2 図

Claims (1)

    【特許請求の範囲】
  1. 文字行が書き込まれた帳票を光電変換器を用いて走査し
    、文字バタン情報を表わす光電変換信号をバッファメモ
    リに格納した後、このメモリ内で文字行を検出する機能
    を有する光学式文字読取装置において、バッファメモリ
    内に格納された文字バタン情報を行方向に分割し、該分
    割した文字バタン情報ととに周辺分布を求め、し求めら
    れた周辺分布から読取対象とする文字行の傾斜量と傾斜
    方向とを検出し、目的とする文字行を切出すことを特徴
    とする文字行切出し方式。
JP57005206A 1982-01-14 1982-01-14 文字行切出し方式 Granted JPS58123169A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57005206A JPS58123169A (ja) 1982-01-14 1982-01-14 文字行切出し方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57005206A JPS58123169A (ja) 1982-01-14 1982-01-14 文字行切出し方式

Publications (2)

Publication Number Publication Date
JPS58123169A true JPS58123169A (ja) 1983-07-22
JPH0461395B2 JPH0461395B2 (ja) 1992-09-30

Family

ID=11604714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57005206A Granted JPS58123169A (ja) 1982-01-14 1982-01-14 文字行切出し方式

Country Status (1)

Country Link
JP (1) JPS58123169A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6771842B1 (en) 1998-05-28 2004-08-03 Fujitsu Limited Document image skew detection method
JP2014035622A (ja) * 2012-08-08 2014-02-24 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56149170A (en) * 1980-03-26 1981-11-18 Toshiyuki Sakai Detection system for character line of documental pictur

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56149170A (en) * 1980-03-26 1981-11-18 Toshiyuki Sakai Detection system for character line of documental pictur

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6771842B1 (en) 1998-05-28 2004-08-03 Fujitsu Limited Document image skew detection method
JP2014035622A (ja) * 2012-08-08 2014-02-24 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
JPH0461395B2 (ja) 1992-09-30

Similar Documents

Publication Publication Date Title
JPS58103266A (ja) 文字画像処理装置
US5038393A (en) Method of effectively reading data written on data sheet, and data reading apparatus therefor
US5257074A (en) Image forming apparatus
US20020025081A1 (en) Document image processing device, document image processing method, and memory medium
JPS58123169A (ja) 文字行切出し方式
JPS6033332B2 (ja) フアクシミリを用いた情報入力方式
JP2924440B2 (ja) 住所記載領域検出装置
JPH05151388A (ja) 処理領域及び処理条件の指定方式
US20210281696A1 (en) Information processing apparatus and non-transitory computer readable medium
JPS58123167A (ja) 行読取装置
JP3463300B2 (ja) マークシート並びにマークシートの方向検出方法及び装置
JPS60110085A (ja) 光学式文字読取装置の文字切出し装置
JPS638988A (ja) 文字読取装置
JP3113086B2 (ja) 文字認識結果通信処理方式
JP2506142B2 (ja) 文字読取り装置
JP2002183660A (ja) 文書読み取り装置および文書読み取り方法
JPH05314311A (ja) 光学式文字読取装置
JPS5833778A (ja) マ−ク処理方式
JPS5831028B2 (ja) 文字認識装置
JPS59178068A (ja) 情報入出力処理装置
JPS59111578A (ja) フアクシミリによる文字読取方式
JPH01245376A (ja) 文字読取装置の文字切出し装置
JPH0417474B2 (ja)
JPS6142310B2 (ja)
JPH02128292A (ja) 光学文字読取装置