JPS6113375A - 画像処理システム - Google Patents

画像処理システム

Info

Publication number
JPS6113375A
JPS6113375A JP59133911A JP13391184A JPS6113375A JP S6113375 A JPS6113375 A JP S6113375A JP 59133911 A JP59133911 A JP 59133911A JP 13391184 A JP13391184 A JP 13391184A JP S6113375 A JPS6113375 A JP S6113375A
Authority
JP
Japan
Prior art keywords
line
image
lines
inputted
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59133911A
Other languages
English (en)
Inventor
Yuzuru Tanaka
譲 田中
Eisaku Tatsumi
栄作 巽
Hiroshi Tanioka
宏 谷岡
Yoshinori Katou
加藤 慶徳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP59133911A priority Critical patent/JPS6113375A/ja
Priority to DE19853523042 priority patent/DE3523042A1/de
Priority to GB8516458A priority patent/GB2162350B/en
Publication of JPS6113375A publication Critical patent/JPS6113375A/ja
Priority to US07/408,429 priority patent/US5003614A/en
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/43Editing text-bitmaps, e.g. alignment, spacing; Semantic analysis of bitmaps of text without OCR

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明はW像処理機能を有する画像処理システムに関す
る。
〔従来技術〕
vjI像処理装置例えばワードプロセッサーは現在様々
な処理能力を有しており、文書の、作成、5iICに欠
かせないものとなっている。文書の入力方法には、主に
キーボード(keyboad)あるいけ、OCR等が使
用されており、文字は使用システムの内部コード(A8
C11、EBCDIC,JIS等)に対応した符号(c
ode data )に変換された後、−保存あるいけ
書き換え、検索、編集等の処理を受ける。また、文書に
は通常、文字以外にも表、グラフ、絵、写真等が含まれ
ており、これらと文章を融合して、文書を作成、編集す
るワードプロセッサーも考えられている。この場合、ゴ
文字、表、グラフ、絵、写真等は各々異るデータ形式で
保存される。例えは、文字は文字コードで、表、グラフ
はそれを記述するのに適当なデータで、絵はグラフィッ
クデータあるいは画像で、写真は画像で、等といった具
合である。
新たな文書を作成する時は別として、既に活字となって
いる文書を大量に入力し、データベース化して利用する
場合には、キーボードを叩いて一次情報を入力するのに
は特に多大な時間と面倒さが伴う。
一方、文書を入力・出力する機能を持つ事務器としては
他にも複写機やファクシミリがある。
皆写機は速やかな入力が可能であるが、入力した文書を
そのまま、あるいけ拡大、縮少して出力するにすぎず、
ワードプロセッシングのように文書を加工する処理能力
や、文書を保存し検索する機能は有してはいない。
〔目 的〕
以上の点に鑑み本願発明は上記欠点を除去することを目
的としている。
以上の点に鑑み本願発明け、画像として入力された文書
に対して、書き換え、編集、検索が可能な画像処理シス
テムを提供することにある。
以上の点に鑑み、本願発@け画像内の行を認識すること
が可能な画像処理システムを提供することにある。
〔実施例〕
以下、図面を参照し、本願発明について詳細に駁明する
第1図は、本願発明の速用が可能なリーダとプリンタを
有した画像処理装置の構造図である。
1は原稿の画像情報を読み取り、及びその処理を行うた
めの読み取り部(リーダ)、2は原稿を押さえるための
原稿力t<−23は原稿を載置するためのプラテン台、
4//′i原稿を照射するための露光ランプ、5〜7は
光学ノぐスを導くためのミラー、8は原稿画像を結像さ
せるための結像レンズ、9は画像情報をデジタル的に読
み取るための受光素子(ラインセンサ)、IOは受光素
子1で読み取った情報を本願発明による画像処理等を行
うための画像処理部である。11は読み取り部lで得ら
れた画像情報を出力するための出力装置(プリンタ)で
、本実施例ではレーザービームプリンタを用いている。
12はリーダ1で読゛み取つ、た画像情報をレーザ光#
に変換するためのレーザースキャナ、13はレーザ光線
を反射させ、感光体ドラム14へ導くためのミラー、1
5は感光体ドラム14上の潜像を現像するための現像器
、17は給紙カセット16からの紙を搬送するための搬
送ベルト、18は紙を排出するための排紙ローラである
上記構成で、原稿カバー1を上げ、透明なプラテン台に
原稿をセントし、光学系4〜9がスキャンして受光素子
であるラインセンサ9によって画像情報が逐次読み込ま
れてい〈0読み込まれた画像情報は@i像処理部10で
後述の処理を行う。出力装置ll内では画像処理部10
からの信号に基いてレーザ光線を変調し、レーザースキ
ャナ12で走査され、一様に帯電された感、光体ドラム
14上に結像露光される。そして現像、転写等の動作を
行い、出力される。なお画像処理装置は、この構成に限
るものではなくワード1四センサと同様の構成のもので
もよい◇第2図は、以上の構成の画像処理装置を有する
画像処理システムの1例を示すブロック図である。リー
ダ1け、原画像を読み取り、シリアルデータとして出力
する。この画像データは画像メモリ20のアクセスタイ
ムよりも高速なので、シリアル−パラレル変換器21を
通して、例えば16b目にデータ幅を広けておく。次に
画像メモリ20の97レンシユサイクルを考慮してF 
I F O(ファーストインファーストアウト)バッフ
ァ22を通して、画像メモリ20に格納する様にしてい
る。
また画像データは、ホストプロセッサ23により、電子
ファイルや、マイクロフィルムやマグネティックチー1
24等に保管される。また1像データ゛はディスプレイ
25によって表示される。そしてキーボード26からの
入力により、専用プん七ジサ271Cたとえば行間に新
しい行を挿入するなどの処理内を指示することが可能で
ある。この指示により専用プロセッサ27t′i画像認
識及び画像処理を行なう。そして処理された画像データ
は入力時とけ逆にPIF02Bおよびパラレル・シリア
ル変換器29を通りプリ/りttVcより記録される。
更に通信回IIIt−利用して、遠方の端末機器に伝送
するように構成してもよい。
次に以上の構成の画像処理システムについて更に詳細に
説明する。第3図に原稿画像の1例を示す。図において
L T OP (Line Top)は、1行における
黒メツシユの内、最上部に存在するメツシュのy座標で
ある。なお2値化画像信号中、黒と判定された画素集合
を以下黒メツシユと称する。またLBTM(Line 
Bottom ) Id 1行における黒メツシユの内
、最下部に存在するメツシュのy座標であり、BS L
N (Ba5e Line)は基線、アルファベット大
文字の最下部のy座標と一致する線である。このうち、
BSLNは文字を移動する際に移動位置の基準となる。
■ LTOP 、LBTMの決定(ステップA)次vc
L”l’OP 、LBTMの決定[Z)イテ説明を行う
。第3−2図に示す文章が入力画像であるとすると、各
入力画素行毎の黒メツシユの累積度数を求めたヒストグ
ラムを第4図に示す。
184図では、大きな度数の塊が6つ見ら創る。
これらが文字の存在部分であり、行を表わして、いると
考えられ、第3−2図に示した入力画像の行数と一致し
ている。アルゴリズム輻、大きく分けて2つの部分から
成る。
8TEPA:度数の存在領域からのLTOP。
LBTMの決定 5TEP B:5TEP1で求めたLTOP 。
LBTMのうち不適当なポイン トの除去 5TEPIのプログラム内容を図4にフローチャートで
示す。
5TnPA[おける処理アルゴリズムを第5図のLTO
)’ 、LB’l”Mの決定フローチャートで説明する
。第3−2図に示す各入力画素行(1行)における黒メ
ツシユの累積数L D (I)は、ステップ5において
、該累積数が1以上か否かの判定を行なう。今FLaL
D(I−1)=00時は0 、 LD(I−1”)〜0
の時はPL=1となるフラグとすると、LD(I)が1
以上ノ場合で、ステップ6でPLが00場合、つまり、
その前の行の(I−1)行が累積数00場合、該1行は
文字行の開始行と判断出来る。
次に入力画像の行番号Jをステップ7で1インクリメン
トし、該5行文字列のL’l’0P(J)I/c入力画
素行番号工をステップ8で格納する。尚ステップ6でフ
ラグFLが0でない時、っまシ前の画素行においても黒
メツシユが存在している時には行の開始ではない為、ス
テップ7.8は実行しない。同様に注目画素行かステッ
プ5においてL D (1)≧1を満足しない時、つま
り黒メツシユが1フも存在しない時、ステップ9〜分岐
し、PLを判断して、つまり前の行にlフ以上の黒メン
シュか存在した場合敵性の終了と判定出来るので、ステ
ップlOでLBTM(J)にI−xtJk目の文字行の
LBTMとして格納する。
以上の処理を、ステツ711で1行ずつ注目性を移動さ
せながら入力画素行毎てにわたって実行し、その終了を
ステップ3で判断した時、ステップ4−4VC分岐し、
入力画像の総行数JをGYO8U[格納する。
以上により、各文字行に対してL ’l’ Op 、及
びLHTMが得られる。
つまり前述の8TEPAでは、第4図に示すヒス(ゲラ
ム中、度数の存在する領域をすべて取り出し、その両端
を各々、LTOP 、LBTMとしている。この処理を
第3−21¥、lvc示す入力画像に対し行った結果が
第1表の人の部分である。
第  1  表 GYO8U=8 GYO8tJ= 6 第1表において、Hは1行中の文字の高さの最大(i&
(H=LBTM−LTOP+ 1 )を示している。
(ステップB) 次に8TEPBについて説明する。第1表の、Aにおい
て行番号の1及び7ではH−2及びlであり行間部のゴ
ミであると考えられる。そこT8TgPB[より、この
様なゴミの影響で誤まったLTOP 、LBTMを決定
してしまうのを避けるためゴミの除去を行う。ゴミは、
各行のHがその平均値の例えば2分の1以下であるか否
かに基づいて判断する。その結果、第1表のBに示すよ
うにゴミと判定された行は除去されている。
第6図に上述の行間のゴミの除去のフローチャートを示
す。第5図の70−チャートの■からのデータに基づき
、各行中の文字の高さHを求め、ステップ1において各
行中の文字の高さHの総和SIJMを求め、ステップ2
で文字の高さの平均AVRf演算する。
ステップ6では各行の文字の高さHを0.5×AV几で
2値化し、0.5 X A V R以上の時ステップ3
に分岐し、文字行の置き換えをする。
つまり第1表のAにおいて誤認識された行番号1及び7
けここで除かれ、第1表のBに示される1〜6行として
正確に認識されたこととなる。
■ BSLNの決定 基線より下部に字の一部が出る文字、例えば英文でtL
y’、j、p、q、yなどが、−行中の文字の大半を占
めるということは一般にはあり得ない。従って第3−1
図に示したように行を夏、■、 IHの領域に区分する
と、各メツシュ行における黒メツシユの累積度数は、特
に英文では領域H1領域1.領域■の順に小さくなると
考えられる。よって基mは、各行のLBTMからLTO
Pへ度数をたどりていった時にtaが急激に増加する点
を捜せに求まる。■の領域に黒メツシユが存在しない行
で社、B8LNIdLB ’I’ M K一致させる。
基1(BSLN)を求める方法として次の2つの方法を
提案する。
・方法1(Ml) 度数の平均値(average )と標準偏差(sta
ndard deviation )による方法・方法
2 (M2 ) 度数の差分(difference )による方法(方
法1) 方法1けT、 B T MからLTOPへ向って逐次、
度数の平均と標準偏差を求め、度数が (平均AV几)+(標準偏差8D ) X m、。
以上になる点をBSLNに決定するという方法である。
m、けパラメータで経験的に定める。
方法2では、L13TMからLTOPへ向けて度数の差
分を求め、差分値が、(基準値)Xm。
で定まるしきい値を越える点をBSLNとしている。基
準値には、その行の最大度数を用いている。m、けパラ
メータで経験的に定める。
171、: 5 、 m、= o、 3に定め、実行し
た結果求まったBSLNは第2表に示す通りである。
第  2  表 2つの方法で求めたBSLNの値は、第2表に示した杉
にほぼ一致している。方法1(Ml)で求めたBSLN
を基に、第3−2図に示す入力画f#に基線を鶴き込む
と第7図の様になり、達切な基線が求まっているとガえ
る。
なお、その他の例として入力画像によってはLBTMと
B S LNt−一致させなけれはならない場合があり
得る。その場合を考慮し、方法1では、度数の追゛跡過
程で、着目しているメツシュ行がLI:lTMから行の
高さHeight (D t/ 2だけきてもBSLN
が定まらなけれは、BSLNをLBTMの位置に決定す
る。L / 2 #iA当に定めた値であるが少なくと
も1/3以上でなけれはならない。その理由としては、
第3−°2図に示したように行al、f[、I[Iの領
域に区分されるが、各々の領域のy軸方向の大食ざはほ
ぼ等しいと考えることができるからである。
(方法2) 方法2では、差分値の他に、度数のしきい値(基準値)
×m3  を設け、度数がこれを越えた場合、この時点
のメツシュ行をBSLNに決定している。ここでm3t
fパラメータであり本実施例においてはm3=m2に設
定している。
次に上述した方法l及び方法2の処理を、第8図、第9
図のフローチャートを用いて説明する。
第8図は方法1によるフ四−チヤードであり各文字行に
対してLI3TM−1画票行より順次!3 S L N
であるか否かの判定を、ステップ1゜2.3,4.5で
囲まれるループをくり返して行なうj まずステップ1では、度数平均値AVRgm。
(フローチャートでFiMl)倍の標準偏差8Dを加え
た値とJ行目の度数を比較し、度数が大である時ステッ
プ7へ分岐し、該1行をBSLNとして記憶する。そう
でない場合ステップ2で平均値AVR,ステップ3で偏
差SDを求め次ライン(J−1)行目の判定用に用意す
るとともに、ステップ4で文字高さLBTM−LTOP
+1の1/2の行まで処理が進んでいるか否かの判定を
行なう。ステップ4でNOと判定された場合、つまり、
基線より下部に一部が出る文字が存在しない場合である
為ステップ6で数行のBSLNけLBTMに等しくする
次に方法2の処理手順を第9図を用いて説明する。ステ
ップ1では、LBTM−1行より順次前の行との度数の
差DFを求める。一方、ステップ2で注目行の度#LD
が文字行中の最大度数値MAXLDIC数m、(M2)
を掛けた値よりも大きい場合、無条件に該注目行をステ
ップ5VcおいてBSLNと判定する。
ところでステップ2において、ステップ3に分岐した場
合、ステップ3で度数差DFの値をM3xMAXLD値
と比較し、その変化の大きい場合、ステップ5に分岐し
数行をBSLNとして得る。以上の処理を順次各画素行
に対して行なう。以上詳述したように、本願発明により
・原稿画像の行を認識することができるので、高度なワ
ードプ四七ッシングシステムを折供することができる。
なお、更に行だけでなく単語間、単語長、段落の認識を
行うように構成すれば、より高度な画像処理を行なうこ
とができる。
〔効 果〕
以上詳述したように、本発明により人力した文書画像の
行を認識できるので、文書の一部だり抜き出して新しい
文書を作製することができる。又、読み取られた文章画
像を2値化し1、各li!Ii素行毎に黒メツシユの度
数分布を用いることにより、文章の行の位置を正確に認
識するとと゛が可能となった。
又、行6h番を並べかえることか可能となった。
又、行間に新しい行を挿入することができる。
又、不必要な行の削除が可能である。
以上詳述したように、文書を画像として入力しながら行
を認識することにより通常のワード10センサや複写機
に比べて、極めて高度にかつ操作性の高−書き換え、編
集、検索等が可能となった。
【図面の簡単な説明】
第1図は画像処理装置の構造図 第2(2)韓画像処理システムの1例を示すプ四ツり図 第3−1図は原稿画像の1例を示す同 第3−2図は他の原稿画像の1例を示す間第4I!4は
黒メツシユの紫積度数を求めたヒストゲラムを示す図 第5図はLTOP、LBTMの決定フローチャート第6
図は行間のゴミの除去のフローチャート第7図は画像に
基線を書針込んだ同 第8図は基線を求める方法1によるフローチャート 第9図は基線を求める方法2によるフローチャート 1けリーダ、LTOPけ1行における黒メツシユの内、
最上部に存在するメツシュのy座標。 BSLNけ基g、LBTMけ1行における黒メツシユの
内、最下剖に存在するメンシュのy座標、10はII偵
処理部。

Claims (2)

    【特許請求の範囲】
  1. (1)原稿画像を入力する入力手段、 上記入力手段によつて入力された画像情報の一部を認識
    する認識手段、 上記認識手段によつて認識された画像情報に基づいて、
    画像の編集処理を行う画像処理手段を有したことを特徴
    とする画像処理システム。
  2. (2)第1項において、認識手段は、画像の行を認識す
    ることを特徴とする画像処理システム。
JP59133911A 1984-06-28 1984-06-28 画像処理システム Pending JPS6113375A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP59133911A JPS6113375A (ja) 1984-06-28 1984-06-28 画像処理システム
DE19853523042 DE3523042A1 (de) 1984-06-28 1985-06-27 Bildverarbeitungssystem
GB8516458A GB2162350B (en) 1984-06-28 1985-06-28 Image processing system
US07/408,429 US5003614A (en) 1984-06-28 1989-09-15 Image processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59133911A JPS6113375A (ja) 1984-06-28 1984-06-28 画像処理システム

Publications (1)

Publication Number Publication Date
JPS6113375A true JPS6113375A (ja) 1986-01-21

Family

ID=15115973

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59133911A Pending JPS6113375A (ja) 1984-06-28 1984-06-28 画像処理システム

Country Status (1)

Country Link
JP (1) JPS6113375A (ja)

Similar Documents

Publication Publication Date Title
US5003614A (en) Image processing system
JP3504054B2 (ja) 文書処理装置および文書処理方法
JP4181892B2 (ja) 画像処理方法
JP3050007B2 (ja) 画像読取装置およびこれを備えた画像形成装置
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
US5257074A (en) Image forming apparatus
US6163623A (en) Method and apparatus for recognizing images of documents and storing different types of information in different files
US6249353B1 (en) Image editing apparatus
JP3443146B2 (ja) 画像合成方法および画像記録装置
US20040034832A1 (en) Method and apparatus for foward annotating documents
JP2002135567A (ja) 画像編集装置
JPH11341229A (ja) 画像処理装置及び画像処理方法
US6377359B1 (en) Information processing apparatus
JPS6113375A (ja) 画像処理システム
JPH05292294A (ja) デジタル複写機
JPS6113378A (ja) 画像処理方法
JPS6113376A (ja) 画像処理システム
JPS6113377A (ja) 画像処理システム
JP3103100B2 (ja) 領域指定方法及び装置
JP2007334437A (ja) 画像処理装置及び方法、並びにプログラム及び記憶媒体
JPS5949671A (ja) 光学的文字読取装置
JPS63187870A (ja) 清書用複写機
JPS6151272A (ja) 画像処理システム
JP2002142070A (ja) 画像伝送システムおよび画像伝送装置ならびにそれらの方法
JP2958406B2 (ja) 画像処理装置