JPH0830725A - 画像処理装置及び方法 - Google Patents

画像処理装置及び方法

Info

Publication number
JPH0830725A
JPH0830725A JP6167748A JP16774894A JPH0830725A JP H0830725 A JPH0830725 A JP H0830725A JP 6167748 A JP6167748 A JP 6167748A JP 16774894 A JP16774894 A JP 16774894A JP H0830725 A JPH0830725 A JP H0830725A
Authority
JP
Japan
Prior art keywords
area
pixel
resolution
pixels
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6167748A
Other languages
English (en)
Inventor
Kazuyuki Saito
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6167748A priority Critical patent/JPH0830725A/ja
Priority to DE69531882T priority patent/DE69531882D1/de
Priority to EP95304854A priority patent/EP0692767B1/en
Priority to US08/501,562 priority patent/US5966455A/en
Publication of JPH0830725A publication Critical patent/JPH0830725A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 画像データの領域判定を高速に、しかも、メ
モリ量を抑えながら行うことを可能にする。 【構成】 入力部1から入力された画像データは、領域
分割部105に供給され、ここで先ず、入力画像中のm
×n画素の領域の各画素を論理和することで、低解像度
の画素(縮小画素)を抽出する。この結果、像の種別を
判定するためのメモリ量は、実質的に1/(m×n)に
なる。そして、この低解像度の画素を順次生成し、それ
によって画像データの各位置(領域)の像の種類を判定
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像処理装置及び方法、
詳しくは入力された画像データ中の各領域の像の種類を
判定する画像処理装置及び方法に関するものである。
【0002】
【従来の技術】光学的文字認識(OCR)装置、複写
機、或いは、ファクシミリ等の装置においては、その処
理を精度良く行うために、入力された画像中の文字領
域、図形、表等の領域を分割することが必要になる。
【0003】領域分割手段として、スペクトル分析方式
の様に、入力画像のフーリエスペクトルを分析し各種領
域に分割する方式を用いたものや、特開昭64−158
89号公報の様に垂直及び水平方向の射影を交互に繰り
返して取り周辺分布の情報から領域を分割していく方式
を用いたものなどがある。
【0004】またラベル付けの手段としては連続画素の
輪郭線を追跡する方式を用いたものなどがある。
【0005】
【発明が解決しようとする課題】しかしながら、上記の
手法のいずれでも、演算処理に多大な時間を費やし、か
つ、画像の画素に対して処理を行うので記憶領域が大規
模化し、複雑な領域構成の画像に対する分割精度が低い
等の問題点があった。
【0006】また、入力画像の解像度が低い場合にも分
割精度が悪くなる等の問題が有り、逆に解像度が高い場
合は画素数が増えラベル付け等の処理時間や記憶領域が
増大するという問題点が有った。
【0007】
【課題を解決するための手段】及び
【作用】本発明は上記問題点に鑑みなされたものであ
り、画像データの領域判定を高速に、しかも、メモリ量
を抑えながら行うことを可能にする画像処理装置及び方
法を提供しようとするものである。
【0008】この課題を解決するため、例えば本発明の
画像処理装置は以下に示す構成を備える。すなわち、与
えられた画像データの各領域の種類を判定する画像処理
装置であって、前記画像データ中のm×n画素領域から
低解像度の1画素を抽出する抽出手段と、低解像度の画
素の連続する広がりから、画像種別の領域を判別する領
域判別手段と、該領域判別手段で判別された領域情報か
ら、当該領域の種別を判断する判断手段とを備える。
【0009】また、本発明に係る好適な実施態様に従え
ば、前記m、nは、入力される画像データの解像度が高
いほど、大きな値を持つことが望ましい。これによっ
て、画像データの解像度にかかわらず、低解像度の画素
の重みを略一定にすることができ、ほぼ同じ環境で像判
定が行える。
【0010】また、抽出手段は、m×n画素内に有意な
画素が1つでも存在するとき、当該m×n画素に対する
低解像度の画素を有意が画素として抽出することが望ま
しい。これによって、m×nの画素群内に1つでも黒画
素が存在するとき、低解像度の画素を黒画素とすること
ができるので、像域の判定に使用することが可能にな
る。
【0011】また、抽出手段は、m×nの画素の各ドッ
ト状態の論理和を算出する算出手段を含むことが望まし
い。これによって、極めて簡単な構成或いは処理で低解
像度の画素を得ることが可能になる。
【0012】また、領域判別手段は、低解像度の画素の
連続する広がりに対して内接する矩形を領域として判別
することが望ましい。これは、文字や写真、表等は一般
に矩形領域毎に展開されており、これに良好に、しかも
処理が単純なだけ高速に対処することが可能になる。
【0013】また、記領域判別手段は、与えられた画像
データ中のm×nの画素群を1画素とするライン単位
に、各低解像度の有意な画素位置を求める手段と、主走
査方向に連続する有意な低解像度の画素の始まり位置
と、その連続する個数を走査ライン毎に記憶すると共
に、注目ライン中に有意な低解像度の画素がない場合に
は、所定の判別情報を記憶する記憶手段と、該記憶手段
で記憶された内容に従って、有意な低解像度の2次元に
連続する領域を検索する検索手段と、検索して得られた
連続する低解像度の画素群に対して固有のラベルを付す
と共に、当該固有のラベルの画素群の座標位置に基づい
て、当該画素群を内接する矩形領域の座標を得る手段と
を備えることが望ましい。なぜなら、有意な画素が存在
しない部分のみが記憶されるので、その分のメモリ消費
量を抑えることが可能になるからである。
【0014】また、判断手段は、前記領域判別手段で判
別された領域の縦、横のサイズ、当該領域内における有
意な低解像度の画素数の占める割合に従って、当該領域
の種類を判断することが望ましい。これによって、各領
域を性格に判定することが可能になる。
【0015】
【実施例】以下、添付図面に従って本発明に係る実施例
を詳細に説明する。
【0016】実施例における画像処理装置の構成例を図
1に示す。図中、101は画像データを入力する入力部
であり、イメージスキャナである。但し、これに限定さ
れるものではなく、例えば、上位装置(ホストコンピュ
ータ)から画像データを入力したり、ファクシミリ受信
するためのインターフェースであっても良い。要は、画
像データを入力するものでありさえすれば良いからであ
る。
【0017】102は装置の制御や各部処理の演算を行
う演算処理部(以下、CPUという)であり、103は
CPU102の制御プログラムや、各種データを記憶し
ておく記憶部である。104は演算処理結果や画像処理
結果、及び画像データを出力する出力部である。
【0018】105は領域分割処理全体を示す領域分割
部であり、以下の構成を備える。
【0019】106は入力画像を縮小しデータ化する、
画像縮小データ化部、107は縮小画素データにラベル
付けを行い同時に初期矩形データを作成するラベリング
部である。108はセパレータや表や図形等を検出する
基本属性判別部である。109は縦書き・横書き等の文
章の組方向を検出する組方向検出部である。110は見
出し類を検出する見出し類検出部である。111は矩形
の合併部である。
【0020】図2は、本実施例の画像処理装置における
画像処理を示すフローチャートで、この処理を実行する
制御プログラムは記憶部103に記憶されている。
【0021】以下、同フローチャートに従って上記構成
の動作を説明する。
【0022】1)ステップS201の説明 まず画像入力部101から元画像を入力する。
【0023】2)ステップS202の説明 次に画像縮小データ化部106において、入力画像に対
し、解像度がRdpi(dpi=dots/inch)
以上であれば、縦mドット、横nドットの1ドット単位
の論理和をとっり、その論理和結果を新たな1画素(縮
小画素)とする。また、入力画像データの解像度がRd
pi未満であれば縦pドット、横qドットのドット単位
の論理和をとって、その論路和結果を新た1画素(縮小
画素)とする(但し、m>p,n>q)。ここで、解像
度に応じて領域サイズを変化させるのは、高解像度にお
ける1画素と低解像度の1画素と比較した場合に、後者
の画素の方がその意味が重要である理由による。従っ
て、入力される画像データの解像度が様々な場合には、
上記の2段階に分けるのではなく、多段階に分けるよう
にすることが望ましい。尚、入力画像の解像度の判断
は、外部に設けられた不図示の操作パネルから指示して
も良いし、画像データ発生源(ホストコンピュータ等)
がそのヘッダ部分に解像度指定コマンドを付加し、この
コマンドを解釈することで行っても良い。
【0024】さて、上記の論理和処理を行うと、入力画
像のm×nの領域、或いはp×qの領域中に1ドットで
も黒画素が有れば、その縮小画素は黒となる(ここで言
う“黒”とは、便宜的なものである)。
【0025】上記のように得られた縮小画素は、主走査
方向に連続する縮小画素を一つの塊として扱い、その黒
画素の始まるX座標、黒画素数を縮小画素データとして
記憶する(図5)。
【0026】主走査方向に存在する縮小黒画素の塊の画
素データは左から順にリンクさせ、最も左の画素データ
はそのアドレスを縮小画素行ヘッダに記憶する。
【0027】また、各縮小画素行ヘッダにおいてもリン
クさせる事によって1連の縮小画素データとしてアクセ
スできるようにする。
【0028】つまり、各縮小画素行のヘッダには、その
行における次の黒画素の塊の格納されているアドレス
(ポインタ)を記憶していると共に、次の行のヘッダの
アドレスをも記憶している。
【0029】以上が、画像縮小データ化部106の処理
である。
【0030】3)ステップS203の説明 次にラベリング部107の処理内容を説明する。
【0031】縮小画像の黒画素に対し1行ずつ縮小画素
データを参照することによってラベルを付加し、上下・
斜めで連続している画素データには同一ラベルを付け、
同時に矩形をかたどっていく。ただし、この時横方向の
連続性は縮小画素データによってあらかじめかわってい
るので上下及び斜めの連続性のみを検査すれば良い事に
なる。
【0032】図3を例にとると、1行目(縮小画素で構
成される行)の縮小画素ヘッダを参照し、その縮小画素
データ先頭アドレスから最初の縮小画素データを読み取
ると画素Aを含む画素データのデータを参照する事にな
る。
【0033】最初に検出される画素Aを含む画素データ
にラベル1が付けられ、この画素Aの座標(Xa,Y
a)を矩形の始点と終点とし、画素数を1、矩形を区別
するための矩形ラベルに画素と同じラベル1を付加して
以上のデータを矩形データ(図4)として記憶部に記憶
する。
【0034】次に次縮小画素データアドレスによって次
の縮小画素データを参照すると画素Bを含む画素データ
を参照する事となり、左方向に画素Aと連続性のないこ
とは画素データが異なる事から明らかである(1行目で
あるのでもちろん上からも連続画素はない)。画素Bを
含む画素データにはラベル2が付けられ、この画素Bの
座標(Xb,Yb)を矩形の始点と終点とし、画素数を
1、矩形を区別するための矩形ラベルに画素と同じラベ
ル2を付加して以上のデータも矩形データ(図4)とし
て記憶部に記憶する。
【0035】以上の様にして1行目のラベリングが終了
したら2行目に移る。
【0036】2行目の縮小画素ヘッダを参照し、その縮
小画素データ先頭アドレスから最初の縮小画素データを
読み取ると画素Cから画素Dまでのデータを参照する事
になる。2行目の最初の画素Cを含む画素データはラベ
ル1の画素Aを含む画素データと上から連続しているの
で画素ラベル1を付加し、矩形ラベル1の矩形データに
対し画素数は1加算して計2画素となり、矩形ラベルは
変わらず1のままで、矩形座標の終点のみを(Xa,Y
a)から(Xd,Yc)(画素Dの座標)へと更新する
(始点の座標は変わらない)。
【0037】また、同時に画素Dを含む画素データは画
素Bを含む画素データとも斜めに連続しており、画素B
を含む画素データのラベルをラベル2からラベル1へと
変更する。そして、矩形ラベル1の矩形データに対し、
矩形ラベル2の画素数を加算して計4画素とし矩形ラベ
ルは変わらず1のままで、矩形座標は画素A,B,C,
Dをすべて含むように終点のみを(Xd,Yc)から
(Xb,Yd)へと更新する。そして、矩形ラベル2の
矩形データについては矩形ラベルを0として無効とす
る。
【0038】以上の様にして2行目が終了したら3行目
に移る。
【0039】3行目の縮小画素行ヘッダを参照し、その
縮小画素データ先頭アドレスから最初の縮小画素データ
を読み取ると画素Eのデータを参照する事になる。3行
目の最初の画素Eを含む画素データは画素Cを含む画素
データと斜めに連続しているので画素ラベル1を付加
し、矩形ラベル1の矩形データに対し画素数は1加算し
て計5画素となり矩形ラベルは変わらず1のままで、矩
形座標は始点をXa,Ya)から(Xe,Ya)へ、お
よび終点を(Xb,Yd)から(Xb,Ye)へと更新
する。
【0040】以下同様にして全縮小画素に対しラベリン
グと矩形のかたどりを行う。この結果、縦横斜めに連続
する縮小黒画素群に対しては同じラベルが付けられ、同
一ラベルで表わされる縮小画素群を内接する矩形の左上
隅の座標データと、右下隅の座標データ、そして、縮小
黒画素数が得られることになる。
【0041】4)ステップS204の説明 この処理は、基本属性判別部108で行われる。基本属
性判別部108は、上記ラベリングと矩形のかたどりの
後、各々の矩形部分が本文に該当する矩形、図形または
写真、表等に該当する矩形、或いはセパレータに該当す
る矩形のいずれであるのかを、そのラベリングされた矩
形の幅W、高さH、面積S、面積に対する黒画素の数、
すなわち画素密度D(これらは矩形データを用いて計算
する事により容易に求まる)を用いて区別する。ここ
で、言うセパレータとは、画像の区切り部分、例えば文
章部分と写真部分、或いは文章部分どうしを区切るため
の線(新聞等で文章部分を区切る線等である)を意味す
る。以下、図6のフローチャートに従って説明する。
尚、基本属性判別部108内部には、図示しないCPU
があって、このCPUが同図フローチャートに対応する
プログラムに従って処理を進めることになる。
【0042】セパレータは、幅Wが閾値Tw1以下でか
つ高さHが幅Wの閾値Tw2倍以上(図6のS60
3)、もしくは幅Wが閾値Tw1より大きくかつ高さH
が幅Wの閾値Tw3倍以上(図6のS604)であれば
縦長セパレータとして矩形ラベルを「−3」として統一
し、矩形を構成する画素ラベルは矩形ラベルとは別にそ
のまま保持しておく(図6のS614)。
【0043】また幅と高さを入れ替えたものも上記と同
様にして(図6のS605,S606)横長セパレータ
として矩形ラベルを「−3」に変更する。
【0044】更に、図7に示す様に、画素密度Dが閾値
Td1以下の時(図6のS607)はカギ型などの変形
セパレータと見なして矩形ラベルを「−3」に変更する
(図6のS614)。
【0045】また、面積Sが閾値Ts1より大きい時
(図6のS608)、その画素密度Dが閾値Td2未満
(図6のS609)ならば表と見なして矩形ラベルを
「−4」に変更し(図6のS615)、画素密度Dが閾
値Td2以上ならば図形または写真とみなして矩形ラベ
ルを「−5」に変更する(図6のS616)。
【0046】つまり、一般に表は、線分で構成され、文
字と比較すると面積は大きい。また、その面積内はほと
んど白であるので、矩形密度は小さい値になる。これに
対し、図形や、写真等は、表に比較して画素密度が大き
くなることに由来している。
【0047】また、面積Sが閾値Ts1以下でかつ閾値
Ts2以上の時で(図6のS610)、その画素密度D
が閾値Td3以上(図6のS611)の矩形や、幅W及
び高さHが共に閾値Tw4以上でかつ画素密度DがTd
5以上の時(図6のS613)の矩形も図形または写真
とみなして矩形ラベルを「−5」に変更する。
【0048】更に、面積Sが閾値Ts1以下でかつ閾値
Ts2以上の時(図6のS610)、画素密度Dが閾値
Td4未満(図6のS612)の矩形を表とみなし矩形
ラベルを「−4」に変更する(図6のS615)。
【0049】以上の様にして、図形または写真、表等に
該当する矩形、セパレータに該当する矩形等を検出し、
残った矩形を本文として矩形ラベルはそのまま(符号が
正なので表等と容易に区別出来る)画素ラベルと同一に
しておく(図6のS617)。
【0050】5)ステップS205の説明 次に組方向検出部109の動作処理内容を図8のフロー
チャートに従って説明する。尚、組方向検出部109内
にはCPUと、同図のフローチャートに対応するプログ
ラムを記憶しているメモリが設けられてる。
【0051】さて、横書き文章の場合、本文として残っ
た矩形は横方向に縮小黒画素が連続して横長の矩形にな
りやすく、縦書き文章であれば、本文として残った矩形
は縦長になりやすい。
【0052】そこで本文の矩形の幅Wと高さHの平均値
を算出し(図8のS801)、平均幅wが平均高さhよ
り大きい場合は横書きの多い章と見なし平均高さhを1
文字の文字サイズとする(図8のS802,S80
3)。逆に平均高さhが平均幅wより大きい場合は縦書
きの多い文章と見なし平均高さwを1文字の文字サイズ
とする(図8のS802,S810)。
【0053】次に、組方向とは逆方向に、それぞれの本
文矩形の縮小黒画素のヒストグラムを取り(図8のS8
04)、周辺分布の形状から閾値Tk以下の場所を段落
の分かれ目とする(図8のS805,S812、図9参
照)。また、段階ごとに組方向と同じ方向に矩形のヒス
トグラムを取って(図8の808,S815)、周辺分
布の形状から黒画素の連続の長さをその段落内文字のそ
の字サイズ(高さサイズ)とし、白画素の連続の長さを
行ピッチとして検出する(図8のS809,S816お
よび図8)。
【0054】6)ステップS206の説明 次に見出し類検出部110において、組方向と文字サイ
ズより、見出し類の検出を行う手順を図10のフローチ
ャートに従って説明する。尚、ここでは本文が縦書きの
場合を説明し、横書きについては説明しないが、以下の
説明からすれば横書きの場合の処理手順は容易に推察さ
れよう。
【0055】先ず、本分矩形の中から矩形の幅Wが文字
サイズwよりも閾値Tm1倍以上大きい矩形を見出し矩
形の候補として検出する(図10のS1005)。
【0056】さらに、矩形の高さHが文字サイズのwの
Tm2倍よりも小さい場合は(図10のS1006)、
横書きの文字が連続したものを含む場合があるので、本
文矩形と見出し矩形の距離が閾値T1より近いもの(図
10のS1007)では見出しから本文に訂正する(図
10のS1009)。
【0057】さらに上記の処理によって残った本文矩形
の中で文字サイズwの範囲に本文及び見出し類の矩形が
ないものを孤立した矩形として見出しとする(図10の
S1010〜S1013)。
【0058】以上説明したように、横書きの場合には、
上記処理における90度回転したものとなるだけである
ので、容易に想到できよう。
【0059】7)ステップS207の説明 次に矩形の合併部111の処理内容を説明する。
【0060】この処理では、何の関係もなくばらばらに
存在したままの本文に該当する矩形及び見出し類の矩形
を合併する。
【0061】図11に例に、矩形A1と矩形Bとの合併
を考える。矩形A1に対してX方向に対してPx、Y方
向に対してPyだけ拡張した仮想矩形A1’を考え、A
1′に対してその周囲に接触或は内包する矩形があるか
サーチする。図示の場合、矩形Bの様に接触していれば
矩形A1と矩形Bを合併して新しく合併矩形A2を作成
し矩形A1の矩形データを更新することで記憶し、矩形
Bのデータは無効とする。ただし、この時Px,Pyは
文字サイズと行ピッチから求めた値であり、また矩形を
合併してできた矩形が図形や表やセパレータ等と接触す
る場合は、合併すること自体を無効とし元の矩形のまま
としておく。
【0062】8)ステップS208の説明 最後に、以上の様にして求めた各種領域の矩形データを
画像データと共に出力部104から出力する。
【0063】以上説明したように本実施例によれば、入
力画像の解像度によって縮小1画素あたりのドット数を
変更し、縮小すると同時に、主走査方向は黒画素のラン
レングスをリンクして記憶し、それらのデータの先頭ア
ドレスを各行のヘッダ領域に記憶する画像縮小データ化
手段によって入力画像を縮小を行う事によって、ラベ
リング処理の処理時間を短縮、記憶領域等の小規模
化、複雑な領域構成の分割精度の向上等がはかれる効
果がある。
【0064】尚、入力した画像に対する処理は、本発明
の主旨から外れるが、例えば、本文では文字認識し、写
真画像領域であれば誤差拡散法等による処理を施す等が
考えられよう。
【0065】また、上記基本属性判別部108で処理内
容で示された各閾値は、入力される画像データの解像度
によって決定されるものであり、固定ではない。
【0066】また、ステップS201の画像入力の際に
多値であるかどうかを判断して2値画像に変換する事
で、入力画像がカラー等の多値画像であっても領域分割
処理は可能である。
【0067】また、ステップS202の画像縮小データ
化処理において、入力画像の画素数が処理速度を損なわ
ない程度に十分少なければ縮小処理を省略し入力画像を
直接画素データ化する事も可能である。
【0068】また、ステップS204の基本属性検出処
理において、セパレータの縦・横違いや、図形や表等求
める時の閾値の違いなどで矩形ラベルを区別する事で、
更に詳細な領域属性の分類を行う事も可能である。
【0069】また、同じくステップS204の基本属性
検出処理において、最初から文章のみなどの様に特定の
属性の画像しか入力しない場合は、予めその旨を指定す
ることで、処理を省略する事も可能である。
【0070】また、ステップS205の組方向の検出に
おいて、平均幅、平均高さを求める代わりにそれぞれの
最多値を求めることによって代替する事ができる。
【0071】また、同じくステップS205の組方向の
検出において、段落ごとに組方向を再度確認すれば、縦
書き文章と横書き文章が混在の原稿にも正確に処理を行
うことができる。
【0072】また、同じくステップS205の組方向の
検出において、最初から一定の組方向の文章しか入力し
ないならば、組方向を固定値とする事(不図示の操作パ
ネルから指定する)で代替する事ができる。
【0073】また、ステップS206の見出し類検出に
おいて、最初から見出し類のない画像しか入力しないな
らば、処理を省略する事も可能である。勿論、この場合
には、見出しが無しを操作部より指示しておく。
【0074】また、ステップS207の矩形の合併にお
いて、図12に示す様に、セパレータ等の矩形と接触し
た場合に、更に実際の縮小画素とも接触指定するか否か
を確認し、接触していなければ合併を実行する事で、傾
斜した画像にも対処できる。
【0075】また、ステップS208の最後の出力の際
に、各種領域の矩形データを参照して、必要な領域の画
像データ(勿論、対応する原画像の領域)のみを出力す
ることも可能であり、記憶領域の更なる縮小や、処理時
間の更なる短縮がはかれる。例えば、文字認識装置に入
力画像データを出力するのであれば、本文であると判定
された画像のみをその装置に出力することが可能にな
る。尚、縮小画素の位置から、原画像中の位置を算出す
るのは、極めて簡単である。すなわち、縮小画素が原画
像のN×M画素領域に対応するのであれば、縮小画素の
位置(X,Y)にそれぞれN、Mをかけあわせれば良
い。
【0076】従って、例えば、実施例の装置を用いて、
それに画像データを供給し、所望とする種類の画像のみ
を出力させるようにも構成することができる。
【0077】また、上記実施例では、領分割部105内
の各構成ユニットに独立したCPUが備えられ、それぞ
れで処理が独立して行われるように説明したが、装置全
体を1つのCPUで動作処理する場合にも適応できるの
は勿論である。
【0078】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによって達成される場合にも適用で
きる。
【0079】
【発明の効果】以上説明した様に本発明によれば、画像
データの領域判定を高速に、しかも、メモリ量を抑えな
がら行うことが可能になる。
【0080】
【図面の簡単な説明】
【図1】実施例の画像処理装置の概略構成を示す図であ
る。
【図2】実施例の画像処理装置における画像処理を示す
フローチャートである。
【図3】実施例のラベリング処理を説明するための図で
ある。
【図4】実施例の矩形データ構造を示す図である。
【図5】実施例における1ラインにおける縮小画素デー
タのリンク構造と、各ラインのヘッダ部分のリンク構造
を示す図である。
【図6】実施例の基本属性判別部の処理を示すフローチ
ャートである。
【図7】実施例の矩形(領域)の属性の密度Dと面積S
での切り分けを示す図である。
【図8】実施例の組方向検出部の処理を示すフローチャ
ートである。
【図9】実施例の段落検出処理の例を示す図である。
【図10】実施例の見出し類検出部の処理を示すフロー
チャートである。
【図11】実施例の矩形の合併処理の例を示す図であ
る。
【図12】他の実施例のセパレータ矩形の合併処理の例
を示す図である。
【符号の説明】
101 入力部 102 演算処理部(CPU) 103 記憶部 104 出力部 105 領域分割部 106 画像縮小データ化部 107 ラベリング部 108 基本属性判別部 109 組方向検出部 110 見出し類検出部 111 矩形の合併部

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 与えられた画像データの各領域の種類を
    判定する画像処理装置であって、 前記画像データ中のm×n画素領域から低解像度の1画
    素を抽出する抽出手段と、 低解像度の画素の連続する広がりから、画像種別の領域
    を判別する領域判別手段と、 該領域判別手段で判別された領域情報から、当該領域の
    種別を判断する判断手段とを備えることを特徴とする画
    像処理装置。
  2. 【請求項2】 前記m、nは、入力される画像データの
    解像度が高いほど、大きな値を持つことを特徴とする請
    求項第1項に記載の画像処理装置。
  3. 【請求項3】 前記抽出手段は、m×n画素内に有意な
    画素が1つでも存在するとき、当該m×n画素に対する
    低解像度の画素を有意が画素として抽出することを特徴
    とする請求項第1項に記載の画像処理装置。
  4. 【請求項4】 前記抽出手段は、m×nの画素の各ドッ
    ト状態の論理和を算出する算出手段を含むことを特徴と
    する請求項第3項に記載の画像処理装置。
  5. 【請求項5】 前記領域判別手段は、低解像度の画素の
    連続する広がりに対して内接する矩形を領域として判別
    することを特徴とする請求項第1項に記載の画像処理装
    置。
  6. 【請求項6】 前記領域判別手段は、 与えられた画像データ中のm×nの画素群を1画素とす
    るライン単位に、各低解像度の有意な画素位置を求める
    手段と、 主走査方向に連続する有意な低解像度の画素の始まり位
    置と、その連続する個数を走査ライン毎に記憶すると共
    に、注目ライン中に有意な低解像度の画素がない場合に
    は、所定の判別情報を記憶する記憶手段と、 該記憶手段で記憶された内容に従って、有意な低解像度
    の2次元に連続する領域を検索する検索手段と、 検索して得られた連続する低解像度の画素群に対して固
    有のラベルを付すと共に、当該固有のラベルの画素群の
    座標位置に基づいて、当該画素群を内接する矩形領域の
    座標を得る手段とを備えることを特徴とする請求項第5
    項に記載の画像処理装置。
  7. 【請求項7】 前記判断手段は、前記領域判別手段で判
    別された領域の縦、横のサイズ、当該領域内における有
    意な低解像度の画素数の占める割合に従って、当該領域
    の種類を判断することを特徴とする請求項第1項に記載
    の画像処理装置。
  8. 【請求項8】 与えられた画像データの各領域の種類を
    判定する画像処理方法であって、 前記画像データ中のm×n画素領域から低解像度の1画
    素を抽出する抽出工程と、 低解像度の画素の連続する広がりから、画像種別の領域
    を判別する領域判別工程と、 該領域判別工程で判別された領域情報から、当該領域の
    種別を判断する判断工程とを備えることを特徴とする画
    像処理方法。
  9. 【請求項9】 前記m、nは、入力される画像データの
    解像度が高いほど、大きな値を持つことを特徴とする請
    求項第8項に記載の画像処理方法。
  10. 【請求項10】 前記抽出工程は、m×n画素内に有意
    な画素が1つでも存在するとき、当該m×n画素に対す
    る低解像度の画素を有意が画素として抽出することを特
    徴とする請求項第8項に記載の画像処理方法。
  11. 【請求項11】 前記抽出工程は、m×nの画素の各ド
    ット状態の論理和を算出する算出手段を含むことを特徴
    とする請求項第10項に記載の画像処理方法。
  12. 【請求項12】 前記領域判別工程は、低解像度の画素
    の連続する広がりに対して内接する矩形を領域として判
    別することを特徴とする請求項第8項に記載の画像処理
    方法。
  13. 【請求項13】 前記領域判別工程は、 与えられた画像データ中のm×nの画素群を1画素とす
    るライン単位に、各低解像度の有意な画素位置を求める
    工程と、 主走査方向に連続する有意な低解像度の画素の始まり位
    置と、その連続する個数を走査ライン毎に記憶すると共
    に、注目ライン中に有意な低解像度の画素がない場合に
    は、所定の判別情報を記憶する記憶工程と、 該記憶工程で記憶された内容に従って、有意な低解像度
    の2次元に連続する領域を検索する検索工程と、 検索して得られた連続する低解像度の画素群に対して固
    有のラベルを付すと共に、当該固有のラベルの画素群の
    座標位置に基づいて、当該画素群を内接する矩形領域の
    座標を得る工程とを備えることを特徴とする請求項第1
    2項に記載の画像処理方法。
  14. 【請求項14】 前記判断工程は、前記領域判別工程で
    判別された領域の縦、横のサイズ、当該領域内における
    有意な低解像度の画素数の占める割合に従って、当該領
    域の種類を判断することを特徴とする請求項第8項に記
    載の画像処理方法。
JP6167748A 1994-07-13 1994-07-20 画像処理装置及び方法 Pending JPH0830725A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP6167748A JPH0830725A (ja) 1994-07-20 1994-07-20 画像処理装置及び方法
DE69531882T DE69531882D1 (de) 1994-07-13 1995-07-11 Gerät und Verfahren zur Bildverarbeitung
EP95304854A EP0692767B1 (en) 1994-07-13 1995-07-11 Image processing apparatus and method
US08/501,562 US5966455A (en) 1994-07-13 1995-07-12 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6167748A JPH0830725A (ja) 1994-07-20 1994-07-20 画像処理装置及び方法

Publications (1)

Publication Number Publication Date
JPH0830725A true JPH0830725A (ja) 1996-02-02

Family

ID=15855379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6167748A Pending JPH0830725A (ja) 1994-07-13 1994-07-20 画像処理装置及び方法

Country Status (1)

Country Link
JP (1) JPH0830725A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6067382A (en) * 1997-02-05 2000-05-23 Canon Kabushiki Kaisha Image coding based on the target code length
JP2001209792A (ja) * 2000-01-25 2001-08-03 Juki Corp 部品位置検出方法、部品位置検出装置、部品データ格納方法及びその装置
US6389162B2 (en) 1996-02-15 2002-05-14 Canon Kabushiki Kaisha Image processing apparatus and method and medium
JP2013072968A (ja) * 2011-09-27 2013-04-22 Olympus Corp 顕微鏡システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6481081A (en) * 1987-09-22 1989-03-27 Mitsubishi Electric Corp Graphic recognizing device
JPH01113880A (ja) * 1987-10-28 1989-05-02 Agency Of Ind Science & Technol 画像の連結成分抽出装置
JPH0696275A (ja) * 1992-09-11 1994-04-08 Canon Inc 画像処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6481081A (en) * 1987-09-22 1989-03-27 Mitsubishi Electric Corp Graphic recognizing device
JPH01113880A (ja) * 1987-10-28 1989-05-02 Agency Of Ind Science & Technol 画像の連結成分抽出装置
JPH0696275A (ja) * 1992-09-11 1994-04-08 Canon Inc 画像処理装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6389162B2 (en) 1996-02-15 2002-05-14 Canon Kabushiki Kaisha Image processing apparatus and method and medium
US6067382A (en) * 1997-02-05 2000-05-23 Canon Kabushiki Kaisha Image coding based on the target code length
JP2001209792A (ja) * 2000-01-25 2001-08-03 Juki Corp 部品位置検出方法、部品位置検出装置、部品データ格納方法及びその装置
JP4614487B2 (ja) * 2000-01-25 2011-01-19 Juki株式会社 部品位置検出方法、部品位置検出装置、部品データ格納方法及びその装置
JP2013072968A (ja) * 2011-09-27 2013-04-22 Olympus Corp 顕微鏡システム

Similar Documents

Publication Publication Date Title
US5684891A (en) Method and apparatus for character recognition
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US6466694B2 (en) Document image processing device and method thereof
US5335290A (en) Segmentation of text, picture and lines of a document image
EP1017011A2 (en) Block selection of table features
JPH08212298A (ja) 文書方向自動判別装置、及び文書方向自動補正装置
JPH10513284A (ja) 二進イメージに対する空白ページ及び文字枠の自動決定
JP2008108114A (ja) 文書処理装置および文書処理方法
JPH0830725A (ja) 画像処理装置及び方法
JP3814334B2 (ja) 画像処理装置及びその方法
JP2022090469A (ja) 書式定義装置、書式定義方法、及びプログラム
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP3100825B2 (ja) 線認識方法
JP3052438B2 (ja) 表認識装置
JP3406942B2 (ja) 画像処理装置及び方法
JPH0696275A (ja) 画像処理装置
JPH11187231A (ja) 画像検索装置及び画像検索方法
JP2000285237A (ja) 画像処理装置、画像処理方法及び画像処理プログラムを記録した記録媒体
JP2740506B2 (ja) 画像認識方法
JPH0644406A (ja) 画像処理方法及び装置
JPH08147314A (ja) 認識型文書ファイリング装置及びその制御方法
JPH09269970A (ja) 文字認識方法とその装置
JP2000155806A (ja) 文字認識方法、文字認識装置、辞書作成方法、辞書作成装置、文字品質判定方法、及び、記録媒体
CN115713460A (zh) 信息处理装置、教师数据的生成方法、已学习模型的生成方法、以及存储介质
JPH09146947A (ja) 文字領域の順序付け方法及び装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040405