JPH0799581A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JPH0799581A
JPH0799581A JP26046593A JP26046593A JPH0799581A JP H0799581 A JPH0799581 A JP H0799581A JP 26046593 A JP26046593 A JP 26046593A JP 26046593 A JP26046593 A JP 26046593A JP H0799581 A JPH0799581 A JP H0799581A
Authority
JP
Japan
Prior art keywords
image
vector
data
area
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP26046593A
Other languages
English (en)
Other versions
JP3353968B2 (ja
Inventor
Shinichi Imaide
愼一 今出
Seiji Tatsuta
成示 龍田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP26046593A priority Critical patent/JP3353968B2/ja
Publication of JPH0799581A publication Critical patent/JPH0799581A/ja
Application granted granted Critical
Publication of JP3353968B2 publication Critical patent/JP3353968B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【目的】本発明は、各種画像が混在した入力画像を画像
の種類毎の領域に分割でき、各種画像種類に適した画像
データ圧縮により混在画像全体のデータ圧縮率を高める
と共に、画像の画質を向上させる画像処理装置を提供す
ることを目的とする。 【構成】本発明は、画像入力部1と、像域分離するカラ
ー画像/モノクロ画像変換部2と、変換されたモノクロ
画像を2値化する2値化部3と、2値化画像を縮小する
縮小処理部4と、入力画像を構成する2値、連続階調画
像などの構成要素の領域の境界を抽出する境界抽出部5
と、抽出した境界が生成する部分領域内の画像種類を判
定する画像種類判定部6と、データ圧縮処理部7とで構
成され、画像のエッジや黒画素パターンの発生頻度の偏
りに着目しパターン判定を効率的に行う前処理を施し、
前処理データをニューラルネットワークにより画像種類
判定で判定を行い、好適する圧縮により処理する画像デ
ータ圧縮処理装置である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力する活字、手書き
文字、写真、絵柄などの各種画像が混在した入力画像
(以下、混在画像と称する)を画像の種類毎の領域に分
割し、データ圧縮等の画像処理を行う画像処理装置に関
する。
【0002】
【従来の技術】従来、文字,絵柄,写真等が混在した混
在画像(文書画像)の様な連続的に階調が変化する画像
(以下連続階調画像と称す)をディジタルデータとして
ファイリングする際に、それらのデータを蓄積するにし
ても通信を行うにしても、効率的データの伝送を行うた
めに、画像データにデータ圧縮が施されている。
【0003】一般に混在画像は、撮像装置によって取り
込み、データ圧縮等の画像処理を行なう場合、文字、絵
柄、写真等の相対的に性質の異なる領域に分割して、各
画像領域に応じた処理を行なうのが望ましい。
【0004】この混在画像から、文字列、絵柄、写真等
の各領域を分割する手法としては、画像全体を連結成分
に分解し、ある種の統合を行なって、連結成分の集合と
しての領域を設定する方法が一般に行われている。
【0005】従来の技術としては、例えば、文献“文字
/絵柄(網点、写真)混在画像の像域分離方式”[電子
情報通信学会論文誌 D−II Vol.J75−D−
IINo.1 p.p.39−47 1992年1月]に記
載されるように、文字画像判定を行うために、まずエッ
ジ強調処理を行い、適当な閾値判定により3値化し、
黒,白画素が連続する箇所をパターンマッチングによっ
てエッジ領域を検出し、文字画像領域を判断する方式が
ある。
【0006】また、特開昭61−296481号公報に
記載されるような、入力された2値の文書画像を縮小化
し、近接した黒画素を統合して領域を検出するものもあ
る。
【0007】これは図49に示すように、文書を光学的
に走査し、光電変換することによって得られた2値の画
像(文書画像)を記憶する画像情報記憶部と、前記画像
情報記憶部に記憶された文書画像を小領域に分割し、各
小領域を1画素に縮小して記憶する縮小画像記憶部と、
前記縮小画像を文字列方向に走査して、近接した黒画素
を統合する黒画素統合処理部と、前記黒画素統合処理部
で得られた画像において、黒画素の連結した領域を画像
領域として検出する領域検出部とから構成されている。
【0008】前記画像情報記憶部に記憶された2値の文
書画像は、所定の画素数からなる小領域に分割され、各
小領域中での黒画素の数が所定の閾値以上であれば黒画
素を、閾値未満であれば白画素を割り当て、縮小画像記
憶部2に記憶される。
【0009】また、黒画素統合処理部では、前記縮小画
像を文字列方向に走査して、所定の閾値より短い白ラン
を黒ランに変換することによって近接した黒画素を統合
する。領域検出部では、前記黒画素統合処理部で得られ
た画像において黒画素の連結した領域を画像領域として
検出する。これにより、文書中に含まれる画像領域の検
出を行なうことができる。
【0010】また、従来画像情報処理システムの処理機
能として、入力した混在画像を画像種類ごとに分類して
ディジタルデータに変換する処理が行われている。
【0011】この処理は、混在画像をディジタルデータ
で蓄積メディアに保存する際に、画像種類ごとに最大効
率でデータを圧縮できる圧縮方法を適用し、総合的デー
タ量を、所望される情報の品質を維持しつつ、最大限削
減することが目的の一つにある。また文字、線画などの
2値階調画像と写真などの連続階調画像を分類してそれ
ぞれに2値画像表現された画像がより良好であるように
2値化処理方法を適応的に選択することを目的としてい
るものもある。
【0012】前記混在画像の中から画像種類ごとの記載
領域を分割し、分類する処理方法は種々考案されてい
る。これらの多くは画像の種類によって呈する特徴量を
抽出して、その特徴量を定められた評価関数または判定
関数で判断し、画像種類を決定している。画像におい
て、所定ブロック領域内での黒画素の発生頻度やエッジ
の発生頻度、輝度レベルのヒストグラム、空間周波数分
布、線分の方向度分布などを特徴量としているものが従
来例として多い。
【0013】また本発明においても特徴量として利用す
る入力画像の濃度勾配の度数分布を特徴量としている
例、特公平4−18350号公報がある。この分類処理
方法では、入力画像であるディジタル画像の水平方向、
垂直方向に対して画素単位毎に濃度勾配を求め、求めた
水平、垂直濃度勾配の値から算出される方向を、分割さ
れた小領域内で計数して、その度数分布を求めている。
度数分布から度数の分散を算出して、分散と所定閾値と
の閾値判定により文字領域であるか否かを判断し決定し
ているものである。
【0014】
【発明が解決しようとする課題】前述した従来の手法に
よる画像データの分類が良好に行われるには、入力され
た画像データがノイズ等を含まない比較的良好な状態の
理想的な画像データを対象としている。しかし実際に
は、入力画像データに照明ムラやファイル原稿の汚れ等
が入り込む場合が多く、このような画像内で部分的にコ
ントラストの低下やノイズの発生し、黒画素検出やエッ
ジ抽出が不安定になる。従って、不安定な黒画素検出や
エッジ抽出をパラメータとして用いた従来の手法では、
正確な画像種類の判定が非常に難しくなる。
【0015】さらに前述した混在画像の領域分割におい
て、画像領域の端部が欠けることなく領域分割を行なう
ためには、画像を縮小化する際に文字の端点等のエッジ
部分を忠実に反映させることが要求される。しかしなが
ら、従来の技術では取り込んだ2値の混在画像を小領域
に分割し、各小領域中の黒画素の数が所定の閾値以上の
場合に黒画素を割り当てていたので、閾値が‘0’より
大きいと、小領域が画像領域の端にかかった場合に領域
が検出されずに、一部が欠けてしまうことや、また閾値
を‘0’にするとノイズを多く拾ってしまい、正しい分
割が出来ないという欠点を有していた。
【0016】さらに、黒白の反転した混在画像では、文
書全体が大きな領域として抽出されてしまうといった欠
点も有していた。
【0017】また、前述した濃度閾値から算出される方
向の分布は、画像のエッジ部分の方向性分布をよく反映
できる。従って垂直・水平方向にエッジ成分を多く含む
活字体文字の画像に限って、それ以外の画像との差異が
顕著になるので、被判定画像が活字体文字か否かを決定
するには有効な特徴量である。さらにこの特徴量から判
定を下す評価基準として分布の分散を用いていること
は、エッジの方向性の偏りを観察することになり、また
分散の算出そのものが計算的負荷が比較的軽いので実用
的である。
【0018】しかし、濃度勾配の方向分布に対する分散
だけを閾値判定しても、例えば、輝度(濃度)レベルの
範囲が狭くなっている所謂コントラストが低い画像であ
ったり、判定対象小領域に対し文字のエッジ部分占める
割合が小さい場合であったり、文字そのものの線の太さ
が細かったりする場合では、たとえそれが活字体文字画
像であっても分散が小さくなり、明確な判定が困難にな
る。なぜなら背景が呈する濃度勾配の方向分布が頻度と
して多くなり、文字部分が呈するそれと相対的に差異が
認められなくなるためである。背景が示す濃度勾配の方
向分布は通常方向依存性はないので、文字部のエッジの
方向分布の方向依存性が背景の分布に埋もれてしまう。
【0019】さらには、活字体文字画像に限らず多種画
像(手書き文字・写真・絵柄・背景)を選択して分類し
ようとすると、濃度勾配の方向分布の分散を観察しただ
けでは全く区別できないという問題点があった。
【0020】そこで本発明は、各種画像が混在した入力
画像を画像の種類毎の領域に分割でき、各種画像種類に
適した画像データ圧縮等を行うことに当たって好適とな
る画像処理装置を提供することを目的とする。
【0021】
【課題を解決するための手段】本発明は上記目的を達成
するために、種々の情報が混在した画像を入力する画像
入力手段と、前記画像入力手段から出力された画像デー
タを2値化画像データに変換する2値化手段と、前記2
値化手段からの2値化画像データを縮小画像データにす
る縮小手段と、前記縮小手段から出力された縮小画像デ
ータから画像を構成する連続要素領域を抽出する構成要
素領域抽出手段と、前記構成要素領域抽出手段により抽
出された連続要素領域の所定領域ごとに、予め情報によ
り分類された画像種に基づき、画像の種類を判定する画
像種類判定手段と、前記抽出された領域と判別された画
像種によって好適するデータ圧縮方式を選択し、前記画
像入力手段からの画像データを圧縮するデータ圧縮手段
とで構成された画像処理装置を提供する。
【0022】そして文字、絵柄および写真等が混在する
混在画像から、文字列、絵柄、写真等の各領域を分割す
る画像処理装置において、前記混在画像を記憶する画像
メモリと、前記画像メモリに記憶された混在画像からエ
ッジを抽出し、2値画像に変換するエッジ抽出・2値化
処理手段と、前記2値画像を所定数の画素からなる小領
域に分割し、各小領域を1画素に縮小する縮小画像処理
手段と、前記縮小画像中の黒画素領域を統合し、ブロッ
ク化するブロック処理手段と、前記ブロック処理手段の
ブロック化により連結した黒画素の存在範囲から画像領
域外接矩形の対角座標を求める矩形領域抽出手段とで構
成された画像処理装置を提供する。
【0023】また、文字,絵柄および写真等が混在する
混在画像をディジタル化し蓄積する画像フレームメモリ
と、前記画像フレームメモリから出力される画像データ
を同種類毎の画像領域に分割して、同種画像領域の位置
並びに大きさを出力する同種画像領域分割手段と、前記
同種画像領域内を所定の大きさの小領域に選択抽出し、
該小領域の位置、大きさを出力する探索ブロック領域選
択手段と、前記探索ブロック領域選択手段により選択さ
れた小領域に対応する画像データを判定対象領域として
前記画像フレームメモリより読み出し、一時蓄積する判
定対象ブロック画像メモリと、前記判定対象領域の画像
データから水平方向の差分値データ及び垂直方向の差分
値データを検出する水平・垂直差分検出手段と、前記水
平・垂直差分データにより輝度修正のための修正パラメ
ータを算出し、前記修正パラメータに基づき、前記判定
対象領域の画像データから修正された輝度レベルを算出
する輝度レベル修正処理手段と、前記水平・垂直差分検
出手段からの水平・垂直差分値データ、及び前記輝度レ
ベル修正処理手段からの修正輝度レベルデータをベクト
ル量子化するベクトル量子化手段と、前記ベクトル量子
化手段からの量子化ベクトルの各成分の計数を行う量子
化ベクトル計数手段と、計数された量子化ベクトルの成
分を入力とし、所定の画像種類を出力するニューラルネ
ットワーク(神経回路網)と、出力される画像種類の判
定結果を評価し決定して、前記同種画像領域の位置及び
大きさのデータと合わせて決定した画像種類を出力する
画像種決定手段とで構成された画像処理装置を提供す
る。
【0024】さらに、入力した画像信号をデジタル画像
データに変換する画像入力手段と、前記入力した画像信
号内から所定の大きさで小領域を選択抽出する判定対象
領域選択部と、判定対象領域の画像データから隣接する
画素の所定数(N)の画素からなる局所画素パターンを
検出する局所画素パターン検出手段と、前記局所画素パ
ターンをN次元空間上でベクトル量子化するベクトル量
子化手段と、前記ベクトル量子化手段により量子化され
た代表ベクトルに対してその発生頻度を計数してヒスト
グラムを算出するヒストグラム生成手段と、前記ヒスト
グラム生成手段により求められた量子化ベクトルヒスト
グラムを入力として、その分布形状を識別して所望する
画像種類を出力する画像種識別手段と、前記識別結果を
得て、画像種類を決定する画像種決定手段とで構成され
た画像処理装置を提供する。
【0025】
【作用】以上のような構成の画像処理装置は、画像入力
部により画像データが2値化処理部に入力される。前記
2値化処理部では、エッジ抽出かまたは黒画素抽出が行
われた後に2値化し、その2値化データは構成領域の境
界抽出を容易にするために縮小処理部に入力され、縮小
処理が施される。縮小処理部から出力された縮小2値画
像は、連続する構成要素の領域を抽出する構成要素領域
抽出手段に入力され、領域が抽出される。抽出された構
成要素の部分領域に対し、逐次画像種類判定処理が施さ
れ画像種類の判定がなされ、それぞれに好適するデータ
圧縮処理がなされる。
【0026】また、本画像処理装置は、入力された、異
なる画像の種類、例えば活字体文字、手書き文字、写
真、絵柄画像などが混在する画像(文書画像)からエッ
ジを抽出し、2値化画像処理が施される。その2値画像
を所定数の画素からなる小領域に、画像領域の端部が欠
けることなく、また、黒白の反転した混在画像に対して
も、効率よく分割されて、各小領域が1画素に縮小さ
れ、縮小画像中の黒画素領域を統合しブロック化され
る。前記ブロック化により連結した黒画素の存在範囲か
ら画像領域外接矩形の対角座標を求められ、同種画像領
域毎に分割される。
【0027】さらに本画像処理装置は、入力した混在画
像が同種画像領域毎に的確に分割され、同種画像領域内
に判定対象領域を定めて、例えば水平差分値,垂直差分
値、修正輝度レベルの3つのパラメータがなす3次元直
交空間に分布する形状をベクトル量子化によりパターン
化してモデル化し、そのモデル化された分布パターンを
ニューラルネットワークで認識して画像種類が判定さ
れ、混在画像が像域分離される。
【0028】また本画像処理装置は、混在画像の各分割
領域に対し、所定の小ブロック単位で特徴パターンを検
出し、その特徴パターンの生起確率分布をニューラルネ
ットワークで識別し判定される。この特徴パターンの特
徴量は、画像の隣接する画素の複数(N)からなる例え
ば、輝度パターンを所定小ブロック内で漏れなく検出さ
れ、検出された輝度パターンをN次元ベクトルと見なし
て、N次元空間において、ベクトル(輝度パターン)の
ベクトル量子化が行われる。そして量子化された所定数
の代表ベクトルに対して、それぞれ発生度数分布を計数
して、発生度数分布の形状を識別する目的で各量子化ベ
クトルの発生度数を並列して、例えば画像種識別手段と
してのニューラルネットワークに入力され、分布形状に
対応する画像種識別結果が出力される。
【0029】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
【0030】図1には、本発明による第1実施例として
の画像データ圧縮装置の構成を示し説明する。
【0031】この画像データ圧縮装置において、画像入
力部1は光学系1aと、例えばCCD等の固体撮像素子
1bとで構成され、入力する2値画像または連続階調画
像から成るカラー画像をディジタル画像データに変換し
て取り込む。
【0032】前記画像入力部1から出力される画像デー
タは、カラー/モノクロ変換処理部2に入力され、取り
込んだカラー画像から輝度(明度)成分のみのデータに
変換されモノクロ画像データに変換し出力する。これは
画像種類を特定して領域を抽出する像域分割を行う上
で、初期段階で扱うデータ量を削減し、以後の処理を簡
単化することにある。
【0033】前記カラー/モノクロ変換処理部2から出
力されるモノクロ画像データは、2値化処理部3に入力
され、2値化処理が施される。前記2値化処理部3で
は、黒画素抽出処理またはエッジ抽出処理が行われる。
【0034】ここで、前述した処理を図2及び図3を参
照して具体的に説明する。
【0035】図2には、黒画素抽出の処理を行う構成を
示す。
【0036】まずモノクロ画像データは、差分演算処理
部11,12により、画像の水平方向と垂直方向のそれ
ぞれに対し、所定の画素間単位毎に差分処理が行われ
る。この差分処理で得られたデータに対して、適切な閾
値を設定して、差分データの絶対値がその閾値以下のと
き‘0’とし、それ以外は‘1’とする2値化処理を2
値化処理部13,14で行う。
【0037】そして合成部15により、水平,垂直の各
2値化データの論理和(排他的論理和)をとり、再び水
平、垂直方向のデータに分離して黒画素再生部16,1
7にて連続する‘0’を挟んだ‘1’と‘1’の間を全
て‘1’にする。
【0038】その結果得られる水平、垂直方向の2値化
データを、さらに合成部18で論理和をとり、黒画素ビ
ットマップを得る。
【0039】次に図3を参照して、2値化処理部3で行
う2値化処理のもう1つの手法及び、エッジ抽出処理の
一例を説明する。前記黒画素ビットマップを生成したの
と同様に、モノクロ画像データは、画像の水平方向と垂
直方向それぞれに対して、所定の画素間単位毎に差分演
算処理部21,22で差分処理が行なわれる。
【0040】これらの差分処理で得られたデータに対
し、適切な正又は負の閾値を設定して、差分データがそ
の正の閾値以下の時、又は負の閾以上の時‘0’とし、
正の閾値以上の時、又は負の閾以下の時は‘1’とする
2値化処理を2値化処理部23,24で行う。ここでこ
の様にするのは、正負2対の差分値から成る2値線分の
一方のエッジのみを抽出するためである。これは文字画
像等で、その線分の太さの変化に対する特徴パラメータ
の依存性を軽減するためである。水平、垂直方向それぞ
れの2値化データの論理和(排他的論理和)を合成部2
5でとり、エッジ抽出による2値化画像データを得る。
【0041】次に図1に戻り、全体の処理の流れを再び
説明する。
【0042】前記2値化処理部3から出力された2値画
像データは、縮小処理部4に入力され、縮小処理を行
う。縮小処理は適当な間隔で画素の単純間引きによって
実現する。この縮小処理によって2値画像データは、行
間等の画像を構成する要素が無い領域と構成要素がある
領域との分離がより明確になる。
【0043】そしてデータ自体の削減が実行され、処理
負荷が低減される。縮小処理部4からの出力は、連続構
成要素領域の境界抽出部5に入力される。この境界抽出
は、例えば、図4に示す構成によって処理が実現され
る。
【0044】まず、間引き処理部26から出力された2
値化データは、LPF(ローパスフィルタ)27を通過
して、エッジ部の平滑化処理が行われ、平滑化処理によ
って得られたデータは、エッジ抽出部28で閾値判定に
よるエッジ抽出が行われる。
【0045】ここで抽出されたエッジデータにより、境
界線算出部29により、水平線垂直線で直線近似を行い
連続構成要素領域の境界を算出することができる。この
直線近似は、例えば、最小自乗法による近似を用いるこ
とができる。結果として、複数の構成要素毎の矩形領域
を得る。
【0046】次に連続構成要素領域の境界抽出部5から
出力された領域データに基づき、画像種類判定部6によ
り、領域毎の画像種類が随時判定される。
【0047】画像種類の判定において、図5を参照して
具体的に説明する。図5(a)は事前に画像種類の違い
による特徴を統計データより抽出して判定時の評価基準
を判定する過程を示す。図5(b)は求めた評価基準を
使って実際の画像種類の判定を行う際の過程を示す。図
5(a)のエッジ抽出部31は、図1で説明された2値
化処理部3に対応する。
【0048】抽出されたエッジデータは、元々の入力画
像に照明ムラ等があった場合にそれらを削減する効果が
ある。また図3で説明したエッジ抽出手法を使えば、文
字画像等を構成する線分の太さに対する依存性が小さい
特徴パラメータとすることができる。エッジ抽出部31
から出力された2値化画像データは、所定のブロック単
位で統計的に複数サンプルし、KL変換部32でKL変
換が施される。KL変換部32ではブロックを構成する
画素数の正規直交ベクトルで表されているブロック単位
の2値化画像データを無相関データになるように変換
し、その基底ベクトルを基底ベクトル抽出部33で算出
する。
【0049】その基底ベクトル算出の対象となる2値化
画像データは画像種類が混在した画像標本を用いる。従
って各種画像が混ざった画像データの任意のブロックデ
ータを使用する。算出した基底ベクトルは内積演算部3
4に入力され、エッジ抽出部31から出力される2値化
画像データとブロック単位で内積演算が行われる。内積
演算されたデータは、算出基底ベクトル毎の成分値を示
し、各種画像に応じた特徴量が得られる。得られた基底
ベクトル毎の内積結果である特徴量をニューラルネット
ワーク部35に入力する。
【0050】前記ニューラルネットワーク部35に入力
する入力数は、前記基底ベクトル数としてもよいが、特
徴量を顕著に表すベクトルから優先的に選択して有効な
ベクトルのみをニューラルネットワークの入力としても
よい。ニューラルネットワークは階層型ネットワークを
用いる。ニューラルネットワークの出力は判定したい画
像種類の数として、教師データ入力部36から教師デー
タが人為的にサンプルしたブロックデータ毎に入力さ
れ、学習がなされる。学習は一般的な逆伝搬法を用いれ
ばよい。
【0051】ブロック領域単位の事前学習によって構築
されたネットワークは、2値化画像データの画像種類の
違いによる2値化パターンベクトルの判定回路である。
この判定回路に2値化パターンデータを入力することで
画像種類の判定を実行することができる。KL変換によ
って求めた各ベクトルの特徴量の判定にあえてニューラ
ルネットワークを用いるのは、特徴量の微妙な違いをよ
り精度よく判定するためである。
【0052】そして図5(b)で示す実際の判定では、
エッジ抽出部31の出力が内積演算部34に入力され、
エッジ抽出部31から出力される2値化画像データとブ
ロック単位で先に求めた基底ベクトルとの内積演算が行
われる。その出力は事前学習にて構築したニューラルネ
ットワーク35に入力され画像の種類が判定され、判定
した画像の種類を出力する。
【0053】図1の構成図において、画像種類判定部6
から出力される画像種類判定結果のデータはデータ圧縮
部7に加えられて、データ圧縮方法が選択され、画像入
力部1からの出力画像を該当するデータ圧縮方法でデー
タ圧縮が行われる。当然ながら境界抽出部5から出力さ
れる領域の位置及びサイズデータと共に画像データが存
在する部分のデータのみ選択的にデータ圧縮が施され
る。従ってデータ圧縮部からの出力は、画像データが存
在する複数の部分領域の位置とサイズのデータと各領域
の画像種別データと各領域の圧縮データとなる。
【0054】以上詳述したように本実施例の画像圧縮装
置では、照明ムラ等の外乱が存在して入力される混在画
像において、外乱に影響され難い2値化パターンを最適
座標軸変換とニューロ判定を効果的に行使する構成の画
像データ圧縮装置を提供することにより、混在画像ファ
イルの総データ数が削減され、且つ画像種ごとの像域分
割を精度よく実行することができる。
【0055】また、この第1実施例によれば、初期段階
において、2値化と縮小処理を行い像域分割を行い、扱
う画像データ並びに画像種類の判定箇所が少なくて済む
ため、演算処理の負荷低減が図られハード化を容易に
し、実現性が高い画像データ圧縮装置である。
【0056】次に図6には本発明による第2実施例とし
ての画像処理装置の領域分割の概念を示し説明する。
【0057】この画像処理装置において、撮像装置等に
よって取り込まれた文書画像を記憶する画像メモリ45
と、前記画像メモリ45によって記憶された文書画像か
らエッジ抽出して2値化するエッジ抽出・2値化処理部
46と、前記エッジ抽出・2値化処理部46で2値化さ
れた文書画像を縮小化する縮小画像処理部47と、前述
した縮小画像中の近接した黒画素を連結してブロック化
するブロック処理部48と、前述したブロック処理画像
中の連結した黒画素の存在範囲から外接矩形の対角座標
を求める矩形領域抽出部49とで構成される。
【0058】次に図7には、第2実施例の画像処理装置
のさらに具体的な構成を示し説明する。
【0059】前記エッジ抽出・2値化処理部46におい
て、図示しない撮像装置によって取り込まれ、画像メモ
リ45に記憶された24ビットフルカラー文書画像を8
ビット白黒階調画像に変換する輝度変換回路50と、白
黒階調画像を記憶する階調画像メモリ51と、前記階調
画像メモリ51に記憶された白黒階調画像を横方向に走
査し、差分をとる横方向差分処理回路52と、前記差分
値を2値化する2値化処理回路53と、前記横方向差分
2値画像を記憶する横方向2値画像メモリ54、縦方向
の同様の操作を行なう縦方向差分処理回路55と縦方向
2値画像メモリ56と、前記2値画像メモリ54、56
に記憶された2値画像の論理和をとり、エッジ2値画像
を得る論理和演算回路57と、前記論理和演算結果の2
値画像を記憶する2値画像メモリ58とで構成される。
【0060】そして前記縮小画像処理部47において
は、前記2値画像メモリ58に記憶された2値画像を縮
小する縮小画像処理回路59と、前記縮小画像を記憶す
る縮小画像メモリ60と、前記縮小画像メモリ60に記
憶された縮小画像中の弧立点等を除去するフィルタ処理
回路61とで構成される。
【0061】さらにブロック処理部48においては、前
記フィルタ処理回路61からのフィルタ処理画像を縦横
に走査し、所定値以上の長さを持つ白ラン(長白ラン)
を検出する長白ラン検出回路62と、検出された長白ラ
ンを記憶するブロック画像メモリ63と、前記ブロック
画像メモリ63に記憶されたブロック画像にラベリング
を施すラベル処理回路64とで構成される。
【0062】そして、矩形領域抽出部49においては、
ラベル処理回路64によって、同一のラベルを付与され
た黒画素の存在範囲から各ブロックの外接矩形対角座標
(アドレス)を抽出するアドレス抽出回路65と、抽出
されたアドレスを記憶するアドレスメモリ66、前記ア
ドレスメモリ66に記憶されたアドレスを縮小化する前
の画像のアドレスに変換するアドレス変換回路67とで
構成される。
【0063】このように構成された画像処理装置におい
て、撮像装置によって取り込まれ、画像記憶メモリ45
に記憶された24ビットフルカラー文書画像は、輝度変
換回路50によって8ビット白黒階調画像に変換され、
階調画像メモリ51に記憶される。輝度変換回路50と
しては種々のものが考えられる。例えば、RGBそれぞ
れに所定の値を乗じてその総和をとるような構成とす
る。横方向差分処理回路52では、階調画像メモリ51
に記憶された白黒階調画像を横方向に走査して差分をと
り、2値化処理回路53で差分値を2値化して横方向2
値画像メモリ54に送る。
【0064】このような操作について図8を用いて説明
する。
【0065】図8は、文書画像の一部を拡大して示した
一部画像68と、一部画像68に対応する部分の階調画
像データ69と、横方向2値画像メモリ54に記憶され
た一部画像68に対応する部分の2値画像70とを示し
ている。
【0066】前記一部画像68では、1つのマスが1画
素を表しており、前記階調画像データ69は、階調画像
メモリ51に記憶された一部画像68に対応する部分の
階調画像データを横方向に走査して隣接画素の差分をと
り、例えば、差分値が50を越えたときにその部分をエ
ッジと見なして、輝度の小さい方の画素の1(黒)を割
り当てて2値化し、横方向2値画像メモリ54に記憶さ
せる。
【0067】同様に、縦方向差分処理回路55では、縦
方向に差分をとって2値化し、縦方向2値画像メモリ5
6に送る。また論理和演算回路57では、前記横方向2
値画像メモリ54、縦方向2値画像メモリ56に記憶さ
れた差分2値画像の論理和をとり、得られたエッジ2値
画像は2値画像メモリ58に記憶される。
【0068】そして縮小画像処理回路59では、例え
ば、2値画像メモリ58に記憶された512×512画
素からなる2値画像を縦横8画素からなる64×64個
の小領域に分割する。そして各小領域中で黒画素(値が
1の画素)を検出し、検出されれば‘1’とし、検出さ
れなければ‘0’とした画素の値で縮小画像を形成し、
縮小画像メモリ60に記憶する。
【0069】次にフィルタ処理回路61では、縮小画像
メモリ60に記憶された縮小画像にフィルタをかけ、縮
小画像中のノイズを除去する。フィルタとしては種々の
ものが考えられるが、例えば、図9に示すような3×3
の弧立点除去フィルタ71を用いる。これは、注目画素
の8近傍の画素の値が同じとき、注目画素の値を近傍の
画素の値と同じにするものであり、左上から右下に向か
って順次走査する事によって弧立点を除去することが出
来る。長白ラン検出回路62では、前記フィルタ処理後
の縮小画像を縦横に走査して、例えば、16画素以上の
長さを持つ白ラン(長白ラン)を検出し、検出された部
分には‘0’(白画素)、それ以外の部分については
‘1’(黒画素)を割り当てることによって黒画素領域
を統合し、ブロック画像を生成して、ブロック画像メモ
リ63に記憶する。
【0070】そしてラベル処理回路64では、ブロック
画像メモリ63に記憶されたブロック画像を走査して各
画素の連結状態を調べ、例えば、4連結している画素に
は同じラベルを付与することによってラベリングを行
う。
【0071】このラベリング操作について図10を用い
て説明する。
【0072】図10において、文書画像中の注目画素x
とその近傍を拡大して示したものである。これまでの処
理で画像は2値化され、白画素は0、黒画素は1で与え
られている。いま、注目画素をx(image[i]
[j])、その上の画素をa(image[i][j−
1])、左隣の画素をb(image[i−1]
[j])とし、以下の条件に従ってラベリングを行な
う。(1)x=0ならばxにはラベル0を与える。 (2)a=bかつa=0ならば、xには新しいラベルを
与える。 (3)a=bかつa≠0ならば、xにはaと同じラベル
を与える。 (4)a>bかつb=0ならば、xにはaと同じラベル
を与える。 (5)a>bかつb≠0ならば、xにはbと同じラベル
を与え、aと同じラベルをもつ全ての画素のラベルをb
のラベルと同じにする。 (6)a<bかつa=0ならば、xにはbと同じラベル
を与える。 (7)a<bかつa≠0ならば、xにはaと同じラベル
を与え、bと同じラベルをもつ全ての画素のラベルをa
のラベルと同じにする。 但し、注目画素が画像上端のときはa=0、画像左端の
ときはb=0とする。
【0073】この処理を画像左上から順次行なうことに
よって、ラベリングが完了する。
【0074】次にアドレス抽出回路65では、前記ブロ
ック画像メモリ63に記憶されたラベリング済みのブロ
ック画像を走査し、図11に示すように、同一のラベル
を付与された画素の座標の横方向最小・最大値(xsn
en)、および、縦方向最小・最大値(ysn,yen)を
検出し、画像領域の外接矩形対角座標(左上座標
(x sn,ysn)、右下座標(xen,yen))としてアド
レスメモリ66に記憶する。アドレス変換回路67で
は、アドレスメモリ66に記憶されたアドレスを縮小画
像処理回路59での縮小率に応じて拡大変換することに
よって、縮小化する前の画像のアドレスに変換する。
【0075】例えば、縮小画像処理回路59での縮小率
が1/8の場合、以下の式によってアドレス変換を行な
い、アドレスメモリ66の内容を書き換える。
【0076】 xs ′=xs ×8 ys ′=ys ×8 xe ′=(xe +1)×8−1 ye ′=(ye
1)×8−1 こうして、アドレスメモリ66に記憶された外接矩形対
角座標と画像メモリ45に記憶された元の画像とを領域
分割処理結果として出力する。
【0077】次に図12乃至図14には、本実施例にお
ける各処理過程の出力画像を示す。
【0078】図12乃至図14において、画像メモリ4
5に記憶される、文字と写真からなる領域分割対象文書
画像73と、2値画像メモリ58に記憶されたエッジ抽
出・2値化処理画像74と、縮小画像メモリ60に記憶
された縮小処理画像75と、ブロック画像メモリ63に
記憶されたブロック処理画像76と、アドレスメモリ6
6に記憶されたアドレスによって、画像メモリ45に記
憶された文書画像の画像領域分割結果を示した画像77
とを示す。
【0079】これにより、画像領域の端部が欠けること
なく領域分割することができる。また、画像を矩形領域
で切り出すので、文書画像の領域分離を効率的に行なう
ことができる。
【0080】この第2実施例の画像処理装置は、画像の
縮小処理を行なう前に隣接画素の輝度の差分を利用した
エッジ抽出・2値化を行なっているため、文字の端点等
のエッジ部分を縮小画像に忠実に反映させることがで
き、画像領域の端部が欠けることなく、また、白黒の反
転した文書画像に対しても、効率よく画像領域を分割す
ることができる。
【0081】また、この画像処理装置は、縮小画像に対
して弧立点除去フィルタをかけることによって、誤分割
の原因となる余計な黒画素を消去しているので、効率よ
く画像領域を分割することが可能となる。さらに、ブロ
ック処理部では、長白ランを検出することによって黒画
素領域をブロック化しているので、予め文字列方向がわ
かっていない場合でも、画像を走査して短い白ランを検
出し、それを黒ランに置き換えて論理積をとるといった
処理が不要となり、効率よく画像領域を分割することが
可能となる。また本実施例では、ブロック化した黒画素
にラベリングを行なっているので、黒画素の連結状態が
簡潔に表現され、効率よく画像領域を分割することが可
能となる。
【0082】次に図15には、本発明による第3実施例
としての画像処理装置について説明する。この画像処理
装置は、前述した第2実施例の図7におけるエッジ抽出
・2値化処理部46のみを変形し、他の構成部は同等で
あり、ここではエッジ抽出・2値化処理部46のみを説
明する。なお、本実施例の構成部で図7に示した構成部
と同等なものには同じ参照符号を付してその説明を省略
する。
【0083】図15において、階調画像メモリ51に記
憶された白黒階調画像を横方向に走査し、比をとる横方
向除去処理回路78、前記比の値を2値化する2値化処
理回路79、縦方向に横方向除去処理回路78と同様の
操作を行なう縦方向除算処理回路80が設けられてい
る。
【0084】このように構成された画像処理装置におい
て、横方向除算処理回路78では、階調画像メモリ51
に記憶された白黒階調画像を横方向に走査して比をと
り、2値化処理回路79で比の値を2値化して横方向2
値画像メモリ54に送る。
【0085】この2値化操作について図16を用いて説
明する。
【0086】図16は、文書画像の一部を拡大した一部
画像68と、一部画像68に対応する部分の階調画像デ
ータ69と、一部画像68に対応する部分の2値画像8
1とを示す。
【0087】図16において、一部画像68は、文書画
像の一部を拡大したもので、1つのマスが1画素を表し
ている。階調画像データ69は、階調画像メモリ51に
記憶された一部画像68に対応する部分の画像データで
あり、一部画像68に対応する部分の2値画像である。
この2値画像を図に示すように横方向に走査して隣接画
素の輝度の大小を調べ、その比をとる。そして、例え
ば、比の値が0.9未満であったときに、輝度の小さい
方の画素に‘1’(黒)を割り当てて2値化し、横方向
2値画像メモリ54に記憶させる。そして2値画像は、
横方向2値画像メモリ54に記憶された一部画像68に
対応する部分であり、同様に縦方向除算処理回路80で
は、縦方向に比をとって2値化し、縦方向2値画像メモ
リ56に送る。
【0088】次に、前述した第2実施例と同様の処理に
よって行う領域分割について説明する。図17乃至図1
9は、本実施例における各処理過程の出力画像を示す。
【0089】図17乃至図19において、領域分割対象
文書画像82は、画像メモリ45で記憶される文字と写
真からなる。また2値化処理画像83は、2値画像メモ
リ58に記憶された2値化処理画像であり、縮小処理画
像84は、縮小画像メモリ60に記憶された縮小処理画
像である。そしてブロック処理画像85は、ブロック画
像メモリ63に記憶されたブロック処理画像であり、領
域分割画像86は、アドレスメモリ66に記憶されたア
ドレスによって、画像メモリ45に記憶された文書画像
の画像領域分割結果を示した画像である。
【0090】このような画像処理により、画像領域の端
部が欠けることなく領域分割することができる。また、
画像を矩形領域で切り出すので、文書画像の領域分離を
効率的に行なうことができる。
【0091】従って、この第3実施例の画像装置では、
画像の縮小処理を行なう前に、隣接画素の輝度の比を利
用したエッジ抽出・2値化を行なっており、文字の端点
等のエッジ部分を縮小画像に忠実に反映させることがで
き、画像領域の端部が欠けること、効率よく画像領域を
分割することが可能となる。さらに、本実施例では、隣
接画素の輝度比の大きさに基づいた2値化を行なってい
るので、シェーディングのかかった文書画像の領域分割
も可能となる。
【0092】例えば、原画像パターンをG、照度パター
ンをF、観測される画像パターンをYとすると、YはF
とGの積(Y=F×G or log Y=log F+log G)に
よって表される。従って、照度パターンFの変化が観測
画像パターンGの変化に比較して十分緩やかであれば、
シェーディングのかかった画像でも隣接画素の輝度比は
保存されていると考えることができる。
【0093】これに対し、隣接画素の輝度差は保存され
ず、暗部では小さく、明部では大きくなるので、暗部で
はエッジが正しく検出されなくなる。すなわち、隣接画
素の輝度差ではなく、輝度比をとることによって、エッ
ジ抽出を行なうことにより、強いシェーディングのかか
った文書画像の領域分割も可能となる。さらに本手法で
は、輝度の低い部分では僅かな輝度の変化も検出される
ので、エッジのみならず、輝度変化のある低輝度部分も
同時に抽出することができる。
【0094】なお、同様な効果を得るための変形例とし
て、図7におけるエッジ抽出・2値化処理部46を図2
0に示すような構成とすることにより可能になる。これ
は、輝度の比をとる代わりに、対数処理回路87によっ
て対数輝度を求め、これに所定値を乗じて階調画像メモ
リ51に記憶しておき、これを縦横に走査して差分をと
り、2値化するものである。
【0095】このような2値化操作について図21を用
いて説明する。
【0096】図21において、対数輝度データ88は、
階調画像メモリ51に記憶された68に対応する部分の
対数輝度のデータであり、これを図に示すように横方向
に走査して隣接画素の差分をとり、例えば、差分値が5
を越えたときに対数輝度の小さい方の画素に‘1’
(黒)を割り当てて2値化し、横方向2値画像メモリ1
4に記憶させる。2値画像41は、横方向2値画像メモ
リ14に記憶された一部画像68に対応する部分の2値
画像である。以下、第1実施例と同様の処理を行ない、
図15と同様の効果を得ることができる。
【0097】次に図22には、本発明による第4実施例
としての画像処理装置の構成を示し説明する。この第4
実施例においては、第2実施例の図7に示したエッジ抽
出・2値化処理部46を変形し、他の構成部は同じ構成
とする。なお、第4実施例の構成部において、図7に示
した構成部と同等のものには同し符号を付してその説明
を省略する。
【0098】この画像処理装置において、微分フィルタ
処理回路89は、階調画像メモリ51に記憶された白黒
階調画像からエッジを抽出するための回路であり、エッ
ジ画像メモリ90は、前記微分フィルタ処理により得ら
れたエッジ画像を記憶するメモリであり、2値化処理回
路91は、前記エッジ画像メモリ90に記憶されたエッ
ジ画像を2値化する処理回路である。
【0099】このように構成された画像処理装置におい
て、微分フィルタ処理回路89では、階調画像メモリ5
1に記憶された白黒階調画像に微分フィルタをかけてエ
ッジを抽出し、エッジ画像メモリ90に記憶させる。
【0100】この微分フィルタとしては、種々のものが
考えられるが、例えば、Laplacianフィルタを
用いる。前記2値化処理回路91では、エッジ画像メモ
リ90に記憶されたエッジ画像を2値化し、2値画像メ
モリ58に記憶させる。また2値化処理としては種々の
ものが考えられるが、例えば、注目画素とその近傍8画
素の計9画素について最大値を求め、その1/2を閾値
として注目画素を2値化する。他にも平均や分散、最大
・最小値の差等を組み合わせた2値化も勿論可能であ
る。なお、固定閾値により2値化を行なう場合には、他
の構成例として図23に示すように構成で、微分フィル
タ処理と2値化処理を同時に行なうことができる。
【0101】図24を参照して、この微分フィルタ処理
と2値化処理の操作について説明する。
【0102】図24において、一部画像92は、文書画
像の一部を拡大して示したもので、1つのマスが1画素
を表している。また階調画像データ93は、階調画像メ
モリ11に記憶された一部画像92に対応する部分の画
像データであり、これをLaplacianフィルタ9
4を通過させてエッジ画像データ95を得る。例えば、
注目画素とその近傍8画素の計9画素について最大値を
求め、その1/2を閾値として注目画素を2値化する。
こうして得られたエッジ画像96は、2値画像メモリ5
8に送られ、記憶される。以下の画像処理は、第2実施
例と同様の処理によって領域分割が行なわれる。
【0103】これにより、画像領域の端部が欠けること
なく領域分割することができる。また、画像を矩形領域
で切り出すので、文書画像の領域分離を効率的に行なう
ことができる。
【0104】従って、第4実施例の画像処理装置は、画
像の縮小処理を行なう前に、微分フィルタを利用したエ
ッジ抽出・2値化を行なっており、文字の端点等のエッ
ジ部分を縮小画像に忠実に反映させることができ、画像
領域の端部が欠けることなく、効率よく画像領域を分割
することが可能となる。さらに、本実施例では、エッジ
抽出手段として2次元の微分フィルタを用いているの
で、階調画像を縦横にそれぞれ走査する必要がなく、構
成を簡単にすることが可能となる。
【0105】なお、予め対象画像の絵柄等の方向性を認
識してから微分フィルタの係数を適当に設定することに
より、特定の方向に連結した画像領域のみを分割する事
等行なってもよく、対象画像の特徴に応じた選択的且
つ、適応的な領域分割が可能となる。
【0106】次に図25には、本発明による第5実施例
としての画像処理装置の構成を示し説明する。この第5
実施例においては、第2実施例の図7に示したエッジ抽
出・2値化処理部46を変形し、他の構成部は同じ構成
とする。なお、第5実施例の構成部において、図7に示
した構成部と同等のものには同し符号を付してその説明
を省略する。
【0107】この画像処理装置において、縮小画像メモ
リ60に記憶された縮小画像を縦横に走査し、所定値以
下の長さを持つ白ラン(短白ラン)を検出する短白ラン
検出回路97と、前記短白ラン検出回路97で検出され
た短白ランを黒ランに置換する白→黒置換回路98と、
横方向の走査により短白ランを黒ランに置換して得られ
たブロック画像を記憶する横ブロック画像メモリ99
と、縦方向の走査により短白ランを黒ランに置換して得
られたブロック画像を記憶する縦ブロック画像メモリ1
00と、前記ブロック画像メモリ99、100に記憶さ
れたブロック画像の論理積をとり、ブロック画像を得る
論理積演算回路101とで構成される。
【0108】このように構成された画像処理装置は、短
白ラン検出回路97が縮小画像メモリ60に記憶された
縮小画像を走査して、所定値以下の長さを持つ白ラン
(短白ラン)を検出し、白→黒置換回路98で、検出さ
れた白ラン中の画素値を‘0’(白画素)から1(黒画
素)に反転させる。この走査に縦横について行ない、横
ブロック画像メモリ99および、縦ブロック画像メモリ
100に記憶させる。そして論理積演算回路101で
は、前記画像メモリ99、100に記憶されたブロック
画像の論理積をとり、ブロック画像を生成し、ブロック
画像メモリ63に記憶させる。
【0109】この操作について図26を用いて説明す
る。
【0110】図26において、一部画像102は縮小画
像メモリ60に記憶された縮小画像の一部を拡大して示
したもので、1つのマスが1画素を表している。これを
横方向に走査し、例えば、長さが16画素未満の白ラン
を検出して、これを黒ランに置換する。こうして得られ
た横ブロック画像は、横ブロック画像メモリ99に記憶
される。
【0111】そして横ブロック画像103は、一部画像
102に対応する部分の横ブロックの画像であり、斜線
部は置換された黒ランを表している。同様に、縮小画像
を縦方向に走査し、短白ランを黒ランに置換することに
よって得られた縦ブロック画像は、縦ブロック画像メモ
リ100に記憶される。
【0112】また、縦ブロック画像104は、一部画像
102に対応する部分の縦ブロックの画像であり、斜線
部は置換された黒ランを表している。横,縦ブロック画
像メモリ99,100に記憶された前記ブロック画像
は、論理積演算回路101によって論理積が演算され、
ブロック画像が生成される。ブロック画像105は、
横,縦ブロック画像103,104の論理積から生成さ
れた、一部画像102に対応する部分のブロック画像で
あり、網掛部は置換された黒画素を表している。以下、
この実施例は、第2実施例と同様の画像処理を行い領域
分割を行なわれる。
【0113】これにより、画像領域の端部が欠けること
なく領域分割することができる。また、画像を矩形領域
で切り出すので、文書画像の領域分割を効率的に行なう
ことができる。
【0114】従って、第5実施例の画像処理装置は、縮
小画像中の黒画素を統合するためのブロック処理に、短
白ラン/黒ラン変換を行なっており、縮小画像中の黒画
素をほぼ矩形状のブロックに統合することができ、効率
よく画像領域を分割することが可能となる。
【0115】以上説明した画像処理装置は、エッジ抽出
・2値化処理部46、縮小画像処理部47、ブロック処
理部48、矩形領域抽出部49は、第2実施例〜第5実
施例に掲げたものに限られるものではなく、その他の公
知の技術を用いて構成することもできる。また、これら
の組合せも、実施例に掲げたものに限られるものではな
く、各処理部を交換して構成することも可能であること
は勿論である。
【0116】なお、文字列の方向等が予めわかっている
場合には、その方向にのみ画素の統合を行なえばよいの
で、より簡単な構成によって実現できる。
【0117】また、これら実施例に示した装置における
画像処理はソフトウェア上で行なうようにしてもよいこ
とは勿論である。
【0118】次に図27には、本発明による第6実施例
としての画像処理装置の構成を示し説明する。
【0119】この画像処理装置は、大別して、入力され
るディジタル画像(混在画像)を画像種類が未知状態の
ままで同種画像領域ごとに矩形分割する同種画像領域抽
出部と、分割された同種画像部分領域の画像種類を判定
し、決定する画像種判定部より構成される。
【0120】この画像処理装置において、異なる画像の
種類、例えば活字体文字、手書き文字、写真、絵柄画像
等が混在して記載されているドキュメントファイルは、
ビデオカメラ、イメージスキャナによってフルカラー画
像が撮像されてアナログ画像入力信号としてディジタル
画像変換器111に入力される。
【0121】前記ディジタル画像変換器111は、アナ
ログ画像入力信号を変換してディジタル画像信号を出力
する。出力データは、一旦、画像フレームメモリ112
に入力されて、一時蓄積される。また既に、ディジタル
画像信号に変換されている蓄積画像データ及び伝送画像
データは、直接、画像フレームメモリ112に入力され
て同様に、一時蓄積される。
【0122】前記画像フレームメモリ112から出力さ
れたディジタル画像データは、同種画像領域抽出部11
3を構成する同種画像領域分割部114に入力される。
この同種画像領域分割部114は、画像種類は未知の状
態で同種類の画像が存在する領域の背景との境界を抽出
して、分割していく処理を行う。
【0123】一枚の混在画像から分割された複数の同種
画像領域は、それぞれ矩形領域として算出されて、定め
られた1稜角の水平・垂直位置を示す分割領域アドレス
データと、矩形領域のサイズ(幅・高さ)が出力され
る。具体的な分割処理方法は、従来より種々考案されて
いる手法を用いてもよし、前記図6に示した実施例を利
用してもよい。例えば、取り扱うデータそのものを削減
して処理の負荷を軽減するために、まず画像フレームメ
モリ112からの出力フルカラー画像をモノクロ画像に
変換し、さらに2値化する。
【0124】そして2値化された2値画像を縮小化処理
して、ローパスフィルターでフィルタリングしてエッジ
抽出を行い、抽出エッジ画像を2値化する。2値化した
エッジ画像のエッジ部分を水平・垂直方向それぞれに対
し線分近似して矩形の境界を抽出する。このようにして
同種画像領域を求めることもできる。
【0125】そして同種画像領域分割部114から出力
された分割領域アドレスデータとサイズは、探索ブロッ
ク領域選択部115に入力される。探索ブロック領域選
択部115では、求められた同種画像領域のどの部分を
実際に画像種判定の着目領域にするかを選択する。選択
された着目領域は、予め設定されるか或いは同種画像領
域のサイズに適応的に変化する大きさをもつ所定サイズ
の矩形小ブロック領域とする。
【0126】図28には、このようにして分割処理され
た一枚の混在画像を簡略化して示す。この図の場合、分
割された同種画像領域はA〜Hの9つ存在している。例
えば、判定対象ブロックは同種画像領域Hに置かれ、こ
の領域内を移動して以後の判定処理が施され、同種画像
領域Hの画像種類が特定される。この矩形小ブロック領
域は、後述する処理で実際に画像種判定の対象となる判
定対象ブロックであり、そのサイズは少なくとも同種画
像領域のサイズより小さい。
【0127】前記探索ブロック領域選択部115におい
て選択される判定対象ブロックの位置は、同種画像領域
内で複数回、同位置を重複しないよう選択される。選択
された判定対象ブロックの位置・サイズのデータは、画
像フレームメモリ112に入力されて、対応する画像メ
モリ部分の画像データが画像フレームメモリ112から
出力される。
【0128】そして画像フレームメモリ112から出力
された判定対象ブロックのフルカラー画像は、画像種判
定部116を構成する判定対象ブロック画像メモリ11
7に入力されて一時蓄積される。この判定対象ブロック
画像メモリ117から出力されるフルカラー画像データ
は、モノクロ画像変換部118に入力されて輝度レベル
データからなるモノクロ画像データに変換される。
【0129】本実施例では、画像種類の判定に際して
は、画像の輝度情報のみで判定し、色情報は使用しない
ことを前提とする。これは、1つには全体の処理過程に
おいて極力前置段階で取り扱うデータを削減して計算処
理の負荷を軽減して実用性のより高い処理とするためで
ある。また、1つには入力画像全面或いは一部が仮にモ
ノクロ画像であってもなんら画像種類の判定には影響が
ない、汎用性の高い処理を実現するためである。
【0130】前記モノクロ画像変換部118から出力さ
れる判定対象画像のモノクロ画像データは、まず水平差
分検出器119と垂直差分検出器120に同時に入力さ
れて、出力データがそれぞれバッファメモリ121とバ
ッファメモリ122に入力され、一時蓄積される。水平
差分検出器119では、モノクロ画像変換部118から
出力される判定対象領域の各画素の輝度成分から構成さ
れる画像データにおいて、任意画素と隣接する画素の輝
度レベルの差分値を水平方向に対して算出するものであ
る。
【0131】具体的には、判定対象画像のモノクロ画像
をM×N画素の矩形画像とし、図29(a)に示すよう
に、水平・垂直の画素配列をそれぞれi、jで記述すれ
ば、その任意画素の輝度レベルは、 yij 但し、i,j:0,1,2,…,M−1 (1) と表わせて、求める水平差分値Δhijは、 Δhij=y(i+1)j−yij 但し、i,j:0,1,2,…,M−2 (2) となる。同様にして、垂直差分値Δvijは、 Δvij=yi(J+1)−yij 但し、i,j:0,1,2,…,N−2 (3) となる。
【0132】これらの水平・垂直差分値がなす水平差分
マップ及び垂直差分マップは、計算結果が一旦、バッフ
ァメモリに格納されると共に、輝度修正パラメータ算出
部123に入力されて、輝度を修正するためのパラメー
タが算出される。
【0133】この輝度修正パラメータ算出部123で
は、図29(b)で示すブロック図に従って処理が進め
られる。水平差分マップの中から急峻なエッジ部分を除
去した部分の差分データを平均したものを平均水平差分
( avrΔh)、また垂直差分マップの中から急峻なエッ
ジ部分を除去した部分の差分データを平均したものを平
均垂直差分( avrΔv)と称して算出する。
【0134】図29(c)に示すように判定対象画像に
おける水平方向(H)、垂直方向(V)と差分値(D)
の3次元直交空間(H,V,D)でのベクトルh(1,
0,avrΔh)とベクトルv(0,1, avrΔv)がな
す平面ベクトルp(h,v,d)、 平面ベクトルp=α×ベクトルh+β×ベクトルv (4) に対する法線ベクトルnは、 法線ベクトルn=( avrΔh, avrΔv,−1) (5) から求める。
【0135】また、水平差分マップ上で急峻なエッジ部
分を“0”としてそれ以外を“1”としたビットマップ
と、垂直差分マップ上で急峻なエッジ部分を“0”とし
てそれ以外を“1”としたビットマップが前記処理のと
きに作成され、これら2つのビットマップの論理和をと
ったビットマップをマスクパターンとする。但し、急峻
なエッジとは、差分値の絶対値が所定の閾値より大きい
か否かで決定される。このようにして、輝度修正パラメ
ータとして、前記法線ベクトルnとマスクパターンが輝
度修正パラメータ算出部123から出力される。
【0136】前記輝度修正パラメータ算出部123から
出力される法線ベクトルnとマスクパターンのデータ
は、輝度レベル修正処理部124に入力されて、同時に
入力されるモノクロ変換部118から判定対象ブロック
の輝度データを修正する。輝度レベル修正処理部124
で行われる輝度レベルの修正処理では、図31に示され
る処理過程が以下のように行なわれる。
【0137】まず、図31(a)に示すようにモノクロ
変換部118からの輝度レベルイメージデータに対し
て、先に求めたマスクパターンが乗じられ、急峻なエッ
ジ部分の輝度データが取り除かれる。次に、図31
(b)に示されるような判定対象ブロックの水平・垂直
・輝度の3次元直交空間(H,V,Y)において、求め
た法線ベクトルnの方向を有する座標軸を修正座標軸m
Yとして設定し、ブロック内全ての画素に対して、その
輝度レベルyijを修正座標軸mYに射影した修正輝度レ
ベルmyijを算出し、修正輝度レベルごとに度数を求め
て修正輝度ヒストグラムを算出する。修正輝度ヒストグ
ラムは、修正輝度に対する正規化が施される。
【0138】尚、図31(b)における斜線部での度数
分布は、修正前の輝度レベルの度数分布を示すものであ
る。
【0139】正規化方法は、種々考えられる。例えば修
正輝度ヒストグラムを、 f(my) 但し、my=0〜255 (6) とし、修正輝度が0から最大にわたって積分した任意修
正輝度myijでの積算度数をg(my)とする。g(m
y)は、
【0140】
【数1】 と表せ、ヒストグラムの総和度数をgt とする。修正輝
度に対する正規化は、g(my)/gt =5%を満足す
るmyを最小修正輝度レベルmin _myとし、g(m
y)/gt =95%を満足するmyを最大修正輝度レベ
ルmax _myとすれば、次式より任意の修正輝度レベル
myijより正規化修正輝度レベルを求めることもでき
る。
【0141】
【数2】 これは、修正輝度レベルのヒストグラムの輝度レベルレ
ンジを求めて、固定した所定のレンジに線形変換する正
規化処理である(図31(b)におけるmy軸方向での
正規化)。なお、最小修正輝度レベル、最大修正輝度レ
ベルを定めるとヒストグラムの積算度数の総和度数に対
する割合は、前記例5%,95%に限定されるものでは
なく、適切な値が設定されれば良い。
【0142】次に度数の正規化であるがこれは度数のピ
ークにそって正規化するもので、図31(b)においは
発生頻度軸方向での正規化である。
【0143】以上により、輝度レベル修正処理部124
では、モノクロ変換部118からの判定対象ブロックの
任意の画素(i、j)が修正されて輝度レベルmyij
なり、これがx軸方向で正規化されて、最終的に正規化
修正輝度レベルnmyijとして求められる。
【0144】そして輝度修正パラメ−タ部123、輝度
レベル修正処理部124で行われる一連の輝度修正処理
は、判定対象ブロックの画像に低周波の照明ムラ等が作
用している場合に、それを低減する処理を行うことと、
該ブロックの画像のダイナミックレンジの違いが該ヒス
トグラムの分布形状に依存することを暖和する目的で行
う。また、低周波成分除去の目的で通常の高域通過フィ
ルタを利用するのに比べてコンボリューション演算がな
く処理が簡単である。結局輝度レベル修正処理部124
からは、算出された前記正規化修正輝度レベルnmyij
が出力される。
【0145】前述した図27において、バッファメモリ
121から出力される水平差分値Δhijとバッファメモ
リ122から出力される垂直差分値ΔVijと正規化修正
輝度レベルnmyijの3つの特徴パラメータは、ベクト
ル量子化器125に入力されて、これら特徴パラメータ
を成分として定義される新たなる3次元直交空間(Δ
H,ΔV,nmY)に於ける特徴ベクトルf(Δh,Δ
v,nmy)をベクトル量子化する。
【0146】なお、図30(a)〜(d)は、それぞれ
画像種毎の特徴ベクトルの発生分布を示す図であり、
(a)は活字体文字、(b)は手書き文字、(c)は写
真画像、(d)は絵柄画像における特徴ベクトルの一例
を示す図である。各図において、縦軸には修正輝度nm
Y(modify Y)、横軸には垂直差分値ΔV(d
elta V)と、水平差分値ΔH(delta H)
をとった3次元直交空間上に各特徴ベクトルの分布をプ
ロットしている。これらの図から、特徴ベクトルの違い
に応じて画像種を判別することが可能であることがわか
る。
【0147】またベクトル量子化器125では、判定対
象ブロック内の任意の画素(i,j)の全ての画素に対
する特徴ベクトルfij(Δhij,Δvij,nmyij)が
入力され処理される。ベクトル量子化器の出力となる量
子化ベクトルは、予め複数の画像種類を有する複数の判
定対象ブロック画像から上記特徴パラメータを算出し
て、3次元直間交空間(Δh,Δv,nmy)を上にプ
ロットした発生分布より求める。即ち発生分布を所定数
の局所空間に最適に分割して、それぞれの局所空間内の
特徴ベクトルの発生確立が等しくなるようにした上で、
各局所領域内の平均ベクトルをその局所領域の代表ベク
トルとするのである。これら代表ベクトルが即ち量子化
ベクトルとなる。
【0148】具体的な代表ベクトルを算出する方法とし
ては種々の方法があるが、その一例として、LBGアル
ゴリズム[“An Algorithm for Vector Quantizer Desi
gn"YOSEPH LINDE etc.IEEE TRANSACTION ON COMUNICAT
IONS,VOL.COM-28,N0.1 JANUARY 1980}]を用いた場合
には、局所領域内に存在する全ての特徴ベクトルとその
局所領域の代表ベクトルとのユークリッド距離が他の局
所領域の代表ベクトルとのユークリッド距離に対し最短
になるように代表ベクトルが決定される。
【0149】従って、正攻法的にベクトル量子化を実行
するとすれば、任意の特徴ベクトルがベクトル量子化器
125に入力されると、前述したように、予め求めた所
定数の代表ベクトルの全てに対するユークリッド距離が
計測されて、最も距離が短いものが選択される。この選
択された代表ベクトルが入力された特徴ベクトルの量子
化ベクトルとして出力される。
【0150】このようにベクトル量子化を正攻法で行う
と、計算処理としての負荷が一般に重くなる。
【0151】そこで本実施例では、階層型フィードフォ
ワードのニューラルネットワークによるベクトル量子化
器を用いる。
【0152】図32は、そのニューラルネットワークの
構成を示したものである。特徴ベクトルfij(Δhij
Δvij,nmyij)は、3次元の入力ベクトルが入力部
131より、ニューラルネットワーク132に入力さ
れ、学習時においては、ユークリッド距離算出部133
にも同時に入力される。ニューラルネットワーク132
は、フィードフォワードの階層型ネットワークとし、3
入力の入力層134及び所定数の層の数とニューロ素子
を有する中間層135と、K個の出力をもつ出力層13
6で構成される。
【0153】この出力層136からの出力は、出力部1
37に出力される。ここで、Kは事前に試行錯誤して設
定されたベクトル数であり、前述した代表ベクトル数と
一致する。このベクトル量子化器を構成するニューラル
ネットワーク132の学習は、付設される教師データ生
成部138を使って行われる。教師データ生成部138
では、前記手法によって、事前に求められた代表ベクト
ルfk [k=0,1,…,K]のデータが格納されて
いる代表ベクトルデータメモリ139から出力される代
表ベクトルfk のデータと、入力部131から出力され
る特徴ベクトルがユークリッド距離算出部133に入力
されて、任意の特徴ベクトルと全ての代表ベクトルとf
k 距離が先の正攻法を使って計算される。
【0154】次に、最短距離選択部140にて最短距離
をとる代表ベクトルfk を選択して出力部137へ入力
し、出力層に設定されたK個の代表ベクトルfk に対応
づけられた出力ブランチのどれか1つが発火するよう指
示する。例えば,発火させたい出力を‘1’、その他を
‘0’とする。これがニューラルネットワーク132に
入力された特徴ベクトルと、ー対ーに対応させたい量子
化ベクトルを表すことになる。
【0155】このような一連の学習過程は、公知なバッ
クプロパゲーション法で行うものであって、混在画像の
中から画像種類を特定しないで特徴ベクトルが複数選択
されて、出力の誤差が設定値以下になるまで繰り返され
る。ー旦、ニューラルネットワーク132の学習が終了
し、全ての重みが決定されたならば、教師データ生成部
138は、切り放される。即ちニューラルネットワーク
132は、入力としての特徴ベクトルが与えられると、
それに対応した量子化ベクトルを出力するベクトル量子
化器としての機能が備わったことになる。
【0156】このようにして構築したベクトル量子化器
により、計算量の低減が図られ、高速性に富むものとな
る。ただし、ニューラルネットワークを利用した場合
は、入力した特徴ベクトルに対し、出力が必ず1つに限
定されない状態が出現することも考えられるが、その場
合は出力としての量子化ベクトルが複数存在しても構わ
ず、候補量子化ベクトルの扱いとなる。
【0157】前記ベクトル量子化器125から出力され
た単一の量子化ベクトルもしくは複数の候補量子化ベク
トルは、量子化ベクトル計数部126に入力される。こ
の量子化ベクトル計数部126では、量子化ベクトルf
k 毎に、その発生頻度の計数を行い、量子化ベクトルf
k のヒストグラムを生成する。さらに量子化ベクトルの
ヒストグラムの度数は、扱う判定対象ブロックの画素数
の変更に対して、普遍性を維持するために量子化ベクト
ルfk の最大度数が一定値になるように正規化される。
【0158】前記量子化ベクトルfk のヒストグラム
は、特徴パターン判定部127に入力されて、その形状
を確認して判定画像種類を出力する。特徴パターン判定
部127は、フィードフォワードの階層型ニューラルネ
ットワークで構成される。入力層は、量子化ベクトルの
数のK個の入力をもつ。中間層は試行錯誤的に適切に決
定された層数とニューロン素子をもち、出力層は判定し
たい画像種類の数の出力をもつ。例えば、活字体文字、
手書き文字、写真、絵柄画像、背景画像の5つの画像種
類を混在画像の中から判定して分離したいのであれば、
5出力をもつことになる。
【0159】この特徴パターン判定部127のニューラ
ルネットワークの学習は、入力された量子化ベクトルの
ヒストグラムのパターン形状と対応関係にある探索ブロ
ック選択部115で選択された判定対象ブロック画像の
種類を教師データとして出力層に与えられる。学習時、
教師データとしての判定対象ブロックの画像種類は人為
的に認識して決定する。そして学習過程は、バックプロ
パゲーション手法により、出力誤差が設定誤差以下にな
るまで、判定対象画像の種類をさまざまに変えて繰り返
し行われる。前記特徴パターン判定部127では、入力
される量子化ベクトルのヒストグラムの形状(特徴パタ
ーン)と画像の種類に相関関係があることを利用して、
ニューラルネットワークにより認識処理を行っている。
敢えてニューラルネットワークを用いているのは、一般
的なパターンマッチングのように多量の参照テンプレー
トと比較決定する膨大な計算を回避することと、特徴パ
ターンと画像種類との相関性が多少劣化しても判定確率
への影響が少ないことを利点とするためである。学習が
終了した特徴パターン判定127は、既に入力される量
子化ベクトルのヒストグラム形状に対し、画像種類を判
定し出力する画像種判定器になっている。
【0160】そして特徴パターン判定部127の出力
は、画像種決定部128入力されて判定対象ブロックの
画像種最終判断が行われる。先のベクトル量子化器12
5のときと同様に、特徴パターン判定部127のニュー
ラルネットワーク出力は、唯一つの画像種を出力しない
場合も考えられる。従って、その判定結果に対する評価
基準が必要であり、決定する処理が必要である。
【0161】本実施例では、図33に示す構成を一例と
して、入力データが5個の画像種類に対応してI1 ,I
2 ,〜,I5 として入力されるとすると、決定画像種判
断部141により、画像種の判断を保留するか決定する
かの判断がなされる。もし、 I1 > th1 但し、i=1,2,…5 且つ、(I1 の最大値)ー(I1 の2番目に大きい値)
>th2 ならば、処理は決定画像種出力部142に移り、Ii
中の最大値を示す画像種類max(Ii )を決定した画
像種類とする。そうでなければ、決定保留処置部143
に処理を移して、画像種類の決定は行われない。なお、
th1 、th2 は所定の閾値を示し、本実施例で最終決
定される画像の種類の人為的に所望する画像の種類に対
する誤り確率が最小になるように統計的に予め設定され
る。決定された、任意の判定対象ブロック画像種決定結
果は、決定結果蓄積部144に入力されて一時的に蓄積
される。次に再び、探索ブロック領域選択部115に戻
って、異なる判定対象ブロックが同種画像領域内で選択
されて決定結果蓄積部144までの処理過程が所定回数
繰り返される。したがって決定結果蓄積部144には、
同種画像領域に於ける異なる判定対象ブロックの判定結
果が蓄積されることになる。決定結果蓄積部144の所
定数の決定結果は、多数決部145に入力されて多数決
判定された後、対応する同種画像領域の画像種類の最終
決定が画像種決定部128から出力される。
【0162】画像種決定部128から出力される最終決
定した画像種類、前記同種画像領域のアドレスデータ及
びサイズが、本実施例の混在画像像域分離装置から出力
される。
【0163】次に図34には、本発明による第7実施例
としての画像処理装置の構成を示し説明する。この第7
実施例の構成部材は、図27に示した第6実施例の構成
部材と同等の部材には同じ参照符号を付して、その説明
を省略する。すなわち、第7実施例は、図27に示した
量子化ベクトル計数部126までを同じ構成とし、それ
以降最終出力までの構成が異なっている。
【0164】前述した第6実施例に示したように、量子
化ベクトル計数部126では、任意の同種画像領域内の
任意の判定対象ブロックに対する特徴ベクトルをベクト
ル量子化し、そのヒストグラムの度数が正規化されて出
力される。いま、探索ブロック領域選択部115で選択
される任意の同種画像領域内の判定対象ブロックを選択
順序に従って番号をつけ識別すると、正規化された量子
化ベクトルは、 量子化ベクトルfk [L] k=0,1,…,K
L=0,1,…,L と表すことができる。但し、量子化されるベクトル数を
K個、選択される判定対象ブロックの総数をLとする。
別の言い方をすれば、Lは任意の同種画像領域内を判定
対象ブロック単位で探索する際の探索回数のことであ
る。量子化ベクトル計数部126からの出力の量子化ベ
クトルfk [L]は、それぞれに接続されたK個の計数
累積部1〜計数累積部Kに入力し、L回分累積加算され
て、その結果ベクトルFk を出力する。即ち、
【0165】
【数3】 を出力する。なお、探索回数が場合によって種々変化さ
せたい場合には、ベクトルFk がLに依存するのを避け
るために、ベクトルFk をLで割って、出力ヒストグラ
ムの度数を平均としてもよい。
【0166】このように任意の同種画像領域内の複数判
定対象ブロックの累積した度数により、量子化ベクトル
のヒストグラムを求めるには、探索ブロック領域選択部
115から計数累積部151までの一連の処理過程を所
定回(L回)繰り返さなければならない。
【0167】そして探索回数出力された値ベクトルFk
は、第6実施例と同様に構成される特徴パターン判定部
127に入力されて、識別したい画像種類に応じた信
号、例えばI1 〜I5 が出力される。
【0168】次に、出力された画像種類の信号I1 〜I
5 は、最尤度判断部152に入力されて最大値を示す画
像種類を最尤判断画像種として出力する。この実施例で
は、画像種類の決定に際して、保留は行わない。
【0169】本実施例の混在画像像域分離装置から最終
出力として、最尤度判断部152から出力される画像種
類、第6実施例と同様な同種画像領域のアドレスデータ
及びサイズが出力される。
【0170】この第7実施例の構成と画像種判定手順を
実現すれば、画像種類と対応づけられる量子化ベクトル
のヒストグラムのパターンは、同種画像領域内の探索領
域を拡大した効果を生み出す特徴抽出するための母集団
を大きく取ることができる。しかも探索領域を拡大する
にも関わらず、ブロック単位毎の判定処理を必要としな
いことが優れている。
【0171】次に図35には、本発明による第8実施例
としての画像処理装置の構成を示し説明する。ここで、
第8実施例の構成部材で図27の構成部材と同等の部材
には同じ参照符号を付して、その説明を省略する。
【0172】そして正規化修正輝度レベルnmyijは、
修正輝度ヒストグラム算出部155に入力されて、正規
化修正輝度レベルnmyijに対する度数の計数を行って
ヒストグラムを生成する。生成ヒストグラムは、正規化
修正輝度レベルの最大値と最小値の差を所定数Sで線形
に分割して、分割最少単位を度数計数のステップ幅とし
て生成する。
【0173】従って、修正輝度ヒストグラム算出部15
5からの出力数は、ステップ数Sとして与えられるが、
このステップ数Sは必要最少限の数で画像種類とヒスト
グラム形状との相関性が適度に保たれるように、試行錯
誤的に予め求められる。ここで、修正輝度ヒストグラム
算出部155からの出力を、 ys s=0,1,…,S と定義しておく。
【0174】一方、バッファメモリ121とバッファメ
モリ122に一時蓄積された水平差分値 hij及び垂直
差分値 vijは、同時に読み出されて勾配ベクトル方位
検出部156に入力される。勾配ベクトル方位検出部1
56は、次の演算式 (1) hij>0のとき θ=tan-1(Δvij
/Δhij) (2) hij<0のとき θ=tan-1(Δvij
/Δhij)+π により求められる。但し、θは判定対象ブロックの任意
の画素(i,j)に対応した勾配ベクトル方位である。
【0175】前記勾配ベクトル方位θは、勾配ベクトル
方位ヒストグラム算出部157に入力されて、勾配ベク
トル方位θに対する度数の計数を行ってヒストグラムを
生成する。この生成ヒストグラムは、修正輝度ヒストグ
ラムを求めたときと同様に、所定のステップ角度で一様
に所定数Rで線形に分割して、分割最少単位に属する方
位角を度数計数の単位とする。
【0176】従って、勾配ベクトル方位ヒストグラム算
出部157からの出力数は、Rで与えられるが、このス
テップ数Rは、必要最少限の数で画像種類とヒストグラ
ム形状との相関数が適度に保たれるように、試行錯誤的
に、予め求められる。ここで、勾配ベクトル方位ヒスト
グラム157からの出力を、 θr r=0,1,…,R と定義しておく。
【0177】なお、計数度数の総計が異なっても勾配ベ
クトル方位θのヒストグラム形状の特徴パターンに般化
性が失われないように、必要に応じてθr の最大度数で
正規化しておくことが望ましい。
【0178】以上により、修正輝度ヒストグラム算出部
155と勾配ベクトル方位ヒストグラム算出部157か
らのys 及びθr の合計[R+S]個の出力が、特徴パ
ターン判定部127に入力する。特徴パターン判定部1
27は、階層型ニューラルネットワークで構成される。
入力層は[R+S]個の入力をもち、中間層は試行錯誤
的に適切に決定された層数とニューロン素子をもち、出
力層は判定したい画像種類の出力をもつ。例えば、活字
体文字、手書き文字、写真、絵柄画像、背景画像の5つ
の画像種類を混在画像の中から判定して分離したいので
あれば、5出力をもつことになる。
【0179】この特徴パターン判定部127のニューラ
ルネットワーク学習は、入力された修正輝度ヒストグラ
ムys と勾配ベクトル方位ヒストブラムθr のパターン
形状と対応関係にある探索ブロック選択部115で選択
された判定対象ブロックの画像の種類を教師データとし
て入力層に与えられる。
【0180】そして学習時、教師データとしての判定対
象ブロックの画像種類は、人為的に認識して決定する。
この学習過程は、バックプロパゲーション手法により、
出力誤差が設定誤差以下になるまで、判定対象画像の種
類をさまざまに変えて繰り返し行われる。前記特徴パタ
ーン判定部127では、入力される修正輝度ヒストグラ
ムys と勾配ベクトル方位ヒストグラムθr の形状(特
徴パターン)と画像の種類に相関関係があることを利用
して、ニューラルネットワークにより認識処理を行って
いる。第6実施例と同様に敢えてニューラルネットワー
クを用いているのは、一般的なパターンマッチングのよ
うに多量の参照テンプレートと比較決定する膨大な計算
を回避することと、特徴パターンと画像種類との相関性
が多少劣化しても判定確率への影響が少ないことを利点
とするためである。学習が終了した特徴パターン判定部
127は、既に入力される修正輝度ヒストグラムys
勾配ベクトル方位ヒストグラムθr のヒストグラム形状
に対し、画像種類を判定し出力する画像種判定器になっ
ている。
【0181】この修正輝度ヒストグラムys と勾配ベク
トル方位ヒストグラムθr のヒストグラム形状と画像種
類との相関性を示すものとして、本実施例では次の特徴
を捉え、利用する。
【0182】図36,図37は、この画像種類として活
字体文字、写真画像、絵柄画像を例にとってヒストグラ
ム形状の特徴的パターンとを対照したものである。図3
6(a),(b),(c)は、横軸に修正輝度、縦軸に
発生度数(発生確率)をとった修正輝度ヒストグラムを
示し、図37(a),(b),(c)は、15度おきの
方位角とそのステップ角で計数された度数を方位方向に
対して示している。前記活字体文字においては、輝度レ
ベルの分布の偏りが高低の2つになり双峰性を示し、勾
配ベクトル方位は90度おきの度数が顕著な方向依存性
が観測できる。写真画像において、輝度レベル分布は単
峰性であり、勾配ベクトル方位は方向依存性能を特に示
さない。また絵柄画像においては、輝度レベルの度数分
布は多峰性を有し、勾配ベクトル方位は先の活字体文字
に見られた90度おきの度数に加えて、45度おきの度
数も顕著になる方向依存性を示す。このように修正輝度
ヒストグラムと勾配ベクトル方位が画像種類によって特
徴的パターンの組み合わせを示す。
【0183】そして、図38は、2つのパラメータが示
す文字種類に対する特徴をまとめたものである。手書き
文字は、輝度ヒストグラムは双峰性を示し、勾配ベクト
ルは方向依存性をもたないという特徴を有する。また背
景は、輝度レベルの分布は鋭い単峰性を示すが活字体文
字が示す単峰性との認識誤りを避けるために占有レベル
の範囲がある閾値以下のものは分布度数を零にすること
にすると、この場合修正輝度レベルの度数はすべて零と
なり、勾配ベクトル方位の方向依存性はないという特徴
になる。
【0184】また背景の輝度レベル分布は、活字体文字
のそれに比べて取り得るレベル範囲が小さいため閾値判
断で輝度レベル分布における相違を明確化することがで
きる。
【0185】次に、前記特徴パターン判定部127の出
力は、画像種決定部128に入力されて判定対象ブロッ
クの画像種最終判断が行われる。この特徴パターン判定
部127のニューラルネットワーク出力は、唯一の画像
種を出力しない場合も考えられるので、図33に示す処
理を用いて画像種を決定する。
【0186】前記画像種決定部128から出力される最
終決定した画像種類、同種画像領域のアドレスデータお
よびサイズが、本実施例の混在画像域分離装置から出力
される。
【0187】さらに図39には第9実施例として、図3
5に示す構成における修正輝度ヒストグラム算出部15
5、勾配ベクトル方位ヒストグラム算出部157以降が
異なる処理を行う構成例を示す。処理内容は、第8実施
例と同様である。ここで、図39に示す構成部材で図3
5と同等の部材には、同じ参照符号を付して、その説明
を省略する。
【0188】本実施例で説明したように、修正輝度ヒス
トグラム算出部155および勾配ベクトル方位ヒストグ
ラム算出部157では、任意の同種画像領域内の任意の
判定対象ブロックに対する特徴ベクトルが抽出され、そ
のヒストグラムの度数が正規化されて出力する。探索ブ
ロック領域選択部115で選択される任意の同種画像領
域内の判定対象ブロックを選択順序にしたがって、番号
をつけ、識別すると正規化された特徴ベクトルは、 ベクトルθL =[θ1 ,θ2 ,θ3 ,…,θR ] ベクトルyL =[y1 ,y2 ,y3 ,…,yS ] 但
し、L =0,1,…,L と表すことができる。但し、選択される判定対象ブロッ
クの総数をLとする。Lは、任意の同種画像領域内を判
定対象ブロック単位で探索する際の探索回数のことであ
る。修正輝度ヒストグラム算出部155、勾配ベクトル
方位ヒストグラム算出部157からの出力(ベクトルθ
L ,ベクトルyL )は、それぞれに接続されたR+S個
の計数度数更新部R+Sに入力されて、L回処理が繰り
返される過程で、それぞれ成分の最大値になるよう更新
される。
【0189】すなわち、それらの特徴ベクトルの成分θ
R ,yS は、 ベクトルθ´=[max(θ1 ),max(θ2 ),max(θ3 ),…,
max(θR ) ]L ベクトルy´=[max(y1 ),max(y2 ),max(y3 ),…,
max(yS ) ]L を出力する。このように任意の同種画像領域内の複数判
定対象ブロックの最大値を示す特徴ベクトルの成分より
なる更新された特徴ベクトルのヒストグラムを求めるに
は、探索ブロック領域選択部115から計数度数更新部
159までの一連の処理過程を所定回(L回)繰り返さ
なければならない。
【0190】そして、探索回数出力された特徴ベクトル
θ´及び特徴ベクトルy´は、第7実施例の特徴パター
ン判定部127と同様な階層型ニューラルネットワーク
で構成される特徴パターン判定部127に入力されて、
識別したい画像種類に応じた信号、例えば、I1 〜I5
が出力される。出力された画像種類の信号I1 〜I
5は、最尤度判断部160に入力されて最大値を示す画
像種類を最尤判断画像として出力する。本実施例では、
画像種類の決定に際して、保留は行わない。
【0191】本実施例の混在画像像領域分離装置から最
終出力として、最尤度判断部160から出力される画像
種類、第8実施例と同様な同種画像領域のアドレスデー
タ及びサイズが出力される。本実施例の構成と画像種判
定手順を実現すれば、画像種類と対応づけられる修正輝
度ヒストグラム及び勾配ベクトル方位ヒストグラムのパ
ターンは、同種画像領域内の複数探索領域の中で、特徴
をより顕著に示すベクトル成分を選択的に抽出すること
ができ、画像種類ごとの特徴パターンの違いを明確化す
る。
【0192】以上のように第2乃至第9実施例の画像処
理装置は、入力された文書画像に対してエッジ抽出・2
値化処理を施すことによって、画像領域の端部が欠ける
ことなく、また、黒白の反転した文書画像に対しても、
効率よく画像領域を分割することができる。
【0193】また画像処理装置は、異なる画像の種類が
混在する混在画像を同種画像領域毎に的確に分割し、同
種画像領域内に判定対象領域を定めて、水平差分値,垂
直差分値、修正輝度レベルの3つのパラメータが示す分
布パターンの統計量を求め、その分布パターンをモデル
化・認識して画像種類を判定することにより、比較的軽
い負荷の処理で正解率の高い混在画像の像域分離が実現
できる。
【0194】そして前記分布パターンの分類・認識は、
統計データに基づき違いを顕著にするために3つのパラ
メータがなす3次元直交空間に分布する形状をベクトル
量子化によりパターン化してモデル化し、そのモデル化
されたパターンの形状をニューラルネットワークで認識
することにより、精度のよい画像種判定を可能にしてい
る人為的判定の場合に類似した、統計量に基づく適切な
クラスタリングが実現できる。
【0195】また、像域分離された画像は、画像の種類
に応じて行うことによって効果を発揮するデータ処理、
例えばデータ圧縮、適応2値化、網点処理、意図的画像
再現効果を実現する種々自然画像処理(フィルタリング
など)を自動化することが可能となる。
【0196】図40は、本発明による第10実施例とし
ての画像処理装置の構成を示すブロック図である。この
第10実施例の構成部材で、図27に示した構成部材と
同等の部材には同じ参照符号を付して、その説明を省略
する。探索ブロック領域選択部115において選択され
る判定対象ブロックの位置は、同種画像領域内で複数
回、同位置を重複しないよう選択される。選択された判
定対象ブロックの位置・サイズのデータは、画像フレー
ムメモリ112に入力されて、対応する画像メモリ部分
の画像データが画像フレームメモリ112から出力され
る。
【0197】この画像フレームメモリ112から出力さ
れた判定対象ブロックのフルカラー画像は、画像種判定
部170を構成する判定対象ブロック画像メモリ117
に入力されて一時蓄積される。判定対象ブロック画像メ
モリ117から出力されるフルカラー画像データは、モ
ノクロ画像変換部118に入力されて輝度レベルデータ
からなるモノクロ画像データに変換される。
【0198】本実施例では、画像種類の判定に際して
は、画像の輝度情報のみで判定し、色情報は使用しない
ことを前提とする。これは、1つには全体の処理過程に
おいて極力前置段階で取り扱うデータを削減して計算処
理の負荷を軽減してより実用性が高い処理を行うためで
ある。また、1つには入力画像全面或いは一部が仮にモ
ノクロ画像であってもなんら画像種類の判定には影響が
ない、汎用性の高い処理を実現するためである。
【0199】次にモノクロ画像変換部118から出力さ
れる判定対象画像のモノクロ画像データ(例えば図4
1)は、まず局所輝度パターン検出器171に入力され
て、着目画素の輝度y0 とそれに隣接する所定数(N−
1)個の輝度y1 ,y2 ,y3,…,yN-1 からなる局
所輝度パターンY(y0 ,y1 ,y2 ,y3 ,…,y
N-1 )を検出する。例えば、3つの輝度成分(y0 ,y
1 ,y2 )からなる局所輝度パターンベクトルを3次元
空間にプロットして得られる画像種毎の発生頻度分布は
図42のようになる。各画像種毎に分布形状の特徴があ
ることが判る。
【0200】局所輝度パターン検出器171から出力さ
れた局所輝度パターンY、即ち輝度の組み合わせY(y
0 ,y1 ,y2 ,y3 ,…,yN-1 )は、ベクトル量子
化器125に入力されて、これら輝度成分で定義される
N次元直交空間において特徴代表ベクトルf0 ,f1
2 ,…,fk にベクトル量子化する。
【0201】前記ベクトル量子化器125では、判定対
象ブロック内の任意の画素の全ての画素を着目画素の輝
度として、局所輝度パターンベクトルYが入力され処理
される。ベクトル量子化器125の出力となる量子化ベ
クトルは、予め複数の画像種類を有する複数の判定対象
ブロック画像から上記局所輝度パターンベクトルを算出
して、N次元直交空間上にプロットした発生分布より求
める。
【0202】この際に用いるベクトル量子化方法は、種
々考えられるが、基本的に局所輝度パターンベクトルの
N次元空間での発生分布形状が、画像種によって違いが
識別されるようになされねばならない。さらに必要最小
限の代表ベクトルで画像種の特徴を表現できることが望
ましい。本実施例ではこの代表ベクトルの決定方法が、
ポイントとして重要となる。
【0203】この第10実施例でのベクトル量子化は、
まず図43(a)に示すような発生度数分布を求める。
すなわち、識別したい各画像種の画像に対し、判定対象
ブロックを選択して局所輝度パターンベクトルYi に対
する発生度数分布を求める。この処理を異なる種類の画
像に対しほぼ同数のブロック数で実施する。従って選択
された全てのブロック数分の度数分布が得られることに
なる。但し、選択された1つのブロックに対して、理想
的には全てのベクトルYi 、つまり各輝度成分の量子化
がQステップならば、i=0,1,2,…,QN −1に
ついての度数分布を求めるが、ベクトルYi の成分数N
が大きくなると莫大なベクトル数になるので、量子化幅
を大きく採って各輝度成分の量子化数を必要に応じて縮
小しても構わない。このベクトル総数をLとする。
【0204】任意の局所輝度パターンベクトルYi の判
定対象ブロック単位での度数自体ximを全てのブロック
に対して計数して総ブロック数Mで除算する。これによ
り図43(b)に示すようなブロック単位のベクトルY
i の度数値の度数分布Pi (xim)が得られる。このベ
クトルYi の度数値の分散σi を全てのベクトルYi
対して計算する。即ち、
【0205】
【数4】 である。
【0206】次に分散σi が大きい順にベクトルYi
並べ変える。それらの内分散σi が所定値以下のもの
は、代表ベクトルとしては対象外として除去し、残りの
ベクトルYi ′をベクトル量子化のための代表ベクトル
とする。分散の所定値というのは、所定値以上のベクト
ルを代表ベクトルとした場合に、上記手法を使って画像
種を識別して満足できる識別率が達成できる値である。
【0207】図40に示したベクトル量子化器125で
は、判定対象ブロックから検出された局所輝度パターン
ベクトルYi が、これら選択された代表ベクトルYi
の何れかに量子化される。即ち、局所輝度パターンベク
トルYi は、N次元直交空間において距離が最も近い代
表ベクトルを量子化ベクトルとする。距離はユークリッ
ド距離(ベクトル成分差の2乗和の平方根)または市街
地距離(ベクトル成分差の絶対値和)を用いればよい。
【0208】このようにして代表ベクトルを求めるの
は、次の目的による。
【0209】本実施例では各画像種の特徴を、前記ベク
トルYi の発生度数分布の形状によって識別しようとし
ている。画像値によってその部分形状が際だって異なる
ベクトルは、上記分散σi が大きくなり、反対に部分形
状がほぼ類似している場合は、その形状を成しているベ
クトルYi の分散は‘0’に近い値を示す。画像値を識
別すること、つまり発生分布形状を区別するのは、互い
に分布形状の異なる部分を優先して識別することが有効
である。従って、相対的に大きい分散値を示すベクトル
i で分布形状を近似することが、画像種による分布形
状を効果的に識別する上で役立つからである。
【0210】図40に示すベクトル量子化器125から
出力された量子化ベクトルは、量子化ベクトル計数部1
26に入力されて、その累積度数が計数されてヒストグ
ラムを算出する。量子化ベクトルgk のヒストグラム
は、特徴パターン判定部127に入力されて、その形状
を認識して判定画像種類を出力する。特徴パターン判定
部127は、フィードフォワードの階層型ニューラルネ
ットワークで構成される。入力層は、量子化ベクトルの
数のK個の入力をもつ。中間層は試行錯誤的に適切に決
定された層数とニューロン素子をもち、出力層は判定し
たい画像種類の数の出力をもつ。例えば、活字体文字、
手書き文字、写真、絵柄画像、背景画像の5つの画像種
類を混在画像の中から判定して分離したいのであれば、
5出力をもつことになる。
【0211】この特徴パターン判定部127のニューラ
ルネットワークの学習は、入力された量子化ベクトルの
ヒストグラムのパターン形状と対応関係にある探索ブロ
ック選択部115で選択された判定対象ブロックの画像
の種類を教師データとして出力層に与えられる。学習
時、教師データとしての判定対象ブロックの画像種類に
は、人為的に認識して決定する。この学習過程は、バッ
クプロパゲーション手法により、出力誤差が設定誤差以
下になるまで、判定対象画像の種類をさまざまに変えて
繰り返し行われる。
【0212】そして特徴パターン判定部127では、入
力される量子化ベクトルのヒストグラムの形状(特徴パ
ターン)と画像の種類に相関関係があることを利用し
て、ニューラルネットワークにより認識処理を行ってい
る。敢えてニューラルネットワークを用いているのは、
一般的なパターンマッチングのように多量の参照テンプ
レートと比較決定する膨大な計算を回避することと、特
徴パターンと画像種類との相関性が多少劣化しても判定
確率への影響が少ないことを利点とするためである。学
習が終了した特徴パターン判定部127は、既に入力さ
れる量子化ベクトルのヒストグラム形状に対し、画像種
類を判定し出力する画像種判定器になっている。
【0213】前記特徴パターン判定部127の出力は、
画像種決定部128に入力されて判定対象ブロックの画
像種最終判断が行われる。特徴パターン判定部127の
ニューラルネットワーク出力は、唯一の画像種を出力し
ない場合も考えられる。
【0214】従って、その判定結果に対する評価基準
(ルール)を設けて、対応する同種画像領域の画像種類
の最終決定が画像種決定部128から出力される。
【0215】前記画像種決定部128から出力される最
終決定した画像種類、上記同種画像領域のアドレスデー
タ及びサイズが、本実施例の混在画像像域分離装置から
出力される。
【0216】次に本発明による第11実施例について説
明する。この第11実施例以降の実施例の画像処理装置
の構成は、図40に示した第10実施例と同様である
が、ベクトル量子化部125内部で行われるベクトル量
子化の量子化されるベクトルの算出方法が異なるもので
あり、構成についての説明は省略する。
【0217】この第11実施例において用いられるベク
トル量子化器の代表ベクトルは、次のようにして求めら
れる。
【0218】まず画像種ごとに、十分な判定対象ブロッ
ク数で着目画素の輝度y0 とそれに隣接する所定数(N
−1)個の輝度y1 ,y2 ,y3 ,…,yN-1 からなる
局所輝度パターンとしてのベクトルYi (y0 ,y1
2 ,y3 ,…,yN-1 )を繰り返し検出する。1つの
ブロックで検出されるベクトルYi は、各輝度成分yj
(j=0,1,2,…,N−1)の量子化がQステップ
ならば、i=0,1,2,…,QN −1通り存在する
が、ベクトルYi の成分数Nが大きくなると莫大なベク
トル数になるので、量子化幅を大きく採って各輝度成分
の量子化数を必要に応じて縮小しても構わない。
【0219】1つの判別対象ブロックにて検出される任
意のベクトルYi の画像種ごとのブロック単位発生度数
の値をFreq(Yij)と表し、複数ブロックでのFr
eq(Yij)の生起度数分布算出する。但し、jは識別
したい画像種の数だけ連番で与えられる。例えば、活字
体文字=‘0’、手書き文字=‘1’、写真=‘2’、
絵柄画像=‘3’のように番号が付される。
【0220】次に、図44に示すように任意のYijに対
して、各画像種単位の平均生起度数Avr(Freq
(Yij))を求め、相互の平均度数の絶対値が算出され
る。例えば4通りの画像種があれば、6通りの値が求め
られることになる。そのうちの最小値[d
min (Yi )]を求め、同様にして全てのベクトルに対
しこの値を算出する。
【0221】各ベクトルの最小値[dmin (Yi )]が
大きいものから順にベクトルYi を並べ変え、その値が
所定値以上を示すベクトルYi を前記ベクトル量子化に
おける代表ベクトルとする。
【0222】このようにして算出された代表ベクトルが
図40に示したベクトル量子化器125で量子化される
ベクトルとして使用される。量子化方法は、第10実施
例と同様に、N次元直交空間において距離が最も近い代
表ベクトルを量子化ベクトルとする。また距離はユーク
リッド距離(ベクトル成分差の2乗和の平方根)または
市街地距離(ベクトル成分差の絶対値和)を用いればよ
い。
【0223】任意のベクトルYijに対する各画像種単位
の平均生起度数Avr(Yij)は、画像値ごとにブロッ
ク単位でのそのベクトルの発生度数の平均を与える。そ
のため、ある画像種があるベクトルYi を取る確率を反
映し、それの最もらしい代表値を示している。画像値に
よってあるベクトルYi を取る確率の違いが小さい場合
は、そのベクトルYi によっては画像種を識別し難いこ
とになる。逆に画像種によってあるベクトルYi を取る
確率の違いの最小値が大きい場合は、そのベクトルYi
によっては画像種を識別し易いことになり、識別し易い
ベクトルを優先して観測し、識別すれば効果的な識別が
可能となる。
【0224】次に本発明による第12実施例としての画
像処理装置について説明する。
【0225】この第12実施例において用いられるベク
トル量子化器の代表ベクトルは、次のようにして求めら
れる。まず画像種ごとに、十分な判定対象ブロック数で
着目画素の輝度y0 とそれに隣接する所定数(N−1)
個の輝度y1 ,y2 ,y3 ,…,yN-1 からなる局所輝
度パターンとしてのベクトルYi (y0 ,y1 ,y2
3 ,…,yN-1 )を繰り返し検出する。1つのブロッ
クで検出されるベクトルYi のは、各輝度成分yj (j
=0,1,2,…,N−1)の量子化がQステップなら
ば、i=0,1,2,…,QN −1通り存在するが、ベ
クトルYi の成分数Nが大きくなると莫大なベクトル数
になるので、量子化幅を大きく採って各輝度成分の量子
化数を必要に応じて縮小しても構わない。
【0226】そして、1つの判定対象ブロックにて検出
される任意のベクトルYi の画像種ごとのブロック単位
発生度数の値をFreq(Yij)と表し、多数ブロック
でのFreq(Yij)の生起確率分布P(Freq(Y
ij))を算出する。但し、jは識別したい画像種の数だ
け連番で与えられる。例えば、活字体文字=‘0’、手
書き文字=‘1’、写真=‘2’、絵柄画像=‘3’の
ように番号が付される。またFreq(Yij)は画像種
毎にサンプルブロック総数が除算され、正規化される。
【0227】次に図45に示すように任意のYi におい
て、任意の2つの画像種j,j′の組み合わせを全て抽
出し、それらの生起確率分布P(Freq(Yij))並
びにP(Freq(Yij′))重なりあう面積、換言す
れば同時発生確率を組み合わせ数分算出する。
【0228】この同時発生確率の最大値[S
max (Yi )]を求めて、各ベクトルの最小値[Smax
(Yi )]が小さいものから順にベクトルYi を並べ変
え、その値が所定値以下を示すベクトルYi を前述した
ベクトル量子化における代表ベクトルとする。
【0229】このようにして算出された代表ベクトルが
図40に示したベクトル量子化器125で量子化される
ベクトルとして使用される。量子化方法は、第10実施
例と同様にN次元直交空間において距離が最も近い代表
ベクトルを量子化ベクトルとする。距離はユークリッド
距離(ベクトル成分差の2乗和の平方根)または市街地
距離(ベクトル成分差の絶対値和)を用いればよい。
【0230】任意のベクトルYi に対する生起確率分布
P(Freq(Yij))の各画像種間の同時発生確率
は、異なる2つの画像種があるベクトルYi をどの程度
の確率で識別できるかを表す。同時発生確率が大きい場
合は、誤る確率が増大する。従って、あるベクトルYi
を取る確率がどの2つの画像種間でも類似する度合いが
小さければ、そのベクトルYi によって画像種の識別が
効果的であることが言える。従って、識別に効果的なベ
クトルを優先して観測すれば、能率のよい画像種識別が
可能となる。
【0231】次に本発明による第13実施例の画像処理
装置について説明する。
【0232】この第13実施例において用いられるベク
トル量子化器の代表ベクトルは、次のようにして求めら
れる。まず画像種ごとに、十分な判定対象ブロック数で
着目画素の輝度y0 とそれに隣接する所定数(N−1)
個の輝度y1 ,y2 ,y3 ,…,yN-1 からなる局所輝
度パターンとしてのベクトルYi (y0 ,y1 ,y2
3 ,…,yN-1 )を繰り返し検出する。1つのブロッ
クで検出されるベクトルYi のは、各輝度成分yj (j
=0,1,2,…,N−1)の量子化がQステップなら
ば、i=0,1,2,…,QN −1通り存在するが、ベ
クトルYi の成分数Nが大きくなると莫大なベクトル数
になるので、量子化幅を大きく採って各輝度成分の量子
化数を必要に応じて縮小しても構わない。
【0233】まず、前記局所輝度パターンをベクトルと
して表現できるN次元空間において、画像種別にそのベ
クトルを十分なサンプル数でプロットする。結果画像種
ごとのベクトルの発生確率分布を得る。これら分布を図
46に示すように、それぞれLBGアルゴリズムを用い
て、所定数のベクトルにベクトル量子化する。LBGア
ルゴリズムは、例えば[“An Algorithm for Vector Qu
antizer Design" YOSEPH LINDE etc. IEEE TRANSACTION
ON COMUNICATIONS ,VOL.COM-28,NO.1 JANUARY 1980
]に詳細に記載されている。要点を言えば、局所領域
内に存在する全ての特徴ベクトルとその局所領域の代表
ベクトルとのユークリッド距離が他の局所領域の代表ベ
クトルとのユークリッド距離に対して最短になるように
代表ベクトルが決定される。
【0234】そして算出された各画像種の量子化ベクト
ルを合成して1つの量子化ベクトルの集合とし、個々の
ベクトル間の距離が大きいベクトルから代表ベクトル優
先候補とする。優先度が高い代表ベクトルから所定数を
選択して、最終的な代表ベクトルとする。代表ベクトル
の距離が互いに小さい、即ち分布が密なベクトル存在空
間は、各画像種の分布形状が類似していると判断でき
る。従って密でない空間のベクトルを優先して選択する
ことで、これらベクトルの発生分布は互いの画像種の違
いを顕著に表すことになり、能率的な画像種識別を実現
する。
【0235】次に本発明による第14実施例の画像処理
装置について説明する。
【0236】この第14実施例において用いられるベク
トル量子化器の代表ベクトルは、次のようにして求めら
れる。まず、画像種ごとに、十分で且つ同数の判定対象
ブロック数で着目画素の輝度y0 とそれに隣接する所定
数(N−1)個の輝度y1 ,y2 ,y3 ,…,yN-1
らなる局所輝度パターンとしてのベクトルYi (y0
1 ,y2 ,y3 ,…,yN-1 )を繰り返し検出する。
1つのブロックで検出されるベクトルYi は、各輝度成
分yj (j=0,1,2,…,N−1)の量子化がQス
テップならば、i=0,1,2,…,QN −1通り存在
するが、ベクトルYi の成分数Nが大きくなると莫大な
ベクトル数になるので、量子化幅を大きく採って各輝度
成分の量子化数を必要に応じて縮小しても構わない。
【0237】次に検出されたベクトルYi から取り得る
全てのベクトルに対し、その頻度を計数する。計数値が
最大のベクトルから随時所定数分選択し、ベクトル量子
化時の代表ベクトルとする。どの画像種に対しても発生
確率が小さいものは、その頻度が画像種によって差異が
表れないので、識別に用いる必要性がない。従って、こ
のような識別に寄与しないベクトルを除去することで、
図40の特徴パターン判定部127の入力数を削減で
き、能率の良い識別部構成が実現できる。
【0238】次に本発明による第15実施例の画像処理
装置について説明する。第15実施例において用いられ
るベクトル量子化器の代表ベクトルは、次のようにして
求められる。まず画像種ごとに、十分な判定対象ブロッ
ク数で着目画素の輝度y0 とそれに隣接する所定数(N
−1)個の輝度y1 ,y2 ,y3 ,…,yN-1 からなる
局所輝度パターンとしてのベクトルYi (y0 ,y1
2 ,y3 ,…,yN-1 )を繰り返し検出する。1つの
ブロックで検出されるベクトルYi は、各輝度成分yj
(j=0,1,2,…,N−1)の量子化がQステップ
ならば、i=0,1,2,…,QN −1通り存在する
が、ベクトルYi の成分数Nが大きくなると莫大なベク
トル数になるので、量子化幅を大きく採って各輝度成分
の量子化数を必要に応じて縮小しても構わない。
【0239】図47に示すように、検出されたベクトル
i の画像種それぞれのヒストグラムを算出し、度数の
最大値で除算して正規化する。得られた各ヒストグラム
はN次元で全微分され、絶対値がとられる。全微分され
たN次元ヒストグラムを所定値閾値で2値化する。
【0240】そして2値化されたそれぞれの画像種のN
次元2値パターンは、全ての画像種で論理積がとられ
る。論理積後の2値N次元パターン分布において、LB
Gアルゴリズム(第13実施例にて説明した)を適用し
て所定数の代表ベクトルを抽出する。ヒストグラムの形
状を識別する上で、形状変化が大きい部分は、多くのベ
クトルで近似し、形状変化が小さい部分は少ないベクト
ルで近似する方が形状を効果的に近似できる。微分パタ
ーン形状は形状変化の度合いを反映する。従って上記処
理方法を使えば、各画像種に共通して分布形状の変化を
容易に抽出でき、画像種によるN次元ヒストグラムのよ
り効果的な形状近似が実現できる。
【0241】次に図48には、本発明による第16実施
例としての画像処理装置の構成を示し説明する。
【0242】この第16実施例においても、画像種判定
部170の局所輝度パターン検出部172までは、図4
0に示す第10実施例と構成は同一である。本実施例の
特徴となる局所輝度パターン検出部172以降から画像
種決定出力までの構成及び動作について説明する。
【0243】この局所輝度パターン検出部172から出
力である局所輝度パターンベクトルYi は、並列的にベ
クトル量子化部173を構成するベクトル量子化器VQ
1 ,VQ2 ,…,VQj ,…,VQJ に入力される。但
し、Jは識別したい画像の種類の数を示す。ベクトル量
子化器VQj は、画像種に対応した代表ベクトルを使っ
て量子化する。
【0244】ベクトル量子化器VQj の代表ベクトル
は、次のようにして求められる。
【0245】まず画像種ごとに、十分な判定対象ブロッ
ク数で着目画素の輝度y0 とそれに隣接する所定数(N
−1)個の輝度y1 ,y2 ,y3 ,…,yN-1 からなる
局所輝度パターンとしてのベクトルYi (y0 ,y1
2 ,y3 ,…,yN-1 )をL個のブロックについて繰
り返し検出する。1つのブロックで検出されるベクトル
i は、各輝度成分yj (j=0,1,2,…,N−
1)の量子化がQステップならば、i=0,1,2,
…,QN −1通り存在するが、ベクトルYi の成分数N
が大きくなると莫大なベクトル数になるので、量子化幅
を大きく採って各輝度成分の量子化数を必要に応じて縮
小しても構わない。得られたベクトルYi は、画像種そ
れぞれにN次元空間において第13実施例で説明したL
BGアルゴリズムを使って所定数Kの代表ベクトルが求
められる。
【0246】前記局所輝度パターン検出部172から出
力され、ベクトル量子化器VQj 173に入力された検
出ベクトルは、先に求められている代表ベクトルとユー
クリッド距離が計算されて、検出ベクトルに対しもっと
も距離が小さい代表ベクトルが選択されてベクトル量子
化が完了する。
【0247】この処理は各ベクトル量子化器VQj で同
時に実行される。ベクトル量子化器VQj からの出力
は、分散合計算出器174に入力されて、1つの判定対
象ブロックから検出された量子化されるベクトルの度数
分布を生成し、それぞれの量子化されたベクトルそれぞ
れの分散σの合計Eを計算する。即ち、任意の判定対象
ブロック1から検出され且つ任意のベクトル量子化器V
j において量子化されるベクトル(代表ベクトル)を
jkL (k=0,1,…,K;L =1,2,…,L)と
し、その発生度数Freq(Yjk)とすれば、分散合計
j は、
【0248】
【数5】 で与えられる。
【0249】分散合計算出器174から同時出力される
各画像種ごとに分散合計Ej は、評価部175に入力さ
れて、その最小値を示す画像種を出力する。出力された
画像種が判定対象ブロックの識別結果である。
【0250】本実施例ではベクトル量子化するときの代
表ベクトルが、予め画像種ごとに一様な発生分布になる
よう計算されている。そのため識別時に対応する画像種
が入力されると、その量子化ベクトルの発生度数は一様
になり、それ以外は分散が大きくなるので、何れの画像
種の分布かが区別できることになる。
【0251】また本発明は、前述した実施例に限定され
るものではなく、他にも発明の要旨を逸脱しない範囲で
種々の変形や応用が可能であることは勿論である。
【0252】
【発明の効果】以上詳述したように本発明によれば、各
種画像が混在した入力画像を画像の種類毎の領域に分割
でき、例えば各種画像種類に適した画像データ圧縮によ
り混在画像全体のデータ圧縮率を高めることができ、画
像の画質を向上させる画像処理装置を提供することがで
きる。
【図面の簡単な説明】
【図1】図1は、本発明による実施例としての画像処理
装置の構成を示す図である。
【図2】図2には、黒画素抽出の処理を行う構成を示す
図である。
【図3】図3は、2値化処理及び、エッジ抽出処理を行
う構成例を示す図である。
【図4】図4は、連続構成要素領域の境界抽出を行う構
成を示す図である。
【図5】図5(a)は事前に画像種類の違いによる特徴
を統計データより抽出して判定時の評価基準を判定する
構成を示し、図5(b)は求めた評価基準を使って実際
の画像種類の判定を行う構成を示す図である。
【図6】本発明の画像処理装置の概念的な構成図であ
る。
【図7】本発明による第2実施例としての画像処理装置
の構成を示す図である。
【図8】図7に示した画像処理装置の差分・2値化処理
を説明をするための図である。
【図9】第2実施例における弧立点除去フィルタを説明
するための図である。
【図10】第2実施例におけるラベル処理を説明するた
めの図である。
【図11】第2実施例における矩形領域抽出を説明する
ための図である。
【図12】第2実施例における各処理過程の出力画像を
第1の例を示す図である。
【図13】第2実施例における各処理過程の出力画像を
第2の例を示す図である。
【図14】第2実施例における各処理過程の出力画像を
第3の例を示す図である。
【図15】本発明による第3実施例としての画像処理装
置の構成を示す図である。
【図16】図15に示した比・2値化処理を説明するた
めの図である。
【図17】第3実施例における各処理過程の出力画像を
第1の例を示す図である。
【図18】第3実施例における各処理過程の出力画像を
第2の例を示す図である。
【図19】第3実施例における各処理過程の出力画像を
第3の例を示す図である。
【図20】第3実施例における対数差分・2値化処理の
説明するための図である。
【図21】第3実施例と同様の効果をもつ2値化操作を
行う場合の別構成を示す図である。
【図22】本発明による第4実施例としての画像処理装
置の構成を示す図である。
【図23】第4実施例における固定閾値により2値化を
行なう場合の別構成を示す図である。
【図24】第4実施例における微分フィルタによるエッ
ジ抽出処理を説明するための図である。
【図25】本発明による第5実施例としての画像処理装
置の構成を示す図である。
【図26】第5実施例における短白ラン/黒ラン変換に
よるブロック処理を説明するための図である。
【図27】本発明による第6実施例としての画像処理装
置の構成を示す図である。
【図28】第6実施例における混在画像を同種画像領域
に分割方法を説明するための図である。
【図29】第6実施例における輝度レベルを修正する方
法を説明するための図である。
【図30】第6実施例における修正輝度ヒストグラムの
算出方法を説明するための図である。
【図31】本発明の実施例に用いたニューラルネットワ
ークを利用するベクトル量子化器の構成を示す図であ
る。
【図32】第6実施例における判定された画像種結果を
評価する方法を説明するための図である。
【図33】複数判定対象領域による画像種判定を説明す
るための構成例を示す図である。
【図34】本発明による第7実施例としての画像処理装
置の構成を示す図である。
【図35】本発明による第8実施例としての画像処理装
置の構成を示す図である。
【図35】第8実施例における勾配ベクトル方位と修正
輝度レベルが呈する画像種毎の特徴パターンの第1の典
型例を示す図である。
【図36】第8実施例における勾配ベクトル方位と修正
輝度レベルが呈する画像種毎の特徴パターンの第2の典
型例を示す図である。
【図37】第8実施例における勾配ベクトル方位と修正
輝度レベルによって区別される典型特徴パターンを示す
図である。
【図38】第8実施例において、2つのパラメータが示
す文字種類に対する特徴を示す図である。
【図39】本発明による第9実施例としての画像処理装
置の構成を示す図である。
【図40】本発明による第10実施例としての画像処理
装置の構成を示す図である。
【図41】第10実施例における輝度レベルパターンを
説明するための図である。
【図42】第10実施例における局所輝度パターンの画
像種ごとに分布形状の一例を示した図である。
【図43】第10実施例におけるベクトル量子化につい
て説明するための図である。
【図44】本発明による第11実施例におけるベクトル
量子化について説明するための図である。
【図45】本発明による第12実施例におけるベクトル
量子化について説明するための図である。
【図46】本発明による第13実施例におけるベクトル
量子化について説明するための図である。
【図47】本発明による第15実施例におけるベクトル
量子化について説明するための図である。
【図48】本発明による第16実施例としての画像処理
装置の構成を示す図である。
【図49】従来の画像処理装置の概略的な構成図であ
る。
【符号の説明】
1…画像入力部、1a…光学系、1b…固体撮像素子、
2…カラー/モノクロ変換処理部、3…2値化処理部、
4…縮小処理部、5…連続構成要素領域の境界抽出部、
6…画像種類判定部、7…データ圧縮部、11,12…
差分演算処理部、13,14…2値化処理部、15,2
5…合成部、16,17…黒画素再生部、20…境界線
算出部、21,22…差分演算処理部、23,24…2
値化処理部、26…間引き処理部、27…LPF(ロー
パスフィルタ)、28…エッジ抽出部、31…エッジ抽
出部、32…KL変換部、33…基底ベクトル抽出部、
34…内積演算部、35…ニューラルネットワーク部、
36…教師データ入力部。
【手続補正書】
【提出日】平成5年11月8日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】請求項3
【補正方法】変更
【補正内容】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】請求項4
【補正方法】変更
【補正内容】
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0023
【補正方法】変更
【補正内容】
【0023】また、文字,絵柄および写真等が混在する
混在画像をディジタル化し蓄積する画像フレームメモリ
と、前記画像フレームメモリから出力される画像データ
を同種類毎の画像領域に分割して、同種画像領域の位置
並びに大きさを出力する同種画像領域分割手段と、前記
同種画像領域内を所定の大きさの小領域に選択抽出し、
該小領域の位置、大きさを出力する探索ブロック領域選
択手段と、前記探索ブロック領域選択手段により選択さ
れた小領域に対応する画像データを判定対象領域として
前記画像フレームメモリより読み出し、一時蓄積する判
定対象ブロック画像メモリと、前記判定対象領域の画像
データから水平方向の差分値データ及び垂直方向の差分
値データを検出する差分検出手段と、前記差分データに
より輝度修正のための修正パラメータを算出し、前記修
正パラメータに基づき、前記判定対象領域の画像データ
から修正された輝度レベルを算出する輝度レベル修正処
理手段と、前記差分検出手段からの差分値データ、及び
前記輝度レベル修正処理手段からの修正輝度レベルデー
タをベクトル量子化するベクトル量子化手段と、前記ベ
クトル量子化手段からの量子化ベクトルの各成分の計数
を行う量子化ベクトル計数手段と、計数された量子化ベ
クトルの成分を入力とし、所定の画像種類を出力するニ
ューラルネットワーク(神経回路網)と、出力される画
像種類の判定結果を評価し決定して、前記同種画像領域
の位置及び大きさのデータと合わせて決定した画像種類
を出力する画像種決定手段とで構成された画像処理装置
を提供する。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0024
【補正方法】変更
【補正内容】
【0024】さらに、入力した画像信号をデジタル画像
データに変換する画像入力手段と、前記入力した画像信
号内から所定の大きさで小領域を選択抽出する判定対象
領域選択部と、判定対象領域の画像データから隣接する
画素の所定数(N)の画素からなる局所特徴パターンを
検出する局所特徴パターン検出手段と、前記局所特徴
ターンをN次元空間上でベクトル量子化するベクトル量
子化手段と、前記ベクトル量子化手段により量子化され
た代表ベクトルに対してその発生頻度を計数してヒスト
グラムを算出するヒストグラム生成手段と、前記ヒスト
グラム生成手段により求められた量子化ベクトルヒスト
グラムを入力として、その分布形状を識別して所望する
画像種類を出力する画像種識別手段と、前記識別結果を
得て、画像種類を決定する画像種決定手段とで構成され
た画像処理装置を提供する。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0142
【補正方法】変更
【補正内容】
【0142】次に度数の正規化であるがこれは度数のピ
ークにそって正規化するもので、図31(b)において
発生頻度軸方向での正規化である。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0219
【補正方法】変更
【補正内容】
【0219】1つの判定対象ブロックにて検出される任
意のベクトルYi の画像種ごとのブロック単位発生度数
の値をFreq(Yij)と表し、複数ブロックでのFr
eq(Yij)の生起度数分布算出する。但し、jは識別
したい画像種の数だけ連番で与えられる。例えば、活字
体文字=‘0’、手書き文字=‘1’、写真=‘2’、
絵柄画像=‘3’のように番号が付される。 ─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成6年2月7日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】変更
【補正内容】
【図面の簡単な説明】
【図1】図1は、本発明による実施例としての画像処理
装置の構成を示す図である。
【図2】図2には、黒画素抽出の処理を行う構成を示す
図である。
【図3】図3は、2値化処理及び、エッジ抽出処理を行
う構成例を示す図である。
【図4】図4は、連続構成要素領域の境界抽出を行う構
成を示す図である。
【図5】図5(a)は事前に画像種類の違いによる特徴
を統計データより抽出して判定時の評価基準を判定する
構成を示し、図5(b)は求めた評価基準を使って実際
の画像種類の判定を行う構成を示す図である。
【図6】本発明の画像処理装置の概念的な構成図であ
る。
【図7】本発明による第2実施例としての画像処理装置
の構成を示す図である。
【図8】図7に示した画像処理装置の差分・2値化処理
を説明をするための図である。
【図9】第2実施例における弧立点除去フィルタを説明
するための図である。
【図10】第2実施例におけるラベル処理を説明するた
めの図である。
【図11】第2実施例における矩形領域抽出を説明する
ための図である。
【図12】第2実施例における各処理過程の出力画像を
第1の例を示す図である。
【図13】第2実施例における各処理過程の出力画像を
第2の例を示す図である。
【図14】第2実施例における各処理過程の出力画像を
第3の例を示す図である。
【図15】本発明による第3実施例としての画像処理装
置の構成を示す図である。
【図16】図15に示した比・2値化処理を説明するた
めの図である。
【図17】第3実施例における各処理過程の出力画像を
第1の例を示す図である。
【図18】第3実施例における各処理過程の出力画像を
第2の例を示す図である。
【図19】第3実施例における各処理過程の出力画像を
第3の例を示す図である。
【図20】第3実施例における対数差分・2値化処理の
説明するための図である。
【図21】第3実施例と同様の効果をもつ2値化操作を
行う場合の別構成を示す図である。
【図22】本発明による第4実施例としての画像処理装
置の構成を示す図である。
【図23】第4実施例における固定閾値により2値化を
行なう場合の別構成を示す図である。
【図24】第4実施例における微分フィルタによるエッ
ジ抽出処理を説明するための図である。
【図25】本発明による第5実施例としての画像処理装
置の構成を示す図である。
【図26】第5実施例における短白ラン/黒ラン変換に
よるブロック処理を説明するための図である。
【図27】本発明による第6実施例としての画像処理装
置の構成を示す図である。
【図28】第6実施例における混在画像を同種画像領域
に分割方法を説明するための図である。
【図29】第6実施例における輝度レベルを修正する方
法を説明するための図である。
【図30】第6実施例における修正輝度ヒストグラムの
算出方法を説明するための図である。
【図31】本発明の実施例に用いたニューラルネットワ
ークを利用するベクトル量子化器の構成を示す図であ
る。
【図32】第6実施例における判定された画像種結果を
評価する方法を説明するための図である。
【図33】複数判定対象領域による画像種判定を説明す
るための構成例を示す図である。
【図34】本発明による第7実施例としての画像処理装
置の構成を示す図である。
【図35】本発明による第8実施例としての画像処理装
置の構成を示す図である。
【図36】第8実施例における勾配ベクトル方位と修正
輝度レベルが呈する画像種毎の特徴パターンの第2の典
型例を示す図である。
【図37】第8実施例における勾配ベクトル方位と修正
輝度レベルによって区別される典型特徴パターンを示す
図である。
【図38】第8実施例において、2つのパラメータが示
す文字種類に対する特徴を示す図である。
【図39】本発明による第9実施例としての画像処理装
置の構成を示す図である。
【図40】本発明による第10実施例としての画像処理
装置の構成を示す図である。
【図41】第10実施例における輝度レベルパターンを
説明するための図である。
【図42】第10実施例における局所輝度パターンの画
像種ごとに分布形状の一例を示した図である。
【図43】第10実施例におけるベクトル量子化につい
て説明するための図である。
【図44】本発明による第11実施例におけるベクトル
量子化について説明するための図である。
【図45】本発明による第12実施例におけるベクトル
量子化について説明するための図である。
【図46】本発明による第13実施例におけるベクトル
量子化について説明するための図である。
【図47】本発明による第15実施例におけるベクトル
量子化について説明するための図である。
【図48】本発明による第16実施例としての画像処理
装置の構成を示す図である。
【図49】従来の画像処理装置の概略的な構成図であ
る。
【符号の説明】 1…画像入力部、1a…光学系、1b…固体撮像素子、
2…カラー/モノクロ変換処理部、3…2値化処理部、
4…縮小処理部、5…連続構成要素領域の境界抽出部、
6…画像種類判定部、7…データ圧縮部、11,12…
差分演算処理部、13,14…2値化処理部、15,2
5…合成部、16,17…黒画素再生部、20…境界線
算出部、21,22…差分演算処理部、23,24…2
値化処理部、26…間引き処理部、27…LPF(ロー
パスフィルタ)、28…エッジ抽出部、31…エッジ抽
出部、32…KL変換部、33…基底ベクトル抽出部、
34…内積演算部、35…ニューラルネットワーク部、
36…教師データ入力部。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04N 1/393 7/24 H04N 7/13 Z

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 種々の情報が混在した画像を入力する画
    像入力手段と、 前記画像入力手段から出力された画像データを2値化画
    像データに変換する2値化手段と、 前記2値化手段からの2値化画像データを縮小画像デー
    タにする縮小手段と、 前記縮小手段から出力された縮小画像データから画像を
    構成する連続要素領域を抽出する構成要素領域抽出手段
    と、 前記構成要素領域抽出手段により抽出された連続要素領
    域の所定領域ごとに、予め情報により分類された画像種
    に基づき、画像の種類を判定する画像種類判定手段と、 前記抽出された領域と判別された画像種によって好適す
    るデータ圧縮方式を選択し、前記画像入力手段からの画
    像データを圧縮するデータ圧縮手段とを具備することを
    特徴とする画像処理装置。
  2. 【請求項2】 文字、絵柄および写真等が混在する混在
    画像から、文字列、絵柄、写真等の各領域を分割する画
    像処理装置において、 前記混在画像を記憶する画像メモリと、 前記画像メモリに記憶された混在画像からエッジを抽出
    し、2値画像に変換するエッジ抽出・2値化処理手段
    と、 前記2値画像を所定数の画素からなる小領域に分割し、
    各小領域を1画素に縮小する縮小画像処理手段と、 前記縮小画像中の黒画素領域を統合し、ブロック化する
    ブロック処理手段と、 前記ブロック処理手段のブロック化により連結した黒画
    素の存在範囲から画像領域外接矩形の対角座標を求める
    矩形領域抽出手段とを具備したことを特徴とする画像処
    理装置。
  3. 【請求項3】 文字,絵柄および写真等が混在する混在
    画像を蓄積する画像フレームメモリと、 前記画像フレームメモリから出力される画像データを同
    種類毎の画像領域に分割して、同種画像領域の位置並び
    に大きさを出力する同種画像領域分割手段と、 前記同種画像領域内から所定の大きさの小領域を選択抽
    出し、該小領域の位置、大きさを出力する探索ブロック
    領域選択手段と、 前記探索ブロック領域選択手段により選択された小領域
    に対応する画像データを判定対象領域として前記画像フ
    レームメモリより読み出し、一時蓄積する判定対象ブロ
    ック画像メモリと、 前記判定対象領域の画像データから差分値データを検出
    する差分検出手段と、 前記差分値データにより輝度修正のための修正パラメー
    タを算出し、前記修正パラメータに基づき、前記判定対
    象領域の画像データから修正された輝度レベルを算出す
    る輝度レベル修正処理手段と、 前記水平・垂直差分検出手段からの水平・垂直差分値デ
    ータ、及び前記輝度レベル修正処理手段からの修正輝度
    レベルデータをベクトル量子化するベクトル量子化手段
    と、 前記ベクトル量子化手段からの量子化ベクトルの各成分
    の計数を行う量子化ベクトル計数手段と、 計数された量子化ベクトルの成分を入力とし、所定の画
    像種類を出力するニューラルネットワーク(神経回路
    網)と、 出力される画像種類の判定結果を評価し決定して、前記
    同種画像領域の位置及び大きさのデータと合わせて決定
    した画像種類を出力する画像種決定手段と、を具備する
    ことを特徴とする画像処理装置。
  4. 【請求項4】 画像データを入力する画像入力手段と、 前記入力した画像データ内から所定の大きさで小領域を
    選択抽出する判定対象領域選択部と、 判定対象領域の画像データから隣接する画素の所定数
    (N)の画素からなる局所画素パターンを検出する局所
    画素パターン検出手段と、 前記局所画素パターンをN次元空間上でベクトル量子化
    するベクトル量子化手段と、 前記ベクトル量子化手段により量子化された代表ベクト
    ルに対してその発生頻度を計数してヒストグラムを算出
    するヒストグラム生成手段と、 前記ヒストグラム生成手段により求められた量子化ベク
    トルヒストグラムを入力として、その分布形状を識別し
    て所望する画像種類を出力する画像種識別手段と、 前記識別結果を得て、画像種類を決定する画像種決定手
    段と、 を具備することを特徴とする画像処理装置。
JP26046593A 1992-09-25 1993-09-27 画像処理装置 Expired - Fee Related JP3353968B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26046593A JP3353968B2 (ja) 1992-09-25 1993-09-27 画像処理装置

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP4-256853 1992-09-25
JP25685392 1992-09-25
JP16363593 1993-07-01
JP5-163635 1993-07-01
JP26046593A JP3353968B2 (ja) 1992-09-25 1993-09-27 画像処理装置

Publications (2)

Publication Number Publication Date
JPH0799581A true JPH0799581A (ja) 1995-04-11
JP3353968B2 JP3353968B2 (ja) 2002-12-09

Family

ID=27322198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26046593A Expired - Fee Related JP3353968B2 (ja) 1992-09-25 1993-09-27 画像処理装置

Country Status (1)

Country Link
JP (1) JP3353968B2 (ja)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6160633A (en) * 1996-08-07 2000-12-12 Olympus Optical Co., Ltd. Code printing apparatus for printing an optically readable code image at set positions on a print medium
JP2002174603A (ja) * 2000-12-08 2002-06-21 Olympus Optical Co Ltd 欠陥分類方法
WO2003098264A1 (fr) * 2002-05-15 2003-11-27 Hamamatsu Photonics K.K. Systeme de traitement d'images et procede de traitement d'images
US6757427B1 (en) 1999-08-24 2004-06-29 Nec Corporation Edge enhancement preprocessing with image region determining function
WO2004081872A1 (ja) * 2003-03-11 2004-09-23 Tadahiro Ohmi データ分析装置およびデータ認識装置
US6865290B2 (en) 2000-02-09 2005-03-08 Ricoh Company, Ltd. Method and apparatus for recognizing document image by use of color information
JP2005285010A (ja) * 2004-03-30 2005-10-13 Fujitsu Ltd 境界抽出方法、プログラムおよびこれを用いた装置
JP2007108965A (ja) * 2005-10-13 2007-04-26 Nippon Telegr & Teleph Corp <Ntt> 変化領域計算方法、変化領域計算装置、変化領域計算プログラム
US7221483B2 (en) 2000-09-05 2007-05-22 Ricoh Company, Ltd. Image encoding method and apparatus, image decoding method and apparatus, image processing apparatus, image formation apparatus, and computer-executable programs
JP2008099273A (ja) * 2007-09-28 2008-04-24 Sony Corp 画像処理装置
US7539344B2 (en) 2002-12-20 2009-05-26 Fujitsu Limited Boundary detection method between areas having different features in image data
WO2009113231A1 (ja) * 2008-03-14 2009-09-17 株式会社ソニー・コンピュータエンタテインメント 画像処理装置および画像処理方法
JP2010134958A (ja) * 2010-02-08 2010-06-17 Fujitsu Ltd 境界検出方法、プログラムおよびこれを用いた装置
JP2010257062A (ja) * 2009-04-22 2010-11-11 Mitsubishi Electric Corp クレータ検出装置
US7991231B2 (en) 2005-09-22 2011-08-02 Sharp Kabushiki Kaisha Method and apparatus for determining whether image characters or graphics are handwritten
JP2013072968A (ja) * 2011-09-27 2013-04-22 Olympus Corp 顕微鏡システム
KR20140129518A (ko) * 2013-04-30 2014-11-07 엘지디스플레이 주식회사 유기발광 표시장치와 그 구동 특성 보상 방법
KR101459782B1 (ko) * 2008-09-08 2014-11-10 현대자동차주식회사 차량용 카메라의 야간 영상 개선 시스템
JP2017108427A (ja) * 2011-11-11 2017-06-15 ジーイー ビデオ コンプレッション エルエルシー 高い分割自由度を伴う効果的なパーティション符号化
JP2018068863A (ja) * 2016-11-02 2018-05-10 カリーナシステム株式会社 ガーゼ検出システム
US10321139B2 (en) 2011-11-11 2019-06-11 Ge Video Compression, Llc Effective prediction using partition coding
US10321148B2 (en) 2011-11-11 2019-06-11 Ge Video Compression, Llc Effective wedgelet partition coding using spatial prediction
JP2019125912A (ja) * 2018-01-16 2019-07-25 富士ゼロックス株式会社 色変換装置及びプログラム
US10382777B2 (en) 2010-11-04 2019-08-13 Ge Video Compression, Llc Picture coding supporting block merging and skip mode
US10574981B2 (en) 2011-11-11 2020-02-25 Ge Video Compression, Llc Effective Wedgelet partition coding
JP2020144636A (ja) * 2019-03-07 2020-09-10 セイコーエプソン株式会社 情報処理装置、学習装置及び学習済モデル
US11488304B2 (en) 2018-05-01 2022-11-01 Eizo Corporation Gauze detection system and gauze detection method

Cited By (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6160633A (en) * 1996-08-07 2000-12-12 Olympus Optical Co., Ltd. Code printing apparatus for printing an optically readable code image at set positions on a print medium
US6757427B1 (en) 1999-08-24 2004-06-29 Nec Corporation Edge enhancement preprocessing with image region determining function
US6865290B2 (en) 2000-02-09 2005-03-08 Ricoh Company, Ltd. Method and apparatus for recognizing document image by use of color information
US7221483B2 (en) 2000-09-05 2007-05-22 Ricoh Company, Ltd. Image encoding method and apparatus, image decoding method and apparatus, image processing apparatus, image formation apparatus, and computer-executable programs
JP2002174603A (ja) * 2000-12-08 2002-06-21 Olympus Optical Co Ltd 欠陥分類方法
WO2003098264A1 (fr) * 2002-05-15 2003-11-27 Hamamatsu Photonics K.K. Systeme de traitement d'images et procede de traitement d'images
US7539344B2 (en) 2002-12-20 2009-05-26 Fujitsu Limited Boundary detection method between areas having different features in image data
US7436999B2 (en) 2003-03-11 2008-10-14 Tadahiro Ohmi Data analysis device and data recognition device
WO2004081872A1 (ja) * 2003-03-11 2004-09-23 Tadahiro Ohmi データ分析装置およびデータ認識装置
JP2005285010A (ja) * 2004-03-30 2005-10-13 Fujitsu Ltd 境界抽出方法、プログラムおよびこれを用いた装置
JP4598426B2 (ja) * 2004-03-30 2010-12-15 富士通株式会社 境界抽出方法、プログラムおよびこれを用いた装置
US7991231B2 (en) 2005-09-22 2011-08-02 Sharp Kabushiki Kaisha Method and apparatus for determining whether image characters or graphics are handwritten
JP2007108965A (ja) * 2005-10-13 2007-04-26 Nippon Telegr & Teleph Corp <Ntt> 変化領域計算方法、変化領域計算装置、変化領域計算プログラム
JP4612522B2 (ja) * 2005-10-13 2011-01-12 日本電信電話株式会社 変化領域計算方法、変化領域計算装置、変化領域計算プログラム
JP2008099273A (ja) * 2007-09-28 2008-04-24 Sony Corp 画像処理装置
WO2009113231A1 (ja) * 2008-03-14 2009-09-17 株式会社ソニー・コンピュータエンタテインメント 画像処理装置および画像処理方法
US8331619B2 (en) 2008-03-14 2012-12-11 Sony Computer Entertainment Inc. Image processing apparatus and image processing method
KR101459782B1 (ko) * 2008-09-08 2014-11-10 현대자동차주식회사 차량용 카메라의 야간 영상 개선 시스템
JP2010257062A (ja) * 2009-04-22 2010-11-11 Mitsubishi Electric Corp クレータ検出装置
JP2010134958A (ja) * 2010-02-08 2010-06-17 Fujitsu Ltd 境界検出方法、プログラムおよびこれを用いた装置
US10785500B2 (en) 2010-11-04 2020-09-22 Ge Video Compression, Llc Picture coding supporting block merging and skip mode
US10602182B2 (en) 2010-11-04 2020-03-24 Ge Video Compression, Llc Picture coding supporting block merging and skip mode
US10382777B2 (en) 2010-11-04 2019-08-13 Ge Video Compression, Llc Picture coding supporting block merging and skip mode
JP2013072968A (ja) * 2011-09-27 2013-04-22 Olympus Corp 顕微鏡システム
US10334255B2 (en) 2011-11-11 2019-06-25 Ge Video Compression, Llc Effective prediction using partition coding
US10911753B2 (en) 2011-11-11 2021-02-02 Ge Video Compression, Llc Effective wedgelet partition coding
US10321139B2 (en) 2011-11-11 2019-06-11 Ge Video Compression, Llc Effective prediction using partition coding
US10341667B2 (en) 2011-11-11 2019-07-02 Ge Video Compression, Llc Adaptive partition coding
US10362317B2 (en) 2011-11-11 2019-07-23 Ge Video Compression, Llc Adaptive partition coding
US11863763B2 (en) 2011-11-11 2024-01-02 Ge Video Compression, Llc Adaptive partition coding
JP2019134466A (ja) * 2011-11-11 2019-08-08 ジーイー ビデオ コンプレッション エルエルシー 高い分割自由度を伴う効果的なパーティション符号化
US11722657B2 (en) 2011-11-11 2023-08-08 Ge Video Compression, Llc Effective wedgelet partition coding
US10542278B2 (en) 2011-11-11 2020-01-21 Ge Video Compression, Llc Effective wedgelet partition coding using spatial prediction
US10542263B2 (en) 2011-11-11 2020-01-21 Ge Video Compression, Llc Effective prediction using partition coding
US10567776B2 (en) 2011-11-11 2020-02-18 Ge Video Compression, Llc Adaptive partition coding
US10574981B2 (en) 2011-11-11 2020-02-25 Ge Video Compression, Llc Effective Wedgelet partition coding
US10574982B2 (en) 2011-11-11 2020-02-25 Ge Video Compression, Llc Effective wedgelet partition coding
JP2017108427A (ja) * 2011-11-11 2017-06-15 ジーイー ビデオ コンプレッション エルエルシー 高い分割自由度を伴う効果的なパーティション符号化
US10771793B2 (en) 2011-11-11 2020-09-08 Ge Video Compression, Llc Effective prediction using partition coding
US10771794B2 (en) 2011-11-11 2020-09-08 Ge Video Compression, Llc Adaptive partition coding
US11425367B2 (en) 2011-11-11 2022-08-23 Ge Video Compression, Llc Effective wedgelet partition coding
US11032555B2 (en) 2011-11-11 2021-06-08 Ge Video Compression, Llc Effective prediction using partition coding
US10785497B2 (en) 2011-11-11 2020-09-22 Ge Video Compression, Llc Effective wedgelet partition coding using spatial prediction
US10321148B2 (en) 2011-11-11 2019-06-11 Ge Video Compression, Llc Effective wedgelet partition coding using spatial prediction
JP2021022947A (ja) * 2011-11-11 2021-02-18 ジーイー ビデオ コンプレッション エルエルシー 高い分割自由度を伴う効果的なパーティション符号化
US10986352B2 (en) 2011-11-11 2021-04-20 Ge Video Compression, Llc Adaptive partition coding
US11032562B2 (en) 2011-11-11 2021-06-08 Ge Video Compression, Llc Effective wedgelet partition coding using spatial prediction
KR20140129518A (ko) * 2013-04-30 2014-11-07 엘지디스플레이 주식회사 유기발광 표시장치와 그 구동 특성 보상 방법
JP2018068863A (ja) * 2016-11-02 2018-05-10 カリーナシステム株式会社 ガーゼ検出システム
JP2019125912A (ja) * 2018-01-16 2019-07-25 富士ゼロックス株式会社 色変換装置及びプログラム
US11488304B2 (en) 2018-05-01 2022-11-01 Eizo Corporation Gauze detection system and gauze detection method
JP2020144636A (ja) * 2019-03-07 2020-09-10 セイコーエプソン株式会社 情報処理装置、学習装置及び学習済モデル

Also Published As

Publication number Publication date
JP3353968B2 (ja) 2002-12-09

Similar Documents

Publication Publication Date Title
JP3353968B2 (ja) 画像処理装置
JP3373008B2 (ja) 画像像域分離装置
US5872864A (en) Image processing apparatus for performing adaptive data processing in accordance with kind of image
US5546474A (en) Detection of photo regions in digital images
US6985631B2 (en) Systems and methods for automatically detecting a corner in a digitally captured image
Bruzzone et al. An adaptive semiparametric and context-based approach to unsupervised change detection in multitemporal remote-sensing images
US6373981B1 (en) Method and apparatus for segmenting data to create mixed raster content planes
KR100926193B1 (ko) 디지털 화상 분할 및 콤팩트한 표현 생성
US5475768A (en) High accuracy optical character recognition using neural networks with centroid dithering
JP3207690B2 (ja) 画像処理装置
KR101183391B1 (ko) 메트릭 임베딩에 의한 이미지 비교
EP1271403A1 (en) Method and device for character location in images from digital camera
JPH1153525A (ja) 顔器官検出装置及び媒体
EP1700269A2 (en) Detection of sky in digital color images
JP4098021B2 (ja) シーン識別方法および装置ならびにプログラム
JP2005509223A (ja) コード認識のための装置及びその方法
US7058220B2 (en) Method and system for processing images using histograms
US6941013B1 (en) Method of image binarization using histogram modeling
CN114170418B (zh) 一种以图搜图的汽车线束连接器多特征融合图像检索方法
CN113052170A (zh) 一种无约束场景下的小目标车牌识别方法
CN111815528A (zh) 基于卷积模型和特征融合的恶劣天气图像分类增强方法
US7620246B2 (en) Method and apparatus for image processing
CN112686248B (zh) 证件增减类别检测方法、装置、可读存储介质和终端
EP1457927A2 (en) Device and method for detecting blurring of image
US20050281463A1 (en) Method and apparatus for processing binary image

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020903

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070927

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees