JPH07121656A - 画像像域分離装置 - Google Patents

画像像域分離装置

Info

Publication number
JPH07121656A
JPH07121656A JP5262278A JP26227893A JPH07121656A JP H07121656 A JPH07121656 A JP H07121656A JP 5262278 A JP5262278 A JP 5262278A JP 26227893 A JP26227893 A JP 26227893A JP H07121656 A JPH07121656 A JP H07121656A
Authority
JP
Japan
Prior art keywords
image
type
unit
input
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5262278A
Other languages
English (en)
Other versions
JP3373008B2 (ja
Inventor
Hiroyuki Fukuda
弘之 福田
Shinichi Imaide
愼一 今出
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP26227893A priority Critical patent/JP3373008B2/ja
Publication of JPH07121656A publication Critical patent/JPH07121656A/ja
Priority to US08/729,774 priority patent/US5867593A/en
Application granted granted Critical
Publication of JP3373008B2 publication Critical patent/JP3373008B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

(57)【要約】 【目的】本発明は、局所特徴パターンの発生頻度分布形
状等の情報を効果的に量子化して、ニューラルネットワ
ークの入力次元数を極力削減でき、規模の最適化を実現
する画像像域分離装置を提供することを目的とする。 【構成】本発明は、ディジタル化された画像から同種類
の画像が存在する領域の背景との境界を抽出してブロッ
ク分割し、該ブロックに対して画像種判定の着目領域を
選択する同種画像領域抽出部3と、判定対象ブロックか
ら隣接画素の輝度レベルの差分値を水平,垂直方向に得
る水平差分検出器9及び垂直差分検出器10と、算出さ
れた修正輝度レベルヒストグラムys と勾配ベクトル方
位ヒストグラムθr の形状と画像の種類の相関関係から
認識処理を行う特徴パターン判定部18と、画像種類を
判定する画像種決定部19とで構成され、判定対象ブロ
ックの画像種判断が行われる画像像域分離装置である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像像域分離装置に係
り、特に各種画像(活字、手書き文字、写真、絵柄な
ど)が混在した入力画像を画像の種類毎に領域を分割
し、分類する画像の像域分離装置に関する。
【0002】
【従来の技術】一般に、画像情報処理システムの処理機
能として、入力した混在画像を画像種類ごとに分類して
ディジタルデータに変換する処理が行われている。従
来、このような処理は、混在画像をディジタルデータで
蓄積メディアに保存する際に、画像種類ごとに最大効率
でデータを圧縮できる圧縮方法を採用し、所望される情
報の品質を維持しつつ、総合的データ量を最大限に削減
することが目的の1つにある。
【0003】また文字、線画などの2値階調画像と写真
などの連続階調画像を分類してそれぞれに2値画像表現
された画像がより良好であるように2値化処理方法を適
応的に選択することを目的としているものもある。
【0004】そして混在画像の中から画像種類ごとの記
載領域を分割し、分類する処理方法は種々提案されてい
る。そのうち、多くは、画像の種類によって呈する特徴
量を抽出して、その特徴量を定められた評価関数または
判定関数で判断し、画像種類を決定している。画像種の
判定においては、所定ブロック領域内での黒画素の発生
頻度やエッジの発生頻度、輝度レベルのヒストグラム、
空間周波数分布、線分の方向度数分布などを特徴量とし
ているものである。
【0005】また、それらと基本的に等価な特徴量とし
て、利用する入力画像の濃度勾配の度数分布を特徴量と
しているものがあり、例えば、特公平4−18350号
公報に記載される。この分類処理方法では、入力画像で
あるディジタル画像の水平方向、垂直方向に対して画素
単位毎に濃度勾配を求め、求めた水平、垂直濃度勾配の
値から算出される方向を、分割された小領域内で計数し
て、その度数分布を求めている。度数分布から度数の分
散を算出して、分散と所定閾値との閾値判定により文字
領域であるか否かを判断し決定している。
【0006】前記濃度勾配から算出される方向の分布
は、画像のエッジ部分の方向性分布をよく反映できる。
従って垂直・水平方向にエッジ成分を多く含む活字体文
字の画像に限って、それ以外の画像との差異が顕著にな
るので、被判定画像が活字体文字か否かを決定するには
有効な特徴量である。さらにこの特徴量から判定を下す
評価基準として分布の分散を用いていることは、エッジ
の方向性の偏りを観察することになり、また分散の算出
そのものが計算的負荷が比較的軽いので実用的である。
【0007】しかし、濃度勾配の方向分布に対する分散
だけを閾値判定しても、例えば輝度(濃度)レベルの範
囲が狭くなっている所謂コントラストが低い画像であっ
たり、判定対象小領域に対し文字のエッジ部分の占める
割合が小さい場合や、文字そのものの線の太さが細かっ
たりする場合では、たとえそれが活字体文字画像であっ
ても分散が小さくなり、明確な判定が困難になる。これ
は、背景が呈する濃度勾配の方向分布が頻度として多く
なり、文字部分が呈する濃度勾配が、それと相対的に差
異が認められなくなるためである。背景が示す濃度勾配
の方向分布は通常方向依存性はないので、文字部のエッ
ジの方向分布の方向依存性が背景の分布に埋もれてしま
う。
【0008】さらには、活字体文字画像に限らず多種画
像(手書き文字・写真・絵柄・背景)を選別して分類し
ようとすると、濃度勾配の方向分布の分散を観察しただ
けでは全く区別できないという問題点があった。
【0009】このような不具合を解決するために本出願
人により、特願平5−163635号において、各種画
像(活字、手書き文字、写真、絵柄など)が混在した入
力画像(以下、混在画像と称す)を、画像の種類毎に領
域を分割し、注目画素に隣接する複数画素の例えば輝度
の組み合わせから成る局所特徴パターンの発生度数分布
に着目して、その分布形状を近似し、特徴量としてニュ
ーラルネットワークで識別/判定する混在画像像域分離
装置を提案している。以下に、その混在画像像域分離装
置を説明する。
【0010】この混在画像像域分離装置は、大きく分け
て、入力されるディジタル画像(混在画像)を画像種類
が未知状態のままで同種画像領域ごとに矩形分割する同
種画像領域抽出部と、分割された同種画像部分領域の画
像種類を判定し、決定する画像種判定部より構成され
る。
【0011】同種画像領域抽出部は、混在画像を入力し
ディジタル画像に変換する画像入力部と、ディジタル画
像を同種画像領域に矩形分割する領域分割部を備えてい
る。画像種判定部は、抽出された同種画像領域内の所定
小ブロック領域において着目画素の例えば輝度とそれに
隣接する所定数(N個)の輝度から成る局所特徴パター
ンを検出する局所特徴パターン検出部と、局所特徴パタ
ーンをN次元空間上でベクトル量子化するベクトル量子
化部と、量子化された代表ベクトルに対してその発生頻
度を計数してヒストグラムを算出するヒストグラム生成
部と、求められた量子化ベクトルヒストグラムを入力と
してその分布形状を識別して所望する画像種類を出力す
る画像種識別部と、同種画像領域内で前記識別結果を得
て、総合的に判断して画像種類を決定する画像種決定部
とを備えている。
【0012】
【発明が解決しようとする課題】しかし、前述した混在
画像像域分離装置においては、ヒストグラムの画像によ
る偏りを排除するために行なう正規化処理によって、本
来連続的であったヒストグラムが不連続なものになり、
それが原因で判定誤りを起こす可能性が有る。また、こ
の分離装置の構成では、ニューラルネットワークへの入
力次元数が多くなると、事前に行なう学習にかかる時間
が比較的長くなり、実際の処理を行なうハード規模が大
きくなる問題があった。
【0013】そこで本発明は、局所特徴パターンの発生
頻度分布形状等の情報を効果的に量子化して、ニューラ
ルネットワークの入力次元数を極力削減でき、規模の最
適化を実現する画像像域分離装置を提供することを目的
とする。
【0014】
【課題を解決するための手段】本発明は上記目的を達成
するために、画像信号を入力する画像入力手段と、入力
した画像内から所定の大きさで小領域を選択抽出する判
定対象領域選択手段を有する画像の像域分離装置におい
て、判定対象領域の画像データから隣接する画素から成
る局所特徴パターンを検出する局所特徴パターン検出手
段と、前記特徴パターンの度数分布を求める手段と、前
記度数分布を乱数を使って正規化する度数分布正規化手
段と、前記正規化された度数分布を入力として画像種類
を識別して結果を出力する画像種識別手段と、前記画像
種識別手段からの識別結果により画像種類を決定する画
像種決定手段とで構成された画像像域分離装置を提供す
る。 さらに、画像信号を入力する画像入力手段と、入
力した画像内から所定の大きさで小領域を選択抽出する
判定対象領域選択部と、画像信号を圧縮する画像圧縮手
段とを有する画像の像域分離装置において、前記判定対
象領域選択部からの判定対象領域の画像データから隣接
する画素の局所特徴パターンを検出する局所特徴パター
ン検出手段と、前記画像圧縮手段からの出力と、前記局
所特徴パターン検出手段からの出力のうち、少なくとも
一方を入力として、所望する画像種類を識別して結果を
出力する画像種識別手段と、前記画像種識別手段からの
識別結果により画像種類を決定する画像種決定手段とで
構成される画像像域分離装置を提供する。
【0015】
【作用】以上のような構成の画像像域分離装置において
は、判定対象領域選択手段に供えられた同種画像領域抽
出部の入力手段からのデータは、領域分割手段に入力さ
れて同種画像領域が抽出されて、領域分割される。同種
画像領域の抽出は、この処理の段階では画像種類は未知
のままで遂行される。つまり活字体文字なのか、手書き
文字なのか、写真なのか、絵柄画像なのかは特定できな
い状態で、背景とは異なって一群をなす画像領域の境界
を抽出する。抽出方法は、種々考えられるが前述した特
願平5−163635号に開示のものを利用してもよ
い。
【0016】同種画像領域抽出部から出力される同種画
像領域の位置・大きさのデータは、順次画像種判定部に
入力されて、各領域ごとの画像の種類を判定し決定す
る。同種画像領域内においては、まず単位判定領域を所
定サイズの小ブロック領域として設定し、所定の探索手
順に従って同種画像領域内を探索範囲として小ブロック
単位で探索する。探索位置が決まった任意小ブロック内
では、局所特徴パターン検出手段によって、着目画素の
例えば輝度とそれに隣接する所定数(N個)の輝度から
成る局所輝度パターンを検出してベクトル量子化手段に
入力する。
【0017】前記ベクトル量子化手段では入力された局
所輝度パターンを構成するN個の次元空間で予め設定さ
れた所定数(M個)の代表ベクトルに量子化する。量子
化された代表ベクトルは、ヒストグラム生成手段におい
て、その累積度数が計算されて探索小ブロック内の量子
化ベクトルに対するヒストグラムが算出される。
【0018】その局所輝度パターンは直接その度数が計
数されてヒストグラムを生成し、画像識別手段に入力す
る場合もある。そしてヒストグラムを形成する各量子化
ベクトルの発生度数は画像種識別手段に入力されてヒス
トグラム形状に基づく探索小ブロックの画像種の識別を
行う。従ってヒストグラム形状が画像種によって類似し
た特徴をもつことが高識別率を実現する上で重要であ
る。そのため画像種毎のヒストグラム形状の再現性を得
るために正規化が必要である。また画像種毎のヒストグ
ラム形状の違いを効果的に反映するために画像種識別手
段への有効な入力信号の選択手段も必要となるので、そ
れら手法を本発明で提案する。さらに本発明の活用目的
の1つである画像データ圧縮処理と合わせて能率のよい
処理構成についても提案する。
【0019】前記画像種識別手段は、例えばフィードフ
ォワード階層型ニューラルネットワークを用いると効果
的な画像種認識が可能となる。ニューラルネットワーク
は、判定したい画像種類によって特徴的に現れる信号を
学習データにし、対応する画像種類を教師データとして
予め学習がなされたネットワークである。画像種識別手
段からの出力は画像種決定手段によって画像種の最終決
定が行われる。画像種識別結果としての出力は、先に求
められた同種画像領域内で複数得られ、画像種決定手段
に入力されることになる。複数の識別結果は多数決判定
により最終決定されるが、識別結果として曖昧なもの、
例えば2つ以上の画像種を同程度の出力値(発火レベ
ル)で識別結果として出力した場合は多数決判定の対象
から除外するなどの判定ルールに基づいて最終結果を出
力する。
【0020】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。図1には、本発明による第1実施例として
の混在画像像域分離装置の概略的な構成を示し説明す
る。
【0021】この混在画像像域分離装置において、異な
る画像の種類、例えば活字体文字、手書き文字、写真、
絵柄画像等が混在して記載されているドキュメントファ
イルは、ビデオカメラ、イメージスキャナによってフル
カラー画像が撮像されてアナログ画像入力信号としてデ
ィジタル画像変換器1に入力される。
【0022】前記ディジタル画像変換器1は、アナログ
画像入力信号を変換してディジタル画像信号を出力す
る。出力データは一旦、画像フレームメモリ2に入力さ
れて一時蓄積される。また既にディジタル画像信号に変
換されている蓄積画像データ、伝送画像データは、直
接、画像フレームメモリ2に入力されて同様に、一時、
蓄積される。
【0023】この画像フレームメモリ2から出力された
ディジタル画像データは、同種画像領域抽出部3を構成
する同種画像領域分割部4に入力される。この同種画像
領域分割部4は、画像種類は未知の状態で同種類の画像
が存在する領域の背景との境界を抽出して、分割してい
く処理を行う。一枚の混在画像から分割された複数の同
種画像領域は、それぞれ矩形領域として算出されて、定
められた1稜角の水平・垂直位置を示す分割領域アドレ
スデータと、矩形領域のサイズ(幅・高さ)が出力され
る。
【0024】前記同種画像領域分割部4から出力された
分割領域アドレスデータとサイズは、探索ブロック領域
選択部5に入力される。探索ブロック領域選択部5で
は、求められた同種画像領域内のどの部分を実際に画像
種判定の着目領域とするかを選択する。着目領域は、予
め設定されるか或いは同種画像領域のサイズに適応的に
変化する大きさをもつ所定サイズの矩形小ブロック領域
とする。探索ブロック領域選択部5により選択される判
定対象ブロックの位置は、同種画像領域内で複数回、同
位置を重複しないよう選択される。選択された判定対象
ブロックの位置・サイズのデータは、画像フレームメモ
リ2に入力されて、対応する画像メモリ部分の画像デー
タが画像フレームメモリ2から出力される。
【0025】画像フレームメモリ2から出力された判定
対象ブロックのフルカラー画像は、画像種判定部6に入
力される。この画像種判定部6の構成例を以下に簡単に
説明する。
【0026】まず、判定対象ブロック画像メモリ7に入
力されて、一時蓄積されたフルカラー画像データは、モ
ノクロ画像変換部8に入力されてモノクロ画像データに
変換される。
【0027】前記モノクロ画像変換部8から出力される
判定対象画像のモノクロ画像データは、まず水平差分検
出器9と垂直差分検出器10に同時に入力されて、判定
対象ブロックの任意の画素(i,j)に対する出力デー
タΔhij、Δvijが、順次、それぞれバッファメモリ1
1とバッファメモリ12に入力され、一時蓄積される。
水平差分検出器9では、モノクロ画像変換部8から出力
される判定対象領域の各画素の輝度成分から構成される
画像データにおいて、任意画素と隣接する画素の輝度レ
ベルの差分値を水平方向に対して算出するものである。
【0028】具体的に言えば、いま判定対象画像のモノ
クロ画像をM×N画素の矩形画像とし、水平・垂直の画
素配列をそれぞれi,jで記述すれば、その任意画素の
輝度レベルは、
【0029】
【数1】 と表わせて、求める水平差分値Δhijは、
【0030】
【数2】 となる。同様にして、垂直差分値Δvijは、
【0031】
【数3】 となる。
【0032】これら水平・垂直差分値がなす水平差分マ
ップ及び垂直差分マップは、計算結果が、一旦バッファ
メモリに格納されると共に輝度修正パラメータ算出部1
3に入力されて、輝度を修正するためのパラメータが算
出される。水平差分のマップの中から急峻なエッジ部分
を除去した部分の差分データを平均したものを平均水平
差分(avrΔh)、また垂直差分マップの中から急峻
なエッジ部分を除去した部分の差分データを平均したも
のを平均垂直差分(avrΔv)と称して算出する。判
定対象画像に於ける水平方向(H)、垂直方向(V)と
差分値(D)の3次元直交空間(H,V,D)でのベク
トルh(1,0,avrΔh)とベクトルv(0,1,
avrΔv)がなす平面p(h,v,d)、
【0033】
【数4】 に対する法線ベクトルn、
【0034】
【数5】 を求める。また、水平差分マップ上で急峻なエッジ部分
を“0”として、それ以外を“1”としたビットマップ
と、垂直差分マップ上に急峻なエッジ部分を“0”とし
それ以外を“1”としたビットマップが前記処理のとき
に作成され、これら2つのビットマップの論理和をとっ
たビットマップをマスクパターンとする。ただし、急峻
なエッジとは、差分値の絶対値が所定の閾値より大きい
か否かで決定される。このようにして、輝度修正パラメ
ータとして上記法線ベクトルnとマスクパターンが輝度
修正パラメータ算出部13から出力される。
【0035】輝度修正パラメータ算出部13から出力さ
れる法線ベクトルnとマスクパターンのデータは、輝度
レベル修正処理部14に入力されて、同時に入力される
モノクロ変換部8からの判定対象ブロックの輝度データ
を修正する。輝度レベル修正処理部14で行われる輝度
レベルの修正処理では、まずモノクロ変換部8からの輝
度レベルイメージデータに対して、先に求めたマスクパ
ターンが乗じられ、急峻なエッジ部分の輝度データが取
り除かれる。次に判定対象ブロックの水平・垂直・輝度
の3次元直交空間(H,V,Y)において、求めた法線
ベクトルnの方向を有する座標軸を修正座標軸mYとし
て設定し、ブロック内全ての画素に対して、その輝度レ
ベルyijを修正座標軸mYに射影した修正輝度レベルm
yijを算出し、修正輝度レベルごとに度数を求めて修正
輝度レベルヒストグラムを算出する。修正輝度ヒストグ
ラムは、修正輝度に対する正規化が施される。正規化方
法は、種々考えられる。例えば修正輝度レベルヒストグ
ラムを、
【0036】
【数6】 とし、修正輝度が0から最大にわたって積分した任意修
正輝度myijでの積算度数をg(my)とする。g(m
y)は、
【0037】
【数7】 と表せ、ヒストグラムの総和度数をgt とする。修正輝
度に対する正規化は、g(my)/gt =5%を満足す
るmyを最小修正輝度レベルmin myとし、g(m
y)/gt =95%を満足するmyを最大修正輝度レベ
ルmax myとすれば、次式より任意の修正輝度レベ
ルmyijより正規化修正輝度レベルを求めることもでき
る。
【0038】
【数8】
【0039】これは、修正輝度レベルのヒストグラムの
輝度レベルレンジを求めて、固定した所定のレンジに線
形変換する正規化処理である。なお、最小修正輝度レベ
ル、最大修正輝度レベルを定めるヒストグラムの積算度
数の総和度数に対する割合は、上記例の5%、95%に
限定される必然性はなく、適切な値が設定されれば良
い。 しかしながら、(9)式の修正輝度レベル算出に
おいて、最大輝度レベルと最小輝度レベルの差つまり、 max my−min my が小さいとき正規化処理後の結果が離散的な値をとるよ
うになってしまう。
【0040】例えば、max my=127,min
my=64 のとき、(8)式より、nr =4となり、正規化修正輝
度レベルnmyijは、 0、4、8、12、16、…、 のような値をとるようになる。
【0041】これは本来連続的な値をとっていたもので
あるが、ヒストグラムが離散的な値をとってしまい、後
で行なう画像種判定の判定誤りの原因になりかねない。
そこで、輝度レベルyijを修正座標軸mYに射影すると
きに、同時に正規化してしまうような処理を行なってし
まうことが好ましい。その具体的な手法を以下に示す。
まず、yijのmY軸に射影するとき、yijの最大値ma
Yと、min Yを用いて、
【0042】
【数9】 を求め、そのyij′をmY軸に射影して修正輝度レベル
myijを求める。
【0043】但し、randomは0以上未満の実数値
の乱数である。この様にして求めたmyijはそのヒスト
グラムが正規化され、かつその正規化による不連続は発
生しない。
【0044】前記(9)式の計算は、mY軸への射影変
換の計算と同時に実行が出来る。つまり変換の係数を変
えるだけで良いので、ヒストグラムを求めてから正規化
するのに比べて回路的に有利である。
【0045】以上により、輝度レベル修正部処理14で
は、モノクロ変換部8からの判定対象ブロックの任意の
画素(i,j)の輝度レベルmyijが修正・正規化され
て、正規化修正輝度レベルnmyijとして求められる。
【0046】前記輝度修正パラメータ部13、輝度レベ
ル修正処理部14で行われる一連の輝度修正処理は、判
定対象ブロックの画像に低周波の照明ムラ等が作用して
いる場合に、それを低減する処置を行うことと、該ブロ
ックの画像のダイナミックレンジの違いが該ヒストグラ
ムの分布形状に依存することを緩和する目的で行う。ま
た、低周波成分除去の目的で通常の高域通過フィルター
を利用するのに比べてコンボリューション演算がなく処
理が簡単である。
【0047】また、正規化修正輝度レベルnmyijは、
修正輝度レベルヒストグラム算出部15に入力されて、
正規化修正輝度レベルnmyijに対する度数の計数を行
ってヒストグラムを生成する。生成ヒストグラムは、正
規化修正輝度レベルの最大値と最小値の差を所定数Sで
線形に分割して、分割最小単位を度数計数のステップ幅
として生成する。従って、修正輝度レベルヒストグラム
算出部15からの出力数はSで与えられるが、このステ
ップ数Sは、必要最小限の数で画像種類とヒストグラム
形状との相関性が適度に保たれるように、試行錯誤的に
予め求められる。ここで、修正輝度レベルヒストグラム
算出部15からの出力を、 ys s=0,1,…,S と定義しておく。一方、バッファメモリ11とバッファ
メモリ12に、一時、蓄積された水平差分値Δhij及び
垂直差分値Δvijは、同時に読み出されて勾配ベクトル
方位検出部16に入力される。前記勾配ベクトル方位検
出部16において、次の演算式、
【0048】
【数10】 により求められる。但し、θは判定対象ブロックの任意
の画素(i,j)に対応した勾配ベクトル方位である。
【0049】勾配ベクトル方位θは、勾配ベクルト方位
ヒストグラム算出部17に入力されて、勾配ベクトル方
位θに対する度数の計数を行ってヒストグラムを生成す
る。この生成ヒストグラムは、修正輝度ヒストグラムを
求めたときと同様に、所定のステップ角度で一様に所定
数Rで線形に分割して、分割最小単位に属する方位角を
度数計数の単位とする。従って、勾配ベクトル方位ヒス
トグラム算出部17からの出力数はRで与えられるが、
このステップ数Rは、必要最小限の数で画像種類とヒス
トグラム形状との相関性が適度に保たれるように、試行
錯誤的に予め求められる。ここで、勾配ベクトル方位ヒ
ストグラム算出部17からの出力を、 θr r=0,1,…,R と定義しておく。
【0050】なお、計数度数の総計が異なっても勾配ベ
クトル方位θのヒストグラム形状の特徴パターンに般化
性が失われないように、必要に応じてθr の最大度数で
正規化しておくのがよい。
【0051】以上により、修正輝度レベルヒストグラム
算出部15と勾配ベクトル方位ヒストグラム算出部17
からのys 及びθr の合計[R+S]個の出力が、特徴
パターン判定部18に入力する。特徴パターン判定部1
8は、階層型ニューラルネットワークで構成される。入
力層は[R+S]個の入力をもち、中間層は試行錯誤的
に適切に決定された層数とニューロン素子をもち、出力
層は判定したい画像種類の数の出力をもつ。例えば、活
字体文字、手書き文字、写真、絵柄画像、背景画像の5
つの画像種類を混在画像の中から判定して分離したいの
であれば、5出力をもつことになる。
【0052】特徴パターン判定部18のニューラルネッ
トワークの学習は、入力された修正輝度レベルヒストグ
ラムys と勾配ベクトル方位ヒストグラムθr のパター
ン形状と対応関係にある探索ブロック選択部5で選択さ
れた判定対象ブロックの画像の種類を教師データとして
出力層に与えられる。学習時、教師データとしての判定
対象ブロックの画像種類は、人為的に認識して決定す
る。この学習過程は、バックプロパゲーション手法によ
り、出力誤差が判定誤差以下になるまで、判定対象画像
の種類をさまざまに変えて繰り返し行われる。特徴パタ
ーン判定部18では、入力される修正輝度レベルヒスト
グラムys と勾配ベクトル方位ヒストグラムθr の形状
(特徴パターン)と画像の種類に相関関係があることを
利用して、ニューラルネットワークにより認識処理を行
っている。敢えてニューラルネットワークを用いている
のは、一般的なパターンマッチングのように多量の参照
テンプレートと比較決定する膨大な計算を回避すること
と、特徴パターンと画像種類との相関性が多少劣化して
も判定確率への影響が少ないことを利点とするためであ
る。学習が終了した特徴パターン判定部18は、既に入
力された修正輝度レベルヒストグラムys と勾配ベクト
ル方位ヒストグラムθr のヒストグラム形状に対し、画
像種類を判定し出力する画像種判定器になっている。
【0053】そして特徴パターン判定部18の出力は、
画像種決定部19に入力されて判定対象ブロックの画像
種最終判断が行われる。画像種決定部19から出力され
る最終決定した画像種類、同種画像領域のアドレスデー
タ及び、サイズが、本実施例の混在画像像域分離装置か
ら出力される。
【0054】前記実施例によれば、修正輝度レベルヒス
トグラムの正規化手段を射影手段の中に含ませて、乱数
を用いて値をばらつかせているので、値が離散的になら
ず、ハード規模の増大を防止した正規化が実現できる。
【0055】次に本発明により画像種を分類した後に行
なう自然画像の圧縮処理について簡単に述べる。まず、
自然画像と判断された部分については自然画像の圧縮方
式の国際標準であるJPEGを利用して圧縮するのが好
ましい。この方法は、画像を8画素×8画素のブロック
に分割し、各ブロック毎にDCT(Discrete
Cosine Transform)を行なってその変
換係数を量子化して符号を当てはめている。このDCT
係数は、ブロック内の周波数成分を求めることになるの
で、そのブロックの特徴をある程度表している。
【0056】そこで、入力画像をすべて8×8のブロッ
クに分解し、ブロック毎のDCT係数を求め、それを画
像種判定のためのニューラルネットワークの入力とする
方法が考えられる。この方法は、圧縮処理に必要とする
回路での出力をニューラルネットワークの入力として用
いるので回路的にも、判定効率的にも効果的である。
【0057】図2には、第2実施例として、混在画像像
域分離装置における画像圧縮部の構成を示す。この図2
において、ブロッキング部22、DCT部23、量子化
及び符号化部24はJPEGのコードを出力するいわゆ
る自然画像圧縮部21を構成する。画像種判定部25は
図1に示した画像種判定部6に相当しており、勾配ベク
トル方位ヒストグラムと修正輝度レベルヒストグラムを
求め、DCT係数と共にニューラルネットワークへ入力
し、その結果から画像種判定を行なうことができるよう
になっている。そして、画像種判定結果に従って圧縮信
号切替部28にて自然画像と判断されたものは、自然画
像圧縮部21での圧縮信号を、絵柄画像と判断されたも
のは絵柄画像圧縮部26による圧縮信号を、文字画像と
判断されたものは文字画像圧縮部27による圧縮信号を
それぞれ出力する。
【0058】本実施例では、自然画像の圧縮には前述し
たようにJPEG方式を用いており、絵柄画像の圧縮に
は特開昭59−171260号公報に記載のカラーファ
クシミリ信号符号化方式の方法を用いている。また、文
字画像の圧縮には、2値画像の標準符号化方式のMMR
方式を用いている。但し、本発明はこれらの手法に限定
されるものではなく、また、その圧縮部の途中段階の情
報を画像種判定のための情報として用いることも構わな
い。
【0059】本実施例では、計算時間の削減のために、
ニューラルネットワークへの入力次元数を減らす構成を
とっている。図2に示した構成の場合、画像信号の局所
特徴パターンである修正輝度レベルヒストグラム並びに
勾配ベクトル方位ヒストグラムと、64個のDCT係数
が入力となり得るのだが、その全てを用いるのではな
く、判定に最も有効なものを選択して入力とするように
している。以下に入力次元を減らす場合の考え方を示
す。
【0060】前述したようにDCT係数はブロック内の
周波数成分であり、その係数のパターンによりブロック
の特徴が判る。例えば、水平方向の周波数成分に大きな
値が現れていたとすると、そのブロックには縦のエッジ
成分が含まれていたと考えられる。つまり、DCT係数
を利用することで、ブロック内の勾配ベクトル方位情報
と同等な作用が得られることになる。また、低い周波数
成分にほとんどパワーが集中している場合には、少なく
ともそのブロックにはエッジのような急峻な変化が含ま
れていなかったことが判る。
【0061】これらの判断は64個の係数の内、例えば
図3にハッチングで示した8個の係数を用いることでほ
ぼ十分であると考えられる。従って、画像種判定部25
への入力としては、修正輝度レベルヒストグラムと前記
8個のDCT係数を用いるようにしている。また、文字
画像圧縮手段27で計算されるランレングスの値や、絵
柄画像圧縮手段26で利用するブロック毎の分解能に関
する情報なども画像種判定の入力信号とすることも可能
である。
【0062】このような方法で次元数を減らすことは計
算時間が短縮できる上に、圧縮処理過程での中間出力を
利用するので、新たな回路を付加すること無く実現が可
能である。
【0063】更に画像圧縮にJPEGのような方法のみ
を用いた場合について述べる。図4において、画像入力
部31、フレームメモリ32、同種画像領域抽出部33
は図1に示す構成部材と同様な機能を有しており、画像
種判定部34への入力は第1実施例で説明したように画
像信号の局所特徴パターンと、DCT部35からのDC
T係数を用いて画像種の判定を行なっている。
【0064】ここで得られた判定結果によって、量子化
部36でのDCT係数の量子化時の量子化ステップもし
くは量子化マトリクスを制御するような構成としてい
る。つまり、画像の特徴に合わせて、符号化処理のパラ
メータを変更することで、画像種に最適な圧縮を行なお
うとするものである。
【0065】具体的には、自然画像と、線画的な文字画
像が含まれている混在画像が入力されたとすると、文字
画像部分は線の輪郭が劣化しないように自然画像と比べ
て高周波成分の量子化幅を小さくしたい。そこで、文字
画像と判断された部分については、その高周波成分の量
子化幅を小さくした量子化マトリクスを用いるようにし
ている。
【0066】この構成によれば、従来のように、一通り
の圧縮部しか設けられず、画像種毎に異なるアルゴリズ
ムで圧縮することが不可能な場合でも、最適な圧縮効率
となるように符号化することができる。
【0067】次に更に入力次元数を削減する方法を用い
た実施例について説明する。本出願人による特願平5−
163635号には、LBGアルゴリズムによるベクト
ル量子化を用いてパターン化を行なう方法が一例として
説明されているが、この方法の場合、分布パターンの密
度が高い所を重点的に分割するようになっているため、
必ずしも分類に関して有意な分類になっていない場合が
あった。
【0068】たとえば文字画像の勾配ベクトル方位を考
えてみると、平坦部に相当する部分に頻度が集中してお
り、この中心部分を細かく分割するようにベクトル量子
化が行なわれている。従って画像内の線の方向性を示す
周辺部は粗く分割されてしまってむしろあまり有意でな
い情報が多くなってしまう。
【0069】このような欠点を解決するために、パター
ン認識の技術を導入して入力の前処理として統計的多変
量解析手段の1つであるF−S変換(FST)を用いる
ことも効果がある。
【0070】“Image calassificat
ion by the Foley−Sammon t
ransform”;OPTICAL ENGINEE
RING/July 1986/Vol.25 No.
7,pp834−840記載のFS変換は、2つのクラ
スを分類する手法で具体的には、Fisher rat
io
【0071】
【数11】 を最大にする分類のためのベクトルdiを求めることで
ある。以後この分類のためのベクトルdiを分類ベクト
ルと呼ぶ。この分類ベクトルdiは対象の修正輝度レベ
ルヒストグラムと勾配ベクトル方位ヒストグラムを併せ
たものの次元数λと同じ次元数を有する。
【0072】そして、Fisher ratioを大き
くする分類ベクトルを2種類求める。Fisher r
atioを最大にする分類ベクトルdiをd1、このd
1と直交するベクトルの中でFisher ratio
を最大にする分類ベクトルdiをd2とする。この分類
ベクトルd1,d2で構成される空間に各データを投影
することにより、2つのクラスが分類される。分類ベク
トルd1,d2は次式から求める。
【0073】
【数12】 ここで、α1,α2は正規化係数、ΔはX1−X2(ク
ラス1とクラス2の平均の差ベクトル)、Iは単位行列
である。このようにして得た分類ベクトルd1,d2で
構成される空間に各データを投影するためには分類ベク
トルと対象物のヒストグラムとの内積t1,t2を求め
る。対象とするヒストグラムをf(λ)とすれば内積t
1,t2は次式で表せられる。
【0074】
【数13】 ここで、“・”は内積演算を表す。
【0075】本来FSTを用いたクラス分類では、前記
t1,t2を適当な閾値処理することで2つのクラスに
分類が可能であるが、本発明で達成しようとしているよ
うな微妙な画像種の分類は総合的な判断を必要としてい
るので、これらをニューラルネットワークを用いた画像
種判定部への入力としている。
【0076】本発明では、クラス1,クラス2を手書き
文字及び絵柄画像として教師データから分類ベクトルを
求め、それを用いヒストグラムf(λ)を投影すると、
(13)式の計算によりt1,t2の2つの値が得られ
る。同様にクラス1,クラス2を他の組み合わせとして
分類ベクトルを求めて同様の計算を行なっている。
【0077】つまり、予め画像種の判っているデータを
複数用意し、それを教師データとして分類ベクトルを求
めておき、図5に示すように、それをROM45などに
記録して、実際の画像種判定時にはブロック画像メモリ
41から読み出される画像信号の勾配ベクトル方位ヒス
トグラムおよび修正輝度レベルヒストグラムを(13)
式のf(λ)として求め、前記分類ベクトルとの内積演
算を内積演算部44でブロック毎に行なうことになる。
【0078】ROM45に記録される分類ベクトルとし
ては、図6に示すように、クラス1,クラス2を手書き
文字及び絵柄画像として求めた分類ベクトル51、手書
き文字及び活字文字として求めた分類ベクトル52、活
字文字及び自然画像として求めた分類ベクトル53、自
然画像及び絵柄画像として求めた分類ベクトル54、手
書き文字及び自然画像として求めた分類ベクトル55、
絵柄画像及び活字文字として求めた分類ベクトル56か
らそれぞれ2つずつ計12個のベクトルが記録されてお
り、コントローラ46からの切り替え指示によってそれ
ぞれの投影結果をバッファ47に一時的に蓄える。バッ
ファ47では、各分類ベクトルへの投影結果をこれを画
像種判定のためのニューラルネットワーク48のそれぞ
れへの入力となるように出力している。
【0079】この方法によれば、ニューラルネットワー
ク48の入力次元数は12にまで減らすことができ、ニ
ューラルネットワークの負荷を軽減させることができ
る。本実施例では、分類ベクトルを各クラス間で2つず
つ求めていたが、d1のみであっても構わなく、クラス
についても図6に示す51〜56の6通りの全ての組み
合せから求めた分類ベクトルを用いる必要はなく、判定
に必要な最小限の入力次元数とすればよい。
【0080】また、これまで述べてきた修正輝度レベル
ヒストグラムと勾配ベクトル方位ヒストグラムとの併用
により判定誤りを減らすようにするといったことも可能
である。即ち、図1に示した画像種判定部6内の特徴パ
ターン判定部18へ、図7に示すように勾配ベクトル方
位ヒストグラム算出部62と、修正輝度レベルヒストグ
ラム算出部63と、FST部64で計算された結果を入
力とするようにしている。
【0081】このとき図7中のFST部64への入力
は、ブロック単位の画像データとしている。FST部6
4では、ヒストグラムだけからでは判定誤りの起き易か
った手書き文字と絵柄画像との分類のために、手書き文
字と絵柄画像を教師データとして分類ベクトルを求めて
おき、その分類ベクトルと判定を行いたい画像のブロッ
クデータとの内積を特徴パターン判定部への入力として
加えるようにしている。これにより判定誤りが軽減され
る。
【0082】次に図8には、本発明による第5実施例と
して、図2に示した画像圧縮に階層的符号化手法を用い
た例を示し説明する。図8においては、原画像71を縦
横2分の1に縮小した1/4縮小画像72をもとめ、そ
れを更に2分の1に縮小した1/16縮小画像73を求
め、これを圧縮して出力したものを第1層データ74と
する。第1層データ74を復号して縦横2倍に拡大し、
第1層復号拡大画像76とし、それを前記1/4縮小画
像72から引いた画像を差分画像77とする。
【0083】この差分画像77を圧縮して出力したもの
を第2層データ78とする。第2層データ78を復号し
て第1層復号拡大画像76を加えたものを縦横2倍に拡
大し、原画像71との差をとった画像を差分画像81と
し、これを圧縮して出力したものを第3層データ82と
する。
【0084】このようにして得られた第1層から第3層
のデータは上位の階層からつまり、最初に第1層データ
を送信し、次に第2層、最後に第3層の順番で送信され
る。受信側では、第1層を先ず復号し、低解像度の画像
を得る。受信側では必要に応じて、更に第2層のデータ
を用いることで、中程度の解像度の画像を得ることがで
き、更に第3層のデータから高解像度の画像を得ること
が出来るようになっている。
【0085】本実施例ではこの階層符号化の途中段階で
得られる階層化された縮小画像を用いて画像種の判定を
行ない、判定が曖昧なときには下位の階層の画像を用い
て判定をし直すようにしている。具体的な方法について
以下の述べる。
【0086】まず1/16縮小画像73より画像種の判
定を行なう。この判定に用いられるデータ量は原画像7
1に比べて16分の1なので判定にかかる時間も概ね1
6分の1になる。
【0087】この時、解像度の低い縮小画像を判定に用
いているために、判定結果が曖昧になるブロックが発生
することがある。その場合、そのブロックについて、よ
り高い解像度のデータを用いて判定を行なうようにして
いる。つまり、1/16縮小画像73のブロックの中で
判定が曖昧であったブロックに対応するブロックを1/
4縮小画像72から取りだし、それを用いて判定をやり
直すようにする。この走査でも判定が曖昧なブロックが
発生した場合は、さらに高解像度の原画像71からその
対応するブロックを取り出して判定をやり直すようにし
ている。こうして各ブロックの画像種を判定した後、そ
れぞれの画像種に対応する圧縮手法によって画像圧縮を
行なっている。ここで言う判定が曖昧であったブロック
とは、画像種が変化する境界部のように複数の画像種が
含まれている可能性がある部分のブロックと、判定に用
いるニューラルネットワークの出力が複数の画像種に対
して比較的近い値を示したブロックのことである。
【0088】この画像種判定の流れについて、図9及び
図10を用いて説明する。最初に、1/16縮小画像を
作るためにフレームメモリ83に記録されている画像を
1/4縮小部84で1/4縮小画像を作成して1/4フ
レームメモリ85に格納する。それをさらに1/4縮小
部86で1/16縮小画像を作成して1/16フレーム
メモリ87に格納する。
【0089】次に、1/16縮小画像の全てのブロック
についてブロック読み出し部88によって1/16フレ
ームメモリ87から読出して、画像種判定部89で順次
画像種判定を行なう(ステップS1)。このときブロッ
クのサイズは、原画像で画像種の判定を行なう場合と同
じなので、1/16縮小画像の1つのブロックは、原画
像において16個のブロックに相当している。
【0090】次に曖昧検出部90により、この判定結果
が曖昧か否か判定し(ステップS2)、判定結果が曖昧
でないと判断されたブロックについては(NO)、その
原画像上で対応している16個のブロックについて画像
種が確定したものとし、その判定結果を判定結果記録部
91に記録する。一方、判定結果が曖昧であったと判定
された場合は(YES)、そのブロックの1/4縮小画
像上で対応している4個のブロックについてブロック読
み出し部88を通じて、1/4フレームメモリ85より
読み出して、それぞれ画像種について再度の判定をする
(ステップS3)。次に、その判定結果が曖昧であった
か否か判定し(ステップS5)、判定結果に曖昧がなか
った場合には(NO)、ステップS3に戻り、再度残り
の3つのブロックに対して同様に、画像種について判定
し(ステップS7)、それらの判定結果が曖昧でなかっ
たブロックについては、その原画像上での4個のブロッ
クについて画像種が確定したとものし、判定結果を判定
結果記録部91に記録する。
【0091】一方ステップS5で、曖昧であったと判断
されたブロックについては(YES)、そのブロックの
原画像上で対応している4個のブロックについて、ブロ
ック読出し部88を通じて、フレームメモリ83より読
出して、それぞれ画像種の判定をやり直す(ステップS
6,S8)。以上の処理により画像種が確定し終えた
ら、全ブロックについて処理が終了したか否か判定し
(ステップS4)、未終了であれば(NO)、1/16
縮小画像に於ける次のブロックの処理を行なう(ステッ
プS9)。
【0092】この構成により、曖昧と判定されるブロッ
クが非常に多い場合を除いて画像種判定の回数が少なく
なる。本実施例では、全てのブロックについて画像種が
確定した後、各層の圧縮を行うようにしている。
【0093】また、本実施例において各層の画像を一時
的に蓄えるためにフレームメモリを用いているが、これ
を省略して、必要に応じてその階層の画像を作成するよ
うにしても構わなく、また、各層毎に画像の解像度が変
るので、それに応じて画像種判定部も各層毎に最適なも
のを用意するようにしても良い。
【0094】第6実施例として、前述した第5実施例の
ようにブロック毎に確定させていく方法の他に、図11
に示すような画像種判定方法もある。この方法において
は、まず、1/16縮小画像の全てのブロックで判定を
行ない(ステップS11)、判定結果が曖昧で画像種が
未確定になっているブロックを抽出し、そのブロックに
対して1/4縮小画像によって判定を行ない(ステップ
S15)、それでも判定が曖昧で画像種が未確定になっ
ているブロックを抽出し、そのブロックに対して原画像
によって判定を行なう(ステップS18)。
【0095】次に、実際のブロックでの画像種の決定の
例として、図12を用いて説明する。ここで、図12
(a)は、1/16縮小画像、同図(b)は1/4縮小
画像、同図(c)は原画像をそれぞれ表している。
【0096】図12(a)は、1/16縮小画像での判
定結果から右上のブロックが未確定となっており、他の
ブロックは第1の画像種と判定されたところである。前
記未確定ブロックの1/4縮小画像上での4個のブロッ
クについて判定を行なったところ、図12(b)に示す
ように右側の2ブロックについて確定した。
【0097】最後に残された部分を原画像を用いて判定
を行ない、図12(c)に示すように画像種を確定す
る。このように本実施例で示す手法によれば、ほとんど
の部分が1/16縮小画像73(図8)からのデータに
よって画像種判定が行なわれるため、判定にかかる時間
を大幅に削減することができる。尚、画像種判定のため
のニューラルネットワークは、1/4縮小画像72、1
/16縮小画像73及び原画像71のデータに対して同
一のニューラルネットワークを共通に用いていたが、こ
れは各解像度に合わせたものをそれぞれ用意し、解像度
毎に別々に用いるようにしても構わない。
【0098】以上詳述したように本実施例によれば、異
なる画像の種類、例えば活字体文字、手書き文字、写
真、絵柄画像などが混在している混在画像を同種画像領
域毎に的確に分割して、その分布パターンの統計量を求
め、その分布パターンもしくは、画像の圧縮手段の中間
データを用いて画像種を判定する混在画像像域分離装置
を提供するので、比較的軽い負荷の処理と正解率の高い
混在画像の像域分離および効率の良い圧縮が実現する。
【0099】前記分布パターンの分類・認識は、データ
をニューラルネットワークで認識する手段を構成してい
るので、精度のよい画像種判定を可能にしている人為的
判定の場合に類似して、統計量に基づく適切なクラスタ
リングが実現できる。
【0100】さらに像域分離された画像は、画像の種類
に応じて行うことによって効果を発揮するデータ処理、
例えばデータ圧縮、適応2値化、網点処理、意図的画像
再現効果を実現する種々自然画像処理(フィルタリング
など)を自動化することが可能である。また本発明は、
前述した実施例に限定されるものではなく、他にも発明
の要旨を逸脱しない範囲で種々の変形や応用が可能であ
ることは勿論である。
【0101】
【発明の効果】以上詳述したように本発明によれば、局
所特徴パターンの発生頻度分布形状等の情報を効果的に
量子化して、ニューラルネットワークの入力次元数を極
力削減でき、規模の最適化を実現する画像像域分離装置
を提供することができる。
【図面の簡単な説明】
【図1】本発明による第1実施例としての混在画像像域
分離装置の概略的な構成を示す図である。
【図2】本発明による第2実施例として、混在画像像域
分離装置における画像圧縮部の構成を示す図である。
【図3】第2実施例で画像判定に用いるブロック内の係
数の位置例を示す図である。
【図4】圧縮パラメータをその画像種に応じて変更する
構成例を示す図である。
【図5】本発明による第3実施例としての混在画像像域
分離装置の概略的な構成を示す図である。
【図6】第3実施例におけるF−S変換を施す画像種の
組み合わせを示す図である。
【図7】本発明による第4実施例としての混在画像像域
分離装置の概略的な構成を示す図である。
【図8】本発明による第5実施例として、図6に示した
画像圧縮に階層的符号化手法を用いた例を示す図であ
る。
【図9】第5実施例の画像種判定における画像データの
流れについて説明するための構成例を示す図である。
【図10】第5実施例における画像種判定の流れについ
て説明するためのフローチャートである。
【図11】第6実施例としての混在画像像域分離装置に
おける画像種判定の流れについて説明するためのフロー
チャートである。
【図12】ブロックでの画像種の決定の一例を示す図で
ある。
【符号の説明】
1…ディジタル画像変換器、2…画像フレームメモリ、
3…同種画像領域抽出部、4…同種画像領域分割部、5
…探索ブロック領域選択部、6…画像種判定部、7…判
定対象ブロック画像メモリ、8…モノクロ画像変換部、
9…水平差分検出器、10…垂直差分検出器、11,1
2…バッファメモリ、13…輝度修正パラメータ算出
部、14…輝度レベル修正処理部、15…修正輝度レベ
ルヒストグラム算出部、16…勾配ベクトル方位検出
部、17…勾配ベクルト方位ヒストグラム算出部、18
…特徴パターン判定部、19…画像種決定部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 画像信号を入力する画像入力手段と、入
    力した画像内から所定の大きさで小領域を選択抽出する
    判定対象領域選択手段を有する画像の像域分離装置にお
    いて、 判定対象領域の画像データから隣接する画素から成る局
    所特徴パターンを検出する局所特徴パターン検出手段
    と、 前記局所特徴パターンの度数分布を求める手段と、 前記度数分布を乱数を使って正規化する度数分布正規化
    手段と、 前記正規化された度数分布を入力として画像種類を識別
    して、結果を出力する画像種識別手段と、 前記画像種識別手段からの識別結果により画像種類を決
    定する画像種決定手段と、を具備することを特徴とする
    画像像域分離装置。
  2. 【請求項2】 画像信号を入力する画像入力手段と、入
    力した画像内から所定の大きさで小領域を選択抽出する
    判定対象領域選択部と、画像信号を圧縮する画像圧縮手
    段とを有する画像の像域分離装置において、 前記判定対象領域選択部からの判定対象領域の画像デー
    タから隣接する画素の局所特徴パターンを検出する局所
    特徴パターン検出手段と、 前記画像圧縮手段からの出力と、前記局所特徴パターン
    検出手段からの出力のうち、少なくとも一方を入力とし
    て、所望する画像種類を識別して、結果を出力する画像
    種識別手段と、 前記画像種識別手段からの識別結果により画像種類を決
    定する画像種決定手段と、を具備することを特徴とする
    画像像域分離装置。
  3. 【請求項3】 請求項2記載の前記画像圧縮手段とし
    て、自然画像圧縮手段、絵柄画像圧縮手段、文字画像圧
    縮手段のうち少なくとも1つを含み、該画像圧縮手段か
    らの出力を切り替える圧縮信号切換手段をさらに具備す
    ることを特徴とする画像像域分離装置。
  4. 【請求項4】 請求項1,2記載の前記画像像域分離装
    置において、統計的多変量解析手段により分類ベクトル
    を求め、この分類ベクトルに前記局所特徴パターンに係
    るデータを射影して画像種識別手段への入力とする手段
    をさらに具備することを特徴とする画像像域分離装置。
JP26227893A 1993-10-20 1993-10-20 画像像域分離装置 Expired - Fee Related JP3373008B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP26227893A JP3373008B2 (ja) 1993-10-20 1993-10-20 画像像域分離装置
US08/729,774 US5867593A (en) 1993-10-20 1996-10-08 Image region dividing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26227893A JP3373008B2 (ja) 1993-10-20 1993-10-20 画像像域分離装置

Publications (2)

Publication Number Publication Date
JPH07121656A true JPH07121656A (ja) 1995-05-12
JP3373008B2 JP3373008B2 (ja) 2003-02-04

Family

ID=17373574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26227893A Expired - Fee Related JP3373008B2 (ja) 1993-10-20 1993-10-20 画像像域分離装置

Country Status (2)

Country Link
US (1) US5867593A (ja)
JP (1) JP3373008B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0902585A3 (en) * 1997-09-11 1999-12-08 Sharp Kabushiki Kaisha Method and apparatus for image processing
KR100750176B1 (ko) * 2005-11-01 2007-08-21 삼성전자주식회사 초정밀화를 이용한 양자화 아티팩트 제거 방법 및 시스템
KR100782848B1 (ko) * 2005-11-01 2007-12-06 삼성전자주식회사 디지털 이미지 처리 방법 및 그 시스템
US7333662B2 (en) 2001-02-20 2008-02-19 Sanyo Electric Co., Ltd. Image coding and decoding using intermediate images
KR101496422B1 (ko) * 2009-04-08 2015-02-27 뉴로우, 인코포레이티드 이미지 압축을 위한 시스템 및 방법
US9253505B2 (en) 2009-04-08 2016-02-02 Newrow, Inc. System and method for image compression
JP2019079347A (ja) * 2017-10-25 2019-05-23 ネットスマイル株式会社 文字種推定システム、文字種推定方法、および文字種推定プログラム
JP2020088740A (ja) * 2018-11-29 2020-06-04 ピクシブ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
US11216747B2 (en) 2018-04-10 2022-01-04 Electronics And Telecommunications Research Institute Artificial intelligent system including pre-processing unit for selecting valid data

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5848185A (en) * 1994-12-28 1998-12-08 Canon Kabushiki Kaisha Image processing apparatus and method
WO1997001152A1 (en) * 1995-06-20 1997-01-09 Cambridge Consultants Limited Improved data processing method and apparatus
AU718453B2 (en) 1996-07-17 2000-04-13 Sony Corporation Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks
US6381369B1 (en) 1996-07-17 2002-04-30 Sony Corporation Image coding apparatus, image coding method, image decoding method, image decoding apparatus, image data transmitting method and recording medium
TW359919B (en) 1996-07-17 1999-06-01 Sony Corp Image coding apparatus, image coding method, image decoding method, image decoding apparatus, image data transmitting method and recording medium
US6292591B1 (en) 1996-07-17 2001-09-18 Sony Coporation Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks
AU714554B2 (en) 1996-07-17 2000-01-06 Sony Corporation Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks
JP2942736B2 (ja) * 1996-09-03 1999-08-30 オリンパス光学工業株式会社 コード記録装置
JP3330826B2 (ja) * 1996-09-09 2002-09-30 シャープ株式会社 画像処理装置
US6282323B1 (en) * 1996-12-04 2001-08-28 Canon Kabushiki Kaisha Image processing method and apparatus
US6269186B1 (en) * 1996-12-20 2001-07-31 Canon Kabushiki Kaisha Image processing apparatus and method
JPH10207766A (ja) * 1997-01-16 1998-08-07 Nec Ic Microcomput Syst Ltd 画像生成装置
US5960111A (en) * 1997-02-10 1999-09-28 At&T Corp Method and apparatus for segmenting images prior to coding
JP4251675B2 (ja) * 1997-07-30 2009-04-08 ソニー株式会社 記憶装置およびアクセス方法
JP4236713B2 (ja) * 1997-07-30 2009-03-11 ソニー株式会社 記憶装置およびアクセス方法
KR100295225B1 (ko) * 1997-07-31 2001-07-12 윤종용 컴퓨터에서 영상정보 검색장치 및 방법
JP3915855B2 (ja) 1997-12-19 2007-05-16 ソニー株式会社 画像符号化装置および画像符号化方法、並びに学習装置および学習方法
JP3549720B2 (ja) * 1998-01-28 2004-08-04 シャープ株式会社 画像処理装置
JP3777813B2 (ja) * 1998-08-05 2006-05-24 コニカミノルタビジネステクノロジーズ株式会社 網点画像判別方法及び画像処理装置
US6445819B1 (en) * 1998-09-10 2002-09-03 Fuji Photo Film Co., Ltd. Image processing method, image processing device, and recording medium
US6377703B1 (en) * 1998-11-10 2002-04-23 Seiko Epson Corporation Apparatus and method for determining an area encompassing an image for scanning the image
JP2000310968A (ja) * 1999-02-23 2000-11-07 Canon Inc 画像表示装置および方法
US6643400B1 (en) * 1999-03-31 2003-11-04 Minolta Co., Ltd. Image processing apparatus and method for recognizing specific pattern and recording medium having image processing program recorded thereon
GB2352915A (en) * 1999-08-06 2001-02-07 Television Monitoring Services A method of retrieving text data from a broadcast image
JP3501031B2 (ja) 1999-08-24 2004-02-23 日本電気株式会社 画像領域判定装置、画像領域判定方法及びそのプログラムを記憶した記憶媒体
US6839466B2 (en) * 1999-10-04 2005-01-04 Xerox Corporation Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding
US20020001096A1 (en) * 2000-04-28 2002-01-03 Kenro Hama Image processor for detecting specified pattern
AU2001267077A1 (en) * 2000-06-14 2001-12-24 Arjun Nayyar Multimedia compression/decompression and compressed data representation
US7397949B2 (en) * 2000-06-21 2008-07-08 Microsoft Corporation Serial storage of ink and its properties
US7006711B2 (en) * 2000-06-21 2006-02-28 Microsoft Corporation Transform table for ink sizing and compression
US7248934B1 (en) 2000-10-31 2007-07-24 Creative Technology Ltd Method of transmitting a one-dimensional signal using a two-dimensional analog medium
US7171042B2 (en) * 2000-12-04 2007-01-30 Intel Corporation System and method for classification of images and videos
US6707473B2 (en) 2001-08-01 2004-03-16 Microsoft Corporation Dynamic rendering of ink strokes with transparency
CN1692369A (zh) * 2001-06-15 2005-11-02 皇家菲利浦电子有限公司 视频信息中自动的自然内容检测
US7343053B2 (en) * 2001-06-27 2008-03-11 Microsoft Corporation Transform table for ink sizing and compression
US6909430B2 (en) * 2001-08-01 2005-06-21 Microsoft Corporation Rendering ink strokes of variable width and angle
US7168038B2 (en) * 2001-08-01 2007-01-23 Microsoft Corporation System and method for scaling and repositioning drawings
US7119924B2 (en) * 2001-09-28 2006-10-10 Xerox Corporation Detection and segmentation of sweeps in color graphics images
US6983068B2 (en) * 2001-09-28 2006-01-03 Xerox Corporation Picture/graphics classification system and method
JP3823804B2 (ja) 2001-10-22 2006-09-20 ソニー株式会社 信号処理方法及び装置、信号処理プログラム、並びに記録媒体
JP3997749B2 (ja) * 2001-10-22 2007-10-24 ソニー株式会社 信号処理方法及び装置、信号処理プログラム、並びに記録媒体
JP3750583B2 (ja) * 2001-10-22 2006-03-01 ソニー株式会社 信号処理方法及び装置、並びに信号処理プログラム
US6996277B2 (en) * 2002-01-07 2006-02-07 Xerox Corporation Image type classification using color discreteness features
US6985628B2 (en) * 2002-01-07 2006-01-10 Xerox Corporation Image type classification using edge features
TWI281126B (en) * 2002-03-19 2007-05-11 Intervideo Digital Technology Image detection method based on region
US7221807B2 (en) * 2002-03-29 2007-05-22 Sharp Laboratories Of America, Inc. Methods and systems for digital image characteristic adjustment using a neural network
JP4439829B2 (ja) * 2003-03-11 2010-03-24 財団法人国際科学振興財団 データ分析装置およびデータ認識装置
US6961068B2 (en) * 2003-10-21 2005-11-01 Inventec Appliances Corporation Method for converting monochrome images
CN1918512B (zh) * 2003-12-19 2010-06-16 创新科技有限公司 具有音频解码和编码的数字静态照相机
JP4568732B2 (ja) * 2003-12-19 2010-10-27 クリエイティブ テクノロジー リミテッド デジタル画像を処理するための方法とそのシステム
JP4258385B2 (ja) * 2004-01-14 2009-04-30 株式会社デンソー 路面反射検出装置
US7596273B2 (en) * 2004-04-19 2009-09-29 Fujifilm Corporation Image processing method, image processing apparatus, and image processing program
US7424151B2 (en) * 2004-06-04 2008-09-09 Xerox Corporation Method and system for image classification and halftone frequency detection
JP2008510348A (ja) * 2004-08-13 2008-04-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ グラフィックとビデオとの混合シーケンスのための適応型分類システムおよびその方法
US7446914B2 (en) * 2005-03-16 2008-11-04 Kabushiki Kaisha Toshiba Image processing apparatus
JP2007067815A (ja) * 2005-08-31 2007-03-15 Olympus Imaging Corp 画像処理装置及び画像処理方法
DE102005047539A1 (de) * 2005-09-30 2007-04-05 Siemens Ag Bildverarbeitungsverfahren zur Fensterung und/oder Dosisregelung für medizinische Diagnostikeinrichtungen
US7946491B2 (en) * 2006-08-03 2011-05-24 Nokia Corporation Method, apparatus, and computer program product for providing a camera barcode reader
TWI373718B (en) * 2007-07-06 2012-10-01 Quanta Comp Inc Classifying method and classifying apparatus for digital image
US8260047B2 (en) * 2008-06-23 2012-09-04 Texas Instruments Incorporated System and method for determining high frequency content in an analog image source
JP4901821B2 (ja) * 2008-07-24 2012-03-21 株式会社東芝 画像処理装置および画像処理方法
JP5173873B2 (ja) * 2008-11-20 2013-04-03 キヤノン株式会社 画像符号化装置及びその制御方法
JP5116650B2 (ja) * 2008-12-10 2013-01-09 キヤノン株式会社 画像符号化装置及びその制御方法
US9092668B2 (en) * 2009-07-18 2015-07-28 ABBYY Development Identifying picture areas based on gradient image analysis
US9015093B1 (en) 2010-10-26 2015-04-21 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US8775341B1 (en) 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
WO2012136276A1 (en) * 2011-04-04 2012-10-11 Telefonaktiebolaget L M Ericsson (Publ) A method and a processor for texture compression
US9123137B2 (en) * 2011-10-27 2015-09-01 Toshiba Alpine Automotive Technology Corporation Motion vector computing device and motion vector computing method
CN103793916B (zh) * 2014-02-21 2016-06-29 武汉大学 一种hifu治疗中子宫肌瘤超声图像分割方法
CN107683469A (zh) * 2015-12-30 2018-02-09 中国科学院深圳先进技术研究院 一种基于深度学习的产品分类方法及装置
JP6705237B2 (ja) * 2016-03-18 2020-06-03 株式会社リコー 画像圧縮装置、画像形成装置、画像圧縮方法およびプログラム
US10380796B2 (en) * 2016-07-19 2019-08-13 Usens, Inc. Methods and systems for 3D contour recognition and 3D mesh generation
KR102621118B1 (ko) * 2018-11-01 2024-01-04 삼성전자주식회사 영상 적응적 양자화 테이블을 이용한 영상의 부호화 장치 및 방법
CN111046727B (zh) * 2019-10-31 2023-10-20 咪咕文化科技有限公司 视频特征提取方法及装置、电子设备及存储介质
CN111310769B (zh) * 2020-02-11 2023-04-18 青岛联合创智科技有限公司 一种图片线特征的提取方法
US11546617B2 (en) 2020-06-30 2023-01-03 At&T Mobility Ii Llc Separation of graphics from natural video in streaming video content
CN112598648B (zh) * 2020-12-24 2022-08-26 重庆邮电大学 一种基于图像梯度方向的图像接缝裁剪篡改检测方法
CN117036832B (zh) * 2023-10-09 2024-01-05 之江实验室 一种基于随机多尺度分块的图像分类方法、装置及介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59171260A (ja) * 1983-03-17 1984-09-27 Nippon Telegr & Teleph Corp <Ntt> カラ−フアクシミリ信号符号化方式
JPS60116081A (ja) * 1983-11-29 1985-06-22 Fujitsu Ltd 文字領域抽出回路
DE3650496T2 (de) * 1985-04-17 1996-10-31 Hitachi Ltd Bildverarbeitungsgerät
JPS61296481A (ja) * 1985-06-24 1986-12-27 Mitsubishi Electric Corp 文書読取装置
US5157743A (en) * 1987-10-28 1992-10-20 Canon Kabushiki Kaisha Image information coding apparatus
US5125045A (en) * 1987-11-20 1992-06-23 Hitachi, Ltd. Image processing system
US4991092A (en) * 1988-08-12 1991-02-05 The Regents Of The University Of California Image processor for enhancing contrast between subregions of a region of interest
JPH02253765A (ja) * 1989-03-28 1990-10-12 Toshiba Corp 画像処理装置
US5150432A (en) * 1990-03-26 1992-09-22 Kabushiki Kaisha Toshiba Apparatus for encoding/decoding video signals to improve quality of a specific region
EP0461817A3 (en) * 1990-06-15 1993-11-18 American Telephone & Telegraph Image segmenting apparatus and methods
US5617485A (en) * 1990-08-15 1997-04-01 Ricoh Company, Ltd. Image region segmentation system
JPH0772861B2 (ja) * 1990-08-24 1995-08-02 富士ゼロックス株式会社 プログラム作成装置
JPH04223552A (ja) * 1990-12-26 1992-08-13 Ricoh Co Ltd ミクストモード文書作成装置
KR930002349B1 (ko) * 1990-12-29 1993-03-29 주식회사 금성사 압축영상의 문자열 분리방법
JP2579397B2 (ja) * 1991-12-18 1997-02-05 インターナショナル・ビジネス・マシーンズ・コーポレイション 文書画像のレイアウトモデルを作成する方法及び装置
JPH0737087A (ja) * 1993-07-19 1995-02-07 Matsushita Electric Ind Co Ltd 画像処理装置
US5592572A (en) * 1993-11-05 1997-01-07 The United States Of America As Represented By The Department Of Health And Human Services Automated portrait/landscape mode detection on a binary image
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0902585A3 (en) * 1997-09-11 1999-12-08 Sharp Kabushiki Kaisha Method and apparatus for image processing
US7333662B2 (en) 2001-02-20 2008-02-19 Sanyo Electric Co., Ltd. Image coding and decoding using intermediate images
KR100750176B1 (ko) * 2005-11-01 2007-08-21 삼성전자주식회사 초정밀화를 이용한 양자화 아티팩트 제거 방법 및 시스템
KR100782848B1 (ko) * 2005-11-01 2007-12-06 삼성전자주식회사 디지털 이미지 처리 방법 및 그 시스템
KR101496422B1 (ko) * 2009-04-08 2015-02-27 뉴로우, 인코포레이티드 이미지 압축을 위한 시스템 및 방법
US9253505B2 (en) 2009-04-08 2016-02-02 Newrow, Inc. System and method for image compression
JP2019079347A (ja) * 2017-10-25 2019-05-23 ネットスマイル株式会社 文字種推定システム、文字種推定方法、および文字種推定プログラム
US11216747B2 (en) 2018-04-10 2022-01-04 Electronics And Telecommunications Research Institute Artificial intelligent system including pre-processing unit for selecting valid data
JP2020088740A (ja) * 2018-11-29 2020-06-04 ピクシブ株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Also Published As

Publication number Publication date
US5867593A (en) 1999-02-02
JP3373008B2 (ja) 2003-02-04

Similar Documents

Publication Publication Date Title
JP3373008B2 (ja) 画像像域分離装置
JP3353968B2 (ja) 画像処理装置
TWI426774B (zh) 用於針對jpeg壓縮歷史紀錄分類為壓縮影像的方法、及用於針對影像是否已經過jpeg壓縮而分類影像的設備及影像分類方法
US5872864A (en) Image processing apparatus for performing adaptive data processing in accordance with kind of image
JP4732660B2 (ja) ビジュアルアテンションシステム
US6556711B2 (en) Image processing apparatus and method
US6832006B2 (en) System and method for controlling image compression based on image emphasis
JP2800633B2 (ja) 画像符号化装置
EP1231565A1 (en) Image colour correction based on image pattern recognition, the image pattern including a reference colour
JP4459864B2 (ja) 画像分類及びハーフトーン周波数検出のための方法及びシステム
EP1168247A2 (en) Method for varying an image processing path based on image emphasis and appeal
JP2001223903A (ja) 走査された色付きおよびグレースケールの文書を圧縮する方法
JPH1153525A (ja) 顔器官検出装置及び媒体
JP4098021B2 (ja) シーン識別方法および装置ならびにプログラム
US7620246B2 (en) Method and apparatus for image processing
US5960119A (en) Method of and system for encoding digital images
Schettini et al. Automatic classification of digital photographs based on decision forests
JP2000013605A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP4217969B2 (ja) 画像処理装置及びプログラム
JPH0342969A (ja) カラー画像情報符号化方式
JP2721107B2 (ja) 映像特徴処理方法
JP3724525B2 (ja) 画像処理方法および画像処理装置
JP2000013612A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP3931468B2 (ja) 画像用領域分離装置および方法
JP3062224B2 (ja) 画像符号化方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20021105

LAPS Cancellation because of no payment of annual fees