JP2994437B2 - デジタル電子スチルカメラ及び画像属性判定方法 - Google Patents

デジタル電子スチルカメラ及び画像属性判定方法

Info

Publication number
JP2994437B2
JP2994437B2 JP16919490A JP16919490A JP2994437B2 JP 2994437 B2 JP2994437 B2 JP 2994437B2 JP 16919490 A JP16919490 A JP 16919490A JP 16919490 A JP16919490 A JP 16919490A JP 2994437 B2 JP2994437 B2 JP 2994437B2
Authority
JP
Japan
Prior art keywords
image
dimensional
document
document image
still camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP16919490A
Other languages
English (en)
Other versions
JPH0457580A (ja
Inventor
宏樹 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP16919490A priority Critical patent/JP2994437B2/ja
Publication of JPH0457580A publication Critical patent/JPH0457580A/ja
Application granted granted Critical
Publication of JP2994437B2 publication Critical patent/JP2994437B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字画像と自然画像とを区別し、各画像デー
タに適した圧縮及び記録を行うデジタル電子スチルカメ
ラに関する。
(従来技術) 電子スチルカメラは、撮像光学系や固体撮像デバイス
を有するカメラ本体にメモリカードが着脱可能に接続さ
れ、撮像デバイスで撮像された静止画像を表わす画像情
報がこのメモリカードにデジタル信号の形で蓄積され
る。画像情報が記録されたメモリカードは電子スチルカ
メラから外されて再生装置に装填され、再生装置でメモ
リカードから読み出された静止画像はテレビ画面等に再
生される。また、メモリカードに蓄積された画像情報は
ハードディスク等の大容量記憶装置に転送されて電子ア
ルバムとして利用されたり、通信装置と接続され映像デ
ータ通信が実行される。現在実用段階にあるメモリカー
ドは、たとえば、SRAM半導体メモリを16Mbit程度に集積
したメモリカードである。このメモリカードに多数の静
止画像、音声を記録したいという要請から記録された情
報を圧縮する方式が開発されてきた。適応離散コサイン
変換(ADCT)方式は画像データ圧縮方式として現在標準
化されている基本方式である。
(発明が解決しようとする課題) しかしながら、このような電子スチルカメラを電子黒
板の代りとして、立体物を走査するスキャナとして用い
る場合、撮影される情報は文字が主体となる。これら文
字の画像を圧縮する際にも自然画像のデータに適用され
る圧縮方式をそのまゝ文字画像のデータに適用すること
となる。自然画像のデータに適用される圧縮方式は文字
画像の高い冗長性に対して効率が悪い圧縮となってい
る。当該カメラの記録媒体たるメモリカードに記録可能
な総情報量には上限があって限られていることからする
と、文字画像に対する圧縮効率が悪いためメモリカード
の容量を有効に利用することができなかった。
そこで本発明は文字画像を自然画像と区別し、文字画
像に対し文字認識処理を行い、文字情報に対する圧縮効
率を高め文字情報としての最小限の情報を記録媒体(メ
モリカード)に記録し記録媒体の容量を有効に利用でき
るデジタル電子スチルカメラ及び当該カメラにおける画
像を区別する方法を提供することを目的とする。
(課題を解決しようとする手段) 本発明は、上記目的を達成するため、請求項1に係る
発明は、被写体を撮像して画像信号に変換する撮像手段
と、前記画像信号を直交変換する直交変換手段と、前記
直交変換された変換成分のスペクトル成分分布に基づ
き、前記画像信号が文書画像または自然画像のいずれの
画像に属するかを判定する画像属性判定手段と、前記画
像属性判定手段によって前記画像信号が自然画像と判定
された際に、当該自然画像を多値データに圧縮する自然
画像圧縮手段と、前記画像属性判定手段によって前記画
像信号が文書画像と判定された際に、当該文書画像に対
して文字の認識処理を実行し、認識された文書画像の文
字データを符号化する文書画像圧縮手段と、前記自然画
像圧縮手段または文書画像圧縮手段で圧縮処理された画
像信号を格納する記録媒体と、を備えたものである。
また、請求項2に係る発明は、請求項1に記載の発明
において、前記直交変換手段は、前記撮像手段によって
撮像された画像信号で構成される1画面分の二次元空間
画像を所定のブロックに分割した分割二次元空間画像毎
に当該空間画像を直交変換し、前記画像属性判定手段
は、前記直交変換された変換成分のスペクトル成分分布
を特徴パラメータとして、前記画像信号が文書画像また
は自然画像のいずれの画像に属するかを判定するもので
ある。
また、請求項3に係る発明は、請求項2に記載の発明
において、前記画像属性判定手段は、前記各スペクトル
成分分布で構成される1画面分の二次元空間画像の直交
変換成分に関する周波数特性とあらかじめ設定された文
書画像に特有な周波数特性とを比較して、両者の類似度
を示す類似度係数を算出する類似度係数算出手段と、前
記類似度係数に基づいて、前記画像信号が文書画像また
は自然画像のいずれの画像に属するかを判定する画像種
判定手段と、を含むものである。
また、請求項4に係る発明は、請求項3に記載の発明
において、前記類似度係数は、前記文書画像特有な周波
数特性と前記1画面分の二次元空間画像の直交変換成分
たる各二次元周波数成分との自乗誤差和であることとし
た。
また、請求項5に係る発明は、請求項3に記載の発明
において、前記類似度係数は、前記文書画像特有な周波
数特性と前記1画面分の二次元空間画像の直交変換成分
たる各二次元周波数成分との絶対誤差和であることとし
た。
また、請求項6に係る発明は、請求項4または請求項
5に記載の発明において、前記画像種判定手段は、前記
自乗誤差和または前記絶対誤差和と予め設定した閾値と
の相違を検知する検知手段と、前記検知手段によって検
知された相異に基づいて、文書画像または自然画像のい
ずれかの画像を規定する画像規定手段と、を含むことと
した。
また、請求項7に係る発明は、請求項1〜請求項6の
いずれか1つに記載の発明において、前記直交変換は、
離散コサイン変換(DCT)であることとした。
また、請求項8に係る発明は、撮像されて得られる画
像信号で構成される一画面分の二次元画像を所定のブロ
ックに分割するブロック分割ステップと、前記ブロック
に分割した2次元空間画像毎に当該空間画像を直交変換
し、当該直交変換成分たるスペクトル成分分布を生成す
るスペクトル成分分布生成ステップと、前記各スペクト
ル成分分布で構成される1画面分の2次元空間画像の直
交変換成分に関する周波数特性と予め設定された文書画
像に特有な周波数特性とに基づいて、両者の類似度を示
す類似度係数を算出する類似度係数算出ステップと、前
記類似度係数の変動の態様に応じて、前記画像信号が文
書画像または自然画像のいずれの画像に属するかを判定
する画像判定ステップと、前記画像信号が文書画像と判
定された際に当該文書画像に対して文字の認識処理を実
行し、認識された文書画像の文字データを符号化する文
書画像符号化ステップと、符号化された符号化データを
記録媒体に記憶する記憶ステップと、を含むものであ
る。
また、請求項9に係る発明は、請求項8に記載の発明
において、前記類似度係数は、前記文書画像特有な周波
数特性と前記1画面分の二次元空間画像の直交変換成分
たる各二次元周波数成分との自乗誤差和であることとし
た。
また、請求項10に係る発明は、請求項8に記載の発明
において、前記類似度係数は、前記文書画像特有な周波
数特性と前記1画面分の二次元空間画像の直交変換成分
たる各二次元周波数成分との絶対誤差和であることとし
た。
また、請求項11に係る発明は、請求項9または請求項
10に記載の発明において、前記画像判定ステップは、前
記自乗誤差和または前記絶対誤差和と予め設定した閾値
との相違を検知するステップと、前記検知された相異に
基づいて、文書画像または自然画像のいずれかの画像を
規定するステップと、を含むこととした。
また、請求項12に係る発明は、請求項8〜請求項11の
いずれか1つに記載の発明において、前記直交変換は、
離散コサイン変換(DCT)であることとした。
(実施例) 第1図は本発明に係る実施例の機能ブロック図であ
る。1は電子スチルカメラの撮像レンズ、2は絞り、3
は撮像デバイスで、たとえば、CCDなどの固体撮像デバ
イスである。4は撮像デバイス3に接続され、その出力
5を入力して伝送3原色、輝度信号(Y)6、色差信号
(R−Y)7、(B−Y)8を生成する処理を実行する
処理回路である。9は処理回路4によって生成された輝
度信号(Y)6、色差信号(R−Y)7、(B−Y)8
の各信号をデジタル信号に変換するアナログ・デジタル
変換器、120はアナログ・デジタル変換器9に接続さ
れ、その出力123を記憶するフレームメモリ、10はフレ
ームメモリ120に接続され、その出力11に適応離散コサ
イン変換(ADCT、離散コサイン変換は以下DCTと略称す
る)方式による圧縮処理を実行する圧縮処理回路、12は
圧縮処理回路10の構成部で符号量または復号画像品質を
制御するためのパラメータである量子化の際のスケーリ
ングファクタを記憶するスケーリングファクタレジスタ
である。13はスケーリングファクタレジスタ12に記憶さ
れたスケーリングファクタによる制御の下に圧縮処理回
路10で生成された符号化(圧縮)画像データ14を入力す
るメモリカードインタフェース、15は当該インタフェー
ス13に接続されてその出力16が記録されるメモリカード
である。17はバス18にのっている圧縮処理回路10の出力
を受けて撮像デバイス駆動器19及び絞り駆動器110にそ
れぞれ駆動出力111及び112を供給する自動露出装置、11
3は圧縮処理回路10の出力18を受けて焦点駆動器114に駆
動出力115を供給する自動焦点装置である。焦点駆動器1
14は撮像レンス1を、絞り駆動器110は絞り2を、撮像
デバイス駆動器19は撮像デバイス3をそれぞれ駆動信号
116、117及び118によって駆動制御する。119はバス18を
介して各部間のデータ転送及び制御を実行するとともに
文書画像と判定されるデータに対し文字の認識を行い当
該認識に係る文字情報をメモリカードインタフェース13
に向けて出力する中央演算装置(CDU)を含む処理制御
装置である。121は特定の被写体が構成する像に対応す
る指令を操作者において入力する入力装置、たとえば、
キーマトリックスである。122は操作者が視認し得る表
示装置、たとえば、ファインダ装置である。この表示装
置には入力装置121から操作者において入力された指令
に対応する被写体が構成する特定像、たとえば、風景、
人の顔、文字画像などの中の風景、が表示される。125
はメモリカード15に記録される情報が文字情報か自然画
像情報かを識別する識別データを記録する識別領域であ
る。
このような構成の下の動作を説明する。電子スチルカ
メラの撮像レンズ1で把えられた被写体像は絞り2によ
りその光量が制御されて撮像デバイス3に結像される。
撮像デバイス3により光電変換された像信号5は処理回
路4に入力され、この処理回路4によって伝送3原色、
輝度信号(Y)6、色差信号(R−Y)7、(B−Y)
8が出力される。これらの出力6、7及び8はアナログ
・デジタル変換器9によって各出力においてデジタル信
号に変換されこのデジタル信号123はフレームメモリ120
に入力され格納されるとともにデータライン124を介し
て圧縮回路10に入力される。
自動露出、自動焦点制御用の露光は圧縮処理回路10の
バス18にのっている直流及び交流出力を用いて自動露
出、自動焦点の制御を行うことによって実行される。当
該直流成分を自動露出装置17で演算し、その出力である
自動露出データ111を撮像デバイス駆動器19に当該露出
データ112を絞り駆動器110にそれぞれ転送し、撮像デバ
イス駆動器19の出力118により撮像デバイス3を制御す
るとともに電子シャツタ制御を実行し、絞り駆動器110
の出力117により絞り2の制御を行い、適正露出の制御
を実行する。次の自動焦点は圧縮処理回路10の出力であ
るバス18にのっている交流成分(高周波成分)を自動焦
点装置113に入力する。自動焦点装置113により自動焦点
演算を実行し、その出力である自動焦点データ115を焦
点駆動器114に転送し、焦点駆動データ114の出力116に
より撮像レンス1の位置を制御し、撮像デバイス3にお
いて像の合焦に至らしめる。自動焦点装置113の演算
は、たとえば、山登り法のアルゴリズムによって実行さ
れる。この方法は画像の焦点が合ってくるにつれて、映
像信号の高周波成分が増加してくることに着目し、高周
波成分を1フィールド内で積分した値が最大になるよう
にフィードバックシステムが構成される。このように把
えられた被写体像の画像データは各変換過程を経て合焦
に到達した後にデジタル信号出力123はフレームメモリ1
20に記憶されるとともにデータライン124を介して圧縮
回路10に転送される。
圧縮処理回路10の構成は第2図に示される。20は入力
される画像データ11、123に対して8×8画素のブロッ
クを単位とした2次元の離散コサイン変換(DCT)を実
行する離散コサイン変換器、21は離散コサイン変換器20
の出力22を線形量子化する量子化器、23は異なった量子
化ステップサイズを設定した量子化マトリクスで、乗算
器24を介して量子化器21に接続されている。25はスケー
リングファクタでスケーリングファクタレジスタ12(第
1図)から出力されて乗算器24に入力される。28は量子
化器21の出力29をハフマン符号化するハフマン符号化
器、210はハフマン符号器28に接続され量子化器21の出
力29を符号化する際に参照される符号テーブルである。
このような構成の下で圧縮及び符号化は次のように実行
される。離散コサイン変換器20に入力された画像データ
であるデジタル信号11、123はこの変換器20により水平
・垂直方向とも直交変換効率から設定される所定の画素
(N画素)から成る小画像ブロック(N×N)に分割さ
れ、当該各ブロックについて二次元DCTが施され、DCT係
数が求められる。このとき、Nの大きさはDCTの変換効
率から8及び16に制定される。Nが大きくなるほど変換
効率は向上するが、その向上の傾向は飽和傾向を示すと
ともに演算規模の増大にしたがって装置規模が大きくな
るためである。本実施例ではNを8に設定することとす
る。8×8画素から構成される小ブロックごとに二次元
DCTが施され求められたDCT係数出力22を大きさが異なっ
た量子化ステップサイズを設定した量子化マトリクス23
を用いて量子化器21により線形量子化し量子化係数を求
める。量子化係数出力29は符号化テーブル210を用いて
ハフマン符号化される。
第3図は実画像を二次元DCTした例を示したものであ
る。同図(a)は一画面分の実画像61であり、矢印62で
示した囲まれた領域を二次元のDCTで変換する。同図
(b)はその拡大図であり、水平・垂直方向とも64画素
からなり、同図(a)に示す480×768画素で構成する1
画面分の実画像61を8×8画素で構成する64個の小ブロ
ックに分割した小ブロック実画像である。同図(c)は
同図(b)に示す小ブロック実画像63をDCTした時の当
該ブロックの変換係数の電力分布64を示している。当該
変換係数は縦及び横各軸で示す周波数成分の座標(横、
縦)における合成成分で二次元スペクトル成分を表現す
る。座標(0、0)における格子領域は変換係数電力の
大きい部分に相当し、座標(7、7)に向う格子領域ほ
ど電力成分が小さくなっていく。各小画像ブロックの局
所的な性質に依存して当該電力分布64は異なるが、一般
的には低い周波数領域に電力が集中する。第1図に示す
圧縮処理回路10に実画像61(第3図(a))が入力され
当該回路10において小画像ブロック63が生成され当該ブ
ロックごとにDCTされてそのDCT係数(電力)分布64が生
成される。
文字の集合として表現される文書画像を上述のDCTし
て得られる変換特性、すなわち二次元周波数特性は自然
画像に同変換を行って得られる、変換特性と異なる特性
を呈する。第4図に文書画像の変換特性を示す。同図の
横軸は当該変換における周波数領域で二次元周波数DC,A
C1,AC2,……,ACnであり、縦軸は1画面分の画像につい
て正規化したDCT係数である。Cは文書画像の二次元周
波数特性であり、Pは自然画像の当該特性である。文書
画像の当該特性Cは自然画像の当該特性Pに比し同図に
示されるように高域の正規化電力(正規化DCT係数)の
減衰が著しい様相を呈する。文書画像の当該特性Cは統
計的観点から標準的な特性が見いだされている。文書画
像の二次元周波数特性Cが呈するこのような特徴を利用
して文書画像と自然画像とのいずれかの画像において文
書画像か自然画像かを識別し、識別された文書画像につ
いて文字を認識する。当該識別及び実行するフローチャ
ートを第5図に示す。
次に第1図、第4図及び第5図を用いて当該識別及び
認識動作について第5図に示すフローチャートの手順に
したがって説明する。
第1図に示す自動焦点装置113はシステムが合焦に至
ると合焦指令信号をバス18を介して処理制御装置119に
転送する。当該信号を受けとった処理制御装置はその合
焦指令信号はバス18を介してフレームメモリ120及び圧
縮処理回路10に転送されフレームメモリ120に記憶され
た被写体像の合焦画像に相応する画像データが固定され
るとともにデータライン124を介して取り込まれたフレ
ームメモリ120で固定された画像データと同一のデータ
に対して上述のDCTを開始するよう圧縮処理回路101に指
令する。圧縮処理回路10は第4図に示す文書画像の二次
元周波数特性Cを得たときの二次元周波数列DC、AC1、A
C2、……、ACnにおいて当該入力画像データに対して上
述のDCTを開始する。(ステッフ51)。二次元周波数領
域を水平垂直平面で表現された場合(第3図(c))に
おける対角方向の合成周波数列である。このように圧縮
回路10において二次元DCTを施されて(ステップ51)に
生成されたDCT係数は第1図に示す処理制御装置119に転
送され1画面分についてDCT係数を正規化して正規化係
数を生成する。当該処理制御装置119は次の機能を有す
る。圧縮回路10によって生成されて圧縮に関与している
DCTの変換成分たるスペクトル成分(DCT係数)に基いて
設定される類似度係数の変動の態様に応じて、圧縮回路
10に入力された画像データが文書画像又は自然画像のい
ずれの画像に属するかを判定する機能、画像データが文
書画像と判定された際にこの文書画像に含まれる各文字
がいかなる文字であるかを認識する機能、認識された文
書画像の各文字データを符号化する機能、画像データで
構成される1画面分の二次元空間画像の直交変換分(DC
T係数)に関する周波数特性P(第4図)と文書画像に
特有な周波数特性C(同図)とを比較する機能、類似度
係数を文書画像特有な周波数特性Cから1画面分の二次
元空間画像の1画面分について正規化した二次元周波数
特性P(正規化DCT係数)を減じて得られる差の2乗総
和、すなわち、2乗誤差和Σ(C−P)又は絶対誤差
和Σ|C−P|として算出する機能、当該2乗誤差和又は絶
対誤差和とあらかじめ設定した閾値との相異を検知する
機能及び検知された相異に基づいて文書画像又は自然画
像のいずれかの画像を規定する機能。これらの機能が当
該処理制御装置119に含まれる中央演算装置(CPU)の制
御下においていわゆるコンピュータプログラムによって
実行され、メモカード15への圧縮データの記録が次の過
程で行われる。
第5図に示すステップ51で二次元DCTされ生成された
二次元DCT係数は前述したように処理制御装置119におい
て正規化される。当該正規化係数の周波数特性P(第4
図)と処理制御装置119にあらかじめ設定されている文
書画像の周波数特性C(同図)とを比較し(ステップ5
2)、類似度係数を算出する。類似度係数は文書画像特
有な正規化二次元DCT係数の周波数特性(第4図に示す
C)と1画面分の二次元空間画像の1画面分について正
規化した正規化2次元DCT係数の周波数特性(同図に示
すP)との2乗誤差和Σ(C−P)又は絶対誤差和Σ
|C−P|で定義する。当該和とあらかじめ設定した閾値と
の相異を検知する(ステップ53)。当該和が当該閾値
(TH)以上であるとき(フロー線54)は文書画像である
と判定される第1図に示すフレームメモリ120に蓄積さ
れている1画面分の文書画像データは順次当該処理制御
装置に転送され当該画像データについて文字の認識処理
が実行される(ステップ55)。文字の認識処理は第6図
に示す処理過程で実行される。同図において61は入力文
字、62は入力文字61を観測して電気信号に変換する観測
過程、64は観測過程62で得られた電気信号63に含まれる
雑音や歪成分の除去、あるいは、文字を読み取るうえで
必ずしも本質的でない冗長な成分を除去する前処理過程
である。66は前処理過程64を経た観測パターン65から文
字を読み取るうえで必要となる文字固有の特徴を抽出過
程、68は特徴抽出過程66で得られた特徴出力67をもとに
入力文字61が何という文字であるかを判定する識別過
程、69は識別過程68で判定された文字データである。観
測過程62で得られる文字信号63には様様な雑音、歪等の
変動成が重畳している。これらの変動成分には観測系に
依存するものと文字の生成過程(印刷、手書き)に依存
するものがある。これらの変動成分は前処理過程64にお
いて信号レベル補正、シェーディング補正等の補正技術
により、また帯域制限処理、正規化処理などの手段によ
って除去される。当該除去処理はそれに続く特徴抽出過
程66及び識別過程68を容易、かつ、安定に実行せしめる
ための処理である。前処理過程64を経た当該変動成分除
去信号は特徴抽出過程において入力文字61がいずれの文
字のカテゴリーに属するかを判定するうえで有効な特徴
が抽出される。識別過程68では特徴出力67にもとづいて
識別関数により入力文字61がいずれのカテゴリーに属す
るを決定し、決定された文字データ69を出力する。当該
文字データ69は符号化され(ステップ56)この符号化デ
ータはバス18(第1図)にのって文字情報としてメモリ
カードインターフェース13(同図)へ転送されその出力
16(同図)はメモリカード15(同図)に記憶される。
次に当該和が当該閾値(TH)に達しないとき(第5図
のフロー線56)は入力画像は自然画像であると判定され
る。第1図に示すフレームメモリ120に蓄積されている
1画面分の自然画データは順次同図に示す圧縮回路10に
転送され当該圧縮回路において当該画像データについて
DCTが施されてそのDCT係数は線形量子化され(ステップ
58)、当該量子化出力はハフマン符号化される(ステッ
プ57)。ハフマン符号化された符号化データ14(第1
図)は自然画像情報としてメモリインターフェース13
(同図)へ転送されその出力16(同図)はメモリカード
15(同図)に記憶される(ステップ60)。文書画像又は
自然画像が当該メモリカード15に記録される際、これら
各画像に施された圧縮処理の態様が識別され得る識別符
号を当該メモリカード15の同図に示す識別領域125に記
録する。文書画像に対しては文字データの符号化が、ま
た、自然画像に対しては適応DCTにそれに続く変換成分
であるDCT係数の符号化が、それぞれ圧縮処理として施
されたことが、当該カードの記録画像を再生する際に識
別されて、当該各圧縮処理に応じた伸長処理に対処でき
るようにするためである。尚、当該識別符号は当該処理
制御装置119で判定された画像態様が文字画像又は自然
画像のいずれに属する画像であるかが識別された際に生
成させた符号として構成することもできる。第1図に示
すフレームメモリ120に蓄積されている1画面分の画像
データについて圧縮方式を選択する判定処理が終了した
ら次に到来する画像データを当該フレームメモリに取り
込み合焦点でそのデータを固定し、同様の処理を行う。
以上は当該処理制御装置119の上述の各機能をいわゆる
コンピュータプログラムによるソフトウエアで実行する
方式である。
当該各機能をハードウエアで実現する方式について次
に説明する。第7図は第1図に示す実施例において当該
処理制御装置119がソフトウエア(コンピュータプログ
ラム)で実行している機能をハードウエアで実現する本
発明の他の実施例での構成を示したブロック図である。
第7図において71は画像データで構成される1画面分の
二次元空間画像の直交変換成分(DCT係数)に関する周
波数特性P(第4図)と文書画像に特有な周波数特性C
(同図)とを比較する比較器72は文書画像に特有な周波
数特性C(同図)をあらかじめ記憶しておく文書画像特
性テンプレート、当該比較器71と当該テンプレート72と
で周波数特性比較回路74を構成する。76は類似度係を文
書画像特有な周波数特性Cから1画面分の二次元空間画
像の1画面分について正規化した二次元周波数特性P
(正規化DCT係数)を減じて得られる差の2乗総和、す
なわち、2乗誤差和Σ(C−P)又は絶対誤差和Σ|C
−P|として算出する類似度係数算出回路、78は当該2乗
誤差和又は絶対誤差和とあらかじめ設定した閾値との相
異を検知する検知回路、710は検知された相異に基づい
て文書画像又は自然画像のいずれかの画像を規定する画
像規定回路、当該検知回路78及び当該規定回路710は画
像属性判定回路712を構成する。714は画像データが文書
画像と判定された際にこの文書画像に含まれる各文字が
いかなる文字であるかを認識する文字認識処理回路、71
6は認識された文書画像の各文字データを符号化する文
字データ符号化回路である。718は各回路間におけるデ
ータの転送及び制御を行う制御回路である。719は各部
に接続するバスである。このような構成におい第1図に
示すメモリカード15への圧縮データの記録が次の動作で
行われる。第5図に示すステップ51で二次元DCTされ生
成された二次元DCT係数は1画面分について正規化され
第4図に示す周波数特性Pを呈する。周波数特性比較回
路74は当該周波数特性P70を取り込みテンプレート72か
らおらかじめ設定されている文書画像の周波数特性C
(同図)を取り出し、比較器71により両特性(PとC)
が比較され(第5図ステップ52)、その比較データ75は
類似度係数算出回路76に転送され類似度係数が算出され
る。類似度係数は前述の定義により2乗誤差和Σ(C−
P)又は絶対誤差和Σ|C−P|である。当該類似度係数
77は画像属性判定回路712に出力されその検知回路78に
入力される。検知回路78は類似度係数たる当該和とあら
かじめ設定した閾値との相異を検知する(第5図ステッ
プ53)。検知出力79は規定回路710に入力される。規定
回路710は当該和が当該閾値(TH)以上であるとき(第
5図フメー線54)はDCTされた画像、すなわち、フレー
ムメモリ120(第1図)に蓄積されている画像を文書画
像であると規定する。画像属性判定回路711は規定回路7
10によって規定された規定信号711をフレームメモリ120
(第1図)に出力し当該メモリ120に蓄積されている1
画面分の文書画像データを順次文字認識回路714に転送
するよう指令するフレームメモリ120(同図)は1画面
分の文書画像データ720を文字認識処理回路714に転送す
る。当該処理回路714は画像属性判定回路712から認識処
理実行許可信号713を受けて当該文書画像データについ
て文字の認識処理を実行する(第5図ステップ55)。
文字の認識処理は前述したように第6図に示す処理過
程で実行される。認識された文字データ715は文字デー
タ符号化回路716に転送され符号化され(第5図ステッ
プ56)この符号化データ717は第1図に示すバス18にの
ってメモリインターフェース13(同図)に転送されその
出力16(同図)はメモリカード15(同図)に記憶され
る。
次に検知出力79において当該和が当該閾値(TH)に達
しないとき(第5図のフロー線56)は規定回路710は圧
縮処理回路10(第1図)によってDCTされた画像、すな
わち、フレームメモリ120(同図)に蓄積されている画
像を自然画像であると規定する。回路710によって規定
された規定信号711をフレームメモリ120(第1図)に出
力し当該メモリ120に蓄積されている1画面分の自然画
像データを順次同図に示す圧縮回路10に転送する。当該
圧縮回路において当該画像データについてDCTが施され
そのDCT係数は線形量子化され(第5図ステッテ58)、
当該量子化出力はハフマン符号化される(ステップ5
7)。ハフマン符号化された符号化データ14(第1図)
は自然画像としてメモリインターフェース13(同図)へ
転送されその出力16(第1図)はメモリカード15(同
図)に記憶される(ステップ60)。フレームメモリ120
(第1図)の1画面分の画像データの処理が終了した
ら、次の画像データを当該フレームメモリ120に取り込
み同様の処理を行う。
(発明の効果) 画像の圧縮画像データを記録媒体(メモリカード)に
記録するに際して、自然画像と文字画像とを識別して文
字画像の圧縮データを冗長がない圧縮データとして記録
できるので、一枚のメモリカードに記録できる文書画像
が増大し当該メモリカードのメモ容量の利用率が向上す
るという技術的効果を奏する。
【図面の簡単な説明】
第1図は本発明の実施例を示す機能ブロック図、第2図
は第1図の圧縮回路10の内部構成を示すブロック図、第
3図(a)は一画面分の実画像を示す図、同図(b)は
同図(a)の実画像中の矢印で示した分割小ブロック実
画像を拡大して示した図、同図(c)は同図(b)の実
画像を二次元DCTで変換した時の変換係数の電力分布を
示した図、第4図は文字画像の正規化DCT係数の二次元
周波数特性を示した図、第5図は本発明を実施する操作
手順を示すフローチャート図、第6図は文字認識処理過
程を示す図、第7図は第1図の中央演算装置(CPU)119
が行うプログラム機能をハードウエアで実現した本発明
の他の実施例を示す図である。 10……圧縮回路、13……メモリカードインターフェー
ス、15……メモリカード、18……バス、119……CPU、12
0……フレームメモリ、124……データライン、71……比
較器、72……テンプレート、74……周波数特性比較回
路、78……検知回路、710……画像規定回路、712画像属
性判定回路、714……文字認識処理回路、716……文字デ
ータ符号化回路、718……制御回路、719……バス。

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】被写体を撮像して画像信号に変換する撮像
    手段と、 前記画像信号を直交変換する直交変換手段と、 前記直交変換された変換成分のスペクトル成分分布に基
    づき、前記画像信号が文書画像または自然画像のいずれ
    の画像に属するかを判定する画像属性判定手段と、 前記画像属性判定手段によって前記画像信号が自然画像
    と判定された際に、当該自然画像を多値データに圧縮す
    る自然画像圧縮手段と、 前記画像属性判定手段によって前記画像信号が文書画像
    と判定された際に、当該文書画像に対して文字の認識処
    理を実行し、認識された文書画像の文字データを符号化
    する文書画像圧縮手段と、 前記自然画像圧縮手段または文書画像圧縮手段で圧縮処
    理された画像信号を格納する記録媒体と、 を備えたことを特徴とするデジタル電子スチルカメラ。
  2. 【請求項2】前記直交変換手段は、前記撮像手段によっ
    て撮像された画像信号で構成される1画面分の二次元空
    間画像を所定のブロックに分割した分割二次元空間画像
    毎に当該空間画像を直交変換し、 前記画像属性判定手段は、前記直交変換された変換成分
    のスペクトル成分分布を特徴パラメータとして、前記画
    像信号が文書画像または自然画像のいずれの画像に属す
    るかを判定することを特徴とする請求項1に記載のデジ
    タル電子スチルカメラ。
  3. 【請求項3】前記画像属性判定手段は、 前記各スペクトル成分分布で構成される1画面分の二次
    元空間画像の直交変換成分に関する周波数特性とあらか
    じめ設定された文書画像に特有な周波数特性とを比較し
    て、両者の類似度を示す類似度係数を算出する類似度係
    数算出手段と、 前記類似度係数に基づいて、前記画像信号が文書画像ま
    たは自然画像のいずれの画像に属するかを判定する画像
    種判定手段と、 を含むことを特徴とする請求項2に記載のデジタル電子
    スチルカメラ。
  4. 【請求項4】前記類似度係数は、前記文書画像特有な周
    波数特性と前記1画面分の二次元空間画像の直交変換成
    分たる各二次元周波数成分との自乗誤差和であることを
    特徴とする請求項3に記載のデジタル電子スチルカメ
    ラ。
  5. 【請求項5】前記類似度係数は、前記文書画像特有な周
    波数特性と前記1画面分の二次元空間画像の直交変換成
    分たる各二次元周波数成分との絶対誤差和であることを
    特徴とする請求項3に記載のデジタル電子スチルカメ
    ラ。
  6. 【請求項6】前記画像種判定手段は、 前記自乗誤差和または前記絶対誤差和と予め設定した閾
    値との相違を検知する検知手段と、 前記検知手段によって検知された相異に基づいて、文書
    画像または自然画像のいずれかの画像を規定する画像規
    定手段と、 を含むことを特徴とする請求項4または請求項5に記載
    のデジタル電子スチルカメラ。
  7. 【請求項7】前記直交変換は、離散コサイン変換(DC
    T)であることを特徴とする請求項1〜請求項6のいず
    れか1つに記載のデジタル電子スチルカメラ。
  8. 【請求項8】撮像されて得られる画像信号で構成される
    一画面分の二次元画像を所定のブロックに分割するブロ
    ック分割ステップと、 前記ブロックに分割した2次元空間画像毎に当該空間画
    像を直交変換し、当該直交変換成分たるスペクトル成分
    分布を生成するスペクトル成分分布生成ステップと、 前記各スペクトル成分分布で構成される1画面分の2次
    元空間画像の直交変換成分に関する周波数特性と予め設
    定された文書画像に特有な周波数特性とに基づいて、両
    者の類似度を示す類似度係数を算出する類似度係数算出
    ステップと、 前記類似度係数の変動の態様に応じて、前記画像信号が
    文書画像または自然画像のいずれの画像に属するかを判
    定する画像判定ステップと、 前記画像信号が文書画像と判定された際に当該文書画像
    に対して文字の認識処理を実行し、認識された文書画像
    の文字データを符号化する文書画像符号化ステップと、 符号化された符号化データを記録媒体に記憶する記憶ス
    テップと、 を含むことを特徴とするデジタル電子スチルカメラによ
    る画像属性判定方法。
  9. 【請求項9】前記類似度係数は、前記文書画像特有な周
    波数特性と前記1画面分の二次元空間画像の直交変換成
    分たる各二次元周波数成分との自乗誤差和であることを
    特徴とする請求項8に記載のデジタル電子スチルカメラ
    による画像属性判定方法。
  10. 【請求項10】前記類似度係数は、前記文書画像特有な
    周波数特性と前記1画面分の二次元空間画像の直交変換
    成分たる各二次元周波数成分との絶対誤差和であること
    を特徴とする請求項8に記載のデジタル電子スチルカメ
    ラによる画像属性判定方法。
  11. 【請求項11】前記画像判定ステップは、 前記自乗誤差和または前記絶対誤差和と予め設定した閾
    値との相違を検知するステップと、 前記検知された相異に基づいて、文書画像または自然画
    像のいずれかの画像を規定するステップと、 を含むことを特徴とする請求項9または請求項10に記載
    のデジタル電子スチルカメラによる画像属性判定方法。
  12. 【請求項12】前記直交変換は、離散コサイン変換(DC
    T)であることを特徴とする請求項8〜請求項11のいず
    れか1つに記載のデジタル電子スチルカメラによる画像
    属性判定方法。
JP16919490A 1990-06-27 1990-06-27 デジタル電子スチルカメラ及び画像属性判定方法 Expired - Lifetime JP2994437B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16919490A JP2994437B2 (ja) 1990-06-27 1990-06-27 デジタル電子スチルカメラ及び画像属性判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16919490A JP2994437B2 (ja) 1990-06-27 1990-06-27 デジタル電子スチルカメラ及び画像属性判定方法

Publications (2)

Publication Number Publication Date
JPH0457580A JPH0457580A (ja) 1992-02-25
JP2994437B2 true JP2994437B2 (ja) 1999-12-27

Family

ID=15881964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16919490A Expired - Lifetime JP2994437B2 (ja) 1990-06-27 1990-06-27 デジタル電子スチルカメラ及び画像属性判定方法

Country Status (1)

Country Link
JP (1) JP2994437B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3337798B2 (ja) * 1993-12-24 2002-10-21 キヤノン株式会社 画像データ及び音声データを処理する装置、データ処理装置並びにデータ処理方法

Also Published As

Publication number Publication date
JPH0457580A (ja) 1992-02-25

Similar Documents

Publication Publication Date Title
JP2876258B2 (ja) デジタル電子スチルカメラ
US8115821B2 (en) Method and apparatus for setting a region of interest in image data
JP2670201B2 (ja) 画像データ圧縮符号化装置および方法
JP4350809B2 (ja) ディジタルカメラ
US5335016A (en) Image data compressing/coding apparatus
CN100405824C (zh) 摄像***和播放***
JP3789836B2 (ja) 画像符号化装置および方法
JPH0832037B2 (ja) 画像データ圧縮装置
JP2994437B2 (ja) デジタル電子スチルカメラ及び画像属性判定方法
JP3335236B2 (ja) デジタルデータ処理装置
JP2000209590A (ja) 画像符号化装置及び方法、記憶媒体並びに撮像装置
JPH02105679A (ja) ディジタル画像記録再生装置
JPH07312751A (ja) 画像データ圧縮符号化方法および装置
JP3398343B2 (ja) 埋め込み装置、デジタルカメラ及び記録媒体
JP4430731B2 (ja) ディジタルカメラおよび撮影方法
KR100792247B1 (ko) 이미지 데이터 처리 시스템 및 그 방법
JP2000059612A (ja) 画像処理装置及びその方法
JP2994421B2 (ja) デジタル電子スチルカメラ
JP3144727B2 (ja) ディジタル電子スチルカメラ
JP3033970B2 (ja) デジタル電子スチルカメラ
JP7259280B2 (ja) 符号化装置、符号化方法及び符号化プログラム
JP3306201B2 (ja) データ圧縮装置
JP3227213B2 (ja) 撮像方法及び装置
JP4143535B2 (ja) 画像データ処理装置、画像データ処理方法、画像データ配信装置および画像データ伝送システム
JPH0752951B2 (ja) 画像データ圧縮処理方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071022

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091022

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101022

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101022

Year of fee payment: 11