JP2010027051A - 画像圧縮装置および画像圧縮方法 - Google Patents

画像圧縮装置および画像圧縮方法 Download PDF

Info

Publication number
JP2010027051A
JP2010027051A JP2009162958A JP2009162958A JP2010027051A JP 2010027051 A JP2010027051 A JP 2010027051A JP 2009162958 A JP2009162958 A JP 2009162958A JP 2009162958 A JP2009162958 A JP 2009162958A JP 2010027051 A JP2010027051 A JP 2010027051A
Authority
JP
Japan
Prior art keywords
image
dictionary
unit
information
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009162958A
Other languages
English (en)
Inventor
Atsushi Tabata
淳 田畑
Masaaki Yasunaga
真明 安永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba TEC Corp
Original Assignee
Toshiba Corp
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba TEC Corp filed Critical Toshiba Corp
Publication of JP2010027051A publication Critical patent/JP2010027051A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】辞書化方式による画像圧縮処理を高速化することができる画像圧縮装置および画像圧縮方法を提供する。
【解決手段】入力した画像を解析してオブジェクト配置情報と頁属性情報を出力する解析部12と、オブジェクト配置情報に基いて画像を部品化して部品画像を出力する部品化部13と、既にある画像辞書の中から頁属性情報に対応する画像辞書を選び、選ばれた画像辞書と部品画像を比較して対応する画像辞書を決定し、決定した画像辞書と辞書インデックスを出力する辞書化部と、画像辞書と辞書インデックスを符号化する符号化部15をもつ画像圧縮装置。
【選択図】図1

Description

本発明は、画像情報からオブジェクト配置情報と頁属性情報を抽出し、これらに基いて画像圧縮する画像圧縮装置および画像圧縮方法に関する。
従来から、2値画像を効率良く圧縮するために、画像ビットマップを辞書化して、インデックス(該当辞書番号とその配置)と辞書を圧縮データとする方式を標準化した技術としてJPEG2が知られている。JPEG2では、圧縮率を上げるため、例えば編み点文字を構成する、形状情報(位置含む)と網点情報に基づいて、それぞれ対となる別の符号化手段で符号化する構成が示されている。
画像情報は大容量となるため、一般に圧縮を行い保存・使用している。通常、文字画像などは2値化して可逆圧縮、写真などは多値の非可逆圧縮を行っている。
しかしながら、2値文字画像に関しても非可逆で圧縮する方式が提案され、ISO/IEC14492(JPEG2)として標準化されている。
この方式の特徴的な点は、文書画像などは同一文字が多く出現することから、文字のビットマップ画像を辞書化することによって、同じ文字はビットマップでなく、辞書インデックスと画像上の位置情報で表現することで、圧縮対象のビットマップ量を減らして圧縮する点である。このような圧縮技術に関し、例えば以下のような特許文献が知られている。
特許文献1(特開2006−254329)は、単純な線描画文字だけでなく、ハーフトーンなどのパターンで表現された文字も効率良く圧縮するように、文字を構成する形状情報とそのパターン情報に分離して圧縮することで、パターン表現された文字等を効率よく圧縮する方式を開示している。
特許文献2(特開2007−174008)は、画像を文字や写真領域を識別し、それぞれに適した圧縮を適用する方式において、文字領域の圧縮に辞書方式の圧縮を用いる例が開示されており、辞書圧縮前に入力された文字領域のデータから非テキストとみなせる情報を辞書化圧縮対象から除外することで、高速に圧縮する方法を開示している。
特許文献3(特開2005−301663)は、OCR(Optical Character Recognition)で取得した文字単位を元にビットマップ辞書化の単位を設定し、必要以上に画像が部品化されることを防ぐ技術を開示している。
しかしこれら特許文献1乃至3の従来技術においては、部品画像のマッチング処理において、様々な文書フォーマットやフォント種類をもった文書の頁属性情報を考慮しておらず、効率的な画像辞書の探索・登録を行なっていないという問題がある。
本発明は、辞書化方式による画像圧縮処理を高速化することができる画像圧縮装置および画像圧縮方法を提供することを目的とする。
課題を解決する一実施形態は、
入力した画像を解析してオブジェクト配置情報と頁属性情報を出力する解析部と、
前記オブジェクト配置情報に基いて、前記画像を部品化して、部品画像を出力する部品化部と、
既にある画像辞書の中から前記解析部からの前記頁属性情報に対応する画像辞書を選び、前記選ばれた画像辞書と前記部品化部からの前記部品画像を比較して対応する画像辞書を決定し、前記決定した画像辞書と前記部品画像の辞書インデックスを出力する辞書化部と、
前記選択された画像辞書と前記辞書インデックスを符号化する符号化部と、
を具備することを特徴とする画像圧縮装置である。
画像圧縮処理を行なう際の部品画像と画像辞書のマッチング処理において、圧縮しようとする画像の頁属性情報(例えば文書、プレゼン、地図等)に対応する画像辞書を優先し対応しない画像辞書は排除するなどして、マッチング処理を効率化する。これにより、画像圧縮処理を高速化することができる。
本発明の第1実施形態の画像圧縮装置の構成の一例を示すブロック図。 当該画像圧縮装置のレイアウト解析部の構成の一例を示すブロック図。 当該画像圧縮装置のレイアウト解析部の動作の一例を説明する説明図。 当該画像圧縮装置の頁属性判定部の構成の一例を示すブロック図。 当該画像圧縮装置の頁判定データの一例の説明図。 当該画像圧縮装置の画像部品化部の構成の一例を示すブロック図。 当該画像圧縮装置の画像部品化部の動作の一例を説明する説明図。 当該画像圧縮装置の画像辞書化部の構成の一例を示すブロック図。 当該画像圧縮装置の画像辞書化部の動作の一例を説明する説明図。 第1実施形態の変形例である画像圧縮装置の構成を示すブロック図。 当該画像圧縮装置のレイアウト解析部の構成の一例を示すブロック図。 当該画像圧縮装置の頁属性判定部の構成の一例を示すブロック図。 当該画像圧縮装置のための傾き計算補助図の一例を示す説明図。 当該画像圧縮装置の頁判定データの一例の説明図。 当該画像圧縮装置の画像辞書化部の構成の一例を示すブロック図。 本発明の第2実施形態の画像圧縮装置の構成の一例を示すブロック図。 当該画像圧縮装置の文字処理部の構成の一例を示すブロック図。 本発明の第3実施形態の画像圧縮装置の構成の一例を示すブロック図。 当該画像圧縮装置の画像辞書化部の構成の一例を示すブロック図。 当該画像圧縮装置の辞書の探索順序入れ替え効果を説明する説明図。 当該画像圧縮装置の画像辞書化部の構成の一例を示すブロック図。 当該画像圧縮装置のビットマップカウント部の働きを説明する説明図。
以下、この発明の実施の形態について図面を参照して詳細に説明する。
本発明の要旨は、入力された画像から頁属性情報を抽出し、画像を部品化して複数の画像辞書に辞書化すると共に、抽出した頁属性情報に基づいて複数の画像辞書から一つを選択することで、辞書マッチング処理を効率化して迅速な圧縮処理を実現する画像圧縮装置および画像圧縮方法である。
このような構成をとることにより、属性に適応した辞書を生成するため、辞書の作成が高速で圧縮率も高い辞書およびインデックス方式の圧縮ファイルを生成することができる。
なお、辞書の切り替え情報はレイアウト解析部以外にも、原稿モード等のユーザー指示手段を用いて辞書を切り替えることも可能である。また切り替え方法も頁単位でなく、頁内のオブジェクト単位で切り替えることも可能である。
また、この辞書の切り替え(選択)は、頁単位毎、地図等の原稿種別の頁情報毎、スキュー角度、天地等の頁単位の原稿方向情報毎、文字情報毎に行なうことも可能であり、それぞれ、高速・高圧縮な辞書圧縮ファイルを生成することができる。
(第1実施形態)
図1は、本発明の第1実施形態の画像圧縮装置の構成の一例を示すブロック図である。本発明の一実施形態に係る画像圧縮装置1は、全体の動作を制御する制御部10と、原稿画像を読み取るスキャナ11と、スキャナ11から画像信号m1が供給されるレイアウト解析部12と、スキャナ11から画像信号m1が供給されレイアウト解析部12からオブジェクト配置情報m2が供給される画像部品化部13を有する。さらに、画像圧縮装置1は、レイアウト解析部12から頁属性情報m3を受け画像部品化部13から部品画像m4を受ける画像辞書化部14と、画像辞書化部14から画像辞書信号m5と辞書インデックスm6が供給される画像符号化部15と、画像符号化部15から符号データm7が供給される記憶部16と、記憶部16の後段に設けられたインターフェース部17を有している。
このような構成をもつ画像圧縮装置1において、以下に動作を説明すると、スキャナ11から入力された画像信号m1はレイアウト解析部12に供給され、レイアウト解析部12では、供給された画像信号m1を既知のレイアウト解析技術により処理することで、オブジェクト配置情報m2と頁属性情報m3を出力する。画像部品化部13は、供給された画像信号m1とオブジェクト配置情報m2を用いて、部品画像m4を出力する。
画像辞書化部14は、部品画像m4を既知のビットマップ辞書化技術と頁属性情報m3を用いて、画像辞書m5と辞書インデックスm6を出力する。画像符号化部15は、これらの信号を受けて符号データm7を生成し、記憶部16に格納する。
図2は、当該画像圧縮装置のレイアウト解析部の構成の一例を示すブロック図である。レイアウト解析部12は、図2に示すように、画像信号m1を受ける縮小処理部21と、縮小処理部21から縮小画像信号m11が供給される連結画素探索部22と、連結画素探索部22から領域の左上座標、左下座標、右上座標、右下座標である領域情報m12を受ける領域座標変換部23と、同じく領域情報m12を受ける頁属性判定部24と、頁属性判定部24に接続されるテーブル25を有している。
このような構成をもつレイアウト解析部12において、縮小処理部21は、画像信号m1を受けると既定の縮小率で縮小し、縮小画像信号m11を出力する。連結画素探索部22は、既知のチェインアルゴリズムで8方向探索して、画素の連結した領域の左上座標、左下座標、右上座標、右下座標である領域情報m12を出力する。ここで、領域情報m12の座標は、縮小処理部21で縮小処理した座標系であるので、画像信号m1と同じ座標系に領域座標変換部23で変換し、オブジェクト配置情報m2として出力する。一方、頁属性判定部24は、頁内の領域情報m12を集計し、テーブル25から読み出した頁判定データm13と比較して、頁属性情報m3を出力する。
ここで、頁属性判定部24の動作を除いたレイアウト解析部12の動作例を図3に示す。 画像信号m1を縮小処理して得た縮小画像m11では、文字等は連結した画素になることがわかる。この画像に対して既知のチェインアルゴリズムを用いて、連結した領域を算出すると、領域情報m12の点線で示したような各固まり毎の複数の領域が算出される。そして、領域座標変換部23は、領域情報m12を受けて、座標系を縮小前に戻したオブジェクト配置情報m2を算出する。
次に、図4は、当該画像圧縮装置の頁属性判定部の構成の一例を示すブロック図である。頁属性判定部24は、領域情報m12が供給される領域傾き算出部31と、同じく領域情報m12が供給される領域距離算出部32と、領域傾き算出部31から傾き情報m21が供給され領域距離算出部32から距離情報m22が供給される判断部33を有している。
このような構成をもつ頁属性判定部24において、領域傾き算出部31は、領域情報m12を用いて、各領域毎の傾き=MAX(|左上X座標−左下X座標|、|左上Y座標−右上Y座標|)を計算して求め、頁内の全領域の傾きの平均を傾き情報m21として算出する。
また、領域距離算出部32は、各領域のセンター座標を求め、各センター座標毎に最も近いセンター座標を持つ領域ペア(下記でP1及びP2を求め、
各領域毎の距離=MIN(|P1のX座標−P2のX座標|、|P1のY座標−P2のY座標|)
を求めることで、頁内のペアの平均を距離情報m22として算出する。
判断部33は、傾き情報m21と距離情報m22を受け取り、テーブル25から図5に示すような頁判定データm13を読み込む。判断部33は、傾き情報m21と距離情報m22を所定の閾値と比較した結果と頁判定データm13に基づいて原稿タイプを決定し、頁属性情報m3として出力する。
次に、図6は、当該画像圧縮装置の画像部品化部の構成の一例を示すブロック図である。画像部品化部13は、図6に示すように、画像信号m1とオブジェクト配置情報m2がそれぞれ供給される縦方向画素カウント部41と横方向画素カウント部42と、縦方向画素カウント部41からの縦方向の射影m31と横方向画素カウント部42からの横方向の射影m32が供給される比較器43と、同じく縦方向画素カウント部41からの縦方向の射影m31と横方向画素カウント部42からの横方向の射影m32と比較器43からの制御信号m33が供給される選択部44と、選択部44からの選択信号m34と画像信号m1が供給される画素分割部45を有している。
このような構成をもつ画像部品化部13において、縦方向画素カウント部41は、オブジェクト配置情報m2の座標単位で画像信号m1を分割して、縦軸への画素カウントの射影を縦方向の射影m31として出力する。また、横方向画素カウント部42も、オブジェクト配置情報m2の座標単位で画像信号m1を分割して、横軸への画素カウントの射影を横方向の射影m32として比較器43に出力する。比較器43は、選択部44が射影値の分散の大きいほうを選択するような制御信号m33を選択部44に出力する。選択部44は、射影値の分散の大きいほうを選択する選択信号m34を画素分割部45に供給する。画素分割部45は、選択された射影値を用いて、画像信号m1を分割して部品画像m4を出力する。
これらの動作を図7を用いて説明する。図7は、当該画像圧縮装置の画像部品化部の動作の一例を説明する説明図である。比較器43では、縦方向の射影m31と横方向の射影m32を比較し、分散の大きい横方向の射影をする。画素分割部45で、射影に対して閾値処理を行うことで、横方向の分割座標を算出し(点線)、図7で○で示された単位により部品画像として出力する。
つぎに、図8は、当該画像圧縮装置の画像辞書化部の構成の一例を示すブロック図である。画像辞書化部14は、図5で示した頁属性情報m3に対応する文書辞書53、プレゼン辞書52、地図辞書51、非文書辞書50を有しており、さらに、頁属性情報m3が供給され各辞書を選択する選択部55と、選択部55により選択された辞書が接続され、部品画像m4が供給され画像辞書信号m5と辞書インデックスm6を出力するマッチング部54を有している。
このような構成をもつ画像辞書化部14において、選択部55は、頁属性情報m3に従って文書辞書53、プレゼン辞書52、地図辞書51、非文書辞書50のうちの適切な辞書を選択出力する。マッチング部54は、既知の位置シフトとマッチング処理を組み合せにより、部品画像m4が、選択部55により選択された辞書に存在するかどうかを判断し、存在すれば、その辞書インデックスm6を出力する。辞書インデックスm6は、対応辞書名と辞書のインデックスと画像上の部品画像の位置情報である。
マッチング部54は、対応するビットマップパターンが辞書に無ければ、その部品画像m4を現在選択されている辞書に登録してインデックスを付与する。マッチング部54は、スキャナ11から入力された全原稿に関して、上記のマッチング処理が終了すれば、各辞書データを画像辞書m5として出力する。そして、画像符号化部15は、画像辞書m5を既知の画像圧縮技術(例えばランレングス)で圧縮し、符号データm7として、辞書インデックスm6と一緒にて出力する。
次に、本発明による特徴的な辞書の効果を図9を用いて説明する。一般に、複数の枚数の文書をスキャンすると、図9に示すように一般文書やプレゼン用のドキュメント、図3で示した地図など、原稿のタイプが異なる文書が混在することがある。これらの文書では、各文書タイプ毎には同一種のフォントデザインやサイズが使われている可能性が高いが、文書タイプが異なるとデザインやサイズが異なる可能性が高い。
一般的には、これらの辞書データをまとめて一つの辞書に登録し、検索及びマッチングを行なう。しかし、上述した本発明に係る実施形態においては、辞書データを原稿タイプ毎に複数の辞書として辞書化し、辞書を使用する際に、頁属性情報に従って適切な辞書を選択し切り替えて、検索、マッチングを行う。これにより、頁属性情報に対応しない不適切な辞書を検索・マッチングの対象としないため、辞書マッチングを効率的に高速に行なうことができる。すなわち、文書画像をマッチングする場合、文書辞書を選択し、プレゼン辞書、地図辞書、非文書辞書を使用しないことで、効率的で高速な辞書マッチングを行なうことができる。
また、マッチング部54でマッチング精度を緩めれば、非可逆で辞書ビットマップの圧縮ファイルが作成されるが、様々なフォントデザインを一つの辞書で管理する方式では、画質とマッチング精度の制御が難しい。しかしながら、本発明の方法のように原稿タイプ毎に辞書を切り替えれば、同一フォントデザイン群内でマッチングが行われる確率が高いので、画質低下を抑えつつマッチング精度を緩めることができるので、従来よりも圧縮率の高い辞書ビットマップ圧縮ファイルを提供することができる。
なおレイアウト解析方法や、そこから算出される頁情報、辞書化や圧縮方法等や、辞書の切り替え方法は、上述した実施形態に限定されるものではなく、本発明の実施可能な範囲は当業者が想到する範囲に及ぶものである。
(第1実施形態の変形例)
次に、本発明の第1実施形態の変形例について以下に図面を用いて詳細に説明する。図10は、第1実施形態の変形例である画像圧縮装置の構成を示すブロック図である。
第1実施形態の変形例は、(領域距離を考慮せずに)領域傾きのみから頁属性情報m3を決定し、決定した頁属性情報m3により辞書を生成し選択する画像圧縮装置および画像圧縮方法を提供する。第1実施形態の変形例は、基本的に第1実施形態と同様の処理部は同一番号を付与しており、レイアウト解析部12’、その頁属性情報m3’、それを元に辞書化を行う画像辞書化部14’が若干異なる以外は同一であるので、変更ブロックのみを説明する。
レイアウト解析部12’の構成は、図11に示す通りであり、第1実施形態との違いは頁属性判定部24’のテーブル25’、頁判定データm13、および頁属性判定部24’の構成、生成される頁属性情報m3’が異なる。
また、頁属性判定部24’の構成を図12に示す。第1実施形態の変形例の頁属性判定部24’と第1実施形態の頁属性判定部24との構成上の相違は、第1実施形態の変形例の頁属性判定部24’が、領域距離算出部32を用いることなく、領域傾き算出部31’のみにより傾き角度m21’と傾き分散m22’を出力することである。
傾き角度m21’は、例えば図13の様に傾きを定義し、簡易的に以下の式で算出する。
if((左上Y座標−右上Y座標)>0){
θ=atan((右下Y座標−左下Y座標)/(右下X座標−左下X座標))

else{
θ=atan((右上Y座標−左上Y座標)/(右上X座標−左上X座標))

縮小処理部21は、傾き角度m21’としてこれらθの平均値を出力し、傾き分散m22’として同分散を出力する。
図14は、当該画像圧縮装置の頁判定データの一例の説明図である。判断部33は、第1実施形態と同様に、図14に示す頁判定データm13を用いて、傾き角度m21’の範囲と傾き分散m22’を閾値と比較した分散の大きさから、角度カテゴリーとして、標準、プラス角度、マイナス角度、特別の4種のカテゴリーに分類して頁属性情報m3’を出力する。ここで特別のカテゴリーは第1実施形態で例示したような地図原稿の場合、領域に角度があるがスキューによる角度ではない可能性が高いカテゴリーも存在するためである。
図15は、画像辞書化部の構成の一例を示すブロック図である。第1実施形態の変形例の画像辞書化部14’は、図14の角度カテゴリーに対応した辞書を有していることが特徴であり、標準辞書56と、プラス角度辞書57と、マイナス角度辞書58と、特別辞書59と、これらの辞書が接続され頁属性情報m3が供給される選択部55と、選択部55により選択された辞書が接続されるマッチング部54を有している。
一般に複数の原稿画像の入力処理を行なうと、入力コンディションにより原稿の方向が若干傾いて入力される可能性があり、この角度をスキューと呼ぶ。またスキューだけでなく原稿の向き(上下逆さま、90度方向違い)なども混在して入力されることがある。
通常、このような条件は画像の頁全体で共通の性質であるが、単純に辞書化を行うと正しく入力されれば同一の文字であっても、スキューによって別々の文字と判別され辞書化されてしまう。そのため辞書化に当たっては、検索対象の文字ビットマップが増大し検索に時間が掛かってしまう。
第1実施形態の変形例の構成を取ることにより、原稿全体の方向依存による歪みに対しても、高速に辞書化処理を行うことができる。また、各角度毎にマッチング対象のデータがそろっているので、辞書マッチング精度を緩めても第1実施形態同様、画質低下を抑制した高圧縮な辞書ビットマップ圧縮ファイルを提供することができる。
また、スキューに対しては角度を補正後一律に処理することも考えられるが、補正により角度は直ってもビットマップが微妙に崩れる可能性があり、スキュー補正を行った画像に対しても同様に効果が得られる。
また、この実施形態の更なる変形例としては、レイアウト解析部12’で、頁単位でなく領域毎に種別を特定し、その領域毎の種別ごとに辞書を切り替える構成を取ることで、より細かな辞書化制御が可能となる。例えば、文書領域とグラフや表領域では、使用するフォントデザインが異なる可能性があるので、領域毎の種別毎に辞書を切り替えることでより高速な辞書マッチング処理が可能となる。
(第2実施形態)
第2実施形態は、レイアウト解析部の代わりに文字処理部18を使用し、オブジェクト配置情報m2’と文字情報m3”を出力し、画像部品化部13で、より高精度な画像の部品化と画像辞書化部14において、文字の特徴に応じた辞書を適用して高速に辞書ビットマップ圧縮ファイルを作成することである。
図16は、本発明の第2実施形態の画像圧縮装置の構成の一例を示すブロック図である。本発明の第2実施形態の画像圧縮装置は、図16に示すように、基本的に第1実施形態と同様の処理部は同一番号を付与しており、文字処理部18が異なる以外は同一であるので、変更ブロックのみ説明する。
文字処理部18は、図17に示す構成を示している。すなわち、文字処理部18は、既知のOCR(Optical Character Recognition)を用いた文字認識部46と、文字認識部46から文字のコード情報m51が供給される言語判定部47を有している。文字処理部18は、画像信号m1を受けて特許文献3の様に文字単位の情報としてオブジェクト配置情報m2’を出力する。また、言語判定部47は、文字処理部18からコード情報m51を受けると、処理中の文字が英語か日本語かその他の言語種別情報を判断して文字情報m3”を出力する。
画像部品化部13は、文字処理部18から文字単位の情報としてオブジェクト配置情報m2’の供給を受けるため、第1実施形態よりも正確な部品画像m4を出力することができる。また、画像辞書化部14では、文字情報が英語か日本語かその他の3種の辞書を用意して切り替える。このように、第2実施形態によれば、言語種別に応じたマッチング動作を行なうことにより、高速な辞書ビットマップによる圧縮処理を行なうことができる。また、第2実施形態では、文字情報として言語種別を用いて切り替えたが、文字情報はこの実施形態に限定されるものではない。
(第3実施形態)
第3実施形態は、特にビットマップを辞書化して圧縮する画像圧縮技術を提供する。
図18は、本発明の第3実施形態の画像圧縮装置の構成の一例を示すブロック図である。本発明の第3実施形態の画像圧縮装置は、図18に示すように、基本的に第1実施形態と同様の処理部は同一番号を付与しており、ビットマップ辞書を用いる画像辞書化部14”が異なる以外は同一である。これにより、第3実施形態は、圧縮時のインデックス探索順序をビットマップの発生頻度に応じて更新することにより、高速に圧縮することが可能となる。
画像辞書化部14”−1は、図19に示すように、既出のビットマップが複数のインデックス付きで格納されているビットマップ辞書61と、頁属性情報m3を受けビットマップ辞書61の探索順序を変更してビットマップ辞書データm41を読み出す探索インデックス並べ替え部62と、読み出し番号m42を探索インデックス並べ替え部62に供給し候補ビットマップm43を探索インデックス並べ替え部62から供給されるデータ読み出し部63と、候補ビットマップm43をデータ読み出し部63から供給され部品画像m4とマッチング処理を行なうマッチング部54を有している。
このような構成をもつ画像辞書化部14”−1においては、与えられる頁属性情報m3に応じてビットマップ辞書61の探索順序を変更し、変更されたビットマップ辞書61の探索順序により、与えられる読み出し番号m42に対応するビットマップ辞書データm41を読み出し、候補ビットマップm43としてビットマップそのものと番号インデックスをデータ読み出し部63に供給する。マッチング部54は候補ビットマップm43と部品画像m4を既知の位置シフトとマッチング処理を組み合せて、部品画像m4が候補ビットマップm43に一致するかどうかを判断し、一致すれば、その番号インデックスを辞書インデックスm6として出力する。マッチング部54は、対応するビットマップパターンが辞書に無ければ、その部品画像m4に新規番号インデックスと頁属性情報m3を合わせてビットマップ辞書61に登録する。
画像辞書化部14”−1は、スキャナ11から入力された全原稿のマッチング処理が終了すれば、ビットマップ辞書を番号インデックス順にソートして画像辞書m5として出力する。そして画像符号化部15で画像辞書m5を既知の画像圧縮技術(例えばランレングス)で圧縮し、辞書インデックスm6と合わせて符号データm7として記憶部16に出力する。
次に、第3実施形態において特徴的な辞書の探索順序入れ替え効果を図20を用いて説明する。例えば、4頁の画像に関する処理で、現在3枚目まで終了しているとすると、新規文字が出現するたびに番号インデックスが付与され、その頁属性情報が付与される。
ここで4頁目は『プレゼン』であるので、探索インデックスを並べ替え、頁属性がプレゼンの辞書ビットマップを探索の先頭に持ってくる。実際にデータの並び替えをする必要は無く、探索インデックス(読み出し番号m42)に対して読み出すべき番号インデックスの対応表を作るだけである。
複数頁をスキャンし一つのファイルを生成する時は、同一文書タイプでは同一のフォント(サイズ、デザイン)が使われる可能性が高い。そのため、頁属性に応じて辞書マッチングのためのデータの探索順序を、処理中の頁属性を優先的に探索することで高速に辞書マッチングが行われるので、高速に辞書ビットマップ圧縮ファイルを提供することができる。
また、辞書マッチングが完全一致で無い場合、符号データm7は非可逆圧縮されることになるが、マッチングアルゴリズムで候補が複数あった場合、頁属性情報を合わせて用いることで、よりマッチング精度が高まるので高画質・高圧縮な辞書ビットマップ圧縮ファイルを提供することができる。
また第3実施形態では、頁番号も管理し頁の探索終了後のビットマップ辞書61への格納時は、頁番号順に再格納しているが(3頁目)、しかし、頁番号は無視して文書は文書、プレゼンはプレゼンと頁属性単位に一つにまとめる方法も可能である。
なおレイアウト解析方法や、そこから算出される頁情報、辞書化やインデックスの付け方、探索方法や圧縮方法等、探索順序の切り替え方法は、上述した実施形態に限定されるものではない。
(第4実施形態)
第4実施形態は、第3実施形態のビットマップ辞書の探索インデックス並べ替え部にビットマップカウント部を設けたことを特徴とする。
図21に第4実施形態の構成の一例である画像辞書化部14”−2を示す。基本的に3実施形態の画像辞書化部14”−1と同様の構成であり同一番号を付与しているが、ビットマップカウント部64が新規に追加されている。
このような画像辞書化部14”−2において、マッチング部54は、候補ビットマップm43と部品画像m4を既知の位置シフトとマッチング処理を組み合せて、部品画像m4が候補ビットマップm43に一致するかどうかを判断し、一致すれば、その番号インデックスを辞書インデックスm6として出力する。対応するビットマップパターンが辞書に無ければ、その部品画像m4に新規番号インデックスと頁属性情報m3を合わせてビットマップ辞書61に登録する。画像辞書化部14”−2は、スキャナ11から入力された全原稿のマッチング処理が終了すれば、ビットマップ辞書を番号インデックス順にソートして画像辞書m5として出力する。
ここで、第4実施形態に特徴的なビットマップカウント部64について、図22を用いて説明する。ビットマップカウント部64は、図22の(a)に示すような構成を有しており、図17(b)に示す各辞書ビットマップを生成した時の頁属性情報m3と番号インデックスm46とその出現頻度であるカウント値であるビットマップ統計情報m53を格納している番号インデックステーブル66と、ビットマップ統計情報m53の中の番号インデックスm46の示すカウント値をインクリメントする番号インデックスカウンタ65と、カウント値が所定の閾値を超えた際に現在処理中の頁属性内で出現頻度に合わせたアクセスの並び替え情報である出現頻度並び替え情報m45を生成する出現頻度並び替え情報生成部67を有している。
次に、カウント値をどのようにインクリメントして出現頻度並び替え情報が更新されるかを、図22(b)に具体的数値を付与して説明する。並び替えを発生させる閾値が“799”である場合、頁属性情報m3として『プレゼン』カテゴリーの番号インデックス“6”が入力されると、番号インデックスカウンタ65によりインクリメントされたカウンタ値“800”がビットマップ統計情報m53として更新され、番号インデックステーブル66で保持される。ここで、出現頻度並び替え情報生成部67は、更新されたカウンタ値“800”に基づき、『プレゼン』カテゴリーの番号インデックス“6”の出現頻度並び替え情報m45を“2”から“1”に変更し、『プレゼン』カテゴリーの番号インデックス“5”の出現頻度並び替え情報m45を“1”から“2”に変更することで、各頁属性内で並び替えを行う。
なお、画像辞書化部14”−2全体の動作例で判るように、ここで入力される番号インデックスm46はマッチングした結果として特定される情報であるため、更新された出現頻度並び替え情報m45は、カウント値m52が閾値を越えた次の部品画像から適用される。
このように、第4実施形態では、探索インデックス並び替え部62は、基本的に第1実施形態同様に頁属性情報m3に応じて並び替えを行うと同時に、頁属性内では出現頻度並び替え情報m45を用いて頁属性内の辞書の探索順序も変更することにより、いっそう高速にマッチング処理を行なうことができる。
なお、第4実施形態では、並び替えの高速化のために頁属性情報m3も用いて頁属性内での並び替えを実施したが、より処理を簡潔にするために頁属性情報を用いずに個々の辞書ビットマップの頻度情報のみで並び替え情報を生成することも可能である。
また、辞書ビットマップの統計処理方法や更新方法等についても、上述した実施形態に限定されるものではない。更に、統計処理は辞書化ビットマップの情報を直接用いたが、特許文献3にあるようにOCR結果に基づき画像部品化を行うと共に、OCRの結果で同一の文字コード例えば“A”に判別された辞書ビットマップをグループ化し、そのグループの発生頻度で並び替えを実施することが可能である。これにより、近似したビットマップ群全体で優先的に探索を行なうことができるので、高速に辞書ビットマップ圧縮ファイルを提供することができる。
(請求案1)
入力した画像を解析してオブジェクト配置情報と頁属性情報を出力する解析部と、
前記オブジェクト配置情報に基いて、前記画像を部品化して、部品画像を出力する部品化部と、
既にある画像辞書の中から前記解析部からの前記頁属性情報に対応する複数の画像辞書を選び、前記選ばれた複数の画像辞書の中から所定順序に従って一つの画像辞書を選び、選ばれた画像辞書と前記部品化部からの前記部品画像を比較して対応する画像辞書を決定し、前記決定した画像辞書と前記部品画像の辞書インデックスを出力する辞書化部と、
前記画像辞書と前記辞書インデックスを符号化する符号化部と、
前記辞書化部の所定順序を前記頁属性情報に基づき並び替えて更新する更新部と、
を具備することを特徴とする画像圧縮装置。
(請求案2)
前記更新部が参照する前記頁属性情報は、文書、地図の少なくとも一方を含む原稿種別情報であることを特徴とする請求案1に記載の画像圧縮装置。
(請求案3)
前記更新部が参照する前記頁属性情報は、スキュー角度、天地の少なくとも一方を含む原稿方向情報であることを特徴とする請求案1に記載の画像圧縮装置。
(請求案4)
入力した画像を解析してオブジェクト配置情報と頁属性情報を出力し、
前記オブジェクト配置情報に基いて、前記画像を部品化して部品画像を出力し、
既にある画像辞書の中から前記頁属性情報に対応する複数の画像辞書を選び、
前記選ばれた複数の画像辞書の中から所定順序に従って一つの画像辞書を選び、
選ばれた画像辞書と前記部品画像を比較して対応する画像辞書を決定し、
前記画像辞書が決定した部品画像の辞書インデックスを決定し、
前記決定した画像辞書と前記部品画像の辞書インデックスを符号化し、
前記所定順序を前記頁属性情報に基づき並び替えて更新することを特徴とする画像圧縮方法。
特開2006−254329 特開2007−174008 特開2005−301663

Claims (7)

  1. 入力した画像を解析してオブジェクト配置情報と頁属性情報を出力する解析部と、
    前記オブジェクト配置情報に基いて、前記画像を部品化して、部品画像を出力する部品化部と、
    既にある画像辞書の中から前記解析部からの前記頁属性情報に対応する画像辞書を選び、前記選ばれた画像辞書と前記部品化部からの前記部品画像を比較して対応する画像辞書を決定し、前記決定した画像辞書と前記部品画像の辞書インデックスを出力する辞書化部と、
    前記画像辞書と前記辞書インデックスを符号化する符号化部と、
    を具備することを特徴とする画像圧縮装置。
  2. 前記入力される画像は複数頁であり、前記解析部は各頁毎に頁属性情報を出力することを特徴とする請求項1記載の画像圧縮装置。
  3. 前記頁属性情報は、文書、地図の少なくとも一つを含む原稿種別情報であることを特徴とする請求項1記載の画像圧縮装置。
  4. 前記頁属性情報は、スキュー角度、天地の少なくとも一つを含む原稿方向情報であることを特徴とする請求項1記載の画像圧縮装置。
  5. 前記辞書化部は、前記既にある画像辞書の中から前記オブジェクト属性情報に対応する画像辞書を選択することを特徴とする請求項1記載の画像圧縮装置。
  6. 前記部品化部が出力した前記部品画像を文字認識して文字情報を出力する文字認識部を更に有しており、
    前記辞書化部は、既にある画像辞書の中から前記文字認識部の文字情報に対応する画像辞書を選ぶことを特徴とする請求項1記載の画像圧縮装置。
  7. 入力した画像を解析してオブジェクト配置情報と頁属性情報を出力し、
    前記オブジェクト配置情報に基いて、前記画像を部品化して、部品画像を出力し、
    既にある画像辞書の中から前記頁属性情報に対応する画像辞書を選び、前記選ばれた画像辞書と前記部品画像を比較して対応する画像辞書を決定し、前記部品画像の辞書インデックスを出力し、
    前記対応する画像辞書と前記辞書インデックスを符号化することを特徴とする画像圧縮方法。
JP2009162958A 2008-07-22 2009-07-09 画像圧縮装置および画像圧縮方法 Pending JP2010027051A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US8270308P 2008-07-22 2008-07-22
US8270808P 2008-07-22 2008-07-22

Publications (1)

Publication Number Publication Date
JP2010027051A true JP2010027051A (ja) 2010-02-04

Family

ID=41732762

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009162958A Pending JP2010027051A (ja) 2008-07-22 2009-07-09 画像圧縮装置および画像圧縮方法

Country Status (1)

Country Link
JP (1) JP2010027051A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09200536A (ja) * 1996-01-18 1997-07-31 Fuji Xerox Co Ltd 符号化装置および復号化装置
JP2000295468A (ja) * 1999-04-01 2000-10-20 Toshiba Corp 画像処理装置
JP2007336467A (ja) * 2006-06-19 2007-12-27 Sharp Corp 画像圧縮装置およびそれを備えた画像読取装置、画像圧縮装置を備えた画像処理装置並びにそれを備えた画像形成装置、画像圧縮処理方法、そのコンピュータプログラム及び記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09200536A (ja) * 1996-01-18 1997-07-31 Fuji Xerox Co Ltd 符号化装置および復号化装置
JP2000295468A (ja) * 1999-04-01 2000-10-20 Toshiba Corp 画像処理装置
JP2007336467A (ja) * 2006-06-19 2007-12-27 Sharp Corp 画像圧縮装置およびそれを備えた画像読取装置、画像圧縮装置を備えた画像処理装置並びにそれを備えた画像形成装置、画像圧縮処理方法、そのコンピュータプログラム及び記録媒体

Similar Documents

Publication Publication Date Title
US7889926B2 (en) Image dictionary creating apparatus, coding apparatus, image dictionary creating method
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US8411955B2 (en) Image processing apparatus, image processing method and computer-readable medium
US7391917B2 (en) Image processing method
JP2940496B2 (ja) パタンマッチング符号化装置及び方法
US7542605B2 (en) Image processing apparatus, control method therefor, and program
US8320019B2 (en) Image processing apparatus, image processing method, and computer program thereof
US20070081179A1 (en) Image processing device, image processing method, and computer program product
US20040213458A1 (en) Image processing method and system
US20090097765A1 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
JPH10162150A (ja) ページ解析システム
US20090274369A1 (en) Image processing device, image processing method, program, and storage medium
US20050226516A1 (en) Image dictionary creating apparatus and method
JP2001203897A (ja) パタンマッチング符号化装置及び方法
Wang et al. Chinese document image retrieval system based on proportion of black pixel area in a character image
JP4261988B2 (ja) 画像処理装置及び方法
JPH11213160A (ja) 画像処理方法及び装置及びその記憶媒体
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
US7508986B2 (en) Document recognition device, document recognition method and program, and storage medium
JP2007129557A (ja) 画像処理システム
JP2010027051A (ja) 画像圧縮装置および画像圧縮方法
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4645058B2 (ja) 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム
JP5109548B2 (ja) 画像処理装置及びプログラム
JP2005352735A (ja) 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100914

A977 Report on retrieval

Effective date: 20111128

Free format text: JAPANESE INTERMEDIATE CODE: A971007

A131 Notification of reasons for refusal

Effective date: 20111206

Free format text: JAPANESE INTERMEDIATE CODE: A131

A02 Decision of refusal

Effective date: 20120327

Free format text: JAPANESE INTERMEDIATE CODE: A02