JP2010027051A

JP2010027051A - 画像圧縮装置および画像圧縮方法

Info

Publication number: JP2010027051A
Application number: JP2009162958A
Authority: JP
Inventors: Atsushi Tabata; 淳田畑; Masaaki Yasunaga; 真明安永
Original assignee: Toshiba Corp; Toshiba TEC Corp
Current assignee: Toshiba Corp; Toshiba TEC Corp
Priority date: 2008-07-22
Filing date: 2009-07-09
Publication date: 2010-02-04

Abstract

【課題】辞書化方式による画像圧縮処理を高速化することができる画像圧縮装置および画像圧縮方法を提供する。
【解決手段】入力した画像を解析してオブジェクト配置情報と頁属性情報を出力する解析部１２と、オブジェクト配置情報に基いて画像を部品化して部品画像を出力する部品化部１３と、既にある画像辞書の中から頁属性情報に対応する画像辞書を選び、選ばれた画像辞書と部品画像を比較して対応する画像辞書を決定し、決定した画像辞書と辞書インデックスを出力する辞書化部と、画像辞書と辞書インデックスを符号化する符号化部１５をもつ画像圧縮装置。
【選択図】図１

Description

本発明は、画像情報からオブジェクト配置情報と頁属性情報を抽出し、これらに基いて画像圧縮する画像圧縮装置および画像圧縮方法に関する。

従来から、２値画像を効率良く圧縮するために、画像ビットマップを辞書化して、インデックス（該当辞書番号とその配置）と辞書を圧縮データとする方式を標準化した技術としてＪＰＥＧ２が知られている。ＪＰＥＧ２では、圧縮率を上げるため、例えば編み点文字を構成する、形状情報（位置含む）と網点情報に基づいて、それぞれ対となる別の符号化手段で符号化する構成が示されている。

画像情報は大容量となるため、一般に圧縮を行い保存・使用している。通常、文字画像などは２値化して可逆圧縮、写真などは多値の非可逆圧縮を行っている。

しかしながら、２値文字画像に関しても非可逆で圧縮する方式が提案され、ISO/IEC１４４９２（ＪＰＥＧ２）として標準化されている。

この方式の特徴的な点は、文書画像などは同一文字が多く出現することから、文字のビットマップ画像を辞書化することによって、同じ文字はビットマップでなく、辞書インデックスと画像上の位置情報で表現することで、圧縮対象のビットマップ量を減らして圧縮する点である。このような圧縮技術に関し、例えば以下のような特許文献が知られている。

特許文献１（特開２００６−２５４３２９）は、単純な線描画文字だけでなく、ハーフトーンなどのパターンで表現された文字も効率良く圧縮するように、文字を構成する形状情報とそのパターン情報に分離して圧縮することで、パターン表現された文字等を効率よく圧縮する方式を開示している。

特許文献２（特開２００７−１７４００８）は、画像を文字や写真領域を識別し、それぞれに適した圧縮を適用する方式において、文字領域の圧縮に辞書方式の圧縮を用いる例が開示されており、辞書圧縮前に入力された文字領域のデータから非テキストとみなせる情報を辞書化圧縮対象から除外することで、高速に圧縮する方法を開示している。

特許文献３（特開２００５−３０１６６３）は、ＯＣＲ（Optical Character Recognition）で取得した文字単位を元にビットマップ辞書化の単位を設定し、必要以上に画像が部品化されることを防ぐ技術を開示している。

しかしこれら特許文献１乃至３の従来技術においては、部品画像のマッチング処理において、様々な文書フォーマットやフォント種類をもった文書の頁属性情報を考慮しておらず、効率的な画像辞書の探索・登録を行なっていないという問題がある。

本発明は、辞書化方式による画像圧縮処理を高速化することができる画像圧縮装置および画像圧縮方法を提供することを目的とする。

課題を解決する一実施形態は、
入力した画像を解析してオブジェクト配置情報と頁属性情報を出力する解析部と、
前記オブジェクト配置情報に基いて、前記画像を部品化して、部品画像を出力する部品化部と、
既にある画像辞書の中から前記解析部からの前記頁属性情報に対応する画像辞書を選び、前記選ばれた画像辞書と前記部品化部からの前記部品画像を比較して対応する画像辞書を決定し、前記決定した画像辞書と前記部品画像の辞書インデックスを出力する辞書化部と、
前記選択された画像辞書と前記辞書インデックスを符号化する符号化部と、
を具備することを特徴とする画像圧縮装置である。

画像圧縮処理を行なう際の部品画像と画像辞書のマッチング処理において、圧縮しようとする画像の頁属性情報（例えば文書、プレゼン、地図等）に対応する画像辞書を優先し対応しない画像辞書は排除するなどして、マッチング処理を効率化する。これにより、画像圧縮処理を高速化することができる。

本発明の第１実施形態の画像圧縮装置の構成の一例を示すブロック図。当該画像圧縮装置のレイアウト解析部の構成の一例を示すブロック図。当該画像圧縮装置のレイアウト解析部の動作の一例を説明する説明図。当該画像圧縮装置の頁属性判定部の構成の一例を示すブロック図。当該画像圧縮装置の頁判定データの一例の説明図。当該画像圧縮装置の画像部品化部の構成の一例を示すブロック図。当該画像圧縮装置の画像部品化部の動作の一例を説明する説明図。当該画像圧縮装置の画像辞書化部の構成の一例を示すブロック図。当該画像圧縮装置の画像辞書化部の動作の一例を説明する説明図。第１実施形態の変形例である画像圧縮装置の構成を示すブロック図。当該画像圧縮装置のレイアウト解析部の構成の一例を示すブロック図。当該画像圧縮装置の頁属性判定部の構成の一例を示すブロック図。当該画像圧縮装置のための傾き計算補助図の一例を示す説明図。当該画像圧縮装置の頁判定データの一例の説明図。当該画像圧縮装置の画像辞書化部の構成の一例を示すブロック図。本発明の第２実施形態の画像圧縮装置の構成の一例を示すブロック図。当該画像圧縮装置の文字処理部の構成の一例を示すブロック図。本発明の第３実施形態の画像圧縮装置の構成の一例を示すブロック図。当該画像圧縮装置の画像辞書化部の構成の一例を示すブロック図。当該画像圧縮装置の辞書の探索順序入れ替え効果を説明する説明図。当該画像圧縮装置の画像辞書化部の構成の一例を示すブロック図。当該画像圧縮装置のビットマップカウント部の働きを説明する説明図。

以下、この発明の実施の形態について図面を参照して詳細に説明する。

本発明の要旨は、入力された画像から頁属性情報を抽出し、画像を部品化して複数の画像辞書に辞書化すると共に、抽出した頁属性情報に基づいて複数の画像辞書から一つを選択することで、辞書マッチング処理を効率化して迅速な圧縮処理を実現する画像圧縮装置および画像圧縮方法である。

このような構成をとることにより、属性に適応した辞書を生成するため、辞書の作成が高速で圧縮率も高い辞書およびインデックス方式の圧縮ファイルを生成することができる。

なお、辞書の切り替え情報はレイアウト解析部以外にも、原稿モード等のユーザー指示手段を用いて辞書を切り替えることも可能である。また切り替え方法も頁単位でなく、頁内のオブジェクト単位で切り替えることも可能である。

また、この辞書の切り替え（選択）は、頁単位毎、地図等の原稿種別の頁情報毎、スキュー角度、天地等の頁単位の原稿方向情報毎、文字情報毎に行なうことも可能であり、それぞれ、高速・高圧縮な辞書圧縮ファイルを生成することができる。

（第１実施形態）
図１は、本発明の第１実施形態の画像圧縮装置の構成の一例を示すブロック図である。本発明の一実施形態に係る画像圧縮装置１は、全体の動作を制御する制御部１０と、原稿画像を読み取るスキャナ１１と、スキャナ１１から画像信号ｍ１が供給されるレイアウト解析部１２と、スキャナ１１から画像信号ｍ１が供給されレイアウト解析部１２からオブジェクト配置情報ｍ２が供給される画像部品化部１３を有する。さらに、画像圧縮装置１は、レイアウト解析部１２から頁属性情報ｍ３を受け画像部品化部１３から部品画像ｍ４を受ける画像辞書化部１４と、画像辞書化部１４から画像辞書信号ｍ５と辞書インデックスｍ６が供給される画像符号化部１５と、画像符号化部１５から符号データｍ７が供給される記憶部１６と、記憶部１６の後段に設けられたインターフェース部１７を有している。

このような構成をもつ画像圧縮装置１において、以下に動作を説明すると、スキャナ１１から入力された画像信号ｍ１はレイアウト解析部１２に供給され、レイアウト解析部１２では、供給された画像信号ｍ１を既知のレイアウト解析技術により処理することで、オブジェクト配置情報ｍ２と頁属性情報ｍ３を出力する。画像部品化部１３は、供給された画像信号ｍ１とオブジェクト配置情報ｍ２を用いて、部品画像ｍ４を出力する。

画像辞書化部１４は、部品画像ｍ４を既知のビットマップ辞書化技術と頁属性情報ｍ３を用いて、画像辞書ｍ５と辞書インデックスｍ６を出力する。画像符号化部１５は、これらの信号を受けて符号データｍ７を生成し、記憶部１６に格納する。

図２は、当該画像圧縮装置のレイアウト解析部の構成の一例を示すブロック図である。レイアウト解析部１２は、図２に示すように、画像信号ｍ１を受ける縮小処理部２１と、縮小処理部２１から縮小画像信号ｍ１１が供給される連結画素探索部２２と、連結画素探索部２２から領域の左上座標、左下座標、右上座標、右下座標である領域情報ｍ１２を受ける領域座標変換部２３と、同じく領域情報ｍ１２を受ける頁属性判定部２４と、頁属性判定部２４に接続されるテーブル２５を有している。

このような構成をもつレイアウト解析部１２において、縮小処理部２１は、画像信号ｍ１を受けると既定の縮小率で縮小し、縮小画像信号ｍ１１を出力する。連結画素探索部２２は、既知のチェインアルゴリズムで８方向探索して、画素の連結した領域の左上座標、左下座標、右上座標、右下座標である領域情報ｍ１２を出力する。ここで、領域情報ｍ１２の座標は、縮小処理部２１で縮小処理した座標系であるので、画像信号ｍ１と同じ座標系に領域座標変換部２３で変換し、オブジェクト配置情報ｍ２として出力する。一方、頁属性判定部２４は、頁内の領域情報ｍ１２を集計し、テーブル２５から読み出した頁判定データｍ１３と比較して、頁属性情報ｍ３を出力する。

ここで、頁属性判定部２４の動作を除いたレイアウト解析部１２の動作例を図３に示す。画像信号ｍ１を縮小処理して得た縮小画像ｍ１１では、文字等は連結した画素になることがわかる。この画像に対して既知のチェインアルゴリズムを用いて、連結した領域を算出すると、領域情報ｍ１２の点線で示したような各固まり毎の複数の領域が算出される。そして、領域座標変換部２３は、領域情報ｍ１２を受けて、座標系を縮小前に戻したオブジェクト配置情報ｍ２を算出する。

次に、図４は、当該画像圧縮装置の頁属性判定部の構成の一例を示すブロック図である。頁属性判定部２４は、領域情報ｍ１２が供給される領域傾き算出部３１と、同じく領域情報ｍ１２が供給される領域距離算出部３２と、領域傾き算出部３１から傾き情報ｍ２１が供給され領域距離算出部３２から距離情報ｍ２２が供給される判断部３３を有している。

このような構成をもつ頁属性判定部２４において、領域傾き算出部３１は、領域情報ｍ１２を用いて、各領域毎の傾き＝ＭＡＸ（｜左上Ｘ座標−左下Ｘ座標｜、｜左上Ｙ座標−右上Ｙ座標｜）を計算して求め、頁内の全領域の傾きの平均を傾き情報ｍ２１として算出する。

また、領域距離算出部３２は、各領域のセンター座標を求め、各センター座標毎に最も近いセンター座標を持つ領域ペア（下記でＰ１及びＰ２を求め、
各領域毎の距離＝ＭＩＮ（｜Ｐ１のＸ座標−Ｐ２のＸ座標｜、｜Ｐ１のＹ座標−Ｐ２のＹ座標｜）
を求めることで、頁内のペアの平均を距離情報ｍ２２として算出する。

判断部３３は、傾き情報ｍ２１と距離情報ｍ２２を受け取り、テーブル２５から図５に示すような頁判定データｍ１３を読み込む。判断部３３は、傾き情報ｍ２１と距離情報ｍ２２を所定の閾値と比較した結果と頁判定データｍ１３に基づいて原稿タイプを決定し、頁属性情報ｍ３として出力する。

次に、図６は、当該画像圧縮装置の画像部品化部の構成の一例を示すブロック図である。画像部品化部１３は、図６に示すように、画像信号ｍ１とオブジェクト配置情報ｍ２がそれぞれ供給される縦方向画素カウント部４１と横方向画素カウント部４２と、縦方向画素カウント部４１からの縦方向の射影ｍ３１と横方向画素カウント部４２からの横方向の射影ｍ３２が供給される比較器４３と、同じく縦方向画素カウント部４１からの縦方向の射影ｍ３１と横方向画素カウント部４２からの横方向の射影ｍ３２と比較器４３からの制御信号ｍ３３が供給される選択部４４と、選択部４４からの選択信号ｍ３４と画像信号ｍ１が供給される画素分割部４５を有している。

このような構成をもつ画像部品化部１３において、縦方向画素カウント部４１は、オブジェクト配置情報ｍ２の座標単位で画像信号ｍ１を分割して、縦軸への画素カウントの射影を縦方向の射影ｍ３１として出力する。また、横方向画素カウント部４２も、オブジェクト配置情報ｍ２の座標単位で画像信号ｍ１を分割して、横軸への画素カウントの射影を横方向の射影ｍ３２として比較器４３に出力する。比較器４３は、選択部４４が射影値の分散の大きいほうを選択するような制御信号ｍ３３を選択部４４に出力する。選択部４４は、射影値の分散の大きいほうを選択する選択信号ｍ３４を画素分割部４５に供給する。画素分割部４５は、選択された射影値を用いて、画像信号ｍ１を分割して部品画像ｍ４を出力する。

これらの動作を図７を用いて説明する。図７は、当該画像圧縮装置の画像部品化部の動作の一例を説明する説明図である。比較器４３では、縦方向の射影ｍ３１と横方向の射影ｍ３２を比較し、分散の大きい横方向の射影をする。画素分割部４５で、射影に対して閾値処理を行うことで、横方向の分割座標を算出し（点線）、図７で○で示された単位により部品画像として出力する。

つぎに、図８は、当該画像圧縮装置の画像辞書化部の構成の一例を示すブロック図である。画像辞書化部１４は、図５で示した頁属性情報ｍ３に対応する文書辞書５３、プレゼン辞書５２、地図辞書５１、非文書辞書５０を有しており、さらに、頁属性情報ｍ３が供給され各辞書を選択する選択部５５と、選択部５５により選択された辞書が接続され、部品画像ｍ４が供給され画像辞書信号ｍ５と辞書インデックスｍ６を出力するマッチング部５４を有している。

このような構成をもつ画像辞書化部１４において、選択部５５は、頁属性情報ｍ３に従って文書辞書５３、プレゼン辞書５２、地図辞書５１、非文書辞書５０のうちの適切な辞書を選択出力する。マッチング部５４は、既知の位置シフトとマッチング処理を組み合せにより、部品画像ｍ４が、選択部５５により選択された辞書に存在するかどうかを判断し、存在すれば、その辞書インデックスｍ６を出力する。辞書インデックスｍ６は、対応辞書名と辞書のインデックスと画像上の部品画像の位置情報である。

マッチング部５４は、対応するビットマップパターンが辞書に無ければ、その部品画像ｍ４を現在選択されている辞書に登録してインデックスを付与する。マッチング部５４は、スキャナ１１から入力された全原稿に関して、上記のマッチング処理が終了すれば、各辞書データを画像辞書ｍ５として出力する。そして、画像符号化部１５は、画像辞書ｍ５を既知の画像圧縮技術（例えばランレングス）で圧縮し、符号データｍ７として、辞書インデックスｍ６と一緒にて出力する。

次に、本発明による特徴的な辞書の効果を図９を用いて説明する。一般に、複数の枚数の文書をスキャンすると、図９に示すように一般文書やプレゼン用のドキュメント、図３で示した地図など、原稿のタイプが異なる文書が混在することがある。これらの文書では、各文書タイプ毎には同一種のフォントデザインやサイズが使われている可能性が高いが、文書タイプが異なるとデザインやサイズが異なる可能性が高い。

一般的には、これらの辞書データをまとめて一つの辞書に登録し、検索及びマッチングを行なう。しかし、上述した本発明に係る実施形態においては、辞書データを原稿タイプ毎に複数の辞書として辞書化し、辞書を使用する際に、頁属性情報に従って適切な辞書を選択し切り替えて、検索、マッチングを行う。これにより、頁属性情報に対応しない不適切な辞書を検索・マッチングの対象としないため、辞書マッチングを効率的に高速に行なうことができる。すなわち、文書画像をマッチングする場合、文書辞書を選択し、プレゼン辞書、地図辞書、非文書辞書を使用しないことで、効率的で高速な辞書マッチングを行なうことができる。

また、マッチング部５４でマッチング精度を緩めれば、非可逆で辞書ビットマップの圧縮ファイルが作成されるが、様々なフォントデザインを一つの辞書で管理する方式では、画質とマッチング精度の制御が難しい。しかしながら、本発明の方法のように原稿タイプ毎に辞書を切り替えれば、同一フォントデザイン群内でマッチングが行われる確率が高いので、画質低下を抑えつつマッチング精度を緩めることができるので、従来よりも圧縮率の高い辞書ビットマップ圧縮ファイルを提供することができる。

なおレイアウト解析方法や、そこから算出される頁情報、辞書化や圧縮方法等や、辞書の切り替え方法は、上述した実施形態に限定されるものではなく、本発明の実施可能な範囲は当業者が想到する範囲に及ぶものである。

（第１実施形態の変形例）
次に、本発明の第１実施形態の変形例について以下に図面を用いて詳細に説明する。図１０は、第１実施形態の変形例である画像圧縮装置の構成を示すブロック図である。

第１実施形態の変形例は、（領域距離を考慮せずに）領域傾きのみから頁属性情報ｍ３を決定し、決定した頁属性情報ｍ３により辞書を生成し選択する画像圧縮装置および画像圧縮方法を提供する。第１実施形態の変形例は、基本的に第１実施形態と同様の処理部は同一番号を付与しており、レイアウト解析部１２’、その頁属性情報ｍ３’、それを元に辞書化を行う画像辞書化部１４’が若干異なる以外は同一であるので、変更ブロックのみを説明する。

レイアウト解析部１２’の構成は、図１１に示す通りであり、第１実施形態との違いは頁属性判定部２４’のテーブル２５’、頁判定データｍ１３、および頁属性判定部２４’の構成、生成される頁属性情報ｍ３’が異なる。

また、頁属性判定部２４’の構成を図１２に示す。第１実施形態の変形例の頁属性判定部２４’と第１実施形態の頁属性判定部２４との構成上の相違は、第１実施形態の変形例の頁属性判定部２４’が、領域距離算出部３２を用いることなく、領域傾き算出部３１’のみにより傾き角度ｍ２１’と傾き分散ｍ２２’を出力することである。

傾き角度ｍ２１’は、例えば図１３の様に傾きを定義し、簡易的に以下の式で算出する。

ｉｆ（（左上Ｙ座標−右上Ｙ座標）＞０）｛
θ＝ａｔａｎ（（右下Ｙ座標−左下Ｙ座標）／（右下Ｘ座標−左下Ｘ座標））
｝
ｅｌｓｅ｛
θ＝ａｔａｎ（（右上Ｙ座標−左上Ｙ座標）／（右上Ｘ座標−左上Ｘ座標））
｝
縮小処理部２１は、傾き角度ｍ２１’としてこれらθの平均値を出力し、傾き分散ｍ２２’として同分散を出力する。

図１４は、当該画像圧縮装置の頁判定データの一例の説明図である。判断部３３は、第１実施形態と同様に、図１４に示す頁判定データｍ１３を用いて、傾き角度ｍ２１’の範囲と傾き分散ｍ２２’を閾値と比較した分散の大きさから、角度カテゴリーとして、標準、プラス角度、マイナス角度、特別の４種のカテゴリーに分類して頁属性情報ｍ３’を出力する。ここで特別のカテゴリーは第１実施形態で例示したような地図原稿の場合、領域に角度があるがスキューによる角度ではない可能性が高いカテゴリーも存在するためである。

図１５は、画像辞書化部の構成の一例を示すブロック図である。第１実施形態の変形例の画像辞書化部１４’は、図１４の角度カテゴリーに対応した辞書を有していることが特徴であり、標準辞書５６と、プラス角度辞書５７と、マイナス角度辞書５８と、特別辞書５９と、これらの辞書が接続され頁属性情報ｍ３が供給される選択部５５と、選択部５５により選択された辞書が接続されるマッチング部５４を有している。

一般に複数の原稿画像の入力処理を行なうと、入力コンディションにより原稿の方向が若干傾いて入力される可能性があり、この角度をスキューと呼ぶ。またスキューだけでなく原稿の向き（上下逆さま、９０度方向違い）なども混在して入力されることがある。

通常、このような条件は画像の頁全体で共通の性質であるが、単純に辞書化を行うと正しく入力されれば同一の文字であっても、スキューによって別々の文字と判別され辞書化されてしまう。そのため辞書化に当たっては、検索対象の文字ビットマップが増大し検索に時間が掛かってしまう。

第１実施形態の変形例の構成を取ることにより、原稿全体の方向依存による歪みに対しても、高速に辞書化処理を行うことができる。また、各角度毎にマッチング対象のデータがそろっているので、辞書マッチング精度を緩めても第１実施形態同様、画質低下を抑制した高圧縮な辞書ビットマップ圧縮ファイルを提供することができる。

また、スキューに対しては角度を補正後一律に処理することも考えられるが、補正により角度は直ってもビットマップが微妙に崩れる可能性があり、スキュー補正を行った画像に対しても同様に効果が得られる。

また、この実施形態の更なる変形例としては、レイアウト解析部１２’で、頁単位でなく領域毎に種別を特定し、その領域毎の種別ごとに辞書を切り替える構成を取ることで、より細かな辞書化制御が可能となる。例えば、文書領域とグラフや表領域では、使用するフォントデザインが異なる可能性があるので、領域毎の種別毎に辞書を切り替えることでより高速な辞書マッチング処理が可能となる。

（第２実施形態）
第２実施形態は、レイアウト解析部の代わりに文字処理部１８を使用し、オブジェクト配置情報ｍ２’と文字情報ｍ３”を出力し、画像部品化部１３で、より高精度な画像の部品化と画像辞書化部１４において、文字の特徴に応じた辞書を適用して高速に辞書ビットマップ圧縮ファイルを作成することである。

図１６は、本発明の第２実施形態の画像圧縮装置の構成の一例を示すブロック図である。本発明の第２実施形態の画像圧縮装置は、図１６に示すように、基本的に第１実施形態と同様の処理部は同一番号を付与しており、文字処理部１８が異なる以外は同一であるので、変更ブロックのみ説明する。

文字処理部１８は、図１７に示す構成を示している。すなわち、文字処理部１８は、既知のＯＣＲ（Optical Character Recognition）を用いた文字認識部４６と、文字認識部４６から文字のコード情報ｍ５１が供給される言語判定部４７を有している。文字処理部１８は、画像信号ｍ１を受けて特許文献３の様に文字単位の情報としてオブジェクト配置情報ｍ２’を出力する。また、言語判定部４７は、文字処理部１８からコード情報ｍ５１を受けると、処理中の文字が英語か日本語かその他の言語種別情報を判断して文字情報ｍ３”を出力する。

画像部品化部１３は、文字処理部１８から文字単位の情報としてオブジェクト配置情報ｍ２’の供給を受けるため、第１実施形態よりも正確な部品画像ｍ４を出力することができる。また、画像辞書化部１４では、文字情報が英語か日本語かその他の３種の辞書を用意して切り替える。このように、第２実施形態によれば、言語種別に応じたマッチング動作を行なうことにより、高速な辞書ビットマップによる圧縮処理を行なうことができる。また、第２実施形態では、文字情報として言語種別を用いて切り替えたが、文字情報はこの実施形態に限定されるものではない。

（第３実施形態）
第３実施形態は、特にビットマップを辞書化して圧縮する画像圧縮技術を提供する。

図１８は、本発明の第３実施形態の画像圧縮装置の構成の一例を示すブロック図である。本発明の第３実施形態の画像圧縮装置は、図１８に示すように、基本的に第１実施形態と同様の処理部は同一番号を付与しており、ビットマップ辞書を用いる画像辞書化部１４”が異なる以外は同一である。これにより、第３実施形態は、圧縮時のインデックス探索順序をビットマップの発生頻度に応じて更新することにより、高速に圧縮することが可能となる。

画像辞書化部１４”−１は、図１９に示すように、既出のビットマップが複数のインデックス付きで格納されているビットマップ辞書６１と、頁属性情報ｍ３を受けビットマップ辞書６１の探索順序を変更してビットマップ辞書データｍ４１を読み出す探索インデックス並べ替え部６２と、読み出し番号ｍ４２を探索インデックス並べ替え部６２に供給し候補ビットマップｍ４３を探索インデックス並べ替え部６２から供給されるデータ読み出し部６３と、候補ビットマップｍ４３をデータ読み出し部６３から供給され部品画像ｍ４とマッチング処理を行なうマッチング部５４を有している。

このような構成をもつ画像辞書化部１４”−１においては、与えられる頁属性情報ｍ３に応じてビットマップ辞書６１の探索順序を変更し、変更されたビットマップ辞書６１の探索順序により、与えられる読み出し番号ｍ４２に対応するビットマップ辞書データｍ４１を読み出し、候補ビットマップｍ４３としてビットマップそのものと番号インデックスをデータ読み出し部６３に供給する。マッチング部５４は候補ビットマップｍ４３と部品画像ｍ４を既知の位置シフトとマッチング処理を組み合せて、部品画像ｍ４が候補ビットマップｍ４３に一致するかどうかを判断し、一致すれば、その番号インデックスを辞書インデックスｍ６として出力する。マッチング部５４は、対応するビットマップパターンが辞書に無ければ、その部品画像ｍ４に新規番号インデックスと頁属性情報ｍ３を合わせてビットマップ辞書６１に登録する。

画像辞書化部１４”−１は、スキャナ１１から入力された全原稿のマッチング処理が終了すれば、ビットマップ辞書を番号インデックス順にソートして画像辞書ｍ５として出力する。そして画像符号化部１５で画像辞書ｍ５を既知の画像圧縮技術（例えばランレングス）で圧縮し、辞書インデックスｍ６と合わせて符号データｍ７として記憶部１６に出力する。

次に、第３実施形態において特徴的な辞書の探索順序入れ替え効果を図２０を用いて説明する。例えば、４頁の画像に関する処理で、現在３枚目まで終了しているとすると、新規文字が出現するたびに番号インデックスが付与され、その頁属性情報が付与される。

ここで４頁目は『プレゼン』であるので、探索インデックスを並べ替え、頁属性がプレゼンの辞書ビットマップを探索の先頭に持ってくる。実際にデータの並び替えをする必要は無く、探索インデックス（読み出し番号ｍ４２）に対して読み出すべき番号インデックスの対応表を作るだけである。

複数頁をスキャンし一つのファイルを生成する時は、同一文書タイプでは同一のフォント（サイズ、デザイン）が使われる可能性が高い。そのため、頁属性に応じて辞書マッチングのためのデータの探索順序を、処理中の頁属性を優先的に探索することで高速に辞書マッチングが行われるので、高速に辞書ビットマップ圧縮ファイルを提供することができる。

また、辞書マッチングが完全一致で無い場合、符号データｍ７は非可逆圧縮されることになるが、マッチングアルゴリズムで候補が複数あった場合、頁属性情報を合わせて用いることで、よりマッチング精度が高まるので高画質・高圧縮な辞書ビットマップ圧縮ファイルを提供することができる。

また第３実施形態では、頁番号も管理し頁の探索終了後のビットマップ辞書６１への格納時は、頁番号順に再格納しているが（３頁目）、しかし、頁番号は無視して文書は文書、プレゼンはプレゼンと頁属性単位に一つにまとめる方法も可能である。

なおレイアウト解析方法や、そこから算出される頁情報、辞書化やインデックスの付け方、探索方法や圧縮方法等、探索順序の切り替え方法は、上述した実施形態に限定されるものではない。

（第４実施形態）
第４実施形態は、第３実施形態のビットマップ辞書の探索インデックス並べ替え部にビットマップカウント部を設けたことを特徴とする。

図２１に第４実施形態の構成の一例である画像辞書化部１４”−２を示す。基本的に３実施形態の画像辞書化部１４”−１と同様の構成であり同一番号を付与しているが、ビットマップカウント部６４が新規に追加されている。

このような画像辞書化部１４”−２において、マッチング部５４は、候補ビットマップｍ４３と部品画像ｍ４を既知の位置シフトとマッチング処理を組み合せて、部品画像ｍ４が候補ビットマップｍ４３に一致するかどうかを判断し、一致すれば、その番号インデックスを辞書インデックスｍ６として出力する。対応するビットマップパターンが辞書に無ければ、その部品画像ｍ４に新規番号インデックスと頁属性情報ｍ３を合わせてビットマップ辞書６１に登録する。画像辞書化部１４”−２は、スキャナ１１から入力された全原稿のマッチング処理が終了すれば、ビットマップ辞書を番号インデックス順にソートして画像辞書ｍ５として出力する。

ここで、第４実施形態に特徴的なビットマップカウント部６４について、図２２を用いて説明する。ビットマップカウント部６４は、図２２の（ａ）に示すような構成を有しており、図１７（ｂ）に示す各辞書ビットマップを生成した時の頁属性情報ｍ３と番号インデックスｍ４６とその出現頻度であるカウント値であるビットマップ統計情報ｍ５３を格納している番号インデックステーブル６６と、ビットマップ統計情報ｍ５３の中の番号インデックスｍ４６の示すカウント値をインクリメントする番号インデックスカウンタ６５と、カウント値が所定の閾値を超えた際に現在処理中の頁属性内で出現頻度に合わせたアクセスの並び替え情報である出現頻度並び替え情報ｍ４５を生成する出現頻度並び替え情報生成部６７を有している。

次に、カウント値をどのようにインクリメントして出現頻度並び替え情報が更新されるかを、図２２（ｂ）に具体的数値を付与して説明する。並び替えを発生させる閾値が“７９９”である場合、頁属性情報ｍ３として『プレゼン』カテゴリーの番号インデックス“６”が入力されると、番号インデックスカウンタ６５によりインクリメントされたカウンタ値“８００”がビットマップ統計情報ｍ５３として更新され、番号インデックステーブル６６で保持される。ここで、出現頻度並び替え情報生成部６７は、更新されたカウンタ値“８００”に基づき、『プレゼン』カテゴリーの番号インデックス“６”の出現頻度並び替え情報ｍ４５を“２”から“１”に変更し、『プレゼン』カテゴリーの番号インデックス“５”の出現頻度並び替え情報ｍ４５を“１”から“２”に変更することで、各頁属性内で並び替えを行う。

なお、画像辞書化部１４”−２全体の動作例で判るように、ここで入力される番号インデックスｍ４６はマッチングした結果として特定される情報であるため、更新された出現頻度並び替え情報ｍ４５は、カウント値ｍ５２が閾値を越えた次の部品画像から適用される。

このように、第４実施形態では、探索インデックス並び替え部６２は、基本的に第１実施形態同様に頁属性情報ｍ３に応じて並び替えを行うと同時に、頁属性内では出現頻度並び替え情報ｍ４５を用いて頁属性内の辞書の探索順序も変更することにより、いっそう高速にマッチング処理を行なうことができる。

なお、第４実施形態では、並び替えの高速化のために頁属性情報ｍ３も用いて頁属性内での並び替えを実施したが、より処理を簡潔にするために頁属性情報を用いずに個々の辞書ビットマップの頻度情報のみで並び替え情報を生成することも可能である。

また、辞書ビットマップの統計処理方法や更新方法等についても、上述した実施形態に限定されるものではない。更に、統計処理は辞書化ビットマップの情報を直接用いたが、特許文献３にあるようにＯＣＲ結果に基づき画像部品化を行うと共に、ＯＣＲの結果で同一の文字コード例えば“Ａ”に判別された辞書ビットマップをグループ化し、そのグループの発生頻度で並び替えを実施することが可能である。これにより、近似したビットマップ群全体で優先的に探索を行なうことができるので、高速に辞書ビットマップ圧縮ファイルを提供することができる。

（請求案１）
入力した画像を解析してオブジェクト配置情報と頁属性情報を出力する解析部と、
前記オブジェクト配置情報に基いて、前記画像を部品化して、部品画像を出力する部品化部と、
既にある画像辞書の中から前記解析部からの前記頁属性情報に対応する複数の画像辞書を選び、前記選ばれた複数の画像辞書の中から所定順序に従って一つの画像辞書を選び、選ばれた画像辞書と前記部品化部からの前記部品画像を比較して対応する画像辞書を決定し、前記決定した画像辞書と前記部品画像の辞書インデックスを出力する辞書化部と、
前記画像辞書と前記辞書インデックスを符号化する符号化部と、
前記辞書化部の所定順序を前記頁属性情報に基づき並び替えて更新する更新部と、
を具備することを特徴とする画像圧縮装置。

（請求案２）
前記更新部が参照する前記頁属性情報は、文書、地図の少なくとも一方を含む原稿種別情報であることを特徴とする請求案１に記載の画像圧縮装置。

（請求案３）
前記更新部が参照する前記頁属性情報は、スキュー角度、天地の少なくとも一方を含む原稿方向情報であることを特徴とする請求案１に記載の画像圧縮装置。

（請求案４）
入力した画像を解析してオブジェクト配置情報と頁属性情報を出力し、
前記オブジェクト配置情報に基いて、前記画像を部品化して部品画像を出力し、
既にある画像辞書の中から前記頁属性情報に対応する複数の画像辞書を選び、
前記選ばれた複数の画像辞書の中から所定順序に従って一つの画像辞書を選び、
選ばれた画像辞書と前記部品画像を比較して対応する画像辞書を決定し、
前記画像辞書が決定した部品画像の辞書インデックスを決定し、
前記決定した画像辞書と前記部品画像の辞書インデックスを符号化し、
前記所定順序を前記頁属性情報に基づき並び替えて更新することを特徴とする画像圧縮方法。

特開２００６−２５４３２９特開２００７−１７４００８特開２００５−３０１６６３

Claims

入力した画像を解析してオブジェクト配置情報と頁属性情報を出力する解析部と、
前記オブジェクト配置情報に基いて、前記画像を部品化して、部品画像を出力する部品化部と、
既にある画像辞書の中から前記解析部からの前記頁属性情報に対応する画像辞書を選び、前記選ばれた画像辞書と前記部品化部からの前記部品画像を比較して対応する画像辞書を決定し、前記決定した画像辞書と前記部品画像の辞書インデックスを出力する辞書化部と、
前記画像辞書と前記辞書インデックスを符号化する符号化部と、
を具備することを特徴とする画像圧縮装置。
前記入力される画像は複数頁であり、前記解析部は各頁毎に頁属性情報を出力することを特徴とする請求項１記載の画像圧縮装置。
前記頁属性情報は、文書、地図の少なくとも一つを含む原稿種別情報であることを特徴とする請求項１記載の画像圧縮装置。
前記頁属性情報は、スキュー角度、天地の少なくとも一つを含む原稿方向情報であることを特徴とする請求項１記載の画像圧縮装置。
前記辞書化部は、前記既にある画像辞書の中から前記オブジェクト属性情報に対応する画像辞書を選択することを特徴とする請求項１記載の画像圧縮装置。
前記部品化部が出力した前記部品画像を文字認識して文字情報を出力する文字認識部を更に有しており、
前記辞書化部は、既にある画像辞書の中から前記文字認識部の文字情報に対応する画像辞書を選ぶことを特徴とする請求項１記載の画像圧縮装置。
入力した画像を解析してオブジェクト配置情報と頁属性情報を出力し、
前記オブジェクト配置情報に基いて、前記画像を部品化して、部品画像を出力し、
既にある画像辞書の中から前記頁属性情報に対応する画像辞書を選び、前記選ばれた画像辞書と前記部品画像を比較して対応する画像辞書を決定し、前記部品画像の辞書インデックスを出力し、
前記対応する画像辞書と前記辞書インデックスを符号化することを特徴とする画像圧縮方法。