JP4323178B2 - 検索対象制限装置、画像処理装置、プログラム、記憶媒体及び検索対象制限方法 - Google Patents
検索対象制限装置、画像処理装置、プログラム、記憶媒体及び検索対象制限方法 Download PDFInfo
- Publication number
- JP4323178B2 JP4323178B2 JP2003025136A JP2003025136A JP4323178B2 JP 4323178 B2 JP4323178 B2 JP 4323178B2 JP 2003025136 A JP2003025136 A JP 2003025136A JP 2003025136 A JP2003025136 A JP 2003025136A JP 4323178 B2 JP4323178 B2 JP 4323178B2
- Authority
- JP
- Japan
- Prior art keywords
- code string
- string data
- packet length
- image
- search target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、検索対象制限装置、画像処理装置、プログラム、記憶媒体及び検索対象制限方法に関する。
【0002】
【従来の技術】
画像入力技術およびその出力技術の進歩により、画像に対して高精細化の要求が、近年非常に高まっている。例えば、画像入力装置として、デジタルカメラ(Digital Camera)を例にあげると、300万以上の画素数を持つ高性能な電荷結合素子(CCD:Charge Coupled Device)の低価格化が進み、普及価格帯の製品においても広く用いられるようになってきた。そして、このピクセル数の増加傾向は、なおしばらくは続くと言われている。
【0003】
一方、画像出力・表示装置に関しても、例えば、レーザプリンタ、インクジェットプリンタ、昇華型プリンタ等のハード・コピー分野における製品、そして、CRTやLCD(液晶表示デバイス)、PDP(プラズマ表示デバイス)等のフラットパネルディスプレイのソフト・コピー分野における製品の高精細化・低価格化は目を見張るものがある。
【0004】
こうした高性能・低価格な画像入出力製品の市場投入効果によって、高精細画像の大衆化が始まっており、今後はあらゆる場面で、高精細画像の需要が高まると予想されている。実際、パーソナルコンピュータ(Personal Computer)やインターネットをはじめとするネットワークに関連する技術の発達は、こうしたトレンドをますます加速させている。特に最近は、携帯電話やノートパソコン等のモバイル機器の普及速度が非常に大きく、高精細な画像を、あらゆる地点から通信手段を用いて伝送あるいは受信する機会が急増している。
【0005】
これらを背景に、高精細画像の取扱いを容易にする画像圧縮伸長技術に対する高性能化あるいは多機能化の要求は、今後ますます強くなっていくことは必至と思われる。
【0006】
そこで、近年においては、こうした要求を満たす画像圧縮方式の一つとして、高圧縮率でも高画質な画像を復元可能なJPEG2000という新しい方式が規格化されつつある。かかるJPEG2000においては、画像を矩形領域(タイル)に分割することにより、少ないメモリ環境下で圧縮伸長処理を行うことが可能である。すなわち、個々のタイルが圧縮伸長プロセスを実行する際の基本単位となり、圧縮伸長動作はタイル毎に独立に行うことができる。
【0007】
一般に、紙文書(原稿)を電子化して保存するような場合には、以下に示すような処理を順番に実行することになる。まず、紙文書(原稿)をスキャナやデジタルスチルカメラ等の画像入力装置を使用して一枚ずつ読み込む。次いで、読み込んだ画像データをJPEGやJPEG2000等の符号化データに画像圧縮装置を使用して変換する。最後に、圧縮処理した符号化データを記憶装置に記憶保存する。
【0008】
ところで、このような手順により記憶装置に記憶保存された符号化データに対し、文字認識を行うOCR(Optical Character Reader)処理等の画像処理が施される場合がある。このOCR処理としては様々な手法が考えられているが、基本的には、符号化データを復号した文書画像中から文字画像(2値化画像)を切り出し、切り出された文字画像を、文字画像と文字コードとの組みを予め記憶した辞書ファイルと比較(パターンマッチング)し、相違度の小さい文字画像又は類似度の大きな文字画像に組み合わされた文字コードをOCR処理結果として出力するものである。
【0009】
【発明が解決しようとする課題】
しかしながら、前述したようなOCR処理においては、文書画像中から文字画像(2値化画像)を切り出すために、符号化された周波数変換係数値を復号化し、さらに、逆量子化する、という複雑な処理が必要であるため、処理時間が長くなることから、処理速度の高速化が望まれている。
【0010】
本発明の目的は、文字検索を短時間で実行することができる検索対象制限装置、画像処理装置、プログラム、記憶媒体及び検索対象制限方法を提供することである。
【0011】
【課題を解決するための手段】
請求項1記載の発明の検索対象制限装置は、記憶部と、画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成された符号列データの入力を受け付ける符号列入力手段と、入力された前記符号列データの構文を解析して、所定領域に係る符号列データを構成するパケットのパケット長が記述されたヘッダ情報を取得する構文解析手段と、前記構文解析手段により取得された前記ヘッダ情報から前記パケット長を読み取り、読み取った一の前記パケット長を比較の対象となる参照ページとしての文書画像の前記パケット長として前記記憶部に保存し、新たに入力された現ページとしての文書画像の前記符号列データから前記パケット長を読み取り、当該パケット長と、前記記憶部に保存されている前記参照ページとしての文書画像の前記パケット長との差分値を類似度として検出する類似度検出手段と、前記類似度検出手段により検出された前記類似度が、所定の閾値以下である場合に、前記現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外する検索対象制限手段と、を備える。
【0012】
したがって、画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて読み取られたパケット長に基づき、入力された現ページとしての文書画像の所定領域に係る符号列データと参照ページとしての文書画像の所定領域に係る符号列データとの変化の度合いを示す類似度が検出され、この類似度に応じて入力された現ページとしての文書画像の所定領域に係る符号列データが文字検索の対象から除外される。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく類似度が検出され、この類似度に応じて入力された現ページとしての文書画像の所定領域に係る符号列データが文字検索の対象から除外されるので、文字検索を短時間で実行することが可能になる。
また、参照ページと現ページとの所定領域についての類似度が、画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出される。これにより、参照ページと現ページとの所定領域についての類似度の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページと現ページとの所定領域についての類似度を高速、かつ、正確に求めることが可能になる。
【0013】
請求項2記載の発明は、請求項1記載の検索対象制限装置において、前記構文解析手段における構文解析条件を指定する条件指定手段を備える。
【0014】
したがって、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、類似度の精度と検出処理速度をユーザの望みに応じて最適化することが可能になる。
【0016】
したがって、参照ページと現ページとの所定領域についての類似度が、画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出される。これにより、参照ページと現ページとの所定領域についての類似度の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページと現ページとの所定領域についての類似度を高速、かつ、正確に求めることが可能になる。
【0017】
請求項3記載の発明は、請求項1または2に記載の検索対象制限装置において、前記検索対象制限手段は、文字検索の際に所定領域に係る符号列データを構成するパケットを無視するように、符号列データのヘッダ部の情報を書き換える。
【0018】
したがって、現ページの所定領域に係る符号列データを文字検索の対象から除外することが可能になる。
【0019】
請求項5記載の発明は、請求項3に記載の検索対象制限装置において、前記検索対象制限手段は、所定領域に係る符号列データのペイロード部のデータを削除する。
【0020】
したがって、現ページの所定領域に係る符号列データを文字検索の対象から除外することが可能になる。
【0021】
請求項5記載の発明は、請求項3記載の検索対象制限装置において、前記検索対象制限手段によりヘッダ部の情報が書き換えられた符号列データを標準形式の符号列データに整える符号列作成手段を備える。
【0022】
したがって、汎用のデコーダで、新たに生成した符号列データを伸長することが可能となる。
【0023】
請求項6記載の発明は、請求項1ないし5のいずれか一記載の検索対象制限装置において、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるタイルである。
【0024】
したがって、周波数変換として離散ウェーブレット変換を用いることが可能になる。
【0025】
請求項7記載の発明は、請求項1ないし5のいずれか一記載の検索対象制限装置において、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるプレシンクトである。
【0026】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページと現ページとの所定領域についての類似度を検出することが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0027】
請求項8記載の発明は、請求項1ないし5のいずれか一記載の検索対象制限装置において、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるコード・ブロックである。
【0028】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページと現ページとの所定領域についての類似度を検出することが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0029】
請求項9記載の発明の画像処理装置は、請求項1ないし8のいずれか一記載の検索対象制限装置と、画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化した符号列データを伸長する画像伸長装置と、この画像伸長装置により伸長された文書画像に対して文字認識を行うOCR(Optical Character Reader)処理を実行するOCR処理装置と、このOCR処理装置によるOCR処理結果として出力された文字コードの中から所望の文字を検索する文字検索装置と、を備える。
【0030】
したがって、請求項1ないし9のいずれか一記載の発明と同様の作用を奏する画像処理装置を提供することが可能になる。
【0031】
請求項10記載の発明のプログラムは、コンピュータにインストールされるか、あるいは解釈されて実行されるプログラムであって、前記コンピュータに、記憶部と、画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成された符号列データの入力を受け付ける符号列入力手段と、入力された前記符号列データの構文を解析して、所定領域に係る符号列データを構成するパケットのパケット長が記述されたヘッダ情報を取得する構文解析機能と、前記構文解析手段により取得された前記ヘッダ情報から前記パケット長を読み取り、読み取った一の前記パケット長を比較の対象となる参照ページとしての文書画像の前記パケット長として前記記憶部に保存し、新たに入力された現ページとしての文書画像の前記符号列データから前記パケット長を読み取り、当該パケット長と、前記記憶部に保存されている前記参照ページとしての文書画像の前記パケット長との差分値を類似度として検出する類似度検出機能と、前記類似度検出手段により検出された前記類似度が、所定の閾値以下である場合に、前記現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外する検索対象制限機能と、を実行させる。
【0032】
したがって、画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて読み取られたパケット長に基づき、入力された現ページとしての文書画像の所定領域に係る符号列データと参照ページとしての文書画像の所定領域に係る符号列データとの変化の度合いを示す類似度が検出され、この類似度に応じて入力された現ページとしての文書画像の所定領域に係る符号列データが文字検索の対象から除外される。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく類似度が検出され、この類似度に応じて入力された現ページとしての文書画像の所定領域に係る符号列データが文字検索の対象から除外されるので、文字検索を短時間で実行することが可能になる。
また、参照ページと現ページとの所定領域についての類似度が、画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出される。これにより、参照ページと現ページとの所定領域についての類似度の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページと現ページとの所定領域についての類似度を高速、かつ、正確に求めることが可能になる。
【0033】
請求項11記載の発明は、請求項10記載のプログラムにおいて、前記構文解析機能における構文解析条件を指定する条件指定機能を前記コンピュータに実行させる。
【0034】
したがって、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、類似度の精度と検出処理速度をユーザの望みに応じて最適化することが可能になる。
【0037】
請求項12記載の発明は、請求項10または11に記載のプログラムにおいて、前記検索対象制限機能は、文字検索の際に所定領域に係る符号列データを構成するパケットを無視するように、符号列データのヘッダ部の情報を書き換える。
【0038】
したがって、現ページの所定領域に係る符号列データを文字検索の対象から除外することが可能になる。
【0039】
請求項13記載の発明は、請求項10または11に記載のプログラムにおいて、前記検索対象制限機能は、所定領域に係る符号列データのペイロード部のデータを削除する。
【0040】
したがって、現ページの所定領域に係る符号列データを文字検索の対象から除外することが可能になる。
【0041】
請求項14記載の発明は、請求項11記載のプログラムにおいて、前記検索対象制限機能によりヘッダ部の情報が書き換えられた符号列データを標準形式の符号列データに整える符号列作成機能を前記コンピュータに実行させる。
【0042】
したがって、汎用のデコーダで、新たに生成した符号列データを伸長することが可能となる。
【0043】
請求項15記載の発明は、請求項10ないし14のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるタイルである。
【0044】
したがって、周波数変換として離散ウェーブレット変換を用いることが可能になる。
【0045】
請求項16記載の発明は、請求項10ないし14のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるプレシンクトである。
【0046】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページと現ページとの所定領域についての類似度を検出することが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0047】
請求項17記載の発明は、請求項10ないし14のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるコード・ブロックである。
【0048】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページと現ページとの所定領域についての類似度を検出することが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0049】
請求項18記載の発明の記憶媒体は、請求項10ないし17のいずれか一記載のプログラムを記憶している。
【0050】
したがって、この記憶媒体に記憶されたプログラムをコンピュータに読み取らせることにより、請求項11ないし19のいずれか一記載の発明と同様の作用を得ることが可能になる。
【0051】
請求項19記載の発明の検索対象制限方法は、画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成された符号列データの入力を受け付ける符号列入力工程と、入力された前記符号列データの構文を解析して、所定領域に係る符号列データを構成するパケットのパケット長が記述されたヘッダ情報を取得する構文解析工程と、前記構文解析工程により取得された前記ヘッダ情報から前記パケット長を読み取り、読み取った一の前記パケット長を比較の対象となる参照ページとしての文書画像の前記パケット長として記憶手段に保存し、新たに入力された現ページとしての文書画像の前記符号列データから前記パケット長を読み取り、当該パケット長と、前記記憶手段により保存された前記参照ページとしての文書画像の前記パケット長との差分値を類似度として検出する類似度検出工程と、前記類似度検出工程により検出された前記類似度が、所定の閾値以下である場合に、前記現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外する検索対象制限工程と、を含む。
【0052】
したがって、画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて読み取られたパケット長に基づき、入力された現ページとしての文書画像の所定領域に係る符号列データと参照ページとしての文書画像の所定領域に係る符号列データとの変化の度合いを示す類似度が検出され、この類似度に応じて入力された現ページとしての文書画像の所定領域に係る符号列データが文字検索の対象から除外される。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく類似度が検出され、この類似度に応じて入力された現ページとしての文書画像の所定領域に係る符号列データが文字検索の対象から除外されるので、文字検索を短時間で実行することが可能になる。
【0053】
【発明の実施の形態】
本発明の実施の一形態を図1ないし図17に基づいて説明する。
【0054】
最初に、本発明の前提となる「階層符号化アルゴリズム」及び「JPEG2000アルゴリズム」の概要について説明する。
【0055】
図1は、JPEG2000方式の基本となる階層符号化アルゴリズムを実現するシステムの機能ブロック図である。このシステムは、色空間変換・逆変換部101、2次元ウェーブレット変換・逆変換部102、量子化・逆量子化部103、エントロピー符号化・復号化部104、タグ処理部105の各機能ブロックにより構成されている。
【0056】
このシステムが従来のJPEGアルゴリズムと比較して最も大きく異なる点の一つは変換方式である。JPEGでは離散コサイン変換(DCT:Discrete Cosine Transform)を用いているのに対し、この階層符号化アルゴリズムでは、2次元ウェーブレット変換・逆変換部102において、離散ウェーブレット変換(DWT:Discrete Wavelet Transform)を用いている。DWTはDCTに比べて、高圧縮領域における画質が良いという長所を有し、この点が、JPEGの後継アルゴリズムであるJPEG2000でDWTが採用された大きな理由の一つとなっている。
【0057】
また、他の大きな相違点は、この階層符号化アルゴリズムでは、システムの最終段に符号形成を行うために、タグ処理部105の機能ブロックが追加されていることである。このタグ処理部105で、画像の圧縮動作時には圧縮データが符号列データとして生成され、伸長動作時には伸長に必要な符号列データの解釈が行われる。そして、符号列データによって、JPEG2000は様々な便利な機能を実現できるようになった。例えば、ブロック・ベースでのDWTにおけるオクターブ分割に対応した任意の階層(デコンポジション・レベル)で、静止画像の圧縮伸長動作を自由に停止させることができるようになる(後述する図3参照)。
【0058】
原画像の入出力部分には、色空間変換・逆変換101が接続される場合が多い。例えば、原色系のR(赤)/G(緑)/B(青)の各コンポーネントからなるRGB表色系や、補色系のY(黄)/M(マゼンタ)/C(シアン)の各コンポーネントからなるYMC表色系から、YUVあるいはYCbCr表色系への変換又は逆変換を行う部分がこれに相当する。
【0059】
次に、JPEG2000アルゴリズムについて説明する。
【0060】
カラー画像は、一般に、図2に示すように、原画像の各コンポーネント111(ここではRGB原色系)が、矩形をした領域によって分割される。この分割された矩形領域は、一般にブロックあるいはタイルと呼ばれているものであるが、JPEG2000では、タイルと呼ぶことが一般的であるため、以下、このような分割された矩形領域をタイルと記述することにする(図2の例では、各コンポーネント111が縦横4×4、合計16個の矩形のタイル112に分割されている)。このような個々のタイル112(図2の例で、R00,R01,…,R15/G00,G01,…,G15/B00,B01,…,B15)が、画像データの圧縮伸長プロセスを実行する際の基本単位となる。従って、画像データの圧縮伸長動作は、コンポーネント毎、また、タイル112毎に、独立に行われる。
【0061】
画像データの符号化時には、各コンポーネント111の各タイル112のデータが、図1の色空間変換・逆変換部101に入力され、色空間変換を施された後、2次元ウェーブレット変換部102で2次元ウェーブレット変換(順変換)が施されて、周波数帯に空間分割される。
【0062】
図3には、デコンポジション・レベル数が3の場合の、各デコンポジション・レベルにおけるサブバンドを示している。すなわち、原画像のタイル分割によって得られたタイル原画像(0LL)(デコンポジション・レベル0)に対して、2次元ウェーブレット変換を施し、デコンポジション・レベル1に示すサブバンド(1LL,1HL,1LH,1HH)を分離する。そして引き続き、この階層における低周波成分1LLに対して、2次元ウェーブレット変換を施し、デコンポジション・レベル2に示すサブバンド(2LL,2HL,2LH,2HH)を分離する。順次同様に、低周波成分2LLに対しても、2次元ウェーブレット変換を施し、デコンポジション・レベル3に示すサブバンド(3LL,3HL,3LH,3HH)を分離する。図3では、各デコンポジション・レベルにおいて符号化の対象となるサブバンドを、網掛けで表してある。例えば、デコンポジション・レベル数を3としたとき、網掛けで示したサブバンド(3HL,3LH,3HH,2HL,2LH,2HH,1HL,1LH,1HH)が符号化対象となり、3LLサブバンドは符号化されない。
【0063】
次いで、指定した符号化の順番で符号化の対象となるビットが定められ、図1に示す量子化・逆量子化部103で対象ビット周辺のビットからコンテキストが生成される。
【0064】
この量子化の処理が終わったウェーブレット係数は、個々のサブバンド毎に、「プレシンクト」と呼ばれる重複しない矩形に分割される。これは、インプリメンテーションでメモリを効率的に使うために導入されたものである。図4に示したように、一つのプレシンクトは、空間的に一致した3つの矩形領域からなっている。更に、個々のプレシンクトは、重複しない矩形の「コード・ブロック」に分けられる。これは、エントロピー・コーディングを行う際の基本単位となる。
【0065】
ウェーブレット変換後の係数値は、そのまま量子化し符号化することも可能であるが、JPEG2000では符号化効率を上げるために、係数値を「ビットプレーン」単位に分解し、画素あるいはコード・ブロック毎に「ビットプレーン」に順位付けを行うことができる。
【0066】
ここで、図5はビットプレーンに順位付けする手順の一例を示す説明図である。図5に示すように、この例は、原画像(32×32画素)を16×16画素のタイル4つで分割した場合で、デコンポジション・レベル1のプレシンクトとコード・ブロックの大きさは、各々8×8画素と4×4画素としている。プレシンクトとコード・ブロックの番号は、ラスター順に付けられており、この例では、プレンシクトが番号0から3まで、コード・ブロックが番号0から3まで割り当てられている。タイル境界外に対する画素拡張にはミラーリング法を使い、可逆(5,3)フィルタでウェーブレット変換を行い、デコンポジション・レベル1のウェーブレット係数値を求めている。
【0067】
また、タイル0/プレシンクト3/コード・ブロック3について、代表的な「レイヤ」構成の概念の一例を示す説明図も図5に併せて示す。変換後のコード・ブロックは、サブバンド(1LL,1HL,1LH,1HH)に分割され、各サブバンドにはウェーブレット係数値が割り当てられている。
【0068】
レイヤの構造は、ウェーブレット係数値を横方向(ビットプレーン方向)から見ると理解し易い。1つのレイヤは任意の数のビットプレーンから構成される。この例では、レイヤ0,1,2,3は、各々、1,3,1,3のビットプレーンから成っている。そして、LSB(Least Significant Bit:最下位ビット)に近いビットプレーンを含むレイヤ程、先に量子化の対象となり、逆に、MSB(Most Significant Bit:最上位ビット)に近いレイヤは最後まで量子化されずに残ることになる。LSBに近いレイヤから破棄する方法はトランケーションと呼ばれ、量子化率を細かく制御することが可能である。
【0069】
図1に示すエントロピー符号化・復号化部104では、コンテキストと対象ビットから確率推定によって、各コンポーネント111のタイル112に対する符号化を行う。こうして、原画像の全てのコンポーネント111について、タイル112単位で符号化処理が行われる。最後にタグ処理部105は、エントロピー符号化・復号化部104からの全符号化データを1本の符号列データに結合するとともに、それにタグを付加する処理を行う。
【0070】
図6には、この符号列データの1フレーム分の概略構成を示している。この符号列データの先頭と各タイルの符号データ(bit stream)の先頭にはヘッダ(メインヘッダ(Main header)、タイル境界位置情報等であるタイルパートヘッダ(tile part header))と呼ばれるタグ情報が付加され、その後に、各タイルの符号化データが続く。なお、メインヘッダ(Main header)には、符号化パラメータや量子化パラメータが記述されている。そして、符号列データの終端には、再びタグ(end of codestream)が置かれる。また、図7は、符号化されたウェーブレット係数値が収容されたパケットをサブバンド毎に表わしたコード・ストリーム構造を示すものである。図7に示すように、タイルによる分割処理を行っても、あるいはタイルによる分割処理を行わなくても、同様のパケット列構造を持つことになる。
【0071】
一方、符号化データの復号化時には、画像データの符号化時とは逆に、各コンポーネント111の各タイル112の符号列データから画像データを生成する。この場合、タグ処理部105は、外部より入力した符号列データに付加されたタグ情報を解釈し、符号列データを各コンポーネント111の各タイル112の符号列データに分解し、その各コンポーネント111の各タイル112の符号列データ毎に復号化処理(伸長処理)を行う。このとき、符号列データ内のタグ情報に基づく順番で復号化の対象となるビットの位置が定められるとともに、量子化・逆量子化部103で、その対象ビット位置の周辺ビット(既に復号化を終えている)の並びからコンテキストが生成される。エントロピー符号化・復号化部104で、このコンテキストと符号列データから確率推定によって復号化を行い、対象ビットを生成し、それを対象ビットの位置に書き込む。このようにして復号化されたデータは周波数帯域毎に空間分割されているため、これを2次元ウェーブレット変換・逆変換部102で2次元ウェーブレット逆変換を行うことにより、画像データの各コンポーネントの各タイルが復元される。復元されたデータは色空間変換・逆変換部101によって元の表色系の画像データに変換される。
【0072】
以上が、「JPEG2000アルゴリズム」の概要である。
【0073】
以下、本発明の実施の一形態について説明する。なお、ここでは、JPEG2000を代表とする画像圧縮伸長技術に関する例について説明するが、言うまでもなく、本発明は以下の説明の内容に限定されるものではない。
【0074】
本実施の形態のサーバコンピュータ及びクライアントコンピュータは、そのコンピュータにインストールされるか、あるいは解釈されて実行される画像処理プログラムによって動作制御されて画像処理を実行する。本実施の形態では、そのような画像処理プログラムを記憶する記憶媒体も紹介する。
【0075】
図8は、本実施の形態におけるシステム構築例を示す模式図である。
【0076】
本実施の形態の画像データ処理システムでは、画像処理装置であるサーバコンピュータ2にLAN(Local Area Network)等のネットワーク3を介してクライアントコンピュータ4が複数台接続されたサーバクライアントシステム1を想定する。このサーバクライアントシステム1は、スキャナやデジタルカメラ等の画像入力装置5及びプリンタ等の画像出力装置6をネットワーク3上でシェアし得る環境が整えられている。また、ネットワーク3上には、マルチファンクションペリフェラルと称されるMFP7が接続され、このMFP7が画像入力装置5や画像出力装置6として機能するように環境が構築されていても良い。
【0077】
このようなサーバクライアントシステム1は、例えばイントラネット8を介して別のサーバクライアントシステム1とのデータ通信可能に構築され、インターネット通信網9を介して外部環境とデータ通信可能に構築されている。
【0078】
サーバコンピュータ2は、文書管理サーバ2aとデータ変換サーバ2bとで構成されている。文書管理サーバ2aは、各種文書の画像イメージを画像データとして記憶する文書管理機能を発揮するものである。データ変換サーバ2bは、例えば画像データにOCR(Optical Character Reader)処理を施してテキストデータを抽出する等のデータ変換機能を発揮するものである。
【0079】
以下においては、本発明の特長的な機能を発揮する画像処理装置であるサーバコンピュータ2(特に、データ変換サーバ2b)について説明する。
【0080】
図9は、本実施の形態における画像処理装置としてのサーバコンピュータ2のモジュール構成図である。サーバコンピュータ2は、情報処理を行うCPU(Central Processing Unit)11、情報を格納するROM(Read Only Memory)12及びRAM(Random Access Memory)13等の一次記憶装置14、後述する圧縮符号を記憶する記憶部であるHDD(Hard Disk Drive)15等の二次記憶装置16、情報を保管したり外部に情報を配布したり外部から情報を入手するためのCD−ROMドライブ等のリムーバブルディスク装置17、ネットワーク3を介して画像入力装置5や外部の他のコンピュータと通信により情報を伝達するためのネットワークインターフェース18、処理経過や結果等を操作者に表示するCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等の表示装置19、並びに操作者がCPU11に命令や情報等を入力するためのキーボード20、マウス等のポインティングディバイス21等から構成されており、これらの各部間で送受信されるデータをバスコントローラ22が調停して動作する。
【0081】
このようなサーバコンピュータ2では、ユーザが電源を投入するとCPU11がROM12内のローダーというプログラムを起動させ、HDD15よりオペレーティングシステムというコンピュータのハードウェアとソフトウェアとを管理するプログラムをRAM13に読み込み、このオペレーティングシステムを起動させる。このようなオペレーティングシステムは、ユーザの操作に応じてプログラムを起動したり、情報を読み込んだり、保存を行ったりする。オペレーティングシステムのうち代表的なものとしては、Windows(登録商標)、UNIX(登録商標)等が知られている。これらのオペレーティングシステム上で走る動作プログラムをアプリケーションプログラムと呼んでいる。
【0082】
ここで、サーバコンピュータ2は、アプリケーションプログラムとして、画像処理プログラムをHDD15に記憶している。この意味で、HDD15は、画像処理プログラムを記憶する記憶媒体として機能する。
【0083】
また、一般的には、サーバコンピュータ2のHDD15等の二次記憶装置16にインストールされる動作プログラムは、CD−ROMやDVD−ROM等の光情報記録メディアやFD等の磁気メディア等に記録され、この記録された動作プログラムがHDD15等の二次記憶装置16にインストールされる。このため、CD−ROM等の光情報記録メディアやFD等の磁気メディア等の可搬性を有する記憶媒体も、画像処理プログラムを記憶する記憶媒体となり得る。さらには、画像処理プログラムは、例えばネットワークインターフェース18を介して外部から取り込まれ、HDD15等の二次記憶装置16にインストールされても良い。
【0084】
サーバコンピュータ2は、オペレーティングシステム上で動作する画像処理プログラムが起動すると、この画像処理プログラムに従い、CPU11が各種の演算処理を実行して各部を集中的に制御する。サーバコンピュータ2のCPU11が実行する各種の演算処理のうち、本実施の形態の特長的な処理について以下に説明する。
【0085】
ここで、サーバコンピュータ2のCPU11が実行する各種の演算処理により実現される機能について説明する。図10に示すように、画像処理装置であるサーバコンピュータ2のデータ変換サーバ2bは、後段の文字検索に係る検索対象を制限させるための検索対象制限装置31と、符号化データを復号する画像伸長装置32と、符号化データを復号(伸長)した文書画像に基づいて文字認識を行うOCR処理装置33と、OCR処理結果として出力された文字コードに基づいて所望の文字を検索する文字検索装置34と、の各機能をCPU11が実行する各種の演算処理により実現する。
【0086】
画像伸長装置32は、周波数変換にDCTを使ったJPEG、あるいは周波数変換にDWTを使ったJPEG2000アルゴリズムによって圧縮符号化された符号化データを復号(伸長)する。本実施の形態における画像伸長装置32は、JPEG2000アルゴリズムによって圧縮符号化された符号化データを「JPEG2000アルゴリズム」に従って復号(伸長)する。なお、「JPEG2000アルゴリズム」に従った復号(伸長)処理については、図1で示した空間変換・逆変換部101、2次元ウェーブレット変換・逆変換部102、量子化・逆量子化部103、エントロピー符号化・復号化部104、タグ処理部105の説明において前述したので、ここでの説明は省略する。
【0087】
OCR処理装置33は、符号化データを復号した文書画像中から文字画像(2値化画像)を切り出し、切り出された文字画像を、文字画像と文字コードとの組みを予め記憶した辞書ファイルと比較(パターンマッチング)し、相違度の小さい文字画像又は類似度の大きな文字画像に組み合わされた文字コードをOCR処理結果として出力する。
【0088】
文字検索装置34は、OCR処理結果として出力された文字コードの中から所望の文字を検索する。
【0089】
次に、検索対象制限装置31について説明する。検索対象制限装置31は、図11に示すように、符号列の入力を受け付ける符号列入力手段41、構文解析手段42、検索対象制限手段43、類似度検出手段44、抽出条件指定手段45、符号列作成手段46、符号列を出力する符号列出力手段47の各種手段から構成される。これらの各種手段は、前述の画像処理プログラムにしたがってCPU11が行う処理により実現している。なお、リアルタイム性が重要視される場合には、処理を高速化する必要がある。そのためには、論理回路(図示せず)を別途設け、論理回路の動作により各種手段の機能を実現するようにするのが望ましい。
【0090】
構文解析手段42は、符号列入力手段41を介して入力された符号列データの構文すなわちヘッダ部に記述されているデータを解読し、類似度検出手段44に「ヘッダ部情報」を出力するものである。ここで、図12は構文解析手段42によるヘッダ部情報の読み取りを示す説明図である。図12に示すように、ペイロード部のデータ量、すなわち、「パケット長」は、周波数変換係数値の数の和(周波数変換係数値の符号量)であって、ヘッダ部に記述されている。ここでは、周波数変換係数値はウェーブレット係数値である。そして、構文解析手段42は、このヘッダ部情報を読み取って類似度検出手段44に対して出力する。
【0091】
抽出条件指定手段45は、類似度検出手段44に対して必要十分な情報だけを提供すべく、符号列入力手段41を介して入力された符号列データについての矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域を各々指定する条件指定手段として機能するものである。このように符号列データについて、矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域を任意に指定することにより、類似度の精度と検出処理速度を、ユーザの望みに応じて最適化することが可能である。すなわち、類似度の検出精度と検出処理速度の間にあるトレード・オフ関係を考慮に入れて、高速化を重視する場合には、小さな矩形領域の、輝度成分の低域サブバンドだけに注目すればよい。逆に、正確な類似度が必要な場合は、注目する矩形領域の面積を大きくし、サブバンドを高域まで調べればよい。
【0092】
類似度検出手段44は、概略的には、入力された現ページとしての文書画像に係る符号列データのヘッダ部情報と、事前に記憶してある参照ページとしての文書画像に係る符号列データのヘッダ部情報を各々比較し、現ページと参照ページとの変化の度合いを示す類似度を検出するものである。
【0093】
ここで、類似度検出手段44による現ページと参照ページとの類似度について説明する。ここでは、ペイロード部のデータ量、すなわち、「パケット長」に基づいて現ページと参照ページとの類似度を検出する手法について説明する。ここで、図13は類似度検出手段44の構成を示す機能ブロック図である。図13に示すように、ヘッダ部情報を受け取った類似度検出手段44は、そのヘッダ部情報から入力原稿のパケット長データを読み取る(パケット長読取手段44a)。そして、所定の文書画像についてのパケット長データを参照ページのパケット長データとして記憶しておく(パケット長記憶手段44b)。現ページと参照ページとの類似度は、符号量の変化量、すなわち、パケット長の変化量に現れることから、現ページと参照ページとの間におけるパケット長の差分を求めることにより(差分検出手段44c)、現ページと参照ページとの類似度を検出することができる。
【0094】
ここで、図14は符号量差と類似度との関係を示す説明図である。図14に示すように、類似度は符号量差(パケット長の差分値)の絶対値が小さいほど大きくなることがわかる。すなわち、符号量差(パケット長の差分値)に関して、現ページと参照ページとの間で変化が無い、あるいは非常に少ない場合は、現ページと参照ページとの間の類似度は非常に高いとみなすことができる。逆に、符号量差(パケット長の差分値)の差の絶対値が大きい場合は、現ページと参照ページとの類似度が小さい、あるいは、書類の種類が異なる、とみなすことができる。
【0095】
検索対象制限手段43は、類似度検出手段44から受け取った「現ページと参照ページとの類似度」に基づいて、文字検索装置34における文字検索を行うか否かを決定するものである。ここで、図15は検索対象制限手段43の構成を示す機能ブロック図である。図15に示すように、符号列データ及び「現ページと参照ページとの類似度」を受け取った検索対象制限手段43は、受け取った「現ページと参照ページとの類似度」とユーザが設定した閾値とを比較し、現ページと参照ページとが類似であるか否かを判定する(制限対象決定手段43a)。
【0096】
受け取った「現ページと参照ページとの類似度」が閾値以下であった場合、すなわち、現ページと参照ページとが類似である場合には、受け取った符号列データはスイッチ43b及びヘッダ書換手段43cをそのまま通過し、受け取った符号列データはそのまま符号列データとして使われる。
【0097】
一方、受け取った「パケット長」が閾値を超えた場合、すなわち、現ページと参照ページとが類似でない場合には、受け取った符号列データはスイッチ43bにおいて遮断され、ヘッダ書換手段43cで符号列データのヘッダ部の情報が書き換えられる。ヘッダ書換手段43cにおいては、文字検索装置34における文字検索時にこのパケットを無視するように、符号列データのヘッダ部の情報が書き換えられる。なお、このように符号列データのヘッダ部の情報を書き換えるのではなく、符号データのペイロード部のデータを削除するようにしても良い。
【0098】
符号列作成手段46は、検索対象制限手段43により符号列データのヘッダ部の情報が書き換えられた符号列データを標準形式の符号列データに整えるものである。こうすることにより、汎用のデコーダで、新たに生成した符号列データを伸長することが可能となる。
【0099】
以上説明したような検索対象制限装置31による検索対象制限処理について図16を参照しつつ更に詳細に説明する。一般に、同一の書類における各文書(原稿)においては、図16に示すように、同一内容のヘッダ(フッタ)が連続することになる。OCR処理装置33におけるOCR処理及び文字検索装置34における文字検索については、このようなヘッダ(フッタ)も対象となることから、書類の枚数が多数のページに及ぶ場合には、このようなヘッダ(フッタ)が検索処理速度に大きな影響を与えることになる。
【0100】
そこで、本実施の形態の画像処理装置であるサーバコンピュータ2のデータ変換サーバ2bにおいては、同一内容のヘッダ(フッタ)であれば現ページと参照ページとの間の類似度は非常に高いとみなすことができることから、検索対象制限装置31による検索対象制限処理によって最初に現われるヘッダ(フッタ)だけを残す、あるいは認識するようにし、それ以降に現われた同一内容のヘッダ(フッタ)については、削除、あるいは無視するようにすることで、検索処理速度の高速化を図ろうとするものである。図16に示す例では、参照ページを直前のページにしているが、複数の参照ページを持ってもよいし、途中で変更してもかまわない。
【0101】
ただし、このように現ページと参照ページとの間でヘッダ(フッタ)の類似度を検出する為には、ヘッダ部情報を読み取る「類似度検出用の領域」を矩形領域単位で予め指定しておくことが前提である。なお、符号列がJPEG2000フォーマットである場合、「類似度検出用の領域」を構成する矩形領域として、タイル、プレシンクトあるいはコード・ブロックを用いることができる。ここでは、図17に示すように、タイルで構成された「類似度検出用の領域」が、ヘッダを含むように指定されている。ヘッダが既に現われたかどうかの判定精度や、それに要する時間は、矩形領域、サブバンド、色成分を指定することにより、調整することができる。
【0102】
なお、検索の精度をより向上させるためには、全画像領域を読み込んだ現ページの符号データから、ページ間の位置ずれを除去し、また、ページ外縁部の汚れやパンチ穴等の不要情報を取り除いておくことが望ましい。
【0103】
ここに、画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて読み取られたパケット長に基づき、入力された現ページとしての文書画像の所定領域に係る符号列データと参照ページとしての文書画像の所定領域に係る符号列データとの変化の度合いを示す類似度が検出され、この類似度に応じて入力された現ページとしての文書画像の所定領域に係る符号列データが文字検索の対象から除外される。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく類似度が検出され、この類似度に応じて入力された現ページとしての文書画像の所定領域に係る符号列データが文字検索の対象から除外されるので、文字検索を短時間で実行することが可能になる。
【0104】
なお、本実施の形態においては、原画像にタイル分割処理を施した場合について説明したが、これに限るものではない。原画像に対してタイル分割を行わない場合でも、プレシンクトやコード・ブロックを矩形領域として利用すれば、タイル分割を行った場合と同様に、参照ページと現ページとの類似度を検出することが可能である。
【0105】
【発明の効果】
請求項1記載の発明の検索対象制限装置によれば、記憶部と、画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成された符号列データの入力を受け付ける符号列入力手段と、入力された前記符号列データの構文を解析して、所定領域に係る符号列データを構成するパケットのパケット長が記述されたヘッダ情報を取得する構文解析手段と、前記構文解析手段により取得された前記ヘッダ情報から前記パケット長を読み取り、読み取った一の前記パケット長を比較の対象となる参照ページとしての文書画像の前記パケット長として前記記憶部に保存し、新たに入力された現ページとしての文書画像の前記符号列データから前記パケット長を読み取り、当該パケット長と、前記記憶部に保存されている前記参照ページとしての文書画像の前記パケット長との差分値を類似度として検出する類似度検出手段と、前記類似度検出手段により検出された前記類似度が、所定の閾値以下である場合に、前記現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外するので、文字検索を短時間で実行することができる。また、参照ページと現ページとの所定領域についての類似度を高速、かつ、正確に求めることができる。
【0106】
請求項2記載の発明によれば、請求項1記載の検索対象制限装置において、前記構文解析手段における構文解析条件を指定する条件指定手段を備えることにより、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することで、類似度の精度と検出処理速度をユーザの望みに応じて最適化することができる。
【0108】
請求項3記載の発明によれば、請求項1または2に記載の検索対象制限装置において、前記検索対象制限手段は、文字検索の際に所定領域に係る符号列データを構成するパケットを無視するように、符号列データのヘッダ部の情報を書き換えることにより、現ページの所定領域に係る符号列データを文字検索の対象から除外することができる。
【0109】
請求項4記載の発明によれば、請求項1または2に記載の検索対象制限装置において、前記検索対象制限手段は、所定領域に係る符号列データのペイロード部のデータを削除することにより、現ページの所定領域に係る符号列データを文字検索の対象から除外することができる。
【0110】
請求項5記載の発明によれば、請求項3記載の検索対象制限装置において、前記検索対象制限手段によりヘッダ部の情報が書き換えられた符号列データを標準形式の符号列データに整える符号列作成手段を備えることにより、汎用のデコーダで、新たに生成した符号列データを伸長することができる。
【0111】
請求項6記載の発明は、請求項1ないし5のいずれか一記載の検索対象制限装置において、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるタイルであることにより、周波数変換として離散ウェーブレット変換を用いることができる。
【0112】
請求項7記載の発明によれば、請求項1ないし5のいずれか一記載の検索対象制限装置において、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるプレシンクトであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページと現ページとの所定領域についての類似度を検出することができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0113】
請求項8記載の発明によれば、請求項1ないし5のいずれか一記載の検索対象制限装置において、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるコード・ブロックであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページと現ページとの所定領域についての類似度を検出することができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0114】
請求項9記載の発明の画像処理装置によれば、請求項1ないし8のいずれか一記載の検索対象制限装置と、画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化した符号列データを伸長する画像伸長装置と、この画像伸長装置により伸長された文書画像に対して文字認識を行うOCR(Optical Character Reader)処理を実行するOCR処理装置と、このOCR処理装置によるOCR処理結果として出力された文字コードの中から所望の文字を検索する文字検索装置と、を備えることにより、請求項1ないし9のいずれか一記載の発明と同様の作用効果を奏する画像処理装置を提供することができる。
【0115】
請求項10記載の発明のプログラムによれば、コンピュータにインストールされるか、あるいは解釈されて実行されるプログラムであって、前記コンピュータに、記憶部と、画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成された符号列データの入力を受け付ける符号列入力手段と、入力された前記符号列データの構文を解析して、所定領域に係る符号列データを構成するパケットのパケット長が記述されたヘッダ情報を取得する構文解析機能と、前記構文解析手段により取得された前記ヘッダ情報から前記パケット長を読み取り、読み取った一の前記パケット長を比較の対象となる参照ページとしての文書画像の前記パケット長として前記記憶部に保存し、新たに入力された現ページとしての文書画像の前記符号列データから前記パケット長を読み取り、当該パケット長と、前記記憶部に保存されている前記参照ページとしての文書画像の前記パケット長との差分値を類似度として検出する類似度検出機能と、前記類似度検出手段により検出された前記類似度が、所定の閾値以下である場合に、前記現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外するので、文字検索を短時間で実行することができる。また、参照ページと現ページとの所定領域についての類似度を高速、かつ、正確に求めることができる。
【0116】
請求項11記載の発明によれば、請求項10記載のプログラムにおいて、前記構文解析機能における構文解析条件を指定する条件指定機能を前記コンピュータに実行させることにより、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することで、類似度の精度と検出処理速度をユーザの望みに応じて最適化することができる。
【0118】
請求項12記載の発明によれば、請求項10または11に記載のプログラムにおいて、前記検索対象制限機能は、文字検索の際に所定領域に係る符号列データを構成するパケットを無視するように、符号列データのヘッダ部の情報を書き換えることにより、現ページの所定領域に係る符号列データを文字検索の対象から除外することができる。
【0119】
請求項13記載の発明によれば、請求項10または11に一記載のプログラムにおいて、前記検索対象制限機能は、所定領域に係る符号列データのペイロード部のデータを削除することにより、現ページの所定領域に係る符号列データを文字検索の対象から除外することができる。
【0120】
請求項14記載の発明によれば、請求項11に記載のプログラムにおいて、前記検索対象制限機能によりヘッダ部の情報が書き換えられた符号列データを標準形式の符号列データに整える符号列作成機能を前記コンピュータに実行させることにより、汎用のデコーダで、新たに生成した符号列データを伸長することができる。
【0121】
請求項15記載の発明によれば、請求項10ないし14のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるタイルである。ことにより、周波数変換として離散ウェーブレット変換を用いることができる。
【0122】
請求項16記載の発明によれば、請求項10ないし14のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるプレシンクトであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページと現ページとの所定領域についての類似度を検出することができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0123】
請求項17記載の発明によれば、請求項10ないし14のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるコード・ブロックであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページと現ページとの所定領域についての類似度を検出することができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0124】
請求項18記載の発明の記憶媒体によれば、請求項10ないし17のいずれか一記載のプログラムを記憶していることにより、この記憶媒体に記憶されたプログラムをコンピュータに読み取らせることで、請求項11ないし19のいずれか一記載の発明と同様の作用効果を得ることができる。
【0125】
請求項19記載の発明の検索対象制限方法は、画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成された符号列データの入力を受け付ける符号列入力工程と、入力された前記符号列データの構文を解析して、所定領域に係る符号列データを構成するパケットのパケット長が記述されたヘッダ情報を取得する構文解析工程と、前記構文解析工程により取得された前記ヘッダ情報から前記パケット長を読み取り、読み取った一の前記パケット長を比較の対象となる参照ページとしての文書画像の前記パケット長として記憶手段に保存し、新たに入力された現ページとしての文書画像の前記符号列データから前記パケット長を読み取り、当該パケット長と、前記記憶手段により保存された前記参照ページとしての文書画像の前記パケット長との差分値を類似度として検出する類似度検出工程と、前記類似度検出工程により検出された前記類似度が、所定の閾値以下である場合に、前記現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外する検索対象制限工程と、を含み、画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて読み取られたパケット長に基づき、入力された現ページとしての文書画像の所定領域に係る符号列データと参照ページとしての文書画像の所定領域に係る符号列データとの変化の度合いを示す類似度を検出し、この類似度に応じて入力された現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外することにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく類似度を検出し、この類似度に応じて入力された現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外するので、文字検索を短時間で実行することができる。
【図面の簡単な説明】
【図1】本発明の前提となるJPEG2000方式の基本となる階層符号化アルゴリズムを実現するシステムの機能ブロック図である。
【図2】原画像の各コンポーネントの分割された矩形領域を示す説明図である。
【図3】デコンポジション・レベル数が3の場合の、各デコンポジション・レベルにおけるサブバンドを示す説明図である。
【図4】プレシンクトを示す説明図である。
【図5】ビットプレーンに順位付けする手順の一例を示す説明図である。
【図6】符号列データの1フレーム分の概略構成を示す説明図である。
【図7】符号化されたウェーブレット係数値が収容されたパケットをサブバンド毎に表わしたコード・ストリーム構造を示す説明図である。
【図8】本発明の実施の一形態のシステム構築例を示す模式図である。
【図9】画像処理装置としてのクライアントコンピュータのモジュール構成図である。
【図10】画像処理装置の構成を示す機能ブロック図である。
【図11】検索対象制限装置の構成を示す機能ブロック図である。
【図12】構文解析手段によるヘッダ部情報の読み取りを示す説明図である。
【図13】類似度検出手段の構成を示す機能ブロック図である。
【図14】符号量差と類似度との関係を示す説明図である。
【図15】検索対象制限手段の構成を示す機能ブロック図である。
【図16】検索対象制限装置による検索対象制限処理について例示的に示す説明図である。
【図17】「類似度検出用の領域」を示す説明図である。
【符号の説明】
2 画像処理装置
15 記憶媒体
31 検索対象制限装置
32 画像伸長装置
33 OCR処理装置
34 文字検索装置
42 構文解析手段
43 検索対象制限手段
44 類似度検出手段
44a パケット長読取手段
44b パケット長記憶手段
44c 差分検出手段
45 条件指定手段
46 符号列作成手段
Claims (19)
- 記憶部と、
画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成された符号列データの入力を受け付ける符号列入力手段と、
入力された前記符号列データの構文を解析して、所定領域に係る符号列データを構成するパケットのパケット長が記述されたヘッダ情報を取得する構文解析手段と、
前記構文解析手段により取得された前記ヘッダ情報から前記パケット長を読み取り、読み取った一の前記パケット長を比較の対象となる参照ページとしての文書画像の前記パケット長として前記記憶部に保存し、新たに入力された現ページとしての文書画像の前記符号列データから前記パケット長を読み取り、当該パケット長と、前記記憶部に保存されている前記参照ページとしての文書画像の前記パケット長との差分値を類似度として検出する類似度検出手段と、
前記類似度検出手段により検出された前記類似度が、所定の閾値以下である場合に、前記現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外する検索対象制限手段と、を備える検索対象制限装置。 - 前記構文解析手段における構文解析条件を指定する条件指定手段を備える請求項1記載の検索対象制限装置。
- 前記検索対象制限手段は、文字検索の際に所定領域に係る符号列データを構成するパケットを無視するように、符号列データのヘッダ部の情報を書き換える請求項1または2に記載の検索対象制限装置。
- 前記検索対象制限手段は、所定領域に係る符号列データのペイロード部のデータを削除する請求項1または2に一記載の検索対象制限装置。
- 前記検索対象制限手段によりヘッダ部の情報が書き換えられた符号列データを標準形式の符号列データに整える符号列作成手段を備える請求項3に記載の検索対象制限装置。
- 分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるタイルである請求項1ないし5のいずれか一記載の検索対象制限装置。
- 分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるプレシンクトである請求項1ないし5のいずれか一記載の検索対象制限装置。
- 分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるコード・ブロックである請求項1ないし5のいずれか一記載の検索対象制限装置。
- 請求項1ないし8のいずれか一記載の検索対象制限装置と、
画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化した符号列データを伸長する画像伸長装置と、
この画像伸長装置により伸長された文書画像に対して文字認識を行うOCR(Optical Character Reader)処理を実行するOCR処理装置と、
このOCR処理装置によるOCR処理結果として出力された文字コードの中から所望の文字を検索する文字検索装置と、を備える画像処理装置。 - コンピュータにインストールされるか、あるいは解釈されて実行されるプログラムであって、前記コンピュータに、
記憶部と、
画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成された符号列データの入力を受け付ける符号列入力手段と、
入力された前記符号列データの構文を解析して、所定領域に係る符号列データを構成するパケットのパケット長が記述されたヘッダ情報を取得する構文解析機能と、
前記構文解析手段により取得された前記ヘッダ情報から前記パケット長を読み取り、読み取った一の前記パケット長を比較の対象となる参照ページとしての文書画像の前記パケット長として前記記憶部に保存し、新たに入力された現ページとしての文書画像の前記符号列データから前記パケット長を読み取り、当該パケット長と、前記記憶部に保存されている前記参照ページとしての文書画像の前記パケット長との差分値を類似度として検出する類似度検出機能と、
前記類似度検出手段により検出された前記類似度が、所定の閾値以下である場合に、前記現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外する検索対象制限機能と、
を実行させるコンピュータに読取り可能なプログラム。 - 前記構文解析機能における構文解析条件を指定する条件指定機能を前記コンピュータに実行させる請求項10記載のプログラム。
- 前記検索対象制限機能は、文字検索の際に所定領域に係る符号列データを構成するパケットを無視するように、符号列データのヘッダ部の情報を書き換える請求項10または11に記載のプログラム。
- 前記検索対象制限機能は、所定領域に係る符号列データのペイロード部のデータを削除する請求項10または11に記載のプログラム。
- 前記検索対象制限機能によりヘッダ部の情報が書き換えられた符号列データを標準形式の符号列データに整える符号列作成機能を前記コンピュータに実行させる請求項11に記載のプログラム。
- 分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるタイルである請求項10ないし14のいずれか一記載のプログラム。
- 分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるプレシンクトである請求項10ないし14のいずれか一記載のプログラム。
- 分割単位である矩形領域は、「JPEG2000アルゴリズム」におけるコード・ブロックである請求項10ないし14のいずれか一記載のプログラム。
- 請求項10ないし17のいずれか一記載のプログラムを記憶している記憶媒体。
- 画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成された符号列データの入力を受け付ける符号列入力工程と、
入力された前記符号列データの構文を解析して、所定領域に係る符号列データを構成するパケットのパケット長が記述されたヘッダ情報を取得する構文解析工程と、
前記構文解析工程により取得された前記ヘッダ情報から前記パケット長を読み取り、読み取った一の前記パケット長を比較の対象となる参照ページとしての文書画像の前記パケット長として記憶手段に保存し、新たに入力された現ページとしての文書画像の前記符号列データから前記パケット長を読み取り、当該パケット長と、前記記憶手段により保存された前記参照ページとしての文書画像の前記パケット長との差分値を類似度として検出する類似度検出工程と、
前記類似度検出工程により検出された前記類似度が、所定の閾値以下である場合に、前記現ページとしての文書画像の所定領域に係る符号列データを文字検索の対象から除外する検索対象制限工程と、を含む検索対象制限方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003025136A JP4323178B2 (ja) | 2003-01-31 | 2003-01-31 | 検索対象制限装置、画像処理装置、プログラム、記憶媒体及び検索対象制限方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003025136A JP4323178B2 (ja) | 2003-01-31 | 2003-01-31 | 検索対象制限装置、画像処理装置、プログラム、記憶媒体及び検索対象制限方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004234564A JP2004234564A (ja) | 2004-08-19 |
JP4323178B2 true JP4323178B2 (ja) | 2009-09-02 |
Family
ID=32953493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003025136A Expired - Fee Related JP4323178B2 (ja) | 2003-01-31 | 2003-01-31 | 検索対象制限装置、画像処理装置、プログラム、記憶媒体及び検索対象制限方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4323178B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8810562B2 (en) * | 2009-05-19 | 2014-08-19 | Advanced Micro Devices, Inc. | Hierarchical lossless compression |
US10630991B2 (en) * | 2015-12-15 | 2020-04-21 | Nippon Telegraph And Telephone Corporation | Image difference detection device, method for detecting image difference, and computer program |
-
2003
- 2003-01-31 JP JP2003025136A patent/JP4323178B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004234564A (ja) | 2004-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4064196B2 (ja) | クライアントコンピュータ、サーバコンピュータ、プログラム、記憶媒体、画像データ処理システム及び画像データ処理方法 | |
JP4111268B2 (ja) | サムネイル画像の表示方法、サーバコンピュータ、クライアントコンピュータ及びプログラム | |
JP4111926B2 (ja) | 画像処理装置、プログラム、記憶媒体及び画像送信方法 | |
JP2004194152A (ja) | 画像処理装置、プログラム、記憶媒体及び画像編集方法 | |
JP2004221836A (ja) | 画像処理装置、プログラム、記憶媒体及び符号伸長方法 | |
US7627185B2 (en) | Hierarchically compressing and coding and storing image data | |
US20030068089A1 (en) | Image processing system processing code data | |
JP3952459B2 (ja) | 画像処理装置、プログラム、記憶媒体及び画像処理方法 | |
JP2004242290A (ja) | 画像処理装置および画像処理方法、画像編集処理システム、画像処理プログラム及び記憶媒体 | |
JP2004214828A (ja) | 画像処理装置、画像処理方法、画像処理用コンピュータプログラム、及びこの画像処理用コンピュータプログラムを記憶する記憶媒体 | |
JP2004221633A (ja) | 画像処理装置、画像処理用プログラム及び記憶媒体 | |
US8081093B2 (en) | Code transforming apparatus and code transforming method | |
US20050207659A1 (en) | Image-processing apparatus, program, and recording medium | |
JP4323178B2 (ja) | 検索対象制限装置、画像処理装置、プログラム、記憶媒体及び検索対象制限方法 | |
JP4723543B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP4280508B2 (ja) | 位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法 | |
JP4052952B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP3961966B2 (ja) | 不要部除去装置、画像処理装置、プログラム、記憶媒体及び不要部除去方法 | |
JP4093870B2 (ja) | 画像処理装置、プログラムおよび記憶媒体 | |
JP4010957B2 (ja) | 画像処理装置、プログラム、記憶媒体および画像形成装置 | |
JP3987425B2 (ja) | 画像伸長装置、プログラム、記憶媒体及び画像伸長方法 | |
JP2004064180A (ja) | 画像処理装置、プログラム及び記憶媒体 | |
JP4374063B2 (ja) | 画像処理装置、プログラム及び記憶媒体 | |
JP2005223407A (ja) | 画像処理装置及びプログラム | |
JP2004201048A (ja) | 画像情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041008 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051116 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20051021 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090602 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090604 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4323178 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120612 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130612 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |