JP4553055B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP4553055B2 JP4553055B2 JP2009110313A JP2009110313A JP4553055B2 JP 4553055 B2 JP4553055 B2 JP 4553055B2 JP 2009110313 A JP2009110313 A JP 2009110313A JP 2009110313 A JP2009110313 A JP 2009110313A JP 4553055 B2 JP4553055 B2 JP 4553055B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- module
- code
- font
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/182—Extraction of features or characteristics of the image by coding the contour of the pattern
- G06V30/1823—Extraction of features or characteristics of the image by coding the contour of the pattern using vector-coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/245—Font recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Controls And Circuits For Display Device (AREA)
Description
これに関連する技術として、例えば、特許文献1には、紙原稿中の文字をアウトライン化する際には、できるだけ高解像度で二値化した文字オブジェクト二値画像をアウトライン化した方が、高画質なアウトラインデータを生成できるが、一方で、高解像度二値画像をアウトライン化する際には、情報量が大きいためにアウトライン化処理時間がかかるという問題点を鑑み、処理時間を短縮しつつ、高品位なアウトライン化画像を生成することを目的とし、小さな文字は高解像度二値画像よりアウトライン化し、大きな文字は低解像度二値画像よりアウトライン化することが開示されている。
これに関連する技術として、例えば、特許文献2には、文字の種類を誤りなく自動的に認識し、文字認識の際に操作者が文字の種類を切り分ける負荷を軽減すると共に、無駄な動作をさせないようにすることを目的とし、文書画像を認識する文書認識装置におけるマーク取り出し手段は、文書画像内の文字行に対して、連結した黒画素塊を取り出し、マーク解析手段により前記黒画素塊の最下辺の座標における黒画素塊の分布を解析し、文字識別手段は、前記マーク解析手段により解析された黒画素塊の分布に基づいて文字の種類を識別し、マークの解析は、黒画素塊の外接矩形間の接触関係を取り出し、その接触関係にある個数を計数したり、あるいは黒画素塊の外接矩形の縦方向又は横方向のマークの個数を計数することによって行うことが開示されている。
本発明は、本構成を有していない場合に比較して、圧縮率を高くすることができ、また、画質の劣化を少なくする画像処理装置及び画像処理プログラムを提供することを目的とする。
本願請求項1記載の発明は、画像データから画素の塊を切り出し、該画素の塊の位置を抽出する切出手段と、前記切出手段によって切り出された画素の塊から類似している画素の塊を抽出し、該画素の塊を一意に識別できる符号を対応付ける類似画像抽出手段と、前記類似画像抽出手段によって抽出された類似の画素の塊に基づいて、画素の塊の位相を推定する位相推定手段と、前記類似画像抽出手段によって抽出された類似の画素の塊と前記位相推定手段によって推定された位相に基づいて、より高解像度の代表画像を生成する高解像度代表画像生成手段と、前記高解像度代表画像生成手段によって生成された画素の塊をベクトル情報に変換するベクトル変換手段と、前記切出手段によって抽出された画素の塊の位置、前記類似画像抽出手段によって該画素の塊に対応付けられた符号、前記位相推定手段によって推定された位相及び前記ベクトル変換手段によって変換されたベクトル情報に基づいて、符号化を行う符号化手段を具備することを特徴とする画像処理装置である。
図1は、本発明を実現するにあたっての第1の実施の形態の概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システム及び方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示等)を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。
なお、1つの画素の塊として、1文字の画像となる場合が多い。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。以下、「文字」又は「文字画像」という場合は、特に断りがない限り「画素の塊」の意で用いる。
また、第1の符号としてフォントコード、第2の符号として画像コード、第3の符号として文字コードを主に例示して説明する。また、画素の塊と第1の符号を関連付けた画素塊・符号関連情報として、フォントファイルを主に例示して説明する。
また、ファイルとは、一つの単位として記憶又は処理される、名前の付いた情報の集合であり、OS(オペレーティングシステム)や応用ソフトウェアがプログラムやデータを扱う際のひとまとまりの単位となるものである。
文字切り出しモジュール110は、図1に示すように、文字コード決定モジュール120、フォント登録モジュール130、出力ファイル形成モジュール140と接続されており、入力画像から文字画像(画素の塊)を切り出す。切り出した文字画像を文字コード決定モジュール120、フォント登録モジュール130へ渡し、切り出した文字画像の文字サイズ(画素の塊のサイズ)と入力画像における位置を出力ファイル形成モジュール140へ渡す。
割り当てた文字コードをフォント登録モジュール130、出力ファイル形成モジュール140へ渡す。
なお、各文字コードに対して、全て文字サイズと位置が必要なわけではない。相対的にサイズと位置が決定できる場合には、必要な部分のみ指定すればよい。例えば、文字サイズが変化しない場合は、最初に1回のみ指定すればよい。あるいは、Y座標が変化しない場合には、X座標のみ指定すればよい。あるいは、フォントのサイズが固定されている場合には、サイズを指定する必要はない。
出力ファイル形成モジュール140でまとめたファイルは、出力ファイルとして出力される。このファイル形式としては、フォント情報を含めることができるものであればよく、例えばPDF(Portable Document Format)(登録商標)を挙げることができる。
ステップS202では、文字切り出しモジュール110が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップS204では、文字コード決定モジュール120が、ステップS202で切り出された各文字画像に文字コードを割り当てる。
ステップS206では、フォント登録モジュール130が、ステップS202で切り出された文字画像とステップS204で割り当てられた文字コードとを対応付けてフォントファイルを生成する。
ステップS208では、出力ファイル形成モジュール140が、ステップS202で抽出された文字サイズと位置、ステップS204で割り当てられた文字コード、ステップS206で作成されたフォントファイルをまとめて、出力ファイルを形成する。
なお、ステップS202で、全ての文字画像を切り出したが、1つの文字画像を切り出して、ステップS204〜ステップS208の処理を行ってもよい。その場合、ステップS202〜ステップS208までを繰り返して処理を行うことになる。
文字切り出しモジュール310は、図3に示すように、代表文字決定モジュール320、出力ファイル形成モジュール350と接続されており、その機能は第1の実施の形態の文字切り出しモジュール110と同様であり、切り出した文字画像を代表文字決定モジュール320へ渡し、切り出した文字画像の文字サイズと入力画像における位置を出力ファイル形成モジュール350へ渡す。
文字の相似度を検証して代表文字を決定する方式として以下を例に挙げる。
(1)切り出された文字画像である2枚の二値画像を入力する。
(2)2枚の入力画像の黒画素の重心をあわせる。
(3)重心をあわせた2枚の入力画像のXOR(eXclusive OR:排他的論理和)演算を行う。
(4)XOR演算の結果、1となった画素(相違する画素)の個数を数える。この個数が閾値以下であれば、類似する文字画像であると判断する。
(5)切り出された文字画像に対して、他の文字画像との相似度を前記の手法で計算し、次々に似ている文字画像をまとめる。
(6)このように似ている文字画像を共通化して、代表文字を生成する。
つまり、代表文字を生成することによって、入力画像の中から一部の画像データである文字画像を共通化している。具体的には、文字画像を共通化するとは、前述したように、複数の文字画像から1つの共通した代表文字を生成すること、又は複数の文字画像の中から1つの文字画像を代表文字として選択すること等がある。
したがって、代表文字としては、例えば、似ている文字画像の平均値を計算し、それを二値化した文字画像、又は、似ている文字画像の中から1つを選択したもの等となる。
さらに、2つの文字画像パターンの論理演算の結果画像に基づいて膨張画像を生成し、その膨張画像と重なり合う割合に基づいて、類似しているか否かを判定するようにしてもよい。つまり、完全に一致する場合の膨張させる度合い(膨張半径)によって、相違度を判定するようにしてもよい。
この他に、特開平07−200745号公報、I. H. Witten, A.Moffat, and T. C. Bell 著「Managing Gigabytes」 Morgan Kaufmmann Publishers pp.320-332.等に記載されている方法を用いてもよい。
類似度の代わりに、2つの画像が合同である場合に最小となり、相違する度合いに応じて増加する量を用いてもよい。この場合は、「距離」又は「相違度」と呼ばれる。距離とは、画像をベクトルで表した場合(画素値そのものをベクトルとする、又は画像の特徴量をベクトルとする等)に、ベクトルで表現した画像を空間内に配置し、その空間内での各画像同士の隔たり(距離)のことである。例えば、ユークリッド距離、マンハッタン距離、ハウスドルフ距離、マハラノビス距離、ベクトル間の角度θ、cosθ、cosθの2乗等がある。
フォント登録モジュール340は、図3に示すように、代表文字決定モジュール320、文字コード決定モジュール330、出力ファイル形成モジュール350と接続されており、入力する文字画像が代表文字決定モジュール320によって生成された代表文字である以外は、第1の実施の形態のフォント登録モジュール130と同様である。ただし、類似する文字画像(入力画像内に複数出現している文字画像)に対して、1つの文字コードが割り当てられ、その1つの文字コードには1つのフォントが対応していることになる。
出力ファイル形成モジュール350は、図3に示すように、文字切り出しモジュール310、文字コード決定モジュール330、フォント登録モジュール340と接続されており、第1の実施の形態の出力ファイル形成モジュール140と同様である。ただし、類似する文字画像に対して、1つのフォントが対応している。したがって、出力ファイル形成モジュール350が形成した出力ファイルを用いて、元の画像(入力画像)を再現する場合、1つのフォントを複数回(入力画像内に類似する文字画像が出現している回数分)参照して、元の画像を描画することになる。
ステップS402では、文字切り出しモジュール310が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップS404では、代表文字決定モジュール320が、ステップS402で切り出された文字画像から代表文字を決定する。
ステップS406では、文字コード決定モジュール330が、ステップS404で決定された代表文字に文字コードを割り当てる。
ステップS408では、フォント登録モジュール340が、ステップS404で決定された代表文字とステップS406で割り当てられた文字コードとを対応付けてフォントファイルを生成する。
ステップS410では、出力ファイル形成モジュール350が、ステップS402で抽出された文字サイズと位置、ステップS406で割り当てられた文字コード、ステップS408で作成されたフォントファイルをまとめて、出力ファイルを形成する。
文字切り出しモジュール510は、図5に示すように、代表文字決定モジュール520、出力ファイル形成モジュール560と接続されており、第2の実施の形態の文字切り出しモジュール310と同様である。
代表文字決定モジュール520は、図5に示すように、文字切り出しモジュール510、文字コード決定モジュール530、拡大モジュール540と接続されており、決定した代表文字を拡大モジュール540へ渡すこと以外は、第2の実施の形態の代表文字決定モジュール320と同様である。
文字コード決定モジュール530は、図5に示すように、代表文字決定モジュール520、フォント登録モジュール550、出力ファイル形成モジュール560と接続されており、第2の実施の形態の文字コード決定モジュール330と同様である。
なお、フォント登録モジュール550は、次のような処理を行ってもよい。
異なる代表文字画像に対して、文字コード決定モジュール530によって(特に文字認識を行った場合)同じ文字コードが付されることもありえる。この場合、各々の代表文字を別のフォント種として登録してもよい。
つまり、次のように行う。
(1)フォント種X(X=0,1,2,...)を登録するとする。
(2)代表文字画像の文字認識を行い、文字コードがYとなったとする。この文字コードYの文字画像を、フォント種Xに登録する。ただし、フォント種Xは、文字コードYが登録されていないフォント種Xの中で、最もXの値が小さいものとする。
(2−1)すなわち、文字コードYが初めて出現した場合は、フォント種0に登録する。
(2−2)フォント種0,1,,,,N−1に文字コードYが登録されている場合、フォント種Nに文字コードYを登録する。
文字切り出しモジュール510は、複数の「2」という文字が記載された入力画像610を対象画像とする。文字切り出しモジュール510は、図6に示すように、文字画像611、文字画像612、文字画像613を文字画像611の解像度で切り出す。そして、文字サイズ/文字位置データ650を抽出する。
代表文字決定モジュール520は、これらの複数の「2」という文字画像が類似していると判定する。
文字コード決定モジュール530は、「2」という文字画像の文字コード・データ640を割り当てる。
拡大モジュール540は、文字画像611、文字画像612、文字画像613の重点(重心線611A等の交差点)を求め、その重点を一致させるように位相を移動して高解像度文字画像620を生成する。
フォント登録モジュール550は、高解像度文字画像620からアウトライン情報であるフォント・データ630を生成する。
出力ファイル形成モジュール560は、フォント・データ630、文字コード・データ640、文字サイズ/文字位置データ650から出力ファイルを形成する。
図7(A)は、入力画像610の解像度(第1の解像度)における標本化格子(第1の標本化格子71、第1の標本化格子72、第1の標本化格子73、第1の標本化格子74)及び文字画像の重心位置(重心71A、重心72A、重心73A、重心74A)を表している。
拡大モジュール540は、まず、図7(B)に示すように、文字画像の重心に基づいて、4つの標本化格子の位相を移動させる。
図7(D)において、第2の標本化格子76は高解像度画像の標本化格子である。
拡大モジュール540は、第1の解像度における4つの標本化格子の位相が移動されると、図7(C)に示すように、第2の解像度における標本化格子を設定し、図7(D)に示すように、文字画像の重心が一致するように、第2の解像度における標本化格子の位相を移動させる。
そして、拡大モジュール540は、第1の解像度における各文字画像の位相に基づいて、その各文字画像の画素値から、第2の解像度における文字画像の画素値を補間する。本例では、拡大モジュール540は、最近傍補間法を適用して、第2の解像度における文字画像の画素値を補間する。すなわち、拡大モジュール540は、第1の解像度における文字画像の4つの値(図7(E)では、丸数字の1、2、3、4)のうち、第2の解像度における標本化格子点に最も近い値を選択して、第2の解像度における文字画像の値とする。具体的には、第2の標本化格子76Aでは、中心に最も近い値は「1」であり、「1」を採用している(丸数字は1である)。なお、補間方法は、この方法に限定されるものではなく、その他の方法(例えば、線形補間法など)を適用してもよい。
なお、拡大モジュール540の処理は、前述の処理に限られず、線形補間、キュービックコンボリューション等でもよい。
ステップS802では、文字切り出しモジュール510が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップS804では、代表文字決定モジュール520が、ステップS802で切り出された文字画像から代表文字を決定する。
ステップS806では、文字コード決定モジュール530が、ステップS804で決定された代表文字に文字コードを割り当てる。
ステップS808では、拡大モジュール540が、ステップS804で決定された代表文字を拡大する。
ステップS810では、フォント登録モジュール550が、ステップS808で拡大された代表文字とステップS806で割り当てられた文字コードとを対応付けてフォントファイルを生成する。
ステップS812では、出力ファイル形成モジュール560が、ステップS802で抽出された文字サイズと位置、ステップS806で割り当てられた文字コード、ステップS810で作成されたフォントファイルをまとめて、出力ファイルを形成する。
文字切り出しモジュール910は、図9に示すように、代表文字決定モジュール920、出力ファイル形成モジュール960と接続されており、第3の実施の形態の文字切り出しモジュール510と同様である。
代表文字決定モジュール920は、図9に示すように、文字切り出しモジュール910、拡大モジュール930と接続されており、拡大モジュール930にのみ代表文字を渡すこと以外は、第3の実施の形態の代表文字決定モジュール520と同様である。
文字コード決定モジュール940は、図9に示すように、拡大モジュール930、フォント登録モジュール950、出力ファイル形成モジュール960と接続されており、拡大モジュール930によって拡大された代表文字を受け取り、その代表文字の文字コードを割り当てる。代表文字は高解像度化が行われており、例えば、文字コードの割り当てとして文字認識を行わせ、誤認識の少ない文字認識を行わせるようにしてもよい。そして、その文字コードをフォント登録モジュール950、出力ファイル形成モジュール960へ渡す。
フォント登録モジュール950は、図9に示すように、拡大モジュール930、文字コード決定モジュール940、出力ファイル形成モジュール960と接続されており、第3の実施の形態のフォント登録モジュール550と同様である。
出力ファイル形成モジュール960は、図9に示すように、文字切り出しモジュール910、文字コード決定モジュール940、フォント登録モジュール950と接続されており、第3の実施の形態の出力ファイル形成モジュール560と同様である。
ステップS1002では、文字切り出しモジュール910が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップS1004では、代表文字決定モジュール920が、ステップS1002で切り出された文字画像から代表文字を決定する。
ステップS1006では、拡大モジュール930が、ステップS1004で決定された代表文字を拡大する。
ステップS1008では、文字コード決定モジュール940が、ステップS1006で拡大された代表文字に文字コードを割り当てる。
ステップS1010では、フォント登録モジュール950が、ステップS1006で拡大された代表文字とステップS1008で割り当てられた文字コードとを対応付けてフォントファイルを生成する。
ステップS1012では、出力ファイル形成モジュール960が、ステップS1002で抽出された文字サイズと位置、ステップS1008で割り当てられた文字コード、ステップS1010で作成されたフォントファイルをまとめて、出力ファイルを形成する。
第1〜第4の実施の形態では、文字の切り出しを行った後、その切り出した画像に対して文字コードを一つ与えていた。
しかし、文字の切り出しの手法、又は文字の画像的特徴から切り出した文字画像に2つ以上の文字コードを付与すべき場合が生じる。つまり、切り出した画像に対して、文字コードが2つ以上存在するような場合に対応できない場合が生じる。
そこで、第5〜第7の実施の形態では、切り出した画像に対して文字コードを2つ以上対応させるべき場合にも対応できるようにしたものである。
文字切り出しの手法としては、文字認識のために行うものとして様々な手法が提案されている。例えば、特許文献2〜5に挙げるものの他、特開平06−44406号公報、特開平06−187489号公報、特開平06−348911号公報、特開平07−13994号公報、特開平07−160810号公報、特開平08−161432号公報、特開平08−297718号公報、特開平10−69524号公報、特開平10−134145号公報、特開平10−261047号公報等の文献に記載された手法を用いればよい。
図11は、文字切り出し処理の結果の例を示したものである。図11に示すように、「A」、「B」、「C」などのように、通常の場合には、一つの文字に対して、一つの矩形(画像)を対応させることができる。
しかし、「ff」などのように、どうしても文字ごとに矩形に分割することができず、矩形の中に複数の文字がある場合が存在する。
第5〜第7の実施の形態は、このような場合にも対応しようとするものである。
切り出した文字画像を、フォント登録モジュール1220、フォントコード決定モジュール1230、文字コード決定モジュール1240へ渡し、文字サイズと文字画像の位置を出力ファイル形成モジュール1260へ渡す。また、画像コードをそれぞれのモジュールへ渡し、その画像コードによって対応をとれるようにしてもよい。
また、文字切り出しモジュール1210では、各切り出し文字画像に番号(画像コード)を付与する。この画像コードは、各切り出し文字画像が特定できればよい符号である。図15に示す例は、1から順に画像コードを割り当てた例である。
フォント登録モジュール1220は、文字切り出しモジュール1210によって切り出された文字画像とフォントコード決定モジュール1230によって割り当てられたフォントコードを関連付けたフォントファイルを生成する。つまり、フォント登録モジュール1220では、文字画像つまりフォントを図16に示すように登録する。フォントファイルは、図16に示すようなフォント情報1600の構成となっており、フォントコード欄1601とフォント欄1602を有するテーブルである。図16の内容は、図15に示した例を示している。
なお、本実施の形態では、フォントコードを画像コードと同じ番号として定義する。画像形成時(つまり、復元時)には、画像コードから、フォントコードを決めて、フォント画像を取得すればよい。又は、フォントコードとして、現実のフォントに利用可能なコードを割り当ててもよい。例えば、外字コードを重複がないように割り当ててもよい。
生成したフォントファイルを出力ファイル形成モジュール1260へ渡す。
フォントコード決定モジュール1230は、文字切り出しモジュール1210によって切り出された文字画像に対してフォントコードを割り当てる。また、フォントコードとそのフォントコードに対応する文字画像の画像コードを対応付けるようにしてもよい。その結果を、フォント登録モジュール1220、出力ファイル形成モジュール1260、フォントコード・文字コード対応表作成モジュール1250へ渡す。
文字コード決定モジュール1240は、文字切り出しモジュール1210によって切り出された文字画像に対して、文字認識を行う。つまり、切り出した文字画像それぞれに対して、文字認識を行った結果の文字コードを与える。文字認識の結果である文字コードをフォントコード・文字コード対応表作成モジュール1250へ渡す。
フォントコード・文字コード対応表作成モジュール1250は、フォントコード決定モジュール1230によって割り当てられたフォントコードと文字コード決定モジュール1240によって文字認識された結果である文字コードを対応付ける。その結果を出力ファイル形成モジュール1260へ渡す。
文字コード決定モジュール1240で、切り出した各文字画像(あるいはフォント)に対して文字コードが一つ対応する場合には、画像コード、又は、フォントコードとして、文字コードを再割当するようにしてもよい。
しかし、切り出した各文字画像(すなわち、画像コード、又は、フォントコードに対応)に対して文字コードが2つ以上対応する場合には、前述の対応を行うことができない。
そこで、フォントコード・文字コード対応表作成モジュール1250において、フォントコードと文字コードの対応表(フォントコード・文字コード対応表1700)を作成する。
フォントコード・文字コード対応表1700は、図17に示すように、フォントコードを入力として、一つあるいは複数の文字コードを出力するものであり、より具体的には、フォントコード・文字コード対応表1700はフォントコード欄1701と文字コード欄1702を有しているテーブルである。ただし、図17において、<X>は、文字「X」のコードを示している。
出力ファイル形成モジュール1260は、フォント登録モジュール1220によって生成されたフォントファイル及びフォントコード決定モジュール1230によって割り当てられたフォントコードと文字切り出しモジュール1210によって抽出されたそのフォントコードに対応する文字画像の位置に基づいて、出力ファイルを形成する。
また、出力ファイル形成モジュール1260は、フォント登録モジュール1220によって生成されたフォントファイル及びフォントコード決定モジュール1230によって割り当てられたフォントコードと文字切り出しモジュール1210によって抽出されたそのフォントコードに対応する文字画像の位置とその文字画像のサイズに基づいて、ファイルを形成するようにしてもよい。
さらに、フォントコード・文字コード対応表作成モジュール1250によって対応付けられたフォントコードと文字コードの対応に基づいて、ファイルを形成するようにしてもよい。
また、出力ファイル形成モジュール1260は、フォント登録モジュール1220によって生成されたフォントファイル、フォントコード決定モジュール1230によって割り当てられたフォントコードと文字切り出しモジュール1210によって抽出されたそのフォントコードに対応する画素の塊の位置、及びフォントコード・文字コード対応表作成モジュール1250によって対応付けられたフォントコードと文字コードの対応に基づいて、ファイルを形成するようにしてもよい。
以上において、フォントコード・文字コード対応表1903は、必須ではない。出力ファイルで文字コードを取得する必要がない場合には、削除することも可能である。この場合の出力ファイルの例を図20に示す。つまり、出力ファイル2000は、フォントファイル2001、フォントコード・文字サイズ・位置対応表2002を有している。
この場合、図12に示した文字コード決定モジュール1240とフォントコード・文字コード対応表作成モジュール1250も不要である。つまり、文字切り出しモジュール1210、フォント登録モジュール1220、フォントコード決定モジュール1230、出力ファイル形成モジュール1260を有しているものであってもよい。
ステップS2102では、文字切り出しモジュール1210が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップS2104では、フォントコード決定モジュール1230が、ステップS2102で切り出された各文字画像に対して、フォントコードを割り当てる。
ステップS2106では、フォント登録モジュール1220が、ステップS2102で切り出された各文字画像とステップS2104で割り当てられたフォントコードを用いて、フォントファイルを生成する。
ステップS2108では、文字コード決定モジュール1240が、ステップS2102で切り出された各文字画像に対して、文字コードを割り当てる。
ステップS2110では、フォントコード・文字コード対応表作成モジュール1250が、ステップS2104で割り当てられたフォントコードとステップS2108で割り当てられた文字コードとを対応付けてフォントコード・文字コード対応表1700を作成する。
ステップS2112では、出力ファイル形成モジュール1260が、ステップS2106で生成されたフォントファイル、ステップS2104で割り当てられたフォントコード、ステップS2110で作成されたフォントコード・文字コード対応表1700、ステップS2102で抽出された文字サイズと位置をまとめて、出力ファイルを形成する。
第6の実施の形態は、文字画像の切り出し結果の中から、類似の文字を発見して、その類似文字群から、代表文字画像を作成し、代表文字画像をフォント登録する構成である。
文字切り出しモジュール2210は、図12に示した文字切り出しモジュール1210と同様である。切り出した文字画像を、代表文字決定モジュール2220、文字コード決定モジュール2230へ渡し、文字サイズと文字画像の位置を出力ファイル形成モジュール2270へ渡す。また、画像コードをそれぞれのモジュールへ渡し、その画像コードによって対応をとれるようにしてもよい。
文字コード決定モジュール2230は、文字切り出しモジュール2210によって切り出された文字画像に対して、文字認識を行う。さらに、文字認識を行った文字画像の画像コードとその文字認識の結果である文字コードとを対応付けるようにしてもよい。その文字コードと画像コードとの対応を代表文字決定モジュール2220、フォントコード・文字コード対応表作成モジュール2260へ渡す。
代表文字決定モジュール2220は、文字切り出しモジュール2210によって切り出された文字画像から同様の画素の塊をまとめて代表の文字画像を生成する。そして、その代表の文字画像に文字コード決定モジュール2230による文字認識の結果である文字コードを対応させる。類似文字発見手法、代表文字作成手法は、図3に示した代表文字決定モジュール320と同様である。その結果をフォント登録モジュール2240、フォントコード決定モジュール2250へ渡す。
なお、1つの文字画像に複数の文字が含まれている場合は、複数の画像コードに1つのフォントコードを割り当てることになる。
例えば、図13に示した画像が入力され、文字切り出しモジュール2210によって図14に示すような文字切り出しが行われ、図15に示すように画像コードが割り当てられた場合、代表文字決定モジュール2220は、画像コード1と画像コード7とに対応する文字画像が同じ形状であると判断し、代表文字を生成する。同様に、画像コード2と画像コード5とに対応する文字画像が同じ形状、画像コード4と画像コード6と画像コード8とに対応する文字画像が同じ形状、であると判断し、代表文字を生成する。なお、画像コード3に対応する文字画像には類似するものがないので、代表文字は画像コード3に対応する文字画像である。そして、フォントコードは、4つの代表文字に付与することになる。
フォント登録モジュール2240は、代表文字決定モジュール2220によって生成された代表の文字画像とフォントコード決定モジュール2250によって割り当てられたフォントコードを関連付けたフォントファイルを生成する。そのフォントファイルを出力ファイル形成モジュール2270へ渡す。
代表文字決定モジュール2220の説明で示した例では、フォント登録モジュール2240は、図23に示すような登録を行う。つまり、フォント情報2300には、フォントコード欄2301にフォントコードとして1〜4を記憶し、フォント欄2302に、それぞれのフォント(画像コード1,7の代表文字画像、画像コード2,5の代表文字画像、画像コード3の代表文字画像、画像コード4,6,8の代表文字画像)を記憶する。
フォントコード決定モジュール2250は、代表文字決定モジュール2220によって生成された代表の文字画像に対してフォントコードを割り当て、フォントコードとそのフォントコードに対応する文字画像の画像コードを対応付ける。その結果をフォント登録モジュール2240、フォントコード・文字コード対応表作成モジュール2260、出力ファイル形成モジュール2270に渡す。
例えば、画像コードからフォントコードへ変換する際に用いる画像コード・フォントコード変換表2400を作成して、画像コードからフォントコードへの変換を行う。画像コード・フォントコード変換表2400は、図24に示すように、画像コード欄2401、フォントコード欄2402を有するテーブルである。代表文字決定モジュール2220の説明で示した例では、フォントコード決定モジュール2250は、図24に示すような画像コード・フォントコード変換表2400を作成する。つまり、画像コード1,7はフォントコードコード1に対応し、画像コード2,5はフォントコードコード2に対応し、画像コード3はフォントコードコード3に対応し、画像コード4,6,8はフォントコードコード4に対応している。
フォントコード・文字コード対応表作成モジュール2260は、フォントコード決定モジュール2250によって割り当てられたフォントコードと文字コード決定モジュール2230によって文字認識された結果である文字コードを対応付ける。その結果を出力ファイル形成モジュール2270へ渡す。
例えば、フォントコード・文字コード対応表作成モジュール2260は、フォントコードと文字コードとの対応表を作成する。
1つの代表文字に対応する複数の文字画像に対して、同じ文字コードである場合には、フォントコードに対して、文字コードをそのまま割り当てればよい。例えば、画像コードと文字コードとの対応が図25の場合を説明する。画像コード・文字コード対応表2500は、画像コード欄2501、文字コード欄2502を有している。画像コード1,7には文字コード<A>を、画像コード2,5には文字コード<B>を、画像コード3には文字コード<C>を、画像コード4,6,8には文字コード<ff>を対応させる。そして、この場合には、フォントコードから文字コードの関係を、図26のように求めることができる。つまり、フォントコード・文字コード対応表2600は、フォントコード欄2601、文字コード欄2602を有している。フォントコード1には文字コード<A>、フォントコード2には文字コード<B>、フォントコード3には文字コード<C>、フォントコード4には文字コード<f><f>に対応している。なお、<f><f>は、2つのフォントコード<f>を意味している。
この場合には、代表文字決定モジュール2220が代表文字決定時に、画像コード1と画像コード7、画像コード2と画像コード5、画像コード4と画像コード8を類似画像として決定すればよい。つまり、文字コードが同じものを類似文字とする。画像コードからフォントコードへの変換表は、図28に示すような画像コード・フォントコード変換表2400となる。つまり、図24に示す画像コード・フォントコード変換表2400とは、画像コード6に対応するフォントコードが5であることが異なる。つまり、文字コードが異なるものはフォンコードも異ならせるようにする。
そして、フォントコードと文字コードの関係は図29に示すフォントコード・文字コード対応表2600となる。つまり、図26に示すフォントコード・文字コード対応表2600とは、フォントコード5があり、そのフォントコード5に文字コード<U>を対応させていることが異なる。
出力ファイル形成モジュール2270は、フォント登録モジュール2240によって生成されたフォントファイル、フォントコード決定モジュール2250によって対応付けられたフォントコードと文字切り出しモジュール2210によって抽出されたそのフォントコードに対応する文字画像の位置及びフォントコード・文字コード対応表作成モジュール2260によって対応付けられたフォントコードと文字コードの対応に基づいて、ファイルを形成する。
また、出力ファイル形成モジュール2270は、フォント登録モジュール2240によって生成されたフォントファイル、フォントコード決定モジュール2250によって対応付けられたフォントコードと画像コードの対応とその画像コードに対応する文字画像の位置、及びフォントコード・文字コード対応表作成モジュール2260によって対応付けられたフォントコードと文字コードの対応に基づいて、ファイルを形成するようにしてもよい。
また、出力ファイル形成モジュール2270は、文字コード決定モジュール2230によって対応付けられた画像コードと文字コードを用いて、フォントコードと画像コードの対応及びフォントコードと文字コードの対応に反映させてファイルを形成するようにしてもよい。
また、出力ファイル形成モジュール2270は、さらに、文字切り出しモジュール2210によって抽出された文字画像の文字サイズに基づいて、ファイルを形成するようにしてもよい。
図18に示したフォントコード・文字サイズ・位置対応表1800は、フォントコードと画像コードが一対一に対応している場合に利用できるものである。図24に示した画像コード・フォントコード変換表2400のように、画像コードとフォントコードが一対一に対応していない場合には、図30に示す画像コード・フォントコード・文字サイズ・位置対応表3000のように、各画像コードに対応するフォントコードと文字サイズ、位置を対応させるようにする。
ステップS3102では、文字切り出しモジュール2210が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップS3104では、文字コード決定モジュール2230が、ステップS3102で切り出された各文字画像に対して、文字コードを割り当てる。
ステップS3106では、代表文字決定モジュール2220が、ステップS3102で切り出された文字画像から代表文字画像を生成する。そして、代表文字画像にステップS3104で認識された文字コードを割り当てる。
ステップS3108では、フォントコード決定モジュール2250が、ステップS3106で生成された代表文字画像に対して、フォントコードを割り当てる。
ステップS3112では、フォントコード・文字コード対応表作成モジュール2260が、ステップS3108で割り当てられたフォントコードとステップS3104で割り当てられた文字コードとを対応付けてフォントコード・文字コード対応表2600を作成する。
ステップS3114では、出力ファイル形成モジュール2270が、ステップS3110で生成されたフォントファイル、ステップS3108で割り当てられたフォントコード、ステップS3112で作成されたフォントコード・文字コード対応表2600、ステップS3102で抽出された文字サイズと位置をまとめて、出力ファイルを形成する。
なお、この場合は、文字コード決定モジュール3250からのフィードバック(文字コードを受け取ること)は不要である。代表文字とフォントコードを一対一に対応させればよいからである。
出力ファイル形成モジュール3270が出力するファイルは、第6の実施の形態と同様である。
ステップS3302では、文字切り出しモジュール3210が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップS3304では、代表文字決定モジュール3220が、ステップS3302で切り出された文字画像から代表文字画像を生成する。
ステップS3306では、フォントコード決定モジュール3240が、ステップS3304で生成された代表文字画像に対して、フォントコードを割り当てる。
ステップS3308では、フォント登録モジュール3230が、ステップS3304で生成された代表文字画像とステップS3306で割り当てられたフォントコードを用いて、フォントファイルを生成する。
ステップS3312では、フォントコード・文字コード対応表作成モジュール3260が、ステップS3306で割り当てられたフォントコードとステップS3310で割り当てられた文字コードとを対応付けてフォントコード・文字コード対応表2600を作成する。
ステップS3314では、出力ファイル形成モジュール3270が、ステップS3308で生成されたフォントファイル、ステップS3306で割り当てられたフォントコード、ステップS3312で作成されたフォントコード・文字コード対応表2600、ステップS3302で抽出された文字サイズと位置をまとめて、出力ファイルを形成する。
第6の実施の形態の代表文字決定モジュール2220、第7の実施の形態の代表文字決定モジュール3220に、図5に示した拡大モジュール540を付加してもよい。つまり、代表文字決定モジュール(2220、3220)は、代表の文字画像に対して拡大処理を行い、その拡大処理した文字画像を生成した画素の塊として、フォント登録モジュール(2240、3230)に渡してもよい。つまり、高品質な文字画像を再現するような場合に適している。
また、第5〜第7の実施の形態では、フォントコードの割当は限定していないが、文字コードをそのままフォントコードとして割り当ててもよい。この場合には、文字コードが重複する虞がある。文字コードが重複すると、異なる画像(代表文字画像)に対して複数のコードを割り当てることになり、問題である。
そこで、文字コードが重複する場合には、異なるフォント種として登録するか、あるいは、1つは文字コードをそのまま割り当て、その他は外字コードを割り当てるなどとすればよい。
JBIG2 TRでは、2値画像データから文字画像らしき部分画像を抽出し(以後、これを入力部分画像ともいう)、既に辞書に登録してある部分画像データ(以後、これらを登録部分画像ともいう)と比較し、似ている部分画像が見つからない場合には、入力部分画像を辞書に登録する。似ている部分画像が見つかった場合には、辞書内におけるその部分画像を示すインデックス、及び、2値画像データにおける入力部分画像の位置により、入力部分画像を符号化する。
一方で、文書画像の中にある複数の同一形状の文字画像データを切り出し、それら各々がスキャン・インされた位相を推定し、推定した位相に基づいて、より解像度の高い文字画像データを生成する文字超解像技術がある。
第8〜第10の実施の形態は、文字超解像技術を用いて、JBIG2 TR等の画像圧縮の性能を向上させる場合に用いられる。
もともと同じ文字画像をスキャン・インした複数の文字画像データをJBIG2 TRで符号化するときに、スキャン・インの解像度と位相によって、異なる文字画像データとして符号化した方がよい場合(つまり、画質を重視する場合)と、同じ文字画像データとして符号化した方がよい場合(つまり、圧縮率を重視する場合)があり、いずれか一方を選択しなくてはならない。
同じ文字画像であるが、スキャン・インの位相がずれているため異なる文字画像データ(部分画像3721、3722、3723)として符号化する。
復号すると、文書画像3741、3742内の部分画像3731、3732、3733は、元の文字画像データがそのまま復号されるため画質劣化がない。しかし、別々の文字として符号化するため、圧縮率は低くなる。
同じ文字画像(部分画像3821、3822、3823)であるので、スキャン・インの位相がずれていてもひとつの文字画像データ(部分画像3831)で代表させて、符号化する。この場合、代表の文字画像だけを対象としているので、圧縮率は高くなる。
しかし、復号すると、文書画像3851、3852内の部分画像3841、3842、3843は、元の文字画像データと位相が異なる文字画像データに置き換わるため、文字列の乱れなどが生じ、画質劣化の要因となり得る。
文字切り出しモジュール3910は、類似文字画像抽出モジュール3920、符号化モジュール3940と接続されており、類似文字画像抽出モジュール3920は、文字切り出しモジュール3910、代表文字画像構成モジュール3930、符号化モジュール3940と接続されており、代表文字画像構成モジュール3930は、類似文字画像抽出モジュール3920、符号化モジュール3940と接続されており、符号化モジュール3940は、文字切り出しモジュール3910、類似文字画像抽出モジュール3920、代表文字画像構成モジュール3930と接続されている。
類似文字画像抽出モジュール3920は、切り出した文字画像データ同士を比較し、形状の似ている文字画像データを抽出する。そして、代表文字画像データを表すインデックスを割り当てる。
代表文字画像構成モジュール3930は、似ている文字画像データから代表文字画像データを得る。
符号化モジュール3940は、切り出した文字画像データごとに、位置、インデックスを符号化する。そして、代表文字画像データは別途符号化する。
文字画像貼り付けモジュール4030は、文字画像データごとに、インデックスに対応する代表文字画像データを取り出す。代表文字画像データを位置に応じて、画像内に貼り付ける。すべての文字画像データに対して同様の処理を行い出力画像データを生成する。
そして、すべての文字画像データに対して同様の処理を行い出力画像データを生成する。
そして、すべての文字画像データに対して同様の処理を行い出力画像データを生成する。
また、コンピュータプログラムとして実現する場合は、PDF、EPS(Encapsulated PostScript)、XDW(登録商標)などの画像をベクトル情報で扱うことができるファイルを生成するソフトウェアに組み込まれていてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…文字コード決定モジュール
130…フォント登録モジュール
140…出力ファイル形成モジュール
310…文字切り出しモジュール
320…代表文字決定モジュール
330…文字コード決定モジュール
340…フォント登録モジュール
350…出力ファイル形成モジュール
510…文字切り出しモジュール
520…代表文字決定モジュール
530…文字コード決定モジュール
540…拡大モジュール
550…フォント登録モジュール
560…出力ファイル形成モジュール
910…文字切り出しモジュール
920…代表文字決定モジュール
930…拡大モジュール
940…文字コード決定モジュール
950…フォント登録モジュール
960…出力ファイル形成モジュール
1210…文字切り出しモジュール
1220…フォント登録モジュール
1230…フォントコード決定モジュール
1240…文字コード決定モジュール
1250…フォントコード・文字コード対応表作成モジュール
1260…出力ファイル形成モジュール
2210…文字切り出しモジュール
2220…代表文字決定モジュール
2230…文字コード決定モジュール
2240…フォント登録モジュール
2250…フォントコード決定モジュール
2260…フォントコード・文字コード対応表作成モジュール
2270…出力ファイル形成モジュール
3210…文字切り出しモジュール
3220…代表文字決定モジュール
3230…フォント登録モジュール
3240…フォントコード決定モジュール
3250…文字コード決定モジュール
3260…フォントコード・文字コード対応表作成モジュール
3270…出力ファイル形成モジュール
3410…文字切り出しモジュール
3420…類似文字画像抽出モジュール
3430…文字画像位相推定モジュール
3440…高解像度代表文字画像構成モジュール
3450…アウトライン・ベクトル・データ変換モジュール
3460…符号化モジュール
3510…復号モジュール
3520…高解像度代表文字画像変換モジュール
3530…高解像度代表文字画像記憶モジュール
3540…低解像度代表文字画像生成モジュール
3550…文字画像貼り付けモジュール
3610…復号モジュール
3620…代表文字ベクトル・データ記憶モジュール
3630…文字画像生成モジュール
3640…文字画像貼り付けモジュール
3910…文字切り出しモジュール
3920…類似文字画像抽出モジュール
3930…代表文字画像構成モジュール
3940…符号化モジュール
4010…復号モジュール
4020…代表文字画像記憶モジュール
4030…文字画像貼り付けモジュール
Claims (6)
- 画像データから画素の塊を切り出し、該画素の塊の位置を抽出する切出手段と、
前記切出手段によって切り出された画素の塊から類似している画素の塊を抽出し、該画素の塊を一意に識別できる符号を対応付ける類似画像抽出手段と、
前記類似画像抽出手段によって抽出された類似の画素の塊に基づいて、画素の塊の位相を推定する位相推定手段と、
前記類似画像抽出手段によって抽出された類似の画素の塊と前記位相推定手段によって推定された位相に基づいて、より高解像度の代表画像を生成する高解像度代表画像生成手段と、
前記高解像度代表画像生成手段によって生成された画素の塊をベクトル情報に変換するベクトル変換手段と、
前記切出手段によって抽出された画素の塊の位置、前記類似画像抽出手段によって該画素の塊に対応付けられた符号、前記位相推定手段によって推定された位相及び前記ベクトル変換手段によって変換されたベクトル情報に基づいて、符号化を行う符号化手段
を具備することを特徴とする画像処理装置。 - 符号化されたデータから、画素の塊の位置、該画素の塊の位相、該画素の塊に対応する代表画像の符号及び該代表画像のベクトル情報を復号する復号手段と、
前記復号手段によって復号されたベクトル情報から代表画像を生成する代表画像生成手段と、
前記代表画像生成手段によって生成された代表画像と前記復号手段によって復号された符号とを対応付けて記憶する画像記憶手段と、
前記画像記憶手段に記憶されている画素の塊と前記復号手段によって復号された位相に基づいて、より低解像度の画素の塊を生成する低解像度画像生成手段と、
前記低解像度画像生成手段によって生成された画素の塊と前記復号手段によって復号された該画素の塊の位置に基づいて、画像を生成する画像生成手段
を具備することを特徴とする画像処理装置。 - 符号化されたデータから、画素の塊の位置、該画素の塊の位相、該画素の塊に対応する代表画像の符号及び該代表画像のベクトル情報を復号する復号手段と、
前記復号手段によって復号されたベクトル情報と前記復号手段によって復号された符号とを対応付けて記憶するベクトル情報記憶手段と、
前記ベクトル情報記憶手段に記憶されているベクトル情報と前記復号手段によって復号された位相に基づいて、代表画像を生成する代表画像生成手段と、
前記代表画像生成手段によって生成された代表画像と前記復号手段によって復号された該画素の塊の位置に基づいて、画像を生成する画像生成手段
を具備することを特徴とする画像処理装置。 - コンピュータに、
画像データから画素の塊を切り出し、該画素の塊の位置を抽出する切出手段と、
前記切出手段によって切り出された画素の塊から類似している画素の塊を抽出し、該画素の塊を一意に識別できる符号を対応付ける類似画像抽出手段と、
前記類似画像抽出手段によって抽出された類似の画素の塊に基づいて、画素の塊の位相を推定する位相推定手段と、
前記類似画像抽出手段によって抽出された類似の画素の塊と前記位相推定手段によって推定された位相に基づいて、より高解像度の代表画像を生成する高解像度代表画像生成手段と、
前記高解像度代表画像生成手段によって生成された画素の塊をベクトル情報に変換するベクトル変換手段と、
前記切出手段によって抽出された画素の塊の位置、前記類似画像抽出手段によって該画素の塊に対応付けられた符号、前記位相推定手段によって推定された位相及び前記ベクトル変換手段によって変換されたベクトル情報に基づいて、符号化を行う符号化手段
として機能させることを特徴とする画像処理プログラム。 - コンピュータに、
符号化されたデータから、画素の塊の位置、該画素の塊の位相、該画素の塊に対応する代表画像の符号及び該代表画像のベクトル情報を復号する復号手段と、
前記復号手段によって復号されたベクトル情報から代表画像を生成する代表画像生成手段と、
前記代表画像生成手段によって生成された代表画像と前記復号手段によって復号された符号とを対応付けて記憶する画像記憶手段と、
前記画像記憶手段に記憶されている画素の塊と前記復号手段によって復号された位相に基づいて、より低解像度の画素の塊を生成する低解像度画像生成手段と、
前記低解像度画像生成手段によって生成された画素の塊と前記復号手段によって復号された該画素の塊の位置に基づいて、画像を生成する画像生成手段
として機能させることを特徴とする画像処理プログラム。 - コンピュータに、
符号化されたデータから、画素の塊の位置、該画素の塊の位相、該画素の塊に対応する代表画像の符号及び該代表画像のベクトル情報を復号する復号手段と、
前記復号手段によって復号されたベクトル情報と前記復号手段によって復号された符号とを対応付けて記憶するベクトル情報記憶手段と、
前記ベクトル情報記憶手段に記憶されているベクトル情報と前記復号手段によって復号された位相に基づいて、代表画像を生成する代表画像生成手段と、
前記代表画像生成手段によって生成された代表画像と前記復号手段によって復号された該画素の塊の位置に基づいて、画像を生成する画像生成手段
として機能させることを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009110313A JP4553055B2 (ja) | 2007-02-21 | 2009-04-30 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007041459 | 2007-02-21 | ||
JP2009110313A JP4553055B2 (ja) | 2007-02-21 | 2009-04-30 | 画像処理装置及び画像処理プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007246514A Division JP2008236715A (ja) | 2007-02-21 | 2007-09-25 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009213145A JP2009213145A (ja) | 2009-09-17 |
JP4553055B2 true JP4553055B2 (ja) | 2010-09-29 |
Family
ID=39704913
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007109002A Expired - Fee Related JP4123299B1 (ja) | 2007-02-21 | 2007-04-18 | 画像処理装置及び画像処理プログラム |
JP2007246514A Pending JP2008236715A (ja) | 2007-02-21 | 2007-09-25 | 画像処理装置及び画像処理プログラム |
JP2009110313A Expired - Fee Related JP4553055B2 (ja) | 2007-02-21 | 2009-04-30 | 画像処理装置及び画像処理プログラム |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007109002A Expired - Fee Related JP4123299B1 (ja) | 2007-02-21 | 2007-04-18 | 画像処理装置及び画像処理プログラム |
JP2007246514A Pending JP2008236715A (ja) | 2007-02-21 | 2007-09-25 | 画像処理装置及び画像処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8411955B2 (ja) |
JP (3) | JP4123299B1 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9769354B2 (en) | 2005-03-24 | 2017-09-19 | Kofax, Inc. | Systems and methods of processing scanned data |
JP4753034B2 (ja) * | 2006-06-02 | 2011-08-17 | 富士ゼロックス株式会社 | パターンマッチング装置、画像符号化装置、画像復号化装置、画像処理システム及びプログラム |
CN101742442A (zh) * | 2008-11-20 | 2010-06-16 | 银河联动信息技术(北京)有限公司 | 通过短信息传输电子凭证的***和方法 |
US9767354B2 (en) | 2009-02-10 | 2017-09-19 | Kofax, Inc. | Global geographic information retrieval, validation, and normalization |
US9576272B2 (en) | 2009-02-10 | 2017-02-21 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
JP5321109B2 (ja) * | 2009-02-13 | 2013-10-23 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US8730268B2 (en) * | 2010-02-05 | 2014-05-20 | Arizona Board Of Regents, A Body Corporate Of The State Of Arizona, Acting For And On Behalf Of Arizona State University | Image processing systems and methods |
US8384917B2 (en) * | 2010-02-15 | 2013-02-26 | International Business Machines Corporation | Font reproduction in electronic documents |
WO2011128933A1 (ja) * | 2010-04-13 | 2011-10-20 | 三菱電機株式会社 | 画像ベクトル化装置、画像ベクトル化方法及び画像ベクトル化プログラム |
US8488886B2 (en) * | 2010-08-02 | 2013-07-16 | Celartem, Inc. | Font matching |
US10146795B2 (en) | 2012-01-12 | 2018-12-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9342742B2 (en) * | 2012-01-12 | 2016-05-17 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
JP2016517587A (ja) | 2013-03-13 | 2016-06-16 | コファックス, インコーポレイテッド | モバイル装置を用いて取込まれたデジタル画像におけるオブジェクトの分類 |
US9208536B2 (en) | 2013-09-27 | 2015-12-08 | Kofax, Inc. | Systems and methods for three dimensional geometric reconstruction of captured image data |
US9355312B2 (en) | 2013-03-13 | 2016-05-31 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US20140316841A1 (en) | 2013-04-23 | 2014-10-23 | Kofax, Inc. | Location-based workflows and services |
JP2016518790A (ja) | 2013-05-03 | 2016-06-23 | コファックス, インコーポレイテッド | モバイル装置を用いて取込まれたビデオにおけるオブジェクトを検出および分類するためのシステムおよび方法 |
US9386235B2 (en) | 2013-11-15 | 2016-07-05 | Kofax, Inc. | Systems and methods for generating composite images of long documents using mobile video data |
JP5821994B2 (ja) * | 2014-04-21 | 2015-11-24 | 富士ゼロックス株式会社 | 画像処理装置、画像形成装置およびプログラム |
JP6432179B2 (ja) * | 2014-06-25 | 2018-12-05 | 京セラドキュメントソリューションズ株式会社 | 文書ファイル生成装置及び文書ファイル生成方法 |
US9760788B2 (en) | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
US10242285B2 (en) | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
CN107147820B (zh) * | 2016-03-01 | 2019-10-11 | 京瓷办公信息***株式会社 | 信息处理装置 |
US9779296B1 (en) | 2016-04-01 | 2017-10-03 | Kofax, Inc. | Content-based detection and three dimensional geometric reconstruction of objects in image and video data |
US10187171B2 (en) * | 2017-03-07 | 2019-01-22 | The United States Of America, As Represented By The Secretary Of The Navy | Method for free space optical communication utilizing patterned light and convolutional neural networks |
US11062176B2 (en) | 2017-11-30 | 2021-07-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005157448A (ja) * | 2003-11-20 | 2005-06-16 | Canon Inc | 画像処理装置及び画像処理方法 |
JP2005323169A (ja) * | 2004-05-10 | 2005-11-17 | Fuji Xerox Co Ltd | 画像処理装置、データファイル、画像処理方法及びそのプログラム |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2552556B2 (ja) | 1989-12-15 | 1996-11-13 | 三洋電機株式会社 | アウトラインフォント生成方法 |
JPH05174185A (ja) | 1991-01-24 | 1993-07-13 | Matsushita Electric Ind Co Ltd | 日本語文字認識装置 |
JPH0528301A (ja) | 1991-07-23 | 1993-02-05 | Fuji Xerox Co Ltd | 文書認識装置 |
DE69232493T2 (de) | 1991-10-21 | 2003-01-09 | Canon K.K., Tokio/Tokyo | Verfahren und Gerät zur Zeichenerkennung |
JPH0644406A (ja) | 1992-07-27 | 1994-02-18 | Canon Inc | 画像処理方法及び装置 |
JPH05120481A (ja) | 1991-10-25 | 1993-05-18 | Seiko Epson Corp | 文字切り出し方法 |
JPH05143776A (ja) | 1991-11-20 | 1993-06-11 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
US5566003A (en) * | 1992-01-21 | 1996-10-15 | Canon Kabushiki Kaisha | Image processing system in which the transmitter and receiver have different data resolutions and data is transmitted at the receiver resolution |
US6212299B1 (en) | 1992-12-11 | 2001-04-03 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for recognizing a character |
JPH06180771A (ja) | 1992-12-11 | 1994-06-28 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
JPH06187489A (ja) | 1992-12-17 | 1994-07-08 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH0713994A (ja) | 1993-02-19 | 1995-01-17 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH06348911A (ja) | 1993-06-07 | 1994-12-22 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
US5710834A (en) * | 1995-05-08 | 1998-01-20 | Digimarc Corporation | Method and apparatus responsive to a code signal conveyed through a graphic image |
JPH07160810A (ja) | 1993-12-09 | 1995-06-23 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP3445394B2 (ja) | 1993-12-17 | 2003-09-08 | ゼロックス・コーポレーション | 少なくとも二つのイメージセクションの比較方法 |
JPH08161432A (ja) | 1994-12-02 | 1996-06-21 | Seiko Epson Corp | 文字切り出し方法および文字切り出し装置 |
JPH08297718A (ja) | 1995-04-25 | 1996-11-12 | Matsushita Electric Ind Co Ltd | 文字切り出し装置及び文字認識装置 |
US5999647A (en) | 1995-04-21 | 1999-12-07 | Matsushita Electric Industrial Co., Ltd. | Character extraction apparatus for extracting character data from a text image |
US6760463B2 (en) * | 1995-05-08 | 2004-07-06 | Digimarc Corporation | Watermarking methods and media |
JP3504054B2 (ja) * | 1995-07-17 | 2004-03-08 | 株式会社東芝 | 文書処理装置および文書処理方法 |
JPH1069524A (ja) | 1996-08-28 | 1998-03-10 | Sumitomo Metal Ind Ltd | 文字切り出し方法 |
US6075875A (en) * | 1996-09-30 | 2000-06-13 | Microsoft Corporation | Segmentation of image features using hierarchical analysis of multi-valued image data and weighted averaging of segmentation results |
JPH10134145A (ja) | 1996-10-31 | 1998-05-22 | Ricoh Co Ltd | 文字切り出し方法およびそれを用いた文字認識装置と、その文字切り出し方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体 |
JPH10261047A (ja) | 1997-03-19 | 1998-09-29 | Fujitsu Ltd | 文字認識装置 |
KR100731708B1 (ko) * | 2000-05-09 | 2007-06-25 | 소니 가부시끼 가이샤 | 데이터 처리 장치와 데이터 처리 방법, 및 기록 매체 |
US7817817B2 (en) * | 2004-09-10 | 2010-10-19 | University Of Maryland | Method for concealing data in curves of an image |
JP2006253892A (ja) | 2005-03-09 | 2006-09-21 | Canon Inc | 画像処理方法及び画像処理装置 |
-
2007
- 2007-04-18 JP JP2007109002A patent/JP4123299B1/ja not_active Expired - Fee Related
- 2007-09-25 JP JP2007246514A patent/JP2008236715A/ja active Pending
-
2008
- 2008-02-19 US US12/071,257 patent/US8411955B2/en not_active Expired - Fee Related
-
2009
- 2009-04-30 JP JP2009110313A patent/JP4553055B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005157448A (ja) * | 2003-11-20 | 2005-06-16 | Canon Inc | 画像処理装置及び画像処理方法 |
JP2005323169A (ja) * | 2004-05-10 | 2005-11-17 | Fuji Xerox Co Ltd | 画像処理装置、データファイル、画像処理方法及びそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4123299B1 (ja) | 2008-07-23 |
JP2008233840A (ja) | 2008-10-02 |
JP2008236715A (ja) | 2008-10-02 |
US20080199081A1 (en) | 2008-08-21 |
JP2009213145A (ja) | 2009-09-17 |
US8411955B2 (en) | 2013-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4553055B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4766030B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4600491B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR101235226B1 (ko) | 화상 처리 장치, 화상 처리 방법 및 기록 매체 | |
JP5178490B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP5365440B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4930288B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5742283B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4862509B2 (ja) | 画像処理システムおよび画像処理プログラム | |
JP5067182B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4872780B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP2012209639A (ja) | 画像処理装置及び画像処理プログラム | |
JP5407582B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4935732B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4973536B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6676955B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5531661B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2008199249A (ja) | 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム | |
JP5223985B2 (ja) | 符号化システムおよび符号化プログラム | |
JP5131372B2 (ja) | 画像処理システムおよび画像処理プログラム | |
JP5720166B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2010267155A (ja) | 画像処理装置及び画像処理プログラム | |
JP2009130870A (ja) | 画像処理装置及び画像処理プログラム | |
JP2005210570A (ja) | 画像処理装置、画像処理用プログラム及び記憶媒体 | |
JP2008099152A (ja) | 画像処理システム、符号化システム、画像処理プログラムおよび符号化プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100622 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100705 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130723 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4553055 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140723 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |