JP4788106B2 - 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム - Google Patents
画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム Download PDFInfo
- Publication number
- JP4788106B2 JP4788106B2 JP2004116647A JP2004116647A JP4788106B2 JP 4788106 B2 JP4788106 B2 JP 4788106B2 JP 2004116647 A JP2004116647 A JP 2004116647A JP 2004116647 A JP2004116647 A JP 2004116647A JP 4788106 B2 JP4788106 B2 JP 4788106B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- pattern
- image pattern
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Processing (AREA)
- Character Discrimination (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
上記目的を達成するために、本発明にかかる画像辞書作成装置は、入力画像に対する文字認識処理の結果として、それぞれの文字画像が表す文字を識別する文字コードを取得する情報取得手段と、前記情報取得手段により取得された文字コードに基づいて、入力画像に含まれる文字画像を文字コード毎に分類する文字分類手段と、前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出する第1の抽出手段と、前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像と前記第1の抽出手段により抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出する第2の抽出手段と、前記第1の抽出手段により抽出された共通形状の画像パターン及び前記第2の抽出手段により抽出された差分形状の画像パターンそれぞれに対し、共通形状の画像パターン及び差分形状の画像パターンを識別する識別情報を付与する識別情報付与手段とを有する。
好適には、前記第1の抽出手段は、前記文字分類手段により同一の文字コードに分類された文字画像の画素の分布確率において、第1の閾値よりも大きい部分を共通形状の画像パターンとして抽出し、前記第2の抽出手段は、前記文字分類手段により同一の文字コードに分類された文字画像の画素の分布確率において、第2の閾値より大きい部分から差分形状の画像パターンを抽出する。
また、本発明にかかる符号化装置は、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字コードとを取得する情報取得手段と、前記情報取得手段により取得された文字コードに基づいて、入力画像に含まれる文字画像を文字コード毎に分類する文字分類手段と、前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出する第1の抽出手段と、前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像と前記第1の抽出手段により抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出する第2の抽出手段と、前記第1の抽出手段により抽出された共通形状の画像パターン及び前記第2の抽出手段により抽出された差分形状の画像パターンそれぞれに対し、共通形状の画像パターン及び差分形状の画像パターンを識別する識別情報を付与する識別情報付与手段と、入力画像に含まれている文字画像の領域を示す文字領域情報と、この文字画像に対応する共通形状の画像パターン及び差分形状の画像パターンの識別情報とを互いに対応付けて符号化する符号化手段とを有する。
また、本発明にかかる画像辞書作成方法は、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字コードとを取得し、取得された文字コードに基づいて、入力画像に含まれる文字画像を文字コード毎に分類し、同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出し、同一の文字コードに分類された文字画像から、当該文字画像と抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出し、抽出された共通形状の画像パターン及び差分形状の画像パターンそれぞれに対し、共通形状の画像パターン及び差分形状の画像パターンを識別する識別情報を付与する。
また、本発明にかかるプログラムは、コンピュータを含む画像辞書作成装置において、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字コードとを取得するステップと、取得された文字コードに基づいて、入力画像に含まれる文字画像を文字コード毎に分類するステップと、同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出するステップと、同一の文字コードに分類された文字画像から、当該文字画像と抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出するステップと、抽出された共通形状の画像パターン及び差分形状の画像パターンそれぞれに対し、共通形状の画像パターン及び差分形状の画像パターンを識別する識別情報を付与するステップとを前記画像辞書作成装置のコンピュータに実行させる。
まず、本発明の理解を助けるために、その背景及び概略を説明する。
画像処理装置2は、例えば、入力画像に含まれる文字画像そのものを符号化する替わりに、それぞれの文字画像の識別情報とその出現位置等を符号化することにより、高い圧縮率を実現することができる。
図1(A)は、共通のフォントデータベースが存在することを前提とした符号化方法を説明し、図1(B)は、画像辞書の添付を前提とした符号化方法を説明する図である。
図1(A)に示すように、文字画像を識別情報(文字コード及びフォントの種類)に対応付けて記憶する共通のフォントデータベースが符号化側及び復号化側の両方に存在する場合には、符号化側の画像処理装置は、文字画像の識別情報(文字コード及びフォントの種類等)と、文字画像の出現位置とを符号化することにより、高い圧縮率で画像データを復号化側の画像処理装置に送信することができる。この場合に、復号化側の画像処理装置は、受信した符号データ(文字コード及びフォントの種類)を復号化し、復号化された文字コード及びフォントの種類、並びに、フォントデータベースに登録されているフォント画像に基づいて文字画像を生成する。
しかしながら、フォントデータベースの存在を前提とした符号化方法では、符号化側及び復号化側でフォントデータベースをそれぞれ設ける必要があり、記憶領域がフォントデータベースにより圧迫される。また、符号化側のフォントデータベースが更新されると、これに応じて復号化側のフォントデータベースも更新する必要がある。また、手書き文字等がフォント画像に置換されて再現性が低くなったり、手書き文字が非文字画像として取り扱われて符号量を小さくできないなど、手書き文字等に対する対応が十分でない。
このように、画像処理装置2は、入力画像に応じて画像辞書を作成し送受信することにより、共通のデータベースを前提とすることなく高い圧縮率を実現することができる。また、フォントデータベースを符号化側及び復号化側で同期させる必要がない。さらには、手書き文字等に対しても十分な再現性を維持しつつ符号量を小さくすることができる。なお、符号量を低減させるためには、画像辞書も符号化されることが望ましい。
図2(A)に例示するように、画像辞書には、入力画像に含まれる複数の画像パターンと、この画像パターンを識別するために付与されたインデクスとが含まれる。画像パターンは、入力画像に含まれる部分的な画像データであり、本例では入力画像(2値)中に既定回数以上(複数回)出現する類型的なパターン(2値データ)である。また、インデクスは、例えば、入力画像毎に個別に生成される識別情報であり、入力画像から画像パターンが抽出される順番でその画像パターンに付与されるシリアル番号等であってもよい。
文字画像よりもさらに小さな単位で画像パターンが抽出される場合には、それぞれの画像パターンの出現頻度が高い場合が多いが(例えば、「1」の縦棒部分は、「山」及び「川」の一部として出現する)、画像辞書に登録すべき画像パターンの数が多くなり画像辞書のデータ量が大きくなる。
一方、文字画像単位で画像パターンが抽出される場合には、同一ドキュメント内では、同一の言語で同一のフォント種類及び同一のフォントサイズの文字が多数出現するため、画像パターンのサイズが大きい割には高い出現頻度が期待できる。
また、ある程度の非可逆性を許容して高い圧縮率を目指す場合に、符号化側の画像処理装置は、画像パターンと同一の部分画像だけでなく、画像パターンと類似する部分画像もインデクスに置換して符号化する。この場合に、文字画像の部分それぞれが、類似する画像パターンに置換されると、文字画像全体として全く異なるものに復号化されて可読性を失う可能性もある。しかしながら、文字画像単位で画像パターンが抽出される場合には、文字画像の全体的な形状が類似する画像パターン(例えば、数字の「1」とアルファベットの「I」など)に置換されるため、ある程度可読性が維持される。
したがって、本実施形態における画像処理装置2は、文字画像単位で入力画像から画像パターンを抽出し、画像辞書に登録する。
次に、画像処理装置2のハードウェア構成を説明する。
図3は、本発明にかかる画像辞書作成方法が適応される画像処理装置2のハードウェア構成を、制御装置20を中心に例示する図である。
図3に例示するように、画像処理装置2は、CPU202及びメモリ204などを含む制御装置20、通信装置22、HDD・CD装置などの記録装置24、並びに、LCD表示装置あるいはCRT表示装置およびキーボード・タッチパネルなどを含むユーザインターフェース装置(UI装置)26から構成される。
画像処理装置2は、例えば、符号化プログラム5(後述)がプリンタドライバの一部としてインストールされた汎用コンピュータであり、通信装置22又は記録装置24などを介して画像データを取得し、取得された画像データを符号化してプリンタ装置10に送信する。また、画像処理装置2は、プリンタ装置10のスキャナ機能より光学的に読み取られた画像データを取得し、取得された画像データを符号化する。
図4は、制御装置20(図3)により実行され、本発明にかかる画像辞書作成方法を実現する符号化プログラム5の機能構成を例示する図である。
図4に例示するように、符号化プログラム5は、画像入力部40、画像辞書作成部50及び符号化部60を有する。
符号化プログラム5において、画像入力部40(情報取得手段)は、プリンタ装置10のスキャナ機能により読み取られた画像データ、又は、通信装置22又は記録装置24などを介して取得されたPDL(Page Discription Language)形式の画像データを取得し、取得された画像データをラスタデータに変換して画像辞書作成部50に出力する。また、画像入力部40は、光学的に読み取られた画像データ等から文字画像を認識する文字認識部410と、PDL形式の画像データを解釈してラスタデータを生成するPDLデコンポーザ420とを有する。
文字認識部410は、入力された画像データ(以下、入力画像)に含まれる文字を認識し、認識された文字の文字識別情報、及び、認識された文字の文字領域情報を文字認識処理の結果として画像辞書作成部50に対して出力する。ここで、文字識別情報とは、文字を識別する情報であり、例えば、汎用性のある文字コード(ASCIIコード又はシフトJISコードなど)、又は、文字コードとフォントの種類との組合せなどである。また、文字領域情報とは、入力画像における文字画像の領域を示す情報であり、例えば、文字画像の位置、大きさ、範囲又はこれらの組合せである。
PDLデコンポーザ420は、PDL形式の画像データを解釈してラスタライズされた画像データ(ラスタデータ)を生成し、生成された画像データと共に、生成された画像データにおける文字画像の文字識別情報及び文字領域情報を画像辞書作成部50に対して出力する。
図5に示すように、画像辞書作成部50は、記憶部500、文字画像抽出部510、文字分類部520、一致判定部530、辞書決定部540(類型決定手段)、位置補正部550(領域補正手段)及びインデクス付与部560(識別情報付与手段)を有する。記憶部500は、メモリ204(図3)及び記録装置24(図3)を制御して、画像入力部40(図4)から入力された入力画像、文字識別情報及び文字領域情報を記憶する。なお、以下、文字コードを文字識別情報の具体例とし、文字の位置情報を文字領域情報の具体例として説明する。
文字分類部520は、文字コードに基づいて、入力画像から切り出された文字画像を複数の文字画像群に分類する。例えば、文字分類部520は、文字コードが一致する文字画像を同一の文字画像群に分類する。
また、一致判定部530は、複数の文字画像を複数の相対位置で比較して一致度合いを判定する。すなわち、一致判定部530は、最大の一致度合いを算出するために、複数の文字画像を互いにずらしながら比較する。
例えば、一致判定部530は、同一の文字画像群に分類された2つの文字画像(文字コードが一致する文字画像)を互いにずらしながら一致画素率を算出し、一致画素率の最大値及びこの最大となったときのずらしベクトルを記憶部500に出力する。
インデクス付与部560は、入力画像に基づいて決定された画像パターンに対して、これらの画像パターンを識別するインデクスを付与し、付与されたインデクスと画像パターンとを対応付けて記憶部500に出力する。
図6に示すように、符号化部60は、パターン判定部610、位置情報符号化部620、インデクス符号化部630、画像符号化部640、辞書符号化部650、選択部660及び符号出力部670を有する。
パターン判定部610は、画像辞書に登録された画像パターンそれぞれと、入力画像に含まれる部分画像とを比較して、この部分画像と対応する画像パターン(同一又は類似の画像パターン)を判定する。より具体的には、パターン判定部610は、入力画像から文字画像単位で切り出された部分画像(位置補正部550により補正がなされたもの)と、画像パターンとを重ねあわせて、一致判定部530(図5)と同様の手法により、一致度合いを算出し、算出された一致度合いが基準値以上であるか否かに基づいて、対応しているか否かを判定する。
パターン判定部610は、対応する画像パターンが発見された場合には、この部分画像の位置情報を位置情報符号化部620に対して出力し、この画像パターンのインデクスをインデクス符号化部630に対して出力し、対応する画像パターンが発見されない場合には、この部分画像を画像符号化部640に対して出力する。
インデクス符号化部630は、パターン判定部610から入力されたインデクスを符号化し、選択部660に対して出力する。例えば、インデクス符号化部630は、インデクスの出現頻度に応じて符号長が異なる符号をそれぞれのインデクスに付与する。
画像符号化部640は、画像に適した符号化方式を適用して、パターン判定部610から入力された部分画像を符号化し、選択部660に対して出力する。
辞書符号化部650は、画像辞書作成部50(図4,図5)から入力された画像辞書(画像パターンとインデクスとが互いに対応付けられたもの)を符号化し、符号出力部670に対して出力する。
符号出力部670は、選択部660から入力された符号データ(位置情報、インデクス及び部分画像の符号データ)と、辞書符号化部650から入力された符号データ(画像辞書の符号データ)とを互いに対応付けてプリンタ装置10(図3)、記録装置24(図3)又は通信装置22(図3)に出力する。
次に、画像処理装置2による符号化処理の全体動作を説明する。
図7は、符号化プログラム5の第1の動作(S1)を示すフローチャートである。なお、本フローチャートでは、プリンタ装置10のスキャナ機能により光学的に読み取られた2値の画像データが入力される場合を具体例として説明する。
図7に示すように、ステップ10(S10)において、画像入力部40は、プリンタ装置10(図3)から画像データ(2値)が入力されると、入力された画像データ(入力画像)を画像辞書作成部50に対して出力する。また、画像入力部40の文字認識部410(図4)は、入力画像に対して文字認識処理を行い、入力画像に含まれる文字画像の文字コード及び位置情報を判定し、判定された文字コード及び位置情報を画像辞書作成部50に対して出力する。
文字画像抽出部510は、記憶部500により記憶された位置情報に基づいて、入力画像における文字画像の範囲を特定し、特定された範囲から文字画像を切り出して記憶部500に記憶する。なお、文字画像の切出しは、符号化対象となる全入力画像(例えば、1ページ又は1ドキュメント)についてなされる。
画像パターンの決定及びインデクスの付与が符号化対象として入力された全入力画像について終了すると、これらの画像パターン及びインデクスは、画像辞書として符号化部60に出力される。
ステップ70(S70)において、符号化部60は、インデクス、位置情報及び部分画像の符号データと、画像辞書の符号データとをプリンタ装置10等に出力する。
図8に示すように、ステップ402(S402)において、一致判定部530は、文字コード毎に分類された文字画像を互いに比較して、複数の相対位置における一致度合いを判定する。具体的には、一致判定部530は、文字画像群における黒画素の画素分布(ヒストグラム)を作成し、作成された画素分布と、この文字画像群に含まれる文字画像とを互いにずらしながら黒画素の一致画素数を算出する。なお、画素分布は、文字画像群に属する文字画像の黒画素を一致画素数が最大となる相対位置で領域毎に画素値を順次加算したヒストグラムである。
すなわち、文字画像群の画素分布をQ(x)、各文字画像の画素値をP(i,x)、位置ベクトルをx、文字画像群に属する各文字画像をi(1〜N:Nは文字画像群に属する文字画像の数)、文字画像iのずらしベクトルをviとした場合に、一致判定部530は、以下の数式により一致画素数を算出する。
(一致画素数K)=Σ{Q(x)*P(i,x−vi)}(「Σ」は、変数xについての総和を示す)
なお、i=1の場合には、
Q(x)=P(1,x)
となり、
i>1の場合には、
Q(x)=P(1,x)+P(2,x−v2)+・・・+P(i−1,x−v(i−1))
となる。
Q(x)=ΣP(i,x−vi)
Q’(x)=Q(x)/N
次に、一致判定部530は、以下の条件式により、分布確率Q’(x)が基準値よりも小さい部分を除去してQ”(x)を算出する。
Q’(x)>閾値Aの場合に、Q”(x)=1
上記以外の場合に、Q”(x)=0
具体的には、辞書決定部540は、上記Q”(x)が1となる画素の数が基準値以上であるか否かを判定し、基準値以上である場合に、画像パターンの登録を行い、基準値よりも小さい場合に、画像パターンの登録を行わない。
図9に示すように、ステップ602(S602)において、パターン判定部610は、補正後の位置情報に基づいて入力画像から切り出された部分画像(すなわち、文字画像)と、画像辞書に登録された画像パターンとを比較して、一致画素数を算出する。なお、パターン判定部610は、一致判定部530から一致画素数を取得してもよい。
ステップ604(S604)において、パターン判定部610は、一致する画像パターンが存在するか否かを判定する。具体的には、パターン判定部610は、それぞれの画像パターンについて算出された一致画素数が許容範囲(例えば、部分画像の全画素に対して90%以上)内であるか否かを判定し、許容範囲内である場合に、S606の処理に移行し、許容範囲外である場合に、S610の処理に移行する。
インデクス符号化部630は、パターン判定部610から入力されたインデクスを符号化し、インデクスの符号データを選択部660に対して出力する。
選択部660は、インデクス符号化部630から入力されたインデクスの符号データと、位置情報符号化部620から入力された位置情報の符号データとを互いに対応付けて符号出力部670に対して出力する。すなわち、選択部660は、部分画像毎に、インデクスと位置情報とを互いに対応付けられるように符号出力部670に出力する。
画像符号化部640は、パターン判定部610から入力された部分画像の画像データを符号化し、部分画像の符号データを選択部660に対して出力する。
選択部660は、画像符号化部640から入力された部分画像の符号データを符号出力部670に対して出力する。
ステップ614(S614)において、辞書符号化部650は、画像辞書作成部50から入力された画像辞書(画像パターンとインデクスとを対応付けたもの)を符号化し、画像辞書の符号データを符号出力部670に対して出力する。
また、本画像処理装置2は、同一の文字画像群に属する文字画像を互いに比較して文字画像の切出し位置(文字画像の位置情報)を補正するため、文字画像の切出し誤差又はフォントの違い等により発生する文字画像のずれを修正し、文字の配置を高い精度で再現することができる。なお、本実施形態では、画像処理装置2は、文字コードに基づいて文字画像を文字画像群に分類したが、フォントの種類及び文字画像の大きさ等の他の文字識別情報を用いて文字画像を分類してもよいし、文字コード、フォントの種類及び文字画像の大きさのいずれか2つ以上を組み合わせて文字画像を分類してもよい。
次に、上記実施形態の第1の変形例を説明する。
図10は、文字認識処理により同一の文字コードとして判定されうる文字画像を例示する図である。
図10(A)に例示するように、フォントの種類が異なる数字「1」は、文字認識部410によって、同一の文字コードとして判別されうる。したがって、上記実施形態では、これらフォントの異なる複数の数字「1」は同一の文字画像群に分類され、これらの文字画像に基づいて1つの画像パターンが登録される。しかしながら、これらの数字「1」は、互いに異なる形状を有し、復号化後の画像においてもこれら形状の相違を再現したい場合がある。また、大きさのみが異なる文字も同一の文字コードとして判別されうるが、これら大きさの相違も再現したい場合がある。
また、図10(B)に例示するように、文字認識処理のミスにより、形状が類似する文字(例えば、数字「1」とアルファベット大文字「I」と)が同一の文字コードとして判別されうる。この場合、少なくとも形状が近似しているため、可読性に与える影響はそれほど大きくないが、これらを区別できるように再現したい場合もある。
そこで、第1の変形例における画像処理装置2は、文字コード毎に分類された文字画像群に、形状の異なる文字画像が混在している場合に、この文字画像群について2以上の画像パターンを決定し、それぞれの画像パターンを画像辞書に登録できるようにする。
図11に示すように、S410において、辞書決定部540が、閾値処理後の画素分布について、分布数が0でない領域(黒画素の領域)が基準よりも広いか否かを判定し、基準以上ある場合に、S422の処理に移行し、基準よりも狭い場合に、この文字画像群について画像パターンの登録を行わずに、画像パターン決定処理(S42)を終了する。
ステップ422(S422)において、辞書決定部540は、画素分布に基づいて、和結合パターンQ”(x)を決定する。
ステップ424(S424)において、辞書決定部540は、和結合パターンQ”(x)と、この文字画像群に属する文字画像との共通部分(積集合)を共通パターンとして抽出し、抽出された共通パターンを画像パターンに決定する。なお、辞書決定部540は、それぞれの文字画像に基づいて抽出された共通パターンすべてを画像辞書に登録するわけではなく、重複する共通パターンを排除して画像辞書に登録する。また、辞書決定部540は、それぞれの文字画像に基づいて抽出された複数の共通パターンのうち、黒画素の領域の違いが閾値以下である場合にも、重複するものとして排除してもよい。
図12に示すように、文字コードで分類された文字画像の黒画素の分布確率Q’(x)は、画素位置xによって異なる数値を示す。これは、文字画像群の中に、形状が異なる文字画像が混在しているからである。分布確率Q’(x)は、閾値Bにより閾値処理がなされることにより、分布確率が低い部分を除去される。これにより、出現頻度が低い文字の差分形状(出現頻度の高い文字との差分)及びノイズ部分等を排除して、類型的な形状のみを画像パターンとすることができる。
辞書決定部540は、上記S422において、閾値B以上の部分を1とし、閾値Bよりも小さい部分を0とした和結合パターンQ”(x)を生成する。
次に、辞書決定部540は、S424において、和結合パターンQ”(x)と、文字画像群に属する各文字画像との共通部分を共通パターンとして抽出する。すなわち、辞書決定部540は、和結合パターンQ”(x)と、各文字画像の画素分布P(i,x−vi)とを積演算する。これにより、文字画像群の中に複数存在する類型的な文字画像の画像パターン#1及び画像パターン#2が抽出される。
次に、上記実施形態の第2の変形例を説明する。
図13は、同一の文字コードとして判定されうる複数の文字画像の共通形状及び差分形状を例示する図である。
図13(A)に例示するように、フォントの種類が異なる数字「1」は、文字認識部410によって、同一の文字コードとして判別されうる。このように、文字コードによって分類された文字画像群は、大部分で同一の形状を有している。以下、文字画像群に属する複数の文字画像が共通して有する部分画像を共通形状といい、それぞれの文字画像とこの共通形状との差分となる部分画像を差分形状という。
図13(B)に例示するように、これらの文字画像を構成する部分形状のうち、第1レベルパターンは、これらの文字画像の共通形状であるため出現頻度が特に高い。また、第2レベルパターンa及び第2レベルパターンbは、それぞれの文字画像に固有の部分形状であり、第1レベルパターンに比べると出現頻度が低い。
そこで、第2の変形例における画像処理装置2は、文字コード毎に分類された文字画像群に形状の異なる複数の文字画像が混在している場合に、これらの文字画像の共通形状及び差分形状をそれぞれ画像パターンとして画像辞書に階層的に登録する。
図14に示すように、S410において、辞書決定部540が、閾値処理後の画素分布について、分布数が0でない領域(黒画素の領域)が基準よりも広いか否かを判定し、基準以上ある場合に、S442の処理に移行し、基準よりも狭い場合に、この文字画像群について画像パターンの登録を行わずに、画像パターン決定処理(S44)を終了する。
ステップ442(S442)において、辞書決定部540は、分布確率Q’(x)において第1レベル閾値よりも大きな部分を共通形状の画像パターン(すなわち、第1レベルパターン)として抽出する。ここで、第1レベル閾値とは、文字画像群に属する文字画像が共通して有する共通形状と、他の形状とを分離するための基準であり、本例では、文字画像群に属するほぼ全ての文字画像で黒画素が存在する場合の分布確率(0.95など)である。
次に、辞書決定部540は、この分布確率Q1(x)において第2レベル閾値以上の部分を1、第2レベル閾値より小さい部分を0として、第1レベルパターンが除去された和結合パターンQ1”(x)を生成する。ここで、第2レベル閾値とは、共通形状の差分としてそれぞれの文字画像を構成する差分形状であって文字画像群において出現頻度が高いものを分離するための基準であり、第1レベル閾値よりも低く、例えば、目標となる符号量及び画質に応じて設定される。
そして、辞書決定部540は、この和結合パターンQ1”と、各文字画像の画素分布P(i,x−vi)とを積演算して、これらの共通部分であるRi(x)を抽出し、抽出されたRi(x)を差分形状の画像パターン(すなわち、第2レベルパターン)に決定する。
図15に示すように、文字コードで分類された文字画像の黒画素の分布確率Q’(x)は、画素位置xによって異なる数値を示す。このうち、分布確率が最も高い部分は、この文字画像群に属する文字画像に共通する形状(すなわち、共通形状)であると考えられる。そして、分布確率が存在する他の領域は、それぞれの文字画像と共通形状との差分に相当する形状(すなわち、差分形状)であると考えられる。
そこで、辞書決定部540は、共通形状(分布確率がほぼ最大となる領域)を抽出するための第1レベル閾値と、出現頻度の高い差分形状を抽出するための第2レベル閾値とを有している。
まず、辞書決定部540は、分布確率Q’(x)に対して第1レベル閾値により閾値処理を行い、第1レベルパターン(共通形状)に相当する部分を抽出する。次に、分布確率Q’(x)から、抽出された第1レベルパターンに相当する部分が除去されて、第2レベル閾値を基準として「1」又は「0」に変換されることにより、第2レベル和結合パターンQ1”(x)が生成される。
辞書決定部540は、この第2レベル和結合パターンQ1”(x)と、各文字画像iの画素分布P(i,x)とを積演算することにより、これらの共通部分である第2レベルパターンを抽出する。本例では、第2レベル和結合パターンQ1”(x)と「文字画像#1」との共通部分は、第2レベルパターンaとなり、第2レベル和結合パターンQ1”(x)と「文字画像#2」との共通部分は、第2レベルパターンbとなる。
これにより、「文字画像#1」は、第1レベルパターンと、第2レベルパターンaとの和としてそれぞれのインデクスに置換でき、「文字画像#2」は、第1レベルパターンと、第2レベルパターンbとの和としてインデクスに置換できる。
図16に示すように、S602において、パターン判定部610は、補正後の位置情報に基づいて入力画像から切り出された部分画像(すなわち、文字画像)と、画像辞書に登録された第1レベルパターンとを比較して、一致画素数を算出する。
ステップ642(S642)において、パターン判定部610は、入力された部分画像と一致する第1レベルパターンが存在するか否かを判定する。具体的には、パターン判定部610は、それぞれの第1レベルパターンについて算出された一致画素数が許容範囲(例えば、部分画像の全画素に対して90%以上)内であるか否かを判定し、許容範囲内である場合に、S644の処理に移行し、許容範囲外である場合に、S610の処理に移行する。
ステップ646(S646)において、パターン判定部610は、この第1レベルパターンの形状と、入力された部分画像との差分形状を抽出する。
ステップ648(S648)において、パターン判定部610は、この第1レベルパターンと対応付けられている第2レベルパターンを画像辞書から読み出し、読み出された第2レベルパターンと、抽出された差分形状とを比較して一致画素数を算出する。パターン判定部610は、それぞれの第2レベルパターンについて算出された一致画素数が許容範囲(例えば、差分形状の全画素に対して90%以上)内であるか否かを判定し、許容範囲内である場合に、S650の処理に移行し、許容範囲外である場合に、S608の処理に移行する。
なお、本例では、第1レベルパターン及び第2レベルパターンのいずれとも一致しない黒画素をノイズ等として除去しているが、これらの黒画素そのものを別途符号化してもよい。
また、画像処理装置2は、共通形状と差分形状とを階層化し、共通形状の符号データから順に出力することにより、復号化側で復号化した符号データの量に応じて徐々に画像品質を改善するプログレッシブ伝送を実現することができる。
次に、上記実施形態の第3の変形例を説明する。
文字認識部410による文字認識の正確性(確度)は、入力画像に含まれる文字画像毎に異なる場合がある。したがって、文字認識結果(文字コード)に基づいて分類された文字画像群には、形状の類似しない文字画像が混在する可能性がある。このように形状が類似しない文字画像が文字画像群に混在すると、画像辞書に登録される画像パターンが歪めらるなどの弊害が発生しうる。
そこで、第3の変形例における画像処理装置2は、文字認識処理の確度毎に、画像辞書を作成する。
図17に例示するように、第3の変形例における文字分類部520は、文字認識処理の確度を文字認識部410から取得し、取得された確度に応じて、入力画像に含まれる文字画像を分類する。本例の文字分類部520は、「確度が90%以上」の文字画像群、「確度が70%以上90%未満」の文字画像群、及び、「確度が70%未満」の文字画像群というように、確度の範囲によって文字画像を分類している。
さらに、文字分類部520は、それぞれの文字画像群を文字コードでさらに分類する。
以上説明したように、第3の変形例における画像処理装置2は、文字認識処理の確度毎に画像辞書を作成することにより、文字認識処理のミスによる画像辞書への影響を最小限に抑えることができる。
次に、第2の実施形態を説明する。
上記第1の実施形態では、画像辞書作成部50は、1ページ又は1ドキュメントなどの文字画像全部を用いて画像辞書を作成していたが、本実施形態における第2の画像辞書作成部52は、1文字ずつ文字画像を比較して画像辞書に登録する。
図18は、第2の画像辞書作成部52の機能構成を説明する図である。
図18に示すように、第2の実施形態における画像辞書作成部52は、図5に示した第1の画像辞書作成部50の各構成に加えて、登録制御部570を有する。
登録制御部570は、文字画像抽出部510により抽出された文字画像を画像パターンとして画像辞書に登録するか否かを判断し、画像辞書への新規登録を制御する。より具体的には、登録制御部570は、新規に入力された文字画像と画像辞書に登録された画像パターンとの一致度合いに基づいて、新規に入力された文字画像を画像パターンとして画像辞書に登録するか否かを判断する。例えば、登録制御部570は、既登録の画像パターンと、新たに入力された文字画像との一致度合いがいずれも基準以下である場合に、この文字画像を画像パターンとして画像辞書に登録するよう辞書決定部540に指示する。
図19に示すように、S10において、画像入力部40は、プリンタ装置10(図3)から画像データ(2値)が入力されると、入力された画像データ(入力画像)を画像辞書作成部50に対して出力する。また、画像入力部40の文字認識部410(図4)は、入力画像に対して文字認識処理を行い、入力画像に含まれる文字画像の文字コード及び位置情報を1文字ずつ判定し、判定された文字コード、位置情報及び文字画像(2値)を1文字ずつ画像辞書作成部50に対して出力する。
ステップ46(S46)において、登録制御部570は、一致判定部530及び位置補正部550と協働して、新たに入力された文字画像を画像パターンとして画像辞書に登録するか否かを判定する。
ステップ54(S54)において、インデクス付与部560は、新たに入力された文字画像(画像パターンとして登録されるもの)に対してインデクスを付与し、この文字画像及びインデクスを記憶部500に対して出力し、この文字画像の位置情報及びインデクスを符号化部60に対して出力する。
ステップ80(S80)において、符号化プログラム5は、入力画像に含まれる文字画像全てについて処理が終了したか否かを判定し、終了したと判定された場合に、画像辞書を符号化してプリンタO装置10等に出力して動作(S2)を終了し、終了していないと判定された場合に、S22の処理に戻って、次の文字画像について処理を行う。
図20に示すように、ステップ462(S462)において、一致判定部530は、新たに入力された文字画像と、記憶部500により画像辞書として記憶されている画像パターンとを比較して、複数の相対位置における一致度合いを判定する。具体的には、一致判定部530は、画像辞書に登録されている画像パターンそれぞれと、新たに入力された文字画像とを互いにずらしながら黒画素の一致画素数Kを算出する。
一致画素数Kは、以下の数式により算出される。
(一致画素数K)=Σ{S(x)*P(i,x−vi)}
S(x):画像パターンの画素分布
次に、一致判定部530は、算出された一致画素数Kを正規化して、一致画素率K’を算出する。
一致画素率K’は、以下の数式により算出される。
(一致画素率K’)=K/M
M:文字画像を構成する画素数
ステップ467(S467)において、登録制御部570は、読み出されたインデクスと、この文字画像の位置情報(位置補正部550により補正がなされたもの)とを符号化部60に対して出力する。
辞書決定部540は、入力された文字画像(位置補正部550により位置補正がなされたもの)を画像パターンとして記憶部500(画像パターン記憶手段)に登録する。
次に、第2の実施形態の変形例を説明する。
画像辞書作成部52は、画像パターンとして画像辞書に登録された文字画像を文字コードに対応付けて記憶し、新たに入力された文字画像と、文字コードが一致する画像パターンとを優先的に比較して、一致度合いを判定する。例えば、辞書決定部540は、文字画像を画像パターンとして画像辞書に登録する場合に、この文字画像の文字コードを画像パターンに対応付けて登録する。一致判定部530は、新たに入力された文字画像と文字コードが一致する画像パターンのみを画像辞書から読み出し、読み出された画像パターンと、入力された文字画像とを比較して、一致画素率K’を算出する。登録制御部570は、文字コードが一致する画像パターンと入力された文字画像との一致画素率K’のみに基づいて、入力された文字画像を画像パターンとして画像辞書に登録するか否かを判定する。
これにより、画像辞書作成部52は、一致度合いの判定処理の回数を減らすことができる。
図21(A)に例示するように、登録制御部570(重み付け手段)は、入力された文字画像の文字コードと画像パターンの文字コードとが一致するか否かに応じて、異なる重み付け係数を有し、一致判定部530により判定された一致度合い(例えば、一致画素率K’)に対して重み付けを行う。より具体的には、登録制御部570は、入力された文字画像の文字コードと画像パターンの文字コードとが一致する場合に、これらの文字コードが一致しない場合よりも一致画素率K’が大きくなるように重み付けを行う。すなわち、画像辞書作成部52は、文字コードが一致する場合には文字画像が文字として画像パターンと同一であると推定されるため、画像としても一致又は近似するものと判定されるように一致度合いを加重する。
なお、文字コードに応じた重み付け処理は、文字コードの一致/不一致によるものに限定されるものではなく、例えば、特定の文字コードの組合せ(数字「1」とアルファベット「l」のように形状が類似する組合せなど)に対応する重み付け係数を設定し、文字コードの組合せに応じてなされてもよいし、可読性の要求に応じた重み付け係数(例えば、漢字の文字コードとひらがなの文字コードとで異なる重み付け)を設定してなされてもよい。
図22に示すように、S462及びS404において、一致判定部530は、画像辞書に登録されている画像パターンそれぞれと、新たに入力された文字画像とを互いにずらしながら黒画素の一致画素率K’を算出し、位置補正部550は、一致判定部530により算出される一致画素率K’に基づいて、補正ベクトルを算出する。
さらに、登録制御部570は、この文字画像に対する文字認識処理の確度を文字認識部410から取得し、取得された文字認識処理の確度に応じて、一致画素率K’に重み付け係数をかけ合わせる。
5・・・符号化プログラム
40・・・画像入力部
410・・・文字認識部
420・・・PDLデコンポーザ
50,52・・・画像辞書作成部
500・・・記憶部
510・・・文字画像抽出部
520・・・文字分類部
530・・・一致判定部
540・・・辞書決定部
550・・・位置補正部
560・・・インデクス付与部
570・・・登録制御部
60・・・符号化部
610・・・パターン判定部
620・・・位置情報符号化部
630・・・インデクス符号化部
640・・・画像符号化部
650・・・辞書符号化部
660・・・選択部
670・・・符号出力部
Claims (14)
- 入力画像に対する文字認識処理の結果として、それぞれの文字画像が表す文字を識別する文字コードを取得する情報取得手段と、
前記情報取得手段により取得された文字コードに基づいて、入力画像に含まれる文字画像を文字コード毎に分類する文字分類手段と、
前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出する第1の抽出手段と、
前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像と前記第1の抽出手段により抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出する第2の抽出手段と、
前記第1の抽出手段により抽出された共通形状の画像パターン及び前記第2の抽出手段により抽出された差分形状の画像パターンそれぞれに対し、共通形状の画像パターン及び差分形状の画像パターンを識別する識別情報を付与する識別情報付与手段と
を有する画像辞書作成装置。 - 前記第1の抽出手段は、前記文字分類手段により同一の文字コードに分類された文字画像の画素の分布確率において、第1の閾値よりも大きい部分を共通形状の画像パターンとして抽出し、
前記第2の抽出手段は、前記文字分類手段により同一の文字コードに分類された文字画像の画素の分布確率において、第2の閾値より大きい部分から差分形状の画像パターンを抽出する
請求項1に記載の画像辞書作成装置。 - 入力画像における文字画像それぞれの領域を示す文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段
をさらに有し、
前記文字分類手段は、前記文字画像抽出手段により抽出された文字画像を文字コード毎に分類し、
前記第1の抽出手段は、前記文字画像抽出手段により抽出された文字画像を互いに比較して、共通形状の画像パターンを抽出し、
前記第2の抽出手段は、前記文字画像抽出手段により抽出された文字画像と前記第1の抽出手段により抽出された共通形状の画像パターンとを互いに比較して、差分形状の画像パターンを抽出する
請求項1に記載の画像辞書作成装置。 - 前記文字画像抽出手段により抽出された複数の文字画像を互いに複数の相対位置で比較して、文字画像の一致度合いを判定する一致判定手段と、
前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段と、
各画像パターンの識別情報に対応付けて、それぞれの画像パターンに対応する文字画像それぞれの文字領域情報を出力する出力手段と
をさらに有する請求項3に記載の画像辞書作成装置。 - 前記文字分類手段により各文字コードに分類された複数の文字画像を互いに比較して、文字画像の一致度合いを判定する一致判定手段
をさらに有し、
前記一致判定手段により判定された一致度合いに基づいて、前記第1の抽出手段は、同一の文字コードに分類された複数の文字画像から、共通形状の画像パターンを抽出し、
前記第2の抽出手段は、同一の文字コードに分類された複数の文字画像から、1つ以上の差分形状の画像パターンを抽出し、
前記識別情報付与手段は、前記第1の抽出手段により同一の文字コードについて抽出された共通形状の画像パターン及び前記第2の抽出手段により同一の文字コードについて抽出された1つ以上の差分形状の画像パターンに対して、前記同一の文字コードとは異なる文字コードについて抽出された共通形状の画像パターン及び差分形状の画像パターンと識別する識別情報を付与する
請求項1〜3のいずれかに記載の画像辞書作成装置。 - 前記文字分類手段により各文字コードに分類された複数の文字画像を互いに比較して、文字画像に含まれる領域毎の一致度合いを判定する一致判定手段
をさらに有し、
前記一致判定手段により領域毎に判定された一致度合いに基づいて、前記第1の抽出手段は、文字画像を構成する複数の共通形状の画像パターンを抽出し、前記第2の抽出手段は、複数の差分形状の画像パターンを抽出する
請求項1〜3のいずれかに記載の画像辞書作成装置。 - 前記情報取得手段は、さらに、文字認識処理の認識確度情報をそれぞれの文字コードに対応付けて取得し、
前記文字分類手段は、認識確度情報と、これに対応する文字コードとに基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する
請求項1〜6のいずれかに記載の画像辞書作成装置。 - 入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字コードとを取得する情報取得手段と、
前記情報取得手段により取得された文字コードに基づいて、入力画像に含まれる文字画像を文字コード毎に分類する文字分類手段と、
前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出する第1の抽出手段と、
前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像と前記第1の抽出手段により抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出する第2の抽出手段と、
前記第1の抽出手段により抽出された共通形状の画像パターン及び前記第2の抽出手段により抽出された差分形状の画像パターンそれぞれに対し、共通形状の画像パターン及び差分形状の画像パターンを識別する識別情報を付与する識別情報付与手段と
を有する画像辞書作成装置。 - 入力画像における文字画像それぞれの領域を示す文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段
をさらに有し、
前記文字分類手段は、前記文字画像抽出手段により抽出された文字画像を文字コード毎に分類し、
前記第1の抽出手段は、前記文字画像抽出手段により抽出された文字画像を互いに比較して、共通形状の画像パターンを抽出し、
前記第2の抽出手段は、前記文字画像抽出手段により抽出された文字画像と前記第1の抽出手段により抽出された共通形状の画像パターンとを互いに比較して、差分形状の画像パターンを抽出する
請求項8に記載の画像辞書作成装置。 - 入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字コードとを取得する情報取得手段と、
前記情報取得手段により取得された文字コードに基づいて、入力画像に含まれる文字画像を文字コード毎に分類する文字分類手段と、
前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出する第1の抽出手段と、
前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像と前記第1の抽出手段により抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出する第2の抽出手段と、
前記第1の抽出手段により抽出された共通形状の画像パターン及び前記第2の抽出手段により抽出された差分形状の画像パターンそれぞれに対し、共通形状の画像パターン及び差分形状の画像パターンを識別する識別情報を付与する識別情報付与手段と、
入力画像に含まれている文字画像の領域を示す文字領域情報と、この文字画像に対応する共通形状の画像パターン及び差分形状の画像パターンの識別情報とを互いに対応付けて符号化する符号化手段と
を有する符号化装置。 - 入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、
前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段と、
前記文字画像抽出手段により抽出された文字画像を、文字コード毎に分類する文字分類手段と、
前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出する第1の抽出手段と、
前記文字分類手段により同一の文字コードに分類された文字画像から、当該文字画像と前記第1の抽出手段により抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出する第2の抽出手段と、
入力画像に含まれている文字画像の領域を示す文字領域情報と、この文字画像に対応する共通形状の画像パターン及び差分形状の画像パターンの識別情報とを互いに対応付けて符号化する符号化手段と、
前記文字分類手段により各文字コードに分類された複数の文字画像を互いに複数の相対位置で比較して、文字画像の一致度合いを判定する一致判定手段と、
前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段と、
少なくとも前記領域補正手段により補正されたそれぞれの文字画像の文字領域情報と、この文字画像が分類された文字コードに基づいて決定された画像パターンの識別情報とを符号化する符号化手段と
を有する符号化装置。 - 入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字コードとを取得し、
取得された文字コードに基づいて、入力画像に含まれる文字画像を文字コード毎に分類し、
同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出し、
同一の文字コードに分類された文字画像から、当該文字画像と抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出し、
抽出された共通形状の画像パターン及び差分形状の画像パターンそれぞれに対し、共通形状の画像パターン及び差分形状の画像パターンを識別する識別情報を付与する
画像辞書作成方法。 - コンピュータを含む画像辞書作成装置において、
入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字コードとを取得するステップと、
取得された文字コードに基づいて、入力画像に含まれる文字画像を文字コード毎に分類するステップと、
同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出するステップと、
同一の文字コードに分類された文字画像から、当該文字画像と抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出するステップと、
抽出された共通形状の画像パターン及び差分形状の画像パターンそれぞれに対し、共通形状の画像パターン及び差分形状の画像パターンを識別する識別情報を付与するステップと
を前記画像辞書作成装置のコンピュータに実行させるプログラム。 - コンピュータを含む画像辞書作成装置において、
入力画像における文字画像それぞれの領域を示す文字領域情報を取得するステップと、
取得された文字領域情報に基づいて、入力画像から文字画像を抽出するステップと、
抽出された文字画像を、文字コード毎に分類するステップと、
同一の文字コードに分類された文字画像から、当該文字画像に共通する共通形状の画像パターンを抽出するステップと、
同一の文字コードに分類された文字画像から、当該文字画像と抽出された共通形状の画像パターンとの差分である差分形状の画像パターンを抽出するステップと、
抽出された共通形状の画像パターン及び差分形状の画像パターンそれぞれに対し、共通形状の画像パターン及び差分形状の画像パターンを識別する識別情報を付与するステップと
を前記画像辞書作成装置のコンピュータに実行させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004116647A JP4788106B2 (ja) | 2004-04-12 | 2004-04-12 | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム |
US11/067,904 US7889926B2 (en) | 2004-04-12 | 2005-03-01 | Image dictionary creating apparatus, coding apparatus, image dictionary creating method |
CN2005100538710A CN1684492B (zh) | 2004-04-12 | 2005-03-14 | 图像词典作成装置、编码装置、图像词典作成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004116647A JP4788106B2 (ja) | 2004-04-12 | 2004-04-12 | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005301663A JP2005301663A (ja) | 2005-10-27 |
JP4788106B2 true JP4788106B2 (ja) | 2011-10-05 |
Family
ID=35060626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004116647A Expired - Fee Related JP4788106B2 (ja) | 2004-04-12 | 2004-04-12 | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7889926B2 (ja) |
JP (1) | JP4788106B2 (ja) |
CN (1) | CN1684492B (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4177865B2 (ja) * | 2006-09-28 | 2008-11-05 | 株式会社東芝 | ベクトルグラフィックス形状データ生成装置、描画装置、方法およびプログラム |
JP2008199249A (ja) * | 2007-02-13 | 2008-08-28 | Fuji Xerox Co Ltd | 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム |
US20080212877A1 (en) * | 2007-03-04 | 2008-09-04 | John Franco | High speed error detection and correction for character recognition |
JP4766030B2 (ja) * | 2007-10-11 | 2011-09-07 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP4626777B2 (ja) * | 2008-03-14 | 2011-02-09 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP5408139B2 (ja) * | 2008-10-09 | 2014-02-05 | 日本電気株式会社 | 異常検知システム、異常検知方法及び異常検知プログラム |
JP5264675B2 (ja) * | 2008-10-20 | 2013-08-14 | 株式会社東芝 | 画像処理装置及び画像処理方法 |
CN101742442A (zh) * | 2008-11-20 | 2010-06-16 | 银河联动信息技术(北京)有限公司 | 通过短信息传输电子凭证的***和方法 |
JP4843705B2 (ja) * | 2009-11-20 | 2011-12-21 | 株式会社東芝 | 名刺読取装置 |
CN102930575B (zh) * | 2011-08-08 | 2017-07-25 | 深圳市世纪光速信息技术有限公司 | 一种辅助图形绘制的方法、装置及信息终端 |
US8494284B2 (en) * | 2011-11-21 | 2013-07-23 | Nokia Corporation | Methods and apparatuses for facilitating detection of text within an image |
US9563811B2 (en) * | 2012-07-31 | 2017-02-07 | Lg Cns Co., Ltd. | Character recognition method, character recognition apparatus and financial apparatus |
CN103561276B (zh) * | 2013-11-07 | 2017-01-04 | 北京大学 | 一种图像视频编解码方法 |
JP2016153933A (ja) * | 2015-02-20 | 2016-08-25 | 株式会社リコー | 画像処理装置、画像処理システム、画像処理方法、プログラム、及び記録媒体 |
US9848237B2 (en) * | 2015-10-21 | 2017-12-19 | Rovi Guides, Inc. | Systems and methods for identifying a source of a user interface from a fingerprint of the user interface |
US10158784B2 (en) | 2016-12-07 | 2018-12-18 | Xerox Corporation | System and method for adaptively compressing data having noisy images using lossless compression |
JP6866636B2 (ja) * | 2016-12-26 | 2021-04-28 | カシオ計算機株式会社 | 文字編集方法、電子機器、及び、プログラム |
US10438098B2 (en) | 2017-05-19 | 2019-10-08 | Hand Held Products, Inc. | High-speed OCR decode using depleted centerlines |
RU2652461C1 (ru) * | 2017-05-30 | 2018-04-26 | Общество с ограниченной ответственностью "Аби Девелопмент" | Дифференциальная классификация с использованием нескольких нейронных сетей |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06105398B2 (ja) * | 1986-03-31 | 1994-12-21 | 株式会社東芝 | パタ−ン認識学習装置 |
JPS6382061A (ja) * | 1986-09-26 | 1988-04-12 | Ricoh Co Ltd | デ−タ圧縮方式 |
JPH06231310A (ja) * | 1993-02-05 | 1994-08-19 | Fujitsu Ltd | 文字認識装置における文字認識方法 |
US5729637A (en) * | 1994-08-31 | 1998-03-17 | Adobe Systems, Inc. | Method and apparatus for producing a hybrid data structure for displaying a raster image |
JPH08255223A (ja) * | 1995-03-16 | 1996-10-01 | Fuji Electric Co Ltd | 文字認識装置における類似文字判別方法 |
JPH10178638A (ja) * | 1996-12-18 | 1998-06-30 | Nippon Telegr & Teleph Corp <Ntt> | 文字領域符号化方法、復号方法、文字領域符号化装置および復号装置 |
US5889897A (en) * | 1997-04-08 | 1999-03-30 | International Patent Holdings Ltd. | Methodology for OCR error checking through text image regeneration |
US6289124B1 (en) * | 1998-04-27 | 2001-09-11 | Sanyo Electric Co., Ltd. | Method and system of handwritten-character recognition |
JP2000067164A (ja) * | 1998-08-26 | 2000-03-03 | Nippon Telegr & Teleph Corp <Ntt> | パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体 |
JP3730073B2 (ja) * | 2000-02-21 | 2005-12-21 | 日本電信電話株式会社 | テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体 |
US6741745B2 (en) * | 2000-12-18 | 2004-05-25 | Xerox Corporation | Method and apparatus for formatting OCR text |
JP2003050971A (ja) * | 2001-08-07 | 2003-02-21 | Riso Kagaku Corp | フォント選択プログラム、画像処理装置及び画像形成装置 |
EP1576822A1 (en) * | 2002-12-16 | 2005-09-21 | Koninklijke Philips Electronics N.V. | Font library for interactive television recording and playback on a storage medium |
-
2004
- 2004-04-12 JP JP2004116647A patent/JP4788106B2/ja not_active Expired - Fee Related
-
2005
- 2005-03-01 US US11/067,904 patent/US7889926B2/en not_active Expired - Fee Related
- 2005-03-14 CN CN2005100538710A patent/CN1684492B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20050226517A1 (en) | 2005-10-13 |
CN1684492B (zh) | 2010-09-08 |
JP2005301663A (ja) | 2005-10-27 |
CN1684492A (zh) | 2005-10-19 |
US7889926B2 (en) | 2011-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7889926B2 (en) | Image dictionary creating apparatus, coding apparatus, image dictionary creating method | |
KR100938099B1 (ko) | 클러스터링 시스템, 클러스터링 방법, 문서 인코딩 시스템 및 클러스터링 방법을 수행하기 위한 컴퓨터 판독가능 매체 | |
US7623712B2 (en) | Image processing method and apparatus | |
JP2940496B2 (ja) | パタンマッチング符号化装置及び方法 | |
US20080199081A1 (en) | Image processing apparatus, image processing method and computer-readable medium | |
CN101419673B (zh) | 图像词典生成装置及方法 | |
JPH11338976A (ja) | 文書画像認識装置、その方法、及び記録媒体 | |
JP2001203897A (ja) | パタンマッチング符号化装置及び方法 | |
US20060182358A1 (en) | Coding apparatus, decoding apparatus, data file, coding method, decoding method, and programs thereof | |
EP0933719A2 (en) | Image processing method and apparatus | |
US7355529B2 (en) | Binary image compression apparatus and method | |
JP4645058B2 (ja) | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム | |
US7508986B2 (en) | Document recognition device, document recognition method and program, and storage medium | |
JP2005352735A (ja) | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム | |
JP2005323169A (ja) | 画像処理装置、データファイル、画像処理方法及びそのプログラム | |
JP4465654B2 (ja) | 画像辞書作成装置、符号化装置、符号化方法及びそのプログラム | |
JP2001236467A (ja) | パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体 | |
JP2005352734A (ja) | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム | |
JP4973603B2 (ja) | 画像処理装置および画像処理プログラム | |
JP2005352736A (ja) | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム | |
CN106022393A (zh) | 一种基于笔划编码的印刷体汉字识别方法 | |
JPH07160824A (ja) | 文字認識装置 | |
JP2000082113A (ja) | 文字認識装置および辞書作成方法および記録媒体 | |
JP2023034823A (ja) | 画像処理装置、画像処理装置の制御方法およびプログラム | |
JP3862314B2 (ja) | 信号処理方法とその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110621 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110704 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140729 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4788106 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |