JP5082512B2 - 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム - Google Patents

情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム Download PDF

Info

Publication number
JP5082512B2
JP5082512B2 JP2007057952A JP2007057952A JP5082512B2 JP 5082512 B2 JP5082512 B2 JP 5082512B2 JP 2007057952 A JP2007057952 A JP 2007057952A JP 2007057952 A JP2007057952 A JP 2007057952A JP 5082512 B2 JP5082512 B2 JP 5082512B2
Authority
JP
Japan
Prior art keywords
partial image
partial
teacher pattern
image
incorrect answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007057952A
Other languages
English (en)
Other versions
JP2008219825A (ja
Inventor
裕 越
俊一 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2007057952A priority Critical patent/JP5082512B2/ja
Publication of JP2008219825A publication Critical patent/JP2008219825A/ja
Application granted granted Critical
Publication of JP5082512B2 publication Critical patent/JP5082512B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラムに関する。
画像圧縮として知られているJBIG2 Text Region(以後、JBIG2 TR)では、画像データを構成すべき部分画像を抽出し(以後、これを入力部分画像ともいう)、既に辞書に登録してある部分画像データ(以後、これを登録部分画像ともいう)と比較し、もしも、類似している部分画像が見つからない場合には、入力部分画像を辞書に登録する。もしも、類似している部分画像が見つかった場合には、辞書内におけるその部分画像(入力部分画像と類似している登録部分画像)を示すインデックス、及び2値画像データにおける入力部分画像の位置により、入力部分画像を符号化する。例えば、JBIG2 TRでは、入力部分画像は、2値画像データから抽出された文字画像らしき部分画像である。
学習型のパターン認識方式では、認識の正解であるパターン(教師パターン)を予め準備する必要がある。場合によっては、不正解となるパターン(似て非なるパターン等も含む)も準備する必要がある。文字認識では、認識したい文字種類の数が限られているために、予め教師パターンを準備することが容易である。
これに関連する技術として、例えば、特許文献1には、手書き文字の認識率を向上させる文字認識装置を提供することを目的とし、予め、多数の人が記述した一連の文字データセット群をもとに文字種ごとに学習して代表的な文字パターンを文字種見本として記憶する文字種見本記憶部と、前記文字データセット群を人ごとに前記文字種見本を当てはめて一連の文字種見本データセットを作成し書き癖の相関を学習し記憶する見本間相関記憶部とを有し、主文字認識部により文字種が確定された文字パターンの全てに対して、癖推定部が前記文字種見本記憶部の文字種見本を検索して該当する文字種見本を当てはめて文字種見本データセットを作成し、前記見本間相関記憶部に記憶されている書き癖と相関をとり、筆者の書き癖を推定した後、文字種判定部が、主文字認識部により出力された文字種が確定できない文字パターンと、前記推定された書き癖データを比較して不確定な文字パターンの文字種を判定することが開示されている。
また、例えば、特許文献2には、画像中の対象物の大きさの変化にも対応して認識を可能にするパターン認識方法を提供することを目的とし、識別対象物を撮像した画像から抽出した検出画像の輪郭線から輪郭線要素の方向成分を抽出し、方向成分ごとの出現頻度の分布から正規化ヒストグラムが作成され、この正規化ヒストグラムは前記検出画像の輪郭線形状に対応しているので,検出画像の輪郭線の大きさが変化しても形状特徴の認識が可能となり、この識別目的物の認識は、ニューラルネットワークを用いて行うことができ、さらに、作成された正規化ヒストグラムを所定角度ピッチで回転させた回転変換ヒストグラムを作成することにより、検出画像中の輪郭線が回転変化している場合にも対応させることができ、この回転変換ヒストグラムは、ニューラルネットワークを学習させる教師データとすることができるので、検出画像の輪郭線の大きさの変化及び回転がある場合にも形状特徴の認識が可能となることが開示されている。
また、例えば、特許文献3には、高い認識率が得られるテンプレートを人手による作業なしに作成することを課題とし、学習用パターン記憶回路から、訓練パターンを含む学習用パターンが読み出され、訓練パターン抽出回路に入力し、訓練パターン抽出回路は、テンプレート記憶回路から、予め作成されているテンプレートを読みこみ、読み出されたテンプレートを用いて、学習用パターンを認識し、高い類似度を示した位置及びカテゴリを用いて訓練パターンを抽出し、テンプレート選別回路に出力し、テンプレート選別回路では、入力された訓練パターンを用いて、テンプレートを選別し、選別されたテンプレートはテンプレート記憶回路に記憶され、また、新規保存されたテンプレートを用いて、以上の動作を繰り返し行い、テンプレートを更新できることが開示されている。
また、例えば、特許文献4には、ニューラルネットワークの学習用パターンの不足を補い、また、未学習データに対する認識率を高めることができる欠陥検査装置を提供することを課題とし、ニューラルネットワークを用いて被検物の欠陥の有無を検査する欠陥検査装置において、被検物の人工的な欠陥画像を画像処理により作成する人工欠陥作成手段と、人工的に作成された欠陥画像により前記ニューラルネットワークを学習させる学習手段と、を備え、また、人工欠陥作成手段は、被検物における欠陥の位置、輝度及び形状の内の少なくとも一つを乱数により決定して作成し、また、人工欠陥作成手段は複数の分類すべき欠陥ごとに人工的な欠陥画像を作成する手段であり、学習手段は分類すべき欠陥の人工画像と良品画像の学習パターンを乱数により決定してニューラルネットワークに学習させることが開示されている。
特開平05−258117号公報 特開平07−121713号公報 特開2001−236467号公報 特開2004−354251号公報
JBIG2 TRでは、視覚的に類似している部分画像を判定するため、同じ文字種であっても、フォント種、ポイント数又は文字の装飾が異なれば類似していない部分画像となる場合がある。逆に、同一の文字種であってもボールドやイタリックは異なるパターン(文字種)と判定して、圧縮の再現率を高めたい場合もある。例えば、図25は、画像251A、251B内の部分画像252A、252B、252Cを抽出した入力部分画像253A、253B、253Cに対して、これらは「α」という同一の文字種であるが、それぞれ異なるものとして認識すべきにも関わらず、同じ部分画像254として認識している例を示している。
また、文字種、フォント種、ポイント数、文字の装飾等が同じである部分画像であっても、部分画像が生成される過程のばらつきによって、部分画像が完全には一致しない場合がある。例えば、スキャナを用いたスキャン・インの過程では、部分画像の標本化の位相が異なる、ノイズが重畳される、スキューが生じる、微小な倍率差が生じるなどのばらつきが発生し得る。例えば、図26では、画像261A、261B内の部分画像262A、262B、262Cを抽出した入力部分画像263A、263B、263Cに対して、これらは矢印という同一の形態であるが、スキャン・インの位相がずれていても同じ部分画像264として認識すべき例を示している。
JBIG2 TRを実現する背景技術では、予め部分画像の違いを表す特徴量を見つけ、その決められた特徴量に基づいて二つの部分画像が似ているか判定していた。この手法では、例えば、ポイント数と解像度で決まる部分画像の大きさ、ハングル文字やアラビア文字などの文字種、などの様々な符号化対象画像の絵柄を予め想定する必要がある。そして、その想定した条件のほかでは性能が低下する可能性がある。
また、入力画像や参照画像に誤差が存在する場合、距離が0(つまり、その空間内では同一)とならなくても同じパターンと判断すべき場合がある。
しかし、同じパターンとして良い場合と、違うパターンとしなければならない場合とを判別することは一般的に困難である。背景技術のような距離計算の場合には、同一距離であっても、同じパターンとすべき場合と違うパターンとすべき場合の2通りが混在していた。例えば、絶対値距離、2乗距離、相関値等が同じ画像であっても、同じパターンと違うパターンの2種類が存在すると考えられる。
本発明は、このような背景技術の状況の中でなされたもので、入力部分画像の生成過程を模擬して変形をすることで、符号化の対象である多様な画像に対して安定した性能を得ることができるようにした情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。] 情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
前記部分情報抽出手段によって抽出された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分情報抽出手段によって抽出された部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された部分情報を認識させるように制御する制御手段
を具備することを特徴とする情報処理装置。
] 画像から部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分画像抽出手段によって抽出された部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
を具備することを特徴とする画像処理装置。
] 情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
前記部分情報抽出手段によって抽出された部分情報から前記情報源を構成すべき部分情報を登録する部分情報登録手段と、
前記部分情報登録手段によって登録された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分情報抽出手段によって抽出された部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された情報を認識させるように制御する制御手段
を具備することを特徴とする情報処理装置。
] 画像から部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された部分画像から前記画像を構成すべき部分画像を登録する部分画像登録手段と、
前記部分画像登録手段によって登録された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分画像抽出手段によって抽出された部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
を具備することを特徴とする画像処理装置。
] 情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
前記部分情報抽出手段によって抽出された部分情報から前記情報源を構成すべき部分情報を登録する部分情報登録手段と、
前記部分情報登録手段によって登録された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分情報登録手段によって登録されている部分情報であって、前記教師パターン生成手段によって対象となった部分情報以外の部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された情報を認識させるように制御する制御手段
を具備することを特徴とする情報処理装置。
] 画像から部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された部分画像から前記画像を構成すべき部分画像を登録する部分画像登録手段と、
前記部分画像登録手段によって登録された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分画像登録手段によって登録されている部分画像であって、前記教師パターン生成手段によって対象となった部分画像以外の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
を具備することを特徴とする画像処理装置。
] 第1の情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記第1の情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び不正解教師パターン生成手段によって生成された不正解教師パターンに基づいて学習し、該学習をした後に第2の情報の認識を行う認識手段
を具備することを特徴とする情報処理装置。
] 第1の部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記第1の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び不正解教師パターン生成手段によって生成された不正解教師パターンに基づいて学習し、該学習をした後に第2の部分画像の認識を行う認識手段
を具備することを特徴とする画像処理装置。
] 画像データから部分画像を切り出して、該部分画像と該部分画像の位置を出力する部分画像切出手段と、
前記部分画像切出手段によって出力された第1の部分画像にばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分画像切出手段によって出力された第1の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記部分画像切出手段によって出力された部分画像をインデックスを付して登録し、指定されたインデックスに対応する部分画像を出力する辞書手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習し、該学習をした後に、前記辞書手段からの部分画像と前記部分画像切出手段によって出力された第2の部分画像が類似しているか否かを判定する判定手段と、
インデックス及び前記部分画像切出手段によって出力された位置を符号化する符号化手段と、
前記辞書手段に対してインデックスを指定し、該インデックスに対応する前記辞書手段が出力する部分画像と前記第2の部分画像とが類似しているか否かを前記判定手段によって判定させ、類似していると判定された場合は、該インデックスと前記第2の部分画像に対応する位置を前記符号化手段によって符号化させる制御手段
を具備することを特徴とする画像符号化装置。
10] 画像データから部分画像を切り出して、該部分画像と該部分画像の位置を出力する部分画像切出手段と、
前記部分画像切出手段によって出力された第1の部分画像にばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分画像切出手段によって出力された第1の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記部分画像切出手段によって出力された部分画像をインデックスを付して登録し、指定されたインデックスに対応する部分画像を出力する辞書手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習し、該学習をした後に、前記辞書手段からの部分画像と前記部分画像切出手段によって出力された第2の部分画像が類似しているか否かを判定する判定手段と、
インデックス及び前記部分画像切出手段によって出力された位置を符号化する符号化手段と、
前記辞書手段に対してインデックスを指定し、該インデックスに対応する前記辞書手段が出力する部分画像と前記第2の部分画像とが類似しているか否かを前記判定手段によって判定させ、前記辞書手段に登録されている全ての部分画像が該第2の部分画像と類似していないと判定された場合は、該第2の部分画像を前記辞書手段に登録し、該第2の部分画像のインデックスと該第2の部分画像に対応する位置を前記符号化手段によって符号化させる制御手段
を具備することを特徴とする画像符号化装置。
11] コンピュータを、
画像データから部分画像を切り出して、該部分画像と該部分画像の位置を出力する部分画像切出手段と、
前記部分画像切出手段によって出力された第1の部分画像にばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターンに基づいて学習し、該学習をした後に、前記第1の部分画像と前記部分画像切出手段によって出力された第2の部分画像が類似しているか否かを判定する判定手段、及び該第1の部分画像の対をインデックスを付して登録している辞書手段と、
インデックス及び前記部分画像切出手段によって出力された位置を符号化する符号化手段と、
前記辞書手段に対してインデックスを指定し、該インデックスに対応する部分画像と前記第2の部分画像とが類似しているか否かを前記辞書手段内の該インデックスに対応する判定手段によって判定させ、前記辞書手段に登録されている全ての部分画像が該第2の部分画像と類似していないと判定された場合は、該第2の部分画像を前記辞書手段に登録し、該第2の部分画像に対応する新たな判定手段を生成させ、該判定手段を学習させ、該第2の部分画像のインデックスと該第2の部分画像に対応する位置を前記符号化手段によって符号化させる制御手段
として機能させることを特徴とする画像符号化プログラム。
12] コンピュータを、
情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
前記部分情報抽出手段によって抽出された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分情報抽出手段によって抽出された部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された部分情報を認識させるように制御する制御手段
として機能させることを特徴とする情報処理プログラム。
13] コンピュータを、
画像から部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分画像抽出手段によって抽出された部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
として機能させることを特徴とする画像処理プログラム。
14] コンピュータを、
情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
前記部分情報抽出手段によって抽出された部分情報から前記情報源を構成すべき部分情報を登録する部分情報登録手段と、
前記部分情報登録手段によって登録された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分情報抽出手段によって抽出された部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された情報を認識させるように制御する制御手段
として機能させることを特徴とする情報処理プログラム。
15] コンピュータを、
画像から部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された部分画像から前記画像を構成すべき部分画像を登録する部分画像登録手段と、
前記部分画像登録手段によって登録された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分画像抽出手段によって抽出された部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
として機能させることを特徴とする画像処理プログラム。
16] コンピュータを、
情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
前記部分情報抽出手段によって抽出された部分情報から前記情報源を構成すべき部分情報を登録する部分情報登録手段と、
前記部分情報登録手段によって登録された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分情報登録手段によって登録されている部分情報であって、前記教師パターン生成手段によって対象となった部分情報以外の部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された情報を認識させるように制御する制御手段
として機能させることを特徴とする情報処理プログラム。
17] コンピュータを、
画像から部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された部分画像から前記画像を構成すべき部分画像を登録する部分画像登録手段と、
前記部分画像登録手段によって登録された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分画像登録手段によって登録されている部分画像であって、前記教師パターン生成手段によって対象となった部分画像以外の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
として機能させることを特徴とする画像処理プログラム。
18] コンピュータを、
第1の情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記第1の情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記教師パターン生成手段によって生成された教師パターン及び不正解教師パターン生成手段によって生成された不正解教師パターンに基づいて学習し、該学習をした後に第2の情報の認識を行う認識手段
として機能させることを特徴とする情報処理プログラム。
19] コンピュータを、
画像データから部分画像を切り出して、該部分画像と該部分画像の位置を出力する部分画像切出手段と、
前記部分画像切出手段によって出力された第1の部分画像にばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分画像切出手段によって出力された第1の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記部分画像切出手段によって出力された部分画像をインデックスを付して登録し、指定されたインデックスに対応する部分画像を出力する辞書手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習し、該学習をした後に、前記辞書手段からの部分画像と前記部分画像切出手段によって出力された第2の部分画像が類似しているか否かを判定する判定手段と、
インデックス及び前記部分画像切出手段によって出力された位置を符号化する符号化手段と、
前記辞書手段に対してインデックスを指定し、該インデックスに対応する前記辞書手段が出力する部分画像と前記第2の部分画像とが類似しているか否かを前記判定手段によって判定させ、類似していると判定された場合は、該インデックスと前記第2の部分画像に対応する位置を前記符号化手段によって符号化させる制御手段
として機能させることを特徴とする画像符号化プログラム。
20] コンピュータを、
画像データから部分画像を切り出して、該部分画像と該部分画像の位置を出力する部分画像切出手段と、
前記部分画像切出手段によって出力された第1の部分画像にばらつきを与えて教師パターンを生成する教師パターン生成手段と、
前記部分画像切出手段によって出力された第1の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
前記部分画像切出手段によって出力された部分画像をインデックスを付して登録し、指定されたインデックスに対応する部分画像を出力する辞書手段と、
前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習し、該学習をした後に、前記辞書手段からの部分画像と前記部分画像切出手段によって出力された第2の部分画像が類似しているか否かを判定する判定手段と、
インデックス及び前記部分画像切出手段によって出力された位置を符号化する符号化手段と、
前記辞書手段に対してインデックスを指定し、該インデックスに対応する前記辞書手段が出力する部分画像と前記第2の部分画像とが類似しているか否かを前記判定手段によって判定させ、前記辞書手段に登録されている全ての部分画像が該第2の部分画像と類似していないと判定された場合は、該第2の部分画像を前記辞書手段に登録し、該第2の部分画像のインデックスと該第2の部分画像に対応する位置を前記符号化手段によって符号化させる制御手段
として機能させることを特徴とする画像符号化プログラム。
本発明にかかる情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラムによれば、本構成を有していない場合に比較して、入力部分画像の生成過程を模擬した変形をすることで、符号化の対象である多様な画像に対して安定した性能を得ることができる。
又は、対象画像から教師パターンを生成するようにしているので、予め教師パターンを準備する必要がない。さらに、未知のパターンに対しても認識性能を低下させることがない。
本発明を実現するにあたっての好適な各種の実施の形態を説明する。
まず、後述する実施の形態の概要を説明する。
本実施の形態では、入力画像毎に距離計算方法を適応化するものである。つまり、入力画像を中心として、入力画像と同じパターンとなるような空間(同一の部分画像と判断されるべきものの空間)を形成し、その空間内の距離を定義する。その距離を用いてパターンマッチングを行うものである。
より具体的に説明する。
前述のように、JBIG2 TRでは、2値画像データから文字画像らしき部分画像である入力部分画像を抽出し、既に辞書に登録してある部分画像データである登録部分画像と比較し、もしも、類似している部分画像が見つからない場合には、入力部分画像を辞書に登録する。もしも、類似している部分画像が見つかった場合には、辞書内におけるその部分画像を示すインデックス及び2値画像データにおける入力部分画像の位置により、入力部分画像を符号化する。
JBIG2 TRにおける入力部分画像に対して、教師パターンを自動的に生成し、学習型のパターン認識方式を適用することができれば、類似していて、かつ、多少の違いを許容した部分画像を辞書から探すことができるようになる。
後述する実施の形態では、一方の部分画像と他方の部分画像が類似していることを判定するために、パターン認識技術又は文字認識技術等を応用し、さらに、これら認識技術の中でも特に、ニューラル・ネットワーク、マハラノビス・タグチ・システム(MTS)、サポート・ベクタ・マシン(SVM)などの学習型の方式を応用する。
また、特にサポート・ベクタ・マシンなどのパターン認識装置では、正解の教師パターンと不正解の教師パターンが必要である。そして、正解と不正解の境界にあるパターンが認識性能を高める上で重要である。
部分画像が生成される過程を模擬し、そのパラメータを微小に変えることにより、正解となる教師パターンを生成することができる。
また、不正解の教師パターンも入力部分画像を用いて適切に生成することができるようになる。
なお、実施の形態は、対象とする情報を画像データ(以下、画像ともいう)を主に例示して説明するが、画像に限らず音声データ、動画像データ、その他のデータであってもよい。
図1は、第1の実施の形態の概念的な処理及び構成を示す説明図である。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システム及び方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示等)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。
まず、入力された画像11A、画像11Bから入力部分画像13Cを抽出する(ステップS101)。なお、入力する画像は1枚であってもよいし、2枚以上の複数であってもよい。また、画像を入力するとは、具体的には、スキャナによって画像を入力すること、ファックスによって通信回線を介して外部機器から画像を入力すること、記憶媒体から画像を入力すること等がある。また、画像11A、画像11Bには、複数の同一の文字画像(部分画像12A、12B、12C、12D)があるとする。一般的な文書画像であれば、このように同一の文字画像が複数あることは普通である。これらを同一の文字画像であると認識できれば、圧縮率を高めること等ができる。
次に、抽出された部分画像に対してばらつきを与えて教師パターンを生成する(ステップS102A、S102B、S102C、S102D)。
なお、ばらつきとは、対象とする入力部分画像を中心にして規則的又は不規則に変形させることであり、特に、スキャン・イン過程の諸条件や、描画過程の諸条件など入力部分画像の生成過程を模擬した変形をいう。
変形としては、例えば、位相ずらし、ノイズ重畳、微小角回転、微小拡大・縮小、色・濃度変更、MTF特性変更などがある。つまり、入力部分画像が生成される過程を模擬することでばらつきを与え、複数の教師パターンを生成している。
次に、パターン認識装置16に対して、生成された教師パターンを与える(ステップS103A、S103B、S103C、S103D)。パターン認識装置16は、これらの教師パターンに基づいて学習する。パターン認識装置16は、具体的には、パーセプトロンやニューラル・ネットワークなどの学習型のパターン認識装置である。
また、画像11A、画像11Bから部分画像12A等を抽出(登録部分画像15A、15B、15C、15D)し、登録部分画像記憶装置15に登録する(ステップS104)。なお、登録部分画像記憶装置15は、例えば、JBIG2 TRにおける登録部分画像を記憶する手段であってもよい。
そして、パターン認識装置16に学習をさせた後に、パターン認識装置16に登録部分画像記憶装置15から抽出された登録部分画像を入力し(ステップS105)、認識させてその結果を出力する(ステップS106)。つまり、入力部分画像13Cと類似している登録部分画像記憶装置15内の登録部分画像(部分画像17A)を抽出する。
これによって、例えば、入力部分画像と位相が異なるが、類似している登録部分画像が抽出されることになる。
図2は、第2の実施の形態の概念的な処理及び構成を示す説明図である。
なお、前述の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。以下の実施の形態の説明においても同様である。
まず、入力された画像11A、画像11Bから入力部分画像13Cを抽出する(ステップS201)。
また、画像11A、画像11Bから部分画像12A等を抽出(登録部分画像15A、15B、15C、15D)し、登録部分画像記憶装置15に登録する(ステップS202)。
そして、登録部分画像記憶装置15に登録されている登録部分画像を1つ抽出し(ステップS203)、その登録部分画像(部分画像26A)に対して、ばらつきを与えて教師パターンを生成する(ステップS204A、S204B、S204C、S204D)。
次に、パターン認識装置16に対して、生成された教師パターンを与える(ステップS205A、S205B、S205C、S205D)。パターン認識装置16は、これらの教師パターンに基づいて学習する。パターン認識装置16は、具体的には、パーセプトロンやニューラル・ネットワークなどの学習型のパターン認識装置である。
そして、パターン認識装置16に学習をさせた後に、パターン認識装置16に抽出された入力部分画像13Cを入力し(ステップS206)、認識させてその結果を出力する(ステップS207)。つまり、入力部分画像13Cと類似している登録部分画像記憶装置15内の登録部分画像(部分画像17A)を抽出する。
これによって、例えば、入力部分画像と位相が異なるが、類似している登録部分画像が抽出されることになる。
図3は、第3の実施の形態の概念的なモジュール構成図を示している。
第3の実施の形態は、ある画像データともうひとつの画像データ、例えば、入力部分画像と登録部分画像が類似しているか否かを判定する装置である。
第3の実施の形態は、図3に示すように、生成過程模擬モジュール31、生成・廃棄・初期化モジュール32、パターン認識モジュール33を有している。
生成過程模擬モジュール31は、図3に示すように、パターン認識モジュール33と接続されており、ある部分画像が生成される過程を模擬し、入力されたある部分画像にばらつきを与え、教師パターンとしてパターン認識モジュール33へ出力する。
生成・廃棄・初期化モジュール32は、図3に示すように、パターン認識モジュール33と接続されており、ある部分画像に対して生成過程模擬モジュール31によって教師パターンが生成されるごとに、パターン認識モジュール33の生成、廃棄又は初期化を行う。ここで、パターン認識モジュール33を生成するとは、入力部分画像を認識できるパターン認識モジュール33を新規に構成することであり、例えば、ニューロ・ネットワークを利用したパターン認識モジュール33である場合に、そのニューロ・ネットワークを生成することである。パターン認識モジュール33を廃棄するとは、パターン認識モジュール33を削除等することであり、使えない又は使わないようにすることであればよい。例えば、ニューロ・ネットワークを利用したパターン認識モジュール33である場合に、そのニューロ・ネットワークを削除等することである。パターン認識モジュール33を初期化するとは、パターン認識モジュール33を新規に生成した当初の状態にすることであり、学習される前の状態のことをいい、例えば、ニューロ・ネットワークを利用したパターン認識モジュール33である場合に、ユニット間の結合の強さを初期値にすること等である。
パターン認識モジュール33は、図3に示すように、生成過程模擬モジュール31、生成・廃棄・初期化モジュール32と接続されており、生成過程模擬モジュール31によって生成された教師パターンに基づいて学習し、その学習をした後にもうひとつの部分画像の認識を行う。
つまり、パターン認識モジュール33は、ニューロ・ネットワーク(生物の神経回路網をモデルにしたもの)、マハラノビス・タグチ・システム等の学習を用いて、入力に対する最適な出力の規則を自ら作り出すことができるものである。
例えば、ニューロ・ネットワークは、ユニットを、ネットワーク状に多数結合した構造になっている。各ユニットは、結合された他のユニットからの入力の総和に応じて、出力を発生する。この時、結合の強さ(重み付け)を調整することで、システム全体の入力に対して最善の出力が得られるように学習させることができ、入力データと出力データの組み合わせを学習させて、入力に対して最適な出力が得られるようにする。また、具体的に、ニューロネットワークには、階層型と相互結合型がある。階層型はパーセプトロン、バックプロパゲーション(BP)学習型、ネオコグニトロンなどがある。相互結合型はアソシアトロン、ホップフィールドネットワーク、ボルツマンマシンなどがある。
つまり、第3の実施の形態では、ある部分画像が入力される度にパターン認識モジュール33が生成され、教師パターンに基づく学習が実施される。そして、学習が終了したパターン認識モジュール33にもうひとつの部分画像が入力され、ある部分画像ともうひとつの部分画像が類似しているか否かが判定される。
ある部分画像ごとに生成され、学習された各々のパターン認識モジュール33は、もうひとつの部分画像の判定が終了した後に、廃棄されてもよい。一度学習が終了したパターン認識モジュール33で、複数の部分画像を判定してもよい。
ある部分画像ごとにパターン認識モジュール33を生成、廃棄する代わりに、ひとつのパターン認識モジュール33を恒常的に設け、ある部分画像ごとに学習を初期化してもよい。
図4は、第4の実施の形態の構成例についての概念的なモジュール構成図を示している。
第4の実施の形態は、図4に示すように、部分画像切出しモジュール41、生成過程模擬モジュール42、パターン認識モジュール43、認識の生成・廃棄モジュール44、部分画像辞書モジュール45、制御モジュール46、符号化モジュール47を有している。
部分画像切出しモジュール41は、図4に示すように、生成過程模擬モジュール42、部分画像辞書モジュール45、制御モジュール46、符号化モジュール47と接続されており、文書画像データから入力部分画像を切り出して、その入力部分画像を生成過程模擬モジュール42、部分画像辞書モジュール45へ渡し、その部分画像の位置を符号化モジュール47へ渡す。より具体的には、JBIG2 TRで採用している文字画像の切出しを用いてもよい。以下の実施の形態においても同様である。
生成過程模擬モジュール42は、図4に示すように、部分画像切出しモジュール41、パターン認識モジュール43と接続されており、部分画像切出しモジュール41から入力部分画像を受け取り、ばらつきを与えて教師パターンを生成する。その教師パターンをパターン認識モジュール43へ渡す。つまり、入力部分画像が生成される過程を模擬して、入力部分画像にばらつきを与えて教師パターンとして出力する。
パターン認識モジュール43は、図4に示すように、生成過程模擬モジュール42、部分画像辞書モジュール45、制御モジュール46、認識の生成・廃棄モジュール44と接続されており、生成過程模擬モジュール42によって生成された教師パターンに基づいて学習する。そして、学習をした後に、入力部分画像(部分画像切出しモジュール41によって切り出された入力部分画像であるが、生成過程模擬モジュール42に入力された入力部分画像とは限らない)と部分画像辞書モジュール45から受け取った登録部分画像が類似しているか否かの判定、つまり認識を行う。その認識結果を制御モジュール46へ渡す。
認識の生成・廃棄モジュール44は、図4に示すように、パターン認識モジュール43、制御モジュール46と接続されており、制御モジュール46からの指示に基づいて、パターン認識モジュール43の生成、廃棄又は初期化を行う。
部分画像辞書モジュール45は、図4に示すように、部分画像切出しモジュール41、パターン認識モジュール43、制御モジュール46と接続されており、部分画像切出しモジュール41から入力部分画像を受け取り、その入力部分画像を辞書に登録し、制御モジュール46から指定されたインデックスに対応する登録部分画像をパターン認識モジュール43へ出力する。
制御モジュール46は、図4に示すように、部分画像切出しモジュール41、部分画像辞書モジュール45、パターン認識モジュール43、認識の生成・廃棄モジュール44、符号化モジュール47と接続されている。制御モジュール46は以下の制御を行う。
まず、部分画像切出しモジュール41に対して、文書画像データから入力部分画像の切り出しを指示する。
次に、部分画像切出しモジュール41によって切り出された入力部分画像が生成過程模擬モジュール42に入力されるごとに、認識の生成・廃棄モジュール44に対して、パターン認識モジュール43を生成する指示を出し、パターン認識モジュール43による学習が終了した後に、部分画像辞書モジュール45に対してインデックスを指定する。
そして、そのインデックスに対応する部分画像辞書モジュール45がパターン認識モジュール43へ出力する登録部分画像と部分画像切出しモジュール41によって切り出された入力部分画像とが類似しているか否かをパターン認識モジュール43によって判定させる。
類似していると判定された場合は、そのインデックスとその入力部分画像に対応する位置を符号化モジュール47によって符号化させる。
類似していないと判定された場合は、部分画像辞書モジュール45に登録されている次の登録部分画像を示すインデックスを指定して、パターン認識モジュール43に同様の判定を行わせる。
パターン認識モジュール43による判定の結果、部分画像辞書モジュール45に登録されている全ての登録部分画像が対象としている入力部分画像と類似していないと判定された場合は、その入力部分画像を部分画像辞書モジュール45に登録し、入力部分画像のインデックスとその入力部分画像に対応する位置を符号化モジュール47によって符号化させる。
また、制御モジュール46は、認識の生成・廃棄モジュール44に対して、入力部分画像ごとにパターン認識モジュール43の生成又は廃棄の指示を行う。また、入力部分画像ごとに新たにパターン認識モジュール43を生成又は廃棄する代わりに、ひとつのパターン認識モジュール43を恒常的に設け、入力部分画像ごとに学習を初期化してもよい。また、廃棄の指示を行うタイミングは、対象とする入力部分画像に対して、符号化モジュール47による符号化が行われた場合である。
符号化モジュール47は、図4に示すように、部分画像切出しモジュール41、制御モジュール46と接続されており、制御モジュール46から渡されたインデックス及び部分画像切出しモジュール41によって切り出された入力部分画像の位置を符号化する。なお、部分画像切出しモジュール41によって切り出された入力部分画像は、パターン認識モジュール43によって認識された入力部分画像であり、制御モジュール46から渡されたインデックスが指し示す登録部分画像であると認識されたものである。
入力部分画像が生成される過程を模擬し入力部分画像にばらつきを与え教師パターンとして出力する生成過程模擬モジュール42の具体的な構成例について、図5〜図13を用いて説明する。
図5は、生成過程模擬モジュール42の構成例についての概念的なモジュール構成図を示している。つまり、入力部分画像を異なる位相で再標本化(再サンプリング)することで、教師パターンを生成する例を示している。
生成過程模擬モジュール42は、図5に示すように、再標本化モジュール51、位相指示モジュール52を有していてもよい。
位相指示モジュール52は、図5に示すように、再標本化モジュール51と接続されており、再標本化モジュール51に対して、ずらす位相量の指示を行う。位相指示モジュール52は、教師パターンが生成過程を均一に模擬するように、例えば、±1/2画素の範囲で均一な分布となるように指示してもよい(図6(B)参照)。また、入力部分画像の一部分に対してのみ位相ずらしを行う、領域によってずらす位相量を異ならせる等の指示であってもよい。
再標本化モジュール51は、部分画像切出しモジュール41から入力部分画像を受け取り、位相指示モジュール52による指示に基づいて、入力部分画像の位相をずらす。
位相をずらすことは、再標本化にあたり、線形補間法や標本化関数の畳み込み補間法などを用いればよい。
図7は、生成過程模擬モジュール42の構成例についての概念的なモジュール構成図を示している。つまり、入力部分画像を微小倍率で拡大・縮小することで、教師パターンを生成する例を示している。
生成過程模擬モジュール42は、図7に示すように、微小倍率拡大・縮小モジュール71、倍率指示モジュール72を有していてもよい。
倍率指示モジュール72は、図7に示すように、微小倍率拡大・縮小モジュール71と接続されており、微小倍率拡大・縮小モジュール71に対して、拡大・縮小する倍率の指示を行う。倍率指示モジュール72は、教師パターンが生成過程を均一に模擬するように、例えば、±5%の範囲で均一な分布となるように指示してもよい(図8(B)参照)。また、入力部分画像の一部分に対してのみ拡大・縮小を行う、領域によって倍率を異ならせる等の指示であってもよい。
微小倍率拡大・縮小モジュール71は、部分画像切出しモジュール41から入力部分画像を受け取り、倍率指示モジュール72による指示に基づいて、入力部分画像を拡大・縮小する。
拡大・縮小に伴う補間は、線形補間法や標本化関数の畳み込み補間法などを用いればよい。
図9は、生成過程模擬モジュール42の構成例についての概念的なモジュール構成図を示している。つまり、入力部分画像を微小な角度で回転することで、教師パターンを生成する例を示している。
生成過程模擬モジュール42は、図9に示すように、微小角度回転モジュール91、角度指示モジュール92を有していてもよい。
角度指示モジュール92は、図9に示すように、微小角度回転モジュール91と接続されており、微小角度回転モジュール91に対して、回転させる角度の指示を行う。角度指示モジュール92は、教師パターンが生成過程を均一に模擬するように、例えば、±5°の範囲で均一な分布となるように指示してもよい(図10(B)参照)。また、入力部分画像の一部分に対してのみ回転を行う、領域によって回転角度を異ならせる等の指示であってもよい。
微小角度回転モジュール91は、部分画像切出しモジュール41から入力部分画像を受け取り、角度指示モジュール92による指示に基づいて、入力部分画像を回転する。
回転に伴う再標本化は、線形補間法や標本化関数の畳み込み補間法などを用いればよい。
図11は、生成過程模擬モジュール42の構成例についての概念的なモジュール構成図を示している。つまり、入力部分画像に空間フィルタを施すことで、教師パターンを生成する例を示している。
生成過程模擬モジュール42は、図11に示すように、空間フィルタモジュール111、特性指示モジュール112を有していてもよい。
特性指示モジュール112は、図11に示すように、空間フィルタモジュール111と接続されており、空間フィルタモジュール111に対して、空間フィルタの特性の指示を行う。特性指示モジュール112は、空間フィルタの特性として、例えば、バンド・パス特性、ロー・パス特性などを指示してもよい(図12(A)(B)参照)。また、入力部分画像の一部分に対してのみ空間フィルタを施す、領域によって空間フィルタを異ならせる等の指示であってもよい。
空間フィルタモジュール111は、部分画像切出しモジュール41から入力部分画像を受け取り、特性指示モジュール112による指示に基づいて、入力部分画像に対して空間フィルタを施す。
図13は、生成過程模擬モジュール42の構成例についての概念的なモジュール構成図を示している。つまり、入力部分画像にノイズを重畳することで、教師パターンを生成する例を示している。
生成過程模擬モジュール42は、図13に示すように、ノイズ重畳モジュール131、特性指示モジュール132を有していてもよい。
特性指示モジュール132は、図13に示すように、ノイズ重畳モジュール131と接続されており、ノイズ重畳モジュール131に対して、ノイズ重畳の特性の指示を行う。特性指示モジュール132は、ノイズ重畳の特性として、例えば、ホワイト・ガウス・ノイズなどの特性を指示してもよい。また、入力部分画像の一部分に対してのみノイズ重畳を施す、領域によってノイズ重畳の特性を異ならせる等の指示であってもよい。
ノイズ重畳モジュール131は、部分画像切出しモジュール41から入力部分画像を受け取り、特性指示モジュール132による指示に基づいて、入力部分画像に対してノイズを重畳する。重畳すべきノイズの生成方法は、疑似乱数などの計算手法で生成してもよいし、疑似乱数に適当な空間フィルタをかけることで生成してもよいし、実際のノイズ波形を計測して使用してもよい。
図14は、第5の実施の形態の構成例についての概念的なモジュール構成図を示している。
第5の実施の形態は、図14に示すように、生成過程模擬モジュール141、生成・廃棄・初期化モジュール142、MTSパターン認識モジュール143を有している。
第5の実施の形態は、図3で示した第3の実施の形態に対応しており、第3の実施の形態のパターン認識モジュール33をMTSパターン認識モジュール143にしたものである。他の生成過程模擬モジュール141、生成・廃棄・初期化モジュール142は、それぞれ生成過程模擬モジュール31、生成・廃棄・初期化モジュール32と同様である。
マハラノビス・タグチ・システムのMTSパターン認識モジュール143は、良いパターン、すなわち、類似しているパターンのみを集めて基準空間を作り、基準空間の中心ほど良く、中心からのマハラノビス距離が大きくなるほど良くない、すなわち類似していないと判断するものである。したがって、教師パターンとして、良いパターンのみを与えれば良く、良くないパターンを与える必要がない。良くないパターンは良いパターンと比較して多様性が大きいことが多く、良くないパターンを適切に生成することはより困難であることが多い。したがって、教師パターン生成が容易である。
第5の実施の形態は、特にJBIG2 TRなどに応用することもできる。つまり、登録部分画像の辞書生成に利用できる。
まず、JBIG2 TRで登録部分画像を生成する際に、厳しい基準(本来類似している部分画像であるが、それぞれ異なる部分画像として登録してしまうような基準、例えば、画像間の距離の閾値を小さくする基準)で行う。
次に、第5の実施の形態で、入力部分画像として、既に登録済みの登録部分画像とする。
各登録部分画像に対して、生成過程模擬モジュール141が入力部分画像の生成過程を模擬した誤差を入れた空間を生成する。
MTSパターン認識モジュール143は、その空間を用いて、他の登録部分画像との距離を計測する。その距離が閾値以下の登録部分画像は、統合して、新たな登録部分画像とする。
このようにすることで、最初厳しい基準で登録した登録部分画像を統合することができるため、圧縮率を向上させることが可能となる。
図15は、第6の実施の形態の構成例についての概念的なモジュール構成図を示している。
第6の実施の形態は、図15に示すように、多値部分画像切出しモジュール151、生成過程模擬モジュール152、パターン認識モジュール153、部分画像辞書モジュール154、制御モジュール155、符号化モジュール156を有している。
多値部分画像切出しモジュール151は、図15に示すように、生成過程模擬モジュール152、部分画像辞書モジュール154、符号化モジュール156と接続されており、2値画像である文書画像データから入力部分画像を切り出して、その入力部分画像を多値化することによって多値化部分画像を生成し、その多値化部分画像を生成過程模擬モジュール152、部分画像辞書モジュール154へ渡し、その部分画像の位置を符号化モジュール156へ渡す。したがって、生成過程模擬モジュール152、部分画像辞書モジュール154、パターン認識モジュール153が処理する対象は、多値化された部分画像である。
生成過程模擬モジュール152は、図15に示すように、多値部分画像切出しモジュール151、パターン認識モジュール153と接続されており、多値部分画像切出しモジュール151から多値化部分画像を受け取り、ばらつきを与えて教師パターンを生成する。その教師パターンをパターン認識モジュール153へ渡す。つまり、入力部分画像が生成される過程を模擬して、入力部分画像にばらつきを与えて教師パターンとして出力する。
パターン認識モジュール153は、図15に示すように、生成過程模擬モジュール152、部分画像辞書モジュール154、制御モジュール155と接続されており、生成過程模擬モジュール152によって生成された教師パターンに基づいて学習する。そして、学習をした後に、多値化部分画像(多値部分画像切出しモジュール151によって出力された多値化部分画像であるが、生成過程模擬モジュール152に入力された多値化部分画像とは限らない)と部分画像辞書モジュール154から受け取った登録部分画像が類似しているか否かの判定、つまり認識を行う。その認識結果を制御モジュール155へ渡す。
部分画像辞書モジュール154は、図15に示すように、多値部分画像切出しモジュール151、パターン認識モジュール153、制御モジュール155と接続されており、多値部分画像切出しモジュール151から多値化部分画像を受け取り、その多値化部分画像を辞書に登録し、制御モジュール155から指定されたインデックスに対応する登録部分画像をパターン認識モジュール153へ出力する。
制御モジュール155は、図15に示すように、パターン認識モジュール153、部分画像辞書モジュール154、符号化モジュール156と接続されている。制御モジュール155は、パターン認識モジュール153による学習の終了の後に、以下の制御を行う。
部分画像辞書モジュール154に対してインデックスを指定し、そのインデックスに対応する部分画像辞書モジュール154が出力する登録部分画像と多値部分画像切出しモジュール151によって出力された多値化部分画像とが類似しているか否かをパターン認識モジュール153によって判定させる。
類似していると判定された場合は、そのインデックスとその多値化部分画像に対応する位置を符号化モジュール156によって符号化させる。
類似していないと判定された場合は、部分画像辞書モジュール154に登録されている次の登録部分画像を示すインデックスを指定して、パターン認識モジュール153に同様の判定を行わせる。
パターン認識モジュール153による判定の結果、部分画像辞書モジュール154に登録されている全ての登録部分画像が対象としている多値化部分画像と類似していないと判定された場合は、その多値化部分画像を部分画像辞書モジュール154に登録し、多値化部分画像のインデックスとその多値化部分画像に対応する位置を符号化モジュール156によって符号化させ、パターン認識モジュール153の学習を初期化する。
符号化モジュール156は、図15に示すように、多値部分画像切出しモジュール151、制御モジュール155と接続されており、制御モジュール155から渡されたインデックス及び多値部分画像切出しモジュール151によって切り出された入力部分画像の位置を符号化する。なお、多値部分画像切出しモジュール151によって切り出された入力部分画像は、パターン認識モジュール153によって認識された入力部分画像であり、制御モジュール155から渡されたインデックスが指し示す登録部分画像であると認識されたものである。
第6の実施の形態によれば、パターン認識モジュール153によるパターン認識処理を多値化画像に対して施すため、認識精度が向上する。
図16は、第7の実施の形態の構成例についての概念的なモジュール構成図を示している。
第7の実施の形態は、図16に示すように、部分画像切出しモジュール161、生成過程模擬モジュール162、部分画像辞書モジュール163、制御モジュール164、符号化モジュール165を有している。
部分画像切出しモジュール161は、図16に示すように、生成過程模擬モジュール162、部分画像辞書モジュール163、制御モジュール164、符号化モジュール165と接続されており、文書画像データから入力部分画像を切り出して、その入力部分画像を生成過程模擬モジュール162、部分画像辞書モジュール163へ渡し、その部分画像の位置を符号化モジュール165へ渡す。
生成過程模擬モジュール162は、図16に示すように、部分画像切出しモジュール161、部分画像辞書モジュール163と接続されており、部分画像切出しモジュール161から入力部分画像を受け取り、ばらつきを与えて教師パターンを生成する。その教師パターンを部分画像辞書モジュール163へ渡す。つまり、入力部分画像が生成される過程を模擬して、入力部分画像にばらつきを与えて教師パターンとして出力する。
部分画像辞書モジュール163は、図16に示すように、部分画像切出しモジュール161、生成過程模擬モジュール162、制御モジュール164と接続されている。そして、部分画像辞書モジュール163内に、パターン認識モジュールとそのパターン認識モジュールが認識できる部分画像との対をインデックスを付して記憶している。そのインデックスが指定されることによって、インデックスに対応するパターン認識モジュールが入力された部分画像が類似しているか否かを判定する。
部分画像辞書モジュール163内のパターン認識モジュールは、生成過程模擬モジュール162によって生成された教師パターンに基づいて学習する。その学習をした後に、学習をした部分画像と部分画像切出しモジュール161によって出力された入力部分画像が類似しているか否かを判定する。
制御モジュール164は、図16に示すように、部分画像切出しモジュール161、部分画像辞書モジュール163、符号化モジュール165と接続されている。制御モジュール164は、以下の制御を行う。
まず、部分画像切出しモジュール161に対して、文書画像データから入力部分画像の切り出しを指示する。
次に、部分画像辞書モジュール163に対してインデックスを指定し、そのインデックスに対応する部分画像と部分画像切出しモジュール161によって切り出された入力部分画像とが類似しているか否かを部分画像辞書モジュール163内のそのインデックスに対応するパターン認識モジュールによって判定させる。
類似していると判定された場合は、そのインデックスと対象となっている入力部分画像に対応する位置を符号化モジュール165によって符号化させる。
類似していないと判定された場合は、部分画像辞書モジュール163に登録されている次の登録部分画像を示すインデックスを指定して、部分画像辞書モジュール163内のパターン認識モジュールに同様の判定を行わせる。
部分画像辞書モジュール163に登録されている全ての部分画像が対象となっている入力部分画像と類似していないと判定された場合は、対象となっている入力部分画像を部分画像辞書モジュール163に登録し、その入力部分画像に対応する新たなパターン認識モジュールを生成させる。
そして、部分画像辞書モジュール163内のパターン認識モジュールを学習させる。つまり、新たに登録した部分画像の教師パターンを生成過程模擬モジュール162により生成させ、部分画像辞書モジュール163内のパターン認識モジュールをその教師パターンに基づいて学習させる。学習が終了した場合は、そのパターン認識モジュールを登録した部分画像と対にしてインデックスを付して登録する。
そして、登録した部分画像のインデックスとその部分画像に対応する位置を符号化モジュール165によって符号化させる。
符号化モジュール165は、図16に示すように、部分画像切出しモジュール161、制御モジュール164と接続されており、制御モジュール164から渡されたインデックス及び部分画像切出しモジュール161によって切り出された入力部分画像の位置を符号化する。なお、部分画像切出しモジュール161によって切り出された入力部分画像は、部分画像辞書モジュール163によって認識された入力部分画像であり、制御モジュール164から渡されたインデックスが指し示す登録部分画像であると認識されたものである。
前述の実施の形態は、教師パターンとして正解のものを与えていたが、第8〜第12の実施の形態は、不正解となる教師パターンをも与えて学習するものに関するものである。
図17は、第8の実施の形態の概念的な処理及び構成を示している。
まず、入力された画像11A、画像11Bから入力部分画像13Cを抽出する(ステップS1701)。
次に、抽出された部分画像に対してばらつきを与えて正解となる教師パターンを生成する(ステップS1702A、S1702B、S1702C)。
次に、パターン認識装置16に対して、生成された教師パターンを与える(ステップS1703A、S1703B、S1703C)。パターン認識装置16は、これらの教師パターンに基づいて学習する。
一方、抽出された部分画像に対して、不正解となる教師パターンを生成する。例えば、画像を極端に太らせる処理(ステップS1704)、極端に傾斜させる処理(ステップS1705)等を行って、不正解となるべき教師パターンを複数生成する。
次に、パターン認識装置16に対して、生成された不正解となるべき教師パターンを与える(ステップS1706、S1707)。パターン認識装置16は、これらの不正解となる教師パターンに基づいて学習する。
また、画像11A、画像11Bから部分画像12A等を抽出(登録部分画像15A、15B、15C、15D)し、登録部分画像記憶装置15に登録する(ステップS1708)。
そして、学習が終了したパターン認識装置16は、登録部分画像記憶装置15に登録されている登録部分画像15A等を認識し、その認識結果17Aを出力する(ステップS1710)。
図18は、第9の実施の形態の概念的な処理及び構成を示している。
まず、入力された画像11A、画像11Bから入力部分画像13Cを抽出する(ステップS1801)。
また、画像11A、画像11Bから部分画像12A等を抽出(登録部分画像15A、15B、15C、15D)し、登録部分画像記憶装置15に登録する(ステップS1802)。
そして、登録部分画像記憶装置15に登録されている登録部分画像15A等を1つ抽出し(ステップS1803)、その登録部分画像(部分画像26A)に対して、ばらつきを与えて正解となる教師パターンを生成する(ステップS1804A、S1804B)。
次に、パターン認識装置16に対して、生成された教師パターンを与える(ステップS1805A、S1805B)。パターン認識装置16は、これらの教師パターンに基づいて学習する。
一方、抽出した登録部分画像(部分画像26A)に対して、不正解となる教師パターンを生成する。例えば、画像を極端に太らせる処理(ステップS1806)、極端に傾斜させる処理(ステップS1807)等を行って、不正解となる教師パターンを複数生成する。
次に、パターン認識装置16に対して、生成された不正解となるべき教師パターンを与える(ステップS1808、S1809)。パターン認識装置16は、これらの不正解となるべき教師パターンに基づいて学習する。
そして、学習が終了したパターン認識装置16は、ステップS1801で切り出した入力部分画像(入力部分画像13C)を認識し(ステップS1810)、その認識結果を出力する(ステップS1811)。
図19は、第10の実施の形態の概念的な処理及び構成を示している。
まず、入力された画像11A、画像11Bから入力部分画像13Cを抽出する(ステップS1901)。
また、画像11A、画像11Bから部分画像12A等を抽出(登録部分画像15A、15B、15C、15D、15E、15F)し、登録部分画像記憶装置15に登録する(ステップS1902)。
そして、登録部分画像記憶装置15に登録されている登録部分画像15Aを1つ抽出し(ステップS1903)、その登録部分画像(部分画像26A)に対して、ばらつきを与えて正解となる教師パターンを生成する(ステップS1904A、S1904B、S1904C)。
次に、パターン認識装置16に対して、生成された教師パターンを与える(ステップS1905A、S1905B、S1905C)。パターン認識装置16は、これらの教師パターンに基づいて学習する。
一方、登録部分画像記憶装置15によって登録されている部分画像であって、正解となる教師パターンの基として抽出された部分画像(登録部分画像15A)以外の部分画像(登録部分画像15B、15C、15D、15E、15F)から不正解となる教師パターンを生成する。ここでは、登録部分画像15Bそのものが不正解となる教師パターンとなる。また、画像を極端に太らせる処理、極端に傾斜させる処理等を行ってもよい。そして、パターン認識装置16に対して、生成された不正解の教師パターンを与える(ステップS1906)。パターン認識装置16は、これらの不正解となるべき教師パターンに基づいて学習する。
そして、学習が終了したパターン認識装置16は、ステップS1901で切り出した入力部分画像(入力部分画像13C)を認識し(ステップS1907)、その認識結果を出力する(ステップS1908)。
図20は、第11の実施の形態の構成例についての概念的なモジュール構成図を示している。
第11の実施の形態は、入力部分画像と登録部分画像が類似しているか否かを判定する装置である。
第11の実施の形態は、図20に示すように、生成過程模擬モジュール201、パターン推定モジュール202、パターン認識モジュール203を有している。
生成過程模擬モジュール201は、図20に示すように、パターン認識モジュール203と接続されており、入力部分画像が生成される過程を模擬し、その入力部分画像にばらつきを与え、正解の教師パターンとしてパターン認識モジュール203へ出力する。
パターン推定モジュール202は、図20に示すように、パターン認識モジュール203と接続されており、入力部分画像から不正解となる教師パターンを生成する。
パターン認識モジュール203は、図20に示すように、生成過程模擬モジュール201、パターン推定モジュール202と接続されており、生成過程模擬モジュール201から渡された正解の教師パターン及びパターン推定モジュール202から渡された不正解となる教師パターンを受け取り、それらに基づいて学習する。そして、学習した後に、登録部分画像を入力し、入力部分画像と登録部分画像とが類似しているか否かの判定を行う。
図21は、第12の実施の形態の構成例についての概念的なモジュール構成図を示している。
第12の実施の形態は、図21に示すように、部分画像切出しモジュール211、生成過程模擬モジュール212、パターン認識モジュール213、パターン推定モジュール214、部分画像辞書モジュール215、制御モジュール216、符号化モジュール217を有している。
部分画像切出しモジュール211は、図21に示すように、生成過程模擬モジュール212、パターン推定モジュール214、部分画像辞書モジュール215、符号化モジュール217と接続されており、文書画像データから入力部分画像を切り出して、その入力部分画像を生成過程模擬モジュール212、パターン推定モジュール214、部分画像辞書モジュール215へ渡し、その部分画像の位置を符号化モジュール217へ渡す。
生成過程模擬モジュール212は、図21に示すように、部分画像切出しモジュール211、パターン認識モジュール213と接続されており、部分画像切出しモジュール211から入力部分画像を受け取り、ばらつきを与えて教師パターンを生成する。その教師パターンをパターン認識モジュール213へ渡す。
パターン推定モジュール214は、図21に示すように、部分画像切出しモジュール211、パターン認識モジュール213と接続されており、部分画像切出しモジュール211から入力部分画像を受け取り、不正解となる教師パターンを生成する。その不正解となる教師パターンをパターン認識モジュール213へ渡す。
部分画像辞書モジュール215は、図21に示すように、部分画像切出しモジュール211、パターン認識モジュール213、制御モジュール216と接続されており、部分画像切出しモジュール211から入力部分画像を受け取り、その入力部分画像にインデックスを付して登録する。そして、制御モジュール216から指定されたインデックスに対応する登録部分画像をパターン認識モジュール213へ出力する。
パターン認識モジュール213は、図21に示すように、生成過程模擬モジュール212、パターン推定モジュール214、部分画像辞書モジュール215、制御モジュール216と接続されており、生成過程模擬モジュール212によって生成された教師パターン及びパターン推定モジュール214によって生成された不正解の教師パターンに基づいて学習する。その学習をした後に、部分画像辞書モジュール215が出力する登録部分画像と部分画像切出しモジュール211によって切り出された入力部分画像が類似しているか否かを判定する。
制御モジュール216は、図21に示すように、パターン認識モジュール213、部分画像辞書モジュール215、符号化モジュール217と接続されている。制御モジュール216は、パターン認識モジュール213による学習の終了の後に、以下の制御を行う。
まず、部分画像辞書モジュール215に対してインデックスを指定し、そのインデックスに対応する登録部分画像をパターン認識モジュール213へ出力させる。
部分画像辞書モジュール215が出力する登録部分画像と部分画像切出しモジュール211が切り出した入力部分画像とが類似しているか否かをパターン認識モジュール213によって判定させる。
類似していると判定された場合は、そのインデックスと対象となっている入力部分画像に対応する位置を符号化モジュール217によって符号化させる。
類似していないと判定された場合は、部分画像辞書モジュール215に登録されている次の登録部分画像を示すインデックスを指定して、パターン認識モジュール213に同様の判定を行わせる。
部分画像辞書モジュール215に登録されている全ての登録部分画像が対象となっている入力部分画像と類似していないと判定された場合は、その入力部分画像を部分画像辞書モジュール215に登録し、その入力部分画像のインデックスとその入力部分画像に対応する位置を符号化モジュール217によって符号化させる。
符号化モジュール217は、図21に示すように、部分画像切出しモジュール211、制御モジュール216と接続されており、制御モジュール216から渡されたインデックス及び部分画像切出しモジュール211によって切り出された入力部分画像の位置を符号化する。なお、部分画像切出しモジュール211によって切り出された入力部分画像は、パターン認識モジュール213によって認識された入力部分画像であり、制御モジュール216から渡されたインデックスが指し示す登録部分画像であると認識されたものである。
図22は、パターン推定モジュール214による処理例を示している。
パターン推定モジュール214は、部分画像辞書モジュール215に記憶されている登録部分画像からパターンを推定し、推定したパターンと異なることがわかっているパターンを生成することで複数の不正解の教師パターンを作成するようにしてもよい(図18に示した第9の実施の形態参照)。登録部分画像そのものを推定パターンとして、明らかに異なるパターンになることがわかっている処理を施す。
例えば、ボールド修飾のように文字を極端に太らせる処理がある(図22の登録部分画像222参照)。太らせる手法としては、膨張処理などでよい。逆に細らせてもよい。
例えば、イタリック修飾のように文字を大きく傾斜させる処理がある(図22の登録部分画像223参照)。傾斜させる手法としては、アフィン変換などでよい。アフィン変換で大きな倍率差で縦横変倍(縦と横で異なる倍率で拡大・縮小すること)してもよい。
例えば、線分を抽出し、線分の先端部分に「はね」、「とめ」、「はらい」、「丸め」などの装飾を施すようにしてもよい。
図23は、パターン推定モジュール214による処理例を示している。
また、パターン推定モジュール214は、部分画像辞書モジュール215に記憶されている登録部分画像からパターンを推定し、推定したパターンと異なることがわかっているパターンを生成することで複数の不正解の教師パターンを作成するようにしてもよい。登録部分画像そのものを推定パターンとして、明らかに異なるパターンになることがわかっている処理を施す。
登録部分画像231とフォント・パターンのデータベース232(例えば、印刷用に用意されている一般的なフォントデータファイル)内のフォントデータ(フォントデータ232A、フォントデータ232B等)とを比較し、最も類似しており、かつ、ある程度以上類似しているフォントデータがある場合に、そのフォントデータを推定パターン233とし、対応する文字コード(文字そのものを表すコード)及びフォント・コード(文字を出力する際の書体を表すコード)とは異なるフォント・パターンのデータベース232内のフォントデータを不正解の教師パターン234として用いる。また、不正解の教師パターン234は、文字コードが異なるフォントデータであってもよいし、文字コードは異ならないがフォント・コードが異なるフォントデータであってもよい。
フォント・パターンのデータベース232内のフォントデータと比較する代わりに、登録部分画像を文字認識装置で認識し、その結果である文字コードとは異なるフォントデータを不正解の教師パターン234としてもよい。
図24を参照して、実施の形態のハードウェア構成例について説明する。図24に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部2417と、プリンタなどのデータ出力部2418を備えたハードウェア構成例を示している。なお、このハードウェア構成は、他の実施の形態についても適用する。
CPU(Central Processing Unit)2401は、前述の実施の形態において説明した各種のモジュール、すなわち、パターン認識モジュール33、生成過程模擬モジュール42、パターン推定モジュール202等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)2402は、CPU2401が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)2403は、CPU2401の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス2404により相互に接続されている。
ホストバス2404は、ブリッジ2405を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス2406に接続されている。
キーボード2408、マウス等のポインティングデバイス2409は、操作者により操作される入力デバイスである。ディスプレイ2410は、液晶表示装置又はCRT(Cathode Ray Tube)などからなり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)2411は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU2401によって実行するプログラムや情報を記録又は再生させる。ハードディスクは、入力部分画像や登録部分画像などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ2412は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2413に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2407、外部バス2406、ブリッジ2405、及びホストバス2404を介して接続されているRAM2403に供給する。リムーバブル記録媒体2413も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート2414は、外部接続機器2415を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート2414は、インタフェース2407、及び外部バス2406、ブリッジ2405、ホストバス2404等を介してCPU2401等に接続されている。通信部2416は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部2417は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2418は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図24に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図24に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図24に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(多機能複写機とも呼ばれ、スキャナ、プリンタ、複写機、ファックス等の機能を有している)などに組み込まれていてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、上記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、上記のプログラム又はその一部は、上記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組合せ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
第1の実施の形態の概念的な処理及び構成を示す説明図である。 第2の実施の形態の概念的な処理及び構成を示す説明図である。 第3の実施の形態の構成例についての概念的なモジュール構成図である。 第4の実施の形態の構成例についての概念的なモジュール構成図である。 生成過程模擬モジュールの構成例についての概念的なモジュール構成図である。 生成過程模擬モジュールによる処理例を示す説明図である。 生成過程模擬モジュールの構成例についての概念的なモジュール構成図である。 生成過程模擬モジュールによる処理例を示す説明図である。 生成過程模擬モジュールの構成例についての概念的なモジュール構成図である。 生成過程模擬モジュールによる処理例を示す説明図である。 生成過程模擬モジュールの構成例についての概念的なモジュール構成図である。 空間フィルタモジュールが用いる空間フィルタの例を示す説明図である。 生成過程模擬モジュールの構成例についての概念的なモジュール構成図である。 第5の実施の形態の構成例についての概念的なモジュール構成図である。 第6の実施の形態の構成例についての概念的なモジュール構成図である。 第7の実施の形態の構成例についての概念的なモジュール構成図である。 第8の実施の形態の概念的な処理及び構成を示す説明図である。 第9の実施の形態の概念的な処理及び構成を示す説明図である。 第10の実施の形態の概念的な処理及び構成を示す説明図である。 第11の実施の形態の構成例についての概念的なモジュール構成図である。 第12の実施の形態の構成例についての概念的なモジュール構成図である。 パターン推定モジュールによる処理例を示す説明図である。 パターン推定モジュールによる処理例を示す説明図である。 実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。 課題の一例を示す説明図である。 課題の一例を示す説明図である。
符号の説明
15…登録部分画像記憶装置
16…パターン認識装置
31…生成過程模擬モジュール
32…生成・廃棄・初期化モジュール
33…パターン認識モジュール
41…部分画像切出しモジュール
42…生成過程模擬モジュール
43…パターン認識モジュール
44…認識の生成・廃棄モジュール
45…部分画像辞書モジュール
46…制御モジュール
47…符号化モジュール
51…再標本化モジュール
52…位相指示モジュール
71…微小倍率拡大・縮小モジュール
72…倍率指示モジュール
91…微小角度回転モジュール
92…角度指示モジュール
111…空間フィルタモジュール
112…特性指示モジュール
113…ノイズ重量モジュール
114…特性指示モジュール
131…ノイズ重畳モジュール
132…特性指示モジュール
141…生成過程模擬モジュール
142…生成・廃棄・初期化モジュール
143…MTSパターン認識モジュール
151…多値部分画像切出しモジュール
152…生成過程模擬モジュール
153…パターン認識モジュール
154…部分画像辞書モジュール
155…制御モジュール
156…符号化モジュール
161…部分画像切出しモジュール
162…生成過程模擬モジュール
163…部分画像辞書モジュール
164…制御モジュール
165…符号化モジュール
201…生成過程模擬モジュール
202…パターン推定モジュール
203…パターン認識モジュール
211…部分画像切出しモジュール
212…生成過程模擬モジュール
213…パターン認識モジュール
214…パターン推定モジュール
215…部分画像辞書モジュール
216…制御モジュール
217…符号化モジュール
232…フォント・パターンのデータベース
2401…CPU
2402…ROM
2403…RAM
2404…ホストバス
2405…ブリッジ
2406…外部バス
2407…インタフェース
2408…キーボード
2409…ポインティングデバイス
2410…ディスプレイ
2411…HDD
2412…ドライブ
2413…リムーバブル記録媒体
2414…接続ポート
2415…外部接続機器
2416…通信部
2417…データ読み取り部
2418…データ出力部

Claims (20)

  1. 情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
    前記部分情報抽出手段によって抽出された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分情報抽出手段によって抽出された部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された部分情報を認識させるように制御する制御手段
    を具備することを特徴とする情報処理装置。
  2. 画像から部分画像を抽出する部分画像抽出手段と、
    前記部分画像抽出手段によって抽出された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分画像抽出手段によって抽出された部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
    を具備することを特徴とする画像処理装置。
  3. 情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
    前記部分情報抽出手段によって抽出された部分情報から前記情報源を構成すべき部分情報を登録する部分情報登録手段と、
    前記部分情報登録手段によって登録された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分情報抽出手段によって抽出された部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された情報を認識させるように制御する制御手段
    を具備することを特徴とする情報処理装置。
  4. 画像から部分画像を抽出する部分画像抽出手段と、
    前記部分画像抽出手段によって抽出された部分画像から前記画像を構成すべき部分画像を登録する部分画像登録手段と、
    前記部分画像登録手段によって登録された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分画像抽出手段によって抽出された部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
    を具備することを特徴とする画像処理装置。
  5. 情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
    前記部分情報抽出手段によって抽出された部分情報から前記情報源を構成すべき部分情報を登録する部分情報登録手段と、
    前記部分情報登録手段によって登録された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分情報登録手段によって登録されている部分情報であって、前記教師パターン生成手段によって対象となった部分情報以外の部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された情報を認識させるように制御する制御手段
    を具備することを特徴とする情報処理装置。
  6. 画像から部分画像を抽出する部分画像抽出手段と、
    前記部分画像抽出手段によって抽出された部分画像から前記画像を構成すべき部分画像を登録する部分画像登録手段と、
    前記部分画像登録手段によって登録された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分画像登録手段によって登録されている部分画像であって、前記教師パターン生成手段によって対象となった部分画像以外の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
    を具備することを特徴とする画像処理装置。
  7. 第1の情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記第1の情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び不正解教師パターン生成手段によって生成された不正解教師パターンに基づいて学習し、該学習をした後に第2の情報の認識を行う認識手段
    を具備することを特徴とする情報処理装置。
  8. 第1の部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記第1の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び不正解教師パターン生成手段によって生成された不正解教師パターンに基づいて学習し、該学習をした後に第2の部分画像の認識を行う認識手段
    を具備することを特徴とする画像処理装置。
  9. 画像データから部分画像を切り出して、該部分画像と該部分画像の位置を出力する部分画像切出手段と、
    前記部分画像切出手段によって出力された第1の部分画像にばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分画像切出手段によって出力された第1の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記部分画像切出手段によって出力された部分画像をインデックスを付して登録し、指定されたインデックスに対応する部分画像を出力する辞書手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習し、該学習をした後に、前記辞書手段からの部分画像と前記部分画像切出手段によって出力された第2の部分画像が類似しているか否かを判定する判定手段と、
    インデックス及び前記部分画像切出手段によって出力された位置を符号化する符号化手段と、
    前記辞書手段に対してインデックスを指定し、該インデックスに対応する前記辞書手段が出力する部分画像と前記第2の部分画像とが類似しているか否かを前記判定手段によって判定させ、類似していると判定された場合は、該インデックスと前記第2の部分画像に対応する位置を前記符号化手段によって符号化させる制御手段
    を具備することを特徴とする画像符号化装置。
  10. 画像データから部分画像を切り出して、該部分画像と該部分画像の位置を出力する部分画像切出手段と、
    前記部分画像切出手段によって出力された第1の部分画像にばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分画像切出手段によって出力された第1の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記部分画像切出手段によって出力された部分画像をインデックスを付して登録し、指定されたインデックスに対応する部分画像を出力する辞書手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習し、該学習をした後に、前記辞書手段からの部分画像と前記部分画像切出手段によって出力された第2の部分画像が類似しているか否かを判定する判定手段と、
    インデックス及び前記部分画像切出手段によって出力された位置を符号化する符号化手段と、
    前記辞書手段に対してインデックスを指定し、該インデックスに対応する前記辞書手段が出力する部分画像と前記第2の部分画像とが類似しているか否かを前記判定手段によって判定させ、前記辞書手段に登録されている全ての部分画像が該第2の部分画像と類似していないと判定された場合は、該第2の部分画像を前記辞書手段に登録し、該第2の部分画像のインデックスと該第2の部分画像に対応する位置を前記符号化手段によって符号化させる制御手段
    を具備することを特徴とする画像符号化装置。
  11. コンピュータを、
    画像データから部分画像を切り出して、該部分画像と該部分画像の位置を出力する部分画像切出手段と、
    前記部分画像切出手段によって出力された第1の部分画像にばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターンに基づいて学習し、該学習をした後に、前記第1の部分画像と前記部分画像切出手段によって出力された第2の部分画像が類似しているか否かを判定する判定手段、及び該第1の部分画像の対をインデックスを付して登録している辞書手段と、
    インデックス及び前記部分画像切出手段によって出力された位置を符号化する符号化手段と、
    前記辞書手段に対してインデックスを指定し、該インデックスに対応する部分画像と前記第2の部分画像とが類似しているか否かを前記辞書手段内の該インデックスに対応する判定手段によって判定させ、前記辞書手段に登録されている全ての部分画像が該第2の部分画像と類似していないと判定された場合は、該第2の部分画像を前記辞書手段に登録し、該第2の部分画像に対応する新たな判定手段を生成させ、該判定手段を学習させ、該第2の部分画像のインデックスと該第2の部分画像に対応する位置を前記符号化手段によって符号化させる制御手段
    として機能させることを特徴とする画像符号化プログラム。
  12. コンピュータを、
    情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
    前記部分情報抽出手段によって抽出された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分情報抽出手段によって抽出された部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された部分情報を認識させるように制御する制御手段
    として機能させることを特徴とする情報処理プログラム。
  13. コンピュータを、
    画像から部分画像を抽出する部分画像抽出手段と、
    前記部分画像抽出手段によって抽出された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分画像抽出手段によって抽出された部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
    として機能させることを特徴とする画像処理プログラム。
  14. コンピュータを、
    情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
    前記部分情報抽出手段によって抽出された部分情報から前記情報源を構成すべき部分情報を登録する部分情報登録手段と、
    前記部分情報登録手段によって登録された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分情報抽出手段によって抽出された部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された情報を認識させるように制御する制御手段
    として機能させることを特徴とする情報処理プログラム。
  15. コンピュータを、
    画像から部分画像を抽出する部分画像抽出手段と、
    前記部分画像抽出手段によって抽出された部分画像から前記画像を構成すべき部分画像を登録する部分画像登録手段と、
    前記部分画像登録手段によって登録された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分画像抽出手段によって抽出された部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
    として機能させることを特徴とする画像処理プログラム。
  16. コンピュータを、
    情報源からその一部分の情報である部分情報を抽出する部分情報抽出手段と、
    前記部分情報抽出手段によって抽出された部分情報から前記情報源を構成すべき部分情報を登録する部分情報登録手段と、
    前記部分情報登録手段によって登録された部分情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分情報登録手段によって登録されている部分情報であって、前記教師パターン生成手段によって対象となった部分情報以外の部分情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分情報抽出手段によって抽出された情報を認識させるように制御する制御手段
    として機能させることを特徴とする情報処理プログラム。
  17. コンピュータを、
    画像から部分画像を抽出する部分画像抽出手段と、
    前記部分画像抽出手段によって抽出された部分画像から前記画像を構成すべき部分画像を登録する部分画像登録手段と、
    前記部分画像登録手段によって登録された部分画像に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分画像登録手段によって登録されている部分画像であって、前記教師パターン生成手段によって対象となった部分画像以外の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習する学習手段と、
    前記学習手段に学習をさせた後に、前記学習手段に前記部分画像抽出手段によって抽出された部分画像を認識させるように制御する制御手段
    として機能させることを特徴とする画像処理プログラム。
  18. コンピュータを、
    第1の情報に対してばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記第1の情報から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記教師パターン生成手段によって生成された教師パターン及び不正解教師パターン生成手段によって生成された不正解教師パターンに基づいて学習し、該学習をした後に第2の情報の認識を行う認識手段
    として機能させることを特徴とする情報処理プログラム。
  19. コンピュータを、
    画像データから部分画像を切り出して、該部分画像と該部分画像の位置を出力する部分画像切出手段と、
    前記部分画像切出手段によって出力された第1の部分画像にばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分画像切出手段によって出力された第1の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記部分画像切出手段によって出力された部分画像をインデックスを付して登録し、指定されたインデックスに対応する部分画像を出力する辞書手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習し、該学習をした後に、前記辞書手段からの部分画像と前記部分画像切出手段によって出力された第2の部分画像が類似しているか否かを判定する判定手段と、
    インデックス及び前記部分画像切出手段によって出力された位置を符号化する符号化手段と、
    前記辞書手段に対してインデックスを指定し、該インデックスに対応する前記辞書手段が出力する部分画像と前記第2の部分画像とが類似しているか否かを前記判定手段によって判定させ、類似していると判定された場合は、該インデックスと前記第2の部分画像に対応する位置を前記符号化手段によって符号化させる制御手段
    として機能させることを特徴とする画像符号化プログラム。
  20. コンピュータを、
    画像データから部分画像を切り出して、該部分画像と該部分画像の位置を出力する部分画像切出手段と、
    前記部分画像切出手段によって出力された第1の部分画像にばらつきを与えて教師パターンを生成する教師パターン生成手段と、
    前記部分画像切出手段によって出力された第1の部分画像から不正解となる教師パターンを生成する不正解教師パターン生成手段と、
    前記部分画像切出手段によって出力された部分画像をインデックスを付して登録し、指定されたインデックスに対応する部分画像を出力する辞書手段と、
    前記教師パターン生成手段によって生成された教師パターン及び前記不正解教師パターン生成手段によって生成された不正解の教師パターンに基づいて学習し、該学習をした後に、前記辞書手段からの部分画像と前記部分画像切出手段によって出力された第2の部分画像が類似しているか否かを判定する判定手段と、
    インデックス及び前記部分画像切出手段によって出力された位置を符号化する符号化手段と、
    前記辞書手段に対してインデックスを指定し、該インデックスに対応する前記辞書手段が出力する部分画像と前記第2の部分画像とが類似しているか否かを前記判定手段によって判定させ、前記辞書手段に登録されている全ての部分画像が該第2の部分画像と類似していないと判定された場合は、該第2の部分画像を前記辞書手段に登録し、該第2の部分画像のインデックスと該第2の部分画像に対応する位置を前記符号化手段によって符号化させる制御手段
    として機能させることを特徴とする画像符号化プログラム。
JP2007057952A 2007-03-08 2007-03-08 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム Expired - Fee Related JP5082512B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007057952A JP5082512B2 (ja) 2007-03-08 2007-03-08 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007057952A JP5082512B2 (ja) 2007-03-08 2007-03-08 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム

Publications (2)

Publication Number Publication Date
JP2008219825A JP2008219825A (ja) 2008-09-18
JP5082512B2 true JP5082512B2 (ja) 2012-11-28

Family

ID=39839261

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007057952A Expired - Fee Related JP5082512B2 (ja) 2007-03-08 2007-03-08 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム

Country Status (1)

Country Link
JP (1) JP5082512B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021009986A1 (ja) 2019-07-12 2021-01-21 村田機械株式会社 画像認識方法及び画像認識装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6928876B2 (ja) * 2017-12-15 2021-09-01 京セラドキュメントソリューションズ株式会社 フォーム種別学習システムおよび画像処理装置
JP2020067669A (ja) * 2018-10-19 2020-04-30 株式会社ファブリカコミュニケーションズ 情報処理装置及びプログラム
JP7097329B2 (ja) * 2018-11-27 2022-07-07 豪洋 石崎 情報処理装置及び類似画像検索プログラム
CN109886210B (zh) * 2019-02-25 2022-07-19 百度在线网络技术(北京)有限公司 一种交通图像识别方法、装置、计算机设备和介质
JP6662484B2 (ja) * 2019-08-14 2020-03-11 大日本印刷株式会社 特定装置、特定方法及びコンピュータプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01230164A (ja) * 1988-03-10 1989-09-13 Nippon Telegr & Teleph Corp <Ntt> 自動学習型ニューラルネット・システム
JPH05258117A (ja) * 1992-03-11 1993-10-08 Toshiba Corp 文字認識装置
JP3231105B2 (ja) * 1992-11-30 2001-11-19 富士通株式会社 データ符号化方式及びデータ復元方式
JPH07121713A (ja) * 1993-10-21 1995-05-12 Kobe Steel Ltd パターン認識方法
JP3730073B2 (ja) * 2000-02-21 2005-12-21 日本電信電話株式会社 テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体
US7206450B2 (en) * 2002-04-25 2007-04-17 Microsoft Corporation Compression of bi-level images with explicit representation of ink clusters
JP2004354251A (ja) * 2003-05-29 2004-12-16 Nidek Co Ltd 欠陥検査装置
JP2005323169A (ja) * 2004-05-10 2005-11-17 Fuji Xerox Co Ltd 画像処理装置、データファイル、画像処理方法及びそのプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021009986A1 (ja) 2019-07-12 2021-01-21 村田機械株式会社 画像認識方法及び画像認識装置
KR20220031676A (ko) 2019-07-12 2022-03-11 무라다기카이가부시끼가이샤 화상 인식 방법 및 화상 인식 장치
US11893718B2 (en) 2019-07-12 2024-02-06 Murata Machinery, Ltd. Image recognition method and image recognition device

Also Published As

Publication number Publication date
JP2008219825A (ja) 2008-09-18

Similar Documents

Publication Publication Date Title
JP5082512B2 (ja) 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム
CN109684803A (zh) 基于手势滑动的人机验证方法
CN111310156B (zh) 一种滑块验证码的自动识别方法及***
CN112513927A (zh) 基于卷积神经网络的风力涡轮机叶片缺陷检查
CN112733884A (zh) 焊接缺陷识别模型训练方法、装置和计算机终端
WO2024060529A1 (zh) 一种道路病害识别方法、***、设备及存储介质
Tsai et al. Transfer learning for surgical task segmentation
CN116630286B (zh) 一种图像异常检测与定位的方法、装置、设备及存储介质
Hu et al. Hybrid Pixel‐Level Crack Segmentation for Ballastless Track Slab Using Digital Twin Model and Weakly Supervised Style Transfer
JP7424496B2 (ja) 精度推定プログラム、装置、及び方法
JP4847356B2 (ja) テンプレートマッチング装置及び方法
Bayer et al. Instance segmentation based graph extraction for handwritten circuit diagram images
KR20220143119A (ko) 인지 시스템용 훈련 데이터 후보의 자동 식별
JP4537097B2 (ja) パターン検出方法及び装置
CN117475262B (zh) 图像生成方法、装置、存储介质及电子设备
JP4631696B2 (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
CN115578753B (zh) 人体关键点检测方法、装置、电子设备及存储介质
JPWO2020152870A1 (ja) 信号処理方法,信号処理装置および信号処理プログラム
Mombach et al. Mirrored and rotated letters in children spellings: An automatic analysis approach
CN113139578B (zh) 一种基于最优训练集的深度学习图像分类方法及***
JP2023042445A (ja) 破断面特徴領域判定モデル生成装置、破断面特徴領域判定モデル生成方法、プログラム、破断面特徴領域判定装置、及び、破断面特徴領域判定方法
Howe et al. Isolated Character Forms from Dated Syriac Manuscripts
CN118284803A (zh) 考虑实际缺陷图像的种类和分布的基于人工智能的材料缺陷检测***及方法
Hagenus et al. A survey on robustness in trajectory prediction for autonomous vehicles
JP2007174037A (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120807

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120820

R150 Certificate of patent or registration of utility model

Ref document number: 5082512

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150914

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees