JPH1153475A - 画像認識装置、画像認識方法および記録媒体 - Google Patents

画像認識装置、画像認識方法および記録媒体

Info

Publication number
JPH1153475A
JPH1153475A JP9223054A JP22305497A JPH1153475A JP H1153475 A JPH1153475 A JP H1153475A JP 9223054 A JP9223054 A JP 9223054A JP 22305497 A JP22305497 A JP 22305497A JP H1153475 A JPH1153475 A JP H1153475A
Authority
JP
Japan
Prior art keywords
category
candidate
data
knowledge
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9223054A
Other languages
English (en)
Other versions
JP3475422B2 (ja
Inventor
Hisataka Yamagishi
久高 山岸
Seikou Rou
世紅 労
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP22305497A priority Critical patent/JP3475422B2/ja
Publication of JPH1153475A publication Critical patent/JPH1153475A/ja
Application granted granted Critical
Publication of JP3475422B2 publication Critical patent/JP3475422B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 正しいものか、間違ったものか決定できない
認識結果を数種類の結果に確定し、受付け正解率を向上
させ、誤認識率を無くした画像認識装置、画像認識方法
および記録媒体を提供する。 【解決手段】 第1、第2、第3前段知識作成手段11
1により第1、第2、第3前段知識112を、第1、第
2後段知識作成手段113により第1、第2後段知識1
14をそれぞれ作成しておき、第1、第2、第3前段判
定手段115では、認識結果について”正解”または”
不明”の2つに認識結果を分別して確定し、第1、第2
後段判定手段116では、OKクラスタに入ったデータ
を該カテゴリに属する”正解”データと決定付け、どの
OKクラスタにも入らない場合は”不明”データとした
後、さらに、NGクラスタの少なくとも1つに入った場
合は”不正解”データと決定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像認識装置、画
像認識方法および該画像認識方法を実行させるためのプ
ログラムを記録した記録媒体に係り、特に、複数のカテ
ゴリを持ち、入力データに対する各カテゴリの一致度
(若しくはそれに類する情報)を算出する画像認識にお
いて、一致度が高いとされた結果が正しいものか、間違
ったものか決定できない認識結果を、「認識結果が正解
と確信できるため受け付ける」,「認識結果が正解と確
信できないためリジェクトする」,「認識結果が未確定
のためリジェクトする」或いは「認識結果が不正解のた
めリジェクトする」等といった数種類の結果に確定し、
受付け正解率を向上させ、かつ誤認識率を0[%]に近
づけた画像認識装置、画像認識方法および記録媒体に関
する。
【0002】
【従来の技術】従来、複数のカテゴリを持ち、入力デー
タに対する各カテゴリの一致度(若しくはそれに類する
情報)を算出する手段を備えた画像認識システムにおい
ては、画像認識の認識結果は、該認識結果が正解である
か或いは誤認識であるかを人がチェックするまで確定で
きなかった。
【0003】つまり、従来の画像認識システムにおける
運用方法は、以下のような手順で行われていた。すなわ
ち、まず第1に、画像認識システムで認識対象データを
認識させ、次に第2に、コンピュータ等の画面に認識結
果を表示させ、認識対象と認識結果を人が突き合わせて
確認をし、そして第3には、誤認識している結果を修正
し、さらに第4には、認識対象について最後まで突き合
わせ確認が終了した後、認識結果を確定するというもの
であった。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の画像認識システムの運用方法にあっては、全文を人
手によって入力することに比べると省力化が図られてい
るものの、第2の人手による認識対象と認識結果の突き
合わせ確認処理に手間がかかるという問題点があった。
例えば、一度に数百、数千の帳票などを認識させる場
合、1枚1枚を認識させた後、人がチェックするのでは
自動化を図るとは言い難いため、画像認識システムの導
入が見送られることも多かった。
【0005】また、認識性能にも問題があり、従来の画
像認識システムによって認識した結果をノーチェックで
全て受け付けたとすると、正解率は80〜95[%]程
度であるのが現状である。すなわち、5〜20[%]は
誤認識しているにもかかわらず正解として受付けてしま
うのである。
【0006】本発明は、このような従来の問題点に着目
してなされたもので、その目的とするところは、複数の
カテゴリを持ち、入力データに対する各カテゴリの一致
度(若しくはそれに類する情報)を算出する画像認識に
おいて、一致度が高いとされた結果が正しいものか、間
違ったものか決定できない認識結果を、「認識結果が正
解と確信できるため受け付ける」,「認識結果が正解と
確信できないためリジェクトする」,「認識結果が未確
定のためリジェクトする」或いは「認識結果が不正解の
ためリジェクトする」等といった数種類の結果に確定
し、受付け正解率を向上させ、かつ誤認識率を0[%]
に近づけた画像認識装置、画像認識方法および記録媒体
を提供することにある。
【0007】
【課題を解決するための手段】上記課題を解決するため
に、本出願の請求項1に記載の発明は、複数カテゴリの
認識対象を持ち、登録画像パタンと入力画像パタンとの
パタンマッチングにおける適合度(距離)に基づき入力
画像の認識を行う画像認識装置において、画像認識の認
識結果およびその付随情報を含むデータから、認識結果
として同じ第1候補のカテゴリを持つデータを集め、該
集めたデータから特定の候補順位における類似カテゴリ
の出現率の高いものを抽出して、第1候補カテゴリに対
する類似カテゴリの関連を示す第1前段知識として保持
する第1前段知識作成手段と、入力画像の認識結果とし
て特定候補順位のカテゴリおよび類似カテゴリが得られ
るとき、該第1候補のカテゴリおよび特定候補順位の類
似カテゴリと前記第1前段知識における関連との比較に
より、該第1候補を”正解”または”不明”と判定する
第1前段判定手段とを具備することを特徴とする画像認
識装置にある。
【0008】また、本出願の請求項2に記載の発明は、
複数カテゴリの認識対象を持ち、登録画像パタンと入力
画像パタンとのパタンマッチングにおける適合度(距
離)に基づき入力画像の認識を行う画像認識装置におい
て、画像認識の認識結果およびその付随情報を含むデー
タから、認識結果として同じ第1候補のカテゴリを持つ
データを集め、該集めたデータから特定の候補順位にお
ける適合度(距離)から、該特定順位の候補を”正解”
と確定し得る適合度(距離)の大きさを算定し、第2前
段知識として保持する第2前段知識作成手段と、入力画
像の認識結果として特定候補順位のカテゴリおよび類似
カテゴリが得られるとき、該特定候補順位のカテゴリま
たは類似カテゴリにおける適合度(距離)の大きさと前
記第2前段知識における適合度(距離)の大きさとの比
較により、該特定順位の候補を”正解”または”不明”
と判定する第2前段判定手段とを具備することを特徴と
する画像認識装置にある。
【0009】また、本出願の請求項3に記載の発明は、
複数カテゴリの認識対象を持ち、登録画像パタンと入力
画像パタンとのパタンマッチングにおける適合度(距
離)に基づき入力画像の認識を行う画像認識装置におい
て、画像認識の認識結果およびその付随情報を含むデー
タから、認識結果として同じ第1候補のカテゴリを持つ
データを集め、該集めたデータから特定の候補順位のカ
テゴリまたは類似カテゴリ間における適合度(距離)差
から、該第1候補を”正解”と確定し得る適合度(距
離)差の大きさを算定し、第3前段知識として保持する
第3前段知識作成手段と、入力画像の認識結果として特
定候補順位のカテゴリおよび類似カテゴリが得られると
き、該特定の候補順位のカテゴリまたは類似カテゴリ間
における適合度(距離)差の大きさと前記第3前段知識
における適合度(距離)差の大きさとの比較により、該
第1候補を”正解”または”不明”と判定する第3前段
判定手段とを具備することを特徴とする画像認識装置に
ある。
【0010】また、本出願の請求項4に記載の発明は、
複数カテゴリの認識対象を持ち、登録画像パタンと入力
画像パタンとのパタンマッチングにおける適合度(距
離)に基づき入力画像の認識を行う画像認識装置におい
て、画像認識の認識結果およびその付随情報を含むデー
タをサンプル収集し、あるカテゴリで認識結果が”正
解”とされているデータから、前記データの集合をクラ
スタリングするときの軸を、上位候補に出現率の高いカ
テゴリを該軸として、下位候補に出現率の高いカテゴリ
を該軸として、上位候補に出現率の高いカテゴリおよび
下位候補に出現率の高いカテゴリをあわせて軸として、
中位候補に出現率の高いカテゴリを該軸として、相関係
数の高いカテゴリ同士を該軸として、或いは、相関係数
の低いカテゴリ同士を該軸として、抽出する第1軸抽出
手段と、前記第1軸抽出手段で抽出された軸に基づき前
記データの集合のクラスタリングを行い、該カテゴリの
OKクラスタとして生成し、生成されたOKクラスタの
形状を第1後段知識として保持する第1後段知識作成手
段と、入力画像の認識結果として認識結果およびその付
随情報を含むデータが得られるとき、該データが前記第
1後段知識のあるカテゴリに所属するOKクラスタの中
に含まれるか否かをチェックして、該OKクラスタに含
まれる場合には該OKクラスタが所属するカテゴリを前
記入力画像の認識結果として”正解”と判定し、何れの
OKクラスタにも含まれていない場合には”未確定”と
判定する第1後段判定手段とを具備することを特徴とす
る画像認識装置にある。
【0011】また、本出願の請求項5に記載の発明は、
前記第1後段判定手段は、前記データがあるカテゴリに
所属するOKクラスタに含まれる場合に、どの程度の確
信を持って”正解”といえるかを示す指標である確信度
を計算する確信度算出手段を具備し、前記データが複数
の別カテゴリに所属するOKクラスタに入った場合に
は、前記確信度に基づいてどのカテゴリを”正解”とす
るかを決定することを特徴とする請求項4に記載の画像
認識装置にある。
【0012】また、本出願の請求項6に記載の発明は、
複数カテゴリの認識対象を持ち、登録画像パタンと入力
画像パタンとのパタンマッチングにおける適合度(距
離)に基づき入力画像の認識を行う画像認識装置におい
て、画像認識の認識結果およびその付随情報を含むデー
タをサンプル収集し、あるカテゴリで認識結果が”誤
認”とされているデータから、前記データの集合をクラ
スタリングするときの軸を、上位候補に出現率の高いカ
テゴリを該軸として、下位候補に出現率の高いカテゴリ
を該軸として、上位候補に出現率の高いカテゴリおよび
下位候補に出現率の高いカテゴリをあわせて軸として、
中位候補に出現率の高いカテゴリを該軸として、相関係
数の高いカテゴリ同士を該軸として、或いは、相関係数
の低いカテゴリ同士を該軸として、抽出する第2軸抽出
手段と、前記第2軸抽出手段で抽出された軸に基づき前
記データの集合のクラスタリングを行い、該カテゴリの
NGクラスタとして生成し、生成されたNGクラスタの
形状を第2後段知識として保持する第2後段知識作成手
段と、入力画像の認識結果として認識結果およびその付
随情報を含むデータが得られるとき、該データが前記第
2後段知識のあるカテゴリに所属するNGクラスタの中
に含まれるか否かをチェックして、該NGクラスタに含
まれる場合には該NGクラスタが所属するカテゴリを前
記入力画像の認識結果として”不正解”と判定し、何れ
のNGクラスタにも含まれていない場合には”正解”と
判定する第2後段判定手段とを具備することを特徴とす
る画像認識装置にある。
【0013】また、本出願の請求項7に記載の発明は、
複数カテゴリの認識対象を持ち、登録画像パタンと入力
画像パタンとのパタンマッチングにおける適合度(距
離)に基づき入力画像の認識を行う画像認識方法におい
て、画像認識の認識結果およびその付随情報を含むデー
タから、認識結果として同じ第1候補のカテゴリを持つ
データを集め、該集めたデータから特定の候補順位にお
ける類似カテゴリの出現率の高いものを抽出して、第1
候補カテゴリに対する類似カテゴリの関連を示す第1前
段知識として保持する第1前段知識作成ステップと、入
力画像の認識結果として特定候補順位のカテゴリおよび
類似カテゴリが得られるとき、該第1候補のカテゴリお
よび特定候補順位の類似カテゴリと前記第1前段知識に
おける関連との比較により、該第1候補を”正解”また
は”不明”と判定する第1前段判定ステップとを具備す
ることを特徴とする画像認識方法にある。
【0014】また、本出願の請求項8に記載の発明は、
複数カテゴリの認識対象を持ち、登録画像パタンと入力
画像パタンとのパタンマッチングにおける適合度(距
離)に基づき入力画像の認識を行う画像認識方法におい
て、画像認識の認識結果およびその付随情報を含むデー
タから、認識結果として同じ第1候補のカテゴリを持つ
データを集め、該集めたデータから特定の候補順位にお
ける適合度(距離)から、該特定順位の候補を”正解”
と確定し得る適合度(距離)の大きさを算定し、第2前
段知識として保持する第2前段知識作成ステップと、入
力画像の認識結果として特定候補順位のカテゴリおよび
類似カテゴリが得られるとき、該特定候補順位のカテゴ
リまたは類似カテゴリにおける適合度(距離)の大きさ
と前記第2前段知識における適合度(距離)の大きさと
の比較により、該特定順位の候補を”正解”または”不
明”と判定する第2前段判定ステップとを具備すること
を特徴とする画像認識方法にある。
【0015】また、本出願の請求項9に記載の発明は、
複数カテゴリの認識対象を持ち、登録画像パタンと入力
画像パタンとのパタンマッチングにおける適合度(距
離)に基づき入力画像の認識を行う画像認識方法におい
て、画像認識の認識結果およびその付随情報を含むデー
タから、認識結果として同じ第1候補のカテゴリを持つ
データを集め、該集めたデータから特定の候補順位のカ
テゴリまたは類似カテゴリ間における適合度(距離)差
から、該第1候補を”正解”と確定し得る適合度(距
離)差の大きさを算定し、第3前段知識として保持する
第3前段知識作成ステップと、入力画像の認識結果とし
て特定候補順位のカテゴリおよび類似カテゴリが得られ
るとき、該特定の候補順位のカテゴリまたは類似カテゴ
リ間における適合度(距離)差の大きさと前記第3前段
知識における適合度(距離)差の大きさとの比較によ
り、該第1候補を”正解”または”不明”と判定する第
3前段判定ステップとを具備することを特徴とする画像
認識方法にある。
【0016】また、本出願の請求項10に記載の発明
は、複数カテゴリの認識対象を持ち、登録画像パタンと
入力画像パタンとのパタンマッチングにおける適合度
(距離)に基づき入力画像の認識を行う画像認識方法に
おいて、画像認識の認識結果およびその付随情報を含む
データから、認識結果として同じ第1候補のカテゴリを
持つデータを集め、該集めたデータから特定の候補順位
における類似カテゴリの出現率の高いものを抽出して、
第1候補カテゴリに対する類似カテゴリの関連を示す第
1前段知識として保持する第1前段知識作成ステップ
と、画像認識の認識結果およびその付随情報を含むデー
タから、認識結果として同じ第1候補のカテゴリを持つ
データを集め、該集めたデータから特定の候補順位にお
ける適合度(距離)から、該特定順位の候補を”正解”
と確定し得る適合度(距離)の大きさを算定し、第2前
段知識として保持する第2前段知識作成ステップと、画
像認識の認識結果およびその付随情報を含むデータか
ら、認識結果として同じ第1候補のカテゴリを持つデー
タを集め、該集めたデータから特定の候補順位のカテゴ
リまたは類似カテゴリ間における適合度(距離)差か
ら、該第1候補を”正解”と確定し得る適合度(距離)
差の大きさを算定し、第3前段知識として保持する第3
前段知識作成ステップと、入力画像の認識結果として特
定候補順位のカテゴリおよび類似カテゴリが得られると
き、該第1候補のカテゴリおよび特定候補順位の類似カ
テゴリと前記第1前段知識における関連との比較によ
り、該第1候補を”正解”または”不明”と判定する第
1前段判定ステップと、前記第1前段判定ステップで”
正解”と判定された入力画像について、該特定候補順位
のカテゴリまたは類似カテゴリにおける適合度(距離)
の大きさと前記第2前段知識における適合度(距離)の
大きさとの比較により、該第1候補を”正解”または”
不明”と判定する第2前段判定ステップと、前記第2前
段判定ステップで”正解”と判定された入力画像につい
て、該特定の候補順位のカテゴリまたは類似カテゴリ間
における適合度(距離)差の大きさと前記第3前段知識
における適合度(距離)差の大きさとの比較により、該
第1候補を”正解”または”不明”と判定する第3前段
判定ステップとを具備することを特徴とする画像認識方
法にある。
【0017】また、本出願の請求項11に記載の発明
は、複数カテゴリの認識対象を持ち、登録画像パタンと
入力画像パタンとのパタンマッチングにおける適合度
(距離)に基づき入力画像の認識を行う画像認識方法に
おいて、画像認識の認識結果およびその付随情報を含む
データをサンプル収集し、あるカテゴリで認識結果が”
正解”とされているデータから、前記データの集合をク
ラスタリングするときの軸を、上位候補に出現率の高い
カテゴリを該軸として、下位候補に出現率の高いカテゴ
リを該軸として、上位候補に出現率の高いカテゴリおよ
び下位候補に出現率の高いカテゴリをあわせて軸とし
て、中位候補に出現率の高いカテゴリを該軸として、相
関係数の高いカテゴリ同士を該軸として、或いは、相関
係数の低いカテゴリ同士を該軸として、抽出する第1軸
抽出ステップと、前記第1軸抽出ステップで抽出された
軸に基づき前記データの集合のクラスタリングを行い、
該カテゴリのOKクラスタとして生成し、生成されたO
Kクラスタの形状を第1後段知識として保持する第1後
段知識作成ステップと、入力画像の認識結果として認識
結果およびその付随情報を含むデータが得られるとき、
該データが前記第1後段知識のあるカテゴリに所属する
OKクラスタの中に含まれるか否かをチェックして、該
OKクラスタに含まれる場合には該OKクラスタが所属
するカテゴリを前記入力画像の認識結果として”正解”
と判定し、何れのOKクラスタにも含まれていない場合
には”未確定”と判定する第1後段判定ステップとを具
備することを特徴とする画像認識方法にある。
【0018】また、本出願の請求項12に記載の発明
は、複数カテゴリの認識対象を持ち、登録画像パタンと
入力画像パタンとのパタンマッチングにおける適合度
(距離)に基づき入力画像の認識を行う画像認識方法に
おいて、画像認識の認識結果およびその付随情報を含む
データをサンプル収集し、あるカテゴリで認識結果が”
誤認”とされているデータから、前記データの集合をク
ラスタリングするときの軸を、上位候補に出現率の高い
カテゴリを該軸として、下位候補に出現率の高いカテゴ
リを該軸として、上位候補に出現率の高いカテゴリおよ
び下位候補に出現率の高いカテゴリをあわせて軸とし
て、中位候補に出現率の高いカテゴリを該軸として、相
関係数の高いカテゴリ同士を該軸として、或いは、相関
係数の低いカテゴリ同士を該軸として、抽出する第2軸
抽出ステップと、前記第2軸抽出ステップで抽出された
軸に基づき前記データの集合のクラスタリングを行い、
該カテゴリのNGクラスタとして生成し、生成されたN
Gクラスタの形状を第2後段知識として保持する第2後
段知識作成ステップと、入力画像の認識結果として認識
結果およびその付随情報を含むデータが得られるとき、
該データが前記第2後段知識のあるカテゴリに所属する
NGクラスタの中に含まれるか否かをチェックして、該
NGクラスタに含まれる場合には該NGクラスタが所属
するカテゴリを前記入力画像の認識結果として”不正
解”と判定し、何れのNGクラスタにも含まれていない
場合には”正解”と判定する第2後段判定ステップとを
具備することを特徴とする画像認識方法にある。
【0019】また、本出願の請求項13に記載の発明
は、前記第1後段判定ステップは、前記データがあるカ
テゴリに所属するOKクラスタに含まれる場合に、どの
程度の確信を持って”正解”といえるかを示す指標であ
る確信度を計算する確信度算出ステップを具備し、前記
データが複数の別カテゴリに所属するOKクラスタに入
った場合には、前記確信度に基づいてどのカテゴリを”
正解”とするかを決定することを特徴とする請求項11
に記載の画像認識方法にある。
【0020】また、本出願の請求項14に記載の発明
は、複数カテゴリの認識対象を持ち、登録画像パタンと
入力画像パタンとのパタンマッチングにおける適合度
(距離)に基づき入力画像の認識を行う画像認識方法
を、コンピュータに実行させるためのプログラムとして
記録した記録媒体において、画像認識の認識結果および
その付随情報を含むデータから、認識結果として同じ第
1候補のカテゴリを持つデータを集め、該集めたデータ
から特定の候補順位における類似カテゴリの出現率の高
いものを抽出して、第1候補カテゴリに対する類似カテ
ゴリの関連を示す第1前段知識として保持する第1前段
知識作成ステップと、入力画像の認識結果として特定候
補順位のカテゴリおよび類似カテゴリが得られるとき、
該第1候補のカテゴリおよび特定候補順位の類似カテゴ
リと前記第1前段知識における関連との比較により、該
第1候補を”正解”または”不明”と判定する第1前段
判定ステップとを具備することを特徴とする記録媒体に
ある。
【0021】また、本出願の請求項15に記載の発明
は、複数カテゴリの認識対象を持ち、登録画像パタンと
入力画像パタンとのパタンマッチングにおける適合度
(距離)に基づき入力画像の認識を行う画像認識方法
を、コンピュータに実行させるためのプログラムとして
記録した記録媒体において、画像認識の認識結果および
その付随情報を含むデータから、認識結果として同じ第
1候補のカテゴリを持つデータを集め、該集めたデータ
から特定の候補順位における適合度(距離)から、該特
定順位の候補を”正解”と確定し得る適合度(距離)の
大きさを算定し、第2前段知識として保持する第2前段
知識作成ステップと、入力画像の認識結果として特定候
補順位のカテゴリおよび類似カテゴリが得られるとき、
該特定候補順位のカテゴリまたは類似カテゴリにおける
適合度(距離)の大きさと前記第2前段知識における適
合度(距離)の大きさとの比較により、該特定順位の候
補を”正解”または”不明”と判定する第2前段判定ス
テップとを具備することを特徴とする記録媒体にある。
【0022】また、本出願の請求項16に記載の発明
は、複数カテゴリの認識対象を持ち、登録画像パタンと
入力画像パタンとのパタンマッチングにおける適合度
(距離)に基づき入力画像の認識を行う画像認識方法
を、コンピュータに実行させるためのプログラムとして
記録した記録媒体において、画像認識の認識結果および
その付随情報を含むデータから、認識結果として同じ第
1候補のカテゴリを持つデータを集め、該集めたデータ
から特定の候補順位のカテゴリまたは類似カテゴリ間に
おける適合度(距離)差から、該第1候補を”正解”と
確定し得る適合度(距離)差の大きさを算定し、第3前
段知識として保持する第3前段知識作成ステップと、入
力画像の認識結果として特定候補順位のカテゴリおよび
類似カテゴリが得られるとき、該特定の候補順位のカテ
ゴリまたは類似カテゴリ間における適合度(距離)差の
大きさと前記第3前段知識における適合度(距離)差の
大きさとの比較により、該第1候補を”正解”または”
不明”と判定する第3前段判定ステップとを具備するこ
とを特徴とする記録媒体にある。
【0023】また、本出願の請求項17に記載の発明
は、複数カテゴリの認識対象を持ち、登録画像パタンと
入力画像パタンとのパタンマッチングにおける適合度
(距離)に基づき入力画像の認識を行う画像認識方法
を、コンピュータに実行させるためのプログラムとして
記録した記録媒体において、画像認識の認識結果および
その付随情報を含むデータから、認識結果として同じ第
1候補のカテゴリを持つデータを集め、該集めたデータ
から特定の候補順位における類似カテゴリの出現率の高
いものを抽出して、第1候補カテゴリに対する類似カテ
ゴリの関連を示す第1前段知識として保持する第1前段
知識作成ステップと、画像認識の認識結果およびその付
随情報を含むデータから、認識結果として同じ第1候補
のカテゴリを持つデータを集め、該集めたデータから特
定の候補順位における適合度(距離)から、該特定順位
の候補を”正解”と確定し得る適合度(距離)の大きさ
を算定し、第2前段知識として保持する第2前段知識作
成ステップと、画像認識の認識結果およびその付随情報
を含むデータから、認識結果として同じ第1候補のカテ
ゴリを持つデータを集め、該集めたデータから特定の候
補順位のカテゴリまたは類似カテゴリ間における適合度
(距離)差から、該第1候補を”正解”と確定し得る適
合度(距離)差の大きさを算定し、第3前段知識として
保持する第3前段知識作成ステップと、入力画像の認識
結果として特定候補順位のカテゴリおよび類似カテゴリ
が得られるとき、該第1候補のカテゴリおよび特定候補
順位の類似カテゴリと前記第1前段知識における関連と
の比較により、該第1候補を”正解”または”不明”と
判定する第1前段判定ステップと、前記第1前段判定ス
テップで”正解”と判定された入力画像について、該特
定候補順位のカテゴリまたは類似カテゴリにおける適合
度(距離)の大きさと前記第2前段知識における適合度
(距離)の大きさとの比較により、該第1候補を”正
解”または”不明”と判定する第2前段判定ステップ
と、前記第2前段判定ステップで”正解”と判定された
入力画像について、該特定の候補順位のカテゴリまたは
類似カテゴリ間における適合度(距離)差の大きさと前
記第3前段知識における適合度(距離)差の大きさとの
比較により、該第1候補を”正解”または”不明”と判
定する第3前段判定ステップとを具備することを特徴と
する記録媒体にある。
【0024】また、本出願の請求項18に記載の発明
は、複数カテゴリの認識対象を持ち、登録画像パタンと
入力画像パタンとのパタンマッチングにおける適合度
(距離)に基づき入力画像の認識を行う画像認識方法
を、コンピュータに実行させるためのプログラムとして
記録した記録媒体において、画像認識の認識結果および
その付随情報を含むデータをサンプル収集し、あるカテ
ゴリで認識結果が”正解”とされているデータから、前
記データの集合をクラスタリングするときの軸を、上位
候補に出現率の高いカテゴリを該軸として、下位候補に
出現率の高いカテゴリを該軸として、上位候補に出現率
の高いカテゴリおよび下位候補に出現率の高いカテゴリ
をあわせて軸として、中位候補に出現率の高いカテゴリ
を該軸として、相関係数の高いカテゴリ同士を該軸とし
て、或いは、相関係数の低いカテゴリ同士を該軸とし
て、抽出する第1軸抽出ステップと、前記第1軸抽出ス
テップで抽出された軸に基づき前記データの集合のクラ
スタリングを行い、該カテゴリのOKクラスタとして生
成し、生成されたOKクラスタの形状を第1後段知識と
して保持する第1後段知識作成ステップと、入力画像の
認識結果として認識結果およびその付随情報を含むデー
タが得られるとき、該データが前記第1後段知識のある
カテゴリに所属するOKクラスタの中に含まれるか否か
をチェックして、該OKクラスタに含まれる場合には該
OKクラスタが所属するカテゴリを前記入力画像の認識
結果として”正解”と判定し、何れのOKクラスタにも
含まれていない場合には”未確定”と判定する第1後段
判定ステップとを具備することを特徴とする記録媒体に
ある。
【0025】また、本出願の請求項19に記載の発明
は、複数カテゴリの認識対象を持ち、登録画像パタンと
入力画像パタンとのパタンマッチングにおける適合度
(距離)に基づき入力画像の認識を行う画像認識方法
を、コンピュータに実行させるためのプログラムとして
記録した記録媒体において、画像認識の認識結果および
その付随情報を含むデータをサンプル収集し、あるカテ
ゴリで認識結果が”誤認”とされているデータから、前
記データの集合をクラスタリングするときの軸を、上位
候補に出現率の高いカテゴリを該軸として、下位候補に
出現率の高いカテゴリを該軸として、上位候補に出現率
の高いカテゴリおよび下位候補に出現率の高いカテゴリ
をあわせて軸として、中位候補に出現率の高いカテゴリ
を該軸として、相関係数の高いカテゴリ同士を該軸とし
て、或いは、相関係数の低いカテゴリ同士を該軸とし
て、抽出する第2軸抽出ステップと、前記第2軸抽出ス
テップで抽出された軸に基づき前記データの集合のクラ
スタリングを行い、該カテゴリのNGクラスタとして生
成し、生成されたNGクラスタの形状を第2後段知識と
して保持する第2後段知識作成ステップと、入力画像の
認識結果として認識結果およびその付随情報を含むデー
タが得られるとき、該データが前記第2後段知識のある
カテゴリに所属するNGクラスタの中に含まれるか否か
をチェックして、該NGクラスタに含まれる場合には該
NGクラスタが所属するカテゴリを前記入力画像の認識
結果として”不正解”と判定し、何れのNGクラスタに
も含まれていない場合には”正解”と判定する第2後段
判定ステップとを具備することを特徴とする記録媒体に
ある。
【0026】また、本出願の請求項20に記載の発明
は、前記第1後段判定ステップは、前記データがあるカ
テゴリに所属するOKクラスタに含まれる場合に、どの
程度の確信を持って”正解”といえるかを示す指標であ
る確信度を計算する確信度算出ステップを具備し、前記
データが複数の別カテゴリに所属するOKクラスタに入
った場合には、前記確信度に基づいてどのカテゴリを”
正解”とするかを決定することを特徴とする請求項18
に記載の記録媒体にある。
【0027】そして、この請求項1、7または14に記
載の発明によれば、第1前段知識作成手段(第1前段知
識作成ステップ)により、画像認識の認識結果およびそ
の付随情報を含むデータから、認識結果として同じ第1
候補のカテゴリを持つデータを集め、該集めたデータか
ら特定の候補順位における類似カテゴリの出現率の高い
ものを抽出して、第1候補カテゴリに対する類似カテゴ
リの関連を示す第1前段知識として保持し、第1前段判
定手段(第1前段判定ステップ)では、入力画像の認識
結果として特定候補順位のカテゴリおよび類似カテゴリ
が得られるとき、該第1候補のカテゴリおよび特定候補
順位の類似カテゴリと前記第1前段知識における関連と
の比較により、該第1候補を”正解”または”不明”と
判定するようにしている。
【0028】ここで、「データ」とは、画像認識システ
ムにおける認識結果とそれに付随する情報を指す。また
「カテゴリ」とは、同じ文字の集まりを指す。また、本
発明が適用される画像認識システムは、例えば、類似し
たカテゴリのうち、登録画像パタンと入力画像パタンと
のパタンマッチング(適合演算)における適合度(距
離)が最も高いものを認識システムの認識結果(第1候
補)として出力し、該認識結果について”正解”、”正
解と確信できない”、”不正解”または”不明”を確定
するものである。尚、適合度の演算方法によっては、認
識結果として適合度(距離)が最も低いものを出力する
場合もある。また、本発明では、画像認識システムの認
識結果とそれに付随する情報を含むデータを得て、該デ
ータを基に認識結果の確定処理を行うが、「付随情報」
とは、類似カテゴリの候補とその候補で演算されたカテ
ゴリ辞書(登録画像パタン)への距離である。
【0029】つまり、本発明の構成は、画像認識システ
ムにおいて、画像認識手段の後段に配置されるものであ
る。
【0030】本発明によれば、正解として確定できたも
のについては人がチェックする必要がなくなり、正解と
確定できなかったものについてのみチェックするだけで
よくなることから、受付け誤認識率を低下させることが
でき、画像認識システムにおける省力化をさらに図るこ
とができる。
【0031】また、請求項2、8または15に記載の発
明によれば、第2前段知識作成手段(第2前段知識作成
ステップ)により、画像認識の認識結果およびその付随
情報を含むデータから、認識結果として同じ第1候補の
カテゴリを持つデータを集め、該集めたデータから特定
の候補順位における適合度(距離)から、該特定順位の
候補を”正解”と確定し得る適合度(距離)の大きさを
算定し、第2前段知識として保持し、第2前段判定手段
(第2前段判定ステップ)では、入力画像の認識結果と
して特定候補順位のカテゴリおよび類似カテゴリが得ら
れるとき、該特定候補順位のカテゴリまたは類似カテゴ
リにおける適合度(距離)の大きさと前記第2前段知識
における適合度(距離)の大きさとの比較により、該特
定順位の候補を”正解”または”不明”と判定するよう
にしている。これにより、正解として確定できたものに
ついては人がチェックする必要がなくなり、正解と確定
できなかったものについてのみチェックするだけでよく
なることから、受付け誤認識率を低下させることがで
き、画像認識システムにおける省力化をさらに図ること
ができる。
【0032】また、請求項3、9または16に記載の発
明によれば、第3前段知識作成手段(第3前段知識作成
ステップ)により、画像認識の認識結果およびその付随
情報を含むデータから、認識結果として同じ第1候補の
カテゴリを持つデータを集め、該集めたデータから特定
の候補順位のカテゴリまたは類似カテゴリ間における適
合度(距離)差から、該第1候補を”正解”と確定し得
る適合度(距離)差の大きさを算定して、第3前段知識
として保持し、第3前段判定手段(第3前段判定ステッ
プ)では、入力画像の認識結果として特定候補順位のカ
テゴリおよび類似カテゴリが得られるとき、該特定の候
補順位のカテゴリまたは類似カテゴリ間における適度
(距離)差の大きさと前記第3前段知識における適合度
(距離)差の大きさとの比較により、該第1候補を”正
解”または”不明”と判定するようにしている。これに
より、正解として確定できたものについては人がチェッ
クする必要がなくなり、正解と確定できなかったものに
ついてのみチェックするだけでよくなることから、受付
け誤認識率を低下させることができ、画像認識システム
における省力化をさらに図ることができる。
【0033】また、請求項10または17に記載の発明
によれば、予め、第1前段知識作成手段(第1前段知識
作成ステップ)により第1前段知識(第1候補カテゴリ
に対する類似カテゴリの関連)を、第2前段知識作成手
段(第2前段知識作成ステップ)により第2前段知識
(特定順位の候補を”正解”と確定し得る適合度(距
離)の大きさ)を、第3前段知識作成手段(第3前段知
識作成ステップ)により第3前段知識(第1候補を”正
解”と確定し得る適合度(距離)差の大きさ)を、それ
ぞれ作成しておき、第1前段判定手段(第1前段判定ス
テップ)、第2前段判定手段(第2前段判定ステップ)
および第3前段判定手段(第3前段判定ステップ)で
は、これら第1、第2および第3前段知識を用いて、入
力画像の認識結果について、”正解”または”不明”
(どのカテゴリにも属さないデータ)の2つに認識結果
を分別して確定するようにしている。これにより、受付
け誤認識率を低下させることができ、画像認識システム
における省力化をさらに図ることができる。また、帳票
読み込みの自動化を図ることができる。すなわち、例え
ば、1枚の帳票を認識対象エリアとするとき、確定結果
がすべて正解の場合はチェックを行うことなく結果を保
存することが可能となり、逆に、正解と確信できるもの
以外の結果が1つでも含まれる場合は、その帳票全体の
認識結果を保存せずに、後に人の入力をまとめて求める
といった運用が可能になる。
【0034】また、請求項4、11または18に記載の
発明によれば、第1軸抽出手段(第1軸抽出ステップ)
により、画像認識の認識結果およびその付随情報を含む
データをサンプル収集し、あるカテゴリで認識結果が”
正解”とされているデータから、前記データの集合をク
ラスタリングするときの軸を抽出し、第1後段知識作成
手段(第1後段知識作成ステップ)により、第1軸抽出
手段(第1軸抽出ステップ)で抽出された軸に基づき前
記データの集合のクラスタリングを行い、該カテゴリの
OKクラスタとして生成し、生成されたOKクラスタの
形状を第1後段知識として保持し、第1後段判定手段
(第1後段判定ステップ)では、入力画像の認識結果と
して認識結果およびその付随情報を含むデータが得られ
るとき、該データが第1後段知識のあるカテゴリに所属
するOKクラスタの中に含まれるか否かをチェックし
て、該OKクラスタに含まれる場合には該OKクラスタ
が所属するカテゴリを入力画像の認識結果として”正
解”と判定し、何れのOKクラスタにも含まれていない
場合には”未確定”と判定する。尚、第1軸抽出手段
(第1軸抽出ステップ)による軸抽出には、例えば、上
位候補に出現率の高いカテゴリを該軸として、下位候補
に出現率の高いカテゴリを該軸として、上位候補に出現
率の高いカテゴリおよび下位候補に出現率の高いカテゴ
リをあわせて軸として、中位候補に出現率の高いカテゴ
リを該軸として、相関係数の高いカテゴリ同士を該軸と
して、或いは、相関係数の低いカテゴリ同士を該軸とし
て抽出する方法等が考えられる。これにより、正解とし
て確定できたものについては人がチェックする必要がな
くなり、正解と確定できなかったものについてのみチェ
ックするだけでよくなることから、受付け誤認識率を低
下させることができ、画像認識システムにおける省力化
をさらに図ることができる。
【0035】また、請求項6、12または19に記載の
発明によれば、第2軸抽出手段(第2軸抽出ステップ)
により、画像認識の認識結果およびその付随情報を含む
データをサンプル収集し、あるカテゴリで認識結果が”
誤認”とされているデータから、前記データの集合をク
ラスタリングするときの軸を抽出し、第2後段知識作成
手段(第2後段知識作成ステップ)により、第2軸抽出
手段(第2軸抽出ステップ)で抽出された軸に基づき前
記データの集合のクラスタリングを行い、該カテゴリの
NGクラスタとして生成し、生成されたNGクラスタの
形状を第2後段知識として保持し、第2後段判定手段
(第2後段判定ステップ)では、入力画像の認識結果と
して認識結果およびその付随情報を含むデータが得られ
るとき、該データが第2後段知識のあるカテゴリに所属
するNGクラスタの中に含まれるか否かをチェックし
て、該NGクラスタに含まれる場合には該NGクラスタ
が所属するカテゴリを前記入力画像の認識結果として”
不正解”と判定し、何れのNGクラスタにも含まれてい
ない場合には”正解”と判定するようにしている。尚、
第2軸抽出手段(第2軸抽出ステップ)における軸抽出
には、上位候補に出現率の高いカテゴリを該軸として、
下位候補に出現率の高いカテゴリを該軸として、上位候
補に出現率の高いカテゴリおよび下位候補に出現率の高
いカテゴリをあわせて軸として、中位候補に出現率の高
いカテゴリを該軸として、相関係数の高いカテゴリ同士
を該軸として、或いは、相関係数の低いカテゴリ同士を
該軸として抽出する方法等が考えられる。
【0036】これにより、正解として確定できたものに
ついては人がチェックする必要がなくなり、正解と確定
できなかったものについてのみチェックするだけでよく
なることから、受付け誤認識率を低下させることがで
き、画像認識システムにおける省力化をさらに図ること
ができる。
【0037】また、請求項5、13または20に記載の
発明によれば、第1後段判定手段(第1後段判定ステッ
プ)において、前記データがあるカテゴリに所属するO
Kクラスタに含まれる場合に、どの程度の確信を持っ
て”正解”といえるかを示す指標である確信度を確信度
算出手段(確信度算出ステップ)により計算するように
し、前記データが複数の別カテゴリに所属するOKクラ
スタに入った場合には、確信度に基づいてどのカテゴリ
を”正解”とするかを決定し、例えば、確信度の大きさ
が所定値以下の場合には”正解と確信できない”と判定
するようにしている。これにより、あるカテゴリのOK
クラスタに入ったデータをそのカテゴリに属するデータ
と決定付け、逆にどのOKクラスタにも入らない場合
は”不明”(どのカテゴリにも属さない)データとされ
るが、あるカテゴリに属するデータと決定付けられた場
合に、認識結果の確信度合いを算出することにより、”
不明”、”正解”、”正解と確信できない”の3つに認
識結果を分別して確定されることとなる。また、さら
に、NGクラスタの少なくとも1つに入った場合は”不
正解”データと決定され、”不明”、”正解”、”不正
解”、”正解と確信できない”の4つに認識結果を分別
して確定されることとなる。
【0038】
【発明の実施の形態】以下、本発明の画像認識装置、画
像認識方法および記録媒体の実施の形態について、図面
を参照して詳細に説明する。
【0039】図1は本発明の一実施形態に係る画像認識
装置の構成図である。
【0040】図1において、本実施形態の画像認識装置
は、おおまかにOCR認識処理部101および認識結果
確定部102を備えて構成されており、認識結果確定部
102は、知識生成部103、前段判定部(第1前段判
定手段、第2前段判定手段および第3前段判定手段)1
15、後段判定部(第1後段判定手段および第2後段判
定手段)116、ルール判定部117、認識確定部11
8およびリジェクト部119を備えて構成されている。
また、知識生成部103は、前段知識の作成部(第1前
段知識作成手段、第2前段知識作成手段および第3前段
知識作成手段)111、前段知識ベース(第1前段知
識、第2前段知識および第3前段知識)112、後段知
識の作成部(第1後段知識作成手段および第2後段知識
作成手段)113および後段知識ベース(第1後段知識
および第2後段知識)114を備えた構成である。
【0041】また、図2は、本実施形態の画像認識装置
の全体的な処理の概略を説明する説明図である。同図に
示すように、本実施形態の画像認識装置は、複数カテゴ
リの認識対象を持ち、登録画像パタンと入力画像パタン
とのパタンマッチングにおける適合度(距離)に基づき
入力画像の認識を行うものであるが、認識結果確定部1
02に特徴を持つものであり、OCR認識処理部101
からの認識結果と付随情報151bについて、前段知識
ベース112および後段知識ベース114に基づく前段
判定部115および後段判定部116の判定を行うこと
によって、認識確定部118により、該認識結果が”未
確定(不正解)”、”正解”或いは”正解と確信が持て
ない”の何れであるかを確定するものである。
【0042】本実施形態の画像認識装置を構成する各構
成要素および各構成要素間の引き渡しデータについて簡
単に説明する。尚、本実施形態の画像認識装置では、説
明を簡単にするため、認識対象の文字画像として、数字
(0〜9)並びに3種の記号(”(”,”)”,”
−”)、合計13種の文字を扱うものとする。
【0043】まず、OCR認識処理部101では、類似
した文字のうち、各文字辞書に対して適合度演算を行
う。ここで、適合度演算は、登録画像パタンと入力画像
パタンとのパタンマッチングにおいて行われるもので、
適合度(以下、距離という)の高いもの順に類似文字を
並べ、距離が最も高いものをOCRの認識結果として出
力する。
【0044】また、認識結果151a,151bは、画
像認識の認識結果およびその付随情報を含むデータであ
り、該データは、1文字あたり13個の候補と各々の候
補辞書に対する距離により構成されている(図6参
照)。特に、知識生成用認識結果151aは、知識生成
のために利用するサンプル画像について実際の運用前に
OCR認識処理部101によって取得し、知識生成部1
03に渡される。また特に、認識結果151bは、実際
のシステム運用時に、OCR認識処理部101から1文
字単位で前段判定部115に供給される。
【0045】前段知識の作成部111は、上記のよう
に、第1前段知識作成手段、第2前段知識作成手段およ
び第3前段知識作成手段を備えて構成され、第1前段知
識作成手段では、画像認識の認識結果およびその付随情
報を含むデータから、認識結果として同じ第1候補のカ
テゴリを持つデータを集め、該集めたデータから特定の
候補順位における類似カテゴリの出現率の高いものを抽
出して、これを第1候補カテゴリに対する類似カテゴリ
の関連を示す第1前段知識として前段知識ベース112
に登録する。
【0046】また、第2前段知識作成手段では、画像認
識の認識結果およびその付随情報を含むデータから、認
識結果として同じ第1候補のカテゴリを持つデータを集
め、該集めたデータから特定の候補順位における適合度
(距離)から、該特定順位の候補を”正解”と確定し得
る適合度(距離)の大きさを算定し、第2前段知識とし
て前段知識ベース112に登録する。
【0047】さらに、第3前段知識作成手段では、画像
認識の認識結果およびその付随情報を含むデータから、
認識結果として同じ第1候補のカテゴリを持つデータを
集め、該集めたデータから特定の候補順位のカテゴリま
たは類似カテゴリ間における適合度(距離)差から、該
第1候補を”正解”と確定し得る適合度(距離)差の大
きさを算定して、第3前段知識として前段知識ベース1
12に登録する。
【0048】本実施形態では、認識対象の文字はカテゴ
リが13個あり、OCR認識処理部101から出力され
るデータは、その13個の全てが必ず候補文字の中に含
まれている。そのうち第2、第3候補文字データで出現
率の高い文字(第1前段知識)を取得すると共に、第1
候補の距離データで正解と判別できる最低値(第2前段
知識)、並びに、第1候補距離と第2候補距離の差のデ
ータから正解と判別できる最低値(第3前段知識)を算
出する。ここで作成された知識は、前段判定部115で
使用されることとなる。尚、13種の数字および記号以
外の文字の場合については、数千種のカテゴリがある
が、この場合、OCR認識処理部101から出力される
データは、距離の大きいカテゴリの上位数十種類とし
て、これらから同様にして、第X(Xは任意に選択可
能)候補に出現の多いものを選択していくことになろ
う。
【0049】次に、後段知識の作成部113は、上記の
ように、第1後段知識作成手段および第2後段知識作成
手段を備えて構成され、第1後段知識作成手段に含まれ
る第1軸抽出手段により、画像認識の認識結果およびそ
の付随情報を含むデータをサンプル収集し、あるカテゴ
リで認識結果が”正解”とされているデータから、デー
タの集合をクラスタリングするときの軸を抽出し、第1
後段知識作成手段により、抽出した軸に基づきデータの
集合のクラスタリングを行い、該カテゴリのOKクラス
タとして生成し、生成されたOKクラスタの形状を第1
後段知識として後段知識ベース114に登録する。
【0050】また、第2後段知識作成手段に含まれる第
2軸抽出手段により、画像認識の認識結果およびその付
随情報を含むデータをサンプル収集し、あるカテゴリで
認識結果が”誤認”とされているデータから、データの
集合をクラスタリングするときの軸を抽出し、第2後段
知識作成手段により、抽出した軸に基づきデータの集合
のクラスタリングを行い、該カテゴリのNGクラスタと
して生成し、生成されたNGクラスタの形状を第2後段
知識として後段知識ベース114に登録する。
【0051】尚、第1および第2軸抽出手段における軸
抽出には、上位候補に出現率の高いカテゴリを該軸とし
て(誤認識し易いカテゴリを選択)、下位候補に出現率
の高いカテゴリを該軸として(誤認識し難いカテゴリを
選択)、上位候補に出現率の高いカテゴリおよび下位候
補に出現率の高いカテゴリをあわせて軸として(誤認識
し易いカテゴリとし難いカテゴリを選択)、中位候補に
出現率の高いカテゴリを該軸として(誤認識し易くもし
難くも無いカテゴリを選択)、相関係数の高いカテゴリ
同士を該軸として、或いは、相関係数の低いカテゴリ同
士を該軸として抽出する方法等が考えられる。
【0052】つまり、クラスタを生成するために軸を選
択し、その軸データを利用してクラスタを生成する。数
字であれば、カテゴリが13個あり、候補にはその13
個のカテゴリへの距離が大きいもの順に出力される。そ
の中から、認識確定に利用出来値特徴のある軸を選択す
ることになる。本実施形態では、上位候補に出現率が高
い文字(すなわち、誤認識し易い文字である)上位3つ
をクラスタ使用軸として選択した。そして、認識結果1
51aを用いてクラスタリングを実施した。作成される
クラスタ形状は楕円体となる。また1カテゴリ当たり、
複数のOKクラスタと複数のNGクラスタが存在するこ
ととなる。
【0053】次に、前段判定部115は、上記のよう
に、第1前段判定手段、第2前段判定手段および第3前
段判定手段を備えて構成され、第1前段判定手段では、
入力画像の認識結果として特定候補順位のカテゴリおよ
び類似カテゴリが得られるとき、該第1候補のカテゴリ
および特定候補順位の類似カテゴリと第1前段知識にお
ける関連との比較により、該第1候補を”正解”また
は”不明”と判定する。
【0054】また、第2前段判定手段では、該特定候補
順位のカテゴリまたは類似カテゴリにおける適合度(距
離)の大きさと第2前段知識における適合度(距離)の
大きさとの比較により、該特定順位の候補を”正解”ま
たは”不明”と判定する。さらに、第3前段判定手段で
は、該特定の候補順位のカテゴリまたは類似カテゴリ間
における適合度(距離)差の大きさと第3前段知識にお
ける適合度(距離)差の大きさとの比較により、該第1
候補を”正解”または”不明”と判定する。
【0055】本実施形態では、認識結果151bにおけ
る第2候補および第3候補の文字と、前段知識ベース1
12の知識とを比較する。例えば、第1候補が”1”で
あった場合には、第2候補および第3候補にそれぞれ”
6”および”)”という文字が出現する率が高い。つま
り、第1前段知識には、第2候補および第3候補に出現
する文字が、”6”および”)”のとき、第1候補が”
1”であるものを正解とする知識を所有しており、まず
認識結果151bの第2候補および第3候補の文字種類
をチェックするのである。
【0056】次に、前段知識ベース112で保持する第
2前段知識(第1候補の距離データで正解と判別できる
最低値)を参照して、該最低値以上の値が第1候補の距
離について算出されているかをチェックし、最低値以上
なら”正解”とする。さらに、第1候補および第2候補
の距離が非常に近い値であると、誤認識している可能性
があるため、前段知識ベース112で保持する第3前段
知識(第1候補距離と第2候補距離の差のデータで正解
と判別できる最低値)を参照して、該最低値以上の値で
あるかをチェックし、最低値以上なら”正解”とする。
以上の3つのチェック全てで”正解”と判断されたデー
タについてのみ、認識確定部118に結果(確定データ
155)が渡されることとなる。
【0057】したがって、確定データ155は前段判定
部115で正解と判断されたデータであり、不明データ
154は前段判定部115で正解と判断されなかったデ
ータである。
【0058】次に、後段判定部116は、上記のよう
に、第1後段判定手段および第2後段判定手段を備えて
構成され、第1後段判定手段では、入力画像の認識結果
として認識結果およびその付随情報を含むデータが得ら
れるとき、該データが第1後段知識のあるカテゴリに所
属するOKクラスタの中に含まれるか否かをチェックし
て、該OKクラスタに含まれる場合には該OKクラスタ
が所属するカテゴリを入力画像の認識結果として”正
解”と判定し、何れのOKクラスタにも含まれていない
場合には”未確定”と判定する。 また、第2後段判定
手段では、該データが第2後段知識のあるカテゴリに所
属するNGクラスタの中に含まれるか否かをチェックし
て、該NGクラスタに含まれる場合には該NGクラスタ
が所属するカテゴリを前記入力画像の認識結果として”
不正解”と判定し、何れのNGクラスタにも含まれてい
ない場合には”正解”と判定する。
【0059】つまり、前段判定部115で未確定とされ
たデータ154を対象に、各カテゴリで生成されたクラ
スタを用いて判定を行う。この後段判定部116には、
OKクラスタおよびNGクラスタの知識が後段知識ベー
ス114から供給され、OKクラスタに入るかどうかの
チェック、並びに、NGクラスタに入るかどうかのチェ
ックという2段階の判定を行う。
【0060】第1後段判定手段において、データがある
カテゴリに所属するOKクラスタに含まれる場合には、
どの程度の確信を持って”正解”といえるかを示す指標
である確信度を当該後段判定部116に含まれる確信度
算出手段により計算し、データが複数の別カテゴリに所
属するOKクラスタに入った場合には、該確信度に基づ
いてどのカテゴリを”正解”とするかを決定する。例え
ば、確信度の大きさが所定値以下の場合には”正解と確
信できない”と判定する。
【0061】尚、確信度算出手段における確信度算出方
法には、データが、該OKクラスタの重心からどの位の
距離に位置しているかを演算し、重心から近ければ高い
確信度を、重心から遠ければ低い確信度をそれぞれ算出
する第1の方法と、また、該OKクラスタを構成するデ
ータの分布に基づいて、データが密度の高いエリアに存
在する場合は高い確信度を、密度の低いエリアに存在す
る場合は低い確信度をそれぞれ算出する第2の方法とが
ある。
【0062】また、第2後段判定手段において、データ
があるカテゴリに所属するNGクラスタに含まれる場合
には、当該後段判定部116に含まれる確信度更新手段
により、OKクラスタに含まれることで計算された確信
度を低くする処理が行われる。
【0063】したがって、確定データ156は、少なく
とも1つのOKクラスタに含まれ、確信度が計算された
データであり、未確定データ157は、後段判定部11
6で、どのOKクラスタにも含まれなかった場合のデー
タであり、認識結果をどのカテゴリにも確定することが
できなかったデータである。
【0064】次に、リジェクト部119は、後段判定部
116で未確定とされたデータ157、或いは、ルール
判定部117で正確と確信できないと判定されたデータ
159を受ける部分である。
【0065】また、ルール判定部117は、後段判定部
116で算出された確信度に基づいて、正解と確信でき
ないデータとしてリジェクトするか、確定データとして
受け付けるか判定する部分である。実際には、ユーザの
設定した値との大小比較で”確定”、”正解と確信でき
ない”を分けている。
【0066】したがって、確定データ158は、ルール
判定部117でユーザの設定した値より確信度が大きい
データであり、正解と確信できないデータ159は、ル
ール判定部117でユーザの設定した値より確信度が小
さいデータである。
【0067】さらに、認識確定部118は、前段判定部
115またはルール判定部117で認識結果を確定でき
たデータ155,158を受ける部分である。
【0068】以上説明した各構成要素により、本実施形
態の画像認識装置では、概略的に以下のような動作が行
われる。図3、図4および図5には、本実施形態の画像
認識装置の概略的動作を説明する概略フローチャートを
示す。
【0069】まず、図3は知識作成処理の概略フローチ
ャートである。知識作成処理では、まずステップ301
で、サンプルデータについて、OCR認識処理部101
により知識生成用の認識結果151aの収集が行われ
る。
【0070】次に、ステップ302では、知識生成部1
03の前段知識の作成部111により前段知識ベース1
12が構築される。すなわち、第1前段知識作成手段に
より第1前段知識(第1候補カテゴリに対する類似カテ
ゴリの関連)が、第2前段知識作成手段により第2前段
知識(特定順位の候補を”正解”と確定し得る適合度
(距離)の大きさ)が、第3前段知識作成手段により第
3前段知識(第1候補を”正解”と確定し得る適合度
(距離)差の大きさ)が、それぞれ作成され登録され
る。
【0071】さらに、ステップ303では、知識生成部
103の後段知識の作成部113により後段知識ベース
114が構築される。すなわち、第1後段知識作成手段
により第1後段知識(OKクラスタの形状)が、第2後
段知識作成手段により第2後段知識(NGクラスタの形
状)がそれぞれ作成され登録される。
【0072】次に、図4および図5は、システム運用時
の処理の概略フローチャートである。まず、ステップ4
01で、実際の認識対象画像について、OCR認識処理
部101により認識処理されて、認識結果151bが認
識結果確定部102の前段判定部115に供給される。
【0073】次に、前段判定部115による処理が行わ
れる。まず、ステップ402では、前段判定部115の
第1前段判定手段により、第1候補のカテゴリおよび特
定候補順位の類似カテゴリと第1前段知識における関連
とを比較して、知識と同じであれば該第1候補を”正
解”と判定してステップ403に進み、また知識と違っ
ていれば”不明”と判定して図5のステップ501に進
む。
【0074】次に、ステップ403では、第2前段判定
手段により、該特定候補順位のカテゴリまたは類似カテ
ゴリにおける適合度(距離)の大きさと第2前段知識に
おける適合度(距離)の大きさとを比較して、知識の距
離の大きさより大きい値であれば該第1候補を”正解”
と判定してステップ404に進み、また知識の距離の大
きさ以下であれば”不明”と判定して図5のステップ5
01に進む。
【0075】さらに、ステップ404では、第3前段判
定手段により、該特定の候補順位のカテゴリまたは類似
カテゴリ間における適合度(距離)差の大きさと第3前
段知識における適合度(距離)差の大きさとを比較し
て、知識の距離差の大きさより大きい値であれば該第1
候補を”正解”と判定して図5のステップ508に進
み、また知識の距離差の大きさ以下であれば”不明”と
判定して図5のステップ501に進む。
【0076】次に、図5の後段判定部116における処
理に進む。まず、ステップ501では、後段判定部11
6の第1後段判定手段により、データが第1後段知識の
あるカテゴリに所属するOKクラスタの中に含まれるか
否かをチェックする。ここで、OKクラスタの中に含ま
れていなければ、ステップ509でリジェクトされる。
【0077】また、ステップ501において、データが
あるカテゴリに所属するOKクラスタに含まれる場合に
は、ステップ502またはステップ503に進んで、ど
の程度の確信を持って”正解”といえるかを示す指標で
ある確信度を確信度算出手段により計算する。
【0078】確信度算出手段による確信度算出は、ステ
ップ502のように、データが、該OKクラスタの重心
からどの位の距離に位置しているかを演算し、重心から
近ければ高い確信度を、重心から遠ければ低い確信度を
それぞれ算出するか、或いは、ステップ503のよう
に、該OKクラスタを構成するデータの分布に基づい
て、データが密度の高いエリアに存在する場合は高い確
信度を、密度の低いエリアに存在する場合は低い確信度
をそれぞれ算出するか、の方法で行われる。
【0079】本実施形態では、図5に示すように、ステ
ップ502でクラスタ重心からの距離による確信度を求
め、ステップ503でクラスタ内座標値による確信度を
求め、ステップ504において、これら2つの算出され
た確信度を加算して最終的な確信度としている。
【0080】次に、ステップ505では、第2後段判定
手段により、該データが第2後段知識のあるカテゴリに
所属するNGクラスタの中に含まれるか否かをチェック
する。ここで、NGクラスタの中に含まれていなければ
ステップ507に進む。
【0081】また、ステップ505において、データが
あるカテゴリに所属するNGクラスタに含まれる場合に
は、ステップ506に進んで、確信度更新手段により、
OKクラスタに含まれることで計算された確信度を低く
するように、確信度を調整する。
【0082】さらに、ステップ507では、ルール判定
部117により、後段判定部116で算出された確信度
とユーザ設定された値とを比較して、ユーザ設定値以下
の確信度の場合には、ステップ509で”正解と確信で
きない”データとしてリジェクトし、また、ユーザ設定
値より大きい確信度の場合には、ステップ508で”正
解”の確定データとして受け付ける。
【0083】次に、以下では、本実施形態の画像認識装
置を構成する各構成要素について、その機能および動作
並びに用いる手法等を各説明図を参照して詳細に説明し
ていく。
【0084】まず、OCR認識処理部101から出力さ
れる認識結果について図6を参照して説明する。認識対
象1文字当たりに出力されるデータは、図6の各行に示
すように、各行上段の候補文字と、各行下段の各候補に
ついての距離である。
【0085】第1行目のデータを例にとり説明を加える
と、次のようになる。すなわち、第1候補は、”0”
で、”0”の距離は234である。第2候補は、”9”
で、”9”の距離は214である。…。第13候補
は、”)”で、”)”の距離は135である。ここで、
距離が大きいほど、認識した文字への信頼度が高いこと
を意味する。つまり、第1行目のデータについて、OC
R認識処理部101は認識対象文字を”0”として認識
したことになる。
【0086】次に、前段知識の作成部111による前段
知識ベース112の構築について説明する。まず、第1
前段知識作成手段では、認識結果151a(図6参照)
のデータのうち、第2候補および第3候補に出現する候
補文字をカウントする。そのうち出現数の上位2つの候
補文字を第1前段知識として保存する。
【0087】次に、第2および第3前段知識作成手段で
は、認識結果151a(図6参照)のデータから、第1
候補距離の大きさ並びに(第1候補距離−第2候補距
離)の大きさの2つの特徴を用いて、認識結果の”確
定”、”未確定”を判断する第2および第3前段知識
(しきい値パラメータ)を作成する。
【0088】まず第1に、知識作成用データからパラメ
ータ決定に使用するデータの選択を行う(カテゴリ毎に
実施する)。具体的には、以下のイ)からニ)の手順で
行われる。
【0089】イ)(第1候補距離−第2候補距離)が、
0、1、2…の場合の正解サンプル数を調べる。
【0090】ロ)正解サンプル数と誤判別サンプル数の
比を調べる。
【0091】ハ)誤判別サンプル数と正解サンプル数の
比が一定以上(例えば、40%以上)になる距離差αを
見つける。
【0092】ニ)(第1候補距離−第2候補距離)がα
以下のデータは、全てリジェクトの対象として(2)の
パラメータ決定の対象から除く。
【0093】次に(第2に)、文字(カテゴリ)ごとに
誤判別をリジェクトするのに必要な第1候補距離並びに
第1候補および第2候補の距離差のしきい値を見つけ
る。具体的には、以下のイ)からハ)の手順で行われ
る。
【0094】イ)誤判別サンプルの第1候補距離と(第
1候補距離−第2候補距離)を調べる。
【0095】ロ)正解のサンプルの第1候補距離と(第
1候補距離−第2候補距離)を調べる。
【0096】ハ)誤判別をすべてリジェクトし、かつ正
解のリジェクトを最小限に抑えることのできる第1候補
と(第1候補距離−第2候補距離)のしきい値を決め
る。
【0097】以上のようにして得られたパラメータを図
7に示す。図中、「第1候補距離」が第2前段知識であ
り、「第1−第2候補距離」が第3前段知識であり、
「第2、第3候補に出現率の高い文字」が第1前段知識
である。
【0098】次に、前段判定部115による判定方法に
ついて説明する。前段判定部115は、知識生成部10
3で作成した候補文字の距離データによる前段知識ベー
ス112を使用して、OCR認識処理部101の認識結
果151bを”確定”、”未確定”に分けるものであ
る。ここで、”確定”、”未確定”に分けるためのルー
ルは、以下に述べる通りである。
【0099】まず第1に(手順1)、第1候補を参照
し、第1前段知識(図7参照)からチェックに使用する
パラメータを選択する。次に(手順2)、第2候補およ
び第3候補文字が第1前段知識(出現率が高いもの)に
一致しているかチェックする。一致しないデータが入っ
ている場合は”不明”データとする。次に(手順3)、
手順2で”不明”データとされなかったデータについ
て、第1候補距離が第2前段知識(図7の第1候補距離
パラメータ)より小さければ”不明”データとする。さ
らに(手順4)、手順3で”不明”データとされなかっ
たデータについて、(第1候補距離−第2候補距離)の
チェックを行う。すなわち、(第1候補距離−第2候補
距離)が第3前段知識(図7の(第1候補距離−第2候
補距離)パラメータ)より小さければ”不明”データと
する。
【0100】図8には、以上の手順をフローチャートと
して示す。すなわち、まずステップ801では、OCR
認識処理部101の認識結果151bから第1候補を取
得する。次に、ステップ802では、第1候補を参照
し、第1前段知識から「第2、第3候補に出現率の高い
候補文字」を抽出する。そして、ステップ803では、
認識結果151bの第2、第3候補と第1前段知識の第
2、第3候補とが一致するかを判断する。ここで、一致
しない場合には、ステップ808に進んで、認識結果1
51bの第1候補を”不明”とする。
【0101】次に、ステップ803において一致した場
合には、ステップ804に進んで、第2および第3前段
知識から「第1候補距離」パラメータαおよび「第1−
第2候補距離差」パラメータβを取得する。そして、ス
テップ805では、認識結果151bの第1候補距離と
「第1候補距離」パラメータαとを比較して、第1候補
距離が「第1候補距離」パラメータαより小さければス
テップ808に進んで、認識結果151bの第1候補
を”不明”とする。
【0102】また、ステップ805において、第1候補
距離が「第1候補距離」パラメータαより大きければ、
ステップ806に進んで、認識結果151bの(第1候
補距離−第2候補距離)と「第1−第2候補距離差」パ
ラメータβとを比較して、(第1候補距離−第2候補距
離)が「第1−第2候補距離差」パラメータβより小さ
ければステップ808に進んで、認識結果151bの第
1候補を”不明”とする。
【0103】また、ステップ806において、(第1候
補距離−第2候補距離)が「第1−第2候補距離差」パ
ラメータβより大きければステップ807に進んで、認
識結果151bの第1候補を”正解”と確定する。
【0104】尚、図8中で用いている「第1候補距離」
パラメータαおよび「第1−第2候補距離差」パラメー
タβは、外部から変動させることができる。つまり、図
7に示したパラメータは、各文字(カテゴリ)毎に用い
る標準的なパラメータであり、これを変動させることで
確定、未確定データ数の割合を調節できる。
【0105】すなわち、「第1候補距離」パラメータα
および「第1−第2候補距離差」パラメータβは、次式
において、Kd、第1固定値および第2固定値を可変設
定することで調整可能である。
【0106】 α=第1候補距離+第1固定値×Kd (−1.0≦Kd≦1.0) β=(第1候補距離−第2候補距離)+第2固定値×K
d (−1.0≦Kd≦1.0) ここで、第1固定値および第2固定値の決定法は、図7
のパラメータを基準に±2の変動幅を持たせる場合に
は、第1固定値=第2固定値=2とする。また、図7の
パラメータを基準値とすると、パラメータαおよびβが
共に大きいほど、図8における条件(ステップ805,
806)を通過できるデータ数は少なくなるから、Kd
が1.0に近くなればなるほど厳しい設定ということに
なる。逆に、Kdが−1.0に近くなればなるほど緩い
設定ということになる。
【0107】次に、後段知識の作成部113による後段
知識ベース114の構築方法について説明する。本実施
形態では、上位候補に出現率が高い文字(すなわち、誤
認識し易い文字)の上位3つを、クラスタ使用軸として
選択し、3次元空間にクラスタを形成することとする。
つまり、図7における出現率の高い候補文字を軸として
選択したことになる。これらの軸を使用して、クラスタ
リングを実施するまでの過程を以下に簡単に述べる。
【0108】まず(手順1)、OCR認識処理部101
から認識結果(知識生成用)151aを受け取り、その
データをカテゴリ別(13個)に分類する。次に(手順
2)、カテゴリ別に分類されたデータを、OCR認識結
果正解データ(以下、甲群という)と誤認識結果(以
下、乙群という)に分類する。次に(手順3)、図7に
示した各カテゴリの「第2、第3候補に出現率の高い候
補文字」のデータ群を、甲群のデータから抽出して、こ
れらを出現率の高い順にA、BおよびCとする。カテゴ
リ”0”を例に取ると、0(A)、6(B)、9(C)
のカテゴリの甲群データを抽出する。
【0109】次に(手順4)、Aのデータ群を対象に、
軸A、軸Bおよび軸Cのデータを抽出してクラスタリン
グを実施する。ここで作成されたクラスタをaとする。
次に(手順5)、Bのデータ群を対象に、軸A、軸Bお
よび軸Cのデータを抽出してクラスタリングを実施す
る。ここで作成されたクラスタをbとする。さらに(手
順6)、Cのデータ群を対象に、軸A、軸Bおよび軸C
のデータを抽出してクラスタリングを実施する。ここで
作成されたクラスタをcとする。次に(手順7)、乙群
のデータに対して、軸A、軸Bおよび軸Cのデータを抽
出してクラスタリングを実施する。
【0110】ここで、カテゴリは13個あるので手順1
〜手順6および手順7はそれぞれ13回実施することに
なる。また、甲群および乙群それぞれについて、複数の
クラスタが生成されることになる。尚、手順3〜手順6
で作成されたクラスタを「OKクラスタ」(a、b、c
が含まれる)と呼び、手順7で作成されたクラスタを
「NGクラスタ」と呼ぶ。
【0111】次に、本実施形態で採用するクラスタリン
グ手法(超楕円体法)について説明する。クラスタ間距
離が近いものの同士を合併しクラスタを生成していく通
常のクラスタリング方法とは異なり、超楕円体法による
クラスタリングは、線型性(線型モデルをいかにして形
成できるかということを意味する)と、連続性(クラス
タを構成するデータの分布が連続的かどうかを意味す
る)とを考慮してクラスタを生成することができる。
【0112】通常のクラスタリングでは、距離という規
範のみで一度クラスタが合併されると、形状は変更でき
ない。つまり、合併後、クラスタを形成している一部分
を分離するための規範が無いのである。しかし、超楕円
体クラスタリングでは、線型性と連続性の考慮により、
合併対象クラスタの変更や、合併後のクラスタ構成デー
タの移動により、定義した規範に即したクラスタ群を構
築することができる。
【0113】図9に示すクラスタ生成を例に採ると、連
続度を重視した場合には、距離の近いクラスタAとBが
合併され、構成データ密度の高いクラスタが生成され
る。また、線型度を重視した場合には、クラスタBとC
が合併され、さらに必要があれば一点移動をおこない、
線型モデルが構築し易いデータ分布のクラスタが生成さ
れることになる。尚、超楕円体クラスタリングの規範
は、各クラスタの体積(超積)の和を最小にすることで
ある。
【0114】次に、超楕円体クラスタリングの処理の流
れについて、以下、簡単に説明する。超楕円体法クラス
タリングの処理の概要は、図10に示すフローチャート
の通りである。前述した通り、この処理を文字(カテゴ
リ)毎に行い、複数のクラスタ/カテゴリを作成する。
【0115】以下に、処理のステップを簡単に述べる。
まず、ステップ1001では各種パラメータを設定す
る。次に、初期のクラスタは、1[データ/クラスタ]
で形成されており、そのクラスタを、クラスタ間距離が
近いもの同士で合併し、処理クラスタ群を形成する。こ
こで用いられるのがウォード法と呼ばれる従来のクラス
タリング手法(ステップ1002)である。
【0116】次に、ステップ1003では、複数[デー
タ/クラスタ]となった後(中には1[データ/クラス
タ]のものも存在する)、超楕円体の評価規範であるク
ラスタ体積和の増加を最小にするクラスタ同士を合併す
る(ステップ1005)。ただし、合併対象のクラスタ
重心間距離は、δu以下でなければならない(ステップ
1004)。
【0117】次に、合併後、クラスタ数を変更せずに、
構成データユニットのクラスタ間移動を行う。ここで移
動対象となるのは、超楕円体の評価規範であるクラスタ
体積和の減少量が最大となるデータである(ステップ1
007〜1010)。ただし、データの移動をおこなう
クラスタは、クラスタ重心間処理がδm以下でなければ
ならない(ステップ1008)。
【0118】最後に、終了判定を行う。クラスタの個数
が指定した最終クラスタ数であるか(ステップ100
6)、或いは、規範増加量が指定値以上である(ステッ
プ1011)とき終了する。そうでなければ、ステップ
1005〜1010を繰り返す。
【0119】尚、上記説明の中で用いたパラメータδu
およびδmには、次のような意味がある。すなわち、δ
uは合併範囲制限パラメータであり、δuを大きくする
と線型度重視となり、δu小さくすると連続度重視とな
る。またδmは移動範囲制限パラメータであり、δmを
大きくすると線型度重視であり、δmを小さくすると連
続度重視である。これらのパラメータδuおよびδm
は、一意に決定できるものではないため、試行錯誤して
設定することが必要である。
【0120】以上のようなクラスタリングを実行した結
果、後段知識としてファイル出力される場合のデータフ
ォーマットを図11に示す。
【0121】次に、楕円体と各パラメータの関係につい
て説明する。クラスタ構成データで生成される共分散行
列の固有ベクトルが楕円体の広がり方向を決め、その方
向の楕円体半径は共分散行列の固有値の平方根に相当す
る。例えば、1データが13の成分からなり、全ての成
分を使用して超楕円体クラスタリングを行うと、13×
13の共分散行列が形成される。そして、その固有ベク
トル、固有値はそれぞれ13個求めることができる。た
だし、図11のクラスタデータフォーマットに示すよう
に、共分散行列は後段知識として保存しない。
【0122】図12には、楕円体と固有値および固有ベ
クトルの関係を説明する説明図を示す。また、楕円体
式、楕円体体積は次式であらわすことができる。
【0123】
【数1】
【数2】 次に、後段判定部116による判定方法について説明す
る。後段判定部116は、前述のように、前段判定部1
15で未確定とされた不明データ154について、確
定、未確定を再度チェックするものである。チェック
は、後段知識の作成部113で作成した後段知識ベース
114(OKクラスタ)に対象データが含まれるか否か
で行う。もし、あるカテゴリのクラスタに含まれる場合
は、その確信度(信頼度)を計算する確信度算出手段を
持つ。
【0124】後段判定部116における処理の流れを説
明するフローチャートを図13に示す。まず、ステップ
1301では、確定対象データ154の第1候補を取得
し、その第1候補で利用する軸データ(3次元)を抽出
する。例えば、第1候補が”0”ならば、図7より、
0、6、9の軸を選択する。
【0125】次に、ステップ1303では、後段知識と
して所有しているクラスタのうち、「OKクラスタ」の
全てに対して、内部に含まれるかチェックを行う。
【0126】ステップ1303において、あるクラスタ
内部に含まれる場合には、ステップ1304に進んで、
クラスタ重心からの距離による確信度を算出し、続いて
ステップ1305で、クラスタ内座標値による確信度を
算出する。そして、ステップ1306では、これら2つ
の確信度を加算して最終的な確信度とする。以上の処理
を全クラスタ似付いて行う(ステップ1302〜130
7)。
【0127】ここで、算出した確信度を、そのクラスタ
を作成する際に使用したデータ群(カテゴリ)に対する
所属度合いとする。つまり、後段知識に作成されている
aというクラスタに入った場合はAに対する所属度合
い、また、bというクラスタに入った場合はBに対する
所属度合い、さらに、cというクラスタに入った場合は
Cに対する所属度合いとなる。
【0128】”0”というカテゴリについて、更に具体
例を述べる。”0”というカテゴリのOKクラスタは、
0、6、9カテゴリのデータ群それぞれについて、0
軸、6軸、9軸を用いてクラスタが作成されている。こ
のうち、0のデータ群で作成されたクラスタに入った場
合は0に対する所属度合いとなる。また6のデータ群で
作成されたクラスタに入った場合は6に対する所属度合
い、9のデータ群で作成されたクラスタに入った場合は
9に対する所属度合いとなる。
【0129】次に、ステップ1308では、内部に含ま
れるクラスタの有無を判断する。複数のクラスタに含ま
れる場合は、ステップ1309で、最大確信度を得たク
ラスタのカテゴリを抽出し、そのクラスタを生成する際
に用いたデータ群を認識結果とする。
【0130】次に、ステップ1312では、知識として
所有しているクラスタのうち、ステップ1309で得ら
れたカテゴリ(認識結果)の所有するNGクラスタ全て
に対して、内部に含まれるかのチェックを行う。もしN
Gクラスタ内部に含まれていた場合には、ステップ13
13において、ステップ1309で得られた確信度を、
ある規則に従って小さくなるような方向に微調整する。
内部に含まれない場合は、ステップ1309の結果を確
定する。
【0131】ここで注目すべき点は、ステップ1309
の処理によって、OCR認識処理部101による認識結
果が覆され、認識結果を置き直して正解とすることがで
きる点である。
【0132】次に、「OKクラスタ」のチェック(ステ
ップ1303)について詳しく説明する。確定対象デー
タがクラスタ内部に含まれるかどうかは、クラスタリン
グにおいて使用する3軸をクラスタの持つ固有ベクトル
で新座標に変換した後、楕円体クラスタを表す次の楕円
体式に代入して、算出された距離が楕円体クラスタのカ
バリング距離以下であるかどうかで判断する。尚、次式
において、γは3軸座標を固有ベクトルの座標に変換し
たものである。
【0133】
【数3】 ここで、もしカバリング距離以下であれば、そのクラス
タに含まれることになり、確信度計算処理(ステップ1
304〜1306)へ進む。逆に、カバリング距離以上
であれば、他のOKクラスタのチェックへ進む。
【0134】次に、確信度の計算処理(ステップ130
4〜1306)について詳しく説明する。まず、認識結
果があるクラスタ内部に含まれると判断された時、算出
するクラスタ重心からの距離の確信度(ステップ130
4)についての説明を行う。
【0135】概要を簡単に述べると、クラスタ知識を生
成した際に確保されたファイル(図11参照)の中で、
dis_max、dis_median、dis_min(以下、距離ポイントデ
ータという)を用いてメンバシップ関数を生成し、その
関数への適合度を計算するのである。ここで用いる距離
ポイントデータとは、クラスタを構成するデータ全てに
ついて中心からの距離を算出し、その中の最大、中央
値、最小値を保存したものである。平均値ではなく中央
値を採用したのは、あるかけ離れた値によって値の変動
が少ないデータという理由からである。ただし、現時点
ではdis_maxの値は保存しているだけで使用していな
い。
【0136】採用するメンバシップ関数の数式は、次の
通りである。式のdisに認識対象文字の距離を入れるこ
とで距離が算出される。尚、t>0であり、dis>dis_m
inならば適合度=1である。
【0137】
【数4】 また、中心からの距離の確信度算出で用いるメンバシッ
プ関数を図示すると図14のようになる。ここで、図1
4の概略を述べておく。認識対象データのクラスタ中心
からの距離がdis_min以下の時、適合度=1を与える。
メンバシップ関数の変極点は、dis_medianである。tの
値を変化させることで、算出される適合度の大きさを変
更できる。すなわち、tが大きくなるほど算出適合度は
大きくなる。
【0138】尚、後段判定部116で用いている「距
離」とは、楕円体の固有ベクトル方向の軸長さを考慮し
たものであり、メンバシップ関数と楕円体の関係は、図
15の適合度と楕円の関係に示す如くなる。説明に用い
るのは2次元の楕円で、x、y軸方向への広がりを持
つ。ここで算出された適合度を、「クラスタ重心からの
確信度」という。
【0139】次に、クラスタ内座標からの確信度の算出
(ステップ1305)について説明する。前述のよう
に、後段知識の作成部113による後段知識ベース11
4の構築において、クラスタを構成するデータの座標値
の頻度を計算している。その頻度によって確信度を割り
当てたものが、図11に示した保存知識おけるfreqienc
yである。2次元の楕円体についての場合に説明を加え
る。
【0140】図16に示されるようなデータの分布でク
ラスタが構成される場合、確信度を求める関数は、頻度
の高い座標値付近で高い値を取るよう設定されている。
これは、このクラスタに属するデータであれば、どの座
標値に偏って集まるかを示していることになる。図16
では、第1象限に偏って集まることが示されている。つ
まり、第1象限に確定対象データが含まれた場合には、
高い確信度を算出する。逆に、第3、第4象限では低い
確信度が算出されることとなる。
【0141】尚、確信度関数のピーク値は、1を使用す
る軸数(クラスタ構成軸数)で割ったものを使用する。
つまり、2軸でクラスタを構成しているならば、各軸の
確信度関数のピーク値は0.5であり、3軸の場合は
0.33である。よって、各軸で算出された確信度を足
し合わせたときに、最大で1を取るように設定する。
【0142】次に、最大確信度の抽出処理(ステップ1
309)について説明する。複数クラスタに確定対象デ
ータが含まれる場合が存在する。その場合、全ての算出
された確信度の中で、最大の確信度を与えるクラスタを
生成する際に用いたデータ群(カテゴリ)をこの時点で
有効とする。前述した通り、この時点で、OCR認識処
理部101による認識結果の第1候補が有効でなくなる
場合があり得る。
【0143】次に、NGクラスタチェック(ステップ1
308)について説明する。最大確信度の抽出処理(ス
テップ1309)において、有効なカテゴリが算出され
た場合には、NGクラスタチェックを行う。NGクラス
タとは、前述した通り、OCR認識処理部101で誤認
識しているデータのみを集めてクラスタを生成したもの
である。クラスタの生成法は、OKクラスタと同様であ
る。
【0144】チェック対象のNGクラスタは、有効なカ
テゴリとして算出されたカテゴリに属するNGクラスタ
全てである。つまり、2が有効クラスタと判断された場
合は、本当は2であるのに他のカテゴリに誤って認識さ
れたしまったデータを集めて作成されたNGクラスタす
べてでチェックを行うのである。
【0145】次に、確信度を低くする処理(ステップ1
313)について説明する。NGクラスタチェック(ス
テップ1308)で、あるNGクラスタに入った場合、
最大確信度の抽出処理(ステップ1309)において算
出された確信度を低くする処理を行う。NGクラスタ
も、OKクラスタと同様に、第2、第3候補に出現し易
い候補を軸として作成されている。つまり、OKクラス
タ、NGクラスタは、同じ空間(軸も同じ)内に存在す
ることになる。
【0146】図17には、あるカテゴリのOKクラスタ
とNGクラスタの位置関係を示す。後段知識ベース11
4の構築方法でも述べたように、Aというカテゴリの第
2、第3候補に多く出現する文字(A、B、C)を軸と
してとり、Aという文字の正解データを集めたデータ群
の軸A、軸B、軸Cから構成される「OKクラスタa」
と、Bという文字の正解データを集めたデータ群の軸
A、軸B、軸Cから構成される「OKクラスタb」と、
Cという文字の正解データを集めたデータ群の軸A、軸
B、軸Cから構成される「OKクラスタc」と、正解が
AなのにBに間違えているデータ群の軸A、軸B、軸C
から構成される「NGクラスタ」とを、2次元に射影し
図示している。ただし、「OKクラスタc」は、説明を
簡単にするために図示していない。
【0147】図17に示すように、OKクラスタaとO
Kクラスタbの重なるエリアに、確定対象のデータが存
在し、OKクラスタチェック(ステップ1303)にお
いて、OKクラスタbの確信度が最大を取る場合で、A
をBと誤認識してしまったデータがあると仮定する。こ
のときそのデータは、NGクラスタにも含まれるため、
図中のNGクラスタ内部の軸上に示す関数により、算出
された結果をBの確信度に掛け合わせて調節する。すな
わち、OKクラスタa、bの重なりが大きい領域 R4
ではBの確信度はそれほど低くならないが、他の領域R
1,R2,R3ではかなり低くなる。
【0148】次に、ルール判定部117による処理につ
いて詳しく説明する。ルール判定部117は、後段判定
部116の確信度算出手段によって算出された確信度を
元に、確定データとするか、或いは、未確定データとし
てリジェクト判定データとするか決定する処理を行うも
のである。図18に、ルール判定部117による処理の
フローチャートを示す。
【0149】処理の内容は簡単で、ステップ1801に
おいて、確信度算出手段によって算出された確信度が所
定値γを越えるときは、ステップ1802に進んで確定
データとし、それ以下の値のときは、ステップ1803
に進んで正解と確信できない判定データとし、リジェク
ト対象データにする。ここで用いた所定値は、ユーザが
設定でき任意に設定できる。所定値を大きくすればする
ほど確定データは減少するようなしくみである。
【0150】以上説明したように、本実施形態の画像認
識装置によれば、予め、前段知識の作成部111におい
て、第1前段知識作成手段により第1前段知識(第1候
補カテゴリに対する類似カテゴリの関連)を、第2前段
知識作成手段により第2前段知識(特定順位の候補を”
正解”と確定し得る適合度(距離)の大きさ)を、第3
前段知識作成手段により第3前段知識(第1候補を”正
解”と確定し得る適合度(距離)差の大きさ)をそれぞ
れ前段知識ベース112に作成しておき、また、後段知
識の作成部113において、第1後段知識作成手段によ
り第1後段知識(OKクラスタの形状)を、第2後段知
識作成手段により第2後段知識(NGクラスタの形状)
をそれぞれ後段知識ベース114に作成しておき、前段
判定部(第1前段判定手段、第2前段判定手段および第
3前段判定手段)115では、これら前段知識ベース1
12の第1、第2および第3前段知識を用いて、入力画
像の認識結果について、”正解”または”不明”(どの
カテゴリにも属さないデータ)の2つに認識結果を分別
して確定し、また、ここで”不明”とされた入力画像の
認識結果については、後段判定部(第1後段判定手段お
よび第2後段判定手段)116により、後段知識ベース
114の第1および第2後段知識を用いて、あるカテゴ
リのOKクラスタに入ったデータを該カテゴリに属す
る”正解”データと決定付け、逆にどのOKクラスタに
も入らない場合は”不明”(どのカテゴリにも属さな
い)データとした後、さらに、NGクラスタの少なくと
も1つに入った場合は”不正解”データと決定し、3つ
に認識結果を分別して確定するようにして、再チェック
を行うようにしている。これにより、受付け誤認識率を
低下させることができ、画像認識システムにおける省力
化をさらに図ることができ、また、帳票読み込みの自動
化を図ることができる。さらに、画像認識システムの認
識結果を否定して”正解”の認識結果に置き換えること
ができるので、認識性能を向上させることができる。
【0151】
【発明の効果】以上の説明から明らかなように、本発明
によれば、第1前段知識作成手段(第1前段知識作成ス
テップ)により、画像認識の認識結果およびその付随情
報を含むデータから、認識結果として同じ第1候補のカ
テゴリを持つデータを集め、該集めたデータから特定の
候補順位における類似カテゴリの出現率の高いものを抽
出して、第1候補カテゴリに対する類似カテゴリの関連
を示す第1前段知識として保持し、第1前段判定手段
(第1前段判定ステップ)では、入力画像の認識結果と
して特定候補順位のカテゴリおよび類似カテゴリが得ら
れるとき、該第1候補のカテゴリおよび特定候補順位の
類似カテゴリと前記第1前段知識における関連との比較
により、該第1候補を”正解”または”不明”と判定す
ることとしたので、正解として確定できたものについて
は人がチェックする必要がなくなり、正解と確定できな
かったものについてのみチェックするだけでよくなるこ
とから、受付け誤認識率を低下させることができ、画像
認識システムにおける省力化をさらに図り得る画像認識
装置、画像認識方法および記録媒体を提供することがで
きる。
【0152】また、本発明によれば、第2前段知識作成
手段(第2前段知識作成ステップ)により、画像認識の
認識結果およびその付随情報を含むデータから、認識結
果として同じ第1候補のカテゴリを持つデータを集め、
該集めたデータから特定の候補順位における適合度(距
離)から、該特定順位の候補を”正解”と確定し得る適
合度(距離)の大きさを算定し、第2前段知識として保
持し、第2前段判定手段(第2前段判定ステップ)で
は、入力画像の認識結果として特定候補順位のカテゴリ
および類似カテゴリが得られるとき、該特定候補順位の
カテゴリまたは類似カテゴリにおける適合度(距離)の
大きさと前記第2前段知識における適合度(距離)の大
きさとの比較により、該特定順位の候補を”正解”また
は”不明”と判定することとし、また、第3前段知識作
成手段(第3前段知識作成ステップ)により、画像認識
の認識結果およびその付随情報を含むデータから、認識
結果として同じ第1候補のカテゴリを持つデータを集
め、該集めたデータから特定の候補順位のカテゴリまた
は類似カテゴリ間における適合度(距離)差から、該第
1候補を”正解”と確定し得る適合度(距離)差の大き
さを算定して、第3前段知識として保持し、第3前段判
定手段(第3前段判定ステップ)では、入力画像の認識
結果として特定候補順位のカテゴリおよび類似カテゴリ
が得られるとき、該特定の候補順位のカテゴリまたは類
似カテゴリ間における適合度(距離)差の大きさと前記
第3前段知識における適合度(距離)差の大きさとの比
較により、該第1候補を”正解”または”不明”と判定
することとしたので、正解として確定できたものについ
ては人がチェックする必要がなくなり、正解と確定でき
なかったものについてのみチェックするだけでよくなる
ことから、受付け誤認識率を低下させることができ、画
像認識システムにおける省力化をさらに図り得る画像認
識装置、画像認識方法および記録媒体を提供することが
できる。
【0153】また、本発明によれば、予め、第1前段知
識作成手段(第1前段知識作成ステップ)により第1前
段知識(第1候補カテゴリに対する類似カテゴリの関
連)を、第2前段知識作成手段(第2前段知識作成ステ
ップ)により第2前段知識(特定順位の候補を”正解”
と確定し得る適合度(距離)の大きさ)を、第3前段知
識作成手段(第3前段知識作成ステップ)により第3前
段知識(第1候補を”正解”と確定し得る適合度(距
離)差の大きさ)を、それぞれ作成しておき、第1前段
判定手段(第1前段判定ステップ)、第2前段判定手段
(第2前段判定ステップ)および第3前段判定手段(第
3前段判定ステップ)では、これら第1、第2および第
3前段知識を用いて、入力画像の認識結果について、”
正解”または”不明”(どのカテゴリにも属さないデー
タ)の2つに認識結果を分別して確定することとしたの
で、受付け誤認識率を低下させることができ、画像認識
システムにおける省力化をさらに図ることができ、ま
た、帳票読み込みの自動化を図り得る画像認識装置、画
像認識方法および記録媒体を提供することができる。
【0154】また、本発明によれば、第1軸抽出手段
(第1軸抽出ステップ)により、画像認識の認識結果お
よびその付随情報を含むデータをサンプル収集し、ある
カテゴリで認識結果が”正解”とされているデータか
ら、前記データの集合をクラスタリングするときの軸を
抽出し、第1後段知識作成手段(第1後段知識作成ステ
ップ)により、第1軸抽出手段(第1軸抽出ステップ)
で抽出された軸に基づき前記データの集合のクラスタリ
ングを行い、該カテゴリのOKクラスタとして生成し、
生成されたOKクラスタの形状を第1後段知識として保
持し、第1後段判定手段(第1後段判定ステップ)で
は、入力画像の認識結果として認識結果およびその付随
情報を含むデータが得られるとき、該データが第1後段
知識のあるカテゴリに所属するOKクラスタの中に含ま
れるか否かをチェックして、該OKクラスタに含まれる
場合には該OKクラスタが所属するカテゴリを入力画像
の認識結果として”正解”と判定し、何れのOKクラス
タにも含まれていない場合には”未確定”と判定するこ
ととしたので、受付け誤認識率を低下させることがで
き、画像認識システムにおける省力化をさらに図り得る
画像認識装置、画像認識方法および記録媒体を提供する
ことができる。
【0155】また、本発明によれば、第2軸抽出手段
(第2軸抽出ステップ)により、画像認識の認識結果お
よびその付随情報を含むデータをサンプル収集し、ある
カテゴリで認識結果が”誤認”とされているデータか
ら、前記データの集合をクラスタリングするときの軸を
抽出し、第2後段知識作成手段(第2後段知識作成ステ
ップ)により、第2軸抽出手段(第2軸抽出ステップ)
で抽出された軸に基づき前記データの集合のクラスタリ
ングを行い、該カテゴリのNGクラスタとして生成し、
生成されたNGクラスタの形状を第2後段知識として保
持し、第2後段判定手段(第2後段判定ステップ)で
は、入力画像の認識結果として認識結果およびその付随
情報を含むデータが得られるとき、該データが第2後段
知識のあるカテゴリに所属するNGクラスタの中に含ま
れるか否かをチェックして、該NGクラスタに含まれる
場合には該NGクラスタが所属するカテゴリを前記入力
画像の認識結果として”不正解”と判定し、何れのNG
クラスタにも含まれていない場合には”正解”と判定す
ることとしたので、受付け誤認識率を低下させることが
でき、画像認識システムにおける省力化をさらに図り得
る画像認識装置、画像認識方法および記録媒体を提供す
ることができる。
【0156】また、本発明によれば、予め、第1後段知
識作成手段(第1後段知識作成ステップ)により第1後
段知識(OKクラスタの形状)を、第2後段知識作成手
段(第2後段知識作成ステップ)により第2後段知識
(NGクラスタの形状)を、それぞれ作成しておき、第
1後段判定手段(第1後段判定ステップ)および第2後
段判定手段(第2後段判定ステップ)では、これら第1
および第2後段知識を用いて、入力画像の認識結果につ
いて、あるカテゴリのOKクラスタに入ったデータを該
カテゴリに属する”正解”データと決定付け、逆にどの
OKクラスタにも入らない場合は”不明”(どのカテゴ
リにも属さない)データとした後、さらに、NGクラス
タの少なくとも1つに入った場合は”不正解”データと
決定され、3つに認識結果を分別して確定することとし
たので、受付け誤認識率を低下させることができ、画像
認識システムにおける省力化をさらに図ることができ、
また、帳票読み込みの自動化を図ることができ、さら
に、画像認識システムの認識結果を否定して”正解”の
認識結果に置き換えることができるので、認識性能を向
上させ得る画像認識装置、画像認識方法および記録媒体
を提供することができる。
【0157】また、本発明によれば、予め、第1前段知
識作成手段(第1前段知識作成ステップ)により第1前
段知識(第1候補カテゴリに対する類似カテゴリの関
連)を、第2前段知識作成手段(第2前段知識作成ステ
ップ)により第2前段知識(特定順位の候補を”正解”
と確定し得る適合度(距離)の大きさ)を、第3前段知
識作成手段(第3前段知識作成ステップ)により第3前
段知識(第1候補を”正解”と確定し得る適合度(距
離)差の大きさ)を、第1後段知識作成手段(第1後段
知識作成ステップ)により第1後段知識(OKクラスタ
の形状)を、第2後段知識作成手段(第2後段知識作成
ステップ)により第2後段知識(NGクラスタの形状)
を、それぞれ作成しておき、第1前段判定手段(第1前
段判定ステップ)、第2前段判定手段(第2前段判定ス
テップ)および第3前段判定手段(第3前段判定ステッ
プ)では、これら第1、第2および第3前段知識を用い
て、入力画像の認識結果について、”正解”または”不
明”(どのカテゴリにも属さないデータ)の2つに認識
結果を分別して確定し、また、ここで”不明”とされた
入力画像の認識結果については、第1後段判定手段(第
1後段判定ステップ)および第2後段判定手段(第2後
段判定ステップ)により、第1および第2後段知識を用
いて、あるカテゴリのOKクラスタに入ったデータを該
カテゴリに属する”正解”データと決定付け、逆にどの
OKクラスタにも入らない場合は”不明”(どのカテゴ
リにも属さない)データとした後、さらに、NGクラス
タの少なくとも1つに入った場合は”不正解”データと
決定され、3つに認識結果を分別して確定するようにし
て、再チェックを行うこととしたので、受付け誤認識率
を低下させることができ、画像認識システムにおける省
力化をさらに図ることができ、また、帳票読み込みの自
動化を図ることができ、さらに、画像認識システムの認
識結果を否定して”正解”の認識結果に置き換えること
ができるので、認識性能を向上させ得る画像認識装置、
画像認識方法および記録媒体を提供することができる。
【0158】また、本発明によれば、第1後段判定手段
(第1後段判定ステップ)において、前記データがある
カテゴリに所属するOKクラスタに含まれる場合に、ど
の程度の確信を持って”正解”といえるかを示す指標で
ある確信度を確信度算出手段(確信度算出ステップ)に
より計算するようにし、前記データが複数の別カテゴリ
に所属するOKクラスタに入った場合には、確信度に基
づいてどのカテゴリを”正解”とするかを決定すること
としたので、あるカテゴリのOKクラスタに入ったデー
タをそのカテゴリに属するデータと決定付け、逆にどの
OKクラスタにも入らない場合は”不明”(どのカテゴ
リにも属さない)データとされるが、あるカテゴリに属
するデータと決定付けられた場合に、認識結果の確信度
合いを算出することにより、”不明”、”正解”、”正
解と確信できない”の3つに認識結果を分別して確定で
き、また、さらに、NGクラスタの少なくとも1つに入
った場合は”不正解”データと決定され、”不明”、”
正解”、”不正解”、”正解と確信できない”の4つに
認識結果を分別して確定し得る画像認識装置、画像認識
方法および記録媒体を提供することができる。
【0159】さらに、本発明によれば、第2後段判定手
段(第2後段判定ステップ)において、前記データがあ
るカテゴリに所属するNGクラスタに含まれる場合に
は、確信度更新手段(確信度更新ステップ)により、ど
の程度の確信を持って”正解”といえるかを示す指標で
ある確信度を低くすることとしたので、あるカテゴリの
OKクラスタに入ったデータをそのカテゴリに属するデ
ータと決定付け、逆にどのOKクラスタにも入らない場
合は”不明”(どのカテゴリにも属さない)データとさ
れるが、あるカテゴリに属するデータと決定付けられた
場合に、認識結果の確信度合いを算出することによ
り、”不明”、”正解”、”正解と確信できない”の3
つに認識結果を分別して確定でき、さらに、NGクラス
タの少なくとも1つに入った場合は”不正解”データと
決定されるか、算出された確信度を低くすることができ
る。
【0160】以上を総括して、本発明によれば、複数の
カテゴリを持ち、入力データに対する各カテゴリの一致
度(若しくはそれに類する情報)を算出する画像認識に
おいて、一致度が高いとされた結果が正しいものか、間
違ったものか決定できない認識結果を、「認識結果が正
解と確信できるため受け付ける」,「認識結果が正解と
確信できないためリジェクトする」,「認識結果が未確
定のためリジェクトする」,並びに「認識結果が不正解
のためリジェクトする」という数種類の結果に確定し、
受付け正解率を向上させ、かつ誤認識率を0[%]に近
づけた画像認識装置、画像認識方法および記録媒体を提
供することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る画像認識装置の構成
図である。
【図2】実施形態の画像認識装置の全体的な処理の概略
を説明する説明図である。
【図3】実施形態の画像認識装置における知識作成処理
の概略フローチャートである。
【図4】実施形態の画像認識装置におけるシステム運用
時の処理の概略フローチャート(その1)である。
【図5】実施形態の画像認識装置におけるシステム運用
時の処理の概略フローチャート(その2)である。
【図6】OCR認識処理部から出力される認識結果を例
示する説明図である。
【図7】第1、第2および第3前段知識のパラメータを
例示する説明図である。
【図8】前段判定部による判定処理を説明するフローチ
ャートである。
【図9】クラスタ生成を例示する説明図である。
【図10】超楕円体法クラスタリングの処理の概要を説
明するフローチャートである。
【図11】後段知識としてファイル出力される場合のデ
ータフォーマットを例示する説明図である。
【図12】楕円体と固有値および固有ベクトルの関係を
説明する説明図である。
【図13】後段判定部における処理の流れを説明するフ
ローチャートである。
【図14】中心からの距離の確信度算出で用いるメンバ
シップ関数を例示する説明図である。
【図15】適合度と楕円の関係を示す説明図である。
【図16】楕円と確信度関数の関係を示す説明図であ
る。
【図17】あるカテゴリのOKクラスタとNGクラスタ
の位置関係を例示する説明図である。
【図18】ルール判定部による処理のフローチャートで
ある。
【符号の説明】
101 OCR認識処理部 102 認識結果確定部 103 知識生成部 111 前段知識の作成部(第1前段知識作成手段、
第2前段知識作成手段および第3前段知識作成手段) 112 前段知識ベース(第1前段知識、第2前段知
識および第3前段知識) 113 後段知識の作成部(第1後段知識作成手段お
よび第2後段知識作成手段) 114 後段知識ベース(第1後段知識および第2後
段知識) 115 前段判定部(第1前段判定手段、第2前段判
定手段および第3前段判定手段) 116 後段判定部(第1後段判定手段および第2後
段判定手段) 117 ルール判定部 118 認識確定部 119 リジェクト部 151a,151b 認識結果 152,153 知識 154 不明データ 155,156,158 確定データ 157 未確定データ 159 正解と確信できないデータ

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 複数カテゴリの認識対象を持ち、登録画
    像パタンと入力画像パタンとのパタンマッチングにおけ
    る適合度(距離)に基づき入力画像の認識を行う画像認
    識装置において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位における
    類似カテゴリの出現率の高いものを抽出して、第1候補
    カテゴリに対する類似カテゴリの関連を示す第1前段知
    識として保持する第1前段知識作成手段と、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該第1候補のカテゴリ
    および特定候補順位の類似カテゴリと前記第1前段知識
    における関連との比較により、該第1候補を”正解”ま
    たは”不明”と判定する第1前段判定手段と、 を具備すること、を特徴とする画像認識装置。
  2. 【請求項2】 複数カテゴリの認識対象を持ち、登録画
    像パタンと入力画像パタンとのパタンマッチングにおけ
    る適合度(距離)に基づき入力画像の認識を行う画像認
    識装置において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位における
    適合度(距離)から、該特定順位の候補を”正解”と確
    定し得る適合度(距離)の大きさを算定し、第2前段知
    識として保持する第2前段知識作成手段と、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該特定候補順位のカテ
    ゴリまたは類似カテゴリにおける適合度(距離)の大き
    さと前記第2前段知識における適合度(距離)の大きさ
    との比較により、該特定順位の候補を”正解”または”
    不明”と判定する第2前段判定手段と、 を具備すること、を特徴とする画像認識装置。
  3. 【請求項3】 複数カテゴリの認識対象を持ち、登録画
    像パタンと入力画像パタンとのパタンマッチングにおけ
    る適合度(距離)に基づき入力画像の認識を行う画像認
    識装置において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位のカテゴ
    リまたは類似カテゴリ間における適合度(距離)差か
    ら、該第1候補を”正解”と確定し得る適合度(距離)
    差の大きさを算定し、第3前段知識として保持する第3
    前段知識作成手段と、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該特定の候補順位のカ
    テゴリまたは類似カテゴリ間における適合度(距離)差
    の大きさと前記第3前段知識における適合度(距離)差
    の大きさとの比較により、該第1候補を”正解”また
    は”不明”と判定する第3前段判定手段と、 を具備すること、を特徴とする画像認識装置。
  4. 【請求項4】 複数カテゴリの認識対象を持ち、登録画
    像パタンと入力画像パタンとのパタンマッチングにおけ
    る適合度(距離)に基づき入力画像の認識を行う画像認
    識装置において、 画像認識の認識結果およびその付随情報を含むデータを
    サンプル収集し、あるカテゴリで認識結果が”正解”と
    されているデータから、前記データの集合をクラスタリ
    ングするときの軸を、 上位候補に出現率の高いカテゴリを該軸として、 下位候補に出現率の高いカテゴリを該軸として、 上位候補に出現率の高いカテゴリおよび下位候補に出現
    率の高いカテゴリをあわせて軸として、 中位候補に出現率の高いカテゴリを該軸として、 相関係数の高いカテゴリ同士を該軸として、 或いは、相関係数の低いカテゴリ同士を該軸として、抽
    出する第1軸抽出手段と、 前記第1軸抽出手段で抽出された軸に基づき前記データ
    の集合のクラスタリングを行い、該カテゴリのOKクラ
    スタとして生成し、生成されたOKクラスタの形状を第
    1後段知識として保持する第1後段知識作成手段と、 入力画像の認識結果として認識結果およびその付随情報
    を含むデータが得られるとき、該データが前記第1後段
    知識のあるカテゴリに所属するOKクラスタの中に含ま
    れるか否かをチェックして、該OKクラスタに含まれる
    場合には該OKクラスタが所属するカテゴリを前記入力
    画像の認識結果として”正解”と判定し、何れのOKク
    ラスタにも含まれていない場合には”未確定”と判定す
    る第1後段判定手段と、 を具備すること、を特徴とする画像認識装置。
  5. 【請求項5】 前記第1後段判定手段は、 前記データがあるカテゴリに所属するOKクラスタに含
    まれる場合に、どの程度の確信を持って”正解”といえ
    るかを示す指標である確信度を計算する確信度算出手段
    を具備し、 前記データが複数の別カテゴリに所属するOKクラスタ
    に入った場合には、前記確信度に基づいてどのカテゴリ
    を”正解”とするかを決定することを特徴とする請求項
    4に記載の画像認識装置。
  6. 【請求項6】 複数カテゴリの認識対象を持ち、登録画
    像パタンと入力画像パタンとのパタンマッチングにおけ
    る適合度(距離)に基づき入力画像の認識を行う画像認
    識装置において、 画像認識の認識結果およびその付随情報を含むデータを
    サンプル収集し、あるカテゴリで認識結果が”誤認”と
    されているデータから、前記データの集合をクラスタリ
    ングするときの軸を、 上位候補に出現率の高いカテゴリを該軸として、 下位候補に出現率の高いカテゴリを該軸として、 上位候補に出現率の高いカテゴリおよび下位候補に出現
    率の高いカテゴリをあわせて軸として、 中位候補に出現率の高いカテゴリを該軸として、 相関係数の高いカテゴリ同士を該軸として、 或いは、相関係数の低いカテゴリ同士を該軸として、抽
    出する第2軸抽出手段と、 前記第2軸抽出手段で抽出された軸に基づき前記データ
    の集合のクラスタリングを行い、該カテゴリのNGクラ
    スタとして生成し、生成されたNGクラスタの形状を第
    2後段知識として保持する第2後段知識作成手段と、 入力画像の認識結果として認識結果およびその付随情報
    を含むデータが得られるとき、該データが前記第2後段
    知識のあるカテゴリに所属するNGクラスタの中に含ま
    れるか否かをチェックして、該NGクラスタに含まれる
    場合には該NGクラスタが所属するカテゴリを前記入力
    画像の認識結果として”不正解”と判定し、何れのNG
    クラスタにも含まれていない場合には”正解”と判定す
    る第2後段判定手段と、 を具備すること、を特徴とする画像認識装置。
  7. 【請求項7】 複数カテゴリの認識対象を持ち、登録画
    像パタンと入力画像パタンとのパタンマッチングにおけ
    る適合度(距離)に基づき入力画像の認識を行う画像認
    識方法において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位における
    類似カテゴリの出現率の高いものを抽出して、第1候補
    カテゴリに対する類似カテゴリの関連を示す第1前段知
    識として保持する第1前段知識作成ステップと、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該第1候補のカテゴリ
    および特定候補順位の類似カテゴリと前記第1前段知識
    における関連との比較により、該第1候補を”正解”ま
    たは”不明”と判定する第1前段判定ステップと、 を具備すること、を特徴とする画像認識方法。
  8. 【請求項8】 複数カテゴリの認識対象を持ち、登録画
    像パタンと入力画像パタンとのパタンマッチングにおけ
    る適合度(距離)に基づき入力画像の認識を行う画像認
    識方法において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位における
    適合度(距離)から、該特定順位の候補を”正解”と確
    定し得る適合度(距離)の大きさを算定し、第2前段知
    識として保持する第2前段知識作成ステップと、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該特定候補順位のカテ
    ゴリまたは類似カテゴリにおける適合度(距離)の大き
    さと前記第2前段知識における適合度(距離)の大きさ
    との比較により、該特定順位の候補を”正解”または”
    不明”と判定する第2前段判定ステップと、 を具備すること、を特徴とする画像認識方法。
  9. 【請求項9】 複数カテゴリの認識対象を持ち、登録画
    像パタンと入力画像パタンとのパタンマッチングにおけ
    る適合度(距離)に基づき入力画像の認識を行う画像認
    識方法において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位のカテゴ
    リまたは類似カテゴリ間における適合度(距離)差か
    ら、該第1候補を”正解”と確定し得る適合度(距離)
    差の大きさを算定し、第3前段知識として保持する第3
    前段知識作成ステップと、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該特定の候補順位のカ
    テゴリまたは類似カテゴリ間における適合度(距離)差
    の大きさと前記第3前段知識における適合度(距離)差
    の大きさとの比較により、該第1候補を”正解”また
    は”不明”と判定する第3前段判定ステップと、 を具備すること、を特徴とする画像認識方法。
  10. 【請求項10】 複数カテゴリの認識対象を持ち、登録
    画像パタンと入力画像パタンとのパタンマッチングにお
    ける適合度(距離)に基づき入力画像の認識を行う画像
    認識方法において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位における
    類似カテゴリの出現率の高いものを抽出して、第1候補
    カテゴリに対する類似カテゴリの関連を示す第1前段知
    識として保持する第1前段知識作成ステップと、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位における
    適合度(距離)から、該特定順位の候補を”正解”と確
    定し得る適合度(距離)の大きさを算定し、第2前段知
    識として保持する第2前段知識作成ステップと、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位のカテゴ
    リまたは類似カテゴリ間における適合度(距離)差か
    ら、該第1候補を”正解”と確定し得る適合度(距離)
    差の大きさを算定し、第3前段知識として保持する第3
    前段知識作成ステップと、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該第1候補のカテゴリ
    および特定候補順位の類似カテゴリと前記第1前段知識
    における関連との比較により、該第1候補を”正解”ま
    たは”不明”と判定する第1前段判定ステップと、 前記第1前段判定ステップで”正解”と判定された入力
    画像について、該特定候補順位のカテゴリまたは類似カ
    テゴリにおける適合度(距離)の大きさと前記第2前段
    知識における適合度(距離)の大きさとの比較により、
    該第1候補を”正解”または”不明”と判定する第2前
    段判定ステップと、 前記第2前段判定ステップで”正解”と判定された入力
    画像について、該特定の候補順位のカテゴリまたは類似
    カテゴリ間における適合度(距離)差の大きさと前記第
    3前段知識における適合度(距離)差の大きさとの比較
    により、該第1候補を”正解”または”不明”と判定す
    る第3前段判定ステップと、 を具備すること、を特徴とする画像認識方法。
  11. 【請求項11】 複数カテゴリの認識対象を持ち、登録
    画像パタンと入力画像パタンとのパタンマッチングにお
    ける適合度(距離)に基づき入力画像の認識を行う画像
    認識方法において、 画像認識の認識結果およびその付随情報を含むデータを
    サンプル収集し、あるカテゴリで認識結果が”正解”と
    されているデータから、前記データの集合をクラスタリ
    ングするときの軸を、 上位候補に出現率の高いカテゴリを該軸として、 下位候補に出現率の高いカテゴリを該軸として、 上位候補に出現率の高いカテゴリおよび下位候補に出現
    率の高いカテゴリをあわせて軸として、 中位候補に出現率の高いカテゴリを該軸として、 相関係数の高いカテゴリ同士を該軸として、 或いは、相関係数の低いカテゴリ同士を該軸として、抽
    出する第1軸抽出ステップと、 前記第1軸抽出ステップで抽出された軸に基づき前記デ
    ータの集合のクラスタリングを行い、該カテゴリのOK
    クラスタとして生成し、生成されたOKクラスタの形状
    を第1後段知識として保持する第1後段知識作成ステッ
    プと、 入力画像の認識結果として認識結果およびその付随情報
    を含むデータが得られるとき、該データが前記第1後段
    知識のあるカテゴリに所属するOKクラスタの中に含ま
    れるか否かをチェックして、該OKクラスタに含まれる
    場合には該OKクラスタが所属するカテゴリを前記入力
    画像の認識結果として”正解”と判定し、何れのOKク
    ラスタにも含まれていない場合には”未確定”と判定す
    る第1後段判定ステップと、 を具備すること、を特徴とする画像認識方法。
  12. 【請求項12】 複数カテゴリの認識対象を持ち、登録
    画像パタンと入力画像パタンとのパタンマッチングにお
    ける適合度(距離)に基づき入力画像の認識を行う画像
    認識方法において、 画像認識の認識結果およびその付随情報を含むデータを
    サンプル収集し、あるカテゴリで認識結果が”誤認”と
    されているデータから、前記データの集合をクラスタリ
    ングするときの軸を、 上位候補に出現率の高いカテゴリを該軸として、 下位候補に出現率の高いカテゴリを該軸として、 上位候補に出現率の高いカテゴリおよび下位候補に出現
    率の高いカテゴリをあわせて軸として、 中位候補に出現率の高いカテゴリを該軸として、 相関係数の高いカテゴリ同士を該軸として、 或いは、相関係数の低いカテゴリ同士を該軸として、抽
    出する第2軸抽出ステップと、 前記第2軸抽出ステップで抽出された軸に基づき前記デ
    ータの集合のクラスタリングを行い、該カテゴリのNG
    クラスタとして生成し、生成されたNGクラスタの形状
    を第2後段知識として保持する第2後段知識作成ステッ
    プと、 入力画像の認識結果として認識結果およびその付随情報
    を含むデータが得られるとき、該データが前記第2後段
    知識のあるカテゴリに所属するNGクラスタの中に含ま
    れるか否かをチェックして、該NGクラスタに含まれる
    場合には該NGクラスタが所属するカテゴリを前記入力
    画像の認識結果として”不正解”と判定し、何れのNG
    クラスタにも含まれていない場合には”正解”と判定す
    る第2後段判定ステップと、 を具備すること、を特徴とする画像認識方法。
  13. 【請求項13】 前記第1後段判定ステップは、 前記データがあるカテゴリに所属するOKクラスタに含
    まれる場合に、どの程度の確信を持って”正解”といえ
    るかを示す指標である確信度を計算する確信度算出ステ
    ップを具備し、 前記データが複数の別カテゴリに所属するOKクラスタ
    に入った場合には、前記確信度に基づいてどのカテゴリ
    を”正解”とするかを決定することを特徴とする請求項
    11に記載の画像認識方法。
  14. 【請求項14】 複数カテゴリの認識対象を持ち、登録
    画像パタンと入力画像パタンとのパタンマッチングにお
    ける適合度(距離)に基づき入力画像の認識を行う画像
    認識方法を、コンピュータに実行させるためのプログラ
    ムとして記録した記録媒体において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位における
    類似カテゴリの出現率の高いものを抽出して、第1候補
    カテゴリに対する類似カテゴリの関連を示す第1前段知
    識として保持する第1前段知識作成ステップと、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該第1候補のカテゴリ
    および特定候補順位の類似カテゴリと前記第1前段知識
    における関連との比較により、該第1候補を”正解”ま
    たは”不明”と判定する第1前段判定ステップと、 を具備すること、を特徴とする記録媒体。
  15. 【請求項15】 複数カテゴリの認識対象を持ち、登録
    画像パタンと入力画像パタンとのパタンマッチングにお
    ける適合度(距離)に基づき入力画像の認識を行う画像
    認識方法を、コンピュータに実行させるためのプログラ
    ムとして記録した記録媒体において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位における
    適合度(距離)から、該特定順位の候補を”正解”と確
    定し得る適合度(距離)の大きさを算定し、第2前段知
    識として保持する第2前段知識作成ステップと、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該特定候補順位のカテ
    ゴリまたは類似カテゴリにおける適合度(距離)の大き
    さと前記第2前段知識における適合度(距離)の大きさ
    との比較により、該特定順位の候補を”正解”または”
    不明”と判定する第2前段判定ステップと、 を具備すること、を特徴とする記録媒体。
  16. 【請求項16】 複数カテゴリの認識対象を持ち、登録
    画像パタンと入力画像パタンとのパタンマッチングにお
    ける適合度(距離)に基づき入力画像の認識を行う画像
    認識方法を、コンピュータに実行させるためのプログラ
    ムとして記録した記録媒体において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位のカテゴ
    リまたは類似カテゴリ間における適合度(距離)差か
    ら、該第1候補を”正解”と確定し得る適合度(距離)
    差の大きさを算定し、第3前段知識として保持する第3
    前段知識作成ステップと、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該特定の候補順位のカ
    テゴリまたは類似カテゴリ間における適合度(距離)差
    の大きさと前記第3前段知識における適合度(距離)差
    の大きさとの比較により、該第1候補を”正解”また
    は”不明”と判定する第3前段判定ステップと、 を具備すること、を特徴とする記録媒体。
  17. 【請求項17】 複数カテゴリの認識対象を持ち、登録
    画像パタンと入力画像パタンとのパタンマッチングにお
    ける適合度(距離)に基づき入力画像の認識を行う画像
    認識方法を、コンピュータに実行させるためのプログラ
    ムとして記録した記録媒体において、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位における
    類似カテゴリの出現率の高いものを抽出して、第1候補
    カテゴリに対する類似カテゴリの関連を示す第1前段知
    識として保持する第1前段知識作成ステップと、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位における
    適合度(距離)から、該特定順位の候補を”正解”と確
    定し得る適合度(距離)の大きさを算定し、第2前段知
    識として保持する第2前段知識作成ステップと、 画像認識の認識結果およびその付随情報を含むデータか
    ら、認識結果として同じ第1候補のカテゴリを持つデー
    タを集め、該集めたデータから特定の候補順位のカテゴ
    リまたは類似カテゴリ間における適合度(距離)差か
    ら、該第1候補を”正解”と確定し得る適合度(距離)
    差の大きさを算定し、第3前段知識として保持する第3
    前段知識作成ステップと、 入力画像の認識結果として特定候補順位のカテゴリおよ
    び類似カテゴリが得られるとき、該第1候補のカテゴリ
    および特定候補順位の類似カテゴリと前記第1前段知識
    における関連との比較により、該第1候補を”正解”ま
    たは”不明”と判定する第1前段判定ステップと、 前記第1前段判定ステップで”正解”と判定された入力
    画像について、該特定候補順位のカテゴリまたは類似カ
    テゴリにおける適合度(距離)の大きさと前記第2前段
    知識における適合度(距離)の大きさとの比較により、
    該第1候補を”正解”または”不明”と判定する第2前
    段判定ステップと、 前記第2前段判定ステップで”正解”と判定された入力
    画像について、該特定の候補順位のカテゴリまたは類似
    カテゴリ間における適合度(距離)差の大きさと前記第
    3前段知識における適合度(距離)差の大きさとの比較
    により、該第1候補を”正解”または”不明”と判定す
    る第3前段判定ステップと、 を具備すること、を特徴とする記録媒体。
  18. 【請求項18】 複数カテゴリの認識対象を持ち、登録
    画像パタンと入力画像パタンとのパタンマッチングにお
    ける適合度(距離)に基づき入力画像の認識を行う画像
    認識方法を、コンピュータに実行させるためのプログラ
    ムとして記録した記録媒体において、 画像認識の認識結果およびその付随情報を含むデータを
    サンプル収集し、あるカテゴリで認識結果が”正解”と
    されているデータから、前記データの集合をクラスタリ
    ングするときの軸を、 上位候補に出現率の高いカテゴリを該軸として、 下位候補に出現率の高いカテゴリを該軸として、 上位候補に出現率の高いカテゴリおよび下位候補に出現
    率の高いカテゴリをあわせて軸として、 中位候補に出現率の高いカテゴリを該軸として、 相関係数の高いカテゴリ同士を該軸として、 或いは、相関係数の低いカテゴリ同士を該軸として、抽
    出する第1軸抽出ステップと、 前記第1軸抽出ステップで抽出された軸に基づき前記デ
    ータの集合のクラスタリングを行い、該カテゴリのOK
    クラスタとして生成し、生成されたOKクラスタの形状
    を第1後段知識として保持する第1後段知識作成ステッ
    プと、 入力画像の認識結果として認識結果およびその付随情報
    を含むデータが得られるとき、該データが前記第1後段
    知識のあるカテゴリに所属するOKクラスタの中に含ま
    れるか否かをチェックして、該OKクラスタに含まれる
    場合には該OKクラスタが所属するカテゴリを前記入力
    画像の認識結果として”正解”と判定し、何れのOKク
    ラスタにも含まれていない場合には”未確定”と判定す
    る第1後段判定ステップと、 を具備すること、を特徴とする記録媒体。
  19. 【請求項19】 複数カテゴリの認識対象を持ち、登録
    画像パタンと入力画像パタンとのパタンマッチングにお
    ける適合度(距離)に基づき入力画像の認識を行う画像
    認識方法を、コンピュータに実行させるためのプログラ
    ムとして記録した記録媒体において、 画像認識の認識結果およびその付随情報を含むデータを
    サンプル収集し、あるカテゴリで認識結果が”誤認”と
    されているデータから、前記データの集合をクラスタリ
    ングするときの軸を、 上位候補に出現率の高いカテゴリを該軸として、 下位候補に出現率の高いカテゴリを該軸として、 上位候補に出現率の高いカテゴリおよび下位候補に出現
    率の高いカテゴリをあわせて軸として、 中位候補に出現率の高いカテゴリを該軸として、 相関係数の高いカテゴリ同士を該軸として、 或いは、相関係数の低いカテゴリ同士を該軸として、抽
    出する第2軸抽出ステップと、 前記第2軸抽出ステップで抽出された軸に基づき前記デ
    ータの集合のクラスタリングを行い、該カテゴリのNG
    クラスタとして生成し、生成されたNGクラスタの形状
    を第2後段知識として保持する第2後段知識作成ステッ
    プと、 入力画像の認識結果として認識結果およびその付随情報
    を含むデータが得られるとき、該データが前記第2後段
    知識のあるカテゴリに所属するNGクラスタの中に含ま
    れるか否かをチェックして、該NGクラスタに含まれる
    場合には該NGクラスタが所属するカテゴリを前記入力
    画像の認識結果として”不正解”と判定し、何れのNG
    クラスタにも含まれていない場合には”正解”と判定す
    る第2後段判定ステップと、 を具備すること、を特徴とする記録媒体。
  20. 【請求項20】 前記第1後段判定ステップは、 前記データがあるカテゴリに所属するOKクラスタに含
    まれる場合に、どの程度の確信を持って”正解”といえ
    るかを示す指標である確信度を計算する確信度算出ステ
    ップを具備し、 前記データが複数の別カテゴリに所属するOKクラスタ
    に入った場合には、前記確信度に基づいてどのカテゴリ
    を”正解”とするかを決定することを特徴とする請求項
    18に記載の記録媒体。
JP22305497A 1997-08-04 1997-08-04 画像認識装置、画像認識方法、および記録媒体 Expired - Fee Related JP3475422B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22305497A JP3475422B2 (ja) 1997-08-04 1997-08-04 画像認識装置、画像認識方法、および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22305497A JP3475422B2 (ja) 1997-08-04 1997-08-04 画像認識装置、画像認識方法、および記録媒体

Publications (2)

Publication Number Publication Date
JPH1153475A true JPH1153475A (ja) 1999-02-26
JP3475422B2 JP3475422B2 (ja) 2003-12-08

Family

ID=16792122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22305497A Expired - Fee Related JP3475422B2 (ja) 1997-08-04 1997-08-04 画像認識装置、画像認識方法、および記録媒体

Country Status (1)

Country Link
JP (1) JP3475422B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639667A (zh) * 2020-04-14 2020-09-08 北京迈格威科技有限公司 图像识别方法、装置、电子设备及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639667A (zh) * 2020-04-14 2020-09-08 北京迈格威科技有限公司 图像识别方法、装置、电子设备及计算机可读存储介质
CN111639667B (zh) * 2020-04-14 2023-06-16 北京迈格威科技有限公司 图像识别方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
JP3475422B2 (ja) 2003-12-08

Similar Documents

Publication Publication Date Title
US6345119B1 (en) Handwritten character recognition apparatus and method using a clustering algorithm
US4028674A (en) Automated signature verification system
US6636631B2 (en) Optical character reading method and system for a document with ruled lines and its application
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
US5321768A (en) System for recognizing handwritten character strings containing overlapping and/or broken characters
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
US8914313B2 (en) Confidence based vein image recognition and authentication
CN112036383B (zh) 一种基于手静脉的身份识别方法及装置
JP2006252559A (ja) 画像において対象物の位置を特定する方法および対象物の画像を相異なる画像カテゴリに分類する方法
Park et al. Automated design of linear tree classifiers
AU722613B2 (en) Fingerprint characteristic extraction apparatus as well as fingerprint classification apparatus and fingerprint verification apparatus for use with fingerprint characteristic extraction apparatus
CN105930792A (zh) 一种基于视频局部特征字典的人体动作分类方法
US7233692B2 (en) Method and computer program product for identifying output classes with multi-modal dispersion in feature space and incorporating multi-modal structure into a pattern recognition system
CN112132117A (zh) 一种辅助胁迫检测的融合身份认证***
CN116363712A (zh) 一种基于模态信息度评估策略的掌纹掌静脉识别方法
JP4802176B2 (ja) パターン認識装置、パターン認識プログラム及びパターン認識方法
WO1996009607A1 (en) Handwritten pattern recognizer
CN117523642A (zh) 一种基于最优间距贝叶斯分类模型的人脸识别方法
JPH1153475A (ja) 画像認識装置、画像認識方法および記録媒体
Fan Efficient multiclass object detection by a hierarchy of classifiers
JP3413236B2 (ja) 文字認識方法
JPH0638276B2 (ja) パターン識別装置
JP2002183667A (ja) 文字認識装置及び記録媒体
Xia et al. An efficient off-line handwritten Japanese address recognition system
JP2766205B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080926

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080926

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090926

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees