JPH09237342A - 注視点を用いた頑健な認識装置 - Google Patents

注視点を用いた頑健な認識装置

Info

Publication number
JPH09237342A
JPH09237342A JP8043419A JP4341996A JPH09237342A JP H09237342 A JPH09237342 A JP H09237342A JP 8043419 A JP8043419 A JP 8043419A JP 4341996 A JP4341996 A JP 4341996A JP H09237342 A JPH09237342 A JP H09237342A
Authority
JP
Japan
Prior art keywords
voting
space
object model
parameter
parameter space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8043419A
Other languages
English (en)
Other versions
JP3764773B2 (ja
Inventor
Katsuto Fujimoto
克仁 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP04341996A priority Critical patent/JP3764773B2/ja
Priority to US08/758,310 priority patent/US5864779A/en
Publication of JPH09237342A publication Critical patent/JPH09237342A/ja
Application granted granted Critical
Publication of JP3764773B2 publication Critical patent/JP3764773B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/48Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 環境を記述するパラメータを推定する認識装
置に関し、パラメータ空間の表現に必要なメモリ容量を
大幅に削減する。 【解決手段】 あらかじめ与えられる注視点情報により
制約されるとともに、形状情報としての物体モデルに基
づくパラメータ空間としての制約パラメータ空間を保持
する手段1と、制約パラメータ空間内で、環境観測によ
り得られた各特徴点に対して物体モデルと整合する部分
パラメータ集合に投票を行う手段2と、制約パラメータ
空間に対する投票結果に応じて、環境を記述するパラメ
ータの推定値を出力する手段3とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文書構造理解処理、
マニピュレータによる物体の操作や移動ロボットのナビ
ゲーションなどに用いられ、例えば環境中に存在する物
体の重心などを認識するための頑健な認識装置に関す
る。
【0002】更に詳しくは、物体や図形の形状情報を物
体モデルとして保持し、環境の観測によって得られた特
徴点に基づいて、環境内に存在する物体、または図形の
種類や位置姿勢などの、環境を記述するパラメータを推
定する頑健な認識装置に関する。
【0003】
【従来の技術】近年このような認識装置を搭載した機器
が広範に用いられるようになっており、それに伴いこの
ような機器によって取り扱われる環境の範囲は整備さ
れ、固定された環境から、整備されておらず、不確実性
の高い環境も含むようになってきている。従って不確実
な環境であっても、対象を正しく認識することができる
頑健な認識装置が、これらの機器の構成要素として重要
な役割を期待されるようになっている。
【0004】例えばカメラによって撮影された画像か
ら、環境中に存在する物体を認識する認識装置、特にノ
イズなどが存在する環境においても、正しく対象を認識
することができる頑健な認識装置を実現するための技術
の代表例として、一般化ハフ変換に基づく頑健な認識装
置が広く知られている。この認識装置の文献を次に示
す。
【0005】D.H. Ballard:"Generalizing the Hough t
ransform to detect arbitrary shapes", Pattern Reco
gnition, Vol.13, No.2, pp111-122 (1981) 図27はこのような頑健な認識装置の従来例、すなわち
一般化ハフ変換に基づく頑健な認識装置の基本構成ブロ
ック図である。同図において、従来の認識装置は1つ以
上の物体の形状情報を保持する物体モデル保持部10
1、環境を記述するパラメータの空間を保持するパラメ
ータ空間保持部102、例えば画像データから抽出され
た特徴点、すなわち観測された1つ以上の特徴点と、物
体モデル保持部101に保持されている物体モデルに基
づいて、パラメータ空間上の投票空間、例えばパラメー
タ空間をメッシュ状に区切った投票空間上に投票を行う
投票実行部103、投票空間上に得られた投票値からパ
ラメータの推定値を出力するパラメータ推定部104を
備えている。
【0006】図28は、図27の認識装置におけるパラ
メータ推定法のフローチャートである。同図において処
理が開始されると、まずステップS101で、環境の観
測によって得られた1つ以上の観測特徴点の集合の入力
に対して、各観測特徴点について物体モデルと整合性が
とれるパラメータ空間中の部分集合が求められ、その部
分集合に対する投票が行われる。続いてステップS10
2で、パラメータ空間上に得られた投票値から環境を記
述するパラメータ、例えば物体の重心座標の位置などの
推定が行われ、処理が終了する。
【0007】図27、および図28で説明した認識装置
の従来例の動作を、物体モデルの具体例を用いて更に説
明する。図29は複数の2次元図形が含まれている文書
を示し、この文書を認識対象の環境として、認識装置の
動作を説明する。
【0008】図30は、図27の物体モデル保持部10
1に保持されている物体モデルの例である。物体モデル
保持部101には一般に複数の物体のモデルが保持され
ているが、図30はその1つを示し、ハート形2次元図
形に対する物体モデルであり、この物体モデルの形状情
報として、ハート形の輪郭上の点がある間隔でとられた
黒丸の位置が保持されている。
【0009】図29のような文書から、ハート形の図形
の重心を、環境を記述するパラメータとして、その推定
値を出力する場合を考える。図29の文書に対する画像
データに対して、例えばエッジ抽出を行い、データを2
値化することによって、各2次元図形を構成する輪郭点
の位置が観測特徴点として得られたものとする。図31
はこのような観測特徴点を示し、ここでは簡単のために
ハートマークと円形マークとのそれぞれに対する輪郭点
が、観測特徴点として得られたものとする。
【0010】図31で観測特徴点のうち、A,B,C、
およびDを考える。これらの観測特徴点が得られた段階
では、これらの4つの点のうちどれが図29の文書内の
ハートマーク上の輪郭点に対応するかは不明であるが、
ここではA,B、およびCがハートマークの輪郭点であ
り、Dは円形マークの輪郭点であるとする。図31にこ
の様子を示す。
【0011】前述のように、この例ではハートマークの
重心位置をパラメータとして推定することにする。そこ
で4つの観測特徴点A,B,C、およびDのそれぞれに
ついて、その点が図30に示した物体モデルの輪郭上の
点のいずれかに一致した場合のその輪郭点に対応する重
心の位置を求め、1つの観測特徴点がハートマークの輪
郭上で次々と移動した時に、その重心が描く軌跡を求め
る。そのような軌跡を図32に示す。
【0012】1つの観測特徴点に対応する重心の軌跡
は、丁度図30の物体モデルを上下に反転させた逆向き
ハートマークとなり、A,B,C、及びDのそれぞれの
観測特徴点に対して4つの逆向きハートマークがxy平
面上に描かれる。
【0013】図32において、図31の円形マークの輪
郭点Dに対応する逆向きハートマークは他の3つのハー
トマークとは共通の交点を持たない。これは観測特徴点
Dが、ここでパラメータとして重心の値が推定されるハ
ートマーク上に存在しないためである。これに対して他
の観測特徴点A,B、およびCに対応する3つの逆向き
ハートマークは1箇所(図の黒丸印)で交わり、この点
が推定値としての真の重心の位置を示すことになる。こ
のパラメータ推定値を求めるためには、xy平面を細か
いメッシュに区切り、それぞれのメッシュを逆向きハー
トマークが通った時にそのメッシュに対する投票数を1
として、3つの逆向きハートマークに対応してメッシュ
空間に投票を行うことにより、投票数として3を得た点
が図29の文書内のハートマークの重心位置、すなわち
パラメータ推定値として出力される。
【0014】
【発明が解決しようとする課題】以上説明したように、
例えば図32でxy平面上のパラメータ、すなわち文書
中に存在するハートマークの重心の位置を求めるために
は、その重心が存在する可能性がある部分、すなわちパ
ラメータ空間を細かいメッシュに分割して投票空間と
し、その投票空間に対する投票を行うことによってパラ
メータの推定値を求めることになる。そこで重心の位置
を精度よく求めるためには、このメッシュ分割を細かく
行わなければならず、投票空間、すなわちパラメータ空
間を表現するために必要なメモリ消費量が膨大になって
しまうという問題点があった。
【0015】例えば縦 100mm、横 100mmの文書上にハー
トマークがあり、その重心を 0.1mmの精度で求める必要
がある場合には、パラメータ空間を1,000 ×1,000 個の
メッシュに分割する必要があり、その分割数に対応する
メモリ領域が必要となる。文書の大きさが大きくなるほ
ど、また重心の位置の精度を高くするほどメモリ消費量
は膨大なものとなり、実用的な認識装置を構成すること
は困難となる。
【0016】本発明は、パラメータ空間の表現に必要な
メモリ消費量を大幅に削減し、高精度でパラメータの推
定を行うことができる頑健な認識装置を提供することを
目的とする。
【0017】
【課題を解決するための手段】図1は本発明の認識装置
の原理構成ブロック図である。同図は、環境の観測によ
って得られた特徴点の集合と、その環境中に存在すると
予想される物体の形状情報を示す物体モデルとを用い
て、環境を記述するパラメータ、例えば文書内の2次元
図形の重心位置を推定する、注視点を用いた頑健な認識
装置の原理構成ブロック図である。
【0018】図1において制約パラメータ空間保持手段
1は、物体モデルに基づくパラメータ空間としての制約
パラメータ空間を保持するものである。この制約パラメ
ータ空間は環境を記述するパラメータの空間があらかじ
め与えられている注視点の情報によって制約されたもの
であり、この注視点情報は、物体モデルとしての形状情
報に対応する情報である。
【0019】投票実行手段2は、制約パラメータ空間保
持手段1に保持されている制約パラメータ空間内の部分
パラメータ集合に対して投票を行うものであり、この部
分パラメータ集合は特徴点のそれぞれに対して物体モデ
ルと整合性を有する制約パラメータ空間内の部分領域で
ある。
【0020】更にパラメータ推定手段3は、特徴点の全
てに対する投票実行手段2による制約パラメータ空間へ
の投票の終了後に、制約パラメータ空間上の投票空間に
対してなされた投票の結果に応じて、環境を記述するパ
ラメータの推定値を出力するものである。
【0021】本発明においては、図1の構成要素に加え
て、更に例えば物体モデルとしての形状情報を保持する
物体モデル保持手段が備えられる。この物体モデル保持
手段は、物体モデルとしての形状情報を制約パラメータ
空間保持手段1、および投票実行手段2に出力するもの
である。
【0022】本発明においては、従来技術で説明したパ
ラメータ空間を大幅に狭めるために、例えばユーザによ
って指定される注視点が用いられる。この注視点は、例
えば図29〜図32で説明した2次元図形としてのハー
トマークに対してはそのハートマークの輪郭上の1つの
点であり、この点の座標があらかじめ与えれらることに
よって、パラメータ空間が大幅に制約され、制約パラメ
ータ空間が得られる。
【0023】例えば図32では、パラメータ空間は観測
特徴点のそれぞれに対する逆向きハートマークが描かれ
る可能性があるxy平面上の範囲の全てに渡り、投票を
行うためにこの領域が細かいメッシュに分割される。
【0024】これに対して本発明では、画像上の1つの
点が注視点として与えられ、この注視点がその重心の位
置を認識すべきハートマーク上に必ず存在するという知
識が前もって与えられる。このため、この注視点に対応
する逆向きハートマーク上に推定すべきパラメータとし
ての真の重心が存在することが明白であるため、この逆
向きハートマークが通る位置のみを投票空間として、他
の観測特徴点に対応する逆向きハートマークが注視点に
対応する逆向きハートマークと交わる位置に対してのみ
投票を行えばよいことになる。
【0025】このように本発明によれば、推定すべきパ
ラメータの空間としての制約パラメータ空間が従来のパ
ラメータ空間に比べて大幅に小さくなる。例えば図32
で説明した例では、従来技術におけるパラメータ空間は
xy平面をメッシュ状に区切った2次元空間であるのに
対して、本発明における制約パラメータ空間は注視点に
対応する逆向きハートマークの輪郭線のみであり、この
輪郭線上の点の位置を、例えばハートマークの輪郭線の
長さに対応させれば、実質的に制約パラメータ空間は1
次元となる。
【0026】
【発明の実施の形態】図2は本発明の頑健な認識装置の
基本構成ブロック図である。同図において物体モデル保
持部11は、一般に複数の物体の物体モデルとしての物
体の形状情報を保持する。この形状情報は、例えばハー
トマークの輪郭線上の点を一定間隔でとった点の2次元
座標値を表す。
【0027】制約パラメータ空間保持部12は、物体モ
デル保持部11に保持されている物体モデルに対応する
制約パラメータ空間を保持する。この制約パラメータ空
間は、物体モデルに対応して、例えばその物体の重心の
位置が存在する可能性のあるパラメータ空間が、例えば
その物体の輪郭線上に存在する1つの注視点によって制
約されたものであり、この注視点は例えばユーザによっ
て指定される。
【0028】投票実行部13は、物体モデル保持部11
に保持されている物体モデルと、観測された特徴点のそ
れぞれに対して、制約パラメータ空間に対する投票を実
行し、全ての観測特徴点に対する投票が終了した後に、
パラメータ推定部14が制約パラメータ空間上の投票空
間に投票された投票結果に応じて、環境を記述するパラ
メータの推定値を出力する。
【0029】図3は、図2の認識装置の構成に対応し
て、その認識装置で実行される環境記述パラメータの推
定方法のフローチャートである。同図において処理が開
始されると、まずステップS1で与えられた注視点と物
体モデルとに基づいて、制約パラメータ空間が生成され
る。図32の例では、注視点に対応する逆向きハートマ
ークが制約パラメータ空間として生成される。
【0030】ステップS2では、各観測特徴点について
物体モデルと整合性のとれた制約パラメータ空間内の部
分集合が求められ、投票が実行される。この部分集合は
ステップS1で生成された制約パラメータ空間、例えば
注視点に対応する逆向きハートマークと、任意の観測特
徴点に対応する逆向きハートマークとの、一般に2つの
交点として求められる。
【0031】続いてステップS3で、制約パラメータ空
間上に得られた投票値から環境記述パラメータ、例えば
重心の位置が推定されて処理を終了する。図4は本発明
を実現するためのコンピュータシステムの構成を示すブ
ロック図である。同図においてシステムは全体を制御す
る中央処理装置(CPU)15、物体モデルとしての形
状情報や、制約パラメータ空間のデータが格納されるラ
ンダムアクセスメモリ(RAM)16、認識プログラム
などを格納するリードオンリメモリ(ROM)17、カ
メラによって撮影された画像データを格納するフレーム
バッファ(FRAM)18、およびパラメータの推定結
果、例えば物体の位置と姿勢に応じて、例えば推定対象
物体を色付けした画像データをディスプレイ上に表示さ
せるにあたり、その画像データを格納するビデオランダ
ムアクセスメモリ(VRAM)19を備えている。
【0032】図5は、図4のRAM16上に展開される
データのうちで、制約パラメータ空間上の投票空間とし
ての配列データのデータ構造である。メモリ上には制約
パラメータ空間が区切られたメッシュのそれぞれに対応
して、投票数が格納される配列のデータが展開される。
注視点と観測特徴点とのデータに基づいて投票される配
列要素が決定され、その配列要素に対応する投票値が1
だけ増加される。
【0033】続いて本発明の実施例を説明する。図6は
本発明の第1の実施例を説明するための認識装置の構成
ブロック図である。同図を図2と比較すると、物体モデ
ル保持部11が保持する物体モデルが図形の輪郭点の2
次元位置座標であることと、観測特徴点が文書内の(図
形の)輪郭点の2次元位置座標である点が異なってい
る。これは、第1の実施例では図29で説明したような
文書中に含まれる2次元図形を認識し、その図形のパラ
メータとして、その図形の位置姿勢の推定値を出力する
動作が行われるためである。すなわち第1の実施例で
は、図30に示したような物体モデルが図6の物体モデ
ル保持部11に保持され、図29に示したような文書中
のハートマークの位置姿勢の推定が行われ、ハートマー
クを他の図形と分離することが可能となる。
【0034】物体モデルは、文書から検出したい図形の
形状モデルのことである。ここでは、図形の輪郭点の集
合により表現する。これにより、輪郭点の量子化精度の
範囲内で任意の形状の図形をモデル化することができ
る。図形Kの物体モデルMは、図形KのNM 個の輪郭点
のそれぞれの物体モデル座標系における2次元座標、す
なわち
【0035】
【数1】
【0036】で表現できる。図形Kの位置姿勢パラメー
タは、図形Kの物体モデル座標系から環境中に仮想的に
設定した作業座標系への座標変換パラメータであり、位
置2次元と姿勢1次元、すなわち (X,Y,Θ) (2) により表現される。第1の実施例の認識装置の目的は、
文書中に配置された図形Kの位置姿勢パラメータを推定
することにある。さらに詳しくは、注視点として文書か
ら得られた輪郭点のうちの1つを指定されたとして、こ
の注視点を輪郭点の一部として含む図形Kの位置姿勢パ
ラメータを推定する。
【0037】物体モデルとその位置姿勢について、図7
と図8を用いて更に説明する。図7はハートマークの物
体モデルとしての輪郭線上の点、すなわち代表点の例で
ある。ここではNM =24であって、24個の代表点で
ハートマークの形状が近似的に表現されている。本来は
ハートマークの輪郭線上の点を連続的に表現することが
望ましいが、一般に任意の形状を持つ物体を方程式など
の形で表すことは困難であるため、輪郭線上の点をある
間隔で選び、その点集合を物体の形状情報、すなわち物
体モデルを表す代表点とみなすことにする。
【0038】図8は図形Kの位置姿勢パラメータの説明
図である。同図において、図7の物体モデルを移動させ
る並進ベクトルのx方向成分X、y方向成分Yと、移動
結果の回転角Θとを用いて、文書中の図形の位置姿勢パ
ラメータが表現される。
【0039】第1の実施例の目的は、前述のように文書
中に配置された図形Kの位置姿勢パラメータを推定する
ことであるが、本実施例では文書から得られた輪郭点の
うちの1つが例えばユーザによって注視点として指定さ
れた時、この注視点を輪郭点の一部として含む図形Kの
位置姿勢パラメータの推定が行われる。すなわち、この
注視点が1つの輪郭点として含まれる図形Kの位置姿勢
パラメータの範囲が求められ、その範囲が制約パラメー
タ空間とされる。
【0040】観測特徴点は、2次元図形が含まれる文書
の画像データに対してエッジ抽出を行い、データの2値
化を行うことによって得られるものであり、図形の輪郭
を構成する輪郭点を示す。このエッジ抽出において、例
えば sobelフィルタが用いられる。一般に輪郭点におい
ては画像の濃度が急激に変化する性質があり、輪郭点の
近傍における濃度勾配を求めることにより、輪郭点の有
無を調べることができる。濃淡画像f(x,y)のx方
向とy方向の単位ベクトルを 外1 (以下ベクトルi
と表記する)、 外2 (以下ベクトルjと表記する)
とする時、画像
【0041】
【外1】
【0042】
【外2】
【0043】の濃度勾配は次式で表される。
【0044】
【数2】
【0045】ディジタル化された画像においては、濃度
勾配の大きさを示す微分係数を差分演算で近似すること
により、濃度勾配の大きさが求められる。この差分近似
の方法には幾通りかの方法があり、各種の差分フィルタ
が考えられる。更に平滑化フィルタと差分フィルタの線
形合成によって新たな差分フィルタを構成することがで
き、その代表的なものが sobelフィルタである。 sobel
フィルタを用いると、輪郭点を求める場合における雑音
の影響を軽減することができる。
【0046】第1の実施例において、観測特徴点は2次
元位置座標によって表現され、ND個の観測特徴点は文
書上に設定される作業座標系における2次元座標を用い
て、次式のように表現できる。
【0047】
【数3】
【0048】次に制約パラメータ空間の生成と、投票実
行部による投票とについて説明する。注視点 外3
(以下ベクトルxA と表記する)の文書上に設定される
作業座
【0049】
【外3】
【0050】標系における2次元座標を、(xA
A )とする。制約パラメータ空間保持部12は、初期
化時に、物体モデルと注視点から制約パラメータ空間C
を生成する。制約パラメータ空間Cは、注視点を輪郭と
して含む、形状が図形Kである物体の位置姿勢パラメー
タの集合である。物体モデルの代表点 外4 (以下ベ
クトルxM と表記する)、注視点ベクトルxA 、制約パ
【0051】
【外4】
【0052】ラメータ空間Cの代表点 外5 (以下
(ベクトルxC ,θC )=(xC ,yC,θC )と表記
する)の間の関係は、座標変換の式から、回転行列 外
6 (以
【0053】
【外5】
【0054】下Rθと表記する)を用いて、
【0055】
【外6】
【0056】
【数4】
【0057】で表すことができる。θC を[0,2π]
で量子化し、代表点を、
【0058】
【数5】
【0059】とすると、制約パラメータ空間Cは、物体
モデルMと姿勢パラメータθC の代表点を用いて、
【0060】
【数6】
【0061】と表現できる。従って制約パラメータ空間
上の投票空間は、2次元配列、
【0062】
【数7】
【0063】で離散的に表現できる。ここで、NM は物
体モデルの代表点の数、 外7 (以下Nθと表記す
る)は姿勢パラメータの量子化数である。
【0064】
【外7】
【0065】従来技術では、投票空間が位置姿勢パラメ
ータ空間3次元をそのまま離散化した3次元配列であっ
たから、本実施例によりメモリ消費量が大幅に削減でき
ていることがわかる。
【0066】観測特徴点 外8 が与えられた時の投票
実行部13による投票は、以下のよ
【0067】
【外8】
【0068】うに行う。観測特徴点 外9 (以下ベク
トルxj D と表記する)と物体モデルMにより
【0069】
【外9】
【0070】作られる位置姿勢パラメータの可能性集合
j は、注視点の場合と同様の考え方により、
【0071】
【数8】
【0072】と表現できる。投票実行部13は、制約パ
ラメータ空間Cと、観測特徴点ベクトルxj D による可
能性集合Cj との交わりに投票する。
【0073】交わりの判定は、それぞれの代表点間の距
離と量子化距離を比較することにより行い、量子化距離
より小さい場合に交わっていると判定する。そして、C
j と交わったCの代表点を表す2次元座標(i,k)に
対して、 H(i,k):=H(i,k) +1 (9) とすることにより投票を行う。
【0074】パラメータ推定部14は、投票実行部13
により全ての観測特徴点に対する投票が完了した後に、
制約パラメータ空間の代表点のうち投票数の最も多いも
のを選択し、この位置姿勢をパラメータの推定値とす
る。
【0075】制約パラメータ空間の生成と投票の実行に
ついて、フローチャートを用いて更に説明する。図9は
制約パラメータ空間生成処理のフローチャートである。
同図において処理が開始されると、まずステップS11
で投票空間H(i,k)と、制約パラメータ空間Cの代
表点 外10 (以下ベクトルP(i,k)と表記す
る)との格納領域がメモリ上に確保される。制約パラメ
ータ空間の生成とは、具
【0076】
【外10】
【0077】体的には投票空間としての2次元配列H
(i,k)と、パラメータ空間中の代表点の座標値ベク
トルP(i,k)の組を、iとkとの値の組としてのイ
ンデックス(i,k)(i=1,…,NM ,k=1,
…,Nθ)に対して生成することであり、ステップS1
1ではこれらの空間に対する領域がメモリ上に確保され
る。
【0078】続いて図9において、ステップS12でこ
のインデックス(i,k)に対してステップS13の処
理が行われる。ステップS13では投票空間H(i,
k)の値が0に初期化されると共に、ベクトルP(i,
k)の値が求められる。
【0079】制約パラメータ空間Cの代表点ベクトルP
(i,k)は、(6)式で説明したように3次元で表現
される。(6)式において、θk C は1次元の姿勢パラ
メータθの量子化後の代表点であり、次式によって計算
できる。
【0080】
【数9】
【0081】また、Rθは2次元回転行列であり、次式
によって与えられる。
【0082】
【数10】
【0083】これらを用いて、ベクトルP(i,k)は
次式のように計算できる。
【0084】
【数11】
【0085】なお(10)式において、姿勢パラメータ
θの量子化を行うための分割数Nθとしては通常 100〜
1000位の数をとることによって、十分な姿勢精度が確保
される。本来は0〜2πの間を連続して取り扱うことが
望ましいが、コンピュータで演算を行うためにこのよう
な量子化が必要となる。
【0086】図10は投票処理の詳細フローチャートで
ある。同図において処理が開始されると、まずステップ
S15で観測特徴点のそれぞれに対して、ステップS1
6〜S22の処理が実行される。
【0087】まずステップS16で可能性集合Cj の生
成が行われ、その後この可能性集合を用いて、ステップ
S17で全てのインデックス、すなわち(i,k)の組
についてステップS18以降の処理が行われる。
【0088】ステップS18では、まずフラグが0とさ
れ、ステップS19で全ての(i′,k′)の組につい
てステップS20、およびS21の処理が行われる。ス
テップS20では、制約パラメータ空間上の代表点ベク
トルP(i,k)と可能性集合の要素 外11 (以下
ベクトルPj (i′,k′)と表記する)との距離の
【0089】
【外11】
【0090】計算が行われ、ステップS21ではこの距
離が量子化距離εより小さい場合にフラグの値が1とさ
れる。その後ステップS22でフラグの値が1である時
に制約パラメータ空間上の代表点のインデックス(i,
k)に対応する投票空間上の投票値H(i,k)が1だ
け増加されて、処理を終了する。
【0091】図10のステップS16で行われる可能性
集合の生成は、前述のように制約パラメータ空間の生成
におけると同様に行われ、可能性集合は次式によって与
えられる。
【0092】
【数12】
【0093】ステップS20における距離の計算で用い
られるノルムとしては、シティブロック距離、またはユ
ークリッド距離などが用いられる。2つのベクトル 外
12、 外13 の間のシティブロック距離とユークリ
ッド距離とは、それぞれ次
【0094】
【外12】
【0095】
【外13】
【0096】式で与えられる。
【0097】
【数13】
【0098】投票処理が終了した後のパラメータの推定
においては、投票結果によって得られた投票数を示す配
列H(i,k)の中から最大の値となっている 外14
【0099】
【外14】
【0100】探索され、このインデックス 外15 に
対する制約パラメータ空間の代表点
【0101】
【外15】
【0102】外16 がパラメータ推定値として出力さ
れる。なおステップS20の距離の比
【0103】
【外16】
【0104】較で用いられる量子化距離εは、例えば物
体モデルの代表点の間隔dM と、姿勢パラメータの量子
化精度 外17 とを用いて、次式によって求められ
る。
【0105】
【外17】
【0106】
【数14】
【0107】次に第1の実施例によるメモリ消費量の削
減について説明する。図11は注視点によって制約され
る以前、すなわち元々の3次元パラメータ空間を示す。
前述のように、第1の実施例における図形Kの位置姿勢
パラメータは、位置2次元(x,y)と姿勢1次元
(θ)、すなわち3次元パラメータ空間として表現され
る。
【0108】図12は、第1の実施例における制約パラ
メータ空間を概念的に示したものである。前述のよう
に、制約パラメータ空間はインデックス(i,k)とし
てのiとkとの値の組に対して表現され、一般的に図1
2のような座標空間内の曲面によって表現される。
【0109】図13は、図12の制約パラメータ空間上
の投票空間を平面的に表したものである。これは図12
の制約パラメータ空間を、例えば平面に伸ばしたものと
解釈することができる。投票空間上のメッシュの数はN
i ×Nk となる。ここでNiは物体モデルの代表点の
数、Nk は姿勢パラメータの量子化数である。
【0110】図14は投票対象空間、すなわち図13の
投票空間上で投票が行われるメッシュの位置の決定法の
説明図である。同図において、制約パラメータ空間を表
す2次元曲面と、観測特徴点による可能性空間を表す2
次元曲面との交線が投票対象空間として決定される。
【0111】図15はこの2次元投票空間への投票の説
明図である。図14で決定された投票対象空間、すなわ
ち観測特徴点による可能性空間との交線上にある制約パ
ラメータ空間上の位置に対応するメッシュへの投票が行
われる。
【0112】図16は従来技術を用いる場合の投票空間
を示し、これは図11の元々の3次元パラメータ空間を
x ×Ny ×Nθの個数のメッシュに区切ったものであ
る。このように従来技術を用いると投票空間が3次元と
なるのに対して、第1の実施例では、図13で説明した
ように投票空間が2次元となるために、従来技術と比較
してメモリ消費量を大幅に削減することが可能となる。
【0113】続いて本発明の第2の実施例について説明
する。第2の実施例では、第1の実施例におけると同様
に、2次元図形が含まれる文書から指定された図形Kの
位置姿勢パラメータの推定が行われるが、図形の輪郭法
線が用いられる点が第1の実施例と異なっている。
【0114】図17は第2の実施例における認識装置の
構成を示すブロック図である。第1の実施例に対する図
6と異なる点は、物体モデル保持部11に保持されてい
る物体モデルとしての形状情報が図形の輪郭法線の位置
姿勢であり、また画像データから得られる観測特徴点が
文書内の(図形の)輪郭法線の位置姿勢になっているこ
とである。
【0115】第2の実施例の物体モデルは、図形の輪郭
法線の位置姿勢の集合により表現される。これにより、
輪郭法線の量子化精度の範囲内で任意の形状の図形をモ
デル化することができる。図形Kの物体モデルMは、図
形KのNM 個の輪郭法線のそれぞれの位置姿勢の物体モ
デル座標系における2次元位置座標と1次元姿勢、すな
わち
【0116】
【数15】
【0117】で表現できる。図形Kの位置姿勢パラメー
タは、図形Kの物体モデル座標系から環境中に仮想的に
設定した作業座標系への座標変換パラメータであり、位
置2次元と姿勢1次元、すなわち (X,Y,Θ) (17) により表現される。第2の実施例の認識装置の目的は、
文書中に配置された図形Kの位置姿勢パラメータを推定
することにある。さらに詳しくは、注視点として文書か
ら得られた輪郭法線のうちの1つを指定されたとして、
この注視点を輪郭法線の一部として含む図形Kの位置姿
勢パラメータを推定する。
【0118】図形の輪郭法線について、図18および図
19を用いて更に説明する。図18は、図7におけると
同様に、物体としてのハートマークの輪郭線上の点にお
ける輪郭法線を示す。その輪郭法線は、輪郭線上の点の
位置と、その点における法線の姿勢との組で表現される
ものであり、図形の形状を第1の実施例におけるよりも
詳しく表現したものである。
【0119】図18におけるように、輪郭法線は輪郭線
上の代表点から伸び、輪郭線と直交する方向を持つ矢印
として、幾何学的に表現される。図19は輪郭法線の定
量的な表現法の説明図である。同図において、法線の矢
印の出発点としての代表点の物体モデル座標系での位置
座標(x,y)と、法線がx軸方向となす角θを用い
て、輪郭法線が定量的に(x,y,θ)によって表現さ
れる。
【0120】観測特徴点は、文書を sobelフィルタを用
いるなどしてエッジ抽出し、2値化することにより得ら
れる輪郭を構成する輪郭法線のこととする。この場合、
観測特徴点は、位置(2次元)と姿勢(1次元)により
表現され、ND 個の観測特徴点は、文書上に設定される
作業座標系における2次元位置座標と1次元姿勢によ
り、
【0121】
【数16】
【0122】と表現できる。注視点ベクトルxA の文書
上に設定される作業座標系における位置姿勢を、
(xA ,yA ,θA )とする。
【0123】制約パラメータ空間保持部11は、初期化
時に、物体モデルと注視点から制約パラメータ空間Cを
生成する。制約パラメータ空間Cは、注視点を輪郭とし
て含む、形状が図形Kである物体の位置姿勢パラメータ
の集合である。物体モデルの代表点ベクトルxM 、注視
点ベクトルxA 、制約パラメータ空間Cの代表点(ベク
トルxC ,θC )=(xC ,yC ,θC )の間の関係
は、座標変換の式から、回転行列Rθを用いて、
【0124】
【数17】
【0125】で表すことができる。従って、制約パラメ
ータ空間Cは、物体モデルMの代表点を用いて、
【0126】
【数18】
【0127】と表現できる。従って制約パラメータ空間
上の投票空間は、1次元配列、 {H(i)|i=1・・・NM } (21) で離散的に表現できる。ここで、NM は物体モデルの代
表点の数である。
【0128】従来技術では、投票空間が位置姿勢パラメ
ータ空間3次元をそのまま離散化した3次元配列であっ
たから、本実施例によりメモリ消費量が大幅に削減でき
ていることがわかる。
【0129】観測特徴点(ベクトルxj D ,θj D )=
(xj D ,yj D ,θj D )が与えられた時の投票実行
部13による投票は、以下のように行う。観測データ
(ベクトルxj D ,θj D )と物体モデルMにより作ら
れる位置姿勢パラメータの可能性集合Cj は、注視点の
場合と同様の考え方により、
【0130】
【数19】
【0131】と表現できる。投票実行部13は、制約パ
ラメータ空間Cと、観測特徴点による可能性集合C j
の交わりに投票する。
【0132】交わりの判定は、それぞれの代表点間の距
離と量子化距離を比較することにより行い、量子化距離
より小さい場合に交わっていると判定する。そして、C
j と交わったCの代表点を表す1次元座標(i)に対し
て、 H(i):=H(i) +1 (23) とすることにより投票を行う。
【0133】パラメータ推定部14は、投票実行部13
により全ての観測特徴点に対する投票が完了した後に、
制約パラメータ空間の代表点のうち投票数の最も多いも
のを選択し、この位置姿勢をパラメータの推定値とす
る。
【0134】このように第2の実施例では、制約パラメ
ータ空間上の投票空間は1次元配列H(i)によって表
される。これに対して前述の第1の実施例では投票空間
は2次元であり、H(i,k)で表された。その理由に
ついて図20、および図21を用いて説明する。
【0135】本発明においては注視点が1つ与えられ、
その注視点が物体モデルの代表点の1つに対応するもの
と考えて、物体の位置姿勢パラメータの可能性空間、す
なわち制約パラメータ空間が生成される。
【0136】第1の実施例においては、注視点としてそ
の位置のみが与えられているにすぎないために、図20
に示すようにその注視点を中心とする回転の自由度が残
っていることになる。
【0137】従って制約パラメータ空間は、代表点の移
動に伴う自由度1つ(i)と、回転による姿勢の変化に
伴う自由度1つ(k)の合計2つの自由度(i,k)を
持つことになり、制約パラメータ空間は2次元、すなわ
ち曲面となり、対応する投票空間も2次元配列となる。
【0138】これに対して第2の実施例においては、注
視点、すなわち注視法線の情報として、輪郭上の点の位
置に加えて、法線の姿勢も指定されているために、この
注視法線を物体モデルの1つとしての輪郭法線に対応さ
せることにより、図21に示すように、2つの法線が一
致するような1つの位置姿勢に限定されるようにしか、
物体が存在することができなくなる。従って制約パラメ
ータ空間は、代表点の移動に伴う1つの自由度(i)の
みを持つこととなり、対応する投票空間も1次元配列と
なる。
【0139】なお第2の実施例では、物体モデルの代表
点の量子化は行われているが、姿勢パラメータの量子化
は行われていない。次に本発明の第3の実施例について
説明する。第3の実施例では、3次元物体が含まれる環
境から、指定された物体Kの位置姿勢パラメータの推定
が行われる。図22は、第3の実施例における認識装置
の構成を示すブロック図である。例えば第1の実施例に
対応する図6と比較すると、物体モデル保持部11が物
体の表面上の点の3次元位置を物体の形状情報として保
持し、観測特徴点が環境中の(物体の)表面上の点の3
次元位置を表すことと、パラメータ推定部14が3次元
物体の位置姿勢の推定値を出力する点が異なっている。
【0140】第3の実施例の物体モデルは、物体の表面
上の点を特徴点としてこの特徴点の集合により表現され
る。これにより、特徴点の量子化精度の範囲内で任意の
形状の物体をモデル化することができる。物体Kの物体
モデルMは、物体KのNM 個の表面上の点のそれぞれの
物体モデル座標系における3次元位置座標、すなわち、
【0141】
【数20】
【0142】で表現できる。物体Kの位置姿勢パラメー
タは、物体Kの物体モデル座標系から環境中に仮想的に
設定した作業座標系への座標変換パラメータであり、位
置3次元と姿勢3次元、すなわち (X,Y,Z,Θ) (25) により表現される。Θは、物体Kの姿勢を表し、例えば
オイラー角を用いるなどして3次元の成分を持つ。
【0143】第3の実施例の認識装置の目的は、環境中
に配置された物体Kの位置姿勢パラメータを推定するこ
とにある。さらに詳しくは、注視点として環境から得ら
れた表面上の点のうちの1つを指定されたとして、この
注視点を表面の一部として含む物体Kの位置姿勢パラメ
ータを推定する。
【0144】観測特徴点は、環境をレンジファインダあ
るいはステレオ視を行うことにより観測し、距離画像を
取得することにより得られる物体表面を構成する特徴点
のこととする。この場合、観測特徴点は、位置(3次
元)により表現され、ND 個の観測特徴点は、環境上に
設定される作業座標系における3次元位置座標により、
【0145】
【数21】
【0146】と表現できる。ここでレンジファインダ、
あるいはステレオ視による特徴点の観測について、図2
3,図24を用いて説明する。図23はレンジファイン
ダによる特徴点の観測法の説明図である。レンジファイ
ンダによれば、視点から観測特徴点までの距離と、その
方向を測定することができるため、図に示すように観測
特徴点の位置を求めることができる。
【0147】図24はステレオ視の説明図である。2つ
の視点から観測特徴点の方向を測定することにより、三
角測量の原理を用いて観測特徴点の位置を求めることが
できる。
【0148】次に、制約パラメータ空間の生成について
説明する。まず、注視点ベクトルx A の位置、すなわち
環境上に設定される作業座標系における位置を、
(xA ,y A ,zA )とする。
【0149】制約パラメータ空間保持部12は、初期化
時に、物体モデルと注視点から制約パラメータ空間Cを
生成する。制約パラメータ空間Cは、注視点を表面とし
て含む形状が物体Kである物体の位置姿勢パラメータの
集合である。物体モデルの代表点ベクトルxM 、注視点
ベクトルxA 、制約パラメータ空間Cの代表点 外18
(以下ベクトルxC ,ΘC )=(xC ,yC ,zC
ΘC )と表記する)の
【0150】
【外18】
【0151】間の関係は、座標変換の式から、回転作用
素 外19 (以下RΘと表記する)
【0152】
【外19】
【0153】を用いて、
【0154】
【数22】
【0155】で表すことができる。ここでオイラー角
と、回転作用素RΘについて更に説明する。ここではオ
イラー角の表現の例としてロール、ピッチ、およびヨー
による表現を説明する。この表現では、基準座標軸に対
して3つの回転を順次行った場合の結果としての座標軸
の姿勢が表現される。まず第1に、x軸の回りの回転と
してヨー(角度ψ)が定義され、その回転の後に更にy
軸の回りの回転としてピッチ(角度θ)が定義され、更
にその後にz軸の回りの回転としてのロール(角度φ)
が定義される。この表現を用いることにより、3次元の
姿勢ΘはΘ=(ψ,θ,φ)と表すことができる。また
前述の回転作用素RΘは、次式によって求められる。
【0156】
【数23】
【0157】従って、制約パラメータ空間Cは、物体モ
デルMの代表点と姿勢パラメータの代表点を用いて、
【0158】
【数24】
【0159】と表現できる。従って制約パラメータ空間
上の投票空間は、2次元配列、
【0160】
【数25】
【0161】で離散的に表現できる。ここで、NM は物
体モデルの代表点の数、Nθは姿勢パラメータの量子化
数である。物体モデルの代表点は物体表面を覆っている
ため2次元、姿勢パラメータは3次元の広がりを持つと
考えられるので、制約パラメータ空間は5次元の広がり
を持つと考えられる。
【0162】従来技術では、投票空間が位置姿勢パラメ
ータ空間6次元をそのまま離散化した6次元配列であっ
たから、本実施例によりメモリ消費量が大幅に削減でき
ていることがわかる。
【0163】観測特徴点ベクトルxj D =(xj D ,y
j D ,zj D )が与えられた時の投票実行部13による
投票は、以下のように行う。観測特徴点ベクトルxj D
と物体モデルMにより作られる位置姿勢パラメータの可
能性集合Cj は、注視点の場合と同様の考え方により、
【0164】
【数26】
【0165】と表現できる。投票実行部13は、制約パ
ラメータ空間Cと、観測特徴点ベクトルxj D による可
能性集合Cj との交わりに投票する。
【0166】交わりの判定は、それぞれの代表点間の距
離と量子化距離を比較することにより行い、量子化距離
より小さい場合に交わっていると判定する。そして、C
j と交わったCの代表点を表す2次元座標(i,k)に
対して、 H(i,k):=H(i,k) +1 (32) とすることにより投票を行う。
【0167】パラメータ推定部14は、投票実行部13
により全ての観測特徴点に対する投票が完了した後に、
制約パラメータ空間の代表点のうち投票数の最も多いも
のを選択し、この位置姿勢をパラメータの推定値とす
る。
【0168】第3の実施例における制約パラメータ空間
および投票空間の次元数と、メモリ容量の削減について
更に説明する。例えば前述の第1の実施例では元々のパ
ラメータ空間が位置2次元、姿勢1次元の合計3次元、
制約パラメータ空間が物体モデルの自由度1次元、姿勢
の自由度1次元の計2次元であった。
【0169】これに対して第3の実施例では、元々のパ
ラメータ空間は位置3次元、姿勢3次元の合計6次元と
なっている。これは環境が2次元から3次元になったた
めである。制約パラメータ空間のCの式は、第1の実施
例における(6)式と類似した式となっているが、イン
デックスとしてのiとkの次元数が第1の実施例とは異
なってくる。
【0170】iは物体モデルの代表点を示すインデック
スであり、第3の実施例では代表点は物体表面を覆う点
を示し、インデックスiは本来2次元のインデックスを
1つの数で代用したものと考えられる。またkは姿勢の
代表点のインデックスであり、オイラー角が3つの数で
表現されることから、インデックスkは元々3次元のイ
ンデックスを1つの数で代用したものと考えられる。従
って制約パラメータ空間は、第3の実施例では5次元と
なる。
【0171】一方投票空間の次元数と制約パラメータ空
間の次元数とは同じであり、第3の実施例における投票
空間は5次元となる。前述の説明では投票空間はH
(i,k)と表現され、2次元配列のように見えるが、
前述のようにiが2次元、kが3次元のインデックスと
考えれらるために、H(i,k)で示した投票空間も5
次元となる。
【0172】このように第3の実施例では元々のパラメ
ータ空間が6次元であるのに対して、投票空間は5次元
となり、1次元分のメモリ容量の削減が実現される。1
次元あたりの量子化数は 100〜1000程度であるために、
メモリ容量を1/100 〜1/1000に削減することが可能
となり、これは認識装置の実用化の可否を左右する重要
な進歩と考えられる。
【0173】最後に本発明の第4の実施例について説明
する。第4の実施例では、第3の実施例におけると同様
に、3次元物体が含まれる環境から指定された物体Kの
位置姿勢パラメータの推定が行われるが、物体の表面法
線が形状情報として用いられる点が異なっている。
【0174】図25は第4の実施例における認識装置の
構成を示すブロック図である。第3の実施例に対応する
図22と比較すると、物体モデル保持部11が、物体モ
デルとしての形状情報として、物体の表面法線の6次元
位置姿勢を保持し、また観測特徴点が環境中の(物体
の)表面法線の6次元位置姿勢を表す点が異なってい
る。
【0175】すなわち第4の実施例においては物体の表
面法線が形状情報として用いられるが、この表面法線と
は物体表面上の点から出発し、その表面に垂直な法線を
意味する。物体モデルは物体の表面をある密度で覆うよ
うな表面法線の集合で表される。定量的には表面法線の
出発点の位置座標3次元と、法線の姿勢3次元の合計6
次元の量として、表面法線が表される。
【0176】第4の実施例の物体モデルは、物体の表面
法線を特徴点としてこの特徴点の集合により表現され
る。これにより、特徴点の量子化精度の範囲内で任意の
形状の物体をモデル化することができる。物体Kの物体
モデルMは、物体KのNM 個の表面法線のそれぞれの位
置姿勢を示す、物体モデル座標系における3次元位置座
標、およびオイラー角などの3次元姿勢座標、すなわち
【0177】
【数27】
【0178】で表現できる。物体Kの位置姿勢パラメー
タは、物体Kの物体モデル座標系から環境中に仮想的に
設定した作業座標系への座標変換パラメータであり、位
置3次元と姿勢3次元、すなわち (X,Y,Z,Θ) (34) により表現される。Θは、物体Kの姿勢を表し、例えば
オイラー角を用いるなどして3次元の成分を持つ。
【0179】第4の実施例の認識装置の目的は、環境中
に配置された物体Kの位置姿勢パラメータを推定するこ
とにある。さらに詳しくは、注視点として環境から得ら
れた表面法線のうちの1つを指定されたとして、この注
視点を表面法線の一部として含む物体Kの位置姿勢パラ
メータを推定する。
【0180】観測特徴点は、環境をレンジファインダあ
るいはステレオ視を行うことにより観測し、距離画像を
取得することにより得られる物体表面法線のこととす
る。この場合、観測特徴点は、位置(3次元)および姿
勢(3次元)により表現され、ND 個の観測特徴点は、
環境上に設定される作業座標系における6次元位置姿勢
座標により、
【0181】
【数28】
【0182】と表現できる。注視点ベクトルxA の環境
上に設定される作業座標系における位置姿勢を、
(xA ,yA ,zA ,ΘA )とする。
【0183】制約パラメータ空間保持部12は、初期化
時に、物体モデルと注視点から制約パラメータ空間Cを
生成する。制約パラメータ空間Cは、注視点を表面法線
として含む、形状が物体Kである物体の位置姿勢パラメ
ータの集合である。物体モデルの代表点(ベクトル
M ,ΘM )、注視点(ベクトルxA ,ΘA )、制約パ
ラメータ空間Cの代表点(ベクトルxC ,ΘC )=(x
C ,yC ,zC ,ΘC )の間の関係は、座標変換の式か
ら、回転作用素RΘを用いて、
【0184】
【数29】
【0185】と表すことができる。従って、制約パラメ
ータ空間Cは、物体モデルMの自由度2次元と、姿勢パ
ラメータの自由度1次元の合計3次元の広がりを持ち、
投票空間は、3次元配列で離散的に表現できる。
【0186】従来技術では、投票空間が位置姿勢パラメ
ータ空間6次元をそのまま離散化した6次元配列であっ
たから、本実施例によりメモリ消費量が大幅に削減でき
ていることがわかる。
【0187】投票実行部13による投票、パラメータ推
定部14によるパラメータの推定は、第1〜第3の実施
例と同様にして行うことができる。この第4の実施例で
は注視点、すなわち注視表面法線は位置と姿勢の情報を
持つ。この注視点に対して物体の代表点の1つを対応さ
せる場合を考えると、図26に示すように物体の自由度
は注視法線を中心とする回転の自由度1つを持つことに
なる。一方物体表面上の代表点は物体の表面に存在する
ために、2つの自由度を持つ。従って制約パラメータ空
間の自由度は合計3つとなり、また投票空間の自由度も
同様に3次元となる。
【0188】
【発明の効果】以上詳細に説明したように、本発明によ
れば雑音や隠蔽などによって認識したい物体の観測特徴
点の情報が欠落していたり、余計なにせの情報が混入し
ている場合でも、環境記述パラメータを正しく推定する
ことができ、また従来の方法に比較してパラメータ空間
の表現に必要なメモリの消費量を著しく削減することが
可能となる。従って、不確実性の高い環境に対しても実
用的なメモリ消費量で動作することができる頑健な認識
システムを構築することができ、対象認識技術の向上に
寄与するところが大きい。
【図面の簡単な説明】
【図1】本発明の認識装置の原理構成を示すブロック図
である。
【図2】本発明の頑健な認識装置の基本構成を示すブロ
ック図である。
【図3】図2の認識装置における環境記述パラメータの
推定方法のフローチャートである。
【図4】本発明を実現するためのコンピュータシステム
の構成を示すブロック図である。
【図5】制約パラメータ空間上の投票空間としての配列
を説明する図である。
【図6】第1の実施例における認識装置の構成を示すブ
ロック図である。
【図7】物体モデルの代表点の例を示す図である。
【図8】2次元図形の位置姿勢パラメータを説明する図
である。
【図9】制約パラメータ空間生成処理のフローチャート
である。
【図10】投票処理の詳細フローチャートである。
【図11】注視点によって制約される以前のパラメータ
空間を示す図である。
【図12】制約パラメータ空間の概念を示す図である。
【図13】制約パラメータ空間上の投票空間を示す図で
ある。
【図14】投票対象空間としてのメッシュの位置の決定
法を説明する図。
【図15】2次元投票空間への投票の説明図である。
【図16】従来における投票空間を示す図である。
【図17】第2の実施例における認識装置の構成を示す
ブロック図である。
【図18】物体モデルとしての輪郭法線を示す図であ
る。
【図19】輪郭法線の定量的な表現法を説明する図であ
る。
【図20】第1の実施例における注視点を中心とする物
体の回転の説明図である。
【図21】第2の実施例における注視点と物体との対応
を説明する図である。
【図22】第3の実施例における認識装置の構成を示す
ブロック図である。
【図23】レンジファインダによる特徴点の観測法の説
明図である。
【図24】ステレオ視による特徴点の観測法の説明図で
ある。
【図25】第4の実施例における認識装置の構成を示す
ブロック図である。
【図26】第4の実施例における注視法線を中心とする
物体の回転を説明する図である。
【図27】頑健な認識装置の従来例の構成を示すブロッ
ク図である。
【図28】図27の認識装置におけるパラメータ推定法
のフローチャートである。
【図29】複数の2次元図形が含まれている文書の例を
示す図である。
【図30】物体モデルの例を示す図である。
【図31】文書の観測によって得られた特徴点の例を示
す図である。
【図32】図31のハートマークの重心の推定法を説明
する図である。
【符号の説明】
1 制約パラメータ空間保持手段 2 投票実行手段 3 パラメータ推定手段 11 物体モデル保持部 12 制約パラメータ空間保持部 13 投票実行部 14 パラメータ推定部 15 中央処理装置(CPU) 16 ランダムアクセスメモリ(RAM) 17 リードオンリメモリ(ROM) 18 フレームメモリ(FRAM) 19 ビデオランダムアクセスメモリ(VRAM)
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/70 360

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 環境の観測によって得られた特徴点の集
    合と、 該環境中に存在すると予想される物体の形状情報を示す
    物体モデルとを用いて、環境を記述するパラメータを推
    定する認識装置において、 該物体モデルとしての形状情報に対応する情報であっ
    て、あらかじめ与えられている注視点情報によって制約
    されるとともに、該物体モデルに基づいて作成される、
    前記パラメータの空間としての制約パラメータ空間を保
    持する制約パラメータ空間保持手段と、 該制約パラメータ空間内で前記特徴点のそれぞれに対し
    て前記物体モデルと整合性を有する部分パラメータ集合
    に対して投票を行う投票実行手段と、 該特徴点の全てに対する投票の終了後に、該制約パラメ
    ータ空間上の投票空間に対してなされた投票結果に応じ
    て、環境を記述するパラメータの推定値を出力するパラ
    メータ推定手段とを備えたことを特徴とする注視点を用
    いた頑健な認識装置。
  2. 【請求項2】 前記物体モデルとしての形状情報を保持
    し、該形状情報を前記制約パラメータ空間保持手段と投
    票実行手段とに出力する物体モデル保持手段を更に備え
    たことを特徴とする請求項1記載の注視点を用いた頑健
    な認識装置。
  3. 【請求項3】 前記物体モデルとしての形状情報が2次
    元物体の輪郭点の位置座標の集合であることと、前記注
    視点情報が該輪郭点のうちの任意の1つの位置座標を示
    すことを特徴とする請求項1、または2記載の注視点を
    用いた頑健な認識装置。
  4. 【請求項4】 前記物体モデルとしての形状情報が2次
    元物体の輪郭法線の位置姿勢の集合であることと、前記
    注視点情報が該輪郭法線のうちの任意の1つの位置姿勢
    を示すことを特徴とする請求項1、または2記載の注視
    点を用いた頑健な認識装置。
  5. 【請求項5】 前記物体モデルとしての形状情報が3次
    元物体の表面上の点の位置座標の集合であることと、前
    記注視点情報が該表面上の点のうちの任意の1つの位置
    座標を示すことを特徴とする請求項1、または2記載の
    注視点を用いた頑健な認識装置。
  6. 【請求項6】 前記物体モデルとしての形状情報が3次
    元物体の表面上の法線の位置姿勢の集合であることと、
    前記注視点情報が該表面上の法線のうちの任意の1つの
    位置姿勢を示すことを特徴とする請求項1、または2記
    載の注視点を用いた頑健な認識装置。
  7. 【請求項7】 前記パラメータ推定手段が出力するパラ
    メータ推定値が、前記物体の重心の位置座標の推定値で
    あることを特徴とする請求項1、または2記載の注視点
    を用いた頑健な認識装置。
  8. 【請求項8】 前記パラメータ推定手段が出力するパラ
    メータ推定値が、前記物体に対する物体モデル座標系か
    ら前記環境中に設定される作業座標系への変換パラメー
    タとしての、該物体の位置姿勢の推定値であることを特
    徴とする請求項1、または2記載の注視点を用いた頑健
    な認識装置。
  9. 【請求項9】 環境の観測によって得られた特徴点の集
    合と、該環境中に存在すると予想される物体の形状情報
    を示す物体モデルとを用いて、環境を記述するパラメー
    タを推定する機能をコンピュータに実行させるための記
    憶媒体であって、 該物体モデルとしての形状情報に対応する情報であっ
    て、あらかじめ与えられている注視点情報によって制約
    されるとともに、該物体モデルに基づいて作成される、
    前記パラメータの空間としての制約パラメータ空間と、 該制約パラメータ空間上の空間であって、前記特徴点の
    それぞれに対して前記物体モデルと整合性を有する部分
    パラメータ集合に対して投票が行われる投票空間とを保
    持し、 該特徴点の全てに対する投票の終了後に、該制約パラメ
    ータ空間に対してなされた投票結果に応じて、環境を記
    述するパラメータの推定値の出力を実現させることを特
    徴とする記憶媒体。
  10. 【請求項10】 環境の観測によって得られた特徴点の
    集合と、 該環境中に存在すると予想される物体の形状情報を示す
    物体モデルとを用いて、環境を記述するパラメータを推
    定する認識方法において、 該物体モデルとしての形状情報に対応する情報であっ
    て、あらかじめ与えられている注視点情報によって制約
    されるとともに、該物体モデルに基づいて作成される、
    前記パラメータ空間としての制約パラメータ空間を保持
    し、 該制約パラメータ空間内で前記特徴点のそれぞれに対し
    て前記物体モデルと整合性を有する部分パラメータ集合
    に対して投票を行い、 該特徴点の全てに対する投票の終了後に、該制約パラメ
    ータ空間上の投票空間に対してなされた投票結果に応じ
    て、環境を記述するパラメータの推定値を出力すること
    を特徴とする注視点を用いた頑健な認識方法。
JP04341996A 1996-02-29 1996-02-29 注視点を用いた頑健な認識装置 Expired - Fee Related JP3764773B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP04341996A JP3764773B2 (ja) 1996-02-29 1996-02-29 注視点を用いた頑健な認識装置
US08/758,310 US5864779A (en) 1996-02-29 1996-12-03 Strict recognizing apparatus using observation point

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04341996A JP3764773B2 (ja) 1996-02-29 1996-02-29 注視点を用いた頑健な認識装置

Publications (2)

Publication Number Publication Date
JPH09237342A true JPH09237342A (ja) 1997-09-09
JP3764773B2 JP3764773B2 (ja) 2006-04-12

Family

ID=12663195

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04341996A Expired - Fee Related JP3764773B2 (ja) 1996-02-29 1996-02-29 注視点を用いた頑健な認識装置

Country Status (2)

Country Link
US (1) US5864779A (ja)
JP (1) JP3764773B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011238204A (ja) * 2010-05-07 2011-11-24 Mvtec Software Gmbh 3次元シーンにおける3次元物体の認識及び位置姿勢決定方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7016539B1 (en) 1998-07-13 2006-03-21 Cognex Corporation Method for fast, robust, multi-dimensional pattern recognition
US7013035B2 (en) * 1998-09-25 2006-03-14 Canon Kabushiki Kaisha Image processing method for setting an extraction area, and apparatus and recording medium
US6763148B1 (en) 2000-11-13 2004-07-13 Visual Key, Inc. Image recognition methods
US6826311B2 (en) * 2001-01-04 2004-11-30 Microsoft Corporation Hough transform supporting methods and arrangements
US7308131B2 (en) * 2002-12-03 2007-12-11 Ntt Docomo, Inc. Representation and coding of panoramic and omnidirectional images
US7190834B2 (en) * 2003-07-22 2007-03-13 Cognex Technology And Investment Corporation Methods for finding and characterizing a deformed pattern in an image
US8081820B2 (en) 2003-07-22 2011-12-20 Cognex Technology And Investment Corporation Method for partitioning a pattern into optimized sub-patterns
US8437502B1 (en) 2004-09-25 2013-05-07 Cognex Technology And Investment Corporation General pose refinement and tracking tool
US7545307B2 (en) * 2005-12-15 2009-06-09 Raytheon Company Target recognition system and method with unknown target rejection
US8103085B1 (en) 2007-09-25 2012-01-24 Cognex Corporation System and method for detecting flaws in objects using machine vision
JP5526942B2 (ja) * 2010-03-31 2014-06-18 ソニー株式会社 ロボット装置、ロボット装置の制御方法およびプログラム
US9679224B2 (en) 2013-06-28 2017-06-13 Cognex Corporation Semi-supervised method for training multiple pattern recognition and registration tool models
US9868212B1 (en) * 2016-02-18 2018-01-16 X Development Llc Methods and apparatus for determining the pose of an object based on point cloud data
WO2019232782A1 (zh) * 2018-06-08 2019-12-12 深圳蓝胖子机器人有限公司 一种物体特征的识别方法、视觉识别装置及机器人

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2885823B2 (ja) * 1989-04-11 1999-04-26 株式会社豊田中央研究所 視覚認識装置
JPH03125585A (ja) * 1989-10-11 1991-05-28 Mitsubishi Electric Corp 画像信号の符号復号化器
JPH0467275A (ja) * 1990-07-06 1992-03-03 Matsushita Electric Ind Co Ltd 認識方法及び認識装置
EP0514688A2 (en) * 1991-05-21 1992-11-25 International Business Machines Corporation Generalized shape autocorrelation for shape acquisition and recognition
JP2873338B2 (ja) * 1991-09-17 1999-03-24 富士通株式会社 動物体認識装置
JP2626528B2 (ja) * 1993-11-22 1997-07-02 日本電気株式会社 図形認識装置
US5638465A (en) * 1994-06-14 1997-06-10 Nippon Telegraph And Telephone Corporation Image inspection/recognition method, method of generating reference data for use therein, and apparatuses therefor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011238204A (ja) * 2010-05-07 2011-11-24 Mvtec Software Gmbh 3次元シーンにおける3次元物体の認識及び位置姿勢決定方法

Also Published As

Publication number Publication date
US5864779A (en) 1999-01-26
JP3764773B2 (ja) 2006-04-12

Similar Documents

Publication Publication Date Title
JP6681729B2 (ja) オブジェクトの3d姿勢およびオブジェクトのランドマーク点の3dロケーションを求める方法、およびオブジェクトの3d姿勢およびオブジェクトのランドマークの3dロケーションを求めるシステム
US9087232B2 (en) 3D object recognition
CN109859305B (zh) 基于多角度二维人脸的三维人脸建模、识别方法及装置
CN103984362B (zh) 位置和姿势测量装置、信息处理装置以及信息处理方法
CN111178250A (zh) 物体识别定位方法、装置及终端设备
JP4691158B2 (ja) 三次元クラスモデルを用いた二次元画像における認識システムおよび方法
US8280150B2 (en) Method and apparatus for determining similarity between surfaces
JP5759161B2 (ja) 物体認識装置、物体認識方法、学習装置、学習方法、プログラム、および情報処理システム
JP3764773B2 (ja) 注視点を用いた頑健な認識装置
JP5251080B2 (ja) 物体認識方法
JP4321350B2 (ja) パラメタ推定方法、パラメタ推定装置および照合方法
Mokhtarian et al. Multi-scale free-form 3D object recognition using 3D models
CN111598946B (zh) 一种物***姿测量方法、装置及存储介质
CN107077735A (zh) 三维对象识别
JP6483832B2 (ja) Rgb−dセンサを使用して物体を走査する方法とシステム
EP3420532B1 (en) Systems and methods for estimating pose of textureless objects
JP6487642B2 (ja) 手指形状の検出方法、そのプログラム、そのプログラムの記憶媒体、及び、手指の形状を検出するシステム。
JP2018091656A (ja) 情報処理装置、計測装置、システム、算出方法、プログラムおよび物品の製造方法
Kroemer et al. Point cloud completion using extrusions
CN111127556A (zh) 基于3d视觉的目标物体识别和位姿估算方法以及装置
JP5762099B2 (ja) 姿勢認識装置、作業ロボット、姿勢認識方法、プログラム及び記録媒体
JP2019211981A (ja) 情報処理装置、情報処理装置の制御方法およびプログラム
WO2007134172A2 (en) Characterization and classification of pose in low dimension
CN116921932A (zh) 焊接轨迹识别方法、装置、设备及存储介质
JP2001143072A (ja) 物体形状識別装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060123

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100127

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110127

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110127

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120127

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130127

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees