JP5728159B2 - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP5728159B2
JP5728159B2 JP2010021368A JP2010021368A JP5728159B2 JP 5728159 B2 JP5728159 B2 JP 5728159B2 JP 2010021368 A JP2010021368 A JP 2010021368A JP 2010021368 A JP2010021368 A JP 2010021368A JP 5728159 B2 JP5728159 B2 JP 5728159B2
Authority
JP
Japan
Prior art keywords
procedure
environment map
real space
image
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010021368A
Other languages
English (en)
Other versions
JP2011159162A5 (ja
JP2011159162A (ja
Inventor
周藤 泰広
泰広 周藤
福地 正樹
正樹 福地
堅一郎 多井
堅一郎 多井
晶晶 郭
晶晶 郭
松田 晃一
晃一 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2010021368A priority Critical patent/JP5728159B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to US12/984,847 priority patent/US8896628B2/en
Priority to CN2011100314217A priority patent/CN102141885B/zh
Publication of JP2011159162A publication Critical patent/JP2011159162A/ja
Publication of JP2011159162A5 publication Critical patent/JP2011159162A5/ja
Priority to US14/527,148 priority patent/US9183678B2/en
Publication of JP5728159B2 publication Critical patent/JP5728159B2/ja
Application granted granted Critical
Priority to US14/869,063 priority patent/US9754418B2/en
Priority to US14/991,477 priority patent/US9805513B2/en
Priority to US15/713,801 priority patent/US10037628B2/en
Priority to US16/026,763 priority patent/US10223837B2/en
Priority to US16/263,524 priority patent/US10515488B2/en
Priority to US16/668,862 priority patent/US10810803B2/en
Priority to US17/069,389 priority patent/US11189105B2/en
Priority to US17/529,605 priority patent/US11651574B2/en
Priority to US18/133,252 priority patent/US12002173B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/01Head-up displays
    • G02B27/017Head mounted
    • G02B27/0172Head mounted characterised by optical features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/003Navigation within 3D models or images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/01Head-up displays
    • G02B27/0101Head-up displays characterised by optical features
    • G02B2027/014Head-up displays characterised by optical features comprising information/image processing systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/61Scene description

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Computer Graphics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Optics & Photonics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Geometry (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は、画像処理装置、画像処理方法及びプログラムに関する。
近年、実空間を撮影して得られる画像を加工した上でユーザに呈示する拡張現実(AR:Augmented Reality)と呼ばれる技術が注目されている。AR技術では、例えば、入力画像に映った実空間内の物体に関連する有用な情報が画像内に挿入され、出力画像として出力される。即ち、AR技術では、典型的には、ユーザに呈示される画像の多くの部分は実空間を映したものであり、画像の一部分が目的に応じて加工され得る。このような特徴は、出力画像の全体(又は大部分)がCG(Computer Graphics)により構成される仮想現実(Virtual Reality)とは対照的である。AR技術を用いることで、例えば、出力画像を基にしたユーザによる実空間の状況把握の容易化や作業支援などの利点が提供され得る。
AR技術において、真に有用な情報をユーザに呈示するためには、コンピュータが実空間の状況を的確に把握することが重要である。そのため、AR技術の基盤となる実空間の状況の把握を目的とした技術の開発も進められている。例えば、下記特許文献1には、カメラの位置や姿勢とカメラの画像に映る特徴点の位置とを同時に推定可能なSLAM(Simultaneous Localization And Mapping)とよばれる技術を応用して、実空間内に存在する物体の3次元位置を表現する環境マップを動的に生成する手法が記載されている。なお、単眼カメラを用いたSLAM技術の基本的な原理は、下記非特許文献1において説明されている。
ところで、高度な情報処理を行うことのできる情報端末が広く普及した現在において、ユーザは、情報端末を様々な情報の閲覧のために利用している。その情報の一例は、説明書(directions)である。例えば、電子機器の説明書のみならず、テーブルマナー、料理の手順、家電の操作若しくは修理方法など、実空間内で遂行すべき作業の手順を記述した様々な情報が電子化され、Webページ又はその他のアプリケーションを介してユーザに提供されている。
特開2008−304268号公報
Andrew J.Davison, "Real-Time Simultaneous Localization and Mapping with a Single Camera", Proceedings of the 9th IEEE International Conference on Computer Vision Volume 2, 2003, pp.1403-1410
しかしながら、従来の電子化された説明書は、一般的に、紙の説明書と同様、2次元の画面上に表示されることを前提として記述されている。そのため、3次元の実空間内での作業位置に関する情報の一部が欠落することにより、作業の手順を直感的に理解することがユーザにとって困難となる場合が少なくない。特に、ユーザを取り巻く環境が動的に変化し得る実空間内での作業については、予めその環境を説明書に記述しておくことができないことから、説明書の理解は一層の困難を伴っていた。
これに対して、ユーザを取り巻く環境を3次元的に表現する環境マップを動的に構築し、その環境マップと関連付けられる位置に作業の各手順に関する説明を表示することができれば、作業手順の理解がユーザにとって直感的かつ容易になるものと期待される。
そこで、本発明は、環境マップを応用し、実空間内で遂行すべき作業手順の直感的かつ容易な理解を可能とする、新規かつ改良された画像処理装置、画像処理方法及びプログラムを提供しようとするものである。
る実施形態によれば、撮像装置を用いて実空間を撮影することにより得られる入力画像を取得する画像取得部と、上記実空間内で遂行すべき作業の一連の手順について、各手順に関する説明と当該説明を表示すべき位置を指定する位置情報とを対応付けて定義する手順データを取得する制御部と、上記制御部により取得される上記手順データを用いて、上記一連の手順に含まれる各手順に関する説明を、上記実空間内に存在する物体の位置を表現する環境マップ及び上記位置情報に基づいて決定される上記入力画像内の位置に重畳することにより、出力画像を生成する重畳部と、を備える画像処理装置が提供される。
かかる構成によれば、手順データによる定義に従って、実空間内で遂行すべき作業の一連の手順に含まれる各手順に関する説明が、実空間内に存在する物体の位置を3次元的に表現する環境マップに基づいて決定される入力画像内の位置に重畳される。
また、上記位置情報は、各手順に関する説明と関連する物体を特定することにより、上記説明を表示すべき上記環境マップ内での位置を指定してもよい。
また、上記手順データは、各手順に関する説明と各説明の表示を進行させるための条件とをさらに対応付けて定義してもよい。
また、各説明の表示を進行させるための上記条件は、環境マップにより表現される物体の位置又は姿勢に応じた条件を含んでもよい。
また、上記制御部は、上記一連の手順に含まれる各手順に関する説明の表示を上記手順データに従って制御してもよい。
また、各手順に関する説明が重畳される上記入力画像内の位置は、上記撮像装置の上記実空間内の位置に応じて決定されてもよい。
また、別の実施形態によれば、像処理装置により実行される画像処理方法であって、撮像装置を用いて実空間を撮影した入力画像を取得するステップと、上記実空間内で遂行すべき作業の一連の手順について、各手順に関する説明と当該説明を表示すべき位置を指定する位置情報とを対応付けて定義する手順データを取得するステップと、取得された上記手順データを用いて、上記一連の手順に含まれる各手順に関する説明を、上記実空間内に存在する物体の位置を表現する環境マップ及び上記位置情報に基づいて決定される上記入力画像内の位置に重畳することにより、出力画像を生成するステップと、を含む画像処理方法が提供される。
また、別の実施形態によれば、画像処理装置を制御するコンピュータを、撮像装置を用いて実空間を撮影することにより得られる入力画像を取得する画像取得部と、上記実空間内で遂行すべき作業の一連の手順について、各手順に関する説明と当該説明を表示すべき位置を指定する位置情報とを対応付けて定義する手順データを取得する制御部と、上記制御部により取得される上記手順データを用いて、上記一連の手順に含まれる各手順に関する説明を、上記実空間内に存在する物体の位置を表現する環境マップ及び上記位置情報に基づいて決定される上記入力画像内の位置に重畳することにより、出力画像を生成する重畳部と、として機能させるための、プログラムが提供される。
以上説明したように、本発明に係る画像処理装置、画像処理方法及びプログラムによれば、環境マップを応用し、実空間内で遂行すべき作業手順の直感的かつ容易な理解を可能とすることができる。
一実施形態に係る画像処理装置が使用され得る実環境の第1の例を示す模式図である。 一実施形態に係る画像処理装置が使用され得る実環境の第2の例を示す模式図である。 一実施形態に係る画像処理装置について説明するための第1の説明図である。 一実施形態に係る画像処理装置について説明するための第2の説明図である。 図1Aに示した実環境において取得され得る入力画像の一例を示す説明図である。 図1Bに示した実環境において取得され得る入力画像の一例を示す説明図である。 一実施形態に係る画像処理装置の構成の一例を示すブロック図である。 一実施形態に係る自己位置検出処理の流れの一例を示すフローチャートである。 オブジェクト上に設定される特徴点について説明するための説明図である。 特徴点の追加について説明するための説明図である。 予測モデルの一例について説明するための説明図である。 特徴データの構成の一例について説明するための説明図である。 一実施形態に係るオブジェクト認識処理の流れの一例を示すフローチャートである。 一実施形態において取得され得る手順データの一例を説明するための説明図である。 一実施形態に係る手順制御処理の流れの一例を示すフローチャートである。 一実施形態に係る手順表示処理の流れの一例を示すフローチャートである。 一実施形態に係る画像処理装置により出力される出力画像の第1の例を示す説明図である。 一実施形態に係る画像処理装置により出力される出力画像の第2の例を示す説明図である。 汎用コンピュータのハードウェア構成の一例を示すブロック図である。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付すことにより重複説明を省略する。
また、以下の順序にしたがって当該「発明を実施するための形態」を説明する。
1.画像処理装置の概要
2.一実施形態に係る画像処理装置の構成
2−1.撮像部
2−2.環境マップ生成部
2−3.出力画像生成部
2−4.出力画像の例
3.ハードウェア構成の例
4.まとめ
<1.画像処理装置の概要>
まず、図1A〜図3Bを用いて、本発明の一実施形態に係る画像処理装置の概要を説明する。図1A及び図1Bは、本発明の一実施形態に係る画像処理装置100が使用され得る一例としての環境1a及び1bをそれぞれ示している。
図1Aを参照すると、環境1aの内部には、シンク11、まな板12、ボウル13、コンロ14、レンジ15、及びその他の物体が存在している。即ち、環境1aは、ユーザが料理を行う実空間であるキッチンに相当する環境である。一方、図1Bを参照すると、環境1bの内部には、テーブル16、イス17、皿18、グラス19及び20、並びにその他の物体が存在している。即ち、環境1bは、ユーザが食事をする実空間であるダイニング(又はレストランの客席)に相当する環境である。
図2A及び図2Bは、上述したような一例としての環境1a又は1bの内部において使用され得る画像処理装置100について説明するための説明図である。
図2Aを参照すると、ユーザにそれぞれ装着される本体101a、撮像装置102a及び表示装置104aを含む画像処理装置100aが示されている。本体101aは、後に詳しく説明する画像処理装置100による画像処理を実行するCPU(Central Processing Unit)及び記憶媒体等をその内部に有する。撮像装置102aは、ユーザの視線と同等の方向を向くようにユーザの頭部に装着され、環境1a又は1bの内部を撮影して一連の入力画像を生成する。画像処理装置100aは、撮像装置102aにより生成される一連の入力画像を入力として画像処理を実行することにより、一連の出力画像を生成する。そして、画像処理装置100aにより生成される出力画像は、表示装置104aにより表示される。表示装置104aは、ユーザの頭部に装着されるヘッドマウントディスプレイである。表示装置104aは、例えば、シースルー型のディスプレイであってもよい。
図2Bを参照すると、ユーザに把持される携帯電話端末である画像処理装置100bが示されている。画像処理装置100bは、例えば、撮像装置付きの携帯電話端末であって、撮像装置(例えば表示装置104bの背面に設けられる)及び表示装置104bを含む。画像処理装置100bは、後に詳しく説明する画像処理装置100による画像処理を実行するCPU及び記憶媒体等をその内部に有する。
なお、本明細書において、画像処理装置100a及び100bを互いに区別する必要がない場合には、符号の末尾のアルファベットを省略することにより、画像処理装置100a及び100bを画像処理装置100と総称する。また、撮像装置102a及び102b(撮像装置102)、表示装置104a及び104b(表示装置104)並びにその他の要素についても同様とする。
図3A及び図3Bは、撮像装置102が環境1a及び1bを撮影することにより取得される一例としての入力画像106a及び106bをそれぞれを示す説明図である。
図3Aを参照すると、入力画像106aには、まな板12、コンロ14、包丁21、調味料入れ22及び他の物体が映っている。入力画像106aは、環境1aにおいて料理をするユーザの視覚に映るイメージと同等の画像である。画像処理装置100は、例えば、撮像装置102を用いてこのような入力画像106aを含む一連の入力画像を取得し、料理の手順に関する説明を各入力画像に重畳する。
図3Bを参照すると、入力画像106bには、テーブル16、皿18、グラス19及び20、ナイフ23、フォーク24、ナプキン25並びに他の物体が映っている。入力画像106bは、環境1bにおいて食事をするユーザの視覚に映るイメージと同等の画像である。画像処理装置100は、例えば、撮像装置102を用いてこのような入力画像106bを含む一連の入力画像を取得し、食事の際のテーブルマナーに関する説明を各入力画像に重畳する。
このような画像処理装置100の構成の一例について、次節より具体的に説明する。
<2.一実施形態に係る画像処理装置の構成>
図4は、本発明の一実施形態に係る画像処理装置100の構成の一例を示すブロック図である。図4を参照すると、画像処理装置100は、撮像部102、環境マップ生成部110、及び出力画像生成部180を備える。
[2−1.撮像部]
撮像部102は、例えば、CCD(Charge Coupled Device)又はCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子を有する撮像装置として実現され得る。撮像部102は、画像処理装置100の外部に設けられてもよい。撮像部102は、環境1a又は環境1bなどの実空間を撮影することにより取得した画像を、入力画像として環境マップ生成部110及び出力画像生成部180へ出力する。
[2−2.環境マップ生成部]
環境マップ生成部110は、撮像部102から入力される入力画像、及びデータ記憶部130により記憶されている後述するオブジェクトの特徴データに基づいて、実空間内に存在する1つ以上の物体の位置等を表現する環境マップを生成する。図4に示しているように、本実施形態において、環境マップ生成部110は、自己位置検出部120、データ記憶部130、画像認識部140、環境マップ構築部150、及び環境マップ記憶部152を含む。
(1)自己位置検出部
自己位置検出部120は、撮像部102から入力される入力画像、及びデータ記憶部130により記憶されている特徴データに基づいて、入力画像を映した撮像装置の位置を動的に検出する。例えば、自己位置検出部120は、上記非特許文献1に記載されているSLAM技術を応用することにより、撮像装置が単眼カメラを有する場合にも、当該カメラの位置及び姿勢、並びにカメラの撮像面における特徴点の位置を、フレームごとに動的に決定することができる。
まず、図5を用いて、自己位置検出部120によるSLAM技術を応用した自己位置検出処理の全体的な流れについて説明する。次に、図6〜図8を用いて、自己位置検出処理の詳細を説明する。
図5は、自己位置検出部120によるSLAM技術を応用した自己位置検出処理の流れの一例を示すフローチャートである。図5において、自己位置検出処理が開始すると、自己位置検出部120は、まず、状態変数を初期化する(ステップS102)。本実施形態において、状態変数とは、カメラの位置及び姿勢(回転角)、当該カメラの移動速度及び角速度、並びに1つ以上の特徴点の位置を要素として含むベクトルである。そして、自己位置検出部120は、撮像部102から入力画像を順次取得する(ステップS112)。ステップ112からステップS118までの処理は、各入力画像について(即ち毎フレーム)繰り返され得る。
ステップS114では、自己位置検出部120は、入力画像に映る特徴点を追跡する。例えば、自己位置検出部120は、データ記憶部130により予め記憶されている特徴点ごとのパッチ(例えば特徴点を中心とする3×3=9画素の小画像)を入力画像から検出する。ここで検出されたパッチの位置、即ち特徴点の位置は、後の状態変数の更新の際に用いられる。
ステップS116では、自己位置検出部120は、所定の予測モデルに基づいて、例えば1フレーム後の状態変数の予測値を生成する。また、ステップS118では、自己位置検出部120は、ステップS116において生成した状態変数の予測値と、ステップS114において検出した特徴点の位置に応じた観測値とを用いて、状態変数を更新する。自己位置検出部120は、ステップS116及びS118における処理を、拡張カルマンフィルタの原理に基づいて実行する。
このような処理の結果として、毎フレーム更新される状態変数の値が出力される。以下、特徴点の追跡(ステップS114)、状態変数の予測(ステップS116)、状態変数の更新(ステップS118)の各処理の内容について、より具体的に説明する。
(1−1)特徴点の追跡
本実施形態において、データ記憶部130は、実空間内に存在し得る物体に対応するオブジェクトの特徴を表す特徴データを予め記憶している。特徴データには、例えば、各オブジェクトの外観の特徴を表す1つ以上の特徴点についての小画像、即ちパッチ(Patch)が含まれる。パッチとは、例えば、特徴点を中心とする3×3=9画素よりなる小画像であってよい。
図6は、オブジェクトの2つの例、並びに各オブジェクト上に設定される特徴点(FP:Feature Point)及びパッチの例を示している。図6の左のオブジェクトは、タンスを表すオブジェクトである(6a参照)。当該オブジェクト上には、特徴点FP1を含む複数の特徴点が設定されている。さらに、特徴点FP1と関連付けて、パッチPth1が定義されている。一方、図6の右のオブジェクトは、カレンダーを表すオブジェクトである(6b参照)。当該オブジェクト上には、特徴点FP2を含む複数の特徴点が設定されている。さらに、特徴点FP2と関連付けて、パッチPth2が定義されている。
自己位置検出部120は、撮像部102から入力画像を取得すると、入力画像に含まれる部分画像と、データ記憶部130に予め記憶されている図6に例示した特徴点ごとのパッチとを照合する。そして、自己位置検出部120は、照合の結果として、入力画像に含まれる特徴点の位置(例えば検出されたパッチの中心画素の位置)を特定する。
なお、特徴点の追跡(図5のステップS114)において、追跡される全ての特徴点に関するデータが予めデータ記憶部130に記憶されていなくてもよい。例えば、図7の例では、時刻T=t−1において、6つの特徴点が入力画像内で検出されている(7a参照)。次に、時刻T=tにおいてカメラの位置又は姿勢が変化すると、時刻T=t−1において入力画像に映っていた6つの特徴点のうち2つのみが入力画像内に映っている。この場合に、自己位置検出部120は、入力画像内で特徴的な画素のパターンを有する位置に新たに特徴点を設定し、その新たな特徴点を後のフレームにおける自己位置検出処理に用いてもよい。例えば、図7の例では、時刻T=tにおいて、4つの新たな特徴点がオブジェクト上に設定されている(7b参照)。かかる点は、SLAM技術の1つの特長であり、それにより、予め全ての特徴点を設定しておくコストを削減できると共に、追加される多数の特徴点を用いて処理の精度を高めることができる。
(1−2)状態変数の予測
本実施形態において、自己位置検出部120は、拡張カルマンフィルタを適用すべき状態変数として、次式に示す状態変数Xを用いる。
Figure 0005728159
式(1)における状態変数Xの第1の要素は、次式の通り、実空間に設定される座標系である世界座標系(x,y,z)でのカメラの3次元位置を表す。
Figure 0005728159
また、状態変数の第2の要素は、カメラの姿勢を表す回転行列に対応する四元数(クォータニオン)を要素として有する4次元ベクトルωである。なお、四元数の変わりにオイラー角を用いてカメラの姿勢が表されてもよい。また、状態変数の第3及び第4の要素は、カメラの移動速度及び角速度をそれぞれ表す。
さらに、状態変数の第5及びそれ以降の要素は、次式の通り、世界座標系での特徴点FP(i=1…N)の3次元位置pをそれぞれ表す。なお、上述したように、特徴点の数Nは、処理の間変化し得る。
Figure 0005728159
自己位置検出部120は、ステップS102において初期化された状態変数Xの値、又は前フレームにおいて更新された状態変数Xの値に基づいて、最新のフレームについての状態変数の予測値を生成する。状態変数の予測値は、次式に示す多次元正規分布に従った拡張カルマンフィルタの状態方程式に従って生成される。
Figure 0005728159
ここで、Fはシステムの状態遷移に関する予測モデル、aは予測条件である。また、wはガウシアンノイズであり、例えばモデル近似誤差や観測誤差等を含み得る。一般的に、ガウシアンノイズwの平均はゼロとなる。
図8は、本実施形態に係る予測モデルの一例について説明するための説明図である。図8を参照すると、本実施形態に係る予測モデルにおける2つの予測条件が示されている。まず、第1の条件として、特徴点の世界座標系における3次元位置は変化しないものとする。即ち、時刻Tにおける特徴点FP1の3次元位置をpとすると、次式の関係が成立する。
Figure 0005728159
次に、第2の条件として、カメラの運動は等速運動であるものとする。即ち、時刻T=t−1から時刻T=tにかけてのカメラの速度及び角速度について、次式の関係が成立する。
Figure 0005728159
このような予測モデル及び式(4)に示した状態方程式に基づいて、自己位置検出部120は、最新のフレームについての状態変数の予測値を生成する。
(1−3)状態変数の更新
そして、自己位置検出部120は、観測方程式を用いて、例えば状態変数の予測値から予測される観測情報と、特徴点の追跡結果として得られる実際の観測情報との誤差を評価する。なお、式(8)におけるνがその誤差である。
Figure 0005728159
ここで、Hは観測モデルを表す。例えば、特徴点FPの撮像面(u−v平面)上の位置を、次式のように定義する。
Figure 0005728159
ここで、カメラの位置x、カメラの姿勢ω、及び特徴点FPの3次元位置pは、いずれも状態変数Xの要素として与えられる。そうすると、ピンホールモデルに従い、特徴点FPの撮像面上の位置は次式を用いて導かれる。
Figure 0005728159
ここで、λは正規化のためのパラメータ、Aはカメラ内部パラメータ、Rωは状態変数Xに含まれるカメラの姿勢を表す四元数ωに対応する回転行列である。カメラ内部パラメータAは、入力画像を撮影する撮像装置の特性に応じて、予め次式のように与えられる。
Figure 0005728159
ここで、fは焦点距離、θは画像軸の直交性(理想値は90°)、kは撮像面の縦軸のスケール(世界座標系から撮像面の座標系へのスケール変化率)、kは撮像面の横軸のスケール、(u,v)は撮像面の中心位置である。
従って、式(11)を用いて導かれる予測される観測情報、即ち各特徴点の撮像面上の位置と、図5のステップS114における特徴点の追跡結果との間の誤差を最小にする状態変数Xを探索することにより、尤もらしい最新の状態変数Xを得ることができる。
Figure 0005728159
自己位置検出部120は、このようにSLAM技術を応用して動的に更新したカメラ(撮像装置)の位置x及び姿勢ωを、環境マップ構築部150及び出力画像生成部180へ出力する。
(2)データ記憶部
データ記憶部130は、ハードディスク又は半導体メモリなどの記憶媒体を用いて、実空間内に存在し得る物体に対応するオブジェクトの特徴を表す特徴データを予め記憶している。図4では、データ記憶部130が環境マップ生成部110の一部である例を示しているが、かかる例に限定されず、データ記憶部130は環境マップ生成部110の外部に設けられてもよい。図9は、特徴データの構成の一例について説明するための説明図である。
図9を参照すると、オブジェクトObj1についての一例としての特徴データFD1が示されている。特徴データFD1は、オブジェクト名称FD11、6方向から撮影した画像データFD12、パッチデータDF13、3次元形状データFD14、及びオントロジーデータFD15を含む。
オブジェクト名称FD11は、“コーヒーカップA”など、対応するオブジェクトを特定することのできる名称である。
画像データFD12は、例えば、対応するオブジェクトを前・後・左・右・上・下の6方向からそれぞれ撮影した6つの画像データを含む。パッチデータFD13は、各オブジェクト上に設定される1つ以上の特徴点ごとの、各特徴点を中心とする小画像の集合である。画像データFD12及びパッチデータFD13は、後述する画像認識部140によるオブジェクト認識処理のために使用され得る。また、パッチデータFD13は、前述した自己位置検出部120による自己位置検出処理のために使用され得る。
3次元形状データFD14は、対応するオブジェクトの形状を認識するためのポリゴン情報、及び特徴点の3次元的な位置情報を含む。3次元形状データFD14は、後述する環境マップ構築部150による環境マップ構築処理のために使用され得る。
オントロジーデータFD15は、例えば、環境マップ構築部150による環境マップ構築処理を支援するために使用され得るデータである。図9の例では、オントロジーデータFD15は、コーヒーカップであるオブジェクトObj1が、机又は食器洗い機に対応するオブジェクトに接する可能性が高いこと、及び本棚に対応するオブジェクトに接する可能性が低いことを表している。
(3)画像認識部
画像認識部140は、データ記憶部130により記憶されている上述した特徴データを用いて、入力画像に映っている物体がそれぞれどのオブジェクトに対応するかを特定する。
図10は、画像認識部140によるオブジェクト認識処理の流れの一例を示すフローチャートである。図10を参照すると、まず、画像認識部140は、撮像部102から入力画像を取得する(ステップS212)。次に、画像認識部140は、入力画像に含まれる部分画像と、特徴データに含まれる各オブジェクトの1つ以上の特徴点のパッチとを照合し、入力画像に含まれる特徴点を抽出する(ステップS214)。なお、画像認識部140によるオブジェクト認識処理に用いられる特徴点と、自己位置検出部120による自己位置検出処理に用いられる特徴点とは、必ずしも同じでなくてもよい。但し、双方の処理で用いられる特徴点が共通している場合には、画像認識部140は、自己位置検出部120による特徴点の追跡結果を再利用してもよい。
次に、画像認識部140は、特徴点の抽出結果に基づいて、入力画像に映っているオブジェクトを特定する(ステップS216)。例えば、画像認識部140は、ある領域内で1つのオブジェクトに属す特徴点が高い密度で抽出された場合には、当該領域にそのオブジェクトが映っていると認識し得る。そして、画像認識部140は、特定したオブジェクトのオブジェクト名称(又は識別子)及びそのオブジェクトに属す特徴点の撮像面上の位置を、環境マップ構築部150へ出力する(ステップS218)。
(4)環境マップ構築部
環境マップ構築部150は、自己位置検出部120から入力されるカメラの位置及び姿勢、画像認識部140から入力される特徴点の撮像面上の位置、及びデータ記憶部130に記憶されている特徴データを用いて、環境マップを構築する。本明細書において、環境マップとは、実空間内に存在する1つ以上の物体の位置(及び姿勢)を表現するデータの集合である。環境マップには、例えば、物体に対応するオブジェクト名称、当該物体に属す特徴点の3次元位置、及び当該物体の形状を構成するポリゴン情報などが含まれ得る。環境マップは、例えば、画像認識部140から入力される特徴点の撮像面上の位置から、上述したピンホールモデルに従って各特徴点の3次元位置を求めることにより構築され得る。
式(11)に示したピンホールモデルの関係式を変形すると、特徴点FPの世界座標系における3次元位置pは、次式により求められる。
Figure 0005728159
ここで、dはカメラと各特徴点との間の世界座標系における距離を表す。環境マップ構築部150は、かかる距離dを、オブジェクトごとに少なくとも4つの特徴点の撮像面上の位置、及び当該特徴点間の距離に基づいて、算出することができる。特徴点間の距離は、図9を用いて説明した特徴データに含まれる3次元形状データFD14として、予めデータ記憶部130により記憶されている。なお、式(14)における距離dの算出処理については、上記特許文献1において詳しく説明されている。
距離dが算出されると、式(14)における右辺の残りの変数は、自己位置検出部120から入力されるカメラの位置及び姿勢、並びに画像認識部140から入力される特徴点の撮像面上の位置であり、いずれも既知となる。そこで、環境マップ構築部150は、式(14)に従って、画像認識部140から入力される各特徴点について、世界座標系における3次元位置を計算する。そして、環境マップ構築部150は、算出した特徴点ごとの3次元位置に応じて最新の環境マップを構築し、構築した環境マップを環境マップ記憶部152に記憶させる。なお、このとき、環境マップ構築部150は、図9を用いて説明した特徴データに含まれるオントロジーデータFD15を用いて、環境マップのデータの正確性を向上させてもよい。
環境マップ記憶部152は、ハードディスク又は半導体メモリなどの記憶媒体を用いて、環境マップ構築部150により構築される環境マップを記憶する。
[2−3.出力画像生成部]
出力画像生成部180は、実空間内で遂行すべき作業の一連の手順について、各手順に関する説明をユーザに呈示するための出力画像を生成し、生成した出力画像を表示装置104に表示させる。その際、出力画像生成部180は、環境マップ生成部110により生成される環境マップ内の所定の位置と各手順に関する説明とを関連付け、当該所定の位置に対応する入力画像内の位置に各手順に関する説明を重畳する。図4に示しているように、本実施形態において、出力画像生成部180は、手順記憶部184、手順制御部186、情報配置部190及び重畳部192を含む。
(1)手順記憶部
手順記憶部184は、ハードディスク又は半導体メモリなどの記憶媒体を用いて、実空間内で遂行すべき作業の一連の手順について、各手順に関する説明と当該説明を表示すべき位置を指定する位置情報とを対応付けて定義する手順データを記憶する。
図11は、本実施形態に係る手順記憶部184により記憶される一例としての手順データ182について説明するための説明図である。図11を参照すると、手順データ182は、“説明書名”、“手順ID”、“手順説明”、“関連物体”及び“進行条件”という5つのデータ項目を有する。
“説明書名”は、実空間内で遂行すべき作業ごとに与えられる名称である。1つの説明書名を指定することにより、1つの作業についての一連の手順に関する手順データを取得することができる。図11の例では、手順データ182には、「テーブルマナー」及び「卵焼き」という2つの作業についての手順データが含まれている。
“手順ID”は、一連の手順に含まれる各手順を識別するための識別子である。図11の例では、「テーブルマナー」についての手順データは、手順ID=「P101」、「P102」及び「P103」である3つの手順を含む。また、「卵焼き」についての手順データは、手順ID=「P201」、「P202」、「P203」及び「P204」である4つの手順を含む。
“手順説明”は、各手順に関するユーザに呈示すべき説明を表す文字列である。図11の例では、「テーブルマナー」の手順ID=「P101」の手順(以下、手順P101などという)の手順説明は、「イスの左側から着席しましょう」という文字列である。手順P102の手順説明は、「食事と飲み物をオーダーしましょう」という文字列である。手順P103の手順説明は、「ナプキンを膝にかけましょう」という文字列である。また、「卵焼き」の手順P201の手順説明は、「卵を割ってかき混ぜる」という文字列である。手順P202の手順説明は、「フライパンをコンロへ」という文字列である。手順P203の手順説明は、「フライパンに卵を流し入れる」という文字列である。手順P204の手順説明は、「塩と胡椒を振る」という文字列である。
“関連物体”は、各手順説明と関連する物体を特定するためのオブジェクト名称を用いて、各手順説明を表示すべき位置を指定する位置情報である。例えば、本実施形態において、各手順説明は、“関連物体”により特定される物体の近傍に表示される。図11の例では、「テーブルマナー」の手順P101の関連物体は、「イス」である。即ち、手順P101の手順説明は、環境マップに含まれるイスの近傍に表示され得る。手順P102の関連物体は、「メニュー」である。即ち、手順P102の手順説明は、環境マップに含まれるメニューの近傍に表示され得る。手順P103の関連物体は、「ナプキン」である。即ち、手順P103の手順説明は、環境マップに含まれるナプキンの近傍に表示され得る。なお、例えば、いずれの物体にも関連しない手順について“関連物体”を空欄とし、当該手順については手順説明を画面中央などの特定の位置に表示することとしてもよい。
“進行条件”は、画像処理装置100が一連の手順を表示する際に、各手順から次の手順へと表示処理を進行させるための条件を表す。即ち、進行条件は、各手順説明を表示すべきタイミングを指定する情報であると言うことができる。図11の例では、進行条件は、次の3種類のパターンのいずれか又はその任意の組合せに従って定義される。
・第1のパターン:環境マップにおける物体の状態
・第2のパターン:所定の時間の経過
・第3のパターン:外部イベント
第1のパターンは、環境マップにより表現される物体の位置又は姿勢が所定の状態にある場合に、進行条件が満たされる(即ち、表示処理が次の手順に進む)というパターンである。例えば、手順データ182の手順P102の進行条件は、「メニューが下げられる」である。かかる進行条件は、例えば、環境マップにおいてテーブル上にメニューが存在しなくなった場合に充足され得る。また、例えば、手順データ182の手順P103の進行条件は、「ナプキンがイスの上にある」である。かかる進行条件は、例えば、環境マップにおいてナプキンがテーブルの上からイスの上方(イスに座ったユーザの膝の上など)に移動した場合に充足され得る。
第2のパターンは、先行する手順説明の表示又はその他のイベントの発生から所定の時間が経過した場合に、進行条件が満たされるというパターンである。例えば、手順データ182の手順P201の進行条件は、「1分経過」である。かかる進行条件は、手順P201の手順説明が表示された後、1分が経過した場合に充足され得る。また、例えば、手順データ182の手順P203の進行条件は、「コンロ点火から30秒経過」である。かかる進行条件は、例えば、外部機器(コンロ)から通知されるコンロ点火というイベントから30秒が経過した場合に充足され得る。
第3のパターンは、他の機器から所定のイベント通知があった場合に、進行条件が満たされるというパターンである。例えば、手順データ182の手順P202の進行条件は、「コンロ上にフライパンがある」である。かかる進行条件は、例えば、圧力センサ等を用いてフライパンが載せられたことを検知したコンロから、当該イベントが通知された場合に充足され得る。なお、「コンロ上にフライパンがある」という条件の充足は、環境マップにおける物体の状態から判別されてもよい(この場合は、第1のパターンである)。他の機器からのイベント通知は、かかる例に限定されず、例えば、撮像装置からの画像認識結果(例えば、ユーザの手の状態の認識結果など)の通知、電子機器からのユーザ操作に関する通知、又は通信装置からの信号受信に関する通知などであってもよい。
手順記憶部184は、このような一例としての手順データ182を記憶し、次に説明する手順制御部186からの要求に応じて手順データ182の少なくとも一部を出力する。なお、図4の例では、手順記憶部184は、画像処理装置100の内部に設けられている。しかしながら、かかる例に限定されず、画像処理装置100の外部の記憶媒体に手順データが記憶されてもよい。その場合には、画像処理装置100は、例えば、ユーザの指示に応じて、必要な手順データを外部の記憶媒体から選択的に取得し得る。また、図11に例示した手順データ182のようなシーケンシャルな手順の代わりに、ステートマシンのように相互に状態遷移する複数の手順が手順データとして定義されてもよい。
(2)手順制御部
手順制御部186は、例えば、ユーザからの指示に応じて手順記憶部184から所望の説明書名についての手順データを取得し、取得した手順データに従って、一連の手順に含まれる各手順に関する手順説明の表示を制御する。
図12は、本実施形態に係る手順制御部186による手順制御処理の流れの一例を示すフローチャートである。図12を参照すると、まず、手順制御部186は、手順記憶部184から所望の説明書名についての手順データを取得する(ステップS302)。例えばユーザが説明書名として「テーブルマナー」を指定した場合には、手順制御部186は、図11に例示した一連の手順P101、P102、P103…を含む「テーブルマナー」についての手順データを取得する。
次に、手順制御部186は、取得した手順データから先頭の手順を1つ読み出す(ステップS304)。例えば、図11に例示した一連の手順P101、P102、P103…を含む手順データが取得された場合には、手順制御部186は、最初に手順P101のレコードを読み出す。
次に、手順制御部186は、読み出した手順と対応付けられている関連物体の近傍に、手順説明を表示させる(ステップS306)。より具体的には、手順制御部186は、例えば、読み出した手順と対応付けられている関連物体の位置を環境マップ内で特定し、当該関連物体の位置の近傍を手順説明を表示すべき3次元位置として決定する。そして、手順説明と当該手順説明を表示すべき3次元位置とを情報配置部190へ出力する。その後の手順表示処理については、後により具体的に説明する。
次に、手順制御部186は、読み出した手順と対応付けられている進行条件に従って、環境マップにおける物体の状態、所定の時間の経過、又は外部イベントなどを監視する(ステップS308)。そして、監視の結果として進行条件が満たされた場合には、処理はステップS310へ進む。
次に、手順制御部186は、表示を完了していない次の手順が残っているか否かを判定する(ステップS310)。ここで、表示を完了していない次の手順が残っている場合には、処理はステップS304へ戻り、次の手順について手順表示処理が繰り返される。一方、表示を完了していない次の手順が残っていない場合には、手順制御部186による手順制御処理は終了する。
(4)情報配置部
情報配置部190は、手順制御部186から入力される各手順説明を表示すべき入力画像内の位置を、環境マップ生成部110から取得される撮像装置の位置及び姿勢を用いて、ピンホールモデルの式(11)に従って算出する。この場合、式(11)における右辺の特徴点FPの3次元位置pに、手順制御部186から入力される3次元位置が代入される。そして、情報配置部190は、各手順説明を表示すべき入力画像内の位置を算出すると、各手順説明と当該手順説明を表示すべき入力画像内の位置とを、重畳部192へ出力する。
(5)重畳部
重畳部192は、情報配置部190から入力される各手順説明を情報配置部190により算出される入力画像内の位置に重畳することにより、出力画像を生成する。
図13は、手順制御部186、情報配置部190及び重畳部192による手順表示処理の流れの一例を示すフローチャートである。なお、図13に示した手順表示処理は、実空間内で遂行すべき作業の一連の手順に含まれる個々の手順ごとに、図12に示した手順制御処理におけるステップS306において実行される。
図13を参照すると、まず、手順制御部186は、環境マップ内の関連物体の位置に基づいて、手順説明を表示すべき3次元位置を決定する(ステップS322)。例えば、ある手順についての関連物体がイスである場合には、環境マップ内の当該イスの表面又は近傍のいずれかの位置が、当該手順に関する手順説明を表示すべき3次元位置として決定される。
次に、情報配置部190は、ステップS322において決定された3次元位置に対応する入力画像内の位置を、環境マップ生成部110から取得される撮像装置の位置及び姿勢を用いて、ピンホールモデルに従って算出する(ステップS324)。なお、ステップS322において決定された3次元位置に対応する撮像面上の位置が入力画像の範囲から外れている場合には、その後の処理はスキップされてもよい。
次に、重畳部192は、情報配置部190により算出された入力画像内の位置に、手順説明を記述したテキストボックスなどを重畳することにより、出力画像を生成する(ステップS326)。重畳部192により生成される出力画像は、例えば、画像処理装置100の表示装置104の画面上に表示される。
[2−4.出力画像の例]
図14及び図15は、本実施形態において表示装置104の画面上に表示され得る出力画像の例をそれぞれ示している。
図14を参照すると、図11に例示した手順P202についての手順説明が重畳された出力画像Im11が示されている。出力画像Im11には、「手順2:フライパンをコンロへ」という手順説明を記述したテキストボックスT11が、フライパンの近傍に表示されている。ユーザは、かかる手順説明を参照することにより、料理の次の手順においてフライパンをコンロにかければよいことを直感的に認識することができる。かかるテキストボックスT11は、手順P202の進行条件である「コンロ上にフライパンがある」という状態が環境マップにおいて実現されるまで、フライパンの近傍に表示され続ける。それにより、ユーザは、手順の対象となる物体を容易に把握することができる。
図15を参照すると、図11に例示した手順P103についての手順説明が重畳された出力画像Im21が示されている。出力画像Im21には、「手順3:ナプキンを膝にかけましょう」という手順説明を記述したテキストボックスT21が、ナプキンの近傍に表示されている。ユーザは、かかる手順説明を参照することにより、テーブルマナーの次の手順においてナプキンを膝にかければよいことを直感的に認識することができる。かかるテキストボックスT21は、手順P103の進行条件である「ナプキンがイスの上にある」という状態が環境マップにおいて実現されるまで、ナプキンの近傍に表示され続ける。それにより、ユーザは、手順の対象となる物体を容易に把握することができる。
なお、ここで説明した手順表示方法は一例に過ぎず、上述した実施形態以外にも様々な応用が可能である。例えば、商業施設や駅などの空間における道案内、又はレンタカー若しくはATM(現金自動預け払い機)における操作説明などのために本発明が適用されてもよい。
<3.ハードウェア構成の例>
なお、上述した実施形態に係る一連の処理をハードウェアで実現するかソフトウェアで実現するかは問わない。一連の処理又はその一部をソフトウェアで実行させる場合には、ソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれたコンピュータ、又は例えば図16に示した汎用コンピュータなどを用いて実行される。
図16において、CPU902は、汎用コンピュータの動作全般を制御する。ROM(Read Only Memory)904には、一連の処理の一部又は全部を記述したプログラム又はデータが格納される。RAM(Random Access Memory)906には、処理の実行時にCPU902により用いられるプログラムやデータなどが一時的に記憶される。
CPU902、ROM904、及びRAM906は、バス910を介して相互に接続される。バス910にはさらに、入出力インタフェース912が接続される。
入出力インタフェース912は、CPU902、ROM904、及びRAM906と、入力装置920、表示装置104、記憶装置924、撮像装置102、及びドライブ930とを接続するためのインタフェースである。
入力装置920は、例えばボタン、スイッチ、レバー、マウスやキーボードなどの入力インタフェースを介して、ユーザからの指示や情報入力を受け付ける。記憶装置924は、例えばハードディスクドライブ又は半導体メモリなどにより構成され、プログラムやデータを記憶する。ドライブ930は、必要に応じて汎用コンピュータに設けられ、例えばドライブ930にはリムーバブルメディア932が装着される。
一連の処理をソフトウェアで実行する場合には、例えば図16に示したROM904、記憶装置924、又はリムーバブルメディア932に格納されたプログラムが、実行時にRAM906に読み込まれ、CPU902によって実行される。
<4.まとめ>
ここまで、図1A〜図16を用いて、本発明の一実施形態について説明した。本実施形態によれば、実空間内で遂行すべき作業の一連の手順に含まれる各手順に関する説明が、実空間内に存在する物体の位置を3次元的に表現する環境マップに基づいて決定される位置に表示される。それにより、ユーザによる手順の直感的な理解が可能となる。特に、本実施形態によれば、ユーザを取り巻く環境が動的に変化し得る実空間内での作業においても、その環境の変化に追随して環境マップが動的に更新される。その結果、各手順に関する説明が表示される位置も環境の変化に合わせて移動するため、環境の変化に起因して説明書の理解が困難となることがない。
また、本実施形態において、各手順に関する説明が表示される位置は、各手順に関する説明と関連付けられる物体の位置に応じて決定され得る。それにより、ユーザは、各手順における作業の対象とすべき物体を容易に把握することができる。また、各手順に関する説明を表示すべきタイミングが環境マップにおける物体の状態(位置又は姿勢)、所定の時間の経過、又は外部イベントなどに応じて制御されるため、ユーザによる作業の進行に合わせて適切なタイミングで説明を表示することができる。さらに、各手順に関する説明が表示される位置は、SLAM技術を用いて動的に検出されるカメラの位置及び姿勢に基づいて算出される。従って、位置又は姿勢が時々刻々と変化する可能性のあるカメラを用いる場合であっても、画像内の適切な位置に説明を表示することができる。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
100 画像処理装置
102 撮像装置(撮像部)
104 表示装置
120 自己位置検出部
130 データ記憶部
150 環境マップ構築部
182 手順データ
186 手順制御部
192 重畳部

Claims (6)

  1. 撮像装置を用いて実空間を撮影することにより得られる入力画像を取得する画像取得部と;
    前記入力画像を用いて、前記実空間内に存在する物体の位置を前記実空間に設定される世界座標系において3次元的に表現する環境マップを動的に構築する環境マップ構築部と;
    前記実空間内で遂行すべき作業の一連の手順について、各手順に関する説明と当該説明を表示すべき位置を指定する位置情報とを対応付けて定義する手順データを取得する制御部と;
    前記制御部により取得される前記手順データを用いて、前記一連の手順に含まれる各手順に関する説明を表示する画像を、画面上の前記環境マップ及び前記位置情報に基づいて決定される位置に重畳する重畳部と;
    を備え、
    前記手順データは、各手順に関する説明と各説明の表示を進行させるための条件とをさらに対応付けて定義し、
    各説明の表示を進行させるための前記条件は、前記環境マップにより表現される物体の前記世界座標系における3次元的な位置又は姿勢に応じた条件を含む、
    画像処理装置。
  2. 前記位置情報は、各手順に関する説明と関連する物体を特定することにより、前記説明を表示すべき前記環境マップ内での位置を指定する、請求項1に記載の画像処理装置。
  3. 前記制御部は、前記一連の手順に含まれる各手順に関する説明の表示を前記手順データに従って制御する、請求項1に記載の画像処理装置。
  4. 各手順に関する説明が重畳される前記画面上の位置は、前記撮像装置の前記実空間内の位置に応じて決定される、
    請求項1〜3のいずれか1項に記載の画像処理装置。
  5. 画像処理装置により実行される画像処理方法であって:
    撮像装置を用いて実空間を撮影した入力画像を取得するステップと;
    前記入力画像を用いて、前記実空間内に存在する物体の位置を前記実空間に設定される世界座標系において3次元的に表現する環境マップを動的に構築するステップと;
    前記実空間内で遂行すべき作業の一連の手順について、各手順に関する説明と当該説明を表示すべき位置を指定する位置情報とを対応付けて定義する手順データを取得するステップと;
    取得された前記手順データを用いて、前記一連の手順に含まれる各手順に関する説明を表示する画像を、画面上の前記環境マップ及び前記位置情報に基づいて決定される位置に重畳するステップと;
    を含み、
    前記手順データは、各手順に関する説明と各説明の表示を進行させるための条件とをさらに対応付けて定義し、
    各説明の表示を進行させるための前記条件は、前記環境マップにより表現される物体の前記世界座標系における3次元的な位置又は姿勢に応じた条件を含む、
    画像処理方法。
  6. 画像処理装置を制御するコンピュータを:
    撮像装置を用いて実空間を撮影することにより得られる入力画像を取得する画像取得部と;
    前記入力画像を用いて、前記実空間内に存在する物体の位置を前記実空間に設定される世界座標系において3次元的に表現する環境マップを動的に構築する環境マップ構築部と;
    前記実空間内で遂行すべき作業の一連の手順について、各手順に関する説明と当該説明を表示すべき位置を指定する位置情報とを対応付けて定義する手順データを取得する制御部と;
    前記制御部により取得される前記手順データを用いて、前記一連の手順に含まれる各手順に関する説明を表示する画像を、画面上の前記環境マップ及び前記位置情報に基づいて決定される位置に重畳する重畳部と;
    として機能させ、
    前記手順データは、各手順に関する説明と各説明の表示を進行させるための条件とをさらに対応付けて定義し、
    各説明の表示を進行させるための前記条件は、前記環境マップにより表現される物体の前記世界座標系における3次元的な位置又は姿勢に応じた条件を含む、
    プログラム。
JP2010021368A 2010-02-02 2010-02-02 画像処理装置、画像処理方法及びプログラム Active JP5728159B2 (ja)

Priority Applications (13)

Application Number Priority Date Filing Date Title
JP2010021368A JP5728159B2 (ja) 2010-02-02 2010-02-02 画像処理装置、画像処理方法及びプログラム
US12/984,847 US8896628B2 (en) 2010-02-02 2011-01-05 Image processing device, image processing method, and program
CN2011100314217A CN102141885B (zh) 2010-02-02 2011-01-26 图像处理设备和图像处理方法
US14/527,148 US9183678B2 (en) 2010-02-02 2014-10-29 Image processing device, image processing method, and program
US14/869,063 US9754418B2 (en) 2010-02-02 2015-09-29 Image processing device, image processing method, and program
US14/991,477 US9805513B2 (en) 2010-02-02 2016-01-08 Image processing device, image processing method, and program
US15/713,801 US10037628B2 (en) 2010-02-02 2017-09-25 Image processing device, image processing method, and program
US16/026,763 US10223837B2 (en) 2010-02-02 2018-07-03 Image processing device, image processing method, and program
US16/263,524 US10515488B2 (en) 2010-02-02 2019-01-31 Image processing device, image processing method, and program
US16/668,862 US10810803B2 (en) 2010-02-02 2019-10-30 Image processing device, image processing method, and program
US17/069,389 US11189105B2 (en) 2010-02-02 2020-10-13 Image processing device, image processing method, and program
US17/529,605 US11651574B2 (en) 2010-02-02 2021-11-18 Image processing device, image processing method, and program
US18/133,252 US12002173B2 (en) 2010-02-02 2023-04-11 Image processing device, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010021368A JP5728159B2 (ja) 2010-02-02 2010-02-02 画像処理装置、画像処理方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2011159162A JP2011159162A (ja) 2011-08-18
JP2011159162A5 JP2011159162A5 (ja) 2013-01-31
JP5728159B2 true JP5728159B2 (ja) 2015-06-03

Family

ID=44341235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010021368A Active JP5728159B2 (ja) 2010-02-02 2010-02-02 画像処理装置、画像処理方法及びプログラム

Country Status (3)

Country Link
US (11) US8896628B2 (ja)
JP (1) JP5728159B2 (ja)
CN (1) CN102141885B (ja)

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9196169B2 (en) 2008-08-21 2015-11-24 Lincoln Global, Inc. Importing and analyzing external data using a virtual reality welding system
US9483959B2 (en) 2008-08-21 2016-11-01 Lincoln Global, Inc. Welding simulator
US8851896B2 (en) 2008-08-21 2014-10-07 Lincoln Global, Inc. Virtual reality GTAW and pipe welding simulator and setup
US8274013B2 (en) 2009-03-09 2012-09-25 Lincoln Global, Inc. System for tracking and analyzing welding activity
US9773429B2 (en) 2009-07-08 2017-09-26 Lincoln Global, Inc. System and method for manual welder training
US9011154B2 (en) 2009-07-10 2015-04-21 Lincoln Global, Inc. Virtual welding system
US9606992B2 (en) * 2011-09-30 2017-03-28 Microsoft Technology Licensing, Llc Personal audio/visual apparatus providing resource management
JP5837404B2 (ja) * 2011-11-22 2015-12-24 株式会社日立製作所 画像処理装置、画像処理方法
US20130155105A1 (en) * 2011-12-19 2013-06-20 Nokia Corporation Method and apparatus for providing seamless interaction in mixed reality
CN104641399B (zh) 2012-02-23 2018-11-23 查尔斯·D·休斯顿 用于创建环境并用于共享环境中基于位置的体验的***和方法
US10937239B2 (en) 2012-02-23 2021-03-02 Charles D. Huston System and method for creating an environment and for sharing an event
US10600235B2 (en) 2012-02-23 2020-03-24 Charles D. Huston System and method for capturing and sharing a location based experience
JP2013225245A (ja) 2012-04-23 2013-10-31 Sony Corp 画像処理装置、画像処理方法及びプログラム
US20160093233A1 (en) 2012-07-06 2016-03-31 Lincoln Global, Inc. System for characterizing manual welding operations on pipe and other curved structures
US9767712B2 (en) 2012-07-10 2017-09-19 Lincoln Global, Inc. Virtual reality pipe welding simulator and setup
US8743224B2 (en) * 2012-07-13 2014-06-03 Intel Corporation Context based management for secure augmented reality applications
US9443414B2 (en) 2012-08-07 2016-09-13 Microsoft Technology Licensing, Llc Object tracking
US9336541B2 (en) * 2012-09-21 2016-05-10 Paypal, Inc. Augmented reality product instructions, tutorials and visualizations
BR112015005692A2 (pt) * 2012-09-21 2017-07-04 Sony Corp dispositivo de controle, e, meio de armazenamento.
US10573037B2 (en) * 2012-12-20 2020-02-25 Sri International Method and apparatus for mentoring via an augmented reality assistant
US9189021B2 (en) * 2012-11-29 2015-11-17 Microsoft Technology Licensing, Llc Wearable food nutrition feedback system
JP6077010B2 (ja) * 2012-12-19 2017-02-08 株式会社日立製作所 作業支援端末および作業支援システム
US9395543B2 (en) * 2013-01-12 2016-07-19 Microsoft Technology Licensing, Llc Wearable behavior-based vision system
EP3517190B1 (en) 2013-02-01 2022-04-20 Sony Group Corporation Information processing device, terminal device, information processing method, and programme
EP2953099B1 (en) 2013-02-01 2019-02-13 Sony Corporation Information processing device, terminal device, information processing method, and programme
US20140253540A1 (en) * 2013-03-07 2014-09-11 Yoav DORI Method and system of incorporating real world objects into a virtual environment
FI125913B (en) * 2013-03-25 2016-04-15 Mikkelin Ammattikorkeakoulu Oy A state-defining object for computer-aided design
US10930174B2 (en) 2013-05-24 2021-02-23 Lincoln Global, Inc. Systems and methods providing a computerized eyewear device to aid in welding
US9952042B2 (en) 2013-07-12 2018-04-24 Magic Leap, Inc. Method and system for identifying a user location
KR102165818B1 (ko) 2013-09-10 2020-10-14 삼성전자주식회사 입력 영상을 이용한 사용자 인터페이스 제어 방법, 장치 및 기록매체
US20150072323A1 (en) 2013-09-11 2015-03-12 Lincoln Global, Inc. Learning management system for a real-time simulated virtual reality welding training environment
US10083627B2 (en) * 2013-11-05 2018-09-25 Lincoln Global, Inc. Virtual reality and real welding training system and method
JP6362325B2 (ja) * 2013-12-18 2018-07-25 マイクロソフト テクノロジー ライセンシング,エルエルシー 物体追跡
US9761059B2 (en) * 2014-01-03 2017-09-12 Intel Corporation Dynamic augmentation of a physical scene
JP2015135645A (ja) * 2014-01-20 2015-07-27 ヤフー株式会社 情報表示制御装置、情報表示制御方法及びプログラム
US9836987B2 (en) 2014-02-14 2017-12-05 Lincoln Global, Inc. Virtual reality pipe welding simulator and setup
DE102014206623A1 (de) * 2014-04-07 2015-10-08 Bayerische Motoren Werke Aktiengesellschaft Lokalisierung eines Head-mounted Displays (HMD) im Fahrzeug
WO2015173882A1 (ja) * 2014-05-13 2015-11-19 株式会社日立製作所 コンテンツ生成方法および管理装置
JP6687543B2 (ja) 2014-06-02 2020-04-22 リンカーン グローバル,インコーポレイテッド 手溶接訓練のためのシステム及び方法
KR20150140449A (ko) 2014-06-05 2015-12-16 팅크웨어(주) 전자 장치, 전자 장치의 제어 방법 및 컴퓨터 판독 가능한 기록 매체
US10270985B2 (en) 2014-09-03 2019-04-23 Intel Corporation Augmentation of textual content with a digital scene
JP2016099638A (ja) * 2014-11-18 2016-05-30 セイコーエプソン株式会社 画像処理装置、画像処理装置の制御方法、および、コンピュータープログラム
JP6609988B2 (ja) * 2015-05-18 2019-11-27 セイコーエプソン株式会社 画像処理装置、画像処理装置の制御方法、および、コンピュータープログラム
WO2017030193A1 (ja) * 2015-08-20 2017-02-23 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP6586834B2 (ja) 2015-09-14 2019-10-09 富士通株式会社 作業支援方法、作業支援プログラム、及び作業支援システム
US10440808B2 (en) * 2015-11-17 2019-10-08 Southwest Research Institute High power impulse plasma source
US10706626B1 (en) * 2015-12-09 2020-07-07 Roger Brent Augmented reality procedural system
JP2017120329A (ja) * 2015-12-28 2017-07-06 株式会社ブリリアントサービス 調理用ヘッドマウントディスプレイおよび調理用ヘッドマウントディスプレイのプログラム
US9536355B1 (en) * 2016-03-24 2017-01-03 Daqri, Llc Thermal detection in an augmented reality system
US10216289B2 (en) * 2016-04-29 2019-02-26 International Business Machines Corporation Laser pointer emulation via a mobile device
EP3319066A1 (en) 2016-11-04 2018-05-09 Lincoln Global, Inc. Magnetic frequency selection for electromagnetic position tracking
US10913125B2 (en) 2016-11-07 2021-02-09 Lincoln Global, Inc. Welding system providing visual and audio cues to a welding helmet with a display
US10878591B2 (en) 2016-11-07 2020-12-29 Lincoln Global, Inc. Welding trainer utilizing a head up display to display simulated and real-world objects
CN106774878A (zh) * 2016-12-12 2017-05-31 大连文森特软件科技有限公司 基于ar增强现实技术的烹饪辅助***
CN107168532B (zh) * 2017-05-05 2020-09-11 武汉秀宝软件有限公司 一种基于增强现实的虚拟同步显示方法及***
US10997872B2 (en) 2017-06-01 2021-05-04 Lincoln Global, Inc. Spring-loaded tip assembly to support simulated shielded metal arc welding
JP7046506B2 (ja) * 2017-06-12 2022-04-04 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US10534962B2 (en) 2017-06-17 2020-01-14 Matterport, Inc. Automated classification based on photo-realistic image/model mappings
US10963750B2 (en) 2018-01-04 2021-03-30 IAS Machine, LLC Procedural language and content generation environment for use in augmented reality/mixed reality systems to support laboratory and related operations
US10467816B2 (en) * 2018-03-23 2019-11-05 Microsoft Technology Licensing, Llc Mixed reality objects
JP7209474B2 (ja) 2018-03-30 2023-01-20 株式会社スクウェア・エニックス 情報処理プログラム、情報処理方法及び情報処理システム
WO2019204395A1 (en) * 2018-04-17 2019-10-24 Marchand Stacey Leighton Augmented reality spatial guidance and procedure control system
US11557223B2 (en) 2018-04-19 2023-01-17 Lincoln Global, Inc. Modular and reconfigurable chassis for simulated welding training
US11475792B2 (en) 2018-04-19 2022-10-18 Lincoln Global, Inc. Welding simulator with dual-user configuration
US12003585B2 (en) 2018-06-08 2024-06-04 Vale Group Llc Session-based information exchange
US20190378334A1 (en) 2018-06-08 2019-12-12 Vulcan Inc. Augmented reality portal-based applications
US10916105B2 (en) 2018-09-06 2021-02-09 Bank Of America Corporation Processing system for providing enhanced reality interfaces at an automated teller machine (ATM) terminal platform
US10755250B2 (en) 2018-09-07 2020-08-25 Bank Of America Corporation Processing system for providing a teller assistant experience using enhanced reality interfaces
US10462425B1 (en) 2018-09-07 2019-10-29 Bank Of America Corporation Processing system for providing a teller assistant experience using enhanced reality interfaces
US20200090661A1 (en) * 2018-09-13 2020-03-19 Magna Legal Services, Llc Systems and Methods for Improved Digital Transcript Creation Using Automated Speech Recognition
US11445107B2 (en) 2019-08-08 2022-09-13 Qorvo Us, Inc. Supervised setup for control device with imager
US11132590B2 (en) 2019-12-12 2021-09-28 Lablightar Inc. Augmented camera for improved spatial localization and spatial orientation determination
AU2020433699A1 (en) * 2020-03-06 2022-09-29 Sandvik Ltd Computer enhanced maintenance system
JP7215752B2 (ja) * 2020-07-19 2023-01-31 プレティア・テクノロジーズ株式会社 コンテンツ提供システム及びコンテンツ提供方法
JP2022052324A (ja) * 2020-09-23 2022-04-04 株式会社x garden 料理支援装置、プログラム及び料理支援方法
US11933621B2 (en) * 2021-10-06 2024-03-19 Qualcomm Incorporated Providing a location of an object of interest

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6856324B2 (en) * 2001-03-27 2005-02-15 Siemens Corporate Research, Inc. Augmented reality guided instrument positioning with guiding graphics
GB2376397A (en) * 2001-06-04 2002-12-11 Hewlett Packard Co Virtual or augmented reality
US20030218638A1 (en) * 2002-02-06 2003-11-27 Stuart Goose Mobile multimodal user interface combining 3D graphics, location-sensitive speech interaction and tracking technologies
JP2003281297A (ja) * 2002-03-22 2003-10-03 National Institute Of Advanced Industrial & Technology 情報提示装置および情報提示方法
JP2004048674A (ja) * 2002-05-24 2004-02-12 Olympus Corp 視野一致型情報呈示システム、並びに、それに用いられる携帯情報端末及びサーバ
AU2002368068A1 (en) * 2002-07-17 2004-02-02 Yoram Baram Closed-loop augmented reality apparatus
US6867753B2 (en) * 2002-10-28 2005-03-15 University Of Washington Virtual image registration in augmented display field
WO2005094664A1 (ja) * 2004-04-02 2005-10-13 Olympus Corporation 内視鏡
US7330125B2 (en) 2005-03-25 2008-02-12 Honeywell International, Inc. Directional sound system with messaging
JP4667111B2 (ja) * 2005-04-21 2011-04-06 キヤノン株式会社 画像処理装置、画像処理方法
EP1922614A2 (en) * 2005-08-15 2008-05-21 Koninklijke Philips Electronics N.V. System, apparatus, and method for augmented reality glasses for end-user programming
JP4738144B2 (ja) * 2005-11-28 2011-08-03 株式会社日立製作所 情報監視方法、システム及びプログラム
US8280405B2 (en) * 2005-12-29 2012-10-02 Aechelon Technology, Inc. Location based wireless collaborative environment with a visual user interface
JP5084167B2 (ja) * 2006-03-31 2012-11-28 キヤノン株式会社 位置姿勢計測方法及び装置
US9323055B2 (en) * 2006-05-26 2016-04-26 Exelis, Inc. System and method to display maintenance and operational instructions of an apparatus using augmented reality
US8614675B2 (en) * 2007-01-25 2013-12-24 Microsoft Corporation Automatic mode determination for an input device
WO2008107021A1 (de) * 2007-03-08 2008-09-12 Siemens Aktiengesellschaft Verfahren und vorrichtung zur generierung von trackingkonfigurationen für augmented-reality-anwendungen
JP4909176B2 (ja) * 2007-05-23 2012-04-04 キヤノン株式会社 複合現実感提示装置及びその制御方法、コンピュータプログラム
JP5380789B2 (ja) * 2007-06-06 2014-01-08 ソニー株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2009037392A (ja) 2007-08-01 2009-02-19 Olympus Corp 作業支援システム
US8786675B2 (en) * 2008-01-23 2014-07-22 Michael F. Deering Systems using eye mounted displays
US8970690B2 (en) * 2009-02-13 2015-03-03 Metaio Gmbh Methods and systems for determining the pose of a camera with respect to at least one object of a real environment
US20100240988A1 (en) * 2009-03-19 2010-09-23 Kenneth Varga Computer-aided system for 360 degree heads up display of safety/mission critical data
US8838080B2 (en) * 2009-07-23 2014-09-16 Qualcomm Incorporated Methods and apparatus for context-based communications through visualization
US8768313B2 (en) * 2009-08-17 2014-07-01 Digimarc Corporation Methods and systems for image or audio recognition processing
WO2011041262A2 (en) * 2009-09-30 2011-04-07 University Of Florida Research Foundation, Inc. Real-time feedback of task performance
US8830227B2 (en) * 2009-12-06 2014-09-09 Primesense Ltd. Depth-based gain control

Also Published As

Publication number Publication date
US20180315249A1 (en) 2018-11-01
US11189105B2 (en) 2021-11-30
US20160035141A1 (en) 2016-02-04
US9805513B2 (en) 2017-10-31
US20180012415A1 (en) 2018-01-11
US8896628B2 (en) 2014-11-25
US20160125657A1 (en) 2016-05-05
US10223837B2 (en) 2019-03-05
US10037628B2 (en) 2018-07-31
US20210027543A1 (en) 2021-01-28
US20230245402A1 (en) 2023-08-03
US20200066057A1 (en) 2020-02-27
US10810803B2 (en) 2020-10-20
US11651574B2 (en) 2023-05-16
US20150049116A1 (en) 2015-02-19
US9183678B2 (en) 2015-11-10
US20190164348A1 (en) 2019-05-30
CN102141885A (zh) 2011-08-03
US12002173B2 (en) 2024-06-04
CN102141885B (zh) 2013-10-30
US10515488B2 (en) 2019-12-24
US20110187746A1 (en) 2011-08-04
JP2011159162A (ja) 2011-08-18
US20220076499A1 (en) 2022-03-10
US9754418B2 (en) 2017-09-05

Similar Documents

Publication Publication Date Title
JP5728159B2 (ja) 画像処理装置、画像処理方法及びプログラム
US10521085B2 (en) Image processing device, image processing method, and program for displaying an image in accordance with a selection from a displayed menu and based on a detection by a sensor
CN105981076B (zh) 合成增强现实环境的构造
US9443353B2 (en) Methods and systems for capturing and moving 3D models and true-scale metadata of real world objects
JP2011095797A (ja) 画像処理装置、画像処理方法及びプログラム
JP2013225245A (ja) 画像処理装置、画像処理方法及びプログラム
JP2011203824A (ja) 画像処理装置、画像処理方法及びプログラム
TW201346640A (zh) 影像處理裝置及電腦程式產品
CN104281397B (zh) 多深度区间的重聚焦方法、装置及电子设备
KR101892735B1 (ko) 직관적인 상호작용 장치 및 방법
JP2021520577A (ja) 画像処理方法及び装置、電子機器並びに記憶媒体
US20210327160A1 (en) Authoring device, authoring method, and storage medium storing authoring program
JP7341736B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20230137440A1 (en) Point and clean
EP4312108A1 (en) Identifying device in a mixed-reality environment

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121212

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130805

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131001

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150406

R150 Certificate of patent or registration of utility model

Ref document number: 5728159

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250