JP7414332B2 - 深度マップイメージ生成方法およびそのためのコンピューティング装置 - Google Patents
深度マップイメージ生成方法およびそのためのコンピューティング装置 Download PDFInfo
- Publication number
- JP7414332B2 JP7414332B2 JP2022545059A JP2022545059A JP7414332B2 JP 7414332 B2 JP7414332 B2 JP 7414332B2 JP 2022545059 A JP2022545059 A JP 2022545059A JP 2022545059 A JP2022545059 A JP 2022545059A JP 7414332 B2 JP7414332 B2 JP 7414332B2
- Authority
- JP
- Japan
- Prior art keywords
- depth map
- image
- map image
- training
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 37
- 238000012549 training Methods 0.000 claims description 103
- 238000013528 artificial neural network Methods 0.000 claims description 89
- 230000006870 function Effects 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims 3
- 230000009466 transformation Effects 0.000 description 39
- 238000010586 diagram Methods 0.000 description 28
- 238000004364 calculation method Methods 0.000 description 20
- 238000003384 imaging method Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 239000004984 smart glass Substances 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/55—Depth or shape recovery from multiple images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computer Graphics (AREA)
- Computer Hardware Design (AREA)
- Image Analysis (AREA)
Description
ここでの基礎RGBイメージおよび基礎深度マップイメージは、全方位仮想現実に使われる等長方形投影(Equirectangular Projection)イメージであり得る。以下で説明する多様な種類のRGBイメージおよび深度マップイメージは、全方位仮想空間を生成するために使われる等長方形投影(Equirectangular Projection)イメージであり得る。
Claims (11)
- コンピューティング装置であって、
一つ以上のインストラクションを保存するメモリ;および
前記メモリに保存された前記一つ以上のインストラクションを実行するプロセッサを含み、
前記プロセッサは、前記一つ以上のインストラクションを実行することによって、
ニューラルネットワークを利用して学習RGBイメージに対する第1推定深度マップイメージを生成し、深度情報を有する学習深度マップイメージと前記第1推定深度マップイメージ間の差に基づいて前記ニューラルネットワークをトレーニングし、
前記学習RGBイメージと前記学習深度マップイメージは、
互いに1:1でマッチングされ、基礎球状イメージに対して同一の設定変更に基づいて生成され、
前記プロセッサは、前記一つ以上のインストラクションを実行することによって、
前記学習深度マップイメージおよび前記第1推定深度マップイメージを球状変換し、
球状変換された学習深度マップイメージと球状変換された第1推定深度マップイメージ間のロスを決定し、
決定されたロスに対応して前記ニューラルネットワークの媒介変数を変更して前記ニューラルネットワークをトレーニングする
ことを特徴とするコンピューティング装置。 - 前記学習深度マップイメージおよび前記第1推定深度マップイメージは等長方形投影イメージである
請求項1に記載のコンピューティング装置。 - 前記プロセッサは、前記一つ以上のインストラクションを実行することによって、
互いに相異なった複数のロス関数を利用して前記球状変換された学習深度マップイメージと前記球状変換された第1推定深度マップイメージ間のロス関数結果をそれぞれ計算し、
計算された複数のロス関数結果に対して代表値を算出して前記ロスとして決定する
請求項1に記載のコンピューティング装置。 - 前記プロセッサは、前記一つ以上のインストラクションを実行することによって、
トレーニングが遂行された前記ニューラルネットワークに質問RGBイメージを入力し、
前記質問RGBイメージに対応して前記ニューラルネットワークが生成した第2推定深度マップイメージを確認し、
前記質問RGBイメージと前記第2推定深度マップイメージを利用して球状仮想イメージ-前記球状仮想イメージは仮想イメージに含まれた少なくとも一つの地点に対する距離情報を含み、前記距離情報は前記第2推定深度マップイメージに基づいて決定される-を生成する
請求項1に記載のコンピューティング装置。 - 前記プロセッサは、前記一つ以上のインストラクションを実行することによって、
使用者端末を通じて使用者に前記球状仮想イメージを提供し、
前記使用者から前記球状仮想イメージの少なくとも一地点に対する使用者要請を受信すれば、前記少なくとも一地点に対する深度情報を抽出して前記使用者端末に提供する
請求項4に記載のコンピューティング装置。 - コンピューティング装置で遂行される深度マップイメージ生成方法であって、
ニューラルネットワークを利用して学習RGBイメージに対する第1推定深度マップイメージを生成する動作;および
球状変換に基づいて生成された、学習深度マップイメージ-前記学習深度マップイメージは前記学習RGBイメージにマッチングされ深度情報を有する-および前記第1推定深度マップイメージ間の差に基づいて前記ニューラルネットワークをトレーニングする動作;を含み、
前記ニューラルネットワークをトレーニングする動作は、
前記学習深度マップイメージおよび前記第1推定深度マップイメージを球状変換する動作;
球状変換された学習深度マップイメージと球状変換された第1推定深度マップイメージ間のロスを決定する動作;および
決定されたロスに対応して前記ニューラルネットワークの媒介変数を変更して前記ニューラルネットワークをトレーニングする動作;を含む
ことを特徴とする深度マップイメージ生成方法。 - 前記学習深度マップイメージおよび前記第1推定深度マップイメージは等長方形投影イメージである
請求項4に記載の深度マップイメージ生成方法。 - 前記ニューラルネットワークをトレーニングする動作は、
互いに異なる複数のロス関数を利用して前記球状変換された学習深度マップイメージと前記球状変換された第1推定深度マップイメージ間のロス関数結果をそれぞれ計算する動作;および
計算された複数のロス関数結果に対して代表値を算出して前記ロスとして決定する動作;を含む
請求項6に記載の深度マップイメージ生成方法。 - 前記深度マップイメージ生成方法は、
トレーニングが遂行された前記ニューラルネットワークに質問RGBイメージを入力する動作;
前記質問RGBイメージに対応して前記ニューラルネットワークが生成した第2推定深度マップイメージを確認する動作;および
前記質問RGBイメージと前記第2推定深度マップイメージを利用して球状仮想イメージ-前記球状仮想イメージは仮想イメージに含まれた少なくとも一つの地点に対する距離情報を含み、前記距離情報は前記第2推定深度マップイメージに基づいて決定される-を生成する動作;をさらに含む
請求項6に記載の深度マップイメージ生成方法。 - 前記深度マップイメージ生成方法は、
使用者端末を通じて使用者に前記球状仮想イメージを提供する動作;および
前記使用者から前記球状仮想イメージの少なくとも一地点に対する使用者要請を受信すれば、前記少なくとも一地点に対する深度情報を抽出して前記使用者端末に提供する動作;をさらに含む
請求項9に記載の深度マップイメージ生成方法。 - コンピュータ読み取り可能なインストラクション(instructions)を保存している保存媒体において、
前記インストラクションは、コンピューティング装置によって実行される時、前記コンピューティング装置に、
ニューラルネットワークを利用して学習RGBイメージに対する推定深度マップを生成する動作;および
球状変換に基づいて生成された、学習深度マップ-前記学習深度マップは前記学習RGBイメージにマッチングされ深度情報を有する-および前記推定深度マップ間の差に基づいて前記ニューラルネットワークをトレーニングする動作;を遂行するようにし、
前記インストラクションを実行することによって、
前記学習深度マップイメージおよび前記第1推定深度マップイメージを球状変換し、
球状変換された学習深度マップイメージと球状変換された第1推定深度マップイメージ間のロスを決定し、
決定されたロスに対応して前記ニューラルネットワークの媒介変数を変更して前記ニューラルネットワークをトレーニングする
ことを特徴とする保存媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0081814 | 2021-06-23 | ||
KR1020210081608A KR102551467B1 (ko) | 2021-06-23 | 2021-06-23 | 깊이 맵 이미지 생성 방법 및 그를 위한 컴퓨팅 장치 |
KR10-2021-0081608 | 2021-06-23 | ||
KR1020210081814A KR102536096B1 (ko) | 2021-06-23 | 2021-06-23 | 학습 데이터 생성 방법 및 그를 위한 컴퓨팅 장치 |
PCT/KR2021/012652 WO2022270683A1 (ko) | 2021-06-23 | 2021-09-16 | 깊이 맵 이미지 생성 방법 및 그를 위한 컴퓨팅 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023534883A JP2023534883A (ja) | 2023-08-15 |
JP7414332B2 true JP7414332B2 (ja) | 2024-01-16 |
Family
ID=84542369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022545059A Active JP7414332B2 (ja) | 2021-06-23 | 2021-09-16 | 深度マップイメージ生成方法およびそのためのコンピューティング装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220414909A1 (ja) |
EP (1) | EP4174773A1 (ja) |
JP (1) | JP7414332B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015001760A (ja) | 2013-06-13 | 2015-01-05 | 任天堂株式会社 | 画像処理システム、画像処理装置、画像処理プログラム、および画像処理方法 |
JP2016035742A (ja) | 2014-07-31 | 2016-03-17 | キヤノンマーケティングジャパン株式会社 | 情報処理システム、その制御方法、及びプログラム、並びに、情報処理装置、その制御方法、及びプログラム |
CN112771539A (zh) | 2018-09-25 | 2021-05-07 | 马特波特公司 | 采用使用神经网络从二维图像预测的三维数据以用于3d建模应用 |
-
2021
- 2021-09-16 JP JP2022545059A patent/JP7414332B2/ja active Active
- 2021-09-16 EP EP21939986.2A patent/EP4174773A1/en active Pending
-
2022
- 2022-08-01 US US17/878,206 patent/US20220414909A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015001760A (ja) | 2013-06-13 | 2015-01-05 | 任天堂株式会社 | 画像処理システム、画像処理装置、画像処理プログラム、および画像処理方法 |
JP2016035742A (ja) | 2014-07-31 | 2016-03-17 | キヤノンマーケティングジャパン株式会社 | 情報処理システム、その制御方法、及びプログラム、並びに、情報処理装置、その制御方法、及びプログラム |
CN112771539A (zh) | 2018-09-25 | 2021-05-07 | 马特波特公司 | 采用使用神经网络从二维图像预测的三维数据以用于3d建模应用 |
Non-Patent Citations (1)
Title |
---|
Giovanni Pintore et al.,SliceNet: deep dense depth estimation from a single indoor panorama using a slice-based representation,[online],2021年06月01日, https://www.semanticscholar.org/paper/SliceNet%3A-deep-dense-depth-estimation-from-a-single-Pintore-Almansa/a868b61f141bce392a15b8db1a79a658ad03661e |
Also Published As
Publication number | Publication date |
---|---|
EP4174773A1 (en) | 2023-05-03 |
JP2023534883A (ja) | 2023-08-15 |
US20220414909A1 (en) | 2022-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11145083B2 (en) | Image-based localization | |
US10832432B2 (en) | Method for training convolutional neural network to reconstruct an image and system for depth map generation from an image | |
US11380017B2 (en) | Dual-view angle image calibration method and apparatus, storage medium and electronic device | |
CN109683699B (zh) | 基于深度学习实现增强现实的方法、装置及移动终端 | |
CN110163898B (zh) | 深度信息配准方法、装置、***、设备及存储介质 | |
JP2019510311A (ja) | 平面の鏡を用いたステレオ画像システムを較正するための方法およびコンピュータプログラム製品 | |
CN113129425B (zh) | 一种人脸图像三维重建方法、存储介质及终端设备 | |
US8509522B2 (en) | Camera translation using rotation from device | |
CN113643414A (zh) | 一种三维图像生成方法、装置、电子设备及存储介质 | |
CN114332125A (zh) | 点云重建方法、装置、电子设备和存储介质 | |
CN114998433A (zh) | 位姿计算方法、装置、存储介质以及电子设备 | |
US10529085B2 (en) | Hardware disparity evaluation for stereo matching | |
US20160335771A1 (en) | Incremental global non-rigid alignment of three-dimensional scans | |
US11893681B2 (en) | Method for processing two-dimensional image and device for executing method | |
JP7414332B2 (ja) | 深度マップイメージ生成方法およびそのためのコンピューティング装置 | |
JP7353675B2 (ja) | 3次元仮想モデルを提供するためのホールフィリング方法及びそのためのコンピューティング装置 | |
CN111742352A (zh) | 3d对象建模方法以及相关设备和计算机程序产品 | |
KR102536096B1 (ko) | 학습 데이터 생성 방법 및 그를 위한 컴퓨팅 장치 | |
KR102551467B1 (ko) | 깊이 맵 이미지 생성 방법 및 그를 위한 컴퓨팅 장치 | |
CN115880526A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
US11908070B2 (en) | Dynamic three-dimensional imaging method | |
KR20200071008A (ko) | 2차원 이미지 처리 방법 및 이 방법을 실행하는 디바이스 | |
JP6384961B2 (ja) | カメラキャリブレーション装置、カメラキャリブレーション方法、カメラキャリブレーションプログラム及び記録媒体 | |
US20240037780A1 (en) | Object recognition method and apparatus, electronic device, computer-readable storage medium, and computer program product | |
CN112163509B (zh) | 图像处理方法、装置、网络设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7414332 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |