JP7143449B2 - デプス画像補完方法及び装置、コンピュータ可読記憶媒体 - Google Patents

デプス画像補完方法及び装置、コンピュータ可読記憶媒体 Download PDF

Info

Publication number
JP7143449B2
JP7143449B2 JP2020568542A JP2020568542A JP7143449B2 JP 7143449 B2 JP7143449 B2 JP 7143449B2 JP 2020568542 A JP2020568542 A JP 2020568542A JP 2020568542 A JP2020568542 A JP 2020568542A JP 7143449 B2 JP7143449 B2 JP 7143449B2
Authority
JP
Japan
Prior art keywords
image
diffusion
pixel
waiting
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020568542A
Other languages
English (en)
Other versions
JP2022501681A (ja
Inventor
▲許▼▲やん▼
祝新革
石建萍
章国▲鋒▼
李▲鴻▼升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Sensetime Lingang Intelligent Technology Co Ltd
Original Assignee
Shanghai Sensetime Lingang Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Sensetime Lingang Intelligent Technology Co Ltd filed Critical Shanghai Sensetime Lingang Intelligent Technology Co Ltd
Publication of JP2022501681A publication Critical patent/JP2022501681A/ja
Application granted granted Critical
Publication of JP7143449B2 publication Critical patent/JP7143449B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/529Depth or shape recovery from texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/89Lidar systems specially adapted for specific applications for mapping or imaging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/60Image enhancement or restoration using machine learning, e.g. neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/80Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10032Satellite or aerial image; Remote sensing
    • G06T2207/10044Radar image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Electromagnetism (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Image Processing (AREA)
  • Measurement Of Optical Distance (AREA)
  • Image Analysis (AREA)

Description

(関連出願の相互参照)
本願は、2019年08月30日にに提出された、出願番号が201910817815.1である中国特許出願に基づく優先権を主張し、該中国特許出願の全内容が参照として本願に組み込まれる。
本願は、画像処理技術に関し、特にデプス画像補完方法及び装置、コンピュータ可読記憶媒体に関する。
現在、一般的なデプス画像取得方法は、ライダー(Light Detection And Ranging:LiDAR)センサ、両眼カメラ、飛行時間型(Time of Flight:TOF)センサなどにより、三次元シーンのデプス画像を取得する。両眼カメラとTOFセンサの有効距離は、一般的には、10m内であり、スマートフォンなどの端末に適用されることが多い。LiDARの有効距離が大きく、数十メートル、ひいては百メートルに達することができ、自動運転、ロボットなどの分野に適用可能である。
LiDARを利用してデプス画像を取得する時、三次元シーンにレーザビームを発射し、続いて、三次元シーンにおける各物体の表面から反射されたレーザビームを受信し、発射時刻と反射時刻との時間差を算出し、三次元シーンのデプス画像を取得する。しかしながら、実際の適用において、一般的には、32/64ビームのLiDARを主に利用するため、疎らなデプス画像しか取得できない。デプス画像補完は、デプス画像を密なデプス画像に復元するプロセスである。関連技術において、デプス画像補完は、デプス画像を直接的にニューラルネットワークに入力し、密なデプス画像を得ることである。しかしながら、このような方式は、疎らポイントクラウドデータを十分に利用していないため、得られた密なデプス画像の正確度が低い。
本願は、疎らなポイントクラウドデータを十分に利用し、補完後のデプス画像の正確度を向上させることができるデプス画像補完方法及び装置、コンピュータ可読記憶媒体を提供する。
本願の技術的解決手段は、以下のように実現する。
第1態様によれば、本願の実施例は、デプス画像補完方法を提供する。前記方法は、
設けられたレーダーにより、ターゲットシーンのデプス画像を収集し、設けられたカメラにより、前記ターゲットシーンの二次元画像を収集することと、
収集されたデプス画像及び前記二次元画像に基づいて、拡散待ち画像及び特徴画像を決定することと、
前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定することであって、前記拡散強度は、前記拡散待ち画像における各画素の画素値が隣接画素へ拡散する強度を表す、ことと、
前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定することと、を含む。
第2態様によれば、本願の実施例は、デプス画像補完装置を提供する。前記装置は、
設けられたレーダーにより、ターゲットシーンのデプス画像を収集し、設けられたカメラにより、前記ターゲットシーンの二次元画像を収集するように構成される収集モジュールと、
収集されたデプス画像及び前記二次元画像に基づいて、拡散待ち画像及び特徴画像を決定し、前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定するように構成される処理モジュールであって、前記拡散強度は、前記拡散待ち画像における各画素の画素値が隣接画素へ拡散する強度を表す、処理モジュールと、
前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定するように構成される拡散モジュールと、を備える。
第3態様によれば、本願の実施例は、デプス画像補完装置を更に提供する。前記装置は、メモリと、プロセッサと、を備え、
前記メモリは、実行可能なデプス画像補完命令を記憶するように構成され、
前記プロセッサは、前記メモリに記憶された実行可能なデプス画像補完命令を実行し、上記第1態様のいずれか一項に記載の方法を実現させるように構成される。
第4態様によれば、本願の実施例は、コンピュータ可読記憶媒体を提供する。前記コンピュータ可読記憶媒体に、実行可能なデプス画像補完命令が記憶されており、プロセッサにより実行される時、上記第1態様のいずれか一項に記載の方法を実現させる。
本願明細書は、例えば、以下の項目も提供する。
(項目1)
デプス画像補完方法であって、前記方法は、
設けられたレーダーにより、ターゲットシーンのデプス画像を収集し、設けられたカメラにより、前記ターゲットシーンの二次元画像を収集することと、
収集されたデプス画像及び前記二次元画像に基づいて、拡散待ち画像及び特徴画像を決定することと、
前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定することであって、前記拡散強度は、前記拡散待ち画像における各画素の画素値が隣接画素へ拡散する強度を表す、ことと、
前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定することと、を含む、デプス画像補完方法。
(項目2)
前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定することは、
前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、前記拡散待ち画像における各画素の拡散後の画素値を決定することと、
前記拡散待ち画像における各画素の拡散後の画素値に基づいて、補完後のデプス画像を決定することと、を含むことを特徴とする
項目1に記載の方法。
(項目3)
前記拡散待ち画像は、初期段階の補完デプス画像であり、前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定することは、
前記拡散待ち画像における各画素の拡散後の画素値を拡散後の画像の各画素の画素値とすることと、
拡散後の画像を補完後のデプス画像とすることと、を含むことを特徴とする
項目2に記載の方法。
(項目4)
前記拡散待ち画像は、第1平面原点距離画像であり、前記デプス画像及び前記二次元画像に基づいて拡散待ち画像及び特徴画像を決定することは、
前記カメラのパラメータ行列を取得することと、
前記収集されたデプス画像及び前記二次元画像に基づいて、前記初期段階の補完デプス画像、前記特徴画像及び法線方向予測画像を決定することであって、前記法線方向予測画像は、三次元シーンにおける各点の法線ベクトルを画素値とした画像を指す、ことと、
前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出することであって、前記第1平面原点距離画像は、前記初期段階の補完デプス画像を利用して算出された前記カメラから前記三次元シーンにおける各点の所在する平面までの距離を画素値とした画像である、ことと、を含むことを特徴とする
項目2に記載の方法。
(項目5)
前記方法は、
前記収集されたデプス画像及び前記二次元画像に基づいて第1信頼度画像を決定することであって、前記第1信頼度画像は、前記収集されたデプス画像における各画素に対応する信頼度を画素値として用いた画像を指す、ことと、
前記収集されたデプス画像、前記パラメータ行列及び前記法線方向予測画像に基づいて、第2平面原点距離画像を算出することであって、前記第2平面原点距離画像は、前記収集されたデプス画像を利用して算出された前記カメラから前記三次元シーンにおける各点の所在する平面までの距離を画素値として用いた画像を指す、ことと、
前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得ることと、を更に含むことを特徴とする
項目4に記載の方法。
(項目6)
前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得ることは、
前記第2平面原点距離画像から、前記第1平面原点距離画像の第1画素点に対応する画素点を置換え画素点として決定し、前記置換え画素点の画素値を決定することであって、前記第1画素点は、前記第1平面原点距離画像におけるいずれか1つの画素点である、ことと、
前記第1信頼度画像から、前記置換え画素点に対応する信頼度情報を決定することと、
前記置換え画素点の画素値、前記信頼度情報及び前記第1平面原点距離画像の第1画素点の画素値に基づいて、前記第1平面原点距離画像の前記第1画素点の最適化後の画素値を決定することと、
を繰り返して実行し、前記第1平面原点距離画像の各画素の最適化後の画素値を決定して前記最適化後の第1平面原点距離画像を得るまで継続すること、を含むことを特徴とする
項目5に記載の方法。
(項目7)
前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定することは、
所定拡散範囲に基づいて、前記拡散待ち画像から、前記拡散待ち画像の第2画素点に対応する拡散待ち画素集合を決定し、前記拡散待ち画素集合における各画素の画素値を決定することであって、前記第2画素点は、前記拡散待ち画像におけるいずれか1つの画素点である、ことと、
前記特徴画像、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する拡散強度を算出することと、を含み、
前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、前記拡散待ち画像における各画素の拡散後の画素値を決定することは、
前記拡散待ち画像の第2画素点の拡散強度、前記拡散待ち画像の第2画素点の画素値及び前記拡散待ち画素集合における各画素の画素値に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を決定すること、
を繰り返して実行し、前記拡散待ち画像における各画素の拡散後の画素値を決定するまで継続すること、を含むことを特徴とする
項目2-6のうちいずれか一項に記載の方法。
(項目8)
前記特徴画像、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する拡散強度を算出することは、
拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出することと、
前記特徴画像において、前記拡散待ち画像の第2画素点に対応する画素を第1特徴画素とすることと、
前記特徴画像において、前記拡散待ち画素集合における第3画素点に対応する画素を第2特徴画素とすることであって、前記第3画素点は、拡散待ち画素集合におけるいずれか1つの画素点である、ことと、
前記第1特徴画素の特徴情報及び前記第2特徴画素の特徴情報を抽出することと、
前記第1特徴画素の特徴情報、前記第2特徴画素の特徴情報、前記強度正規化パラメータ及び所定拡散制御パラメータ利用して、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における第3画素点からなる拡散画素ペアのサブ拡散強度を算出することと、
を繰り返して実行し、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素からなる拡散画素ペアのサブ拡散強度を決定するまで継続することと、
前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素からなる拡散画素ペアのサブ拡散強度を前記拡散待ち画像の第2画素点に対応する拡散強度とすることと、を含むことを特徴とする
項目7に記載の方法。
(項目9)
前記サブ拡散強度は、前記拡散待ち画像の第2画素点と前記拡散待ち画素集合における第3画素点との類似度であることを特徴とする
項目8に記載の方法。
(項目10)
拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出することは、
前記拡散待ち画像の第2画素点の特徴情報及び前記拡散待ち画素集合における第3画素点の特徴情報を抽出することと、
抽出して得られた拡散待ち画像の第2画素点の特徴情報、前記拡散待ち画素集合における第3画素点の特徴情報及び前記所定拡散制御パラメータ利用して、前記拡散待ち画素集合における第3画素点のサブ正規化パラメータを算出することと、
を繰り返して実行し、前記拡散待ち画素集合における各画素のサブ正規化パラメータを得るまで継続することと、
前記拡散待ち画素集合における各画素のサブ正規化パラメータに対して累加を行い、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを得ることと、を含むことを特徴とする
項目8に記載の方法。
(項目11)
前記拡散待ち画像の第2画素点の拡散強度、前記拡散待ち画像の第2画素点の画素値及び前記拡散待ち画素集合における各画素の画素値に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を決定することは、
前記拡散強度における各サブ拡散強度をそれぞれ前記拡散待ち画像の第2画素点の画素値と乗算し、得られた乗算結果を累加し、前記拡散待ち画像の第2画素点の第1拡散部を得ることと、
前記拡散強度における各サブ拡散強度をそれぞれ拡散待ち画素集合における各画素の画素値と乗算し、得られた乗算結果を累加し、前記拡散待ち画像の第2画素点の第2拡散部を得ることと、
前記拡散待ち画像の第2画素点の画素値、前記拡散待ち画像の第2画素点の第1拡散部及び前記拡散待ち画像の第2画素点の第2拡散部に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を算出することと、を含むことを特徴とする
項目8に記載の方法。
(項目12)
前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定した後、前記方法は、
前記補完後のデプス画像を拡散待ち画像とし、前記拡散待ち画像及び前記特徴画像に基づいて前記拡散待ち画像における各画素の拡散強度を決定するステップ、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて前記拡散待ち画像における各画素の拡散後の画素値を決定するステップ、及び前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するステップを繰り返して実行し、所定の繰り返し回数に達するまで継続することを更に含むことを特徴とする
項目3に記載の方法。
(項目13)
前記拡散待ち画像における各画素の拡散後の画素値に基づいて、補完後のデプス画像を決定した後、前記方法は、
前記補完後のデプス画像を初期段階の補完デプス画像とし、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出して前記第1平面原点距離画像を拡散待ち画像とするステップ、前記拡散待ち画像及び前記特徴画像に基づいて前記拡散待ち画像における各画素の拡散強度を決定するステップ、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて前記拡散待ち画像における各画素の拡散後の画素値を決定するステップ、及び前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するステップを繰り返して実行し、所定の繰り返し回数に達するまで継続することを更に含むことを特徴とする
項目4-11のうちいずれか一項に記載の方法。
(項目14)
毎回に実行される、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出して前記第1平面原点距離画像を拡散待ち画像とするステップは、
前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出するステップと、
前記収集されたデプス画像及び前記二次元画像に基づいて、第1信頼度画像を決定するステップと、
前記収集されたデプス画像、パラメータ行列及び法線方向予測画像に基づいて、第2平面原点距離画像を算出するステップと、
前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得て、最適化後の第1平面原点距離画像を拡散待ち画像とするステップと、を含むことを特徴とする
項目13に記載の方法。
(項目15)
デプス画像補完装置であって、前記装置は、
設けられたレーダーにより、ターゲットシーンのデプス画像を収集し、設けられたカメラにより、前記ターゲットシーンの二次元画像を収集するように構成される収集モジュールと、
収集されたデプス画像及び前記二次元画像に基づいて、拡散待ち画像及び特徴画像を決定し、前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定するように構成される処理モジュールであって、前記拡散強度は、前記拡散待ち画像における各画素の画素値が隣接画素へ拡散する強度を表す、処理モジュールと、
前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定するように構成される拡散モジュールと、を備える、デプス画像補完装置。
(項目16)
前記拡散モジュールは更に、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、前記拡散待ち画像における各画素の拡散後の画素値を決定し、前記拡散待ち画像における各画素の拡散後の画素値に基づいて、補完後のデプス画像を決定するように構成されることを特徴とする
項目15に記載のデプス画像補完装置。
(項目17)
前記拡散待ち画像は、初期段階の補完デプス画像であり、
前記拡散モジュールは、前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するように構成される場合、更に、前記拡散待ち画像における各画素の拡散後の画素値を拡散後の画像の各画素の画素値とし、拡散後の画像を補完後のデプス画像とするように構成されることを特徴とする
項目16に記載のデプス画像補完装置。
(項目18)
前記拡散待ち画像は、第1平面原点距離画像であり、
前記処理モジュールは、前記デプス画像及び前記二次元画像に基づいて拡散待ち画像及び特徴画像を決定するように構成される場合、更に、前記カメラのパラメータ行列を取得し、前記デプス画像及び前記二次元画像に基づいて、前記初期段階の補完デプス画像、前記特徴画像及び法線方向予測画像を決定するように構成され、前記法線方向予測画像は、三次元シーンにおける各点の法線ベクトルを画素値とした画像を指し、前記処理モジュールは更に、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出するように構成され、前記第1平面原点距離画像は、前記初期段階の補完デプス画像を利用して算出された前記カメラから前記三次元シーンにおける各点の所在する平面までの距離を画素値とした画像であることを特徴とする
項目16に記載のデプス画像補完装置。
(項目19)
前記処理モジュールは更に、前記デプス画像及び前記二次元画像に基づいて第1信頼度画像を決定するように構成され、前記第1信頼度画像は、前記デプス画像における各画素に対応する信頼度を画素値として用いた画像を指し、前記処理モジュールは更に、前記デプス画像、前記パラメータ行列及び前記法線方向予測画像に基づいて、第2平面原点距離画像を算出するように構成され、前記第2平面原点距離画像は、前記デプス画像を利用して算出された前記カメラから前記三次元シーンにおける各点の所在する平面までの距離を画素値として用いた画像を指し、前記処理モジュールは更に、前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得るように構成されることを特徴とする
項目18に記載のデプス画像補完装置。
(項目20)
前記処理モジュールは、前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得るように構成される場合、更に、前記第2平面原点距離画像から、前記第1平面原点距離画像の第1画素点に対応する画素点を置換え画素点として決定し、前記置換え画素点の画素値を決定することであって、前記第1画素点は、前記第1平面原点距離画像におけるいずれか1つの画素点である、ことと、前記第1信頼度画像から、前記置換え画素点に対応する信頼度情報を決定することと、前記置換え画素点の画素値、前記信頼度情報及び前記第1平面原点距離画像の第1画素点の画素値に基づいて、前記第1平面原点距離画像の前記第1画素点の最適化後の画素値を決定することと、を繰り返して実行し、前記第1平面原点距離画像の各画素の最適化後の画素値を決定して前記最適化後の第1平面原点距離画像を得るまで継続するように構成されることを特徴とする
項目19に記載のデプス画像補完装置。
(項目21)
前記処理モジュールは、前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定するように構成される場合、更に、所定拡散範囲に基づいて、前記拡散待ち画像から、前記拡散待ち画像の第2画素点に対応する拡散待ち画素集合を決定し、前記拡散待ち画素集合における各画素の画素値を決定するように構成され、前記第2画素点は、前記拡散待ち画像におけるいずれか1つの画素点であり、前記処理モジュールは更に、前記特徴画像、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する拡散強度を算出するように構成され、
前記拡散モジュールは、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、前記拡散待ち画像における各画素の拡散後の画素値を決定するように構成される場合、更に、前記拡散待ち画像の第2画素点の拡散強度、前記拡散待ち画像の第2画素点の画素値及び前記拡散待ち画素集合における各画素の画素値に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を決定すること、を繰り返して実行し、前記拡散待ち画像における各画素の拡散後の画素値を決定するまで継続するように構成されることを特徴とする
項目16-20のうちいずれか一項に記載のデプス画像補完装置。
(項目22)
前記処理モジュールは、前記特徴画像、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する拡散強度を算出するように構成される場合、更に、拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出することと、前記特徴画像において、前記拡散待ち画像の第2画素点に対応する画素を第1特徴画素とすることと、前記特徴画像において、前記拡散待ち画素集合における第3画素点に対応する画素を第2特徴画素とすることであって、前記第3画素点は、拡散待ち画素集合におけるいずれか1つの画素点である、ことと、前記第1特徴画素の特徴情報及び前記第2特徴画素の特徴情報を抽出することと、前記第1特徴画素の特徴情報、前記第2特徴画素の特徴情報、前記強度正規化パラメータ及び所定拡散制御パラメータ利用して、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における第3画素点からなる拡散画素ペアのサブ拡散強度を算出することと、を繰り返して実行し、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素からなる拡散画素ペアのサブ拡散強度を決定するまで継続することと、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素からなる拡散画素ペアのサブ拡散強度を前記拡散待ち画像の第2画素点に対応する拡散強度とすることと、を実行するように構成されることを特徴とする
項目21に記載のデプス画像補完装置。
(項目23)
前記処理モジュールは、拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出するように構成される場合、更に、前記拡散待ち画像の第2画素点の特徴情報及び前記拡散待ち画素集合における第3画素点の特徴情報を抽出することと、抽出して得られた拡散待ち画像の第2画素点の特徴情報、前記拡散待ち画素集合における第3画素点の特徴情報及び前記所定拡散制御パラメータ利用して、前記拡散待ち画素集合における第3画素点のサブ正規化パラメータを算出することと、を繰り返して実行し、前記拡散待ち画素集合における各画素のサブ正規化パラメータを得るまで継続することと、前記拡散待ち画素集合における各画素のサブ正規化パラメータに対して累加を行い、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを得ることと、実行するように構成されることを特徴とする
項目22に記載のデプス画像補完装置。
(項目24)
前記拡散モジュールは、前記拡散待ち画像の第2画素点の拡散強度、前記拡散待ち画像の第2画素点の画素値及び前記拡散待ち画素集合における各画素の画素値に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を決定するように構成される場合、更に、前記拡散強度における各サブ拡散強度をそれぞれ前記拡散待ち画像の第2画素点の画素値と乗算し、得られた乗算結果を累加し、前記拡散待ち画像の第2画素点の第1拡散部を得て、前記拡散強度における各サブ拡散強度をそれぞれ拡散待ち画素集合における各画素の画素値と乗算し、得られた乗算結果を累加し、前記拡散待ち画像の第2画素点の第2拡散部を得て、前記拡散待ち画像の第2画素点の画素値、前記拡散待ち画像の第2画素点の第1拡散部及び前記拡散待ち画像の第2画素点の第2拡散部に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を算出するように構成されることを特徴とする
項目22に記載のデプス画像補完装置。
(項目25)
前記拡散モジュールは更に、前記補完後のデプス画像を拡散待ち画像とし、前記拡散待ち画像及び前記特徴画像に基づいて前記拡散待ち画像における各画素の拡散強度を決定するステップ、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて前記拡散待ち画像における各画素の拡散後の画素値を決定するステップ、及び前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するステップを繰り返して実行し、所定の繰り返し回数に達するまで継続するように構成されることを特徴とする
項目17に記載のデプス画像補完装置。
(項目26)
前記拡散モジュールは更に、前記補完後のデプス画像を初期段階の補完デプス画像とし、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出して前記第1平面原点距離画像を拡散待ち画像とするステップ、前記拡散待ち画像及び前記特徴画像に基づいて前記拡散待ち画像における各画素の拡散強度を決定するステップ、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて前記拡散待ち画像における各画素の拡散後の画素値を決定するステップ、及び前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するステップを繰り返して実行し、所定の繰り返し回数に達するまで継続するように構成されることを特徴とする
項目18-24のうちいずれか一項に記載のデプス画像補完装置。
(項目27)
前記拡散モジュールは、毎回に実行される、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出して前記第1平面原点距離画像を拡散待ち画像とするように構成される場合、更に、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び法線方向予測画像に基づいて、第1平面原点距離画像を算出し、前記デプス画像及び前記二次元画像に基づいて、第1信頼度画像を決定し、前記デプス画像、パラメータ行列及び法線方向予測画像に基づいて、第2平面原点距離画像を算出し、前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得て、最適化後の第1平面原点距離画像を拡散待ち画像とするように構成されることを特徴とする
項目26に記載のデプス画像補完装置。
(項目28)
デプス画像補完装置であって、前記装置は、メモリと、プロセッサと、を備え、
前記メモリは、実行可能なデプス画像補完命令を記憶するように構成され、
前記プロセッサは、前記メモリに記憶された実行可能なデプス画像補完命令を実行し、項目1-14のうちいずれか一項に記載の方法を実現させるように構成される、デプス画像補完装置。
(項目29)
コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体に、実行可能なデプス画像補完命令が記憶されており、実行可能なデプス画像補完命令が、プロセッサに、項目1-14のうちいずれか一項に記載の方法を実現させる、コンピュータ可読記憶媒体。
本願の実施例は、デプス画像補完方法及び装置、コンピュータ可読記憶媒体を提供する。設けられたレーダーにより、ターゲットシーンのデプス画像を収集し、設けられたカメラにより、前記ターゲットシーンの二次元画像を収集し、収集されたデプス画像及び二次元画像に基づいて、拡散待ち画像及び特徴画像を決定し、拡散待ち画像及び特徴画像に基づいて、拡散待ち画像における各画素の拡散強度を決定する。拡散強度は、拡散待ち画像における各画素の画素値が隣接画素へ拡散する強度を表す。拡散待ち画像における各画素の画素値及び拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定する。上記実現方式を利用することで、収集されたデプス画像及び二次元画像に基づいて、拡散待ち画像を得ることができる。拡散待ち画像に、収集されたデプス画像における全てのポイントクラウドデータが残されている。これにより、拡散待ち画像における各画素値及びそれに対応する拡散強度を利用して、拡散待ち画像における各画素の拡散後の画素値を決定する時、収集されたデプス画像における全てのポイントクラウドデータを利用する。これにより、収集されたデプス画像におけるポイントクラウドデータを十分に利用することで、三次元シーンにおける各3D点のデプス情報の正確度がより高くなり、補完後のデプス画像の正確度が向上した。
本願の実施例によるデプス画像補完方法を示す第1フローチャートである。 本願の実施例によるデプス画像補完方法を示す第2フローチャートである。 本願の実施例による第1平面原点距離画像の演算を示す概略図である。 本願の実施例による収集されたデプス画像の雑音を示す概略図である。 本願の実施例による第1信頼度画像を示す概略図である。 本願の実施例によるデプス画像補完方法を示す第3フローチャートである。 本願の実施例によるデプス画像補完方法のプロセスを示す第1概略図である。 本願の実施例によるデプス画像補完方法のプロセスを示す第2概略図である。 本願の実施例によるデプス画像補完方法のプロセスを示す第3概略図である。 本願の実施例によるデプス画像補完方法を示す第4フローチャートである。 本願の実施例によるデプス画像補完方法を示す第5フローチャートである。 本願の実施例による拡散待ち画像の第2画素点の拡散後の画素値を示す概略図である。 本願の実施例による所定の繰り返し回数の値による補完後のデプス画像の誤差への影響を示す第1概略図である。 本願の実施例による所定の繰り返し回数の値による補完後のデプス画像の誤差への影響を示す第2概略図である。 本願の実施例による所定の誤差フォールトトレラントパラメータによる第1信頼度画像の真値画像への影響を示す概略図である。 本願の実施例による所定の誤差フォールトトレラントパラメータによる信頼度の真値-絶対誤差曲線分布への影響を示す概略図である。 本願の実施例による所定の予測モデルのサンプリング率による補完後のデプス画像への影響を示す第1概略図である。 本願の実施例による所定の予測モデルのサンプリング率による補完後のデプス画像への影響を示す第2概略図である。 本願の実施例による三次元シーンの収集されたデプス画像及び二次元画像を示す概略図である。 本願の実施例による畳み込み空間伝播ネットワークで得られた補完したデプス画像を示す図である。 本願の実施例によるNConv-畳み込みニューラルネットワークで得られた補完したデプス画像を示す図である。 関連技術における疎-密な方法で得られた補完したデプス画像を示す。 本願の実施例による法線方向予測画像を示す図である。 本願の実施例による第1信頼度画像を示す図である。 本願の実施例による補完したデプス画像を示す図である。 本願の実施例によるデプス画像補完装置の構造を示す概略図である。 本願の実施例によるデプス画像補完装置の構造を示す概略図である。
以下、本願の実施例における図面を参照しながら、本願の実施例における技術的解決手段を明瞭かつ完全に説明する。
画像処理技術の成長に伴い、ますます多くの装置は、デプス画像を取得し、デプス画像を更に処理し、様々な機能を実現させることができる。一般的なデプス画像取得方法は、ライダー(Light Detection And Ranging:LiDAR)センサ、ミリ波レーダー、両眼カメラ、飛行時間型(Time of Flight:TOF)センサなどの方式で三次元シーンのデプス画像を得る。しかしながら、両眼カメラとTOFによるデプス画像取得の有効距離は、一般的には、10m内であり、一般的にスマートフォンなどの端末に適用され、顔などのターゲットのデプス画像を得る。LiDARの有効距離大きく、数十メートル、ひいては百メートルに達することができ、自動運転、ロボットなどの分野に適用可能である。
LiDARを利用してデプス画像を取得する時、三次元シーンにレーザビームを能動的に発射し、続いて、三次元シーンにおける各物体の表面から反射されたレーザビームを受信し、レーザビームを発射する発射時刻と反射レーザビームを受信する受信時刻との時間差を算出し、三次元シーンのデプス画像を取得する。LiDARがレーザビームの時間差に基づいてデプス画像を取得するため、LiDARで取得されたデプス画像は、疎らなポイントクラウドデータからなる。また、実際の適用において、一般的には、32/64ビームのLiDARを主に利用するため、疎らなデプス画像のみを取得することができる。従って、デプス補完により、疎らなデプス画像を密なデプス画像に変換しなければならない。関連技術において、デプス画像補完方法は、大量の疎らなデプス画像及び三次元シーンの二次元画像からなる訓練データにより、ニューラルネットワークに対して教師あり訓練を行い、訓練されたニューラルネットワークモデルを得て、続いて、疎らなデプス画像及び三次元シーンの二次元画像を訓練したニューラルネットワークのモデルに入力し、デプス補完プロセスを完了し、密なデプス画像を得る。しかしながら、このような方式において、デプス画像におけるポイントクラウドデータを十分に利用していないため、得られた補完したデプス画像の正確度が低い。
上記デプス補完方法に存在する問題に対して、本願の実施例の要旨は、収集された疎ら的なデプス画像及び三次元シーンの二次元画像に基づいて、拡散待ち画像を得て、続いて、拡散待ち画像で画素レベルの拡散を実現させ、補完後のデプス画像を得て、疎らなデプス画像における各疎らなポイントクラウドデータを十分に利用し、正確度が高いデプス補完画像を得ることである。
上記本願の実施例の要旨によれば、本願の実施例は、デプス画像補完方法を提供する。図1に示すように、該方法は、以下を含んでもよい。
S101において、設けられたレーダーにより、ターゲットシーンのデプス画像を収集し、設けられたカメラにより、前記ターゲットシーンの二次元画像を収集する。
本願の実施例は、収集された疎らなデプス画像に対してデプス画像補完を行うシーンで実現する。まず、それ自体に設けられたレーダーにより、ターゲットシーンのデプス画像を収集すると共に、装置上に設けられたカメラにより、ターゲットシーンの二次元画像を収集する。
設けられたレーダーによりデプス画像を収集する時、レーザビームの発射時刻と受信時刻との時間差に基づいて、レーザビームに対応する三次元シーンにおける3D点のデプス情報を算出し、算出したデプス情報を画素値として、デプス画像を得ることができることに留意されたい。勿論、例えば、位相情報のようなレーザビームの他の特性により、レーザビームに対応する3D点のデプス情報を算出して、デプス画像を得ることもできる。本願の実施例は、これを限定するものではない。
本願の実施例において、レーダーにより収集されたデプス画像は、疎らなデプス画像であることに留意されたい。
本願の実施例において、設けられたレーダーは、32/64ビームのLiDARセンサであってもよく、ミリ波レーダーであってもよく、又は他のタイプのレーダーであってもよく、本願の実施例は、これを限定するものではない。
本願の実施例において、設けられたカメラにより二次元画像を収集する時、カラーカメラの光学デバイスにより、三次元シーンにおける各3Dの画素値情報を得て、二次元画像を得ることができる。他の方式で、ターゲットシーンの二次元画像を得ることもでき、本願の実施例は、これを限定するものではない。
本願の幾つかの実施例において、設けられたカメラは、三次元シーンのカラーの二次元画像を得るカラーカメラであってもよい。三次元シーンの赤外グレースケール画像を得る赤外カメラであってもよい。勿論、設けられたカメラは、他のタイプのカメラであってもよく、本願の実施例は、これを限定するものではない。
本願の実施例において、収集されたデプス画像の解像度と二次元画像の解像度は、同じであっても異なってもよい。収集されたデプス画像の解像度と二次元画像の解像度が異なる時、収集されたデプス画像及び二次元画像のうちのいずれか1つに対してスケーリング操作を行うことで、収集されたデプス画像の解像度と二次元画像の解像度を一致させることができることに留意されたい。
本願の実施例において、レーダー及びカメラは、実際の需要に応じて設置されて配置されてもよく、本願の実施例は、これを限定するものではない。
S102において、収集されたデプス画像及び二次元画像に基づいて、拡散待ち画像及び特徴画像を得る。
S103において、拡散待ち画像及び特徴画像に基づいて、拡散待ち画像における各画素の拡散強度を決定し、拡散強度は、拡散待ち画像における各画素の画素値が隣接画素へ拡散する強度を表し、拡散強度に基づいて、拡散待ち画像における各画素の画素値が隣接画像へどのぐらい拡散するかを決定する。
拡散待ち画像及び特徴画像に基づいて、拡散待ち画像における各画素の拡散強度を決定する時、まず、拡散待ち画像における各画素に対して、隣接する幾つかの画素を決定し、続いて、特徴画像に基づいて、各画素とそれに対応する隣接画素との類似度を1つずつ対比することで、拡散強度を決定することに留意されたい。
S104において、拡散待ち画像における各画素の画素値及び拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定する。
本願の実施例において、拡散待ち画像は、デプス画像及び二次元画像に基づいて決定されたものであるため、拡散待ち画像に、収集されたデプス画像における全てのポイントクラウドデータが残されている。従って、拡散待ち画像における各画素の画素値及びそれに対応する拡散強度を利用して、拡散待ち画像における各画素の拡散した画素値を決定する時、収集されたデプス画像における全てのポイントクラウドデータを利用する。これにより得られた三次元シーンにおける各3D点に対応するデプス情報の正確度がより高く、補完後のデプス画像の正確度が向上した。
本願の幾つかの実施例において、拡散待ち画像における各画素の画素値及び拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定するステップS104の実現プロセスは、S1041-S1042を含んでもよい。
S1041において、拡散待ち画像における各画素の画素値及び拡散待ち画像における各画素の拡散強度に基づいて、拡散待ち画像における各画素の拡散後の画素値を決定する。
S1042において、拡散待ち画像における各画素の拡散後の画素値に基づいて、補完後のデプス画像を決定する。
なお、本願の実施例における補完後のデプス画像は、補完後の密なデプス画像を指している。それは、比較的包括的な三次元シーンのデプス情報を持ち、デプス画像を必要とする種々のシーンに直接的に適用可能である。
本願の実施例において、拡散待ち画像における各画素の画素値及びそれに対応する拡散強度を利用して拡散待ち画像における各画素の拡散後の画素値を算出し、拡散待ち画像における各画素の拡散後の画素値に基づいて、補完後のデプス画像を決定する場合、収集されたデプス画像における全てのポイントクラウドデータを利用する。従って、得られた三次元シーンにおける各3D点に対応するデプス情報の正確度がより高く、補完後のデプス画像の正確度が更に向上した。
上記実施例と同様な発明構想によれば、本願の幾つかの実施例において、拡散待ち画像は、初期段階の補完デプス画像であり、拡散待ち画像における各画素の拡散後の画素値に基づいて、補完後のデプス画像を決定するステップS1042の実現プロセスは、S1042a-S1042bを含んでもよい。
S1042aにおいて、拡散待ち画像における各画素の拡散後の画素値を拡散後の画像の各画素の画素値とする。
S1042bにおいて、拡散後の画像を補完後のデプス画像とする。
初めて得られる初期段階の補完デプス画像は、収集されたデプス画像及び二次元画像に基づいて得られた画像であり、つまり、収集されたデプス画像及び二次元画像に対して平面分割、デプス情報のパディングなどの操作を行い、三次元シーンにおける各3D点のデプス情報を得て画素値とすることで得られた画像であり、又は、初めて得られた初期段階の補完デプス画像は、関連技術により、収集されたデプス画像及び二次元画像を処理することで得られたものであることに留意されたい。ここで、初期段階の補完デプス画像におけるポイントクラウドデータの密度は、収集されたデプス画像におけるポイントクラウドデータの密度より大きい。
本願の実施例において、拡散待ち画像における各画素の拡散後の画素値を拡散後の画像の各画素の画素値とし、拡散後の画像を補完後のデプス画像とする。これにより、収集されたデプス画像における全てのポイントクラウドデータを十分に利用し、デプス画像におけるポイントクラウドデータを利用して、効果が高い補完後のデプス画像を得る。
本願の幾つかの実施例において、拡散待ち画像は、第1平面原点距離画像である。この場合、図2に示すように、収集されたデプス画像及び二次元画像に基づいて、拡散待ち画像及び特徴画像を決定するステップS102の実現プロセスは、S1021-S1023を含んでもよい。
S1021において、カメラのパラメータ行列を取得する。
取得されたパラメータ行列は、カメラに固有のパラメータ行列であり、該パラメータ行列は、カメラの内部パラメータ行列を指してもよく、カメラの射影変換パラメータ及び焦点距離が含まれてもよいことに留意されたい。勿論、パラメータ行列に、第1平面原点距離画像の算出に必要なパラメータが含まれてもよく、本願の実施例は、これを限定するものではない。
S1022において、収集されたデプス画像及び二次元画像に基づいて、初期段階の補完デプス画像、特徴画像及び法線方向予測画像を決定し、法線方向予測画像は、三次元シーンにおける各点の法線ベクトルを画素値とした画像を指す。
本願の実施例において、法線方向予測画像は、三次元シーンにおける各3D点の表面法線ベクトルを画素値とすることで得られた画像を指す。3D点の表面法線ベクトルは、該3D点から開始した該3D点に垂直な接平面のベクトルと定義される。
始めて得られた初期段階の補完デプス画像は、収集されたデプス画像及び二次元画像を利用することで決定された三次元シーンにおける各3D点の一次デプス情報を画素値とした画像を指すことに留意されたい。
S1023において、初期段階の補完デプス画像、カメラのパラメータ行列及び法線方向予測画像に基づいて、第1平面原点距離画像を算出し、第1平面原点距離画像は、初期段階の補完デプス画像を利用することで算出されたカメラと各点の所在する平面との距離を画素値とした画像である。
初期段階の補完デプス画像、パラメータ行列及び法線方向予測画像を得た後、初期段階の補完デプス画像における各画素の画素値、パラメータ行列及び法線方向予測画像における各画素の画素値に基づいて、各3D点に対して、第1平面原点距離を算出し、続いて、各3D点の第1平面原点距離を画素値として、第1平面原点距離画像を得る。これにより、後続で、第1平面原点距離画像及び特徴画像に基づいて、第1平面原点距離画像における各画素に対して、拡散後の画素値を算出することで、補完後のデプス画像を得る。
本願の実施例において、第1平面原点距離は、初期段階の補完デプス画像により算出されたカメラの中心と三次元シーンにおける各3D点の所在する接平面との距離を指す。
第1平面原点距離画像は、各3D点の第1平面原点距離であるカメラの中心と3D点の所在する接平面との距離を画素値とすることで得られた画像であるため、同一の接平面に位置する3D点は、同一又は類似の第1平面原点距離を有すべきである。1つの3D点の第1平面原点距離と、該3D点と同一の接平面に位置する他の3D点の第1平面原点距離と、の差が大きい場合、該3D点の第1平面原点距離が、修正されるべき異常値であることを表す。つまり、同一の接平面に位置する3D点は、幾何学的に制約される。該幾何学的制約の要旨によれば、第1平面原点距離画像及び特徴画像に基づいて、第1平面原点距離画像における各画素に対して、拡散後の画素値を算出する時、第1平面原点距離画像における異常値を修正し、正確率が高い第1平面原点距離画像を得て、更に、正確率が高い第1平面原点距離画像に基づいて、効果が高い補完後のデプス画像を得ることができる。
本願の実施例において、まず、三次元シーンにおける各3D点の第1平面原点距離を算出し、続いて、各3D点の第1平面原点距離を画素値とし、第1平面原点距離画像を得る。各3D点の第1平面原点距離を算出する時、まず、各3D点の、画像平面への2D投影を決定し、カメラのパラメータ行列に対して反転を行い、パラメータ行列の逆行列を得る。続いて、一次補完sれたデプス画像から、各3D点に対応する一次デプス情報を得て、法線方向予測画像から、各3D点の所在する接平面の法線ベクトルを得る。最後に、各3D点に対応する一次デプス情報、各3D点の所在する接平面法線ベクトル、パラメータ行列の逆行列及び3D点の、平面画像への2D投影を乗算することで、各3D点の第1平面原点距離を得る。
例示的に、本願の実施例において、3D点の第1平面原点距離を算出する式を提供する。それは、式(1)に示すとおりである。
Figure 0007143449000001
ただし、
Figure 0007143449000002
は、3D点の第1平面原点距離を表し、
Figure 0007143449000003
表示は、3D点の、平面画像への2D投影を表し、
Figure 0007143449000004
は、3D点に対応する一次デプス情報を表し、
Figure 0007143449000005
は、3D点Xの所在する接平面の法線ベクトルを表し、Cは、パラメータ行列を表す。これにより、3D点の、画像平面への2D投影の座標値、3D点に対応する一次デプス情報の値及び3D点の所在する接平面の法線ベクトルを得た後、それらを(1)に代入し、3D点の第1平面原点距離を算出し、続いて、各3D点の第1平面原点距離を画素値として、第1平面原点距離画像を得る。
幾何学的関係により、3D点の第1平面原点距離を算出する式を導き出すことができることに留意されたい。幾何学的関係から分かるように、カメラの中心から3D点の所在する接平面までの距離は、3D点の所在する平面におけるいずれか一点及び3D点の所在する平面の法線ベクトルにより決定されてもよい。3D点の三次元座標は、3D点の、画像平面への2D投影、3D点の一次デプス情報及びパラメータ行列により求められるため、カメラの中心から3D点の所在する接平面までの距離を、3D点の一次デプス情報、3D点の所在する平面の法線ベクトル、パラメータ行列及び2D投影により求めることができる。初期段階の補完デプス画像について言えば、各画素点の位置情報は、3D点の2D投影であり、各画素点の画素値は、3D点に対応するデプス情報である。同様に、法線方向予測画像について言えば、各画素点の位置情報は、3D点の2D投影であり、各画素点の画素値は、3D点の法線ベクトル情報である。従って、初期段階の補完デプス画像、法線方向予測画像及びパラメータ行列から、全ての3D点の第1平面原点距離を取得することができる。
例示的に、本願の実施例において、幾何的関係を利用して3D点の第1平面原点距離を算出する式を導き出すプロセスを提供する。つまり、式(1)の導き出しプロセスを提供する。
幾何的関係から分かるように、三次元シーンにおける3D点と3D点の所在する接平面の距離の関係は、式(2)に示すとおりである。
Figure 0007143449000006
ただし、Xは、三次元シーンにおける3D点を表し、
Figure 0007143449000007
は、3D点の、画像平面への2D投影を表し、
Figure 0007143449000008
は、3D点Xから開始した3D点Xの所在する接平面に垂直な法線ベクトルを表し、
Figure 0007143449000009
は、カメラの中心から3D点Xの所在する接平面までの距離を表し、つまり、3D点の一次デプス情報を表す。
式(2)に対して変換を行うことで、式(3)を得ることができる。
Figure 0007143449000010
三次元シーンにおける3D点は、式(4)で表される。
Figure 0007143449000011
ただし、Xは、三次元シーンにおける3D点を表し、
Figure 0007143449000012
は、3D点の、画像平面への2D投影を表し、
Figure 0007143449000013
は、3D点に対応する一次デプス情報を表し、Cは、パラメータ行列を表す。
式(4)を式(3)に代入することで、式(1)を得ることができる。
例示的に、本願の実施例は、第1平面原点距離画像の演算を表す概略図を提供する。図3に示すように、Oは、カメラの中心であり、Xは、三次元シーンにおける1つの3D点であり、
Figure 0007143449000014
は、3D点の、画像平面への2D投影であり、Fは、3D点の接平面であり、
Figure 0007143449000015
は、3D点の所在する接平面の法線ベクトルであり、
Figure 0007143449000016
は、3D点に対応する一次デプス情報である。初期段階の補完デプス画像を得た後、初期段階の補完デプス画像から、3D点の2D投影
Figure 0007143449000017
、該3D点に対応する一次デプス情報を知ることができる。続いて、法線方向予測画像から、知3D点の所在する接平面の法線ベクトルを知る。パラメータ行列Cは、既知のものであるため、3D点の2D投影
Figure 0007143449000018
、3D点に対応する一次デプス情報
Figure 0007143449000019
、法線ベクトル
Figure 0007143449000020
及びパラメータ行列Cを式(1)に代入することで、3D点の第1平面原点距離を算出することができる。式(1)により、三次元シーンにおける各3D点の第1平面原点距離を得た後、各3D点の第1平面原点距離を画素値として、第1平面原点距離画像を得ることができる。
本願の実施例において、収集されたデプス画像及び二次元画像を利用して、初期段階の補完デプス画像、特徴画像及び法線方向予測画像を得て、初期段階の補完デプス画像、法線方向予測画像及び自体に記憶されたパラメータ行列に基づいて、第1平面原点距離画像を算出し、第1平面原点距離画像における各画素について、拡散後の画素値を算出する。幾何学的制約により、第1平面原点距離画像における異常値を除去し、第1平面原点距離画像の正確率を向上させる。これにより、後続で、正確率が高い第1平面原点距離画像に基づいて、効果が高い補完後のデプス画像を得ることができる。
本願の幾つかの実施例において、初期段階の補完デプス画像、カメラのパラメータ行列及び法線方向予測画像に基づいて、第1平面原点距離画像を算出するステップS1023を実行した後、該方法は、S1024-S1026を更に含む。
S1024において、収集されたデプス画像及び二次元画像に基づいて、第1信頼度画像を決定し、第1信頼度画像は、デプス画像における各画素に対応する信頼度を画素値として用いた画像を指す。
本願の実施例において、第1信頼度画像は、三次元シーンにおける各3D点の一次デプス情報の信頼度を画素値として用いることで得られた画像を指す。
S1025において、収集されたデプス画像、パラメータ行列及び法線方向予測画像に基づいて、第2平面原点距離画像を算出し、前記第2平面原点距離画像は、収集されたデプス画像により算出されたカメラから三次元シーンの各点の所在する平面までの距離を画素値とした画像を指す。
本願の実施例において、第2平面原点距離は、デプス画像により算出されたカメラの中心から三次元シーンにおける3D点の所在する接平面までの距離を指す。
デプス画像、パラメータ行列及び法線方向予測結果に基づいて、第2平面原点距離画像を算出する時、まず、三次元シーンにおける各3D点の第2平面原点距離を算出する必要がある。各3D点の第2平面原点距離を算出する時、まず、各3D点の、画像への2D投影を決定し、パラメータ行列に対して逆演算を行い、パラメータ行列の逆行列を得て、続いて、収集されたデプス画像から、各3D点に対応するデプス情報を得て、法線方向予測画像から、各3D点の所在する接平面の法線ベクトルを得る。続いて、各3D点に対応するデプス情報、各3D点の所在する接平面の法線ベクトル、パラメータ行列の逆行列及の3D点の、平面画像への2D投影を乗算し、各3D点の第2平面原点距離を得る。
例示的に、本願の実施例において、式(5)により、各3D点の第2平面原点距離を算出することができる。
Figure 0007143449000021
ただし、
Figure 0007143449000022
は、3D点の第2平面原点距離であり、
Figure 0007143449000023
は、3D点に対応するデプス情報であり、
Figure 0007143449000024
は、3D点の所在する接平面の法線ベクトルであり、
Figure 0007143449000025
は、3D点の画像平面への2D投影であり、Cは、カメラのパラメータ行列である。各3D点のデプス情報の値、各3D点の所在する接平面の法線ベクトル、パラメータ行列及び各3D点の、画像への2D投影の座標を取得した後、これらを式(5)に代入して、各3D点の第2平面原点距離を算出することができる。続いて、全ての3D点の第2平面原点距離を画素値として、第2平面原点距離画像を得ることができる。
S1026において、第1信頼度画像における画素、第2平面原点距離画像における画素及び第1平面原点距離画像における画素に基づいて、第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得る。
レーダーにより、移動中のターゲット又は物体の縁に対してデプス情報収集を行う時、雑音は、不可避的に発生するため、収集されたデプス画像に、不確実なデプス情報が存在することに留意されたい。これに対して、第1信頼度画像を導入して、デプス情報の信頼性を評価することができる。
本願の実施例において、第1信頼度画像は、各3D点のデプス情報の信頼度である、デプス画像における各画素に対応する信頼度を画素値とすることで得られた画像を指す。
第1信頼度画像における画素、第2平面原点距離画像における画素及び第1平面原点距離画像における画素を利用して、第1平面原点距離画像を最適化する時、第1信頼度画像における1つの画素の画素値に基づいて、該画素に対応する3D点のデプス情報の信頼度を判定することができる。第1信頼度画像における該画素の画素値が高いと、該画素点に対応する3D点のデプス情報が確実であり、3D点の実際のデプスに近く、該画素点に対応する3D点の第2平面原点距離の信頼性もより高いと認められる。この場合、該画素点に対応する3D点の第2平面原点距離を利用して、該画素点に対応する3D点の第1平面原点距離に対して置き換え最適化を行うと、最適化後の第1平面原点距離画像における一部の画素値を実際の平面原点距離の画素点に近くすることができる。従って、最適化後の第1平面原点距離画像及び特徴画像に基づいて、画素拡散を実現させる時、第1平面原点距離画像における異常値を除去できるだけでなく、収集されたデプス画像における異常値を低減させ、最適化後の第1平面原点距離画像による影響を低下させ、最適化後の第1平面原点距離画像の正確度を更に向上させることができる。
本願の幾つかの実施例において、第1信頼度画像の画素値により、値の範囲を設定することで、元デプス情報の信頼度を表すことができる。例示的に、第1信頼度画像の画素値範囲は、[0,1]と設定されてもよい。第1信頼度画像の画素値が1に近いと、該画素点に対応する3D点の元デプス情報が確実であることを表す。第1信頼度画像の画素値が0時,該画素点に対応する3D点の元デプス情報が確実ではないことを表す。勿論、実際の状況に応じて、第1信頼度画像の画素値の範囲を設定してもよく、本願の実施例は、これを限定するものではない。
例示的に、本願の実施例は、収集されたデプス画像の雑音を示す概略図を提供する。図4(a)に示すように、レーダーが領域1において運動状態である自動車に対してデプス情報を収集する時、雑音が発生する。例えば、小さな四角い枠における点がずれる。これにより、得られたデプス情報は、実際のデプス情報に合わなく、デプス情報が確実ではない。この場合、図4(b)の領域1における各画素点の画素値により、原始デプス情報の信頼度を判定することができる。図4(b)から分かるように、領域1全体の色が濃く、領域1に、画素値が0に近い大量の画素点が存在することを表す。つまり、領域1に、デプス情報が確実ではない大量の画素点が存在する。画素の置換えを行う時、これらの画素点の信頼度状況に応じて、置き換えを行なわない。これにより、これらの画素点の、最適化した第1平面原点距離画像への影響を低減させる。
本願の実施例において、第1信頼度画像に基づいて、第2平面原点距離画像から、確実な第2平面原点距離を有する画素点を選び出し、第1平面原点距離画像において、該画素点に対応する画素点の画素値に対して置き換えを行い、最適化後の第1平面原点距離画像を得ることができる。これにより、最適化後の第1平面原点距離画像に基づいて、補完後のデプス画像を得ることができる。従って、第1平面原点距離画像における異常値を除去できるだけでなく、レーダーにより収集されたデプス画像における異常値により最適化後の第1平面原点距離画像への影響を低減させ、最適化した第1平面原点距離画像の正確度を向上させ、更に、補完したデプス画像の正確度を向上させることができる。
本願の幾つかの実施例において、第1信頼度画像における画素、第2平面原点距離画像における画素及び第1平面原点距離画像における画素に基づいて、第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得るステップS1026の実現プロセスは、S1026a-S1026eを含んでもよい。
S1026aにおいて、第2平面原点距離画像から、第1平面原点距離画像の第1画素点に対応する画素点を置換え画素点として決定し、置換え画素点の画素値を決定し、第1画素点は、第1平面原点距離画像におけるいずれか1つの画素点である。
置換え画素点を決定する時、第1平面原点距離画像の第1画素点の座標情報に基づいて、第2平面原点距離画像において、これに対応する画素点を探すと共に、該画素点の画素値を置換え画素点の画素値として取得することに留意されたい。
S1026b、第1信頼度画像から、置換え画素点に対応する信頼度情報を決定する。
置換え画素点及び置換え画素点の画素値を決定した後、第1信頼度画像から、置換え画素点の座標情報に基づいて、置換え画素点に対応する画素点を決定し、該画素点の信頼度情報である該画素点の画素値を取得する必要がある。これにより、置換え画素点に対応する信頼度情報を決定することができる。
S1026cにおいて、置換え画素点の画素値、信頼度情報及び第1平面原点距離画像の第1画素点の画素値に基づいて、第1平面原点距離画像の第1画素点の最適化後の画素値を決定する。
第1平面原点距離画像の第1画素点の最適化後の画素値を算出する時、まず、置換え画素点の画素値が0より大きいかどうかを判定し、真理関数により判定結果を記録することに留意されたい。つまり、置換え画素点の画素値が0より大きい時、真理関数の関数値は、1であり、置換え画素点の画素値が0以下である時、真理関数の関数値は、0である。続いて、真理関数の関数値、置換え画素点の画素値、信頼度情報及び第1平面原点距離画像の第1画素点の画素点に基づいて、第1画素点の最適化後の画素値を算出する。
本願の実施例において、真理関数の関数値を信頼度情報、置換え画素点の画素値と乗算することで、第1サブ最適化画素値を得ると共に、真理関数の函数値を信頼度情報と乗算し、1と、得られた乗算結果と、の差分値を求め、差分値を第1平面原点距離画像の第1画素点の画素値と乗算することで、第2サブ最適化画素値を得る。最後に、第1サブ最適化画素値と第2サブ最適化画素値を加算し、第1画素点の最適化後の画素値を得る。他の形態に応じて、所定の距離算出モデルを設けることもできる。本願の実施例は、これを限定するものではない。
例示的に、本願の実施例は、真理関数の関数値、置換え画素点の画素値、信頼度情報及び第1平面原点距離画像の第1画素点の画素値に基づいて、第1画素点の最適化後の画素値を算出する式を提供する。これは、式(6)に示すとおりである。
Figure 0007143449000026
ただし、
Figure 0007143449000027
は、真理関数であり、
Figure 0007143449000028
は、置換え画素点の信頼度情報であり、
Figure 0007143449000029
は、置換え画素点の画素値であり、
Figure 0007143449000030
は、第1平面原点距離画像の第1画素点の画素値であり、
Figure 0007143449000031
は、第1平面原点距離画像の第1画素点の最適化後の画素値である。
S1026dにおいて、上記ステップを繰り返して実行し、第1平面原点距離画像の各画素の最適化後の画素値を決定して最適化後の第1平面原点距離画像を得るまで継続する。
上記ステップにおける第1平面原点距離画像の第1画素点の最適化後の画素値の算出方法により、第1平面原点距離画像における各画素に対して、最適化後の画素値を算出し、これらの最適化後の画素値を利用して、最適化後の第1平面原点距離画像を構成する。
本願の実施例において、第1平面原点距離画像における各画素に対して、最適化後の画素値を算出することで、最適化後の第1平面原点距離画像を得ることができる。従って、後続で、最適化後の第1平面原点距離画像及び特徴画像に基づいて、最適化後の第1平面原点距離画像の各画素の拡散きょづおを決定し、拡散強度及び最適化後の第1平面原点距離画像の画素値に基づいて、効果が高い補完したデプス画像を得ることができる。
本願の幾つかの実施例において、図5に示すように、拡散待ち画像及び特徴画像に基づいて、拡散待ち画像における各画素の拡散強度を決定するステップS103の実現プロセスは、S1031-S1032を含んでもよい。
S1031において、所定拡散範囲に基づいて、拡散待ち画像から、拡散待ち画像の第2画素点に対応する拡散待ち画素集合を決定し、拡散待ち画素集合における各画素の画素値を決定し、第2画素点は、拡散待ち画像におけるいずれか1つの画素点である。
拡散待ち画素集合は、拡散待ち画像の第2画素点の近傍領域に位置する画素を指す。所定拡散範囲に基づいて、まず、拡散待ち画像の第2画素点の近傍領域範囲を決定し、続いて、該近傍領域範囲内に位置する全ての画素を抽出し、拡散待ち画像の第2画素点に対応する拡散待ち画素集合を構成する。
本願の幾つかの実施例において、所定拡散範囲は、実際の需要に応じて設定されてもよく、本願の実施例は、これを限定するものではない。例示的に、所定拡散範囲を4近傍領域と設定し、4つの画素点を取り出して拡散待ち画素集合を構成することができる。所定拡散範囲を8近傍領域と設定し、拡散待ち画像の第2画素点の周辺に位置する8個の画素を取り出して拡散待ち画素集合を構成することもできる。
S1032において、特徴画像、拡散待ち画像の第2画素点及び拡散待ち画素集合における各画素を利用して、拡散待ち画像の第2画素点に対応する拡散強度を算出する。
特徴画像から、拡散待ち画像の第2画素点に対応する特徴情報及び拡散待ち画素集合における各画素に対応する特徴情報を取得し、これらの特徴情報に基づいて、拡散待ち画像の第2画素点に対応する拡散強度を算出する。
拡散待ち画素集合が複数の画素からなるものであるため、拡散待ち画像の第2画素点に対応する拡散強度を算出する時、拡散待ち画像の第2画素画素点と拡散待ち画素集合における各画素により、画素ペアを構成し、これらの画素ペアのサブ拡散強度をそれぞれ算出し、続いて、これらのサブ拡散強度を拡散待ち画像の第2画素点に対応する拡散強度とする。
拡散待ち画像の第2画素点に対応する拡散強度を得た後、拡散待ち画像における各画素の画素値に基づいて、拡散待ち画像における各画素の拡散後の画素値を決定することは、S1033-S1034を含んでもよい。
S1033において、拡散待ち画像の第2画素点の拡散強度、拡散待ち画像の第2画素点の画素値及び拡散待ち画素集合における各画素の画素値に基づいて、拡散待ち画像の第2画素点の拡散後の画素値を決定する。
拡散待ち画像の第2画素点に対応する拡散強度を得た後、拡散待ち画像における各画素の画素値及び拡散待ち画像における各画素の拡散強度に基づいて、拡散待ち画像における各画素の拡散後の画素値を決定することは、拡散待ち画像の第2画素点の拡散強度、拡散待ち画像の第2画素点の画素値及び拡散待ち画素集合における各画素の画素値に基づいて、拡散待ち画像の第2画素点の画素値を決定することになる。
S1034において、上記ステップを繰り返して実行し、拡散待ち画像における各画素の拡散後の画素値を決定するまで継続する。
例示的に、本発明の実施例は、デプス画像補完方法のプロセスを示す概略図を提供する。図6に示すように、該例において、初期段階の補完デプス画像を拡散待ち画像とする。レーダーにより、デプス画像
Figure 0007143449000032
を収集すると共に、カメラにより、三次元シーンの二次元画像
Figure 0007143449000033
を収集する。
Figure 0007143449000034
を所定の予測モデル1に入力し、初期段階の補完デプス画像
Figure 0007143449000035
及び特徴画像
Figure 0007143449000036
,を得て、続いて、初期段階の補完デプス画像
Figure 0007143449000037
及び特徴画像
Figure 0007143449000038
に基づいて、初期段階の補完デプス画像
Figure 0007143449000039
における各画素の拡散強度2を決定し、初期段階の補完デプス画像
Figure 0007143449000040
における各画素の画素値及び拡散強度2に基づいて、初期段階の補完デプス画像
Figure 0007143449000041
における各画素の拡散後の画素値を得て、補完後のデプス画像
Figure 0007143449000042
を得る。
第1平面原点距離画像を拡散待ち画像として、第1平面原点距離画像の拡散後の画素値を算出した後、拡散された第1平面原点距離画像を得るが、拡散された第1平面原点距離画は、補完後のデプス画像ではなく、補完後のデプス画像を得るために。拡散された第1平面原点距離画像に対して逆変換を行う必要がある。
本願の実施例において、第1平面原点距離画像は、初期段階の補完デプス画像、法線方向予測画像及びパラメータ行列に基づいて算出されたものであるため、拡散された第1平面原点距離画像、法線方向予測画像及びパラメータ行列に基づいて、デプス画像を逆算する。更に、算出したデプス画像を、補完後のデプス画像とする。
本願の実施例において、まず、法線方向予測画像から、各3D点の所在する接平面の法線ベクトル、各3D点の、画像平面への2D投影を取得し、拡散された第1平面原点距離画像から、各3D点の拡散された第1平面原点距離を取得すると共に、パラメータ行列に対して反転を行い、パラメータ行列の逆行列を得る。続いて、各3D点の所在する接平面の法線ベクトル、各3D点の、画像平面への2D投影及びパラメータ行列の逆行列を乗算し、乗算結果を得る。拡散された第1平面原点距離と、得られた乗算結果と、の比を求め、得られた比を各3D点に対応するデプス補完情報とする。続いて、各3D点に対応するデプス補完情報を画素値として、補完後のデプス画像を得る。
例示的に、本願の実施例は、各3D点に対応するデプス補完情報の演算プロセスを提供する。それは、式(7)に示すとおりである。
Figure 0007143449000043
ただし、
Figure 0007143449000044
は、各3D点に対応するデプス補完情報を表し、
Figure 0007143449000045
は、3D点拡散された第1平面原点距離を表し、
Figure 0007143449000046
は、3D点の、画像平面への2D投影を表し、
Figure 0007143449000047
は、3D点Xの所在する接平面の法線ベクトルを表し、Cは、パラメータ行列を表す。
各3D点の所在する接平面の法線ベクトル、各3D点の、画像平面への2D投影の座標、パラメータ行列、及び各3D点の拡散された第1平面原点距離の数値を得た後、これらのパラメータを式(7)に代入し、各3D点に対応するデプス補完情報を算出する。これにより、各3D点に対応するデプス補完情報に基づいて、補完後のデプス画像を得る。
例示的に、図7に示すように、本願の実施例は、デプス画像補完方法のプロセスを示す概略図を提供する。該例において、第1平面原点距離画像を拡散待ち画像とする。収集されたデプス画像
Figure 0007143449000048
及び二次元画像
Figure 0007143449000049
を入力として、所定の予測モデル1に送り込み、初期段階の補完デプス画像を出力するためのサブネットワーク2から出力された初期段階の補完デプス画像
Figure 0007143449000050
と、法線方向画像を予測するためのサブネットワーク3から出力された法線方向予測画像
Figure 0007143449000051
と、を得ると共に、1つの畳み込み層により、初期段階の補完デプス画像を出力するためのサブネットワーク2と法線方向画像を予測するためのサブネットワーク3に対して、直列接続4を行い、該畳み込み層における特徴データに対して可視化を行い、特徴画像
Figure 0007143449000052
を得る。続いて、初期段階の補完デプス画像
Figure 0007143449000053
、法線方向予測画像
Figure 0007143449000054
及び取得したパラメータ行列Cに基づいて、(1)により、三次元シーンにおける各3D点に対応する第1平面原点距離を算出し、第1平面原点距離画像
Figure 0007143449000055
を更に得る。最後に、得られた第1平面原点距離画像
Figure 0007143449000056
及び特徴画像
Figure 0007143449000057
に基づいて、第1平面原点距離画像
Figure 0007143449000058
における各画素の拡散強度5を決定し、第1平面原点距離画像
Figure 0007143449000059
における各画素の画素値及び拡散強度5に基づいて、第1平面原点距離画像
Figure 0007143449000060
における各画素の拡散後の画素値を得て、拡散された第1平面原点距離画像
Figure 0007143449000061
を得る。最後に、式(7)により、拡散された第1平面原点距離画像
Figure 0007143449000062
、法線方向予測画像
Figure 0007143449000063
に対して逆変換を行い、補完後のデプス画像
Figure 0007143449000064
を得る。
同様に、最適化後の第1平面原点距離画像を拡散待ち画像として、拡散後の画素値を算出することで、拡散された最適化した第1平面原点距離画像を得ることができる。続いて、拡散された最適化した第1平面原点距離画像に対して逆変換を行い、補完後のデプス画像を得ることができる。
本願の実施例において、まず、拡散された最適化した第1平面原点距離画像から、各3D点の平面原点距離を取得し、法線方向予測画像から、各3D点の所在する接平面の法線ベクトル及び各3D点の、画像平面への2D投影を取得すると共に、パラメータ行列の逆行列を求める。続いて、各3D点の所在する接平面の法線ベクトル、各3D点の、画像平面への2D投影及び及パラメータ行列の逆行列を乗算し、乗算結果を得る。更に、各3D点の平面原点距離画像と、上記乗算結果と、の比を求め、得られた比を各3D点に対応するデプス補完情報とする。最後に、各3D点に対応するデプス補完情報を画素値として、補完後のデプス画像を得る。
例示的に、本願の実施例は、式(8)により、各3D点に対応するデプス補完情報を算出することができる。
Figure 0007143449000065
ただし、
Figure 0007143449000066
は、3D点に対応するデプス補完情報であり、
Figure 0007143449000067
は、画素拡散により得られた3D点の平面原点距離であり、
Figure 0007143449000068
は、3D点の所在する接平面の法線ベクトルであり、
Figure 0007143449000069
は、3D点の、画像平面への2D投影であり、Cは、カメラのパラメータ行列である。
3D点の平面原点距離の具体的な数値、3D点の所在する接平面の法線ベクトル及び3D点の、画像平面への2D投影の座標を取得した後、これらのパラメータを式(8)に代入し、各3D点に対応するデプス補完情報を得て、更に各3D点に対応するデプス補完情報を画素値として、補完後のデプス画像を得ることができる。
例示的に、本願の実施例は、デプス画像補完方法のプロセスを示す概略図を提供する。図8に示すように、収集されたデプス画像
Figure 0007143449000070
及び二次元画像
Figure 0007143449000071
を所定の予測モデル1に送り込み、初期段階の補完デプス画像を出力するためのサブネットワーク2から出力された初期段階の補完デプス画像
Figure 0007143449000072
と、法線方向画像を予測するためのサブネットワーク3から出力された法線方向予測画像
Figure 0007143449000073
と、第1信頼度画像を出力するためのサブネットワーク4から出力された第1信頼度画像
Figure 0007143449000074
と、を得る。それと同時に、畳み込み層を利用して、初期段階の補完デプス画像を出力するためのサブネットワーク2と法線方向画像を予測するためのサブネットワーク3に対して直列接続5を行い、畳み込み層における特徴データを可視化し、特徴画像
Figure 0007143449000075
を得る。続いて、式(4)及び得られた初期段階の補完デプス画像
Figure 0007143449000076
、法線方向予測画像
Figure 0007143449000077
及びパラメータ行列Cにより、各3D点の第1平面原点距離を算出し、更に第1平面原点距離画像
Figure 0007143449000078
を得る。それと同時に、式(5)及びレーダーにより収集されたデプス画像
Figure 0007143449000079
、法線方向予測画像
Figure 0007143449000080
及びパラメータ行列Cにより、各3D点の第2平面原点距離を算出し、更に第2平面原点距離画像
Figure 0007143449000081
を得る。続いて、第1信頼度画像
Figure 0007143449000082
に基づいて、確実な第2平面原点距離を有する画素点を選び出し、確実な第2平面原点距離により、第1平面原点距離画像
Figure 0007143449000083
における各画素に対して最適化6を行い、最適化後の第1平面原点距離画像
Figure 0007143449000084
を得て、最適化後の第1平面原点距離画像
Figure 0007143449000085
及び特徴画像
Figure 0007143449000086
に基づいて、
Figure 0007143449000087
における各画素の拡散強度7を決定する。更に、最適化後の第1平面原点距離画像
Figure 0007143449000088
における各画素の画素値及び拡散強度7に基づいて、最適化後の第1平面原点距離画像
Figure 0007143449000089
における各画素の拡散後の画素値を得て、拡散された最適化した第1平面原点距離画像
Figure 0007143449000090
を得る。最後に、式(8)により、拡散された最適化した第1平面原点距離画像
Figure 0007143449000091
、法線方向予測画像
Figure 0007143449000092
に対して逆変換を行い、各3D点のデプス補完情報を算出し、更に、補完後のデプス画像を得る。
本願の実施例において、所定拡散範囲に基づいて、各拡散待ち画像の各画素について、対応する拡散待ち画素集合を決定し、更に、特徴画像、拡散待ち画像の各画素及び拡散されるべき各画素に対応する拡散待ち画素集合に基づいて、拡散待ち画像の各画素の拡散強度を算出する。これにより、拡散強度、拡散待ち画像の各画素の画素値及び拡散待ち画像の各画素に対応する拡散待ち画素集合に基づいて、拡散待ち画像における各画素の拡散後の画素値を算出し、補完後のデプス画像を得ることができる。
本願の幾つかの実施例において、図9に示すように、特徴画像、拡散待ち画像の第2画素点及び拡散待ち画素集合における各画素により、拡散待ち画像の第2画素点に対応する拡散強度を算出するステップS1032の実現プロセスは、S1032a-S1032fを含んでもよい。
S1032aにおいて、拡散待ち画像の第2画素点及び拡散待ち画素集合における各画素を利用して、拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出する。
拡散待ち画像の第2画素点に対応する拡散強度を算出する時、まず、事前設けられた所定の特徴抽出モデルにより、拡散待ち画像の第2画素点に対して特徴抽出を行い、所定の範囲で決定された拡散待ち画素集合における各画素に対しても特徴抽出を行う。続いて、抽出された特徴情報に基づいて、拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出する。これにより、後続で、強度正規化パラメータにより、拡散待ち画像の第2画素点に対応する拡散強度を得る。
強度正規化パラメータは、第1特徴画素の特徴情報、第2特徴画素の特徴情報の算出結果に対して正規化を行い、サブ拡散強度を得るためのパラメータであることに留意されたい。
例えば、
Figure 0007143449000093
の畳み込みカーネルのような寸法が小さい畳み込みカーネルを所定の特徴抽出モデルとして用いることができる。同様な目的を達成できる他の機器学習モデルを所定の特徴抽出モデルとして用いることもできる。本願の実施例は、これを限定するものではない。
所定の特徴抽出モデルにより、拡散待ち画像の第2画素点及び拡散待ち画素集合における各画素を処理し、つまり、所定の特徴抽出モデルにより、少なくとも2種類の画素を処理できることに留意されたい。従って、同一の所定の特徴抽出モデルにより、拡散待ち画像の第2画素点及び拡散待ち画素集合における各画素に対して特徴抽出を行うことができる。また、異なる所定の特徴抽出モデルにより、拡散待ち画像の第2画素点及び拡散待ち画素集合における各画素に対して特徴抽出を行うこともできる。
S1032bにおいて、特徴画像において、拡散待ち画像の第2画素点に対応する画素を第1特徴画素とし、拡散待ち画素集合における第3画素点に対応する画素を第2特徴画素とし、第3画素点は、拡散待ち画素集合におけるいずれか1つの画素点である。
拡散待ち画像の第2画素点の強度正規化パラメータを算出した後、特徴画像において、拡散待ち画像の第2画素点に対応する画素を探し、探した画素を第1特徴画素とする。それと同時に、特徴画像において、拡散待ち画素集合における第3画素点に対応する画素を探し、探した画素作を第2特徴画素とする。第3画素点は、拡散待ち画素集合におけるいずれか1つの画素点であってもよい。
特徴画像は、所定の予測モデルにおける一層の特徴データを可視化することで得られた画像であるため、特徴画像において、拡散待ち画像の第2画素点に対応する画素を探すために、所定の予測モデルから、寸法が拡散待ち画像の寸法と同じである畳み込み層を選択し、該畳み込み層における特徴データを可視化して特徴画像を得て、特徴画像と拡散待ち画像の画素を一対一に対応させ、更に、拡散待ち画像の第2画素点の位置情報に基づいて、第1特徴画素を見付けることができ、同様に、拡散待ち画素集合における第3画素点の位置情報に基づいて、第2特徴画素を見付けることができることに留意されたい。装置は、他の方式により、第1特徴画素及び第2特徴画素を探すこともできる。本願の実施例は、これを限定するものではない。
S1032cにおいて、第1特徴画素の特徴情報及び第2特徴画素の特徴情報を抽出する。
本願の実施例において、第1特徴画素の特徴情報を抽出する時、まず、第1特徴画素の画素値を抽出し、続いて、所定の特徴抽出モデルにより、第1特徴画素の画素値を演算し、第1特徴画素の特徴情報を得る。同様に、第2特徴画素の特徴情報を抽出する時にも、まず、第2特徴画素の画素値を抽出し、続いて、所定の特徴抽出モデルにより、第2特徴画素の画素値を演算し、第2特徴画素の特徴情報を得る。
例示的に、所定の特徴抽出モデル
Figure 0007143449000094
により、第1特徴画素に対して特徴抽出を行い、所定の特徴抽出モデル
Figure 0007143449000095
により、第2特徴画素に対して特徴抽出を行うことができる。第1特徴画素は、特徴画像における、拡散待ち画像の第2画素点に対応する画素であり、
Figure 0007143449000096
で表されてもよい。第2特徴画素は、特徴画像における、拡散待ち画素集合における第3画素点に対応する画素であり、
Figure 0007143449000097
で表されてもよい。なお、第1特徴画素の特徴情報は、
Figure 0007143449000098
であり、第2特徴画素の特徴情報は、
Figure 0007143449000099
である。従って、装置は、第1特徴画素の特徴情報及び第2特徴画素の特徴情報を得る。
S1032dにおいて、第1特徴画素の特徴情報、第2特徴画素の特徴情報、強度正規化パラメータ及び所定拡散制御パラメータ利用して、拡散待ち画像の第2画素点及び拡散待ち画素集合における第3画素点からなる拡散画素ペアのサブ拡散強度を算出する。
本願の実施例において、所定拡散制御パラメータは、サブ拡散強度値を制御するためのパラメータである。所定拡散制御パラメータは、実際の需要に応じて設定された固定値であってもよく、学習を行う可変パラメータであってもよい。
本願の実施例において、所定の拡散強度演算モデルにより、まず、第1特徴画素の特徴情報に対して転置を求め、転置結果を得る。続いて、転置結果と第2特徴画素の特徴情報を乗算し、1と得られた乗算結果との差分値を求め、差分値結果を得る。続いて、差分値結果を二乗し、所定拡散制御パラメータの二乗の倍数との比を求める。続いて、得られた比を指数関数の指数とし、自然対数eを指数関数の底として、演算を行い、最後に、強度正規化パラメータにより、得られた演算結果を正規化し、最終的なサブ拡散強度を得る。所定の拡散強度演算モデルの具体的な形態は、実際の需要に応じて設定されてもよい。本願の実施例は、これを限定するものではない。
例示的に、本願の実施例は、所定の拡散強度演算モデルを提供する。これは、式(9)に示すとおりである。
Figure 0007143449000100
ただし、
Figure 0007143449000101
は、拡散待ち画像の第2画素点を表し、
Figure 0007143449000102
は、拡散待ち画素集合における第3画素点を表し、
Figure 0007143449000103
は、拡散待ち画像の第2画素点に対応する強度正規化パラメータを表し、
Figure 0007143449000104
は、第1特徴画素を表し、
Figure 0007143449000105
は、第2特徴画素を表し、
Figure 0007143449000106
は、第1特徴画素の特徴情報であり、
Figure 0007143449000107
は、第2特徴画素の特徴情報であり,
Figure 0007143449000108
は、所定拡散制御パラメータを表し、
Figure 0007143449000109
は、拡散待ち画像の第2画素点及び拡散待ち画素集合における第3画素点からなる拡散画素ペアのサブ拡散強度を表す。
第1特徴画素の特徴情報
Figure 0007143449000110
、第2特徴画素の特徴情報
Figure 0007143449000111
を得て、拡散待ち画像の第2画素点に対応する強度正規化パラメータ
Figure 0007143449000112
を算出した後、これらのパラメータの具体的な数値を式(9)に代入し、拡散待ち画像の第2画素点及び拡散待ち画素集合における第3画素点からなる拡散画素ペアのサブ拡散強度
Figure 0007143449000113
を算出することができる。
S1032eにおいて、上記ステップを繰り返して実行し、拡散待ち画像の第2画素点及び拡散待ち画素集合における各画素からなる画素ペアのサブ拡散強度を決定するまで継続する。
S1032fにおいて、拡散待ち画像の第2画素点及び拡散待ち画素集合における各画素からなる拡散画素ペアのサブ拡散強度を拡散待ち画像の第2画素点に対応する拡散強度とする。
本願の実施例において、拡散待ち画像の第2画素点及び拡散待ち画素集合における各画素からなる拡散画素ペアに対してそれぞれサブ拡散強度の演算を行い、続いて、算出された全てのサブ拡散強度を拡散待ち画像の第2画素点の拡散強度とする。このような方式により、拡散待ち画像における各画素の拡散強度を得て、拡散強度に基づいて、拡散待ち画像における各画素に対して、拡散後の画素値を算出し、正確率が高い補完後のデプス画像を得る。
本願の幾つかの実施例において、サブ拡散強度は、拡散待ち画像の第2画素点と拡散待ち画素集合における第3画素点との類似度であってもよい。
本願の実施例において、拡散待ち画像の第2画素点と拡散待ち画素集合における第3画素点との類似度をサブ拡散強度とすることができる。つまり、拡散待ち画像の第2画素点と拡散待ち画素集合における第3画素点との類似度に基づいて、拡散待ち画素集合における第3画素点が拡散待ち画像の第2画素点へ拡散する強度を決定することができる。拡散待ち画像の第2画素点と拡散待ち画素集合における第3画素点との類似度が高いと、拡散待ち画像の第2画素点と拡散待ち画素集合における第3画素点は、三次元シーンにおける同一の平面に位置する可能性が極めて高いと認められる。この場合、拡散待ち画素集合における第3画素点が拡散待ち画像の第2画素点へ拡散する強度は大きい。拡散待ち画像の第2画素点と拡散待ち画素集合における第3画素点が類似しないと、拡散待ち画像の第2画素点と拡散待ち画素集合における第3画素点が同一の平面に位置しないと認められる。この場合、拡散待ち画素集合における第3画素点が拡散待ち画像の第2画素点へ拡散する強度は小さい。これにより、画素拡散プロセスにおけるエラーの発生を避ける。
本願の実施例において、拡散待ち画像における画素と拡散待ち画素集合における各画素との類似度に基づいて、サブ拡散強度を決定する。これにより、拡散待ち画像における画素と同一の平面に位置する画素により、拡散待ち画像における各画素の拡散後の画素値を算出し、正確率が高い補完後のデプス画像を得る。
本願の幾つかの実施例において、拡散待ち画像の第2画素点及び拡散待ち画素集合における各画素を利用して、拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出するステップS1032aの実現プロセスは、S201-S204を含んでもよい。
S201において、拡散待ち画像の第2画素点の特徴情報及び拡散待ち画素集合における第3画素点の特徴情報を抽出する。
所定の特徴抽出モデルにより、拡散待ち画像の第2画素点の特徴情報を抽出する時、まず、拡散待ち画像の第2画素の画素値を取得し、所定の特徴抽出モデルにより、該画素値を算出し、拡散待ち画像の第2画素点の特徴情報を得る。同様に、拡散待ち画素集合における第3画素点の特徴情報を抽出する時にも、まず、拡散待ち画素集合における第3画素点の画素値を抽出し、続いて、該画素値に対して、所定の特徴抽出モデルにより、演算を行い、拡散待ち画素集合における第3画素点の特徴情報を得る。
例示的に、拡散待ち画像の第2画素点は、
Figure 0007143449000114
で表され、拡散待ち画素集合における第3画素は
Figure 0007143449000115
で表される場合、所定の特徴抽出モデル
Figure 0007143449000116
により、拡散待ち画像の第2画素点に対して特徴抽出を行い、所定の特徴抽出モデル
Figure 0007143449000117
により、拡散待ち画素集合における第3画素に対して特徴抽出を行うと、拡散待ち画像の第2画素点の特徴情報は、
Figure 0007143449000118
で表されてもよく、拡散待ち画素集合における第3画素点の特徴情報は、
Figure 0007143449000119
で表されてもよい。勿論、他の所定の特徴抽出モデルにより、拡散待ち画像の第2画素点及び拡散待ち画素集合における第3画素点に対して特徴抽出を行うこともできる。本願の実施例は、これを限定するものではない。
S202において、抽出して得られた拡散待ち画像の第2画素点の特徴情報、拡散待ち画素集合における第3画素点の特徴情報及び所定拡散制御パラメータ利用して、拡散待ち画素集合における第3画素のサブ正規化パラメータを算出する。
所定のサブ正規化パラメータ演算モデルにより、まず、拡散待ち画像の第2画素点の特徴情報に対して行列転置を行い、転置結果と拡散待ち画素集合における第3画素点の特徴情報を乗算し、続いて、1と得られた乗算結果との差分値を求め、得られた差分値結果を二乗し、二乗結果を得る。続いて、二乗結果と所定拡散制御パラメータの二乗の倍数との比を求める。最後に、得られた比を指数函数の指数とし、自然対数eを指数関数の底として、演算を行い、最終的な演算結果を拡散待ち画素集合における第3画素点に対応するサブ正規化パラメータとすることに留意されたい。勿論、所定のサブ正規化パラメータ演算モデルは、実際の需要に応じて、他の形態に設けられてもよい。本願の実施例は、これを限定するものではない。
例示的に、本願の実施例は、所定のサブ正規化パラメータ演算モデルを提供する。これは、式(10)に示すとおりである。
Figure 0007143449000120
ただし、
Figure 0007143449000121
は、拡散待ち画像の第2画素点を表し、
Figure 0007143449000122
は、拡散待ち画素集合における第3画素点を表し、
Figure 0007143449000123
、拡散待ち画像の第2画素点の特徴情報を表し、
Figure 0007143449000124
は、拡散されるべき画素集における第3画素点の特徴情報を表し、
Figure 0007143449000125
は、所定拡散制御パラメータを表し、
Figure 0007143449000126
は、拡散待ち画素集合における第3画素点に対応するサブ正規化パラメータを表す。
拡散待ち画像の第2画素点の特徴情報
Figure 0007143449000127
、拡散待ち画素集合における第3画素点の特徴情報
Figure 0007143449000128
を得て、所定拡散制御パラメータ
Figure 0007143449000129
を取得した後、これらのパラメータの具体的な数値を式(10)に代入し、拡散待ち画素集合における第3画素点に対応するサブ正規化パラメータを算出することができる。
S203において、上記ステップを繰り返して実行し、拡散待ち画素集合における各画素のサブ正規化パラメータを得るまで継続する。
S204において、拡散待ち画素集合における各画素のサブ正規化パラメータに対して累加を行い、拡散待ち画像の第2画素点に対応する強度正規化パラメータを得る。
例示的に、拡散待ち画素集合における第3画素のサブ正規化パラメータが
Figure 0007143449000130
である場合、装置は、式(11)により、拡散待ち画像の第2画素点に対応する強度正規化パラメータを得ることができる。
Figure 0007143449000131
ただし、
Figure 0007143449000132
は、拡散待ち画素集合を表し、
Figure 0007143449000133
は、拡散待ち画像の第2画素点の強度正規化パラメータを表す。
拡散待ち画素集合における各画素のサブ正規化パラメータの数値を算出する時、これらのサブ正規化パラメータの数値を直接的に式(11)に代入して累加し、得られた累加結果を拡散待ち画像の第2画素点に対応する強度正規化パラメータとすることができる。
本願の実施例において、まず、拡散待ち画像の第2画素点に対して特徴抽出を行い、拡散待ち画素集合における各画素に対して特徴抽出を行い、続いて、所定のサブ正規化パラメータ演算モデルにより、抽出された特徴情報及び所定拡散制御パラメータに対して演算を行い、サブ正規化パラメータを得て、得られた全てのサブ正規化パラメータを累加し、強度正規化パラメータを得る。これにより、装置は、後続で、強度正規化パラメータにより、拡散強度を算出することができる。
本願の幾つかの実施例において、図10に示すように、拡散待ち画像の第2画素点の拡散強度、拡散待ち画像の第2画素点の画素値及び拡散待ち画素集合における各画素の画素値に基づいて、拡散待ち画像の第2画素点の拡散後の画素値を決定するステップS1033の実現プロセスは、S1033a-S1033dを含んでもよい。
S1033aにおいて、拡散強度における各サブ拡散強度をそれぞれ拡散待ち画像の第2画素点の画素値と乗算し、得られた乗算結果を累加し、拡散待ち画像の第2画素点の第1拡散部を得る。
本願の実施例において、まず、拡散待ち画像の第2画素点の画素値及び拡散待ち画像の第2画素点の拡散強度を取得し、拡散待ち画像の第2画素点の拡散強度のうち、拡散待ち画素集合における第3画素点のサブ拡散強度と拡散待ち画像の第2画素点の画素値を乗算し、乗算結果を得る。このように繰り返し、拡散待ち画素集合における各画素のサブ拡散強度と拡散待ち画像の第2画素点の画素値を乗算した後、得られた全ての積を累加し、拡散待ち画像の第2画素点の第1拡散部を算出することができる。
本願の実施例において、他の方式により、拡散待ち画像の第2画素点の第1拡散部を算出することもできる。本願の実施例は、これを限定するものではない。
例示的に、本願の実施例は、式(12)により、第1拡散部を算出することができる。式(12)は、以下に示すとおりである。
Figure 0007143449000134
ただし、
Figure 0007143449000135
は、拡散待ち画素集合における第3画素点に対応するサブ拡散強度であり、
Figure 0007143449000136
は、拡散待ち画素集合を表し、
Figure 0007143449000137
は、拡散待ち画像の第2画素点の画素値を表し、
Figure 0007143449000138
は、算出された拡散待ち画像の第2画素点の第1拡散部を表す。
拡散待ち画像の第2画素点の画素値及び拡散待ち画素集合における各画素のサブ拡散強度の数値を得た後、拡散待ち画像の第2画素点の画素値及び拡散待ち画素集合における各画素のサブ拡散強度の数値を式(12)に代入し、拡散待ち画像の第2画素点の第1拡散部を算出することができる。
拡散待ち画像の第2画素点の拡散強度を算出する時、強度正規化パラメータにより、サブ拡散強度に対して正規化を行ったため、各サブ拡散強度と拡散待ち画像の第2画素点の画素値を乗算して累加した後、得られた累加結果の数値は、元の拡散待ち画像の第2画素点の画素値より大きくないことに留意されたい。
S1033bにおいて、拡散強度における各サブ拡散強度をそれぞれ拡散待ち画素集合における各画素の画素値と乗算し、得られた乗算結果を累加し、拡散待ち画像の第2画素点の第2拡散部を得る。
サブ拡散強度をそれぞれ拡散待ち画素集合における各画素値と乗算する時、拡散待ち画素集合における第3画素点に対応するサブ拡散強度を拡散待ち画素集合における第3画素点の画素値と乗算し、乗算結果を得て、このように繰り返し、各サブ拡散強度をそれぞれ拡散待ち画素集合における各画素値と乗算するまで継続し、最後に、全ての積を累加し、得られた累加結果を拡散待ち画像の第2画素点の第2拡散部とすることに留意されたい。
本願の実施例において、他の方法により、拡散待ち画像の第2画素点の第2拡散部を算出することもできる。本願の実施例は、これを限定するものではない。
例示的に、本願の実施例において、式(13)により、第2拡散部を算出することができる。
Figure 0007143449000139
ただし、
Figure 0007143449000140
は、拡散待ち画素集合における第3画素点に対応するサブ拡散強度であり、
Figure 0007143449000141
は、拡散待ち画素集合を表し、
Figure 0007143449000142
は、拡散待ち画素集合における第3画素点の画素値を表し、
Figure 0007143449000143
は、算出された拡散待ち画像の第2画素点の第2拡散部を表す。
拡散待ち画素集合における第3画素点の画素値及び拡散待ち画素集合における各画素のサブ拡散強度の数値を得た後、拡散待ち画素集合における第3画素点の画素値及び拡散待ち画素集合における各画素のサブ拡散強度の数値を式(13)に代入し、拡散待ち画像の第2画素点の第2拡散部を算出することができる。
S1033cにおいて、拡散待ち画像の第2画素点の画素値、拡散待ち画像の第2画素点の第1拡散部及び拡散待ち画像の第2画素点の第2拡散部に基づいて、拡散待ち画像の第2画素点の拡散後の画素値を算出する。
本願の実施例において、拡散待ち画像の第2画素点の画素値から、第1拡散画素部を差し引き、続いて、得られた差分値と第2拡散部を加算し、最後の加算結果を拡散後の画素値とすることができる。本願の実施例は、拡散待ち画像の第2画素点の画素値、第1拡散画素部及び第2拡散画素部に対して他の処理を行い、拡散待ち画像の第2画素点の拡散後の画素値を得ることもできる。本願の実施例は、これを限定するものではない。
例示的に、本願の実施例は、式(14)により、拡散待ち画像の第2画素点の拡散画素値を得て、画素拡散を完了することができる。
Figure 0007143449000144
ただし、
Figure 0007143449000145
は、拡散待ち画像の第2画素点の画素値を表し、
Figure 0007143449000146
は、拡散待ち画素集合における第3画素点に対応するサブ拡散強度を表し、
Figure 0007143449000147
は、拡散待ち画素集合を表し、
Figure 0007143449000148
は、拡散待ち画素集合における第3画素点の画素値を表す。
拡散待ち画像の第2画素点の画素値、拡散待ち画素集合における各画素に対応するサブ拡散強度、拡散待ち画素集合における各画素の画素値を得た後、これらのパラメータの具体的な数値を式(14)に代入し、拡散待ち画像の第2画素点の拡散後の画素値を算出することができる。
例示的に、本願の実施例は、式(14)を導き出すプロセスを提供する。
本願の実施例において、拡散待ち画像の第2画素点の画素値から、第1拡散画素部を差し引き、続いて、得られた差分値と第2拡散部を加算し、最後の加算結果を拡散画素値とすることができる。これは、式(15)で表されてもよい。
Figure 0007143449000149
ただし、
Figure 0007143449000150
は、算出された拡散待ち画像の第2画素点の第1拡散部を表し、
Figure 0007143449000151
は、算出された拡散待ち画像の第2画素点の第2拡散部を表し、
Figure 0007143449000152
は、拡散待ち画像の第2画素点の画素値を表す。
式(12)及び式(13)を式(15)に代入し、式(16)を得ることができる。
Figure 0007143449000153
式(16)を合わせて整理すると、式(14)を得ることができる。
例示的に、本願の実施例は、拡散待ち画像の第2画素点の拡散後の画素値の算出を示す概略図を提供する。図11に示すように、拡散待ち画像1及び特徴画像2に基づいて、拡散待ち画像の第2画素点の拡散後の画素値を算出する時、まず、拡散待ち画像の第2画素点について、拡散待ち画素集合を決定する。本願の実施例において、8近傍領域により、拡散待ち画素集合3を決定する。図11に示すように、拡散待ち画像の第2画素点
Figure 0007143449000154
は、左上の9ブロック型ボックスの中心に位置し、周囲の8個の画素点からなる集合は、拡散待ち画素集合3である。続いて、特徴画像2から、拡散待ち画像の第2画素点に対応する第1特徴画素及び拡散待ち画素集合における第3画素に対応する第2特徴画素を見付け、所定の特徴抽出モデル
Figure 0007143449000155
により、第1特徴画素に対して特徴抽出を行い、所定の特徴抽出モデル
Figure 0007143449000156
により、第2特徴画素に対して特徴抽出を行う(特徴抽出プロセスは、示されていない)。ここで、
Figure 0007143449000157
は、
Figure 0007143449000158
の畳み込みカーネルとして設定されてもよい。通ぢて、所定の拡散強度演算モデル4、式(9)及び拡散強度の演算に必要なパラメータを利用して、拡散強度を算出し、続いて、拡散待ち画像の第2画素点の画素値、拡散強度、拡散待ち画素集合における各画素の画素値を式(14)に代入し、拡散待ち画像の第2画素点の拡散後の画素値5を算出し、更に、補完後のデプス画像6を得る。これにより、拡散待ち画像の第2画素点の拡散後の画素値の演算を完了する。
S1033dにおいて、上記ステップを繰り返して実行し、拡散待ち画像における各画素の拡散後の画素値を得るまで継続する。
拡散待ち画像の第2画素点に対する画素拡散を完了した後、上記ステップを繰り返し、拡散待ち画像における各画素の拡散後の画素値を算出し、補完後のデプス画像を得る。
本願の実施例において、拡散待ち画像における各画素の画素値、及び拡散待ち画像の各画素に対応する拡散待ち画素集合における全ての画素の画素値及び算出された拡散強度に基づいて、拡散待ち画像における各画素の拡散後の画素値に対して一つずつ演算を行うことができる。これにより、収集されたデプス画像を十分に利用して、正確率が高い補完後のデプス画像を得ることができる。
本願の幾つかの実施例において、拡散待ち画像及び特徴画像に基づいて、画素拡散を実現させ、補完後のデプス画像を得るステップS104を行った後、該方法は、S105を更に含んでもよい。
S105において、補完後のデプス画像を拡散待ち画像とし、拡散待ち画像及び特徴画像に基づいて拡散待ち画像における各画素の拡散強度を決定するステップ、拡散待ち画像における各画素の画素値及び拡散待ち画像における各画素の拡散強度に基づいて拡散待ち画像における各画素の拡散後の画素値を決定するステップ、及び拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するステップを繰り返して実行し、所定の繰り返し回数に達するまで継続する。
補完後のデプス画像を得た後、引き続き、補完後のデプス画像を改めて、拡散待ち画像として、拡散待ち画像における各画素の拡散後の画素値を算出し、画素拡散を更に十分にし、最適化した補完後のデプス画像を得ることもできる。
本願の幾つかの実施例において、所定の繰り返し回数を8回としてもよい。補完後のデプス画像を得た後、該補完後のデプス画像に対して、上記ステップを引き続き7回実行し、画素拡散をより十分にする。所定の繰り返し回数は、実際の需要に応じて設定されてもよく、本願の実施例は、これを限定するものではないことに留意されたい。
本願の幾つかの実施例において、拡散待ち画像における各画素の拡散後の画素値に基づいて、補完後のデプス画像を決定するステップS104を実行した後、該方法は、S106を更に含んでもよい。
S106において、補完後のデプス画像を初期段階の補完デプス画像とし、初期段階の補完デプス画像、カメラのパラメータ行列及び法線方向予測画像に基づいて、第1平面原点距離画像を算出して第1平面原点距離画像を拡散待ち画像とするステップ、拡散待ち画像及び特徴画像に基づいて拡散待ち画像における各画素の拡散強度を決定するステップ、拡散待ち画像における各画素の画素値及び拡散待ち画像における各画素の拡散強度に基づいて拡散待ち画像における各画素の拡散後の画素値を決定するステップ、及び拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するステップを繰り返して実行し、所定の繰り返し回数に達するまで継続する。
本願の幾つかの実施例において、初期段階の補完デプス画像、カメラのパラメータ行列及び法線方向予測画像に基づいて、第1平面原点距離画像を算出して第1平面原点距離画像を拡散待ち画像とするステップは、
初期段階の補完デプス画像、カメラのパラメータ行列及び法線方向予測画像に基づいて、第1平面原点距離画像を算出するステップと、デプス画像及び二次元画像に基づいて、第1信頼度画像を決定するステップと、デプス画像、パラメータ行列及び法線方向予測画像に基づいて、第2平面原点距離画像を算出するステップと、第1信頼度画像における画素、第2平面原点距離画像における画素及び第1平面原点距離画像における画素に基づいて、第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得て、最適化後の第1平面原点距離画像を拡散待ち画像とするステップと、を含む。
本願の実施例において、収集されたデプス画像
Figure 0007143449000159
及び二次元画像に基づいて、初期段階の補完デプス画像
Figure 0007143449000160
、法線方向予測画像
Figure 0007143449000161
及び第1信頼度画像
Figure 0007143449000162
を得た後、初期段階の補完デプス画像
Figure 0007143449000163
における全ての画素xに対して、第2平面原点距離情報を算出し、更に、第2平面原点距離画像を得て、全ての画素の第1平面原点距離情報を算出し、更に、第1平面原点距離画像を得る。続いて、現在の繰り返し回数が所定の反復回数未満であると判定した場合、第1平面原点距離画像における各画素値
Figure 0007143449000164
に対して、置換え距離情報を算出し、画素値の最適化を行い、更に、最適化後の第1平面原点距離画像を得る。続いて、最適化後の第1平面原点距離画像を拡散待ち画像とし、最適化後の第1平面原点距離画像における第2画素点について、対応する拡散待ち画素集合を決定し、第2画素点に対応する拡散強度を算出し、続いて、拡散強度における各サブ拡散強度、拡散待ち画素集合における各画素の画素値及び最適化後の第1平面原点距離画像における第2画素点の画素値に基づいて、最適化後の第1平面原点距離画像の第2画素点の拡散後の画素値を算出し、拡散された最適化した第1平面原点距離画像を得る。更に、拡散された最適化した第1平面原点距離画像に対して逆変換を行い、補完後のデプス画像を得る。補完後のデプス画像を得た後、現在の繰り返し回数iに1を加算し、新たな現在の繰り返し回数を得る。続いて、新たな現在の繰り返し回数を所定の繰り返し回数と比較し、新たな現在の繰り返し回数が所定の繰り返し回数未満である場合、上記プロセスを引き続き実行し、新たな現在の繰り返し回数が所定の繰り返し回数以上になるまで継続し、最終的な補完後のデプス画像を得る。
例示的に、本願の実施例は、所定の繰り返し回数の値による補完后されたデプス画像の誤差への影響を示す。図12(a)に示すように、KITTIデータ集合により試験を行う。横座標は、所定の繰り返し回数であり、縦座標は、二乗平均平方根誤差(Root Mean Square Error:RMSE)である。RMSEの単位は、mmである。図面における3本の曲線は、それぞれ、全サンプル試験回数(epoch)の様々な値により得られた結果である。図12(a)から分かるように、epoch=10である場合、つまり、KITTIデータ集合における全てのサンプルが10回試験される場合、RMSEは、所定の繰り返し回数の増加に伴って降下する。所定の繰り返し回数が20である場合、RMSEは、最も小さく、0に近い。epoch=20である場合、RMSEは、まず、所定の繰り返し回数の増加に伴って降下し、続いて不変のまま保持し、RMSEは、0に近い。epoch=30である場合、RMSEは、所定の繰り返し回数の増加に伴って降下し、続いて、小幅に上昇するが、RMSEは、最大限5以下であり、RMSEが0に近くなるまで継続する。図12(b)は、NYUデータ集合により試験を行った結果を示す図である。図12(a)と同様に、図12(b)の横座標も所定の繰り返し回数であり、縦座標は、RMSEであり、図面における3本の曲線は、それぞれepochの様々な値により得られた結果を表す。図12(b)から分かるように、epoch=5、epoch=10、epoch=15に関わらず、所定の繰り返し回数の増加に伴って、RMSEは、まず減少し、0に近くなるまで継続し、続いて不変のまま保持する。図12(a)及び図12(b)から分かるように、所定の繰り返し回数の画素拡散を行うことで、補完後のデプス画像のRMSEを著しく減少させることができる。つまり、所定の繰り返し回数の画素拡散を行うことで、補完後のデプス画像の正確度を更に向上させることができる。
本願の実施例において、補完後のデプス画像を得た後、引き続き、補完後のデプス画像に対して補完を繰り返して行い、補完後のデプス画像の正確度を更に向上させることができる。
本願の幾つかの実施例において、デプス画像補完方法は、所定の予測モデルにより実現することができる。ターゲットシーンのデプス画像及び二次元画像を収集した後、まず、デプス画像補完装置内に事前記憶された所定の予測モデルを取得し、続いて、デプス画像及び映像画像を入力として所定の予測モデルに送り込んで演算を行い、一次予測処理を行い、所定の予測モデルから出力された結果に基づいて、拡散待ち画像及び特徴画像を得る。これにより、後続で、拡散待ち画像及び特徴画像に基づいて、画素拡散を実現させる。
本願の実施例において、所定の予測モデルは、訓練されたモデルであることが理解されるべきである。本願の実施例において、訓練された畳み込みニューラルネットワーク(Convolutional Neural Networks:CNN)モデルを所定の予測モデルとして用いることができる。勿論、実際の状況に応じて、同様な目的を達成できる他のネットワークモデル又は他の機器学習モデルを所定の予測モデルとすることもできる。本願の実施例は、これを限定するものではない。
例示的に、本願の実施例において、CNNにおける残差ネットワーク(Residual Networks:ResNet)の変形ResNet-34又はResNet-50を所定の予測モデルとして用いることができる。
所定の予測モデルにより、収集されたデプス画像及び二次元画像に対して予測処理を行った後、実際の設定に応じて、例えば、初期段階の補完デプス画像、法線方向予測画像、延いてはデプス画像に対応する信頼度画像などを得ることができるため、所定の予測モデルにより得られた予測結果を直接的に拡散待ち画像とすることができ、予測結果に対して処理を行うことで拡散待ち画像を得ることもできることに留意されたい。
得られた拡散待ち画像は、所定の予測モデルの出力に基づいて得られた、画素値の拡散を行うための画像を指し、得られた特徴画像は、デプス画像及び二次元画像を所定の予測モデルに入力して演算を行った後、所定の予測モデルにおける一層の特徴データを可視化することで得られた特徴画像を指すことに留意されたい。
所定の予測モデルにより、デプス画像及び二次元像を予測することで、初期段階の補完デプス画像及び法線方向予測画像を得ることができ、つまり、所定の予測モデルは、2つの出力を有するため、特徴画像を得る時、初期段階の補完デプス画像を出力するためのサブネットワークにおける特徴データのみを可視化することで特徴画像を得ることができ、法線方向予測画像を出力するためのサブネットワークにおける特徴データのみを可視化することで特徴画像を得ることもでき、初期段階の補完デプス画像を出力するためのサブネットワークと法線方向予測画像を出力するためのサブネットワークを直列接続し、直列接続ネットワークにおける特徴データを可視化することで、特徴画像を得ることもできることに留意されたい。勿論、他の方式で特徴画像を得ることもできる。本願の実施例は、これを限定するものではない。
例示的に、所定の予測モデルがResNet-34である場合、まず、デプス画像及び二次元画像をResNet-34に送り込んで予測を行い、続いて、ResNet-34の最後から2層目における特徴データを可視化し、可視化結果を特徴画像とすることができる。勿論、他の方式により、特徴画像を得ることもできる。本願の実施例は、これを限定するものではない。
本願の幾つかの実施例において、所定の予測モデルは、下記方法で訓練される。
S107において、訓練サンプル及び予測モデルを取得する。
レーダーによりターゲットシーンのデプス画像を収集し、カメラによりターゲットシーンの二次元画像を収集する前に、訓練サンプル及び予測モデルを取得する必要もある。これにより、後続で、訓練サンプルにより、予測モデルを訓練することができる。
所定の予測モデルにより、初期段階の補完デプス画像、法線方向予測画像、特徴画像及び第1信頼度画像を得ることができるため、取得された訓練サンプルに、少なくとも訓練デプス画像サンプル、訓練二次元画像サンプル、訓練デプス画像サンプルと訓練二次元画像サンプルに対応する初期段階の補完デプス画像の真値画像、法線方向予測画像の真値画像及び第1信頼度画像の真値画像が含まれることに留意されたい。ここで、初期段階の補完デプス画像の真値画像は、三次元シーンの真実のデプス情報を画素値とすることで構成された画像を指す。法線方向予測画像の真値画像は、初期段階の補完デプス画像の真値画像に対して主成分分析(Principal Component Analysis:PCA)を行うことで算出された画像を指す。第1信頼度画像の真値画像は、訓練デプス画像及びデプス画像の真値画像を利用することで算出された画像を指す。
本願の実施例において、各3D点の信頼度の真値に対して演算を行い、続いて、各3D点の信頼度の真値を画素値として、第1信頼度画像の真値画像を得る。各3D点の置信度の真値を算出する時、まず、3D点のデプス情報から、3D点デプス情報の真値を差し引き、得られた差分値の絶対値を求め、絶対値結果を得る。続いて、絶対値結果と所定の誤差フォールトトレラントパラメータとの比を求める。最後に、得られた比を指数関数の指数とし、自然対数eを指数関数の底として演算を行い、各3D点の信頼度の真値を得る。
例示的に、本願の実施例において、式(17)により、3D点の信頼度の真値を算出することができる。式(17)は、以下に示すとおりである。
Figure 0007143449000165
ただし、
Figure 0007143449000166
は、3D点のデプス情報を表し、
Figure 0007143449000167
は、3D点の訓練デプス情報の真値を表し、bは、所定の誤差フォールトトレラントパラメータであり、
Figure 0007143449000168
は、算出された信頼度の真値である。
各3D点のデプス情報、各3D点の訓練デプス情報の真値、及び所定の誤差フォールトトレラントパラメータの数値を取得した後、これらのデータを式(17)に代入し、各3D点の信頼度の真値を一つずつ算出し、更に各3D点の信頼度の真値を画素値として、第1信頼度画像の真値画像を得ることができる。
本願の実施例において、所定の誤差フォールトトレラントパラメータは、第1信頼度画像の真値画像の演算プロセスに影響を与えるため、所定の誤差フォールトトレラントパラメータは、経験に応じて設定されてもよく、本願の実施例は、これを限定するものではないことに留意されたい。
例示的に、本願の実施例は、所定の誤差フォールトトレラントパラメータによる第1信頼度画像の真値画像の誤差への影響を示す。図13(a)に示すように、横座標は、所定の誤差フォールトトレラントパラメータbの値であり、縦座標は、様々な所定の誤差フォールトトレラントパラメータbにより算出された第1信頼度画像の真値画像の二乗平均平方根誤差(Root Mean Square Error:RMSE)である。RMSEの単位は、mmである。図13(a)から分かるように、bの値は、
Figure 0007143449000169
から次第に増大し、
Figure 0007143449000170
となるまで継続する場合、第1信頼度画像の真値画像のRMSEは、まず減少し、続いて増大する。また、bが
Figure 0007143449000171
である場合、第1信頼度画像の真値画像RMSEは、最小になる。これから分かるように、第1信頼度画像の真値画像のRMSEを最小にするために、所定の誤差フォールトトレラントパラメータbを
Figure 0007143449000172
とすることができる。本願の実施例は、所定の誤差フォールトトレラントパラメータの値による信頼度の真値-絶対誤差(Absolute Error:AE)曲線分布への影響を更に示す。図13(b)における横座標は、絶対誤差であり、AEの単位は、mである。縦座標は、信頼度の真値
Figure 0007143449000173
である。図13(b)における5本の曲線は、左から右へ、順に、b=0.1である場合の
Figure 0007143449000174
曲線分布、b=0.5である場合の
Figure 0007143449000175
曲線分布、b=1.0である場合の
Figure 0007143449000176
曲線分布、b=1.5である場合の
Figure 0007143449000177
曲線分布、b=2.0である場合の
Figure 0007143449000178
曲線分布、及びb=5.0である場合の
Figure 0007143449000179
曲線分布である。これらの曲線分布から分かるように、bの値が小さすぎる時、例えば、b=0.1、b=0.5である時、AEが小さくても、信頼度の
Figure 0007143449000180
も低い。実際の適用において、誤差が小さい信頼度真値に対して、高い信頼度を求めることができない。つまり、信頼度が不正確である。同様に、bの値が大きすぎる時、つまり、b=2.0、b=5.0である時、AEが大きいが、信頼度の真値
Figure 0007143449000181
は高い。実際の適用において、雑音に対する許容度が高い。従って、誤差が大きい信頼度の置信度の真値に対して、低い信頼度を求めることができない。bが1である時、小さなAEについて、信頼度
Figure 0007143449000182
が高く、大きなAEについて、信頼度
Figure 0007143449000183
が低い、信頼度の真値に対して、適切な信頼度を求めることができる。
S108において、訓練サンプルにより、予測モデルを訓練し、予測パラメータを得る。
訓練サンプルを得た後、訓練サンプルにより、予測モデルに対して教師あり訓練を行い、損失関数が要件を満たすまで訓練を中止し、予測パラメータを得る。これにより、後続で、所定の予測モデルを得る。
所定のモデルを訓練する時、訓練デプス画像サンプル及び訓練二次元画像サンプルを入力として、訓練デプス画像サンプル及び訓練二次元画像サンプルに対応する初期段階の補完デプス画像の真値画像、法線方向予測画像の真値画像及び第1信頼度画像の真値画像を監督として、教師あり訓練を行うことに留意されたい。
本願の実施例において、初期段階の補完デプス画像の真値画像、法線方向予測画像の真値画像及び第1信頼度画像の真値画像に対してそれぞれサブ損失関数を設定し、続いて、これらのサブ損失関数をそれぞれそれに対応する損失関数の重み調整パラメータと乗算し、最後に乗算結果に基づいて、所定の予測モデルの損失関数を得ることができる。
例示的に、所定の予測モデルの損失関数を以下に設定してもよい。
Figure 0007143449000184
ただし、
Figure 0007143449000185
は、初期段階の補完デプス画像の真値画像に対応するサブ損失関数であり、
Figure 0007143449000186
は、法線方向予測画像の的真値画像に対応するサブ損失関数であり、
Figure 0007143449000187
は、第1信頼度画像の真値画像に対応するサブ損失関数であり、
Figure 0007143449000188
は、損失関数の重み調整パラメータである。勿論、所定の予測モデルの損失関数を他の形態に設定してもよく、本願の実施例は、これを限定するものではない。
損失関数の重み調整パラメータは、実際の状況に応じて設定されてもよく、本願の実施例は、これを限定するものではないことに留意されたい。
初期段階の補完デプス画像の真値画像に対応するサブ損失関数は、以下のように設定されてもよい。
Figure 0007143449000189
ただし、
Figure 0007143449000190
は、訓練サンプルから予測された3D点の一次デプス情報を表し、
Figure 0007143449000191
は、3D点の元デプス情報の真値を表し、nは初期段階の補完デプス画像の画素の総数である。
法線方向予測画像の真値画像に対応するサブ損失関数は、以下のように設定されてもよい。
Figure 0007143449000192
ただし、
Figure 0007143449000193
は、訓練サンプルから予測された3D点の所在する接平面の法線ベクトルを表し、
Figure 0007143449000194
は、3D点の真実の法線ベクトルを表し、nは、法線方向予測画像の画素の総数である。
第1信頼度画像の真値画像に対応するサブ損失関数は、以下のように設定されてもよい。
Figure 0007143449000195
ただし、
Figure 0007143449000196
は、訓練サンプルから予測された3D点に対応する信頼度情報を表し、
Figure 0007143449000197
は、式(17)により算出された3D点に対応する信頼度情報の真値を表し、nは、第1信頼度画像の画素の総数である。
訓練プロセスにおいて、多くのハイパーパラメータが、例えば、サンプリング率などのような、最後に得られた所定の予測モデルの性能に影響を与えるため、装置は、適切なハイパーパラメータを選択して予測モデルに対して訓練を行うことができることに留意されたい。これにより、後続で、効果が高い所定の予測モデルを得る。
S109において、予測パラメータ及び予測モデルにより、所定の予測モデルを構成する。
予測モデルを訓練して、予測パラメータを得た後、得られた予測パラメータ及び予測モデルにyり、所定の予測モデルを構成する。これにより、後続で、装置は、所定の予測モデルにより、装置により収集されたデプス画像及び二次元画像を予測することができる。
例示的に、本願の実施例は、所定の予測モデルのサンプリング率による補完後のデプス画像への影響を示す概略図を提供する。図14(a)に示すように、KITTIデータ集合で試験を行う。横座標は、サンプリング率であり、縦座標は、RMSEであり、RMSEの単位は、mmである。図面における3本の曲線は、それぞれ、epoch=10、epoch=20及びepoch=30である場合に得られた結果である。図14(a)から分かるように、epoch=10、epoch=20、epoch=30に関わらず、サンプリング率が0から1.0へ逓増する時、RMSEは、ますます小さくなり、且つ、サンプリング率が1.0である場合、RMSEは、最小になる。図14(b)は、NYUデータ集合で試験を行った結果を示す。図14(a)と同様に、図14(b)における横座標は、サンプリング率であり、縦座標は、RMSEであり、RMSEの単位は、mmである。図面における3本の曲線は、それぞれ、epoch=10、epoch=20及びepoch=30である場合に得られた結果である。図14(a)と同様に、epoch=10、epoch=20、epoch=30に関わらず、サンプリング率が0から1.0へ逓増する時、RMSEは、ますます小さくなり、且つ、サンプリング率が1.0である場合、RMSEは、最小になる。図14(a)及び図14(b)から分かるように、所定の予測モデルに対して適切なサンプリング率を選択することで、補完後のデプス画像のRMSEを著しく低下させることができ、つまり、効果が高い補完後のデプス画像を得ることができる。
本願の実施例において、予測モデルに対して訓練を行い、予測パラメータを得て、予測パラメータ及び予測モデルで所定の予測モデルを構成することができる。従って、後続で、所定の予測モデルにより、リアルタイムに収集されたデプス画像及び二次元画像に対して予測処理を行うことができる。
例示的に、本願の実施例は、デプス画像補完方法の効果と関連技術におけるデプス補完技術の効果との比較を示す概略図を提供する。図15(a)に示すように、収集された三次元シーンのデプス画像及び二次元画像を示す概略図である。観察を容易にするために、デプス画像と二次元画像を重ね合せて示す。図15(b)は、関連技術における畳み込み空間伝播ネットワーク(Convolutional Spatial Propagation Network:CSPN)によりデプス補完を行うことで得られた補完したデプス画像を示す。図15(c)は、関連技術におけるNConv-畳み込みニューラルネットワーク(NConv- Convolutional Neural Network:NConv-CNN)により得られた補完したデプス画像を示す。図15(d)は、関連技術における疎ら-密な(Sparse-to-Dense)方法で得られた補完したデプス画像を示す。図15(e)は、本願の実施例による予測した法線方向予測画像を示す。図15(f)は、本願の実施例による予測した第1信頼度画像を示す。図15(g)は、本願の実施例によるデプス画像補完方法で得られた補完后したデプス画像を示す。図15(b)、図15(c)、図15(d)を図15(g)と比較すると、従来技術に比べて、本願の実施例によるデプス画像補完方法で得られた補完したデプス画像の効果がより高く、誤ったデプス情報を有する画素点の数がより少なく、且つ補完後のデプス画像の細部情報もより十分であることが明らかになる。
具体的な実施形態の上記方法において、各ステップの記述順番は、厳しい実行順番として実施過程を限定するものではなく、各ステップの具体的な実行順番はその機能及び考えられる内在的論理により決まることは、当業者であれば理解すべきである。
本願の幾つかの実施例において、図16に示すように、本願の実施例は、デプス画像補完装置1を提供する。該デプス画像補完装置1は、
設けられたレーダーにより、ターゲットシーンのデプス画像を収集し、設けられたカメラにより、前記ターゲットシーンの二次元画像を収集するように構成される収集モジュール10と、
収集されたデプス画像及び前記二次元画像に基づいて、拡散待ち画像及び特徴画像を決定し、前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定するように構成される処理モジュール11であって、前記拡散強度は、前記拡散待ち画像における各画素の画素値が隣接画素へ拡散する強度を表す、処理モジュール11と、
前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定するように構成される拡散モジュール12と、を備えてもよい。
本願の幾つかの実施例において、前記拡散モジュール12は更に、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、前記拡散待ち画像における各画素の拡散後の画素値を決定し、前記拡散待ち画像における各画素の拡散後の画素値に基づいて、補完後のデプス画像を決定するように構成される。
本願の幾つかの実施例において、前記拡散待ち画像は、初期段階の補完デプス画像であり、前記拡散モジュール12は、前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するように構成される場合、更に、前記拡散待ち画像における各画素の拡散後の画素値を拡散後の画像の各画素の画素値とし、拡散後の画像を補完後のデプス画像とするように構成される。
本願の幾つかの実施例において、前記拡散待ち画像は、第1平面原点距離画像であり、前記処理モジュール11は、前記デプス画像及び前記二次元画像に基づいて拡散待ち画像及び特徴画像を決定するように構成される場合、更に、前記カメラのパラメータ行列を取得し、前記デプス画像及び前記二次元画像に基づいて、前記初期段階の補完デプス画像、前記特徴画像及び法線方向予測画像を決定するように構成され、前記法線方向予測画像は、三次元シーンにおける各点の法線ベクトルを画素値とした画像を指し、前記処理モジュール11は更に、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出するように構成され、前記第1平面原点距離画像は、前記初期段階の補完デプス画像を利用して算出された前記カメラから前記三次元シーンにおける各点の所在する平面までの距離を画素値とした画像である。
本願の幾つかの実施例において、前記処理モジュール11は更に、前記デプス画像及び前記二次元画像に基づいて第1信頼度画像を決定するように構成され、前記第1信頼度画像は、前記デプス画像における各画素に対応する信頼度を画素値として用いた画像を指し、前記処理モジュール11は更に、前記デプス画像、前記パラメータ行列及び前記法線方向予測画像に基づいて、第2平面原点距離画像を算出するように構成され、前記第2平面原点距離画像は、前記デプス画像を利用して算出された前記カメラから前記三次元シーンにおける各点の所在する平面までの距離を画素値として用いた画像を指し、前記処理モジュール11は更に、前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得るように構成される。
本願の幾つかの実施例において、前記処理モジュール11は、前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得るように構成される場合、更に、前記第2平面原点距離画像から、前記第1平面原点距離画像の第1画素点に対応する画素点を置換え画素点として決定し、前記置換え画素点の画素値を決定することであって、前記第1画素点は、前記第1平面原点距離画像におけるいずれか1つの画素点である、ことと、前記第1信頼度画像から、前記置換え画素点に対応する信頼度情報を決定することと、前記置換え画素点の画素値、前記信頼度情報及び前記第1平面原点距離画像の第1画素点の画素値に基づいて、前記第1平面原点距離画像の前記第1画素点の最適化後の画素値を決定することと、を繰り返して実行し、前記第1平面原点距離画像の各画素の最適化後の画素値を決定して前記最適化後の第1平面原点距離画像を得るまで継続するように構成される。
本願の幾つかの実施例において、前記処理モジュール11は、前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定するように構成される場合、更に、所定拡散範囲に基づいて、前記拡散待ち画像から、前記拡散待ち画像の第2画素点に対応する拡散待ち画素集合を決定し、前記拡散待ち画素集合における各画素の画素値を決定するように構成され、前記第2画素点は、前記拡散待ち画像におけるいずれか1つの画素点であり、前記処理モジュール11は更に、前記特徴画像、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する拡散強度を算出するように構成され、
前記拡散モジュール12は、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、前記拡散待ち画像における各画素の拡散後の画素値を決定するように構成される場合、更に、前記拡散待ち画像の第2画素点の拡散強度、前記拡散待ち画像の第2画素点の画素値及び前記拡散待ち画素集合における各画素の画素値に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を決定すること、を繰り返して実行し、前記拡散待ち画像における各画素の拡散後の画素値を決定するまで継続するように構成される。
本願の幾つかの実施例において、前記処理モジュール11は、前記特徴画像、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する拡散強度を算出するように構成される場合、更に、拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出することと、前記特徴画像において、前記拡散待ち画像の第2画素点に対応する画素を第1特徴画素とすることと、前記特徴画像において、前記拡散待ち画素集合における第3画素点に対応する画素を第2特徴画素とすることであって、前記第3画素点は、拡散待ち画素集合におけるいずれか1つの画素点である、ことと、前記第1特徴画素の特徴情報及び前記第2特徴画素の特徴情報を抽出することと、前記第1特徴画素の特徴情報、前記第2特徴画素の特徴情報、前記強度正規化パラメータ及び所定拡散制御パラメータ利用して、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における第3画素点からなる拡散画素ペアのサブ拡散強度を算出することと、を繰り返して実行し、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素からなる拡散画素ペアのサブ拡散強度を決定するまで継続することと、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素からなる拡散画素ペアのサブ拡散強度を前記拡散待ち画像の第2画素点に対応する拡散強度とすることと、を実行するように構成される。
本願の幾つかの実施例において、前記処理モジュール11は、拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出するように構成される場合、更に、前記拡散待ち画像の第2画素点の特徴情報及び前記拡散待ち画素集合における第3画素点の特徴情報を抽出することと、抽出して得られた拡散待ち画像の第2画素点の特徴情報、前記拡散待ち画素集合における第3画素点の特徴情報及び前記所定拡散制御パラメータ利用して、前記拡散待ち画素集合における第3画素点のサブ正規化パラメータを算出することと、を繰り返して実行し、前記拡散待ち画素集合における各画素のサブ正規化パラメータを得るまで継続することと、前記拡散待ち画素集合における各画素のサブ正規化パラメータに対して累加を行い、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを得ることと、実行するように構成される。
本願の幾つかの実施例において、前記拡散モジュール12は、前記拡散待ち画像の第2画素点の拡散強度、前記拡散待ち画像の第2画素点の画素値及び前記拡散待ち画素集合における各画素の画素値に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を決定するように構成される場合、更に、前記拡散強度における各サブ拡散強度をそれぞれ前記拡散待ち画像の第2画素点の画素値と乗算し、得られた乗算結果を累加し、前記拡散待ち画像の第2画素点の第1拡散部を得て、前記拡散強度における各サブ拡散強度をそれぞれ拡散待ち画素集合における各画素の画素値と乗算し、得られた乗算結果を累加し、前記拡散待ち画像の第2画素点の第2拡散部を得て、前記拡散待ち画像の第2画素点の画素値、前記拡散待ち画像の第2画素点の第1拡散部及び前記拡散待ち画像の第2画素点の第2拡散部に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を算出するように構成される。
本願の幾つかの実施例において、前記拡散モジュール12は更に、前記補完後のデプス画像を拡散待ち画像とし、前記拡散待ち画像及び前記特徴画像に基づいて前記拡散待ち画像における各画素の拡散強度を決定するステップ、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて前記拡散待ち画像における各画素の拡散後の画素値を決定するステップ、及び前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するステップを繰り返して実行し、所定の繰り返し回数に達するまで継続するように構成される。
本願の幾つかの実施例において、前記拡散モジュール12は更に、前記補完後のデプス画像を初期段階の補完デプス画像とし、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出して前記第1平面原点距離画像を拡散待ち画像とするステップ、前記拡散待ち画像及び前記特徴画像に基づいて前記拡散待ち画像における各画素の拡散強度を決定するステップ、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて前記拡散待ち画像における各画素の拡散後の画素値を決定するステップ、及び前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するステップを繰り返して実行し、所定の繰り返し回数に達するまで継続するように構成される。
本願の幾つかの実施例において、前記拡散モジュール12は、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出して前記第1平面原点距離画像を拡散待ち画像とするように構成される場合、更に、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び法線方向予測画像に基づいて、第1平面原点距離画像を算出し、前記デプス画像及び前記二次元画像に基づいて、第1信頼度画像を決定し、前記デプス画像、パラメータ行列及び法線方向予測画像に基づいて、第2平面原点距離画像を算出し、前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得て、最適化後の第1平面原点距離画像を拡散待ち画像とするように構成される。
幾つかの実施例において、本願の実施例で提供される装置における機能及びモジュールは、上記方法実施例に記載の方法を実行するために用いられ、具体的な実現形態は上記方法実施例の説明を参照されたい。簡潔化のために、ここで詳細な説明を省略する。
本願の幾つかの実施例において、図17は、本願の実施例によるデプス画像補完装置の構造を示す概略図である。図17に示すように、本願で提供されるデプス画像補完装置は、プロセッサ01と、プロセッサ01による実行可能な命令を記憶したメモリ02と、を備えてもよい。プロセッサ01は、メモリに記憶された実行可能なデプス画像補完命令を実行し、本願の実施例で提供されるデプス画像補完方法を実現させるように構成される。
本願の実施例において、上記プロセッサ01は、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、デジタル信号プロセッサ(Digital Signal Processor:DSP)、デジタル信号処理機器(Digital Signal Process:DSPD)、プログラマブルロジックデバイス(Programmable Logic Device:PLD)、フィールドプログラマブルゲートアレイ(Field-Programmable Gate Array:FPGA)、CPU、コントローラ、マイクロコントローラ、マイクロプロセッサのうちの少なくとも1つであってもよい。様々な機器について、上記プロセッサの機能を実現させるための電子機器は、他のものであってもよく、本願の実施例は、これを限定するものではないことが理解されるべきである。該端末は、メモリ02を更に備えてもよい。該メモリ02は、プロセッサ01に接続されてもよい。ここで、メモリ02は、高速RAMメモリを含んでもよく、例えば、少なくとも2つの磁気ディスクメモリのような不揮発性メモリを含んでもよい。
上記適用において、上記メモリ02は、プロセッサ01に命令及びデータを提供するための、例えば、ランダムアクセスメモリ(Random-Access Memory:RAM)のような揮発性メモリ(volatile memory)であってもよく、例えば、読出し専用メモリ(Read-Only Memory:ROM)、フラッシュメモリ(flash memory)、ハードディスクドライブ(Hard Disk Drive:HDD)又はソリッドステートドライブ(Solid-State Drive:SSD)のような不揮発性メモリ(non-volatile memory)であってもよく、又は上記メモリの組み合わせであってもよい。
なお、本実施例における各機能モジュールは一つの処理ユニットに集積されてもよいし、各ユニットが物理的に別個のものとして存在してもよいし、2つ以上のユニットが一つのユニットに集積されてもよい。上記集積したユニットはハードウェアとして実現してもよく、ハードウェアとソフトウェア機能ユニットとの組み合わせで実現してもよい。
集積したユニットがソフトウェア機能ユニットの形で実現され、かつ独立した製品として販売または使用されるとき、コンピュータにより読み取り可能な記憶媒体内に記憶されてもよい。このような理解のもと、本実施例の技術的解決手段は、本質的に、又は、従来技術に対して貢献をもたらした部分又は該技術的解決手段の一部は、ソフトウェア製品の形式で具現することができ、このようなコンピュータソフトウェア製品は、記憶媒体に記憶しても良く、また、コンピュータ機器(パーソナルコンピュータ、サーバ又はネットワーク装置など)又はprocessor(プロセッサ)に、本願の各実施例に記載の方法の全部又は一部のステップを実行させるための若干の命令を含む。前記の記憶媒体は、USBメモリ、リムーバブルハードディスク、読出し専用メモリ、ランダムアクセスメモリ、磁気ディスク、又は光ディスクなど、プログラムコードを記憶可能な各種の媒体を含む。
本願の実施例におけるデプス画像補完装置は、例えば、デスクトップコンピュータ、ノートパソコン、マイクロコンピュータ、車載コンピュータなどのような、演算機能を有する装置であってもよい。具体的な装置の実施形態は、実際の需要に応じて決まってもよく、本願の実施例はこれを限定するものではない。
本願の実施例提供は、コンピュータ可読記憶媒体を提供する。前記コンピュータ可読記憶媒体に、実行可能なデプス画像補完命令が記憶されており、端末に適用される。該プログラムがプロセッサにより実行される時、本願の実施例で提供されるデプス画像補完方法を実現させる。
本願の実施例は、方法、システム又はコンピュータプログラム製品として提供されてもよい。従って、本願は、ハードウェア実施例、ソフトウェア実施例又は、ソフトウェアとハードウェアを組み合わせる実施例の形態を用いてもよいことが当業者であれ理解すべきである。また、本願は、コンピュータによる利用可能なコンピュータコードを含む1つ又は複数のコンピュータによる利用可能な記憶媒体(磁気ディスクメモリ及び光学メモリなどを含むが、これらに限定されない)で実行されるコンピュータプログラム製品の形態を利用することができる。
本願は、本願の実施例の方法、機器(システム)及びコンピュータプログラム製品のフローチャート及び/又はブロック図を参照しながら、説明される。コンピュータプログラム命令により、フローチャート及び/又はブロック図における各フロー及び/又はブロック、及びフローチャート及び/又はブロック図におけるフロー及び/又はブロックの組み合わせを実現することができることが理解されるべきである。これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータまたはその他プログラマブルデータ処理装置のプロセッサに提供でき、それによって機器を生み出し、これら命令はコンピュータまたはその他プログラマブルデータ処理装置のプロセッサにより実行される時、フローチャート及び/又はブロック図における1つ又は複数のブロック中で規定している機能/操作を実現する装置を生み出した。
これらのコンピュータ可読プログラム命令をコンピュータ可読記憶媒体に記憶してもよい。これらの命令によれば、コンピュータ又は他のプログラマブルデータ処理装置は特定の方式で動作する。従って、命令が記憶されているコンピュータ可読記憶媒体は、フローチャート及び/又はブロック図における1つ又は複数のブロック中で規定している機能を実現する各態様の命令を含む製品を備える。
これらのコンピュータプログラム命令をコンピュータ又は他のプログラマブルデータ処理装置にロードしてもよい。これにより、コンピュータ、他のプログラマブルデータ処理装置又は他の装置で一連の操作の工程を実行して、コンピュータで実施されるプロセスを生成する。従って、コンピュータ、他のプログラマブルデータ処理装置又は他の装置で実行される命令により、フローチャート及び/又はブロック図における1つ又は複数のブロック中で規定している機能を実現させる。
後続の説明において、「モジュール」、「部材」又は「ユニット」のような素子を表すための接尾語は、本願の説明を容易にするためのものだけであり、その自体は、特定の意味を持たない。従って、「モジュール」、「部材」又は「ユニット」は混用してもよい。
上記は、本願の好ましい実施例に過ぎず、本願の保護範囲を限定するものではない。
本実施例において、デプス画像補完装置は、収集されたデプス画像及び二次元画像に基づいて、拡散待ち画像を得ることができる。拡散待ち画像に、収集されたデプス画像における全てのポイントクラウドデータが残されている。これにより、拡散待ち画像における各画素値及びそれに対応する拡散強度を利用して、拡散待ち画像における各画素の拡散後の画素値を決定する時、収集されたデプス画像における全てのポイントクラウドデータを利用する。これにより、収集されたデプス画像におけるポイントクラウドデータを十分に利用することで、三次元シーンにおける各3D点のデプス情報の正確度がより高くなり、補完後のデプス画像の正確度が向上した。

Claims (17)

  1. デプス画像補完方法であって、前記方法は、
    設けられたレーダーにより、ターゲットシーンのデプス画像を収集し、設けられたカメラにより、前記ターゲットシーンの二次元画像を収集することと、
    収集されたデプス画像及び前記二次元画像に基づいて、拡散待ち画像及び特徴画像を決定することと、
    前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定することであって、前記拡散強度は、前記拡散待ち画像における各画素の画素値が隣接画素へ拡散する強度を表す、ことと、
    前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定すること
    を含む、デプス画像補完方法。
  2. 前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定することは、
    前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、前記拡散待ち画像における各画素の拡散後の画素値を決定することと、
    前記拡散待ち画像における各画素の拡散後の画素値に基づいて、補完後のデプス画像を決定すること
    を含む請求項1に記載の方法。
  3. 前記拡散待ち画像は、初期段階の補完デプス画像であり、前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定することは、
    前記拡散待ち画像における各画素の拡散後の画素値を拡散後の画像の各画素の画素値とすることと、
    拡散後の画像を補完後のデプス画像とすること
    を含む請求項2に記載の方法。
  4. 前記拡散待ち画像は、第1平面原点距離画像であり、前記デプス画像及び前記二次元画像に基づいて拡散待ち画像及び特徴画像を決定することは、
    前記カメラのパラメータ行列を取得することと、
    前記収集されたデプス画像及び前記二次元画像に基づいて、初期段階の補完デプス画像、前記特徴画像及び法線方向予測画像を決定することであって、前記法線方向予測画像は、三次元シーンにおける各点の法線ベクトルを画素値とした画像を指す、ことと、
    前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出することであって、前記第1平面原点距離画像は、前記初期段階の補完デプス画像を利用して算出された前記カメラから前記三次元シーンにおける各点の所在する平面までの距離を画素値とした画像である、こと
    を含む請求項2に記載の方法。
  5. 前記方法は、
    前記収集されたデプス画像及び前記二次元画像に基づいて第1信頼度画像を決定することであって、前記第1信頼度画像は、前記収集されたデプス画像における各画素に対応する信頼度を画素値として用いた画像を指す、ことと、
    前記収集されたデプス画像、前記パラメータ行列及び前記法線方向予測画像に基づいて、第2平面原点距離画像を算出することであって、前記第2平面原点距離画像は、前記収集されたデプス画像を利用して算出された前記カメラから前記三次元シーンにおける各点の所在する平面までの距離を画素値として用いた画像を指す、ことと、
    前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得ること
    を更に含む請求項4に記載の方法。
  6. 前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得ることは、
    前記第2平面原点距離画像から、前記第1平面原点距離画像の第1画素点に対応する画素点を置換え画素点として決定し、前記置換え画素点の画素値を決定することであって、前記第1画素点は、前記第1平面原点距離画像におけるいずれか1つの画素点である、ことと、
    前記第1信頼度画像から、前記置換え画素点に対応する信頼度情報を決定することと、
    前記置換え画素点の画素値、前記信頼度情報及び前記第1平面原点距離画像の第1画素点の画素値に基づいて、前記第1平面原点距離画像の前記第1画素点の最適化後の画素値を決定することと、
    を繰り返して実行し、前記第1平面原点距離画像の各画素の最適化後の画素値を決定して前記最適化後の第1平面原点距離画像を得るまで継続すること含む請求項5に記載の方法。
  7. 前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定することは、
    所定拡散範囲に基づいて、前記拡散待ち画像から、前記拡散待ち画像の第2画素点に対応する拡散待ち画素集合を決定し、前記拡散待ち画素集合における各画素の画素値を決定することであって、前記第2画素点は、前記拡散待ち画像におけるいずれか1つの画素点である、ことと、
    前記特徴画像、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する拡散強度を算出すること
    を含み、
    前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、前記拡散待ち画像における各画素の拡散後の画素値を決定することは、
    前記拡散待ち画像の第2画素点の拡散強度、前記拡散待ち画像の第2画素点の画素値及び前記拡散待ち画素集合における各画素の画素値に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を決定すること、
    を繰り返して実行し、前記拡散待ち画像における各画素の拡散後の画素値を決定するまで継続すること含む請求項4~6のうちいずれか一項に記載の方法。
  8. 前記特徴画像、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する拡散強度を算出することは、
    拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出することと、
    前記特徴画像において、前記拡散待ち画像の第2画素点に対応する画素を第1特徴画素とすることと、
    前記特徴画像において、前記拡散待ち画素集合における第3画素点に対応する画素を第2特徴画素とすることであって、前記第3画素点は、拡散待ち画素集合におけるいずれか1つの画素点である、ことと、
    前記第1特徴画素の特徴情報及び前記第2特徴画素の特徴情報を抽出することと、
    前記第1特徴画素の特徴情報、前記第2特徴画素の特徴情報、前記強度正規化パラメータ及び所定拡散制御パラメータ利用して、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における第3画素点からなる拡散画素ペアのサブ拡散強度を算出することと、
    を繰り返して実行し、前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素からなる拡散画素ペアのサブ拡散強度を決定するまで継続することと、
    前記拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素からなる拡散画素ペアのサブ拡散強度を前記拡散待ち画像の第2画素点に対応する拡散強度とすること
    を含む請求項7に記載の方法。
  9. 前記サブ拡散強度は、前記拡散待ち画像の第2画素点と前記拡散待ち画素集合における第3画素点との類似度である請求項8に記載の方法。
  10. 拡散待ち画像の第2画素点及び前記拡散待ち画素集合における各画素を利用して、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを算出することは、
    前記拡散待ち画像の第2画素点の特徴情報及び前記拡散待ち画素集合における第3画素点の特徴情報を抽出することと、
    抽出して得られた拡散待ち画像の第2画素点の特徴情報、前記拡散待ち画素集合における第3画素点の特徴情報及び前記所定拡散制御パラメータ利用して、前記拡散待ち画素集合における第3画素点のサブ正規化パラメータを算出することと、
    を繰り返して実行し、前記拡散待ち画素集合における各画素のサブ正規化パラメータを得るまで継続することと、
    前記拡散待ち画素集合における各画素のサブ正規化パラメータに対して累加を行い、前記拡散待ち画像の第2画素点に対応する強度正規化パラメータを得ること
    を含む請求項8に記載の方法。
  11. 前記拡散待ち画像の第2画素点の拡散強度、前記拡散待ち画像の第2画素点の画素値及び前記拡散待ち画素集合における各画素の画素値に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を決定することは、
    前記拡散強度における各サブ拡散強度をそれぞれ前記拡散待ち画像の第2画素点の画素値と乗算し、得られた乗算結果を累加し、前記拡散待ち画像の第2画素点の第1拡散部を得ることと、
    前記拡散強度における各サブ拡散強度をそれぞれ拡散待ち画素集合における各画素の画素値と乗算し、得られた乗算結果を累加し、前記拡散待ち画像の第2画素点の第2拡散部を得ることと、
    前記拡散待ち画像の第2画素点の画素値、前記拡散待ち画像の第2画素点の第1拡散部及び前記拡散待ち画像の第2画素点の第2拡散部に基づいて、前記拡散待ち画像の第2画素点の拡散後の画素値を算出すること
    を含む請求項8に記載の方法。
  12. 前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定した後、前記方法は、
    前記補完後のデプス画像を拡散待ち画像とし、前記拡散待ち画像及び前記特徴画像に基づいて前記拡散待ち画像における各画素の拡散強度を決定するステップ、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて前記拡散待ち画像における各画素の拡散後の画素値を決定するステップ、及び前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するステップを繰り返して実行し、所定の繰り返し回数に達するまで継続することを更に含む請求項3に記載の方法。
  13. 前記拡散待ち画像における各画素の拡散後の画素値に基づいて、補完後のデプス画像を決定した後、前記方法は、
    前記補完後のデプス画像を初期段階の補完デプス画像とし、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出して前記第1平面原点距離画像を拡散待ち画像とするステップ、前記拡散待ち画像及び前記特徴画像に基づいて前記拡散待ち画像における各画素の拡散強度を決定するステップ、前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて前記拡散待ち画像における各画素の拡散後の画素値を決定するステップ、及び前記拡散待ち画像における各画素の拡散後の画素値に基づいて補完後のデプス画像を決定するステップを繰り返して実行し、所定の繰り返し回数に達するまで継続することを更に含む請求項411のうちいずれか一項に記載の方法。
  14. 毎回に実行される、前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出して前記第1平面原点距離画像を拡散待ち画像とするステップは、
    前記初期段階の補完デプス画像、前記カメラのパラメータ行列及び前記法線方向予測画像に基づいて、第1平面原点距離画像を算出するステップと、
    前記収集されたデプス画像及び前記二次元画像に基づいて、第1信頼度画像を決定するステップと、
    前記収集されたデプス画像、パラメータ行列及び法線方向予測画像に基づいて、第2平面原点距離画像を算出するステップと、
    前記第1信頼度画像における画素、前記第2平面原点距離画像における画素及び前記第1平面原点距離画像における画素に基づいて、前記第1平面原点距離画像における画素を最適化し、最適化後の第1平面原点距離画像を得て、最適化後の第1平面原点距離画像を拡散待ち画像とするステップ
    を含む請求項13に記載の方法。
  15. デプス画像補完装置であって、前記装置は、
    設けられたレーダーにより、ターゲットシーンのデプス画像を収集し、設けられたカメラにより、前記ターゲットシーンの二次元画像を収集するように構成される収集モジュールと、
    収集されたデプス画像及び前記二次元画像に基づいて、拡散待ち画像及び特徴画像を決定し、前記拡散待ち画像及び前記特徴画像に基づいて、前記拡散待ち画像における各画素の拡散強度を決定するように構成される処理モジュールであって、前記拡散強度は、前記拡散待ち画像における各画素の画素値が隣接画素へ拡散する強度を表す、処理モジュールと、
    前記拡散待ち画像における各画素の画素値及び前記拡散待ち画像における各画素の拡散強度に基づいて、補完後のデプス画像を決定するように構成される拡散モジュール
    を備える、デプス画像補完装置。
  16. デプス画像補完装置であって、前記装置は、メモリプロセッサを備え、
    前記メモリは、実行可能なデプス画像補完命令を記憶するように構成され、
    前記プロセッサは、前記メモリに記憶された前記実行可能なデプス画像補完命令を実行することにより、請求項114のうちいずれか一項に記載の方法を実現するように構成される、デプス画像補完装置。
  17. コンピュータ読み取り可能な記憶媒体であって、前記コンピュータ読み取り可能な記憶媒体には、実行可能なデプス画像補完命令が記憶されており、前記実行可能なデプス画像補完命令は、請求項114のうちいずれか一項に記載の方法を実現することをプロセッサに行わせる、コンピュータ読み取り可能な記憶媒体。
JP2020568542A 2019-08-30 2019-12-26 デプス画像補完方法及び装置、コンピュータ可読記憶媒体 Active JP7143449B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910817815.1A CN112446909B (zh) 2019-08-30 2019-08-30 一种深度图像补全方法及装置、计算机可读存储介质
CN201910817815.1 2019-08-30
PCT/CN2019/128828 WO2021036135A1 (zh) 2019-08-30 2019-12-26 一种深度图像补全方法及装置、计算机可读存储介质

Publications (2)

Publication Number Publication Date
JP2022501681A JP2022501681A (ja) 2022-01-06
JP7143449B2 true JP7143449B2 (ja) 2022-09-28

Family

ID=74684872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020568542A Active JP7143449B2 (ja) 2019-08-30 2019-12-26 デプス画像補完方法及び装置、コンピュータ可読記憶媒体

Country Status (6)

Country Link
US (1) US20210082135A1 (ja)
JP (1) JP7143449B2 (ja)
KR (1) KR20210027269A (ja)
CN (1) CN112446909B (ja)
SG (1) SG11202012443SA (ja)
WO (1) WO2021036135A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12008740B2 (en) * 2020-08-12 2024-06-11 Niantic, Inc. Feature matching using features extracted from perspective corrected image
CN113012210B (zh) * 2021-03-25 2022-09-27 北京百度网讯科技有限公司 深度图的生成方法、装置、电子设备和存储介质
US20220390591A1 (en) * 2021-06-03 2022-12-08 Ford Global Technologies, Llc Depth map generation
CN113625271B (zh) * 2021-07-29 2023-10-27 中汽创智科技有限公司 基于毫米波雷达和双目相机的同时定位与建图方法
KR102641108B1 (ko) * 2021-08-03 2024-02-27 연세대학교 산학협력단 깊이맵 완성 장치 및 방법
GB2609983A (en) * 2021-08-20 2023-02-22 Garford Farm Machinery Ltd Image processing
WO2023106119A1 (ja) * 2021-12-09 2023-06-15 ソニーグループ株式会社 制御装置、制御方法、情報処理装置、生成方法、およびプログラム
CN114897955B (zh) * 2022-04-25 2023-04-18 电子科技大学 一种基于可微几何传播的深度补全方法
WO2024076027A1 (ko) * 2022-10-07 2024-04-11 삼성전자 주식회사 포인트 클라우드를 생성하는 방법 및 전자 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018072858A1 (en) 2016-10-18 2018-04-26 Photonic Sensors & Algorithms, S.L. Device and method for obtaining distance information from views
JP2019016275A (ja) 2017-07-10 2019-01-31 キヤノン株式会社 画像処理方法、画像処理プログラム、記憶媒体、画像処理装置、および撮像装置
WO2019035155A1 (ja) 2017-08-14 2019-02-21 楽天株式会社 画像処理システム、画像処理方法、及びプログラム
JP2019091122A (ja) 2017-11-10 2019-06-13 凸版印刷株式会社 デプスマップフィルタ処理装置、デプスマップフィルタ処理方法及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5363213A (en) * 1992-06-08 1994-11-08 Xerox Corporation Unquantized resolution conversion of bitmap images using error diffusion
CN103198486B (zh) * 2013-04-10 2015-09-09 浙江大学 一种基于各向异性扩散的深度图像增强方法
AU2013206597A1 (en) * 2013-06-28 2015-01-22 Canon Kabushiki Kaisha Depth constrained superpixel-based depth map refinement
CN103839258A (zh) * 2014-02-13 2014-06-04 西安交通大学 一种二值化激光散斑图像的深度感知方法
CN106780593B (zh) * 2016-11-28 2019-07-26 深圳奥比中光科技有限公司 一种彩色深度图像的获取方法、获取设备
CN108062769B (zh) * 2017-12-22 2020-11-17 中山大学 一种用于三维重建的快速深度恢复方法
CN108932734B (zh) * 2018-05-23 2021-03-09 浙江商汤科技开发有限公司 单目图像的深度恢复方法及装置、计算机设备
CN109325972B (zh) * 2018-07-25 2020-10-27 深圳市商汤科技有限公司 激光雷达稀疏深度图的处理方法、装置、设备及介质
CN109685732B (zh) * 2018-12-18 2023-02-17 重庆邮电大学 一种基于边界捕捉的深度图像高精度修复方法
CN110047144A (zh) * 2019-04-01 2019-07-23 西安电子科技大学 一种基于Kinectv2的完整物体实时三维重建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018072858A1 (en) 2016-10-18 2018-04-26 Photonic Sensors & Algorithms, S.L. Device and method for obtaining distance information from views
JP2019016275A (ja) 2017-07-10 2019-01-31 キヤノン株式会社 画像処理方法、画像処理プログラム、記憶媒体、画像処理装置、および撮像装置
WO2019035155A1 (ja) 2017-08-14 2019-02-21 楽天株式会社 画像処理システム、画像処理方法、及びプログラム
JP2019091122A (ja) 2017-11-10 2019-06-13 凸版印刷株式会社 デプスマップフィルタ処理装置、デプスマップフィルタ処理方法及びプログラム

Also Published As

Publication number Publication date
WO2021036135A1 (zh) 2021-03-04
KR20210027269A (ko) 2021-03-10
CN112446909B (zh) 2022-02-01
SG11202012443SA (en) 2021-04-29
JP2022501681A (ja) 2022-01-06
CN112446909A (zh) 2021-03-05
US20210082135A1 (en) 2021-03-18

Similar Documents

Publication Publication Date Title
JP7143449B2 (ja) デプス画像補完方法及び装置、コンピュータ可読記憶媒体
US20190035150A1 (en) Resolution adaptive mesh for performing 3-d metrology of an object
EP3132418B1 (en) Non local image denoising
CA3098402C (en) Rendering images using modified multiple importance sampling
JP6202147B2 (ja) 曲線検出方法と曲線検出装置
CN111028327A (zh) 一种三维点云的处理方法、装置及设备
KR20210027380A (ko) 다수의 센서들 및 감소된 복잡도 신경망들을 사용한 오브젝트 검출
CN110632608A (zh) 一种基于激光点云的目标检测方法和装置
EP3945497A1 (en) Method and apparatus with image depth estimation
WO2023075885A1 (en) Denoising depth image data using neural networks
CN114494433B (zh) 图像处理方法、装置、设备和计算机可读存储介质
US20180025535A1 (en) Hölder Adaptive Image Synthesis
US11470298B2 (en) Method and apparatus with updating of algorithm for generating disparity image
CN113281779A (zh) 一种3d物体快速检测方法、装置、设备及介质
CN111179331B (zh) 深度估计方法、装置、电子设备及计算机可读存储介质
US9852537B2 (en) Rendering via ray-depth field intersection
KR20110048829A (ko) 레인지 영상의 노이즈 제거장치 및 방법
CN112150529A (zh) 一种图像特征点的深度信息确定方法及装置
EP3579138A1 (en) Method for determining a type and a state of an object of interest
EP3276577B1 (en) Hölder adaptive image synthesis
WO2023095564A1 (ja) 情報処理装置及び情報処理方法
US20240126953A1 (en) Arithmetic operation system, training method, and non-transitory computer readable medium storing training program
EP4322112A1 (en) Method and device for representing rendered scenes
CN118298194B (zh) 一种面向相机光通信的条纹图像处理方法、装置及设备
US20230229971A1 (en) Systems and methods for optimizing a machine learning model

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201208

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220826

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220914

R150 Certificate of patent or registration of utility model

Ref document number: 7143449

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150