JP2020005201A - 送信装置及び受信装置 - Google Patents

送信装置及び受信装置 Download PDF

Info

Publication number
JP2020005201A
JP2020005201A JP2018125275A JP2018125275A JP2020005201A JP 2020005201 A JP2020005201 A JP 2020005201A JP 2018125275 A JP2018125275 A JP 2018125275A JP 2018125275 A JP2018125275 A JP 2018125275A JP 2020005201 A JP2020005201 A JP 2020005201A
Authority
JP
Japan
Prior art keywords
video
learning
unit
image
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018125275A
Other languages
English (en)
Inventor
一宏 原
Kazuhiro Hara
一宏 原
片山 美和
Miwa Katayama
美和 片山
河北 真宏
Masahiro Kawakita
真宏 河北
三科 智之
Tomoyuki Mishina
智之 三科
菊池 宏
Hiroshi Kikuchi
宏 菊池
妹尾 孝憲
Takanori Senoo
孝憲 妹尾
藤井 俊彰
Toshiaki Fujii
俊彰 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2018125275A priority Critical patent/JP2020005201A/ja
Publication of JP2020005201A publication Critical patent/JP2020005201A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】表示端末側(受信側)で適正な学習モデルによる機械学習を利用して映像補完処理を行う。【解決手段】機械学習機能を有し、学習結果である学習モデル及び/又は学習パラメータを送信する送信装置と、前記学習モデル及び/又は学習パラメータに基づいて機械学習部を内部に構築する、受信装置とからなる。受信装置は、映像の符号化データを受信し、符号化データを復号した映像から表示映像を作成する際に、前記機械学習部から出力された映像により、表示に必要な映像情報を補完する。【選択図】図1

Description

本発明は、送信装置及び受信装置に関し、特に、データの符号化・復号処理に機械学習を利用する送信装置及び受信装置に関する。
近年、HMD(Head Mounted Display)による2眼の360度ビデオをコンテンツとしたサービスが普及している。VR(Virtual Reality)ではユーザーが別の空間に移動したような没入感を得られることが知られる。これらのサービスでは将来のサービス展開として、ユーザーが姿勢を動かしたときの運動視差に対応することが考えられている(例えば、3DoF+:3 degrees of freedom +)。そしてその先の展望として、ユーザーが姿勢だけではなく位置を移動したときの運動視差に対応するサービス(6DoF+)の実用化が期待されている。また、HMD以外の表示端末を使用した将来の映像視聴サービスでは、スポーツ中継などでユーザーが見たい視点から映像を楽しむことができる自由視点映像の実用化に向けた開発も進められている。
これらのサービスの実現に向けて、コンテンツ制作手法の議論が進められている。例えば、自由視点映像サービスに向けた撮影手法では膨大な数の映像を一度に取得する必要があり、複数台のカメラで撮影空間を囲むように配置することが知られている。また、運動視差つき360度映像では全天周カメラを所定の位置に複数台配置する取り組みが進められている。
表示側では、撮影された映像をもとにレンダリングを行うことでユーザーが好む任意の視点映像を生成することが考えられている。これらのレンダリング処理では、撮影時に実際のカメラのない視点(仮想ビュー)を生成する視点合成処理、すなわち、カメラ間の視点映像の内挿処理、外挿処理、補間処理等が行われる。視点合成処理には、デプス画像の利用も行われている。例えば、カメラの撮影映像とデプス画像を基に内挿する視点位置でのビューを射影する方法や、カメラ映像ではなくデプス画像を射影することで内挿視点でのデプス画像を生成後に、カメラ映像を投影させる方法が存在する。
また、編集などのコンテンツ制作では、3次元モデルシーンやイメージベース(多視点映像及び/又は多視点デプス画像)での編集作業が行われる。伝送と記録では、任意のフォーマットによって符号化が行われデータ量を圧縮した上での記録や、有線や無線ネットワークを介した配信が行われる。
広範囲な運動視差に対応した映像の記録・伝送を行う場合に、情報量が膨大になることから、全ての情報量を記録や伝送することはできず、一部の情報を符号化して記録・伝送する。そのため、復号側では不足した情報を補完することが必要となる。例えばイメージベース(多視点映像及び/又は多視点デプス画像)のフォーマットでは、視点内挿処理による補間があり、3次元モデルシーンのフォーマットでは、映像データベースからの映像をもとに補完処理が行われる。近年、これらの映像処理にAI(Artificial Intelligence:人工知能)技術を用いた学習モデルによる処理を利用することが検討されており、例えば、映像シーン認識方法に深層学習を利用することが提案されている(特許文献1)。
特開2018−5638号公報
上述のように、映像処理に機械学習を利用することが検討されている。しかしながら、送信側(コンテンツ提供者側)では、正解画像を用いた学習モデル作成が容易であるが、表示端末側(ユーザー側)ではモデルの学習に時間がかかること、正解データの取得ができない場合における教師なし学習では補完の精度が低くなってしまう問題がある。また、コンテンツ毎の映像の特徴が一般的に異なることから統一的な学習モデルと学習パラメータでは補完精度が落ちてしまう問題が挙げられる。
従って、上記のような問題点に鑑みてなされた本発明の目的は、表示端末側(受信側)で適正な学習モデルによる機械学習を利用して映像補完処理を行うことのできる、送信装置及び受信装置を提供することにある。
上記課題を解決するために本発明に係る送信装置は、機械学習機能を有し、学習結果である学習モデル及び/又は学習パラメータを送信することを特徴とする。
また、前記送信装置は、映像を符号化し、符号化データを出力する符号化部と、機械学習機能を有し、学習結果である学習モデル及び/又は学習パラメータを出力する学習モデル作成部と、を備えており、前記学習モデル及び/又は学習パラメータは、前記符号化データを復号した映像から表示映像を作成する際に、不足する映像情報を生成する処理に用いられることが望ましい。
また、前記送信装置は、前記表示映像が、多視点映像から生成された視点内挿映像であることが望ましい。
また、前記送信装置は、前記学習モデルと学習パラメータを、学習モデルモジュール識別子を有するヘッダと、パラメータ識別子及びパラメータ識別子に対応するパラメータ値を有するデータとを備えた伝送パケットにより送信することが望ましい。
また、前記送信装置は、機械学習のための学習用画像が、視点内挿映像と、前記視点内挿映像の周辺視点映像、及び前後フレーム映像をアップサンプリングし、ブロック化したブロック画像を複数配置した構成であることが望ましい。
また、前記送信装置は、映像の符号化データを送信するとともに、前記学習モデル及び/又は学習パラメータを、受信側からのリクエストに応じて、ネットワーク経由で送信することが望ましい。
上記課題を解決するために本発明に係る受信装置は、学習結果である学習モデル及び/又は学習パラメータを受信し、前記学習モデル及び/又は学習パラメータに基づいて学習済みの機械学習機能を取得することを特徴とする。
また、前記受信装置は、映像の符号化データを復号する復号部と、復号された映像から表示映像を作成する際に、機械学習により、不足する映像情報を生成する映像補完部と、を備えていることが望ましい。
また、前記受信装置は、前記表示映像が、多視点映像から生成された視点内挿映像であることが望ましい。
また、前記受信装置は、前記表示映像のオクルージョン領域を埋めるためのインペイント領域の画素値に、機械学習により生成された補正画像を利用することが望ましい。
また、前記受信装置は、作成された映像をブロック画像ごとに機械学習により補正を行い、補正された前記ブロック画像をブロック統合し、表示映像を作成することが望ましい。
また、前記受信装置は、映像の符号化データを復号するとき、送信側に自動的に前記映像に対応した学習モデル及び/又は学習パラメータのリクエストを行い、ネットワーク経由で前記学習モデル及び/又は学習パラメータを取得することが望ましい。
また、前記受信装置は、学習モデル及び/又は学習パラメータを蓄積し、復号後の映像の解析結果に基づいて、映像に対応した前記学習モデル及び/又は学習パラメータを選択する学習モデル選択部を備えることが望ましい。
本発明における送信装置及び受信装置によれば、受信側(表示端末側)で適正な学習モデルによる機械学習を利用して映像補完処理を行うことができる。そして、本発明によれば、復号処理で情報が不足している映像・3次元モデルを、補完処理で品質改善することができ、また、補完処理により伝送・記録する情報量の削減が可能になる。
また、本発明をデプス推定や視点内挿技術に適用すれば、オクルージョン領域(陰になって見えない部分)等におけるノイズの低減をすることができる。さらに、補完処理によってデプス画像や視点内挿画像の画質劣化が低減することにより、より離れたカメラ間隔での視点内挿が可能となり、そのため、符号化対象となる視点数(必要なカメラ台数)を削減することができる。
本発明の送信装置・受信装置の一例のブロック図である。 本発明の送信装置の学習モデル作成部の一例のブロック図である。 機械学習に用いる画像の一例である。 伝送する機械学習用データの構造の一例である。 本発明の受信装置の映像補完部の一例のブロック図である。 本発明の受信装置の映像補完部の別の例のブロック図である。 本発明の受信装置の学習モデル選択部の一例のブロック図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。
図1は、本発明の送信装置・受信装置の一例のブロック図である。本発明の送信装置及び受信装置は、それぞれ、符号化装置、復号装置としても機能し、また、全体として学習モデル・パラメータの送受信システムを構成する。
送信装置10は、機械学習の学習モデル及び/又は学習パラメータ(学習済みのパラメータ値を含む。)を送信する。また、送信装置10は、一般にコンテンツ提供者が管理し、受信装置20に対して映像(多視点映像や3次元シーン等を含むことができる)等のコンテンツを提供する。他方、受信装置20は、機械学習の学習モデル及び/又は学習パラメータを受信する。また、受信装置20は、一般にユーザーが管理し、送信装置10から送信された情報を受信して、映像等のコンテンツを復号・表示することができる。
まず、送信装置10について説明する。送信装置10は、入力された撮影映像を編集し、編集された映像を符号化して符号化データを出力するとともに、映像処理の際の機械学習で用いる学習モデル・学習パラメータを出力する。送信装置10は、入力部11、映像編集部12、符号化部13、及び学習モデル作成部14を備える。
入力部11には、撮影された映像が入力される。入力される映像は、立体映像を構成するために複数のカメラで撮影された多視点映像、全天周カメラで撮影された映像等、複数の映像の組み合わせであってもよい。また、多視点映像に対応するデプス画像を含めることができる。
映像編集部12は、入力された映像を編集し、番組制作を行う。この番組は、3次元モデルシーンや多視点映像、或いは任意の視点映像であってもよい。映像編集部12は、入力された映像から自動編集を行っても良いが、人為的な編集操作を加えることができるように構成されてもよい。映像編集部12は、編集した番組映像を、符号化部13と学習モデル作成部14に出力する。
符号化部13は、編集された番組の映像情報の符号化を行う。なお、符号化はデータを圧縮するから、符号化の際に映像情報の一部が消失する。符号化されたデータは受信装置20に向けて出力される。また、符号化部13は、符号化されたデータ(符号化後の視点映像や3次元モデル)を復号し、学習モデル作成部14に出力する。なお、符号化データを復号する処理は、学習モデル作成部14内で行ってもよい。また、受信装置に伝送しない視点情報を、学習モデル作成部14に対して出力してもよい。
学習モデル作成部14は、符号化部13から入力される符号化・復号処理をされた後の映像と、映像編集部12から直接入力される編集された番組映像とを元に、学習用画像と正解画像情報を作成し、機械学習を行い、最適な学習モデルと学習パラメータを作成する。そして、作成された学習モデル及び学習パラメータ等を、受信装置20に送信する。なお、受信側で必要なデータに応じて、学習モデルと学習パラメータの一方を送信してもよい。学習モデル作成部14の詳細は後述する。
図1では、符号化部13からの符号化データと、学習モデル作成部14からの学習モデル等のデータは、別々の伝送路で送信されているが、これらは、ひとまとめのデータとして、一つの伝送路で送信することもできる。送受信方法としては、放送システム、電波通信、ネットワーク等を利用することができる。例えば、符号化データと学習モデルデータを放送システムで同時に配信することができる。また、後述のとおり、符号化データを放送システムで配信し、学習モデルデータをネットワークで送信することができる。さらに、符号化データを記録媒体として提供し、学習モデルデータを伝送路で送信してもよい。
受信装置20は、映像を符号化した符号化データ及び機械学習で用いる学習モデル・学習パラメータを受信し、符号化データの復号及び補完処理を行って映像を出力する。受信装置20は、復号部21、映像補完部22、レンダリング部23、及び表示部24を備えている。
復号部21は、符号化データの復号を行い、復号映像(復号画像)を映像補完部22に出力する。
映像補完部22は、送信装置(コンテンツ提供者側)10から送信された学習モデル及び/又は学習パラメータを受信する。映像補完部22では、得られた学習モデル・パラメータをもとに送信側と同じ機械学習機能をその内部に再現し、復号映像から表示映像を作成する際に不足する映像情報を生成する。また、映像補完部22は視点内挿やフレーム補間の処理を行うと共に、内挿画像や補間フレーム画像を補正する処理を行う。このとき補正処理は得られた学習モデルとパラメータを用いて行われる。映像補完部22の詳細は後述する。
レンダリング部23は、映像補完部22から出力される映像をもとに、表示に必要な画像フォーマットのレンダリングを行う。処理された映像は、表示部24に出力される。
表示部24は、レンダリング部23で処理された映像を表示する。なお、表示部24は、受信装置20の内部に設けられることは必須ではなく、受信装置20とは別体の独立した表示装置として構成してもよい。
(送信装置の学習モデル作成部)
図2に、送信装置10の学習モデル作成部14の一例のブロック図を示す。図2は、伝送・記録フォーマットがイメージベース(多視点映像やデプス画像)の場合でのコンテンツ提供者側の学習モデル作成部14の構成を示している。
ここでは、学習モデル作成部14が、ある対象視点のフレームに基づいて、ブロック単位で映像の補正・補完を行う機械学習を行い、学習モデルを作成する例を説明する。図2において、学習モデル作成部14は、周辺視点映像入力部101、前後フレーム映像入力部102、視点内挿部103、アップサンプル部104、ブロック分割部105、入力画像生成部106、対象視点フレーム入力部107、ブロック分割部108、機械学習部110、学習モデル・パラメータ圧縮部111、変調部112、及び送信部113を備えている。
入力対象となる映像は、例えば、符号化部13から入力される符号化・復号処理をされた後の映像、及び/又は、映像編集部12から入力される符号化処理を経ていない映像である。入力映像には学習用の正解画像として視点内挿を行う視点の映像、視点内挿時に参照をされる周辺視点映像などが含まれている。例えば、複数枚の多視点画像とそれに対応する複数枚のデプス画像を入力映像とする。これらの画像は、対象物を360度の方向から撮影した多視点映像や、インテグラル立体映像を構成するための複数映像であってもよい。また、それぞれの視点映像は、予め奇数フレームと偶数フレームの映像に分かれていてもよい。
周辺視点映像入力部101は、図1の符号化部13において符号化され、更に復号された映像から、対象視点の映像に対してその周辺視点の映像を選択し、視点内挿部103及びアップサンプル部104に出力する。
前後フレーム映像入力部102は、図1の符号化部13において符号化され、更に復号された映像から、対象視点フレーム(又は視点内挿が行われるフレーム)の前後のフレームの映像を選択し、アップサンプル部104に出力する。対象視点のフレームの前後のフレームからのフレーム間内挿を利用することにより、予測画像の精度が向上する。
視点内挿部103は、周辺視点映像入力部101から入力された周辺視点映像(対象視点の周辺の視点の映像)に基づいて、視点の内挿処理を行い、対象視点の仮想ビュー(映像)を生成し、その生成された映像をアップサンプル部104に出力する。
アップサンプル部104は、周辺視点映像入力部101、前後フレーム映像入力部102、及び視点内挿部103から入力されたそれぞれの映像について、アップサンプリングを行い、映像の解像度を高く(例えば、縦横2倍に)する。なお、映像をアップサンプリングして処理することにより、予測画像の精度が向上する。
ブロック分割部105は、アップサンプル処理されたそれぞれの映像をブロックに分割する。ブロックとしては、例えば、16×16ピクセル(pixel)を単位ブロックとする。分割対象の映像はアップサンプル処理されているため、このブロックは、元の映像の8×8ピクセルのブロック画像に対応する。なお、単位ブロックのサイズは、上記に限定されるものではなく、例えば、32×32ピクセルとしてもよい。
入力画像生成部106は、機械学習部110の入力画像を作成する。入力画像は、機械学習の学習用画像(予測の元になる画像)となる。ここでは、ブロック分割された各映像から、対象視点の映像に関連する複数のブロック映像(ブロック画像)をタイル状に並べて、入力画像を構成する。
図3に、機械学習に用いる画像の一例を示す。図3(A)は、入力画像の例である。ここでは16×16ピクセル(pixel)のブロック画像が9(3×3)個配列され、48×48ピクセルの入力画像が構成されている。まず、視点補間画像(対象視点の映像に対応する視点内挿画像)を入力画像の中央部に配置する。この視点補間画像は、視点内挿部103で作成された対象視点の映像をアップサンプリング(2倍)してブロック化したものである。また、視点補間画像の周囲には、隣接画像1〜4及び隣接デプス画像1〜4のブロックを配置する。例えば、隣接画像1〜4は、視点補間画像の上下左右に隣接する視点の映像ブロックや、対象視点の映像フレームの前後フレームの対応する視点の映像ブロックであり、周辺視点映像入力部101や前後フレーム映像入力部102の出力をアップサンプリングしてブロック化したものから適宜選択して配置する。また、隣接デプス画像1〜4も同様に、視点補間画像の上下左右に隣接する視点のデプス画像や、前後フレームの対応する視点のデプス画像のブロックであり、これらから適宜選択して配置する。なお、隣接画像やデプス画像をそれぞれ幾つ選び、どのように配置するか等は、適宜設定することができる。
次に、対象視点フレーム入力部107は、例えば、図1の映像編集部12で編集された映像から、対象視点のフレームの映像を選択し、ブロック分割部108に出力する。なお、対象視点のフレームの映像は映像編集部12からの映像に限定されるものではなく、図1の符号化部13において符号化され、更に復号された映像から、対象視点の映像を選択してもよい。対象視点フレーム入力部107から入力された映像からは、機械学習における学習用正解画像が作成される。
ブロック分割部108は、対象視点フレーム入力部107から入力された対象視点フレームの映像を、ブロックに分割する。ブロックとしては、例えば、8×8ピクセル(pixel)を単位ブロックとする。対象視点フレーム入力部107からの映像はアップサンプル処理されていないため、このブロックは、入力画像の16×16ピクセルのブロック画像に対応する。なお、単位ブロックは、上記のサイズに限定されるものではなく、学習用画像のサイズと対応させればよい。ブロック分割部108で分割され出力された映像が、9ブロックの入力画像の中央にある16×16ピクセルの視点補間画像(視点内挿画像)に対応する正解画像となる。図3(B)に、正解画像の一例(イメージ)を示す。
機械学習部110は、入力画像生成部106からの入力画像を学習用画像(訓練用画像)とし、ブロック分割部108から入力された正解画像との比較を行うことで、機械学習を進め、最適な学習モデルと学習パラメータを算出する。なお、ここでの機械学習は広い概念でとらえて良い。例えば、畳み込みニューラルネットワークを用いて構築される機械学習であって良く、特徴量の抽出とモデリングを自動的に行うディープラーニング等を含むことができる。また、畳み込みニューラルネットワーク以外に、例えば、SVM(Support Vector Machine)などを用いて構築してもよい。
学習により、最適な学習モデルと学習パラメータを習得した機械学習部110は、図3(A)に示す入力画像が入力されると、正解画像に近似した補間画像を出力することができる。図3(C)に、出力画像(補間画像)の一例(イメージ)を示す。出力画像(補間画像)は、正解画像と同じく、8×8ピクセル(pixel)の単位ブロックである。
なお、学習用画像に対象視点を内挿して生成した映像を用い、正解画像に対象視点における実際の映像を用いることにより、機械学習部は、内挿映像で不足する映像情報(例えば、オクルージョン領域の映像情報)を生成する学習機能を得ることができる。また、学習用画像に符号化及び復号された映像を用い、正解画像に映像編集部から入力された符号化前の映像を用いることにより、機械学習部は、符号化で失われた映像情報(画質改善のための映像情報)を生成する学習機能を得ることができる。
学習を終了すると、機械学習部110は、最適な学習モデル及び/又は学習パラメータを学習モデル・パラメータ圧縮部111に出力する。なお、学習モデルと学習パラメータを出力後も、機械学習部110は継続的に学習を行い、より精度の高い学習モデルと学習パラメータや、異なるシーンやフレームにおける最適な学習モデルと学習パラメータ等を算出して、更新データとして学習モデル・パラメータ圧縮部111に出力してもよい。
学習モデル・パラメータ圧縮部111は、機械学習部110から入力された最適な学習モデル及び/又は学習パラメータを、伝送に適したデータ形式に圧縮処理を行う。エントロピー符号化等を利用してもよいし、圧縮データを差分データのみとしてもよい。なお、必要に応じて、入力画像生成部106で生成された入力画像の一部を、学習データとして圧縮して送信してもよい。
その後、変調部112は、圧縮処理された所定の形式の学習モデル・パラメータデータを、送信に適した信号に変調する。例えば、データを伝送パケットの形式とする。そして、送信部113は、変調された学習モデル・パラメータデータの信号を、ユーザー側(受信装置)に送信する。
図4に、伝送する機械学習用データの構造の一例を示す。これは、機械学習用データを伝送パケットとして送信するときの例である。図4(A)は、伝送データの基本構成である。伝送データは、ヘッダと、データと、ビット調整とを含む。ビット調整とは、伝送データをByte単位とするための調整用ビットである。
図4(B)は、ヘッダの構成例である。ヘッダは、「フレーム情報・前情報コピー識別子」と、「学習モデルのモジュール読み出し番号・フィードバック有無・フィードバック接続先情報」と、「学習モデルモジュール識別子」とを備える。「フレーム情報・前情報コピー識別子」には、対象となる映像のフレームの情報、及び前フレーム情報のコピー用識別子を格納する。また、「学習モデルのモジュール読み出し番号」は、あらかじめ定義した0からスタートする番号であって、学習モデルのモジュール読み出しに用いる。「フィードバック有無・フィードバック接続先情報」については、基本的には学習モデルのモジュール読み出し番号が連番で接続されていくが、別の学習モデルのモジュールへ接続する時はフィードバック接続先情報で番号を指定する。「学習モデルモジュール識別子」については、事前に学習モデルのモジュール読み出し番号を定義し(例えば、0001:畳込み層モジュール、0002:プーリング層モジュール、等)、識別子とする。
図4(C)は、データの構成例である。データは、「パラメータ識別子」と、「カウンタ識別子」と、「パラメータ識別子に対応するパラメータ値」とを備える。「パラメータ識別子」については、事前に学習用モデルのモジュール毎に、パラメータ識別子を定義しておき、該当する識別子を格納する。(例えば、0001:畳込み層モジュールに対応するパラメータ識別子では、0001:レイヤーの入力サイズ、0002: 畳み込むカーネルのサイズ)「カウンタ識別子」については、パラメータ識別子でのパケット情報が何番目のデータかを、カウンタ識別子で把握する。なお、特定の値によりパラメータ値終了を判断してもよい(例:1111111111111111:パラメータ値の終了フラグ)。「パラメータ識別子に対応するパラメータ値」には、パラメータ識別子に設定する値や、機械学習で得られたパラメータ値を入力する。また、機械学習で得られたパラメータ値が一つのファイル形式である場合には、バイナリ形式のファイルデータを圧縮してパラメータ値の中にパケット化してもよい。
(受信装置の映像補完部)
図5に、受信装置20の映像補完部22の一例のブロック図を示す。図5は、伝送・記録フォーマットがイメージベース(多視点映像やデプス画像)の場合でのユーザー側の映像補完部22の構成を示している。
映像補完部22は、送信装置10から伝送された学習モデル及び学習パラメータを用いて送信側と同じ機械学習部を構築し、符号化データを復号して得られた映像から表示映像を作成する際に、映像の補完処理を行う。図5において、映像補完部22は、復調部201、解凍部202、周辺視点映像入力部203、前後フレーム映像入力部204、視点内挿部205、アップサンプル部206、ブロック分割部207、入力画像生成部208、機械学習部210、視点内挿補正部211、ブロック統合部212、インペイント部213、及び平滑フィルタ214を備えている。
映像補完部22の入力対象となる映像は、伝送された符号化データを、復号部21で復号処理した映像である。例えば、複数枚の多視点画像と複数枚のデプス画像を入力映像とすることができる。これらの画像は、対象物を360度の方向から撮影した多視点映像や、インテグラル立体映像を構成するための複数映像であってもよい。
復調部201は、送信装置10から所定の方式で変調されて伝送された学習モデル・学習パラメータについて、変調方式に対応する方式により復調処理を行い、復調されたデータを解凍部202に出力する。
解凍部202は、復調部201で復調されたデータについて、送信側で行った圧縮処理に対応する解凍処理を行って、学習モデル・学習パラメータを復元し、機械学習部210に出力する。
周辺視点映像入力部203は、図1の復号部21において復号された映像から、対象視点の映像に対してその周辺視点の映像を抽出し、視点内挿部205及びアップサンプル部206に出力する。
前後フレーム映像入力部204は、図1の復号部21において復号された映像から、視点内挿が行われるフレームの前後のフレームの映像を抽出し、アップサンプル部206に出力する。
視点内挿部205は、周辺視点映像入力部203から入力された周辺視点映像(対象視点の周辺の視点の映像)に基づいて、視点の内挿処理を行い、対象視点の仮想ビュー(映像)を生成する。この映像は、映像補完部22の出力映像の基礎となる映像であり、その生成された映像をインペイント部213とアップサンプル部206に出力する。
アップサンプル部206は、周辺視点映像入力部203、前後フレーム映像入力部204、及び視点内挿部205から入力されたそれぞれの映像について、アップサンプリングを行い、映像の解像度を高く(例えば、縦横2倍に)する。なお、映像をアップサンプリングして処理することにより、補完画像の精度が向上する。
ブロック分割部207は、アップサンプル処理されたそれぞれの映像をブロックに分割する。ブロックとしては、例えば、16×16ピクセル(pixel)を単位ブロックとする。分割対象の映像はアップサンプル処理されているため、このブロックは、元の映像の8×8ピクセルのブロック画像に対応する。なお、単位ブロックのサイズは、上記に限定されるものではなく、例えば、32×32ピクセルとしてもよい。
入力画像生成部208は、機械学習部210及び/又は視点内挿補正部211の入力画像を作成する。この入力画像生成部208の構成・動作は、送信側の入力画像生成部106と同一である。入力画像は、機械学習により補正画像(補間画像)を予測するための元になる画像となる。ここでは、ブロック分割された各映像から、対象視点の映像に関連する複数のブロック映像(ブロック画像)をタイル状に並べて、図3(A)に示される入力画像を作成する。
機械学習部210には、解凍部202で解凍された学習モデル・学習パラメータが入力される。この学習モデル・学習パラメータは、送信側(コンテンツ提供者側)の学習済みの機械学習部110から得られたデータであり、このデータに基づいて、機械学習部210を学習済み機械学習部として機能させることができる。なお、この機械学習機能は、符号化データを復号した映像から表示映像を作成する際に、不足する映像情報を生成する機能である。機械学習部210は、入力画像生成部208で生成された入力画像を補正するための学習モデル・学習パラメータを視点内挿補正部211に出力する。或いは、機械学習部210は、入力画像から、学習結果に基づいて出力画像(図3(C))を予測生成し、視点内挿補正部211に出力してもよい。
視点内挿補正部211は、機械学習部210からの最適の学習モデル・学習パラメータに基づいて、入力画像生成部208から出力される入力画像を受けて機械学習により視点内挿画像の補正をブロック毎に行う。或いは、機械学習部210からの出力画像(予測画像)を受けて、視点内挿等の処理により作成された内挿画像を補正してもよい。出力される補正画像は、例えば、8×8ピクセルのブロックである。補正された画像は、表示映像を作成する際に不足する画像部分を補完することができる。
ブロック統合部212は、視点内挿補正部211でブロック毎に生成された補正画像(ブロック画像)を統合し、一枚の補正された視点内挿映像(対象視点の映像)を生成する。
インペイント部213には、視点内挿部205からの対象視点の内挿映像と、ブロック統合部212からの補正映像とが入力される。視点内挿部205で生成された内挿映像は、オクルージョン領域等を生じる可能性があり、インペイント部213は、ブロック統合部212からの補正映像により、このオクルージョン領域を埋める補完処理を行う。すなわち、視点内挿部で発生したオクルージョン領域を埋めるためのインペイント領域の画素値に、学習モデル結果を使用することができる。補完された映像は、平滑フィルタ214に出力される。
平滑フィルタ214は、インペイント部213からの入力された映像に対して、フィルタ処理を行う。入力された映像は、ブロック統合処理やインペイント処理により、ブロックや領域の境界にノイズ(つなぎ目)を生じやすい。このノイズを平滑フィルタ処理により除去することができる。この平滑フィルタ214の出力が、受信装置20の映像補完部22の出力映像となる。
このように、視点内挿で得られた映像のオクルージョン領域を埋めるためのインペイント領域の画素値に、学習モデル結果(機械学習による予測)を使用することにより、視点内挿映像の精度を向上させることができる。
(受信装置の映像補完部の別の例)
図6に、受信装置20の映像補完部22の別の例のブロック図を示す。図6は、伝送・記録フォーマットがイメージベース(多視点映像やデプス画像)の場合でのユーザー側の映像補完部22の別の構成を示している。
映像補完部22は、送信装置10から伝送された学習モデル及び学習パラメータを用いて送信側と同じ機械学習部を構築し、符号化データを復号して得られた映像から表示映像を作成する際に、映像の補完処理を行う。図6において、映像補完部22は、復調部201、解凍部202、周辺視点映像入力部203、前後フレーム映像入力部204、視点内挿部205、アップサンプル部206、ブロック分割部207、入力画像生成部208、機械学習部210、視点内挿補正部211、ブロック統合部212、及び平滑フィルタ214を備えている。
図5の映像補完部22との違いは、インペイント部を備えておらず、視点内挿補正部211で補正されたブロック映像をブロック統合して、出力映像を得ている点である。図5と共通の構成は、説明を簡略化する。映像補完部22の入力対象となる映像は、伝送された符号化データを、図1の復号部21で復号処理した映像である。
復調部201及び解凍部202は、図5の映像補完部22と同様であり、送信装置10から圧縮・変調されて伝送された学習モデル・学習パラメータについて復調処理及び解凍処理を行って、学習モデル・学習パラメータを復元し、機械学習部210に出力する。
周辺視点映像入力部203は、復号部21において復号された映像から、対象視点の映像に対してその周辺視点の映像を抽出し、視点内挿部205及びアップサンプル部206に出力する。
前後フレーム映像入力部204は、復号部21において復号された映像から、視点内挿が行われるフレームの前後のフレームの映像を抽出し、アップサンプル部206に出力する。
視点内挿部205は、周辺視点映像に基づいて、視点の内挿処理を行い、対象視点の仮想ビュー(映像)を生成し、アップサンプル部206に出力する。
アップサンプル部206は、周辺視点映像入力部203、前後フレーム映像入力部204、及び視点内挿部205から入力されたそれぞれの映像について、アップサンプリングを行い、映像の解像度を高くする。
ブロック分割部207は、アップサンプル処理されたそれぞれの映像をブロックに分割する。ブロックとしては、例えば、16×16ピクセル(pixel)を単位ブロックとする。なお、単位ブロックのサイズは、32×32ピクセルとしてもよい。
入力画像生成部208は、機械学習部210及び/又は視点内挿補正部211の入力画像を作成する。入力画像は、機械学習により補正画像(補間画像)を予測するための元になる画像となる。図5の映像補完部22と同様に、ブロック分割された各映像から、対象視点の映像に関連する複数のブロック映像(ブロック画像)をタイル状に並べて、図3(A)に示される入力画像を作成する。
機械学習部210には、解凍部202で解凍された学習モデル・学習パラメータが入力され、このデータに基づいて、機械学習部210を学習済み機械学習部として機能させることができる。機械学習部210は、入力画像生成部208で生成された入力画像を補正するための学習モデル・学習パラメータを視点内挿補正部211に出力する。或いは、機械学習部210は、入力画像から、学習結果に基づいて出力画像(図3(C))を予測生成し、視点内挿補正部211に出力してもよい。
視点内挿補正部211は、機械学習部210からの最適の学習モデル・学習パラメータに基づいて、入力画像生成部208から出力される入力画像を受けて機械学習により視点内挿画像の補正をブロック毎に行う。或いは、機械学習部210から出力画像(予測画像)を受けて、視点内挿等の処理により作成された内挿画像を補正してもよい。視点内挿補正部211の出力は、例えば、図3(C)に示される8×8ピクセルの補間画像(補正画像)である。補正された画像は、表示映像を作成する際に不足する画像部分を補完することができる。
ブロック統合部212は、視点内挿補正部211でブロック毎に生成された補正画像(ブロック画像)を統合し、一枚の補正された視点内挿映像(対象視点の映像)を生成する。なお、補正された視点内挿映像は、機械学習の結果(学習モデル結果)により、オクルージョン領域が予測され補完されている。
平滑フィルタ214は、ブロック統合部212から入力された映像に対して、フィルタ処理を行う。ブロック境界に生じるノイズを平滑フィルタ処理により除去することができる。この平滑フィルタ214の出力が、受信装置20の映像補完部22の出力映像となる。
このように、学習モデル結果(機械学習による予測)を使用することにより、視点内挿映像の精度を向上させることができる。また、補正された画像は符号化・復号処理で失った画像情報も補完するから、出力映像の画質を向上させることができる。なお、ここでは視点内挿映像について説明したが、学習モデル結果の使用は、3次元モデルシーンの復号処理においても適用できる。
図1〜図6では、機械学習用データ(学習モデル及び学習パラメータ)が、映像符号化データと共に、送信装置から送信されてくることを想定した構成を示しているが、例えば、送信装置と受信装置がネットワークで接続されている送受信システムにおいて、コンテンツ視聴時に受信装置が自動的にコンテンツに対応した機械学習データのリクエストを行い、ネットワーク経由で学習モデルや学習パラメータ等のデータを取得する構成としてもよい。
(受信装置の学習モデルの最適化)
次に、ユーザー側(受信側)において、機械学習によって最適な学習モデル・学習パラメータを選択し、より適正な映像補完を行うことができる受信装置について説明する。一般に、映像のコンテンツや映像シーンによって、適した学習モデルや学習パラメータが異なると考えられている。
図7に、受信装置20に設ける、学習モデル選択部220の一例のブロック図を示す。図7の学習モデル選択部220は、例えば、図5、図6の映像補完部22において、解凍部202と機械学習部210の間に配置することができる。
学習モデル選択部220は、学習モデル・学習パラメータを蓄積し、その中から入力画像の補完に最も適切な学習モデル・学習パラメータを選択して、機械学習部210に出力する。学習モデル選択部220は、学習モデル・学習パラメータ蓄積用メモリ221と、入力画像解析部222と、学習モデル選択用機械学習部223とを備える。
学習モデル・学習パラメータ蓄積用メモリ221は、複数の学習モデル・学習パラメータ値を蓄積する。蓄積される学習モデル等は、例えば、送信装置(コンテンツ提供側)10から送信され、復調部201及び解凍部202を経て、学習モデル・学習パラメータ蓄積用メモリ221に入力されたものであって良く、また、元々受信装置20に準備されていた学習モデル等を蓄積してもよい。蓄積された学習モデル・学習パラメータは、指示に基づいて、学習モデル選択用機械学習部223に出力される。
入力画像解析部222は、入力画像(ここでは、コンテンツ提供側から送信され、復号部21で復号された映像等)を解析する。例えば、入力された映像のコンテンツ内容を解析して映像ジャンルの分析等を行い、その結果を学習モデル選択用機械学習部223に出力する。
学習モデル選択用機械学習部223は、学習段階においては、例えば、入力画像解析部222での解析結果と出力画像或いは補完画像との対比等に基づいて、入力画像に適した学習モデル・学習パラメータの選択方法について機械学習を行う。入力画像がコンテンツ映像のジャンルを示す識別子を備えている場合は、識別子と出力画像或いは補完画像との対比に基づいて機械学習を行っても良い。なお、最適な学習モデルを逐次的に選択する学習モデルは、教師なし学習を行っても良いし、学習モデルをネットワーク経由でダウンロードしても良い。
学習モデル選択用機械学習部223は、学習後においては、入力画像解析部222での解析結果(入力画像のジャンル)、又はジャンルを示す識別子に基づいて、最適な学習モデル・学習パラメータを、学習モデル・学習パラメータ蓄積用メモリ221から選択して読み出し、機械学習部210へ出力する。
映像補完部22は、機械学習部210で用いる機械学習データを、学習モデル選択用機械学習部223で選択された学習モデルと学習パラメータに切り替え、適切な学習モデルに基づいて機械学習部210での処理、すなわち、補正(補完)画像の生成を行い、入力画像から不足する情報を補完して出力画像とする。学習モデル・学習パラメータは、映像の内容(コンテンツ)が変わるごとに、又はシーンが変わるごとに切り替えてもよい。
ここでは、学習モデル選択部220は、図5、図6の映像補完部22の一部として説明したが、一般に、機械学習により映像を補正・補完する受信装置において、適正な学習モデル・学習パラメータを用いるために利用することができる。
これまで、伝送・記録フォーマットがイメージベース(多視点映像やデプス画像)の場合であって、視点内挿をする場合を例として説明したが、本発明は、3次元モデルの符号化及び復号処理にも適用できる。
上記の実施の形態では、送信装置10及び受信装置20の構成と動作について説明したが、本発明はこれに限らず、学習モデル・学習パラメータの送信方法及び受信方法として構成されてもよい。また、送信装置10及び受信装置20からなる送受信システムとして構成されてもよい。
なお、上述した送信装置10及び受信装置20として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、送信装置10及び受信装置20の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
10 送信装置
11 入力部
12 映像編集部
13 符号化部
14 学習モデル作成部
20 受信装置
21 復号部
22 映像補完部
23 レンダリング部
24 表示部
101 周辺視点映像入力部
102 前後フレーム映像入力部
103 視点内挿部
104 アップサンプル部
105 ブロック分割部
106 入力画像生成部
107 対象視点フレーム入力部
108 ブロック分割部
110 機械学習部
111 学習モデル・パラメータ圧縮部
112 変調部
113 送信部
201 復調部
202 解凍部
203 周辺視点映像入力部
204 前後フレーム映像入力部
205 視点内挿部
206 アップサンプル部
207 ブロック分割部
208 入力画像生成部
210 機械学習部
211 視点内挿補正部
212 ブロック統合部
213 インペイント部
214 平滑フィルタ

Claims (13)

  1. 機械学習機能を有し、学習結果である学習モデル及び/又は学習パラメータを送信する送信装置。
  2. 請求項1に記載の送信装置であって、
    映像を符号化し、符号化データを出力する符号化部と、
    機械学習機能を有し、学習結果である学習モデル及び/又は学習パラメータを出力する学習モデル作成部と、を備えており、
    前記学習モデル及び/又は学習パラメータは、前記符号化データを復号した映像から表示映像を作成する際に、不足する映像情報を生成する処理に用いられることを特徴とする、送信装置。
  3. 請求項2に記載の送信装置であって、
    前記表示映像は、多視点映像から生成された視点内挿映像であることを特徴とする、送信装置。
  4. 請求項1乃至3のいずれか一項に記載の送信装置であって、
    前記学習モデルと学習パラメータを、学習モデルモジュール識別子を有するヘッダと、パラメータ識別子及びパラメータ識別子に対応するパラメータ値を有するデータとを備えた伝送パケットにより送信することを特徴とする、送信装置。
  5. 請求項1乃至4のいずれか一項に記載の送信装置であって、
    機械学習のための学習用画像は、視点内挿映像と、前記視点内挿映像の周辺視点映像、及び前後フレーム映像をアップサンプリングし、ブロック化したブロック画像を複数配置した構成であることを特徴とする、送信装置。
  6. 請求項1乃至5のいずれか一項に記載の送信装置であって、
    映像の符号化データを送信するとともに、
    前記学習モデル及び/又は学習パラメータを、受信側からのリクエストに応じて、ネットワーク経由で送信することを特徴とする、送信装置。
  7. 学習結果である学習モデル及び/又は学習パラメータを受信し、前記学習モデル及び/又は学習パラメータに基づいて学習済みの機械学習機能を取得する、受信装置。
  8. 請求項7に記載の受信装置であって、
    映像の符号化データを復号する復号部と、
    復号された映像から表示映像を作成する際に、機械学習により、不足する映像情報を生成する映像補完部と、を備えていることを特徴とする、受信装置。
  9. 請求項8に記載の受信装置であって、
    前記表示映像は、多視点映像から生成された視点内挿映像である、受信装置。
  10. 請求項8又は9に記載の受信装置であって、
    前記表示映像のオクルージョン領域を埋めるためのインペイント領域の画素値に、機械学習により生成された補正画像を利用することを特徴とする、受信装置。
  11. 請求項8又は9に記載の受信装置であって、
    作成された映像をブロック画像ごとに機械学習により補正を行い、補正された前記ブロック画像をブロック統合し、表示映像を作成することを特徴とする、受信装置。
  12. 請求項7乃至11のいずれか一項に記載の受信装置であって、
    映像の符号化データを復号するとき、送信側に自動的に前記映像に対応した学習モデル及び/又は学習パラメータのリクエストを行い、ネットワーク経由で前記学習モデル及び/又は学習パラメータを取得することを特徴とする、受信装置。
  13. 請求項7乃至12のいずれか一項に記載の受信装置であって、
    学習モデル及び/又は学習パラメータを蓄積し、復号後の映像の解析結果に基づいて、映像に対応した前記学習モデル及び/又は学習パラメータを選択する学習モデル選択部を備えることを特徴とする、受信装置。
JP2018125275A 2018-06-29 2018-06-29 送信装置及び受信装置 Pending JP2020005201A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018125275A JP2020005201A (ja) 2018-06-29 2018-06-29 送信装置及び受信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018125275A JP2020005201A (ja) 2018-06-29 2018-06-29 送信装置及び受信装置

Publications (1)

Publication Number Publication Date
JP2020005201A true JP2020005201A (ja) 2020-01-09

Family

ID=69100629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018125275A Pending JP2020005201A (ja) 2018-06-29 2018-06-29 送信装置及び受信装置

Country Status (1)

Country Link
JP (1) JP2020005201A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115088266A (zh) * 2020-04-30 2022-09-20 多玩国株式会社 内容生成装置、内容分发***、内容生成方法以及内容生成程序
WO2022230081A1 (ja) * 2021-04-28 2022-11-03 三菱電機株式会社 映像伝送システム、映像伝送方法及び映像受信装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090034622A1 (en) * 2007-08-01 2009-02-05 Her Majesty The Queen In Right Of Canada Represented By The Minister Of Industry Learning Filters For Enhancing The Quality Of Block Coded Still And Video Images
JP2013062752A (ja) * 2011-09-15 2013-04-04 Hitachi Ltd 画像符号化方法および画像復号方法
WO2016199330A1 (ja) * 2015-06-12 2016-12-15 パナソニックIpマネジメント株式会社 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
WO2019199701A1 (en) * 2018-04-09 2019-10-17 Dolby Laboratories Licensing Corporation Hdr image representations using neural network mappings

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090034622A1 (en) * 2007-08-01 2009-02-05 Her Majesty The Queen In Right Of Canada Represented By The Minister Of Industry Learning Filters For Enhancing The Quality Of Block Coded Still And Video Images
JP2013062752A (ja) * 2011-09-15 2013-04-04 Hitachi Ltd 画像符号化方法および画像復号方法
WO2016199330A1 (ja) * 2015-06-12 2016-12-15 パナソニックIpマネジメント株式会社 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
WO2019199701A1 (en) * 2018-04-09 2019-10-17 Dolby Laboratories Licensing Corporation Hdr image representations using neural network mappings

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FARRUGIA, REUBEN A. ET AL.: "Super Resolution of Light Field Images Using Linear Subspace Projection of Patch-Volumes", IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING, vol. Volume: 11, Issue: 7, JPN6022019968, 30 August 2017 (2017-08-30), pages 1058 - 1071, ISSN: 0004925069 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115088266A (zh) * 2020-04-30 2022-09-20 多玩国株式会社 内容生成装置、内容分发***、内容生成方法以及内容生成程序
CN115088266B (zh) * 2020-04-30 2023-12-19 多玩国株式会社 内容生成装置、内容分发***、内容生成方法以及记录介质
WO2022230081A1 (ja) * 2021-04-28 2022-11-03 三菱電機株式会社 映像伝送システム、映像伝送方法及び映像受信装置

Similar Documents

Publication Publication Date Title
US20210005006A1 (en) Apparatus for transmitting point cloud data, a method for transmitting point cloud data, an apparatus for receiving point cloud data and a method for receiving point cloud data
US20190265646A1 (en) Methods and Apparatus for Full Parallax Light Field Display Systems
CN115443652B (zh) 点云数据发送设备、点云数据发送方法、点云数据接收设备和点云数据接收方法
US20210006806A1 (en) An apparatus, a method and a computer program for volumetric video
JP7202087B2 (ja) 映像処理装置
JP6037567B2 (ja) 2次元にも対応する立体映像フローのデコード方法
WO2013031575A1 (ja) 画像処理装置および画像処理方法
TWI539790B (zh) 用於產生及重建一視訊串流之裝置、方法與軟體產品
US11509879B2 (en) Method for transmitting video, apparatus for transmitting video, method for receiving video, and apparatus for receiving video
US11677922B2 (en) Apparatus for transmitting a video, a method for transmitting a video, an apparatus for receiving a video, and a method for receiving a video
CN114503587A (zh) 点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法
KR102308604B1 (ko) 레거시 및 몰입형 렌더링 디바이스들에 대한 몰입형 비디오를 포맷하는 방법, 장치 및 스트림
WO2013115024A1 (ja) 画像処理装置および画像処理方法
US11910016B2 (en) Method and device for multi-view video decoding and method and device for image processing
CN115398890A (zh) 点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法
KR20190103102A (ko) Vr 디바이스 및 vr 디바이스 제어 방법
CN114946179A (zh) 点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法
US20220217400A1 (en) Method, an apparatus and a computer program product for volumetric video encoding and decoding
JP2020005201A (ja) 送信装置及び受信装置
CN104284193A (zh) 编码装置和编码方法、以及解码装置和解码方法
WO2013146636A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム
US20220167014A1 (en) Methods and devices for coding and decoding a multi-view video sequence
KR20200143287A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR20200095408A (ko) 이머시브 비디오 포맷팅 방법 및 장치
JP2020195093A (ja) 符号化装置、復号装置、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220527

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221122