以下に添付図面を参照しながら、本開示の実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
<1.本開示の一実施形態>
[概略]
[全体構成例]
[補間動画生成部の機能構成例]
[補間動画送出部の機能構成例]
[補間部の機能構成例]
[補間動画生成部の動作例]
[補間動画送出部の動作例]
[補間部の動作例]
[まとめ]
<2.実施例1>
<3.実施例2>
<4.実施例3>
<5.まとめ>
<1.本開示の一実施形態>
[概略]
本開示の実施の形態について詳細に説明する前に、本開示の概略について説明する。
動画像を再生する動画像再生装置の表示画面の高解像度化が進んでいる。その一方で、ネットワークストリーミングや放送波その他の伝送媒体を介して配信される動画の解像度の品質は、必ずしも動画像再生装置の表示画面の解像度に適合するとは限らないという問題がある。
例えば、動画像再生装置の表示解像度が、いわゆるフルHDや4K/2Kであっても、その解像度の動画を、画質を維持しながら符号化して伝送するには、高い符号化レートで符号化する必要がある。有線、無線を問わず、通信回線の伝送速度上、その様な高レートの符号化された動画をリアルタイムに伝送できない場合がある。
また動画像再生装置の復号能力が不十分な場合もあり、その場合は高レートの符号化された動画を復号するのに時間がかかってしまう。この場合は、低い符号化レートで、低い解像度で伝送される動画を受信し、動画像再生装置で表示画面のサイズに合う様に拡大して再生していた。また、ワンセグメント放送や携帯機器向けの動画ストリーミング等で、携帯機器向けに解像度や符号化レートを下げたコンテンツのような、元々小さい画面を備える装置に向けて配信された動画像を、タブレットやテレビなどの大きな画面を備える機器で再生する場合も、同様に拡大して再生していた。この様な場合においても、小さな画面サイズ向けの再生動画を大きなサイズの画面に拡大再生すると、再生画質が劣化する。
この問題に対しては、受信した再生動画を動画像再生装置内で解析し、アップコンバート演算によって画面拡大時の劣化程度を低減させる技術がある。しかし、元々情報量が少ない小画面向けの動画を基にした演算では、画質の改善に限界があったり、また計算処理が再生機器の負荷となったり、演算のために独自の回路を搭載したりする必要がある。
一方で、インターネット上の動画配信サーバの多くは、一つの動画コンテンツに対して、複数の画サイズや符号化レートで符号化された動画ファイル群を用意し、再生装置側が、伝送速度や再生能力に応じた画サイズや符号化レートの動画ファイルを選択する動画ストリーミング方式が広く利用される様になっている。
しかし、このストリーミング方式では、選択できる画サイズや符号化レートは予め決められており、任意の画サイズや符号化レートを指定できるわけではない。例えば配信サーバが1Mbps、3Mbps、5Mbpsの動画像ファイルを提供していた場合、動画像再生装置の通信速度が4Mbpsであったら、動画像再生装置は3Mbpsの動画像を選択して受信すれば許容出来る最も高画質の動画像を再生できるが、1Mbps分の伝送帯域は使われない事になる。
小さな画面サイズ向けの再生動画を拡大して再生する際に、画面内の一部分の領域のみを高画質化すれば、ユーザの視聴体験を向上させられるケースが多くある。例えばスポーツ中継におけるボールや選手またはスコア表示、映画における俳優の顔などの、その動画像において認識を向上させることが出来る領域、またはその動画像において重要であると考えられる領域のみを高画質化すれば、多くの場合、ユーザの視聴体験は改善される。
そこで本開示の一実施形態では、サーバは、画面内の一部領域のみを高品質な動画像とする高品質な部分画面の動画像を生成する。本実施形態では、このような高品質な部分画面の動画像のことを「補間動画」と称する。サーバは、生成した補間動画を動画像再生装置に伝送する。動画像再生装置は、低品質の動画像を拡大して再生する際に、高品質な部分画面の補間動画像を合成して同時に再生する。本実施形態では、低品質の動画像を拡大して再生する際に、高品質な部分画面の補間動画像を合成する処理のことを「補間処理」と称する。以下で説明する本開示の一実施形態では、低品質の動画像を拡大して再生する場合であっても、画面内の一部領域を高画質化することで、ユーザの視聴体験を改善させることが出来る。
動画像の配信側は、配信する(低品質の)再生動画の基であるオリジナルの動画として、高解像度であり、高符号化レートで符号化された高品質の動画像を予め作成し、保持している。動画像の配信側は、通信帯域や動画像再生装置の能力を考慮して、高品質の動画像を基に解像度や符号化レートを落とした再生動画を作成し、配信している。そこで動画像の配信側は、例えば、そのオリジナルの高品質の動画を基にして、高品質の動画から画面内の重要領域を抽出した部分領域画面の動画を生成することで、補間動画を生成する。
元の高品質動画と、配信および再生される動画とは、動画の内容は同じであり、同じコンテンツを基にして画サイズや符号化レート等が異なる動画実体(動画ファイル等)である。よって両動画は、コンテンツ名(タイトル名等)や内部管理識別子が同じであったり対応がとれる様に管理されていたりするものとする。ユーザは、(低品質の)再生動画と元の高品質動画とは、両動画のコンテンツ名(タイトル名等)を参照する事で同一コンテンツに対応するものだと識別でき、動画像再生装置は、内部管理識別子によって両動画を対応付けすることができる。
以上、本開示の概略について説明した。次に、本開示の一実施形態に係る動画像再生システムの全体構成例について説明する。
[全体構成例]
図1は、本開示の一実施形態に係る動画像再生システム1の全体構成例を示す説明図である。以下、図1を用いて本開示の一実施形態に係る動画像再生システム1の全体構成例について説明する。
図1に示したように、本開示の一実施形態に係る動画像再生システム1は、再生動画送出部110と、補間動画生成部120と、補間動画送出部130と、再生装置200と、を含んで構成される。再生動画送出部110、補間動画生成部120、及び補間動画送出部130が、動画像の配信側に設けられる要素であり、これらの要素は同一の装置に設けられてもよく、また図1に示したように、ネットワーク等の伝送路を介して接続されていても良い。ネットワーク等の伝送路を介して接続される場合は、各々の伝送路は同一の伝送路でも良く、異なる伝送路でも良い。例えば、再生動画送出部110と、補間動画生成部120と、補間動画送出部130との全てが同一ネットワークに接続されていても良く、再生動画送出部110と再生装置200との間の伝送路は放送波であり、補間動画送出部130と再生装置200との間の伝送路はネットワークであると言う様に異なる伝送路でも良い。
以下の説明では、再生動画送出部110、補間動画生成部120、及び補間動画送出部130は図1に示したようにネットワーク等の伝送路を介して接続されているものとして説明するが、本開示は係る例に限定されるものではない。
図10は、再生動画送出部110、補間動画生成部120,補間動画送出部130が保持する動画データ群を示す説明図である。図10に示した動画データ群も参照しながら、再生動画送出部110、補間動画生成部120、及び補間動画送出部130について説明する。
再生動画送出部110は、ネットワークや放送波等の伝送路を介して、再生装置200に対して再生動画v10を送出する。再生動画v10は、全てのクライアントに共通に伝送され、クライアントで再生される動画ファイルで構成される。再生動画送出部110から送出される再生動画v10は、再生装置200で受信され、再生されたり、また保存されたりし得る。
補間動画生成部120は、再生動画v10と同じ内容で、再生動画v10より品質が高い高品質動画v11を保持する。なお、品質が高いとは、画サイズが大きかったり、符号化レート高かったりするものと言う。高品質動画v11は、再生動画v10と同じ内容で、画サイズや符号化レートなどの品質が高い動画ファイルで構成される。高品質動画v11は、再生動画v10の基となる動画である。再生動画と高品質動画は、表示名や内部管理識別子等によって、ユーザやシステムで対応付けが可能である。補間動画生成部120は、再生装置200で再生される動画像内の補間領域を決定し、高品質動画v11から補間領域を抽出し、補間動画v12と補間情報i10を生成する。補間動画生成部120は、例えば動画像を配信する事業者側に設けられる動画オーサリング装置であったり、ネットワーク上のサーバ装置であったりし得る。
補間動画v12は、高品質動画v11の動画面の内、再生動画v10において内容の認識を向上させることが出来る領域、またはその動画像において重要であると考えられる領域である、補間領域部分だけを抽出した動画ファイル、すなわち高品質動画v11の部分画面の動画である。補間動画v12は、高品質動画v11の各Frame画像に対して、後述の補間指示部121が保持する情報が指示する補間領域の部分画像を抽出して、その部分画像をFrame画像として符号化した動画ファイルで構成される。
補間情報i10は、本開示の再生情報の一例である。補間情報i10は、補間動画生成部120が生成する情報であって、補間動画v12の各Frame画像が、元の高品質動画v11の動画面のどの座標、幅、高さであるかをFrame毎に示したファイルで構成される。補間情報i10は、後述の補間指示部121が保持する情報を基に生成される。また補間情報i10は、元の高品質動画v11の全体の画サイズも記録され得る。
一つの動画コンテンツ(再生動画v10及び高品質動画v11)に対して、補間動画v12および補間情報i10が複数作成されてもよい。例えば、あるスポーツ動画という一つの動画コンテンツに対して、選手Aの領域を補間する補間動画v12及び補間情報i10、選手Bの領域を補間する補間動画v12及び補間情報i10というように、複数の補間動画v12及び補間情報i10があってもよい。このように一つの動画コンテンツに対して補間動画v12および補間情報i10が複数作成されることで、ユーザは、好きな選手の補間動画v12及び補間情報i10を、一つ又は複数選択して、再生装置200で再生させることが可能になる。また例えば、あるスポーツ動画という一つの動画コンテンツに対して、文字情報(例えばスコア)が表示される領域を補間する補間動画v12及び補間情報i10が生成されるようにしてもよい。
補間動画生成部120は、図1に示したように、補間指示部121を含んで構成される。補間指示部121は、高品質動画v11の画面に対して、どの部分を補間領域とするかを指示した情報を保持する。高品質動画v11の画面は、再生動画v10と同じ内容で、画サイズや符号化レートなどの品質が高い画面である。補間指示部121が保持する情報は、高品質動画v11の各Frame時刻またはFrame番号、各Frame画像内で補間領域とすべき領域の座標、幅、高さを、Frame毎に列挙したものである。補間指示部121が保持する情報は、例えば再生動画v10を再生するユーザや、再生動画v10を配信する配信事業者側の人間(例えば再生動画v10を編集する編集者や、再生動画v10がスポーツ動画であれば、競技を解説する解説者)等が動画の時刻に沿って領域指示したものをファイル化したものであったり、動画認識によって自動的に領域検出した物をファイル化したものであったりし得る。補間指示部121が保持する情報は、補間情報i10として補間動画送出部130に提供され得る。
図1では、動画認識を実行する動画解析部300を図示している。動画解析部300は、動画認識によってFrame毎の補間領域を決定し、その決定した補間領域の情報を補間指示部121に渡す。
補間動画送出部130は、補間動画生成部120が生成した補間動画v12及び補間情報i10を保持し、ネットワーク等の伝送路を介して再生装置200へ送出する。補間動画送出部130は、例えばネットワーク上のサーバ装置であり得る。
再生装置200は、再生動画送出部110から送出される再生動画v10を受信して再生する。また再生装置200は、再生動画v10の再生に際し、補間動画送出部130から送出される補間動画v12及び補間情報i10を受信し、補間情報i10を用いて再生動画v10の一部を補間動画v12に置き換えて再生する。
図1に示したように、再生装置200は、補間部210と、再生部220と、を含んで構成される。補間部210は、再生動画送出部110から再生動画v10を受信すると共に、補間動画送出部130から補間動画v12及び補間情報i10を受信する。補間部210は、再生動画v10に対して、補間動画v12を用いて、再生動画v10における補間領域を高品質化し、補間後動画v13を生成する。再生部220は、補間部210が生成した補間後動画v13を再生する。再生部220によって再生される補間後動画v13は、表示画面(図示せず)に表示される。
補間部210と、再生部220とは、図1に示したように同一の再生装置200の内部に配置されていても良いが、ネットワーク等の伝送路で相互に接続されていても良い。
以上、図1を用いて本開示の一実施形態に係る動画像再生システム1の全体構成例について説明した。次に、本開示の一実施形態に係る補間動画生成部120の機能構成例について説明する。
[補間動画生成部の機能構成例]
図2は、本開示の一実施形態に係る補間動画生成部120の機能構成例を示す説明図である。以下、図2を用いて本開示の一実施形態に係る補間動画生成部120の機能構成例について説明する。
図2に示したように、本開示の一実施形態に係る補間動画生成部120は、補間指示部121と、復号部122と、補間情報処理部123と、Frame画像抽出部124と、符号化部125と、を含んで構成される。
補間指示部121は、上述したように、高品質動画v11の画面に対して、どの部分を補間領域とするかを指示した情報を保持する。補間指示部121が保持する情報は、必要に応じ、補間情報処理部123に適宜供給される。
復号部122は、符号化されている高品質動画v11を復号する。復号部122は、高品質動画v11を復号すると、各Frameの時刻及び高品質動画v11の画サイズの情報を補間情報処理部123に渡し、高品質動画v11の動画面のFrame画像をFrame画像抽出部124に渡す。
補間情報処理部123は、補間指示部121が保持している情報から、高品質動画v11のFrame毎に補間画像v12を抽出する座標(補間画像v12の動画面座標)及びサイズを決定し、その座標及びサイズの情報をFrame画像抽出部124に渡す。また補間情報処理部123は、補間指示部121が保持している情報から補間情報i10を生成する。補間情報処理部123が生成した補間情報i10は、補間動画送出部130に送られる。
Frame画像抽出部124は、復号部122から与えられた高品質動画v11の復号後のFrame画像から、補間情報処理部123が指示する領域の画素群(部分画像)を抽出し、補間動画面のFrame画像とする。Frame画像抽出部124によって抽出される補間動画面のFrame画像は符号化部125に送られる。
符号化部125は、Frame画像抽出部124が抽出した補間動画面のFrame画像を符号化して、補間動画v12を生成する。符号化部125が生成した補間動画v12は補間動画送出部130に送られる。
補間動画生成部120は、図2に示した構成を有することで、高品質動画v11から補間動画v12を生成すると共に、補間動画v12を用いて再生動画v10を補間するための補間情報i10を生成することが出来る。
以上、図2を用いて本開示の一実施形態に係る補間動画生成部120の機能構成例について説明した。続いて、本開示の一実施形態に係る補間動画送出部130の機能構成例について説明する。
[補間動画送出部の機能構成例]
図3は、本開示の一実施形態に係る補間動画送出部130の機能構成例を示す説明図である。以下、図3を用いて一実施形態に係る補間動画送出部130の機能構成例について説明する。
図3に示したように、本開示の一実施形態に係る補間動画送出部130は、受信部131と、補間記録部132と、補間一覧管理部133と、送出部134と、を含んで構成される。
受信部131は、補間動画生成部120が生成した補間動画v12及び補間情報i10を受信する。受信部131は、補間動画生成部120が生成した補間動画v12及び補間情報i10を受信すると、受信した補間動画v12及び補間情報i10を補間記録部132に送る。
補間記録部132は、受信部131から送られる、補間動画v12と補間情報i10とを対応付けて保持する。補間記録部132は、この補間動画v12と補間情報i10との組が、どの動画コンテンツに関するものかも併せて保持する。補間動画v12と補間情報i10との組がどの動画コンテンツに関するものかの判断には、後述するように、補間動画生成部120が補間情報i10に記した動画コンテンツの識別子が用いられる。図3には、補間記録部132が保持する補間管理情報の例が示されている。動画コンテンツXには、選手Aと選手Bについて補間するための情報が存在し、動画コンテンツYには、車aについて補間するための補間管理情報が存在している。補間管理情報には、それぞれ補間動画v12と補間情報i10とが対応付けられる。
補間一覧管理部133は、再生装置200の補間部210からの問い合わせに応じて、補間記録部132が保持している補間動画群に対応する動画コンテンツの一覧を返す。また補間一覧管理部133は、補間部210から動画コンテンツが指定されると、補間記録部132が保持している補間動画v12と補間情報i10との組の一覧を返す。
図3に示した例では、補間一覧管理部133は、再生装置200の補間部210からの問い合わせに応じて、補間記録部132が保持している補間動画群に対応する動画コンテンツの一覧としてコンテンツX及びコンテンツYを返す。また図3に示した例では、補間一覧管理部133は、再生装置200でコンテンツXが指定されると、コンテンツXに存在している補間動画v12と補間情報i10との組の一覧として、「選手A」及び「選手B」を返す。また補間一覧管理部133は、再生装置200で補間動画v12と補間情報i10との組が指示されると、送出部134に対してその補間動画v12と補間情報i10との組の送出を指示する。
送出部134は、補間一覧管理部133から送出が指示された補間動画v12と補間情報i10との組を、補間記録部132から取得して再生装置200に送出する。
補間動画送出部130は、図3に示した構成を有することで、高品質動画v11から生成された補間動画v12と共に、補間動画v12を用いて再生動画v10を補間するための補間情報i10を再生装置200に送出することが出来る。
以上、図3を用いて本開示の一実施形態に係る補間動画送出部130の機能構成例について説明した。続いて、本開示の一実施形態に係る再生装置200に含まれる補間部210の機能構成例について説明する。
[補間部の機能構成例]
図4は、本開示の一実施形態に係る再生装置200に含まれる補間部210の機能構成例を示す説明図である。以下、図4を用いて本開示の一実施形態に係る再生装置200に含まれる補間部210の機能構成例について説明する。
図4に示したように、本開示の一実施形態に係る再生装置200に含まれる補間部210は、受信部211、212、213と、補間動画選択部214と、復号部215、216と、時刻制御部217と、補間処理部218と、を含んで構成される。
受信部211、212、213は、本開示の画像取得部の一例である。受信部211、212、213は、それぞれ、再生動画v10、補間動画v12、補間情報i10を受信する。再生動画v10は再生動画送出部110から、補間動画v12及び補間情報i10は補間動画送出部130から、それぞれ送出される。受信部211が受信した再生動画v10は復号部215へ、受信部212が受信した補間動画v12は復号部216へ、受信部212が受信した補間情報i10は補間処理部218へ、それぞれ送られる。
図4に示した例では、受信部211、212、213が別々の構成要素として示されているが、本開示は係る例に限定されない。受信部211、212、213は、1つの構成要素として設けられても良い。
補間動画選択部214は、再生動画送出部110から受信する再生動画v10に対応する補間動画の一覧を補間動画送出部130から取得し、再生動画v10の補間に用いられる補間動画v12及び補間情報i10を決定する。補間動画選択部214が決定した補間動画v12及び補間情報i10は、補間動画送出部130から送出される。
復号部215、216は、それぞれ、符号化された状態の再生動画v10、補間動画v12を1フレームずつ復号し、Frame画像(画素群)を出力する。復号部215、216は、再生動画v10及び補間動画v12のFrame画像を補間処理部218に出力する。また復号部215、216は、再生動画v10及び補間動画v12のFrame画像のFrame時刻(Frame番号)を出力する。
時刻制御部217は、復号部215、216から取得したFrame時刻(Frame番号)の情報を用いて、補間処理部218での補間処理の際に、再生動画v10及び補間動画v12のFrame時刻が一致するような制御を行う。
補間処理部218は、本開示の画像合成部の一例である。補間処理部218は、補間動画v12を用いた再生動画v10の補間処理を行う。補間処理部218は、再生動画v10を復号する復号部215から再生動画v10のFrame画像を、補間動画v12を復号する復号部216から補間動画v12のFrame画像を、時刻制御部217から今回のFrameのFrame時刻を受け取る。また補間処理部218は、受信部213が受信した補間情報i10の中から、当該Frame時刻の補間領域の座標を取得し、再生動画v10のFrame画像における当該座標位置に補間動画v12のFrame画像を合成する。そして補間処理部218は、再生動画v10の動画面内の一部領域(補間領域)が補間動画v12により高品質化された、補間後のFrame画像v13を出力する。
補間後のFrame画像v13は、再生部220で画面へ再生描画されたり、符号化部230によって動画に符号化されて、送出部/記録部240により保存されたり、別の装置へ送出されたりしても良い。
補間部210は、図4に示した構成を有することで、補間動画v12及び再生動画v10を補間するための補間情報i10を用いて、再生動画v10の一部を高画質の補間動画v12で補間する補間処理を実行することができる。補間部210は、再生動画v10の一部を高画質の補間動画v12で補間する補間処理を実行することで、ユーザの視聴体験を向上させることが可能になる。
以上、図4を用いて本開示の一実施形態に係る再生装置200に含まれる補間部210の機能構成例について説明した。次に、本開示の一実施形態に係る補間動画生成部120の動作例について説明する。
[補間動画生成部の動作例]
図5は、本開示の一実施形態に係る補間動画生成部120の動作例を示す流れ図である。図5に示した流れ図は、本開示の一実施形態に係る補間動画生成部120で補間動画v12及び補間情報i10を生成する際の動作例である。以下、図5を用いて、本開示の一実施形態に係る補間動画生成部120の動作例について説明する。
まず補間動画生成部120は、(符号化されている)高画質動画v11を復号部122で復号し、復号されたFrame画像を生成する(ステップS101)。Frame画像は、1画面分の画素群が並んだデータである。
ステップS101で高画質動画v11のFrame画像を生成すると、続いて補間動画生成部120は、復号Frame画像内で、補間領域であると指示された情報を補間指示部121が取得する(ステップS102)。例えば、ユーザが、そのFrame画像を見て、補間領域の座標、幅、高さを指示し得る。ここでの「ユーザ」には、再生動画v10を再生するユーザや、再生動画v10を配信する配信事業者側の人間(例えば再生動画v10を編集する編集者や、再生動画v10がスポーツ動画であれば、競技を解説する解説者)等が含まれ得る。また、事前にユーザが領域指示したり、動画認識処理によって補間領域を自動抽出したりした情報は、Frame時刻(Frame番号)と補間領域の座標、幅、高さの列の形でファイルに保存されてもよい。補間動画が生成される際に、補間領域であると指示された情報が読み込まれ、復号後の各FrameのFrame時刻(Frame番号)に該当する補間領域の情報が取得される。
例えば動画解析部300は、顔認識、動体認識、奥行き認識等の技術などを利用して高画質動画v11を解析し、補間すべき領域を自動決定してもよい。また、ユーザ(再生動画v10を再生するユーザや、再生動画v10を配信する配信事業者側の人間等)の指示と動画解析部300による動画解析とを組み合わせてもよい。動画像に対し、ユーザが指示した物体の動きを追跡する動画解析技術がある。この物体の動きを追跡する動画解析技術を利用して、例えば、スポーツの動画であれば、ユーザがある選手を指示すると、動画解析部300は、その指示された選手の動きを追跡し、その追跡により得られる領域を補間領域としてもよい。
補間指示部121は、ユーザ(再生動画v10を再生するユーザや、再生動画v10を配信する配信事業者側の人間等)の指示又は画像認識の結果に基づいて生成された補間領域の情報(座標、幅、高さ)を補間情報処理部123へ送る。補間情報処理部123は、補間指示部121から渡された補間領域の情報をFrame画像抽出部124へ渡す。
続いて補間動画生成部120は、復号された高品質動画v11のFrame画像から、補間指示部121から指定された領域(座標、幅、高さ)の画素群をFrame画像抽出部124で抽出する(ステップS103)。
上記ステップS103で、高品質動画v11のFrame画像から指定された領域(座標、幅、高さ)の画素群を抽出すると、続いて補間動画生成部120は、抽出した画素群を補間領域のFrame画像とし、符号化部125で符号化してファイルに書き込むことで補間動画v11を生成する(ステップS104)。
このステップS104での符号化の際の符号化レートは、元の高品質動画v11よりも低いレートに決定し得る。一般に動画の符号化では、画サイズ(面積、画面内画素数)が小さくなれば、同等の画質を維持するのに必要な符号化レートも低くて済む。そのため、例えば高品質動画v11と、補間領域のFrame画像の画サイズ(面積)との比率から符号化レートを決定してもよい。例えば面積比が10:1ならば、符号化部125は、符号化レートを高品質動画v11の1割の値にして符号化しても良い。加えて、符号化部125は、符号化方式のS/N比の特性等も利用して符号化レートを決定し得る。
また補間動画生成部120は、Frame時刻(Frame番号)と、高品質動画v11のFrame画像上における補間領域の座標、幅、高さの情報を、補間情報処理部123にファイルに記録させることで、補間情報i10を記録する(ステップS105)。
補間動画生成部120は、図5に示した一連の動作を、高品質動画v11の最終Frameまで繰返す事により、高品質動画v11から補間領域だけを抽出した補間動画v12と、Frame毎に補間動画v12を配置すべき座標を記した補間情報i10が生成される。補間情報i10にはこれに加えて、高品質動画v11の全体画サイズ、動画コンテンツのタイトル名や識別子、補間動画の補間名称や補間識別子の情報も記録され得る。上述したように、高品質動画v11と再生動画v10とは同一の動画コンテンツとして対応付けされている。従って、補間動画v12の基となった高品質動画v11のタイトル名や識別子が補間情報i10に付与される事で、生成された補間動画v12の補間対象となる再生動画v10への対応付けが可能になる。また補間動画v12の補間名称や補間識別子が補間情報i10に付与される事で、一つの動画コンテンツに対して複数の補間動画v12及び補間情報i10を作成された場合に、ユーザが補間動画を選別出来るようになる。
以上、図5を用いて、本開示の一実施形態に係る補間動画生成部120の動作例について説明した。次に、本開示の一実施形態に係る補間動画送出部130の動作例について説明する。
[補間動画送出部の動作例]
図6及び図7は、本開示の一実施形態に係る補間動画送出部130の動作例を示す流れ図である。図6及び図7に示した流れ図は、本開示の一実施形態に係る補間動画送出部130で補間動画v12及び補間情報i10を再生装置200へ送出する際の動作例である。以下、図6及び図7を用いて、本開示の一実施形態に係る補間動画送出部130の動作例について説明する。
まず、再生装置200へ補間動画v12及び補間情報i10の一覧を送出する際の補間動画送出部130の動作例について説明する。補間動画送出部130は、再生装置200の補間部210から、補間動画v12及び補間情報i10の要求を補間一覧管理部133で受信する(ステップS111)。この再生装置200からの要求には、動画コンテンツを識別するためのコンテンツ識別子が含まれている。
ステップS111で補間部210から要求を受信すると、補間一覧管理部133は、補間記録部132に対して、再生装置200から送られてきたコンテンツ識別子を指定して、保持している補間動画v12及び補間情報i10の一覧を受け取る(ステップS112)。この補間動画v12及び補間情報i10の一覧は、補間名称及び補間識別子の列で構成され得る。
ステップS112で補間記録部132から補間動画v12及び補間情報i10の一覧を受け取ると、補間一覧管理部133は、取得した一覧を再生装置200の補間部210へ返す(ステップS113)。
続いて、再生装置200へ補間動画v12及び補間情報i10を送出する際の補間動画送出部130の動作例について説明する。補間動画v12及び補間情報i10の一覧を受信した補間部210は、どの補間動画v12及び補間情報i10を取得するかを決定し、補間動画送出部130に、補間識別子を指定して補間動画v12及び補間情報i10の送出を要求する。補間一覧管理部133は、補間部210から送信された補間動画v12及び補間情報i10の送出要求を受信する(ステップS121)。
ステップS121で送出要求を受信すると、補間一覧管理部133は、補間部210に指定された補間識別子を送出部134に指定して、補間動画v12及び補間情報i10の送出を指示する(ステップS122)。
送出部134は、上記ステップS122で補間動画v12及び補間情報i10の送出を補間一覧管理部133から指示されると、補間記録部132に対して補間識別子を指定して補間動画v12及び補間情報i10のファイルを受け取り、受け取ったファイルを補間部210へ送信する(ステップS123)。
補間動画送出部130は、図6及び図7に示した動作を実行することで、高品質動画v11から生成された補間動画v12と共に、補間動画v12を用いて再生動画v10を補間するための補間情報i10を再生装置200に送出することが出来る。
以上、図6及び図7を用いて、本開示の一実施形態に係る補間動画送出部130の動作例について説明した。次に、本開示の一実施形態に係る再生装置200に含まれる補間部210の動作例について説明する。
[補間部の動作例]
図8及び図9は、本開示の一実施形態に係る再生装置200に含まれる補間部210の動作例を示す流れ図である。図8及び図9に示した流れ図は、本開示の一実施形態に係る補間部210で、補間動画v12を用いた再生動画v10の補間処理を実行する際の動作例である。以下、図8及び図9を用いて本開示の一実施形態に係る再生装置200に含まれる補間部210の動作例について説明する。
再生装置200のユーザが、再生装置200に対して再生する再生動画v10を決定すると(ステップS131)、補間動画選択部214は、決定された再生動画v10に対応する補間動画v12及び補間情報i10を決定する(ステップS132)。補間動画選択部214は、補間動画送出部130に対して、再生動画v10のコンテンツ識別子を指定して、補間動画送出部130が保持している補間動画v12及び補間情報i10の一覧を取得する。補間動画選択部214は、取得した一覧の中から補間処理に使用する補間動画v12を決定する。例えば、補間動画選択部214が取得した補間名称の一覧を画面に表示させて、一覧の中からユーザに選択させることで補間処理に使用する補間動画v12が決定される。補間動画選択部214は、補間動画送出部130に対して、決定した補間動画v12及び補間情報i10の送出を要求する。
補間動画送出部130から、要求に応じた補間動画v12及び補間情報i10が送出されると、補間部210は、送出された補間動画v12及び補間情報i10を用いて、再生動画送出部110から送出された再生動画v10の補間処理を実行する(ステップS133)。図9に示したのは、ステップS133の補間処理の詳細を示す流れ図である。
再生動画v10を受信する受信部211は、受信した再生動画v10を復号部215へ送り、復号部215に再生動画v10の復号を行わせる。補間動画v12を受信する受信部212は、受信した補間動画v12を復号部216へ送り、復号部216に補間動画v12の復号を行わせる。補間情報i10を受信する受信部213は、受信した補間情報i10を補間処理部218へ送る。
再生動画v10を復号する復号部215は、再生動画v10を1Frame分復号し、復号Frame画像を生成する(ステップS141)。また復号部215は、今回復号したFrameのFrame時刻(Frame番号)を時刻制御部217へ伝える。
補間動画v12を復号する復号部216は、補間動画v12を1Frame分復号し、復号Frame画像を生成する(ステップS144)。また復号部216は、今回復号したFrameのFrame時刻(Frame番号)を時刻制御部217へ伝える。
時刻制御部217は、再生動画v10と補間動画v12のFrame時刻を比較する(ステップS142、S145)。再生動画v10と補間動画v12のFrame時刻を比較した結果、Frame時刻が一致していれば、時刻制御部217は補間処理部218にそのFrame時刻を伝える。一方、再生動画v10と補間動画v12のFrame時刻を比較した結果、Frame時刻が一致していなければ、時刻制御部217は双方のFrame時刻が一致するまでFrame復号を繰り返させる。例えば時刻制御部217は、Frame時刻が遅い(Frame番号が大きい)方を基準とし、Frame時刻が早い(Frame番号が小さい)方の動画のFrame画像は破棄する。そして時刻制御部217は、次のFrame復号を復号部215、216に指示し、基準とした(Frame時刻が遅い方の)Frame時刻と同じ時刻の復号Frame画像が出力されるまで、比較処理を繰り返す。
再生動画v10と補間動画v12のFrame時刻が一致していれば、補間処理部218は、再生動画v10と補間動画v12の復号Frame画像を、後述する基軸画サイズに合わせる様に拡大または縮小する(ステップS143、S146)。補間処理部218は、再生動画v10の復号Frame画像の画像サイズと、補間動画v12の基なった高品質動画v11の画像サイズとが基軸画サイズと同じになる様に、各復号Frame画像の変倍率を決定する。補間処理部218は、補間動画v12の基となった高品質動画v11の画像サイズを、補間情報i10から取得し得る。
図11は、ステップS143、S146における拡大または縮小処理を示す説明図である。図11に示すように、補間処理部218は、再生動画v10と補間動画v12の復号Frame画像を、基軸画サイズに合わせるように拡大または縮小する。
例えば基軸画サイズを、動画の表示画面サイズとし、画サイズが、再生動画面<表示画面<元高品質動画面であるとする。この場合に、各画面サイズの幅・高さを、基軸画サイズ(ここでは動画の表示画面のサイズ)は幅BW×高さBH、再生動画面サイズは幅PW×高さPH、元の高品質動画面サイズは幅HW×高さHWとする。例として、再生動画面の幅PWが640ピクセルで高さPHが360ピクセル、基軸画面サイズの幅BWが1280ピクセル、高さBHが720ピクセル、元の高品質動画面サイズの幅HWが1920ピクセル、高さHHが1080ピクセルであるとする。また、補間動画面サイズを幅MW×高さMHとする。
この場合に、補間処理部218は、再生動画v10のFrame画像を表示画面サイズに拡大する。上述の例では、縦と横のピクセル数が各々2倍(BW=PW×2、BH=PH×2)なので、補間処理部218は、再生動画v10のFrame画像の1つのピクセルを横及び縦に2つずつ並べることで再生動画v10のFrame画像を表示画面サイズに拡大する。
一方、補間処理部218は、補間動画v12のFrame画像を縮小する。この縮小の際の縮小率は、補間動画v12の基となった高品質動画v11の画サイズと表示画面サイズとの比率にする。上述の例では、縦と横の画素数の比率が、高品質動画面サイズ:基軸画面サイズ=3:2(すなわち、BW=HW×2/3、BH=HH×2/3)である。従って補間処理部218は、補間動画v12のFrame画像は、縦と横の画素数を2/3に間引いて縮小する。例えば補間動画v12のFrame画像の幅MWが192ピクセル、高さMHが108ピクセルの場合は、補間処理部218は、補間動画v12のFrame画像の幅を128ピクセル、高さを72ピクセルに、それぞれ縮小する。
補間処理部218は、この様に拡大または縮小することで、再生動画v10のFrame画像と補間動画v12のFrame画像とを、同一の基軸画サイズ座標軸(画サイズがBW×BHの領域)上での画素列として処理出来る様にする。
続いて補間処理部218は、時刻制御部217から与えられたFrame時刻に対応する、補間領域の座標、幅、高さの情報を補間情報i10から取得する。上述の様に、補間情報にはFrame時刻毎の補間座標が記述されているが、この座標、幅、高さは元の高品質動画v11の画サイズ上での数値である。従って補間処理部218は、これらFrame時刻毎の補間座標の数値も、ステップS143、S146と同様の方法で、基軸画サイズ上の座標、幅、高さに変倍する(ステップS147)。例えば上述の例のように、高品質動画v11の画サイズと基軸画サイズの縦および横の画素数比率が3:2だった場合に、高品質動画v11での補間領域の座標[x,y]が[90,60]であれば、補間処理部218は、基軸画サイズ上の補間領域の座標を、補間領域の座標の値を2/3倍した[60,40]とする。
続いて、補間処理部218は、再生動画v10のFrame画像に、補間動画v12のFrame画像をオーバーレイ描画(画素を上書き)する(ステップS148)。再生動画v10のFrame画像上に、補間動画v12のFrame画像をオーバーレイ描画する際の座標は、補間情報i10の当該Frame時刻の座標を、基軸画サイズ上の座標に変換した座標とする。再生動画v10のFrame画像、補間動画v12のFrame画像、補間座標の全てが、同一の基軸画サイズ上の画像(画素群)及び画素座標となる様に変倍及び座標変換されているので、補間処理部218は、上述の再生動画v10のFrame画像、補間動画v12のFrame画像、補間座標を同一座標上の画素群及び座標位置として扱う事が出来る。
補間部210は、図8及び図9に示した処理を実行することで、補間動画v12及び再生動画v10を補間するための補間情報i10を用いて、再生動画v10の一部を高画質の補間動画v12で補間する補間処理を実行することができる。補間部210は、再生動画v10の一部を高画質の補間動画v12で補間する補間処理を実行することで、ユーザの視聴体験を向上させることが可能になる。
[まとめ]
以上説明したように本開示の一実施形態に係る動画像再生システム1は、低品質の再生動画v10を拡大した表示画面に対して、一部の領域(例えばスポーツ中継であれば、選手の姿やスコア表示などの、その動画像において認識を向上させることが出来る領域、またはその動画像において重要であると考えられる領域)を高品質の補間動画v12で補間する。本開示の一実施形態に係る動画像再生システム1は、このように低品質の再生動画v10を高品質の補間動画v12で補間することで、ユーザの視聴体験を向上させる事が出来る。
本開示の一実施形態に係る動画像再生システム1は、元の高品質動画v11の全てではなく、高品質動画v11から抽出された補間領域部分を有する補間動画v12だけが伝送されることで、補間動画v12の情報量を下げ、符号化レート(伝送レート)を低減する事が出来る。また再生装置200には再生動画v10そのものをアップコンバート演算する演算負荷や専用の演算回路を設ける必要はなく、座標の演算や画像の合成を行う構成を設ければ良いので、本開示の一実施形態に係る動画像再生システム1では、再生装置200の処理能力が高くない場合であっても、再生装置200に過大な負荷を掛けずに、再生装置200で再生動画v10を補間させることが出来る。
上述の例では、補間動画v12及び補間情報i10は、予め補間動画生成部120で生成してファイルとして保存していた。本開示は係る例に限定されるものではない。補間動画v12及び補間情報i10は、動的に生成されるようにしてもよい。
例えば、再生装置200の再生部220に、補間動画生成部120に含まれる補間指示部121が設けられていても良い。ユーザが再生動画v10を再生閲覧している間に、その再生動画v10に対する補間領域を指示する場合を例示する。補間指示部121は、その補間領域の座標、幅、高さと、再生部220で再生されている再生動画v10の再生画面の画サイズとを、補間動画生成部120に送信する。補間動画生成部120は、再生装置200から受信した補間領域の座標、幅、高さに対して、同じく再生装置200から受信した再生画面サイズから、再生動画v10に対応する高品質動画v11の画面サイズに座標変換する。この処理は、上記ステップS143、146での座標変換の逆変換である。そして補間動画生成部120は、高品質動画v11から指定された領域(または変換後の領域)を抽出して補間動画v12を生成し、補間動画送出部130を経て補間部210へ送信する。
また例えば、ライブカメラ等のリアルタイム配信で、配信者がリアルタイムに補間領域を指示する場合を例示する。この場合、(ライブカメラ等が生成する)リアルタイム動画が、上記の説明での高品質動画v11(オリジナル動画)に相当する。動画配信者は、ライブカメラの動画がリアルタイムに生成する動画Frameに対して、配信用に低画サイズ及び低符号化レートで再生動画v10を送出しつつ、視聴者に注目して欲しい領域は補間領域として補間動画生成部120に指示する。補間動画生成部120は、ライブカメラから動画Frameを受け取る都度、指示された領域をそのFrame画像から抽出して補間動画v12のFrame画像とし、そのFrameの補間情報i10とともに補間動画送出部130に送出しする。補間動画送出部130は、補間部210に、リアルタイムに補間動画v12のFrameと補間情報i10とを送出する。
再生画面に対応する補間動画v12の、補間部210での受信遅延を吸収するために、再生動画送出部110と補間動画送出部130との間で、送出する動画時刻を合わせる様に連携したり、あるいは再生動画送出部110と補間動画送出部130を同一機器に備えるようにして、再生動画v10と補間動画v12との送出タイミングを合わせたりし得る。さらに、ライブカメラ等のリアルタイム配信の例では、ライブカメラから動画を受け取る補間動画生成部120と再生動画送出部110とを一体化したり、また補間動画生成部120と補間動画送出部130とを一体化して補間動画Frameの生成と送出を一体化したりしても良い。
また、補間部210の補間動画選択部214が補間動画を決定する際に、上述の例ではユーザに補間一覧から選択指示させていたが、本開示は係る例に限定されるものではない。例えば、ネットワーク上で人気の高い補間対象や、視聴者の嗜好分析、過去の補間対象の選択傾向等を用いて、補間動画選択部214は、自動的に補間対象を選択したり、おすすめの補間対象を提示したりしてもよい。例えば補間動画選択部214は、過去に視聴者に選択された回数が多かった選手Aを、補間対象として自動的に選択したり、おすすめの補間対象として提示したりしてもよい。
補間動画v12の抽出元となる高品質動画v11は、上述したように、例えば動画配信業者が保持するオリジナル(元素材)の高品質動画が用いられ得る。一方で、その様な元素材の高品質動画が無い場合もある。例えば、プライベートコンテンツの様に個人が作成した動画や、昔に作成された動画などが元素材の高品質動画が無い場合にあたる。この場合は、その元素材の高品質動画が無い動画を補間動画生成部120に伝送して蓄積させてもよい。そして例えば上記特許文献1等で開示されている、動画単体からの高画質化演算・アップコンバート技術を用いて擬似的な高画質動画v11を補間動画生成部120に生成させて、その高画質動画v11を補間動画v12の抽出元としてもよい。
この場合、高画質化処理のための高負荷演算や特殊な回路は、再生装置200ではなく補間動画生成部120に配置すればよい。従って、元素材の高品質動画が無い場合であっても、再生装置200での負荷やコストは低減できるし、高画質化処理のための高負荷演算や特殊な回路を補間動画生成部120に配置するのであれば、より高性能で高価格な高画質化回路を補間動画生成部120に配置することもできる。また、補間動画生成部120だけが高画質化のための演算を行えばよく、また生成した疑似的な高画質動画v11は補間動画生成部120に保存されるので、高画質化のための演算は一回だけ行えばよい。
なお、動画のネットワーク伝送に関して、MPEG−DASH(Dynamic Adaptive Streaming over HTTP、ISO/IEC 23009−1)では、伝送路の伝送レートに応じて伝送する動画の符号化レートを自動的に調整する技術が開示されている。本開示は、このMPEG−DASHの技術を適用し得る。
例えば、補間動画v12を複数の符号化レートで符号化し、セグメント分割したファイル群として配置しておき、補間動画v12の伝送に、このMPEG−DASHの技術が用いられてもよい。また再生動画v10と補間動画v12のいずれにもMPEG−DASHによる伝送レート調整を行う場合は、双方の伝送レートの上限や下限を設定し、両者の伝送レートを調整してもよい。
例えば、伝送帯域が5Mbpsで、(再生動画送出部110から送出される)再生動画v10の伝送レートが4Mbpsであり、補間動画v12の伝送用の帯域が残りの1Mbpsとして動画伝送が始められる場合を考える。この場合、再生動画v10の伝送レート:補間動画v12の伝送レート=4:1とする。MPEG−DASHでは、動画伝送時の実効レートを計測し、その実効レートに合わせて動画伝送レートを変動させる。この時、再生装置200は、双方の動画伝送の実効レートの総和を求めて実効伝送レートの合計を求め、再生動画v10の伝送レートは実効伝送レートの合計の4/5、補間動画v12の伝送レートは実効伝送レートのその1/5のレートを上限とする事で、双方の動画の伝送レート調整を調整してもよい。
また、以下の説明の中には、補間動画v12として伝送する補間領域のサイズが変動する方式がある。例えば補間動画面の全体サイズは変わらないが、その中に埋め込まれる補間領域の画素量が増減したり、補間領域の面積によって、伝送する補間動画群(分割画面動画群)の数が増減したりする場合がある。つまり、補間領域のサイズによって、伝送する補間動画v12の情報量が増減する。
この様な方式の場合は、再生装置200は、上述した再生動画v10と補間動画v12のレート割り当てにおいて、補間領域サイズが小さい期間は補間動画v12に割り当てるレートの比率を下げ、補間領域が大きい期間は割り当てるレートの比率を上げてもよい。
またMPEG−DASHにおいて動画伝送レートを決定する(すなわち、取得する動画ファイルを選択する)役割を担う、動画受信側である補間部210は、補間情報i10を取得している。この補間情報i10を用いれば、補間部210は、未来の動画時刻における補間領域サイズを先行して知り得るので、補間領域サイズによる補間動画v12のレート配分を先行して行ってもよい。
<2.実施例1>
[概要]
上述した本開示の一実施形態では、補間領域の画像をそのまま動画面としていた。この場合、補間動画v12のFrame毎に補間領域の画サイズが変化することが当然考えられる。すなわち、再生画面内で再生動画v10に対して補間したい補間領域のサイズは、こまめに変化する事が考えられる。例えばスポーツコンテンツの場合、動画面内で特定選手が表示される領域を補間する場合、その選手が移動することによって、補間領域は小さくなったり大きくなったりする。
一方、一般的に、動画符号化方式や復号処理の多くは、Frame毎に画サイズ(動画面サイズ)が変化する様な動画に対応していない。そこで、補間領域だけを動画面とする補間動画v12を実現するために、補間領域の大きさがFrame毎に変化する場合を想定した実施例について説明する。
図17は、本実施例1における補間領域と補間動画v12の動画面の画サイズの変化例を示す説明図である。本実施例1では、図17に示すように、補間動画v12の動画面の幅及び高さは、全Frameの補間領域群の中で最大の幅(MW)及び高さ(MH)とする。
例えば図17に示したように、高画質動画v11のFrame0の補間領域が50×100、Frame1の補間領域が70×150、Frame2の補間領域が100×80の場合、Frame2の補間領域の幅100が最も大きい幅(MW)、Frame1の補間領域の高さ150が最も大きい高さ(MH)である。従って本実施例は、補間動画v12の動画面の画サイズは、幅MWを100、高さMHを150に固定する。各Frameの補間領域画像は、この100×150の画サイズ内に収まる様になる。
全Frameの補間領域群の中で最大の幅(MW)及び高さ(MH)の領域を補間領域とすることで、Frame毎に補間領域のサイズが変化しても、補間動画v12の動画面の画サイズは100×150で常に固定され、既存の動画符号化方式や復号処理で処理できる。また、全Frameの補間領域群の中で最大の幅(MW)及び高さ(MH)の領域を補間領域とすることで、本実施例は、全ての補間領域群を包含できる最小領域の補間動画v12を生成する。
このように補間動画v12の動画面の画サイズが固定されることで、各Frameにおいて補間領域の画サイズと補間動画v12の動画面の画サイズとが異なるものとなる。従って、本実施例は、各Frameで補間領域の画サイズと補間動画v12の動画面の画サイズとを個別に管理する。各Frameで補間領域の画サイズと補間動画v12の動画面の画サイズとを個別に管理するため、本実施例は、補間情報i10に双方のサイズを記述する。
例えば、補間動画生成部120は、補間情報i10の先頭に補間動画v12の動画面サイズ(MW×MH)を記述し、またFrame毎に補間領域のサイズを補間情報i10に記述する。補間動画v12の動画面サイズは全Frameに渡って固定で変化しないので、Frame毎に記述する必要は無い。補間領域は、Frame毎に位置及びサイズが変化し得るのでFrame毎に記述される。補間部210が補間動画v12を復号する時には、復号部216は通常、復号したFrame画像の画サイズを情報として返すので、補間動画v12の動画面サイズは復号したFrame画像から取得する事も出来る。この場合、補間情報i10には補間領域のサイズだけが記述されていればよい。
次に、補間動画v12の動画面と補間領域との座標について述べる。図18は、補間動画v12の動画面と補間領域との座標との関係を示す説明図である。なお座標とは、高品質動画v11の動画面内における、補間領域や補間動画v12の動画面の左上角の座標をいう。
高品質動画v11の画サイズを幅HW×高さHH、補間動画v12の画サイズを幅MW×高さMHとする。またFrame毎の補間領域の左上座標を[x,y]、補間領域のサイズを幅DW×高さDHとする。
図18に示す様に、補間領域が高品質動画v11の動画面内の右下に位置していたとする。例えば高品質動画v11の動画面サイズがHW=1920、HW=1080であり、補間領域が座標[x,y]=[1850,1000]、サイズDW=50、DH=70であったとする。この時、補間領域の右下座標[x+DW,y+DH]は[1900,1070]であり、高品質動画v11の動画面内に収まる。
しかし補間動画面のサイズと補間領域サイズが異なるので、図18に示す様に、補間動画v12の動画面の座標を[x,y]=[1850,1000]にすると、高品質動画v11の動画面からはみ出る場合がある。上述の例の様に補間動画v12の動画面の画サイズは100×150であれば、座標[1820,1000]から100×150の画像を抽出しようとすると、右下座標[x+MW,y+MH]は[1950,1150]となり、高品質動画v11の画サイズ(HW=1920、HH=1080)からはみ出る。
この場合の対応として、例えば補間部210は、補間動画v12の動画面として画像抽出する座標を左上にずらして、高品質動画v11の動画面からはみ出ない様にして抽出する。ここで、画像抽出する左上座標=抽出座標を[xx,yy]とする。例えば補間部210は、補間動画v12の動画面の右下角を高品質動画v11の動画面の右下境界に合わせる様に、抽出座標[xx,yy]を[HW−MW,HH−MH]=[1820,930]とし、これをそのFrameの補間動画v12の動画面の座標に設定する。この場合、補間動画v12の動画面の座標[xx,yy]と補間領域の座標[x,y]は異なるものになるので、双方の座標は個別に管理されることが望ましい。そこで補間情報i10には、個々のFrame毎に、補間領域の座標[x,y]に加えて、その補間領域を包含する補間動画v12の動画面の座標(高画質動画v11のFrame画像から画素群を抽出した際の座標)[xx,yy]も合わせて記しておく。
図18の例では、補間領域の座標[x,y]、補間領域を包含する補間動画v12の動画面の座標[xx,yy]も、高品質動画v11の動画面上の座標軸で記されているが、本開示は係る例に限定されるものではない。別の方法として、補間動画v12の動画面の座標を高品質動画v11の動画面上の座標として記され([1820,930])、補間領域の座標は補間動画v12の動画面内の座標([30,70])として記されてもよい。
この様に本実施例は、補間動画v12の動画面の画サイズを(サイズが変化する)全ての補間領域を包含し得る最大幅MW×最大高さMHを有する画サイズとする事で、補間動画v12の動画面の画サイズに固定でき、かつ全Frameの補間領域を包含できる。その結果、補間領域と補間動画v12の動画面の画サイズとが異なる事になるので、本実施例では、2つのサイズを管理できる様に補間情報i10に双方のサイズが記述されるか、または、補間動画v12の動画面の画サイズは補間部210での復号時に取得される。
また、補間動画v12の動画面の画サイズと補間領域のサイズとが異なる事により、図18に示したように補間動画v12の動画面が高品質動画v11の動画面からはみ出る場合が発生するので、本実施例は、補間動画v12の動画面の座標を調整して、補間動画v12の動画面が高品質動画v11の動画面からはみ出ない様にする。その結果、補間領域と補間動画v12の動画面の座標が異なる事になるので、本実施例では、双方の座標を管理するために補間情報i10に双方の座標が記述される。
補間部210は、補間情報i10に記された補間領域と補間動画v12の動画面との座標及びサイズ情報を基に、補間動画v12の動画面から補間領域の画像を抽出する。図19は、補間部210で補間動画v12の動画面から補間領域の画像を抽出する際の処理を示す説明図である。
まず補間部210は、補間動画v12の動画面の座標と補間領域の座標との差に基づき、補間動画v12の動画面内から画像を抽出する補間領域の座標を決定する。図19に示した例で、補間部210は補間情報i10のFrame3の情報によって、補間動画v12の動画面は高品質動画v11の動画面内の[1820,930]座標から抽出した画像であり、補間領域は高品質動画v11の動画面内の[1850,1000]座標であると解る。そこで補間部210は、補間動画のFrame3を復号して得られたFrame画像内の座標[30,70]を補間領域の座標と判断する。そして補間部210は、その座標[30,70]を左上座標として、補間領域サイズ(50x70)分の画像を抽出する。最後に補間部210は、補間領域の座標とサイズを、高品質動画v11の動画面上の座標及びサイズから基軸画サイズ上の座標及びサイズに変換してから、再生動画v10への補間動画v12の合成処理を行う。
[補間部の機能構成例]
次に、この実施例1を実行するための補間部210の機能構成例について説明する。図12は、本開示の一実施形態の実施例1に係る補間部210の機能構成例を示す説明図である。図12は、特に、補間部210に含まれる補間処理部218の機能構成例を示す説明図である。
図12に示したように、本開示の一実施形態の実施例1に係る補間処理部218は、画像変倍部301、304と、補間座標計算部302と、補間領域抽出部303と、Frame画像合成部305と、を含んで構成される。
画像変倍部301、304は、復号部215、216が復号したFrame画像(画素群)を拡大または縮小することで変倍する。上述の本開示の一実施形態の説明に示した様に、画像変倍部301、304は、再生動画v10のFrame画像及び補間動画v12のFrame画像を基軸画サイズに変倍する。
補間座標計算部302は、補間処理部218が取得した補間情報i10を基に、元の高品質動画v11の動画面サイズ上の、補間動画v12による補間領域の座標や画サイズ(幅及び高さ)の値を、基軸画サイズに変換したり、補間動画v12の動画面から抽出すべき補間領域を決定したりする。
補間領域抽出部303は、補間動画を復号して得られる復号Frame画像から、補間領域の画像を抽出する。Frame画像合成部305は、再生動画v10のFrame画像と、補間領域抽出部303が抽出した補間領域の画像と、補間座標計算部302が計算した変倍後の補間座標に基づいて合成する。
以上、実施例1に係る補間処理部218の機能構成例について説明した。次に、実施例1に係る補間動画生成部120の動作例について説明する。
[補間動画生成部の動作例]
図13〜15は、実施例1に係る補間動画生成部120の動作例を示す流れ図である。なお、実施例1に係る補間動画生成部120の構成は、図2に示したものと同一であるとする。以下、図13〜15を用いて、実施例1に係る補間動画生成部120の動作例について説明する。
補間指示部121に、補間指示が入力される(ステップS201)。補間指示部121は、高品質動画v11のFrame毎に補間指示の情報を取得し、全Frameの補間指示を、ファイルやデータベース、メモリ等の形で保持する。補間指示の情報は、Frame時刻、補間領域の(左上)座標、サイズ(幅、高さ)である。
補間指示部121に補間指示が入力されると、補間情報処理部123は、補間指示部121に入力される情報から、補間動画v12の動画面サイズ(幅MW、高さMH)を決定する(ステップS202)。
図14に示した流れ図は、図13のステップS202での補間情報処理部123の動作を詳細に示したものである。まず補間情報処理部123は、補間動画v12の動画面サイズ(幅MW、高さMH)をいずれも0に初期化する(ステップS211)。
補間情報処理部123は、続いて補間領域群の最大幅及び高さを求める。補間領域群の最大幅及び高さは、図17に示したようにして求められる。補間領域群の最大幅及び高さを求める際に、補間情報処理部123は、1Frame分の補間指示領域を補間指示部121から受け取る(ステップS212)。補間指示領域の幅をDW、高さをDHとする。続いて補間情報処理部123は、MWとDWの値、及びMHとDHの値を比較し、各々大きい方を新たなMW、MHとする(ステップS213)。すなわち、MW<DWならMW=DWに更新し、MH<DHならMH=DHに更新する。補間情報処理部123は、ステップS212、213の処理を高品質動画v11の最終Frameまで繰り返す。
ステップS212、213の処理が最終Frameまで繰り返されると、最終的に得られるMW、MHが、全Frameの補間領域群の中で、最大の幅及び高さである。補間情報処理部123は、MW、MHを補間動画v12の動画面サイズとし、補間情報i10に記録する(ステップS214)。
図13に戻って説明する。ステップS202で補間動画v12の動画面サイズが決まると、続いてFrame画像抽出部124は、補間動画v12の動画面サイズに従って高品質動画v11の各Frame画像から補間画像を抽出する(ステップS203)。
図15に示した流れ図は、図13のステップS203での処理を詳細に示したものである。復号部122は、高品質動画v11の1Frame分を復号し、復号されたFrame画像をFrame画像抽出部124へ送る。また復号したFrameの時刻(またはFrame番号)と、Frame画サイズ(幅HW、高さHH)を補間情報処理部123へ送る(ステップS221)。
補間情報処理部123は、補間指示部121から、復号したFrameの時刻に対応した補間領域指示情報を受け取る(ステップS222)。ここでは、指示された補間領域の(高品質動画v11の動画面上の)左上座標を[x,y]、幅をDW、高さをDHとする。
続いて補間情報処理部123は、高品質動画v11のFrame画像から補間動画v12の動画面として画像抽出する座標[xx,yy]を決定する(ステップS223)。画像抽出する座標[xx,yy]は図18に示したようにして決まる。補間領域指示座標[x,y]から補間動画v12の動画面サイズMW×MHを抽出する場合に、その補間動画v12の動画面の右下座標は[x+MW,y+MH]となる。補間情報処理部123は、補間動画v12の動画面の右下座標を、高品質動画v11の動画面サイズHW×HHと比較する。抽出領域の右端[x+MW]がHW以内ならxx=x、HWを越えていればxx=HW−MWとする。また抽出領域の下端[y+MH]がHH以内ならyy=y、HHを越えていればyy=HH−MHとする。
続いてFrame画像抽出部124は、ステップS223で決定した座標[xx,yy]と、補間動画v12の動画面サイズMWxMHを受け取り、高品質動画v11のFrame画像から、その座標及び動画面サイズで決まる領域の画素群を抽出する(ステップS224)。
そして、符号化部125は、ステップS224でFrame画像抽出部124が抽出した画素群を動画符号化し、補間動画v12を生成する(ステップS225)。補間動画v12を生成するための符号化については、上述したように図5のステップS104で触れられているので、詳細は省略する。
また、補間情報処理部123は、そのFrameの補間情報として、Frame時刻(Frame番号)、補間領域として指示された座標[x,y]及び補間領域のサイズDW×DH、Frame画像抽出部124が抽出した座標(補間動画v12の動画面座標[xx,yy])を補間情報i10に記録する(ステップS225)。
ステップS221〜S225の処理は、高品質動画v11の最終Frameまで繰り返される。
補間動画生成部120は、図13〜図15に示したような動作を実行することで、サイズが変化する補間領域群を全て包含し得る補間動画v12の動画面サイズを決定すると共に、サイズの情報を補間情報i10に記録して、高品質動画v11からその動画面サイズの補間動画v12を生成する。そして補間動画生成部120は、Frame毎に、抽出する座標(補間動画v12の動画面の座標)が高品質動画v11の動画面からはみ出ない様に調整し、本来の補間座標とサイズ、画素抽出した補間動画v12の動画面の座標を補間情報として記録する。補間動画生成部120が生成した補間動画v12及び補間情報i10は、ネットワーク等の伝送路を介して補間動画送出部130に送られる。
以上、実施例1に係る補間動画生成部120の動作例について説明した。実施例1に係る補間動画送出部130の動作は、図6及び図7に示した動作例と同一であるので、ここでは詳細な説明は省略する。続いて、実施例1に係る補間部210に含まれる補間処理部218の動作例について説明する。
[補間処理部の動作例]
図16は、実施例1に係る補間部210に含まれる補間処理部218の動作例を示す流れ図である。以下、図16を用いて実施例1に係る補間部210に含まれる補間処理部218の動作例について説明する。
図16に示したのは、図8のステップS133の補間処理を詳細に示したものである。再生動画v10を復号する復号部215は、再生動画v10を1Frame分復号し、復号Frame画像を生成する(ステップS231)。また復号部215は、今回復号したFrameのFrame時刻(Frame番号)を時刻制御部217へ伝える。
補間動画v12を復号する復号部216は、補間動画v12を1Frame分復号し、復号Frame画像を生成する(ステップS233)。また復号部216は、今回復号したFrameのFrame時刻(Frame番号)を時刻制御部217へ伝える。
時刻制御部217は、再生動画v10と補間動画v12のFrame時刻が同期するように時刻合わせを行う(ステップS231、S233)。
時刻制御部217によって、再生動画v10と補間動画v12のFrame時刻の同期が取れるようになると、続いて補間領域抽出部303は、補間動画v12のFrame画像から補間領域の画像を抽出する(ステップS234)。補間領域の画像の抽出は図19に示したように行われる。
補間領域抽出部303は、対象となっているFrame時刻の補間情報から、補間動画v12の座標[xx,yy]を取得する。これは補間動画生成部120が、高品質動画v11のFrame画像から画素を抽出した際の座標であり、補間動画v12の座標である。例えば、[xx:1820,yy:930]であるとする。
また補間領域抽出部303は、対象となっているFrame時刻の補間情報から、補間領域座標[x,y]を取得する。これは補間動画生成部120において補間指示された領域の座標である。例えば[x:1850,y:1000]。であるとする。
補間動画v12での、抽出すべき補間領域の座標は、補間動画v12の動画面の左上を基点にすると[x−xx,y−yy]であり、上述の例に照らし合わせると[x−xx,y−yy]=[30,70]となる。
そして補間領域抽出部303は、対象となっているFrame時刻の補間情報から、補間領域のサイズ(幅DW、高さDH)を取得する。例えばDW=50、DH=70であるとする。
最後に補間領域抽出部303は、補間動画v12の左上座標(上述の例では[30,70])から、補間領域のサイズ(DW=50、DH=70)の画素群を抽出する。
補間領域抽出部303が補間領域の画像を抽出すると、画像変倍部301、304は、再生動画v10と補間動画v12の復号Frame画像を基軸画サイズに合わせる様に拡大または縮小する(ステップS232、S235)。このステップS232、S235での処理は、図9でのステップS143、S146の処理と同一であるので、詳細な説明は省略する。
画像変倍部301、304が再生動画v10と補間動画v12の復号Frame画像を拡大または縮小すると、画像変倍部304は、Frame時刻毎の補間座標の数値も、ステップS232、S235と同様の方法で、基軸画サイズ上の座標、幅、高さに変倍する(ステップS236)。そしてFrame画像合成部305は、再生動画v10のFrame画像に、補間動画v12のFrame画像をオーバーレイ描画(画素を上書き)する(ステップS237)。
実施例1に係る補間部210に含まれる補間処理部218は、このように動作することで、補間領域のみを動画面とする補間動画v12を再生動画v10の動画面に補間合成する事が出来る。
補間領域のみを動画面とする補間動画v12を再生動画v10の動画面に補間合成する事により、補間動画v12の動画面は全Frameの補間領域群の全てを含みつつ、全Frameの補間領域群以外の領域を含まない最小の画サイズとなる。実施例1は、補間動画面の画素量を最小限に減らすことが出来る。また補間領域のサイズがFrame毎に変化する場合であっても、補間動画v12の動画面のサイズは変わらないため、既存の動画符号化処理及び復号処理を用いる事が出来る。
この実施例1は、補間動画v12は補間領域のみを含み、補間処理に必要ではない領域を含まないため、補間動画v12の画サイズを、元の高品質動画v11の画サイズより小さくする事が出来る。一般に、動画符号化方式では、画サイズが小さくなれば、(元の高品質動画v11と)同等の動画品質を維持するのに必要な符号化レートを小さくする事が出来るため、補間動画v12の符号化レートを下げる事ができる。従って実施例1では、高品質動画v11の画面全体を伝送する場合に比べて、補間動画v12の伝送レートを低減させる事ができる。また補間動画v12の画サイズが小さいため、補間部210の補間動画v12の復号処理の負担は抑えられる。
例えば、携帯機器やコンシューマ機器の中には、ハードウェアデコーダが一つしか搭載されていないものがある。この様な機器にこの実施例1を適用する場合、例えば、再生動画v10はハードウェアデコーダで復号し、画サイズが小さい補間動画v12はソフトウェア的にデコードする(例えばCPUの演算によりデコードする)というような復号処理の割り当てが可能である。補間動画v12の画サイズが小さいため、ソフトウェア的なデコードでも補間動画v12を復号可能である。
また上述の例では、一つの再生動画v10の補間処理時に補間動画v12が一つであった場合を説明したが、上述の本開示の一実施形態で説明したように、一つの再生動画v10に対して、同時に複数の補間動画v12が存在していても良い。例えば「スポーツX」という動画コンテンツの再生動画v10に対して、「選手A」と「選手B」という二つの補間動画のいずれも用いて補間処理をしてもよい。この場合は、補間部210の補間動画選択部214は、ユーザの指示や、ユーザの嗜好分析、ネット上の人気度などを用いた自動判断等により、補間動画送出部130に対して「選手A」と「選手B」の双方の補間動画v12及び補間情報i10の送出を要求する。補間部210は、複数の補間動画v12及び補間情報i10の受信に伴い、「選手A」と「選手B」の補間動画v12を同時に処理する。そして補間部210は、再生動画v10の動画面に対して、2つの補間動画v12から得られる補間領域画像を補間合成し得る。
<3.実施例2>
[概要]
続いて、本開示の一実施形態の実施例2について説明する。実施例1では、補間動画v12の動画面は補間領域のみに絞っているため、一つの再生動画v10に対して複数の補間領域(例えば「選手A」と「選手B」の2つの補間領域)がある場合には、補間領域毎に補間動画v12が分かれていた。そのため、補間部210は、一つの再生動画v10に対して複数の補間領域を処理する場合に、その補間領域の数だけ補間動画v12を復号していた。
以下で説明する実施例2では、複数の補間領域の画像を一つの補間動画v12に収める。これにより補間部210は、補間動画v12を一つ復号すれば、全ての補間領域の画像を抽出できる。
図24は、実施例2における補間動画v12の動画面と補間領域との関係例を示す説明図である。
実施例2では、補間動画v12の動画面の画サイズは、元の高品質動画v11の動画面と同じ画サイズとする。補間動画v12の動画面の画サイズを、元の高品質動画v11の動画面と同じ画サイズにすることにより、高品質動画v11の動画面における全ての補間領域を含有する領域が、補間動画v12で確保される。
そして、補間動画生成部120は、補間動画v12の各Frame画像を作るにあたって、補間領域の部分だけ、高品質動画v11のFrame画像で該当する領域の画素群を配置する。ここで配置される座標は、高品質動画v11の動画面上の座標(すなわち補間動画v12の動画面上の座標)となる。補間動画生成部120は、補間動画Frameの補間領域以外の領域を無効画素で埋める。
本実施例2では、無効画素とは、補間部210での補間画像の抽出時に破棄される様に、予め決められた画素値を持つ画素のことをいう。例えば、輝度+色差(YCbCr等)の値域外の値だったり、RGBA(赤緑青+アルファ値)の透明度が最大となる値だったり、または全Frameに渡って全く現れない画素値が選択されたり、特定の画素値が無効画素値として決められても良い。この無効画素値は、変化しない固定値とする。
この結果、補間動画v12のFrame画像は、補間領域にだけ高品質動画v11の該当領域から取得した有効画素群が配置され、それ以外の領域は無効画素群で埋められたFrame画像となる。そして補間情報i10として、そのFrame内の矩形の補間領域の座標が補間領域の数だけ記述される。図24の例では、あるFrameに3つの補間領域が配置され、補間情報i10にも3つの矩形の補間領域の座標が記述される。この補間領域の座標、幅及び高さは、元の高品質動画v11の動画面上のものであるとともに、補間動画v12の動画面上の物でもある。何故ならば、本実施例では補間動画v12の動画面の画サイズは、元の高品質動画v11の動画面と同じ画サイズと同じだからである。
補間動画生成部120は、この補間動画v12を符号化する時に、画サイズは高品質動画v11と同じ(図24の例では1920×1080)であっても、符号化レートは高品質動画v11の符号化レートよりも低いレートで符号化しても、画像品質を維持できる。なぜなら、Frame画像中で無効画素の部分は固定値のため、近接のマクロブロック間やFrame間で変化が無いので、符号化後の情報量が激減するからである。符号化後の情報の大部分は、画像が変化する補間領域部分の情報のみとなる。よって、符号化レートは、全Frameの中で、Frame内の補間領域群の合計画素数が最大となる最大補間領域面積を基にして決定しても、符号化後の動画の品質は維持される。
例えば図24の例では、3つの補間領域の内、四角形の補間領域は200×100=20000画素、三角形の補間領域は150×200/2=15000画素、円形の補間領域は80×80×π=約20000画素であり、3つの補間領域の画素の合計は約55000画素である。元の高品質動画v11は1920×1080=2073600画素なので、画素数比は55000÷2073600=約2.7%となる。
例えば高品質動画v11が4Mbpsで符号化されていた場合、単純な面積比で考えるなら、補間動画生成部120は、4Mbps×2.7%=約100Kbpsで符号化しても、補間動画v12は高品質動画v11と同等の品質が期待できる。また、符号化レートを低くすることでノイズが出る場合には、補間動画生成部120は、符号化方式のS/N比特性を基にしたり、符号化レートに下限を設けたりし得る。この様に、補間動画v12の画サイズが元の高品質動画v11と同じでも、有効画素数は少ないため、補間動画生成部120は、Frame内の有効画素数(補間領域の画素数)を基にした低い符号化レートで補間動画v12を符号化できる。
補間部210の概要についても図24を用いて説明する。
補間部210は、補間領域の画像を抽出する際に、まず補間動画v12を1Frame分復号する。上述した通り、補間領域の数に関係なく、補間部210は補間動画v12を1Frame復号すれば全ての補間領域の画像を抽出できる。
そして補間部210は、補間動画v12のFrame画像から、補間情報i10を基に補間領域を含む矩形画像を抽出する。補間情報i10に記された座標、幅、高さは、元の高品質動画v11の座標かつ補間動画v12の動画面上の座標である。何故ならば、本実施例では補間動画v12の動画面の画サイズは、元の高品質動画v11の動画面と同じ画サイズと同じだからである。つまり補間情報i10に記された座標は、補間動画v12の動画面から抽出すべき座標で、かつ補間処理時に補間画像を配置する(高品質画v11の画面上の)座標でもある。
そして補間部210は、抽出した矩形画像に無効画素が含まれていれば、その無効画素の部分を破棄し、残った有効画素群だけを再生動画v10の動画面に補間合成する。この様に、補間動画v12から抽出した矩形画像の内、無効画素を除去する事で、本実施例は図24に示すように非矩形の補間領域も表現できる。例えば、補間部210は、選手の人型や人物の顔の輪郭等に沿った形状の補間画像を抽出できる。
以上、本開示の一実施形態の実施例2の概要について説明した。次に、実施例2に係る補間動画生成部120の動作例について説明する。
[補間動画生成部の動作例]
図20〜図22は、実施例2に係る補間動画生成部120の動作例を示す流れ図である。なお、実施例2に係る補間動画生成部120の構成は、図2に示したものと同一であるとする。以下、図20〜図22を用いて、実施例2に係る補間動画生成部120の動作例について説明する。
補間指示部121に、補間指示が入力される(ステップS301)。補間指示部121は、高品質動画v11のFrame毎に補間指示の情報を取得し、全Frameの補間指示を、ファイルやデータベース、メモリ等の形で保持する。補間指示の情報は、Frame時刻、補間領域の(左上)座標、サイズ(幅、高さ)である。本実施例では、1つのFrameに対して複数の領域に対する補間指示が入力されても良い。
補間指示部121に補間指示が入力されると、補間情報処理部123は、高画質動画v11のFrame群の中で、Frame内の補間領域の面積(画素数)が最大の物を求め、補間動画v12の符号化レートを決定する(ステップS302)。
図21は、ステップS302のFrame内の補間領域の面積(画素数)が最大の物を求める際の動作を詳細に示す流れ図である。
補間情報処理部123は、まず最大補間面積を0で初期化する(ステップS311)。続いて補間情報処理部123は、1Frame分の補間領域群を補間指示部121から取得する(ステップS312)。
続いて補間情報処理部123は、Frame内の各補間領域の面積(画素数)を計算し、その総和をそのFrameの補間領域面積(画素数)とする(ステップS313)。なお、補間領域間で重なり合う部分がある場合は、補間情報処理部123は、その重なり合う部分は重複せずに計算してもよい。ステップS313で求められる面積を補間面積とも称する。
続いて補間情報処理部123は、最大補間面積と、ステップS313で求めた補間面積とを比較し、ステップS313で求めた補間面積の方は大きければ、最大補間面積をステップS313で求めた補間面積の値に更新する(ステップS314)。
補間情報処理部123は、最後のFrameこのステップS312〜ステップS314の処理を繰返す(ステップS315)。最後のFrameまで処理が完了すると、補間情報処理部123は、最大補間面積と、元の高品質動画v11の面積及び符号化レートから、補間動画v12の符号化レートを決定する(ステップS316)。補間情報処理部123は、上述した様に、高品質動画v11の面積と最大補間面積との比を用いて符号化レートを決定してもよいし、符号化方式のS/N比に沿って非線形に計算してもよいし、符号化レートの最低値を設けてもよい。
図20に戻って説明する。補間動画v12の符号化レートが決定されると、Frame画像抽出部124は、高品質動画v11から補間動画v12を生成する(ステップS303)。
図22は、ステップS303の高品質動画v11から補間動画v12を生成する際の動作を詳細に示す流れ図である。
復号部122は、高品質動画v11を1Frame分復号する(ステップS321)。高品質動画v11の画サイズを、幅HW、高さHHとする。復号部122が高品質動画v11を1Frame分復号すると、続いてFrame画像抽出部124は、補間動画v12のためにFrameバッファを用意する(ステップS322)。そのFrameバッファの画サイズの幅MW及び高さMHは、高品質動画v11の画サイズ(幅HW、高さHH)と同じとする。またFrame画像抽出部124は、用意したFrameバッファを無効画素で埋める。Frame画像抽出部124は、そのFrameで指示された補間領域の数だけ、Frameバッファに補間領域の画素群を配置する。
Frameバッファを用意し、無効画素でFrameバッファを埋めると、続いてFrame画像抽出部124は、補間情報処理部123から、補間指示された領域を受け取る(ステップS323)。
Frame画像抽出部124は、補間指示された領域を補間情報処理部123から受け取ると、ステップS321の復号処理により得られる高品質動画v11のFrame画像から、指示された領域の画素群を抽出し、補間領域用のFrameバッファに配置する(ステップS324)。その配置の際の座標、幅及び高さは、高品質動画v11での値と同じとする。
Frame画像抽出部124は、ステップS324の処理を、そのFrameで指示された補間領域の数だけ繰り返す(ステップS325)。ステップS324の処理を、そのFrameで指示された補間領域の数だけ繰り返すと、符号化部125は、1Frame分の後処理を行って補間動画v12を生成する(ステップS326)。
Frame画像抽出部124が生成したFrameバッファには、補間領域群には高品質動画v11の画素群が、それ以外の領域には無効画素群が配置されている。符号化部125は、このFrameバッファをステップS302で求められた符号化レートで符号化し、補間動画v12を生成する。
補間情報処理部123は、このFrameの補間領域の情報を、補間情報i10に記録する。その記録される情報は、Frame時刻(またはFrame番号)と、矩形の補間領域の座標、幅、高さである。これらの値は高品質動画v11の動画面上の値であるとともに、補間動画v12の動画面上の値でもある。1Frame内に複数の補間領域がある場合には、補間情報処理部123は、図24に補間情報i10として示されているように、それら複数の補間領域についての情報を列挙して記録する。
ステップS321〜S326の処理は、最後のFrameまで繰り返される。
実施例2に係る補間動画生成部120は、図20〜図22に示したような動作を実行することで、補間領域には高品質動画v11の画素群が、それ以外の領域には無効画素が配置された補間動画v12と、Frame毎に1つ又は複数の補間領域の情報が記述された補間情報i10を作成することが出来る。補間動画生成部120で生成された補間動画v12及び補間情報i10は、補間動画送出部130へ送られて、保存される。
以上、図20〜図22を用いて、実施例2に係る補間動画生成部120の動作例について説明した。実施例2に係る補間動画送出部130の動作は、図6及び図7に示した動作例と同一であるので、ここでは詳細な説明は省略する。続いて、実施例2に係る補間部210の動作例について説明する。
[補間部の動作例]
図23は、実施例2に係る補間部210の動作例を示す流れ図である。なお、実施例2に係る補間部210の構成は、図4に示したものと同一であるとする。以下、図23を用いて実施例2に係る補間部210の動作例について説明する。
図23に示したのは、図8のステップS133の補間処理を詳細に示したものである。再生動画v10を復号する復号部215は、再生動画v10を1Frame分復号し、復号Frame画像を生成する(ステップS331)。また復号部215は、今回復号したFrameのFrame時刻(Frame番号)を時刻制御部217へ伝える。
補間動画v12を復号する復号部216は、補間動画v12を1Frame分復号し、復号Frame画像を生成する(ステップS333)。また復号部216は、今回復号したFrameのFrame時刻(Frame番号)を時刻制御部217へ伝える。
時刻制御部217は、再生動画v10と補間動画v12のFrame時刻が同期するように時刻合わせを行う(ステップS331、S333)。
時刻制御部217によって、再生動画v10と補間動画v12のFrame時刻の同期が取れるようになると、続いて補間領域抽出部303は、補間動画v12のFrame画像から補間領域の画像を抽出する。この補間領域の画像の抽出は以下のように行われる。
補間領域抽出部303は、抽出対象のFrameのFrame時刻の補間情報から、補間領域の座標[x,y]、幅MW、高さMHを取得し、補間動画v12のFrame画像から該領域の画素群を抽出する(ステップS334)。
続いて補間領域抽出部303は、抽出した画素群(補間画像)から、無効画素群を破棄する(ステップS335)。例えば、処理対象の画像の画像フォーマットがアルファチャンネルを持つ画像フォーマットなら、補間領域抽出部303は、抽出した画素群(補間画像)に対して透過度を最大にする。また例えば、処理対象の画像の画像フォーマットがアルファチャンネルを持たない画像フォーマットなら、後で補間合成する際に無効画素はスキップする。
補間領域抽出部303が補間領域の画像を抽出すると、画像変倍部301、304は、再生動画v10と補間動画v12の復号Frame画像を基軸画サイズに合わせる様に拡大または縮小する(ステップS332、S336)。このステップS332、S336での処理は、図9でのステップS143、S146の処理と同一であるので、詳細な説明は省略する。
画像変倍部301、304が再生動画v10と補間動画v12の復号Frame画像を拡大または縮小すると、画像変倍部304は、Frame時刻毎の補間座標の数値も、ステップS332、S336と同様の方法で、基軸画サイズ上の座標、幅、高さに変倍する(ステップS337)。
上記ステップS334〜S337の処理は、その処理対象のFrameの全ての補間領域に対して繰り返される(ステップS338)。
Frame画像合成部305は、基軸画サイズの座標系に変倍された再生動画v10のFrame画像に、同じく基軸画サイズの座標系に変倍された補間動画v12のFrame画像をオーバーレイ描画(画素を上書き)する(ステップS339)。補間領域が複数ある場合は、Frame画像合成部305はその補間領域の数だけオーバーレイ描画(画素を上書き)する。ステップS335について述べた様に、Frame画像のフォーマットによっては、Frame画像合成部305は、このステップS339での描画の段階で無効画素はスキップし、有効画素だけ画素合成してもよい。
実施例2に係る補間部210に含まれる補間処理部218は、このように動作することで、1つのFrameに補間領域が複数存在していた場合でも、補間領域のみを動画面とする補間動画v12を再生動画v10の動画面に補間合成する事が出来る。
本実施例2では、1つのFrameに補間領域が複数あっても、補間動画v12は一つにまとめられ、また符号化レートは高画質動画v11に比べ、補間領域の面積に応じて低減できる。例えば携帯機器やコンシューマ機器は、ハードウェア能力の向上によって、2動画の同時ハードウェアデコードが可能になりつつある。そのような構成を有する機器は、再生動画v10と、本実施例2での補間動画v12の2つを同時にハードウェアデコードする様に構成する事で、ハードウェアデコード群を有効活用しながら、複数の補間領域で再生動画v10を補間する事が出来る。
1つの動画コンテンツに対して、複数の補間動画v12を作成してもよい。例えば、「スポーツX」の動画コンテンツに対して、「選手A」のみの補間動画v12、「選手A+選手B」の補間動画v12等が作成されていても良い。1つの動画コンテンツに対して、複数の補間動画v12を作成する場合、補間部210の補間動画選択部214は、補間名称を列挙してユーザに補間動画v12を選択させたり、視聴者の嗜好やインターネット上の人気度から補間動画v12を自動選択したり、ユーザに推薦したりしてもよい。
また、本実施例2では、1つの補間動画v12に複数の補間領域を含んではいるが、補間部210は、複数の補間動画v12を同時に用いて補間処理を実行してもよい。例えばあるスポーツ動画のコンテンツで選手が10人いる時、2〜3人の選手の補間領域群を含む補間動画を補間動画生成部120で予め複数作成しておく。補間部210は、その内の「選手A,選手B」についての補間動画v12と「選手M,選手N」の補間動画v12とを同時に補間処理してもよい。
また、上記実施例2では、補間情報i10を用いて補間動画v12の各Frame画面上の補間領域の座標、幅、高さを記していたが、この補間情報i10を無くしても良い。補間情報i10を無くす場合、補間動画生成部120は補間動画v12だけを生成し、補間情報i10は生成しない。補間動画送出部も補間動画v12のみを保持し、再生装置200へ送出する。
そして補間情報i10を無くす場合、補間部210の補間処理部218は、復号された補間動画v12のFrame画像に対して、全画素を走査して有効画素のみを抽出する。補間動画v12のFrame画像からの補間画像の抽出をハードウェアが行う場合には、全画素を走査して有効画素のみを抽出する方が、回路の単純化や高速化となる場合もあり得る。一方、補間動画v12のFrame画像からの補間画像の抽出をプログラムで行う場合は、予め画素抽出すべき矩形情報が与えられた方が処理の最適化を行える場合もあり得る。なお、基軸画サイズへの変換に必要な元高品質動画v11の動画面サイズは、補間情報i10から得なくても、補間動画v12の動画面サイズで代用する事が出来る。本実施例2では、元高品質動画v11の動画面サイズと補間動画v12の動画面サイズとが同じ画サイズだからである。
以上の様に、補間動画v12に複数の補間領域を埋め込み、補間領域以外の領域を無効画素で埋める事で、本実施例2は補間領域が複数あっても、一つの補間動画v12の復号だけで良いという利点を有する。特に、上記の様に同時に二つの動画を同時にハードウェアデコードできる機器で補間処理を実行する場合にはその能力を活用できる。また本実施例2は、非矩形の補間領域も表現できる。補間処理時に無効画素を破棄するため、補間動画面v12が矩形でも、補間に使用する(無効画素を破棄した後の)補間画像は任意の形状になる。例えば、補間領域を選手の人型に合わせたり、顔認識した結果の人間の顔の形に合わせたりする事ができ、本実施例は、より自然な補間処理を行うことができる。
なお、この実施例2の内容を実施例1に適用することも可能である。実施例2の内容を実施例1に適用することで、実施例1について、上述の非矩形の補間領域を表現できる、非補間領域の情報量を減らす事が出来る、補間動画面の座標を個別管理する必要が無くなる等の効果が加わる。
図26は、実施例2の内容を実施例1に適用した際の効果を示す説明図である。実施例2の内容を実施例1に適用することで、本実施形態に係る動画像再生システム1は、Frame0で示すように、非矩形の補間領域を表現できる。実施例1では、補間領域のみを補間動画v12としていた。実施例2の内容を実施例1に適用することで、本実施形態に係る動画像再生システム1は、補間動画v12の動画面に無効画素を配置して、補間部210による補間合成時に、任意の形状の補間領域を補間合成できる様になる。
図26のFrame0の例では、円形の補間領域を表現するために、円形の補間領域を含む矩形を補間動画v12の動画面とし、円形の補間領域以外の部分は無効画素で埋められている。実施例2の内容を実施例1に適用することで、本実施形態に係る動画像再生システム1は、補間部210の補間合成時に無効画素を除去する事で、円形の補間領域を補間合成できる。
実施例2の内容を実施例1に適用することで、本実施形態に係る動画像再生システム1は、Frame1に示すように、非補間領域の情報量を減らす事が出来る。実施例1では、図17で説明した様に、補間領域の画サイズはFrame毎に変化し、一方で補間動画v12の動画面の画サイズは固定であった。そのため実施例1では、補間動画v12の動画面の画サイズは全Frameの補間領域群の、最大幅×最大高であった。そのため、あるFrameの補間領域のサイズが小さくても、補間動画v12の当該Frameには、はその小さな補間領域以外の画素情報も付与されていた。
実施例2の内容を実施例1に適用することで、本実施形態に係る動画像再生システム1は、補間動画v12の各Frame画像において、そのFrameの補間領域以外を無効画素にする事で、無効画素部分は値が変化しないため、Frameの動画符号化時に情報量を減らす事が出来る。
図26のFrame1の例では、補間動画v12の動画面は、全Frameの最大幅及び高さであるMW=100、MH=100の画サイズを有している。本実施形態に係る動画像再生システム1は、あるFrameの補間領域がその画サイズより小さい幅50×高さ60である場合、補間領域以外の領域を無効画素で埋める事で、そのFrameを符号化する時の情報量を減らすことができる。
実施例2の内容を実施例1に適用することで、本実施形態に係る動画像再生システム1は、Frame2に示すように、補間動画面の座標を個別管理する必要が無くなる。実施例1では、図18で説明した様に、高品質動画v11の動画面上において補間領域が右端や下端に位置する場合、補間動画v12の動画面の画サイズを固定にしているために補間動画v12の動画面が高品質動画v11の動画面からはみ出る場合があった。そのため、補間動画v12の動画面を左や上にずらして補間動画v12の動画面が高品質動画v11の動画面からはみ出ない様にするために、補間領域の座標と補間動画v12の動画面の座標を個別に管理していた。
実施例2の内容を実施例1に適用することで、本実施形態に係る動画像再生システム1は、補間動画v12の動画面が高品質動画v11の動画面からはみ出る場合でも、はみ出る領域に無効画素を埋める事で、補間動画v12を動画面の画サイズを固定しつつ、補間動画v12を動画面と補間領域の座標とを一元化することが出来る様になる。
図26のFrame2の例では、補間動画v12の動画面の画サイズがMW=100×MH=100であるのに対して、補間領域の座標が[1840×1000]である。この状態で100×100の画素群をそのまま抽出すると補間動画v12の動画面が高品質動画v11の動画面からはみ出してしまう。そこで本実施形態に係る動画像再生システム1は、はみ出す領域(すなわち、補間領域以外の領域)は高品質動画v11の動画面の画素群は参照しない事で、補間動画v12の動画面の座標は補間領域の座標からずらす必要が無く、単一の座標を管理するだけで済む。
図25は、実施例2の内容を実施例1に適用した場合の補間動画生成部120の動作例を示す流れ図である。図25に示したのは、高品質動画v11から補間動画v12の動画面の画像を抽出する際の、補間動画生成部120の動作例である。
まず、図15のステップS221同様に、復号部122は、高品質動画v11の1Frame分を復号し、復号されたFrame画像をFrame画像抽出部124へ送る。また復号したFrameの時刻(またはFrame番号)と、Frame画サイズ(幅HW、高さHH)を補間情報処理部123へ送る(ステップS341)。
補間情報処理部123は、補間指示部121から、復号したFrameの時刻に対応した補間領域指示情報を受け取る(ステップS342)。ここでは、指示された補間領域の(高品質動画v11の動画面上の)左上座標を[x,y]、幅をDW、高さをDHとする。
続いてFrame画像抽出部124は、補間動画v12の動画面のFrameバッファを用意する。そのFrameバッファの幅MWと高MHは、図13のステップS202で決定した画サイズである。そしてFrame画像抽出部124は、そのFrameバッファを無効画素で埋める(ステップS343)。
続いてFrame画像抽出部124は、高品質動画v11から補間領域の画素群を抽出し、補間動画v12の動画面のFrameバッファに配置する(ステップS344)。Frame画像抽出部124は、高品質動画像の座標[x,y]、サイズ(幅DW×高さDH)の画素群を抽出する。そしてFrame画像抽出部124は、補間動画v12の動画面のFrameバッファの座標[0,0]から、抽出した画素群を配置する。
これにより、補間動画v12の幅MW×高さMHの動画面上で、補間領域(幅DW×高さDH)には有効画素、それ以外の領域には無効画素が配置され、画サイズとしては幅MW×高さMHで固定された補間動画v12の動画面のFrame画像が作られる。
続いて符号化部125は、ステップS344で生成された補間動画v12の動画面のFrame画像を動画符号化する(ステップS345)。ステップS345での符号化レートは、全Frameの補間領域群の中で最大補間面積のものと、元の高品質動画の面積&符号化レートから決定する。上述したように、符号化部125は、面積比でレートを決定してもよいし、符号化方式のS/N比に沿って非線形に計算してもよいし、最低符号化レートを設けてもよい。実施例1では補間動画面積を用いていたが、実施例2を実施例1に適用すると、その動画面内に収まっている補間領域の面積を用いることができるので、符号化レートは更に下げられる。
また、補間情報i10として、Frame時刻(またはFrame番号)、補間領域の座標[x,y]及びサイズDW×DHを記述する。補間動画v12の動画面と補間領域の左上座標は同一なので、実施例1とは異なり補間動画面の座標を別途記述しなくてもよい。
なお補間情報i10にはサイズDW×DHの記述が省略されてもよい。補間処理部218は、サイズの情報が無くても、補間動画v12の動画面のFrame画像から無効画素を破棄すれば有効画素だけを抽出できる。実施例2と同様、補間動画v12のFrame画像からの補間画像の抽出をハードウェアで行う場合には、単純な画素走査の方が回路の単純化を行い得るし、ソフトウェアで行う場合には、予め矩形情報が与えられた方が処理を最適化でき得る。
このように、実施例1に実施例2を適用することで、本実施形態に係る動画像再生システム1は、非矩形な補間領域を表現したり、非補間領域の情報量を減らして符号化効率を上げたり、補間動画と補間領域の座標を一元管理できる様になる。
<4.実施例3>
[概要]
続いて、本開示の一実施形態にかかる動画像再生システム1のさらに別の実施例について説明する。本実施例3は、補間動画v12を補間指示毎に作成するのではなく、高品質動画v11の画面領域を例えばタイル状に複数に分割し、各タイル矩形(分割画面)を動画面とした分割画面動画群として予め用意し、これを補間動画v12とする。そして補間指示からは、Frame毎の補間領域を記録した補間情報i10だけを生成する。補間部210では、補間領域に対応する分割画面動画(補間動画v12)群を取得して、分割画面動画群から補間領域の画素群を抽出し、補間合成する。
この実施例3により、本開示の一実施形態にかかる動画像再生システム1は、補間動画の数を常に一定にすることができる、補間指示に関係なく事前に補間動画v12を生成しておける、補間領域に該当する補間動画をすぐに取得できる等の効果を奏する。
図32〜図34は、実施例3の動作の概要を示す説明図である。
補間動画生成部120は、図32に示すように、補間指示の有無に関係なく、予め高品質動画v11の画面を複数の部分画面に分割する。ここでは説明上、画面分割した個々の矩形の部分画面を「タイル」と称する。つまり補間動画生成部120は、高品質動画v11の画面を横TX個×縦TY個のタイルに分割する。
そして補間動画生成部120は、高品質動画v11の全Frameに対して、個々のタイル毎に動画符号化して分割画面動画群を生成し、これを補間動画v12の群として扱う。画面がTX個×TY個に分割されていれば、TX×TY個の分割画面動画(補間動画)が補間動画生成部120によって生成され、個々の補間動画v12は元の高品質動画面v11の対応するタイルの領域を動画面としている。
例えば図32に示すように、元の高品質動画v11の画サイズが1024×768で、画面分割数を横4×縦3とすると、高品質動画v11の動画面は4×3=12個のタイルに分割され、分割画面動画(=補間動画)も12個生成される。また各タイルの画サイズは横1024/4=256、縦768/3=256となり、分割画面動画(補間動画v12)群は、各タイル領域を動画面とし、画サイズはそのタイルの画サイズとなる。
以下では、説明のために各タイルの左端から0,1,2,3、上端から0,1,2と順番に番号を振って、個々のタイル及び分割画面動画(補間動画)に番号を付加しておく。例えば左上のタイル(分割画面動画)は<横0,縦0>、右下のタイル(分割画面動画)は<横3,縦2>とする。
実施例1や実施例2と異なるのは、この補間動画v12の群は高品質動画v11の動画面を個定数で画面分割した物であり、補間指示には関係なく独立して、補間動画生成部120で予め生成できる点である。
補間情報i10には、上述の実施例同様に、Frame時刻(またはFrame番号)と、そのFrameの補間座標、幅、高さが列挙して記述される。本実施例3では、その補間情報i10とペアとなる、その補間情報専用の補間動画v12は無く、上記の分割画面動画群を補間動画v12(の群)とする。一つの動画コンテンツ(高品質動画v11)に対して複数の補間情報i10があっても、分割画面動画群は一セットのみで、各補間情報i10で情報が共有される。
一方、補間部210は、補間動画送出部130から補間情報i10とともに、補間動画v12となる分割画面動画群の情報を取得する。分割画面動画群の情報には、元の高品質動画v11の画サイズ、横及び縦の分割数、各分割画面動画の場所(例えばURL)等がある。補間動画送出部130から送出されるこれらの情報により、補間部210は画面上のどの座標がどのタイルに属するかを知る事が出来る。
図33は、補間領域が1つのタイルに全て含まれている場合の、補間部210での合成処理を示したものである。補間部210は、補間情報i10から、あるFrame(0番目のFrame)の補間領域情報(座標、幅、高さ)を取得する。例えば図32に示すように、0番目のFrameの補間領域の座標が[260,600]であり、幅100、高さ100であるとする。補間部210は、分割画面動画群の情報から、座標[260,600]はタイル<1,2>に属すると判定できる。また補間領域の右下は[360,700]であり、これもタイル<1,2>の領域なので、補間部210は、補間領域の画像はタイル<1,2>の分割動画から全て取得できる事が解る。
そこで補間部210は、補間動画送出部130から、タイル<1,2>の分割画面動画を取得し、取得したタイル<1,2>の分割画面動画を復号して、0番目のFrameのFrame画像を得る。タイル<1,2>は、高品質動画v11の[256,512]からの256x256サイズの領域である。補間部210は、このFrame画像内の、[260−256,600−512]の座標で100×100の画素群を抽出して、再生動画v10へ補間合成する。
図34は、補間領域が複数のタイルにまたがっている場合の、補間部210での合成処理を示したものである。補間部210は、補間情報i10から、あるFrame(1番目のFrame)の補間領域情報(座標、幅、高さ)を取得する。例えば図32に示すように、1番目のFrameの補間領域の座標が[450,550]であり、幅100、高さ100のサイズであるとする。補間部210は、分割画面動画群の情報から、補間領域の左上はタイル<1,2>の領域にあるが、右下[550,650]はタイル<2,2>の領域にあると判定できる。つまりこの補間領域は、タイル<1,2>とタイル<2,2>にまたがっている。そこで補間部210は、補間動画送出部130から、タイル<1,2>の分割画面動画に加えてタイル<2,2>の分割画面動画も取得する。タイル<2,2>は元の高品質動画の[512,512]からの256×256サイズの領域である。
そして補間部210は、タイル<1,2>とタイル<2,2>の2つの分割画面動画を復号して、1番目のFrameのFrame画像を得る。図34に示すように、タイル<1,2>には補間領域の左側部分が存在し、補間領域として座標[450,550]から幅100、高さ100の領域を抽出する場合を考える。補間部210は、Frame画像内の座標[補間領域左450−タイル左256,補間領域上550−タイル上512]=[194,38]、幅(タイル右512−補間領域左450)×高さ100のサイズで補間領域の左側を抽出できる。またタイル<2,2>には補間領域の右側部分があり、補間部210は、Frame画像内の座標[0,38]から幅(補間領域右(450+100)−タイル左512)×高さ100のサイズで抽出できる。補間部210は、上記2つの領域から画素群を取得し、横につなぎ合わせることで、2つのタイルのFrame画像から補間領域画像を生成する事が出来る。補間部210は、生成した補間領域画像を再生動画v10の補間合成に用いる。
この様に、補間部210は、補間情報i10とペアになる(その補間情報i10専用の)補間動画v12を用いるのではなく、どの補間情報i10であっても同じ分割画面動画群を用い、補間領域の座標、幅、高さから、その補間領域が属するタイルに対応する分割画面動画群を取得し、そのFrame画像群から補間領域分の画素群を抽出する。
[補間動画生成部の機能構成例]
続いて、実施例3に係る補間動画生成部120の機能構成例を説明する。図27は、本開示の一実施形態の実施例3に係る補間動画生成部120の機能構成例を示す説明図である。
上記実施例1、2とは異なり、本実施例3では、補間動画v12は補間指示毎に作られるのではなく、指定された画面分割数で予め高品質動画v11の動画面を分割し、分割した各タイルを動画面とする補間動画v12の群が、補間指示とは独立して生成される。補間情報i10は、上記実施例1、2と同様に補間指示部121から生成され、各Frameの補間領域の座標やサイズが記録される。
従って、本実施例3では、上記実施例1、2とは異なり、補間指示部121からの補間情報はFrame画像抽出部124には送られない。また実施例3に係る補間動画生成部120は、Frame画像抽出部124に替わりFrame画像分割部126を含んで構成される。Frame画像分割部126は、指定された画面分割数で高品質動画v11の動画面を分割する。Frame画像分割部126により分割された高品質動画v11は、符号化部125で符号化されることで各タイルを動画面とする補間動画v12の群となる。
[補間動画送出部の機能構成例]
続いて、実施例3に係る補間動画送出部130の機能構成例を説明する。図28は、本開示の一実施形態の実施例3に係る補間動画送出部130の機能構成例を示す説明図である。
実施例3に係る補間動画送出部130の構成は、上記実施例1、2に係る補間動画送出部130の構成と違いはない。ただ、補間記録部132での補間動画v12と補間情報i10の管理形態が異なる。実施例3に係る補間動画送出部130の補間記録部132は、補間動画v12と補間情報i10とをペアにして管理するのではなく、動画コンテンツに対して補間動画v12の群(分割画面動画群)を対応付けて管理する。
例えば補間記録部132は、[動画コンテンツX]に対して、横TX=4×縦TY=3の12分割された補間動画v12の群を[動画コンテンツX]に対応付けて管理して保持する。補間記録部132は、補間動画v12の群を[動画コンテンツX]に対応付けて管理して保持するのに並行して、補間情報i10を、同じく[動画コンテンツX]に対応付けて管理する。
例えば図3に示したように、[選手A]の補間指示と[選手B]の補間指示があった場合は、補間記録部132は双方の選手の補間情報i10を管理して保持する。補間記録部132が管理する情報には、画面分割数、各タイルに対応する補間動画v12の保存場所(例えばURL等)が追加される。補間記録部132が管理するこれらの情報は、補間部210での補間処理時に補間部210へ送られる。補間部210は、補間領域に対応する補間動画v12の選別に、画面分割数、各タイルに対応する補間動画v12の保存場所(例えばURL等)の情報も用いる。
[補間部の機能構成例]
続いて実施例3に係る補間部210の機能構成例について説明する。図29は、本開示の一実施形態の実施例3に係る補間部210の機能構成例を示す説明図である。
実施例3に係る補間部210の構成は、図4に示した本開示の一実施形態に係る補間部210の構成と違いはない。ただ、補間処理部218での処理内容が異なる。本実施例3では、補間処理部218は、補間情報i10から得られるFrame画像内の補間領域を基に、その補間領域に対応するタイルの補間動画v12(一つまたは複数)を決定し、補間動画送出部130からその補間動画v12(一つまたは複数)を送出する様に、受信部212に指示する処理が加わる。
[補間動画生成部の動作例]
続いて、実施例3に係る補間動画生成部120の動作例を説明する。図30は、本開示の一実施形態の実施例3に係る補間動画生成部120の動作例を示す説明図である。
復号部122が高品質動画v11を1Frame分復号する(ステップS401)。高品質動画v11の画サイズを、幅HW×高HHとする。また、予め指定された画面分割数を、横TX×縦TYとする。画面分割する各タイルの画サイズは、幅TW=HW/TX、高さTH=HH/TYとなる。
ステップS401で復号部122が高品質動画v11を1Frame分復号すると、続いてFrame画像分割部126が、復号後のFrame画像を横TX×縦TY個のタイルに分割する。まずFrame画像分割部126は、タイル行カウンタyを初期化(例えば0で初期化)する(ステップS402)。
続いてFrame画像分割部126は、1水平ライン分のタイルを生成する。Frame画像分割部126は、タイル列カウンタxを初期化(例えば0で初期化)する(ステップS403)。
続いてFrame画像分割部126は、タイル<x,y>の画素群を抽出する。具体的には、Frame画像分割部126は、座標[x×TW,y×TH]から、領域サイズ(幅TW×高TH)分の画素群を、ステップS401で復号部122が復号した高画質動画v11のFrame画像から抽出する。Frame画像分割部126が画素群を抽出すると、続いて符号化部125は、タイル<x,y>の分割画面動画(補間動画v12)として動画符号化する(ステップS404)。
符号化部125が上記ステップS404で符号化すると、続いてFrame画像分割部126はタイル列カウンタxを1増やす(ステップS405)。Frame画像分割部126は、xが横分割数TXを超えたかどうか判断し(ステップS406)、超えていなければ、上記ステップS404、S405の処理を繰り返し、1水平ライン分のタイルの分割画面動画(補間動画v12)を生成する。
xが横分割数TXを超えると、続いて符号化部125はタイル行カウンタyを1増やす(ステップS407)。Frame画像分割部126は、yが縦分割数TYを超えたかどうか判断し(ステップS408)、超えていなければステップS403に戻る。yが縦分割数TYを超えたら、Frame画像分割部126はそのFrame画像に対する分割処理を終了する。補間動画生成部120は、全てのFrameに対して図30に示した処理を実行する。
補間動画生成部120は、図30に示した動作を実行することで、高品質動画v11の動画面に対して、横TX個×縦TY個に分割した各タイルを動画面とする、分割画面動画(補間動画v12の群)を生成することが出来る。また補間動画生成部120は、図30に示した動作と並行し、上述したように、補間指示部121の補間指示から補間情報i10を生成する。上述したように、本実施例3では、補間指示とペアとなる補間動画v12は生成されない。
以上、実施例3に係る補間動画生成部120の動作例について説明した。実施例3に係る補間動画送出部130の動作は、図6及び図7に示した動作例と同一であるので、ここでは詳細な説明は省略する。続いて、実施例3に係る補間部210の動作例について説明する。
[補間部の動作例]
続いて、実施例3に係る補間部210の動作例を説明する。図31は、本開示の一実施形態の実施例3に係る補間部210の動作例を示す説明図である。
受信部211が再生動画v10を受信すると、復号部215は再生動画v10を復号してFrame画像を生成する。復号部215はそのFrame画像のFrame時刻(Frame番号)を補間座標計算部302に伝える(ステップS411)。補間座標計算部302は、そのFrameの補間領域に対応する(一つまたは複数の)補間動画v12を決定し、補間動画v12の取得を要求する(ステップS413)。Frameの補間領域に対応する(一つまたは複数の)補間動画v12の決定方法については、上述した通りであるが、改めて説明すると以下の通りである。
高品質動画v11の画サイズHW×HHと、画面分割数TX×TYとから、補間座標計算部302は各タイル(補間動画v12)の横及び縦の数、画サイズTW×THが分かる。またタイル番号を<tx,ty>とすると、補間座標計算部302は各タイルの左上座標[tx×TW,ty×TH]が分かる。
補間領域の左上座標を[x,y]、サイズをMW×MHとすると、補間領域は左上座標が[x,y]、右上座標が[x+MW,y]、左下座標が[x,y+MH]、右下座標が[x+MW,y+MH]となる。補間座標計算部302は、この補間領域の四隅に対応するタイル群のタイル番号を決定し、そのタイル群と、水平方向及び垂直方向でそのタイル群の間に存在するタイル群が、今回の補間領域を含むタイル群であると決定する。
補間座標計算部302は、補間動画送出部130から送出される情報から、各タイル番号に対応する補間動画v12の場所(URL等)を抽出し、受信部212に対して、抽出した場所からの(一つまたは複数の)補間動画v12の受信を要求する。
そして、補間動画送出部130から送出された(一つまたは複数の)補間動画v12を受信部212が受信すると、復号部216は受信した(一つまたは複数の)補間動画v12を復号し、補間処理の対象とするFrame番号の、補間動画v12のFrame画像(一つまたは複数)を補間処理部218に送る(ステップS414)。
時刻制御部217は、再生動画v10と補間動画v12のFrame時刻が同期するように時刻合わせを行う(ステップS411、S414)。
補間処理部218は、補間動画v12のFrame画像(一つまたは複数)から、補間領域の画素群を抽出する(ステップS415)。補間処理部218での補間領域の画素群の抽出方法は上述した通りである
補間処理部218は、各補間動画v12のFrame毎に、補間動画v12のFrame画像内で画素抽出する領域を決定する。抽出する領域の補間動画v12の動面内での座標は、左上[x−(tx×TW),y−(ty×TH)]、右上[x+MW−(tx×TW),y−(ty×TH)]、左下[x−(tx×TW),y+MH−(ty×TH)]、右下[x+MW−(tx×TW),y+MH−(ty×TH)]である。なお、下限値は0、上限値は横TW、高さTHである。
補間処理部218は、抽出した画素群を、バッファ上に、水平及び/または垂直方向に連結して配置する。
補間処理部218は、補間動画v12の終了(最終Frame)まで、ステップS413〜S415の処理を繰り返す(ステップS416)。補間処理部218は、補間動画v12の終了まで処理を繰り返すことにより、分割画面群である(一つまたは複数の)補間動画v12から、補間領域の画素群を抽出したバッファを生成できる。
ここまでの座標系(座標や画像のサイズ)は高品質動画v11の動画面を基にした座標系だったので、画像変倍部301、304は、高品質動画v11の動画面を基にした座標系を、基軸画サイズの座標系に変倍し、座標変換する(ステップS412、S417)。
変倍及び座標変換が完了すると、Frame画像合成部305が補間処理(再生動画v10への補間動画v12の補間処理)を行う(ステップS418)。
実施例3に係る補間部210は、図31に示した動作を実行することで、予め画面分割された部分画面の動画群である補間動画v12の群から、補間領域の画素群を抽出して、補間処理を行うことができる。
実施例3における処理の効率化として、補間部210は補間動画v12の先読みをしてもよい。実施例3では、補間領域の座標移動に伴って、取得すべき補間動画v12(タイル番号)が変わっていく場合がある。このような場合に、補間部210が取得する補間情報i10を用いて補間動画v12の先読みを行い得る。
補間部210は、予め補間情報i10を先読みして、現在処理しているFrameより先(例えば、数秒先)のFrame時刻(以下「先読み時刻」とも称する)の補間領域を取得し、その領域に該当するタイル番号の補間動画v12を決定する。その補間動画v12が、今はまだ受信していないものであれば先行して受信指示を出して受信するか、またシーク要求をして、(補間動画v12の先頭の方の)不要なFrameを飛ばして受信する。
補間部210は、受信した補間動画v12の符号化データを解析して、対象Frame(先読み時刻のFrame)を含むGOP(Group Of Picture)の先頭を受信バッファに置く。動画再生時刻がその先読み時刻になったら、補間部210は、GOPの先頭から復号して、対象Frame画像を取得する。
補間部210は、このように先読みして補間動画v12を受信することで、シークなどのネットワーク通信と符号化データ解析(GOPの頭出しなど)を行うだけで、補間部210の復号部216による復号処理を行わずとも、先読み処理が可能である。なお補間部210に使用されていない(復号部216とは別の)復号部があれば、その使用されていない復号部を活用して、先行取得した補間動画v12の対象Frameの画像を抽出してもよい。
上述の本開示の一実施形態の説明では、MPEG−DASHを用いた補間動画v12の伝送レート調整について述べたが、この実施例3では、MPEG−DASHを用いた補間動画v12の伝送レート調整にさらなる改良を加えることが可能になる。
実施例3では、取得する複数の補間動画v12の群(分割画面の動画群)に対して、異なるレートを割り当ててもよい。実施例3では、補間領域の座標、サイズによって複数のタイルの補間動画v12の群を取得する場合があるが、複数の補間動画v12を全て同じ符号化レート及び伝送レートにする必要は無い。
例えば、補間領域に対応する複数のタイル群に対して各々重要度を付け、重要度が高いタイルの補間動画v12には高い画質で高い符号化レートが、低いタイルには低い画質で低いレートが割り当てられるようにしてもよい。タイルの重要度の設定は、例えば、補間領域の画面の中で、各タイルが占める面積の割合で決められても良い。
具体的には、補間部210は、補間領域を多く含むタイルの補間動画v12に高いレートを配分して画質を上げ、あまり含まないタイルの補間動画v12は、画質を下げてレートを低減させるようにしてもよい。また例えば、補間領域の中央は重要度を高くして、外側にかけて重要度を低く変化させてもよい。これにより補間部210は、中央に近いタイルの補間動画v12は高い画質で高いレートに決定し、外側のタイルは低画質にしてレートを低減させることができる。
実施例3により、補間動画v12の数を一定とすることが可能になる。補間動画生成部120は、補間指示毎に補間動画v12を作るのではなく、事前に固定数に画面分割された分割画面の補間動画v12を生成する。よって補間指示のパターンが増えても、補間動画送出部130が保持する補間動画v12の数は増やさずに済む。そのため実施例3の技術を適用することで、補間動画送出部130での動画記録容量を抑える事が出来る。
実施例3により、補間指示と無関係に、事前に補間動画v12を作成しておくことが可能になる。補間動画v12は、補間指示に関係ないため、新たな補間指示が追加された時も、補間動画v12を新たに生成する処理は不要である。
動画配信システムの多くは、その投資コストの多くをストレージ容量に充当し、CPUやメモリコスト(CPUのグレードやメモリ容量、またクラウド上の仮想マシンであればCPU使用時間の課金等)への投資コストを抑える傾向にある。本実施例3の技術を適用することで、補間指示のパターンが増えても補間動画v12の生成処理を行わないため、CPUやメモリのコストを抑える事が出来る。
実施例3により、補間領域に該当する補間動画v12をすぐに取得することが可能になる。補間動画v12は事前に作成されているので、例えば再生装置200のユーザが補間領域を指示したら、補間部210は指示に基づいてすぐさま補間動画v12を取得することができる。すなわち、補間動画生成部120での補間動画v12が生成されるまで待つ時間が不要となるので、実施例3によってインタラクティブな補間処理が可能となる。
<5.まとめ>
以上説明したように、本開示の一実施形態に係る動画像再生システム1は、低品質な再生動画v10に対して、画像の一部を高品質化して、ユーザの視聴体験を向上させることが出来る。
本開示の一実施形態に係る動画像再生システム1は、画質の高い動画を全て伝送するのでなく、補間領域だけを伝送する。従って、伝送レート及び負荷を低く抑えながら、画像の一部を高品質化して、ユーザの視聴体験を向上させることが出来る。
単体の動画を解析して高画質化のための演算を行う技術に比べて、本開示の一実施形態に係る動画像再生システム1は、再生装置200での高画質化のための演算負荷や、高画質化のための特殊な回路は不要となる。また再生動画の品質が低く、情報量が少なくても、再生動画に対応する高画質動画から補間動画が生成されるので、再生装置200での高画質化のための補間処理に影響が無い。また、単体の動画を解析して高画質化のための演算を行う技術に比べて、本開示の一実施形態に係る動画像再生システム1は、再生動画とは別の動画として補間動画を符号化するため、再生動画とは独立して動画品質を設定できる。本開示の一実施形態に係る動画像再生システム1は、再生装置200での高画質化演算のために、再生動画を再符号化(再作成)する必要が無い。
また本開示の一実施形態に係る動画像再生システム1は、再生動画の伝送の折に、空いている伝送帯域を有効に活用できる。例えば、再生動画送出部110を含んでいるサーバが3パターンのレート及び画サイズの動画ファイルを提供する場合、再生装置200は、使用可能な伝送帯域以下である動画ファイルを選択する。この場合、伝送帯域に余裕が生まれることがある。本開示の一実施形態に係る動画像再生システム1は、余裕のある伝送帯域を活用して補間動画を伝送して、再生画面の重要領域を高画質化できる。
また本開示の一実施形態に係る動画像再生システム1は、動画の配信業者が元素材として保持している高品質動画を活用でき、また、その高品質動画全体を伝送する場合に比べて、補間動画の伝送レートを低減させる事が出来る。また本開示の一実施形態に係る動画像再生システム1は、補間動画の画サイズや符号化レートを低く抑えられるため、補間処理側の負荷を抑えることが出来る。
また本開示の一実施形態に係る動画像再生システム1は、1つの再生動画に対して、画面内の異なる領域に対応する複数の補間動画群を用意する事が出来る。1つの再生動画に対して、画面内の異なる領域に対応する複数の補間動画群を用意することにより、複数の再生装置群が再生動画に対して異なる領域を補間する場合に、複数の再生装置で共通の再生動画と、再生装置毎に異なる補間動画とを伝送することが可能になる。そのため本開示の一実施形態に係る動画像再生システム1は、高画質の動画を画面全体で保持する必要が無く、また複数の再生装置で共通の再生動画をブロードキャスト配信することで、動画を送出する側の動画データの記録容量を小さくすることが出来る利点を有する。また本開示の一実施形態に係る動画像再生システム1は、複数の再生装置で共通の再生動画をブロードキャスト配信することで、伝送効率を向上させることが出来る利点を有する。
本開示の一実施形態に係る動画像再生システム1は、上記実施例1を適用することで、補間動画は補間領域を含む必要最小限の画サイズとなり、符号化レート及び伝送レートを必要最小限にする事が出来る。また、符号化レート及び伝送レートを必要最小限にする事により、補間部210の補間処理(復号処理やFrame画像に対する処理)も低減される。従って本開示の一実施形態に係る動画像再生システム1に、上記実施例1を適用することで、ハードウェアデコーダが一つしかない様な機器でも、そのハードウェアデコーダを再生動画の復号に用い、補間動画の復号にソフトウェアデコーダを用いる等の柔軟な構成が出来る。
本開示の一実施形態に係る動画像再生システム1は、上記実施例1を適用することで、補間領域と補間動画が一対一に対応し、複数の補間パターンの組合せを容易にすることが出来る。例えば、選手Aと選手Bを補間する場合であれば選手Aを補間するための補間動画Aと選手Bを補間するための補間動画Bを、選手Aと選手Cの補間であれば補間動画Aと選手Cを補間するための補間動画Cを取得すればよい。
本開示の一実施形態に係る動画像再生システム1は、上記実施例2を適用することで、複数の補間領域の画像を一つの補間動画面内に含める事が出来る。複数の補間領域の画像を一つの補間動画面内に含める事で、補間処理の際に一つのデコーダによる補間動画の復号で複数の補間領域の画像を一気に抽出でき、補間領域が複数あってもその数だけ復号する必要が無い。また本開示の一実施形態に係る動画像再生システム1に、上記実施例2を適用することで、補間動画のストリーミングも一つで済む。また本開示の一実施形態に係る動画像再生システム1に、上記実施例2を適用することで、矩形以外の補間領域も表現できる。
また本開示の一実施形態に係る動画像再生システム1は、上記実施例1及び実施例2を適用することで、実施例1の場合でも矩形以外の補間領域を表現でき、また補間動画の符号化後の情報量を低減できる。
本開示の一実施形態に係る動画像再生システム1は、上記実施例3を適用することで、補間動画群(部分画面の動画群)は、補間パターンに影響を受けなくなり、補間処理の前に予め作成しておくことができる。上記実施例3では、分割パターンを変えない限り、補間動画群の数は一定であり、補間パターンごとに補間動画を生成する必要が無く、補間情報だけ作成すればよい。そのため本開示の一実施形態に係る動画像再生システム1に、上記実施例3を適用することで、補間パターンが増えても、補間動画送出部130が保持する補間動画の数は増やさずに済み、動画ファイル記憶領域の容量を抑えられる。
本開示の一実施形態に係る動画像再生システム1は、上記実施例3を適用することで、補間指示が追加される度に補間動画を生成する必要が無いので、動画配信するサーバのCPUやメモリの投資コストを抑える事が出来る。本開示の一実施形態に係る動画像再生システム1は、上記実施例3を適用することで、補間動画が事前に作成されているため、新たな補間パターン(補間指示)が作られると、再生装置200は補間動画をすぐに取得して補間合成を行える。本開示の一実施形態に係る動画像再生システム1は、上記実施例3を適用することで、補間動画生成部120での補間動画の生成を待つ時間が不要になり、インタラクティブな補間が可能となる。
本明細書の各装置が実行する処理における各ステップは、必ずしもシーケンス図またはフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、各装置が実行する処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
また、各装置に内蔵されるCPU、ROMおよびRAMなどのハードウェアを、上述した各装置の構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供されることが可能である。また、機能ブロック図で示したそれぞれの機能ブロックをハードウェアで構成することで、一連の処理をハードウェアで実現することもできる。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
なお、本技術は以下のような構成も取ることができる。
(1)
第1の画質を有する第1の動画像と同一の内容であり、前記第1の画質より高い第2の画質で、前記第1の動画像の一部の領域に対応するサイズを有する第2の動画像を生成する画像生成部と、
前記第1の動画像の一部を前記第2の動画像に置き換えて前記第1の動画像及び前記第2の動画像を同時に再生させるための再生情報を生成する再生情報生成部と、
を備える、映像処理装置。
(2)
前記画像生成部は、前記再生情報生成部が生成する再生情報に基づいて出力する第2の動画像の領域を決定する、前記(1)に記載の映像処理装置。
(3)
前記画像生成部は、前記第1の動画像及び前記第2の動画像を同時に再生させる期間における、決定した前記領域を網羅する画素群に対して前記第2の画質で前記領域の動画像と同一の内容の動画像を生成する、前記(2)に記載の映像処理装置。
(4)
前記画像生成部は、決定した前記領域に対しては前記第2の画質で前記領域の動画像と同一の内容の動画像を生成し、前記領域を除いた領域に対しては無効画素を生成する、前記(2)に記載の映像処理装置。
(5)
前記画像生成部は、前記第1の動画像及び前記第2の動画像を同時に再生させる期間における、決定した前記領域を網羅する画素群に対して、前記領域に対しては前記第2の画質で前記領域の動画像と同一の内容の動画像を生成し、前記領域を除いた領域に対しては無効画素を生成する、前記(4)に記載の映像処理装置。
(6)
前記画像生成部は、前記領域として複数の領域に分割されたブロックの中の所定のブロックに対して前記第2の画質で前記領域の動画像と同一の内容の動画像を生成する、前記(2)に記載の映像処理装置。
(7)
前記画像生成部は、前記第1の動画像の再生時に前記第1の動画像の内容の認識を高める領域について前記第2の動画像を生成する、前記(1)〜(6)のいずれかに記載の映像処理装置。
(8)
前記領域は、前記第1の動画像における人間の姿が含まれる領域である、前記(7)に記載の映像処理装置。
(9)
前記領域は、前記第1の動画像における文字情報が表示される領域である、前記(7)または(8)に記載の映像処理装置。
(10)
前記画像生成部は、前記第2の動画像の基となる第3の動画像から、前記再生情報に基づいて動的に前記第2の動画像を生成する、前記(1)〜(9)のいずれかに記載の映像処理装置。
(11)
第1の画質を有する第1の動画像及び前記第1の動画像と同一の内容であり、前記第1の画質より高い第2の画質で、前記第1の動画像の一部の領域に対応するサイズを有する第2の動画像、並びに前記第1の動画像の一部を前記第2の動画像に置き換えて前記第1の動画像及び前記第2の動画像を同時に再生するための再生情報を取得する画像取得部と、
前記画像取得部が取得した前記再生情報に基づいて、前記第1の動画像の一部を前記第2の動画像に置き換えて前記第1の動画像及び前記第2の動画像を同時に再生させる画像合成部と、
を備える、映像再生装置。
(12)
前記画像合成部は、前記第2の動画像の中から前記第1の動画像の一部と置き換える領域を前記再生情報に基づいて抽出する画像抽出部を含む、前記(11)に記載の映像再生装置。
(13)
前記画像合成部は、前記画像抽出部が抽出する領域に関する情報が含まれた前記再生情報を前記第2の動画像と共に取得する、前記(12)に記載の映像再生装置。
(14)
前記画像取得部は、前記第1の動画像を、前記第2の動画像を送信する装置と別の装置から取得する、前記(11)〜(13)のいずれかに記載の映像再生装置。
(15)
前記画像取得部は、前記第1の動画像を、前記第2の動画像を送信する装置と同じ装置から取得する、前記(11)〜(13)のいずれかに記載の映像再生装置。
(16)
第1の画質を有する第1の動画像と同一の内容であり、前記第1の画質より高い第2の画質で、前記第1の動画像の一部の領域に対応するサイズを有する第2の動画像を生成するステップと、
前記第1の動画像の一部を前記第2の動画像に置き換えて前記第1の動画像及び前記第2の動画像を同時に再生させるための再生情報を生成するステップと、
を備える、映像処理方法。
(17)
第1の画質を有する第1の動画像及び前記第1の動画像と同一の内容であり、前記第1の画質より高い第2の画質で、前記第1の動画像の一部の領域に対応するサイズを有する第2の動画像、並びに前記第1の動画像の一部を前記第2の動画像に置き換えて前記第1の動画像及び前記第2の動画像を同時に再生するための再生情報を取得するステップと、
前記取得するステップで取得された前記再生情報に基づいて、前記第1の動画像の一部を前記第2の動画像に置き換えて前記第1の動画像及び前記第2の動画像を同時に再生させるステップと、
を備える、映像再生方法。
(18)
映像処理装置と、
映像再生装置と、
を備え、
前記映像処理装置は、
第1の画質を有する第1の動画像と同一の内容であり、前記第1の画質より高い第2の画質で、前記第1の動画像の一部の領域に対応するサイズを有する第2の動画像を生成する画像生成部と、
前記第1の動画像の一部を前記第2の動画像に置き換えて前記第1の動画像及び前記第2の動画像を同時に再生させるための再生情報を生成する再生情報生成部と、
を含み、
前記映像再生装置は、
少なくとも前記第2の動画像及び前記再生情報を前記映像処理装置から取得する画像取得部と、
前記画像取得部が取得した前記再生情報に基づいて、前記第1の動画像の一部を前記第2の動画像に置き換えて前記第1の動画像及び前記第2の動画像を同時に再生させる画像再生部と、
を含む、映像処理システム。