1.本発明の基礎となった知見
特許文献1では、ディスク上に左目用の字幕データと、右目用の字幕データが個別に準備されており、映像を再生する装置側では、ディスクからこれら字幕データを個別に読み込んで、左目用の字幕と右目用の字幕とを生成して出力する技術が開示されている。
特許文献2では、映像について左目用映像のストリームと右目用映像のストリームを個別に準備し、映像を再生する装置側では、これらストリームから左目用映像と右目用映像とを個別に生成する技術が開示されている。このとき、字幕は、1つのストリーム(ES)で準備されており、この字幕のESから左目用映像と右目用映像とが生成される。
特許文献1、2ともディスク上に記録された映像及び字幕を再生することが前提となっている。そのため、再生対象である映像に対応して、平面的な字幕と、左目用の字幕及び右目用の字幕とがそれぞれストリーム化されて記録されていても、再生する装置側でこれらストリームの内容を解析して、字幕を表示する際の処理としてどの方法を用いるかを決定しても何ら問題はない。なぜなら、ディスク上に1つの番組が既に記録されているので、字幕のストリームを解析して、その後再生を始めても、表示遅延が生じることはないからである。
しかしながら、放送により配信される番組では、番組の映像及び字幕を受信しつつ、表示を行うため、映像等について迅速な解析が要求される。
そこで、本発明者らは、字幕等の表示データのストリームを処理する前に参照される付加情報に着目し、当該付加情報により字幕のESの配信形態を迅速に特定し、特定した配信形態に応じた処理方法で字幕を生成する映像処理装置を想到するに至った。
本発明の一態様である、3D映像の映像ストリームを受信しつつ、再生する映像処理装置は、3D映像とともに表示される表示データのデータストリームを含み、且つ表示データについて左目用表示データと右目用表示データがそれぞれ個別にストリーム化された左目用のデータストリーム及び右目用のデータストリーム双方が存在するか否かを示す付加情報を含むトランスポートストリームを受信する受信手段と、前記付加情報に基づいて、前記トランスポートストリームに左目用のデータストリーム及び右目用のデータストリーム双方が存在するか否かを判別する判別手段と、存在すると判別された場合には左目用のデータストリームから左目用表示データを、右目用のデータストリームから右目用表示データをそれぞれ生成し、存在しないと判別された場合には前記データストリームから左目用表示データ及び右目用表示データを生成する表示データ生成手段とを備えることを特徴とする。
2.第1の実施の形態
以下、図面を参照しながら、本実施の形態について詳細に説明する。
2.1 字幕文の立体視について
先ず、本実施の形態を説明する上で基礎となる技術である字幕文の3D表示の手法について説明する。
字幕を3D表示するための手法として、2つの再生モードがある。1つは、1plane+offsetという再生モードであり、もう一つは、2plane+offsetという再生モードである。
図1は、1plane+offsetの仕組みの一例を示す図である。このモードでは、一般的に字幕は1つのES(Elementary Stream)で配信され、デジタルテレビなどの映像処理装置は字幕データをデコードして字幕プレーンの画像G10を作成する。そして、作成した字幕プレーンの画像G10をオフセットの値だけ右にシフトした画像(左目字幕画像)G11が生成され、左目映像と重畳される。また、そして、作成した字幕プレーンの画像G10をオフセットの値だけ左にシフトした画像(右目字幕画像)G12が生成され、右目映像と重畳される。字幕画像が重畳された左目映像、右目映像を順に表示することで、字幕画像は表示画面よりも手前に見え、3D表示が可能となる。ここで、オフセットの値は、3D映像に対して適切に字幕を重畳するためのもので、画素数で表される。映像と同期させる必要があるので、3D映像のESに含めて送信される。例えば、オフセットの値は、3D映像データがMPEG(Moving Picture Experts Group)形式で符号化されている場合はGOP(Group of Pictures)や各画像フレームのuser dataとして埋め込まれる。
なお、オフセットの値がマイナスだった場合は、字幕プレーンの画像を左にシフトしたものを左目字幕画像とし、右にシフトしたものを右目字幕画像とすることで、字幕画像は表示画面よりも奥に見える。
このように、シフトするオフセットの値を設定することにより字幕プレーンG13の奥行きを設定することができる。
1plane+offsetによる再生モードでは、字幕プレーンメモリが1つで良いため、3D字幕を作成するための映像処理装置の負担は少ないが、平面的な画像が手前に出てきたり、奥に引込んだりするという表示にすぎず、字幕や文字スーパーのテキスト文書やビットマップ等のオブジェクト自体が立体的に見えることはない。
図2は、2plane+offsetの仕組みの一例を示す図である。このモードでは、左目用の字幕データと右目用の字幕データを1つのESで配信することも可能であるが、一般的には左目用の字幕データと右目用の字幕データは別々のESとして2つのESで配信される。受信側では、左目用の字幕データは左目用の字幕デコーダでデコードして左字幕プレーンの画像G20を作成し、右目用の字幕データは右目用の字幕デコーダでデコードして右字幕プレーンの画像G21を作成する。そして、作成した左字幕プレーンの画像G20をオフセットの値だけ右にシフトした画像(左目字幕画像)G22が生成され、左目映像と重畳される。また、そして、作成した右字幕プレーンの画像G21をオフセットの値だけ左にシフトした画像(右目字幕画像)G23が生成され、右目映像と重畳される。字幕画像が重畳された左目映像、右目映像を順に表示することで、字幕画像は表示画面よりも手前に見え、3D表示が可能となる。
なお、オフセットの値がマイナスだった場合は、左字幕プレーンの画像を左にシフトしたものを左目字幕画像とし、右字幕プレーンの画像を右にシフトしたものを右目字幕画像とし、字幕画像は表示画面よりも奥に見える。
このように、シフトするオフセットの値を設定することにより字幕プレーンG24の奥行きを設定することができる。
2plane+offsetによる再生モードでは、左目用字幕画像と右目用字幕画像で別々の字幕プレーンの画像を用いることで、字幕や文字スーパーのテキスト文書やビットマップ等のオブジェクト自体が立体的に見えるが、字幕デコーダや字幕プレーンメモリが2つずつ必要となり、映像処理装置の処理負担が大きい。
以上が、3D字幕を立体視するための2つのモードの概要である。
2.2 映像処理システム100
ここでは、本実施の形態における映像処理システム100の概要について説明する。
映像処理システム100は、図3に示すように、映像配信装置200及び映像処理装置300、301、302から構成されている。
映像配信装置200は、番組の映像、音声及び当該番組に対する字幕が符号化され、1つのトランスポートストリームとして番組の映像、音声及び当該番組に対する字幕をデジタル放送として配信するものである。配信事業者は、映像配信装置200を利用して、番組の映像、音声及び当該番組に対する字幕を配信することができる。
映像処理装置300、301、302は、映像配信装置200から配信されたトランスポートストリームを受信し、受信したトランスポートストリームから番組の映像、音声及び字幕を生成し、表示するものである。
映像配信装置200は、3D非対応の2D映像処理装置や、1つのESで字幕を配信する方法にのみ対応した3D映像処理装置や、1つのESでの配信及び2つのESでの字幕の配信に対応した3D映像処理装置など、様々な処理能力の装置に対応するため、1つの番組に対して、2D用の字幕セット、3D用の字幕を1つのESで配信する字幕セット、3D用の2つのESで配信する字幕セットのなどの字幕セットのうち2つ以上の字幕セットを生成し、配信する。生成される字幕セットは、平面的に見えたり、立体的に見えたりとユーザが感じる視覚効果は異なるが、同等の内容を伝えるための字幕データである。ここで、1ESとは、平面的な字幕の映像がストリーム化されたものであり、字幕を2D表示、及び1plane+offsetを用いた3D表示する場合に用いられる。つまり、1ESで、2D用の字幕セット及び1plane+offsetによる3D表示用の字幕セットの双方を実現できる。2ESとは、左目用字幕のESと右目用字幕のESとからなるものであり、2plane+offsetを用いた3D表示する場合に用いられる。また、以降において、字幕セットを単に字幕と表記する場合がある。
映像処理装置300、301、302は、複数ある字幕セットのうち、自身の処理能力に応じた1つの字幕セットのみ表示する。
なお、映像処理装置300は、1ES及び2ESでの字幕の配信に対応した装置であり、映像処理装置301は、1ESで字幕を配信する方法にのみ対応した装置であり、映像処理装置302は、3D非対応の装置(つまり2D映像を表示する装置)である。
また、本実施の形態では、MPEG2−TS(Transport Stream)規格に規定されているSI/PSI(ServiceInformation/Program Specific Information)情報を利用する。
SIとは番組に関する情報を映像処理装置が解釈可能な形式で符号化した各種テーブルの総称である。これは、ARIB(The Association of Radio Industries and Businesses)によって規定されており、例えば、NIT(Network Information Table)、EIT(Event Information Table)のテーブルがこれに含まれる。
PSIとはTSに含まれる各ESがどの番組に属しているかを記載した情報を映像処理装置が解釈可能な形式で符号化した各種テーブルの総称である。ISO/IEC13818−1(International Organization for Standardization/International Electrotechnical Commission 13818−1)及びARIBが策定した規格に規定されており、例えば、PAT(Program Association Table)やPMT(Program Map Table)のテーブルがこれに含まれる。
2.3 映像配信装置200
映像配信装置200は、図4に示すように、ES属性情報記憶部201、番組配列情報生成部202、AVエンコーダ203、字幕符号化部204、音声符号化部205、多重化部206及び配信部207から構成されている。
(1)ES属性情報記憶部201
ES属性情報記憶部201は、後述する番組配列情報生成部202がSI/PSI情報を生成するためのES属性情報を記憶するものである。
具体的には、ES属性情報記憶部201は、図5に示すES属性情報一覧T100を記憶している。
ES属性情報一覧T100は、ES名、stream_type、view、PID及びcomponent_tagからなる組を複数記憶するための領域を有している。ES名、stream_type、view、PID及びcomponent_tagからなる組が1つのES属性情報となる。
「ES名」欄には、各ESを識別するためにつけられた名称が格納される。なお、各ESを識別できればよいため、名称ではなく、番号などを付与して識別してもよい。
「stream_type」欄には、当該ESのストリームの種別(映像、字幕、音声等)を識別する情報が格納される。例えば、デジタル放送では映像のストリームは「0x10」、字幕のストリームは「0x06」とARIBの運用規定で定められている。そこで、左目用映像及び右目用映像それぞれのストリームに対しては「0x10」が、左目用字幕及び右目用字幕それぞれのストリームに対しては「0x06」が、それぞれ格納される。
「view」欄には、当該ESが左目用か右目用かを示すための識別情報が格納される。なお、ここでは、説明の便宜上、左目用の映像及び字幕については識別情報として“left”と記載し、右目用の映像及び字幕については“right”と記載する。また、2D用のESもしくは1ESで字幕を配信するESについては、左目用、右目用の区別がないため、識別情報には、対応するESは左目及び右目の区別がされない旨の情報が格納される。ここでは、説明の便宜上「−」と記載する。
「PID」欄には、対応するESに割り当てられ、当該ESのTS(Transport Stream)パケットに付与すべきPIDの値が格納される。
「component_tag」欄には、当該ESに付与すべきcomponent_tagの値が格納される。
例えば、図5に示すES属性情報T101は、「ES名」が左目映像、「stream_type」が0x10、「view」が「left」、「PID」が「0x0110」であるので、PIDが「0x0110」であるESは、左目映像のストリームであることが分かる。
また、図5に示すES属性情報T102は、「ES名」が1ES字幕、「stream_type」が「0x06」、「view」が「−」、「PID」が「0x0112」であるので、PIDが「0x0112」であるESは、2D用の字幕もしくは3D用の字幕映像を1つのESで配信しているストリームであることが分かる。
さらには、ES属性情報T103は、「ES名」が左目用字幕、「stream_type」が0x06、「view」が「left」、「PID」が「0x0113」であるので、PIDが「0x0113」であるESは、左目用字幕のストリームであることが分かる。
なお、図5において図示していないが、ES属性情報一覧T100には、音声のESに関するES属性情報も格納されている。また、ES属性情報記憶部201は、その他SI/PSI情報を作成するために番組に関する情報など様々な情報をも格納している。
(2)番組配列情報生成部202
番組配列情報生成部202は、ES属性情報記憶部201で格納されている情報を基に、SI/PSI情報を作成し、生成したSI/PSI情報を多重化部206へ出力する。
ここで、SI/PSI情報として生成される各種テーブルとしては、例えば、NIT、EIT、PAT及びPMTなどである。
なお、1つの番組を構成するESの構成によって、SI/PSI情報の各種テーブルに挿入する記述子や、パラメータの値が異なる。そのため、番組配列情報生成部202は、あらゆるES構成に対応した複数のSI/PSI情報を映像の配信前に予め作成しておいても良いし、配信時にESの構成を考慮してSI/PSI情報を作成してもよい。
番組配列情報生成部202は、SI/PSI情報の1つである、PMTを生成する。
以下、番組配列情報生成部202で生成されるPMTについて説明する。PMTは、配信する番組の情報や、番組のES構成及び、それぞれのESに関する情報を格納している。
図6は、PMTのデータ構造を示す図である。個々のパラメータの意味については、ISO/IEC13818−1(MPEG−2)にて規定されているため説明を省略し、本発明に関連する部分のみ説明を行なう。PMTには記述子を配置可能な箇所が2箇所ある。
1つ目はファーストループD100と呼ぶ部分である。ファーストループD100の「descriptor()」には記述子の配置が可能である。「descriptor()」部分はfor文で囲まれており、複数の記述子を挿入可能であることが分かる。ここには、番組全体に関わる記述子を配置する。
2つ目は、ES情報記載箇所D101に含まれるセカンドループD102と呼ぶ部分である。ES情報記載箇所D101は、ファーストループD100の直後からfor文が始まっており、このfor文は番組に含まれるESの数だけ繰り返される。このfor文内のパラメータ、例えば、stream_typeやelementary_PIDなどは、当該ESに関するパラメータである。セカンドループD102は、このES情報記載箇所D101に含まれている。セカンドループD102の「descriptor()」には記述子の配置が可能である。「descriptor()」部分はfor文で囲まれており、複数の記述子を挿入可能であることが分かる。ここには、当該ESに関わる記述子を配置する。
ES情報記載箇所D101のelementary_PIDはTSの1つ1つのパケットであるトランスポートパケットを識別するための情報である。同一の映像ES、同一の字幕ES、同一のSI/PSIのテーブルのトランスポートパケットに対しては、それぞれ同じelementary_PIDが付与されている。elementary_PIDは単にPIDとも呼ばれる。
例えば、左目用映像のES、右目用映像のES、1ES字幕のES、左目用字幕のES、右目用字幕のESの合計5つのESから1つの番組が構成されている場合、ES情報記載箇所D101には、ES情報を記載する部分が5回出現する。そして、ES属性情報に基づいてstream_typeやelementary_PIDなどに左目用字幕のESに関する情報をパラメータとして設定している場合には、セカンドループD102には、左目用字幕のESに関する記述子が配置される。
図7は、ISO/IEC13818−1(MPEG−2)及びARIB規格を拡張することにより、PMTのセカンドループD102に配置する3D字幕ペア記述子(stereoscopic_subtitle_pair_descriptor)D200の一例を模式的に示す図である。3D字幕ペア記述子D200は、ES情報にてstream_typeやelementary_PIDなどに、左目用字幕のESに関する情報をパラメータとして設定している場合及び右目用字幕のESに関する情報をパラメータとして設定している場合に配置される。
3D字幕ペア記述子D200は、“descriptor_tag”、“descriptor_length”、“subtitle_view、reserved”、“pair_PID”というパラメータから構成されている。
“descriptor_tag”は、本記述子が3D字幕ペア記述子であることを3D映像表示装置にて識別するための情報であり、固定値が設定される。例えばここでは、「0x80」が設定される。
“descriptor_length”は、このフィールドの直後に続く記述子のデータ部分の全バイト長を示す情報である。本記述子は固定長であり、後続のバイト長は2であるため、固定値「2」が設定される。
“subtitle_view”は、当該ESが左右どちらの字幕のESであるかを示す情報である。左目用字幕のESであれば「0」、右目用字幕のESであれば「1」が設定される。
“reserved”は、将来拡張等のため、パラメータ設定には使用しない領域である。この2ビットにはすべて「1」を設定する。
“pair_PID”は当該ESとペアとなる字幕ESのPIDを示す情報である。当該ESが左目用字幕のESであれば右目用字幕のESのPID、右目用字幕のESであれば左目用字幕のESのPIDの値が設定される。
図8は、番組配列情報生成部202で生成され、映像処理装置に配信するPMTの一部を模式的に示す図である。図6のPMTのデータ構造で示したES情報記載箇所D101に実際に番組に含まれる全てのESに関するESの情報が記載されているのが、ES情報記載箇所D300である。なお、図6に示すとおり、本来はelementary_PIDの前後にreserved領域およびES_info_lengthの記載があるが、図8に記載した各ES情報D301、D304、D305、D306、D307では、これらの記載を省略している。このうち、左目用字幕のES情報が記載されているのが、左目用字幕のES情報D301である。この中で、図6で示す3D字幕ペア記述子D200に実際に左目用字幕ESの情報が記載されているのが、左目用字幕ESのデータ構造D302である。また、従来のstream_identifier_descriptorに、実際に左目用字幕ESの情報が記載されているのが、stream_identifier_descriptor D303である。stream_identifier_descriptor D303の各パラメータの意味については、ISO/IEC13818−1及びARIBが策定した規格に規定されているため、説明を省略する。
左目用字幕のES情報D301のうちstream_typeには、図5のES属性情報T103の「stream_type」で示さる値「0x06」が代入されている。Elementary_PIDには、図5のES属性情報T103の「PID」で示される値「0x0113」が代入されている。descriptor_tagは、記述子のIDである「0x80」が代入されている。descriptor_lengthには、後続のバイト数である「0x2」が代入されている。また、図5のES属性情報T103の「view」では「left」が設定されているので、subtitle_viewには、値「0x0」が代入されている。reservedには、固定値である「0x2」が代入されている。pair_PIDには、このESが左目用字幕のESであるため、右目用字幕のESのElementary_PIDの値である「0x0114」が代入されている。右目用字幕のESのElementary_PIDの値は、右目用字幕のES属性情報T104から取得可能である。stream_identifier_descriptorの内容については既存であるため説明を省略する。
なお、本実施の形態では、3D字幕ペア記述子は、字幕ESに対するES情報に記載するとしているが、これに限定されない。3D字幕ペア記述子は、文字スーパー用のテキスト文字列やビットマップのESに対するES情報に記載してもよい。なぜなら、ARIB規格では、字幕プレーンに字幕及び文字スーパーを表示することができるよう定められている。そのため、字幕と文字スーパーとは同様の方式にて立体視を実現できるからである。そこで、文字スーパーを3D表示する際には、2ESによる文字スーパーのES、及び文字スーパーに対するES情報に3D字幕ペア記述子と同様の内容の記述子が記載されたPMTを配信することで、受信側の装置では、2ESによる文字スーパーについて2plane+offset方式による3D表示が可能となる。
(3)AVエンコーダ203
AVエンコーダ203は、MPEG−2、MPEG−4などの方式を用いて、ビデオカメラ等で撮影した映像から左目用映像のESと右目用映像のESを作成し、生成した左目用映像のESと右目用映像のESを多重化部206へ出力する。
なお、各左目映像のESに含まれるピクチャ毎に、字幕に対するオフセット値が付与されている。
(4)字幕符号化部204
字幕符号化部204は、字幕に対してMPEG−1、MPEG−2などの方式を使ってエンコードして、1ESで配信する字幕のES、左目用字幕のES及び右目用字幕のESなどを生成し、生成した各字幕のESを多重化部206へ出力する。
(5)音声符号化部205
音声符号化部205は、音声データを、リニアPCMなどの方式で圧縮・符号化して、音声のESを生成し、生成した音声のESを多重化部206へ出力する。
(6)多重化部206
多重化部206は、SI/PSI情報、左目用映像のES、右目用映像のES、1ESで配信する字幕のES、左目用字幕のES、右目用字幕のESに対して、必要に応じてパケット化した後、多重化して、MPEG2−TS形式の1つ以上のTS(Transport Stream)を生成し、生成したTSを配信部207へ出力する。TSの生成の際、各パケットに付与するPIDは、SI/PSI情報の記載に従う。
(7)配信部207
配信部207は、放送波やCDN網やオープンインターネット網を介して、1つ以上の映像表示装置に、多重化部206で生成した1つ以上のTSを、デジタル放送として配信する。
ここで、 図9は、多重化部206で生成され、配信部207で配信されるTS400の構造を模式的に示した図である。TS400は、トランスポートパケットと呼ばれる188バイトのパケットの連続して構成されている。各トランスポートパケットには、PIDが含まれている。PIDは、当該トランスポートパケットを識別するための情報であり、同一の映像ES、同一の字幕ES、同一のSI/PSIのテーブルのトランスポートパケットに対して、それぞれ同じPIDが付与されている。このため、TS400を受信した装置は、TS400を、各ESに分離したり、SI/PSIのテーブルを取り出したりすることが可能である。TS400には、PIDの値が「0x000」、「0x101」、「0x110」、「0x111」、「0x112」、「0x113」、「0x114」のESが多重化されていることが分かる。
2.4 映像処理装置300の構成
映像処理装置300は、映像配信装置200からのデジタル放送を受信して、映像とともに字幕を表示してユーザに立体視させるデジタルテレビであり、図10に示すように、入力受付部311、分離処理部312、左ビデオデコーダ313、右ビデオデコーダ314、オフセット取得部315、左目映像出力部316、右目映像出力部317、字幕生成部318、音声デコーダ319、重畳部320、321及び表示処理部322から構成されている。
また、字幕生成部318は、図10に示すように、メイン字幕デコーダ360、サブ字幕デコーダ361、左目用字幕プレーン362、右目用字幕プレーン363、左目字幕出力部364及び右目字幕出力部365を有している。
(1)入力受付部311
入力受付部311は、チャンネル切り替え、2D/3D切り替え、字幕のON/OFF切り替えなどのユーザ入力を受け付け、ユーザ入力の内容に応じて、分離処理部312に取得すべきパケットを指示する。
(2)分離処理部312
分離処理部312は、映像配信装置200から配信されたトランスポートストリームを受信し、左目用の映像パケット、右目用の映像パケット、音声パケット、字幕パケット等に分離し、対応するデコーダへ出力するものである。
分離処理部312は、図10に示すように、分離部350及びデコーダ割当部351を有している。
(2−1)分離部350
分離部350は、映像配信装置200から配信されたトランスポートストリーム(TS)400を受信する。
分離部350は、入力受付部311で受け付けたユーザの指示に基づいて、受信したTS400からユーザが選択した番組のSI/PSIの各種テーブル、映像、音声、字幕のパケットのみを取得する。
分離部350は、各種パケットの出力先をデコーダ割当部351に特定させるために、取得したPAT、PMT等のSI/PSI情報をデコーダ割当部351へ出力する。
分離部350は、デコーダ割当部351からの指示により、各種パケットを適切なデコーダへ出力する。具体的には、分離部350は、取得した映像パケットが左目用の映像である場合には左ビデオデコーダ313へ、右目用の映像である場合には右ビデオデコーダ314へ出力する。分離部350は、取得した音声パケットを音声デコーダ319へ出力する。分離部350は、取得した字幕パケットを、デコーダ割当部351に指示に応じてメイン字幕デコーダ360及びサブ字幕デコーダ361の何れかに出力する。
(2−2)デコーダ割当部351
デコーダ割当部351は、PAT、PMT等のSI/PSI情報を解析して、各種パケットの出力先を特定するものである。
映像パケット、音声パケットについては、既存技術であるため、詳細な説明は省略する。
ここでは、字幕パケットについての出力先の特定について説明する。
デコーダ割当部351は、ユーザが選択している番組に関するSI/PSI情報の各種テーブル情報、例えばPMTを参照し、複数ある字幕ESのパケットの出力先の特定、つまり、複数ある字幕ESのパケットをメイン字幕デコーダとサブ字幕デコーダに適切に割り当てる。なお、割り当て不要と判定された字幕ESは、メイン字幕デコーダ及びサブ字幕デコーダのいずれにも割当てないことで、分離部350によるデコーダへの受け渡しを抑制する。例えば、2ESで配信された字幕の左目用字幕のESのパケットの出力先をメイン字幕デコーダ360に、右目用字幕のESのパケットの出力先をサブ字幕デコーダ361に割り当てる。
デコーダ割当部351は、SI/PSI情報の解析結果として、字幕が1ESで配信されているか、2ESで配信されているかを、字幕生成部318に通知する。
(3)左ビデオデコーダ313、右ビデオデコーダ314
左ビデオデコーダ313は、左目映像用の映像パケットを復号し、復号結果である左目用映像を左目映像出力部316に出力する。
右ビデオデコーダ314は、右目映像用のパケットを復号し、復号結果である右目用映像を右目映像出力部317に出力する。
なお、ビデオデコーダによるパケットの復号の動作が既存技術であるため、詳細な説明は省略する。
(4)オフセット取得部315
オフセット取得部315は、映像パケットから字幕の奥行きを設定するためのオフセット値を取得し、取得したオフセット値を左目字幕出力部364、右目字幕出力部365へ出力する。
(5)左目映像出力部316、右目映像出力部317
左目映像出力部316は、左ビデオデコーダ313から取得した左目用映像(レフトビュー)を一定間隔で重畳部320へ出力する。
右目映像出力部317は、右ビデオデコーダ314から取得した右目用映像(ライトビュー)を一定間隔で重畳部321へ出力する。
(6)字幕生成部318
字幕生成部318は、デコーダ割当部351による解析結果に応じて、1ESから3D表示用の字幕の生成、もしくは2ESから3D表示用の字幕(左目用字幕及び右目用字幕)の生成を行う。以下において、字幕生成部318の構成要素であるメイン字幕デコーダ360、サブ字幕デコーダ361、左目用字幕プレーン362、右目用字幕プレーン363、左目字幕出力部364及び右目字幕出力部365について説明する。
(6−1)メイン字幕デコーダ360、サブ字幕デコーダ361
メイン字幕デコーダ360及びサブ字幕デコーダ361は、分離部350から受け取った字幕パケットを復号し、復号結果である字幕を対応するプレーンに書き込む。
具体的には、メイン字幕デコーダ360は、デコーダ割当部351から字幕が2ESで配信されている旨の通知を受け取っている場合には、2ESで配信された字幕の左目用字幕のパケットを復号し、復号結果である左目用時字幕を左目用字幕プレーン362に格納する。
また、メイン字幕デコーダ360は、デコーダ割当部351から字幕が1ESで配信されている旨の通知を受け取っている場合には、1ESで配信された字幕のパケットを復号して、復号結果である字幕の画像を左目用字幕プレーン362及び右目用字幕プレーン363に格納する。
サブ字幕デコーダ361は、2ESで配信された字幕の右目用字幕パケットを復号して、復号結果である右目用字幕の画像を右目用字幕プレーン363に格納する。
(6−2)左目用字幕プレーン362、右目用字幕プレーン363
左目用字幕プレーン362は、メイン字幕デコーダ360で生成された一画面分の字幕文の映像の画素データをライン単位で格納し、水平同期信号、垂直同期信号に沿ってこれらの画素データを出力するためのメモリである。
右目用字幕プレーン363は、メイン字幕デコーダ360もしくはサブ字幕デコーダ361で生成された一画面分の字幕文の映像の画素データをライン単位で格納し、水平同期信号、垂直同期信号に沿ってこれらの画素データを出力するためのメモリである。
(6−3)左目字幕出力部364、右目字幕出力部365
左目字幕出力部364は、左目用字幕プレーン362に格納された字幕の画像から左目用字幕画像を生成し、一定間隔で重畳部320へ出力する。ここで一定間隔とは、例えば左目映像出力部316が左目映像を出力するタイミングである。
右目字幕出力部365は、デコーダ割当部351から字幕が1ESで配信されている旨の通知がされている場合には、左目用字幕プレーン362に格納された字幕の画像から右目用字幕画像を生成し、一定間隔で重畳部321へ出力する。デコーダ割当部351から字幕が2ESで配信されている旨の通知がされている場合には、右目用字幕プレーン363に格納された字幕の画像から右目用字幕画像を生成し、一定間隔で重畳部321へ出力する。ここで一定間隔とは、例えば右目映像出力部317が右目映像を出力するタイミングである。
具体的には、左目字幕出力部364は、左目用字幕プレーン362に対して水平座標に、オフセット取得部315から受け取ったオフセット値を加算して左目用字幕画像を生成する。
また、右目字幕出力部365は、字幕が1ESで配信されている場合には左目用字幕プレーン362に対して水平座標に、オフセット取得部315から受け取ったオフセット値を減算して右目用字幕文の映像を生成し、字幕が2ESで配信されている場合には右目用字幕プレーン363に対して水平座標に、オフセット取得部315から受け取ったオフセット値を減算して右目用字幕画像を生成する。
(7)音声デコーダ319
音声デコーダ319は、分離部350から受け取った音声のパケットを復号して、音声データを生成する。そして、音声デコーダ319は、生成した音声データを音声として出力する。
(8)重畳部320、321
重畳部320は、左目映像に、左目用字幕の画像を重畳し、出力するものである。
重畳部321は、右目映像に、右目用字幕の画像を重畳し、出力するものである。
(9)表示処理部322
表示処理部322は、重畳部320で生成された左目用字幕の画像が重畳された左目映像をディスプレイ(図示せず)に表示する動作と、重畳部321で生成された右目用字幕の画像が重畳された右目映像を当該ディスプレイに表示する動作とを交互に繰り返す。
2.5 動作
(1)映像配信装置200の動作
ここでは、映像配信装置200の動作について図11に示す流れ図を用いて説明する。
番組配列情報生成部202は、ES属性情報記憶部201で格納されている情報を基に、SI/PSI情報を作成する(ステップS5)。
AVエンコーダ203は、左目映像及び右目映像のそれぞれを符号化して、左目映像のES及び右目映像のESを生成する(ステップS10)。
字幕符号化部204は、字幕に対して複数の字幕ES、具体的には1ESで配信する字幕のES、左目用字幕のES及び右目用字幕のESを生成する(ステップS15)。
音声符号化部205は、音声データを圧縮・符号化して、音声ESを生成する(ステップS20)。
多重化部206は、SI/PSI情報、左目映像のES及び右目映像のES、複数の字幕のES、及び音声のESなどを多重化して、MPEG2−TS形式のトランスポートストリームを生成し、配信部207を介して外部へ配信する(ステップS25)。
(2)映像処理装置300の動作
ここでは、映像処理装置300の動作、特にデコーダ割当部351における字幕ESについてのデコーダ割当の動作について、図12に示す流れ図を用いて説明する。
デコーダ割当部351は、ユーザが選択している番組に関するSI/PSI情報に含まれるPMTを読み込む(ステップS100)。
デコーダ割当部351は、読み込んだPMTに字幕のES情報が存在するか否かを判断する(ステップS105)。具体的には、デコーダ割当部351は、stream_typeやcomponent_tagの値によって字幕のESの存在の有無を判定する。例えば、デジタル放送では、字幕及び文字スーパーのstream_typeは「0x06」、字幕のcomponent_tagは「0x30〜0x37」、文字スーパーのcomponent_tagは「0x39〜0x3F」とするようARIB規格の「BS/広帯域CSデジタル放送運用規定」にて定められている。
ES情報が存在すると判断する場合(ステップS105における「Yes」)、デコーダ割当部351は、存在するES情報に3D字幕ペア記述子(stereoscopic_subtitle_pair_descriptor)が存在するか否かを判断する(ステップS110)。
3D字幕ペア記述子が存在すると判断する場合(ステップS110における「Yes」)、デコーダ割当部351は、ES情報に存在する3D字幕ペア記述子を1つ取得する(ステップS115)。
デコーダ割当部351は、取得した3D字幕ペア記述子は左目用であるか否かを判断する(ステップS120)。具体的には、デコーダ割当部351は、取得した3D字幕ペア記述子に含まれる“subtitle_view”で示される値が“0x0”であるか否かを判断する。
取得した3D字幕ペア記述子は左目用であると判断する場合(ステップS120における「Yes」)、デコーダ割当部351は、ES情報に含まれる“elementary_PID”で示されるPIDの字幕ESのパケットの出力先としてメイン字幕デコーダ360を、3D字幕ペア記述子に含まれる“pair_PID”で示されるPIDの字幕ESのパケットの出力先としてサブ字幕デコーダ361を、それぞれ割り当てる(ステップS125)。
取得した3D字幕ペア記述子は左目用でない、つまり右目用であると判断する場合(ステップS120における「No」)、デコーダ割当部351は、3D字幕ペア記述子に含まれる “pair_PID”で示されるPIDの字幕ESのパケットの出力先としてサブ字幕デコーダ361を、ES情報に含まれる“elementary_PID”で示されるPIDの字幕ESのパケットの出力先としてメイン字幕デコーダ360を、それぞれ割り当てる(ステップS130)。
3D字幕ペア記述子が存在しないと判断する場合(ステップS110における「No」)、デコーダ割当部351は、ES情報に存在する字幕ESのパケットのES情報を取得する(ステップS135)。デコーダ割当部351は、取得したES情報に含まれる“elementary_PID”で示されるPIDの字幕ESのパケットの出力先としてメイン字幕デコーダ360を割り当てる(ステップS140)。このとき、サブ字幕デコーダ361は、デコード処理を行う必要がない。
ES情報が存在しないと判断する場合(ステップS105における「Yes」)、デコーダ割当部351は、当該処理、つまり字幕ESの割り当ての処理を終了する。
これにより、2ESによる字幕の配信、つまり左目用の字幕ESと右目用字幕ESとがそれぞれ独立して配信される場合は、デコーダ割当部351は、左目用字幕ESをメイン字幕デコーダ360に、右目用字幕ESをサブ字幕デコーダ361にそれぞれ割り当てるので、映像処理装置300は、2ESによる字幕の配信がされている場合には、2plane+offsetによる字幕画像、つまり高品質の画像で字幕を表示することができる。
2.6 具体例
ここでは、字幕表示について具体例を用いて補足説明する。
図13は、字幕表示を実現するために配信される画像のイメージ図である。図13(a)で示す字幕の画像G100は、平面的な画像であり、1ES用の字幕データとして配信される。
図13(b)で示す字幕の画像G101は、物体を左側から見たときの画像であり、左目用の字幕データとして配信される。また図13(b)で示す字幕の画像G102は、同じ物体を右側から見たときの画像であり、右目用の字幕データとして配信される。
ここでは、画像G100が1ESの字幕として、画像G101と画像G102が2ESの字幕として、それぞれ映像配信装置200から配信され、映像処理装置300で字幕表示されるまでの動作について説明する。
字幕符号化部204は、画像G100から1つのESを、画像G101から左目用字幕のESを、画像G102から右目用字幕のESをそれぞれ生成する。字幕のデータ構造については既存であるため、説明を省略する。
AVエンコーダ203は左目用映像のESと右目用映像のESを生成する。また、音声符号化部205では、音声のESを生成する。
番組配列情報生成部202は、SI/PSI情報を生成する。ここで作成されるPMTでは、図6に示すES情報記載箇所D101の部分において、左目用字幕ESのES情報はES情報D301に記載され、右目用字幕ESのES情報はES情報D304に記載され、左目用映像ESのES情報はES情報D305に記載され、右目用映像ESのES情報はES情報D306に記載されており、1ESのES情報はES情報D307に記載されている。
そして、多重化部206によって、SI/PSI情報、左目用映像ES、右目用映像ES、1ES3D字幕のES、左目用字幕のES、右目用字幕のESは多重化されて、図9に示すTS400が生成され、配信部207により、映像処理装置300に配信される。
映像処理装置300では、入力受付部311からユーザの番組指定を受け付ける。そして、分離処理部312のデコーダ割当部351は、ユーザが指定した番組についてのPMTを取得し、取得したPMTを用いてユーザが指定した番組に対する左目用映像、右目用映像及び音声それぞれのPIDを取得する。さらに、デコーダ割当部351は、TS400に左目用字幕ES、及び右目用字幕ESのそれぞれが独立して存在するか否かを判断する。この場合、S400に左目用字幕ES、及び右目用字幕ESのそれぞれが独立して存在するので、デコーダ割当部351は、左目用字幕ESのパケットをメイン字幕デコーダ360に、右目用字幕ESのパケットをサブ字幕デコーダ361に、それぞれ割り当てる。
分離部350は、受信したTS400からユーザが指定した番組のESのうち、左目用映像のESのパケットを左ビデオデコーダ313、右目用映像のESのパケットを右ビデオデコーダ314に、音声ESのパケットを音声デコーダ319に、それぞれ出力する。
さらに、分離部350は、指定した番組のESのうち左目用字幕のESのパケットをメイン字幕デコーダ360に、右目用字幕のESのパケットをサブ字幕デコーダ361に、それぞれ出力する。
左ビデオデコーダ313は、左目用映像のESのパケットをデコードして、左目用映像を生成し、左目映像出力部316へ出力する。右ビデオデコーダ314は、右目用映像のESのパケットをデコードして、右目用映像を生成し、右目映像出力部317へ出力する。オフセット取得部315は、左目用映像のESのパケットからオフセット情報を取得し、左目字幕出力部364及び右目字幕出力部365へ出力する。
音声デコーダ319は、音声のESのパケットをデコードして、音声データを生成し、音声として出力する。
メイン字幕デコーダ360は、左目用字幕のパケット(PIDが「0x0113」であるTSパケット)をデコードし、左目用字幕の画像G101を生成して左目用字幕プレーン362に格納する。サブ字幕デコーダ361は、右目用字幕のパケット(PIDが「0x0114」であるTSパケット)をデコードし、右目用字幕の画像G102を生成して、右目用字幕プレーン363に格納する。
左目字幕出力部364は、左目用字幕プレーン362に格納されている左目用字幕の画像G101に対して水平座標に、オフセット取得部315から取得したオフセットの値を加算した画像を、図2に示す左目字幕画像G22として一定間隔で出力する。
右目字幕出力部365は、右目用字幕プレーン363に格納されている右目用字幕の画像G102に対して水平座標に、オフセット取得部315から取得したオフセットの値を減算した画像を、図2に示す左目字幕画像G23として一定間隔で出力する。
表示処理部322では、重畳部320で生成された左目用字幕の画像が重畳された左目映像を出画する動作と、重畳部321で生成された右目用字幕の画像が重畳された右目映像を出画する動作とを交互に繰り返す。これにより、図2に示す字幕プレーンG24が出画されることとなる。
このように、3D字幕ペア記述子(stereoscopic_subtitle_pair_descriptor)という新規記述子を定義して、2ESで字幕を配信する字幕のES情報としてPMTに配置して映像配信装置200から配信し、映像処理装置300は、デコーダ割当部351によって、PMTを解析して左目用字幕のESのパケットはメイン字幕デコーダ360、右目用字幕のESのパケットはサブ字幕デコーダ361にそれぞれ割り当てることにより、配信事業者の意図したとおりの映像(左目用映像/右目用映像)と重畳して表示することができる。
2.7 映像処理装置301及び映像処理装置302
ここでは、映像処理装置301及び映像処理装置302の字幕の表示について、簡単に説明する。
映像処理装置301は、2ESによる字幕セットを用いた字幕の3D表示はできない。そこで、1ESによる字幕セットを用いて1plane+offset方式による字幕の3D表示を行う。
映像処理装置302は、字幕の3D表示そのものができない。そこで、1ESによる字幕セットを用いて字幕の2D表示、つまりデコードにより得られた平面的な字幕の画像そのものを、映像と重畳させて表示する。または、2ESで配信した字幕の左目用字幕及び右目用字幕のいずれかの字幕を2D用の字幕として表示するとしてもよい。
さらに、映像処理装置302は、映像の表示も2Dのみであるので、例えば、左目用映像と右目用映像とが配信された場合、左目用映像及び右目用映像のいずれかの映像のみを用いて2D用の映像として表示してもよい。
2.8 変形例
上記実施の形態では、映像配信装置200は、トランスポートストリームに、1ESの字幕セット及び2ESの字幕セットの双方を常に含む構成としたが、これに限定されない。
映像配信装置200は、配信先となる映像表示装置の処理能力に応じて、配信する字幕セットを変更してもよい。
このとき、映像処理システム100において、映像処理装置300、301、302は、自身の処理能力を送信する。例えば、映像処理装置300は2plane+offsetによる字幕表示が可能である旨を、映像処理装置301は1plane+offsetによる字幕表示が可能である旨を、映像処理装置302は2D表示による字幕表示が可能である旨を、配信の要求とともに送信する。
映像配信装置200では、配信の要求とともに受け取った配信先の映像処理装置の処理能力に応じた字幕セットを、映像とともに配信する。このとき、受信側である映像処理装置の処理能力に応じた字幕セットがトランスポートストリームに含まれていることとなるので、例えば映像処理装置300のデコーダ割当部351は、2ESの字幕セットがトランスポートストリームに存在することを前提として、処理を行うこととなる。
ここでは、本変形例における映像処理装置300のデコーダ割当部351の処理について、図14に示す流れ図を用いて説明する。
デコーダ割当部351は、ユーザが選択している番組に関するSI/PSI情報に含まれるPMTを読み込む(ステップS200)。
デコーダ割当部351は、変数「N」に0を代入する(ステップS205)。
次に、デコーダ割当部351は、変数「N」の値を1つインクリメントする(ステップS210)。
デコーダ割当部351は、ES情報記載箇所D101にN番目のES情報が存在するか否かを判断する(ステップS215)。
N番目のES情報が存在すると判断する場合(ステップS215における「Yes」)、デコーダ割当部351は、N番目のES情報を取得する(ステップS220)。
デコーダ割当部351は、取得したES情報に3D字幕ペア記述子(stereoscopic_subtitle_pair_descriptor)が存在するか否かを判断する(ステップS225)。
3D字幕ペア記述子が存在すると判断する場合(ステップS225における「Yes」)、デコーダ割当部351は、当該ES情報に存在する3D字幕ペア記述子を取得する(ステップS230)。
デコーダ割当部351は、取得した3D字幕ペア記述子は左目用であるか否かを判断する(ステップS235)。具体的には、デコーダ割当部351は、取得した3D字幕ペア記述子に含まれる“subtitle_view”で示される値が“0x0”であるか否かを判断する。
取得した3D字幕ペア記述子は左目用であると判断する場合(ステップS235における「Yes」)、デコーダ割当部351は、ES情報に含まれる“elementary_PID”で示されるPIDの字幕ESのパケットの出力先としてメイン字幕デコーダ360を、3D字幕ペア記述子に含まれる“pair_PID”で示されるPIDの字幕ESのパケットの出力先としてサブ字幕デコーダ361を、それぞれ割り当てる(ステップS240)。これにより、パケットのPIDがElementary_PIDと同一であるパケットのみがメイン字幕デコーダ360に出力され、パケットのPIDがpair_PIDと同一であるパケットのみがサブ字幕デコーダ361に出力される。
取得した3D字幕ペア記述子は左目用でない、つまり右目用であると判断する場合(ステップS235における「No」)、デコーダ割当部351は、3D字幕ペア記述子に含まれる “pair_PID”で示されるPIDの字幕ESのパケットの出力先としてサブ字幕デコーダ361を、ES情報に含まれる“elementary_PID”で示されるPIDの字幕ESのパケットの出力先としてメイン字幕デコーダ360を、それぞれ割り当てる(ステップS245)。
3D字幕ペア記述子が存在しないと判断する場合(ステップS225における「No」)、処理はステップS210へ戻る。
N番目のES情報が存在しない場合(ステップS215における「No」)、処理は終了する。
なお、本変形例では、字幕のペアに対するデコーダの割り当てを迅速に行うことを目的として、左目用字幕のESのES情報、及び右目用字幕のESのES情報の何れかを読み込んだ後、以降の読み込みは行わないよう処理を制御している。そのため、映像及び音声のPIDを特定するためには、別途処理を行う必要がある。そこで、字幕のペアに対するデコーダの割り当てと並行して、映像及び音声のPIDを特定を行うために、左目用字幕のESのES情報、及び右目用字幕のESのES情報の何れかを読み込んだ後であっても、映像及び音声双方のPIDが特定されていなければ、これらのPIDが特定されるまで以降のES情報の読み込みを行ってもよい。
また、本変形例では、映像処理装置300について、左目用字幕のESのES情報、及び右目用字幕のESのES情報が存在しない場合の処理については言及していないが、これらES情報が存在しない場合であって、1ESの字幕セットが存在する場合には、当該字幕セットを用いて、左目用字幕及び右目用字幕を生成する。
なお、1ESの字幕セットが存在する場合でも、字幕のペアに対するデコーダの割り当てを迅速に行うことを目的として、左目用字幕のESのES情報、及び右目用字幕のESのES情報の何れかを読み込んだ後、以降の読み込みは行わないよう処理を制御してもよい。その場合、左目用字幕のESのES情報、及び右目用字幕のESのES情報の何れかを読み込む前に1ESの字幕のESのES情報を読み込んだ場合には、Elementary_PIDの値を保持しておき、以降に左目用字幕のESのES情報、及び右目用字幕のESのES情報の何れかを読み込んだ場合には1ESの字幕のElementary_PIDの値を破棄して左目用字幕のESのES情報、及び右目用字幕のESのES情報の何れかのES情報からメイン字幕デコーダとサブ字幕デコーダの割り当てを行い、PMT内の全てのES情報の読み込みが終了しても左目用字幕のESのES情報、及び右目用字幕のESのES情報の何れのES情報も存在しない場合には1ESの字幕のElementary_PIDで示される字幕ESをメイン字幕デコーダに割り当てればよい。
2.9 その他の変形例
また、上記実施の形態などに限らず、例えば、以下のような変形例が考えられる。
(1)上記実施の形態において、2ESにより字幕が配信される場合、3D字幕ペア記述子において“pair_PID”を記載し、当該に対応するPIDとペアとなる字幕のESを特定したが、これに限定されない。
ペアとなる字幕ESが特定できる方法であれば、どのような方法であってもよい。例えば、component_tagなどのPID以外のパラメータによってペアとなる字幕ESを特定してもよい。
または、左目用字幕のPIDやcomponent_tagに固定値を足した値もしくは引いた値を右目用字幕のPIDやcomponent_tagの値とするよう配信側と受信側でルールを決めておくことで、片方のESのPIDやcomponent_tag取得した時点でペアとなるESのPIDやcomponent_tagを特定できるようにしてもよい。
または、PIDやcomponent_tag等のパラメータにおいて、2ESで配信する字幕の左目用字幕にのみ割当てる値の範囲や右目用字幕にのみ割当てる値の範囲を配信側と受信側でルールを決めておくことで、PIDやcomponent_tag等のパラメータを取得した時点で、2ESで配信する字幕の左目用字幕であることや右目用字幕であることを特定できるようにしてもよい。この場合、2ESで配信する字幕の左目用字幕のcomponent_tagは「0x31」、右目用字幕のcomponent_tagは「0x32」というように配信側と受信側でルールを決めておけばよい。
また、PIDやcomponent_tagなどによってペアとなる字幕ESを特定するのではなく、重畳する映像の字幕を指定することで、メイン字幕デコーダとサブ字幕デコーダに割当てる字幕ESを判定してもよい。この場合、左目用字幕のESのES情報には対応する左目用映像を特定するためのPIDやcomponent_tagを指定する。
(2)上記実施の形態では、3D字幕ペア記述子(stereoscopic_subtitle_pair_descriptor)をPMTに配置したが、これに限定されない。
3D字幕ペア記述子は、他のSI/PSIのテーブルに配置されてもよい。例えば、SIのEITのループに配置してもよい。または、SIとPSI両方に3D字幕ペア記述子を配置してもよい。
EITなどのSIは番組開始以前に取得可能な情報であるため、番組開始前にデコーダ割当部351によって、左目用字幕ESのPIDと右目用字幕ESのPIDを特定しておくことも可能である。なお、SIは番組開始以前から配信されている情報であり、番組直前にPIDが変更される可能性もあるため、番組開始時にSIとPSIに記載された3D字幕ペア記述子の内容を比較し、記載内容が異なる場合には、PSIに記載された情報を優先してもよい。
(3)上記実施の形態では、2ESによる字幕セットが配信されていることを、3D字幕ペア記述子によって判別されるとしたが、これに限定されない。
例えば、SI/PSIのテーブルのreserved領域やreserved_future_use領域など、現在使用されていない領域を拡張して、3D字幕ペア記述子に記載した情報と同等の情報を、これら拡張した領域に分割して入れてもよい。
(4)上記実施の形態において、左目用字幕のES情報、及び右目用字幕のES情報それぞれに、3D字幕ペア記述子を配置し、各3D字幕ペア記述子にview情報やpair_PIDの情報を記載するとしたが、これに限定されない。
どちらかの字幕ESのES情報に3D字幕ペア記述子を配置したり、両方の字幕ESのES情報として、view情報のみを記載したりしてもよい。
例えば、左目用字幕のES情報、及び右目用字幕のES情報のうち一方のES情報の3D字幕ペア記述子を配置する場合には、ES情報記載箇所D101で記述される左目用字幕のES情報、及び右目用字幕のES情報のうち、先行して記載されるES情報に3D字幕ペア記述子を記載する。これにより、左目用字幕のES情報、及び右目用字幕のES情報のうち片方のES情報、つまりES情報記載箇所D101に先行して記載されたES情報を読んだ時点で、左目用字幕ESと右目用字幕ESを特定でき、表示までの時間を短縮することができる。
(5)上記実施の形態において、図12に示すステップS115では、3D字幕ペア記述子を有する1つのES情報を取得したが、3D字幕ペア記述子を有するES情報が複数個ある場合には、複数個のES情報を取得してもよい。
なお、この場合、ステップS120、S125、S130の処理をES情報の数だけ繰り返してもよい。
また、3D字幕ペアが存在しない場合であって、字幕ESのES情報が複数個ある場合には、複数個のES情報を取得してもよい。
なお、この場合、ステップS140の処理をESの数だけ繰り返し、複数のPIDをメイン字幕デコーダ360に割り当ててもよい。
(6)上記実施の形態では、映像処理装置301は、2ESで配信される字幕セットがある場合は、2ESで配信される字幕セットを表示し、2ESで配信される字幕セットがない場合は1ESで配信される字幕セットを表示するよう、2ESで配信される字幕セットの表示を優先したが、これに限定されない。
1ESで配信される字幕セットの表示を優先させてもよい。具体的には、1ESで配信される字幕セットがある場合は、1ESで配信される字幕セットを表示画面に表示し、1ESで配信される字幕セットがない場合は2ESで配信される字幕セットを表示画面に表示するようにデコーダ割当部351が動作してもよい。
または、ユーザが1ESで配信される字幕セットと2ESで配信される字幕セットとのどちらを優先するかを予め、もしくは番組視聴時に選択し、ユーザが選択した字幕セットを優先的に表示するよう、デコーダ割当部351が動作してもよい。
または、映像配信装置200が優先して表示したい字幕セットがどちらであるかという情報をSI/PSIに格納して配信し、映像処理装置301にて当該情報を参照して、優先的に表示する字幕セットを決定してもよい。
(7)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
2.10 まとめ
以上説明したように、配信事業者は、3D非対応の2D映像表示装置や、1ESで字幕を配信する方法にのみ対応した3D映像表示装置や、1ES及び2ESでの字幕の配信に対応した3D映像表示装置など、様々なニーズに対応するため、1つの番組に対して、2D用の字幕セット、3D用の1ESで配信する字幕セット、3D用の2ESで配信する字幕セットのなどの字幕セットのうち2つ以上の字幕セットを作成する可能性がある。作成される字幕セットは、平面的に見えたり、立体的に見えたりとユーザが感じる視覚効果は異なるが、同等の内容を伝えるための字幕データである。そのため、映像処理装置では、複数ある字幕セットのうち、1つの字幕セットのみ表示すればよい。
そこで、本実施の形態のように映像と複数の字幕セットを配信して映像処理装置側で最適な字幕セットを選択して表示したり、上記変形例のように配信側で、映像処理装置の処理能力に応じた映像と字幕セットのみを配信を配信したりする。
そのため、例えば、CDN網やインターネット網を使って番組を配信する場合には、番組配信前に3D映像配信装置が3D映像表示装置の処理能力を取得し、3D映像表示装置が、表示可能な字幕セット(2D字幕、1ESで配信する字幕、2ESで配信する字幕)を返すことで、3D映像配信装置は最適な字幕セットのみを番組に含め、それ以外は配信しないことにより、配信するデータ量や使用するネットワーク帯域の削減が可能である。なお、3D映像配信装置が処理能力を取得して最適な文字セットを判断するのではなく、3D映像表示装置自身が自身の処理能力やユーザの嗜好及び選択動作により、最適な字幕セットを要求してもよい。
3.第2の実施の形態
上記第1の実施の形態において、図5に示す3D字幕ペア記述子(stereoscopic_subtitle_pair_descriptor)を使用した場合、当該記述子の有無により、字幕ESが2ESで配信される字幕セットのESであるか否かを判別することは可能である。
しかしながら、1ESで配信される字幕セットには、2D用字幕、1ESで配信される3D字幕がある。さらには、1ESで配信される3Dの字幕セットは、1plane+offsetの再生モードで表示するための3D字幕である場合と、左目用字幕画像と右目用字幕画像とが1つのESで配信され、且つ2plane+offsetの再生モードで再生する3D字幕である場合とがある。
そのため、2ESで配信される字幕には対応していないが、1ESで配信され、1plane+offsetの再生モードで表示する3D字幕には対応している映像処理装置が適切な字幕ESを表示するためには、1ESで配信される字幕ESが2D用字幕であるか3D用字幕であるか、再生モードが1plane+offsetであるか2plane+offsetであるか、字幕セットのES構成が1ESであるか2ESであるかを、それぞれ識別することが必要となる。
そこで、本実施の形態では、これらを識別することのできる映像処理システム100aについて説明する。
映像処理システム100aは、図15に示すように、映像配信装置200a、映像処理装置300a、301a、302aから構成されている。ここで、映像処理装置300aは、1ES及び2ESでの字幕の配信に対応した装置であり、映像処理装置301aは、1ESで字幕を配信する方法にのみ対応した装置であり、映像処理装置302aは、3D非対応の装置(つまり2D映像を表示する装置)である。
各装置の概要は、第1の実施の形態と同様であるので、ここでの各装置の概要の説明は省略する。
以降では、各装置の構成要素について第1の実施の形態と異なる点を中心に説明する。
3.1 映像配信装置200a
映像配信装置200aは、図16に示すように、ES属性情報記憶部201、番組配列情報生成部202a、AVエンコーダ203、字幕符号化部204a、音声符号化部205、多重化部206及び配信部207から構成されている。
ES属性情報記憶部201、AVエンコーダ203、音声符号化部205、多重化部206及び配信部207については、第1の実施の形態で説明しているので、ここでの説明は省略する。
(1)番組配列情報生成部202a
番組配列情報生成部202aは、ES属性情報記憶部201で格納されている情報を基に、SI/PSI情報を作成し、生成したSI/PSI情報を多重化部206へ出力する。
ここで、第1の実施の形態との変更点は、PMTに記載される情報が、3D字幕ペア記述子ではなく、3D字幕記述子(stereoscopic_subtitle_descriptor)D500である。
以下、3D字幕記述子D500について説明する。
図17は、ISO/IEC13818−1(MPEG−2)及びARIB規格を拡張することにより得られる、PMTのセカンドループに配置する3D字幕記述子(stereoscopic_subtitle_descriptor)D500の一例を模式的に示す図である。
3D字幕記述子D500は、ES情報記載箇所D101にて、3D用の字幕セットの字幕ESに関するES情報に配置される。
3D字幕記述子D500は、descriptor_tag、descriptor_length、subtitle_mode、subtitle_component、subtitle_view、pair_PID、reservedというパラメータから構成されている。
descriptor_tagは、本記述子が3D字幕記述子であることを3D表示が可能な映像処理装置にて識別するための情報であり、固定値が設定される。例えば、「0x80〜0xBF」が、事業者定義記述子のタグ値として設定可能な範囲とされているため、ここでは、「0x81」が設定される。
descriptor_lengthは、このフィールドの直後に続く記述子のデータ部分の全バイト長を示す情報である。本記述子は固定長であり、後続のバイト長は2であるため、固定値「2」が設定される。
subtitle_modeは、当該ESが1plane+offsetで再生されるべき字幕ESか2plane+offsetで再生されるべき字幕ESかを示す情報である。1plane+offsetであれば「0」、2plane+offsetであれば「1」を設定する。
subtitle_componentは、当該ESが1ESで構成された字幕か2ESで構成された字幕の一部かを示す情報である。1ESで構成されていれば「0」、2ESで構成されていれば「1」を設定する。
subtitle_viewは、当該ESが左右どちらの字幕のESであるかを示す情報である。左目用字幕のESであれば「0」、右目用字幕のESであれば「1」を設定する。
pair_PIDは、3D表示用の字幕が2ESで配信されている場合であって、当該ESとペアとなる字幕ESのPIDを示す情報である。当該ESが左目用字幕のESであれば右目用字幕のESのPID、右目用字幕のESであれば左目用字幕のESのPIDの値を設定する。
reservedにはすべて「1」を設定する。
例えば、1ESで配信される3D字幕のES(以下、「1ES3D字幕のES」という。)において、1plane+offsetで再生したい場合、subtitle_modeには「0」、subtitle_componentには「0」が入る。また、1ES3D字幕のESにおいて、2plane+offsetで再生したい場合、subtitle_modeには「1」、subtitle_componentには「0」が入る。2ESで配信される左目用字幕のESにおいて、subtitle_modeには「1」、subtitle_componentには「1」、subtitle_viewには「0」、pair_PIDには右目用字幕のESのElementary_PIDが入る。
図18は、各映像処理装置に配信するPMTの一部を模式的に示す図であり、図6のPMTのデータ構造で示したES情報記載箇所D101に実際に1plane+offsetで再生する1ES3D字幕のESの情報、及び左目用字幕のESの情報などが記載されている。
例えば、ES情報D601は、1plane+offsetで再生する1ES3D字幕のESのES情報を示すものである。ES情報D601に含まれる記述子D602に、図17の3D字幕記述子に実際に1plane+offsetで再生する1ES3D字幕のES情報が記載されている。なお、図6に示すとおり、本来はelementary_PIDの前後にreserved領域およびES_info_lengthの記載があるが、図18に記載したES情報D601、D603では、これらの記載を省略している。
ES情報D601におけるstream_typeには、図5のES属性情報一覧T100の「stream_type」欄の値である「0x06」が、Elementary_PIDには、ES属性情報一覧T100の「PID」欄の「0x0112」が、それぞれ代入されている。
ES情報D601におけるdescriptor_tagは、記述子のIDである「0x81」が代入されており、本記述子D602が3D字幕記述子であることを示している。descriptor_lengthには、後続のバイト数である「0x2」が代入されている。そして、subtitle_modeには、当該ESが1plane+offsetモードで再生されることを示す値「0x0」が代入されている。subtitle_componentには、当該ESが1ESで配信される字幕であることを示す値「0x0」が代入されている。reservedの14ビットには固定値「1」であるため、2進数の「0x11111111111111」を16進数で示した「0x3FFF」が代入されている。
また、ES情報D603は、左目用字幕のES情報を示すものである。ES情報D603に含まれる記述子D604に、図17の3D字幕記述子D500に実際に左目用字幕ESの情報が記載されている。
ES情報D603におけるstream_typeには、ES属性情報一覧T100の「stream_type」欄の値である「0x06」が、Elementary_PIDには、ES属性情報一覧T100の「PID」欄の「0x0113」が、それぞれ代入されている。
ES情報D603におけるdescriptor_tagは、記述子のIDである「0x81」が代入されており、本記述子D602が3D字幕記述子であることを示している。descriptor_lengthには、後続のバイト数である「0x2」が代入されている。subtitle_modeには、当該ESが2plane+offsetモードで再生するため「0x1」が代入されている。subtitle_componentには、当該ES字幕が2ESで配信される字幕の一部であるため「0x1」が代入されている。subtitle_viewには、このESが左目用字幕のESであるため、「0x0」が代入されている。pair_PIDには、右目用字幕のESのElementary_PIDの値である「0x0114」が代入されている。なお、右目用字幕のESのElementary_PIDの値は、ES属性情報一覧T100から取得可能である。
なお、本実施の形態では、3D字幕記述子は、字幕ESに対するES情報に記載するとしているが、これに限定されない。3D字幕記述子は、文字スーパー用のテキスト文字列やビットマップのESに対するES情報に記載してもよい。なぜなら、ARIB規格では、字幕プレーンに字幕及び文字スーパーを表示することができるよう定められている。そのため、字幕と文字スーパーとは同様の方式にて立体視を実現できるからである。
(2)字幕符号化部204a
字幕符号化部204aは、字幕に対してMPEG−1、MPEG−2などの方式を使ってエンコードして、3D字幕記述子D500の記述内容に基づいて、2D表示用の字幕のES、1plane+offsetに対応する1ES3D字幕のES、2plane+offsetに対応する1ES3D字幕のES、及び2ESによる字幕のES(つまり、左目用字幕のES及び右目用字幕のES)などを生成し、生成した各字幕のESを多重化部206へ出力する。
3.2 映像処理装置300a
映像処理装置300aは、映像配信装置200aからのデジタル放送を受信して、映像とともに字幕を表示してユーザに立体視させるデジタルテレビであり、図19に示すように、入力受付部311、分離処理部312a、左ビデオデコーダ313、右ビデオデコーダ314、オフセット取得部315、左目映像出力部316、右目映像出力部317、字幕生成部318、音声デコーダ319、重畳部320、321及び表示処理部322から構成されている。
また、分離処理部312aは、分離部350とデコーダ割当部351aとを有している。
ここでは、第1の実施の形態の映像処理装置300とは異なる構成要素である、分離処理部312a、特にデコーダ割当部351aについて説明する。
(1)デコーダ割当部351a
デコーダ割当部351aは、PAT、PMT等のSI/PSI情報を解析して、各種パケットの出力先を特定するものである。
映像パケット、音声パケットについては、既存技術であるため、詳細な説明は省略する。
ここでは、字幕パケットについての出力先の特定について説明する。
デコーダ割当部351aは、ユーザが選択している番組に関するSI/PSI情報の各種テーブル情報、例えばPMTを参照し、3D字幕記述子の存在の有無を判断する。
デコーダ割当部351aは、3D字幕記述子が存在すると判断する場合には、当該3D字幕記述子の記述内容に基づいて、3D表示に用いられる字幕の再生方法、及び配信の方法を特定する。具体的には、デコーダ割当部351aは、字幕の再生方法が2plane+offset方式であるか1plane+offset方式であるかの特定、及び配信の方法が1ESで配信されているか2ESで配信されているかの特定を行う。
デコーダ割当部351aは、特定した結果に応じて、字幕のESのパケットをメイン字幕デコーダとサブ字幕デコーダに適切に割り当てる。具体的には、デコーダ割当部351aは、字幕の再生方法が2plane+offset方式であり、且つ字幕が2ESで配信されている場合には、左目用字幕のESのパケットをメイン字幕デコーダ360に、右目用字幕のESのパケットをサブ字幕デコーダ361に割り当てる。字幕の再生方法が2plane+offset方式であり、且つ字幕が1ESで配信されている場合には、デコーダ割当部351aは、字幕のESのパケットをメイン字幕デコーダ360及びサブ字幕デコーダ361の双方に割り当てる。また、字幕の再生方法が1plane+offset方式であり、且つ字幕が1ESで配信されている場合には、デコーダ割当部351aは、字幕のESのパケットをメイン字幕デコーダ360のみに割り当てる。
デコーダ割当部351aは、SI/PSI情報の解析結果として、3D字幕記述子の存在の有無、及び3D字幕記述子が存在する場合には3D表示に用いられる字幕の再生方法と配信の方法とを、字幕生成部318に通知する。
このとき、分離部350では、デコーダ割当部351aの割り当て結果に応じて、各種パケットを適切なデコーダへ出力することとなる。また、字幕生成部318では、3D字幕記述子の存在しない旨の通知をデコーダ割当部351aから受け取った場合には、分離部350から受け取った字幕パケットについて2D表示として処理する。3D字幕記述子の存在する旨の通知をデコーダ割当部351aから受け取った場合には、デコーダ割当部351aで特定された再生方法及び配信方法に基づいて、左目用字幕及び右目用字幕を生成する。
3.3 動作
(1)映像配信装置200aの動作
ここでは、映像配信装置200aの動作について、図11に示す流れ図を用いて、変更点のみ説明する。
ステップS5において、生成されるSI/PSI情報の内容、特にPMTの内容が第1の実施の形態と異なる。具体的には、字幕の3D表示を行う場合には、映像配信装置200aの番組配列情報生成部202aは、PMTのES情報記載箇所D101において3D字幕記述子を記載する。
また、ステップS15において、本実施の形態では、ステップS5で生成したPMTの記載内容、具体的には3D字幕記述子の記載内容に応じて、少なくとも1つ以上の字幕ESが生成される点が、第1の実施の形態と異なる。なお、3D字幕記述子の有無に関係なく2D表示用の字幕のESは常に生成される。
(2)映像処理装置300aの動作
ここでは、映像処理装置300aの動作、特にデコーダ割当部351aにおける字幕ESについてのデコーダ割当の動作について、図20及び図21に示す流れ図を用いて説明する。
デコーダ割当部351aは、ユーザが選択している番組に関するSI/PSI情報に含まれるPMTを読み込む(ステップS100)。
デコーダ割当部351aは、読み込んだPMTに、3D字幕記述子(stereoscopic_subtitle_descriptor)が存在し、subtitle_mode=1かつsubtitle_component=1であるES情報が存在するか否かを判断する(ステップS305)。
ES情報が存在すると判断する場合(ステップS305における「Yes」)、デコーダ割当部351aは、subtitle_mode=1かつsubtitle_component=1であるES情報を取得する(ステップS310)。
デコーダ割当部351aは、取得したES情報は、左目用であるか否かを判断する(ステップS315)。具体的には、デコーダ割当部351aは、取得したES情報に含まれるsubtitle_viewの値が0であるか否かを判断する。
取得したES情報は左目用であると判断する場合(ステップS315における「Yes」)、デコーダ割当部351aは、ES情報に含まれる“elementary_PID”で示されるPIDの字幕ESのパケットの出力先としてメイン字幕デコーダ360を、3D字幕記述子に含まれる“pair_PID”で示されるPIDの字幕ESのパケットの出力先としてサブ字幕デコーダ361を、それぞれ割り当てる(ステップS320)。これにより、パケットのPIDがElementary_PIDと同一であるパケットのみがメイン字幕デコーダ360に出力され、パケットのPIDがpair_PIDと同一であるパケットのみがサブ字幕デコーダ361に出力される。また、このとき、メイン字幕デコーダ360では、分離部350から受け取ったパケットから左目用字幕を生成し、サブ字幕デコーダ361では、分離部350から受け取ったパケットから右目用字幕を生成する。
取得したES情報は左目用でない、つまり右目用であると判断する場合(ステップS315における「No」)、デコーダ割当部351aは、3D字幕記述子に含まれる “pair_PID”で示されるPIDの字幕ESのパケットの出力先としてサブ字幕デコーダ361を、ES情報に含まれる“elementary_PID”で示されるPIDの字幕ESのパケットの出力先としてメイン字幕デコーダ360を、それぞれ割り当てる(ステップS325)。
ES情報が存在しないと判断する場合(ステップS305における「No」)、デコーダ割当部351aは、読み込んだPMTに、3D字幕記述子(stereoscopic_subtitle_descriptor)が存在し、subtitle_mode=1かつsubtitle_component=0であるES情報が存在するか否かを判断する(ステップS340)。
ES情報が存在すると判断する場合(ステップS340における「Yes」)、デコーダ割当部351aは、subtitle_mode=1かつsubtitle_component=0であるES情報を取得する(ステップS345)。
デコーダ割当部351aは、ES情報に含まれる“elementary_PID”で示されるPIDの字幕ESのパケットの出力先としてメイン字幕デコーダ360及びサブ字幕デコーダ361の双方を割り当てる(ステップS350)。これにより、パケットのPIDがElementary_PIDと同一であるパケットのみがメイン字幕デコーダ360及びサブ字幕デコーダ361に出力される。また、このとき、メイン字幕デコーダ360では、1ESで配信された左目用字幕についてのパケットから左目用字幕を生成し、サブ字幕デコーダ361では、1ESで配信された右目用字幕についてのパケットから左目用字幕を生成する。
ES情報が存在しないと判断する場合(ステップS340における「No」)、デコーダ割当部351aは、読み込んだPMTに、3D字幕記述子(stereoscopic_subtitle_descriptor)が存在し、subtitle_mode=0かつsubtitle_component=0であるES情報が存在するか否かを判断する(ステップS355)。
ES情報が存在すると判断する場合(ステップS355における「Yes」)、デコーダ割当部351aは、subtitle_mode=0かつsubtitle_component=0であるES情報を取得する(ステップS360)。
デコーダ割当部351aは、ES情報に含まれる“elementary_PID”で示されるPIDの字幕ESのパケットの出力先としてメイン字幕デコーダ360に割り当てる(ステップS350)。これにより、パケットのPIDがElementary_PIDと同一であるパケットのみがメイン字幕デコーダ360に出力される。このとき、サブ字幕デコーダ361は、デコード処理を行う必要がない。また、このとき、メイン字幕デコーダ360を含む字幕生成部318では、1plane+offset方式により左目用字幕、及び右目用字幕を生成する。
ES情報が存在しないと判断する場合(ステップS355における「No」)、デコーダ割当部351aは、字幕ESのES情報が存在するか否かを判断する(ステップS370)。これは、stream_typeやcomponent_tagの値によって判定が可能である。例えば、デジタル放送では、字幕及び文字スーパーのstream_typeは「0x06」、字幕のcomponent_tagは「0x30〜0x37」、文字スーパーのcomponent_tagは「0x39〜0x3F」とするようARIB規格の「BS/広帯域CSデジタル放送運用規定」にて定められている。
ES情報は存在すると判断する場合(ステップS370における「Yes」)、デコーダ割当部351aは、字幕ESのES情報を取得する(ステップS375)。
デコーダ割当部351aは、ES情報に含まれる“elementary_PID”で示されるPIDの字幕ESのパケットの出力先としてメイン字幕デコーダ360に割り当てる(ステップS380)。これにより、パケットのPIDがElementary_PIDと同一であるパケットのみがメイン字幕デコーダ360に出力される。このとき、サブ字幕デコーダ361はデコード処理を行う必要がない。また、このとき、配信された映像が3D表示される場合には、メイン字幕デコーダ360を含む字幕生成部318では、メイン字幕デコーダ360に割り当てられた字幕ESから左目用字幕、及び右目用字幕を生成する。この場合の各字幕の生成は、1plane+offset方式により実現できる。
ES情報は存在しないと判断する場合(ステップS370における「No」)、処理は終了する。この場合、配信されたTS内に字幕ESが含まれていないため、メイン字幕デコーダ360及びサブ字幕デコーダ361に対して字幕ESの割当はなされていない。
3.4 映像処理装置301a及び映像処理装置302a
ここでは、映像処理装置301a及び映像処理装置302aの字幕の表示について、簡単に説明する。
映像処理装置301aは、1palne+offset方式による字幕表示を行う装置であるため、2ESによる字幕セットを用いた字幕の3D表示はできないし、1ESによる2plane+offset方式を用いた字幕の3D表示はできない。そこで、ES情報に3D字幕記述子が存在する場合には、subtitle_mode=0かつsubtitle_component=0であるときのみ当該ES情報で示される字幕ESを用いて1palne+offset方式による字幕表示を行う。ES情報に3D字幕記述子が存在するが、subtitle_mode=0かつsubtitle_component=0でない場合、及び3D字幕記述子が存在しない場合には、映像処理装置301aは、2D用のES情報が存在するときには、当該ES情報で示される字幕ESを用いて1palne+offset方式による字幕表示を行う。
また、映像処理装置302aは、字幕の3D表示そのものができない。そこで、3D字幕記述子が存在しないES情報、つまり2D用のES情報が存在する場合には、当該ES情報で示される字幕ESを用いて2Dの字幕表示を行う。
3.5 変形例
また、上記実施の形態に限らず、例えば、以下のような変形例が考えられる。
(1)上記第2の実施の形態において、字幕の配信方法が2ESである場合、3D字幕記述子において、“pair_PID”を記載し、ペアとなる字幕ESを特定したが、これに限定されない。
ペアとなる字幕ESを特定できる方法であれば、どのような方法であってもよい。例えば、component_tagなどのPID以外のパラメータによってペアとなる字幕ESを特定してもよい。
または、左目用字幕のPIDやcomponent_tagに固定値を足した値もしくは引いた値を右目用字幕のPIDやcomponent_tagの値とするよう配信側と受信側でルールを決めておくことで、片方のESのPIDやcomponent_tag取得した時点でペアとなるESのPIDやcomponent_tagを特定できるようにしてもよい。
または、PIDやcomponent_tag等のパラメータにおいて、2ESで配信する字幕の左目用字幕にのみ割当てる値の範囲や、2ESで配信する字幕の右目用字幕にのみ割当てる値の範囲や、再生モードが1plane+offsetであり、1ESで配信する字幕にのみ割当てる値の範囲や、再生モードが2plane+offsetであり、1ESで配信する字幕にのみ割当てる値の範囲を配信側と受信側でルールを決めておくことで、PIDやcomponent_tag等のパラメータを取得した時点で、字幕ESの再生モードが1plane+offsetであり、1ESで配信する字幕のESか、再生モードが2plane+offsetであり、1ESで配信する字幕のESか、左目用字幕のESか右目用字幕のESであることを特定できるようにしてもよい。例えば、2ESで配信する字幕の左目用字幕のcomponent_tagは「0x31」、右目用字幕のcomponent_tagは「0x32」というように配信側と受信側でルールを決めておけばよい。
また、PIDやcomponent_tagなどによってペアとなる字幕ESを特定するのではなく、重畳する映像の字幕を指定することで、メイン字幕デコーダ360とサブ字幕デコーダ361とに割当てる字幕ESを判定してもよい。例えば、左目用字幕のESのES情報には対応する左目用映像を特定するためのPIDやcomponent_tagを指定する。
(2)上記第2の実施の形態では、3D字幕記述子(stereoscopic_subtitle_descriptor)をPMTに配置したが、これに限定されない。
3D字幕記述子は、他のSI/PSIのテーブルに配置してもよい。例えば、SIのEITのループに配置しても良い。また、SIとPSI両方に3D字幕記述子(stereoscopic_subtitle_descriptor)を配置してもよい。
EITなどのSIは番組開始以前に取得可能な情報であるため、番組開始前にデコーダ割当部351aによって、左目用字幕ESのPIDと右目用字幕ESのPIDを特定しておくことも可能である。なお、SIは番組開始以前から配信されている情報であり、番組直前にPIDが変更される可能性もあるため、番組開始時にSIとPSIに記載されたstereoscopic_subtitle_descriptor記述子の内容を比較し、記載内容が異なる場合には、PSIに記載された情報を優先してもよい。
(3)上記第2の実施の形態において、配信される字幕セットに対する配信方法及び再生方法を、3D字幕記述子によって判別したが、これに限定されない。
例えば、SI/PSIのテーブルのreserved領域やreserved_future_use領域など、現在使用されていない領域を拡張して、3D字幕記述子に記載しているのと同等の情報を、これら拡張した領域に分割して入れても良い。
(4)上記第2の実施の形態では、左目用字幕のES情報及び右目用字幕のES情報それぞれに3D字幕記述子(stereoscopic_subtitle_descriptor)を配置し、自身が左目用字幕か右目用字幕かというview情報とペアとなる字幕ESを特定するためのpair_PIDの情報とを記載するとしたが、これに限定されない。
どちらかの字幕ESのES情報に3D字幕ペア記述子を配置したり、両方の字幕ESのES情報として、view情報のみを記載して、pair_PIDパラメータを省略したりしてもよい。
例えば、左目用字幕のES情報、及び右目用字幕のES情報のうち一方のES情報の3D字幕記述子を配置する場合には、ES情報記載箇所D101で記述される左目用字幕のES情報、及び右目用字幕のES情報のうち、先行して記載されるES情報に3D字幕記述子を記載する。これにより、左目用字幕のES情報、及び右目用字幕のES情報のうち片方のES情報、つまりES情報記載箇所D101で先行して記述されたES情報を読んだ時点で、左目用字幕ESと右目用字幕ESを特定でき、表示までの時間を短縮することができる。
(5)上記第2の実施の形態で、2D用の字幕は3D用字幕とは個別に生成されるものとしたが、これに限定されない。
2D用字幕については、3D用字幕のいずれかの字幕ESと共用してもよい。これにより、2D用字幕を別途作成したり配信したりする手間を省くことができる。この場合、3D字幕記述子に、2D用字幕として使用するか否かのパラメータをさらに追加してもよい。
(6)上記第2の実施の形態において、図20、21に示すステップS310、S345において、条件(直前の判定ステップにおける条件)を満たすES情報が複数個ある場合には、複数個のES情報を取得してもよい。なお、この場合、複数のPIDをメイン字幕デコーダ360及びサブ字幕デコーダ361に割当ててもよい。
また、ステップS360、S375において、条件(直前の判定ステップにおける条件)を満たすES情報が複数個ある場合には、複数個のES情報を取得してもよい。なお、この場合、複数のPIDをメイン字幕デコーダ360に割当ててもよい。
(7)上記第2の実施の形態では、2ESで配信される字幕セットがある場合は、2ESで配信される字幕セットを表示し、2ESで配信される字幕セットがない場合は再生モードが2plane+offsetであり、1ESで配信される字幕セットを表示し、2plane+offsetであり、1ESで配信される字幕セットがない場合には、再生モードが1plane+offsetであり、1ESで配信される字幕セットを表示し、いずれもない場合には、2D用の字幕セットを表示するようになっている。すなわち、2ESで配信される字幕セット、再生モードが2plane+offsetであり、1ESで配信される字幕、再生モードが1plane+offsetであり、1ESで配信される字幕、2D字幕の順で表示を優先させているが、これに限定されない。
当該優先順位は一例であり、映像処理装置の処理能力やユーザの嗜好によって、優先順位を変えたり、特性の文字セットの使用を抑制したりしてもよい。
例えば、映像処理装置302aのように、再生モードが1plane+offsetであり、1ESで配信される字幕セットにのみ対応している場合には、2ESで配信される字幕セットや2plane+offsetであり、1ESで配信される字幕セットがあってもメイン字幕デコーダ360及びサブ字幕デコーダ361への割り当ては行なわず、再生モードが1plane+offsetであり、1ESで配信される字幕セットが存在する場合のみ字幕を表示してもよい。
(8)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
3.6 まとめ
以上、説明したように、3D字幕記述子(stereoscopic_subtitle_descriptor)の有無によって字幕ESが2D用字幕か3D用字幕かを判定可能となり、subtitle_modeの値によって再生モードが1plane+offsetであるか2plane+offsetであるかの判定が可能となり、subtitle_componentの値によって字幕セットのES構成が1ESであるか2ESであるかの判定が可能となる。
このように、3D字幕記述子(stereoscopic_subtitle_descriptor)という新規記述子を、3D表示される字幕のES情報として配置して映像配信装置200aから配信し、映像処理装置300aは、デコーダ割当部351aによって、PMTを解析して、解析結果に応じて字幕のパケットを適切な字幕デコーダに出力することにより、配信事業者の意図したとおりの映像(左目用映像/右目用映像)と重畳して表示することが出来る。
4.変形例
また、上記各実施の形態などに限らず、例えば、以下のような変形例が考えられる。
(1)上記各実施の形態では、トランスポートストリームをデジタル放送として配信したが、これに限定されない。
IPTV及びVOD(Video On Demand)としてトランスポートストリームを配信してもよい。
このとき、IPTVとしてトランスポートストリームを配信する場合には、3D字幕ペア記述子又は3D字幕記述子をPMTに記載するのではなく再生制御情報、例えばERI(Entry Resource Information)に記載する。または、IPネットワークによる通信によってトランスポートストリームを配信する場合には、HTTP又はHTTPS(Hypertext Transfer Protocol over Secure Socket Layer)のヘッダに3D字幕ペア記述子又は3D字幕記述子を記載する。
または、VODとしてトランスポートストリームを配信する場合には、ECG(Electronic Content Guide)メタデータに、3D字幕ペア記述子又は3D字幕記述子を記載する。
また、IP放送、VODなど、配信する形態によって運用規定が異なるため、デコーダ割当部351によるPMTに字幕のES情報が存在するか否かを判断(ステップS105参照)については、自身が受信する形態(IP放送、VOD、デジタル放送)によって、判断に使用するパラメータ及びパラメータ値を変更することで実現できる。
(2)上記各実施の形態において、オフセットは左目用映像のパケットに格納するとしたが、これに限定されない。
オフセットは、右目用映像のパケットに格納されてもよい。この場合、オフセット取得部315は、右ビデオデコーダ314からオフセットを取得することとなる。
または、オフセット取得部315は、左目用映像と右目用映像の差分から、映像の奥行き情報を算出し、これを利用してオフセット情報を生成するとしてもよい。
(3)上記各実施の形態では、映像処理装置の一例としてデジタルテレビであるとしたが、これに限定されない。映像処理装置を、DVDレコーダ、BD(Blu−ray Disc)レコーダやセットトップボックスに適用してもよい。
(4)上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(5)上記の各装置を構成する構成要素の一部または全部は、1個の集積回路から構成されているとしてもよい。
例えば、第1の実施の形態で示す映像配信装置200は、図22に示すように、ES属性情報記憶部201、番組配列情報生成部202、AVエンコーダ203、字幕符号化部204、音声符号化部205、多重化部206及び配信部207の各機能ブロックは典型的には集積回路であるLSIとして実現してもよい。これらは個別に1チップ化されてもよいし、1以上の構成要素、又は各構成要素の一部を含むように1チップ化されてもよい。
また、第1の実施の形態で示す映像処理装置300は、図23に示すように、入力受付部311、分離処理部312、左ビデオデコーダ313、右ビデオデコーダ314、オフセット取得部315、左目映像出力部316、右目映像出力部317、字幕生成部318、音声デコーダ319、重畳部320、321及び表示処理部322の各機能ブロックは典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、1以上の構成要素、又は各構成要素の一部を含むように1チップ化されてもよい。
(6)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。
(7)上記の実施の形態及び変形例で説明した手法の手順を記述したプログラムをメモリに記憶しておき、CPU(Central Processing Unit)などがメモリからプログラムを読み出して、読み出したプログラムを実行することによって、上記の手法が実現されるようにしてもよい。
また、当該手法の手順を記述したプログラムを記録媒体に格納して、頒布するようにしてもよい。なお、上記プログラムを記憶する媒体としては、例えば、ICカード、ハードディスク、光ディスク、フレキシブルディスク、ROM、フラッシュメモリ等がある。
(8)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
6.補足
(1)本発明の一態様である、3D映像の映像ストリームを受信しつつ、再生する映像処理装置は、3D映像とともに表示される表示データのデータストリームを含み、且つ表示データについて左目用表示データと右目用表示データがそれぞれ個別にストリーム化された左目用のデータストリーム及び右目用のデータストリーム双方が存在するか否かを示す付加情報を含むトランスポートストリームを受信する受信手段と、前記付加情報に基づいて、前記トランスポートストリームに左目用のデータストリーム及び右目用のデータストリーム双方が存在するか否かを判別する判別手段と、存在すると判別された場合には左目用のデータストリームから左目用表示データを、右目用のデータストリームから右目用表示データをそれぞれ生成し、存在しないと判別された場合には前記データストリームから左目用表示データ及び右目用表示データを生成する表示データ生成手段とを備えることを特徴とする。
この構成によると、映像処理装置は、トランスポートストリームに含まれる付加情報を用いて、左目用データストリーム及び右目用データストリームの存在の有無を判断するので、表示データのストリームの配信形態を迅速に特定し、特定した配信形態に応じた表示データの3D表示を迅速に行うことができる。
(2)ここで、前記映像ストリームから得られる複数の映像により一の3D番組が構成され、前記付加情報は、前記一の3D番組に関するPMT(Program Map Table)であり、前記判別手段は、前記PMTに左目用のデータストリーム及び右目用のデータストリーム双方の存在を示す記述が存在するか否かにより、前記判別を行うとしてもよい。
この構成によると、映像処理装置は、PMTを用いた前記判別を行うので、表示データを含むストリームの内容を解析する前に、左目用データストリーム及び右目用データストリームの存在の有無を特定することができる。そのため、映像処理装置は、表示データのストリームの配信形態を迅速に特定することができる。
(3)ここで、前記トランスポートストリームに左目用のデータストリーム及び右目用のデータストリームが含まれる場合には、前記PMTに、左目用のデータストリーム及び右目用のデータストリームのうち少なくとも何れか一方の存在を示す記述子が含まれ、当該記述子には、他方を特定する識別子が記載されており、前記判別手段は、前記PMTに前記記述子が存在するか否による前記判別を行い、存在すると判別する場合には、さらに、当該記述子から他方を特定する識別子を取得するとしてもよい。
この構成によると、映像処理装置は、左目用データストリーム及び右目用データストリームのうち少なくとも何れか一方の存在を示す記述子の有無を判別し、記述子が存在する場合には当該記述子から他方を特定することができるので、PMTの解析の時間を短縮することができる。
(4)ここで、前記判別手段は、前記PMTに左目用のデータストリームの存在を示す第1記述子、及び右目用のデータストリームの存在を示す第2記述子が存在するか否により、前記判別を行うとしてもよい。
この構成によると、映像処理装置は、第1記述子及び第2記述子の双方の存在を判別することで、左目用データストリーム及び右目用データストリームの存在の有無を特定することができ、さらに当該判別により左目用データストリームと右目用データストリームとの相互の対応をも特定することができる。
(5)ここで、前記付加情報は、左目用のデータストリーム及び右目用のデータストリーム双方が存在するか否かを示す第1判別情報と、1つのプレーンを用いて前記表示データ生成手段による前記処理が行われる第1生成手法及び2つのプレーンを用いて前記処理が行われる第2生成手法の何れを用いるかを示す第2判別情報とを含んでおり、前記データストリームは、前記第1生成手法が用いられる第1種データストリームであり、前記トランスポートストリームにおいて、表示データについて左目用表示データと右目用表示データとが同一のストリームとなるようストリーム化された第2種データストリームが含まれる場合には、前記第2判別情報には前記第2生成手法が用いられることが示されており、前記判別手段は、前記第1判別情報を用いて、前記判別を行い、前記判別により左目用のデータストリーム及び右目用のデータストリーム双方が存在しないと判別した場合には、さらに、前記第2判別情報が前記第1生成手法及び前記第2生成手法のうち何れを示しているか判別し、前記表示データ生成手段は、前記判別手段で左目用のデータストリーム及び右目用のデータストリーム双方が存在すると判別された場合には、前記第2生成手法により前記処理を行い、前記判別手段で左目用データストリーム及び右目用データストリーム双方が存在しないと判別され、且つ前記第2判別情報が前記第2生成手法を用いることを示していると判別された場合には、前記第2生成手法を用いて前記第2種データストリームから左目用表示データ及び右目用表示データを生成し、前記判別手段で左目用データストリームと右目用データストリームとが存在しないと判別され、且つ前記第2判別情報が前記第1生成手法を用いることを示していると判別された場合には、前記第1生成手法を用いて前記第1種データストリームから左目用表示データ及び右目用表示データを生成するとしてもよい。
この構成によると、映像処理装置は、左目用表示データ及び右目用表示データの生成の優先順位を、左目用データストリームと右目用データストリームとから生成、第2種データストリームから生成、第1種データストリームから生成としている。一般的に、1つデータから左目用及び右目用のデータを生成する場合に比べて、個別のデータから左目用及び右目用のデータそれぞれを生成する方が画質はよい。また、個別のデータを1つのストリームでストリーム化するよりも、個別にストリーム化する方が画質はよい。よって、映像処理装置は、上記の優先順位に従って、画質がよい表示データを優先的に表示することができる。
(6)また、本発明の一態様である、映像処理装置に3D映像の映像ストリームを受信させつつ、再生させるために前記映像ストリームを送信する送信装置は、3D映像とともに表示される表示データについて左目用表示データと右目用表示データがそれぞれ個別にストリーム化された左目用のデータストリームと右目用のデータストリーム双方が存在するか否かを示す付加情報を生成する付加情報生成手段と、表示データのデータストリームの生成、及び前記付加情報が示す内容に応じて前記左目用のデータストリームと前記右目用のデータストリームとの生成を行うストリーム生成手段と、前記付加情報、前記映像ストリーム、及び前記ストリーム生成手段で生成された全てのストリームを多重化して送信する送信手段とを備えることを特徴とする。
この構成によると、送信装置は、トランスポートストリームに付加情報を含めて映像処理装置に送信し、映像処理装置に、当該付加情報を用いて左目用データストリーム及び右目用データストリームの存在の有無を判断させることで、表示データのストリームの配信形態を迅速に特定させ、特定した配信形態に応じた表示データの3D表示を迅速に行わせることができる。
(7)ここで、前記映像ストリームから得られる複数の映像により一の3D番組が構成され、前記付加情報は、前記一の3D番組に関するPMT(Program Map Table)であり、前記付加情報生成手段は、前記トランスポートストリームに、前記左目用のデータストリームと前記右目用のデータストリームとを含める場合には、前記PMTに前記左目用のデータストリーム及び前記右目用のデータストリーム双方の存在を示す記述を記載するとしてもよい。
この構成によると、送信装置は、映像処理装置にPMTを用いた前記判別を行わせるので、表示データを含むストリームの内容を解析する前に、左目用データストリーム及び右目用データストリームの存在の有無を特定させることができる。
(8)ここで、前記付加情報生成手段は、前記PMTに左目用のデータストリーム及び右目用のデータストリームのうち何れか一方の存在を示す記述子を含め、さらに、当該記述子に他方を特定する識別子を記載するとしてもよい。
この構成によると、送信装置は、左目用データストリーム及び右目用データストリームのうち少なくとも何れか一方の存在を示す記述子をPMTに含め、当該記述子には他方を特定する識別子を記載するので、映像処理装置に、当該記述子の有無を判別させ、記述子が存在する場合には当該記述子から他方を特定させることができるので、PMTの解析の時間を短縮させることができる。
(9)ここで、前記付加情報生成手段は、前記PMTに左目用のデータストリームの存在を示す第1記述子、及び右目用のデータストリームの存在を示す第2記述子を含めるとしてもよい。
この構成によると、送信装置は、第1記述子及び第2記述子をPMTに含めるので、映像処理装置にこれら記述子の双方の存在を判別させることで、左目用データストリーム及び右目用データストリームの存在の有無を特定させることができ、さらに当該判別により左目用データストリームと右目用データストリームとの相互の対応をも特定させることができる。
(10)ここで、前記付加情報生成手段は、左目用のデータストリーム及び右目用のデータストリーム双方が存在するか否かを示す第1判別情報と、1つのプレーンを用いて前記表示データ生成手段による前記処理が行われる第1生成手法及び2つのプレーンを用いて前記処理が行われる第2生成手法の何れを用いるかを示す第2判別情報とを含む前記付加情報を生成し、前記データストリームは、前記第1生成手法が用いられる第1種データストリームであり、前記ストリーム生成手段は、前記第1判別情報が左目用のデータストリーム及び右目用のデータストリーム双方が存在しないことを示し、且つ前記第2判別情報が前記第2生成手法を用いることを示す場合には、さらに、表示データについて左目用表示データと右目用表示データとが同一のストリームとなるようストリーム化された第2種データストリームを生成するとしてもよい。
この構成によると、送信装置は、第1判別情報及び第2判別情報により、左目用データストリーム及び右目用データストリームの存在の有無、及び各表示データの生成方法を、映像処理装置に容易に特定させることができる。また、送信装置は、左目用データストリーム及び右目用データストリームが存在しない場合であっても、第2種データストリームを送信することで、映像処理装置に第2生成手法を行わせるので、左目用データストリーム及び右目用データストリームそれぞれから生成された各表示データの画質と同等の画質を映像処理装置に提供することができる。
(11)また、本発明の一態様である、3D映像のストリームを送信する送信装置と、当該映像ストリームを受信しつつ、再生する映像処理装置とからなる映像処理システムは、前記送信装置は、3D映像とともに表示される表示データについて左目用表示データと右目用表示データがそれぞれ個別にストリーム化された左目用のデータストリームと右目用のデータストリーム双方が存在するか否かを示す付加情報を生成する付加情報生成手段と、表示データのデータストリームの生成、及び前記付加情報が示す内容に応じて前記左目用のデータストリームと前記右目用のデータストリームとの生成を行うストリーム生成手段と、前記付加情報、前記映像ストリーム、及び前記ストリーム生成手段で生成された全てのストリームが多重化されたトランスポートストリームを送信する送信手段とを備え、前記映像処理装置は、前記トランスポートストリームを受信する受信手段と、前記付加情報に基づいて、前記トランスポートストリームに左目用のデータストリーム及び右目用のデータストリーム双方が存在するか否かを判別する判別手段と、存在すると判別された場合には左目用のデータストリームから左目用表示データを、右目用のデータストリームから右目用表示データをそれぞれ生成し、存在しないと判別された場合には前記データストリームから左目用表示データ及び右目用表示データを生成する表示データ生成手段とを備えることを特徴とする。
この構成によると、映像処理システムの送信装置は、トランスポートストリームに付加情報を含めて映像処理装置に送信し、映像処理装置は、トランスポートストリームに含まれる付加情報を用いて、左目用データストリーム及び右目用データストリームの存在の有無を判断する。これにより、映像処理システムでは、表示データの配信形態を迅速に特定し、特定した配信形態に応じた表示データの3D表示を迅速に行うことができる。