JP5957770B2

JP5957770B2 - 映像処理装置、方法、プログラム、記録媒体及び集積回路

Info

Publication number: JP5957770B2
Application number: JP2013517849A
Authority: JP
Inventors: 宗續　敏彦; 敏彦宗續; 由佳小澤; 川口　透; 透川口; 洋矢羽田; 上坂　靖; 靖上坂; 智輝小川
Original assignee: Panasonic Intellectual Property Management Co Ltd
Current assignee: Panasonic Intellectual Property Management Co Ltd
Priority date: 2011-06-01
Filing date: 2012-05-21
Publication date: 2016-07-27
Anticipated expiration: 2032-05-21
Also published as: JPWO2012164864A1; US20120311645A1; WO2012164864A1; AR086599A1

Description

本発明は、ストリームデータを処理する技術に関し、特に３Ｄ映像と共に表示されるべき字幕等のデータの処理技術に関する。

放送や、インターネットなどネットワークでの映像配信において、映画などのデジタル映像コンテンツの字幕は、映像データとは別のデータとして、映像データと関連付けられて配信され、受信装置側でデジタル映像コンテンツと共に表示される。

視聴者が立体的な映像として見ることができる３Ｄデジタル映像コンテンツ（以下、「３Ｄ映像」と呼ぶ。）においても、立体的な映像として見える仕組みを導入していないデジタル映像コンテンツ（以下、「２Ｄ映像」と呼ぶ。）において字幕を表示するのと同様に、字幕を３Ｄ映像と共に表示する。ところが、２Ｄ映像と同じように３Ｄ映像に字幕を重ね合わせると、３Ｄ映像は画面の手前や奥に広がりがあるので、字幕が３Ｄ映像の奥に位置したり、手前に位置したりして見づらくなる。そこで、これを改善するために、３Ｄ映像と共に表示する字幕（以下、「３Ｄ字幕」と呼ぶ。）を３Ｄ空間内に適切に配置して表示するための技術として、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードと２ｐｌａｎｅ＋ｏｆｆｓｅｔモードによる処理技術が提案されている（非特許文献１）。なお、デジタル放送において２Ｄ映像や３Ｄ映像と共に表示するために配信される表示データには、字幕以外にもテロップやデータ放送用の表示データ等があり、これらのデータを３Ｄ映像と共に表示する際に、上記の処理技術が応用できる。以下、字幕、テロップ、データ放送用の表示データなどを総称して「字幕等表示データ」と呼ぶこととする。また、１ｐｌａｎｅ＋ｏｆｆｓｅｔモード、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードをまとめて３Ｄ字幕等表示モードと呼ぶこととする。

Ｂｌｕ−ｒａｙＤｉｓｃＡｓｓｏｃｉａｔｉｏｎ、″ＷｈｉｔｅＰａｐｅｒＢｌｕ−ｒａｙＤｉｓｃＲｅａｄ−ＯｎｌｙＦｏｒｍａｔ″、ｐ．３９〜ｐ．４２、″６．３３Ｄｇｒａｐｈｉｃｓｗｉｔｈ３Ｄｖｉｄｅｏ″、［ｏｎｌｉｎｅ］、２０１０年０７月、Ｂｌｕ−ｒａｙＤｉｓｃＡｓｓｏｃｉａｔｉｏｎ、［２０１２年４月２日検索］、インターネット〈ＵＲＬ：ｈｔｔｐ：／／ｗｗｗ．ｂｌｕ−ｒａｙｄｉｓｃ．ｃｏｍ／ａｓｓｅｔｓ／Ｄｏｗｎｌｏａｄａｂｌｅｆｉｌｅ／ＢＤ−ＲＯＭ＿Ａｕｄｉｏ＿Ｖｉｓｕａｌ＿Ａｐｐｌｉｃａｔｉｏｎ＿Ｆｏｒｍａｔ＿Ｓｐｅｃｉｆｉｃａｔｉｏｎｓ−１８７８０．ｐｄｆ

しかしながら、３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであるか２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであるかは、字幕等表示データを含むストリームの内容を解析することにより判別し得るが、字幕等表示データを含むストリームの内容を解析して３Ｄ字幕等表示モードを判別するのでは、字幕等表示データを３Ｄ映像と共に表示するまでの処理に比較的大きな時間がかかる。このため、映像処理装置において、迅速に３Ｄ字幕等表示モードを判別できることが望まれる。そこで、映像配信システムから、新たに３Ｄ字幕等表示モードを迅速に識別できる情報を含めたストリームを配信することが考えられている。
しかしながら、映像処理装置は、このような情報を用いた判別処理に対応することができず、このままでは新たな映像配信システムの良さを生かすことができない。このため、新たな映像配信システムに対応する映像処理装置の開発が喫緊の課題となっている。
本発明は、上記課題を解決するためになされたものであり、映像配信システムから配信された３Ｄ字幕等表示モードを迅速に識別できる情報を含めたストリームを処理し、迅速に３Ｄ字幕等表示モードを判別することのできる映像処理装置を提供することを目的とする。

上記課題を解決するために本発明に係る映像処理装置は、３Ｄ映像と共に補助表示物を表示するための映像処理装置であって、前記補助表示物を１プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第１の処理手段と、前記補助表示物を２プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第２の処理手段と、前記補助表示物を１プレーン及び２プレーンのいずれかを用いて表す情報を含む補助表示物再生用ストリームと、前記補助表示物が１プレーン及び２プレーンのいずれで表されているかを示す識別情報を含むデータブロックとを含んで構成される伝送ストリームを受信する受信手段と、前記補助表示物再生用ストリームの内容が参照されることに先行して、データブロック内の識別情報を抽出し、当該識別情報に応じて第１の処理手段及び第２の処理手段のいずれかを選択する選択手段と、前記選択手段による前記選択の後に、前記補助表示物再生用ストリームの内容である補助表示物を表す情報を、第１の処理手段及び第２の処理手段のうち当該選択手段により選択された処理手段に対して、逐次供給して右目用補助表示物及び左目用補助表示物の作成及び出力を行わせる制御手段とを備える。

本発明に係る映像処理装置は、映像配信システムから配信された３Ｄ字幕等表示モードを迅速に識別できる情報を含めたストリームを処理し、迅速に３Ｄ字幕等表示モードを判別することができる。

ＰＭＴのデータ構造を示す図。記述子ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏのデータ構造を示す図。ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅ及びｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅそれぞれの値と３Ｄ字幕等表示モードの関係を示す図。本発明の実施の形態に係る映像処理装置３００の機能構成を示すブロック図。字幕処理手段３０９の機能ブロック図。データ放送処理手段３１０の機能ブロック図。映像処理装置３００の処理を示すフローチャート。実施の形態１における判定手段３０４の処理を示すフローチャート。記述子ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏのデータ構造の第１の変形例を示す図。図９の変形例におけるｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅ及びｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅそれぞれの値と３Ｄ字幕等表示モードの関係を示す図。記述子ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏのデータ構造の第２の変形例を示す図。１ｐｌａｎｅ＋ｏｆｆｓｅｔモードの概念を示す図。２ｐｌａｎｅ＋ｏｆｆｓｅｔモードの概念を示す図。多重化装置３０００の機能構成を示すブロック図。データ符号化方式記述子のデータ構造を示す図。ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値と３Ｄ字幕等表示モードの関係を示す図。実施の形態２における判定手段３０４の処理を示すフローチャート。ａｄｄｉｔｉｏｎａｌ＿ａｒｉｂ＿ｂｘｍｌ＿ｉｎｆｏのデータ構造を示す図。ａｄｄｉｔｉｏｎａｌ＿ａｒｉｂ＿ｃａｒｏｕｓｅｌ＿ｉｎｆｏのデータ構造を示す図。ＥＩＴのデータ構造を示す図。データコンテンツ記述子のデータ構造を示す図。実施の形態５における判定手段３０４の処理を示すフローチャート。ａｒｉｂ＿ｂｘｍｌ＿ｉｎｆｏのデータ構造を示す図。ａｒｉｂ＿ｂｘｍｌ＿ｉｎｆｏのａｒｉｂ＿ｃａｒｏｕｓｅｌ＿ｉｎｆｏに記述されるデータの構成を示す図。ＥＲＩのデータ構造を示す図。電子映像配信システム２２００の概略構成図である。電子映像配信システム２２００の処理のシーケンスを示す図。（ａ）３Ｄ字幕等表示モードの識別情報を記載するＥＲＩにおけるタグ要素の第１の変形例を示す図、（ｂ）同じく第２の変形例を示す図。ＥＣＧメタデータのデータ構造を示す図。３Ｄ字幕等表示モードの識別情報を記載するＥＣＧメタデータにおけるタグ要素の変形例を示す図。（ａ）映像処理装置が送信するＨＴＴＰ−ＧＥＴリクエストの一例を示す図。（ｂ）１ｐｌａｎｅ＋ｏｆｆｓｅｔモードの場合のＨＴＴＰレスポンンスヘッダの応答の一例を示す図。（ｃ）２ｐｌａｎｅ＋ｏｆｆｓｅｔモードの場合のＨＴＴＰレスポンンスヘッダの応答の一例を示す図。実施の形態９におけるデータ放送用データ提供サーバの概略構成図。

＜本発明に係る一形態を得るに至った経緯＞
３Ｄ映像の視聴者は、平面的な２Ｄ映像の視聴時とは異なって、映像が画面の手前方向や奥方向に広がりをもつように感じる。

このような３Ｄ映像と共に、字幕等表示データを表示させる場合には、字幕等表示データも、３Ｄ映像に合わせて適切に３Ｄ空間内に配置して表示しなければ、視聴者にとって見づらい表示となる可能性がある。

３Ｄ映像と共に３Ｄ空間内に適切に字幕等表示データを表示する方法として、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードと２ｐｌａｎｅ＋ｏｆｆｓｅｔモードの方法がある（これら３Ｄ字幕等表示モードにそれぞれの処理の詳細については後述する。）が、字幕等表示データがどちらの方式で処理されるデータであるかは、字幕等表示データを含むストリームの内容を解析しなければ、判別できない。

３Ｄ字幕等表示モードのそれぞれのモードでは、処理方法が異なり、デコーダの数やメモリ量など処理に必要なリソースが異なる。また、これらのリソースは、映像処理装置の他の処理（例えば、裏番組の録画や、録画済みの番組のダビングなどの処理）と共有で使用され、各処理の実行の際には、リソースの確保のために他の処理と調停を行う必要がある。そのため、解析してからリソースを確保して、データを処理するのでは、３Ｄ映像と共に表示されるまでに時間がかかる。

本発明者らは、映像処理装置において、字幕等表示データのストリームを処理する前に参照されるべきデータブロックに着目し、このデータブロックに３Ｄ字幕等表示モードを識別するための情報（以下、「モード識別情報」と呼ぶ。）を記述したデータを配信するシステムを想到するに至った。このシステムでは、モード識別情報を３Ｄ映像と共に表示する表示データを含むデータの処理に先だって処理されるデータブロックに含ませて配信するので、映像処理装置は、３Ｄ映像と共に表示する表示データを解析して処理する前に、このモード識別情報に基づいて、３Ｄ字幕等表示モードを識別し、それぞれのモードで必要なリソースの確保を開始することができる。これにより、３Ｄ映像と共に表示する字幕等表示データが３Ｄ映像と共に表示されるまでの時間を短縮できる。

以下、本発明に係る実施の形態について図を参照しながら説明する。
＜実施の形態１＞
＜１．１概要＞
本発明に係る実施の形態の映像処理装置は、放送やデータ配信で用いられているＭＰＥＧ２−ＴＳ（ＴｒａｎｓｐｏｒｔＳｔｒｅａｍ）形式のデータストリームを受信する。

データストリームの送信側（例えば放送局）は、番組（プログラム）を構成する３Ｄ映像データ、音声データ、字幕データ、データ放送用データなどをそれぞれ符号化してＥＳ（ＥｌｅｍｅｎｔａｒｙＳｔｒｅａｍ）を生成し、多重化したデータストリームを配信する。なお、本実施の形態でいうコンテンツの概念には、このように放送やデータ配信される番組を含むものとする。なお、多重化したデータストリームを生成する多重化装置については後述する。このとき、データストリームの送信側は、従来のＭＰＥＧ２−ＴＳ形式のデータストリームに含まれるＳＩ（ＳｅｒｖｉｃｅＩｎｆｏｒｍａｔｉｏｎ）／ＰＳＩ（ＰｒｏｇｒａｍＳｐｅｃｉｆｉｃＩｎｆｏｒｍａｔｉｏｎ）にモード識別情報を記載して送信する。

映像処理装置は、受信したデータストリームに含まれるＳＩ／ＰＳＩに記載されているモード識別情報を、字幕等表示データを含むストリームを処理する前に、抽出して解析することにより３Ｄ字幕等表示モードを判別する。

＜１．２データ＞
以下、本実施の形態で用いるデータのデータ構造について説明する。

本実施の形態ではＭＰＥＧ２−ＴＳ規格に規定されているＳＩ／ＰＳＩ情報を利用する。ＳＩとは番組に関する情報を映像処理装置が解釈可能な形式で符号化した各種テーブルの総称である。これは、ＡＲＩＢ（ＴｈｅＡｓｓｏｃｉａｔｉｏｎｏｆＲａｄｉｏＩｎｄｕｓｔｒｉｅｓａｎｄＢｕｓｉｎｅｓｓｅｓ）によって規定されており、例えば、ＮＩＴ（ＮｅｔｗｏｒｋＩｎｆｏｒｍａｔｉｏｎＴａｂｌｅ）、ＥＩＴ（ＥｖｅｎｔＩｎｆｏｒｍａｔｉｏｎＴａｂｌｅ）のテーブルがこれに含まれる。

ＰＳＩとはＴＳに含まれる各ＥＳがどの番組に属しているかを記載した情報を映像処理装置が解釈可能な形式で符号化した各種テーブルの総称である。ＩＳＯ／ＩＥＣ１３８１８−１及びＡＲＩＢが策定した規格に規定されており、例えば、ＰＡＴ（ＰｒｏｇｒａｍＡｓｓｏｃｉａｔｉｏｎＴａｂｌｅ）やＰＭＴ（ＰｒｏｇｒａｍＭａｐＴａｂｌｅ）のテーブルがこれに含まれる。

本実施の形態１では、モード識別情報を記載するテーブルとしてＰＭＴを用いる。

図１はＰＭＴのデータ構造を示す図である。

ＰＭＴは、配信する番組の情報や、番組のＥＳ構成及び、それぞれのＥＳに関する情報を格納する。

個々のフィールドについては、ＩＳＯ／ＩＥＣ１３８１８−１（ＭＰＥＧ−２）にて規定されているため説明を省略し、本実施の形態に関連する部分のみ説明を行なう。

ＰＭＴには、同図のファーストループ４００のｄｅｓｃｒｉｐｔｏｒ（）の箇所と、セカンドループ４０２のｄｅｓｃｒｉｐｔｏｒ（）の箇所に記述子を記述することができる。

本実施の形態では、１つの番組の途中では３Ｄ字幕等表示モードは変わらないものとする。このため、番組全体で共通な情報に関する記述子を定義する箇所であるＰＭＴのファーストループ４００に新たにａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏという記述子を記述し、モード識別情報として、ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅと、ｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅとをこの記述子に記述して、３Ｄ字幕等表示モードの判定に用いる。

図２にａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子のデータ構造を示す。

ａｒｉｂ＿３ｄ＿ｏｉｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子の中で、ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅという１ｂｉｔのフィールドが字幕に関する３Ｄ字幕等表示モードを、ｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅという１ｂｉｔのフィールドがデータ放送に関する３Ｄ字幕等表示モードをそれぞれ識別するために用いるフィールドである。

図３は、ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅ及びｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅそれぞれの値と３Ｄ字幕等表示モードの関係を表す。図３では、ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅ及びｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅの値が「０」の場合は、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードを示し、「１」の場合は２ｐｌａｎｅ＋ｏｆｆｓｅｔモードを示す。

本実施の形態の映像処理装置３００は、図２で示したａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子が、図１で示したファーストループ４００のｄｅｓｃｒｉｐｔｏｒ（）の箇所に記載されたＰＭＴを受信する。

＜１．３構成＞
図４は、本発明の実施の形態に係る映像処理装置３００の機能ブロック図である。

映像処理装置３００は、受信部３０１、デマルチプレクサ３０２、解析手段３０３、判定手段３０４、ビデオデコード手段３０５、オフセット取得手段３０６、左目映像出力手段３０７、右目映像出力手段３０８、字幕処理手段３０９、データ放送処理手段３１０、及び表示用映像出力手段３１１を含む構成である。

映像処理装置３００は、図示されていないプロセッサ、及びＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ハードディスクを含む構成である。また、映像処理装置３００の各機能ブロックは、ハードウェアとして構成されているか、もしくは前記プロセッサが前記ＲＯＭや前記ハードディスクに記憶されているプログラムを実行することで実現される。
（受信部３０１）
受信部３０１は、チューナーであり、放送局や配信センターから配信されたＭＰＥＧ２−ＴＳ形式のストリームデータを受信する。
（デマルチプレクサ３０２）
デマルチプレクサ３０２は、受信部３０１で受信したＭＰＥＧ２−ＴＳのストリームデータからＰＡＴを抽出し解析手段３０３へ出力する機能を備える。また、解析手段３０３でＰＡＴを解析して得られるＰＭＴのＰＩＤの情報に従って、ＰＭＴのＰＩＤを持つＴＳパケットを解析手段３０３へ出力する機能を備える。また、解析手段３０３でＰＭＴを解析して得られる再生対象の番組（プログラム）に関係するＴＳパケットの持つＰＩＤを選択する機能を備える。そして、ＰＩＤに基づいてＴＳパケットの種類別に、ＳＩ／ＰＳＩ情報のパケットは解析手段３０３へ、映像データのパケットはビデオデコード手段３０５へ、字幕データのパケットは字幕処理手段３０９へ、データ放送に関するデータのパケットはデータ放送処理手段３１０へ、それぞれ振り分けて出力する機能を備える。
（解析手段３０３）
解析手段３０３は、ＰＡＴ、ＰＭＴ、ＮＩＴ、ＥＩＴ、ＢＩＴ（ＢｒｏａｄｃａｓｔｅｒＩｎｆｏｒｍａｔｉｏｎＴａｂｌｅ）などのＳＩ／ＰＳＩの内容を解析する機能と、ＰＡＴの解析の結果得られる再生対象の番組(プログラム)のＰＭＴのＰＩＤをデマルチプレクサ３０２に出力する機能と、ＰＭＴの解析の結果得られる再生対象の番組を構成する映像や音声などのデータそれぞれのＰＩＤをマルチプレクサ３０２に出力する機能と、ＰＭＴの解析の結果から得られるモード識別情報を判定手段３０４に出力する機能とを備える。
（判定手段３０４）
判定手段３０４は、解析手段３０３から出力されたモード識別情報を基に、字幕処理手段３０９及びデータ放送処理手段３１０でのデータの処理に使用する３Ｄ字幕等表示モードを選択し、選択結果を字幕処理手段３０９及びデータ放送処理手段３１０に出力する機能を備える。また、選択した３Ｄ字幕等表示モードでの処理に必要なデコーダとプレーンメモリを確保する機能を備える。
（ビデオデコード手段３０５）
ビデオデコード手段３０５は、デマルチプレクサ３０２で振り分けられて入力された３Ｄ映像のデータを含むＴＳパケットから符号化された３Ｄ映像データを抽出して復号し、左目用の映像フレームを左目映像出力手段３０７に、右目用の映像フレームを右目映像出力手段３０８に、それぞれ出力する機能を備える。例えば、サイドバイサイド方式による３Ｄ映像を復号処理したり、ＭＰＥＧ４−ＭＶＣ形式の３Ｄ映像を復号処理したりする。
（オフセット取得手段３０６）
オフセット取得手段３０６は、ビデオデコード手段３０５で復号する３Ｄ映像のデータを含むＴＳパケットに含まれている、３Ｄ映像と共に表示する字幕等のデータを３Ｄ表示するための処理に用いるｏｆｆｓｅｔ値を取得する機能を備える。また、取得したｏｆｆｓｅｔ値は、字幕データがある場合には、字幕処理手段３０９に出力し、データ放送用の表示データがある場合には、データ放送処理手段３１０に出力する機能を備える。
（左目映像出力手段３０７）
左目映像出力手段３０７は、ビデオデコード手段３０５が出力した左目用映像フレームを表示用映像出力手段３１１へ出力する機能を備える。左目用映像フレームは、表示用映像出力手段３１１に出力される前に、左目用字幕映像や左目用データ放送映像が存在すれば、これらの映像と合成され、左目用映像として表示用映像出力手段３１１に出力される。
（右目映像出力手段３０８）
右目映像出力手段３０８は、ビデオデコード手段３０５が出力した右目用映像フレームを表示用映像出力手段３１１へ出力する機能を備える。右目用映像フレームは、表示用映像出力手段３１１に出力される前に、右目用字幕映像や右目用データ放送映像が存在すれば、これらの映像と合成され、右目用映像として表示用映像出力手段３１１に出力される。
（字幕処理手段３０９）
図５は、字幕処理手段３０９の機能ブロック図である。

字幕処理手段３０９は、第１の字幕処理手段７００、第２の字幕処理手段８００、及びスイッチ６００を含む構成である。

スイッチ６００は、判定手段３０４の判定結果に従って、デマルチプレクサ３０２で振り分けられ出力した字幕の表示データを含むパケットを、第１の字幕処理手段７００に出力するか、第２の字幕処理手段８００に出力するのかを切り替える機能を備える。

第１の字幕処理手段７００は、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードで字幕の表示データを含むパケットを処理するためのものであり、字幕デコード手段７０１、字幕プレーンメモリ７０２、左字幕シフト出力手段７０３、及び右字幕シフト出力手段７０４を含む構成である。

字幕デコード手段７０１は、デマルチプレクサ３０２でＭＰＥＧ２−ＴＳストリームデータから振り分けられた字幕データを含むパケットを復号して字幕プレーンの映像を生成する。

字幕プレーンメモリ７０２は、判定手段３０４が、映像処理装置３００の持つＲＡＭ等の記憶媒体の一部を割り当てた領域であり、字幕デコード手段７０１で生成した字幕プレーンの映像を保存する。

左字幕シフト出力手段７０３は、オフセット取得手段３０６が取得したｏｆｆｓｅｔ値に従って、字幕プレーンメモリ７０２に保存する字幕プレーンの映像を左目用にシフトして左目用字幕映像を出力する。

右字幕シフト出力手段７０４は、オフセット取得手段３０６が取得したｏｆｆｓｅｔ値に従って、字幕プレーンメモリ７０２に保存する字幕プレーンの映像を右目用にシフトして右目用字幕映像を出力する。

第２の字幕処理手段８００は、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードで字幕の表示データを含むパケットを処理するためのものであり、左字幕デコード手段８０１、左字幕プレーンメモリ８０２、左字幕シフト出力手段８０３、右字幕デコード手段８０４、右字幕プレーンメモリ８０５、及び右字幕シフト出力手段８０６を含む構成である。

左字幕デコード手段８０１は、デマルチプレクサ３０２でＭＰＥＧ２−ＴＳストリームデータから振り分けられた左目用の字幕データを含むパケットを復号して左字幕プレーンの映像を生成する。

左字幕プレーンメモリ８０２は、判定手段３０４が、映像処理装置３００の持つＲＡＭ等の記憶媒体の一部を割り当てた領域であり、左字幕デコード手段８０１で生成した左字幕プレーンの映像を保存する。

左字幕シフト出力手段８０３は、オフセット取得手段３０６が取得したｏｆｆｓｅｔ値に従って、左字幕プレーンメモリ８０２に保存する左字幕プレーンの映像を左目用にシフトして左目用字幕映像を出力する。

右字幕デコード手段８０４は、デマルチプレクサ３０２でＭＰＥＧ２−ＴＳストリームデータから振り分けられた右目用の字幕データを含むパケットを復号して右字幕プレーンの映像を生成する。

右字幕プレーンメモリ８０５は、判定手段３０４が、映像処理装置３００の持つＲＡＭ等の記憶媒体の一部を割り当てた領域であり、右字幕デコード手段８０４で生成した右字幕プレーンの映像を保存する。

右字幕シフト出力手段８０６は、オフセット取得手段３０６が取得したｏｆｆｓｅｔ値に従って、右字幕プレーンメモリ８０５に保存している右字幕プレーンの映像を右目用にシフトして右目用字幕映像を出力する。

なお、図５は字幕処理手段３０９の構成は論理的構成を示したものであり、字幕デコード手段７０１、左字幕デコード手段８０１、右字幕デコード手段８０４の物理的字幕デコーダは、判定手段３０４が処理のたびに割り当てたものである。したがって、同一の物理的字幕デコーダが、必ずしも字幕デコード手段７０１、左字幕デコード手段８０１、右字幕デコード手段８０４のうちのひとつに毎回割り当られるとは限らず、また、これらのいずれにも使用されることがありうる。また、同様に、字幕プレーンメモリ７０２、左字幕プレーンメモリ８０２、右字幕プレーンメモリ８０５の物理的メモリ領域は、判定手段３０４が処理のたびに割り当てたものである。したがって、同一の物理的メモリ領域が、必ずしも字幕プレーンメモリ７０２、左字幕プレーンメモリ８０２、右字幕プレーンメモリ８０５のうちのひとつに毎回割り当てられるとは限らず、また、これらのいずれにも使用されることがある。また、左字幕シフト手段７０３と右字幕シフト手段８０３は物理的には同一のものであっても良い。また、右字幕シフト手段７０４と右字幕シフト手段８０６は物理的には同一のものであっても良い。
（データ放送処理手段３１０）
図６は、データ放送処理手段３１０の機能ブロック図である。

データ放送処理手段３１０は、第１のデータ放送処理手段９００、第２のデータ放送処理手段１０００、及びスイッチ６０１を含む構成である。

スイッチ６０１は、判定手段３０４の判定結果に従って、デマルチプレクサ３０２で振り分けられ出力したデータ放送用のデータを含むパケットを、第１のデータ放送処理手段９００に出力するか、第２のデータ放送処理手段１０００に出力するのかを切り替える機能を備える。

第１のデータ放送処理手段９００は、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードでデータ放送用のデータのパケットを処理するためのものであり、
データ放送デコード手段９０１、データ放送プレーンメモリ９０２、左データ放送シフト出力手段９０３、及び右データ放送シフト出力手段９０４を含む構成である。

データ放送デコード手段９０１は、デマルチプレクサ３０２でＭＰＥＧ２−ＴＳストリームデータから振り分けられたデータ放送用のデータを含むパケットを復号してデータ放送プレーンの映像を生成する。

データ放送プレーンメモリ９０２は、判定手段３０４が、映像処理装置３００の持つＲＡＭ等の記憶媒体の一部を割り当てた領域であり、データ放送デコード手段９０１で生成したデータ放送プレーンの映像を保存する。

左データ放送シフト出力手段９０３は、オフセット取得手段３０６が取得したｏｆｆｓｅｔ値に従って、データ放送プレーンメモリ９０２に保存するデータ放送プレーンの映像を左目用にシフトして左目用データ放送映像を出力する。

右データ放送シフト出力手段９０４は、オフセット取得手段３０６が取得したｏｆｆｓｅｔ値に従って、データ放送プレーンメモリ９０２に保存するデータ放送プレーンの映像を右目用にシフトして右目用データ放送映像を出力する。

第２のデータ放送処理手段１０００は、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードでデータ放送用のデータのパケットを処理するためのものであり、左データ放送デコード手段１００１、左データ放送プレーンメモリ１００２、左データ放送シフト出力手段１００３、右データ放送デコード手段１００４、右データ放送プレーンメモリ１００５、及び右データ放送シフト出力手段１００６を含む構成である。

左データ放送デコード手段１００１は、デマルチプレクサ３０２でＭＰＥＧ２−ＴＳストリームデータから振り分けられた左目用のデータ放送用のデータを含むパケットを復号して左データ放送プレーンの映像を生成する。

左データ放送プレーンメモリ１００２は、判定手段３０４が、映像処理装置３００の持つＲＡＭ等の記憶媒体の一部を割り当てた領域であり、左データ放送デコード手段１００１で生成した左データ放送プレーンの映像を保存する。

左データ放送シフト出力手段１００３は、オフセット取得手段３０６が取得したｏｆｆｓｅｔ値に従って、左データ放送プレーンメモリ１００２に保存する左データ放送プレーンの映像を左目用にシフトして左目用データ放送映像を出力する。

右データ放送デコード手段１００４は、デマルチプレクサ３０２でＭＰＥＧ２−ＴＳストリームデータから振り分けられた右目用のデータ放送用のデータを含むパケットを復号して右データ放送プレーンの映像を生成する。

右データ放送プレーンメモリ１００５は、判定手段３０４が、映像処理装置３００の持つＲＡＭ等の記憶媒体の一部を割り当てた領域であり、右データ放送デコード手段１００４で生成した右データ放送プレーンの映像を保存する。

右データ放送シフト出力手段１００６は、オフセット取得手段３０６が取得したｏｆｆｓｅｔ値に従って、右データ放送プレーンメモリ１００５に保存している右データ放送プレーンの映像を右目用にシフトして右目用データ放送映像を出力する。

なお、図６はデータ放送処理手段３１０の構成は論理的構成を示したものであり、データ放送デコード手段９０１、左データ放送デコード手段１００１、右データ放送デコード手段１００４の物理的データ放送デコーダは、判定手段３０４が処理のたびに割り当てたものである。したがって、同一の物理的データ放送デコーダが、必ずしもデータ放送デコード手段９０１、左データ放送デコード手段１００１、右データ放送デコード手段１００４のうちのひとつに毎回割り当られるとは限らず、また、これらのいずれにも使用されることがありうる。また、同様に、データ放送プレーンメモリ９０２、左データ放送プレーンメモリ１００２、右データ放送プレーンメモリ１００５の物理的メモリ領域は、判定手段３０４が処理のたびに割り当てたものである。したがって、同一の物理的メモリ領域が、必ずしも字幕プレーンメモリ９０２、左字幕プレーンメモリ１００２、右字幕プレーンメモリ１００５のうちのひとつに毎回割り当てられるとは限らず、また、これらのいずれにも使用されることがある。また、左字幕シフト手段１００３と右字幕シフト手段１００３は物理的には同一のものであっても良い。また、右字幕シフト手段９０４と右字幕シフト手段１００６は物理的には同一のものであっても良い。
（表示用映像出力手段３１１）
表示用映像出力手段３１１は、左目映像出力手段３０７、右目映像出力手段３０８、字幕処理手段３０９、及びデータ放送処理手段３１０のそれぞれから出力された表示データを合成して得られた右目用映像と左目用映像とを外部の表示装置３１２に出力する機能を備える。

表示装置３１２は、出力された左目用映像と右目用映像とを用いて３Ｄ映像として視聴可能な機能を備える。表示装置３１２は、例えば３Ｄ映像対応テレビである。

＜１．４動作＞
以下、放送を受信したときを例に映像処理装置３００の処理動作について説明する。

図７は、映像処理装置の処理を示すフローチャートである。

まず、受信部３０１は、放送を受信し、放送に含まれるＭＰＥＧ２−ＴＳストリームをデマルチプレクサ３０２へ出力する（ステップＳ１０）。

デマルチプレクサ３０２は、ＭＰＥＧ２−ＴＳストリームからＰＡＴのＴＳパケットを抽出し、解析手段３０３へ出力する（ステップＳ１１）。

解析手段３０３は、デマルチプレクサ３０２から入力されたＴＳパケットからＰＡＴを抽出し、その内容を解析し、再生する番組に関するＰＭＴのＰＩＤを取り出し、デマルチプレクサ３０２に通知する（ステップＳ１２）。

デマルチプレクサ３０２は、ＰＭＴのＰＩＤを持つＴＳパケットを解析手段３０３へ出力する（ステップＳ１３）。

解析手段３０３は、受け取ったＴＳパケットからＰＭＴを抽出し、その内容を解析する（ステップＳ１４）。

解析手段３０３は、ＰＭＴのファーストループ４００にａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子の記載があるかを調べ、ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子が記載されていれば、その内容を判定手段３０４に出力する（ステップＳ１５）。

判定手段３０４は、ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏの内容を解析し、字幕処理手段３０９及びデータ放送処理手段３１０で使用する３Ｄ字幕等表示モードを判別する（ステップＳ１６）。なお、ステップＳ１６の詳しい処理については後述する。

判定手段３０４は、判定結果を字幕処理手段３０９及びデータ放送処理手段３１０に通知する（ステップＳ１７）。更に、判定手段３０４は、解析手段３０３に判定結果通知完了を通知する（ステップＳ１８）。

解析手段３０３は、判定結果通知完了の通知を受けると、再生する番組の映像、字幕、データ放送用の表示データそれぞれを含むＥＳのＰＩＤをデマルチプレクサ３０２に通知する（ステップＳ１９）。なお、これらのＥＳのＰＩＤはＰＭＴを解析することによって取得する。

デマルチプレクサ３０２は、受信したＴＳパケットのうち、解析手段３０３から通知されたＰＩＤのＴＳパケットをＰＩＤに応じて、ビデオデコード手段３０５、字幕処理手段３０９、データ放送処理手段３１０にそれぞれ出力する（ステップＳ２０）。

ＴＳパケットが入力されたビデオデコード手段３０５、字幕処理手段３０９、データ放送処理手段３１０は、それぞれ入力されたＴＳパケットから映像データ、字幕データ、データ放送用データを抽出し、表示用の映像を生成して出力する（ステップＳ２１）。これらの表示用の映像は、合成され表示用映像出力手段３１１から出力される。

以下、ステップＳ１６における判定手段３０４の動作を詳しく説明する。

図８は、判定手段３０４におけるステップＳ１６の処理の詳細を示すフローチャートである。

判定手段３０４は、解析手段３０３から送られたａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏの中のｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅの値が「０」あるか否かを判定し、「０」である場合（ステップＳ３１：Ｙｅｓ）は、字幕処理手段３０９での３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、字幕処理手段３０９での処理に必要なデコーダとメモリを確保する（ステップＳ３２）。次に、判定手段３０４は、判定結果を字幕処理手段３０９に通知する（ステップＳ３３）。ステップＳ３３の処理が完了したら、ステップＳ３７に進む。

一方、ステップＳ３１でＮｏの場合は、判定手段３０４は、ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏの中のｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅの値が「１」であるか否かを判定し、「１」である場合（ステップＳ３４：Ｙｅｓ）は、字幕処理手段３０９での３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、字幕処理手段３０９での処理に必要なデコーダとメモリを確保する（ステップＳ３５）。次に、判定手段３０４は、判定結果を字幕処理手段３０９に通知する（ステップＳ３６）。ステップＳ３６の処理が完了したら、ステップＳ３７に進む。

一方、ステップＳ３４でＮｏの場合には、ステップＳ３７に進む。

ステップＳ３３、ステップＳ３６の処理が完了及びステップＳ３４でＮｏの場合には、判定手段３０４は、ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏの中のｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅの値が「０」か否かを判定し、「０」である場合（ステップＳ３７：Ｙｅｓ）は、データ放送処理手段３１０での３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、データ放送処理手段３１０での処理に必要なデコーダとメモリを確保する（ステップＳ３８）。次に、判定手段３０４は、判定結果をデータ放送処理手段３１０に通知する（ステップＳ３９）。

一方、ステップＳ３７でＮｏの場合には、判定手段３０４は、ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏの中のｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅの値が「１」であるか否かを判定し、「１」である場合（ステップＳ４０：Ｙｅｓ）は、データ放送処理手段３１０での３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、データ放送処理手段３１０での処理に必要なデコーダとメモリを確保する（ステップＳ４１）。次に、判定手段３０４は、判定結果をデータ放送処理手段３１０に通知する（ステップＳ４２）。

＜１．５実施の形態１の変形例＞
（１）新規に定義する記述子の名称は、ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏでなくてもよい。既に規格化されて定義されている記述子の名称と異なり、且つモード識別情報が記載されている記述子であることが認識できる名称であれば、任意の名称を用いてよい。
また同様に、ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅ及びｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅの名称も任意の名称を用いてよい。

（２）上記実施の形態においては、字幕及びデータ放送用の３Ｄ字幕等表示モードの判別のための情報を、ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子の中のｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅ及びｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅとして、それぞれ１ｂｉｔを割り当てたフィールドを用いて表したが、１ｂｉｔのフィールドで記述することに限らない。字幕等の３Ｄ字幕等表示モードを識別することができれば、１ｂｉｔでなくてもよい。

例えば、図９に示すように、ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子の中で、ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅ及びｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅそれぞれに２ｂｉｔを割り当て、図１０に示す値で表現する構成であっても良い。ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅ及びｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅそれぞれが取り得る値として、「００」は、３Ｄ用の字幕や３Ｄ用のデータ放送用データがないことを意味し、「０１」は、１ｐｌａｎｅ＋ｏｆｆｓｅｔモード、「１０」は、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであることを意味する、なお、「１１」は、使用禁止の値であるので、ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅ及びｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅは、この値を使用しないことを意味する。

なお、複数の字幕（例えば、１ｐｌａｎｅ＋ｏｆｆｓｅｔ用と２ｐｌａｎｅ＋ｏｆｆｓｅｔ用の両方）が用意されている場合には、ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅの値として「１１」を使用して、１ｐｌａｎｅ＋ｏｆｆｓｅｔ用と２ｐｌａｎｅ＋ｏｆｆｓｅｔ用とのデータがあるということを表すこととしてもよい。この場合、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードでの字幕等の処理に必要なリソースが確保できない時には、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードでの処理を行ったり、ユーザにどちらの３Ｄ字幕等表示モードで処理するか提示して、ユーザの指定したモードで処理するようにしてよい。また、データ放送用の表示データに対しても、ｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅについて、ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅついて上記に示したのと同様の方法で処理を行ってもよい。

（３）ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子のデータ構造を図２で示すデータ構造としたが、３Ｄ字幕等表示モードを識別することができるフィールドを含むデータ構造であればどのようなデータ構造であってもよい。

例えば、図１１に示すデータ構造としてもよい。

図１１では、ｓｕｂｔｉｔｌｅ＿１ｐｌａｎ＿ｏｆｆｓｅｔ＿ｆｌａｇは１ｂｉｔのフィールドであり、その値が「０」の場合は３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードではなく、「１」の場合には３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであるとする。

同様に、ｓｕｂｔｉｔｌｅ＿２ｐｌａｎ＿ｏｆｆｓｅｔ＿ｆｌａｇは１ｂｉｔのフィールドであり、その値が「０」の場合は３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードではなく、「１」の場合には３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであるとする。

なお、ｓｕｂｔｉｔｌｅ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇとｓｕｂｔｉｔｌｅ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇが共に「０」の場合は３Ｄ字幕の表示データが付随していないとしてもよい。

（４）さらに、図１１に示すデータ構造において、番組に３Ｄ字幕が必ずひとつだけ付随する場合には、ｓｕｂｔｉｔｌｅ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇとｓｕｂｔｉｔｌｅ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇとは、共に「０」若しくは「１」となることを禁止するという制約を課してもよい。

（５）一方、図１１に示すデータ構造において、番組に複数の３Ｄ字幕（例えば、英語用と日本語用）が付随する場合には、そのうちのどれか一つでも３Ｄ字幕の３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードである場合にｓｕｂｔｉｔｌｅ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇの値を「１」とし、すべての３Ｄ字幕の３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードでない場合は、ｓｕｂｔｉｔｌｅ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇの値が「０」としてもよい。また、どれかひとつでも３Ｄ字幕の３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードである場合にはｓｕｂｔｉｔｌｅ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇの値を「１」とし、すべての３Ｄ字幕の３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードでない場合には、ｓｕｂｔｉｔｌｅ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇの値を「０」として、これらの値を用いて３Ｄ字幕等表示モードを判定してもよい。

（６）図１１において、ｂｍｌ＿１ｐｌａｎ＿ｏｆｆｓｅｔ＿ｆｌａｇとｂｍｌ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇとは、３Ｄデータ放送用の表示データを３Ｄ表示する場合の３Ｄ字幕等表示モードを識別するためのものである。ｂｍｌ＿１ｐｌａｎ＿ｏｆｆｓｅｔ＿ｆｌａｇは、３Ｄ字幕におけるｓｕｂｔｉｔｌｅ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇに相当し、ｂｍｌ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇは、同じくｓｕｂｔｉｔｌｅ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇに相当するので上述したｓｕｂｔｉｔｌｅ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ及びｓｕｂｔｉｔｌｅ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇと同様の方法を用いて、放送用データの表示データの３Ｄ字幕等表示モードの判定を行ってもよい。

（７）本実施の形態においては、ＰＭＴのファーストループ４００にａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子を記述するとしたが、ＰＭＴのＥＳ情報記載箇所４０１のセカンドループ４０２にａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子を記載してもよい。

すなわち、３Ｄ字幕等表示モードを識別するための情報が記載されたａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子の記載箇所は、ＰＭＴにおいて記述子が記載できる箇所であればどこに記載されていてもよい。

（８）ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子を記載する代わりに、ＰＭＴ内の未使用領域（ｒｅｓｅｒｖｅｄ領域）を利用してもよい。すなわち、ＰＭＴ内にモード識別情報が記述されていればよい。例えば、ＰＭＴのｒｅｓｅｒｖｅｄ領域のうち２ｂｉｔを、図３に示すｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅとして、モード識別情報の記載に利用してもよい。

また、ｒｅｓｅｒｖｅｄ領域のうちのいずれか４ｂｉｔを利用してもよい。４ｂｉｔを利用する場合には、図１０に示すｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅとして、モード識別情報を記載できる。また、４ｂｉｔのｒｅｓｅｒｖｅｄ領域を用いる場合には、１ｂｉｔずつ図１１に示すｓｕｂｔｉｔｌｅ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ，ｓｕｂｔｉｔｌｅ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ，ｂｍｌ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ，ｂｍｌ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇとして、モード識別情報を記載してもよい。ｒｅｓｅｒｖｅｄ領域は、例えば、図１で示すｒｅｓｅｒｖｅｄ４０３、ｒｅｓｅｒｖｅｄ４０４及び、ｒｅｓｅｒｖｅｄ４０５のいずれかを使用する。

（９）また、ＰＭＴのｒｅｓｅｒｖｅｄ領域を利用して、モード識別情報を記述するとしたが、未使用領域の利用は、ＰＭＴのｒｅｓｅｒｖｅｄ領域に限らない。ＰＭＴ内に記述される記述子のｒｅｓｅｒｖｅｄ領域を用いてもよい。
例えば、ＰＭＴに記述される既存の記述子中のｒｅｓｅｒｖｅｄ領域を利用し、上述のＰＭＴのｒｅｓｅｒｖｅｄ領域を利用した方法と同様な方法でモード識別情報を記載してもよい。

（１０）また、上記の記述方法を組み合わせてもよい。

＜１．６補足＞
（３Ｄ字幕等表示モード）
本実施の形態で判別する３Ｄ字幕等表示モードの１ｐｌａｎｅ＋ｏｆｆｓｅｔモードと２ｐｌａｎｅ＋ｏｆｆｓｅｔモードとについて、図を参照しながら説明する。

図１２は１ｐｌａｎｅ＋ｏｆｆｓｅｔモードの仕組みを概念的に示す図である。

字幕プレーン画像１００は符号化された後、字幕表示用ＥＳとして３Ｄ映像のＥＳ等の他のデータのＥＳ（例えば、音声用ＥＳ）と共に多重化されて配信される。

映像処理装置３００は、受信した字幕表示用ＥＳから抽出した符号化された字幕データを復号して、字幕プレーン画像１００を作成する。

映像処理装置３００は、字幕プレーン画像１００と、３Ｄ映像のＥＳに含まれるｏｆｆｓｅｔの値とを用いて、３Ｄ字幕を表示するための左目用字幕画像と右目用字幕画像を生成する。

ｏｆｆｓｅｔの値は、３Ｄ映像対して適切に字幕を重畳するためのもので、画素数で表される。映像と同期させる必要があるので、３Ｄ映像のＥＳに含めて送信される。ｏｆｆｓｅｔの値は、３Ｄ映像データがＭＰＥＧ形式で符号化されている場合はＧＯＰ（ＧｒｏｕｐｏｆＰｉｃｔｕｒｅｓ）や各画像フレームのｕｓｅｒｄａｔａとして埋め込まれる。

映像処理装置３００は、３Ｄ映像の左目映像と重畳する左目用字幕画像を出力する際には、作成した字幕プレーン画像１００をｏｆｆｓｅｔの値分の画素数だけ右にシフトした左目字幕画像１０１を出力し、３Ｄ映像の右目映像と重畳する右目用字幕画像を出力する際には、作成した字幕プレーン画像１００をｏｆｆｓｅｔの値分の画素数だけ左にシフトした画像を右目字幕画像１０２として出力する。左目字幕画像１０１と右目字幕画像１０２とにより、字幕プレーン１０３は３Ｄ映像の画面よりも手前に位置しているように見える。

なお、ｏｆｆｓｅｔの値がマイナスの値である場合は、字幕プレーン画像１００の画像を左にシフトしたものを左目字幕画像１０１とし、右にシフトしたものを右目字幕画像１０２として出力する。この場合、字幕プレーン１０３は３Ｄ映像の画面よりも奥に位置しているように見える。

このように、シフトするｏｆｆｓｅｔの値によって字幕プレーン１０３の奥行きを設定することができる。１ｐｌａｎｅ＋ｏｆｆｓｅｔでは、ひとつの字幕プレーン用メモリで処理可能なため、本３Ｄ字幕等表示モードによる処理は２ｐｌａｎｅ＋ｏｆｆｓｅｔモードに比べて少ないデコーダとメモリで済むというメリットがある。しかし、平面的な画像を画面より手前に配置、もしくは、画面より奥に配置するというもののため、字幕のテキストなどのオブジェクト自体を立体的に見せることはできないというデメリットがある。

図１３は、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードの仕組みを概念的に示す図である。
２ｐｌａｎｅ＋ｏｆｆｓｅｔモードでは、字幕は、左目用の字幕データと右目用の字幕データの２つによって構成される。これら２つの字幕データは、それぞれ符号化されたあと、別々のＥＳとして３Ｄ映像のＥＳ等の他のデータのＥＳ（例えば、音声のＥＳ）と共に多重化されて配信される。

映像処理装置３００は、受信した２つの字幕用ＥＳをそれぞれ復号する。まず、左目用の字幕データは、左目用の字幕データ用に確保されたデコーダで復号して、左字幕プレーン画像２００を作成する。一方、右目用の字幕データは、右目用の字幕データ用に確保されたデコーダで復号して右字幕プレーン画像２０１を作成する。

映像処理装置３００は、作成した左字幕プレーン画像２００を、３Ｄ映像のＥＳに含まれるｏｆｆｓｅｔの値分の画素数だけ右にシフトした画像を左目字幕画像２０２として生成し、作成した右字幕プレーン画像２０１を３Ｄ映像のＥＳに含まれるｏｆｆｓｅｔの値分の画素数だけ左にシフトした画像を右目字幕画像２０３として生成する。左目字幕画像２０２は、左目映像と、右目字幕画像２０３は右目映像と重畳して出力することにより、字幕プレーン２０４は３Ｄ映像の画面より手前に位置しているように見える。なお、ｏｆｆｓｅｔの値がマイナスの値である場合は、左目字幕画像２０２は、左字幕プレーン画像２００を左にシフトして生成し、右目字幕画像２０３は、右字幕プレーン画像２０１を右にシフトして生成する。この場合、字幕プレーン２０４は、３Ｄ映像の画面よりも奥に位置しているように見える。このように、シフトするｏｆｆｓｅｔの値によって字幕プレーン２０４の奥行きを設定することができる。

２ｐｌａｎｅ＋ｏｆｆｓｅｔモードでは、左目用字幕画像と右目用字幕画像で別々の字幕プレーン画像を用いるので、字幕自体を立体的に見せることが可能である。しかし、字幕用に使用するデコーダや字幕プレーンメモリが２つずつ必要となるので、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードに比べて映像処理装置３００の処理の負荷が大きいというデメリットがある。

なお、ＡＲＩＢ規格では、字幕プレーンに字幕及び文字スーパーをそれぞれ別途表示することができ、文字スーパーについても、字幕と同様の処理で立体視を実現できる。したがって、本実施の形態における字幕の概念には、ＡＲＩＢ規格における文字スーパーも含むものとする。
（多重化装置３０００）
次に、本実施の形態の映像処理装置３００が受信する多重化したデータストリームを生成する多重化装置について説明する。

図１４は、放送や配信に用いられるＭＰＥＧ２−ＴＳを生成する多重化装置３０００の概略構成図である。

多重化装置３０００は、多重化手段３００１、ビデオデータ蓄積手段３００２、ビデオ入力手段３００３、オーディオデータ蓄積手段３００４、オーディオ入力手段３００５、字幕データ蓄積手段３００６、字幕入力手段３００７、データ放送用データ蓄積手段３００８、データ放送用データ入力手段３００９、番組情報入力手段３０１０、及びＳＩ／ＰＳＩ生成手段３０１１を含む構成である。

多重化装置３０００は、図示しないプロセッサ及びメモリを含んで構成されており、多重化手段３００１、ビデオ入力手段３００３、オーディオ入力手段３００５、字幕入力手段３００７、データ放送用データ入力手段３００９、番組情報入力手段３０１０、及びＳＩ／ＰＳＩ生成手段３０１１の機能は、このメモリに記憶されているプログラムをこのプロセッサが実行することにより実現される。

多重化手段３００１は、ビデオ入力手段３００３、オーディオ入力手段３００５、字幕入力手段３００７、データ放送用データ入力手段３００９、及びＳＩ／ＰＳＩ生成手段３０１１からそれぞれ出力されたビデオデータ、オーディオデータ、字幕データ、データ放送データ及びＳＩ／ＰＳＩからＴＳストリームを生成する。

ビデオデータ蓄積手段３００２は、ハードディスクなどの記憶媒体で構成され、ビデオデータを蓄積する。

ビデオ入力手段３００３は、ビデオデータ蓄積手段３００２からビデオデータを読み出し、符号化を行い、多重化手段３００１に出力する機能と、ＳＩ／ＰＳＩ生成手段３０１１にＳＩ／ＰＳＩ構築に必要なビデオデータに関する情報を出力する機能を備える。

オーディオデータ蓄積手段３００４は、ハードディスクなどの記憶媒体で構成され、オーディオデータを蓄積する。

オーディオ入力手段３００５は、オーディオデータ蓄積手段３００４からオーディオデータを読み出し、符号化を行い、多重化手段３００１に出力する機能と、ＳＩ／ＰＳＩ生成手段３０１１にＳＩ／ＰＳＩ構築に必要なオーディオデータに関する情報を出力する機能を備える。

字幕データ蓄積手段３００６は、ハードディスクなどの記憶媒体で構成され、字幕データを蓄積する。

字幕入力手段３００７は、字幕データ蓄積手段３００６から字幕データを読み出し、符号化を行い、多重化手段３００１に出力する機能と、ＳＩ／ＰＳＩ生成手段３０１１にＳＩ／ＰＳＩ構築に必要な字幕データに関する情報を出力する機能を備える。このとき、字幕データがどの３Ｄ字幕等表示モードで処理するデータであるのかの情報も字幕データと共に字幕データ蓄積手段３００６に記憶されており、字幕入力手段３００７は、この３Ｄ字幕等表示モードに関する情報をＳＩ／ＰＳＩ生成手段３０１１に出力する。

データ放送用データ蓄積手段３００８は、ハードディスクなどの記憶媒体で構成され、データ放送用データを蓄積する。

データ放送用データ入力手段３００９は、データ放送用データ蓄積手段３００８から字幕データを読み出し、符号化を行い、多重化手段３００１に出力する機能と、ＳＩ／ＰＳＩ生成手段３０１１にＳＩ／ＰＳＩ構築に必要なデータ放送用データに関する情報を出力する機能を備える。このとき、データ放送用データがどの３Ｄ字幕等表示モードで処理するータであるのかの情報もデータ放送用データと共にデータ放送用データ蓄積手段３００８に記憶されており、データ放送用データ入力手段３００９は、この３Ｄ字幕等表示モードに関する情報をＳＩ／ＰＳＩ生成手段３０１１に出力する。

番組情報入力手段３０１０は、ＥＩＴの生成に必要な番組構成情報をＳＩ／ＰＳＩ生成手段３０１１に出力する。

ＳＩ／ＰＳＩ生成手段３０１１は、ビデオ入力手段３００３、オーディオ入力手段３００５、字幕入力手段３００７、データ放送用データ入力手段３００９、番組情報入力手段３０１０から入力された情報に基づいて、ＳＩ／ＰＳＩの情報を生成し、多重化手段３００１に生成したＳＩ／ＰＳＩの情報を出力する。

ＳＩ／ＰＳＩ生成手段３０１１は、字幕入力手段３００７から得られる３Ｄ字幕等表示モードの情報に従って、ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅに３Ｄ字幕等表示モードの値を設定したａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子をＰＭＴのファーストループ４００に記載する。

また、ＳＩ／ＰＳＩ生成手段３０１１は、データ放送用データ入力手段３００９から得られる３Ｄ字幕等表示モードの情報に従って、ｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅに３Ｄ字幕等表示モードの値を設定したａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子をＰＭＴのファーストループ４００に記載する。

＜１．７まとめ＞
本実施の形態の映像処理装置は、受信したＰＭＴに記載されたモード識別情報から、３Ｄ字幕等表示モードを判別する。ＰＭＴは、３Ｄ映像や字幕等表示データを含むＥＳを処理する前に処理されるべきデータブロックなので、字幕等表示データを処理する前に３Ｄ字幕等表示モードを判別してリソースを確保することができる。このため、表示データを３Ｄ映像と共に表示するまでの時間を短縮することができる。
＜実施の形態２＞
＜２．１概要＞
実施の形態１では、新たに定義したａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子を用いるとしたが、本実施の形態では、既に規格化されている記述子であるデータ符号化方式記述子（ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｄｅｓｃｒｉｐｔｏｒ）のフィールドを利用する点が異なる。本実施の形態の映像処理装置は、ＰＭＴのファーストループ４００ではなく、セカンドループ４０２に記載されたデータ符号化方式記述子のｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄからモード識別情報を抽出して、３Ｄ字幕等表示モードを判別する。

図１で示すように、セカンドループ４０２は、ＥＳ情報記載箇所４０１に含まれる。ＥＳ情報記載箇所は、この番組に係るＥＳ毎の情報を記載する箇所である。このため、ＥＳ情報記載箇所４０１のｆｏｒループは、この番組に係るＥＳの数だけ繰り返される。

同図のｅｌｅｍｅｎｔａｒｙ＿ＰＩＤはＴＳのそれぞれのパケットであるトランスポートパケットを識別するための情報である。同一の映像ＥＳ、同一の字幕ＥＳ、同一のＳＩ／ＰＳＩのテーブルのトランスポートパケットは、それぞれ同じｅｌｅｍｅｎｔａｒｙ＿ＰＩＤが付与されて送信される。なお、ｅｌｅｍｅｎｔａｒｙ＿ＰＩＤは単にＰＩＤとも呼ばれる。

本実施の形態では、字幕に対するモード識別情報は、字幕データを含むＥＳのＰＩＤに対応したｄｅｓｃｒｉｐｔｏｒの記述箇所のデータ符号化方式記述子に記述し、データ放送用の表示データに対するモード識別情報は、データ放送用の表示データを含むＥＳのＰＩＤに対応したｄｅｓｃｒｉｐｔｏｒの記述箇所のデータ符号化方式記述子に記述する。

＜２．２データ＞
図１５は、データ符号化方式記述子のデータ構造を示す図である。

データ符号化方式記述子の各フィールドについては、ＡＲＩＢが策定した規格に規定されているため説明を省略し、本実施の形態に関連する部分のみ説明を行なう。

本実施の形態においては、データ符号化方式記述子の中のｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄのフィールドにモード識別情報を記載する。ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄ１５０１は、１６ｂｉｔのデータ長を持つ。

ＡＲＩＢの規格では、従来の字幕を表すｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値は０ｘ０００８であるが本実施の形態では、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄに図１６で示す値を用いる。図１６で示すように１ｐｌａｎｅ＋ｏｆｆｓｅｔモードで処理する３Ｄ字幕の場合は、０ｘ０１００、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードで処理する３Ｄ字幕の場合は、０ｘ０２００、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードで処理するデータ放送用の表示データの場合は、０ｘ０４００、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードで処理するデータ放送用の表示データの場合は、０ｘ０８００の値を用いる。

＜２．３構成＞
本実施の形態の映像処理装置の構成で、実施の形態１の映像処理装置３００と同じ構成のものは説明を省略し、異なる点を重点的に説明する。なお、本実施の形態で用いる映像処理装置の符号は、説明の都合上、実施の形態１と同じ符号を用いる。

実施の形態１と異なる点は、解析手段３０３がＰＭＴのファーストループに記載されたａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏからモード識別情報を抽出するのではなく、セカンドループ４０２に記載されるデータ符号化方式記述子内のｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄからモード識別情報を抽出し判定手段３０４に出力する点と、判定手段３０４がａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子に記載したモード識別情報ではなく、データ符号化方式記述子のｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値に基づいて３Ｄ字幕等表示モードを判別する点である。

＜２．４動作＞
本実施の形態における映像処理装置３００の動作は、図７のステップＳ１５で、解析手段３０３がＰＭＴのファーストループ４００にあるａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子の代わりにＰＭＴのセカンドループ４０２にあるデータ符号化方式記述子を抽出してその内容を判定手段３０４に出力する点と、ステップＳ１６で判定手段３０４が、データ符号化方式記述子からｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値を抽出し、３Ｄ字幕等表示モードを判別する点が実施の形態１と異なる。それ以外のステップは、実施の形態１と同じであるので説明を省略する。

図１７は、実施の形態２の映像処理装置３００の判定手段３０４でのステップＳ１６の処理の詳細を示すフローチャートである。

判定手段３０４は、解析手段３０３から入力されたデータ符号化方式記述子からｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄを抽出し、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値が０ｘ０１００に一致するか否かを判定する（ステップＳ５１）。判定手段３０４は、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値が０ｘ０１００に一致する場合（ステップＳ５１：Ｙｅｓ）、字幕処理手段３０９での３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、字幕処理手段３０９での処理に必要なデコーダとメモリを確保する（ステップＳ５２）。次に、判定手段３０４は、判定結果を字幕処理手段３０９に通知し（ステップＳ５３）、ステップＳ１６の処理を完了する。

一方、ステップＳ５１でＮｏの場合には、判定手段３０４は、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値が０ｘ０２００に一致するか否かを判定する（ステップＳ５４）。判定手段３０４は、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値が０ｘ０２００に一致する場合（ステップＳ５４：Ｙｅｓ）、字幕処理手段３０９での３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、字幕処理手段３０９での処理に必要なデコーダとメモリを確保する（ステップＳ５５）。次に、判定手段３０４は、判定結果を字幕処理手段３０９に通知し（ステップＳ５６）、ステップＳ１６の処理を完了する。

ステップＳ５４でＮｏの場合には、判定手段３０４は、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値が０ｘ０４００に一致するか否かを判定する（ステップＳ５７）。判定手段３０４は、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値が０ｘ０４００に一致する場合（ステップＳ５７：Ｙｅｓ）、データ放送処理手段３１０での３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、データ放送処理手段３１０での処理に必要なデコーダとメモリを確保する（ステップＳ５８）。次に、判定手段３０４は、判定結果をデータ放送処理手段３１０に通知し（ステップＳ５９）、ステップＳ１６の処理を完了する。

更に、判定手段３０４は、ステップＳ５７でＮｏの場合には、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値が０ｘ０８００に一致するか否かを判定する（ステップＳ６０）。判定手段３０４は、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値が０ｘ０８００に一致する場合（ステップＳ６０：Ｙｅｓ）、データ放送処理手段３１０での３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、データ放送処理手段３１０での処理に必要なデコーダとメモリを確保する（ステップＳ６１）。次に、判定手段３０４は、判定結果をデータ放送処理手段３１０に通知し（ステップＳ６２）、ステップＳ１６の処理を完了する。

なお、本実施の形態では、ＰＭＴのセカンドループに記述されるデータ符号化方式記述子に記述されるモード識別情報によって３Ｄ字幕等表示モードを判定している。データ符号化方式記述子は、ＰＭＴ内の番組を構成する各ＥＳに関する情報に含まれるため、判定手段３０４は、ステップＳ５１の処理を行う前に、字幕データを含むＥＳに関する情報の記載部分のデータ符号化方式記述子であるか、データ放送用の表示データを含むＥＳに関する情報の記載部分のデータ符号化方式記述子であるかを識別し、字幕データを含むＥＳに関する情報である場合には、ステップＳ５１に進み、データ放送の表示データを含むＥＳの場合はステップＳ５７の処理に進むようにしてもよい。

＜２．５実施の形態２の変形例＞
（１）ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄで用いるモード識別情報の値として図１６で示す値を用いたが、モード識別情報で用いる値は、これに限らない。ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄに割り当てられたｂｉｔ長で表現でき、それぞれの処理モードが識別できる値であればどのような値を用いてもよい。

＜２．６補足＞
多重化装置３０００のＳＩ／ＰＳＩ生成手段３０１１は、字幕入力手段３００７から出力されたモード識別情報を、ＰＭＴのセカンドループ４０２のうち、字幕を含むＥＳに関する情報を記載した箇所のデータ符号化方式記述子に設定する。また、データ放送用データ入力手段３００９から出力されたモード識別情報をＰＭＴのセカンドループ４０２のうち、データ放送用の表示データを含むＥＳに関する情報を記載した箇所のデータ符号化方式記述子に設定する。
＜２．７まとめ＞
本実施の形態の映像処理装置は、既存の記述子のフィールドを利用して、モード識別情報を記述できるので、実施の形態１のように新たに記述子を定義することなく、また既存の記述子のフィールドを拡張することもなく、３Ｄ字幕等表示モードを識別することができる。
＜実施の形態３＞
＜３．１概要＞
実施の形態２では、ＰＭＴのセカンドループ４０２に記載される既に規格化されている記述子であるデータ符号化方式記述子（ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｄｅｓｃｒｉｐｔｏｒ）内のｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄにモード識別情報を記述するとしたが、本実施の形態では、データ符号化方式記述子の未使用領域（ｒｅｓｅｒｖｅｄ領域）にモード識別情報を記述する点で異なる。

本実施の形態の映像処理装置は、ＰＭＴのファーストループ４００ではなく、セカンドループ４０２に記載されたデータ符号化方式記述子のｒｅｓｅｒｖｅｄ領域からモード識別情報を抽出して、３Ｄ字幕等表示モードを判別する。
＜３．２データ＞
本実施の形態で用いるデータのデータ構造について説明する。

本実施の形態では、図１５に示すデータ符号化方式記述子にａｄｄｉｔｉｏｎａｌ＿ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｎｆｏのひとつとして記載するａｄｄｉｔｉｏｎａｌ＿ａｒｉｂ＿ｂｘｍｌ＿ｉｎｆｏ記述子を用いる。

図１８に、ａｄｄｉｔｉｏｎａｌ＿ａｒｉｂ＿ｂｘｍｌ＿ｉｎｆｏのデータ構成を示す。

本実施の形態では、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ１８０１の４ｂｉｔのうち下位２ｂｉｔを、図３で示したｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅの情報を記述するために用いる。ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅとが取り得る値については、実施の形態１と同じなので説明を省略する。
＜３．３構成＞
本実施の形態の映像処理装置の構成で、実施の形態１の映像処理装置３００と同じ構成のものは説明を省略し、異なる点を重点的に説明する。なお、本実施の形態で用いる映像処理装置の符号は、説明の都合上、実施の形態１と同じ符号を用いる。

実施の形態１と異なる点は、解析手段３０３がＰＭＴのファーストループに記載された
ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏからモード識別情報を抽出するのではなく、データ符号化方式記述子内の未使用領域に記載されたモード識別情報を抽出し判定手段３０４に出力する点と、判定手段３０４が、このモード識別情報に基づいて３Ｄ字幕等表示モードを判別する点である。

＜３．４動作＞
本実施の形態における映像処理装置３００の動作は、図７のステップＳ１５で、解析手段３０３がＰＭＴのファーストループ４００にａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子の代わりにＰＭＴのセカンドループ４０２にあるデータ符号化方式記述子を抽出してその内容を判定手段３０４に出力する点と、ステップＳ１６で判定手段３０４が、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ１８０１の下位２ｂｉｔの値を抽出し、この値に基づいて３Ｄ字幕等表示モードを判別する点で実施の形態２と異なる。それ以外のステップは、実施の形態２と同じであるので説明を省略する。

判定手段３０４は、ステップＳ１６でｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ１８０１の下位２ｂｉｔの値が、「００」の場合は、字幕とデータ放送用の表示データが共に１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、「０１」の場合は、字幕が１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであり、データ放送用の表示データは２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判別する。「１０」の場合は、字幕は２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであり、データ放送用の表示データは１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、「１１」の場合は、字幕とデータ放送用の表示データが共に２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定する。

＜３．５実施の形態３の変形例＞
（１）本実施の形態においては、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ１８０１の下位２ｂｉｔにモード識別情報を記述するとしたが、モード識別情報の記載は、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ１８０１の下位２ｂｉｔを用いることに限らない。モード識別情報用に２ｂｉｔが確保できればよい。例えば、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ１８０１の上位２ｂｉｔに記述してもよい。

（２）また、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ１８０１を用いるとしたが、用いる未使用領域は、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ１８０１に限らない。データ符号化方式記述子内の未使用領域であればどこを用いてもよい。例えば、図１８で示すデータ符号化方式記述子内のａｄｄｉｔｉｏｎａｌ＿ａｒｉｂ＿ｂｘｍｌ＿ｉｎｆｏ記述子には、ａｄｄｉｔｉｏｎａｌ＿ａｒｉｂ＿ｃａｒｏｕｓｅｌ＿ｉｎｆｏ記述子が記載されているので、この記述子の未使用領域に記載してもよい。また、図１９で示すａｄｄｉｔｉｏｎａｌ＿ａｒｉｂ＿ｃａｒｏｕｓｅｌ＿ｉｎｆｏのデータ構造のＲｅｓｅｒｖｅｄのうちの２ｂｉｔに記述してもよい。

（３）本実施の形態においては、モード識別情報として図３に示すｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅの値を記述するとしたが、モード識別情報は、この値を用いることに限らない。３Ｄ字幕等表示モードを識別できる情報であればよい。例えば、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ１８０１の４ｂｉｔを用いて、図１０で示したｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅとの値を記述してもよい。

また、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ１８０１の４ｂｉｔを用いて、図１１で示したｓｕｂｔｉｔｌｅ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ、ｓｕｂｔｉｔｌｅ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ、ｂｍｌ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ、ｂｍｌ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇの値を記述してもよい。
＜３．６まとめ＞
本実施の形態の映像処理装置は、既存の記述子の未使用領域を利用して、モード識別情報を記述できるので、実施の形態１のように新たに記述子を定義することなく、また、記述子のフィールドを拡張することもなく、３Ｄ字幕等表示モードを識別することができる。
＜実施の形態４＞
＜４．１概要＞
実施の形態１においては、ＰＳＩ情報の１つであるＰＭＴにａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子を記載するとしたが、本実施の形態では、ＰＭＴではなく、ＳＩ情報のひとつであるＥＩＴにａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子を記載する点が異なる。本実施の形態の映像処理装置は、ＥＩＴに記載された記述子に含まれるモード識別情報を抽出して判定を行う。

＜４．２データ＞
以下、本実施の形態で用いるＥＩＴのデータ構造について説明する。

図２０は、ＥＩＴのデータ構造を示す図である。

ＥＩＴは、番組の名称や放送日時、放送内容など番組に関連する情報を格納する。個々のフィールドについては、ＡＲＩＢが策定した規格に規定されているため説明を省略し、本実施の形態に関連する部分のみ説明を行なう。

ＥＩＴにおいては、ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子は、ｆｏｒループで囲まれたｄｅｓｃｒｉｐｔｏｒ１４０１の箇所に記載する。なお、このｄｅｓｃｒｉｐｔｏｒ１４０１は、このＥＩＴに記載されている番組毎に異なる情報が記述された記述子である。

ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子は、実施の形態１と同じなので説明を省略する。

ＰＭＴは各番組を構成するデータとセットで送られるのに対して、ＥＩＴは、番組の放送に先立って送られ、ＥＰＧ（ＥｌｅｃｔｒｏｎｉｃＰｒｏｇｒａｍＧｕｉｄｅ）を構築するのに利用される。また、録画や視聴の予約にも利用される。

＜４．３構成＞
本実施の形態の映像処理装置の構成で、実施の形態１の映像処理装置３００と同じ構成のものは説明を省略し、異なる点を重点的に説明する。なお、本実施の形態で用いる映像処理装置の符号は、説明の都合上、実施の形態１と同じ符号を用いる。

解析手段３０３が、ＰＭＴではなく、ＥＩＴに含まれるモード識別情報に基づいて３Ｄ字幕等表示モードを判別する点が実施の形態１と異なる。

＜４．４動作＞
ユーザが、ＥＩＴに含まれる複数の番組のうちの１つの番組を視聴予約した場合を例に映像処理装置３００の動作を説明する。

視聴予約した番組の開始時間になると映像処理装置３００は、予約した番組のストリームデータを受信部３０１で受信する。解析手段３０３は、図７のステップＳ１５で、前もって受信していたＥＩＴに含まれる視聴予約番組に関する情報のうちのａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子を抽出して、判定手段３０４に出力する。

以降の処理は、実施の形態１と同じなので説明を省略する。

＜４．５実施の形態４の変形例＞
（１）本実施の形態では、番組開始時にＥＩＴからモード識別情報を抽出するとしたが、ＥＩＴからモード識別情報を抽出する処理は、番組開始時に限らない。ＥＩＴは番組開始より前に受信しているので、番組開始以前に、ＥＩＴに情報が記載されている各番組の３Ｄ字幕等の表示モードを判定し、記憶しておいてもよい。例えば、ＥＩＴを受信した際に、ＥＩＴに含まれるａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子の内容を抽出し、保存しておき、番組開始時に、判定手段３０４が保存した内容に基づいて３Ｄ字幕等表示モードの判定を行うようにしてもよい。また、前もって判定までを行い、その判定結果を保存しておき、番組の開始時にその判定結果を読み出して、以降の処理を行うようにしてもよい。

（２）本実施の形態においては、ＥＩＴに新たに定義したａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子を記載するとしたが、新たに記述子を定義しなくてもよい。ＥＩＴにモード識別情報が記述されていればよい。例えば、ａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子を記載する代わりに、ＥＩＴの未使用領域（ｒｅｓｅｒｖｅｄ領域）を使用してもよい。

具体的には、ＥＩＴのｒｅｓｅｒｖｅｄ領域のうちのいずれか２ｂｉｔを、図３に示すｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅの値を記述することによって、３Ｄ字幕等表示モードを判別するようにしてもよい。

（３）なお、未使用領域を利用するのは、２ｂｉｔに限られない。モード識別情報の記述に必要なｂｉｔを割り当ててよい。例えば、未使用領域のうちのいずれか４ｂｉｔに、図１２に示すｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅの値を記述することによって、３Ｄ字幕等表示モードを判別するようにしてもよい。

（４）また、未使用領域のうちのいずれか４ｂｉｔを利用する場合には、図１１に示すｓｕｂｔｉｔｌｅ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ、ｓｕｂｔｉｔｌｅ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ、ｂｍｌ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ、ｂｍｌ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇの値を記述して、３Ｄ字幕等表示モードを判別するようにしてもよい。

（５）また、上記のモード識別情報の記述方法を組み合わせてもよい。

（６）ＥＩＴは番組の放送や配信前に映像処理装置に配信されるものであるため、緊急放送などにより、実際に放送される内容が、ＥＩＴで配信された情報と異なるものとなる場合もある。このため、実施の形態１に示したＰＭＴを用いた識別方法と組み合わせて処理してもよい。

＜４．６補足＞
多重化装置３０００のＳＩ／ＰＳＩ生成手段３０１１は、番組情報入力手段３０１０から入力された番組構成情報に基づいてＥＩＴを生成するが、このとき、番組情報入力手段３０１０は、番組毎の字幕の３Ｄ字幕等表示モード、データ放送用の表示データの３Ｄ字幕等表示モードをＳＩ／ＰＳＩ生成手段３０１１に出力する。ＳＩ／ＰＳＩ生成手段３０１１は、番組情報入力手段３０１０から出力された情報に基づき、ＥＩＴの各番組に関する情報を記述する箇所に、モード識別情報を設定する。

＜４．７まとめ＞
本実施の形態の映像処理装置は、受信したＥＩＴに記載された番組毎のモード識別情報から、３Ｄ字幕等表示モードを判別する。

ＥＩＴは、番組の放送に先だって送信されるため、番組に係る字幕等表示データを処理する前に３Ｄ字幕等表示モードを判別し、リソースを確保することができる。このため、表示データを３Ｄ映像と共に表示するまでの時間を短縮することができる。
＜実施の形態５＞
＜５．１概要＞
実施の形態４では、ＥＩＴの番組に係る情報の記載箇所に、新たに定義した記述子であるａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子にモード識別情報を記載し、映像処理装置がこのモード識別情報を抽出して３Ｄ字幕等表示モードを判別したが、本実施の形態では、規格化されている既存の記述子であるデータコンテンツ記述子（ｄａｔａ＿ｃｏｎｔｅｎｔ＿ｄｅｓｃｒｉｐｔｏｒ）にモード識別情報を記載し、このモード識別情報を抽出することによって３Ｄ字幕等表示モードを判別する。

＜５．２データ＞
図２１は、データコンテンツ記述子のデータ構造を示す図である。

データコンテンツ記述子の各フィールドについては、ＡＲＩＢが策定した規格に規定されているため説明を省略し、本実施の形態に関連する部分のみ説明を行なう。

本実施の形態では、データコンテンツ記述子中のｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄ１７０１にモード識別情報を記述する。

字幕やデータ放送用の表示データの３Ｄ字幕等表示モードを識別するための値として、図１６に示すものを使用する。

ＥＩＴは、番組に係る個々のＥＳの情報ではなく、番組に係るＥＳに共通の情報を記述するものであるため、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄ１７０１で、字幕及びデータ放送用の表示データのそれぞれについて３Ｄ字幕等表示モードを識別できるようにする必要がある。ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの各値については、既に説明したので説明を省略する。

字幕とデータ放送用の表示データの両方の３Ｄ字幕等表示モードを識別できるようにするために、それぞれの値の和を利用する。具体的には、例えば、字幕が２ｐｌａｎｅ＋ｏｆｆｓｅｔモードで処理され、データ放送用の表示データが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードで処理されるべきデータである場合には、０ｘ０２００と０ｘ０４００の和をとり、０ｘ０６００を設定する。また、字幕とデータ放送用の表示データが共に２ｐｌａｎｅ＋ｏｆｆｓｅｔモードで処理されるべきデータである場合には、０ｘ０２００と０ｘ０８００の和をとり、０ｘ０Ａ００を設定する。他の組み合わせでも同様に和をとった値を用いる。

＜５．３構成＞
本実施の形態の映像処理装置の構成で、実施の形態４の映像処理装置３００と同じ構成のものは説明を省略し、異なる点を重点的に説明する。なお、本実施の形態で用いる映像処理装置の符号は、説明の都合上、実施の形態４と同じ符号を用いる。

実施の形態４と異なる点は、解析手段３０３がＥＩＴのａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏからモード識別情報を抽出するのではなく、データコンテンツ記述子内のｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄをモード識別情報として抽出し、判定手段３０４に出力する点と、判定手段３０４がｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値に基づいて３Ｄ字幕等表示モードを判別する点である。

＜５．４動作＞
本実施の形態における映像処理装置３００の動作は、図７のステップＳ１５で、解析手段３０３が、データコンテンツ記述子を抽出し、判定手段３０４に出力する点と、ステップＳ１６で判定手段３０４が、データコンテンツ記述子からｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値を抽出し、その値に基づいて３Ｄ字幕等表示モードを判別する点で、実施の形態４と異なる。それ以外のステップは、実施の形態４と同じであるので説明を省略する。

以下、本実施の形態でのステップＳ１６の処理の詳細を説明する。

図２２は、本実施の形態の映像処理装置３００の判定手段３０４でのステップＳ１６の処理の詳細を示すフローチャートである。

判定手段３０４は、解析手段３０３から入力されたデータコンテンツ記述子からｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄを抽出し、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値と０ｘ０１００の論理積を求め、その結果が「０」であるか否かを判定する（ステップＳ７１）。判定手段３０４は、論理積の結果が「０」でない場合（ステップＳ７１：Ｙｅｓ）、字幕処理手段３０９での３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、字幕処理手段３０９での処理に必要なデコーダとメモリを確保する（ステップＳ７２）。次に、判定手段３０４は、判定結果を字幕処理手段３０９に通知し（ステップＳ７３）、ステップＳ７７に進む。

一方、ステップＳ７１でＮｏの場合には、判定手段３０４は、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値と０ｘ０２００の論理積を求め、その結果が「０」であるか否かを判定する（ステップＳ７４）。判定手段３０４は、論理積の結果が「０」でない場合（ステップＳ７４：Ｙｅｓ）、字幕処理手段３０９での３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、字幕処理手段３０９での処理に必要なデコーダとメモリを確保する（ステップＳ７５）。次に、判定手段３０４は、判定結果を字幕処理手段３０９に通知し（ステップＳ７６）、ステップＳ７７に進む。

ステップＳ７４でＮｏの場合には、判定手段３０４は、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値と０ｘ０４００の論理積を求め、その結果が「０」であるか否かを判定する（ステップＳ７７）。判定手段３０４は、論理積の結果が「０」でない場合（ステップＳ７７：Ｙｅｓ）、データ放送処理手段３１０での３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、データ放送処理手段３１０での処理に必要なデコーダとメモリを確保する（ステップＳ７８）。次に、判定手段３０４は、判定結果をデータ放送処理手段３１０に通知し（ステップＳ７９）、ステップＳ１６の処理を完了する。

更に、判定手段３０４は、ステップＳ７７でＮｏの場合には、ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄの値と０ｘ０８００の論理積を求め、その結果が「０」であるか否かを判定する（ステップＳ８０）。判定手段３０４は、論理積の結果が「０」でない場合（ステップＳ８０：Ｙｅｓ）、データ放送処理手段３１０での３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、データ放送処理手段３１０での処理に必要なデコーダとメモリを確保する（ステップＳ８１）。次に、判定手段３０４は、判定結果をデータ放送処理手段３１０に通知し（ステップＳ８２）、ステップＳ１６の処理を完了する。

＜５．５実施の形態５の変形例＞
（１）ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄで用いるモード識別情報の値として図１６で示す値を用いたが、モード識別情報で用いる値は、これに限らない。ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄに割り当てられたｂｉｔ長で表現でき、字幕及びデータ放送用の表示データの３Ｄ字幕等表示モードがそれぞれ判別できる値であればどのような値を用いてもよい。

＜５．６まとめ＞
本実施の形態の映像処理装置は、既存の記述子のフィールドを利用して、モード識別情報を記述できるので、実施の形態４のように新たに記述子を定義することなく、また、記述子のフィールドを拡張することなく、３Ｄ字幕等表示モードを識別することができる。＜実施の形態６＞
＜６．１概要＞
実施の形態５では、規格化されている既存の記述子であるデータコンテンツ記述子の
ｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄにモード識別情報を記載し、このモード識別情報を抽出することによって３Ｄ字幕等表示モードを判別するとしたが、本実施の形態では、データコンテンツ記述子の未使用領域（ｒｅｓｅｒｖｅｄ領域）として定義されているフィールドにモード識別情報を記載し、このモード識別情報を抽出することによって３Ｄ字幕等表示モードを判別する。

＜６．２データ＞
本実施の形態で用いるデータのデータ構造について説明する。

本実施の形態では、図２１に示すデータコンテンツ記述子に一連のｓｅｌｅｃｔｏｒ＿ｂｙｔｅのひとつとして記載されるａｒｉｂ＿ｂｘｍｌ＿ｉｎｆｏ記述子を用いる。

図２３は、ａｒｉｂ＿ｂｘｍｌ＿ｉｎｆｏ記述子のデータ構造を示す図である。

本実施の形態では、ａｒｉｂ＿ｂｘｍｌ＿ｉｎｆｏ記述子のｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ２００１の６ｂｉｔのうち下位２ｂｉｔを、図３で示したｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅの情報を記述するために用いる。ｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅとが取り得る値については、実施の形態１と同じなので説明を省略する。

＜６．３構成＞
本実施の形態の映像処理装置の構成で、実施の形態５の映像処理装置３００と同じ構成のものは説明を省略し、異なる点を重点的に説明する。なお、本実施の形態で用いる映像処理装置の符号は、説明の都合上、実施の形態５と同じ符号を用いる。

実施の形態５と異なる点は、データコンテンツ記述子内のｄａｔａ＿ｃｏｍｐｏｎｅｎｔ＿ｉｄからモード識別情報を抽出するのではなく、データコンテンツ記述子内の未使用領域に記載されたモード識別情報を抽出し判定手段３０４に出力する点と、判定手段３０４が、このモード識別情報に基づいて３Ｄ字幕等表示モードを判別する点である。

＜６．４動作＞
本実施の形態における映像処理装置３００の動作は、図７のステップＳ１６で判定手段３０４が、データコンテンツ記述子のからｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ２００１の下位２ｂｉｔの値を抽出し、その値に基づいて３Ｄ字幕等表示モードを判別する点で、実施の形態５と異なる。それ以外のステップは、実施の形態５と同じであるので説明を省略する。

判定手段３０４は、ステップＳ１６でｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ２００１の下位２ｂｉｔの値が、「００」の場合は、字幕とデータ放送用の表示データが共に１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、「０１」の場合は、字幕が１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであり、データ放送用の表示データは２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判別する。「１０」の場合は、字幕は２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであり、データ放送用の表示データは２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、「１１」の場合は、字幕とデータ放送用の表示データが共に２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定する。

＜６．５実施の形態６の変形例＞
（１）本実施の形態においては、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ２００１の下位２ｂｉｔにモード識別情報を記述するとしたが、モード識別情報の記載は、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ２００１の下位２ｂｉｔへの記載に限らない。モード識別情報用に２ｂｉｔが確保できればよい。例えば、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ２００１の上位２ｂｉｔに記述してもよい。

（２）また、モード識別情報は、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ２００１に記載することに限らない。データコンテンツ記述子の未使用領域であれば、どこを用いてもよい。例えば、図２３のａｒｉｂ＿ｂｘｍｌ＿ｉｎｆｏ記述子には、ａｒｉｂ＿ｃａｒｏｕｓｅｌ＿ｉｎｆｏ記述子が含まれており、この記述子の未使用領域に記載してもよい。具体的には、図２４で示すａｒｉｂ＿ｃａｒｏｕｓｅｌ＿ｉｎｆｏのＲｅｓｅｒｖｅｄの２ｂｉｔに記述してもよい。

（３）本実施の形態においては、モード識別情報として図３に示すｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅの値を記述するとしたが、モード識別情報は、この値を用いることに限らない。３Ｄ字幕等表示モードを識別できる情報であればよい。例えば、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ２００１の４ｂｉｔに、図１０で示したｓｕｂｔｉｔｌｅ＿ｏｆｆｓｅｔ＿ｍｏｄｅとｂｍｌ＿ｏｆｆｓｅｔ＿ｍｏｄｅとの値を記述してもよい。

（４）また、ｒｅｓｅｒｖｅｄ＿ｆｕｔｕｒｅ＿ｕｓｅ２００１の４ｂｉｔに、図１１で示したｓｕｂｔｉｔｌｅ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ、ｓｕｂｔｉｔｌｅ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ、ｂｍｌ＿１ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇ、ｂｍｌ＿２ｐｌａｎｅ＿ｏｆｆｓｅｔ＿ｆｌａｇの値を記述してもよい。

（５）上記のモード識別情報の記述方法を組み合わせてもよい。

＜６．６まとめ＞
本実施の形態の映像処理装置は、既存の記述子の未使用領域を用いてモード識別情報を記述できるので、記述子のフィールドを拡張することなく３Ｄ字幕等表示モードを識別することができる。
＜実施の形態７＞
＜７．１概要＞
実施の形態７は、放送ではなく、ＩＰ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）ネットワークを用いた電子映像配信システムでのＶＯＤ（ＶｉｄｅｏＯｎＤｅｍａｎｄ）において、配信されるコンテンツの付加情報（メタデータ）にモード識別情報を記述し、映像処理装置はその付加情報を解析して、３Ｄ字幕等表示モードを判定する。

＜７．２データ＞
本実施の形態に係る電子映像配信システムは、デジタルテレビ情報化研究会の「デジタルテレビネットワーク機能仕様ストリーミング機能仕様書コーデック編」に定義されている再生制御情報にモード識別情報を記載する。本実施の形態では、一例として、ＥＲＩ（ＥｎｔｒｙＲｅｓｏｕｒｃｅＩｎｆｏｒｍａｔｉｏｎ）にモード識別情報を記述する。

以下、本実施の形態で用いるデータを説明する。

図２５は、ＥＲＩのデータ構造を示す図である。ただし、本実施の形態に必要のない記述に関しては省略している。ＥＲＩは、ＸＭＬ（ＥｘｔｅｎｓｉｂｌｅＭａｒｋｕｐＬａｎｇｕａｇｅ）文書形式で記述される。

ＥＲＩには、字幕に関する情報を記述するタグ要素として、ひとつのＥＲＩの中に０〜２回記述が可能なｃａｐｔｉｏｎ＿ｉｎｆｏ要素が定義されている。

本実施の形態では、ｃａｐｔｉｏｎ＿ｉｎｆｏ要素にｏｆｆｓｅｔ＿ｍｏｄｅ２５０１という属性を新たに追加する。ｏｆｆｓｅｔ＿ｍｏｄｅ２５０１が存在しない、若しくは、ｏｆｆｓｅｔ＿ｍｏｄｅ２５０１の値が「０」の場合は３Ｄ字幕ではなく従来の２Ｄ字幕であることを表し、ｏｆｆｓｅｔ＿ｍｏｄｅ２５０１の値が「１」の場合は１ｐｌａｎｅ＋ｏｆｆｓｅｔモードを表し、「２」の場合は２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると定義する。

＜７．３構成＞
本実施の形態の映像処理装置の構成で、実施の形態１の映像処理装置３００と同じ構成のものは説明を省略し、異なる点を重点的に説明する。なお、本実施の形態で用いる映像処理装置の符号は、説明の都合上、実施の形態１と同じ符号を用いる。

実施の形態１と異なる点は、受信部３０１が放送ではなく、ＩＰネットワークから情報を受信する点、前記受信する情報は、ＭＰＥＧ２−ＴＳ形式で伝送される映像、音声といった番組を構成するコンテンツデータと、コンテンツ一覧や再生制御情報など付加情報(メタデータ）といったＭＰＥＧ２−ＴＳ以外の形式で伝送されるデータで構成されること、判定手段３０４は解析手段３０３からＰＭＴを受け取るのではなく、受信部３０１から前記受信した再生制御情報としてＥＲＩを受け取ること、判定手段３０４がａｒｉｂ＿３ｄ＿ｏｆｆｓｅｔｍｏｄｅ＿ｉｎｆｏ記述子ではなく、ＥＲＩに定義したタグ要素に記載されたモード識別情報に基づいて３Ｄ字幕等表示モードを判別することである。

＜７．４動作＞
本実施の形態における映像処理装置３００の動作は、まず、図７のステップＳ１８の処理はなく、ステップＳ１６、ステップＳ１７の処理は図７のステップＳ１６，Ｓ１７，Ｓ１８以外の処理、すなわちコンテンツデータを受信し、前記コンテンツデータを再生する処理に先立ち、ＥＲＩを受信した際に行われるものである。また、ステップＳ１６で判定手段３０４が、ＥＲＩから抽出したｃａｐｔｉｏｎ＿ｉｎｆｏ要素の値に基づいて３Ｄ字幕等表示モードの判定を行う点が、実施の形態１と異なる。それ以外のステップは、実施の形態１と同じであるので説明を省略する。

判定手段３０４は、ステップＳ１６で、ｏｆｆｓｅｔ＿ｍｏｄｅ２５０１の値が「１」であれば、字幕処理手段３０９での３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、「２」の場合は２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定する。

＜７．５実施の形態７の変形例＞
（１）本実施の形態では、モード識別情報の値として「０」や「１」の値を用いたが、識別のための値はこれに限らない。３Ｄ字幕等表示モードが判別できる値であれば何でもよい。例えば、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであれば「１ｐｌａｎｅ＋ｏｆｆｓｅｔ」、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであれば「２ｐｌａｎｅ＋ｏｆｆｓｅｔ」の値を用いてもよい。

（２）本実施の形態においては、ＥＲＩのｃａｐｔｉｏｎ＿ｉｎｆｏ要素の属性を追加して３Ｄ字幕等表示モードを表現したが、ｃａｐｔｉｏｎ＿ｉｎｆｏ要素にさらに子要素を追加し、この子要素にモード識別情報を記述してもよい。

具体的には、図２８（ａ）に示すようにｃａｐｔｉｏｎ＿ｉｎｆｏ要素に子要素としてｏｆｆｓｅｔ＿ｍｏｄｅ要素を追加する。このｏｆｆｓｅｔ＿ｍｏｄｅ要素の値が「０」の場合には、従来の２Ｄ字幕の表示であることと定義し、「１」の場合には、１ｐｌａｎｅ＋ｏｆｆｓｅｔモード、「２」の場合には２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると定義して、この値により３Ｄ字幕等表示モードを判別してもよい。なお、従来の２Ｄ字幕の表示である場合には、ｏｆｆｓｅｔ＿ｍｏｄｅ要素の値を「０」とするのではなく、ｃａｐｔｉｏｎ＿ｉｎｆｏ要素にｏｆｆｓｅｔ＿ｍｏｄｅ要素を記述せず、ｏｆｆｓｅｔ＿ｍｏｄｅ要素の記述がない場合に従来の２Ｄ字幕の表示であると判断してもよい。

（３）また、図２８（ｂ）で示すようにｏｆｆｓｅｔ＿ｍｏｄｅ要素は内容を持たない空要素とし、ｏｆｆｓｅｔ＿ｍｏｄｅの属性としてｍｏｄｅを定義し、ｏｆｆｓｅｔ＿ｍｏｄｅ要素が存在しないか、ｍｏｄｅ属性の値が「０」の場合は、３Ｄ字幕ではなく従来の２Ｄ字幕であることを表し、ｏｆｆｓｅｔ＿ｍｏｄｅ要素のｍｏｄｅ属性の値が「１」の場合は１ｐｌａｎｅ＋ｏｆｆｓｅｔモードを表し、ｏｆｆｓｅｔ＿ｍｏｄｅ要素のｍｏｄｅ属性の値が「２」の場合は２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると定義してもよい。

（４）本実施の形態においては、ＥＲＩのｃａｐｔｉｏｎ＿ｉｎｆｏ要素に追加した属性や、子要素にモード識別情報を記述するとしたが、ＥＲＩのｃａｐｔｉｏｎ＿ｉｎｆｏ要素以外の要素を用いてもよい。ＥＲＩ内の要素であれば、どの要素を用いてもよい。ｃａｐｔｉｏｎ＿ｉｎｆｏ要素以外の要素を用いる場合でも、ｃａｐｔｉｏｎ＿ｉｎｆｏ要素で用いた方法を用いてよい。例えば、ｓｔｅｒｅｏｓｃｏｐｉｃ＿ｉｎｆｏ要素を用いてｃａｐｔｉｏｎ＿ｉｎｆｏ要素と同様の方法で定義し、３Ｄ字幕等表示モードの判定に用いてもよい。

＜７．６補足＞
以下、本実施の形態に係る電子映像配信システム２２００について説明する。

＜７．６．１構成＞
図２６は、本実施の形態に係る電子映像配信システム２２００の概略構成図である。

電子映像配信システム２２００は、映像処理装置３００、ポータルサーバ２２０１、再生制御情報サーバ２２０２、ライセンスサーバ２２０３、及びコンテンツサーバ２２０４
を含む構成である。これらのサーバや映像処理装置３００は、ＩＰネットワーク２２０５で接続される。

ポータルサーバ２２０１は、映像処理装置３００に配信されるコンテンツの一覧と、コンテンツを再生するために必要なメタデータのＵＲＬ（ＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＬｏｃａｔｏｒ）を提供するサーバである。

再生制御情報サーバ２２０２は、コンテンツの付加情報を提供するサーバである。ＥＲＩはこのサーバから提供される。

ライセンスサーバ２２０３は、映像処理装置３００が受信し再生するコンテンツに関して、映像処理装置３００に使用の許可のライセンスを与えるサーバである。

コンテンツサーバ２２０４は、映像などのコンテンツデータを映像処理装置３００に提供するサーバである。

＜７．６．２動作＞
図２７は、電子映像配信システム２２００の処理のシーケンスを示す図である。

まず、映像処理装置３００は、ポータルサーバ２２０１に対して、配信されるコンテンツの一覧とコンテンツを再生するために必要なメタデータのＵＲＩ（ＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＩｄｅｎｔｉｆｉｅｒ）とから構成されるナビゲーション情報の送信を要求する（ステップＳ１０１）。

ポータルサーバ２２０１は、映像処理装置３００から要求を受信すると、ナビゲーション情報を映像処理装置３００に送信する（ステップＳ１０２）。なお、本実施の形態におけるナビゲーション情報は、ＨＴＭＬ（ＨｙｐｅｒＴｅｘｔＭａｒｋｕｐＬａｎｇｕａｇｅ）文書形式のデータとして送信され、前記再生制御情報のＵＲＩは、ＨＴＭＬブラウザでボタンがクリックされた場合に選択される参照先として記述されているものとする。

映像処理装置３００は、受信したナビゲーション情報を、ＨＴＭＬブラウザを用いて表示することにより、ユーザにコンテンツ一覧を提示する。ユーザが再生するコンテンツを選択すると、映像処理装置３００は、選択されたコンテンツの再生制御情報のＵＲＩに基づいて、再生制御情報サーバ２２０２に、再生制御情報の送信を要求する（ステップＳ１０３）。

再生制御情報の送信要求を受信した再生制御情報サーバ２２０２は、モード識別情報が記載されたＥＲＩを含む再生制御情報を映像処理装置３００に送信する（ステップＳ１０４）。

次に、映像処理装置３００は、再生制御情報を参照し、コンテンツの再生のためのライセンスが必要な場合には、ライセンスサーバ２２０３にライセンス発行の要求を送信する（ステップＳ１０５）。

ライセンス発行の要求を受信したライセンスサーバ２２０３は、ライセンス発行処理を行い、映像処理装置３００へライセンス情報を送信する（ステップＳ１０６）。

ライセンス情報を受信した映像処理装置３００は、再生制御情報に基づいて、コンテンツサーバ２２０４に、再生要求をしたコンテンツのコンテンツデータの送信要求を行う（ステップＳ１０７）。

コンテンツデータの送信要求を受信したコンテンツサーバ２２０４は、再生要求のコンテンツに係るコンテンツデータを映像処理装置３００に送信する（ステップＳ１０８）。

映像処理装置３００では、コンテンツサーバ２２０４から逐次受信したコンテンツデータを復号し、再生制御情報に含まれるＥＲＩから抽出したモード識別情報に基づいて字幕等の処理を行い、表示用の映像を表示装置３１２に出力する。なお、コンテンツデータの送信要求の送信や、コンテンツデータの受信は、ＨＴＴＰやＲＴＰ（Ｒｅａｌ−ｔｉｍｅＴｒａｎｓｐｏｒｔＰｒｏｔｏｃｏｌ）／ＲＴＳＰ（ＲｅａｌＴｉｍｅＳｔｒｅａｍｉｎｇＰｒｏｔｏｃｏｌ）といったプロトコルを使用する。

＜７．７まとめ＞
本実施の形態の映像処理装置は、ＩＰネットワークを用いた電子映像配信システムで用いられる、コンテンツの付加情報（メタデータ）としての再生制御情報、より具体的な例としてＥＲＩに記述したモード識別情報を用いて３Ｄ字幕等表示モードを判別する。３Ｄ字幕等の表示データを含むストリーミングデータを受信する前に処理されるべき再生制御情報を用いるので、３Ｄ字幕等の表示データを含むストリーミングデータを処理する前に、３Ｄ字幕等表示モードを識別し、リソースを確保することが可能となる。このため、表示データを３Ｄ映像と共に表示するまでの時間を短縮することができる。
＜実施の形態８＞
＜８．１概要＞
本発明に係る実施の形態８では、ＩＰＴＶでのＶＯＤ（ＶｉｄｅｏＯｎＤｅｍａｎｄ）におけるＥＣＧ（ＥｌｅｃｔｒｏｎｉｃＣｏｎｔｅｎｔＧｕｉｄｅ）メタデータにモード識別情報を記述し、映像処理装置はそのＥＣＧメタデータから抽出したモード識別情報を解析して、３Ｄ字幕等表示モードを判定する。

＜８．２データ＞
本実施の形態に係る電子映像配信システムは、ＩＰＴＶ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌＴｅｌｅｖｉｓｉｏｎ）フォーラムジャパンの「ＳＴＤ−０００６ＣＤＮスコープサービスアプローチ仕様１．３版」に定義されているＥＣＧメタデータ内にモード識別情報を記述する。

以下、本実施の形態で用いるデータを説明する。

図２９は、ＥＣＧメタデータのデータ構造を示す図である。ただし、本実施の形態に必要のない記述に関しては省略している。ＥＣＧメタデータは、ＸＭＬ文書形式で記述される。

本実施の形態においては、ＰｒｏｇｒａｍＩｎｆｏｒｍａｔｉｏｎ要素の中の、ＢａｓｉｃＤｅｓｃｒｉｐｔｉｏｎ要素にあるＣａｐｔｉｏｎＬａｎｇｕａｇｅ要素を使用し、ＣａｐｔｉｏｎＬａｎｇｕａｇｅ要素のｄｅｓｃｒｉｐｔｉｏｎ属性２９０１にモード識別情報を記述する。

すなわち、ｄｅｓｃｒｉｐｔｉｏｎ属性２９０１の値が ″１ｐｌａｎｅ＋ｏｆｆｓｅｔ″であれば、３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモード、″２ｐｌａｎｅ＋ｏｆｆｓｅｔ″であれば、３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると定義する。

＜８．３構成＞
本実施の形態の映像処理装置の構成で、実施の形態７の映像処理装置３００と同じ構成のものは説明を省略し、異なる点を重点的に説明する。なお、本実施の形態で用いる映像処理装置の符号は、説明の都合上、実施の形態７と同じ符号を用いる。

実施の形態７と異なる点は、受信部３０１が受信する付加情報としてＥＣＧメタデータが含まれること、判定手段３０４は受信部３０１からＥＲＩを受け取るのではなくＥＣＧメタデータを受け取ること、判定手段３０４が、ＥＲＩに定義したタグ要素に記載されたモード識別情報ではなく、ＥＣＧメタデータに定義したタグ要素に記載されたモード識別情報に基づいて３Ｄ字幕等表示モードを判別することである。

＜８．４動作＞
本実施の形態における映像処理装置３００の動作は、まず、図７のステップＳ１８の処理はなく、ステップＳ１６、ステップＳ１７の処理は図７のステップＳ１６，Ｓ１７，Ｓ１８以外の処理、すなわちコンテンツデータを受信し、前記コンテンツデータを再生する処理に先立ち、ユーザが再生するコンテンツを選択した際に行われるものである。また、ステップＳ１６で判定手段３０４が、ＥＣＧメタデータから抽出したｄｅｓｃｒｉｐｔｉｏｎ属性２９０１の値に基づいて３Ｄ字幕等表示モードの判定を行う点が、実施の形態７と異なる。それ以外のステップは、実施の形態７と同じであるので説明を省略する。

判定手段３０４は、ステップＳ１６で、ＥＣＧメタデータのうち、ユーザが選択した再生するコンテンツに対応する部分のｄｅｓｃｒｉｐｔｉｏｎ属性２９０１の値が″１ｐｌａｎｅ＋ｏｆｆｓｅｔ″であれば、字幕処理手段３０９での３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定し、″２ｐｌａｎｅ＋ｏｆｆｓｅｔ″の場合は２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると判定する。

＜８．５実施の形態８の変形例＞
（１）本実施の形態では、ｄｅｓｃｒｉｐｔｉｏｎ属性に記述するモード識別情報の値として″１ｐｌａｎｅ＋ｏｆｆｓｅｔ″や″２ｐｌａｎｅ＋ｏｆｆｓｅｔ″を用いたが、識別のための値はこれに限らない。３Ｄ字幕等表示モードが判別できる値であれば何でもよい。例えば、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであれば「１」、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであれば「２」としてもよい。

（２）本実施の形態においては、ＣａｐｔｉｏｎＬａｎｇｕａｇｅ要素のｄｅｓｃｒｉｐｔｉｏｎ属性の値にモード識別情報を記述するとしたが、新たにモード識別情報を記述する属性を定義してもよい。

図３０に示すようにＣａｐｔｉｏｎＬａｎｇｕａｇｅ要素にｏｆｆｓｅｔ＿ｍｏｄｅ属性３１０１を定義し、このｏｆｆｓｅｔ＿ｍｏｄｅ属性３１０１にモード識別情報を記述してもよい。

例えば、ｏｆｆｓｅｔ＿ｍｏｄｅ属性の値が「０」の場合は３Ｄ字幕表示ではなく、従来の２Ｄ字幕表示であることを表し、ｏｆｆｓｅｔ＿ｍｏｄｅ属性の値が「１」の場合は１ｐｌａｎｅ＋ｏｆｆｓｅｔモードを表し、ｏｆｆｓｅｔ＿ｍｏｄｅ属性の値が「２」の場合は２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると定義してもよい。

（３）また、ＣａｐｔｉｏｎＬａｎｇｕａｇｅ要素に新たに子要素を追加し、この子要素にモード識別情報を記述してもよい。

（４）また、実施の形態７の変形例の（３）で示したのと同様にｏｆｆｓｅｔ＿ｍｏｄｅ要素は内容を持たない空要素とし、ｏｆｆｓｅｔ＿ｍｏｄｅの属性としてｍｏｄｅを定義して、同様の方法で判別してもよい。

＜８．６補足＞
本実施の形態に係る電子映像配信システムの動作は、実施の形態７に係る電子映像配信システム２２００とほぼ同じであるが、図２７のステップＳ１０２の処理で、ポータルサーバ２２０１が映像処理装置３００に送信するナビゲーション情報にとして、モード識別情報を記述したＥＣＧメタデータを送信する点で、実施の形態７の電子映像配信システムと異なる。なお、説明の都合上、実施の形態７と同じ符号を用いる。

本実施の形態の映像処理装置３００は、ＥＣＧ処理する機能を備えており、受信したＥＣＧメタデータを処理し、コンテンツ選択画面をユーザに提示する。なお、ＥＣＧ処理を処理する機能は、映像処理装置３００が備えるプロセッサが、ＥＣＧ処理するためのプログラムを実行することにより実現される。

ユーザが再生するコンテンツを選択すると、図２７のステップＳ１０３の処理において、映像処理装置３００は、受信したＥＣＧメタデータに記述されているＵＲＩに基づいて、再生制御情報サーバ２２０２に再生制御情報の送信を要求する。

この処理以降の処理は、実施の形態７と同じなので説明を省略する。

＜８．７まとめ＞
本実施の形態の映像処理装置は、ＩＰネットワークを用いた電子映像配信システムで用いられるコンテンツの付加情報（メタデータ）であるＥＣＧメタデータに記述したモード識別情報を用いて３Ｄ字幕等表示モードを判別する。３Ｄ字幕等の表示データを含むストリーミングデータを受信する前に、ＥＣＧメタデータを処理するので、３Ｄ字幕等の表示データを含むストリーミングデータを処理する前に、３Ｄ字幕等表示モードを識別し、リソースを確保することができる。このため、表示データを３Ｄ映像と共に表示するまでの時間を短縮することができる。
＜実施の形態９＞
＜９．１概要＞
本発明に係る実施の形態９の映像処理装置は、データ放送用の表示データを、放送からではなく、ＩＰ放送で行われている擬似データ放送のようなＩＰネットワークの通信によって受信する。このとき、映像処理装置３００は、ＢＩＴにあるハイパーリンク記述子から、データ放送用データを要求するＵＲＩを取得する。ＢＩＴやハイパーリンク記述子については、ＩＰＴＶフォーラムジャパンの「ＳＴＤ−０００４ＩＰ放送仕様１．２版」に定義されているので、説明を省略する。

本実施の形態に係る電子映像配信システムは、ＨＴＴＰ又はＨＴＴＰＳ（ＨｙｐｅｒｔｅｘｔＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌｏｖｅｒＳｅｃｕｒｅＳｏｃｋｅｔＬａｙｅｒ）のレスポンスヘッダにモード識別情報を記述し、映像処理装置は、レスポンスヘッダを解析して３Ｄ字幕等表示モードを判定する。

＜９．２データ＞
図３１は、ＨＴＴＰのヘッダのデータ構造を示す。ただし、本実施の形態に必要のない記述に関しては省略している。

図３１（ａ）は、映像処理装置３００から送信するＨＴＴＰ−ＧＥＴリクエストを示す。

図３１（ｂ）は、図３１（ａ）のＨＴＴＰ−ＧＥＴリクエストを受信したデータ放送用データを提供するサーバから送信する、３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードである場合のＨＴＴＰレスポンスヘッダを含むＨＴＴＰレスポンスである。

図３１（ｃ）は、図３１（ａ）のＨＴＴＰ−ＧＥＴリクエストを受信したデータ放送用データを提供するサーバから送信する、３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードである場合のＨＴＴＰレスポンスヘッダを含むＨＴＴＰレスポンスである。

本実施の形態においては、ＨＴＴＰレスポンスヘッダの拡張ヘッダとして、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅを定義し、この拡張ヘッダにモード識別情報を記述する。すなわち、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅの値が″１ｐｌａｎｅ＋ｏｆｆｓｅｔ″であれば、３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモード、″２ｐｌａｎｅ＋ｏｆｆｓｅｔ″であれば、３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであると定義する。

＜９．３構成＞
本実施の形態の映像処理装置の構成で、実施の形態７の映像処理装置３００と同じ構成のものは説明を省略し、異なる点を重点的に説明する。なお、本実施の形態で用いる映像処理装置の符号は、説明の都合上、実施の形態７同じ符号を用いる。

実施の形態７と異なる点は、映像処理装置３００のプロセッサが受信したＨＴＴＰレスポンスヘッダからモード識別情報を抽出し判定手段３０４に出力する点と、判定手段３０４が、ＥＲＩに定義したタグ要素に記載されたモード識別情報ではなく、ＨＴＴＰレスポンスヘッダの拡張ヘッダに記載されたモード識別情報に基づいて３Ｄ字幕等表示モードを判別する点である。

＜９．４動作＞
本実施の形態における映像処理装置３００の動作は、まず、図７のステップＳ１８の処理はなく、ステップＳ１６、ステップＳ１７の処理は映像受信装置３００がデータ放送用データをＨＴＴＰにより受信したときに行われるものである。また、図７のステップＳ１６，Ｓ１７，Ｓ１８以外の処理、すなわちコンテンツデータを受信し、前記コンテンツデータを再生する処理は、ＩＰ放送受信中は行われているものである。また、ステップＳ１５で、映像処理装置３００が備えるプロセッサは、ＨＴＴＰ処理を行うプログラムを実行してデータ放送用データをＨＴＴＰで受信し、続いて、ＨＴＴＰレスポンスヘッダの拡張ヘッダであるＸ−Ｏｆｆｓｅｔ−Ｍｏｄｅからモード識別情報を抽出し判定手段３０４に出力こと、ステップＳ１６で判定手段３０４が、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅの値に基づいて３Ｄ字幕等表示モードの判定を行うことが、実施の形態７と異なる。それ以外のステップは、実施の形態７と同じであるので説明を省略する。

以下に、データ放送用データ取得のシーケンスを説明する。

本実施の形態では、データ放送用データの要求先のＵＲＬがｈｔｔｐ：／／ｗｗｗ．ｂｒｏａｄｃａｓｔｅｒ．ｃｏｍ／ｄａｔａ＿ｂｒｏａｄｃａｓｔ／３Ｄｄａｔａであるとして説明する。

まず、映像処理装置３００は、データ放送用データを提供するサーバに対して、図３１（ａ）に示すＨＴＴＰ−ＧＥＴリクエストを送信する。このＨＴＴＰ−ＧＥＴリクエストは、データ放送用データの要求先のＵＲＬとして、ｈｔｔｐ：／／ｗｗｗ．ｂｒｏａｄｃａｓｔｅｒ．ｃｏｍ／ｄａｔａ＿ｂｒｏａｄｃａｓｔ／３Ｄｄａｔａを指定したＨＴＴＰ−ＧＥＴリクエストである。

図３１（ａ）のリクエストを受信したデータ放送用の表示データを提供するサーバは、要求されたデータ放送用データの要求先にあるデータ放送用表示データの３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードの場合は図３１（ｂ）のＨＴＴＰレスポンスヘッダを返信する。このＨＴＴＰレスポンスには、拡張ヘッダとして、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅが記述されており、この値は″１ｐｌａｎｅ−ｏｆｆｓｅｔ″であるので、判定手段３０４は、データ放送処理手段３１０でのデータ放送用の表示データの処理が、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードによる処理であると判断する。一方、３Ｄ字幕等表示モードが２ｐｌａｎｅ＋ｏｆｆｓｅｔモードの場合は、図３１（ｃ）のＨＴＴＰレスポンスヘッダを返信する。この場合のＸ−Ｏｆｆｓｅｔ−Ｍｏｄｅの値は″２ｐｌａｎｅ＋ｏｆｆｓｅｔ″であるので、判定手段３０４は、データ放送処理手段３１０でのデータ放送用の表示データの処理が、２ｐｌａｎｅ−ｏｆｆｓｅｔモードによる処理であると判断する。

＜９．５実施の形態９の変形例＞
（１）本実施の形態においては、ＨＴＴＰレスポンスヘッダに、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅという拡張ヘッダを定義して、このＸ−Ｏｆｆｓｅｔ−Ｍｏｄｅに″１ｐｌａｎｅ−ｏｆｆｓｅｔ″と″２ｐｌａｎｅ−ｏｆｆｓｅｔ″とのいずれかの値を記述し、この値に基づいてデータ放送用の表示データの３Ｄ字幕等表示モードを判定するとしたが、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅに記述する値は、これらの値に限らない。１ｐｌａｎｅ＋ｏｆｆｓｅｔモードと２ｐｌａｎｅ＋ｏｆｆｓｅｔモードとが識別できる値であればよい。例えば、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅの値が「１」であれば、１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであるとし、「２」であれば２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであるとしてもよい。（２）また、拡張ヘッダの名称も、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅではなくてもよい。モード識別情報が記載されている拡張ヘッダであることがわかれば、どのような名称であってもよい。

＜９．６補足＞
以下、本実施の形態に係るデータ放送用データ提供サーバについて説明する。

＜９．６．１構成＞
（データ放送用データ提供サーバ３２００）
図３２は、実施の形態９におけるデータ放送用データを映像処理装置３００に提供するデータ放送用データ提供サーバ３２００の概略構成図である。

データ放送用データ提供サーバ３２００は、送受信部３２０１、解析部３２０２、データ取得部３２０３、レスポンス生成部３２０４、及び蓄積部３２０５を含む構成である。

送受信部３２０１は、映像処理装置３００とデータの送受信を行う機能を備える。

解析部３２０２は、送受信部３２０１で受信したＨＴＴＰ−ＧＥＴリクエストを解析する機能と、映像処理装置３００に送信するデータを特定する機能を備える。

データ取得部３２０３は、解析部３２０２で特定したデータ放送用のデータと属性情報とを蓄積部３２０５から読み出す機能を備える。

レスポンス生成部３２０４は、解析部３２０２から通知されたＨＴＴＰ−ＧＥＴリクエストの情報と、データ取得部３２０３が蓄積部３２０５から読み出した、データ放送用データ、及び属性情報に含まれるモード識別情報を受信し、映像処理装置３００に返すＨＴＴＰレスポンスを生成する機能を備える。

レスポンス生成部３２０４で生成したレスポンスは送受信部３２０１へ出力され、送受信部３２０１から映像処理装置３００へ送信される。

データ放送用データ提供サーバ３２００は、図示しないプロセッサ及びメモリを含んで構成されており、送受信部３２０１、解析部３２０２、データ取得部３２０３、レスポンス生成部３２０４の機能は、このメモリに記憶されているプログラムをこのプロセッサが実行することにより実現される。

蓄積部３２０５は、ハードディスクなどの記録媒体で構成され、データ放送用データや蓄積されているデータ放送用の表示データ、及びその表示データのモード識別情報を含む属性情報を蓄積する。

＜９．６．２動作＞
まず、送受信部３２０１は、コンテンツに係るデータ放送用データの取得要求であるＨＴＴＰ−ＧＥＴリクエストを受信し、解析部３２０２へ出力する。

解析部３２０２は、ＨＴＴＰ−ＧＥＴリクエストを解析し、要求のあったコンテンツに係るデータ放送用の表示データを特定する情報を、データ取得部３２０３に出力する。

データ取得部３２０３は、解析部３２０２から通知された情報に基づいて、データ放送用の表示データとその属性情報を蓄積部３２０５から読み出す。

次に、データ取得部３２０３は、読み出した属性情報から、データ放送用の表示データの３Ｄ字幕等表示モードが１ｐｌａｎｅ＋ｏｆｆｓｅｔモードであるか２ｐｌａｎｅ＋ｏｆｆｓｅｔモードであるかの情報を抽出し、レスポンス生成部３２０４へ出力する。

レスポンス生成部３２０４は、データ放送用の表示データの３Ｄ字幕等表示モードにしたがって、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅ拡張ヘッダを設定する。具体的には、データ取得部３２０３から受け取ったモード識別情報が１ｐｌａｎｅ＋ｏｆｆｓｅｔモードの場合には、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅの値を″１ｐｌａｎｅ＋ｏｆｆｓｅｔ″とし、２ｐｌａｎｅ＋ｏｆｆｓｅｔモードの場合には、Ｘ−Ｏｆｆｓｅｔ−Ｍｏｄｅの値を″２ｐｌａｎｅ＋ｏｆｆｓｅｔ″をＨＴＴＰレスポンスヘッダに含むＨＴＴＰレスポンスを生成する。

生成したＨＴＴＰレスポンスを送受信部３２０１へ出力し、送受信部３２０１は、ＨＴＴＰレスポンスを映像処理装置３００へ送信する。

＜９．７まとめ＞
本実施の形態の映像処理装置は、ＩＰネットワークを用いた電子映像配信システムで用いられる通信プロトコルであるＨＴＴＰのレスポンスヘッダに記述したモード識別情報を用いて３Ｄ字幕等表示モードを判別する。これにより、データ放送用の表示データを処理する前に、３Ｄ字幕等表示モードを識別し、リソースを確保することができるので表示データを３Ｄ映像と共に表示するまでの時間を短縮することができる。
＜１０．その他の変形例＞
以上、本発明に係る映像処理装置を、実施の形態に基づいて説明したが、以下のように変形することも可能であり、本発明は上述した実施の形態で示した通りの映像処理装置に限られないことは勿論である。
（１）実施の形態における映像処理装置は、処理した映像を外部の表示装置（例えば、３Ｄ映像対応テレビ）に出力するとしたが、この映像処理装置と表示装置とを一体にした構成（例えば、本発明に係る映像処理装置を備える３Ｄ映像対応テレビ）としてもよい。
（２）実施の形態において、判定手段３０４は、判定結果に基づいて、字幕処理手段３０９及びデータ放送処理手段３１０で処理に必要なデコーダやメモリのリソースを確保するとしたが、映像処理装置のデコーダやメモリは映像処理装置の他の処理と共用で用いられるので、他の処理を実行（例えば、裏番組の録画や、録画済みの番組のダビング）している場合、デコーダやメモリのリソースを確保できない可能性がある。このような場合には、字幕等の処理に先だって、他の処理を中断して字幕等の表示のための処理のリソースを確保したり、字幕やデータ放送の表示が不可能であることをユーザに告知するようにしてもよい。告知されたユーザは、実行中の他の処理を中断させるかどうかの判断ができる。映像処理装置は、ユーザが実行中の他の処理の中断等を行うことでリソースが確保できる状態になれば、その時点からリソースを確保し、字幕等の表示データの処理を行うことができる。

このように、リソースが確保できない場合には、字幕等を３Ｄ映像と共に表示することはできないが、字幕やデータ放送用のデータの処理に先だって、３Ｄ字幕等表示モードを判別することによって、ユーザの利便性に配慮した処理が可能となる。
（３）実施の形態において説明した各構成要素の内、全部又は一部を１チップ又は複数チップの集積回路で実現してもよいし、コンピュータのプログラムで実現してもよい。

また、実施の形態において説明した各構成要素は、映像処理装置が有するプロセッサと協働することにより、その機能を実現する。
（４）本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。

また、本発明は、前記コンピュータプログラム又は前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、ＣＤ―ＲＯＭ、ＭＯ、ＤＶＤ、ＤＶＤ−ＲＯＭ、ＤＶＤ−ＲＡＭ、ＢＤ（Ｂｌｕ−ｒａｙＤｉｓｃ（登録商標））、半導体メモリなど、に記録したものとしてもよい。また、これらの記録媒体に記録されている前記コンピュータプログラム又は前記デジタル信号であるとしてもよい。

また、本発明に係るコンピュータプログラム又はデジタル信号を、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
（５）上記実施の形態及び上記変形例をそれぞれ適宜組み合わせるとしてもよい。
（６）以下、更に本発明の一実施形態としての映像処理装置の構成及びその変形例と効果について説明する。

（ａ）本発明の一実施形態に係る映像処理装置は、３Ｄ映像と共に補助表示物を表示するための映像処理装置であって、前記補助表示物を１プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第１の処理手段と、前記補助表示物を２プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第２の処理手段と、少なくとも、前記補助表示物を１プレーン及び２プレーンのいずれかを用いて表す情報を含む補助表示物再生用ストリームと、前記補助表示物が１プレーン及び２プレーンのいずれで表されているかを示す識別情報を含むデータブロックとを受信する受信手段と、前記補助表示物再生用ストリームの内容が参照されることに先行して、データブロック内の識別情報を抽出し、当該識別情報に応じて第１の処理手段及び第２の処理手段のいずれかを選択する選択手段と、前記選択手段による前記選択の後に、前記補助表示物再生用ストリームの内容である補助表示物を表す情報を、第１の処理手段及び第２の処理手段のうち当該選択手段により選択された処理手段に対して、逐次供給して右目用補助表示物及び左目用補助表示物の作成及び出力を行わせる制御手段とを備える。

従って、この映像処理装置によれば、３Ｄ映像と共に表示する表示データを含むストリームの内容を解析することなく、３Ｄ字幕等表示モードを判別することができるので、表示データを３Ｄ映像と共に表示するまでの時間を短縮することができる。

（ｂ）また、前記制御手段は、前記第１及び第２の処理手段の処理に先行して、前記選択手段の選択結果に基づいて、第１の処理手段及び第２の処理手段のうち選択された処理手段に必要なプレーン数に応じたメモリ領域を確保する、としてもよい。

従って、この映像処理装置によれば、３Ｄ映像と共に表示する表示データを含むストリームの内容を解析する前に、表示データを含むストリームを処理するための画像プレーンメモリを確保することができる。

（ｃ）また、前記受信手段は、前記補助表示物が共に表示される３Ｄ映像を含むコンテンツに係るストリームを含むＭＰＥＧ２−ＴＳ形式のデータストリームを受信し、前記データブロックは、前記データストリームに含まれる前記コンテンツに関するＰＭＴであり、前記選択手段は、前記ＰＭＴから抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択する、としてもよい。

従って、この映像処理装置によれば、３Ｄ映像と共に表示する表示データを含むストリームの内容を解析する前に、解析するＰＭＴに含まれるモード識別情報に基づいて、３Ｄ字幕等表示モードを識別することができる。

（ｄ）また、前記ＰＭＴには、前記コンテンツに係るストリームを構成する各ＥＳそれぞれに関する情報の記載部分と前記コンテンツに係るストリームに共通する情報の記載部分とがあり、前記識別情報は、前記コンテンツに係るストリームに共通する情報の記載部分に含まれており、前記選択手段は、前記コンテンツに係るストリームに共通する情報の記載部分から抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択する、としてもよい。

従って、この映像処理装置によれば、コンテンツに係るストリームに共通する情報の記載部分に記述したモード識別情報に基づいて、３Ｄ字幕等表示モードを識別することができる。

（ｅ）また、前記ＰＭＴには、前記コンテンツに係るストリームを構成する各ＥＳそれぞれに関する情報の記載部分と前記コンテンツに係るストリームに共通する情報の記載部分とがあり、前記識別情報は、前記各ＥＳそれぞれに関する情報の記載部分に含まれており、前記選択手段は、前記各ＥＳそれぞれに関する情報の記載部分から抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択する、としてもよい。

従って、この映像処理装置によれば、コンテンツを構成する各ＥＳ毎の情報の記載部分に記述したモード識別情報に基づいて、３Ｄ字幕等表示モードを識別することができる。

（ｆ）また、前記各ＥＳそれぞれに関する情報の記載部分には、データ符号化方式識別子が含まれており、前記識別情報は、前記データ符号化方式識別子に含まれており、前記選択手段は、前記データ符号化方式識別子から抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択する、としてもよい。

従って、この映像処理装置によれば、コンテンツを構成する各ＥＳ毎の情報の内、データ符号化方式識別子に記述したモード識別情報に基づいて、３Ｄ字幕等表示モードを識別することができる。

（ｇ）また、前記受信手段は、放送局からのＭＰＥＧ２−ＴＳ形式のデータストリームを受信し、前記データブロックは、前記データストリームに含まれるＥＩＴであり、前記ＥＩＴは、前記補助表示物が共に表示される３Ｄ映像に関する情報の記載部分が含まれており、前記識別情報は、前記補助表示物が共に表示される３Ｄ映像に関する情報の記載部分に含まれており、前記選択手段は、前記補助表示物が共に表示される３Ｄ映像に関する情報の記載部分から抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択する、としてもよい。

従って、この映像処理装置によれば、３Ｄ映像と共に表示する表示データを含むストリームが送信される前に、送信されるＥＩＴに含まれるモード識別情報に基づいて、３Ｄ字幕等表示モードを識別することができる。

（ｈ）また、前記補助表示物が共に表示される３Ｄ映像に関する情報には、データコンテンツ記述子が含まれており、前記識別情報は、前記データコンテンツ記述子に含まれており、前記選択手段は、前記データコンテンツ記述子から抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択する、としてもよい。

従って、この映像処理装置によれば、ＥＩＴに含まれるデータコンテンツ記述子に記述したモード識別情報に基づいて、３Ｄ字幕等表示モードを識別することができる。

（ｉ）また、前記受信手段は、少なくともＩＰネットワークを用いて配信されるストリーミングデータと、前記ストリーミングデータを再生するための情報を含む再生制御情報とを受信し、前記データブロックは、前記再生制御情報に含まれているものであり、前記選択手段は、前記データブロックから抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択する、としてもよい。

従って、この映像処理装置によれば、ＩＰＴＶ用のストリーミングデータを再生するための再生制御情報に記述したモード識別情報に基づいて、３Ｄ字幕等表示モードを識別することができる。

（ｊ）また、前記受信手段は、少なくともＩＰネットワークを用いて配信されるＶＯＤ用ナビゲーションデータ、および、前記補助表示物が共に表示される３Ｄ映像を含むコンテンツに係るストリームを含むＶＯＤ用のストリーミングデータを受信し、前記データブロックは、前記ナビゲーションデータに含まれたものであり、前記選択手段は、前記データブロックから抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択する、としてもよい。

従って、この映像処理装置によれば、ＶＯＤ用のストリーミングデータを受信する前に処理を行うナビゲーションデータに記述したモード識別情報に基づいて、３Ｄ字幕等表示モードを識別することができる。

（ｋ）また、前記受信手段は、前記補助表示物が共に表示される３Ｄ映像を含むコンテンツに係るストリームを含むＭＰＥＧ２−ＴＳ形式のデータストリームを受信し、前記データストリームに含まれる前記コンテンツに係るＢＩＴに記載されたハイパーリンク記述子の情報に基づいて、前記補助表示物再生用ストリームを、ＨＴＴＰを用いてＩＰネットワークから取得する取得手段を更に備え、前記データブロックは、前記取得の要求に対する応答であるＨＴＴＰのレスポンスヘッダであり、前記選択手段は、前記レスポンスヘッダから抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択する、としてもよい。

従って、この映像処理装置によれば、ＨＴＴＰのレスポンスヘッダに記述したモード識別情報に基づいて、３Ｄ字幕等表示モードを識別することができる。

（ｌ）本発明の一実施形態に係る映像処理方法は、３Ｄ映像と共に補助表示物を表示するための映像処理装置の映像処理方法であって、前記補助表示物を１プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第１の処理ステップと、前記補助表示物を２プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第２の処理ステップと、少なくとも前記補助表示物を１プレーン及び２プレーンのいずれかを用いて表す情報を含む補助表示物再生用ストリームと、前記補助表示物が１プレーン及び２プレーンのいずれで表されているかを示す識別情報を含むデータブロックとを受信する受信ステップと、前記補助表示物再生用ストリームの内容が参照されることに先行して、データブロック内の識別情報を抽出し、当該識別情報に応じて第１の処理ステップ及び第２の処理ステップのいずれかを選択する選択ステップと、前記選択ステップによる前記選択の後に、前記補助表示物再生用ストリームの内容である補助表示物を表す情報を、第１の処理ステップ及び第２の処理ステップのうち当該選択ステップにより選択された処理ステップに対して、逐次供給して右目用補助表示物及び左目用補助表示物の作成及び出力を行わせる制御ステップとを備える。

従って、この映像処方法によれば、３Ｄ映像と共に表示する表示データを含むストリームの内容を解析することなく、３Ｄ字幕等表示モードを判別することができるので、表示データを３Ｄ映像と共に表示するまでの時間を短縮することができる。

（ｍ）本発明の一実施形態に係る映像処理プログラムは、３Ｄ映像と共に補助表示物を表示するための映像処理装置の映像処理プログラムであって、前記映像処理装置に、前記補助表示物を１プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第１の処理ステップと、前記補助表示物を２プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第２の処理ステップと、少なくとも前記補助表示物を１プレーン及び２プレーンのいずれかを用いて表す情報を含む補助表示物再生用ストリームと、前記補助表示物が１プレーン及び２プレーンのいずれで表されているかを示す識別情報を含むデータブロックとを受信する受信ステップと、前記補助表示物再生用ストリームの内容が参照されることに先行して、データブロック内の識別情報を抽出し、当該識別情報に応じて第１の処理ステップ及び第２の処理ステップのいずれかを選択する選択ステップと、前記選択ステップによる前記選択の後に、前記補助表示物再生用ストリームの内容である補助表示物を表す情報を、第１の処理ステップ及び第２の処理ステップのうち当該選択ステップにより選択された処理ステップに対して、逐次供給して右目用補助表示物及び左目用補助表示物の作成及び出力を行わせる制御ステップとを備える。

従って、この映像処理プログラムによれば、３Ｄ映像と共に表示する表示データを含むストリームの内容を解析することなく、３Ｄ字幕等表示モードを判別することができるので、表示データを３Ｄ映像と共に表示するまでの時間を短縮することができる。

（ｎ）本発明の一実施形態に係る映像処理プログラムの記録媒体は、３Ｄ映像と共に補助表示物を表示するための映像処理装置に実行させる映像処理プログラムを記録した記録媒体であって、前記映像処理装置に、前記補助表示物を１プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第１の処理ステップと、前記補助表示物を２プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第２の処理ステップと、少なくとも前記補助表示物を１プレーン及び２プレーンのいずれかを用いて表す情報を含む補助表示物再生用ストリームと、前記補助表示物が１プレーン及び２プレーンのいずれで表されているかを示す識別情報を含むデータブロックとを受信する受信ステップと、前記補助表示物再生用ストリームの内容が参照されることに先行して、データブロック内の識別情報を抽出し、当該識別情報に応じて第１の処理ステップ及び第２の処理ステップのいずれかを選択する選択ステップと、前記選択ステップによる前記選択の後に、前記補助表示物再生用ストリームの内容である補助表示物を表す情報を、第１の処理ステップ及び第２の処理ステップのうち当該選択ステップにより選択された処理ステップに対して、逐次供給して右目用補助表示物及び左目用補助表示物の作成及び出力を行わせる制御ステップとを映像処理装置に実行させる映像処理プログラムを記録している。

従って、この映像処理プログラムの記録媒体によれば、３Ｄ映像と共に表示する表示データを含むストリームの内容を解析することなく、３Ｄ字幕等表示モードを判別することができるので、表示データを３Ｄ映像と共に表示するまでの時間を短縮することができる。

（ｏ）本発明の一実施形態に係る映像処理装置を構成する集積回路は、３Ｄ映像と共に補助表示物を表示するための映像処理装置を構成する集積回路であって、前記補助表示物を１プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第１の処理手段と、前記補助表示物を２プレーンで表す情報に基づいて、前記補助表示物の３Ｄ表示のための右目用補助表示物及び左目用補助表示物を作成して出力する機能を有する第２の処理手段と、少なくとも前記補助表示物を１プレーン及び２プレーンのいずれかを用いて表す情報を含む補助表示物再生用ストリームと、前記補助表示物が１プレーン及び２プレーンのいずれで表されているかを示す識別情報を含むデータブロックとを受信する受信手段と、前記補助表示物再生用ストリームの内容が参照されることに先行して、データブロック内の識別情報を抽出し、当該識別情報に応じて第１の処理手段及び第２の処理手段のいずれかを選択する選択手段と、前記選択手段による前記選択の後に、前記補助表示物再生用ストリームの内容である補助表示物を表す情報を、第１の処理手段及び第２の処理手段のうち当該選択手段により選択された処理手段に対して、逐次供給して右目用補助表示物及び左目用補助表示物の作成及び出力を行わせる制御手段とを備える。

従って、この映像処理装置を構成する集積回路によれば、３Ｄ映像と共に表示する表示データを含むストリームの内容を解析することなく、３Ｄ字幕等表示モードを判別することができるので、表示データを３Ｄ映像と共に表示するまでの時間を短縮することができる。

本発明に係る映像処理装置は、字幕やデータ放送用データを３Ｄ映像と共に表示する映像処理装置等に有効である。

３００映像処理装置
３０１受信部
３０２デマルチプレクサ
３０３解析手段
３０４判定手段
３０５ビデオデコード手段
３０６オフセット取得手段
３０７左目映像出力手段
３０８右目映像出力手段
３０９字幕処理手段
３１０データ放送処理手段
３１１表示用映像出力手段
７０１字幕デコード手段
７０２字幕プレーンメモリ
７０３左字幕シフト出力手段
７０４右字幕シフト出力手段
８０１左字幕デコード手段
８０２左字幕プレーンメモリ
８０３左字幕シフト出力手段
８０４右字幕デコード手段
８０５右字幕プレーンメモリ
８０６右字幕シフト出力手段

Claims

3D映像と共に補助表示物を表示するための映像処理装置であって、
補助表示物用ストリームをデコードすることで、平面的な補助対象物を得て1プレーンに格納し、順次入力されてくるオフセットに従い、1プレーンに格納された補助対象物の座標を左方向及び右方向にシフトすることで、平面形状をなす補助対象物の画面に対する奥行きを変化させる第１処理手段と、
補助表示物用ストリームをデコードすることで、立体形状をなす補助表示物を規定する左目用補助表示物、右目用補助表示物の組みを得て、左目用補助表示物、右目用補助対象物を2プレーンのそれぞれに格納し、順次入力されてくるオフセットに従い、2プレーンのそれぞれに格納された左目用補助表示物の座標、及び、右目用補助表示物の座標を相反する方向にシフトすることで、立体形状をもった補助表示物の画面に対する奥行きを変化させる第２処理手段と、
補助表示物再生用ストリームと、前記補助表示物が１プレーン及び２プレーンのいずれで表されているかを示す識別情報を含むデータブロックとを受信する受信手段と、
前記補助表示物再生用ストリームの内容が参照されることに先行して、データブロック内の識別情報を抽出し、当該識別情報に応じて第１の処理手段及び第２の処理手段のいずれかを選択する選択手段と、
前記選択手段による前記選択の後に、前記補助表示物再生用ストリームの内容である補助表示物を表す情報を、第１の処理手段及び第２の処理手段のうち当該選択手段により選択された処理手段に対して、逐次供給して右目用補助表示物及び左目用補助表示物の作成及び出力を行わせる制御手段と
を備えることを特徴とする映像処理装置。
前記制御手段は、前記第１及び第２の処理手段の処理に先行して、前記選択手段の選択結果に基づいて、第１の処理手段及び第２の処理手段のうち選択された処理手段に必要なプレーン数に応じたメモリ領域を確保する
ことを特徴とする請求項１に記載の映像処理装置。
前記受信手段は、前記補助表示物が共に表示される3D映像を含むコンテンツに係るストリームを含むMPEG２-TS（Transport Stream）形式のデータストリームを受信し、
前記データブロックは、前記データストリームに含まれる前記コンテンツに関するPMT（Program Map Table）であり、
前記選択手段により抽出される識別情報は、前記PMTに格納されることを特徴とする請求項２に記載の映像処理装置。
前記PMTには、前記コンテンツに係るストリームを構成する各ES（Elementary Stream）それぞれに関する情報の記載部分と前記コンテンツに係るストリームに共通する情報の記載部分とがあり、
前記選択手段により抽出される識別情報は、前記コンテンツに係るストリームに共通する情報の記載部分に含まれている
ことを特徴とする請求項３に記載の映像処理装置。
前記PMTには、前記コンテンツに係るストリームを構成する各ESそれぞれに関する情報の記載部分と前記コンテンツに係るストリームに共通する情報の記載部分とがあり、
前記識別情報は、前記各ESそれぞれに関する情報の記載部分に含まれており、
前記選択手段は、前記各ESそれぞれに関する情報の記載部分から抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択することを特徴とする請求項３に記載の映像処理装置。
前記各ESそれぞれに関する情報の記載部分には、データ符号化方式識別子が含まれており、
前記識別情報は、前記データ符号化方式識別子に含まれており、
前記選択手段は、前記データ符号化方式識別子から抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択することを特徴とする請求項５に記載の映像処理装置。
前記受信手段は、放送局からのMPEG２-TS形式のデータストリームを受信し、
前記データブロックは、前記データストリームに含まれるEIT（Event Information Table）であり、
前記EITは、前記補助表示物が共に表示される3D映像に関する情報の記載部分が含まれており、
前記識別情報は、前記補助表示物が共に表示される3D映像に関する情報の記載部分に含まれており、
前記選択手段は、前記補助表示物が共に表示される3D映像に関する情報の記載部分から抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択することを特徴とする請求項２に記載の映像処理装置。
前記補助表示物が共に表示される3D映像に関する情報には、データコンテンツ記述子が含まれており、
前記識別情報は、前記データコンテンツ記述子に含まれており、
前記選択手段は、前記データコンテンツ記述子から抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択することを特徴とする請求項７に記載の映像処理装置。
前記受信手段は、少なくともIP（Internet Protocol）ネットワークを用いて配信されるストリーミングデータと、前記ストリーミングデータを再生するための情報を含む再生制御情報とを受信し、
前記データブロックは、前記再生制御情報に含まれているものであり、
前記選択手段は、前記データブロックから抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択することを特徴とする請求項２に記載の映像処理装置。
前記受信手段は、少なくとも、IP（Internet Protocol）ネットワークを用いて配信されるVOD（Video ODemand）用のナビゲーションデータ、および、前記補助表示物が共に表示される3D映像を含むコンテンツに係るストリームを含むVOD用のストリーミングデータを受信し、
前記データブロックは、前記ナビゲーションデータに含まれたものであり、
前記選択手段は、前記データブロックから抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択することを特徴とする請求項２に記載の映像処理装置。
前記受信手段は、前記補助表示物が共に表示される3D映像を含むコンテンツに係るストリームを含むMPEG２-TS形式のデータストリームを受信し、
前記データストリームに含まれる前記コンテンツに係るBIT（Broadcaster Information Table）に記載されたハイパーリンク記述子の情報に基づいて、前記補助表示物再生用ストリームをHTTP（HyperText Transfer Protocol）を用いてIPネットワークから取得を行う取得手段を更に備え、
前記データブロックは、前記取得の要求に対する応答であるHTTPのレスポンスヘッダであり、
前記選択手段は、前記レスポンスヘッダから抽出した前記識別情報に基づいて、前記第１の処理手段及び前記第２の処理手段のいずれかを選択することを特徴とする請求項２に記載の映像処理装置。
3D映像と共に補助表示物を表示するための映像処理装置の映像処理方法であって、
補助表示物用ストリームをデコードすることで、平面的な補助対象物を得て1プレーンに格納し、順次入力されてくるオフセットに従い、1プレーンに格納された補助対象物の座標を左方向及び右方向にシフトすることで、平面形状をなす補助対象物の画面に対する奥行きを変化させる第１処理ステップと、
補助表示物用ストリームをデコードすることで、立体形状をなす補助表示物を規定する左目用補助表示物、右目用補助表示物の組みを得て、左目用補助表示物、右目用補助対象物を2プレーンのそれぞれに格納し、順次入力されてくるオフセットに従い、2プレーンのそれぞれに格納された左目用補助表示物の座標、及び、右目用補助表示物の座標を相反する方向にシフトすることで、立体形状をもった補助表示物の画面に対する奥行きを変化させる第２処理ステップと、
補助表示物再生用ストリームと、前記補助表示物が１プレーン及び２プレーンのいずれで表されているかを示す識別情報を含むデータブロックとを受信する受信ステップと、
前記補助表示物再生用ストリームの内容が参照されることに先行して、データブロック内の識別情報を抽出し、当該識別情報に応じて第１の処理ステップ及び第２の処理ステップのいずれかを選択する選択ステップと、
前記選択ステップによる前記選択の後に、前記補助表示物再生用ストリームの内容である補助表示物を表す情報を、第１の処理ステップ及び第２の処理ステップのうち当該選択ステップにより選択された処理ステップに対して、逐次供給して右目用補助表示物及び左目用補助表示物の作成及び出力を行わせる制御ステップと
を備えることを特徴とする映像処理方法。
3D映像と共に補助表示物を表示するための映像処理装置に実行させる映像処理プログラムであって、
前記映像処理装置に、補助表示物用ストリームをデコードすることで、平面的な補助対象物を得て1プレーンに格納し、順次入力されてくるオフセットに従い、1プレーンに格納された補助対象物の座標を左方向及び右方向にシフトすることで、平面形状をなす補助対象物の画面に対する奥行きを変化させる第１処理ステップと、
補助表示物用ストリームをデコードすることで、立体形状をなす補助表示物を規定する左目用補助表示物、右目用補助表示物の組みを得て、左目用補助表示物、右目用補助対象物を2プレーンのそれぞれに格納し、順次入力されてくるオフセットに従い、2プレーンのそれぞれに格納された左目用補助表示物の座標、及び、右目用補助表示物の座標を相反する方向にシフトすることで、立体形状をもった補助表示物の画面に対する奥行きを変化させる第２処理ステップと、
補助表示物再生用ストリームと、前記補助表示物が１プレーン及び２プレーンのいずれで表されているかを示す識別情報を含むデータブロックとを受信する受信ステップと、
前記補助表示物再生用ストリームの内容が参照されることに先行して、データブロック内の識別情報を抽出し、当該識別情報に応じて第１の処理ステップ及び第２の処理ステップのいずれかを選択する選択ステップと、
前記選択ステップによる前記選択の後に、前記補助表示物再生用ストリームの内容である補助表示物を表す情報を、第１の処理ステップ及び第２の処理ステップのうち当該選択ステップにより選択された処理ステップに対して、逐次供給して右目用補助表示物及び左目用補助表示物の作成及び出力を行わせる制御ステップとを、
実行させる映像処理プログラム。
3D映像と共に補助表示物を表示するための映像処理装置を構成する集積回路であって、
補助表示物用ストリームをデコードすることで、平面的な補助対象物を得て1プレーンに格納し、順次入力されてくるオフセットに従い、1プレーンに格納された補助対象物の座標を左方向及び右方向にシフトすることで、平面形状をなす補助対象物の画面に対する奥行きを変化させる第１処理手段と、
補助表示物用ストリームをデコードすることで、立体形状をなす補助表示物を規定する左目用補助表示物、右目用補助表示物の組みを得て、左目用補助表示物、右目用補助対象物を2プレーンのそれぞれに格納し、順次入力されてくるオフセットに従い、2プレーンのそれぞれに格納された左目用補助表示物の座標、及び、右目用補助表示物の座標を相反する方向にシフトすることで、立体形状をもった補助表示物の画面に対する奥行きを変化させる第２処理手段と、
補助表示物再生用ストリームと、前記補助表示物が１プレーン及び２プレーンのいずれで表されているかを示す識別情報を含むデータブロックとを受信する受信手段と、
前記補助表示物再生用ストリームの内容が参照されることに先行して、データブロック内の識別情報を抽出し、当該識別情報に応じて第１の処理手段及び第２の処理手段のいずれかを選択する選択手段と、
前記選択手段による前記選択の後に、前記補助表示物再生用ストリームの内容である補助表示物を表す情報を、第１の処理手段及び第２の処理手段のうち当該選択手段により選択された処理手段に対して、逐次供給して右目用補助表示物及び左目用補助表示物の作成及び出力を行わせる制御手段とを備えることを特徴とする集積回路。