以下、本発明の好適な実施の形態が詳細に後述され、これらの実施の形態は、添付図面に示してある。できる限り、同じ参照符号は同一又は類似する部分を言及するために図面の全体に亘って使用される。
本発明の詳細な説明において、メインデータと、制作者により光ディスク内に記録されたタイトル(例えば、映画タイトル)を含むオーディオ/ビデオデータを表す。通常、AVデータは、MPEG2フォーマットで記録され、AVストリームあるいはメインAVストリームと称される。さらに、補助データは、メインデータを再生するのに必要な他の全てのデータ、例えば、テキスト・サブタイトル・ストリーム、インタラクティブ・グラフィック・ストリーム、プレゼンテーション・グラフィック・ストリーム、補助オーディオ・ストリーム(例えば、ブラウザブル・スライドショーのためのもの)等を表す。補助データ・ストリームは、MPEG2フォーマット又は他のデータ・フォーマットで記録することができる。補助データは、メインAVストリームと多重化されて記録されるか、あるいは、光ディスク内に独立したデータファイルとして存在し得る。
サブタイトルは、再生されるビデオ(イメージ)に対応する字幕情報を表し、これは、所定の言語により表現される。例えば、ユーザがディスプレイ画面上のイメージを視聴しながら、各種の言語で表される複数のサブタイトルのうち1つを視聴するためのオプションを選択すると、選択されたサブタイトルに該当する字幕情報がディスプレイ画面内の所定の部分に表示される。表示された字幕情報がテキストデータ(例えば、文字)である場合、選択されたサブタイトルは、テキスト・サブタイトルと称される。本発明の一態様によれば、MPEG2フォーマットの複数のテキスト・サブタイトル・ストリームは、光ディスクに記録可能であり、独立した複数のストリーム・ファイルとして存在することができる。各テキスト・サブタイトル・ストリーム・ファイルは、テキスト・サブタイトルのテキストデータと、テキストデータを再生するのに必要な再生制御データを含む。本発明の他の態様によると、MPEG2フォーマットの単一のテキスト・サブタイトル・ストリームのみを光ディスクに記録することもできる。
図1は、ブルーレイディスク(BD)等の光ディスクに記録されたデータファイルの構造を示す。図1によれば、1つのルートディレクトリ(root)に少なくとも1つのBDディレクトリ(BDMV)が含まれる。各BDディレクトリは、1又は複数のユーザとのインタラクティブのために用いられる、インデックス・ファイル(index.bdmv)とオブジェクトファイル(MovieObject.bdmv)を含む。例えば、インデックス・ファイルは、インデックス・テーブルを表すデータを含み、インデックス・テーブルは、複数の選択可能なメニューとムービータイトルを有する。各BDディレクトリは、再生するオーディオ/ビデオ(AV)データ及びAVデータの再生に必要な各種のデータを含む4つのファイル・ディレクトリをさらに含む。
各BDディレクトリに含まれるファイル・ディレクトリとしては、ストリーム・ディレクトリ(STREAM)、クリップ・インフォメーション・ディレクトリ(CLIPINF)、プレイリスト・ディレクトリ(PLAYLIST)、補助データ・ディレクトリ(AUX DATA)がある。先ず、ストリーム・ディレクトリ(STREAM)は、特定のデータ・フォーマットを有するオーディオ/ビデオ(AV)ストリーム・ファイルを含む。例えば、AVストリーム・ファイルは、MPEG2トランスポート・パケットの形式であって、図1に示すように「*.m2ts」と呼ぶ。ストリーム・ディレクトリは、1又は複数のテキスト・サブタイトル・ストリーム・ファイルをさらに含む。各テキスト・サブタイトル・ストリーム・ファイルは、特定の言語により表現されたテキスト・サブタイトルのテキスト(例えば、文字)データと、テキストデータの再生制御情報を含む。テキスト・サブタイトル・ストリーム・ファイルは、ストリーム・ディレクトリ内に独立したストリーム・ファイルとして存在し、図1に示すように、「*.m2ts」あるいは「*.txtst」と呼ぶ。ストリーム・ディレクトリに含まれるAVストリーム・ファイル又はテキスト・サブタイトル・ストリーム・ファイルは、クリップ・ストリーム・ファイルとも呼ぶ。
次いで、クリップ・インフォメーション・ディレクトリ(CLIPINF)は、ストリーム・ディレクトリに含まれるストリーム・ファイル(AV又はテキスト・サブタイトル)に対応するクリップ情報を含む。各クリップ・インフォメーション・ファイルは、対応するストリーム・ファイルのプロパティ情報及び再生タイミング情報を含む。例えば、クリップ・インフォメーション・ファイルは、マッピング情報を含み、マッピング情報においては、エントリポイントマップ(EPM)によって、プレゼンテーション・タイム・スタンプ(PTS)とソースパケットナンバー(SPN)とが一対一で対応づけられる。マッピング情報を用いて、後述するプレイアイテムあるいはサブプレイ・アイテムにより提供されるタイミング情報(In−Time、Out−Time)から、ストリーム・ファイルの特定の位置が決定される。規格においては、ストリーム・ファイルとそれに対応するクリップ情報ファイルの各ペアは、クリップとして指定される。例えば、CLIPINF内の01000.clpiは、STREAM内のファイルに含まれる01000.m2tsに関するプロパティ情報及び再生タイミング情報を含み、01000.clpiと01000.m2tsは、1つのクリップを構成する。
再び図1を参照すると、プレイリスト・ディレクトリ(PLAYLIST)は、1又は複数のプレイリスト・ファイル(*.mpls)を含み、各プレイリスト・ファイルは、少なくとも1つのメインAVクリップとメインAVクリップの再生時間を指定する少なくとも1つのプレイアイテムを含む。さらに詳しくは、プレイアイテムは、In−TimeとOut−Timeを指定する情報を含む。In−TimeとOut−Timeは、プレイアイテム内のClip_Information_File_nameによって指定されるメインAVクリップの再生開始時間と再生終了時間を表す。このため、プレイリスト・ファイルは、1又は複数のメインAVクリップの基本的な再生制御情報を表す。さらに、プレイリスト・ファイは、サブプレイ・アイテムをさらに含み、サブプレイ・アイテムは、テキスト・サブタイトル・ストリーム・ファイルの基本的な再生制御情報を含む。サブプレイ・アイテムが1又は複数のテキスト・サブタイトル・ストリーム・ファイルを再生するために、プレイリスト・ファイルに含まれる場合、サブプレイ・アイテムは、プレイアイテムと同期する。これに対し、サブプレイ・アイテムがブラウザブル・スライドショーを再生するために使用される場合、サブプレイ・アイテムはプレイアイテムと同期しない。本発明によると、サブプレイ・アイテムの主な機能は、1又は複数のテキスト・サブタイトル・ストリーム・ファイルの再生を制御することである。
最後に、補助データ・ディレクトリ(AUX DATA)は、補助データストリーム・ファイルを含む。補助データストリーム・ファイルとしては、例えば、フォントファイル(例えば、*.font又は*.otf)、ポップアップ・メニュー・ファイル(図示せず)、クリックサウンドを生成するためのサウンドファイル(例えば、sound.bdmv)が挙げられる。上述したテキスト・サブタイトル・ストリーム・ファイルは、ストリーム・ディレクトリではなく、補助データ・ディレクトリに含まれることもある。
図2は、本発明による光ディスク内のデータ格納領域を示す。図2を参照すると、光ディスクは、ディスクボリュームの最内周を占めるファイルシステム情報領域と、ディスクボリュームの最外周を占めるストリーム領域と、ファイルシステム情報領域とストリーム領域との間を占めるデータベース領域を含む。ファイルシステム情報領域内には、図1に示すように、全データファイルを管理するためのシステム情報が格納される。AVストリーム及び1又は複数のテキスト・サブタイトル・ストリームは、ストリーム領域内に格納される。図1に示すように、ジェネラル・ファイル、プレイリスト・ファイル及びクリップ・インフォメーション・ファイルは、ディスクボリューム内のデータベース領域内に格納される。上述したように、ジェネラル・ファイルは、インデックス・ファイル及びオブジェクトファイルを含み、プレイリスト・ファイル及びクリップ・インフォメーション・ファイルは、ストリーム領域内に格納されたAVストリーム及びテキスト・サブタイトル・ストリームを再生するために必要な情報を含む。データベース領域及び/又はストリーム領域内に格納された情報を使用して、ユーザは、特定の再生モードを選択し、選択された再生モードでメインAV及びテキスト・サブタイトル・ストリームを再生することができる。
図3は、テキスト・サブタイトル・ストリームとメインAVストリームが再生されるときに、ディスプレイ画面に提示されるテキスト・サブタイトル及びメインイメージを示す。メインイメージとテキスト・サブタイトルは、メインAVストリームと、対応するテキスト・サブタイトル・ストリームが同期して再生されるときに、ディスプレイ画面内に同時に表示される。
図4は、プレイリストを用いた、メインAVクリップとテキスト・サブタイトル・クリップのプレイリストの再生制御を示す概略図である。図4によれば、プレイリスト・ファイルは、少なくとも1つのAVクリップの再生を制御するための少なくとも1つのプレイアイテムと、複数のテキスト・サブタイトル・クリップの再生を制御するサブプレイ・アイテムとを含む。図4に示すように、英語テキスト・サブタイトル用のテキスト・サブタイトル・クリップ1と韓国語テキスト・サブタイトル用のテキスト・サブタイトル・クリップ2は、メインAVクリップと同期する。これによって、メインイメージと、対応するテキスト・サブタイトルは、特定のプレゼンテーション・タイムにディスプレイ画面上に同時に表示される。ディスプレイ画面上にテキスト・サブタイトルを表示するためには、図5A〜図5Cに示すように、ディスプレイ制御情報(例えば、位置及びサイズ情報)とプレゼンテーション時間情報が必要である。
図5Aは、本発明による、ディスプレイ画面上に提示されるダイアログを示す。ダイアログは、所要のプレゼンテーション・タイムにディスプレイ画面上に表示される全テキスト・サブタイトル・データを表す。通常、ダイアログのプレゼンテーション・タイムは、プレゼンテーション・タイム・スタンプPTSで表わされる。例えば、図5Aに示すように、ダイアログのプレゼンテーションは、PTS(k)で始まってPTS(k+1)で終わる。このため、図5Aに示すダイアログは、PTS(k)とPTS(k+1)との間にディスプレイ画面上に表示される全てのテキスト・サブタイトル・データを表す。ダイアログは、少なくとも1つのサブタイトル・テキスト(文字)ラインを含む。1つのダイアログ内に2つ以上のサブタイトル・テキスト・ラインが存在する場合、全体のテキストデータは、ダイアログのために定義されているスタイルにしたがって表示される。1つのダイアログに含まれる最大の文字数は、約100個に制限される。
さらに、図5Bは、本発明による、ダイアログ領域を示す。領域は、所与のプレゼンテーション・タイム内にディスプレイ画面上に表示されるテキスト・サブタイトル・データ(ダイアログ)が分割されたものの一部を表す。すなわち、1つのダイアログは、少なくとも1つの領域を含み、各領域は、少なくとも1つのサブタイトル・テキスト・ラインを含む。領域を表す全体のテキスト・サブタイトル・データは、領域に割り当てられた領域スタイル(グローバル・スタイル)にしたがってディスプレイ画面に表示される。1つのダイアログに含まれる最大の領域数は、サブタイトル・データの所望のデコーディング・レートに基づいて決められる必要がある。その理由は、領域数が大きいと低いデコーディング・レートをもたらすからである。例えば、好ましい高効率のデコーディング・レートを達成するためには、1つのダイアログに対する領域の最大数を2に制限する必要がある。しかしながら、他の目的の場合には、領域の最大数は、2より大きくなっても良い。
図5Cは、本発明による、ダイアログ領域のためのスタイル情報を示す。スタイル情報は、ダイアログに含まれる少なくとも一部の領域を表示するために必要なプロパティを定義した情報を表す。スタイル情報の例として、位置、領域サイズ、背景色、テキスト配列、テキストフロー情報及びその他の各種の情報が挙げられる。スタイル情報は、領域スタイル情報(グローバル・スタイル情報)とインライン・スタイル情報(ローカル・スタイル情報)に分類できる。
領域スタイル情報は、1つのダイアログの全体領域に適用される領域スタイル(グローバル・スタイル)を定義する。例えば、領域スタイル情報は、領域位置、領域サイズ、フォントカラー、背景色、テキストフロー、テキスト配列、ラインスペース、フォント名、フォントスタイル、フォントサイズのうち少なくとも1つを含む。図5Cに示すように、例えば、2つの異なる領域スタイルは、領域1及び領域2に適用される。位置1、サイズ1及び青い背景色を有する領域スタイルが領域1に適用され、位置2、サイズ2及び赤い背景色の別の領域スタイルが領域2に適用される。
これに対し、インライン・スタイル情報は、1つの領域に含まれるテキスト・ストリングの特定の一部に適用されるインライン・スタイル(ローカル・スタイル)を定義する。例えば、インライン・スタイル情報は、フォントタイプ、フォントスタイル及びフォントカラーのうち少なくとも1つを含む。
テキスト・ストリングの特定の一部は、1つの領域内又はテキスト・ラインの特定の一部内の全テキスト・ラインになる。図5Cによれば、特定のインライン・スタイルは、領域1に含まれるテキスト部「mountain」に適用される。すなわち、テキスト・ストリングの特定の部分のフォントタイプ、フォントスタイル及びフォントカラーのうち少なくとも1つは、領域1内のテキスト・ストリングの残りの部分とは異なる。
図6Aは、プレゼンテーション・タイム・スタンプ(PTS)区間中のディスプレイ画面上のテキスト・サブタイトル・ダイアログのプレゼンテーションを示す。PTS1〜PTS6の間には4つのダイアログが表示される。さらに詳しくは、領域#1は1つの領域だけを有し、テキスト#1は、PTS1〜PTS2の間に、この領域内に表示される。次いで、ダイアログ#2は、領域1と領域2を有し、テキスト#1とテキスト#2は、領域1と領域2内に表示される。そして、ダイアログ#3は、1つの領域だけを有し、テキスト#2は、PTS3〜PTS4の間に、この領域内に表示される。PTS4〜PTSの間には、提示されるダイアログが存在しない。テキスト#3は、PTS5〜PTS6の間に、ダイアログ#4の領域内に表示される。ダイアログを定義する情報は、ダイアログ・プレゼンテーション・タイム情報とダイアログ・テキストデータを含む。ダイアログ・テキストデータは、スタイル情報と、ダイアログの各領域内に表示されるテキスト・ストリングを含む。プレゼンテーション・タイム情報の例としては、PTS開始及びPTS終了のセットが挙げられる。スタイル情報は、上述した領域(グローバル)スタイル情報及びインライン(ローカル)スタイル情報を含む。図6Aに示すように、ダイアログには、異なるスタイル情報セットが適用される。
図6Bは、PTS区間中にディスプレイ画面上に提示されるテキスト・サブタイトル・ダイアログ間の連続性を示す。図6Bによれば、ダイアログ#1のプレゼンテーション終了時間は、ダイアログ#2のプレゼンテーション開始時間と同じである。このため、ダイアログ#1とダイアログ#2との間には連続性が存在する。ダイアログ#1領域内のテキスト#1の表示は、ダイアログ#2の領域1内のテキスト#1の表示に連続する。すなわち、2つのダイアログのPTS区間は連続し、2つの領域内のテキスト#1をプレゼンテーションする時に同じスタイル情報(領域及びインライン)が用いられる。同様に、ダイアログ#2とダイアログ#3との間に他の連続性が存在する。その理由は、ダイアログ#2の領域2内のテキスト#2の表示がダイアログ#3の領域内のテキスト#2の表示に連続するからである。同じサブタイトル・テキストを表示する2つの連続的なダイアログ間の連続性を保証するため、ダイアログのプレゼンテーション・タイム(PTS区間)が連続する必要がある。併せて、領域内の同じテキストを提示するときには同じ領域スタイル情報及びインライン・スタイル情報を使用する必要がある。再び図6Bを参照すると、ダイアログ#3とダイアログ#4との間には連続性が存在しない。その理由は、PTS区間が連続的ではないからである。
ダイアログが前のダイアログと連続するか否かを示すインジケータ(例えば、continuous_presentation_flag)を現在のダイアログのプレゼンテーション情報に含めることができる。
図7Aは、本発明による、テキスト・サブタイトル・ストリーム・ファイル(例えば、図1の10001.m2ts)を示す。テキスト・サブタイトル・ストリーム・ファイルは、複数のトランスポート・パケット(TP)を含むMPEG2トランスポート・ストリームを形成し、全てのトランスポート・パケットは、同じパケット識別子(例えばPID=0x18xx)を有する。ディスクプレーヤが特定のテキスト・サブタイトル・ストリームを含む多くの入力ストリームを入力すると、PIDを使用してテキスト・サブタイトル・ストリームに含まれている全てのトランスポート・パケットを見つける。図7Aによれば、トランスポート・パケットの各サブセットは、パケット・エレメンタリ・ストリーム(PES)パケットを形成する。図7Aに示すように、PESパケットのうち1つは、領域スタイルのグループを定義するダイアログ・スタイル・ユニット(DSU)に対応する。DSUは、ダイアログ・スタイル・セグメント(DSS)とも呼ばれる。残りの全てのPESパケットは、ダイアログ・プレゼンテーション・ユニット(DPUs)に対応し、各DPUは、少なくとも1つの領域を有する1つのダイアログのプレゼンテーション情報と、領域スタイル・インジケータ、インライン・スタイル情報及び各領域についてのテキスト・ストリングを有するダイアログのためのプレゼンテーション情報を含む。同様に、DPUは、ダイアログ・プレゼンテーション・セグメント(DPS)とも呼ばれる。
図7Bは、本発明による、テキスト・サブタイトル・ストリームに含まれるDPUとDSU内に含まれる特定の情報を示す。DSUは、領域スタイルグループを定義する情報セットを含み、各領域スタイルグループは、対応するダイアログ領域に適用される。さらに、DPUは、ダイアログ・テキストデータと、ダイアログのためのダイアログ・プレゼンテーション情報を含む。ダイアログ・テキストデータは、ダイアログの各領域に含まれるテキスト・ストリングと、テキスト・ストリングの特定の部分に適用されるインライン・スタイル情報と、各ダイアログ領域に適用される領域スタイルを指示する領域スタイル識別子を含む。領域スタイル識別子は、DSU内に定義された領域スタイルグループのうち1つを識別する。これに対し、ダイアログ・プレゼンテーション情報は、ダイアログのための、プレゼンテーション時間情報とパレット(カラー)更新情報を含む。プレゼンテーション・タイム情報は、ディスプレイ画面上にダイアログを提示するためのプレゼンテーション開始時間(例えば、PTS_start)とプレゼンテーション終了時間(例えば、PTS_end)を含む。パレット更新情報は、表示色を更新するときに適用されるダイアログの表示色とパレット情報(例えば、Palette for update)を更新するかどうかを指示するインジケータ(例えば、Palette _update_flag」を含む。
テキスト・サブタイトル・ストリーム内に含まれる全てのデータは、それぞれの基本的な機能に基づいて3種類のデータに分類される。例えば、図7Bに示すように、データは、ダイアログ・テキストデータ、コンポジション情報及びレンダリング情報に分類される。ダイアログ・テキストデータは、ダイアログの各領域に対して、テキスト・ストリング、インライン・スタイル情報及び領域スタイル識別子を含む。コンポジション情報は、例えば、プレゼンテーション開始時間及びプレゼンテーション終了時間を示すプレゼンテーション時間情報、ダイアログ領域の位置情報、及びダイアログのパレット更新情報を含む。最後に、レンダリング情報は、プレゼンテーションのためにテキスト・ストリングをグラフィックデータとしてレンダリングするために必要な情報を含む。
図7Bによれば、DSU内に含まれている各領域の水平位置及び垂直位置は、コンポジション情報の一部である。DSU内に含まれている領域幅、領域の高さ、フォントカラー、背景色、テキストフロー、テキスト配列、ラインスペース、フォント名、フォントスタイル、フォントサイズは、レンダリング情報を表す。
DSUは、制作者により定義された、限られた数の領域スタイルを定義する領域スタイル・セット情報(ダイアログ・スタイル・セット)のセットを含む。例えば、DSUに定義された領域スタイルの最大数は、60個に制限され、領域スタイルは、領域スタイル識別情報(region_style_id)により識別される。このため、制作者は、光ディスクに限られた数の領域スタイルだけを定義するDSUを格納する。領域スタイルは、光ディスクに記録されたテキスト・サブタイトル・ストリームを再生するときにディスクプレーヤによって使用される。又は、ディスクプレーヤは、他のソースから提供されるスタイル情報の別のセットによって定義された他の領域スタイルを使用することができる。ソースの例としては、ディスクプレーヤに含まれるローカルデータ・ストレージが挙げられる。結果的に、光ディスク内に記録されたテキスト・サブタイトル・ストリームから再生されたサブタイトル領域は、各種の領域スタイルを有することが可能である。
図8は、本発明の一例による、テキスト・サブタイトル・ストリーム(Text_subtitle_stream())のシンタックスを示す。上述したように、テキスト・サブタイトル・ストリーム・シンタックスは、領域スタイルのセットを定義する情報セットを含むダイアログ・スタイル・ユニット(dialog_style_unit())のシンタックスと、複数のプレゼンテーション・ユニット(dialog_presentation_unit())のシンタックスを含み、各DPUシンタックスは、ダイアログ・プレゼンテーション情報と、少なくとも1つのダイアログ・テキスト領域を含む。各ダイアログ・テキスト領域は、領域スタイル識別子、1又は複数のテキスト・ストリング、インライン・スタイル情報を含み、領域スタイル識別子は、DSUシンタックス内に定義された領域スタイル・セットのうち1つを識別する。
図9Aは、図8に示すようなテキスト・サブタイトル・ストリーム内に含まれたダイアログ・スタイル・ユニット(dialog_style_unit()」のシンタックスを示す。ダイアログ・スタイル・ユニット・シンタックスは、ダイアログ・スタイル・セット(dialog_style set())のシンタックスを含み、そこでは、制作者により定義された領域スタイル・セットが定義される。図9Bは、図9Aに示されるダイアログ・スタイル・ユニット内に含まれるダイアログ・スタイル・セット(dialog_style_style set())のシンタックスを示す。ダイアログ・スタイル・セット・シンタックスは、領域スタイル(region_style())のセットを定義する領域スタイル情報のセットを含み、データフィールド又は、region_style()に定義された制作者による定義されたスタイル・セットの他にテキスト・サブタイトルのための独自のスタイル・セット(プレーヤスタイル)を生成することをプレーヤに許可するか否かを示すフラグ(player_style_flag」を含む。ダイアログ・スタイル・セットシンタックスは、ユーザ制御スタイルのセットを定義するユーザ変更可能なスタイル・セット(user_changeable_styleset()」のシンタックスをさらに含む。
図9Bによれば、領域スタイル識別情報(region_style_id)は、領域スタイル(region_style()」のセットに割り当てられ、各領域スタイル情報は、ダイアログ・テキスト領域の全体に適用されるグローバル・スタイル情報を表す。各領域に対するDPU内に含まれた領域スタイル識別子は、領域スタイル識別情報のうちの1つを含む。このため、各DPU内に含まれた少なくとも1つのダイアログ・テキスト領域を再生するとき、領域スタイル識別子に対応する領域スタイルが適用される。
以下、各領域スタイル(region_style())に定義された特定の領域再生プロパティを詳述する。領域水平位置(region_horizontal_position」は、グラフィックプレーン内において領域の左上ピクセルの水平アドレスを指定し、領域垂直位置(region_vertical_position」は、グラフィックプレーン内の領域の左上ピクセルの垂直アドレスを指定する。さらに、領域幅(region_width)は、領域水平位置から四角形の領域の水平長を指定し、領域高さ(region_height)は、領域垂直位置から四角形の領域の垂直長を指定する。領域背景色インデックス(region_bg_color_index)は、領域の背景色を指示するインデックス値を指定する。
さらに、テキスト水平位置(text_horizontal_position)は、領域内のテキストの始点の水平アドレスを指定し、テキスト垂直位置(text_vertical_position)は、領域内のテキストの始点の垂直アドレスを指定する。テキスト・フロー(text_flow)は、領域内においてラインの進行(左→右、あるいは、右→左)及びラインの進行(上→下、あるいは、下→上)を指定する。テキスト配列(text_alignment)は、領域内のレンダリングされたテキストの配列(左側、中央、右側)を指定する。ダイアログが複数の領域を有する場合、視聴者の混乱を防ぐため、全ての領域内には、同じテキストフローが適用される。再び図9Bを参照すると、ラインスペース(line_space)は、領域内の隣り合う2つのライン間の距離を指定する。フォント識別情報(font_id)は、クリップ・インフォメーション・ファイルで指定されるフォント識別情報を指定する。フォントスタイル(font_style)は、領域内のテキストのフォントスタイル、例えば、普通体、太字体、斜体及び太字体−斜体などを指定する。フォントサイズ(font_size)は、領域内のテキストのフォントサイズ、例えば、ピクセル単位での文字の垂直サイズを指定する。最後に、フォントカラー・インデックス(font_color_index)は、領域内のテキストカラーを指定するインデックス値を指定する。
図9Bに示すプレーヤ・スタイル・フラグ(player_style_flag)は、制作者がディスクプレーヤにスタイル(プレーヤスタイル)の独自のセットの生成及び/又は使用を許容するか否かを示す。スタイルの独自のセット、テキスト・サブタイトルのために光ディスクに定義された、制作者により定義された領域スタイルに追加してディスクプレーヤのローカルデータ・ストレージ内に既に格納されている。例えば、プレーヤ・スタイル・フラグ値が1bに設定される場合、制作者は、プレーヤ・スタイルの独自のセットを生成及び/又は使用することを許可する。これに対し、プレーヤ・スタイル・フラグに0bが設定される場合、制作者は、プレーヤがスタイル・セットの生成及び/利用することを禁止する。
図9Cは、図9Bに示されるダイアログ・スタイル・セットに含まれたユーザ変更可能なスタイル・セット(user_changeable_styleset())のシンタックスを示す。user_changeable_styleset()は、ユーザ制御スタイル・セット(user_control_style())を定義するユーザ制御スタイル情報のセットを含む。各ユーザ制御スタイルは、対応する領域スタイルにより指定された領域プレゼンテーション・プロパティのうち少なくとも1つを変更するように構成される。ユーザ制御スタイルのセットのうち1つを選択することにより、ユーザは、各領域の領域スタイルを簡単な方式により変更することができる。しかしながら、領域スタイルにより指定された全てのプロパティがユーザにより変更可能な場合、ユーザによるダイアログの表示制御が極めて困難になる。したがって、ユーザ制御スタイルによって変更可能な領域プレゼンテーション・プロパティは、領域水平位置、領域垂直位置、フォントサイズ、テキスト水平位置、テキスト垂直位置及びラインスペースのうち少なくとも1つに制限される。
図9B及び図9Cによれば、ユーザ制御スタイルのセットは、領域スタイルIDを有する各領域スタイルに対して定義され、ユーザスタイルIDs(user_style_id)は、ユーザ制御スタイルのセットに割り当てられる。各領域スタイルに対して定義されるユーザ制御スタイルの最大数を25に制限することができる。ダイアログ・スタイルのセットに定義された領域スタイル・セットの最大数が60であるため、1つのDPUに対して定義されるユーザにより変更可能なスタイルの総数は、1500個以下になる。
図9Cによれば、領域の水平位置を変更するために、ユーザ制御スタイルは、領域水平位置の水平移動の方向を指定する(region_horizontal_position_direction)と、ピクセル単位で水平移動量を指定する(region_horizontal_position_delta)を含む。例えば、水平位置方向が0に設定されている場合には水平移動は右方向となり、水平位置方向が1に設定されている場合、水平移動は左方向となる。領域垂直位置を変更するため、ユーザ制御スタイルは、領域水平位置の垂直移動の方向を指定する(region_vertical_position_direction)と、ピクセル単位で垂直移動量を指定する垂直位置デルタ(region_vertical_position_delta)を含む。例えば、垂直位置方向に0が設定されている場合、垂直移動は下方へ、「1」が設定されている場合、垂直移動は上方へ行われる。さらに、領域スタイルIDを有する領域スタイルにより定義されるフォントサイズを変更するため、ユーザ制御スタイルは、フォントサイズの変更方向を指定するフォントサイズ変更方向(font_size_inc_dec)と、ピクセル単位でフォントサイズの変更量を指定するフォントサイズデルタ(font_size_delta)を含む。例えば、font_size_inc_decが0に設定されている場合、フォントサイズは増加し、1に設定されている場合、フォントサイズは減少する。
本発明による、ユーザ変更可能スタイルのセットの特徴は、下記のとおりである。第一に、ユーザ制御スタイルのセットは、ダイアログ・スタイル・ユニットに定義された各領域スタイルのセットに対して定義され、制御スタイルのセットの数は固定である。このため、2つの異なる領域スタイルに対して定義されたユーザ制御スタイルの数は、同じである。各ダイアログ・テキスト領域を再生するときに用いられるユーザ制御スタイルのセットの数は固定である。第二に、ユーザ制御スタイルのセットは、異なるユーザスタイルIDにより識別される。第三に、領域プレゼンテーション・プロパティの全ての変更は、単一のユーザ制御スタイルとともに定義される。例えば、領域水平位置とフォントサイズは、2つの異なるユーザ制御スタイルによって別個に変更されない。それぞれは、シングルユーザ制御スタイルとともに変更される。第四に、特定のプロパティの変更は、実際のプロパティ値として表すのではなく、その移動方向あるいは変更量で表す。実際のプロパティ値は、変更量(デルタ)と変更方向を、領域スタイルに定義された元のプロパティ値に適用することによって得られる。
結論的には、制作者は、光ディスク内にメインAVストリームを記録するとき、少なくとも1つのテキスト・サブタイトル・ストリームもまた記録する。各テキスト・サブタイトル・ストリームは、ダイアログ・スタイル・セットを定義するDSUと複数のDPUを含む。領域スタイルのセットは、異なる領域スタイルIDを有する。DSUは、各領域スタイルに対してユーザ制御スタイルのセットをさらに定義する。ユーザ制御スタイルは、異なるユーザスタイルIDを有する。各ユーザ制御スタイルは、対応する領域スタイルによって指定される制作者により定義された領域プレゼンテーション・プロパティのうち少なくとも1つを変更するように構成される。しかも、ダイアログ・スタイル・セットは、プレーヤ・スタイル・フラグを含み、プレーヤ・スタイル・フラグは、制作者により定義されたスタイルのセットに加えて、制作者がテキスト・サブタイトルのプレーヤ・スタイルの独自のセットを生成及び/又はプレーヤに許可したかどうかを示す。
以下、図10を参照し、本発明による、メインAVストリーム及びテキスト・サブタイトル・ストリームをデコードする装置について説明する。本装置は、パケット識別子に基づいて、入力ストリームをビデオ・ストリーム、オーディオ・ストリーム、グラフィック・ストリーム、テキスト・サブタイトル・ストリームに分離するパケット識別子(PID)フィルター5と、ビデオ・ストリームをデコードするビデオ・デコード手段20と、オーディオ・ストリームをデコードするオーディオ・デコード手段10と、グラフィック・ストリームをデコードするグラフィック・デコード手段30と、テキスト・サブタイトル・ストリームをデコードするテキスト・サブタイトル・デコード手段40を含む。
テキスト・サブタイトル・ストリームは、図10に示すように、光ディスクから又は別の外部の入力ソースから抽出される。このため、本装置は、入力データソースを選択するスイッチ6をさらに含む。このため、テキスト・サブタイトル・ストリームが光ディスクから抽出する場合、スイッチ6は、PIDフィルター5に接続されたデータ信号Aを選択する。これに対し、テキスト・サブタイトルが外部入力ソースから入力された場合は、スイッチ6は、外部入力ソースに接続されたデータ信号Bを選択する。
再び図10を参照すると、オーディオ・デコード手段10、ビデオ・デコード手段20、グラフィック・デコード手段30は、デコードするストリームデータを格納するためのトランスポートバッファ11、21、31を含む。デコードされた信号をビデオ及びグラフィックイメージに変換するビデオプレーン(VP)23とグラフィックプレーン33は、ビデオ・デコード手段20及びグラフィック・デコード手段30に各々含まれる。グラフィック・デコード手段30は、表示可能なグラフィックイメージの色と透明度を制御するためのカラー・ルックアップ・テーブル(CLUT)34を含む。
テキスト・サブタイトル・デコード手段40は、1つの言語をサポートするテキスト・サブタイトル・ストリームを選択手段6から入力すると、テキスト・サブタイトルの全体をサブタイトル・プレローディング・バッファ(SPB)41に一度にプレロードすることができる。また、複数の言語をサポートする複数のテキスト・サブタイトル・ストリームが存在する場合、全てのテキスト・サブタイトル・ストリームをSPB41に一度にプレロードすることができる。このため、SPB41のサイズは、スイッチ6から入力するテキスト・サブタイトル・ストリーム・ファイルの総数に基づいて決定する必要がある。例えば、SPB41のサイズは、0.5Mバイトのテキスト・サブタイトル・ストリーム・ファイルをプレロードするために0.5Mバイト以上である必要がある。さらに、ユーザが2つの0.5Mバイトのテキスト・サブタイトル・ストリーム・ファイルの中から選択する場合にテキスト・サブタイトルのシームレス・プレゼンテーションを保証するために、SPB41のサイズは、1Mバイト以上でなければならない。SPB41のサイズは、必要な全てのテキスト・サブタイトル・ストリームを一度にプレロードするのに十分なサイズである必要がある。
テキスト・サブタイトル・デコード手段40は、図1に示す補助データ・ディレクトリに含まれる関連する全てのフォントファイルを格納するためのフォント・プレローディング・バッファ(FPB)410をさらに含む。同様に、FPB410のサイズは、1又は複数の言語をサポートするテキスト・サブタイトルのシームレス・プレゼンテーションをサポートするために、必要とする全てのフォントファイルを一度にプレロードするのに十分なサイズである必要がある。全ての有効なテキスト・サブタイトル・ストリーム・ファイルと、関連するフォントファイルがプレロードされるために、プレロードされたデータの抽出及び使用は容易に実現される。さらに、これらの理由から、SPB41とFPB410の制御も簡単になる。テキスト・サブタイトル・デコード手段40は、SPB41に格納された各テキスト・サブタイトルをデコードするテキスト・サブタイトル・デコーダ42と、デコードされたサブタイトル・データを表示可能なサブタイトル・イメージとして合成するグラフィックプレーン43と、変換されたサブタイトル・イメージのカラー及び透明度のうち少なくとも1つを制御するカラー・ルックアップ・テーブル(CLUT)44をさらに含む。
テキスト・サブタイトル・デコード手段40は、SPB41にプレロードされたテキスト・サブタイトル・ストリームを再生するときに選択的に用いられるプレーヤ・スタイルのセットを定義するプレーヤ・スタイル・セットを格納するローカルデータ・ストレージ45をさらに含む。さらに、ローカルデータ・ストレージ45は、テキスト・サブタイトル・ストリームを再生するときに選択的に用いられるユーザ制御スタイルのセットを指定するユーザ変更可能なセットをさらに格納する。ユーザ変更可能なセットは、図9Cに示すように、DSU内に含まれているユーザ変更可能なセットと同様である。
本発明の第一の態様によれば、各プレーヤ・スタイルは、ダイアログ・テキスト領域の領域プレゼンテーション・プロパティの完全なセットを指定する領域スタイルを表す。例えば、プレーヤ・スタイルは、領域の水平位置、領域の垂直位置、領域幅、領域の高さ、領域の背景色インデックス、テキストの水平位置、テキストの垂直位置、テキストフロー、テキスト配列、ラインスペース、フォント識別情報、フォントスタイル、フォントサイズ、フォントカラー・インデックスである。この場合、ローカルデータ・ストレージ45に格納されているプレーヤ・スタイル・セットは、DSUに定義された領域スタイル・セットとは独立して用いられる。
本発明の第2の態様によれば、各プレーヤ・スタイルは、DSU内に定義された領域スタイルにより最初に定義された領域プレゼンテーション・プロパティのうち少なくとも1つを再定義するように構成される。DSU内に定義されている領域スタイルがフォント識別情報を含む領域プレゼンテーション・プロパティの完全なセットを定義し、プレーヤ・スタイルがフォント識別情報を再定義する場合、再定義されたフォント識別情報と、領域スタイルにより指定された他の全てのプロパティは組み合せて用いられる。
本発明の第3の態様によれば、各プレーヤ・スタイルは、DSUに定義された領域スタイルにより最初に定義された領域再生プロパティのうち少なくとも1つを変更するように構成される。例えば、プレーヤ・スタイルは、領域スタイルに定義された領域の水平位置の変更方向及び変更量を指定することができる。この場合、プレーヤ・スタイル・セットは、図9Cに示すようなユーザ変更可能なセットと同様である。
図11は、本発明の一例による、光ディスク内に記録されたテキスト・サブタイトル・ストリームをデコードする方法を示す。テキスト・サブタイトル・デコーダ42がSPB41内にプレロードされたテキスト・サブタイトル・ストリームの再生を始めると、テキスト・サブタイトル・デコーダ42は、初めに、DSUに含まれたplayer_style_flagを読みとり、ローカルデータ・ストレージ45に格納されたプレーヤ・スタイル・セットの使用が許可されているかどうかを判定する(S110)。例えば、player_style_flagに0bが設定されていれば、プレーヤ・スタイル・セットの使用は許可されない。この場合、テキスト・サブタイトル・デコーダ42は、光ディスクに記録された制作者により定義された領域スタイルを使用しなければならない。これに対し、player_style_flagに1bが設定されていれば、テキスト・サブタイトル・デコーダ42は、ローカルデータ・ストレージ45に格納されたプレーヤ・スタイル・セットの使用が許可される。次いで、テキスト・サブタイトル・デコーダ42は、プレーヤ・スタイル・セットに定義されたプレーヤ・スタイルのセットのうち何れか1つを使用するか否かを独立して判定する(S112)。例えば、テキスト・サブタイトル・デコーダ42は、プレーヤ・スタイルのセットと、テキスト・サブタイトル・ストリームに定義された領域スタイルとを比較し、その比較結果を用いてステップS112の判定を行う。ステップS112において、プレーヤ・スタイルのセットを用いないと判定すると、光ディスク内に記録された領域スタイルを用いる(S111)。これに対し、ステップS112において、プレーヤ・スタイルのセットを用いると判定すると、テキスト・サブタイトル・デコーダ42は、プレーヤ・スタイル・セットを独立して用いるか、あるいは、ディスクに記録された領域スタイルのセットと組み合せて用いるかを判定する(S113)。
さらに、テキスト・サブタイトル・デコーダは、DPUをデコードするとき、DPUに含まれた領域スタイル識別子により識別された領域スタイルを用いる。ユーザがこの領域スタイルの変更を希望する場合、ユーザは、領域スタイルを変更するためのコマンドを入力する。DSU内に定義されたユーザ変更可能なスタイルによって定義されたユーザ制御スタイルのセットのうち1つを選択することにより、領域の水平位置、領域の垂直位置及びフォントサイズのうち少なくとも1つが変更される。
図10に示す装置は、ビデオ・デコード手段20、グラフィック・デコード手段30、テキスト・サブタイトル・デコード手段40から出力されるイメージを重畳するイメージ重畳手段50をさらに含む。図3に示すように、ディスプレイ画面上には、合成されたイメージが表示される。通常、ビデオ・デコード手段20のVP23から出力されるビデオイメージは、ディスプレイ画面の背景として表示され、グラフィック・デコード手段及び/又はテキスト・サブタイトル・デコード手段から出力されるイメージは、所定の順序でビデオイメージ上に重畳される。例えば、グラフィクデコード手段30の出力イメージがプレゼンテーション・グラフィック・イメージであれば、これらのイメージは、最初に第1の加算手段52によりビデオイメージ上に重畳され、次いで、テキスト・サブタイトル・デコード手段40から出力されるテキスト・サブタイトル・イメージは第2の加算手段53によりビデオイメージ上に重畳される。しかしながら、グラフィック・デコード手段30の出力イメージがインタラクティブ・グラフィック・イメージであれば、テキスト・サブタイトル・デコード手段40から出力されるテキスト・サブタイトル・イメージは、第1の加算手段52によりビデオイメージ上に重畳される。次いで、インタラクティブ・グラフィック・イメージは、第2の加算手段53によりサブタイトルが重畳されたイメージ上にさらに重畳される。
最後に、図10に示す装置は、入力するトランスポート・ストリーム(例えば、MPEGトランスポート・ストリーム)をデコードするシステムデコーダ4と、上述した装置内の全ての構成要素の動作を制御するマイクロプロセッサー3を含む。
以上述べたように、本発明の実施の形態は、当業者によって、特許請求の範囲に開示された本発明の技術的な思想とその技術範囲内において各種の実施例を改良、変更、代替又は付加などできることは自明である。よって、本発明は、特許請求の範囲及びそれと均等範囲内における本発明の改良及び変更事項を含むということは言うまでもない。
本発明によれば、複数のユーザ制御スタイルは、ダイアログ・スタイル・セグメントに定義された各領域スタイルに対して定義される。各ユーザ制御スタイルは、ユーザによって選択可能であり、対応する領域スタイルによって指定された領域プレゼンテーション・プロパティを変更するように構成される。したがって、ユーザは、各種のユーザ制御スタイルのうちの1つを選択するオプションを有することができる。