JP3536493B2 - オーサリングシステム,このシステムで使用される符号化装置及び多重化装置並びに多重ビットストリームを生成する方法 - Google Patents

オーサリングシステム,このシステムで使用される符号化装置及び多重化装置並びに多重ビットストリームを生成する方法

Info

Publication number
JP3536493B2
JP3536493B2 JP32481795A JP32481795A JP3536493B2 JP 3536493 B2 JP3536493 B2 JP 3536493B2 JP 32481795 A JP32481795 A JP 32481795A JP 32481795 A JP32481795 A JP 32481795A JP 3536493 B2 JP3536493 B2 JP 3536493B2
Authority
JP
Japan
Prior art keywords
information
multiplexing
stream
encoding
intermediate file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32481795A
Other languages
English (en)
Other versions
JPH09162830A (ja
Inventor
剛 小田
幹太 安田
義明 大石
勝己 田原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP32481795A priority Critical patent/JP3536493B2/ja
Publication of JPH09162830A publication Critical patent/JPH09162830A/ja
Application granted granted Critical
Publication of JP3536493B2 publication Critical patent/JP3536493B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えばMPEG2
のようなディジタル動画像符号化標準に沿って多重ビッ
トストリームを生成して蓄積メディアに記録するための
オーサリングシステムに関し、並びにこのシステムで使
用される符号化装置及び多重化装置並びに多重ビットス
トリームを生成する方法に関する。
【0002】更に具体的には、例えば映画ビデオ,音楽
ビデオ等のあらゆる種類のビデオ素材を対象にして、そ
のビデオ素材の映像及び映像に対応した背景音(所望に
より、サラウンドを含める。),複数の言語の吹き替
え,複数の言語の字幕等の関連情報をMPEG2標準,
MPEGオーディオ標準等に沿って夫々生成した個別符
号化ビットストリームを、多重化して多重ビットストリ
ーム形式に生成し、光ディスク,光磁気ディスク,磁気
テープ等の蓄積メディアに対してディジタル記録する際
に利用されるオーサリングシステム,このシステムで使
用される符号化装置及び多重化装置並びに多重ビットス
トリームを生成する方法に関する。
【0003】このようなオーサリングシステムは、概し
て、符号化装置,多重化装置等から構成されており、符
号化装置により映像,背景音,音声等のソースデータを
MPEG2に沿って夫々圧縮符号化し、多重化装置によ
りこれら圧縮符号化データを1本の多重ビットストリー
ムに生成して蓄積メディアに記録するものである。
【0004】
【従来の技術】〔マルチメディアを多重化するMPEG
システム〕最初に、本発明を容易に理解出来るようにす
るため、本発明に関連するマルチメディアを多重化する
MPEG2(Moving Picture Experts Group2)システ
ム及び最終的に生成される多重ビットストリームの概要
に関して説明する。このよな多重ビットストリームに関
する刊行物としては、安田浩編著:“マルチメディア符
号化の国際標準”,丸善株式会社(1991)、マルチ
メディア通信研究会編:“最新MPEG教科書”アスキ
ー出版局(1995)、テレビジョン学会編:“画像情
報圧縮”オーム社(1991)等があり、以下のMPE
Gシステムの説明に関してこれらを適宜引用している。
【0005】(MPEGシステム)MPEGビデオやM
PEGオーディオの符号化されたストリーム(ビット
列)、更に他の符号化ストリームを、同期を含めて統合
し1本化すると共に、そのストリームを蓄積メディア等
がもつ固有のフォーマットに適合したデータ形式にする
必要がある。更に、アプリケーションで使用するデータ
を付加することも求められる。このように、ビデオ,オ
ーディオ等を同期化して多重化するのがMPEGシステ
ムの役割である。
【0006】MPEG標準には、主にCD−ROM等の
蓄積メディアのための標準であるMPEG1と、MPE
G1のアプリケーションも含む広い範囲のアプリケーシ
ョンのための標準であるMPEG2とがある。本発明
は、主にMPEG2を利用している。また、MPEG2
システムの多重化に関しては、一つのプログラム(番
組)を構成するプログラム・ストリーム(program stre
am、MPEG2−PS)と、複数プログラムを同時に構
成できるトランスポート・ストリーム(transportstrea
m、MPEG2−TS)の2種類の方式があるが、この
内、本発明は、主にMPEG2−PSを対象としてい
る。
【0007】図6に、本発明に関係するMPEG2シス
テムの基本的な機能を理解するためのシステム構成図を
示す。このシステムは、ビデオ符号器(エンコーダ)3
及びオーディオ符号器(エンコーダ)5からなる符号化
装置1と、ビデオ符号器及びオーディオ符号器の出力を
多重化する多重化装置(MUX Multiplexier)21
と、この多重化装置からの多重ビットストリームを記録
する蓄積メディア53と、蓄積メディアに記録された多
重ビットストリームを分離する分離装置(DMUX De
multiplexer )55と、分離された符号化データを夫々
復号するビデオ復号器57及びオーディオ復号器(デコ
ーダ)59からなる復号装置60とを備えている。
【0008】このシステムの動作に関しては、符号化装
置1のビデオ符号器3及びオーディオ符号器5は、ビデ
オ及びオーディオの個別素材を、例えばMPEG標準に
従って、夫々の連携を保ちながら個別に符号化圧縮す
る。符号化された各個別のストリーム(データ列)を多
重化装置21でアプリケーションに合わせて、ストリー
ムの蓄積メディアのフォーマットに適合した多重化を行
い、記録する。即ち、複数の個別符号化ストリームを時
分割多重して1本のストリームにする。
【0009】多重ストリームが記録された蓄積メディア
53は、分離装置55で、ビデオ,オーディオ等の各個
別のストリーム(データ列)部分を分離して、夫々の復
号装置60に送る。復号装置60のビデオ復号器57,
オーディオ復号器59等は、多重化装置側で意図したよ
うに、復号装置側で個別ストリームを同期復号する。各
復号器57,59では個別に符号化ビットストリームを
復号して、出力装置(テレビ・モニタ,スピーカ等)に
出力する。
【0010】近年、符号化・多重化装置1,21から分
離・復号化装置55,59に多重ビットストリームを伝
達する伝達メディア53として、記録媒体として光ディ
スク,光磁気ディスク等を利用したDVD(Digital Vi
deo Disc)が検討されている。本発明は、このDVDに
関連して成された発明である。
【0011】(多重,分離及び同期の方式)次に、多
重,分離及び同期の方式に付いて概略的に説明する。多
くの時分割多重方式で用いられているパケット(Packe
t)による多重方式を、MPEG2システムでも取り入
れている。図7に、基本的なパケットによる1プログラ
ムの多重・分離方式を取り入れたMPEG2−PS(プ
ログラム・ストリーム)の基準復号器を示す。詳細に関
しては、後述する。
【0012】このパケットによる多重化とは、例えば、
ビデオ,オーディオ等のデータを多重する場合、ビデ
オ,オーディオ等の夫々をパケットと呼ばれる適当な長
さのビットストリーム(ビット列)に分割し、ヘッダ等
の付加情報を付けて、適宜、ビデオ,オーディオ等のデ
ータのパケットを切り換えて時分割記録する方式であ
る。図8(1)に示すように、これらのパケットには、
ヘッダと称される先頭部分にビデオ,オーディオ等の属
性を識別する情報等がある。また、必要に応じて、最後
尾にビット・エラーを検出するためのCRC(Cyclic R
edundancy Check 、巡回冗長検査)と称される符号を追
加する。
【0013】パケット長は、蓄積メディアに強く依存す
る。例えば、光ディスク・システムのように長い(40
96バイトのパケット長)ものもあり、MPEGでは上
限を約216(64Kバイト)とし、フレキシビリティを
もたせるために、各パケットは固定長でも可変長でも良
いことになっている。ヘッダ等の固定的に必要な部分
は、パケット長に依存しないため、短いパケットはオー
バヘッド(多重化のための追加データ)が大きく、記録
効率が低下するが、時分割多重の切替時間が短いため
に、多重に起因する遅延とバッファ・メモリ量が少なく
て済むというメリットもある。
【0014】図8(2)に示すように、MPEG2−P
S(プログラム・ストリーム)では、ビデオやオーディ
オやその他のデータのパケットの上位にパック・レイヤ
と称する階層がある。通常は複数個のパケットを束ねた
パック(Pack)と称される構成単位で取り扱われる。図
8(2)にパックの構成を示すが、パック・ヘッダ部分
に、後述する同期再生用の時間基準参照用の付加情報等
がある。パックの主目的は、ストリームの途中から復号
再生することを可能にすることにある。
【0015】(タイムス・スタンプによるAV同期方
式)復号装置において、個別ストリームの復号は、アク
セク・ユニット単位で行われる。例えば、ビデオでは1
フレーム,オーディオでは1オーディオ・フレームが、
アクセス・ユニットとなる。MPEG2の同期方式に関
しては、ビデオ,オーディオ,他のデータの各アクセス
・ユニットに、何時復号再生すべきかを示すタイム・ス
タンプと称される情報が付加される。このタイム・スタ
ンプに対しては、SCR(System Clock Reference、シ
ステム時刻基準参照値)と称される情報によって時間基
準が与えられる。
【0016】タイム・スタンプは、各アクセス・ユニッ
ト毎に付けられる復号再生処理の時刻管理のタグ(札)
に相当する。MPEGオーディオの符号化方式に起因し
て、2種類のタイム・スタンプがあり、一つはPTS
(Presentation Time Stamp )と称される「再生出力の
時刻管理情報」で、他方はDTS(Decoding Time Stam
p )と称される「復号の時刻管理情報」である。これら
のタイム・スタンプは、パケットの中にアクセス・ユニ
ットの先頭がある場合には、パケット・ヘッダに付加す
る。しかし、パケットの中にアクセス・ユニットの先頭
がない場合には、パケット・ヘッダにタイム・スタンプ
は付加しない。また、パケットの中に二つ以上のアクセ
ス・ユニットの先頭があっても、最初のアクセス・ユニ
ットに対応するタイム・スタンプだけをパケットヘッダ
に付加する。
【0017】図7に示すMPEG2−PS(プログラム
・ストリーム)の基準復号器に関して説明する。蓄積メ
ディアに記録された多重ビットストリームが、分離装置
55により個別ストリームに分離される。ビデオのビッ
トストリームは、ビデオのSTD(System Target Deco
der 、システムに対応したデコーダ)バッファ57′に
蓄積され、オーディオのビットストリームは、オーディ
オのSTDバッファ59′に蓄積される。タイム・スタ
ンプ(PTS,DTS)に時間基準を与えるSCR(シ
ステム時刻基準参照値)は、システム・デコーダ61に
蓄積される。
【0018】PTS(再生出力の時刻管理情報)は、図
7に示されたMPEG2−PSの基準復号器の内部のS
TC(System Time Clock 、基本となる同期信号。基本
的には、SCRと一致している。)がPTSに一致した
時に、そのアクセス・ユニット を再生出力する。PT
Sの精度は、90kHzのクロックで計測した値を33
ビ ット長で表す。90kHzの理由は、NTSC,P
AL両方のビデオ方式のフレ ーム周波数の公倍数であ
ることと、オーディオの1サンプル周期よりも高い精度
を得るためである。32ビット長の理由は、90kH
zのクロックの計測値で、 ビデオのSMPTE(Soci
ety of Motion Picture and TelevisionEngineers、
アメリカ映画・テレビ技術協会)タイム・コードと同様
に1日の24時間の範囲 を表現できるようにするため
である。
【0019】DTS(復号の時刻管理情報)は、MPE
G2ではビデオの特殊な符号化ストリームの送出順序が
あることから設けられている。即ち、Iピクチャ(Intr
a-Picture 、フレーム内符号化画像)とPピクチャ(Pr
edictive-Picture、フレーム間順方向予測符号化画像)
は、Bピクチャ(Bidirectinally Predictive-Picture
、双方向予測符号化画像)よりも先行して符号化スト
リームに送出するために、復号する順序と再生出力する
順序が異なることに対応したものである。PTSとDT
Sが異なる場合には、両方のタイム・スタンプを付け、
一致する場合にはPTSだけを付けることになってい
る。具体的には、Bピクチャのあるビデオ符号化ストリ
ームでは、IピクチャとPピクチャでPTS及びDTS
を付け、Bピクチャや、BピクチャのないIピクチャと
BピクチャではPTSだけでよいことになる。
【0020】SCR(System Clock Referenceシステム
時刻基準参照値)は、ビデオ,オーディオの復号器を含
むMPEGシステム復号装置において、時刻基準となる
STC(基準となる同期情報)の値を符号器側で意図し
た値にセット・校正するための情報である。また、SC
Rの利用に際しては、単にSCRの値だけでは不十分
で、SCRの値を運んでいるストリーム中のバイトのタ
イミング(復号器への到達時刻)の精度が必要となる。
SCRは、MPEG2では6バイト(実データは42ビ
ット)で送られるが、復号器側では、その最終段の到達
の瞬間に、STCはSCRの値をセットすることが求め
られる。
【0021】このSCRに対して、復号装置側はSTC
と一体になったPLL(位相ロック・ループ)を構成し
て、符号器のシステム・クロックと完全に周波数の一致
したSTCを復号器でもつことが出来る。
【0022】分離装置55及び復号装置60を更に説明
すると、分離装置55で多重ビットストリームを映像の
個別ストリーム,音声の個別ストリーム等に分離して、
夫々のSTDバッファ57′,59′に逐次記録され
る。夫々の復号器では、対応するSTDバッファから所
定のタイミングで1アクセス・ユニット分(ビデオでは
1フレーム分、オーディオでは1オーディオ・フレーム
分)のビットストリームを読み出し、復号化処理を行
う。
【0023】図9は、STDバッファに蓄積される状態
及び所定のタイミングで読み出し、復号化するタイミン
グを説明する図である。最初、STDバッファは空であ
ったと仮定する。分離装置から個別ビットストリームが
順次蓄積される。1フレーム分蓄積された時、復号化装
置は蓄積されたビットストリームを1アクセス・ユニッ
ト分だけ一度に読み出し、読み出されたビットストリー
ムの復号化処理を開始する。読み出しタイミングが所定
のタイミングより遅れたり又はビットレートが早過ぎる
と、STDバッファはオーバフローを生ずる。所定のタ
イミングより早すぎたり又はビットレートが遅過ぎる
と、アンダーフローを生じて、いずれにしてもバッファ
は破綻する。
【0024】更に、多重ビットストリームは、ビデオに
対し、対応するオーディオ等が適当な順序・割合で送ら
れて同期を取ることが必要である。例えば、ビデオのみ
送られて来てそれに対応するオーディオ等が送られて来
ないと、ビデオとオーディオ等の同期が取れず、再現で
きなくなる。
【0025】従って、予め、多重化装置においてビデオ
データとオーディオデータ等とを多重化する際に、ST
Dバッファが破綻しないように、またビデオとオーディ
オ等の同期が取れて復号が行われるように、スケジュー
リングを行いながら多重ビットストリームを生成するこ
とが必要になる。
【0026】従来、図10に示すようなビデオCD等に
使用されるリアルタイム・オーサリングシステムが知ら
れている。図10のリアルタイム・オーサリングシステ
ムは符号化装置1と、多重化装置21からなり、符号化
装置1は、一般に、ディジタル・ビデオソース信号(個
別素材)を符号化するビデオ符号化器3と、ディジタル
・オーディオソース信号(個別素材)を符号化するオー
ディオ符号化器5とを有する。
【0027】多重化装置21は、前段に、ビデオ符号化
器3に接続されたバッファメモリ65と、オーディオ符
号化器5に接続されたバッファメモリ67とを有し、更
に後段に、これらバッファメモリ65,67に接続され
た多重化器回路69とを有している。
【0028】図10のリアルタイム・オーサリングシス
テムの動作は、ビデオ符号化器3及びオーディオ符号化
器5は、ビデオソース信号,オーディオソース信号等の
個別素材を、夫々の連携を保ちながら、個別に圧縮符号
化する。符号化ビデオ・ビットストリームはバッファメ
モリ65に逐次蓄積され、同様に符号化オーディオ・ス
トリームはバッファメモリ67に逐次蓄積される。
【0029】多重化回路69は、バッファメモリ65に
蓄積されたビデオデータと、バッファメモリ67に蓄積
されたオーディオデータとを、所定の順序で多重化し
て、ビデオビットストリームとオーディオビットストリ
ームが時分割多重化された多重ビットストリームを生成
する。多重ビットストリームは、適当な蓄積メディアに
記録される。
【0030】
【発明が解決しようとする課題】このような従来のリア
ルタイム・オーサリングシステムを使用して、多重ビッ
トストリームを生成する場合、大別して3つの問題が生
じてきた。即ち、多重化スケジューリングに関する問
題,同一エレメンタリー・ストリームを用いて複数回多
重化を行う場合の問題及び参照画像位置情報に関する問
題がある。
【0031】(1)多重化スケジューリングに関する問
題 従来は個別素材としてビデオとオーディオのみを多重し
ていたが、適用範囲が拡大するにつれ、映画ソース,音
楽ビデオ等を含むあらゆるビデオソースが対象となって
いる。例えば、1つの映像に対応して、オーディオに関
してはサラウンドを付加して蓄積したり、数カ国の言語
で吹き替えし、また数カ国語の言語の字幕を含んだ多重
ビットストリームを生成し、蓄積メディアに記録したい
場合が生じる。
【0032】この場合、動画像信号,音声信号,字幕信
号等を夫々の所定の符号化装置により圧縮して得られた
個別ビットストリームと、その他非圧縮のビットストリ
ーム等を多重化装置(MUX)で多重化し、1本のMP
EG2標準の多重ビットストリームとして所定の記録媒
体に記録する必要がある。
【0033】MPEG2標準の多重ビットストリーム
は、分離・復号化装置の前段にある分離装置(DMU
X)により複数種の個別ビットストリームに分離され、
各個別ビットストリームはその後段にある各々の復号化
装置により復号・再生される。分離装置から分離・送出
された各個別ビットストリームは各々のSTDバッファ
に蓄積され、各々の復号化装置によりアクセス・ユニッ
ト分のビットストリームが読み出されてデコードされ
る。
【0034】この場合に、分離装置から分離・送出され
る各エレメンタリー・ストリームは、そのSTDバッフ
ァをオーバフロー又はアンダフローして破綻させてはな
らない。また、ビデオに対してオーディオ等が同期が取
れた割合で組み合わせてあることが必要である。従っ
て、各復号化装置のSTDバッファが破綻しないよう
に、予め多重化装置において、個別ビットストリームを
多重化するに際して、個別ビットストリームの適切な組
み合わ及び適切な個別ビットストリーム長の決定等のス
ケジューリング処理を行わなければならない。
【0035】多重化のスケジューリング処理を行う場合
に、現在まさに多重化(パケット化)しようとする部分
の大きさを決めるために、多重化すべきエレメンタリー
・ストリーム(素ビット列)を先読みしてそれより先の
部分(DTSが遅い部分)のアクセス・ユニットの大き
さを観察することにより、現在の多重化を決定すること
が可能となる。
【0036】このため、従来のリアルタイム・オーサリ
ングシステムのように、符号化と多重化をリアルタイム
で実行する場合には、多重化スケジューリングの先読み
のために多重化装置にバッファメモリを備える必要があ
る。
【0037】このバッファメモリに関して、オーサリン
グシステムでは、適用範囲の拡大にともない多数のエレ
メンタリー・ストリームを多重化する場合が生じる。実
際、このような場合を想定して、MPEG2では音声は
最大32本のエレメンタリー・ストリームの多重化を許
容している。このような多数のエレメンタリー・ストリ
ームの多重化をリアルタイム処理するには、当然のよう
に、莫大な容量のバッファメモリが必要になる。
【0038】また、そのように多重化するエレメンタリ
ー・ストリームの個数が多くなればなるほど、前述のよ
うに夫々の復号装置のSTDバッファの破綻が起こらな
いように多重化スケジューリングを行うために、先読み
の範囲を相当広げなければならなくなる。この点から
も、多重化装置には莫大な容量のバッファメモリが必要
とされる。
【0039】更に、エレメンタリー・ストリームの個数
が増加する毎に、その分だけ解析の量も増加し、多重化
装置の負担が大きくなる。
【0040】(2)同じ映像のエレメンタリー・ストリ
ームを用いて、複数回多重化を繰り返す問題 MPEG2の多重化の仕様から、音声のエレメンタリー
・ストリームは最大32個まで多重化可能である。この
音声多重化の許容範囲を利用して、映画やビデオソース
に対し、1つの映像に対して多数国の言語で吹き替えし
たり、多数国の言語の字幕を挿入して多重ビットストリ
ームを生成し、これを蓄積した蓄積メディアを作成する
こと望まれる。
【0041】言い換えれば、1つのプログラム(番組)
の映像のエレメンタリー・ストリームに対して、複数個
の音声のエレメンタリー・ストリームと、複数の字幕の
エレメンタリー・ストリームとから、組み合わせを変え
た複数個の多重ビットストリームを作成したい場合であ
る。
【0042】例えば、或る映画に対し、英語音声及び日
本語音声を多重化し、且つ英語字幕及び日本語字幕で多
重化したソフトウェアと、英語音声及びスペイン語音声
で且つ英語字幕及びスペイン語字幕で多重化したソフト
ウェアとの2種類のソフトウェアを作成したい場合があ
る。
【0043】このような場合、1つのプログラムに対し
異なる種類の多重ビットストリームを作成するために、
各多重ビットストリームを生成する毎に別個に、同一の
映像,音声,字幕を符号化してこれらのエレメンタリー
・ストリームを多重化スケジューリングのために解析を
行うことは、重複した作業が発生し、全体としては無駄
であり、非常に効率が悪い。
【0044】(3)参照画像位置情報に関する問題 MPEG2多重ストリームは、パック単位に、後で説明
するPSI(プログラム仕様情報)であるPSD(プロ
グラム・ストリーム・ディレクトリ)とPSM(プログ
ラム・ストリーム・マップ)と呼ぶ特別のパケットが、
パック・ヘッダの後に挿入される。PSDには、そのパ
ックの前後に位置する参照すべきIピクチャへのオフセ
ット値が入る。PSMには、主に多重化されているエレ
メンタリー・ストリームを説明し、またそれらの相互関
係を説明するものであるが、その他に自由に情報を織り
込むことが可能であり、例えば音楽ビデオや映画等にあ
るトラックの先頭のIピクチャへのオフセット値等が入
ることが出来る。
【0045】PSDにおいて、過去に向かって参照する
より未来に向かって参照するIピクチャの範囲を拡大す
ると、その分だけエレメンタリー・ストリームの先読み
の範囲を広げなければ、PSDの内容を決定し多重ビッ
トストリームに対して書き込むことは出来ない。
【0046】トラックは、通常、数分〜数十分の時間単
位となるため、現実には、多重化しながらその莫大なデ
ータを先読みしてトラックの先頭のIピクチャのアドレ
ス等の情報を決定し、PSMのデータとして書き込むこ
とは不可能である。
【0047】本発明は、上述のような問題を解決し、且
つ多数の個別データを効率良く多重化するオーサリング
システムを提供することを目的とする。
【0048】更に本発明は、このようなオーサリングシ
ステムに使用される符号化手段と、多重化手段を提供す
るものである。
【0049】
【課題を解決するための手段】本発明にかかるオーサリ
ングシステムは、例えばMPEG2,MPEGオーディ
オ等に沿って、複数の個別ソース信号を夫々符号化して
得られた各エレメンタリー・ストリームとその他のディ
ジタル信号列とを多重化して多重ビットストリームを生
成するオーサリングシステムであって、前記符号化時に
各エレメンタリー・ストリームをファイルとして夫々生
成すると同時に符号化付随情報を中間ファイルとして夫
々生成する符号化装置と、前記各エレメンタリー・スト
リームのファイルと前記中間ファイルとから、前記エレ
メンタリー・ストリームを分析することなしに多重化の
スケジューリングを行って多重ビットストリームを生成
する多重化装置とを備えている。
【0050】更に本発明にかかるオーサリングシステム
は、上述のオーサリングシステムにおいて、前記多重化
装置は、スケジューリング器と、参照画像位置情報生成
器と、多重ビットストリーム生成器とを有し、前記スケ
ジューリング器は、多重化を行う各エレメンタリー・ス
トリームのスケジューリングを行いその結果をスケジュ
ールデータの中間ファイルとして生成し、前記参照画像
位置情報生成器は、前記スケジュールデータの中間ファ
イルから多重ビットストリームを構成する全てのパック
毎に挿入する参照画像位置情報の中間ファイルを生成
し、前記多重ビットストリーム生成器は、前記スケジュ
ールデータの中間ファイル及び前記参照画像位置情報の
中間ファイルの情報に基づき各エレメンタリー・ストリ
ームから多重ビットストリームを生成している。
【0051】更に本発明にかかるオーサリングシステム
は、上述のオーサリングシステムにおいて、前記符号化
付随情報の中間ファイルに、少なくとも多重化の最小単
位であるアクセス・ユニット毎のサイズ,DTS及びP
TSが記述されている。
【0052】更に本発明にかかる多重ビットストリーム
を生成する方法は、ビデオソース信号,オーディオソー
ス信号,字幕ソース信号を含む複数の個別ソース信号を
夫々符号化して得られた各々のエレメンタリー・ストリ
ームとその他のディジタル信号列とを多重化して多重ビ
ットストリームを生成する方法であって、前記符号化す
る段階において、各々のエレメンタリー・ストリームの
ファイルを生成すると同時に夫々の符号化付随情報を中
間ファイルとして生成し、前記多重化する段階におい
て、前記中間ファイルを取り込むことにより、前記エレ
メンタリー・ストリームを分析することなしに多重化ス
ケジューリングを行って多重化する。
【0053】更に本発明にかかる多重ビットストリーム
を生成する方法は、上述の多重ビットストリームを生成
する方法において、前記多重化する段階は、スケジュー
リングする段階,参照画像位置情報を生成する段階及び
多重ビットストリーム生成する段階を有し、前記スケジ
ューリングする段階は、前記符号化付随情報の中間ファ
イルに基づき各エレメンタリー・ストリームのスケジュ
ーリングを行いその結果をスケジュールデータの中間フ
ァイルとして生成し、前記参照画像位置情報を生成する
段階は、前記スケジュールデータの中間ファイルから多
重ビットストリームを構成する全てのパック毎に挿入す
る参照画像位置情報の中間ファイルを生成し、前記多重
ビットストリームを生成する段階は、前記スケジュール
データの中間ファイル及び前記参照画像位置情報の中間
ファイルの情報に基づき各エレメンタリー・ストリーム
から多重ビットストリームを生成する。
【0054】以上のような本発明にかかる符号化・多重
化装置及び多重ビットストリームを生成する方法によれ
ば、符号化処理段階と、スケジューリング処理段階と、
多重化処理段階に分離され、各エレメンタリ・ストリー
ムを分析すること無く、多重化処理できる。
【0055】また、各個別ソース信号の符号化処理にお
いて、各エレメンタリ・ストリーム・ファイルと各符号
化付随情報ファイルと生成してあるので、後で任意の組
み合わせの多重ビットストリームを生成出来る。
【0056】
【発明の実施の形態】以下、本発明にかかる実施例に関
し、添付の図面を参照しながら説明する。なお、同一要
素に付いては同一符号を付与して、説明の重複を省略す
る。
【0057】〔MPEGシステムのデータ構造とビット
ス・トリーム構成〕最初に、本実施例のオーサリングシ
ステムにより生成される多重ビットストリームのデータ
構造に関して説明し、次にPSI(Program Specific I
nformation、プログラム仕様情報)に関して説明する。
【0058】本実施例の多重ビットストリームのデータ
構造は、MPEG2−PS(Program Stream)に準じて
おり、そのデータ構造とビットストリームは、以下のよ
うに階層的構造になっている。このMPEGストリーム
は、1ビットのフラグ等も多数あるが、ヘッダ等の各単
位毎にバイト整列されたバイトス・トリームとなってい
て、固定長でないデータ部分には、長さを示す情報が先
行して置かれ、不要な場合はその部分をスキップしたり
出来るようになっている。
【0059】(MPEG2−PSのデータ構造)多重ビ
ットストリーム(MPEG2−PS)のデータ構造を上
位レイヤ(パック・レイヤ)と下位レイヤ(パケット・
レイヤ)に分けて図1と図2に示す。図1に示す上位レ
イヤ(パック・レイヤ)に関して、1つのプログラム
は、シーケンスと称されることもあるが、先頭の「パッ
ク・ヘッダ」に始まり、「終了コード」で終わる。前述
のように、パックは、一般に複数個のパケットから構成
され、プログラムの先頭のパックには、「システム・ヘ
ッダ」と称されるストリーム全体の概要を記述(パラメ
ータ情報)した情報グループがある。このシステム・ヘ
ッダは、先頭のパックには、付加することが義務づけら
れているが、2番目以降のパックではオプションとなっ
ている。
【0060】パック・ヘッダは、可変長で、32ビット
(4バイト)の「パック開始コード」の後に、「01」の
2ビットが続き、これがMPEG1との識別コードにな
っている。その後に、合計で6バイト長の前述の「SC
R(システム時刻基準参照値)」と、このストリームの
「プログラム多重化レート」(可変ビットレートの場合
は時々刻々の値)を50バイト/秒単位で表す情報が続
く。
【0061】最大7バイトまでのスタッフィング・バイ
トを置くことが出来るので、このスタッフィング・バイ
トに先行して「パック・スタッフィング・バイト長」で
長さを示す。これに続いて、Mバイト(最大7)の「パ
ック・スタッフィング・バイト」が置かれている(スタ
ッフィング・バイトに付いては、後で説明する。)。以
上のことから、パックヘッダ長は14バイト乃至21バ
イトの可変長となる。
【0062】システム・ヘッダには、32ビットの「シ
ステム・ヘッダ開始コード」に続いて、このシステム・
ヘッダ自身の長さを示す情報項目(フィールド)として
「ヘッダ長」が含まれる。実データ部分には、「ビット
・レート」,「オーディオ・チャネル数」,4種類の
「フラグ類」,「ビデオ・チャネル数」(1プログラム
でも複数個のビデオ,オーディオをもつことが出来
る。)と、そして各個別ストリム毎に必要なバッファ・
メモリ量を示すフィールド「P−STDバッファ領域ス
ケール」,「P−STDバッファ領域サイズ」が含まれ
る。フラグには、次の4つの項目がある。 「固定レート・フラグ」…一定ビット・レートであるこ
との識別。 「CSPSフラグ(Constrained System Parameter Str
eam 、制限的なシステム・パラメータ・ストリーム)」
…システム・ストリームのパラメータに制限を設けて、
実際の復号器での互換性を実現を意図したもの。 「オーディオ・ロック・フラグ」…システム・ストリー
ム中のオーディオがシステム・クロック(90kHz)
とフェイズ・ロックしているかどうかを示すフラグ。 「ビデオ・ロック・フラグ」…システム・ストリーム中
のビデオがシステム・クロック(90kHz)とフェイ
ズ・ロックしているかどうかを示すフラグ。
【0063】次に、システム・ヘッダ中の「N回ルー
プ」中に示す「ストリームID」は、下表にその一例を
示すように、32ビットのパケット開始コードの最後の
8ビット部分である。この8ビットでストリームを区別
して、各個別ストリーム毎にパラメータ(必要なバッフ
ァ・メモリ容量)を示す。
【0064】 ストリームIDテーブル(一部) ストリームID ストリーム種別 1011 1100 プログラム・ストリーム・マップ(PSM) 1011 1101 プライベート・ストリーム1 1011 1110 パディング・ストリーム 1011 1111 プライベート・ストリーム2 110X XXXX MPEGオーディオ・ストリーム 1110 XXXX MPEGビデオ・ストリーム 1111 0010 DSM* コントロールコマンド 1111 1111 プログラム・ストリーム・ディレクトリ(PSD) (*)DSM:Digital Storage Media ,ディジタル蓄積メディア
【0065】下位レイヤ(パケット・レイヤ) MPEGのパケットはPESパケット(Peckeized Elem
entary Stream Packet)と称され、この構造はMPEG
2−TSと共用して用いられるため、ヘッダの部分が複
雑になっているが、階層的に理解し易くなっている。最
初の部分にフラグ類がまとめて置かれ、それらのフラグ
に対応してオプション的に条件符号化された項目がそれ
に続いている。更にそのオプション項目に2次的なオプ
ション項目がある。
【0066】32ビットの「パケット開始コード」は、
24ビットの固定部分の「パケット開始プレフィック
ス」と8ビットの「ストリームID(識別)」部分から
なる。MPEG2−PSでは、最大で、ビデオ16チャ
ネル、オーディオ32チャネルまで可能となるようにス
トリームIDが定義されている。
【0067】「パケット長」は、このフィールドに続く
パケットのデータ長を示す。
【0068】システム制御情報として、次のようなもの
がある。パケット長に続く2ビットの制御コード「10」
は、前述したようにMPEG1の“00”,“01”又は
“11”との識別用に利用されている。「スクランブル制
御フラグ」は、データにスクランブル(データ列の組み
替え等)をかけて、守秘情報や商用システムなどに用い
ることが出来る。通常、“00”とされている。「PES
優先度フラグ」は、重要なパケットと、そうでないパケ
ット(場合によっては捨て去ることが出来るパケット)
に区別出来るようにしている。通常、“0 ”とされてい
る。次に、「データ整列」が続き、「コピー・ライト」
は、ビデオやオーディオの符号化ストリームの著作権を
示す情報である。「オリジナル/コピー」は、原本か複
写かを示す。「PESヘッダ長」は、PESパケットの
ヘッダの長さを示す。
【0069】「オプション・フィールド」として、次の
ものがある。 「PTS」…前述したPTS(Presentation Time Stam
p )と称される「再生出力の時刻管理情報」である。 「DTS」…前述したDTS(Decoding Time Stamp )
と称される「復号の時刻管理情報」である。 その他「ESCR」,「ESレート」等が続くが、本実
施例に直接関係が無いため省略する。
【0070】最大7バイトまでの「スタッフィング・バ
イト」及び「パディング・バイト」は、ダミーのバイト
で、符号には意味の無いデータです。用途としては例え
ば、PTSやDTSの有無に拘らずパケット・データ長
を一定にするために、PTSやDTSが無いパケットに
おいて、これらの代わりにスタッフィング・バイトを置
くこと等がある。
【0071】(PSI(プログラム仕様情報)のデータ
構造と)MPEG2−PSには、複数個のビデオ,オー
ディオ,その他のデータの個別ストリームを1本に多重
化しているため、分離・復号化装置においてどのパケッ
トを取り出して、どのように復号すればよいか等の情報
が必要になる。これらのプログラム仕様情報を総称して
PSI(Program Stream Information、プログラム仕様
情報)と称している。MPEG2−PSには、2つのP
SI(プログラム仕様情報)用パケットが定義されてい
る。一つはPSM(Program Stream Map)で、他の一つ
はPSD(Program Stream Directory)の各パケットで
ある。こら等のデータ構造を図11ー15に示し、前述
のPESパケットとの違いを解説する。
【0072】PSM(プログラム・ストリーム・マッ
プ)パケットは、プログラムの付加情報や各個別ストリ
ームの付加情報を記述するパケットである。例えば、ビ
デオのスケーラビリティ符号化に付いての情報やオーデ
ィオの言語識別情報などを記述できる。
【0073】PSD(プログラム・ストリーム・ディレ
クトリ)パケットは、蓄積メディアで用いられるランダ
ム・アクセスのためのディレクトリ情報で、個別のスト
リーム毎にランダム・アクセスのためのエントリー・ポ
イント(例えば、ビデオならIピクチャの先頭アドレ
ス)を、ストリーム先頭からのバイト数表現で示してい
る。このパケットのデータ構造は、前半部分は通常のP
ESパケットと同じで、後半部分(オプション・データ
とパケット・データに相当する部分)が異なっている。
【0074】〔実施例1〕本オーサリングシステムが目
的としている映画やビデオを数カ国語の音声で、数カ国
語の字幕で、多重化されたソフトウェアを作成するよう
な場合、即ち多数のエレメンタリー・ストリームを符号
化し、これらを時分割多重化する場合に、符号化から多
重化までの処理をリアルタイムで行うことは、多重化の
スケジューリングや参照画像位置情報(PSM情報,P
SD情報)の生成に必要となる先読みのバッファメモリ
容量の問題で非現実的である。
【0075】また、多重化する映像と音声と字幕の組み
合わせを変えて複数種類のソフトウェアを作成する場
合、その度毎に同じ符号化をし、且つそのエレメンタリ
ー・ストリームの多重化装置での解析を行うことは冗長
であり、効率が悪い。
【0076】そこで、これらの問題を考慮して、本実施
例のオーサリングシステムでは、符号化処理と多重化処
理とを時間的に完全に分けるものとしている。
【0077】図4は、実施例1にかかるオーサリングシ
ステムのシステム構成を示す図であり、このオーサリン
グシステムにより上述のような多重ビットストリームが
生成され蓄積メディアに蓄積される。このオーサリング
システムは、基本的には、符号化装置1と、多重化装置
21とを備えている。しかし、従来技術に関連して説明
したリアルタイム・オーサリングシステムの構成と比較
すると、実施例1の構成はリアルタイム方式ではなく、
符号化処理と、スケジューリングに必要な情報の生成処
理と、多重化処理とを時間的に完全に分けるものとして
いる。
【0078】即ち、ビデオ,オーディオ及び字幕データ
を夫々の符号化装置で符号化して生成された各エレメン
タリー・ストリーム(素ビット列)のファイルと共に符
号化の過程で得られる符号化付随情報の中間ファイルを
生成し、次にこの符号化付随情報ファイルから多重化装
置のスケジューリング器で生成されたスケジュールデー
タの中間ファイルを生成し、更にこのスケジュールデー
タの中間ファイルから参照画像位置情報生成器で生成さ
れた参照画像位置情報の中間ファイルとを生成してお
き、その後、多重ビットストリーム生成器でこれら中間
ファイルを用いて多重ビットストリームを生成する。
【0079】(符号化装置)符号化装置1は、例えばビ
デオ符号化器3と、オーディオ符号化器5と、字幕デー
タ符号化器7とを有する。
【0080】ビデオ符号化器3に対してビデオカメラ等
から出力されるディジタル形式のビデオソース信号が入
力され、ビデオ符号化器3はこのビデオソース信号を例
えばMPEG2システムのような動画像符号化標準を利
用して圧縮符号化する。このビデオ圧縮データはエレメ
ンタリー・ストリーム(素ビット列)として、ハードデ
ィスク等の蓄積メディアに蓄積され、ビデオ・エレメン
タリー・ストリーム・ファイル9が生成される。
【0081】同時に、符号化工程で得られる符号化付随
情報が、ハードディスク等の記録メディアに蓄積され符
号化付随情報ファイル11が生成される。この符号化付
随情報ファイルは従来のオーサリングシステムでは使用
されていなかったものであり、本実施例において初めて
生成された新規なものである。符号化付随情報は、従来
技術で説明した後段の分離・復号装置で多重ビットスト
リームをビデオ,オーディオ,字幕データ等の個別のス
トリーム部分に分離する分離装置で必要とされる情報で
あり、多重化の最小単位であるアクセス・ユニットのサ
イズ,DTS(復号の時刻管理情報),PTS(再生出
力の時刻管理情報)からなる。
【0082】同様に、オーディオ符号化装置5に対して
ディジタル形式のオーディオソース信号が入力され、オ
ーディオ符号化装置5はこのオーディオソース信号を例
えばMPEGオーディオシステムのようなオーディオ符
号化方式を利用して圧縮符号化する。このオーディオ圧
縮データはエレメンタリー・ストリーム(素ビット列)
として、ハードディスク等の蓄積メディアに蓄積され、
オーディオ・エレメンタリー・ストリーム・ファイル1
3が生成される。
【0083】同時に、符号化工程で得られる符号化付随
情報が、ハードディスク等の記録メディアに蓄積され、
符号化付随情報ファイル15が生成される。符号化付随
情報は、後段の分離・復号装置で多重ビットストリーム
をビデオ,オーディオ,字幕データ等の個別ビットスト
リームを分離する分離装置で必要とされる情報であり、
アクセス・ユニットのサイズ,PTSからなる。
【0084】同様に、字幕符号化装置7に対してディジ
タル形式の字幕ソース信号が入力され、字幕符号化装置
7はこの字幕ソース信号を符号化する。この字幕符号化
データはエレメンタリー・ストリーム(素ビット列)と
して、ハードディスク等の蓄積メディアに蓄積され、字
幕エレメンタリー・ストリーム・ファイル17が生成さ
れる。
【0085】同時に、符号化工程で得られる符号化付随
情報が、ハードディスク等の記録メディアに蓄積され、
符号化付随情報ファイル19が生成される。符号化付随
情報は、後段の分離・復号部で多重ビットストリームを
ビデオ,オーディオ,字幕データ等の個別ビットストリ
ームを分離する分離装置で必要とされる情報であり、ア
クセス・ユニットのサイズ,PTS,表示終了時刻から
なる。
【0086】なお、図4は例示であり、オーディオソー
ス信号及び字幕ソース信号は夫々1個に限定されるもの
でなく、複数の言語による吹き替えのソース信号,複数
の言語による字幕ソース信号を追加することが出来、更
にこれ以外のソース信号も考えられる。これらのソース
信号に関し、夫々の符号化器によりエレメンタリー・ス
トリーム及び符号化付随情報ファイルが生成される。な
お、説明を簡単にするため、以下ビデオ,オーディオ,
字幕の3つの場合に付いて説明を続ける。
【0087】ここで注意すべきことは、従来のオーサリ
ングシステムでは、上述のような符号化付随情報ファイ
ルの生成は行わず、各エレメンタリー・ストリームを先
読みして分析しながら多重化に必要な情報を集めて、ビ
デオ,オーディオ,字幕データの多重化が行われていた
ことである。しかし、本オーサリングシステムが目的と
しているように映画やビデオを数カ国語の音声で、数カ
国語の字幕で、多重化されたソフトウェアを作成するよ
うな場合、即ち多数のエレメンタリー・ストリームを符
号化し、多重化する場合に、符号化から多重化までの処
理をリアルタイムで行うことは、多重化のスケジューリ
ングや参照画像位置情報の生成に必要となる先読みのバ
ッファメモリの問題で非現実的である。
【0088】そこで、本実施例においては、リアルタイ
ムの多重化作業は行わず、1プログラム(番組)のビデ
オ,オーディオ,字幕データを最後まで符号化して、各
エレメンタリー・ストリームを生成すると同時にこの過
程で収集される各符号化付随情報を符号化付随情報ファ
イルとして生成している。このような処理を行うことに
より、後で、1つのビデオ情報に対し、複数のオーディ
オ情報,字幕情報等の内から任意の組み合わせの多重化
処理が、既に生成済みの各エレメンタリ・ストリーム及
び符号化付随情報ファイルを利用することにより可能に
なる。
【0089】(多重化装置)多重化装置21は、スケジ
ューリング器23と、参照画像位置情報生成器29と、
多重ビットストリーム生成器37とを有している。
【0090】(スケジューリング器)スケジューリング
器23は、符号化付随情報ファイル11,15,19を
読み込み、スケジューリング処理を行い、その結果をス
ケジュールデータ28の中間ファイルとして生成する。
このスケジュールデータ28は、主にパックに関するパ
ック情報ファイル25と、主にパケットに関するパケッ
ト情報27である。
【0091】スケジューリング器23に読み込まれる符
号化付随情報ファイル11,15,19には、スケジュ
ーリングに必要な情報であるアクセス・ユニットのサイ
ズ,PTS,また特にビデオではDTSが蓄積されてい
る。このため、スケジューリング器23は、各エレメン
タリー・ストリーム9,13,17を分析すること無し
に、ビデオ,オーディオ,字幕データのパックの長さ,
組み合わせ順序等のスケジューリン処理が可能になる。
【0092】スケジューリング器23のスケジューリン
グ処理を通じて、これら符号化付随情報ファイル11,
15,19からスケジュールデータ28が生成される。
スケジュールデータ28としては、パック情報ファイル
25とパケット情報ファイル27がある。この内、パッ
ク情報ファイル25としては、各パックに関する「SC
R(システム時刻基準参照値)」,「プログラム多重化
レート」,「スタッフィングビット長」,「パック内の
パケット個数N」等の情報が記述される。上述したパッ
ク・レイヤのデータ構造のパック・ヘッダ,システム・
ヘッダの情報項目の内、これらが決定されると、他の情
報項目は基本的にはシステムの仕様により一義的に決定
される。
【0093】これら符号化付随情報ファイル11,1
5,19から生成されるパケット情報ファイル27とし
ては、各パケットに関する「ストリームID」(ストリ
ーム・タイプ(エレメンタリー・ストリームの種類を表
す。)とバッファ・ナンバ(同じストリームタイプをも
つストリームが複数種ある時、夫々に付けられる番号)
からなる。),「パケット長」,「PESヘッダ長」,
「PTS(再生出力の時刻管理情報)」,「DTS(復
号の時刻管理情報)」等の情報が記述される。更に、字
幕に関しては、「PTS」とともに「表示終了時刻」の
情報が記述される。同様に、上述したPESパケット・
レイヤのデータ構造のパケット・ヘッダの情報項目の
内、これらが決定されると、他の情報項目は基本的には
システムの仕様により一義的に決定される。
【0094】(参照画像位置情報生成器)参照位置情報
生成器29は、スケジューリング器23から出力される
スケジュールデータ28であるパック情報ファイル25
及びパケット情報ファイル27を読み込み、参照画像位
置情報32を生成する。参照画像位置情報32は、多重
ビットストリームを構成する全てのパック毎に挿入する
情報で、上述のPSI(プログラム仕様情報)であり、
参照画像位置情報ファイルも中間ファイルの1つであ
る。この参照画像位置情報ファイルは、PSD(プログ
ラム・ストリーム・ディレクトリ)情報ファイル33
と、PSM(プログラム・ストリーム・マップ)情報フ
ァイル35とからなる。PSD情報ファイル33は、上
述のPSDパケット生成に関する情報である。同様に、
PSM情報ファイル33は、上述のPSMパケット生成
に関する情報である。これにより、基本的に、PSDパ
ケット及びPSMパケットが決定される。
【0095】(多重ビットストリーム生成器)多重ビッ
トストリーム生成器37は、ビデオ,オーディオ,字幕
データ等の各符号化装置3,5,7で生成された各エレ
メンタリー・ストリームのファイル9,13,17を、
多重化スケジューリング器23で生成されたスケジュー
ルデータの中間ファイルであるパック情報ファイル25
及びパケット情報ファイル27と、参照画像位置情報生
成器29で生成されたで中間ファイルであるPSD情報
ファイル33及びPSM情報ファイル35とを用いて組
み合わせ、1本の多重ビットストリームを生成する。
【0096】なお、PSMパケットには、エレメンタリ
ー・ストリームの説明を与える記述や、例えば想定して
いるトラックの先頭アドレスやそれ以外に様々な情報を
記述できるが、そのために必要情報を多重ビットストリ
ーム生成器37に入力する必要があることを承知された
い。
【0097】実施例1の動作をまとめて述べると、符号
化処理では、符号化を行いエレメンタリー・ストリーム
をファイル9,13,17として生成すると共にその後
段の多重化のスケジューリングに必要となるアクセス・
ユニットのサイズ,DTS(decoding time stamp 、復
号の時刻管理情報),またビデオの場合はPTS(pres
entation time stamp 、生出力の時刻管理情報)等の情
報を中間ファイル11,15,19として生成する。
【0098】符号化処理段階が終わった後、多重化装置
21のスケジューリング器23はビデオや音声や文字の
各エレメンタリー・ストリームのアクセス・ユニット情
報の中間ファイル11,15,19からスケジューリン
グ処理を行い、その多重ビットストリームを構成するパ
ックやパケットのスケジュールデータ28の中間ファイ
ル25,27を生成する。
【0099】スケジュールデータ28の中間ファイル2
5,27から参照画像位置情報生成器29が、多重ビッ
トストリームの全てのパックにおかれているPSD,P
SMに記述される参照画像位置情報を中間ファイル3
3,35として生成する。
【0100】多重ビットストリーム生成器37は、これ
ら中間ファイル25,27,33,35の情報に基づ
き、パック,PESパケット,PSDパケット,PSM
パケットに情報を記述しながら、各エレメンタリ・スト
リームを所定の順序で組み合わせて時分割多重化処理を
行う。
【0101】実施例1によれば、各符号化装置でエレメ
ンタリ・ストリーム自体だけでなく、その全アクセス・
ユニットの情報を符号化付随情報ファイルとして別個に
生成することにより、多重化装置側では各エレメンタリ
・ストリームの解析をすることなく、アクセス・ユニッ
ト情報の中間ファイルからスケジューリング処理を行う
ことが出来る。
【0102】従って、多数のエレメンタリー・ストリー
ムを多重化する場合であっても、各符号化付随情報ファ
イルに個々のエレメンタリー・ストリームの先頭から最
後までのアクセス・ユニット情報が蓄積されているの
で、符号化付随情報ファイルのみでスケジューリング処
理が可能になり、スケジューリングが非常に容易にな
る。
【0103】〔実施例2〕次に、符号化装置で符号化し
たエレメンタリー・ストリームと、そのアクセス・ユニ
ットのサイズ,DTS,PTSを記述した符号化付随情
報を、夫々のファイルとして管理することにより、最初
の符号化のみで、それらのファイルを用いてその後は符
号化を繰り返さずに、所望により何度でも多重化のみを
行い多重ビットストリームを生成することが出来ること
になる。
【0104】図3に示すシステムは、1つのビデオ素材
に対して、オーディオソース信号として日本語音声と英
語音声がある場合を示している。最初に、ビデオと日本
語の音声と英語の音声の多重ビットストリームを作る。
その後に、必要に応じて、映像と日本語音声のみの多重
ビットストリームを作成したり、或いは映像と英語音声
のみの多重ビットストリームを作成する場合を示してい
る。
【0105】図3に示す本実施例2にかかるオーサリン
グシステムのシステム構成図を示す図である。このオー
サリングシステムは、符号化装置1′と、2個の音声多
重化装置21-1,21-2とを備えている。
【0106】符号化装置1′は、ビデオ符号化装3と、
音声符号化装置41,43とを有している。
【0107】ビデオ符号化装置3に対してディジタル形
式のビデオソース信号が入力され、ビデオ符号化装置3
はこのビデオソース信号を例えばMPEG2システムを
利用して圧縮符号化する。このビデオ圧縮データはエレ
メンタリー・ストリームとして、ハードディスク等の蓄
積メディアに蓄積され、ビデオ・エレメンタリー・スト
リーム・ファイル9が生成される。
【0108】同時に、符号化工程で得られる符号化付随
情報が、ハードディスク等の記録メディアに蓄積され、
符号化付随情報ファイル11が生成される。符号化付随
情報は、後段の分離装置で多重ビットストリームから個
別のストリーム部分を分離する分離装置で必要とされる
情報であり、アクセス・ユニットのサイズ,DTS,ま
た特にビデオではPTSからなる。
【0109】音声符号化装置41に対してディジタル形
式の日本語音声ソース信号が入力され、音声符号化装置
41はこの日本語音声ソース信号をMPEGオーディオ
システムを利用して圧縮符号化する。この日本語音声圧
縮データはエレメンタリー・ストリーム(素ビット列)
として、ハードディスク等の蓄積メディアに蓄積され、
オーディオ・エレメンタリー・ストリーム・ファイル4
5が生成される。
【0110】同時に、符号化工程で得られる符号化付随
情報が、ハードディスク等の記録メディアに蓄積され、
符号化付随情報ファイル47が生成される。
【0111】音声符号化装置43に対してディジタル形
式の英語音声ソース信号が入力され、音声符号化装置4
3はこの英語音声ソース信号をMPEGオーディオシス
テムを利用して圧縮符号化する。この英語音声圧縮デー
タはエレメンタリー・ストリーム(素ビット列)とし
て、ハードディスク等の蓄積メディアに蓄積され、字幕
・エレメンタリー・ストリーム・ファイル49が生成さ
れる。
【0112】同時に、符号化工程で得られる符号化付随
情報が、ハードディスク等の記録メディアに蓄積され、
符号化付随情報ファイル51が生成される。
【0113】以上は例示であり、日本語音声,英語音声
の他に他の言語による吹き替え、更に他の言語による字
幕ソース信号等も用意できる。この場合、各個別ソース
信号に符号化器を用意し、各エレメンタリー・ストリー
ム及び符号化付随情報のファイルを生成する。以下、説
明を簡単にするため、図に示すビデオ,日本語音声,英
語音声に関して説明する。
【0114】多重化装置21-1と21-2は、実施例1の
多重化装置21と実質的に同じである。多重化装置21
-1は、これら全ての情報を多重化し、映像・日本語音声
・英語音声の多重ビットストリームを生成する。即ち、
多重化装置21-1は、スケジューリング器,参照画像位
置情報生成器及び多重ビットストリーム生成器を有し、
スケジュールデータ及び参照画像位置情報を用いて、ビ
デオ・エレメンタリー・ストリーム,日本語エレメンタ
リー・ストリーム,英語エレメンタリー・ストリームを
多重化する。
【0115】これとは別に、ビデオと日本語音声のみの
多重ビットストリームを生成することも出来る。この場
合には、既に符号化済みの映像と、日本語音声のファイ
ルとを使用して、多重化装置23-2で多重化すれば良
い。この多重化装置23-2も、実施例1で説明した多重
化装置と実質的に同じものであり、即ち多重化装置21
-1の入力を選択的に変更することにより、多重化装置2
3-2とすることが出来る。
【0116】従って、多重化装置23-2もスケジューリ
ング器,参照画像位置情報生成器及び多重ビットストリ
ーム生成器を有し、スケジュールデータ及び参照画像位
置情報生成器を用いて、ビデオ・エレメンタリー・スト
リーム及び日本語エレメンタリー・ストリームを多重化
する。
【0117】このように、ここのエレメンタリー・スト
リームとアクセス・ユニット情報を中間ファイルとして
管理することにより、例えば1つの映画素材やビデオ素
材に対する複数のオーディオ,複数の言語による吹き替
え,複数の言語による字幕等を予め符号化して、各エレ
メンタリ・ストリームファイルと共に各符号化付随情報
ファイルを生成しておくことにより、後で任意の組み合
わせにより多重ビットストリームを生成することが出来
る。符号化処理の重複を避けることが出来、全体とし
て、非常に効率的になる。
【0118】
【発明の効果】本発明によれば、多数の個別データを効
率良く多重化するオーサリングシステムを提供すること
が出来る。
【0119】更に本発明によれば、このようなオーサリ
ングシステムに使用される符号化手段と、多重化手段を
提供することが出来る。
【図面の簡単な説明】
【図1】本実施例が準用しているMPEG2−PSのパ
ック(上位)レイヤのデータ構造を説明する図である。
【図2】本実施例が準用しているMPEG2−PSのP
ESパケット(下位)・レイヤのデータ構造を説明する
図である。
【図3】本実施例が参照画像位置情報ファイルとして使
用するMPEG2−PSのPSMパケット及びPSDパ
ケットのデータ構造を説明する図である。
【図4】実施例1にかかるオーサリングシステムの構成
を示す図である。
【図5】実施例2にかかるオーサリングシステムの構成
を示す図である。
【図6】本実施例に関連するMPEGシステムの基本シ
ステムの構成を説明する図である。
【図7】MPEG2−PSの基準復号器を説明する図で
ある。
【図8】ビデオ及びオーディオ情報のパケットによる多
重化の状態並びにパックによるパケットのグループ化を
説明する図である。
【図9】復号装置のSTDバッファのデータ蓄積状態及
び読み出しタイミングを説明する図である。
【図10】従来技術のリアルタイム・オーサリング・シ
ステムの構成を示す図である。
【符号の説明】
1,1′符号化装置 3 ビデオ符号器 5 オーディオ符号器 9,13,17 エレメンタリー・ストリーム・ファイ
ル 11,15,19, 47,51 符号化付随情報ファイ
ル 21,21-1,21-2 多重化装置(MUX) 23 スケジューリング器 25 パック情報 27 パケット情報 29 参照画像位置情報生成器 33 PSD情報ファイル 35 PSM情報ファイル 37 多重ビットストリーム生成器 51 蓄積メディア 55 分離装置(DMUX) 57′,59′ STDバッファ 57 ビデオ・デコーダ(復号器) 59 オーディオ・デコーダ(復号器) 60 復号装置 61 システム・デコーダ 63 ピクチャ遅延メモリ 65,67 バッファメモリ 69 多重化回路
───────────────────────────────────────────────────── フロントページの続き (72)発明者 田原 勝己 東京都品川区北品川6丁目7番35号 ソ ニー株式会社内 (56)参考文献 特開 平5−236009(JP,A) 特開 平5−236466(JP,A) 特開 平6−252876(JP,A) 特開 平6−343065(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04J 3/00 H04N 7/025 H04N 7/03 H04N 7/035 H04N 7/24

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】 ディジタル符号化標準に沿って、複数の
    個別ソース信号を夫々符号化して得られた各エレメンタ
    リー・ストリームとその他のディジタル信号列とを多重
    化して多重ビットストリームを生成するオーサリングシ
    ステムにおいて、 前記符号化時に各エレメンタリー・ストリームをファイ
    ルとして夫々生成すると同時に符号化付随情報を中間フ
    ァイルとして夫々生成する符号化装置と、 前記各エレメンタリー・ストリームのファイルと前記中
    間ファイルとから、前記エレメンタリー・ストリームを
    分析することなしに多重化のスケジューリングを行って
    多重ビットストリームを生成する多重化装置とを備えた
    オーサリングシステム。
  2. 【請求項2】 請求項1に記載のオーサリングシステム
    において、 前記ディジタル符号化標準は、動画像に関してはMPE
    G2システムであり、オーディオに関してはMPEGオ
    ーディオであるオーサリングシステム。
  3. 【請求項3】 請求項1に記載のオーサリングシステム
    において、 前記符号化装置は、少なくともビデオソース信号を受け
    取りこれを符号化して、ビデオデータのエレメンタリー
    ・ストリームのファイル及び符号化付随情報の中間ファ
    イルを生成するビデオ符号化器と、 複数のオーディオソース信号を夫々受け取ってこれを符
    号化して、各々のオーディオデータのエレメンタリー・
    ストリームのファイル及び符号化付随情報の中間ファイ
    ルを生成する複数個のオーディオ符号化器とを有するオ
    ーサリングシステム。
  4. 【請求項4】 請求項3に記載のオーサリングシステム
    において、 前記符号化装置は、更に少なくとも1つの字幕ソース信
    号を受け取ってこれを符号化して、字幕データのエレメ
    ンタリー・ストリームのファイル及び符号化付随情報の
    中間ファイルを生成する字幕符号化器とを有するオーサ
    リングシステム。
  5. 【請求項5】 請求項1に記載のオーサリングシステム
    において、 前記多重化装置は、スケジューリング器と、参照画像位
    置情報生成器と、多重ビットストリーム生成器とを有
    し、 前記スケジューリング器は、多重化を行う各エレメンタ
    リー・ストリームのスケジューリングを行いその結果を
    スケジュールデータの中間ファイルとして生成し、 前記参照画像位置情報生成器は、前記スケジュールデー
    タの中間ファイルから多重ビットストリームを構成する
    全てのパック毎に挿入する参照画像位置情報の中間ファ
    イルを生成し、 前記多重ビットストリーム生成器は、前記スケジュール
    データの中間ファイル及び前記参照画像位置情報の中間
    ファイルの情報に基づき各エレメンタリー・ストリーム
    から多重ビットストリームを生成するオーサリングシス
    テム。
  6. 【請求項6】 請求項5に記載のオーサリングシステム
    において、 前記符号化付随情報の中間ファイルに、少なくとも多重
    化の最小単位であるアクセス・ユニット毎のサイズ,D
    TS及びPTSが記述されているオーサリングシステ
    ム。
  7. 【請求項7】 少なくともビデオソース信号,オーディ
    オソース信号を含む複数の個別ソース信号を、ディジタ
    ル動画像符号化標準に沿って夫々符号化して得られた各
    エレメンタリー・ストリームを多重化して多重ビットス
    トリームを生成するオーサリングシステムで使用される
    符号化装置において、 前記複数の個別信号を夫々符号化する複数の符号化器を
    有し、各々の該符号化器は個別信号を圧縮符号化してエ
    レメンタリー・ストリームのファイルを生成すると共
    に、対応する符号化付随情報のファイルを生成する符号
    化装置。
  8. 【請求項8】 少なくともビデオ信号,オーディオ信号
    を含む複数の個別信号を夫々符号化して得られた各エレ
    メンタリー・ストリームを多重化してディジタル動画像
    符号化標準に沿って多重ビットストリームを生成するオ
    ーサリングシステムで使用される多重化装置において、 多重化を行う各エレメンタリー・ストリームのスケジュ
    ーリングを行いスケジュールデータの中間ファイルを生
    成するスケジューリング器と、 前記スケジュールデータの中間ファイルから参照画像位
    置情報の中間ファイルを生成する参照画像位置情報生成
    器と、 前記参照画像位置情報の中間ファイル及び前記スケジュ
    ールデータの中間ファイルの情報に基づき各エレメンタ
    リー・ストリームから多重ビットストリームを生成する
    ビットストリーム生成器とを備えた多重化装置。
  9. 【請求項9】 個別ストリームを夫々符号化し、各符号
    化ビットストリームを多重化して多重ビットストリーム
    を生成するオーサリングシステムにおいて、該オーサリ
    ングシステムは符号化装置及び多重化装置を備え、 前記符号化装置は、符号化時にエレメンタリー・ストリ
    ームをファイルとして生成すると同時に符号化付随情報
    を中間ファイルとして生成し、 前記多重化装置は、多重化スケジューリング器,参照画
    像位置情報生成器及び多重ビットストリーム生成器とを
    有し、 前記多重化スケジューリング器は、前記符号化付随情報
    の中間ファイルから、前記エレメンタリー・ストリーム
    を分析することなしに、多重化のスケジュールデータを
    中間ファイルとして生成し、 前記参照画像位置情報生成器は、前記スケジュールデー
    タの中間ファイルから参照画像位置情報を生成し、 前記多重ビットストリーム生成器は、該参照位置情報の
    中間ファイル,前記スケジュールデータの中間ファイル
    及び各エレメンタリー・ストリームから多重ビットスト
    リームを生成するオーサリングシステム。
  10. 【請求項10】 ビデオソース信号,オーディオソース
    信号,字幕ソース信号を含む複数の個別ソース信号を夫
    々符号化して得られた各々のエレメンタリー・ストリー
    ムとその他のディジタル信号列とを多重化して多重ビッ
    トストリームを生成する方法において、 前記符号化する段階において、各々のエレメンタリー・
    ストリームのファイルを生成すると同時に夫々の符号化
    付随情報を中間ファイルとして生成し、 前記多重化する段階において、前記中間ファイルを取り
    込むことにより、前記エレメンタリー・ストリームを分
    析することなしに多重化スケジューリングを行って多重
    化する、多重ビットストリームを生成する方法。
  11. 【請求項11】 請求項10に記載の多重ビットストリ
    ームを生成する方法において、 前記多重化する段階は、スケジューリングする段階,参
    照画像位置情報を生成する段階及び多重ビットストリー
    ム生成する段階を有し、 前記スケジューリングする段階は、前記符号化付随情報
    の中間ファイルに基づき各エレメンタリー・ストリーム
    のスケジューリングを行いその結果をスケジュールデー
    タの中間ファイルとして生成し、 前記参照画像位置情報を生成する段階は、前記スケジュ
    ールデータの中間ファイルから多重ビットストリームを
    構成する全てのパック毎に挿入する参照画像位置情報の
    中間ファイルを生成し、 前記多重ビットストリームを生成する段階は、前記スケ
    ジュールデータの中間ファイル及び前記参照画像位置情
    報の中間ファイルの情報に基づき各エレメンタリー・ス
    トリームから多重ビットストリームを生成する多重ビッ
    トストリームを生成する方法。
  12. 【請求項12】 請求項11に記載の多重ビットストリ
    ームを生成する方法において、 前記符号化付随情報の中間ファイルに、少なくとも多重
    化の最小単位であるアクセス・ユニット毎のサイズ,D
    TS及びPTSが記述される多重ビットストリームを生
    成する方法。
JP32481795A 1995-12-13 1995-12-13 オーサリングシステム,このシステムで使用される符号化装置及び多重化装置並びに多重ビットストリームを生成する方法 Expired - Fee Related JP3536493B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32481795A JP3536493B2 (ja) 1995-12-13 1995-12-13 オーサリングシステム,このシステムで使用される符号化装置及び多重化装置並びに多重ビットストリームを生成する方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32481795A JP3536493B2 (ja) 1995-12-13 1995-12-13 オーサリングシステム,このシステムで使用される符号化装置及び多重化装置並びに多重ビットストリームを生成する方法

Publications (2)

Publication Number Publication Date
JPH09162830A JPH09162830A (ja) 1997-06-20
JP3536493B2 true JP3536493B2 (ja) 2004-06-07

Family

ID=18170009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32481795A Expired - Fee Related JP3536493B2 (ja) 1995-12-13 1995-12-13 オーサリングシステム,このシステムで使用される符号化装置及び多重化装置並びに多重ビットストリームを生成する方法

Country Status (1)

Country Link
JP (1) JP3536493B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3185863B2 (ja) 1997-09-22 2001-07-11 日本電気株式会社 データ多重化方法および装置
JP2002159004A (ja) * 2000-04-21 2002-05-31 Sony Corp 符号化装置および方法、記録媒体、並びにプログラム
KR100806432B1 (ko) * 2000-04-21 2008-02-21 소니 가부시끼 가이샤 정보 처리 장치 및 방법, 프로그램과 기록 매체
JP4538908B2 (ja) * 2000-06-14 2010-09-08 ソニー株式会社 データ変換装置及び方法

Also Published As

Publication number Publication date
JPH09162830A (ja) 1997-06-20

Similar Documents

Publication Publication Date Title
US8218582B2 (en) Method and apparatus for generating information signal to be recorded
US8886010B2 (en) Apparatus and method for decoding data for providing browsable slide show, and data storage medium therefor
US8233776B2 (en) After-recording apparatus
US8233780B2 (en) Reproducing apparatus and method, and recording medium
JP5052763B2 (ja) 映像データの記録された情報貯蔵媒体、その記録方法、記録装置、再生方法及び再生装置
US20070211718A1 (en) Method of and apparatus for converting data stream format and method of and apparatus for recording data stream using the method and apparatus
US20020034144A1 (en) Recording apparatus
JP3536493B2 (ja) オーサリングシステム,このシステムで使用される符号化装置及び多重化装置並びに多重ビットストリームを生成する方法
CA2490879C (en) Reproducing apparatus and method, and recording medium
JPH0950673A (ja) データ符号化装置および方法、データ記録媒体並びにデータ復号化装置および方法
KR0181082B1 (ko) 엠펙 시스템의 피티에스 부호화장치
JP3531324B2 (ja) 符号化・多重化装置,多重化前処理装置及び符号化・多重化方法
CA2725179C (en) Reproducing apparatus and method, and recording medium
KR100336501B1 (ko) 엠펙-1 멀티미디어 스트림에의 텍스트 자료 동기화 방법과 이를 지원하는 엠펙-1 디코더
JP2003274337A (ja) データ記録装置、データ再生装置、データ記録再生装置及びデータ記録方法
JP2005260979A (ja) アフレコ信号伝送方法
JP2005245006A (ja) アフレコ信号再生装置
JP2005260978A (ja) アフレコ信号生成用プログラム
JP2005198347A (ja) アフレコ信号生成方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040308

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080326

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090326

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100326

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100326

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110326

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140326

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees