JP2001128126A

JP2001128126A - エンコードされたビデオビットストリームのセクションを交換するための方法及びシステム

Info

Publication number: JP2001128126A
Application number: JP2000278022A
Authority: JP
Inventors: Jay Yogeshwar; ジェイ・ヨーグシュウォー; Sheau-Bao Ng; − バオ・ンシャウ; Teiichi Ichigawa; 偵一伊知川; Hiroaki Unno; 裕明海野; Hidenori Mimura; 英紀三村; Tetsuya Kitamura; 哲也北村; J Cookson Christopher; クリストファー・ジェイ・クックソン; Greg B Thagard; グレッグ・ビー・サガード; Andrew Drusin Rosen; アンドリュー・ドルージン・ローゼン
Original assignee: Toshiba Corp; Time Warner Entertainment Co LP
Current assignee: Toshiba Corp; Time Warner Cable Enterprises LLC
Priority date: 1995-07-13
Filing date: 2000-09-13
Publication date: 2001-05-11
Anticipated expiration: 2016-04-19
Also published as: AU5552096A; WO1997003443A1; JP3445278B2; JP4430580B2; US6026232A; AU707082B2; CA2202171C; US6219043B1; JPH11500592A; KR100287656B1; CA2202171A1; EP0839374A1; EP0839374A4; JP3842537B2; JP2005318645A

Abstract

(57)【要約】【課題】編集したときに画質を劣化させないようにす
る。【解決手段】エンコードビデオのセクションを除去す
るため、エンコードされたビットストリーム内の始点及
び終点を決定する。エンコードデータの始点及び終点ア
ドレスは、各ピクチャーで消費されたビット、各ピクチ
ャーのシーケンスヘッダーのビット数、各ピクチャーグ
ループ（GOP）ヘッダーのビット数、及び全スタッフビ
ットを加算するで計算される。挿入されるビデオをエン
コードするため、無関係な信号成分のデコードを防ぐ処
理が実行される。この処理は編集ポイント前の最終ピク
チャーを判断し、編集ポイント後のフレームに関する参
照フレームとしてその最終ピクチャーを使用することで
行われる。更に最初の量子化値でエンコードされた最初
のビデオの短期間が、置き換えビデオの終わりに含まれ
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】まず、関連出願について述べ
る。

【０００２】本願は、1995年5月8日に提出された「エン
コードされたビデオビットストリームのセクションを交
換するための方法およびシステム」と題する米国特許明
細書連続番号08/438,014に関連している。本願は又、
「オーディオエンコーダの数が低減されるオーディオ映
像エンコードシステム」と題する米国特許明細書連続番
号08/467,991、「既にエンコードされたビデオフレーム
の品質を手動で変えるための方法およびシステム」と題
する明細書連続番号08/466,391、「ユーザが既にエンコ
ードされたビデオフレームの品質を手動で変えるための
方法およびシステム」と題する米国特許明細書連続番号
08/469,370、「量子化レベルを変化させることにより、
ビデオエンコーダのビット割当てを制御するレート制御
式デジタルビデオ編集法およびシステム」と題する米国
特許明細書連続番号08/466,766、および「レート量子化
モデルを使用しエンコードするビデオエンコード方法お
よびシステム」と題する米国特許明細書連続番号08/47
3,783に関連し、これらの特許明細書は共に1995年6月6
日に提出され、本明細書に参考として取り入れられてい
る。

【０００３】本発明はエンコードされたビットストリー
ムセクションが新たなセクションに置き換えられるエン
コードシステムに関し、特にエンコードされたビデオセ
クションがデコード副成分(decoding artifacts)を減少
するように置き換えられるビデオエンコードシステムに
関する。

【０００４】

【従来の技術】圧縮法が利用できるようになる前は、オ
ーディオ、ビデオ、及びフィルムは単にオーディオ、ビ
デオ、及びフィルムのセクションすなわち一部を切り取
り、必要に応じてそのセクションを新たな又は代替えの
セクションに置き換えることにより編集が行われてい
た。しかし、データをエンコードする圧縮法が用いられ
るようになると、単純な「カット及び貼り付け」編集
は、ビデオフレームを構成するのに用いられる情報とし
て不可能となった。従ってエンコードされたビデオセク
ションを単純に切り取ることは、変更されていないビデ
オセクションを劣化させることがあり、新たなビデオが
すでにエンコードされたビットストリームに単純に挿入
されると、デコード副成分を含むことがある。

【０００５】MPEGビデオエンコードにおいてこの問題を
解決するために、以前のビデオ内に置き換えられる新た
なビデオセクションを閉じたピクチャのグループ（GO
P：group of pictures）としてラベル付けする方法が
ある。MPEGエンコードにおいて、閉じたピクチャのグル
ープは、第１のコード化されたＩフレーム直後のＢタイ
プフレーム内に用いられる予測が、後方予測のみを使用
することを示す。または、MPEGは「broken_link」と呼
ばれるフラッグの使用を可能とする。このフラッグは設
定されたとき、第１のコード化されたＩフレーム直後の
第１のＢフレームが、予測に用いられる参照フレームを
利用できないために、正しくデコードされないことがあ
るということを示す。そのデコーダは正しくデコードで
きないフレームの表示を防ぐためにこのフラグを用い
る。

【０００６】

【発明が解決しようとする課題】上記解決策は、エンコ
ードされたビデオを劣化させ、品質の低いビデオを提供
することがある。

【０００７】そこで本発明は、すでにエンコードされた
データセクションが、エンコードされた他のデータセク
ションに置き換えられるシステムであって、目にみえる
デコード副成分の少ないまたは無い新規な方法および装
置を提供することを目的としている。

【０００８】また本発明の目的は、置き換えるべきエン
コードされたビデオセクションが、既にエンコードされ
たビデオ内にエラーすなわちビデオデコード副成分を含
めないように、エンコードされた他のビデオセクション
と置き換えられるビデオエンコードシステムを提供する
ことである。

【０００９】更に本発明は情報を新規で有用な方法で格
納するデータ構造を有するメモリを提供することを目的
とする。

【００１０】

【課題を解決するための手段】上記及び他の目的はエン
コードされたビットストリームのセクションを置き換え
る新規な方法およびシステムにより達成される。エンコ
ードされたビデオのセクションを取り除くために、デジ
タル的にエンコードされたビットストリーム内で、エン
コードされたビデオの始点および終点を判断する必要が
ある。これは、目的の画面に対するビットオフセットを
判断するために既にエンコードされた各フレームに用い
られたビットの数を加算することにより行われる。他の
方法としてエンコードされたビットストリーム内の特定
フレームの正確な位置又は時間を示す情報を維持するた
めにディレクトリを用いることができる。

【００１１】オリジナルビデオの例えば第２セクション
の１／２である１つのGOPの第１セクションは、エンコ
ードされる新たなビデオの始点に位置し、次のGOPの最
初の２つのＢフレームを正しくエンコード及びデコード
するのに必要な切断点の前のGOPの最後のＰフレームを
生成するために用いられる。この短い初期セクションか
らのエンコードされたデータは、すでにエンコードされ
たデータ内で置換されることはなく、スタート点後の最
初の２つのＢフレームにより参照される参照フレーム
（最後のＰフレーム）を生成するためにのみ利用され
る。

【００１２】又、前記オリジナルビデオの短いセクショ
ンはビデオの終点に位置し、最初にエンコードされたと
きに用いられた量子化値を用いてエンコードされる。GO
P内のエンコードされたビデオのフレームは既にエンコ
ードされたフレームに戻って参照されるので、最初のエ
ンコードのフレームが前記終点直前のビデオの新たなフ
レームに戻って参照されると、デコードに関する突然の
不具合が発生することがある。従って、オリジナルビデ
オがオリジナルフレームに同等なフレームに戻って参照
されるのが望ましい。オリジナルビデオの１／２が編集
セグメントの始点で再びエンコードされるが、これは本
質的なものではない。

【００１３】他の方法として、置換ビデオ内のフレーム
が置換ビデオの外側のフレームに依存しないように、置
換ビデオは周知の閉じたピクチャのグループモードを用
いてエンコードされる。この方法の新規な特徴は、予備
ビットが双方向フレームに割り当てられ、Ｂフレームの
ビット数がＰフレームに用いられるビット数の概算値を
示すように、この双方向フレームは閉じたGOPモードの
ために単一方向予測のみを有することである。この方法
では、閉じたGOPモードは大きなデコード副成分をＢフ
レームに含まず、ＢフレームはほぼＰフレームと同一の
品質を有する。

【００１４】デジタル格納媒体に格納されたエンコード
されたビデオも本発明の一部を構成する。本発明は又、
新規で有用なデータ構造を格納するメモリを含む。この
メモリは好適な光ディスクである。

【００１５】

【発明の実施の形態】以下、この発明の実施の形態を説
明する。

【００１６】本発明は、複数の構成要素および機能を備
えるデジタルビデオエンコードシステムである。システ
ムのさまざまな構成要素をさらに容易に識別する目的
で、本明細書は、以下に示す項に編成されている。Ｉ. はじめに II. システム構成要素 III. 汎用システム動作 IV. システム代替策 V. 最適エンコード効率を維持しながらオーディオエン
コーダの数を低減する VI. エンコードされたビデオの情報を記憶するための
ログファイル、ならびにログファイルおよびエンコード
されたビデオにアクセスするためのログインタプリタユ
ーティリティ VII. エンコードされたビデオの品質の変更 A. 期間での品質の変更 B. フレームの領域内での品質の変更 VIII. 品質変更後のビデオの再エンコード A. 品質が単独フレーム内で変更された場合のビット割
当て制御 B. 編集ポイントでのデコードを回避しながら再エンコ
ードする 1. 最初にエンコードしたときに使用された状態にエン
コーダを復元する 2. ピクチャのグループのクローズモードでの再エンコ
ード IX. エンコードに使用されるレート量子化モデリング X. データ構造を使用して、オーディオ、ビデオ、およ
びサブピクチャのデジタル信号を結合する I. はじめに開示されたシステムは、デジタル圧縮システムとしても
知られるデジタルオーディオ映像エンコードシステムに
関する。本明細書に開示される考えは、あらゆる種類の
エンコードスキームで使用可能で、特に、正式にはISO/
IEC 13818-2、MPEG-2システム情報を指定するISO/IEC 1
3818-1、およびMPEG-2の前身であるMPEG-1（ISO/IEC 11
172-ビデオ）として知られるMPEG-2（エムペグ：Moving
PictureExperts Group）に適用できる。本明細書で
は、MPEG-1およびMPEG-2は集合的に「MPEG」と呼ばれ
る。MPEG規格は、圧縮されたまたはエンコードされたビ
デオストリームの構文だけを指定しているが、圧縮をど
のように実行するかは指定していない。MPEGエンコード
されたデータストリームは圧縮済みのデータストリーム
であるため、エンコードプロセスは圧縮プロセスと呼ぶ
ことができるし、その逆も可能であることに注意すべき
である。また、システムはドルビー（登録商標）AC-3を
使用して実行できるオーディオのエンコード、つまりIS
O/IEC 13818-3に定義されるMPEG-2規格にも関する。前
記規格のそれぞれが、それらを参照することにより本明
細書の一部をなすものとする。

【００１７】MPEGビデオ圧縮は、時間的な因果関係の予
測圧縮である。MPEGエンコーダは新しいビデオピクチャ
を受け取ると、新しいビデオピクチャを、エンコーダが
既にエンコードされたピクチャに基づいて作成した予測
されたピクチャと比較する。予測が以前に伝送された情
報に基づいて立てられるために「因果関係(causal)」予
測コーディングという用語が使用され、予測が時間的な
ピクチャ単位で実行されるために、「時間的(tempora
l)」因果予測コーディングという用語が使用される。予
測手順には、ビデオピクチャ内での領域の運動の予測が
必要である。したがって、時間的予測は、動き補償予測
と呼ばれることもある。

【００１８】旧ピクチャと新ピクチャの比較の結果は、
後のビデオピクチャに格納される新しい情報を表す。そ
れから、「残留情報(residual information)」と呼ばれ
る新しい情報は、一連の情報圧縮プロセスを受けること
となる。まず、離散コサイン変換(DCT)と呼ばれる一次
数学変換が実行される。DCT演算により、ピクセル残留
情報が係数の列に変換される。MPEG圧縮においては、DC
Tは8x8ピクセルから成るブロックで実行される。同様
に、DCT係数も8x8配列数内に入れられる。その後、これ
らの係数は、量子化ステップサイズつまりq-レベルに基
づき、精度の設定された程度まで個別に量子化される
（すなわち四捨五入される）。量子化プロセスは、通
常、値ゼロが設定された多くの係数を生み出す。さもな
ければ、この量子化プロセスは、量子化雑音と呼ばれる
コーディング構造が生じさせることとなる。

【００１９】量子化された係数は、その後、ゼロ値が設
定された係数でのランレングスコーディング、およびそ
れぞれが結果として生じるランレングス値とゼロ以外の
係数値をそれぞれ表す2つの数の組の可変長コーディン
グの組み合わせを使用してコーディングされる。これら
のランレングス非ゼロ値の組のコードは、他のオーバヘ
ッド情報とともに、ビデオピクチャに対応する圧縮済み
デジタルデータストリームを形成する。出力データ転送
レートや記憶容量のような物理的な制限のために、適切
な量の圧縮が達成されるように、量子化の程度を変化さ
せることが必要である。これがバッファフィードバック
と呼ばれる。

【００２０】MPEGに準拠するデコーダは、エンコードさ
れたのデジタルデータストリームを読み取り、エンコー
ドプロセスと逆の演算を実行する。

【００２１】一般的には、デジタルデータストリーム中
のビット総数は、実質上、ビデオピクチャを表すために
必要とされるビット総数を下回るため、圧縮が達成され
る。しかしながら、MPEGビデオコーディングによって例
証されるような圧縮が、決して歪みや人為構造(artifac
ts)を免れないことを認識することが重要である。前述
したように、圧縮人為構造の主要なソースは量子化プロ
セスである。

【００２２】開示されたシステムは、圧縮プロセスまた
はエンコードプロセスの間に量子化の程度を動的に調整
することを目的とする。特に、調整は人間のオペレータ
によって出される指示に従って行われる。調整は、より
大きなビデオシーケンスの部分に適用する場合もあれ
ば、ビデオシーケンス全体に適用することもある。 II. システム構成要素ここで、類似した参照番号が複数の図を通して同一の部
分または対応する部分を示し、さらに特定するとその図
1Aを示す図面を参照すると、エンコーダシステムアーキ
テクチャのブロック図が示されている。ビデオエンコー
ドプロセスとは、中断やエラーなくエンコードおよび編
集を達成するために同期して動作する多くの異なった装
置を必要とする1つの複雑なプロセスであることに注記
すべきである。しかし、オーディオエンコードおよびビ
デオエンコードは、適切なタイムコードが使用される限
り、別個に実行できる。図1Aには4つのワークステーシ
ョンが描かれているが、通常、エンコードシステムのユ
ーザまたはオペレータが対話するのは1台のキーボード
およびワークステーションだけである。ワークステーシ
ョンは、プロセッサ、RAM、ROM、ネットワークインタフ
ェース、ハードディスク、キーボード、モニタ、および
それ以外の従来の構成要素のような従来の汎用コンピュ
ータ構成要素を具備する。

【００２３】ワークステーション30は、実施例ではSun
SPARC20 Unixワークステーションであるシステム制御ス
テーションとして機能する。ワークステーション30に
は、マウスやそれ以外のポインティングデバイスである
キーボード32およびポインティンブデバイス33のような
従来のワークステーション入力装置だけではなく、グラ
フィックコンソールディスプレイモニタ31も具備され
る。ユーザは、おもに、コンソールディスプレイ31に表
示されるグラフィックユーザインタフェース(GUI)を介
してワークステーション30を視覚的に操作することとな
る。

【００２４】ワークステーション30は、以下に説明する
別のワークステーション40、10および20に接続され、そ
れらを制御する。ワークステーション30は、やはり以下
に説明するオーディオインタフェース装置72およびデジ
タルビデオキャプチャ記憶装置60にも接続される。ワー
クステーション30は、米国電子工業会(EIA)規格RS-232
によって定義される直列インタフェースを介してワーク
ステーション40に接続される。同様に、ワークステーシ
ョン30とオーディオインタフェース装置72の間の接続も
直列RS-232規格による。ワークステーション30とデジタ
ルビデオキャプチャ記憶装置60の間の接続は、業界規格
のS-バスインタフェースを介している。

【００２５】フレームジョガー41は、オペレータが、VT
R51または52どちらかのビデオを編集を実行しなければ
ならない箇所に位置決めできるようにするために、ワー
クステーション40に接続される。システムは、ビデオの
位置を制御するために、オペレータが入力するタイムコ
ードを使用することができる。ただし、ジョグ制御装置
は、ビデオを位置決めするためにジョブノブの使用を可
能にすることによって、システムのユーザフレンドリ度
を高めている。ワークステーション30は、ビデオディス
プレイモニタ61で表示されるビデオが、デジタルキャプ
チャ記憶装置60または録画VTR62、あるいはその両方か
らのビデオであるのかどうかを制御する。

【００２６】ビデオエンコード装置50は、MPEG-1、MPEG
-2、またはそれ以外のビデオ圧縮規格に従って圧縮を実
行するデジタルビデオエンコーダである。市販されてい
るMPEG-1エンコーダは、ソニー（登録商標）RTE-3000で
ある。MPEG-2エンコーダは、本明細書に参照により取り
入れられる1994年12月27日に出願された日本特許明細書
6-326435に説明される教示に従って構築することができ
る。ワークステーション10は、業界規格S-バスインタエ
ースを介してビデオエンコード装置50を直接的に制御
し、ワークステーション10は、イーサネット（登録商
標）ネットワークのような標準ネットワーキング装置を
介してワークステーション30からコマンドを受け取る。
エンコードプロセスの間、ワークステーション10は、ビ
デオエンコード装置50のビデオエンコード制御プログラ
ムのリアルタイム実行をサポートする。実施例において
は、ワークスステーション10は、Sun SPARC20 Unixワー
クステーションである。

【００２７】ワークステーション10は中央ワークステー
ション30からのコマンドに応え、圧縮プロセスを開始す
る。圧縮プロセスの間、ワークステーション10は、ビデ
オ信号の特定の領域に適用される量子化の程度を動的に
制御する。量子化が変化させられる特定の領域は、空間
的領域または時間的領域、あるいはその両方に及び、量
子化が厳密にどのように制御されるのかは以下に説明す
る。

【００２８】ビデオエンコード装置50への入力ビデオ
は、再生VTR 51内のテープからである。再生VTR51は、
職業用のデジタルビデオ規格、ITU-R 601（以前はCCIR
601ビデオ規格と呼ばれていた）ビデオテーププレーヤ
である。この規格は、PALシステムだけではなくNTSCシ
ステムにも適用する。再生VTR 51内のテープには、ビデ
オカメラまたはフィルムカメラによってキャプチャされ
たか、あるいはコンピュータによって作成されたさまざ
まな画像および場面を表す電磁情報が記憶されているこ
とが注記される。ビデオエンコード装置50からのエンコ
ードされた出力は、1つ以上のハードディスク21で記憶
するためにワークステーション20に転送される。

【００２９】ビデオエンコード装置50によりエンコード
および出力されたビデオデータを表示するためには、MP
EG-2のようなデジタルビデオデコーダが必要になる。し
かし、本明細書の作成時点では、実現されたシステム
は、このようなデコーダはシステムの初期開発段階の間
は容易に手に入らなかったため、別個のMPEG-2デコーダ
を実装していない。したがって、ビデオエンコード装置
50は、MPEG-2ビデオストリームをワークステーション20
に出力するだけではなく、MPEG-2のエンコードデータに
同等な復号化されたビデオ画像がビデオエンコード装置
50から録画VTR 52へ出力される。録画VTR 52は、D1イン
タフェースとして知られる業界規格のデジタルビデオ信
号コネクタによりビデオエンコード装置50に接続され、
ワークステーション40によって制御される。再生VTR 51
および録画VTR 52の両方共、AmpexDCT職業用ビデオテー
プレコーダを使用して適切に実現される。

【００３０】オーディオは、例えばドルビーAC-3フォー
マットまたは代わりにISO/IEC 13818-3規格に記述され
るようなMPEG-2に準拠するフォーマットにエンコードさ
れ、圧縮される。エンコードシステムのオーディオソー
スは、4つのデジタルオーディオテープ(DAT)プレーヤ、
71a、71b、71cおよび71dである。スタジオ品質のDATプ
レーヤは、ソニーが市販している。DATプレーヤ71a-71d
は、ワークステーション40によって業界規格プロトコル
RS-422を介して接続され、制御される。DATプレーヤ71a
-71dによって出力されるオーディオ信号は、オーディオ
エンコーダ70a、70b、70c、および70dにそれぞれ入力さ
れる。これらのオーディオエンコーダは市販のドルビー
AC-3モデルDP 525エンコーダを使用して実現され、オー
ディオインタフェース装置72によって制御される。通
常、オーディオエンコードは指定されたタイムコードで
開始、終了する。オーディオインタフェース装置72は、
ワークステーション30からその間のRS-232接続上でエン
コード開始タイムコードおよびエンコード終了タイムコ
ードのような命令を受け取る。さらに、オーディオイン
タフェース装置72は、さまざまなデジタル圧縮済みオー
ディオデータを、ワークステーション20に伝送される単
独デジタルストリームに多重化する。ワークステーショ
ン20は、オーディオエンコード装置70により出力される
圧縮済みデジタルデータに対応する複数のファイルに、
入力デジタルオーディオストリームを多重分離する。ビ
デオエンコード装置50は、そのビデオ同期信号に基づく
同期信号をオーディオインタフェース装置72に提供す
る。同期信号により、オーディオビットストリームは、
ビデオエンコード装置50により出力されるビデオビット
ストリームに同期できるようになる。

【００３１】ワークステーション30は、さまざまなオー
ディオエンコード装置70a-70dのどれかからオーディオ
デコーダ73へオーディオデータの複製を提供するように
オーディオインタフェース装置72に指示する機能を備え
る。オーディオデコーダ73は、圧縮済みのオーディオ
を、ユーザがスピーカ75を介してオーディオを聞くこと
ができるように復号化する。どのオーディオエンコード
装置をモニタするかについての選択は、キーボード32ま
たはポインティングデバイス33のどちらかによってコン
ソールディスプレイ31上でのグラフィックユーザインタ
フェースを通して人間のオペレータが決定する。オーデ
ィオインタフェース装置72の構成は、前述の機能を実行
する機能を備えたハードウェアである。このハードウェ
アは、1つ以上のプログラミングされたマイクロプロセ
ッサまたは開示された機能を達成するために配列される
従来の回路要素、あるいはその両方である。

【００３２】ワークステーション40はスタジオ装置制御
ステーションであり、録画ビデオテープレコーダ52とと
もに、再生ビデオテープレコーダ51およびデジタルオー
ディオテーププレーヤ71a-71dの両方を制御するために
適切なコマンドを発行する。また、ワークステーション
40は、デジタルビデオキャプチャ記憶装置60に、適切な
時点でビデオのキャプチャを開始するように命令する。
ワークステーション40とさまざまなビデオテープデッキ
およびオーディオテープデッキの間の接続は、業界規格
のRS-422プロトコルである。このプロトコルを使用する
と、各テープデッキはワークステーション40に、標準タ
イムコードフォーマットでその現在のテープロケーショ
ンを知らせることができるようになる。ワークステーシ
ョン40はこのような情報を使用して、ビデオとオーディ
オの情報が正しく、再生、記録されるように、さまざま
なテープデッキを適切に同期させる。この実施例では、
ワークステーション40は、DOSおよびカリフォルニア
州、モアパークにあるEditingTechnologies Corp.Ensem
ble Proが市販しているソフトウェアプログラムであるE
nsemble Proを実行する標準的なIBM互換パーソナルコン
ピュータである。ワークステーション30がRS-232通信ポ
ートを介してワークステーション40で実行しているEnse
mble Proと通信できるように、マイナーな改良をEnsemb
le Proプログラムに加えたことを注記する。この改良は
Editing Technologies, Corp.を介して市販されている
か、あるいは過度の実験を行わないでも当業者により実
行できるかのどちらかである。

【００３３】デジタルビデオキャプチャ記憶装置60は、
エンコードシステム内で、以下に示す2つの機能を行
う。第1に、この装置は、ビデオ信号に適用されてきた
手動編集の便利な「前と後」比較を行うためにそのキャ
プチャ記憶機能を使用し、第2に、ビデオディスプレイ
にグラフィックオーバレイ機能を提供する。このグラフ
ィックオーバレイ機能は、例えば、空間手動編集フェー
ズの間に使用され、人間のオペレータが、量子化および
その結果割り当てられたビットの数が変化する関心のあ
る領域を定義できるようにする。

【００３４】本発明では、デジタルビデオキャプチャ記
憶装置は、カリフォルニア州、マウンテンビューにある
Viewgraphicsの市販されているDRABMベースのオーディ
オ製品モデルVS6000として実現されている。この装置に
入力されるデジタルビデオは、ITU-R-601（旧CCIR 60
1）画像解像度を備える業界規格D1による。デジタルビ
デオキャプチャ記憶装置60の出力は、ビデオ信号の赤、
緑、および青の構成要素を表す3つの別個のアナログ信
号を介してビデオディスプレイに接続される。グラフィ
ックオーバレイ情報は、デジタルビデオキャプチャ記憶
装置60によって出力される最終アナログ信号の作成前
に、デジタルビデオキャプチャ記憶装置60により処理さ
れるため、他のビデオデータとともにビデオディスプレ
イモニタ61では人間のオペレータが見ることができる。

【００３５】Unix環境で動作しているワークステーショ
ン30は、デジタルビデオキャプチャ記憶装置60を使用す
るビデオディスプレイモニタ61の上にそのグラフィック
ウィンドウをマップする。これによって、人間のオペレ
ータは、モニタ61に示されるディスプレイのグラフィッ
クオーバレイ面で（矩形の描画のような）グラフィック
動作を実行できるようになる。装置60は、オーバレイ機
能を実現する。オーバレイは、メモリ内の情報をモニタ
を駆動するアナログビデオ信号に変換する前に、ビデオ
メモリで実行される。システムが使用するVS6000は、ビ
デオメモリの上部に8-ビットメモリを持つ。この8-ビッ
ト面で、コンピュータはあらゆるカラーグラフィックス
およびテキストを描画できる。この8-ビット面での
「色」の1つが透明色である。透明色であるこのオーバ
レイ面上の任意のピクセルは、その下にあるビデオメモ
リの値を採る。一般的には、オーバレイ面の大部分が透
明色になり、（線、テキストなどの）グラフィックは透
明以外の色を使用する。したがって、ビデオメモリおよ
びオーバレイグラフィックメモリの両方からなるディス
プレイメモリが形成される。モニタ61で表示するために
究極的にはアナログ信号に変換されるディスプレイメモ
リである。人間のオペレータは、通常、キーボード32と
結び付いたポインティングデバイス３３Ｗ使用し、この
ようなグラフィック動作およびこのようにして作成され
たグラフィックオブジェクトの操作を実行する。

【００３６】ワークステーション20は、オーディオイン
タフェース装置72だけではなくビデオエンコード装置50
からデジタルデータストリームを受け取る。ワークステ
ーション20は、イーサネット接続でワークステーション
30に接続され、ワークステーション20は、業界規格のS-
バスインタフェースを介してビデオエンコード装置50お
よびオーディオインタフェース装置72にも接続される。
受け取られたデジタルデータストリームは、別個のデー
タファイルとして1つ以上のハードディスクの中に記憶
される。別個のダイレクトメモリアクセス(DMA)カード
は、キャプチャされたデジタルストリームデータをハー
ドディスク21に転送するときに使用される。結果的に大
量のデジタルデータが生じる長いビデオシーケンスの場
合、ハードディスク21は、Sun Microsystems製のSPARCs
torage Array X655A/G5のような市販されているハード
ディスクを使用して実現できる。この実施例において
は、ワークステーション20は、Sun Microsystems製の市
販されているSPARKserver 1000である。

【００３７】また、ワークステーション20は、ビデオ圧
縮済みデータおよびオーディオ圧縮済みデータに対応す
るデータファイルも、復号化装置への移送または伝送に
適切な単独フォーマットファイルにフォーマットする。
最終的な媒体はディスクベースであるのが望ましく、そ
の場合フォーマットは、関連するディスクフォーマット
に準拠することになる。通常、フォーマットされたファ
イルは、デジタルテープのようななんらかの中間デジタ
ル記憶手段により、1つまたは複数の最終伝送媒体への
転送が発生する機構へ移送される。図示されているデジ
タル記憶装置22は、このような目的に使用される。本実
施例では、デジタル記憶装置22は、市販されている8 mm
Exabyteテープドライブを具備する。デジタル記憶装置
22のインタフェースは、業界規格の小型コンピュータ用
周辺機器インタフェース(SCSI)である。

【００３８】複数のSCSI装置を同じSCSIバスに接続でき
ることは既知である。したがって、デジタル記憶装置22
は、市販されているデジタルリニアテープ(DLT)ドライ
ブ、磁気光学(MO)ディスクドライブ、またはフロッピー
（登録商標）ディスクドライブのような他のSCSI装置も
具備できる。これらの構成は容易に対応され、フォーマ
ット段階の前またはフォーマット段階の間に必要となる
可能性がある補助データ用の柔軟な入力機構を提供する
のに役立つ。例えば、映画の製作では、字幕情報は、大
部分の場合、前記のSCSI装置の1つを必要とする媒体内
で利用できる。このような場合、補助データはワークス
テーション20で実行中のソフトウェアプログラムによっ
て読み取られ、補助データがフォーマットされたファイ
ルに格納されるように処理される。補助データは、米国
のクローズキャプションフォーマットである字幕データ
を格納する場合がある。補助データには、プログラムコ
ードやポストスクリプトデータのような希望のデータを
入れることができる。

【００３９】図1Bは、図1Aのシステムに対応し、図1Aの
システムと同じように機能するオーディオ／映像エンコ
ードシステム98がブロック図で示している。図1Bでは、
エンコードシステムヘのビデオ入力がカメラ80から供給
され、オーディオはマイクロフォン82から供給される。
映像情報およびおそらくオーディオ情報を記憶する映画
フィルムは、フィルムを照明するためのライトおよびフ
ィルムから画像をキャプチャするための光検出器を具備
する転送装置88を介してエンコードシステム98に転送さ
れる。入力装置80、82、および88からの情報は、オーデ
ィオテープレコーダまたはビデオテープレコーダによっ
てのような、エンコードシステム98によってエンコード
される前に電磁フォーマットで記憶される。オーディオ
テープおよびビデオテープは、図1Aのシステムによりエ
ンコードされる。

【００４０】エンコードシステムにより作り出される最
終的なデジタルビットストリームは、光ディスクをプレ
ス加工する光ディスクマスタリング装置90、光ディスク
に書き込む光ディスク書込み装置84に送られるか、ある
いはテレビジョン送信機86を介して、テレビジョン受像
器またはセットトップボックスデコーダに伝送されるこ
とがある。光ディスクのプレス加工および作成は、例え
ばマスタディスクを使用する既知で市販されている方法
で実行される。エンコードされた情報は、ビデオオンデ
マンドシステムでも使用できる。エンコードされたビッ
トストリームは、究極的には、エンコードプロセスに対
応する復号化プロセスにより復号化され、オーディオ映
像情報はテレビまたはモニタでユーザに表示される。復
号化装置は、テレビまたはモニタで表示するためにエン
コードされたディスクを復号化するデジタルビデオディ
スクプレーヤを具備する。

【００４１】エンコードシステムがオーディオおよび画
像を表す電気信号を入力し、電気信号を新しいフォーマ
ットに変換し、究極的には、エンコードされた元の情報
を作成し直すために信号が復号化されることは、図1Bか
ら明らかである。 III. システム動作図2は、図1にブロック図で示されるシステムの一般的な
動作を説明するフローチャートである。図2から分かる
ように、システムはその動作サイクルの間に複数の「状
態」を経過する。濃い実線は標準的な操作経路を示し、
実線は中断終了経路を描き、破線はバイパス経路を示
す。

【００４２】システムによる最初の動作はセットアップ
状態100で発生する。このステップによって、圧縮状態1
02が入力される前に、入力パラメータを指定することが
できる。圧縮状態102では、再生VTR 51内のテープに記
憶されるビデオ画像が、ビデオエンコード装置50により
デジタル圧縮されたフォーマットにエンコードされる。

【００４３】圧縮状態102の後、ユーザは、編集状態104
の過去に圧縮されたデータの画質に基づいて手動で圧縮
プロセスを編集することができる。これによって、ユー
ザは、ビデオの1フレームの領域内または期間で画質を
改善または低下させることができる。「編集」という用
語が、場面自体をピクチャストリームに付加したり、削
除することを意味しないことに注意すべきである。本明
細書中では、「編集」という用語は、量子化および続い
てビデオの質を変更することを意味する。画像が編集状
態104で編集された後、新しいユーザ指定パラメータに
従ってデータをエンコードするために、圧縮状態102で
再び圧縮動作を実行することが必要である。

【００４４】ユーザがビデオの編集された形式を確認し
てから、字幕のようなオーディオ、ビデオおよびそれ以
外の情報を含むすべての情報が、フォーマット状態106
で、まとめて希望のフォーマットに結合される。完了状
態108では、あらゆる一時ファイルが消去され、プロセ
スは終了状態110で終了する。図2に説明される個々の状
態に関するさらに詳細な情報は、ここでは図3から図6を
参照して説明する。

【００４５】図3は、セットアップ状態100で実行される
ステップを示している。ステップ120は、セットアップ
状態を開始し、ステップ122はシステムを初期化した。
このステップでは、ワークステーション30に格納される
システム制御ソフトウェアの実行が開始し、コンソール
ディスプレイ31に表示され、キーボード32およびポイン
ティングデバイス33を介してパラメータを入力させるユ
ーザインタフェースを担当するグラフィックユーザイン
タフェース(GUI)プログラムのようなそれ以外のプログ
ラムが起動される。また、ステップ122の間に、ワーク
ステーション30のシステム制御装置ソフトウェアが他の
装置に照会し、システムの利用可能な装置を含むシステ
ム状態を突き止める。

【００４６】ステップ124では、GUIを通してユーザに情
報が表示される。歓迎のメッセージ、システムに関する
情報、エンコードプロセスに使用されるパラメータ、お
よび過去にエンコードされたあらゆるファイルの存在が
表示される。表示されたシステム情報には、オーディオ
エンコーダ、VTR、オーディオテープデッキ、およびそ
の構成を含むシステムに接続される装置を具備する。シ
ステムに既にエンコードされたファイルが格納されてい
る場合は、情報はファイルを作成するのに使用されたオ
ーディオエンコードパラメータおよびビデオエンコード
パラメータを記述する情報がユーザに表示される。

【００４７】ステップ126では、それから、標準システ
ムパラメータまたはユーザ指定システムパラメータを使
用するエンコード、システムパラメータに対する変更、
または選択されたパラメータが受入れ可能であることの
確認を開始するためのコマンドのようなユーザからの情
報を入力する。

【００４８】それから、ステップ128では、エンコード
動作と復号化動作の準備をするために、グラフィックユ
ーザインタフェースからシステム制御装置ソフトウェア
に、入力されたデータを転送することにより、入力デー
タを処理する。セットアップ状態は130で終了する。

【００４９】図4には、圧縮状態102で実行されるプロセ
スがブロック図が示される。標準動作フローに従い、ユ
ーザは、既に、セットアップ状態で圧縮されるビデオお
よび付随オーディオシーケンスを指定した。それから、
ユーザは、システムに、自動手順、つまり自動圧縮手順
を実行するように指示する。自動圧縮手順の間のビデオ
圧縮により、ユーザは期間で、あるいはビデオの1フレ
ームの中で動的量子化プロセスを制御することはできな
い。これは、コーディング決定が、ビデオエンコード装
置50により計算される客観的な基準に基づいて下される
初期圧縮実行として意図される。自動圧縮がすでに実行
されていた場合は、ユーザは、空間的（フレームまたは
ビデオ上で）または時間的的（ビデオシーケンスで）の
どちらかで、編集圧縮モードでの量子化を手動で調整で
きる。

【００５０】圧縮状態では、ステップ140で開始した
後、ステップ142で圧縮動作に備える。この動作中、ビ
デオのタイムコードおよび圧縮パラメータとともに圧縮
される付随オーディオのような圧縮プロセスのパラメー
タが、ワークステーション10を介してワークステーショ
ン30からビデオエンコード装置50にダウンロードされ
る。

【００５１】それから、ステップ144では、希望の圧縮
の種類が決定される。初めて情報を圧縮するときには、
圧縮プロセスは自動的に、ユーザの介入なく実行され
る。ステップ146では、自動圧縮プロセスの準備をす
る。この準備中に、ワークステーション30は、デジタル
オーディオテーププレーヤ71a-71dおよび関連するオー
ディオエンコード装置70a-70dの内のどれを使用しなけ
ればならないかを決定する。また、ワークステーション
30は、ワークステーション20に、オーディオインターフ
ェス装置72を介した、ビデオエンコード装置50およびオ
ーディオエンコーダ70a-70dの出力からのビットストリ
ームキャプチャに備えるように命令する。さらに、再生
VTR 51、録画VTR 52、およびDATプレーヤ71a-71dは、テ
ープを適切な開始位置まで進める。それから、ワークス
テーション40が再生ビデオテープレコーダ51、録画テー
プレコーダ52、およびDATプレーヤ71a-71dに、ステップ
148での移動を開始するように信号を送る。その後、ス
テップ150で、ビデオエンコード装置50を使用するMPEG-
1またはMPEG-2フォーマットのような希望のフォーマッ
トに従ってビデオデータがエンコードされる。また、オ
ーディオデータも、ドルビーAC-3フォーマットのような
希望のフォーマットに従ってエンコードされる。手動編
集プロセスを後で補助するためにログファイルを作成す
る必要がある。ログファイルは、ビデオデータの後での
編集を実行するために必要となるエンコードされたビデ
オデータのパラメータを示す。エンコードプロセスは、
適切なタイムコードに到達するステップ160で停止す
る。このタイムコードは、エンコードされるべき情報の
最後である場合もあれば、ビデオシーケンスの最後では
ないユーザが指定したポイントである場合もある。

【００５２】ステップ144で、自動圧縮プロセスがすで
に実行され、ユーザが、以下に図5に関して説明するよ
うに、編集状態の間に指定されたパラメータを使用して
ビデオの1つ以上のフレームの画質を手動で変更するこ
とを希望すると判断されると、ステップ144で、編集−
圧縮動作を実行する必要があるかどうかが判断されるだ
ろう。ステップ152では、手動編集が開始するポイント
である希望の開始ポイントへの再生VTR 51の合図を含む
編集圧縮動作の準備が行われる。また、オーディオ情報
は、いったん自動圧縮動作でエンコードされると、変更
する必要はないので、オーディオ装置はディスエーブル
される。それから、ステップ154で、再生VTR 51および
録画VTR 52が移動する。

【００５３】ステップ156では、その後、図5に説明する
編集状態でユーザによって指定されたパラメータに従っ
たビデオデータのエンコードが開始する。編集圧縮は、
終了タイムコードに達したステップ160で終了する。ス
テップ162では、ユーザに、圧縮およびエンコードが完
了した旨のメッセージが表示され、プロセスはステップ
164で終了する。

【００５４】図5は、編集状態104で実行されるプロセス
を説明する。前述したように、ここで言われる編集と
は、ビデオシーケンス内で場面を削除、短縮、または移
動させる従来のビデオの編集ではない。本明細書でいう
編集状態とは、ビデオの一部またはビデオの時間シーケ
ンスの質を、手動でビデオの量子化を設定することによ
り変更することである。

【００５５】ステップ170で編集状態を開始した後、ス
テップ172では、ユーザはエンコードされたビデオのビ
ット割当てを変更することによるビデオの手動の編集を
希望するかどうか尋ねられる。ユーザがビット割当ての
変更を望まない場合、プロセスはステップ188で終了す
る。ユーザがビット割当ての変更を望む場合は、ユーザ
はステップ174で編集対象のビデオセグメントを定義す
る。これは、画質を変更しなければならないビデオの期
間を選択することによって実行される。それから、ステ
ップ176で、ユーザが空間的編集または時間的編集を希
望するのかを判断する。空間的編集がビデオのフレーム
の中でビットの量子化または割当てを変更するのに対
し、時間的編集は、ビットの割当てを期間で変更する。
ユーザが空間的編集を選択すると、フローは、編集され
るフレーム内の領域を入力するステップ178に進む。ま
た、適用される変更の相対的な程度も入力される。本発
明の場合、ゼロを含む-5から+5の整数目盛りが、変更の
相対量を示すために使用される。ユーザは、キーボード
32またはポインティングデバイス33あるいはその両方を
使用してビデオの領域をマークし、-5から+5の間で-5と
+5を含む整数の内の1つを指定する。ユーザは、ある領
域に以前設定された量子化レベルを変更してはならない
ことを示すこともできる。例えば、ユーザはある一定の
領域のビット割当ての増加を希望する場合、それ以外の
領域のビット割当てを減少しなければならない必要があ
る。ユーザがある領域を「保護つき(protected)」とも
呼ばれる変更不可と設定すると、画質領域の改善に必要
となるビットは保護つきの領域からは採取されない。

【００５６】ステップ176でユーザが時間的編集を希望
すると判断されると、フローは、どのように期間を編集
しなければならないのかを入力するステップ180に進
む。空間的編集と同様に、時間的編集の場合も、ユーザ
は、ビデオのある特定のシーケンスに適用される変更の
相対度を示す-5と+5の間の整数値を指定する。この変更
は、選択された期間全体で有効となる。

【００５７】空間的編集または時間的編集のどちらかが
ステップ178と180で実行されてから、ステップ182で、
ビデオシーンが、手動で入力されたパラメータに従っ
て、エンコードし直され、例えばMPEG-2フォーマットに
圧縮し直される。ユーザが画質がどのように変更された
のかを詳しく比較できるように、既にエンコードされた
のデータは新規に編集されたデータの隣に表示される。

【００５８】オペレータが編集対象のセグメントを示す
と、VTR 52からのビデオが記憶装置60に転送され、記憶
装置60で利用可能な総メモリの多くても半分を占める。
そのセグメントは、「前の」セグメントに対応する。編
集−圧縮プロセスの間、ビットストリームはワークステ
ーション20によってキャプチャされ、マスタビデオビッ
トストリームファイルから別個のビットストリームファ
イルとして記憶される。マスタビデオビットストリーム
ファイルは、映画全体の圧縮済みビットストリームであ
る。編集−圧縮されたビデオはVTR 52で録画される。エ
ンコードプロセスの間、オペレータはピクチャを、それ
がVTR 52で録画されているのと同時に表示することにな
る。オペレータがエンコードした後のピクチャの表示を
希望する場合は、VTRを再生機械として使用できる。オ
ペレータが「前と後」の比較を実行したいと考える場
合、VTR 52の対応するセグメントが記憶装置60に転送さ
れ、装置60の総メモリの残りの半分までを消費する。

【００５９】このエンコードの後、オペレータは、変更
されたビデオを保存する必要があるかどうかを決定す
る。オペレータが「後」のセグメントを無視することを
決めた場合、マスタビットストリームは変更されずに残
され、編集−圧縮済みのビットストリームは削除され
る。VTR 52がマスタビットストリームを反映できるよう
にするには、「前」のセグメントを録画する目的だけ
に、編集済みのセグメントで別の自動−圧縮が実行され
る。装置60を「前」のセグメントをVTR 52に転送して戻
すために装置を使用するという代替策も可能である。オ
ペレータが「後」のセグメントを記憶することを決めた
場合、以下に説明するように、マスタビットストリーム
ファイルを更新して、編集−圧縮済みのビットストリー
ムファイルを入れる必要がある。

【００６０】ユーザが、ステップ184でビデオが受け入
れられると判断した場合、既にエンコードされたデータ
は新規にエンコードされたデータで置き換えられる。こ
のステップは、以下の別項でさらに詳しく説明する。新
規にエンコードされたデータが以前エンコードされたデ
ータを置き換えると、ステップ192で、ユーザが更に編
集を希望するかどうかを判断する。さらに編集を希望す
る場合には、フローはステップ174に戻る。ユーザがビ
デオの編集を終了したら、フローは編集状態を終了する
ステップ188に進む。

【００６１】ユーザが、ステップ184でビデオが受け入
れられないと判断した場合は、ユーザは、編集変更が記
録されないようにステップ186で編集動作を終了する
か、あるいはユーザはビデオを編集し直す。ビデオは、
編集で新しいパラメータを選択するユーザによって編集
し直される。ユーザが希望する場合は、編集対象の新し
いビデオセグメントを定義することも可能である。

【００６２】ユーザが圧縮（自動−圧縮だけ、または編
集−圧縮とともに自動−圧縮のどちらか）に満足する
と、圧縮済みビデオ、圧縮済みオーディオ、およびそれ
以外のすべてのファイルを含む個々のデータファイル
が、最終フォーマットへのフォーマットの準備が完了し
た状態となり、フォーマット状態166に入る。補助デー
タには、最終的なフォーマット済みデータファイルに記
憶される字幕のような情報を含むことがある。図6にブ
ロック図で示されるフローチャートでは、ステップ200
でのフォーマット状態の開始後、ユーザが補助データを
記憶することを決定すると、ワークステーション20は、
フロッピーディスクドライブ内にフロッピーディスクな
どを具備するデジタル記憶装置22から補助データを読み
取る。それから、ステップ204で補助データがエンコー
ドされたオーディオおよびビデオと結合され、最終的な
フォーマット済みファイルを作り出す。システムによっ
て作成される最終的なデジタルビットストリームは、IS
O/IEC 13818-1に定義される「プログラムストリーム」
として構築できる。代わりに、最終的なビットストリー
ムは、直接衛星DSSフォーマット、光ディスクでの使用
に適したVBR（可変ビットレート）またはその他の種類
のフォーマットのような任意の種類のフォーマットとす
ることができる。エンコードされたビデオとオーディオ
は別個に記憶できるため、システムは、同じエンコード
されたビデオとオーディオを別々の最終フォーマットに
エンコードすることができる。これは、さまざまなフォ
ーマットを作り出す機能を備える1つのフォーマッタを
使用するか、または別個のフォーマッタによって達成さ
れる。ステップ206では、フォーマットされたファイル
がディスク21で記憶される。

【００６３】フォーマットされたファイルがステップ21
0のデジタル記憶装置22内のテープに書き込まれるステ
ップ208で完了状態になる。その後で、もはや必要とさ
れていない一時ファイルを削除するさまざまな「ハウス
クリーニング」機能を実行するステップ122で終了状態
に入る。圧縮プロセスが終了される前のような異常終了
要求が発生した場合、打切り手順が、オーディオテープ
プレーヤおよびビデオテーププレーヤを停止し、破壊さ
れている可能性があるデータファイルもクリーンアップ
するワークステーション30で実行される。プロセスは、
それからステップ216で終了する。 IV. システム代替策望ましいシステム構成要素およびその動作は前記に説明
したが、言うまでもなく代替ハードウェアが図1Aおよび
図1Bに開示されるハードウェアを代用することができ
る。ビデオエンコード装置50は、利用できる場合にはMP
EG-2ビデオエンコーダであるのが望ましい。しかし、MP
EG-1ビデオエンコーダとしても知られる市販されている
ISO/IEC 1172-ビデオ標準エンコーダを使用することも
できる。MPEG-1エンコーダに対する必要な改良は、MPEG
-1バッファ管理モジュールが、ワークステーション10の
ような外部ソースから制御できるようにする必要があ
る。さらに、入力ビデオサポートは、ITU-R 601（前CIR
601）解像度ビデオを格納するために増大されなければ
ならない。このような改良は、過度の実験を行わないで
もデジタルビデオエンコードの当業者により実行でき
る。

【００６４】4つのオーディオテーププレーヤと4つのオ
ーディオエンコーダが図1Aに描かれているが、それ以外
の構成はオーディオシステムに容易に採用できる。例え
ば、1台の市販されている8 mmデジタルオーディオプレ
ーヤを複数のDATプレーヤの代わりに使用することがで
きる。1台のTASCAMデジタルオーディオプレーヤを使用
すると、ワークステーション40から必要とされるのは1
つのRS-422制御信号だけであるが、最大8つの別個のオ
ーディオチャネルを同時にサポートできる。オーディオ
エンコーダが同時に8つのオーディオ入力を受け入れる
ことが可能でなければならず、オーディオインタフェー
ス装置72もオーディオデータストリームの4つから8つへ
の増加に対処するために改良されなければならないのは
言うまでもない。

【００６５】オーディオおよびビデオの同時エンコード
の代替策として、オーディオおよびビデオエンコード
は、別個の時間またはロケーション、あるいはその両方
で実行され、後で最終的なフォーマットに結合すること
ができる。これには、SMPTE（全米映画テレビジョン技
術者協会）タイムコードフォーマットのような既知のタ
イムコードの使用が必要となる。タイムコードは、ビデ
オテーププレーヤ、ワークステーション、または別個の
スタンドアロン式タイムコード作成プログラムによって
作成される。

【００６６】録画VTR 52は、ビデオデコーダが利用可能
で、ワークステーション20に接続されている場合には排
除できる。その場合、再構築されるビデオは、圧縮フェ
ーズ中のビデオエンコード装置50から録画される代わり
に、ディスク21内のディスクファイルから作成されるだ
ろう。録画VTR 52を排除すると、テープ費用だけではな
く装置費用という点でも、システムの費用が大きく節約
される。

【００６７】さらに、グラフィック動作をディスプレイ
ビデオのグラフィックオーバレイ面で実行する能力は、
市販のX-端末オプションを使用して、コンソールディス
プレイ上でサポートすることができる。例えば、コンソ
ールディプレイ31は、ビデオをオーバレイグラフィック
ウィンドウで表示する機能を備えたX-端末で置き換えら
れる。ペンシルバニア州のKing of PrussiaのHuman Des
igned Systems 社のHDSV View Stationのような市販さ
れているマルチメディアディスプレイ端末は、表示およ
び手動編集領域定義動作のためにX-端末に接続すること
ができる。ただし、ビデオデコーダの職業用品質のビデ
オは、人間のオペレータが再構築されたビデオ信号の質
を評価できるように、図1Aに図示されるモニタ61のよう
な職業用モニタで表示しなければならない。 V. 最適エンコード効率を維持しながらオーディオエン
コーダの数を低減する前述したように、図1Aは、マルチパスビデオエンコード
装置50および4台のワンパスオーディオエンコーダ70a、
70b、70c、および70dを備えたエンコードシステムをブ
ロック図している。再生VTR 51は、ビデオエンコード装
置50にエンコードされるべきビデオ信号を供給し、デジ
タルオーディオテープ(DAT)プレーヤ71a-71dが、それぞ
れワンパスオーディオエンコーダ70a-70dにエンコード
されるべきオーディオ信号を供給する。

【００６８】本発明の実施例では、最終フォーマット済
みオーディオ映像データストリーム内の8つのオーディ
オトラックをエンコードする。各オーディオトラック
は、1つ以上のオーディオチャネルを具備する。オーデ
ィオトラックは他の装置でもオーディオを格納できる
が、例えば、あるオーディオトラックが左チャネルと右
チャネルを備える場合がある。図7に説明する。もっと
も効率的なオーディオ映像エンコードを実行するために
オーディオエンコーダの数を求める方法、およびこのオ
ーディオ映像エンコードを実行する方法は、図7に説明
する。図7では、開始後、ステップ240でビデオエンコー
ドに必要とされるパスの数Pが求められる。ビデオをMPE
Gフォーマットにエンコードするためには、通常、2つ以
上のパスがビデオのエンコードに必要となる。本発明の
場合、望ましいパス数は2であるが、3つ以上のパスも可
能である。それから、ステップ242でエンコードされる
オーディオトラックの数Tが求められる。本発明では、
異なったオーディオトラック数も可能であるが、オーデ
ィオトラックの数は8が望ましい。次に、ステップ244で
は、もっとも効率的なオーディオ映像エンコードを実行
するために必要とされるワンパスオーディオエンコーダ
数AEが計算される。必要なオーディオエンコーダの数
は、ビデオエンコードに必要とされるパスの数で除算さ
れるエンコードされるべきオーディオトラック数に等し
い。実施例では、エンコーダの2つのパスで除算される8
つのオーディオトラックは、必要な4つのオーディオエ
ンコーダに等しい。オーディオエンコーダの計算された
数が整数ではない場合、オーディオエンコーダの計算さ
れた数は、整数となるように切り上げる必要がある。例
えば、7つのオーディオトラックだけしかツーパスビデ
オエンコーダにエンコードされない場合、7/2=3.5とな
り、3.5は次にもっとも大きい整数4に切り上げられる。
本システムによって実行されるエンコードプロセスの
間、1つのビデオパスはオーディオエンコーダの内3台し
か使用しないが、それ以外のビデオエンコードパスは4
台のオーディオエンコーダすべてを使用する。ステップ
240-244が、システムの初期設計時にだけ実行される必
要があり、オーディオ映像作業がエンコードされるたび
に必要とされるワンパスオーディオエンコーダの数を計
算する必要はないことに注意すべきである。さらに、ス
テップ240、242および244は、ワークステーション30の
ようなコンピュータによってコンピュータ／マシン実装
されるか、あるいはユーザまたはオーディオ映像エンコ
ードシステムの設計者により判断される。

【００６９】オーディオエンコーダの数が求められ、オ
ーディオ映像エンコードシステムがセットアップされて
から、オーディオ映像エンコードプロセスが開始でき
る。ステップ246では、1にカウンターがセットされる。
カウンターは、ビデオエンコードシステムの各パスをカ
ウントするに用られる為に可変である。それから、ステ
ップ248は、オーディオトラックのすべてではないが、
いくつかでワンパスオーディオエンコードを実行しなが
ら、第1ビデオエンコードパスを実行する。例えば、8つ
のオーディオトラックおよび1つのツーパスビデオエン
コーダが存在する場合、第1パス中に4つのオーディオエ
ンコーダを使用できる。それからステップ250で、カウ
ンターが1だけ増される。ステップ252では、ステップ24
8で使用されたのと同じオーディオエンコーダを使用し
て、エンコードされていないオーディオトラックのワン
パスオーディオエンコードを実行しながら、次のビデオ
エンコードパスを実行する。例えば、第2ビデオエンコ
ードパスの間、ステップ249で使用される4つのオーディ
オエンコーダは、オーディオトラック５から8をエンコ
ードできる。それからステップ254で、カウンタがP、必
須ビデオエンコードパス数に等しいかどうかが判断され
る。実施例では、2つのビデオエンコードパスしかない
ため、プロセスは終了するだろう。終了しない場合、フ
ローはステップ250、252、および254から成るループを
実行するために戻る。

【００７０】言うまでもなく、8つのオーディオトラッ
クがあるオーディオ映像作品用のツーパスビデオエンコ
ーダを使用するだけではなく、それ以外の実施例も可能
である。例えば、スリーパスビデオエンコーダは、6つ
のオーディオトラックで使用できる。この状況では、オ
ーディオエンコーダのもっとも効率的な数は3（6/2=3)
である。ツーパスビデオエンコーダが使用され、合計6
つのオーディオトラックがエンコードされる場合、オー
ディオエンコーダのもっとも効率的な数は3となるだろ
う。代替策として、スリーパスビデオエンコーダを、エ
ンコードするオーディオトラックが5つあるシステムで
使用することができる。この代替システムでは、オーデ
ィオエンコーダの内の1つしか使用されず、他の2つのビ
デオエンコードパスが、両方オーディオエンコーダの両
方が使用されている間に発生する一方、ビデオエンコー
ドパスの内のどれか1つが動作している状態の2つのワン
パスオーディオエンコーダが必要である。従来の技術の
当業者に明らかになるように、ビデオエンコーダとオー
ディオトラック数のこれ以外の組み合わせも、本明細書
に記載される教示を考慮すると可能である。

【００７１】できるかぎり効率的であるという点での本
発明の重要な一面とは、ビデオエンコードのパスが発生
している間につねにオーディオエンコードを実行し、オ
ーディオエンコードが実行している間につねにビデオエ
ンコードのパスを実行するということである。この取り
決めでは、ビデオエンコード動作の1パスの間に、オー
ディオエンコーダの少なくともいくつかがつねに使用さ
れることになる。できるかぎり効率的であるためには、
オーディオトラック数をオーディオエンコーダの数で均
等に除算できない場合（つまり、エンコードされるオー
ディオトラックの数をビデオパス数で除算すると余りが
出る場合）、エンコードプロセス全体で、ビデオパスか
ら余りを差し引いた数に等しい数の休止していたオーデ
ィオエンコーダがある。例えば、スリーパスビデオエン
コーダおよび4つのオーディオトラックの場合、2つのオ
ーディオエンコーダが必要とされ、余り1が出る（例え
ば、4/3=1で余りが1）。したがって、もっとも効率的で
あり、スリーパスビデオエンコードが完了されのと同時
にオーディオエンコードを完了するためには、オーディ
オエンコーダが休止となるのはわずか2回である（例え
ば、3つのビデオパスから余り1を差し引くと2に等し
い）。エンコーダが休止する2回は、同じパスで発生可
能であり（同じビデオエンコードパスに異なった2つの
オーディオエンコーダがある）、前記例のそれ以外の2
回のビデオエンコードパスのそれぞれがオーディオエン
コーダのすべてを活用するか、あるいは1つの休止オー
ディオエンコーダがある2つのビデオエンコードパスが
あるという意味である。これらの2つのパスでは、同じ
または別のオーディオエンコーダが休止となることがあ
る。 VI. エンコードされたビデオの情報を記憶するための
ログファイル、ならびにログファイルおよびエンコード
されたビデオにアクセスするためのログインタプリタユ
ーティリティ開示されたエンコードシステムは、当初、MPEG-2、MPEG
-1、またはそれ以外のデジタルビデオエンコードフォー
マットのような圧縮済みデジタルフォマットにビデオを
エンコードする。このエンコードは、システム構成要素
に関する第II項および汎用システム動作に関する第III
項に説明する。したがって、エンコードされたビデオデ
ータは、例えばハードディスク上のデジタルフォーマッ
ト内で記憶される。

【００７２】デジタルビデオエンコードプロセスの間、
ビデオの統計およびそれ以外の情報が作成され、ログフ
ァイルに記憶される。MPEGビデオエンコードに精通した
従来の技術の当業者は、ビデオを記述する統計および情
報の種類、およびこれらの統計および情報を作成する方
法を熟知している。従来のエンコードシステムでは、こ
の種類の情報およびデータは作成されるが、通常、ビデ
オエンコードの後に廃棄される。しかし、本発明の場
合、ピクチャをコーディングするために使用された合計
ビット、ピクチャをエンコードする平均二乗エラー、ピ
クチャあたりの平均量子化スケールなどのような作成さ
れたこの情報は、エンコードプロセスの後で、システム
RAMからログファイルにダンプされる。本発明によって
使用されるログファイルの例は、図8A-10Bに説明する。
これらのログファイルは、VBRシステムで特に有効であ
り、ビデオエンコーダの初期パス（複数の場合がある）
の間に作成される。それから、ログファイルは、最終エ
ンコードパスの間およびビデオの後での編集および再エ
ンコードの間に使用される。

【００７３】本発明により使用されることがある、シー
ケンスレーヤのログファイル、ピクチャレイヤログファ
イル、およびマクロブロックレーヤのログファイルとい
う異なった3種類のログファイルがある。これらのログ
ファイルのそれぞれが、その各レイヤの統計および情報
を記述する。図10（A）にブロック図で示される完全フ
ォーマット、および図10（B）にブロック図で示される
短縮フォーマットという異なった2種類のマクロブロッ
クレーヤのログファイルフォーマットがある。マクロブ
ロックレーヤのの詳細な情報が必要とされる場合には、
完全フォーマットが使用され、マクロブロックの詳細の
すべてを追跡調査する必要がない場合には、短縮フォー
マットが使用される。2時間の映画中のマクロブロック
の数は多数であるため、マクロブロックログファイルは
大量の記憶スペースを消費する。したがって、大きな記
憶スペースが使用できない限り、完全または短縮フォー
マットのマクロブロックファイルを記憶することはでき
ない可能性がある。ただし、マクロブロック情報を入手
する必要がある場合は、エンコードビデオを復号化する
か、あるいはそれ以外の手段でこの情報を再構築するこ
とができる。

【００７４】図8A-10Bにブロック図で示されるログファ
イルフォーマットの詳細の多くは重要ではなく、これら
のファイルフォーマットは、単に、エンコードプロセス
の間に作成できるデータの例図としてのみ提供されたこ
とに注記すべきである。しかし、ログファイル中の情報
のいくつかは、ビデオの質を変更するプロセスの間に使
用されるので重要である。以下に説明するように、エン
コードされたビデオの編集ポイントを決定するために
は、初期のピクチャにより消費されるビット数を総計す
る必要がある。合計される情報は、図9Bおよび図9Cに描
かれ、ピクチャごとのビット数（generated_bit_pictur
e）、シーケンスヘッダ（bits_sequence_header)、ピク
チャのグループ(GOP)ヘッダのビット数(bits_GOP_heade
r)、およびスタッフィングとして使用されるビット数ま
たはスペースを埋めるために使用されるビット数(stuff
ing_size)に関する。

【００７５】図11は、ログファイルを使用して実行され
るさまざまな機能のフローチャートを説明する。ビデオ
セグメントの初期エンコードの後、ステップ270では、
図8A-9Cにブロック図で示されるビデオエンコーダの自
動実行から作成されたピクチャおよびシーケンスレーヤ
のログファイルを読み込む。それから、ステップ272で
エンコードされたビデオに録画されるピクチャごとのロ
グファイルレコードのバイトオフセットを示すインデッ
クステーブルを作成する。2つのテーブルが作成され
る。一方はフレーム番号により、もう一方はタイムコー
ドによりインデックスが付けられる。タイムコードイン
デックステーブルには、ピクチャごとのログファイルの
中にオフセットされるバイトが記憶され、タイムコード
の昇順で並べ替えられる。同様に、ピクチャフレームイ
ンデックステーブルには、（エンコーダによって確認さ
れるように）入力されたピクチャ番号の昇順で並べ替え
られるログファイル内へのバイトオフセットが記憶され
る。

【００７６】作成されたインデックステーブルは、任意
の希望されるピクチャまたはマクロブロックのログ情報
をすばやく選び出すのに有効である。ログファイル内の
シーケンス、ピクチャまたはマクロブロックのデータを
記憶するためには固定サイズレコードが使用されている
が、エンコーダはそれらをコーディングする前に入信ピ
クチャを並べ替える。加えて、3:2の割合で毎秒30フレ
ームに引き下げられた映画（毎秒24フレーム）ソースを
取り扱う場合、ある種のタイムコードは省略される。イ
ンデックステーブルは、ピクチャの並べ替えおよびタイ
ムコードの省略にも関らず、適切なデータの位置をすば
やく突き止めるための手段となる。

【００７７】ビデオのさまざまなフレームと期間がその
品質を手動で改変されるに従い、エンコードされたビデ
オは頻繁に変化するので、本発明によるエンコードシス
テムが、各ピクチャをコーディングする際に使用される
エンコードされたのビット数のディレクトリまたはイン
デックスを維持しないことを注記すべきである。ただ
し、エンコードされたの情報を記述するログファイルは
固定サイズレコードであるため、ピクチャまたは期間の
品質が改変されても、ログファイル内の情報のディレク
トリまたはインデックスを維持することは容易である。

【００７８】インデックステーブルの作成後、ステップ
274を使用することにより、ユーザは、ブロック276、27
8、および280に描かれるさまざまなログファイルユーテ
ィリティを使用するログファイルからさまざまな情報を
すばやく入手できる。ログファイル中のレコードが必要
とされる場合、作成されたインデックスは、ログファイ
ル内の希望のレコードを突き止めるために使用され、完
全なレコードがログファイルから引き出される。それか
ら、このレコードは希望される個々のパラメータを検索
するために解析される。個々のレコードをインデックス
テーブルを使用して解析するプロセスは、他のログ解釈
プログラムユーティリティのすべての基礎となる。解析
プロセスは既知であり、従来の技術の当業者は、編成さ
れたファイルから希望の情報を検索する方法を理解して
いる。

【００７９】ステップ276は、ログファイルのカットア
ンドペーストユーティリティである。フレーム内でまた
は期間で手動で量子化（および画質）を変更した後、ロ
グファイルのオリジナルセットは、編集中に発生した変
更に対応するように更新されなければならない。ログフ
ァイルのカットアンドペーストユーティリティは、編集
済みのセグメントタイムコードに対応するログファイル
内でオフセットの位置を突き止め、ログファイル内の情
報を再エンコードされたビデオに対応する新しい情報で
置き換える。再エンコードのプロセスについては、以下
のVIII項に説明する。

【００８０】ステップ278では、デジタルでエンコード
されたビットストリームの編集を可能とするためにパラ
メータを入手するためのユーティリティを示している。
ビデオが最初にエンコードされ、ユーザがビデオのフレ
ームの品質または期間の改変を希望する場合、削除さ
れ、希望の品質を備えた新規にエンコードされたビデオ
で置き換えられなければならないエンコードされたビデ
オ内の適切な部分を突き止める必要がある。

【００８１】エンコードされたビデオのビットストリー
ム内の編集ポイントのバイトオフセットは、編集ポイン
トに対応するピクチャまで各ピクチャをエンコードする
のに使用されるビットの累積項目を計算することにより
求められる。指定のピクチャが位置するファイルの最初
からのバイトまたはビットの総数を求めるために、以前
のピクチャのそれぞれをエンコードするのに使用された
ビット数が合計される。合計されたピクチャログファイ
ルから入手される情報とは、ｉ番目のピクチャをエンコ
ードするのに使用されるビットＢｉの数、シーケンスヘ
ッダを構成するビットＳｉの数、ピクチャのグループ
（GOP）ヘッダをエンコードするのに使用されるビット
Ｇｉの数、スタッフィングとして使用されるビットＴｉ
の数である。N番目のピクチャのビットオフセットは、
次に示すように計算される。

【００８２】バイトオフセットは、ビットオフセットを8で除算する
ことによってだけ計算される。エンコードされたビデオ
ビットストリーム中のアドレスオフセットを求めるため
にログファイルを使用する代替策として、ビットストリ
ームデコーダを使用して、ピクチャオフセットのディレ
クトリを作成することができる。ただし、エンコーダ
は、ディレクトリを更新するために編集が終わるたびに
ビットストリーム全体を実行しなければならないため、
このアプローチは面倒である。

【００８３】最後に、ステップ280では、タイムコード
をもっとも近いピクチャのグループ（GOP）の最初また
は最後に四捨五入するためのユーティリティを示してい
る。エンコードされたビットストリームのすべての切取
りまたは編集は、ピクチャのグループ（GOP）の境界で
実行される。ただし、GOP境界はビデオに編集を実行す
るオペレータにはわからない。オペレータがいったん編
集セグメントの開始ポイントおよび終了ポイントを指定
すると、システムはGOP境界を計算する。GOP境界は、各
ピクチャレコード内に記憶されるGOP番号と呼ばれるピ
クチャレイヤパラメータを検討することにより設定され
る。ピクチャレイヤログファイルの連続レコードを通し
てトレースすることにより、図9Bの中のGOP番号（GOP_n
umber）が変化すると、GOP境界があると判断される。

【００８４】ログファイルおよびログファイルユーティ
リティは、ビデオエンコーダに密接に関係しているの
で、ログファイルは図1Aに図示されるワークステーショ
ン10のハードディスク内に記憶され、ログファイルユー
ティリティはワークステーション10により実行される。
代わりに、ワークステーション30またはそれ以外のの任
意の処理システムにログファイルが格納され、ログファ
イルユーティリティが実行されることがある。 VII. エンコードされたビデオの品質の変更 A. 期間での品質の変更エンコードシステムにより作成されるエンコードされた
ビデオは、光ディスクのような最終的なデジタル記憶媒
体に書き込まれることを目的とする。ディスク上のエン
コードされたビデオは、一定ビットレート(CBR)動作と
比較すると、ビデオの異なったセクションの間でのビッ
トレートの大きな変更の可能性を提供する可変ビットレ
ート(VBR)でエンコードされる。VBRコーディングによ
り、著しく異なるビット数を異なったピクチャに割り当
てることができるようになるため、画質は経時的に変化
する。さらにVBRは、CBR動作では不可能なスケール内で
のユーザによって定義されたビデオのセクションにデー
タレートを割当てし直す可能性も提供する。CBRにより
同じことを達成する場合には、デコーダできわめて大き
なバッファが必要になるだろう。

【００８５】エンコードシステムによって手動編集と呼
ばれることが可能になるが、手動編集とは、映画の中で
場面を短縮または延長したり、異なった場面を置換する
ことではなく、画質を変更することである。画質は経時
的に変更することができ、本項に説明するように時間的
編集または時間的手動編集と呼ばれる。別の項では、フ
レームのあるセクションからフレームの別のセクション
にビットをシフトすることによって、データのフレーム
内での画質を変更する、空間編集または空間手動編集と
呼ばれることについて説明する。

【００８６】時間的編集、つまり編集セグメントのさま
ざまなセクションの間でのビットを再割当てで、以下に
示す3つの主要な制約を満たす必要がある。

【００８７】1.編集される映画／ビデオの総容量が割り
当てられた容量を上回らないこと。

【００８８】2.編集セグメント内にバッファアンダフロ
ーがないこと。および 3.時間的編集によって生じさせられる編集セグメントの
外側にバッファアンダフローがないこと。

【００８９】制約1は、結果として生じる編集済みのセ
グメントが最初にエンコードされたセグメントと同じビ
ット数を消費するように編集セグメントをエンコードし
直すことにより処理される。変種セグメントが検討され
る期間全体であることを注記すべきである。編集セグメ
ント内の異なる期間には、ユーザにより品質が指定さ
れ、編集セグメントのこれらの期間は単にセクション、
または期間と呼ばれる。

【００９０】アンダフロー状態が存在するかどうかを突
き止めるためには、デコーダのモデルを使用して目標ビ
ットを確認することが必要である。エンコーダのVBR動
作では、ビデオバッファ検査機構（VBR)モデルの修正さ
れたバージョンが使用される。このモデルは、VBRの簡
略修正モデルと呼ばれ、デジタル記憶装置媒体(DSM)に
使用できる。VBRモード用のVBVは既知でありMPEG-2規格
で定義され、ISO/IEC 13818-2の第C.3.2項の付録Cに特
に記載される。

【００９１】VBR用VBVモデルでは、デコーダのバッファ
はいっぱいのままであるが、アンダフローしないように
制限されている。さらに、バッファは一定のレートRmax
でバッファがいっぱいになるまで充填し、それからバッ
ファが空になり始めるまで、ビットはバッファに伝送さ
れない。各フレーム間隔ごとに、あるフレームを復号化
するために必要とされるビットがバッファから削除され
る。これを念頭に入れておくと、VBRモードでは、ピク
チャの列に割り当てるビットが多すぎると、バッファア
ンダフローが発生することが分かる。ピクチャのビット
がバッファから削除されるに従い、バッファは空にな
り、高画質ピクチャのビットの大多数がバッファを充電
できるレートより早いレートで削除される場合、バッフ
ァがアンダフローする。アンダフローを防止するため
に、ピクチャをエンコードするために使用されるビット
数が低減される。ピクチャのビット数を低減すると、充
填レートは同じに保たれるが、ビットをバッファから削
除するレートが低減される。VBV占有がいっぱいである
場合、VBVバッファヘのビットストリーム伝送は即座に
停止されるため、バッファオーバフローはVBRに関して
発生できない。つまり、バッファオーバフローではな
く、単にバッファがいっぱいな状況が存在する。 ISO/I
EC 13818-2、付録C、第C.3.2に説明されるように、 VBR
の簡略修正VBVモデルは以下の通りである。

【００９２】1. sequence_headerでのbit_rate_fieldは
max_bit_rateを表す。

【００９３】2. VBVは当初空である。VBVバッファ（つ
まりVBVバッファファイル）をmax_bit_rateのレートで
いっぱいに満たしてから、復号化プロセスが開始する。
ピクチャデータは、MPEG-2国際規格に定義されるCBRのV
BVモデルのようにただちに削除、エンコードされる。

【００９４】3. ビットストリームは、VBVバッファが
いっぱいになるまでmax_bit_rateのレートでVBVバッフ
ァの中に格納される。VBVバッファ占有がいっぱいの場
合、VBVへのビットストリーム転送は即座に停止され
る。次のピクチャのデータが削除されてから、ビットス
トリーム伝送は即座に開始する。

【００９５】4. VBVバッファはアンダフローしないも
のとする。

【００９６】5. 各vbv_delayフィールドがFFFFに設定
される。

【００９７】期間でビデオの品質を変更するには、ビデ
オのフレームにビットを追加またはビデオのフレームか
らビットを削除する必要がある。ここで、ビデオのセク
ションに追加またはビデオのセクションから削除される
ビットの数についての説明を行う。ビデオのセクション
に追加またはビデオのセクションから削除できるビット
の数は、検討されているビデオのセクションの有効ビッ
トレートに依存する。有効ビットレートRは、以下のよ
うに計算される。 R=（総割当てビット／フレーム数）＊Frame_Rate (2) 総割当てビットはビットレートに正比例しているので、
割当てビット数を参照することは、異なる単位を使用す
る場合を除き、ビットレートと同じ意味を伝える。保証
された最小レート、例えばRminがビデオの任意のセクシ
ョンに適用されると仮定すると、セクション「ｉ」から
削除できる最大ビット数は以下の通りである。Ｔ_ｉ＝（Ｒ_ｉ−Ｒ_ｍｉｎ）＊Ｎ_ｉ／Ｆｒａｍｅ＿Ｒａｔｅ (3) この場合、Niはセクション「ｉ」のフレーム数で、Ｒｉ
は同じセクションの有効レートである。保証された最小
値は、セクションに最小品質レベルを保証するために必
要とされる。同様に、指定されたセクション「j」に追
加できる最大ビット数は、以下の通り計算される。Ｔ_ｊ＝（Ｒ_ｍａｘ−Ｒ_ｊ）＊Ｎ_ｊ／Ｆｒａｍｅ＿Ｒａｔｅ (4) この場合、Rmaxは最大レート、つまりバッファがいっぱ
いでないときに充填するレートであり、Njはセクション
jのフレーム数である。

【００９８】期間で画質を変更すること（時間的編集）
についての説明は、今度は図12およびそこに参照される
図に関して行う。開始後、ステップ281では、第II項お
よび第III項で前述したようにユーザの介入なく自動ビ
デオエンコードを実行する。自動エンコードの場合、作
成されるデータストリームの最大レートおよび最小レー
トがある。最大ビットレートは、ビデオデコーダの機能
により決定され、例えばRmaxは毎秒Mbitsである。最小
ビットレートは、希望される最小画質に応じて、ユーザ
が指定できる。典型的な最小ビットレートRminは毎秒3
Mbitsである。ビデオの部分が低いビットレートとな
り、ビデオの部分が高いビデオレートとなることができ
るように、平均エンコードレートとは異なり、平均エン
コードレートをやや下回るRminを設定するのが望まし
い。Rminがビデオの平均エンコードレートをわずかに下
回って設定されると、結果として生じるエンコードビデ
オはかなり一定した画質となる。通常、Rmax=毎秒8 Mbi
tsでRminが毎秒約3 Mbitsの場合、ビデオの平均値は毎
秒約3 1/2から5 Mbitsとなるはずである。

【００９９】移動ビデオエンコードがステップ281で実
行された後、レート量子化関数を求める必要がある。本
発明のプロセスでは、希望の品質を獲得するのに必要な
ビット数が求められるが、再エンコード時には、希望の
ビットレートを結果的に生じさせるために量子化値を設
定しなければならない。レート量子化関数は、それぞれ
参照により本明細書に取り入れられる記事、画像処理に
関するIEEE会報、第3巻、第5号、1994年9月、533-545ペ
ージのラムチャンドラン(Ramchandran)その他による
「マルチ解像度およびMPEGビデオディスクロージャに適
用される依存量子化のためのビット割当て」、IEEE ICA
SSP、1993年、V381-V-384、ラムチャンドランその他に
よる「MPEGビデオ符号器に適用される依存量子化のため
のビット割当て」、および1994年にプリンストンビデオ
会議で提示されたレイニンガー(Reininger)による「レ
ート−歪み曲線を使用する多重化されたMPEGビデオ用の
共同マルチチャネルビットレート制御」に説明されるよ
うな従来の方法で計算できる。

【０１００】次に、ステップ284では、選択された期間
のユーザ品質設定値を入力する。ユーザは、究極的には
ピクチャの量子化を制御するのに使用される異なったセ
クションの優先順位を入力する。量子化は、損失のある
MPEGエンコードの解像度とも呼ばれる画質を制御する。
図13には、期間でビデオの品質を変更するために情報を
収集する目的で使用されるユーザインタフェーズを説明
する。当初、ユーザは、品質を変更することになる編集
セグメント全体の期間を入力する。この応報の入力は、
図13のユーザインタフェースには図示されていないが、
図13のユーザインタフェースが表示される前に入力され
る。図13に示される例の場合、変更対象の編集セグメン
トの期間が、例えば時間0分から時間5分までとなること
がある。ユーザが編集セグメントの総期間を記述した後
に、編集セグメント内のさらに短い期間に、優先順位P
を含む-5から+5までの範囲のさまざまな優先順位が指定
され、この期間の品質が保護され、改変してはならない
ことを示している。優先順位「なし」は、Pという優先
順位と同じ意味である。エンコードシステムは前記入力
スキームに限定されず、ユーザの希望の優先順位を入力
するために、それ以外の範囲または記号を使用できるの
は言うまでもない。

【０１０１】優先順位を指定するのに加えて、ユーザは
最小ビットレートも入力する。このビットレートは、ス
テップ281の自動ビデオエンコードの間にビデオをエン
コードするために使用される最小ビットレートと異なっ
ている場合がある。ユーザインタフェースのもう1つの
特徴とは、それを使用すると、ユーザが「バックグラウ
ンド優先順位」を設定できるという点である。これは、
ユーザが優先順位を指定したのではない選択済みの期間
内の期間にこのバックグラウンド優先順位が設定される
ことを意味する。例えば、図13では、バックグラウンド
優先順位に「1」が指定されるとすると、未指定の期間0
0:03:20:01から00:03:59:99には、ユーザが手動でこの
特定のセクションに優先順位を指定しなくても、「1」
という優先順位が自動的に指定される。

【０１０２】図13に描かれるインタフェースの底部で
は、編集セグメント内で新しい期間を作成するために
「挿入」ブロックが使用され、以前に作成された期間を
変えるために「リコール」ブロックが使用され、期間に
加えられる変更を保存するために「更新」が使用され、
期間を削除するために「削除」が使用される。光ディス
クのようなエンコードされたビデオ用の究極のデジタル
記憶装置媒体は、自動的にエンコードされたデータがデ
ィスクに書き込まれる場合には、理想的には容量まで満
たされる制限された記憶領域容量を備える。したがっ
て、画質を向上させ、ある特定の期間のビットレートを
引き上げる場合はつねに、品質が向上した期間に必要な
余分な記憶容量を供給するために、品質が低下したビデ
オのセクションが存在しなければならない。したがっ
て、本発明の実施例では、品質を改善するのに必要なビ
ットはビデオの別のセクションから取らなければならな
いため、別の期間に違う画質を割り当てないで、1つの
期間だけに高い画質を割り当てることは不可能である。
したがって、編集されたビデオのセグメントには、バッ
クグラウンドセクションとは異なり、時間的な手動編集
が適切に動作するために「保護つき」のセクションとマ
ークされていない少なくとも1つのセクションがなけれ
ばならない。さらに、ユーザが優先順位を設定した結
果、同じ画質およびビットレートが、それらが選択され
るたびに生じることはないが、編集セグメント内のピク
チャのビットの修正された数を求めるためのプロセスを
理解すると明らかになるように、ある特定のセクション
の品質は、他のセクションの割り当てられた優先順位お
よび他のセクションの長さにも依存する。

【０１０３】本発明によるエンコードシステムにより活
用される特徴とは、視聴者が、自動エンコードプロセス
中にまたは後日、エンコードされたビデオをレビューす
ることができるという点である。エンコードされたビデ
オが視聴者に表示されるに従って、視聴者は、ビデオを
停止したり、関心のあるタイムコードを書き残したりし
なくても、ビデオの関心のあるポイントや領域を記憶す
るために、リターンキーを押したり、画面に表示される
「ボタン」の上でグラフィックユーザインタフェースを
「クリック」するなどの機能を実行できる。これらの関
心のあるポイントは、後日、ユーザが呼び出し、映画全
体をレビューしなくても綿密に検討することができる。
これは、ユーザが変更を希望するエンコードビデオ内の
ポイントを決定する便利で、効率的な方法となる。この
機能は、関心のあるポイントや領域が発生した時点での
位置に対応して、タイムコードを記憶することによって
達成される。

【０１０４】ユーザがステップ284で希望の品質設定値
を入力してから、ステップ286でユーザの入力に基づい
てフレームごとに修正されたビットが計算される。この
プロセスは、図14-16Bに関して詳細に記述される。ビデ
オの編集セグメント内で時間のビットレートを変更する
ための一般的な手順は、図14のフローチャートに説明さ
れる。ユーザの入力に基づいてビットレートを計算する
ために、ステップ302では、-5と+5の間の範囲内から10
と0の間の範囲内にあったユーザの入力をマッピングす
る。-5という初期入力は、10というマッピングされた設
定値に対応し、最小品質であり、+5という入力は0とい
うマッピングされた設定値に対応し、最大画質である。
同様に、0という入力された品質選択は5というマッピン
グされた設定値に対応するなどである。ステップ302で
実行されるマッピングの目的とは、割り当てられたビッ
ト数がマッピングされた設定値により乗算される量-1の
べきまで引き上げられるe（2.71828...）に比例するこ
とである。この場合、優先順位の設定値がさらに小さい
場合のビット数が、優先順位が高い場合より下回るよう
に、さらにe-10はe0を下回る。目標ビットを優先順位-4
から+4に対応して求めるプロセスは、図16Aと図16Bに詳
細に説明される。

【０１０５】ステップ304では、「保護つき」のセクシ
ョンがあるかどうか判断される。保護つきセクションと
は、画質を以前の自動エンコードから変更してはならな
いセクションのことである。保護つきセクションがある
場合は、フローはステップ306に進み、そこで保護つき
セクションの再エンコードに割り当てられるビット数が
最初の自動エンコードの結果生じる以前のビット数に等
しくなるように設定される。このようにして、保護つき
セクションのピクチャ品質は変化しない。

【０１０６】ステップ308では、最大品質または最小品
質に設定されるセクションがあるかどうか判断される。
最大品質とは、ユーザ入力+5に対応し、最小品質とはユ
ーザ入力-5に対応する。最大画質および最小画質の場
合、依然としてビデオバッファの制約を満たし、エンコ
ードされたビデオを記憶する媒体の記憶容量を上回らず
に、それぞれ最高品質のビデオと最低品質のビデオが設
定されたエンコードされたビデオを入手するのが望まし
い。最大品質または最小品質に設定されるセクションが
ある場合は、フローは、ステップ310に進み、そこで最
大ケースまたは最小ケースの修正ビット数が計算され
る。このプロセスは図15に詳しく示される。

【０１０７】図15では、最大ケースおよび最小ケースに
割り当てられたビット数を求めるプロセスが、マッピン
グされた優先順位の10と0にそれぞれ割り当てられたビ
デオのセクションに最小レートおよび最大レートを割り
当てることによってステップ320で開始する。図14のス
テップ302では、このマッピングおよび時間的編集の記
述の残りの部分が実行され、それ以外の明確な指示がな
いかぎり、マッピングされた優先順位が参照される。以
下に記述されるように、最大データレートはデコーダの
能力により制限を受け、毎秒1 Mbitsとなり、最小デー
タレートは、示しているように図13でユーザインタフェ
ースによりブロック図され、通常は毎秒3Mbitsとなる自
動エンコードモードの間に使用される最小ビットレート
を下回ることもあれば、上回ることもある。

【０１０８】それから、ステップ322では、マッピング
された優先順位1から9が設定されたセクションがあるか
どうか判断される。つまり、最大品質または最小品質が
割り当てられていることに加え、ユーザが割り当てるそ
れ以外の中間品質が存在するのである。それ以外のマッ
ピングされた優先順位がある場合には、フローはステッ
プ324に進み、1と9の間のマッピングされた優先順位が
設定されるすべてのセクションの平均ビットレートが計
算される。この平均が許容範囲（最大ビットレートと最
小ビットレートの間）にない場合、フローはステップ32
8に進む。ステップ328では、最大レート、つまり最高の
画質を実現するレートは、平均が最小レートを下回る場
合に低減される。最大レートを引き下げることにより、
非最大状況および非最小状況（マッピング優先順位1-
9）に使用できるビット数が多くなり、それにより平均
が希望の範囲内または希望の範囲近くとなる。代わり
に、ステップ328では、平均が最大レートを上回る場
合、最小データレートは引き上げられ、それにより非最
大状況および非最小状況（例えば、優先順位1-9）のビ
ット数が引き下げられる。ステップ328の後、フローは
平均が範囲内になるまでステップ324、326、および329
が繰り返される324に戻る。さらに、最大ビットレート
および最小ビットレートは、「保護つき」セクションが
品質の調整の前と同じビットを受け取ることを確実にす
るために調整される。

【０１０９】いったんステップ326で平均が範囲内にあ
ると判断すると、フローはステップ330に進み、それぞ
れマッピングされた優先順位10と0が設定されるセクシ
ョンに計算された最小レートおよび最大レートが割り当
てられる。それから、ステップ332で、残りのビット
は、保護つきではなく、最大状況や最小状況でもないセ
クションに分配される。マッピングされた範囲1-9が設
定されるビデオのセクションおよびデータレートの変更
方法については、図16Aおよび図16Bに関して後で説明す
る。

【０１１０】ステップ322でマッピングされた優先順位1
-9が設定されるセクションが存在しない、つまり最大セ
クション、最小セクションまたは保護つきセクションだ
けが存在すると判断した場合は、ステップ340で、ビッ
トの最終割当てが自動エンコードによるビットの初期割
当てと等しくなるまで、必要に応じて最小レートおよび
最大レートを調整する。ステップ340を実行する2通りの
代替方法がある。第1に、最大ビットレートRmaxは、例
えば毎秒8 Mbitsで固定されている。総合的な編集セグ
メントの合計ビットは理解されているため、最小データ
レートであるRminは、自動エンコードの間に獲得される
と同じビット総数を達成するために調整されるだけであ
る。Rminを総ビットの以前の数を達成するために調整す
ることができない場合には、自動エンコードの間に獲得
されるビット総数を達成するために、最大データレート
Rmaxが調整される。

【０１１１】代替策として、ステップ340では最大品質
セクションに優先順位1および最小品質セクションに優
先順位9が指定され、編集セグメントの期間の新しいビ
ットレートを求めるために、図16Aおよび図16Bにブロッ
ク図で示されるビット割当てアルゴリズムが実行され
る。それから、ステップ342で図16Aおよび図16Bに従っ
て計算されたデータレートが、以下に説明するように、
最低指定品質および最高指定品質が設定されるセクショ
ンに割り当てられ、図15のプロセスが終了する。

【０１１２】ステップ308およびステップ310が、必要な
場合に実行された後で、ステップ312で、すべてのセク
ションにマッピングされた優先順位1-9が設定されるか
どうか判断する。これが当てはまると、フローはステッ
プ314に進み、図16Aおよび図16Bに詳説するように、マ
ッピングされた優先順位の修正ビット数が計算される。

【０１１３】図16Aの最初のステップでは、使用される
共通ビットプールのサイズを決定する。当初、保護つき
ではないマッピング優先順位1-9が設定されるすべての
セクションでゃ、一定数のビットが削除されている。再
分配深度と呼ばれる係数k1は、このために使用され、例
えば、0.4に設定され、以前に（つまり自動エンコード
実行から）割り当てられたビットの40%が、保護つきで
もなく、最大品質や最小品質によりマークされてもいな
いあらゆるセクションから削除されることになることを
意味する。

【０１１４】次に、ステップ362では、ユーザ選択品質
がどの程度品質に影響を及ぼすかを判断する。動的範囲
係数と呼ばれる変数k3が設定され、優先順位から生じる
ことになる品質変更を決定する。k3がどのように設定さ
れるかに応じて、例えば優先順位2は、品質での相対的
に小さな向上、または品質での比較的に大きな向上のよ
うなさまざまな品質の変更を課す場合がある。通常、動
的範囲係数k3は、1.0に設定される。

【０１１５】ユーザ選択優先順位をビットの再分配で使
用するには、形式exp（−優先順位/k3）の指数的な関係
が使用される。指数内の動的範囲係数k3が、指数曲線の
形状を決定する。曲線は、動的範囲係数の値が大きくな
るほど急勾配となり、実質上、変化する優先順位が設定
されたセクションの間で割当てし直したビットでの不均
衡が強まる。この負の指数は、マッピングされた優先順
位の絶対値が増加するに従い（さらに低い優先順位セク
ション）、そのセクションに割り当てられるビットは減
少する、つまりマッピング優先順位1は最高の優先順位
で、9まで数を引き上げると設定される優先順位が低く
なることを意味する。

【０１１６】ステップ364では、ユーザ選択優先順位が
正規化される。つまり、ユーザが選択した優先順位が、
各セクションの相対優先順位を決定するために使用され
る。まず、E1が計算される。この場合、p1とはマッピングされたユーザ選択優先順位
で、ｉは、保護つきまたは最大品質や最小品質が設定さ
れる期間を除く、編集セグメント内のセクション期間で
ある。次に、優先順位製機化係数k2が、以下のように計
算される。

【０１１７】この場合、Nはセクション数である。優先順位正規化係
数は、優先順位に従って割当てし直されたすべてのビッ
トの合計が、つねに、ビットの使用可能な共通プールに
等しくなることを確実にするために必要とされる。

【０１１８】したがって、各セクションの相対優先順位
は、以下のように計算される。

【０１１９】 Riはｉ番目のセクションの相対優先順位の端数であるの
で、すべてのRiの求和は単一となる。

【０１２０】ステップ366でセクションのサイズが正規
化される。割り当てられた優先順位が設定される期間の
サイズは異なり、ビットはさまざまなセクションのサイ
ズに比例して分配されなければならないので、これが必
要である。第1に、編集済みフレーム総数での各期間内
のフレーム数の端数Ti（保護つきではない、非最大、ま
たは非最小優先順位が設定されるフレーム）は、以下に
従い求められる。

【０１２１】Ｔ_ｉ＝Ｎ_ｉ／Ｎ (8) この場合、Niはｉ番目の期間内のフレーム数であり、N
は編集セグメントのフレーム総数である。つまり、改変
され、保護されておらず、最大でも最小でもない優先順
位ではない）優先順位が指定されるすべてのフレームで
ある。したがって、サイズ正規家系数k3は、以下の等式
に従い計算される。

【０１２２】この場合、Nはセクション数である。図16Aのステップ36
6から、フローは図16Bのステップ368に進む。

【０１２３】図16Bでは、ステップ368で、以下の等式に
従い、ビットの共通プールが求められる。

【０１２４】この場合、Biはｉ番目のセクションの自動エンコード手
順の間に使用されたビット数に図15のステップ332で分
配されたあらゆるビットを加算したビット総数である。
求和は「N」セクション上である。

【０１２５】それから、ステップ370で、以下の等式に
従い各セクションに割り当てられるビットのターゲット
数を求める。各セクションのビット総数Fiは、ビットの共通プールの
パーセンテージにビットの共通プールに与えられたビッ
ト分低減されたビット(Bi)の元の数を加算したものに等
しい。ビットの共通プールからのビットのパーセンテー
ジは、各セクションのフレーム総数の端数(Ti)、セクシ
ョンの相対優先順位(Ri)、およびセクションのそれぞれ
に総計されるフレームおその対応する端数で乗算される
セクションの優先順位に依存するサイズ正規化係数(k3)
に基づいている。

【０１２６】ステップ370で計算されたセクションごと
に割り当てられたビットのターゲット数が最大データレ
ートと最小データレートの間にない場合がある。これが
当てはまると、ステップ372で、再分配深度k1が0.01低
減され、フローは、ステップ368のビットの共通プール
を計算し直し、ステップ370のビットのターゲット数を
計算し直すために戻る。ステップ368、370、372および3
74のループが、ステップ370で計算されたビットのター
ゲット数が最大データレートと最小データレートの間に
なるまで実行される。

【０１２７】それから、ステップ376では、ビット位取
り因数Siおよびイントラフレームおよび非イントラフレ
ームが、希望の品質を獲得するために異なるビット数を
必要とする。まず、ビット位取り因数Siが、以下の等式
に従い計算される。次に、イントラピクチャおよび非イントラピクチャの位
取り因数が計算される。イントラ位取り因数SIiは、以
下の等式い従い計算される。大きなイントラフレームにより、バッファアンダフロー
が発生する可能性があり、イントラ因数Ifは、イントラ
ピクチャのビット割当てでの変動を、If=0.8のときに20
%に制限することによって安全率を示す（つまり、SIiは
範囲0.8<ＳＩｉ<1.2に制限される）。Si'-Si-1.0である
ことに注意する。非イントラビット位取り因数SNiは、
以下のように計算される。この場合、BIiおよびBniは、ピクチャタイプによってｉ
番目のセクションで合計される総イントラビットと非イ
ントラビットである。

【０１２８】最後に、フレームごとに使用されるビット
数は、適切な食らい取り因数（イントラ位取り因数また
は非イントラ位取り因数のどちらか）で乗算される元の
ビット数を使用して求められる。それから、図16B（お
よび図14）のプロセスが終了する。

【０１２９】この時点で、各フレームの修正されたビッ
ト数が計算され、図12のステップ286が完了する。ただ
し、フレームの変更済みビット数によりバッファアンダ
フローが生じたり、編集セグメントの立ち下がり端での
ビット数の占有が、編集セグメントの外のそれ以降のフ
レームがアンダフローするように変化する場合がある。
これらの状況は、必要ならば、図17に詳説される図12の
ステップ288で調べ、訂正される。

【０１３０】図17は、バッファアンダフローがないか確
認、訂正し、編集セグメントの立ち下がり縁でのビット
再割当てのための問題を確認、訂正するプロセスを説明
する。図17では、ステップ390で編集セグメントのフレ
ームのそれぞれのビット割当てをスキャンする。それか
ら、ステップ392で、前述のVBVモデルを使用する新しい
ビットの分配のアンダフローがないか確認する。アンダ
フロー問題が存在し(u_flowリスト）、各アンダフロー
を排除するのに必要なビット数が求められ、u_valに記
憶されるポイントのリストが作成される。アンダフロー
が、多すぎるビットによって表されるピクチャのために
発生することを頭に入れていおくことが重要である。多
数のビットで表される高品質のピクチャがデコーダによ
ってバッファから読み出される場合は、ピクチャが復号
化されるときにバッファから多数のビットが削除され、
これらのビットは十分に速く再び満たすことはできな
い。したがって、アンダフローを排除するためには、ビ
ットはピクチャ空削除される。さらに、ステップ392で
は、バッファがいっぱいであるポイントのリストが作成
され、これらのポイントはo_flowに記憶される。前述し
たように、バッファがいっぱいになると、データはバッ
ファに伝送されなくなるので、バッファがいっぱいであ
っても問題はないことに注意する。

【０１３１】ステップ394では、編集セグメントの立ち
下がり縁でのバッファ占有を調べる。動作のVBRモードで
は、編集済みビデオセグメントの立ち下がり縁でのバッ
ファ占有が、編集済みセグメントがまったく同じビット
数で置き換えられていても、修正された実行のバッファ
占有とは異なる可能性がある。これは、VBR用のVBVモデ
ルの特異性から生じる。したがって、バッファ占有の制
約を調べることが重要である。編集セグメントの立ち下
がり縁でのバッファ占有がビットの再分配の前とまった
く同じか、あるいさらに高い場合に、問題は存在しない
ことを示すのはかなり簡単である。バッファ占有が以前
とまったく同じ場合には、それ以降のフレームの占有
も、VBV違反がないかすでに確認済みの以前の実行とま
ったく同じままとなる。占有が以前より高い場合、バッ
ファがそれ以降のフレームの間にいっぱいになる可能性
があり、それは、バッファがいっぱいな場合、データは
バッファに送られなくなり、アンダフローは発生しない
ので完全に許容できる状態である。しかし、以前の実行
と比較して、バッファ占有が立ち下がり縁でさらに低い
場合に、第3のケースが生じる。これは、それ以降のフ
レームでバッファアンダフローを作成する可能性があ
り、密接に調べる必要がある。編集セグメントの最後の
フレームを、バッファセグメントの外側でのフレームの
バッファアンダフローを防ぐために処理できる2通りの
方法がある。第1のアプローチは、2つの内で簡単な方で
ある。編集セグメントの最後のフレームのビット数によ
り、（ログファイルに記憶される）元のエンコードより
大きいまたは元のエンコードに等しいバッファ占有が生
じる場合、アンダフロー問題は存在せず、したがって処
置を講じる必要はない。編集セグメントの最後のフレー
ムのバッファ内のビット数が、最初にエンコードされた
セグメントのバッファ内のビット数を下回る場合、ビッ
トのこの低減された数により、編集セグメントの後のフ
レームの内容に応じて、編集セグメントの外側のフレー
ムのアンダフローが生じる場合もあれば、生じない場合
もある。アンダフローが発生しないように防ぐのに必要
となるビット数を求める代わりに、編集セグメントの最
後のセグメントのバッファの占有が、元のエンコードの
場合と同じになるように調整されるだけである。安全性
の目的から、編集セグメントの最後のバッファ占有また
は十分さは、アンダフローの可能性がないことを保証す
るために元のエンコードの占有の10%上まで引き上げる
ことができる。編集セグメントの最後のフレームのバッ
ファ占有を元のエンコードのレベルになるように引き上
げる必要がある場合は、終了フレームのビット数をステ
ップ398で実行したように低減する必要がある。最後の
フレームはアンダフローポイントとして処理され、u_fl
owリストに格納され、バッファレベルを元のエンコード
のレベルまで引き上げるために最後のフレームから削除
する必要があるビット数がu_valに付加される。

【０１３２】編集セグメントの再エンコードにより生じ
るアンダフローを処理するための第2のアプローチは、
編集フレームの外側でバッファアンダフロー状況を引き
起こさない編集セグメントの最後のフレームのバッファ
の最小可能レベルを概算する反復プロセスである。これ
は、元のエンコードのバッファ占有と編集セグメントの
最後のフレームの再エンコードのバッファ占有の間の最
大差異を概算するプロセスにより実行される。

【０１３３】図18にブロック図で示されるフローチャー
トを見ると、元のエンコードバッファ占有にはB0が割り
当てられ、元のエンコードのログファイルに記憶されて
いた。ｉ=1...nの場合に編集セグメントの境界を超えた
フレーム「ｉ」でのバッファ占有はBiである。この場
合、「n」はエンコードされる映画内の最後のフレーム
に相当する。再エンコードのバッファ占有が、連続する
フレームのどれかでアンダフロー状況を引き起こさずに
元のエンコードからどの程度低くなることができるか
は、再エンコードのバッファレベルを、少なくとも、そ
れが元のエンコードのためであったポイントに設定する
だけの第1アプローチとは対照的に決定されなければな
らない。この条件を満たす境界での新しいさらに低いバ
ッファ占有をB0'にする。これは、編集セグメント境界
での最小許容バッファ占有である。以前の実行のバッフ
ァ占有より低いバッファ占有を設定する可能性は、差異
が、編集セグメント後のもっと遅いフレーム間隔で吸収
されるため、アンダフローが発生しないという事実から
生じる。

【０１３４】図18のステップ420で開始し、編集セグメ
ントの最後のフレームの再エンコードされたビデオのバ
ッファ占有B0'が、将来アンダフローを引き起こすこと
なくゼロであると想定する。これは、バッファ占有が、
アンダフローを防ぐためにはより高くなければならない
が、バッファ占有はゼロを下回ってはならない可能性が
あるため、B0'に関してもっとも自由な概算である。し
かし、図18のプロセスは、再エンコードされたの編集セ
グメントの最後のフレームのゼロの占有によりアンダフ
ローが生じるかどうか、および生じる場合、アンダフロ
ーを引き起こさない値B0'が見つかるまで、編集セグメ
ントの最後でバッファ占有を増加させるかどうかを確認
するためにチェックする。

【０１３５】図18のプロセスでは、元のエンコードと再
エンコードの間の概算バッファ占有差異「X」を評価す
る。

【０１３６】差異「X」は、「X」がチェックされ、必要に応じてアン
ダフローのすべての可能性が排除されるまで調整されて
いることが保証されるまで、最終的に決定できないので
概算と呼ばれる。図18の手順は、境界フレーム直後のフ
レーム、つまりｉ=1で開始して、一度に1フレームづつ
進む。B0'がゼロに等しい第1フレームの場合、概算差異
は、ステップ422で計算されるように、元のエンコード
の第1フレームのバッファ占有の値であるのにすぎな
い。

【０１３７】次に、ステップ424では、境界フレームの右側にあるフ
レームにより吸収されるビット数を求める。吸収される
ビット数とは、元のエンコードの編集セグメント後のフ
レームによりバッファの中に格納される場合もあるが、
実際には、バッファがいっぱいであるためにさらにビッ
トを受け入れることができなかったために元のエンコー
ドの間バッファに格納されなかったビットを指す場合に
使われる言い回しである。量△tiは、バッファがその間
いっぱいであったが、B0'の値が引き下げられたために
現在では追加ビットを受け入れることができる編集セグ
メントの後の元のエンコードのｉ番目のフレームの期間
を表す。バッファはフレーム全体でいっぱいとなること
はできず、ゼロより大きいか、ゼロに等しいため、期間
△tiはフレームの期間を下回らなければならない。元の
エンコードの間にバッファが一度もいっぱいでなかった
場合には、期間△tiはゼロである。したがって、この場合、'P'は毎秒フレーム単位で測定され、通常、
毎秒30フレームであるピクチャレートである。バッファ
がいっぱいである結果、編集セグメントの右側で吸収さ
れるビット総数は、以下のように計算される。

【０１３８】この場合、Rmaxはバッファの充填レートである。

【０１３９】ステップ426では、編集セグメントの最後
のフレームのバッファ占有レベルを求めるための手順が
終了できるかどうかを判断する。ｉ番目のフレームによ
って吸収されるビットの合計がX'を上回る、つまりai>
X'である場合は、バッファアンダフローが発生しない
で、ステップ428が実行されるように、バッファはもっ
と遅いフレームで満たされることができるため、手順は
停止される。代わりに、最後のフレームnに到達すると
(I=n)、ビデオの最後までX'の概算値によりアンダフロ
ー問題が生じることはない。

【０１４０】ステップ426に対する回答が「ノー」の場
合、ステップ430で吸収されずに残るビット数biが計算
される。

【０１４１】それから、ステップ432では、bi>Biであるかを判断す
る。この場合、Biとは編集セグメントの後のｉ番目のフ
レームのバッファ占有である。bi>Biの場合、現在のバ
ッファ占有「Bi」が許容するより多くのビットが吸収さ
れないで残っているため、差異の概算値、X'は大きすぎ
て、アンダフローを生じさせる。したがって、吸収され
ずに残るビットの間では、「Bi」ビットだけがアンダフ
ローを引き起こさずに吸収できる。次に、差異の概算X'
はステップ434で改訂されなければならない。ステップ4
34では、X'の改訂された概算は、吸収されずに残るビッ
トに吸収されたビットを加算したものとして計算され
る。

【０１４２】ステップ432で、Bi<Biであると判断する場合、ｉ番目の
フレームでのバッファ占有は吸収されないで残るビット
より大きいので、アンダフローの問題はなく、X'の概算
を変更する必要はなく、フローはステップ436に進む。
ステップ436では、次のフレームが調べられ（ｉは1で増
分される）、ステップ424、426、430、432、434、およ
び436のループが、ステップ426での判断に肯定的な回答
が得られるまで繰り返される。

【０１４３】ステップ426に肯定的な回答が得られる
と、概算X'は受け入れられるため、ステップ428では、
編集セグメントの境界での最小許容バッファ占有B0'は
以下の通りである。編集セグメントの再エンコードされた最後のフレームの
実際のバッファ占有がB0'を下回る場合、アンダフロー
状況がビットの再割当てのために発生する。この場合、
最後のフレームはu_flowリスト内のアンダフローポイン
トとしてマークされ、アンダフロー状況（変更済みビデ
オのビット数と結果的に最小許容バッファ占有を生じさ
せるビット数B0'の間の差異）を防ぐための編集セグメ
ントの最後のフレームから削除する必要があるビット数
は、ステップ392について記述されたのと同様にu_valの
中に格納される。

【０１４４】本発明のエンコードシステムの場合、ビデ
オの中のすべてのポイントのバッファ占有を知っている
ことが望ましく、この情報はログファイルに記憶される
ことに注記すべきである。しかし、編集セグメントの最
後のフレームでのバッファ占有を引き下げる場合には、
編集セグメント後のフレームのバッファ占有が変更さ
れ、ログファイル内のバッファ占有情報が不正確にな
り、そのため編集セグメント後のフレームのバッファ占
有を計算し直す是正処置を講じる必要があるだろう。

【０１４５】図17のプロセスに戻って参照すると、ステ
ップ396では、u_flowリスト内にエントリがあるかどう
かを判断する。ない場合は、アンダフロー問題は存在せ
ず、図17のプロセスは終了する。u_flowリストにエント
リがある場合は、フローはステップ398に進み、u_flow
リスト内の各位置の左側からもっとも近いo_flowポイン
トまでのセクションが保護つきとマークされ、u_val内
の対応するビット数に等しいビットがこれらのセクショ
ンから削除される。バッファアンダフローは1つ以上の
フレーム内の多すぎるビットにより引き起こされるた
め、フレーム内のビット数を低減すると、アンダフロー
問題が解決される。アンダフローを防止するために削除
されるビットが原因で画質に著しい低下が生じないよう
にするために、ビットはアンダフローポイントだけから
削除されるのではなく、バッファがいっぱいであった最
後のポイントまで戻ってすべてのフレームから均一に削
除される。これが、アンダフローを防止しながらも最高
品質のビデオを獲得する方法となる。

【０１４６】その後、ステップ398で削除されるこれら
のビットは、ステップ400で保護つきとマークされない
セクションに均一に分配され、図17のプロセスがもう一
度開始する。ステップ400でビットを分配しても、アン
ダフローが問題ではなくなるという保証にはならないた
め、図17のプロセス全体を繰り返し使用して、アンダフ
ロー状況がないか再度確認する必要がある。

【０１４７】図17のプロセスが完了した後、図12のステ
ップ288は完了し、図12のステップ290が実行される。ス
テップ290では、ステップ282で求められるレート−量子
化関数を使用してフレームごとの平均量子化値を求め
る。希望されるビットの数は、以前ステップ286で計算
され、ステップ288でアンダフロー問題が存在するかど
うかを確認するためにチェックされたが、エンコードさ
れたデータに希望のビット数が設定されるようにデータ
を再エンコードするためには、量子化値を求めなければ
ならない。これは、レート−量子化関数を求め、レート
を捜し出すことで量子化値を求めるだけで、決定され
る。

【０１４８】ピクチャ単位で量子化レベルを求める場合
は、レート−量子化関数(RQF)は、ステップ282で求めら
れた。この関数を概算するには、ピクチャごとに2つの
データポイントが必要とされる。RQFは以下の通りであ
る。

【０１４９】この場合、Rは1つのピクチャをコーディングするために
使用されるビット数、Qは量子化スケール、X、g、およ
びHはピクチャ単位のコーディング特性パラメータであ
る。Hは、Hがヘッダにより消費されるビット、運動ベク
タ、DC係数などとなるように、量子化スケールとは独立
したビットを表す。

【０１５０】エンコーダの最初の実行は、ビデオシーケ
ンス内のコーディングされたピクチャごとに2つのデー
タポイントを作成するために使用できる。これは、ピク
チャ内のマクロブロックごとに使用される1組の交互の
量子化スケールにより実行できる。これらは、レート−
量子化モデルパラメータ「X」と「g」を計算するために
処理される。これらの2つのパラメータは、Hの値ととも
に、コーディングされたビデオのフレームごとに1つ、
ファイル内に記憶できる。

【０１５１】ビデオのある特定なコーディングされたフ
レームに割り当てられるターゲットビットを作り出す量
子化スケールを求めるために、「R」がターゲットビッ
トを表す前記等式が使用され、(X、g、H)の値が前記のロ
グファイルである可能性がある記憶されたデータファイ
ルから読み取られる。この等式に最適の「Q」の値が希
望の量子化スケールである。

【０１５２】それから、ステップ292でステップ290で求
められた量子化値を使用してビデオの変更されたセクシ
ョンを再エンコードする。再エンコードの間に特別な手
順が講じられない限り、既にエンコードされたビデオの
再エンコードセグメントによりエンコードによって問題
が生じる可能性があることに注記すべきである。エンコ
ード構造および復号化構造を回避するための再エンコー
ドプロセスの詳細は、以下の別個の項に説明する。ビデ
オは再エンコードされてから、以前エンコードされたビ
デオのビットストリームに代入され、プロセスは終了す
る。

【０１５３】図5に関して記述するように、ユーザは、
ビデオが許容できるかどうかを判断するために、ビデオ
が再エンコードされた後でビデオを表示することができ
る。ビデオが許容できない場合には、ユーザは新規にエ
ンコードされたビデオを受け入れる必要はなく、既にエ
ンコードされたビデオの使用を続けることができる。ユ
ーザが新規にエンコードされたビデオが望ましいとわか
ったら、新規にエンコードされたビデオで既にエンコー
ドされたビデオは置き換えられる。それから、ユーザ
は、図5に説明するように、ビデオの新しいセグメント
を、空間的に、または時間的に編集できる。

【０１５４】図19（A）および図19（B）では、オリジナ
ルビデオエンコードからの、およびユーザが手動品質優
先順位を入力した後のビットレートの2つの異なる例を
示している。図19（A）および図19（B）では、（メガビ
ットを表す106のスケールでの）ビットレートが、ピク
チャのグループ番号に対してプロットされる。ブロック
図で示される例では、1つのGOPに15のピクチャが格納さ
れ、各GOPは0.5秒ごとに表示される。また、実線は元の
エンコードを示し、破線はユーザが手動で画質を調整し
た後のエンコードを示す。

【０１５５】図19（A）では、優先順位2、-3、3、0およ
び保護つきが設定される5種類の異なった優先順位領域
のあるエンコードを説明する。優先順位3が設定される
期間は、再エンコードの後に、元のエンコードに比較し
てさらに多くのビットを使用する。優先順位はただ単に
互いに相関しているだけなので、優先順位2が設定され
るセクションのビットレートは、著しく上昇していない
が、-3および0のセクションではビットレートは低下し
ている。保護つきセクションには、再エンコードの前に
存在したのと類似した再エンコード後のビットレートが
設定されなければならない。

【０１５６】図19（B）は、それぞれユーザが選択した
優先順位0、2、0、4、および0が設定された領域のある
第2例である。ここでも、優先順位は互いに相関してい
るので、優先順位0は、ビットレートが未変更であるこ
とを意味するのではなく、単に、優先順位2と4が設定さ
れるそれ以外のセクションに相対する優先順位である。
優先順位4にが設定されるセクションに高いビットレー
トを指定するために、ユーザ選択優先順位0が設定され
るこれらのセクションは低減され、優先順位2が設定さ
れるセクションには、エンコードの前後とほぼ同じビッ
トレートが設定される。

【０１５７】時間的手動編集の処理は、本発明の実施例
の図1Aのワークステーション30で発生する。ただし、時
間的手動編集はビデオエンコードプロセスの間は発生し
ないので、ワークステーション10はビデオエンコードプ
ロセスのレートを低下させないで時間的手動編集計算を
実行できる。

【０１５８】本発明が、編集セグメント内でのさまざま
な時間セグメントの画質の変更として詳しく記述される
ことに注記すべきである。言うまでもなく、同じ時間セ
グメント内にないピクチャのセクションの質の変更を許
可するためにこの概念を拡張することは明らかに可能で
ある。例えば、映画の最後の5分間の質を最初の5分間を
犠牲にして向上させるために、本発明の教示を適用する
ことができる。以下に説明するように、単独編集セグメ
ントの外側にある期間の品質を変更することが希望され
る場合、ユーザは、関心のあるセグメントを連続して表
示し、チェックし、ビットを割当てし直し、各セクショ
ンの立ち下がり縁でのバッファ占有だけではなく、映画
の合計ビットに関係する制約が規定の限度内にあること
を確認する必要があるだろう。

【０１５９】時間的手動編集は、編集セグメントの元の
エンコードのビット数を、編集セグメントの再エンコー
ドのビット数と同じにしておくこととして記述されてき
た。しかし、希望される場合には、再エンコードされた
の編集セグメントが消費するビットをさらに少なくした
り、十分な記憶容量が存在する場合には、再エンコード
されたの編集セグメントのビット数が元のエンコードの
ビット数を上回ることがある。また、ビデオの元のエン
コードを、それにより最終デジタル記憶媒体上の使用で
きるすべての記憶スペースが消費されないように実行す
ることもできる。したがって、再エンコード後のビット
総数は、元を上回るまたは下回る任意の量、例えば5%と
1%多いまたは少ないビットを含む、0%と20%の間で多い
か少ない量を消費できる。

【０１６０】時間的手動編集の説明は、ビデオエンコー
ド後にビデオを変更することに関して行われてきた。し
かし、本明細書に記載される教示は、初期エンコードプ
ロセスがなかったシステムにも適用できる。さらに、共
通ビットプールの使用に関する時間的手動編集の教示
は、以下に示すビデオフレームの空間手動編集の概念に
適用できる。また、空間手動編集の個々のフレームでの
動作様式は、以下に説明するように、上質の時間的編集
を達成するためにフレームの列に適用できる。 B. フレームの領域内での品質の変更図20には、1つ以上のフレーム内で領域の品質を変える
ための一般的な手順を説明する。開始後、ステップ450
では、システム構成要素および一般的なシステム動作に
関する項に説明するように、MPEGフォーマットやそれ以
外のフォーマットのような圧縮済みデジタルフォーマッ
トに入力ビデオをエンコードする自動ビデオエンコード
を実行する。ステップ452では、ユーザにエンコードさ
れたビデオが表示され、ステップ454では、ユーザは1つ
以上のフレーム内の領域の品質の変更を示すコマンドを
入力できる。

【０１６１】図21には、図1Aに示されるビデオディスプ
レイモニタ61のようなモニタ上で表示されるビデオのフ
レームがブロック図が示される。図21のビデオのフレー
ムは、木465、人467、鳥468、および2つの雲471がある
として描かれる。

【０１６２】図21では、フレーム内の領域が、木465を
取り囲む領域466、人を取り囲む領域469、および領域47
0、重複領域469を含めて、ならびに鳥468および人467の
頭を含めて限定される。これらの領域は、図1Aに示され
るグラフィックポインティングデバイス33を使用して描
画された。図21でユーザが設定した品質優先順位には、
木を含む領域466の-5、人を含む領域469の+2、および鳥
と人の頭を含む領域470の+4が含まれる場合がある。図2
1内のビデオのフレームのそれ以外の領域には、ユーザ
定義優先順位は指定されず、したがって、「無定義」優
先順位が指定される。後述するように、「無定義」領域
とは、ユーザ定義優先順位が指定されるフレームのエン
コードのビット総数を、フレームの元のエンコードの結
果生じるビット数に等しくなるように調整する目的で、
ユーザ定義領域の量子化レベルを変更した後に最初に修
正される領域のことである。ユーザがフレームの領域の
品質の変更を希望しない場合、これらの領域は、ユーザ
によって優先順位ゼロが設定されるとマークされるだろ
う。

【０１６３】本発明の実施例では、ビデオのフレーム内
で優先順位領域を限定すると、ユーザは、当初グラフィ
ックポインティングデバイスを使用して、ビデオの表示
されたフレーム上に矩形領域を作成する。後で定義され
る領域は先に定義される領域の上に格納され、先に定義
される領域と重複することがある。本発明が矩形領域を
限定することに関して説明していても、本発明の教示
を、円や楕円のような曲線を含む領域、八角形や六角形
のような多角形の領域、またはそれ以外の、曲線または
直線あるいはその両方を含むユーザが定義する形状にも
適用できるのは言うまでもない。ユーザは、各領域を定
義してから、領域の優先順位を定義する。代わりに、ユ
ーザは、すべての領域の形状を定義し、その後にこれら
の領域に優先順位を指定することができる。

【０１６４】ユーザが初期に領域内で優先順位を定義す
る場合、領域はピクセル位置に対応する。ただし、以下
に示される優先順位を割り当てるプロセスは、マクロブ
ロック単位で動作し、マクロブロックはデジタルビデオ
エンコードに使用される単位である。したがって、マク
ロブロックがユーザ定義領域内または外周上にある場
合、そのマクロブロックには領域の優先順位が割り当て
られる。従来の技術の当業者は、単純な数学を利用して
ユーザ定義領域に対応するマクロブロックを求めること
ができる。ユーザ定義領域の外周の場合は、領域の外辺
部がマクロブロックに交差する場合に、ユーザ定義領域
内に単にマクロブロックを入れる代替策として、マクロ
ブロックを領域内に入れるかどうかを判断するさらに精
密なプロセスが、ユーザ定義領域内にマクロブロックの
50%以上がある場合には、ユーザ定義領域内にマクロブ
ロックを入れて、ユーザ定義領域内にマクロブロックの
50%以下がある場合には、ユーザ定義領域からマクロブ
ロックを排除することによって実行することができる。

【０１６５】領域およびその優先順位が定義された後
で、ユーザは、希望する場合には領域の重複を変更でき
る。例えば、ユーザは図21の領域469の上で事前に決定
されたファンクションキーを押しながら「クリック」し
て、領域469を領域470の上になるように変更し、人全体
に領域469の優先順位が設定され、鳥468だけに領域470
に割り当てられる優先順位が設定されるようにする。重
複領域には、ユーザによって入力されるときにスタック
優先順位が指定される。このスタック優先順位は、ユー
ザ定義領域が追加、削除、または修正されるときに、必
要に応じて調整される。

【０１６６】領域が定義された後で、ユーザは、希望に
応じて領域のけ以上を作りなおしたり、グラフィックポ
インティングデバイス33を使用して領域を移動すること
がもできるまた、ユーザにより定義された領域は、グラ
フィックポインティングデバイス33を使用して削除でき
る。領域が削除されていても、ユーザ定義優先順位だけ
が削除されているのであり、言うまでもなく削除中の領
域内のオリジナルビデオデータは削除されていないこと
に注記すべきである。

【０１６７】期間で品質を変更することについての前記
項に説明するように、自動エンコードの間または自動エ
ンコードの後で、ユーザはエンコードビデオをレビュー
することができ、関心のあるフレームまたは期間が発生
するたびに、ユーザはキーボードで単にキーを押した
り、入力を別の装置から入力し、特定のフレームまたは
期間が重要であることを示す。後で、ユーザはそのフレ
ームまたは期間に戻って、さらに時間を費やして期間を
検討し、希望に応じてその期間内で特徴を変えることが
できる。

【０１６８】ビデオのフレーム内の領域をユーザが定義
するプロセスは、ユーザによって修正されるデータのフ
レームが1つしかない単純なケースについて前述され
た。しかし、ビデオシーケンス内のデータのフレームを
一度に1フレームづつ作業するのはきわめて単調で退屈
であるため、本発明を使用すると、ユーザは最初の期間
で領域を定義し、後の期間で対応する領域を定義できる
ようになる。それ以降、最初のフレームと最後のフレー
ムの中間のビデオのすべてのフレームに、ユーザにより
最初のフレームと最後のフレームに定義される領域に対
応する領域が作成され、最初の領域または最後の領域あ
るいはその両方の領域と同じ優先順位、もしくは最初の
フレームと最後のフレームの優先順位に基づく優先順位
が指定されるように、補間プロセスが実行される。さら
に、重複領域のスタック優先順位は、補間プロセスの間
維持される。中間フレームにその領域が自動的に作成さ
れた後、ユーザは、希望に応じて、優先順位、領域の形
状を変更することにより改変したり、新しい領域を追加
したり、領域を削除することができる。

【０１６９】以下に、補間プロセスがどのように動作す
るのかの例を示す。ユーザに時間インスタンスt_1とt_n
での2つのフレームの優先順位領域を選択させる。ユー
ザがフレームt_1に領域を、t_nに対応する領域を割り当
てた後、これら2つの領域の座標は、t_1とt_nの間のす
べてのフレームの領域仕様を獲得するために中間フレー
ム上で補間される。定義中の実際の領域に補間を実行で
きるだけではなく、補間は品質優先順位にも実行でき
る。補間プロセスには、単純な一時関数が使用される。
ユーザがポイントa_1のあるフレームt_1の領域Aを定義
し、フレームt_nの対応する領域Aに対応するポイントa_
nがあり、中間フレームa_2、a_3...a_(n-1)内の対応す
るポイントに、以下のように定義される水平縦軸および以下のような垂直縦軸があると仮定する。この場合hとvは問題のポイントの水
平縦軸と垂直縦軸に対応する。このプロセスでは、領域
を限定する多角形の頂点だけが使用され、頂点は補間さ
れる。それから、領域は頂点により限定される。線形補
間以外の他の補間技法も実行できる。

【０１７０】前記補間プロセスは、編集対象のセグメン
ト内のすべてのフレームのすべての領域が適切に定義さ
れるまで、必要な回数実行できる。さらにこのプロセス
は、ユーザが中間プロセスの補間で決定された領域を移
動したり、領域のサイズを変更することができ、補間プ
ロセスが最初のフレームと改変された中間プロセスに、
それから中間とフレームと最後のプロセスにもう一度実
行できるように発生する微調整プロセスにより再帰的と
なる。補間プロセスは、おもに、フレームを横切って移
動する領域を定義するために使用される。しかし、本発
明には、静止しておりフレームの列内で使用される領域
を一度定義することも含まれる。

【０１７１】領域が定義され、ユーザ定義優先順位が入
力された後、各マクロブロックの新しい量子化値は、ユ
ーザによって入力された優先順位およびマクロブロック
の古い量子化値に基づいて、図20のステップ456で概算
されるか、求められる。これは、ユーザ選択優先順位の
それぞれで使用される元の量子化値の端数を示している
図22に説明される関係に従って決定される。例えば、ユ
ーザが優先順位ゼロを入力すると、使用される元の量子
化値の結果として生じる端数は1であり、元の量子化値
に変更がないことを意味する。ユーザが優先順位-3を選
択すると、元の量子化値の端数は1.58となり、優先順位
3が設定されるマクロブロックの元の量子化値が、結果
として生じる量子化値を求めるために、1.58により乗算
されることを意味する。優先順位-3は品質の低下を意味
するので、量子化レベルは、品質の低下を達成するため
に量子化レベルを引き上げる、つまりマクロブロックに
使用されるビットはさらに少なくなければならない。反
対に、3のような正の優先順位がユーザによって入力さ
れると、元の自動号化からのマクロブロックの量子化値
は量子化レベルを引き下げる0.42で乗算される。引き下
げられた量子化レベルは、マクロブロック内のイメージ
を表すにはさらに多くのビットが必要とされ、したがっ
て、画質が向上することを意味する。図22に示される線
上のポイントは(-5, 100)、(-4, 1.75)、(-3, 1.58)、
(-2, 1.42)、(-1, 1.25)、(0, 1)、(1,0.72)、(2, 0.5
8)、(3, 0.42)、(4, 0.25)、および(5, 0.01)である。
図22に説明されるマッピングは、q-レベルと優先順位の
間のこの方向の線形関係に基づいている。図22で求めら
れたポイントは、実験を通して求められ、さまざまな端
数は希望に応じてユーザ選択優先順位と使用できる。

【０１７２】優先順位-5と5はそれぞれ最低可能品質お
よび最高可能品質を獲得することを目的とする。最低品
質は、非線形量子化スケールが使用されるときの最大許
容量子化レベル112、および線形量子化スケールがMPEG-
2エンコードに使用されるときの62の結果である。ま
た、最高品質を達成するために使用される最低量子化レ
ベルは1である。したがって、図22に説明される関係か
らは、実際の許容qスケールから離れた値が生じること
があるが、これらの計算されたq値は単にその飽和レベ
ルで格納されるだけである。例えば、当初、マクロブロ
ックに量子化スケール20が設定され、ユーザがマクロブ
ロックの優先順位を-5となるように選択すると想定して
ください。100で乗算される量子化値20が、量子化スケ
ールから離れた新しい量子化レベル2,000を生み出すた
め、最大量子化値または飽和量子化値が使用される。

【０１７３】前記のように飽和レベルを使用することに
加えて、本発明では、MPEGエンコードのIフレーム、Pフ
レーム、およびBフレームの予防措置を講じる。本発明
は、Iタイプフレームの最高量子化レベルを、非線形量
子化ケースの場合96となるように、線形量子化スケール
使用時には58となるように制限する。同様に、B型フレ
ームおよびP型フレームの最高量子化レベルは、非線形
量子化スケールの場合は112、線形量子化スケールの場
合は62である。線形量子化スケールおよび非線形量子化
スケールは、MPEG規格で定義される。Iフレーム型、Pフ
レーム型、およびBフレーム型のそれぞれに使用される
最低量子化レベルは1である。言うまでもなく、図22に
ブロック図で示されるユーザ定義入力および元の量子化
値の端数は、ユーザの要件を満たすために修正できる。

【０１７４】ステップ456でマクロブロックごとに新規
量子化値が計算した後、ステップ458で、ステップ456で
求められた量氏化器値の結果生じるフレームごとにビッ
ト数を求める。本発明の実施例では、他の領域の品質は
低下したが、いくつかの領域の品質が向上した後で、各
フレームに同じビット数を獲得しなければならないた
め、このステップは重要である。新しい量子化値の結果
生じるビット数を求めるために、マクロブロックごとの
結果として生じるビット数に対する量子化レベルを適切
に概算する関数を設定する必要がある。結果として生じ
るビット数と量子化レベルの間の関係正を求めるため
に、MPEG-2エンコーダのようなビデオエンコーダの経験
的な結果の検討が実施され、求められた関係は実際の経
験的な結果に基づいている。多くのビデオシーケンスを
使用するさまざまな量子化レベルおよびフレームタイプ
のシミュレーション結果が実施された。これらの結果に
基づき、マクロブロックの量子化レベル(q)とそのマク
ロブロックをエンコードする際に使用されるビット数
(b)の間の以下の関係性は、フレームタイプに応じて、
以下の通りであると判断された。

【０１７５】この場合、Iタイプフレームの場合m=-0.75で、Bタイプ
フレームとPタイプフレームの場合、m=01.0である。さ
らに、Iフレーム、Pフレーム、およびBフレームの場合
それぞれn=15、14.5、および13.8である。これらの値
は、前記に注記されるように、多数のビデオシーケンス
で平均化される。前記等式は、エンコーダの動作を予測
するための優れた近似基準として働き、ビット数と量子
化レベルの間の関係はログ領域内で線形である。言うま
でもなく、正確であるなら、量子化レベルと結果として
生じるビット数の間のそれ以外の関係も、本明細書に記
載されるその他のレート−量子化関数を含む、指定され
た量子化レベルから生じるビット数を求める場合に使用
できる。

【０１７６】前記プロセスは、指定された指定量子化レ
ベルから生じるビット数を求める方法を説明する。しか
し、複数のエンコードが使用される場合は、新規エンコ
ードからの情報を使用して、量子化関数に対してデータ
レートをさらに正確にすることができる。初期自動エン
コードプロセスの間に、エンコードされるべきビデオの
統計を収集するのに使用される第1ビデオエンコードパ
スがある。それから、実際のエンコードである第2パス
の間に、量子化関数に対するデータレートの別の実際の
ポイントが、指定されたq-レベルから作成されるビット
数bを記述する前記等式に対応するqプロットに対するb
においてのように獲得される。データが、以下に説明す
るように、ユーザ指定選択に従ってエンコードされた
後、結果として生じるビデオは、それが希望される品質
の改善を満たすかどうかに応じて、ユーザによって受け
入れられるか、拒絶される。再エンコードするたびに、
概算されたビットに対するq-レベル関係の実際データが
作成される。新しいq-レベル割当てq'が指定されると、
求められたデータレートは、再エンコードによって得ら
れる追加データに基づいて、このポイントに関してさら
に正確に成る。新規量子化レベル、q'が以前に得られた2
つのポイントの間に該当する場合、新規q-レベルで出力
されるビット数の概算を得るために、ログ領域内で線形
補間を実行することができる。新規量子化レベル「q」が2
つの事前に決定されたq-レベルの間に該当しない場合に
は、モデルは、もっとも近いq-レベルから新しい量子化
レベルq'に補外し、エンコード時に作成されるビット数
を概算するのに使用できる。データが再エンコードされ
る時間が長いほど、エンコーダからの出力ビットに対し
てより優れた概算を得る確率が高くなることを注記す
る。

【０１７７】概算された量子化値から生じる各フレーム
のビット数が図20のステップ458で求められた後、ステ
ップ460で、ビット概算数がフレームの元のビット数に
十分近いかどうか判断し、必要ならビット数を訂正す
る。これは、図23-25Cでブロック図で示されるプロセス
に従い実行される。

【０１７８】ステップ460が実行されると、図23のステ
ップ472が、最初に、ビット概算数と元のエンコードの
ビット数の差異を求める。これは、以下の等式に従い計
算される。

【０１７９】この場合、B'は、修正されたフレームの概算ビット数、
Bは元のエンコードから結果として生じるフレームのビ
ット数、およびDは差異である。元のエンコードから結
果として生じるビット数以外のBの値を使用することが
できるのは言うまでもない。例えば、ユーザは、フレー
ムの総ビット数の増加を希望する場合、元のエンコード
から結果として生じるビット数より大きい事前に決定さ
れた量である数にBを設定できる。同様にして、ユーザ
は、フレームの元のビット数を下回るようにBを設定す
ることもできる。したがって、記録されたフレームは、
記憶領域の制約、最小品質制約、およびビデオバファア
ンダフローの可能性に応じて、元のエンコードより多い
ビットまたは少ないビットを消費することがある。ま
た、フレーム内の領域の量子化値が改変されていない場
合、その量子化値を改変された領域から結果として生じ
るビット数だけを分析し、変更されなかった領域を無視
することができる。それから、ステップ474でこの差異
を分析し、ビットが多すぎると判断されると、フロー
は、ビット数を低減するためにマクロブロックの量子化
レベルを引き上げる目的の図24A-24Cに説明されるプロ
セスのために、Bに進む。ステップ474で修正されたフレ
ーム内のビットが少なすぎると判断されると、新規フレ
ームのマクロブロックの量子化レベルは、図25A-図25C
にブロック図で示されるプロセスFに従ってさらに多く
のビットを作成するために引き下げられる必要がある。
それ以外の場合、差異が許容できるスレッショルド内に
ある場合は、マクロブロックの量子化レベルを修正する
必要はなく、プロセスは図20のステップ462を実行する
ために戻る。フレーム内のビット数を再エンコードされ
たビデオに対し同じに保つ場合、ビットは、ある領域か
ら別の領域にシフトされると考えることができる。

【０１８０】ステップ474では、差異Dは、差異をスレッ
ショルドTに比較することで分析される。スレッショル
ドは、領域の品質の変更の結果生じるビット数が総ビッ
ト数の0.001以内である場合、差異は許容でき、プロセ
スは停止できることを意味する0.001xBに設定される。
言うまでもなく、差異が許容できることを示す停止スレ
ッショルドは、別の方法で求められ、希望に応じて引き
上げたり、引き下げたり、フレームの元のビット数とユ
ーザ選択優先順位から結果的に生じるビット数の両方に
基づくことができる。図24A-図24C、および図25A-図25C
に説明されるプロセスは、図24A-図24Bがユーザ選択品
質の結果として生じるビット数を低減するために使用さ
れ、図25A-図25Cがユーザ選択品質の結果として生じる
ビット数を増加させるために使用されるという点を除
き、きわめて類似している。図24A-図25Cで実行される
プロセスの一般的な概要は、これらのプロセスの詳細を
説明する前にここで記述する。当初、ビデオのフレーム
内のマクロブロックは、「無定義」、「負の優先順
位」、「正の優先順位」、「変更不可」の4種類の内の1
つとしてラベルが付けられる。領域にユーザによる優先
順位が指定されていない場合、またはシステムによって
ユーザが「無定義」ステータスを割り当てることができ
る場合、その領域は「無定義」タイプであると見なされ
る。ユーザが-5と-1の間の、および-5と-1を含む優先順
位を割り当てると、これらの領域内のマクロブロックは
「負の優先順位」であると考えられる。領域に1と5の間
の、および1と5を含む優先順位が割り当てられると、そ
れらの領域には「正の優先順位」が設定されていると考
えられる。最後に、優先順位0で割り当てられるすべて
の領域、またはシステムによってユーザが他のなんらか
の方法で、領域の品質を変更させてはならないことを示
すことができる場合には、それらの領域のマクロブロッ
クは「変更不可」タイプと見なされる。4種類のマクロ
ブロックのそれぞれの中でのマクロブロックのそれぞれ
には、4種類の内のそれぞれに独自のインデックスのセ
ットが備えられるように、インデックスｉでラベルが付
けられる。ゼロのインデックスｉは、最初のマクロブロ
ックに割り当てられ、インデックスn-1は最後のマクロ
ブロックに割り当てられる。この場合、Nはある領域種
類内のマクロブロックの総数である。例えば、「無定
義」領域のすべてに対し、これらの領域内のマクロブロ
ックのそれぞれに0からn-1のインデックスが付けられ
る。3つ以上の「無定義」領域がある場合、「無定義」
領域に2つの異なるインデックスｉ＝0がないことに注記
する。すべての「無定義」領域に対しては、インデック
ス0が付いたマクロブロックは1つだけ、インデックス1
がついたマクロブロックは1つなどである。

【０１８１】ユーザが領域の優先順位を決定した後にフ
レーム内のビットが多すぎる場合、フレームの量子化レ
ベルは、フレームのビット数を低減するために引き上げ
られなければならない。マクロブロックの元の量子化値
が、図10（A）または図10（B）のどちらかにブロック図
で示されるフォーマットを持つマクロブロックレーヤの
ログファイルから削除される。代わりに、エンコーダは
再実行し、量子化値がエンコーダの元の実行の後に記憶
されていなかった場合には、量子化値を求める。しか
し、別の代替策では、エンコードされたビットストリー
ムを復号化し、元のエンコードの量子化値を求める。ビ
ット数を低減するために、手順は、「無定義」タイプの
マクロブロックごとの量子化レベルを1量子化レベル、
一度に1マクロブロックづつ引き上げることで動作す
る。これで問題が解決されない場合、「無定義」の各マ
クロブロックのqレベルは、一度に1マクロブロックづつ
再度1増加される。事前に決定された最大量子化レベル
が設定され、無マクロブロックの量子化レベルを超えて
増加できる。「無定義」タイプのすべてのマクロブロッ
クがこの最大レベルに達すると、「負の優先順位」およ
び「正の優先順位」の領域は、同じように1増加され
る。まず、すべての負の優先順位マクロブロックが1量
子化レベル引き上げられ、これでビット差の問題が解決
されない場合、「正の優先順位」マクロブロックのマク
ロブロックの量子化レベルが1増加される。これで問題
が解決しない場合、「負の優先順位」マクロブロックの
量子化レベルは再び1増加され、これで問題が解決しな
い場合には、「正の優先順位」タイプのマクロブロック
の量子化レベルが1増加される。このプロセスは「負の
優先順位」タイプおよび「正の優先順位」タイプのすべ
てのマクロブロックの量子化レベルが前記最大レベルに
引き上げられるまで続行する。これでビット差問題が解
決しない場合には、「変更不可」タイプのマクロブロッ
クの量子化レベルが、ビット差問題が解決されるまで、
一度に1量子化レベル引き上げられる。十中八九、ビッ
ト差問題は、「変更不可」タイプの量子化レベルが変更
され始める前に訂正されるだろう。ユーザ選択優先順位
が設定されるフレームのビット数が少なすぎて、図25A-
図25Cのプロセスに従ってビット数を増加するために、
マクロブロックの量子化レベルを引き下げる必要がある
場合、類似したプロセスが発生する。

【０１８２】今度は、生じたビットが多すぎてしまった
ときに図23によって実行される図24Aにブロック図で示
されるフローチャートを参照すると、プロセスはブロッ
クタイプを「無定義」タイプに設定するステップ480に
より図24Aで開始する。それから、ステップ482で、マク
ロブロックインデックスを、インデックスｉがゼロに等
しく設定されることを意味する開始ポイントに設定す
る。それから、設定されていたマクロブロックタイプ
（フローチャートで初めて、「無定義」タイプの第1マ
クロブロック）の問題のマクロブロック（インデックス
＝ｉ内のマクロブロック）の量子化レベルに最大事前定
義量子化レベルが設定されているかどうかを判断する、
ステップ486が実行される。この訂正プロセスの最大量
子化レベルは、訂正されるマクロブロックの品質で大き
な劣化がないように高すぎて設定してはならない。可能
であるなら、マクロブロックの質に大きな差が出ないよ
うに、均一のビット数を減少させる目的で品質を劣化さ
せようとすることが望ましい。したがって、この最大値
は線形量子化スケールが使用されるときには量子化レベ
ル62に、非線形量子化スケールがMPEG-2エンコードなど
に使用されるときには112に設定される。ただし、最大
量子か器値には、それ以外の値も使用できる。問題のマ
クロブロックの量子化レベルがステップ486で最大では
ないと判断されると、ステップ488で問題のマクロブロ
ックの量子化レベルを1量子化レベル増分する。それか
ら、ステップ490で前記のビットレート−量子化機能を
使用してフレームのビット概算を計算し直す。それから
ステップ490では、マクロブロックのインデックスをゾ
ウ文する。マクロブロックのインデックスがマクロブロ
ックタイプの最後のマクロブロックが処理されていない
ことを示す場合は、フローはステップ484にループバッ
クする。それ以外の場合は、フローはステップ492か
ら、ブロックインデックスをゼロにリセットするステッ
プ498に進み、第1マクロブロックを示す。

【０１８３】フローがステップ484に戻ると、ステップ4
90で計算し直されるビット概算は、前述するように、ス
レッショルドに比較される前記の差Dを計算し直すため
に使用される。ビット概算が高すぎない場合、ユーザ選
択優先順位を指定されるフレームのビット数が訂正さ
れ、フローは呼び出しプロセスに戻る。それ以外の場
合、フローは、問題の（インデックス1が設定される）
マクロブロックの量子化値が最大であるかどうかをもう
一度判断するステップ486に進む。

【０１８４】ステップ486で、問題のマクロブロックの
量子化値が最大であると判断すると、そのブロックの量
子化レベルは引き上げる必要はなく、ステップ494では1
ブロックインデックスｉを増分する。ステップ496でマ
クロブロックタイプのインデックスが最後のブロックを
通り過ぎていないと判断すると、フローはステップ486
に進み、増分されたインデックスの付いたブロックに最
大量子化値が設定されているかどうかを判断する。それ
以外の場合、ステップ496でマクロブロックが問題のマ
クロブロックタイプの最後のマクロブロックであると判
断すると、ステップ498が実行され、ブロックインデッ
クスが第1マクロブロック（ｉ=0）にリセットされる。
それから、フローは図24Bに説明されるプロセスCに進
む。

【０１８５】図24Bでは、ステップ500で、ブロックタイ
プが「無定義」タイプであるかどうか調べる。「無定
義」タイプである場合は、ステップ502ですべての「無
定義」マクロブロックに最大qレベルが設定されている
かどうかを判断する。「無定義」マクロブロックのすべ
てに最大qレベルが設定される場合、「無定義」タイプ
のマクロブロックにさらに調整を実行することは不可能
であるため、マクロブロックタイプは、ステップ504で
「負の優先順位」に変更され、フローは図24Aにブロッ
ク図で示されるプロセスDに戻り、ステップ484が実行さ
れる。それ以外の場合、ステップ502で、「無定義」タ
イプのすべてのマクロブロックに最大qレベルが設定さ
れていないと判断すると、フローは修正中のマクロブロ
ックのタイプを変更しないで、プロセスに戻る。この手
順は、フレームの結果として生じる数がスレッショルド
範囲内になるまで続行するか、あるいは「無定義」型の
すべてのマクロブロックが「負の優先順位」に変更され
るブロックタイプを結果的に生じさせる最大量子化レベ
ルに設定される。

【０１８６】ステップ500でブロックタイプが「無定
義」ではないと判断するとステップ506がブロックタイ
プが「負の優先順位」であるか判断する。ブロックタイ
プが「負の優先順位」の場合、ステップ506は、「正の
優先順位」のすべてのブロックに最大qレベルが設定さ
れるかどうか判断する。ステップ508の判断の結果が負
である場合、ステップ510が実行され、ブロックタイプ
が「正の優先順位」に設定され、フローは図24Aにブロ
ック図で示されるプロセスDに進む。

【０１８７】ステップ508で「正の優先順位」のすべて
のマクロブロックに最大qレベルが設定されると判断す
ると、ステップ512で「負の優先順位」タイプのすべて
のブロックに最大ｑレベルが設定されるかどうか調べ
る。設定されていない場合、ブロックタイプは変更され
ず、フローは図24AのプロセスDに戻る。「負の優先順
位」タイプのすべてのマクロブロックに、ステップ512
で、最大qレベルが設定されていると判断される場合、
すべての「無定義」、「負の優先順位」および「正の優
先順位」のマクロブロックに最大量子化レベルが設定さ
れ、ブロックタイプがステップ512で「変更不可」に設
定される。それから、フロは図24AのプロセスDに進む。

【０１８８】図24Bのステップ506が負と判断されてか
ら、プロセスEおよび図24Cのステップ520が実行され
る。ステップ520でブロックタイプが「正の優先順位」
であるかどうか判断する。そうである場合は、ステップ
522で「負の優先順位」のすべてのブロックに最大Qレベ
ルが設定されるかどうかが判断される。設定されていな
い場合、ブロックタイプは「負の優先順位」に設定さ
れ、フローは図24Aにブロック図で示されるプロセスDに
戻る。ステップ522で「負の優先順位」タイプのすべて
のブロックに最大qレベルが設定されていると判断する
と、ステップ526で「正の優先順位」タイプのすべての
ブロックに最大qレベルが設定されるかどうかを調べ
る。設定されていない場合、フローは図24Aにブロック
図で示されるプロセスDに戻る。それ以外の場合、すべ
ての「無定義」ブロックとともにすべての「負の優先順
位」および「正の優先順位」に最大量子化レベルが設定
され、ステップ526でブロックタイプが「変更不可」に
設定され、フローは図24Aにブロック図で示されるプロ
セスDに戻る。

【０１８９】ステップ520でブロックタイプが「正の優
先順位」ではないと判断すると、ブロックタイプはそれ
ゆえ「変更不可」でなければならず、ステップ530で
「変更不可」タイプのすべてのブロックに最大qレベル
が設定されるかどうかが判断される。設定されている場
合、ユーザ選択優先順位が設定されるフレーム内のビッ
トが多すぎるという問題を解決しないで、すべてのブロ
ックタイプが最大量子化レベルに設定されたので、エラ
ーが生じる。すべてのブロックを最大事前定義qレベル
に設定すると、フレームの元のエンコードを上回らない
ビット数が生じるはずである。ステップ530での判断が
負である場合、フローは図24Aに説明されるプロセスDに
戻る。

【０１９０】図23のプロセスが、ユーザ選択優先順位領
域のあるフレーム内のビット数が少なすぎると判断する
と、図25A-図25Cのプロセスが実行される。図25A-図25C
は、量子化レベルがフレームのビット数を増加させるた
めに引き上げられる代わりに引き下げられ、マクロブロ
ックの量子化レベルが、引き下げられたときに量子化Ｒ
レベルの1のような事前に決定される最小レベルを超え
ることができないという点を除き、図24A-図24Cにブロ
ック図で示されるプロセスに基づいている。前記に注記
した相違点を除き、図25A-図25Cのプロセスが図24A-図2
4Cのプロセスに同一であるため、図25A-図25Cのさらな
る説明は簡略を期すために行わない。

【０１９１】図23-図25Cに記述される訂正プロセスは、
本発明が動作する1つの様式である。ただし、異なった
種類のマクロブロックの量子化レベルを調整する代替手
段も可能である。例えば、「負の優先順位」および「正
の優先順位」のマクロブロックの量子化レベルを、前述
のように同時に変更する代わりに、「負の優先順位」タ
イプ、「正の優先順位」タイプおよび「変更不可」タイ
プのマクロブロックは均一に増加できる。代わりに、ビ
ットが多すぎる場合には、「負の優先順位」タイプの量
子化レベルが、最大量子レベルに達するまで引き上げら
れてから、「正の優先順位」タイプのマクロブロックの
量子化レベルが引き上げられる。反対に、ユーザ選択優
先順位が設定されるビット数が少なすぎる場合、「負の
優先順位」タイプのマクロブロックのレベルが引き下げ
られる前にビット数を増加するために、「正の優先順
位」タイプのマクロブロックの量子化レベルが引き下げ
られる場合がある。後者の2つのケースでは、「無定
義」タイプのマクロブロックの改変は、「負の優先順
位」または「正の優先順位」タイプのマクロブロックの
前、間、または後に発生する可能性がある。

【０１９２】図23A-25Cのプロセスが実行された後、フ
ローは、新しい量子化値を使用してビデオを再エンコー
ドする図20のステップ462に戻る。この再エンコード
は、再エンコードされたのフレームの結果として生じる
ビット数を、フレームの元のエンコードのビット数にで
きる限り近づける目的で、レート−制御関数を使用し
て、量子化値を微調整する間に実行される。レート−制
御装置プロセスは、以下の別項に詳しく説明する。ま
た、再エンコードの間、エンコード人為構造が発生する
可能性があるため、以下の別項に説明するように、これ
らのエンコード人為構造を低減する目的で特殊な手段を
実行できる。

【０１９３】空間手動編集のプロセスは、本発明の実施
例の図1Aのワークステーション30で発生する。しかし、
空間手動編集がビデオエンコードプロセスと同時に発生
しない場合、ワークステーション10は、ビデオエンコー
ドプロセスのレートを劣化させないで時間的手動編集を
事項できる。本発明がフレーム内のさまざまな領域の画
質を変更することとして詳しく記述されることに注記す
べきである。本明細書の概念を、あるフレームの領域内
のビットを別のフレームの領域にシフトすることに拡大
することができるのは言うまでもない。さらに、空間手
動編集は、前記の時間的手動編集といっしょに適用でき
る。

【０１９４】空間手動編集は、ユーザ指定領域優先順位
が設定されるフレームのビット数をフレームの元のエン
コードと同じに保つこととして説明された。ただし、希
望される場合、再エンコードされた編集セグメントは、
十分な記憶領域容量がある場合には、フレームの元のビ
ット数より多いか少ない事前に決定されるビット数を消
費できる。これらのケースでは、改変されたフレームを
変更できるビット数を理解しておくことが望ましく、そ
のため図24A-図25Cにブロック図で示されるプロセス
は、設定された差が達成されるまで動作するだろう。し
たがって、任意のフレームの再エンコードのビット総数
は、5%と1%多いまたは少ないビットの両方を含む0%と20
%の間で多くまたは少なく、元のエンコードを上回る
か、下回る任意の量を消費する。

【０１９５】空間手動編集の説明は、ビデオがエンコー
ドされた後のビデオの変更に関して行われた。しかし、
本明細書に記載される教示は、初期エンコードプロセス
がなかったシステムにも適用できる。

【０１９６】空間手動編集は、以前に取得されたフレー
ムと同じビット数を達成するために、ユーザ選択優先順
位に基づいて量子化値を割り当ててから、必要に応じ
て、フレームのマクロブロックの量子化レベルを調整す
ることによって動作する。対照的に、前記の項に記述さ
れた時間的手動編集は、ビデオのセクションからビット
の共通プールを削除し、それらのビットを、ユーザ選択
優先順位に従って、共通プールから分配し直す。あるフ
レームに関して空間手動編集が実行されるプロセスにつ
いてのすべての教示は、時間的手動編集の項に説明され
るように、時間でビデオのフレームの品質を変更すると
いう概念に適用でき、逆の場合も同じである。例えば、
空間編集は、品質の変更を達成するために量子化レベル
を修正することとして説明されてきたが、ビット数は時
間的編集の項で調整される。フレームまたはマクロブロ
ックのビット数は、直接、量子化レベルに依存するた
め、ビット数および量子化レベルの修正は、同じ結果を
達成し、そのため時間的編集および空間編集は、ビット
数または量子化レベルあるいはその両方を修正できる。 VIII. 品質変更後のビデオの再エンコード A. 品質が単独フレーム内で変更された場合のビット割
当て制御図1Aにブロック図に示されるビデオエンコード装置50の
ビットレートを制御するために、ワークステーション10
または同じ制御機能を実行できるあらゆる専門ハードウ
ェアのような制御装置が、量子化レベル、つまりq-レベ
ルおよびレート制御式エンコーダ内ヘのスライスごとの
概算ビット数または予想ビット数をロードする。それか
ら、エンコーダはエンコードを開始し、量子化レベル
は、以前に求められた予想ビット数に比較して、作成さ
れたビット数の精度を測定してから調整される。予想ビ
ット数は、空間手動編集および時間的手動編集に関する
項で前述されるように、レート−量子化関数を使用して
求められる。このプロセスは、一度のn個のマクロブロ
ックの集合に対して連続して実行され、各集合はMB(ｉ)
と示され、以下の通りである。

【０１９７】１＜ｉ＜（マクロブロックの合計数／n） (27) マクロブロックの最後の集合を再エンコードする場合、
作成されるビット数のマイナーな過剰予想が、ビットス
タッフィングを使用して吸収できるため、レート−制御
装置が、再エンコードプロセス中で作成されたビットの
総数が最初にエンコードされた長さより短くなることを
保証する。

【０１９８】図26は、事前に割り当てられる量子化レベ
ルでデジタルビデオの集合を再エンコードするための方
法を説明するフローチャートである。調整は、量子化モ
デルが、再エンコードにより作成されるビット数を、作
成されたビットの実際の数に対してどれほど正確に予想
下のかに基づいて、事前に割り当てられた量子化レベル
に加えられる。図26では、レート制御式コーディングプ
ロセスは、ステップ700で開始してから、ステップ702で
ｉ=1を設定することによって、nマクロブロックの第1集
合をマクロブロックの現在の集合として指定する。ステ
ップ704では、マクロブロックの各集合MB（ｉ）の再エ
ンコードで使用される、ビット予想数の完全な集合、EB
（ｉ）をロードする。それから、MB(I)はステップ706で
再エンコードされ、実際に作成されたビットの数がGB
（ｉ）として記憶される。作成済みビットGB（ｉ）、予
想ビットEB（ｉ）の間のパーセンテージ差は、ステップ
708で予想率、PB（ｉ）＝GB（ｉ）／EB（ｉ）として計
算される。さらに、システムは、累積ビットの予想数E
B'（ｉ）、累積作成ビット数、GB'（ｉ）をマクロブロ
ックのすべてお再エンコードされた集合に対して計算す
ることが可能で、この場合、EB'(1)=EB(1)、GB'(1)=GB
(1)、EB'（ｉ）=EB'（ｉ-1）＋EB（ｉ）およびｉ>2の場
合、BG'(1)=GB'（ｉ-1）＋GB（ｉ）である。したがっ
て、PB（ｉ）/EB'（ｉ）を使用することによって、説明
されたステップ708の代替策として、PB（ｉ）は、累積
ビット予想数EB'（ｉ）および累積作成ビット数GB'
（ｉ）を使用して計算できる。これは、マクロブロック
のある特定の集合がどれほど正確にエンコードされたの
かを示す代わりに、全体としての再エンコードプロセス
がどのようにターゲットビット数を満たしているのかの
より正確な表示となる。ステップ710では、概算率が使
用され、マクロブロックの次の集合、MB(ｉ+1)内のq-レ
ベルの訂正係数を判断する。

【０１９９】この訂正係数は、2通りの方法の内の1つを
使用して求められる。第1の訂正係数決定方法は、割合
ルックアップテーブルと呼ばれる割合値のテーブル内の
率の単純並べ替え済みリストを進み、どの2つの割合オ
間に概算率が該当するのかを判断する。テーブル内の2
つの数の大きい方のインデックスjは、訂正係数インデ
ックスとして使用される。訂正係数インデックスは、テ
ーブル内のj番目の要素を訂正係数として選択すること
により訂正係数テーブル内で訂正係数△（ｉ）を探すた
めに使用され、マクロブロックの次の集合は△（ｉ）に
よって調整される。割合ルックアップテーブル、RTに
は、例えば、以下のような並べ替えられた値が指定されＲＴ=｛0.85，0.90，0.95, 1.0，1.05，1.10，1.15，
1.2, 1.5 ｝訂正係数テーブルCTには、以下の値が指定される。

【０２００】ＣＴ＝｛-3，-2，-1, 0, １，2, 3, 4, 9, ｝図30は、概算率を使用して訂正係数インデックスを割合
ルックアップテーブルから求めるプロセスを説明するフ
ローチャートである。ブロック図のためだけに、PB
（ｉ）＝0.87であると想定する。インデックスjは、当
初、ステップ722で設定される。PB（ｉ）をRT(j)に比較
するプロセスが開始し、前記ルックアップテーブルに定
義されるように、ステップ724では、PB(ｉ)=0.87がRT
(1)=0.85に比較される。0.87が0.85を上回る場合、プロ
セスはステップ726に続く。ステップ726で残りのインデ
ックスがあると判断されているので、制御はステップ72
8に渡され、jは1増分される。ステップ724に戻ると、PB
（ｉ）=0.87は現在RT(2)=0.90であるため、制御は、訂
正係数インデックスの検索を終了するステップ730に渡
される。

【０２０１】図31は、テーブルヘのインデックスが指定
されるルックアップテーブル内で値を捜し出す方法を説
明するフローチャートである。図31では、第1の方法に
従って訂正係数を求めるために、2であるインデックスj
が使用され、CT内の対応するエントリを捜し出す。CT内
の第2位置から読み取ると、訂正係数は、ステップ736で
-2であると判断される。したがって、MB(I+1)のq-レベ
ルは-2で変更される。同様に、PB（ｉ）=1.12の場合、
インデックス7はPB（ｉ）より大きいRT内の最初の入力
に対応するため、7番目の位置にあるCTの訂正係数は3で
ある。したがって、MB （ｉ+1）のq-レベルは3を追
加することによって、例えば3をMB（ｉ＋1)に加算する
ことにより変更される。

【０２０２】第2の訂正係数決定方法では、再エンコー
ドされたマクロブロックの集合のパーセンテージが訂正
係数を求める際に第2パラメータとして使用される点を
除き、第1方法に類似したプロセスを使用する。さら
に、テーブルから訂正係数を読み取る代わりに、訂正係
数はマトリックスから読み取られる。再エンコードされ
たマクロブロックの集合のパーセンテージ、または再エ
ンコードされていないマクロブロックの集合のパーセン
テージを使用することにより、フレームの列の最初でよ
り漸進的な訂正を加え、必要なら、最後でより著しい訂
正を加えることができる。これによって、システムは量
子化モデルと実際に作成されたビット数の間の変動をよ
り正確に訂正できるようになる。再エンコードされずに
残っているマクロブロックの集合の数と訂正の意義の間
の反転関係を使用し、マクロ部アロックのある集合内で
の過剰予想がマクロブロックの別の集合での過少予想に
より相殺されると仮定すれば、不必要な訂正は回避され
る。

【０２０３】第2訂正係数方法の訂正係数マトリックスC
TMの例として、CTMが以下のように定義されると想定す
る。

【数１】

【０２０４】フレームの列の最初で、概算比が必要なビ
ット数の過剰評価を示す場合、すべての未使用のビット
をただちに次のスライスに割り当てし直す必要はない。
未使用のビットがただちにMB（ｉ+1）によって消費され
た場合、kｉ+1の場合、予想以上のビットを消費するMB
(k)により、MB(k+1)は強制的に不必要にさらに高い量子
化レベルに引き上げられるだろう。未使用のビットは、
必要とされ、MB(k)によって使用されるまで、再エンコ
ードプロセスでMB（ｉ）から前方に運ばれる。

【０２０５】図32は、概算比および残っている再エンコ
ードされていないマクロブロックの集合の数の両方を使
用して訂正係数がどのように計算されるのかを説明する
フローチャートである。必要となるビット数の過剰評価
のケース、つまり訂正係数jがPB（ｉ）=0.87の場合に2
に等しいと以前に判断した場合、図32のステップ744で
過剰評価が再エンコードプロセスの最初のパーセントデ
発生するかどうか判断する。CTMの(2,1)での要素は-1で
あり、したがって訂正係数として選択される。これによ
り、第1方法では-2がであった再エンコードプロセスの
初期に訂正効果は鈍る。しかし、再エンコードプロセス
の99パーセントは実行され、概算比がPB（ｉ）＝1.12で
ある場合、3である要素（9,77）が選択されるので、再
エンコードプロセスの最後で完全に訂正する。

【０２０６】図27（A）-図27（C）に戻ると、q-レベル
が事前に割り当てられたフレームがある集合内のマクロ
ブロックの数が1つのスライスの中のマクロブロックの
数に等しい別の例として説明される。ビットの概算数EB
（ｉ）が前述のように計算され、図27（A）のMB
（ｉ）、マクロブロックｉのレート制御プロセスで使用
されるメモリの中にロードされてから、MB（ｉ）が実際
に再エンコードされる。作成ビット数、GB（ｉ）が求め
られ、概算比が計算され、訂正係数捜し出される。図27
（B）に示されるように、それからMB（ｉ+1）は△
（ｉ）によって訂正され、プロセスはMB（ｉ+1）のため
に繰り返される。図27（C）には、MB（ｉ+1)が概算さ
れ、計算され、その概算比が求められた後のMB（ｉ+2)
の変化が示される。このプロセスは、すべてのマクロブ
ロックおよび部分的なマクロブロックが再エンコードさ
れ、訂正されるまで続行される。

【０２０７】図27（A）および図27（D）を参照して別の
例が示される。この例では、集合あたりのマクロブロッ
ク数は、2つのスライスの仲のマクロブロックの数であ
る。EB（ｉ）、GB(ｉ)、およびPB（ｉ）を計算した後
で、2つのスライスを構成するMB（ｉ+1）のマクロブロ
ックは、図27（D）に説明されるように、△（ｉ）によ
り訂正される。この再エンコードおよび訂正プロセス
は、すべてのマクロブロックが再エンコードされるまで
以前の例で続行される。

【０２０８】再エンコードプロセスにより生じる変更
は、図28（A）および図28（B）に説明される。フレーム
Nの2つの等しい面積の領域である領域Aと領域Bは、当初
ほぼ等しい数のビットを使用してエンコードされる。ユ
ーザは、領域Aの品質が劣化され、領域Bの品質が向上さ
れなければならないと指定する。しかし、元のエンコー
ドに使用されたビット数が再エンコードのビット数にで
きる限り近くなるようにすることが望ましい。フレーム
Nを再エンコードした後、フレームNには元のエンコード
から作成された同じバイト数が格納されるが、領域Aは
より少ない数のビットでコーディングされ、領域Bは追
加ビットを使用する。これにより、ユーザが要求したよ
うに、領域Aの品質は劣化し、領域Bの品質は向上する。
本発明のレート制御プロセスでは、レート量子化関数を
使用して求められた概算数でのマイナーな誤差を訂正す
ることにより、フレームの再エンコードされたビット数
はできる限り元のビット数に近づけられる。

【０２０９】図29では、複数のフレームからのビットを
割当てし直し、それらを第2の複数のフレームに与える
ことにより、デジタルビデオストリームに加えられる変
更を説明する。個々のフレーム面積は変化しても、フレ
ームの集合の総面積は同じままでなければならない。レ
ート制御装置により、複数のフレームの再エンコードの
ビット数は、ビット概算数を求めるために使用されるレ
ート量子化関数がわずかに間違っていても、元のエンコ
ードからのビット数と同じになるように微調整できるよ
うになる。 B. 編集ポイントで復号化人為構造を回避しながら再エ
ンコードする 1. 最初にエンコードしたときに使用された状態にエン
コーダを復元する前述の時間的品質編集動作および空間品質編集動作は、
ビデオの品質を新規量子化値でビデオを再エンコードす
ることによって変更できるようにする。ただし、再エン
コードされたビデオを単にオリジナルビデオに代入する
だけでは、ビデオの編集ポイントでの可視グリッチとし
て出現する受け入れられない復号化人為構造が生じる場
合がある。これらの可視グリッチは、代入されている新
規セグメントにMPEG-2構文のような適切な構文が設定さ
れ、編集境界でのバッファ制約事項が満たされていても
発生する。問題は、編集セグメントの前に来る最後の基
準フレーム（最後のP-フレーム）および編集セグメント
の最後にある別の基準フレーム（私語のP-フレーム）の
非可用性の結果生じる。これにより、編集セグメントの
最初にあるB-フレームの第1集合と編集セグメント直後B
フレームの第1集合のエンコードと復号化の間に格差が
生じる。

【０２１０】デジタルエンコード圧縮ビデオの編集を適
切に実行するためには、まず、希望の編集ポイントに対
応するエンコードビットストリームの適切な位置を決定
する必要がある。このプロセスは、エンコードされたビ
デオにアクセスするためのユーティリティを説明する第
VI項に前述された。前述するように、これは、問題のピ
クチャのビットオフセットを求めるために、既にエンコ
ードされたフレームのそれぞれい使用されるビット数を
合計することで実行される。代わりに、エンコードされ
たビットストリーム内のある特定のフレームや期間の厳
密なロケーションを示す情報を維持するために、ディレ
クトリも使用できる。

【０２１１】今度は図33（A）-図33（E）を見ると、本
発明の動作を説明するための例として使用されるビデオ
の期間がブロック図されている。図33（A）では、エン
コードされたビデオの元のセクション0がブロック図で
示される。エンコードされた期間5 m 0sから10m 0s（5
分、ゼロ秒から10分、ゼロ秒まで）を別のビデオセクシ
ョンで置き換えることが希望される。図33（B）では、
図33（A）のエンコードされたビデオに代入しなければ
ならない未エンコードビデオの新しいセクションがブロ
ック図で示される。図33（B）および図33（C）の破線
は、未エンコードビデオを表すのに使用され、図33
（A）、図33（D）および図33（E）の実線はエンコード
されたビデオを示すのに使用される。

【０２１２】図33（B）に示される新しいビデオのセク
ションだけが、GOPが以前のGOPを参照する標準MPEG-2を
使用してエンコードされ、図33（A）に示されるビデオ
に代入される場合、復号化人為構造が、MPEG-2ビデオ圧
縮で使用される双方向復号化に必要な正確な基準フレー
ムが欠如しているため、編集ポイント5m 0sと10m 0sで
存在するだろう。GOPの始まりは以前のGOPに戻って参照
するが、GOPの最後は次のGOPに進んで参照しないという
事実のため、この問題は本発明により違うように処理さ
れる5分ポイントおよび10分ポイントの両方で存在す
る。

【０２１３】復号化人為構造をGOPの始まりで防ぐに
は、GOPの最初の2つのB-フレームの基準フレームとして
使用される先行するGOPの最後のP-フレームを作成し直
すことである。これは、例えば、オリジナルビデオの1
つのGOPを挿入対象のビデオの始めに格納することによ
り達成され、この追加されたビデオは図33（C）の4 m 5
8.5sから4 m 59sに示される。例では、GOPの他の期間も
可能ではあるが、あるGOPは1秒の2分の1に等しい。エン
コーダは、4m 59sの直前にGOPの最後のP-フレームを作
成するために、元のエンコードに使用される同じ量子化
値でこのセクションに関して再実行される。最後のP-フ
レームを除く、ビデオのこの短いセクションの再エンコ
ードの結果生じるすべての情報は廃棄されることがあ
る。

【０２１４】編集セグメントの最後での復号化人為構造
を防ぐために、オリジナルビデオの1秒という期間（例
えば、図33（C）の10 m 0sから10m 1s）が置換される新
規ビデオの最後に付加され、この1秒セグメントは、元
のエンコードの間に使用されたのと同じ量子化値を使用
してエンコードされる。この1秒期間がビデオの最後に
付加されなかった場合、10m 0sマーク直後の2つのB-ピ
クチャは、10m 0sは2つのGOPの間の分割ポイントである
と仮定し、編集の前と編集の後で異なる基準ピクチャに
戻って参照する。例は、ビデオの2分の1秒期間または1
秒期間の新規セクションへの付加として説明したが、概
念はGOPの付加に一般化できる。

【０２１５】現在では、最後にある編集ポイントが10m
1sポイントであるため、復号化人為構造は10分マークで
は出現しなくなるが、人は復号化人為構造が10m 1sで生
じるかどうかを考慮しなければならない。10m 1sマーク
直後の2つのB-フレームが、それらが以前に参照した本
質的に同じ基準フレームに戻って参照するため、可視復
号化人為構造は生じない。10m 0sマーク直後の2つのB-
フレームが、それらが過去に参照した同じ基準フレーム
に戻って参照しなくても、2つのB-フレームは再エンコ
ードされていたため、適切に新しい基準フレームに戻っ
て参照する。したがって、可視復号化人為構造は10m 0s
ポイントまたは10m 1sポイントでは存在しない。

【０２１６】図33の最後に追加された2つのGOP（1秒）
は、最後のP-フレームが元のエンコードにほぼ同等とな
るのに十分な時間でなければならない。10分ポイントの
後のオリジナルビデオを再エンコードするときにまった
く同じ量子化値が使用されることが保証できる場合に
は、1GOP（2分の1秒）で正確にエンコードされた基準ピ
クチャを適切に作成するのに十分であるはずである。た
だし、適正な品質を保証するためには、2つのGOPが好ま
し。最初に使用されたのと同じ量子化値を使用すること
が希望されても、実際には、元の量子化値からマイナー
な偏差が生じうる場合があるため、2つのGOPが望まし
い。

【０２１７】4m 58.5sから4m 59sおよび10m 0sから10m
1sまで使用されるビデオの元の期間に加えて、図33
（C）は、4m 59sから5m 0sまでの追加オリジナルビデオ
を示している。このビデオは復号化人為構造の防止には
必須ではないため、最後のP-フレームを決定するための
2分の1秒が5m 0sマークの直前（例えば4m 59.5sから5m
0sまで）に使用できる。ただし、4m 59sから5m 0s期間
は、オペレータによる、品質の手動変更が編集境界を超
えて影響したという認知の機会を排除するために新規ビ
デオに付加される。この誤認は、MPEG GOPの最初でのフ
レームのコーディング順序はIBBだが、フレームはBBIと
して表示されるという事実のためである。1秒期間は、
その期間の元のエンコードの間に使用されたのと同じ量
子化値を使用してエンコードされる。以前使用された量
子化値を得る方法を以下に説明する。1秒期間が4m 59s
から5m 0sに付加されないと、図33（D）にブロック図で
示される代わりのエンコードされたビデオは、5m 0sで
開始するだろう。

【０２１８】図33（C）のビデオをエンコードした結果
生じる有効なデータは、4m 59sから10m 1sまで実行する
代替データSとして図33（D）に示される。それから、こ
の代替データSは、図33（E）に示すような最終ビットス
トリームを結果的に生じさせる図33（A）にブロック図
で示される元のエンコードされたデータに代入される。

【０２１９】図33（A）に示されるエンコードされてい
ない情報およびエンコードされた情報は、実施例のビデ
オであるが、エンコードされた情報を復号化するため
に、以前のまたは以降の、あるいはその両方の情報を使
用するオーディオまたはその他の種類の情報となる場合
がある。

【０２２０】図33（B）のビデオの新しいセクション
は、任意のビデオソースから得られ、前記の時間的編集
プロセスまたは空間編集プロセスによって作成されるビ
デオである可能性がある。4m 59sから5m 0sまでおよび1
0m 0sから10m 1sまでの図33（C）のオリジナルビデオ
は、元のエンコードに使用されたのと同じ量子化値が設
定されるオリジナルビデオである。図33（C）の新しい
ビデオNの両端にあるこのビデオは、時間的編集プロセ
スを使用し、最後のセクションの品質を、時間的手動編
集の項に説明した保護つきに設定するだけで得られ、量
子化値が同じで留まる必要があることを示す。代わり
に、図33（A）のビデオは、図33（A）のビデオに関係な
く完了され、異なった長さとなる場合がある。さらに、
ビデオのセクションをカットアウトし、新しいビデオを
付加しないために本発明を使用することもできる。この
場合、図33（B）にビデオは存在せず、「N」セグメント
とその対応するエンコードは、図33（C）-図33（E）に
は記載されていない。編集セグメントの前の最後のP-フ
レームが適切に構築され、オリジナルビデオの2分の1秒
から1秒の（1つまたは2つのGOP)がエンコードされるべ
き新しいビデオの最後に付加され、元のエンコードで使
用された同じ量子化スケールでエンコードされる限り、
可視復号化人為構造はどのような状況でも発生しない。

【０２２１】図34は、図33（A）-図33（E）に関して記
述されるプロセスを説明するフローチャートである。開
始後、ステップ780で、ビデオは圧縮フォーマットにエ
ンコードされ、図33（A）に示されるエンコードされた
ビデオが作成される。ステップ782では、エンコードさ
れたビデオに代入されなければならないエンコードされ
ていないフォーマットのビデオの新しいセクションが決
定される。ビデオのこの新しいセクションは、図33
（B）と図33（C）でNとして示され、オリジナルフレー
ムに関連する、オリジナルフレームに関連しない、また
はオリジナルフレームとは異なった期間がセ設定される
場面を表すことがある。置換されるビデオの開始ポイン
トおよび終了ポイントは、それぞれ5m 0sと10m 0sであ
る。ただし、置換対象の最終エンコードの実際の開始ポ
イントおよび最終ポイントは、図33（D）にブロック図
で示されるように異なっている場合がある。

【０２２２】ステップ784では、編集ポイント5m 0sおよ
び10m 0sでの復号化人為構造を防止するために、前記の
理由からエンコードされていないビデオの期間をビデオ
のエンコードされた新しいセクションの最後に付加す
る。これらの付加された期間は4m 59sから5m 0sおよび1
0m 0sから10m 1sまでである。ただし、4m 59sから5m 0s
までの期間は必須ではない。

【０２２３】ステップ786では、編集ポイントの直前のP
ーフレームを決定する。図33（E）で置換されるビデオは
4m 50sから10m 1sなので、4m 50sの直前の最後のP-フレ
ームを突き止める必要がある。このP-フレームは、4m 5
8.5sから4m 50sまでの期間のためのエンコーダを、P-フ
レームを最初にエンコードするために使用された量子化
値で実行することにより決定される。量子化値は、図10
（A）または図10（B）のどちらかに示されるフォーマッ
トを持つマクロブロックログファイルから元の量子化値
を検索することにより求められる。ただし、映画全体の
各マクロブロックの量子化値は、大量の記憶領域容量を
消費するので、量子化値を記憶するのは望ましくない場
合がある。代替策として、量子化値を、Iフレーム、Pフ
レーム、およびBフレーム用ビデオバッファ、allocated
_bitとして図9Bにピクチャレイヤログファイルに図示さ
れるピクチャのターゲットビット、図9Cにmean_activit
yとして記憶されるピクチャの活動レベル、およびエン
コードの間にエンコーダにより計算されるマクロブロッ
クの活動レベルに関するレート制御ステータスを使用し
て単に作り出すことができる。レート制御ステータス
は、それぞれIビデオバッファ、Pビデオバッファ、およ
びBビデオバッファのレート制御ステータス情報を記憶
する、図9Cの底部でS1_ｉ、S2_ｉ、S1_ｐ、S2_p、S1_
b、およびS2_bとしてブロック図で示されるピクチャレ
イヤログファイルに記憶される。ビデオエンコード技術
の当業者は、本明細書に記載される教示に基づき、過度
の実験を行わないで希望のP-フレームの量子化値を求め
ることができるだろう。

【０２２４】基準フレームの量子化値またはエンコード
された基準フレーム自体を求める代わりの方法として、
エンコードされた基準ストリーム内の基準フレームのエ
ンコードバージョンは既知の方法で複合化できる。さら
に、必要とされる基準フレームを得るそれ以外の方法も
実行できる。

【０２２５】基準P-フレームが得られた後、ビデオは、
最後のセクションの元のエンコードと同じ量子化レベル
を維持しながら、ステップ788でエンコードされる。量
子化レベルは、前述のように得られる。結果として生じ
るエンコードされたビデオは、図33（D）に示される。

【０２２６】それから、ステップ790で、新規にエンコ
ードされたビデオを最初にエンコードされたビデオに代
入し、図33（E）に説明するように、最終製品が得られ
る。置換されたエンコードされたビデオを含むこのエン
コードされたビデオには、編集ポイントで最小の復号化
人為構造がある。 2. ピクチャのグループの閉鎖モードでの再エンコード図33（A）-図34に説明される手順の代替策として、復号
化人為構造を低減しつつも新しいビデオの始まりのエン
コードのために別の手順を実行できる。この手順では、
ビデオの立ち下がり端を処理する方法は、図33（A）-図
34に関して前記と同じである。

【０２２７】この代替実施例の例として、図33（A）を
元のエンコードされたビデオとして、図33（B）を図33
（A）に代入されなければならないエンコードされてい
ないビデオとして使用する。元のエンコードされていな
いビデオは図33（B）の始まり縁で追加されず、図33
（C）に記述されるように、対応する元のエンコードさ
れていないビデオの2つのGOP（1秒）は、図33（B）の最
後に追加され、エンコードされるべきビデオは図35
（A）に示される通りである。

【０２２８】エンコーダが、第2基準ピクチャのないB-
フレームのビットを増加させながら、図35（A）のビデ
オをGOP閉鎖モードでビデオの第1GOPのためにエンコー
ドすると、開始編集ポイントでの可視復号化人為構造は
排除される。10m 0sから10m 1sまでの元のエンコードに
使用されたのと同じ量子化レベルを使用する最後の部分
のエンコードは、図33（A）-図34に関して前述されるの
と同じであり、その結果生じるエンコードビデオは図35
（B）にブロック図で示される。GOP閉鎖モードは、第6.
3.8項でのMPEG規格に説明される。ピクチャのグループ
の閉鎖モードフラグは1にセットされ、エンコードされ
たB-フレームが、逆方向予測だけを使用してエンコード
され、以前のGOPの基準フレームが使用されていないこ
とを示す。しかし、双方向フレームに通常使用される基
準フレームの内の1つが使用できないため、引き下げら
れた品質を排除するために手順が実行されない限り、B-
フレームは、品質を劣化させてしまうだろう。

【０２２９】GOP閉鎖モードでのB-フレームの品質劣化
の問題を解決するために、単一方向だけの予測が設定さ
れるB-フレームのビット数は、フレームの品質が大幅に
引き下げられないように増加される。B-フレームには単
一方向だけの予測が設定されているので、ビット数は、
ほぼ通常のP-フレームに使用されるビット数に増加する
のが好ましい。ただし、ビット数は、希望される画質に
応じて変化する。

【０２３０】図35（B）のエンコードされたのビデオ
は、図35（C）でブロック図で示されるように、既にエ
ンコードされたビデオに直接代入できる。

【０２３１】GOP閉鎖モードを使用するプロセスを説明
するフローチャートは、図36に示される。図36では、ビ
デオはステップ800での圧縮フォーマットにエンコード
され、エンコードされたビデオに代入される必要がある
ビデオの新しいセクションは、ステップ780と782に関し
て記述されるのと類似した方法でステップ802で決定さ
れる。次に、ステップ804では、必要に応じて、エンコ
ードされていないオリジナルビデオのGOP（1つまたは2
つのGOP）を、ビデオの新しいセクションの立ち下がり
端に付加する。

【０２３２】それから、ステップ786でビデオをエンコ
ードする。新しいビデオの第1GOPは、ピクチャのグルー
プの閉鎖モードでエンコードされ、基準フレームを見失
った双方向に予測されるフレームのビット数が、ほぼ単
一方向予想フレームであるP-フレームに使用されるビッ
ト数に増加される。エンコードされたビデオのビット総
数が同じままとなる場合、二方向フレームに必要となる
余分なビットは他のフレームから削除されなければなら
ない。これは、空間手動編集または時間的手動編集、あ
るいはその両方についての項に前述するように達成され
る。次に、ビデオの新しいセクションの残りは普通にエ
ンコードされる。最後に、新規ビデオの立ち下がり端で
付加された期間は、編集セグメントの終了ポイントでの
復号化人為構造を防ぐために、追加された期間の元のエ
ンコードの間に使用されたのと同じ量子化値を使用し
て、エンコードされる。最後に、新規にエンコードされ
たビデオが、ステップ808で最初にエンコードされたビ
デオに代入される。

【０２３３】前述のプロセス、および図34と36にブロッ
ク図されたプロセスのいずれかによって、代わりのエン
コードされたセクションを含むエンコードされたビデオ
の最終バージョンでは、復号化人為構造の数が低減され
るため、可視ビデオグリッチは減少し、復号化人為構造
を防ぐためになんの訂正処置も講じられない場合と比較
してビデオの品質が向上する。前記を説明する例は、GO
Pの境界での編集ポイントに関係する。ただし、前記教
示は、GOP境界にない編集にも適用できる。

【０２３４】復号化人為構造を低減するプロセスは、再
生VTR51およびビデオエンコーダ50とともに、ワークス
テーション10、30、および40を使用して実行される。し
かし、それ以外のハードウェア代替策も可能であり、発
明の前述した面は、プロセスを実行するために、任意の
汎用コンピュータまたは特定のハードウェアを使用して
実現できる。編集ポイントを決定するため、およびエン
コードされるべきビデオの新規セクションの最後に付加
されるビデオを決定するために使用される計算は、ワー
クステーション10またはワークステーション30のどちら
かで実行される。 IX. エンコードに使用されるレート量子化モデリン
グエンコードプロセスから生じるマクロブロックの列を表
すのに必要とされるビット数を正確に概算するために、
フレームは、フレームの標準量子化レベルを表す複数の
量子化レベルを使用して事前にエンコードできる。それ
から、フレームは、他の量子化レベルだけではなく、代
表的な量子化レベルを使用して実際にエンコードでき
る。図1Aに示される実施例では、ワークステーション10
は事前に決定された量子化レベルをビデオエンコード装
置50にロードする。それから、ビデオエンコード装置50
は、事前エンコードを実行する。量子化モデルを作成す
るもっとも正確な方法では、可能な量子化レベルごとに
各フレームをエンコードし、結果として生じる使用ビッ
ト数に関する統計を記録することが必要となる。しか
し、このプロセスには、未処理ビデオでのn会のパスが
必要となる。この場合、nは未処理ビデオのエンコード
に使用される量子化レベルの総数である。この方法はひ
どく長いので、本発明は、従来の方法に要した時間の少
しで最適の方法に類似した結果を作成する改善された方
法となる。方法には、量子化レベルに対する代表的なビ
ットレートを、事前エンコードフェーズの間に複数のフ
レームのそれぞれに計算できるように、複数のフレーム
のさまざまなパーツに異なった量子化レベルを割り当て
ることが必要になる。これにより、正確なビットレート
対量子化レベルの統計を作成しながらも、各フレームの
n-1の事前エンコードが節約される。それから、これら
の統計を補間し、そのビットレート対量子化レベルが事
前エンコードプロセスで決定されなかったマクロブロッ
クによって使用されるビット数を概算する。2つの代替
実施例では、方法は未処理ビデオまたは未処理ビデオの
すべてのフレームから過半数のフレームを事前エンコー
ドする。

【０２３５】図37（A）には、2ポイントビットレート対
量子化レベル線が複数のフレームに作成され、結果が複
数のフレームに記憶されるように、事前エンコードプロ
セス内でマクロブロックに基づいて2つの異なった量子
化レベルをマクロブロックに割り当てられる未処理ビデ
オのフレームが示される。代替例では、量子化レベル
は、マクログループのグループまたはストリップで割り
当てられる。図37（B）では、量子化レベルが、位置に
基づく統計上の異常を回避するために、フレーム内のさ
まざまな場所に割り当てられるフレームでの4つの量子
化レベルの均一な分配を説明する。図示されたフレーム
では、各行のj、行内の最初の量子化レベルは、qjmod4
である。この結果、4ポイントビットレート対量子化レ
ベルの曲線が生じる。図37（C）では、図37（B）と同
じプロセスが示されるが、量子化レベルはブロック様式
で割り当てられている。このプロセスのシングルパスは
正確なビットレート対量子化レベル曲線を作り出すが、
代替実施例では、このプロセスは、量子化レベルごとに
各フレームを分析することによって収集される統計に近
づくさらに正確な統計を作成するために、複数のフレー
ムで何度も繰り返される。

【０２３６】図38では、複数のフレームの量子化レベル
対ビットレート特性を決定する一般的なプロセスを説明
する。プロセスはステップ850で開始し、事前エンコー
ドされる未処理ビデオを表すビデオ信号を獲得すること
により、ステップ852で続行する。ステップ854では、プ
ロセスは、第1フレーム、ｉがフレームインデックスで
あるところのi=1が事前エンコードされなければならな
いことを示す。ステップ856に続けると、フレームi=1の
量子化レベルは、統計学上の異常を防止するためにフレ
ームで均一に割り当てられる。ステップ858では、フレ
ームi=1は、ステップ856で割り当てられる量子化レベル
を使用して事前エンコードされる。ステップ858の結果
は、ステップ856で割り当てられる量子化レベルごとの
ビットレートがフレームi=1に記録されるように、ステ
ップ860で求められる。ステップ862では、方法が、複数
のフレームのすべてが事前にエンコードされているかど
うかを判断する。事前にエンコードされていたフレーム
は1つだけであったので、プロセスは、フレームインデ
ックスｉに1を加算してエンコードされるべきフレーム
として第2フレームを指定するステップ866まで続く。そ
れから、制御は、量子化レベルをフレームｉ=2に割り当
てるステップ856に戻される。ステップ856、858、860、
および862で割り当て、事前にエンコードし、ビットレ
ートを決定するプロセスは、すべての残りのフレームに
ついて続行される。ステップ862で、複数のフレームの
すべてが事前にエンコードされていたと判断される場
合、プロセスはステップ864に移動することにより終了
する。ステップ864に到達すると、ビットレート対量子
化レベル曲線は、ステップ856で割り当てられる量子化
レベルおよびその対応するビットレートを使用すること
により、近似される。

【０２３７】未処理ビデオの複数のフレームにビットレ
ート対量子化レベル曲線を作成したので、事前エンコー
ドプロセスは、未処理ビデオの一部がデジタル記憶装置
媒体、つまりコンパクトディスクに適合するようにエン
コードされるエンコードプロセスに移動する。未処理ビ
デオセグメントの1つ、複数、過半数またはすべてが、
この第2フェーズでエンコードされる。未処理ビデオセ
グメントを自動的にエンコードする必要がある場合は、
エンコーダは、セグメント内の各フレームのマクロブロ
ックに割り当てられる量子化レベルを決定するために、
対応するビットレート対量子化レベル曲線と結び付いた
各マクロブロックの活動基準を使用する。それから、セ
グメントの各フレームがエンコードされ、その結果とし
て生じるビット数は、割り当てられた量子化レベルに基
づいてビット概算数と比較される。結果として生じるビ
ット数がビット予測数から大きく異なる場合、自動エン
コーダは、エンコードされるマクロブロックの次の集合
の量子化レベルを変更することによって、変動を補償し
ようと試みる。この連続プロセスにより、自動エンコー
ダはターゲットビット数に一致するように未処理ビデオ
全体のセグメントをエンコードする。

【０２３８】さらに、ビデオシーケンスのもっと後のフ
レームのビットレート対量子化レベル曲線は、結果とし
て生じるエンコードされたデジタルビデオを通して品質
を調整する場合に使用できる。図39に図示されるよう
に、フレームNは同じ量子化レベルにフレームMより少な
いビットを作成すると知られている。したがって、フレ
ームMは、フレームN内と同じ品質の画像を作成するため
にはさらに多くのビットを必要とする。フレームNがそ
のすべての割り当てられたビットを使用しないで希望の
品質でエンコードされると、エンコーダは、同じ品質の
ために、ユニット時間あたりさらに多くのビットを必要
とするフレームMをエンコードする際に使用される余分
なビットを前方に運ぶことができる。この機能は、M+N>
1の場合にフレーム先読みバッファが1つしかないシステ
ムでは利用できない。 X. データ構造を使用して、オーディオ、ビデオ、
およびサブピクチャのデジタル信号を結合する本特許明細書の前記部分は、おもに、エンコード圧縮デ
ジタルオーディオ映像信号を作成するために、オーディ
オ映像情報のエンコードの間に使用される技法に関す
る。しかし、オーディオ情報およびビデオ情報が結合、
記憶、およびテレビの上などで、オーディオ映像情報を
作成し直す、または構築し直すために後で復号化される
ためには、オーディオ情報、ビデオ情報、およびそれ以
外の記憶され、後で復号化できるようにエンコードされ
ていた情報を結合し、インタリーブする必要がある。オ
ーディオ情報、視覚情報、およびそれ以外の情報の結合
は、図1Aに図示されるワークステーション20で発生する
フォーマットプロセスとして、前記に簡略に説明した。
フォーマットプロセスならびに結果として生じるデータ
構造および信号について、ここで詳しく説明する。

【０２３９】ここで図1Aを見ると、MPEGビデオおよびエ
ンコードされたオーディオはディスク21に記憶される。
さらに、ビデオの上に表示またはオーバレイあるいはそ
の両方を行われる字幕または図形表記、あるいはその両
方を含むサブピクチャ情報は、例えば、別個のワークス
テーションにより初期にエンコードされ、エンコードさ
れたサブピクチャ情報は、フロッピーディスク、テープ
またはその他の種類のディスクのようなデジタル記憶装
置媒体に記憶される。この記憶されたサブピクチャ情報
は、デジタル記憶装置22の内の1つにより読み取られ、
フォーマットプロセスでディスク21内のエンコードされ
たオーディオとビデオと結合され、ワークステーション
20により1つのデータストリームにフォーマットされ
る。フォーマットプロセスの出力は、ディスク21に記憶
されてから、デジタル記憶装置22のデジタルテープに書
き込まれる。それから、テープは既知の光ディスク製造
法により光ディスクを作成するために使用される。した
がって、本発明は、オーディオおよび視覚データのエン
コードに関係するだけではなく、エンコードデータ、オ
ーディオデータ、ビデオデータおよびサブピクチャデー
タを1つのデータストリーム、デジタル記憶装置媒体お
よびフォーマットされたオーディオ情報、ビデオ情報、
およびサブピクチャ情報を記憶するその上でのデータ構
造に結合するためのプロセスおよびシステムに関し、復
号化プロセスおよびユーザまたは消費者に表示するため
にオーディオ情報、ビデオ情報およびサブピクチャ情報
を分離し、再構築するデコーダにも関する。光ディスク
上またはフォーマットされたデータ内でのデータ構造
が、メモリ内に記憶される情報の物理的な編成を分け与
える特殊電子構造要素に関係することを注記すべきであ
る。これらの特殊電子構造要素は、ビデオオンデマンド
システムに使用できるまたはデジタルビデオディスクプ
レーヤを使用してユーザまたは消費者のために復号化さ
れる光ディスク内に記憶される。

【０２４０】エンコードされたのオーディオ映像情報用
のディスクまたはそれ以外の記憶装置媒体のフォーマッ
ト構造の特定な特徴を説明する前に、本発明により改善
される既知の規格について説明する。ISO/IEC 13818-1
は、そこに引用される参考とともに、参照により本明細
書に取り入れられるMPEGビデオおよびオーディオのシス
テム面を記述する。これ以降MPEGシステム説明と呼ばれ
るISO/IEC 13818-1は、ビデオストリームおよびオーデ
ィオストリームの基本的な多重化アプローチを説明す
る。これらのストリームは、パケット化基本ストリーム
（PES）パケットと呼ばれるパケットに分割される。ま
た、MPEGシステム説明には、1つ以上の独立したタイム
ベースのある1つ以上のプログラムを1つのストリームに
結合する移送ストリームの使用についても説明される。
MPEGシステム説明は、複数の基本ストリームを同期させ
るために使用されるプレゼンテーション時刻記録（PT
S）の使用について説明する。時刻記録は、一般的には9
0kHzという単位で、システムクロックリファレンス(SC
R)、プログラムクロックリファレンス(PCR)、およびオ
プションの基本ストリームクロックリファレンス(ESCR)
といっしょに使用される。データがMPEGシステム説明に
従い、どのようにフォーマットされるのかについての詳
細の完全な説明は、ISO/IEC 13818-1に記載される。

【０２４１】ISO/IEC 13818-1に基づいたフォーマット
プロセスを使用するのに加えて、データは、また、ISO
9660, 1988、情報処理−−ボリューム、および本明細書
に参考により取り入れられる情報交換用CD-ROMのファイ
ル構造に従ってフォーマットおよび記憶される。この規
格は、ディスクボリューム（音量ではなく、ディスクの
内容）およびファイル構造がどのように編成されるのか
を記述する。

【０２４２】オーディオデータ、ビデオデータ、および
サブピクチャデータを記憶するために使用される光ディ
スクの現在の時刻での実施例は、片面あたり5ギガバイ
トの容量で、総記憶容量10ギガバイトの単層両面ディス
クである。将来のフォーマットでは、記憶容量を増加す
るために多層ディスクを見越し、読み取り専用ディスク
の使用に加えて、追記技術および上書き技術も使用でき
る。本発明とともに使用できるディスクのそれ以外の面
については、1994年9月13日に提出された「光ディスク
および光ディスク装置」という米国特許明細書08/304,8
48に説明する。ディスクの外径は120 mmであるのが好ま
しい。

【０２４３】図40では、究極的には光ディスクに具備さ
れるワークステーション20のフォーマットされた出力の
構造を説明する。この構造900は、リードイン領域902を
含む。リードイン領域にはディスクから読み取られるデ
ータのそれ以降の処理を制御する個々のフィールドが含
まれる。リードイン領域900に記憶される例示的な引込
み情報は、本明細書に参考により取り入れられるクック
ソン(Cookson)その他の米国特許5,400,077の図3にブロ
ック図で示される。

【０２４４】システム領域904およびボリューム管理情
報906はISO 9660に準拠する。ボリューム管理情報906に
は、主要なボリューム記述子、ボリューム記述子設定終
止プログラム、ディレクトリレコード、およびパステー
ブルレコードが含まれる。主要なボリューム記述子に
は、ディスクがビデオディスクであるのか、またはオー
ディオディスクであるのかを示す記述子型、ディスクが
どの規格に準拠しているのかを示す標準識別子、システ
ム識別子、ボリューム識別子、ボリュームサイズ、論理
ブロックサイズ、パステーブルサイズなどのディスクボ
リュームの基本的な情報が記憶される。システムのこれ
らのフィールドおよびそれ以外のフィールド、およびボ
リューム管理情報は、ISO 9660に詳説されているので、
その説明は簡略さを期すために省略される。さらに、希
望する場合には、ISO 9660に準拠する補足ボリューム記
述子もある。

【０２４５】ボリューム記述子設定終止プログラムに
は、ボリューム記述子型、標準識別子、およびボリュー
ム記述子バージョンが記憶される。ディレクトリレコー
ドには、ISO 9660に従ったディスクのさまざまなディレ
クトリ情報が記憶される。パステーブルレコードには、
ISO 9660に記述されるように、L型パステーブルおよびM
型パステーブルが記憶される。

【０２４６】ディスク情報ファイル908は、ディスクの
内容についてのさらなる情報および光ディスクをプレイ
するときにユーザが選択できるメニュー情報にが記憶さ
れる。ディスク情報ファイル908の詳細は、図41に関し
て説明される。

【０２４７】各ディスクには、最大99データファイルま
で最小1データファイル910が格納される。例えば、ディ
スク上に2つの異なったオーディオ映像プログラムが記
憶されている場合、ディスク情報ファイル908には、ユ
ーザが使用を希望するデータファイルのどれかをユーザ
が選択するためのメニューを作成するのに必要な情報が
記憶される。データファイルは、図42-56に関連して詳
説される。リードアウト領域16は、ディスク、処理がど
のように実行されるのかを記述するそれ以外の情報、ま
たは関連するディスクに関する情報が記憶されることが
ある。

【０２４８】図41は、図40のディスク情報ファイル908
を説明する。ディスク情報ファイル908には、ファイル
管理情報920およびユーザが対話するメニューを構成す
る情報であるメニューデータ922が格納される。メニュ
ーデータは、ビデオデータ、オーディオデータ、および
サブピクチャデータを含む。ファイル管理情報920は、
ファイル管理テーブル924、ディスク構造情報926、メニ
ュー構造情報928、および複数オメニューセル情報フィ
ールド932と934が含まれるメニューセル情報テーブル93
0を格納する。

【０２４９】ファイル管理テーブル924には、ディスク
情報ファイルのあらゆる面に関する情報が含まれる。フ
ァイル管理テーブル924内には、ファイル名を識別する
ためのボリューム管理情報906の対応するディレクトリ
レコード内の対応するファイル識別子と同じ内容を記述
するファイル名が記憶される。論理ブロックの数を使用
してファイルのサイズを記述するフィールドがある。本
明細書全体で、「論理ブロック」という用語は、ISO 96
60に定義されるように使用される。論理ブロック数を使
用するファイル管理テーブルのサイズ、ファイルの先頭
からの相対論理ブロック番号を使用するディスク構造情
報926の開始アドレス、ファイルの先頭からの相対論理
ブロック番号を使用して記述されるメニュー構造情報92
8の開始アドレス、ファイルの先頭からの相対論理ブロ
ック番号を使用するメニューセル情報テーブル930の開
始アドレスを記述するエントリがある。メニューデータ
がない場合は、このフィールドの値はゼロになる。ファ
イルの先頭からの相対論理ブロック番号を使用するメニ
ューデータ922の開始アドレスを記述するフィールドが
ある。メニューデータが存在しない場合、このエントリ
はゼロである。

【０２５０】ファイル管理テーブル924には、メニュー
データ用のビデオのビデオ属性を記述するフィールドも
ある。この情報は、ビデオ圧縮モードがMPEG-1であった
のか、MPEG-2であったのか、ビデオのフレームレート
（毎秒29.97フレームまたは毎秒25フレームのどちら
か）、表示アスペクト比が3/4であるか、または9/16で
あるのかを示すフィールド、およびパンスキャンとレタ
ーボックスモードの両方が許可されていることを示す
か、パンスキャンモードがは許可されているが、レター
ボックスモードが禁止されていることを示すか、あるい
はパンスキャンモードが禁止され、レターボックスモー
ドが許可されていることを示すディスプレイモードフィ
ールドを含む。

【０２５１】ビデオ属性を記述するフィールドと同様
に、ファイル管理テーブル924のオーディオストリーム
を記述するフィールドもある。このフィールドには、オ
ーディオがドルビーAC-3に従ってエンコードされたのか
どうか、オーディオがMPEGオーディオであるのかどう
か、あるいはオーディオが線形PCMオーディオ（48 kHz
で16ビット）を含むオーディオコーディングモードの表
示が指定される。また、オーディオがモノラル、ステレ
オ、またはデジタルサラウンドであるのかを含むオーデ
ィオコーディングモードの表示も指定される。

【０２５２】ファイル管理テーブル924には、さらに、
メニューデータ922のサブピクチャストリーム属性を記
述するフィールドも入る。このフィールドは、以下に説
明するように、ランレングスサブピクチャコーディング
モードがサブピクチャに使用されることを示す。フィー
ルド管理テーブル924には、メニューのためのすべての
サブピクチャに使用される16セットのカラーパレットを
記述するフィールドも入る。パレット番号1から16に
は、輝度信号Y、カラー差異信号Cr=R-Y、およびカラー
差異信号Cb=B-Yが指定される。

【０２５３】ディスク構造情報926には、ディスクに記
憶されるビデオファイルおよびオーディオファイルの構
成情報が含まれる。ディスク構造情報926には、ファイ
ル名を識別するために使用されるディレクトリレコード
内での対応するファイル識別子と同じ内容を記述するフ
ァイル名が含まれる。ファイルをディスク構造情報ファ
イルとして識別するファイル識別子フィールドがある。
図40に示されるデータファイル910および914のようなデ
ィスク上のデータファイルの数を示すフィールドがあ
る。また、ファイルにビデオ情報とオーディオ情報の両
方が記憶されるのか、あるいはオーディオ情報だけが記
憶されるのか、およびアイルがカラオケファイルである
かどうかを含むデータファイルのそれぞれのタイプを示
すフィールドもある。

【０２５４】ディスク構造情報926には、データファイ
ル内のサブピクチャとオーディオ情報を含むフィールド
も含まれる。このフィールド内には、サブピクチャチャ
ネル数も示される。各サブピクチャチャネルは、異なっ
たサブピクチャ言語のようなさまざまなサブピクチャ情
報を表示する場合に使用できる。また、オーディオスト
リーム数の表示、チャネル番号順の各サブピクチャチャ
ネルの言語コードの表示、オーディオストリーム番号順
のオーディオストリームの言語コードの連続記述、およ
びファイルのパレンタル管理とアングル情報の記述もあ
る。パレンタル管理情報は、表示される情報のある特定
のシーケンスを記述する場合に使用される。パレンタル
管理情報は、シーケンス内に含まれる特定のセルの最大
親レベルである。レベルは、1から5で変化し、レベルが
高いほど、見聞きされる内容に対する制限が多くなる。
シーケンスとセル、およびパレンタル管理スキームの詳
細は、以下に説明する。ビデオシーケンスのアングルの
数を記述するフィールドもある。例えば、ミュージック
ビデオに、ミュージックビデオ全体を通して3つの異な
ったカメラビューがある場合、ユーザはどの特定のカメ
ラアングルを表示に希望するのかを選択できる。また、
シーケンス内のプログラム数を示すフィールドもある。

【０２５５】メニュー構造情報928には、各メニュータ
イプの開始セル番号が含まれる。ディスプレイシーケン
スには複数のセルがある。例えば、1つのシーケンスは
最高256のセルを格納できる。セルは、後述する再生情
報（PBI）パックと次のPBIの直前のパックの間のGOP
（ピクチャのグループ）の整数である。ビデオ用データ
は、データを連続して再生する必要があるレコード単位
としてセルの中に分離される。セルには、表示のための
情報が含まれ、その目的に応じて分割される。セル内の
第1オーディオパックとおよび第1サブピクチャパック
が、セルの先頭にあるPBIパックの後ろ手記録されるビ
デオヘッドパック中のPTSに近いプレゼンテーション時
刻記録(PTS)を含むのが望ましい。異なったセルは、希
望されるアングルおよびプログラムの親制約に応じて表
示される。例えば、より若年層の視聴者向けには不適切
であった映画のあるセクションがあったと仮定する。表
示できるパレンタル管理レベルに応じて、2つのシーケ
ンス共用セルが存在する。例えば、制約されていない表
示の場合、ある特定のシーケンスにセル1、2、3、およ
び5を表示できる。制約レベルの表示の場合は、そのシ
ーケンスに表示されるセルは1、2、4、および5である場
合がある。

【０２５６】異なったアングルに関しては、同時進行
し、その再生に要する時間が実質上等しい、複数のカメ
ラアングルで各ビデオを記録させることができる。各ア
ングルは、アングルセルと呼ばれる1つのセルから構成
される。同時に先行する複数のアングルセルの集合が、
アングルブロックと呼ばれる。シーケンス内の複数オロ
ケーションでアングルブロックが限定される場合、各ア
ングル番号のアングルセル数およびカメラアングルは、
アングルブロックを通して同じでなければならない。

【０２５７】メニューセルとは、ユーザに、ボリューム
内の各ビデオファイルまたはオーディオファイルの内容
を知らせるメニュー画面を構成するセルである。メニュ
ーセルの集合は、メニュー用データとしてディスク情報
ファイルにともに記録される。メニュータイプ共呼ばれ
る、メニューセルタイプは、タイトルメニュー、プログ
ラムメニュー、オーディオメニュー、サブピクチャメニ
ュー、およびアングルメニューに分類される。メニュー
画面には、メニュー用ビデオが備えられる。再生装置の
画面上に表示される選択用アイテムは、メニューセルの
サブピクチャデータとして記録される。

【０２５８】メニューセル情報テーブル930は、図41の9
32と934のような複数のメニューセル情報が記憶される
テーブルである。1つのメニュー画面に1つのメニューセ
ルが具備される。メニューセル情報は、複数のフィール
ドを含む。第1フィールドは、ディスクの情報のコピー
が許可されているかどうか、パレンタル管理のレベル、
メニューがタイトルメニューであるかどうかなどのメニ
ューセルタイプ、プログラムメニュー、オーディオメニ
ュー、サブピクチャメニュー、またはアングルメニュー
およびメニューの言語コードを示す。各言語にはコード
が割り当てられ、言語コードサブフィールド内に現れる
特殊コードが、メニューと使用される言語を示す。

【０２５９】メニュー画面上のサブピクチャによって表
示される選択アイテムの開始番号および選択アイテム数
を記述するフィールドもある。選択アイテム開始番号
は、メニュー画面上の選択アイテムの最小数を記述し、
メニューの次のページが存在するかどうかを示すフィー
ルド、および選択できる1と16の間のアイテム数を記述
する番号がある。メニューセル情報は、メニューセルの
開始パックのシステムクロックリファレンス(SCR)の下
位32ビット、メニューセルの開始アドレスをファイルの
先頭からの相対論理番号で記述するフィールド、および
メニューセルを構築する論理ブロック数を記述するフィ
ールドも含む。

【０２６０】メニューデータ922は、メニューのために
表示される実際の情報を含む。この情報は、図40のデー
タファイル910と914の情報が構築されるのと同じように
構築され、したがって各面の綿密な記述は冗長な記述を
防ぐために省略される。メニュー画面で選択されるアイ
テムは、サブピクチャ情報で形成される。ディスクプレ
ーヤによるメニュー選択の処理は、コンピュータコード
を実行するマイクロプロセッサを使用して実行される。
タイトルのためのメニュー選択が行われると、選択の結
果はファイルの最初または選択されたタイトル番号に対
応するシーケンス番号から再生される。プログラムメニ
ュー選択の場合、選択されたプログラムは選択されたプ
ログラムの最初から再生される。メニューからのオーデ
ィオ選択の場合、オーディオストリームは選択されたオ
ーディオストリームに対応するように設定される。同様
に、サブピクチャメニュー選択の場合、チャネル番号は
選択されたサブピクチャチャネルに等しく設定される。
最後に、メニューからのアングル選択は、アングルセル
番号を選択された番号に等しくなるように変更する。そ
れ以外の情報は、希望に応じて含まれ、メニューを通し
て選択できる。

【０２６１】図40のデータファイル910のようなデータ
ファイルには、図42にブロック図で示されるような2つ
のセクション、つまりデータファイル管理情報940およ
びオーディオ情報、ビデオ情報およびサブピクチャ情報
を表示するために使用される実際のデータ942が記憶さ
れる。データファイル管理情報940には、4つの主要な構
成要素、つまりデータファイル管理テーブル944、シー
ケンス情報テーブル946、セル情報テーブル948およびデ
ータ検索マップ950を含む。

【０２６２】データファイル管理テーブル944は、デー
タファイル910の各面に関する情報を含む。この情報に
は、ファイル名を識別するためのディレクトリレコード
内の対応するファイル識別子と同じ内容であるファイル
名のフィールド、オーディオ情報とビデオ情報の両方が
ファイルに記憶されることを示すファイル識別子、論理
ブロック数により定義されるファイルのサイズ、ファイ
ル管理テーブルのサイズ、ファイルのシーケンス番号、
ファイルのセルの数、ディスク構造情報(DSI)パックの
数、シーケンス情報テーブル946の開始アドレス、セル
情報テーブル948の開始アドレス、データ検索マップの
開始アドレス、データ942の開始アドレス、MPEG-1また
はMPEG-2のようなビデオ圧縮モードを含むデータ942の
ビデオ属性を記述するフィールド、レートが毎秒29.97
フレームであるのか、毎秒25フレームであるのかを含む
フレームレート、表示アスペクト比が3/4であるのか、9
/16であるのか、またはディスプレイモードによってパ
ンスキャンフォーマットとレターボックスフォーマット
の1つが可能とされるのか、両方が可能とされるのかを
示す表示アスペクト比を含む。

【０２６３】データファイル管理情報は、さらに、ファ
イル内のオーディオストリーム数を、オーディオコーデ
ィングモードのようなオーディオストリーム属性、モノ
ラル、ステレオ、またはデジタルサラウンドのようなオ
ーディオモード、特殊言語が含まれているのかどうかを
示すオーディオタイプを記述するフィールド、および言
語のコード番号を示す特殊コードのフィールドも含む。

【０２６４】データファイル管理テーブル944は、さら
に、サブピクチャチャネル数を記述するフィールド、サ
ブピクチャのランレングスコーディングが使用されるこ
と、および指定言語および指定される言語があるかどう
かを示すフィールドのようなサブピクチャチャネル属性
を記述するフィールドを含む。さらに、ファイルのすべ
てのサブピクチャチャネルで使用される16のカラーパレ
ットのY、Cr、およびCBカラーを示すフィールドがあ
る。また、シーケンス情報テーブルのサイズ、最小セル
番号と後続の連続セルの数を記述するフィールド、およ
びファイルの1つのシーケンス内で使用されるセル番号
の範囲を記述するフィールドもある。1つのシーケンス
内で使用されるセル番号は、32の連続番号で1つの集合
を作り、最小セル番号を集合の最初の番号となるように
格納することにより計算される数の集合に入れられなけ
ればならない。このフィールドには、シーケンスで使用
されるセル数、およびシーケンスで使用される最小セル
数を含むサブフィールドがある。

【０２６５】シーケンス情報テーブル946には、複数の
シーケンス情報エントリ952と954を含む。シーケンスと
は、このシーケンスにより指定される範囲内のセルが選
択式で再生される順序のことである。完全および接続と
いう2種類のシーケンスがある。完全型シーケンスは、
それ自体を再生した後に終了する。接続型シーケンス
は、連続して再生される。参照番号952により示される
シーケンス情報1および954により示されるシーケンス情
報ｉのようなシーケンス情報番号は、シーケンス番号に
等しく、1で開始するシーケンス情報テーブルい、記述
順序で番号が付けられる。シーケンス情報テーブルのシ
ーケンス情報エントリは、完全型シーケンスまたは接続
型シーケンスの順序で記述されている。各シーケンス情
報テーブルは、完了型シーケンスまたは接続型シーケン
スの順序で記述される。各シーケンス情報には、シーケ
ンスタイプ、格納されるプログラム数、格納されるセル
数、シーケンス再生時間、接続型シーケンス数、接続可
能シーケンス番号、およびシーケンス制御情報を示す
フィールドを示すフィールドを含む。

【０２６６】シーケンス情報のシーケンスタイプフィー
ルドは、シーケンスのコピーおよびパレンタル管理を記
述する。コピーが許可されているのか、または禁止され
ているのかを示すサブフィールド、パレンタル管理のレ
ベルを1-5で指定するサブフィールド、完了型シーケン
ス、接続型ヘッドシーケンス、接続型中間シーケンスま
たは接続タイプとシーケンス内の１つである可能性があ
るシーケンスタイプを示すサブフィールドある。また、
シーケンスが、カラオケアプリケーションで使用するか
どうかを示すアプリケーション型サブフィールドもあ
る。

【０２６７】格納プログラム数フィールドは、最高1つ
のシーケンス内に100というプログラム数を記述する。
格納セル数フィールドは、ある特定のシーケンス内で
の、合計256セルまでのセル総数を記述する。シーケン
スまたは再生時間は、時、分、秒およびビデオフレーム
による単位でこのシーケンスの総再生時間を記述する。

【０２６８】接続型シーケンス数フィールドには、最大
数が8であるその直後に接続可能なシーケンス数を指定
する。接続可能シーケンス番号フィールドは、接続可能
シーケンスのシーケンス番号と指定される数のシーケン
スのパレンタル管理のレベルを記述する。接続可能シー
ケンスの選択番号は、記述された順序で1から割り当て
られる。このフィールドには、パレンタル管理番号のサ
ブフィールド、およびシーケンス番号のサブフィールド
が指定される。シーケンス情報の最後のフィールドは、
再生順でシーケンスに含まれるセルを記述するシーケン
ス制御情報である。このフィールドも、複数のセルの集
合であるアングルブロックの記述に使用される。それら
のセルの再生時間は、実質上等しい。各再生セクション
は、1つのセルで構成される。アングルブロックは、多
くても9個のセルを含み、第1セルに1という番号が付け
られる。シーケンス制御情報のサブフィールドには、実
質上再生される複数のセルを結合する再生単位としてプ
ログラムを定義するプログラム番号を指定する。以下の
セルに連続して進むのか、休止するのか、あるいはシー
ケンスの最後に到達したかを示すセル再生制御のサブフ
ィールドがあり、ブロックが構成セルではないかどう
か、ブロック構成の第1セルがあるかどうか、それがブ
ロック構成内のセルなのか、ブロック構成内の最後のセ
ルであるのかを示すブロックモードサブフィールドがあ
る。ブロックがないかどうか、またはアングルブロック
があるかどうかを示すブロック型サブフィールドがあ
る。最後に、再生対象のセルのセル番号を示すサブフィ
ールドがある。

【０２６９】データファイル管理情報940は、さらに、
複数のセル情報エントリ956と958を含むセル情報テーブ
ル948を含む。各セル情報エントリは、コピーが許可さ
れているのか、禁止されているのかを示すセルタイプ情
報、およびパレンタル管理レベルを含む。また、時、
分、秒およびビデオフレームによりセルのセル再生総時
間を記述するセル再生時間を示すフィールドもある。セ
ルの第1パックに記述されるシステムクロックリファレ
ンスの下位32ビットを記述するフィールド、ファイルの
始めからの相対論理ブロック番号でセルの開始ポイント
得のアドレスを記述するフィールド、およびセル内に含
まれる論理ブロック数を記述するフィールドがある。

【０２７０】ファイル管理情報940のデータの最後のセ
クションは、データ検索マップ950である。データ検索
マップは、データ検索情報パック960と962の複数のポイ
ンタを備える。再生情報(PBI)パックポインタと呼ばれ
るこれらのポインタは、データ942内に存在する再生情
報のアドレスを指定する。高速順方向モードまたは高速
反転モードを実行し、情報の表示を可能にするために
は、MPEG-2ビデオシーケンスのイントラピクチャに依存
するのが最適です。これらのイントラピクチャは、その
アドレスがデータ検索マップ内に記憶されるデータ942
内の再生情報パックを使用して配置される。PBIパック
の詳説は、以下で行う。

【０２７１】図43にブロック図で示されるデータファイ
ル910のデータ942は、再生情報(PBI)、ビデオ情報、サ
ブピクチャ情報、およびオーディオ情報のインタリーブ
されたパックを含む。例えば、図43では、データは再生
情報940、ビデオ情報942と944、サブピクチャ情報946、
オーディオ情報948などを含む。データ942内の情報の構
造、およびプレゼンテーションタイミングは、MPEGシス
テム説明（ISO/IEC 13818-1）に定義されるプログラム
ストリームに準拠する。しかし、再生情報およびサブピ
クチャ情報、ならびにこの情報が、記憶、エンコード、
および復号化される方法が、本発明の一部を構成する。

【０２７２】図43でデータ942から構成されるさまざま
な情報は、情報パックを含む。例示的なパック970Aおよ
び980Aが、図44Aと44Bに示される。各パックは、パック
ヘッダ972Aまたは972B、およびビデオ情報、オーディオ
情報、サブピクチャ情報、または再生情報から構成され
る。

【０２７３】パック970Aの構造は、パケット982Aが2034
バイトと2027バイトの間で占有するときに使用される。
スタッフィングフィールド980Aによって、1から8バイト
のスタッフィングがパック総サイズを2048バイトにでき
るようにする。ビデオ情報、オーディオ情報、サブピク
チャ情報または再生情報が2027バイトを下回るとき、図
44Bに示されるパック構造970Bが使用され、1バイトのス
タッフィング970Bおよびパケット982Bと984Bのビット総
数を2034バイトにあるようにする埋め込み984のパケッ
トがある。パケットヘッダ972Aと972Bのそれぞれには、
パック開始フィールド974、システムクロックリファレ
ンス976、多重化（MUX)レートフィールド978、およびス
タッフィングフィールド980がある。図44Aと44Bのパケ
ットは、ISO/IEC13818に従って構築され、プログラムス
トリームパック内のフィールドのセマンティック定義に
関するその第2.5.3.4項に説明される。

【０２７４】図45は、再生情報(PBI)パックを示してい
る。パックヘッダ972は、図44Aと44Bに関して記述され
るように、構築される。図45のシステムヘッダ986は、I
SO/IEC13818-1に記述されるプログラムストリームシス
テムヘッダの要件に準じて構築される。システムヘッダ
内のフィールドのセマンティック定義は、ISO/IEC 1381
8-1の第2.5.3.6項に説明される。

【０２７５】パケットヘッダ988は、ISO/IEC 13818-1の
第2.4.3項に記述されるPESパケット内のフィールドのセ
マンティック定義に説明されるフィールドに従って構築
される。ただし、パケットヘッダ988では、プレゼンテ
ーション時刻記録までのフィールドだけが必要とされ
る。

【０２７６】再生情報パックは、さらに、サブストリー
ムIDフィールド990を含む。これは、サブストリームの
識別を示す8ビットのフィールドである。使用できる別
の識別は、サブピクチャストリーム、ビデオ空白化情報
（VBI)ストリーム、AC-3ストリーム、または線形PCMス
トリームである。MPEGオーディオサブストリームなどの
他のストリームタイプを入れることも可能である。サブ
ストリームID990はビデオ空白化情報992のデータを先行
するので、サブストリームIDは、後続の情報がビデオ空
白化情報ストリームであることを示すように設定され
る。ビデオ空白化情報992のデータは、ISO/IEC 13818-1
に従って構築され、ISO/IEC 13818-1に必要となる意味
論に準拠する。

【０２７７】図45に示される再生情報パックの中には、
データ検索情報996のデータを格納するデータ検索情報
パケットのパケットヘッダ994も示される。パケットヘ
ッダ994には、24ビット値000001hが設定されるパケット
開始コードプレフィックス、データ検索情報996が以前
に定義された規格に準拠していないことを示すストリー
ム識別、パケット長を示すフィールドを含む。データ検
索情報996はMPEG規格では開示されていないので、スト
リームIDは、後続の情報がデータストリームの私的なタ
イプであることを示す。

【０２７８】図45を説明するデータ検索情報996のデー
タの特定の内容が図46に示される。データ検索情報996
は、一般情報1000、アングルアドレス情報1020、ハイラ
イト情報1022、同期再生情報1024、およびPBIパックア
ドレス情報1036を含む。

【０２７９】一般情報1000は、図47にさらに詳細にブロ
ック図で示される。前記のように、データ検索情報の目
的とは、デジタルエンコードされた情報の迅速な検索を
可能にすることであり、特に、ビデオ復号化中に実行さ
れるトリックモード用イントラピクチャオ高速位置発見
を可能にする。したがって、図46に示される再生情報パ
ックは、ピクチャのグループ(GOP)のそれぞれのヘッド
パックであり、I-ピクチャで開始するビデオヘッドパッ
クの直前に割り当てられる。一般情報1000は、I-ピクチ
ャの再生開始時刻であるGOP1002の時刻記録である。次
に、PBIのシステムクロックリファレンス(SCR)がある。
これは、PBIパックヘッダに記述されるSCRの下位32ビッ
トを記述する。1006は、I-ピクチャの最終アドレスを示
し、ファイルの初めからの相対論理ブロック番号により
I-ピクチャの最終データが記録されるパックのアドレス
を記述する。セル番号はフィールド1008に記憶され、GO
Pが属するセル番号を記述する。フィールド1010は、制
約のレベルおよびコピーが許可されているかどうかも含
むパレンタル管理情報を記述する。最後に、フィールド
1012は、ファイルのヘッドからの相対論理ブロック番号
を使用するこのPBIパックのアドレスであるPBIパックア
ドレスを記述する。

【０２８０】図46に示されるデータ検索情報996のフィ
ールド1020は、アングルアドレス情報である。アングル
アドレス情報には、その他のアングルのアドレス情報が
含まれる。アングルアドレス情報には、それぞれが異な
ったアングルセル番号に関する9つのフィールドが含ま
れる。アングルアドレス情報1020の各フィールドの場
合、ある特定のPBIパックが属するセルがアングルブロ
ックを構成する場合、アングルアドレス情報のフィール
ドは、対応するデータ検索情報のビデオ開始プレゼンテ
ーション時刻記録を超えないもっとも近いビデオ開始プ
レゼンテーション時刻記録を持つアングルセル番号のPB
Iパックのアドレスを記述する。アングルセルが存在し
ない場合、またはアングルブロックが構成されない場
合、特定のセルのアングルアドレス情報ははゼロに設定
される。

【０２８１】データ検索情報996の第3セクションは、ハ
イライト情報1022である。ハイライト情報は、メニュー
画面上での選択アイテムの位置、および選択時に変更さ
れるその色とコントラストを記述する。この情報は、セ
ルがメニューの一部である場合にだけ使用される。ハイ
ライト情報には、選択アイテム開始番号およびメニュー
画面上でサブピクチャにより表示されるアイテム数を記
述するフィールドがある。選択アイテム開始番号および
アイテム数の特定のサブフィールドには、メニュー画面
上での選択アイテムの最小数を記述するサブフィール
ド、メニューの次ページが存在するかどうかを記述する
サブフィールド、およびメニュー画面上での選択アイテ
ムの数を記述するサブフィールドがある。ハイライト情
報の第2フィールドには、選択アイテムの位置、色、お
よびコントラストが含まれる。このフィールドは、メニ
ュー画面上の選択アイテムごとの矩形表示領域、および
選択時に変更される対応する色とコントラストを記述す
る。矩形表示領域は、X-Y座標面内に限定される。選択
アイテムの位置、色、およびコントラストを記述するこ
のフィールド内の情報には、メニューの矩形領域を限定
すること、およびさまざまなタイプのピクセルが、選択
時にどのようにして変更されるのかを記述する情報を含
む。さらに詳細に後述するように、サブピクチャは4種
類の異なったピクセルを酌量する。テキストやそれ以外
の情報を表示するために使用できる第1強調ピクセルと
第2強調ピクセル、線描画またはその他の図形パターン
のようなパターンを表示するために使用されるパターン
ピクセル、およびバックグラウンドピクセルがある。以
上4種類の異なった情報がハイライトまたは選択される
場合、アイテムがハイライトされるときに選択される
色、およびハイライトされたときのピクセルのコントラ
ストも知っておく必要がある。したがって、4種類の異
なったピクセルが選択されたときの、その色およびコン
トラストを記述するハイライト情報内に8つのサブフィ
ールドがある。

【０２８２】データ検索情報996内の5番目のアイテムは
同期再生情報1024である。同期再生情報1024は、図48に
詳しくブロック図で示される。同期再生情報の目的と
は、ビデオデータと同期するオーディオとサブピクチャ
の開始時間とアドレス情報を検出できるようにすること
である。図48に示される同期再生情報1024には、オーデ
ィオのプレゼンテーション時刻記録のターゲットである
オーディオパックアドレスが含まれる。このフィールド
の最上位ビットは、オーディオパックがこのPBIの前に
位置しているのか、このPBIの後に位置しているのかを
示す。オーディオ1028のプレゼンテーション時刻記録
（PTS）は、ビデオ開始PTSからの相対プレゼンテーショ
ン時刻記録により、I-ピクチャの再生開始時間の直後に
再生開始時間が設定されたオーディオパケットのPTSを
記述する。オーディオのプレゼンテーション時刻記録
は、プレゼンテーション時刻記録をそのために記憶させ
るために、最高8つのオーディオストリームを酌量す
る。さらに、GOPの間に再生されるオーディオフレーム
を構成するオーディオパケットがするかどうかを示すサ
ブフィールドがある。ピクチャにオーディオがない場合
には、オーディオのプレゼンテーション時刻記録を記憶
したり、復号化する必要はない。最高8つのオーディオ
チャネルがあるので、各オーディオチャネルには対応す
るアドレスフィールドと時刻記録フィールドがある。

【０２８３】データ構造1024も、問題のサブピクチャパ
ックの、PBIパックに相対したアドレスをを記述するサ
ブピクチャパックアドレス1030を含む。サブピクチャの
プレゼンテーション時刻記録は、対応するサブピクチャ
情報の同期を記述する。GOP再生の間に再生される必要
があるサブピクチャユニットが存在するかどうか、サブ
ピクチャの再生開始時間がビデオプレゼンテーション時
刻記録の前かどうか、GOP再生中に再生されるサブピク
チャユニットの製作開始時間、およびGOP再生中に再生
されるサブピクチャユニットの再生終了時間を示すサブ
フィールドがある。1つのデータストリームに含めるこ
とができる最高32のサブピクチャのように、存在するそ
れぞれのサブピクチャには、対応するアドレスと時刻記
録のフィールドがある。

【０２８４】データ検索情報996の図46に示される最後
のセクションは、PBIパックアドレス情報である。PBIパ
ックアドレス情報は、ファイル内の他のPBIパックのア
ドレスを構成し、他のPBIパックの位置が迅速に見つけ
られるようにする。PBIパックアドレス情報は、相対論
理ブロック番号を使用して周囲のPBIパックのアドレス
を記述する。PBIパックアドレス情報には、それぞれ次
のPBIパックアドレスと前のPBIパックアドレスを記述す
る2つのフィールドがある。現在のPBIパックアドレスか
らの相対論理ブロック番号を使用して、GOPのすぐ先に
あるGOPに属するPBIパックのアドレスを、nx0.5秒と(n+
1)x0.5秒の間であるその累積した再生時間で定義し、複
数のPBIパックがこの範囲に該当する場合は、n x 0.5
秒、1≦b≦15を選択する15のフィールドがある。

【０２８５】現在のPBIパックアドレスからの相対論理
ブロック番号を使用して、GOPに属するPBIパックのアド
レスを、n x 0.5秒と(n+1) x 0.5秒の間のその累積再生
時間で定義し、複数のパックがこの範囲っ該当する場合
には、n x 0.5秒、-15≦n≦-1にもっとも近いPBIパック
を選択する15のフィールドがある。

【０２８６】現在のPBIパックアドレスからの相対論理
ブロック番号を使用して、GOPのすぐ先のGOPに属するPB
Iパックアドレスをn x 0.5秒と[n x 0.5 +1]秒の間のそ
の累積再生時間で定義し、複数のPBIパックがこの範囲
に該当する場合には、n x 0.5秒、n=20またはn=60にも
っとも近いPBIパックを選択する2つのフィールドがあ
る。

【０２８７】現在のPIパックアドレスからの相対論理ブ
ロック番号を使用して、GOPに臆するPBIのアドレスをn
x 0.5秒と[n x 0.5 +1]秒の間のその累積再生時間で定
義し、複数のPBIパックがこの範囲に該当する場合は、P
BIパックをn x 0.5秒、n=-20またはn=-60にもっとも近
いPBIパックを選択する2つのフィールドがある。

【０２８８】ビデオパック1040の構造は図49にブロック
図で示される。ビデオパックは、図44Aと44Bに示される
ヘッダ972Aまたは972Bに従って構築されたパックヘッダ
972を備える。ビデオ用のパケットヘッダ1046は、ビデ
オデータ1048でのように、ISO/IEC 13818-1に従って構
築される。ただし、MPEGビデオ信号として表記されるビ
デオデータ1048は、前記技法に従いエンコードするのが
好ましい。

【０２８９】MPEGエンコードされたピクチャのグループ
は、図50の1050として示される。このGOP 1050を複数の
ビデオパック1040に分割し、ビデオストリーム1060を作
成する方法は、図50の底部にブロック図で示される。ピ
クチャオグループ1050は、ビデオパックに適合するため
に適切なユニットに分割される。最後のビデオパック10
40G、ビデオパックjは、パックのそれぞれに使用される
完全な2048バイトを使用しないので、最後のパックjを2
048バイトに等しくするには、スタッフィングが使用さ
れる。

【０２９０】図51Aは、MPEGオーディオのビデオパック
を示している。このビデオパックは、パックヘッダ97
2、MPEG要件に準拠して構築されるパケットヘッダ108
4、およびエンコードされたMPEGオーディオデータ1086
を含む。

【０２９１】図51Bは、線形PCMオーディオまたはドルビ
ーAC-3オーディオのどちらかと準拠して構築されるオー
ディオパック1090を示している。図51Bにブロック図で
示されるパケットの場合、パックヘッダ972は前記のよ
うに配列され、パケットヘッダ1094はMPEG要件に準拠し
て構築され、stream_idフィールドは線形PCMまたはAC-3
のどちらかに対応する私的オーディオデータストリーム
を示す。サブストリームid 1096は、オーディオデータ
が線形PCM用であるか、AC-3（またはMPEG）用であるか
を示す。オーディオフレームポインタ1098は、オーディ
オパケット内のオーディオフレームヘッダ数を示すフレ
ームヘッダ数を具備し、ポインタの最後のバイトからの
相対バイト数を使用して、オーディオフレームの第1ア
クセス装置の先頭を示す第1アクセス装置ポインタも備
える。線形PCMオーディオにとって、各フレームがフレ
ームヘッダとフレームデータを備えるオーディオフレー
ムに分割されるのは普通のことである。オーディオフレ
ームポインタ1098も同様にドルビーAC-3で使用できる。
オーディオデータ1100は、対応するオーディオエンコー
ド方法に従って構築される。

【０２９２】図52は、エンコードされたオーディオスト
リーム1100を示す。このオーディオストリームは、個々
のパック1122を構成するオーディオパックのストリーム
1120に変換される。各パックの長さは2048バイトで、最
後のオーディオパック1122G、オーディオパックjは、長
さを2048バイトにするために、スタッフィングビットを
付加することによって調整される。

【０２９３】本発明の新規の特徴とは、サブピクチャの
使用およびサブピクチャパックのオーディオ情報とビデ
オ情報とのインタリーブである。サブピクチャ情報を使
用すると、グラフィック情報の表示が可能になり、MPEG
ビデオでのサブピクチャ情報の重複が酌量できる。ホン
発明により使用されるサブピクチャ情報と従来のクロー
ズキャプション字幕の間の大きな相違点とは、サブピク
チャ情報がビットマップ化されたグラフィックであるの
に対し、クローズキャプションでは、デコーダに記憶さ
れている文字セット内の文字を表示するために文字符号
が伝送されるという点である。したがって、従来のクロ
ーズキャプションは、デコーダ内の文字セットによって
制限される。しかし、サブピクチャ情報はビットマップ
化しているため、外国語文字を含む任意のタイプの文字
は、言語ごとにデコーダ内の文字セットを記憶する必要
なしに表示することができる。

【０２９４】サブピクチャ情報の各表示画面が、サブピ
クチャユニットと呼ばれる。図53にサブピクチャユニッ
ト1140がブロック図で示される。サブピクチャユニット
は、ビットマップ化されたピクセルデータから成る1つ
の画面を具備し、このピクセルデータの画面が複数のビ
デオフレームで表示される。サブピクチャユニット1140
は、サブピクチャユニットヘッダ1142を備える。サブピ
クチャユニットヘッダ1142には、サブピクチャ装置の先
頭からのバイト数に相対して、サブピクチャユニットの
サイズおよび表示制御シーケンステーブル1146を記述す
るフィールドがある。

【０２９５】ピクセルデータ1144は、ランレングス圧縮
済みビットマップ化情報である。ピクセルは表示された
情報のバックグラウンドを形成するバックグラウンドピ
クセル、図形線描画を含むサブピクチャ内の表示パター
ンを可能にするパターンピクセル、および2つの異なっ
た属性を持つ図形または文字が表示できるようにする2
種類の強調ピクセルとなる場合がある。ビットマップ化
情報は、従来のグラフィック作成技法を使用して作成で
きる。ランレングス圧縮は、以下の規則に従って実行さ
れる。同種の1ピクセルから3ピクセルが続く場合、最初
の2ビットにはピクセル数を、続く2ビットにはピクセル
データを入力する。4ビットが1つの単位と見なされる。
同種の4から15のピクセルが続く場合は、最初の2ビット
にゼロを指定し、続く4ビットにピクセル数、次の2ビッ
トにピクセルデータを入力する。8ビットが1つの単位と
見なされる。同種の16から63ピクセルが続く場合、最初
の4ビットにゼロを指定し、続く6ビットにピクセル数、
次の2ビットにピクセルデータを入力する。12ビットが1
つの単位と見なされる。同種の64から255のピクセルが
続く場合は、最初の6ビットにゼロを指定し、続く8ビッ
トにピクセル数、接ぎの2ビットにピクセルデータを入
力する。16ビットが1つの単位と見なされる。同じピク
セルが行末まで続く場合は、最初の14ビットにゼロを指
定し、次の2ビットにピクセルデータを記述する。16ビ
ットが1つの単位と考えられる。1行でのピクセルの記述
が完了するときにバイト割当てが生じない場合、調整の
ために4ビットのダミーデータを挿入する。希望に応じ
て、画像データを表すために他の圧縮機構を使用するこ
とも可能である。例えば、JPEGフォーマットやGIFFフォ
ーマットを使用して、サブピクチャ画像を表すことがで
きる。

【０２９６】表示制御シーケンステーブル1146には、制
御シーケンスが発生する年代順を記述する複数の表示制
御シーケンス1146A、1146B、1146Cなどが含まれる。表
示制御シーケンステーブルには、サブピクチャユニット
内の情報がどのように表示されるのかに関する情報が含
まれる。例えば、1つのサブピクチャを形成するワード
は、1つづつまたは経時的にグループとして表示される
か、その色が変化することがある。これは、カラオケ情
報を表示するためにサブピクチャを使用する場合に役立
つ。

【０２９７】各表示制御シーケンス(DCSQ)は、サブピク
チャユニットが表示されている期間で実行されるピクチ
ャデータを変更するコマンドを酌量する。表示制御シー
ケンスの第1フィールドは表示開始時間である。このフ
ィールドは、サブピクチャユニットヘッダによりサブピ
クチャパケット内で記述されるPTSからの相対PTSのある
DCSQに含まれる表示制御コマンドの実行開始時間を記述
する。記述された実行開始時間の後の第1ビデオフレー
ムから、表示制御緒は、DCSQ表示制御開始時間に従って
開始される。各DCSQの第2フィールドは、後続の表示制
御シーケンスのアドレスである。このフィールドは、第
1サブピクチャユニットからの相対バイト数により後続
のDCSQの開始アドレスを記述する。後続のDCSQが存在し
ない場合には、このフィールドは、第1サブピクチャユ
ニットからの相対バイト数によりこのDCSQの開始アドレ
スを記述する。それ以降、DCSQには1つ以上の表示制御
コマンドが格納される。これらのコマンドにより、ピク
セルデータの属性および表示を制御、変更できるように
なる。コマンドには、サブピクチャのオン／オフ状態に
関係なく、強制的にサブピクチャ装置の表示を開始する
コマンドが含まれる。例えば、ユーザがサブピクチャを
オフにするためにメニューを使用する場合、このコマン
ドを設定してユーザの設定値を無視することができる。
別のコマンドは、更新されたサブピクチャ装置の表示を
開始する。このコマンドは、各DCSQで一度表示されなけ
ればならない。2種類の強調ピクセル、パターンピクセ
ル、およびバックグラウンドピクセルを含む前記の4種
類のピクセルの色とコントラストを設定するためのコマ
ンドがある。サブピクチャを構成するピクセルデータの
矩形領域表示および位置を設定するコマンドが存在す
る。このコマンドは、上部および下部のX座標とY座標の
設定を可能にする。また、表示に使用されるピクセルデ
ータのヘッドアドレスを設定するために使用されるコマ
ンドもある。このコマンドを使用すると、上部フィール
ドと下部フィールドの両方のヘッドアドレスを入力でき
る。拡大されたフィールドでは、装置のヘッドからの相
対バイト数による上部フィールドと下部フィールドのピ
クセルデータの各ヘッドアドレスが使用される。第1ピ
クセルデータは、行の第1ピクセルを表す。このコマン
ドは、少なくとも第1DCSQ、DCSQ0で使用されなければな
らない。

【０２９８】ピクセルデータの色とコントラストを変更
するためのDCSQの中に表示されるコマンドがある。デー
タ検索情報のハイライト情報が使用される場合には、こ
のコマンドは使用してはならない。ピクセルデータの色
とコントラストを変更するためのコマンドは、表示中に
ピクセルデータの色とコントラストを制御するためのピ
クセル制御データを含む。ピクセル制御データに記述さ
れる制御の内容は、指定された開始時間の後にビデオフ
レームごとに実行され、新規ピクセル制御データが検出
されるか、新規サブピクチャユニットが検出されるまで
続行する。ピクセル制御データは、同じ変更が加えられ
る線を指定するために使用される線制御情報を含む。ま
た、ピクセル制御情報は、変更が加えられる線上の位置
を指定するために使用することもできる。線制御コマン
ドにより、開始線番号、変更ポイント数、および変更終
了線番号の変更が可能になる。ピクセル制御情報は、変
更開始ピクセル番号、および強調ピクセル1と2、パター
ンピクセル、およびバックグラウンドピクセルの新しい
色とコントラストを含む。また、表示制御シーケンスの
最後を示すコマンドもある。各DCSQは、このコマンドで
終了しなければならない。

【０２９９】映画の場合のようなビデオフレームの期間
で、使用できる多くの異なったサブピクチャユニットが
存在する。図54に図示されるように、サブピクチャユニ
ットは、サブピクチャパック1150に分割される。サブピ
クチャパックには、前記のパックヘッダ972、MPEGシス
テム要件に準拠するパックヘッダ、後続のデータがサブ
ピクチャデータであることを示すサブストリームID、お
よびサブピクチャデータ1158それ自体がある。

【０３００】サブピクチャユニット1140のようなサブピ
クチャユニットは、図55にブロック図で示されるように
サブピクチャパック150に分割される。最後のサブピク
チャパック1050Gには、その長さを2048バイトにする埋
込みが含まれる。

【０３０１】図56では、連続サブピクチャユニットが表
示される方法を説明する。時間が新しいサブピクチャパ
ケットに記述されるPTSの時間に等しくなる場合、現在
表示中(1160)のサブピクチャユニットがクリアされ(116
2)、次のサブピクチャユニットの表示制御シーケンスに
よって指定される時間が発生すると、そのサブピクチャ
が表示される(1164)。1160と1162の間に、サブピクチャ
ユニットnとサブピクチャユニットn+1の間の境界線があ
る。この境界線は、サブピクチャユニットn+1のパケッ
トヘッダに記述されるPTSで発生する。サブユニットn+1
の実際の表示時間は、サブピクチャn+1のDCSQに説明さ
れる。

【０３０２】サブピクチャ情報に使用されるピクセルデ
ータの作成は、表示が希望される情報のビットマップを
作成するためにコンピュータを使用して実行できる。ビ
ットマップ化情報のプロセスは、技術で周知である。

【０３０３】図40-56は、オーディオ情報、ビデオ情
報、およびサブピクチャ情報をエンコードするために使
用されるデータ構造を強調する。ただし、図40-56での
データ構造の開示により、MPEGエンコードの従来の技術
の当業者は、特にMPEGシステム説明ISO/IEC 13818-1の
力を借りて、エンコードされたオーディオ、ビデオ、お
よびサブピクチャをデータ構造にフォーマットできる。
同様に、データを記憶する構造についての知識があれ
ば、ビデオ情報、オーディオ情報、およびサブピクチャ
情報を作成するためのデータ構造の復号化は、従来の技
術の当業者により実行できる。

【０３０４】本発明の一部を成す例示的なビデオデコー
ダは、光ディスクに記憶されたデータを読み取る光ディ
スク読取り装置を具備する。読み取られた情報は、情報
を復号化するために、従来の解析技法を使用して解析さ
れる。ビデオ、オーディオ、サブピクチャ、およびPBI
パックのすべてを復号化しなければならない。ビデオ
は、オーディオパックが従来のデコーダを使用して復号
化されるように、市販されているMPEGデコーダを使用し
て復号化することができる。サブピクチャ情報は、サブ
ピクチャユニットをサブピクチャパックから、それらが
エンコードされたのと逆転して構築することで復号化さ
れる。特別に構築されたハードウェアまたはソフトウェ
アコーディングを使用してプログラミングされた汎用マ
イクロプロセッサは、サブピクチャ情報を復号化するた
めに使用できる。図45にブロック図で示される再生情報
パックには、データ検索情報996が含まれる。データ検
索情報は、プログラミングされたマイクロプロセッサを
使用して処理され、オーディオデコーダ、ビデオデコー
ダ、およびサブピクチャデコーダとは異なる。メニュー
機能もプログラミングされたマイクロプロセッサによっ
て実行されるので、データ検索情報の中に含まれるハイ
ライト情報1022および他のすべてのメニュー機能は、サ
ブピクチャデコーダによってではなく、プログラミング
されたマイクロプロセッサによって実行される。本発明
の動作、データ構造、エンコードプロセスと復号化プロ
セスに関する追加情報は、両方とも本明細書に参考によ
り取り入れられる日本国特許明細書7ー8298、および7-85
693に記載される。

【０３０５】本発明のエンコードシステムを使用する
と、ピクチャ内で品質を制御できる。この制御は、最終
ビデオ製品の作成者がエンコードシステムの最終製品を
密接に制御できるようになるため重要である。したがっ
て、デジタルビデオエンコードによりアナログビデオ内
に存在しない復号化人為構造が生じても、最終デジタル
製品はきわめて良好だろう。前記項のどれかの教示は、
他の項に適用できる。

【０３０６】本発明の決定、計算および処置は、コンピ
ュータ技術の当業者に明らかとなるように、本発明の教
示に従ってプログラミングされた従来の汎用デジタルコ
ンピュータを使用して、実現できる。適切なソフトウェ
アコーディングは、ソフトウェア技術の当業者に明らか
となるように、本開示の教示に基づいて技能のあるプロ
グラマにより容易に作成できる。

【０３０７】本発明は、当業者に容易に明らかになるよ
うに、アプリケーションに特殊な集積回路を作成した
り、従来の構成部品回路の適切なネットワークの相互接
続によっても、実現される。

【０３０８】本発明は、本発明のプロセスを実行するた
めにコンピュータをプログラミングする場合に使用でき
る指示を格納する記憶装置媒体であるコンピュータプロ
グラム製品を含む。記憶装置媒体は、フロッピーディス
ク、光ディスク、CD-ROM、および磁気光学ディスク、RO
M、RAM、EPROM、EEPROM、磁気カードや光カード、ある
いは電子指示を記憶するために適当な任意のタイプの媒
体を含む任意のタイプのディスクを含むが、それらに限
定されない。本発明は、さらに、電子指示またはデータ
を記憶するのに適当な前記媒体のどれかで記憶される、
本発明により出力されるエンコードでータを含む記憶装
置媒体であるコンピュータプログラム製品も含む。前
記教示という観点から、本発明の数多くの改良および変
化が可能であることは明らかである。したがって、付属
請求項の範囲内であれば、本発明は、本明細書に明確に
指示がある場合を除き実施できる。

【０３０９】

【発明の効果】以上説明したようにこの発明によれば、
編集したときに画質を劣化させないようにすることがで
きる。即ち、エンコードビデオのセクションを除去す
るため、エンコードされたビットストリーム内のエンコ
ードビデオの始点及び終点を決定する。エンコードデー
タの始点及び終点アドレスは、各ピクチャーで消費され
たビット、各ピクチャーのシーケンスヘッダーのビット
数、各ピクチャーグループ（GOP）ヘッダーのビット
数、及び全スタッフビットを加算することにより計算さ
れる。除去されるビデオの代わりに挿入されるビデオを
エンコードするため、無関係な信号成分のデコードを防
ぐ処理が実行される。この処理は編集ポイント前の最終
ピクチャーを判断し、編集ポイント後のフレームに関す
る参照フレームとしてその最終ピクチャーを使用するこ
とで行われる。更に、その最初の量子化値を用いてエン
コードされた最初のビデオの短い期間が、置き換えられ
るビデオの終わりに含まれる。又は、初期にエンコード
された参照ピクチャーが使用されないように、エンコー
ダは動作する。しかしこれは、ピクチャーの品質を維持
するために余分のビットが必要となる。なぜなら、置き
換えビデオの初期の双方向フレームは2つの参照フレー
ムの代わりに1つの参照フレームのみを使用するからで
ある。

【図面の簡単な説明】

【図１Ａ】エンコーダシステムアーキテクチャのブロッ
ク図。

【図１Ｂ】エンコードされるべきオーディオおよびビデ
オを得るための装置、ならびにエンコードシステムによ
り作成されるエンコードされたオーディオ映像データを
書き込み、伝送するための装置を示す図。

【図２】図１のシステムの一般的な動作を示すフローチ
ャート。

【図３】セットアップ状態で実行されるプロセスを示す
フローチャート。

【図４】圧縮状態で実行されるプロセスを示す図。

【図５】編集状態で実行されるプロセスを示す図。

【図６】開始状態、完了状態、および終了状態のために
実行されるプロセスを示す図。

【図７】マルチパスビデオエンコーダを使用しながら所
定数のオーディオトラックをエンコードするのに必要と
されるオーディオエンコーダの数を決定する方法、なら
びにオーディオエンコードおよびマルチパスビデオエン
コードを同時に実行するプロセスを示すフローチャー
ト。

【図８Ａ】シーケンスレーヤのログファイルフォーマッ
トを示す図。

【図８Ｂ】同じくシーケンスレーヤのログファイルフォ
ーマットを示す図。

【図８Ｃ】同じくシーケンスレーヤのログファイルフォ
ーマットを示す図。

【図８Ｄ】同じくシーケンスレーヤのログファイルフォ
ーマットを示す図。

【図９Ａ】ピクチャレイヤのログファイルフォーマット
を示す図。

【図９Ｂ】同じくピクチャレイヤのログファイルフォー
マットを示す図。

【図９Ｃ】同じくピクチャレイヤのログファイルフォー
マットを示す図。

【図１０】マクロブロックレーヤのログファイルのフル
フォーマット、およびマクロブロックレーヤのログファ
イルのショートフォーマットを示す図。

【図１１】ログファイル内の情報を活用するためのプロ
セスを示す図。

【図１２】異なる期間に対する画質の手動調整中に実行
される一般プロセスを示す図。

【図１３】様々な期間で画質を変更するためのパラメー
タを入力するために使用されるユーザインタフェースを
示す図。

【図１４】所望の画質に対応するビット数を計算するた
めの一般的な手段を示す図。

【図１５】最大または最小のユーザ選択優先順位が設定
されるセクションを処理するために使用されるプロセス
を示す図。

【図１６Ａ】最大または最小の優先順位ではない希望の
画質に対応するビット数を計算するためのフローチャー
トを示す図。

【図１６Ｂ】同じく最大または最小の優先順位ではない
希望の画質に対応するビット数を計算するためのフロー
チャートを示す図。

【図１７】画質を変更した結果、アンダフローが生じる
場合に確認するために使用されるプロセスのフローチャ
ートを示す図。

【図１８】バッファアンダフローが、編集セグメント内
で加えられた変更のために、編集セグメントの後のフレ
ームで発生するかどうかを判断するためのフローチャー
トを示す図。

【図１９】ユーザが選択した品質によってエンコードさ
れたビデオのビットレートがどのように変更されるのか
についての例、および同じくユーザが選択した品質によ
ってエンコードされたビデオのビットレートがどのよう
に変更されるのかについての例を示す図。

【図２０】1つのフレーム内のさまざまな領域の画質の
手動調整の間に実行される一般的なプロセスを示す図。

【図２１】ビデオの１フレーム内にユーザが選択した優
先度が設定されたさまざまな領域の例を示す図。

【図２２】選択された優先順位に使用される元の量子化
の端数小数部に対するユーザ選択優先順位のグラフを示
す図。

【図２３】ユーザ選択優先順位の結果生じるビット数
と、フレームの元のエンコードの結果生じるビット数の
間の差異が許容できるかどうか、あるいは訂正手順を実
行しなければならないかどうかを判断するためのプロセ
スを示す図。

【図２４Ａ】設定されたビットが多すぎると判断される
ために、ビット数を低減する目的でマクロブロックの量
子化レベルが増分される場合に、フレームを訂正するた
めのプロセスを示す図。

【図２４Ｂ】同じく設定されたビットが多すぎると判断
されるために、ビット数を低減する目的でマクロブロッ
クの量子化レベルが増分される場合に、フレームを訂正
するためのプロセスを示す図。

【図２４Ｃ】同じく設定されたビットが多すぎると判断
されるために、ビット数を低減する目的でマクロブロッ
クの量子化レベルが増分される場合に、フレームを訂正
するためのプロセスを示す図。

【図２５Ａ】ビット数を増加するために１つのフレーム
内のマクロブロックの量子化レベルを引き下げることに
よってフレーム内の少なすぎるビットを訂正するための
プロセスを示す図。

【図２５Ｂ】同じくビット数を増加するために１つのフ
レーム内のマクロブロックの量子化レベルを引き下げる
ことによってフレーム内の少なすぎるビットを訂正する
ためのプロセスを示す図。

【図２５Ｃ】同じくビット数を増加するために１つのフ
レーム内のマクロブロックの量子化レベルを引き下げる
ことによってフレーム内の少なすぎるビットを訂正する
ためのプロセスを示す図。

【図２６】ｎ個のマクロブロックの集合のそれぞれで使
用されるビットの予想数をメモリからロードしてから、
ｎ個のマクロブロックの集合ごとにビットの結果数をカ
ウントし、ビットの予想数および作成数に基づいた概算
の精度を計算し、フレームの列のターゲットサイズに近
く留まるために、次のｎ個のマクロブロックの予め割り
当てられた量子化レベルを調整する一般的なプロセスを
示しているフローチャート。

【図２７】（Ａ）は、固定割当てされた量子化レベルを
示しているフレームのピクチャを示す図、（Ｂ）はマク
ロブロックの各集合に1 スライスが含まれ、マクロブロ
ックの第1 集合が再エンコードされた後で、第1 訂正係
数が計算され、第1 訂正係数がマクロブロックの第2 集
合に加算された場合の、図２７（Ａ）のフレームのピク
チャを示す図、（Ｃ）はマクロブロックの第2集合が再
エンコードされた後で、第2訂正係数が計算され、第2訂
正係数がマクロブロックの第3集合に追加された、図２
７（B）のフレームのピクチャを示す図、（Ｄ）はマク
ロブロックの第1 集合に２つのスライスが含まれ、マク
ロブロックの第1集合が再エンコードされてから、第１
訂正係数が計算され、第１訂正係数がマクロブロックの
第２集合に加算された場合の図２７（Ａ）のフレームの
ピクチャを示す図。

【図２８】その量子化レベルが変更される２つの異なっ
た領域を含む1 フレームを示す図と、その量子化レベル
が変更された２つの異なった領域を表すために使用され
るビデオストリーム内でのビット数の変更を示している
図２８（Ａ）のフレームの２つの考えられるエンコード
のピクチャを示す図。

【図２９】再エンコードされた列の総長が列の元の長さ
に等しい、一連の画像を表すために使用されるビット数
の変更を示しているビデオストリームを示す図。

【図３０】訂正係数指数が、どのようにして概算率を使
用して比例ルックアップテーブルから求められるのかを
説明するフローチャートを示す図。

【図３１】訂正係数が、訂正係数指数を使用して訂正係
数テーブルからどのようにして選択されるのかを説明す
るフローチャートを示す図。

【図３２】訂正係数が、概算割合およびマクロブロック
の再エンコードされていない残りの集合数を使用してど
のようにして計算されるのかを説明するフローチャート
を示す図。

【図３３】（Ａ）はエンコードされたフォーマットを取
るオリジナルビデオのセクションを示す図、（Ｂ）は元
のエンコードされたビデオに置き換えられなければなら
ないエンコードされていないフォーマットにおけるビデ
オの新たなセクションを示す図、（Ｃ）はオリジナルビ
デオのエンコードされていないセクションがその両端に
あるビデオのエンコードされていない新たなセクション
を示す図、（Ｄ）は元のエンコードされたビデオに置き
換えられなければならないエンコードされたフォーマッ
トにおける図３３（C）のビデオを示す図、（Ｅ）は置
き換えられたエンコードされたビデオがその中に含まれ
る、元のエンコードされたビデオを示す図。

【図３４】減少されたデコード構造を有するビデオとな
るエンコードビデオデータストリームにビデオのセクシ
ョンを置き換えるプロセスを示す図。

【図３５】（Ａ）は立ち下がり端でのオリジナルビデオ
のエンコードされていないセクションを有するビデオの
エンコードされていない新しいセクションを示す図、
（Ｂ）は図３３（Ａ）のブロック図にある最初にエンコ
ードされたビデオに置き換えられるエンコードされたビ
デオのセクションを示す図、（Ｃ）は図３５（Ｂ）の置
き換えられたエンコードされたビデオを含む図３３
（Ａ）の最初にエンコードされたビデオを示す図。

【図３６】クローズグループのピクチャモードを使用し
て置き換えられるビデオをエンコードすることによっ
て、エンコードされたビデオビットストリームを編集す
る場合に、デコード構造を減少させるためのプロセスを
説明する図。

【図３７】（Ａ）は事前エンコードプロセスでビットレ
ートモデルに対する量子化レベルを作成するために、そ
れに割り当てられる2つの量子化レベルが設定される未
処理ビデオのフレームを示す図、（Ｂ）は回転パターン
で割り当てられる4つの量子化レベルのあるフレームを
示す図、（Ｃ）はブロックフォーメーションで分散され
る4 つの量子化レベルのあるフレームを示す図。

【図３８】ビデオ信号を得て、それらの信号を事前エン
コードし、事前エンコードフェーズで特定された量子化
レベルに対するビットレートを決定するプロセスを説明
するフローチャート。

【図３９】2つの記録済みフレーム、およびビットレー
トに対するそれらの対応する量子化レベルを示す図。

【図４０】最終的には光ディスクに格納されるエンコー
ドされたデータの最終フォーマットの概略を示す図。

【図４１】図４０のディスク情報ファイル908を説明す
る図。

【図４２】図４０にブロック図で示されるデータファイ
ルのデータファイル管理情報の内容を示す図。

【図４３】図４０のデータファイルに記憶されるデータ
の詳細を示す図。

【図４４】その中でそのデータがスタッフィングパケッ
トを必要としないデータパックを示す図とパディングの
ためにパケットを必要とするデータパックを示す図。

【図４５】再生情報パックを示す図。

【図４６】図４５のデータ検索情報996の中に含まれる
情報を示す図。

【図４７】図４６の一般情報を示す図。

【図４８】図４６にブロック図で示される同期再生情報
を示す図。

【図４９】ビデオパックを示す図。

【図５０】ピクチャのグループ(GOP)とビデオパックの
列の間の関係を説明する図。

【図５１】MPEGオーディオエンコード仕様に従ってエン
コードされたオーディオパックを示す図と、AC-3または
リニアPCMオーディオエンコードに従って構築されたオ
ーディオパックを示す図。

【図５２】エンコードされたオーディオストリームとオ
ーディオパックの間の関係を示す図。

【図５３】サブピクチャユニットの構造を示す図。

【図５４】サブピクチャパックの構造を示す図。

【図５５】サブピクチャパックに関連したサブピクチャ
装置の構造を説明する図。

【図５６】表示サブピクチャユニットnとサブピクチャ
ユニットn+1の間の変化を示す図。

【符号の説明】

１０、２０、３０、４０…ワークステーション、２１…
ハードディスク、２２…デジタル記憶装置、３１…コン
ソールディスプレイ、５０…ビデオエンコード装置、５
１…再生ＶＴＲ、５２…録画ＶＴＲ、６０…デジタルキ
ャプチャ記憶装置、７０ａ〜７０ｄ…オーディオエンコ
ーダ、７２…オーディオインタフェース装置、７３…オ
ーディオデコーダ。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｎ 5/91 Ｈ０４Ｎ 5/93 Ｚ 5/93 (72)発明者ジェイ・ヨーグシュウォーアメリカ合衆国、ニュージャージー州 08648、ローレンスビル、アンソニー・レーン 34 (72)発明者シャウ − バオ・ンアメリカ合衆国、ニュージャージー州 08512、クランベリー、ペティー・ロード４ (72)発明者伊知川偵一日本国神奈川県横浜市金沢区並木３−２− ７−623 (72)発明者海野裕明日本国千葉県市川市八幡１−20−９ (72)発明者三村英紀日本国神奈川県横浜市金沢区並木２−３− １−403 (72)発明者北村哲也日本国東京都狛江市中和泉１−15−12− 301 (72)発明者クリストファー・ジェイ・クックソンアメリカ合衆国、カリフォルニア州 90046、ロサンゼルス、トーレイソン・ドライブ 7825 (72)発明者グレッグ・ビー・サガードアメリカ合衆国、カリフォルニア州 90277、レドンド・ビーチ、エメラルド・ストリート 601 (72)発明者アンドリュー・ドルージン・ローゼンアメリカ合衆国、カリフォルニア州 91304−3654、キャノガ・パーク、フォールブルック・アベニュー 7815

Claims

【特許請求の範囲】

【請求項１】エンコードされたビデオのビットストリ
ームにビデオを追加する方法であって、前記エンコードされたビデオが修正される始点及び終点
を決定する工程と、前記始点及び終点間に挿入するためのビデオ、及び前記
終点直後のエンコードされたビデオを示すビデオを含む
未エンコードビデオを得る工程と、前記挿入用ビデオの第1グループのピクチャー（GOP）を
前記始点及び終点の外側の参照フレームを用いずにエン
コードし、第2参照フレームを含まない双方向予測フレ
ームに追加ビットを割り当てる工程と、前記第1GOPより
後のGOPを挿入されるビデオの前記終点までエンコード
する工程、及び前記終点直後のエンコードされたビデオ
を示すビデオをエンコードする工程とを実行することに
よって前記未エンコードビデオをエンコードする工程
と、前記エンコードする各工程により作成されるエンコード
されたビデオを前記エンコードされたビットストリーム
内にに配置する工程と、を含む方法。
【請求項２】請求項１記載の方法であって、一方向予
測を有するフレームに用いられたビット数を使用して前
記追加ビット数を決定する工程を更に含むことを特徴と
する方法。
【請求項３】請求項１記載の方法であって、前記終点
直後のエンコードされたビデオを示すビデオをエンコー
ドする工程は、前記未エンコードビデオの最初のエンコ
ード期間中に使用された量子化値に等しい量子化値を用
いて、前記エンコードされたビデオを示すビデオをエン
コードする工程を含むことを特徴とする方法。
【請求項４】請求項１記載の方法であって、前記決定
する工程は、前記エンコードされたビデオのディレクトリ情報を参照
せずに、ビデオフレームに対応するビット数を追加する
ことにより決定する工程を含むことを特徴とする方法。
【請求項５】請求項１記載の方法であって、カメラを使用してビデオを得る工程と、得たビデオをエンコードして、エンコードされたデータ
のビットストリームを発生する工程と、を更に含むこと
を特徴とする方法。
【請求項６】請求項１の処理により作成されたエンコ
ードされたビットストリームのビデオを格納するための
データ構造を含むメモリにおいて、（1）前記メモリに格納されるデータ構造であって、（ａ）情報の1単位であるメニューセルを複数格納した
フィールド、（ｂ）タイトルメニューの開始セル用フィールド、（ｃ）オーディオ選択メニューの開始セル用フィール
ド、（ｄ）前記ビデオとは異なるビットマップされた情報を
提供するのに用いられるサブピクチャー情報を選択する
ための用いられるメニューの開始セル用フィールド、（ｅ）前記メモリ内に複数のプログラムが存在するとき
に、複数のプログラムを選択するために用いる開始セル
用フィールド、及び（ｆ）前記メモリ内に複数のアングル画面が存在すると
き、カメラアングルを選択するために用いるアングルメ
ニュー用開始セルのフィールドを含むデータ構造と、（2）表示される各メニューに対するテーブルエントリ
を含むメニューセル情報テーブルであって、前記前記テ
ーブルエントリは各々、（ａ）前記テーブルエントリに対応するメニューがタイ
トルメニューか、プログラムメニューか、オーディオメ
ニューか、サブピクチャーメニューか、またはアングル
メニューかを示すフィールド、（ｂ）選択項目の数を示すフィールド、（ｃ）対応するメニューセルの開始部のシステムクロッ
ク参照部を少なくとも示すフィールド、（ｄ）対応するメニューセルの開始アドレスを示すフィ
ールド、及び（ｅ）対応するメニューセルの複数ブロックを示すフィ
ールドを含むメニューセル情報テーブルと、（3）各メニューについて表示される情報を格納するた
めのデータ構造と、（4）オーディオを格納するためのデータ構造、及び (5)請求項１の処理によって作成されたエンコードされ
たビットストリームのビデオを格納するためのデータ構
造、を具備することを特徴とするメモリ。
【請求項７】請求項６記載のメモリであって、前記メ
モリは光ディスクであることを特徴とするメモリ。
【請求項８】請求項１の処理によって作成されたエン
コードされたビットストリームのビデオを格納するため
のデータ構造を含むメモリであって、（1）ファイル管理情報を格納するためのデータ構造で
あり、該データ構造は、（ａ）前記メモリ内情報
のアドレス及びサイズ情報を格納するためのファイル管
理テーブルと、（ｂ）情報の1単位である各セルが再生される順番を示
す情報を格納するシーケンス情報テーブルであって、該
シーケンス情報テーブルは各シーケンスに対するテーブ
ルエントリを含み、各テーブルエントリは、（ｂ1）再生された後に終結する完了形式シーケンス
か、順番に再生される複数シーケンスの一部である接続
形式シーケンスの先頭か、接続形式シーケンスの中心部
か、及び接続形式シーケンスの終了部かを格納するフィ
ールドと、（ｂ2）前記対応するシーケンス内の複数セルを格納す
るフィールドと、（ｂ3）前記対応するシーケンスの再生時間を格納する
フィールドと、（ｂ4）前記対応するシーケンスの後に再生されるシー
ケンスを格納するフィールドとを含むシーケンス情報テ
ーブルと、（ｃ）セルを示す情報を格納するセル情報テーブルであ
って、各セルについてのテーブルエントリを含み、各テ
ーブルエントリは、（ｃ1）対応するセルの再生時間を示すフィールドと、（ｃ2）前記対応するセルのシステムクロック参照の少
なくとも一部を示すフィールドと、（ｃ3）前記対応するセルのアドレスを示すフィール
ド、及び（ｃ4）前記対応するセルの複数の論理ブロックを示す
フィールドとを含むセル情報テーブルと、（2）オーディオを格納するためのデータ構造、及び（3）請求項１の処理により発生されたエンコードされ
たビットストリームのビデオを格納するためのデータ構
造。
【請求項９】前記メモリは光ディスクであることを特
徴とする請求項８記載のメモリ。
【請求項１０】請求項１の処理によって作成されたエ
ンコードされたビットストリームのビデオを格納するた
めのデータ構造を含むメモリであって、該データ構造は
オーディオ及びタイミング情報を含む記述的情報を格納
するための構造を含み、（1）記述的情報を含むデータ構造であって、（ａ）前記記述的情報データ格納のシステムクロック参
照を格納するためのフィールドと、（ｂ）他のピクチャーを参照せずにデコードされる対応
するビデオピクチャーの開始時間を格納するためのフィ
ールドと、（ｃ）前記対応するビデオピクチャーの再生開始時間直
前の再生開始時間を有するオーディオ情報のタイムスタ
ンプを格納するためのフィールドと、（ｄ）第1ビットは前記オーディオ信号が前記記述的情
報データ構造の前に位置するか又は後に位置するかを示
し、前記オーディオ情報のアドレスを格納するためのフ
ィールドと、（ｅ）前記記述的情報データ構造の前及び後に発生する
他の記述的情報データ構造のアドレスを示すフィールド
とを含むデータ構造と、 (2)オーディオを格納するためのデータ構造、及び (3)前記請求項１の処理によって作成されたエンコード
されたビットストリームのビデオを格納するデータ構造
と、を具備することを特徴とするメモリ。
【請求項１１】請求項１０記載のメモリであって、前
記メモリは光ディスクであることを特徴とするメモリ。
【請求項１２】請求項１の処理によって作成されたエ
ンコードされたビットストリームのビデオを格納するた
めのデータ構造を含むメモリであって、該データ構造は
オーディオ及びサブピクチャー情報を格納するための構
造を含み、（1）サブピクチャーユニットを格納するために前記メ
モリ内に格納されるデータ構造であって、（ａ）サブピクチャーユニットヘッダーを格納するため
のフィールドと、（ｂ）マップされた画像を格納するためのフィールド、
及び（ｃ）複数のテーブルエントリを含む表示制御テーブル
を格納するためのフィールドであって、（ｃ1）前記ビットマップされた画像の表示開始時間を
格納するサブフィールドと、（ｃ2）次のテーブルエントリのアドレスを格納するサ
ブフィールド、及び（ｃ3）表示エリア、画素色、画素コントラスト、及び
ビデオフレームが表示されたときに生じる画素の色とコ
ントラスト変更とを含むコマンドグループから選択され
る少なくとも1つの表示制御コマンドを格納するサブフ
ィールドとを含むデータ構造と、（2）オーディオを格納するためのデータ構造、及び（3）請求項１の処理により作成されたエンコードさて
たビットストリームのビデオを格納するためのデータ構
造と、を具備することを特徴とするメモリ。
【請求項１３】請求項１２記載のメモリであって、前
記サブピクチャーユニットデータ構造は、前記サブピクチャーユニットデータ構造内の情報を含む
複数のパックを具備することを特徴とするメモリ。
【請求項１４】請求項１２記載のメモリであって、前
記メモリは光ディスクであることを特徴とするメモリ。
【請求項１５】エンコードされたビデオのビットスト
リームにビデオを追加するシステムであって、（1）前記エンコードされたビデオが修正される始点と
終点を決定する手段と、（2）前記始点と終点の間に挿入するためのビデオを含
む未エンコードビデオ及び前記終点直後のエンコードさ
れたビデオを示すビデオを得る手段と、（3）前記未エンコードビデオをエンコードする手段
であって、このエンコード手段は、（ａ）前記始点と終点の外側の参照フレームを用いるこ
となく、挿入用ビデオの第1グループのピクチャー（GO
P）をエンコードし、第2参照フレームを含まない双方向
に予測されたフレームに追加ビットを割り付ける手段
と、（ｂ）前記第1GOP後の複数のGOPを、挿入されるビデオ
の終点までエンコードする手段、及び（ｃ）前記終点直後のエンコードされたビデオを示すビ
デオをエンコードする手段とを含み、（4）前記エンコードする各工程により作成されたエン
コードされたビデオを前記エンコードされたビットスト
リーム内に配置する手段、を具備することを特徴とする
システム。
【請求項１６】請求項１５記載のシステムであって、
一方向予測を有するフレームに用いたビット数を用いて
前記追加ビット数を決定する手段を更に具備することを
特徴とするシステム。
【請求項１７】請求項１５記載のシステムであって、
前記終点直後のエンコードされたビデオを示すビデオを
エンコードする手段は、前記未エンコードビデオの最初のエンコード時に用いら
れる量子化値に等しい量子化値を用いて、前記エンコー
ドされたビデオを示すビデオをエンコードする手段を具
備することを特徴とするシステム。
【請求項１８】請求項１５記載のシステムであって、
前記決定手段は、前記エンコードされたビデオのディレクトリ情報を参照
することなく、ビデオフレームに対応するビット数を追
加することにより前記始点と終点を決定する手段を含む
ことを特徴とするシステム。
【請求項１９】請求項１５記載のシステムであって、ビデオを得るためのカメラと、得られたビデオをエンコードしてエンコードされたデー
タのビットストリームを作成する手段を更に具備するこ
とを特徴とするシステム。