JP4875285B2 - 編集装置および方法 - Google Patents
編集装置および方法 Download PDFInfo
- Publication number
- JP4875285B2 JP4875285B2 JP2003107787A JP2003107787A JP4875285B2 JP 4875285 B2 JP4875285 B2 JP 4875285B2 JP 2003107787 A JP2003107787 A JP 2003107787A JP 2003107787 A JP2003107787 A JP 2003107787A JP 4875285 B2 JP4875285 B2 JP 4875285B2
- Authority
- JP
- Japan
- Prior art keywords
- buffer
- bit stream
- bitstream
- decoding
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【発明の属する技術分野】
本発明は編集装置および方法に関し、特に、離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換と動き補償によって圧縮された画像情報(ビットストリーム)を、衛星放送、ケーブルテレビジョン放送、インターネットなどのネットワークメディアを介して送受信する際に、若しくは光ディスク、磁気ディスク、フラッシュメモリのような記憶メディア上で処理する際に用いて好適な編集装置および方法に関する。
【0002】
【従来の技術】
近年、画像情報をデジタルとして取り扱い、その際、効率の良い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEG(Moving Picture Expert Group)などの方式に準拠した装置が、放送局などの情報配信、および一般家庭における情報受信の双方において普及しつつある。
【0003】
特に、MPEG2(ISO/IEC 13818-2)は、汎用画像圧縮方式として定義された規格であり、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、例えばDVD(Digital Versatile Disk)規格に代表されるように、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに広く用いられている。
【0004】
このMPEG2圧縮方式を用いることにより、例えば、720×480画素を持つ標準解像度の飛び越し走査画像に対しては4乃至8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像に対しては18乃至22Mbpsの符号量(ビットレート)を割り当てることで、高い圧縮率と良好な画質の実現が可能である。
【0005】
MPEG2は主として放送用に適合する高画質符号化を対象としていたが、より高い圧縮率の符号化方式には対応していなかったので、MPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。
【0006】
さらに、近年、テレビ会議用の画像符号化を当初の目的として、国際電気連合の電気通信標準化部門であるITU-T (International Telecommunication Union − Telecommunication Standardization Sector)によるH.26L(ITU-T Q6/16 VCEG)という標準の規格化が進んでいる。H.26Lは、MPEG2やMPEG4といった符号化方式に比べ、その符号化、復号に、より多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。
【0007】
また、現在、MPEG4の活動の一環として、このH.26Lに基づいた、より高い符号化効率を実現する符号化技術の標準化がITU-Tと共同でJVT(Joint Video Team)として行われている。
【0008】
ここで、離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換と動き補償とによる画像圧縮について説明する。図1は、従来の画像情報符号化装置の一例の構成を示す図である。
【0009】
図1に示した画像情報符号化装置10において、入力端子11より入力されたアナログ信号からなる画像情報は、A/D変換部12により、デジタル信号に変換される。そして、画面並べ替えバッファ13は、A/D変換部12より供給された画像情報のGOP(Group of Pictures)構造に応じて、フレームの並べ替えを行う。
【0010】
ここで、画面並べ替えバッファ13は、イントラ(画像内)符号化が行われる画像に対しては、フレーム全体の画像情報を直交変換部15に供給する。直交変換部15は、画像情報に対して離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換を施し、変換係数を量子化部16に供給する。量子化部16は、直交変換部15から供給された変換係数に対して量子化処理を施す。
【0011】
可逆符号化部17は、量子化部16から供給された量子化された変換係数や量子化スケール等から符号化モードを決定し、この符号化モードに対して可変長符号化、又は算術符号化等の可逆符号化を施し、画像符号化単位のヘッダ部に挿入される情報を形成する。そして、可逆符号化部17は、符号化された符号化モードを蓄積バッファ18に供給して蓄積させる。この符号化された符号化モードは、画像圧縮情報として出力端子19より出力される。
【0012】
また、可逆符号化部17は、量子化された変換係数に対して可変長符号化、若しくは算術符号化等の可逆符号化を施し、符号化された変換係数を蓄積バッファ18に供給して蓄積させる。この符号化された変換係数は、画像圧縮情報として出力端子19より出力される。
【0013】
量子化部16の挙動は、蓄積バッファ18に蓄積された変換係数のデータ量に基づいて、レート制御部20によって制御される。また、量子化部20は、量子化後の変換係数を逆量子化部21に供給し、逆量子化部21は、その量子化後の変換係数を逆量子化する。逆直交変換部22は、逆量子化された変換係数に対して逆直交変換処理を施して復号画像情報を生成し、その情報をフレームメモリ23に供給して蓄積させる。
【0014】
また、画面並べ替えバッファ13は、インター(画像間)符号化が行われる画像に関しては、画像情報を動き予測・補償部24に供給する。動き予測・補償部24は、同時に参照される画像情報をフレームメモリ23より取り出し、動き予測・補償処理を施して参照画像情報を生成する。動き予測・補償部24は、生成した参照画像情報を加算器14に供給し、加算器14は、参照画像情報を対応する画像情報との差分信号に変換する。また、動き予測・補償部24は、同時に動きベクトル情報を可逆符号化部17に供給する。
【0015】
可逆符号化部17は、量子化部16から供給され量子化された変換係数および量子化スケール、並びに動き予測・補償部24から供給された動きベクトル情報等から符号化モードを決定し、その決定した符号化モードに対して可変長符号化または算術符号化等の可逆符号化を施し、画像符号化単位のヘッダ部に挿入される情報を生成する。そして、可逆符号化部17は、符号化された符号化モードを蓄積バッファ18に供給して蓄積させる。この符号化された符号化モードは、画像圧縮情報として出力される。
【0016】
また、可逆符号化部17は、その動きベクトル情報に対して可変長符号化若しくは算術符号化等の可逆符号化処理を施し、画像符号化単位のヘッダ部に挿入される情報を生成する。
【0017】
また、イントラ符号化と異なり、インター符号化の場合、直交変換部15に入力される画像情報は、加算器14より得られた差分信号である。なお、その他の処理については、イントラ符号化を施される画像圧縮情報と同様であるため、その説明を省略する。
【0018】
次に、上述した画像情報符号化装置10に対応する画像情報復号装置の一例の構成を図2に示す。図2に示した画像情報復号装置40において、入力端子41より入力された画像圧縮情報は、蓄積バッファ42において一時的に格納された後、可逆復号部43に転送される。
【0019】
可逆復号部43は、定められた画像圧縮情報のフォーマットに基づき、画像圧縮情報に対して可変長復号若しくは算術復号等の処理を施し、ヘッダ部に格納された符号化モード情報を取得し逆量子化部44等に供給する。また同様に、可逆復号部43は、量子化された変換係数を取得し逆量子化部44に供給する。さらに、可逆復号部43は、復号するフレームがインター符号化されたものである場合には、画像圧縮情報のヘッダ部に格納された動きベクトル情報についても復号し、その情報を動き予測・補償部51に供給する。
【0020】
逆量子化部44は、可逆復号部43から供給された量子化後の変換係数を逆量子化し、変換係数を逆直交変換部45に供給する。逆直交変換部45は、定められた画像圧縮情報のフォーマットに基づき、変換係数に対して逆離散コサイン変換若しくは逆カルーネン・レーベ変換等の逆直交変換を施す。
【0021】
ここで、対象となるフレームがイントラ符号化されたものである場合、逆直交変換処理が施された画像情報は、画面並べ替えバッファ47に格納され、D/A変換部48におけるD/A変換処理の後に出力端子49から出力される。
【0022】
また、対象となるフレームがインター符号化されたものである場合、動き予測・補償部51は、可逆復号処理が施された動きベクトル情報とフレームメモリ50に格納された画像情報とに基づいて参照画像を生成し、加算器46に供給する。加算器46は、この参照画像と逆直交変換部45からの出力とを合成する。なお、その他の処理については、イントラ符号化されたフレームと同様であるため、説明を省略する。
【0023】
ところで、先に述べたJoint Video Teamで標準化が行われている符号化方式(以下JVT Codec)では、MPEG2やMPEG4などの符号化効率を改善するため、様々な方式が検討されている。例えば、離散コサイン変換の変換方法は、4×4ブロックサイズの整数係数変換が用いられている。そして、動き補償の際のブロックサイズが可変であり、より最適な動き補償が行えるようになっている。しかしながら、基本的な方式は、図1に示した画像情報符号化装置10において行われる符号化方式と同様に行うことが可能であるようにされている。
【0024】
従って、図2に示した画像情報復号装置40において行われる復号方式と、基本的に同じ方式により復号することが可能であるようにされている。
【0025】
ところで異なる復号装置(デコーダ)間での互換性を維持し、バッファをオーバーフローまたはアンダーフローさせないために、MPEGやITU−Tでは、バッファモデルが導入されている。仮想デコーダバッファモデルを標準で定義し、符号化装置(エンコーダ)は、この仮想デコーダバッファを破綻しないように符号化することによりデコーダ側でのバッファオーバーフローまたはアンダーフローを防ぎ、互換性を維持することが可能とされている。
【0026】
MPEGにおける仮想バッファモデルについて、図3を参照して説明する。以下の説明において、デコーダバッファへの入力ビットレートをR、デコーダバッファのサイズをB、デコーダが最初のフレームをバッファから引き抜く時のバッファ占有量をF、その際の遅延時間をDとする。また、時刻t0,t1,t2,・・・における各フレームのビット量をb0,b1,b2・・・とする。
【0027】
ここでフレームレートをMとすると、
ti+1−ti=1/Mが成り立つ。
【0028】
Biを、時刻tiにおけるフレームのビット量biを引き抜く直前のバッファ占有量とすると以下の式(1)が成り立つ。
B0=F
Bi+1=min(B,Bi―bi+R(ti+1−ti)) ・・・(1)
【0029】
ここで、MPEG2における固定ビットレート符号化方式の場合、エンコーダは次式(2)の条件を満たすよう符号化しなければならない。
Bi≦B
Bi−bi≧0 ・・・(2)
このような条件が満たされている間は、エンコーダは、バッファオーバーフローやアンダーフローを発生させてしまうような符号化を行うようなことがないとされている。
【0030】
また、MPEG2における可変ビットレート符号化方式の場合、入力ビットレートRは、プロファイル、レベルで定義される最大ビットレートであり、F=Bである。従って式(1)は、次式(3)のように書き換えられる。
B0=B
Bi+1=min(B,Bi―bi+Rmax(ti+1−ti)) ・・・(3)
【0031】
この時、エンコーダは、次式(4)に表される条件を満たすように符号化を実行しなければならない。
Bi―bi≧0 ・・・(4)
この条件が満たされるとき、エンコーダは、デコーダ側でバッファアンダーフローが起こらないような符号化を行うことになる。デコーダバッファが一杯になった時は、エンコーダバッファは空であり、符号化ビットストリームが発生していないことを意味する。従って、エンコーダは、デコーダのバッファオーバーフローを起こさないように監視する必要は無い。
【0032】
MPEGでは、各プロファイル、レベルで定義されるバッファサイズ、ビットレートに基づいて上述したようなバッファの制約を守るように符号化が行なわれる。各プロファイル、レベルに準拠したデコーダは、そのビットストリームを破綻することなく復号することができる。
【0033】
【発明が解決しようとする課題】
しかしながら、実際にはプロファイル、レベルに規定されたバッファサイズ、ビットレートを用いない場合でも、ビットストリームを復号することが出来る場合がある。
【0034】
例えば、ビットレートR、バッファB、初期遅延時間F(R,B,F)で符号化されたビットストリームは、より大きなバッファサイズB'(B'>B)を持つデコーダによっても復号可能である。また、より高いビットレートR'(R'>R)で復号することも可能である。
【0035】
例えば、デコーダの復号ビットレートが、符号化ビットレートより低い場合においても、十分大きなバッファサイズをもったデコーダであれば復号することが可能である。
【0036】
このように、所定のビットストリームが与えられた場合、各ビットレートにおいて、そのビットストリームを復号するために必要な最小バッファサイズBminが存在する。このような関係を図4に示す。
【0037】
JVT Codecでは、各プロファイル、レベルで固定のビットレート、バッファサイズで復号するだけでなく、図4に示したような条件を有するデコーダで復号できるように標準化が進められている。必ずしもエンコーダの符号化ビットレート、バッファサイズとデコーダの復号ビットレート、バッファサイズが同一でなくとも復号できることを目的としている。この目的が達成されることにより、例えば、復号ビットレートが高いデコーダでは、バッファサイズを削減することなどが可能になる。
【0038】
しかしながら、このような情報は、ビットストリーム中で時間的に変動する。そのため、デコーダ互換のための制約が緩められている分、所定の条件下では復号可能であっても、別の条件下では復号不可能になる場合があるといった問題があった。例えば、このような(R,B)の特性が時間的に変動する場合、所定の時刻で復号可能であっても、別の時刻では復号不可能である可能性があるといった問題があった。
【0039】
ランダムアクセスなどで、別なシーンや、別なチャンネルなどに移行した場合も、必ずしも復号可能であるとは限らなくなるといった問題があった。また、スプライシング(Splicing)などビットストリームレベルでの編集を行った際、デコード可能性を保証できなくなるといった問題があった。
【0040】
本発明はこのような状況に鑑みてなされたものであり、ビットストリームの復号可能性を効率よく判断し、またスプライシングなどビットストリームの編集を簡便に行えるようにすることを目的とする。
【0053】
【課題を解決するための手段】
本発明の編集装置は、入力されたビットストリーム中のランダムにアクセスが可能な所定区間毎に挿入されているヘッダに含まれる、ビットストリームを復号する際にビットストリームを格納するバッファのバッファサイズとバッファへの入力ビットレートとの組み合わせに従ってビットストリームが復号可能であるか否かを判定する際の判定基準として用いるバッファ特性情報を読み出し、その読み出した情報に基づいて、ビットストリームを編集点で接続したビットストリームがデコーダのバッファを破綻させずに復号可能であるか否かを判断する判断手段と、判断手段により復号可能であると判断された場合、ビットストリームを編集点で接続する編集を行う編集手段とを含み、判断手段は、第1のビットストリームのヘッダに含まれるバッファ特性情報に示されるバッファサイズと入力ビットレートを変数とする第1の特性曲線が、第2のビットストリームのヘッダに含まれるバッファ特性情報に示されるバッファサイズと入力ビットレートを変数とする第2の特性曲線の常に上に位置するか、または、同一である場合、第1のビットストリームと第2のビットストリームと編集点で接続したビットストリームがデコーダのバッファを破綻させずに復号可能であると判断する。
【0054】
本発明の編集方法は、入力されたビットストリーム中のランダムにアクセスが可能な所定区間毎に挿入されているヘッダに含まれる、ビットストリームを復号する際にビットストリームを格納するバッファのバッファサイズとバッファへの入力ビットレートとの組み合わせに従ってビットストリームが復号可能であるか否かを判定する際の判定基準として用いるバッファ特性情報を読み出し、その読み出した情報に基づいて、ビットストリームを編集点で接続したビットストリームがデコーダのバッファを破綻させずに復号可能であるか否かを判断する判断ステップと、判断ステップの処理で復号可能であると判断された場合、ビットストリームを編集点で接続する編集を行う編集ステップとを含み、判断ステップの処理は、第1のビットストリームのヘッダに含まれるバッファ特性情報に示されるバッファサイズと入力ビットレートを変数とする第1の特性曲線が、第2のビットストリームのヘッダに含まれるバッファ特性情報に示されるバッファサイズと入力ビットレートを変数とする第2の特性曲線の常に上に位置するか、または、同一である場合、第1のビットストリームと第2のビットストリームと編集点で接続したビットストリームがデコーダのバッファを破綻させずに復号可能であると判断する。
【0059】
本発明の編集装置および方法においては、入力されたビットストリーム中のランダムにアクセスが可能な所定区間毎に挿入されているヘッダに含まれる、ビットストリームを復号する際にビットストリームを格納するバッファのバッファサイズとバッファへの入力ビットレートとの組み合わせに従ってビットストリームが復号可能であるか否かを判定する際の判定基準として用いるバッファ特性情報が読み出され、その読み出された情報に基づいて、ビットストリームのヘッダに含まれるバッファ特性情報に示されるバッファサイズと入力ビットレートを変数とする第1の特性曲線が、第2のビットストリームのヘッダに含まれるバッファ特性情報に示されるバッファサイズと入力ビットレートを変数とする第2の特性曲線の常に上に位置するか、または、同一である場合、第1のビットストリームと第2のビットストリームと編集点で接続したビットストリームがデコーダのバッファを破綻させずに復号可能であると判断された場合、ビットストリームを編集点で接続する編集が行われる。
【0060】
【発明の実施の形態】
以下に、本発明の実施の形態について図面を参照して説明する。図5は、本発明を適用した符号化装置の一実施の形態の構成を示す図である。図5に示した符号化装置70は、図1に示した画像情報符号化装置10を含む構成とされている。ここでは、画像情報符号化装置10の構成などについては、既に説明したので、その説明は適宜省略する。
【0061】
画像情報符号化装置10に入力された画像情報は、符号化され、画像圧縮情報(BS:ビットストリーム)としてバッファ71とビットストリーム解析部72に出力される。バッファ71は、入力されたビットストリームを一旦記憶し、必要に応じ、バッファ情報付加部73に出力する。ビットストリーム解析部72は、ビットストリーム中の所定の区間、例えば、GOPやランダムアクセスポイント間でのバッファの占有状態を調べ、その情報をバッファ情報BHとしてバッファ情報付加部73に供給する。ここで、ランダムアクセスポイントとは、JVT規格において、ビットストリーム中でランダムにアクセスが可能な所定の区間のことを言う。また、同様にGOPとは、MPEG2/MPEG4規格において、ランダムにアクセスが可能な所定の区間のことを言う。
【0062】
バッファ情報付加部73は、入力されたバッファ情報BHを、同じく入力されたビットストリームに付加して出力する。
【0063】
ここでは、ビットストリーム解析部72が行う解析の一例として、各ランダムアクセスポイント間でバッファ占有状態を調べ、各ランダムアクセスポイントにヘッダ情報としてバッファ占有状態の情報を符号化してビットストリームを構成する場合を例にあげて説明する。ここでは、このような説明を行うが、GOP単位で求めるようにしても良いし、他の任意の単位で求めるようにしても良く、以下に説明する単位に、他の単位を用いた場合においても、本発明を適用できることは言うまでもない。
【0064】
図6を参照して(Rmin、Bmin)の特性を決定する方法について説明する。ここで、Rminは、バッファへの入力ビットレートRの最小値を示し、Bminは、バッファサイズBの最小値を示すとする。
【0065】
所定のビットストリームのビットレートRが与えられた場合、そのビットストリームを復号ビットレートRで復号する復号装置(例えば、図7に示す構成を有する)で復号可能である最低限のバッファサイズBminは、例えば、以下のようにして決定される。
【0066】
所定のアクセスポイント間のフレーム数をNとする。各フレームの発生ビット量をb(i)(i=1,N)、バッファから各フレームのデータを引き抜く直前のバッファ占有量をB(i)、引き抜いた直後のバッファ占有量をB2(i)とする。符号化装置のバッファ量をBとすれば、
B2(i)=B(i)―b(i)
B(i+1)=B2(i)+R/(Frame Rate) ・・・(5)
ただし、if(B(i+1)>B)B(i+1)=Bとし、B(i)の最大値はBである。また遅延量FはF=Bとする。
【0067】
このとき、Bminは、次式(6)で求められる。
Bmin=B―min(B2(i)) ・・・(6)
このときのRをRminとすれば、上記のような方法により(Rmin、Bmin)を決定することができる。
【0068】
次に、(Rmin、Bmin、Fmin)を決定する方法の一例を説明する。B=Bmin、R=Rminとする。式(5)と同様に、次式(7)が成り立つ。
B2(i)=B(i)−b(i)
B(i+1)=B2(i)+R/(Frame Rate) ・・・(7)
となる。ただし、以下の条件に基づくアンダーフローに対する監視が行われる。
if(B2(i)<0){
Fmin=Fmin+(0―B2(i));
B2(i)=0;}
【0069】
Fminは、各ランダムアクセスポイントの先頭で0に初期化される。また、オーバーフローに対する監視も同様に、以下の条件に基づき行われる。
if(B(i+1)>B)B(i+1)=B
ランダムアクセスポイント間の全てのフレームに対して上記した検査が行われることにより、(Rmin、Bmin、Fmin)が決定される。
【0070】
上記した(Rmin、Bmin、Fmin)は、予め定められた所定の個数だけ検査を行うようにしても良いし、その中で独立な組み合わせのみを定義するようにしても良い。上記のようにして求められた特性は、図4に示すようになる。各点の間は線形補間される。上記のようにして求められた、(Rmin、Bmin、Fmin)の値、バッファ情報BHは、バッファ情報付加部73によりビットストリーム中の所定の位置に挿入され、符号化され出力される。
【0071】
ビットストリーム解析部72は、上述したような、各ランダムアクセス間の(Rmin、Bmin、Fmin)と同時にビットストリーム全体に対して同様の解析を行い、ビットストリーム全体に対する特性、(Rmin、Bmin、Fmin)globalを決定し、この値を、バッファ情報付加部73に、バッファ情報BHとして供給する。
【0072】
画像情報符号化装置10から出力されたビットストリームBSは、バッファ71において所定の時間だけ遅延された後、バッファ情報付加部73に入力される。バッファ情報付加部73は、ビットストリーム中の所定の位置にビットストリーム解析部72より供給されるバッファ情報BHを挿入し、最終的な出力ビットストリームBSを出力する。
【0073】
ここで、バッファ情報BH(若しくはバッファ特性情報)は、例えば、(Rmin、Bmin、Fmin)や(Rmin、Bmin、Fmin)globalである。バッファ情報付加部73は、ビットストリームBS中の所定の位置に、上記情報を挿入する。ここでシンタクスの一例を以下に示し説明する。
【0074】
【0075】
ランダムアクセスポイント間の(Rmin、Bmin、Fmin)は、例えば、その直前のランダムアクセスポイントヘッダに、上記したシンタクスのように記録される。RAP_startcodeは、RAPヘッダが存在し、そのヘッダの開始を示すコードである。
【0076】
closed_GOPは、そのGOP内の全てのピクチャが他のGOPのピクチャを参照することがなく独立であるか、または、他のGOPのピクチャを参照するという依存関係があるかどうかを示すフラグである。broken_linkは、編集などにより、そのGOPの前後でビットストリームの置き換えが行われた場合、予測の参照画像が存在するか否かを示すフラグである。
【0077】
NumBuffer_Paramは、求めた特性セット(Rmin、Bmin、Fmin)の数を示す。
Rate[i]、Buffer[i]、F[i]は、それぞれをRmin、Bmin、Fmin示す。ここでは、例えば、Rminは、小さいものから順に記録される。
【0078】
ビットストリーム全体の(Rmin、Bmin、Fmin)globalは、例えば、そのビットストリームの先頭のシーケンスヘッダに、以下のシンタクスのようにして記録される。
【0079】
【0080】
ここで、NumBuffer_Paramは、求めた特性セット(Rmin、Bmin、Fmin)globalの数を示す。Rate[i]、Buffer[i]、F[i]は、それぞれをRmin、Bmin、Fminを示す。ここでは、例えば、Rminは、小さいものから順に記録される。
【0081】
バッファ情報付加部73において、上記のバッファ情報BHが付加された後、最終的な出力ビットストリームBSが出力される。
【0082】
なお、発明の実施の形態ではバッファ情報BHとして、最小ビットレートRmin、最小バッファサイズBminおよび最小遅延量Fminの全てをビットストリームに付加するように説明した。しかし、この例に限らず、最小ビットレートRmin、最小バッファサイズBmin若しくは最小遅延量Fminのうち、少なくとも一つをビットストリームに加えるようにしてもよい。例えば、最小ビットレートRminおよび最小バッファサイズBminの組み合わせをビットストリームに付加するようにしてもよい。
【0083】
図7に本発明を適用した復号装置の一実施の形態の構成を示す。図7に示した復号装置90は、図5に示した符号化装置70に対応するものであり、内部に、図2に示した画像情報復号装置40を含んでいる。復号装置90に入力されたビットストリームBSは、ビットストリーム解析部91と復号可能性判定部92に供給される。
【0084】
ビットストリーム解析部91は、ビットストリーム中のバッファ情報BHを復号し、復号可能性判定部92に出力する。ビットストリーム解析部91は、ビットストリームをパースし、シーケンスヘッダに記録されている、(Rmin、Bmin、Fmin)globalを復号する。また、各ランダムアクセスポイントヘッダに記録されている、(Rmin、Bmin、Fmin)を復号する。これら情報が復号可能性判定部92に出力される。
【0085】
復号可能性判定部92は、バッファ情報BHおよび画像情報復号装置40より供給されるデコーダ情報DIに基づいて、入力されたビットストリームがバッファを破綻させること無く復号可能であるかどうかを判定する。デコーダ情報DIは、例えば、デコーダバッファサイズおよび復号ビットレートなどである。
【0086】
復号可能性判定部92は、(Rmin、Bmin、Fmin)globalから、図4に示したような特性曲線を作成する。各点の間は線形補間する。この時、デコーダ(復号装置90)のバッファおよび復号ビットレートが(Rmin、Bmin、Fmin)globalにより作られる特性曲線より上に位置する場合、入力されたビットストリームは、復号可能であると判断することが可能である。従ってこのようなとき、復号可能性判定部92は、復号可能であると判定し、ビットストリームを画像情報復号装置40に供給する。
【0087】
画像情報復号装置40は、図2に示した画像情報復号装置40と基本的に同様な構成により、同様な処理を実行し、入力されたビットストリームを復号し、画像情報を図示されていないテレビジョン受像機などに出力する。
【0088】
ビットストリーム全体を復号可能であるかどうかは上記のように、(Rmin、Bmin、Fmin)globalの特性曲線、デコーダバッファサイズ、復号ビットレートを調べることによって判定することが可能である。
【0089】
また、ランダムアクセスなどにより、所定のランダムアクセスポイントから特定の区間のみを復号したい場合、同様にして、復号可能性判定部92は、(Rmin、Bmin、Fmin)から図4に示すような特性曲線を作成する。各点の間は線形補間する。この時、デコーダのバッファおよび復号ビットレートが(Rmin、Bmin、Fmin)により作られる特性曲線より上に位置する場合、ビットストリームは復号可能である。従ってこのようなとき、復号可能性判定部92は、復号可能であると判定し、ビットストリームを画像情報復号装置40に供給する。
【0090】
次にビットストリームの編集を行う際の説明を行う。図8は、本発明を適用したビットストリームの編集を行う編集装置110の一実施の形態の構成を示す図である。編集装置110が行う編集の例として、入力ビットストリーム1の一部を、別の入力ビットストリーム2に置き換えるスプライスを行う場合を例に挙げて説明する。
【0091】
ここで、スプライスについて簡単に説明するに、スプライスとは、所定のビットストリームをランダムアクセスポイントにおいて別のビットストリームに置き換えて編集を行うことである。このようなスプライスは、例えば、テレビジョン放送の番組に、コマーシャルの放送を挿入する際などである。この場合、入力ビットストリーム1がテレビジョン放送の番組のビットストリームであり、入力ビットストリーム2がコマーシャルのビットストリームである。
【0092】
入力ビットストリーム1は、ビットストリーム解析部111−1に入力され、入力ビットストリーム2は、ビットストリーム解析部111−2に入力される。ビットストリーム解析部111−1,111−2は、それぞれ入力されたビットストリーム1,2中に含まれているバッファ情報BH1,2を復号し、ビットストリーム編集部112に出力する。
【0093】
ビットストリーム編集部112は、バッファ情報BH1,2に基づき、所定の編集ポイントで、入力ビットストリーム1に対して入力ビットストリーム2を挿入可能であるか否かを判定する。この時、編集後のビットストリームが、デコーダ(復号装置90)のバッファを破綻させずに復号可能であるためには、ランダムアクセスポイントとその直前のバッファ占有量の値が同一であるという条件が必要である。
【0094】
MPEG2,4方式を用いるデコーダは、特定のビットレート、バッファサイズで動作することが想定されていたが、JVT方式を用いるデコーダにおいては、図4に示すように、その他のビットレート、バッファサイズであっても、(Rmin、Bmin、Fmin)の特性曲線より上にある場合、復号することが可能であるようにバッファに対する制約が緩和されている。
【0095】
ビットストリームの編集により、その編集前後でデコード可能性が変化しないようにするためには、編集区間の(Rmin、Bmin、Fmin)が同一であれば良い。従って、ビットストリーム編集部112は、編集区間に位置するランダムアクセスポイントヘッダにおける(Rmin、Bmin、Fmin)特性を、入力ビットストリーム1,2に対して作成し、これらの値が一致する場合、その区間をビットストリーム2に置換する。一致しない場合、ビットストリーム1または2に対してパディングビットを挿入して、(Rmin、Bmin、Fmin)が一致するようにした後、入力ビットストリーム2に置換する。
【0096】
JVTにおいては、バッファに対する規制が緩和されているが、このことを利用すれば、スプライスにおけるバッファの適合条件を緩和することが可能になる。JVTにおいては、デコーダのバッファサイズおよび復号ビットレートが(Rmin、Bmin、Fmin)の上に位置する場合、復号可能であることがわかる。従って、元の入力ビットストリーム1の所定の編集区間の(Rmin、Bmin、Fmin)に対して、挿入する入力ビットストリーム2の所定編集区間の(Rmin、Bmin、Fmin)が常に下にある場合、入力ビットストリーム1を復号可能なデコーダは、その区間をビットストリーム2に置換しても復号可能であることになる。
【0097】
図9にその関係を図示する。曲線1は、入力ビットストリーム1の編集区間での(Rmin、Bmin、Fmin)特性を示す。曲線2は入力ビットストリーム2の編集区間での(Rmin、Bmin、Fmin)特性を示す。デコーダのバッファ、復号ビットレートが、この曲線の上に来る場合、復号可能であることから、図9に示すように曲線2が常に曲線1の下に来るとき、復号可能であることが保証される。
【0098】
従って、ビットストリーム編集部112は、編集区間に位置するランダムアクセスポイントヘッダにおける(Rmin、Bmin、Fmin)特性を、ビットストリーム1,2に対して作成し、ビットストリーム2の特性曲線が、ビットストリーム1の特性曲線の下に来る場合、その区間をビットストリーム2に置換する。
【0099】
逆に、一致しないような場合、ビットストリーム1または2に対してパディングビットを挿入して、ビットストリーム2の(Rmin、Bmin、Fmin)特性曲線が、ビットストリーム1の特性曲線の下に位置するように変更した後、入力ビットストリーム2に置換する。
【0100】
このような条件を満たすようにスプライスを行った場合、ビットストリーム1を復号可能なデコーダを破綻させることはない。ビットストリーム編集部112はスプライスをした後、最終的なビットストリームを出力する。
【0101】
このように、ビットストリーム中のランダムアクセスが行えるポイントのヘッダに、(Rmin、Bmin、Fmin)といった最小ビットレート、最小バッファサイズ、最小初期遅延時間などの情報を含ませることにより、復号側において、ビットストリームの復号可能性を効率良く判断することが可能となり、また、スプライシングなどのビットストリームの編集を容易に、かつ、復号側のバッファを破綻させることなく復号が常に行えるようにすることが可能となる。
【0102】
図10は、汎用のパーソナルコンピュータの内部構成例を示す図である。パーソナルコンピュータのCPU(Central Processing Unit)211は、ROM(Read Only Memory)212に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)213には、CPU211が各種の処理を実行する上において必要なデータやプログラムなどが適宜記憶される。入出力インタフェース215は、キーボードやマウスから構成される入力部216が接続され、入力部216に入力された信号をCPU211に出力する。また、入出力インタフェース215には、ディスプレイやスピーカなどから構成される出力部7も接続されている。
【0103】
さらに、入出力インタフェース215には、ハードディスクなどから構成される記憶部218、および、インターネットなどのネットワークを介して他の装置とデータの授受を行う通信部219も接続されている。ドライブ220は、磁気ディスク231、光ディスク232、光磁気ディスク233、半導体メモリ234などの記録媒体からデータを読み出したり、データを書き込んだりするときに用いられる。
【0104】
記録媒体は、図10に示すように、パーソナルコンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク231(フレキシブルディスクを含む)、光ディスク232(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク233(MD(Mini-Disc)(登録商標)を含む)、若しくは半導体メモリ234などよりなるパッケージメディアにより構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記憶されているROM212や記憶部218が含まれるハードディスクなどで構成される。
【0105】
なお、本明細書において、媒体により提供されるプログラムを記述するステップは、記載された順序に従って、時系列的に行われる処理は勿論、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0106】
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
【0109】
【発明の効果】
本発明の編集装置および方法によれば、スプライスなどの編集にかかる処理を軽減させ、容易に編集可能であるか否かを判断することが可能となる。
【図面の簡単な説明】
【図1】従来の画像情報符号化装置の一例の構成を示す図である。
【図2】従来の画像情報復号装置の一例の構成を示す図である。
【図3】バッファ量について説明する図である。
【図4】ビットレートとバッファ量の関係について説明する図である。
【図5】本発明を適用した符号化装置の一実施の形態の構成を示す図である。
【図6】バッファ量について説明する図である。
【図7】本発明を適用した復号装置の一実施の形態の構成を示す図である。
【図8】本発明を適用した編集装置の一実施の形態の構成を示す図である。
【図9】ビットレートとバッファ量の関係について説明する図である。
【図10】媒体を説明する図である。
【符号の説明】
70 符号化装置, 71 バッファ, 72 ビットストリーム解析部, 73 バッファ情報付加部, 90 復号装置, 91 ビットストリーム解析部, 92 復号可能性判定部, 111 ビットストリーム解析部, 112ビットストリーム編集部
Claims (2)
- 入力されたビットストリーム中のランダムにアクセスが可能な所定区間毎に挿入されているヘッダに含まれる、前記ビットストリームを復号する際に前記ビットストリームを格納するバッファのバッファサイズと前記バッファへの入力ビットレートとの組み合わせに従って前記ビットストリームが復号可能であるか否かを判定する際の判定基準として用いるバッファ特性情報を読み出し、その読み出した情報に基づいて、前記ビットストリームを編集点で接続したビットストリームがデコーダのバッファを破綻させずに復号可能であるか否かを判断する判断手段と、
前記判断手段により復号可能であると判断された場合、前記ビットストリームを編集点で接続する編集を行う編集手段と
を含み、
前記判断手段は、第1の前記ビットストリームの前記ヘッダに含まれる前記バッファ特性情報に示される前記バッファサイズと前記入力ビットレートを変数とする第1の特性曲線が、第2の前記ビットストリームの前記ヘッダに含まれる前記バッファ特性情報に示される前記バッファサイズと前記入力ビットレートを変数とする第2の特性曲線の常に上に位置するか、または、同一である場合、前記第1のビットストリームと前記第2のビットストリームと編集点で接続したビットストリームがデコーダのバッファを破綻させずに復号可能であると判断する
編集装置。 - 入力されたビットストリーム中のランダムにアクセスが可能な所定区間毎に挿入されているヘッダに含まれる、前記ビットストリームを復号する際に前記ビットストリームを格納するバッファのバッファサイズと前記バッファへの入力ビットレートとの組み合わせに従って前記ビットストリームが復号可能であるか否かを判定する際の判定基準として用いるバッファ特性情報を読み出し、その読み出した情報に基づいて、前記ビットストリームを編集点で接続したビットストリームがデコーダのバッファを破綻させずに復号可能であるか否かを判断する判断ステップと、
前記判断ステップの処理で復号可能であると判断された場合、前記ビットストリームを編集点で接続する編集を行う編集ステップと
を含み、
前記判断ステップの処理は、第1の前記ビットストリームの前記ヘッダに含まれる前記バッファ特性情報に示される前記バッファサイズと前記入力ビットレートを変数とする第1の特性曲線が、第2の前記ビットストリームの前記ヘッダに含まれる前記バッファ特性情報に示される前記バッファサイズと前記入力ビットレートを変数とする第2の特性曲線の常に上に位置するか、または、同一である場合、前記第1のビットストリームと前記第2のビットストリームと編集点で接続したビットストリームがデコーダのバッファを破綻させずに復号可能であると判断する
編集方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003107787A JP4875285B2 (ja) | 2002-04-26 | 2003-04-11 | 編集装置および方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002125298 | 2002-04-26 | ||
JP2002125298 | 2002-04-26 | ||
JP2003107787A JP4875285B2 (ja) | 2002-04-26 | 2003-04-11 | 編集装置および方法 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009108322A Division JP5223769B2 (ja) | 2002-04-26 | 2009-04-27 | 復号装置および方法、プログラム、並びに記録媒体 |
JP2010028883A Division JP5206706B2 (ja) | 2002-04-26 | 2010-02-12 | 符号化装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004007571A JP2004007571A (ja) | 2004-01-08 |
JP4875285B2 true JP4875285B2 (ja) | 2012-02-15 |
Family
ID=30447464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003107787A Expired - Fee Related JP4875285B2 (ja) | 2002-04-26 | 2003-04-11 | 編集装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4875285B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0406901D0 (en) * | 2004-03-26 | 2004-04-28 | British Telecomm | Transmitting recorded material |
JP4719602B2 (ja) * | 2006-03-28 | 2011-07-06 | アルパイン株式会社 | ビデオ出力システム |
CN101606389B (zh) * | 2007-01-08 | 2013-06-12 | 汤姆森特许公司 | 用于视频流拼接的方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08251582A (ja) * | 1995-03-07 | 1996-09-27 | Toshiba Corp | 符号化データ編集装置 |
-
2003
- 2003-04-11 JP JP2003107787A patent/JP4875285B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004007571A (ja) | 2004-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5429580B2 (ja) | 復号装置および方法、プログラム、並びに記録媒体 | |
JP3852366B2 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
JP4875285B2 (ja) | 編集装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090427 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100212 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100413 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100614 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20100702 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111125 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141202 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4875285 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |