JP4704374B2 - ビデオトランスコーディング方法及び装置 - Google Patents

ビデオトランスコーディング方法及び装置 Download PDF

Info

Publication number
JP4704374B2
JP4704374B2 JP2007040829A JP2007040829A JP4704374B2 JP 4704374 B2 JP4704374 B2 JP 4704374B2 JP 2007040829 A JP2007040829 A JP 2007040829A JP 2007040829 A JP2007040829 A JP 2007040829A JP 4704374 B2 JP4704374 B2 JP 4704374B2
Authority
JP
Japan
Prior art keywords
frame
video stream
transcoder
motion vector
specific block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007040829A
Other languages
English (en)
Other versions
JP2007228581A (ja
Inventor
圭 桓 辛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020070000791A external-priority patent/KR100843080B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2007228581A publication Critical patent/JP2007228581A/ja
Application granted granted Critical
Publication of JP4704374B2 publication Critical patent/JP4704374B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、入力ビデオストリームをGOP(Group Of Picture)構造が相異なる他のフォーマットでトランスコーディングする時、いくつかの参照フレームから適した参照フレームを高速で選択できる方法に関する。
インターネットを含んだ情報通信技術が発達するにつれて文字、音声だけではなく画像通信が増加している。既存の文字中心の通信方式としては消費者の多様な欲求を満たすには不足であり、これにより文字、映像、音楽など多様な形態の特性を受容できるマルチメディアサービスが増加している。マルチメディアデータは、その量が膨大で大容量の記録媒体を要して伝送時に広い帯域幅を要する。したがって、文字、映像、オーディオを含んだマルチメディアデータを伝送するためには、圧縮コーディング技法を使うことが必須的である。
データを圧縮する基本的な原理は、データの重複(redundancy)要素を除去する過程である。イメージから同一の色やオブジェクトが反復されるような空間的重複や、動画フレームで隣接フレームがほとんど変化がない場合やオーディオで同じ音がずっと反復されるような時間的重複、または人間の視覚及び知覚能力が高い周波数に鈍感なことを考慮した視覚的重複を除去することでデータを圧縮できる。一般的なビデオコーディング方法において、ビデオデータの時間的重複はモーション補償に基づいた時間的フィルタリング(temporal filtering)によって除去し、空間的重複は空間的変換(spatial transform)によって除去する。
ビデオデータの重複を除去した結果は、また量子化過程を通じて所定の量子化ステップによって損失符号化される。前記量子化された結果は、最終的にエントロピー符号化(entropy coding)を通じて最終的に無損失符号化される。
ところが、符号化されたビデオデータは、そのまま最終端末機器に伝達されて復呼化されるが、最終端末機器に伝送する前にネットワーク状況または最終端末機器の性能などを考慮してトランスコーディング(transcoding)される。例えば、符号化されたビデオデータが現在ネットワークを介して伝送するのに適していない場合、伝送サーバー側では前記ビデオデータのSNR(signal−to−noise ratio)、フレーム率、解像度またはコーディング方式(コーデック)を変更するが、このような過程を“トランスコーディング”と言う。
MPEG−2でコーディングされたビデオデータをH.264方式にトランスコーディングする従来の方法は、周波数領域(frequency domain)からコンバージョン(conversion)する方法と画素領域(pixel domain)でコンバージョンする方法とに分けられる。周波数領域でコンバージョンする方法は、トランスコーディングの入力フォーマットと出力フォーマットとの間に類似性が大きい場合に主に使われ、画素領域でコンバージョンする方法は、前記類似性が小さな場合に主に使われる。特に、画素領域でコンバージョンする方法は、エンコーディング時に推定されたモーションベクトルを再活用する。
ところが、トランスコーディングによってGOP構造が変わったり、モーションベクトルの参照方式が変わる場合には、既存のモーションベクトルをそのまま利用しにくい。このような理由で、もし、トランスコーディング時に復元された映像からモーションベクトルを再計算すれば、多くの時間と資源を消耗するようになる。また、再計算を避けようと遠く離れたフレームを参照すれば、直前フレームを参照するより多くの残差(Residue)が発生してビット率上昇及び画質低下を招きうる。
このようにGOP構造(参照方式)が、他のビデオストリーム間にトランスコーディングが行われる時、計算複雑性、画質及びビット率の間に適切な妥協点(Trade−off)を得るために、如何なるフレームを参照フレームとして選択しなければならないのかは非常に難しい問題である。
米国特許第6449392号公報 韓国公開特許第10−2003−25285号公報 韓国公開特許第10−2003−14697号公報
本発明が果そうとする技術的課題は、したがって、入力と出力との間に相異なるGOP構造(参照方式)を有するトランスコーディング過程で、トランスコーディング速度と画像品質とを考慮して適した参照フレームを選択する方法及び装置を提供することである。
本発明の技術的課題は、前述した技術的課題に制限されず、言及されていないさらなる技術的課題は、下記から当業者に明確に理解されるであろう。
前記技術的課題を果たすための本発明の一実施形態による、入力ビデオストリームを変換して出力ビデオストリームを生成させるトランスコーダは、前記入力ビデオストリームから変換係数及びビデオフレームを復元する復元部と、前記変換係数の大きさに基づいて、前記ビデオフレームによって参照された第1フレーム、又は、前記第1フレームと異なる位置の第2フレームのうち一つを選択する選択部と、前記選択されたフレームを参照して前記復元されたビデオフレームを符号化する符号化部と、を含み、前記選択部は、特定ブロックに対する前記変換係数の絶対値の和が所定の閾値を超えなければ、前記第1フレームを前記特定ブロックに対する参照フレームとして選択し、特定ブロックに対する前記変換係数の絶対値の和が所定の閾値を超えれば、前記第2フレームを前記特定ブロックに対する参照フレームとして選択し、前記閾値は、単一フレームに属する変換係数の絶対値の和をブロック数で割った値に所定の可変係数を乗算した値であり、前記可変係数は、前記単一フレーム内で処理する残余ブロックの数及び処理を終えなければならない残余時間によって決定される
前記技術的課題を果たすための本発明の一実施形態よるトランスコーディング方法は、入力ビデオストリームから変換係数及びビデオフレームを復元する段階と、前記変換係数の大きさに基づいて、前記ビデオフレームによって参照された第1フレーム、又は、前記第1フレームと異なる位置の第2フレームのうち一つを選択する段階と、前記選択されたフレームを参照して前記復元されたビデオフレームを符号化する段階と、を含み、前記選択する段階は、特定ブロックに対する前記変換係数の絶対値の和が所定の閾値を超えなければ、前記第1フレームを前記特定ブロックに対する参照フレームとして選択する段階と、特定ブロックに対する前記変換係数の絶対値の和が所定の閾値を超えれば、前記第2フレームを前記特定ブロックに対する参照フレームとして選択する段階と、を含み、前記閾値は、単一フレームに属する変換係数の絶対値の和をブロック数で割った値に所定の可変係数を乗算した値であり、前記可変係数は、前記単一フレーム内で処理する残余ブロックの数及び処理を終えなければならない残余時間によって決定される
本発明によれば、入力ビデオストリームをGOP構造が相異なる他のフォーマットでトランスコーディングするにおいて、最適の参照フレームを選択することによって、制限された演算能力(Computation Power)内で相対的に高い画質または低いビット率を実現できる長所がある。
以下、添付された図面を参照して、本発明の一実施形態を詳しく説明する。
図1Aは、MPEG−2ビデオメインプロファイルのGOP構造を、図1Bは、H.264ベースラインプロファイルのGOP構造を表わす。図1に図示されたように、Bフレームは、前後のIフレームまたはPフレームを参照できるが、他のBフレームを参照することはできない。しかし、Pフレームは、Iフレームまたは他のPフレームを参照できる。このような参照は、一つのGOP構造内でなされることが一般的である。
一方、H.264ベースラインプロファイルは、図2に図示したように、或るフレームは、直前フレームを参照する構造になっている。しかし、一般的にH.264は、単一のGOP内では或るフレームを参照することができ、多重参照も可能な構造になっている。
図2A及び図2Bは、H.264が支援する多重参照(multiple reference)の概念を示す図面である。図2Aを参照すれば、現在Pフレーム10は、同時に複数のフレーム20、25を参照できるということが分かる。これは、モーションベクトルを推定し、現在フレームの残差(residual)を生成させる単位がフレーム単位ではなくマクロブロック(MB)単位からなるために可能なことである。
図2Bは、現在Pフレーム10の相異なるマクロブロックMB1、MB2がそれぞれ相異なるフレーム20、25上の領域ref1、ref2を参照することを示す。このように、H.264では、マクロブロック別に適した参照フレームを選択させることでビデオコーディングの多様性及び適応性を提供する。
トランスコーダは、相異なるGOP構造を有する図1Aのような入力ビデオを図2Bのような出力ビデオにトランスコーディングするためには、入力ビデオのモーションベクトルを再計算する必要がある。しかし、出力ビデオで直前フレームを参照するためにモーションベクトルを再計算すれば、計算時間を多く消耗する。一方に、再計算をしないように入力ビデオの参照方式をそのまま使って遠距離のフレームを参照すれば、直前フレームを参照することに比べて大きい残差が発生して画質低下(または、ビット率上昇)を誘発できる。したがって、トランスコーディング時には、演算量と画質(または、ビット率)との間には一定した妥協点を捜し出す必要がある。
図3A及び図3Bは、トランスコーディング時に参照フレームを選択する方法を説明する図面であって、図3Aは、トランスコーディング前の入力ビデオ構造であり、図3Bは、トランスコーディング後の出力ビデオ構造である。図3Aで現在処理するフレームがBであり、モーションベクトルはIフレームを示している。MPEG−2構造では、フレームBのすべての前方参照ベクトルはIフレームを示す。一方、図3BのようなH.264構造では、MB1とMB2との前方順方向モーションベクトル(forward motion vector)のmv1、mv2は、Iフレームを示すこともでき、P1フレームを示すこともできる。もし、Iフレームを示すモーションベクトルmv2(I)が、P1フレームを示すモーションベクトルmv2(P1)に比べて残差をあまり大きくしない場合なら、演算速度のためにmv2(I)を選択することが有利である。一方に、その反対の場合なら、mv2(P1)を選択することが有利である。
本発明は、GOP構造が変更されるトランスコーディングで、出力ビデオの規格がH.264のように多重参照を支援する場合なら、参照フレームを選択するにおいて入力ビデオのものと、直前フレームを新しい参照フレームとして指定するもののうち一つを決定する方法を提供しようとする。入力ビデオの参照フレームをそのまま従えば、既存のモーションベクトルを再活用することで高速の変換が可能であり、新しい参照フレームを選択すれば演算量が多く必要であるが、優れた画質を得られる。したがって、両者の間に適切な妥協点を通じてトランスコーディングの速度及び画質をすべて考慮したトランスコーディングを実行することが可能である。
図4は、本発明の一実施形態によるトランスコーダ100の構成を図示するブロック図である。トランスコーダ100は、入力ビデオストリームを変換して出力ビデオストリームを生成させる。このために、トランスコーダ100は、復元部110、選択部120及び符号化部130を含んで構成されうる。
復元部110は、入力ビデオストリームから変換係数(transform coefficient)及びビデオフレームを復元する。選択部120は、前記変換係数の大きさに基づいて、前記ビデオフレームによって参照された第1フレームと前記第1フレームと異なる位置の第2フレームのうち一つを選択する。そして、符号化部130は、前記選択されたフレームを参照して前記復元されたビデオフレームを符号化する。
図5は、復元部110を構成を図示するブロック図である。復元部110は、エントロピーデコーダ111、逆量子化部112、逆変換部113及び逆予測部114を含んで構成されうる。
エントロピーデコーダ111は、可変長復号化、算術復号化などのアルゴリズムを用いて入力ビデオストリームを無損失復号化して量子化係数及びモーションベクトルを復元する。
逆量子化部112は、前記復元された量子化係数を逆量子化する。このような逆量子化過程は、ビデオエンコーダで行われた量子化過程の逆に該当する。前記逆量子化結果、変換係数を得られる。前記変換係数は、選択部120に提供される。
逆変換部113は、前記変換係数を、逆DCT変換、逆ウェーブレット変換などの逆空間的変換技法を使って逆変換する。
逆予測部114は、エントロピーデコーダ111で復元されたモーションベクトルを用いて現在フレームに対する参照フレームをモーション補償して予測フレームを生成させ、前記生成された予測フレームを前記逆変換部113で逆変換された結果と加算して復元されたフレームを生成させる。
再び、図4を参照すれば、選択部120は、復元部110から提供された変換係数を用いて、前記入力ビデオストリームから参照フレームとして使われた第1フレームをそのまま使うか、これと異なる第2フレームを使うかを選択する。これによって選択されたフレームは、符号化部130で参照フレームとして利用される。このような選択のために、選択部120は、前記変換係数から所定の閾値を計算し、この閾値を前記判別基準として使う。
本発明では、一つのフレーム内で固定された閾値を使う方法と、リアルタイムで応用に適するように閾値がフレーム内でも適応的に変化する可変方法を例を挙げる。
固定された閾値を利用する方法
本実施形態では、閾値(TH)は、単一フレーム内では固定されている。閾値(TH)は、多様な方法で定めることができるが、一例として、次の(式1)のように計算されうる。
Figure 0004704374
(式1)で、Nは一フレームのブロックの個数であり、C(i,j)はm番目のブロック内の座標(i,j)の位置での変換係数である。また、Vctlは、閾値の大きさを調節できる制御パラメータ(デフォルト値=1.0)である。前記ブロックは、DCT変換の単位であるDCTブロック大きさを有することもでき、モーション推定の単位であるマクロブロック大きさを有することもある。
現在ブロックのインデックスをkとする時、参照フレームの選択基準は、次の(式2)のようである。
Figure 0004704374
(式2)で、Σ|C(i,j)|は、現在ブロックに含まれる変換係数の絶対値の和を意味し、Reforigは、入力ビデオストリームで現在ブロックの参照フレームとして使われた第1フレームを意味し、Refは、前記第1フレームとは異なる位置の第2フレームを意味する。望ましくは、第2フレームは、現在ブロックが属するフレーム(現在フレーム)の直前フレームである。
(式2)が意味することは、平均より大きいエネルギーを有するブロックに対しては、現在フレームとより近いフレームを参照フレームとして選択するということである。このようにすることでエネルギーが平均より小さなブロックは、入力ビデオストリームでのモーションベクトルをそのまま使って、それより大きいブロックは、相対的に隣接したフレームを参照フレームにして新たにモーションベクトルを求めるということである。このような方法を通じて、画質及びトランスコーディングの速度間に適切な妥協点を捜しうる。
ところが、(式1)のように、まだ処理されていないブロックまで考慮して閾値を求める方法は、多少多くの計算を要する。したがって、現在処理するブロックのインデックスがkである場合、閾値(TH)を計算するにおいて、次の(式3)のように現在処理されたブロックのみを考慮する実施形態も考えられる。
Figure 0004704374
選択部120で、参照フレームを選択する単位であるブロックと実際モーションベクトルが割り当てられるマクロブロックとの大きさが異なることもできるが、この場合にはモーションベクトルの併合や分解が必要かも知れない。
可変閾値を使う方法
トランスコーダのリアルタイム応用では、制限時間までフレームを処理できるかが重要な課題になる。リアルタイムトランスコーディング状況では、現在可溶の計算時間を一つの因子にして可変的に閾値を調節する必要がある。すなわち、可変閾値(TH)は、次の(式4)のように固定閾値(TH)に可変係数RTfactorを乗算することで計算されうる。
Figure 0004704374
(式4)は、現在フレームを処理するための制限時間を超過するような場合には、閾値(TH)を増加させてトランスコーディングの速度を向上させ、十分な時間が残っている場合には、閾値(TH)を減少させて画質の向上を図りうるということを意味する。
前記RTfactorは、さまざまな方法で決定できるが、考慮する因子が現在処理中であるブロックのインデックス、制限時間のうち残余時間などであることを考慮すれば、次の(式5)のように決定されうる。
Figure 0004704374
(式5)で、kは、現在処理中であるブロックのインデックス番号(0≦k<N)であり、Nは、フレームを成す全体ブロックの数である。そして、Tdueは、現在のフレームの変換を終えなければならない時刻を、Tcurは、現在時刻をそれぞれ意味し、framerateは、映像再生時の秒当りフレーム数を意味する。前記framerateは、定数であるが、(Tdue−Tcur)を正規化(normalize)するために乗算されている。したがって、(式5)の分子及び分母はすべて0と1との間の値を有する。(式5)は、現在フレームで処理する残余ブロック数が多いほどRTfactorは大きくなることでトランスコーディングの速度を高くし、処理可能な時間が多いほどRTfactorが小くなることでトランスコーディングの速度を低めて画質向上を図るということを意味する。
(式5)と同様の趣旨で、RTfactorは、次の(式6)のように定義されることもある。
Figure 0004704374
選択部120は、前述した固定閾値または可変閾値と現在ブロックに含まれる変換係数の絶対値の和とを比べて、入力ビデオストリームのモーションベクトル及び参照フレーム(第1フレーム)をそのまま使うか、新しいフレーム(第2フレーム)を参照してモーションベクトルを計算するかを選択する。このような選択は、それぞれのブロック別になされて参照フレーム情報として符号化部130に提供される。
モーションベクトルが逆方向モーションベクトルである場合に、順方向モーションベクトルに近似する方法がすでに知られているので、順方向モーションベクトルを得られない場合には、逆方向モーションベクトルを近似して順方向モーションベクトルを得た後、これを既存のモーションベクトル及び参照フレームの代わりに使用できる。例えば、Bフレームの或るマクロブロックが以後行うPフレームの或るブロックを参照したら、このブロックとオーバーラップ(overlap)されるPフレームのマクロブロックのうち最も広い面積を覆うマクロブロックを選択し、このマクロブロックの先行Iフレームに対するモーションベクトルを求めうる。このとき、Bフレームで使用できるIフレームに対するモーションベクトルは、Pフレームブロックに対するモーションベクトルと、Pフレームブロックのうち最も多くオーバーラップされたマクロブロックのIフレームに対するモーションベクトルの和で計算されうる。
図6は、符号化部130の構成を図示するブロック図である。符号化部130は、予測部131、変換部132、量子化部133及びエントロピーエンコーダ134を含んで構成されうる。
予測部131は、前記参照フレーム情報を用いて現在フレームのそれぞれのブロック別に第1フレーム及び第2フレームのうち一つを参照フレームにしてモーションベクトルを求める。前記第1フレームは、復元部110で復元されたフレームのうち現在フレームの参照フレームとして使われたフレームを意味し、前記第2フレームは、前記第1フレームと異なる時間的位置にあるフレームを意味する。
このとき、予測部131は、現在フレームの或るブロックが第1フレームを参照フレームにする場合には、前記ブロックに既存の入力ビデオストリームのモーションベクトルを前記現在ブロックにそのまま割り当てする。また、前記ブロックが第2フレームを参照フレームにする場合には、前記第2フレームを参照してモーションベクトルを推定し、該推定されたモーションベクトルを前記現在ブロックに割り当てする。
そして、予測部131は、現在フレームに属するブロックに割り当てられたモーションベクトルを用いて該当参照フレーム(第1フレームまたは第2フレーム)をモーション補償して予測フレームを生成させ、現在フレームから前記予測フレームを差引くことで残差を生成させる。
変換部132は、前記生成された残差に対して空間的変換を行う。このような空間的変換方法としては、DCT(Discrete Cosine Transform)、ウェーブレット変換(wavelet transform)などが使われうる。空間的変換結果、変換係数が求められるが、空間的変換方法としてDCTを使う場合、DCT係数が、ウェーブレット変換を使う場合、ウェーブレット係数が求められる。
量子化部133は、空間的変換部132から求めた変換係数を量子化して量子化係数を生成させる。量子化(quantization)とは、任意の実数値で表現される前記変換係数を一定区間に分けて不連続的な値(discrete value)に表わす作業を意味する。このような量子化方法としては、スカラー量子化、ベクトル量子化などの方法があるが、このうち簡単なスカラー量子化方法は、変換係数を量子化テーブルの該当値で割った後、整数の位に四捨五入する過程で実行される。
エントロピーエンコーダ134は、前記量子化係数と、予測部131によって提供されるモーションベクトルを無損失符号化して出力ビデオストリームを生成させる。このような無損失符号化方法としては、算術符号化(arithmetic coding)、可変長符号化(variable length coding)などが使われうる。
今まで図4ないし図6の各構成要素は、メモリ上の所定領域で実行されるタスク、クラス、サブルーチン、プロセス、オブジェクト、実行スレッド、プログラムのようなソフトウェアや、FPGA(field−programmable gate array)やASIC(application−specific integrated circuit)のようなハードウェアに具現されることができ、また、前記ソフトウェア及びハードウェアの組合わせでなされることもできる。前記構成要素は、コンピュータで読取可能な記録媒体に含まれていることもでき、複数のコンピュータにその一部が分散されて分布されることもできる。
以上、添付された図面を参照して本発明の実施形態を説明したが、当業者ならば本発明がその技術的思想や必須的な特徴を変更せずとも、他の具体的な形態に実施できるということを理解できるであろう。したがって、前述した実施形態は、あらゆる面で例示的なものであり、限定的ではないと理解せねばならない。
本発明は、ビデオトランスコーディング方法及び装置に関連する技術分野に適用されうる。
MPEG−2ビデオメインプロファイルのGOP構造を表わす図である。 H.264ベースラインプロファイルのGOP構造を表わす図である。 H.264が支援する多重参照の概念を示す図である。 H.264が支援する多重参照の概念を示す図である。 トランスコーディング時に参照フレームを選択する方法を説明する図である。 トランスコーディング時に参照フレームを選択する方法を説明する図である。 本発明の一実施形態によるトランスコーダの構成を図示するブロック図である。 図4のトランスコーダに含まれる復元部の構成を図示するブロック図である。 図4のトランスコーダに含まれる符号化部の構成を図示するブロック図である。
符号の説明
100 トランスコーダ
110 復元部
111 エントロピーデコーダ
112 逆量子化部
113 逆変換部
114 逆予測部
120 選択部
130 符号化部
131 予測部
132 変換部
133 量子化部
134 エントロピーエンコーダ

Claims (10)

  1. 入力ビデオストリームを変換して出力ビデオストリームを生成させるトランスコーダにおいて、
    前記入力ビデオストリームから変換係数及びビデオフレームを復元する復元部と、
    前記変換係数の大きさに基づいて、前記ビデオフレームによって参照された第1フレーム、又は、前記第1フレームと異なる位置の第2フレームのうち一つを選択する選択部と、
    前記選択されたフレームを参照して前記復元されたビデオフレームを符号化する符号化部と、を含み、
    前記選択部は、
    特定ブロックに対する前記変換係数の絶対値の和が所定の閾値を超えなければ、前記第1フレームを前記特定ブロックに対する参照フレームとして選択し、
    特定ブロックに対する前記変換係数の絶対値の和が所定の閾値を超えれば、前記第2フレームを前記特定ブロックに対する参照フレームとして選択し、
    前記閾値は、
    単一フレームに属する変換係数の絶対値の和をブロック数で割った値に所定の可変係数を乗算した値であり、前記可変係数は、前記単一フレーム内で処理する残余ブロックの数及び処理を終えなければならない残余時間によって決定されることを特徴とするトランスコーダ。
  2. 前記第2フレームは、
    前記ビデオフレームの直前に位置するフレームであることを特徴とする請求項1に記載のトランスコーダ。
  3. 前記入力ビデオストリームは、MPEG標準ビデオストリームであり、前記出力ビデオストリームは、H.264標準ビデオストリームであることを特徴とする請求項1に記載のトランスコーダ。
  4. 前記可変係数は、
    処理する残余ブロックの数を前記単一フレームに属するブロック数で割った値を、前記残余時間にフレーム率を乗算した値で割ることで計算されることを特徴とする請求項1に記載のトランスコーダ。
  5. 前記符号化部は、
    前記選択されたフレームが第1フレームである場合には、前記入力ビデオストリームモーションベクトルをそのまま利用し、前記選択されたフレームが第2フレームである場合には、前記第2フレームを参照にしてモーションベクトルを推定することを特徴とする請求項1に記載のトランスコーダ。
  6. 入力ビデオストリームを変換して出力ビデオストリームを生成させるトランスコーディング方法において、
    前記入力ビデオストリームから変換係数及びビデオフレームを復元する段階と、
    前記変換係数の大きさに基づいて、前記ビデオフレームによって参照された第1フレーム、又は、前記第1フレームと異なる位置の第2フレームのうち一つを選択する段階と、
    前記選択されたフレームを参照して前記復元されたビデオフレームを符号化する段階と、を含み、
    前記選択する段階は、
    特定ブロックに対する前記変換係数の絶対値の和が所定の閾値を超えなければ、前記第1フレームを前記特定ブロックに対する参照フレームとして選択する段階と、
    特定ブロックに対する前記変換係数の絶対値の和が所定の閾値を超えれば、前記第2フレームを前記特定ブロックに対する参照フレームとして選択する段階と、を含み、
    前記閾値は、
    単一フレームに属する変換係数の絶対値の和をブロック数で割った値に所定の可変係数を乗算した値であり、前記可変係数は、前記単一フレーム内で処理する残余ブロックの数及び処理を終えなければならない残余時間によって決定されることを特徴とするトランスコーディング方法。
  7. 前記第2フレームは、
    前記ビデオフレームの直前に位置するフレームであることを特徴とする請求項6に記載のトランスコーディング方法。
  8. 前記入力ビデオストリームは、MPEG標準ビデオストリームであり、前記出力ビデオストリームは、H.264標準ビデオストリームであることを特徴とする請求項6に記載のトランスコーディング方法。
  9. 前記可変係数は、
    処理する残余ブロックの数を前記単一フレームに属するブロック数で割った値を、前記残余時間にフレーム率を乗算した値で割ることで計算されることを特徴とする請求項6に記載のトランスコーディング方法。
  10. 前記符号化する段階は、
    前記選択されたフレームが第1フレームである場合には、前記入力ビデオストリームモーションベクトルをそのまま利用し、前記選択されたフレームが第2フレームである場合には、前記第2フレームを参照にしてモーションベクトルを推定する段階を含むことを特徴とする請求項6に記載のトランスコーディング方法。
JP2007040829A 2006-02-24 2007-02-21 ビデオトランスコーディング方法及び装置 Expired - Fee Related JP4704374B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2006-0018295 2006-02-24
KR20060018295 2006-02-24
KR1020070000791A KR100843080B1 (ko) 2006-02-24 2007-01-03 비디오 트랜스코딩 방법 및 장치
KR10-2007-0000791 2007-01-03

Publications (2)

Publication Number Publication Date
JP2007228581A JP2007228581A (ja) 2007-09-06
JP4704374B2 true JP4704374B2 (ja) 2011-06-15

Family

ID=38353101

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007040829A Expired - Fee Related JP4704374B2 (ja) 2006-02-24 2007-02-21 ビデオトランスコーディング方法及び装置

Country Status (3)

Country Link
US (1) US20070201554A1 (ja)
EP (1) EP1838105A1 (ja)
JP (1) JP4704374B2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8463997B2 (en) * 2007-08-16 2013-06-11 Samsung Electronics Co., Ltd. Apparatus and method of caching frame
US8831101B2 (en) * 2008-08-02 2014-09-09 Ecole De Technologie Superieure Method and system for determining a metric for comparing image blocks in motion compensated video coding
US8687685B2 (en) 2009-04-14 2014-04-01 Qualcomm Incorporated Efficient transcoding of B-frames to P-frames
US9100656B2 (en) 2009-05-21 2015-08-04 Ecole De Technologie Superieure Method and system for efficient video transcoding using coding modes, motion vectors and residual information
EP2355510A1 (en) * 2009-12-21 2011-08-10 Alcatel Lucent Method and arrangement for video coding
US9432678B2 (en) 2010-10-30 2016-08-30 Hewlett-Packard Development Company, L.P. Adapting a video stream
US8755438B2 (en) * 2010-11-29 2014-06-17 Ecole De Technologie Superieure Method and system for selectively performing multiple video transcoding operations
US9210442B2 (en) 2011-01-12 2015-12-08 Google Technology Holdings LLC Efficient transform unit representation
US9380319B2 (en) * 2011-02-04 2016-06-28 Google Technology Holdings LLC Implicit transform unit representation
KR101898464B1 (ko) * 2011-03-17 2018-09-13 삼성전자주식회사 모션 추정 장치 및 그것의 모션 추정 방법
US9674523B2 (en) * 2012-11-14 2017-06-06 Advanced Micro Devices, Inc. Methods and apparatus for transcoding digital video
US9544597B1 (en) 2013-02-11 2017-01-10 Google Inc. Hybrid transform in video encoding and decoding
US9967559B1 (en) 2013-02-11 2018-05-08 Google Llc Motion vector dependent spatial transformation in video coding
US9674530B1 (en) 2013-04-30 2017-06-06 Google Inc. Hybrid transforms in video coding
CN103647984A (zh) * 2013-11-14 2014-03-19 天脉聚源(北京)传媒科技有限公司 一种视频处理服务器负载分配的方法及***
WO2015088265A1 (en) * 2013-12-13 2015-06-18 Samsung Electronics Co., Ltd. Storage medium, reproducing apparatus and method for recording and playing image data
US9565451B1 (en) 2014-10-31 2017-02-07 Google Inc. Prediction dependent transform coding
US9769499B2 (en) 2015-08-11 2017-09-19 Google Inc. Super-transform video coding
US10277905B2 (en) 2015-09-14 2019-04-30 Google Llc Transform selection for non-baseband signal coding
US9807423B1 (en) 2015-11-24 2017-10-31 Google Inc. Hybrid transform scheme for video coding
US11477486B2 (en) 2019-01-02 2022-10-18 Qualcomm Incorporated Escape coding for coefficient levels
US11122297B2 (en) 2019-05-03 2021-09-14 Google Llc Using border-aligned block functions for image compression
CN111901631B (zh) * 2020-07-30 2023-02-17 有半岛(北京)信息科技有限公司 一种直播视频的转码方法、装置、服务器和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000244921A (ja) * 1999-02-24 2000-09-08 Matsushita Electric Ind Co Ltd 映像符号化方法および装置
JP2001169295A (ja) * 1999-09-10 2001-06-22 Ntt Docomo Inc 動画像符号化データのトランスコーディング方法およびトランスコーディング装置
JP2005533468A (ja) * 2002-07-17 2005-11-04 ディリティアム ネットワークス ピーティーワイ リミテッド ハイブリッドビデオコーデックビットストリーム間の変換符号化のための方法と装置
JP2006295503A (ja) * 2005-04-08 2006-10-26 Pioneer Electronic Corp 再符号化装置、再符号化方法、および再符号化用プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6449392B1 (en) * 1999-01-14 2002-09-10 Mitsubishi Electric Research Laboratories, Inc. Methods of scene change detection and fade detection for indexing of video sequences
EP1092321A1 (en) * 1999-04-30 2001-04-18 Koninklijke Philips Electronics N.V. Video encoding method with selection of b-frame encoding mode
US6744814B1 (en) * 2000-03-31 2004-06-01 Agere Systems Inc. Method and apparatus for reduced state sequence estimation with tap-selectable decision-feedback
EP1354481A2 (en) * 2001-01-12 2003-10-22 Koninklijke Philips Electronics N.V. Method and device for scalable video transcoding
JP4015934B2 (ja) * 2002-04-18 2007-11-28 株式会社東芝 動画像符号化方法及び装置
JP2004221998A (ja) * 2003-01-15 2004-08-05 Canon Inc 画像処理装置
CN1774930A (zh) 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 视频转码
US20050175099A1 (en) * 2004-02-06 2005-08-11 Nokia Corporation Transcoder and associated system, method and computer program product for low-complexity reduced resolution transcoding
US7782955B2 (en) * 2005-09-28 2010-08-24 Avisonic Technology Corporation Transcoder and transcoding method operating in a transform domain for video coding schemes possessing different transform kernels

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000244921A (ja) * 1999-02-24 2000-09-08 Matsushita Electric Ind Co Ltd 映像符号化方法および装置
JP2001169295A (ja) * 1999-09-10 2001-06-22 Ntt Docomo Inc 動画像符号化データのトランスコーディング方法およびトランスコーディング装置
JP2005533468A (ja) * 2002-07-17 2005-11-04 ディリティアム ネットワークス ピーティーワイ リミテッド ハイブリッドビデオコーデックビットストリーム間の変換符号化のための方法と装置
JP2006295503A (ja) * 2005-04-08 2006-10-26 Pioneer Electronic Corp 再符号化装置、再符号化方法、および再符号化用プログラム

Also Published As

Publication number Publication date
EP1838105A1 (en) 2007-09-26
US20070201554A1 (en) 2007-08-30
JP2007228581A (ja) 2007-09-06

Similar Documents

Publication Publication Date Title
JP4704374B2 (ja) ビデオトランスコーディング方法及び装置
KR100763181B1 (ko) 기초계층과 향상계층의 데이터를 바탕으로 예측 정보를코딩하여 코딩율을 향상시키는 방법 및 장치
KR100654436B1 (ko) 비디오 코딩 방법과 디코딩 방법, 및 비디오 인코더와디코더
KR100850705B1 (ko) 시공간적 복잡도를 고려한 적응적 동영상 부호화 방법 및그 장치
KR100781525B1 (ko) 가중 평균합을 이용하여 fgs 계층을 인코딩 및디코딩하는 방법 및 장치
KR100631768B1 (ko) 비디오 코딩에서 프레임간 예측방법 및 비디오 인코더와,비디오 디코딩방법 및 비디오 디코더
US7379496B2 (en) Multi-resolution video coding and decoding
KR100750138B1 (ko) 인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및장치
JP4763548B2 (ja) スケーラブルビデオコーディング及びデコーディング方法と装置
KR100596706B1 (ko) 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치
KR100843080B1 (ko) 비디오 트랜스코딩 방법 및 장치
US20060280372A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
JP5745175B2 (ja) 適応的な量子化パラメータ差分値を用いた映像の符号化及び復号化方法と装置
US7885341B2 (en) Spatial filtering for improving compression efficiency of motion compensated interframe coding
JP2008522537A (ja) 多階層基盤のビデオエンコーディング方法、デコーディング方法及び前記方法を利用した装置
KR20050053470A (ko) 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치
JP2009533938A (ja) 多階層基盤のビデオエンコーディング方法および装置
JP2006304307A5 (ja)
JP2006304307A (ja) エントロピーコーディングのコンテキストモデルを適応的に選択する方法及びビデオデコーダ
KR20060109241A (ko) 인트라 코딩을 선택적으로 적용하여 인트라 bl 예측모드의 비디오 신호를 인코딩 및 디코딩하는 방법 및 장치
JP2005524352A (ja) 複数基準フレームに基づいた動き補償時間的フィルタ化を用いたスケーラブルなウェーブレット・ベースの符号化
KR20130054396A (ko) 최적화된 디블록킹 필터
JP2006518572A (ja) ビデオをトランスコーディングする方法
KR20050075483A (ko) 비디오 코딩 및 디코딩 방법, 및 이를 위한 장치
JP4762486B2 (ja) マルチ・リゾルーション・ビデオ符号化および復号化

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100929

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110309

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees