JP2006191253A - レート変換方法及びレート変換装置 - Google Patents

レート変換方法及びレート変換装置 Download PDF

Info

Publication number
JP2006191253A
JP2006191253A JP2005000363A JP2005000363A JP2006191253A JP 2006191253 A JP2006191253 A JP 2006191253A JP 2005000363 A JP2005000363 A JP 2005000363A JP 2005000363 A JP2005000363 A JP 2005000363A JP 2006191253 A JP2006191253 A JP 2006191253A
Authority
JP
Japan
Prior art keywords
quantization
image data
quantization parameter
requantization
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005000363A
Other languages
English (en)
Inventor
Yoichi Masuda
洋一 増田
Yasuo Hamamoto
康男 濱本
Yuji Hayashino
裕司 林野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005000363A priority Critical patent/JP2006191253A/ja
Priority to US11/321,445 priority patent/US20060171460A1/en
Publication of JP2006191253A publication Critical patent/JP2006191253A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】符号量制御性、符号削減量及び画質に対して高品質なレート変換装置を提供する。
【解決手段】動画像を圧縮符号化した第一画像符号化データから直交変換係数データ以外の残りのデータを分離し、直交変換ブロック毎に第一量子化画像データを可変長復号し、前記直交変換ブロックに対応する第一量子化パラメータを含む画像解析情報を抽出し、直交変換ブロック毎に前記第一量子化パラメータを用いて第一量子化画像データを逆量子化した後、第二量子化パラメータを用いて再量子化し生成した第二量子化画像データを順次可変長符号化し、前記残りのデータに対してレート変換に伴う修正を施したデータとの多重化を行い第二画像符号化データを作成し、第二画像符号化データの符号量を制御する為に、第二量子化パラメータを設定すると共に前記再量子化処理における除算結果の小数点以下の数値に対する丸め方法を前記画像解析情報に基づき設定する。
【選択図】図1

Description

本発明は、動画像符号化データのビットレート変換を実行するための方法及び装置に関するものである。
デジタル動画像を効率よく伝送・記録するためには圧縮符号化が必要である。ディジタルビデオおよび付随するオーディオに対する圧縮符号化方式の標準規格として周知であるMPEG(Moving Picture Expert Group)−2では、一連の複数の画面(フレーム)から構成される動画像において、フレーム間の差分を取ることによって時間軸方向の冗長度を削減し、さらに、各フレームを構成する複数の画素にDCT(Discrete Cosine Transform;離散コサイン変換)による直交変換処理を施した後、量子化を行い空間軸方向の冗長度を削減することにより効率の良い動画像圧縮符号化を実現している。
MPEG−2では、動画像符号化データは階層構造を有し、最上位のシーケンス層からGOP(Group of Picture)層、ピクチャ層、スライス層、マクロブロック層およびブロック層の順の各層からなる。
符号化装置で符号化された動画像符号化データは、所定の転送速度で伝送路に送出され、復号装置に入力されて復号され再生される。しかしながら、無線通信などの狭帯域の伝送路に接続された復号装置も存在するため、動画像符号化データのビットレートを変換する必要がある。このビットレートの変換を行うのがレート変換装置である。
動画像符号化データのビットレートを変換するには大きく分けて以下の二つの方法がある。その1つは、復号装置と符号化装置の両方を用意し、動画像符号化データを復号装置で復号し画像を再生した後に、符号化装置でその再生画像を所望のビットレートまで再圧縮符号化する方法である。この方法では、復号装置と符号化装置両方を必要としており高価になる上、復号してから再び符号化するため遅延が大きくなり、実用的ではない。
一方、画像を完全に復号再生せずに、ビットレート変換を行う方法がある。MPEG−2で圧縮符号化した画像を例にして、図13を用いて説明する。図13は完全な復号再生を必要としないレート変換装置の概略構成を示すブロック図である。
レート変換装置10では、入力端子100への入力ビットストリーム内のシーケンス層、GOP層、ピクチャ層、スライス層およびマクロブロック層の符号化情報を殆ど再利用する。基本的にブロック層のDCT係数の変換およびブロック層の変換に伴い修正が必要なマクロブロック層の符号の変換処理のみが行われる。
まず、MPEG−2で圧縮符号化された画像のビットストリームを入力端子100から入力する。可変長復号部(VLD)110ではビットストリームを解析しながら、ブロック毎に第一の量子化スケールQ_scale1と量子化されたDCT係数a[i]を抽出する。ここで、i=1、・・・、64である。
また、可変長符号とは、0以外の係数間の0の個数(ラン)と係数値(レベル)の組を表す符号である。出現頻度の高いランとレベルの組には短い符号が、出現頻度の低いランとレベルの組には長い符号が割り当てられる。
可変長復号部110はQ_scale1、a[i]を逆量子化部(IQ)130に送り、それ以外のデータをマルチプレクサ160(MUX)に送る。
逆量子化部130では係数a[i]にQ_scale1を積算して逆量子化操作を行い、b[i]を生成し、量子化部(Q)140に送る。量子化部140では逆量子化して得られた逆量子化係数b[i]を第二の量子化スケールQ_scale2で除算して再量子化係数c[i]を生成する。c[i]とQ_scale2を可変長符号化部(VLC)150に送り、可変長符号に変換してマルチプレクサ160に送る。
マルチプレクサ160では、送られてきたデータを多重化して出力する。なお、所望のビットレートに圧縮するためにレート制御部120にて、可変長復号部110への入力ビット数及び可変長符号化部150の出力ビット数を計数しながらQ_scale2を決定する。
このようなレート変換方法においては、逆DCTや逆量子化といった不可逆過程を経て動画像データが復号され、さらにこの動画像データがDCTや量子化という不可逆過程を経て動画像符号化データに変換されるため、画質が劣化する問題がある。
特許文献1では、量子化スケール変更によるレート変換方法において、画質の劣化が生じる可能性が低くなるような量子化スケール決定方法が示されている。特許文献1では、元々大きな量子化スケールで量子化されていたDCT係数が、さらに粗い量子化スケールで再量子化することにより発生する画質劣化を防ぐために、閾値を設け、元々の量子化スケールが閾値より小さい場合にのみ量子化スケールの変更を行うようにしている。閾値は、処理対象の符号化困難度の時間変化に応じて変更される。
特開2002−218464号公報
ところで、前記従来の構成における再量子化時の除算では、小数点以下の値の取り扱いは、四捨五入または切り捨てのどちらか一方を適用するのが一般的である。しかしながら、小数点以下の値の取り扱い方によって、削減符号量と画質において結果が大きく異なってくる。
名称”Mobile&Calendar” を有する既知の画像テストシーケンスに対する量子化スケール変更によるレート変換実験結果を図14及び15に示す。ここで、図14は切り捨て適用時の実験結果を示し、図15は四捨五入適用時の実験結果を示している。実験では、量子化スケールを変更するために全てのマクロブロックに対して、量子化スケールを特定する値である量子化スケールコードを一律に増加させた。また、該テストシーケンスは、704×480画像ドットの解像度、4:2:0のクロマフォーマット、450フレーム、12Mbpsの平均ビットレートを有する。また、該テストシーケンスの量子化後DCT係数のうち「0」を除く各レベル絶対値出現頻度を図16に示す。図16よりレベル絶対値1が非常に多く出現することがわかる。
小数点以下の値を切り捨てする場合、量子化スケール変更前の時点でレベルの絶対値が1である量子化後DCT係数は量子化スケールを一段階大きく変更するだけでレベル0へと変更される。それゆえ、レベル絶対値1の量子化後DCT係数が多く含まれる前記テストシーケンスに対して、量子化スケールを一段階大きく変更すると図14に示すように符号量が大幅に削減される。つまり、必要以上に符号量が削減される状況が発生し、変換後レートを目標レートへと制御する上で問題となる。
一方、小数点以下の値を四捨五入する場合、図15に示すように量子化スケール変更に応じて符号量は段階的に削減されていく。しかしながら、四捨五入適用時と切り捨て適用時において、同等の符号量まで削減して画像の比較を行うと、四捨五入適用時は画質において切り捨て適用時より劣っている。
例えば、四捨五入及び切り捨て適用時のそれぞれにおいて、前記テストシーケンスを約5Mbpsの平均ビットレートにレート変換した際の輝度成分の信号対雑音比(SNR)は図17に示すとおりである。ここで、SNRは(数1)により求まる変換前後の画像間のSNRであり、SNRが高ければ高いほど変換前後の誤差が小さいことを示す。四捨五入適用時は、切り捨て適用時よりSNRが約3.8dB低い結果となっている。
Figure 2006191253
これは、四捨五入適用時は符号量の減少が小さく、切り捨て適用時と同等の符号量まで削減するためには、量子化スケールを大きく変更する必要があり、結果として画質が劣化するためである。
本発明は、前記従来の課題を解決するもので、再量子化時の除算における小数点以下の値の取り扱い方を適応的に変更可能なレート変換装置を提供することを目的とする。
前記従来の課題を解決するために、本発明は次のようにして、再量子化時の除算における小数点以下の値の取り扱い方を適応的に変更し、レート変換を行う。
複数の画面から構成される動画像を圧縮符号化した第一画像符号化データから、直交変換係数データ以外の残りのデータを分離し、直交変換ブロック毎に第一量子化画像データを順次可変長復号する。
また、第一画像符号化データを解析し、前記直交変換ブロックに対応する第一量子化パラメータを含む画像解析情報を抽出する。
次に直交変換ブロック毎に前記第一量子化パラメータを用いて、第一量子化画像データを逆量子化した後、第二量子化パラメータを用いて再量子化し第二量子化画像データを生成する。
さらに、第二量子化画像データを順次可変長符号化し、分離された残りのデータに対してレート変換に伴う修正を施したデータとの多重化を行い、第二画像符号化データを作成する。
ここで、第二画像符号化データの符号量を制御するために、第二量子化パラメータを設定するとともに、前記再量子化処理における除算結果の小数点以下の数値に対する丸め方法を画像解析情報に基づき設定する。
除算結果の数値丸め方法は、量子化パラメータの変更量閾値設け、量子化パラメータの変更量が閾値以上であれば切り捨てを適用し、そうでなければ四捨五入を適用する。
量子化パラメータの変更量閾値は、事前に用意した入力レートと目標レートとの対応表を参照し設定する。また、変更量閾値は変換対象である第一画像符号化データの解析結果に応じて変更することも可能である。
本構成によって、再量子化時の除算における小数点以下の値の取り扱い方を適応的に変更可能となる。
本発明のレート変換方法によれば、再量子化時の除算における小数点以下の値の取り扱い方を適応的に変更可能とすることにより、目標ビットレートが高い場合は符号量制御性に優れた四捨五入が適用され、目標ビットレートが低い場合は、画質劣化を抑えた符号量削減に優れた切り捨てが適用される。したがって、符号量制御性、符号削減量および画質において優れたレート変換方法が簡単な構成で提供される。
以下本発明の実施の形態について、図面を参照しながら説明する。これらの実施の形態では、背景技術のところで説明したMPEG−2で圧縮符号化して得られたビットストリームを例として用いるが、本発明のレート変換方法及びレート変換装置はこの方式に限るものではなく、量子化過程を含む他の圧縮符号化方式に対して同様に適用できる。
(実施の形態1)
本発明の実施の形態におけるレート変換装置の処理対象であるMPEG−2ビットストリームの構成の詳細を説明する。ビットストリームは背景技術のところで説明したように階層構造を有しており、以下では各階層に対応したデータについて説明する。
シーケンスは、動画像を構成する時系列のピクチャの集合である。ビットストリームは、最上位層のデータとして、このシーケンスに対応したシーケンス層のデータを含んでいる。このシーケンス層のヘッダには、そのシーケンスに属する各ピクチャのサイズや画素アスペクト比等を指定するデータが含まれている。
シーケンス層のデータには、このシーケンスを構成する複数のGOPに対応したGOP層のデータが含まれている。1つのGOPは、複数のピクチャによって構成されている。GOPを構成する各ピクチャには、イントラ符号化ピクチャ(Iピクチャ)、順方向予測ピクチャ(Pピクチャ)、双方向予測ピクチャ(Bピクチャ)の3種類がある。
Iピクチャは、他のピクチャとは独立して静止画として符号化される画面のことである。Pピクチャは、時間的に過去に位置するIまたはPピクチャに基づいて予測符号化される画面のことである。Bピクチャは、時間的に前後に位置するIまたはPピクチャを用いて順方向、逆方向または双方向のピクチャに基づいて予測符号化される画面のことである。GOP層のデータ中には、以上説明したようなGOPを構成する各ピクチャに対応したピクチャ層のデータが含まれている。
1つのピクチャは、複数のスライスから構成され、ピクチャ層のデータには、そのピクチャを構成する各スライスに対応したスライス層のデータが含まれている。また、各スライスに対応したスライス層のヘッダには、そのスライスに適用する量子化スケールを指定するデータが含まれる。
1つのスライスは、各々が16×16個の画素からなる複数のマクロブロックにより構成されている。スライス層のデータには、そのスライスを構成する各マクロブロックに対応したマクロブロック層のデータが含まれている。
ここで、PピクチャまたはBピクチャに対応したマクロブロック層のデータは、各マクロブロック毎に、当該マクロブロックのピクチャ間予測符号化のために参照された他のピクチャ内の参照画像の位置を特定する動き情報を含んでいる場合がある。
各マクロブロックに対応したマクロブロック層のデータには、そのマクロブロックを構成する各ブロックに対応したブロック層のデータが含まれている。また、マクロブロック層のヘッダには、同一スライス内の以降のマクロブロックに適用する量子化スケールを指定するデータが含まれる場合がある。
ブロックは、輝度信号Yと色差信号Cb、Crの三種類からなる。ここで、Iピクチャに対応したブロック層のデータは、各ブロック毎に、当該ブロック内の各画素値から得られた複数のDCT係数を量子化し、かつ、可変長符号化することにより得られた可変長符号化データを含んでいる。さらにPピクチャまたはBピクチャに対応したブロック層のデータは、ブロック毎に、当該ブロックとその参照画像との間の差分情報に対応したDCT係数を量子化し、かつ、可変長符号化することにより得られた可変長符号化データを含んでいる。
以上が、本実施形態に係るレート変換装置の処理対象であるMPEG−2ビットストリームの構成の詳細である。
図1は、本発明の実施の形態1におけるレート変換装置の構成を示すブロック図である。図1において、図13と同じ構成要素については同じ符号を用い、説明を一部省略する。
レート変換装置10では、入力端子100への入力ビットストリーム内のシーケンス層、GOP層、ピクチャ層、スライス層およびマクロブロック層の符号化情報の殆どを再利用する。基本的にブロック層のDCT係数の変換およびブロック層の変換に伴い修正が必要なマクロブロック層の符号の変換処理のみが行われる。
以下、レート変換装置10の動作の概要を説明する。まず、MPEG−2で圧縮符号化された画像のビットストリームを入力端子100から入力する。解析部210では、ビットストリームを解析しながら、ブロック毎に第一の量子化スケールコードQ_code1及び量子化スケールタイプQ_typeとDCT係数ブロックを抽出し、可変長復号部(VLD)110に送る。また、解析部210は、ビットストリームからDCT係数ブロック以外のデータを分離しマルチプレクサ160(MUX)に送る。
第一の量子化スケールQ_scale1は、第一の量子化スケールコードQ_code1及び量子化スケールタイプQ_typeにより特定される。量子化スケールコードは、「1」〜「31」のいずれかの値をとる。また、量子化スケールタイプの値は、線形量子化スケールの場合は「0」、非線形量子化スケールの場合は「1」である。
可変長復号部110では、DCT係数ブロックを可変長復号し、量子化されたDCT係数a[i]を生成する。ここで、iは可変長符号化時のスキャンの順番を表し、i=1、・・・、64である。可変長復号部110は、a[i]とともにQ_code1とQ_typeを逆量子化部(IQ)130に送る。ここで、可変長復号部110は、Q_code1とQ_typeの代わりに直接Q_scale1を逆量子化部130に送ってもよい。また、解析部210は、Q_code1、Q_type及びビットストリームの各種解析結果をレート制御部220に送る。
逆量子化部130では、Q_code1とQ_type より求めたQ_scale1に係数a[i]を積算して逆量子化操作を行い、b[i]を生成し、量子化部(Q)140に送る。量子化部140では逆量子化して得られた逆量子化係数b[i]を第二の量子化スケールQ_scale2で除算し、小数点以下を丸め閾値Rthで丸め、再量子化係数c[i]を生成する。ここで、小数点以下を丸め閾値Rthで丸めるとは、小数点以下の値がRth以上の場合は切り上げ、そうでない場合は、切り下げ(切り捨て)することを意味する。
また、量子化部140において量子化によりブロック内の再量子化係数が全て0となる場合には、マクロブロック中のどのブロックにDCT係数が存在するかを示すCBP(Coded Block Pattern)等を変更する必要が生じる。これを避けるため、再量子化係数が全て0となる場合には、元々非0成分のうちDCTスキャン順の最初に位置する成分をレベル絶対値1へと変換して残す処理等を行ってもよい。
また、所望のビットレートに圧縮するためにレート制御部220にて、解析部210によるビットストリームの解析結果及び可変長符号化部150の出力符号量を基に量子化スケールコード変更量Q_addとRthを決定する。Q_code1にQ_addを加えたものを第二の量子化スケールコードQ_code2とすると、Q_scale2は、Q_code2及びQ_typeにより特定される。ただし、Q_code2が「31」を超える場合は、Q_code2を「31」へと変更する。レート制御部220は、Q_code2、Q_type及びRthを量子化部140に送る。
本実施の形態では、レート制御方式としてGOP単位でのフィードバック制御を想定して説明を行うが、レート制御方式をこの方式に限るものではなく、他のレート制御方式に対して同様に適用できる。
量子化部140はc[i]とQ_code2及びQ_typeを可変長符号化部(VLC)150に送り、可変長符号化部150はc[i]を可変長符号に変換してマルチプレクサ160に送る。また可変長符号化部150はQ_code2及びQ_typeも併せてマルチプレクサ160に送る。
マルチプレクサ160では、解析部210より送られてきた分離データに対して、レート変換処理に伴い修正が必要となった部分の修正を行った後、可変長符号化部150より送られてくる可変長符号データとの多重化を行い、MPEG−2ビットストリームを出力する。修正が必要となる部分は、基本的には量子化スケールコードが示されている部分のみであるが、レート変換内容によっては、前述のCBPや他の部分の修正も必要となる。
以下、本実施の形態による再量子化パラメータ設定動作の詳細を図2のフローチャートに従って説明する。
目標ビットレートの変更が生じると以下の処理が開始される(ステップS00)。まず、圧縮符号化された画像のビットストリームが入力端子100から入力され、解析部210でビットストリームの解析が行われる(ステップS01)。ビットストリームの解析内容としては、GOP単位での可変長復号部110への入力符号量、Q_scale1、Q_type、DCT係数の各レベル絶対値の出現頻度等がある。
レート制御部220では、目標ビットレートや解析部210によるビットストリーム解析 結果等を基に再量子化パラメータであるQ_addとRthの初期値を決定する(ステップS02)。この初期値の決定方法としては、図3に示すような再量子化パラメータ設定表を参照する方法がある。図3の再量子化パラメータ設定表は、複数の入力レートと目標レートに対応する再量子化パラメータが示されており、レート制御部220は、レート変換内容が最も近い再量子化パラメータを選択する。再量子化パラメータ設定表は、複数の動画像符号化データに対して各種パラメータによるレート変換結果を求めることにより作成可能である。
また、レート制御部220は、目標ビットレートを基に、GOP単位での目標符号量を算出する。ここで、レート制御部220は目標符号量として可変長符号化部150より出力されるべき符号量を算出する。
次にステップS03では、前述のように逆量子化部130で逆量子化操作を行い逆量子化係数b[i]を生成し、量子化部140でb[i]を第二の量子化スケールQ_scale2で除算し、小数点以下を丸め閾値Rthで丸め、再量子化係数c[i]を生成し、可変長符号化部150で可変長符号に変換して符号量削減処理が行われる。
ステップS03により1GOPの符号量削減処理を行った後、レート制御部220では、目標ビットレート変更の有無を判断する(ステップS04)。
ステップS04において、目標ビットレート変更があると判断された場合には、ステップS05へと遷移し、処理を終了する(ステップS05)。そうでない場合は、ステップS06へと遷移する。
次に、レート制御部220では、可変長符号化部150より出力される符号量削減処理後の1GOPの出力符号量を確認する(ステップS06)。ここで、出力符号量確認対象は可変長符号化部150からの出力符号量に限定するものではなく、マルチプレクサ160からの出力符号量としても良い。ただし、その際には、目標出力符号量はマルチプレクサ160からの出力符号量として算出する必要がある。
1GOPの出力符号量が目標出力符号量以上の場合は、ステップS07へと遷移し、Q_addを1増加させる。ここで、元のQ_addが30の場合にはQ_addは30のままである。一方、1GOPの出力符号量が目標出力符号量より小さい場合は、Q_addを1減少させる。ここで、元のQ_addが0の場合にはQ_addは0のままである。
前述のようにQ_addを更新した後、ステップS09においてステップS01と同様に解析部210がストリーム解析を行う。
ストリームの解析結果を得たレート制御部220では、丸め閾値Rthの設定処理を行う。本実施例では、丸め閾値Rthとして「0.5」と「1」の二通りを用意し、レート制御部220はどちらを適用するかを決定する。すなわち、レート制御部220は四捨五入と切り捨てのどちらを適用するかを切り替える。
丸め閾値Rthの切替方法は、量子化スケールコードの変更量閾値Q_add_thを設け、Q_addがQ_add_th以上であればRthを1に切り替え、そうでなければRthを0.5に切り替える。
Q_add_thの最も簡単な設定方法としては、入力レートと目標レートとの対応表を用意し、参照する方法である。図4に入力レートとQ_add_thの対応表の例を示す。レート制御部220は、図4の対応表のうち入力レートが最も近いものに対応するQ_add_thを選択する。図4の対応表は、複数の動画像符号化データに対して各種パラメータによるレート変換結果を求めることにより作成可能である。
また、他のQ_add_th設定方法として、ステップS01における量子化スケールコードの出現頻度分布解析結果を利用することが可能である。例えば、制御単位(本実施の形態1ではGOP単位)での量子化スケールの平均値Q_aveを求め、量子化スケールがQ_aveの2倍以上となる量子化スケールコード変更量をQ_add_thとしてもよい。これは、以下の理由による。
第二の量子化スケールQ_scale2が第一の量子化スケールQ_scale1の2倍を超えると、レベル絶対値1の量子化後DCT係数は量子化スケール変更後に絶対値が0.5より小さくなり、丸め閾値Rthに関わらずレベル0となる。Rthを1ではなく0.5とする主な目的は、Q_addを1としただけでレベル絶対値1の量子化後DCT係数の全てがレベル0となることによる符号量の急激な削減防ぐことにある。したがって、Q_addがQ_add_thを超えると、Rthを0.5と設定する利点がなくなり、Rthを1と設定する方が画質劣化を抑えながら符号量を削減する上で効果的である。
なお、本発明の実施の形態1では前述のようにレート制御方式としてGOP単位でのフィードバック制御を想定して説明を行ったが、マクロブロック単位でのフィードバック制御を行う場合には、Q_aveを処理対象マクロブロック毎のQ_scale1として、前述の処理を行うことも可能である。
さらに、他のQ_add_th設定方法としては、ステップS01におけるレベルの出現頻度分布解析結果を利用することも可能である。例えば、全ての非0の係数のうちレベル絶対値1の係数の出現割合とQ_add_thの対応表を用意し、参照する。レート制御部220は、図5の対応表においてレベル絶対値1の係数の出現割合が最も近いものに対応するQ_add_thを選択する。図5の対応表は、複数の動画像符号化データに対して各種パラメータによるレート変換結果を求めることにより作成可能である。レベル絶対値1の係数の出現割合が高ければ高いほど、Rthを1と設定した際には符号量の急激な削減が起きやすいため、Q_add_thは大きく設定されることになる。
再量子化パラメータが設定された後、ステップS03へと遷移し、目標レートの変更要求が発生するまで以上のステップを繰り返す。
かかる構成によれば再量子化時の除算における小数点以下の値の取り扱い方をストリーム解析結果等に応じて適応的に変更可能とすることにより、目標ビットレートが高い場合は符号量制御性に優れた四捨五入が適用され、目標ビットレートが低い場合は、画質劣化を抑えた符号量削減に優れた切り捨てが適用される。したがって、符号量制御性、符号削減量および画質において優れたレート変換装置が提供される。
なお、DCT係数の中から所定の個数の係数(主に高周波成分)を捨てることにより符号量を削減する方法があり、前述の再量子化による符号量削減方法と組み合わせることが可能である。例えば、前記ステップS07においてQ_addが30の場合は、これ以上符号量を削減できないが、DCT係数を強制的に破棄することにより更なる符号量の削減が可能である。
(実施の形態2)
本発明の実施の形態2は、再量子化パラメータ設定動作において、実施の形態1と相違するものである。したがって、レート変換装置の動作概要の説明は省略する。図6は、本発明の実施の形態2における再量子化パラメータ設定動作の詳細を示すフローチャートを示す。図6において、図2と同じ構成要素については同じ符号を用い、説明を省略する。
以下では、再量子化パラメータ設定動作の詳細を図6に従って説明する。また、丸め閾値Rthは、「0.5」、「0.75」、「0.8125」、「0.875」、「1.0」の5段階のいずれかの値をとるものとして説明する。ただし、丸め閾値Rthの取り得る値はこれに限るものではない。
ステップS00からステップS06までの動作は、実施の形態1で述べたとおりである。ステップS06において、出力符号量が目標出力符号量以上の場合は、ステップS11へと遷移し、そうでない場合はステップS12へと遷移する。
ステップS11では、丸め閾値Rthが1であるかどうか判断し、Rthが1であればQ_addを1増加させ(ステップ13)、Rthが1より小さければRthを一段階増加させる(ステップS14)ことにより符号削減量を増やす。ただし、元のQ_addが30の場合にはQ_addは増加させない。
一方、ステップS12では、量子化スケールコード変更量Q_addが1以下であるかどうか判断し、Q_addが1以下であれば、Rthを一段階減少させ(ステップS15)、そうでなければQ_addを1減少させる(ステップS16)ことにより、符号削減量を減らす。ただし、Rthが0.5の場合は、Rthは減少させずQ_addを0とする。
以上の処理を行った後にステップS10においてストリームの解析を行い、ステップS03へと遷移する。以降は、目標レート変更要求が発生するまで前述のステップを繰り返す。
かかる構成によれば、Q_addが1を超える場合は画質劣化を抑えた符号量削減に適した切り捨てが適用され、Q_addが1であれば符号量制御性に優れた丸め閾値の変更が適用される。
したがって、切り捨て適用時に問題であったQ_addを1とすることによる符号量の急激な削減を避けられ、符号量制御性、符号削減量および画質において優れたレート変換装置が提供される。
図7に前記画像テストシーケンス”Mobile&Calendar”に対して実施の形態2における各再量子化パラメータセットによりレート変換した際の、レート変化の様子を示す。図7より、再量子化パラメータセット変更に応じてレートが段階的に変化することがわかる。
なお、本発明の実施の形態2ではQ_addが1の時にのみ丸め閾値Rthの変更を行うものとして説明を行ったが、丸め閾値Rthの変更はこれに限るものではない。例えば、丸め閾値Rthの変更のための量子化スケールコード変更量閾値を複数設け、該閾値に応じてRthを切り替えることにより更に柔軟な符号量制御も可能である。
(実施の形態3)
本発明の実施の形態3は、再量子化パラメータ設定動作において、実施の形態1と相違するものである。実施の形態3では量子化スケール変更の代わりに量子化テーブル変更を行い、符号量を削減する。
図1のブロック図を用いて実施の形態3におけるレート変換装置の動作概要を説明する。まず、MPEG−2で圧縮符号化された画像のビットストリームを入力端子100から入力する。
解析部210では、ビットストリームを解析しながら、ブロック毎に第一の量子化テーブルQ_table1[i]及びDCT係数ブロックを抽出し、可変長復号部(VLD)110に送る。また、解析部210は、ビットストリームからDCT係数ブロック以外のデータを分離しマルチプレクサ160(MUX)に送る。
可変長復号部110では、DCT係数ブロックを可変長復号し、量子化されたDCT係数a[i]を生成する。ここで、iは可変長符号化時のスキャンの順番を表し、i=1、・・・、64である。スキャン方法には、ジグザグスキャンとオルタネートスキャンの二つがあり、スキャンの順番が異なる。以下では、iはジグザグスキャンの順番を表すものとして説明するが、これに限定するものではない。
また、第一の量子化テーブルQ_table1[i]はビットストリーム中のシーケンス層のヘッダ部、またはピクチャ層のヘッダ部に含まれ、切り替えることができる。いずれにも量子化テーブルのデータが含まれない場合はデフォルトの量子化テーブルを使用する。量子化テーブルにはイントラブロック用と非イントラブロック用の二種類が存在し、さらに輝度信号と色差信号によっても使い分けられる場合がある。
可変長復号部110は、Q_table1[i]とa[i]を逆量子化部(IQ)130に送る。また、解析部210は、Q_table1[i]及びビットストリームの各種解析結果をレート制御部220に送る。
逆量子化部130では係数a[i]にQ_table1[i]を積算して逆量子化操作を行い、b[i]を生成し、量子化部(Q)140に送る。量子化部140では逆量子化して得られた逆量子化係数b[i]を第二の量子化テーブルQ_table2[i]で除算し、小数点以下を丸め閾値Rthで丸め、再量子化係数c[i]を生成する。
量子化部140はc[i]とQ_table2[i]を可変長符号化部(VLC)150に送り、可変長符号に変換してマルチプレクサ(MUX)160に送る。マルチプレクサ160では、解析部210より送られてきた分離データに対して、レート変換処理に伴い修正が必要となった部分の修正を行った後、可変長符号化部150より送られてくる可変長符号データとの多重化を行い、MPEG−2ビットストリームを出力する。
また、量子化部140において量子化によりブロック内の再量子化係数が全て0となる場合には、マクロブロック中のどのブロックにDCT係数が存在するかを示すCBP等を変更する必要が生じる。これを避けるため、再量子化係数が全て0となる場合には、元々非0成分のうちDCTスキャン順の最初に位置する成分のレベル絶対値を1へと変換して残す処理を行ってもよい。
なお、所望のビットレートに圧縮するためにレート制御部220にて、ビットストリームの解析結果、可変長復号部110への入力符号量(入力ビット数)及び可変長符号化部150の出力符号量を基に量子化テーブル変更パラメータα、βとRthを決定する。
ここで、Q_table1[i]に(α×i+β)を積算したものを第二の量子化テーブルQ_table2[i]とする。量子化テーブルの変更量の増減方法は、例えば、βを1.0で固定し、αを0.01単位で増減させることにより行う。ただし、量子化テーブル変更方法はこれに限定するものではない。
本実施の形態では、レート制御方式としてGOP単位でのフィードバック制御を想定して説明を行うが、レート制御方式をこの方式に限るものではなく、他のレート制御方式に対して同様に適用できる。
図8は、本発明の実施の形態3における再量子化パラメータ設定動作の詳細を示すフローチャートを示す。図8において、図2と同じ構成要素については同じ符号を用い、説明を省略する。
以下では、再量子化パラメータ設定動作の詳細を図8に従って説明する。ステップS00からステップS06までの動作は、実施の形態1で述べた通りである。ただし、ステップS02の初期値設定では、図9に示すような再量子化パラメータ初期設定表を用いる。
ステップS06において1GOPの出力符号量が目標出力符号量以上の場合は、ステップS17へと遷移し、量子化テーブルの変更量を増加させる。一方、1GOPの出力符号量が目標出力符号量より小さい場合は、ステップS18へと遷移し量子化テーブルの変更量を減少させる。
ストリームの解析結果を得たレート制御部220では、丸め閾値Rthの設定処理を行う。本実施の形態3では、丸め閾値Rthとして「0.5」と「1」の二通りを用意し、レート制御部220はどちらを適用するかを決定する。すなわち、レート制御部220は四捨五入と切り捨てのどちらを適用するかを切り替える。
丸め閾値Rthの切替方法は、パラメータαの変更量閾値αthを設け、αがαth以上であればRthを1に切り替え、そうでなければRthを0.5に切り替える。
αthの簡単な設定方法は、入力レートとの対応表を用意し、参照する方法である。図10に入力レートとαthの対応表の例を示す。レート制御部220は、図10の対応表のうちレート変換内容が最も近いものに対応するαthを選択する。図10の対応表は、複数の動画像符号化データに対して各種パラメータによるレート変換結果を求めることにより作成可能である。
なお、αthの設定は、実施の形態1におけるQ_add_thの設定と同様にしてストリーム解析結果を利用しても良い。
かかる構成によれば符号量削減を量子化テーブルの変更により行う場合において再量子化時の除算における小数点以下の値の取り扱い方を適応的に変更可能となり、目標ビットレートが高い場合は符号量制御性に優れた四捨五入が適用され、目標ビットレートが低い場合は、画質劣化を抑えた符号量削減に適した切り捨てが適用される。したがって、符号量制御性、符号削減量および画質において優れたレート変換装置が提供される。
(実施の形態4)
本発明の実施の形態4は、逆量子化及び量子化の処理において、実施の形態1、2及び3と相違するものである。図11は、本発明の実施の形態4におけるレート変換装置の構成を示すブロック図である。図11において、図1と同じ構成要素については同じ符号を用い、説明を省略する。
本実施の形態4のレート変換装置10は、逆量子化部130と量子化部140を1つにまとめた量子化画像データ変換部330を備える。すなわち、量子化画像データ変換部330は係数a[i]に対して演算を行い、小数点以下の数値を丸め閾値Rthにて丸めて直接c[i]を生成する。
量子化スケールコード変更によるレート変換の場合は、量子化画像データ変換部330は係数a[i]に(Q_scale1÷Q_scale2)を積算し、小数点以下の数値を丸め閾値Rthにて丸めて直接c[i]を生成する。
また、量子化テーブル変更によるレート変換の場合は、量子化画像データ変換部330は係数a[i]に(Q_table1[i]÷Q_table2[i])を積算し、小数点以下の数値を丸め閾値Rthにて丸めて直接c[i]を生成する。
かかる構成によれば逆量子化・量子化処理が簡素化されるが、実施の形態1、2及び3とレート変換結果は同様となり、符号量制御性、符号削減量および画質において優れたレート変換装置が提供される。
(実施の形態5)
本発明の実施の形態4は、ステップS03の符号量削減処理においてブロックの種類等に応じて丸め閾値Rthを変更する点で実施の形態1、2、3及び4と相違するものである。
図12はブロックの種類に応じた丸め閾値設定動作の詳細を示すフローチャートであり、以下では図12に従って説明する。
各ブロックごとに丸め閾値設定処理が開始され(ステップS20)、まず解析部210によるストリーム解析結果に基づき、現在対象となっているブロックのピクチャタイプをレート制御部220で判断する(ステップS21)。
ステップS21においてピクチャタイプが、Iピクチャであると判断された場合にはRthを一段階減少させ(ステップS22)、ステップS23へと遷移する。これは、Iピクチャは最も重要なピクチャであることからRthを一段階減少させ、符号削減量を抑えるためである。
ステップS21においてピクチャタイプが、Pピクチャであると判断された場合にはステップS24へと遷移する。また、ステップS21においてピクチャタイプが、Bピクチャであると判断された場合にはRthを一段階増加させ(ステップS25)、ステップS24へと遷移する。
以上の処理により、ピクチャ毎の重み付けが行われ、ピクチャ毎の重み付けをしない場合と比較して画質が改善する。また、ピクチャ毎の重み付け方はこれに限るものではない。
ここで、ステップS21においてピクチャタイプがIピクチャであると判断されるとステップS24への遷移は行われないが、これはIピクチャが予測符号化を行わず動きベクトルを持たないためである。
次にステップS24において、対象であるブロックを含むマクロブロックの動きベクトルの大きさが設定した閾値を超えるかどうかをレート制御部220で判断する。動きベクトルの大きさは、解析部210によるストリーム解析結果より得られる。閾値は縦方向成分と横方向成分の二種類があり、いずれか一方を超えるかどうかの判断を行うものとする。ただし、該閾値は事前にシミュレーション等を通じて最適な値を求める必要がある。
ステップS24において、動きベクトルの大きさが閾値を超えると判断されるとステップS23へと遷移する。一方、ステップS24において、動きベクトルの大きさが閾値以下であると判断されると、Rthを一段階増加させ(ステップS26)、ステップS23へと遷移する。
以上の処理により、各マクロブロックに重み付けが行われる。動きベクトルが大きいマクロブロックは、視覚的に注目を受けやすく重要であることから符号量の削減を抑え、そうでない場合には符号量を多く削減することによりマクロブロック毎の重み付けをしない場合と比較して画質が改善する。また、動きベクトルの大きさに応じたマクロブロックごとの重み付け方はこれに限るものではない。
次にステップS23において、対象であるブロックが輝度成分Y、色差成分Cb、Crのいずれであるかを解析部210によるストリーム解析結果を基に、レート制御部220で判断する。
ステップS23において、ブロックが輝度成分Yであると判断されるとステップ18へ遷移し、丸め閾値Rthの設定は終了する。
また、ステップS23において、ブロックが色差成分Cb、Crであると判断されるとRthを一段階増加させ(ステップS27)、ステップS28へと遷移し丸め閾値Rthの設定は終了する。
以上の処理により人間の視覚上最も重要である輝度成分Yに対しては符号量の削減を抑え、色差成分Cb、Crに対しては符号量を多く削減することにより各成分に重み付けをしない場合と比較して画質が改善する。また、各成分の重み付け方はこれに限るものではない。
レート制御部220は以上のようにして設定した丸め閾値Rth及び量子化パラメータを量子化部140もしくは量子化画像データ変換部330に送り、制御を行う。
なお、本実施の形態5ではピクチャタイプ、動きベクトルの大きさ、色成分毎の重み付けを組み合わせて行っているが、各重み付けを単独で行っても良い。
さらに、DCT係数の周波数に応じてさらにRthを変更することにより、各周波数成分に重み付けが可能である。例えば、DCT係数スキャン位置iに閾値ithを設け、ith以下の重要である低周波成分に対してはRthを減少させ符号量の削減を抑え、ithを超える高周波成分に対してはRthを増加させ符号量を多く削減することにより各周波数成分に重み付けをしない場合と比較して画質が改善する。また、各周波数成分の重み付け方はこれに限るものではない。
かかる構成によれば、ピクチャタイプ、動きベクトルの大きさ、色成分、周波数成分毎に重み付けが可能となり、各重み付け行わない場合と比較して画質の改善が期待できる。それゆえ、符号削減量および画質においてより優れたレート変換装置が提供される。
本発明にかかるレート変換方法及びレート変換装置は、構成が簡素であり、レート変換による遅延が小さい特徴を有し、通信路状況に応じて動画像符号化データのレートをリアルタイムで制御可能なAVCサーバ等として有用である。
本発明の実施の形態1、2及び3におけるレート変換装置の構成を示すブロック図 本発明の実施の形態1における再量子化パラメータ設定動作の詳細を示すフローチャート 本発明の実施の形態1における再量子化パラメータ初期設定表の例を示す図 本発明の実施の形態1における入力レートとQ_add_thの対応表の例を示す図 本発明の実施の形態1におけるレベル絶対値1の係数の出現割合とQ_add_thの対応表の例を示す図 本発明の実施の形態2における再量子化パラメータ設定動作の詳細を示すフローチャート 本発明の実施の形態2における再量子化パラメータセットとレート変化の関係を表すグラフ 本発明の実施の形態3における再量子化パラメータ設定動作の詳細を示すフローチャート 本発明の実施の形態3における再量子化パラメータ初期設定表の例を示す図 本発明の実施の形態3における入力レートとαthの対応表の例を示す図 本発明の実施の形態4におけるレート変換装置の構成を示すブロック図 本発明の実施の形態5における丸め閾値Rth設定動作の詳細を示すフローチャート 従来のレート変換装置の概略構成を示すブロック図 量子化時の除算において切り捨てを適用した際の量子化スケールコード変更量とレート変化の関係を表すグラフ例を示す図 量子化時の除算において四捨五入を適用した際の量子化スケールコード変更量とレート変化の関係を表すグラフ例を示す図 画像テストシーケンスのDCT係数の各レベル絶対値出現頻度を表すグラフ 量子化時の除算において切り捨て及び四捨五入を適用した際のSNRの比較結果を示す図
符号の説明
10 レート変換装置
100 入力端子
110 可変長復号部
120 レート制御部
130 逆量子化部
140 量子化部
150 可変長符号化部)
160 マルチプレクサ
170 出力端子
210 解析部
220 レート制御部
330 量子化画像データ変換部

Claims (26)

  1. 複数の画面から構成される動画像を圧縮符号化した第一画像符号化データから、直交変換ブロック毎に第一量子化画像データを順次可変長復号する可変長復号ステップと、
    前記第一画像符号化データを解析し、前記直交変換ブロックに対応する第一量子化パラメータを含む画像解析情報を抽出する解析ステップと、
    前記直交変換ブロック毎に前記第一量子化パラメータを用いて、前記第一量子化画像データを量子化前の逆量子化画像データに戻す逆量子化ステップと、
    前記逆量子化画像データを、第二量子化パラメータを用いて量子化し、第二量子化画像データを生成する再量子化ステップと、
    前記第二量子化画像データを順次可変長符号化し可変長符号化画像データを作成する可変長符号化ステップと、
    前記第一画像符号化データを前記第二量子化パラメータ及び前記可変長符号化画像データに基づき第二画像符号化データに変換する画像符号化データ変換ステップと、
    前記第二画像符号化データの符号量を制御するために、前記第二量子化パラメータを設定するとともに、前記再量子化ステップにおける演算結果の小数点以下の数値に対する丸め閾値を前記画像解析情報に基づき設定する再量子化パラメータ設定ステップを備えたことを特徴とするレート変換方法。
  2. 複数の画面から構成される動画像を圧縮符号化した第一画像符号化データから、直交変換ブロック毎に第一量子化画像データを順次可変長復号する可変長復号ステップと、
    前記第一画像符号化データを解析し、前記直交変換ブロックに対応する第一量子化パラメータを含む画像解析情報を抽出する解析ステップと、
    前記直交変換ブロック毎に前記第一量子化パラメータ及び第二量子化パラメータの比率を用いて、前記第一量子化画像データを第二量子化画像データへと変換する量子化画像データ変換ステップと、
    第二量子化画像データを順次可変長符号化し可変長符号化画像データを作成する可変長符号化ステップと、
    前記第一画像符号化データを前記第二量子化パラメータ及び前記可変長符号化画像データに基づき第二画像符号化データに変換する画像符号化データ変換ステップと、
    前記第二画像符号化データの符号量を制御するために、前記第二量子化パラメータを設定するとともに、前記量子化画像データ変換ステップにおける演算結果の小数点以下の数値に対する丸め閾値を前記画像解析情報に基づき設定する再量子化パラメータ設定ステップを備えたことを特徴とするレート変換方法。
  3. 前記再量子化パラメータ設定ステップは、前記第一量子化パラメータから前記第二量子化パラメータへの量子化パラメータ変更量が閾値以上の場合は、前記再量子化ステップまたは量子化画像データ変換ステップの演算過程において丸め閾値を大きく設定し、
    前記量子化パラメータ変更量が閾値を超えない場合は丸め閾値を小さく設定することを特徴とする請求項1または2に記載のレート変換方法。
  4. 前記再量子化パラメータ設定ステップは、前記第一量子化パラメータから前記第二量子化パラメータへの量子化パラメータ変更量が閾値以上の場合は前記再量子化ステップまたは量子化画像データ変換ステップの演算過程において小数点以下の数値に対して四捨五入を適用し、
    前記量子化パラメータ変更量が閾値を超えない場合は小数点以下の数値に対して切り捨てを適用することを特徴とする請求項1または2に記載のレート変換方法。
  5. 前記再量子化パラメータ設定ステップは、前記解析ステップによる第一画像符号化データの直交変換係数分布解析結果に基づき、量子化パラメータ変更量閾値を決定することを特徴とする請求項3または4に記載のレート変換方法。
  6. 前記再量子化ステップまたは量子化画像データ変換ステップの演算過程において、周波数成分の閾値を設け、閾値以下の低周波成分の丸め閾値は小さくし、閾値を超える高周波成分の丸め閾値は大きくすることを特徴とする請求項1〜4いずれかに記載のレート変換方法。
  7. 前記解析ステップは、直交変換ブロックの種類を解析し、前記再量子化ステップまたは量子化画像データ変換ステップの演算過程において、輝度信号及び色差信号ブロックごとに丸め閾値を変更することを特徴とする請求項1〜4いずれかに記載のレート変換方法。
  8. 前記解析ステップは、画面の種類を解析し、前記再量子化ステップまたは量子化画像データ変換ステップの演算過程において、前記画面の種類に応じて丸め閾値を変更することを特徴とする請求項1〜4に記載のレート変換方法。
  9. 前記解析ステップは、連続する画面間のずれ量を解析し、前記再量子化ステップまたは量子化画像データ変換ステップの演算過程において、前記連続する画面間のずれ量に応じて丸め閾値を変更することを特徴とする請求項1〜4いずれかに記載のレート変換方法。
  10. 前記再量子化パラメータ設定ステップによって設定される量子化パラメータは、直交変換係数ごとの量子化の荒さを示す量子化テーブルであることを特徴とする請求項1〜4いずれかに記載のレート変換方法。
  11. 前記再量子化パラメータ設定ステップによって設定される量子化パラメータは直交変換対象領域の量子化の荒さを示す量子化スケールコードであることを特徴とする請求項1〜4いずれかに記載のレート変換方法。
  12. 前記再量子化パラメータ設定ステップは、前記解析ステップによる第一画像符号化データの量子化スケールコード分布解析結果に基づき、量子化スケールコード変更量閾値を決定し、
    量子化スケールコード変更量が量子化スケールコード変更量閾値以上の場合は前記再量子化ステップまたは量子化画像データ変換ステップの演算過程において小数点以下の数値に対して切り捨てを適用し、
    量子化スケールコード変更量が量子化スケールコード変更量閾値を超えない場合は小数点以下の数値に対して四捨五入を適用することを特徴とする請求項11に記載のレート変換方法。
  13. 前記再量子化パラメータ設定手段は、量子化スケールコード変更量が2を超える場合は前記再量子化手段の演算過程において小数点以下の数値に対して切り捨てのみを適用し、
    量子化スケールコード変更量が1の場合には複数の丸め閾値を用意し、符号量制御内容に応じて前記丸め閾値のいずれかを選択し、小数点以下の数値に対して適用することを特徴とする請求項11に記載のレート変換方法。
  14. 複数の画面から構成される動画像を圧縮符号化した第一画像符号化データから、直交変換ブロック毎に第一量子化画像データを順次可変長復号する可変長復号手段と、
    前記第一画像符号化データを解析し、前記直交変換ブロックに対応する第一量子化パラメータを含む画像解析情報を抽出する解析手段と、
    前記直交変換ブロック毎に前記第一量子化パラメータを用いて、前記第一量子化画像データを量子化前の逆量子化画像データに戻す逆量子化手段と、
    前記逆量子化画像データを、第二量子化パラメータを用いて量子化し、第二量子化画像データを生成する再量子化手段と、
    前記第二量子化画像データを順次可変長符号化し可変長符号化画像データを作成する可変長符号化手段と、
    前記第一画像符号化データを前記第二量子化パラメータ及び前記可変長符号化画像データに基づき第二画像符号化データに変換する画像符号化データ変換手段と、
    前記第二画像符号化データの符号量を制御するために、前記第二量子化パラメータを設定するとともに、前記再量子化手段における演算結果の小数点以下の数値に対する丸め閾値を前記画像解析情報に基づき設定する再量子化パラメータ設定手段を備えたことを特徴とするレート変換装置。
  15. 複数の画面から構成される動画像を圧縮符号化した第一画像符号化データから、直交変換ブロック毎に第一量子化画像データを順次可変長復号する可変長復号手段と、
    前記第一画像符号化データを解析し、前記直交変換ブロックに対応する第一量子化パラメータを含む画像解析情報を抽出する解析手段と、
    前記直交変換ブロック毎に前記第一量子化パラメータ及び第二量子化パラメータの比率を用いて、前記第一量子化画像データを第二量子化画像データへと変換する量子化画像データ変換手段と、
    第二量子化画像データを順次可変長符号化し可変長符号化画像データを作成する可変長符号化手段と、
    前記第一画像符号化データを前記第二量子化パラメータ及び前記可変長符号化画像データに基づき第二画像符号化データに変換する画像符号化データ変換手段と、
    前記第二画像符号化データの符号量を制御するために、前記第二量子化パラメータを設定するとともに、前記量子化画像データ変換手段における演算結果の小数点以下の数値に対する丸め閾値を前記画像解析情報に基づき設定する再量子化パラメータ設定手段を備えたことを特徴とするレート変換装置。
  16. 前記再量子化パラメータ設定手段は、前記第一量子化パラメータから前記第二量子化パラメータへの量子化パラメータ変更量が閾値以上の場合は前記再量子化手段または量子化画像データ変換手段の演算過程において丸め閾値を大きく設定し、
    前記量子化パラメータ変更量が閾値を超えない場合は丸め閾値を小さく設定することを特徴とする請求項14または15に記載のレート変換装置。
  17. 前記再量子化パラメータ設定手段は、前記第一量子化パラメータから前記第二量子化パラメータへの量子化パラメータ変更量が閾値以上の場合は前記再量子化手段または量子化画像データ変換手段の演算過程において小数点以下の数値に対して四捨五入を適用し、
    前記量子化パラメータ変更量が閾値を超えない場合は小数点以下の数値に対して切り捨てを適用することを特徴とする請求項14または15に記載のレート変換装置。
  18. 前記再量子化パラメータ設定手段は、前記解析手段による第一画像符号化データの直交変換係数分布解析結果に基づき、量子化パラメータ変更量閾値を決定することを特徴とする請求項16または17に記載のレート変換装置。
  19. 前記再量子化手段または量子化画像データ変換手段の演算過程において、低周波成分の丸め閾値は小さくし、高周波成分の丸め閾値は大きくすることにより画質を改善することを特徴とする請求項14〜17いずれかに記載のレート変換装置。
  20. 前記解析手段は、直交変換ブロックの種類を解析し、前記再量子化手段または量子化画像データ変換手段の演算過程において、輝度信号及び色差信号ブロックごとに丸め閾値を変更することにより画質を改善することを特徴とする請求項14〜17いずれかに記載のレート変換装置。
  21. 前記解析手段は、画面の種類を解析し、前記再量子化手段または量子化画像データ変換手段の演算過程において、前記画面の種類に応じて丸め閾値を変更することを特徴とする請求項14〜17いずれかに記載のレート変換装置。
  22. 前記解析手段は、連続する画面間のずれ量を解析し、前記再量子化手段または量子化画像データ変換手段の演算過程において、前記連続する画面間のずれ量に応じて丸め閾値を変更することを特徴とする請求項14〜17いずれかに記載のレート変換装置。
  23. 前記再量子化パラメータ設定手段によって設定される量子化パラメータは、直交変換係数ごとの量子化の荒さを示す量子化テーブルであることを特徴とする請求項14〜17いずれかに記載のレート変換装置。
  24. 前記再量子化パラメータ設定手段によって設定される量子化パラメータは直交変換対象領域の量子化の荒さを示す量子化スケールコードであることを特徴とする請求項14〜17いずれかに記載のレート変換装置。
  25. 前記再量子化パラメータ設定手段は、前記解析手段による第一画像符号化データの量子化スケールコード分布解析結果に基づき、量子化スケールコード変更量閾値を決定し、
    量子化スケールコード変更量が量子化スケールコード変更量閾値以上の場合は前記再量子化手段または量子化画像データ変換手段の演算過程において小数点以下の数値に対して切り捨てを適用し、
    量子化スケールコード変更量が量子化スケールコード変更量閾値を超えない場合は小数点以下の数値に対して四捨五入を適用することを特徴とする請求項24に記載のレート変換装置。
  26. 前記再量子化パラメータ設定手段は、量子化スケールコード変更量が2を超える場合は前記再量子化手段または量子化画像データ変換手段の演算過程において小数点以下の数値に対して切り捨てのみを適用し、
    量子化スケールコード変更量が1の場合には複数の丸め閾値を用意し、符号量制御内容に応じて前記丸め閾値のいずれかを選択し、小数点以下の数値に対して適用することを特徴とする請求項24に記載のレート変換装置。
JP2005000363A 2005-01-05 2005-01-05 レート変換方法及びレート変換装置 Pending JP2006191253A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005000363A JP2006191253A (ja) 2005-01-05 2005-01-05 レート変換方法及びレート変換装置
US11/321,445 US20060171460A1 (en) 2005-01-05 2005-12-29 Image conversion apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005000363A JP2006191253A (ja) 2005-01-05 2005-01-05 レート変換方法及びレート変換装置

Publications (1)

Publication Number Publication Date
JP2006191253A true JP2006191253A (ja) 2006-07-20

Family

ID=36756522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005000363A Pending JP2006191253A (ja) 2005-01-05 2005-01-05 レート変換方法及びレート変換装置

Country Status (2)

Country Link
US (1) US20060171460A1 (ja)
JP (1) JP2006191253A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008117541A1 (ja) * 2007-03-28 2008-10-02 Panasonic Corporation 符号化レート変換装置および符号化レート変換方法
WO2010073746A1 (ja) * 2008-12-25 2010-07-01 株式会社メガチップス トランスコーダ

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7974193B2 (en) 2005-04-08 2011-07-05 Qualcomm Incorporated Methods and systems for resizing multimedia content based on quality and rate information
US7262719B2 (en) * 2006-01-30 2007-08-28 International Business Machines Corporation Fast data stream decoding using apriori information
US8582905B2 (en) * 2006-01-31 2013-11-12 Qualcomm Incorporated Methods and systems for rate control within an encoding device
US20070201388A1 (en) * 2006-01-31 2007-08-30 Qualcomm Incorporated Methods and systems for resizing multimedia content based on quality and rate information
JP4569840B2 (ja) * 2007-09-12 2010-10-27 ソニー株式会社 画像符号化装置、画像符号化方法
JPWO2009050897A1 (ja) * 2007-10-19 2011-02-24 パナソニック株式会社 符号化レート変換装置、符号化レート変換方法および集積回路
JP4963680B2 (ja) * 2008-03-27 2012-06-27 株式会社メガチップス 画像処理装置
CN101779468B (zh) * 2008-06-27 2012-07-04 索尼公司 图像处理装置和图像处理方法
BRPI0904324A2 (pt) * 2008-06-27 2015-06-30 Sony Corp Dispositivo de processamento de imagem, e, método de processamento de imagem
RU2479935C2 (ru) * 2008-06-27 2013-04-20 Сони Корпорейшн Устройство для обработки изображения и способ обработки изображения
JP5136470B2 (ja) * 2009-03-06 2013-02-06 富士通株式会社 動画像符号化装置及び動画像符号化方法
JP5624576B2 (ja) * 2012-03-14 2014-11-12 株式会社東芝 画像圧縮コントローラ及び画像圧縮装置
US9628808B2 (en) * 2013-03-26 2017-04-18 Dolby Laboratories Licensing Corporation Encoding perceptually-quantized video content in multi-layer VDR coding
JP6652126B2 (ja) * 2015-03-13 2020-02-19 ソニー株式会社 画像処理装置および方法
JP2019050451A (ja) * 2017-09-07 2019-03-28 キヤノン株式会社 画像処理装置及びその制御方法及びプログラム及び画像処理システム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1067798A3 (en) * 1999-06-30 2005-11-30 Media Glue Corporation Apparatus, method and computer program product for transcoding a coded moving picture sequence
JP2003018599A (ja) * 2001-07-04 2003-01-17 Matsushita Electric Ind Co Ltd 画像符号化装置および方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008117541A1 (ja) * 2007-03-28 2008-10-02 Panasonic Corporation 符号化レート変換装置および符号化レート変換方法
WO2010073746A1 (ja) * 2008-12-25 2010-07-01 株式会社メガチップス トランスコーダ

Also Published As

Publication number Publication date
US20060171460A1 (en) 2006-08-03

Similar Documents

Publication Publication Date Title
EP1497990B1 (en) Method and device for indicating quantizer parameters in a video coding system
KR100934290B1 (ko) 엠피이지-2 4:2:2-프로파일 비트스트림을 메인-프로파일비트스트림으로 컨버팅 하기 위한 방법 및 아키텍처
US7620103B2 (en) Programmable quantization dead zone and threshold for standard-based H.264 and/or VC1 video encoding
JP4617644B2 (ja) 符号化装置及び方法
US6658157B1 (en) Method and apparatus for converting image information
US7957600B2 (en) Methods and systems for rate-distortion optimized quantization of transform blocks in block transform video coding
US8396311B2 (en) Image encoding apparatus, image encoding method, and image encoding program
EP1195993A2 (en) Transcoding of video signal
EP1833256B1 (en) Selection of encoded data, setting of encoded data, creation of recoded data, and recoding method and device
US20060171460A1 (en) Image conversion apparatus
JPWO2010001999A1 (ja) 動画像符号化/復号化方法及び装置
EP1143737A2 (en) Image encoding apparatus and method, video camera, image recording apparatus, and image transmission apparatus
EP1407615A1 (en) Method and device for generating a scalable coded video signal from a non-scalable coded video signal
JP2001145113A (ja) 画像情報変換装置及び方法
KR20010071689A (ko) 화소값을 변경하기 위한 이미지 프로세싱 회로 및 방법
WO2010137322A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法、および画像復号方法
KR100229796B1 (ko) 열화영상에 대한 보상기능을 갖는 영상 복호화 시스템
JPH09322176A (ja) 符号化モード選択方法、動画像符号化装置、符号化方法、記録方法、及び伝送方法
JP2006295449A (ja) レート変換方法及びレート変換装置
JP2010538575A (ja) 代替え的エントロピー符号化方法
JP2004194076A (ja) 画像処理装置およびその方法と符号化装置
JP4292659B2 (ja) 画像情報変換装置及び画像情報変換方法
JP2006060836A (ja) 画像符号のトランスコーダ及び画像符号のトランスコーディング方法
JP4292658B2 (ja) 画像情報変換装置及び画像情報変換方法
KR20150102874A (ko) 적응적 부호화 방법을 이용한 영상의 부호화 방법 및 이를 이용한 인코딩 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071210

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091104

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20091120

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100309