JP4709074B2 - 動画像符号化方法,装置,そのプログラムおよびそのプログラムを記録した記録媒体 - Google Patents

動画像符号化方法,装置,そのプログラムおよびそのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP4709074B2
JP4709074B2 JP2006160390A JP2006160390A JP4709074B2 JP 4709074 B2 JP4709074 B2 JP 4709074B2 JP 2006160390 A JP2006160390 A JP 2006160390A JP 2006160390 A JP2006160390 A JP 2006160390A JP 4709074 B2 JP4709074 B2 JP 4709074B2
Authority
JP
Japan
Prior art keywords
prediction mode
sensitivity
prediction
visual
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006160390A
Other languages
English (en)
Other versions
JP2007329780A (ja
Inventor
幸浩 坂東
一人 上倉
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006160390A priority Critical patent/JP4709074B2/ja
Publication of JP2007329780A publication Critical patent/JP2007329780A/ja
Application granted granted Critical
Publication of JP4709074B2 publication Critical patent/JP4709074B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は,高能率画像信号符号化技術に関し,特に,視覚感度を考慮した動画像符号化方法に関するものである。
H.264では,イントラ予測および可変形状動き補償の導入に伴い,従来の標準化方式と比べて,予測モードの種類が増加している。このため,一定の主観画質を保持しつつ,符号量を削減するには,適切な予測モードを選択する必要がある。H.264の参照ソフトウェアJM[非特許文献1]では,以下のR−Dコストを最小化する予測モードを選択している。
Figure 0004709074
ここで,Sは原信号,qは量子化パラメータ,mは予測モードを表す番号であり,^Sm,q はSに対してモードmを用いて予測し,qを用いて量子化した場合の復号信号である。また,λはモード選択に用いるラグランジェの未定乗数である。さらに,D(S,^Sm,q )は次式に示す二乗誤差和である。
Figure 0004709074
ここで,SY ,SU ,SV は原信号のY,U,V成分であり,^Sm,q Y ,^Sm,q U ,^Sm,q V は復号信号のY,U,V成分である。
H.264における復号信号の算出を以下に示す。なお,説明に用いる記号を表1にまとめる。
Figure 0004709074
H.264の符号化処理では,モード番号mの予測を用いた場合の予測誤差信号R(=S−Pm )に対して,変換行列Φを用いた直交変換が次式のように施される。
C=ΦRΦt (1)
Φt は変換行列Φに対する転置行列を表す。なお,変換行列Φは次式で表される整数要素の直交行列である。
Figure 0004709074
次に,行列Φが非正規行列であるため,行列の正規化に相当する処理を行う。
n =N(C) (3)
さらに,Cに対して,量子化パラメータqを用いた量子化が次式のとおり施される。なおJMでは,正規化は量子化の中に組み込まれている。
V=Q(Cn ) (4)
一方,H.264の復号処理では,Vに対して,次式のように逆量子化を施し,変換係数の復号値を得る。
Figure 0004709074
次に,^Cq に対して,次式のように逆変換を施し,予測誤差の復号信号を得る。
Figure 0004709074
最後に,次式により,符号化対象画像の復号信号を得る。
Figure 0004709074
なお,本発明に関連する技術が記載された参考文献としては,上記非特許文献1の他に下記の非特許文献2〜5がある。また,下記の特許文献1には,ハードウェアの大幅な増加なしに複数回の符号化による符号化効率の向上を図るために,第1の符号化時に検出した動きベクトルから動画像の動き量を検出し,第2の符号化時の符号化レートを,人間の視覚特性と符号化歪み低減を考慮して制御する技術が記載されている。
特開平10−336675号公報 K.P.Lim and G.Sullivan and T.Wiegand,Text Description of Joint Model Reference Encoding Methods and Decoding Concealment Methods. Joint Video Team (JVT) of ISO/IEC MPEG and ITU-T VCEG,JVT-R95 ,Jan.,2006. J.L.Mannos and D.J.Sakrison. The effect of a visual fidelity criterion on the encoding of images. IEEE Trans. Infomation Theory ,Vol.IT-20 ,pp.523-536,July 1974. N.B.Nill. A visual model weighted cosine transform for image compression and quality assessment. IEEE Trans. Commun.,Vol.COM-33,No.12 ,pp.551-557,June 1985. B.Chitprasert and K.R.Rao. Human visual weighted progressive image transmission. IEEE Trans. Commun.,pp.1040-1044,July 1990. 上倉一人,渡辺裕,小林直樹,一之瀬進,安田浩. 演算量低減を考慮したグローバル動き・輝度変化補償動画像符号化. 電子情報通信学会論文誌,Vol.J82-B ,No.9,pp.1676-1688,Spt. 1999.
前述の通り,JMで用いられている主観画質の尺度は二乗誤差である。しかし,この二乗誤差は必ずしも,主観的な画質劣化を反映した歪み量ではない。例えば,高周波数成分の変化は低周波数成分の変化に比べて,視覚的には検知されにくい。また,動きの早いシーンにおける画質劣化は静止シーンにおける画質劣化よりも相対的に目立ちにくいことが知られている(時間マスキング効果)。しかし,こうした視覚特性を利用していない符号化器(例えば,JM)には,符号量の効率的な削減に関して,改良の余地が残る。
上記特許文献1に記載の技術では,視覚特性を考慮した量子化ステップ幅の制御などの符号化レートの制御は行っているが,符号化モードの選択には対応していない。
本発明はかかる事情に鑑みてなされたものであって,時空間でのマスキング効果を考慮して,主観画質を反映した歪み量を用いることにより,効率的に符号量を削減する予測モード選択方法を確立することを目的とする。
前述の空間マスキング効果は,空間周波数成分に対する視覚感度に差があることに由来する。そこで,直交変換係数に対して,周波数成分毎の視覚感度に応じて歪み量の重み付けを行うことで,主観画質に対応した歪み量を定義する。さらに,時間マスキングを考慮して,上述の重み付けされた歪み量に対して,動き量に応じてさらに重み付けを行う。こうした時空間的な性質に応じて重み付けされた歪み量をR−Dコスト内で用いる。
すなわち,本発明は,フレーム内予測およびフレーム間予測に関するブロックサイズ等の予測モードを設定し,同予測により得られた予測誤差信号に対して,直交変換,量子化による情報圧縮を行う動画像符号化において,歪み量,符号量,未定乗数からなるラグランジェのコスト関数に基づき予測モードを決定する際,直交変換を施すブロック内の周波数成分に対して,所定の視覚感度関数によって算出された視覚感度の値を乗じたものと前記直交変換を施すブロック内の周波数成分との比を,感度係数として算出する過程と,各予測モードごとに,前記感度係数を二乗誤差に乗じて得られる重み付き歪み量を算出する過程と,前記重み付き歪み量を用いてコスト関数を設定し,該コスト関数を用いて各予測モードのコストを算出する過程と,前記コスト関数を用いて算出されたコストを最小化する予測モードを選択する過程とを有することを特徴とする。
また,上記本発明において,視覚感度関数は,少なくともパラメータの一つとして視距離を画像の幅で除した視距離パラメータを有し,該視距離パラメータの減少関数であり,感度係数を算出する際,フレーム内の大局的な動き量に応じて,動き量が大きい場合の視距離パラメータが,動き量が小さい場合の視距離パラメータより大きな値となるように設定し,感度係数を各フレーム毎に適応的に変化させることを特徴とする。
また,上記本発明において,視覚感度関数は,少なくともパラメータの一つとして視距離を画像の幅で除した視距離パラメータを有し,該視距離パラメータの減少関数であり,感度係数を算出する際,ブロック内の動き量に応じて,動き量が大きい場合の視距離パラメータが,動き量が小さい場合の視距離パラメータより大きな値となるように設定し,感度係数を各ブロック毎に適応的に変化させることを特徴とする。
本発明では,符号化歪みの主観画質への寄与の度合いを考慮して,モード選択のR−Dコストを適応的に切り替える。これにより,符号化歪みの主観画質への寄与が小さい領域に対しては,符号量削減を重視するような重み付けがR−Dコストに加えられる。この場合,視覚的には検知され難い領域に対して符号量の削減を行うため,復号画像の主観画質を保ちながら,効率的に符号量を削減できる。
以下,本発明の具体的な実施形態を詳しく説明する。
[量子化誤差信号の重み付け]
まず,量子化誤差信号に対する視覚感度に基づく重み付けについて,説明する。本実施形態では,次式のR−Dコストを用いる。
Figure 0004709074
このR−Dコストの計算に用いる歪み量として,以下の重み付き歪み量を用いる。
Figure 0004709074
ここで,Cn Y(i)[k,l],Cn U(i)[k,l],Cn V(i)[k,l]はマクロブロック(Y成分の場合,16×16[画素],U,V成分の場合,8×8[画素])内のサブブロック(N×N[画素])のうち,ラスター走査においてi番目に走査されるサブブロックである。また,^Cq Y(i)[k,l],^Cq U(i)[k,l],^Cq V(i)[k,l]はマクロブロック内の復号変換係数(Y成分の場合,16×16[画素],U,V成分の場合,8×8[画素])内のサブブロック(N×N[画素])のうち,ラスター走査においてi番目に走査されるサブブロックである。さらに,Wk,l Y ,Wk,l U ,Wk,l V は1以下に設定される重み係数であり,以下では,感度係数と呼ぶ。感度係数の算出については,[感度係数の算出]にて詳述する。
上式において,Wk,l Y ,Wk,l U ,Wk,l V を小さな値に設定することは,量子化歪みD(Cn ,^Cq )を小さく見積もることに相当する。なお,直交変換の正規性より,すべてのk,lに対して,Wk,l Y =1,Wk,l U =1,Wk,l V =1とすれば,上述の重み付き歪み量は二乗誤差和と等価となる。
[感度係数の算出]
変換行列Φ(N×N行列)の第k列ベクトル(N次元ベクトル)をφk とすると,同行列に対する基底画像は,次式より得られる。なお,H.264の場合,Nとして取りうる値は4または8のいずれかである。
Figure 0004709074
ここで,φl t はφl の転置ベクトルである。
各基底画像fk,l (x,y)(0≦x,y≦N−1)に対して,次式に示す離散フーリエ変換を施し,フーリエ係数を得る。なお,以下ではN=2m とおく。
Figure 0004709074
ここで,jは虚数単位である。得られたフーリエ係数Fk,l (u,v)(0≦u≦N−1,0≦v≦N−1)に対して,以下の重み付けを行う。
Figure 0004709074
以下,〜Fk,l (u,v)(なお,〜はFの上側に付く綴字記号)について,説明する。^g(η)はg(η)を用いた次式で表される関数である。
Figure 0004709074
ここで,αは重みを制御するパラメータであり,外部から与えられる。また,g(η)は視覚感度関数として知られる関数であり,次式のような関数形で表される。
g(η)=(a+bη)exp(−(cη)d ) (12)
ここで,a,b,c,dは視覚感度関数の関数形を定めるパラメータ(以後,モデルパラメータと呼ぶ)であり,例えば,次のような値をとる。次の値は,上から順に,非特許文献2,非特許文献3,非特許文献4による。
(a,b,c,d)=(0.4992,0.2964,−0.114 ,1.1 ) (13)
(a,b,c,d)=(0.2 ,0.45,−0.18,1 ) (14)
(a,b,c,d)=(0.246 ,0.615 ,−0.25,1 ) (15)
また,式(12)において,ηは以下の値とする。
Figure 0004709074
η0 は以下のように,g(η)が最大値をとる引数である。
Figure 0004709074
θ(r,H)は縦幅Hの画像を視距離rHにおいて観測する場合の一画素あたりの角度であり,次式により与えられる。
Figure 0004709074
以後,rを視距離パラメータと呼ぶ。以上の議論より,〜Fk (u,v)は視距離パラメータrの関数であることが分かる。そこで,以下では,〜Fk (u,v,r)として,視距離パラメータrの関数であることを陽に示す表記法を用いる。
基底画像fk,l (x,y)(0≦x,y≦N−1)に対する感度係数を次式の電力比として定義する。
Figure 0004709074
感度係数は符号化対象画像とは独立に求めることが可能である。このため,符号化前に予め感度係数を求め,ルックアップテーブルに格納すれば,符号化時の感度係数算出のための演算は省略することができる。なお,Wk,l U (r),Wk,l V (r)についても同様に求めることができる。このとき,輝度成分と色差成分でモデルパラメータを変更することも可能である。
このとき,Wk,l Y (r),Wk,l U (r),Wk,l V (r)は次式を満たす。
k,l Y (r)≦1
k,l U (r)≦1
k,l V (r)≦1
これは,
g(η)≦1
となることから,
Figure 0004709074
となるためである。また,〜Fk (u,v,r)がrの減少関数であることから,Wk,l Y (r),Wk,l U (r),Wk,l V (r)は視距離パラメータrに対する減少関数であることが分かる。これは,視距離と共に視覚感度が鈍化するという視覚特性に対応するものである。
[時間マスキング効果の影響を考慮した修正]
あるフレームにおいて,時間軸方向の大きな変化(高速なカメラパン・チルト,シーンチェンジ等)が発生した場合,そのフレームの画質に対する感度は極端に低下する。これは,時間マスキング効果として知られる視覚特性である。そこで,時間軸方向の大きな変化が発生したフレームに対しては,感度係数が小さな値になるよう制御する。本実施形態では,この感度係数の制御に視距離パラメータを用いる。
例えば,以下のようになる。
(1)フレーム毎に視距離パラメータを制御する場合:
r=r1 …グローバル動きベクトルの大きさが閾値以上の場合
r=r2 …それ以外の場合 (20)
ここで,r1 >r2 とする。なお,グローバル動きベクトルの算出については,例えば,非特許文献5の方法による。
(2)マクロブロック毎に視距離パラメータを制御する場合:
r=r1 ’…マクロブロックの動きベクトルの大きさが閾値以上の場合
r=r2 ’…それ以外の場合 (21)
なお,マクロブロック内のサブマクロブロックが異なる動きベクトルを有する場合には,以下のようになる。
r=r1 ’…サブマクロブロックに含まれる動きベクトルの大きさの最小値が閾値以上の場合
r=r2 ’…それ以外の場合 (22)
ここで,r1 ’>r2 ’とする。
[処理フローチャート]
本発明の実施形態の処理について,図1の処理フローチャートに従って説明する。なお,予測モードの選択以外の処理については,従来の動画像符号化処理と同様であるため,予測モードの選択以外の処理部分の説明は省略する。
ステップS1:予測モードの初期値をレジスタXに書き込む。
ステップS2:最小コストを格納するレジスタC,最適モードを格納するレジスタMを各々,初期値に設定する。
ステップS3:予測モード,量子化パラメータ,符号化対象信号,参照信号を入力とし,与えられた予測モードを用いた場合の符号量を算出し,算出した値をレジスタに書き出す。具体的な算出方法は,JMの方法に従う。
ステップS4:予測モード,量子化パラメータ,符号化対象信号,参照信号を入力とし,与えられた予測モードを用いた場合の重み付き歪み量を算出し,算出した値をレジスタに書き出す。本処理の詳細については図2を用いて後述する。
ステップS5:予測モード,量子化パラメータを入力とし,未定乗数を算出し,算出した値をレジスタに書き出す。具体的な算出方法は,JMの方法に従う。
ステップS6:符号量,重み付き歪み量,未定乗数を入力とし,R−Dコストを算出し,算出した値をレジスタに書き出す。具体的な算出方法は,式(8) に従う。
ステップS7:ステップS6で算出したR−Dコスト,およびレジスタCの値を入力とし,ステップS6で算出したR−DコストがレジスタCの値よりも小さいか否かの判定を行い,判定結果である真偽値を出力する。出力が真値の場合,ステップS8に進む。出力が偽値の場合,ステップS10の処理に移る。
ステップS8:ステップS6で算出したR−DコストをレジスタCに書き出す。
ステップS9:レジスタXの値をレジスタMに書き出す。
ステップS10:全ての予測モードについて,以上の処理を終えたかどうかを判定し,まだの場合には,ステップS11に進む。全ての予測モードについて処理を終えたならば,処理を終了する。最終的にレジスタMに格納されたモードが最適モードとして選択された予測モードであり,そのときのコストがレジスタCに格納された値である。
ステップS11:レジスタXに次の予測モードを表す値を書き出す。レジスタに書き出す予測モードの順番は予め与えられるものとする。その後,ステップS3に戻り,同様に処理を繰り返す。
図1におけるステップS4の詳しい処理の流れを図2に示す。
ステップS21:変換行列Φにより得られた変換係数を入力とし,正規化処理を行い,正規化後の変換係数を一次元配列としてレジスタに書き出す。なお,二次元データである変換係数を一次元データとする走査方法については外部から与えられるものとする。これは,以下のステップS22,ステップS24においても同様である。
ステップS22:変換係数に対する量子化結果を入力とし,逆量子化処理を行い,変換係数の復号値を一次元配列としてレジスタに書き出す。
ステップS23:動きベクトルを入力とし,その動きベクトルに応じて,視距離パラメータを算出する処理を行い,算出した視距離パラメータをレジスタに書き出す。例えば,式(20)〜(22)に示す方法に従う。ここでは,2種類の感度係数について選択する例を示しているが,本発明は,選択の候補が3種類以上となっても同様に適用できる。なお,ここで入力として用いる動きベクトルは,別途,与えられるものとする。例えば,符号化の過程で算出された動きベクトルを用いる方法(マクロブロック内の動きベクトルの平均ベクトルを用いる等)がある。あるいは,符号化とは独立に求めたマクロブロック(16×16[画素])に対する動きベクトルを用いる方法もある。
ステップS24:視距離パラメータを入力として,視距離パラメータに応じて感度係数を算出する処理を行い,算出された感度係数を一次元配列としてレジスタに書き出す。具体的な算出法は,式(19)に従う。なお,選択可能な視距離パラメータが予め定められている場合は,感度係数も予め算出しておくことができるため,感度係数の算出処理は省略できる。この場合,本処理は,以下のようになる。視距離パラメータを入力として,視距離パラメータに応じて予めレジスタに格納された感度係数を読み出し,一次元配列としてレジスタに書き出す。
ステップS25:繰り返し回数をカウントするために用いるカウンタiの値を0に初期化する。レジスタSの値を0に初期化する。
ステップS26:ステップS21で出力された正規化後の変換係数の第i成分,およびステップS22で出力された変換係数の復号値の第i成分を入力とし,両者の差分を求め,同差分値を二乗する処理を行い,算出した二乗誤差(変換係数の符号化歪み)をレジスタに書き出す。
ステップS27:ステップS26で出力した二乗誤差,感度係数の第i成分を入力とし,二乗誤差に感度係数を乗じる処理を行い,乗算結果をレジスタに書き出す。
ステップS28:ステップS27で算出した値,レジスタSの値を入力として,両者を加算し,加算結果をレジスタSに書き出す。
ステップS29,S30:以上の処理をカウンタiに1を加算しながら繰り返し,変換係数の全成分について行う。
[装置構成例]
本発明の実施形態に係る装置構成図を図3に示す。なお,本実施形態により選択した最適な予測モードを用いて動画像を符号化する処理部の構成については,従来の一般的な動画像符号化装置の構成と同様であるので,ここでは,予測モードを選択する処理構成の部分だけを説明する。
初期モード設定部101:予測モードの初期値をモード記憶部102に書き出す。
符号量算出部103:予測モード,量子化パラメータ,符号化対象信号,参照信号を入力とし,符号化した場合の符号量を算出し,算出した値を符号量記憶部104に書き出す。具体的な算出方法は,JMの方法に従う。
重み付き歪み量算出部105:予測モード,量子化パラメータ,符号化対象信号,参照信号を入力とし,符号化した場合の重み付き歪み量を算出し,算出した値を重み付き歪み量記憶部106に書き出す。本処理の詳細については図2を用いて後述する。
未定乗数算出部107:予測モード,量子化パラメータを入力とし,未定乗数を算出し,算出した値を未定乗数記憶部108に書き出す。具体的な算出方法は,JMの方法に従う。
コスト算出部109:符号量記憶部104,重み付き歪み量記憶部106,未定乗数記憶部108から読み出した符号量,重み付き歪み量,未定乗数を入力とし,R−Dコストを算出し,算出した値をコスト記憶部110に書き出す。具体的な算出方法は,式(8) に従う。
最小コスト判定部111:コスト記憶部110,最小コスト記憶部112から読み出したR−Dコスト,最小コストを入力とし,R−Dコストが最小コストよりも小さいか否かの判定を行い,判定結果である真偽値を出力する。出力が真値の場合,コスト記憶部110から読み出したR−Dコストを最小コスト記憶部112に書き出し,最適モード更新部113の処理に進む。出力が偽値の場合,最終モード判定部115の処理に移る。
最適モード更新部113:最小コスト記憶部112に書き出したR−Dコスト算出に用いたモードを最適モード記憶部114に書き出す。
最終モード判定部115,モード設定部116:以上の処理を全ての予測モードについて行う。
最適モード出力部117:全ての予測モードについての処理が終了したならば,最適モード記憶部114に記憶されている予測モードを最適モードとして出力する。
図3における重み付き歪み量算出部105の詳細構成について図4に示す。
変換係数正規化部201:変換行列Φにより得られた変換係数を入力とし,正規化処理を行い,正規化後の変換係数を正規化変換係数記憶部202に書き出す。
変換係数復号部203:変換係数に対する量子化結果を入力とし,逆量子化処理を行い,変換係数の復号値を復号変換係数記憶部204に書き出す。ここでの量子化は,JMと同様に正規化処理を含む。
歪み量算出部205:正規化変換係数記憶部202,復号変換係数記憶部204から読み出した正規化後の変換係数および変換係数の復号値を入力とし,各成分毎に両者の差分を求め,同差分値を二乗する処理を行い,算出した二乗誤差を歪み量記憶部206に書き出す。
感度係数乗算部207:感度係数記憶部208−1,208−2のいずれかから読み出した感度係数,歪み量記憶部206から読み出した二乗誤差を入力とし,二乗誤差に感度係数を乗じる処理を行い,得られた重み付き歪み量を歪み量記憶部212に書き出す。なお,ここでは,2種類の感度係数について選択する例を示しているが,本発明は,選択の候補が3種類以上となっても同様に適用できる。
視距離パラメータ算出部209:動きベクトルを入力とし,動きベクトルに応じて,視距離パラメータを算出する処理を行い,算出した視距離パラメータを視距離パラメータ記憶部210に書き出す。例えば,式(20)〜(22)に示す方法に従う。なお,ここでは,2種類の視距離パラメータを選択する例を示しているが,本発明は,選択の候補が3種類以上となっても同様に適用できる。また,ここで入力として用いる動きベクトルは,別途,与えられるものとする。例えば,符号化の過程で算出された動きベクトルを用いて,マクロブロック内の動きベクトルの平均ベクトルを用いる方法がある。あるいは,符号化とは独立に求めたマクロブロック(16×16[画素])に対する動きベクトルを用いても良い。
感度係数選択部211:視距離パラメータを入力として,視距離パラメータに応じて感度係数を選択する処理を行い,選択された感度係数を感度係数乗算部207の入力とすることを表す制御信号を出力する。
歪み量和算出部213:歪み量記憶部212から読み出した各成分の重み付き歪み量を入力とし,全ての成分についての合計和を算出し,算出結果の合計和を図3の重み付き歪み量記憶部106に書き出す。
以上の動画像符号化の処理は,コンピュータとソフトウェアプログラムとによっても実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。
以上の手段を用いることにより,本発明は,例えばH.264のような多くの符号化モードを有する符号化器において,適切な符号化モードを選択することが可能となり,復号画像の主観画質を保ちながら符号化効率を向上させることができるようになる。H.264等の高能率画像信号符号化の特徴は,自由度の高い符号化モードの選択にあるため,適切な符号化モードの選択によって初めて,符号化性能を最大限に引き出すことが可能となる。
本発明の実施形態の処理フローチャートである。 図1におけるステップS4の処理フローチャートである。 本発明の実施形態に係る装置構成図である。 図3における重み付き歪み量算出部の詳細構成図である。
符号の説明
101 初期モード設定部
102 モード記憶部
103 符号量算出部
104 符号量記憶部
105 重み付き歪み量算出部
106 重み付き歪み量記憶部
107 未定乗数算出部
108 未定乗数記憶部
109 コスト算出部
110 コスト記憶部
111 最小コスト判定部
112 最小コスト記憶部
113 最適モード更新部
114 最適モード記憶部
115 最終モード判定部
116 モード設定部
117 最適モード出力部
201 変換係数正規化部
202 正規化変換係数記憶部
203 変換係数復号部
204 復号変換係数記憶部
205 歪み量算出部
206 歪み量記憶部
207 感度係数乗算部
208−1,208−2 感度係数記憶部
209 視距離パラメータ算出部
210 視距離パラメータ記憶部
211 感度係数選択部
212 歪み量記憶部
213 歪み量和算出部

Claims (6)

  1. フレーム内予測およびフレーム間予測に関する予測モードを設定し,設定した予測モードによる予測により得られた予測誤差信号に対して,直交変換および量子化による情報圧縮を行う動画像符号化方法において,
    歪み量,符号量および未定乗数からなるラグランジェのコスト関数に基づき予測モードを決定する際,
    直交変換を施すブロック内の周波数成分に対して,所定の視覚感度関数によって算出された視覚感度の値を乗じたものと前記直交変換を施すブロック内の周波数成分との比を,感度係数として算出する過程と,
    各予測モードごとに,前記感度係数を二乗誤差に乗じて得られる重み付き歪み量を算出する過程と,
    前記重み付き歪み量を用いてコスト関数を設定し,該コスト関数を用いて各予測モードのコストを算出する過程と,
    前記コスト関数を用いて算出されたコストを最小化する予測モードを選択する過程とを有する
    ことを特徴とする動画像符号化方法。
  2. 請求項1記載の動画像符号化方法において,
    前記視覚感度関数は,少なくともパラメータの一つとして視距離を画像の幅で除した視距離パラメータを有し,該視距離パラメータの減少関数であり,
    前記感度係数を算出する際,フレーム内の大局的な動き量に応じて,動き量が大きい場合の視距離パラメータが,動き量が小さい場合の視距離パラメータより大きな値となるように設定し,前記感度係数を各フレーム毎に適応的に変化させる
    ことを特徴とする動画像符号化方法。
  3. 請求項1記載の動画像符号化方法において,
    前記視覚感度関数は,少なくともパラメータの一つとして視距離を画像の幅で除した視距離パラメータを有し,該視距離パラメータの減少関数であり,
    前記感度係数を算出する際,ブロック内の動き量に応じて,動き量が大きい場合の視距離パラメータが,動き量が小さい場合の視距離パラメータより大きな値となるように設定し,前記感度係数を各ブロック毎に適応的に変化させる
    ことを特徴とする動画像符号化方法。
  4. フレーム内予測およびフレーム間予測に関する予測モードを設定し,設定した予測モードによる予測により得られた予測誤差信号に対して,直交変換および量子化による情報圧縮を行う動画像符号化装置において,
    各予測モードに対して,符号量を算出する手段と,
    直交変換を施すブロック内の周波数成分に対して,所定の視覚感度関数によって算出された視覚感度の値を乗じたものと前記直交変換を施すブロック内の周波数成分との比を,感度係数として算出し,各予測モードごとに,前記感度係数を二乗誤差に乗じて得られる重み付き歪み量を算出する手段と,
    各予測モードに対して,量子化パラメータを入力としてラグランジュの未定乗数を算出する手段と,
    前記符号量と前記重み付き歪み量と前記未定乗数とによって定められるコスト関数を用いて各予測モードのコストを算出する手段と,
    前記コスト関数を用いて算出されたコストを最小化する予測モードを選択する手段とを備える
    ことを特徴とする動画像符号化装置。
  5. 請求項1から請求項までのいずれか1項に記載の動画像符号化方法を,コンピュータに実行させるための動画像符号化プログラム。
  6. 請求項1から請求項までのいずれか1項に記載の動画像符号化方法を,コンピュータに実行させるための動画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2006160390A 2006-06-09 2006-06-09 動画像符号化方法,装置,そのプログラムおよびそのプログラムを記録した記録媒体 Expired - Fee Related JP4709074B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006160390A JP4709074B2 (ja) 2006-06-09 2006-06-09 動画像符号化方法,装置,そのプログラムおよびそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006160390A JP4709074B2 (ja) 2006-06-09 2006-06-09 動画像符号化方法,装置,そのプログラムおよびそのプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2007329780A JP2007329780A (ja) 2007-12-20
JP4709074B2 true JP4709074B2 (ja) 2011-06-22

Family

ID=38929941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006160390A Expired - Fee Related JP4709074B2 (ja) 2006-06-09 2006-06-09 動画像符号化方法,装置,そのプログラムおよびそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4709074B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4681011B2 (ja) * 2008-01-31 2011-05-11 日本電信電話株式会社 動画像符号化方法、動画像符号化装置、動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4824708B2 (ja) * 2008-01-31 2011-11-30 日本電信電話株式会社 動画像符号化方法,装置,プログラムおよびコンピュータ読み取り可能な記録媒体
JP4819855B2 (ja) * 2008-08-18 2011-11-24 日本電信電話株式会社 動画像量子化方法、動画像量子化装置、動画像量子化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4819856B2 (ja) * 2008-08-18 2011-11-24 日本電信電話株式会社 動画像符号化方法、動画像符号化装置、動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5349429B2 (ja) * 2010-08-30 2013-11-20 Kddi株式会社 符号量低減装置および符号化装置
CN111193931B (zh) * 2018-11-14 2023-04-07 深圳市中兴微电子技术有限公司 一种视频数据的编码处理方法和计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0823540A (ja) * 1994-07-08 1996-01-23 Kokusai Denshin Denwa Co Ltd <Kdd> 映像符号化器系の制御装置
JPH0970041A (ja) * 1995-08-30 1997-03-11 Kokusai Denshin Denwa Co Ltd <Kdd> 可変ビットレート符号化装置
JP2005286645A (ja) * 2004-03-29 2005-10-13 Toshiba Corp 画像符号化装置、画像符号化方法および画像符号化プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0823540A (ja) * 1994-07-08 1996-01-23 Kokusai Denshin Denwa Co Ltd <Kdd> 映像符号化器系の制御装置
JPH0970041A (ja) * 1995-08-30 1997-03-11 Kokusai Denshin Denwa Co Ltd <Kdd> 可変ビットレート符号化装置
JP2005286645A (ja) * 2004-03-29 2005-10-13 Toshiba Corp 画像符号化装置、画像符号化方法および画像符号化プログラム

Also Published As

Publication number Publication date
JP2007329780A (ja) 2007-12-20

Similar Documents

Publication Publication Date Title
US6711211B1 (en) Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
US8625916B2 (en) Method and apparatus for image encoding and image decoding
RU2544799C2 (ru) Устройство кодирования движущихся изображений, устройство декодирования движущихся изображений, способ кодирования движущихся изображений и способ декодирования движущихся изображений
RU2369038C1 (ru) Способ кодирования изображения/декодирования изображения, устройство кодирования изображения/декодирования изображения
US8170355B2 (en) Image encoding/decoding method and apparatus
US8107529B2 (en) Coding device, coding method, program of coding method, and recording medium recorded with program of coding method
WO2008020687A1 (en) Image encoding/decoding method and apparatus
US20130136187A1 (en) Video encoding method, video decoding method, video encoding apparatus, video decoding apparatus, and program thereof
JPH09261662A (ja) ディジタルビデオ符号化器における動き推定方法および装置
JP4709074B2 (ja) 動画像符号化方法,装置,そのプログラムおよびそのプログラムを記録した記録媒体
JP4709187B2 (ja) 符号化パラメータ決定方法、符号化パラメータ決定装置、符号化パラメータ決定プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2011223068A (ja) 符号化装置、復号装置及びプログラム
JP6837110B2 (ja) 動画像復号方法
JP4709179B2 (ja) 符号化パラメータ選択方法,符号化パラメータ選択装置,符号化パラメータ選択プログラムおよびその記録媒体
JP4776505B2 (ja) 画像符号化装置、画像復号装置及び画像処理プログラム
JP4681011B2 (ja) 動画像符号化方法、動画像符号化装置、動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US11202082B2 (en) Image processing apparatus and method
JP2702139B2 (ja) 動画像の予測符号化方式
JP2011205602A (ja) 符号化装置、復号装置及びプログラム
JP4222274B2 (ja) 符号化モード選択装置及び符号化モード選択プログラム
JP4819855B2 (ja) 動画像量子化方法、動画像量子化装置、動画像量子化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
WO2022196133A1 (ja) 符号化装置及び方法
KR102209835B1 (ko) 주파수 영역의 움직임 예측을 이용한 부호화 장치 및 방법
CN112154667B (zh) 视频的编码和解码
JP4820800B2 (ja) 画像符号化方法、画像符号化装置、及び画像符号化プログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080529

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080801

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100924

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110317

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees