JP2009100125A - 符号化装置 - Google Patents

符号化装置 Download PDF

Info

Publication number
JP2009100125A
JP2009100125A JP2007268206A JP2007268206A JP2009100125A JP 2009100125 A JP2009100125 A JP 2009100125A JP 2007268206 A JP2007268206 A JP 2007268206A JP 2007268206 A JP2007268206 A JP 2007268206A JP 2009100125 A JP2009100125 A JP 2009100125A
Authority
JP
Japan
Prior art keywords
unit
data
encoding
arithmetic
pcm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007268206A
Other languages
English (en)
Inventor
Yoshinori Shigeta
良則 繁田
Hiromitsu Nakayama
啓満 中山
Kiwamu Watanabe
究 渡辺
Satoshi Takegawa
智 竹川
Tatsuhiro Suzumura
竜広 鈴村
Takaya Ogawa
貴也 小川
Masashi Uehashi
雅志 上橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007268206A priority Critical patent/JP2009100125A/ja
Priority to US12/245,984 priority patent/US20090097567A1/en
Publication of JP2009100125A publication Critical patent/JP2009100125A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】算術符号化の際の再度符号化の頻度の低減ないしは解消を可能とすることにより、符号化処理を効率良く行うための符号化装置を提供する。
【解決手段】マクロブロックの画像データ2は、マクロブロック・タイプが決定された後、そのタイプの画像データに対して、DCTデータの生成を経て2値化データが生成される。2値化データは、ビット長予測部12によって、そのビット量から算術符号化後のビット長の予測値が、符号化の規格上許容される最大符号量を超えるか否かのビット長予測が行われる。超えると予測した場合には、その2値化データの算術符号化を実行させないように制御する。
【選択図】図1

Description

本発明は、MPEG−4規格の動画像符号化を行う符号化装置に関する。
画像を圧縮符号化する最近の規格として、国際標準化機関(ITU-T)によるMPEG−4 Part10:Advanced Video Coding(MPEG-4 AVC a或いは H.264規格(ITU-T H.264/AVC))がある。
このH.264規格の符号化装置(H.264符号化装置と略記)では、その規格上において、1マクロブロック毎に許容される符号量としてのビット量が所定値、具体的には3200ビット以内に制限されている。
このため、H.264符号化装置においては、算術符号化を行う符号化時に1マクロブロックのビット量が3200ビットを超えた場合、該当するマクロブロックを圧縮しないでデジタルコードとしてのPCM(パルスコードモデュレーション)に変換するI_PCMタイプのマクロブロックとして再度符号化(以降、I_PCM再符号化処理と呼ぶ)を行う必要がある。
複数のマクロブロックの符号化処理をパイプライン方式で行う場合、I_PCM再符号化処理はパイプラインを停止する必要があり、符号化処理の効率を低下させる原因となる。
なお、特許文献1には、予測モードの多い符号化において、符号化に先立って発生符号量を高精度に見積もることができ、符号化手段及び工程における符号化処理を、例えば画質、圧縮率、レートを最適に制御する符号化装置が開示されている。
しかし、この特許文献1には、算術符号化を行った場合に許容される最大符号量以下に抑制する内容の記載や、符号化処理の効率の低下を改善する内容の記載がされていない。 このため、算術符号化の際の再度符号化の頻度の低減ないしは解消を可能にし、符号化処理を効率良く行うことができる符号化装置が望まれる。
特開2005−203905号公報 ITU-T Recommendation H.264(05/2003) "Advanced video coding for generic audiovisual services"(2003)
本発明は上述した点に鑑みてなされたもので、算術符号化の際の再度符号化の頻度の低減ないしは解消を可能とすることにより、符号化処理を効率良く行うための符号化装置を提供することを目的とする。
本発明の一実施形態に係る符号化装置は、所定のブロックサイズの画像データを直交変換する直交変換部と、前記直交変換部から出力される画像データを2値化する2値化部と、前記2値化部により生成された2値化データに対して算術符号化を行う算術符号化部と、前記2値化データから、前記算術符号化部により生成される算術符号化データが、符号化の規格上において、前記所定のブロックサイズの場合に対して、許容される最大符号量を超えるか否かの予測を行う予測部と、を具備し、前記予測部により、前記算術符号化データが、前記最大符号量を超えると予測した場合には、前記算術符号化部による該当する2値化データに対する算術符号化を実行させない制御を行うことを特徴とする。
本発明の一実施形態に係る符号化装置は、所定のブロックサイズの画像データを直交変換する直交変換部と、前記直交変換部から出力される変換データを2値化する2値化部と、前記2値化部により生成された2値化データに対して算術符号化を行い、前記画像データの第1の符号化データとしての算術符号化データを生成する算術符号化部と、前記画像データをデジタルコードに変換して、前記画像データの第2の符号化データとしてのデジタルコードデータの生成を、前記算術符号化部の動作と並行して行うデジタルコード変換部と、前記算術符号化部により生成された算術符号化データが、符号化の規格上において、前記所定のブロックサイズの場合に対して、許容される最大符号量を超えるか否かの判定を行う判定部と、前記判定部により、前記算術符号化データが、前記最大符号量を超えると判定した場合には、前記デジタルコード変換部により変換されたデジタルコードデータを前記画像データの符号化データとして選択してストリームを出力するストリーム生成部と、を具備することを特徴とする。
本発明によれば、算術符号化の際の再度符号化の頻度の低減ないしは解消を可能とする。これにより、符号化処理を効率良く行うことが可能となる。
(第1の実施形態)
以下、本発明の実施形態を説明するに先立ち、本実施形態に関係する参考例を説明する。図4は、参考例のH.264符号化装置21の構成を示す。
このH.264符号化装置21は、所定のブロックサイズとしてのマクロブロックの画像データ2をモード判定部3が読み込み、画面間符号化および画面内符号化の予測モードを評価し、マクロブロック・タイプを決定する。モード判定部3に係る内容は、非特許文献1の8.3節、8.4節に記載されている。8.3節、8.4節において、画面内符号化及び画面間符号化の予測がそれぞれ記載されている。
モード判定部3により決定されたマクロブロック・タイプのデータは、直交変換を行う直交変換部としての例えばDCT(離散コサイン変換)データ生成部4に入力される。
次に、DCTデータ生成部4は、決定されたマクロブロック・タイプに従い、画像データの差分データを計算し、差分データのDCT変換を行い、DCT差分データを生成する。このDCT差分データは、2値化部5に入力される。DCTデータ生成部4に係る内容は、非特許文献1の8.5節に記載されている。
2値化部5は、マクロブロック・タイプのデータとDCT差分データを2値化し、2値化データを生成する。この2値化データは、算術符号化部6に入力される。2値化部5に係る内容は、非特許文献1の9.3.2節に記載されている。
算術符号化部6は、2値化データを算術符号化し、算術符号化データを生成する。算術符号化部6に係る内容は、非特許文献1の9.3節に記載されている。
この算術符号化部6は、1マクロブロック当たり、算術符号化データが許容される最大符号量としての3200ビットを超えたか否かを判定(検出)する判定部として、PCM判定部7を有する。
そして、PCM判定部7は、算術符号化処理の途中で算術符号化データが、この3200ビットを超えることを検出すると、算術符号化部6の処理を中断させる。そして、PCM判定部7は、PCM処理要求8をPCMデータ生成部9及びH.264ストリーム生成部10に出力し、I_PCM再符号化処理を行うようにする。
つまり、PCM判定部7は、I_PCM再符号化処理として、マクロブロック・タイプをI_PCMに強制的に書き換え、算術符号化部6においてマクロブロック・タイプのデータのみを算術符号化し、マクロブロック・タイプ算術符号化データを生成する。このマクロブロック・タイプ算術符号化データは、H.264ストリーム生成部10に出力される。
PCMデータ生成部9は、PCM処理要求8がある場合には、該当マクロブロックの画像データ2をデジタルコード変換として、例えばパルスコード変調(PCM)符号化し、PCMデータを生成する。そして、このPCMデータをH.264ストリーム生成部10に出力する。PCMデータ生成部9に係る内容は、非特許文献1の8.3.4節に記載されている。
H.264ストリーム生成部10は、PCM処理要求8が無い場合には、算術符号化データをH.264ストリーム11として出力する。一方、PCM処理要求8がある場合には、マクロブロック・タイプ算術符号化データとPCMデータを連結し、H.264ストリーム11を生成して、この連結されたデータ(つまりマクロブロック・タイプ算術符号化データとPCMデータ)を出力する。
上記のように、参考例のH.264符号化装置21においては、PCM判定部7は、算術符号化処理の途中で算術符号化データが3200ビットを超えたことを検出すると、算術符号化処理を中断し、I_PCM再符号化処理を行う必要があった。
H.264符号化装置21が複数のマクロブロックに対してパイプライン方式の処理(パイプライン処理とも言う)を行う構成の場合、I_PCM再符号化の処理を行っている間は、そのパイプライン処理が停止することになるため、H.264符号化処理の処理効率の低下を引き起こすという欠点があった。
ここで、パイプライン処理とは、モード判定部3、DCTデータ生成部4、2値化部5、算術符号化部6、H.264ストリーム生成部10が、それぞれ異なる(領域としての)各マクロブロックに対して同時に処理を行うことが可能な動作を言う。
従って、算術符号化部6において、あるマクロブロックの画像データに対して、その算術符号化処理を中断することになると、その前段の2値化部5による2値化データが算術符号化部6に出力されても、その前のマクロブロックの画像データに対する算術符号化処理が中断しているため、その処理を速やかに続行できないことになる。
このため、上記のようなH.264符号化処理の処理効率の低下を低減ないしは解消してH.264ストリーム11を生成できるH.264符号化装置が望まれる。
次にこのような参考例における欠点を低減できるH.264符号化装置を説明する。
図1は本発明の第1の実施形態に係るH.264符号化装置1の構成を示す。このH.264符号化装置1は、基本的には、図4のH.264符号化装置21において、以下に説明するビット長予測部12を備えた構成にしている。
そして、このビット長予測部12により、算術符号化部6が算術符号化データを生成する前に、2値化部5の2値化データから、算術符号化データがH.264符号化の規格上で許容される最大符号量としての3200ビットを超えるか否かを予測する。以下、ビット長予測部12を備えたH.264符号化装置1の構成及び動作を説明する。
このH.264符号化装置1は、入力されるマクロブロックの画像データ2を読み込むモード判定部3を有する。
このモード判定部3は、読み込んだマクロブロックの画像データ2に対して、画面間符号化(インター符号化)及び画面内符号化(イントラ符号化)の予測モードを評価し、マクロブロック・タイプを決定し、マクロブロック・タイプのデータをDCTデータ生成部4に出力する。モード判定部3に係る内容は、上述した非特許文献1の8.3節、8.4節に記載されている。
DCTデータ生成部4は、決定されたマクロブロック・タイプに従い、画像データ2の差分データを計算し、差分データのDCT変換を行う。そして、このDCTデータ生成部4は、DCT変換によりDCT差分データを生成して、2値化部5に出力する。DCTデータ生成部4に係る内容は、非特許文献1の8.5節に記載されている。
2値化部5は、DCT差分データを2値化する。2値化部5に係る内容は、参考例の場合と同様に非特許文献1の9.3.2節に記載されている。
このH.264符号化装置1においては、参考例の構成と異なり、例えば2値化部5に、ビット長予測部12が設けてある。
本実施形態における2値化部5は、2値化された2値化データとしての2値化DCT差分データを、この2値化部5内のビット長予測部12に出力する。
また、この2値化部5は、マクロブロック・タイプのデータの2値化を行い、2値化マクロブロック・タイプデータ(或いはマクロブロック・タイプの2値化データ)を生成する。
このビット長予測部12は、入力されたDCT差分データの2値化データ量から算術符号化部6による算術符号化後のビットが3200ビットを超えるか否かを、その算術符号化の開始前に予測する。本明細書では、この予測をビット長予測という。
また、ビット長予測部12は、このビット長予測により、3200ビットを超えると予測した場合には、該当するマクロブロック・タイプを強制的にI_PCMに変更する。 ビット長予測部12は、2値化DCT差分データのビット量と、これを算術符号化した場合の算術符号化データのビット量とに相関があることを利用して、以下の式1により、簡単な計算でビット長予測を行う。
2値化DCT差分データのビット量*N > 3200 (式1)
ここで、Nは1以下の数値で、通常0.8から0.6程度の値である。本実施形態においては、このように2値化DCT差分データのビット量に単に所定の数値を乗算することにより、ビット長予測を行う。なお、式1は除算形式の表現にすることもできる。
そして、このビット長予測により、式1が成立する場合には、上記のようにマクロブロック・タイプを強制的にI_PCMに変更する。
なお、ビット長予測部12は、式1により2値化DCT差分データのビット量から算術符号化後のビット長が3200ビットを超えるか否かのビット長予測を行っているが、2値化DCT差分データのビット量と、該当する2値化マクロブロック・タイプデータ(或いはマクロブロック・タイプの2値化データ)のビット量の和からビット長予測を行うようにしても良い。
そして、このビット長予測部12によるビット長予測により、算術符号化後のビット長が3200ビットを超えると予測した場合には、算術符号化部6におけるこのビット長予測が行われない場合に行われる2値化DCT差分データの算術符号化を実行させないように制御する。この場合、算術符号化部6は、I_PCMのマクロブロック・タイプの2値化データに対する算術符号化を行う。
この具体例の場合は、ビット長予測部12がビット長予測により、式1が成立すると予測した場合には、上記のようにマクロブロック・タイプを強制的にI_PCMに変更して(2値化部5或いはビット長予測部12が)その結果を算術符号化部6に出力することにより、この制御が行われる。
一方、ビット長予測部12によるビット長予測により、3200ビットを超えないと予測された場合には、図4の場合と同様に、2値化部5は、DCT差分データの2値化データとマクロブロック・タイプの2値化データとを連結した2値化データを算術符号化部6に出力する。そして、以下のように図4の場合と同様の処理が行われることになる。
算術符号化部6は、2値化データを算術符号化し、算術符号化データを生成する。また、この算術符号化部6は、算術符号化部6による算術符号化データが3200ビットを超えるか否かを判定するPCM判定部7を有する。算術符号化部6に係る内容は、非特許文献1の9.3節に記載されている。
図4の構成において説明したように、PCM判定部7は、算術符号化処理の途中で算術符号化データが、3200ビットを超えることを検出すると、算術符号化部6の処理を中断させる。
そして、PCM判定部7は、PCM処理要求8をPCMデータ生成部9及びH.264ストリーム生成部10に出力し、I_PCM再符号化処理を行うようにする。
この場合、PCM判定部7は、I_PCM再符号化処理として、マクロブロック・タイプをI_PCMに強制的に書き換える。
また、算術符号化部6は、そのマクロブロック・タイプのデータのみを算術符号化し、マクロブロック・タイプ算術符号化データを生成する。このマクロブロック・タイプ算術符号化データは、H.264ストリーム生成部10に出力される。
PCMデータ生成部9は、PCM処理要求8がある場合には、該当マクロブロックの画像データ2をデジタルコード変換として、例えばパルスコード変調(PCM)符号化し、PCMデータを生成する。
そして、このPCMデータをH.264ストリーム生成部10に出力する。PCMデータ生成部9に係る内容は、非特許文献1の8.3.4節に記載されている。
H.264ストリーム生成部10は、PCM処理要求8が無い場合には、算術符号化データをH.264ストリーム11として出力する。
一方、PCM処理要求8がある場合には、マクロブロック・タイプ算術符号化データとPCMデータを連結し、H.264ストリーム11を生成して、この連結されたデータ(つまりマクロブロック・タイプ算術符号化データとPCMデータ)を出力する。
一方、上述したようにビット長予測により、3200ビットを超えると予測した場合には、ビット長予測部12は、該当するマクロブロック・タイプを強制的にI_PCMに変更する。また、そのマクロブロック・タイプは、2値化部5により2値化データが生成される。
そして、2値化部5から、マクロブロック・タイプが強制的にI_PCMに変更された2値化データが算術符号化部6に入力されると、算術符号化部6のPCM判定部7は、直ちに通常のPCM判定処理を行うことなく、PCM処理要求8を出力する。
また、算術符号化部6は、マクロブロック・タイプの2値化データのみの算術符号化のみを行い、生成した算術符号化データをH.264ストリーム生成部10に出力する。
つまり、この場合、算術符号化部6は、2値化DCT差分データの算術符号化を実行しない。
また、PCM処理要求8が入力されたPCMデータ生成部9は、該当するマクロブロックの画像データ2をPCM符号化し、生成したPCMデータをH.264ストリーム生成部10に出力する。
H.264ストリーム生成部10は、PCM処理要求8により、算術符号化部6により生成されたマクロブロック・タイプの算術符号化データと、PCMデータ生成部9により生成されたPCMデータをH.264ストリーム11として後段側に出力する。
このようにビット長予測部12により、2値化DCT差分データのビット量を用いてビット長予測を行い、ビット長予測値が3200ビットを超えると予測した場合には、ビット長予測部12は、該当する2値化DCT差分データを算術符号化部6で算術符号化を実行させないように制御する。
このため、算術符号化部6に入力され、この算術符号化部6により算術符号化されるDCT差分データは、そのビット量が3200以内に収まると予測されたもののみとなる。従って、本実施形態によれば、算術符号化部6により算術符号化した場合に、I_PCM再符号化処理が発生する頻度を下げることができる。
また、I_PCM再符号化処理が発生する頻度を下げることができるので、このH.264符号化装置1が複数のマクロブロックに対してパイプライン処理を行っている場合に、I_PCM再符号化処理のためにパイプライン処理が停止する頻度を下げることが出来ることになる。
従って本実施形態によれば、H.264符号化処理効率の低下を緩和することが出来る。 図2は変形例のH.264符号化装置1Bの構成を示す。
このH.264符号化装置1Bは、図1におけるPCMデータ生成部9の代わりにPCMデータ生成部9Bを採用した構成である。
図1のH.264符号化装置1におけるPCMデータ生成部9は、PCM処理要求8が発生した場合に、該当するマクロブロックの画像データのPCMデータを生成していた。
この変形例におけるPCMデータ生成部9Bは、PCM処理要求8が発生しない場合にも算術符号化部6側とは独立して或いは並行して、マクロブロックの画像データのPCMデータを生成し、生成したPCMデータを例えばPCMデータ生成部9B内のバッファメモリ等により構成されるPCMデータ記憶部16に格納する。
換言すると、PCM処理要求8が出される前に、それが出された時のマクロブロックの画像データを(デジタルコード変換部としての)PCMデータ生成部9BによりPCMデータとして予め生成し、PCMデータ一時記憶手段としてのPCMデータ記憶部16に格納しておく。
そして、ビット長予測部12により、そのビット予測値が3200ビットを超えると予測された場合には、その予測結果に基づいて(上述した実施形態と同様に)PCM判定部7を経て直ちにPCM処理要求8が出される。このPCM処理要求8が出されると、このPCMデータ生成部9Bは、該当するPCMデータをPCMデータ記憶部16から読み出してH.264ストリーム生成部10に出力する。
このため、PCM処理要求8が出されてからPCMデータを生成し始める場合に比較して、短時間にPCMデータをH.264ストリーム生成部10に出力できる。
また、ビット長予測部12により、そのビット予測値が3200ビットを超えないと予測された場合において、算術符号化部6による算術符号化データがPCM判定部7により3200ビットを超えたと判定された場合にもPCM処理要求8がPCMデータ生成部9Bに入力される。
この場合にも、このPCMデータ生成部9Bは、該当するPCMデータをPCMデータ記憶部16から読み出してH.264ストリーム生成部10に出力する。
このため、PCM処理要求8が出されてからPCMデータを生成し始める場合に比較して、短時間にPCMデータをH.264ストリーム生成部10に出力できる。つまり、算術符号化部6の算術符号化の処理が中断される時間を十分に低減できる。
このように本変形例は、PCM処理要求8が出された場合、該当するPCMデータを速やかにH.264ストリーム生成部10に出力することができる。その他の動作は、図1の場合と同様である。
本変形例によれば、第1の実施形態の場合と同様に算術符号化部6の算術符号化の処理が中断する頻度を低減できると共に、さらに算術符号化の処理を中断する場合にも短時間の中断で済ませることができる。
このため、第1の実施形態の場合よりもさらにH.264符号化処理効率の低下を緩和することが出来る。
(第2の実施形態)
図3は本発明の第2の実施形態に係るH.264符号化装置1Bの構成を示す。このH.264符号化装置1Cは、基本的には、図4のH.264符号化装置21において、PCMデータ生成部9をPCM処理要求8が発生した場合に動作する構成であったものを、常時PCMデータを生成に使用する構成のPCMデータ生成部9Cにすると共に、PCM用2値化部13と、PCM用算術符号化部14とを備えた構成にしている。
そして、PCMデータ生成部9Cは、マクロブロックの画像データ2からPCMデータを生成して、H.264ストリーム生成部10に出力する。
また、このPCMデータ生成部9Cにより生成されるPCMデータに対応して、PCM用2値化部13は、このマクロブロック・タイプをI_PCMとして2値化し、2値化マクロブロック・タイプデータを生成する。そして、PCM用2値化部13は、この2値化マクロブロック・タイプデータをPCM用算術符号化部14に出力する。
PCM用算術符号化部14は、2値化マクロブロック・タイプデータの算術符号化を行い、PCM用算術符号化データを生成する。そして、PCM用算術符号化部14は、このPCM用算術符号化データをH.264ストリーム生成部10に出力する。
また、図4においては、PCM判定部7は、算術符号化部6内に設けられ、算術符号化データが3200ビットを超えるか否かを判定して、超えると判定した場合にはPCM処理要求8をH.264ストリーム生成部10と、PCMデータ生成部9とに出力していた。これに対して、本実施形態におけるPCM判定部7Bは、算術符号化部6の例えば外部に設けられ、算術符号化部6から算術符号化データのビット長15が入力される。
そして、PCM判定部7Bは、そのビット長15が3200ビットを超えると判定した場合には、PCM処理要求8をH.264ストリーム生成部10に出力する構成にしている。 また、算術符号化部6により生成された算術符号化データは、H.264ストリーム生成部10に入力される。
なお、本実施形態においては、算術符号化部6は、PCM判定部7BがPCM処理要求8を出力する場合にも、算術符号化の処理を中断しない(或いは中断を必要しない)構成となっている。
H.264ストリーム生成部10は、PCM判定部7BからPCM処理要求8が入力されない場合には、算術符号化部6から入力される算術符号化データを選択して、H.264ストリーム11として出力する。
一方、H.264ストリーム生成部10は、PCM判定部7BからPCM処理要求8が入力された場合には、PCMデータ生成部9Cから入力されるPCMデータとPCM用算術符号化部14から入力されるPCM用算術符号化データを連結してH.264ストリーム11として出力する。
その他は、図4のH.264符号化装置21の構成及び動作と類似している。本実施形態においては、モード判定部3によるモード判定結果に応じて、決定されたマクロブロップ・タイプの画像データに対して、DCTデータ生成部4、2値化部5、算術符号化部6がパイプライン的にそれぞれ動作する。
この動作と並行してPCMデータ生成部9Cは、マクロブロップ・タイプをI_PCMとして、そのマクロブロックの画像データをPCMデータの生成を行う。
また、PCM用2値化部13は、このマクロブロック・タイプをI_PCMとして2値化し、2値化マクロブロック・タイプデータを生成する。そして、PCM用2値化部13は、この2値化マクロブロック・タイプデータをPCM用算術符号化部14に出力する。 つまり、共通の画像データ2に対して、算術符号化部6側で第1の符号化を行う動作と並行して、デジタルコード変換部側のPCMデータ生成部9C側で第2の符号化の動作を行うようにしている。
そして、上述したように、H.264ストリーム生成部10は、PCM判定部7BからPCM処理要求8が入力されない場合には、算術符号化部6からの算術符号化データを選択し、逆にPCM処理要求8が入力された場合には、PCMデータ生成部9C側からのPCMデータ及びPCM用算術符号化データを選択して出力する構成にしている。
そして、算術符号化部6は、PCM判定部7BがPCM処理要求8を出力する判定を行った場合においても、算術符号化の処理を中断しない(換言すると中断を必要としない)構成にしている。
次に本実施形態のH.264符号化装置21の動作を説明する。
モード判定部3は、マクロブロックの画像データ2を読み込み、画面間符号化または画面内符号化の予測モードを評価し、マクロブロック・タイプを決定する。
また、このマクロブロックの画像データは、PCMデータ生成部9Cにも入力され、PCMデータが生成される。
DCTデータ生成部4は、モード判定部3により決定されたマクロブロック・タイプに従い、画像の差分データを求め、DCT変換を行い、DCT差分データを生成する。
2値化部5は、マクロブロック・タイプとDCT差分データを2値化し、2値化データを生成する。
算術符号化部6は、2値化データを算術符号化し、算術符号化データを生成する。このとき、算術符号化データのビット量をビット長15としてPCM判定部7Bに出力する。 PCM判定部7Bは、ビット長15が3200ビットを超えるか否かの判定を行い、超えた場合には、PCM処理要求8をH.264ストリーム生成部10に出力する。
上記のようにPCMデータ生成部9Cは、マクロブロックの画像データのPCMデータを生成する。そして、H.264ストリーム生成部10に出力する。
また、PCM用2値化部13は、マクロブロック・タイプをI_PCMとして2値化し、2値化マクロブロック・タイプデータを生成し、PCM用算術符号化部14に出力する。PCM用算術符号化部14は、2値化マクロブロック・タイプデータの算術符号化を行い、PCM用算術符号化データを生成し、H.264ストリーム生成部10に出力する。
H.264ストリーム生成部10は、PCM処理要求8が無い場合には、算術符号化部6から入力されたデータをH.264ストリーム11として出力し、PCM処理要求8がある場合には、PCM用算術符号化データとPCMデータを連結し、H.264ストリーム11として出力する。
本実施形態によれば、算術符号化部6の算術符号化データが符号化の規格上から許容される最大符号量としての3200ビットを超える事態が発生しても、並行して生成されるPCMデータをH.264ストリーム生成部10に出力することができる。
従って、算術符号化部6は、算術符号化の処理を中断することを必要としないので、H.264符号化処理の効率の低下を防止できる。
従って、本実施形態によれば、パイプライン処理を停止する必要がないので、効率良くH.264符号化処理を行うことが出来るようになる。
なお、本実施形態におけるPCMデータ生成部9Cとして、図2のPCMデータ生成部9Bを採用しても良い。
なお、本発明は、上述したH.264符号化装置の場合に限定されるものでなく、符号化の規格上で許容される最大符号量が規定されるような場合に広く適用できる。
また、上述じた実施形態等の構成を部分的に組み合わせる等して構成される実施形態も本発明に属する。
本発明の第1の実施形態に係るH.264符号化装置の構成を示すブロック図。 第1の実施形態の変形例に係るH.264符号化装置の構成を示すブロック図。 本発明の第2の実施形態に係るH.264符号化装置の構成を示すブロック図。 本発明における参考例のH.264符号化装置の構成を示すブロック図。
符号の説明
1、1B、1C…H.264符号化装置、4…DCTデータ生成部、5…2値化部、6…算術符号化部、7…PCM判定部、9…PCMデータ生成部、10…H.264ストリーム生成部、11…H.264ストリーム、12…ビット長予測部

Claims (5)

  1. 所定のブロックサイズの画像データを直交変換する直交変換部と、
    前記直交変換部から出力される画像データを2値化する2値化部と、
    前記2値化部により生成された2値化データに対して算術符号化を行う算術符号化部と、
    前記2値化データから、前記算術符号化部により生成される算術符号化データが、符号化の規格上において、前記所定のブロックサイズの場合に対して、許容される最大符号量を超えるか否かの予測を行う予測部と、
    を具備し、
    前記予測部により、前記算術符号化データが、前記最大符号量を超えると予測した場合には、前記算術符号化部による該当する2値化データに対する算術符号化を実行させない制御を行うことを特徴とする符号化装置。
  2. 所定のブロックサイズの画像データを直交変換する直交変換部と、
    前記直交変換部から出力される変換データを2値化する2値化部と、
    前記2値化部により生成された2値化データに対して算術符号化を行い、前記画像データの第1の符号化データとしての算術符号化データを生成する算術符号化部と、
    前記画像データをデジタルコードに変換して、前記画像データの第2の符号化データとしてのデジタルコードデータの生成を、前記算術符号化部の動作と並行して行うデジタルコード変換部と、
    前記算術符号化部により生成された算術符号化データが、符号化の規格上において、前記所定のブロックサイズの場合に対して、許容される最大符号量を超えるか否かの判定を行う判定部と、
    前記判定部により、前記算術符号化データが、前記最大符号量を超えると判定した場合には、前記デジタルコード変換部により変換されたデジタルコードデータを前記画像データの符号化データとして選択してストリームを出力するストリーム生成部と、
    を具備することを特徴とする符号化装置。
  3. 前記予測部は、前記2値化データのデータ量に、所定のパラメータ値を乗算若しくは除算することにより前記予測を行うことを特徴とする請求項1に記載の符号化装置。
  4. さらに、前記予測部が前記予測に用いる前記2値化データに対応する画像データを予めデジタルコードに変換するデジタルコード変換部と、該デジタルコード変換部により生成されたデジタルコードを記憶する記憶部とを有することを特徴とする請求項1又は3に記載の符号化装置。
  5. 前記直交変換部、前記2値化、及び前記算術符号化部は、それぞれ異なる領域に対応する各ブロックサイズの画像データに対する処理を実行可能なパイプライン方式の構成である特徴とする請求項1又は2に記載の符号化装置。
JP2007268206A 2007-10-15 2007-10-15 符号化装置 Pending JP2009100125A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007268206A JP2009100125A (ja) 2007-10-15 2007-10-15 符号化装置
US12/245,984 US20090097567A1 (en) 2007-10-15 2008-10-06 Encoding apparatus and encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007268206A JP2009100125A (ja) 2007-10-15 2007-10-15 符号化装置

Publications (1)

Publication Number Publication Date
JP2009100125A true JP2009100125A (ja) 2009-05-07

Family

ID=40534160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007268206A Pending JP2009100125A (ja) 2007-10-15 2007-10-15 符号化装置

Country Status (2)

Country Link
US (1) US20090097567A1 (ja)
JP (1) JP2009100125A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012060261A (ja) * 2010-09-06 2012-03-22 Sony Corp 画像処理装置および方法
WO2012070232A1 (ja) * 2010-11-26 2012-05-31 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
WO2012120910A1 (ja) * 2011-03-10 2012-09-13 パナソニック株式会社 動画像符号化装置および動画像符号化方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5949778B2 (ja) * 2011-11-01 2016-07-13 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法およびプログラム
TWI514851B (zh) * 2012-02-15 2015-12-21 Novatek Microelectronics Corp 影像編碼/解碼系統與其方法
CN103260023A (zh) * 2012-02-21 2013-08-21 联咏科技股份有限公司 图像编码/解码***与其方法
JP6337380B2 (ja) * 2013-07-31 2018-06-06 サン パテント トラスト 画像符号化方法および画像符号化装置
US9813381B2 (en) * 2014-06-18 2017-11-07 Open Text Sa Ulc Flexible and secure transformation of data using stream pipes
CN109561313B (zh) * 2018-10-16 2020-04-24 北京大学 一种基于分块的脉冲序列压缩方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004135251A (ja) * 2002-10-10 2004-04-30 Sony Corp 画像情報符号化方法及び画像情報復号方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69227217T2 (de) * 1991-07-15 1999-03-25 Canon Kk Bildkodierung
WO2004030369A1 (en) * 2002-09-27 2004-04-08 Videosoft, Inc. Real-time video coding/decoding
US6894628B2 (en) * 2003-07-17 2005-05-17 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and methods for entropy-encoding or entropy-decoding using an initialization of context variables
JP2005184232A (ja) * 2003-12-17 2005-07-07 Sony Corp 符号化装置、プログラム、およびデータ処理方法
JP4227067B2 (ja) * 2004-04-28 2009-02-18 株式会社東芝 動画像符号化方法と装置及びプログラム
KR100746007B1 (ko) * 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004135251A (ja) * 2002-10-10 2004-04-30 Sony Corp 画像情報符号化方法及び画像情報復号方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8873871B2 (en) 2010-09-06 2014-10-28 Sony Corporation Image processing apparatus and method
US9838715B2 (en) 2010-09-06 2017-12-05 Sony Corporation Image processing apparatus and method
US9414068B2 (en) 2010-09-06 2016-08-09 Sony Corporation Image processing apparatus and method
JP2012060261A (ja) * 2010-09-06 2012-03-22 Sony Corp 画像処理装置および方法
JP2013179689A (ja) * 2010-11-26 2013-09-09 Nec Corp 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
JP5321753B2 (ja) * 2010-11-26 2013-10-23 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
WO2012070232A1 (ja) * 2010-11-26 2012-05-31 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
US10154267B2 (en) 2010-11-26 2018-12-11 Nec Corporation Video encoding device, video decoding device, video encoding method, video decoding method, and program
US10742991B2 (en) 2010-11-26 2020-08-11 Nec Corporation Video encoding device, video decoding device, video encoding method, video decoding method, and program
US11310510B2 (en) 2010-11-26 2022-04-19 Nec Corporation Video encoding device, video decoding device, video encoding method, video decoding method, and program
US11659189B2 (en) 2010-11-26 2023-05-23 Nec Corporation Video encoding device, video decoding device, video encoding method, video decoding method, and program
US11659188B2 (en) 2010-11-26 2023-05-23 Nec Corporation Video encoding device, video decoding device, video encoding method, video decoding method, and program
WO2012120910A1 (ja) * 2011-03-10 2012-09-13 パナソニック株式会社 動画像符号化装置および動画像符号化方法

Also Published As

Publication number Publication date
US20090097567A1 (en) 2009-04-16

Similar Documents

Publication Publication Date Title
JP2009100125A (ja) 符号化装置
US7848579B2 (en) Image coding device, method and computer program with data coding amount prediction
JP4819940B2 (ja) 動画像符号化装置
JP2009118233A (ja) 動画像符号化装置および復号装置
JP2008017225A (ja) 通信端末装置
JP2010178319A (ja) 画像符号化装置及び画像符号化方法
JPWO2009090964A1 (ja) 同期制御方法および情報処理装置
JP6985546B2 (ja) 画像復号装置、画像復号方法及びプログラム
JP2005252555A (ja) ビデオ情報再符号化装置
JP5197428B2 (ja) 画像符号化装置及び画像符号化方法
JP2006279272A (ja) 動画像符号化装置およびその符号化制御方法
JP2007306370A (ja) 画像符号化記録装置
JP2006332986A (ja) 動画像符号化方式変換装置
JP4367354B2 (ja) 画像符号化装置
JP2008271213A (ja) 画像符号化装置
JP2009005217A (ja) 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラム,画像復号プログラムおよびコンピュータ読み取り可能な記録媒体
JP2007266679A (ja) 動画像符号化装置
JP2014011481A (ja) 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
JP2007336005A (ja) 画像符号化装置および画像符号化方法
JP2006303987A (ja) 画像符号化装置及び画像符号化方法
US9485509B2 (en) Image compression device, image compression method, image decompression device, and image decompression method
JP2007088678A (ja) 画像符号化装置
JP2007208802A (ja) 画像符号化装置及び画像符号化方法
JP7450078B1 (ja) 映像符号化装置、および、映像符号化方法
JP4253572B2 (ja) 画像符号化装置、画像符号化方法および画像符号化プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110322

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110712