JP2008533853A - 先読みを伴う準一定品質のレート制御 - Google Patents

先読みを伴う準一定品質のレート制御 Download PDF

Info

Publication number
JP2008533853A
JP2008533853A JP2008501002A JP2008501002A JP2008533853A JP 2008533853 A JP2008533853 A JP 2008533853A JP 2008501002 A JP2008501002 A JP 2008501002A JP 2008501002 A JP2008501002 A JP 2008501002A JP 2008533853 A JP2008533853 A JP 2008533853A
Authority
JP
Japan
Prior art keywords
encoding
data
complexity
bit rate
multimedia data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008501002A
Other languages
English (en)
Inventor
ティアン、タオ
チェン、ペイソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2008533853A publication Critical patent/JP2008533853A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • H04N21/23655Statistical multiplexing, e.g. by controlling the encoder to alter its bitrate to optimize the bandwidth utilization
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2385Channel allocation; Bandwidth allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4347Demultiplexing of several video streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】先読みを伴う準一定品質のレート制御。
【解決手段】方法および装置は、ライブビデオストリームなどのマルチメディアデータを効率的に符号化する。1秒など、あらかじめ決定された時間間隔の符号化複雑度が、使用されることになる実際の符号化の前に推定される。これにより、実際の符号化が、複雑度の先験的推定値を用いて実行されることが可能になり、あらかじめ決定された時間間隔について割り付けられるビット(ビットレート)は、あらかじめ決定された時間間隔内に効率的に割り付けられることが可能になる。さらに、推定された複雑度は、マルチプレクサなどのデバイスに対して供給されることができ、次いでこのデバイスは、これらのビデオチャネルについて予想される符号化複雑度に従って多重化されたビデオチャネルの収集のために使用可能な帯域幅を割り付けることができ、次いでこれにより、特定のチャネルの品質は、多重化されたビデオチャネルの収集についての帯域幅が比較的一定のときでさえ、比較的一定にとどまることが可能になる。
【選択図】 図2

Description

(35U.S.C.§119の下における優先権の主張)
本特許出願は、この譲受人に譲渡され、ここに参照することによりここで明確に組み込まれる、2005年3月10日に出願された「先読みを伴う準一定品質のレート制御のための方法および装置(METHOD AND APPARATUS FOR QUASI-CONSTANT-QUALITY RATE CONTROL WITH LOOK-AHEAD)」という名称の仮出願第60/660,908号に対する優先権を主張する。
(技術分野)
本発明は、一般にデジタルビデオに関し、より詳細にはビデオ圧縮に関する。
インターネットおよび無線通信の爆発的な成長およびすばらしい成功、ならびにマルチメディアサービスについてのますます増大する要求によって、インターネットチャネルおよびモバイル/無線チャネル上のストリーミングメディア(streaming media)は、すさまじい注意を引いてきている。異種のインターネットプロトコル(Internet Protocol)(IP)ネットワークにおいては、ビデオは、サーバによって供給され、1つまたは複数のクライアントによって流されることができる。有線接続は、ダイアルアップ(dial-up)、統合サービスデジタル網(integrated services digital network)(ISDN)、ケーブル、デジタル加入者回線プロトコル(digital subscriber line protocol)(まとめてxDSLと称される)、ファイバ、ローカルエリアネットワーク(local area network)(LAN)、ワイドエリアネットワーク(wide area network)(WAN)などを含む。伝送モードは、ユニキャスト(uni-cast)またはマルチキャスト(multi-cast)のいずれともすることができる。
モバイル/無線通信は、異種のIPネットワークに類似している。モバイル/無線チャネル上でのマルチメディアコンテンツ(multimedia content)の移送は、これらのチャネルが、多くの場合にマルチパスフェーディング(multi-path fading)、シャドーイング(shadowing)、シンボル間干渉、および騒音障害(noise disturbance)によって非常に損なわれるので、非常に課題が多い。移動性や競合するトラフィックなど一部の他の理由もまた、帯域幅の変動および損失を引き起こす。チャネル雑音と、サービスを受けるユーザ数は、チャネル環境の時間的に変化する特性を決定する。
デジタルビデオは、一般的に効率的な記憶および/または伝送のために圧縮される。ビデオ圧縮の多数の規格が存在している。
ビデオ圧縮に共通する1つの問題は、帯域幅(毎秒当たりのビット)とビジュアル品質(visual quality)との間の妥協である。ピーク信号対雑音比(peak signal-to-noise ratio)(PSNR)など様々な測定値が、ビジュアル品質にアクセスするために使用されることができる。一定のフレームレートでは、ビデオのフレームを符号化するために使用されるビットは、ビデオについてのビットレートまたは帯域幅に直接に比例することになることと、これらの用語(ビットおよび帯域幅)は、技術的には同じではないが、当技術分野においてしばしば交換可能に使用されることがあり、その正確な解釈は、文脈から決定され得ることが理解されるであろう。
比較的に良好なビジュアル品質のために必要とされる帯域幅は、符号化されているビデオの複雑度と共に変化することになる。例えば、ニュースキャスターのショットなど比較的静的なショットは、比較的低い帯域幅を用いて比較的高いビジュアル品質で符号化されることができる。対照的に、スポーツイベントにおける運動選手をパンするショットなど比較的動的なショットは、同じビジュアル品質のために比較的大量の帯域幅を消費する可能性がある。
比較的一定の品質を達成するためには、フレームを符号化するために使用可能なビット数を変化させる可変ビットレート(variable bit rate)(VBR)として知られている技法を使用することが望ましい。しかし、これらのVBR技法は、一般に伝送されるビデオコンテンツの場合においては適用可能ではない。デジタルビデオコンテンツ(digital video content)は、光ネットワーク、有線ネットワーク、無線ネットワーク、衛星などを経由するなど、様々な媒体を経由して伝送されることができる。ブロードキャストするときに、これらの通信媒体は、一般的に帯域制限されている。したがって、定ビットレート(constant bit rate)(CBR)技法は、一般的に伝送環境またはブロードキャスト環境において見出される。
定ビットレート(CBR)技法の使用に伴う問題は、ビジュアル品質が、符号化されているビデオの複雑度に従って変化することになることである。ブロードキャスターのショットなど、ショットが比較的静的であるときには、ある与えられた品質レベルについて必要とされるよりも多いビットが消費され、または「浪費される」ことになる。スポーツにおけるなど、ショットが比較的動的であるときには、品質は、CBRで悪化する可能性がある。ビジュアル品質が損なわれるときには、ビジュアルアーティファクト(visual artifact)が明らかになる可能性があり、例えば「ブロッキネス(blockiness)」として観察される可能性がある。
したがって当技術分野においては、伝送媒体についての比較的一定のビットレートの有利な属性と、視聴者の楽しみのための比較的一定のビジュアル品質とを組み合わせることができる符号化技法についての必要性が存在する。
概要
ここにおいて開示されるシステムおよび方法は、例えばあらかじめ決定された時間ウィンドウにおいて1つまたは複数のマルチメディアデータについての符号化複雑度(encoding complexity)を推定し、また符号化するためのビットレートを決定する推定された符号化複雑度を使用することにより、上記の必要性に対処している。
一態様は、受け取られるビデオデータを符号化する方法であり、ここで本方法は、ビデオデータの第1の部分についての第1の符号化複雑度を決定することと、その第1の符号化複雑度に少なくとも部分的に基づいてビデオデータの第1の部分を符号化することとを含む。
一態様は、受け取られるビデオデータを符号化するための装置であり、ここで本装置は、ビデオデータの第1の部分についての第1の符号化複雑度を決定するための手段と、その第1の符号化複雑度に少なくとも部分的に基づいてビデオデータの第1の部分を符号化するための手段とを含む。
一態様は、受け取られるビデオデータを符号化する装置であり、ここで本装置は、ビデオデータの第1の部分についての第1の符号化複雑度を決定するように構成されるプロセッサと、その第1の符号化複雑度に少なくとも部分的に基づいてビデオデータの第1の部分を符号化するように構成されるエンコーダとを含む。
一態様は、受け取られるビデオデータを符号化するための命令を有する有形媒体中に実施されるコンピュータプログラムプロダクトであり、ここで本コンピュータプログラムプロダクトは、ビデオデータの第1の部分についての第1の符号化複雑度を決定するための命令を有するモジュールと、その第1の符号化複雑度に少なくとも部分的に基づいてビデオデータの第1の部分を符号化するための命令を有するモジュールとを含む。
一態様は、マルチメディアデータを符号化するための方法であり、ここで本方法は、選択されるウィンドウのデータに対応する第1のマルチメディアデータを符号化することと、第1のマルチメディアデータを再符号化しながら、第1のマルチメディアデータと異なる、選択されるウィンドウのデータに対応する第2のマルチメディアデータを符号化することとを含む。
一態様は、マルチメディアデータを符号化するための装置であり、ここで本装置は、選択されるウィンドウのデータに対応する第1のマルチメディアデータと、第1のマルチメディアデータと異なる、選択されるウィンドウのデータに対応する第2のマルチメディアデータとを符号化するための手段と、その符号化手段が第2のマルチメディアデータを符号化する間に、第1のマルチメディアデータを再符号化するための手段とを含む。
一態様は、マルチメディアデータを符号化するための装置であり、ここで本装置は、選択されるウィンドウのデータに対応する第1のマルチメディアデータを符号化し、第1のマルチメディアデータと異なる、選択されるウィンドウのデータに対応する第2のマルチメディアデータを符号化するように構成される第1のエンコーダと、第1のエンコーダが、第2のマルチメディアデータを符号化している間に、第1のマルチメディアデータを再符号化するように構成される第2のエンコーダとを含む。
一態様は、伝送されるときに一緒に多重化され搬送される複数の(multiple)ビデオチャネルについてのビデオデータを符号化する方法であり、ここで本方法は、複数のビデオチャネルについてのビデオ符号化のためのビデオフレームを受け取ることと、ほぼ同じ品質レベルで複数のチャネルのうちの一部分を符号化することが必要とされ、その符号化される部分についてのデータが一緒に多重化され搬送されるべきであるデータの相対量を決定することと、データのその決定された相対量に従って符号化される部分についてのデータを割り付けることと、その割り付けられたデータに従ってビデオフレームを符号化することと、伝送のために符号化されたビデオフレームを多重化することとを含む。
一態様は、帯域制限された伝送媒体において一緒に多重化される複数のビデオチャネルを符号化する方法であり、ここで本方法は、一緒に符号化され、多重化され、次いで伝送されるべき複数のチャネルから、チャネルごとにあらかじめ決定された時間間隔に対応する少なくとも複数のフレームを含む複数のビデオフレームを受け取ることと、複数のチャネルのビジュアル品質が、符号化複雑度の違いに関係なくほぼ同じであるように複数のチャネルについて使用可能なビットを複数のチャネル間に割り付けることと、その割り付けられたビットに従って符号化することを含む。
一態様は、圧縮されるように符号化されるべき、少なくとも第1のビデオチャネルと第2のビデオチャネルとを含む2つ以上のビデオチャネルの間に使用可能な帯域幅を割り付ける方法であり、ここで本方法は、第1のビデオチャネルの、ビデオクリップの存続時間よりも短いあらかじめ決定された時間間隔のビデオフレームの組に関連する符号化複雑度を推定することと、なお推定することは、実際に使用されることになる符号化の前に実行される;ビデオフレームの組の実際の符号化のためにその推定された符号化複雑度に少なくとも部分的に基づいた情報を使用することと;を含む。
一態様は、複数のチャネル間に使用可能な帯域幅を割り付ける方法であり、ここで本方法は、複数のチャネルのうちのおのおのについてビデオフレームの組についての符号化複雑度メトリックに関する情報を受け取ることと、なおビデオフレームの組についてのデータは、同じ期間中に伝送するために多重化されるべきである;チャネルごとにその符号化複雑度メトリックに少なくとも部分的に基づいてその期間についての使用可能なビットを多重化されたチャネル間に割り付けることと;を含む。
一態様は、ビデオ符号化するための装置であり、ここで本装置は、ビデオクリップの長さに関連する期間よりも短いあらかじめ決定された期間に対応するビデオフレームの組に関連する符号化複雑度を推定するように構成される第1の処理要素と、その推定された符号化複雑度に少なくとも部分的に基づいて選択されるビットレートを使用してビデオフレームの組を符号化するように構成される第2の処理要素とを含む。
一態様は、複数のチャネル間に使用可能な帯域幅を割り付けるための装置であり、ここで本装置は、複数のチャネルのうちのおのおのについてビデオフレームの収集のための符号化複雑度メトリックに関する情報を受け取るように構成される分配回路と、なおビデオフレームの収集についてのデータは、同じ期間中における伝送のために多重化されるべきである;チャネルごとにその符号化複雑度メトリックに少なくとも部分的に基づいてその期間についての使用可能なビットを多重化されたチャネル間に割り付けるように構成される計算回路と;を含む。
一態様は、マルチメディアデータを符号化するための命令を有する有形媒体中に実施されるコンピュータプログラムプロダクトであり、ここで本コンピュータプログラムプロダクトは、選択されるウィンドウのデータに対応する第1のマルチメディアデータを符号化するための、また第1のマルチメディアデータと異なる、選択されるウィンドウのデータに対応する第2のマルチメディアデータを符号化するための命令を有するモジュールと、符号化するための命令を有するそのモジュールが、第2のマルチメディアデータを符号化している間に第1のマルチメディアデータを再符号化するための命令を有するモジュールを含む。
以降の説明においては、特定の詳細が、実施形態の完全な理解をもたらすために与えられる。しかし、それらの実施形態は、これらの特定の詳細なしに実行されることができることが、当業者によって理解されるであろう。例えば、電気コンポーネントは、それらの実施形態を不必要な詳細の形であいまいにしないようにブロック図に示されることができる。他の例においては、そのようなコンポーネント、他の構成および技法は、それらの実施形態をさらに説明するために詳細に示されることができる。別個のブロックとして示される電気コンポーネントは、再配置され、かつ/または1つのコンポーネントへと組み合わされることができることも理解される。
一部の実施形態は、プロセスとして説明されることができ、このプロセスは、フローチャート、流れ図、構成図、またはブロック図として示されることにも注目される。フローチャートは、オペレーションを逐次的プロセスとして説明することができるが、オペレーションの多くは、並列に、または同時に実行されることができ、プロセスは、反復されることができる。さらに、オペレーションの順序は、再配置されることができる。プロセスは、そのオペレーションが完了されるときに終了される。プロセスは、方法、関数(funcion)、プロシージャ、サブルーチン、サブプログラムなどに対応していてもよい。プロセスが関数に対応するときには、その終了は、その呼出し関数または主要関数に対するその関数のリターン(return)に対応する。
以下で説明される方法および装置は、ライブビデオチャネル(live video channel)などのマルチメディアデータを効率的に符号化する。ウィンドウが、時間またはデータの選択される量に、例えば約1秒または1秒などマルチメディアデータの一部分に基づいている可能性がある場合における選択されるウィンドウの符号化複雑度は、実際の符号化が使用されることになる前に推定される。これにより、実際の符号化は、複雑度の先験的推定値を用いて実行されることが可能になり、それによってあらかじめ決定された時間間隔について割り付けられたビット(ビットレート)が選択ウィンドウ内において効率的に割り付けられることが可能になる。
ビットレートは、帯域幅または品質あるいはそれらの両方に基づいてビットレートを推定するデバイスから入力されることができる。例えば、マルチプレクサは、ビットレートを提供するように実施されることができる。その品質は、複雑度に基づいたコンテンツの分類に基づいたものとすることができる。そのような分類は、「マルチメディア処理のためのコンテンツの分類(Content Classification for Multimedia Processing)」という名称の同時係属特許出願第「 」号中において論じられている。
さらに、推定された複雑度は、マルチプレクサなどのデバイスに供給されることができ、このデバイスは、次いでこれらのマルチメディアチャネルについて予想される符号化複雑度に従って、ビデオチャネルなど多重化されたマルチメディアチャネルの集まり(collection)のために使用可能な帯域幅を割り付けることができ、次いでたとえ多重化チャネルの集まりのための帯域幅が比較的一定であるとしても、このデバイスにより、特定のチャネルの品質は比較的一定のままに留まることが可能になる。これにより、チャネルの集まりの内部のチャネルが、比較的一定のビットレートと可変なビジュアル品質ではなくて、可変なビットレートと比較的一定のビジュアル品質を有するようになる。
図1は、マルチメディアデータ102の、チャネルなど複数の(multiple)ソースの符号化を示すシステム図である。マルチメディアデータ102は、それぞれのエンコーダ104によって符号化され、これらのエンコーダは、マルチプレクサ(MUX)106が、次に伝送媒体108と通信しているときに、通信している。例えば、マルチメディアデータ102は、ニュースチャネル、スポーツチャネル、ムービーチャネルなど、様々なコンテンツチャネルに対応することができる。エンコーダ104は、マルチメディアデータ102をシステムのために指定された符号化フォーマットへと符号化する。ビデオデータの符号化の場合について説明されるが、開示される技法の原理および利点は、例えばビジュアルデータおよび/またはオーディオデータを含めて、マルチメディアデータに対して一般に適用可能である。符号化されたマルチメディアデータは、マルチプレクサ106に対して供給され、このマルチプレクサは、様々な符号化されたマルチメディアデータを組み合わせ、その組み合わされたデータを伝送のために伝送媒体108に対して送信する。
伝送媒体108は、それだけには限定されないが、DirecTV(登録商標)などのデジタル衛星通信、デジタルケーブル、有線および無線のインターネット通信、光ネットワーク、セル電話網など、様々な媒体に対応する可能性がある。無線通信システムの場合には、伝送媒体108は、例えば、符号分割多元接続(code division multiple access)(CDMAまたはCDMA2000)通信システムの一部分を備えることができ、あるいは代わりに、そのシステムは、周波数分割多元接続(frequency division multiple access)(FDMA)システム、直交周波数分割多元接続(orthogonal frequency division multiple access)(OFDMA)システム、サービス業界のためのGSM/GPRS(汎用パケット無線サービス(General Packet Radio Service))/EDGE(拡張データGSM環境(enhanced data GSM environment))やTETRA(地上トランクド無線(Terrestrial Trunked Radio))モバイル電話技術などの時分割多元接続(time division multiple access)(TDMA)システム、広帯域符号分割多元接続(wideband code division multiple access)(WCDMA)、高データレート(1×EV−DOまたは1×EV−DOゴールドマルチキャスト(Gold Multicast))システム、または一般に技法の組合せを使用した任意の無線通信システムとすることができる。伝送媒体108は、例えば無線周波数(radio frequency)(RF)への変調を含むことができる。一般的に、スペクトル制約条件などに起因して、伝送媒体は、限られた帯域幅を有し、伝送媒体に対するマルチプレクサ106からのデータは、比較的定ビットレート(CBR)に保持される。
従来のシステムにおいて、マルチプレクサ106の出力における定ビットレート(CBR)の使用は、マルチプレクサ106に入力として供給される符号化されたマルチメディアデータもまた、CBRであることを必要とする。背景において説明されるように、例えばビデオコンテンツを符号化するときのCBRの使用は、可変なビジュアル品質をもたらす可能性があり、これは一般的に望ましくない。
図に示されるシステムにおいては、2つ以上のエンコーダ104が、入力データの予想される符号化複雑度を通信する。1つまたは複数のエンコーダ104は、応答してマルチプレクサ106から適応させられたビットレート制御を受けることができる。これにより、比較的複雑なマルチメディアを符号化することを予想するエンコーダは、準可変なビットレート様式でマルチメディアのこれらのフレームについて、より高いビットレートまたはより高い帯域幅(フレーム当たりのより多くのビット)を受け取ることが可能になる。これにより、例えばビジュアルの場合に、マルチメディアデータ102は、より一定のビジュアル品質で符号化されることが可能になる。比較的複雑なビデオを符号化する特定のエンコーダ104によって使用される余分な帯域幅は、エンコーダが定ビットレートで動作するように実施された場合に、そうでなければ他のマルチメディアデータ102を符号化するために使用されていることになるビットに由来する。これは、マルチプレクサ106の出力を定ビットレート(CBR)に保持する。
マルチメディアデータ102の個別のソースは、比較的バーストが多い、すなわち使用される帯域幅が変化する可能性があるが、マルチメディアデータの複数のソースの累積的な総量には、あまりバーストがない可能性がある。あまり複雑でないマルチメディアを符号化しているチャネルからのビットレートは、例えばマルチプレクサ106によって比較的複雑なマルチメディアを符号化しているチャネルに対して再割付けされることができ、これは、例えば全体として組み合わされたマルチメディアデータのビジュアル品質を高めることができる。開示される技法は、マルチメディアデータについての帯域幅の設定におけるユーザの介入が、ほとんどまたは全く必要とされないように適応して帯域幅を割り付けるために使用されることができる。
一例においては、エンコーダ104は、一緒に符号化され多重化されるべき、ビデオフレームなどのマルチメディアデータの組の複雑度の指示をマルチプレクサ106に供給する。例えば、マルチプレクサ106は、符号化されたデータの1秒の長さのデータウィンドウなど、データのあらかじめ決定されたウィンドウを一度に多重化することができる。データのこのあらかじめ決定されたウィンドウにおいては、マルチプレクサ106の出力は、伝送媒体108のために指定されたビットレートより高くない出力を供給すべきである。
例えば、複雑度の指示は、ある与えられたレベルの品質についてデータのウィンドウについてのマルチメディアデータを符号化するために使用されることになるビット数の推定値に対応する可能性がある。マルチプレクサ106は、複雑度の指示を解析し、割り付けられたビット数または帯域幅を様々なエンコーダ104に供給し、エンコーダ104は、その組におけるマルチメディアデータを符号化するためにこの情報を使用する。これにより、1組のマルチメディアデータは、個々に可変なビットレートであり、しかもグループとして定ビットレートを達成することが可能になる。
図2は、符号化のプロセスを一般的に示すフローチャートである。図示されるプロセスは、様々なやり方で修正されることができることが当業者によって理解されるであろう。例えば、別の実施形態においては、図示されるプロセスの様々な部分は、組み合わされることができ、代替シーケンスの形で再構成されることができ、取り除かれることができるなどとなる。
プロセスの状態210および220は、その出力が多重化されているエンコーダのグループにとって使用可能な帯域幅を効率的に使用するために、マルチプレクサを経由して他のエンコーダと協調して符号化している、図1のエンコーダ104などのエンコーダ手段の観点から説明されることになる。状態320および330は、マルチプレクサから分離している場合に、マルチプレクサまたは他の帯域幅割付けデバイスの観点から書かれている。
図示されるプロセスは、状態210において、あらかじめ決定された期間またはウィンドウについての符号化複雑度を推定する。このあらかじめ決定された期間またはウィンドウは、比較的広い範囲内で変化することができる。例えば、このあらかじめ決定された期間は、約500ミリ秒から約10000ミリ秒まで変化することができる。あらかじめ決定された期間についての比較的良好な値は、約1秒である。ピクチャのグループが、あらかじめ決定された期間と偶然に一致していない限り、「スーパーフレーム」と名付けられるこのあらかじめ決定された期間は、ピクチャのグループ(group of picture)(GOP)、すなわちフレーム内部に関連したピクチャのグループについての期間に対応していないことに注意すべきである。そうではなくて、スーパーフレームは、ある与えられた数の逐次的ピクチャとすることができる。マルチプレクサまたは同様なデバイスが、多重化されるようにパッケージするための、あらかじめ決定された数のフレームなど、周期的間隔内の様々なマルチメディアデータを収集する場合のシステムにおいては、あらかじめ決定された期間は、マルチプレクサによって使用される周期的時間間隔に一致すべきであることが理解されるであろう。例えば、マルチプレクサは、多重化されたデータについての帯域幅制限に従うようにビットまたは帯域幅を個別のチャネルに割り付ける、例えば約1秒のあらかじめ決定された時間間隔を使用することができる。
符号化複雑度を推定する一例は、デュアルパスまたはマルチパスの符号化スキームの「第1のパス」の符号化プロセスに類似した符号化などの符号化プロセスを経由したものである。第1のパスの符号化プロセスにおいては、デフォルト量子化パラメータ(quantization parameter)(QP)レベルなど、標準のデフォルト品質レベルが、一般的に使用される。符号化複雑度を推定するための別の技法は、以下で説明されることになる帯域幅比メトリック(bandwidth ratio metric)である。
伝統的なマルチパス符号化スキームにおいては、2時間の映画など全体のマルチメディアクリップ(multimedia clip)が、まず符号化されたビデオを保存せずに第1のパスにおいて符号化され、次いでもう一度符号化される。フレームの特定の組がどれほど複雑でどれほど多くの動きを有するかなど、第1のパスの符号化から集められるメトリックまたは統計データが、次いで第2のパスまたはその後の符号化において使用されるビットレートを調整するために使用される。これは、符号化されたビデオの品質を改善する。
しかし、そのような従来のマルチパス技法は、DVD上のストレージについての映画の符号化など非リアルタイムデータの符号化のためには有用であるが、全体のクリップを符号化する遅延は、比較的に大きなレイテンシが許容可能にならないブロードキャスティングまたは他の配信の環境におけるデータの符号化については一般的に適切ではない。多くの場合に、マルチメディアデータは、ニュースブロードキャストやスポーツイベントなど、ライブであるコンテンツを搬送することができる。さらに、マルチメディアデータは、たとえ特定のコンテンツが「ライブ」でないときでさえ、そのコンテンツがライブとして扱われるように、マルチメディアを配信するエンティティ(entity)の制御できないコンテンツを搬送することもできる。
ニュースやスポーツイベントなどのライブマルチメディアデータでは、例えば存続期間が数時間の大きなレイテンシは、一般的に許容可能ではない。しかし、比較的短いレイテンシは、許容可能で、多くの状況において注目されないこともある。あらかじめ決定された期間またはウィンドウを有する開示される技法は、数秒の範囲におけるレイテンシなど、比較的短いレイテンシを導入する。これらのレイテンシは、一般的にライブコンテンツの視聴者によって反対されるべきものではない。
あらかじめ決定された期間についての符号化複雑度が知られているときに、この情報は、プロセスの実際の符号化220のためにビットを効率的に割り付けるために使用されることができる。例えば、符号化複雑度情報は、他のチャネルの符号化複雑度とは独立に使用されることができ、実際の符号化220は、依然として観察可能な利点を有することになる。ビットレートにおける小さな変動は、一般的にバッファによって対応されることができる。マルチメディアデータの他のソースからのビットレート割付けと組み合わされるときに、プロセスは、さらに改善されることさえできる。この変動については図3において説明される。
図3は、複数のソースのマルチメディアデータの複雑度に基づいてビットレートを選択しながら、符号化のプロセスを一般的に説明するフローチャートである。図示されるプロセスは、様々な方法で修正されることができることが、当業者によって認識されるであろう。例えば、別の実施形態においては、図示されるプロセスの様々な部分は、組み合わされることができ、代替シーケンスの形で再構成されることができ、取り除かれることができるなどとなる。
プロセスの状態310および340は、その出力が多重化されているエンコーダのグループにとって使用可能な帯域幅を効率的に使用するために、マルチプレクサを経由して他のエンコーダと協調して符号化している、図1のエンコーダ104などのエンコーダ手段の観点から説明されることになる。状態320および330は、マルチプレクサから分離している場合に、図1のマルチプレクサ106や他の帯域幅割付けデバイスなどのマルチプレクサ手段の観点から書かれている。
図示されるプロセスは、状態310においてあらかじめ決定された期間またはウィンドウについての符号化複雑度を推定する。この推定動作310は、図2に関連して以前に説明されたプロセスの推定動作210について説明される動作と同じとすることができる。しかし、図3の推定動作310についてのあらかじめ決定された期間は、マルチプレクサが、ビットまたは帯域幅を割り付ける期間またはウィンドウと一致すべきであることに注意すべきである。
プロセスは、320において他のチャネルからの同じあらかじめ決定された期間についての符号化複雑度を取り出すことへと進む。特定の期間において、様々な符号化されたチャネルからの符号化されたビデオは、多重化されることになり、多重化された通信チャネルに割り付けられた総帯域幅を超過すべきではない。
プロセスは、状態330において様々なチャネルの間にビットを割り付けることへと進む。例えば、符号化複雑度に関する情報は、ある与えられたビジュアル品質のために消費されることが予想されるビット数に関連づけられることができる。このビット数は、合計されることができ、チャネルに割り付けられるビット数は、消費されることが予想される相対的なビット数に依存する可能性がある。例えば、全体の使用可能な帯域幅のうちのプロラタ部分(pro-rata portion)は、チャネルのプロラタ予想される(pro-rata expected)ビット消費に基づいて各チャネルに対して分配されることができる。別の例においては、チャネルは、消費されることが予想される相対的なビット数に応じて、低い帯域幅、中間の帯域幅、または高い帯域幅のうちの1つに対するなど様々なあらかじめ選択されたビットレートに割り当てられることができる。各システムは、最大帯域幅および最小帯域幅についての個々のシステム制限を有する可能性があり、ビットの割付けはこれらの制限を超過すべきではないことにも注意すべきである。次いで、スーパーフレームと名付けられるあらかじめ決定された期間についてのフレームの組についての割り付けられたビットは、スーパーフレームレベルでビットレート制御するためにエンコーダに供給される。
次いで状態340において、エンコーダは、割り付けられたビットに従ってスーパーフレームまたはあらかじめ決定された期間のフレームを符号化する。これにより、個別のチャネルまたはチャネルのグループは、ほぼ一定の品質を達成するために可変ビットレート(variable bit rate)(VBR)を有し、しかも出力において定ビットレート(CBR)を保持するためにマルチプレクサの出力に複数のチャネルを供給することが可能になる。
図4は、マルチプレクサと対話するマルチパスの先読みビデオエンコーダの一例を示すシステム図である。図示されるシステムは、2−パスアーキテクチャ(two-pass architecture)を使用するが、2−パスよりも多いものも使用されることができることが理解されるであろう。本システムは、データストア402と、オプショナルなプリプロセッサ404と、第1のパスのエンコーダ406と、第2のパスのエンコーダ408と、マルチプレクサ106と、伝送媒体108を含む。本システムは、様々な方法で実施されることができる。例えば、1つまたは複数のオプショナルなプリプロセッサ404と、第1のパスのエンコーダ406と、第2のパスのエンコーダ408は、組み合わされることができ、分離され共通のコントローラによって制御されることができるなどである。
データストア402は、着信するマルチメディアデータを記憶する。データストア402は、ソリッドステートメモリ(solid state memory)(DRAM、SRAM)、ハードドライブ、など多種多様なデバイスによって実施されることができる。オプショナルなプリプロセッサ404は、符号化プロセス中においてフレームのグループ内におけるビット割付けのための帯域幅比メトリックを計算することができる。その帯域幅比メトリックについては後で説明される。図示されるシステムにおいては、プリプロセッサ404は、スーパーフレームレベルのビットレート制御とは独立に動作する。オプショナルなプリプロセッサ404は、第1のパスのエンコーダ406と第2のパスのエンコーダ408に対してこれらのメトリックを供給する。
オプショナルなプリプロセッサ404と、第1のパスのエンコーダ406と、第2のパスのエンコーダ408は、パイプラインアーキテクチャ(pipelined architecture)に配列される。このパイプラインアーキテクチャにおいては、ステージごとのレイテンシは同じであるべきであり、すなわち各ステージは、同じ量のデータを処理すべきである。そのデータ量は、あらかじめ決定された期間またはウィンドウのフレームに対応する。これらのフレームは、スーパーフレームと称される。第2のパスのエンコーダ408は、フレームの組を符号化しているが、第1のパスのエンコーダ406は、第2のパスのエンコーダ408によって符号化されるべきフレームの次の組の第1のパスの符号化を実行しており、オプショナルなプリプロセッサ404は、第1のパスのプロセッサ406によって符号化される第1のパスとなるべきフレームの次の組を処理する。符号化されていないビデオについての生データは、データストア402から取り出されることができ、このデータに対するリファレンスは、メモリポインタなどとしてモジュール間を通過させられることができる。
第1のパスのエンコーダ406は、あらかじめ決定された期間についてのマルチメディアデータフレームを符号化する。しかし、実際に符号化されるマルチメディアデータフレームは使用される必要がなく、一般的に切り捨てられる。ある与えられた品質レベルにおいてフレームを符号化するために使用されるビット数などの複雑度メトリックが、マルチプレクサ106に対して供給される。動きベクトル(motion vector)(MV)の計算や絶対ピクセル差(absolute pixel difference)(SAD)の和など、再使用されることができる他のデータは、第1のパスのエンコーダ406から第2のパスのエンコーダ408へと供給されることができる。
複雑度メトリックは、組み合わされた多重化データについて使用可能なビットを様々なチャネル間に割り付けるためにマルチプレクサ106によって使用される。例えば、マルチプレクサ106は、図3に関連して以前に説明されたプロセスのビットを割り付ける状態330を使用することができる。次いで、割り付けられたビットは、これらのフレームの符号化のために第2のパスのエンコーダ408に対して供給される。
次いで、第2のパスのエンコーダ408は、パイプラインの次のサイクルにおいてフレームを符号化し、符号化されたフレームは、パイプラインの後続のサイクルにおいて他のチャネルからのデータと多重化し、伝送媒体を経由して伝送するためにマルチプレクサ106に対して使用可能にされる。
図5、6、および7は、図4に示されるシステムと類似したシステムの変形を示している。他の変形は、当業者によって簡単に決定されることになる。例えば、図4に示されるシステムの一変形は、オプショナルなプリプロセッサ404を伴わないシステムである。プリプロセッサ404の除去は、そのパイプライン中の1ステージと、そのステージのレイテンシとを削除する。
図5の変形においては、プリプロセッサ502は、第1のパスの符号化以外の、それよりも複雑でない解析を実行し、複雑度メトリックを供給する。これは、例えば処理能力が限られているシステムにおいて有用になり得る。例えば、帯域幅比メトリックは、これについては後で論じられることになるが、複雑度を決定するために使用されることができる。
図5に示される変形は、データストア402、プリプロセッサ502、エンコーダ504、マルチプレクサ106、および伝送媒体108を含む。マルチプレクサ106は、プリプロセッサ502からの複雑度推定値に応じてエンコーダ504についてのビットレートを割り付けることができる。プリプロセッサ502からの帯域幅比やエンコーダ504についてのビットレート制御など、別のメトリックの間のマッピングは、線形、非線形、選択された範囲内においてルックアップテーブルを経由してマッピングされるなどとすることができる。
図6に示される変形は、マルチプレクサと対話しない。図6の変形は、データストア402と、オプショナルなプリプロセッサ404と、第1のパスのエンコーダ602と、第2のパスのエンコーダ604とを含む。マルチパスエンコーダの数は、2以外にも変化することができることが理解されるであろう。もっと正確に言えば、第1のパスのエンコーダの結果は、他のチャネルからの複雑度に依存したビットレート割付けなしに第2のパスのエンコーダによって使用される。これは、ビットレートにおけるある変動がバッファによって許容可能なシステムにおいて有用になり得るが、ほぼ定ビットレートの符号化が望ましい。図示されるシステムにおいては、第1のパスのエンコーダ602は、スーパーフレームとしても知られているあらかじめ決定された時間にわたってフレームの第1のパスの符号化を実行し、複雑度情報は、第2のパスの符号化604を設定するために使用される。図6の変形と従来のデュアルパスシステムとの間の1つの違いは、従来のデュアルパスシステムが、一度に全体のメディアクリップのパスを実行し、これがライブデータなど、ある種のタイプのデータについて非実用的であることである。
図7Aに示される変形もまた、マルチプレクサと対話しない。その変形は、データストア402と、プリプロセッサ702と、第1のパスのエンコーダ704とを含んでいる。プリプロセッサ702は、時間ウィンドウ化複雑度メトリックを第1のパスのエンコーダ704に対して供給する。第1のパスのエンコーダ704は、対応するマルチメディアデータの符号化について使用するビットレートを選択するためにこの情報を使用する。
図7Bに示される変形は、マルチプレクサと対話することができるが、必ずしも対話するとは限らない。その変形は、符号化複雑度決定手段712を含み、この符号化複雑度決定手段は、符号化手段714に対して複雑度指示を供給する。一例においては、符号化複雑度決定手段712は、プリプロセッサ502に対応する可能性があり、符号化手段714は、第1のパスのエンコーダ504に対応する可能性がある。別の例においては、符号化複雑度決定手段712は、第1のパスのエンコーダ602に対応する可能性があり、符号化手段714は、第2のパスのエンコーダ604に対応する可能性がある。一態様においては、符号化複雑度決定手段712は、データの時間ウィンドウについての複雑度情報を供給し、符号化手段714は、後でこの複雑度情報を符号化する。別の態様においては、複雑度情報は、マルチプレクサまたは他のモジュールに対して供給されることができ、次いでこれは、調整されたビットレートを符号化手段714に対して供給することができる。
図8は、マルチメディアデータの様々なソースのニーズまたは符号化複雑度に基づいて多重化システムの使用可能な帯域幅を分配するためのプロセッサ800の一例を示すシステム図である。例えば、そのようなプロセッサは、マルチプレクサ106に組み込まれることができ、あるいはマルチプレクサ106とは独立にすることができる。
図8に示されるプロセッサ800は、複雑度収集回路802と分配回路804とを含んでいる。複雑度収集回路802は、例えば複数の第1のパスのエンコーダから複雑度推定値を取り出す。これらの複雑度推定値は、収集される。総ビットレート806は、レジスタに記憶されるデータ値とすることができるが、対応するマルチメディアデータの間に割り付けられる。例えば、高い複雑度、中間の複雑度、および低い複雑度について除外される様々なビットレートが存在する可能性があり、次いでこれらのビットレートは、相対的な複雑度推定値に少なくとも部分的に基づいて選択され、それに応じて分配回路804に対して供給されることができる。次いで分配回路は、例えばスーパーフレームレベルのビットレート制御のために分配されたビットレートを使用する第2のパスのエンコーダと通信を行う。
次に他の態様が説明される。レート制御は、複数のレベルで実行されることができる。「スーパーフレーム」レベルにおけるレート制御、すなわち固定数の逐次的ピクチャについての、またはウィンドウのデータについてのレート制御は、フレーム内の、またマクロブロック内のピクチャグループ(group of pictures)(GOP)についてのレート制御に追加して使用されることができることに注意すべきである。例えば、従来の技法は、これらの他のレベル、ならびにここにおいて説明される技法の内部におけるレート制御のために使用されることができる。スーパーフレームのために選択されるコンテンツおよびサイズに応じて、ピクチャグループのサイズは、スーパーフレームのサイズよりも大きくすることも、あるいは小さくすることもできることにも注意すべきである。
帯域幅マップ生成
人間のビジュアル品質Vは、符号化複雑度Cと割り付けられたビットB(帯域幅とも称される)の両方の関数とすることができる。
符号化複雑度メトリックCは、人間の視覚の観点から空間周波数と時間周波数とを考慮することに注意すべきである。人間の目に対してより感受性のあるひずみについては、複雑度値は、それに対応してより高くなる。一般的にVは、Cと共に単調に減少し、Bと共に単調に増大していることが仮定されることができる。この3−Dの関係の一例が、図9にプロットされる。
一定のビジュアル品質を達成するために、帯域幅(B)は、式1および2の形で表現される判断基準を満たす、符号化されるべきi番目のオブジェクト(フレームまたはMB)に対して割り当てられる。
=B(C,V) (式1)
Figure 2008533853
式1および/または2において、Cは、i番目のオブジェクトの符号化複雑度であり、Bは、総使用可能帯域幅であり、Vは、オブジェクトのための達成されるビジュアル品質である。人間のビジュアル品質は、式として定式化することが難しい。したがって、上式は、正確には定義されていない。しかし、3−Dモデルがすべての変数について連続していることが仮定される場合には、帯域幅比(B/B)は、(C,V)対の近傍内で不変なものとして取り扱われることができる。帯域幅比βは、式3で定義される。
β=B/B (式3)
次いでビット割付け問題は、式4で表現されるものと定義されることができる。
Figure 2008533853
上式4においては、δは、「近傍」を示す。
符号化複雑度は、空間的にも時間的にも人間のビジュアル感受性によって影響を及ぼされる。ジロ(Girod)の人間の視覚モデルは、空間複雑度を定義するために使用されることができるモデルの一例である。このモデルは、局所的な空間周波数と周囲の照明を考慮している。結果として生ずるメトリックは、Dcsatと呼ばれる。プロセス中における事前処理ポイントにおいて、ピクチャが内部で符号化されるべき(to be Intra-coded)か、相互間で符号化されるべき(to be Inter-coded)かについては知られておらず、両方についての帯域幅比が生成される。内部で符号化されるピクチャでは、帯域幅比は、式5の形で表現される。
βINTRA=β0INTRAlog10(1+αINTRAcsat) (式5)
上式においては、Yは、MBの平均輝度成分であり、αINTRAは、輝度の2乗についての重みファクタであり、Dcsat項は、それに続いており、β0INTRAは、
Figure 2008533853
を保証する、正規化ファクタである。例えば、αINTRA=4についての値は、良好なビジュアル品質を達成する。スケーリングファクタβ0INTRAの値は、ビットが異なるビデオオブジェクトのβINTRAの間の比に従って割り付けられる限りは、重要ではない。
この関係を理解するためには、帯域幅が符号化複雑度と共に対数的に割り付けられることに注意すべきである。輝度の2乗の項は、より大きな大きさを有する係数が、符号化するためにより多くのビットを使用することを示す。対数が負の値をもたないようにするために、1が、括弧内の項に加えられる。他の底(base)を有する対数も使用されることができる。
相互間で符号化されるピクチャについてのビット割付けは、空間複雑度ならびに時間複雑度を考慮する必要がある。これは、以下で式6において表される。
βINTER=β0INTERlog10(1+αINTER・SSD・Dcsatexp(−γ||MV+MV||)) (式6)
式6において、MVおよびMVは、現行のMBについての順方向および逆方向の動きベクトルである。INTRA式中のYは、SSDによって置き換えられ、このSSDは、差の2乗の和(sum of squared difference)を意味することに注目されることができる。
式6中における||MV+MV||の役割を理解するために、人間のビジュアルシステムの次の特性、すなわち滑らかな予測可能な動き(小さな||MV+MV||)を受ける区域が、注意を引き、目によって追跡されることができ、一般的には静止した領域よりも多くのどのようなひずみも許容することができないことに注意すべきである。しかし、高速な、または予測できない動き(大きな||MV+MV||)を受ける区域は、追跡されることができず、かなりの量子化を許容することができる。実験は、αINTER=1、γ=0.001が良好なビジュアル品質を達成することを示す。
フレームタイプの決定は、βINTRAの後に実行されることができ、βINTERは、フレームごとに計算される。βINTER/βINTRA≧Tである場合、またはシーンの変化が検出される場合には、次いでフレームは、I−フレームとして符号化され、そうでなければフレームは、P−フレームまたはB−フレームとして符号化される。逐次的なB−フレームの数は、コンテンツ適応可能である。
GOPレベルレート制御(RC)とフレームレベルRC
異なるピクチャタイプは、異なる符号化効率と異なるエラー堅牢性とを有する。エンコーダとデコーダは、おのおのバッファを保持する。仮想バッファサイズは、どれほど多くのバースト性が、許容され得るかを決定する。例えば、仮想バッファサイズが8秒間のマルチメディアデータの平均サイズに設定される場合、次いでレート制御(RC)アルゴリズムは、8秒間の時間フレーム上で平均ビットレートを保持する。瞬間的なビットレートは、平均よりずっと高い、またはずっと低くすることができるが、任意の8秒間のデータにおいて、ビットレートの平均は、ターゲットビットレートの周囲の非常に近くにとどまるべきである。
エンコーダバッファのバッファ満杯度(buffer fullness)と、デコーダバッファのバッファ満杯度とは、互いに双対をなす。デコーダバッファのオーバーフローするイベントは、エンコーダバッファのアンダーフローするイベントに対応する。デコーダバッファのアンダーフローするイベントは、デコーダバッファのオーバーフローするイベントに対応する。
I−フレームQP割当て
ビットストリームの先頭において、量子化パラメータ(Quantization Parameter)(QP)は、式7に示されるような平均ピクセル当たりのビット (average bit-per-pixel)(bpp)値に従って第1のI−フレームについて計算される。
Figure 2008533853
この式は、共同ビデオチーム(Joint Video Team)(JVT)仕様から取られる。上式においてWおよびHは、それぞれピクチャの幅および高さである。
Figure 2008533853
であり、この式中におけるパラメータは、すぐにアドレス指定されることになる。
エンコーダは、以前に符号化されたP枚のピクチャのQPを追跡する。平滑化されたPピクチャのQPは、式8を介して得られる。
QP’=(1−α)×QP’+α×QP (式8)
上式において、αは指数の重みファクタであり、QPは、最近符号化されたP−フレームのQPである。
GOP中における第1のI−フレームのQPは、式9を使用して計算されることができる。
QP=QP’+ΔQP (式9)
P−フレームQP割当て
フレームサイズ上の下限は、式10に表されるようなピクチャグループ(GOP)の先頭において初期化される。
Figure 2008533853
式10は、JVTから取られ、ここでB(ni,0)は、(i−1)番目のGOPを符号化した後のバッファ占有率であり、バッファが最初に空であるようにするためにB(n0,0)=0であり、u(ni,j)は、使用可能なチャネル帯域幅であり、Fは、あらかじめ定義されたフレームレートである。
I−フレームは、符号化するために多くのビットを取る可能性がある。フレームサイズの上限は、式11に表されるように、ピクチャグループ(GOP)の先頭において初期化される。
Figure 2008533853
上式11は、JVTから取られ、ここでbは、最初のI−フレーム上で費やされる最大ビット数である。
Figure 2008533853
は、バッファについてのオーバーフロー保護ファクタである。
あらゆるフレームを符号化した後に、下限および上限は、式12および13中において表されるようにアップデートされることができる。
Figure 2008533853
Figure 2008533853
式12および13は、JVTから取られ、ここでb(ni,j)は、i番目のGOP中におけるj番目のフレームによって生成されるビット数である。
残りの先読みのための総ビット数は、式14に表されるように計算されることができる。
Figure 2008533853
式14において、NRemaingLookAheadは、残りの先読み(remaining look-Ahead)フレーム数であり、βRemainingLookAheadは、残りの先読みフレームの対応する帯域幅メトリックであり、βProjectedBWSmoothingWinは、予測される帯域幅平滑化ウィンドウ(projected bandwidth smoothing window)の帯域幅メトリックである。バッファを空にするタスクは、帯域幅平滑化ウィンドウ上に分散され、この帯域幅平滑化ウィンドウのサイズは、ユーザによってあらかじめ記述されることができることが分かる。例えば、ビデオの8秒ごとのWの平均ビットレートを保持するために、帯域幅平滑化ウィンドウは、8倍のフレームレート(秒当たりのフレーム)に設定されるべきである。
Pフレームの予測されるサイズは、式15中に表される。
Figure 2008533853
上式において、β(ni,j)は、i番目のGOP中のj番目のフレームの帯域幅メトリックであり、それは、帯域幅メトリック(B)を介して得られることができる。
バッファ占有率のアンダーフローおよびオーバーフローを防止するために、式16および17のクリッピング関数(clipping function)が、R(ni,j)に適用される。
R(ni,j)=max{L(ni,j),f(ni,j)} (式16)
R(ni,j)=min{U(ni,j),f(ni,j)} (式17)
式16および17は、JVTから取られる。JVTにおいて説明される2次のモデリング(quadratic modeling)は、QstepおよびQPを計算するために適用されることができ、ここでSは、動き推定(motion estimation)から得られるSAD値である。2次モデル中におけるパラメータは、線形回帰(linear regression)を使用してフレームごとにアップデートされることができる。
以上の考察から、フレーム間のRCは、以降の改善された特性を伴って、JVT勧告と類似していることが理解されることができる。すなわち、大きな仮想バッファは、十分なビットレート変動と準一定の品質を可能にし、フレームサイズは、フレーム複雑度マップに従って割り付けられ、先読みフレーム(スーパーフレーム)は、反因果関係の統計を活用するために使用される。
B−フレームQP割当て
この部分は、JVT勧告と同じとすることができる。たった1つのB−フレームだけが1対のI−フレームまたはP−フレームの間に存在する場合には、式18が使用されることができる。
Figure 2008533853
上式18は、JVTから取られ、式中でQPおよびQPは、I−フレームまたはP−フレームの対についての量子化パラメータである。
1対のI−フレームまたはP−フレームの間のB−フレーム数が、L(L>1)である場合、式19が、使用されることができる。
Figure 2008533853
上式は、JVTから取られ、式中でαは、第1のBフレームの量子化パラメータとQPとの間の差であり、式20aによって与えられる。
α=min{−3,max{2,2×L+QP−QP}} (式20a)
スーパーフレームレベルレート制御(RC)
スーパーフレームレベルにおけるレート制御は、スーパーフレームのサイズが最大のあらかじめ記述された値を超過しないようにするために使用される。一態様においては、符号化がマルチパスで実行される場合、スーパーフレームレベルRCは、第1のパスにおいて実行されない。
全体のスーパーフレームを符号化した後に、エンコーダは、スーパーフレームのサイズが、その限界よりも下であることを検証する。そうでない場合に、現行のスーパーフレーム中におけるフレームの帯域幅マップは、式20bに記述されるようにスケールダウンされることができる。式20bにおいて、Pは、0と1との間の保護ファクタである。
Figure 2008533853
基本ユニットレベルレート制御(RC)
基本ユニットは、1つまたは複数のマクロブロックのいずれかとすることができる。
内部基本ユニットQP(INTRA basic unit QP)調整
式21において表される関係は、内部基本ユニットQP調整のために使用されることができる。
Figure 2008533853
式21において、Aは、実験によって決定される負でないパラメータであり、
Figure 2008533853
は、ビデオオブジェクト近傍の平均帯域幅比である。A=0.08についての値は、良好なビジュアル品質を与える。QPにおける変化は、さらに急激な変化を防止するためにあらかじめ記述された制限を受ける。
相互間基本ユニットQP(INTER basic unit QP)調整
相互間基本ユニットQPは、2次モデルに従って割り当てられ、この2次モデルは、式22に表されるようにJVTから取られる。
Figure 2008533853
適応基本ユニットサイズ(adaptive basic unit size)
基本ユニットのサイズは、どれだけ頻繁にQPが調整されることができるかを決定する。しかし、あまりにも多すぎるQP調整は、オーバーヘッドを増大させる。適応基本ユニットサイジングは、類似したQPのマクロブロック(MB)を一緒にグループ分けし、それらに単一のQPを割り当てる。
図10は、マルチメディアデータを符号化するための方法の一例を示している。図示される方法は、選択されるウィンドウのデータに対応する第1のマルチメディアデータを符号化すること1010と、第1のマルチメディアデータを再符号化しながら、第1のマルチメディアデータとは異なる、選択されるウィンドウのデータに対応する第2のマルチメディアデータを符号化すること1020とを含む。
図11は、マルチメディアデータを符号化するための装置の一例を示している。図示される装置は、選択されるウィンドウのデータに対応する第1のマルチメディアデータと、第1のマルチメディアデータとは異なり、選択されるウィンドウのデータに対応する第2のマルチメディアデータとを符号化するための手段1110と、符号化手段1110が第2のマルチメディアデータを符号化する間に、第1のマルチメディアデータを再符号化するための手段1120とを含む。
当業者は、情報および信号が、様々な異なる技術および技法のうちのどれかを使用して表されることができることを理解するであろう。例えば、以上の説明全体を通して参照されることができるデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁気のフィールドまたは粒子、光のフィールドまたは粒子、あるいはそれらの任意の組合せによって表されることができる。
当業者は、ここにおいて開示される例に関連して説明される様々な例示の論理ブロック、モジュール、およびアルゴリズムステップが、電子的ハードウェア、ファームウェア、コンピュータソフトウェア、ミドルウェア、マイクロコード、あるいはそれらの組合せとして実施されることができることをさらに理解するであろう。ハードウェアおよびソフトウェアのこの交換可能性を明確に説明するために、様々な例示のコンポーネント、ブロック、モジュール、回路、およびステップが、それらの機能の観点から一般的に以上で説明されてきている。そのような機能がハードウェアとして実施されるか、あるいはソフトウェアとして実施されるかは、特定のアプリケーション、および全体的なシステムに課される設計制約条件に依存する。当業者は、特定のアプリケーションごとに変化する方法で、説明される機能を実施することができるが、そのような実施の決定は、開示される本方法の範囲からの逸脱を引き起こすものとして解釈されるべきではない。
ここにおいて開示される実施形態に関連して説明される様々な例示の論理ブロック、モジュール、および回路は、ここにおいて説明される機能を実行するように設計された汎用プロセッサ、デジタル信号処理プロセッサ(digital signal processor)(DSP)、特定用途向け集積回路(application specific integrated circuit)(ASIC)、フィールドプログラマブルゲートアレイ(field programmable gate array)(FPGA)または他のプログラマブルロジックデバイス、個別ゲートまたはトランジスタロジック、個別ハードウェアコンポーネント、あるいはそれらの任意の組合せを用いて実施され、または実行されることができる。システムの一部または全部は、図示されていないプロセッサの形で実行されることができる。汎用プロセッサは、マイクロプロセッサとすることができるが、代替案においては、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械とすることもできる。プロセッサはまた、コンピューティングデバイス(computing device)の組合せとして、例えばDSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと組み合わされた1つまたは複数のマイクロプロセッサ、あるいは他のそのような任意のコンフィギュレーションとして実施されることもできる。
ここにおいて開示される実施形態に関連して説明される方法またはアルゴリズムのステップは、ハードウェアの形で直接に、プロセッサによって実行されるソフトウェアモジュールの形で、あるいはこれらの2つの組合せの形で実施されることができる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、着脱可能ディスク、CD−ROM、あるいは当技術分野において知られているストレージ媒体の他の任意の形態の形で存在することができる。例示のストレージ媒体は、プロセッサが、ストレージ媒体から情報を読み取り、ストレージ媒体に情報を書き込むことができるように、プロセッサに結合される。代替案においては、ストレージ媒体は、プロセッサと一体になっていてもよい。プロセッサおよびストレージ媒体は、ASIC中に存在することができる。そのASICは、ユーザ端末中に存在することができる。代替案においては、プロセッサおよびストレージ媒体は、ユーザ端末中に個別コンポーネントとして存在することもできる。
本開示の実施形態の上記の説明は、いずれの当業者も本発明を作り、または使用することができるようにするために提供される。これらの実施形態に対する様々な修正は、当業者に対して簡単に明らかになり、ここにおいて定義される包括的な原理は、他の例に対しても適用されることができ、追加の要素が追加されることもできる。したがって、本発明は、ここにおいて示される実施形態だけに限定されるようには意図されず、ここにおいて開示される原理および新規特徴と整合した最も広い範囲が与えられるように意図されている。
複数のマルチメディアデータチャネルについてのデータの符号化を示すシステム図である。 符号化のプロセスを一般的に示すフローチャートである。 複数のマルチメディアチャネルについてのデータの複雑度に基づいてビットレートを選択しながら、符号化のプロセスを一般的に示すフローチャートである。 マルチプレクサと対話するマルチパスの先読みエンコーダの一例を示すシステム図である。 マルチプレクサと対話するシングルパスの先読みエンコーダの一例を示すシステム図である。 独立なマルチパスの先読みエンコーダの一例を示すシステム図である。 独立なシングルパスの先読みエンコーダの一例を示すシステム図である。 符号化複雑度決定手段と符号化手段の一例を示すシステム図である。 チャネルの必要性に基づいて多重化システムの使用可能な帯域幅を分配するための装置の一例を示すシステム図である。 符号化複雑度Cと割り付けられたビットBに対する推定されるビジュアル品質関数Vの3−Dマップである。 マルチメディアデータを符号化するための方法の一例を示す図である。 マルチメディアデータを符号化するための装置の一例を示す図である。

Claims (53)

  1. 受け取られるビデオデータを符号化する方法であって、
    前記ビデオデータの第1の部分についての第1の符号化複雑度を決定することと、
    前記第1の符号化複雑度に少なくとも部分的に基づいてビデオデータの前記第1の部分を符号化することと
    を備える方法。
  2. 前記第1の符号化複雑度に少なくとも部分的に基づいて決定されているターゲットビットレートを受け取ることをさらに備え、符号化することは、前記第1の部分を符号化することをさらに備え、その結果、前記符号化された第1の部分は、前記ターゲットビットレートに近いビットレートで伝送されることができる、請求項1に記載の方法。
  3. 前記第1の符号化複雑度は、前記第1の部分の符号化に基づいており、前記方法は、
    前記第1の符号化複雑度に少なくとも部分的に基づいて決定されているターゲットビットレートを受け取ることをさらに備え、符号化することは、前記第1の部分を再符号化することをさらに備え、その結果、前記再符号化された第1の部分は、前記ターゲットビットレートに近いビットレートで伝送されることができる、請求項1に記載の方法。
  4. 前記第1の符号化複雑度は、符号化プロセスに基づいておらず、前記方法は、
    前記ビデオデータの前記第1の部分についての第2の符号化複雑度を取り出すことをさらに備え、ターゲットビットレートは、前記第1の符号化複雑度と前記第2の符号化複雑度とに基づいて少なくとも部分的に決定される、請求項1に記載の方法。
  5. 前記第1の部分は、ビデオクリップの存続期間よりも短いあらかじめ決定された期間のビデオデータに対応する、請求項1に記載の方法。
  6. 前記あらかじめ決定された期間は、約1秒である、請求項5に記載の方法。
  7. 前記第1の部分は、あらかじめ決定された数のフレームのビデオデータに対応する、請求項1に記載の方法。
  8. 前記第1の符号化複雑度は、局所的な空間周波数と周囲の照明との組合せに基づくオブジェクトについてのメトリックの対数に少なくとも部分的に基づいている、請求項1に記載の方法。
  9. 前記オブジェクトは、マクロブロックまたはフレームである、請求項8に記載の方法。
  10. 受け取られるビデオデータを符号化するための装置であって、
    前記ビデオデータの第1の部分についての第1の符号化複雑度を決定するための手段と、
    前記第1の符号化複雑度に少なくとも部分的に基づいてビデオデータの前記第1の部分を符号化するための手段と
    を備える装置。
  11. 前記第1の符号化複雑度に少なくとも部分的に基づいて決定されているターゲットビットレートを受け取るための手段をさらに備え、符号化することは、前記第1の部分を符号化することをさらに備え、その結果、前記符号化された第1の部分は、前記ターゲットビットレートに近いビットレートで伝送されることができる、請求項10に記載の装置。
  12. 前記第1の符号化複雑度は、前記第1の部分の符号化に基づいており、前記装置は、前記第1の符号化複雑度に少なくとも部分的に基づいて決定されているターゲットビットレートを受け取るための手段をさらに備え、前記符号化手段は、前記第1の部分を再符号化するための手段をさらに備え、その結果、前記再符号化された第1の部分は、前記ターゲットビットレートに近いビットレートで伝送されることができる、請求項10に記載の装置。
  13. 前記第1の符号化複雑度は、符号化プロセスに基づいておらず、前記装置は、
    前記ビデオデータの前記第1の部分についての第2の符号化複雑度を取り出すための手段をさらに備え、ターゲットビットレートは、前記第1の符号化複雑度と前記第2の符号化複雑度とに基づいて少なくとも部分的に決定される、請求項10に記載の装置。
  14. 前記第1の部分は、ビデオクリップの存続期間よりも短いあらかじめ決定された期間のビデオデータに対応する、請求項10に記載の装置。
  15. 前記あらかじめ決定された期間は、約1秒である、請求項14に記載の装置。
  16. 前記第1の部分は、あらかじめ決定された数のフレームのビデオデータに対応する、請求項10に記載の装置。
  17. 前記第1の符号化複雑度は、局所的な空間周波数と周囲の照明との組合せに基づくオブジェクトについてのメトリックの対数に少なくとも部分的に基づいている、請求項10に記載の装置。
  18. 前記オブジェクトは、マクロブロックまたはフレームである、請求項18に記載の装置。
  19. 受け取られるビデオデータを符号化する装置であって、
    前記ビデオデータの第1の部分についての第1の符号化複雑度を決定するように構成されるプロセッサと、
    前記第1の符号化複雑度に少なくとも部分的に基づいてビデオデータの前記第1の部分を符号化するように構成されるエンコーダと
    を備える装置。
  20. 前記エンコーダは、さらに前記第1の符号化複雑度に少なくとも部分的に基づいて決定されているターゲットビットレートを受け取るように構成され、前記エンコーダは、さらに前記第1の部分を符号化するように構成され、その結果、前記符号化された第1の部分は、前記ターゲットビットレートに近いビットレートで伝送されることができる、請求項19に記載の装置。
  21. 前記第1の符号化複雑度は、前記第1の部分の符号化に基づいており、前記エンコーダは、前記第1の符号化複雑度に少なくとも部分的に基づいて決定されているターゲットビットレートを受け取るように構成され、前記エンコーダは、さらに前記第1の部分を再符号化するように構成され、その結果、前記再符号化された第1の部分は、前記ターゲットビットレートに近いビットレートで伝送されることができる、請求項19に記載の装置。
  22. 前記第1の符号化複雑度は、符号化プロセスに基づいておらず、前記エンコーダは、さらに前記ビデオデータの前記第1の部分についての第2の符号化複雑度を取り出すように構成され、ターゲットビットレートは、前記第1の符号化複雑度と前記第2の符号化複雑度とに基づいて少なくとも部分的に決定される、請求項19に記載の装置。
  23. 前記第1の部分は、ビデオクリップの存続期間よりも短いあらかじめ決定された期間のビデオデータに対応する、請求項19に記載の装置。
  24. 前記あらかじめ決定された期間は、約1秒である、請求項23に記載の装置。
  25. 前記第1の部分は、あらかじめ決定された数のフレームのビデオデータに対応する、請求項19に記載の装置。
  26. 前記第1の符号化複雑度は、局所的な空間周波数と周囲の照明との組合せに基づくオブジェクトについてのメトリックの対数に少なくとも部分的に基づいている、請求項19に記載の装置。
  27. 前記オブジェクトは、マクロブロックまたはフレームである、請求項26に記載の装置。
  28. マルチプレクサをさらに備え、前記マルチプレクサは、符号化複雑度に少なくとも部分的に基づいたターゲットビットレートを前記エンコーダに供給するように構成される、請求項26に記載の装置。
  29. 受け取られるビデオデータを符号化するための命令を有する有形媒体の形で実施されるコンピュータプログラムプロダクトであって、
    前記ビデオデータの第1の部分についての第1の符号化複雑度を決定するための命令を有するモジュールと、
    前記第1の符号化複雑度に少なくとも部分的に基づいてビデオデータの前記第1の部分を符号化するための命令を有するモジュールと
    を備えるコンピュータプログラムプロダクト。
  30. 前記第1の符号化複雑度に少なくとも部分的に基づいて決定されているターゲットビットレートを受け取るための命令を有するモジュールをさらに備え、符号化するための命令を有する前記モジュールは、前記第1の部分を符号化するための命令をさらに備え、その結果、前記符号化された第1の部分は、前記ターゲットビットレートに近いビットレートで伝送されることができる、請求項29に記載のコンピュータプログラムプロダクト。
  31. 前記第1の符号化複雑度は、前記第1の部分の符号化に基づいており、前記コンピュータプログラムプロダクトは、前記第1の符号化複雑度に少なくとも部分的に基づいて決定されているターゲットビットレートを受け取るための命令を有するモジュールをさらに備え、符号化するための命令を有する前記モジュールは、前記第1の部分を再符号化するための命令をさらに備え、その結果、前記再符号化された第1の部分は、前記ターゲットビットレートに近いビットレートで伝送されることができる、請求項29に記載のコンピュータプログラムプロダクト。
  32. 前記第1の符号化複雑度は、符号化プロセスに基づいておらず、前記コンピュータプログラムプロダクトは、
    前記ビデオデータの前記第1の部分についての第2の符号化複雑度を取り出すための命令を有するモジュールをさらに備え、ターゲットビットレートは、前記第1の符号化複雑度と前記第2の符号化複雑度とに基づいて少なくとも部分的に決定される、請求項29に記載のコンピュータプログラムプロダクト。
  33. 前記第1の部分は、ビデオクリップの存続期間よりも短いあらかじめ決定された期間のビデオデータに対応する、請求項29に記載のコンピュータプログラムプロダクト。
  34. 前記あらかじめ決定された期間は、約1秒である、請求項34に記載のコンピュータプログラムプロダクト。
  35. 前記第1の部分は、あらかじめ決定された数のフレームのビデオデータに対応する、請求項29に記載のコンピュータプログラムプロダクト。
  36. 前記第1の符号化複雑度は、局所的な空間周波数と周囲の照明との組合せに基づくオブジェクトについてのメトリックの対数に少なくとも部分的に基づいている、請求項29に記載のコンピュータプログラムプロダクト。
  37. 前記オブジェクトは、マクロブロックまたはフレームである、請求項36に記載のコンピュータプログラムプロダクト。
  38. マルチメディアデータを符号化するための方法であって、
    選択されるウィンドウのデータに対応する第1のマルチメディアデータを符号化することと、
    前記第1のマルチメディアデータを再符号化しながら、前記第1のマルチメディアデータと異なる、前記選択されるウィンドウのデータに対応する第2のマルチメディアデータを符号化することと
    を備える方法。
  39. 前記選択されるウィンドウのデータは、約1秒間のデータに対応する、請求項38に記載の方法。
  40. 前記第1のマルチメディアデータは、ビデオデータを備え、前記第1のマルチメディアデータの符号化は、
    前記ビデオデータについての符号化複雑度を決定することと、
    前記ビデオデータを符号化することと
    を備える、請求項38に記載の方法。
  41. 前記第1のマルチメディアデータを再符号化することは、前記第1のマルチメディアデータを符号化することからの符号化統計データを使用する、請求項38に記載の方法。
  42. マルチメディアデータを符号化するための装置であって、
    選択されるウィンドウのデータに対応する第1のマルチメディアデータと、前記第1のマルチメディアデータと異なる、前記選択されるウィンドウのデータに対応する第2のマルチメディアデータとを符号化するための手段と、
    前記符号化手段が、前記第2のマルチメディアデータを符号化する間に、前記第1のマルチメディアデータを再符号化するための手段と
    を備える装置。
  43. 前記選択されるウィンドウのデータは、約1秒間のデータに対応する、請求項42に記載の方法。
  44. 前記第1のマルチメディアデータは、ビデオデータを備え、前記符号化手段は、
    前記ビデオデータについての符号化複雑度を決定するための手段と、
    前記ビデオデータを符号化するための手段と
    を備える、請求項42に記載の方法。
  45. 前記再符号化手段は、前記第1のマルチメディアデータを再符号化するために前記符号化手段からの符号化統計データを使用する、請求項42に記載の方法。
  46. マルチメディアデータを符号化するための装置であって、
    選択されるウィンドウのデータに対応する第1のマルチメディアデータを符号化し、前記第1のマルチメディアデータと異なる、前記選択されるウィンドウのデータに対応する第2のマルチメディアデータを符号化するように構成される第1のエンコーダと、
    前記第1のエンコーダが、前記第2のマルチメディアデータを符号化している間に、前記第1のマルチメディアデータを再符号化するように構成される第2のエンコーダと
    を備える装置。
  47. 前記選択されるウィンドウのデータは、約1秒間のデータに対応する、請求項46に記載の装置。
  48. 前記第1のマルチメディアデータは、ビデオデータを備え、前記第1のエンコーダは、
    前記ビデオデータについての符号化複雑度を決定するように構成されるプロセッサと、
    前記ビデオデータを符号化するように構成されるエンコーダと
    を備える、請求項46に記載の装置。
  49. 前記第2のエンコーダは、前記第1のマルチメディアデータを再符号化するために前記第1のエンコーダからの符号化統計データを受け取るように構成される、請求項46に記載の装置。
  50. マルチメディアデータを符号化するための命令を有する有形媒体中に実施されるコンピュータプログラムプロダクトであって、
    選択されるウィンドウのデータに対応する第1のマルチメディアデータを符号化するための、また前記第1のマルチメディアデータと異なる、前記選択されるウィンドウのデータに対応する第2のマルチメディアデータを符号化するための命令を有するモジュールと、
    符号化するための命令を有する前記モジュールが、前記第2のマルチメディアデータを符号化している間に前記第1のマルチメディアデータを再符号化するための命令を有するモジュールと
    を備えるコンピュータプログラムプロダクト。
  51. 前記選択されるウィンドウのデータは、約1秒間のデータに対応する、請求項50に記載のコンピュータプログラムプロダクト。
  52. 前記第1のマルチメディアデータは、ビデオデータを備え、前記第1のマルチメディアデータの符号化のための命令を有する前記モジュールは、
    前記ビデオデータについての符号化複雑度を決定するための命令を有するモジュールと、
    前記ビデオデータを符号化するための命令を有するモジュールと
    を備える、請求項50に記載のコンピュータプログラムプロダクト。
  53. 前記第1のマルチメディアデータを再符号化するための命令を有する前記モジュールは、前記第1のマルチメディアデータの符号化のための命令を有する前記モジュールから受け取られる符号化統計データを使用するための命令を備える、請求項50に記載のコンピュータプログラムプロダクト。
JP2008501002A 2005-03-10 2006-03-10 先読みを伴う準一定品質のレート制御 Pending JP2008533853A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US66090805P 2005-03-10 2005-03-10
PCT/US2006/008766 WO2006099226A1 (en) 2005-03-10 2006-03-10 Quasi-constant-quality rate control with look-ahead

Publications (1)

Publication Number Publication Date
JP2008533853A true JP2008533853A (ja) 2008-08-21

Family

ID=36579436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008501002A Pending JP2008533853A (ja) 2005-03-10 2006-03-10 先読みを伴う準一定品質のレート制御

Country Status (8)

Country Link
US (1) US8565301B2 (ja)
EP (1) EP1864500A1 (ja)
JP (1) JP2008533853A (ja)
KR (1) KR100927083B1 (ja)
CN (1) CN101185337B (ja)
AR (1) AR052604A1 (ja)
TW (1) TW200644638A (ja)
WO (1) WO2006099226A1 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7483388B2 (en) * 2005-06-23 2009-01-27 Cisco Technology, Inc. Method and system for sending a multimedia stream in an IP multicast network
US7596657B2 (en) * 2006-01-13 2009-09-29 Paul Kaler Increased storage capacity for solid state disks using data compression
US20100111163A1 (en) * 2006-09-28 2010-05-06 Hua Yang Method for p-domain frame level bit allocation for effective rate control and enhanced video encoding quality
CN101523908A (zh) * 2006-10-02 2009-09-02 艾利森电话股份有限公司 多媒体管理
DE102007001379A1 (de) * 2007-01-09 2008-07-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Konzept zum Encodieren einer Mehrzahl von Informationssignalen für eine gemeinsame Übertragung in einem Zeitmultiplex
DE102007013026B4 (de) 2007-03-19 2010-12-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung einer Mehrzahl von Informationssignalen unter Verwendung einer gemeinsamen Rechenleistung
KR100928045B1 (ko) * 2007-10-25 2009-11-23 에스케이 텔레콤주식회사 영상 분석 장치를 이용한 부호화 방법 및 시스템과 그를위한 영상 분석 장치
US9113194B2 (en) * 2007-12-19 2015-08-18 Arris Technology, Inc. Method and system for interleaving video and data for transmission over a network at a selected bit rate
US8780988B2 (en) * 2008-02-28 2014-07-15 Vixs Systems, Inc. Hierarchical video analysis-based real-time perceptual video coding
US8798137B2 (en) * 2008-02-29 2014-08-05 City University Of Hong Kong Bit rate estimation in data or video compression
EP2101503A1 (en) * 2008-03-11 2009-09-16 British Telecommunications Public Limited Company Video coding
US9167007B2 (en) * 2008-06-06 2015-10-20 Amazon Technologies, Inc. Stream complexity mapping
US9047236B2 (en) 2008-06-06 2015-06-02 Amazon Technologies, Inc. Client side stream switching
CN101345867B (zh) * 2008-08-22 2010-06-02 四川长虹电器股份有限公司 一种基于帧复杂度的码率控制方法
CN101404546B (zh) * 2008-10-24 2012-07-18 成都华日通讯技术有限公司 基于信号矩特征的频谱占用度测量方法
US8166170B2 (en) * 2008-10-26 2012-04-24 Imagine Communications Ltd. Distributed multiplexing
EP2359602B1 (en) * 2008-11-25 2019-09-11 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for statistical multiplexing
EP2200319A1 (en) * 2008-12-10 2010-06-23 BRITISH TELECOMMUNICATIONS public limited company Multiplexed video streaming
EP2219342A1 (en) 2009-02-12 2010-08-18 BRITISH TELECOMMUNICATIONS public limited company Bandwidth allocation control in multiple video streaming
CN101834776A (zh) * 2009-03-13 2010-09-15 华为技术有限公司 一种带宽控制方法和装置、***
FR2946820B1 (fr) * 2009-06-16 2012-05-11 Canon Kk Procede de transmission de donnees et dispositif associe.
US10165286B2 (en) 2009-07-08 2018-12-25 Dejero Labs Inc. System and method for automatic encoder adjustment based on transport data
US9756468B2 (en) 2009-07-08 2017-09-05 Dejero Labs Inc. System and method for providing data services on vehicles
US8942215B2 (en) 2010-07-15 2015-01-27 Dejero Labs Inc. System and method for transmission of data from a wireless mobile device over a multipath wireless router
US8595389B2 (en) * 2010-01-08 2013-11-26 International Business Machines Corporation Distributed performance counters
EP2330824A1 (en) * 2009-11-27 2011-06-08 Thomson Licensing Local statistical multiplexing of video streams over internet protocol
US9521178B1 (en) 2009-12-21 2016-12-13 Amazon Technologies, Inc. Dynamic bandwidth thresholds
GB2484061A (en) 2010-06-22 2012-04-04 Gi Provision Ltd Optimising target bit rate for wireless transmission of multiple video streams
US8837601B2 (en) * 2010-12-10 2014-09-16 Netflix, Inc. Parallel video encoding based on complexity analysis
US9832540B2 (en) 2010-12-15 2017-11-28 Hulu, LLC Method and apparatus for hybrid transcoding of a media program
US8976857B2 (en) 2011-09-23 2015-03-10 Microsoft Technology Licensing, Llc Quality-based video compression
US20140181266A1 (en) * 2011-09-29 2014-06-26 Avvasi Inc. System, streaming media optimizer and methods for use therewith
CN103428523B (zh) * 2012-05-22 2015-07-08 华为技术有限公司 评估视频质量的方法和装置
CN103517080A (zh) * 2012-06-21 2014-01-15 北京数码视讯科技股份有限公司 实时视频流编码器和实时视频流编码方法
KR101353290B1 (ko) * 2012-07-06 2014-01-27 인텔렉추얼디스커버리 주식회사 멀티미디어 스티칭을 위한 트랜스코딩 방법 및 이를 이용한 트랜스코더
WO2014061181A1 (ja) * 2012-10-18 2014-04-24 日本電気株式会社 カメラシステム
WO2015095166A2 (en) * 2013-12-16 2015-06-25 Arris Enterprises, Inc. Producing an output need parameter for an encoder
US10349104B2 (en) 2015-08-19 2019-07-09 Ericsson Ab System and method for managing segment delivery and bandwidth responsive to encoding complexity metrics
US20170055007A1 (en) * 2015-08-19 2017-02-23 Ericsson Ab System and method for managing segment delivery and bandwidth responsive to encoding complexity metrics
US9888052B2 (en) 2015-09-21 2018-02-06 Imagine Communications Corp. ABR allocation for statistical multiplexing
US9807416B2 (en) 2015-09-21 2017-10-31 Google Inc. Low-latency two-pass video coding
CN110800047B (zh) * 2017-04-26 2023-07-25 Dts公司 用于对数据进行处理的方法和***
CN109218724B (zh) * 2017-07-06 2020-08-04 腾讯科技(深圳)有限公司 一种数据编码方法、装置及存储设备和终端设备
US11146608B2 (en) 2017-07-20 2021-10-12 Disney Enterprises, Inc. Frame-accurate video seeking via web browsers
KR20190065792A (ko) * 2017-12-04 2019-06-12 삼성전자주식회사 전자 장치 및 전자 장치의 영상 데이터 전송 방법
CN110536168B (zh) * 2019-09-11 2021-09-17 北京达佳互联信息技术有限公司 视频上传方法、装置、电子设备及存储介质
CN113382258B (zh) * 2021-06-10 2022-10-21 北京百度网讯科技有限公司 视频编码方法、装置、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5929916A (en) * 1995-12-26 1999-07-27 Legall; Didier J. Variable bit rate encoding
JP2000041250A (ja) * 1998-05-29 2000-02-08 Internatl Business Mach Corp <Ibm> ビデオ・フレ―ムの多重ストリ―ムを処理する方法及びシステム
JP2003517743A (ja) * 1998-08-27 2003-05-27 ジェネラル・インスツルメント・コーポレイション 圧縮デジタルビデオ信号および圧縮されていないデジタルビデオ信号の統計的な多重化のための動的ビット配分

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0127329B1 (ko) 1993-08-14 1997-12-29 구자홍 디씨티기반의 인트라프레임 동영상 압축을 위한 버퍼 제어장치
CA2234132A1 (en) * 1997-04-15 1998-10-15 Renee Caroline Roemmele Process to chloroketoamines using carbamates
US6181742B1 (en) 1998-01-26 2001-01-30 International Business Machines Corporation Single pass target allocation for video encoding
US6278735B1 (en) 1998-03-19 2001-08-21 International Business Machines Corporation Real-time single pass variable bit rate control strategy and encoder
US6269217B1 (en) * 1998-05-21 2001-07-31 Eastman Kodak Company Multi-stage electronic motion image capture and processing system
US6859496B1 (en) 1998-05-29 2005-02-22 International Business Machines Corporation Adaptively encoding multiple streams of video data in parallel for multiplexing onto a constant bit rate channel
JP2003531533A (ja) * 2000-04-18 2003-10-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ジョイントビットレートトランスコーディングにおけるビットレートアロケーション
JP4256574B2 (ja) 2000-08-04 2009-04-22 富士通株式会社 画像信号符号化方法および画像信号符号化装置
US6731685B1 (en) * 2000-09-20 2004-05-04 General Instrument Corporation Method and apparatus for determining a bit rate need parameter in a statistical multiplexer
US7525552B2 (en) * 2004-04-21 2009-04-28 Slipstream Data Inc. Method, system and software product for color image encoding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5929916A (en) * 1995-12-26 1999-07-27 Legall; Didier J. Variable bit rate encoding
JP2000041250A (ja) * 1998-05-29 2000-02-08 Internatl Business Mach Corp <Ibm> ビデオ・フレ―ムの多重ストリ―ムを処理する方法及びシステム
JP2003517743A (ja) * 1998-08-27 2003-05-27 ジェネラル・インスツルメント・コーポレイション 圧縮デジタルビデオ信号および圧縮されていないデジタルビデオ信号の統計的な多重化のための動的ビット配分

Also Published As

Publication number Publication date
TW200644638A (en) 2006-12-16
AR052604A1 (es) 2007-03-21
EP1864500A1 (en) 2007-12-12
WO2006099226A1 (en) 2006-09-21
KR20070111550A (ko) 2007-11-21
KR100927083B1 (ko) 2009-11-13
US8565301B2 (en) 2013-10-22
US20060224762A1 (en) 2006-10-05
CN101185337A (zh) 2008-05-21
CN101185337B (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
JP2008533853A (ja) 先読みを伴う準一定品質のレート制御
JP5384694B2 (ja) 多層ビデオ設計のためのレート制御
WO2021244341A1 (zh) 图像编码方法及装置、电子设备及计算机可读存储介质
US8351513B2 (en) Intelligent video signal encoding utilizing regions of interest information
JP5351040B2 (ja) 映像符号化規格に対応した映像レート制御の改善
EP2441265B1 (en) Motion based dynamic resolution multiple bit rate video encoding
JP5427785B2 (ja) ビデオ圧縮技法及びビデオ伝達技法
CA2396305C (en) Methods and apparatus for rate control during dual pass encoding
US8406297B2 (en) System and method for bit-allocation in video coding
JP2008533841A (ja) マルチメディア処理のためのコンテンツ分類
CA2748373A1 (en) Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
CA2396308C (en) Methods and apparatus for statistical multiplexing during dual pass encoding
JP2004289796A (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
KR100929607B1 (ko) 엠펙-2 메인 프로파일에서 h.264/avc 베이스라인프로파일로의 트랜스코딩 방법
US20060034369A1 (en) Method and system for parametric video quality equalization in selective re-encoding
US20060034522A1 (en) Method and system for equalizing video quality using selective re-encoding
Song et al. Adaptive rate control algorithms for low bit rate video under networks supporting bandwidth renegotiation
KR101371507B1 (ko) 저지연 영상 통신 시스템 및 방법
KR100949755B1 (ko) 비디오 시퀀스의 레이트를 제어하는 방법 및 장치, 비디오부호화 장치
Overmeire et al. Constant quality video coding using video content analysis
Fang et al. Hardware oriented rate control algorithm and implementation for realtime video coding
Aliabad et al. No-reference H. 264/AVC statistical multiplexing for DVB-RCS
Schwenke et al. Dynamic Rate Control for JPEG 2000 Transcoding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110301

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110726