JP7229261B2 - ビデオ符号化のビットレート制御方法、装置、機器、記憶媒体及びプログラム - Google Patents

ビデオ符号化のビットレート制御方法、装置、機器、記憶媒体及びプログラム Download PDF

Info

Publication number
JP7229261B2
JP7229261B2 JP2020544623A JP2020544623A JP7229261B2 JP 7229261 B2 JP7229261 B2 JP 7229261B2 JP 2020544623 A JP2020544623 A JP 2020544623A JP 2020544623 A JP2020544623 A JP 2020544623A JP 7229261 B2 JP7229261 B2 JP 7229261B2
Authority
JP
Japan
Prior art keywords
image frame
quantization parameter
domain complexity
obtaining
complexity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020544623A
Other languages
English (en)
Other versions
JP2021517388A (ja
Inventor
グオ,ヤオヤオ
マオ,シュンアン
グゥ,チェンチェン
Original Assignee
テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド filed Critical テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Publication of JP2021517388A publication Critical patent/JP2021517388A/ja
Application granted granted Critical
Publication of JP7229261B2 publication Critical patent/JP7229261B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本願は、2018年3月28日に中国特許庁に提出された、出願番号が201810265922.3であり、発明の名称が「ビデオ符号化のビットレート制御方法、装置、機器及び記憶媒体」である中国特許出願に基づく優先権を主張し、その全ての内容は参照することにより本願に組み込まれる。
本願は、ビデオ画像処理の技術分野に関し、特にビデオ符号化のビットレート制御方法、装置、機器、記憶媒体及びプログラムに関する。
ビットレート制御は、ビデオ符号化の重要な部分であり、チャネルの状態に応じて、現在残っているターゲットビットに対して最適な割り当てを行い、エンコーダの現在の状況に応じて、量子化パラメータを動的に調整することにより、帯域幅が制限された条件下で、最適なビデオ品質を提供することができる。
ビットレート制御の技術は、主にビット割り当て及びビット制御に分けられる。ビット割り当ては、画像群(GOP:Group of Picture)レベルのビット割り当て、フレームレベルのビット割り当て、及びマクロブロックレベルのビット割り当てという3つの段階に分けられる。具体的には、端末側のエンコーダは、GOPの符号化を始める際に、現在のチャネルの帯域幅、現在のビデオのフレームレート、及びGOPの長さに基づいて、現在のGOPのターゲットビット数を割り当て、GOPのビット割り当てが完了した後、現在の画像フレームを符号化する際に、現在のGOPにおける残りのフレーム数及びビット数に基づいて、現在の画像フレームのターゲットビットを割り当て、現在の画像フレームにおけるマクロブロックを符号化する際に、現在の画像フレームにおける残りのビットデータと、現在符号化されていないマクロブロック数とに基づいて、現在の符号化単位にターゲットビットを割り当てる。
従来技術では、フレームレベルでビット割り当てを行う際に、現在のGOPの残りのビット数に対して、主に、均等割り当てと、予め定められた重みによるビット割り当てとの2つの方式が用いられる。このような割り当て方式は、連続的な自然シーンにおいて、非常に良好な効果を達成することができる。しかしながら、ユーザは、リアルタイムビデオ通話中に、携帯電話のブレ、光線の変化、シーンの遷移、又はカメラの切り替えなどの一連の複雑な操作が発生する可能性があるため、ビデオ通話の様々なシーンが現れる。画像シーンが変化すると、このようなビット割り当て及び量子化パラメータの算出方式は、ビデオコンテンツの変化に応じて、適応的に調整することができない。これにより、現在の画像フレームに大量のビットが消費され、さらに、大きな遅延をもたらしたり、ビデオにカクカク現象が発生したり、ユーザ体験に影響を与える。
本願の実施例では、ビデオ符号化のビットレート制御方法が提供されている。当該方法は、
ビデオストリームにおける第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得するステップと、
前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの第1ターゲットビットを第2ターゲットビットに更新し、前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新するステップと、
前記第2ターゲットビット及び前記第2初期量子化パラメータに基づいて、前記第1画像フレームの圧縮ビットストリームを生成するステップと、を含む。
本願の実施例では、ビデオ符号化のビットレート制御方法が提供されている。当該方法は、
第1端末が、ビデオストリームにおける第1画像フレームを取得するステップと、
前記第1端末が、前記第1画像フレームを処理することにより、前記第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得するステップと、
前記第1端末が、前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの第1ターゲットビットを第2ターゲットビットに更新し、前記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新するステップと、
前記第1端末が、前記第2ターゲットビット及び前記第2初期量子化パラメータに基づいて、前記第1画像フレームの圧縮ビットストリームを生成するステップと、
前記第1端末が、前記圧縮ビットストリームをサーバに伝送することにより、第2移動端末が、前記サーバから前記圧縮ビットストリームを取得し、前記圧縮ビットストリームを復号化し、復号化されたターゲット画像フレームを表示するようにさせるステップと、を含む。
本願の実施例では、ビデオ符号化のビットレート制御装置が提供されている。当該装置は、
ビデオストリームにおける第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得する時空間領域複雑さ取得モジュールと、
前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの第1ターゲットビットを第2ターゲットビットに更新し、前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新するパラメータ調整モジュールと、
前記第2ターゲットビット及び前記第2初期量子化パラメータに基づいて、前記第1画像フレームの圧縮ビットストリームを生成する圧縮ビットストリーム取得モジュールと、を含む。
本願の実施例では、プロセッサとメモリとを備えるビデオ符号化のビットレート制御機器が提供されており、前記メモリには、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶され、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、前記プロセッサによりロードされて実行されることで、本願の実施例におけるビデオ符号化のビットレート制御方法を実現させる。
本願の実施例では、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットを記憶したコンピュータ読み取り可能な記憶媒体が提供されており、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、プロセッサによりロードされて実行されることで、本願の実施例におけるビデオ符号化のビットレート制御方法を実現させる。
本願の実施例又は従来技術の構成及びメリットをより明確に説明するために、以下、実施例又は従来技術の説明に必要な図面を簡単に紹介する。明らかに、以下の説明における図面は本願のいくつかの実施例を示しているにすぎず、当業者にとって、創造的な労働をせずに、これらの図面から他の図面を得ることもできる。
本願の実施例におけるビデオ符号化のビットレート制御方法が適用されるシステムアーキテクチャ図である。 本願の実施例で提供されたビデオ符号化のビットレート制御方法のフローチャートである。 本願の実施例で提供されたIPPP参照フレームの構成シーケンス図である。 本願の実施例で提供された第1ターゲットビット及び初期量子化パラメータの調整のフローチャートである。 本願の実施例で提供された別のビデオ符号化のビットレート制御方法のフローチャートである。 本願の実施例で提供された第1画像フレームの空間領域複雑さの取得のフローチャートである。 本願の実施例で提供された第1画像フレームの時間領域複雑さの取得のフローチャートである。 本願の実施例で提供された第1画像フレームの第2ターゲットビットの取得のフローチャートである。 本願の実施例で提供された第1画像フレームの第2初期量子化パラメータの取得のフローチャートである。 本願の実施例で提供された別のビデオ符号化のビットレート制御方法のフローチャートである。 本願の実施例で提供されたビデオ符号化のビットレート制御装置のブロック図である。 本願の実施例で提供された別のビデオ符号化のビットレート制御装置のブロック図である。 本願の実施例で提供された空間領域複雑さ取得ユニットの構成ブロック図である。 本願の実施例で提供された時間領域複雑さ取得ユニットの構成ブロック図である。 本願の実施例で提供されたパラメータ調整モジュールの構成ブロック図である。 本願の実施例で提供された第2ターゲットビット取得ユニットの構成ブロック図である。 本願の実施例で提供された第2量子化パラメータ取得ユニットの構成ブロック図である。 本願の実施例で提供されたビデオ符号化のビットレート制御機器の模式図である。 本願の実施例で提供されたビデオ符号化のビットレート制御システムのブロック図である。
以下、本願の実施例の図面を参照しながら、本願の実施例の構成を明確かつ完全に説明するが、明らかなように、説明する実施例は、本願の実施例の一部にすぎず、実施例の全部ではない。当業者が創造的な労働をせずに本願の実施例から得るすべての他の実施例は、本願の保護範囲に属する。
説明すべきものとして、本願の明細書及び特許請求の範囲並びに上記図面における用語「第1」、「第2」などは、類似した対象を区別するためのものであり、必ずしも特定の順序又は優先順位を記述するものではない。理解すべきものとして、このように使用されるデータは、ここで説明する本願の実施例が、ここで図示又は説明したもの以外の順序で実施されることが可能になるように、適宜交換可能である。また、用語「含む」、「備える」、及びこれらの任意の変形は、非排他的な包含が含まれることを意図するものである。例えば、一連のステップ又はユニットを含むプロセス、装置、システム、製品又は機器は、必ずしも明示的にリストされているステップ又はユニットに限定されないが、明示的にリストされていない他のステップ又はユニット、或いは、これらのプロセス、装置、製品又は機器に固有の他のステップ又はユニットを含んでもよい。
図1Aは、本願の実施例におけるビデオ符号化のビットレート制御方法が適用されるシステムアーキテクチャ図である。図1Aに示すように、本願のいくつかの実施例におけるビデオ符号化のビットレート制御方法のシステムアーキテクチャ図には、少なくとも、第1端末11、ネットワーク12、サーバ13が含まれる。また、本願のいくつかの実施例におけるビデオ符号化のビットレート制御方法のシステムアーキテクチャ図は、第2端末14をさらに含んでもよい。
本願のいくつかの実施例では、上記第1端末11及び上記第2端末14は、データ計算処理機能を有するスマートデバイスであってもよく、(通信モジュールが搭載された)スマートフォン、ハンドヘルドパソコン、タブレットコンピュータ、及びパーソナルコンピュータなどを含むが、これらに限定されない。第1端末11には、オペレーティングシステムがインストールされ、このオペレーティングシステムは、Android(登録商標)オペレーティングシステム、Symbian(登録商標)オペレーティングシステム、Windows(登録商標) mobileオペレーティングシステム、及びアップルiPhone(登録商標) OSオペレーティングシステムなどを含むが、これらに限定されない。上記第1端末11及び上記第2端末14には、例えば、ビデオ符号化のビットレート制御を行うアプリケーションクライアントのような様々なアプリケーションクライアントがインストールされる。
ネットワーク12は、有線ネットワーク及び無線ネットワークを含んでもよい。図1Aに示すように、アクセスネットワーク側では、上記第1端末11と上記第2端末14とが無線又は有線でネットワーク12に接続されてもよい。一方、コアネットワーク側では、サーバ13は、一般的に、有線でネットワーク12に接続される。当然のことながら、上記サーバ13は、無線でネットワーク12に接続されてもよい。
サーバ13は、アプリケーションクライアントのサーバであってもよく、主に、端末機器から送信された圧縮ビットストリームを受信する。サーバ13は、別個のサーバであってもよいし、複数のサーバからなるサーバクラスタであってもよい。
図1Aに示すシステムアーキテクチャ図によれば、本願の実施例では、端末機器により実行されるビデオ符号化のビットレート制御方法が提供されている。該端末機器は、第1端末であってもよいし、第2端末であってもよい。図1Bに示すように、当該方法は、以下のステップを含む。
S101において、ビデオストリームにおける第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得する。
ステップS101において、現在の移動端末に対応する画像収集装置(例えば、カメラ)によって、ビデオ情報の収集を行い、具体的には、伝送対象のビデオにおける画像フレームを取得し、伝送対象の画像フレームを第1画像フレーム(現在の画像フレーム)として、後続の処理対象とする。
ここで、フレームは、ビデオにおける最小単位である1つの映像画面であり、1フレームは、1つの静止した画面であり、連続的なフレームは、アニメーション又はビデオなどを形成する。一般的に、フレーム数とは、簡単に言えば、1秒間に伝送するピクチャのフレーム数であり、グラフィックプロセッサが1秒あたり更新可能な回数と理解されてもよく、通常、FPS(Frames Per Second)で表される。各フレームは、いずれも静止した画像であり、フレームを迅速で連続的に表示すると、動いているように見える。高いフレームレートの場合、より滑らかで、よりリアルなアニメーションを得ることができる。1秒あたりフレーム数(fps)が多いほど、表示される動きが滑らかになる。
さらに、上記第1画像フレームを処理することにより、第1画像フレームの空間領域複雑さ、及び第1画像フレームの時間領域複雑さを取得する。
ここで、上記第1画像フレームを処理することは、ビデオ画像をダウンサンプリングした後、ダウンサンプリングされた画像に対して、例えば8×8サイズの画素ブロックを基本単位として、空間領域複雑さ及び時間領域複雑さの計算を行うことを含んでもよい。ここで、各々の画素ブロックは、1つの基本単位とみなすことができる。
説明すべきものとして、この構成は、リアルタイム通信過程に適用され、該符号化過程における参照フレームは、主に、IPPP(Intra picture and predicted picture)フォーマット構造を採用し、ここで、IPPPは、図2に示すように、Pフレームのみが存在し、かつ、現在フレームに対して前方フレームのみが参照可能な符号化構造である。
ここで、上記第1画像フレームの空間領域複雑さは、第1画像フレームのテクスチャ複雑さを示すものであり、空間的にシーンが複雑になるほど、空間領域複雑さの値が高くなる。上記空間領域複雑さに対応するのは、フレーム内予測である。フレーム内予測は、同一のフレーム内の符号化済みブロックに基づいて予測を行い、予測ブロックを構築し、現在ブロックとの残差を算出し、さらに、残差や予測モードなどの情報を符号化する。フレーム内予測は、主に除去するのが空間領域冗長である。上記第1画像フレームの時間領域複雑さは、上記第1画像フレームと、上記第1画像フレームが位置する画像群における符号化済みの画像フレームとの時間領域相関性であり、画像フレームシーケンスの時間変化量を示すものである。動き程度の高い画像フレームシーケンスは、通常、より高い時間領域複雑さの値がある。上記時間領域複雑さに対応するのは、フレーム間予測である。フレーム間予測は、1つ又は複数の符号化済みフレームに基づいて予測を行い、予測ブロックを構築し、現在ブロックとの残差を算出し、さらに、残差、予測モード、動きベクトル残差、参照画像インデックスなどの情報を符号化する。フレーム間予測は、主に除去するのが時間領域冗長である。
S102において、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1ターゲットビットを第2ターゲットビットに更新し、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新する。
ここで、上記第1ターゲットビットは、既存のターゲットビットであり、上記第1初期量子化パラメータは、既存の初期量子化パラメータである。上記第2ターゲットビットは、新たなターゲットビットであり、上記第2初期量子化パラメータは、新たな初期量子化パラメータである。
ここで、上記既存のターゲットビットは、端末機器のエンコーダが、上記第1画像フレームの位置する画像群にターゲットビット数を割り当てた後、上記第1画像フレームを符号化する際に、現在の画像群における残りのフレーム数及びビット数に基づいて、上記第1画像フレームに割り当てたターゲットビットである。
上記既存の初期量子化パラメータは、上記第1画像フレームの既存のターゲットビットから算出された量子化パラメータである。
具体的には、ステップS102における上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1ターゲットビットを第2ターゲットビットに更新することは、図3に示すように、
第1画像フレームの動き推定属性と第2画像フレームの動き推定属性とを取得するステップであって、上記第1画像フレームの動き推定属性が、第1画像フレームの時間領域複雑さと空間領域複雑さとの比率であり、上記第2画像フレームの動き推定属性が、第2画像フレームの時間領域複雑さと空間領域複雑さとの比率であり、上記第2画像フレームが、上記第1画像フレームの1つ前の画像フレームである、ステップS102aと、
第1制限条件を取得し、上記第1制限条件に基づいて、上記第1画像フレームの第1ターゲットビットを第2ターゲットビットに調整するステップであって、上記第1制限条件には、上記第1画像フレームの動き推定属性と上記第2画像フレームの動き推定属性との比率が含まれる、ステップS102bと、を含む。
具体的には、ステップS102における上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新することは、
第2制限条件を取得し、上記第2制限条件に基づいて、上記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新するステップであって、上記第2制限条件には、第1画像フレームの空間領域複雑さと第2画像フレームの空間領域複雑さとの比率と、第1画像フレームの空間領域複雑さと第2画像フレームの1つ前の画像フレームの空間領域複雑さとの比率とが含まれる、ステップを含む。
説明すべきものとして、第1画像フレームの第1ターゲットビットを第2ターゲットビットに調整した後の段階、つまり、ビット割り当てが完了した後にビット制御を行う必要がある段階において、具体的には、2次レート歪みモデルを用いて、ビット制御を行う。ここで、2次レート歪みモデルに対応する数式は、数式1に示すとおりである。
Figure 0007229261000001
数式1において、RHeadは、該マクロブロックのヘッダ情報が消費するビット数であり、Mは、第1画像フレーム(現在の画像フレーム)の残差信号の平均絶対偏差(MAD:Mean Absolute Difference)であり、a、bは、対応する制限パラメータである。ここで、平均絶対偏差(MAD)は、数式2によって更新される。
Figure 0007229261000002
数式2において、MAD(j-1)は、現在の画像フレームの1つ前のフレームの実際のMAD値を表し、p1、p2は、対応する制限パラメータである。
S103において、上記第2ターゲットビット及び上記第2初期量子化パラメータに基づいて、上記第1画像フレームの圧縮ビットストリームを生成する。
ここで、ビットストリームとは、単位時間内でビデオファイルに使用されるデータトラフィックであり、ビデオ符号化の画質制御における最も重要な部分である。本実施例では、既存のターゲットビット及び初期量子化パラメータを、シーン切り替えに適応するように調整することにより、伝送に適するビデオストリーム、つまり圧縮ビットストリームを取得する。
本実施例では、第1画像フレーム(現在の画像フレーム)と第2画像フレーム(1つ前の画像フレーム)との時間領域相関性と、第1画像フレームの空間領域相関性とに基づいて、第1画像フレームのターゲットビット数及び符号化の量子化パラメータを調整することにより、シーン切り替え又はシーン移動時の1秒あたりのピークビットレートが効果的に低減され、ビットレートの制御不能が回避され、ビデオストリームのスムーズな伝送が可能になる。
また、本願の実施例では、別のビデオ符号化のビットレート制御方法が提供されている。図4に示すように、当該方法は、以下のステップを含む。
S201において、ビデオストリームにおける第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得する。
いくつかの実施例では、ビデオ画像をダウンサンプリングした後、ダウンサンプリングされた画像に対して、例えば8×8サイズの画素ブロックを基本単位として、空間領域複雑さIcost及び時間領域複雑さPcostの計算を行う。ここで、各々の画素ブロックは、1つの基本単位とみなすことができる。ここで、上記基本単位は、上記マクロブロックと同等であってもよい。
ここで、ステップS201において上記ビデオストリームにおける第1画像フレームの空間領域複雑さを取得することは、上記第1画像フレームにおける第1基本単位の最適なフレーム内予測コストを取得するステップと、上記第1基本単位の最適なフレーム内予測コストに基づいて、第1画像フレームの空間領域複雑さを取得するステップと、を含む。上記最適なフレーム内予測コストは、算出された、上記第1画像フレームの消費するビット数を推定したものである。さらに、上記最適なフレーム内予測コストは、上記第1画像フレームの歪み量を考慮してもよい。つまり、上記最適なフレーム内予測コストは、上記第1画像フレームの消費するビット数を推定したものと上記第1画像フレームの歪み量との重み付け加算和であってもよい。
図5に示すように、ステップS201において上記ビデオストリームにおける第1画像フレームの空間領域複雑さを取得することは、具体的に、以下のステップを含む。
S2Aにおいて、上記第1画像フレームが有するフレーム内予測方向の中から、第1所定数のフレーム内予測方向を間隔として、複数のターゲット方向を選択し、各前記ターゲット方向のフレーム内コストを取得する。
S2Bにおいて、数値が最も小さいフレーム内コストに対応するターゲット方向を最適方向とする。
S2Cにおいて、上記最適方向を中心として、第2所定数を半径として、最適なフレーム内予測方向を取得する。
ここで、ステップS2Cにおいて、いくつかの実施例では、上記第2所定数は、第1所定数の2分の1である。
例えば、仮に上記第1所定数が8であるとすると、上記最適方向を中心として、8/2を半径として、最適なフレーム内予測方向を取得する。つまり、上記最適方向を中心として、左右両側にそれぞれ4つの基本単位を探索することにより、最適なフレーム内予測方向を取得する。
S2Dにおいて、最適なフレーム内予測方向に基づいて、上記第1基本単位と第2基本単位との残差のSATD(Sum of Absolute Transformed Difference)値を取得し、第1基本単位の最適なフレーム内予測コストを取得し、第1基本単位の最適なフレーム内予測コストから、第1画像フレームの空間領域複雑さを算出する。
ここで、上記第2基本単位は、上記最適なフレーム内予測方向における基本単位であり、SATDは、ビデオ残差信号の大きさを評価するものであり、その値が、対応する残差のHadamard変換後の絶対値和である。ビデオ符号化規格では、アダマール(Hadamard)変換は、SATDの計算に用いられることが多い。
例を挙げて説明すると、
本実施例では、35個のフレーム内予測方向を有する画像フレームを例にして、最初に第1基本単位の最適なフレーム内予測方向を取得する。ここで、最適なフレーム内予測方向を取得することは、まず、35個のフレーム内予測方向の中から、Δ個の方向おきに1つの方向を取って、フレーム内コストを算出し、このような初期選別を行うことにより、最適な方向を取得する第1段階と、この最適な方向を中心として、Δ/2を半径として、最適なフレーム内予測方向を探索する第2段階との2つの段階に分けられる。ここで、Δは、例えば、値が8である。
最適な予測方向に基づいて、第1基本単位と第2基本単位との残差のSATD値を算出し、即ち、第1基本単位の最適なフレーム内予測コストを取得する。さらに、第1基本単位の最適なフレーム内予測コストから、第1画像フレームの最適なフレーム内予測コスト、即ち第1画像フレームの空間領域複雑さを算出する。ここで、第1画像フレームの空間領域複雑さIcostは、ΨI_curで表され、第2画像フレームの空間領域複雑さIcostは、ΨI_preで表される。
ここで、ステップS201において上記第1画像フレームの時間領域複雑さを取得することは、上記第1画像フレームにおける第1基本単位の最適なフレーム間予測コストを取得するステップと、上記第1基本単位の最適なフレーム間予測コストに基づいて、第1画像フレームの時間領域複雑さを取得するステップと、を含む。
図6に示すように、ステップS201において上記第1画像フレームの時間領域複雑さを取得することは、具体的に、
整数画素ダイヤモンド探索アルゴリズムによって、第1画像フレームにおける第1基本単位の最適マッチングブロックを取得し、それを参照単位とするステップS2aと、
上記参照単位と第1基本単位との残差のSATD値を取得するステップであって、上記SATD値が、第1基本単位の最適なコストである、ステップS2bと、を含む。
上記第1画像フレームの時間領域複雑さを取得することは、
第1基本単位の最適なコストと第1基本単位の最適なフレーム内予測コストとを比較して、最も小さい数値を第1基本単位の最適なフレーム間予測コストとし、第1基本単位の最適なフレーム間予測コストに基づいて、第1画像フレームの時間領域複雑さを取得するステップS2cをさらに含む。
例を挙げて説明すると、
本実施例では、整数画素ダイヤモンド探索アルゴリズムによって、第1基本単位の最適マッチングブロックを取得し、それを参照単位とする。参照単位を決定した後、さらに、残差のSATD値を第1基本単位の最適なコストとして算出する。最後に、取得された最適なコストと第1基本単位のIcostとを比較して、数値が最も小さいものを第1基本単位のPcostとし、さらに第1画像フレームのPcostを取得する。ここで、第1画像フレームのPcostは、ΨP_curで表され、第1画像フレームの1つ前のフレームのPcostは、ΨP_preで表される。
さらに、本実施例では、ΨIP_curで第1画像フレームの動き状況を表し、具体的には、以下のように算出する。
Figure 0007229261000003
数式3から分かるように、前後のフレームのテクスチャの変化が大きくない場合、第1画像フレームの動きが静止するほど、ΨP_curが0に近づくため、ΨIP_curが大きくなる。これに応じて、第1画像フレームの動きが激しいほど、ΨP_curが大きくなるため、ΨIP_curが小さくなることに直接つながる。したがって、ΨIP_curは、第1画像フレームの動きの激しさを直接反映している。
S202aにおいて、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1ターゲットビットを第2ターゲットビットに更新する。図7に示すように、ステップS202aは、
第1画像フレームの動き推定属性が第1区分パラメータよりも小さい場合、第1ビット調整関数で第1画像フレームの第1ターゲットビットを調整することにより、第1画像フレームの第2ターゲットビットを取得するステップS3A、又は、
第1画像フレームの動き推定属性が第2区分パラメータよりも小さい場合、第2ビット調整関数で第1画像フレームの第1ターゲットビットを調整することにより、第1画像フレームの第2ターゲットビットを取得するステップS3B、又は、
第1画像フレームの動き推定属性が第3区分パラメータよりも小さい場合、第3ビット調整関数で第1画像フレームの第1ターゲットビットを調整することにより、第1画像フレームの第2ターゲットビットを取得するステップS3C、を含む。
ここで、上記第1区分パラメータ、第2区分パラメータ、及び第3区分パラメータの数値は、同一の傾向に属し、本実施例では順次増大する。
例を挙げて説明すると、
第1画像フレームは、現在の画像フレームであり、第2画像フレームは、1つ前の画像フレーム、即ち、現在の画像フレームの1つ前の画像フレームである。
第1画像フレームに対応する時間領域複雑さΨI_curと空間領域複雑さΨP_curとの比率を、第1画像フレームの動き推定属性ΨIP_curとして、第2画像フレームに対応する時間領域複雑さΨI_preと空間領域複雑さΨP_preとの比率を、第2画像フレームの動き推定属性ΨIP_preとする。
第1画像フレームの動き推定属性ΨIP_curと第2画像フレームの動き推定属性ΨIP_preとの比率を制限条件として、第1画像フレームの第1ターゲットビットRTarを調整することにより、第1画像フレームの第2ターゲットビットRTar’を取得する。
具体的には、第1画像フレームの第1ターゲットビットRTarを調整することにより、第1画像フレームの第2ターゲットビットRTar’を取得することは、
従来のターゲットビットの計算方式によって、ターゲットビットRTarを取得した後、第1画像の時空間領域複雑さに基づいて、区分関数を設定し、ΨIP_curの大きさに応じて、α、α、及びαという3つのレベルを設定し、RTarを調整することを含む。実施例では、α、α、及びαがそれぞれ2.5、3、3.5に設定されている。
(1)ΨIP_cur<αの場合、第1画像フレームの第1ターゲットビットRTarを調整することにより、第1画像フレームの第2ターゲットビットRTar’を取得することに用いる数式(第1ビット調整関数)は、数式4である。
Figure 0007229261000004
ここで、σ、σ、及びσは、画像の時空間領域複雑さに基づいて、RTarを調整するための重みであり、β、β及びβは、それぞれ、第1条件パラメータ、第2条件パラメータ、及び第3条件パラメータである。本実施例では、σ、σ、及びσがそれぞれ3.2、2.6、及び1.6に設定されており、β、β、及びβがそれぞれ3、2.5、及び2に設定されている。
また、ΨIP_cur<αの場合、画像の変動が激しく、画像自体のテクスチャも特に大きく変動する可能性が高く、このとき、さらなる制限条件を追加することでターゲットビットを調整する。したがって、ΨIP_cur<αの場合、第1画像フレームの第1ターゲットビットRTarを調整することは、数式5(第4ビット調整関数)によって、第1画像フレームの第1ターゲットビットRTarを調整することにより、第1画像フレームの第2ターゲットビットRTar’を取得することをさらに含む。
Figure 0007229261000005
ここで、σは、RTarを調整するための第4重みであり、βは、第4条件パラメータである。本実施例では、σ4が2に設定されており、βが5に設定されている。
(2)ΨIP_cur<αの場合、第1画像フレームの第1ターゲットビットRTarを調整することにより、第1画像フレームの第2ターゲットビットRTar’を取得することに用いる数式(第2ビット調整関数)は、数式6である。
Figure 0007229261000006
ここで、σ及びσは、RTarを調整するための第5重み及び第6重みであり、β及びβは、それぞれ第5条件パラメータ及び第6条件パラメータである。本実施例では、σ及びσが2.6及び2に設定されており、β及びβが2及び1.5に設定されている。
(3)ΨIP_cur<αの場合、第1画像フレームの第1ターゲットビットRTarを調整することにより、第1画像フレームの第2ターゲットビットRTar’を取得することに用いる数式(第3ビット調整関数)は、数式7である。
Figure 0007229261000007
ここで、σは、RTarを調整するための第7重みであり、βは、第7条件パラメータである。本実施例では、σが2に設定されており、βが1.2に設定されている。
説明すべきものとして、対応する区分関数は、シーンのニーズに応じて、調整してもよい。例えば、ΨIP_cur<αに対応する第1ビット調整関数を、4つの区分をもつ区分関数に設定してもよく、4つの区分をもつ区分関数によって調整されたデータ、及び最終的に受信側に示される効果をさらにテストして調整し、シーンのニーズを満たすために適切なパラメータを選択する必要がある。
さらに、S202bにおいて、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新する。図8に示すように、ステップS202bは、
第1量子化調整関数で第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新するステップS3aを含み、
その後に、
第2量子化調整関数で第1画像フレームの第1最大量子化パラメータを第2最大量子化パラメータに更新するステップS3b、及び/又は、
第3量子化調整関数で第1画像フレームの第1最小量子化パラメータを第2最小量子化パラメータに更新するステップS3cをさらに含み、
前記第1量子化調整関数で第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新するステップの後に、
取得された第2初期量子化パラメータが量子化パラメータの臨界閾値よりも大きい場合、第4量子化調整関数で前記第2初期量子化パラメータを調整することにより、ターゲット初期量子化パラメータを取得するステップS3dをさらに含む。
例を挙げて説明すると、
第1画像フレームは、現在の画像フレームであり、第2画像フレームは、1つ前の画像フレーム、即ち、現在の画像フレームの1つ前の画像フレームである。
第1画像フレームの空間領域複雑さΨP_curと第2画像フレームの空間領域複雑さΨP_preとの比率、及び、第1画像フレームの空間領域複雑さΨP_curと前記第2画像フレームの1つ前の画像フレームの空間領域複雑さΨP_prepreとの比率を制限条件とし、第1画像フレームの第1初期量子化パラメータQPframeを調整することにより、第1画像フレームの第2初期量子化パラメータQPframe’を取得する。
具体的には、第1画像フレームの第1初期量子化パラメータQPframeを調整することにより、QPframe’を取得することは、以下のステップを含む。
(1)数式8(第1量子化調整関数)で第1画像フレームの第1初期量子化パラメータQPframeを調整することにより、第1画像フレームの第2初期量子化パラメータQPframe’を取得する。
Figure 0007229261000008
(2)第1画像フレームの第1初期量子化パラメータQPframeを調整することにより、QPframe’を取得した後、ステップS202bは、初期量子化パラメータに対応する範囲を調整し、具体的に、初期量子化パラメータに対応する最大量子化パラメータ及び最小量子化パラメータを調整するステップをさらに含む。具体的には、
数式9(第2量子化調整関数)で第1画像フレームの第1最大量子化パラメータQPmaxを調整することにより、第1画像フレームの第2最大量子化パラメータQPmax’を取得し、
Figure 0007229261000009
数式10(第3量子化調整関数)で第1画像フレームの第1最小量子化パラメータQPminを調整することにより、第1画像フレームの第2最小量子化パラメータQPmin’を取得する。
Figure 0007229261000010
ここで、上式は、第1画像フレームと第2画像フレームとのPcost関係、及び第1画像フレーム(現在の画像フレーム)と2つ前の画像フレーム(第2画像フレーム(1つ前の画像フレーム)の1つ前の画像フレーム)とのPcost関係に基づいて、第1画像フレームが大きく動いているシーンにあるか否かを判断し、第1画像フレームが大きく動いているシーンにある場合、符号化過程に消費されるビットが多すぎるという現象を回避するために、第1画像フレームの初期量子化パラメータを引き上げる必要がある。
上式において、ΨP_pre及びΨP_prepreは、それぞれ第2画像フレーム及び2つ前の画像フレーム(第2画像フレーム(1つ前の画像フレーム)の1つ前の画像フレーム)のPcostを表す。ω及びωは、いずれも第1画像フレームと第2画像フレーム(1つ前の画像フレーム)とのPcostの比率の閾値である。本実施例では、ω及びωが6及び3に設定されている。ω及びωは、いずれも第1画像フレームと第2画像フレームの1つ前の画像フレームとのPcostの比率の閾値である。本実施例では、ω及びωが8及び4に設定されている。λ及びλは、それぞれ現在の初期QP、最大QP、最小QPに対応する第1オフセット値及び第2オフセット値である。本実施例では、λ及びλが6及び3に設定されている。
符号化過程では、QP値が大きすぎると、ブロッキングアーティファクトが出やすくなるため、数式(8)~(10)に加えて、第1画像フレームの量子化パラメータQPを調整する必要がある。したがって、
(3)第1画像フレームの第2初期量子化パラメータQP’frameを取得し後、ステップS202bは、以下のステップをさらに含む。
数式11(第4量子化調整関数)で第1画像フレームの第1初期量子化パラメータを調整することにより、最終的な符号化のターゲット初期量子化パラメータQPinitalを取得する。
Figure 0007229261000011
ここで、QPThrは、第1画像フレームの臨界閾値である。本実施例では、QPThrが35に設定されている。QPinitalは、第1画像フレームの時空間領域相関性に基づいて調整された最終的な符号化の初期量子化パラメータQP、即ち、ターゲット初期量子化パラメータである。
S203において、上記第2ターゲットビット及び上記第2初期量子化パラメータに基づいて、上記第1画像フレームの圧縮ビットストリームを生成する。
本実施例では、異なるシーンにおける第1画像フレームの変動程度によって、既存のターゲットビットを調整し、異なるシーンにおける第1画像フレームと第2画像フレームとの時間領域相関性によって、既存の量子化パラメータ(初期量子化パラメータ、最大量子化パラメータ、及び最小量子化パラメータ)を合理的に調整する。つまり、現在画像のコンテンツ特性に応じて、画像パラメータの調整を適応的に行うことができる。これにより、第1画像フレームの伝送過程に消費されるビットが少なくなり、リアルタイムビデオ過程に生じる大きな時間遅延又はカクカク現象が回避され、ユーザ体験が向上する。
本実施例では、ビデオ符号化のビットレート制御方法が提供されている。図9に示すように、当該方法は、
第1端末が、ビデオストリームにおける第1画像フレームを取得するステップS301と、
上記第1端末が、上記第1画像フレームを処理することにより、上記第1画像フレームの空間領域複雑さ、及び上記第1画像フレームの時間領域複雑さを取得するステップS302と、
上記第1端末が、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1ターゲットビットを第2ターゲットビットに更新し、上記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新するステップS303と、
上記第1端末が、上記第2ターゲットビット及び上記第2初期量子化パラメータに基づいて、上記第1画像フレームの圧縮ビットストリームを生成するステップS304と、
上記第1端末が、上記圧縮ビットストリームをサーバに伝送するステップS305と、
第2移動端末が、上記サーバから前記圧縮ビットストリームを取得し、上記圧縮ビットストリームを復号化し、復号化されたターゲット画像フレームを第2移動端末に表示するステップS306と、を含む。
本実施例の第1端末は、ビデオデータを伝送する前に、伝送対象の画像フレームに対してパラメータ調整を行うことにより、シーンのニーズに適する圧縮ビットストリームを取得し、さらに、ビデオデータの伝送に少ないビットが消費され、かつスムーズに伝送することができる。これにより、対応するアプリケーションのユーザの粘着性を高める。
本実施例では、ビデオ符号化のビットレート制御装置が提供されている。図10に示すように、当該装置は、
ビデオストリームにおける第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得する時空間領域複雑さ取得モジュール110と、
上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1ターゲットビットを第2ターゲットビットに更新し、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新するパラメータ調整モジュール120と、
上記第2ターゲットビット及び上記第2初期量子化パラメータに基づいて、上記第1画像フレームの圧縮ビットストリームを生成する圧縮ビットストリーム取得モジュール130と、を含む。
上記装置の実施例における装置は、方法の実施例と同様な発明構想に基づくものである。
本実施例では、ビデオ符号化のビットレート制御装置が提供されている。図11に示すように、当該装置は、時空間領域複雑さ取得モジュール210と、パラメータ調整モジュール220と、圧縮ビットストリーム取得モジュール230と、を含む。
時空間領域複雑さ取得モジュール210は、ビデオストリームにおける第1画像フレームの空間領域複雑さを取得し、上記第1画像フレームの時間領域複雑さを取得する。
具体的には、時空間領域複雑さ取得モジュール210は、空間領域複雑さ取得ユニット211を含み、空間領域複雑さ取得ユニット211は、図12に示すように、
上記第1画像フレームにおける第1基本単位の最適なフレーム内予測コストを取得する最適フレーム内予測コスト取得サブユニット2111と、
上記第1基本単位の最適なフレーム内予測コストに基づいて、第1画像フレームの空間領域複雑さを取得する空間領域複雑さ取得サブユニット2112と、を含む。
ここで、より具体的には、空間領域複雑さ取得ユニット211は、
上記第1画像フレームが有するフレーム内予測方向の中から、第1所定数のフレーム内予測方向を間隔として、複数のターゲット方向を選択し、各ターゲット方向のフレーム内コストを取得するターゲット方向フレーム内コスト取得サブユニットと、
数値が最も小さいフレーム内コストに対応するターゲット方向を最適方向とし、上記最適方向を中心として、第2所定数を半径として、最適なフレーム内予測方向を取得する最適フレーム内予測方向取得サブユニットと、
最適なフレーム内予測方向に基づいて、上記第1基本単位と第2基本単位との残差のSATD値を取得し、第1基本単位の最適なフレーム内予測コストを取得し、第1基本単位の最適なフレーム内予測コストから、現在の画像フレームの空間領域複雑さを算出する空間領域複雑さ取得サブユニットと、を含んでもよい。
さらに、時空間領域複雑さ取得モジュール210は、時間領域複雑さ取得ユニット212を含み、時間領域複雑さ取得ユニット212は、図13に示すように、
上記第1画像フレームにおける第1基本単位の最適なフレーム間予測コストを取得する最適フレーム間予測コスト取得サブユニット2121と、
上記第1基本単位の最適なフレーム間予測コストに基づいて、第1画像フレームの時間領域複雑さを取得する時間領域複雑さ取得サブユニット2122と、を含む。
ここで、より具体的には、時間領域複雑さ取得ユニットは、
第1画像フレームにおける第1基本単位の最適マッチングブロックを取得し、上記最適マッチングブロックを参照単位とする参照単位取得サブユニットと、
上記参照単位と第1基本単位との残差のSATD値を取得し、上記SATD値が、第1基本単位の最適なコストである第1基本単位最適コスト取得サブユニットと、
第1基本単位の最適なコストと第1基本単位の最適なフレーム内予測コストとを比較して、最も小さい数値を第1基本単位の最適なフレーム間予測コストとし、第1基本単位の最適なフレーム間予測コストに基づいて、第1画像フレームの時間領域複雑さを取得する時間領域複雑さ取得サブユニットと、を含んでもよい。
パラメータ調整モジュール220は、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、第1画像フレームの第1ターゲットビットを調整することにより、第1画像フレームの第2ターゲットビットを取得し、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、第1画像フレームの第1初期量子化パラメータを調整することにより、第1画像フレームの第2初期量子化パラメータを取得する。
具体的には、パラメータ調整モジュール220は、図14に示すように、
第1画像フレームの動き推定属性と第2画像フレームの動き推定属性とを取得し、上記第1画像フレームの動き推定属性が、第1画像フレームの時間領域複雑さと空間領域複雑さとの比率であり、上記第1画像フレームの動きの激しさを示すものであり、上記第2画像フレームの動き推定属性が、第2画像フレームの時間領域複雑さと空間領域複雑さとの比率であり、上記第2画像フレームの動きの激しさを示すものであり、上記第2画像フレームが、上記第1画像フレームの1つ前の画像フレームである動き推定取得ユニット221と、
第1制限条件を取得し、上記第1制限条件に基づいて、上記第1画像フレームの第1ターゲットビットを第2ターゲットビットに調整し、上記第1制限条件には、上記第1画像フレームの動き推定属性と第2画像フレームの動き推定属性との比率が含まれる第2ターゲットビット取得ユニット222と、を含む。
具体的には、第2ターゲットビット取得ユニット222は、図15に示すように、
第1画像フレームの動き推定属性が第1区分パラメータよりも小さい場合、第1ビット調整関数で前記第1画像フレームの第1ターゲットビットを第2ターゲットビットに調整する第1ビット調整サブユニット2221、又は、
第1画像フレームの動き推定属性が第2区分パラメータよりも小さい場合、第2ビット調整関数で前記第1画像フレームの第1ターゲットビットを第2ターゲットビットに調整する第2ビット調整サブユニット2222、又は、
第1画像フレームの動き推定属性が第3区分パラメータよりも小さい場合、第3ビット調整関数で前記第1画像フレームの第1ターゲットビットを第2ターゲットビットに調整する第3ビット調整サブユニット2223を含み、
ここで、上記第1区分パラメータ、第2区分パラメータ、及び第3区分パラメータは、順次増大する。
さらに、パラメータ調整モジュール220は、
第2制限条件を取得し、上記第2制限条件に基づいて、上記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新し、上記第2制限条件には、第1画像フレームの空間領域複雑さと第2画像フレームの空間領域複雑さとの比率と、第1画像フレームの空間領域複雑さと第2画像フレームの1つ前の画像フレームの空間領域複雑さとの比率とが含まれる第2量子化パラメータ取得ユニット223を含む。
第2量子化パラメータ取得ユニット223は、図16に示すように、
第1量子化調整関数で第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新する初期量子化調整サブユニット2231を含む。
第2量子化パラメータ取得ユニット223は、図16に示すように、
第2量子化調整関数で第1画像フレームの第1最大量子化パラメータを第2最大量子化パラメータに更新する最大量子化調整サブユニット2232、及び/又は、
第3量子化調整関数で第1画像フレームの第1最小量子化パラメータを第2最小量子化パラメータに更新する最小量子化調整サブユニット2233をさらに含む。
第2量子化パラメータ取得ユニット223は、
上記第2初期量子化パラメータが量子化パラメータの臨界閾値よりも大きい場合、第4量子化調整関数で前記第2初期量子化パラメータをターゲット初期量子化パラメータに更新する最終量子化調整サブユニット2234をさらに含む。
圧縮ビットストリーム取得モジュール230は、上記第2ターゲットビット及び上記第2初期量子化パラメータに基づいて、上記第1画像フレームの圧縮ビットストリームを生成する。
上記装置の実施例における装置は、方法の実施例と同様な発明構想に基づくものである。
本願の実施例では、プロセッサとメモリとを備えるビデオ符号化のビットレート制御機器が提供されており、メモリには、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶され、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットは、プロセッサによりロードされて実行されることで、方法の実施例で提供されたビデオ符号化のビットレート制御方法を実現させる。
本願の実施例では、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットを記憶したコンピュータ読み取り可能な記憶媒体が提供されており、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットは、プロセッサによりロードされて実行されることで、方法の実施例に記載のビデオ符号化のビットレート制御方法を実現させる。少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットには、
ビデオストリームにおける第1画像フレームの空間領域複雑さを取得し、上記第1画像フレームの時間領域複雑さを取得し、
上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1ターゲットビットを第2ターゲットビットに更新し、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新し、
上記第2ターゲットビット及び上記第2初期量子化パラメータに基づいて、上記第1画像フレームの圧縮ビットストリームを生成する、処理を行うための命令が含まれる。
本願の実施例では、さらに、上記実施例で提供されたビデオ符号化のビットレート制御方法の実施に使用可能なビデオ符号化のビットレート制御機器が提供されている。図17に示すように、具体的には、
当該機器は、無線周波数(RF:Radio Frequency)回路810、1つ又は複数のコンピュータ読取可能な記憶媒体を含むメモリ820、入力ユニット830、表示ユニット840、センサ850、オーディオ回路860、ワイヤレスフィデリティ(WiFi:Wireless Fidelity)モジュール870、1つ又は複数の処理コアを含むプロセッサ880、及び電源890などの部品を備えてもよい。当業者であれば理解できるように、図17に示される機器の構成は、機器を限定するものではなく、図示されたものよりも多く又は少ない部品を含んでもよく、或いはいくつかの部品を組み合わせたものであってもよく、或いは部品の異なる配置を有してもよい。
RF回路810は、情報の送受信中又は通話中に信号を送受信するために使用することができ、特に、基地局のダウンリンク情報を受信して、1つ又は複数のプロセッサ880に渡して処理するとともに、アップリンクに関するデータを基地局に送信する。一般に、RF回路810は、アンテナ、少なくとも1つの増幅器、チューナ、1つ又は複数の発振器、加入者識別モジュール(SIM)カード、トランシーバ、カプラー、低雑音増幅器(LNA:Low Noise Amplifier)、デュプレクサなどを含むが、これらに限定されない。また、RF回路810は、無線通信を介してネットワークや他のデバイスと通信することもできる。無線通信には、グローバルモバイル通信システム(GSM:Global System of Mobile communication)、汎用パケット無線サービス(GPRS:General Packet Radio Service)、コード分割多元接続(CDMA:Code Division Multiple Access)、広帯域コード分割多元接続(WCDMA:Wideband Code Division Multiple Access)、長期的進化(LTE:Long Term Evolution)、電子メール、ショートメッセージングサービス(SMS:Short Messaging Service)などを含むが、これらに限定されない任意の通信規格又はプロトコルを使用してもよい。
メモリ820は、ソフトウェアプログラム及びモジュールを記憶するために使用することができ、プロセッサ880は、メモリ820に記憶されたソフトウェアプログラム及びモジュールを実行することにより、様々な機能アプリケーション及びデータ処理を実行する。メモリ820は、主にプログラム記憶領域及びデータ記憶領域を含んでもよい。ここで、プログラム記憶領域には、オペレーティングシステム、機能に必要なアプリケーションプログラムなどを記憶してもよい。データ記憶領域には、機器の使用に応じて作成されたデータなどを記憶してもよい。また、メモリ820は、高速ランダムアクセスメモリを含んでもよいし、不揮発性メモリ、例えば、少なくとも1つの磁気ディスク記憶デバイス、フラッシュメモリデバイス、又は他の不揮発性ソリッドステート記憶デバイスを含んでもよい。これに応じて、メモリ820は、メモリコントローラをさらに含んでもよい。これにより、プロセッサ880及び入力ユニット830によるメモリ820へのアクセスが提供される。
入力ユニット830は、入力された数字又は文字の情報を受信することと、ユーザ設定及び機能制御に関する、キーボード、マウス、ジョイスティック、光学又はトラックボールによる信号入力を生成することとに使用することができる。具体的には、入力ユニット830は、タッチセンシティブ表面831及び他の入力デバイス832を含んでもよい。タッチセンシティブ表面831は、タッチスクリーン又はタッチパッドとも呼ばれ、その上又はその近くでのユーザのタッチ操作を収集し(例えば、ユーザが指、スタイラスなどの任意の適切なもの又はアクセサリを使用して、タッチセンシティブ表面831の上又はタッチセンシティブ表面831の近くで行う操作)、プリセットプログラムに従って、相応の接続装置を駆動することができる。いくつかの実施例では、タッチセンシティブ表面831は、タッチ検出装置及びタッチコントローラの2つの部分を含んでもよい。ここで、タッチ検出装置は、ユーザのタッチ方位を検出し、タッチ操作による信号を検出し、信号をタッチコントローラに伝送する。タッチコントローラは、タッチ検出装置からタッチ情報を受信し、それをタッチポイント座標に変換してプロセッサ880に送信するとともに、プロセッサ880から送信されたコマンドを受信して実行することができる。また、抵抗膜、静電容量、赤外線や表面弾性波などの複数の形態によって、タッチセンシティブ表面831を実現してもよい。入力ユニット830は、タッチセンシティブ表面831に加えて、他の入力デバイス832も含んでもよい。具体的には、他の入力デバイス832は、物理キーボード、ファンクションキー(例えば、ボリュームコントロールキー、スイッチキーなど)、トラックボール、マウス、ジョイスティックなどのうち1つ又は複数を含んでもよいが、これらに限定されない。
表示ユニット840は、ユーザが入力した情報又はユーザに提供する情報、及び機器の様々なグラフィカルユーザインターフェースを表示するために使用することができる。これらのグラフィカルユーザインターフェースは、グラフィック、テキスト、アイコン、ビデオ、及びそれらの任意の組み合わせから構成されてもよい。表示ユニット840は、表示パネル841を備えてもよい。いくつかの実施例では、表示パネル841は、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機発光ダイオード(OLED:Organic Light-Emitting Diode)などの形態で配置してもよい。さらに、タッチセンシティブ表面831は、表示パネル841を覆ってもよい。タッチセンシティブ表面831は、その上又はその近くでのタッチ操作を検出すると、タッチイベントのタイプを決定するために、該タッチ操作をプロセッサ880に伝送する。次に、プロセッサ880は、タッチイベントのタイプに応じて、相応の視覚的出力を表示パネル841に提供する。ここで、タッチセンシティブ表面831及び表示パネル841は、2つの別個の部品として、入力機能及び出力機能を実現してもよいが、いくつかの実施例では、タッチセンシティブ表面831及び表示パネル841を統合して、入力機能及び出力機能を実現してもよい。
機器は、例えば、光センサ、モーションセンサ、及び他のセンサなどの少なくとも1種のセンサ850をさらに含んでもよい。具体的には、光センサは、環境光センサ及び近接センサを含んでもよい。ここで、環境光センサは、環境光の明るさに応じて表示パネル841の輝度を調整することができ、近接センサは、機器が耳に近づくと、表示パネル841及び/又はバックライトをオフにすることができる。モーションセンサの1種として、重力加速度センサは、各方向(通常、3軸)における加速度の大きさを検出でき、静止時に重力の大きさ及び方向を検出でき、機器の姿勢を認識するアプリケーション(例えば、画面の縦横切り替え、関連ゲーム、磁力計の姿勢キャリブレーション)、振動認識関連の機能(例えば、歩数計、タップ)などに利用可能である。前記機器に配置可能な他のセンサ、例えば、ジャイロスコープ、気圧計、湿度計、温度計、赤外線センサなどについては、ここでは説明を省略する。
オーディオ回路860、スピーカー861、マイクロフォン862は、ユーザと機器との間のオーディオインターフェースを提供することができる。オーディオ回路860は、受信されたオーディオデータから変換された電気信号をスピーカー861に伝送することができる。スピーカー861は、電気信号を音響信号に変換して出力する。一方、マイクロフォン862は、収集された音響信号を電気信号に変換する。オーディオ回路860は、電気信号を受信してオーディオデータに変換し、オーディオデータをプロセッサ880に出力して、プロセッサ880によってオーディオデータを処理した後、RF回路810を介してオーディオデータを例えば他の機器に送信するか、又は、さらなる処理のために、オーディオデータをメモリ820に出力する。オーディオ回路860は、外付けイヤホンと機器との通信を提供するためのイヤホンジャックを含んでもよい。
WiFiは、近距離無線伝送技術に属する。機器は、WiFiモジュール870によって、ユーザによる電子メールの送受信、Webページの閲覧、及びストリーミングメディアのアクセスを助けることができる。WiFiは、無線ブロードバンドインターネットアクセスをユーザに提供する。図17にWiFiモジュール870を示しているが、理解できるように、WiFiモジュール870は、機器の必須構成に属せず、必要に応じて、発明の本質を変更しない範囲内で完全に省略可能である。
プロセッサ880は、機器の制御センターであり、機器全体の各部分を様々なインターフェース及び回線で接続し、メモリ820に記憶されたソフトウェアプログラム及び/又はモジュールを実行又は遂行して、メモリ820に記憶されたデータを呼び出すことにより、機器の様々な機能を実行してデータを処理し、機器を全体的に監視制御する。いくつかの実施例では、プロセッサ880は、1つ又は複数の処理コアを含んでもよい。いくつかの実施例では、プロセッサ880には、アプリケーションプロセッサ及びモデムプロセッサが統合されてもよい。ここで、アプリケーションプロセッサは、主にオペレーティングシステム、ユーザ画面、及びアプリケーションプログラムなどを処理し、モデムプロセッサは主に無線通信を処理する。理解できるように、上記モデムプロセッサは、プロセッサ880に統合されなくてもよい。
機器は、各部品に電力を供給する電源890(例えば、電池)をさらに含む。いくつかの実施例では、電源は、電源管理システムを介して、プロセッサ880に論理的に接続されてもよい。これにより、電力管理システムによって、充電、放電、及び電力消耗管理などの機能を実現する。電源890は、1つ又は複数の直流又は交流電源、再充電システム、電源故障検出回路、電源変換器又はインバータ、電源状態インジケータなどの任意のコンポーネントを含んでもよい。
図示されないが、機器には、カメラ、ブルートゥース(登録商標)モジュールなどが含まれてもよく、ここでは説明を省略する。具体的には、本実施例では、機器の表示ユニットは、タッチスクリーンであり、機器は、メモリと、1つ又は複数のプログラムとをさらに含む。ここで、1つ又は複数のプログラムは、メモリに記憶され、1つ又は複数のプロセッサで本願の装置の実施例における命令を実行するように構成される。具体的には、プロセッサは、
ビデオストリームにおける第1画像フレームの空間領域複雑さを取得し、上記第1画像フレームの時間領域複雑さを取得するステップと、
上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1ターゲットビットを第2ターゲットビットに更新し、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、上記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新するステップと、
上記第2ターゲットビット及び上記第2初期量子化パラメータに基づいて、上記第1画像フレームの圧縮ビットストリームを生成するステップと、を実行する。
本実施例では、ビデオ符号化のビットレート制御システムが提供されており、図18に示すように、当該システムは、第1端末11と、サーバ13と、第2端末14とを含む。
第1端末11は、
ターゲットビデオストリームにおける第1画像フレームを取得する第1画像フレーム取得モジュール310と、
上記第1画像フレームを処理することにより、上記第1画像フレームの空間領域複雑さと上記第1画像フレームの時間領域複雑さとを取得する時空間領域複雑さ取得モジュール320と、
上記空間領域複雑さ及び上記時間領域複雑さに基づいて、第1画像フレームの第1ターゲットビットを調整することにより、第1画像フレームの第2ターゲットビットを取得し、上記空間領域複雑さ及び上記時間領域複雑さに基づいて、第1画像フレームの第1初期量子化パラメータを調整することにより、第1画像フレームの第2初期量子化パラメータを取得するパラメータ調整モジュール330と、
調整された第2ターゲットビット及び初期量子化パラメータに基づいて、上記第1画像フレームの圧縮ビットストリームを取得する圧縮ビットストリーム取得モジュール340と、を含む。
第1端末11は、上記圧縮ビットストリーム情報をサーバに送信する圧縮ビットストリーム送信モジュール350をさらに含む。
第2端末14は、
サーバから上記圧縮ビットストリームを取得する圧縮ビットストリーム取得モジュール510と、
受信された圧縮ビットストリームを復号化する圧縮ビットストリーム復号化モジュール520と、を含む。
上記システムの実施例におけるシステムは、方法の実施例と同様な発明構想に基づくものである。
説明すべきものとして、上記本願の実施例の前後順序は、記述のためのものにすぎず、実施例の優劣を示すものではない。
当業者であれば理解できるように、上記実施例を実現するためのステップの全部又は一部は、ハードウェアによって実行されてもよいし、プログラムによって関連ハードウェアに指示することにより実行されてもよい。プログラムは、コンピュータ読み取り可能な記憶媒体に記憶されてもよい。上記で言及された記憶媒体は、読み出し専用メモリ、磁気ディスク、又は光ディスクなどであってもよい。
上記は、本願の好ましい実施例にすぎず、本願の保護範囲を限定するものではない。本願の精神および原則内で行われる種々の修正、均等置換え、改善などは全て本願の保護範囲内に含まれるべきである。
11 アプリケーションクライアント(第1端末)
12 ネットワーク
13 サーバ
14 アプリケーションクライアント(第2端末)
110 時空間領域複雑さ取得モジュール
120 パラメータ調整モジュール
130 圧縮ビットストリーム取得モジュール
210 時空間領域複雑さ取得モジュール
211 空間領域複雑さ取得ユニット
2111 最適フレーム内予測コスト取得サブユニット
2112 空間領域複雑さ取得サブユニット
212 時間領域複雑さ取得ユニット
2121 最適フレーム間予測コスト取得サブユニット
2122 時間領域複雑さ取得サブユニット
220 パラメータ調整モジュール
221 動き推定取得ユニット
222 第2ターゲットビット取得ユニット
2221 第1ビット調整サブユニット
2222 第2ビット調整サブユニット
2223 第3ビット調整サブユニット
223 第2量子化パラメータ取得ユニット
2231 初期量子化調整サブユニット
2232 最大量子化調整サブユニット
2233 最小量子化調整サブユニット
2234 最終量子化調整サブユニット
230 圧縮ビットストリーム取得モジュール
310 現在画像フレーム取得モジュール
320 時空間領域複雑さ取得モジュール
330 パラメータ調整モジュール
340 圧縮ビットストリーム取得モジュール
350 圧縮ビットストリーム送信モジュール
510 圧縮ビットストリーム取得モジュール
520 圧縮ビットストリーム復号化モジュール
810 RF回路
820 メモリ
830 入力ユニット
831 タッチセンシティブ表面
832 他の入力デバイス
840 表示ユニット
841 表示パネル
850 センサ
860 オーディオ回路
870 WiFiモジュール
880 プロセッサ
890 電源

Claims (14)

  1. 端末機器が実行する、ビデオ符号化のビットレート制御方法であって、
    ビデオストリームにおける第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得するステップと、
    前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの符号化に割り当てられる第1ターゲットビットを第2ターゲットビットに更新し、前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの前記第1ターゲットビットから算出された第1初期量子化パラメータを第2初期量子化パラメータに更新するステップと、
    前記第2ターゲットビット及び前記第2初期量子化パラメータに基づいて、前記第1画像フレームの圧縮ビットストリームを生成するステップと、
    を含み、前記第1及び第2ターゲットビットはビットレート制御においてチャネルの状態に応じて決定されるものであり、前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの符号化に割り当てられる第1ターゲットビットを第2ターゲットビットに更新する前記ステップは、
    第1画像フレームの動き推定属性と第2画像フレームの動き推定属性とを取得するステップであって、前記第1画像フレームの動き推定属性が、第1画像フレームの空間領域複雑さと時間領域複雑さとの比率であり、前記第1画像フレームの動きの激しさを示すものであり、前記第2画像フレームの動き推定属性が、第2画像フレームの空間領域複雑さと時間領域複雑さとの比率であり、前記第2画像フレームの動きの激しさを示すものであり、前記第2画像フレームが、前記第1画像フレームの1つ前の画像フレームである、ステップと、
    前記第1画像フレームの動き推定属性と前記第2画像フレームの動き推定属性との比率が属する所属区間を取得し、前記所属区間に対して予め定義されている関数に前記第1ターゲットビットを入力することにより返される値を前記第2ターゲットビットとして取得し、前記第1画像フレームの前記第1ターゲットビットを前記第2ターゲットビットに更新するステップと、
    を含む、ビデオ符号化のビットレート制御方法。
  2. 前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの第1初期量子化パラメータを第2初期量子化パラメータに更新する前記ステップは、
    第1画像フレームの空間領域複雑さと第2画像フレームの空間領域複雑さの比率が属する第1所属区間と、第1画像フレームの空間領域複雑さと第2画像フレームの1つ前の画像フレームの空間領域複雑さとの比率が属する第2所属区間とにより決定される所属領域を取得し、前記所属領域に対して予め定義されている関数に前記第1初期量子化パラメータを入力することにより返される値を前記第2初期量子化パラメータとして取得し、前記第1画像フレームの前記第1初期量子化パラメータを前記第2初期量子化パラメータに更新するステップ、
    を含む請求項1に記載のビデオ符号化のビットレート制御方法。
  3. 記第1画像フレームの前記第1ターゲットビットを前記第2ターゲットビットに更新するステップにおいて
    第1画像フレームの動き推定属性が、第1区分パラメータを用いて指定される第1範囲に属する場合、前記所属区間に対して予め定義されている関数は、第1の傾きを有する線型関数である第1ビット調整関数であり、又は、
    第1画像フレームの動き推定属性が、第2区分パラメータを用いて指定される第2範囲に属する場合、前記所属区間に対して予め定義されている関数は、第2の傾きを有する線型関数である第2ビット調整関数であり、又は、
    第1画像フレームの動き推定属性が、第3区分パラメータを用いて指定される第3範囲に属する場合、前記所属区間に対して予め定義されている関数は、第3の傾きを有する線型関数である第3ビット調整関数であり、
    記第1範囲、前記第2範囲、及び前記第3範囲は互いに異なる、請求項1に記載のビデオ符号化のビットレート制御方法。
  4. 記第1画像フレームの前記第1初期量子化パラメータを前記第2初期量子化パラメータに更新するステップにおいて
    前記所属領域に対して予め定義されている関数は、入力された前記第1初期量子化パラメータに、前記所属領域に対して予め決定されているオフセットを加えた値を返す第1量子化調整関数である、
    求項2に記載のビデオ符号化のビットレート制御方法。
  5. 記第1画像フレームの前記第1初期量子化パラメータを前記第2初期量子化パラメータに更新するステップの後に、
    前記所属領域に対して予め定義されている第2量子化調整関数で第1画像フレームの第1最大量子化パラメータを第2最大量子化パラメータに更新するステップであって、前記第2量子化調整関数は、入力された前記第1最大量子化パラメータに、前記所属領域に対して予め決定されているオフセットを加えた値を前記第2最大量子化パラメータとして返す、ステップ及び/又は、
    前記所属領域に対して予め定義されている第3量子化調整関数で第1画像フレームの第1最小量子化パラメータを第2最小量子化パラメータに更新するステップであって、前記第3量子化調整関数は、入力された前記第1最小量子化パラメータに、前記所属領域に対して予め決定されているオフセットを加えた値を前記第2最小量子化パラメータとして返す、ステップ
    をさらに含む請求項2に記載のビデオ符号化のビットレート制御方法。
  6. 前記第2初期量子化パラメータが量子化パラメータの臨界閾値よりも大きい場合、入力された前記第2初期量子化パラメータに依存する値をターゲット初期量子化パラメータとして返す線型関数である第4量子化調整関数を用いて、前記第2初期量子化パラメータを前記ターゲット初期量子化パラメータに更新するステップ、
    をさらに含む請求項4に記載のビデオ符号化のビットレート制御方法。
  7. ビデオストリームにおける第1画像フレームの空間領域複雑さを取得する前記ステップは、
    前記第1画像フレームにおける第1基本単位の最適なフレーム内予測コストを取得するステップと、
    前記第1基本単位の最適なフレーム内予測コストに基づいて、第1画像フレームの空間領域複雑さを取得するステップと、
    を含む請求項1に記載のビデオ符号化のビットレート制御方法。
  8. 前記第1画像フレームの時間領域複雑さを取得する前記ステップは、
    前記第1画像フレームにおける第1基本単位の最適なフレーム間予測コストを取得するステップと、
    前記第1基本単位の最適なフレーム間予測コストに基づいて、第1画像フレームの時間領域複雑さを取得するステップと、
    を含む請求項1に記載のビデオ符号化のビットレート制御方法。
  9. 前記ビデオストリームにおける第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得するステップの前に、ビデオストリームにおける第1画像フレームを取得するステップを含み
    前記第2ターゲットビット及び前記第2初期量子化パラメータに基づいて、前記第1画像フレームの圧縮ビットストリームを生成するステップの後に、前記圧縮ビットストリームをサーバに伝送するステップをさらに含み、
    前記ビデオストリームにおける第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得するステップは、
    前記第1画像フレームを処理することにより、前記第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得するステップ、
    を含む請求項1に記載のビデオ符号化のビットレート制御方法。
  10. ビデオ符号化のビットレート制御装置であって、
    ビデオストリームにおける第1画像フレームの空間領域複雑さ及び時間領域複雑さを取得する時空間領域複雑さ取得モジュールと、
    前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの符号化に割り当てられる第1ターゲットビットを第2ターゲットビットに更新し、前記空間領域複雑さ及び前記時間領域複雑さに基づいて、前記第1画像フレームの前記第1ターゲットビットから算出された第1初期量子化パラメータを第2初期量子化パラメータに更新するパラメータ調整モジュールと、
    前記第2ターゲットビット及び前記第2初期量子化パラメータに基づいて、前記第1画像フレームの圧縮ビットストリームを生成する圧縮ビットストリーム取得モジュールと、
    を含み、前記第1及び第2ターゲットビットはビットレート制御においてチャネルの状態に応じて決定されるものであり、前記パラメータ調整モジュールは、
    第1画像フレームの動き推定属性と第2画像フレームの動き推定属性とを取得し、前記第1画像フレームの動き推定属性が、第1画像フレームの時間領域複雑さと空間領域複雑さとの比率であり、前記第1画像フレームの動きの激しさを示すものであり、前記第2画像フレームの動き推定属性が、第2画像フレームの時間領域複雑さと空間領域複雑さとの比率であり、前記第2画像フレームの動きの激しさを示すものであり、前記第2画像フレームが、前記第1画像フレームの1つ前の画像フレームである動き推定取得ユニットと、
    前記第1画像フレームの動き推定属性と前記第2画像フレームの動き推定属性との比率が属する所属区間を取得し、前記所属区間に対して予め定義されている関数に前記第1ターゲットビットを入力することにより返される値を前記第2ターゲットビットとして取得し、前記第1画像フレームの前記第1ターゲットビットを前記第2ターゲットビットに更新する第2ターゲットビット取得ユニットと、
    を含む、ビデオ符号化のビットレート制御装置。
  11. 前記パラメータ調整モジュールは、
    第1画像フレームの空間領域複雑さと第2画像フレームの空間領域複雑さの比率が属する第1所属区間と、第1画像フレームの空間領域複雑さと第2画像フレームの1つ前の画像フレームの空間領域複雑さとの比率が属する第2所属区間とにより決定される所属領域を取得し、前記所属領域に対して予め定義されている関数に前記第1初期量子化パラメータを入力することにより返される値を前記第2初期量子化パラメータとして取得し、前記第1画像フレームの前記第1初期量子化パラメータを前記第2初期量子化パラメータに更新する第2量子化パラメータ取得ユニット、
    を含む請求項10に記載のビデオ符号化のビットレート制御装置。
  12. プロセッサとメモリとを備えるビデオ符号化のビットレート制御機器であって、前記メモリには、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶され、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、前記プロセッサによりロードされて実行されることで、請求項1~9のいずれか1項に記載のビデオ符号化のビットレート制御方法を実現させるビデオ符号化のビットレート制御機器。
  13. 少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットを記憶したコンピュータ読み取り可能な記憶媒体であって、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、プロセッサによりロードされて実行されることで、請求項1~9のいずれか1項に記載のビデオ符号化のビットレート制御方法を実させるコンピュータ読み取り可能な記憶媒体。
  14. 請求項1~9のいずれか1項に記載のビデオ符号化のビットレート制御方法を端末機器に実行させるコンピュータプログラム。
JP2020544623A 2018-03-28 2019-02-27 ビデオ符号化のビットレート制御方法、装置、機器、記憶媒体及びプログラム Active JP7229261B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810265922.3 2018-03-28
CN201810265922.3A CN110324622B (zh) 2018-03-28 2018-03-28 一种视频编码码率控制方法、装置、设备及存储介质
PCT/CN2019/076310 WO2019184643A1 (zh) 2018-03-28 2019-02-27 一种视频编码码率控制方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
JP2021517388A JP2021517388A (ja) 2021-07-15
JP7229261B2 true JP7229261B2 (ja) 2023-02-27

Family

ID=68058556

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020544623A Active JP7229261B2 (ja) 2018-03-28 2019-02-27 ビデオ符号化のビットレート制御方法、装置、機器、記憶媒体及びプログラム

Country Status (5)

Country Link
US (2) US11240511B2 (ja)
EP (1) EP3780610A4 (ja)
JP (1) JP7229261B2 (ja)
CN (1) CN110324622B (ja)
WO (1) WO2019184643A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113132728B (zh) * 2019-12-31 2023-06-27 上海海思技术有限公司 编码方法及编码器
CN111083536B (zh) * 2019-12-31 2022-02-22 广州酷狗计算机科技有限公司 调节视频码率的方法和装置
CN113365061B (zh) * 2020-03-03 2024-02-09 炬芯科技股份有限公司 H264宏块级码率控制方法、装置及可读存储介质
CN111479113B (zh) * 2020-04-15 2021-04-09 腾讯科技(深圳)有限公司 码率控制方法和装置、存储介质和电子设备
CN111447446B (zh) * 2020-05-15 2022-08-23 西北民族大学 一种基于人眼视觉区域重要性分析的hevc码率控制方法
CN111787318A (zh) * 2020-06-24 2020-10-16 浙江大华技术股份有限公司 一种视频码率控制方法、装置、设备以及存储装置
CN112165620A (zh) * 2020-09-24 2021-01-01 北京金山云网络技术有限公司 视频的编码方法及装置、存储介质、电子设备
CN112218083B (zh) * 2020-10-16 2021-09-17 西安邮电大学 高效视频编码标准帧内图像码率估计方法
CN112073723B (zh) * 2020-11-16 2021-02-02 北京世纪好未来教育科技有限公司 视频信息处理方法、装置、电子设备及存储介质
CN113132757B (zh) * 2021-04-21 2022-07-05 北京汇钧科技有限公司 数据处理方法和装置
CN113973205A (zh) * 2021-10-21 2022-01-25 重庆邮电大学 基于视频内容特征的码率控制比特分配方法及存储介质
CN115022719B (zh) * 2022-05-12 2023-05-26 东风汽车集团股份有限公司 一种远程驾驶自适应视频码率控制传输方法与***
CN115225911B (zh) * 2022-08-19 2022-12-06 腾讯科技(深圳)有限公司 一种码率自适应方法、装置、计算机设备和存储介质
CN115412758B (zh) * 2022-09-01 2023-11-14 北京奇艺世纪科技有限公司 一种视频处理方法及相关装置
CN116094969B (zh) * 2022-12-23 2024-03-29 中国联合网络通信集团有限公司 带宽调整方法、装置、设备及存储介质
CN116208586B (zh) * 2023-05-04 2023-06-30 广东珠江智联信息科技股份有限公司 一种低延时医疗影像数据传输方法及***
CN117014659B (zh) * 2023-10-07 2024-02-06 腾讯科技(深圳)有限公司 一种视频转码方法、装置、电子设备和存储介质
CN117478881A (zh) * 2023-11-06 2024-01-30 淘宝(中国)软件有限公司 视频信息处理方法、***、设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060245492A1 (en) 2005-04-28 2006-11-02 Thomas Pun Single pass rate controller

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8005139B2 (en) * 2004-06-27 2011-08-23 Apple Inc. Encoding with visual masking
US7474701B2 (en) * 2004-09-23 2009-01-06 International Business Machines Corporation Single pass variable bit rate control strategy and encoder for processing a video frame of a sequence of video frames
BRPI0518821B8 (pt) 2004-12-02 2019-08-27 Interdigital Madison Patent Holdings determinação de parâmetro de quantizador para controle de taxa em codificador de vídeo
KR100790148B1 (ko) * 2006-07-27 2008-01-02 삼성전자주식회사 실시간 영상 복잡도 측정 방법
US8331438B2 (en) * 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
EP2286595A1 (en) * 2008-06-16 2011-02-23 Dolby Laboratories Licensing Corporation Rate control model adaptation based on slice dependencies for video coding
CN101325711A (zh) * 2008-07-16 2008-12-17 上海大学 基于时空掩盖效应的自适应码率控制方法
WO2010057170A1 (en) * 2008-11-17 2010-05-20 Cernium Corporation Analytics-modulated coding of surveillance video
US20100166060A1 (en) * 2008-12-31 2010-07-01 Texas Instruments Incorporated Video transcoder rate control
CN101827267B (zh) * 2010-04-20 2012-07-04 上海大学 基于视频图像分割技术的码率控制方法
US9565440B2 (en) * 2013-06-25 2017-02-07 Vixs Systems Inc. Quantization parameter adjustment based on sum of variance and estimated picture encoding cost
US20150071343A1 (en) * 2013-09-12 2015-03-12 Magnum Semiconductor, Inc. Methods and apparatuses including an encoding system with temporally adaptive quantization
US20150215621A1 (en) * 2014-01-30 2015-07-30 Qualcomm Incorporated Rate control using complexity in video coding
EP2919232A1 (en) * 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and method for encoding and decoding
US9661329B2 (en) * 2014-04-30 2017-05-23 Intel Corporation Constant quality video coding
US10397574B2 (en) * 2014-05-12 2019-08-27 Intel Corporation Video coding quantization parameter determination suitable for video conferencing
CN104683804B (zh) * 2015-02-14 2017-12-29 北京航空航天大学 基于视频内容特征的参数自适应多维码率控制方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060245492A1 (en) 2005-04-28 2006-11-02 Thomas Pun Single pass rate controller

Also Published As

Publication number Publication date
US11240511B2 (en) 2022-02-01
US20220030245A1 (en) 2022-01-27
WO2019184643A1 (zh) 2019-10-03
EP3780610A1 (en) 2021-02-17
CN110324622B (zh) 2022-09-23
EP3780610A4 (en) 2021-04-28
CN110324622A (zh) 2019-10-11
JP2021517388A (ja) 2021-07-15
US11606564B2 (en) 2023-03-14
US20200288143A1 (en) 2020-09-10

Similar Documents

Publication Publication Date Title
JP7229261B2 (ja) ビデオ符号化のビットレート制御方法、装置、機器、記憶媒体及びプログラム
US10986332B2 (en) Prediction mode selection method, video encoding device, and storage medium
CN111010576B (zh) 一种数据处理方法及相关设备
US11388403B2 (en) Video encoding method and apparatus, storage medium, and device
CN109168013B (zh) 一种抽帧的方法、装置、设备及计算机可读存储介质
KR102225235B1 (ko) 비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체
CN106961603A (zh) 帧内编码帧码率分配方法和装置
US10284850B2 (en) Method and system to control bit rate in video encoding
WO2019169997A1 (zh) 视频运动估计方法、装置、终端及存储介质
CN105992001A (zh) 一种对图片进行量化处理的方法及装置
JPWO2012160626A1 (ja) 画像圧縮装置、画像復元装置、及びプログラム
CN113630621B (zh) 一种视频处理的方法、相关装置及存储介质
CN116939212A (zh) 视频处理方法、装置、计算机可读存储介质及计算机设备
CN110213593B (zh) 一种运动矢量的确定方法、编码压缩方法和相关装置
CN112866710B (zh) 一种编码单元处理方法和相关装置
CN109003313B (zh) 一种传输网页图片的方法、装置和***

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230214

R150 Certificate of patent or registration of utility model

Ref document number: 7229261

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150