JP2021516919A - ビデオ符号化方法並びにその装置、記憶媒体、機器、及びコンピュータプログラム - Google Patents

ビデオ符号化方法並びにその装置、記憶媒体、機器、及びコンピュータプログラム Download PDF

Info

Publication number
JP2021516919A
JP2021516919A JP2020551298A JP2020551298A JP2021516919A JP 2021516919 A JP2021516919 A JP 2021516919A JP 2020551298 A JP2020551298 A JP 2020551298A JP 2020551298 A JP2020551298 A JP 2020551298A JP 2021516919 A JP2021516919 A JP 2021516919A
Authority
JP
Japan
Prior art keywords
coding
video frame
quantization parameter
resolution
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020551298A
Other languages
English (en)
Other versions
JP7085014B2 (ja
Inventor
マオ,シュンアン
グオ,リツァイ
シ,ヨンファン
ガオ,アンリン
ガオ,シンウエイ
ジャン,タオ
ドン,ハイボ
グ,チェンチェン
ルゥ,ジン
Original Assignee
テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド filed Critical テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Publication of JP2021516919A publication Critical patent/JP2021516919A/ja
Application granted granted Critical
Publication of JP7085014B2 publication Critical patent/JP7085014B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本願のビデオ符号化方法は、符号化対象のビデオを取得するステップであって、前記ビデオには、順に並んだ少なくとも2つのビデオフレームが含まれる、ステップと、前記少なくとも2つのビデオフレームのうちのi(iは、2以上の正の整数)番目のビデオフレームに対して、前記i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値を計算するステップと、前記量子化パラメータ及び前記量子化パラメータ閾値に基づいて、前記i番目のビデオフレームの符号化解像度を決定するステップであって、前記符号化解像度が、第1符号化解像度又は第2符号化解像度であり、前記第1符号化解像度が、前記i番目のビデオフレームのサンプリング時の解像度であり、前記第2符号化解像度が、前記i番目のビデオフレームをダウンサンプリングする場合の解像度である、ステップと、前記符号化解像度で前記i番目のビデオフレームを符号化するステップと、を含む。

Description

本願は、2018年4月27日に提出された、出願番号が201810394329.9であり、発明の名称が「ビデオ符号化方法、装置、記憶媒体及び機器」である中国特許出願に基づく優先権を主張し、その全ての内容は参照することにより本願に組み込まれる。
本願の実施例は、符号化の技術分野に関し、特に、ビデオ符号化方法、装置、記憶媒体及び機器に関する。
ビデオは、複数のビデオフレームで順に構成されたビデオフレームシーケンスである。ビデオのデータ量が大きいため、符号化によってビデオを圧縮してもよい。符号化には、ビデオにおける各ビデオフレームの符号化解像度を決定する必要がある。以下、符号化解像度及びビデオフレームの種類について紹介する。
関連技術では、2種類の符号化解像度が提供されている。第1符号化解像度は、ビデオフレームのサンプリング時の解像度であり、第2符号化解像度は、該ビデオフレームをダウンサンプリングする場合の解像度である。ここでのダウンサンプリングとは、いくつかのサンプル値おきにサンプル値シーケンスを1回サンプリングすることである。ここから分かるように、第2符号化解像度は、第1符号化解像度よりも低い。一方、関連技術では、2種類のビデオフレームが提供されている。1種類は、Iフレームであり、もう1種類は、Pフレームである。Iフレームは、フレーム内予測フレームであり、それ自体が全ての情報を有し、他のフレームを参照することなく符号化を行うことができる。Pフレームは、フレーム間予測フレームであり、他のフレームを参照してこそ、符号化を行うことができる。
上記2種類のビデオフレームの特徴に基づいて、端末は、各ビデオフレームを符号化する際に、該ビデオフレームがIフレームであるか、それともPフレームであるかを決定する必要があり、該ビデオフレームがIフレームである場合、第1符号化解像度で該ビデオを符号化し、該ビデオフレームがPフレームである場合、第2符号化解像度で該ビデオフレームを符号化する。
上記方法では、同じ種類のビデオフレームが同じ符号化解像度に対応することで、符号化方式の柔軟性が不十分になる。
本願の実施例は、同じ種類のビデオフレームが同じ符号化解像度に対応することで、符号化方式の柔軟性が不十分になるという問題を解決するビデオ符号化方法、装置、記憶媒体及び機器を提供する。その構成は、以下のとおりである。
一態様では、ビデオ符号化方法が提供されている。前記方法は、
符号化対象のビデオを取得するステップであって、前記ビデオには、順に並んだ少なくとも2つのビデオフレームが含まれる、ステップと、
前記少なくとも2つのビデオフレームのうちのi(iは、2以上の正の整数)番目のビデオフレームに対して、前記i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値を計算するステップと、
前記量子化パラメータ及び前記量子化パラメータ閾値に基づいて、前記i番目のビデオフレームの符号化解像度を決定するステップであって、前記符号化解像度が、第1符号化解像度又は第2符号化解像度であり、前記第1符号化解像度が、前記i番目のビデオフレームのサンプリング時の解像度であり、前記第2符号化解像度が、前記i番目のビデオフレームをダウンサンプリングする場合の解像度である、ステップと、
前記符号化解像度で前記i番目のビデオフレームを符号化するステップと、を含む。
一態様では、ビデオ符号化装置が提供されている。前記装置は、
符号化対象のビデオを取得し、前記ビデオには、順に並んだ少なくとも2つのビデオフレームが含まれる取得モジュールと、
前記少なくとも2つのビデオフレームのうちのi(iは、2以上の正の整数)番目のビデオフレームに対して、前記i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値を計算する計算モジュールと、
前記計算モジュールにより取得された前記量子化パラメータ及び前記量子化パラメータ閾値に基づいて、前記i番目のビデオフレームの符号化解像度を決定し、前記符号化解像度が、第1符号化解像度又は第2符号化解像度であり、前記第1符号化解像度が、前記i番目のビデオフレームのサンプリング時の解像度であり、前記第2符号化解像度が、前記i番目のビデオフレームをダウンサンプリングする場合の解像度である決定モジュールと、
前記決定モジュールにより決定された前記符号化解像度で前記i番目のビデオフレームを符号化する符号化モジュールと、を含む。
一態様では、コンピュータ可読記憶媒体が提供されている。前記記憶媒体には、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶され、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、プロセッサによりロードされて実行されることで、上記のようなビデオ符号化方法を実現させる。
一態様では、ビデオ符号化機器が提供されている。前記ビデオ符号化機器は、プロセッサと、メモリとを備え、前記メモリには、少なくとも1つの命令が記憶され、前記命令は、前記プロセッサによりロードされて実行されることで、上記のようなビデオ符号化方法を実現させる。
本願の実施例で提供された構成の有益な効果は、少なくとも、下記の効果を含む。
ビデオフレームの量子化パラメータ及び量子化パラメータ閾値をそれぞれ計算し、量子化パラメータ及び量子化パラメータ閾値に基づいて、ビデオフレームの符号化解像度を決定することにより、同じ種類のビデオフレームは、同じ符号化解像度に対応する可能性もあるし、異なる符号化解像度に対応する可能性もあるようになり、同じ種類のビデオフレームが同じ符号化解像度に対応することで、符号化方式の柔軟性が不十分になるという問題が解決され、符号化方式の柔軟性が向上する。
量子化パラメータが、画質に関連するものであり、量子化パラメータ閾値が、所望の画質に関連するものであるため、量子化パラメータ及び量子化パラメータ閾値に基づいて、ビデオフレームの符号化解像度を決定することは、画質及び所望の画質に基づいて、ビデオフレームの符号化解像度を選択することに相当し、決定される符号化解像度の正確さを向上させることができる。
本願の実施例の構成をより明確に説明するために、以下、実施例の説明に必要な図面を簡単的に紹介する。明らかに、以下の説明における図面は本願のいくつかの実施例を示しているにすぎず、当業者にとって、創造的な労働をせずに、これらの図面から他の図面を得ることもできる。
本願の一部の実施例で示された符号化解像度を決定するフローチャートである。 一部の例示的な実施例で示されたビデオ符号化システムの構成の模式図である。 本願の一実施例で提供されたビデオ符号化方法のフローチャートである。 本願の他の実施例で提供されたビデオ符号化方法のフローチャートである。 本願の他の実施例で提供された符号化コスト比を計算するフローチャートである。 本願の一実施例で提供されたビデオ符号化装置の構成ブロック図である。 本願の別の実施例で提供されたビデオ符号化装置の構成ブロック図である。
本願の実施例の目的、構成、及びメリットをより明確にするために、以下、図面を参照しながら、本願の実施形態をさらに詳しく説明する。
本願の実施例を詳しく説明する前に、本願の実施例の適用シナリオについて説明する。
本願の実施例は、ビデオ圧縮の適用シナリオに適用される。ビデオを圧縮した後、ビデオを伝送することができ、ビデオの伝送時に使用する帯域幅が節約され、伝送にかかる時間が削減され、ビデオを記憶することもでき、ビデオにより使用される記憶スペースが節約され、ビデオに対して他の処理を行うこともでき、ここでは限定しない。
ここで、ビデオ伝送は、リアルタイム伝送及び非リアルタイム伝送を含む。リアルタイム伝送は、インスタント通信クライアントを利用して、リアルタイムビデオ通話を行うことや、ライブ配信クライアントを利用して、リアルタイムなライブ配信を行うことなどであってもよい。非リアルタイム伝送は、ビデオのアップロードやダウンロードなどであってもよい。
概括して言えば、本願の実施例は、5つのステップに分けることができる。図1を参照すると、第1ステップ101で、フレーム内/フレーム間プリコーディングコスト分析を行うことにより、符号化コスト比を決定し、第2ステップ102で、符号化コスト比に基づいて、量子化パラメータを推定し、第3ステップ103で、量子化パラメータ閾値を計算し、第4ステップ104で、量子化パラメータ及び量子化パラメータの閾値に基づいて、符号化解像度を選択し、第5ステップ105で、選択された符号化解像度でビデオフレームを符号化する。ここで、各ステップの詳細な解釈について、詳しくは以下の実施例の説明を参照されたい。
本願の実施例では、ビデオにおける各Iフレームは、同じ符号化解像度に対応する可能性もあるし、異なる符号化解像度に対応する可能性もあり、ビデオにおける各Pフレームは、同じ符号化解像度に対応する可能性もあるし、異なる符号化解像度に対応する可能性もある。つまり、同じ種類のビデオフレームは、同じ符号化解像度に対応する可能性もあるし、異なる符号化解像度に対応する可能性もある。これにより、符号化方式の柔軟性が向上する。また、量子化パラメータが、画質に関連するものであり、量子化パラメータ閾値が、所望の画質に関連するものであるため、量子化パラメータ及び量子化パラメータ閾値に基づいて、ビデオフレームの符号化解像度を決定することは、画質及び所望の画質に基づいて、ビデオフレームの符号化解像度を選択することに相当し、決定される符号化解像度の正確さを向上させることができる。
以下、本願の実施例のシステムアーキテクチャについて説明する。
図2を参照されたいが、図2は、本願の実施例で提供されたビデオ符号化システムの構成の模式図である。該ビデオ符号化システムが、インスタント通信クライアントを利用してリアルタイムビデオ通話を行うシナリオに適用される場合を例にすると、該ビデオ符号化システムは、少なくとも、第1端末210と、第2端末220と、サーバ230とを含む。第1端末210とサーバ230とは、有線ネットワーク又は無線ネットワークを介して接続を確立し、第2端末220とサーバ230とは、有線ネットワーク又は無線ネットワークを介して接続を確立する。
第1端末210は、ビデオデータストリームの送受信機能を有する機器(例えば、スマートフォン)である。第1端末210には、例えば、ウィーチャットクライアント、QQクライアントなどのインスタント通信クライアントがインストールされる。
第2端末220は、ビデオデータストリームの送受信機能を有する機器(例えば、スマートフォン)である。第2端末220と第1端末210には、少なくとも1つの同じインスタント通信クライアントがインストールされ、かつ第2端末220におけるインスタント通信クライアントは、第1端末210におけるインスタント通信クライアントと通信することができる。
サーバ230は、インスタント通信クライアントのバックグラウンドサーバであり、1つのサーバ、又は複数のサーバからなるサーバクラスタ、又はクラウドコンピューティングセンターであってもよい。
本願の実施例では、第1端末210からサーバ230を介して第2端末220へ、リアルタイムビデオ通話を開始してもよいし、第2端末220からサーバ230を介して第1端末210へ、リアルタイムビデオ通話を開始してもよい。
以下、リアルタイムビデオ通話がつながった後に、第1端末210を利用する第1ユーザと、第2端末220を利用する第2ユーザとがリアルタイムビデオ通話を行う過程について紹介する。第1端末210が、カメラで第1ユーザの通話過程を撮像することにより、第1ビデオを取得し、本願の実施例で提供されたビデオ符号化方法によって該第1ビデオを符号化し、符号化された第1ビデオデータストリームをサーバ230に送信し、サーバ230が、該第1ビデオデータストリームを第2端末220に転送し、第2端末220が、該符号化方式に対応する復号化方式で該第1ビデオデータストリームを復号化し、復号化された第1ビデオを再生する。同時に、第2端末220が、カメラで第2ユーザの通話過程を撮像することにより、第2ビデオを取得し、本願の実施例で提供された符号化方式で該第2ビデオを符号化し、符号化された第2ビデオデータストリームをサーバ230に送信し、サーバ230が、該第2ビデオデータストリームを第1端末210に転送し、第1端末210が、該符号化方式に対応する復号化方式で該第2ビデオデータストリームを復号化し、復号化された第2ビデオを再生する。
任意選択的に、第1端末210は、第2ビデオに加えて、自身が撮像した第1ビデオを再生してもよい。つまり、第1端末210の表示画面の第1領域内で第2ビデオを再生し、第2領域内で第1ビデオを再生する。同様に、第2端末220は、第1ビデオに加えて、自身が撮像した第2ビデオを再生してもよい。つまり、第2端末220の表示画面の第1領域内で第1ビデオを再生し、第2領域内で第2ビデオを再生する。ここで、第1端末210及び第2端末220の表示画面は、図2に示すとおりである。
図3を参照されたいが、図3は、本願の一実施例で提供されたビデオ符号化方法のフローチャートである。該ビデオ符号化方法は、図2に示す第1端末又は第2端末に適用可能である。該ビデオ符号化方法は、下記のステップを含む。
ステップ301で、符号化対象のビデオを取得し、該ビデオには、順に並んだ少なくとも2つのビデオフレームが含まれる。
ビデオは、端末が撮像したものであってもよいし、端末がネットワークからダウンロードしたものであってもよいし、端末が他の機器から取得したものであってもよく、本実施例は、ビデオの出所を限定しない。
ビデオは、順に並んだ少なくとも2つのビデオフレームを含むビデオフレームシーケンスである。ここで、順に並ぶことは、各ビデオフレームの撮像順に並び、つまり、各ビデオフレームの撮像時間の早い順に並ぶことを意味する。
ビデオフレームシーケンスにおける1番目のビデオフレームについては、端末は、デフォルトとして、第1符号化解像度で該ビデオフレームを符号化する。ビデオフレームシーケンスにおける残りのビデオフレームについては、端末は、該ビデオフレームシーケンスから1つのビデオフレームを順次読み出し、該ビデオフレームをi(iは2以上の正の整数)番目のビデオフレームとして、ステップ302〜303を実行して該i番目のビデオフレームの符号化解像度を選択し、最後に、ステップ304を実行して、選択された該符号化解像度で該i番目のビデオフレームを符号化する。ここで、符号化解像度は、第1符号化解像度又は第2符号化解像度であり、詳しくは、ステップ303の解釈を参照されたい。
ステップ302で、少なくとも2つのビデオフレームのうちのi番目のビデオフレームに対して、i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値を計算する。
量子化とは、符号化が必要なデータの量を低減して、データを圧縮する目的を達成するために、連続信号を離散信号としてサンプリングする処理方式を意味する。
量子化パラメータは、ビデオフレームを量子化する過程に係るパラメータである。
量子化パラメータは、量子化の精度を示すためのパラメータである。ここで、量子化パラメータは、量子化の精度と負の相関関係にある。つまり、量子化パラメータが小さいほど、量子化が細かくなり、このときの画質が良く、データの圧縮比が高くない。量子化パラメータが大きいほど、量子化が粗くなり、このときの画質が悪く、データの圧縮比が高い。
量子化パラメータは、量子化ステップサイズに対応する番号である。例えば、H.264(MPEG−4 AVC:Moving Picture Expert Group−4 Advanced Video Codec)では、52個の量子化ステップサイズがあるため、量子化パラメータの数値が0〜51であり、各量子化パラメータそれぞれは、52個の量子化ステップサイズのうちの1つの量子化ステップサイズを識別するためのものである。
量子化パラメータ閾値は、所望の画質を表すための閾値である。ここでの所望の画質は、ユーザが主観的に許容できる画質である。ここで、量子化パラメータ閾値は、所望の画質と正の相関関係にある。即ち、所望の画質が低いほど、量子化パラメータ閾値が小さくなり、所望の画質が高いほど、量子化パラメータ閾値が大きくなる。
これは、人間の目が、静止シーンの画質の損失に敏感であり、動いているシーンの画質の損失に敏感でないからである。このため、人間の目は、静止シーンでのビデオフレームの所望の画質に対する要求が高く、端末は、第1符号化解像度で符号化を行って画質を向上させることに傾くように、静止シーンでのビデオフレームに対して、大きな量子化パラメータ閾値を設定してもよい。人間の目は、動いているシーンでのビデオフレームの所望の画質に対する要求が低く、端末は、第2符号化解像度で符号化を行ってデータの圧縮比を向上させることに傾くように、動いているシーンでのビデオフレームに対して、小さな量子化パラメータ閾値を設定してもよい。
本実施例では、少なくとも2つのビデオフレームのうちのi番目のビデオフレームに対して、端末は、i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値をそれぞれ計算する。ここでの量子化パラメータは、端末が推定したものであり、実際の量子化パラメータとは異なる可能性がある。ここで、端末が量子化パラメータを計算する内容の詳細については、ステップ402又は403の説明を参照されたいが、量子化パラメータ閾値を計算する内容の詳細については、ステップ404〜407の説明を参照されたい。
ステップ303で、量子化パラメータ及び量子化パラメータ閾値に基づいて、i番目のビデオフレームの符号化解像度を決定する。
符号化解像度は、第1符号化解像度又は第2符号化解像度である。第1符号化解像度は、i番目のビデオフレームのサンプリング時の解像度であり、フル解像度と呼ばれてもよい。第2符号化解像度は、i番目のビデオフレームをダウンサンプリングする場合の解像度であり、ダウンサンプリング解像度と呼ばれてもよい。ここで、第2符号化解像度は、第1符号化解像度よりも小さい。
ステップ304で、該符号化解像度でi番目のビデオフレームを符号化する。
第1符号化解像度でi番目のビデオフレームを符号化する場合、画質が良く、データの圧縮比が低い。第2符号化解像度でi番目のビデオフレームを符号化する場合、画質が悪く、データの圧縮比が高い。
以上説明したように、本願の実施例で提供されたビデオ符号化方法では、ビデオフレームの量子化パラメータ及び量子化パラメータ閾値をそれぞれ計算し、量子化パラメータ及び量子化パラメータ閾値に基づいて、ビデオフレームの符号化解像度を決定することにより、同じ種類のビデオフレームは、同じ符号化解像度に対応する可能性もあるし、異なる符号化解像度に対応する可能性もあるようになり、同じ種類のビデオフレームが同じ符号化解像度に対応することで、符号化方式の柔軟性が不十分になるという問題が解決され、符号化方式の柔軟性が向上する。
量子化パラメータが、画質に関連するものであり、量子化パラメータ閾値が、所望の画質に関連するものであるため、量子化パラメータ及び量子化パラメータ閾値に基づいて、ビデオフレームの符号化解像度を決定することは、画質及び所望の画質に基づいて、ビデオフレームの符号化解像度を選択することに相当し、決定される符号化解像度の正確さを向上させることができる。
図4を参照されたいが、図4は、本願の他の実施例で提供されたビデオ符号化方法のフローチャートである。該ビデオ符号化方法は、図2に示す第1端末又は第2端末に適用可能である。該ビデオ符号化方法は、下記のステップを含む。
ステップ401で、符号化対象のビデオを取得し、該ビデオには、順に並んだ少なくとも2つのビデオフレームが含まれる。
ビデオは、端末が撮像したものであってもよいし、端末がネットワークからダウンロードしたものであってもよいし、端末が他の機器から取得したものであってもよく、本実施例は、ビデオの出所を限定しない。
ビデオは、順に並んだ少なくとも2つのビデオフレームを含むビデオフレームシーケンスである。ここで、順に並ぶことは、各ビデオフレームの撮像順に並び、つまり、各ビデオフレームの撮像時間の早い順に並ぶことを意味する。
ビデオフレームシーケンスにおける1番目のビデオフレームについては、端末は、デフォルトとして、第1符号化解像度で該ビデオフレームを符号化する。ビデオフレームシーケンスにおける残りのビデオフレームについては、端末は、該ビデオフレームシーケンスから1つのビデオフレームを順次読み出し、該ビデオフレームをi(iは2以上の正の整数)番目のビデオフレームとして、ステップ402〜408を実行して該i番目のビデオフレームの符号化解像度を選択し、最後に、ステップ409を実行して、選択された該符号化解像度で該i番目のビデオフレームを符号化する。ここで、符号化解像度は、第1符号化解像度又は第2符号化解像度であり、第1符号化解像度は、ビデオフレームのサンプリング時の解像度であり、第2符号化解像度は、該ビデオフレームをダウンサンプリングする場合の解像度であり、詳しくは、ステップ303の説明を参照されたい。
ステップ402で、少なくとも2つのビデオフレームのうちのi番目のビデオフレームに対して、i番目のビデオフレームの符号化モードが固定品質符号化モードである場合、設定された量子化パラメータを読み出し、該量子化パラメータを該i番目のビデオフレームの量子化パラメータとして決定し、ステップ404を実行する。
固定品質符号化モードとは、一定の画質でビデオフレームを符号化するモードを意味する。つまり、固定品質符号化モードで各ビデオフレームを符号化する場合、符号化された各ビデオフレームの画質が一定となる。
ビデオフレームの画質が、量子化パラメータに関連するものであるため、画質が一定である場合は、量子化パラメータが一定であることを意味する。したがって、固定品質符号化モードのビデオフレームに対して、一定の量子化パラメータを予め設定しておいてもよい。つまり、i番目のビデオフレームの符号化モードが固定品質符号化モードである場合、i番目のビデオフレームの量子化パラメータが、予め設定されたものであり、端末は、それを直接読み出すだけで、該i番目のビデオフレームの量子化パラメータを取得することができる。
説明すべきものとして、異なる符号化解像度が、異なる量子化パラメータに対応するため、量子化パラメータを読み出す前に、端末は、i番目のビデオフレームの符号化解像度を仮定する必要もあり、そして、該符号化解像度に対応する量子化パラメータを読み出す。ここで、第1符号化解像度に対応する量子化パラメータは、第2符号化解像度に対応する量子化パラメータよりも大きい。例えば、第1符号化解像度に対応する量子化パラメータは、33であり、第2符号化解像度に対応する量子化パラメータは、27である。
画質を向上させるために、リアルタイムビデオ通話のシナリオにおけるビデオフレームの多くは、第1符号化解像度で符号化される。このため、任意選択的に、端末は、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定してもよい。当然のことながら、端末は、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定してもよく、本実施例は限定しない。
ステップ403で、少なくとも2つのビデオフレームのうちのi番目のビデオフレームに対して、i番目のビデオフレームの符号化モードが固定ビットレート符号化モードである場合、i番目のビデオフレームにおける1番目の符号化ブロックの量子化パラメータを計算し、該1番目の符号化ブロックの量子化パラメータを該i番目のビデオフレームの量子化パラメータとして決定する。
固定ビットレート符号化モードは、一定のビットレートでビデオフレームを符号化するモードである。つまり、固定ビットレート符号化モードで1秒あたりの複数のビデオフレームを符号化する場合、符号化された1秒あたりの全てのビデオフレームの総サイズが一定となる。
一定のビットレートでビデオフレームを符号化すると、ビデオフレームの画質が安定しないが、画質が、量子化パラメータに関連するものであるため、端末は、画質に応じて、量子化パラメータを動的に決定する必要がある。つまり、i番目のビデオフレームの符号化モードが固定ビットレート符号化モードである場合、端末は、i番目のビデオフレームの量子化パラメータを動的に計算してもよい。
説明すべきものとして、異なる符号化解像度が、異なる量子化パラメータに対応するため、量子化パラメータを計算する前に、端末は、i番目のビデオフレームの符号化解像度を仮定する必要もあり、そして、仮定された符号化解像度に基づいて、量子化パラメータを計算する。ここで、第1符号化解像度と仮定された場合と、第2符号化解像度と仮定された場合とは、量子化パラメータ計算のアルゴリズムが同一である。
ここで、i番目のビデオフレームにおける1番目の符号化ブロックの量子化パラメータを計算することは、以下の4つの方式を含んでもよい。
1)、i−1番目のビデオフレームがIフレームであり、かつ第2符号化解像度でi−1番目のビデオフレームを符号化した場合、i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、第1オフセット及び第2オフセットを取得し、平均値、第1オフセット、及び第2オフセットの和を1番目の符号化ブロックの量子化パラメータとして決定する。
i−1番目のビデオフレームの符号化モードが固定品質符号化モードである場合、符号化過程では、端末は、該i−1番目のビデオフレームを少なくとも2つの符号化ブロックに分割する。各符号化ブロックの量子化パラメータは、いずれも、設定された量子化パラメータであり、各符号化ブロックに対して設定された量子化パラメータは等しい。したがって、全ての符号化ブロックの実際の量子化パラメータの平均値は、依然として設定された該量子化パラメータである。
i−1番目のビデオフレームの符号化モードが固定ビットレート符号化モードである場合、符号化過程では、端末は、該i−1番目のビデオフレームを少なくとも2つの符号化ブロックに分割し、エンコーダにおいて設定されたアルゴリズムで各符号化ブロックの実際の量子化パラメータを計算し、全ての量子化パラメータを加算したものを符号化ブロックの数で除算することにより、平均値を取得する。
説明すべきものとして、i−1番目のビデオフレームをプリコーディングする際に、まず、該i−1番目のビデオフレームの1番目の符号化ブロックの量子化パラメータを計算してから、該量子化パラメータをi−1番目のビデオフレームの量子化パラメータと仮定する。実際に符号化を行う際に、端末は、i−1番目のビデオフレームにおける各符号化ブロックの実際の量子化パラメータを計算する。ここで算出された実際の量子化パラメータは、以前に仮定された量子化パラメータと異なる。本ステップで計算されるのは、符号化過程で得られる実際の量子化パラメータの平均値である。
第1オフセットは、第1符号化解像度に対応する量子化パラメータと、第2符号化解像度に対応する量子化パラメータとのオフセットであり、経験値であってもよいし、数式によって算出されたものであってもよく、本実施例は限定しない。本実施例では、第1オフセットをQPdeltaと記す。ここで、第1符号化解像度、第2符号化解像度、及び第1オフセットの間には、以下の関係がある。第1符号化解像度の量子化パラメータから第1オフセットを減算することにより、第2符号化解像度の量子化パラメータが取得され、つまり、第2符号化解像度の量子化パラメータに第1オフセットを加算することにより、第1符号化解像度の量子化パラメータが取得される。
第2オフセットは、IフレームとPフレームとの量子化パラメータのオフセットであり、経験値であってもよいし、数式によって算出されたものであってもよく、本実施例は限定しない。本実施例では、第2オフセットをQPoffset−I/Pと記す。
平均値、第1オフセット、及び第2オフセットを取得した後、この3つの和を1番目の符号化ブロックの量子化パラメータとする。
2)、i−1番目のビデオフレームがIフレームであり、かつ第1符号化解像度でi−1番目のビデオフレームを符号化した場合、i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、第2オフセットを取得し、平均値及び第2オフセットの和を1番目の符号化ブロックの量子化パラメータとして決定する。
ここで、平均値の計算及び第2オフセットの取得の流れについては、上述したとおりであり、ここでは説明を省略する。
平均値及び第2オフセットを取得した後、この両者の和を1番目の符号化ブロックの量子化パラメータとする。
3)、i−1番目のビデオフレームがPフレームであり、かつ第1符号化解像度でi−1番目のビデオフレームを符号化した場合、i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、平均値を1番目の符号化ブロックの量子化パラメータとして決定する。
ここで、平均値の計算の流れについては、上述したとおりであり、ここでは説明を省略する。
平均値を取得した後、平均値を1番目の符号化ブロックの量子化パラメータとする。
4)、i−1番目のビデオフレームがPフレームであり、かつ第2符号化解像度でi−1番目のビデオフレームを符号化した場合、i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、第1オフセットを取得し、平均値及び第1オフセットの和を1番目の符号化ブロックの量子化パラメータとして決定する。
ここで、平均値の計算と第1オフセットの取得の流れについては、上述したとおりであり、ここでは説明を省略する。
平均値及び第1オフセットを取得した後、この両者の和を1番目の符号化ブロックの量子化パラメータとする。
本実施例では、i−1番目のビデオフレームの種類及び符号化解像度に基づいて、上記4つの方式の中から1つの方式を選択し、選択された方法によって、i番目のビデオフレームにおける1番目の符号化ブロックの量子化パラメータを計算してもよい。
ステップ404で、i番目のビデオフレームがIフレームであると仮定する場合の第1符号化コストを計算する。
本実施例では、i番目のビデオフレームが実際にIフレームであるかPフレームであるかにかかわらず、i番目のビデオフレームがIフレームであると仮定して第1符号化コストを計算し、i番目のビデオフレームがPフレームであると仮定して第2符号化コストを計算する必要がある。
ここで、i番目のビデオフレームがIフレームであると仮定する場合の第1符号化コストを計算することは、以下のいくつかのステップを含んでもよい。
ステップ4041で、i番目のビデオフレームを少なくとも2つの符号化ブロックに分割する。
ここで、端末は、異なるアルゴリズムによって、i番目のビデオフレームを複数の符号化ブロックに分割してもよく、本実施例は限定しない。ここで、異なるアルゴリズムによって取得された符号化ブロックの数は、同じであってもよいし、異なっていてもよい。
1つの可能な実現方式では、端末は、i番目のビデオフレームを8×8個の符号化ブロックに分割する。
ステップ4042で、符号化ブロックに対してフレーム内予測符号化を行うことにより、フレーム内符号化コストを取得する。
ここで、フレーム内符号化コストのアルゴリズムには、様々なものがあり、以下、そのうちの2つのアルゴリズムについて紹介する。
1つ目のアルゴリズムでは、フレーム内符号化コストは、符号化ブロックにおける全ての画素の予測残差の絶対値の和に等しい。
2つ目のアルゴリズムでは、フレーム内符号化コストcost=D+λ×Rであり、ここで、Dは、符号化ブロックの歪みの程度であり、該符号化ブロックにおける全ての画素の符号化再構成画像と元の画像との差の絶対値で表すことができ、λは、ラグランジュ係数であり、Rは、符号化ブロックが使用するビット数である。
ステップ4043で、各フレーム内符号化コストの和を第1符号化コストとして決定する。
本実施例では、第1符号化コストをIcostと記する。
任意選択的に、i番目のビデオフレームを少なくとも2つの符号化ブロックに分割する前に、該方法は、i番目のビデオフレームをダウンサンプリングすることをさらに含む。
ここで、端末は、簡単なダウンサンプリングアルゴリズムでi番目のビデオフレームをダウンサンプリングしてもよい。これにより、i番目のビデオフレームのデータ量を低減させ、後続に第1符号化コスト及び第2符号化コストを計算する速度を向上させ、最終的に符号化解像度を決定する速度を向上させる。
1つの可能な実現形態では、端末は、i番目のビデオフレームの長さ及び幅に対して2:1のダウンサンプリングを行う。当然のことながら、端末は、他の割合のダウンサンプリングを行ってもよく、本実施例は限定しない。
ステップ405で、i番目のビデオフレームがPフレームであると仮定する場合の第2符号化コストを計算する。
ここで、i番目のビデオフレームがPフレームであると仮定する場合の第2符号化コストを計算することは、以下のいくつかのステップを含んでもよい。
ステップ4051で、i番目のビデオフレームを少なくとも2つの符号化ブロックに分割する。
ここで、端末は、異なるアルゴリズムによって、i番目のビデオフレームを複数の符号化ブロックに分割してもよく、本実施例は限定しない。ここで、異なるアルゴリズムによって取得された符号化ブロックの数は、同じであってもよいし、異なっていてもよい。
説明すべきものとして、本ステップにおける符号化ブロックを分割するアルゴリズムは、ステップ4041における符号化ブロックを分割するアルゴリズムと同じである。これにより、本ステップで取得された各符号化ブロックは、ステップ4041で取得された各符号化ブロックと同じである。
一つの可能な実現方式では、端末は、同様にi番目のビデオフレームを8×8個の符号化ブロックに分割する。
任意選択的に、端末は、まずステップ4041を実行した場合、ステップ4041の実行結果を直接読み出すことにより、少なくとも2つの符号化ブロックを取得してもよい。これにより、符号化ブロックを繰り返して分割することで消費される時間を回避し、符号化効率を向上させる。
ステップ4052で、符号化ブロックに対してフレーム間予測符号化を行うことにより、フレーム間符号化コストを取得する。
ここで、フレーム間符号化コストとフレーム内符号化コストとのアルゴリズムは同じであり、ここでは説明を省略する。
ステップ4053で、各フレーム間符号化コストの和を第2符号化コストとして決定する。
本実施例では、第2符号化コストをPcostと記する。
説明すべきものとして、本実施例は、ステップ404及びステップ405の実行順序を限定しない。つまり、端末は、まず第1符号化コストを計算してから、第2符号化コストを計算してもよいし、まず第2符号化コストを計算してから、第1符号化コストを計算してもよいし、第1符号化コスト及び第2符号化コストを同時に計算してもよい。
ステップ406で、第1符号化コストを第2符号化コストで除算することにより、符号化コスト比を取得する。
本実施例では、符号化コスト比をIPcostと記すると、IPcost=Icost/Pcostである。
図5を参照されたいが、図5は、符号化コスト比の計算過程を示している。図5において、端末は、まずi番目のビデオフレームをダウンサンプリングしてから、Iフレーム符号化コスト(即ち、i番目のビデオフレームがIフレームであると仮定する場合に算出された第1符号化コスト)及びPフレーム符号化コスト(即ち、i番目のビデオフレームがPフレームであると仮定する場合に算出された第2符号化コスト)を計算し、Iフレーム符号化コストをPフレーム符号化コストで除算することにより、符号化コスト比を取得する。
ステップ407で、符号化コスト比に基づいて、量子化パラメータ閾値を決定する。
本実施例では、端末は、符号化コスト比を数式に入力して量子化パラメータ閾値を計算してもよいし、又は、符号化コスト比と量子化パラメータ閾値との対応関係を設定し、符号化コスト比に基づいて、該対応関係から量子化パラメータ閾値を検索してもよく、本実施例は限定しない。ここで、量子化パラメータ閾値をQPTHと記する。
ここで、いずれの方式で量子化パラメータ閾値を決定しても、符号化コスト比は、量子化パラメータ閾値と正の相関関係にある。これは、ダウンサンプリングそのものがビデオ情報の一部を損失させるが、人間の目が、静止シーンの画質の損失に敏感であり、動いているシーンの画質の損失に敏感でないからである。このため、端末は、第1符号化解像度で符号化を行って画質を向上させることに傾くように、静止シーンでのビデオフレームに対して、大きな量子化パラメータ閾値を設定し、第2符号化解像度で符号化を行ってデータの圧縮比を向上させることに傾くように、動いているシーンでのビデオフレームに対して、小さな量子化パラメータ閾値を設定してもよい。
一般的に、符号化コスト比が小さいほど、現在のシーンの動きが激しくなることを表し、第2符号化解像度で符号化を行うことに傾くように、小さな量子化パラメータ閾値を設定する必要がある。逆に、符号化コスト比が大きいほど、現在のシーンが静止になることを表し、第1符号化解像度で符号化を行うことに傾くように、大きな量子化パラメータ閾値を設定する必要がある。
説明すべきものとして、量子化パラメータ閾値は、符号化解像度に対応するものであり、つまり、異なる符号化解像度は、異なる量子化パラメータ閾値に対応する。一般的に、第1符号化解像度に対応する量子化パラメータ閾値から、第2符号化解像度に対応する量子化パラメータ閾値を減算した差は、第1オフセットに等しい。
ステップ408で、量子化パラメータが量子化パラメータ閾値以下である場合、i番目のビデオフレームの符号化解像度が第1符号化解像度であると決定し、量子化パラメータが量子化パラメータ閾値よりも大きい場合、i番目のビデオフレームの符号化解像度が第2符号化解像度であると決定する。
本実施例では、量子化パラメータが、符号化解像度に対応するものであり、量子化パラメータ閾値も、符号化解像度に対応するものであるため、量子化パラメータと量子化パラメータ閾値とを比較する前に、量子化パラメータ及び量子化パラメータ閾値が、同じ符号化解像度に対応することを保証する必要がある。
本実施例では、2つの実現方式が提供されている。1つ目の実現方式では、1つの閾値集合を設定し、かつ該閾値集合を1つの符号化解像度に対応付け、量子化パラメータを取得した後、閾値集合に対応する符号化解像度に応じて、該量子化パラメータを変換し、変換された最終的な量子化パラメータと該閾値集合とに基づいて、量子化パラメータ閾値を決定する。2つ目の実現方式では、2つの閾値集合を設定し、かつ2つの閾値集合を異なる符号化解像度に対応付け、量子化パラメータを取得した後、まず、該量子化パラメータに対応する符号化解像度を決定してから、該符号解像度に基づいて、2つの閾値集合の中から1つの閾値集合を選択し、量子化パラメータ及び検索された閾値集合に基づいて、量子化パラメータ閾値を決定する。ここで、閾値集合は、少なくとも2つの量子化パラメータ閾値を含む集合であり、かつ、閾値集合には、量子化パラメータ閾値と符号化コスト比との第1対応関係が定義される。例えば、
Figure 2021516919
で示される閾値集合は、それぞれ33及び36である2つの量子化パラメータ閾値を含み、33は、3よりも小さい符号化コスト比に対応し、36は、3以上の符号化コスト比に対応する。
以下、この2つの実現方式を紹介する。
1つ目の実現方式について
1)1つの閾値集合が存在し、かつ該閾値集合が第1符号化解像度に対応する場合、量子化パラメータ及び量子化パラメータ閾値に基づいて、i番目のビデオフレームの符号化解像度を決定する前に、該方法は、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定した場合、該量子化パラメータを最終的な量子化パラメータとして決定するステップと、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定した場合、該量子化パラメータに第1オフセットを加算することにより、最終的な量子化パラメータを取得するステップと、をさらに含む。
例えば、存在する1つの閾値集合は、第1符号化解像度に対応する。量子化パラメータQPの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定した場合、該QPを最終的な量子化パラメータとして、ステップ409を実行する。量子化パラメータQPの計算時に、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定した場合、該QP+QPdeltaを最終的な量子化パラメータとして、ステップ409を実行する。
2)1つの閾値集合が存在し、かつ該閾値集合が第2符号化解像度に対応する場合、量子化パラメータ及び量子化パラメータ閾値に基づいて、i番目のビデオフレームの符号化解像度を決定する前に、該方法は、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定した場合、該量子化パラメータから第1オフセットを減算することにより、最終的な量子化パラメータを取得するステップと、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定した場合、該量子化パラメータを最終的な量子化パラメータとして決定するステップと、をさらに含む。
例えば、存在する1つの閾値集合が第2符号化解像度に対応する。量子化パラメータQPの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定した場合、該QP−QPdeltaを最終的な量子化パラメータとして、ステップ409を実行する。量子化パラメータQPの計算時に、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定した場合、該QPを最終的な量子化パラメータとして、ステップ409を実行する。
2つ目の実現方式について
1)2つの閾値集合が存在し、かつ、2つの閾値集合が、異なる符号化解像度に対応する場合、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定したのであれば、符号化コスト比、2つの閾値集合、及び第1符号化解像度に基づいて、量子化パラメータ閾値を決定する。ここで、符号化コスト比、2つの閾値集合、及び第1符号化解像度に基づいて、量子化パラメータ閾値を決定することは、2つの閾値集合の中から、第1符号化解像度に対応する閾値集合を検索するステップと、符号化コスト比に基づいて、検索された該閾値集合から、量子化パラメータ閾値を検索するステップと、を含む。
本実施例では、2つの閾値集合と、異なる符号化解像度との第2対応関係が予め設定されるため、符号化コスト比、2つの閾値集合、及び第1符号化解像度に基づいて、量子化パラメータ閾値を決定する際に、端末は、まず、第2対応関係に基づいて、2つの閾値集合の中から、第1符号化解像度に対応する1つの閾値集合を検索してから、該閾値集合に定義された量子化パラメータ閾値と符号化コスト比との第1対応関係に基づいて、該符号化コスト比に対応する1つの量子化パラメータ閾値を検索する。
例えば、第2対応関係において、第1符号化解像度に対応する閾値集合は
Figure 2021516919
であり、第2符号化解像度に対応する閾値集合は
Figure 2021516919
である。量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定した場合、選択された閾値集合は
Figure 2021516919
である。このときの符号化コスト比が3よりも小さい場合、取得された量子化パラメータ閾値は33であり、このときの符号化コスト比が3以上である場合、取得された量子化パラメータ閾値は36である。
2)2つの閾値集合が存在し、かつ、2つの閾値集合が、異なる符号化解像度に対応する場合、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定したのであれば、符号化コスト比、2つの閾値集合、及び第2符号化解像度に基づいて、量子化パラメータ閾値を決定する。ここで、符号化コスト比値、2つの閾値集合、及び第2符号化解像度に基づいて、量子化パラメータ閾値を決定することは、2つの閾値集合の中から、第2符号化解像度に対応する閾値集合を検索するステップと、符号化コスト比に基づいて、検索された該閾値集合から、量子化パラメータ閾値を検索するステップと、を含む。
本実施例では、2つの閾値集合と、異なる符号化解像度との第2対応関係が予め設定されるたm、符号化コスト比、2つの閾値集合、及び第2符号化解像度に基づいて、量子化パラメータ閾値を決定する際に、端末は、まず、第2対応関係に基づいて、2つの閾値集合の中から、第2符号化解像度に対応する1つの閾値集合を検索してから、該閾値集合に定義された量子化パラメータ閾値と符号化コスト比との第1対応関係に基づいて、該符号化コスト比に対応する1つの量子化パラメータ閾値を検索する。
例えば、第2対応関係において、第1符号化解像度に対応する閾値集合は
Figure 2021516919
であり、第2符号化解像度に対応する閾値集合は
Figure 2021516919
である。量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定した場合、選択された閾値集合は
Figure 2021516919
である。このときの符号化コスト比が3よりも小さい場合、取得された量子化パラメータ閾値は27であり、このときの符号化コスト比が3以上である場合、取得された量子化パラメータ閾値は30である。
ステップ409で、該符号化解像度でi番目のビデオフレームを符号化する。
第1符号化解像度でi番目のビデオフレームを符号化する場合、画質が良く、データの圧縮比が低い。第2符号化解像度でi番目のビデオフレームを符号化する場合、画質が悪く、データの圧縮比が高い。
本実施例では、H.264、H.265、オーディオビデオ符号化標準(AVS:Audio Video coding Standard)などのビデオ圧縮標準を用いて、上記決定された符号化解像度に基づいて、ビデオフレームを符号化してもよい。
以上説明したように、本願の実施例で提供されたビデオ符号化方法は、ビデオフレームの量子化パラメータ及び量子化パラメータ閾値をそれぞれ計算し、量子化パラメータ及び量子化パラメータ閾値に基づいて、ビデオフレームの符号化解像度を決定することにより、同じ種類のビデオフレームは、同じ符号化解像度に対応する可能性もあるし、異なる符号化解像度に対応する可能性もあるようになり、同じ種類のビデオフレームが同じ符号化解像度に対応することで、符号化方式の柔軟性が不十分になるという問題が解決され、符号化方式の柔軟性が向上する。
量子化パラメータが、画質に関連するものであり、量子化パラメータ閾値が、所望の画質に関連するものであるため、量子化パラメータ及び量子化パラメータ閾値に基づいて、ビデオフレームの符号化解像度を決定することは、画質及び所望の画質に基づいて、ビデオフレームの符号化解像度を選択することに相当する。所望の画質が高い場合、高い第1符号化解像度でビデオフレームを符号化することにより、画質を向上させる。所望の画質が低い場合、低い第2符号化解像度でビデオフレームを符号化することにより、データの圧縮比を向上させる。
まず、ビデオフレームをダウンサンプリングしてから、ビデオフレームの符号化コスト比を計算することにより、ビデオフレームのデータ量を低減させ、後続に第1符号化コスト及び第2符号化コストを計算する速度を向上させ、最終的に符号化解像度を決定する速度を向上させることができる。
図6を参照されたいが、図6は、本願の一実施例で提供されたビデオ符号化装置の構成ブロック図である。該ビデオ符号化装置は、図2に示す第1端末又は第2端末に適用可能である。該ビデオ符号化装置は、下記のモジュールを含む。
取得モジュール610は、符号化対象のビデオを取得し、ビデオには、順に並んだ少なくとも2つのビデオフレームが含まれる。ここで、該取得モジュール610の実現の詳細は、ステップ301又はステップ401の説明を参照されたい。
計算モジュール620は、少なくとも2つのビデオフレームのうちのi(iは、2以上の正の整数)番目のビデオフレームに対して、i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値を計算する。ここで、該計算モジュール620におけるi番目のビデオフレームの量子化パラメータの計算の実現の詳細は、ステップ302又はステップ402〜403の説明を参照されたいが、該計算モジュールにおけるi番目のビデオフレームの量子化パラメータ閾値の計算の実現の詳細は、ステップ302又はステップ404〜407の説明を参照されたい。
決定モジュール630は、計算モジュール620により取得された量子化パラメータ及び量子化パラメータ閾値に基づいて、i番目のビデオフレームの符号化解像度を決定し、符号化解像度が、第1符号化解像度又は第2符号化解像度であり、第1符号化解像度が、i番目のビデオフレームのサンプリング時の解像度であり、第2符号化解像度が、i番目のビデオフレームをダウンサンプリングする場合の解像度である。ここで、該決定モジュール630の実現の詳細は、ステップ303又はステップ408の説明を参照されたい。
符号化モジュール640は、決定モジュール630により決定された符号化解像度でi番目のビデオフレームを符号化する。ここで、該符号化モジュール640の実現の詳細は、ステップ304又はステップ409での説明を参照されたい。
任意選択的に、計算モジュール620は、さらに、
i番目のビデオフレームの符号化モードが固定品質符号化モードである場合、設定された量子化パラメータを読み出し、量子化パラメータをi番目のビデオフレームの量子化パラメータとして決定し(その実現の詳細は、ステップ402の説明を参照)、
i番目のビデオフレームの符号化モードが固定ビットレート符号化モードである場合、i番目のビデオフレームにおける1番目の符号化ブロックの量子化パラメータを計算し、1番目の符号化ブロックの量子化パラメータをi番目のビデオフレームの量子化パラメータとして決定する(その実現の詳細は、ステップ403の説明を参照)。
任意選択的に、計算モジュール620は、さらに、
i−1番目のビデオフレームがIフレームであり、かつ第2符号化解像度でi−1番目のビデオフレームを符号化した場合、i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、第1オフセット及び第2オフセットを取得し、平均値、第1オフセット、及び第2オフセットの和を1番目の符号化ブロックの量子化パラメータとして決定し、及び/又は、
i−1番目のビデオフレームがIフレームであり、かつ第1符号化解像度でi−1番目のビデオフレームを符号化した場合、i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、第2オフセットを取得し、平均値及び第2オフセットの和を1番目の符号化ブロックの量子化パラメータとして決定し、及び/又は、
i−1番目のビデオフレームがPフレームであり、かつ第1符号化解像度でi−1番目のビデオフレームを符号化した場合、i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、平均値を1番目の符号化ブロックの量子化パラメータとして決定し、及び/又は、
i−1番目のビデオフレームがPフレームであり、かつ第2符号化解像度でi−1番目のビデオフレームを符号化した場合、i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、第1オフセットを取得し、平均値及び第1オフセットの和を1番目の符号化ブロックの量子化パラメータとして決定する。
ここで、第1オフセットは、第1符号化解像度に対応する量子化パラメータと、第2符号化解像度に対応する量子化パラメータとのオフセットであり、第2オフセットは、IフレームとPフレームとの量子化パラメータのオフセットである。
説明すべきものとして、i番目のビデオフレームにおける1番目の符号化ブロックの量子化パラメータを計算する上記4つの実現方式での実現の詳細は、ステップ403の説明を参照されたい。
任意選択的に、計算モジュール620は、さらに、
i番目のビデオフレームがIフレームであると仮定する場合の第1符号化コストを計算し、
i番目のビデオフレームがPフレームであると仮定する場合の第2符号化コストを計算し、
第1符号化コストを第2符号化コストで除算することにより、符号化コスト比を取得し、
符号化コスト比に基づいて、量子化パラメータ閾値を決定し、符号化コスト比と量子化パラメータ閾値とが正の相関関係にある。
説明すべきものとして、上述したi番目のビデオフレームの量子化パラメータ閾値の計算の実現の詳細は、ステップ404〜407の説明を参照されたい。
任意選択的に、計算モジュール620は、さらに、
i番目のビデオフレームを少なくとも2つの符号化ブロックに分割し、
符号化ブロックに対してフレーム内予測符号化を行うことにより、フレーム内符号化コストを取得し、
各フレーム内符号化コストの和を第1符号化コストとして決定する。
説明すべきものとして、上述した第1符号化コストの計算の実現の詳細は、ステップ404の説明を参照されたい。
任意選択的に、計算モジュール620は、さらに、
i番目のビデオフレームを少なくとも2つの符号化ブロックに分割し、
符号化ブロックに対してフレーム間予測符号化を行うことにより、フレーム間符号化コストを取得し、
各フレーム間符号化コストの和を第2符号化コストとして決定する。
説明すべきものとして、上述した第2符号化コストの計算の実現の詳細は、ステップ405の説明を参照されたい。
任意選択的に、計算モジュール620は、さらに、i番目のビデオフレームを少なくとも2つの符号化ブロックに分割する前に、i番目のビデオフレームをダウンサンプリングする。
説明すべきものとして、上述したi番目のビデオフレームのダウンサンプリングの実現の詳細は、ステップ4043の説明を参照されたい。
任意選択的に、2つの閾値集合が存在し、かつ、2つの閾値集合が、異なる符号化解像度に対応する場合、計算モジュール620は、さらに、
量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定した場合、符号化コスト比、2つの閾値集合、及び第1符号化解像度に基づいて、量子化パラメータ閾値を決定し、
量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定した場合、符号化コスト比、2つの閾値集合、及び第2符号化解像度に基づいて量子化パラメータ閾値を決定する。
説明すべきものとして、上述した量子化パラメータ閾値の計算の実現の詳細は、ステップ408における2つ目の実現方式の説明を参照されたい。
任意選択的に、計算モジュール620は、さらに、
2つの閾値集合の中から、第1符号化解像度に対応する閾値集合を検索し、
符号化コスト比に基づいて、検索された該閾値集合から、量子化パラメータ閾値を検索する。
説明すべきものとして、上述した量子化パラメータ閾値の計算の実現の詳細は、ステップ408における2つ目の実現方式の1)の説明を参照されたい。
任意選択的に、計算モジュール620は、さらに、
2つの閾値集合の中から、第2符号化解像度に対応する閾値集合を検索し、
符号化コスト比に基づいて、検索された該閾値集合から、量子化パラメータ閾値を検索する。
説明すべきものとして、上述した量子化パラメータ閾値の計算の実現の詳細は、ステップ408における2つ目の実現方式の2)の説明を参照されたい。
任意選択的に、決定モジュール630は、さらに、
量子化パラメータが量子化パラメータ閾値以下である場合、i番目のビデオフレームの符号化解像度が第1符号化解像度であると決定し、
量子化パラメータが量子化パラメータ閾値よりも大きい場合、i番目のビデオフレームの符号化解像度が第2符号化解像度であると決定する。
説明すべきものとして、上述した符号化解像度の決定の実現の詳細は、ステップ408の説明を参照されたい。
任意選択的に、1つの閾値集合が存在し、かつ閾値集合が第1符号化解像度に対応する場合、決定モジュール630は、さらに、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定した場合、量子化パラメータを最終的な量子化パラメータとして決定し、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定した場合、量子化パラメータに第1オフセットを加算することにより、最終的な量子化パラメータを取得する。
説明すべきものとして、上述した最終的な量子化パラメータの決定の実現の詳細は、ステップ408における1つ目の実現方式の1)の説明を参照されたい。
任意選択的に、1つの閾値集合が存在し、かつ閾値集合が第2符号化解像度に対応する場合、決定モジュール630は、さらに、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定した場合、量子化パラメータから第1オフセットを減算することにより、最終的な量子化パラメータを取得し、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定した場合、量子化パラメータを最終的な量子化パラメータとして決定する。
説明すべきものとして、上述した最終的な量子化パラメータの決定の実現の詳細は、ステップ408における1つ目の実現方式の2)の説明を参照されたい。
以上説明したように、本願の実施例で提供されたビデオ符号化装置は、ビデオフレームの量子化パラメータ及び量子化パラメータ閾値をそれぞれ計算し、量子化パラメータ及び量子化パラメータ閾値に基づいて、ビデオフレームの符号化解像度を決定することにより、同じ種類のビデオフレームは、同じ符号化解像度に対応する可能性もあるし、異なる符号化解像度に対応する可能性もあるようになり、同じ種類のビデオフレームが同じ符号化解像度に対応することで、符号化方式の柔軟性が不十分になるという問題が解決され、符号化方式の柔軟性が向上する。
量子化パラメータが、画質に関連するものであり、量子化パラメータ閾値が、所望の画質に関連するものであるため、量子化パラメータ及び量子化パラメータ閾値に基づいて、ビデオフレームの符号化解像度を決定することは、画質及び所望の画質に基づいて、ビデオフレームの符号化解像度を選択することに相当する。所望の画質が高い場合、高い第1符号化解像度でビデオフレームを符号化することにより、画質を向上させる。所望の画質が低い場合、低い第2符号化解像度でビデオフレームを符号化することにより、データの圧縮比を向上させる。
まず、ビデオフレームをダウンサンプリングしてから、ビデオフレームの符号化コスト比を計算することにより、ビデオフレームのデータ量を低減させ、後続に第1符号化コスト及び第2符号化コストを計算する速度を向上させ、最終的に符号化解像度を決定する速度を向上させることができる。
図7は、本願の例示的な一実施例で提供された端末700の構成ブロック図である。該端末700は、例えば、スマートフォン、タブレットコンピュータ、ムービング・ピクチャー・エクスパーツ・グループ・オーディオレイヤー3(MP3:Moving Picture Experts Group Audio Layer III)プレーヤー、ムービング・ピクチャー・エクスパーツ・グループ・オーディオレイヤー4(MP4:Moving Picture Experts Group Audio Layer IV)プレーヤー、ノートパソコン、又はデスクトップパソコンのような携帯移動端末であってもよい。端末700は、ユーザ機器、携帯端末、ラップトップ型端末、デスクトップ型端末などの他の名称と称される可能性もある。
一般的に、端末700は、プロセッサ701とメモリ702とを備える。
プロセッサ701は、1つ又は複数の処理コアを含んでもよく、例えば、4コアプロセッサ、8コアプロセッサなどである。プロセッサ701は、デジタル信号処理(DSP:Digital Signal Processing)、フィールドプログラマブルゲートアレイ(FPGA:Field−Programmable Gate Array)、プログラマブルロジックアレイ(PLA:Programmable Logic Array)のうちの少なくとも1つのハードウェアの形で実現されてもよい。プロセッサ701は、メインプロセッサとコプロセッサとを含んでもよい。メインプロセッサは、ウェイク状態でのデータを処理するためのプロセッサであり、中央処理装置(CPU:Central Processing Unit)とも呼ばれる。コプロセッサは、スタンバイ状態でのデータを処理するための低消費電力プロセッサである。いくつかの実施例では、プロセッサ701には、グラフィック処理ユニット(GPU:Graphics Processing Unit)が組み込まれてもよい。GPUは、ディスプレイに表示しようとするコンテンツのレンダリング及び描画を担当する。いくつかの実施例では、プロセッサ701は、機械学習に関する演算操作を処理するための人工知能(AI:Artificial Intelligence)プロセッサを含んでもよい。
メモリ702は、1つ又は複数のコンピュータ可読記憶媒体を含んでもよい。該コンピュータ可読記憶媒体は、非一時的であってもよい。メモリ702は、高速ランダムアクセスメモリ、及び不揮発性メモリ、例えば、1つ又は複数のディスク記憶デバイス、フラッシュメモリ記憶デバイスなどを含んでもよい。いくつかの実施例では、メモリ702内の非一時的なコンピュータ可読記憶媒体は、少なくとも1つの命令を記憶する。該少なくとも1つの命令は、プロセッサ701によって実行されることで、本願の方法の実施例で提供されたビデオ符号化方法を実現させる。
いくつかの実施例では、端末700は、任意選択的に、周辺機器インタフェース703及び少なくとも1つの周辺機器をさらに含む。プロセッサ701、メモリ702、及び周辺機器インタフェース703の間には、バス又は信号線を介して接続されてもよい。各周辺機器は、バス、信号線、又は回路基板を介して、周辺機器インタフェース703に接続されてもよい。具体的には、周辺機器は、無線周波数回路704、ディスプレイ705、カメラコンポーネント706、オーディオ回路707、測位コンポーネント708、及び電源709のうちの少なくとも1つを含む。
周辺機器インタフェース703は、入力/出力(I/O:Input/Output)に関する少なくとも1つの周辺機器をプロセッサ701とメモリ702とに接続するために用いられてもよい。いくつかの実施例では、プロセッサ701、メモリ702、及び周辺機器インタフェース703は、同一のチップ又は回路基板上に集積される。いくつかの他の実施例では、プロセッサ701、メモリ702、及び周辺機器インタフェース703のいずれか1つ又は2つが、個別のチップ又は回路基板上で実現されてもよく、本実施例はこれを限定しない。
無線周波数回路704は、電磁信号とも呼ばれる無線周波数(RF:Radio Frequency)信号を送受信する。無線周波数回路704は、電磁信号により通信ネットワーク及び他の通信機器と通信を行う。無線周波数回路704は、電気信号を電磁信号に変換して送信したり、受信された電磁信号を電気信号に変換したりする。任意選択的に、無線周波数回路704は、アンテナシステム、RFトランシーバ、1つ又は複数の増幅器、チューナー、発振器、デジタル信号プロセッサ、コーデックチップセット、ユーザ識別モジュールカードなどを含む。無線周波数回路704は、少なくとも1つの無線通信プロトコルにより他の端末と通信することができる。該無線通信プロトコルは、メトロポリタンエリアネットワーク、各世代移動通信ネットワーク(2G、3G、4G、及び5G)、無線ローカルエリアネットワーク、及び/又はワイヤレスフィデリティ(WiFi:Wireless Fidelity)ネットワークを含むが、これらに限定されない。いくつかの実施例では、無線周波数回路704は、近距離無線通信(NFC:Near Field Communication)に関する回路を含んでもよく、本願はこれを限定しない。
ディスプレイ705は、ユーザ画面(UI:User Interface)を表示する。該UIは、図形、テキスト、アイコン、ビデオ、及びこれらの任意の組み合わせを含んでもよい。ディスプレイ705がタッチディスプレイである場合、ディスプレイ705は、ディスプレイ705の表面又は表面の上方のタッチ信号を収集する能力も有する。該タッチ信号は、制御信号としてプロセッサ701に入力されて処理されてもよい。この場合、ディスプレイ705は、ソフトボタン及び/又はソフトキーボードとも呼ばれる仮想ボタン及び/又は仮想キーボードを提供するために用いられてもよい。いくつかの実施例では、ディスプレイ705は、1つであってもよく、端末700のフロントパネルに設けられてもよい。別のいくつかの実施例では、ディスプレイ705は、少なくとも2つであってもよく、それぞれ端末700の異なる表面に設けられたり、折り畳まれるように設計されたりしてもよい。他のいくつかの実施例では、ディスプレイ705は、端末700の湾曲面又は折り畳み面に設けられるフレキシブルなディスプレイであってもよい。ひいては、ディスプレイ705は、非矩形の不規則な図形、即ち異形ディスプレイに設けられてもよい。ディスプレイ705は、液晶ディスプレイ(LCD:Liquid Crystal Display)、有機発光ダイオード(OLED:Organic Light−Emitting Diode)などの材質を用いて製造されてもよい。
カメラコンポーネント706は、画像又はビデオを収集する。任意選択的に、カメラコンポーネント706は、フロントカメラとリアカメラとを含む。一般的に、フロントカメラは、端末のフロントパネルに設けられ、リアカメラは、端末の背面に設けられる。いくつかの実施例で、リアカメラは、少なくとも2つあり、それぞれメインカメラ、デプスカメラ、広角カメラ、望遠カメラのうちの任意の1種類である。これにより、メインカメラ及びデプスカメラを組み合わせて実現される背景ボケの機能、メインカメラ及び広角カメラを組み合わせて実現されるパノラマ撮影及び仮想現実(VR:Virtual Reality)撮影の機能、又はその他の組み合わせ撮影の機能を実現する。いくつかの実施例では、カメラコンポーネント706は、フラッシュをさらに含んでもよい。フラッシュは、単一色温度フラッシュであってもよいし、二重色温度フラッシュであってもよい。二重色温度フラッシュは、暖色系のフラッシュと寒色系のフラッシュとの組み合わせを指し、異なる色温度での光の補償に用いることができる。
オーディオ回路707は、マイクロホン及びスピーカーを含んでもよい。マイクロホンは、ユーザ及び環境の音波を収集し、音波を電気信号に変換し、電気信号を、処理のためにプロセッサ701に入力するか、又は、音声通信を実現するために無線周波数回路704に入力する。マイクロホンは、ステレオ収集又はノイズ低減のために、複数であってもよく、端末700の異なる部位にそれぞれ設けられてもよい。マイクロホンは、アレイマイクロホン又は全指向性マイクロホンであってもよい。スピーカーは、プロセッサ701又は無線周波数回路704からの電気信号を音波に変換する。スピーカーは、従来のフィルムスピーカーであってもよいし、圧電セラミックスピーカーであってもよい。スピーカーが圧電セラミックスピーカーである場合に、電気信号を人間に聞こえる音波に変換できるだけでなく、距離測定などの用途のために、電気信号を人間に聞こえない音波に変換できる。いくつかの実施例では、オーディオ回路707は、イヤホンジャックをさらに含んでもよい。
測位コンポーネント708は、ナビゲーション又は位置情報サービス(LBS:Location Based Service)を実現するために、端末700の現在の地理的位置を測位する。測位コンポーネント708は、米国の全地球測位システム(GPS:Global Positioning System)、中国の北斗システム、ロシアのグロナスシステム、又は欧州連合のガリレオシステムに基づく測位コンポーネントであってもよい。
電源709は、端末700内の各コンポーネントに電力を供給する。電源709は、交流電力、直流電力、一次電池、又は充電式電池であってもよい。電源709に充電式電池が含まれる場合、該充電式電池は、有線充電又は無線充電をサポートしてもよい。該充電式電池は、迅速充電技術をサポートするために用いられてもよい。
いくつかの実施例では、端末700は、1つ又は複数のセンサ710をさらに含む。該1つ又は複数のセンサ710は、加速度センサ711、ジャイロセンサ712、圧力センサ713、指紋センサ714、光学センサ715、及び近接センサ716を含むが、これらに限定されない。
加速度センサ711は、端末700で確立された座標系の3つの座標軸上の加速度の大きさを検出することができる。例えば、加速度センサ711は、重力加速度の3つの座標軸の成分を検出するために用いられてもよい。プロセッサ701は、加速度センサ711で収集された重力加速度信号に基づいて、タッチディスプレイ705が横方向のビュー又は縦方向のビューでユーザ画面の表示を行うように制御してもよい。加速度センサ711は、ゲーム又はユーザの運動データの収集に用いられてもよい。
ジャイロセンサ712は、端末700の機体の方向及び回転角度を検出することができる。ジャイロセンサ712は、、加速度センサ711と協働して、端末700に対するユーザの3D動作を収集することができる。プロセッサ701は、ジャイロセンサ712で収集されたデータに基づいて、動作感知(例えば、ユーザの傾き操作に応じてUIを変更する)、撮影時の画像安定化、ゲーム制御、及び慣性航法の機能を実現することができる。
圧力センサ713は、端末700のサイドフレーム及び/又はタッチディスプレイ705の下に設けられてもよい。圧力センサ713は、端末700のサイドフレームに設けられる場合、端末700に対するユーザの把持信号を検出することができる。プロセッサ701は、圧力センサ713で収集された把持信号に基づいて、左右手の識別又はショートカット操作を行う。圧力センサ713がタッチディスプレイ705の下に設けられる場合、プロセッサ701は、タッチディスプレイ705に対するユーザの圧力操作に基づいて、UI上の操作可能なコントロールユニットへの制御を実現する。操作可能なコントロールユニットは、ボタンコントロールユニット、スクロールバーコントロールユニット、アイコンコントロールユニット、メニューコントロールユニットのうちの少なくとも1種類を含む。
指紋センサ714は、ユーザの指紋を収集する。プロセッサ701が、指紋センサ714で収集された指紋に基づいて、ユーザのアイデンティティを識別し、又は、指紋センサ714が、収集された指紋に基づいて、ユーザのアイデンティティを識別する。ユーザのアイデンティティが、信頼できるアイデンティティであると識別された場合、プロセッサ701は、該ユーザが関連の敏感な操作を実行することを許可する。該敏感な操作は、画面のロック解除、暗号化情報の閲覧、ソフトウェアのダウンロード、支払い、及び設定変更などを含む。指紋センサ714は、端末700の正面、背面、又は側面に設けられてもよい。端末700に物理キー又はメーカーLogoが設けられる場合、指紋センサ714は、物理キー又はメーカーLogoと一体化されてもよい。
光学センサ715は、環境光の強度を収集する。一実施例では、プロセッサ701は、光学センサ715で収集された環境光の強度に応じて、タッチディスプレイ705の表示輝度を制御してもよい。具体的には、環境光の強度が高い場合に、タッチディスプレイ705の表示輝度を高くし、環境光の強度が低い場合に、タッチディスプレイ705の表示輝度を低くする。他の実施例では、プロセッサ701は、光学センサ715で収集された環境光の強度に応じて、カメラコンポーネント706の撮影パラメータを動的に調整してもよい。
近接センサ716は、距離センサとも呼ばれ、通常、端末700のフロントパネルに設けられる。近接センサ716は、ユーザと端末700の正面との距離を収集する。一実施例では、近接センサ716が、ユーザと端末700の正面との距離が徐々に小さくなることを検出すると、プロセッサ701は、タッチディスプレイ705を点灯状態から消灯状態に切り替えるように制御する。近接センサ716が、ユーザと端末700の正面との距離が徐々に大きくなることを検出すると、プロセッサ701は、タッチディスプレイ705を消灯状態から点灯状態に切り替えるように制御する。
当業者であれば理解できるように、図7に示す構成が、端末700を限定するものではなく、端末700は、図示より多く又は少ないコンポーネントを含んでもよく、或いはいくらかのコンポーネントを組み合わせたものであってもよく、或いはコンポーネントの異なる配置を採用してもよい。
本願の一実施例では、コンピュータ可読記憶媒体が提供されている。前記記憶媒体には、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶され、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、前記プロセッサによりロードされて実行されることで、上記のようなビデオ符号化方法を実現させる。
本願の一実施例では、ビデオ符号化機器が提供されている。前記ビデオ符号化機器は、プロセッサと、メモリとを備え、前記メモリには、少なくとも1つの命令が記憶され、前記命令は、前記プロセッサによりロードされて実行されることで、上記のようなビデオ符号化方法を実現させる。
ここで、ビデオ符号化機器が端末のような電子機器である場合、該ビデオ符号化機器の構成の詳しくは、図7に示す実施例における端末700の構成の説明を参照されたい。
説明すべきものとして、上記実施例で提供されたビデオ符号化装置は、ビデオ符号化を行う際に、上記の各機能モジュールの分割のみを例として説明されているが、実際の適用では、必要に応じて、上記の機能を異なる機能モジュールに割り当てて完了し、即ち、ビデオ符号化装置の内部構成を異なる機能モジュールに分割して、以上に説明した全部又は一部の機能を完了してもよい。また、上記実施例で提供されたビデオ符号化装置は、ビデオ符号化方法の実施例と同一の構想に属し、その具体的な実現過程の詳しくは、方法の実施例を参照されたいが、ここでは説明を省略する。
当業者であれば理解できるように、上記の実施例を実現する全部又は一部のステップは、ハードウェアによって実行されてもよいし、プログラムによって関連のハードウェアに指示することにより実行されてもよい。前記プログラムは、コンピュータ可読記憶媒体に記憶されてもよく、上記の記憶媒体は、読み出し専用メモリ、磁気ディスク、又は光ディスクなどであってもよい。
以上の説明は、本願の実施例を限定するものではなく、本願の実施例の精神及び原則内で行われるいかなる修正、均等置換え、改善などは全て本願の実施例の保護範囲内に含まれるべきである。
210 第1端末
220 第2端末
230 サーバ
610 取得モジュール
620 計算モジュール
630 決定モジュール
640 符号化モジュール
700 端末
701 プロセッサ
702 メモリ
703 周辺機器インタフェース
704 無線周波数回路
705 ディスプレイ
706 カメラコンポーネント
707 オーディオ回路
708 測位コンポーネント
709 電源
710 センサ
711 加速度センサ
712 ジャイロセンサ
713 圧力センサ
714 指紋センサ
715 光学センサ
716 近接センサ
例えば、存在する1つの閾値集合は、第1符号化解像度に対応する。量子化パラメータQPの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定した場合、該QPを最終的な量子化パラメータとして、ステップ408を実行する。量子化パラメータQPの計算時に、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定した場合、該QP+QPdeltaを最終的な量子化パラメータとして、ステップ408を実行する。
例えば、存在する1つの閾値集合が第2符号化解像度に対応する。量子化パラメータQPの計算時に、i番目のビデオフレームの符号化解像度が第1符号化解像度であると仮定した場合、該QP−QPdeltaを最終的な量子化パラメータとして、ステップ408を実行する。量子化パラメータQPの計算時に、i番目のビデオフレームの符号化解像度が第2符号化解像度であると仮定した場合、該QPを最終的な量子化パラメータとして、ステップ408を実行する。
2)2つの閾値集合が存在し、かつ、2つの閾値集合が、異なる符号化解像度に対応する場合、量子化パラメータの計算時に、i番目のビデオフレームの符号化解像度が第符号化解像度であると仮定したのであれば、符号化コスト比、2つの閾値集合、及び第2符号化解像度に基づいて、量子化パラメータ閾値を決定する。ここで、符号化コスト比値、2つの閾値集合、及び第2符号化解像度に基づいて、量子化パラメータ閾値を決定することは、2つの閾値集合の中から、第2符号化解像度に対応する閾値集合を検索するステップと、符号化コスト比に基づいて、検索された該閾値集合から、量子化パラメータ閾値を検索するステップと、を含む。
本実施例では、2つの閾値集合と、異なる符号化解像度との第2対応関係が予め設定されるた、符号化コスト比、2つの閾値集合、及び第2符号化解像度に基づいて、量子化パラメータ閾値を決定する際に、端末は、まず、第2対応関係に基づいて、2つの閾値集合の中から、第2符号化解像度に対応する1つの閾値集合を検索してから、該閾値集合に定義された量子化パラメータ閾値と符号化コスト比との第1対応関係に基づいて、該符号化コスト比に対応する1つの量子化パラメータ閾値を検索する。
ステップ409で、ステップ408で決定された符号化解像度でi番目のビデオフレームを符号化する。

Claims (16)

  1. 端末が実行するビデオ符号化方法であって、
    符号化対象のビデオを取得するステップであって、前記ビデオには、順に並んだ少なくとも2つのビデオフレームが含まれる、ステップと、
    前記少なくとも2つのビデオフレームのうちのi(iは、2以上の正の整数)番目のビデオフレームに対して、前記i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値を計算するステップと、
    前記i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値に基づいて、前記i番目のビデオフレームの符号化解像度を決定するステップであって、前記符号化解像度が、第1符号化解像度又は第2符号化解像度であり、前記第1符号化解像度が、前記i番目のビデオフレームのサンプリング時の解像度であり、前記第2符号化解像度が、前記i番目のビデオフレームをダウンサンプリングする場合の解像度である、ステップと、
    前記符号化解像度で前記i番目のビデオフレームを符号化するステップと、
    を含むことを特徴とする方法。
  2. 前記i番目のビデオフレームの量子化パラメータを計算することは、
    前記i番目のビデオフレームの符号化モードが固定品質符号化モードである場合、設定された量子化パラメータを読み出し、前記設定された量子化パラメータを前記i番目のビデオフレームの量子化パラメータとして決定するステップと、
    前記i番目のビデオフレームの符号化モードが固定ビットレート符号化モードである場合、前記i番目のビデオフレームにおける1番目の符号化ブロックの量子化パラメータを計算し、前記1番目の符号化ブロックの量子化パラメータを前記i番目のビデオフレームの量子化パラメータとして決定するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  3. 前記i番目のビデオフレームにおける1番目の符号化ブロックの量子化パラメータを計算することは、
    i−1番目のビデオフレームがIフレームであり、かつ前記第2符号化解像度で前記i−1番目のビデオフレームを符号化した場合、前記i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、第1オフセット及び第2オフセットを取得し、前記平均値、前記第1オフセット、及び前記第2オフセットの和を前記1番目の符号化ブロックの量子化パラメータとして決定するステップ、及び/又は、
    i−1番目のビデオフレームがIフレームであり、かつ前記第1符号化解像度で前記i−1番目のビデオフレームを符号化した場合、前記i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、第2オフセットを取得し、前記平均値及び前記第2オフセットの和を前記1番目の符号化ブロックの量子化パラメータとして決定するステップ、及び/又は、
    i−1番目のビデオフレームがPフレームであり、かつ前記第1符号化解像度で前記i−1番目のビデオフレームを符号化した場合、前記i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、前記平均値を前記1番目の符号化ブロックの量子化パラメータとして決定するステップ、及び/又は、
    i−1番目のビデオフレームがPフレームであり、かつ前記第2符号化解像度で前記i−1番目のビデオフレームを符号化した場合、前記i−1番目のビデオフレームにおける全ての符号化ブロックの実際の量子化パラメータの平均値を計算し、第1オフセットを取得し、前記平均値及び前記第1オフセットの和を前記1番目の符号化ブロックの量子化パラメータとして決定するステップ、を含み、
    前記第1オフセットは、前記第1符号化解像度に対応する量子化パラメータと、前記第2符号化解像度に対応する量子化パラメータとのオフセットであり、前記第2オフセットは、IフレームとPフレームとの量子化パラメータのオフセットである、
    ことを特徴とする請求項2に記載の方法。
  4. 前記i番目のビデオフレームの量子化パラメータ閾値を計算することは、
    前記i番目のビデオフレームがIフレームであると仮定する場合の第1符号化コストを計算するステップと、
    前記i番目のビデオフレームがPフレームであると仮定する場合の第2符号化コストを計算するステップと、
    前記第1符号化コストを前記第2符号化コストで除算することにより、符号化コスト比を取得するステップと、
    前記符号化コスト比に基づいて、前記量子化パラメータ閾値を決定するステップであって、前記符号化コスト比と前記量子化パラメータ閾値とが正の相関関係にある、ステップと、
    を含むことを特徴とする請求項1に記載の方法。
  5. 前記i番目のビデオフレームがIフレームであると仮定する場合の第1符号化コストを計算する前記ステップは、
    前記i番目のビデオフレームを少なくとも2つの符号化ブロックに分割するステップと、
    前記符号化ブロックに対してフレーム内予測符号化を行うことにより、フレーム内符号化コストを取得するステップと、
    各フレーム内符号化コストの和を前記第1符号化コストとして決定するステップと、
    を含むことを特徴とする請求項4に記載の方法。
  6. 前記i番目のビデオフレームがPフレームであると仮定する場合の第2符号化コストを計算する前記ステップは、
    前記i番目のビデオフレームを少なくとも2つの符号化ブロックに分割するステップと、
    前記符号化ブロックに対してフレーム間予測符号化を行うことにより、フレーム間符号化コストを取得するステップと、
    各フレーム間符号化コストの和を前記第2符号化コストとして決定するステップと、
    を含むことを特徴とする請求項4に記載の方法。
  7. 2つの閾値集合が存在し、かつ、前記2つの閾値集合が、異なる符号化解像度に対応する場合、前記符号化コスト比に基づいて、前記量子化パラメータ閾値を決定する前記ステップは、
    前記i番目のビデオフレームの量子化パラメータの計算時に、前記i番目のビデオフレームの符号化解像度が前記第1符号化解像度であると仮定した場合、前記符号化コスト比、前記2つの閾値集合、及び前記第1符号化解像度に基づいて、前記量子化パラメータ閾値を決定するステップと、
    前記i番目のビデオフレームの量子化パラメータの計算時に、前記i番目のビデオフレームの符号化解像度が前記第2符号化解像度であると仮定した場合、前記符号化コスト比、前記2つの閾値集合、及び前記第2符号化解像度に基づいて、前記量子化パラメータ閾値を決定するステップと、
    を含むことを特徴とする請求項4に記載の方法。
  8. 前記符号化コスト比、前記2つの閾値集合、及び前記第1符号化解像度に基づいて、前記量子化パラメータ閾値を決定する前記ステップは、
    前記2つの閾値集合の中から、前記第1符号化解像度に対応する1つの閾値集合を検索するステップと、
    前記符号化コスト比に基づいて、検索された前記閾値集合から、前記量子化パラメータ閾値を検索するステップと、
    を含むことを特徴とする請求項7に記載の方法。
  9. 前記符号化コスト比、前記2つの閾値集合、及び前記第2符号化解像度に基づいて、前記量子化パラメータ閾値を決定する前記ステップは、
    前記2つの閾値集合の中から、前記第2符号化解像度に対応する1つの閾値集合を検索するステップと、
    前記符号化コスト比に基づいて、検索された前記閾値集合から、前記量子化パラメータ閾値を検索するステップと、
    を含むことを特徴とする請求項7に記載の方法。
  10. 前記i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値に基づいて、前記i番目のビデオフレームの符号化解像度を決定する前記ステップは、
    前記i番目のビデオフレームの量子化パラメータが前記量子化パラメータ閾値以下である場合、前記i番目のビデオフレームの符号化解像度が前記第1符号化解像度であると決定するステップと、
    前記i番目のビデオフレームの量子化パラメータが前記量子化パラメータ閾値よりも大きい場合、前記i番目のビデオフレームの符号化解像度が前記第2符号化解像度であると決定するステップと、
    を含むことを特徴とする請求項1乃至9のいずれか1項に記載の方法。。
  11. 1つの閾値集合が存在し、かつ前記閾値集合が前記第1符号化解像度に対応する場合、前記i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値に基づいて、前記i番目のビデオフレームの符号化解像度を決定する前記ステップの前に、
    前記i番目のビデオフレームの量子化パラメータの計算時に、前記i番目のビデオフレームの符号化解像度が前記第1符号化解像度であると仮定した場合、前記i番目のビデオフレームの量子化パラメータを最終的な量子化パラメータとして決定するステップと、
    前記i番目のビデオフレームの量子化パラメータの計算時に、前記i番目のビデオフレームの符号化解像度が前記第2符号化解像度であると仮定した場合、前記i番目のビデオフレームの量子化パラメータに前記第1オフセットを加算することにより、最終的な量子化パラメータを取得するステップと、
    をさらに含むことを特徴とする請求項10に記載の方法。
  12. 1つの閾値集合が存在し、かつ前記閾値集合が前記第2符号化解像度に対応する場合、前記i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値に基づいて、前記i番目のビデオフレームの符号化解像度を決定する前記ステップの前に、
    前記i番目のビデオフレームの量子化パラメータの計算時に、前記i番目のビデオフレームの符号化解像度が前記第1符号化解像度であると仮定した場合、前記i番目のビデオフレームの量子化パラメータから前記第1オフセットを減算することにより、最終的な量子化パラメータを取得するステップと、
    前記i番目のビデオフレームの量子化パラメータの計算時に、前記i番目のビデオフレームの符号化解像度が前記第2符号化解像度であると仮定した場合、前記i番目のビデオフレームの量子化パラメータを最終的な量子化パラメータとして決定するステップと、
    を含むことを特徴とする請求項10に記載の方法。
  13. ビデオ符号化装置であって、
    符号化対象のビデオを取得し、前記ビデオには、順に並んだ少なくとも2つのビデオフレームが含まれる取得モジュールと、
    前記少なくとも2つのビデオフレームのうちのi(iは、2以上の正の整数)番目のビデオフレームに対して、前記i番目のビデオフレームの量子化パラメータ及び量子化パラメータ閾値を計算する計算モジュールと、
    前記計算モジュールにより取得された前記量子化パラメータ及び前記量子化パラメータ閾値に基づいて、前記i番目のビデオフレームの符号化解像度を決定し、前記符号化解像度が、第1符号化解像度又は第2符号化解像度であり、前記第1符号化解像度が、前記i番目のビデオフレームのサンプリング時の解像度であり、前記第2符号化解像度が、前記i番目のビデオフレームをダウンサンプリングする場合の解像度である決定モジュールと、
    前記決定モジュールにより決定された前記符号化解像度で前記i番目のビデオフレームを符号化する符号化モジュールと、
    を含むことを特徴とする装置。
  14. コンピュータ可読記憶媒体であって、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶され、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、プロセッサによりロードされて実行されることで、請求項1〜12のいずれか1項に記載のビデオ符号化方法を実現させることを特徴とする記憶媒体。
  15. ビデオ符号化機器であって、プロセッサと、メモリとを備え、前記メモリには、前記少なくとも1つの命令が記憶され、前記命令は、前記プロセッサによりロードされて実行されることで、請求項1〜12のいずれか1項に記載のビデオ符号化方法を実現させることを特徴とする機器。
  16. 請求項1〜12のいずれか1項に記載のビデオ符号化方法を、端末に実行させるコンピュータプログラム。
JP2020551298A 2018-04-27 2019-03-18 ビデオ符号化方法並びにその装置、記憶媒体、機器、及びコンピュータプログラム Active JP7085014B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810394329.9A CN108391127B (zh) 2018-04-27 2018-04-27 视频编码方法、装置、存储介质及设备
CN201810394329.9 2018-04-27
PCT/CN2019/078432 WO2019205831A1 (zh) 2018-04-27 2019-03-18 视频编码方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
JP2021516919A true JP2021516919A (ja) 2021-07-08
JP7085014B2 JP7085014B2 (ja) 2022-06-15

Family

ID=63065777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020551298A Active JP7085014B2 (ja) 2018-04-27 2019-03-18 ビデオ符号化方法並びにその装置、記憶媒体、機器、及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US11388403B2 (ja)
EP (1) EP3787291B1 (ja)
JP (1) JP7085014B2 (ja)
CN (1) CN108391127B (ja)
WO (1) WO2019205831A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108391127B (zh) 2018-04-27 2021-08-10 腾讯科技(深圳)有限公司 视频编码方法、装置、存储介质及设备
JP6941744B2 (ja) * 2018-09-26 2021-09-29 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム
CN110636293B (zh) * 2019-09-27 2024-03-15 腾讯科技(深圳)有限公司 视频编码、解码方法和装置、存储介质及电子装置
CN110677692B (zh) * 2019-09-27 2022-12-06 腾讯科技(深圳)有限公司 视频解码方法及装置、视频编码方法及装置
CN110582022B (zh) 2019-09-27 2022-12-30 腾讯科技(深圳)有限公司 视频编解码方法和装置及存储介质
CN110536134B (zh) * 2019-09-27 2022-11-04 腾讯科技(深圳)有限公司 视频编码、解码方法和装置、存储介质及电子装置
CN111787322B (zh) * 2020-08-04 2022-05-13 北京百度网讯科技有限公司 视频编码的方法、装置、电子设备及计算机可读存储介质
CN113573142B (zh) * 2021-09-22 2021-12-24 北京海誉动想科技股份有限公司 分辨率调整方法与装置
CN115225928B (zh) * 2022-05-11 2023-07-25 北京广播电视台 一种多类型音视频混播***及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003032677A (ja) * 2001-07-18 2003-01-31 Hitachi Ltd 動画像圧縮符号化装置
JP2007520157A (ja) * 2004-01-29 2007-07-19 インターナショナル・ビジネス・マシーンズ・コーポレーション ビデオ符号化のための動的な解像度変更のためのシステムおよび方法
JP2011223315A (ja) * 2010-04-09 2011-11-04 Mitsubishi Electric Corp 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
WO2017127213A1 (en) * 2016-01-19 2017-07-27 Google Inc. Real-time video encoder rate control using dynamic resolution switching
CN107155107A (zh) * 2017-03-21 2017-09-12 腾讯科技(深圳)有限公司 视频编码方法和装置、视频解码方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8175147B1 (en) * 2005-08-08 2012-05-08 Texas Instruments Incorporated Video coding rate control
US7773672B2 (en) * 2006-05-30 2010-08-10 Freescale Semiconductor, Inc. Scalable rate control system for a video encoder
CN102450014B (zh) * 2009-03-31 2017-07-14 茨特里克斯***公司 用于质量感知视频优化的方法和视频优化器
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US8379718B2 (en) * 2009-09-02 2013-02-19 Sony Computer Entertainment Inc. Parallel digital picture encoding
CN102625104B (zh) * 2012-03-26 2014-04-16 浙江大学 一种视频编码方法
WO2014193630A1 (en) * 2013-05-30 2014-12-04 Intel Corporation Quantization offset and cost factor modification for video encoding
EP3145201A1 (en) * 2015-09-17 2017-03-22 Harmonic Inc. Video processing with dynamic resolution changes
KR101811721B1 (ko) * 2016-12-12 2018-01-25 삼성전자주식회사 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
CN108391127B (zh) * 2018-04-27 2021-08-10 腾讯科技(深圳)有限公司 视频编码方法、装置、存储介质及设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003032677A (ja) * 2001-07-18 2003-01-31 Hitachi Ltd 動画像圧縮符号化装置
JP2007520157A (ja) * 2004-01-29 2007-07-19 インターナショナル・ビジネス・マシーンズ・コーポレーション ビデオ符号化のための動的な解像度変更のためのシステムおよび方法
JP2011223315A (ja) * 2010-04-09 2011-11-04 Mitsubishi Electric Corp 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
WO2017127213A1 (en) * 2016-01-19 2017-07-27 Google Inc. Real-time video encoder rate control using dynamic resolution switching
CN107155107A (zh) * 2017-03-21 2017-09-12 腾讯科技(深圳)有限公司 视频编码方法和装置、视频解码方法和装置

Also Published As

Publication number Publication date
EP3787291B1 (en) 2024-03-06
US11388403B2 (en) 2022-07-12
WO2019205831A1 (zh) 2019-10-31
CN108391127A (zh) 2018-08-10
JP7085014B2 (ja) 2022-06-15
US20200382781A1 (en) 2020-12-03
EP3787291A4 (en) 2021-06-23
EP3787291A1 (en) 2021-03-03
CN108391127B (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
JP7085014B2 (ja) ビデオ符号化方法並びにその装置、記憶媒体、機器、及びコンピュータプログラム
JP7026260B2 (ja) ビデオ符号化方法、ビデオ符号化装置およびコンピュータプログラム
CN110881136B (zh) 视频帧率控制方法、装置、计算机设备及存储介质
JP2023126583A (ja) 予測モードの復号化の方法、符号化の方法、復号化の装置、符号化の装置および記憶媒体
CN112532975B (zh) 视频编码方法、装置、计算机设备及存储介质
CN110996117B (zh) 视频转码方法、装置、电子设备和存储介质
CN109168032B (zh) 视频数据的处理方法、终端、服务器及存储介质
CN110049326B (zh) 视频编码方法及装置、存储介质
CN113891074B (zh) 视频编码方法和装置、电子装置和计算机可读存储介质
CN111586413A (zh) 视频调整方法、装置、计算机设备及存储介质
CN110572679B (zh) 帧内预测的编码方法、装置、设备及可读存储介质
CN109714628B (zh) 播放音视频的方法、装置、设备、存储介质及***
CN116074512A (zh) 视频编码方法、装置、电子设备以及存储介质
CN111698262B (zh) 带宽确定方法、装置、终端及存储介质
CN111770339B (zh) 视频编码方法、装置、设备及存储介质
CN110177275B (zh) 视频编码方法及装置、存储介质
CN109040753B (zh) 预测模式选择方法、装置及存储介质
CN114422782B (zh) 视频编码方法、装置、存储介质及电子设备
CN113038124B (zh) 视频编码方法、装置、存储介质及电子设备
CN115474037B (zh) 视频的质量检测方法、装置、电子设备及可读存储介质
CN113079372B (zh) 帧间预测的编码方法、装置、设备及可读存储介质
CN117676170A (zh) 块效应检测的方法、装置、设备和存储介质
CN113938689A (zh) 量化参数确定方法和装置
CN115811615A (zh) 屏幕视频的编码方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200923

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220603

R150 Certificate of patent or registration of utility model

Ref document number: 7085014

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150