JP2022017234A - 符号化ビットストリームにおける動きベクトルの提示 - Google Patents

符号化ビットストリームにおける動きベクトルの提示 Download PDF

Info

Publication number
JP2022017234A
JP2022017234A JP2021158778A JP2021158778A JP2022017234A JP 2022017234 A JP2022017234 A JP 2022017234A JP 2021158778 A JP2021158778 A JP 2021158778A JP 2021158778 A JP2021158778 A JP 2021158778A JP 2022017234 A JP2022017234 A JP 2022017234A
Authority
JP
Japan
Prior art keywords
accuracy
bitstream syntax
frame
region
header
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021158778A
Other languages
English (en)
Inventor
シルキン,セルゲイ
Silkin Sergey
サブリン,セルゲイ
Sablin Sergey
ジョウ,ヨウ
You Zhou
リン,チー-ロン
Chih-Lung Lin
リー,ミン-チェ
Ming-Chieh Lee
ジェイ. サリヴァン,ゲイリー
j sullivan Gary
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of JP2022017234A publication Critical patent/JP2022017234A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/55Motion estimation with spatial constraints, e.g. at image or region borders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】符号化ビットストリームにおける動きベクトルの提示を提供する。【解決手段】動画データを符号化する際に使用するためのフォーマットは:少なくとも1つの領域が動き推定を使用して符号化されている複数のフレームを含む、一連のフレームと;これらのフレームのそれぞれ各1つについて、又はこれらのフレームの各フレーム内の1つ以上の領域のそれぞれ各1つについて、動き推定の動きベクトルを表す動きベクトル値のそれぞれのセットと;それぞれのフレーム又は領域のそれぞれの動きベクトル値が第1の解像度で符号化されているか又は第2の解像度で符号化されているかを示す、それぞれのフレーム又は領域の各々に関連付けられる少なくとも1つのそれぞれのインジケータと;を備える。【選択図】図7

Description

最近の通信システムでは、ビデオ信号は、有線及び/又は無線ネットワークのような媒体を介して、しばしばインターネットのようなパケットベースのネットワークを介してある端末から別の端末へ送信され得る。例えばビデオは、デスクトップやラップトップコンピュータ、タブレット又はスマートフォンのようなユーザ端末において実行されるVoIP(ボイスオーバーインターネットプロトコル)クライアントアプリケーションから実施されるVoIP呼の一部であり得る。
典型的に、ビデオのフレームは、ネットワーク上での転送のためにこれらのフレームを圧縮するよう、送信端末にあるエンコーダによって符号化される。所与のフレームの符号化は、イントラフレーム符号化を備えることがあり、イントラフレーム符号化により、ブロックが同じフレーム内の他のブロックとの相対で符号化される。この場合、ターゲットブロックは、そのブロックと近傍ブロックとの間の差(残差)に関して符号化される。あるいは、一部のフレームについての符号化は、インターフレーム符号化を備えることがあり、インターフレーム符号化により、ターゲットフレーム内のブロックが、典型的には動き予測に基づいて、先行フレームの対応する部分との相対で符号化される。この場合、ターゲットブロックは、そのブロックと予測が行われる対応する部分との間のオフセット、及び、そのブロックと予測が行われる対応する部分との間の差(残差)を識別する動きベクトルに関して符号化される。レシーバにおける対応するデコーダは、デコーダ側のスクリーンへの出力のためフレームを圧縮解除するよう、受け取ったビデオ信号のフレームを適切なタイプの予測に基づいて復号する。
ビデオを符号化(圧縮)するとき、動きベクトルを使用して、現在のフレームのインターフレーム予測を生成する。エンコーダは最初に、現在のブロック(ターゲットブロック)に最も良く合致する以前の符号化フレーム内で類似ブロック(参照ブロック(reference block))を探し、参照ブロックとターゲットブロックとの間の変位を、符号化ビットストリームの一部としてデコーダへ信号伝達する。変位は典型的に、水平及び垂直のx及びy座標として表され、動きベクトルと呼ばれる。
参照「ブロック」は、実際には、参照フレーム内の実際のブロック位置にあることに制約されない。すなわち、参照ブロックは、ターゲットブロックと同じグリッドに制限されず、むしろ、動きベクトルによる、ターゲットブロックの位置に対する参照フレームのオフセットの対応するサイズの部分(correspondingly-sized portion)である。現在の規格によると、動きベクトルは、分数のピクセル解像度(fractional pixel resolution)で表される。例えばH.264規格では、各動きベクトルは、1/4ピクセル解像度で表される。したがって、例として現在のフレーム内の16×16ブロックを、ターゲットブロックの位置の1ピクセル左にある以前のフレーム内の16×16フレームから予測する場合、動きベクトルは(4,0)である。あるいは、ターゲットブロックを、例えばターゲットブロックの左にわずか3/4ピクセルにある参照ブロックから予測する場合、動きベクトルは(3,0)である。分数のピクセル位置にある参照ブロックは、実際にはそれ自体は存在していないが、参照フレームのピクセル間の補完によって生成される。サブピクセルの動きベクトルは、圧縮効果に関してかなりのパフォーマンスを達成することができる。
しかしながら、分数のピクセル解像度を使用することは、動きベクトルを符号化するために、動きベクトルを整数のピクセル解像度で推定した場合よりも多くのビットを伴い、また、最も良く合致する参照を探す際にもより多くの処理リソースを伴う。例えばビデオ符号化では、例えば縮小されたサイズのより良く合致する残差は、一般に、動きベクトルの符号化に生じるビットよりも重要である可能性があり、あるいは達成される品質は、そのリソースを正当化すると考えることができるので、これは価値のあることであり得る。しかしながら、符号化される必ずしもすべての動画像がビデオ(すなわちカメラからキャプチャされる)とは限らない。本明細書では、カメラではなく画面からキャプチャされる動画像を符号化(圧縮)するとき、符号化ビットストリーム内の動きベクトルの大部分は概して整数ピクセルを指すが、これらの動きベクトルのうちのほんの一部が分数のピクセル部分で見つかる傾向があることを認識している。したがって、エンコーダは通常、1/4ピクセルの単位でビットストリーム内の動きベクトルを表すが、画面共有又は記録アプリケーションでは、実際には、1ピクセル単位のみで動きベクトルを符号化することによって、必要以上の品質損失を伴わずに、帯域幅を確保することができる。
それでもなお、分数の動きベクトルが(カメラによってキャプチャされる)通常のビデオ、恐らくは他の動画像(例えばアニメーション)にとって依然として有益である可能性があることを考えると、動きベクトルは柔軟な方法で信号伝達され得る:ビデオソースが、キャプチャされた画面からのものであるとき、動きベクトルは1ピクセル単位で信号伝達され得るが、通常のビデオ及び/又は他の動画像については、依然として分数のピクセル単位(fractional pixel unit)を使用してもよい。
より一般的には、例えばどのようにデコーダの設計者が任意の所望のトレードオフ又は効果を実装するよう望むかに依存して、分数又は整数ピクセルの動きベクトルの解像度を使用するかどうかに対する制御を持つのに有益であり得る、様々な環境が存在し得る。例えば恐らくは一部のビデオ又はアニメーションは、その性質の何らかの側面に起因して、動き推定において整数ピクセル解像度によって、より効果的に供給されることになり、一方、他のビデオや他のタイプの動画は、分数ピクセル解像度によって、より効果的に供給されることがある。
したがって、本明細書で開示される一側面によると、動画データを符号化する際に使用するためのフォーマットが提供され、これにより、そのフォーマットに従って符号化される動画データは、下記を備える:
- 少なくとも1つの領域が動き推定を使用して符号化されている複数のフレームを含む、一連のフレームと;
- これらのフレームのそれぞれ各1つについて、又はこれらのフレームの各フレーム内の1つ以上の領域のそれぞれ各1つについて、動き推定の動きベクトルを表す動きベクトル値のそれぞれのセットと;
- それぞれのフレーム又は領域のそれぞれの動きベクトル値が第1の解像度で符号化されているか又は第2の解像度で符号化されているかを示す、それぞれのフレーム又は領域の各々に関連付けられる少なくとも1つのそれぞれのインジケータ。
動きベクトル値は、第1の解像度で符号化される動きベクトル値が、より多くの数のより精細なステップ(finer step)を有するスケールで表され、第2の解像度で符号化されるベクトル値が、より少ない数のより粗いステップ(coarser step)を有するスケールで表されて、符号化ビットストリーム内で平均してより少ないビット数を要する、というプロトコルに従って符号化される。より粗いステップは、整数ピクセル単位を表し、より精細なステップは、分数ピクセル単位を表す。
本明細書で開示される更なる側面によると、上記フォーマット又はプロトコルに従って符号化される動画データのビットストリームを担持するネットワーク要素又はコンピュータ読取可能記録媒体が提供される。
実施形態において、複数のフレーム又は領域のうち第1の解像度で符号化されたフレーム又は領域と、複数のフレーム又は領域のうち第2の解像度で符号化された他のフレーム又は領域とを備えるビットストリームを提供することができ、それぞれのインジケータは、複数の(インターフレーム符号化された)フレーム又は領域の各々について個々に解像度を指示する。
実施形態において、各フレーム又は領域の動きベクトル値の各々は、符号化ビットストリーム内の動きベクトルフィールドに含まれてもよく、上記プロトコルによると、動きベクトルフィールドは、その動きベクトルが第2の解像度で符号化されるフレーム又は領域について、減少されたサイズを有することがある。
本明細書で開示される別の態様によると、符号化形式の動画データを受け取るための入力部と、動き予測モジュールとを備えるデコーダが提供される。動画データは、本明細書で開示される実施形態のいずれに係るフォーマット又はプロトコルに基づいて、少なくとも1つの領域が動き推定を使用して符号化されている複数のフレーム(すなわち、インターフレーム符号化されたフレーム)を含む。動き予測モジュールは、動きベクトル値に基づいて、(インターフレーム符号化された)フレーム又は領域を復号する。これは、インジケータの各々を読み取って、それぞれのフレーム又は領域の動きベクトル値が第1の解像度で符号化されているか、第2の解像度で符号化されているかを判断し、第1の解像度の場合、動きベクトル値を分数ピクセル単位で解釈し、第2の解像度の場合、動きベクトル値を整数ピクセル単位で解釈することを含む。
実施形態においては、動画データは、フレーム又は領域の各々に関連付けられる2つのそれぞれのインジケータを備え、該2つのインジケータは、二次元のそれぞれの動きベクトルの解像度を示し、動き予測モジュールは、両インジケータを読み取り、それに従ってそれぞれの動きベクトル値を解釈するように構成される。
実施形態において、フレームの少なくとも一部の各々は、複数の領域に分割され;動画データは、複数の領域のそれぞれ各1つの領域の動きベクトル値が第1の解像度で符号化されているか、第2の解像度で符号化されているかを個々に示す、複数の領域のそれぞれ各1つの領域に関連付けられる少なくとも1つのそれぞれのインジケータを備え;動き予測モジュールは、インジケータを読み取って、各それぞれの領域の動きベクトル値が第1の解像度で符号化されているか、第2の解像度で符号化されているかを判断し、それに従ってそれぞれの動きベクトル値を分数ピクセル単位又は整数ピクセル単位で解釈するように構成される。実施形態において、領域は、H.26x規格のスライスである。
実施形態において、動画データは、動きベクトル値の解像度が領域ごとに指示されているか又はフレームごとに指示されているかを設定する設定(setting)を更に備え、動き予測モジュールは、設定を読み取って、それに従って動きベクトル値を解釈するように構成される。
実施形態において、動き予測モジュールは、それぞれのインジケータがフレーム又は領域の1つについて存在しない場合、デフォルトとして、それぞれの動きベクトル値を分数ピクセル単位で解釈するように構成される。
また更なる実施形態では、動きベクトルを含む動画データは更に、可逆符号化技術に従って符号化され得る。デコーダは、動き予測モジュールによる復号に先行する、可逆符号化段階の逆を備え得る。
更なる側面によると、コンピュータ読取可能記録媒体上に具現化され、実行されると、本明細書に開示される実施形態のいずれかに係るデコーダの動作を実行されるように構成されるコンピュータプログラム製品が提供される。
この発明の概要は、以下の発明の詳細な説明において更に説明される概念の選択を簡単な形で紹介するために提供される。この発明の概要は、特許請求に係る主題の主要な特徴又は本質的な特徴を特定するようには意図されておらず、特許請求に係る主題の範囲を限定するよう使用されることも意図されていない。特許請求に係る主題は、本明細書で指摘される欠点のいずれか又はすべてを解決する実装にも限定されない。
本開示の理解を助け、実施形態を実施する方法を示すために、例として添付の図面への参照を行う。
ビデオストリームの概略的な表現である。
通信システムの概略的なブロック図である。
符号化ビデオストリームの概略的な表現である。
エンコーダの概略的なブロック図である。
デコーダの概略的なブロック図である。
インターフレーム符号化スキームの概略的な表現である。
別のインターフレーム符号化スキームの概略的な表現である。
図1は、カメラからキャプチャされ、符号化ビットストリームを生成するようビデオエンコーダによって符号化される空間区分(spatial division)に分割される、入力ビデオ信号の概略図を提供する。信号は、時間で複数のフレーム(F)に分割されるビデオ動画を備え、各フレームは、時間内のそれぞれ異なる瞬間(…t-1、t、t+1…)における画像を表す。各フレーム内では、フレームは、各々が複数のピクセルを表す複数の区分へ空間で分けられる。これらの区分は、ブロックとも呼ばれる。特定のスキームでは、フレームは、異なるブロックレベルに分割及びサブ分割される。例えば各フレームはマクロブロック(MB)に分割され、各マクロブロックはブロック(b)に分割され得る。例えば各ブロックは、フレーム内の8×8ピクセルの領域を表し、各マクロブロックは、2×2ブロック(16×16ピクセル)の領域を表す。特定のスキームでは、各フレームを、独立に復号可能なスライス(S)へ分割することもでき、各スライスが複数のマクロブロックを備える。スライスSは、一般に任意の形状を取ってよく、例えば各スライスはマクロブロック内の1つ以上の行とすることができ、あるいは(例えば画像内の関心領域ROIに対応する)マクロブロックのイレギュラーな又は任意に定義される選択である。
「ピクセル」という用語に関して、以下では、この用語は、ピクチャアレイのサンプリンググリッド内のサンプル及びサンプリング位置を示すのに使用される(文献では時々、代わりに、「ピクセル」という用語を使用して、1つの単一の空間的位置に対応する3つの色成分すべてを指し、時々、単一のアレイ内の単一の位置又は単一の整数サンプル値を指すのに使用される)。サンプリンググリッドの解像度は、ルマ・サンプリングアレイとクロマ・サンプリングアレイとの間で異なることが多い。実施形態では、以下は、4:4:4表現に適用され得るが、潜在的には、例えば4:2:2及び4:2:0にも適用され得る。
任意の所与の規格はブロック又はマクロブロックという用語に特有の意味を与えるが、ブロックという用語は、多くの場合、当技術分野ではより一般的に、イントラ予測又はインター予測のような符号化及び復号動作が実行されるレベルにおけるフレームの区分を指すことにも使用され、そうでないことが特に記載されない限り、本明細書で使用されることになるのは、このより一般な意味であることに留意されたい。例えば本明細書で参照されるブロックは、実際には、H.26x規格ではブロック又はマクロブロックと呼ばれる区分である可能性があり、様々な符号化及び復号段階は、渦中の符号化モード、アプリケーション及び/又は規格に適切であるように、任意のそのような区分のレベルで動作することができる。
キャプチャされる入力信号内のブロックは、通常、空間領域で表され、各色空間チャネルは、ブロック内の空間位置に応じて表される。例えばYUV色空間では、ルミナンス(Y)及びクロミナンス(U,V)チャネルの各々を、デカルト座標x及びyの関数として表すことができる:Y(x,y)、U(x,y)及びV(x,y)。あるいはRGB色空間では、赤(R)、緑(G)及び青(B)チャネルの各々を、デカルト座標の関数として表すことができる:R(x,y)、G(x,y)及びB(x,y)。この表現では、色空間の各チャネルがピクセル位置の別個のセットの各々におけるそのチャネルのそれぞれの規模に関して表されるように、各ブロック又は部分は、異なる空間座標、例えばx及びy座標おけるピクセル値のセットによって表される。
しかしながら、量子化に先行して、ブロックを、符号化プロセスの一部として変換領域表現に、典型的には空間周波数領域表現(時々、単に周波数領域とも呼ばれる)に変換することができる。周波数領域では、ブロック内の各色空間チャネルは、二次元のうちの各次元で空間周波数の関数(1/長さの次元)として表される。例えばこれを、それぞれ水平及び垂直方向における波数kx及びkyによって示すことができ、その結果、チャネルを、YUV空間ではY(kx,ky)、U(kx,ky)及びV(kx,ky)として表し、RGB空間ではR(kx,ky)、G(kx,ky)及びB(kx,ky)として表すことができる。したがって、ピクセル位置の別個のセットの各々における規模に関して色空間チャネルを表す代わりに、変換は、ブロックを形成する空間周波数成分の別個のセットの各々に関連付けられる係数に関して、すなわちブロックにわたる空間変動の異なる周波数に対応する空間周波数項(term)の別個のセットの各々の振幅に関して、各色空間チャネルを表す。そのような変換の可能性は、フーリエ変換、離散コサイン変換(DCT)、カルーネン・レーベル変換(KLT)又は他のものを含む。
図2のブロック図は、本開示の技術を用いることができる通信システムの例を提供する。通信システムは、第1の送信端末12と、第2の受信端末22を備える。例えば各端末12、22は、携帯電話又はスマートフォン、タブレット、ラップトップコンピュータ、デスクトップコンピュータ、あるいはテレビジョンセット、セットトップボックス、ステレオシステム等のような他の家庭用機器のうちの1つを備え得る。第1及び第2の端末12、22はそれぞれ通信ネットワーク32に動作可能に結合され、これにより第1の送信端末12は、第2の受信端末22によって受信されることになる信号を送信するように構成される。当然、送信端末12は、受信端末22から信号を受信する能力も有することができ、またその逆もあり得るが、説明の目的で、本明細書では送信については第1の端末12の観点から説明し、受信については第2の端末22の観点から説明する。通信ネットワーク32は、例えばワイドエリアインターネット及び/又はローカルエリアネットワークのようなパケットベースのネットワーク、並びに/あるいは携帯電話ネットワークを備え得る。
第1の端末12は、フラッシュメモリ若しくは他の電子メモリ、磁気ストレージデバイス及び/又は光ストレージデバイスのようなコンピュータ読取可能記録媒体14を備える。第1の端末12は、1つ以上の実行ユニットを有するプロセッサ又はCPUの形の処理装置16、トランスミッタ(Tx)18を有する有線又は無線モデムのようなトランシーバ、ビデオカメラ15及び画面17(すなわち、ディスプレイ又はモニタ)も備える。カメラ15及び画面17の各々は、端末12の残りの部分として同じケーシング内に収納されてもよく、あるいは収納されなくてもよい(さらにトランスミッタ18は内蔵であっても外付けであってもよく、例えば後者の場合にはドングル又は無線ルータを備える)。記録媒体14、ビデオカメラ15、画面17及びトランスミッタ18はそれぞれ、処理装置16に動作可能に結合され、トランスミッタ18は、有線又は無線リンクを介してネットワーク32に動作可能に結合される。同様に、第2の端末22は、電子、磁気及び/又は光ストレージデバイス等のようなコンピュータ読取可能記録媒体24と、1つ以上の実行ユニットを有するCPUの形の処理装置26を備える。第2の端末は、少なくともレシーバ(RX)28を有する有線又は無線モデムのようなトランシーバと、端末22の残りの部分として同じケーシング内に収納されても、収納されなくてもよい画面25を備える。第2の端末の記録媒体24、画面25及びレシーバ28は各々、それぞれの処理装置26に動作可能に結合され、レシーバ28は有線又は無線リンクを介してネットワーク32に動作可能に結合される。
第1の端末12上のストレージ14は、動画データを符号化するために少なくともエンコーダを格納する。エンコーダは、それぞれの処理装置16上で実行されるよう構成される。実行されると、エンコーダは、ビデオカメラ15から「生の」(符号化されていない)入力ビデオストリームを受け取り、このビデオストリームを、より低ビットレートのストリームに圧縮するように符号化するよう動作可能であり、トランスミッタ18及び通信ネットワーク32を介して第2の端末22のレシーバ28へ送信するために符号化ビデオストリームを出力する。第2の端末22上のストレージ24は、自身の処理装置26上で実行されるよう構成されるビデオデコーダを少なくとも格納する。実行されると、デコーダは、レシーバ28から符号化ビデオストリームを受け取り、画面25への出力のためにこの符号化ビットストリームを復号する。
エンコーダ及びデコーダは、画面共有ストリームを含め、他のタイプの動画データを符号化及び復号するようにも動作可能である。画面共有ストリームは、符号化側で画面17からキャプチャされる画像データであり、これにより、1以上の他のリモートのユーザは、符号化側のユーザが画面上で何を見ているかを知ることができ、あるいはその画面のユーザは、1人以上の他のユーザに対して後に再生するために、画面上で起こっていることを記録することができる。送信端末12と受信端末22との間で実施される呼の場合、送信端末12の画面17の動画コンテンツ(moving content)が、受信端末22の画面25上で復号及び表示されるように、ライブ(リアルタイム)で符号化されて送信されることになる。例えばエンコーダ側のユーザは、そのユーザがオペレーティングシステムのデスクトップ又は何らかのアプリケーションをどのように動かしているかを、別のユーザと共有したいことがある。
画面共有ストリームが画面等からキャプチャされると言う場合、これは、そのようにするための任意の特定の機構に限定しないことに留意されたい。例えばデータは、画面17の画面バッファから読み取られる可能性があり、あるいはデータは、画面17における表示のためにオペレーティングシステムから又はアプリケーションから出力される同じグラフィカルデータのインスタンスを受け取ることによって、キャプチャされる可能性がある。
図3は、送信端末12上で動作しているエンコーダから受信端末22上で動作しているデコーダへ送信されるであろう符号化ビットストリーム33の概略的な表現を提供する。ビットストリーム33は、フレーム又はスライスごとに符号化済み画像データ34を備え、符号化済み画像データ34は、任意の関連する動きベクトルとともに、そのフレーム又はスライスのブロックについての符号化サンプルを備える。一適用では、ビットストリームは、送信端末12と受信端末22との間のVoIP呼のような、ライブ(リアルタイム)の呼の一部として伝送され得る(VoIP呼は、ビデオ及び画面共有も含むことができる)。ビットストリーム33は、各フレーム又はスライスに関連付けられるヘッダ情報36も備える。実施形態では、ヘッダ36は、以下でより詳細に説明されるように、少なくとも1つのフラグ37の形で、動きベクトルの解像度を示す少なくとも1つの追加の要素を含むように構成される。
図4は、送信端末12上で実装されるような、エンコーダを示すブロック図である。エンコーダは、離散コサイン変換(DCT)モジュール51、量子化器(Q)53、逆変換モジュール61、逆量子化器63、イントラ予測モジュール41、インター予測モジュール43、スイッチ47、減算段階(-)49及び可逆符号化段階65を備える主符号化モジュール40を備える。エンコーダは更に、インター予測モジュール43に結合される制御モジュール50を備える。これらのモジュール又は段階の各々は、送信端末の記録媒体14上に格納され、その処理装置16における実行のために構成されるコードの一部として実装され得るが、これらの一部又はすべてが全体又は部分的に専用のハードウェア回路内で実装される可能性は除外されない。
減算段階49は、複数のフレーム(F)にわたる複数のブロックを備える入力信号のインスタンスを受け取るように構成される。入力ストリームは、カメラ15から受け取られるか、画面17上に表示されているものからキャプチャされる。イントラ又はインター予測41、43は、別の既に符号化されているブロック又は対応するサイズの参照部分からの予測に基づいて、符号化されるべき現在の(ターゲット)ブロックの予測バージョン(predicted version)を生成する。予測バージョンは、減算段階49の入力に供給され、減算段階49では、空間領域の入力信号(すなわち、実際の信号)から減算されて、ブロックの予測バージョンと、実際の入力信号内に対応するブロックとの間の差を表す残差信号が生成される。
イントラ予測モードでは、イントラ予測41は、同じフレームの別の既に符号化されているブロック、典型的には近傍ブロックからの予測に基づいて、符号化されるべき現在の(ターゲット)ブロックの予測バージョンを生成する。イントラフレーム符号化を実行するときは、フレーム内の画像データの或る部分が、同じフレーム内の別の部分とどのように異なるかについての指標(measure)のみを符号化して送信することがその狙いである。次いで、その部分を(開始する何らかの絶対データ(absolute data)を所与として)デコーダで予測することができ、したがって、その実際のデータ自体ではなく、予測と実際のデータとの間の差を送信すれば良いだけである。差分信号は典型的に、大きさがより小さいので、符号化にかかるビットはより少ない(これは可逆圧縮段階65の動作に起因する-以下を参照されたい)。
インター予測モードでは、インター予測モジュール43は、現在のブロックとは異なるフレームの別の既に符号化されている参照部分からの予測に基づいて、符号化されるべき現在の(ターゲット)ブロックの予測バージョンを生成する。参照部分は、ブロックのサイズを有するが、インター予測モジュール43によって予測される、動きベクトルによる空間領域内のターゲットブロックに対するオフセットである(インター予測は、動き予測又は動き推定と呼ばれることもある)。インター予測モジュール43は、空間領域内において、ターゲットフレーム以外の1つ以上のフレーム内のそれぞれの可能性のある複数の動きベクトルによってオフセットされる複数の候補参照部分を検索し、適切なメトリックに従ってターゲットブロックに対して残差を最小にする候補を選択することによって、所与のターゲットブロックについて最適な参照を選択する。インター予測モジュール43は、スイッチ47により、イントラフレーム予測段階41の代わりにフィードバック経路へ切り替えられ、したがって、イントラフレームを他のフレームのものに対して符号化するために、あるフレームと別のフレームのブロックの間にフィードバックループが作成される。すなわち、残差はここでは、インター予測ブロックと実際の入力ブロックとの間の差を表す。これは典型的に、イントラフレーム符号化よりも、符号化すべきビットはより少ない。
する。
残差信号(予測が入力信号から減算された後の残差ブロックを備える)は、減算段階49から、残差値を周波数領域に変換する変換(DCT)モジュール51(又は他の適切な変換)を通って、変換された値を実質的に離散量子化インデックス(discrete quantization indices)に変換する量子化器53へと出力される。変換モジュール51及び量子化モジュール53によって生成される残差の量子化されて変換されたインデックス、並びに予測モジュール41、43において使用される予測の指示及びインター予測モジュール43によって生成される任意の動きベクトルは、すべて、符号化ビデオストリーム33に含まれるように出力されるが(図3の要素34を参照されたい)、その際に、ゴロムエンコーダ又はエントロピーエンコーダ等の可逆符号化段階65を更に経由し、この可逆符号化段階65において、動きベクトル及び変換及び量子化されたインデックスが、当技術分野で公知の可逆符号化技術を使用して更に圧縮される。
量子化されて変換された信号のインスタンスはまた、逆量子化器63及び逆変換モジュール61を通ってフィードバックされ、以前に符号化されたブロックの逆量子化及び逆変換されたバージョンに基づいて、符号化されている現在のターゲットブロックを予測した方法と同じ方法で、符号化されるべき後続のブロックを予測する際に、選択された予測モジュール41又は43により使用するために、(デコーダにおいて見られるような)ブロックの予測バージョンを生成する。スイッチ47は、現在符号化されているフレーム又はブロックに使用される符号化に適切であるように、逆量子化器63の出力をイントラ予測モジュール41又はインター予測モジュール43のいずれかの入力へ渡すように構成される。
図5は、受信端末22上で実装され得るようなデコーダを例示するブロック図である。デコーダは、可逆符号化の逆95と、逆量子化段階83と、逆DCT変換段階81と、スイッチ70と、イントラ予測段階71及び動き補償段階73を備える。これらのモジュール又は段階の各々は、受信端末の記録媒体24上に格納され、その処理装置26における実行のために構成されるコードの一部として実装され得るが、これらの一部又はすべてが全体又は部分的に専用のハードウェア回路内で実装される可能性は除外されない。
逆量子化器83は、符号化信号33を、エンコーダからレシーバ28及び逆の可逆符号化段階95を介して受け取るように構成される。逆量子化器83は、符号化信号内の量子化インデックスを、(残差ブロックを備える)残差信号の逆量子化(de-quantize)されたサンプルへと変換し、逆量子化されたサンプルを、逆DCTモジュール81に渡し、逆DCTモジュール81では、これらのサンプルを、周波数領域から空間領域へと戻すよう変換する。スイッチ70は次いで、逆量子化された空間領域残差サンプルを、復号されている現在のフレーム又はブロックに使用される予測モードに適切であるように、イントラ予測モジュール71又はインター予測モジュール73に渡し、イントラ予測モジュール71又はインター予測モジュール73はそれぞれ、イントラ又はインター予測を使用してブロックを復号する。どのモードを使用すべきかは、符号化ビットストリーム33内の符号化サンプル34とともに受け取られる任意の動きベクトル及び/又は予測の指示を使用して決定される。この段階から続いて、復号されたブロックが出力され、受信端末22における画面25を通して再生されるようになる。
説明したように、従来の規格に従うコーデックは、四分の一のピクセルの解像度で動き予測を実行し、これは、動きベクトルが四分の一のピクセルステップに関して表されることも意味する。四分の一のピクセル解像度の動き推定の例が図6に示されている。この例では、ターゲットブロックの左上の角にあるピクセルpが、ピクセルa、b、c及びdの間の補完から予測され、ターゲットブロックの他のピクセルも、あるフレームのターゲットブロックと、他のフレーム内の参照部分との間のオフセットに従って、参照フレーム内のピクセルのそれぞれのグループ間の同様の補完に基づいて予測されることになる(これらのブロックは図6では太字の破線で示されている)。しかしながら、以下に説明されるように、この粒度で動き推定を実行することは重要性を有する。
可逆コーダ65及びデコーダ95を参照すると、可逆符号化は、(量子化のように)情報を捨てることによるのではなく、可逆符号化段階65によって符号化されることになるデータ内で、異なる値が生じる可能性がどの程度か又はどの程度頻繁に生じるかに応じて、異なる長さのコードワードを使用して異なる値を表することによって機能する、圧縮形式である。例えばコードワード内で1にぶつかる前の先頭の0の数は、コードワードの長さを示し、したがって、1が最も短いコードワードであり、010、011が次に短く、その後に00100等と続いていくことになる。したがって、最も短いコードワードは、均一のコードワード長を使用した場合に必要とされることになる長さよりもかなり短いが、最も長いものはそれよりも長い。しかし、最も頻繁な値又は最も可能性の高い値を最も短いコードワードに割り当て、最も可能性が低い又は生じる頻度が最も少ない値のみを長いコードワードに割り当てることによって、結果として得られるビットストリーム33は、均一のコードワード長を使用した場合よりも、符号化される値ごとに必要とするビット数は少なく、したがって、いずれかの更なる情報を破棄する必要なしに、圧縮を達成することができる。
可逆符号化段階65に先行するエンコーダ40の多くは、可逆符号化段階65を通過する前に、できるだけ多くの値を可能な限り小さくするように設計される。値がより頻繁に生じると、より小さな値は、より大きな値よりも符号化ビットストリーム33内において低いビットレートを招くことになる。これが、絶対サンプル(absolute sample)とは対照的に残差を符号化する理由である。また、多くのサンプルが変換領域のゼロ又は小さな係数へと変換する傾向があるので、これは変換51の背後にある根拠でもある。
同様の検討を、動きベクトルの符号化に適用することができる。
例えばH.264/MPEG-4 Part10及びH.265/HEVCでは、動きベクトルは、指数ゴロム符号で符号化される。以下の表は、動きベクトル値及び符号化ビットを示す。
値 コードワード 発生するビット数
0 1 1
1 010 3
2 011 3
3 00100 5
4 00111 5
5 0001000 7
・・・
上記の表から、値が大きいほど、より多くのビットが使用されることがわかる。これは、動きベクトルの解像度がより高いほど、より多くのビットが必要とされることを意味する。例えば四分の一のピクセル解像度では、1ピクセルのオフセットは、値4で表さなければならず、符号化ビットストリームの5ビットを必要とする。
(カメラからキャプチャされる)ビデオの符号化では、より精細な解像度が、より低いコストの残差参照の検索においてより良い機会を提供するので、動きベクトルにおけるこの解像度のコストは、価値がある可能性がある。しかしながら、ここでは、画面からキャプチャされる動画について、空間変位の大部分が、フルピクセル変位となる傾向があり、これらのほんの一部が分数ピクセル位置となる傾向があるので、動きベクトルの大部分が、整数のピクセル値を指す傾向があり、分数ピクセル値を指すものは非常に少ないことが観察される。
そのような基準において、1ピクセル解像度の画面からキャプチャされる画像データの動きベクトルを符号化することが望ましいことがある。そのようなコンテンツについて動きベクトルの分数部分(端数部分(fractional parts)に対してビットを費やす必要がないという事実を考慮すると、これは、そのようなコンテンツを符号化する際に必要とされるビットレートを減らすことができることを意味する。
例えばエンコーダは通常、1/4ピクセルのオフセット単位でビットストリーム内の動きベクトルを解釈するが、エンコーダは実際には、しばしば、この解像度を諦めて、代わりに、画像符号化アプリケーションの動きベクトルを整数のピクセルオフセット単位で符号化することによって、ビットレートを節約することが可能である。動きベクトルの精度を4倍減らすことになるが、そのような精度は一般に、画面共有又は記録アプリケーションにとっては価値が低く、また、これはベクトルを符号化するのに必要なビット数を減らす。現在の(ターゲット)ブロックを、そのターゲットブロックの1ピクセル左の参照ブロックから予測するために、動きベクトルは(4,0)の代わりに(1,0)となるであろう。上記のゴロム符号化を使用すると、これは、動きベクトルを符号化するために必要とされるビットが、(00111,1)から(010,1)に変化し、したがってこの場合、2ビットが節約されることを意味する。
さらに、減少した解像度の動きベクトルは、動きベクトルの検索を整数値に制限し、したがって検索によって発生する処理リソースを減らすことによって、エンコーダにおいて実行される動き推定の複雑性も減らすことができる。あるいは、通常の検索を実行して、結果として得られる動きベクトルを丸めて整数値にすることも可能であろう。
図7は、全体のピクセルの解像度のみに制約される動き予測の例を示す。この場合、動きベクトルは、全体のピクセルステップのみに制約される。図6とは対照的に、ピクセルpは、補間なしに単一の全体のピクセルのみから予測される。あるいは、(やはり太い破線で示される)あるフレーム内のターゲットブロックと、他のフレーム内に参照部分との間のオフセットに応じて、ピクセルb、c、d又は別のピクセルから予測された可能性もあるが、制約に起因して、ピクセル間の補完からは予測することはできない。なお、任意の所与のブロックについて、図6の例に図示されるような四分の一ピクセル予測は、最も低い残差を与えた場合、偶然に、補間を伴わない全体的なピクセルオフセットを生成する可能性があることに留意されたい。しかしながら、そのようにすることには制約されず、サイズ調整可能な画像に対して、それがすべてのブロックについて起こることは全くありそうにないことである。
分数の動きベクトル値が、カメラキャプチャされたコンテンツにとってやはり非常に有益な可能性があることを考えると、諸実施形態において、エンコーダ40に、動き予測モジュール43と結合されるコントローラ50を提供する。コントローラ50は、柔軟な方法で動きベクトルの解像度を選択するように構成され、ソースデータが、キャプチャされた画面17からのものであり、分数のピクセル動きが存在しないとき、動きベクトルを、全体のピクセル単位のみで符号化して送信するが、カメラコンテンツのビデオについては、やはり動きベクトルを分数のピクセル精度で符号化して送信する。
これを行うために、コントローラ50は、キャプチャされているコンテンツのタイプが画面コンテンツであるという事実を示す、性能ヒューリスティックを測るように構成され得る。それに応じて、次いで、画面コンテンツ符号化のために分数ピクセル動き補償を無効にする。あるいは、コントローラ50は、符号化のためにエンコーダに供給しているのはどのタイプのデータであるかに関して、アプリケーション又はオペレーションシステムから指示を受け取ることがあり、コントローラ50は、これに基づいてモード間を選択することができる。別のオプションとして、履歴データに基づいてその選択を行うことができる。選択は1フレームごとに行うことができ、あるいは、モードは、フレーム内の異なる領域について個々に、例えば1スライスごとに個々に選択されてもよい。
したがって、フレーム又はスライスを符号化する前に、エンコーダは、履歴統計データ、そのタイプのアプリケーションの知識、マルチパス分析又は何らかの他のそのような技術等のファクタに基づいて、動きベクトル解像度を決めることができる。エンコーダが、フルピクセルの動き推定のみを使用すると決めた場合、分数のピクセル検索はスキップされる。スケーリングされた動きベクトル予測が分数部分を有する場合、予測は整数値に丸められてよい。
更なる実施形態では、コントロールは、任意選択で、ベクトルの垂直成分又は水平成分に対して個別に適用されてもよい。これは、水平又は垂直にスケーリングされる画面ビデオの符号化にとって有益であり得る。例えばエンコーダが、水平又は垂直にサイズ変更(resize)される画面共有と連動している場合を考える。この場合、動きベクトルの成分の一方が分数部分を有し、他方の成分は有しないことになる。ビットレートを制御するため、エンコーダは、所定の範囲内で量子化パラメータ(QP)を調整することができる。QPが、許容される上限に到達しており、ビットレートがまだ高すぎる場合、エンコーダは内部サイズ変更器(internal resizer)をトリガすることができる。これは、入ってくるピクチャを垂直にサイズ変更し、デコーダ側では、復号されるピクチャは、元の幅まで伸張される。したがって、水平の動きベクトルと垂直の動きベクトルを別個に取り扱うことが有益であるという状況が生じることがある。
整数ピクセルの単位又はステップの減少された解像度スケールで動きベクトルを表し、したがって、従来的なコーデックにわたって関連するビットレートの節約を達成するために、動きベクトルを信号伝達するためのプロトコルは、将来のコーデック規格のために更新されなければならないであろう。諸実施形態では、これは、H.265(HEVC:(High Efficiency Video Coding))規格に対する更新として実装され得る。キャプチャされる画面コンテンツを符号化するために、符号化データ34のフォーマットには、各動きベクトルについて、減少されたサイズの動きベクトルのフィールドが与えられるであろう。整数ピクセルモードで符号化される符号化画面キャプチャストリームでは、関連するデータ34は、ビットストリーム33内の整数の動きベクトルを備え、実施形態によってはビットストリーム33内の整数の動きベクトルのみを備えるであろう。
実施形態においては、これは任意選択であり、ヘッダ36に含まれるフラグ37を用いて、関連するフレーム又はスライスの符号化に分数ピクセル(例えば1/4ピクセル)解像度が使用されているのか整数ピクセル解像度が使用されているのかを示す(再び図3を参照されたい)。水平及び垂直解像度を別個に選択することができる場合、フレーム又はスライスに対して、2つのフラグ37が必要とされるであろう。
以下に、H.265規格に対する更新に基づく例示の実施形態を開示する。修正は、動きベクトルを、符号化ビットストリーム33内の減少した整数のピクセルスケールで表すことを可能にし、水平及び垂直成分の動きベクトルの解像度を伝達するために、圧縮されたストリームのヘッダ情報36にスライスごとに2つのフラグ37を追加する。
修正は、ヘッダレベル以外はシンタックス又は解析プロセスを変更しないが、動きベクトルの差を整数として解釈し、スケーリングされたMV予測因子を丸めて整数値にすることによって、復号プロセスを修正する。修正は、テストされる画面コンテンツシーケンスについて、符号化効率を7%ほど、平均で約2%向上させることがわかっており、したがって、符号化及び復号プロセスの複雑性も低減させることができる。
動きベクトルの解釈の解像度を示す高レベルのインジケータが(SPS、PPS及び/又はスライスヘッダレベルで)追加される。
復号プロセスでは、動きベクトルはフルピクセル解像度であるよう指示され、スケーリングされた動きベクトル予測が分数部分を有する場合、次いで実施形態によっては、予測が整数値に丸められる。動きベクトルの差は、1/4-サンプルオフセットではなく、整数オフセットとして簡単に解釈される。すべての他の復号プロセスは同じままである。(ヘッダレベルより下の)解析プロセスも変更されない。動きベクトルが、フルサンプル精度で符号化され、入力画像データが4:4:4又は4:2:0サンプリングを使用するとき、クロマ動きベクトルは通常のやり方で導出され、これは1/2-サンプルクロマ動き変位を生じることになる。あるいは、クロマ動きベクトルは、整数値に丸められてもよい。
動きベクトル解像度を伝達するためのシンタックスの変更に関して、実施形態によっては、3つの可能なモードが存在し、この場合、モードインジケータが、ピクチャパラメータセット(PPS)のような(フレーム当たり)より高いヘッダレベル、あるいはシーケンスパラメータセット(SPS)のような更に高いヘッダレベルで信号伝達される。モードインジケータは3つの選択可能な値を有する。1つの値は、動きベクトルが常に(このPPSを使用するピクチャにおいて)1/4サンプルオフセットを表すように解釈されることを示す。2つめの値は、動きベクトルが常に(このPPSを使用するピクチャにおいて)整数オフセットを表すように解釈されることを示す。3つめの値は、より低いレベルにおいて、その低いレベルで適用される解釈を適応的に選択する信号が存在することを示す。この低レベルの指示は、この第3のモードで動作するときにのみ存在することになるスライスヘッダ内のフラグとすることができる。
これを実装するために、実施形態においては、動きベクトル解像度の制御モードを示す新たな2ビットのインジケータがPPS拡張に含まれることになる。このインジケータは、motion_vector_resolution_control_idcと呼ばれることがある。モードが0のとき、動きベクトルは1/4ピクセル精度で符号化され、すべての復号プロセスは変更されないままである。モードが1であるとき、PPSを参照するスライス内の動きベクトルのすべてが、フルピクセル精度で符号化される。そして、モードが2のとき、動きベクトル解像度は、スライスヘッダ内のフラグによって、スライスごとの単位で制御される。motion_vector_resolution_control_idcが存在しないとき、その値は0と推論される。motion_vector_resolution_control_idcが2に等しいとき、slice_motion_vector_resolution_flagと呼ばれる追加のフラグがスライスヘッダ内で信号伝達される。フラグがゼロのとき、このスライスの動きベクトルは、1/4ピクセル精度で符号化され、フラグが1のとき、動きベクトルはフルピクセル精度で符号化される。フラグが存在しないとき、その値はmotion_vector_resolution_control_idcの値に等しいと推論される。
修正されたPPSシンタックスは、次のように例示される:
Figure 2022017234000002
修正されたスライスヘッダシンタックスは、次のように例示される:
Figure 2022017234000003
上述のスケーリングに関し、これは、例えばHEVC(H.265)で起こるものである。動きベクトルが何らかの他のフレームを符号化するために使用される場合、何が、(i)現在のピクチャと、(ii)その参照ピクチャとの間の相対的な位置変位に関して等価なものとなる動きベクトルとなるかを計算することができることが狙いである。これは、別のピクチャの共同配置される(co-located)部分内の動きベクトルによって示される変位の相対的な位置に基づいており、また、(iii)そのピクチャと、(iv)その参照ピクチャとして参照していたピクチャとの間の相対的な位置に基づいている。すなわち、動きベクトル自体は、予測に基づいて符号化され、この場合、現在のターゲットフレーム内のターゲットブロックについての動きベクトルは、以前のフレーム内の空間的に対応するブロックについての以前の動きベクトルとの相対で符号化される。ターゲットブロックについての動きブロックは、次いで、予測バージョンと実際のバージョンとの間の差(典型的にはデルタ)のみに関して、符号化ビットストリーム33内で伝達される。デコーダは、次いで、デコーダ側で同じ予測を実行して、デルタを追加することによって符号化された動きベクトルを再作成することができる。
しかしながら、符号化データの時間的な(temporal)フレームレートは常に一定ではなく、ピクチャがビットストリーム内に符号化される順番と、そのピクチャがキャプチャされて表示される順番との間には差がある可能性がある。基本的に同じ方向の同じ動きの速さを表すよう、これらの時間的な関係を計算して、動きベクトルをスケーリングするのに使用することができる。すなわち、動きベクトルの予測バージョンは、参照ベクトルに完全に等しくはなく、むしろそのスケーリングされたバージョンである。これは、時間的な動きベクトル予測(temporal motion vector prediction)としても知られる。
HEVC規格における現在の動きベクトル(MV)復号プロセスは、次のように要約され得る:
1.MVがデコーダにおいてどのように予測されるか判断し、動きベクトルデルタ(MVD)が、エンコーダからの符号化ビットストリームで送信されているか否かを判断する(これは何らかのシンタックス指示を伴うことがある)。
2.予測動きベクトル(PMV:predicted motion vector)を生成する。これは整数のペア(px,py)を作成する。整数は、ルマ領域において四分の一のサンプル位置の精度でオフセットを表すように想定される。
3.MVDが送信されない場合、MV値(mx,my)を(px,py)に設定し、そうでない場合、整数のペア(px,py)を(dx,dy)として復号し、MV(mx,my)を(px+dx,py+dy)に設定する。MVは、ルマ領域における1/4-サンプルオフセットを表すものとして解釈される。注:ルマの区別(luma distinction)は、ビデオが、クロマチャネルと異なる解像度をルマチャネルで使用する、4:2:2又は4:2:0等のフォーマットの場合にのみ問題となる;代わりに、ビデオが、例えば4:4:4フォーマットである場合、オフセットは、すべてのサンプリンググリッドについて1/4サンプルユニットを有するものとして解釈される。
4.後続のPMVを生成するために(及びデブロッキングフィルタ等を制御するために)後に使用するために最後の値(mx,my)を格納する。
本開示の実施形態では、整数ピクセルベクトルモードが使用されているとき、スケーリングされた動きベクトルは、整数ピクセル解像度に対する制約に適応するよう、復号プロセスで丸められることがある。例えば動きベクトル復号プロセスは、次のように修正され得る。
1.MVがデコーダにおいてどのように予測されるか判断し、動きベクトルデルタ(MVD)が、エンコーダからの符号化ビットストリームで送信されている否かを判断する(これは何らかのシンタックス指示を伴うことがある)。
2.予測動きベクトル(PMV)を生成する。これは整数のペア(px,py)を作成する。整数は、ルマ領域において四分の一のサンプル位置の精度でオフセットを表すように想定される。
3.整数精度モードで動作する場合、これを行う:
a.整数オフセットに対応させるように予測値の端数を切り捨てる-例えばcreate(rx,ry)=(round(px/4),round(py/4))
b.MVDが送信されない場合、MV値(mx,my)を(4*rx,4*ry)に設定し、そうでない場合、整数のペア(px,py)を(dx,dy)として復号し、MV(mx,my)を(4*(rx+dx),4*(ry+dy))に設定する。MVは、ルマ領域における1/4-サンプルオフセットを表すものとして解釈される。(注:やはり、ルマの区別は、ビデオが4:2:2又は4:2:0等のフォーマットの場合にのみ問題となる。)
4.そうでない場合(すなわち、1/4-サンプリング精度モードで動作する場合)、これを行う:MVDが送信されない場合、MV値(mx,my)を(px,py)に設定し、そうでない場合、整数のペア(px,py)を(dx,dy)として復号し、MV(mx,my)を(px+dx,py+dy)に設定する。MVはやはり、ルマ領域における1/4-サンプルオフセットを表すものとして解釈される。
5.後続のPMVを生成するために(及びデブロッキングフィルタ等を制御するために)後に使用するために最後の値(mx,my)を格納する。
しかしながら、上述のプロセスは、必ずしもすべての可能性のある実施形態に必要ではない。上記に概説されたアプローチは、動きベクトル予測が1/4ピクセル領域で生じるよう、デコーダが、開始から1/4ピクセル領域で動作することを想定している。しかしながら、実際には、デコーダは必ずしも、この段階でその単位(unit)が何を意味しているかを知る必要はない。したがって、実際に画像を生成するために後に使用されるまで、その単位に対するいずれの解釈も提起(place)されないという、代替的なアプローチを取ることも可能である。
以下は、そのような代替的なアプローチの実施形態による復号プロセスを説明する。上記のように、動きベクトル値のうちの少なくとも1つが異なるように符号化され、この場合、動き予測モジュール73は、その動きベクトル値のうちの別の動きベクトル値をスケーリングすることによって、動きベクトル値を予測するように構成される。動きベクトル値の少なくとも1つは、デルタ値に関して異なるように符号化され、動き予測モジュール73は、動きベクトル値のうちの別の動きベクトル値をスケーリングして、スケーリングされた動きベクトル値を生成し、次いでデルタ値をスケーリングされた動きベクトル値に追加することによって、動きベクトル値を予測するように構成され得る。しかしながら、上記とは異なり、動き予測モジュール73は、(整数モードが使用されているとき)スケーリング後に整数ピクセル解像度へ丸めることなく、その整数ピクセル単位(integer pixel units)で動きベクトル値を解釈するように更に構成される。これは、スケーリングの際に、その単位に対する解釈を提起することをやめることによって可能になる。動き推定モジュール73は、スケーリングされた動きベクトルの値へのデルタの追加を実行することにより、スケーリングされた動きベクトル値を整数ピクセル解像度へ丸めることなく、整数ピクセル単位で動きベクトル値を解釈するように構成され得る。結果として得られる動きベクトル値は単に、画像を生成するのに使用されるときに、整数又は分数ピクセル単位に関して解釈される。また、結果として得られる値は、整数又は分数単位に関して格納された値に対する解釈を提起することなく、1つ以上の後続の動きベクトルを予測する際に使用するために格納される。
例えばそのような代替によると、動きベクトルの復号プロセスは、以下のように実装され得る。
1.MVがデコーダにおいてどのように予測されるか判断し、動きベクトルデルタ(MVD)が、エンコーダからの符号化ビットストリームで送信されている否かを判断する(これは何らかのシンタックス指示を伴うことがある)。
2.予測動きベクトル(PMV)を生成する。これは整数のペア(px,py)を作成する。しかしながら、これが何を表し得るのかについては気にしない-すなわち、この段階では、その単位に対していかなる解釈も提起しない。
3.MVDが送信されない場合、MV値(mx,my)を(px,py)に設定し、そうでない場合、整数のペア(px,py)を(dx,dy)として復号し、MV(mx,my)を(px+dx,py+dy)に設定する。整数精度モードで動作するとき、MVを、ルマ領域内の全体の整数のオフセット(whole-integer offset)を表すように解釈する。すなわち、1/4-サンプルオフセット単位で値(4*mx,4*my)を表すように解釈する。そうでない場合(すなわち、1/4-サンプリング精度モードで動作する場合)、MVを、ルマ領域内の1/4-サンプルオフセットを表すように解釈する。すなわち、1/4-サンプルオフセット単位で値(mx,my)を表すように解釈する(注:やはり、ルマの区別は、ビデオが4:2:2又は4:2:0等のフォーマットの場合にのみ問題となる。)
4.後続のPMVを生成するために(及びデブロッキングフィルタ等を制御するために)後に使用するために最後の値(mx,my)を格納する。やはり、これが何を表し得るのかについては気にしない。
したがって、上記の丸めステップ3aは、ここでは除外される。数の解釈のみが修正される。これは、MV予測プロセスの修正が必要とされないので、復号プロセスをあまり複雑でないものにする。
上述の丸めは、1/4(又は分数)解像度から整数解像度への丸めを指すことに留意されたい。現在の規格では、動きベクトル精度の一部として、更により精細な精度から、1/4精度への丸めも存在する。上記の代替的な実施形態では、そのような事前丸めも存在することは除外されない。
このやり方では、幾つかの動作の副作用が存在することがある。1つの副作用は、一部のピクチャが他とは異なるモードを使用する場合、時間的なMV予測のためにMV予測プロセスで使用されるスケーリングが正しくない可能性があることである。しかしながら、これは非常に些細な影響である。特に、異なるモードで動作するというこの状況があることは珍しく、又は時間的なMV予測は通常、非常に小さな利点しかもたらさないためである。別の副作用は、デブロッキングフィルタ制御の結果が、異なるスケール因子で解釈されるMV値に依存し得ることである。しかしながら、この影響も小さいであろう。特に画面コンテンツを符号化するときに、デブロッキングは無効にされ得るか、あまり影響を持たないことがあるからである。
常に整数動きのみを使用して、時間的な動きベクトル予測を無効にするという別の可能性もあり得る。エンコーダにその機能の使用を無効にさせるHEVCのシンタックスが既に存在する。それは、差が整数として符号化されるか、分数値として部号化されるかに応じて異なるように動作する特別なプロセスを、デコーダに持たせる必要性を回避するためにあり得る方法であろう。時間的動きベクトル予測から得られる利益は、これらの使用ケースではいずれにしても小さく(又はゼロ)、これを無効にすることは、必ずしも望ましくないことはない。
上記の実施形態は、単に例として説明されていることが認識されよう。
例えば上記は、ブロックに関して説明されているが、これは必ずしもいずれかの特定の規格においてブロックと呼ばれる区分に限定されない。例えば本明細書で言及されるブロックは、H.26x規格でブロック又はマクロブロックと呼ばれる区分であってもよい。
任意の特定のコーデック又は規格に限定されている本開示の範囲、一般的には本明細書で開示される技術を、H.264又はH.265のようなH.26x規格又は任意の別の規格であるかどうかに関わらず、既存の規格又は既存の規格に対する更新のコンテキストのいずれかにおいて実装することができ、あるいは特注のコーデックで実装してもよい。さらに本開示の範囲は、RGB、YUV又は他のものに関するかどうかに関わらず、ビデオサンプルについてのいずれかの特定の表現に特に制限されない。また、その範囲はいずれかの特定の量子化に限定されず、DCT変換にも限定されない。例えばKL変換(KLT:Karhunen-LoeveTransform)のような代替的な変換を使用することができ、あるいは変換を使用しなくてもよい。さらに、本開示は、VoIP通信やいずれかの特定の種類のネットワークを介する通信に限定されないが、データを通信する能力を有するいずれかの任意のネットワーク又は媒体において使用することも可能である。
動きベクトルオフセットが、整数のピクセル等に制限される又は制限されないと言う場合、これは、色空間チャネルのうちのいずれか1つ又は2つにおける動き推定、あるいは3つの色チャネルすべてにおける動き推定を指すことがある。
さらに、本発明は、整数ピクセルと四分の一ピクセルの解像度との間を選択することに限定されない。一般に、本明細書で説明される技術を、整数ピクセルの解像度と任意の分数ピクセル解像度、例えば1/2ピクセル解像度との間を選択すること、あるいは整数ピクセル解像度と複数の異なる分数ピクセルモードとの間を選択すること、例えば整数と1/2及び1/4ピクセルモードとの間を選択することに適用することができる。
さらに、本開示の範囲は、符号化ビデオ及び/又は画面キャプチャストリームがネットワークを介して送信される適用に限定されず、ストリームがライブストリームである適用にも限定されない。例えば別の適用では、ストリームは、光ディスク、ハードドライブ又は他の磁気ストレージ、あるいは「フラッシュ」メモリスティック又は他の電子メモリのような、ストレージデバイス上に格納され得る。したがって、画面共有ストリームは、(確かに1つのオプションではあるが)必ずしもライブシェアリングを意味する必要はないことに留意されたい。あるいはまた、後に1以上の他のユーザと共有するために格納されてもよく、あるいは、キャプチャされた画像は共有されずに、ある時間に画面を使用していたユーザのために単に記録されればよいこともある。一般に、画面キャプチャは、(確かに1つのオプションではあるが、必ずしも画面バッファからの読み取りではなくてよい)任意の適切な手段によってキャプチャされる、キャプチャされたエンコーダ側の画面コンテンツからなる任意の動画データであってよく、1以上の他のユーザと(ライブであってもなくてもよい)共有されるか、キャプチャしているユーザの利益のため又は単にアーカイブのために(恐らくはターンアウトされると、実際には再び見ることはできない)単に記録されることになる。
コーデックは、必ずしも画面キャプチャデータ及びビデオの符号化に限定されないことに留意されたい。実施形態によっては、コーデックは、他のタイプの動画データ、例えばアニメーションを符号化する能力を有することがある。そのような他のタイプの動画データは、分数ピクセルモード又は整数ピクセルモードで符号化され得る。
さらに、インターフレーム符号化は、必ずしも常に以前のフレームとの相対で符号化する必要はなく、より一般的には、一部のコーデックは、ターゲットフレーム以外の異なるフレーム、すなわち(適切な外部バッファを想定すると)ターゲットフレームの先行フレーム又は前方のフレームに対する符号化を許容することに留意されたい。
さらに、以前に説明したように、動きベクトル自体を異なるように符号化してもよいことに留意されたい。符号化ビットストリーム内で伝達されるような動きベクトルが整数のピクセル等に制限される場合、これは異なるように符号化された動きベクトルの形式が、そのように制限されることを意味する(例えばデルタ)。
さらに、デコーダは、必ずしもエンドユーザ端末で実装されなくてもよく、受信端末における即時の使用のために、動画データを出力しなくてもよい。代替的な実装では、受信端末は、動画データを復号又はトランスコードされた形で別の端末に出力し、あるいは後の使用のために復号データを格納するため、デコーダソフトウェアを実行するサーバのような中間端末であってよい。同様に、エンコーダは、エンドユーザ端末で実装される必要はなく、送信端末から発信される動画データを符号化する必要がない。他の実施形態において、送信端末は、例えば動画データを未符号化あるいは別の形でコード化された形で別の端末から受け取り、サーバで格納するためにそのデータを符号化又はトランスコードし、あるいは受信端末へ転送するため、エンコーダソフトウェアを実行するサーバのような中間端末であってよい。
一般に、本明細書で説明される機能はいずれも、ソフトウェア、ファームウェア、ハードウェア(例えば固定の論理回路)又はこれらの実装の組合せを使用して実装され得る。「モジュール」、「機能」、「コンポーネント」及び「ロジック」という用語は、本明細書で使用されるとき、ソフトウェア、ファームウェア、ハードウェア又はその組合せを表す。ソフトウェア実装の場合、モジュール、機能又はロジックは、プロセッサ(例えば1つ又は複数のCPU)で実行されると、指定のタスクを実行するプログラムコードを表す。プログラムコードは、1つ以上のコンピュータ読取可能メモリデバイス内に格納され得る。以下に説明される技術の機能は、プラットフォーム独立であり、これは、本技術が、様々はプロセッサを有する様々な市販のコンピューティングプラットフォーム上で実装され得ることを意味する。
例えば端末は、ユーザ端末のハードウェアに、例えばプロセッサ機能ブロック等のような動作を実行させるエンティティ(例えばソフトウェア)を含み得る。例えば端末はコンピュータ読取可能媒体を含んでよく、コンピュータ読取可能媒体は、ユーザ端末、より具体的にはユーザ端末のオペレーションシステム及び関連するハードウェアに動作を実行させる命令を保持するように構成され得る。したがって、このようにして動作を実行するようにオペレーティングシステム及び関連するハードウェアを構成する命令機能の結果、機能を実行するようオペレーションシステム及び関連するハードウェアの変換につながる。命令は、コンピュータ読取可能媒体により、様々な異なる構成を通して端末へと提供され得る。
コンピュータ読取可能媒体の1つのそのような構成は、信号担持媒体であり、したがって、命令を(例えば搬送波として)ネットワーク等を介してコンピューティングデバイスへ伝送するよう構成される。コンピュータ読取可能媒体は、コンピュータ読取可能記録媒体として構成されてもよく、これは信号担持媒体ではない。コンピュータ読取可能記録媒体の例には、磁気技術、光技術及び命令や他のデータを格納する他の技術を含め、ランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、光ディスク、フラッシュメモリ、ハードディスクメモリ及び他のメモリデバイスが含まれる。
本主題は、構造的特徴及び/又は方法的動作に特有の言葉で説明されているが、添付の特許請求の範囲で定義される主題は、必ずしも上述の具体的な特徴又は動作に限定されないことを理解されたい。むしろ、上述の具体的な特徴及び動作は、特許請求の範囲を実装する例示の形式として開示される。
上記の実施形態につき以下の付記を残しておく。
[付記1]
符号化ビットストリームにおいて動画データのための符号化データを受け取るための入力部であって、前記動画データは、動き推定を使用して少なくとも1つの領域が符号化されている複数のフレームを含み、前記符号化データは、前記フレーム内のそれぞれの少なくとも1つの領域に関連付けられる動きベクトル(MV)値のそれぞれのセットを含み、前記符号化データは更に、
前記フレームのうちの少なくとも1つに関連付けられる高レベルヘッダ内に、(a)前記フレームの前記少なくとも1つについてのMV精度が領域ごとに制御されているかどうか、及び(b)前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されていない場合、前記フレームの前記少なくとも1つについての前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを示すモードインジケータと、
前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されている場合、前記フレームの前記少なくとも1つのそれぞれの領域の各々について、該領域のヘッダ内に、前記領域の前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを示すフラグ値と、
を含む、前記入力部と;
前記フレームを復号するためのビデオデコーダであって、前記フレームを復号することが、イントラ予測動作及びインター予測動作を含み、前記インター予測動作が、前記MV値に少なくとも部分的に基づいており、前記フレームを復号することが更に、
前記モードインジケータから、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されているかどうかを判断することと、
前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されていない場合、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されていないことも示す前記モードインジケータから、前記フレームの前記少なくとも1つについての前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを判断し、それにより前記フレームの前記少なくとも1つの前記それぞれの領域の前記MV値を整数サンプル精度で解釈するか、1/4サンプル精度で解釈するかを判断することと、
前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されている場合、前記フレームの前記少なくとも1つの前記それぞれの領域の各々について、該領域の前記フラグ値に基づいて、前記領域の前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを判断し、それにより前記領域の前記MV値を整数サンプル精度で解釈するか、1/4サンプル精度で解釈するかを判断することと、
前記1/4サンプル精度について分数ピクセル単位で又は前記整数サンプル精度について整数ピクセル単位で前記MV値を解釈することと、
を含む、前記ビデオデコーダと;
前記復号したフレームを表示のために出力するためのバッファと;
を備える、デコーダシステム。
[付記2]
前記高レベルヘッダは、シーケンスパラメータセット又はピクチャパラメータセットであり、前記領域はスライスであり、前記領域のヘッダはスライスヘッダである、
付記1に記載のデコーダシステム。
[付記3]
前記モードインジケータ及び/又は前記フラグ値は、前記MV値の水平成分についてのMV精度を示すか、前記MV値の垂直成分についてのMV精度を示し、前記復号することは、前記フレームの前記少なくとも1つを水平又は垂直にサイズ変更することを更に含む、
付記1に記載のデコーダシステム。
[付記4]
前記MV値の前記水平成分及び前記MV値の前記垂直成分は異なるMV精度を有する、
付記3に記載のデコーダシステム。
[付記5]
コンテンツタイプが画面キャプチャコンテンツである場合、前記MV精度は整数サンプル精度であり、前記コンテンツタイプがカメラビデオコンテンツである場合、前記MV精度は1/4サンプル精度である、
付記1に記載のデコーダシステム。
[付記6]
前記モードインジケータは2ビット値であり、前記モードインジケータについて、
第1の可能な値が、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されないことを示し、前記フレームの前記少なくとも1つについての前記MV精度が1/4サンプル精度であることを更に示し、
第2の可能な値が、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されないことを示し、前記フレームの前記少なくとも1つについての前記MV精度が整数サンプル精度であることを更に示し、
第3の可能な値が、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されることを示す、
付記1に記載のデコーダシステム。
[付記7]
前記フレームの前記少なくとも1つの前記それぞれの領域のうちの所与の領域について、前記所与の領域の前記フラグ値が前記ビットストリーム内に存在していない場合、前記所与の領域の前記フラグ値は、前記モードインジケータと等しい値を有するように推論される、
付記1に記載のデコーダシステム。
[付記8]
1つ以上の処理ユニット及びメモリを備えるコンピュータシステムにおいて実施される方法であって:
ビデオシーケンスのフレームについての符号化データをビットストリームの一部として受け取る受信ステップであって、前記フレームの各々は1つ以上の領域を含み、前記ビットストリームは、
前記ビデオシーケンスの前記フレームのうちの少なくとも1つに適用するヘッダ内において、(a)前記フレームの前記少なくとも1つについての動きベクトル(MV)精度が領域ごとに制御されているかどうか、及び(b)前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されていない場合、前記フレームの前記少なくとも1つについての前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを示すインジケータの値と、
前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されている場合、前記フレームの前記少なくとも1つの前記1つ以上の領域の各領域について、該領域のヘッダ内において、前記領域の前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを示すフラグ値と、
を含む、受信ステップと;
前記符号化データを使用して前記フレームを復号する復号ステップであって、前記フレームを復号することは、イントラ予測動作及びインター予測動作を含み、前記フレームを復号することは更に、
前記インジケータの値に基づいて、前記フレームの前記少なくとも1つについてのMV精度が領域ごとに制御されているかどうかを判断することと、
前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されていない場合、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されていないことも示す前記インジケータの値に基づいて、前記フレームの前記少なくとも1つについての前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを判断することと、
前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されている場合、前記フレームの前記少なくとも1つの前記1つ以上の領域の各領域について、該領域のヘッダ内の前記フラグ値に基づいて、前記領域の前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを判断することと、
を含む、復号ステップと;
前記復号したフレームを表示のために出力するステップと;
を含む、方法。
[付記9]
前記フレームのうちの前記少なくとも1つに適用するヘッダは、シーケンスパラメータセット又はピクチャパラメータセットであり、前記領域はスライスであり、前記領域のヘッダはスライスヘッダである、
付記8に記載の方法。
[付記10]
前記インジケータ及び/又は前記フラグ値は、MV値の水平成分についてのMV精度を示すか、前記MV値の垂直成分についてのMV精度を示し、
当該方法は、前記復号ステップの間に、前記フレームの前記少なくとも1つを水平又は垂直にサイズ変更するステップを更に含む、
付記8に記載の方法。
[付記11]
前記MV値の前記水平成分及び前記MV値の前記垂直成分は異なるMV精度を有する、
付記10に記載の方法。
[付記12]
コンテンツタイプが画面キャプチャコンテンツである場合、前記MV精度は整数サンプル精度であり、前記コンテンツタイプがカメラビデオコンテンツである場合、前記MV精度は1/4サンプル精度である、
付記8に記載の方法。
[付記13]
前記インジケータは2ビット値であり、前記インジケータについて、
第1の可能な値が、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されないことを示し、前記フレームの前記少なくとも1つについての前記MV精度が1/4サンプル精度であることを更に示し、
第2の可能な値が、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されないことを示し、前記フレームの前記少なくとも1つについての前記MV精度が整数サンプル精度であることを更に示し、
第3の可能な値が、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されることを示す、
付記8に記載の方法。
[付記14]
前記フレームの前記少なくとも1つのそれぞれの領域のうちの所与の領域について、前記所与の領域についての前記フラグ値が前記ビットストリーム内に存在していない場合、前記所与の領域についての前記フラグ値は、前記インジケータと等しい値を有するように推論される、
付記8に記載の方法。
[付記15]
コンピュータによって実行されると、該コンピュータに:
ビデオシーケンスのフレームについての符号化データをビットストリームの一部として受け取る受信ステップであって、前記フレームの各々は1つ以上の領域を含み、前記ビットストリームは、
前記ビデオシーケンスの前記フレームのうちの少なくとも1つに適用するヘッダ内において、(a)前記フレームの前記少なくとも1つについての動きベクトル(MV)精度が領域ごとに制御されているかどうか、及び(b)前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されていない場合、前記フレームの前記少なくとも1つについての前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを示すインジケータの値と、
前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されている場合、前記フレームの前記少なくとも1つの前記1つ以上の領域の各領域について、該領域のヘッダ内において、前記領域の前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを示すフラグ値と、
を含む、受信ステップと;
前記符号化データを使用して前記フレームを復号する復号ステップであって、前記フレームを復号することは、イントラ予測動作及びインター予測動作を含み、前記フレームを復号することは更に、
前記インジケータの値に基づいて、前記フレームの前記少なくとも1つについてのMV精度が領域ごとに制御されているかどうかを判断することと、
前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されていない場合、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されていないことも示す前記インジケータの値に基づいて、前記フレームの前記少なくとも1つについての前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを判断することと、
前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されている場合、前記フレームの前記少なくとも1つの前記1つ以上の領域の各領域について、該領域のヘッダ内の前記フラグ値に基づいて、前記領域の前記MV精度が整数サンプル精度であるか、1/4サンプル精度であるかを判断することと、
を含む、復号ステップと;
前記復号したフレームを表示のために出力するステップと;
を含む動作を実行させる、コンピュータプログラム。
[付記16]
前記フレームのうちの前記少なくとも1つに適用するヘッダは、シーケンスパラメータセット又はピクチャパラメータセットであり、前記領域はスライスであり、前記領域のヘッダはスライスヘッダである、
付記15に記載のコンピュータプログラム。
[付記17]
前記インジケータ及び/又は前記フラグ値は、MV値の水平成分についてのMV精度を示すか、前記MV値の垂直成分についてのMV精度を示し、
前記復号ステップは、前記フレームの前記少なくとも1つを水平又は垂直にサイズ変更するステップを更に含む、
付記15に記載のコンピュータプログラム。
[付記18]
前記MV値の前記水平成分及び前記MV値の前記垂直成分は異なるMV精度を有する、
付記17に記載のコンピュータプログラム。
[付記19]
前記インジケータは2ビット値であり、前記インジケータについて、
第1の可能な値が、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されないことを示し、前記フレームの前記少なくとも1つについての前記MV精度が1/4サンプル精度であることを更に示し、
第2の可能な値が、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されないことを示し、前記フレームの前記少なくとも1つについての前記MV精度が整数サンプル精度であることを更に示し、
第3の可能な値が、前記フレームの前記少なくとも1つについての前記MV精度が領域ごとに制御されることを示す、
付記15に記載のコンピュータプログラム。
[付記20]
前記フレームの前記少なくとも1つのそれぞれの領域のうちの所与の領域について、前記所与の領域についての前記フラグ値が前記ビットストリーム内に存在していない場合、前記所与の領域についての前記フラグ値は、前記インジケータと等しい値を有するように推論される、
付記15に記載のコンピュータプログラム。

Claims (20)

  1. 1つ以上の処理ユニット及びメモリを含むコンピューティングシステムにおいて、
    ビデオシーケンスの少なくとも一部のための、ビットストリームの一部としての符号化データを受け取るステップであり、前記符号化データは、
    第1のレベルのビットストリームシンタックスにおけるヘッダ内に符号化されたインジケータであり、前記インジケータは、(a)動きベクトル(「MV」)精度が前記第1のレベルのビットストリームシンタックスより低い第2のレベルのビットストリームシンタックスで制御されるか否か、及び(b)前記MV精度が前記第2のレベルのビットストリームシンタックスで制御されない場合、前記MV精度が整数サンプル精度であるか、分数サンプル精度であるかを示す、インジケータと、
    前記MV精度が前記第2のレベルのビットストリームシンタックスで制御される場合、前記ビデオシーケンスの複数のフレーム又は領域の各々について、前記フレーム又は領域の前記第2のレベルのビットストリームシンタックスにおけるヘッダ内の前記フレーム又は領域のためのフラグであり、前記フラグは、前記フレーム又は領域について、前記MV精度が前記整数サンプル精度であるか、前記分数サンプル精度であるかを示す、フラグと、
    を含む、ステップと、
    前記符号化データを復号するステップであり、前記復号するステップは、
    前記第1のレベルのビットストリームシンタックスにおける前記ヘッダを使用して前記インジケータを判断することと、
    前記インジケータに基づいて、前記MV精度が前記第2のレベルのビットストリームシンタックスで制御されるか否かを判断することと、
    前記MV精度が前記第2のレベルのビットストリームシンタックスで制御されない場合、前記複数のフレーム又は領域の各々について、前記インジケータに基づいて、前記フレーム又は領域の前記MV精度が前記整数サンプル精度であるか、前記分数サンプル精度であるかを判断することと、
    前記MV精度が前記第2のレベルのビットストリームシンタックスで制御される場合、前記複数のフレーム又は領域の各々について、前記フレーム又は領域の前記第2のレベルのビットストリームシンタックスにおける前記ヘッダ内の前記フレーム又は領域のための前記フラグに基づいて、前記フレーム又は領域の前記MV精度が前記整数サンプル精度であるか、前記分数サンプル精度であるかを判断することと、
    を含む、ステップと、
    を含む方法。
  2. 前記第1のレベルのビットストリームシンタックスはシーケンスレベルであり、前記第2のレベルのビットストリームシンタックスはフレームレベルである、請求項1に記載の方法。
  3. 前記第1のレベルのビットストリームシンタックスにおける前記ヘッダはシーケンスヘッダであり、前記第2のレベルのビットストリームシンタックスにおける前記ヘッダはフレームヘッダである、請求項1に記載の方法。
  4. 前記第1のレベルのビットストリームシンタックスはシーケンスレベルであり、前記第2のレベルのビットストリームシンタックスはスライスレベルである、請求項1に記載の方法。
  5. 前記第1のレベルのビットストリームシンタックスにおける前記ヘッダはシーケンスパラメータセットであり、前記第2のレベルのビットストリームシンタックスにおける前記ヘッダはスライスヘッダである、請求項1に記載の方法。
  6. 前記分数サンプル精度は1/4サンプル精度である、請求項1に記載の方法。
  7. 前記インジケータ又は前記フラグにより示される前記MV精度は、MV値の水平成分又は前記MV値の垂直成分に関し、当該方法は、前記復号するステップの間、前記フレームのうち少なくとも1つを水平又は垂直にサイズ変更するステップを更に含む、請求項1に記載の方法。
  8. 前記MV値の前記水平成分及び前記MV値の前記垂直成分は、異なるMV精度を有する、請求項7に記載の方法。
  9. 前記復号するステップは、前記複数のフレーム又は領域のうちの所与のフレーム又は領域のMV値について、
    前記所与のフレーム又は領域の前記MV精度が前記整数サンプル精度である場合、前記MV値を整数サンプルの単位で解釈することと、
    前記所与のフレーム又は領域の前記MV精度が前記分数サンプル精度である場合、前記MV値を分数サンプルの単位で解釈することと、
    を更に含む、請求項1に記載の方法。
  10. 前記インジケータは、3つの可能な値のうち1つを有し、前記3つの可能な値は、
    前記MV精度が前記第2のレベルのビットストリームシンタックスにおいて制御されないこと、及び前記MV精度が前記分数サンプル精度であることを示す第1の可能な値と、
    前記MV精度が前記第2のレベルのビットストリームシンタックスにおいて制御されないこと、及び前記MV精度が前記整数サンプル精度であることを示す第2の可能な値と、
    前記MV精度が前記第2のレベルのビットストリームシンタックスにおいて制御されることを示す第3の可能な値と、
    を含む、請求項1に記載の方法。
  11. 前記複数のフレーム又は領域のうちの所与のフレーム又は領域について、所与のフレーム又は領域の前記フラグが前記ビットストリーム内に存在していない場合、前記所与のフレーム又は領域の前記フラグは、前記インジケータに等しい値を有するように推論される、請求項1に記載の方法。
  12. 前記インジケータを判断することは、前記第1のレベルのビットストリームシンタックスにおける前記ヘッダからの2ビットを使用する、請求項1に記載の方法。
  13. 前記インジケータを判断することは、前記第1のレベルのビットストリームシンタックスにおける前記ヘッダからのエントロピー符号化された2ビット値をエントロピー復号することを含む、請求項1に記載の方法。
  14. ビデオシーケンスの少なくとも一部のための、ビットストリームの一部としての符号化データを格納された1つ以上のコンピュータ読取可能メモリデバイスであって、前記符号化データは、
    第1のレベルのビットストリームシンタックスにおけるヘッダ内に符号化されたインジケータであり、前記インジケータは、(a)動きベクトル(「MV」)精度が前記第1のレベルのビットストリームシンタックスより低い第2のレベルのビットストリームシンタックスで制御されるか否か、及び(b)前記MV精度が前記第2のレベルのビットストリームシンタックスで制御されない場合、前記MV精度が整数サンプル精度であるか、分数サンプル精度であるかを示す、インジケータと、
    前記MV精度が前記第2のレベルのビットストリームシンタックスで制御される場合、前記ビデオシーケンスの複数のフレーム又は領域の各々について、前記フレーム又は領域の前記第2のレベルのビットストリームシンタックスにおけるヘッダ内の前記フレーム又は領域のためのフラグであり、前記フラグは、前記フレーム又は領域について、前記MV精度が前記整数サンプル精度であるか、前記分数サンプル精度であるかを示す、フラグと、
    を含み、
    前記符号化データは、
    前記第1のレベルのビットストリームシンタックスにおける前記ヘッダを使用して前記インジケータを判断することと、
    前記インジケータに基づいて、前記MV精度が前記第2のレベルのビットストリームシンタックスで制御されるか否かを判断することと、
    前記MV精度が前記第2のレベルのビットストリームシンタックスで制御されない場合、前記複数のフレーム又は領域の各々について、前記インジケータに基づいて、前記フレーム又は領域の前記MV精度が前記整数サンプル精度であるか、前記分数サンプル精度であるかを判断することと、
    前記MV精度が前記第2のレベルのビットストリームシンタックスで制御される場合、前記複数のフレーム又は領域の各々について、前記フレーム又は領域の前記第2のレベルのビットストリームシンタックスにおける前記ヘッダ内の前記フレーム又は領域のための前記フラグに基づいて、前記フレーム又は領域の前記MV精度が前記整数サンプル精度であるか、前記分数サンプル精度であるかを判断することと、
    を含む動作に従う復号を容易にするように編成されている、1つ以上のコンピュータ読取可能メモリデバイス。
  15. 前記第1のレベルのビットストリームシンタックスにおける前記ヘッダはシーケンスヘッダであり、前記第2のレベルのビットストリームシンタックスにおける前記ヘッダはフレームヘッダである、請求項14に記載の1つ以上のコンピュータ読取可能メモリデバイス。
  16. 前記第1のレベルのビットストリームシンタックスにおける前記ヘッダはシーケンスパラメータセットであり、前記第2のレベルのビットストリームシンタックスにおける前記ヘッダはスライスヘッダである、請求項14に記載の1つ以上のコンピュータ読取可能メモリデバイス。
  17. ビデオシーケンスの少なくとも一部を符号化し、それにより前記ビデオシーケンスの前記少なくとも一部のための、ビットストリームの一部としての符号化データを生成する動作を実行するように構成されたエンコーダであり、前記ビットストリームは、第1のレベルのビットストリームシンタックスと、前記第1のレベルのビットストリームシンタックスより低い第2のレベルのビットストリームシンタックスとを有し、前記動作は、
    前記第1のレベルのビットストリームシンタックスにおけるヘッダ内にインジケータを符号化することであり、前記インジケータは、(a)動きベクトル(「MV」)精度が前記第2のレベルのビットストリームシンタックスで制御されるか否か、及び(b)前記MV精度が前記第2のレベルのビットストリームシンタックスで制御されない場合、前記MV精度が整数サンプル精度であるか、分数サンプル精度であるかを示す、ことと、
    前記MV精度が前記第2のレベルのビットストリームシンタックスで制御される場合、前記ビデオシーケンスの複数のフレーム又は領域の各々について、
    前記フレーム又は領域の前記MV精度が前記整数サンプル精度であるか、前記分数サンプル精度であるかを判断することと、
    前記フレーム又は領域の前記第2のレベルのビットストリームシンタックスにおけるヘッダ内の前記フレーム又は領域のためのフラグを設定することであり、前記フラグは、前記フレーム又は領域の前記MV精度が前記整数サンプル精度であるか、前記分数サンプル精度であるかを示す、ことと、
    を含む、エンコーダと、
    前記ビットストリームの一部としての前記符号化データを格納するための出力バッファであり、前記符号化データは、
    前記第1のレベルのビットストリームシンタックスにおける前記ヘッダ内に符号化された前記インジケータと、
    前記MV精度が前記第2のレベルのビットストリームシンタックスで制御される場合、前記複数のフレーム又は領域の各々について、前記フレーム又は領域の前記第2のレベルのビットストリームシンタックスにおける前記ヘッダ内の前記フレーム又は領域のための前記フラグと、
    を含む、出力バッファと、
    を含むエンコーダシステム。
  18. 前記インジケータを符号化することは、前記第1のレベルのビットストリームシンタックスにおける前記ヘッダ内の2ビットを使用する、請求項17に記載のエンコーダシステム。
  19. 前記インジケータを符号化することは、前記第1のレベルのビットストリームシンタックスにおける前記ヘッダの2ビット値をエントロピー符号化することを含む、請求項17に記載のエンコーダシステム。
  20. 前記フレームはコンテンツタイプを有し、前記コンテンツタイプが画面キャプチャコンテンツタイプである場合、前記MV精度は前記整数サンプル精度であり、前記コンテンツタイプがカメラビデオコンテンツタイプである場合、前記MV精度は前記分数サンプル精度である、請求項17に記載のエンコーダシステム。
JP2021158778A 2014-01-08 2021-09-29 符号化ビットストリームにおける動きベクトルの提示 Pending JP2022017234A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201461925108P 2014-01-08 2014-01-08
US61/925,108 2014-01-08
US201461934506P 2014-01-31 2014-01-31
US61/934,506 2014-01-31
US14/530,625 2014-10-31
US14/530,625 US9774881B2 (en) 2014-01-08 2014-10-31 Representing motion vectors in an encoded bitstream
JP2019166337A JP2020022170A (ja) 2014-01-08 2019-09-12 符号化ビットストリームにおける動きベクトルの提示

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2019166337A Division JP2020022170A (ja) 2014-01-08 2019-09-12 符号化ビットストリームにおける動きベクトルの提示

Publications (1)

Publication Number Publication Date
JP2022017234A true JP2022017234A (ja) 2022-01-25

Family

ID=53496190

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2016545337A Active JP6588441B2 (ja) 2014-01-08 2015-01-07 符号化ビットストリームにおける動きベクトルの提示
JP2019166337A Pending JP2020022170A (ja) 2014-01-08 2019-09-12 符号化ビットストリームにおける動きベクトルの提示
JP2021158778A Pending JP2022017234A (ja) 2014-01-08 2021-09-29 符号化ビットストリームにおける動きベクトルの提示

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2016545337A Active JP6588441B2 (ja) 2014-01-08 2015-01-07 符号化ビットストリームにおける動きベクトルの提示
JP2019166337A Pending JP2020022170A (ja) 2014-01-08 2019-09-12 符号化ビットストリームにおける動きベクトルの提示

Country Status (11)

Country Link
US (4) US9774881B2 (ja)
EP (2) EP3075156A2 (ja)
JP (3) JP6588441B2 (ja)
KR (3) KR102523311B1 (ja)
CN (2) CN105900425B (ja)
AU (1) AU2015204953B2 (ja)
BR (1) BR112016015618A8 (ja)
CA (1) CA2935425C (ja)
MX (1) MX361790B (ja)
RU (1) RU2679979C1 (ja)
WO (1) WO2015105816A2 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US9774881B2 (en) 2014-01-08 2017-09-26 Microsoft Technology Licensing, Llc Representing motion vectors in an encoded bitstream
US9749642B2 (en) 2014-01-08 2017-08-29 Microsoft Technology Licensing, Llc Selection of motion vector precision
US9942560B2 (en) 2014-01-08 2018-04-10 Microsoft Technology Licensing, Llc Encoding screen capture data
KR102068828B1 (ko) * 2014-09-30 2020-01-22 에이치에프아이 이노베이션 인크. 비디오 코딩을 위한 적응적 모션 벡터 레졸루션 방법
CA2965720C (en) * 2014-11-20 2020-04-14 Hfi Innovation Inc. Method of motion vector and block vector resolution control
KR102349788B1 (ko) * 2015-01-13 2022-01-11 인텔렉추얼디스커버리 주식회사 영상의 부호화/복호화 방법 및 장치
GB2539213A (en) * 2015-06-08 2016-12-14 Canon Kk Schemes for handling an AMVP flag when implementing intra block copy coding mode
CN107925774A (zh) * 2015-08-24 2018-04-17 Lg 电子株式会社 基于间预测模式的图像处理方法及其装置
US10334224B2 (en) * 2016-02-19 2019-06-25 Alcacruz Inc. Systems and method for GPU based virtual reality video streaming server
WO2017156669A1 (en) 2016-03-14 2017-09-21 Mediatek Singapore Pte. Ltd. Methods for motion vector storage in video coding
US10362307B2 (en) * 2016-09-09 2019-07-23 Hanwha Techwin Co., Ltd. Quantization parameter determination method and image capture apparatus
US10841794B2 (en) * 2017-09-18 2020-11-17 Futurewei Technologies, Inc. Adaptive motion vector resolution
CN109756739B (zh) * 2017-11-07 2022-09-02 华为技术有限公司 图像预测方法和装置
US10638137B2 (en) * 2018-03-07 2020-04-28 Tencent America LLC Method and apparatus for video coding
WO2019194501A1 (ko) * 2018-04-01 2019-10-10 엘지전자 주식회사 움직임 벡터 리파인먼트에 기반한 영상 코딩 방법 및 그 장치
CN118175298A (zh) 2018-04-02 2024-06-11 Lg电子株式会社 图片解码方法、图片编码方法和发送方法
US11057617B2 (en) * 2018-08-03 2021-07-06 Tencent America LLC Method and apparatus for video coding
WO2020084475A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Utilization of refined motion vector
CN109413344B (zh) * 2018-10-26 2022-04-19 北京计算机技术及应用研究所 基于视频采集及编码技术的多分辨率屏幕操作状态监视装置
WO2020098647A1 (en) 2018-11-12 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Bandwidth control methods for affine prediction
CN113039790B (zh) 2018-11-17 2023-04-14 北京字节跳动网络技术有限公司 视频处理的方法、装置和非暂时性计算机可读介质
KR20210091161A (ko) 2018-11-20 2021-07-21 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 부분적 위치에 기반한 차분 계산
CN113196771B (zh) * 2018-12-21 2023-12-22 北京字节跳动网络技术有限公司 基于运动矢量精度的运动矢量范围
EP3868107A4 (en) 2018-12-21 2021-12-15 Beijing Bytedance Network Technology Co. Ltd. MOTION VECTOR ACCURACY IN INTERACTING WITH MOTION VECTOR DIFFERENCE MODE
CN115426494B (zh) * 2018-12-29 2024-05-17 华为技术有限公司 编码器,解码器和使用压缩mv存储的对应方法
WO2020177755A1 (en) 2019-03-06 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Usage of converted uni-prediction candidate
EP3713235B1 (en) * 2019-03-19 2023-08-02 Axis AB Methods and devices for encoding a video stream using a first and a second encoder
AU2020250609B2 (en) 2019-04-01 2023-09-07 Beijing Bytedance Network Technology Co., Ltd. Using interpolation filters for history based motion vector prediction
CN117395411A (zh) 2019-08-20 2024-01-12 北京字节跳动网络技术有限公司 用于视频处理的方法、装置以及计算机可读存储介质
JP7409802B2 (ja) * 2019-08-22 2024-01-09 シャープ株式会社 動画像復号装置および動画像符号化装置
WO2021036982A1 (en) * 2019-08-24 2021-03-04 Beijing Bytedance Network Technology Co., Ltd. Coded representation of history-based motion vector prediction tables
CN110636294B (zh) * 2019-09-27 2024-04-09 腾讯科技(深圳)有限公司 视频解码方法及装置,视频编码方法及装置
CN110650357B (zh) 2019-09-27 2023-02-10 腾讯科技(深圳)有限公司 视频解码方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003189312A (ja) * 2001-12-20 2003-07-04 Oki Electric Ind Co Ltd 動画像符号化装置及び動画像復号化装置
JP2013509020A (ja) * 2009-10-14 2013-03-07 トムソン ライセンシング 動き情報の適応型符号化方法及び装置
WO2013154673A1 (en) * 2012-04-11 2013-10-17 Motorola Mobility Llc Signaling of temporal motion vector predictor (mvp) flag for temporal prediction

Family Cites Families (228)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60158786A (ja) 1984-01-30 1985-08-20 Kokusai Denshin Denwa Co Ltd <Kdd> 画像動き量検出方式
US4661849A (en) 1985-06-03 1987-04-28 Pictel Corporation Method and apparatus for providing motion estimation signals for communicating image sequences
US4661853A (en) 1985-11-01 1987-04-28 Rca Corporation Interfield image motion detector for video signals
DE3854171T2 (de) 1987-06-09 1995-12-21 Sony Corp Bewertung von Bewegungsvektoren in Fernsehbildern.
EP0294958B1 (en) 1987-06-09 1995-08-23 Sony Corporation Motion compensated interpolation of digital television images
JP2712645B2 (ja) 1989-10-14 1998-02-16 ソニー株式会社 動きベクトル伝送方法及びその装置並びに動きベクトル復号化方法及びその装置
EP0715469B1 (en) 1989-10-14 2001-09-12 Sony Corporation Video signal coding/decoding method and apparatus
US5103306A (en) 1990-03-28 1992-04-07 Transitions Research Corporation Digital image compression employing a resolution gradient
KR950011200B1 (ko) 1990-10-31 1995-09-29 니뽕 빅터 가부시끼가이샤 인터레이스 동화상 신호의 압축 장치
DE69223925T2 (de) 1991-05-24 1998-06-18 British Broadcasting Corp Videobildverarbeitung
US5317397A (en) 1991-05-31 1994-05-31 Kabushiki Kaisha Toshiba Predictive coding using spatial-temporal filtering and plural motion vectors
US5467136A (en) 1991-05-31 1995-11-14 Kabushiki Kaisha Toshiba Video decoder for determining a motion vector from a scaled vector and a difference vector
JPH0541862A (ja) 1991-08-03 1993-02-19 Sony Corp 動きベクトルの可変長符号化方式
US5428396A (en) 1991-08-03 1995-06-27 Sony Corporation Variable length coding/decoding method for motion vectors
CA2079434A1 (en) 1991-09-30 1993-03-31 Derek Andrew Motion vector estimation, motion picture encoding and storage
JP2962012B2 (ja) 1991-11-08 1999-10-12 日本ビクター株式会社 動画像符号化装置及びその復号装置
GB2262854B (en) 1991-12-24 1995-05-24 Sony Broadcast & Communication Image processing apparatus
US6441842B1 (en) 1992-02-19 2002-08-27 8×8, Inc. Video compression/decompression processing and processors
US5594813A (en) 1992-02-19 1997-01-14 Integrated Information Technology, Inc. Programmable architecture and methods for motion estimation
US5436665A (en) * 1992-03-03 1995-07-25 Kabushiki Kaisha Toshiba Motion picture coding apparatus
US6226327B1 (en) 1992-06-29 2001-05-01 Sony Corporation Video coding method and apparatus which select between frame-based and field-based predictive modes
JPH0662386A (ja) * 1992-08-04 1994-03-04 G C Technol Kk 解像度変換復号方法と装置
JP3348310B2 (ja) 1992-09-28 2002-11-20 ソニー株式会社 動画像符号化方法および動画像符号化装置
JP3200196B2 (ja) 1992-10-15 2001-08-20 株式会社リコー 動きベクトル検出方法
ATE204691T1 (de) 1993-03-24 2001-09-15 Sony Corp Verfahren und vorrichtung zur kodierung/dekodierung von bewegungsvektoren, und verfahren und vorrichtung zur kodierung/dekodierung von bildsignalen
US5442400A (en) 1993-04-29 1995-08-15 Rca Thomson Licensing Corporation Error concealment apparatus for MPEG-like video data
JPH06343172A (ja) 1993-06-01 1994-12-13 Matsushita Electric Ind Co Ltd 動きベクトル検出方法及び動きベクトル符号化方法
US5477272A (en) 1993-07-22 1995-12-19 Gte Laboratories Incorporated Variable-block size multi-resolution motion estimation scheme for pyramid coding
CN1099723A (zh) 1993-08-31 1995-03-08 张智新 硫酸铵分解法
KR970003102B1 (ko) * 1993-09-17 1997-03-14 대우전자 주식회사 영상 복호기에서의 하프 픽셀 움직임 보상 회로
TW283289B (ja) 1994-04-11 1996-08-11 Gen Instrument Corp
US5594504A (en) 1994-07-06 1997-01-14 Lucent Technologies Inc. Predictive video coding using a motion vector updating routine
US5684538A (en) 1994-08-18 1997-11-04 Hitachi, Ltd. System and method for performing video coding/decoding using motion compensation
US6301299B1 (en) * 1994-10-28 2001-10-09 Matsushita Electric Industrial Co., Ltd. Memory controller for an ATSC video decoder
EP0710033A3 (en) 1994-10-28 1999-06-09 Matsushita Electric Industrial Co., Ltd. MPEG video decoder having a high bandwidth memory
US5623311A (en) 1994-10-28 1997-04-22 Matsushita Electric Corporation Of America MPEG video decoder having a high bandwidth memory
GB2301971B (en) 1995-06-06 1999-10-06 Sony Uk Ltd Video compression
GB2301972B (en) 1995-06-06 1999-10-20 Sony Uk Ltd Video compression
US6026182A (en) 1995-10-05 2000-02-15 Microsoft Corporation Feature segmentation
US5929940A (en) 1995-10-25 1999-07-27 U.S. Philips Corporation Method and device for estimating motion between images, system for encoding segmented images
US5991463A (en) 1995-11-08 1999-11-23 Genesis Microchip Inc. Source data interpolation method and apparatus
JP2798035B2 (ja) 1996-01-17 1998-09-17 日本電気株式会社 適応動きベクトル補間による動き補償フレーム間予測方法
US5787203A (en) 1996-01-19 1998-07-28 Microsoft Corporation Method and system for filtering compressed video images
US5799113A (en) 1996-01-19 1998-08-25 Microsoft Corporation Method for expanding contracted video images
US5692063A (en) 1996-01-19 1997-11-25 Microsoft Corporation Method and system for unrestricted motion estimation for video
US6957350B1 (en) 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
US5768537A (en) * 1996-02-22 1998-06-16 International Business Machines Corporation Scalable MPEG2 compliant video encoder
US5982438A (en) 1996-03-22 1999-11-09 Microsoft Corporation Overlapped motion compensation for object coding
US5847776A (en) 1996-06-24 1998-12-08 Vdonet Corporation Ltd. Method for entropy constrained motion estimation and coding of motion vectors with increased search range
US6233017B1 (en) 1996-09-16 2001-05-15 Microsoft Corporation Multimedia compression system with adaptive block sizes
US6130963A (en) 1996-11-22 2000-10-10 C-Cube Semiconductor Ii, Inc. Memory efficient decoding of video frame chroma
US6377628B1 (en) 1996-12-18 2002-04-23 Thomson Licensing S.A. System for maintaining datastream continuity in the presence of disrupted source data
US6330344B1 (en) * 1997-02-14 2001-12-11 Sony Corporation Image processing device and method employing motion detection to generate improved quality image from low resolution image
US6201927B1 (en) 1997-02-18 2001-03-13 Mary Lafuze Comer Trick play reproduction of MPEG encoded signals
US5991447A (en) 1997-03-07 1999-11-23 General Instrument Corporation Prediction and coding of bi-directionally predicted video object planes for interlaced digital video
US6005980A (en) 1997-03-07 1999-12-21 General Instrument Corporation Motion estimation and compensation of video object planes for interlaced digital video
US5844613A (en) 1997-03-17 1998-12-01 Microsoft Corporation Global motion estimator for motion video signal encoding
US6404813B1 (en) 1997-03-27 2002-06-11 At&T Corp. Bidirectionally predicted pictures or video object planes for efficient and flexible video coding
US6661470B1 (en) 1997-03-31 2003-12-09 Matsushita Electric Industrial Co., Ltd. Moving picture display method and apparatus
US5973755A (en) 1997-04-04 1999-10-26 Microsoft Corporation Video encoder and decoder using bilinear motion compensation and lapped orthogonal transforms
JP3129986B2 (ja) 1997-04-09 2001-01-31 日本車輌製造株式会社 杭施工機のトルク管理装置
US6067322A (en) 1997-06-04 2000-05-23 Microsoft Corporation Half pixel motion estimation in motion video signal encoding
US6574371B2 (en) 1997-06-09 2003-06-03 Hitachi, Ltd. Image decoding method
EP2285119B1 (en) 1997-06-09 2015-08-05 Hitachi, Ltd. Image decoding method
JPH1169345A (ja) 1997-06-11 1999-03-09 Fujitsu Ltd フレーム間予測動画像符号化装置及び復号装置並びにフレーム間予測動画像符号化方法及び復号方法
JP2897763B2 (ja) 1997-07-28 1999-05-31 日本ビクター株式会社 動き補償符号化装置、復号化装置、符号化方法及び復号化方法
US6310918B1 (en) 1997-07-31 2001-10-30 Lsi Logic Corporation System and method for motion vector extraction and computation meeting 2-frame store and letterboxing requirements
US6266091B1 (en) 1997-07-31 2001-07-24 Lsi Logic Corporation System and method for low delay mode operation video decoding
FR2766946B1 (fr) 1997-08-04 2000-08-11 Thomson Multimedia Sa Procede et dispositif de pretraitement pour estimation de mouvement
US6281942B1 (en) 1997-08-11 2001-08-28 Microsoft Corporation Spatial and temporal filtering mechanism for digital motion video signals
US6339656B1 (en) 1997-12-25 2002-01-15 Matsushita Electric Industrial Co., Ltd. Moving picture encoding decoding processing apparatus
US6122017A (en) 1998-01-22 2000-09-19 Hewlett-Packard Company Method for providing motion-compensated multi-field enhancement of still images from video
JP3856262B2 (ja) 1998-03-09 2006-12-13 日本ビクター株式会社 動き補償符号化装置、動き補償符号化方法、及び動き補償符号記録媒体
US6611624B1 (en) * 1998-03-13 2003-08-26 Cisco Systems, Inc. System and method for frame accurate splicing of compressed bitstreams
US6020934A (en) * 1998-03-23 2000-02-01 International Business Machines Corporation Motion estimation architecture for area and power reduction
US6195389B1 (en) * 1998-04-16 2001-02-27 Scientific-Atlanta, Inc. Motion estimation system and methods
JP3888597B2 (ja) 1998-06-24 2007-03-07 日本ビクター株式会社 動き補償符号化装置、及び動き補償符号化復号化方法
JP4026238B2 (ja) 1998-07-23 2007-12-26 ソニー株式会社 画像復号装置及び画像復号方法
US6219070B1 (en) 1998-09-30 2001-04-17 Webtv Networks, Inc. System and method for adjusting pixel parameters by subpixel positioning
US6466624B1 (en) * 1998-10-28 2002-10-15 Pixonics, Llc Video decoder with bit stream based enhancements
GB2343579A (en) 1998-11-07 2000-05-10 Ibm Hybrid-linear-bicubic interpolation method and apparatus
US6584154B1 (en) * 1998-11-26 2003-06-24 Oki Electric Industry Co., Ltd. Moving-picture coding and decoding method and apparatus with reduced computational cost
US6418166B1 (en) 1998-11-30 2002-07-09 Microsoft Corporation Motion estimation and block matching pattern
US6983018B1 (en) 1998-11-30 2006-01-03 Microsoft Corporation Efficient motion vector coding for video compression
US6496608B1 (en) 1999-01-15 2002-12-17 Picsurf, Inc. Image data interpolation system and method
US6259741B1 (en) 1999-02-18 2001-07-10 General Instrument Corporation Method of architecture for converting MPEG-2 4:2:2-profile bitstreams into main-profile bitstreams
US6320593B1 (en) 1999-04-20 2001-11-20 Agilent Technologies, Inc. Method of fast bi-cubic interpolation of image information
JP2000308064A (ja) 1999-04-22 2000-11-02 Mitsubishi Electric Corp 動きベクトル検出装置
EP1050850A1 (en) * 1999-05-03 2000-11-08 THOMSON multimedia Process for estimating a dominant motion between two frames
US6968008B1 (en) 1999-07-27 2005-11-22 Sharp Laboratories Of America, Inc. Methods for motion estimation with adaptive motion accuracy
US6556624B1 (en) * 1999-07-27 2003-04-29 At&T Corp. Method and apparatus for accomplishing multiple description coding for video
US6647061B1 (en) 2000-06-09 2003-11-11 General Instrument Corporation Video size conversion and transcoding from MPEG-2 to MPEG-4
US7206453B2 (en) 2001-05-03 2007-04-17 Microsoft Corporation Dynamic filtering for lossy compression
US7266150B2 (en) * 2001-07-11 2007-09-04 Dolby Laboratories, Inc. Interpolation of video compression frames
US6950469B2 (en) 2001-09-17 2005-09-27 Nokia Corporation Method for sub-pixel value interpolation
US20030095603A1 (en) 2001-11-16 2003-05-22 Koninklijke Philips Electronics N.V. Reduced-complexity video decoding using larger pixel-grid motion compensation
GB2382940A (en) * 2001-11-27 2003-06-11 Nokia Corp Encoding objects and background blocks
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
JP2005513925A (ja) * 2001-12-20 2005-05-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化及び復号化方法及び装置
KR100924850B1 (ko) 2002-01-24 2009-11-02 가부시키가이샤 히타치세이사쿠쇼 동화상 신호의 부호화 방법 및 복호화 방법
US7003035B2 (en) 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US7620109B2 (en) * 2002-04-10 2009-11-17 Microsoft Corporation Sub-pixel interpolation in motion estimation and compensation
US7116831B2 (en) 2002-04-10 2006-10-03 Microsoft Corporation Chrominance motion vector rounding
US7305034B2 (en) 2002-04-10 2007-12-04 Microsoft Corporation Rounding control for multi-stage interpolation
US7110459B2 (en) 2002-04-10 2006-09-19 Microsoft Corporation Approximate bicubic filter
US7277587B2 (en) 2002-04-26 2007-10-02 Sharp Laboratories Of America, Inc. System and method for lossless video coding
US7224731B2 (en) * 2002-06-28 2007-05-29 Microsoft Corporation Motion estimation/compensation for screen capture video
US7016547B1 (en) * 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
US6980695B2 (en) 2002-06-28 2005-12-27 Microsoft Corporation Rate allocation for mixed content video
MXPA05000559A (es) * 2002-07-15 2005-04-19 Nokia Corp Metodo para ocultamiento de errores en secuencias de video.
JP4724351B2 (ja) * 2002-07-15 2011-07-13 三菱電機株式会社 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および通信装置
US7072512B2 (en) 2002-07-23 2006-07-04 Microsoft Corporation Segmentation of digital video and images into continuous tone and palettized regions
US8824553B2 (en) 2003-05-12 2014-09-02 Google Inc. Video compression method
WO2004114063A2 (en) * 2003-06-13 2004-12-29 Georgia Tech Research Corporation Data reconstruction using directional interpolation techniques
US20050013498A1 (en) 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information
US7738554B2 (en) 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
US7609763B2 (en) * 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
EP1536647A1 (en) 2003-11-26 2005-06-01 STMicroelectronics Limited A video decoding device
KR100631777B1 (ko) 2004-03-31 2006-10-12 삼성전자주식회사 다 계층의 모션 벡터를 효율적으로 압축하는 방법 및 장치
KR100586882B1 (ko) 2004-04-13 2006-06-08 삼성전자주식회사 모션 스케일러빌리티를 지원하는 코딩 방법 및 장치
US8130825B2 (en) * 2004-05-10 2012-03-06 Nvidia Corporation Processor for video data encoding/decoding
KR100678949B1 (ko) * 2004-07-15 2007-02-06 삼성전자주식회사 비디오 코딩 및 디코딩 방법, 비디오 인코더 및 디코더
US7558428B2 (en) 2004-09-13 2009-07-07 Microsoft Corporation Accelerated video encoding using a graphics processing unit
JP4241588B2 (ja) 2004-11-30 2009-03-18 日本ビクター株式会社 動画像符号化装置、及び動画像復号化装置
JP4216796B2 (ja) 2004-12-15 2009-01-28 日本電信電話株式会社 動きベクトル探索方法,動きベクトル探索装置,動きベクトル探索プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
WO2006096612A2 (en) * 2005-03-04 2006-09-14 The Trustees Of Columbia University In The City Of New York System and method for motion estimation and mode decision for low-complexity h.264 decoder
WO2006112272A1 (ja) * 2005-04-13 2006-10-26 Ntt Docomo, Inc. 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、および動画像復号プログラム
KR100703778B1 (ko) * 2005-04-29 2007-04-06 삼성전자주식회사 고속 fgs를 지원하는 비디오 코딩 방법 및 장치
US20070121728A1 (en) 2005-05-12 2007-05-31 Kylintv, Inc. Codec for IPTV
US20070025442A1 (en) 2005-07-28 2007-02-01 Sanyo Electric Co., Ltd. Coding method for coding moving images
US8761259B2 (en) 2005-09-22 2014-06-24 Qualcomm Incorporated Multi-dimensional neighboring block prediction for video encoding
GB0600141D0 (en) * 2006-01-05 2006-02-15 British Broadcasting Corp Scalable coding of video signals
US7956930B2 (en) * 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US7929599B2 (en) 2006-02-24 2011-04-19 Microsoft Corporation Accelerated video encoding
US8130828B2 (en) 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US8155195B2 (en) 2006-04-07 2012-04-10 Microsoft Corporation Switching distortion metrics during motion estimation
US7965767B2 (en) 2006-06-30 2011-06-21 Intel Corporation Two-dimensional filtering architecture
US9014280B2 (en) * 2006-10-13 2015-04-21 Qualcomm Incorporated Video coding with adaptive filtering for motion compensated prediction
US9445128B2 (en) * 2006-12-08 2016-09-13 Freescale Semiconductor, Inc. System and method of determining deblocking control flag of scalable video system for indicating presentation of deblocking parameters for multiple layers
EP2132941B1 (en) * 2007-04-09 2017-05-17 Nokia Technologies Oy High accuracy motion vectors for video coding with low encoder and decoder complexity
US8861591B2 (en) 2007-05-11 2014-10-14 Advanced Micro Devices, Inc. Software video encoder with GPU acceleration
US9648325B2 (en) 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
SG152082A1 (en) 2007-10-19 2009-05-29 Creative Tech Ltd A method and system for processing a composite video image
US8582652B2 (en) * 2007-10-30 2013-11-12 General Instrument Corporation Method and apparatus for selecting a coding mode
US20090141808A1 (en) * 2007-11-30 2009-06-04 Yiufai Wong System and methods for improved video decoding
US8279936B1 (en) 2007-12-11 2012-10-02 Marvell International Ltd. Method and apparatus for fractional pixel expansion and motion vector selection in a video codec
US20090168871A1 (en) * 2007-12-31 2009-07-02 Ning Lu Video motion estimation
US20110032991A1 (en) 2008-01-09 2011-02-10 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, and image decoding method
KR101431543B1 (ko) * 2008-01-21 2014-08-21 삼성전자주식회사 영상 부호화/복호화 장치 및 방법
US9584710B2 (en) 2008-02-28 2017-02-28 Avigilon Analytics Corporation Intelligent high resolution video system
JP2009230537A (ja) 2008-03-24 2009-10-08 Olympus Corp 画像処理装置、画像処理プログラム、画像処理方法、および、電子機器
US8266665B2 (en) 2008-03-25 2012-09-11 Verizon Patent And Licensing Inc. TV screen capture
US20090245374A1 (en) 2008-03-26 2009-10-01 Mediatek Inc. Video encoder and motion estimation method
US20090257499A1 (en) 2008-04-10 2009-10-15 Qualcomm Incorporated Advanced interpolation techniques for motion compensation in video coding
US8831086B2 (en) 2008-04-10 2014-09-09 Qualcomm Incorporated Prediction techniques for interpolation in video coding
US20090262801A1 (en) 2008-04-17 2009-10-22 Qualcomm Incorporated Dead zone parameter selections for rate control in video coding
JP2010016453A (ja) 2008-07-01 2010-01-21 Sony Corp 画像符号化装置および方法、画像復号装置および方法、並びにプログラム
JP5240530B2 (ja) * 2008-10-02 2013-07-17 ソニー株式会社 画像処理装置および方法
US9078007B2 (en) 2008-10-03 2015-07-07 Qualcomm Incorporated Digital video coding with interpolation filters and offsets
WO2010043806A2 (fr) 2008-10-14 2010-04-22 France Telecom Codage et decodage avec elimination d'un ou plusieurs predicteurs predetermines
TWI428022B (zh) * 2008-10-24 2014-02-21 Nat Univ Chung Cheng Video control method for instant video encoding chips
DE102008064280A1 (de) 2008-12-20 2010-06-24 Bayer Technology Services Gmbh Verfahren zur Herstellung von Bis(Para-Aminocyclohexyl)Methan
US8428145B2 (en) 2008-12-31 2013-04-23 Entropic Communications, Inc. System and method for providing fast trick modes
US9472167B2 (en) 2009-04-17 2016-10-18 International Business Machines Corporation Video capture through hardware
US8346915B2 (en) 2009-05-04 2013-01-01 Qualcomm Incorporated System and method of recording and sharing mobile application activities
US8498493B1 (en) 2009-06-02 2013-07-30 Imagination Technologies Limited Directional cross hair search system and method for determining a preferred motion vector
BRPI1012928A2 (pt) * 2009-06-09 2018-01-30 Sony Corp aparelho e método de processamento de imagem.
JP2010288110A (ja) * 2009-06-12 2010-12-24 Sony Corp 画像処理装置および画像処理方法
SI3448031T1 (sl) 2009-06-18 2021-03-31 Kabushiki Kaisha Toshiba Naprava za video dekodiranje in postopek za video dekodiranje
JP5353532B2 (ja) 2009-07-29 2013-11-27 ソニー株式会社 画像処理装置及び画像処理方法
US20110255589A1 (en) 2009-08-03 2011-10-20 Droplet Technology, Inc. Methods of compressing data and methods of assessing the same
JP2011041037A (ja) * 2009-08-12 2011-02-24 Sony Corp 画像処理装置および方法
KR20110017302A (ko) 2009-08-13 2011-02-21 삼성전자주식회사 움직임 벡터의 정확도 조절을 이용한 영상 부호화, 복호화 방법 및 장치
EP2302588B1 (en) * 2009-08-21 2012-02-29 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for estimation of interframe motion fields
WO2011021915A2 (ko) 2009-08-21 2011-02-24 에스케이텔레콤 주식회사 적응적 움직임 벡터 해상도를 이용한 영상 부호화/복호화 방법 및 장치
KR101441874B1 (ko) * 2009-08-21 2014-09-25 에스케이텔레콤 주식회사 적응적 움직임 벡터 해상도를 이용한 영상 부호화/복호화 방법 및 장치
KR101678968B1 (ko) * 2009-08-21 2016-11-25 에스케이텔레콤 주식회사 참조 픽처 보간 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
US8411750B2 (en) * 2009-10-30 2013-04-02 Qualcomm Incorporated Global motion parameter estimation using block-based motion vectors
US20110176611A1 (en) * 2010-01-15 2011-07-21 Yu-Wen Huang Methods for decoder-side motion vector derivation
EP2362655B1 (en) * 2010-02-10 2013-07-17 Telefonaktiebolaget L M Ericsson (Publ) Motion-vector estimation
US20110200108A1 (en) 2010-02-18 2011-08-18 Qualcomm Incorporated Chrominance high precision motion filtering for motion interpolation
US9313526B2 (en) * 2010-02-19 2016-04-12 Skype Data compression for video
US9237355B2 (en) 2010-02-19 2016-01-12 Qualcomm Incorporated Adaptive motion resolution for video coding
US9100661B2 (en) * 2010-04-05 2015-08-04 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using dynamic-range transformation, and method and apparatus for decoding video by using dynamic-range transformation
EP2590407A4 (en) 2010-06-04 2017-05-10 Nec Corporation Communication system, method, and device
US20120008686A1 (en) 2010-07-06 2012-01-12 Apple Inc. Motion compensation using vector quantized interpolation filters
JP5563403B2 (ja) 2010-08-12 2014-07-30 日本電信電話株式会社 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置およびそれらのプログラム
RU2010135495A (ru) * 2010-08-24 2012-02-27 ЭлЭсАй Корпорейшн (US) Видеотранскодер с гибким управлением качеством и сложностью
US20120051431A1 (en) * 2010-08-25 2012-03-01 Qualcomm Incorporated Motion direction based adaptive motion vector resolution signaling for video coding
JP5855570B2 (ja) 2010-09-30 2016-02-09 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、プログラムおよび集積回路
US10327008B2 (en) * 2010-10-13 2019-06-18 Qualcomm Incorporated Adaptive motion vector resolution signaling for video coding
US10045046B2 (en) * 2010-12-10 2018-08-07 Qualcomm Incorporated Adaptive support for interpolating values of sub-pixels for video coding
JP2012126040A (ja) 2010-12-16 2012-07-05 Ricoh Co Ltd 画像形成装置
US9215473B2 (en) 2011-01-26 2015-12-15 Qualcomm Incorporated Sub-slices in video coding
US9001883B2 (en) * 2011-02-16 2015-04-07 Mediatek Inc Method and apparatus for slice common information sharing
TWI466550B (zh) * 2011-02-23 2014-12-21 Novatek Microelectronics Corp 多媒體裝置及其移動偵測方法
US9271005B2 (en) 2011-02-24 2016-02-23 Vixs Systems, Inc. Multi-pass video encoder and methods for use therewith
WO2012120863A1 (ja) 2011-03-08 2012-09-13 パナソニック株式会社 動画像符号化方法および動画像復号方法
US20120236115A1 (en) * 2011-03-14 2012-09-20 Qualcomm Incorporated Post-filtering in full resolution frame-compatible stereoscopic video coding
US8780996B2 (en) 2011-04-07 2014-07-15 Google, Inc. System and method for encoding and decoding video data
JP2012231301A (ja) 2011-04-26 2012-11-22 Sony Corp 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体
WO2013002716A2 (en) 2011-06-30 2013-01-03 Telefonaktiebolaget L M Ericsson (Publ) A method a decoder and encoder for processing a motion vector
US10536701B2 (en) 2011-07-01 2020-01-14 Qualcomm Incorporated Video coding using adaptive motion vector resolution
US9277228B2 (en) * 2011-07-18 2016-03-01 Qualcomm Incorporated Adaptation parameter sets for video coding
US9521418B2 (en) * 2011-07-22 2016-12-13 Qualcomm Incorporated Slice header three-dimensional video extension for slice header prediction
US9288505B2 (en) * 2011-08-11 2016-03-15 Qualcomm Incorporated Three-dimensional video with asymmetric spatial resolution
US20130229485A1 (en) * 2011-08-30 2013-09-05 Nokia Corporation Apparatus, a Method and a Computer Program for Video Coding and Decoding
CN102946534A (zh) 2011-09-02 2013-02-27 斯凯普公司 视频编码
CN102946533B (zh) * 2011-09-02 2016-08-17 斯凯普公司 视频编码
RU2487489C2 (ru) 2011-10-18 2013-07-10 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "МИЭТ" Способ поиска векторов перемещений в динамических изображениях
MX340433B (es) * 2011-12-16 2016-07-08 Panasonic Ip Corp America Metodo de codificacion de imagenes de video, dispositivo de codificacion de imagenes de video, metodo de decodificacion de imagenes de video, dispositivo de decodificacion de imagenes de video y dispositivo de codificacion/decodificacion de imagenes de video.
US9451252B2 (en) * 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
US9538200B2 (en) * 2012-01-19 2017-01-03 Qualcomm Incorporated Signaling of deblocking filter parameters in video coding
US20130188717A1 (en) * 2012-01-20 2013-07-25 Qualcomm Incorporated Motion prediction in svc using partition mode without split flag
US9215266B2 (en) 2012-01-26 2015-12-15 Zoom International S.R.O. System and method for zero-footprint screen capture
US9363512B2 (en) * 2012-03-08 2016-06-07 Blackberry Limited Motion vector sign bit hiding
US20130287109A1 (en) * 2012-04-29 2013-10-31 Qualcomm Incorporated Inter-layer prediction through texture segmentation for video coding
US20130294513A1 (en) * 2012-05-07 2013-11-07 Qualcomm Incorporated Inter layer merge list construction for video coding
CN102740073B (zh) 2012-05-30 2015-06-17 华为技术有限公司 一种编码方法及装置
US9253487B2 (en) * 2012-05-31 2016-02-02 Qualcomm Incorporated Reference index for enhancement layer in scalable video coding
US9584805B2 (en) * 2012-06-08 2017-02-28 Qualcomm Incorporated Prediction mode information downsampling in enhanced layer coding
US9219913B2 (en) * 2012-06-13 2015-12-22 Qualcomm Incorporated Inferred base layer block for TEXTURE—BL mode in HEVC based single loop scalable video coding
US9258562B2 (en) * 2012-06-13 2016-02-09 Qualcomm Incorporated Derivation of depth map estimate
US9338452B2 (en) 2012-07-09 2016-05-10 Qualcomm Incorporated Motion vector difference coding extension for enhancement layer
US9674519B2 (en) * 2012-11-09 2017-06-06 Qualcomm Incorporated MPEG frame compatible video coding
US9774881B2 (en) 2014-01-08 2017-09-26 Microsoft Technology Licensing, Llc Representing motion vectors in an encoded bitstream
US9749642B2 (en) 2014-01-08 2017-08-29 Microsoft Technology Licensing, Llc Selection of motion vector precision
US9942560B2 (en) 2014-01-08 2018-04-10 Microsoft Technology Licensing, Llc Encoding screen capture data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003189312A (ja) * 2001-12-20 2003-07-04 Oki Electric Ind Co Ltd 動画像符号化装置及び動画像復号化装置
JP2013509020A (ja) * 2009-10-14 2013-03-07 トムソン ライセンシング 動き情報の適応型符号化方法及び装置
WO2013154673A1 (en) * 2012-04-11 2013-10-17 Motorola Mobility Llc Signaling of temporal motion vector predictor (mvp) flag for temporal prediction

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHOU, YOU ET AL.: "Motion Vector Resolution Control for Screen Content Coding", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JCTVC-P0277 (version 1), JPN6020039189, 9 January 2014 (2014-01-09), pages 1 - 5, ISSN: 0004920988 *

Also Published As

Publication number Publication date
CN105900425A (zh) 2016-08-24
BR112016015618A8 (pt) 2020-06-02
MX2016008974A (es) 2016-10-04
US20150195527A1 (en) 2015-07-09
CA2935425C (en) 2021-11-23
US9774881B2 (en) 2017-09-26
KR20210118986A (ko) 2021-10-01
AU2015204953A1 (en) 2016-07-21
KR102427065B1 (ko) 2022-07-28
KR102306845B1 (ko) 2021-09-30
US20200169750A1 (en) 2020-05-28
BR112016015618A2 (ja) 2017-08-08
JP6588441B2 (ja) 2019-10-09
CN110460861A (zh) 2019-11-15
KR20160106127A (ko) 2016-09-09
CN110460861B (zh) 2022-11-18
CN105900425B (zh) 2019-10-01
JP2017508349A (ja) 2017-03-23
JP2020022170A (ja) 2020-02-06
AU2015204953B2 (en) 2018-11-01
US10587891B2 (en) 2020-03-10
CA2935425A1 (en) 2015-07-16
US20180109806A1 (en) 2018-04-19
WO2015105816A3 (en) 2016-04-28
KR20220104075A (ko) 2022-07-25
EP4192014A1 (en) 2023-06-07
US11546629B2 (en) 2023-01-03
EP3075156A2 (en) 2016-10-05
KR102523311B1 (ko) 2023-04-18
MX361790B (es) 2018-12-17
RU2679979C1 (ru) 2019-02-14
WO2015105816A2 (en) 2015-07-16
US20230086944A1 (en) 2023-03-23

Similar Documents

Publication Publication Date Title
JP2022017234A (ja) 符号化ビットストリームにおける動きベクトルの提示
KR102271780B1 (ko) 화면 콘텐츠 데이터의 비디오 인코딩
TWI705698B (zh) 適應性跨組件殘差預測
EP2681914B1 (en) Quantized pulse code modulation in video coding
WO2016057782A1 (en) Boundary filtering and cross-component prediction in video coding
JP2022548825A (ja) 映像処理における量子化パラメータのシグナリング
WO2020262408A1 (ja) イントラ予測装置、画像復号装置、及びプログラム
JP2013017085A (ja) 画像符号化装置及び画像符号化方法
BR122022001655B1 (pt) Método, dispositivo de memória legível por computador e sistema de codificador

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230620