JP7476631B2 - 画像コーディング方法及び装置並びに画像デコーディング方法及び装置 - Google Patents
画像コーディング方法及び装置並びに画像デコーディング方法及び装置 Download PDFInfo
- Publication number
- JP7476631B2 JP7476631B2 JP2020068869A JP2020068869A JP7476631B2 JP 7476631 B2 JP7476631 B2 JP 7476631B2 JP 2020068869 A JP2020068869 A JP 2020068869A JP 2020068869 A JP2020068869 A JP 2020068869A JP 7476631 B2 JP7476631 B2 JP 7476631B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- feature map
- probability
- coded
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title description 86
- 238000013527 convolutional neural network Methods 0.000 claims description 52
- 238000007781 pre-processing Methods 0.000 claims description 46
- 238000000605 extraction Methods 0.000 claims description 18
- 238000010586 diagram Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004904 shortening Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/94—Vector quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
Description
畳み込みニューラルネットワークを用いて、処理待ちの画像データに対して特徴抽出を行い、前記画像データの特徴マップを生成し;
前記特徴マップに対して量子化を行い、離散的な特徴マップを生成し;
前記離散的な特徴マップに対して前処理を行い、前処理データを生成し、前記前処理データのデータ量が前記離散的な特徴マップのデータ量よりも小さく;
前記前処理データに基づいて前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算し;及び
前記コーディング待ちデータの確率に基づいて前記コーディング待ちデータに対してエントロピーコーディングを行うことを含む。
デコーディング済みデータに対して前処理を行い、前処理データを生成し、前記前処理データのデータ量が前記デコーディング済みデータのデータ量よりも小さく;
前記前処理データに基づいて現在のデコーディング待ちデータの確率を計算し;
前記確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し;及び
前記特徴マップに対して再構成を行い、画像データを生成することを含む。
畳み込みニューラルネットワークを用いて、処理待ちの画像データに対して特徴抽出を行い、前記画像データの特徴マップを生成し;
前記特徴マップに対して量子化を行い、離散的な特徴マップを生成し;
前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算し;
フラッグデータを生成し、前記フラッグデータが、前記離散的な特徴マップにおける各チャネルデータがすべてゼロであるかを指示するために用いられ;及び
前記フラッグデータ及び前記コーディング待ちデータの確率に基づいて、前記コーディング待ちデータに対してエントロピーコーディングを行うことを含む。
現在のデコーディング待ちデータの確率を推定し;
フラッグデータ及び前記デコーディング待ちデータの確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し、そのうち、前記フラッグデータが、前記特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられ;及び
前記特徴マップに対して再構成を行い、画像データを生成することを含む。
畳み込みニューラルネットワークコーダであって、畳み込みニューラルネットワークを用いて、処理待ちの画像データに対して特徴抽出を行い、前記画像データの特徴マップを生成するもの;
量子化器であって、前記特徴マップに対して量子化を行い、離散的な特徴マップを生成するもの;
前処理器であって、前記離散的な特徴マップに対して前処理を行い、前処理データを生成し、前記前処理データのデータ量が前記離散的な特徴マップのデータ量よりも小さいもの;
確率推定器であって、前記前処理データに基づいて前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算するもの;及び
エントロピーコーダであって、前記コーディング待ちデータの確率に基づいて前記コーディング待ちデータに対してエントロピーコーディングを行うものを含む。
前処理器であって、デコーディング済みデータに対して前処理を行い、前処理データを生成し、前記前処理データのデータ量が前記デコーディング済みデータのデータ量よりも小さいもの;
確率推定器であって、前記前処理データに基づいて現在のデコーディング待ちデータの確率を計算するもの;
エントロピーデコーダであって、前記確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得するもの;及び
畳み込みニューラルネットワークデコーダであって、前記特徴マップに対して再構成を行い、画像データを生成するものを含む。
畳み込みニューラルネットワークコーダであって、畳み込みニューラルネットワークを用いて、処理待ちの画像データに対して特徴抽出を行い、前記画像データの特徴マップを生成するもの;
量子化器であって、前記特徴マップに対して量子化を行い、離散的な特徴マップを生成するもの;
確率推定器であって、前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算するもの;
フラッグデータ生成器であって、フラッグデータを生成し、前記フラッグデータが、前記離散的な特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられるもの;及び
エントロピーコーダであって、前記フラッグデータ及び前記コーディング待ちデータの確率に基づいて前記コーディング待ちデータに対してエントロピーコーディングを行うものを含む。
確率推定器であって、現在のデコーディング待ちデータの確率を推定するもの;
エントロピーデコーダであって、フラッグデータ及び前記デコーディング待ちデータの確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し、そのうち、前記フラッグデータが、前記特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられるもの;及び
畳み込みニューラルネットワークデコーダであって、前記特徴マップに対して再構成を行い、画像データを生成するものを含む。
本発明の実施例は、画像コーディング方法を提供し、図1は、本発明の実施例における画像コーディング方法のフローチャートであり、図1に示すように、該方法は、以下のステップを含む。
102:特徴マップに対して量子化を行い、離散的な特徴マップを生成し;
103:離散的な特徴マップに対して前処理を行い、前処理データを生成し、該前処理データのデータ量が離散的な特徴マップのデータ量よりも小さく;
104:前処理データに基づいて離散的な特徴マップにおけるコーディング待ちデータの確率を計算し;
105:コーディング待ちデータの確率に基づいてコーディング待ちデータに対してエントロピーコーディングを行う。
(外1)
は、推定されるコーディング待ちデータの確率であり、
(外2)
は、データ
(外3)
のその前のデータ
(外4)
に対しての条件付き確率であり、mは、その前のデータの個数であり、それは、マスク畳み込み層のスケールと関係があり、例えば、マスク畳み込み層のスケールが3*3であるときに、m=4であり、マスク畳み込み層のスケールが5*5であるときに、m=12であり、マスク畳み込み層のスケールが7*7であるときに、m=24である。
402 :特徴マップに対して量子化を行い、離散的な特徴マップを生成し;
403:離散的な特徴マップに対して前処理を行い、前処理データを生成し、前処理データのデータ量が離散的な特徴マップのデータ量よりも小さく;
404:フラッグデータを生成し、フラッグデータが、離散的な特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられ;
405:前処理データに基づいて離散的な特徴マップにおけるコーディング待ちデータの確率を計算し;
406:フラッグデータ及びコーディング待ちデータの確率に基づいて、離散的な特徴マップにおけるコーディング待ちデータに対してエントロピーコーディングを行う。
(外5)
(即ち、コーディング待ちデータ)を取得し;該離散的な潜在表現
(外6)
が前処理器を経て、離散的な潜在表現
(外7)
における、現在のコーディング待ちデータを中心とする7*7の範囲内のデータが選択され、選択されたデータが前処理データ
(外8)
とされ;該前処理データ
(外9)
がそれぞれ3*3の畳み込みカーネル、5*5の畳み込みカーネル及び7*7の畳み込みカーネルを経て、畳み込み運算後の結果c1、c2及びc3が取得され;階層的先験モデルが潜在表現yに基づいて結果c4を生成し;畳み込み運算後の結果c1、c2、c3及びc4に基づいて、エントロピーパラメータモジュールにより、コーディング待ちデータの確率モデルを計算し、ガウス分布を例とすると、確率モデルは、ガウス分布の平均値μ及び標準偏差σを含み、これにより、コーディング待ちデータの確率
(外10)
を取得し;フラッグデータ生成器により、離散的な潜在表現
(外11)
が各チャネル上ですべてゼロであるかを指示するためのフラッグデータflagを生成し、そして、算術コーダが確率
(外12)
及びフラッグデータflagに基づいて、離散的な潜在表現
(外13)
に対してエントロピーコーディングを行い、画像データを表すコードストリームb1を生成する。
本発明の実施例は、画像デコーディング方法を提供し、図6は、本発明の実施例における画像デコーディング方法のフローチャートである。図6に示すように、該方法は、以下のステップを含む。
602:前処理データに基づいて、現在のデコーディング待ちデータの確率を計算し;
603:確率に基づいてデコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し;
604:畳み込みニューラルネットワークを用いて、特徴マップを再構成し、画像データを生成する。
702:前処理データに基づいて、現在のデコーディング待ちデータの確率を計算し;
703:フラッグデータ及びデコーディング待ちデータの確率に基づいて、デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し、そのうち、フラッグデータが、特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられ;
704:畳み込みニューラルネットワークを用いて、特徴マップを再構成し、画像データを生成する。
(外14)
(即ち、特徴マップ)を取得し、その後、畳み込みニューラルネットワークデコーダにより、潜在表現
(外15)
に対してデコーディングを行い、画像データを再構成する。
(外16)
の確率、及び、現在の処理の特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するためのフラッグデータflagを使用する必要があり、そのうち、該確率は、次のような方式で計算されても良く、即ち、離散的な潜在表現
(外17)
が前処理器を経て、離散的な潜在表現
(外18)
における、現在のデコーディング待ちデータを中心とする7*7の範囲内のデータが選択され、選択されたデータが前処理データ
(外19)
とされ;該前処理データ
(外20)
がそれぞれ3*3の畳み込みカーネル、5*5の畳み込みカーネル及び7*7の畳み込みカーネルを経て、畳み込み運算後の結果c1、c2及びc3が取得され;階層的先験モデルが生成結果c4を計算し;畳み込み運算後の結果c1、c2、c3及びc4に基づいて、エントロピーパラメータモジュールにより、デコーディング待ちデータの確率モデルを計算し、ガウス分布を例とすれば、確率モデルは、ガウス分布の平均値μ及び標準偏差σを含み、これにより、コーディング待ちデータの確率
(外21)
を取得し;算術デコーダが確率
(外22)
及びフラッグデータflagに基づいて、コードストリームb1に対してエントロピーデコーディングを行い、潜在表現
(外23)
(特徴マップ)を生成し、そして、畳み込みニューラルネットワークデコーダにより、潜在表現
(外24)
に対してデコーディングを行い、画像データを再構成する。
本発明の実施例は、画像コーディング方法を提供し、図9は、本発明の実施例における画像コーディング方法のフローチャートであり、図9に示すように、該方法は、以下のステップを含む。
902:特徴マップに対して量子化を行い、離散的な特徴マップを生成し;
903:前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算し;
904:フラッグデータを生成し、フラッグデータが、離散的な特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられ;
905:フラッグデータ及びコーディング待ちデータの確率に基づいてコーディング待ちデータに対してエントロピーコーディングを行う。
本発明の実施例は、画像デコーディング方法を提供し、図10は、本発明の実施例における画像デコーディング方法のフローチャートであり、図10に示すように、該方法は、以下のステップを含む。
1002:フラッグデータ及びデコーディング待ちデータの確率に基づいてデコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し、そのうち、フラッグデータが、特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられ;
1003:畳み込みニューラルネットワークを用いて特徴マップを再構成し、画像データを生成する。
本発明の実施例は、画像コーディング装置を提供する。該装置が問題を解決する原理が第一側面の実施例における方法に類似したので、その具体的な実施は、第一側面の実施例における方法の実施を参照することができ、内容が同じである重複説明は、省略される。
量子化器1102:特徴マップに対して量子化を行い、離散的な特徴マップを生成し;
前処理器1103:離散的な特徴マップに対して前処理を行い、前処理データを生成し、前処理データのデータ量が離散的な特徴マップのデータ量よりも小さく;
確率推定器1104:前処理データに基づいて離散的な特徴マップにおけるコーディング待ちデータの確率を計算し;
エントロピーコーダ1105:コーディング待ちデータの確率に基づいてコーディング待ちデータに対してエントロピーコーディングを行う。
本発明の実施例は、画像デコーディング装置を提供する。該装置が問題を解決する原理が第二側面の実施例における方法に類似したので、その具体的な実施は、第二側面の実施例における方法の実施を参照することができ、内容が同じである重複説明は、省略される。
確率推定器1202:前処理データに基づいて、現在のデコーディング待ちデータの確率を計算し;
エントロピーデコーダ1203:確率に基づいてデコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し;
畳み込みニューラルネットワークデコーダ1204:特徴マップに対して再構成を行い、画像データを生成する。
本発明の実施例は、画像コーディング装置を提供する。該装置が問題を解決する原理が第三側面の実施例における方法に類似したから、その具体的な実施は、第三側面の実施例における方法の実施を参照することができ、内容が同じである重複説明は、省略される。
量子化器1302:特徴マップに対して量子化を行い、離散的な特徴マップを生成し;
確率推定器1303:離散的な特徴マップにおけるコーディング待ちデータの確率を計算し;
フラッグデータ生成器1304:フラッグデータを生成し、フラッグデータは、離散的な特徴マップにおける或るチャネルのデータがすべてゼロであるかを指示するために用いられ;
エントロピーコーダ1305:フラッグデータ及びコーディング待ちデータの確率に基づいてコーディング待ちデータに対してエントロピーコーディングを行う。
本発明の実施例は、画像デコーディング装置を提供する。該装置が問題を解決する原理が第四側面の実施例における方法に類似したので、その具体的な実施は、第四側面の実施例における方法の実施を参照することができ、内容が同じである重複説明は、省略される。
エントロピーデコーダ1402:フラッグデータ及びデコーディング待ちデータの確率に基づいてデコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し、そのうち、フラッグデータは、特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられ;
畳み込みニューラルネットワークデコーダ1403:特徴マップに対して再構成を行い、画像データを生成する。
本発明の実施例は、さらに、電子機器を提供し、それは、第五側面の実施例に記載の画像コーディング装置を含み、又は、第六側面の実施例に記載の画像デコーディング装置を含み、又は、第七側面の実施例に記載の画像コーディング装置を含み、又は、第八側面の実施例に記載の画像デコーディング装置を含み、それらの内容がここに合併される。該電子機器は、例えば、コンピュータ、サーバー、ワークステーション、ラップトップコンピュータ、スマートフォンなどであっても良いが、本発明の実施例は、これに限られない。
画像コーディング方法であって、
畳み込みニューラルネットワークを用いて、処理待ちの画像データに対して特徴抽出を行い、前記画像データの特徴マップを生成し;
前記特徴マップに対して量子化を行い、離散的な特徴マップを生成し;
前記離散的な特徴マップに対して前処理を行い、前処理データを生成し、前記前処理データのデータ量が前記離散的な特徴マップのデータ量よりも小さく;
前記前処理データに基づいて前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算し;及び
前記コーディング待ちデータの確率に基づいて前記コーディング待ちデータに対してエントロピーコーディングを行うことを含む、方法。
付記1に記載の画像コーディング方法であって、
前記離散的な特徴マップにおける一部のデータを前処理データとして選択し、そのうち、前記前処理データは、現在の前記コーディング待ちデータを中心とする、所定範囲内の複数のデータを含む、方法。
付記2に記載の画像コーディング方法であて、
マスク畳み込み層を用いて、前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算するときに、前記所定範囲は、前記マスク畳み込み層のスケールに対応する、方法。
付記3に記載の画像コーディング方法であって、
前記マスク畳み込み層の個数が1個である場合、前記所定範囲は、前記マスク畳み込み層のスケールに等しく、前記マスク畳み込み層の個数が複数個である場合、前記所定範囲は、複数の前記マスク畳み込み層の最大スケールに等しく、又は、前記所定範囲は、各前記マスク畳み込み層のスケールに等しい、方法。
付記1に記載の画像コーディング方法であって、さらに、
フラッグデータを生成し、前記フラッグデータが、前記離散的な特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられ;及び
前記フラッグデータ及び前記コーディング待ちデータの確率に基づいて前記離散的な特徴マップにおける前記コーディング待ちデータに対してエントロピーコーディングを行うことを含む、方法。
付記5に記載の画像コーディング方法であって、
前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロであると指示するときに、前記離散的な特徴マップにおける該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行わず、前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロでないと指示するときに、前記コーディング待ちデータの確率に基づいて前記該チャネル上コーディング待ちデータに対してエントロピーコーディングを行う、方法。
画像デコーディング方法であって、
デコーディング済みデータに対して前処理を行い、前処理データを生成し、前記前処理データのデータ量が前記デコーディング済みデータのデータ量よりも小さく;
前記前処理データに基づいて現在のデコーディング待ちデータの確率を計算し;
前記確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し;及び
前記特徴マップに対して再構成を行い、画像データを生成することを含む、方法。
付記7に記載の画像デコーディング方法であって、
前記デコーディング済みデータにおける一部のデータを前処理データとして選択し、そのうち、前記前処理データは、現在の前記デコーディング待ちデータを中心とする、所定範囲内の複数のデータを含む、方法。
付記8に記載の画像デコーディング方法であって、
マスク畳み込み層を用いて前記デコーディング待ちデータの確率を計算するときに、前記所定範囲は、前記マスク畳み込み層のスケールに対応する、方法。
付記9に記載の画像デコーディング方法であって、
前記マスク畳み込み層の個数が1個である場合、前記所定範囲は、前記マスク畳み込み層のスケールに等しく、前記マスク畳み込み層の個数が複数個である場合、前記所定範囲は、複数の前記マスク畳み込み層の最大スケールに等しく、又は、前記所定範囲は、各前記マスク畳み込み層のスケールに等しい、方法。
付記7に記載の画像デコーディング方法であって、
前記前記確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得することは、具体的に、
フラッグデータ及び前記デコーディング待ちデータの確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得することを含み、
前記フラッグデータは、前記特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられる、方法。
付記11に記載の画像デコーディング方法であって、
前記フラッグデータにより、前記特徴マップにおける或るチャネルのデータがすべてゼロであると指示するときに、該チャネル上ですべてゼロの特徴マップを生成し、前記フラッグデータにより、前記特徴マップにおける或るチャネルのデータがすべてゼロでないと指示する場合、前記デコーディング待ちデータの確率に基づいて該チャネルの前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを得る、方法。
画像コーディング方法であって、
畳み込みニューラルネットワークを用いて、処理待ちの画像データに対して特徴抽出を行い、前記画像データの特徴マップを生成し;
前記特徴マップに対して量子化を行い、離散的な特徴マップを生成し;
前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算し;
フラッグデータを生成し、前記フラッグデータが、前記離散的な特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられ;及び
前記フラッグデータ及び前記コーディング待ちデータの確率に基づいて前記コーディング待ちデータに対してエントロピーコーディングを行うことを含む、方法。
付記13に記載の画像コーディング方法であって、
前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロであると指示するときに、前記離散的な特徴マップにおける該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行わず、前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロでないと指示するときに、前記該チャネルコーディング待ちデータの確率に基づいて該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行う、方法。
画像デコーディング方法であって、
現在のデコーディング待ちデータの確率を推定し;
フラッグデータ及び前記デコーディング待ちデータの確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し、そのうち、前記フラッグデータが、前記特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられ;及び
前記特徴マップに対して再構成を行い、画像データを生成することを含む、方法。
付記15に記載の画像デコーディング方法であって、
前記フラッグデータにより、前記特徴マップにおける或るチャネルのデータがすべてゼロであると指示する場合、該チャネル上ですべてゼロの特徴マップを生成し、前記フラッグデータにより、前記特徴マップにおける或るチャネルのデータがすべてゼロでないと指示する場合、前記デコーディング待ちデータの確率に基づいて該チャネルの前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを得る、方法。
画像コーディング装置であって、
畳み込みニューラルネットワークコーダであって、畳み込みニューラルネットワークを用いて、処理待ちの画像データに対して特徴抽出を行い、前記画像データの特徴マップを生成するもの;
量子化器であって、前記特徴マップに対して量子化を行い、離散的な特徴マップを生成するもの;
前処理器であって、前記離散的な特徴マップに対して前処理を行い、前処理データを生成し、前記前処理データのデータ量が前記離散的な特徴マップのデータ量よりも小さいもの;
確率推定器であって、前記前処理データに基づいて前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算するもの;及び
エントロピーコーダであって、前記コーディング待ちデータの確率に基づいて前記コーディング待ちデータに対してエントロピーコーディングを行うものを含む、装置。
付記17に記載の画像コーディング装置であって、
前記前処理器は、前記離散的な特徴マップにおける一部のデータを前処理データとして選択し、そのうち、前記前処理データは、現在の前記コーディング待ちデータを中心とする、所定範囲内の複数のデータを含む、装置。
付記18に記載の画像コーディング装置であって、
前記確率推定器は、マスク畳み込み層を含み、前記マスク畳み込み層は、前記前処理データに対して畳み込み運算を行い、前記所定範囲は、前記マスク畳み込み層のスケールに対応する、装置。
付記19に記載の画像コーディング装置であって、
前記マスク畳み込み層の個数が1個である場合、前記所定範囲は、前記マスク畳み込み層のスケールに等しく、前記マスク畳み込み層の個数が複数個である場合、前記所定範囲は、複数の前記マスク畳み込み層の最大スケールに等しく、又は、前記所定範囲は、各前記マスク畳み込み層のスケールに等しい、装置。
付記17に記載の画像コーディング装置であって、さらに、
フラッグデータ生成器であって、フラッグデータを生成し、前記フラッグデータが、前記離散的な特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられるものを含み、
前記エントロピーコーダは、さらに、前記フラッグデータに基づいて、前記離散的な特徴マップにおける前記コーディング待ちデータに対してエントロピーコーディングを行う、装置。
付記21に記載の画像コーディング装置であって、
前記エントロピーコーダは、前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロであると指示するときに、前記離散的な特徴マップにおける該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行わず、前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロでないと指示するときに、前記コーディング待ちデータの確率に基づいて該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行う、装置。
画像デコーディング装置であって、
前処理器であって、デコーディング済みデータに対して前処理を行い、前処理データを生成し、前記前処理データのデータ量が前記デコーディング済みデータのデータ量よりも小さいもの;
確率推定器であって、前記前処理データに基づいて現在のデコーディング待ちデータの確率を計算するもの;
エントロピーデコーダであって、前記確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得するもの;及び
畳み込みニューラルネットワークデコーダであって、前記特徴マップに対して再構成を行い、画像データを生成するものを含む、装置。
付記23に記載の画像デコーディング装置であって、
前記前処理器は、前記デコーディング済みデータにおける一部のデータを前処理データとして選択し、そのうち、前記前処理データは、現在の前記デコーディング待ちデータを中心とする、所定範囲内の複数のデータを含む、装置。
付記24に記載の画像デコーディング装置であって、
前記確率推定器は、マスク畳み込み層を含み、前記マスク畳み込み層は、前記前処理データに対して畳み込み運算を行い、前記所定範囲は、前記マスク畳み込み層のスケールに対応する、装置。
付記25に記載の画像デコーディング装置であって、
前記マスク畳み込み層の個数が1個である場合、前記所定範囲は、前記マスク畳み込み層のスケールに等しく、前記マスク畳み込み層の個数が複数個である場合、前記所定範囲は、複数の前記マスク畳み込み層の最大スケールに等しく、又は、前記所定範囲は、各前記マスク畳み込み層のスケールに等しい、装置。
付記23に記載の画像デコーディング装置であって、
前記エントロピーデコーダは、さらに、フラッグデータに基づいて、前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し、そのうち、前記フラッグデータは、前記特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられる、装置。
付記27に記載の画像デコーディング装置であって、
前記エントロピーデコーダは、前記フラッグデータにより、前記特徴マップにおける或るチャネルのデータがすべてゼロであると指示するときに、該チャネル上ですべてゼロの特徴マップを生成し、前記フラッグデータにより、前記特徴マップにおける或るチャネルのデータがすべてゼロでないと指示する場合、前記デコーディング待ちデータの確率に基づいて該チャネルの前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得する、装置。
画像コーディング装置であって、
畳み込みニューラルネットワークコーダであって、畳み込みニューラルネットワークを用いて処理待ちの画像データに対して特徴抽出を行い、前記画像データの特徴マップを生成するもの;
量子化器であって、前記特徴マップに対して量子化を行い、離散的な特徴マップを生成するもの;
確率推定器であって、前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算するもの;
フラッグデータ生成器であって、フラッグデータを生成し、前記フラッグデータが、前記離散的な特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられるもの;及び
エントロピーコーダであって、前記フラッグデータ及び前記コーディング待ちデータの確率に基づいて前記コーディング待ちデータに対してエントロピーコーディングを行うものを含む、装置。
付記29に記載の画像コーディング装置であって、
前記エントロピーコーダは、前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロであると指示するときに、前記離散的な特徴マップにおける該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行わず、前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロでないと指示するときに前記コーディング待ちデータの確率に基づいて該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行う、装置。
画像デコーディング装置であって、
確率推定器であって、現在のデコーディング待ちデータの確率を推定するもの;
エントロピーデコーダであって、フラッグデータ及び前記デコーディング待ちデータの確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し、そのうち、前記フラッグデータが、前記特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられるもの;及び
畳み込みニューラルネットワークデコーダであって、前記特徴マップに対して再構成を行い、画像データを生成するものを含む、装置。
付記31に記載の画像デコーディング装置であって、
前記エントロピーデコーダは、前記フラッグデータにより、前記特徴マップにおける或るチャネルのデータがすべてゼロであると指示する場合、該チャネル上ですべてゼロの特徴マップを生成し、前記フラッグデータにより、前記特徴マップにおける或るチャネルのデータがすべてゼロでないと指示する場合、前記デコーディング待ちデータの確率に基づいて、該チャネルの前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを得る、装置。
Claims (10)
- 画像コーディング装置であって、
畳み込みニューラルネットワークを用いて処理待ちの画像データに対して特徴抽出を行い、前記画像データの特徴マップを生成する畳み込みニューラルネットワークコーダ;
前記特徴マップに対して量子化を行い、離散的な特徴マップを生成する量子化器;
前記離散的な特徴マップに対して前処理を行って前処理データを生成し、前記前処理データのデータ量が前記離散的な特徴マップのデータ量よりも小さい前処理器;
前記前処理データに基づいて前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算する確率推定器;及び
前記コーディング待ちデータの確率に基づいて前記コーディング待ちデータに対してエントロピーコーディングを行うエントロピーコーダを含む、画像コーディング装置。 - 請求項1に記載の画像コーディング装置であって、
前記前処理器は、前記離散的な特徴マップにおける一部のデータを前処理データとして選択し、前記前処理データは、現在の前記コーディング待ちデータを中心とする、所定範囲内の複数のデータを含む、画像コーディング装置。 - 請求項2に記載の画像コーディング装置であって、
前記確率推定器は、マスク畳み込み層を含み、前記マスク畳み込み層は、前記前処理データに対して畳み込み演算を行い、前記所定範囲は、前記マスク畳み込み層のスケールに対応する、画像コーディング装置。 - 請求項3に記載の画像コーディング装置であって、
前記マスク畳み込み層の数が1つである場合、前記所定範囲は、前記マスク畳み込み層のスケールに等しく、前記マスク畳み込み層の数が複数である場合、前記所定範囲は、複数の前記マスク畳み込み層の最大スケールに等しく、又は、前記所定範囲は、各前記マスク畳み込み層のスケールに等しい、画像コーディング装置。 - 請求項1に記載の画像コーディング装置であって、
フラッグデータを生成し、前記フラッグデータが、前記離散的な特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられるフラッグデータ生成器をさらに含み、
前記エントロピーコーダは、さらに、前記フラッグデータに基づいて、前記離散的な特徴マップにおける前記コーディング待ちデータに対してエントロピーコーディングを行う、画像コーディング装置。 - 請求項5に記載の画像コーディング装置であって、
前記エントロピーコーダは、前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロであると指示するときに、前記離散的な特徴マップにおける該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行わず、前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロでないと指示するときに、前記コーディング待ちデータの確率に基づいて該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行う、画像コーディング装置。 - 画像コーディング装置であって、
畳み込みニューラルネットワークを用いて処理待ちの画像データに対して特徴抽出を行い、前記画像データの特徴マップを生成する畳み込みニューラルネットワークコーダ;
前記特徴マップに対して量子化を行い、離散的な特徴マップを生成する量子化器;
前記離散的な特徴マップにおけるコーディング待ちデータの確率を計算する確率推定器;
フラッグデータを生成し、前記フラッグデータが、前記離散的な特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられるフラッグデータ生成器;及び
前記フラッグデータ及び前記コーディング待ちデータの確率に基づいて前記コーディング待ちデータに対してエントロピーコーディングを行うエントロピーコーダを含む、画像コーディング装置。 - 請求項7に記載の画像コーディング装置であって、
前記エントロピーコーダは、前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロであると指示するときに、前記離散的な特徴マップにおける該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行わず、前記フラッグデータにより、前記離散的な特徴マップにおける或るチャネルのデータがすべてゼロでないと指示するときに、前記コーディング待ちデータの確率に基づいて該チャネルの前記コーディング待ちデータに対してエントロピーコーディングを行う、画像コーディング装置。 - 画像デコーディング装置であって、
現在のデコーディング待ちデータの確率を推定する確率推定器;
フラッグデータ及び前記デコーディング待ちデータの確率に基づいて前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを取得し、前記フラッグデータが、前記特徴マップにおける各チャネルのデータがすべてゼロであるかを指示するために用いられるエントロピーデコーダ;及び
前記特徴マップに対して再構成を行い、画像データを生成する畳み込みニューラルネットワークデコーダを含む、画像デコーディング装置。 - 請求項9に記載の画像デコーディング装置であって、
前記エントロピーデコーダは、前記フラッグデータにより、前記特徴マップにおける或るチャネルのデータがすべてゼロであると指示する場合、該チャネルについてすべてゼロの特徴マップを生成し、前記フラッグデータにより、前記特徴マップにおける或るチャネルのデータがすべてゼロでないと指示する場合、前記デコーディング待ちデータの確率に基づいて、該チャネルの前記デコーディング待ちデータに対してエントロピーデコーディングを行い、特徴マップを得る、画像デコーディング装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910429351.7 | 2019-05-22 | ||
CN201910429351.7A CN111988629B (zh) | 2019-05-22 | 2019-05-22 | 图像编码装置和图像解码装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020191077A JP2020191077A (ja) | 2020-11-26 |
JP7476631B2 true JP7476631B2 (ja) | 2024-05-01 |
Family
ID=73435971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020068869A Active JP7476631B2 (ja) | 2019-05-22 | 2020-04-07 | 画像コーディング方法及び装置並びに画像デコーディング方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11184615B2 (ja) |
JP (1) | JP7476631B2 (ja) |
CN (1) | CN111988629B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11538197B2 (en) * | 2020-09-15 | 2022-12-27 | Google Llc | Channel-wise autoregressive entropy models for image compression |
CN114979711B (zh) * | 2021-02-25 | 2023-10-13 | 华为技术有限公司 | 音视频或图像分层压缩方法和装置 |
JP2022174948A (ja) * | 2021-05-12 | 2022-11-25 | 横河電機株式会社 | 装置、監視システム、方法およびプログラム |
CN115442609A (zh) * | 2021-06-02 | 2022-12-06 | 华为技术有限公司 | 特征数据编解码方法和装置 |
WO2023075563A1 (ko) * | 2021-11-01 | 2023-05-04 | 엘지전자 주식회사 | 피쳐 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
CN116112673A (zh) * | 2021-11-10 | 2023-05-12 | 华为技术有限公司 | 编解码方法及电子设备 |
CN116170596A (zh) * | 2021-11-24 | 2023-05-26 | 华为技术有限公司 | 编解码方法及电子设备 |
KR102628127B1 (ko) * | 2022-02-21 | 2024-01-23 | 가천대학교 산학협력단 | 특징량맵에 대한 영상 신호를 처리하기 위한 방법 및 이를 지원하는 장치 |
CN117412046A (zh) * | 2022-07-08 | 2024-01-16 | 华为技术有限公司 | 一种编解码方法、装置及计算机设备 |
WO2024007820A1 (zh) * | 2022-07-08 | 2024-01-11 | 华为技术有限公司 | 数据编解码方法及相关设备 |
CN117880509A (zh) * | 2022-10-11 | 2024-04-12 | 华为技术有限公司 | 特征数据编解码方法及相关装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019079514A (ja) | 2017-10-19 | 2019-05-23 | 富士通株式会社 | 画像処理装置及び画像処理方法 |
JP2020191631A (ja) | 2019-05-22 | 2020-11-26 | 富士通株式会社 | 画像符号化装置、確率モデル生成装置及び画像圧縮システム |
JP2020191630A (ja) | 2019-05-22 | 2020-11-26 | 富士通株式会社 | 画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 |
WO2020261314A1 (ja) | 2019-06-24 | 2020-12-30 | 日本電信電話株式会社 | 画像符号化方法、及び画像復号方法 |
WO2021155832A1 (zh) | 2020-02-07 | 2021-08-12 | 华为技术有限公司 | 一种图像处理方法以及相关设备 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101279573B1 (ko) * | 2008-10-31 | 2013-06-27 | 에스케이텔레콤 주식회사 | 움직임 벡터 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
JP5258664B2 (ja) * | 2009-04-14 | 2013-08-07 | 株式会社エヌ・ティ・ティ・ドコモ | 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム |
WO2011126277A2 (en) * | 2010-04-05 | 2011-10-13 | Samsung Electronics Co., Ltd. | Low complexity entropy-encoding/decoding method and apparatus |
CA2794771C (en) | 2010-05-21 | 2016-03-29 | Research In Motion Limited | Methods and devices for reducing sources in binary entropy coding and decoding |
US8855205B2 (en) * | 2010-05-26 | 2014-10-07 | Newratek Inc. | Method of predicting motion vectors in video codec in which multiple references are allowed, and motion vector encoding/decoding apparatus using the same |
US8483500B2 (en) | 2010-09-02 | 2013-07-09 | Sony Corporation | Run length coding with context model for image compression using sparse dictionaries |
AU2012205077B2 (en) | 2011-01-06 | 2016-04-07 | Samsung Electronics Co., Ltd. | Encoding method and device of video using data unit of hierarchical structure, and decoding method and device thereof |
CN116546221A (zh) * | 2016-02-05 | 2023-08-04 | 渊慧科技有限公司 | 使用神经网络压缩图像 |
CN106485717A (zh) * | 2016-09-12 | 2017-03-08 | 上海影城有限公司 | 一种基于卷积神经网络的图像特征提取方法及*** |
US10332001B2 (en) * | 2016-12-15 | 2019-06-25 | WaveOne Inc. | Enhanced coding efficiency with progressive representation |
KR20180073314A (ko) * | 2016-12-22 | 2018-07-02 | 삼성전자주식회사 | 컨볼루션 신경망 시스템 및 그것의 동작 방법 |
US10713794B1 (en) * | 2017-03-16 | 2020-07-14 | Facebook, Inc. | Method and system for using machine-learning for object instance segmentation |
CN107464222B (zh) * | 2017-07-07 | 2019-08-20 | 宁波大学 | 基于张量空间的无参考高动态范围图像客观质量评价方法 |
US20190122073A1 (en) * | 2017-10-23 | 2019-04-25 | The Charles Stark Draper Laboratory, Inc. | System and method for quantifying uncertainty in reasoning about 2d and 3d spatial features with a computer machine learning architecture |
US10796452B2 (en) * | 2017-12-03 | 2020-10-06 | Facebook, Inc. | Optimizations for structure mapping and up-sampling |
US10733431B2 (en) * | 2017-12-03 | 2020-08-04 | Facebook, Inc. | Systems and methods for optimizing pose estimation |
US10692243B2 (en) * | 2017-12-03 | 2020-06-23 | Facebook, Inc. | Optimizations for dynamic object instance detection, segmentation, and structure mapping |
US10674152B2 (en) * | 2018-09-18 | 2020-06-02 | Google Llc | Efficient use of quantization parameters in machine-learning models for video coding |
US11729406B2 (en) * | 2019-03-21 | 2023-08-15 | Qualcomm Incorporated | Video compression using deep generative models |
US20200329233A1 (en) * | 2019-04-12 | 2020-10-15 | Frank Nemirofsky | Hyperdata Compression: Accelerating Encoding for Improved Communication, Distribution & Delivery of Personalized Content |
-
2019
- 2019-05-22 CN CN201910429351.7A patent/CN111988629B/zh active Active
-
2020
- 2020-04-07 JP JP2020068869A patent/JP7476631B2/ja active Active
- 2020-04-22 US US16/855,465 patent/US11184615B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019079514A (ja) | 2017-10-19 | 2019-05-23 | 富士通株式会社 | 画像処理装置及び画像処理方法 |
JP2020191631A (ja) | 2019-05-22 | 2020-11-26 | 富士通株式会社 | 画像符号化装置、確率モデル生成装置及び画像圧縮システム |
JP2020191630A (ja) | 2019-05-22 | 2020-11-26 | 富士通株式会社 | 画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 |
WO2020261314A1 (ja) | 2019-06-24 | 2020-12-30 | 日本電信電話株式会社 | 画像符号化方法、及び画像復号方法 |
WO2021155832A1 (zh) | 2020-02-07 | 2021-08-12 | 华为技术有限公司 | 一种图像处理方法以及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111988629A (zh) | 2020-11-24 |
US11184615B2 (en) | 2021-11-23 |
JP2020191077A (ja) | 2020-11-26 |
US20200374522A1 (en) | 2020-11-26 |
CN111988629B (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7476631B2 (ja) | 画像コーディング方法及び装置並びに画像デコーディング方法及び装置 | |
JP7424078B2 (ja) | 画像エンコーディング方法及び装置並びに画像デコーディング方法及び装置 | |
US10713818B1 (en) | Image compression with recurrent neural networks | |
US10853447B2 (en) | Bezier volume representation of point cloud attributes | |
US11869221B2 (en) | Data compression using integer neural networks | |
CN110892419B (zh) | 停止码容忍的图像压缩神经网络 | |
US11783511B2 (en) | Channel-wise autoregressive entropy models for image compression | |
US11375198B2 (en) | Processing signal data using an upsampling adjuster | |
CN111727445A (zh) | 局部熵编码的数据压缩 | |
JP6246233B2 (ja) | 頂点誤差訂正のための方法および装置 | |
KR20200138079A (ko) | 전역적 문맥을 이용하는 기계 학습 기반의 이미지 압축을 위한 방법 및 장치 | |
CN115130571A (zh) | 特征编码及解码方法、装置、电子设备及存储介质 | |
CN116527943B (zh) | 基于矢量量化索引和生成模型的极限图像压缩方法及*** | |
CN111107377A (zh) | 深度图像压缩方法及其装置、设备和存储介质 | |
CN115393452A (zh) | 一种基于非对称自编码器结构的点云几何压缩方法 | |
CN117915114B (zh) | 一种点云属性压缩方法、装置、终端及介质 | |
CN117616753A (zh) | 使用光流的视频压缩 | |
CN117459727A (zh) | 一种图像处理方法、装置、***、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7476631 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |