JP7026878B2 - ディープニューラルネットワークを用いた、視覚的品質を維持した量子化パラメータ予測 - Google Patents
ディープニューラルネットワークを用いた、視覚的品質を維持した量子化パラメータ予測 Download PDFInfo
- Publication number
- JP7026878B2 JP7026878B2 JP2019558385A JP2019558385A JP7026878B2 JP 7026878 B2 JP7026878 B2 JP 7026878B2 JP 2019558385 A JP2019558385 A JP 2019558385A JP 2019558385 A JP2019558385 A JP 2019558385A JP 7026878 B2 JP7026878 B2 JP 7026878B2
- Authority
- JP
- Japan
- Prior art keywords
- image features
- neural network
- image
- quantization parameter
- video content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
- H04N19/197—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
Description
視覚的品質を維持できるQPマッピング戦略を設計するために、視覚的品質評価(VQA)のためのアプローチを使用する。このようなVQAアルゴリズムは、原画像及び歪み画像(例えば、圧縮画像)を所与として歪み画像の品質を測定することができる。このアルゴリズムは、一般性を失うことなく、視覚的品質を0(低品質)から1(高品質)までの実数として格付けする。本明細書で説明するフレームワークは、あらゆるVQAアルゴリズムを使用することができる。1つのVQAアルゴリズムは、特徴類似度指数モデル(FSIM)である。FSIMアルゴリズムは計算が速く、適度に良好な視覚的品質測定を達成する。
このQPマッピング手順は、ビデオ符号化ワークフロー内で直接実行することができる。別のアプローチは、このようなQPマッピング戦略を近似することができる高速アルゴリズムを発見することである。この目的のために、図2に示すようなディープニューラルネットワークを使用する。ネットワークの入力層は、特徴抽出器を用いて入力画像ブロックから抽出された画像特徴を含む。本明細書ではこれらの特徴について説明する。ネットワークの出力層は、それぞれが考えられるQP値のうちの1つに対応する52個のノード(例えば、QP=0、...、QP=51)から成る。出力ノードは、-1~1の活性化値を有し、活性化の最も高いノードが目標QP値を予測する。
QP予測ニューラルネットワークの入力層は、Haralickテクスチャ記述子、全変動及び分散という3つの異なるタイプの画像特徴によって構成される。13次元Haralickテクスチャ記述子は、入力画像からの典型的な特徴抽出テクスチャ情報(features extracting textural information)である。Haralickテクスチャ記述子は、グレーレベル同時生起行列(GLCM)から計算される。全変動及び分散の特徴は、処理される画像内の画素値の統計である。
1.装置の非一時的メモリにプログラムされる方法であって、
a.ビデオコンテンツを取得するステップと、
b.ビデオコンテンツから画像特徴を抽出するステップと、
c.ディープニューラルネットワークを通じて画像特徴を供給するステップと、
d.最も高い活性化値を有するノードに対応する目標量子化パラメータ値を予測するステップと、を含む方法。
a.レンズと、
b.ビデオコンテンツを取得するように構成されたセンサと、
c.ビデオコンテンツから画像特徴を抽出し、ディープニューラルネットワークを通じて画像特徴を供給し、最も高い活性化値を有するノードに対応する目標量子化パラメータ値を予測するように構成された処理コンポーネントと、を備えるシステム。
a.レンズと、
b.ビデオコンテンツを取得するように構成されたセンサと、
c.
i.ビデオコンテンツから画像特徴を抽出し、
ii.ディープニューラルネットワークを通じて画像特徴を供給し、
iii.最も高い活性化値を有するノードに対応する目標量子化パラメータ値を予測する、
アプリケーションを記憶する非一時的メモリと、
d.メモリに結合されて、アプリケーションを処理するように構成された処理コンポーネントと、を備えるカメラ装置。
a.ビデオコンテンツを取得するステップと、
b.0の量子化パラメータから開始する量子化パラメータを使用してビデオコンテンツの各画像ブロックを圧縮し、圧縮された画像ブロックの品質尺度が視覚的品質閾値を下回るまで量子化パラメータを増加させるステップと、
c.圧縮された画像ブロックの品質尺度が視覚的品質閾値を下回る量子化パラメータの直前の量子化パラメータを、視覚的品質を維持する量子化パラメータとして利用するステップと、を含む方法。
a.レンズと、
b.ビデオコンテンツを取得するように構成されたセンサと、
c.0の量子化パラメータから開始する量子化パラメータを使用してビデオコンテンツの各画像ブロックを圧縮し、圧縮された画像ブロックの品質尺度が視覚的品質閾値を下回るまで量子化パラメータを増加させ、圧縮された画像ブロックの品質尺度が視覚的品質閾値を下回る量子化パラメータの直前の量子化パラメータを、視覚的品質を維持する量子化パラメータとして利用するように構成された処理コンポーネントと、を備えるシステム。
a.レンズと、
b.ビデオコンテンツを取得するように構成されたセンサと、
c.
i.0の量子化パラメータから開始する量子化パラメータを使用してビデオコンテンツの各画像ブロックを圧縮し、圧縮された画像ブロックの品質尺度が視覚的品質閾値を下回るまで量子化パラメータを増加させ、
ii.圧縮された画像ブロックの品質尺度が視覚的品質閾値を下回る量子化パラメータの直前の量子化パラメータを、視覚的品質を維持する量子化パラメータとして利用する、
アプリケーションを記憶する非一時的メモリと、
d.メモリに結合されて、アプリケーションを処理するように構成された処理コンポーネントと、を備えるカメラ装置。
Claims (12)
- 装置の非一時的メモリにプログラムされる方法であって、
a.ビデオコンテンツを取得するステップと、
b.前記ビデオコンテンツから、Haralickテクスチャ記述子、全変動及び分散を含む画像特徴を抽出するステップと、
c.ディープニューラルネットワークを通じて前記画像特徴を供給するステップと、
d.最も高い活性化値を有するノードに対応する目標とする量子化パラメータ値を予測するステップと、
を含み、
出力層は52個のノードを含み、各ノードは量子化パラメータ値の1つに対応し、
前記画像特徴を抽出するステップは、前記画像特徴を様々な粒度で抽出する空間ピラミッドフレームワークを用いて実行される、
ることを特徴とする方法。 - 前記ディープニューラルネットワークは、最初に、トレーニング画像ブロックから抽出された画像特徴を用いて教師なしで事前トレーニングされる、
請求項1に記載の方法。 - バックプロパゲーションアルゴリズムを使用して画像特徴及びその割り当てられた量子化パラメータ値を入力することによって、前記ニューラルネットワークを改善するステップをさらに含む、
請求項1に記載の方法。 - 前記空間ピラミッドフレームワークは、画像ブロックを逐次的にさらに小さな部分画像の一連のグリッドに分割し、前記グリッドの各々について部分画像毎に前記画像特徴を抽出し、その後に前記画像特徴を最終的な特徴ベクトルに連結させて前記ニューラルネットワーク内に入力するステップを含む、
請求項1に記載の方法。 - e.レンズと、
f.ビデオコンテンツを取得するように構成されたセンサと、
g.前記ビデオコンテンツから、Haralickテクスチャ記述子、全変動及び分散を含む画像特徴を抽出し、ディープニューラルネットワークを通じて前記画像特徴を供給し、最も高い活性化値を有するノードに対応する目標とする量子化パラメータ値を予測するように構成された処理コンポーネントと、
を備え、
出力層は52個のノードを含み、各ノードは量子化パラメータ値の1つに対応し、
前記画像特徴の抽出は、前記画像特徴を様々な粒度で抽出する空間ピラミッドフレームワークを用いて実行される、
ことを特徴とするシステム。 - 前記ディープニューラルネットワークは、最初に、トレーニング画像ブロックから抽出された画像特徴を用いて教師なしで事前トレーニングされる、
請求項5に記載のシステム。 - 前記処理コンポーネントは、バックプロパゲーションアルゴリズムを使用して画像特徴及びその割り当てられた量子化パラメータ値を入力することによって、前記ニューラルネットワークを改善するようにさらに構成される、
請求項5に記載のシステム。 - 前記空間ピラミッドフレームワークは、画像ブロックを逐次的にさらに小さな部分画像の一連のグリッドに分割し、前記グリッドの各々について部分画像毎に前記画像特徴を抽出し、その後に前記画像特徴を最終的な特徴ベクトルに連結させて前記ニューラルネットワーク内に入力するステップを含む、
請求項5に記載のシステム。 - h.レンズと、
i.ビデオコンテンツを取得するように構成されたセンサと、
j.
i.前記ビデオコンテンツから、Haralickテクスチャ記述子、全変動及び分散を含む画像特徴を抽出し、
ii.ディープニューラルネットワークを通じて前記画像特徴を供給し、
iii.前記複数のノードの各ノードの活性化値の比較に基づいて、最も高い活性化値を有するノードに対応する目標とする量子化パラメータ値を予測し、出力層は52個のノードを含み、各ノードは量子化パラメータ値の1つに対応し、各ノードは-1と1の間の活性化値を有する、
アプリケーションを記憶する非一時的メモリと、
k.前記メモリに結合されて、前記アプリケーションを処理するように構成された処理コンポーネントと、
を備え、
前記画像特徴の抽出は、前記画像特徴を様々な粒度で抽出する空間ピラミッドフレームワークを用いて実行される、
ことを特徴とするカメラ装置。 - 前記ディープニューラルネットワークは、最初に、トレーニング画像ブロックから抽出された画像特徴を用いて教師なしで事前トレーニングされる、
請求項9に記載のカメラ装置。 - 前記アプリケーションは、さらに、バックプロパゲーションアルゴリズムを使用して画像特徴及びその割り当てられた量子化パラメータ値を入力することによって、前記ニューラルネットワークを改善する、
請求項9に記載のカメラ装置。 - 前記空間ピラミッドフレームワークは、画像ブロックを逐次的にさらに小さな部分画像の一連のグリッドに分割し、前記グリッドの各々について部分画像毎に前記画像特徴を抽出し、その後に前記画像特徴を最終的な特徴ベクトルに連結させて前記ニューラルネットワーク内に入力するステップを含む、
請求項9に記載のカメラ装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/646,737 US10728553B2 (en) | 2017-07-11 | 2017-07-11 | Visual quality preserving quantization parameter prediction with deep neural network |
US15/646,737 | 2017-07-11 | ||
PCT/IB2018/054832 WO2019012363A1 (en) | 2017-07-11 | 2018-06-29 | PREDICTION OF QUANTIFICATION PARAMETER PRESERVING VISUAL QUALITY THROUGH DEEP NEURAL NETWORK |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020518191A JP2020518191A (ja) | 2020-06-18 |
JP7026878B2 true JP7026878B2 (ja) | 2022-03-01 |
Family
ID=63209629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019558385A Active JP7026878B2 (ja) | 2017-07-11 | 2018-06-29 | ディープニューラルネットワークを用いた、視覚的品質を維持した量子化パラメータ予測 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10728553B2 (ja) |
JP (1) | JP7026878B2 (ja) |
KR (1) | KR20190127909A (ja) |
CN (1) | CN110637460B (ja) |
WO (1) | WO2019012363A1 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11195096B2 (en) * | 2017-10-24 | 2021-12-07 | International Business Machines Corporation | Facilitating neural network efficiency |
US10721471B2 (en) * | 2017-10-26 | 2020-07-21 | Intel Corporation | Deep learning based quantization parameter estimation for video encoding |
US10560696B2 (en) * | 2018-06-25 | 2020-02-11 | Tfi Digital Media Limited | Method for initial quantization parameter optimization in video coding |
US10963742B2 (en) * | 2018-11-02 | 2021-03-30 | University Of South Florida | Leveraging smart-phone cameras and image processing techniques to classify mosquito genus and species |
KR20200082227A (ko) * | 2018-12-28 | 2020-07-08 | 한국전자통신연구원 | 오디오 신호를 위한 손실 함수 결정 방법 및 손실 함수 결정 장치 |
US10325352B1 (en) * | 2019-01-23 | 2019-06-18 | StradVision, Inc. | Method and device for transforming CNN layers to optimize CNN parameter quantization to be used for mobile devices or compact networks with high precision via hardware optimization |
US10325185B1 (en) * | 2019-01-23 | 2019-06-18 | StradVision, Inc. | Method and device for online batch normalization, on-device learning, and continual learning applicable to mobile devices or IOT devices additionally referring to one or more previous batches to be used for military purpose, drone or robot, and testing method and testing device using the same |
US20210233259A1 (en) * | 2020-01-28 | 2021-07-29 | Ssimwave Inc. | No-reference visual media assessment combining deep neural networks and models of human visual system and video content/distortion analysis |
CN111314698A (zh) * | 2020-02-27 | 2020-06-19 | 浙江大华技术股份有限公司 | 一种图像编码处理方法及装置 |
KR20210155695A (ko) | 2020-06-16 | 2021-12-23 | 삼성전자주식회사 | 화질 튜닝을 수행하는 이미지 처리 시스템 및 화질 튜닝 방법 |
US11335033B2 (en) | 2020-09-25 | 2022-05-17 | Adobe Inc. | Compressing digital images utilizing deep learning-based perceptual similarity |
KR20220043694A (ko) * | 2020-09-29 | 2022-04-05 | 삼성전자주식회사 | 영상을 처리하는 디바이스 및 그 동작 방법 |
CN114363624B (zh) * | 2020-10-13 | 2023-03-31 | 北京大学 | 一种基于敏感度的码率分配特征压缩方法 |
CN112733863B (zh) * | 2021-01-07 | 2022-06-07 | 苏州浪潮智能科技有限公司 | 一种图像特征提取方法、装置、设备及存储介质 |
CN113259163B (zh) * | 2021-05-17 | 2022-02-08 | 云南大学 | 一种基于网络拓扑感知的Web服务质量预测方法及*** |
EP4145394A1 (en) * | 2021-09-06 | 2023-03-08 | Nokia Technologies Oy | Personalized perceptual video encoder for mission-critical tasks |
WO2023169501A1 (en) * | 2022-03-09 | 2023-09-14 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for visual data processing |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003153007A (ja) | 2001-07-23 | 2003-05-23 | Eastman Kodak Co | 画像重要度に基づく画像圧縮制御システム及び方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5444820A (en) * | 1993-12-09 | 1995-08-22 | Long Island Lighting Company | Adaptive system and method for predicting response times in a service environment |
KR0139154B1 (ko) * | 1994-07-08 | 1998-06-15 | 김광호 | 신경망을 이용한 부호화방법 및 그 장치 |
US20060280242A1 (en) | 2005-06-13 | 2006-12-14 | Nokia Corporation | System and method for providing one-pass rate control for encoders |
CN101325707B (zh) * | 2007-06-12 | 2012-04-18 | 浙江大学 | 纹理自适应视频编解码*** |
US8473657B2 (en) | 2009-03-23 | 2013-06-25 | Lsi Corporation | High speed packet FIFO output buffers for switch fabric with speedup |
US20120316421A1 (en) * | 2009-07-07 | 2012-12-13 | The Johns Hopkins University | System and method for automated disease assessment in capsule endoscopy |
WO2012096988A2 (en) * | 2011-01-10 | 2012-07-19 | Rutgers, The State University Of New Jersey | Method and apparatus for shape based deformable segmentation of multiple overlapping objects |
US8594385B2 (en) * | 2011-04-19 | 2013-11-26 | Xerox Corporation | Predicting the aesthetic value of an image |
US8731323B2 (en) * | 2011-11-23 | 2014-05-20 | Stmicroelectronics Asia Pacific Pte Ltd. | General banding and codec banding artifact removal |
US9143776B2 (en) * | 2012-05-07 | 2015-09-22 | Futurewei Technologies, Inc. | No-reference video/image quality measurement with compressed domain features |
US9668699B2 (en) * | 2013-10-17 | 2017-06-06 | Siemens Healthcare Gmbh | Method and system for anatomical object detection using marginal space deep neural networks |
US9536177B2 (en) * | 2013-12-01 | 2017-01-03 | University Of Florida Research Foundation, Inc. | Distributive hierarchical model for object recognition in video |
US20150193947A1 (en) * | 2014-01-06 | 2015-07-09 | Qualcomm Incorporated | System and method to generate high dynamic range images with reduced ghosting and motion blur |
US20170272778A9 (en) * | 2014-01-06 | 2017-09-21 | Samsung Electronics Co., Ltd. | Image encoding and decoding methods for preserving film grain noise, and image encoding and decoding apparatuses for preserving film grain noise |
US9639806B2 (en) * | 2014-04-15 | 2017-05-02 | Xerox Corporation | System and method for predicting iconicity of an image |
EP3271863B1 (en) | 2015-03-20 | 2021-07-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Relevance score assignment for artificial neural network |
US10373050B2 (en) * | 2015-05-08 | 2019-08-06 | Qualcomm Incorporated | Fixed point neural network based on floating point neural network quantization |
CN104992347B (zh) * | 2015-06-17 | 2018-12-14 | 北京奇艺世纪科技有限公司 | 一种视频匹配广告的方法及装置 |
US10499056B2 (en) | 2016-03-09 | 2019-12-03 | Sony Corporation | System and method for video processing based on quantization parameter |
CN106485316B (zh) * | 2016-10-31 | 2019-04-02 | 北京百度网讯科技有限公司 | 神经网络模型压缩方法以及装置 |
CN106778918B (zh) * | 2017-01-22 | 2020-10-30 | 苏州飞搜科技有限公司 | 一种应用于手机端的深度学习图像识别***及实现方法 |
-
2017
- 2017-07-11 US US15/646,737 patent/US10728553B2/en active Active
-
2018
- 2018-06-29 CN CN201880027382.3A patent/CN110637460B/zh active Active
- 2018-06-29 WO PCT/IB2018/054832 patent/WO2019012363A1/en active Application Filing
- 2018-06-29 JP JP2019558385A patent/JP7026878B2/ja active Active
- 2018-06-29 KR KR1020197031103A patent/KR20190127909A/ko not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003153007A (ja) | 2001-07-23 | 2003-05-23 | Eastman Kodak Co | 画像重要度に基づく画像圧縮制御システム及び方法 |
Non-Patent Citations (4)
Title |
---|
LIU, Xin et al.,Spatial complexity based optimal initial quantization parameter determination,2015 Visual Communications and Image Processing (VCIP),IEEE,2016年04月25日,pp. 1-4,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7457913,<DOI: 10.1109/VCIP.2015.7457913> |
SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services - Coding of moving video,Recommendation ITU-T H.264 (10/16) Advanced video coding for generic audiovisual services,ITU-T,2017年01月31日,第90頁 |
ZHANG, Yong and ZHANG, Ming Ming,Application of Artificial Neural Network in Video Compression Coding,2008 International Conference on Information Management, Innovation Management and Industrial Engineering,IEEE,2009年01月06日,pp. 207-210,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=4737529,<DOI: 10.1109/ICIII.2008.298> |
ZHU, Jianying et al.,A novel quantization parameter estimation model based on neural network,2012 International Conference on Systems and Informatics (ICSAI2012),IEEE,2012年06月25日,pp. 2020-2023,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6223448,<DOI: 10.1109/ICSAI.2012.6223448> |
Also Published As
Publication number | Publication date |
---|---|
CN110637460A (zh) | 2019-12-31 |
KR20190127909A (ko) | 2019-11-13 |
JP2020518191A (ja) | 2020-06-18 |
US10728553B2 (en) | 2020-07-28 |
CN110637460B (zh) | 2021-09-28 |
US20190020871A1 (en) | 2019-01-17 |
WO2019012363A1 (en) | 2019-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7026878B2 (ja) | ディープニューラルネットワークを用いた、視覚的品質を維持した量子化パラメータ予測 | |
KR102332490B1 (ko) | 심층 신경망용 압축 방법, 칩, 전자 장치 및 매체 | |
US11095925B2 (en) | Artificial intelligence based resolution improvement system | |
US10834415B2 (en) | Devices for compression/decompression, system, chip, and electronic device | |
CN110765860B (zh) | 摔倒判定方法、装置、计算机设备及存储介质 | |
CN111869220B (zh) | 电子装置及其控制方法 | |
CN108780499A (zh) | 基于量化参数的视频处理的***和方法 | |
CN110622214B (zh) | 基于超体素的时空视频分割的快速渐进式方法 | |
KR102343648B1 (ko) | 영상 부호화 장치 및 영상 부호화 시스템 | |
CN115618051A (zh) | 一种基于互联网的智慧校园监控视频存储方法 | |
TWI577178B (zh) | 影像處理裝置及其影像壓縮方法 | |
CN110650339A (zh) | 一种视频压缩方法、装置及终端设备 | |
CN116757962A (zh) | 一种图像去噪方法、装置 | |
CN111243046B (zh) | 图像质量检测方法、装置、电子设备及存储介质 | |
WO2018123202A1 (ja) | 動画像処理装置、表示装置、動画像処理方法、および制御プログラム | |
Bakhtiari et al. | No-reference video quality assessment by deep feature maps relations | |
CN111488476B (zh) | 图像推送方法、模型训练方法及对应装置 | |
Ding et al. | Improved frequency table adjusting algorithms for context-based adaptive lossless image coding | |
JP2022546774A (ja) | イントラ予測のための補間フィルタリング方法と装置、コンピュータプログラム及び電子装置 | |
EP4391533A1 (en) | Feature map encoding method and apparatus and feature map decoding method and apparatus | |
WO2024084660A1 (ja) | 画像符号化装置、画像復号装置、画像処理システム、モデル学習装置、画像符号化方法、画像復号方法、および、コンピュータ可読記憶媒体 | |
TW201521429A (zh) | 用於移動估計的視訊前處理方法與裝置 | |
RU2782583C1 (ru) | Слияние изображений на блочной основе для контекстной сегментации и обработки | |
Laazoufi et al. | Point Cloud Quality Assessment using 1D VGG16 based Transfer Learning Model | |
CN116934647A (zh) | 基于空间角度可变形卷积网络的压缩光场质量增强方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191025 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201028 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20201225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210714 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210924 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220126 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7026878 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |