JP2023512570A

JP2023512570A - 画像処理方法および関連装置

Info

Publication number: JP2023512570A
Application number: JP2022548020A
Authority: JP
Inventors: 晶王; ▲澤▼ 崔; 博白
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2020-02-07
Filing date: 2021-02-05
Publication date: 2023-03-27
Also published as: KR20220137076A; CA3167227A1; BR112022015510A2; CN113259665A; WO2021155832A1; CN113259665B; EP4090022A1; EP4090022A4; CN115088257A; US20220375133A1; AU2021215764A1; MX2022009686A

Abstract

本出願は、人工知能の分野に関し、第１の画像を取得するステップと、少なくとも１つの第１の特徴マップを取得するために、第１の画像に対して特徴抽出を実行するステップであって、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ステップと、目標圧縮ビットレートを取得するステップであって、目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数である、ステップと、Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するステップと、符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行するステップであって、少なくとも１つの処理された第１の特徴マップがＭ個の第２の特徴値を含む、ステップと、を含む画像処理方法を開示する。本出願では、圧縮ビットレート制御が同じ圧縮モデルで実施され得る。

Description

関連出願の相互参照本出願は、２０２０年２月７日に中国国家知的財産権局に出願された「ＩＭＡＧＥＰＲＯＣＥＳＳＩＮＧＭＥＴＨＯＤＡＮＤＲＥＬＡＴＥＤＤＥＶＩＣＥ」と題する中国特許出願第２０２０１００８２８０８．４号の優先権を主張し、その全体が参照により本明細書に組み込まれる。

本出願は、人工知能の分野に関し、詳細には、画像処理方法および関連装置に関する。

今日、マルチメディアデータは、インターネットトラフィックの大部分を占めている。画像データの圧縮は、マルチメディアデータの記憶および効率的な伝送において極めて重要な役割を果たす。そのため、画像符号化は、実用的価値の高い技術である。

画像符号化は、長い歴史にわたって研究されてきた。研究者らは、大量の方法を提案し、ＪＰＥＧ、ＪＰＥＧ２０００、ＷｅｂＰ、およびＢＰＧなどの様々な国際規格を策定している。これらの符号化方法は、現在広く応用されているが、これらの従来の方法は、画像データの量の増加および絶えず出現する新しいメディアタイプに対していくつかの制限を示す。

近年、研究者らは、深層学習に基づく画像符号化方法の研究を始めている。一部の研究者は、既に良好な結果を達成している。例えば、Ｂａｌｌｅらは、現在の最良の画像符号化性能を凌駕し、さらに現在の最良の従来の符号化標準ＢＰＧを凌駕する、エンドツーエンドの最適画像符号化方法を提案した。しかしながら、現在、深層畳み込みネットワークに基づくほとんどの画像符号化には欠点があり、すなわち、１つの訓練されたモデルは、１つのタイプの入力画像に対して１つの符号化結果しか出力することができず、その結果、実際の要求に基づいた目標圧縮ビットレートの符号化効果が、得られることができない。

本出願は、同一の圧縮モデルにおいて圧縮ビットレート制御を実施するための画像処理方法を提供する。

第１の態様によると、本出願は、画像処理方法を提供する。本方法は、
第１の画像を取得するステップと、少なくとも１つの第１の特徴マップを取得するために、第１の画像に対して特徴抽出を実行するステップであって、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ステップと、目標圧縮ビットレートを取得するステップであって、目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数である、ステップと、Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するステップであって、元の第１の特徴マップが、本出願の本実施形態において少なくとも１つの処理された第１の特徴マップと置き換えられてもよい、ステップと、符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行するステップであって、少なくとも１つの処理された第１の特徴マップがＭ個の第２の特徴値を含む、ステップと、を含む。前述の方式では、圧縮ビットレート制御を実施するために、異なる目標圧縮ビットレートに対して異なる目標ゲイン値が設定される。

第１の態様の任意選択の設計において、少なくとも１つの処理された第１の特徴マップを量子化することによって取得された量子化データの情報エントロピーは、予め設定された条件を満たし、予め設定された条件は、目標圧縮ビットレートに関連する。

第１の態様の任意選択の設計において、目標圧縮ビットレートが大きいほど、量子化されたデータの情報エントロピーがより大きくなることを示す。

第１の態様の任意選択の設計において、符号化データに対応する圧縮ビットレートと目標圧縮ビットレートとの差は、予め設定された範囲内に入る。

第１の態様の任意選択の設計において、Ｍ個の第２の特徴値は、Ｍ個の目標ゲイン値と、対応する第１の特徴値に対して個々に乗算演算を実行することによって取得される。

第１の態様の任意選択の設計において、少なくとも１つの第１の特徴マップは、第１の目標特徴マップを含み、第１の目標特徴マップは、Ｐ個の第１の特徴値を含み、Ｐ個の第１の特徴値のすべてが同じ目標ゲイン値に対応し、ＰがＭ以下の正の整数である。

第１の態様の任意選択の設計において、本方法は、
目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標ゲイン値を決定するステップであって、目標マッピング関係が、圧縮ビットレートとＭ個の目標ゲイン値との間の相関関係を示すために使用される、ステップをさらに含み、
目標マッピング関係が、複数の圧縮ビットレート、複数のゲインベクトル、および複数の圧縮ビットレートと複数のゲインベクトルとの間の相関関係を含み、目標圧縮ビットレートが、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標ゲイン値が、複数のゲインベクトルのうちの１つの要素であり、または
目標マッピング関係が、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標ゲイン値を含む。

第１の態様の任意選択の設計において、目標圧縮ビットレートは、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、第１の圧縮ビットレートは、Ｍ個の第１のゲイン値に対応し、第２の圧縮ビットレートは、Ｍ個の第２のゲイン値に対応し、Ｍ個の目標ゲイン値は、Ｍ個の第１のゲイン値およびＭ個の第２のゲイン値に対して補間演算を実行することによって取得される。

第１の態様の任意選択の設計において、Ｍ個の第１のゲイン値は、第１の目標ゲイン値を含み、Ｍ個の第２のゲイン値は、第２の目標ゲイン値を含み、Ｍ個の目標ゲイン値は、第３の目標ゲイン値を含み、第１の目標ゲイン値、第２の目標ゲイン値、および第３の目標ゲイン値は、Ｍ個の第１の特徴値のうちの同じ特徴値に対応し、第３の目標ゲイン値は、第１の目標ゲイン値および第２の目標ゲイン値に対して補間演算を実行することによって取得される。

第１の態様の任意選択の設計において、第１の画像は、目標オブジェクトを含み、Ｍ個の第１の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

第１の態様の任意選択の設計において、Ｍ個の目標ゲイン値のそれぞれは、１つの逆ゲイン値に対応し、逆ゲイン値は、符号化データの復号プロセスにおいて取得された特徴値を処理するために使用され、Ｍ個の目標ゲイン値のそれぞれと、対応する逆ゲイン値との積は、予め設定された範囲内に入る。

第１の態様の任意選択の設計において、本方法は、少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を実行するステップであって、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、各第３の特徴値が１つの第１の特徴値に対応する、ステップと、Ｍ個の目標逆ゲイン値を取得するステップであって、各目標逆ゲイン値が１つの第３の特徴値に対応する、ステップと、Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値に対してそれぞれゲイン処理を実行するステップと、第２の画像を取得するために、逆ゲイン処理後に取得された少なくとも１つの第２の特徴マップに対して画像再構成を行うステップであって、逆ゲイン処理後に取得された少なくとも１つの第２の特徴マップがＭ個の第４の特徴値を含む、ステップと、をさらに含む。

第１の態様の任意選択の設計において、Ｍ個の第４の特徴値は、Ｍ個の目標逆ゲイン値と、対応する第３の特徴値に対して個々に乗算演算を実行することによって取得される。

第１の態様の任意選択の設計において、少なくとも１つの第２の特徴マップは、第２の目標特徴マップを含み、第２の目標特徴マップは、Ｐ個の第３の特徴値を含み、Ｐ個の第３の特徴値のすべてが同じ目標逆ゲイン値に対応し、ＰがＭ以下の正の整数である。

第１の態様の任意選択の設計において、本方法は、目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標逆ゲイン値を決定するステップであって、目標マッピング関係が圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用される、ステップをさらに含む。

第１の態様の任意選択の設計において、目標マッピング関係は、複数の圧縮ビットレート、複数の逆ゲインベクトル、および複数の圧縮ビットレートと複数の逆ゲインベクトルとの間の相関関係を含み、目標圧縮ビットレートは、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標逆ゲイン値は、複数の逆ゲインベクトルのうちの１つの要素である。

第１の態様の任意選択の設計において、目標マッピング関係は、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標逆ゲイン値を含む。

第１の態様の任意選択の設計において、第２の画像は、目標オブジェクトを含み、Ｍ個の第３の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

第１の態様の任意選択の設計において、Ｍ個の目標ゲイン値のそれぞれと、対応する目標逆ゲイン値との積は、予め設定された範囲内に入る。

第１の態様の任意選択の設計において、目標圧縮ビットレートは、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、第１の圧縮ビットレートは、Ｍ個の第１の逆ゲイン値に対応し、第２の圧縮ビットレートは、Ｍ個の第２の逆ゲイン値に対応し、Ｍ個の目標逆ゲイン値は、Ｍ個の第１の逆ゲイン値およびＭ個の第２の逆ゲイン値に対して補間演算を実行することによって取得される。

第１の態様の任意選択の設計において、Ｍ個の第１の逆ゲイン値は、第１の目標逆ゲイン値を含み、Ｍ個の第２の逆ゲイン値は、第２の目標逆ゲイン値を含み、Ｍ個の目標逆ゲイン値は、第３の目標逆ゲイン値を含み、第１の目標逆ゲイン値、第２の目標逆ゲイン値、および第３の目標逆ゲイン値は、Ｍ個の第３の特徴値のうちの同じ特徴値に対応し、第３の目標逆ゲイン値は、第１の目標逆ゲイン値および第２の目標逆ゲイン値に対して補間演算を実行することによって取得される。

第２の態様によると、本出願は、画像処理方法を提供する。本方法は、
符号化データを取得するステップと、少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を実行するステップであって、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、Ｎが正の整数である、ステップと、Ｍ個の目標逆ゲイン値を取得するステップであって、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である、ステップと、Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理するステップと、第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに基づいて画像再構成を行うステップであって、少なくとも１つの処理された第２の特徴マップがＭ個の第４の特徴値を含む、ステップと、を含む。

第２の態様の任意選択の設計において、Ｍ個の第４の特徴値は、Ｍ個の目標逆ゲイン値と、対応する第３の特徴値に対して個々に乗算演算を実行することによって取得される。

第２の態様の任意選択の設計において、少なくとも１つの第２の特徴マップは、第２の目標特徴マップを含み、第２の目標特徴マップは、Ｐ個の第３の特徴値を含み、Ｐ個の第３の特徴値のすべてが同じ目標逆ゲイン値に対応し、ＰがＭ以下の正の整数である。

第２の態様の任意選択の設計において、本方法は、
目標圧縮ビットレートを取得するステップと、
目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標逆ゲイン値を決定するステップであって、目標マッピング関係が、圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用される、ステップをさらに含み、
目標マッピング関係が、複数の圧縮ビットレート、複数の逆ゲインベクトル、および複数の圧縮ビットレートと複数の逆ゲインベクトルとの間の相関関係を含み、
目標圧縮ビットレートが、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標逆ゲイン値が、複数の逆ゲインベクトルのうちの１つの要素であり、または
目標マッピング関係が、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標逆ゲイン値を含む。

第２の態様の任意選択の設計において、第２の画像は、目標オブジェクトを含み、Ｍ個の第３の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

第２の態様の任意選択の設計において、目標圧縮ビットレートは、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、第１の圧縮ビットレートは、Ｍ個の第１の逆ゲイン値に対応し、第２の圧縮ビットレートは、Ｍ個の第２の逆ゲイン値に対応し、Ｍ個の目標逆ゲイン値は、Ｍ個の第１の逆ゲイン値およびＭ個の第２の逆ゲイン値に対して補間演算を実行することによって取得される。

第２の態様の任意選択の設計において、Ｍ個の第１の逆ゲイン値は、第１の目標逆ゲイン値を含み、Ｍ個の第２の逆ゲイン値は、第２の目標逆ゲイン値を含み、Ｍ個の目標逆ゲイン値は、第３の目標逆ゲイン値を含み、第１の目標逆ゲイン値、第２の目標逆ゲイン値、および第３の目標逆ゲイン値は、Ｍ個の第１の特徴値のうちの同じ特徴値に対応し、第３の目標逆ゲイン値は、第１の目標逆ゲイン値および第２の目標逆ゲイン値に対して補間演算を実行することによって取得される。

第３の態様によると、本出願は、画像処理方法を提供する。本方法は、
第１の画像を取得するステップと、
少なくとも１つの第１の特徴マップを取得するために、符号化ネットワークに基づいて第１の画像に対して特徴抽出を実行するステップであって、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ステップと、
目標圧縮ビットレートを取得するステップであって、目標圧縮ビットレートがＭ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対応し、各初期ゲイン値が１つの第１の特徴値に対応し、各初期逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である、ステップと、
Ｍ個の第２の特徴値を取得するために、Ｍ個の初期ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するステップと、
符号化データおよびビットレート損失を取得するために、量子化ネットワークおよびエントロピー符号化ネットワークに基づいて、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行するステップであって、ゲイン処理後に取得された少なくとも１つの第１の特徴マップがＭ個の第２の特徴値を含む、ステップと、
少なくとも１つの第２の特徴マップを取得するために、エントロピー復号ネットワークに基づいて符号化データに対してエントロピー復号を実行するステップであって、少なくとも１つの第２の特徴マップがＭ個の第３の特徴値を含み、各第３の特徴値が１つの第１の特徴値に対応する、ステップと、
Ｍ個の第４の特徴値を取得するために、Ｍ個の初期逆ゲイン値に基づいて対応する第３の特徴値をそれぞれ処理するステップと、
第２の画像を取得するために、復号ネットワークに基づいて、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行うステップであって、少なくとも１つの処理された特徴マップがＭ個の第４の特徴値を含む、ステップと、
第１の画像に対する第２の画像の歪み損失を取得するステップと、
第１の画像と第２の画像との間の画像歪み値が第１の予め設定された程度に達するまで、損失関数を使用することによって、第１の符号化／復号ネットワーク、Ｍ個の初期ゲイン値、およびＭ個の初期逆ゲイン値に対して共同訓練を実行するステップであって、画像歪み値がビットレート損失および歪み損失に関連し、符号化／復号ネットワークが符号化ネットワーク、量子化ネットワーク、エントロピー符号化ネットワーク、およびエントロピー復号ネットワークを含む、ステップと、
第２の符号化／復号ネットワーク、Ｍ個の目標ゲイン値、およびＭ個の目標逆ゲイン値を出力するステップであって、第２の符号化／復号ネットワークが、第１の符号化／復号ネットワークに対して反復訓練が実行された後に取得されたモデルであり、Ｍ個の目標ゲイン値およびＭ個の目標逆ゲイン値が、Ｍ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対して反復訓練が実行された後に取得される、ステップと、
を含む。

第３の態様の任意選択の設計において、ゲイン処理後に取得された少なくとも１つの第１の特徴マップを量子化することによって取得された量子化データの情報エントロピーは、予め設定された条件を満たし、予め設定された条件は、目標圧縮ビットレートに関連する。

第３の態様の任意選択の設計において、予め設定された条件は、少なくとも、目標圧縮ビットレートが大きいほど量子化されたデータの情報エントロピーがより大きくなることを示すことを含む。

第３の態様の任意選択の設計において、Ｍ個の第２の特徴値は、Ｍ個の目標ゲイン値と、対応する第１の特徴値に対して個々に乗算演算を実行することによって取得される。

第３の態様の任意選択の設計において、少なくとも１つの第１の特徴マップは、第１の目標特徴マップを含み、第１の目標特徴マップは、Ｐ個の第１の特徴値を含み、Ｐ個の第１の特徴値のすべてが同じ目標ゲイン値に対応し、ＰがＭ以下の正の整数である。

第３の態様の任意選択の設計において、第１の画像は、目標オブジェクトを含み、Ｍ個の第１の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

第３の態様の任意選択の設計において、Ｍ個の目標ゲイン値のそれぞれと、対応する目標逆ゲイン値との積は、予め設定された範囲内に入り、Ｍ個の初期ゲイン値のそれぞれと、対応する初期逆ゲイン値との積は、予め設定された範囲内に入る。

第４の態様によると、本出願は、画像処理装置を提供する。本装置は、
第１の画像を取得するように構成された取得モジュールと、
少なくとも１つの第１の特徴マップを取得するために、第１の画像に対して特徴抽出を実行し、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ように構成された特徴抽出モジュールを備え、
取得モジュールが、目標圧縮ビットレートを取得し、目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数であり、
Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するように構成されたゲインモジュールと、
符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行し、少なくとも１つの処理された第１の特徴マップがＭ個の第２の特徴値を含む、ように構成された量子化およびエントロピー符号化モジュールと、
を備える。

第４の態様の任意選択の設計において、少なくとも１つの処理された第１の特徴マップを量子化することによって取得された量子化データの情報エントロピーは、予め設定された条件を満たし、予め設定された条件は、目標圧縮ビットレートに関連する。

第４の態様の任意選択の設計において、予め設定された条件は、少なくとも、
目標圧縮ビットレートが大きいほど、量子化されたデータの情報エントロピーがより大きくなることを示すことを含む。

第４の態様の任意選択の設計において、符号化データに対応する圧縮ビットレートと目標圧縮ビットレートとの差は、予め設定された範囲内に入る。

第４の態様の任意選択の設計において、Ｍ個の第２の特徴値は、Ｍ個の目標ゲイン値と、対応する第１の特徴値に対して個々に乗算演算を実行することによって取得される。

第４の態様の任意選択の設計において、少なくとも１つの第１の特徴マップは、第１の目標特徴マップを含み、第１の目標特徴マップは、Ｐ個の第１の特徴値を含み、Ｐ個の第１の特徴値のすべてが同じ目標ゲイン値に対応し、ＰがＭ以下の正の整数である。

第４の態様の任意選択の設計において、本装置は、
目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標ゲイン値を決定し、目標マッピング関係が、圧縮ビットレートとＭ個の目標ゲイン値との間の相関関係を示すために使用される、ように構成された決定モジュールをさらに備え、
目標マッピング関係が、複数の圧縮ビットレート、複数のゲインベクトル、および複数の圧縮ビットレートと複数のゲインベクトルとの間の相関関係を含み、目標圧縮ビットレートが、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標ゲイン値が、複数のゲインベクトルのうちの１つの要素であり、または
目標マッピング関係が、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標ゲイン値を含む。

第４の態様の任意選択の設計において、目標圧縮ビットレートは、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、第１の圧縮ビットレートは、Ｍ個の第１のゲイン値に対応し、第２の圧縮ビットレートは、Ｍ個の第２のゲイン値に対応し、Ｍ個の目標ゲイン値は、Ｍ個の第１のゲイン値およびＭ個の第２のゲイン値に対して補間演算を実行することによって取得される。

第４の態様の任意選択の設計において、Ｍ個の第１のゲイン値は、第１の目標ゲイン値を含み、Ｍ個の第２のゲイン値は、第２の目標ゲイン値を含み、Ｍ個の目標ゲイン値は、第３の目標ゲイン値を含み、第１の目標ゲイン値、第２の目標ゲイン値、および第３の目標ゲイン値は、Ｍ個の第１の特徴値のうちの同じ特徴値に対応し、第３の目標ゲイン値は、第１の目標ゲイン値および第２の目標ゲイン値に対して補間演算を実行することによって取得される。

第４の態様の任意選択の設計において、第１の画像は、目標オブジェクトを含み、Ｍ個の第１の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

第４の態様の任意選択の設計において、Ｍ個の目標ゲイン値のそれぞれは、１つの逆ゲイン値に対応し、逆ゲイン値は、符号化データの復号プロセスにおいて取得された特徴値を処理するために使用され、Ｍ個の目標ゲイン値のそれぞれと、対応する逆ゲイン値との積は、予め設定された範囲内に入る。

第４の態様の任意選択の設計において、本装置は、
少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、各第３の特徴値が１つの第１の特徴値に対応する、ように構成された復号モジュールをさらに備え、
取得モジュールが、Ｍ個の目標逆ゲイン値を取得し、各目標逆ゲイン値が１つの第３の特徴値に対応する、ようにさらに構成され、
本装置は、
Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値に対してそれぞれゲイン処理を実行するように構成された逆ゲインモジュールと、
第２の画像を取得するために、逆ゲイン処理後に取得された少なくとも１つの第２の特徴マップに対して画像再構成を行い、逆ゲイン処理後に取得された少なくとも１つの第２の特徴マップがＭ個の第４の特徴値を含む、ように構成された再構成モジュールと、
をさらに備える。

第４の態様の任意選択の設計において、Ｍ個の第４の特徴値は、Ｍ個の目標逆ゲイン値と、対応する第３の特徴値に対して個々に乗算演算を実行することによって取得される。

第４の態様の任意選択の設計において、少なくとも１つの第２の特徴マップは、第２の目標特徴マップを含み、第２の目標特徴マップは、Ｐ個の第３の特徴値を含み、Ｐ個の第３の特徴値のすべてが同じ目標逆ゲイン値に対応し、ＰがＭ以下の正の整数である。

第４の態様の光学設計において、決定モジュールは、
目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標逆ゲイン値を決定し、目標マッピング関係が圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用される、ようにさらに構成されている。

第４の態様の任意選択の設計において、目標マッピング関係は、複数の圧縮ビットレート、複数の逆ゲインベクトル、および複数の圧縮ビットレートと複数の逆ゲインベクトルとの間の相関関係を含み、目標圧縮ビットレートは、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標逆ゲイン値は、複数の逆ゲインベクトルのうちの１つの要素である。

第４の態様の任意選択の設計において、目標マッピング関係は、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標逆ゲイン値を含む。

第４の態様の任意選択の設計において、第２の画像は、目標オブジェクトを含み、Ｍ個の第３の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

第４の態様の任意選択の設計において、Ｍ個の目標ゲイン値のそれぞれと、対応する目標逆ゲイン値との積は、予め設定された範囲内に入る。

第４の態様の任意選択の設計において、目標圧縮ビットレートは、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、第１の圧縮ビットレートは、Ｍ個の第１の逆ゲイン値に対応し、第２の圧縮ビットレートは、Ｍ個の第２の逆ゲイン値に対応し、Ｍ個の目標逆ゲイン値は、Ｍ個の第１の逆ゲイン値およびＭ個の第２の逆ゲイン値に対して補間演算を実行することによって取得される。

第４の態様の任意選択の設計において、Ｍ個の第１の逆ゲイン値は、第１の目標逆ゲイン値を含み、Ｍ個の第２の逆ゲイン値は、第２の目標逆ゲイン値を含み、Ｍ個の目標逆ゲイン値は、第３の目標逆ゲイン値を含み、第１の目標逆ゲイン値、第２の目標逆ゲイン値、および第３の目標逆ゲイン値は、Ｍ個の第１の特徴値のうちの同じ特徴値に対応し、第３の目標逆ゲイン値は、第１の目標逆ゲイン値および第２の目標逆ゲイン値に対して補間演算を実行することによって取得される。

第５の態様によると、本出願は、画像処理装置を提供する。本装置は、
符号化データを取得するように構成された取得モジュールと、
少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、Ｎが正の整数である、ように構成された復号モジュールを備え、
取得モジュールが、Ｍ個の目標逆ゲイン値を取得し、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である、ようにさらに構成され、
Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理するように構成された逆ゲインモジュールと、
第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、少なくとも１つの処理された第２の特徴マップがＭ個の第４の特徴値を含む、ように構成された再構成モジュールと、
を備える。

第５の態様の任意選択の設計において、Ｍ個の第４の特徴値は、Ｍ個の目標逆ゲイン値と、対応する第３の特徴値に対して個々に乗算演算を実行することによって取得される。

第５の態様の任意選択の設計において、少なくとも１つの第２の特徴マップは、第２の目標特徴マップを含み、第２の目標特徴マップは、Ｐ個の第３の特徴値を含み、Ｐ個の第３の特徴値のすべてが同じ目標逆ゲイン値に対応し、ＰがＭ以下の正の整数である。

第５の態様の任意選択の設計において、取得モジュールは、目標圧縮ビットレートを取得するようにさらに構成され、
本装置は、
目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標逆ゲイン値を決定し、目標マッピング関係が、圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用される、決定モジュールをさらに備え、
目標マッピング関係が、複数の圧縮ビットレート、複数の逆ゲインベクトル、および複数の圧縮ビットレートと複数の逆ゲインベクトルとの間の相関関係を含み、目標圧縮ビットレートが、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標逆ゲイン値が、複数の逆ゲインベクトルのうちの１つの要素であり、または
目標マッピング関係が、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標逆ゲイン値を含む。

第５の態様の任意選択の設計において、第２の画像は、目標オブジェクトを含み、Ｍ個の第３の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

第５の態様の任意選択の設計において、目標圧縮ビットレートは、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、第１の圧縮ビットレートは、Ｍ個の第１の逆ゲイン値に対応し、第２の圧縮ビットレートは、Ｍ個の第２の逆ゲイン値に対応し、Ｍ個の目標逆ゲイン値は、Ｍ個の第１の逆ゲイン値およびＭ個の第２の逆ゲイン値に対して補間演算を実行することによって取得される。

第５の態様の任意選択の設計において、Ｍ個の第１の逆ゲイン値は、第１の目標逆ゲイン値を含み、Ｍ個の第２の逆ゲイン値は、第２の目標逆ゲイン値を含み、Ｍ個の目標逆ゲイン値は、第３の目標逆ゲイン値を含み、第１の目標逆ゲイン値、第２の目標逆ゲイン値、および第３の目標逆ゲイン値は、Ｍ個の第１の特徴値のうちの同じ特徴値に対応し、第３の目標逆ゲイン値は、第１の目標逆ゲイン値および第２の目標逆ゲイン値に対して補間演算を実行することによって取得される。

第６の態様によると、本出願は、画像処理装置を提供する。本装置は、
第１の画像を取得するように構成された取得モジュールと、
少なくとも１つの第１の特徴マップを取得するために、符号化ネットワークに基づいて第１の画像に対して特徴抽出を実行し、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ように構成された特徴抽出モジュールと、を備え、
取得モジュールが、目標圧縮ビットレートを取得し、目標圧縮ビットレートがＭ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対応し、各初期ゲイン値が１つの第１の特徴値に対応し、各初期逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である、ようにさらに構成され、
Ｍ個の第２の特徴値を取得するために、Ｍ個の初期ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するように構成されたゲインモジュールと、
符号化データおよびビットレート損失を取得するために、量子化ネットワークおよびエントロピー符号化ネットワークに基づいて、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行し、ゲイン処理後に取得された少なくとも１つの第１の特徴マップがＭ個の第２の特徴値を含む、ように構成された量子化およびエントロピー符号化モジュールと、
少なくとも１つの第２の特徴マップを取得するために、エントロピー復号ネットワークに基づいて符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＭ個の第３の特徴値を含み、各第３の特徴値が１つの第１の特徴値に対応する、ように構成された復号モジュールと、
Ｍ個の第４の特徴値を取得するために、Ｍ個の初期逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理するように構成された逆ゲインモジュールと、
第２の画像を取得するために、復号ネットワークに基づいて少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、少なくとも１つの処理された特徴マップがＭ個の第４の特徴値を含む、ように構成された再構成モジュールと、を備え、
取得モジュールが、第１の画像に対する第２の画像の歪み損失を取得するようにさらに構成され、
第１の画像と第２の画像との間の画像歪み値が第１の予め設定された程度に達するまで、損失関数を使用することによって、第１の符号化／復号ネットワーク、Ｍ個の初期ゲイン値、およびＭ個の初期逆ゲイン値に対して共同訓練を実行し、画像歪み値がビットレート損失および歪み損失に関連し、符号化／復号ネットワークが符号化ネットワーク、量子化ネットワーク、エントロピー符号化ネットワーク、およびエントロピー復号ネットワークを含む、ように構成された訓練モジュールと、
第２の符号化／復号ネットワーク、Ｍ個の目標ゲイン値、およびＭ個の目標逆ゲイン値を出力し、第２の符号化／復号ネットワークが、第１の符号化／復号ネットワークに対して反復訓練が実行された後に取得されたモデルであり、Ｍ個の目標ゲイン値およびＭ個の目標逆ゲイン値が、Ｍ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対して反復訓練が実行された後に取得される、ように構成された出力モジュールと、
を備える。

第６の態様の任意選択の設計において、ゲイン処理後に取得された少なくとも１つの第１の特徴マップを量子化することによって取得された量子化データの情報エントロピーは、予め設定された条件を満たし、予め設定された条件は、目標圧縮ビットレートに関連する。

第６の態様の任意選択の設計において、予め設定された条件は、少なくとも、
目標圧縮ビットレートが大きいほど、量子化されたデータの情報エントロピーがより大きくなることを示すことを含む。

第６の態様の任意選択の設計において、Ｍ個の第２の特徴値は、Ｍ個の目標ゲイン値と、対応する第１の特徴値に対して個々に乗算演算を実行することによって取得される。

第６の態様の任意選択の設計において、少なくとも１つの第１の特徴マップは、第１の目標特徴マップを含み、第１の目標特徴マップは、Ｐ個の第１の特徴値を含み、Ｐ個の第１の特徴値のすべてが同じ目標ゲイン値に対応し、ＰがＭ以下の正の整数である。

第６の態様の任意選択の設計において、第１の画像は、目標オブジェクトを含み、Ｍ個の第１の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

第６の態様の任意選択の設計において、Ｍ個の目標ゲイン値のそれぞれと、対応する目標逆ゲイン値との積は、予め設定された範囲内に入り、Ｍ個の初期ゲイン値のそれぞれと、対応する初期逆ゲイン値との積は、予め設定された範囲内に入る。

第７の態様によると、本出願の一実施形態は、実行装置を提供する。実行装置は、メモリ、プロセッサ、およびバスシステムを含むことができる。メモリは、プログラムを記憶するように構成され、プロセッサは、メモリ内のプログラムを実行するように構成され、本プログラムは、
第１の画像を取得するステップと、
少なくとも１つの第１の特徴マップを取得するために、第１の画像に対して特徴抽出を実行するステップであって、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ステップと、
目標圧縮ビットレートを取得するステップであって、目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数である、ステップと、
Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するステップと、
符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行するステップであって、少なくとも１つの処理された第１の特徴マップがＭ個の第２の特徴値を含む、ステップと、
を含む。

第７の態様の任意選択の設計において、実行装置は、仮想現実ＶＲ装置、携帯電話、タブレットコンピュータ、ノートブックコンピュータ、サーバ、またはインテリジェントウェアラブルデバイスである。

本出願の第７の態様では、プロセッサは、第１の態様または第１の態様の任意の可能な実施態様のステップを実行するようにさらに構成されてもよい。詳細については、第１の態様を参照されたい。詳細は、ここでは再び説明されない。

第８の態様によると、本出願の一実施形態は、実行装置を提供する。実行装置は、メモリ、プロセッサ、およびバスシステムを含むことができる。メモリは、プログラムを記憶するように構成され、プロセッサは、メモリ内のプログラムを実行するように構成され、本プログラムは、
符号化データを取得するステップと、
少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を実行するステップであって、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、Ｎが正の整数である、ステップと、
Ｍ個の目標逆ゲイン値を取得するステップであって、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である、ステップと、
Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理するステップと、
第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行うステップであって、少なくとも１つの処理された第２の特徴マップがＭ個の第４の特徴値を含む、ステップと、
を含む。

第８の態様の任意選択の設計において、実行装置は、仮想現実ＶＲ装置、携帯電話、タブレットコンピュータ、ノートブックコンピュータ、サーバ、またはインテリジェントウェアラブルデバイスである。

本出願の第８の態様では、プロセッサは、第２の態様または第２の態様の任意の可能な実施態様のステップを実行するようにさらに構成されてもよい。詳細については、第２の態様を参照されたい。詳細は、ここでは再び説明されない。

第９の態様によると、本出願の一実施形態は、訓練装置を提供する。訓練装置は、メモリと、プロセッサと、バスシステムとを含むことができる。メモリは、プログラムを記憶するように構成され、プロセッサは、メモリ内のプログラムを実行するように構成され、本プログラムは、
第１の画像を取得するステップと、
少なくとも１つの第１の特徴マップを取得するために、符号化ネットワークに基づいて第１の画像に対して特徴抽出を実行するステップであって、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ステップと、
目標圧縮ビットレートを取得するステップであって、目標圧縮ビットレートがＭ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対応し、各初期ゲイン値が１つの第１の特徴値に対応し、各初期逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である、ステップと、
Ｍ個の第２の特徴値を取得するために、Ｍ個の初期ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するステップと、
符号化データおよびビットレート損失を取得するために、量子化ネットワークおよびエントロピー符号化ネットワークに基づいて、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行するステップであって、ゲイン処理後に取得された少なくとも１つの第１の特徴マップがＭ個の第２の特徴値を含む、ステップと、
少なくとも１つの第２の特徴マップを取得するために、エントロピー復号ネットワークに基づいて符号化データに対してエントロピー復号を実行するステップであって、少なくとも１つの第２の特徴マップがＭ個の第３の特徴値を含み、各第３の特徴値が１つの第１の特徴値に対応する、ステップと、
Ｍ個の第４の特徴値を取得するために、Ｍ個の初期逆ゲイン値に基づいて対応する第３の特徴値をそれぞれ処理するステップと、
第２の画像を取得するために、復号ネットワークに基づいて少なくとも１つの処理された第２の特徴マップに対して画像再構成を行うステップであって、少なくとも１つの処理された特徴マップがＭ個の第４の特徴値を含む、ステップと、
第１の画像に対する第２の画像の歪み損失を取得するステップと、
第１の画像と第２の画像との間の画像歪み値が第１の予め設定された程度に達するまで、損失関数を使用することによって、第１の符号化／復号ネットワーク、Ｍ個の初期ゲイン値、およびＭ個の初期逆ゲイン値に対して共同訓練を実行するステップであって、画像歪み値がビットレート損失および歪み損失に関連し、符号化／復号ネットワークが符号化ネットワーク、量子化ネットワーク、エントロピー符号化ネットワーク、およびエントロピー復号ネットワークを含む、ステップと、
第２の符号化／復号ネットワーク、Ｍ個の目標ゲイン値、およびＭ個の目標逆ゲイン値を出力するステップであって、第２の符号化／復号ネットワークが、第１の符号化／復号ネットワークに対して反復訓練が実行された後に取得されたモデルであり、Ｍ個の目標ゲイン値およびＭ個の目標逆ゲイン値が、Ｍ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対して反復訓練が実行された後に取得される、ステップと、
を含む。

本出願の第９の態様では、プロセッサは、第３の態様または第３の態様の任意の可能な実施態様のステップを実行するようにさらに構成されてもよい。詳細については、第３の態様を参照されたい。詳細は、ここでは再び説明されない。

第１０の態様によると、本出願の一実施形態は、コンピュータ可読記憶媒体を提供する。コンピュータ可読記憶媒体は、コンピュータプログラムを記憶する。コンピュータプログラムがコンピュータ上で動作すると、コンピュータは、第１の態様から第３の態様のいずれか一つに記載の画像処理方法を実行することを可能にされる。

第１１の態様によると、本出願の一実施形態は、コンピュータプログラムを提供する。コンピュータプログラムがコンピュータ上で動作すると、コンピュータは、第１の態様から第３の態様のいずれか一つに記載の画像処理方法を実行することを可能にされる。

第１２の態様によると、本出願は、チップシステムを提供する。チップシステムは、前述の態様における機能を実施する際に、例えば、前述の方法におけるデータおよび／または情報を送信または処理する際に、実行装置または訓練装置をサポートするように構成されたプロセッサを含む。想定し得る設計では、チップシステムは、メモリをさらに含む。メモリは、実行装置または訓練装置の必要なプログラム命令およびデータを記憶するように構成されている。チップシステムは、チップを含んでもよく、またはチップおよび別のディスクリート部品を含んでもよい。

本出願の実施形態は、画像処理方法を提供する。第１の画像が取得され、少なくとも１つの第１の特徴マップを取得するために、第１の画像に対して特徴抽出が実行され、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数であり、目標圧縮ビットレートが取得され、目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数であり、対応する第１の特徴値は、Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいてそれぞれ処理され、符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化が実行され、少なくとも１つの処理された第１の特徴マップがＭ個の第２の特徴値を含む。前述の方式では、圧縮ビットレート制御を実施するために、異なる目標圧縮ビットレートに対して異なる目標ゲイン値が設定される。

人工知能メインフレームワークの構造の概略図である。本出願の一実施形態によるアプリケーションシナリオを示す図である。本出願の一実施形態によるアプリケーションシナリオを示す図である。本出願の一実施形態による画像処理方法の実施形態を示す図である。ＣＮＮベースの画像処理プロセスを示す図である。本出願の一実施形態による圧縮ビットレートでの特徴マップの情報エントロピー分布を示す図である。本出願の一実施形態による圧縮ビットレートでの特徴マップの情報エントロピー分布を示す図である。本出願の一実施形態による目標関数マッピング関係を示す図である。本出願の一実施形態による画像処理方法の一実施形態を示す図である。本出願の一実施形態による画像圧縮手順を示す図である。本出願の一実施形態による圧縮効果を示す図である。本出願の一実施形態による訓練プロセスを示す図である。本出願の一実施形態による画像処理プロセスを示す図である。本発明の一実施形態による画像処理システムのシステムアーキテクチャを示す図である。本出願の一実施形態による画像処理方法の概略流れ図である。本発明の一実施形態による画像処理装置の構造の概略図である。本発明の一実施形態による画像処理装置の構造の概略図である。本発明の一実施形態による画像処理装置の構造の概略図である。本出願の一実施形態による実行装置の構造の概略図である。本出願の一実施形態による訓練装置の構造の概略図である。本出願の一実施形態によるチップの構造の概略図である。

以下、本発明の実施形態における図面を参照して本発明の実施形態を説明する。本発明の実施形態で使用される用語は、単に本発明の特定の実施形態を説明するために使用され、本発明を限定することは意図されていない。

以下、本出願の実施形態について図面を参照して説明する。当業者は、本出願の実施形態において提供される技術的解決策が、技術が進化し、新たなシナリオが出現するにつれて、同様の技術的問題にも適用されることを学ぶことができる。

本出願の明細書、特許請求の範囲、および添付の図面において、「第１」、「第２」などの用語は、同様の対象を区別することが意図されているが、必ずしも特定の順番または順序示すものではない。このように使用される用語は、適切な状況において交換可能であり、これは、本出願の実施形態において同じ属性を有する対象を説明する際に使用される区別方式にすぎないことを理解されたい。加えて、「含む（ｉｎｃｌｕｄｅ）」、「有する（ｈａｖｅ）」という用語およびそれらの任意の他の変形は、非排他的な包含をカバーすることを意味しており、したがって、一連のユニットを含むプロセス、方法、システム、製品、またはデバイスは、必ずしもそれらのユニットに限定されず、明示的に列挙されていない他のユニット、またはそのようなプロセス、方法、製品、もしくはデバイスに固有の他のユニットを含むことができる。

まず、人工知能システムの全体的な動作手順が説明される。図１は、人工知能メインフレームワークの構造の概略図である。以下は、前述の人工知能メインフレームワークを、２つの次元、すなわち、「インテリジェント情報チェーン」（横軸）および「ＩＴバリューチェーン」（縦軸）から説明する。「インテリジェント情報チェーン」は、データ取得からデータ処理までの全般的なプロセスを反映する。例えば、プロセスは、インテリジェント情報知覚、インテリジェント情報表現および形成、インテリジェント推論、インテリジェント意思決定、ならびにインテリジェント実行および出力の一般的なプロセスであってもよい。このプロセスでは、データは、「データ情報－知識－知恵」の凝縮プロセスを受ける。「ＩＴバリューチェーン」は、人工知能が情報技術産業にもたらす価値を、人間の知能の基盤となるインフラストラクチャおよび情報（技術の提供や処理の実装）から、システムの産業生態プロセスに反映する。

（１）インフラストラクチャ
インフラストラクチャは、人工知能システムに計算能力のサポートを提供し、外界と通信し、基本プラットフォームを使用することによってサポートを実施する。インフラストラクチャは、センサを使うことによって外部と通信する。計算能力は、インテリジェントチップ（ＣＰＵ、ＮＰＵ、ＧＰＵ、ＡＳＩＣ、またはＦＰＧＡなどのハードウェアアクセラレーションチップ）によって提供される。ベースプラットフォームは、分散計算フレームワークおよびネットワークなどの関連するプラットフォームの保障およびサポートを含み、クラウドストレージおよび計算、相互接続および相互作用ネットワークなどを含むことができる。例えば、センサは、データを取得するために外部と通信し、データは、計算のために、基本プラットフォームによって提供される分散コンピューティングシステム内のインテリジェントチップに提供される。

（２）データ
インフラストラクチャの上位層からのデータは、人工知能分野におけるデータソースを示す。データは、グラフ、画像、音声、テキストに関連し、従来の装置のモノのインターネットデータにさらに関連し、既存のシステムのサービスデータと、力、変位、液位、温度、湿度などの知覚データと、を含む。

（３）データ処理
データ処理は、通常、データ訓練、機械学習、深層学習、検索、推論、および意思決定などの方式を含む。

機械学習および深層学習は、データに対して記号化および形式化されたインテリジェント情報モデリング、抽出、前処理、訓練などを行うことを意味することがある。

推論は、コンピュータまたはインテリジェントシステムにおいて人間のインテリジェントな推論方法をシミュレートし、推論制御ポリシーに基づいて、形式化された情報を使用して機械思考を実行し、問題を解決するプロセスである。推論の典型的な機能は、検索およびマッチングである。

意思決定は、インテリジェント情報の推論の後に決定が行われるプロセスであり、通常、分類、ランク付け、および予測などの機能を提供する。

（４）一般的な能力
データに対して上述のデータ処理が行われた後、翻訳、テキスト分析、コンピュータビジョン処理、音声認識、画像認識などを行うために、いくつかの一般的な能力が、データ処理結果、例えば、アルゴリズムまたは一般的なシステムに基づいてさらに形成されてもよい。

（５）インテリジェント製品および産業応用
インテリジェント製品および産業応用とは、様々な分野における人工知能システムの製品および応用であり、人工知能ソリューション全体のカプセル化、インテリジェント情報意思決定の製品化、および着地応用の実現を示す。その応用分野は、主にインテリジェント端末、インテリジェント交通、インテリジェント医療、自動運転、安全都市などを含む。

本出願は、人工知能分野における画像処理分野に適用されてもよく、以下は、製品着地の複数の適用シナリオを説明する。

Ｉ．端末装置における画像圧縮処理への適用
本出願の実施形態において提供される画像圧縮方法は、端末装置における画像圧縮プロセスに適用されてもよく、具体的には、端末装置におけるアルバム、ビデオ監視などに適用されてよい。詳細については、図２ａを参照されたい。図２ａは、本出願の一実施形態による適用シナリオを示す。図２ａに示されているように、端末装置は、圧縮対象の写真を取得することができる。圧縮対象の写真は、カメラによって撮影された写真またはビデオから抽出された写真のフレームであってもよい。端末装置は、埋め込みニューラルネットワーク処理ユニット（ｎｅｕｒａｌｎｅｔｗｏｒｋｐｒｏｃｅｓｓｉｎｇｕｎｉｔ、ＮＰＵ）の人工知能（ａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅ、ＡＩ）符号化ユニットを使用することによって、取得された圧縮対象の写真に対して特徴抽出を実行し、画像データを冗長度がより低い出力特徴に変換し、出力特徴内の点の確率推定値を生成することができる。中央処理装置（ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ、ＣＰＵ）は、出力特徴における各点の確率推定値を使用することによって、抽出された出力特徴に対して算術符号化を行い、出力特徴の符号化冗長度を低減し、画像圧縮プロセスにおけるデータ伝送量をさらに低減し、符号化後に得られた符号化データをデータファイルの形式で対応する記憶位置に記憶する。ユーザが記憶位置に記憶されたファイルを取得する必要がある場合、ＣＰＵは、対応する記憶位置から、記憶されたファイルを取得およびロードし、算術復号に基づいて復号された特徴マップを取得し、再構成画像を取得するために、ＮＰＵ内のＡＩ復号ユニットを使用することによって特徴マップに対して再構成を行うことができる。

２．クラウド側での画像圧縮処理への適用
本出願の実施形態において提供される画像圧縮方法は、クラウド側での画像圧縮プロセスに適用されてもよく、具体的には、クラウド側のサーバにおいてクラウドアルバムなどの機能に適用されてもよい。詳細については、図２ｂを参照されたい。図２ｂは、本出願の一実施形態による適用シナリオを示す。図２ｂに示されているように、端末装置は、圧縮対象の写真を取得することができる。圧縮対象の写真は、カメラによって撮影された写真またはビデオから抽出された写真のフレームであってもよい。端末装置は、符号化データを取得するために、ＣＰＵを使用することによって、圧縮対象の写真に対して可逆符号化圧縮を行うことができ、可逆符号化圧縮は、例えば、従来技術における任意の可逆圧縮方法に基づいて実行されてよいが、それに基づいて実行されることに限定されない。端末装置は、符号化データをクラウド側のサーバに送信することができる。サーバは、圧縮対象の画像を取得するために、受信された符号化データに対して対応する可逆復号を実行することができる。サーバは、グラフィックス処理ユニット（ｇｒａｐｈｉｃｓｐｒｏｃｅｓｓｉｎｇｕｎｉｔ、ＧＰＵ）内のＡＩ符号化ユニットを使用することによって、取得された圧縮対象の写真に対して特徴抽出を実行して、画像データを冗長度がより低い出力特徴に変換し、出力特徴内の点の確率推定値を生成することができる。ＣＰＵは、出力特徴内の点の確率推定値を使用することによって、抽出された出力特徴に対して算術符号化を実行して、出力特徴の符号化冗長度を低減し、画像圧縮プロセスにおけるデータ伝送量をさらに低減し、符号化後に得られた符号化データをデータファイルの形式で対応する記憶位置に記憶する。ユーザが記憶位置に記憶されたファイルを取得する必要がある場合、ＣＰＵは、対応する記憶位置から、記憶されたファイルを取得およびロードし、算術復号に基づいて復号された特徴マップを取得し、再構成画像を取得するために、ＮＰＵ内のＡＩ復号ユニットを使用することによって特徴マップに対して再構成を行うことができる。サーバは、符号化データを取得するために、ＣＰＵを使用することによって、圧縮対象の写真に対して可逆符号化圧縮を実行することができ、可逆符号化圧縮は、例えば、従来技術における任意の可逆圧縮方法に基づいて実行されてよいが、それに基づいて実行されることに限定されない。サーバは、符号化データを端末装置に送信することができ、端末装置は、復号画像を取得するために、受信された符号化データに対して対応する可逆復号を実行することができる。

本出願の本実施形態では、ＡＩ符号化ユニットと量子化ユニットとの間に、特徴マップ内の特徴値に対してゲイン処理を行うステップが追加されてよく、算術復号ユニットとＡＩ復号ユニットとの間に、特徴マップ内の特徴値に対して逆ゲイン処理を行うステップが追加されてよい。次に、本発明の実施形態における画像処理方法が詳細に説明される。

本出願の実施形態は大量のニューラルネットワークアプリケーションに関するものであるため、理解を容易にするために、以下ではまず、本出願の実施形態において使用され得るニューラルネットワークの関連用語および概念について説明する。

（１）ニューラルネットワーク
ニューラルネットワークは、ニューロンを含むことができる。ニューロンは、ｘｓおよび切片１を入力として使用する演算ユニットであってもよく、演算ユニットの出力は、以下の通りであってもよい。

ここで、
ｓ＝１，２，…，ｎであり、ｎは１よりも大きい自然数であり、ＷｓはＸｓの重みであり、ｂはニューロンのオフセットである。ｆはニューロンの活性化関数（ａｃｔｉｖａｔｉｏｎｆｕｎｃｔｉｏｎ）であり、活性化関数は、非線形特性をニューラルネットワークに導入して、ニューロンの入力信号を出力信号に変換するために使用される。活性化関数の出力信号は、次の畳み込み層の入力として使用されてもよく、活性化関数は、ｓｉｇｍｏｉｄ関数であってもよい。ニューラルネットワークは、複数の単一ニューロンを一緒に接続することによって構成されるネットワークである。具体的には、あるニューロンの出力が別のニューロンの入力であってもよい。各ニューロンの入力は、局所受容野の特徴を抽出するために前の層の局所受容野に接続され得る。局所受容野は、いくつかのニューロンを含む領域であってもよい。

（２）深層ニューラルネットワーク
多層ニューラルネットワークとも呼ばれる深層ニューラルネットワーク（ｄｅｅｐｎｅｕｒａｌｎｅｔｗｏｒｋ、ＤＮＮ）は、複数の隠れ層を有するニューラルネットワークとして理解されてもよい。ＤＮＮは、異なる層の位置に基づいて分割される。ＤＮＮ内部のニューラルネットワークは、入力層、隠れ層および出力層の３つのタイプに分類される。一般に、最初の層は入力層であり、最後の層は出力層であり、中間の層は隠れ層である。層は、完全に接続されている。具体的には、第ｉ層の任意のニューロンは、必ず第（ｉ＋１）層の任意のニューロンに接続されている。

ＤＮＮは、非常に複雑に見えるが、各層の働きは、複雑ではない。つまり、ＤＮＮは、以下の線形関係式である。

ここで、

は入力ベクトルであり、

は出力ベクトルであり、

はオフセットベクトルであり、Ｗは重み行列（係数とも呼ばれる）であり、α（）は活性化関数である。各層は、出力ベクトル

を得るために、単に、入力ベクトル

に対してこのような単純な演算を実行する。ＤＮＮの大量の層に起因して、大量の係数Ｗおよびオフセットベクトル

も存在する。これらのパラメータは、ＤＮＮにおいて以下のように定義される。係数Ｗが一例として使用される。３層ＤＮＮにおいて、第２層の４番目のニューロンから第３層の２番目のニューロンへの線形係数が

と定義されると仮定される。上付き文字３は、係数Ｗが位置される層を表し、下付き文字は、出力の第３層のインデックス２および入力の第２層のインデックス４に対応する。

結論として、第（Ｌ－１）層のｋ番目のニューロンから第Ｌ層のｊ番目のニューロンへの係数が

と定義される。

入力層にパラメータＷが存在しないことに留意されたい。深層ニューラルネットワークでは、隠れ層が多いほど、ネットワークは、現実世界における複雑なケースを記述する能力が高くなる。理論的には、パラメータの多いモデルほどより複雑になり、「容量」が大きくなる。これは、モデルがより複雑な学習タスクを完了できることを示す。深層ニューラルネットワークの訓練は、重み行列を学習するプロセスであり、訓練の最終目的は、訓練された深層ニューラルネットワークのすべての層の重み行列（複数の層のベクトルＷによって形成された重み行列）を取得することである。

（３）畳み込みニューラルネットワーク
畳み込みニューラルネットワーク（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒｏｎｎｅｔｗｏｒｋ、ＣＮＮ）は、畳み込み構造を有する深層ニューラルネットワークである。畳み込みニューラルネットワークは、畳み込み層およびサブサンプリング層を含む特徴抽出器を含む。特徴抽出器は、フィルタとみなすことができる。畳み込み層は、畳み込みニューラルネットワークにおいて、入力信号に対して畳み込み処理を行うニューロン層である。畳み込みニューラルネットワークの畳み込み層では、１つのニューロンは、隣接する層のニューロンの一部にのみ接続されることがある。畳み込み層は、一般に、いくつかの特徴面を含み、各特徴面は、いくつかの矩形に配置されたニューロンを含むことができる。同じ特徴面内のニューロンは重みを共有し、ここで共有される重みは畳み込みカーネルである。重みの共有は、画像情報を抽出する方式が位置に無関係であると理解されてもよい。畳み込みカーネルは、ランダムなサイズの行列の形態で初期化されてもよい。畳み込みニューラルネットワークの訓練プロセスにおいて、学習を通じて畳み込みカーネルに対して適切な重みが取得され得る。加えて、重みの共有は、畳み込みニューラルネットワークの層間の接続が低減され、過剰適合のリスクが低減されるため有利である。

（４）損失関数
深層ニューラルネットワークを訓練するプロセスでは、深層ニューラルネットワークの出力が実際に予測された値に最大限近いことが期待されるため、現在のネットワークの予測値が、期待される目標値と比較されてもよく、次いで、ニューラルネットワークの各層における重みベクトルが、現在の予測値と目標値との差に基づいて更新される（通常、最初の更新の前に初期化プロセスがあり、言い換えれば、パラメータが深層ニューラルネットワークの各層に対して予め設定される）。例えば、ネットワークの予測値が大きい場合、深層ニューラルネットワークが実際に期待される目標値、または実際に期待される目標値に近い値を予測することができるまで、予測値を下げるように重みベクトルが調整される。したがって、「比較によってどのようにして予測値と目標値との差を得るか」は、予め定義される必要がある。これが、損失関数（ｌｏｓｓｆｕｎｃｔｉｏｎ）または目的関数（ｏｂｊｅｃｔｉｖｅｆｕｎｃｔｉｏｎ）である。損失関数および目的関数は、予測値と目標値との差を測定するために使用される重要な式である。損失関数が例として使用される。損失関数の出力値（ｌｏｓｓ）が大きいほど、差が大きいことを示す。したがって、深層ニューラルネットワークの訓練は、ｌｏｓｓをできるだけ最小化するプロセスである。

（５）逆伝播アルゴリズム
訓練プロセスにおいて、ニューラルネットワークは、誤差逆伝播（ｂａｃｋｐｒｏｐａｇａｔｉｏｎ、ＢＰ）アルゴリズムを使用することによって初期のニューラルネットワークモデルにおけるパラメータの値を補正することができ、それにより、ニューラルネットワークモデルの再構成誤差損失がますます小さくなる。具体的には、出力に誤差損失が生成されるまで入力信号が順方向に転送され、誤差逆伝播誤差損失情報に基づいて、誤差損失が小さくなるように初期のニューラルネットワークモデルのパラメータが更新される。逆伝播アルゴリズムは、主に誤差損失に依存する逆伝播の動きであり、最適なニューラルネットワークモデルのパラメータ、例えば、重み行列を取得することを目的とする。

本出願の実施形態は、まずアプリケーションシナリオが端末装置である例を使用することによって説明を提供する。

例えば、端末装置は、携帯電話、タブレットコンピュータ、ノートブックコンピュータ、またはインテリジェントウェアラブルデバイスであってよく、端末装置は、取得された写真に対して圧縮処理を行うことができる。別の例では、端末装置は、仮想現実（ｖｉｒｔｕａｌｒｅａｌｉｔｙ、ＶＲ）装置であってもよい。別の例として、本出願の実施形態は、インテリジェントモニタリングにも適用されてもよい。インテリジェントモニタリングでは、カメラが構成されてもよい。この場合、インテリジェントモニタリングでは、カメラを用いることによって圧縮対象の写真などが取得されてもよい。本出願の実施形態は、画像圧縮が行われる必要がある他のシナリオにさらに適用されてもよいことを理解されたい。他のアプリケーションシナリオは、ここでは１つずつ列挙されない。

図３は、本出願の一実施形態による画像処理方法の一実施形態を示す。図３に示されるように、本出願の本実施形態において提供される画像処理方法は、以下のステップを含む。

３０１．第１の画像を取得する。

本出願の本実施形態では、第１の画像は、圧縮対象の画像である。第１の画像は、カメラを使用することによって前述の端末装置によって撮影された画像であってもよく、または第１の画像は、端末装置から取得された画像（例えば、端末装置のアルバムに記憶された画像、または端末装置によってクラウドから取得された写真）であってもよい。第１の画像は、画像圧縮要件を有する画像であってよく、処理対象の画像のソースは本出願において限定されないことを理解されたい。

３０２．少なくとも１つの第１の特徴マップを取得するために、第１の画像に対して特徴抽出を実行し、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である。

本出願の本実施形態では、任意選択で、端末装置は、少なくとも１つの第１の特徴マップを取得するために、ＣＮＮに基づいて第１の画像に対して特徴抽出を実行することができる。以下では、第１の特徴マップは、チャネルワイズ特徴マップと呼ばれることもあり、各セマンティックチャネルは、１つの第１の特徴マップ（チャネルワイズ特徴マップ）に対応する。

本出願の本実施形態において、図４は、ＣＮＮベースの画像処理プロセスを示す。図４は、第１の画像４０１、ＣＮＮ４０２、および複数の第１の特徴マップ４０３を示す。ＣＮＮ４０２は、複数のＣＮＮ層を含むことができる。

例えば、ＣＮＮ４０２は、入力データ（第１の画像）の左上３×３画素に重みを乗算し、第１の特徴マップの左上ニューロンにマッピングすることができる。乗算される重みも３×３である。次いで、同様の処理において、ＣＮＮ４０２は、入力データ（第１の画像）を左から右へ、上から下へ走査し、入力データに重みを乗算して特徴マップのニューロンにマッピングする。本明細書では、使用される３×３重みは、フィルタまたはフィルタコアと呼ばれる。すなわち、ＣＮＮ４０２にフィルタを適用する処理は、フィルタコアを用いることによって畳み込み演算を行う処理であり、抽出された結果は、「第１の特徴マップ」と呼ばれる。第１の特徴マップは、マルチチャネルワイズ特徴マップと呼ばれることもあり、「マルチチャネルワイズ特徴マップ」という用語は、複数のチャネルに対応する特徴マップのセットであってもよい。一実施形態によると、マルチチャネルワイズ特徴マップは、ＣＮＮ４０２によって生成されてもよく、ＣＮＮ４０２は、ＣＮＮの「特徴抽出層」または「畳み込み層」とも呼ばれる。ＣＮＮの層は、出力から入力へのマッピングを定義することができる。層によって定義されたマッピングは、入力データに適用される１つまたは複数のフィルタコア（畳み込みコア）として実行され、次の層に出力される特徴マップを生成する。入力データは、特定の層の画像または特徴マッピング画像であってもよい。

図４を参照されたい。順方向実行中、ＣＮＮ４０２は、第１の画像４０１を受信し、出力としてマルチチャネルワイズ特徴マップ４０３を生成する。加えて、順方向実行中、次の層４０２は、入力としてマルチチャネルワイズ特徴マップ４０３を受信し、出力としてマルチチャネルワイズ特徴マップ４０３を生成する。次いで、各後続の層は、前の層で生成されたマルチチャネルワイズ特徴マップを受信し、出力として次のマルチチャネルワイズ特徴マップを生成する。最後に、第（Ｎ）層で生成されたマルチチャネルワイズ特徴マップが受信される。

加えて、入力特徴マップを出力特徴マップにマッピングするための畳み込みコアを適用する動作に加えて、別の処理動作が行われてもよい。別の処理動作の例は、活性化関数の適用、プーリング、リサンプリングなどを含むことができるが、これらに限定されない。

上記は、第１の画像に対して特徴抽出を実行するための１つの実施態様にすぎないことに留意されたい。実際の応用では、具体的な特徴抽出の実施態様は限定されない。

本出願の本実施形態では、前述の方式において、元の画像（第１の画像）が、ＣＮＮ畳み込みニューラルネットワークを使用することによって別の空間（少なくとも１つの第１の特徴マップ）に変換される。任意選択で、１９２個の特徴マップがあり、すなわち、１９２個のセマンティックチャネルがあり、各セマンティックチャネルは、１つの第１の特徴マップに対応する。本出願の本実施形態では、少なくとも１つの第１の特徴マップは、３次元テンソルの形態であってもよく、テンソルのサイズは、１９２×ｗ×ｈであってもよく、ｗ×ｈは、単一チャネルの第１の特徴マップに対応する行列の幅および長さである。

本出願の本実施形態では、複数の特徴値を取得するために、第１の画像に対して特徴抽出が実行されてもよい。少なくとも１つの第１の特徴マップは、複数の特徴値の一部または全部を含むことができる。圧縮結果に対して比較的小さい影響を及ぼす一部のセマンティックチャネルに対応する特徴マップに対してはゲイン処理が行われなくてもよい。この場合、少なくとも１つの第１の特徴マップは、複数の特徴値の一部を含む。

本出願の本実施形態では、少なくとも１つの第１の特徴マップは、Ｎ個の第１の特徴値を含み、Ｎが正の整数である。

３０３．目標圧縮ビットレートを取得し、目標圧縮ビットレートは、Ｍ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数である。

本出願の本実施形態では、端末装置は、目標圧縮ビットレートを取得することができる。目標圧縮ビットレートは、ユーザによって指定されてもよく、第１の画像に基づいて端末装置によって決定されてもよい。これは、ここでは限定されない。

本出願の本実施形態では、目標圧縮ビットレートは、Ｍ個の目標ゲイン値に対応し、各目標ゲイン値は、１つの第１の特徴値に対応し、ＭがＮ以下の正の整数である。すなわち、目標圧縮ビットレートとＭ個の目標ゲイン値との間に特定の相関関係があり、目標圧縮ビットレートを取得した後、端末装置は、取得された目標圧縮ビットレートに基づいて、Ｍ個の対応する目標ゲイン値を決定することができる。

任意選択で、一実施形態では、端末装置は、目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標ゲイン値を決定することができる。目標マッピング関係は、圧縮ビットレートとＭ個の目標ゲイン値との間の相関関係を示すために使用される。目標マッピング関係は、予め記憶されたマッピング関係であってもよい。目標圧縮ビットレートを取得した後、端末装置は、対応する記憶位置において、目標圧縮ビットレートに対応する目標マッピング関係を直接見つけることができる。

任意選択で、一実施形態では、目標マッピング関係は、複数の圧縮ビットレート、複数のゲインベクトル、および複数の圧縮ビットレートと複数のゲインベクトルとの間の相関関係を含んでもよく、目標圧縮ビットレートは、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標ゲイン値は、複数のゲインベクトルのうちの１つの要素である。

本出願の本実施形態では、目標マッピング関係は、予め設定されたテーブルまたは別の形態であってよい。目標マッピング関係は、複数の圧縮ビットレートと、圧縮ビットレートに対応するゲインベクトルとを含む。ゲインベクトルは、複数の要素を含むことができ、各圧縮ビットレートは、Ｍ個の目標ゲイン値に対応し、Ｍ個の目標ゲイン値は、各圧縮ビットレートに対応するゲインベクトルに含まれる要素である。

任意選択で、一実施形態では、目標マッピング関係は、目標関数マッピング関係を含むことができ、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標ゲイン値を含む。

本出願の本実施形態では、目標マッピング関係は、予め設定された目標関数マッピング関係または別の形態であってもよい。目標関数マッピング関係は、少なくとも圧縮ビットレートとゲイン値との対応関係を示すことができる。目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標ゲイン値を含む。

本出願の本実施形態では、Ｍ個の目標ゲイン値の一部または全部が同じであってもよいことに留意されたい。この場合、Ｍ個の目標特徴値内の、第１の特徴値に対応する目標ゲイン値を示すために、Ｍ個未満の数が使用されてもよい。例えば、一実施形態では、少なくとも１つの第１の特徴マップは、第１の目標特徴マップを含み、第１の目標特徴マップは、Ｐ個の第１の特徴値を含み、Ｐ個の第１の特徴値のすべてが同じ目標ゲイン値に対応し、ＰがＭ以下の正の整数である。すなわち、Ｐ個の第１の特徴値は、同じセマンティックチャネルの特徴値であり、同じ目標ゲイン値に対応する。この場合、Ｐ個の第１の特徴値は、１つのゲイン値を使用することによって示されてもよい。

別の実施形態では、各セマンティックチャネルに対応する第１の特徴値のゲイン値が同じである場合、Ｍ個の第１のゲイン値は、セマンティックチャネルと同じ数の目標ゲイン値を使用することによって示されてもよい。具体的には、１９２個のセマンティックチャネル（第１の特徴マップ）がある場合、Ｍ個の第１のゲイン値は、１９２個のゲイン値を使用することによって示されてもよい。

本出願の本実施形態では、少なくとも１つの第１の特徴マップのすべてまたは一部のそれぞれに含まれる第１の特徴値は、同じ目標ゲイン値に対応することができる。この場合、少なくとも１つの第１の特徴マップは、第１の目標特徴マップを含み、第１の目標特徴マップは、Ｐ個の第１の特徴値を含み、Ｐ個の第１の特徴値のすべてが同じ目標ゲイン値に対応し、ＰがＭ以下の正の整数である。すなわち、第１の目標特徴マップは、少なくとも１つの第１の特徴マップのうちの１つであり、Ｐ個の第１の特徴値を含み、Ｐ個の第１の特徴値のすべてが同じ目標ゲイン値に対応する。

本出願の本実施形態では、Ｎ個の第１の特徴値は、少なくとも１つの第１の特徴マップに含まれるすべての特徴値であってよい。ＭがＮと同じである場合、これは、少なくとも１つの第１の特徴マップに含まれるすべての特徴値のそれぞれが、対応する目標ゲイン値を有することに相当する。ＭがＮ未満である場合、これは、少なくとも１つの第１の特徴マップに含まれる特徴値の一部が、対応する目標ゲイン値を有することに相当する。一実施形態では、第１の特徴マップの数が１よりも大きい場合、少なくとも１つの第１の特徴マップの一部のそれぞれに含まれるすべての特徴値のそれぞれは、対応する目標ゲイン値を有し、少なくとも１つの第１の特徴マップの一部のそれぞれに含まれる特徴値の一部は、対応する目標ゲイン値を有する。

任意選択で、一実施形態では、第１の画像は、目標オブジェクトを含み、Ｍ個の第１の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

本出願の本実施形態では、一部のシナリオにおいて、Ｍ個の第１の特徴値は、Ｎ個の第１の特徴値内の、１つまたは複数の目標オブジェクトに対応する特徴値である。例えば、モニタで撮影された映像コンテンツについては、ゲイン処理は、シーンが比較的固定されている領域に対しては行われなくてもよく、ゲイン処理は、その領域を通過する物体や人物のコンテンツに対して行われてもよい。

３０４．Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理する。

本出願の本実施形態では、目標圧縮ビットレートおよび目標圧縮ビットレートに対応するＭ個の目標ゲイン値が取得された後、Ｍ個の第２の特徴値を取得するために、対応する第１の特徴値は、Ｍ個の目標ゲイン値に基づいてそれぞれ処理されてもよい。一実施形態では、Ｍ個の第２の特徴値は、Ｍ個の目標ゲイン値と、対応する第１の特徴値に対して個々に乗算演算を行うことによって取得され、すなわち、対応する第２の特徴値は、第１の特徴値に、対応する目標ゲイン値が乗算された後に取得されてもよい。

本出願の本実施形態では、同じＡＩ圧縮モデルにおいて異なる圧縮ビットレートの効果を実装するために、異なる目標ゲイン値が、異なる取得された目標圧縮ビットレートに対して取得されてもよい。Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値がそれぞれ処理された後、元の第１の画像に対応する少なくとも１つの特徴マップに含まれるＮ個の第１の特徴値の分布は、ゲイン処理が行われるＭ個の第１の特徴値に起因して変化する。

本出願の本実施形態では、図５ａおよび図５ｂは、本出願の実施形態による異なる圧縮ビットレートに対する特徴マップの分布を示す。異なる圧縮ビットレートは、異なる画素当たりのビット（ｂｉｔｓｐｅｒｐｉｘｅｌ、ｂｐｐ）を使用することによって表される。ｂｐｐは、各画素を記憶するために使用されるビットの数を表し、ｂｐｐが小さいほど、圧縮ビットレートが小さいことを示す。図５ａは、ｂｐｐが１の場合のＮ個の第１の特徴値の分布を示す。図５ｂは、ｂｐｐが０．１５の場合のＮ個の第１の特徴値の分布を示す。より高い圧縮ビットレートのモデルの符号化ネットワークの出力特徴（Ｎ個の第１の特徴値）は、統計的ヒストグラムにおいてより大きい分散を有し、したがって、量子化後に取得される情報エントロピーがより大きくなる。したがって、異なる圧縮ビットレートが異なる目標ゲイン値に対応することを条件として、異なる目標圧縮ビットレートに基づいてＮ個の第１の特徴値に対して異なる程度にゲイン処理が行われ、その結果、単一のＡＩ圧縮モデルで複数のビットレートの再構成効果が実装され得る。具体的には、Ｍ個の目標ゲイン値の選択規則は以下の通りである。目標圧縮ビットレートが大きいほど、対応する第１の特徴値がＭ個の目標ゲイン値に基づいてそれぞれ処理された後に取得されるＮ個の第１の特徴値がより分散した分布を示しており、したがって、量子化後に取得される情報エントロピーがより大きくなる。

本出願の本実施形態では、複数の第１の特徴マップを取得するために、第１の画像に対して特徴抽出が行われた後、すべての抽出された第１の特徴マップが処理される必要がある。複数の第１の特徴マップに含まれる特徴値は、同一の目標ゲイン値に対応する。この場合、複数の第１の特徴マップに含まれるＮ個の第１の特徴値の分布を変更するために、複数の第１の特徴マップに含まれるすべての特徴値に、対応する目標ゲイン値が乗算される。目標圧縮ビットレートが大きいほど、Ｎ個の第１の特徴値の分布がより分散することを示す。

本出願の本実施形態では、複数の第１の特徴マップを取得するために、第１の画像に対して特徴抽出が行われた後、すべての抽出された第１の特徴マップが処理される必要がある。複数の第１の特徴マップのそれぞれに含まれる特徴値は、同じ目標ゲイン値に対応し、すなわち、各第１の特徴マップは、１つの目標ゲイン値に対応する。この場合、複数の第１の特徴マップに含まれるＮ個の第１の特徴値の分布を変更するために、複数の第１の特徴マップのそれぞれに含まれる特徴値に、対応する目標ゲイン値が乗算される。目標圧縮ビットレートが大きいほど、Ｎ個の第１の特徴値の分布がより分散することを示す。

本出願の本実施形態では、複数の第１の特徴マップを取得するために、第１の画像に対して特徴抽出が行われた後、すべての抽出された第１の特徴マップが処理される必要がある。第１の特徴マップの一部のそれぞれに含まれる特徴値は、同じ目標ゲイン値に対応し、第１の特徴マップの残りの部分のそれぞれに含まれる特徴値は、異なる目標ゲイン値に対応し、すなわち、第１の特徴マップの一部のそれぞれは、１つの目標ゲイン値に対応し、第１の特徴マップの残りの部分のそれぞれは、複数の目標ゲイン値に対応する（同じ特徴マップにおける異なる特徴値は、異なる目標ゲイン値に対応することがある）。この場合、複数の第１の特徴マップに含まれるＮ個の第１の特徴値の分布を変更するために、複数の第１の特徴マップの一部のそれぞれに含まれる特徴値に、対応する目標ゲイン値が乗算され、複数の第１の特徴マップの残りの部分に含まれる特徴値に、対応する目標ゲイン値が乗算される。目標圧縮ビットレートが大きいほど、Ｎ個の第１の特徴値の分布がより分散することを示す。

本出願の本実施形態では、複数の第１の特徴マップを取得するために、第１の画像に対して特徴抽出が行われた後、抽出された第１の特徴マップの一部が処理される必要がある（圧縮結果に対して比較的小さい影響を及ぼす一部のセマンティックチャネルに対応する第１の特徴マップに対してはゲイン処理が行われなくてもよい）。処理される必要がある抽出された第１の特徴マップの数は、１よりも大きい。複数の第１の特徴マップのそれぞれに含まれる特徴値は、同じ目標ゲイン値に対応し、すなわち、各第１の特徴マップは、１つの目標ゲイン値に対応する。この場合、複数の第１の特徴マップに含まれるＮ個の第１の特徴値の分布を変更するために、複数の第１の特徴マップのそれぞれに含まれる特徴値に、対応する目標ゲイン値が乗算される。目標圧縮ビットレートが大きいほど、Ｎ個の第１の特徴値の分布がより分散することを示す。

本出願の本実施形態では、複数の第１の特徴マップを取得するために、第１の画像に対して特徴抽出が行われた後、抽出された第１の特徴マップの一部が処理される必要がある（圧縮結果に対して比較的小さい影響を及ぼす一部のセマンティックチャネルに対応する第１の特徴マップに対してはゲイン処理が行われなくてもよい）。処理される必要がある抽出された第１の特徴マップの数は、１よりも大きい。第１の特徴マップの一部のそれぞれに含まれる特徴値は、同じ目標ゲイン値に対応し、第１の特徴マップの残りの部分のそれぞれに含まれる特徴値は、異なる目標ゲイン値に対応し、すなわち、第１の特徴マップの一部のそれぞれは、１つの目標ゲイン値に対応し、第１の特徴マップの残りの部分のそれぞれは、複数の目標ゲイン値に対応する（同じ特徴マップにおける異なる特徴値は、異なる目標ゲイン値に対応することがある）。この場合、複数の第１の特徴マップに含まれるＮ個の第１の特徴値の分布を変更するために、複数の第１の特徴マップの一部のそれぞれに含まれる特徴値に、対応する目標ゲイン値が乗算され、複数の第１の特徴マップの残りの部分に含まれる特徴値に、対応する目標ゲイン値が乗算される。目標圧縮ビットレートが大きいほど、Ｎ個の第１の特徴値の分布がより分散することを示す。

本出願の本実施形態では、複数の第１の特徴マップを取得するために、第１の画像に対して特徴抽出が行われた後、抽出された第１の特徴マップの一部が処理される必要がある（圧縮結果に対して比較的小さい影響を及ぼす一部のセマンティックチャネルに対応する第１の特徴マップに対してはゲイン処理が行われなくてもよい）。処理される必要がある抽出された第１の特徴マップの数は、１に等しく、第１の特徴マップに含まれる特徴値は、同じ目標ゲイン値に対応し、すなわち、第１の特徴マップは、１つの目標ゲイン値に対応する。この場合、複数の第１の特徴マップに含まれるＮ個の第１の特徴値の分布を変更するために、第１の特徴マップに含まれる特徴値に、対応する目標ゲイン値が乗算される。目標圧縮ビットレートが大きいほど、Ｎ個の第１の特徴値の分布がより分散することを示す。

本出願の本実施形態では、複数の第１の特徴マップを取得するために、第１の画像に対して特徴抽出が行われた後、抽出された第１の特徴マップの一部が処理される必要がある（圧縮結果に対して比較的小さい影響を及ぼす一部のセマンティックチャネルに対応する第１の特徴マップに対してはゲイン処理が行われなくてもよい）。処理される必要がある抽出された第１の特徴マップの数は、１に等しく、第１の特徴マップに含まれる特徴値は、異なる目標ゲイン値に対応し、すなわち、第１の特徴マップは、複数の目標ゲイン値に対応する（同じ特徴マップにおける異なる特徴値は、異なる目標ゲイン値に対応することがある）。この場合、複数の第１の特徴マップに含まれるＮ個の第１の特徴値の分布を変更するために、第１の特徴マップに含まれる特徴値に、対応する目標ゲイン値が乗算される。目標圧縮ビットレートが大きいほど、Ｎ個の第１の特徴値の分布がより分散することを示す。

第１の特徴マップに含まれる第１の特徴値に対してのみゲイン処理が行われてもよいことに留意されたい。

セマンティックチャネルの特徴値に対して同じスケールのゲイン処理が行われる場合、すなわち、すべてのセマンティックチャネルに対応する複数の第１の特徴マップに含まれる第１の特徴値が同じ目標ゲイン値に対応する場合、Ｎ個の第１の特徴値の情報エントロピーは、変更され得るが、圧縮効果は、比較的低いことに留意されたい。したがって、基本ゲイン演算ユニットは、セマンティックチャネルレベル（すべてのセマンティックチャネルのうちの少なくとも２つに対応する第１の特徴マップのそれぞれに含まれる第１の特徴値が、異なる目標ゲイン値に対応する）または特徴値レベル（セマンティックチャネルに対応する第１の特徴マップに含まれるすべての第１の特徴値のうちの少なくとも２つが、異なる目標ゲイン値に対応する）に設定され、その結果、比較的良好な圧縮効果が達成され得る。

以下では、前述の技術的効果を実装することができるＭ個の目標ゲイン値をどのように取得するかを説明する。

１．手動決定方式
本出願の本実施形態では、目標関数マッピング関係は、手動で決定されてもよい。各セマンティックチャネルに対応する第１の特徴マップに含まれる第１の特徴値が同じ目標ゲイン値に対応する場合、目標関数マッピング関係の入力は、セマンティックチャネルおよび目標圧縮ビットレートであってもよく、目標関数マッピング関係の出力は、対応する目標ゲイン値である（第１の特徴マップに含まれる第１の特徴値が同じ目標ゲイン値に対応するため、セマンティックチャネルに対応するすべての目標ゲイン値は、１つの目標ゲイン値を使用することによって表され得る）。例えば、各セマンティックチャネルに対応する目標ゲイン値は、線形関数、二次関数、三次関数、または四次関数を使用することによって決定され得る。図６は、本出願の一実施形態による目標関数マッピング関係を示す。図６に示されるように、目標関数マッピング関係は、線形関数であり、関数の入力は、セマンティックチャネルシーケンス番号（例えば、セマンティックチャネルシーケンス番号１～１９２がある）であり、関数の出力は、目標マッピング関数であり、各目標圧縮ビットレートは、異なる目標関数マッピング関係に対応する。目標圧縮ビットレートが大きいほど、目標関数マッピング関係の傾きがより小さくなることに対応する。二次非線形関数または三次非線形関数の近似分布則もこれと同様であり、詳細は、ここでは説明されない。

本出願の本実施形態では、Ｍ個の第１の特徴値のそれぞれに対応する目標ゲイン値は、手動で決定され得る。目標圧縮ビットレートが大きいほど、Ｎ個の第１の特徴値の分布がより分散されることを示すことを条件として、具体的な設定方式は、本出願において限定されない。

２．訓練方式
本出願の本実施形態では、各目標圧縮ビットレートに対応するＭ個の目標ゲイン値を訓練方式で取得することは、復号側の処理と組み合わされる必要がある。したがって、各目標圧縮ビットレートに対応するＭ個の目標ゲイン値を訓練方式で取得することは、後続の実施形態において詳細に説明され、詳細は、ここでは説明されない。

３０５．符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を行い、少なくとも１つの処理された第１の特徴マップがＭ個の第２の特徴値を含む。

本出願の本実施形態では、Ｍ個の第２の特徴値を取得するために、対応する第１の特徴値がＭ個の目標ゲイン値に基づいてそれぞれ処理された後、符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化が行われてもよい。少なくとも１つの処理された第１の特徴マップは、Ｍ個の第２の特徴値を含む。

本出願の本実施形態では、Ｎ個の第１の特徴値は、後続のエントロピー符号化を容易にするために、指定された規則に従って量子化中心に変換される。量子化演算は、Ｎ個の第１の特徴値を浮動小数点数からビットストリーム（例えば、８ビット整数または４ビット整数などの特定ビット整数を使用するビットストリーム）に変換することができる。一部の実施形態では、量子化演算は、丸め（ｒｏｕｎｄ）を行うことによってＮ個の第１の特徴値に対して実行されてもよいが、これに限定されない。

本出願の本実施形態では、少なくとも１つの処理された第１の特徴マップを量子化することによって取得された量子化データの情報エントロピーは、予め設定された条件を満たし、予め設定された条件は、目標圧縮ビットレートに関連する。具体的には、目標圧縮ビットレートが大きいほど、量子化データの情報エントロピーがより大きくなることを示す。

本出願の本実施形態では、出力特徴における点の確率推定値は、エントロピー推定ネットワークを使用することによって取得されてよく、バイナリビットストリームを取得するために、この確率推定値を使用することによって出力特徴に対してエントロピー符号化が行われる。本出願におけるエントロピー符号化処理では、既存のエントロピー符号化技術が使用されてもよく、詳細は本出願において説明されないことに留意されたい。

本出願の本実施形態では、符号化データに対応する圧縮ビットレートと目標圧縮ビットレートとの差は、予め設定された範囲内に入る。予め設定された範囲は、実際の応用において選択されてよい。符号化データに対応する圧縮ビットレートと目標圧縮ビットレートとの差が許容可能な範囲内に入るという条件で、具体的な予め設定された範囲は、本出願において限定されない。

本出願の本実施形態では、符号化データが取得された後、符号化データは、伸張用の端末装置に送信されてもよい。この場合、伸張用の画像処理装置がデータを伸張することができる。あるいは、圧縮用の端末装置は、符号化データを記憶装置に記憶することができる。符号化データが必要とされる場合、端末装置は、記憶装置から符号化データを取得し、符号化データを伸張することができる。

任意選択で、一実施形態では、目標圧縮ビットレートは、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、第１の圧縮ビットレートは、Ｍ個の第１のゲイン値に対応し、第２の圧縮ビットレートは、Ｍ個の第２のゲイン値に対応し、Ｍ個の目標ゲイン値は、Ｍ個の第１のゲイン値およびＭ個の第２のゲイン値に対して補間演算を実行することによって取得される。本出願の本実施形態では、Ｍ個の第１の値は、第１の目標ゲイン値を含み、Ｍ個の第２のゲイン値は、第２の目標ゲイン値を含み、Ｍ個の目標ゲイン値は、第３の目標ゲイン値を含み、第１の目標ゲイン値、第２の目標ゲイン値、および第３の目標ゲイン値は、Ｍ個の第１の特徴値のうちの同じ特徴値に対応し、第３の目標ゲイン値は、第１の目標ゲイン値および第２の目標ゲイン値に対して補間演算を実行することによって取得される。

本出願の本実施形態では、複数の圧縮ビットレートの圧縮効果が単一のモデルにおいて実装され得る。具体的には、異なる圧縮ビットレートに対する圧縮効果を実装するために、複数の目標圧縮ビットレートに対して異なる目標ゲイン値が対応して設定されてもよい。次いで、圧縮ビットレート範囲内の任意の圧縮効果の新しいゲイン値を取得するために、補間アルゴリズムを使用することによって目標ゲイン値に対して補間演算が実行されてもよい。具体的には、Ｍ個の第１ゲイン値は、第１の目標ゲイン値を含み、Ｍ個の第２ゲイン値は、第２の目標ゲイン値を含み、Ｍ個の目標ゲイン値は、第３の目標ゲイン値を含み、第１の目標ゲイン値、第２の目標ゲイン値および第３の目標ゲイン値は、Ｍ個の第１の特徴値のうちの同じ特徴値に対応し、第３の目標ゲイン値は、第１の目標ゲイン値および第２の目標ゲイン値に対して補間演算を実行することによって取得される。補間演算は、以下の式に基づいて実行され得る。
ｍ_ｌ＝［（ｍ_ｉ）^ｌ・（ｍ_ｊ）^１－ｌ］、ここで
ｍ_ｌは、第３の目標ゲイン値を表し、ｍ_ｉは、第１の目標ゲイン値を表し、ｍ_ｊは、第２の目標ゲイン値を表し、ｍ_ｌ、ｍ_ｉ、およびｍ_ｊは、同じ特徴値に対応し、ｌ∈（０，１）は、調整係数であり、目標圧縮ビットレートのサイズに基づいて決定されてもよい。

本出願の本実施形態では、複数の圧縮ビットレートのそれぞれに対応するＭ個の目標ゲイン値が取得された後、目標圧縮ビットレートに対応する圧縮が実行される場合、目標圧縮ビットレートに隣接する２つの圧縮ビットレートに対応する２つのグループの目標ゲイン値（各グループはＭ個の目標ゲイン値を含む）が複数の圧縮ビットレートから決定されてよく、目標圧縮ビットレートに対応するＭ個の目標ゲイン値を取得するために、２つのグループの目標ゲイン値に対して前述の補間処理が実行される。本出願の本実施形態では、圧縮ビットレート区間におけるＡＩ圧縮モデルの任意の圧縮効果が実装され得る。

本出願の本実施形態では、Ｍ個の目標ゲイン値のそれぞれは、１つの逆ゲイン値に対応し、逆ゲイン値は、符号化データの復号プロセスにおいて取得された特徴値を処理するために使用され、Ｍ個の目標ゲイン値のそれぞれと、対応する逆ゲイン値との積は、予め設定された範囲内に入る。復号側の逆ゲインプロセスは、後続の実施形態において説明され、詳細は、ここでは説明されない。

本出願の本実施形態は、画像処理方法を提供する。第１の画像が取得され、少なくとも１つの第１の特徴マップを取得するために、第１の画像に対して特徴抽出が実行され、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数であり、目標圧縮ビットレートが取得され、目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数であり、対応する第１の特徴値は、Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいてそれぞれ処理され、符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化が実行され、少なくとも１つの処理された第１の特徴マップがＭ個の第２の特徴値を含む。前述の方式では、圧縮ビットレート制御を実施するために、異なる目標圧縮ビットレートに対して異なる目標ゲイン値が設定される。

図７は、本出願の一実施形態による画像処理方法の一実施形態を示す。図７に示されるように、本実施形態において提供される画像処理方法は、以下のステップを含む。

７０１．符号化データを取得する。

本出願の本実施形態では、図３および対応する実施形態において取得された符号化データが取得され得る。

本出願の本実施形態では、符号化データが取得された後、符号化データは、伸張用の端末装置に送信されてもよい。この場合、伸張用の画像処理装置は、符号化データを取得して伸張することができる。あるいは、圧縮用の端末装置は、符号化データを記憶装置に記憶することができる。符号化データが必要とされる場合、端末装置は、記憶装置から符号化データを取得し、符号化データを伸張することができる。

７０２．少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を行い、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、Ｎが正の整数である。

本出願の本実施形態では、符号化データは、再構成された出力特徴（少なくとも１つの第２の特徴マップ）を取得するために、従来技術におけるエントロピー復号技術を使用することによって復号されてもよい。少なくとも１つの第２の特徴マップは、Ｎ個の第３の特徴値を含む。

本出願の本実施形態における少なくとも１つの第２の特徴マップは、前述の少なくとも１つの処理された第１の特徴マップと同じであってもよいことに留意されたい。

７０３．Ｍ個の目標逆ゲイン値を取得し、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である。

任意選択で、一実施形態では、目標圧縮ビットレートが取得されてよく、目標圧縮ビットレートに対応するＭ個の目標逆ゲイン値は、目標マッピング関係に基づいて決定されてよい。目標マッピング関係は、圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用される。目標マッピング関係は、複数の圧縮ビットレート、複数の逆ゲインベクトル、および複数の圧縮ビットレートと複数の逆ゲインベクトルとの間の相関関係を含み、目標圧縮ビットレートは、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標逆ゲイン値は、複数の逆ゲインベクトルのうちの１つの要素であり、または目標マッピング関係は、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標逆ゲイン値を含む。

本出願の本実施形態では、目標逆ゲイン値は、図３に対応する実施形態における目標ゲイン値を取得するステップにおいて取得されてもよい。これは、ここでは限定されない。

任意選択で、一実施形態では、少なくとも１つの第２の特徴マップは、第２の目標特徴マップを含み、第２の目標特徴マップは、Ｐ個の第３の特徴値を含み、Ｐ個の第３の特徴値のすべてが同じ目標逆ゲイン値に対応し、ＰがＭ以下の正の整数である。

任意選択で、一実施形態では、第２の画像は、目標オブジェクトを含み、Ｍ個の第３の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

７０４．Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理する。

本出願の本実施形態では、Ｍ個の第４の特徴値は、Ｍ個の目標逆ゲイン値と、対応する第３の特徴値に対して個々に乗算演算を実行することによって取得されてもよい。具体的には、本出願の本実施形態では、Ｍ個の第４の特徴値を取得するために、少なくとも１つの第２の特徴マップ内のＭ個の第３の特徴値に、対応する逆ゲイン値がそれぞれ乗算され、その結果、逆ゲイン処理後に取得される少なくとも１つの第２の特徴マップがＭ個の第４の特徴値を含む。逆ゲイン処理は、図３に対応する実施形態におけるゲイン処理と組み合わされ、その結果、正常な画像解析が保証され得る。

７０５．第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、少なくとも１つの処理された第２の特徴マップがＭ個の第４の特徴値を含む。

本出願の本実施形態では、Ｍ個の第４の特徴値が取得された後、第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成が実行されてもよい。少なくとも１つの処理された第２の特徴マップは、Ｍ個の第４の特徴値を含む。少なくとも１つの第２の特徴マップは、前述のやり方で解析され、第２の画像に再構成される。

任意選択で、一実施形態では、目標圧縮ビットレートは、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、第１の圧縮ビットレートは、Ｍ個の第１の逆ゲイン値に対応し、第２の圧縮ビットレートは、Ｍ個の第２の逆ゲイン値に対応し、Ｍ個の目標逆ゲイン値は、Ｍ個の第１の逆ゲイン値およびＭ個の第２の逆ゲイン値に対して補間演算を実行することによって取得される。本出願の本実施形態では、Ｍ個の第１の逆ゲイン値は、第１の目標逆ゲイン値を含み、Ｍ個の第２の逆ゲイン値は、第２の目標逆ゲイン値を含み、Ｍ個の目標逆ゲイン値は、第３の目標逆ゲイン値を含み、第１の目標逆ゲイン値、第２の目標逆ゲイン値、および第３の目標逆ゲイン値は、Ｍ個の第１の特徴値のうちの同じ特徴値に対応し、第３の目標逆ゲイン値は、第１の目標逆ゲイン値および第２の目標逆ゲイン値に対して補間演算を実行することによって取得される。

本出願の本実施形態では、Ｍ個の目標ゲイン値のそれぞれは、１つの逆ゲイン値に対応し、逆ゲイン値は、符号化データの復号プロセスにおいて取得される特徴値を処理するために使用され、Ｍ個の目標ゲイン値のそれぞれと、対応する逆ゲイン値との積は、予め設定された範囲内に入り、すなわち、同じ特徴値に対応する目標ゲイン値と逆ゲイン値との間には、以下の特定の値関係がある。２つの値の積は、予め設定された範囲内に入る。予め設定された範囲は、値「１」に近い値範囲であってもよく、ここでは限定されない。

本出願の本実施形態は、画像処理方法を提供する。符号化データが取得され、少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号が実行され、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、Ｎが正の整数であり、Ｍ個の目標逆ゲイン値が取得され、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である。Ｍ個の第４の特徴値を取得するために、対応する第３の特徴値がＭ個の目標逆ゲイン値に基づいてそれぞれ処理され、第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成が実行され、少なくとも１つの処理された第２の特徴マップがＭ個の第４の特徴値を含む。前述の方式では、圧縮ビットレート制御を実施するために、異なる目標圧縮ビットレートに対して異なる目標逆ゲイン値が設定される。

次に、変分オートエンコーダ（ｖａｒｉａｔｉｏｎａｌａｕｔｏｅｎｃｏｄｅｒ、ＶＡＥ）のアーキテクチャが、本出願の実施形態において提供される画像圧縮方法を説明するための例として使用される。変分オートエンコーダは、データ圧縮またはノイズ低減のために使用されるオートエンコーダである。

図８は、本出願の一実施形態による画像圧縮手順を示す。

本実施形態は、同じセマンティックチャネルに対応する目標ゲイン値が同じであり、同じセマンティックチャネルに対応する目標逆ゲイン値が同じである例を使用することによって説明を提供する。１９２個のセマンティックチャネルが存在し、訓練中に４つの指定されたコードポイント（４つの圧縮ビットレート）で訓練が行われる必要がある。各圧縮ビットレートは、１つの目標ゲインベクトルおよび１つの目標逆ゲインベクトルに対応する。目標ゲインベクトルｍ_ｉは、圧縮ビットレートに対応する、サイズが１９２×１であるベクトルである。目標逆ゲインベクトル

は、圧縮ビットレートに対応する、サイズが１９２×１であるベクトルである。ｙは、符号化ネットワークの出力特徴（少なくとも１つの第１の特徴マップを含む）であり、出力特徴のサイズは、１９２×ｗ×ｈである。ｗ×ｈは、単一のセマンティックチャネルの特徴マップの幅および長さである。

およびｙ’は、それぞれ、ゲイン処理、量子化、エントロピー符号化、エントロピー復号、および逆ゲイン処理後に取得される新しい出力特徴であり、サイズが、すべてｙと同じである。本実施形態では、ＶＡＥ法が基本モデルフレームとして使用され、ゲインユニットおよび逆ゲインユニットが追加される。図８に示されるように、モデル実行は以下のステップであってもよい。

８０１．第１の画像が符号化ネットワークに入った後に出力特徴ｙを取得する。

８０２．ゲイン処理後に取得される出力特徴

を取得するために、チャネルごとに出力特徴ｙと、対応するゲインベクトルｍ_ｉを乗算する。

８０３．特徴

を取得するために、出力特徴

を量子化する。

８０４．エントロピー推定モジュールを使用することによって出力特徴における点の確率推定値を取得し、バイナリビットストリームを取得するために、確率推定値を使用することによって出力特徴に対してエントロピー符号化を実行する。

８０５．再構成された出力特徴

を取得するために、エントロピー復号器を使用することによってバイナリビットストリームに対してエントロピー復号を実行する。

８０６．逆ゲイン処理後に取得される出力特徴ｙ’を取得するために、チャネルごとに出力特徴

と、対応する逆ゲインベクトル

を乗算する。

８０７．出力特徴が復号ネットワークに入った後、出力特徴ｙ’を解析して第２の画像に再構成する。

図９を参照されたい。図９の左図は、マルチスケール構造類似度指標尺度（ｍｕｌｔｉ－ｓｃａｌｅｓｔｒｕｃｔｕｒａｌｓｉｍｉｌａｒｉｔｙｉｎｄｅｘｍｅａｓｕｒｅ、ＭＳ－ＳＳＩＭ）が評価指標として使用される条件下で、本実施形態の単一モデルにおけるレート歪み性能（非破線）と、従来技術におけるＶＡＥ法を用いることによって４つの圧縮モデルを別々に訓練する場合のレート歪み性能（破線）との比較を示し、横座標がＢＰＰであり、縦座標がＭＳ－ＳＳＩＭである。図９の右図は、ピーク信号対雑音比（ｐｅａｋｓｉｇｎａｌｔｏｎｏｉｓｅｒａｔｉｏ、ＰＳＮＲ）が評価指標として使用される条件下で、本実施形態の単一モデルにおけるレート歪み性能（非破線）と、従来技術におけるＶＡＥ法を用いることによって４つの圧縮モデルを別々に訓練した場合のレート歪み性能（破線）との比較を示し、横座標がＢＰＰであり、縦座標がＰＳＮＲである。本実施形態では、モデルパラメータ数がＶＡＥ法の単一モデルのモデルパラメータ数と基本的に一致するという前提で、両方の評価指標に基づいて任意のビットレートの圧縮効果が実装され得て、圧縮効果は、ＶＡＥ法のマルチモデル実装効果よりも悪くなく、モデルの記憶量がＮ倍（Ｎは、本発明の本実施形態の異なるビットレートの圧縮効果を実装するためにＶＡＥ法において必要なモデルの数である）低減され得ることが分かる。

図１０は、本出願の一実施形態による訓練プロセスを示す。図１０に示されるように、本実施形態におけるモデルの損失関数は、以下の通りである。
ｌｏｓｓ＝ｌ_ｄ＋β・ｌ_ｒ、ここで
ｌ_ｄは、第１の画像に対する第２の画像の、評価指標に基づいて計算される歪み損失であり、ｌ_ｒは、計算を通してエントロピー推定ネットワークによって取得されるビットレート損失（またはビットレート推定値と呼ばれる）であり、βは、歪み損失とビットレート推定値との間のトレードオフを調整するためのラグランジュ係数である。

異なる圧縮ビットレートと一致するゲイン行列および逆ゲイン行列｛Ｍ，Ｍ’｝を取得するために、モデル訓練プロセスが図１０に示されてもよい。損失関数におけるラグランジュ係数βは、モデル訓練プロセスにおいて絶えず変換され、対応するゲインおよび逆ゲインベクトル

は、ゲインおよび逆ゲイン行列｛Ｍ，Ｍ’｝とモデルとの共同最適化を実施するために、ランダムに初期化されたゲインおよび逆ゲイン行列｛Ｍ，Ｍ’｝から選択され、符号化ネットワークのバックエンドおよび復号ネットワークのフロントエンドにそれぞれ配置される。このようにして、複数の圧縮ビットレートの圧縮効果が単一モデルで実装され得る。

例えば、４つの圧縮ビットレートの圧縮効果が単一モデルにおいて実装され得る。訓練によって得られた４つのゲインベクトルに、対応する逆ゲインベクトルが乗算される。異なる圧縮ビットレートに対応する目標ゲインベクトルおよび目標逆ゲインベクトルにおける対応する要素の乗算結果は、ほぼ等しく、その結果、以下の関係式が得られることができる。

ここで

および

は、それぞれ、異なる圧縮ビットレートに対応するゲインと逆ゲインベクトルの対であり、Ｃは、要素がすべて定数であるベクトルであり、ｉ，ｊ∈（１，４）である。

単一モデルにおいて連続的なビットレートの調整を実施するために、本実施形態では、前述の式を使用することによって、以下の導出が実行されてもよい。

ｍ_ｉおよびｍ_ｊは、ゲイン／逆ゲイン行列における２つの隣接するゲイン／逆ゲインベクトルであり、ｌ∈（０，１）は、調整係数である。

本出願の本実施形態では、新しいゲインと逆ゲインベクトルの対を取得するために、訓練を通して取得された４つの隣接するゲインと逆ゲインベクトルの対に対して補間演算が実行されてもよい。

異なる圧縮ビットレートにマッチングするゲイン行列Ｍを取得するために、訓練プロセスは以下の通りである。本実施形態では、損失関数におけるラグランジュ係数は、モデル訓練プロセスにおいて絶えず変換され、対応するゲインベクトルｍ_ｉおよび逆ゲインベクトル

は、ランダムに初期化されたゲイン行列Ｍから選択される。逆ゲインベクトル

は、ゲインベクトルｍ_ｉの逆数を取得することによって生成されてもよい。詳細については、前述の実施形態のステップ７０５における目標ゲイン値および目標逆ゲイン値の選択規則の説明を参照されたい。詳細は、ここでは説明されない。

本出願の本実施形態では、ゲインベクトルｍ_ｉおよび逆ゲインベクトル

は、ゲイン行列Ｍおよびモデルの共同最適化を実施するために、符号化ネットワークのバックエンドおよび復号ネットワークのフロントエンドにそれぞれ配置される。このようにして、４つのビットレートの圧縮効果が単一モデルにおいて実装され得る。詳細については、図１１を参照されたい。図１１は、本出願の一実施形態による画像処理プロセスを示す。次いで、補間アルゴリズムを使用することによって、訓練を通して取得された４つの隣接するゲインと逆ゲインベクトルの対に対して補間演算が実行され、その結果、ビットレート区間における任意の圧縮効果の新しいゲインベクトルが取得され得る。

本実施形態では、モデルパラメータの数が単一のＶＡＥ法モデルのモデルパラメータの数と基本的に一致するという前提で、任意のビットレートの圧縮効果が実装され得て、圧縮効果は、各ビットレートでの独立した訓練の効果よりも悪くなく、モデルの記憶量がＮ倍削減され得る（Ｎは、ＶＡＥ法において本発明の本実施形態の異なるビットレートの圧縮効果を実装するために必要なモデルの数である）。

ＶＡＥのみが、説明のためのアーキテクチャとして上記で使用されていることに留意されたい。実際の適用においては、画像圧縮方法は、別のＡＩ圧縮モデルアーキテクチャ（例えば、オートエンコーダａｕｔｏ－ｅｎｃｏｄｅｒまたは別の画像圧縮モデル）にさらに適用されてもよい。これは、本出願では限定されない。

図１２は、本出願の一実施形態による画像処理システムのシステムアーキテクチャの図である。図１２において、画像処理システム２００は、実行装置２１０と、訓練装置２２０と、データベース２３０と、クライアント装置２４０と、データ記憶システム２５０と、を含む。実行装置２１０は、計算モジュール２１１を含む。

データベース２３０は、第１の画像のセットを記憶する。訓練装置２２０は、第１の画像を処理するために使用される目標モデル／ルール２０１を生成し、成熟した目標モデル／ルール２０１を取得するために、データベース内の第１の画像を使用することによって目標モデル／ルール２０１に対して反復訓練を実行する。本出願の本実施形態は、目標モデル／ルール２０１が第２の符号化／復号ネットワークと、各圧縮ビットレートに対応するＭ個の目標ゲイン値およびＭ個の目標逆ゲイン値と、を含む例を使用することによって説明を提供する。

第２の符号化／復号ネットワーク、ならびに訓練装置２２０によって取得される各圧縮ビットレートに対応するＭ個の目標ゲイン値およびＭ個の目標逆ゲイン値は、携帯電話、タブレットコンピュータ、ノートブックコンピュータ、ＶＲ装置、または監視システムなどの異なるシステムまたは装置に適用されてもよい。実行装置２１０は、データ記憶システム２５０内のデータ、コードなどを呼び出すことができ、またはデータ記憶システム２５０内のデータ、命令などを記憶することができる。データ記憶システム２５０は、実行装置２１０内に配置されてもよく、またはデータ記憶システム２５０は、実行装置２１０に対する外部メモリであってもよい。

計算モジュール２１１は、少なくとも１つの第１の特徴マップを取得するために、第２の符号化／復号ネットワークを使用することによって、クライアント装置２４０によって受信された第１の画像に対して特徴抽出を実行し、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数であり、目標圧縮ビットレートを取得し、目標圧縮ビットレートが、Ｍ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数であり、Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理し、符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行し、少なくとも１つの処理された第１の特徴マップがＭ個の第２の特徴値を含む。

計算モジュール２１１は、少なくとも１つの第２の特徴マップを取得するために、第２の符号化／復号ネットワークを使用することによって、符号化データに対してエントロピー復号をさらに実行し、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、Ｎが正の整数であり、Ｍ個の目標逆ゲイン値を取得し、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数であり、Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理し、第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、少なくとも１つの処理された第２の特徴マップがＭ個の第４の特徴値を含む。

本出願の一部の実施形態において、図１２を参照されたい。実行装置２１０およびクライアント装置２４０は、独立した装置であってもよい。Ｉ／Ｏインターフェース２１２は、クライアント装置２４０とデータを交換するために実行装置２１０内に構成されている。「ユーザ」は、クライアント装置２４０を使用することによって第１の画像をＩ／Ｏインターフェース２１２に入力することができ、実行装置２１０は、第２の画像をユーザに提供するために、Ｉ／Ｏインターフェース２１２を使用することによって第２の画像をクライアント装置２４０に返す。

図１２は、本発明の一実施形態による画像処理システムのアーキテクチャの概略図にすぎず、図に示される装置、構成要素、モジュールなどの位置関係は、なんら限定を構成するものではないことに留意されたい。例えば、本出願の一部の他の実施形態では、実行装置２１０は、クライアント装置２４０内に構成されてもよい。例えば、クライアント装置が携帯電話またはタブレットコンピュータである場合、実行装置２１０は、携帯電話またはタブレットコンピュータのホスト中央処理ユニット（ＨｏｓｔＣＰＵ）内の、アレイ画像を処理するように構成されたモジュールであってもよく、または実行装置２１０は、携帯電話またはタブレットコンピュータ内のグラフィックス処理ユニット（ｇｒａｐｈｉｃｓｐｒｏｃｅｓｓｉｎｇｕｎｉｔ、ＧＰＵ）またはニューラルネットワーク処理ユニット（ＮＰＵ）であってもよい。ＧＰＵまたはＮＰＵは、コプロセッサとしてホスト中央処理装置に搭載され、ホスト中央処理装置は、ＧＰＵまたはＮＰＵにタスクを割り当てる。

前述の説明を参照して、以下は、本出願の実施形態において提供される画像処理方法の訓練段階の具体的な実施手順を説明することから始まる。

１．訓練段階
詳細については、図１３を参照されたい。図１３は、本出願の一実施形態による画像処理方法の概略流れ図である。本出願の本実施形態において提供される画像処理方法は、以下のステップを含むことができる。

１３０１．第１の画像を取得する。

１３０２．少なくとも１つの第１の特徴マップを取得するために、符号化ネットワークに基づいて第１の画像に対して特徴抽出を行い、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である。

１３０３．目標圧縮ビットレートを取得し、目標圧縮ビットレートがＭ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対応し、各初期ゲイン値が１つの第１の特徴値に対応し、各初期逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である。

１３０４．Ｍ個の第２の特徴値を取得するために、Ｍ個の初期ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理する。

１３０５．符号化データおよびビットレート損失を取得するために、量子化ネットワークおよびエントロピー符号化ネットワークに基づいて、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行し、ゲイン処理後に取得された少なくとも１つの第１の特徴マップがＭ個の第２の特徴値を含む。

１３０６．少なくとも１つの第２の特徴マップを取得するために、エントロピー復号ネットワークに基づいて符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＭ個の第３の特徴値を含み、各第３の特徴値が１つの第１の特徴値に対応する。

１３０７．Ｍ個の第４の特徴値を取得するために、Ｍ個の初期逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理する。

１３０８．第２の画像を取得するために、復号ネットワークに基づいて、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、少なくとも１つの処理された特徴マップがＭ個の第４の特徴値を含む。

１３０９．第１の画像に対する第２の画像の歪み損失を取得する。

１３１０．第１の画像と第２の画像との間の画像歪み値が第１の予め設定された程度に達するまで、損失関数を使用することによって、第１の符号化／復号ネットワーク、Ｍ個の初期ゲイン値、およびＭ個の初期逆ゲイン値に対して共同訓練を実行し、画像歪み値がビットレート損失および歪み損失に関連し、符号化／復号ネットワークが符号化ネットワーク、量子化ネットワーク、エントロピー符号化ネットワーク、およびエントロピー復号ネットワークを含む。

１３１１．第２の符号化／復号ネットワーク、Ｍ個の目標ゲイン値、およびＭ個の目標逆ゲイン値を出力し、第２の符号化／復号ネットワークが、反復訓練が第１の符号化／復号ネットワークに対して実行された後に取得されたモデルであり、Ｍ個の目標ゲイン値およびＭ個の目標逆ゲイン値が、反復訓練がＭ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対して実行された後に取得される。

ステップ１３０１～ステップ１３１１の具体的な説明については、前述の実施形態における説明を参照されたい。これは、ここでは限定されない。

任意選択で、少なくとも１つの処理された第１の特徴マップを量子化することによって取得された量子化データの情報エントロピーは、予め設定された条件を満たし、予め設定された条件は、目標圧縮ビットレートに関連する。

任意選択で、予め設定された条件は、少なくとも、
目標圧縮ビットレートが大きいほど、量子化されたデータの情報エントロピーがより大きくなることを示すことを含む。

任意選択で、Ｍ個の第２の特徴値は、Ｍ個の初期ゲイン値と、対応する第１の特徴値に対して個々に乗算演算を実行することによって取得される。

任意選択で、Ｍ個の第４の特徴値は、Ｍ個の初期逆ゲイン値と、対応する第３の特徴値に対して個々に乗算演算を実行することによって取得される。

任意選択で、Ｍ個の目標ゲイン値のそれぞれと、対応する目標逆ゲイン値との積は、予め設定された範囲内に入り、Ｍ個の初期ゲイン値のそれぞれと、対応する初期逆ゲイン値との積は、予め設定された範囲内に入る。

図１～図１３に対応する実施形態によると、本出願の実施形態における前述の解決策をより良好に実施するために、以下は、前述の解決策を実施するように構成された関連装置をさらに提供する。詳細については、図１４を参照されたい。図１４は、本出願の一実施形態による画像処理装置１４００の構成の概略図である。画像処理装置１４００は、端末装置またはサーバであってもよく、画像処理装置１４００は、
第１の画像を取得するように構成された取得モジュール１４０１と、
少なくとも１つの第１の特徴マップを取得するために、第１の画像に対して特徴抽出を実行し、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ように構成された特徴抽出モジュール１４０２と、を備え、
取得モジュール１４０１が、目標圧縮ビットレートを取得するようにさらに構成され、目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数であり、
Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するように構成されたゲインモジュール１４０３と、
符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行し、少なくとも１つの処理された第１の特徴マップがＭ個の第２の特徴値を含む、ように構成された量子化およびエントロピー符号化モジュール１４０４と、
を備える。

任意選択で、符号化データに対応する圧縮ビットレートと目標圧縮ビットレートとの差は、予め設定された範囲内に入る。

任意選択で、Ｍ個の第２の特徴値は、Ｍ個の目標ゲイン値と、対応する第１の特徴値に対して個々に乗算演算を実行することによって取得される。

任意選択で、少なくとも１つの第１の特徴マップは、第１の目標特徴マップを含み、第１の目標特徴マップは、Ｐ個の第１の特徴値を含み、Ｐ個の第１の特徴値のすべてが同じ目標ゲイン値に対応し、ＰがＭ以下の正の整数である。

任意選択で、本装置は、
目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標ゲイン値を決定するように構成された決定モジュールであって、目標マッピング関係が、圧縮ビットレートとＭ個の目標ゲイン値との間の相関関係を示すために使用される、決定モジュールをさらに備え、
目標マッピング関係が、複数の圧縮ビットレート、複数のゲインベクトル、および複数の圧縮ビットレートと複数のゲインベクトルとの間の相関関係を含み、目標圧縮ビットレートが、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標ゲイン値が、複数のゲインベクトルのうちの１つの要素であり、または
目標マッピング関係が、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標ゲイン値を含む。

任意選択で、目標圧縮ビットレートは、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、第１の圧縮ビットレートは、Ｍ個の第１のゲイン値に対応し、第２の圧縮ビットレートは、Ｍ個の第２のゲイン値に対応し、Ｍ個の目標ゲイン値は、Ｍ個の第１のゲイン値およびＭ個の第２のゲイン値に対して補間演算を実行することによって取得される。

任意選択で、Ｍ個の第１のゲイン値は、第１の目標ゲイン値を含み、Ｍ個の第２のゲイン値は、第２の目標ゲイン値を含み、Ｍ個の目標ゲイン値は、第３の目標ゲイン値を含み、第１の目標ゲイン値、第２の目標ゲイン値、および第３の目標ゲイン値は、Ｍ個の第１の特徴値のうちの同じ特徴値に対応し、第３の目標ゲイン値は、第１の目標ゲイン値および第２の目標ゲイン値に対して補間演算を実行することによって取得される。

任意選択で、第１の画像は、目標オブジェクトを含み、Ｍ個の第１の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

任意選択で、Ｍ個の目標ゲイン値のそれぞれは、１つの逆ゲイン値に対応し、逆ゲイン値は、符号化データの復号プロセスにおいて取得された特徴値を処理するために使用され、Ｍ個の目標ゲイン値のそれぞれと、対応する逆ゲイン値との積は、予め設定された範囲内に入る。

任意選択で、本装置は、
少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、各第３の特徴値が１つの第１の特徴値に対応する、ように構成された復号モジュールをさらに備え、
取得モジュールが、Ｍ個の目標逆ゲイン値を取得し、各目標逆ゲイン値が１つの第３の特徴値に対応する、ようにさらに構成され、
本装置は、
Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値に対してそれぞれゲイン処理を実行するように構成された逆ゲインモジュールと、
第２の画像を取得するために、逆ゲイン処理後に取得された少なくとも１つの第２の特徴マップに対して画像再構成を行い、逆ゲイン処理後に取得された少なくとも１つの第２の特徴マップがＭ個の第４の特徴値を含む、ように構成された再構成モジュールと、
をさらに備える。

任意選択で、Ｍ個の第４の特徴値は、Ｍ個の目標逆ゲイン値と、対応する第３の特徴値に対して個々に乗算演算を実行することによって取得される。

任意選択で、少なくとも１つの第２の特徴マップは、第２の目標特徴マップを含み、第２の目標特徴マップは、Ｐ個の第３の特徴値を含み、Ｐ個の第３の特徴値のすべてが同じ目標逆ゲイン値に対応し、ＰがＭ以下の正の整数である。

任意選択で、決定モジュールは、
目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標逆ゲイン値を決定し、目標マッピング関係が圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用される、ようにさらに構成されている。

任意選択で、目標マッピング関係は、複数の圧縮ビットレートと、複数の逆ゲインベクトルと、複数の圧縮ビットレートと複数の逆ゲインベクトルとの間の相関関係とを含み、目標圧縮ビットレートは、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標逆ゲイン値は、複数の逆ゲインベクトルのうちの１つの要素である。

任意選択で、目標マッピング関係は、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標逆ゲイン値を含む。

任意選択で、第２の画像は、目標オブジェクトを含み、Ｍ個の第３の特徴値は、少なくとも１つの特徴マップ内の、目標オブジェクトに対応する特徴値である。

任意選択で、Ｍ個の目標ゲイン値のそれぞれと、対応する目標逆ゲイン値との積は、予め設定された範囲内に入る。

任意選択で、目標圧縮ビットレートは、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、第１の圧縮ビットレートは、Ｍ個の第１の逆ゲイン値に対応し、第２の圧縮ビットレートは、Ｍ個の第２の逆ゲイン値に対応し、Ｍ個の目標逆ゲイン値は、Ｍ個の第１の逆ゲイン値およびＭ個の第２の逆ゲイン値に対して補間演算を実行することによって取得される。

任意選択で、Ｍ個の第１の逆ゲイン値は、第１の目標逆ゲイン値を含み、Ｍ個の第２の逆ゲイン値は、第２の目標逆ゲイン値を含み、Ｍ個の目標逆ゲイン値は、第３の目標逆ゲイン値を含み、第１の目標逆ゲイン値、第２の目標逆ゲイン値、および第３の目標逆ゲイン値は、Ｍ個の第１の特徴値のうちの同じ特徴値に対応し、第３の目標逆ゲイン値は、第１の目標逆ゲイン値および第２の目標逆ゲイン値に対して補間演算を実行することによって取得される。

本出願の本実施形態は、画像処理装置１４００を提供する。取得モジュール１４０１は、第１の画像を取得する。特徴抽出モジュール１４０２は、少なくとも１つの第１の特徴マップを取得するために、第１の画像に対して特徴抽出を実行し、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である。取得モジュール１４０１は、目標圧縮ビットレートを取得し、目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数である。ゲインモジュール１４０３は、Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値を処理する。量子化およびエントロピー符号化モジュール１４０４は、符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行し、少なくとも１つの処理された第１の特徴マップがＭ個の第２の特徴値を含む。前述の方式では、圧縮ビットレート制御を実施するために、異なる目標圧縮ビットレートに対して異なる目標ゲイン値が設定される。

図１５は、本発明の一実施形態による画像処理装置１５００の構成の概略図である。画像処理装置１５００は、端末装置またはサーバであってもよく、画像処理装置１５００は、
符号化データを取得するように構成された取得モジュール１５０１と、
少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、Ｎが正の整数である、ように構成された復号モジュール１５０２と、を備え、
取得モジュール１５０１がＭ個の目標逆ゲイン値を取得し、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である、ようにさらに構成され、
Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理するように構成された逆ゲインモジュール１５０３と、
第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、少なくとも１つの処理された第２の特徴マップがＭ個の第４の特徴値を含む、ように構成された再構成モジュール１５０４と、
を備える。

任意選択で、取得モジュールは、目標圧縮ビットレートを取得するようにさらに構成され、
本装置は、
目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標逆ゲイン値を決定し、目標マッピング関係が、圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用される、決定モジュールをさらに備え、
目標マッピング関係が、複数の圧縮ビットレート、複数の逆ゲインベクトル、および複数の圧縮ビットレートと複数の逆ゲインベクトルとの間の相関関係を含み、目標圧縮ビットレートが、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標逆ゲイン値が、複数の逆ゲインベクトルのうちの１つの要素であり、または
目標マッピング関係が、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標逆ゲイン値を含む。

本発明の本実施形態は、画像処理装置を提供する。取得モジュール１５０１は、符号化データを取得する。復号モジュール１５０２は、少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、Ｎが正の整数である。取得モジュール１５０１は、Ｍ個の目標逆ゲイン値を取得し、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である。逆ゲインモジュール１５０３は、Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理する。再構成モジュール１５０４は、第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、少なくとも１つの処理された第２の特徴マップがＭ個の第４の特徴値を含む。前述の方式では、圧縮ビットレート制御を実施するために、異なる目標圧縮ビットレートに対して異なる目標ゲイン値が設定される。

図１６は、本出願の一実施形態による画像処理装置１６００の構成の概略図である。画像処理装置１６００は、端末装置またはサーバであってもよく、画像処理装置１６００は、
第１の画像を取得するように構成された取得モジュール１６０１と、
少なくとも１つの第１の特徴マップを取得するために、符号化ネットワークに基づいて第１の画像に対して特徴抽出を実行し、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ように構成された特徴抽出モジュール１６０２と、を備え、
取得モジュール１６０１が、目標圧縮ビットレートを取得し、目標圧縮ビットレートがＭ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対応し、各初期ゲイン値が１つの第１の特徴値に対応し、各初期逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である、ようにさらに構成され、
Ｍ個の第２の特徴値を取得するために、Ｍ個の初期ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するように構成されたゲインモジュール１６０３と、
符号化データおよびビットレート損失を取得するために、量子化ネットワークおよびエントロピー符号化ネットワークに基づいて、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行し、ゲイン処理後に取得された少なくとも１つの第１の特徴マップがＭ個の第２の特徴値を含む、ように構成された量子化およびエントロピー符号化モジュール１６０４と、
少なくとも１つの第２の特徴マップを取得するために、エントロピー復号ネットワークに基づいて符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＭ個の第３の特徴値を含み、各第３の特徴値が１つの第１の特徴値に対応する、ように構成された復号モジュール１６０５と、
Ｍ個の第４の特徴値を取得するために、Ｍ個の初期逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理するように構成された逆ゲインモジュール１６０６と、
第２の画像を取得するために、復号ネットワークに基づいて、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、少なくとも１つの処理された特徴マップがＭ個の第４の特徴値を含む、ように構成された再構成モジュール１６０７と、を備え、
取得モジュール１６０１が第１の画像に対する第２の画像の歪み損失を取得するようにさらに構成され、
第１の画像と第２の画像との間の画像歪み値が第１の予め設定された程度に達するまで、損失関数を使用することによって、第１の符号化／復号ネットワーク、Ｍ個の初期ゲイン値、およびＭ個の初期逆ゲイン値に対して共同訓練を実行し、画像歪み値がビットレート損失および歪み損失に関連し、符号化／復号ネットワークが、符号化ネットワーク、量子化ネットワーク、エントロピー符号化ネットワーク、およびエントロピー復号ネットワークを含む、ように構成された訓練モジュール１６０８と、
第２の符号化／復号ネットワーク、Ｍ個の目標ゲイン値、およびＭ個の目標逆ゲイン値を出力し、第２の符号化／復号ネットワークが、第１の符号化／復号ネットワークに対して反復訓練が実行された後に取得されたモデルであり、Ｍ個の目標ゲイン値およびＭ個の目標逆ゲイン値が、Ｍ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対して反復訓練が実行された後に取得される、ように構成された出力モジュール１６０９と、
を含む。

任意選択で、ゲイン処理後に取得された少なくとも１つの第１の特徴マップが量子化された後に取得された量子化データの情報エントロピーは、予め設定された条件を満たし、予め設定された条件が目標圧縮ビットレートに関連し、ＮがＭ以上の正の整数である。

以下は、本出願の実施形態において提供される実行装置を説明する。図１７は、本出願の一実施形態による実行装置の構造の概略図である。実行装置１７００は、具体的には、仮想現実ＶＲ装置、携帯電話、タブレットコンピュータ、ノートブックコンピュータ、インテリジェントウェアラブル装置、監視データ処理装置などとして表されることがある。これは、ここでは限定されない。図１４および図１５に対応する実施形態に記載される画像処理装置は、図１４および図１５に対応する実施形態の画像処理装置の機能を実施するために、実行装置１７００に配備されてもよい。具体的には、実行装置１７００は、受信機１７０１、送信機１７０２、プロセッサ１７０３、およびメモリ１７０４を含む（実行装置１７００内に１つまたは複数のプロセッサ１７０３があってもよく、図１７では１つのプロセッサが例として使用されている）。プロセッサ１７０３は、アプリケーションプロセッサ１７０３１および通信プロセッサ１７０３２を含むことができる。本出願の一部の実施形態では、受信機１７０１、送信機１７０２、プロセッサ１７０３、およびメモリ１７０４は、バスを使用することによって、または別の方式で接続されてもよい。

メモリ１７０４は、読み取り専用メモリおよびランダムアクセスメモリを含み、プロセッサ１７０３に命令およびデータを提供することができる。メモリ１７０４の一部は、不揮発性ランダムアクセスメモリ（ｎｏｎ－ｖｏｌａｔｉｌｅｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ、ＮＶＲＡＭ）をさらに含むことができる。メモリ１７０４は、プロセッサ実行可能動作命令、実行可能モジュール、データ構造、それらのサブセット、またはそれらの拡張セットを記憶する。動作命令は、様々な動作を実施するための様々な動作命令を含むことができる。

プロセッサ１７０３は、実行装置の動作を制御する。特定のアプリケーションの間、実行装置のコンポーネントは、バスシステムを使用することによって互いに結合される。データバスに加えて、バスシステムは、電源バス、制御バス、ステータス信号バスなどをさらに含んでもよい。しかしながら、明確な説明のために、図中の様々なタイプのバスは、バスシステムとして表記されている。

本出願の前述の実施形態において開示された方法は、プロセッサ１７０３に適用されてもよく、またはプロセッサ１７０３によって実施されてもよい。プロセッサ１７０３は、集積回路チップであってもよく、信号処理能力を有する。実施プロセスにおいて、前述の方法におけるステップは、プロセッサ１７０３内のハードウェア集積論理回路を使用することによって、またはソフトウェアの形態の命令を使用することによって実施され得る。プロセッサ１７０３は、汎用プロセッサ、デジタル信号プロセッサ（ｄｉｇｉｔａｌｓｉｇｎａｌｐｒｏｃｅｓｓｏｒ、ＤＳＰ）、マイクロプロセッサ、もしくはマイクロコントローラであってもよく、または特定用途向け集積回路（ａｐｐｌｉｃａｔｉｏｎ－ｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ、ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ｆｉｅｌｄ－ｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ、ＦＰＧＡ）もしくは別のプログラマブル論理デバイス、ディスクリートゲートもしくはトランジスタ論理デバイス、またはディスクリートハードウェアコンポーネントをさらに含んでもよい。プロセッサ１７０３は、本出願の実施形態において開示された方法、ステップ、および論理ブロック図を実施または実行することができる。汎用プロセッサは、マイクロプロセッサであってもよく、またはプロセッサは、任意の従来のプロセッサなどであってもよい。本出願の実施形態を参照して開示された方法のステップは、ハードウェア復号プロセッサによって直接実行され完了されてもよく、または復号プロセッサ内のハードウェアモジュールとソフトウェアモジュールとの組合せを使用することによって実行され完了されてもよい。ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、読み取り専用メモリ、プログラマブル読み取り専用メモリ、電気的消去可能プログラマブルメモリ、またはレジスタなど、当技術分野における成熟した記憶媒体内に位置されてもよい。記憶媒体は、メモリ１７０４内に位置され、プロセッサ１７０３は、メモリ１７０４内の情報を読み取り、プロセッサのハードウェアと組み合わせて前述の方法のステップを完了する。

受信機１７０１は、入力されたデジタルまたは文字情報を受信し、実行装置の関連設定および機能制御に関連する信号入力を生成するように構成されてもよい。送信機１７０２は、第１のインターフェースを介してデジタルまたは文字情報を出力するように構成されてもよい。送信機１７０２は、ディスクグループ内のデータを修正するために、第１のインターフェースを介してディスクグループに命令を送信するようにさらに構成されてもよい。送信機１７０２は、ディスプレイスクリーンなどのディスプレイ装置をさらに含むことができる。

本出願の本実施形態では、場合によっては、プロセッサ１７０３は、図９～図１１に対応する実施形態において実行装置によって実行される画像処理方法を実行するように構成されている。具体的には、アプリケーションプロセッサ１７０３１は、第１の画像を取得し、
少なくとも１つの第１の特徴マップを取得するために、第１の画像に対して特徴抽出を実行し、第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数であり、
目標圧縮ビットレートを取得し、目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数であり、
Ｍ個の第２の特徴値を取得するために、Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理し、
符号化データを取得するために、Ｍ個の第２の特徴値を含む少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行する、
ように構成されている。

任意選択で、アプリケーションプロセッサ１７０３１は、
目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標ゲイン値を決定し、目標マッピング関係が、圧縮ビットレートとＭ個の目標ゲイン値との間の相関関係を示すために使用され、
目標マッピング関係が、複数の圧縮ビットレート、複数のゲインベクトル、および複数の圧縮ビットレートと複数のゲインベクトルとの間の相関関係を含み、目標圧縮ビットレートが、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標ゲイン値が、複数のゲインベクトルのうちの１つの要素であり、または
目標マッピング関係が、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標ゲイン値を含む、
ようにさらに構成されている。

任意選択で、アプリケーションプロセッサ１７０３１は、
少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、各第３の特徴値が１つの第１の特徴値に対応し、Ｍ個の目標逆ゲイン値を取得し、各目標逆ゲイン値が１つの第３の特徴値に対応し、Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値に対してゲイン処理をそれぞれ実行し、第２の画像を取得するために、逆ゲイン処理後に取得された少なくとも１つの第２の特徴マップに対して画像再構成を行い、逆ゲイン処理後に取得された少なくとも１つの第２の特徴マップがＭ個の第４の特徴値を含む、
ようにさらに構成されている。

任意選択で、アプリケーションプロセッサ１７０３１は、目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標逆ゲイン値を決定し、目標マッピング関係が圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用される、ようにさらに構成されている。

具体的には、アプリケーションプロセッサ１７０３１は、
符号化データを取得し、
少なくとも１つの第２の特徴マップを取得するために、符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、Ｎが正の整数であり、
Ｍ個の目標逆ゲイン値を取得し、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数であり、
Ｍ個の第４の特徴値を取得するために、Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理し、
第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、少なくとも１つの処理された第２の特徴マップがＭ個の第４の特徴値を含む、
ように構成されている。

任意選択で、アプリケーションプロセッサ１７０３１は、
目標圧縮ビットレートを取得し、目標マッピング関係に基づいて、目標圧縮ビットレートに対応するＭ個の目標逆ゲイン値を決定し、目標マッピング関係が、圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用され、目標マッピング関係が、複数の圧縮ビットレート、複数の逆ゲインベクトル、および複数の圧縮ビットレートと複数の逆ゲインベクトルとの相関関係を含み、目標圧縮ビットレートは、複数の圧縮ビットレートのうちの１つであり、Ｍ個の目標逆ゲイン値が、複数の逆ゲインベクトルのうちの１つの要素であり、または目標マッピング関係が、目標関数マッピング関係を含み、目標関数関係の入力が目標圧縮ビットレートを含む場合、目標関数関係の出力がＭ個の目標逆ゲイン値を含む、ようにさらに構成されている。

本出願の一実施形態は、訓練装置をさらに提供する。図１８は、本出願の一実施形態による訓練装置の構造の概略図である。図１６に対応する実施形態に記載された画像処理装置は、図１６に対応する実施形態における画像処理装置の機能を実施するために、訓練装置１８００に配備されてもよい。具体的には、訓練装置１８００は、１つまたは複数のサーバによって実施される。訓練装置１８００は、異なる構成または性能に起因して比較的大きな差異を生成することがあり、１つまたは複数の中央処理装置（ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ、ＣＰＵ）１８２２（例えば、１つまたは複数のプロセッサ）、メモリ１８３２、ならびにアプリケーション１８４２またはデータ１８４４を記憶する１つもしくは複数の記憶媒体１８３０（例えば、１つもしくは複数の大容量記憶装置）を含むことができる。メモリ１８３２および記憶媒体１８３０は、一過性記憶装置または永続的記憶装置であってもよい。記憶媒体１８３０に記憶されたプログラムは、少なくとも１つのモジュール（図示せず）を含むことができ、各モジュールは、訓練装置のための一連の命令動作を含むことができる。さらに、中央処理装置１８２２は、記憶媒体１８３０と通信するように配置され、訓練装置１８００において、記憶媒体１８３０における一連の命令動作を実行することができる。

訓練装置１８００は、１つもしくは複数の電源１８２６、１つもしくは複数の有線または無線ネットワークインターフェース１８５０、１つもしくは複数の入力／出力インターフェース１８５８、および／またはＷｉｎｄｏｗｓＳｅｒｖｅｒ（商標）、ＭａｃＯＳＸ（商標）、Ｕｎｉｘ（商標）、Ｌｉｎｕｘ（商標）、もしくはＦｒｅｅＢＳＤ（商標）などの１つもしくは複数のオペレーティングシステム１８４１をさらに含むことができる。

本出願の本実施形態において、中央処理装置１８２２は、図１６に対応する実施形態の画像処理装置によって実行される画像処理方法を実行するように構成されている。具体的には、中央処理装置１８２２は、
第１の画像を取得し、
少なくとも１つの第１の特徴マップを取得するために、符号化ネットワークに基づいて第１の画像に対して特徴抽出を実行し、少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数であり、
目標圧縮ビットレートを取得し、目標圧縮ビットレートが、Ｍ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対応し、各初期ゲイン値が１つの第１の特徴値に対応し、各初期逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数であり、
Ｍ個の第２の特徴値を取得するために、Ｍ個の初期ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理し、
符号化データおよびビットレート損失を取得するために、量子化ネットワークおよびエントロピー符号化ネットワークに基づいて、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行し、ゲイン処理後に取得された少なくとも１つの第１の特徴マップがＭ個の第２の特徴値を含み、
少なくとも１つの第２の特徴マップを取得するために、エントロピー復号ネットワークに基づいて、符号化データに対してエントロピー復号を実行し、少なくとも１つの第２の特徴マップがＭ個の第３の特徴値を含み、各第３の特徴値が１つの第１の特徴値に対応し、
Ｍ個の第４の特徴値を取得するために、Ｍ個の初期逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理し、
第２の画像を取得するために、復号ネットワークに基づいて、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、少なくとも１つの処理された第２の特徴マップがＭ個の第４の特徴値を含み、
第１の画像に対する第２の画像の歪み損失を取得し、
第１の画像と第２の画像との間の画像歪み値が第１の予め設定された程度に達するまで、損失関数を使用することによって、第１の符号化／復号ネットワーク、Ｍ個の初期ゲイン値、およびＭ個の初期逆ゲイン値に対して共同訓練を実行し、画像歪み値がビットレート損失および歪み損失に関連し、符号化／復号ネットワークが符号化ネットワーク、量子化ネットワーク、エントロピー符号化ネットワーク、およびエントロピー復号ネットワークを含み、
第２の符号化／復号ネットワーク、Ｍ個の目標ゲイン値、およびＭ個の目標逆ゲイン値を出力し、第２の符号化／復号ネットワークが、第１の符号化／復号ネットワークに対して反復訓練が実行された後に取得されたモデルであり、Ｍ個の目標ゲイン値およびＭ個の目標逆ゲイン値が、Ｍ個の初期ゲイン値およびＭ個の初期逆ゲイン値に対して反復訓練が実行された後に取得される、
ように構成されている。

任意選択で、ゲイン処理後に取得された少なくとも１つの第１の特徴マップを量子化することによって取得された量子化データの情報エントロピーは、予め設定された条件を満たし、予め設定された条件は、目標圧縮ビットレートに関連する。

本出願の一実施形態は、コンピュータプログラム製品をさらに提供する。コンピュータプログラム製品がコンピュータ上で動作すると、コンピュータは、図１７に示される前述の実施形態に記載された方法において実行装置によって実行されるステップを実行することを可能にされ、またはコンピュータは、図１８に示される前述の実施形態に記載された方法において訓練装置によって実行されるステップを実行することを可能にされる。

本出願の一実施形態は、コンピュータ可読記憶媒体をさらに提供する。コンピュータ可読記憶媒体は、信号処理を行うためのプログラムを記憶する。プログラムがコンピュータ上で動作すると、コンピュータは、図１７に示される前述の実施形態に記載された方法において実行装置によって実行されるステップを実行することを可能にされ、またはコンピュータは、図１８に示される前述の実施形態に記載された方法において訓練装置によって実行されるステップを実行することを可能にされる。

本出願の実施形態において提供される実行装置、訓練装置、または端末装置は、具体的にはチップであってよい。チップは、処理ユニットおよび通信ユニットを含む。処理ユニットは、例えば、プロセッサであってもよい。通信ユニットは、例えば、入力／出力インターフェース、ピン、または回路であってもよい。処理ユニットは、記憶ユニットに記憶されたコンピュータ実行可能命令を実行して、実行装置内のチップに図３～図７に示される実施形態に記載された画像処理方法を実行させることができ、または訓練装置内のチップに図１３に示される実施形態に記載された画像処理方法を実行させることができる。任意選択で、記憶ユニットは、チップ内の記憶ユニット、例えば、レジスタまたはキャッシュである。記憶ユニットは、代替として、無線アクセスデバイス端のチップの外部に位置される記憶ユニット、例えば、読み取り専用メモリ（ｒｅａｄ－ｏｎｌｙｍｅｍｏｒｙ、ＲＯＭ）または静的情報および命令を記憶することができる別のタイプの静的記憶デバイス、またはランダムアクセスメモリ（ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ、ＲＡＭ）であってもよい。

詳細については、図１９を参照されたい。図１９は、本出願の一実施形態によるチップの構造の概略図である。チップは、ニューラルネットワーク処理ユニットＮＰＵ２０００として表されてもよい。ＮＰＵ２０００は、コプロセッサとしてホストＣＰＵ（ＨｏｓｔＣＰＵ）に搭載され、ＨｏｓｔＣＰＵがＮＰＵにタスクを割り当てる。ＮＰＵのコア部分は演算回路２００３であり、演算回路２００３は、コントローラ２００４を使用することによって、メモリから行列データを抽出し、乗算演算を実行するように制御される。

一部の実施態様では、演算回路２００３は、複数のプロセスエンジン（ＰｒｏｃｅｓｓＥｎｇｉｎｅ、ＰＥ）を含む。一部の実施態様では、演算回路２００３は、２次元シストリックアレイである。演算回路２００３は、１次元シストリックアレイであってもよく、または乗算や加算などの数学的演算を実行することができる他の電子回路であってもよい。一部の実施態様では、演算回路２００３は、汎用マトリックスプロセッサである。

例えば、入力行列Ａ、重み行列Ｂ、出力行列Ｃがあると仮定される。演算回路は、重みメモリ２００２から行列Ｂの対応するデータを取り出し、そのデータを演算回路内の各ＰＥにバッファリングする。演算回路は、入力メモリ２００１から行列Ａのデータを取得し、そのデータと行列Ｂとの行列演算を行い、得られた行列の部分結果または最終結果をアキュムレータ（ａｃｃｕｍｕｌａｔｏｒ）２００８に記憶する。

統合メモリ２００６は、入力データおよび出力データを記憶するように構成されている。重みデータは、ダイレクトメモリアクセスコントローラ（ＤｉｒｅｃｔＭｅｍｏｒｙＡｃｃｅｓｓＣｏｎｔｒｏｌｌｅｒ、ＤＭＡＣ）２００５を使用することによって重みメモリ２００２に直接転送される。入力データも、ＤＭＡＣを使用することによって統合メモリ２００６に転送される。

ＢＩＵは、バスインターフェースユニット（ＢｕｓＩｎｔｅｒｆａｃｅＵｎｉｔ）、すなわち、ＡＸＩバスを使用することによってＤＭＡＣおよび命令フェッチバッファ（ＩｎｓｔｒｕｃｔｉｏｎＦｅｔｃｈＢｕｆｆｅｒ、ＩＦＢ）２００９と相互作用するように構成されたバスインターフェースユニット２０１０である。

バスインターフェースユニット２０１０（ＢｕｓＩｎｔｅｒｆａｃｅＵｎｉｔ、略してＢＩＵ）は、命令フェッチバッファ２００９が外部メモリから命令を取得するように構成され、ダイレクトメモリアクセスコントローラ２００５が外部メモリから入力行列Ａまたは重み行列Ｂの生データを取得するようにさらに構成されている。

ＤＭＡＣは、主に、外部メモリＤＤＲ内の入力データを統合メモリ２００６に転送し、重みデータを重みメモリ２００２に転送し、または入力データを入力メモリ２００１に転送するように構成されている。

ベクトル計算ユニット２００７は、複数の演算処理ユニットを含む。必要な場合は、演算回路の出力に対して、ベクトル乗算、ベクトル加算、指数演算、対数演算、値比較などのさらなる処理が実行される。ベクトル計算ユニット２００７は、主に、ニューラルネットワークにおける非畳み込み／全接続層に対して、バッチ正規化（ＢａｔｃｈＮｏｒｍａｌｉｚａｔｉｏｎ）、画素レベル加算、および特徴面のアップサンプリングなどのネットワーク計算を実行するように構成されている。

一部の実施態様では、ベクトル計算ユニット２００７は、処理された出力ベクトルを統合メモリ２００６に記憶することができる。例えば、ベクトル計算ユニット２００７は、演算回路２００３の出力に線形関数および／または非線形関数を適用してもよく、例えば、畳み込み層で抽出された特徴面に対して線形補間を行ってもよい。別の例では、線形関数および／または非線形関数は、活性化値を生成するために累算値のベクトルに適用される。一部の実施態様では、ベクトル計算ユニット２００７は、正規化値、画素レベルの和、または正規化値と画素レベルの和を生成する。一部の実施態様では、処理された出力ベクトルは、演算回路２００３への活性化された入力として使用され得て、例えば、処理された出力ベクトルは、ニューラルネットワークの後続の層において使用され得る。

コントローラ２００４に接続された命令フェッチバッファ（ｉｎｓｔｒｕｃｔｉｏｎｆｅｔｃｈｂｕｆｆｅｒ）２００９は、コントローラ２００４によって使用される命令を記憶するように構成されている。

統合メモリ２００６、入力メモリ２００１、重みメモリ２００２、命令フェッチバッファ２００９は、いずれもＯｎ－Ｃｈｉｐメモリである。外部メモリは、ＮＰＵのハードウェアアーキテクチャに専用である。

上記のいずれかで言及されたプロセッサは、汎用中央処理ユニット、マイクロプロセッサ、ＡＳＩＣ、または第１の態様による方法のプログラム実行を制御するように構成された１つもしくは複数の集積回路であってもよい。

加えて、記載された装置の実施形態は、単なる例であることに留意されたい。別個の部分として説明されるユニットは、物理的に別個であってもなくてもよく、ユニットとして表示される部分は、物理的ユニットであってもなくてもよく、１つの場所に位置されてもよく、または複数のネットワークユニット上に分散されてもよい。一部またはすべてのモジュールは、実施形態の解決策の目的を達成するために、実際の要求に従って選択されてもよい。加えて、本出願において提供される装置の実施形態の添付図面において、モジュール間の接続関係は、モジュールが互いに通信接続を有することを示し、これは、具体的には、１つまたは複数の通信バスまたは信号ケーブルとして実施されてもよい。

前述の実施態様の説明に基づいて、当業者は、本出願が、必要な汎用ハードウェアに加えてソフトウェアによって実施され得ること、または、当然ながら、特定用途向け集積回路、専用ＣＰＵ、専用メモリ、専用コンポーネントなどを含む専用ハードウェアによって実施され得ることを明確に理解することができる。一般に、コンピュータプログラムによって実行され得る任意の機能は、対応するハードウェアを使用することによって容易に実施され得て、同じ機能を達成するために使用される特定のハードウェア構造は、様々な形態、例えば、アナログ回路、デジタル回路、または専用回路の形態であってもよい。しかしながら、本出願では、ソフトウェアプログラムの実施態様が、ほとんどの場合、より良い実施態様である。このような理解に基づいて、本出願の技術的解決策は、本質的に、または従来技術に寄与する部分は、ソフトウェア製品の形態で実施されてもよい。ソフトウェア製品は、コンピュータのフロッピーディスク、ＵＳＢフラッシュドライブ、リムーバブルハードディスク、ＲＯＭ、ＲＡＭ、磁気ディスク、または光ディスクなどの可読記憶媒体に記憶され、コンピュータ装置（パーソナルコンピュータ、訓練装置、またはネットワーク装置であってもよい）に本出願の実施形態に記載された方法を実行するように命令するためのいくつかの命令を含む。

前述の実施形態のすべてまたは一部は、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せを使用して実施されてもよい。ソフトウェアが実施形態を実施するために使用される場合、実施形態のすべてまたは一部は、コンピュータプログラム製品の形態で実施されてもよい。

コンピュータプログラム製品は、１つまたは複数のコンピュータ命令を含む。コンピュータプログラム命令がコンピュータにロードされて実行されると、本出願の実施形態による手順または機能のすべてまたは一部が生成される。コンピュータは、汎用コンピュータ、専用コンピュータ、コンピュータネットワーク、または他のプログラム可能な装置であってもよい。コンピュータ命令は、コンピュータ可読記憶媒体に記憶されてもよく、またはコンピュータ可読記憶媒体から別のコンピュータ可読記憶媒体に送信されてもよい。例えば、コンピュータ命令は、有線（例えば、同軸ケーブル、光ファイバ、もしくはデジタル加入者線（ＤＳＬ））または無線（例えば、赤外線、高周波、もしくはマイクロ波）方式で、ウェブサイト、コンピュータ、訓練装置、またはデータセンタから別のウェブサイト、コンピュータ、訓練装置、またはデータセンタに送信されてもよい。コンピュータ可読記憶媒体は、コンピュータによってアクセス可能な任意の使用可能な媒体、あるいは１つまたは複数の使用可能な媒体を統合するデータ記憶装置、例えば、訓練装置またはデータセンタであってもよい。使用可能な媒体は、磁気媒体（例えば、フロッピーディスク、ハードディスク、または磁気テープ）、光媒体（例えば、ＤＶＤ）、半導体媒体（例えば、ソリッドステートディスク（ＳｏｌｉｄＳｔａｔｅＤｉｓｋ、ＳＳＤ））などであってもよい。

２００画像処理システム
２０１目標モデル／ルール
２１０実行装置
２１１計算モジュール
２１２Ｉ／Ｏインターフェース
２２０訓練装置
２３０データベース
２４０クライアント装置
２５０データ記憶システム
４０１第１の画像
４０２ＣＮＮ／層
４０３マルチチャネルワイズ特徴マップ
１４００画像処理装置
１４０１取得モジュール
１４０２特徴抽出モジュール
１４０３ゲインモジュール
１４０４エントロピー符号化モジュール
１５００画像処理装置
１５０１取得モジュール
１５０２復号モジュール
１５０３逆ゲインモジュール
１５０４再構成モジュール
１６００画像処理装置
１６０１取得モジュール
１６０２特徴抽出モジュール
１６０３ゲインモジュール
１６０４エントロピー符号化モジュール
１６０５復号モジュール
１６０６逆ゲインモジュール
１６０７再構成モジュール
１６０８訓練モジュール
１６０９出力モジュール
１７００実行装置
１７０１受信機
１７０２送信機
１７０３プロセッサ
１７０４メモリ
１８００訓練装置
１８２２中央処理装置
１８２６電源
１８３０記憶媒体
１８３２メモリ
１８４１オペレーティングシステム
１８４２アプリケーション
１８４４データ
１８５０無線ネットワークインターフェース
１８５８出力インターフェース
２０００ニューラルネットワーク処理ユニット（ＮＰＵ）
２００１入力メモリ
２００２重みメモリ
２００３演算回路
２００４コントローラ
２００５ダイレクトメモリアクセスコントローラ
２００６統合メモリ
２００７ベクトル計算ユニット
２００８アキュムレータ
２００９命令フェッチバッファ
２０１０バスインターフェースユニット
１７０３１アプリケーションプロセッサ
１７０３２通信プロセッサ

Claims

画像処理方法であって、
第１の画像を取得するステップと、
少なくとも１つの第１の特徴マップを取得するために、前記第１の画像に対して特徴抽出を実行するステップであって、前記少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ステップと、
目標圧縮ビットレートを取得するステップであって、前記目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数である、ステップと、
Ｍ個の第２の特徴値を取得するために、前記Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するステップと、
符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行するステップであって、前記少なくとも１つの処理された第１の特徴マップが前記Ｍ個の第２の特徴値を含む、ステップと
を含む、画像処理方法。
前記少なくとも１つの処理された第１の特徴マップを量子化することによって取得された量子化データの情報エントロピーが予め設定された条件を満たし、前記予め設定された条件が前記目標圧縮ビットレートに関連する、請求項１に記載の方法。
前記予め設定された条件が、少なくとも、
目標圧縮ビットレートが大きいほど、前記量子化データの情報エントロピーがより大きくなることを示す、請求項２に記載の方法。
前記符号化データに対応する圧縮ビットレートと前記目標圧縮ビットレートとの差が、予め設定された範囲内に入る、請求項１から３のいずれか一項に記載の方法。
前記Ｍ個の第２の特徴値が、前記Ｍ個の目標ゲイン値と、前記対応する第１の特徴値に対して個々に乗算演算を実行することによって取得される、請求項１から４のいずれか一項に記載の方法。
前記少なくとも１つの第１の特徴マップが第１の目標特徴マップを含み、前記第１の目標特徴マップがＰ個の第１の特徴値を含み、前記Ｐ個の第１の特徴値のすべてが同じ目標ゲイン値に対応し、ＰがＭ以下の正の整数である、請求項１から５のいずれか一項に記載の方法。
前記方法が、
目標マッピング関係に基づいて、前記目標圧縮ビットレートに対応する前記Ｍ個の目標ゲイン値を決定するステップであって、前記目標マッピング関係が、圧縮ビットレートとＭ個の目標ゲイン値との間の相関関係を示すために使用される、ステップをさらに含み、
前記目標マッピング関係が、複数の圧縮ビットレート、複数のゲインベクトル、および前記複数の圧縮ビットレートと前記複数のゲインベクトルとの間の相関関係を含み、前記目標圧縮ビットレートが、前記複数の圧縮ビットレートのうちの１つであり、前記Ｍ個の目標ゲイン値が、前記複数のゲインベクトルのうちの１つの要素であり、または
前記目標マッピング関係が、目標関数マッピング関係を含み、前記目標関数関係の入力が前記目標圧縮ビットレートを含む場合、前記目標関数関係の出力が前記Ｍ個の目標ゲイン値を含む、
請求項１から６のいずれか一項に記載の方法。
前記目標圧縮ビットレートが、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、前記第１の圧縮ビットレートが、Ｍ個の第１のゲイン値に対応し、前記第２の圧縮ビットレートが、Ｍ個の第２のゲイン値に対応し、前記Ｍ個の目標ゲイン値が、前記Ｍ個の第１のゲイン値および前記Ｍ個の第２のゲイン値に対して補間演算を実行することによって取得される、請求項１から７のいずれか一項に記載の方法。
前記第１の画像が目標オブジェクトを含み、前記Ｍ個の第１の特徴値が、前記少なくとも１つの特徴マップ内の、前記目標オブジェクトに対応する特徴値である、請求項１から８のいずれか一項に記載の方法。
前記Ｍ個の目標ゲイン値のそれぞれが、１つの逆ゲイン値に対応し、前記逆ゲイン値が、前記符号化データの復号プロセスにおいて取得される特徴値を処理するために使用され、前記Ｍ個の目標ゲイン値のそれぞれと、前記対応する逆ゲイン値との積が、予め設定された範囲内に入る、請求項１から９のいずれか一項に記載の方法。
画像処理方法であって、
符号化データを取得するステップと、
少なくとも１つの第２の特徴マップを取得するために、前記符号化データに対してエントロピー復号を行うステップであって、前記少なくとも１つの第２の特徴マップが、Ｎ個の第３の特徴値を含み、Ｎが正の整数である、ステップと、
Ｍ個の目標逆ゲイン値を取得するステップであって、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数である、ステップと、
Ｍ個の第４の特徴値を取得するために、前記Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理するステップと、
第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行うステップであって、前記少なくとも１つの処理された第２の特徴マップが、前記Ｍ個の第４の特徴値を含む、ステップと
を含む、画像処理方法。
前記Ｍ個の第４の特徴値が、前記Ｍ個の目標逆ゲイン値と、前記対応する第３の特徴値に対して個々に乗算演算を実行することによって取得される、請求項１１に記載の方法。
前記少なくとも１つの第２の特徴マップが第２の目標特徴マップを含み、前記第２の目標特徴マップがＰ個の第３の特徴値を含み、前記Ｐ個の第３の特徴値のすべてが同じ目標逆ゲイン値に対応し、ＰがＭ以下の正の整数である、請求項１１または１２に記載の方法。
前記方法が、
目標圧縮ビットレートを取得するステップと、
目標マッピング関係に基づいて、前記目標圧縮ビットレートに対応する前記Ｍ個の目標逆ゲイン値を決定するステップであって、前記目標マッピング関係が、圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用される、ステップをさらに含み
前記目標マッピング関係が、複数の圧縮ビットレート、複数の逆ゲインベクトル、および前記複数の圧縮ビットレートと前記複数の逆ゲインベクトルとの間の相関関係を含み、前記目標圧縮ビットレートが、前記複数の圧縮ビットレートのうちの１つであり、前記Ｍ個の目標逆ゲイン値が、前記複数の逆ゲインベクトルのうちの１つの要素であり、または
前記目標マッピング関係が、目標関数マッピング関係を含み、前記目標関数関係の入力が前記目標圧縮ビットレートを含む場合、前記目標関数関係の出力が前記Ｍ個の目標逆ゲイン値を含む、
請求項１１から１３のいずれか一項に記載の方法。
前記第２の画像が目標オブジェクトを含み、前記Ｍ個の第３の特徴値が、前記少なくとも１つの特徴マップ内の、前記目標オブジェクトに対応する特徴値である、請求項１１から１４のいずれか一項に記載の方法。
前記目標圧縮ビットレートが、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、前記第１の圧縮ビットレートが、Ｍ個の第１の逆ゲイン値に対応し、前記第２の圧縮ビットレートが、Ｍ個の第２の逆ゲイン値に対応し、前記Ｍ個の目標逆ゲイン値が、前記Ｍ個の第１の逆ゲイン値および前記Ｍ個の第２の逆ゲイン値に対して補間演算を実行することによって取得される、請求項１１から１５のいずれか一項に記載の方法。
画像処理装置であって、
第１の画像を取得するように構成された取得モジュールと、
少なくとも１つの第１の特徴マップを取得するために、前記第１の画像に対して特徴抽出を実行し、前記少なくとも１つの第１の特徴マップがＮ個の第１の特徴値を含み、Ｎが正の整数である、ように構成された特徴抽出モジュールを備え、
前記取得モジュールが、目標圧縮ビットレートを取得するようにさらに構成され、前記目標圧縮ビットレートがＭ個の目標ゲイン値に対応し、各目標ゲイン値が１つの第１の特徴値に対応し、ＭがＮ以下の正の整数であり、
Ｍ個の第２の特徴値を取得するために、前記Ｍ個の目標ゲイン値に基づいて、対応する第１の特徴値をそれぞれ処理するように構成されたゲインモジュールと、
符号化データを取得するために、少なくとも１つの処理された第１の特徴マップに対して量子化およびエントロピー符号化を実行し、前記少なくとも１つの処理された第１の特徴マップが前記Ｍ個の第２の特徴値を含む、ように構成された量子化およびエントロピー符号化モジュールと
を備える、画像処理装置。
前記少なくとも１つの処理された第１の特徴マップを量子化することによって取得された量子化データの情報エントロピーが予め設定された条件を満たし、前記予め設定された条件が前記目標圧縮ビットレートに関連する、請求項１７に記載の装置。
前記予め設定された条件が、少なくとも、
目標圧縮ビットレートが大きいほど、前記量子化データの情報エントロピーがより大きくなることを示す、請求項１８に記載の装置。
前記符号化データに対応する圧縮ビットレートと前記目標圧縮ビットレートとの差が、予め設定された範囲内に入る、請求項１７から１９のいずれか一項に記載の装置。
前記Ｍ個の第２の特徴値が、前記Ｍ個の目標ゲイン値と、前記対応する第１の特徴値に対して個々に乗算演算を実行することによって取得される、請求項１７から２０のいずれか一項に記載の装置。
前記少なくとも１つの第１の特徴マップが第１の目標特徴マップを含み、前記第１の目標特徴マップがＰ個の第１の特徴値を含み、前記Ｐ個の第１の特徴値のすべてが同じ目標ゲイン値に対応し、ＰがＭ以下の正の整数である、請求項１７から２１のいずれか一項に記載の装置。
前記装置が、
目標マッピング関係に基づいて、前記目標圧縮ビットレートに対応する前記Ｍ個の目標ゲイン値を決定し、前記目標マッピング関係が、圧縮ビットレートとＭ個の目標ゲイン値との間の相関関係を示すために使用される、決定モジュールをさらに備え、
前記目標マッピング関係が、複数の圧縮ビットレート、複数のゲインベクトル、および前記複数の圧縮ビットレートと前記複数のゲインベクトルとの間の相関関係を含み、前記目標圧縮ビットレートが、前記複数の圧縮ビットレートのうちの１つであり、前記Ｍ個の目標ゲイン値が、前記複数のゲインベクトルのうちの１つの要素であり、または
前記目標マッピング関係が、目標関数マッピング関係を含み、前記目標関数関係の入力が前記目標圧縮ビットレートを含む場合、前記目標関数関係の出力が前記Ｍ個の目標ゲイン値を含む、
請求項１７から２２のいずれか一項に記載の装置。
前記目標圧縮ビットレートが、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、前記第１の圧縮ビットレートが、Ｍ個の第１のゲイン値に対応し、前記第２の圧縮ビットレートが、Ｍ個の第２のゲイン値に対応し、前記Ｍ個の目標ゲイン値が、前記Ｍ個の第１のゲイン値および前記Ｍ個の第２のゲイン値に対して補間演算を実行することによって取得される、請求項１７から２３のいずれか一項に記載の装置。
前記第１の画像が目標オブジェクトを含み、前記Ｍ個の第１の特徴値が、前記少なくとも１つの特徴マップ内の、前記目標オブジェクトに対応する特徴値である、請求項１７から２４のいずれか一項に記載の装置。
前記Ｍ個の目標ゲイン値のそれぞれが、１つの逆ゲイン値に対応し、前記逆ゲイン値が、前記符号化データの復号プロセスにおいて取得される特徴値を処理するために使用され、前記Ｍ個の目標ゲイン値のそれぞれと、前記対応する逆ゲイン値との積が、予め設定された範囲内に入る、請求項１７から２５のいずれか一項に記載の装置。
画像処理装置であって、
符号化データを取得するように構成された取得モジュールと、
少なくとも１つの第２の特徴マップを取得するために、前記符号化データに対してエントロピー復号を実行し、前記少なくとも１つの第２の特徴マップがＮ個の第３の特徴値を含み、Ｎが正の整数である、ように構成された復号モジュールを備え、
前記取得モジュールがＭ個の目標逆ゲイン値を取得するようにさらに構成され、各目標逆ゲイン値が１つの第３の特徴値に対応し、ＭがＮ以下の正の整数であり、
Ｍ個の第４の特徴値を取得するために、前記Ｍ個の目標逆ゲイン値に基づいて、対応する第３の特徴値をそれぞれ処理するように構成された逆ゲインモジュールと、
第２の画像を取得するために、少なくとも１つの処理された第２の特徴マップに対して画像再構成を行い、前記少なくとも１つの処理された第２の特徴マップが前記Ｍ個の第４の特徴値を含む、ように構成された再構成モジュールと
を備える、画像処理装置。
前記Ｍ個の第４の特徴値が、前記Ｍ個の目標逆ゲイン値と、前記対応する第３の特徴値に対して個々に乗算演算を実行することによって取得される、請求項２７に記載の装置。
前記少なくとも１つの第２の特徴マップが第２の目標特徴マップを含み、前記第２の目標特徴マップがＰ個の第３の特徴値を含み、前記Ｐ個の第３の特徴値のすべてが同じ目標逆ゲイン値に対応し、ＰがＭ以下の正の整数である、請求項２７または２８に記載の装置。
前記取得モジュールが目標圧縮ビットレートを取得するようにさらに構成され、
前記装置が、
目標マッピング関係に基づいて、前記目標圧縮ビットレートに対応する前記Ｍ個の目標逆ゲイン値を決定し、前記目標マッピング関係が、圧縮ビットレートと逆ゲインベクトルとの間の相関関係を示すために使用される、決定モジュールをさらに備え、
前記目標マッピング関係が、複数の圧縮ビットレート、複数の逆ゲインベクトル、および前記複数の圧縮ビットレートと前記複数の逆ゲインベクトルとの間の相関関係を含み、前記目標圧縮ビットレートが、前記複数の圧縮ビットレートのうちの１つであり、前記Ｍ個の目標逆ゲイン値が、前記複数の逆ゲインベクトルのうちの１つの要素であり、または
前記目標マッピング関係が、目標関数マッピング関係を含み、前記目標関数関係の入力が前記目標圧縮ビットレートを含む場合、前記目標関数関係の出力が前記Ｍ個の目標逆ゲイン値を含む、
請求項２７から２９のいずれか一項に記載の装置。
前記第２の画像が目標オブジェクトを含み、前記Ｍ個の第３の特徴値が、前記少なくとも１つの特徴マップ内の、前記目標オブジェクトに対応する特徴値である、請求項２７から３０のいずれか一項に記載の装置。
前記目標圧縮ビットレートが、第１の圧縮ビットレートよりも大きく、第２の圧縮ビットレートよりも小さく、前記第１の圧縮ビットレートが、Ｍ個の第１の逆ゲイン値に対応し、前記第２の圧縮ビットレートが、Ｍ個の第２の逆ゲイン値に対応し、前記Ｍ個の目標逆ゲイン値が、前記Ｍ個の第１の逆ゲイン値および前記Ｍ個の第２の逆ゲイン値に対して補間演算を実行することによって取得される、請求項２７から３１のいずれか一項に記載の装置。
互いに結合された不揮発性メモリおよびプロセッサを備える画像処理装置であって、前記プロセッサが請求項１から１６のいずれか一項に記載の方法を実行するために、前記メモリに記憶されたプログラムコードを呼び出す、画像処理装置。