WO2021145105A1

WO2021145105A1 - データ圧縮装置、およびデータ圧縮方法

Info

Publication number: WO2021145105A1
Application number: PCT/JP2020/045668
Authority: WO
Inventors: 朋紀佐藤; 悠二西牧; 義己田中
Original assignee: ソニーグループ株式会社
Priority date: 2020-01-15
Filing date: 2020-12-08
Publication date: 2021-07-22

Abstract

学習モデルを適用した特徴量圧縮データと残差データ圧縮データを生成する可逆圧縮処理において圧縮効率を向上させた構成、処理を実現する。学習モデルを適用して入力データの特徴量圧縮データを生成する特徴量圧縮部と、特徴量圧縮データの復元により特徴量復元データを生成する特徴量復元部と、入力データと特徴量復元データとの差分である残差データを算出する差分算出部と、残差データから複数の残差分割ブロックを生成する残差データブロック分割部と、残差分割ブロックの圧縮処理により、複数の残差分割ブロック圧縮データを生成する残差分割ブロック単位エンコーダと、特徴量圧縮データと残差分割ブロック圧縮データを合成して出力用圧縮データを生成する出力用圧縮データ生成部を有する。

Description

データ圧縮装置、およびデータ圧縮方法

　本開示は、データ圧縮装置、およびデータ圧縮方法に関する。さらに詳細には、データ圧縮処理を実行するデータ圧縮装置、およびデータ圧縮方法に関する。

　近年、スマートフォン等のモバイルデバイスや、カメラ等のセンサーの利用が急激に増加している。これらの装置（デバイス）は、様々なデータ、例えば通信データ、画像データを生成し、生成したデータを、ネットワークを介して他の装置に転送する処理や、フラッシュメモリ、光ディスク、ハードディスク等の記録メディアに記録する処理等を行なう。

　大容量のデータを転送あるいは記録する場合、データ圧縮処理により、データ転送速度の向上、データ記録容量の削減が実現され、圧縮率を高めた効率的な圧縮処理技術が求められている。
　センサーやモバイルデバイスから生成されたデータを圧縮する技術の一態様として、機械学習モデルを用いた圧縮手法が提案されている。

　機械学習モデルを用いた圧縮手法の一例として、圧縮対象データから重要な特徴データを抽出し、抽出した特徴データの圧縮処理を行なうことで高い圧縮率を実現する手法がある。
　しかし、この手法では、圧縮対象となるデータから選択された特徴データ以外のデータが圧縮結果データに含まれないことになり、情報の欠損が発生する。

　すなわち、圧縮データに含まれない特徴データ以外のデータの復元は不可能となり、復元データ（伸長データ）は、圧縮前の元データと異なるデータとなってしまう。すなわち、上記のような単に機械学習を適用した圧縮処理は非可逆圧縮処理になってしまうという問題がある。

　欠損データをより少なくする構成を開示した従来技術として特許文献１（特開２０１９－１４０６８０号公報）がある。この特許文献１は、情報の欠損が少なく、かつ、圧縮効率の高い圧縮システムを提案している。
　具体的には、機械学習手法のひとつであるオートエンコーダを用い、複数のスケールの特徴量を抽出することで、少ない情報から高精細な画像の復元を行なう構成である。

　しかし、この特許文献１に記載の構成を適用しても、欠損データを完全になくすことはできない。すなわち可逆圧縮処理を実現するには至っていない。

　医療用画像など、データの利用目的によっては情報の欠損が許容されない場面が存在する。このようなデータの圧縮、復元には、可逆圧縮が必須となる。

　機械学習モデルを用いた圧縮手法において可逆圧縮を実現する構成を開示した従来技術として、Ｓｈｅｎらが提案した圧縮システムがある。
　この構成は、非特許文献１（"Ｌｏｓｓｌｅｓｓ　Ｃｏｍｐｒｅｓｓｉｏｎ　ｏｆ　Ｃｕｒａｔｅｄ　Ｅｒｙｔｈｒｏｃｙｔｅ　Ｉｍａｇｅｓ　Ｕｓｉｎｇ　Ｄｅｅｐ　Ａｕｔｏｅｎｃｏｄｅｒｓ　ｆｏｒ　Ｍａｌａｒｉａ　Ｉｎｆｅｃｔｉｏｎ　Ｄｉａｇｎｏｓｉｓ"　Ｐｕｂｌｉｓｈｅｄ　ｉｎ　２０１６　Ｐｉｃｔｕｒｅ　Ｃｏｄｉｎｇ　Ｓｙｍｐｏｓｉｕｍ　４－７　Ｄｅｃｅｍｂｅｒ　２０１６．Ｈｏｎｇｄａ　Ｓｈｅｎ　ｅｔ　ａｌ．）に記載されている。

　この非特許文献１には、機械学習モデルを適用した圧縮データに含まれない特徴データ以外の非抽出データを残差データとして抽出し、この残差データに対して、さらに圧縮処理を行ない、残差データ圧縮データを生成する。
　すなわち、最終的な圧縮データは、機械学習モデルを適用した圧縮データと、残差データ圧縮データの組みデータとする。この組みデータを送信、あるいは記憶部に格納し、復元（伸長）する場合は、組データの構成データである機械学習モデルを適用した圧縮データと、残差データ圧縮データを個別に取り出して、個別に復元した後、これらの復元データを組み合わせて圧縮処理前のデータを復元する構成である。

　しかし、この非特許文献１に記載の構成は、残差データの圧縮データのデータ量が大きくなり、最終的に生成される圧縮データである機械学習モデルを適用した圧縮データと、残差データ圧縮データの組みデータについてもデータ量がおおきくなり、結果的に圧縮効率が低下するという問題がある。

特開２０１９－１４０６８０号公報

"Ｌｏｓｓｌｅｓｓ　Ｃｏｍｐｒｅｓｓｉｏｎ　ｏｆ　Ｃｕｒａｔｅｄ　Ｅｒｙｔｈｒｏｃｙｔｅ　Ｉｍａｇｅｓ　Ｕｓｉｎｇ　Ｄｅｅｐ　Ａｕｔｏｅｎｃｏｄｅｒｓ　ｆｏｒ　Ｍａｌａｒｉａ　Ｉｎｆｅｃｔｉｏｎ　Ｄｉａｇｎｏｓｉｓ"　Ｐｕｂｌｉｓｈｅｄ　ｉｎ　２０１６　Ｐｉｃｔｕｒｅ　Ｃｏｄｉｎｇ　Ｓｙｍｐｏｓｉｕｍ　４－７　Ｄｅｃｅｍｂｅｒ　２０１６．Ｈｏｎｇｄａ　Ｓｈｅｎ　ｅｔ　ａｌ．

　本開示は、例えば、上記問題点に鑑みてなされたものであり、機械学習モデルを適用した圧縮処理を行ない、かつ圧縮率を向上させた可逆圧縮を実現するデータ圧縮装置、およびデータ圧縮方法を提供することを目的とする。

　本開示の第１の側面は、
　学習モデルを適用して入力データの特徴量圧縮データを生成する特徴量圧縮部と、
　前記特徴量圧縮データに対する復元処理を実行して特徴量復元データを生成する特徴量復元部と、
　前記入力データと、前記特徴量復元データとの差分データである残差データを算出する差分算出部と、
　前記残差データをブロック分割して、複数の残差分割ブロックを生成する残差データブロック分割部と、
　前記複数の残差分割ブロック各々の圧縮処理を実行し、複数の残差分割ブロック圧縮データを生成する残差分割ブロック単位エンコーダと、
　前記特徴量圧縮部の生成した特徴量圧縮データと、前記残差分割ブロック単位エンコーダの生成した複数の残差分割ブロック圧縮データを合成して出力用圧縮データを生成する出力用圧縮データ生成部を有するデータ圧縮装置にある。

　さらに、本開示の第２の側面は、
　データ圧縮装置において実行するデータ圧縮方法であり、
　特徴量圧縮部が、学習モデルを適用して入力データの特徴量圧縮データを生成する特徴量圧縮処理と、
　特徴量復元部が、前記特徴量圧縮データに対する復元処理を実行して特徴量復元データを生成する特徴量復元処理と、
　差分算出部が、前記入力データと、前記特徴量復元データとの差分データである残差データを算出する差分算出処理と、
　残差データブロック分割部が、前記残差データをブロック分割して、複数の残差分割ブロックを生成する残差データブロック分割処理と、
　残差分割ブロック単位エンコーダが、前記複数の残差分割ブロック各々の圧縮処理を実行し、複数の残差分割ブロック圧縮データを生成する残差分割ブロック単位エンコード処理と、
　出力用圧縮データ生成部が、前記特徴量圧縮部の生成した特徴量圧縮データと、前記残差分割ブロック単位エンコーダの生成した複数の残差分割ブロック圧縮データを合成して出力用圧縮データを生成する出力用圧縮データ生成処理を実行するデータ圧縮方法にある。

　本開示のさらに他の目的、特徴や利点は、後述する本開示の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。

　本開示の一実施例の構成によれば、学習モデルを適用した特徴量圧縮データと残差データ圧縮データを生成する可逆圧縮処理において圧縮効率を向上させた構成、処理が実現される。
　具体的には、例えば、学習モデルを適用して入力データの特徴量圧縮データを生成する特徴量圧縮部と、特徴量圧縮データの復元により特徴量復元データを生成する特徴量復元部と、入力データと特徴量復元データとの差分である残差データを算出する差分算出部と、残差データから複数の残差分割ブロックを生成する残差データブロック分割部と、残差分割ブロックの圧縮処理により、複数の残差分割ブロック圧縮データを生成する残差分割ブロック単位エンコーダと、特徴量圧縮データと残差分割ブロック圧縮データを合成して出力用圧縮データを生成する出力用圧縮データ生成部を有する。
　本構成により、学習モデルを適用した特徴量圧縮データと残差データ圧縮データを生成する可逆圧縮処理において圧縮効率を向上させた構成、処理が実現される。
　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。

学習モデルを用いたデータ圧縮処理を可逆圧縮処理として実行するデータ圧縮装置の構成例について説明する図である。学習モデルを用いたデータ復元処理を実行するデータ復元装置の構成例について説明する図である。学習モデルを用いたデータ圧縮処理を可逆圧縮処理として実行するデータ圧縮装置の構成例について説明する図である。学習モデルを用いたデータ圧縮処理を可逆圧縮処理として実行するデータ圧縮処理のシーケンスについて説明するフローチャートを示す図である。学習モデルを用いたデータ復元処理を実行するデータ復元装置の構成例について説明する図である。学習モデルを用いたデータ復元処理を実行するデータ復元装置の実行するデータ復元処理のシーケンスについて説明するフローチャートを示す図である。学習モデルの生成、更新処理のシーケンスについて説明するフローチャートを示す図である。本開示のデータ圧縮装置の構成例について説明する図である。本開示のデータ圧縮装置の残差データブロック分割部の実行する処理の具体例について説明する図である。本開示のデータ圧縮装置の残差分割ブロック単位エンコーダの実行する処理の具体例について説明する図である。本開示のデータ圧縮装置が実行するデータ圧縮処理のシーケンスについて説明するフローチャートを示す図である。機械学習の学習に用いられる誤差関数について説明する図である。本開示の学習モデルの生成、更新処理のシーケンスについて説明するフローチャートを示す図である。データ圧縮装置の残差データブロック分割部が実行する残差データの分割ビット数の決定処理シーケンスについて説明するフローチャートを示す図である。本開示のデータ圧縮装置のハードウェア構成例について説明する図である。

　以下、図面を参照しながら本開示のデータ圧縮装置、およびデータ圧縮方法の詳細について説明する。なお、説明は以下の項目に従って行なう。
　１．機械学習モデルを用いたデータ圧縮処理において、可逆圧縮を実現するための基本構成について
　２．学習モデルを利用した特徴量圧縮処理と、残差データ圧縮処理を併用したデータ圧縮、およびデータ復元処理の構成と処理シーケンスについて
　３．学習モデルの生成シーケンスについて
　４．本開示の学習モデルを利用した特徴量圧縮処理と、残差データ圧縮処理を併用したデータ圧縮装置の構成とデータ圧縮処理シーケンスについて
　４－１．（実施例１）残差データの圧縮処理に際して、残差データの各要素を数ビット（ｂｉｔ）単位のブロックに分割し、ブロック単位で圧縮処理を行なうデータ圧縮装置の実施例について
　４－２．（実施例２）圧縮効率を高める残差データ、すなわち、より小さなデータ量の残差圧縮データを生成可能とするための残差データを生成する学習モデルを生成する実施例について
　４－３．（実施例３）圧縮効率を高める残差データの最適なブロック分割態様の決定処理、すなわち、より小さなデータ量の残差圧縮データを生成可能とするブロック分割態様を決定する実施例について
　５．データ圧縮装置のハードウェア構成例について
　６．本開示の構成のまとめ

　　［１．機械学習モデルを用いたデータ圧縮処理において、可逆圧縮を実現するための基本構成について］
　まず、本開示の構成や処理の説明の前に、機械学習モデルを用いたデータ圧縮処理において、可逆圧縮を実現するための基本構成について説明する。

　先に説明したＳｈｅｎらが提案した圧縮システム、すなわち、非特許文献１（"Ｌｏｓｓｌｅｓｓ　Ｃｏｍｐｒｅｓｓｉｏｎ　ｏｆ　Ｃｕｒａｔｅｄ　Ｅｒｙｔｈｒｏｃｙｔｅ　Ｉｍａｇｅｓ　Ｕｓｉｎｇ　Ｄｅｅｐ　Ａｕｔｏｅｎｃｏｄｅｒｓ　ｆｏｒ　Ｍａｌａｒｉａ　Ｉｎｆｅｃｔｉｏｎ　Ｄｉａｇｎｏｓｉｓ"　Ｐｕｂｌｉｓｈｅｄ　ｉｎ　２０１６　Ｐｉｃｔｕｒｅ　Ｃｏｄｉｎｇ　Ｓｙｍｐｏｓｉｕｍ　４－７　Ｄｅｃｅｍｂｅｒ　２０１６．Ｈｏｎｇｄａ　Ｓｈｅｎ　ｅｔ　ａｌ．）に開示された構成に基づいて説明する。

　非特許文献１に開示されたデータ圧縮構成の概要は以下の通りである。
　まず、機械学習モデルを用いた圧縮処理を実行するオートエンコーダを用いてデータから特徴量を抽出して特徴量圧縮データを生成する。
　さらに、特徴量圧縮データに基づく復元データと、入力データとの差分である残差データを計算し、残差データの圧縮データである残差圧縮データを生成する。
　最後に、特徴量圧縮データと残差圧縮データを含むデータを最終的な圧縮データとして生成する。

　この最終的な圧縮データは、機械学習モデルを用いた圧縮処理によって生成された特徴量圧縮データに、この特徴量圧縮データには含まれない残差圧縮データを追加したデータである。従って、最終的な圧縮データの復元処理により、圧縮処理前の元の入力データと同一の復元データを生成することが可能となる。すなわち、可逆圧縮が実現される。これにより、可逆性が強く求められる医療画像への適用が可能となった。

　図１を参照して、非特許文献１に開示されたＳｈｅｎらが提案したデータ圧縮装置の構成と処理について説明する。

　図１に示すデータ圧縮装置２０は、機械学習モデルを用いたデータ圧縮処理を可逆圧縮処理として実行するデータ圧縮装置の構成例である。図１に示すデータ圧縮装置２０は、入力データである圧縮対象データ１０に対する圧縮処理を行なう。

　図１に示す圧縮対象データ１０は、画像データである。なお、画像データは圧縮対象データ１０の一例であり、圧縮対象データ１０は画像データに限らず数値列データ等、様々なデータとすることができる。
　ここでは、圧縮対象データ１０は図１に示すように５０×５０＝２５００画素の画像データであるとする。

　圧縮対象データ１０は、まず、特徴量エンコーダ２１に入力される。特徴量エンコーダ２１は、圧縮対象データ１０である画像データから取得される特徴量の圧縮データ、すなわち図１に示す特徴量圧縮データ１１を生成する。
　画像データから取得する特徴量とは、例えば画像のエッジ情報、色情報、濃淡情報等の様々な情報である。
　特徴量エンコーダ２１は、予め生成された機械学習モデル（以下、「学習モデル」として説明する）を利用して特徴量圧縮データ１１を生成する。

　学習モデルは、様々なサンプルデータに基づいて予め生成された学習モデルであり、特徴量圧縮データを生成するための学習モデルである。この学習モデルには、例えば圧縮処理に適用するためのパラメータ情報等が含まれる。
　特徴量エンコーダ２１は、この学習モデルを利用して特徴量圧縮データ１１を生成する。

　図１に示す例では、２５００画素の画像データを１５００画素、１０００画素、３０画素の順に、順次、圧縮する例を示している。
　特徴量エンコーダ２１は、最終的に３０画素の画像に相当するデータ量を持つ特徴量圧縮データ１１を生成する。

　特徴量エンコーダ２１の生成した特徴量圧縮データ１１は、特徴量デコーダ２２に入力される。特徴量デコーダ２２は、特徴量エンコーダ２１と同様、予め生成された学習モデルを利用して特徴量圧縮データ１１の復元処理（伸長処理）を実行する。

　学習モデルは、様々なサンプルデータに基づいて生成された特徴量復元（伸長）データを生成するための学習モデルであり、復元処理に適用するためのパラメータ情報を有する学習モデルである。
　特徴量デコーダ２２は、この学習モデルを適用したデータ復元処理を行ない、特徴量復元（伸長）データ１２、すなわち５０×５０＝２５００画素の特徴量復元画像を生成する。

　この特徴量復元（伸長）データ１２は、圧縮前の圧縮対象データ１０と類似する画像となるが、完全に同一の画像とはならない。
　この理由は、特徴量エンコーダ２１が圧縮対象データ１０から選択した特徴量のみを用いて特徴量圧縮データ１１を生成し、特徴量デコーダ２２が、この特徴量圧縮データ１１を復元して特徴量復元（伸長）データ１２を生成しているからである。すなわち、特徴量復元（伸長）データ１２には、特徴量として選択されなかった情報が含まれない。

　このように、特徴量復元（伸長）データ１２は、圧縮前の圧縮対象データ１０と異なってしまい、学習モデルを用いたデータ圧縮処理では、可逆圧縮処理を実現できない。
　図１に示すデータ圧縮装置２０は、可逆圧縮処理を実現するため、さらに、以下の処理を実行する。

　まず、差分算出部２３において、特徴量復元（伸長）データ１２と、圧縮対象データ１０との差分、すなわち残差データ１３を算出する。
　次に、残差エンコーダ２４が残差データ１３の圧縮処理を実行する。
　残差エンコーダ２４の実行するデータ圧縮処理は、学習モデルを適用した圧縮処理ではなく、可逆性が保証された圧縮処理である。具体的には、例えば辞書式の圧縮処理や、ゴロム符号化処理等のエントロピー符号化処理を適用した圧縮処理を実行する。
　残差エンコーダ２４は、残差データ１３の圧縮処理により残差圧縮データ１４を生成する。

　次に、出力用圧縮データ生成部（ビットストリーム生成部）２５が、
　（ａ）特徴量エンコーダ２１が生成した特徴量圧縮データ１１、
　（ｂ）残差エンコーダ２４が生成した残差圧縮データ１４、
　これら２つの圧縮データを入力して、これらを組み合わせた出力用圧縮データ１５を生成する。

　出力用圧縮データ１５は、上記（ａ），（ｂ）の各圧縮データの組データ、すなわち、特徴量圧縮データ＋残差圧縮データである。
　この出力用圧縮データ１５が、例えば通信部２６を介して外部装置に送信される。あるいは記憶部２７に格納される。

　出力用圧縮データ１５は、学習モデルを適用して圧縮処理された特徴量圧縮データ１１と、特徴量圧縮データ１１に含まれない残差データ１３の圧縮データである残差圧縮データ１４を含む圧縮データであり、この出力用圧縮データ１５を用いた復元処理（伸長処理）により、圧縮前の圧縮対象データ１０（入力画像）と同一のデータを再現することが可能となる。
　すなわち可逆圧縮処理が実現される。

　次に、出力用圧縮データ１５を入力して復元処理を実行するデータ復元装置の構成と処理について図２を参照して説明する。

　図２に示すデータ復元装置５０は、例えばネットワークを介して、図１に示すデータ圧縮装置２０が生成した出力用圧縮データ１５を受信して復元処理（伸長処理）を実行する。

　図２に示すデータ復元装置５０は、通信部５１を介して、図２に示す出力用圧縮データ（特徴量圧縮データ＋残差圧縮データ）６１を入力する。
　この出力用圧縮データ６１は、図１に示すデータ圧縮装置２０が生成した出力用圧縮データ１５に対応する。

　出力用圧縮データ６１は、データ分離部５２に入力され、特徴量圧縮データ６２と、残差圧縮データ６３に分離される。
　特徴量圧縮データ６２は、特徴量デコーダ５３に入力される。
　特徴量デコーダ５３は、先に図１を参照して説明したデータ圧縮装置２０の特徴量デコーダ２２と同様、予め生成された学習モデルを利用して特徴量圧縮データ６２の復元処理（伸長処理）を実行する。

　学習モデルは、様々なサンプルデータに基づいて生成された特徴量復元（伸長）データを生成するための学習モデルであり、復元処理に適用するためのパラメータ情報を有する学習モデルである。
　特徴量デコーダ５３は、この学習モデルを適用したデータ復元処理を行ない、特徴量復元（伸長）データ６４、すなわち５０×５０＝２５００画素の特徴量復元画像を生成する。

　一方、データ分離部５２が分離した残差圧縮データ６３は、残差デコーダ５４に入力される。
　残差デコーダ５４は、残差圧縮データ６３に対する復元処理（伸長処理）を実行する。この残差デコーダ５４の実行する復元処理は、先に図１を参照して説明したデータ圧縮装置２０の残差エンコーダ２４の実行するデータ圧縮処理に対応するデータ復元処理であり、可逆性を持つ圧縮データの復元処理として実行される。
　残差デコーダ５４は、残差圧縮データ６３に対する復元処理（伸長処理）により、残差データ６５を生成する。
　この残差データ６５は、図１に示す残差データ１３と同一のデータである。

　特徴量デコーダ５３が生成した特徴量復元（伸長）データ６４と、残差デコーダ５４の生成した残差データ６５は、合成部５５に入力される。
　合成部５５は、特徴量復元（伸長）データ６４と、残差データ６５の合成処理を実行して、復元（伸長）データ６６を生成する。
　この復元（伸長）データ６６は、図１に示すデータ圧縮装置２０が入力した圧縮処理前の圧縮対象データ１０と同一のデータとなる。

　すなわち、図１に示すデータ圧縮装置２０の生成した圧縮データ（出力用圧縮データ５０）に対して、図２に示すデータ復元装置５０が実行する復元処理により、圧縮前のデータ（圧縮対象データ１０）と同一の復元（伸長）データ６６を生成することが可能となり、可逆圧縮が実現される。

　しかし、この図１、図２を参照して説明したデータ圧縮、復元処理手法、すなわち機械学習モデルを用いた可逆圧縮手法には圧縮率が低下してしまうという問題がある。

　前述したように、図１に示すデータ圧縮装置２０の生成する最終出力である出力用圧縮データ１５は、
　（ａ）特徴量エンコーダ２１が生成した特徴量圧縮データ１１、
　（ｂ）残差エンコーダ２４が生成した残差圧縮データ１４、
　これら２つの圧縮データを組み合わせた圧縮データである。

　（ｂ）残差エンコーダ２４は、可逆圧縮処理により残差圧縮データ１４を生成しているため、残差圧縮データ１４のデータ量が大きくなってしまう傾向がある。
　この結果、上記の（ａ）のデータ、すなわち、特徴量エンコーダ２１が学習モデルを適用して生成した特徴量圧縮データ１１のデータ量を小さくしても、最終的な出力用圧縮データ１５に含まれる上記（ｂ）のデータ、すなわち、残差エンコーダ２４が生成した残差圧縮データ１４の影響で、最終的な出力用圧縮データ１５のデータ量が大きくなり、圧縮効率が低下してしまうという問題がある。

　前述したように、残差エンコーダ２４は、例えば、数値の出現頻度を利用するエントロピー符号を用いて残差データの圧縮を行なう。
　図１に示すデータ圧縮装置２０の残差エンコーダ２４が生成する残差圧縮データ１４のデータ量について考察する。
　残差エンコーダ２４は、残差データ１３の圧縮処理を行なう。残差データ１３は、差分算出部２３において算出された圧縮対象データ（入力画像）１０と特徴量復元データ（特徴量復元画像）１２の対応画素各々の差分画素値に相当する。

　例えば、一例として、圧縮対象データ（入力画像）１０と特徴量復元データ（特徴量復元画像）１２の各画素値が３２ｂｉｔのｉｎｔ型（整数型）のデータであるとする。
　この場合、各画素の残差データの値は、
　－２，１４７，４８３，６４８（－２^３２）～２，１４７，４８３，６４７（２^３２－１）
　このような広範囲の値に設定される可能性がある。

　このように各画素の残差データが極めて広範囲の値に広がる可能性があると、数値の出現頻度に偏りが発生しづらく、エントロピー符号の圧縮率が向上しない。
　すなわち、残差エンコーダ２４が生成する残差圧縮データ１４のデータ量が大きくなる。

　従って、図１に示すデータ圧縮装置２０の特徴量エンコーダ２１において実行される学習モデルを適用した圧縮処理が高い圧縮率を実現したとしても、残差データが圧縮しづらいデータである限り、最終出力である出力用圧縮データ１５のデータ量を大幅に削減することは困難となる。

　また、非特許文献１に記載のＳｈｅｎらの手法は、特徴量エンコーダ２１における特徴量圧縮処理に適用する学習モデルの生成手法、すなわち学習方法にも課題がある。

　図１に示すデータ圧縮装置２０の最終出力である出力用圧縮データ１５は、残差圧縮データが大半を占めており、この残差圧縮データをいかに少なくするかが圧縮率向上の鍵となる。従って、本来は残差データの圧縮効率を高めることを考慮して学習モデルを最適化するべきである。

　しかし、非特許文献１に記載の学習モデルは、圧縮対象データ１０と、特徴量復元（伸長）データ１２との誤差を最小化するモデル、つまり、抽出される特徴の質を向上させるような学習モデルであり、残差データの圧縮効率については考慮されていない。結果として、最終出力である出力用圧縮データ１５中の残差圧縮データのデータ量が大きくなってしまっている。

　特徴量エンコーダ２１において生成される特徴量圧縮データ１１のデータサイズは、圧縮対象データ１０の特徴の質に関わらず一定であり、圧縮率向上という観点では、残差圧縮データのデータ量削減が鍵であり、改善の余地があると考えられる。

　　［２．学習モデルを利用した特徴量圧縮処理と、残差データ圧縮処理を併用したデータ圧縮、およびデータ復元処理の構成と処理シーケンスについて］
　次に、学習モデルを利用した特徴量圧縮処理と、残差データ圧縮処理を併用したデータ圧縮、およびデータ復元処理の構成と処理シーケンスについて説明する。

　非特許文献１に記載された構成について、図１、図２を参照して説明したが、次に、図３以下を参照して、学習モデルを利用した特徴量圧縮処理と、残差データ圧縮処理を併用したデータ圧縮、およびデータ復元の構成と処理シーケンスについて説明する。

　図３は、学習モデルを利用した特徴量圧縮処理と、残差データ圧縮処理を併用したデータ圧縮処理を行なうデータ圧縮装置１００の構成例を示す図である。

　図３に示すデータ圧縮装置１００は、学習モデル適用特徴量圧縮部１０１、学習モデル適用特徴量復元部１０２、差分算出部１０３、残差エンコーダ１０４、出力用圧縮データ生成部（ビットストリーム生成部）１０５、および学習モデル格納部１１０を有する。

　図３に示すデータ圧縮装置１００は、圧縮対象データである入力データ１２１を学習モデル適用特徴量圧縮部１０１に入力する。
　学習モデル適用特徴量圧縮部１０１は、学習モデル格納部１１０に格納された学習モデルを適用して、入力データ１２１から取得される特徴量の圧縮データ、すなわち特徴量圧縮データ１２２を生成する。

　学習モデル格納部１１０に格納された学習モデルは、様々なサンプルデータに基づいて生成された特徴量圧縮データを生成するための学習モデルであり、圧縮処理に適用するためのパラメータ情報等を有する学習モデルである。
　学習モデル適用特徴量圧縮部１０１は、この学習モデルを利用して特徴量圧縮データ１２２を生成する。

　学習モデル適用特徴量圧縮部１０１の生成した特徴量圧縮データ１２２は、学習モデル適用特徴量復元部１０２に入力される。学習モデル適用特徴量復元部１０２も、学習モデル格納部１１０に格納された学習モデルを適用して、特徴量圧縮データ１２２の復元処理（伸長処理）を実行し、特徴量復元（伸長）データ１２３を生成する。

　学習モデル適用特徴量復元部１０２が利用する学習モデルは、様々なサンプルデータに基づいて生成された特徴量復元（伸長）データを生成するための学習モデルであり、復元処理に適用するためのパラメータ情報を有する学習モデルである。
　学習モデル適用特徴量復元部１０２は、学習モデルを適用したデータ復元処理を行ない、特徴量復元（伸長）データ１２３を生成する。

　学習モデル適用特徴量復元部１０２が生成した特徴量復元（伸長）データ１２３は、差分算出部１１０３に入力される。
　差分算出部１０３は、学習モデル適用特徴量復元部１０２が生成した特徴量復元（伸長）データ１２３と、圧縮処理前の入力データ１２１との差分、すなわち残差データ１２４を算出する。

　差分算出部１０３が算出した残差データ１２４は、残差エンコーダ１０４に入力される。
　残差エンコーダ１０４は、残差データ１２４の圧縮処理を実行して、残差圧縮データ１２５を生成する。
　残差エンコーダ１０４の実行するデータ圧縮処理は、学習モデルを適用した圧縮処理ではなく、可逆性が保証された圧縮処理である。具体的には、例えば辞書式の圧縮処理や、ゴロム符号化処理等のエントロピー符号化処理を適用した圧縮処理を実行する。

　しかし、先に図１を参照して説明したように、この残差エンコーダ１０４の実行するデータ圧縮処理では、十分なデータ量削減が実現されないという問題がある。
　すなわち、例えば、圧縮対象データ（入力データ）１２１の各要素値が３２ｂｉｔのｉｎｔ型（整数型）のデータであるとすると、特徴量復元データ１２３との残差データは、－２，１４７，４８３，６４８（－２^３２）から２，１４７，４８３，６４７（２^３２－１）の広範囲の値を取り得る。このように残差データの各要素が極めて広範囲の値に広がる可能性があると、数値の出現頻度に偏りが発生しづらく、エントロピー符号の圧縮率が向上しない。
　すなわち、残差エンコーダ１０４が生成する残差圧縮データ１２５のデータ量が大きくなってしまう。

　残差エンコーダ１０４が生成した残差圧縮データ１２５は、出力用圧縮データ生成部（ビットストリーム生成部）１０５に入力される。

　出力用圧縮データ生成部（ビットストリーム生成部）１０５は、
　（ａ）学習モデル適用特徴量圧縮部１０１の生成した特徴量圧縮データ１２２、
　（ｂ）残差エンコーダ１０４が生成した残差圧縮データ１２５、
　これら２つの圧縮データを入力して、これらを組み合わせた出力用圧縮データ１２６を生成する。

　出力用圧縮データ１２６は、上記（ａ），（ｂ）の各圧縮データの組データ、すなわち、特徴量圧縮データ＋残差圧縮データである。
　この出力用圧縮データ１２６が、例えば通信部を介して外部装置に送信される。あるいは記憶部に格納される。

　出力用圧縮データ１２６は、学習モデルを適用して圧縮処理された特徴量圧縮データ１２２と、特徴量圧縮データ１２２に含まれない残差データ１２４の圧縮データである残差圧縮データ１２５を含む圧縮データであり、この出力用圧縮データ１２６を用いた復元処理（伸長処理）により、圧縮前の入力データ１２１と同一のデータを再現することが可能となる。すなわち可逆圧縮処理が実現される。

　次に、図４に示すフローチャートを参照して、図３に示すデータ圧縮装置１００が実行するデータ圧縮処理のシーケンスについて説明する。
　図４に示すフローの各ステップの処理について、順次、説明する。

　　（ステップＳ１０１）
　まず、データ圧縮装置１００は、ステップＳ１０１において、圧縮対象データを入力する。

　　（ステップＳ１０２）
　次に、データ圧縮装置１００は、ステップＳ１０２において、学習モデル（特徴量圧縮用学習モデル、特徴量復元用学習モデル）を取得する。

　　（ステップＳ１０３）
　次に、データ圧縮装置１００は、ステップＳ１０３において、入力データ（圧縮対象データ）に対して、特徴量圧縮用学習モデルを適用した圧縮処理を実行して特徴量圧縮データを生成する。

　この処理は、図３に示すデータ圧縮装置１００の学習モデル適用特徴量圧縮部１０１が実行する処理である。

　　（ステップＳ１０４）
　次に、データ圧縮装置１００は、ステップＳ１０４において、ステップＳ１０３で生成した特徴量圧縮データに対して、特徴量復元用学習モデルを適用した復元処理を実行して特徴量復元データを生成する。

　この処理は、図３に示すデータ圧縮装置１００の学習モデル適用特徴量復元部１０２が実行する処理である。

　　（ステップＳ１０５）
　次に、データ圧縮装置１００は、ステップＳ１０５において、入力データ（圧縮対象データ）と、ステップＳ１０４で生成した特徴量復元データとの差分（残差）を算出する。

　この処理は、図３に示すデータ圧縮装置１００の差分算出部１０３が実行する処理である。

　　（ステップＳ１０６）
　次に、データ圧縮装置１００は、ステップＳ１０６において、ステップＳ１０５で算出した差分（残差）に対する圧縮処理を実行して、残差圧縮データを生成する。

　この処理は、図３に示すデータ圧縮装置１００の残差エンコーダ１０４が実行する処理である。
　しかし、先に説明したように、この残差エンコーダ１０４の実行するデータ圧縮処理では十分なデータ量削減が実現されない、すなわち圧縮効率が悪いという問題がある。

　　（ステップＳ１０７）
　最後に、データ圧縮装置１００は、ステップＳ１０７において、ステップＳ１０３で学習モデル適用特徴量圧縮部１０１が生成した特徴量圧縮データと、ステップＳ１０６で残差エンコーダ１０４が生成した残差圧縮データを組み合わせて、出力用圧縮データを生成する。

　この処理は、図３に示すデータ圧縮装置１００の出力用圧縮データ生成部１０５が実行する処理である。

　出力用圧縮データ生成部１０５が生成する出力用圧縮データは、ステップＳ１０３で学習モデル適用特徴量圧縮部１０１が生成した特徴量圧縮データと、ステップＳ１０６で残差エンコーダ１０４が生成した残差圧縮データを組み合わせたデータである。
　この出力用圧縮データには、残差エンコーダ１０４が生成した圧縮効率の悪い残差圧縮データが含まれるため、データ量が大きくなってしまう。

　次に、図５を参照して、図３に示すデータ圧縮装置１００が生成した出力用圧縮データ１０５を入力して復元処理を実行するデータ復元装置１５０の構成について説明する。

　図５に示すように、データ復元装置１５０は、データ分離部１５１、学習モデル適用特徴量復元部１５２、残差デコーダ１５３、合成部１５４、さらに学習モデル格納部１６０を有する。

　図５に示すデータ復元装置１５０は、例えばネットワークを介して、図３に示すデータ圧縮装置１００が生成した出力用圧縮データ１７１（＝図３に示す出力用圧縮データ１２６）を受信して復元処理（伸長処理）を実行する。

　復元処理対象データである出力用圧縮データ１７１は、図５に示すデータ復元装置１５０のデータ分離部１５１に入力される。
　データ分離部１５１は、出力用圧縮データ１７１に含まれる２種類の圧縮データ、すなわち、特徴量圧縮データ１７２と、残差圧縮データ１７３との分離処理を行なう。
　特徴量圧縮データ１７２は、学習モデル適用特徴量復元部１５２に入力される。

　学習モデル適用特徴量復元部１５２は、先に図３を参照して説明したデータ圧縮装置１００の学習モデル適用特徴量復元部１０２と同様、予め生成された学習モデルを利用して特徴量圧縮データ１７２の復元処理（伸長処理）を実行する。

　学習モデルは、様々なサンプルデータに基づいて生成された特徴量復元（伸長）データを生成するための学習モデルであり、復元処理に適用するためのパラメータ情報を有する学習モデルである。
　学習モデル適用特徴量復元部１５２は、この学習モデルを適用したデータ復元処理を行ない、特徴量復元（伸長）データ１７４を生成する。

　一方、データ分離部１５１が分離した残差圧縮データ１７３は、残差デコーダ１５３に入力される。
　残差デコーダ１５３は、残差圧縮データ１７３に対する復元処理（伸長処理）を実行する。この残差デコーダ１５３の実行する復元処理は、先に図３を参照して説明したデータ圧縮装置１００の残差エンコーダ１０４の実行するデータ圧縮処理に対応するデータ復元処理であり、可逆性を持つ圧縮データの復元処理として実行される。

　残差デコーダ１５３は、残差圧縮データ１７３に対する復元処理（伸長処理）により、残差データ１７５を生成する。
　この残差データ１７５は、図３に示す残差データ１２４と同一のデータである。

　学習モデル適用特徴量復元部１５２が生成した特徴量復元（伸長）データ１７４と、残差デコーダ１５３の生成した残差データ１７５は、合成部１５４に入力される。
　合成部１５４は、特徴量復元（伸長）データ１７４と、残差データ１７５の合成処理を実行して、復元（伸長）データ１７６を生成する。
　この復元（伸長）データ１７６は、図３に示すデータ圧縮装置１００が入力した圧縮処理前の圧縮対象データである入力データ１２１と同一のデータとなる。

　このように、図３に示すデータ圧縮装置１００の生成した圧縮データ（出力用圧縮データ１２６）に対して、図５に示すデータ復元装置１５０が実行する復元処理により、圧縮前の入力データ１２１と同一の復元（伸長）データ１７５を生成することが可能となり、可逆圧縮が実現される。

　次に、図６に示すフローチャートを参照して、図５に示すデータ復元装置１５０が実行するデータ復元処理のシーケンスについて説明する。
　図６に示すフローの各ステップの処理について、順次、説明する。

　　（ステップＳ１２１）
　まず、データ復元装置１５０は、ステップＳ１２１において、復元対象データを入力する。
　入力する復元対象データは、特徴量圧縮データと、残差圧縮データによって構成されたデータである。

　　（ステップＳ１２２）
　次に、データ復元装置１５０は、ステップＳ１２２において、ステップＳ１２１で入力した復元対象データを特徴量圧縮データと、残差圧縮データに分離する。

　この処理は、図５に示すデータ復元装置１５０のデータ分離部１５１が実行する処理である。

　　（ステップＳ１２３）
　次に、データ復元装置１５０は、ステップＳ１２３において、学習モデル（特徴量復元用学習モデル）を取得する。

　　（ステップＳ１２４）
　次に、データ復元装置１５０は、ステップＳ１２４において、ステップＳ１２２のデータ分離処理において、入力データから分離された特徴量圧縮データに対して、特徴量復元用学習モデルを適用した復元処理を実行して特徴量復元データを生成する。

　この処理は、図５に示すデータ復元装置１５０の学習モデル適用特徴量復元部１５２が実行する処理である。

　　（ステップＳ１２５）
　次に、データ復元装置１５０は、ステップＳ１２５において、ステップＳ１２２のデータ分離処理において、入力データから分離された残差圧縮データに対する復元処理（伸長処理）を実行して残差復元データを生成する。

　この処理は、図５に示すデータ復元装置１５０の残差デコーダ１５３が実行する処理である。

　　（ステップＳ１２６）
　次に、データ復元装置１５０は、ステップＳ１２６において、ステップＳ１２４で生成した特徴量復元データと、ステップＳ１２５で生成した残差復元データの合成処理を実行して、出力用復元データを生成する。

　この復元（伸長）データは、図３に示すデータ圧縮装置１００が入力した圧縮処理前の圧縮対象データである入力データ１２１と同一のデータとなる。
　このように、図３に示すデータ圧縮装置１００の生成した圧縮データ（出力用圧縮データ１２６）に対して、図５に示すデータ復元装置１５０が実行する復元処理により、圧縮前のデータ（入力データ１２１）と同一の復元（伸長）データ１７５を生成することが可能となり、可逆圧縮が実現される。

　しかし、前述したように、この図３～図６を参照して説明したデータ圧縮、復元処理手法、すなわち機械学習モデルを用いた可逆圧縮手法では、図３に示すデータ圧縮装置１００の生成する圧縮データ（出力用圧縮データ１２６）に含まれる残差圧縮データのデータ量が多くなり、圧縮効率が低下してしまうという問題がある。

　　［３．学習モデルの生成シーケンスについて］
　次に、図７に示すフローチャートを参照して、図３に示すデータ圧縮装置１００の学習モデル適用特徴量圧縮部１０１、学習モデル適用特徴量復元部１０２、さらに、図５に示すデータ復元装置１５０の学習モデル適用特徴量復元部１５１が利用する学習モデルの生成シーケンスについて説明する。

　図７に示すフローチャートの各ステップの処理について、順次、説明する。
　なお、図７に示すフローに従った処理は、図３に示すデータ圧縮装置１００や図５に示すデータ復元装置１５０、あるいはその他の装置において実行可能であり、図７に示すフローに従った処理によって生成、更新された学習モデルが図３に示すデータ圧縮装置１００の学習モデル格納部１１０や、図５に示すデータ復元装置１５０の学習モデル格納部１６０に格納される。

　　（ステップＳ１５１）
　まず、ステップＳ１５１において、ひな形としての学習モデルを入力する。
　ひな形となる学習モデルには、特徴量圧縮データを生成するための圧縮処理用学習モデルと、特徴量圧縮データから復元データを生成するための復元処理用学習モデルが含まれる。

　圧縮処理用学習モデルには圧縮処理に適用する様々なパラメータが含まれ、復元処理用学習モデルには復元処理に適用する様々なパラメータが含まれる。
　初期的なひな形の学習モデルのパラメータは、任意の値に設定可能である。

　　（ステップＳ１５２）
　次に、ステップＳ１５２において、ステップＳ１５１で入力した学習モデルの損失関数を定義する。
　損失関数は、学習モデルの性能を定量的に評価するための関数である。

　具体的には、例えば、学習モデルを適用したデータ処理を実行するデータ処理部に対する入力と出力の距離を測る指標値算出関数、例えば二乗誤差の算出関数や、クロスエントロピー誤差算出関数等が用いられる。

　　（ステップＳ１５３）
　次に、ステップＳ１５３において、ステップＳ１５２で定義した損失関数を用いて、ステップＳ１５１で入力した現在の学習モデルのパラメータの評価を行う。

　具体的には、入力データから特徴量を抽出し、抽出された特徴量から復元したデータと入力データとの乖離の度合いを損失関数により評価する。
　例えば、復元データと入力データとの乖離が少ないほど損失が小さい（評価値が高い）値が算出される損失関数を定義して、この損失関数を用いて学習モデルのパラメータの評価を行う。

　　（ステップＳ１５４～Ｓ１５５）
　次に、ステップＳ１５４において、ステップＳ１５３で算出した評価値に基づいてパラメータの更新量を計算し、ステップＳ１５５において、計算結果に基づくパラメータの更新を行う。
　これらのパラメータの評価と更新処理は、予め規定した回数、繰り返して実行する。

　　（ステップＳ１５６）
　ステップＳ１５６において、ステップＳ１５４～Ｓ１５５のパラメータ評価と更新処理が、予め規定した回数に達したと判定されると、ステップＳ１５７に進む。

　　（ステップＳ１５７）
　最後に、ステップＳ１５７において、ステップＳ１５４～Ｓ１５５のパラメータ評価と更新処理の規定回数文の繰り返し処理によって、最終的に更新されたパラメータを設定した学習モデルを生成して学習モデル格納部（図３の学習モデル格納部１１０、図５の学習モデル格納部１６０）に格納する。

　このようにして生成された学習モデルが、図３に示すデータ圧縮装置１００の学習モデル適用特徴量圧縮部１０１、学習モデル適用特徴量復元部１０２、さらに、図５に示すデータ復元装置１５０の学習モデル適用特徴量復元部１５１において利用され、特徴量の圧縮、復元処理が行われる。

　ただし、前述したように、この学習モデルは、圧縮対象データと、特徴量復元（伸長）データとの誤差を最小化するモデル、つまり、抽出される特徴の質を向上させるような学習モデルであり、残差データの圧縮しやすさについては考慮されていない。
　すなわち、図３に示すデータ圧縮装置１００の最終出力である出力用圧縮データ１２６に含まれる残差圧縮データのデータ量については考慮されていないため、圧縮効率の向上に寄与する学習モデルとはならないという問題がある。

　　［４．本開示の学習モデルを利用した特徴量圧縮処理と、残差データ圧縮処理を併用したデータ圧縮装置の構成とデータ圧縮処理シーケンスについて］
　次に、本開示の学習モデルを利用した特徴量圧縮処理と、残差データ圧縮処理を併用したデータ圧縮装置の構成とデータ圧縮処理シーケンスについて説明する。

　図１～図７を参照して説明したように、既存の学習モデルを用いた可逆圧縮手法には、以下の問題がある。
　（１）残差データの圧縮効率が悪い
　（２）学習モデルの学習方法が最適でない
　これら２点の問題点が存在する。

　上記問題点の発生する要因は以下のように解析できる。
　（１）残差データの圧縮効率が悪い
　この問題点は、具体的には、
　（１）残差データの各要素が広い範囲の値を取りうるために、既存の辞書式の圧縮やエントロピー符号の圧縮が効きづらい、
　このような要因によって発生している。

　また、（２）学習モデルの学習方法が最適でない
　この問題点は、具体的には、
　（２）質の良い特徴を生成するようにモデルを学習しており、全体の圧縮率向上という本来の目的でモデルを学習していない、
　このような要因によって発生している。

　以下において説明する本開示のデータ圧縮装置は、これらの問題を解決するものである。
　本開示のデータ圧縮装置も、先に図１や図３を参照して説明したデータ圧縮装置と同様、学習モデルを利用した特徴量圧縮処理と、残差データ圧縮処理を併用したデータ圧縮処理を実行する。

　しかし、本開示のデータ圧縮装置は、残差データの圧縮処理態様を改良しており、図１や図３に示すデータ圧縮装置に比較して、残差圧縮データのデータ量が大きく削減される。結果として、最終出力となる出力用圧縮データ（特徴量圧縮データ＋残差圧縮データ）のデータサイズを小さくする可逆圧縮処理を実現している。

　なお、本開示のデータ圧縮装置の実施例として、以下の複数の実施例について、順次、説明する。
　　（実施例１）残差データの圧縮処理に際して、残差データの各要素を数ビット（ｂｉｔ）単位のブロックに分割し、ブロック単位で圧縮処理を行なうデータ圧縮装置の実施例、
　　（実施例２）圧縮効率を高める残差データ、すなわち、より小さなデータ量の残差圧縮データを生成可能とするための残差データを生成する学習モデルを生成する実施例、
　　（実施例３）圧縮効率を高める残差データの最適なブロック分割態様の決定処理、すなわち、より小さなデータ量の残差圧縮データを生成可能とするブロック分割態様を決定する実施例

　　［４－１．（実施例１）残差データの圧縮処理に際して、残差データの各要素を数ビット（ｂｉｔ）単位のブロックに分割し、ブロック単位で圧縮処理を行なうデータ圧縮装置の実施例について］
　まず、（実施例１）として、残差データの圧縮処理に際して、残差データの各要素を数ビット（ｂｉｔ）単位のブロックに分割し、ブロック単位で圧縮処理を行なうデータ圧縮装置の実施例について説明する。

　この（実施例１）は、残差データを、の各要素を数ビット（ｂｉｔ）単位のブロックに分割し、分割ブロック単位の圧縮処理を行なうことで、各ブロックの数値の取り得る範囲を狭め、数値の出現規則や頻度を用いた圧縮効率を向上させて残差圧縮データのデータ量を削減する構成としたものである。

　本開示の実施例１のデータ圧縮装置２００の構成例を図８に示す。
　図８に示す本開示のデータ圧縮装置２００は、先に説明した図１や図３のデータ圧縮装置と同様、学習モデルを利用した特徴量圧縮処理と、残差データ圧縮処理を併用したデータ圧縮処理を行なう。

　図８に示すデータ圧縮装置２００は、学習モデル適用特徴量圧縮部２０１、学習モデル適用特徴量復元部２０２、差分算出部２０３、残差データブロック分割部２０４、残差分割ブロック単位エンコーダ２０５、出力用圧縮データ生成部（ビットストリーム生成部）２０６、および学習モデル格納部２１０を有する。

　図８に示すデータ圧縮装置２００は、圧縮対象データである入力データ２２１を学習モデル適用特徴量圧縮部２０１に入力する。
　学習モデル適用特徴量圧縮部２０１は、学習モデル格納部２１０に格納された学習モデルを適用して、入力データ２２１から取得される特徴量の圧縮データ、すなわち特徴量圧縮データ２２２を生成する。

　学習モデル格納部２１０に格納された学習モデルは、様々なサンプルデータに基づいて生成された特徴量圧縮データを生成するための学習モデルであり、圧縮処理に適用するためのパラメータ情報を有する学習モデルである。
　学習モデル適用特徴量圧縮部２０１は、この学習モデルを利用して特徴量圧縮データ２２２を生成する。
　なお、学習モデル適用特徴量圧縮部２０１の生成する圧縮処理は非可逆圧縮処理である。

　学習モデル適用特徴量圧縮部２０１の生成した特徴量圧縮データ２２２は、学習モデル適用特徴量復元部２０２に入力される。学習モデル適用特徴量復元部２０２も、学習モデル格納部２１０に格納された学習モデルを適用して、特徴量圧縮データ２２２の復元処理（伸長処理）を実行し、特徴量復元（伸長）データ２２３を生成する。

　学習モデル適用特徴量復元部２０２が利用する学習モデルは、様々なサンプルデータに基づいて生成された特徴量復元（伸長）データを生成するための学習モデルであり、復元処理に適用するためのパラメータ情報を有する学習モデルである。
　学習モデル適用特徴量復元部２０２は、学習モデルを適用したデータ復元処理を行ない、特徴量復元（伸長）データ２２３を生成する。

　学習モデル適用特徴量復元部２０２が生成した特徴量復元（伸長）データ２２３は、差分算出部２０３に入力される。
　差分算出部２０３は、学習モデル適用特徴量復元部２０２が生成した特徴量復元（伸長）データ２２３と、圧縮処理前の入力データ２２１との差分、すなわち残差データ２２４を算出する。

　差分算出部２０３が算出した残差データ２２４は、残差データブロック分割部２０４に入力される。
　残差データブロック分割部２０４は、差分算出部２０３が算出した残差データ２２４を、複数のブロックに分割し、図に示す複数（ｎ個）の残差分割ブロック－ｎ，２２５－１～ｎを生成する。

　図９を参照して、残差データブロック分割部２０４の実行する処理の具体例について説明する。
　図８に示す入力データ２２１を４画素の画像データと仮定する。この仮定において、残差データブロック分割部２０４に入力する残差データ２２４が、図９に示す４画素ａ～ｄ各々の残差データによって構成されているとする。

　図９に示す残差データ２２４は、画素ａ～ｄ各々の残差データによって構成されている。これらは、差分算出部２０３において算出された入力データ２２１と特徴量復元データ２２３の４つの対応画素ａ～ｄ各々の差分画素値に相当する。

　図９に示すように、４画素ａ～ｄ各々の残差データは、以下の通りである。
　画素ａの残差（差分画素値）＝２７１
　画素ｂの残差（差分画素値）＝１５
　画素ｃの残差（差分画素値）＝２９
　画素ｄの残差（差分画素値）＝９７
　図９には、この各数値に対応する２進ビット列（３２ビット）を示している。

　図９に示す例は、入力データ２２１と特徴量復元データ２２３の各画素値が３２ｂｉｔのｉｎｔ型（整数型）のデータであると仮定しており、画素ａ～ｄ各々の残差データも２進ビット列（３２ビット）として示している。

　残差データブロック分割部２０４は、これらの３２ビットのビット列を複数のブロックに分割する。
　残差データブロック分割部２０４は、残差データの全要素（全画素）について、同一区切り位置でビット列を区切り、同一区切り位置内の全要素の構成データを１つの残差分割ブロックの構成データとして、複数の残差分割ブロックを生成する。

　具体的には、例えば図９に示すように残差データ２２４の全要素（全画素）について、最上位ビットから最下位ビットまで８ビット単位の４つのブロックに分割する。なお、図９に示す例では、１ブロック当たりのビット数、すなわち分割ビット数＝８ビットとしているが、これは、一例であり、様々な分割態様が可能である。

　例えば、１６ビット単位の２ブロックに分割する設定、あるいは上位ビットから１５ビット、次の１０ビット、最後の７ビット等、異なるビット数で分割する設定としてもよい。
　なお、分割ビット数の最適化処理については、後述する実施例３において説明する。

　図９に示す例では、残差データブロック分割部２０４は、各画素ａ～ｄの残差データ（２７１，１５，２９，３２）の３２ビットデータを、上位ビットから下位ビットまで、８ビット単位の４つのブロックに分割し、４つの残差分割ブロック１，２２５－１～残差分割ブロック４，２２５－４を生成している。

　残差分割ブロック１，２２５－１は、画素ａ～ｄの残差データ各々の最上位ビットから８ビットのデータによって構成される残差分割ブロックである。
　残差分割ブロック２，２２５－２は、画素ａ～ｄの残差データ各々の上位から９ビット～１６ビットの８ビットデータによって構成される残差分割ブロックである。

　残差分割ブロック３，２２５－３は、画素ａ～ｄの残差データ各々の上位から１７ビット～２４ビットの８ビットデータによって構成される残差分割ブロックである。
　残差分割ブロック４，２２５－４は、画素ａ～ｄの残差データ各々の上位から２５ビット～３２ビットの８ビットデータ（＝下位８ビットデータ）によって構成される残差分割ブロックである。

　先に図３を参照して説明したように、従来のデータ圧縮装置１００の残差エンコーダ１０４は、これらの３２ビット数値列に対して、辞書式の圧縮処理や、ゴロム符号化処理等のエントロピー符号を実行するが、残差エンコーダ１０４の実行するデータ圧縮処理では、十分なデータ量削減が実現されないという問題があった。
　すなわち、各画素の残差データは、－２，１４７，４８３，６４８（－２^３２）から２，１４７，４８３，６４７（２^３２－１）の広範囲の値を取る可能性があり、このように各画素の残差データが極めて広範囲の値に広がると、数値の出現頻度に偏りが発生しづらく、エントロピー符号の圧縮率が向上しない。

　この問題を解決するため、図８に示す本開示のデータ圧縮装置２００は、以下の処理を行なう構成としている。
　残差データブロック分割部２０４が、各画素ａ～ｄの残差データ（２７１，１５，２９，３２）の３２ビットデータを、上位ビットから下位ビットまで、複数（図９に示す例では４つ）のブロックに分割する。
　図９に示す例では、４つの残差分割ブロック１，２２５－１～残差分割ブロック４，２２５－４を生成する。
　さらに、次の残差分割ブロック単位エンコーダ２０５が、これらの複数の残差分割ブロック単位で圧縮処理を実行する。

　図８に示すように、残差データブロック分割部２０４が生成した複数の残差分割ブロック１，２２５－１～残差分割ブロックｎ，２２５－ｎは、残差分割ブロック単位エンコーダ２０５に入力される。

　残差分割ブロック単位エンコーダ２０５は、これらの複数の残差分割ブロック１，２２５－１～残差分割ブロックｎ，２２５－ｎを個別に圧縮し、分割ブロック数に応じた残差分割ブロック圧縮データ－１，２２６－１～残差分割ブロック圧縮データ－ｎ，２２６－ｎを生成する。

　残差分割ブロック単位エンコーダ２０５の実行する残差分割ブロック単位の圧縮処理例について、図１０を参照して説明する。

　図１０には、図９を参照して説明した残差データブロック分割部２０４の生成した４つの残差分割ブロック、すなわち、４画素ａ～ｄの残差データ（２７１，１５，２９，３２）の３２ビットデータを、上位ビットから下位ビットまで、８ビット単位で分割した４つの残差分割ブロック１，２２５－１～残差分割ブロック４，２２５－４を示している。

　残差分割ブロック単位エンコーダ２０５は、これら４つの残差分割ブロック１，２２５－１～残差分割ブロック４，２２５－４に対して、個別に圧縮処理（エンコード処理）を実行する。残差分割ブロック単位エンコーダ２０５は、残差分割ブロックごとに辞書式の圧縮やエントロピー符号による圧縮を行う。
　なお、残差分割ブロック単位エンコーダ２０５実行する圧縮処理は、残差分割ブロック単位の可逆圧縮処理である。
　この圧縮処理結果として、分割ブロック数に応じた残差分割ブロック圧縮データ－１，２２６－１～残差分割ブロック圧縮データ－４，２２６－４を生成する。

　各ブロックに含まれる各要素（各画素）のビット数は８ビットであり、この８ビットデータの数値の取り得る範囲は、先に図３等を参照して説明した従来方式よりも狭まることになる。
　先に図３を参照して説明したように、従来のデータ圧縮装置１００の残差エンコーダ１０４は、これらの３２ビット数値列に対して、辞書式の圧縮処理や、ゴロム符号化処理等のエントロピー符号を実行する。しかし、各画素の残差データは、－２，１４７，４８３，６４８（－２^３２）から２，１４７，４８３，６４７（２^３２－１）の広範囲の値を取る可能性があり、このように各画素の残差データが極めて広範囲の値に広がると、数値の出現頻度に偏りが発生しづらく、エントロピー符号の圧縮率が向上しない。

　これに対して、図８に示す本開示のデータ圧縮装置２００では、圧縮処理対象となるデータを各画素の３２ビットデータ列を８ビット単位で分割している。８ビットデータの取り得る数値範囲は、－１２８（－２^８）～１２７（２^８）と大幅に削減される。この結果、１つのブロックに同じ値（具体的にはビット値＝０）が多数、含まれる確率を大幅に上げることができる。結果としてエントロピー符号化による圧縮効率が大幅に向上することになる。すなわちデータ圧縮効率が上がり、圧縮データのデータ量を小さくすることが可能となる。

　図１０に示す各画素ａ～ｄの３２ビットデータ列の４つのブロック中、上位ビットのブロックは、ほぼオール０の値である。このように全てのビットが０であるブロックは、圧縮データとして最小のビット数に削減することが可能となる。すなわち、各画素の残差データの値が小さい値である場合、上位ビットのブロックの圧縮データのデータ量を大幅に削減でき、圧縮率を向上させることができる。

　圧縮処理対象となるデータは、図８に示す差分算出部２０３が算出した残差データ２２４である。これは、学習モデル適用特徴量復元部２０２が生成した特徴量復元（伸長）データ２２３と、圧縮処理前の入力データ２２１との差分データである。

　この差分データは、大きな値をとる可能性は少なく、小さい値をとる可能性が大きい。この理由は、学習モデル適用特徴量圧縮部２０１や、学習モデル適用特徴量復元部２０２において実行するデータ圧縮、復元処理が学習モデルを利用した処理であり、この学習モデルが、入力と復元データを近づけるように設定された学習モデルであるからである。
　従って、図１０に示すように各画素の上位ビットの多くは０に設定される可能性が高く、圧縮効率を大幅に向上させることができる。

　図８に戻り、本開示のデータ圧縮装置２００の構成と処理について説明を続ける。
　図１０を参照して説明したように、残差分割ブロック単位エンコーダ２０５は、残差データブロック分割部２０４から入力した複数の残差分割ブロック１，２２５－１～残差分割ブロックｎ，２２５－ｎを個別に圧縮し、分割ブロック数に応じた残差分割ブロック圧縮データ－１，２２６－１～残差分割ブロック圧縮データ－ｎ，２２６－ｎを生成する。

　残差分割ブロック単位エンコーダ２０５が生成した複数の残差分割ブロック圧縮データ－１，２２６－１～残差分割ブロック圧縮データ－ｎ，２２６－ｎは、出力用圧縮データ生成部（ビットストリーム生成部）２０６に入力される。

　出力用圧縮データ生成部（ビットストリーム生成部）２０６は、
　（ａ）学習モデル適用特徴量圧縮部２０１の生成した特徴量圧縮データ２２２、
　（ｂ）残差分割ブロック単位エンコーダ２０５が生成した複数の残差分割ブロック圧縮データ－１，２２６－１～残差分割ブロック圧縮データ－ｎ，２２６－ｎ、
　これらの圧縮データを入力して、これらを組み合わせた出力用圧縮データ２２７を生成する。

　出力用圧縮データ２２７は、上記（ａ），（ｂ）の各圧縮データの組データ、すなわち、特徴量圧縮データ＋残差分割ブロック圧縮データである。
　この出力用圧縮データ２２７が、例えば通信部を介して外部装置に送信される。あるいは記憶部に格納される。

　出力用圧縮データ２２７は、学習モデルを適用して圧縮処理された特徴量圧縮データ２２２と、特徴量圧縮データ２２２に含まれない残差データ２２４の圧縮データである残差分割ブロック圧縮データ２２６を含む圧縮データであり、この出力用圧縮データ２２７を用いた復元処理（伸長処理）により、圧縮前の入力データ２２１と同一のデータを再現することが可能となる。すなわち可逆圧縮処理が実現される。

　次に、図１１に示すフローチャートを参照して、図８に示すデータ圧縮装置２００が実行するデータ圧縮処理のシーケンスについて説明する。
　図１１に示すフローの各ステップの処理について、順次、説明する。

　　（ステップＳ２０１）
　まず、データ圧縮装置２００は、ステップＳ２０１において、圧縮対象データを入力する。

　　（ステップＳ２０２）
　次に、データ圧縮装置２００は、ステップＳ２０２において、学習モデル（特徴量圧縮用学習モデル、特徴量復元用学習モデル）を取得する。

　　（ステップＳ２０３）
　次に、データ圧縮装置２００は、ステップＳ２０３において、入力データ（圧縮対象データ）に対して、特徴量圧縮用学習モデルを適用した圧縮処理を実行して特徴量圧縮データを生成する。

　この処理は、図８に示すデータ圧縮装置２００の学習モデル適用特徴量圧縮部２０１が実行する処理である。

　　（ステップＳ２０４）
　次に、データ圧縮装置２００は、ステップＳ２０４において、ステップＳ２０３で生成した特徴量圧縮データに対して、特徴量復元用学習モデルを適用した復元処理を実行して特徴量復元データを生成する。

　この処理は、図８に示すデータ圧縮装置２００の学習モデル適用特徴量復元部２０２が実行する処理である。

　　（ステップＳ２０５）
　次に、データ圧縮装置２００は、ステップＳ２０５において、入力データ（圧縮対象データ）と、ステップＳ２０４で生成した特徴量復元データとの差分（残差）を算出する。

　この処理は、図８に示すデータ圧縮装置２００の差分算出部２０３が実行する処理である。

　　（ステップＳ２０６）
　次に、データ圧縮装置２００は、ステップＳ２０６において、ステップＳ２０５で算出した残差データの分割ビット数を決定する。

　この処理は、図８に示すデータ圧縮装置２００の残差データブロック分割部２０４が実行する処理である。

　残差データブロック分割部２０４は、ステップＳ２０５で算出した残差データの分割ビット数を決定する。具体的には、先に図９を参照して説明したように、上位ビットから８ビットずつのブロック等、予め規定された分割ビット数を用いる。
　あるいは、残差データの圧縮データを最小化するための最適な分割ビット数を算出して決定してもよい。この分割ビット数最適化処理については、後段の（実施例３）において説明する。

　　（ステップＳ２０７）
　次に、データ圧縮装置２００は、ステップＳ２０７において、ステップＳ２０６で決定した残差データの分割ビット数に応じて、残差データを分割し、複数の残差分割ブロックを生成する。

　この処理は、図８に示すデータ圧縮装置２００の残差データブロック分割部２０４が実行する処理である。
　具体的には、例えば先に図９を参照して説明したように、上位ビットから８ビットずつの複数の残差分割ブロックを生成する。

　　（ステップＳ２０８）
　次に、データ圧縮装置２００は、ステップＳ２０８において、ステップＳ２０７で生成した複数の残差分割ブロック単位で圧縮処理を実行して、複数の残差分割ブロック圧縮データを生成する。

　この処理は、図８に示すデータ圧縮装置２００の残差分割ブロック単位エンコーダ２０５が実行する処理である。

　残差分割ブロック単位エンコーダ２０５は、例えば先に図１０を参照して説明したように、残差データブロック分割部２０４が生成した複数の残差分割ブロック単位で圧縮処理を実行して、複数の残差分割ブロック圧縮データを生成する。

　　（ステップＳ２０９）
　最後に、データ圧縮装置２００は、ステップＳ２０９において、ステップＳ２０３で学習モデル適用特徴量圧縮部２０１が生成した特徴量圧縮データと、ステップＳ２０８で残差分割ブロック単位エンコーダ２０５が生成した複数の残差分割ブロック圧縮データを組み合わせて、出力用圧縮データを生成する。

　この処理は、図８に示すデータ圧縮装置２００の出力用圧縮データ生成部２０６が実行する処理である。

　先に説明したように、図８に示すデータ圧縮装置２００の出力用圧縮データ生成部２０６が生成する出力用圧縮データ２２７は、学習モデルを適用して圧縮処理された特徴量圧縮データ２２２と、特徴量圧縮データ２２２に含まれない残差データ２２４の圧縮データである残差分割ブロック圧縮データ２２６を含む圧縮データである。
　この出力用圧縮データ２２７を用いた復元処理（伸長処理）により、圧縮前の入力データ２２１と同一のデータを再現することが可能となる。すなわち可逆圧縮処理が実現される。

　　［４－２．（実施例２）圧縮効率を高める残差データ、すなわち、より小さなデータ量の残差圧縮データを生成可能とするための残差データを生成する学習モデルを生成する実施例について］
　次に、（実施例２）として、圧縮効率を高める残差データ、すなわち、より小さなデータ量の残差圧縮データを生成可能とするための残差データを生成する学習モデルを生成する実施例について説明する。

　なお、本実施例２に従って生成された学習モデルは、実施例１で説明した図８に示すデータ圧縮装置２００において利用可能である。また、図１１を参照して説明した処理フローに従ったデータ圧縮処理において利用可能である。
　すなわち、以下において説明する実施例２に従って生成される学習モデルは、図８に示すデータ圧縮装置２００の学習モデル適用特徴量圧縮部２０１と、学習モデル適用特徴量復元部２０２において利用される学習モデルである。

　図８に示すデータ圧縮装置２００の学習モデル適用特徴量圧縮部２０１は、学習モデル格納部２１０に格納された学習モデルを適用して、入力データ２２１から取得される特徴量の圧縮データ、すなわち特徴量圧縮データ２２２を生成する。

　学習モデル格納部２１０に格納された学習モデルは、様々なサンプルデータに基づいて生成された特徴量圧縮データを生成するための学習モデルであり、圧縮処理に適用するためのパラメータ情報を有する学習モデルである。
　学習モデル適用特徴量圧縮部２０１は、この学習モデルを利用して特徴量圧縮データ２２２を生成する。

　また、学習モデル適用特徴量復元部２０２も、学習モデル格納部２１０に格納された学習モデルを適用して、特徴量圧縮データ２２２の復元処理（伸長処理）を実行し、特徴量復元（伸長）データ２２３を生成する。

　実施例２は、これらの学習モデル適用特徴量圧縮部２０１や、学習モデル適用特徴量復元部２０２が利用する学習モデルの生成処理に関する実施例である。
　学習モデル適用特徴量圧縮部２０１や、学習モデル適用特徴量復元部２０２が利用する学習モデルを工夫することで、圧縮効率を向上させるものである。

　本実施例２について説明する前に、学習モデルの生成、更新処理を行なうための学習方法と、図８に示すデータ圧縮装置２００を利用したデータ圧縮処理において発生する残差データ２２４の圧縮効率との関係について説明する。

　図８に示すデータ圧縮装置２００を利用したデータ圧縮処理において、差分算出部２０３が生成する残差データ２２４は、学習モデル適用特徴量復元部２０２が生成した特徴量復元（伸長）データ２２３と、圧縮処理前の入力データ２２１との差分データである。

　学習モデル適用特徴量圧縮部２０１や、学習モデル適用特徴量復元部２０２が利用する学習モデルのパラメータは、学習モデル適用特徴量復元部２０２が生成した特徴量復元（伸長）データ２２３と、圧縮処理前の入力データ２２１との乖離度合いをどのように評価するかによって決定される。すなわち、学習モデル対応の損失関数をどのように定義するかによって異なるものとなる。

　例えば、先に図７を参照して説明した既存の学習モデルの生成、更新処理では、ステップＳ１５２で損失関数を定義して、ステップＳ１５３で定義した損失関数を用いて学習モデルのパラメータの評価を行っている。
　この既存システムにおけるパラメータ評価処理は、先に図７を参照して説明したように、特徴量から復元したデータと入力データとの乖離の度合いを損失関数により評価している。
　例えば、復元データと入力データとの乖離が少ないほど損失が小さい（評価値が高い）値が算出される損失関数を定義して、この損失関数を用いて学習モデルのパラメータの評価を行っている。

　一般的な学習モデルの生成、更新時に利用される学習モデルのパラメータの評価用の損失関数の代表例として、特徴量からの復元データと入力データとの乖離の度合いをと算出する誤差算出である二乗誤差算出関数が知られている。

　本実施例２では、学習モデル適用特徴量圧縮部２０１や、学習モデル適用特徴量復元部２０２が利用する学習モデルのパラメータの評価用の損失関数として、イプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数と呼ばれる誤差関数を用いる。

　図１２を参照して、一般的な機械学習の学習に用いられる誤差関数である二乗誤差算出関数と、本実施例２において利用する誤差関数であるイプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数について説明する。

　図１２には、以下の２つの誤差関数を示している。
　（１）二乗誤差算出関数
　（２）イプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数
　いずれのグラフも縦軸（ｙ）が損失、横軸（ｘ）が入出力データの差分（乖離度）を示している。

　なお、各グラフの横軸の入出力データの差分（乖離度）は、図８に示すデータ圧縮装置２００の入力データ２２１と、特徴量復元データ２２３との差分、すなわち残差データ２２４に相当する。

　二乗誤差算出関数と、イプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数における損失（ｙ）と、入出力データの差分（乖離度）（ｘ）との関係式は以下の（式１）、（式２）として示すことができる。

　なお、上記（式１），（式２）において、ｉは、残差データの構成要素の識別子である。例えば、圧縮対象データが画像である場合、画像構成画素の画素識別子である、

　学習モデルのパラメータを評価する損失関数として図１２（１）に示す二乗誤差算出関数を用いた場合、入出力差、つまり、残差データの各要素の値が大きくなるほど損失が著しく大きくなる（評価値が著しく下がる）ことがわかる。
　つまり、損失関数として二乗誤差算出関数を用いた場合は、残差の各要素をできるだけ小さくするように学習モデルが生成、更新される。

　一方、学習モデルのパラメータを評価する損失関数として図１２（２）に示すイプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数を用いた場合は、入出力差の絶対値、つまり、残差データの各要素の値が規定値（ε：イプシロン）よりも大きくなった場合に損失が大きくなる（評価値が下がる）ことがわかる。

　つまり、学習モデルのパラメータを評価する損失関数として図１２（２）に示すイプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数を用いた場合は、残差データの各要素の値が規定値（ε：イプシロン）以内に収まるように学習モデルが生成、更新される。

　一例として、規定値（ε：イプシロン）の値を、
　ε＝１１１１１１１１
　　＝２５５
　とした場合について考察する。

　この場合、入出力差の絶対値、つまり、残差データの各要素の値が２５５（＝１１１１１１１１）以下となるように、学習モデルが生成、更新される。

　例えば、先に図９を参照して説明したように、入力データが画像であり、画像の構成画素が３２ビットデータである場合、各要素である各画素の残差データの値が２５５（＝１１１１１１１１）以下となるように、学習モデルが生成、更新される。
　つまり、各画素の残差データの値が０～２５５（＝００００００００～１１１１１１１１）以下、すなわち下位８ビットに値が収まるように学習モデルが生成、更新される。

　各要素の残差データの値が０～２５５（＝００００００００～１１１１１１１１）以下、すなわち、下位８ビットに収まっていれば値の大小は問われないため、前述した二乗誤差算出関数を適用した場合より、値の大小に関する制約が少なくなる。

　前述した実施例１において説明した図８に示すデータ圧縮装置２００では、先に図９、図１０を参照して説明したように、残差分割ブロックの全てのビットが０となるブロックを多く作ることで圧縮効率が向上する。

　図９、図１０を参照して説明したように、各要素（各画素）が３２ビットデータである場合、各要素（各画素）の残差データを０～２５５（＝００００００００～１１１１１１１１）の範囲、すなわち下位８ビットで表現可能な値に収束させることができれば、図９、図１０に示す残差分割ブロック２２５－１～４の上位ビット側の３ブロックの構成ビットは全て０となる。
　このような設定とすることで、残差分割ブロックの圧縮効率を著しく高めることが可能となる。

　すなわち、学習モデルのパラメータを評価する損失関数として図１２（２）に示すイプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数を用い、さらに、規定値（ε：イプシロン）を残差分割ブロックの最下位ビット側のブロックに含まれるビット数で表現可能な値として設定して、学習モデルを生成、更新する。

　このようにして生成、更新した学習モデルを図８に示すデータ圧縮装置２００の学習モデル適用特徴量圧縮部２０１や、学習モデル適用特徴量復元部２０２において利用する学習モデルとして設定することで、残差データの各要素の値が最下位ビット側のブロックに含まれるビット数で収まる設定とすることが可能となる。

　この結果、残差分割ブロックの圧縮効率を著しく高めることが可能となり、図８に示す残差分割ブロックエンコーダ２０５が生成する残差分割ブロック圧縮データのデータ量を削減することが可能となり、最終的な出力用圧縮データ２２７のデータ量の削減が実現される。

　次に、図１３に示すフローチャートを参照して、本実施例２における学習モデルの生成、更新シーケンスについて説明する。
　図１３に示すフローチャートに従って生成、更新された学習モデルは、先に図８を参照して説明した（実施例１）のデータ圧縮装置２００の学習モデル格納部２１０に格納され、学習モデル適用特徴量圧縮部２０１、学習モデル適用特徴量復元部２０２における特徴量データ圧縮、特徴量データ復元処理に利用される。

　なお、図１３に示すフローに従った処理は、図８に示すデータ圧縮装置２００、あるいはその他の装置において実行可能である。
　図１３に示すフローチャートの各ステップの処理について、順次、説明する。

　　（ステップＳ２５１）
　まず、ステップＳ２５１において、ひな形としての学習モデルを入力する。
　ひな形となる学習モデルには、特徴量圧縮データを生成するための圧縮処理用学習モデルと、特徴量圧縮データから復元データを生成するための復元処理用学習モデルが含まれる。

　圧縮処理用学習モデルには圧縮処理に適用する様々なパラメータが含まれ、復元処理用学習モデルには復元処理に適用する様々なパラメータが含まれる。
　初期的なひな形の学習モデルのパラメータは、任意の値を設定可能である。

　　（ステップＳ２５２）
　次に、ステップＳ２５２において、ステップＳ２５１で入力した学習モデルの損失関数として用いるイプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数、すなわち、図１２（２）に示すイプシロンーインセンシティブーロス算出関数のパラメータ（ε：イプシロン）を決定する。
　例えば、先に説明したような値、すなわち、
　ε＝２５５＝１１１１１１１１
　このようなパラメータ（ε：イプシロン）を決定する。
　なお、このパラメータ（ε：イプシロン）の値は、任意の値に決定可能である。

　　（ステップＳ２５３）
　次に、ステップＳ２５３において、ステップＳ２５２で決定したパラメータ（ε：イプシロン）を設定した損失関数、すなわち、イプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数を用いて、ステップＳ２５１で入力した現在の学習モデルのパラメータの評価を行う。

　具体的には、入力データから特徴量を抽出し、抽出された特徴量から復元したデータと入力データとの乖離度合いに応じた損失を、先に説明した（式２）で示される関数、すなわち、図１２（２）に示すイプシロンーインセンシティブーロス算出関数を用いて算出し、評価する。

　先に説明したように、イプシロンーインセンシティブーロス算出関数を用いた評価では、復元データと入力データとの乖離が規定値（ε）以下となれば損失＝０（評価値＝ＭＡＸ）と評価される。このような損失関数を用いて学習モデルのパラメータの評価を行う。

　　（ステップＳ２５４～Ｓ２５５）
　次に、ステップＳ２５４において、ステップＳ２５３で算出した評価値に基づいてパラメータの更新量を計算し、ステップＳ２５５において、計算結果に基づくパラメータの更新を行う。
　これらのパラメータの評価と更新処理は、予め規定した回数、繰り返して実行する。

　　（ステップＳ２５６）
　ステップＳ２５６において、ステップＳ２５４～Ｓ２５５のパラメータ評価と更新処理が、予め規定した回数に達したと判定されると、ステップＳ２５７に進む。

　　（ステップＳ２５７）
　最後に、ステップＳ２５７において、ステップＳ２５４～Ｓ２５５のパラメータ評価と更新処理の規定回数文の繰り返し処理によって、最終的に更新されたパラメータを設定した学習モデルを生成して学習モデル格納部（図８の学習モデル格納部２１０）に格納する。

　このようにして生成された学習モデルが、図８に示すデータ圧縮装置２００の学習モデル適用特徴量圧縮部２０１、学習モデル適用特徴量復元部２０２において利用され、特徴量の圧縮、復元処理が行われる。

　この学習モデルは、圧縮対象データと、特徴量復元（伸長）データの各要素（例えば画素）の差を、できるだけ規定値（ε）以下とする学習モデルとなる。
　図８に示すデータ圧縮装置２００の学習モデル適用特徴量圧縮部２０１、学習モデル適用特徴量復元部２０２においてこの学習モデルを適用した処理を行なうことで、図８に示す差分算出２０３の算出する差分データ２２４の各要素の差分（残差）は、ほぼ規定値（ε）以下となる。

　すなわち、残差データの各要素の値が最下位ビット側のブロックに含まれるビット数にほぼ収まる設定とすることが可能となる。
　この結果、残差分割ブロックの圧縮効率を著しく高めることが可能となり、図８に示す残差分割ブロックエンコーダ２０５が生成する残差分割ブロック圧縮データのデータ量を削減することが可能となり、最終的な出力用圧縮データ２２７のデータ量の削減が実現される。

　　［４－３．（実施例３）圧縮効率を高める残差データの最適なブロック分割態様の決定処理、すなわち、より小さなデータ量の残差圧縮データを生成可能とするブロック分割態様を決定する実施例について］
　次に、（実施例３）として圧縮効率を高める残差データの最適なブロック分割態様の決定処理、すなわち、より小さなデータ量の残差圧縮データを生成可能とするブロック分割態様を決定する実施例について説明する。

　なお、本実施例３は、実施例１で説明した図８に示すデータ圧縮装置２００の残差データブロック分割部２０４において、残差データブロックを生成する処理の一例に相当する。
　先に図１１を参照して説明した処理フローにおけるステップＳ２０６～Ｓ２０７の処理の一実施例である。

　本実施例３は、実施例１で説明した図８に示すデータ圧縮装置２００の圧縮効率を向上させるために、図８に示すデータ圧縮装置２００の残差データブロック分割部２０４において、残差の各要素を区切る準最適なビット数を決定する実施例である。

　残差データブロック分割部２０４の処理例として、先に図９を参照して説明した処理例では、入力データ２２１と特徴量復元データ２２３の各要素（画素）が３２ｂｉｔのｉｎｔ型（整数型）のデータであると仮定し、３２ビットのビット列を８ビットの４ブロックに分割する例を説明した。

　しかし、この図９に示すビット分割処理例は、一例であり、様々な分割態様が可能である。
　例えば、１６ビット単位の２ブロックに分割する設定、あるいは上位ビットから１５ビット、次の１０ビット、最後の７ビット等、異なるビット数で分割する設定も可能である。

　残差データの各要素を分割するビット数は、各ブロックが取り得る値の範囲や、ブロック内の全てのビットが０となるブロックの数を決定付ける。従って、分割ビット数は、圧縮効率に影響を与える重要なパラメータである。

　本実施例３は、図８に示すデータ圧縮装置２００の残差データブロック分割部２０４において、残差の各要素を区切る準最適なビット数を決定するデータ圧縮装置の実施例である。
　残差データブロック分割部２０４は、「冗長度」と呼ばれる圧縮率の目安となる値に基づいて、準最適な分割ビット数を決定する。

　なお、本実施例３に従った処理は、先に説明した実施例１に従った図８に示すデータ圧縮装置２００の必須構成ではなく、データ圧縮装置２００の計算リソースに余裕がある場合にオプションとして実行すればよい。

　図１４に示すフローチャートは、図８に示すデータ圧縮装置２００の残差データブロック分割部２０４が本実施例３に従って実行する残差データ２２４の分割ビット数の決定処理シーケンスである。
　以下、図１４に示すフローチャートの各ステップの処理について説明する。

　　（ステップＳ３０１）
　まず、図８に示すデータ圧縮装置２００の残差データブロック分割部２０４は、ステップＳ３０１において、残差データを複数ブロックに区切る「残差データ区切りビット数候補」を、複数、決定する。

　　（ステップＳ３０２）
　次に、残差データブロック分割部２０４は、ステップＳ３０２において、ステップＳ３０１で決定した複数の「残差データ区切りビット数候補」から１つの「残差データ区切りビット数候補」を選択する。

　　（ステップＳ３０３）
　次に、残差データブロック分割部２０４は、ステップＳ３０３において、差分算出部２０３から入力する残差データ２２４に対して、ステップＳ３０２で選択した１つの「残差データ区切りビット数候補」を適用して、残差分割ブロックを生成する。

　　（ステップＳ３０４）
　次に、残差データブロック分割部２０４は、ステップＳ３０４において、ステップＳ３０３で生成した残差分割ブロック各々の冗長度を算出し、算出した冗長度の全ブロックの平均値である平均冗長度を算出する。

　なお、冗長度は以下の（式３）で定義される。
　冗長度：ｒ＝１－（Ｈ／Ｈ＿ｍａｘ）＝１－（エントロピー／最大エントロピー）
　　　・・・（式３）

　なお、上記（式３）に示すエントロピーは、以下の（式４）で定義される。
　エントロピー：Ｈ＝－Σ_ｋｐ_ｉｌｏｇ_２ｐ_ｉ　・・・（式４）

　上記（式４）において、
　ｐ_ｉは、残差分割ブロックに含まれるある数値の出現確率を表す。
　例えば、残差分割ブロック内に１，２，２，４という４つの数値が含まれているとする。
　このとき、数値１，２，４の出現確率は、それぞれ１／４，１／２，１／４である。

　なお、最大エントロピーは、すべての数値の出現確率が等しい、つまり、残差分割ブロック内に１，２，２，４という４つの数値が含まれている場合の例では、１／３と仮定したときのエントロピーの値である。

　残差データブロック分割部２０４は、ステップＳ３０４において、ステップＳ３０３で生成した残差分割ブロックの冗長度を、上記（式３）を用いて算出する。

　なお、残差データブロック分割部２０４は、ステップＳ３０４において、残差分割ブロックの冗長度を複数の残差分割ブロック全てについて算出し、その平均値（平均冗長度）も算出する。
　算出した平均冗長度は、残差データの圧縮しやすさ、すなわち圧縮率をどの程度高めることが可能であるかを推定する評価値とみなすことができる。

　　（ステップＳ３０５）
　次に、残差データブロック分割部２０４は、ステップＳ３０５において、ステップＳ３０１で決定した複数の「残差データ区切りビット数候補」の全ての候補についての冗長度算出処理が完了したか否かを判定する。

　未処理の「残差データ区切りビット数候補」がある場合は、ステップＳ３０２に戻り、未処理の「残差データ区切りビット数候補」についてステップＳ３０２～Ｓ３０４の処理を実行する。

　ステップＳ３０５において、ステップＳ３０１で決定した複数の「残差データ区切りビット数候補」の全ての候補についての冗長度算出処理が完了したと判定した場合は、ステップＳ３０６に進む。

　　（ステップＳ３０６）
　次に、残差データブロック分割部２０４は、ステップＳ３０６において、算出された平均冗長度平均が最も高い「残差データ区切りビット数候補」を、残差分割ブロック生成に適用する最終的な「残差データ区切りビット数」として決定する。

　各ブロックの冗長度の平均値が最も大きくなった場合のビット数は準最適な残差データのブロック分割ビット数とみなすことができる。なお、"準"最適としているのは、辞書式の圧縮方式やエントロピー符号が必ずしも冗長度の通りにデータを圧縮できるとは限らないためである。しかし、多くの場合で、図１３に示すフローに従って決定されたビット数で、残差データの各要素を区切ることで、先に図８を参照して説明した実施例１のデータ圧縮装置２００の圧縮効率を向上させることが期待できる。

　　［５．データ圧縮装置のハードウェア構成例について］
　次に、図１５を参照して、データ圧縮装置のハードウェア構成例について説明する。
　図１５を参照して説明するハードウェアは、先に図８を参照して説明したデータ圧縮装置２００の１つの具体的なハードウェア構成例である。

　ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）３０１は、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）３０２、または記憶部３０８に記憶されているプログラムに従って各種の処理を実行する制御部やデータ処理部として機能する。例えば、上述した実施例において説明したシーケンスに従った処理を実行する。ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）３０３には、ＣＰＵ３０１が実行するプログラムやデータなどが記憶される。これらのＣＰＵ３０１、ＲＯＭ３０２、およびＲＡＭ３０３は、バス３０４により相互に接続されている。

　ＣＰＵ３０１はバス３０４を介して入出力インタフェース３０５に接続され、入出力インタフェース３０５には、各種スイッチ、キーボード、マウス、マイクロホン、センサーなどよりなる入力部３０６、ディスプレイ、スピーカーなどよりなる出力部３０７が接続されている。ＣＰＵ３０１は、入力部３０６から入力される指令に対応して各種の処理を実行し、処理結果を例えば出力部３０７に出力する。

　入出力インタフェース３０５に接続されている記憶部３０８は、例えばハードディスク等からなり、ＣＰＵ３０１が実行するプログラムや各種のデータを記憶する。通信部３０９は、Ｗｉ－Ｆｉ通信、ブルートゥース（登録商標）（ＢＴ）通信、その他インターネットやローカルエリアネットワークなどのネットワークを介したデータ通信の送受信部として機能し、外部の装置と通信する。

　入出力インタフェース３０５に接続されているドライブ３１０は、磁気ディスク、光ディスク、光磁気ディスク、あるいはメモリカード等の半導体メモリなどのリムーバブルメディア３１１を駆動し、データの記録あるいは読み取りを実行する。

　　［６．本開示の構成のまとめ］
　以上、特定の実施例を参照しながら、本開示の実施例について詳解してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本開示の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。

　なお、本明細書において開示した技術は、以下のような構成をとることができる。
　（１）　学習モデルを適用して入力データの特徴量圧縮データを生成する特徴量圧縮部と、
　前記特徴量圧縮データに対する復元処理を実行して特徴量復元データを生成する特徴量復元部と、
　前記入力データと、前記特徴量復元データとの差分データである残差データを算出する差分算出部と、
　前記残差データをブロック分割して、複数の残差分割ブロックを生成する残差データブロック分割部と、
　前記複数の残差分割ブロック各々の圧縮処理を実行し、複数の残差分割ブロック圧縮データを生成する残差分割ブロック単位エンコーダと、
　前記特徴量圧縮部の生成した特徴量圧縮データと、前記残差分割ブロック単位エンコーダの生成した複数の残差分割ブロック圧縮データを合成して出力用圧縮データを生成する出力用圧縮データ生成部を有するデータ圧縮装置。

　（２）　前記特徴量圧縮部は、
　前記入力データに含まれる特徴量を選択して前記特徴量圧縮データを生成する非可逆圧縮処理を実行する（１）に記載のデータ圧縮装置。

　（３）　前記残差分割ブロック単位エンコーダは、
　可逆圧縮処理を実行する（１）または（２）に記載のデータ圧縮装置。

　（４）　前記特徴量復元部は、
　学習モデルを適用して前記特徴量圧縮データに対する復元処理を実行する（１）～（３）いずれかに記載のデータ圧縮装置。

　（５）　前記データ圧縮装置は、
　前記学習モデルを格納した学習モデル格納部を有する（１）～（４）いずれかに記載のデータ圧縮装置。

　（６）　前記特徴量圧縮部は、
　入力データの特徴量の圧縮処理に適用するパラメータを含む学習モデルを適用して、前記特徴量圧縮データを生成する構成である（１）～（５）いずれかに記載のデータ圧縮装置。

　（７）　前記学習モデルに含まれるパラメータは、
　学習モデルの性能評価を行なうための損失関数であるイプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数を用いた評価結果に基づいて生成されたパラメータである（６）に記載のデータ圧縮装置。

　（８）　前記残差データブロック分割部は、
　前記残差データを要素単位でブロック分割を行い、複数の残差分割ブロックを生成する（１）～（７）いずれかに記載のデータ圧縮装置。

　（９）　前記残差データブロック分割部は、
　前記残差データの各要素を構成するビット列について最上位ビットから最下位ビットまで複数のブロックに分割し、複数の残差分割ブロックを生成する（１）～（８）いずれかに記載のデータ圧縮装置。

　（１０）　前記残差データブロック分割部は、
　前記残差データの全要素について、同一区切り位置でビット列を区切り、
　同一区切り位置内の全要素の構成データを１つの残差分割ブロックの構成データとして、複数の残差分割ブロックを生成する（１）～（９）いずれかに記載のデータ圧縮装置。

　（１１）　前記残差データブロック分割部は、
　前記残差分割ブロックを生成するための区切りビット数を決定する処理を実行する（１）～（１０）いずれかに記載のデータ圧縮装置。

　（１２）　前記残差データブロック分割部は、
　同一の残差データに、複数の異なる区切りビット数を適用して生成した残差分割ブロックの冗長度を算出し、
　算出した冗長度に基づいて、最適区切りビット数を決定する（１１）に記載のデータ圧縮装置。

　（１３）　前記冗長度は、圧縮効率が高いほど大きな値を示す冗長度であり、
　前記残差データブロック分割部は、
　算出した冗長度が最大値の区切りビット数を最適区切りビット数として決定する（１２）に記載のデータ圧縮装置。

　（１４）　前記残差分割ブロック単位エンコーダは、
　前記残差データブロック分割部が生成した複数の残差分割ブロック各々に対して個別に可逆圧縮処理を実行して、複数の残差分割ブロック圧縮データを生成する（１）～（１３）いずれかに記載のデータ圧縮装置。

　（１５）　データ圧縮装置において実行するデータ圧縮方法であり、
　特徴量圧縮部が、学習モデルを適用して入力データの特徴量圧縮データを生成する特徴量圧縮処理と、
　特徴量復元部が、前記特徴量圧縮データに対する復元処理を実行して特徴量復元データを生成する特徴量復元処理と、
　差分算出部が、前記入力データと、前記特徴量復元データとの差分データである残差データを算出する差分算出処理と、
　残差データブロック分割部が、前記残差データをブロック分割して、複数の残差分割ブロックを生成する残差データブロック分割処理と、
　残差分割ブロック単位エンコーダが、前記複数の残差分割ブロック各々の圧縮処理を実行し、複数の残差分割ブロック圧縮データを生成する残差分割ブロック単位エンコード処理と、
　出力用圧縮データ生成部が、前記特徴量圧縮部の生成した特徴量圧縮データと、前記残差分割ブロック単位エンコーダの生成した複数の残差分割ブロック圧縮データを合成して出力用圧縮データを生成する出力用圧縮データ生成処理を実行するデータ圧縮方法。

　また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。

　なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。

　以上、説明したように、本開示の一実施例の構成によれば、学習モデルを適用した特徴量圧縮データと残差データ圧縮データを生成する可逆圧縮処理において圧縮効率を向上させた構成、処理が実現される。
　具体的には、例えば、学習モデルを適用して入力データの特徴量圧縮データを生成する特徴量圧縮部と、特徴量圧縮データの復元により特徴量復元データを生成する特徴量復元部と、入力データと特徴量復元データとの差分である残差データを算出する差分算出部と、残差データから複数の残差分割ブロックを生成する残差データブロック分割部と、残差分割ブロックの圧縮処理により、複数の残差分割ブロック圧縮データを生成する残差分割ブロック単位エンコーダと、特徴量圧縮データと残差分割ブロック圧縮データを合成して出力用圧縮データを生成する出力用圧縮データ生成部を有する。
　本構成により、学習モデルを適用した特徴量圧縮データと残差データ圧縮データを生成する可逆圧縮処理において圧縮効率を向上させた構成、処理が実現される。

　　２０　データ圧縮装置
　　２１　特徴量エンコーダ
　　２２　特徴量デコーダ
　　２３　差分算出部
　　２４　残差エンコーダ
　　２５　出力用圧縮データ生成部（ビットストリーム生成部）
　　２６　通信部
　　２７　記憶部
　　５０　データ復元装置
　　５１　通信部
　　５２　データ分離部
　　５３　特徴量デコーダ
　　５４　残差デコーダ
　　５５　合成部
　１００　データ圧縮装置
　１０１　学習モデル適用特徴量圧縮部
　１０２　学習モデル適用特徴量復元部
　１０３　差分算出部
　１０４　残差エンコーダ
　１０５　出力用圧縮データ生成部（ビットストリーム生成部）
　１１０　学習モデル格納部
　１５０　データ復元装置
　１５１　データ分離部
　１５２　学習モデル適用特徴量復元部
　１５３　残差デコーダ
　１５４　合成部
　１６０　学習モデル格納部
　２００　データ圧縮装置
　２０１　学習モデル適用特徴量圧縮部
　２０２　学習モデル適用特徴量復元部
　２０３　差分算出部
　２０４　残差データブロック分割部
　２０５　残差分割ブロック単位エンコーダ
　２０６　出力用圧縮データ生成部（ビットストリーム生成部）
　２１０　学習モデル格納部
　３０１　ＣＰＵ
　３０２　ＲＯＭ
　３０３　ＲＡＭ
　３０４　バス
　３０５　入出力インタフェース
　３０６　入力部
　３０７　出力部
　３０８　記憶部
　３０９　通信部
　３１０　ドライブ
　３１１　リムーバブルメディア

Claims

　学習モデルを適用して入力データの特徴量圧縮データを生成する特徴量圧縮部と、
　前記特徴量圧縮データに対する復元処理を実行して特徴量復元データを生成する特徴量復元部と、
　前記入力データと、前記特徴量復元データとの差分データである残差データを算出する差分算出部と、
　前記残差データをブロック分割して、複数の残差分割ブロックを生成する残差データブロック分割部と、
　前記複数の残差分割ブロック各々の圧縮処理を実行し、複数の残差分割ブロック圧縮データを生成する残差分割ブロック単位エンコーダと、
　前記特徴量圧縮部の生成した特徴量圧縮データと、前記残差分割ブロック単位エンコーダの生成した複数の残差分割ブロック圧縮データを合成して出力用圧縮データを生成する出力用圧縮データ生成部を有するデータ圧縮装置。
　前記特徴量圧縮部は、
　前記入力データに含まれる特徴量を選択して前記特徴量圧縮データを生成する非可逆圧縮処理を実行する請求項１に記載のデータ圧縮装置。
　前記残差分割ブロック単位エンコーダは、
　可逆圧縮処理を実行する請求項１に記載のデータ圧縮装置。
　前記特徴量復元部は、
　学習モデルを適用して前記特徴量圧縮データに対する復元処理を実行する請求項１に記載のデータ圧縮装置。
　前記データ圧縮装置は、
　前記学習モデルを格納した学習モデル格納部を有する請求項１に記載のデータ圧縮装置。
　前記特徴量圧縮部は、
　入力データの特徴量の圧縮処理に適用するパラメータを含む学習モデルを適用して、前記特徴量圧縮データを生成する構成である請求項１に記載のデータ圧縮装置。
　前記学習モデルに含まれるパラメータは、
　学習モデルの性能評価を行なうための損失関数であるイプシロンーインセンシティブーロス（ｅｐｓｉｌｏｎ－ｉｎｓｅｎｓｉｔｉｖｅ　ｌｏｓｓ）算出関数を用いた評価結果に基づいて生成されたパラメータである請求項６に記載のデータ圧縮装置。
　前記残差データブロック分割部は、
　前記残差データを要素単位でブロック分割を行い、複数の残差分割ブロックを生成する請求項１に記載のデータ圧縮装置。
　前記残差データブロック分割部は、
　前記残差データの各要素を構成するビット列について最上位ビットから最下位ビットまで複数のブロックに分割し、複数の残差分割ブロックを生成する請求項１に記載のデータ圧縮装置。
　前記残差データブロック分割部は、
　前記残差データの全要素について、同一区切り位置でビット列を区切り、
　同一区切り位置内の全要素の構成データを１つの残差分割ブロックの構成データとして、複数の残差分割ブロックを生成する請求項１に記載のデータ圧縮装置。
　前記残差データブロック分割部は、
　前記残差分割ブロックを生成するための区切りビット数を決定する処理を実行する請求項１に記載のデータ圧縮装置。
　前記残差データブロック分割部は、
　同一の残差データに、複数の異なる区切りビット数を適用して生成した残差分割ブロックの冗長度を算出し、
　算出した冗長度に基づいて、最適区切りビット数を決定する請求項１１に記載のデータ圧縮装置。
　前記冗長度は、圧縮効率が高いほど大きな値を示す冗長度であり、
　前記残差データブロック分割部は、
　算出した冗長度が最大値の区切りビット数を最適区切りビット数として決定する請求項１２に記載のデータ圧縮装置。
　前記残差分割ブロック単位エンコーダは、
　前記残差データブロック分割部が生成した複数の残差分割ブロック各々に対して個別に可逆圧縮処理を実行して、複数の残差分割ブロック圧縮データを生成する請求項１に記載のデータ圧縮装置。
　データ圧縮装置において実行するデータ圧縮方法であり、
　特徴量圧縮部が、学習モデルを適用して入力データの特徴量圧縮データを生成する特徴量圧縮処理と、
　特徴量復元部が、前記特徴量圧縮データに対する復元処理を実行して特徴量復元データを生成する特徴量復元処理と、
　差分算出部が、前記入力データと、前記特徴量復元データとの差分データである残差データを算出する差分算出処理と、
　残差データブロック分割部が、前記残差データをブロック分割して、複数の残差分割ブロックを生成する残差データブロック分割処理と、
　残差分割ブロック単位エンコーダが、前記複数の残差分割ブロック各々の圧縮処理を実行し、複数の残差分割ブロック圧縮データを生成する残差分割ブロック単位エンコード処理と、
　出力用圧縮データ生成部が、前記特徴量圧縮部の生成した特徴量圧縮データと、前記残差分割ブロック単位エンコーダの生成した複数の残差分割ブロック圧縮データを合成して出力用圧縮データを生成する出力用圧縮データ生成処理を実行するデータ圧縮方法。