WO2024142897A1

WO2024142897A1 - 情報処理装置、及び情報処理方法

Info

Publication number: WO2024142897A1
Application number: PCT/JP2023/044343
Authority: WO
Inventors: 武文名雲; 卓也北村; 義基小野; 敦大和
Original assignee: ソニーセミコンダクタソリューションズ株式会社
Priority date: 2022-12-26
Filing date: 2023-12-12
Publication date: 2024-07-04

Abstract

本開示は、より確実に、機械学習の推論を行うことができるようにする情報処理装置、及び情報処理方法に関する。ニューラルネットワークを用いた推論を行う前にニューラルネットワークを解析して、ニューラルネットワークで処理される特徴量の圧縮と復号を制御するための制御情報を生成する事前解析部と、入力データとニューラルネットワークを用いた推論を行い、入力データから得られる特徴量を処理した処理結果を、演算結果として出力する演算部と、制御情報に基づいて、演算部から入力される特徴量を圧縮して、圧縮した特徴量である圧縮特徴量をメモリに記録する圧縮部と、制御情報に基づいて、メモリに一時的に記録された圧縮特徴量を復号して、復号した特徴量を演算部に出力する復号部とを備える情報処理装置が提供される。本開示は、例えば、機械学習推論器に適用することができる。

Description

情報処理装置、及び情報処理方法

　本開示は、情報処理装置、及び情報処理方法に関し、特に、より確実に、機械学習の推論を行うことができるようにした情報処理装置、及び情報処理方法に関する。

　近年、ニューラルネットワーク(neural network)等の機械学習の研究開発が活発に行われている。機械学習の推論処理を行う機械学習演算器では、入力データとネットワーク情報を取得して推論を行い、その処理結果を演算結果として外部に出力する。この種の機械学習演算器は、演算部とメモリを含んで構成して、演算部で処理される特徴量等のデータをメモリに一時的に記録することで、記録したデータを次の処理等で読み出して演算に用いることができる。

　機械学習演算器においては、演算部で処理するデータのデータサイズが増加する傾向にあり、その結果として、メモリの使用量、及び演算部とメモリとの間のデータ通信量が大きくなっている。これらの対策として、演算部とメモリの間に圧縮部と復号部を設けて、データ量を削減する手法が提案されている。例えば、特許文献１には、ニューラルネットワークの搬送データを圧縮する際に、非圧縮と圧縮のデータを比較して、圧縮の利得があった場合にのみ圧縮を適用する手法が開示されている。

特開2021-111320号公報

　従来の手法であると、圧縮したデータのデータサイズがメモリサイズよりも小さい場合には、演算部で推論処理を行うことができるが、圧縮や復号の方式によっては、推論処理を行うことができないときがあり、機械学習の推論を確実に行うための提案が求められていた。

　特に、特許文献１に開示されている手法は、データの圧縮率が動的に変化する圧縮方式を用いているが、圧縮後のデータサイズを規定できないため、入力データによって推論可能なケースと推論不可能なケースが存在することになる。このように、特許文献１に開示されている手法はでは、入力データによって推論の可否が変わってしまうため、確実に推論処理を行うことができない。

　本開示はこのような状況に鑑みてなされたものであり、より確実に、機械学習の推論を行うことができるようにするものである。

　本開示の一側面の情報処理装置は、ニューラルネットワークを用いた推論を行う前に前記ニューラルネットワークを解析して、前記ニューラルネットワークで処理される特徴量の圧縮と復号を制御するための制御情報を生成する事前解析部と、入力データと前記ニューラルネットワークを用いた推論を行い、前記入力データから得られる前記特徴量を処理した処理結果を、演算結果として出力する演算部と、前記制御情報に基づいて、前記演算部から入力される前記特徴量を圧縮して、圧縮した前記特徴量である圧縮特徴量をメモリに記録する圧縮部と、前記制御情報に基づいて、前記メモリに一時的に記録された前記圧縮特徴量を復号して、復号した前記特徴量を前記演算部に出力する復号部とを備える情報処理装置である。

　本開示の一側面の情報処理方法は、情報処理装置が、ニューラルネットワークを用いた推論を行う前に前記ニューラルネットワークを解析して、前記ニューラルネットワークで処理される特徴量の圧縮と復号を制御するための制御情報を生成し、入力データと前記ニューラルネットワークを用いた推論を行い、前記入力データから得られる前記特徴量を処理した処理結果を、演算結果として出力し、前記制御情報に基づいて、入力される前記特徴量を圧縮して、圧縮した前記特徴量である圧縮特徴量をメモリに記録し、前記制御情報に基づいて、前記メモリに一時的に記録された前記圧縮特徴量を復号して、復号した前記特徴量を出力する情報処理方法である。

　本開示の一側面の情報処理装置、及び情報処理方法においては、ニューラルネットワークを用いた推論を行う前に前記ニューラルネットワークが解析されて、前記ニューラルネットワークで処理される特徴量の圧縮と復号を制御するための制御情報が生成され、入力データと前記ニューラルネットワークを用いた推論が行われ、前記入力データから得られる前記特徴量を処理した処理結果が、演算結果として出力され、前記制御情報に基づいて、入力される前記特徴量が圧縮されて、圧縮した前記特徴量である圧縮特徴量がメモリに記録され、前記制御情報に基づいて、前記メモリに一時的に記録された前記圧縮特徴量が復号されて、復号した前記特徴量が出力される。

　本開示の一側面の情報処理装置は、画像データのサンプルデータに基づいて、前記画像データの圧縮を制御するための制御情報を生成する事前解析部と、前記制御情報に基づいて、入力される前記画像データを圧縮する圧縮部とを備え、前記事前解析部は、前記画像データのサンプルデータの統計値を解析した結果に応じた非線形変換を行うための非線形変換テーブルを選定し、前記画像データのサンプルデータと前記画像データのサンプルデータの予測値との差分である予測残差のサンプルデータに基づいて、サンプルデータの統計値を解析した結果に応じた残差非線形変換を行うための残差非線形変換テーブルを選定し、選定した前記非線形変換テーブルと前記残差非線形変換テーブルの識別情報を前記制御情報に含め、前記圧縮部は、入力される前記画像データに対し予測値を生成して、前記画像データと前記予測値との差分から得られる差分情報をエントロピ符号化することで、前記画像データを圧縮する圧縮方式を用いており、前記非線形変換テーブルに従い、入力される前記画像データに対し、非線形変換を行い、前記残差非線形変換テーブルに従い、非線形変換適用済みの前記画像データと、非線形変換適用済みの前記画像データに対して生成した前記予測値との差分である非線形変換適用済みの予測残差に対し残差非線形変換を行う情報処理装置である。

　本開示の一側面の情報処理装置においては、画像データのサンプルデータに基づいて、前記画像データの圧縮を制御するための制御情報が生成され、前記制御情報に基づいて、入力される前記画像データが圧縮される。また、前記画像データのサンプルデータの統計値を解析した結果に応じた非線形変換を行うための非線形変換テーブルが選定され、前記画像データのサンプルデータと前記画像データのサンプルデータの予測値との差分である予測残差のサンプルデータに基づいて、サンプルデータの統計値を解析した結果に応じた残差非線形変換を行うための残差非線形変換テーブルが選定され、選定された前記非線形変換テーブルと前記残差非線形変換テーブルの識別情報が前記制御情報に含められ、入力される前記画像データに対し予測値を生成して、前記画像データと前記予測値との差分から得られる差分情報をエントロピ符号化することで、前記画像データを圧縮する圧縮方式が用いられており、前記非線形変換テーブルに従い、入力される前記画像データに対し、非線形変換が行われ、前記残差非線形変換テーブルに従い、非線形変換適用済みの前記画像データと、非線形変換適用済みの前記画像データに対して生成した前記予測値との差分である非線形変換適用済みの予測残差に対し残差非線形変換が行われる。

　本開示の一側面の情報処理装置は、入力データとニューラルネットワークを用いた推論を行い、前記入力データから得られる特徴量を処理した処理結果を、演算結果として出力する演算部と、前記演算部から入力される前記特徴量を圧縮して、圧縮した前記特徴量である圧縮特徴量をメモリに記録する圧縮部と、前記メモリに一時的に記録された前記圧縮特徴量を復号して、復号した前記特徴量を前記演算部に出力する復号部とを備え、前記特徴量は、ｘｙ平面の特徴量をｚ方向のチャンネルごとに構成した３次元のデータであり、前記圧縮部は、入力される前記特徴量のデータに対し予測値を生成して、前記特徴量のデータと前記予測値との差分から得られる差分情報をエントロピ符号化することで、前記特徴量を圧縮する圧縮方式を用いており、前記特徴量の圧縮方法として、前記特徴量のデータをｚ方向に対応した第２の方向にまとめる圧縮方法が設定された場合、前記特徴量のデータと同じチャンネルのｘｙ平面に対応した第１の方向の予測により前記予測値を生成し、前記特徴量のデータと前記予測値との差分から得られる前記差分情報を、前記第２の方向にパッキングする情報処理装置である。

　本開示の一側面の情報処理装置においては、入力データとニューラルネットワークを用いた推論が行われ、前記入力データから得られる特徴量を処理した処理結果が、演算結果として出力され、入力される前記特徴量が圧縮されて、圧縮した前記特徴量である圧縮特徴量がメモリに記録され、前記メモリに一時的に記録された前記圧縮特徴量が復号されて、復号した前記特徴量が出力される。また、前記特徴量は、ｘｙ平面の特徴量をｚ方向のチャンネルごとに構成した３次元のデータであり、入力される前記特徴量のデータに対し予測値を生成して、前記特徴量のデータと前記予測値との差分から得られる差分情報をエントロピ符号化することで、前記特徴量を圧縮する圧縮方式が用いられ、前記特徴量の圧縮方法として、前記特徴量のデータをｚ方向に対応した第２の方向にまとめる圧縮方法が設定された場合、前記特徴量のデータと同じチャンネルのｘｙ平面に対応した第１の方向の予測により前記予測値が生成され、前記特徴量のデータと前記予測値との差分から得られる前記差分情報が、前記第２の方向にパッキングされる。

　なお、本開示の一側面の情報処理装置は、独立した装置であってもよいし、１つの装置を構成している内部ブロックであってもよい。

従来の機械学習推論器の構成例を示す図である。レイヤごとの処理に必要なデータ量とメモリサイズとの関係を示す図である。 DNNの特徴量のデータ構成例を示す図である。 DNN処理のデータアクセス方法の例を示す図である。本開示を適用した機械学習推論器の一実施の形態の構成例を示す図である。図５のネットワーク事前解析器の構成例を示す図である。 DNNのネットワーク構成例を示す図である。ウェイトデータのデータサイズの例を示す図である。特徴マップのデータサイズの例を示す図である。特徴量の圧縮率の算出の流れを示すフローチャートである。各レイヤで必要な特徴マップのデータサイズの算出例を示す図である。各レイヤで必要な特徴マップのデータサイズの例を示す図である。各レイヤの最大ターゲットレートの例を示す図である。各レイヤのターゲットレートの例を示す図である。特徴マップごとのターゲットレートの算出例を示す図である。特徴マップごとのターゲットレートの例を示す図である。 DNN処理の例を示す図である。 DNN処理の各処理に適した圧縮方法を示す図である。特徴量の圧縮方法の決定の流れを示すフローチャートである。特徴量の圧縮方法を決定する判定表の例を示す図である。特徴量の圧縮方法を決定する判定表の例を示す図である。特徴量の圧縮方法を決定する判定表の例を示す図である。特徴量の圧縮方法を決定する判定表の例を示す図である。アクセス方法の優先度の例を示す図である。特徴量の圧縮方法を決定する判定表の例を示す図である。最終的な判定表の例を示す図である。符号化制御情報の例を示す図である。図５の圧縮部の構成例を示す図である。空間方向まとめの圧縮方法を用いる場合の特徴量圧縮の例を示す図である。デプス方向まとめの圧縮方法を用いる場合の特徴量圧縮の例を示す図である。図５の復号部の構成例を示す図である。図３１のデータ並び替え部によるデータの並び替え処理の例を示す図である。本開示を適用した機械学習推論器の一実施の形態の他の構成例を示す図である。図３３のネットワーク事前解析器の構成例を示す図である。図３４の制御パラメータ生成部の構成例を示す図である。図３５の非線形変換テーブル選定部の構成例を示す図である。非線形変換のバリエーションの例を示す図である。図３５の予測算出パラメータ算出部の構成例を示す図である。チャンネル間予測を用いる場合の予測値生成とパッキングの例を示す図である。空間方向予測とチャンネル間予測を用いる場合の予測値生成の例を示す図である。予測算出パラメータの例を示す図である。チャンネルごとに異なる参照チャンネルと予測方法の例を示す図である。空間方向予測とチャンネル間予測を用いる場合の予測値生成とパッキングの例を示す図である。図３５の残差非線形変換テーブル選定部の構成例を示す図である。残差非線形変換のバリエーションの例を示す図である。図３５のエントロピ符号化テーブル選定部によるエントロピ符号化テーブルの選定の例を示す図である。符号化制御情報の例を示す図である。図３３の圧縮部の構成例を示す図である。図３３の復号部の構成例を示す図である。 DNNを模式的に表した図である。 DNNの各層の構成を示す図である。活性化関数の例を示す図である。 DNNの実装方法として特徴マップをメモリに一旦格納する例を示す図である。従来のDNN処理の流れを示すフローチャートである。従来のDNN処理を実行するDNNシステムの構成と動作を示す図である。特徴マップを圧縮してメモリに格納する例を示す図である。 DPCMモードによる圧縮の例を示す図である。 DPCMモードにおける入力データと差分データの頻度を示す図である。チャンネルインタリーブを施したデータの並び替えの例を示す図である。ダイレクト圧縮モードによる圧縮の例を示す図である。特徴量データの頻度の偏りが非対称となる場合の第１の例を示す図である。特徴量データの頻度の偏りが非対称となる場合の第２の例を示す図である。特徴量データの頻度の偏りが対称となる場合の第１の例を示す図である。特徴量データの頻度の偏りが対称となる場合の第２の例を示す図である。符号化側に導入される前処理の例を示す図である。復号側に導入される後処理の例を示す図である。ネットワーク事前解析器による圧縮パラメータの決定の例を示す図である。機械学習演算器による推論処理の例を示す図である。機械学習演算器によるDNN処理の流れを示すフローチャートである。 DNN処理を実行するDNNシステムの構成と動作を示す図である。ネットワーク事前解析器による圧縮パラメータ決定処理の流れを示すフローチャートである。特徴量データの最頻値と最小値を示す図である。非対称符号化器の構成例を示す図である。図７３の可変長符号テーブルの例を示す図である。非対称復号器の構成例を示す図である。図７５の可変長符号テーブルの例を示す図である。対称符号化器の構成例を示す図である。図７７の可変長符号テーブルの例を示す図である。対称復号器の構成例を示す図である。図７９の可変長符号テーブルの例を示す図である。圧縮部の構成例を示す図である。復号部の構成例を示す図である。前処理部における非対称用の前処理を示す図である。後処理部における非対称用の後処理を示す図である。前処理部における対称用の前処理を示す図である。後処理部における対称用の後処理を示す図である。リファインメント処理の例を示す図である。圧縮部の他の構成例を示す図である。復号部の他の構成例を示す図である。量子化したデータに非ゼロが含まれる場合の圧縮ストリームの構成例を示す図である。量子化したデータが全てゼロになる場合の圧縮ストリームの構成例を示す図である。コンピュータの構成例を示すブロック図である。

＜従来の構成＞
　図１は、従来の機械学習推論器の構成例を示す図である。

　図１において、機械学習推論器１１は、機械学習の推論を行う演算器である。機械学習推論器１１は、そこに入力されるネットワーク情報と入力データに基づいて、ディープラーニング(deep learning)等の機械学習の推論処理を行い、その結果得られる演算結果を外部に出力する。ニューラルネットワークをディープラーニングに対応させて４層以上に層を深くしたものを、ディープニューラルネットワーク(DNN：deep neural network)という。入力データは、画像データ等のデータである。

　機械学習推論器１１は、演算部２１、圧縮部２２、復号部２３、及びメモリ２４を有する。演算部２１は、ディープラーニング等の機械学習の推論処理を行う場合に、各レイヤの特徴マップ(feature map)等の特徴量を、メモリ２４に一時的に記録する。演算部２１は、メモリ２４に記録された特徴量を、次のレイヤの処理等で読み出して演算に用いることができる。メモリ２４は、SRAM(static random access memory)等で構成されて演算部２１の内部に組み込まれたり、DRAM(dynamic random access memory)等で構成されて演算部２１に外部接続されたりして構成される。

　近年、ディープラーニング等の機械学習の推論処理では、特徴量のデータサイズが大きく、モバイル・エッジ等での処理を想定した場合におけるコスト増加の要因になるケースがある。メモリ２４を、演算部２１の内部に組み込むか、あるいは演算部２１に外部接続するかのいずれであっても、メモリ２４の使用量、及び演算部２１とメモリ２４との間のデータ通信量が問題となる。このような問題を解決するために、機械学習推論器１１では、演算部２１とメモリ２４との間に、圧縮部２２と復号部２３を設けて、データ量を削減している。

　圧縮部２２は、演算部２１から入力される特徴量を圧縮し、圧縮特徴量としてメモリ２４に書き込んで一時的に記録する。復号部２３は、メモリ２４に記録された圧縮特徴量を読み出して復号し、復号した特徴量を演算部２１に出力する。

　ここで、所定の有限のメモリサイズを有するメモリ２４に対し、利用可能なメモリサイズを超えるデータサイズの特徴量が発生するディープニューラルネットワーク(DNN)があった場合を想定する。一般的には、特徴量のデータサイズがメモリサイズを超える場合、推論処理を行うことができない。一方で、機械学習推論器１１では、圧縮部２２と復号部２３を設けているため、圧縮後の特徴量のデータサイズがメモリサイズを下回る場合には、演算部２１での推論処理を行うことができる。

　図２は、レイヤごとの処理に必要なデータ量とメモリサイズとの関係を示す図である。図２では、横軸はDNNのレイヤ、縦軸は各レイヤの処理に必要なデータ量を表す。また、図中の横方向の破線は、メモリ２４のメモリサイズを表す。図２においては、横軸の方向に進むほど、より後段のレイヤであることを表しているが、棒グラフで示すように、後段のレイヤは、前段のレイヤと比べて、処理に必要なデータ量が少なくなる傾向にある。このとき、圧縮部２２による圧縮で用いられる圧縮率を一律に設定してしまうと、メモリサイズを下回るデータ量となる後段のレイヤの処理で不要な圧縮を行ったり、メモリサイズを超えるデータ量となる前段のレイヤの処理で適切な圧縮を適用できなかったりする場合が出てくる。

　上述した特許文献１に開示されている手法のように、非圧縮と圧縮のデータを比較して、圧縮の利得があった場合にのみ圧縮を適用する手法であると、データの圧縮率が動的に変化する圧縮方式となるが、圧縮後のデータサイズを規定できないため、入力データによって推論可能なケースと推論不可能なケースが存在することになる。入力データによって、推論の可否が変化する手法は、実用上不便であって改善する必要がある。

　また、DNNの特徴量が持つデータの性質及び利用方法を考慮して、適切な圧縮方法を選択することで、より適切な特徴量の圧縮を行うことができる。一般に、DNNの特徴量は、図３に示すような３次元のデータとして表現されることが多い。図３において、ｘｙ平面は、特徴量の空間方向の位置を示し、ｚ方向は、特徴量のチャンネル方向を示す。図３において、特徴量fは、ｘｙ平面の特徴量をｚ方向のチャンネルごとに構成した３次元のデータであり、チャンネル#0～#6の各チャンネルに対応した特徴量f10～f16から構成される。

　一般に、DNNの推論処理(以下、DNN処理ともいう)で圧縮の対象となる特徴量は、DNN処理の初期で発生する特徴である場合が多く、この場合、ｘｙ空間方向の相関は高いが、ｚ方向の相関は低い。しかし、ｚ方向は完全に無相関ではなく、一部の特徴量のチャンネル間には緩い相関が存在するケースがある。しかし、特徴量を利用する際に、動的に特徴量間の相関を判断することは、処理コストの観点から困難であり、ｚ方向の相関利用には改善の余地がある。加えて、DNN処理で利用可能なデータアクセス方法として、複数種類の方法が存在している。

　図４は、DNN処理のデータアクセス方法の例を示す図である。例えば、図４のＡに示すような、画像データのように、空間方向にデータをread/writeするdepth wise accessがある。図４のＡにおいては、図中の矢印ｓで示すように、チャンネルを固定して、チャンネル単位で空間方向にデータがアクセスされる。また、図４のＢに示すような、空間的な座標を固定してチャンネル方向にデータをread/writeするpixel wise accessがある。図４のＢにおいては、図中の矢印ｄで示すように、画像データの場合には画素(ピクセル)を固定して、チャンネル方向にデータがアクセスされる。なお、pixel wise accessは、point wise accessとも呼ばれる。

　このように、従来の構成では、演算部２１とメモリ２４との間に、圧縮部２２と復号部２３を設けることで、圧縮したデータのデータサイズがメモリサイズよりも小さい場合には、演算部２１で推論処理を行うことができるが、圧縮や復号の方式によっては、推論処理を行うことができないときがある。また、圧縮部２２による圧縮を適用する際には、DNNの特徴量が持つ空間方向の相関を利用しつつ、DNN処理のデータアクセス方法を考慮した圧縮方法を適切に選択することで、より適切な特徴量の圧縮を行うことができる。そこで、本開示では、従来の構成を改善した構成を提案する。

＜＜本開示の第１の構成＞＞

＜機械学習推論器の構成＞
　図５は、本開示を適用した機械学習推論器の一実施の形態の構成例を示す図である。図５において、機械学習推論器１００は、ネットワーク事前解析器１１０と、機械学習演算器１１１とから構成される。

　ネットワーク事前解析器１１０は、そこに入力されるネットワーク情報を解析し、解析の結果得られる符号化制御情報を、機械学習演算器１１１に出力する。ネットワーク情報は、機械学習の推論で用いられるディープニューラルネットワーク(DNN)等のニューラルネットワークに関する情報である。符号化制御情報は、機械学習で処理される特徴量の圧縮と復号を制御するための制御情報である。

　機械学習演算器１１１は、ディープラーニング等の機械学習の推論を行う演算器である。機械学習演算器１１１は、そこに入力されるネットワーク情報と入力データに基づいて、機械学習の推論処理を行い、その結果得られる演算結果を外部に出力する。入力データは、画像データ等のデータである。

　機械学習演算器１１１は、演算部１２１、圧縮部１２２、復号部１２３、及びメモリ１２４を有する。演算部１２１は、ディープラーニング等の機械学習の推論処理を行い、入力データから得られる特徴量を処理した処理結果を、演算結果として出力する演算ユニットである。演算部１２１は、ディープラーニングの推論処理(DNN処理)を行う場合に、ディープニューラルネットワーク(DNN)で処理される各レイヤの特徴マップ(feature map)等の特徴量を適宜、メモリ１２４に一時的に記録(保持)させる。

　演算部１２１とメモリ１２４との間には、圧縮部１２２と復号部１２３が設けられる。圧縮部１２２と復号部１２３には、ネットワーク事前解析器１１０からの符号化制御情報が入力される。メモリ１２４は、演算部１２１の内部に組み込まれるSRAM等で構成されるか、演算部１２１に外部接続されるDRAM等で構成される。

　圧縮部１２２は、特徴マップ等の特徴量を圧縮する圧縮処理を行う圧縮器である。圧縮部１２２は、ネットワーク事前解析器１１０からの符号化制御情報に基づいて、演算部１２１から入力される特徴量を圧縮する。圧縮部１２２は、圧縮した特徴量である圧縮特徴量を、圧縮ストリームとしてメモリ１２４に書き込む。また、圧縮部１２２は、特徴量を圧縮しない場合、特徴量を、非圧縮ストリームとしてメモリ１２４に書き込む。これにより、メモリ１２４には、圧縮ストリームと非圧縮ストリームのデータが一時的に記録される。

　復号部１２３は、圧縮部１２２により圧縮された圧縮特徴量を特徴量に復号する復号処理を行う復号器である。復号部１２３は、メモリ１２４に一時的に記録された圧縮ストリーム又は非圧縮ストリームのデータを適宜読み出す。復号部１２３は、ネットワーク事前解析器１１０からの符号化制御情報に基づいて、メモリ１２４から読み出した圧縮ストリームを、圧縮特徴量から特徴量に復号する。復号部１２３は、圧縮特徴量から復号した特徴量、又は非圧縮ストリームとして読み出した特徴量を演算部１２１に出力する。

　以上のように、機械学習推論器１００においては、機械学習演算器１１１で機械学習の推論処理が実施される前に、ネットワーク事前解析器１１０が、機械学習で用いられるネットワーク情報の解析を実施して、その解析の結果得られる符号化制御情報を、機械学習演算器１１１に入力する。そして、機械学習演算器１１１においては、演算部１２１により機械学習の推論処理を実施する際に、DNN等のニューラルネットワークで処理される特徴量をメモリ１２４に一時的に記録するが、メモリ１２４に記録される特徴量は、必要に応じて、符号化制御情報に基づき、圧縮部１２２により圧縮され、復号部１２３により復号される。

＜ネットワーク事前解析器の構成＞
　図６は、図５のネットワーク事前解析器１１０の構成例を示す図である。図６において、ネットワーク事前解析器１１０は、検出部１４１、圧縮率算出部１４２、及び圧縮方法決定部１４３を有する。

　検出部１４１は、そこに入力されるネットワーク情報を解析(パース)することで、ニューラルネットワークで処理されるウェイトのデータサイズと、特徴量のデータサイズを検出し、その検出結果を圧縮率算出部１４２に出力する。

　圧縮率算出部１４２は、検出部１４１からの検出結果に基づいて、特徴量の圧縮率を算出して出力する。特徴量の圧縮率の算出に際しては、ウェイトのデータサイズと、特徴量のデータサイズの他に、ニューラルネットワークのネットワーク構成や、メモリ１２４における利用可能なメモリサイズ等の情報を用いることで、最適な圧縮率が算出される。ここで算出する最適な圧縮率は、圧縮部１２２による圧縮処理で、圧縮のターゲットとなるレートとして指定可能であるため、以下、ターゲットレートともいう。特徴量の圧縮率の算出の詳細は、図７乃至図１６を参照して後述する。

　圧縮方法決定部１４３には、ネットワーク情報と、圧縮率算出部１４２からの特徴量の圧縮率が入力される。圧縮方法決定部１４３は、ネットワーク情報と特徴量の圧縮率に基づいて、特徴量の圧縮方法を決定して出力する。特徴量の圧縮方法の決定に際しては、特徴量の圧縮率を用いることで圧縮の有無が決定され、ネットワーク情報を解析することでDNN処理に最適な圧縮方法が決定される。特徴量の圧縮方法の決定の詳細は、図１７乃至図２７を参照して後述する。

　以上のように、ネットワーク事前解析器１１０においては、特徴量#0～#Nの特徴量ごとに、圧縮率算出部１４２により算出される圧縮率(ターゲットレート)と、圧縮方法決定部１４３により決定される圧縮方法とが得られ、符号化制御情報として出力される。

＜特徴量の圧縮率の算出＞
　図６の圧縮率算出部１４２による特徴量の圧縮率の算出例を、図７乃至図１６を参照しながら説明する。

　この例では、機械学習演算器１１１においてメモリ１２４がSRAMで構成され、利用可能なメモリサイズが32キロバイト(KB)である場合を説明する。また、この例では、ネットワーク事前解析器１１０に入力されるネットワーク情報を、図７に示したDNNのネットワーク構成を用いて説明する。図７のネットワーク構成では、特徴量として、特徴マップが処理される。DNNの手法の１つとして、CNN(Convolutional Neural Network)があるが、ここでは、CNNが用いられる場合を例示する。

　図７において、DNNは、pixel wise conv-1, depth wise conv, pixel wise conv-2, add の４つのレイヤを含んで構成される。なお、「conv」は、「convolution」の略である。pixel wise conv-1のウェイトは、weight1であり、depth wise convのウェイトは、weight2であり、pixel wise conv-2のウェイトは、weight3である。feature map1 ～ feature map5は、特徴マップを表す。

　pixel wise conv-1は、そこに入力されるfeature map1に、weight1を用いたレイヤ処理(pixel wise convolution)を行い、その結果得られるfeature map2を出力する。pixel wise conv-1から出力されるfeature map2は、depth wise convとaddに入力される。depth wise convは、そこに入力されるfeature map2に、weight2を用いたレイヤ処理(depth wise convolution)を行い、その結果得られるfeature map3を出力する。depth wise convから出力されるfeature map3は、pixel wise conv-2に入力される。

　pixel wise conv-2は、そこに入力されるfeature map3に、weight3を用いたレイヤ処理(pixel wise convolution)を行い、その結果得られるfeature map4を出力する。pixel wise conv-2から出力されるfeature map4は、addに入力される。addは、そこに入力されるfeature map2とfeature map4を加算する加算処理を行い、その結果得られるfeature map5を出力する。

　また、この例では、検出部１４１によって、図８と図９に示したウェイトと特徴マップのデータサイズが検出された場合を説明する。なお、ウェイトと圧縮前の特徴マップは、それぞれ8 bit/sampleのデータとされる。

　図８は、ウェイトのデータサイズの例を示す図である。図８に示すように、weight1, weight2, weight3のデータサイズは、それぞれのテンソルで表されたカーネルサイズから、128バイト、288バイト、256バイトであり、その合計は、672バイトとなる。

　図９は、特徴マップのデータサイズの例を示す図である。図９に示すように、feature map1, feature map2, feature map3, feature map4, feature map5のデータサイズは、それぞれのテンソルで表されたサイズから、19200バイト、9600バイト、38400バイト、9600バイト、9600バイトとなる。

　図１０のフローチャートは、圧縮率算出部１４２により行われる特徴量の圧縮率の算出の流れを示している。

　まず、圧縮率算出部１４２は、メモリ１２４の利用可能なメモリサイズと、ウェイトのデータサイズから、ワークバッファサイズを算出する(Ｓ１１)。ワークバッファサイズは、メモリ１２４において、特徴量を一時的に記録するために実際に利用可能なメモリサイズであり、例えば、次の式(１)により算出される。

　式(１)において、totalRAMSizeは、メモリ１２４の利用可能なメモリサイズを表し、weightDataSizeは、ウェイトのデータサイズを表す。この例では、totalRAMSizeが32キロバイト、weightDataSizeが672バイトであり、式(１)を適用することで、workBufferSize = 32000 - 672 = 31328バイトが算出される。よって、ワークバッファサイズは、31328バイトとなる。また、ウェイトで利用するメモリサイズを予め確保しておくことができる。

　次に、圧縮率算出部１４２は、各レイヤで必要な特徴マップのデータサイズを求める(Ｓ１２)。ここでは、各レイヤに対する入力と出力の特徴マップのデータサイズ、レイヤ処理時にスキップされている特徴マップのデータサイズを算出する。該当のレイヤへの入出力時の特徴マップのデータサイズ、及び該当のレイヤ処理時にスキップされている特徴マップのデータサイズの合計値が、非圧縮時の特徴マップのデータサイズとなる。

　図１１は、各レイヤで必要な特徴マップのデータサイズの算出例を示す図である。図１１に示すように、pixel wise conv-1は、19200バイトのfeature map1が入力され、9600バイトのfeature map2が出力されるため、特徴マップのデータサイズの合計値は、28800バイトとなる。depth wise convは、9600バイトのfeature map2が入力され、38400バイトのfeature map3が出力されるため、特徴マップのデータサイズの合計値は、48000バイトとなる。

　pixel wise conv-2は、38400バイトのfeature map3が入力され、9600バイトのfeature map4が出力され、9600バイトのfeature map2をスキップするため、特徴マップのデータサイズの合計値は、57600バイトとなる。addは、9600バイトのfeature map2と9600バイトのfeature map4が入力され、9600バイトのfeature map5が出力されるため、特徴マップのデータサイズの合計値は、28800バイトとなる。

　次に、圧縮率算出部１４２は、各レイヤで必要な特徴マップのデータサイズ、及びワークバッファサイズから、各レイヤのターゲットレートを算出する(Ｓ１３)。ここでは、圧縮後のターゲットレートを、特徴マップのデータサイズとワークバッファサイズとの比から算出する。また、ターゲットレートが非圧縮時のレートを超える場合、すなわち、非圧縮時のデータサイズを超える場合には、圧縮の必要がないと判断して、元のデータサイズをアサインする。さらに、ターゲットレートの圧縮率に小数部が含まれる場合、レート制御の演算を簡略化する目的で整数部にアサインしてその整数値を用いる。これにより、各レイヤ処理に必要な圧縮率を定義することができる。

　この例では、各レイヤで必要な特徴マップのデータサイズは、図１２に示すように、pixel wise conv-1が28800バイト、depth wise convが48000バイト、pixel wise conv-2が57600バイト、addが28800バイトであり、次の式(２)を適用することで、図１３に示すような、各レイヤの最大ターゲットレートを求めることができる。

　また、式(２)で求めた最大ターゲットレートに対し、次の式(３)を適用することで、図１４に示すような、各レイヤのターゲットレートを求めることができる。

　なお、式(３)において、int()は、小数部を切り捨てて整数にする関数である。min()は、最小の数値を返す関数であり、各レイヤのターゲットレートが8 bit/sampleを超えることはない。

　この例では、図１２乃至図１４に示したように、レイヤごとのターゲットレート(単位：bit/sample)は、次のように求められる。すなわち、pixel wise conv-1は、必要な特徴マップのデータサイズが28800バイトであるので、最大ターゲットレートは8.702222222となり、ターゲットレートは8となる。depth wise convは、必要な特徴マップのデータサイズが48000バイトであるので、最大ターゲットレートは5.221333333となり、ターゲットレートは5となる。pixel wise conv-2は、必要な特徴マップのデータサイズが57600バイトとなるので、最大ターゲットレートは4.351111111となり、ターゲットレートは4となる。addは、必要な特徴マップのデータサイズが28800バイトであるので、最大ターゲットレートは8.702222222となり、ターゲットレートは8となる。

　次に、圧縮率算出部１４２は、各レイヤのターゲットレートから、特徴量ごとのターゲットレートを算出する(Ｓ１４)。ここでは、上述のステップＳ１３により、各レイヤの処理を実行可能なターゲットレートが算出されたが、特徴マップは複数のレイヤで用いられるため、処理全体を通じて最小のターゲットレートで処理する必要がある。例えば、図７のネットワーク構成に示したように、feature map2は、pixel wise conv-1, depth wise conv, add の３箇所のレイヤで用いられる。このとき、図１４に示したように、それぞれのレイヤに設定されたターゲットレートは、8, 5, 4, 8 bit/sampleであるが、これらの最小値である4を選択することで、特徴マップに対するターゲットレートを算出することができる。

　図１５は、特徴マップごとのターゲットレートの算出例を示す図である。図１５においては、各特徴マップについて、該当のレイヤに入力又は出力しない場合を、「非参照」と記載している。ただし、pixel wise conv-2はfeature map2をスキップするので、feature map2では、これを考慮している。

　feature map1は、pixel wise conv-1で用いられるため、その最小値である8 bit/sampleであるターゲットレートが、特徴量のターゲットレートとなる。feature map2は、pixel wise conv-1, depth wise conv, pixel wise conv-2, add で用いられるため、その最小値である4 bit/sampleが、特徴量のターゲットレートとなる。

　feature map3は、depth wise conv, pixel wise conv-2 で用いられるため、その最小値である4 bit/sampleが、特徴量のターゲットレートとなる。feature map4は、pixel wise conv-2, addで用いられるため、その最小値である4 bit/sampleが、特徴量のターゲットレートとなる。feature map5は、addで用いられるため、その最小値である8 bit/sampleが、特徴量のターゲットレートとなる。

　図１０のステップＳ１４が終了すると処理は終了する。このように、図１０のフローチャートに示した処理が行われることで、図１６に示すように、feature map1 ～ feature map5である特徴マップに対し、8, 4, 4, 4, 8 bit/sampleであるターゲットレートが算出される。

＜特徴量の圧縮方法の決定＞
　図６の圧縮方法決定部１４３による特徴量の圧縮方法の決定例を、図１７乃至図２７を参照しながら説明する。

　演算部１２１により実行されるDNN処理では適用される処理ごとにデータのアクセス方法が異なる。図１７は、MobileNet等で利用されるdepth wise convolutionとpixel wise convolutionの処理概念を示している。MobileNetは、モバイル端末等の限られたリソースでも利用可能な軽量かつ高精度なCNNのアーキテクチャである。なお、pixel wise convolutionは、point wise convolutionとも称される。

　図１７に示すように、RGBの3チャンネルの特徴量が入力される場合に、depth wise convolutionとpixel wise convolutionのどちらの処理も入力された特徴量の全てを参照するものの、参照順序が、空間内のデータを連続して読むか、空間位置を固定してチャンネル方向(デプス方向)を優先として読むかで異なっている。そのため、本開示で適用される圧縮方法についても、各処理のデータのアクセス方法に従った圧縮方法とするのが好適である。

　例えば、DNN処理としてdepth wise convolutionが行われる場合、空間方向に連続したアクセス順となるため、図１８のＡにおいて、ｘｙ方向の平面的な四角ｓ１乃至ｓ４で示すように、空間方向のデータをまとめた圧縮方法(以下、「空間方向まとめの圧縮方法」ともいう)が有効となる。一方で、DNN処理としてpixel wise convolutionが行われる場合、デプス方向のデータアクセス順となるため、図１８のＢにおいて、ｚ方向の立体的な四角ｄ１乃至ｄ４で示すように、デプス方向のデータをまとめた圧縮方法(以下、「デプス方向まとめの圧縮方法」ともいう)が有効となる。

　図１９のフローチャートは、圧縮方法決定部１４３により行われる特徴量の圧縮方法の決定の流れを示している。

　まず、圧縮方法決定部１４３は、圧縮率算出部１４２により算出された特徴マップの圧縮率から、特徴マップに圧縮を行う必要があるかどうかを判定する(Ｓ２１)。ここでは、特徴マップごとに算出された圧縮率が所定値以上となるかどうかにより、特徴マップの圧縮の必要性の有無を判定することができる。

　ステップＳ２１において圧縮を行う必要がないと判定した場合、圧縮方法決定部１４３は、特徴マップの圧縮方法として、非圧縮を選択してその決定結果を出力する(Ｓ２２)。すなわち、ターゲットレートが非圧縮時のレートを超える場合には圧縮の必要性はなく、該当する特徴マップには非圧縮が指定される。非圧縮を指定して不要な圧縮を行わないことで、例えば消費電力を削減することができる。

　一方で、ステップＳ２１において圧縮を行う必要があると判定した場合、圧縮方法決定部１４３は、特徴マップの圧縮方法を選択してその決定結果を出力する(Ｓ２３)。ここでは、各特徴マップを参照するレイヤごとのデータのアクセス方法に従い、圧縮方法として、空間方向まとめ又はデプス方向まとめが指定される。

　ステップＳ２２，Ｓ２３が終了すると、処理は終了する。すなわち、特徴マップごとに、圧縮方法として、非圧縮、空間方向まとめ、又はデプス方向まとめが指定される。

　この例では、図１６に示したように、特徴量の圧縮率の算出によって、feature map1 ～ feature map5である特徴マップに対し、8, 4, 4, 4, 8 bit/sampleであるターゲットレートが算出されており、これらのターゲットレートに従い、圧縮又は非圧縮の選択を行う。ここで、図２０乃至図２３，図２５に示した判定表と図２４に示したテーブルを便宜的に用いながら、各特徴マップに対し、最適な圧縮方法を決定するまでの手順を説明する。

　feature map1とfeature map5は、ターゲットレートが8 bit/sampleであり、非圧縮時のデータサイズを超えるため、圧縮する必要はない。そのため、図２０の判定表に示すように、feature map1とfeature map5の圧縮方法は、「非圧縮」と記載する。

　次に、図２１の判定表に示すように、pixel wise conv-1, depth wise conv, pixel wise conv-2, add の各列に、希望するアクセス方法を記載する。例えば、pixel wise conv-2 の場合、feature map3を入力として読み込む。この場合、直接参照しないfeature map1, 2, 4, 5に対しては斜線を記載し、feature map3に対しては、pixel wise conv-2でアクセス効率が良い「pixel-wise」と記載する。

　各列に対しても同様の判断を適用することで、pixel wise conv-1では、feature map1に対して「pixel-wise」が記載され、feature map2, 3, 4, 5に対して斜線が記載される。depth wise convでは、feature map2に対して「depth-wise」が記載され、feature map1, 3, 4, 5に対して斜線が記載される。特徴マップの各要素を加算するadd の場合、feature map2とfeature map4を入力として読み込むが、「depth-wise」と「pixel-wise」のどちらも容易に対応可能である。そのため、feature map2 ,4に対し、「don't care」と記載し、feature map1, 3, 5に対して斜線が記載される。

　次に、図２２，図２３の判定表により、feature map2, 3の圧縮方法の決定方法を説明する。ここでの圧縮方法の決定に関しては、判定表の列単位に判別を行う。

　まず、１つのレイヤ処理からのみ参照され、優位な圧縮方法を一意に特定可能な特徴マップから決定する。図２２の判定表に示すように、１つのレイヤ処理からのみ参照される特徴マップは、feature map3とfeature map4がある。feature map3は、pixel wise conv-2のみから参照され、デプス方向まとめの圧縮方法が有効となるため、決定した圧縮方法を「デプス方向まとめ」と一意に特定することができる。feature map4は、add のみから参照されるが、add のアクセス方法は、「don't care」であるため、feature map4の圧縮方法は未定のままとする。

　次に、２つ以上のレイヤ処理から参照される特徴マップに対し、圧縮方法を決定する。図２３の判定表に示すように、feature map2は、depth wise convとaddの２つのレイヤ処理から参照される。それぞれ最適なアクセス方法は、「depth-wise」と「don't care」であるため、図２４のアクセス方法の優先度に従って、より優先度の高い「depth-wise」を選択する。図２４のテーブルにおいては、優先度を表す数値によって、「depth-wise」と「pixel-wise」が、「don't care」よりも優先度が高いことが管理されている。

　そして、図２３の判定表に示すように、feature map2におけるaddの「don't care」を、「depth-wise」に上書きし、決定した圧縮方法に「空間方向まとめ」と記載する。なお、この例では存在しないが、「depth-wise」と「pixel-wise」のように、アクセス方法の優先度が同じ場合も想定され、その場合には、例えば、ネットワーク全体の処理順序や演算器の特性などから、適宜最適なアクセス方法が選択されることが望ましい。

　最後に、図２５の判定表により、feature map4のように、アクセスするレイヤ処理が１つしかないが、「don't care」などのようにアクセス方法が一意に定まらない場合を説明する。

　ここで、図２５の判定表において、addの列を確認すると、図２３の判定表に示した直前の手順により、feature map2におけるaddの「don't care」が「depth-wise」に置き換わったことを確認することができる。このように、同じ列に「don't care」以外の設定がされていた場合、feature map2におけるaddの「depth-wise」を参照して、feature map4におけるaddの「don't care」を「depth-wise」に上書きし、決定した圧縮方法に「空間方向まとめ」と記載する。

　なお、ここでも、「depth-wise」と「pixel-wise」のように、アクセス方法の優先度が同じ場合や、「don't care」しか存在しない場合も想定されるが、その場合には、例えば、ネットワーク全体の処理順序や演算器の特性などから、適宜最適なアクセス方法が選択されることが望ましい。

　以上をまとめると、最終的に作成される判定表は、図２６の判定表のようになる。すなわち、図２６の判定表に示すように、feature map1, 5は非圧縮、feature map2は空間方向まとめの圧縮方法、feature map3はデプス方向まとめの圧縮方法、feature map4は空間方向まとめの圧縮方法となる。

　ネットワーク事前解析器１１０においては、圧縮率算出部１４２により算出された圧縮率(ターゲットレート)と、圧縮方法決定部１４３により決定された圧縮方法とが、特徴マップ等の特徴量ごとに得られるので、それらを集約して符号化制御情報として出力する。図２７は、符号化制御情報の例を示す図である。図２７の符号化制御情報では、図１６のターゲットレートと、図２６の圧縮方法を集約して、feature map1 ～ feature map5である特徴マップごとに、ターゲットレートと圧縮方法が対応付けられる。

　より具体的には、feature map1は、ターゲットレートが8 bit/sampleで、圧縮方法が「非圧縮」となる。また、feature map2は、ターゲットレートが4 bit/sampleで、圧縮方法が「空間方向まとめ」となり、feature map3は、ターゲットレートが4 bit/sampleで、圧縮方法が「デプス方向まとめ」となる。また、feature map4は、ターゲットレートが4 bit/sampleで、圧縮方法が「空間方向まとめ」となり、feature map5は、ターゲットレートが8 bit/sampleで、圧縮方法が「非圧縮」となる。

＜圧縮部の構成＞
　図２８は、図５の圧縮部１２２の構成例を示す図である。

　圧縮部１２２は、ネットワーク事前解析器１１０からの符号化制御情報に基づいて、演算部１２１から入力された特徴量を圧縮した圧縮特徴量を生成して圧縮ストリームとして出力するか、圧縮していない特徴量を非圧縮ストリームとして出力する。圧縮ストリーム又は非圧縮ストリームを含む特徴量ごとのストリームは、圧縮部１２２からメモリ１２４に出力され、そのデータが一時的に記録される。

　図２８において、圧縮部１２２は、データ取り出し部１６１、スイッチ１６２、加算部１６３、量子化部１６４、エントロピ符号化部１６５、逆量子化部１６６、加算部１６７、ワークバッファ１６８、及び予測値生成部１６９を有する。圧縮部１２２に入力される符号化制御情報は、特徴量ごとのターゲットレートと圧縮方法を含み、それらの情報(パラメータ)に従って、圧縮部１２２の各部が動的に制御される。

　ターゲットレートは、量子化部１６４と逆量子化部１６６に入力される。圧縮方法は、データ取り出し部１６１と、スイッチ１６２と、予測値生成部１６９に入力される。図２８において、圧縮部１２２には、特徴量#Nのデータと、特徴量#Nの符号化制御情報が入力されている。

　データ取り出し部１６１には、演算部１２１からの特徴量のデータが入力される。データ取り出し部１６１は、そこに入力される圧縮方法に従い、入力された特徴量(3Dテンソル形式の特徴量)を２次元の圧縮単位で読み出し、ブロック化特徴量としてスイッチ１６２に出力する。例えば、データ取り出し部１６１に入力される特徴量は3Dテンソルで表され、空間方向まとめやデプス方向まとめ等の圧縮方法に従って、２次元の圧縮単位で読み出される。

　スイッチ１６２は、そこに入力される圧縮方法に従い、データ取り出し部１６１からのブロック化特徴量の出力先を切り替える。すなわち、スイッチ１６２は、圧縮方法が指定されている場合、下側の端子に接続され、ブロック化特徴量を加算部１６３に出力する。また、スイッチ１６２は、圧縮方法の指定が非圧縮である場合、上側の端子に接続され、ブロック化特徴量を、非圧縮ストリームとしてそのまま外部に出力する。

　加算部１６３には、スイッチ１６２を介してデータ取り出し部１６１からのブロック化特徴量と、予測値生成部１６９からの予測値が入力される。加算部１６３は、ブロック化特徴量と予測値との差分から予測残差を生成し、量子化部１６４に出力する。

　量子化部１６４は、そこに入力されるターゲットレートに従い、加算部１６３からの予測残差を量子化し、量子化予測残差としてエントロピ符号化部１６５及び逆量子化部１６６に出力する。

　エントロピ符号化部１６５は、量子化部１６４からの量子化予測残差に対し、エントロピ符号化を行って圧縮ストリームを生成し、外部に出力する。なお、ここでは、エントロピ符号化を行う場合を例示したが、量子化予測残差を固定長で符号化するなどしてもよい。

　逆量子化部１６６は、そこに入力されるターゲットレートに従い、量子化部１６４からの量子化予測残差に対し、予測残差の逆量子化を行い、その結果得られる逆量子化予測残差を、加算部１６７に出力する。

　加算部１６７には、逆量子化部１６６からの逆量子化予測残差と、予測値生成部１６９からの予測値が入力される。加算部１６７は、逆量子化予測残差と予測値を加算して局所復号データを生成し、ワークバッファ１６８に出力する。ワークバッファ１６８は、加算部１６７からの局所復号データを一時的に記録し、必要に応じて予測値生成部１６９に出力する。

　予測値生成部１６９は、そこに入力される圧縮方法に従い、ワークバッファ１６８からの局所復号データから予測値を生成し、加算部１６３及び加算部１６７に出力する。予測値生成部１６９では、空間方向まとめやデプス方向まとめ等の圧縮方法に従い、予測値の生成方法が適切に切り替えられる。

　ここで、圧縮部１２２において、圧縮方法に従って動的に制御される各部(データ取り出し部１６１、予測値生成部１６９等)の動作の例を説明する。図２９は、空間方向まとめの圧縮方法を用いる場合の特徴量圧縮の例を示す図である。図２９に示すように、圧縮方法として空間方向まとめが指定されている場合、ｘｙ方向の平面的な四角ｓ１乃至ｓ４で示すように、空間方向のデータをまとめて、チャンネル単位で符号化が行われる。

　予測に際しても同様に、チャンネル単位で予測を行い、予測値を生成することができる。例えば、符号化が適用されてローカルデコードバッファに記録されたデータを参照して、予測値生成部１６９が予測を行うケースを想定する。特に、符号化対象の特徴量の空間位置の左側に隣接する隣接位置のデータを参照値とするとき、次の式(４)を用いて、特徴量の予測値を生成することができる。

　なお、式(４)において、x, yは、符号化対象の特徴量のｘｙ平面の空間位置、iは、ｚ方向の符号化対象のチャンネルを表す。P_x,y,iは、符号化対象の特徴量_x,y,iの予測値を表す。f_x,y,iは、既に符号化済みの特徴量_x,y,iの値を表す。

　このように、空間方向まとめの圧縮方法を用いる場合には、同じチャンネル内の空間方向の予測で得られた特徴量の予測値と、現在の特徴量のデータとの差分データを、空間方向にまとめてパッキングして符号化することで、特徴量を圧縮することができる。このようなパッキングを行うことで、復号部１２３では、空間方向にまとめて圧縮した特徴量を復号することになる。

　図３０は、デプス方向まとめの圧縮方法を用いる場合の特徴量圧縮の例を示す図である。図３０に示すように、圧縮方法としてデプス方向まとめの圧縮方法が指定されている場合、特徴量の予測値を同じチャンネルのデータから生成する一方で、差分データのパッキングをデプス方向(チャンネル方向)に行うため、予測値生成時の参照面と、符号化時のデータのパッキング面が異なっている。図３０においては、各チャンネルの特徴量のｘｙ平面の空間位置を、左上の位置を原点としてp(x, y)で表している。

　まず、図３０のＡに示すように、各チャンネルにおけるp(0, 0)の特徴量のデータを符号化する(図中の立体的な四角ｄ１)。ここでは、参照データが存在しないため、PCM(Pulse Code Modulation)や、予め定められた初期値から予測を実施する。次に、図３０のＢに示すように、各チャンネルのp(0, 0)の特徴量のデータを、その右隣のp(1, 0)の予測用に保存する。p(1, 0)の特徴量のデータは、保存したp(0, 0)の特徴量のデータを予測値として用いて差分データを生成する(矢印ｒ１)。

　次に、差分データに対し、エントロピ符号化を適用する。また、図３０のＣに示すように、デプス方向にデータをパッキングして、圧縮データを生成する(立体的な四角ｄ２)。その後は、図３０のＤに示すように、各チャンネルのp(1, 0)の特徴量のデータを保存し、その右隣のp(2, 0)の予測に用いる(矢印ｒ２)。図３０のＡ乃至Ｄに示した一連の処理を繰り返すことで、特徴量の全てのデータを圧縮することができる。

　このように、デプス方向まとめの圧縮方法を用いる場合には、空間方向の予測で得られた特徴量の予測値と、現在の特徴量のデータとの差分データを符号化して、デプス方向にまとめてパッキングすることで、特徴量を圧縮することができる。このようなパッキングを行うことで、復号部１２３では、デプス方向にまとめて圧縮した特徴量を復号することになる。

　以上のように、圧縮部１２２においては、入力される特徴量のデータに対し予測値を生成して、特徴量のデータと予測値との差分から得られる差分情報をエントロピ符号化することで、特徴量を圧縮する圧縮方式を用いている。また、圧縮部１２２においては、符号化制御情報が入力され、量子化部１６４と逆量子化部１６６が、圧縮率(ターゲットレート)に従い、予測残差の量子化と、予測残差を量子化した量子化予測残差の逆量子化を行うことで、指定された圧縮率に特徴量が圧縮されるようにしている。圧縮部１２２においては、データ取り出し部１６１が圧縮方法に従い、入力される特徴量からデータを取り出し、予測値生成部１６９が圧縮方法に従い、予測値を生成することで、DNN処理におけるデータアクセス方法に対応した圧縮単位でデータが処理されるようにしている。

＜復号部の構成＞
　図３１は、図５の復号部１２３の構成例を示す図である。

　復号部１２３は、ネットワーク事前解析器１１０から入力される符号化制御情報に基づいて、メモリ１２４に一時的に記録された特徴量ごとのストリーム(圧縮ストリーム又は非圧縮ストリーム)から特徴量を再構成し、演算部１２１に出力する。なお、再構成された特徴量は、特徴量全体の復号が完了した後に出力しても、部分的に再構成された結果を順次出力してもよい。

　図３１において、復号部１２３は、スイッチ１８１、エントロピ復号部１８２、逆量子化部１８３、加算部１８４、データ並び替え部１８５、ワークバッファ１８６、及び予測値生成部１８７を有する。復号部１２３に入力される符号化制御情報は、特徴量ごとのターゲットレートと圧縮方法を含み、それらの情報(パラメータ)に従って、復号部１２３の各部が動的に制御される。

　ターゲットレートは、逆量子化部１８３に入力される。圧縮方法は、スイッチ１８１と、データ並び替え部１８５と、予測値生成部１８７に入力される。図３１において、復号部１２３には、特徴量#Nのデータと、特徴量#Nの符号化制御情報が入力されている。

　スイッチ１８１には、メモリ１２４に一時的に記録された特徴量のストリームが入力される。スイッチ１８１は、そこに入力される圧縮方法に従い、入力されたストリームの出力先を切り替える。すなわち、スイッチ１８１は、圧縮方法の指定が非圧縮である場合、上側の端子に接続され、入力された非圧縮ストリームをデータ並び替え部１８５に出力する。また、スイッチ１８１は、圧縮方法が指定されている場合、下側の端子に接続され、入力された圧縮ストリームをエントロピ復号部１８２に出力する。

　エントロピ復号部１８２は、スイッチ１８１を介して入力される圧縮ストリームに対し、エントロピ復号を行って量子化予測残差を再構成し、逆量子化部１８３に出力する。

　逆量子化部１８３は、そこに入力されるターゲットレートに従い、エントロピ復号部１８２からの量子化予測残差に対し、予測残差の逆量子化を行い、その結果得られる逆量子化予測残差を加算部１８４に出力する。

　加算部１８４には、逆量子化部１８３からの逆量子化予測残差と、予測値生成部１８７からの予測値が入力される。加算部１８４は、逆量子化予測残差と予測値を加算して局所復号データを生成し、データ並び替え部１８５及びワークバッファ１８６に出力する。

　データ並び替え部１８５には、スイッチ１８１を介して非圧縮ストリームとして入力されるブロック化特徴量、又は加算部１８４から局所復号データとして入力されるブロック化特徴量が入力される。データ並び替え部１８５は、ブロック化特徴量のデータを、元の特徴量形式であるテンソル形式(3Dテンソル形式)に再マッピングを行い、その結果得られる特徴量のデータを出力する。

　ワークバッファ１８６は、加算部１８４からの局所復号データを一時的に記録し、必要に応じて予測値生成部１８７に出力する。予測値生成部１８７は、そこに入力される圧縮方法に従い、ワークバッファ１８６からの局所復号データから予測値を生成し、加算部１８４に出力する。

　図３２は、図３１のデータ並び替え部１８５によるデータの並び替え処理の例を示す図である。図３２に示すように、データ並び替え部１８５に入力されたブロック化特徴量ｂｆのデータは、空間方向まとめの圧縮方法が指定されている場合、空間方向に並べられることで、元の特徴量の形式に再マッピングされる(ｘｙ方向の平面的な四角ｓ１)。また、ブロック化特徴量ｂｆのデータは、デプス方向まとめの圧縮方法が指定されている場合、デプス方向に並べられることで、元の特徴量の形式に再マッピングされる(ｚ方向の立体的な四角ｄ１)。

　以上のように、復号部１２３においては、入力される圧縮特徴量のデータをエントロピ復号して得られる差分情報と加算する予測値を生成して、差分情報と予測値を加算することで、圧縮特徴量を復号する復号方式を用いている。また、復号部１２３においては、符号化制御情報が入力され、逆量子化部１８３が圧縮率(ターゲットレート)に従い、量子化した予測残差の逆量子化を行うことで、指定された圧縮率に圧縮された圧縮特徴量から特徴量に復号されるようにしている。復号部１２３においては、予測値生成部１８７が圧縮方法に従い、予測値を生成し、データ並び替え部１８５が圧縮方法に従い、予測値を差分情報に加算して得られる特徴量を並び替えることで、DNN処理におけるデータアクセス方法に対応した圧縮単位でデータが処理されるようにしている。

　本開示の第１の構成では、ネットワーク事前解析器１１０により事前にニューラルネットワークを解析して生成した符号化制御情報に基づいて、演算部１２１とメモリ１２４の間に設けられた圧縮部１２２と復号部１２３を制御することで、演算部１２１によるニューラルネットワークを用いた推論処理を確実に行うことができる。

　より具体的には、従来では、演算で必要とするワークバッファサイズが、搭載されたメモリサイズを超える場合、演算部による推論処理を行うことができなかった。また、特許文献１に開示されている手法のように、圧縮の利得があった場合にのみ圧縮を適用する手法であると、圧縮後のストリームサイズが入力データ依存となり、入力データによって推論の可否が変化してしまい、確実に推論処理を行うことができない。

　それに対し、本開示の第１の構成では、事前にニューラルネットワークを解析して、利用可能なメモリサイズに適合した特徴量の圧縮率を含む符号化制御情報を生成することで、ニューラルネットワークを用いた推論処理で処理される特徴量を一時的に記録するために必要なワークバッファサイズを、利用可能なメモリサイズ以下に制御することができる。また、本開示の第１の構成では、特徴量の圧縮率を用いた制御を行うため、圧縮後のストリームサイズが入力データ依存となることはなく、推論の可否が変化することもない。

　これにより、従来演算が不可能となっていた、搭載されたメモリ容量が少ない機械学習推論器においても、確実に推論処理を実施することができる。また、DNNのレイヤでは、前段のレイヤから後段のレイヤに向かうほど、処理に必要なデータ量が少なくなる傾向にあるのは先に述べた通りであるが、符号化制御情報に含まれる特徴量の圧縮率を用いた制御を行うことで、後段のレイヤの処理で不要な圧縮を行ったり、前段のレイヤの処理で適切な圧縮を適用できなかったりすることはない。

　また、本開示の第１の構成では、事前にニューラルネットワークを解析して、DNN処理のデータアクセス方法に適合した特徴量の圧縮方法を含む符号化制御情報を生成することで、DNNの特徴量が持つ空間方向の相関を利用しつつ、DNN処理のデータアクセス方法を考慮した圧縮方法を適切に選択して、より適切な特徴量の圧縮を行うことができる。

＜＜本開示の第２の構成＞＞

＜機械学習推論器の構成＞
　図３３は、本開示を適用した機械学習推論器の一実施の形態の他の構成例を示す図である。図３３において、機械学習推論器２００は、ネットワーク事前解析器２１０と、機械学習演算器２１１とから構成される。

　ネットワーク事前解析器２１０は、そこに入力される機械学習のネットワーク情報と、サンプルデータ群を解析し、解析の結果得られる符号化制御情報を、機械学習演算器２１１に出力する。サンプルデータ群は、制御パラメータ生成用のサンプルデータを含む。符号化制御情報には、圧縮率(ターゲットレート)と圧縮方法のほかに、特徴量を効率的に圧縮するための制御パラメータが含まれる。

　機械学習演算器２１１は、そこに入力されるネットワーク情報と入力データに基づいて、ディープラーニング等の機械学習の推論処理を行い、その結果得られる演算結果を外部に出力する。機械学習演算器２１１は、演算部２２１、圧縮部２２２、復号部２２３、及びメモリ２２４を有する。演算部２２１は、演算部１２１(図５)と同様に構成される演算ユニットであり、ディープラーニングの推論処理を行う場合に、DNNの各レイヤの特徴マップ等の特徴量をメモリ２２４に適宜記録させる。メモリ２２４は、メモリ１２４(図５)と同様に、SRAM, DRAM等で構成される。

　演算部２２１とメモリ２２４との間には、圧縮部２２２と復号部２２３が設けられる。圧縮部２２２と復号部２２３には、ネットワーク事前解析器２１０からの符号化制御情報が入力される。

　圧縮部２２２は、特徴マップ等の特徴量を圧縮する圧縮処理を行う圧縮器である。圧縮部２２２は、ネットワーク事前解析器２１０からの符号化制御情報に基づいて、演算部２２１からの特徴量を圧縮し、圧縮特徴量を圧縮ストリームとしてメモリ２２４に書き込む。また、圧縮部２２２は、特徴量を圧縮しない場合、特徴量を非圧縮ストリームとしてメモリ２２４に書き込む。

　復号部２２３は、圧縮部２２２により圧縮された圧縮特徴量を特徴量に復号する復号処理を行う復号器である。復号部２２３は、メモリ２２４に一時的に記録された圧縮ストリーム又は非圧縮ストリームのデータを適宜読み出す。復号部２２３は、ネットワーク事前解析器２１０からの符号化制御情報に基づいて、メモリ２２４から読み出した圧縮ストリームを、圧縮特徴量から特徴量に復号する。復号部２２３は、圧縮特徴量から復号した特徴量、又は非圧縮ストリームとして読み出した特徴量を演算部２２１に出力する。

　以上のように、機械学習推論器２００においては、機械学習演算器２１１で機械学習の推論処理が実施される前に、ネットワーク事前解析器２１０が、ネットワーク情報とサンプルデータ群の解析を実施して、その解析の結果得られる符号化制御情報を、機械学習演算器２１１に入力する。そして、機械学習演算器２１１では、演算部２２１により機械学習の推論処理を実施する際に、DNN等のニューラルネットワークで処理される特徴量をメモリ２２４に一時的に記録するが、メモリ２２４に記録される特徴量は、必要に応じて、符号化制御情報に基づき、圧縮部２２２により圧縮され、復号部２２３により復号される。

＜ネットワーク事前解析器の構成＞
　図３４は、図３３のネットワーク事前解析器２１０の構成例を示す図である。図３４において、ネットワーク事前解析器２１０は、検出部２４１、圧縮率算出部２４２、圧縮方法決定部２４３、特徴量サンプル抽出部２４４、制御パラメータ生成部２４５－０乃至２４５－Ｎ(Ｎ：１以上の整数)を有する。

　検出部２４１は、そこに入力されるネットワーク情報を解析(パース)することで、ニューラルネットワークで処理されるウェイトのデータサイズと、特徴量のデータサイズを検出し、その検出結果を圧縮率算出部２４２に出力する。

　圧縮率算出部２４２は、検出部１４１からの検出結果に基づいて、特徴量の圧縮率(ターゲットレート)を算出して出力する。ここでの特徴量の圧縮率の算出に際しては、例えば、図７乃至図１６を参照して説明した算出方法を用いることができる。ここでは、特徴量#0～#Nの特徴量ごとに圧縮率が算出され、圧縮方法決定部２４３には、特徴量#0～#Nの圧縮率が出力され、制御パラメータ生成部２４５－０乃至２４５－Ｎのそれぞれには、特徴量#0～#Nのうちの対応する番号の特徴量の圧縮率が出力される。

　圧縮方法決定部２４３には、ネットワーク情報と、圧縮率算出部２４２からの特徴量の圧縮率が入力される。圧縮方法決定部２４３は、ネットワーク情報と特徴量の圧縮率に基づいて、特徴量の圧縮方法を決定して出力する。特徴量の圧縮方法の決定に際しては、例えば、図１７乃至図２７を参照して説明した決定方法を用いることができる。ここでは、特徴量#0～#Nの特徴量ごとに圧縮方法が決定され、制御パラメータ生成部２４５－０乃至２４５－Ｎのそれぞれには、特徴量#0～#Nのうちの対応する番号の特徴量の圧縮方法が出力される。

　特徴量サンプル抽出部２４４は、そこに入力されるネットワーク情報とサンプルデータ群に基づいて、DNN等のニューラルネットワークの各レイヤの特徴量のサンプルデータを生成する。入力されるサンプルデータ群の数に規定はないが、特徴量の統計データ等を利用するため、十分なサンプルデータ数を用意するのが望ましい。ここでは、特徴量#0～#Nの特徴量ごとにサンプルデータが生成され、制御パラメータ生成部２４５－０乃至２４５－Ｎのそれぞれには、特徴量#0～#Nのうちの対応する番号の特徴量のサンプルデータが出力される。

　制御パラメータ生成部２４５－０には、圧縮率算出部２４２からの特徴量#0の圧縮率と、圧縮方法決定部２４３からの特徴量#0の圧縮方法と、特徴量サンプル抽出部２４４からの特徴量#0のサンプルデータが入力される。制御パラメータ生成部２４５－０は、特徴量#0の圧縮率、特徴量#0の圧縮方法、及び特徴量#0のサンプルデータに基づいて、特徴量#0に対する制御パラメータとして、特徴量#0の圧縮率と圧縮方法に最適な制御パラメータを生成して出力する。

　制御パラメータ生成部２４５－Ｎは、制御パラメータ生成部２４５－０と同様に、そこに入力される特徴量#Nの圧縮率、特徴量#Nの圧縮方法、及び特徴量#Nのサンプルデータに基づいて、特徴量#Nに対する制御パラメータとして、特徴量#Nの圧縮率と圧縮方法に最適な制御パラメータを生成して出力する。

　なお、説明が繰り返しになるので、制御パラメータ生成部２４５－１乃至２４５－Ｎ－１については図示を省略しているが、制御パラメータ生成部２４５－０乃至２４５－Ｎによって、特徴量#0～#Nの制御パラメータが生成されて出力される。

　以上のように、ネットワーク事前解析器２１０においては、特徴量#0～#Nの特徴量ごとに、圧縮率算出部２４２により算出される圧縮率(ターゲットレート)と、圧縮方法決定部２４３により決定される圧縮方法と、制御パラメータ生成部２４５－０乃至２４５－Ｎにより生成される制御パラメータとが得られ、符号化制御情報として出力される。

　図３５は、図３４の制御パラメータ生成部２４５－Ｎの構成例を示す図である。図３５において、制御パラメータ生成部２４５－Ｎは、非線形変換テーブル選定部３２１、非線形変換部３２２、予測算出パラメータ算出部３２３、簡易予測値生成部３２４、差分部３２５、残差非線形変換テーブル選定部３２６、残差非線形変換部３２７、及びエントロピ符号化テーブル選定部３２８を有する。

　非線形変換テーブル選定部３２１は、そこに入力される特徴量#Nのサンプルデータに基づいて、特徴量サンプルの各チャンネル単位で、最適な非線形変換テーブルを選定し、その識別情報である非線形変換テーブルIDを出力する。非線形変換テーブル選定部３２１の詳細は、図３６、図３７を参照して後述する。

　非線形変換部３２２には、特徴量#Nのサンプルデータと、非線形変換テーブル選定部３２１からの非線形変換テーブルIDが入力される。非線形変換部３２２は、非線形変換テーブルIDにより特定される非線形変換テーブルに従い、特徴量#Nのサンプルデータに対し非線形変換を行い、その結果得られる非線形変換適用済み特徴量#Nサンプルデータを、予測算出パラメータ算出部３２３、簡易予測値生成部３２４、及び差分部３２５に出力する。

　予測算出パラメータ算出部３２３には、圧縮率算出部２４２(図３４)からの特徴量#Nのターゲットレートと、圧縮方法決定部２４３(図３４)からの特徴量#Nの圧縮方法と、非線形変換部３２２からの非線形変換適用済み特徴量#Nサンプルデータが入力される。予測算出パラメータ算出部３２３は、ターゲットレートと圧縮方法に基づいて、非線形変換適用済み特徴量#Nサンプルデータから、予測値算出用の予測算出パラメータを算出して出力する。ここでは、特徴量内の相関の強いチャンネルの算出や、参照時の補正パラメータの算出などが行われる。予測算出パラメータ算出部３２３の詳細は、図３８乃至図４３を参照して後述する。

　簡易予測値生成部３２４には、圧縮率算出部２４２(図３４)からの特徴量#Nのターゲットレートと、圧縮方法決定部２４３(図３４)からの特徴量#Nの圧縮方法と、非線形変換部３２２からの非線形変換適用済み特徴量#Nサンプルデータと、予測算出パラメータ算出部３２３からの予測算出パラメータが入力される。簡易予測値生成部３２４は、ターゲットレート、圧縮方法、及び予測算出パラメータに基づいて、非線形変換適用済み特徴量#Nサンプルデータから予測値を生成し、差分部３２５に出力する。ここでは、正確な予測残差の算出を実施してもよいが、コストに制限がある場合などには、簡易的な近似処理を行っても構わない。

　差分部３２５には、非線形変換部３２２からの非線形変換適用済み特徴量#Nサンプルデータと、簡易予測値生成部３２４からの予測値が入力される。差分部３２５は、非線形変換適用済み特徴量#Nサンプルデータと予測値との差分から、予測残差#Nのサンプルを算出し、残差非線形変換テーブル選定部３２６及び残差非線形変換部３２７に出力する。

　残差非線形変換テーブル選定部３２６は、差分部３２５からの予測残差#Nサンプルデータに基づいて、予測残差に適用する残差用の予測変換テーブルである残差非線形変換テーブルを選定し、その識別情報である残差非線形変換テーブルIDを出力する。残差非線形変換テーブル選定部３２６の詳細は、図４４、図４５を参照して後述する。

　残差非線形変換部３２７には、差分部３２５からの予測残差#Nサンプルデータと、残差非線形変換テーブル選定部３２６からの残差非線形変換テーブルIDが入力される。残差非線形変換部３２７は、残差非線形変換テーブルIDにより特定される残差非線形変換テーブルに従い、予測残差#Nサンプルデータに対し非線形変換を行い、その結果得られる非線形変換適用済み予測残差サンプルデータを、エントロピ符号化テーブル選定部３２８に出力する。

　エントロピ符号化テーブル選定部３２８は、残差非線形変換部３２７からの非線形変換適用済み予測残差サンプルデータに基づいて、統計値を算出してエントロピ符号化テーブルを選定し、その識別情報であるエントロピ符号化テーブルIDを出力する。ここでは、非線形変換を実施した予測残差に最適なVLC(variable length code)テーブルの番号が出力される。エントロピ符号化テーブル選定部３２８の詳細は、図４６を参照して後述する。

　以上のように、制御パラメータ生成部２４５－Ｎにおいては、特徴量#Nの各チャンネルに対し、非線形変換テーブルID、予測算出パラメータ、残差非線形変換テーブルID、及びエントロピ符号化テーブルIDが生成され、制御パラメータとして出力される。なお、図３５では、制御パラメータ生成部２４５－Ｎの構成を代表して説明したが、制御パラメータ生成部２４５－０乃至２４５－Ｎ－１(図３４)についても同様に構成される。

　図３６は、図３５の非線形変換テーブル選定部３２１の構成例を示す図である。図３６において、非線形変換テーブル選定部３２１は、チャンネル分割部４２１、ヒストグラム算出部４２２－０乃至４２２－３、及び変換テーブルID算出部４２３－０乃至４２３－３を有する。なお、図３６においては、説明を簡略化するため、チャンネル数がM=4である場合を示す。

　チャンネル分割部４２１は、そこに入力される特徴量#Nのサンプルデータ群を、チャンネルごとに分割する。チャンネル分割部４２１は、特徴量#Nのチャンネル#0のサンプルデータ(f10,…,f60)をヒストグラム算出部４２２－０、特徴量#Nのチャンネル#1のサンプルデータ(f11,…,f61)をヒストグラム算出部４２２－１、特徴量#Nのチャンネル#2のサンプルデータ(f12,…,f62)をヒストグラム算出部４２２－２、特徴量#Nのチャンネル#3のサンプルデータ(f13,…,f63)をヒストグラム算出部４２２－３にそれぞれ出力する。

　ヒストグラム算出部４２２－０は、特徴量#Nのチャンネル#0のサンプルデータに基づいて、特徴量#Nのチャンネル#0のヒストグラムを算出し、変換テーブルID算出部４２３－０に出力する。変換テーブルID算出部４２３－０は、ヒストグラム算出部４２２－０からのヒストグラムに基づいて、特徴量#Nのチャンネル#0の非線形変換テーブルIDを算出する。ここでは、特徴量#Nのチャンネル#0のヒストグラムと、非線形変換テーブルの定義に利用したヒストグラムとの間で、ヒストグラムマッチングを行う。このヒストグラムマッチングの中で最尤なヒストグラムを検出し、最尤なヒストグラムから算出された非線形変換テーブルのIDを出力する。

　ヒストグラム算出部４２２－１と変換テーブルID算出部４２３－１、ヒストグラム算出部４２２－２と変換テーブルID算出部４２３－２、及びヒストグラム算出部４２２－３と変換テーブルID算出部４２３－３においては、ヒストグラム算出部４２２－０と変換テーブルID算出部４２３－０と同様に、特徴量#Nの各チャンネルのサンプルデータから算出したヒストグラムに基づいて、各チャンネルの非線形変換テーブルIDが算出される。これにより、特徴量#Nのチャンネル#0～#3の４チャンネル分の非線形変換テーブルIDが出力される。なお、非線形変換テーブルは、予め複数用意されて内部メモリ等に記録され、その中から選定された非線形変換テーブルのIDが出力される。

　図３７は、非線形変換のバリエーションの例を示す図である。図３７においては、特徴量のチャンネルごとのサンプルデータについて、ヒストグラムと非線形変換テーブルの例を示している。

　図３７のＡにおいて、特徴量#Nのチャンネル#0のサンプルデータf10は、通常の画像のような特徴量を有し、特に重要な部分が存在しないため、サンプルデータf10における特徴量の値の頻度は線a0で表される。そのため、サンプルデータf10に対しては、予め用意された非線形変換テーブルの中から、変換前と変換後の関係が、線b0で示すような関係となる非線形変換テーブルを選定する。

　図３７のＢにおいて、特徴量#Nのチャンネル#1のサンプルデータf11は、エッジ成分のみを抜き出した画像のような特徴量を有し、特定の特徴量の値にヒストグラムピークが集中するため、サンプルデータf11における特徴量の値の頻度は線a1で表される。そのため、サンプルデータf11に対しては、特定の特徴量の値を保護するように、変換前と変換後の関係が、線b1で示すような関係となる非線形変換テーブルを選定する。

　図３７のＣにおいて、特徴量#Nのチャンネル#2のサンプルデータf12は、白黒に２値化された画像のような特徴量を有し、特定の複数の特徴量の値にヒストグラムピークが集中するため、サンプルデータf12における特徴量の値の頻度は線a2で表される。そのため、サンプルデータf12に対しては、特定の複数の特徴量の値を保護するように、変換前と変換後の関係が、線b2で示すような関係となる非線形変換テーブルを選定する。

　ここで、非線形変換を適用する対象データである特徴量は、畳み込み演算やアクティベーションにより様々な性質を持つデータとなる。例えば、通常の画像のような特徴量(図３７のＡ)、エッジ成分のみを抜き出した画像のような特徴量(図３７のＢ)、白黒に２値化された画像のような特徴量（図３７のＣ）など様々な性質を有する。通常の画像のように、非線形変換による圧縮を適用することが期待されるが、このような異なる性質のデータに対し、一律に同じ処理を適用することは、深刻な認識性能の劣化を引き起こす可能性がある。そのため、本開示では、事前にネットワーク情報を解析する際に、特徴量のデータ分布特性及びその後の利用方法を解析することで、最適な非線形変換による圧縮を適用することを可能にしている。

　なお、特徴量の非線形変換と逆非線形変換は、圧縮部２２２の非線形変換部２６３(図４８)と、復号部２２３の逆非線形変換部２８６(図４９)でそれぞれ実施されるが、その詳細は後述する。

　図３８は、図３５の予測算出パラメータ算出部３２３の構成例を示す図である。図３８において、予測算出パラメータ算出部３２３は、参照チャンネル算出部４４１、参照パラメータ算出部４４２、及び予測方法決定部４４３を有する。

　参照チャンネル算出部４４１には、予測算出パラメータ算出のターゲットとなるチャンネルのチャンネルIDと、非線形変換部３２２(図３５)からの非線形変換適用済み特徴量#Nサンプルデータが入力される。参照チャンネル算出部４４１は、非線形変換適用済み特徴量#Nサンプルデータに基づいて、チャンネルIDにより指定されたチャンネル(ターゲットチャンネル)に対し、チャンネル間での参照予測を行う場合における参照チャンネルIDを算出して出力する。

　ここでは、探索範囲をチャンネル#0～#M-1とし、予測に用いるチャンネルは正規化相関などを用いて算出することができる。例えば、ターゲットチャンネルに対し、チャンネル#0との正規化相関を全サンプルデータに対して算出してその平均値を求める。そして、これらの演算をチャンネル#0～#M-1の全てに対して実施して、最も正規化相関の平均値の高いチャンネルのIDを、ターゲットチャンネルの参照チャンネルIDとして求めることができる。

　参照パラメータ算出部４４２には、予測算出パラメータ算出のターゲットとなるチャンネルのチャンネルIDと、非線形変換部３２２(図３５)からの非線形変換適用済み特徴量#Nサンプルデータと、参照チャンネル算出部４４１からの参照チャンネルIDが入力される。参照パラメータ算出部４４２は、非線形変換適用済み特徴量#Nサンプルデータ群に基づいて、参照チャンネルIDで指定されたチャンネルから、チャンネルIDで指定されたターゲットチャンネルの予測値を生成するための参照パラメータ(フィッティングパラメータ)を算出して出力する。

　ここでは、例えば、次の式(５)により、特徴量#Nの予測値を算出する場合、参照パラメータとして、Scale, offset₀, offset₁などのパラメータを、最小二乗法などを用いて算出する。

　なお、式(５)において、x, yは、符号化対象の特徴量の空間位置、iは、符号化対象のチャンネル、jは、予測対象のチャンネルを表す。P_x,y,iは、特徴量_x,y,iの予測値を表す。f_x,y,jは、既に符号化済みの特徴量_x,y,jの値を表す。offset₀, offset₁, Scaleは、予測値生成のためのパラメータである。

　予測方法決定部４４３には、予測算出パラメータ算出のターゲットとなるチャンネルのチャンネルIDと、非線形変換部３２２(図３５)からの非線形変換適用済み特徴量#Nサンプルデータ群と、参照チャンネル算出部４４１からの参照チャンネルIDと、参照パラメータ算出部４４２からの参照パラメータが入力される。予測方法決定部４４３は、非線形変換適用済み特徴量#Nサンプルデータに基づいて、チャンネルIDで指定されたターゲットチャンネルの予測値を、参照チャンネルIDと参照パラメータを用いて予測する場合の予測方法を決定して出力する。詳細は後述するが、予測方法には、チャンネル間予測、双方向予測、空間方向予測などがあり、例えば、チャンネル間予測を実施できない場合には、空間方向予測が実施されるようにする。

　以上のように、予測算出パラメータ算出部３２３においては、指定されたターゲットチャンネルに対し、有効な参照チャンネルのIDである参照チャンネルIDと、参照時の補正パラメータとなる参照パラメータと、最終的に決定される予測方法を含む予測算出パラメータが算出される。なお、予測算出パラメータ算出部３２３では、先頭のチャンネル(チャンネル#0)を除いた全てのチャンネルをターゲットチャンネルとして処理が実施され、チャンネル数から１を減算した数のチャンネル分の予測算出パラメータが算出される。

　ここで、図３９を参照しながら、pixel wiseに限定して、圧縮部２２２における予測値生成とパッキングの例を説明する。予測は、既に符号化が完了しているチャンネルのデータを参照して行う。参照チャンネルは、事前にネットワーク事前解析器２１０(参照チャンネル算出部４４１)により算出されている。このとき、参照チャンネルを、１つのチャンネルに限定してもよいし、圧縮部２２２が複数候補のチャンネルから選択してもよい。また、この例では、符号化方向は、矢印ｅの方向、すなわち、手前のチャンネルから奥のチャンネルに向かう方向としている。

　また、異なるチャンネル間の予測は、上記の式(５)を用いて、offsetとScaleの調整を実施して行うことができる。式(５)において、P_x,y,iは特徴量_x,y,iの予測値、f_x,y,jは既に符号化済みの特徴量_x,y,jの値を表している。この調整に用いられるoffset₀, offset₁, Scaleを含む参照パラメータは、事前にネットワーク事前解析器２１０(参照パラメータ算出部４４２)により算出されている。また、事前にネットワーク事前解析器２１０(予測方法決定部４４３)により、チャンネル間予測である予測方法が決定されている。

　図３９においては、符号化方向が矢印ｅの方向となるので、特徴量f10～f13がチャンネル#0～#3の特徴量に対応している場合、例えば、矢印ｒ１で示すように、チャンネル#3が符号化対象のチャンネル、チャンネル#1が予測対象のチャンネルとなり、i=3，j=1として予測値を生成することができる。また、pixel wiseの場合、圧縮方法としてデプス方向まとめが指定されるため、デプス方向にデータをまとめて符号化する(立体的な四角ｄ１)。

　次に、図４０を参照しながら、空間方向とチャンネル方向の双方のデータを参照して、あるチャンネルの予測値を生成する例を説明する。すなわち、この例では、事前にネットワーク事前解析器２１０(予測方法決定部４４３)により、双方向予測である予測方法が決定されている。

　例えば、図４０において、特徴量f10～f13がチャンネル#0～#3の特徴量に対応している場合に、チャンネル#3の特徴量f13における特徴量Xの予測値を生成する場合を想定する。特徴量Xは、矢印ｒ１で示すように、同じチャンネル#3内の隣接位置の特徴量のデータから算出された予測値Cと、矢印ｒ２で示すように、参照チャンネルであるチャンネル#1の特徴量f11における同じ位置の特徴量のデータから算出された予測値Bと、予測値Bを算出した特徴量の位置の隣接位置の特徴量のデータから算出された予測値Aを用いて、予測値を生成することができる。

　予測値A, B, Cは、次の式(６)を用いて、符号化済みの特徴量のデータから算出することができる。また、次の式(６)を用いて算出された予測値A, B, Cの値を、式(７)に示した条件式に適用することで、特徴量Xの予測値を求めることができる。

　なお、式(６)において、x, yは、符号化対象の特徴量の空間位置、iは、符号化対象のチャンネル、jは、予測対象のチャンネルを表す。f_x,y,jは、既に符号化済みの特徴量_x,y,jの値を表す。offset₀, offset₁, Scaleは、予測値生成のためのパラメータである。また、式(７)において、P_x,y,iは、特徴量_x,y,iの予測値を表す。min()は、最小の数値を返す関数であり、max()は、最大の数値を返す関数である。

　このように、予測値の生成に際しては、例えば、図３９に示したように、チャンネル間予測を用いてチャンネル間での参照を行ったり、図４０に示したように、空間方向予測とチャンネル間予測を用いて空間方向の参照とチャンネル間での参照を双方向に行ったりできる。

　図４１は、予測算出パラメータ算出部３２３から出力される予測算出パラメータの例を示す図である。図４１において、予測算出パラメータは、参照チャンネル、参照パラメータ、及び予測方法であるパラメータを含む。参照チャンネルは、参照チャンネルIDにより指定される。参照パラメータは、参照式として用いられる式(５)や式(６)におけるoffset₀, offset₁, Scaleが指定される。予測方法は、空間方向予測、チャンネル間予測、又は双方向予測のいずれかの予測タイプが指定される。

　参照パラメータは、チャンネル単位で指定される。そのため、参照チャンネルや予測方法は、チャンネルごとに異なる。図４２は、チャンネルごとに異なる参照チャンネルと予測方法の例を示す図である。図４２において、特徴量f10～f13がチャンネル#0～#3の特徴量に対応している場合に、例えば、チャンネル#0の予測方法として、空間方向予測が指定されるときを想定する。このとき、チャンネル#0の特徴量f10における特徴量X0の予測値は、矢印ｒ１で示すように、同じチャンネル#0内の隣接位置の特徴量のデータから算出した予測値を用いて生成することができる。

　また、チャンネル#1の予測方法として、双方向予測が指定されるとき、チャンネル#1の特徴量f11における特徴量X1の予測値は、矢印ｒ２で示すように、同じチャンネル#1内の隣接位置の特徴量のデータから算出した予測値と、矢印ｒ３で示すように、チャンネル#0の特徴量f10における同じ位置の特徴量のデータから算出した予測値を用いて生成することができる。チャンネル#2の予測方法として、チャンネル間予測が指定されるとき、チャンネル#2の特徴量f12における特徴量X2の予測値は、矢印ｒ４で示すように、チャンネル#1の特徴量f11における同じ位置の特徴量のデータから算出した予測値を用いて生成することができる。チャンネル#3の予測方法として、双方向予測が指定されるとき、チャンネル#3の特徴量f13における特徴量X3の予測値は、矢印ｒ５で示すように、同じチャンネル#3内の隣接位置の特徴量のデータから算出した予測値と、矢印ｒ６で示すように、チャンネル#1の特徴量f11における同じ位置の特徴量のデータから算出した予測値を用いて生成することができる。

　次に、図４３を参照しながら、空間方向とチャンネル方向の双方のデータを参照する場合における予測値生成とパッキングの例を説明する。図４３においては、各チャンネルの特徴量のｘｙ平面の位置を、左上の位置を原点としてp(x, y)で表している。

　まず、図４３のＡに示すように、各チャンネルにおけるp(0, 0)の特徴量のデータを符号化する。ここでは、参照データが存在しないため、PCMや予め定められた初期値から予測を実施する。また、矢印ｒ１で示すように、各チャンネルのp(0, 0)では、チャンネル間予測を実施する。次に、図４３のＢに示すように、各チャンネルのp(0, 0)の特徴量のデータを、その隣のp(1, 0)の予測用に保存する。p(1, 0)は、同じチャンネル内のp(0, 0)の特徴量のデータと、別のチャンネルで既に符号化済みの同じ位置の特徴量のデータを参照して予測値を生成する(矢印ｒ２,ｒ３)。これにより、p(1, 0)について、特徴量のデータと予測値との差分データを生成する。

　次に、差分データに対し、後述する残差非線形変換及びエントロピ符号化を適用する。また、図４３のＣに示すように、デプス方向(チャンネル方向)にデータをパッキングして、圧縮データを生成する(立体的な四角ｄ２)。その後は、図４３のＤに示すように、各チャンネルのp(1, 0)の特徴量のデータを保存し、その隣のp(2, 0)の予測に用いる。ここでも、空間方向とチャンネル方向の双方向予測が実施される(矢印ｒ４,ｒ５)。図４３のＡ乃至Ｄに示した一連の処理を繰り返すことで、特徴量の全てのデータを圧縮することができる。

　このように、空間方向とチャンネル方向の双方向予測で得られた特徴量の予測値と、現在の特徴量のデータとの差分データを符号化して、デプス方向にまとめてパッキングすることで、特徴量を圧縮することができる。圧縮部２２２によってこのようなパッキングを行うことで、復号部２２３では、デプス方向にまとめて圧縮した特徴量を復号することになる。

　図４４は、図３５の残差非線形変換テーブル選定部３２６の構成例を示す図である。図４４において、残差非線形変換テーブル選定部３２６は、チャンネル分割部４６１、ヒストグラム算出部４６２－０乃至４６２－３、及び変換テーブルID算出部４６３－０乃至４６３－３を有する。なお、図４４においては、説明を簡略化するため、チャンネル数がM=4である場合を示す。

　チャンネル分割部４６１は、そこに入力される予測残差#Nのサンプルデータ群をチャンネルごとに分割する。チャンネル分割部４６１は、予測残差#Nのチャンネル#0のサンプルデータ(p10,…,p60)をヒストグラム算出部４６２－０、予測残差#Nのチャンネル#1のサンプルデータ(p11,…,p61)をヒストグラム算出部４６２－１、予測残差Nのチャンネル#2のサンプルデータ(p12,…,p62)をヒストグラム算出部４６２－２、予測残差#Nのチャンネル#3のサンプルデータ(p13,…,p63)をヒストグラム算出部４６２－３にそれぞれ出力する。

　ヒストグラム算出部４６２－０は、予測残差#Nのチャンネル#0のサンプルデータに基づいて、予測残差#Nのチャンネル#0のヒストグラムを算出し、変換テーブルID算出部４６３－０に出力する。変換テーブルID算出部４６３－０は、ヒストグラム算出部４６２－０からのヒストグラムに基づいて、予測残差#Nのチャンネル#0の残差非線形変換テーブルIDを算出する。ここでは、予測残差#Nのチャンネル#0のヒストグラムと、残差非線形変換テーブルの定義に利用したヒストグラムとの間で、ヒストグラムマッチングを行う。このヒストグラムマッチングの中で最尤なヒストグラムを検出し、最尤なヒストグラムから算出された残差非線形変換テーブルのIDを出力する。

　ヒストグラム算出部４６２－１と変換テーブルID算出部４６３－１、ヒストグラム算出部４６２－２と変換テーブルID算出部４６３－２、及びヒストグラム算出部４６２－３と変換テーブルID算出部４６３－３においては、ヒストグラム算出部４６２－０と変換テーブルID算出部４６３－０と同様に、予測残差#Nの各チャンネルのサンプルデータから算出したヒストグラムに基づいて、各チャンネルの残差非線形変換テーブルIDが算出される。これにより、予測残差#Nのチャンネル#0～#3の４チャンネル分の残差非線形変換テーブルIDが出力される。なお、残差非線形変換テーブルは予め用意されて内部メモリ等に記録され、その中から選定された残差非線形変換テーブルのIDが出力される。

　図４５は、残差非線形変換のバリエーションの例を示す図である。図４５においては、予測残差のチャンネルごとのサンプルデータについて、ヒストグラムと残差非線形変換テーブルの例を示している。

　図４５のＡは、予測残差#Nのチャンネル#0のサンプルデータp10が、図３７のＡと同様に通常の画像のような予測残差を有する場合を示し、サンプルデータp10における予測残差の値の頻度は線c0で表される。そのため、サンプルデータp10に対しては、予め用意された残差非線形変換テーブルの中から、変換前と変換後の関係が、線d0で示すような関係となる残差非線形変換テーブルを選定する。

　図４５のＢにおいては、予測残差#Nのチャンネル#1のサンプルデータp11が、図３７のＢと同様にエッジ成分のみを抜き出した画像のような予測残差を有する場合を示し、サンプルデータp11における予測残差の値の頻度は線c1で表される。そのため、サンプルデータp11に対しては、特定の予測残差の値を保護するように、変換前と変換後の関係が、線d1で示すような関係となる残差非線形変換テーブルを選定する。

　図４５のＣにおいては、予測残差#Nのチャンネル#2のサンプルデータp12が、図３７のＣと同様に白黒に２値化された画像のような予測残差を有する場合を示し、サンプルデータp12における予測残差の値の頻度は線c2で表される。そのため、サンプルデータp12に対しては、特定の複数の予測残差の値を保護するように、変換前と変換後の関係が、線d2で示すような関係となる残差非線形変換テーブルを選定する。

　なお、予測残差の非線形変換と逆非線形変換は、圧縮部２２２の残差非線形変換部２６５(図４８)及び残差逆非線形変換部２６９(図４８)と、復号部２２３の残差逆非線形変換部２８４(図４９)でそれぞれ実施されるが、その詳細は後述する。なお、非線形変換テーブルを用いた変換処理(図３６、図３７等で説明した特徴量の非線形変換と逆非線形変換)と、残差非線形変換テーブルを用いた変換処理(図４４、図４５等で説明した予測残差の非線形変換と逆非線形変換)は、両方の変換処理を行うことは勿論、少なくとも一方の変換処理が行われればよい。

　図４６は、図３５のエントロピ符号化テーブル選定部３２８によるエントロピ符号化テーブルの選定の例を示す図である。図４６においては、Table ID =0,1,2,3により識別される４種類のVLCテーブルを予め用意している。VLCテーブルは、それぞれ0を中心とした分布となっており、それぞれが異なる予測残差に対して最適化されている。エントロピ符号化テーブル選定部３２８は、予測残差のチャンネルごとに、どのエントロピ符号化テーブルを用いるべきかを選定し、その選定結果に応じたTable IDを出力する。

　図４７は、符号化制御情報の例を示す図である。図４７の符号化制御情報では、特徴量のチャンネルごとに、圧縮率(ターゲットレート)と、圧縮方法と、制御パラメータが対応付けられる。制御パラメータは、非線形変換テーブルID、予測算出パラメータ、残差非線形変換テーブルID、及びエントロピ符号化テーブルIDを含む。予測算出パラメータは、参照チャンネルID、参照パラメータ、及び予測方法を含む。図４７においては、feature map2である特徴マップの符号化制御情報として、チャンネル#0～#7のチャンネルIDごとのターゲットレートと、圧縮方法と、制御パラメータが含まれる。ここでは、feature map2である特徴マップの符号化制御情報を例示しているが、feature map1等の他の特徴マップについても同様に、チャンネルごとに、ターゲットレートと、圧縮方法と、制御パラメータが含まれる。

＜圧縮部の構成＞
　図４８は、図３３の圧縮部２２２の構成例を示す図である。

　圧縮部２２２は、ネットワーク事前解析器２１０からの符号化制御情報に基づいて、演算部２２１から入力された特徴量を圧縮した圧縮特徴量を生成して圧縮ストリームとして出力するか、圧縮していない特徴量を非圧縮ストリームとして出力する。圧縮ストリーム又は非圧縮ストリームを含む特徴量ごとのストリームは、圧縮部２２２からメモリ２２４に出力され、そのデータが一時的に記録される。

　図４８において、圧縮部２２２は、データ取り出し部２６１、スイッチ２６２、非線形変換部２６３、加算部２６４、残差非線形変換部２６５、量子化部２６６、エントロピ符号化部２６７、逆量子化部２６８、残差逆非線形変換部２６９、加算部２７０、ワークバッファ２７１、及び予測値生成部２７２を有する。圧縮部２２２に入力される符号化制御情報は、特徴量ごとのターゲットレートと圧縮方法と制御パラメータを含み、それらの情報(パラメータ)に従って、圧縮部２２２の各部が動的に制御される。

　ターゲットレートは、量子化部２６６と逆量子化部２６８に入力される。圧縮方法は、データ取り出し部２６１と、スイッチ２６２と、予測値生成部２７２に入力される。制御パラメータのうち、非線形変換テーブルIDは非線形変換部２６３、残差非線形変換テーブルIDは残差非線形変換部２６５と残差逆非線形変換部２６９、エントロピ符号化テーブルIDはエントロピ符号化部２６７にそれぞれ入力される。また、制御パラメータのうち、予測算出パラメータに含まれる参照チャンネルID、参照パラメータ、及び予測方法は、予測値生成部２７２に入力される。図４８において、圧縮部２２２には、特徴量#Nのデータと、特徴量#Nの符号化制御情報が入力されている。

　データ取り出し部２６１には、演算部２２１からの特徴量のデータが入力される。データ取り出し部２６１は、そこ入力される圧縮方法に従い、入力された特徴量(3Dテンソル形式の特徴量)を２次元の圧縮単位で読み出し、ブロック化特徴量としてスイッチ２６２に出力する。

　スイッチ２６２は、そこに入力される圧縮方法に従い、データ取り出し部２６１からのブロック化特徴量の出力先を切り替える。すなわち、スイッチ２６２は、圧縮方法が指定されている場合、下側の端子に接続され、ブロック化特徴量を非線形変換部２６３に出力する。また、スイッチ２６２は、圧縮方法の指定が非圧縮である場合、上側の端子に接続され、ブロック化特徴量を、非圧縮ストリームとしてそのまま出力する。

　非線形変換部２６３は、そこに入力される非線形変換テーブルIDにより特定される非線形変換テーブルに従い、スイッチ２６２を介してデータ取り出し部２６１から入力されるブロック化特徴量に対し非線形変換を行い、その結果得られる非線形変換適用済みブロック化特徴量を、加算部２６４に出力する。

　加算部２６４には、非線形変換部２６３からの非線形変換適用済みブロック化特徴量と、予測値生成部２７２からの予測値が入力される。加算部２６４は、非線形変換適用済みブロック化特徴量と予測値との差分から予測残差を生成し、残差非線形変換部２６５に出力する。

　残差非線形変換部２６５は、そこに入力される残差非線形変換テーブルIDにより特定される残差非線形変換テーブルに従い、加算部２６４からの予測残差に対し非線形変換を行い、その結果得られる非線形変換適用済み予測残差を量子化部２６６に出力する。

　量子化部２６６は、そこに入力されるターゲットレートに従い、残差非線形変換部２６５からの非線形変換適用済み予測残差を量子化し、量子化予測残差としてエントロピ符号化部２６７及び逆量子化部２６８に出力する。

　エントロピ符号化部２６７は、そこに入力されるエントロピ符号化テーブルIDにより特定されるエントロピ符号化テーブルに従い、量子化部２６６からの量子化予測残差に対し、エントロピ符号化を行って圧縮ストリームを生成し、外部に出力する。

　逆量子化部２６８は、そこに入力されるターゲットレートに従い、量子化部２６６からの量子化予測残差に対し、予測残差の逆量子化を行い、その結果得られる逆量子化予測残差を、残差逆非線形変換部２６９に出力する。

　残差逆非線形変換部２６９は、そこに入力される残差非線形変換テーブルIDにより特定される残差非線形変換テーブルに従い、逆量子化部２６８からの逆量子化予測残差に対し逆非線形変換を行い、その結果得られる逆非線形変換適用済み逆量子化予測残差を加算部２７０に出力する。

　加算部２７０には、残差逆非線形変換部２６９からの逆非線形変換適用済み逆量子化予測残差と、予測値生成部２７２からの予測値が入力される。加算部２７０は、逆非線形変換適用済み逆量子化予測残差と予測値を加算して局所復号データを生成し、ワークバッファ２７１に出力する。ワークバッファ２７１は、加算部２７０からの局所復号データを一時的に記録し、必要に応じて予測値生成部２７２に出力する。

　予測値生成部２７２は、そこに入力される圧縮方法、参照チャンネルID、参照パラメータ、及び予測方法に従い、ワークバッファ２７１からの局所復号データから予測値を生成し、加算部２６４及び加算部２７０に出力する。

　なお、非線形変換テーブル、残差非線形変換テーブル、及びエントロピ符号化テーブルは、予め複数用意されて内部メモリ等に記録されており、非線形変換部２６３、残差非線形変換部２６５、エントロピ符号化部２６７、及び残差逆非線形変換部２６９は、必要に応じてIDに応じたテーブルを読み出して用いることができる。

＜復号部の構成＞
　図４９は、図３３の復号部２２３の構成例を示す図である。

　復号部２２３は、ネットワーク事前解析器２１０から入力される符号化制御情報に基づいて、メモリ２２４に一時的に記録された特徴量ごとのストリーム(圧縮ストリーム又は非圧縮ストリーム)から特徴量を再構成し、演算部２２１に出力する。なお、再構成された特徴量は、特徴量全体の復号が完了した後に出力しても、部分的に再構成された結果を順次出力してもよい。

　図４９において、復号部２２３は、スイッチ２８１、エントロピ復号部２８２、逆量子化部２８３、残差逆非線形変換部２８４、加算部２８５、逆非線形変換部２８６、データ並び替え部２８７、ワークバッファ２８８、及び予測値生成部２８９を有する。復号部２２３に入力される符号化制御情報は、特徴量ごとのターゲットレートと圧縮方法と制御パラメータを含み、それらの情報(パラメータ)に従って、復号部２２３の各部が動的に制御される。

　ターゲットレートは、逆量子化部２８３に入力される。圧縮方法は、スイッチ２８１と、データ並び替え部２８７と、予測値生成部２８９に入力される。制御パラメータのうち、非線形変換テーブルIDは逆非線形変換部２８６、残差非線形変換テーブルIDは残差逆非線形変換部２８４、エントロピ符号化テーブルIDはエントロピ復号部２８２にそれぞれ入力される。また、制御パラメータのうち、予測算出パラメータに含まれる参照チャンネルID、参照パラメータ、及び予測方法は、予測値生成部２８９に入力される。図４９において、復号部２２３には、特徴量#Nのデータと、特徴量#Nの符号化制御情報が入力されている。

　スイッチ２８１には、メモリ２２４に一時的に記録された特徴量のストリームが入力される。スイッチ２８１は、そこに入力される圧縮方法に従い、入力されたストリームの出力先を切り替える。すなわち、スイッチ２８１は、圧縮方法の指定が非圧縮だった場合、上側の端子に接続され、入力された非圧縮ストリームをデータ並び替え部２８７に出力する。また、スイッチ２８１は、圧縮方法が指定されている場合、下側の端子に接続され、入力された圧縮ストリームをエントロピ復号部２８２に出力する。

　エントロピ復号部２８２は、そこに入力されるエントロピ符号化テーブルIDにより特定されるエントロピ符号化テーブルに従い、スイッチ２８１を介して入力される圧縮ストリームに対し、エントロピ復号を行って量子化予測残差を再構成し、逆量子化部２８３に出力する。

　逆量子化部２８３は、そこに入力されるターゲットレートに従い、エントロピ復号部２８２からの量子化予測残差に対し、予測残差の逆量子化を行い、その結果得られる逆量子化予測残差を残差逆非線形変換部２８４に出力する。

　残差逆非線形変換部２８４は、そこに入力される残差非線形変換テーブルIDにより特定される残差非線形変換テーブルに従い、逆量子化部２８３からの逆量子化予測残差に対し逆非線形変換を行い、その結果得られる逆非線形変換適用済み逆量子化予測残差を加算部２８５に出力する。

　加算部２８５には、残差逆非線形変換部２８４からの逆非線形変換適用済み逆量子化予測残差と、予測値生成部２８９からの予測値が入力される。加算部２８５は、逆非線形変換適用済み逆量子化予測残差と予測値を加算して局所復号データを生成し、逆非線形変換部２８６及びワークバッファ２８８に出力する。

　逆非線形変換部２８６は、そこに入力される非線形変換テーブルIDにより特定される非線形変換テーブルに従い、加算部２８５からの局所復号データに対し逆非線形変換を行い、その結果得られる逆非線形変換適用済み局所復号データを、データ並び替え部２８７に出力する。

　データ並び替え部２８７には、スイッチ２８１を介して非圧縮ストリームとして入力されるブロック化特徴量、又は逆非線形変換部２８６から逆非線形変換適用済み局所復号データとして入力されるブロック化特徴量が入力される。データ並び替え部２８７は、ブロック化特徴量のデータを、元の特徴量形式であるテンソル形式(3Dテンソル形式)に再マッピングを行い、その結果得られる特徴量のデータを出力する。

　ワークバッファ２８８は、加算部２８５からの局所復号データを一時的に記録し、必要に応じて予測値生成部２８９に出力する。予測値生成部２８９は、そこに入力される圧縮方法、参照チャンネルID、参照パラメータ、及び予測方法に従い、ワークバッファ２８８からの局所復号データから予測値を生成し、加算部２８５に出力する。

　なお、非線形変換テーブル、残差非線形変換テーブル、及びエントロピ符号化テーブルは、予め複数用意されて内部メモリ等に記録されており、エントロピ復号部２８２、残差逆非線形変換部２８４、及び逆非線形変換部２８６は、必要に応じてIDに応じたテーブルを読み出して用いることができる。

　本開示の第２の構成では、ネットワーク事前解析器２１０が事前にニューラルネットワークを解析して生成する符号化制御情報に、特徴量のチャンネルごとに、圧縮率と、圧縮方法と、制御パラメータを含めることができる。また、制御パラメータには、非線形変換テーブルIDと、残差非線形変換テーブルIDと、エントロピ符号化テーブルIDと、参照チャンネルID、参照パラメータ、及び予測方法を含む予測算出パラメータを含めることができる。

　制御パラメータを用いることで、より効率的に特徴量を圧縮することができる。例えば、非線形変換テーブルIDにより特定される非線形変換テーブルに従った非線形変換や逆非線形変換と、残差非線形変換テーブルIDにより特定される残差非線形変換テーブルに従った非線形変換や逆非線形変換を行うことで、畳み込み演算等により様々な性質を持つデータである特徴量と予測残差に対し、データ分布特性等を用いて特に重要な部分を保護することができる。これにより、圧縮率の向上による認識率の低減を回避することができる。また、予測算出パラメータを用いた予測値の生成を行うことで、事前に予測方法などが限定されることにより符号化演算量を低減することができる。

＜＜本開示の第３の構成＞＞

＜DNNの概要と従来の問題点＞
　図５０は、ディープニューラルネットワーク(DNN)を模式的に表した図である。図５０に示すように、DNNでは、多い場合には100層以上の多層の計算レイヤ(Layer)を繰り返すことにより、演算結果(認識結果)を算出する。この各層(レイヤ)の計算結果を、特徴マップ(feature map)と呼んでいる。

　図５１は、DNNの各層の構成を示す図である。図５１に示すように、DNNの各層は、前層からの特徴マップに対して重み(Weight)データを用いて畳み込みや積和などを施す線形フィルタ処理と、その結果を非線形マッピングして特徴マップを生成する活性化関数処理とから構成される。活性化関数は、各層固有のパラメータ(Parameter)によってその種類や特性が規定される。図５２は、活性化関数の一例として、ReLU(Rectified Linear Unit)関数を示している。

　DNNの実装方法として、図５３に示すように、ある層(n-1層)の処理を行った後にその計算結果である特徴マップをメモリに一旦格納し、そのデータを用いて次の層(n層)に進むという層ごとの演算方法がある。この種の演算方法では、層内は同じ計算の繰り返しからなるので、演算効率が良い。また、層が進む際に、使用済みとなった特徴マップ領域を廃棄して必要な領域を新たに確保することで、メモリ量を削減できる。しかしながら、特徴マップは各層により大きさが異なり、DNNの入力よりも大きくなる場合がある。そのため、層ごとの演算方法では、最大の特徴マップ分の以上の領域をメモリ上に確保する必要がある。

　図５４のフローチャートは、従来のDNN処理の流れを示している。まず、DNNパーサ(DNN Parser)でDNNネットワークを解析する(Ｓ５１)。続いて、入力データをメモリに書き込んで(Ｓ５２)、nの初期値として、1を設定する(Ｓ５３)。そして、nが、N以下であるかとなるかどうかが判定される(Ｓ５４)。n ≦ N となる場合(Ｓ５４：Yes)には、以降の処理が繰り返される。すなわち、メモリからデータを読み出して、Layer(n)のパラメータで、n層の処理を実行し(Ｓ５５)、その演算結果をメモリに書き込み(Ｓ５６)、nの値をインクリメントする(Ｓ５７)。なお、nは処理対象の層を示す変数であり、処理対象の最後の層を示す値がNとなる。

　ステップＳ５４乃至Ｓ５７の処理を繰り返すことで、n ＞ N となった場合(Ｓ５４：No)、出力データとしてメモリからデータを読み出して(Ｓ５８)、一連の処理は終了する。DNN処理では、各層(Layer)の処理ごとに、メモリに格納する特徴マップを上書きするため、メモリ量は単純増加するものではない。なお、DNNネットワークの解析(Ｓ５１)は、予めオフラインで実行しておくことも可能である。

　図５５は、従来のDNN処理を実行するDNNシステムの構成と動作を示す図である。図５５においては、CPU(Central Processing Unit)３１が、DMAC(Direct Memory Access Controller)３２にコマンドを発行し、DRAM(Dynamic Random Access Memory)３３のデータをDNNプロセッサ３４の内部メモリに転送する。

　続いて、CPU３１が、DNNプロセッサ３４を制御することで処理を実行する。ここでは、次の処理を層数分ループで実行する。すなわち、CPU３１が、所望の層のDNNパラメータと内部メモリアドレス情報をROMから読み出してDNNプロセッサ３４にセットする。次に、CPU３１が、startパルスでDNNプロセッサ３４を起動し、DNNプロセッサ３４は、処理終了したとき、finishパルスを返す。これらの処理が層数分ループして実行された後に、CPU３１が、DMAC３２にコマンドを発行し、DNNプロセッサ３４の内部メモリの演算結果を、DRAM３３に転送する。

　メモリ消費量の多い特徴マップに、EBC(Embedded Block Coding)のようなメモリ圧縮技術を施すことで、メモリ量を削減することができる。図５６に示すように、メモリに対して圧縮部(Enc)と復号部(Dec)を設けることで、圧縮された特徴マップ(Compressed Feature Map)を、メモリに格納することが可能となる。この場合の圧縮には、高速性やランダムアクセス性を重視した固定長サイズの非可逆圧縮と、認識性能を重視したロスレス(Lossless)の可逆圧縮がある。非可逆圧縮は、より圧縮歪を少なくして、認識性能の劣化を減らすことが求められる。一方で、可逆圧縮は、圧縮後のサイズをより小さくすることが求められる。

＜本開示の概要＞
　画像信号圧縮では、隣接するデータとの相関が強いため、差分パルス符号変調(DPCM：Differential Pulse-Code Modulation)を用いて隣接するデータとの差分を求めることで、差分データの頻度に偏りをつくって圧縮を行うのが一般的である。DPCMモードによる圧縮の例を、図５７に示している。図５７においては、入力データを量子化(Quantize)した後に、予測(Pred：Prediction)した予測値との差分を求めて、可変長符号化(VLC：Variable Length Coding)とリファインメント(Refinement)を実施することで、ビットストリームが出力される。ここでは、図５８に示すように、頻度(Probability)が一定となる入力データ(図５８のＡ)を、隣接データ(予測値)との差分を取ることで、それにより得られる差分データ(図５８のＢ)では、頻度に偏りが生じている。

　DNNの特徴量データでは、処理の関係上、チャンネルインタリーブが施されるのが一般的である。チャンネルインタリーブが施されている場合、相関のある同一チャンネルのデータを得るためには、並び替えを行う必要があり、そのためのメモリ等のハードウェア(HW)が必要となる。図５９は、チャンネルインタリーブを施したデータの並び替えの例を示す図である。図５９においては、上段のチャンネルインタリーブが施されたデータが、下段ではチャンネルごとに並び替えられている。

　DNNの特徴量データでは、隣接データとの差分を取らずとも、特徴量自身にデータの頻度の偏りがあるため、そのまま可変長符号化等の統計的性質を用いた圧縮が可能となる。以下、この圧縮方法をダイレクト圧縮(Direct Compression)と呼ぶ。図６０は、ダイレクト圧縮モードによる圧縮の例を示す図である。図６０においては、入力データ(特徴量データ)を量子化(Quantize)した後に、そのまま可変長符号化(VLC)とリファインメントを実施することで、ビットストリームを出力している。なお、以下の説明では、入出力される特徴量は、8ビットに量子化したものを用いて説明する。

　DNNの特徴量データにおける頻度の偏りには、少なくとも非対称のものと対称のものがある。非対称のものは、最頻値に対して、正(又は負)にのみ分布があり、最頻値から離れるにしたがって頻度が下がる。特徴量データの頻度の偏りが非対称となる場合の例を、図６１、図６２に示している。図６１は、縦軸を頻度(Probability)、横軸を値(Value)とした場合のヒストグラムを示しており、最頻値に対して正にのみ分布が存在し、横軸の値が最頻値から離れるにしたがって、縦軸の頻度が低下している。図６２においても同様である。

　一方で、対称のものは、形状が完全に左右対称とは限らないが、最頻値に対して正負双方に分布があり、最頻値から離れるにしたがって頻度が下がる。特徴量データの頻度の偏りが対称となる場合の例を、図６３、図６４に示している。図６３は、縦軸を頻度、横軸を値とした場合のヒストグラムを示しており、最頻値に対して正負双方に分布が存在し、横軸の値が最頻値から離れるにしたがって、縦軸の頻度が低下している。図６４においても同様である。

　そのため、ダイレクト圧縮を実施するに際しては、これらの２つのパターンに対応する必要がある。ここで、これらの最頻値の値は固定ではなく、ネットワークモデル、またその層ごとに異なっているため、それを考慮する必要がある。これは、特徴量を量子化する手法やデータ自身の形状などに起因するものである。

　これらの問題を解決するために、本開示では、前処理と後処理を導入する。すなわち、圧縮(符号化)側では、前処理と符号化部分を組(ペア)にする一方で、復号(伸張)側では、復号部分と後処理を組(ペア)にする。具体的には、本開示の第３の構成は、上述した本開示の第２の構成(図３３の構成)に対応した構成を採用することができる。例えば、図３３の構成に対応した構成を採用した場合、図６５に示すように、符号化側の圧縮部２２２(図３３)において、前処理部５１１を設けて、前処理部５１１が、可変パラメータに基づき、入力DNNの特徴量データ(Ｄ１)に当該特徴量に応じた補正(オフセット)を施すことにより、符号化部５１２が想定する固定の最頻値(例えば最頻値0固定)の位置に揃える処理を行う。これにより、前処理部５１１による補正後(オフセット後)の特徴量データ(Ｄ２)が符号化部５１２に入力され、符号化が行われる。

　一方で、図６６に示すように、復号側の復号部２２３(図３３)において、復号部５２１が復号を行うことで得られる復号後の特徴量データ(Ｄ３)は最頻値が固定(例えば最頻値0固定)されているので、後処理部５２２を設けて、後処理部５２２が、可変パラメータに基づき、当該特徴量に応じた補正(逆オフセット)を施すことにより、元の特徴量データの分布に戻す処理を行う。これにより、後処理部５２２による補正後(逆オフセット後)の特徴量データ(Ｄ４)の分布は、元の特徴量データ(Ｄ１)の分布と同じになる。

＜ネットワーク事前解析器と機械学習演算器の構成と動作＞
　以上のようにして、DNNの特徴量の圧縮復号(圧縮伸張)が可能となるが、それぞれのネットワークモデルの各層に応じて、符号化部５１２と復号部５２１における非対称と対称の選択するための符号化モード、及び前処理部５１１と後処理部５２２における補正値(オフセット値)を決定する必要がある。符号化モードと補正値を含むパラメータを、圧縮パラメータと呼ぶ。符号化モードは、非対称符号化器と対称符号化器、又は非対称復号器と対称復号器を切り替えるための切り替え情報(符号化器切り替え情報)である。補正値(オフセット値)は、補正値情報である。つまり、圧縮パラメータは、特徴量の圧縮モデルを複数切り替えて用いるための切り替え情報と、特徴量をそれぞれの圧縮モデルに適合させるための補正値情報とを含む。

　圧縮パラメータは、DNNの推論時に決定するのではなく、いくつかのテスト入力を用いた事前のオフライン処理で決定することができる。オフライン処理は、ネットワークモデル決定時に一度だけ行えばよい。例えば、圧縮パラメータは、図３３のネットワーク事前解析器２１０による事前のオフライン処理で決定することができる。圧縮パラメータは、符号化制御情報に含めることができる。

　図６７は、ネットワーク事前解析器２１０による圧縮パラメータの決定の例を示す図である。図６７において、ネットワーク事前解析器２１０は、そこに入力されるテスト入力のデータ群(サンプルデータ群)を解析して、各層の圧縮パラメータを決定する。圧縮パラメータは、符号化モードと補正値を含み、層ごとに決定される。ネットワーク事前解析器２１０は、全層の圧縮パラメータを、符号化制御情報として機械学習演算器２１１(図３３)に出力する。図６８は、機械学習演算器２１１による推論処理の例を示す図である。図６８において、機械学習演算器２１１には、符号化制御情報としての全層分の圧縮パラメータが入力される。DNNの推論時において、圧縮部２２２では、圧縮パラメータに基づき、前処理や符号化などの処理が行われ、復号部２２３では、圧縮パラメータに基づき、復号や後処理などの処理が行われる。

　図６９のフローチャートは、機械学習演算器２１１によるDNN処理の流れを示している。まず、DNNパーサでDNNネットワークを解析する(Ｓ７１)。続いて、入力データを圧縮してメモリに書き込んで(Ｓ７２)、nの初期値として、1を設定する(Ｓ７３)。そして、n ≦ N である場合(Ｓ７４：Yes)には、以降の処理が繰り返される。すなわち、Layer(n-1)のデータが圧縮されている場合(Ｓ７５：Yes)、Layer(n-1)の圧縮パラメータでメモリのデータを伸張して読み出す(Ｓ７６)。一方で、Layer(n-1)のデータが圧縮されていない場合(Ｓ７５：No)、そのままデータをメモリから読み出す(Ｓ７７)。なお、n = 1 であるとき、つまり、Layer(0)では圧縮された入力データがメモリに格納された状態であるため、常に伸張の処理を行う。

　ステップＳ７６又はＳ７７が終了すると、Layer(n)のパラメータでn層の処理を実行する(Ｓ７８)。続いて、Layer(n)のデータを圧縮する場合(Ｓ７９：Yes)、Layer(n)の圧縮パラメータでデータを圧縮してメモリに書き込む(Ｓ８０)。一方で、Layer(n)のデータを圧縮しない場合(Ｓ７９：No)、そのままデータをメモリに書き込む(Ｓ８１)。ステップＳ８０又はＳ８１が終了したとき、nの値をインクリメントする。

　ステップＳ７４乃至Ｓ８２の処理を繰り返すことで、n ＞ N となった場合(Ｓ７４：No)に、Layer Nのデータが圧縮されているとき(Ｓ８３：Yes)、Layer Nの圧縮パラメータでメモリのデータを伸張し、出力データとして読み出す(Ｓ８４)。一方で、Layer Nのデータが圧縮されていない場合(Ｓ８３：No)、出力データとして、データをそのままメモリから読み出す(Ｓ８５)。ステップＳ８４又はＳ８５が終了すると、一連の処理は終了する。なお、DNNネットワークの解析(Ｓ７１)は、予めオフラインで実行しておくことも可能である。

　図７０は、DNN処理を実行するDNNシステムの構成と動作を示す図である。図７０においては、CPU５０１が、DMAC５０２にコマンドを発行し、DRAM５０３のデータをDNNプロセッサ５０４の内部メモリに転送する。

　続いて、CPU５０１が、DNNプロセッサ５０４を制御することで処理を実行する。ここでは、次の処理を層数分ループで実行する。すなわち、CPU５０１が、所望の層のDNNパラメータと内部メモリアドレス情報をROMから読み出してDNNプロセッサ５０４にセットする。このとき、CPU５０１は、必要に応じて圧縮パラメータを、ROMから読み出してセットする。次に、CPU５０１が、startパルスでDNNプロセッサ５０４を起動し、DNNプロセッサ５０４は、処理終了したとき、finishパルスを返す。これらの処理が層数分ループして実行された後に、CPU５０１が、DMAC５０２にコマンドを発行し、DNNプロセッサ５０４の内部メモリの演算結果を、DRAM５０３に転送する。

　図７１は、ネットワーク事前解析器２１０による圧縮パラメータ決定処理の流れを示すフローチャートである。ネットワーク事前解析器２１０は、テスト入力のデータ群(サンプルデータ群)を解析することで、n層の特徴量データの最頻値と最小値を算出し(Ｓ９１)、最小値＋閾値Thの値が、最頻値以上となるかどうかを判定する(Ｓ９２)。例えば、閾値Thは、圧縮パラメータ決定時の各種条件に応じた最適な値を適宜設定することができる。

　ネットワーク事前解析器２１０は、ステップＳ９２の判定結果に応じて圧縮パラメータを決定する。すなわち、最小値＋閾値Th ≧ 最頻値である場合(Ｓ９２：Yes)、「非対称」である符号化モードと、「最頻値－符号化器入力最小値」である補正値が決定される(Ｓ９３)。また、最小値＋閾値Th ＜最頻値である場合(Ｓ９２：No)、「対称」である符号化モードと、「最頻値－符号化器入力中央値」である補正値が決定される(Ｓ９４)。

　例えば、図７２に示すように、最小値(最小値＋閾値Th)が最頻値よりも小さい場合には、「対称」である符号化モードと、「最頻値－符号化器入力中央値」である補正値とが、圧縮パラメータとして決定される。ステップＳ９３又はＳ９４が終了すると、n層の圧縮パラメータが決定され、一連の処理は終了する。圧縮を施す各層について一連の処理を繰り返すことで、全層の圧縮パラメータが決定される。

　例えば、圧縮部２２２において、最小値近辺のデータをより圧縮できることを特徴とする符号化器と、中央値近辺のデータをより圧縮できることを特徴とする符号化器とを設けて、前者の符号化器を、頻度の偏りが非対称となる特徴量データに対する符号化である非対称符号化を行う非対称符号化器とし、後者の符号化器を、頻度の偏りが対称となる特徴量データに対する符号化である対称符号化を行う対称符号化器とすることができる。圧縮部２２２では、決定された圧縮パラメータを用いることで、非対称符号化器と対称符号化器を切り替えて用いるとともに、特徴量データを非対称符号化器と対称符号化器のそれぞれに適合させることができる。また、復号部２２３において、最小値近辺のデータをより復号できることを特徴とする復号器と、中央値近辺のデータをより復号できることを特徴とする復号器とを設けて、前者の復号器を、頻度の偏りが非対称となる特徴量データに対する復号である非対称復号を行う非対称復号器とし、後者の復号器を、頻度の偏りが対称となる特徴量データに対する復号である対称復号を行う対称復号器とすることができる。復号部２２３では、決定された圧縮パラメータを用いることで、非対称復号器と対称復号器を切り替えて用いるとともに、特徴量データを非対称復号器と対称復号器のそれぞれに適合させることができる。

＜非対称符号化器の構成＞
　図７３は、圧縮部２２２における非対称符号化器５１２Ａの構成例を示す図である。

　図７３において、非対称符号化器５１２Ａは、量子化部５３１、量子化ステップ決定部５３２、可変長符号化部５３３、可変長符号テーブル５３４、リファインメント符号処理部５３５、及び結合部５３６を有する。

　量子化部５３１は、量子化ステップ決定部５３２により決定された量子化ステップに従い、そこに入力される特徴量データ(入力：0～255)を量子化し、可変長符号化部５３３及びリファインメント符号処理部５３５に出力する。なお、量子化ステップ決定部５３２は、符号化制御情報に含まれるターゲットレート(圧縮率)に基づき、量子化ステップを決定してもよい。

　可変長符号化部５３３は、可変長符号テーブル５３４に従い、量子化部５３１からの量子化データを符号化し、結合部５３６に出力する。図７４は、可変長符号テーブル５３４の例を示す図である。図７４に示すように、可変長符号テーブル５３４は、入力値と可変長符号語とを対応付けたテーブルである。

　リファインメント符号処理部５３５は、量子化部５３１からの量子化データに対し、リファインメント符号処理を施し、結合部５３６に出力する。結合部５３６は、可変長符号化部５３３からの符号化データと、リファインメント符号処理部５３５からの符号化データとを結合し、ビットストリームとして出力する。

＜非対称復号器の構成＞
　図７５は、復号部２２３における非対称復号器５２１Ａの構成例を示す図である。

　図７５において、非対称復号器５２１Ａは、分離部５４１、可変長復号部５４２、可変長符号テーブル５４３、逆量子化部５４４、リファインメント復号処理部５４５、及び結合部５４６を有する。

　分離部５４１は、そこに入力されるビットストリームを分離し、分離して得られた符号化データを、可変長復号部５４２及びリファインメント復号処理部５４５に出力する。また、分離部５４１は、入力ビットストリームから得られた量子化ステップを、逆量子化部５４４に出力する。なお、量子化ステップは、符号化制御情報に含まれるターゲットレート(圧縮率)に基づいて決定してもよい。

　可変長復号部５４２は、可変長符号テーブル５４３に従い、分離部５４１からの符号化データを復号し、逆量子化部５４４に出力する。図７６は、可変長符号テーブル５４３の例を示す図である。図７６に示すように、可変長符号テーブル５４３は、入力値と可変長符号語とを対応付けたテーブルであり、図７４の可変長符号テーブル５３４に対応している。逆量子化部５４４は、分離部５４１からの量子化ステップに従い、可変長復号部５４２からの復号データを逆量子化し、結合部５４６に出力する。

　リファインメント復号処理部５４５は、分離部５４１からの符号化データに対し、リファインメント復号処理を施し、結合部５４６に出力する。結合部５４６は、逆量子化部５４４からの逆量子化復号データと、リファインメント復号処理部５４５からの復号データとを結合し、その結果得られる特徴量データ(出力：0～255)を出力する。

＜対称符号化器の構成＞
　図７７は、圧縮部２２２における対称符号化器５１２Ｂの構成例を示す図である。

　図７７において、対称符号化器５１２Ｂは、量子化部５５１、量子化部５５２、量子化ステップ決定部５５３、減算部５５４、可変長符号化部５５５、可変長符号テーブル５５６、リファインメント符号処理部５５７、及び結合部５５８を有する。

　量子化部５５１は、量子化ステップ決定部５５３により決定された量子化ステップに従い、そこに入力される特徴量データ(入力：0～255)を量子化し、減算部５５４及びリファインメント符号処理部５５７に出力する。量子化部５５２は、量子化ステップ決定部５５３により決定された量子化ステップに従い、そこに入力される特徴量データ(中央値：128)を量子化し、減算部５５４に出力する。なお、量子化ステップ決定部５５３は、符号化制御情報に含まれるターゲットレート(圧縮率)に基づき、量子化ステップを決定してもよい。

　減算部５５４は、量子化部５５１からの量子化データから、量子化部５５２からの量子化データを引く減算を行い、その減算の結果を可変長符号化部５５５に出力する。可変長符号化部５５５は、可変長符号テーブル５５６に従い、減算部５５４からの量子化データを符号化し、結合部５５８に出力する。図７８は、可変長符号テーブル５５６の例を示す図である。図７８に示すように、可変長符号テーブル５５６は、入力値と可変長符号語とを対応付けたテーブルである。

　リファインメント符号処理部５５７は、量子化部５５１からの量子化データに対し、リファインメント符号処理を施し、結合部５５８に出力する。結合部５５８は、可変長符号化部５５５からの符号化データと、リファインメント符号処理部５５７からの符号化データとを結合し、ビットストリームとして出力する。

＜対称復号器の構成＞
　図７９は、復号部２２３における対称復号器５２１Ｂの構成例を示す図である。

　図７９において、対称復号器５２１Ｂは、分離部５６１、可変長復号部５６２、可変長符号テーブル５６３、量子化部５６４、加算部５６５、逆量子化部５６６、リファインメント復号処理部５６７、及び結合部５６８を有する。

　分離部５６１は、そこに入力されるビットストリームを分離し、分離して得られた符号化データを、可変長復号部５６２及びリファインメント復号処理部５６７に出力する。また、分離部５６１は、入力ビットストリームから得られた量子化ステップを、量子化部５６４及び逆量子化部５６６に出力する。なお、量子化ステップは、符号化制御情報に含まれるターゲットレート(圧縮率)に基づいて決定してもよい。

　可変長復号部５６２は、可変長符号テーブル５６３に従い、分離部５６１からの符号化データを復号し、加算部５６５に出力する。図８０は、可変長符号テーブル５６３の例を示す図である。図８０に示すように、可変長符号テーブル５６３は、入力値と可変長符号語とを対応付けたテーブルであり、図７８の可変長符号テーブル５５６に対応している。量子化部５６４は、分離部５６１からの量子化ステップに従い、そこに入力される特徴量データ(中央値：128)を量子化し、加算部５６５に出力する。

　加算部５６５は、可変長復号部５６２からの復号データ(量子化データ)と、量子化部５６４からの量子化データとを足し合わせる加算を行い、その演算結果を逆量子化部５６６に出力する。逆量子化部５６６は、分離部５６１からの量子化ステップに従い、加算部５６５からの復号データを逆量子化し、結合部５６８に出力する。

　リファインメント復号処理部５６７は、分離部５６１からの符号化データに対し、リファインメント復号処理を施し、結合部５６８に出力する。結合部５６８は、逆量子化部５６６からの逆量子化復号データと、リファインメント復号処理部５６７からの復号データとを結合し、その結果得られる特徴量データ(出力：0～255)を出力する。

＜圧縮部の構成＞
　図８１は、機械学習演算器２１１における圧縮部２２２の構成例を示す図である。

　図８１において、圧縮部２２２は、前処理部５１１、非対称符号化器５１２Ａ(図７３)、対称符号化器５１２Ｂ(図７７)、及びスイッチ５１３を有する。圧縮部２２２において、n層の特徴量データが入力される場合、ネットワーク事前解析器２１０により決定されたn層の圧縮パラメータが入力される。ここでは、圧縮パラメータに含まれる情報のうち、補正値情報が前処理部５１１に入力され、切り替え情報がスイッチ５１３に入力される。

　前処理部５１１は、補正値情報に含まれる補正値に基づいて、そこに入力される特徴量データを補正し、非対称符号化器５１２Ａ及び対称符号化器５１２Ｂに出力する。非対称符号化器５１２Ａは、前処理部５１１からの補正後の特徴量データに対し、非対称符号化を行う。対称符号化器５１２Ｂは、前処理部５１１からの補正後の特徴量データに対し、対称符号化を行う。スイッチ５１３は、切り替え情報に含まれる符号化モードに従い、符号化モードが非対称である場合、非対称符号化器５１２Ａの出力を選択し、符号化モードが対称である場合、対称符号化器５１２Ｂの出力を選択する。スイッチ５１３により選択された符号化器の出力が、圧縮特徴量データとして出力される。なお、前処理部５１１の後段にスイッチを設けて切り替え情報を入力することで、符号化モードに応じて前処理部５１１の出力先を切り替えるようにしてもよい。

＜復号部の構成＞
　図８２は、機械学習演算器２１１における復号部２２３の構成例を示す図である。

　図８２において、復号部２２３は、非対称復号器５２１Ａ(図７５)、対称復号器５２１Ｂ(図７９)、後処理部５２２、スイッチ５２３、及びスイッチ５２４を有する。復号部２２３において、n層の圧縮特徴量データが入力される場合、ネットワーク事前解析器２１０により決定されたn層の圧縮パラメータが入力される。ここでは、圧縮パラメータに含まれる情報のうち、切り替え情報がスイッチ５２３とスイッチ５２４に入力され、補正値情報が後処理部５２２に入力される。

　スイッチ５２３は、切り替え情報に含まれる符号化モードに従い、符号化モードが非対称である場合、圧縮特徴量データを非対称復号器５２１Ａに入力し、符号化モードが対称である場合、圧縮特徴量データを対称復号器５２１Ｂに入力する。非対称復号器５２１Ａは、スイッチ５２３を介して入力される圧縮特徴量データに対し、非対称復号を行う。対称復号器５２１Ｂは、スイッチ５２３を介して入力される圧縮特徴量データに対し、対称復号を行う。

　スイッチ５２４は、切り替え情報に含まれる符号化モードに従い、符号化モードが非対称である場合、非対称復号器５２１Ａの出力を選択し、符号化モードが対称である場合、対称復号器５２１Ｂの出力を選択する。後処理部５２２は、補正値情報に含まれる補正値に基づいて、スイッチ５２４を介して入力される特徴量データを補正して出力する。

＜前処理・後処理：非対称用＞
　図８３は、図８１の前処理部５１１における非対称用の前処理を示す図である。図８３に示すように、前処理部５１１では、頻度の偏りが非対称となる特徴量データが入力される場合、減算部５１０によって、入力データから、補正値(最頻値－符号化器入力最小値)を引く減算を行うことで、非対称符号化器５１２Ａが想定する固定の最頻値の位置に揃える補正(オフセット)が施され、出力データとして出力される。

　図８４は、図８２の後処理部５２２における非対称用の後処理を示す図である。図８４に示すように、後処理部５２２では、非対称復号器５２１Ａから、頻度の偏りが非対称となる特徴量データが入力される場合、加算部５２０によって、入力データに、補正値(最頻値－符号化器入力最小値)を足し合わせる加算を行うことで、最頻値の位置を戻して元の特徴量データの分布に戻す補正(逆オフセット)が施され、出力データとして出力される。

＜前処理・後処理：対称用＞
　図８５は、図８１の前処理部５１１における対称用の前処理を示す図である。図８５に示すように、前処理部５１１では、頻度の偏りが対称となる特徴量データが入力される場合、減算部５１０によって、入力データから、補正値(最頻値－符号化器入力中央値)を引く減算を行うことで、対称符号化器５１２Ｂが想定する固定の最頻値の位置に揃える補正(オフセット)が施され、出力データとして出力される。

　図８６は、図８２の後処理部５２２における対称用の後処理を示す図である。図８６に示すように、後処理部５２２では、対称復号器５２１Ｂから、頻度の偏りが対称となる特徴量データが入力される場合、加算部５２０によって、入力データに、補正値(最頻値－符号化器入力中央値)を足し合わせる加算を行うことで、最頻値の位置を戻して元の特徴量データの分布に戻す補正(逆オフセット)が施され、出力データとして出力される。

＜リファインメント処理＞
　図８７は、リファインメント符号処理やリファインメント復号処理で実施されるリファインメント処理の例を示す図である。図８７においては、符号化するブロック状のデータを、ビットイメージで示している。図８７において、横方向がブロック幅(Block Width)、縦方向がビット深度(Bit Depth)を示し、上側がMSB(Most Significant Bit)で、下側がLSB(Least Significant Bit)となる。量子化が線Ｌで行われたとしたとき、線Ｌより下側のドット模様の部分は、VLC化されずにビットイメージそのもので符号化される。このドット模様の部分を、リファインメント(Refinement)と呼ぶ。ビット総数は、データブロックごとに計算される。所望のビット量(bps×Blockサイズ)から、VLCで伝送される符号量とヘッダ情報を減じたものとなる。リファインメントの伝送順序はビットプレーンで行われ、MSB側から行われる。ビットプレーン内の伝送順は特に規定はないが、符号化側と復号側で正しく揃える必要がある。

＜他の構成例＞
　上述した説明では、機械学習演算器２１１における圧縮部２２２(図８１)において、非対称符号化器５１２Ａと対称符号化器５１２Ｂのそれぞれの符号化器に対し、共通の前処理部５１１を１つ設けた構成を示したが、前処理部５１１をそれぞれの符号化器に対して個別に設けて、切り替えて使い分けてもよい。図８８は、圧縮部２２２の他の構成例を示す図である。図８８において、圧縮部２２２は、非対称用前処理部５１１Ａ、対称用前処理部５１１Ｂ、非対称符号化器５１２Ａ、対称符号化器５１２Ｂ、及びスイッチ５１４を有する。

　非対称用前処理部５１１Ａは、補正値情報に含まれる補正値に基づいて、非対称用の前処理(図８３)を行うことで、そこに入力される特徴量データを補正し、非対称符号化器５１２Ａに出力する。非対称符号化器５１２Ａは、非対称用前処理部５１１Ａからの補正後の特徴量データに対し、非対称符号化を行う。

　対称用前処理部５１１Ｂは、補正値情報に含まれる補正値に基づいて、対称用の前処理(図８５)を行うことで、そこに入力される特徴量データを補正し、対称符号化器５１２Ｂに出力する。対称符号化器５１２Ｂは、対称用前処理部５１１Ｂからの補正後の特徴量データに対し、対称符号化を行う。

　スイッチ５１４は、切り替え情報に含まれる符号化モードに従い、符号化モードが非対称である場合、非対称符号化器５１２Ａの出力を選択し、符号化モードが対称である場合、対称符号化器５１２Ｂの出力を選択する。スイッチ５１４により選択された符号化器の出力が、圧縮特徴量データとして出力される。

　また、上述した説明では、機械学習演算器２１１における復号部２２３(図８２)において、非対称復号器５２１Ａと対称復号器５２１Ｂのそれぞれの復号器に対し、共通の後処理部５２２を１つ設けた構成を示したが、後処理部５２２をそれぞれの復号器に対して個別に設けて、切り替えて使い分けてもよい。図８９は、復号部２２３の他の構成例を示す図である。図８９において、復号部２２３は、非対称復号器５２１Ａ、対称復号器５２１Ｂ、非対称用後処理部５２２Ａ、対称用後処理部５２２Ｂ、スイッチ５２５、及びスイッチ５２６を有する。

　スイッチ５２５は、切り替え情報に含まれる符号化モードに従い、符号化モードが非対称である場合、圧縮特徴量データを非対称復号器５２１Ａに入力し、符号化モードが対称である場合、圧縮特徴量データを対称復号器５２１Ｂに入力する。非対称復号器５２１Ａは、スイッチ５２５を介して入力される圧縮特徴量データに対し、非対称復号を行い、非対称用後処理部５２２Ａに出力する。非対称用後処理部５２２Ａは、補正値情報に含まれる補正値に基づいて、非対称用の後処理(図８４)を行うことで、そこに入力される特徴量データを補正する。

　対称復号器５２１Ｂは、スイッチ５２５を介して入力される圧縮特徴量データに対し、対称復号を行い、対称用後処理部５２２Ｂに出力する。対称用後処理部５２２Ｂは、補正値情報に含まれる補正値に基づいて、対称用の後処理(図８６)を行うことで、そこに入力される特徴量データを補正する。スイッチ５２６は、切り替え情報に含まれる符号化モードに従い、符号化モードが非対称である場合、非対称用後処理部５２２Ａの出力を選択し、符号化モードが対称である場合、対称用後処理部５２２Ｂの出力を選択する。スイッチ５２６により選択された後処理部の出力が、特徴量データとして出力される。

＜オールゼロフラグの例＞
　上述した符号化器と復号器の説明において、量子化したデータを可変長符号化(VLC)するとしたが、量子化したデータが全てゼロになる場合も多くあることから、オールゼロフラグ(all zero flag)を規定して圧縮ストリームに適用することで、より効率良く圧縮を行うことができる。量子化したデータがゼロである場合、オールゼロフラグを"1"とし、VLC部分は伝送しない。一方で、量子化したデータに非ゼロが含まれる場合、オールゼロフラグを"0"とし、VLC部分を伝送する。ただし、頻度の偏りが対称となる場合、量子化したデータから、量子化した中央値を引いているが、この場合も同様に適用可能である。

　図９０は、量子化したデータに非ゼロが含まれる場合の圧縮ストリームの構成例を示す図である。図９０において、量子化ステップに続く、オールゼロフラグが"0"となり、VLC部分が伝送される。また、リファインメントも伝送される。一方で、図９１は、量子化したデータが全てゼロになる場合の圧縮ストリームの構成例を示す図である。図９１においては、オールゼロフラグが"1"となり、VLC部分は伝送されない。

　なお、上述した説明では、DNNの特徴量データには、頻度の偏りには少なくとも非対称のものと対称のものがあるとしたが、それ以外の分布モデルを用意して切り替えて使用することも可能である。さらに、サンプルデータによる特徴量データの分布に基づくモデルを新規作成し、それも含めて切り替えて使用することも可能である。予測値との差分を取ることなく圧縮できるモデルについて説明したが、切り替え時には予測値との差分を取るモデルも含めて、切り替えて使用することも可能である。

　以上のように、本開示の第３の構成では、DNN等の機械学習を処理時の中間データ、特に特徴量データ(特徴マップ)を圧縮して限られたメモリ容量のプロセッサ等でも大規模な演算を実現するために、圧縮パラメータを用いて、複数の符号化方式(復号方式)、並びに前処理及び後処理を切り替えることで、効率よく圧縮できるようにしている。

　すなわち、本開示の第３の構成では、DNNの特徴マップを圧縮する際に、特徴量のデータ分布に応じて、異なる圧縮方法とそれぞれに対応したデータの前処理からなる複数の組合せを切り替えることを特徴とする符号化方式を提案している。例えば、異なる圧縮方法には、少なくとも、次の２つの圧縮方法を含めて切り替えて用いることができる。具体的には、１つ目の圧縮方法は、データの度数分布的に最小値の近傍で頻度が高く、値が大きくなるにつれて頻度が低くなるモデル(第１圧縮モデル)に適した圧縮方法である。２つ目の圧縮方法は、データの度数分布的に値の中央で頻度が高く、かつ、値が中央より大きく、あるいは、小さくなるにつれて頻度が低くなるモデル(第２圧縮モデル)に適した圧縮方法である。

　また、本開示の第３の構成では、DNNの特徴マップを復号する際に、特徴量のデータ分布に応じて、異なる復号方法(伸張方法)とそれぞれに対応したデータの後処理からなる複数の組み合わせを切り替えることを特徴とする復号方式を提案している。例えば、異なる復号方法は、少なくとも、次の２つの復号方法を含めて切り替えて用いることができる。具体的には、１つ目の復号方法は、データの度数分布的に最小値の近傍で頻度が高く、値が大きくなるにつれて頻度が低くなるモデル(第１圧縮モデル)に適した復号方法である。２つ目の復号方法は、データの度数分布的に値の中央で頻度が高く、かつ、値が中央よりも大きく、あるいは小さくなるにつれて頻度が低くなるモデル(第２圧縮モデル)に適した復号方法である。

　ただし、上述した圧縮方法と復号方法において、データの分布は、DNNの推論時の入力そのものではなく、事前に行われるオフライン処理でその分布に応じた圧縮パラメータが決定され、DNNの推論時に用いられる。すなわち、ネットワーク事前解析器２１０が、特徴量のサンプルデータを解析して、特徴量の圧縮モデルを複数切り替えて用いるための切り替え情報と、特徴量をそれぞれの圧縮モデルに適合させるための補正値情報とを含む圧縮パラメータを生成し、生成した圧縮パラメータを制御情報に含めることができる。このとき、圧縮モデルには、予測値との差分を取らずに圧縮可能とする圧縮モデルであるダイレクト圧縮を含む。機械学習演算器２１１では、圧縮部２２２が、補正値情報に基づいて、入力される特徴量を補正して、第１圧縮モデル又は第２圧縮モデルに適合させる前処理を行い、前処理で補正した補正特徴量に対し、第１圧縮モデル又は第２圧縮モデルに応じた符号化を行い、切り替え情報に基づいて、第１圧縮モデル又は第２圧縮モデルに応じた符号化で得られた圧縮特徴量を選択してメモリ２２４に記録する。また、復号部２２３が、メモリ２２４に一時的に格納された圧縮特徴量に対し、第１圧縮モデル又は第２圧縮モデルに応じた復号を行い、切り替え情報に基づいて、第１圧縮モデル又は第２圧縮モデルに応じた復号で得られた補正特徴量を選択し、補正値情報に基づいて、選択した補正特徴量を、補正前の特徴量に戻す後処理を行う。

　このように、本開示の第３の構成では、圧縮パラメータを用いて、複数の符号化方式(復号方式)、並びに前処理及び後処理を切り替えて、効率よく特徴量を圧縮することで、メモリ容量を削減し、消費電力の低減や処理速度といったパフォーマンスの向上を実現することができる。また、並び替え回路を使用することなく、複数の符号化方式(復号方式)、並びに前処理及び後処理を切り替えて特徴量を効率よく圧縮することで、より確実に推論を行って認識性能劣化を抑えることができる。

＜＜変形例＞＞

　上述した説明では、本開示を適用した機器として、機械学習推論器１００(図５)と機械学習推論器２００(図３３)を示したが、機械学習推論器１００(図５)と機械学習推論器２００(図３３)の機能は、監視カメラ、ワークステーション、サーバなどの情報処理装置に搭載して実行することができる。また、機械学習推論器１００(図５)におけるネットワーク事前解析器１１０と機械学習演算器１１１が別の装置として構成されてもよい。例えば、ネットワーク事前解析器１１０を含む第１の装置と、機械学習演算器１１１を含む第２の装置とが、ネットワークを介して接続されてもよい。機械学習推論器２００(図３３)におけるネットワーク事前解析器２１０と機械学習演算器２１１についても同様に別の装置として構成されてもよい。

　圧縮部１２２(図５)と圧縮部２２２(図３３)で用いられる圧縮方式は、符号化制御情報を適用可能な圧縮方式であれば、他の圧縮方式を用いてもよい。復号部１２３(図５)と復号部２２３(図３３)で用いられる復号方式は、符号化制御情報を適用可能な復号方式であれば、他の復号方式を用いてもよい。なお、符号化制御情報には、圧縮率、圧縮方法、及び制御パラメータのうち、少なくともいずれかの情報(パラメータ)が含まれていればよい。制御パラメータには、非線形変換テーブルID、予測算出パラメータ、残差非線形変換テーブルID、及びエントロピ符号化テーブルIDのうち、少なくともいずれかの情報(パラメータ)が含まれていればよい。予測算出パラメータには、参照チャンネルID、参照パラメータ、及び予測方法のうち、少なくともいずれかの情報(パラメータ)が含まれていればよい。

　上述した説明において、ニューラルネットワークで処理される特徴量は、中間データであるとも言える。本開示は、符号化制御情報を用いて、中間データとしての画像データの圧縮と復号を制御しても構わない。例えば、非線形変換テーブルと残差非線形変換テーブルを、画像データに対して適用することができる。具体的には、機械学習推論器２００(図３３)において、ネットワーク事前解析器２１０と機械学習演算器２１１を、例えば、次のように構成すればよい。

　すなわち、ネットワーク事前解析器２１０は、画像データのサンプルデータに基づいて、画像データの圧縮を制御するための符号化制御情報を生成する。より具体的には、ネットワーク事前解析器２１０においては、非線形変換テーブル選定部３２１が、画像データのサンプルデータの統計値を解析した結果に応じた非線形変換を行うための非線形変換テーブルを選定する。また、残差非線形変換テーブル選定部３２６が、画像データのサンプルデータと画像データのサンプルデータの予測値との差分である予測残差のサンプルデータに基づいて、サンプルデータの統計値を解析した結果に応じた残差非線形変換を行うための残差非線形変換テーブルを選定する。これにより、符号化制御情報には、非線形変換テーブルIDと残差非線形変換テーブルIDを含む制御パラメータが含められる。

　また、機械学習演算器２１１は、圧縮部２２２を有し、圧縮部２２２は、ネットワーク事前解析器２１０からの符号化制御情報に基づいて、入力される画像データを圧縮する。より具体的には、圧縮部２２２は、入力される画像データに対し予測値を生成して、画像データと予測値との差分から得られる差分情報をエントロピ符号化することで、画像データを圧縮する圧縮方式を用いている。圧縮部２２２においては、非線形変換部２６３が、非線形変換テーブルに従い、入力される画像データに対し、非線形変換を行う。また、残差非線形変換部２６５が、残差非線形変換テーブルに従い、非線形変換適用済みの画像データと、非線形変換適用済みの画像データに対して生成した予測値との差分である非線形変換適用済みの予測残差に対し残差非線形変換を行う。このように、非線形変換テーブルと残差非線形変換テーブルを用いて、画像データに対し２段階の非線形変換を行うことで、データ分布特性等を用いて特に重要な部分を保護することができる。

　上述した説明において、DNN処理のデータアクセス方法として、depth wise accessとpixel wise access(point wise access)を説明したが、演算部１２１(図５)では、双方のアクセス方法を用いて演算を行うことは勿論、いずれか一方のアクセス方法のみを用いて演算を行うことも可能である。例えば、DNN処理としてpixel wise convolutionが行われる場合にそのデータアクセス方法としてpixel wise accessのみが用いられるとき、デプス方向まとめの圧縮方法が有効となるが、このとき、圧縮方法を、空間方向まとめとデプス方向まとめで切り替える必要はなく、デプス方向まとめの圧縮方法で固定とすればよい。

　このとき、圧縮部１２２(図５)と復号部１２３(図５)は、ネットワーク事前解析器１１０(図５)からの符号化制御情報に含まれる圧縮方法を用いずに、固定で設定された圧縮方法を用いることができる。例えば、圧縮部１２２は、デプス方向まとめの圧縮方法が固定で設定されている場合に、空間方向の予測で得られた特徴量の予測値と、現在の特徴量のデータとの差分データを符号化して、デプス方向にまとめてパッキングすることで、特徴量を圧縮することができる(図３０)。なお、繰り返しになるので説明は省略するが、機械学習推論器１００(図５)に限らず、機械学習推論器２００(図３３)においても同様の動作を行うことができる。

＜コンピュータの構成＞
　上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。図９２は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

　コンピュータにおいて、CPU(Central Processing Unit)１００１、ROM(Read Only Memory)１００２、RAM(Random Access Memory)１００３は、バス１００４により相互に接続されている。バス１００４には、さらに、入出力インタフェース１００５が接続されている。入出力インタフェース１００５には、入力部１００６、出力部１００７、記憶部１００８、通信部１００９、及びドライブ１０１０が接続されている。

　入力部１００６は、キーボード、マウス、マイクロフォンなどよりなる。出力部１００７は、ディスプレイ、スピーカなどよりなる。記憶部１００８は、ハードディスクや不揮発性のメモリなどよりなる。通信部１００９は、ネットワークインタフェースなどよりなる。ドライブ１０１０は、半導体メモリ、磁気ディスク、光ディスク、又は光磁気ディスクなどのリムーバブル記録媒体１０１１を駆動する。

　以上のように構成されるコンピュータでは、CPU１００１が、ROM１００２や記憶部１００８に記録されているプログラムを、入出力インタフェース１００５及びバス１００４を介して、RAM１００３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ(CPU１００１)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体１０１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記録媒体１０１１をドライブ１０１０に装着することにより、入出力インタフェース１００５を介して、記憶部１００８にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部１００９で受信し、記憶部１００８にインストールすることができる。その他、プログラムは、ROM１００２や記憶部１００８に、予めインストールしておくことができる。

　コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。また、プログラムは、１のコンピュータ(プロセッサ)により処理されてもよいし、複数のコンピュータによって分散処理されてもよい。

　なお、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　また、本開示は、以下のような構成をとることができる。

（１）
　ニューラルネットワークを用いた推論を行う前に前記ニューラルネットワークを解析して、前記ニューラルネットワークで処理される特徴量の圧縮と復号を制御するための制御情報を生成する事前解析部と、
　入力データと前記ニューラルネットワークを用いた推論を行い、前記入力データから得られる前記特徴量を処理した処理結果を、演算結果として出力する演算部と、
　前記制御情報に基づいて、前記演算部から入力される前記特徴量を圧縮して、圧縮した前記特徴量である圧縮特徴量をメモリに記録する圧縮部と、
　前記制御情報に基づいて、前記メモリに一時的に記録された前記圧縮特徴量を復号して、復号した前記特徴量を前記演算部に出力する復号部と
　を備える情報処理装置。
（２）
　前記事前解析部は、前記ニューラルネットワークの各レイヤのウェイトのデータサイズ、前記特徴量のデータサイズ、及び前記メモリのメモリサイズに基づいて、前記ニューラルネットワークの各レイヤで処理される前記特徴量の圧縮率を算出し、算出した前記圧縮率を前記制御情報に含める
　前記（１）に記載の情報処理装置。
（３）
　前記事前解析部は、前記特徴量の圧縮率に基づいて、前記圧縮率を算出した前記特徴量のうち、前記圧縮率が所定値以上となる前記特徴量の圧縮方法を非圧縮に決定し、決定した前記圧縮方法を前記制御情報に含める
　前記（２）に記載の情報処理装置。
（４）
　前記事前解析部は、前記ニューラルネットワークの各レイヤで処理される前記特徴量、及び前記ニューラルネットワークの各レイヤの処理におけるデータアクセス方法に基づいて、前記データアクセス方法に対応した圧縮単位での前記特徴量の圧縮方法を決定し、決定した前記圧縮方法を前記制御情報に含める
　前記（１）乃至（３）のいずれかに記載の情報処理装置。
（５）
　前記特徴量は、ｘｙ平面の特徴量をｚ方向のチャンネルごとに構成した３次元のデータであり、
　前記事前解析部は、前記特徴量の圧縮方法として、前記特徴量のデータをｘｙ平面に対応した第１の方向にまとめる第１の圧縮方法、又は前記特徴量のデータをｚ方向に対応した第２の方向にまとめる第２の圧縮方法を決定し、決定した前記圧縮方法を前記制御情報に含める
　前記（１）又は（４）に記載の情報処理装置。
（６）
　前記圧縮部は、
　　入力される前記特徴量のデータに対し第１の予測値を生成して、前記特徴量のデータと前記第１の予測値との差分から得られる差分情報をエントロピ符号化することで、前記特徴量を圧縮する圧縮方式を用いており、
　　前記圧縮方法に従い、前記ニューラルネットワークの各レイヤの処理におけるデータアクセス方法に対応した圧縮単位で取り出された前記特徴量のデータと前記第１の予測値との差分を算出する
　前記（５）に記載の情報処理装置。
（７）
　前記復号部は、
　　入力される前記圧縮特徴量のデータをエントロピ復号して得られる前記差分情報と加算する第２の予測値を生成して、前記差分情報と前記第２の予測値を加算することで、前記圧縮特徴量を復号する復号方式を用いており、
　　前記圧縮方法に従い、前記データアクセス方法に対応した圧縮単位で前記第２の予測値を前記差分情報に加算して得られる前記特徴量のデータを並び替える
　前記（６）に記載の情報処理装置。
（８）
　前記圧縮部は、前記第１の圧縮方法が指定された場合、前記特徴量のデータと同じチャンネルの前記第１の方向の予測により前記第１の予測値を生成し、前記特徴量のデータと前記第１の予測値との差分から得られる前記差分情報を、前記第１の方向にパッキングする
　前記（６）に記載の情報処理装置。
（９）
　前記圧縮部は、前記第２の圧縮方法が指定された場合、前記特徴量のデータと同じチャンネルの前記第１の方向の予測により前記第１の予測値を生成し、前記特徴量のデータと前記第１の予測値との差分から得られる前記差分情報を、前記第２の方向にパッキングする
　前記（６）に記載の情報処理装置。
（１０）
　前記事前解析部は、前記特徴量のサンプルデータに基づいて、前記ニューラルネットワークで処理対象となる特徴量を解析して、特徴量の圧縮と復号を制御するためのパラメータを生成し、生成した前記パラメータを前記制御情報に含める
　前記（１）に記載の情報処理装置。
（１１）
　前記特徴量は、ｘｙ平面の特徴量をｚ方向のチャンネルごとに構成した３次元のデータであり、
　前記事前解析部は、チャンネル単位で特徴量の圧縮と復号を制御するための制御パラメータを生成し、生成した前記制御パラメータを前記制御情報に含める
　前記（１０）に記載の情報処理装置。
（１２）
　前記事前解析部は、前記特徴量のサンプルデータに基づいて、前記特徴量の予測値を生成する際に参照するチャンネルを示した参照チャンネルを算出し、算出した前記参照チャンネルの識別情報を前記制御パラメータに含め、
　前記圧縮部は、
　　入力される前記特徴量のデータに対し第１の予測値を生成して、前記特徴量のデータと前記第１の予測値との差分から得られる差分情報をエントロピ符号化することで、前記特徴量を圧縮する圧縮方式を用いており、
　　前記制御パラメータに従い、前記第１の予測値を生成し、
　前記復号部は、
　　入力される前記圧縮特徴量のデータをエントロピ復号して得られる前記差分情報と加算する第２の予測値を生成して、前記差分情報と前記第２の予測値を加算することで、前記圧縮特徴量を復号する復号方式を用いており、
　　前記制御パラメータに従い、前記第２の予測値を生成する
　前記（１１）に記載の情報処理装置。
（１３）
　前記事前解析部は、前記特徴量のサンプルデータ、及び前記参照チャンネルの識別情報に基づいて、前記参照チャンネルを参照して前記予測値を生成するための参照パラメータを算出し、算出した前記参照パラメータを前記制御パラメータに含める
　前記（１２）に記載の情報処理装置。
（１４）
　前記事前解析部は、前記特徴量のサンプルデータ、前記参照チャンネルの識別情報、及び前記参照パラメータに基づいて、ｘｙ平面に対応した第１の方向を参照して行う予測である第１の予測方法、ｚ方向に対応した第２の方向でチャンネル間を参照して行う予測である第２の予測方法、及び前記第１の方向と前記第２の方向の双方向を参照して行う予測である第３の予測方法を少なくとも含む予測方法の中から１つの予測方法を決定し、決定した前記予測方法を前記制御パラメータに含める
　前記（１３）に記載の情報処理装置。
（１５）
　前記事前解析部は、チャンネルごとに、前記参照チャンネルと、前記参照パラメータと、前記予測方法を切り替える
　前記（１４）に記載の情報処理装置。
（１６）
　前記事前解析部は、
　　前記特徴量のサンプルデータに基づいて、チャンネルごとのサンプルデータの統計値を解析した結果に応じた非線形変換を行うための非線形変換テーブルを選定し、
　　選定した前記非線形変換テーブルとの識別情報を前記制御パラメータに含め、
　前記圧縮部は、前記非線形変換テーブルに従い、入力される前記特徴量のデータに対し非線形変換を行う
　前記（１１）に記載の情報処理装置。
（１７）
　前記事前解析部は、チャンネルごとに、前記非線形変換テーブルを切り替える
　前記（１６）に記載の情報処理装置。
（１８）
　前記事前解析部は、
　　前記特徴量のサンプルデータと前記特徴量のサンプルデータの予測値との差分である予測残差のサンプルデータに基づいて、チャンネルごとのサンプルデータの統計値を解析した結果に応じた残差非線形変換を行うための残差非線形変換テーブルを選定し、
　　選定した前記残差非線形変換テーブルの識別情報を前記制御パラメータに含め、
　前記圧縮部は、前記残差非線形変換テーブルに従い、前記特徴量のデータと、前記特徴量のデータに対して生成した予測値との差分である予測残差に対し非線形変換を行う
　前記（１１）又は（１６）に記載の情報処理装置。
（１９）
　前記事前解析部は、チャンネルごとに、前記残差非線形変換テーブルを切り替える
　前記（１８）に記載の情報処理装置。
（２０）
　前記事前解析部は、
　　前記特徴量のサンプルデータと前記特徴量のサンプルデータの予測値との差分である予測残差のサンプルデータに基づいて、チャンネルごとのサンプルデータの統計値を解析した結果に応じたエントロピ符号化を行うためのエントロピ符号化テーブルを選定し、
　　選定した前記エントロピ符号化テーブルの識別情報を前記制御パラメータに含め、
　前記圧縮部は、前記エントロピ符号化テーブルに従い、前記特徴量のデータと、前記特徴量のデータに対して生成した予測値との差分情報に対しエントロピ符号を行う
　前記（１１）に記載の情報処理装置。
（２１）
　前記事前解析部は、前記特徴量のサンプルデータを解析して、前記特徴量の圧縮モデルを複数切り替えて用いるための切り替え情報と、前記特徴量をそれぞれの前記圧縮モデルに適合させるための補正値情報とを含む圧縮パラメータを生成し、生成した前記圧縮パラメータを前記制御情報に含める
　前記（１０）に記載の情報処理装置。
（２２）
　前記圧縮モデルは、予測値との差分を取らずに圧縮可能とする圧縮モデルを含む
　前記（２１）に記載の情報処理装置。
（２３）
　前記圧縮部は、
　　前記補正値情報に基づいて、入力される前記特徴量を補正して、第１の圧縮モデル又は第２の圧縮モデルに適合させる前処理を行い、
　　前記前処理で補正した補正特徴量に対し、前記第１の圧縮モデル又は前記第２の圧縮モデルに応じた符号化を行い、
　　前記切り替え情報に基づいて、前記第１の圧縮モデル又は前記第２の圧縮モデルに応じた符号化で得られた前記圧縮特徴量を選択して前記メモリに記録する
　前記（２１）又は（２２）に記載の情報処理装置。
（２４）
　前記復号部は、
　　前記メモリに一時的に格納された前記圧縮特徴量に対し、前記第１の圧縮モデル又は前記第２の圧縮モデルに応じた復号を行い、
　　前記切り替え情報に基づいて、前記第１の圧縮モデル又は前記第２の圧縮モデルに応じた復号で得られた前記補正特徴量を選択し、
　　前記補正値情報に基づいて、選択した前記補正特徴量を、補正前の前記特徴量に戻す後処理を行う
　前記（２３）に記載の情報処理装置。
（２５）
　情報処理装置が、
　ニューラルネットワークを用いた推論を行う前に前記ニューラルネットワークを解析して、前記ニューラルネットワークで処理される特徴量の圧縮と復号を制御するための制御情報を生成し、
　入力データと前記ニューラルネットワークを用いた推論を行い、前記入力データから得られる前記特徴量を処理した処理結果を、演算結果として出力し、
　前記制御情報に基づいて、入力される前記特徴量を圧縮して、圧縮した前記特徴量である圧縮特徴量をメモリに記録し、
　前記制御情報に基づいて、前記メモリに一時的に記録された前記圧縮特徴量を復号して、復号した前記特徴量を出力する
　情報処理方法。
（２６）
　画像データのサンプルデータに基づいて、前記画像データの圧縮を制御するための制御情報を生成する事前解析部と、
　前記制御情報に基づいて、入力される前記画像データを圧縮する圧縮部と
　を備え、
　前記事前解析部は、
　　前記画像データのサンプルデータの統計値を解析した結果に応じた非線形変換を行うための非線形変換テーブルを選定し、
　　前記画像データのサンプルデータと前記画像データのサンプルデータの予測値との差分である予測残差のサンプルデータに基づいて、サンプルデータの統計値を解析した結果に応じた残差非線形変換を行うための残差非線形変換テーブルを選定し、
　　選定した前記非線形変換テーブルと前記残差非線形変換テーブルの識別情報を前記制御情報に含め、
　前記圧縮部は、
　　入力される前記画像データに対し予測値を生成して、前記画像データと前記予測値との差分から得られる差分情報をエントロピ符号化することで、前記画像データを圧縮する圧縮方式を用いており、
　　前記非線形変換テーブルに従い、入力される前記画像データに対し、非線形変換を行い、
　　前記残差非線形変換テーブルに従い、非線形変換適用済みの前記画像データと、非線形変換適用済みの前記画像データに対して生成した前記予測値との差分である非線形変換適用済みの予測残差に対し非線形変換を行う
　情報処理装置。
（２７）
　入力データとニューラルネットワークを用いた推論を行い、前記入力データから得られる特徴量を処理した処理結果を、演算結果として出力する演算部と、
　前記演算部から入力される前記特徴量を圧縮して、圧縮した前記特徴量である圧縮特徴量をメモリに記録する圧縮部と、
　前記メモリに一時的に記録された前記圧縮特徴量を復号して、復号した前記特徴量を前記演算部に出力する復号部と
　を備え、
　前記特徴量は、ｘｙ平面の特徴量をｚ方向のチャンネルごとに構成した３次元のデータであり、
　前記圧縮部は、
　　入力される前記特徴量のデータに対し予測値を生成して、前記特徴量のデータと前記予測値との差分から得られる差分情報をエントロピ符号化することで、前記特徴量を圧縮する圧縮方式を用いており、
　　前記特徴量の圧縮方法として、前記特徴量のデータをｚ方向に対応した第２の方向にまとめる圧縮方法が設定された場合、前記特徴量のデータと同じチャンネルのｘｙ平面に対応した第１の方向の予測により前記予測値を生成し、前記特徴量のデータと前記予測値との差分から得られる前記差分情報を、前記第２の方向にパッキングする
　情報処理装置。

　１００　機械学習推論器，　１１０　ネットワーク事前解析器，　１１１　機械学習演算器，　１２１　演算部，　１２２　圧縮部，　１２３　復号部，　１２４　メモリ，　１４１　検出部，　１４２　圧縮率算出部，　１４３　圧縮方法決定部，　１６１　データ取り出し部，　１６２　スイッチ，　１６３　加算部，　１６４　量子化部，　１６５　エントロピ符号化部，　１６６　逆量子化部，　１６７　加算部，　１６８　ワークバッファ，　１６９　予測値生成部，　１８１　スイッチ，　１８２　エントロピ復号部，　１８３　逆量子化部，　１８４　加算部，　１８５　データ並び替え部，　１８６　ワークバッファ，　１８７　予測値生成部，　２００　機械学習推論器，　２１０　ネットワーク事前解析器，　２１１　機械学習演算器，　２２１　演算部，　２２２　圧縮部，　２２３　復号部，　２２４　メモリ，　２４１　検出部，　２４２　圧縮率算出部，　２４３　圧縮方法決定部，　２４４　特徴量サンプル抽出部，　２４５－０乃至２４５－Ｎ　制御パラメータ生成部，　２６１　データ取り出し部，　２６２　スイッチ，　２６３　非線形変換部，　２６４　加算部，　２６５　残差非線形変換部，　２６６　量子化部，　２６７　エントロピ符号化部，　２６８　逆量子化部，　２６９　残差逆非線形変換部，　２７０　加算部，　２７１　ワークバッファ，　２７２　予測値生成部，　２８１　スイッチ，　２８２　エントロピ復号部，　２８３　逆量子化部，　２８４　残差逆非線形変換部，　２８５　加算部，　２８６　逆非線形変換部，　２８７　データ並び替え部，　２８８　ワークバッファ，　２８９　予測値生成部，　３２１　非線形変換テーブル選定部，　３２２　非線形変換部，　３２３　予測算出パラメータ算出部，　３２４　簡易予測値生成部，　３２５　差分部，　３２６　残差非線形変換テーブル選定部，　３２７　残差非線形変換部，　３２８　エントロピ符号化テーブル選定部，　４２１　チャンネル分割部，　４２２－０乃至４２２－３　ヒストグラム算出部，　４２３－０乃至４２３－３　変換テーブルID算出部，　４４１　参照チャンネル算出部，　４４２　参照パラメータ算出部，　４４３　予測方法決定部，　４６１　チャンネル分割部，　４６２－０乃至４６２－３　ヒストグラム算出部，　４６３－０乃至４６３－３　変換テーブルID算出部，　５０１　CPU，　５０２　DMAC，　５０３　DRAM，　５０４　DNNプロセッサ，　５１１　前処理部，　５１１Ａ　非対称用前処理部，　５１１Ｂ　対称用前処理部，　５１２　符号化部，　５１２Ａ　非対称符号化器，　５１２Ｂ　対称符号化器，　５１３，５１４　スイッチ，　５２１　復号部，　５２１Ａ　非対称復号器，　５２１Ｂ　対称復号器，　５２２　後処理部，　５２２Ａ　非対称用後処理部，　５２２Ｂ　対称用後処理部，　５２３，５２４，５２５，５２６　スイッチ，　５３１　量子化部，　５３２　量子化ステップ決定部，　５３３　可変長符号化部，　５３４　可変長符号テーブル，　５３５　リファインメント符号処理部，　５３６　結合部，　５４１　分離部，　５４２　可変長復号部，　５４３　可変長符号テーブル，　５４４　逆量子化部，　５４５　リファインメント復号処理部，　５４６　結合部，　５５１　量子化部，　５５２　量子化部，　５５３　量子化ステップ決定部，　５５４　減算部，　５５５　可変長符号化部，　５５６　可変長符号テーブル，　５５７　リファインメント符号処理部，　５５８　結合部，　５６１　分離部，　５６２　可変長復号部，　５６３　可変長符号テーブル，　５６４　量子化部，　５６５　加算部，　５６６　逆量子化部，　５６７　リファインメント復号処理部，　５６８　結合部

Claims

　ニューラルネットワークを用いた推論を行う前に前記ニューラルネットワークを解析して、前記ニューラルネットワークで処理される特徴量の圧縮と復号を制御するための制御情報を生成する事前解析部と、
　入力データと前記ニューラルネットワークを用いた推論を行い、前記入力データから得られる前記特徴量を処理した処理結果を、演算結果として出力する演算部と、
　前記制御情報に基づいて、前記演算部から入力される前記特徴量を圧縮して、圧縮した前記特徴量である圧縮特徴量をメモリに記録する圧縮部と、
　前記制御情報に基づいて、前記メモリに一時的に記録された前記圧縮特徴量を復号して、復号した前記特徴量を前記演算部に出力する復号部と
　を備える情報処理装置。
　前記事前解析部は、前記ニューラルネットワークの各レイヤのウェイトのデータサイズ、前記特徴量のデータサイズ、及び前記メモリのメモリサイズに基づいて、前記ニューラルネットワークの各レイヤで処理される前記特徴量の圧縮率を算出し、算出した前記圧縮率を前記制御情報に含める
　請求項１に記載の情報処理装置。
　前記事前解析部は、前記特徴量の圧縮率に基づいて、前記圧縮率を算出した前記特徴量のうち、前記圧縮率が所定値以上となる前記特徴量の圧縮方法を非圧縮に決定し、決定した前記圧縮方法を前記制御情報に含める
　請求項２に記載の情報処理装置。
　前記事前解析部は、前記ニューラルネットワークの各レイヤで処理される前記特徴量、及び前記ニューラルネットワークの各レイヤの処理におけるデータアクセス方法に基づいて、前記データアクセス方法に対応した圧縮単位での前記特徴量の圧縮方法を決定し、決定した前記圧縮方法を前記制御情報に含める
　請求項１に記載の情報処理装置。
　前記特徴量は、ｘｙ平面の特徴量をｚ方向のチャンネルごとに構成した３次元のデータであり、
　前記事前解析部は、前記特徴量の圧縮方法として、前記特徴量のデータをｘｙ平面に対応した第１の方向にまとめる第１の圧縮方法、又は前記特徴量のデータをｚ方向に対応した第２の方向にまとめる第２の圧縮方法を決定し、決定した前記圧縮方法を前記制御情報に含める
　請求項１に記載の情報処理装置。
　前記圧縮部は、
　　入力される前記特徴量のデータに対し第１の予測値を生成して、前記特徴量のデータと前記第１の予測値との差分から得られる差分情報をエントロピ符号化することで、前記特徴量を圧縮する圧縮方式を用いており、
　　前記圧縮方法に従い、前記ニューラルネットワークの各レイヤの処理におけるデータアクセス方法に対応した圧縮単位で取り出された前記特徴量のデータと前記第１の予測値との差分を算出する
　請求項５に記載の情報処理装置。
　前記復号部は、
　　入力される前記圧縮特徴量のデータをエントロピ復号して得られる前記差分情報と加算する第２の予測値を生成して、前記差分情報と前記第２の予測値を加算することで、前記圧縮特徴量を復号する復号方式を用いており、
　　前記圧縮方法に従い、前記データアクセス方法に対応した圧縮単位で前記第２の予測値を前記差分情報に加算して得られる前記特徴量のデータを並び替える
　請求項６に記載の情報処理装置。
　前記圧縮部は、前記第１の圧縮方法が指定された場合、前記特徴量のデータと同じチャンネルの前記第１の方向の予測により前記第１の予測値を生成し、前記特徴量のデータと前記第１の予測値との差分から得られる前記差分情報を、前記第１の方向にパッキングする
　請求項６に記載の情報処理装置。
　前記圧縮部は、前記第２の圧縮方法が指定された場合、前記特徴量のデータと同じチャンネルの前記第１の方向の予測により前記第１の予測値を生成し、前記特徴量のデータと前記第１の予測値との差分から得られる前記差分情報を、前記第２の方向にパッキングする
　請求項６に記載の情報処理装置。
　前記事前解析部は、前記特徴量のサンプルデータに基づいて、前記ニューラルネットワークで処理対象となる特徴量を解析して、特徴量の圧縮と復号を制御するためのパラメータを生成し、生成した前記パラメータを前記制御情報に含める
　請求項１に記載の情報処理装置。
　前記特徴量は、ｘｙ平面の特徴量をｚ方向のチャンネルごとに構成した３次元のデータであり、
　前記事前解析部は、チャンネル単位で特徴量の圧縮と復号を制御するための制御パラメータを生成し、生成した前記制御パラメータを前記制御情報に含める
　請求項１０に記載の情報処理装置。
　前記事前解析部は、前記特徴量のサンプルデータに基づいて、前記特徴量の予測値を生成する際に参照するチャンネルを示した参照チャンネルを算出し、算出した前記参照チャンネルの識別情報を前記制御パラメータに含め、
　前記圧縮部は、
　　入力される前記特徴量のデータに対し第１の予測値を生成して、前記特徴量のデータと前記第１の予測値との差分から得られる差分情報をエントロピ符号化することで、前記特徴量を圧縮する圧縮方式を用いており、
　　前記制御パラメータに従い、前記第１の予測値を生成し、
　前記復号部は、
　　入力される前記圧縮特徴量のデータをエントロピ復号して得られる前記差分情報と加算する第２の予測値を生成して、前記差分情報と前記第２の予測値を加算することで、前記圧縮特徴量を復号する復号方式を用いており、
　　前記制御パラメータに従い、前記第２の予測値を生成する
　請求項１１に記載の情報処理装置。
　前記事前解析部は、前記特徴量のサンプルデータ、及び前記参照チャンネルの識別情報に基づいて、前記参照チャンネルを参照して前記予測値を生成するための参照パラメータを算出し、算出した前記参照パラメータを前記制御パラメータに含める
　請求項１２に記載の情報処理装置。
　前記事前解析部は、前記特徴量のサンプルデータ、前記参照チャンネルの識別情報、及び前記参照パラメータに基づいて、ｘｙ平面に対応した第１の方向を参照して行う予測である第１の予測方法、ｚ方向に対応した第２の方向でチャンネル間を参照して行う予測である第２の予測方法、及び前記第１の方向と前記第２の方向の双方向を参照して行う予測である第３の予測方法を少なくとも含む予測方法の中から１つの予測方法を決定し、決定した前記予測方法を前記制御パラメータに含める
　請求項１３に記載の情報処理装置。
　前記事前解析部は、チャンネルごとに、前記参照チャンネルと、前記参照パラメータと、前記予測方法を切り替える
　請求項１４に記載の情報処理装置。
　前記事前解析部は、
　　前記特徴量のサンプルデータに基づいて、チャンネルごとのサンプルデータの統計値を解析した結果に応じた非線形変換を行うための非線形変換テーブルを選定し、
　　選定した前記非線形変換テーブルの識別情報を前記制御パラメータに含め、
　前記圧縮部は、前記非線形変換テーブルに従い、入力される前記特徴量のデータに対し非線形変換を行う
　請求項１１に記載の情報処理装置。
　前記事前解析部は、チャンネルごとに、前記非線形変換テーブルを切り替える
　請求項１６に記載の情報処理装置。
　前記事前解析部は、
　　前記特徴量のサンプルデータと前記特徴量のサンプルデータの予測値との差分である予測残差のサンプルデータに基づいて、チャンネルごとのサンプルデータの統計値を解析した結果に応じた残差非線形変換を行うための残差非線形変換テーブルを選定し、
　　選定した前記残差非線形変換テーブルの識別情報を前記制御パラメータに含め、
　前記圧縮部は、前記残差非線形変換テーブルに従い、前記特徴量のデータと、前記特徴量のデータに対して生成した予測値との差分である予測残差に対し非線形変換を行う
　請求項１１に記載の情報処理装置。
　前記事前解析部は、チャンネルごとに、前記残差非線形変換テーブルを切り替える
　請求項１８に記載の情報処理装置。
　前記事前解析部は、
　　前記特徴量のサンプルデータと前記特徴量のサンプルデータの予測値との差分である予測残差のサンプルデータに基づいて、チャンネルごとのサンプルデータの統計値を解析した結果に応じたエントロピ符号化を行うためのエントロピ符号化テーブルを選定し、
　　選定した前記エントロピ符号化テーブルの識別情報を前記制御パラメータに含め、
　前記圧縮部は、前記エントロピ符号化テーブルに従い、前記特徴量のデータと、前記特徴量のデータに対して生成した予測値との差分情報に対しエントロピ符号を行う
　請求項１１に記載の情報処理装置。
　前記事前解析部は、前記特徴量のサンプルデータを解析して、前記特徴量の圧縮モデルを複数切り替えて用いるための切り替え情報と、前記特徴量をそれぞれの前記圧縮モデルに適合させるための補正値情報とを含む圧縮パラメータを生成し、生成した前記圧縮パラメータを前記制御情報に含める
　請求項１０に記載の情報処理装置。
　前記圧縮モデルは、予測値との差分を取らずに圧縮可能とする圧縮モデルを含む
　請求項２１に記載の情報処理装置。
　前記圧縮部は、
　　前記補正値情報に基づいて、入力される前記特徴量を補正して、第１の圧縮モデル又は第２の圧縮モデルに適合させる前処理を行い、
　　前記前処理で補正した補正特徴量に対し、前記第１の圧縮モデル又は前記第２の圧縮モデルに応じた符号化を行い、
　　前記切り替え情報に基づいて、前記第１の圧縮モデル又は前記第２の圧縮モデルに応じた符号化で得られた前記圧縮特徴量を選択して前記メモリに記録する
　請求項２１に記載の情報処理装置。
　前記復号部は、
　　前記メモリに一時的に格納された前記圧縮特徴量に対し、前記第１の圧縮モデル又は前記第２の圧縮モデルに応じた復号を行い、
　　前記切り替え情報に基づいて、前記第１の圧縮モデル又は前記第２の圧縮モデルに応じた復号で得られた前記補正特徴量を選択し、
　　前記補正値情報に基づいて、選択した前記補正特徴量を、補正前の前記特徴量に戻す後処理を行う
　請求項２３に記載の情報処理装置。
　情報処理装置が、
　ニューラルネットワークを用いた推論を行う前に前記ニューラルネットワークを解析して、前記ニューラルネットワークで処理される特徴量の圧縮と復号を制御するための制御情報を生成し、
　入力データと前記ニューラルネットワークを用いた推論を行い、前記入力データから得られる前記特徴量を処理した処理結果を、演算結果として出力し、
　前記制御情報に基づいて、入力される前記特徴量を圧縮して、圧縮した前記特徴量である圧縮特徴量をメモリに記録し、
　前記制御情報に基づいて、前記メモリに一時的に記録された前記圧縮特徴量を復号して、復号した前記特徴量を出力する
　情報処理方法。
　画像データのサンプルデータに基づいて、前記画像データの圧縮を制御するための制御情報を生成する事前解析部と、
　前記制御情報に基づいて、入力される前記画像データを圧縮する圧縮部と
　を備え、
　前記事前解析部は、
　　前記画像データのサンプルデータの統計値を解析した結果に応じた非線形変換を行うための非線形変換テーブルを選定し、
　　前記画像データのサンプルデータと前記画像データのサンプルデータの予測値との差分である予測残差のサンプルデータに基づいて、サンプルデータの統計値を解析した結果に応じた残差非線形変換を行うための残差非線形変換テーブルを選定し、
　　選定した前記非線形変換テーブルと前記残差非線形変換テーブルの識別情報を前記制御情報に含め、
　前記圧縮部は、
　　入力される前記画像データに対し予測値を生成して、前記画像データと前記予測値との差分から得られる差分情報をエントロピ符号化することで、前記画像データを圧縮する圧縮方式を用いており、
　　前記非線形変換テーブルに従い、入力される前記画像データに対し、非線形変換を行い、
　　前記残差非線形変換テーブルに従い、非線形変換適用済みの前記画像データと、非線形変換適用済みの前記画像データに対して生成した前記予測値との差分である非線形変換適用済みの予測残差に対し非線形変換を行う
　情報処理装置。
　入力データとニューラルネットワークを用いた推論を行い、前記入力データから得られる特徴量を処理した処理結果を、演算結果として出力する演算部と、
　前記演算部から入力される前記特徴量を圧縮して、圧縮した前記特徴量である圧縮特徴量をメモリに記録する圧縮部と、
　前記メモリに一時的に記録された前記圧縮特徴量を復号して、復号した前記特徴量を前記演算部に出力する復号部と
　を備え、
　前記特徴量は、ｘｙ平面の特徴量をｚ方向のチャンネルごとに構成した３次元のデータであり、
　前記圧縮部は、
　　入力される前記特徴量のデータに対し予測値を生成して、前記特徴量のデータと前記予測値との差分から得られる差分情報をエントロピ符号化することで、前記特徴量を圧縮する圧縮方式を用いており、
　　前記特徴量の圧縮方法として、前記特徴量のデータをｚ方向に対応した第２の方向にまとめる圧縮方法が設定された場合、前記特徴量のデータと同じチャンネルのｘｙ平面に対応した第１の方向の予測により前記予測値を生成し、前記特徴量のデータと前記予測値との差分から得られる前記差分情報を、前記第２の方向にパッキングする
　情報処理装置。