JP2021044783A

JP2021044783A - 情報処理装置，情報処理方法および情報処理プログラム

Info

Publication number: JP2021044783A
Application number: JP2019167608A
Authority: JP
Inventors: 靖文坂井; Yasubumi Sakai; 創作森木; Sosaku Moriki
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-09-13
Filing date: 2019-09-13
Publication date: 2021-03-18
Also published as: EP3792836A1; US20210081783A1; CN112508165A; US11811427B2

Abstract

【課題】量子化されたニューラルネットワークで学習した場合の認識精度を向上させる。【解決手段】量子化対象データを構成する複数の変数要素の出現頻度の分布を取得する統計処理部１０２と、複数の変数要素の出現頻度の分布に基づき、複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット（ＭＳＢ）位置を合わせる量子化位置設定部１０３とを備える。【選択図】図２

Description

本発明は、情報処理装置，情報処理方法および情報処理プログラムに関する。

ニューラルネットワークは、生物学的脳をモデリングしたコンピュータ科学的アーキテクチャを参照する。最近、ニューラルネットワーク技術の発展により、多種の電子システムにおいて、ニューラルネットワークを活用して入力データを分析し、有効な情報を抽出する研究が活発に進められている。

ニューラルネットワークの処理装置は、複雑な入力データに対する多量の演算を必要とする。

画像処理などで顕著な成果を示しているニューラルネットワークは、その演算処理を複雑にすることで高い性能を実現している。また、ニューラルネットワークの演算処理は複雑化の傾向にある。このような演算処理の複雑化により、ニューラルネットワーク向け計算機の演算回数や必要となるメモリ量が増加している。

このように複雑化の傾向にあるニューラルネットワークの実行時間を短縮する手法として、重みや勾配などの、ニューラルネットワークに使用される変数を固定小数点に量子化する手法が知られている。

特開２０１８−１２４６８１号公報特開２０１９−３２８３３号公報特開２０１９−７９５３１号公報

しかしながら、このような従来手法で量子化されたニューラルネットワークで学習した場合の画像等の認識精度が、量子化しない場合の認識精度よりも劣化してしまうという課題がある。

１つの側面では、本発明は、量子化されたニューラルネットワークで学習した場合の認識精度を向上させることを目的とする。

このため、この情報処理装置は、量子化対象データの量子化を行なう情報処理装置であって、前記量子化対象データを構成する複数の変数要素の出現頻度の分布を取得する統計処理部と、前記複数の変数要素の出現頻度の分布に基づき、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる量子化位置設定部とを備える。

一実施形態によれば、量子化されたニューラルネットワークで学習した場合の認識精度を向上させることができる。

実施形態の一例としての計算機システムのハードウェア構成を例示する図である。実施形態の一例としての計算機システムの機能構成を例示する図である。ニューラルネットワークの概要を示す図である。固定小数点による数値を説明するための図である。実施形態の一例としての計算機システムにおける量子化位置を説明するための図である。従来の計算機システムにおける量子化位置を説明するための図である。実施形態の一例としての計算機システムの量子化位置設定部による処理を説明するためのフローチャートである。実施形態の一例としての計算機システムの量子化手法による画像認識率を例示する図である。実施形態の一例としての計算機システムの量子化手法による画像認識率を説明するための図である。

以下、図面を参照して本情報処理装置，情報処理方法および情報処理プログラムに係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。

（Ａ）構成
図１は実施形態の一例としての計算機システム１のハードウェア構成を例示する図である。

計算機システム１は、情報処理装置であって、固定小数点に量子化されたニューラルネットワークを実現する。計算機システム１は、図１に示すように、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１０，メモリ１１およびアクセラレータ１２を備える。これらのＣＰＵ１０，メモリ１１およびアクセラレータ１２は、通信バス１３を介して相互に通信可能に接続されている。通信バス１３は、本計算機システム１内のデータ通信を行なう。

メモリ１１は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）およびＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）を含む記憶メモリである。メモリ１１のＲＯＭには、量子化処理に係るソフトウェアプログラムやこのプログラム用のデータ類が書き込まれている。メモリ１１上のソフトウェアプログラムは、ＣＰＵ１０に適宜読み込まれて実行される。また、メモリ１１のＲＡＭは、一次記憶メモリあるいはワーキングメモリとして利用される。メモリ１１のＲＡＭには、重みなどの量子化に用いられるパラメータも格納される。
アクセラレータ１２は、行列演算などのニューラルネットワークの計算に必要な演算処理を実行する。

ＣＰＵ１０は、種々の制御や演算を行なう処理装置（プロセッサ）であり、実装されたプログラムに基づき、計算機システム１全体を制御する。そして、このＣＰＵ１０がメモリ１１等に格納された深層学習処理プログラム（図示省略）を実行することで、後述する深層学習処理部１００としての機能を実現する。

また、深層学習処理プログラムは量子化処理プログラムを含んで構成されてもよい。ＣＰＵ１０がメモリ１１等に格納された量子化処理プログラム（図示省略）を実行することで、後述する量子化処理部１０１としての機能を実現する。

そして、計算機システム１のＣＰＵ１０が、深層学習処理プログラム（量子化処理プログラム，情報処理プログラム）を実行することにより、深層学習処理部１００（量子化処理部１０１）として機能する。

なお、深層学習処理部１００（量子化処理部１０１，情報処理プログラム）としての機能を実現するためのプログラム（深層学習処理プログラム，量子化処理プログラム）は、例えばフレキシブルディスク，ＣＤ（ＣＤ−ＲＯＭ，ＣＤ−Ｒ，ＣＤ−ＲＷ等），ＤＶＤ（ＤＶＤ−ＲＯＭ，ＤＶＤ−ＲＡＭ，ＤＶＤ−Ｒ，ＤＶＤ＋Ｒ，ＤＶＤ−ＲＷ，ＤＶＤ＋ＲＷ，ＨＤＤＶＤ等），ブルーレイディスク，磁気ディスク，光ディスク，光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータ（計算機システム１）はその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。また、そのプログラムを、例えば磁気ディスク，光ディスク，光磁気ディスク等の記憶装置（記録媒体）に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。

深層学習処理部１００（量子化処理部１０１）としての機能を実現する際には、内部記憶装置（本実施形態ではメモリ１１のＲＡＭやＲＯＭ）に格納されたプログラムがコンピュータのマイクロプロセッサ（本実施形態ではＣＰＵ１０）によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
図２は実施形態の一例としての計算機システム１の機能構成を例示する図である。

計算機システム１は、図２に示すように、深層学習処理部１００としての機能を備える。深層学習処理部１００は、ニューラルネットワークにおける深層学習を実施する。

ニューラルネットワークは、ハードウェア回路であってもよいし、ＣＰＵ１０等によりコンピュータプログラム上で仮想的に構築される階層間を接続するソフトウェアによる仮想的なネットワークであってもよい。

図３にニューラルネットワークの概要を示す。図３に示すニューラルネットワークは、入力層と出力層との間に複数の隠れ層を含むディープニューラルネットワークである。例えば、隠れ層は、畳み込み層、プーリング層または全結合層等である。各層に示す丸印は、所定の計算をそれぞれ実行するノードを示す。

ニューラルネットワークは、例えば、画像や音声などの入力データを入力層に入力し、畳み込み層やプーリング層などで構成される隠れ層にて所定の計算を順次実行することで、演算により得られる情報を入力側から出力側に順次伝えるフォーワッド方向の処理（順伝播処理）を実行する。フォーワッド方向の処理の実行後、出力層から出力される出力データと正解データから得られる誤差関数の値を小さくするために、フォーワッド方向の処理で使用するパラメータを決定するバックワード方向の処理（逆伝播処理）とを実行する。そして、逆伝播処理の結果に基づいて重み等の変数を更新する更新処理が実行される。例えば、逆伝播処理の計算に使用される重みの更新幅を決定するアルゴリズムとして、勾配降下法が使用される。

重みの更新式を以下の式（１）に示す。
Ｗ_ｔ＋１ ← Ｗ_ｔ−η・Δｗ・・・（１）
なお、ｗ_ｔ＋１は更新後の重みであり、Ｗ_ｔは更新前の重みである。ηはニューラルネットワークの学習率である。Δｗは勾配である。

深層学習処理部１００は、量子化処理部１０１を備える。
量子化処理部１０１は、ニューラルネットワークに使用される変数を量子化する。例えば、量子化処理部１０１は、上述した勾配Δｗを量子化する。

また、量子化処理部１０１は、変数を表現するデータ型を変更して量子化を行なう機能を備える。量子化処理部１０１は、浮動小数点タイプの変数を固定小数点タイプの変数に変換してもよい。
例えば、量子化処理部１０１は、例えば、３２ビット浮動小数点数から8ビット固定小数点数に変更してもよい。
また、本計算機システム１において、量子化処理部１０１は、統計処理部１０２および量子化位置設定部１０３としての機能を備える。

統計処理部１０２は、量子化対象のデータのビットの分布について統計情報を取得する。例えば、統計処理部１０２は、量子化対象である勾配Δｗの値の出現頻度を計数する。統計処理部１０２は、固定小数点による勾配Δｗの値の出現頻度を計数する。

統計処理部１０２は、量子化対象データを構成する複数の変数要素の出現頻度の分布を取得する。なお、量子化対象データを構成する複数の変数要素の出現頻度の分布は既知の手法で取得することができ、その説明は省略する。
量子化位置設定部１０３は、量子化位置を設定する。

図４は固定小数点による数値を説明するための図である。
この図４においてはビット幅が８ビットであり、小数点ビット幅が３ビットの固定小数点＜８，３＞の構成を例示する。
この図４に例示する固定小数点＜８，３＞は、以下の式（２）で表される。

上記式（２）において、最後尾にある“2^(-3)”の指数部分である“-3”が小数点ビット幅に相当し、量子化の分解能を示す。そして、この小数点ビット幅で決まる“-3”が量子化位置に相当する。量子化位置を量子化範囲といってもよい。

図５は実施形態の一例としての計算機システム１における量子化位置を説明するための図である。図５においては、量子化前の変数の分布を線グラフで示す。この図５に例示する分布図において、横軸は量子化対象の変数要素（底を２とする対数値）を表し、図中右側が上位のビット位置（大きい値）を示す。すなわち、図５においては、量子化対象データを構成する複数の変数要素の出現頻度の分布を示し、横軸は量子化対象である勾配Δｗの変数要素（底を２とする対数値）を表す。また、縦軸は出現頻度（度数）を表す。

量子化位置設定部１０３は、学習率ηが所定の閾値Ｔよりも小さい場合に、勾配Δｗについての量子化範囲を、当該量子化範囲のＭＳＢ（ＭｏｓｔＳｉｇｎｉｆｉｃａｎｔＢｉｔ：最上位ビット）が、量子化前の変数要素の分布における最大値（量子化最大値）よりも小さい値に合わせる（設定する）。なお、学習率ηの閾値Ｔは、システム管理者等により予め設定され、メモリ１１の所定の記憶領域に予め記憶させてもよい。

図５に示す例においては、量子化位置設定部１０３は、量子化範囲を、当該量子化範囲のＭＳＢ（図５中の符号Ｐ１参照）が、量子化前の変数要素の分布における最大値（量子化最大値:図５中の符号Ｐ２参照）よりも８ビット小さい値になるように（ずらして）設定している。

この図５に示す量子化前の変数要素の分布において、量子化位置よりも右側の領域（図５中の斜線を付した領域）は、量子化範囲から外れる値（量子化範囲外）を示す。量子化位置設定部１０３は、量子化範囲から外れる値を量子化後の最上位ビット位置となるように量子化位置を設定する。

量子化位置設定部１０３がこのように量子化位置を設定することにより、量子化処理部１０１による量子化を行なうことで、量子化前の変数要素のうちＭＳＢを先頭とする少なくとも１つの値が量子化範囲外となる。すなわち、量子化前の変数要素のうち大きい方から数えて一つ以上の値が量子化範囲外となる。

なお、量子化前の変数要素の分布に対する量子化位置をずらす量は適宜変更して実施することができる。また、この量子化位置をずらす量はメモリ１１等の所定の記憶領域に予め記憶されている。

また、この量子化範囲外となった変数要素については、例えば、四捨五入を行なうことで量子化範囲にその一部を含めるよう丸めてもよい。これにより、量子化前の変数要素のうち大きい値が量子化範囲の値に丸められる。

なお、量子化位置設定部１０３は、Δw以外のニューラルネットワーク内の変数（例えば、重み，活性や重み更新に用いない勾配）の小数部は、量子化前の値の最大値が量子化位置のＭＳＢとなるように設定してもよい。
ここで、従来の量子化手法における量子化位置を説明する。

図６は従来の計算機システムにおける量子化位置を説明するための図である。図６においても、量子化前の変数の分布を線グラフで示す。この図６に例示する分布図において、横軸は量子化対象の変数要素（底を２とする対数値）を表し、図中右側が上位のビット位置（大きい値）を示す。すなわち、図６においては、横軸は量子化対象である勾配Δｗの変数要素（底を２とする対数値）を表す。また、縦軸は出現頻度（度数）を表す。
従来の量子化手法においては、量子化範囲を、当該量子化範囲のＭＳＢが、量子化前の変数要素の分布におけるＭＳＢに合わせる（設定する）。

図６に示す例においては、量子化範囲が、当該量子化範囲のＭＳＢ（図６中の符号Ｐ３参照）が、量子化前の変数要素の分布における最大値（量子化最大値：図６中の符号Ｐ４参照）となるように設定している。

これにより、量子化を行なうことで、量子化前の変数要素のうち値が小さい方から少なくとも１つの値が量子化範囲外となる。すなわち、量子化前の変数要素のうち小さい方から数えて一つ以上の値が量子化範囲外となる。

また、この量子化範囲外となった変数要素については、例えば、四捨五入を行なうことで量子化範囲にその一部を含めるよう丸めてもよい。これにより、量子化前の変数要素のうち小さい値が量子化範囲の値に丸められる。

（Ｂ）動作
上述の如く構成された実施形態の一例としての計算機システム１の量子化位置設定部１０３による処理を、図７に示すフローチャート（ステップＳ１〜Ｓ３に従って説明する）。以下の処理は、量子化処理部１０１が勾配Δｗを固定小数点に量子化する際に行なわれる。

ニューラルネットワークの学習時、すなわち、重みの更新時において、量子化位置設定部１０３は、学習率ηが予め規定された閾値Ｔ以上であるかを確認する（ステップＳ１）。

確認の結果、学習率ηが予め規定された閾値Ｔ以上である場合には（ステップＳ１のＹＥＳルート参照）、量子化位置設定部１０３は、量子化範囲を、当該量子化範囲のＭＳＢが量子化最大値に一致するように設定する（ステップＳ２）。

一方、ステップＳ１の確認の結果、学習率ηが予め規定された閾値Ｔ未満である場合には（ステップＳ１のＮＯルート参照）、量子化位置設定部１０３は、量子化範囲を、当該量子化範囲のＭＳＢが量子化最大値よりも小さな値に設定する（ステップＳ３）。

その後、量子化処理部１０１は、量子化位置設定部１０３によって設定された量子化位置に対して量子化を実行する。なお、量子化処理部１０１による量子化処理は既知の手法により実現することができ、その説明は省略する。

（Ｃ）効果
このように、実施形態の一例としての計算機システム１によれば、量子化位置設定部１０３が、量子化対象データを構成する複数の変数要素の出現頻度の分布において、最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット（ＭＳＢ）位置を合わせる。これにより、ニューラルネットワークを量子化して学習させても、量子化しない場合に比べて、画像等の認識率の劣化量が低減される。
図８は実施形態の一例としての計算機システム１の量子化手法による画像認識率を例示する図である。

この図８においては、量子化しない場合（fp32），従来手法を用いて量子化した場合と、本計算機システム１の量子化手法を用いて量子化した場合との、各場合について学習結果（認識率）をそれぞれ図示している。

ここで、従来手法とは、量子化範囲を、当該量子化範囲のＭＳＢが量子化最大値に一致するように設定する手法であり、本計算機システム１の量子化手法とは、量子化範囲を、当該量子化範囲のＭＳＢが量子化最大値よりも小さな値に設定する手法である。特に、この図８に例示する比較結果において、量子化した場合（本発明）は、量子化位置のＭＳＢが量子化最大値よりも８ビット小さな値となるように量子化位置を設定した場合を示す。

この図に示すように、従来手法を用いて量子化した場合の認識率は、量子化しない場合に比べて著しく低下している。これに対して、本計算機システム１の量子化手法においては、量子化しない場合に比べて認識率が同等となっていることがわかる。

すなわち、本計算機システム１によれば、ニューラルネットワークを量子化して学習させても、認識率は量子化しない場合と同等にすることができ、信頼性を向上させることができる。
図９は実施形態の一例としての計算機システム１の量子化手法による画像認識率を説明するための図である。

この図９においては、学習率が大きい場合における認識率と、学習率が小の場合における認識率とを示している。学習率が大きい場合は、前述した閾値Ｔよりも大きい状態を含み、学習率が小さいは、前述した閾値Ｔ以上であることを含む。

本計算機システム１は、学習率が閾値Ｔよりも小さい場合に、Δｗの小数部を小さくする（図９中の右側参照）。すなわち、量子化範囲を、当該量子化範囲のＭＳＢが量子化最大値よりも小さな値に設定する。これにより、学習率が小である場合において、量子化しない場合と同等の認識率を得ることができる。

また、本計算機システム１は、学習率が閾値Ｔよりも大きい場合には、Δｗの小数部を小さくする（図９の左側参照）。すなわち、学習率が大きい場合には、量子化範囲を、当該量子化範囲のＭＳＢが量子化最大値に一致するように設定する。これにより、認識率は従来手法と同等となる。

（Ｄ）その他
開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。

上述した実施形態では、量子化処理部１０１（量子化位置設定部１０３，統計処理部１０２）としての機能をＣＰＵ１０がプログラムを実行することで実現しているが、これに限定されるものではない。量子化処理部１０１（量子化位置設定部１０３，統計処理部１０２）の少なくとも一部の機能を電子回路によって実現してもよく、種々変形して実施することができる。

上述した実施形態においては、量子化位置設定部１０３が、学習率ηが閾値Ｔ未満であることを検知したタイミングで、量子化範囲を当該量子化範囲のＭＳＢが量子化最大値よりも小さな値に設定しているが、これに限定されるものではない。量子化位置設定部１０３は、学習率ηが閾値Ｔ未満であることを検知した後、少し遅れたタイミングで（例えば、１または２エポック後）に、量子化範囲の位置決めを行なってもよい。これにより学習速度を向上させることができるという効果を奏することができる。

また、上述した実施形態においては、量子化処理部１０１が、フォーワッド方向における演算に用いる重みの勾配ｗの量子化を行なう例を示したが、これに限定されるものではなく、種々変更して実施することができる。例えば、バックワード方向における演算に用いる勾配の量子化に適用してもよく、これにより、実装が容易になるという効果を奏することができる。

上述した実施形態においてはニューラルネットワークを画像認識に用いる例について示したが、これに限定されるものではなく、適宜変更して実施することができる。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。

（Ｅ）付記
以上の実施形態に関し、さらに以下の付記を開示する。

（付記１）
量子化対象データの量子化を行なう処理を実行するプロセッサを有する情報処理装置であって、
前記プロセッサは、
前記量子化対象データを構成する複数の変数要素の出現頻度の分布を取得し、
前記複数の変数要素の出現頻度の分布に基づき、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる、処理を行なうことを特徴とする、情報処理装置。

（付記２）
前記合わせる処理が、
量子化範囲から外れる値を量子化後の最上位ビット位置となるように処理する
ことを特徴とする、付記１記載の情報処理装置。

（付記３）
前記量子化対象データが、ニューラルネットワークの重みの更新に使用する勾配である
ことを特徴とする、付記１または２記載の情報処理装置。

（付記４）
ニューラルネットワークの学習率が所定の閾値よりも小さい場合に、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる
ことを特徴とする、付記１〜３のいずれか１項に記載の情報処理装置。

（付記５）
情報処理装置が、量子化対象データの量子化を行なうに際して、
前記量子化対象データを構成する複数の変数要素の出現頻度の分布を取得する処理と、
前記複数の変数要素の出現頻度の分布に基づき、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる処理と
を備えることを特徴とする、情報処理方法。

（付記６）
量子化範囲から外れる値を量子化後の最上位ビット位置となるように処理する
ことを特徴とする、付記５記載の情報処理方法。

（付記７）
前記量子化対象データが、ニューラルネットワークの重みの更新に使用する勾配である
ことを特徴とする、付記５または６記載の情報処理方法。

（付記８）
ニューラルネットワークの学習率が所定の閾値よりも小さい場合に、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる
ことを特徴とする、付記５〜７のいずれか１項に記載の情報処理方法。

（付記９）
量子化対象データの量子化を行なう情報処理装置のプロセッサに、
前記量子化対象データを構成する複数の変数要素の出現頻度の分布を取得し、
前記複数の変数要素の出現頻度の分布に基づき、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる
処理を実行させる、情報処理プログラム。

（付記１０）
量子化範囲から外れる値を量子化後の最上位ビット位置となるように
前記プロセッサに処理を実行させる、付記９記載の情報処理プログラム。

（付記１１）
前記量子化対象データが、ニューラルネットワークの重みの更新に使用する勾配である
ことを特徴とする、付記９または１０記載の情報処理プログラム。

（付記１２）
ニューラルネットワークの学習率が所定の閾値よりも小さい場合に、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる
処理を実行させる、付記９〜１１のいずれか１項に記載の情報処理プログラム。

１計算機システム
１０ＣＰＵ
１１メモリ
１２アクセラレータ
１３通信バス
１００深層学習処理部
１０１量子化処理部
１０２統計処理部
１０３量子化位置設定部

Claims

量子化対象データの量子化を行なう処理を実行するプロセッサを有する情報処理装置であって、
前記プロセッサは、
前記量子化対象データを構成する複数の変数要素の出現頻度の分布を取得し、
前記複数の変数要素の出現頻度の分布に基づき、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる、処理を行なうことを特徴とする、情報処理装置。
前記合わせる処理が、
量子化範囲から外れる値を量子化後の最上位ビット位置となるように処理する
ことを特徴とする、請求項１記載の情報処理装置。
前記量子化対象データが、ニューラルネットワークの重みの更新に使用する勾配である
ことを特徴とする、請求項１または２記載の情報処理装置。
ニューラルネットワークの学習率が所定の閾値よりも小さい場合に、前記量子化位置設定部が、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる
ことを特徴とする、請求項１〜３のいずれか１項に記載の情報処理装置。
量子化対象データの量子化を行なうに際して、
前記量子化対象データを構成する複数の変数要素の出現頻度の分布を取得する処理と、
前記複数の変数要素の出現頻度の分布に基づき、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる処理と
を備えることを特徴とする、情報処理方法。
量子化対象データの量子化を行なう情報処理装置のプロセッサに、
前記量子化対象データを構成する複数の変数要素の出現頻度の分布を取得し、
前記複数の変数要素の出現頻度の分布に基づき、前記複数の変数要素のうち最大値の変数要素よりも小さい変数要素に量子化位置の最上位ビット位置を合わせる
処理を実行させる、情報処理プログラム。