TW201918939A

TW201918939A - 用於學習低精度神經網路的方法及裝置

Info

Publication number: TW201918939A
Application number: TW107124493A
Authority: TW
Inventors: 崔裕鎭; 正元李; 哈米莫斯塔法伊爾
Original assignee: 南韓商三星電子股份有限公司
Priority date: 2017-11-07
Filing date: 2018-07-16
Publication date: 2019-05-16
Also published as: US11270187B2; KR102672004B1; KR20190051755A; TWI775898B; US20190138882A1; CN109754063A

Abstract

本發明提供一種方法。所述方法包括：選擇神經網路模型，其中所述神經網路模型包括多個層，且其中所述多個層中的每一者包括權重及啟動；通過將多個量化層***到所述神經網路模型內來修改所述神經網路模型；將成本函數與經修改的所述神經網路模型進行關聯，其中所述成本函數包括與第一正規化項對應的第一係數，且其中所述第一係數的初始值是預定義的；以及訓練經修改的所述神經網路模型，以通過增大所述第一係數來產生層的量化權重，直到所有權重均被量化且所述第一係數滿足預定義的閾值為止，更包括優化所述量化權重的權重縮放因數及優化量化啟動的啟動縮放因數，且其中所述量化權重是使用經優化的所述權重縮放因數進行量化。

Description

合併權重量化與啟動量化之低準度神經網路之學習方法與裝置

本揭露大體來說涉及神經網路，且更具體來說，涉及將權重量化與啟動量化進行組合的用於學習低精度神經網路的方法及裝置。

深度神經網路近來在許多電腦視覺任務（例如，圖像分類、物件檢測、語義分割（semantic segmentation）及超解析度（super resolution））中實現了主要的性能突破。最先進的神經網路的性能得益於非常深的及過度參數化的多層架構。目前，通常在多於一百個層中存在數百萬或數千萬個參數。然而，在大量層中增加網路參數的數目需要使用高性能向量計算處理器，例如配備有大量記憶體的圖形處理單元（graphics processing unit，GPU）。此外，當對高解析度圖像及尺寸增大的視頻進行處理時，對計算能力及記憶體資源的需求迅速增長。

近來，深度神經網路的低精度實施方式受到極大的關注，特別是對於資源受限器件（例如，由電池供電的移動器件或可攜式器件）上的深度神經網路的部署而言。在這種平臺中，記憶體及能力是有限的。此外，可能不支持基本浮點算數運算（floating-point arithmetic operation）。低精度權重（例如，參數）及啟動（例如，特徵圖）降低了計算成本並且降低了記憶體要求。由此，當計算預算和電力預算有限時，低精度權重及啟動是優選的，且有時需要以降低的功耗進行高效處理。通過使用較小位元寬度的低精度權重及啟動而不使用較大位元寬度的全精度值也可減少記憶體負擔。

根據一個實施例，一種方法包括：選擇神經網路模型，其中所述神經網路模型包括多個層，且其中所述多個層中的每一者包括權重及啟動；通過將多個量化層***到所述神經網路模型內來修改所述神經網路模型；將成本函數與經修改的所述神經網路模型進行關聯，其中所述成本函數包括與第一正規化項對應的第一係數，且其中所述第一係數的初始值是預定義的；以及訓練經修改的所述神經網路模型，以通過增大所述第一係數來產生層的量化權重，直到所有權重均被量化且所述第一係數滿足預定義的閾值為止，更包括優化所述量化權重的權重縮放因數以及優化量化啟動的啟動縮放因數，且其中所述量化權重是使用經優化的所述權重縮放因數進行量化。

根據一個實施例，一種裝置包括：選擇器，被配置成選擇神經網路模型，其中所述神經網路模型包括多個層，且其中所述多個層中的每一者包括權重及啟動；***器件，被配置成通過將多個量化層***到所述神經網路模型內來修改所述神經網路模型；關聯器件，被配置成將成本函數與經修改的所述神經網路模型進行關聯，其中所述成本函數包括與第一正規化項對應的第一係數，且其中所述第一係數的初始值是預定義的；以及訓練器件，被配置成訓練經修改的所述神經網路模型，以通過增大所述第一係數來產生層的量化權重，直到所有權重均被量化且所述第一係數滿足預定義的閾值為止，且優化所述量化權重的權重縮放因數以及優化量化啟動的啟動縮放因數，其中所述量化權重是使用經優化的所述權重縮放因數進行量化。

在下文中，參照附圖詳細闡述本揭露的實施例。應注意，相同的元件將由相同的參考編號指示，儘管它們示出在不同的圖式中。在以下說明中，提供例如詳細配置及元件等具體細節僅是為了幫助全面理解本揭露的實施例。因此，對所屬領域中的技術人員應顯而易見，在不背離本揭露的範圍的條件下可對本文所述的實施例作出各種改變及修改。另外，為清晰及簡潔起見，省略對眾所周知的功能及構造的說明。以下所述的用語是考慮到本揭露中的功能而定義的用語，且可根據使用者、使用者的意圖或習慣而有所不同。因此，這些用語的定義應基於本說明書通篇的內容來確定。

本揭露可具有各種修改及各種實施例，以下參照附圖詳細闡述其中的一些實施例。然而應理解，本揭露並非僅限於所述實施例，而是包括處於本揭露的範圍內的所有修改、等效形式及替代形式。

儘管可能使用包括例如“第一（first）”、“第二（second）”等序數詞的用語來闡述各種元件，但結構元件不受這些用語限制。這些用語僅用於區分各個元件。舉例來說，在不背離本揭露的範圍的條件下，“第一結構元件”可被稱為“第二結構元件”。相似地，“第二結構元件”也可被稱為“第一結構元件”。本文中所用的用語“和/或（and/or）”包括一個或多個相關項的任意及所有組合。

本文中所用的用語僅用於闡述本揭露的各種實施例，而並非旨在限制本揭露。除非上下文清楚地另外指明，否則單數形式旨在包括複數形式。在本揭露中，應理解，用語“包括（include）”或“具有（have）”指示特徵、數目、步驟、操作、結構元件、部件或其組合的存在，而不排除一個或多個其他特徵、數位、步驟、操作、結構元件、部件或其組合的存在或添加的可能。

除非進行不同地定義，否則本文中所用的所有用語具有與本揭露所屬領域中的技術人員所理解的含意相同的含意。例如在常用字典中所定義的用語等用語應被解釋為具有與相關技術領域中的上下文含意相同的含意，且除非在本揭露中進行清楚定義，否則不應將其解釋為具有理想化或過於正式的含意。

根據一個實施例，本系統及方法獲得具有量化權重及量化啟動（例如，特徵圖）的低精度神經網路。量化權重及量化啟動由低精度（例如，較低位元寬度）的固定點數表示。在神經網路的每一個層中分別為權重及啟動定義共用縮放因數（common scaling factor）以涵蓋權重及啟動的對於每一個層均發生變化的動態範圍。本系統及方法提供權重量化及啟動量化。

對於權重量化而言，本系統在神經網路的每一個層中以權重的均方量化誤差（mean square quantization error，MSQE）的正規化係數對神經網路進行訓練。根據一個實施例，正規化係數是可學習參數。在初始時，可將正規化係數設定成小的且對高精度（例如，較大位元寬度）模型進行訓練。隨著訓練繼續進行，本系統逐漸增大正規化係數以使正規化係數迫使權重越來越被量化。本系統在正規化係數變得足夠大而使開始時為高精度模型的經訓練模型收斂到僅具有量化權重的低精度模型時完成網路訓練。在訓練期間，每一個層中的權重的縮放因數也是可學習的以使本系統對縮放因數進行優化來將MSQE最小化。

對於啟動（例如，特徵圖）量化而言，本系統包括量化層。量化層是輸出輸入的量化值的非線性層。類似于權重量化，在每一個層中定義啟動的可學習縮放因數，且在訓練期間優化所述可學習縮放因數。將每一個層中的啟動的MSQE最小化以進行優化。量化層在訓練期間產生量化啟動且權重是基於量化啟動進行優化。相反，權重不在訓練反覆運算期間被量化，而是隨著由於MSQE正規化及增大的正規化係數繼續進行訓練，每一權重會逐漸收斂到量化值。

通過將權重量化過程與啟動量化過程進行組合，本系統提供用於學習低精度神經網路的統一訓練方法。根據一個實施例，除了用於低精度神經網路的本訓練過程之外，本系統及方法還提供對可應用的權重及啟動的2的冪縮放因數進行的正規化。當2的冪縮放由位移來實施而非由標量乘法來實施時，2的冪縮放在計算上可為有利的。

根據一個實施例，本系統關注具有量化權重及量化啟動（例如，特徵圖）的低精度神經網路。每一個層中的量化權重及量化啟動分別由相似位元寬度的低精度固定點數（low-precision fixed-point number）表示。在神經網路的每一個層中分別另外地定義權重及啟動的共用縮放因數以涵蓋權重及啟動的對於每一個層均發生變化的動態範圍。縮放因數是量化單元大小（quantization cell size），其對於線性量化而言是固定的。

低精度神經網路可由低精度固定點算數運算來實施。

圖1示出根據本揭露實施例的將權重量化與啟動量化進行組合的用於一般非線性啟動函數的低精度卷積層100的方法的示例性流程圖。

參照圖1，低精度卷積層100的固定點設計包括卷積運算101、偏置加法運算103、第一比例因數乘法運算105、非線性啟動運算107、第二比例因數乘法運算109、量化運算111及用於成本函數選擇、神經網路訓練、量化單元大小優化及權重優化的運算113。

圖1所示方法包括選擇神經網路模型，其中神經網路模型包括多個層。在實施例中，可使用選擇器來選擇神經網路模型。所述多個層中的每一者可包括權重及啟動。可通過將多個量化層***到神經網路模型內來修改神經網路模型。在實施例中，可使用***裝置來***所述多個量化層。將成本函數與經修改的神經網路模型進行關聯，其中所述成本函數包括與第一正規化項對應的第一係數，且第一係數的初始值是預定義的。在實施例中，可使用關聯裝置來將成本函數與經修改的神經網路模型進行關聯。訓練經修改的神經網路模型以通過增大第一係數來產生層的量化權重直到所有權重均被量化且第一係數滿足預定義的閾值為止，並且優化量化權重的權重縮放因數以及優化量化啟動的啟動縮放因數，其中量化權重是使用經優化的權重縮放因數進行量化。在實施例中，可使用訓練裝置來提供訓練。

權重縮放因數及啟動縮放因數可基於將最小平方量化誤差（MSQE）最小化來進行優化。

可將所述多個量化層中的每一量化層***到神經網路模型內每一個層中的每一啟動輸出之後。

成本函數可包括與第二正規化項對應的第二係數，第二正規化項基於權重縮放因數及啟動縮放因數為2的冪數。

可將量化權重、權重縮放因數及啟動縮放因數應用於固定點神經網路，其中固定點神經網路包括多個卷積層，其中所述多個卷積層中的每一者包括卷積運算，所述卷積運算被配置成接收特徵圖及量化權重。偏置加法運算可被配置成接收卷積運算的輸出、及偏置。第一乘法運算可被配置成接收偏置加法運算的輸出、及第一比例因數。啟動運算可被配置成接收第一乘法器運算的輸出。第二乘法運算可被配置成接收啟動運算的輸出及第二比例因數，且量化運算可被配置成接收第二乘法運算的輸出。

可通過以下方式訓練神經網路：通過隨機梯度下降方法來更新權重；通過隨機梯度下降方法來更新權重縮放因數；通過隨機梯度下降方法來更新啟動縮放因數；如果權重縮放因數及啟動縮放因數是2的冪，則包括隨機下降方法的附加梯度；通過隨機梯度下降方法來更新正規化係數；以及如果正規化係數大於預定常數或者所述隨機梯度下降方法的反覆運算次數大於預定限值，則結束訓練。

權重可為固定點權重。第一比例因數可為權重縮放因數與啟動縮放因數的乘積。啟動運算可為非線性啟動函數。

量化權重、權重縮放因數及啟動縮放因數可應用於固定點神經網路，其中固定點神經網路包括多個卷積層，且其中所述多個卷積層中的每一者包括卷積運算，所述卷積運算被配置成接收特徵圖及量化權重。偏置加法運算可被配置成接收卷積運算的輸出、及偏置。修正線性單元（ReLU）啟動運算可被配置成接收偏置加法運算的輸出。比例因數乘法運算可被配置成接收ReLU啟動運算的輸出及比例因數，且量化運算可被配置成接收比例因數乘法運算的輸出。

比例因數可為權重比例因數與量化比例因數的乘積。

卷積運算101接收特徵圖（例如，固定點（fixed-point，FXP）輸入）及固定點權重（例如，FXP權重）。在一個實施例中，卷積運算101是利用低精度固定點乘法器及累加器實施的。

偏置加法運算103接收卷積運算101的輸出、及偏置，並對卷積運算101的輸出與偏置求和。

對於層l ，可以權重縮放因數d _l 及輸入特徵圖縮放因數D _l _-1來對固定點權重及輸入特徵圖進行縮放。舉例來說，可由第一比例因數乘法運算105以權重縮放因數d _l 與輸入特徵圖縮放因數D _l _-1 的乘積（例如，D _l _-1 d _l ）來對偏置加法運算103的輸出進行縮放，第一比例因數乘法運算105接收偏置加法運算103的輸出、及縮放因數D _l _-1 d _l 並從偏置加法運算103的輸出與縮放因數D _l _-1 d _l 產生乘積。在一個實施例中，可通過以縮放因數D _l _-1 d _l 對偏置進行縮放來避免對偏置加法運算103的輸出進行縮放。

第一非線性啟動運算107接收第一比例因數乘法運算105的輸出。

非線性啟動運算107的輸出以縮放因數縮放因數1/D _l 進行縮放。舉例來說，第二比例因數乘法運算109接收啟動運算107的輸出、及縮放因數（例如，1/D _l ）並產生啟動運算107的輸出與縮放因數的乘積。

量化運算111將第二比例因數乘法運算109的輸出量化（例如，FXP輸出）。

運算113選擇成本函數，訓練神經網路，優化量化單元大小並優化權重。

圖2示出根據本揭露實施例的將權重量化與啟動量化進行組合的用於ReLU啟動函數的低精度卷積層200的方法的示例性流程圖。

參照圖2，低精度卷積層200包括卷積運算201、偏置加法運算203、ReLU運算205、比例因數乘法運算207、量化運算209及用於成本函數選擇、神經網路訓練、量化單元大小優化及權重優化的運算211。

卷積運算201接收特徵圖（例如，FXP輸入）及固定點權重（例如，FXP權重）。在一個實施例中，卷積運算201是利用低精度固定點乘法器及累加器實施的。

偏置加法運算203接收卷積運算201的輸出、及偏置，並對卷積運算201的輸出與偏置求和。

ReLU運算205接收偏置加法運算203的輸出。

對於層l ，可分別以縮放因數d _l 及D _l _-1來對固定點權重及輸入特徵圖進行縮放。舉例來說，可由比例因數乘法運算207以權重縮放因數d _l 與輸入特徵圖縮放因數D _l _-1 的乘積除以D _l （例如，(D _l _-1 d _l )/D _l ）來對ReLU運算205的輸出進行縮放，比例因數乘法運算207接收ReLU運算205的輸出及縮放因數D _l _-1 d _l /D _l ，並從ReLU運算205的輸出與縮放因數D _l _-1 d _l /D _l 產生乘積。也就是說，圖1中所示的兩個縮放運算在圖2中被組合成一個縮放運算。如果縮放因數是2的冪數，則可通過位移來實施縮放。相似地，可通過利用簡單矩陣乘法取代卷積來實施全連接層（fully-connected layer）。

量化運算209將比例因數乘法運算207的輸出量化（例如，FXP輸出）。

運算211選擇成本函數，訓練神經網路，優化量化單元大小並優化權重。

在低精度神經網路中，可提供並固定權重及啟動的位元寬度。可選擇用於固定點權重及啟動的縮放因數。在確定最優縮放因數的同時，本系統對低精度固定點權重進行優化。根據一個實施例，本系統及方法同時學習量化參數及量化固定點權重。

根據一個實施例，本系統及方法提供包括權重量化及啟動量化的低精度神經網路量化。

可定義量化函數。可提供用於表示每一量化值的位元數。對於位元寬度n 而言（其中n 是整數），量化函數輸出如以下方程式（1）中所示：Q_n (x ;d ) =d ·clip (round (2/d ),[-2 ⁿ ^-1 ,2 ⁿ ^-1 -1])，…(1) 其中x 是輸入且d 是量化單元大小（例如，共用縮放因數）；且捨入函數（rounding function）及裁減函數（clipping function）如以下方程式（2）及方程式（3）中所示：round (x ) =sign (x)ë|x | + 0.5û，…(2)clip (x ,[a ,b ]) = min(max (x ,a ),b )，…(3) 其中x 、a 、及b 是輸入。

對於具有L 個層的一般非線性神經網路而言，W ₁ ,W ₂ ,...,W_L 分別為層1到層L 中的權重集合，其中L 是整數。為使標注簡明起見，對於任何符號A 而言，方程式（4）均如下：，…(4)。

對於權重量化而言，本系統提供所有L 個層中的權重的MSQE的平均值的正規化項，即，如以下方程式（5）中所示：，…(5) 其中n 是低精度權重的位元寬度，d _l 是量化單元大小（即，層L 中的權重的共用縮放因數），且N 是所有L 個層中的權重的總數目，即。

根據一個實施例，本系統提供可學習正規化係數以利用以上MSQE正規化逐漸獲得量化權重。正規化係數可為另一個可學習參數。本系統從小的正規化係數（例如，預定義的正規化係數）開始，以小的性能損失來學習高精度模型。隨著訓練繼續進行，本系統增大正規化係數直到在訓練完成時存在量化權重為止。包括小的正規化係數的附加懲罰項（additional penalty term），例如，-log a，其中a是正規化係數。權重量化的成本函數如以下方程式（6）中所示：，…(6) 其中是訓練資料集X 的原始網路損失函數（original network loss function），且其中l 是為進行訓練而選擇及固定的超參數（hyper-parameter）。

本系統對網路訓練中的成本函數進行優化並更新權重、量化單元大小及可學習正規化係數。由於存在對小的a值的懲罰項即-loga（其中a使正規化項R_n 的重要性在訓練期間連續增大），此使用于權重量化的正規化增大且使權重能夠通過完成訓練而得到量化。正規化係數逐漸增大，只要網路損失函數不明顯降低即可。

對於啟動量化而言，本系統提供量化層。對於原始全精度模型而言，在需要對低精度模型進行啟動量化的任何位置（例如，在每一啟動函數之後）***用於啟動的量化層。本系統可在從1到L 的每一現存的層之後***量化層。對於來自層l 的啟動x 而言，量化層輸出Q_m (x ;D _l )，其中Q_m 是位元寬度m 的量化函數，且D _l 是層l 的輸出啟動的可學習量化單元大小（例如，共用縮放因數）。

本系統通過將層l 的輸出啟動的MSQE最小化來對D _l 進行優化，如以下方程式（7）中所示：，…(7) 其中X_l 是層l 的輸出啟動值的集合，條件是1£l £L 。此外，通過假設量化層是緊挨在第一層之前***以對網路輸入進行量化（即，其中X ₀ 是網路輸入值的集合且D ₀ 是網路輸入的量化單元大小），l 可包括l =0。

在訓練中將量化層啟動以產生量化啟動來針對量化啟動對權重進行優化。相反，權重量化方法實際上不會在訓練期間一次將權重全部量化。權重是在訓練期間逐漸被量化的，其中由於MSQE正規化，每一個權重會隨著訓練以增大的正規化係數進行而逐漸收斂到量化值。

2的冪量化單元大小（例如，共用縮放因數）當由位移實施而非由標量乘法實施時會在計算方面提供有益之處。可如以下在方程式（8）中所示來引入附加正規化項：…(8) 其中round_pow ₂ 是捨入到最接近的2的冪值的捨入函數，即，如以下方程式（9）中所示：...(9) 利用可學習正規化係數，本系統在訓練期間將量化單元大小逐漸收斂到最優的2的冪值。舉例來說，可通過對以下方程式（10）所示的成本函數進行優化來獲得以2的冪的量化單元大小進行的權重量化：，…(10) 其中l 及z 是為進行訓練而選擇及固定的超參數。相似地，可通過將啟動量化單元大小正規化到2的冪數。

圖3示出根據本揭露實施例對低精度神經網路進行權重量化及啟動量化的方法的示例性流程圖。

參照圖3，在301處，本系統選擇具有位元寬度n 及m 的神經網路模型，其中n 及m 是整數。低精度神經網路的量化方法包括分別針對低精度權重及低精度啟動來選擇具有位元寬度n 及m 的原始神經網路模型（例如，位元寬度可針對不同層而為不同的或者針對所有層為固定的）。

在303處，本系統通過***量化層對所選擇的神經網路模型進行修改。舉例來說，在每一啟動輸出之後及第一層輸入之前***量化層。

在305處，本系統選擇成本函數。舉例來說，成本函數如以下方程式（11）中所示：…(11) 其中l 及h 是在訓練之前選擇及固定的超參數。

在307處，如果量化單元大小是2的冪，則本系統在成本函數中包括附加正規化項，如以下方程式（12）中所示：，...(12) 其中z ₁ 及z ₂ 是在訓練之前選擇及固定的超參數。

在309處，本系統對網路進行訓練以產生經優化的量化單元大小。

在311處，本系統利用經優化的量化單元大小對權重進行優化。在訓練結束之後，本系統可利用經優化的量化單元大小對經訓練的權重進行量化，這是由於在訓練結束時的經訓練的權重是經量化的但仍處於高精度。從311產生的損失可為可忽略不計的，只要權重量化成功且a 變得足夠大即可。

圖4示出根據本揭露實施例的將權重量化與啟動量化進行組合的訓練低精度神經網路的方法的示例性流程圖。根據一個實施例，圖4可如由圖3中的309所表示的一樣來實施。

利用以迷你批（mini-batch）進行的隨機梯度下降，通過隨機梯度下降方法的一種來更新每一可學習參數p （例如，權重、量化單元大小、正規化係數），例如如以下方程式（13）中所示：…(13) 參照圖4，在401處，本系統利用如以下方程式（14）中所示梯度來更新中的權重：…(14) 其中B_n (δ_l ) 是線性量化單元邊界的集合，即，如以下方程式（15）中所示：…(15) 第一項可從反向傳播方法（back propagation method）獲得。

在403處，本系統利用以下方程式（16）所示梯度來更新權重量化單元大小：…(16) 其中=clip (round (w /d _l ),[-2 ⁿ ^-1 ,2 ⁿ ^-1 -1])。

在405處，本系統更新權重正規化係數a 。並非直接更新a ，本系統利用如以下方程式（17）中所示的梯度來更新g = loga ：…(17) 在407處，本系統利用以下方程式（18）所示梯度來更新啟動量化單元大小：…(18) 其中。

在409處，如果需要2的冪量化單元大小，則如以下方程式（19）及方程式（20）所示包括附加梯度：…(19)…(20) 在訓練期間，利用以下方程式（21）及方程式（22）的梯度更新w₁ = logb ₁ 及w₂ = logb ₂ 。…(21)…(22)

在411處，如果對於足夠大的預定常數A 而言a ＞A 或如果反覆運算次數大於預定數目，則訓練結束。

為能夠通過量化層進行反向傳播，當輸入處於裁剪邊界內時，本系統使用將梯度從上層傳遞到下層的直通估算器（straight-through estimator）。在裁剪邊界外部，梯度被確定成零。在量化中可使用隨機捨入而非確定性捨入來實現更好的收斂。

梯度的附加計算成本並不昂貴，且附加複雜度僅以O (N )增長，其中N 是權重的數目。因此，上述方法適用于具有數百萬或數千萬個參數的深度神經網路。

根據一個實施例，權重量化方法可擴展到包括權重修剪。也就是說，對於閾值q 而言，用於權重量化與權重修剪兩者的函數可如以下方程式（23）中一樣進行定義：…(23)

如果輸入小於閾值q ，則以上方程式（23）輸出零。否則，方程式（23）輸出輸入的量化值。接著，為了除實現權重量化之外還實現權重修剪，將以上方程式（5）中的權重正規化修改為以下方程式（24）：…(24) 其中q _l 是預定常數或每一訓練反覆運算中的權重值的函數。

舉例來說，對於每一層l 中的目標權重修剪速率r_l 而言，可從每一個層中的權重的絕對值的第r個百分位獲得閾值q _l ，閾值q _l 可在每一訓練反覆運算中更新。正規化接著迫使低於閾值q _l 的權重朝零逼近，同時將其他權重量化成它們最近的單元中心。經量化的低精度權重的大小可通過可變速率編碼（例如，赫夫曼編碼（Huffman coding）或算術編碼）得到進一步壓縮。

舉例來說，對於權重修剪而言，修剪函數可如以下方程式（25）中所示：…(25) 權重修剪正規化項可如以下方程式（26）中所示：…(26) 其中q _l 是預定常數或每一訓練反覆運算中的權重值的函數。

類似於以上方程式（24），對於每一層l 中的目標權重修剪速率r_l 而言，可從每一個層中的權重的絕對值的第r個百分位獲得閾值q _l ，且閾值q _l 可在每一訓練反覆運算中更新。正規化接著使低於閾值q _l 的權重朝零移動。

根據一個實施例，本系統提供具有量化權重及量化特徵圖的低精度神經網路。舉例來說，假設分別對每一個層中的權重及特徵圖應用共用縮放因數（即，固定量化單元大小），則經量化的權重及特徵圖由低精度的固定點數表示。由於固定點權重及特徵圖為低精度，因此本系統會降低存儲/記憶體要求降低計算成本；可使用固定點算數運算而非全精度浮點算數運算。

儘管已在本揭露的詳細說明中闡述了本揭露的某些實施例，然而在不背離本揭露的範圍的條件下可以各種形式對本揭露進行修改。因此，本揭露的範圍不應僅基於所闡述的實施例來確定，而是應基於隨附權利要求及其等效範圍來確定。

100、200‧‧‧低精度卷積層

101、201‧‧‧卷積運算

103、203‧‧‧偏置加法運算

105‧‧‧第一比例因數乘法運算

107‧‧‧非線性啟動運算/第一非線性啟動運算/啟動運算

109‧‧‧第二比例因數乘法運算

111、209‧‧‧量化運算

113、211‧‧‧運算

205‧‧‧ReLU運算

207‧‧‧比例因數乘法運算

301、303、305、307、309、311、401、403、405、407、409、411‧‧‧步驟

結合附圖閱讀以下詳細說明，以上及其他方面、特徵及本揭露某些實施例的優點將更顯而易見，在附圖中：圖1示出根據本揭露實施例的將權重量化與啟動量化進行組合的用於一般非線性啟動函數的低精度卷積層的方法的示例性流程圖。圖2示出根據本揭露實施例的將權重量化與啟動量化進行組合的用於修正線性單元（rectified linear unit，ReLU）啟動函數的低精度卷積層的方法的示例性流程圖。圖3示出根據本揭露實施例的對低精度神經網路進行權重量化及啟動量化的方法的示例性流程圖。圖4示出根據本揭露實施例的將權重量化與啟動量化進行組合的訓練低精度神經網路的方法的示例性流程圖。

Claims

一種方法，包括：選擇神經網路模型，其中所述神經網路模型包括多個層，且其中所述多個層中的每一者包括權重及啟動；通過將多個量化層***到所述神經網路模型內來修改所述神經網路模型；將成本函數與經修改的所述神經網路模型進行關聯，其中所述成本函數包括與第一正規化項對應的第一係數，且其中所述第一係數的初始值是預定義的；以及訓練經修改的所述神經網路模型，以通過增大所述第一係數來產生層的量化權重，直到所有權重均被量化且所述第一係數滿足預定義的閾值為止，更包括優化所述量化權重的權重縮放因數以及優化量化啟動的啟動縮放因數，且其中所述量化權重是使用經優化的所述權重縮放因數進行量化。
如申請專利範圍第1項所述的方法，其中優化所述權重縮放因數及所述啟動縮放因數是基於將最小平方量化誤差最小化。
如申請專利範圍第1項所述的方法，更包括：將所述多個量化層中的每一量化層***到所述神經網路模型內每一個層中的每一啟動輸出之後。
如申請專利範圍第1項所述的方法，其中所述成本函數包括與第二正規化項對應的第二係數，所述第二正規化項是基於所述權重縮放因數及所述啟動縮放因數為2的冪數。
如申請專利範圍第1項所述的方法，更包括將所述量化權重、所述權重縮放因數及所述啟動縮放因數應用於固定點神經網路，其中所述固定點神經網路包括多個卷積層，其中所述多個卷積層中的每一者包括：卷積運算，被配置成接收特徵圖及所述量化權重，偏置加法運算，被配置成接收所述卷積運算的輸出、及偏置，第一乘法運算，被配置成接收所述偏置加法運算的輸出、及第一比例因數，啟動運算，被配置成接收所述第一乘法器運算的輸出，第二乘法運算，被配置成接收所述啟動運算的輸出、及第二比例因數，以及量化運算，被配置成接收所述第二乘法運算的輸出。
如申請專利範圍第1項所述的方法，其中訓練所述神經網路包括：通過隨機梯度下降方法來更新所述權重；通過所述隨機梯度下降方法來更新所述權重縮放因數；通過所述隨機梯度下降方法來更新所述啟動縮放因數；如果所述權重縮放因數及所述啟動縮放因數是2的冪，則包括所述隨機下降方法的附加梯度；通過所述隨機梯度下降方法來更新所述第一係數；以及如果所述第一係數大於預定常數或者所述方法的反覆運算次數大於預定限值，則結束訓練。
如申請專利範圍第5項所述的方法，其中所述權重是固定點權重。
如申請專利範圍第5項所述的方法，其中所述第一比例因數是所述權重縮放因數與所述啟動縮放因數的乘積。
如申請專利範圍第5項所述的方法，其中所述啟動運算是非線性啟動函數。
如申請專利範圍第1項所述的方法，更包括將所述量化權重、所述權重縮放因數及所述啟動縮放因數應用於固定點神經網路，其中所述固定點神經網路包括多個卷積層，其中所述多個卷積層中的每一者包括：卷積運算，被配置成接收特徵圖及所述量化權重，偏置加法運算，被配置成接收所述卷積運算的輸出、及偏置，修正線性單元啟動運算，被配置成接收所述偏置加法運算的輸出，比例因數乘法運算，被配置成接收所述修正線性單元啟動運算的輸出、及比例因數，以及量化運算，被配置成接收所述比例因數乘法運算的輸出。
如申請專利範圍第10項所述的方法，其中所述比例因數是所述權重比例因數與所述量化比例因數的乘積。
一種裝置，包括：選擇器，被配置成選擇神經網路模型，其中所述神經網路模型包括多個層，且其中所述多個層中的每一者包括權重及啟動； ***器件，被配置成通過將多個量化層***到所述神經網路模型內來修改所述神經網路模型；關聯器件，被配置成將成本函數與經修改的所述神經網路模型進行關聯，其中所述成本函數包括與第一正規化項對應的第一係數，且其中所述第一係數的初始值是預定義的；以及訓練器件，被配置成訓練經修改的所述神經網路模型，以通過增大所述第一係數來產生層的量化權重，直到所有權重均被量化且所述第一係數滿足預定義的閾值為止，且優化所述量化權重的權重縮放因數以及優化量化啟動的啟動縮放因數，其中所述量化權重是使用經優化的所述權重縮放因數進行量化。
如申請專利範圍第12項所述的裝置，其中所述訓練器件還被配置成基於將最小平方量化誤差最小化來優化所述權重縮放因數及所述啟動縮放因數。
如申請專利範圍第12項所述的裝置，其中所述***器件還被包括以將所述多個量化層中的每一量化層***到所述神經網路模型內每一個層中的每一啟動輸出之後。
如申請專利範圍第12項所述的裝置，其中所述成本函數包括與第二正規化項對應的第二係數，所述第二正規化項是基於所述權重縮放因數及所述啟動縮放因數為2的冪數。
如申請專利範圍第12項所述的裝置，其中所述神經網路是固定點神經網路，所述量化權重、所述權重縮放因數及所述啟動縮放因數應用於所述固定點神經網路，其中所述固定點神經網路包括多個卷積層，其中所述多個卷積層中的每一者包括：卷積器件，被配置成接收特徵圖及所述量化權重，偏置加法器件，被配置成接收所述卷積器件的輸出、及偏置，第一乘法器，被配置成接收所述偏置加法器件的輸出、及第一比例因數，啟動器件，被配置成接收所述第一乘法器的輸出，第二乘法器，被配置成接收所述啟動器件的輸出、及第二比例因數，以及量化器件，被配置成接收所述第二乘法器的輸出。
如申請專利範圍第12項所述的裝置，其中所述訓練器件更被包括以：通過隨機梯度下降方法來更新所述權重；通過所述隨機梯度下降方法來更新所述權重縮放因數；通過所述隨機梯度下降方法來更新所述啟動縮放因數；如果所述權重縮放因數及所述啟動縮放因數是2的冪，則包括所述隨機下降方法的附加梯度；通過所述隨機梯度下降方法來更新所述第一係數；以及如果所述第一係數大於預定常數或者反覆運算次數大於預定限值，則結束訓練。
如申請專利範圍第16項所述的裝置，其中所述權重是固定點權重。
如申請專利範圍第16項所述的裝置，其中所述第一比例因數是所述權重縮放因數與所述啟動縮放因數的乘積。
如申請專利範圍第16項所述的裝置，其中所述啟動器件是非線性啟動器件。