JP2023501261A

JP2023501261A - 入力データの処理方法

Info

Publication number: JP2023501261A
Application number: JP2022525543A
Authority: JP
Inventors: ヨハネストラクスラー，; イルケイヴンデルリッチ，; スヴェンシェーンフェルド，
Original assignee: Eyyes GmbH
Current assignee: Eyyes GmbH
Priority date: 2019-11-05
Filing date: 2020-11-05
Publication date: 2023-01-18
Also published as: AU2020379943A1; EP3908984B1; EP4318317A2; KR20220089699A; EP3908984A1; WO2021089710A1; ES2974685T3; DE102019129760A1; US20220383065A1; EP4318317A3; CA3149564A1; EP4300367A2; EP3908984C0

Abstract

データを処理するためのコンピュータ実装方法であって、入力データが、フィルタ基準を定義し、複数の直列または並列フィルタリング法ステップにおいて結果データを生成する、直列に配置された複数のフィルタを使用して分析され、それによって、フィルタ基準に対応し、結果値を含む結果データが生成され、各フィルタには重み係数が対応付けられており、フィルタリング法ステップにおけるフィルタの数が一定である、コンピュータ実装方法。【選択図】図３

Description

第１の変形例では、以下に開示される本発明は、入力データを処理するためのコンピュータ実装方法であって、特に深層学習ＣＮＮにおいて、
入力データが、フィルタ基準を定義し、１つのフィルタリング法ステップまたは複数のフィルタリング法ステップにおいて結果データを生成するいくつかのフィルタを使用して分析され、
それによって、フィルタ基準に対応し、結果値を含む結果データが生成され、
少なくとも１つのフィルタに重み係数が関連付けられている、コンピュータ実装方法に関する。

第１の変形例とは独立した第２および第３の変形例では、本発明は、請求項１６および／または２３のプリアンブルの特徴を有する方法、そのような方法を実行するための論理モジュール、請求項２６のプリアンブルの特徴を有する論理モジュール、そのような論理モジュールを有する装置、方法を実行するためのコンピュータプログラム、および記憶媒体に関する。

入力データは、例えば、所定のデータまたはデータベースに記憶されたデータとすることができる。入力データはまた、センサによって判定されたデータとすることができる。第１または第２の変形例にかかる本発明にかかる方法の以下の説明は、所定のデータまたはセンサによって判定されることができるデータとしての画像データの分析に焦点を合わせている。しかしながら、第１、第２または第３の変形例にかかる本発明にかかる方法の適用は、決して画像データの分析に限定されない。

同様に、本発明にかかる方法は、第１、第２または第３の変形例にかかる他のデータにも適用されることができる。データは、動的、したがって時変データ、ならびに静的データとすることができる。動的データは、例えば、これに限定されないが、特定のパターンにしたがって内容が変化することができる、または自由に変化することができるデータとすることができる。測定されたまたは所定のデータはまた、機械の機能を記述する機械データまたは人間の行動を記述する個人データとすることができる。

現在の教示によれば、結果データは、直列に配置されたフィルタによって、または並列に配置されたフィルタによって入力データから生成されることができる。

本発明の第１の実施形態によれば、フィルタリング法ステップは、必ずしもニューラルネットワークを必要としない方法で使用されることができる。既知の例は、プレウィットフィルタリング法、ウェーブレットフィルタリング法またはフレーム理論分析法である。ニューラルネットワークが使用されない場合、これらのフィルタリング法で使用されるフィルタのパラメータは、既存の事前知識を用いて作成されなければならない。ニューラルネットワークを使用する場合、使用されるフィルタのパラメータが教示（訓練データを使用したニューラルネットワークの訓練）されることができる。

畳み込みニューラルネットワーク（ＣＮＮ）では、それぞれの分析タスクに応じて変化するいくつかのフィルタを使用して入力データが分析され、各フィルタは、少なくとも１つのフィルタ基準（フィルタパラメータとも呼ばれる）を有することが当該技術分野の背景技術によって知られている。背景技術によれば、デジタルフィルタ、数学フィルタおよびアナログフィルタ、ならびにそれらの動作モードが知られている。入力データは、隠れ層（国際公開第２０１８１１２７９５号パンフレットを参照）とも呼ばれる入力層と出力層との間に配置された層に可変数のフィルタを適用し、結果データを生成することによって修正される。結果データは、フィルタ基準に対応する結果値を含む。入力データへのフィルタの適用および結果データの生成は、フィルタに関連する重み係数によって現在の教示にしたがって重み付けされる。ＣＮＮの性質および機能は、例えばオンライン百科事典Ｗｉｋｉｐｅｄｉａおよびさらに本開示に記載されている。

当該技術分野の背景技術にかかる方法では、ニューラルネットワークが使用される場合であっても、関連性のないフィルタ基準を有する、および／または最終結果に関連性のある影響を及ぼさないフィルタを検出し、当該技術分野の背景技術にしたがって適用される方法からそれらを削除するために、さらなる計算プログラムが必要とされる。これらの関連性のないフィルタは、ＣＮＮを教示するプロセスの間に認識され、行われた削除は、そのように取り消すことはできないが、ＣＮＮは、以前に削除されたフィルタを再導入するように再教示されなければならない。当業者は、不要なフィルタを識別し、それらのフィルタを関連性のないフィルタとして分類するには計算能力が必要であることを認識するであろう。当業者は、例示的な手法として「プルーニング」または「スパイク」を知っている。

関連性がないと分類されたフィルタが適用される方法から削除されるという事実は、方法を剛性にし、技術の背景に応じてさらに適合させることができないようにする。ＣＮＮは、ＣＮＮの動作中にさらなるフィルタ特性を有するさらなるフィルタを使用してさらなる学習を実行する可能な好ましい特性を奪われ（いわゆる推論演算）、さらなるフィルタ特性を有するさらなるフィルタは、ＣＮＮを教示する以前に実行されたプロセス中に現在の教示の適用下で関連性がないと分類され、削除されている。

欧州特許第３４８０７４６号明細書は、フィルタの検出と重み係数の関連付けとの間の関連付けに基づいている。欧州特許第３４８０７４６号明細書では、連続して配置された一定数のフィルタまたは互いに並列に実行されるフィルタリング法ステップについて言及されていない。

国際公開第２０１９０７４８０４号パンフレットは、定義された数のフィルタの表示を提供していない。

米国特許出願公開第２０１９００８８７７２５号明細書では、多次元色空間の軸に応じてフィルタの数が選択される。米国特許出願公開第２０１９００８８７７２５号明細書は、結果データに対するフィルタの影響を重み付けするための重み付け係数の使用を開示していない。

米国特許出願公開第２０１９００８０５０７号明細書は、［００１３］において、多次元色空間の軸の関数としてのフィルタの数の定義について述べている。しかしながら、米国特許出願公開第２０１９００８０５０７号明細書は、特性を評価するための重み係数の使用に関するいかなる言及も含まない。多次元色空間内の軸の数が一定であり、結果的にフィルタの数が一定である、米国特許出願公開第２０１９００８０５０７号明細書に開示されている方法を繰り返す場合であっても、米国特許出願公開第２０１９００８０５０７号明細書に開示されている方法は、重み付け係数の特徴によって異なり、重み付け係数によって、結果データに対するフィルタの影響が各方法ステップにおいて制御されることができる。米国特許出願公開第２０１９００８０５０７号明細書に開示されている方法が繰り返される場合、この方法は、各方法ステップにおいて同じ結果データをもたらす。

国際公開第２０１８１０６８０５号パンフレットは、方法ステップ間の一定数のフィルタの表示を提供していない。

国際公開第２０１７１５２９９０号パンフレットは、層の削減による乗算演算の削減を目的とすることにより、静的な数のフィルタを備える、以下に開示される本発明にかかる方法の基本的な概念と矛盾する（６～７ページ）。

米国特許第６３８９４０８号明細書は、生物学的および化学的物質を検出するためのミュラー行列について述べている。これは、連続して配置された一定数のフィルタ、または互いに並列に実行されるフィルタリング法ステップを示すものではない。

欧州特許出願公開第０５６６０１５号明細書の解決手法は、互いに並列に実行される、順次配置された静的な数のフィルタまたはフィルタリング法ステップを含まない。

欧州特許第１０３９４１５号明細書では、順次配置された静的な数のフィルタまたは互いに並列に実行される静的な数のフィルタリング法ステップが参照される。

米国特許出願公開第２０１８０１３７４１４号明細書、米国特許出願公開第２０１８０１３７４１７号明細書は、当該技術分野の背景技術にかかる刊行物として知られている。米国特許出願公開第２０１８０１３７４１４号明細書の［００４４］は、深層学習ＣＮＮが入力データを処理するための少なくとも３つの層またはフィルタを含むことを定義している。米国特許出願公開第２０１８０１３７４１４号明細書、米国特許出願公開第２０１８０１３７４１７号明細書は、フィルタの順次切り替えのみを記載している。米国特許出願公開第２０１８０１３７４１４号明細書は、この方法が繰り返されるとき、一定数のフィルタの表示を提供しない。さらに、本出願は、層全体の入力データの並列化処理ではなく、ＬＫＡＭによって入力データに依存するフィルタ演算を回避することによる最適化に焦点を当てている。

現在の教示にかかる分析方法は、コンピュータ実装方法として実行される。背景技術にかかる方法を使用するニューラルネットワークにおける入力データの分析では、入力データは、いくつかのフィルタリング法ステップにおいて結果データ（出力データとも呼ばれる）を生成するいくつかのフィルタによって分析される。結果データは、結果値および応答値を含む。

当該技術分野の背景によれば、そのような分析方法は、フィルタリング法ステップ間の変動する数のフィルタによって特徴付けられる。これは、フィルタの数が方法ステップの過程で変更可能な変数であるため、コンピュータのコンピュータプロセッサをディメンジョニングするときに特に不利である。このタイプのコンピュータプロセッサは、ＡＳＩＣモジュールとして実装されることはできず、十分にディメンジョニングされた数の入力および出力を有する動作の順次処理を有する汎用プロセッサユニットによってのみ実装される。

国際公開第２０１８１１２７９５号パンフレット欧州特許第３４８０７４６号明細書国際公開第２０１９０７４８０４号パンフレット米国特許出願公開第２０１９００８８７７２５号明細書米国特許出願公開第２０１９００８０５０７号明細書国際公開第２０１８１０６８０５号パンフレット国際公開第２０１７１５２９９０号パンフレット米国特許第６３８９４０８号明細書欧州特許出願公開第０５６６０１５号明細書欧州特許第１０３９４１５号明細書米国特許出願公開第２０１８０１３７４１４号明細書米国特許出願公開第２０１８０１３７４１７号明細書

ＣｈａｒｕＣ．Ａｇｇａｒｗａｌ，ＮｅｕｒａｌＮｅｔｗｏｒｋｓａｎｄＤｅｅｐＬｅａｒｎｉｎｇ，ＳｐｒｉｎｇｅｒＩｎｔｅｒｎａｔｉｏｎａｌＰｕｂｌｉｓｈｉｎｇＡＧ２０１８，Ｃｈａｐｔｅｒ８．３．３，ｐａｇｅ３３５ｆｆ．ｓｅｋｕｓｈｏｎＡｎＯｖｅｒｖｉｅｗｏｆＡｒｉｔｈｍｅｔｉｃＡｄａｐｔａｔｉｏｎｓｆｏｒＩｎｆｅｒｅｎｃｅｏｆＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋｓｏｎＲｅ－ｃｏｎｆｉｇｕｒａｂｌｅＨａｒｄｗａｒｅ

第１、第２、および第３の変形例にかかる本発明にかかる方法は、ニューラルネットワークを使用してデータを分析する方法を、これらの構成要素の有利な特性を利用しながらＡＳＩＣ構成要素（ＡＳＩＣは特定用途向け集積回路を表す）を備えるコンピュータプロセッサによって処理されることができるように設計するという特定の目的を有する。

第１、第２、および第３の変形例にかかる本発明にかかる方法はまた、効率的な方法でリアルタイムで動的データを処理する特定の目的を有する。

ＡＳＩＣモジュールの形態の論理モジュールは、それが製造された後にＡＳＩＣの機能をもはや変更することができないという事実によって区別され、これが、ＡＳＩＣモジュールの製造コストが一般に低く、開発のための１回限りのコストが高い理由である。ＡＳＩＣモジュールは、定義された固定相互接続を有する顧客の要求にしたがって作成され、通常、それらの特定の顧客にのみ供給される。

代替的な論理モジュールは、フリープログラマブルゲートアレイ、または略してＦＰＧＡと呼ばれるが、ＦＰＧＡは、はるかに高価であり、したがって大量の構成要素には適していない。ＦＰＧＡコンポーネントは、自由にプログラム可能である。

本発明によれば、これは、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法によって達成される。

本発明にかかる方法の第１の変形例は、方法ステップにおけるフィルタの数が一定であることを特徴とする。

第１の変形例にかかる本発明にかかる方法は、各方法ステップにおける静的な数のフィルタを特徴とする。フィルタリング法ステップを実行するとき、フィルタの数は、前のフィルタリング法ステップで使用されたフィルタの数に等しい。

したがって、第１の変形例にかかる本発明にかかる方法は、関連性のないフィルタを認識および分類するプロセスが省略されているため、現在の教示にかかる前述の方法と比較して単純化を表す。固定数のフィルタはまた、固定数のフィルタが一定の変数を表すという利点を提供する。計算プロセスの継続時間は、可変数のフィルタに依存せず、一定数のフィルタに依存し、したがって計画されることができる。

第１、第２、および第３の変形例にかかる本発明にかかる方法は、コンピュータプロセッサを使用して実行されることができる。第１、第２、および第３の変形例にかかる本発明にかかる方法は、特にＡＳＩＣモジュールを備えるコンピュータプロセッサによって実行されることができる。

固定数のフィルタは、第１および／または第２の変形例にかかる本発明にかかる方法が、全てのフィルタの利用可能性のためにＣＮＮの教示中に関連性がないと分類されるさらなるフィルタによって拡張されることができるというさらなる利点を提供し、これについては、第１および／または第２の変形例にかかる本発明にかかる方法の特定の実施形態を参照して以下で説明する。したがって、第１および／または第２の変形例にかかる本発明にかかる方法は、当該技術分野の背景技術にかかる方法と比較して、変化する状況によりよく適合させることができる。

第１の変形例にかかる本明細書で説明する方法は、順次に配置されたフィルタを使用して実行されることができ、個々のフィルタリング法ステップは、順次行われる。フィルタの数が一定であるため、第１の変形例にかかる本発明にかかる方法は、フィルタリング法ステップを実行するときのフィルタの数が、前のフィルタリング法ステップにおいて使用されたフィルタの数に等しいことを特徴とする。

個々のフィルタリング法ステップは、個々のフィルタリング法ステップの結果を記憶しながら、コンピュータプロセッサを用いて実行されることができる。個々のフィルタリング法ステップはまた、それぞれ単一のプロセッサで実行されることもできる。

本明細書に開示される方法は、並列に配置されたフィルタによって実行されることができ、個々のフィルタリング法ステップは並列に行われる。個々のフィルタリング法ステップは、コンピュータプロセッサを使用して実行されることができる。個々のフィルタリング法ステップは、個々のプロセッサによって実行されることもできる。

上記で使用される「順次」および「並列」という用語は、時間的配置および空間的配置を指すことができる。

フィルタの順次配置と並列配置との組み合わせが可能である。

第１および／または第２の変形例にかかる本発明にかかる方法は、フィルタの数が方法ステップの数にわたって一定であるため、ＣＰＵ利用率またはメモリ要件などの、第１および／または第２の変形例にかかる本発明にかかる方法を実行するために必要な計算労力が、個々の方法ステップにおいて正規化されることができることを特徴とする。個々の方法ステップに必要な計算労力は、数学関数によって記述されることができる。計算労力は、特に、個々の方法ステップにわたって一定とすることができる。方法ステップのこの正規化および／または数学関数を使用して計算努力を記述する可能性はまた、本発明にかかる方法を実行するための装置の故障が第１および／または第２の変形例にしたがって容易に認識可能であるという効果を有する。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、重み係数が０であり、重み係数が当該技術分野の背景技術から知られている形態で存在することができることを特徴とすることができる。第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、重み係数の新たな定義に基づいていない。

重み係数は、重み係数が０に等しい場合、それぞれのフィルタを使用して判定された結果も０に等しくなるように、それぞれのフィルタにリンクされる。したがって、０に等しい重み係数が対応付けられたフィルタは、複数のフィルタを用いて生成される結果データに影響を与えない。

フィルタに関連する重み係数は、数学的演算または論理によってフィルタにリンクされることができる。数学的演算は、例えば、フィルタ基準と重み係数との乗算とすることができ、したがって、フィルタ基準と重み係数とが０で乗算される場合、このフィルタを使用して得ることができる結果は０に等しい。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、せいぜい、全てのフィルタが回路構成に関して常に存在するという事実を特徴とする。フィルタの影響のみが重み係数を介して制御される。

現在の教示にかかる方法とは対照的に、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、剛性構造に基づいており、したがって反復可能である。第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、剛性であり、したがって不変の特性を有するマイクロチップ上で実行されることができる。

重み係数は、現在の教示に関して非ゼロとすることができる。非ゼロの重み係数は、後述する精度の規定を参照して結果に影響を及ぼす。

重み係数は、現在の教示に関して１に等しくすることができる。

非ゼロの重み係数を指定することにより、結果データに対するそれぞれのフィルタの影響が、現在の教示と同様に定義されることができる。

１または１に近い値に等しい重み係数を指定することにより、単独で、または他の重み係数と比較して、結果データに対するそれぞれのフィルタの影響は、スケーリングされず、またはほとんどスケーリングされないままとすることができる。

本発明はまた、０に近い値を有する重み係数、したがって結果データにほとんど影響を及ぼさないそのフィルタを含むことができる。当業者は、誤差を許容しながら、結果データに影響を与えることを意図していないフィルタに関連する重み係数を０に近く、したがって非ゼロに設定することができる。結果として生じる誤差は、当該技術分野の背景技術にかかる方法を使用して判定および低減されることができる。必要に応じて、冒頭で述べた当該技術分野の背景技術にかかる方法が同様に適用されて、結果に対するフィルタの影響を評価すべきである。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、データの分析におけるフィルタの使用を提供することができる。現在の教示によれば、データの分析は、これらのフィルタおよび／またはフィルタに関連する重み係数の判定を含むＣＮＮを教示する前のプロセスを必要とする。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、フィルタ特性を有するこれらのフィルタが、ＣＮＮを教示するプロセス中に結果データに関連のない影響を及ぼし、０または０に近い重み係数を受け取ることを特徴とすることができる。本発明にかかる方法の１つの可能な実施形態では、第１および／または第２の変形例によれば、これらのフィルタは、教示プロセス中に削除されることができない。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法を使用するとき、最終結果に対するフィルタの影響がさらにレビューされることを特徴とすることができる。

そのようなレビューは、教示中に結果データに関連しないと分類され、０に等しい重み係数が与えられたフィルタに、前述のレビュー後に０に等しい重み係数が与えられるという結果をもたらすことができる。そのようなレビューはまた、教示中に関連性があると分類され、非ゼロの重み係数が与えられるフィルタに、前述のレビュー後に０に等しい重み係数が与えられるという結果を有することができる。これらの適応プロセスは、フィルタの削除のみを可能にする従来技術の方法とは対照的に、可逆的である。必要に応じて、これらの適応プロセスは、当業者によってレビューされた後にのみ実行される。

述べた入力データの分析に加えて、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法の可能な適用は、フィルタの影響または複数のフィルタの影響を非常に効率的な方法で判定することである。このレビューは、複数のフィルタから選択された重み係数が０に等しいかまたは０に近くなるように実行されることができる。ＡＳＣＩプロセッサが、第１および／または第２の変形例にかかる本発明にかかる方法を有利に実行するための計算ユニットとして、例えば、フィルタに関連付けられた２^ｎ個の重み係数を有する２^ｎ（ｎ＝１、２、３．．．；例えば、ｎ＝３による８）個のフィルタを含む場合、最終結果に対するこれらのフィルタの影響は、０に等しい２^ｎ個の重み係数を設定することによって判定されることができる。反復プロセスでは、多数のフィルタ、ここでは例えば８つのフィルタからのフィルタの影響が非常に効率的にレビューされることができる。第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、複数のフィルタから２^ｎ個のフィルタが判定され、２^ｎ個のフィルタは、結果値に大きな影響を及ぼさないことを特徴とすることができる。第１および／または第２および／または第３の変形例にかかる本発明にかかる方法とは対照的に、（「プルーニング」または「スパイク」として当業者に知られている）フィルタの最適な数を判定するための上述した方法は、結果値に有意な影響を及ぼさないフィルタに基づく。したがって、第１の変形例にかかる本発明にかかる方法は、既知の方法のさらなる発展形（例えば、「プルーニング」または「スパイク」）である。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法を使用して入力データを分析することと、フィルタの定数２^ｎのために最終結果に対するフィルタの影響をレビューすることとが、互いに独立して実行されることができる同様の方法であることを特徴とする。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、複数のフィルタから２^ｎ個のフィルタを削除するステップを含むことができる。２^ｎ個のフィルタの全てが削除された場合、この数のフィルタは、本発明にかかる方法では無効にされる。削除されるフィルタの数は、複数のフィルタの数以下とすることができる。これは、所定のコンピューティングユニットアーキテクチャを有するＡＳＩＣコンポーネントを備えるコンピューティングユニットの使用を可能にする。

重み係数は、例えば１など、ほぼ同じ値を有することができる。現在の教示を参照すると、フィルタの重み付けは、結果データが異なる重み付け係数の影響を受けるような異なる値を有するという点で達成される。

基本的に、０に近い値を有する重み係数、したがって０とは距離値だけ異なる値を有する重み値が、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法に課される精度の要件を満たすかどうかは、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法の精度に対する要件である。距離値は、精度の定義された要件に応じて定義されることができる。距離値は、数値限界を参照するだけでなく、必要な精度に関しても指定されることができる。これは、ある値に近い重み値または別の値に近い重み値にも当てはまる。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、せいぜい、全てのフィルタが回路構成に関して常に存在するという事実を特徴とする。現在の教示にかかる方法とは対照的に、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、剛性構造に基づく。第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、剛性であり、したがって不変の特性を有するマイクロチップ上で実行されることができる。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、全てのフィルタが回路構成に関して存在するという上記の基本的な考え方に基づいている。現在の教示を参照すると、フィルタは、結果データとの関連性を低くすることができる。当該技術分野の背景技術にかかる方法では、結果データとの関連性が低いこれらのフィルタは削除されるが、本発明にかかる方法では、これらのフィルタはアクティブのままであり、任意に０または０に近い重み係数に関連付けられる。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、選択されたフィルタのフィルタ基準が可変であることを特徴とすることができる。第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、ルーチン（「プルーニング」）を含むことができ、このルーチンによって、フィルタの低関連性が判定され、フィルタ基準は、このフィルタが結果データと関連性のあるフィルタ基準を含むように、反復的な方法ステップで修正される。結果データに対するフィルタの関連性は、現在の教示にかかる数学的方法を使用して判定されることができる。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、フィルタ基準がフィルタパラメータを含み、フィルタパラメータが可変であることを特徴とすることができる。フィルタパラメータは、フィルタ基準の値であり、その値は、フィルタが結果データと関連性を有するように修正されることができる。

例えば、色を分析する場合、フィルタパラメータは、ＲＧＢ値または色を記述する値とすることができる。フィルタが結果データと関連性のないＲＧＢ値を有する場合、フィルタパラメータには、異なる値が割り当てられることができる。

上述したフィルタパラメータの変化は、当該技術分野の背景から知られている、結果値に大きな影響を及ぼさないフィルタの削除の代替手段を表す。当該技術分野の背景として冒頭で既に述べたように、そのような方法は、技術用語「プルーニング」によって知られている。第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、現在の教示にかかる「プルーニング」方法によって補完されることができ、この方法にしたがって、結果値に大きな影響を与えないフィルタが削除される。個々のフィルタリング法ステップの定義されたリンクに応じて、いくつかのフィルタが削除されることができる。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、ニューラルネットワークにおけるデータを分析するための方法として特に適している。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、ニューラルネットワークを使用してデータを処理する範囲内のさらなる方法ステップによって補完されることができる。結果値は、さらなる結果値を生成するさらなる方法ステップのグループからの少なくとも１つのさらなる方法ステップにおいて処理されることができる。
－合計、
－等化、
－調整、
－プーリング。

さらなる方法ステップは、現在の教示にしたがって既知である。

本明細書に開示される本発明はまた、説明の上記の一般的な部分および図面の説明の以下に記載される方法を実行するための手段を備えるデータ処理のための装置に関する。

本明細書に開示される本発明は、データの処理が、ＡＳＣＩコンポーネントおよび／またはＦＰＧＡコンポーネントを有するコンピュータプロセッサによって実行されることを可能にする。

本明細書で開示される本発明はまた、コンピュータプログラムがコンピュータによって実行されると、コンピュータまたはコンピュータに、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法を実行させる命令を含むコンピュータ製品に関する。

本明細書で開示される本発明はまた、コンピュータによって実行されると、このコンピュータまたはコンピュータに、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法を実行させる命令を含むコンピュータ可読記憶媒体に関する。

説明の一般的な部分および実施形態によって以下に記載される方法において上述された方法に加えて、本明細書に開示される本発明はまた、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法を実行するための装置、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法を実行するための命令を含むコンピュータプログラム、ならびに第１および／または第２の変形例にかかる本発明にかかる方法を実行するためのコンピュータプログラムが記憶されているデータ媒体に関する。

第１の変形例とは独立した第２の変形例では、本発明は、請求項１６のプリアンブルの特徴を有する方法、そのような方法を実行するための論理モジュール、請求項３０のプリアンブルの特徴を有する論理モジュール、そのような論理モジュールを有する装置、方法を実行するためのコンピュータプログラム、および記憶媒体に関する。

以下の記述は、本発明にも適用され、したがって、本発明の第１および／または第２および／または第３の変形例の例示的な実施形態を表すことができる。

ニューラルネットワークは、適切な構成（これは、学習とも呼ばれる訓練プロセスを介して行われる）の後に、例えば分類を実行するために、計算的に見て順次および／または並列に配置された複数の層によってデータの入力から出力を生成する機械学習のモデルである。構成された（すなわち、訓練されている）ニューラルネットワークを使用したデータ処理の処理は推論と呼ばれる。

いわゆるディープニューラルネットワークは、入力層と出力層との間にいくつかの層（少なくとも２つの層、通常は３つ以上の層）を有し、そのそれぞれにおいて、いくつかの結果データが、入力データ（通常は層ごとに異なる入力データサイズを有する）から、線形演算によって層にそれぞれ関連付けられたいくつかのフィルタによって生成される。計算的に見て順次配置された層の場合、１つの層関数の結果データは、直後の層（少なくとも選択された層に関して、好ましくは全ての層に関して）の入力データとして、非線形活性化関数、例えばＲｅＬＵもしくは別の適切な非線形活性化関数の適用、および／またはプーリングおよび／またはダウンサンプリング法などのさらなる演算が結果データに適用されることができ、その後に結果データが入力データとして次の層に供給される。非線形活性化関数の適用は、調整プロセスとも呼ばれる。

複数の層によって、それぞれの場合に層に関連付けられたいくつかのフィルタを用いて、入力データから線形演算によってそれぞれの場合にいくつかの結果データが生成されるディープニューラルネットワークであって、第１層に関連付けられたフィルタのフィルタサイズが入力データサイズよりも小さく、フィルタがそれぞれ入力データの異なる点において線形演算を実行する（以下、そのような層が本開示では第１層と呼ばれる）ディープニューラルネットワークは、線形演算として内積が使用される場合、畳み込みニューラルネットワーク（ＣＮＮ）と呼ばれ、フィルタの繰り返し適用後に畳み込みが行われる。

ニューラルネットワークの出力層の前に、少なくとも２つの層が密接に接続されていることが多く、すなわち、前の層の全ての要素（ニューロン）が直後の層の全ての要素（ニューロン）に接続されている（いわゆる完全接続層）。これらの層を最初に説明した第１層と区別するために、互いにしっかりと接続された任意の層は、本開示では第２層と呼ばれる。少なくとも２つの第２層のうちの１つが出力層を形成することも提供されることができる。

ニューラルネットワークの入力層に供給される入力データは、以下の例が示すように、グリッドに配置されることができ、グリッドは、異なる寸法および異なる数のチャネル（データチャネルまたはチャネル）を有することができる：
－１チャネルの１Ｄグリッド：オーディオ信号の形式の入力データであり、振幅は、離散的な時間ステップに沿って表されることができる
－１チャネルの２Ｄグリッド：モノクロ画像信号の形態の入力データであり、画像信号を表すグレースケール画素は、高さおよび幅に沿って表されることができる
－３チャネルの２Ｄグリッド：カラー画像信号の形態の入力データであり、赤、緑、および青の色のうちの１つの強度は、高さおよび幅に沿って配置されることができる、チャネルごとにピクセルで表されることができる
－１チャネルの３Ｄグリッド：例えば医療イメージングなどの体積データの形態の入力データ
－３チャネルの３Ｄグリッド：カラービデオデータの形式の入力データであり、赤、緑、および青の色のうちの１つの強度は、高さおよび幅に沿って配置されることができる、チャネルごとにピクセルで表されることができ、追加の軸は時間を表す

入力データサイズは、存在するグリッド寸法およびチャネルに関連して存在する入力データの量に依存し、例えば、ｐ・ｑエントリおよびｋチャネルを有する２Ｄに存在する入力データの場合、ｐ・ｑ・ｋである。チャネル毎に、入力データサイズはｐ・ｑである。フィルタを使用することによって、異なる入力データサイズを有する入力データが１つの同じニューラルネットワークに使用されることができることに留意されたい。チャネル数は、深さ（順次配置される層の数であるニューラルネットワークの深さと混同しないようにする）と呼ばれることがあるため、入力データは、縦・横・奥行きの形式で存在すると言える。

単一のフィルタ（カーネルと呼ばれることが多い）は、それが適用される入力データと常に同じ数のチャネルを有し、通常は同じ数の次元も有するため、２Ｄ入力データの場合、通常は２Ｄフィルタが使用される（ただし、次元数の対応は必ずしも必要ではない；例えば、２Ｄ入力データの場合、１Ｄフィルタが代わりに使用されることができる）。チャネルごとのフィルタサイズ（フィルタが関連付けられている第１層に関連して、受容野サイズとも呼ばれる）は、チャネルごとの入力データサイズよりも小さく、通常ははるかに小さい（１桁以上小さい）。受容野のサイズは、フィルタが適用される入力データのどのセクションにフィルタがチャネルごとおよび適用ごとに取り込むかを示す。ｌ・ｍ個のエントリおよびｋ個のチャネルを有する２Ｄのフィルタの場合、受容野のサイズはｌ・ｍであり、フィルタサイズはｌ・ｍ・ｋである。フィルタに関しては、高さ・幅・深さの形式で存在すると言うこともできる。

受容野のサイズは、チャネル当たりの入力データサイズよりも小さいため、線形演算（フローティングウィンドウ演算）を実行するために、入力データの異なる点に全く同じフィルタが適用されることができる。密接に接続された層の間とは異なり、計算的に見てすぐ次の層の全ての要素が、計算的に見てすぐ前の層の全ての要素に接続されているわけではない。

いわゆるストライドは、１つの同じフィルタが適用される入力データの異なる点が互いにどれだけずれているかを示す。

フィルタは、少なくとも１つのフィルタパラメータ（例えば、フィルタおよび／またはバイアスパラメータのグリッド内の行列エントリ）によって特徴付けられることができ、その結果、入力データの異なる位置での１つの同じフィルタの複数の適用は、いわゆるパラメータ共有をもたらす。各実装における各チャネルについて得られた線形演算の計算結果は、結果データを形成するために全てのチャネルにわたって合計され、結果データは、計算的に見て次の層の入力データとして機能する。これは、各異なる位置で直ちにまたは後に行うことができる。

１つの同じフィルタを入力データに複数適用すること（フローティングウィンドウ演算）に関して、このフローティングウィンドウ演算は、入力データの縦および横の各深さ寸法に利用可能な部分データを列ベクトルに変換し（いわゆる平坦化）、フィルタを行列に変換することによって、単一の行列乗算として単一の作業ステップで数学的に等価に実行されることができることに留意されたい。ベクトルに行列を乗算すると、フローティングウィンドウ演算と同じ結果データが得られる。このプロセスは、当該技術分野の背景技術（例えば、「ＣｈａｒｕＣ．Ａｇｇａｒｗａｌ，ＮｅｕｒａｌＮｅｔｗｏｒｋｓａｎｄＤｅｅｐＬｅａｒｎｉｎｇ，ＳｐｒｉｎｇｅｒＩｎｔｅｒｎａｔｉｏｎａｌＰｕｂｌｉｓｈｉｎｇＡＧ２０１８，Ｃｈａｐｔｅｒ８．３．３，ｐａｇｅ３３５ｆｆ．ｓｅｃｔｉｏｎ）に対応するため、ここでは詳細に説明しない。本開示に関連して、そのような行列乗算の可能性は、フローティングウィンドウ演算が言及または説明されるときに常に含まれる。

既に説明したように、特定の次元および特定の数のチャネルを有する入力データは、入力層を介してニューラルネットワークに供給される。第１層の結果データのチャネルの数が、この第１層に関連付けられ、この第１層によって使用されるフィルタの数によって与えられることから、第１層による処理の後、結果データは、同じ次元性を有するが、通常は異なる数のチャネル（したがって、異なるデータサイズ）を有するこれらの入力データから生成される。例えば、入力層を介して供給される入力データの入力データサイズが３チャネルで３２・３２であり、１０個のフィルタが使用される場合（受容野のサイズが５・５であり、当然ながら３チャネルである場合）、この第１層の結果データは、１０チャネルで２８・２８となる。この結果データは、入力データとして計算的に見て（通常は非線形活性化関数を適用した後）、直後のさらなる第１層に利用可能にすることができる。

第１層で実行される線形演算ならびに実行される任意のプーリングおよび／またはダウンサンプリング法は、チャネル当たりのデータサイズの縮小につながる。

パディング法は、結果データのデータサイズの縮小を防止または低減するために使用されることが多い。

数学的には、ｎ個のグリッド次元およびｍ個のチャネルに存在する入力データおよび／またはフィルタは、ｎ・ｍ個のテンソルとして表されることができる。そのようなテンソルは、入力データの個々の要素の空間的関係を維持しながらベクトルとして表されることもできることに留意されたい。

通常、第１層ごとにいくつかの異なるフィルタ（例えば異なる寸法および／またはフィルタパラメータによって互いに異なる）が使用され、各フィルタのチャネルの数は、当然ながら、それぞれの第１層によって処理される入力データのチャネルの数に対応しなければならない。背景技術では、フィルタの数は、異なる第１層に対して異なる。

内積は、線形演算として使用されることが多く、第１層に関連するフィルタのフィルタサイズは、入力データサイズよりも小さく、フィルタは、それぞれ入力データ内の異なる点において線形演算を実行し、数学的に畳み込みと言うことができる。

上記の記述は、当然ながら、本発明の第１および／または第２および／または第３の変形例の範囲内でも適用可能であり、本発明の第１および／または第２および／または第３の変形例の例示的な実施形態において使用されることができる。

本発明の第２の変形例の目的は、特に、入力層と出力層との間に複数の第１層を有するニューラルネットワークによってデータを処理するためのコンピュータ実装方法であって、フィルタが、各第１層に関連付けられ、この方法が、そのようなネットワークが実装される論理モジュール、そのような論理モジュールを有する装置、方法を実行するためのコンピュータプログラム製品、およびコンピュータ可読記憶媒体を提供するために、より低いエネルギー消費および／またはより低いコストでハードウェアに実装されることができる、コンピュータ実装方法を提供することである。

この目的は、請求項１６の特徴を有するコンピュータ実装方法、そのような方法を実行するように構成された論理モジュール、請求項３０の特徴を有する論理モジュール、そのような論理モジュールを有する装置、そのような方法を実行するためのコンピュータプログラム製品、およびそのようなコンピュータプログラム製品を有するコンピュータ可読記憶媒体によって達成される。

ニューラルネットワークによってデータを処理するための本発明の第２の変形例にかかるコンピュータ実装方法は、入力層と出力層との間に複数の第１層を有するニューラルネットワークを提供し、フィルタは、複数の第１層の各第１層に関連付けられ、
－複数の第１層の各第１層において、複数の第１層のそれぞれの第１層に関連付けられたフィルタを使用して、線形演算によって入力データから１つ以上のチャネルで結果データが生成され、入力データがチャネルごとに入力データサイズを有し、
－複数の第１層の各第１層について、第１層に関連するフィルタの受容野のサイズは、フィルタがそれぞれ関連付けられ、フィルタが入力データの異なる点においてそれぞれ線形演算を実行する複数の第１層のその第１層のチャネル当たりの入力データサイズよりも小さく、
－複数の第１層のうちの少なくとも１つの第１層において、非線形活性化関数が、活性化結果データの形態の結果データを生成するために結果データに適用される。

入力層と出力層との間に存在する複数の第１層に関して、本発明の第２の変形例によれば、
－複数の第１層のうちの第１層に関連付けられたフィルタの数が、複数の第１層のうちの第１層のそれぞれについて同じであり、第１層のそれぞれにおいて、それぞれの第１層に関連付けられたフィルタのそれぞれが線形演算に使用され、
－各フィルタが、好ましくは、結果データを生成するときに、入力データの異なる点においてそれぞれのフィルタによって実行された演算の結果が考慮される程度を判定する重み係数に関連付けられる、ことが提供される。

データフローが、計算的に見て連続的に配置された一連の第１層に沿って続く場合、個々の第１層に関連付けられたフィルタの数は、したがって一定のままである。

第１層に関連付けられたフィルタの数は、入力層と出力層との間に配置された全ての第１層について同じであるため、各第１層の結果データは、同じ数のチャネルを有する。様々なフィルタの受容野も同じになるように選択される場合、フィルタサイズは一致する。

重み係数は、異なる数値を有することができる；これらは、当該技術分野の背景技術（例えば、逆伝播）に対応する方法で訓練されることができる。ニューラルネットワークの訓練が、結果データを判定するときに選択されたフィルタの計算結果が関連性を有しないことを示す場合、このフィルタには、例えば、０の数値または０に近い数値を有する重み係数が与えられる。適切な数値を選択することにより、例えばフィルタの計算結果にその重み係数を乗算することによって、選択されたフィルタの効果が固定されることができる（例えば、他のフィルタに関連してスケーリングされる）。

ニューラルネットワークが再び訓練されると、重み係数が変化する可能性がある。

本発明の有利な実施形態は、従属請求項に定義されている。

複数の第１層のうちの少なくとも第１層において、好ましくは複数の第１層において、または全ての第１層において、非線形活性化関数（例えば、ＲｅＬＵ）が、活性化結果データの形態の結果データを生成するために結果データに適用されることが実現されることができる。

複数の第１層のうちの少なくとも１つの第１層、好ましくは複数の第１層または全ての第１層において、縮小法および／またはプーリング法（例えば、最大プーリングまたは平均プーリング）および／またはダウンサンプリング法が結果データの数に適用されることが提供されることができる。

複数の第１層のうちの少なくとも１つの第１層、好ましくは複数の第１層または全ての第１層において、入力データの異なる点において実行される線形演算は内積であり、結果データは、畳み込みの結果であることが提供されることができる。この場合、少なくとも１つの第１層は、畳み込み層と呼ばれることができ、ニューラルネットワークは、畳み込みニューラルネットワーク（ＣＮＮ）と呼ばれることができる。

ニューラルネットワークは、計算的に見て複数の第１層の背後に、互いに密接に接続された少なくとも２つの第２層を有し、出力層は、計算的に見て少なくとも２つの第２層の背後に順次配置されるか、または計算的に見て最後に順次配置された第２層が出力層として形成されるかのいずれかであることが提供されることができる。

それは、複数の第１層のうちの少なくとも２つの第１層が、計算的に見て入力層と出力層との間に順次配置されるように設けられることができる。

それは、複数の第１層のうちの少なくとも２つの第１層が、計算的に見て入力層と出力層との間に並列に配置されるように設けられることができる。したがって、少なくとも２つのデータフローが並列に行われることができる。

当該技術分野の背景技術と同様に、フィルタのパラメータは、ニューラルネットワークの訓練中に教示されることができる。

第１層の入力データに対してパディング法が実行されることができる。

本発明の第２の変形例にかかる論理モジュール、特にＡＳＩＣにおいて、複数の第１層を有するニューラルネットワークのニューラルネットワーク計算を実行するための、特に本発明の第２の変形例にかかる方法を実行するための電子回路構成は、論理モジュールが製造された後にもはや変更されることができないという意味で固定されている。

そのような論理モジュールは、ニューラルネットワークに入力を供給するための少なくとも１つの信号入力と、出力を供給するための少なくとも１つの信号出力とを有する。例えば、信号入力は、適切な信号発生装置（例えば、２Ｄまたは３Ｄカメラ、マイクロフォン、非視覚または非可聴測定用のセンサなど）と直接通信することができ、あるいはメモリまたはプロセッサからデータを受信することができる。信号出力は、撮像装置、メモリ、プロセッサ、またはアクチュエータ、例えば車両と通信することができる。

そのような論理モジュールはまた、以下を有する：
－それぞれがニューラルネットワークの第１層を表す複数の第１層回路構成であって、各第１層回路構成が、入力データを受信するための少なくとも１つの信号入力と、結果データを出力するための少なくとも１つの信号出力とを有し、各第１層回路構成が、少なくとも１つの第１層を有し、各場合において、１つ以上のチャネルにおいて、線形演算によって、少なくとも１つの第１層に関連付けられたいくつかのフィルタを使用して、チャネル当たりの入力データサイズを有する入力データからいくつかの結果データが生成されることができ、少なくとも１つの第１層に関連付けられたフィルタの受容野のサイズが、少なくとも１つの第１層のチャネル当たりの入力データサイズよりも小さく、フィルタのそれぞれが、入力データの異なる点においてチャネル当たりの線形演算を実行し、第１層回路構成の全てが、少なくとも１つの第１層に関連付けられた同じ数のフィルタを有し、各第１層回路構成の少なくとも１つの第１層のそれぞれにおいて、それぞれの第１層に関連付けられたフィルタのそれぞれが、線形演算に使用され、好ましくは、各フィルタが、入力データの異なる点においてそれぞれのフィルタによって実行された演算の結果が結果データの生成において考慮される程度を判定する重み係数に関連付けられることが提供される、複数の第１層回路構成、
－信号出力に接続された出力回路構成、
－複数の層回路構成とデータ通信し、変更可能な仕様にしたがって、データフローが論理モジュールの信号入力から個々の層回路構成へと、個々の層回路構成間で、および個々の層回路構成から出力回路構成へと伝導される順序を指定するために、ニューラルネットワークのネットワークアーキテクチャを定義するように設計された少なくとも１つのスケジューラ回路構成。

そのような論理モジュールでは、論理モジュールが製造された後にはもはや変更されることができないという意味で、個々の層回路構成が固定されているニューラルネットワークが構成されるが、そのために、スケジューラ回路構成に対応する仕様によって１つの同じ論理モジュールに対して異なるネットワークアーキテクチャが実現されることができる。

信号入力からデータフローを計算的に直接受信すると考えられる第１層回路構成は、ニューラルネットワークの入力層を表す。出力回路構成は、ニューラルネットワークの出力層を表す。第１層回路構成間のデータフローは、変更可能な仕様にしたがってスケジューラ回路構成によって指定されたネットワークアーキテクチャに対応するように行われる。

本発明の第２の変形例にかかる論理モジュールの有利な実施形態は、従属請求項に定義されている。

本発明の第２の変形例にかかる論理モジュールは、好ましくは、フィルタの数（当然ながら、全ての第１層回路構成が常に同じ数のフィルタを有するように）および／またはフィルタパラメータおよび／または受容野および／または重み係数のその後の変更が必要とされないように、ニューラルネットワークの推論演算のために提供される。このため、それらは、好ましくは論理モジュール内で固定された方法で、すなわち変更不能に構成されることができる。しかしながら、これらの変数が変更されることができるように論理モジュールのＲＡＭ回路構成に記憶されることが代替的に提供されることができる。

複数の第１層回路構成のうちの少なくとも１つの第１層回路構成、好ましくは複数の第１層回路構成、または全ての第１層回路構成において、入力データの異なる点に対して実行される線形演算は、内積であり、結果データは、畳み込みの結果であることが提供されることができる。この場合、少なくとも１つの第１層回路構成は、畳み込み層回路構成と呼ばれることができ、論理モジュール内に構成されたニューラルネットワークは、畳み込みニューラルネットワーク（ＣＮＮ）と呼ばれることができる。

少なくとも１つの第１層回路構成、好ましくは複数の第１層回路構成、または全ての第１層回路構成において、以下のリストから選択される少なくとも１つ、好ましくはいくつか、または全ての機能モジュールが形成されることが提供されることができる：
－キャッシュメモリシステム、
－存在することができる任意のバイアスを除去するためのバイアスモジュール、
－調整処理を行う調整モジュール、
－プーリング法、例えば最大プーリングまたは平均プーリングを実行するためのプーリングモジュール、
－非線形活性化関数を実行して、活性化結果データの形態の結果データを生成するための活性化モジュール、
－パディング法を実行するためのパディングモジュール。

複数の第１層回路構成のうちの少なくとも１つの第１層回路構成、好ましくは複数の第１層回路構成において、または全ての第１層回路構成において、いくつかの（例えば、上記のリストで指定された機能モジュールの全て）が固定され、複数の第１層回路構成のうちの少なくとも１つの第１層回路構成において、好ましくは複数の第１層回路構成において、または全ての第１層回路構成において、機能モジュールのうちのどれがアクティブであるべきか、およびアクティブでないべきかが（例えばスケジューラを介して）指定されることができることが提供されることができる。したがって、第１層回路構成のいくつかまたは全てが同じ固定機能モジュールで構成されるが、同じ機能モジュールが全ての層の回路構成でアクティブになるように切り替えられない場合、それらの機能は、依然として互いに異なることが可能である。

以下、各機能モジュールの機能について説明する。

このキャッシュメモリシステムでは、第１層回路構成の各フィルタについて、チャネル毎にフィルタが行う線形演算の合計が、全チャネルにわたって実行されることができる。追加的または代替的に、他の第１層回路構成から到来する項など、他の項が線形演算の結果に加算されてもよい。異なる合計は、異なる第１層回路構成のキャッシュメモリ構成において提供されることができる。

バイアスモジュールでは、線形演算の結果の望ましくない数値成長を回避するために、存在する可能性があるバイアスが除去されることができる。

非線形活性化関数（例えば、ＲｅＬＵ）が調整モジュールにおいて実行されて、活性化結果データの形態の結果データを生成することができる。様々な非線形活性化関数が、異なる第１層回路構成の活性化モジュールに設けられることができる。

当該技術分野の背景技術にしたがって設計されたプーリングおよび／またはダウンサンプリング法は、プーリングモジュールで実行されることができる。異なる第１層回路構成のプーリングモジュールには、異なるプーリングおよび／またはダウンサンプリング法が設けられることができる。

ネットワークアーキテクチャは、スケジューラ回路構成によって、
－少なくとも２つの第１層回路構成が、計算的に見て入力層と出力層との間に順次配置され、および／または
－少なくとも２つの第１層回路構成が、計算的に見て入力層と出力層との間に並列に配置されるように定義されることが提供されることができる。

データフローが、第１層回路構成の少なくとも１つの機能モジュールから別の第１層回路構成の少なくとも１つの機能モジュールへと直接、すなわち、一方の第１層回路構成の信号出力を介して他方の回路構成の信号入力へ進むことなく伝導されるように、スケジューラ回路構成によってネットワークアーキテクチャが定義されることが提供されることができる。例えば、場合によっては他の第１層回路構成の線形演算の結果データとともに、第１層回路構成の線形演算の結果データが、活性化結果データの形態の結果データを生成するための非線形活性化関数を実行するための他の層回路構成内の活性化モジュールに供給されることが提供されることができる。

ネットワークアーキテクチャは、少なくとも１つの第１層回路構成がデータフローに対して２回以上トラバースされるように、すなわち、データフローが、この少なくとも１つの第１層回路構成の信号出力からこの少なくとも１つの第１層回路構成の信号出力までの計算の過程で少なくとも１回実行されるように、スケジューラ回路構成によって定義されることが提供されることができる。

密接に相互接続された第２の層を表し、出力層が、計算的に見て（すなわち、データフローに関連して）少なくとも２つの第２層の背後に順次に配置されるか、または計算的に見て最後の層が出力層として形成されるように順次に配置される、少なくとも２つの第２層回路構成が論理モジュール内に固定的に予め定められることが提供されることができる。

本発明の第２の変形例にかかる論理モジュールを有する装置では、装置上または装置内に配置された少なくとも１つの信号発生装置によって入力される少なくとも１つの信号を介して、ニューラルネットワーク計算のための入力として少なくとも１つの論理モジュールに信号が供給されることができ、少なくとも１つの論理モジュールは、装置の制御もしくは調整装置と通信するため、または装置の少なくとも１つのアクチュエータへの制御コマンドの出力のための少なくとも１つの信号出力を有することが提供される。これは、支援動作または装置の自律動作に使用されることができる。装置は、例えば、車両またはロボットとして設計されることができる。

第１および第２の変形例とは独立した第３の変形例では、本発明は、請求項２３のプリアンブルの特徴を有する方法、そのような方法を実行するための論理モジュール、そのような論理モジュールを有する装置、方法を実行するためのコンピュータプログラム、および記憶媒体に関する。

ＦＰＧＡおよびＡＳＩＣなどの論理モジュール上のニューラルネットワークの構成は、必要とされる高い計算能力および大規模なメモリ要件のために困難であることが多い。

ＩｌｋａｙＷｕｎｄｅｒｌｉｃｈ、ＢｅｎｊａｍｉｎＫｏｃｈおよびＳｖｅｎＳｃｈｏｎｆｅｌｄによる刊行物「ＡｎＯｖｅｒｖｉｅｗｏｆＡｒｉｔｈｍｅｔｉｃＡｄａｐｔａｔｉｏｎｓｆｏｒＩｎｆｅｒｅｎｃｅｏｆＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋｓｏｎＲｅ－ｃｏｎｆｉｇｕｒａｂｌｅＨａｒｄｗａｒｅ」（ｈｔｔｐｓ：／／ｗｗｗ．ｉａｒｉａ．ｏｒｇ／ｃｏｎｆｅｒｅｎｃｅｓ２０２０／ＰｒｏｇｒａｍＡＬＬＤＡＴＡ２０．ｈｔｍｌ））は、必要とされる計算能力およびメモリが少なくなるように、この移植をどのようにして達成されることができるかに関する戦略を提示している。主な焦点は、いわゆる量子化であり、ここでは、ニューラルネットワークの訓練中に浮動数演算が基本演算構造として使用され、推論演算中に整数演算が使用され、訓練中に浮動数として判定されたニューラルネットワークのパラメータ値は、スケーリングファクタとの乗算およびそれに続く整数値への丸めによって量子化される。これは、ニューラルネットワークの演算にも当てはまり、例えば、畳み込み演算はｉｎｔ３２に基づいて実行されることができ、および／または量子化された非線形活性化関数は非線形活性化関数として使用されることができる。

本発明の第１の、第２の、または第３の変形例でも使用されることができる刊行物に記載された手段は、論理モジュールの外部で訓練され、論理モジュールに移植されたニューラルネットワークの推論演算を著しく加速させた。

本発明の第３の変形例の目的は、特に、ニューラルネットワークによってデータを処理するためのコンピュータ実装方法であって、論理モジュールに実装された場合に、より高速な推論演算、そのようなニューラルネットワークが実装された論理モジュールの提供、そのような論理モジュールを有する装置、方法を実行するためのコンピュータプログラム製品、およびコンピュータ可読記憶媒体を可能にする、コンピュータ実装方法を提供することである。

この目的は、請求項２３の特徴を有するコンピュータ実装方法、そのような方法を実行するように設計された論理モジュール、そのような論理モジュールを有する装置、そのような方法を実行するためのコンピュータプログラム製品、およびそのようなコンピュータプログラム製品を有するコンピュータ可読記憶媒体によって達成される。

本発明の第３の変形例にかかる方法は、ニューラルネットワークによってデータを処理するためのコンピュータ実装方法を提供し、ニューラルネットワークが、入力層と出力層との間に複数の第１層を含み（フィルタは、複数の第１層の各第１層に関連付けられることができる）、
－複数の第１層の各第１層において、入力データから（好ましくは、複数の第１層のそれぞれの第１層に関連付けられたフィルタを使用して）線形演算によって１つ以上のチャネルで結果データが生成され、入力データがチャネルごとに入力データサイズを有し、
－（任意に、複数の第１層のうちの第１層ごとに、第１層に関連付けられたフィルタの受容野のサイズは、フィルタがそれぞれ関連付けられた複数の第１層のうちのその第１層のチャネルごとの入力データサイズよりも小さく、フィルタは、入力データの異なる点においてそれぞれ線形演算を実行する）
－複数の第１層のうちの少なくとも１つの第１層において、非線形活性化関数が、活性化結果データの形態の結果データを生成するために結果データに適用され、
－複数の第１層のうちの少なくとも１つの第１層、好ましくは複数の第１層のうちの全ての第１層における（好ましくは論理モジュールの外部で行われる）ニューラルネットワークの訓練中に、第１の画像領域を有する非線形活性化関数が活性化結果データを生成するために使用され、
－論理モジュールを使用して実行されることが好ましいニューラルネットワークの推論演算中に、複数の第１層のうちの少なくとも１つの第１層において、好ましくは複数の第１層のうちの全ての第１層において、第２の画像領域を有する非線形活性化関数が活性化結果データを生成するために使用され、第２の画像領域が第１の画像領域の真のサブセットを形成する。

第１の画像領域（すなわち、第１および第２の画像領域は同一ではない）の真のサブセットである第２の画像領域（活性化結果データが存在する）を有する非線形活性化関数の使用は、以下では「活性化クリッピング」と呼ばれる。

活性化クリッピングでは、活性化結果データの値の範囲が制限される（より大きい第１の画像領域からより小さい第２の画像領域へ）。この目的のために、例えば、「下限Ｌ」および「上限Ｕ」と呼ばれる下限および／または上限に対して値が設定される。上限および下限の数値は、例えば、符号を除いて同じであってもよく、または異なる数値を有してもよい。下限および／または上限の定義と同等に、対応する範囲が当然定義されることができる。

当業者は、達成されるべき精度を考慮して、本発明にかかる方法を実行する速度を高めるために上限および／または下限を選択する。上限が下限に近く対応するか、または上限が下限に対応するような小さい範囲を選択することは、本発明にかかる方法の精度の低下を伴う可能性がある。

例として活性化クリッピングを実行するために使用されることができる関数は、以下では「クリッピングされた」活性化関数または「クリッピング関数」と呼ばれ、ニューラルネットワークの推論演算中に上限／下限を上回る／下回る非線形活性化関数の結果データが上限／下限にマッピングされ、上限と下限との間にあるそのような結果データが変化しないように定義されることができる。この場合、上限と下限との間で、結果データは、訓練において既に選択された非線形活性化関数に対応するコースを有するが、これらの範囲外では、それぞれ選択された上限および下限の形式の定数値が存在し、その結果、クリッピングされた活性化関数の（第２の）画像領域は、訓練において使用される非線形活性化関数の（第１の）画像領域の実際のサブセットである。

Ｌ＝０およびＵ＝６を有するＲｅＬＵ－６関数など、値の範囲の下限および上限を既に含むいくつかの非線形活性化関数があることに留意されたい。しかしながら、そのような活性化関数は、既に訓練で使用されている場合、ＬＲｅＬＵなどの非線形活性化関数が訓練で使用され、クリッピングされた活性化関数が推論演算で使用される場合よりも著しく低い精度を提供する。訓練で使用される非線形活性化関数は、制限されない（第１の）画像領域を有することができる。

活性化クリッピングは、論理モジュール上に構成されたニューラルネットワークの推論演算の速度を増加させる。例えば、３２０×３２０×３の入力サイズを有するＴｉｎｙＹＯＬＯｖ３ＣＮＮを移植してカメラ画像またはビデオストリーム内のオブジェクトまたは人物を分類する場合、ＸＩＬＩＮＸＡｒｔｉｘ－７ＦＰＧＡに移植されたときに約５０％のフレームレートの増加が達成され、これは待ち時間の短縮を意味する。

異なる画像領域（例えば、訓練中のＬＲｅＬＵおよびクリッピング関数を有するＬＲｅＬＵの合成から生じる活性化関数クリップ－ＬＲｅＬＵ）を除いて同一であるニューラルネットワークの訓練中および推論演算中に非線形活性化関数を使用することが特に好ましい。

活性化クリッピングを実行するために、以下のいずれかが提供されることができる：
－第１のステップでは、第１の画像領域を有する非線形活性化関数（好ましくは訓練中に既に使用されていた活性化関数）を使用し、次いで第２のステップでは、第１の画像領域を第２の画像領域に縮小すること（すなわち、活性化後にのみクリッピングする）、または
－既に第２の画像領域（すなわち、活性化中に既にクリッピングされている活性化関数を使用して、クリッピングが別個のステップとしてもはや必要とされないようにする）を有する非線形活性化関数を直ちに使用すること。

非線形活性化関数としては、ＲｅＬＵ関数または漏洩ＲｅＬＵ関数（ＬＲｅＬＵ）が使用されることが好ましい。これらの関数は、ｔａｎｈなどの他の非線形活性化関数と比較して複雑度が低いことを特徴とし、これにより、計算コストが低くなり、固定小数点演算を有するハードウェアでの実装が容易になる。

ニューラルネットワークの訓練中に浮動数演算が使用され、これがニューラルネットワークの推論演算のための整数演算に量子化されることが提供されることができる。

ニューラルネットワークの量子化に関する上記刊行物に既に記載されているように、結果活性化データを所定の整数データ型、好ましくはｕｉｎｔ８にマッピングするマッピング演算が、第２の画像領域に位置する結果活性化データに適用されることが提供されることができる。

先に引用したニューラルネットワークの量子化に関する刊行物に既に記載されているように、線形演算（好ましくは後続の第１層に関連付けられたフィルタを使用する）によって複数の第１層のうちの後続の第１層において結果データを生成する前に、所定のデータ型にマッピングされた結果活性化データにデマッピング演算が適用されることが提供されることができる。

本発明の第１の変形例、本発明の第２の変形例および本発明の第３の変形例は、一緒に使用されることができる。本発明の１つの変形例に関してなされた記述は、本発明の他の変形例に関しても適用可能である。特に、最適な数のフィルタ（例えば、「プルーニング」または「スパイク」方法のさらなる開発）を判定するための本発明の第１の変形例に関して説明した新規な方法は、本発明の第２および／または第３の変形例でも使用されることができる。

本発明の第１および／または第２および／または第３の変形例にかかる本発明にかかる方法において使用されることができるフィルタ、例として図１に示す。本発明の第１の変形例にかかる方法は、添付の図２から図６によって説明され、本発明の第２の変形例にかかる方法、本発明にかかる論理装置、本発明の第２の変形例にかかる方法によって計算されることができ、および／または本発明にかかる論理装置に表されるニューラルネットワークの表現、および本発明にかかる論理装置を有する装置が図７から図１１に示され、本発明の第３の変形例にかかる方法が図１２から図１４に示され、図に含まれる略語は、以下の要素を示す。

ＩＤ、ＩＤ＃、ＩＤ’’ 入力データ
ＯＤ結果データ（出力データ）
ＷＦ重み係数
１（第１の）フィルタリング法ステップ
２（第２の）フィルタリング法ステップ
３結果データを入力データとしてフィードバック
４矩形
５回路
６装置
７論理モジュール
８装置の制御または調整装置
９信号発生装置
１０装置のアクチュエータ
１００ニューラルネットワーク
１０１第１層
１０２第２層
１０３入力層
１０４出力層
１０５フィルタ
２００論理モジュール
２０１第１層回路構成
２０２第２層回路構成
２０３信号入力
２０４信号出力
２０５スケジューラ回路構成
２０６ＲＡＭ回路構成
２０７キャッシュメモリシステム
２０８ＢＩＡＳモジュール
２０９調整モジュール
２１０プーリングモジュール
２１１パディングモジュール

主題は、特許請求の範囲によって定義される。図２、図３、および図４、ならびに図面の説明は、第１および／または第２および／または第３の変形例にかかる図面に示された本発明にかかる方法の実施形態を示すにすぎない。当業者は、全ての図に対する図の説明を互いに組み合わせること、または１つの図に対する図の説明を上記の説明の一般的な部分と組み合わせることができる。

当該技術分野の背景技術（方向θおよび周波数ｆを有する２Ｄガボールフィルタ）によるフィルタ基準の一例を示す図。単一チャネル２Ｄ画像内の垂直データを検出するためのフォーマット３・３・１における２Ｄフィルタ（プレウィットフィルタ）を示す図。ニューラルネットワークにおいてデータを処理するための第１および／または第２および／または第３の変形例にかかる、本発明にかかる方法の実施形態を示す図。ニューラルネットワークにおいてデータを処理するための第１および／または第２および／または第３の変形例にかかる本発明にかかる方法のさらなる実施形態を示す図。第１および／または第２の変形例にかかる本発明にかかる方法の第１の実施形態と第２の実施形態との組み合わせを示す図。フィルタの数によって統一された形式のデータの分析を示す図。第１および／または第２および／または第３の変形例にかかる方法のさらなる実施形態を示す図。本発明にかかる論理モジュール、特にＡＳＩＣを示す図。図７に示す論理モジュールのための様々な第１層回路構成の構造の例を詳細に示す図。本発明の第２の変形例にかかる方法を実行することができ、本発明にかかる論理モジュールに永続的に記憶されることができる、ＣＮＮの形態の推論演算における訓練されたニューラルネットワークの可能なアーキテクチャを示す図。本発明にかかる少なくとも１つの論理モジュールを有する車両の形態の本発明にかかる装置を示す図。本発明にかかる少なくとも１つの論理モジュールを有するロボットの形態の本発明にかかる装置を示す図。畳み込み層ＣＯＮＶ、調整層ＲＥＣＴ（非線形活性化関数が適用される）、および任意のプーリング層ＰＯＯＬを有するニューラルネットワークの第ｉの第１層を示す図。Ｌ＝－２およびＵ＝７のパラメータでクリッピングされたＬＲｅＬＵ_０．１（ｚ）の形態の非線形活性化関数の例を示す図。任意の追加のマッピングおよびデマッピング法が示されている例示的な実施形態において、クリッピングが、活性化とは別個のステップとして提供されている図。任意の追加のマッピングおよびデマッピング法が示されている例示的な実施形態において、クリッピングされた活性化関数を用いて（単一ステップで）活性化が行われている図。

図１ａは、当該技術分野の背景技術（方向θおよび周波数ｆを有する２Ｄガボールフィルタ）によるフィルタ基準の一例を示しており、このフィルタ基準は、フィルタに適用可能である。このフィルタ基準またはそのようなフィルタ基準を含むフィルタは、本発明にかかる方法の第１および／または第２および／または第３の変形例でも使用されることができる。図１ａに示すフィルタ基準の例では、出力データは、ピクセルの円錐度の関数としてフィルタ基準を含むフィルタとの重ね合わせによって入力データから判定される。図１ａに示すフィルタ基準に加えて、現在の教示にかかる他のフィルタ基準も使用されることができる。例えば、単一チャネル２Ｄ画像内の垂直データを検出するためのフォーマット３・３・１における２Ｄフィルタ（プレウィットフィルタ）を図１ｂに示す。

図２は、ニューラルネットワークにおいてデータを処理するための第１および／または第２および／または第３の変形例にかかる、本発明にかかる方法の実施形態を示している。

入力データがｉ個のフィルタ（ｉ＝１、２、３．．．）を使用して分析されることは、当該技術分野の背景において周知である。この場合、入力データは、順次配置されたフィルタによって連続的に分析され、各フィルタはフィルタ基準を有する。個々のフィルタのフィルタ基準は、有利な方法で異なることができる。

入力データＩＤは、第１のフィルタＦ１を使用した分析用の第１の入力データＩＤ１として受信され、第１の結果データＯＤ１が判定される。第ｉ－１の結果データＯＤｉ－１は、第ｉのフィルタＦｉを使用した分析用の第ｉの入力データＩｄｉとして到着し、第ｉの結果データＯＤｉが判定される。したがって、入力データＩＤは、ｉ個のフィルタのチェーンを使用して分析され、チェーンの最後に判定された結果データＯＤｉは、ｉ個のフィルタを使用するフィルタリング法ステップの結果データＯＤに対応する。

各フィルタＦｉ（ｉ＝１、２、３、．．．）には、重み係数ＷＦｉ（ｉ＝１、２、３、．．．）が対応付けられている。例えば、第１のフィルタＦ１には、第１の重み係数ＷＦ１が対応付けられている。第ｉの重み係数ＷＦｉ（ｉ＝１、２、３、．．．）は、第ｉのフィルタＦｉ（ｉ＝１、２、３、．．．）に対応付けられている。重み係数ＷＦｉとフィルタＦｉとの数学的関連付けは、フィルタＦｉ（ｉ＝１、２、３、．．．）によって判定された結果データＯＤｉ（ｉ＝１、２、３、．．．）にそれぞれの重み係数Ｗｉ（ｉ＝１、２、３、．．．）が乗算されるようにすることができる。重み係数とフィルタとの関連付けは、重み係数Ｗｉが０に等しいとき、結果データＯＤｉが値０を有するような論理を含むこともできる。

図２に示され、参照番号１によって識別される線は、フィルタリング法ステップに対応する。フィルタリング法ステップ１は、フィルタリング法ステップの出力データを後続のフィルタリング法ステップの入力データとしてフィードバックすることによって繰り返されることができる。有利な方法では、結果データＯＤは、フィードバックされる前にメモリに記憶され、この任意のプロセスは図２には示されていない。後続のフィルタリング法ステップのための入力データとしての出力データのフィードバックは、図２の矢印２によって表されている。

第１および／または第２および／または第３の変形例にかかる図２に記載された本発明にかかる方法の実施形態は、フィルタリング法ステップの数にわたるフィルタＦｉ（ｉ＝１、２、３．．．）の数が不変であることを特徴とする。したがって、全てのフィルタリング法ステップは、結果データを生成するための静的数のフィルタを有する。

背景技術によれば、ｉ＝１、２、３．．．は、それぞれの分析問題に適合した量を有する；ｉは、特定の分析問題によって変化する。この結果、現在の教示が排他的に適用される場合、参照番号３によって図２に示されるようなフィルタリング法ステップではなく、１つの方法ステップが繰り返されることができる。現在の教示の実施態様は、フィルタチェーンを形成するためだけにフィルタＦ１．．．Ｆｉの順次配置に限定される。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、ｉが静的値を有することを特徴とする。本発明にかかる方法が第１および／または第２の変形例にしたがって使用される場合、静的値は、システムが教示されているときにニューラルネットワークの原理に基づく分析に設定される。必要とされないフィルタの省略に基づく、上記簡単に説明した現在の教示の系統化とは対照的に、第１および／または第２の変形例にかかる本発明にかかる方法では、フィルタＦ１．．．Ｆｉの静的数を維持しながら、０または０に近い重み係数が、必要とされないフィルタに関連付けられることが提供される。

適用されるフィルタの静的数は、いくつかのフィルタの適用に基づくフィルタリング法ステップが反復可能であるという効果を有する。反復フィルタリング法ステップは、ＡＳＣＩモジュールを備えるコンピュータプロセッサ上で有利な方法で実行されることができる。

上述したように、各フィルタＦｉ（ｉ＝１、２、３．．．）は、重み係数ＷＦｉ（ｉ＝１、２、３．．．）に関連付けられている。

重み係数ＷＦｉ（ｎ∈ｉ＝１、２、３、．．．）の重み係数ＷＦｎは、値０の重み係数値をとることができる。これは、重み係数ＷＦｎの値が０であるフィルタＦｎが関連付けられたフィルタＦｎが回路構成の点で保存され、それに対応して入力データＩＤｎの分析が行われるが、結果データＯＤｎとＷＦｎとの積は値０となるという効果を有する。したがって、フィルタＦｎは、フィルタリング法ステップの結果データＯＤに影響を及ぼさない。図２の上記の説明を参照すると、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、静的数のフィルタを維持しながら、フィルタの影響が、値０を有する関連する重み係数を介して０に等しく設定されることを特徴とする。

重み係数Ｗｉ（ｎ∈ｉ＝１、２、３、．．．）の重み係数ＷＦｎは、非ゼロの重み係数値をとることができる。これは、値が０である重み係数ＷＦｎが関連付けられたフィルタＦｎが回路構成に関して保存され、結果データＯＤｎとＷＦｎとの積が０以外の値をとる入力データＩＤｎの対応する分析が実行されるという効果を有する。したがって、フィルタＦｎは、フィルタリング法ステップの結果データＯＤに影響を及ぼす。

当業者は、有意な結果を達成するために、フィルタに関連付けられた少なくとも１つの重み係数が、フィルタリング法ステップにおいて異なる値を有することを認識する。フィルタＦｉに関連する重み係数ＷＦｉは、現在の教示の適用下でニューラルネットワークを教示することによって判定されることができる。当該技術分野の背景にかかる方法が精巧な方法で省略されている当該技術分野の背景にかかる方法とは対照的に、第１および／または第２の変形例にかかる本発明にかかる方法では、回路構成の観点から全てのフィルタが存在し、効率的な方法では、重み係数ＷＦｉを０または非ゼロに設定することにより、それぞれのフィルタＦＩは、それぞれのフィルタの結果データに影響を及ぼすまたは影響を及ぼさない。

図３は、ニューラルネットワークにおいてデータを処理するための第１および／または第２および／または第３の変形例にかかる本発明にかかる方法のさらなる実施形態を示している。入力データＩＤは、フィルタ基準を定義し、フィルタリング法ステップ１、２において結果データＯＤを生成するいくつかの少なくとも１つのフィルタＦｋ（ｋ＝１、２、３、．．．）を使用して分析され、それによって、フィルタ基準に対応する、結果値を含む結果データＯＤが生成され、重み係数ＷＦｋは、それぞれの場合にフィルタＦｋと関連付けられることができる。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、静的数のｋ個のフィルタを特徴とする。図３に示す方法は、結果データＯＤを入力データＩＤとしてフィードバックすることによって、矢印２で示すように繰り返し実行されることができる。特に、反復フィルタリング法ステップは、ＡＳＣＩモジュールを備えるコンピュータプロセッサ上で実行されることができる。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、入力データＩＤが並列フィルタリング法ステップ１、２において分析されることを特徴とする。結果データＯＤは、結果行列にまとめることができる。

ｊ番目の方法ステップの結果データＯＤをｊ＋１番目の方法ステップの入力データＩＤとしてフィードバックすることによって、本発明にかかる方法のこの実施形態は、第１および／または第２および／または第３の変形例にしたがって繰り返されることができる。図３にかかる第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、結果データＯＤがフィードバックされて第ｊ＋１の方法ステップを実行する前に、第ｊの方法ステップの結果データＯＤをメモリ（図３には示さず）に記憶する任意のステップを含むことができる。

図２の図の説明に記載された実施形態と同様に、重み付け係数ＷＦｋ（ｋ＝１、２、３．．．）はまた、図３に示された第１および／または第２および／または第３の変形例にかかる本発明にかかる方法の実施形態におけるフィルタＦｋに関連付けられ、それによって、図２の図の説明および説明の一般的な部分で述べられた効果および利点が達成されることができる。

要約すると、フィルタの静的数を維持しながら、重み係数を介してフィルタをオンおよびオフに切り替えることができることが再び述べられる。図３に示す方法は、フィルタの数ｋが一定であることを特徴とする。

図４は、第１および／または第２の変形例にかかる本発明にかかる方法の第１の実施形態と第２の実施形態との組み合わせを示している。第１の実施形態および第２の実施形態は、図２および図３の図の説明を参照して上述したように、互いに独立した別個の方法として実行されることができる。

一般的な用語で説明すると、入力データＩＤは、フィルタ基準を有するフィルタによって生成され、結果データＯＤは、フィルタ基準に対応する。この方法は、ｊ番目の方法ステップのＯＤをｊ＋１番目の方法ステップの入力データとしてフィードバックすることによって繰り返されることができる。

入力データは、並列に実行されるｋ個のフィルタリング法ステップ１、２で分析され、ｋは、本発明にかかる方法が第１および／または第２の変形例にしたがって実行されるときの静的値を仮定する。フィルタリング法ステップ１、２は、ｉ個のフィルタを含み、ｉは静的値を有する。第１および／または第２の変形例にかかる本発明にかかる方法は、フィルタリング法ステップ１、２が、フィルタリング法ステップ１、２の全てのｊ回の繰り返しにおいて同じ数のｉ、ｋ個のフィルタ（ｉ、ｋ＝１、２、３．．．）を有することを特徴とする。

第１および／または第２の変形例にかかる図２の図の説明に記載された本発明にかかる方法の実施形態と同様に、各フィルタＦｉｋ（ｉ、ｋ＝１、２、３．．．）は、関連する重み係数ＷＦｉｋ（ｉ、ｋ＝１、２、３．．．）を有し、第ｊの方法ステップの結果データＯＤｊに対するフィルタＦｉｋ（ｉ、ｋ＝１、２、３．．．）の影響は、重み係数Ｗｉｋ（ｉ、ｋ＝１、２、３．．．）によって定義されることができる。重み係数Ｗｉｋは、０の値または０に近い値に関連付けることができるため、有意なフィルタＦｉｋ（ｉ、ｋ＝１、２、３．．．）を維持しながらフィルタＦｉｋ（ｉ、ｋ＝１、２、３．．．）は、ｊ番目の方法ステップの結果データＯＤｊに影響を与えない。

重み係数Ｗｉｋは、現在の教示を用いてニューラルネットワークを教示することによって判定されることができる。当業者は、意味のある結果を得るために、フィルタに関連する少なくとも１つの重み係数がフィルタリング法ステップにおいて異なる値を有することを認識する。

フィルタＦｉｋに関連する重み係数Ｗｉｋを、０または非ゼロに等しい上記の説明にしたがって選択することによって、フィルタの数は、図４に示す個々のフィルタリング法ステップ１、２の第１および／または第２の変形例にかかる本発明にかかる方法の実施形態の全ての反復において同じままとすることができる。同様に、並列に実行されるフィルタリング法ステップ１、２の数は同じままとすることができる。フィルタ数Ｆｉｋ（ｉ、ｋ＝１、２、３、．．．）の有利な剛性のために、ニューラルネットワークを使用してデータを分析するための本明細書に開示される方法は、剛性に構造化されたプロセッサ上で実行されることができる。

当業者は、当該技術分野の背景から知られている縮小法を使用して結果行列の次元を縮小することができる。当業者は、例えば、最大プーリング法、平均化を伴う方法などを使用することができる。

図４は、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法を使用したデータの分析の非常に簡略化された表現を示している。特に、図２および図３を参照すると、フィルタの直列および並列配置が非常に簡略化されて示されている。当業者は、ＣＮＮの現在の方法を参照すると、並列または直列に配置された方法ステップ以外の関係が可能であることを知っている。これは、並列方法ステップ１、２の間の破線矢印を使用して図４に示されている。図４に簡略化された概略的な方法で示されている方法は、ＣＮＮに関する現在の教示を組み込むことによって拡張されることができる。

図２、図３、図４の図の上記の説明では、フィルタの不特定数ｉ、ｋが言及されている。入力データを処理するときに適用可能なフィルタの数は、１つ以上のコンピュータプロセッサの特性によって判定される。

図５は、フィルタの数によって統一された形式のデータの分析を示している。

図５は、第１の入力データＩＤ’として文字および数字を有するアイチャートを含む。アイチャートの内容は、アイチャートが例えば文字および数字を含むことを除いて、本明細書に開示される本発明の説明にそれ以上関連しない。

図５は、第２の入力値ＩＤ２として自動車の画像を含む。自動車の画像は、例えば、他の自動車のカメラによって記録されていることができ、他の自動車は、セルフステアリングシステムを含む。図２に第２の入力値ＩＤ’’として示されている自動車の画像は、監視カメラからの画像とすることができる。

図５で説明したように、第１の入力データは、第１のフィルタリング法ステップ１においてｎ個のフィルタによって分析される。フィルタの数を指定する（数ｎは、ｎ＝１、２、３．．．で一定である）。重み係数は、各フィルタに関連付けられ、各重み係数は、第１の入力データの分析のための重み係数値を有する。

第１のフィルタＦ２に対応付けられる第１の重み係数Ｗ１は、例えば、重み係数の値がＷ１＝０．０５である。

第２のフィルタＦ２に対応する第２の重み係数値Ｗ２は、重み係数値Ｗ２＝０．０である。第２の重み係数値Ｗ２を０に等しく設定することにより、第１のフィルタリング法ステップ１におけるアイチャートの分析中に、得られた結果に対する第２のフィルタＦ２の影響が抑制される。

第２のフィルタリング法ステップでは、多数のｎ個のフィルタが再び使用される。第１のフィルタリング法ステップ１で使用されるｎ個のフィルタの数は、第２のフィルタリング法ステップ２で使用されるｎ個のフィルタの数に対応する。

第２のフィルタリング法ステップ２では、フィルタＦｎの影響（ｎ＝定数、ｎ＝１、２、３．．．）も重み係数によって判定され、重み係数は、フィルタＦｎに関連付けられる。第２のフィルタＦ２に関連する重み係数Ｗ２は、Ｗ２＝００００１の重み係数値を含み、第２の重み係数値は、アイチャートの分析の文脈ではほぼ０に等しい値を有する。したがって、第２のフィルタリング法ステップの第２のフィルタＦ２は、第１の入力データＩＤ’としてのアイチャートの分析に大きな影響を及ぼさない。

第１のフィルタリング法ステップ１および第２のフィルタリング法ステップ２は、ＡＳＩＣ構成要素を備えるコンピュータプロセッサによって、第１および／または第２の変形例にかかる図５に示す本発明にかかる方法の適用において実行されることができる。これは、この方法が異なるプロセッサでも実行されることができることを排除するものではない。さらに、第１のフィルタリング法ステップ１の分析は、第１のプロセッサで実行されることができ、第２のフィルタリング法ステップ２の分析は、第２のプロセッサで実行されることができる。

図５はまた、第２の入力値ＩＤ’’としての画像データの分析を示し、どの第２の入力データＩＤ’’が別の装置によって取得され、どの第２の入力データＩＤ’’が根本的に異なる状況であるかを表している。

第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、第１の入力値ＩＤ’を分析するための定数ｎのフィルタが、第２の入力値ＩＤ’’を分析するための定数ｎのフィルタに対応することを特徴とすることができる。これは、結果データに対するフィルタの影響が、本発明にかかる方法が第１および／または第２および／または第３の変形例にしたがって実行されるときにフィルタに関連する重み係数を介して制御されるために可能である。

当業者は、図５に示す方法を、数学的畳み込みのサブ方法および／またはデータ量を減らすためのサブ方法（「サブサンプリング」）および／または不要な情報を破棄するためのサブ方法（「プーリング」）および／またはデータを処理するための当該技術分野の背景から知られている分類のためのサブ方法（「完全接続層」）と組み合わせることができる。

図６は、第１および／または第２および／または第３の変形例にかかる方法のさらなる実施形態を示し、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法は、少なくとも１つのさらなる方法ステップによって補足される。少なくとも１つのさらなる方法ステップは、以下に記載され、当該技術分野の背景から知られているさらなる方法ステップの群から選択されることができ、当該技術分野の背景から知られているニューラルネットワークの方法：パディングＰＡＤ、バッファメモリＣＡＣＨＥ、等化ＢＩＡＳ、調整ＲＥＣＴ（非線形活性化関数の適用）およびプーリングＰＯＯＬと組み合わせることができる。選択されたさらなる方法ステップの省略は、他のさらなる方法ステップによって達成されることができる効果に影響を及ぼさない。選択されたさらなる方法ステップの省略は、結果データにのみ影響を及ぼす。したがって、言及されたさらなる方法ステップは、任意の方法で組み合わせることができる。後者は図６には示されていない；図６は、さらなる方法ステップにかかる、第１および／または第２および／または第３の変形例にかかる、議論中の本発明にかかる方法の可能な補足を示している。

さらなる方法ステップと第１および／または第２の変形例にかかる本発明にかかる方法との組み合わせは、第１および／または第２の変形例にかかる本発明にかかる方法と、判定された値の中間記憶なしのさらなる方法ステップとを含む方法の実施形態が実現可能であるという特別な効果を有する。これは、一定数のフィルタによって達成される。使用される計算ユニットに関して、一定数のフィルタは、計算ユニットに実装された論理の明確に定義された相互接続を可能にする。

当業者はまた、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法を、本明細書に列挙されていないさらなる方法ステップと組み合わせることができる。

図６は、第１および／または第２の変形例にかかる本発明にかかる方法と、矩形４によるさらなる方法ステップとを要約しており、第１および／または第２の変形例にかかる本発明にかかる方法と、全てのさらなる方法ステップが選択されたときに、好ましくは計算ユニット上で実行されるさらなる方法ステップとを含む。

入力データＩＤは、所定のデータおよび／またはセンサによって判定されることができるデータとすることができる。データの起源は、図６に示す方法の実施に影響を及ぼさない。単に以下の説明の理解を容易にするために、したがって決して限定的ではなく、入力データＩＤは、本明細書では説明しない白黒画像センサの特性を考慮して、画像センサによって判定され、６４０×４８０の行列フォーマットを有すると仮定する。

入力データＩＤは、さらなる方法ステップとしてパディング法ステップＰＡＤに供給される。

入力データＩＤは、いわゆる方法ステップＣＯＮＶに供給され、方法ステップＣＯＮＶでは、入力データＩＤは、上記の説明にかかる一定数のフィルタを有するＣＮＮの教示を使用して、したがって第１および／または第２の変形例にかかる上記の本発明にかかる方法を使用して処理される。

重み係数は、方法ステップＣＯＮＶを実行するコンピュータプロセッサに供給されることができる。この目的のために、重み係数は、永続的メモリに記憶される。重み係数を記憶するためのメモリの構成自体は、図６に示す方法の実装、または第１および／または第２の変形例にかかる本発明にかかる方法の実装に影響を及ぼさない。メモリの構成は、構成要素の設計に関連する問題にすぎない。

結果値ＯＤは、例えば、データを処理するために畳み込み層ＣＯＮＶにおいて４つのフィルタが使用される場合、６４０×４８０×４（入力データＩＤはグレー値画像である）の形式を有する。これと同様に、結果値ＯＤは、１６個のフィルタが使用される場合、６４０×４８０×１６（入力データＩＤはグレー値画像）の形式を有することができる。

一例として与えられる結果値の形式は、重み係数とは無関係である。重み係数が値０を有する場合、この重み係数を使用して計算された結果値は０である。このため、結果データＯＤの内容のみが重み係数に依存する。

結果データＯＤは、バッファメモリＣＡＣＨＥに供給され、このバッファメモリＣＡＣＨＥは、演算ユニットの論理における従来技術にしたがって設計される。入力結果データＯＤは、当該技術分野の背景技術にかかる方法を使用してバッファメモリ内で合計される。バッファメモリＣＡＣＨＥは、現在の教示を参照して可能であるが、本明細書で説明する方法の観点からはあまり有利ではないＲＡＭメモリではないことが好ましい。技術の背景に応じた技術を使用し、上記の例を参照して、６４０×４８０×４の結果データは、６４０×４８０×１の行列フォーマットに合計される。

合計されたデータは、バッファメモリＣＡＣＨＥから等化ステップＢＩＡＳに供給され、等化ステップＢＩＡＳでは、現在の教示を使用してデータが等化され、次に調整方法ステップＲＥＣＴに供給され、最後にプーリング法ステップＰＯＯＬに供給される。方法ステップＣＡＣＨＥ、ＢＩＡＳ、ＲＥＣＴ、ＰＯＯＬは、当該技術分野の背景から知られている。

等化ステップを実行するための等化パラメータは、矩形４によって表されるコンピューティングユニットの外部に記憶されることができる。現在の教示によれば、調整プロセスは、活性化としても知られており、調整プロセスまたはＲｅＬＵ法などの当該技術分野の背景技術にしたがって知られている活性化プロセスが使用される。

さらなる結果値／ＯＤ／は、一定数のフィルタを用いたＣＮＮ教示を使用して、したがって第１および／または第２の変形例にしたがって上述した本発明にかかる方法を使用して、方法ステップＣＡＣＨＥ、ＢＩＡＳ、ＲＥＣＴ、ＰＯＯＬの群からのさらなる方法ステップを適用して、データの処理からの結果値ＯＤから判定される結果値として定義される。

矩形４によって要約されている、第１および／または第２および／または第３の変形およびさらなる方法ステップにかかる本発明にかかる方法は、データのフィードバックを記号化する矢印３によって示されているように、ｉ倍（ｉ＝１、２、３．．．）繰り返されることができる。さらなる結果値／ＯＤ／は、第１および／または第２および／または第３の変形例にかかる本発明にかかる方法と、図６には示されていない少なくとも１つのさらなる方法ステップとを含むさらなる計算ユニットに供給されることも考えられる。

図６の方法ステップＣＯＮＶによって表される第１および／または第２の変形例にかかる本発明にかかる方法、ならびにさらなる方法ステップＣＡＣＨＥ、ＢＩＡＳ、ＲＥＣＴ、ＰＯＯＬは、好ましくは、コンピューティングユニット上で実行される。第ｉの方法ステップにおける第１および／または第２の変形例にかかる、少なくとも１つのさらなる方法ステップの選択および他のさらなる方法ステップの非実行または省略、ならびに上述した本発明にかかる方法の実行／非実行について、コンピューティングユニットは、対応する回路５を備える。当業者は、このような回路５を用いてこのような計算ユニットを設計することができることは明らかである。回路５はまた、さらなる方法ステップを省略しながら結果値を読み出すことを可能にする。

さらなる方法ステップＣＡＣＨＥによって実行される、第１および／または第２の変形例にかかる本発明にかかる方法から得られた結果値ＯＤの合計は、必要なメモリが低減されることができるという効果を有する。

図７は、本発明にかかる論理モジュール２００、特にＡＳＩＣを示し、特に本発明にかかる方法を実行するための、複数の第１層１０１を有するニューラルネットワーク１００のニューラルネットワーク計算を実行するための電子回路構成が恒久的に指定されている（すなわち、論理モジュールの製造後に変更不可能である）。

論理モジュール２００は、ニューラルネットワーク１００のための（例えば、外部ＣＰＵ２１３からの）入力を供給するための信号入力２０３と、ニューラルネットワーク１００の出力を配信するための信号出力２０４とを有する。

それぞれがニューラルネットワーク１００の第１層１０１を表す複数（ここでは例示的に６つ）の第１層回路構成２０１が提供され、各第１層回路構成２０１は、入力データを受信するための少なくとも１つの信号入力と、結果データを出力するための少なくとも１つの信号出力とを有し、各第１層回路構成２０１は、少なくとも１つの第１層１０１（図８を参照）を有し、各場合において、１つ以上のチャネルにおいて、線形演算によって少なくとも１つの第１層１０１に関連付けられたいくつかのフィルタ１０５を使用して、チャネル当たりの入力データサイズを有する入力データからいくつかの結果データを生成することができ、少なくとも１つの第１層１０１に関連付けられたフィルタ１０５の受容野は、少なくとも１つの第１層１０１のチャネル当たりの入力データサイズよりも小さく、フィルタ１０５は、入力データの異なる点においてチャネル当たりの線形演算を実行する。

全ての第１層回路構成２０１は、少なくとも１つの第１層１０１に関連する同じ数のフィルタ１０５を有し、各第１層回路構成２０１の少なくとも１つの第１層１０１のそれぞれにおいて、それぞれの第１層１０１に関連するフィルタ１０５のそれぞれは、線形演算に使用される。

各フィルタ１０５には重み係数が関連付けられており、重み係数は、結果データを生成するときに、入力データの異なる点においてそれぞれのフィルタ１０５によって実行された演算の結果が考慮される程度を判定する。

論理モジュール２００は、信号出力２０４に接続された出力回路構成（図示せず）を有する。

複数の第１層回路構成２０１とデータ通信するスケジューラ回路構成２０５は、変更可能な仕様にしたがって、データフローが論理モジュール２００の信号入力２０３から個々の第１層回路構成２０１へと、個々の第１層回路構成２０１の間で、および個々の第１層回路構成２０１から出力回路構成へと伝導される順序を指定するために、ニューラルネットワーク１００のネットワークアーキテクチャを定義するように設計される。

図７には、２つの第２層回路構成２０２が例として示されており、これらは互いに密接に接続されており、そのうちの一方は出力回路構成に接続されることができ、またはそのように設計されることができる。

ネットワーク計算の結果は、外部のＣＰＵ２１３に供給されることができる。

図８は、図７に示す論理モジュール２００のための様々な第１層回路構成２０１の構造の例を詳細に示している。

ここで、各第１層回路構成２０１は同じ構造を有する。特に、当然ながら、各第１層回路構成２０１（より正確には、それに含まれる第１層１０１）は、他の全ての第１層回路構成２０１と同じ数のフィルタ１０５を有する。

各第１層回路構成は、信号入力２０３および信号出力２０４を有する。スケジューラ回路構成２０５（ここでは図示せず）は、個々の第１層回路構成２０４の信号入力２０３および信号出力２０４が互いにどのように接続されるかを判定するために使用されることができる。

各第１層回路構成２０１は、各第１層回路構成２０１が動作中にその機能を有するという意味で、ニューラルネットワーク１００の第１層１０１を表す。

ここに存在する様々な機能モジュールが例として示されている（それらは当該技術分野の背景技術に対応するため、それ自体公知である）：
－キャッシュメモリシステム２０７
－存在することができるバイアスを除去するためのバイアスモジュール２０８
－（非線形活性化関数を適用することとしても知られる）調整プロセスを実行するための調整モジュール２０９
－プーリングおよび／またはダウンサンプリング法を実行するためのプーリングモジュール２１０
－パディング法を実行するためのパディングモジュール２１１

全ての第１層回路構成２０１の全ての機能モジュールを使用する必要は必ずしもない；代わりに、どの機能モジュールがその中で使用されるかを第１層回路構成２０１のそれぞれについて指定されることができる。これは、好ましくはスケジューラ回路構成２０５によって処理されることができる。

スケジューラ回路構成２０５は、データフローが第１層回路構成２０１の少なくとも１つの機能モジュールから別の第１層回路構成２０１の少なくとも１つの機能モジュールへと直接伝送されるようにネットワークアーキテクチャを定義するものとすることができる。

図９は、本発明の第２の変形例にかかる方法を実行することができ、本発明にかかる論理モジュール２００に永続的に記憶されることができる、ＣＮＮの形態の推論演算における訓練されたニューラルネットワーク１００の可能なアーキテクチャを示している。

ニューラルネットワーク１００は、ニューラルネットワーク１００に入力（ここでは例として番号２）を供給することができる入力層１０３を有する。例として、３つの第１層１０１が設けられ、結果データは、畳み込みを使用してフィルタ１０５によって計算され、それぞれ次の層１０１、１０２に供給される。本発明にとって、各第１層１０１が同じ数のフィルタ１０５（ここでは、例えば、５つのフィルタ１０５）を有し、各第１層１０１内の全てのフィルタ１０５も使用されることが重要である。この例では、ニューラルネットワーク１００の訓練により、一番左に示されている第１層１０１では、２つのフィルタ１０５の演算結果が結果データの生成において考慮されず（重み係数が０に等しい）、一方、中央および右に示されている第１層１０１では、それぞれの場合に１つのフィルタ１０５が適用されるが、結果データの生成には何ら影響を与えないことが示された。ニューラルネットワーク１００の訓練はまた、重み係数が非ゼロであるそれらのフィルタ１０５の演算の結果が異なるように重み付けされ、これは例として与えられた重み係数の異なる数値から生じることを示している。

各第１層１０１では、非線形活性化関数が使用されて、活性化データ（調整プロセスとしても知られるこのプロセスは、いずれにせよ当該技術の背景技術に対応するため示されていない）の形式で結果データを生成する。

計算的に見て最後の第１層１０１の結果データ（より正確には、活性化データの形態の結果データ）は、密接に接続された２つの第２層１０２に供給され、そのうちの右側に示される第２層１０２は、出力層１０４として構成される。

個々の第１層１０１における一定数のフィルタ１０５とは別に、図９に示されるニューラルネットワーク１００は、当該技術分野の背景技術に対応する。

図１０は、本発明にかかる少なくとも１つの論理モジュール２００を有する車両の形態の本発明にかかる装置６を示し、信号は、車両上または車両内に配置された少なくとも１つの信号発生装置９によって、少なくとも１つの信号入力２０３を介してニューラルネットワーク計算のための入力として少なくとも１つの論理モジュール２００に供給されることができ、少なくとも１つの論理モジュール２００は、車両の制御もしくは調整装置８と通信するための、または車両の少なくとも１つのアクチュエータ１０（図示せず）への制御コマンドの出力のための少なくとも１つの信号出力２０４を有する。

図１１は、本発明にかかる少なくとも１つの論理モジュール２００を有するロボットの形態の本発明にかかる装置６を示し、信号は、ロボット上またはロボット内に配置された少なくとも１つの信号発生装置９によって、少なくとも１つの信号入力２０３を介してニューラルネットワーク計算のための入力として少なくとも１つの論理モジュール２００に供給されることができ、少なくとも１つの論理モジュール２００は、ロボットの制御または調整装置８と通信するための、またはロボット（図示せず）の少なくとも１つのアクチュエータ１０（例えば、サーボモータまたは操作装置）への制御コマンドの出力のための少なくとも１つの信号出力２０４を有する。

図１２から図１４は、（この場合はニューラルネットワーク１００の量子化と組み合わせた）活性化クリッピングが使用される、本発明の第３の変形例にかかる方法を示している。ニューラルネットワーク１００は、例えば、画像またはビデオストリーム内のオブジェクトの分類によるコンピュータビジョンの分野で使用される。

図１２は、畳み込み層ＣＯＮＶ、調整層ＲＥＣＴ（非線形活性化関数が適用される）、および任意のプーリング層ＰＯＯＬを有するニューラルネットワーク１００の第ｉの第１層１０１を示している。以下では、発生する行列および演算子について説明する。

行列：
Ａ^{［ｉ－１］}またはＡ^［ｉ］は、前（ｉ－１）層１０１または本（ｉ）層１０１の活性化結果データ（活性化マップ）の全体を表し、ここではデータフォーマットｉｎｔ１６で存在する（Ａ^［０］は入力画像のＲＧＢ行列に相当する）。これに対応して、Ｅ^{［ｉ－１］}またはＥ^［ｉ］は、前の（ｉ－１）層１０１または現在の（ｉ）層１０１の結果データ（特徴マップ）全体を表している。

パラメータＰ（自然数）は、式

にしたがって実行される量子化のためのスケーリング指数を示す。Ｐ＝８の値が好ましい。

そのエントリが重み係数を表す畳み込み演算の重み行列は

によって示され、これは式１にしたがって量子化される。

畳み込みのバイアスベクトルは

によって示され、量子化は以下の式１にしたがって実行される。

演算子：
演算子「Ｒｓｈｉｆｔ」はビットシフタを表し、これは、以下の式に示すように、量子化された行列の畳み込み（

）の後に、結果がＰ桁だけ右にシフトされる正規化が必要であるためである。

（式２）。

演算「Ａｄｄ」は、バイアスベクトルを加算する。関数

は非線形活性化関数を表し、α＝０はＲｅＬＵ関数をもたらし、α≠０はＬＲｅＬＵ関数をもたらす。

「Ｌｉｎｅａｒ」は、任意の線形活性化関数を表す。

「ＭａｘＰｏｏｌｉｎｇ」は、ここでは例として最大プーリングとして実行されるプーリング演算子を表す。

キャスト関数「ｃａｓｔ」は、入力を指定されたビット幅、例えば

または

にキャストする。

「活性化クリッパ」（クリッピング関数）を用いて、活性化結果データの値の範囲は、第１の画像領域Ｂ１から第２の画像領域Ｂ２の形態の実サブセットに制限され、使用される「クリッピング関数」は、以下のように定義されることができる（式３）：

図１３は、Ｌ＝－２およびＵ＝７のパラメータでクリッピングされたＬＲｅＬＵ_０．１（ｚ）の形態の非線形活性化関数の例を示している。最適値は、例えば（浮動数演算において）以下のとおりである：データ型ｕｎｉｔ８の全ビット幅がこのように使用されるため、Ｌ_{ｆｌｏａｔ}＝－２およびＵ_{ｆｌｏａｔ}＝１４－２^－４＝１３．９３７５である。整数演算へのスケーリングは、例えば

および

をもたらす。

図１４ａおよび図１４ｂの例示的な実施形態は、任意の追加のマッピングおよびデマッピング法が示されているという点で、図１２の実施形態とは異なる。図１４ａの例示的な実施形態では、クリッピングは、活性化とは別個のステップとして提供される。一方、図１４ｂの例示的な実施形態では、クリッピングされた活性化関数を用いて（単一ステップで）活性化が行われる。

マッピング演算子は、活性化結果データのクリッピング値Ａ_ｃｌｉｐをデータ型ｕｎｉｔ８にマッピングする（値の範囲［０，２５５］）。第１のステップでは、マッピングバイアスＭ_ＢからＡ_ｃｌｉｐがカウントされ、これは、クリッピングされた活性化結果データの最小値が０（すなわち、

）にマッピングされるように選択される。第２のステップでは、マッピング電力Ｍ_Ｐに応じた行列Ａ_ｃｌｉｐ＋Ｍ_Ｂが右方向にシフトされ、以下が適用される（式４）：

Ｌ＝－５１２およびＵ＝３５６８の上記の例では、結果は例えばＭ_Ｐ＝４である。

マッピング部は、以下のように要約されることができる：

ｉ－１番目の第１層１０１を通過した後、ｕｎｉｔ８活性化マップＡ^{［ｉ－１］} _{ｕｎｉｔ８}がメモリに書き込まれ、第ｉ層１０１について読み出される。線形演算（ここでは：畳み込み）を実行するために、Ａ^{［ｉ－１］} _{ｕｎｉｔ８}がデータ型ｉｎｔ１６にマッピングされて戻される（デマッピング、デコンプレッション）。マッピング演算と同様に、デマッピング法には２つのパラメータ、すなわちデマッピング電力Ｄ_ＰおよびデマッピングバイアスＤ_Ｂが必要である。したがって、デマッピングマッピング関数は、以下のように定義されることができる：

以前に使用されたマッピング電力は、マッピング電力として選択される：Ｄ_Ｐ＝Ｍ_Ｐ。デマッピングバイアスＤ_Ｂの場合、第１の自然な選択は、マッピングバイアスを使用することである。しかしながら、量子化ノイズＱとも呼ばれるマッピング損失およびデマッピング損失をより詳細に見ると、ＱがＤ_Ｂ＝Ｍ_Ｂに対して平均自由ではないことが分かる。これは、誤差伝播における利得効果をもたらし、ニューラルネットワーク１００の浮動数モデルと量子化バージョンとの間のより大きな偏差をもたらす。したがって、平均値のない量子化ノイズを得るために、デマッピング電力は以下のように選択される：

。

Claims

データを処理するためのコンピュータ実装方法であって、
入力データが、フィルタ基準を定義し、複数の直列フィルタリング法ステップにおいて結果データを生成する、直列に配置された複数のフィルタを使用して分析され、
それによって、前記フィルタ基準に対応し、結果値を含む前記結果データが生成され、
各フィルタには重み係数が対応付けられており、
前記フィルタリング法ステップにおける前記フィルタの数が一定である、
ことを特徴とするコンピュータ実装方法。
ニューラルネットワークにおいてデータを処理するためのコンピュータ実装方法であって、
入力データが、フィルタ基準を定義し、並列に配置された複数の少なくとも１つのフィルタを使用して分析され、並列フィルタリング法ステップにおいて結果データを生成し、
それによって、前記フィルタ基準に対応し、結果値を含む前記結果データが生成され、
各フィルタには重み係数が対応付けられており、
前記フィルタリング法ステップにおける前記フィルタの数が一定である、
ことを特徴とするコンピュータ実装方法。
前記結果データが結果行列に結合される、
ことを特徴とする請求項１または２に記載の方法。
重み係数が０である、
ことを特徴とする請求項１から３のいずれか一項に記載の方法。
重み係数が非ゼロである、
ことを特徴とする請求項１から４のいずれか一項に記載の方法。
重み係数が１である、
ことを特徴とする請求項１から５のいずれか一項に記載の方法。
選択されたフィルタの前記フィルタ基準が定義されることができる、
ことを特徴とする請求項１から６のいずれか一項に記載の方法。
前記フィルタ基準が、フィルタパラメータが変更されることができるフィルタパラメータを含む、
ことを特徴とする請求項７に記載の方法。
前記入力データから複数の入力データが作成され、
入力データが同じデータを含む、
ことを特徴とする請求項２に記載の方法。
前記結果データが、縮小法を使用して結果データ行列に結合される、
ことを特徴とする請求項１から９のいずれか一項に記載の方法。
請求項１から１０のいずれか一項に記載のニューラルネットワークにおけるデータ分析方法。
前記結果値が、以下のさらなる結果値／ＯＤ／の生成を伴ってさらなる方法ステップのうちの少なくとも１つにおいて処理される、
ことを特徴とする請求項１１に記載の方法：
－合計、
－等化、
－調整、
－プーリング。
請求項１から１２のいずれか一項に記載の方法を実行するための手段を備える、データ処理のための装置。
ＡＳＣＩコンポーネントおよび／またはＦＰＧＡコンポーネントを有するプロセッサを備える、請求項１３に記載のデータ処理のための装置。
ニューラルネットワーク（１００）によってデータを処理するためのコンピュータ実装方法であって、
前記ニューラルネットワーク（１００）が、入力層（１０３）と出力層（１０４）との間に複数の第１層（１０１）を含み、フィルタ（１０５）が、前記複数の第１層（１０１）の各第１層（１０１）に関連付けられ、
－前記複数の第１層（１０１）のうちの各第１層（１０１）において、結果データが、線形演算によって前記複数の第１層（１０１）の前記それぞれの第１層（１０１）に関連するフィルタ（１０５）を使用して入力データから１つ以上のチャネルで生成され、前記入力データがチャネルごとの入力データサイズを有し、
－前記複数の第１層（１０１）のうちの各第１層（１０１）について、前記第１層（１０１）に関連付けられた前記フィルタ（１０５）の受容野のサイズが、前記フィルタ（１０５）がそれぞれ関連付けられ、前記フィルタ（１０５）が前記入力データの異なる点においてそれぞれ前記線形演算を実行する前記複数の第１層（１０１）のうちの前記第１層（１０１）のチャネル当たりの入力データサイズよりも小さく、
－複数の第１層（１０１）のうちの少なくとも１つの第１層（１０１）において、非線形活性化関数が、活性化結果データの形態の結果データを生成するために前記結果データに適用され、
前記入力層（１０３）と前記出力層（１０４）との間に存在する前記複数の第１層（１０１）に関して、
－前記複数の第１層（１０１）のうちの第１層（１０１）に関連付けられたフィルタ（１０５）の数が、前記複数の第１層（１０１）のうちの前記第１層（１０１）のそれぞれについて同じであり、前記第１層（１０１）のそれぞれにおいて、それぞれの第１層（１０１）に関連付けられた前記フィルタ（１０５）のそれぞれが線形演算に使用される、ことを特徴とする、特に請求項１から１２のいずれか一項に記載の方法。
各フィルタ（１０５）が、前記結果データを生成するときに、前記入力データの異なる点において前記それぞれのフィルタ（１０５）によって実行された前記演算の結果が考慮される程度を判定する重み係数に関連付けられる、請求項１５に記載の方法。
複数の第１層（１０１）または全ての第１層（１０１）において、非線形活性化関数が、活性化結果データの形態の結果データを生成するために前記結果データに適用される、請求項１５または１６に記載の方法。
前記複数の第１層（１０１）のうちの少なくとも１つの第１層（１０１）、好ましくは複数の第１層（１０１）または全ての第１層（１０１）における前記結果データの数に対して、縮小法および／またはプーリング法および／またはダウンサンプリング法が適用される、請求項１５から１７のいずれか一項に記載の方法。
前記複数の第１層（１０１）のうちの少なくとも１つの第１層（１０１）、好ましくは複数の第１層（１０１）または全ての第１層（１０１）において、前記入力データの異なる点において実行される前記線形演算が内積であり、前記結果データが畳み込みの結果である、請求項１５から１８のいずれか一項に記載の方法。
前記ニューラルネットワークが、計算的に見て前記複数の第１層（１０１）の背後に、互いに密接に接続された少なくとも２つの第２層（１０２）を有し、前記出力層（１０４）が、計算的に見て前記少なくとも２つの第２層（１０２）の背後に順次配置されるか、または計算的に見て最後の層として順次配置された前記第２層（１０２）が、前記出力層（１０４）として形成される、請求項１６から１９のいずれか一項に記載の方法。
前記複数の第１層（１０１）のうちの少なくとも２つの第１層（１０１）が、計算的に見て前記入力層（１０３）と前記出力層（１０４）との間に順次配置される、請求項１５から２０のいずれか一項に記載の方法。
前記複数の第１層（１０１）のうちの少なくとも２つの第１層（１０１）が、計算的に見て前記入力層（１０３）と前記出力層（１０４）との間に並列に配置される、請求項１５から２１のいずれか一項に記載の方法。
ニューラルネットワーク（１００）によってデータを処理するためのコンピュータ実装方法であって、前記ニューラルネットワーク（１００）が、入力層（１０３）と出力層（１０４）との間に複数の第１層（１０１）を含み、好ましくは、フィルタ（１０５）が前記複数の第１層（１０１）の各第１層（１０１）に関連付けられることが提供され、
－前記複数の第１層（１０１）の各第１層（１０１）において、好ましくは線形演算によって前記複数の第１層（１０１）の前記それぞれの第１層（１０１）に関連付けられたフィルタ（１０５）を使用して、入力データから１つ以上のチャネルで結果データが生成され、前記入力データがチャネルごとに入力データサイズを有し、
－複数の第１層（１０１）のうちの各第１層（１０１）について、前記第１層（１０１）に関連付けられた前記フィルタ（１０５）の受容野のサイズが、前記フィルタ（１０５）がそれぞれ関連付けられ、前記フィルタ（１０５）が前記入力データの異なる点においてそれぞれ前記線形演算を実行する複数の第１層（１０１）のうちの前記第１層（１０１）のチャネル当たりの入力データサイズよりも小さいことが好ましく、
－複数の第１層（１０１）のうちの少なくとも１つの第１層（１０１）において、非線形活性化関数が、活性化結果データの形態の結果データを生成するために前記結果データに適用され、
－前記複数の第１層（１０１）のうちの前記少なくとも１つの第１層（１０１）、好ましくは前記複数の第１層（１０１）のうちの全ての第１層（１０１）における前記ニューラルネットワーク（１００）の訓練中に、第１の画像領域（Ｂ１）を有する非線形活性化関数が前記活性化結果データを生成するために使用され、
－論理モジュール（２００）を使用して実行されることが好ましい前記ニューラルネットワーク（１００）の推論演算中に、前記複数の第１層（１０１）のうちの前記少なくとも１つの第１層（１０１）において、好ましくは前記複数の第１層（１０１）のうちの全ての第１層（１０１）において、第２の画像領域（Ｂ２）を有する非線形活性化関数が、前記活性化結果データを生成するために使用され、前記第２の画像領域（Ｂ２）が、前記第１の画像領域（Ｂ１）の真のサブセットを形成する、ことを特徴とする、特に請求項１５から２２のいずれか一項に記載の方法。
非線形活性化関数、好ましくはＬＲｅＬＵが、前記異なる画像領域（Ｂ１、Ｂ２）以外は同一である、前記ニューラルネットワーク（１００）の前記訓練中および前記推論演算中に使用される、請求項２３に記載の方法。
前記ニューラルネットワーク（１００）の前記訓練中に、前記ニューラルネットワーク（１００）の前記推論演算のための整数演算に量子化される浮動数演算が使用される、請求項２３または２４に記載の方法。
マッピング演算が、前記第２の画像領域（Ｂ２）に位置する前記結果活性化データに適用され、前記結果活性化データを所定の整数データ型、好ましくはｕｎｉｔ８にマッピングする、請求項２５に記載の方法。
前記複数の第１層（１０１）のうちの後続の第１層（１０１）において線形演算によって結果データが生成される前に、前記所定のデータ型にマッピングされた前記結果活性化データにデマッピング演算が適用される、請求項２６に記載の方法。
請求項１５から２７のいずれか一項に記載の方法を実行するための電子回路構成が恒久的に指定されている、論理モジュール（２００）、特にＡＳＩＣ。
請求項１５から２７のいずれか一項に記載の方法を実行するための電子回路構成が上書き可能に記憶される、論理モジュール、特にＦＰＧＡ。
複数の第１層（１０１）を有するニューラルネットワーク（１００）のニューラルネットワーク計算を実行するための、特に請求項１から２７のいずれか一項に記載の方法を実行するための電子回路構成が恒久的に指定される論理モジュール（２００）、特にＡＳＩＣであって、
－前記ニューラルネットワーク（１００）に入力を供給するための少なくとも１つの信号入力（２０３）と、
－前記ニューラルネットワーク（１００）の出力をもたらすための少なくとも１つの信号出力（２０４）と、を有し、
前記論理モジュール（２００）が、
－それぞれが前記ニューラルネットワーク（１００）の第１層（１０１）を表す複数の第１層回路構成（２０１）であって、各第１層回路構成（２０１）が、入力データを受信するための少なくとも１つの信号入力と、結果データを出力するための少なくとも１つの信号出力とを有し、各第１層回路構成（２０１）が、それぞれが１つ以上のチャネルにおいて、線形演算によって前記少なくとも１つの第１層（１０１）に関連付けられたいくつかのフィルタ（１０５）を使用して、チャネル当たりの入力データサイズを有する入力データからいくつかの結果データが生成されることができる少なくとも１つの第１層（１０１）を有し、前記少なくとも１つの第１層（１０１）に関連付けられた前記フィルタ（１０５）の受容野のサイズが、前記少なくとも１つの第１層（１０１）のチャネル当たりの前記入力データサイズよりも小さく、前記フィルタ（１０５）が、前記入力データの異なる点において前記チャネル当たりの前記線形演算をそれぞれ実行し、前記第１層回路構成（２０１）の全てが、前記少なくとも１つの第１層（１０１）に関連する同じ数のフィルタ（１０５）を有し、各第１層回路構成（２０１）の前記少なくとも１つの第１層（１０１）のそれぞれにおいて、それぞれの第１層（１０１）に関連する前記フィルタ（１０５）のそれぞれが線形演算に使用される、第１層回路構成と、
－前記信号出力（２０４）に接続される出力回路構成と、
－変更可能な仕様にしたがって、データフローが前記論理モジュール（２００）の前記信号入力（２０３）から個々の第１層回路構成（２０１）へと、個々の第１層回路構成（２０１）の間で、および個々の第１層回路構成（２０１）から前記出力回路構成へと伝導される順序を指定するために、複数の第１層回路構成（２０１）とデータ通信可能であり、前記ニューラルネットワーク（１００）のネットワークアーキテクチャを定義するように設計されている少なくとも１つのスケジューラ回路構成（２０５）と、をさらに備える、ことを特徴とする論理モジュール。
各フィルタ（１０５）が、前記結果データを生成するときに、前記入力データの異なる点において前記それぞれのフィルタ（１０５）によって実行された前記演算の結果が考慮される程度を判定する重み係数に関連付けられる、請求項３０に記載の論理モジュール。
前記フィルタ（１０５）および／または前記フィルタ（１０５）に関連する前記重み係数が、前記論理モジュール（２００）のＲＡＭ回路構成（２０６）に変更可能に記憶される、請求項３０または３１に記載の論理モジュール。
少なくとも１つの第１層回路構成（２０１）、好ましくは複数の第１層回路構成（２０１）または全ての第１層回路構成（２０１）において、以下のリストから選択される少なくとも１つ、好ましくはいくつかまたは全ての機能モジュールが形成される、請求項３０から３２のいずれか一項に記載の論理モジュール：
－キャッシュメモリシステム（２０７）
－存在することができるバイアスを除去するためのバイアスモジュール（２０８）、
－調整プロセスを実行するための調整モジュール（２０９）、プーリングおよび／またはダウンサンプリング法を実行するためのプーリングモジュール（２１０）
－パディング法を実行するためのパディングモジュール（２１１）。
ネットワークアーキテクチャが、データフローが第１層回路構成（２０１）の少なくとも１つの機能モジュールから別の第１層回路構成（２０１）の少なくとも１つの機能モジュールへと直接伝送されるように、前記スケジューラ回路構成（２０５）によって定義される、請求項３０から請求項３３のいずれか一項に記載の論理モジュール。
ネットワークアーキテクチャが、前記スケジューラ回路構成（２０５）によって、
－少なくとも２つの第１層回路構成（２０１）が、計算的に見て前記入力層と前記出力層との間に順次配置され、および／または、
－少なくとも２つの第１層回路構成（２０１）が、計算的に見て前記入力層と前記出力層との間に並列に配置される、ように定義される、請求項３０から請求項３４のいずれか一項に記載の論理モジュール。
前記複数の第１層回路構成（２０１）のうちの少なくとも１つの第１層回路構成（２０１）、好ましくは複数の第１層回路構成（２０１）または全ての第１層回路構成（２０１）において、前記入力データの異なる点において実行される前記線形演算が内積であり、前記結果データが畳み込みの結果である、請求項３０から３５のいずれか一項に記載の論理モジュール。
密接に相互接続された第２層（１０２）を表す少なくとも２つの第２層回路構成（２０２）が、前記論理モジュール内に固定的に予め定められ、前記出力層が、計算的に見て前記少なくとも２つの第２層（１０２）の背後に連続して配置されるか、または計算的に見て最後に連続して配置された前記第２層（１０２）が、前記出力層として形成される、請求項３０から３６のいずれか一項に記載の論理モジュール。
前記装置（６）上または装置内に配置された少なくとも１つの信号発生装置（９）による少なくとも１つの信号入力（２０３）を介した前記ニューラルネットワーク計算のための入力として、信号が前記少なくとも１つの論理モジュール（２００）に供給されることができ、前記少なくとも１つの論理モジュール（２００）が、前記装置（６）の制御もしくは調整装置（８）と通信するための、または前記装置（６）の少なくとも１つのアクチュエータ（１０）への制御コマンドの直接出力のための少なくとも１つの信号出力（２０４）を有する、請求項３７に記載の少なくとも１つの論理モジュール（２００）を有する装置（６）。
コンピュータプログラムがコンピュータによって実行されると、請求項１から２７のいずれか一項に記載の方法を前記コンピュータに実行させる命令を含むコンピュータプログラム製品。
コンピュータによって実行されると、請求項１から２７のいずれか一項に記載の方法を前記コンピュータに実行させる命令を含むコンピュータ可読記憶媒体。