JP6857369B2

JP6857369B2 - Ｃｎｎを学習する方法及び学習装置、それを利用したテスト方法及びテスト装置

Info

Publication number: JP6857369B2
Application number: JP2020001966A
Authority: JP
Inventors: − ヒョンキム、ケイ; キム、ヨンジュン; キム、インスー; − キョンキム、ハク; ナム、ウヒョン; ブー、ソッフン; ソン、ミュンチュル; ヨー、ドンフン; リュー、ウジュ; チャン、テウン; ジョン、キュンチョン; チェ、ホンモ; チョウ、ホジン
Original assignee: Stradvision Inc
Current assignee: Stradvision Inc
Priority date: 2019-01-23
Filing date: 2020-01-09
Publication date: 2021-04-14
Anticipated expiration: 2040-01-09
Also published as: US20200234135A1; KR20200091795A; EP3686794B1; US11461653B2; JP2020119535A; CN111476247A; KR102337383B1; CN111476247B; EP3686794A1

Description

ハードウェア最適化に使用される１ｘＫまたはＫｘ１コンボリューション演算を利用したＣＮＮを学習する方法及び学習装置、それを利用したテスト方法及びテスト装置｛ＬＥＡＲＮＩＮＧＭＥＴＨＯＤＡＮＤＬＥＡＲＮＩＮＧＤＥＶＩＣＥＦＯＲＣＮＮＵＳＩＮＧ１ｘＫＯＲＫｘ１ＣＯＮＶＯＬＵＴＩＯＮＴＯＢＥＵＳＥＤＦＯＲＨＡＲＤＷＡＲＥＯＰＴＩＭＩＺＡＴＩＯＮ，ＡＮＤＴＥＳＴＩＮＧＭＥＴＨＯＤＡＮＤＴＥＳＴＩＮＧＤＥＶＩＣＥＵＳＩＮＧＴＨＥＳＡＭＥ｝を提供する。

本発明はハードウェア最適化に使用される１ｘＫまたはＫｘ１コンボリューション演算を利用したＣＮＮのパラメータを学習する方法に関し、より詳細には、前記１ｘＫコンボリューション演算または前記Ｋｘ１コンボリューション演算を利用して前記ＣＮＮの前記パラメータを学習する方法において、（ａ）少なくとも一つのトレーニングイメージが取得されると、学習装置は、リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、前記トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させてリシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させる段階；及び（ｂ）前記学習装置は、出力レイヤをもって、前記調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成させ、ロスレイヤをもって、前記出力とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習する段階；を含むことを特徴とする学習方法及び学習装置、それを利用したテスト方法及びテスト装置に関する。

ディープコンボリューションニューラルネットワーク（ＤｅｅｐＣｏｎｖｏｌｕｔｉｏＮＮｅｕｒａｌＮｅｔｗｏｒｋｓ；ＤｅｅｐＣＮＮ）は、ディープラーニング分野で起きた驚くべき発展の核心である。ＣＮＮは、文字の認識問題を解決するために９０年代にすでに使用されていたが、現在のように広く使用されるようになったのは最近の研究結果の賜物である。このようなディープＣＮＮは、２０１２年ＩｍａｇｅＮｅｔイメージ分類コンテストで他の競争相手に勝って優勝を収めた。そして、コンボリューションニューラルネットワークは機械学習（ＭａｃｈｉｎｅＬｅａｒｎｉｎｇ）分野で非常に有用なツールとなった。

ＣＮＮは、イメージから特徴を抽出する特徴抽出器（ＦｅａｔｕｒｅＥｘｔｒａｃｔｏｒ）及びイメージ内の物体を検出したり特徴抽出器が抽出した特徴を参照してイメージを認識する特徴分類器（ＦｅａｔｕｒｅＣｌａｓｓｉｆｉｅｒ）を含む。

そして、ＣＮＮの特徴抽出器はコンボリューションレイヤを含み、特徴分類器は、特徴抽出器が抽出した特徴に対してＦＣ演算（ＦｕｌｌｙＣｏｎｎｅｃｔｅｄＯｐｅｒａｔｉｏｎ）を適用することができる少なくとも一つのＦＣレイヤを含むことができる。

コンボリューションレイヤは、ＣＮＮが行うほぼ大部分の演算において最も重要な部分を占める。

コンボリューションレイヤは、近傍のピクセルに関する情報をさらに利用してローカルレセプティブフィールド（ＬｏｃａｌＲｅｃｅｐｔｉｖｅＦｉｅｌｄ）から特徴を抽出する。しかし、コンボリューションレイヤのフィルタ特性（Ｃｈａｒａｃｔｅｒｉｓｔｉｃ）は線形的であるため、フィルタは非線形の特徴を十分に抽出することができない。このような問題を解決するためには、特徴マップの個数を増やさなければならないが、そうすると演算量が増える問題点がある。

したがって、演算量を最小化するために特徴マップの次元を減らすことができる１ｘ１コンボリューションレイヤが使用されている。

１ｘ１コンボリューションレイヤは、複数個の特徴マップから同じような性質を有するものを一まとめにすることができ、結果的に特徴マップの数を減らすことができ、演算量を減らすことができるようになる。

また、演算量が減るようになると、ニューラルネットワークがさらに深くなり得る余地が生じるようになる。

また、１ｘ１コンボリューションレイヤは、イメージセグメンテーションに使用されたりＦＣレイヤの代わりに特徴抽出器などに使用されている。

この際に、本発明者は、１ｘ１コンボリューションレイヤのコンボリューション演算に比べてより効率的にコンボリューション演算量を減らし得るようにするＣＮＮを提案することにする。

本発明は、上述した問題点を全て解決することをその目的とする。

本発明は、コンボリューション演算量を効率的に減らし得るようにするＣＮＮを提供することを他の目的とする。

本発明は、コンボリューション演算を通じてイメージ上の特徴をより効果的に抽出し得るようにするＣＮＮを提供することをまた他の目的とする。

前記のような本発明の目的を達成し、後述する本発明の特徴的な効果を実現するための、本発明の特徴的な構成は以下の通りである。

本発明の一態様によると、１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を利用してＣＮＮのパラメータを学習する方法において、（ａ）少なくとも一つのトレーニングイメージが取得されると、学習装置は、リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、前記トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させてリシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させる段階；及び（ｂ）前記学習装置は、出力レイヤをもって、前記調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成し、ロスレイヤをもって、前記出力とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習する段階；を含むことを特徴とする。

一実施例において、前記（ａ）段階で、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネル個数がＫの倍数でない場合、前記学習装置は、前記リシェイプレイヤをもって、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル（ＤｕｍｍｙＣｈａｎｎｅｌ）を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がＫの倍数になるようにした後、前記トレーニングイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するＫ個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。

一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネル個数をＬとする場合、前記（ａ）段階で、前記学習装置は、前記リシェイプレイヤをもって、幅Ｗ、高さＨｘＫ、チャンネル

である前記リシェイプ済み特徴マップを生成させることを特徴とする。

一実施例において、前記後続コンボリューションレイヤのカーネル（Ｋｅｒｎｅｌ）個数をＭとする場合、前記（ａ）段階で、前記学習装置は、前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記調整特徴マップを生成させることを特徴とする。

一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネル個数をＬとする場合、前記（ａ）段階で、前記学習装置は、前記リシェイプレイヤをもって、幅ＷｘＫ、高さＨ、チャンネル

一実施例において、前記後続コンボリューションレイヤのカーネル個数をＭとする場合、前記（ａ）段階で、前記学習装置は、前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記調整特徴マップを生成させることを特徴とする。

一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネル個数をＬとする場合、前記（ａ）段階で、前記学習装置は、前記リシェイプレイヤをもって、（ｉ）幅Ｗ、高さＨｘＫ、チャンネル

である前記リシェイプ済み特徴マップを生成させるか、（ｉｉ）幅ＷｘＫ、高さＨ、チャンネル

である前記リシェイプ済み特徴マップを生成させ、前記

番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分（ＦｉｎａｌＰａｒｔ）のサイズが幅Ｗ、高さＨｘＫであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング（ＺｅｒｏＰａｄｄｉｎｇ）を追加させて前記

番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅Ｗ、高さＨｘＫであるサイズになるようにするか、前記

番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記

番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズになるようにすることを特徴とする。

本発明の他の態様によると、１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を利用してＣＮＮをテストする方法において、（ａ）学習装置が、（ｉ）リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の学習用特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させて学習用リシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記学習用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された学習用調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、（ｉｉ）出力レイヤをもって、前記学習用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して、少なくとも一つの学習用出力を生成させ、ロスレイヤをもって、前記学習用出力とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習した状態で、少なくとも一つのテストイメージが取得されると、テスト装置は、前記リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、前記テストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させてテスト用リシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、前記後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整されたテスト用調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させる段階；及び（ｂ）前記テスト装置が、前記出力レイヤをもって、前記テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させる段階；を含むことを特徴とする。

一実施例において、前記（ａ）段階で、前記テストイメージまたはこれを加工した特徴マップのチャンネル個数がＫの倍数でない場合、前記テスト装置は、前記リシェイプレイヤをもって、前記テストイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル（ＤｕｍｍｙＣｈａｎｎｅｌ）を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がＫの倍数になるようにした後、前記テストイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するＫ個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。

一実施例において、前記テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、前記（ａ）段階で、前記テスト装置は、前記リシェイプレイヤをもって、幅Ｗ、高さＨｘＫ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする。

一実施例において、前記後続コンボリューションレイヤのカーネル（Ｋｅｒｎｅｌ）個数をＭとする場合、前記（ａ）段階で、前記テスト装置は、前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする。

一実施例において、前記テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、前記（ａ）段階で、前記テスト装置は、前記リシェイプレイヤをもって、幅ＷｘＫ、高さＨ、チャンネル

一実施例において、前記後続コンボリューションレイヤのカーネル個数をＭとする場合、前記（ａ）段階で、前記テスト装置は、前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする。

一実施例において、前記テストイメージまたは前記これを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、前記（ａ）段階で、前記テスト装置が前記リシェイプレイヤをもって、（ｉ）幅Ｗ、高さＨｘＫ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させるか、（ｉｉ）幅ＷｘＫ、高さＨ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させ、前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分（ＦｉｎａｌＰａｒｔ）のサイズが幅Ｗ、高さＨｘＫであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング（ＺｅｒｏＰａｄｄｉｎｇ）を追加させて前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅Ｗ、高さＨｘＫであるサイズになるようにするか、前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズになるようにすることを特徴とする。

本発明のまた他の態様によると、１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を利用してＣＮＮのパラメータを学習する学習装置において、インストラクションを格納する少なくとも一つのメモリと、（Ｉ）リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させてリシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させるプロセス、及び（ＩＩ）出力レイヤをもって、前記調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成させ、ロスレイヤをもって、前記出力とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、を含むことを特徴とする。

一実施例において、前記（Ｉ）プロセスで、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネル個数がＫの倍数でない場合、前記プロセッサは、前記リシェイプレイヤをもって、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル（ＤｕｍｍｙＣｈａｎｎｅｌ）を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がＫの倍数になるようにした後、前記トレーニングイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するＫ個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。

一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、前記（Ｉ）プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、幅Ｗ、高さＨｘＫ、チャンネル

一実施例において、前記後続コンボリューションレイヤのカーネル（Ｋｅｒｎｅｌ）個数をＭとする場合、前記（Ｉ）プロセスで、前記プロセッサは、前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記調整特徴マップを生成させることを特徴とする。

一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、前記（Ｉ）プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、幅ＷｘＫ、高さＨ、チャンネル

一実施例において、前記後続コンボリューションレイヤのカーネル個数をＭとする場合、前記（Ｉ）プロセスで、前記プロセッサは、前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記調整特徴マップを生成させることを特徴とする。

一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、前記（Ｉ）プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、（ｉ）幅Ｗ、高さＨｘＫ、チャンネル

である前記リシェイプ済み特徴マップを生成させ、前記

番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分のサイズが幅ＷｘＫ、高さＨであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記

番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズとなることを特徴とする。

本発明のまた他の態様によると、１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を利用してＣＮＮをテストするテスト装置において、インストラクションを格納する少なくとも一つのメモリと、学習装置は、（ｉ）リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の学習用特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させて学習用リシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記学習用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された学習用調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、（ｉｉ）出力レイヤをもって、前記学習用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの学習用出力を生成させ、ロスレイヤをもって、前記学習用出力とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習した状態で、（Ｉ）リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、少なくとも一つのテストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させてリシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、前記後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させるプロセス、及び（ＩＩ）前記出力レイヤをもって、前記テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させるプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、を含むことを特徴とする。

一実施例において、前記（Ｉ）プロセスで、前記テストイメージまたはこれを加工した特徴マップのチャンネル個数がＫの倍数でない場合、前記プロセッサは、前記リシェイプレイヤをもって、前記テストイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル（ＤｕｍｍｙＣｈａｎｎｅｌ）を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がＫの倍数になるようにした後、前記テストイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するＫ個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。

一実施例において、前記テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、前記（Ｉ）プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、幅Ｗ、高さＨｘＫ、チャンネル

一実施例において、前記後続コンボリューションレイヤのカーネル（Ｋｅｒｎｅｌ）個数をＭとする場合、前記（Ｉ）プロセスで、前記プロセッサは、前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする。

一実施例において、前記テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、前記（Ｉ）プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、幅ＷｘＫ、高さＨ、チャンネル

一実施例において、前記後続コンボリューションレイヤのカーネル個数をＭとする場合、前記（Ｉ）プロセスで、前記プロセッサは、前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする。

一実施例において、前記テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、前記（Ｉ）プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、（ｉ）幅Ｗ、高さＨｘＫ、チャンネル

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分のサイズが幅ＷｘＫ、高さＨであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記

その他にも、本発明の方法を実行するためのコンピュータプログラムを格納するためのコンピュータ読取り可能な記録媒体がさらに提供される。

本発明は、１ｘＫまたはＫｘ１コンボリューション演算を利用してＣＮＮのコンボリューション演算量を効率的に減らすことができる効果がある。

また、本発明は、１ｘＫまたはＫｘ１コンボリューション演算を利用した分だけ入力された特徴マップまたはイメージのチャンネル個数を増加させることができるので、コンボリューション演算を通じてイメージ上の特徴を効果的に抽出することができる他の効果がある。

本発明の実施例の説明に利用されるために添付された以下の各図面は、本発明の実施例のうちの一部に過ぎず、本発明が属する技術分野において通常の知識を有する者（以下「通常の技術者」）にとっては、発明的作業が行われることなくこの各図面に基づいて他の図面が得られ得る。

本発明の一実施例による１ｘＫまたはＫｘ１コンボリューション演算を利用してＣＮＮを学習する学習装置を簡略に示したものである。本発明の一実施例による１ｘＫまたはＫｘ１コンボリューション演算を利用してＣＮＮを学習する方法を簡略に示したものである。本発明の一実施例による１ｘＫまたはＫｘ１コンボリューション演算を利用してＣＮＮを学習するためのトレーニングイメージまたはこれを加工した特徴マップを簡略に示したものである。本発明の一実施例による（ｉ）トレーニングイメージまたはこれを加工した特徴マップをリシェイプして生成されたリシェイプ済み特徴マップと、（ｉｉ）リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用して生成された調整特徴マップとを簡略に示したものである。本発明の一実施例による（ｉ）トレーニングイメージまたはこれを加工した特徴マップをリシェイプして生成されたリシェイプ済み特徴マップと、（ｉｉ）リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用して生成された調整特徴マップとを簡略に示したものである。本発明の一実施例による（ｉ）トレーニングイメージまたはこれを加工した特徴マップをリシェイプして生成されたリシェイプ済み特徴マップと、（ｉｉ）リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用して生成された調整特徴マップとを簡略に示したものである。本発明の一実施例による（ｉ）トレーニングイメージまたはこれを加工した特徴マップをリシェイプして生成されたリシェイプ済み特徴マップと、（ｉｉ）リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用して生成された調整特徴マップとを簡略に示したものである。本発明の一実施例による１ｘＫまたはＫｘ１コンボリューション演算を利用してＣＮＮをテストするテスト装置を簡略に示したものである。本発明の一実施例による１ｘＫまたはＫｘ１コンボリューション演算を利用してＣＮＮをテストする方法を簡略に示したものである。

後述する本発明に関する詳細な説明は、本発明の各目的、各技術的解法、及び各長所を明らかにするために本発明が実施され得る特定の実施例を例示として示す添付図面を参照する。これらの実施例は、当業者が本発明を実施することができるように十分詳細に説明される。

また、本発明の詳細な説明及び各請求項にわたって、「含む」という単語及びそれらの変形は、他の技術的各特徴、各付加物、構成要素または段階を除外することを意図したものではない。通常の技術者にとって本発明の他の各目的、長所及び各特性が、一部は本説明書から、また一部は本発明の実施から明らかになるであろう。以下の例示及び図面は実例として提供され、本発明を限定することを意図したものではない。

さらに、本発明は、本明細書に示された実施例のすべての可能な組合せを網羅する。本発明の多様な実施例は互いに異なるが、相互に排他的である必要はないことが理解されるべきである。例えば、ここに記載されている特定の形状、構造及び特性は、一実施例に関連して本発明の精神及び範囲を逸脱せず、かつ他の実施例で具現され得る。また、それぞれの開示された実施例内の個別の構成要素の位置又は配置は、本発明の精神及び範囲を逸脱せず、かつ変更され得ることが理解されるべきである。したがって、後述の詳細な説明は、限定的な意味として受け取ろうとするものではなく、本発明の範囲は適切に説明されるのであれば、その請求項が主張することと均等な全ての範囲とともに添付された請求項によってのみ限定される。図面において類似の参照符号は、様々な側面にわたって同一であるか、又は類似の機能を指す。

本発明で言及している各種イメージは、舗装または非舗装道路関連のイメージを含み得、この場合、道路環境で登場し得る物体（例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物）を想定し得るが、必ずしもこれに限定されるものではなく、本発明で言及している各種イメージは、道路と関係のないイメージ（例えば、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内と関連したイメージ）でもあり得、この場合、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内環境で登場し得る物体（例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物）を想定し得るが、必ずしもこれに限定されるものではない。

以下、本発明の属する技術分野において通常の知識を有する者が本発明を容易に実施し得るようにするために、本発明の好ましい実施例に関して添付された図面を参照して詳細に説明することにする。

図１は、本発明の一実施例による１ｘＫまたはＫｘ１コンボリューション演算を利用してＣＮＮを学習する学習装置を簡略に示したものであって、図１を参照すると、学習装置１００は通信部１１０とプロセッサ１２０とを含むことができる。

まず、通信部１１０は、少なくとも一つのトレーニングイメージを受信することができる。

この際、トレーニングイメージはデータベース１３０に格納されていてもよく、データベース１３０にはトレーニングイメージに対応して少なくとも一つの物体それぞれに対するクラス情報の少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）及びそれぞれの物体に対する位置情報の少なくとも一つの原本正解が格納されていてもよい。

また、学習装置は、次のプロセスを遂行するためのコンピュータ読取り可能なインストラクション（Ｉｎｓｔｒｕｃｔｉｏｎ）を格納することができるメモリ１１５をさらに含むことができる。一実施例によると、プロセッサ、メモリ、媒体等は統合プロセッサ（ＩｎｔｅｇｒａｔｅｄＰｒｏｃｅｓｓｏｒ）として統合され得る。

次に、プロセッサ１２０は、リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させてリシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させるプロセスを遂行することができる。ここで、前記加工した特徴マップは、（ｉ）トレーニングイメージに対してコンボリューション演算を少なくとも一回適用する方法、（ｉｉ）前記（ｉ）の方法の結果に対して後続演算（例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など）を適用する方法、及び（ｉｉｉ）前記（ｉｉ）の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。そして、プロセッサ１２０は、出力レイヤをもって、調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成させ、ロスレイヤをもって、出力とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して少なくとも一つのロスを算出させることにより、ロスをバックプロパゲーションして後続コンボリューションレイヤの少なくとも一部のパラメータを学習するプロセスを遂行することができる。

この際、本発明の一実施例による学習装置１００は、コンピューティング装置であって、プロセッサを搭載して演算能力を備えた装置であればいくらでも本発明による学習装置１００として採択され得る。また、図１では、一つの学習装置１００のみを示したが、これに限定されず、学習装置は複数個に分けて役割を遂行することもできる。

このように構成された本発明の一実施例による学習装置１００を用いて、１ｘＫまたはＫｘ１コンボリューション演算を利用してＣＮＮを学習する方法を、図２を参照して説明すると以下の通りである。

まず、トレーニングイメージが入力されると、学習装置１００が、前処理（Ｐｒｅ−Ｐｒｏｃｅｓｓｉｎｇ）レイヤ１２１をもって、トレーニングイメージを前処理して加工した特徴マップを生成させることができる。

この際、前処理レイヤ１２１は、コンボリューションレイヤ、バッチ正規化レイヤ、アクティベーションレイヤ、プーリングレイヤのうち少なくとも一つを含むことができ、加工した特徴マップを生成することができる。ここで、前記加工した特徴マップは、（ｉ）トレーニングイメージに対してコンボリューション演算を適用する方法、（ｉｉ）前記（ｉ）の方法の結果に対して後続演算（例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など）を適用する方法、及び（ｉｉｉ）前記（ｉｉ）の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。しかし、前処理レイヤ１２１はこれに限定されず、前処理レイヤ１２１はイメージ処理のためのＣＮＮを構成するそれぞれのレイヤを含むことができる。

次に、学習装置１００はリシェイプレイヤをもって、トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを２次元的にコンカチネートさせてリシェイプ済み特徴マップを生成させることができる。この際、学習装置１００は前処理レイヤ１２１をもって、トレーニングイメージを前処理させずにトレーニングイメージを直接的にリシェイプレイヤ１２２に入力することもできる。

この場合、トレーニングイメージまたはそれを加工した特徴マップのチャンネル個数がＫの倍数でない場合、学習装置１００はリシェイプレイヤ１２２をもって、それぞれのピクセルに対応するチャンネルに少なくとも一つのダミーチャンネル（ＤｕｍｍｙＣｈａｎｎｅｌ）を追加させて少なくとも一つのダミーチャンネルを含むチャンネルの個数がＫの倍数になるようにした後、トレーニングイメージまたはこれを加工した特徴マップの少なくとも一つのダミーチャンネルを含む全てのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせることができる。

すなわち、トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、学習装置１００はリシェイプレイヤ１２２をもって、（ｉ）幅Ｗ、高さＨｘＫ、チャンネル

であるリシェイプ済み特徴マップを生成させるか、（ｉｉ）幅ＷｘＫ、高さＨ、チャンネル

であるリシェイプ済み特徴マップを生成させることができる。

番目のチャンネル上のリシェイプ済み特徴マップの最終部分（ＦｉｎａｌＰａｒｔ）のサイズが幅Ｗ、高さＨｘＫであるサイズにならない場合には、学習装置１００はリシェイプレイヤ１２２をもって、少なくとも一つのゼロパディング（ＺｅｒｏＰａｄｄｉｎｇ）を追加させて

番目のチャンネル上のリシェイプ済み特徴マップの最終部分のサイズが幅Ｗ、高さＨｘＫであるサイズになるようにするか、

番目のチャンネル上のリシェイプ済み特徴マップの最終部分のサイズが幅ＷｘＫ、高さＨであるサイズにならない場合には、リシェイプレイヤ１２２をもって、少なくとも一つのゼロパディングを追加させて

番目のチャンネル上のリシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズになるようにすることができる。

一例として、図３を参照すると、トレーニングイメージまたはこれを加工した特徴マップ３００の幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、トレーニングイメージまたはこれを加工した特徴マップ３００の最初のチャンネル（Ｃ１）上のそれぞれのピクセルに対応するそれぞれの特徴は、それぞれＣ１Ｆ１１、…、Ｃ１Ｆ２２、…、Ｃ１ＦＷＨのように表すことができる。そして、トレーニングイメージまたはこれを加工した特徴マップ３００の他のチャンネルＣ２、Ｃ３、…、ＣＬ上のそれぞれのピクセルに対応するそれぞれの特徴も同じ方法で表すことができる。

そして、図３と図４ａを参照すると、図３のトレーニングイメージまたはこれを加工した特徴マップ３００上のピクセルであるＣ１Ｆ１１に対応するＫ個のチャンネルの特徴であるＣ１Ｆ１１、Ｃ２Ｆ１１、…、ＣＫＦ１１をコンカチネートし、トレーニングイメージまたはこれを加工した特徴マップ３００上のピクセルＣ１Ｆ２１に対応するＫ個のチャンネルの特徴であるＣ１Ｆ２１、Ｃ２Ｆ２１、…、ＣＫＦ２１をコンカチネートし、トレーニングイメージまたはこれを加工した特徴マップ３００上のピクセルＣ１ＦＷＨに対応するＫ個のチャンネルの特徴であるＣ１ＦＷＨ、Ｃ２ＦＷＨ、…、ＣＫＦＷＨをコンカチネートすることと同じである。つまり、トレーニングイメージまたはこれを加工した特徴マップ３００上のすべてのピクセルに対応してそれぞれＫ個のチャンネルの特徴をコンカチネートしてリシェイプ済み特徴マップ４００Ａを生成するようになる。

この際、リシェイプ済み特徴マップ４００Ａは、幅Ｗ、高さＨｘＫ、チャンネル

を有するようになる。そして、リシェイプ済み特徴マップ４００Ａのそれぞれのチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ３００のＫ個のチャンネルから構成されたそれぞれのグループに対応し得る。つまり、リシェイプ済み特徴マップ４００Ａの最初のチャンネルはトレーニングイメージまたはこれを加工した特徴マップ３００の最初のないしＫ番目のチャンネルに対応し、リシェイプ済み特徴マップ４００Ａの二番目のチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ３００のＫ＋１番目のチャンネルないし２ｘＫ番目のチャンネルに対応し得る。そして、リシェイプ済み特徴マップ４００Ａの

番目のチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ３００の

番目のチャンネルないしＬ番目のチャンネルに対応し得る。

次に、学習装置１００は、後続コンボリューションレイヤ１２３をもって、リシェイプ済み特徴マップ４００Ａに対して１ｘＫコンボリューション演算を適用させてボリュームが調整された調整特徴マップ４００Ｂを生成させることができる。

一例として、図４ａと図４ｂを参照すると、図４ａのリシェイプ済み特徴マップ４００Ａ上の１ｘＫサイズに対応するＣ１Ｆ１１、Ｃ２Ｆ１１、…、ＣＫＦ１１に対して１ｘＫコンボリューション演算を適用してＣ１Ｆ１１’ピクセルの特徴を生成し、Ｃ１Ｆ２２、Ｃ２Ｆ２２、…、ＣＫＦ２２に対して１ｘＫコンボリューション演算を適用してＣ１Ｆ２２’ピクセルの特徴を生成し、Ｃ１ＦＷＨ、Ｃ２ＦＷＨ、…、ＣＫＦＷＨに対して１ｘＫコンボリューション演算を適用してＣ１ＦＷＨ’ピクセルの特徴を生成することと同じである。この場合、１ｘＫサイズは、コンボリューションレイヤのカーネルサイズであり得る。その結果、図４ａのリシェイプ済み特徴マップ４００Ａに対して１ｘＫコンボリューション演算を適用して図４ｂのように幅Ｗ、高さＨである調整特徴マップ４００Ｂを生成するようになる。したがって、図３のトレーニングイメージまたはこれを加工した特徴マップ３００に対して１ｘ１コンボリューション演算を適用するのに比べて、リシェイプ済み特徴マップ４００Ａを生成して１ｘＫコンボリューション演算を遂行することにより、演算量を１／Ｋに減らすことができるようになり、それに伴ってコンボリューション演算速度をＫ倍だけ増加させることができるようになる。この際、調整特徴マップ４００Ｂのチャンネルの個数は、１ｘＫコンボリューション演算を遂行する後続コンボリューションレイヤ１２３のカーネル個数、すなわち、フィルタの個数に対応し得る。一例として、後続コンボリューションレイヤ１２３のカーネル個数をＭとする場合、調整特徴マップ４００ＢのチャンネルはＭ個になり得る。

一方、前記では１ｘＫコンボリューション演算を使用する方法を説明したが、トレーニングイメージまたはこれを加工した特徴マップ３００のＫ個のチャンネルの特徴を幅方向にコンカチネートした後、Ｋｘ１コンボリューション演算を遂行することもできる。

そして、図３と図５ａを参照すると、図３のトレーニングイメージまたはこれを加工した特徴マップ３００上のピクセルであるＣ１Ｆ１１に対応するＫ個のチャンネルの特徴であるＣ１Ｆ１１、Ｃ２Ｆ１１、…、ＣＫＦ１１を幅方向にコンカチネートし、トレーニングイメージまたはこれを加工した特徴マップ３００上のピクセルＣ１Ｆ１２に対応するＫ個のチャンネルの特徴であるＣ１Ｆ１２、Ｃ２Ｆ１２、…、ＣＫＦ１２を幅方向にコンカチネートし、トレーニングイメージまたはこれを加工した特徴マップ３００上のピクセルＣ１ＦＷＨに対応するＫ個のチャンネルの特徴であるＣ１ＦＷＨ、Ｃ２ＦＷＨ、…、ＣＫＦＷＨを幅の方向にコンカチネートすることと同じである。つまり、トレーニングイメージまたはこれを加工した特徴マップ３００上のすべてのピクセルに対応してそれぞれＫ個のチャンネルの特徴を幅方向にコンカチネートしてリシェイプ済み特徴マップ５００Ａを生成するようになる。

この際、リシェイプ済み特徴マップ５００Ａは、幅ＷｘＫ、高さＨ、チャンネル

になる。そして、リシェイプ済み特徴マップ５００Ａのそれぞれのチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ３００のＫ個のチャンネルから構成されたそれぞれのグループに対応し得る。すなわち、リシェイプ済み特徴マップ５００Ａの最初のチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ３００の最初のチャンネルないしＫ番目のチャンネルに対応し、リシェイプ済み特徴マップ５００Ａの二番目のチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ３００のＫ＋１番目のチャンネルないし２ｘＫ番目のチャンネルに対応し得る。そして、リシェイプ済み特徴マップ５００Ａの

次に、学習装置１００は、後続コンボリューションレイヤ１２３をもって、リシェイプ済み特徴マップ５００Ａに対してＫｘ１コンボリューション演算を適用させてボリュームが調整された調整特徴マップ５００Ｂを生成させることができる。

一例として、図５ａと図５ｂを参照すると、図５ａのリシェイプ済み特徴マップのＫｘ１サイズに対応するＣ１Ｆ１１、Ｃ２Ｆ１１、…、ＣＫＦ１１に対してＫｘ１コンボリューション演算を適用してＣ１Ｆ１１”ピクセルの特徴を生成し、Ｃ１Ｆ１２、Ｃ２Ｆ１２、…、ＣＫＦ１２に対してＫｘ１コンボリューション演算を適用してＣ１Ｆ１２”ピクセルの特徴を生成し、Ｃ１ＦＷＨ、Ｃ２ＦＷＨ、…、ＣＫＦＷＨに対してＫｘ１コンボリューション演算を適用してＣ１ＦＷＨ”ピクセルの特徴を生成することと同じである。この際、Ｋｘ１サイズは、コンボリューションレイヤのカーネルサイズであり得る。その結果、図５ａのリシェイプ済み特徴マップ５００Ａに対してＫｘ１コンボリューション演算を適用して図５ｂのように幅Ｗ、高さＨである調整特徴マップ５００Ｂを生成するようになる。

次に、学習装置１００は、後処理（Ｐｏｓｔ−Ｐｒｏｃｅｓｓｉｎｇ）レイヤ１２４をもって、後続コンボリューションレイヤ１２３から出力される調整特徴マップ５００Ｂを後処理させることができる。この際、後処理レイヤ１２４は、コンボリューションレイヤ、バッチ正規化レイヤ、アクティベーションレイヤ、プーリングレイヤ、ＦＣレイヤのうち少なくとも一つを含むことができ、後続コンボリューションレイヤ１２３から出力される調整特徴マップ５００Ｂまたはこれを加工した特徴マップの分類された特徴を表す確率情報を生成することができる。しかし、後処理レイヤ１２４はこれに限定されず、後処理レイヤ１２４はイメージ処理のためのＣＮＮを構成するそれぞれのレイヤを含むことができる。

次に、学習装置１００は、出力レイヤ１２５をもって、調整特徴マップ５００Ｂまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成させ、ロスレイヤ１２６をもって、前記出力とこれに対応する原本正解とを参照して少なくとも一つのロスを算出させることにより、ロスをバックプロパゲーションして後続コンボリューションレイヤのパラメータを少なくとも一部学習することができる。この場合、学習装置１００は後処理レイヤ１２４をもって、調整特徴マップ５００Ｂを後処理させずに調整特徴マップ５００Ｂを直接的に出力レイヤ１２２に入力することもできる。

図６は、本発明の一実施例による１ｘＫまたはＫｘ１コンボリューション演算を利用してＣＮＮをテストするテスト装置を簡略に示したものであって、図６を参照すると、テスト装置２００は通信部２１０とプロセッサ２２０とを含むことができる。

また、テスト装置は、次のプロセスを遂行するためのコンピュータ読取り可能なインストラクション（Ｉｎｓｔｒｕｃｔｉｏｎ）を格納することができるメモリ２１５をさらに含むことができる。一実施例によると、プロセッサ、メモリ、媒体等は統合プロセッサ（ＩｎｔｅｇｒａｔｅｄＰｒｏｃｅｓｓｏｒ）として統合され得る。

先ず、通信部２１０は、少なくとも一つのテストイメージを取得するか、他の装置をもって取得するように支援することができる。

この際、本発明の一実施例による１ｘＫまたはＫｘ１コンボリューション演算を利用したＣＮＮは、図２ないし図５ｂを参照して説明した学習方法によって学習された状態であり得る。

参考までに、以下の説明で混同を避けるために「学習用」という文句は、先に説明した学習プロセスと関連する用語について追加され、「テスト用」という文句はテストプロセスと関連する用語について追加される。

つまり、少なくとも一つのトレーニングイメージが取得されると、学習装置が、（ａ）リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の学習用特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させて学習用リシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、学習用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された学習用調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を出力させるプロセスを遂行した状態であり得る。ここで、前記学習用加工した特徴マップは、（ｉ）トレーニングイメージに対してコンボリューション演算を少なくとも一回適用する方法、（ｉｉ）前記（ｉ）の方法の結果に対して後続演算（例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など）を適用する方法、及び（ｉｉｉ）前記（ｉｉ）の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。学習装置が、（ｂ）出力レイヤをもって、学習用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの学習用出力を生成させ、ロスレイヤをもって、学習用出力とこれに対応する少なくとも一つの原本正解とを参照して少なくとも一つのロスを算出させることにより、ロスをバックプロパゲーションして後続コンボーションレイヤの少なくとも一部のパラメータを学習するプロセスを遂行した状態であり得る。

次に、プロセッサ２２０はリシェイプレイヤをもって、テストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを２次元的にコンカチネートさせてテスト用リシェイプ済み特徴マップを生成させ、後続コンボリューションレイヤをもって、テスト用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリュームが調整されたテスト用調整特徴マップを生成させるプロセスを遂行することができる。ここで、前記テスト用加工した特徴マップは、（ｉ）テストイメージに対してコンボリューション演算を少なくとも一回適用する方法、（ｉｉ）前記（ｉ）の方法の結果に対して後続演算（例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など）を適用する方法、及び（ｉｉｉ）前記（ｉｉ）の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。そして、プロセッサ２２０は出力レイヤをもって、テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させることができる。

この際、本発明の一実施例によるテスト装置２００は、コンピューティング装置であって、プロセッサを搭載して演算能力を備えた装置であればいくらでも本発明によるテスト装置２００として採択され得る。また、図６では一つのテスト装置２００のみを示したが、これに限定されず、テスト装置は複数個に分けて役割を遂行することもできる。

このように構成された本発明の一実施例によるテスト装置２００を利用して、１ｘＫまたはＫｘ１コンボリューション演算を利用したＣＮＮをテストする方法を、図７を参照して説明すると以下のとおりである。以下の説明において、図１ないし図５ｂを参照して説明した学習方法から容易に理解可能な部分については、詳細な説明を省略することとする。

まず、図１ないし図７を参照して説明した学習方法によって後続コンボリューションレイヤ２２３が学習された状態で、テストイメージが入力されると、テスト装置２００が、前処理レイヤ２２１をもって、テストイメージを前処理させてテスト用加工した特徴マップを生成させることができる。

この際、前処理レイヤ２２１は、コンボリューションレイヤ、バッチ正規化レイヤ、アクティベーションレイヤ、プーリングレイヤのうち少なくとも一つを含むことができ、テストイメージに対してコンボリューション演算を適用してテスト用加工した特徴マップを生成することができる。ここで、前記テスト用加工した特徴マップは、（ｉ）テストイメージに対してコンボリューション演算を少なくとも一回適用する方法、（ｉｉ）前記（ｉ）の方法の結果に対して後続演算（例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など）を適用する方法、及び（ｉｉｉ）前記（ｉｉ）の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。しかし、前処理レイヤ２２１はこれに限定されず、前処理レイヤ２２１はイメージ処理のためのＣＮＮを構成するそれぞれのレイヤを含むことができる。

次に、テスト装置２００は、リシェイプレイヤ２２２をもって、テストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを２次元的にコンカチネートさせてテスト用リシェイプ済み特徴マップを生成させることができる。ここで、前記テスト用加工した特徴マップは、（ｉ）テストイメージに対してコンボリューション演算を少なくとも一回適用する方法、（ｉｉ）前記（ｉ）の方法の結果に対して後続演算（例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など）を適用する方法、及び（ｉｉｉ）前記（ｉｉ）の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。この際、テスト装置２００は前処理レイヤ２２１をもって、テストイメージを前処理させずにテストイメージを直接的にリシェイプレイヤ２２２に入力することもできる。

この場合、テストイメージまたはこれを加工した特徴マップのチャンネルの個数がＫの倍数でない場合、テスト装置２００はリシェイプレイヤ２２２をもって、それぞれのピクセルに対応するチャンネルに少なくとも一つのダミーチャンネル（ＤｕｍｍｙＣｈａｎｎｅｌ）を追加させて少なくとも一つのダミーチャンネルを含むチャンネルの個数がＫの倍数になるようにした後、テストイメージまたはこれを加工した特徴マップの少なくとも一つのダミーチャンネルを含む全てのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせることができる。

すなわち、テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、テスト装置２００は、リシェイプレイヤ２２２をもって、（ｉ）幅Ｗ、高さＨｘＫ、チャンネル

であるテスト用リシェイプ済み特徴マップを生成させるか、（ｉｉ）幅ＷｘＫ、高さＨ、チャンネル

であるテスト用リシェイプ済み特徴マップを生成させることができる。そして、

番目のチャンネル上のテスト用リシェイプ済み特徴マップの最終部分のサイズが幅Ｗ、高さＨｘＫであるサイズにならない場合には、テスト装置２００はリシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて

番目のチャンネル上のテスト用リシェイプ済み特徴マップの最終部分のサイズが幅Ｗ、高さＨｘＫであるサイズになるようにするか、

番目のチャンネル上のテスト用リシェイプ済み特徴マップの最終部分のサイズが幅ＷｘＫ、高さＨであるサイズにならない場合には、テスト装置２００はリシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて

番目のチャンネル上のリシェイプ済み特徴マップの最終部分のサイズが幅ＷｘＫ、高さＨであるサイズになるようにすることができる。

この際、テスト用リシェイプ済み特徴マップは、幅Ｗ、高さＨｘＫ、チャンネル

になる。そして、テスト用リシェイプ済み特徴マップのそれぞれのチャンネルは、テストイメージまたはこれを加工した特徴マップのＫ個のチャンネルから構成されたそれぞれのグループに対応し得る。つまり、テスト用リシェイプ済み特徴マップの最初のチャンネルは、テストイメージまたはこれを加工した特徴マップの最初のチャンネルないしＫ番目のチャンネルに対応し、テスト用リシェイプ済み特徴マップの二番目のチャンネルは、テストイメージまたはこれを加工した特徴マップのＫ＋１番目のチャンネルないし２ｘＫ番目のチャンネルに対応し得る。そして、テスト用リシェイプ済み特徴マップの

番目のチャンネルは、テストイメージまたはこれを加工した特徴マップの

以後、テスト装置２００は、後続コンボリューションレイヤ２２３をもって、テスト用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用してボリュームが調整されたテスト用調整特徴マップを生成させることができる。この際、テスト用調整特徴マップのチャンネルの個数は、１ｘＫコンボリューション演算を遂行する後続コンボリューションレイヤ２２３のカーネル個数、すなわち、フィルタの個数に対応し得る。一例として、後続コンボリューションレイヤ２２３のカーネル個数をＭとする場合、テスト用調整特徴マップのチャンネルはＭ個になり得る。

一方、前記では１ｘＫコンボリューション演算のための方法を説明したが、テストイメージまたはこれを加工した特徴マップのＫ個のチャンネルの特徴を幅方向にコンカチネートした後、Ｋｘ１コンボリューション演算を遂行することもできる。

つまり、図５ａを参照して説明したように、テスト用リシェイプ済み特徴マップは幅ＷｘＫ、高さＨ、チャンネル

になり得る。この際、テスト用リシェイプ済み特徴マップのそれぞれのチャンネルは、テストイメージまたはこれを加工した特徴マップのＫ個のチャンネルから構成されたそれぞれのグループに対応し得る。

そして、テスト装置２００は、後続コンボリューションレイヤ２２３をもって、テスト用リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用してボリュームが調整されたテスト用調整特徴マップを生成させることができる。

次に、テスト装置１００は、後処理レイヤ２２４をもって、後続コンボリューションレイヤ２２３から出力されるテスト用調整特徴マップを後処理させることができる。この際、後処理レイヤ２２４は、コンボリューションレイヤ、バッチ正規化レイヤ、アクティベーションレイヤ、プーリングレイヤ、ＦＣレイヤのうち少なくとも一つを含むことができ、後続コンボリューションレイヤ２２３から出力されるテスト用調整特徴マップまたはこれを加工した特徴マップの分類された特徴を表す確率情報を生成することができる。しかし、後処理レイヤ２２４はこれに限定されず、イメージ処理のためのＣＮＮを構成するそれぞれのレイヤを含むことができる。

次に、テスト装置２００は、出力レイヤ２２５をもって、テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させることができる。

本発明による方法は、ＫＰＩ（ＫｅｙＰｅｒｆｏｒｍａｎｃｅＩｎｄｅｘ、重要業績評価指標）を満たすハードウェア最適化に使用されるために提供され得る。

また、以上にて説明された本発明による実施例は、多様なコンピュータの構成要素を通じて遂行することができるプログラム命令語の形態で具現されて、コンピュータ読取り可能な記録媒体に格納され得る。前記コンピュータ読取り可能な記録媒体は、プログラム命令語、データファイル、データ構造などを単独で又は組み合わせて含むことができる。前記コンピュータ読取り可能な記録媒体に格納されるプログラム命令語は、本発明のために特別に設計され、構成されたものであるか、コンピュータソフトウェア分野の当業者に公知にされて使用可能なものであり得る。コンピュータ読取り可能な記録媒体の例には、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、ＣＤ−ＲＯＭ、ＤＶＤのような光記録媒体、フロプティカルディスク（ＦｌｏｐｔｉｃａｌＤｉｓｋ）のような磁気−光メディア（Ｍａｇｎｅｔｏ−ＯｐｔｉｃａｌＭｅｄｉａ）、及びＲＯＭ、ＲＡＭ、フラッシュメモリなどのようなプログラム命令語を格納して遂行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるもののような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行される高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を実行するために一つ以上のソフトウェアモジュールとして作動するように構成され得、その反対も同様である。

以上にて本発明が具体的な構成要素などのような特定事項と限定された実施例及び図面によって説明されたが、これは本発明のより全般的な理解の一助とするために提供されたものであるに過ぎず、本発明が前記実施例に限られるものではなく、本発明が属する技術分野において通常の知識を有する者であれば、係る記載から多様な修正及び変形が行われ得る。

従って、本発明の思想は、前記説明された実施例に局限されて定められてはならず、後述する特許請求の範囲だけでなく、本特許請求の範囲と均等または等価的に変形されたものすべては、本発明の思想の範囲に属するといえる。

１００：学習装置
２００：テスト装置
１１０、２１０：通信部
１２０、２２０：プロセッサ
１３０：データベース

Claims

１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を利用してＣＮＮのパラメータを学習する方法において、
（ａ）少なくとも一つのトレーニングイメージが取得されると、学習装置は、リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、前記トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させてリシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させる段階；及び
（ｂ）前記学習装置は、出力レイヤをもって、前記調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成し、ロスレイヤをもって、前記出力とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習する段階；
を含むことを特徴とする学習方法。
前記（ａ）段階で、
前記トレーニングイメージまたはこれを加工した特徴マップのチャンネル個数がＫの倍数でない場合、前記学習装置は、前記リシェイプレイヤをもって、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル（ＤｕｍｍｙＣｈａｎｎｅｌ）を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がＫの倍数になるようにした後、前記トレーニングイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するＫ個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項１に記載の学習方法。
前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネル個数をＬとする場合、
前記（ａ）段階で、
前記学習装置は、
前記リシェイプレイヤをもって、幅Ｗ、高さＨｘＫ、チャンネル

である前記リシェイプ済み特徴マップを生成させることを特徴とする請求項１に記載の学習方法。
前記後続コンボリューションレイヤのカーネル（Ｋｅｒｎｅｌ）個数をＭとする場合、
前記（ａ）段階で、
前記学習装置は、
前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記調整特徴マップを生成させることを特徴とする請求項３に記載の学習方法。
前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネル個数をＬとする場合、
前記（ａ）段階で、
前記学習装置は、
前記リシェイプレイヤをもって、幅ＷｘＫ、高さＨ、チャンネル

である前記リシェイプ済み特徴マップを生成させることを特徴とする請求項１に記載の学習方法。
前記後続コンボリューションレイヤのカーネル個数をＭとする場合、
前記（ａ）段階で、
前記学習装置は、
前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記調整特徴マップを生成させることを特徴とする請求項５に記載の学習方法。
前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネル個数をＬとする場合、
前記（ａ）段階で、
前記学習装置が、
前記リシェイプレイヤをもって、（ｉ）幅Ｗ、高さＨｘＫ、チャンネル

である前記リシェイプ済み特徴マップを生成させるか、（ｉｉ）幅ＷｘＫ、高さＨ、チャンネル

である前記リシェイプ済み特徴マップを生成させ、
前記

番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分（ＦｉｎａｌＰａｒｔ）のサイズが幅Ｗ、高さＨｘＫであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング（ＺｅｒｏＰａｄｄｉｎｇ）を追加させて前記

番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅Ｗ、高さＨｘＫであるサイズになるようにするか、前記

番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記

番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズになるようにすることを特徴とする請求項１に記載の学習方法。
１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を利用してＣＮＮをテストする方法において、
（ａ）学習装置が、（ｉ）リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の学習用特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させて学習用リシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記学習用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された学習用調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、（ｉｉ）出力レイヤをもって、前記学習用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して、少なくとも一つの学習用出力を生成させ、ロスレイヤをもって、前記学習用出力とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習した状態で、少なくとも一つのテストイメージが取得されると、テスト装置は、前記リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、前記テストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させてテスト用リシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、前記後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整されたテスト用調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させる段階；及び
（ｂ）前記テスト装置が、前記出力レイヤをもって、前記テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させる段階；
を含むことを特徴とするテスト方法。
前記（ａ）段階で、
前記テストイメージまたはこれを加工した特徴マップのチャンネル個数がＫの倍数でない場合、前記テスト装置は、前記リシェイプレイヤをもって、前記テストイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル（ＤｕｍｍｙＣｈａｎｎｅｌ）を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がＫの倍数になるようにした後、前記テストイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するＫ個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項８に記載のテスト方法。
前記テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、
前記（ａ）段階で、
前記テスト装置は、
前記リシェイプレイヤをもって、幅Ｗ、高さＨｘＫ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする請求項８に記載のテスト方法。
前記後続コンボリューションレイヤのカーネル（Ｋｅｒｎｅｌ）個数をＭとする場合、
前記（ａ）段階で、
前記テスト装置は、
前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする請求項１０に記載のテスト方法。
前記テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、
前記（ａ）段階で、
前記テスト装置は、
前記リシェイプレイヤをもって、幅ＷｘＫ、高さＨ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする請求項１０に記載のテスト方法。
前記後続コンボリューションレイヤのカーネル個数をＭとする場合、
前記（ａ）段階で、
前記テスト装置は、
前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする請求項１２に記載のテスト方法。
前記テストイメージまたは前記これを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、
前記（ａ）段階で、
前記テスト装置が、
前記リシェイプレイヤをもって、（ｉ）幅Ｗ、高さＨｘＫ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させるか、（ｉｉ）幅ＷｘＫ、高さＨ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させ、
前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分（ＦｉｎａｌＰａｒｔ）のサイズが幅Ｗ、高さＨｘＫであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング（ＺｅｒｏＰａｄｄｉｎｇ）を追加させて前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅Ｗ、高さＨｘＫであるサイズになるようにするか、前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズになるようにすることを特徴とする請求項８に記載のテスト方法。
１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を利用してＣＮＮのパラメータを学習する学習装置において、
インストラクションを格納する少なくとも一つのメモリと、
（Ｉ）リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させてリシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させるプロセス、及び（ＩＩ）出力レイヤをもって、前記調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成させ、ロスレイヤをもって、前記出力とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、
を含むことを特徴とする学習装置。
前記（Ｉ）プロセスで、
前記トレーニングイメージまたはこれを加工した特徴マップのチャンネル個数がＫの倍数でない場合、前記プロセッサは、前記リシェイプレイヤをもって、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル（ＤｕｍｍｙＣｈａｎｎｅｌ）を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がＫの倍数になるようにした後、前記トレーニングイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するＫ個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項１５に記載の学習装置。
前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、
前記（Ｉ）プロセスで、
前記プロセッサは、前記リシェイプレイヤをもって、幅Ｗ、高さＨｘＫ、チャンネル

である前記リシェイプ済み特徴マップを生成させることを特徴とする請求項１５に記載の学習装置。
前記後続コンボリューションレイヤのカーネル（Ｋｅｒｎｅｌ）個数をＭとする場合、
前記（Ｉ）プロセスで、
前記プロセッサは、前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記調整特徴マップを生成させることを特徴とする請求項１７に記載の学習装置。
前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、
前記（Ｉ）プロセスで、
前記プロセッサは、
前記リシェイプレイヤをもって、幅ＷｘＫ、高さＨ、チャンネル

である前記リシェイプ済み特徴マップを生成させることを特徴とする請求項１５に記載の学習装置。
前記後続コンボリューションレイヤのカーネル個数をＭとする場合、
前記（Ｉ）プロセスで、
前記プロセッサは、
前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記調整特徴マップを生成させることを特徴とする請求項１９に記載の学習装置。
前記トレーニングイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、
前記（Ｉ）プロセスで、
前記プロセッサは、
前記リシェイプレイヤをもって、（ｉ）幅Ｗ、高さＨｘＫ、チャンネル

である前記リシェイプ済み特徴マップを生成させるか、（ｉｉ）幅ＷｘＫ、高さＨ、チャンネル

である前記リシェイプ済み特徴マップを生成させ、
前記

番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分（ＦｉｎａｌＰａｒｔ）のサイズが幅Ｗ、高さＨｘＫであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング（ＺｅｒｏＰａｄｄｉｎｇ）を追加させて前記

番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅Ｗ、高さＨｘＫであるサイズになるようにするか、前記

番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分のサイズが幅ＷｘＫ、高さＨであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記

番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズとなるようにすることを特徴とする請求項１５に記載の学習装置。
１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を利用してＣＮＮをテストするテスト装置において、
インストラクションを格納する少なくとも一つのメモリと、
学習装置は、（ｉ）リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内の学習用特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させて学習用リシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記学習用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された学習用調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、（ｉｉ）出力レイヤをもって、前記学習用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの学習用出力を生成させ、ロスレイヤをもって、前記学習用出力とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習した状態で、（Ｉ）リシェイプレイヤ（ＲｅｓｈａｐｉｎｇＬａｙｅｒ）をもって、少なくとも一つのテストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するＫ個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを２次元的にコンカチネート（Ｃｏｎｃａｔｅｎａｔｉｎｇ）させてリシェイプ済み特徴マップ（ＲｅｓｈａｐｅｄＦｅａｔｕｒｅＭａｐ）を生成させ、前記後続（Ｓｕｂｓｅｑｕｅｎｔ）コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算またはＫｘ１コンボリューション演算を適用させてボリューム（Ｖｏｌｕｍｅ）が調整された調整特徴マップ（ＡｄｊｕｓｔｅｄＦｅａｔｕｒｅＭａｐ）を生成させるプロセス、及び（ＩＩ）前記出力レイヤをもって、前記テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させるプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、
を含むことを特徴とするテスト装置。
前記（Ｉ）プロセスで、
前記テストイメージまたはこれを加工した特徴マップのチャンネル個数がＫの倍数でない場合、
前記プロセッサは、前記リシェイプレイヤをもって、前記テストイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル（ＤｕｍｍｙＣｈａｎｎｅｌ）を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がＫの倍数になるようにした後、前記テストイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するＫ個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項２２に記載のテスト装置。
前記テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、
前記（Ｉ）プロセスで、
前記プロセッサは、
前記リシェイプレイヤをもって、幅Ｗ、高さＨｘＫ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする請求項２２に記載のテスト装置。
前記後続コンボリューションレイヤのカーネル（Ｋｅｒｎｅｌ）個数をＭとする場合、
前記（Ｉ）プロセスで、
前記プロセッサは、
前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して１ｘＫコンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする請求項２４に記載のテスト装置。
前記テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、
前記（Ｉ）プロセスで、
前記プロセッサは、
前記リシェイプレイヤをもって、幅ＷｘＫ、高さＨ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする請求項２４に記載のテスト装置。
前記後続コンボリューションレイヤのカーネル個数をＭとする場合、
前記（Ｉ）プロセスで、
前記プロセッサは、
前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対してＫｘ１コンボリューション演算を適用させて幅Ｗ、高さＨ、チャンネルＭであるＷｘＨｘＭのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする請求項２６に記載のテスト装置。
前記テストイメージまたはこれを加工した特徴マップの幅をＷ、高さをＨとし、チャンネルの個数をＬとする場合、
前記（Ｉ）プロセスで、
前記プロセッサは、
前記リシェイプレイヤをもって、（ｉ）幅Ｗ、高さＨｘＫ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させるか、（ｉｉ）幅ＷｘＫ、高さＨ、チャンネル

である前記テスト用リシェイプ済み特徴マップを生成させ、
前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分（ＦｉｎａｌＰａｒｔ）のサイズが幅Ｗ、高さＨｘＫであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング（ＺｅｒｏＰａｄｄｉｎｇ）を追加させて前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅Ｗ、高さＨｘＫであるサイズになるようにするか、前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分のサイズが幅ＷｘＫ、高さＨであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記

番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅ＷｘＫ、高さＨであるサイズになるようにすることを特徴とする請求項２２に記載のテスト装置。