JP6857369B2 - Cnnを学習する方法及び学習装置、それを利用したテスト方法及びテスト装置 - Google Patents

Cnnを学習する方法及び学習装置、それを利用したテスト方法及びテスト装置 Download PDF

Info

Publication number
JP6857369B2
JP6857369B2 JP2020001966A JP2020001966A JP6857369B2 JP 6857369 B2 JP6857369 B2 JP 6857369B2 JP 2020001966 A JP2020001966 A JP 2020001966A JP 2020001966 A JP2020001966 A JP 2020001966A JP 6857369 B2 JP6857369 B2 JP 6857369B2
Authority
JP
Japan
Prior art keywords
feature map
test
channel
width
height
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020001966A
Other languages
English (en)
Other versions
JP2020119535A (ja
Inventor
− ヒョン キム、ケイ
− ヒョン キム、ケイ
キム、ヨンジュン
キム、インスー
− キョン キム、ハク
− キョン キム、ハク
ナム、ウヒョン
ブー、ソッフン
ソン、ミュンチュル
ヨー、ドンフン
リュー、ウジュ
チャン、テウン
ジョン、キュンチョン
チェ、ホンモ
チョウ、ホジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Stradvision Inc
Original Assignee
Stradvision Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Stradvision Inc filed Critical Stradvision Inc
Publication of JP2020119535A publication Critical patent/JP2020119535A/ja
Application granted granted Critical
Publication of JP6857369B2 publication Critical patent/JP6857369B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/36Handling requests for interconnection or transfer for access to common bus or bus system
    • G06F13/368Handling requests for interconnection or transfer for access to common bus or bus system with decentralised access control
    • G06F13/378Handling requests for interconnection or transfer for access to common bus or bus system with decentralised access control using a parallel poll method
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Description

ハードウェア最適化に使用される1xKまたはKx1コンボリューション演算を利用したCNNを学習する方法及び学習装置、それを利用したテスト方法及びテスト装置{LEARNING METHOD AND LEARNING DEVICE FOR CNN USING 1xK OR Kx1 CONVOLUTION TO BE USED FOR HARDWARE OPTIMIZATION, AND TESTING METHOD AND TESTING DEVICE USING THE SAME}を提供する。
本発明はハードウェア最適化に使用される1xKまたはKx1コンボリューション演算を利用したCNNのパラメータを学習する方法に関し、より詳細には、前記1xKコンボリューション演算または前記Kx1コンボリューション演算を利用して前記CNNの前記パラメータを学習する方法において、(a)少なくとも一つのトレーニングイメージが取得されると、学習装置は、リシェイプレイヤ(Reshaping Layer)をもって、前記トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを2次元的にコンカチネート(Concatenating)させてリシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された調整特徴マップ(Adjusted Feature Map)を生成させる段階;及び(b)前記学習装置は、出力レイヤをもって、前記調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成させ、ロスレイヤをもって、前記出力とこれに対応する少なくとも一つの原本正解(Ground Truth)とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習する段階;を含むことを特徴とする学習方法及び学習装置、それを利用したテスト方法及びテスト装置に関する。
ディープコンボリューションニューラルネットワーク(Deep ConvolutioN Neural Networks;Deep CNN)は、ディープラーニング分野で起きた驚くべき発展の核心である。CNNは、文字の認識問題を解決するために90年代にすでに使用されていたが、現在のように広く使用されるようになったのは最近の研究結果の賜物である。このようなディープCNNは、2012年ImageNetイメージ分類コンテストで他の競争相手に勝って優勝を収めた。そして、コンボリューションニューラルネットワークは機械学習(Machine Learning)分野で非常に有用なツールとなった。
CNNは、イメージから特徴を抽出する特徴抽出器(Feature Extractor)及びイメージ内の物体を検出したり特徴抽出器が抽出した特徴を参照してイメージを認識する特徴分類器(Feature Classifier)を含む。
そして、CNNの特徴抽出器はコンボリューションレイヤを含み、特徴分類器は、特徴抽出器が抽出した特徴に対してFC演算(Fully Connected Operation)を適用することができる少なくとも一つのFCレイヤを含むことができる。
コンボリューションレイヤは、CNNが行うほぼ大部分の演算において最も重要な部分を占める。
コンボリューションレイヤは、近傍のピクセルに関する情報をさらに利用してローカルレセプティブフィールド(Local Receptive Field)から特徴を抽出する。しかし、コンボリューションレイヤのフィルタ特性(Characteristic)は線形的であるため、フィルタは非線形の特徴を十分に抽出することができない。このような問題を解決するためには、特徴マップの個数を増やさなければならないが、そうすると演算量が増える問題点がある。
したがって、演算量を最小化するために特徴マップの次元を減らすことができる1x1コンボリューションレイヤが使用されている。
1x1コンボリューションレイヤは、複数個の特徴マップから同じような性質を有するものを一まとめにすることができ、結果的に特徴マップの数を減らすことができ、演算量を減らすことができるようになる。
また、演算量が減るようになると、ニューラルネットワークがさらに深くなり得る余地が生じるようになる。
また、1x1コンボリューションレイヤは、イメージセグメンテーションに使用されたりFCレイヤの代わりに特徴抽出器などに使用されている。
この際に、本発明者は、1x1コンボリューションレイヤのコンボリューション演算に比べてより効率的にコンボリューション演算量を減らし得るようにするCNNを提案することにする。
本発明は、上述した問題点を全て解決することをその目的とする。
本発明は、コンボリューション演算量を効率的に減らし得るようにするCNNを提供することを他の目的とする。
本発明は、コンボリューション演算を通じてイメージ上の特徴をより効果的に抽出し得るようにするCNNを提供することをまた他の目的とする。
前記のような本発明の目的を達成し、後述する本発明の特徴的な効果を実現するための、本発明の特徴的な構成は以下の通りである。
本発明の一態様によると、1xKコンボリューション演算またはKx1コンボリューション演算を利用してCNNのパラメータを学習する方法において、(a)少なくとも一つのトレーニングイメージが取得されると、学習装置は、リシェイプレイヤ(Reshaping Layer)をもって、前記トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを2次元的にコンカチネート(Concatenating)させてリシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された調整特徴マップ(Adjusted Feature Map)を生成させる段階;及び(b)前記学習装置は、出力レイヤをもって、前記調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成し、ロスレイヤをもって、前記出力とこれに対応する少なくとも一つの原本正解(Ground Truth)とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習する段階;を含むことを特徴とする。
一実施例において、前記(a)段階で、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネル個数がKの倍数でない場合、前記学習装置は、前記リシェイプレイヤをもって、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がKの倍数になるようにした後、前記トレーニングイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するK個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。
一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネル個数をLとする場合、前記(a)段階で、前記学習装置は、前記リシェイプレイヤをもって、幅W、高さHxK、チャンネル
Figure 0006857369
である前記リシェイプ済み特徴マップを生成させることを特徴とする。
一実施例において、前記後続コンボリューションレイヤのカーネル(Kernel)個数をMとする場合、前記(a)段階で、前記学習装置は、前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記調整特徴マップを生成させることを特徴とする。
一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネル個数をLとする場合、前記(a)段階で、前記学習装置は、前記リシェイプレイヤをもって、幅WxK、高さH、チャンネル
Figure 0006857369
である前記リシェイプ済み特徴マップを生成させることを特徴とする。
一実施例において、前記後続コンボリューションレイヤのカーネル個数をMとする場合、前記(a)段階で、前記学習装置は、前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記調整特徴マップを生成させることを特徴とする。
一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネル個数をLとする場合、前記(a)段階で、前記学習装置は、前記リシェイプレイヤをもって、(i)幅W、高さHxK、チャンネル
Figure 0006857369
である前記リシェイプ済み特徴マップを生成させるか、(ii)幅WxK、高さH、チャンネル
Figure 0006857369
である前記リシェイプ済み特徴マップを生成させ、前記
Figure 0006857369
番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分(Final Part)のサイズが幅W、高さHxKであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング(Zero Padding)を追加させて前記
Figure 0006857369
番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅W、高さHxKであるサイズになるようにするか、前記
Figure 0006857369
番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記
Figure 0006857369
番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズになるようにすることを特徴とする。
本発明の他の態様によると、1xKコンボリューション演算またはKx1コンボリューション演算を利用してCNNをテストする方法において、(a)学習装置が、(i)リシェイプレイヤ(Reshaping Layer)をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の学習用特徴それぞれを2次元的にコンカチネート(Concatenating)させて学習用リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、前記学習用リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された学習用調整特徴マップ(Adjusted Feature Map)を生成させ、(ii)出力レイヤをもって、前記学習用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して、少なくとも一つの学習用出力を生成させ、ロスレイヤをもって、前記学習用出力とこれに対応する少なくとも一つの原本正解(Ground Truth)とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習した状態で、少なくとも一つのテストイメージが取得されると、テスト装置は、前記リシェイプレイヤ(Reshaping Layer)をもって、前記テストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを2次元的にコンカチネート(Concatenating)させてテスト用リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、前記後続(Subsequent)コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整されたテスト用調整特徴マップ(Adjusted Feature Map)を生成させる段階;及び(b)前記テスト装置が、前記出力レイヤをもって、前記テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させる段階;を含むことを特徴とする。
一実施例において、前記(a)段階で、前記テストイメージまたはこれを加工した特徴マップのチャンネル個数がKの倍数でない場合、前記テスト装置は、前記リシェイプレイヤをもって、前記テストイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がKの倍数になるようにした後、前記テストイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するK個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。
一実施例において、前記テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、前記(a)段階で、前記テスト装置は、前記リシェイプレイヤをもって、幅W、高さHxK、チャンネル
Figure 0006857369
である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする。
一実施例において、前記後続コンボリューションレイヤのカーネル(Kernel)個数をMとする場合、前記(a)段階で、前記テスト装置は、前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする。
一実施例において、前記テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、前記(a)段階で、前記テスト装置は、前記リシェイプレイヤをもって、幅WxK、高さH、チャンネル
Figure 0006857369
である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする。
一実施例において、前記後続コンボリューションレイヤのカーネル個数をMとする場合、前記(a)段階で、前記テスト装置は、前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする。
一実施例において、前記テストイメージまたは前記これを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、前記(a)段階で、前記テスト装置が前記リシェイプレイヤをもって、(i)幅W、高さHxK、チャンネル
Figure 0006857369
である前記テスト用リシェイプ済み特徴マップを生成させるか、(ii)幅WxK、高さH、チャンネル
Figure 0006857369
である前記テスト用リシェイプ済み特徴マップを生成させ、前記
Figure 0006857369
番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分(Final Part)のサイズが幅W、高さHxKであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング(Zero Padding)を追加させて前記
Figure 0006857369
番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅W、高さHxKであるサイズになるようにするか、前記
Figure 0006857369
番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記
Figure 0006857369
番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズになるようにすることを特徴とする。
本発明のまた他の態様によると、1xKコンボリューション演算またはKx1コンボリューション演算を利用してCNNのパラメータを学習する学習装置において、インストラクションを格納する少なくとも一つのメモリと、(I)リシェイプレイヤ(Reshaping Layer)をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを2次元的にコンカチネート(Concatenating)させてリシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された調整特徴マップ(Adjusted Feature Map)を生成させるプロセス、及び(II)出力レイヤをもって、前記調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成させ、ロスレイヤをもって、前記出力とこれに対応する少なくとも一つの原本正解(Ground Truth)とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、を含むことを特徴とする。
一実施例において、前記(I)プロセスで、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネル個数がKの倍数でない場合、前記プロセッサは、前記リシェイプレイヤをもって、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がKの倍数になるようにした後、前記トレーニングイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するK個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。
一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、前記(I)プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、幅W、高さHxK、チャンネル
Figure 0006857369
である前記リシェイプ済み特徴マップを生成させることを特徴とする。
一実施例において、前記後続コンボリューションレイヤのカーネル(Kernel)個数をMとする場合、前記(I)プロセスで、前記プロセッサは、前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記調整特徴マップを生成させることを特徴とする。
一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、前記(I)プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、幅WxK、高さH、チャンネル
Figure 0006857369
である前記リシェイプ済み特徴マップを生成させることを特徴とする。
一実施例において、前記後続コンボリューションレイヤのカーネル個数をMとする場合、前記(I)プロセスで、前記プロセッサは、前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記調整特徴マップを生成させることを特徴とする。
一実施例において、前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、前記(I)プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、(i)幅W、高さHxK、チャンネル
Figure 0006857369
である前記リシェイプ済み特徴マップを生成させるか、(ii)幅WxK、高さH、チャンネル
Figure 0006857369
である前記リシェイプ済み特徴マップを生成させ、前記
Figure 0006857369
番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分(Final Part)のサイズが幅W、高さHxKであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング(Zero Padding)を追加させて前記
Figure 0006857369
番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅W、高さHxKであるサイズになるようにするか、前記
Figure 0006857369
番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分のサイズが幅WxK、高さHであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記
Figure 0006857369
番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズとなることを特徴とする。
本発明のまた他の態様によると、1xKコンボリューション演算またはKx1コンボリューション演算を利用してCNNをテストするテスト装置において、インストラクションを格納する少なくとも一つのメモリと、学習装置は、(i)リシェイプレイヤ(Reshaping Layer)をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の学習用特徴それぞれを2次元的にコンカチネート(Concatenating)させて学習用リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、前記学習用リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された学習用調整特徴マップ(Adjusted Feature Map)を生成させ、(ii)出力レイヤをもって、前記学習用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの学習用出力を生成させ、ロスレイヤをもって、前記学習用出力とこれに対応する少なくとも一つの原本正解(Ground Truth)とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習した状態で、(I)リシェイプレイヤ(Reshaping Layer)をもって、少なくとも一つのテストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを2次元的にコンカチネート(Concatenating)させてリシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、前記後続(Subsequent)コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された調整特徴マップ(Adjusted Feature Map)を生成させるプロセス、及び(II)前記出力レイヤをもって、前記テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させるプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、を含むことを特徴とする。
一実施例において、前記(I)プロセスで、前記テストイメージまたはこれを加工した特徴マップのチャンネル個数がKの倍数でない場合、前記プロセッサは、前記リシェイプレイヤをもって、前記テストイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がKの倍数になるようにした後、前記テストイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するK個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。
一実施例において、前記テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、前記(I)プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、幅W、高さHxK、チャンネル
Figure 0006857369
である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする。
一実施例において、前記後続コンボリューションレイヤのカーネル(Kernel)個数をMとする場合、前記(I)プロセスで、前記プロセッサは、前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする。
一実施例において、前記テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、前記(I)プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、幅WxK、高さH、チャンネル
Figure 0006857369
である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする。
一実施例において、前記後続コンボリューションレイヤのカーネル個数をMとする場合、前記(I)プロセスで、前記プロセッサは、前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする。
一実施例において、前記テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、前記(I)プロセスで、前記プロセッサは、前記リシェイプレイヤをもって、(i)幅W、高さHxK、チャンネル
Figure 0006857369
である前記テスト用リシェイプ済み特徴マップを生成させるか、(ii)幅WxK、高さH、チャンネル
Figure 0006857369
である前記テスト用リシェイプ済み特徴マップを生成させ、前記
Figure 0006857369
番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分(Final Part)のサイズが幅W、高さHxKであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング(Zero Padding)を追加させて前記
Figure 0006857369
番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅W、高さHxKであるサイズになるようにするか、前記
Figure 0006857369
番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分のサイズが幅WxK、高さHであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記
Figure 0006857369
番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズになるようにすることを特徴とする。
その他にも、本発明の方法を実行するためのコンピュータプログラムを格納するためのコンピュータ読取り可能な記録媒体がさらに提供される。
本発明は、1xKまたはKx1コンボリューション演算を利用してCNNのコンボリューション演算量を効率的に減らすことができる効果がある。
また、本発明は、1xKまたはKx1コンボリューション演算を利用した分だけ入力された特徴マップまたはイメージのチャンネル個数を増加させることができるので、コンボリューション演算を通じてイメージ上の特徴を効果的に抽出することができる他の効果がある。
本発明の実施例の説明に利用されるために添付された以下の各図面は、本発明の実施例のうちの一部に過ぎず、本発明が属する技術分野において通常の知識を有する者(以下「通常の技術者」)にとっては、発明的作業が行われることなくこの各図面に基づいて他の図面が得られ得る。
本発明の一実施例による1xKまたはKx1コンボリューション演算を利用してCNNを学習する学習装置を簡略に示したものである。 本発明の一実施例による1xKまたはKx1コンボリューション演算を利用してCNNを学習する方法を簡略に示したものである。 本発明の一実施例による1xKまたはKx1コンボリューション演算を利用してCNNを学習するためのトレーニングイメージまたはこれを加工した特徴マップを簡略に示したものである。 本発明の一実施例による(i)トレーニングイメージまたはこれを加工した特徴マップをリシェイプして生成されたリシェイプ済み特徴マップと、(ii)リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用して生成された調整特徴マップとを簡略に示したものである。 本発明の一実施例による(i)トレーニングイメージまたはこれを加工した特徴マップをリシェイプして生成されたリシェイプ済み特徴マップと、(ii)リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用して生成された調整特徴マップとを簡略に示したものである。 本発明の一実施例による(i)トレーニングイメージまたはこれを加工した特徴マップをリシェイプして生成されたリシェイプ済み特徴マップと、(ii)リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用して生成された調整特徴マップとを簡略に示したものである。 本発明の一実施例による(i)トレーニングイメージまたはこれを加工した特徴マップをリシェイプして生成されたリシェイプ済み特徴マップと、(ii)リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用して生成された調整特徴マップとを簡略に示したものである。 本発明の一実施例による1xKまたはKx1コンボリューション演算を利用してCNNをテストするテスト装置を簡略に示したものである。 本発明の一実施例による1xKまたはKx1コンボリューション演算を利用してCNNをテストする方法を簡略に示したものである。
後述する本発明に関する詳細な説明は、本発明の各目的、各技術的解法、及び各長所を明らかにするために本発明が実施され得る特定の実施例を例示として示す添付図面を参照する。これらの実施例は、当業者が本発明を実施することができるように十分詳細に説明される。
また、本発明の詳細な説明及び各請求項にわたって、「含む」という単語及びそれらの変形は、他の技術的各特徴、各付加物、構成要素または段階を除外することを意図したものではない。通常の技術者にとって本発明の他の各目的、長所及び各特性が、一部は本説明書から、また一部は本発明の実施から明らかになるであろう。以下の例示及び図面は実例として提供され、本発明を限定することを意図したものではない。
さらに、本発明は、本明細書に示された実施例のすべての可能な組合せを網羅する。本発明の多様な実施例は互いに異なるが、相互に排他的である必要はないことが理解されるべきである。例えば、ここに記載されている特定の形状、構造及び特性は、一実施例に関連して本発明の精神及び範囲を逸脱せず、かつ他の実施例で具現され得る。また、それぞれの開示された実施例内の個別の構成要素の位置又は配置は、本発明の精神及び範囲を逸脱せず、かつ変更され得ることが理解されるべきである。したがって、後述の詳細な説明は、限定的な意味として受け取ろうとするものではなく、本発明の範囲は適切に説明されるのであれば、その請求項が主張することと均等な全ての範囲とともに添付された請求項によってのみ限定される。図面において類似の参照符号は、様々な側面にわたって同一であるか、又は類似の機能を指す。
本発明で言及している各種イメージは、舗装または非舗装道路関連のイメージを含み得、この場合、道路環境で登場し得る物体(例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物)を想定し得るが、必ずしもこれに限定されるものではなく、本発明で言及している各種イメージは、道路と関係のないイメージ(例えば、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内と関連したイメージ)でもあり得、この場合、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内環境で登場し得る物体(例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物)を想定し得るが、必ずしもこれに限定されるものではない。
以下、本発明の属する技術分野において通常の知識を有する者が本発明を容易に実施し得るようにするために、本発明の好ましい実施例に関して添付された図面を参照して詳細に説明することにする。
図1は、本発明の一実施例による1xKまたはKx1コンボリューション演算を利用してCNNを学習する学習装置を簡略に示したものであって、図1を参照すると、学習装置100は通信部110とプロセッサ120とを含むことができる。
まず、通信部110は、少なくとも一つのトレーニングイメージを受信することができる。
この際、トレーニングイメージはデータベース130に格納されていてもよく、データベース130にはトレーニングイメージに対応して少なくとも一つの物体それぞれに対するクラス情報の少なくとも一つの原本正解(Ground Truth)及びそれぞれの物体に対する位置情報の少なくとも一つの原本正解が格納されていてもよい。
また、学習装置は、次のプロセスを遂行するためのコンピュータ読取り可能なインストラクション(Instruction)を格納することができるメモリ115をさらに含むことができる。一実施例によると、プロセッサ、メモリ、媒体等は統合プロセッサ(Integrated Processor)として統合され得る。
次に、プロセッサ120は、リシェイプレイヤ(Reshaping Layer)をもって、トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを2次元的にコンカチネート(Concatenating)させてリシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された調整特徴マップ(Adjusted Feature Map)を生成させるプロセスを遂行することができる。ここで、前記加工した特徴マップは、(i)トレーニングイメージに対してコンボリューション演算を少なくとも一回適用する方法、(ii)前記(i)の方法の結果に対して後続演算(例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など)を適用する方法、及び(iii)前記(ii)の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。そして、プロセッサ120は、出力レイヤをもって、調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成させ、ロスレイヤをもって、出力とこれに対応する少なくとも一つの原本正解(Ground Truth)とを参照して少なくとも一つのロスを算出させることにより、ロスをバックプロパゲーションして後続コンボリューションレイヤの少なくとも一部のパラメータを学習するプロセスを遂行することができる。
この際、本発明の一実施例による学習装置100は、コンピューティング装置であって、プロセッサを搭載して演算能力を備えた装置であればいくらでも本発明による学習装置100として採択され得る。また、図1では、一つの学習装置100のみを示したが、これに限定されず、学習装置は複数個に分けて役割を遂行することもできる。
このように構成された本発明の一実施例による学習装置100を用いて、1xKまたはKx1コンボリューション演算を利用してCNNを学習する方法を、図2を参照して説明すると以下の通りである。
まず、トレーニングイメージが入力されると、学習装置100が、前処理(Pre−Processing)レイヤ121をもって、トレーニングイメージを前処理して加工した特徴マップを生成させることができる。
この際、前処理レイヤ121は、コンボリューションレイヤ、バッチ正規化レイヤ、アクティベーションレイヤ、プーリングレイヤのうち少なくとも一つを含むことができ、加工した特徴マップを生成することができる。ここで、前記加工した特徴マップは、(i)トレーニングイメージに対してコンボリューション演算を適用する方法、(ii)前記(i)の方法の結果に対して後続演算(例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など)を適用する方法、及び(iii)前記(ii)の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。しかし、前処理レイヤ121はこれに限定されず、前処理レイヤ121はイメージ処理のためのCNNを構成するそれぞれのレイヤを含むことができる。
次に、学習装置100はリシェイプレイヤをもって、トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを2次元的にコンカチネートさせてリシェイプ済み特徴マップを生成させることができる。この際、学習装置100は前処理レイヤ121をもって、トレーニングイメージを前処理させずにトレーニングイメージを直接的にリシェイプレイヤ122に入力することもできる。
この場合、トレーニングイメージまたはそれを加工した特徴マップのチャンネル個数がKの倍数でない場合、学習装置100はリシェイプレイヤ122をもって、それぞれのピクセルに対応するチャンネルに少なくとも一つのダミーチャンネル(Dummy Channel)を追加させて少なくとも一つのダミーチャンネルを含むチャンネルの個数がKの倍数になるようにした後、トレーニングイメージまたはこれを加工した特徴マップの少なくとも一つのダミーチャンネルを含む全てのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせることができる。
すなわち、トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、学習装置100はリシェイプレイヤ122をもって、(i)幅W、高さHxK、チャンネル
Figure 0006857369
であるリシェイプ済み特徴マップを生成させるか、(ii)幅WxK、高さH、チャンネル
Figure 0006857369
であるリシェイプ済み特徴マップを生成させることができる。
Figure 0006857369
番目のチャンネル上のリシェイプ済み特徴マップの最終部分(Final Part)のサイズが幅W、高さHxKであるサイズにならない場合には、学習装置100はリシェイプレイヤ122をもって、少なくとも一つのゼロパディング(Zero Padding)を追加させて
Figure 0006857369
番目のチャンネル上のリシェイプ済み特徴マップの最終部分のサイズが幅W、高さHxKであるサイズになるようにするか、
Figure 0006857369
番目のチャンネル上のリシェイプ済み特徴マップの最終部分のサイズが幅WxK、高さHであるサイズにならない場合には、リシェイプレイヤ122をもって、少なくとも一つのゼロパディングを追加させて
Figure 0006857369
番目のチャンネル上のリシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズになるようにすることができる。
一例として、図3を参照すると、トレーニングイメージまたはこれを加工した特徴マップ300の幅をW、高さをHとし、チャンネルの個数をLとする場合、トレーニングイメージまたはこれを加工した特徴マップ300の最初のチャンネル(C1)上のそれぞれのピクセルに対応するそれぞれの特徴は、それぞれC1F11、…、C1F22、…、C1FWHのように表すことができる。そして、トレーニングイメージまたはこれを加工した特徴マップ300の他のチャンネルC2、C3、…、CL上のそれぞれのピクセルに対応するそれぞれの特徴も同じ方法で表すことができる。
そして、図3と図4aを参照すると、図3のトレーニングイメージまたはこれを加工した特徴マップ300上のピクセルであるC1F11に対応するK個のチャンネルの特徴であるC1F11、C2F11、…、CKF11をコンカチネートし、トレーニングイメージまたはこれを加工した特徴マップ300上のピクセルC1F21に対応するK個のチャンネルの特徴であるC1F21、C2F21、…、CKF21をコンカチネートし、トレーニングイメージまたはこれを加工した特徴マップ300上のピクセルC1FWHに対応するK個のチャンネルの特徴であるC1FWH、C2FWH、…、CKFWHをコンカチネートすることと同じである。つまり、トレーニングイメージまたはこれを加工した特徴マップ300上のすべてのピクセルに対応してそれぞれK個のチャンネルの特徴をコンカチネートしてリシェイプ済み特徴マップ400Aを生成するようになる。
この際、リシェイプ済み特徴マップ400Aは、幅W、高さHxK、チャンネル
Figure 0006857369
を有するようになる。そして、リシェイプ済み特徴マップ400Aのそれぞれのチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ300のK個のチャンネルから構成されたそれぞれのグループに対応し得る。つまり、リシェイプ済み特徴マップ400Aの最初のチャンネルはトレーニングイメージまたはこれを加工した特徴マップ300の最初のないしK番目のチャンネルに対応し、リシェイプ済み特徴マップ400Aの二番目のチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ300のK+1番目のチャンネルないし2xK番目のチャンネルに対応し得る。そして、リシェイプ済み特徴マップ400Aの
Figure 0006857369
番目のチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ300の
Figure 0006857369
番目のチャンネルないしL番目のチャンネルに対応し得る。
次に、学習装置100は、後続コンボリューションレイヤ123をもって、リシェイプ済み特徴マップ400Aに対して1xKコンボリューション演算を適用させてボリュームが調整された調整特徴マップ400Bを生成させることができる。
一例として、図4aと図4bを参照すると、図4aのリシェイプ済み特徴マップ400A上の1xKサイズに対応するC1F11、C2F11、…、CKF11に対して1xKコンボリューション演算を適用してC1F11’ピクセルの特徴を生成し、C1F22、C2F22、…、CKF22に対して1xKコンボリューション演算を適用してC1F22’ピクセルの特徴を生成し、C1FWH、C2FWH、…、CKFWHに対して1xKコンボリューション演算を適用してC1FWH’ピクセルの特徴を生成することと同じである。この場合、1xKサイズは、コンボリューションレイヤのカーネルサイズであり得る。その結果、図4aのリシェイプ済み特徴マップ400Aに対して1xKコンボリューション演算を適用して図4bのように幅W、高さHである調整特徴マップ400Bを生成するようになる。したがって、図3のトレーニングイメージまたはこれを加工した特徴マップ300に対して1x1コンボリューション演算を適用するのに比べて、リシェイプ済み特徴マップ400Aを生成して1xKコンボリューション演算を遂行することにより、演算量を1/Kに減らすことができるようになり、それに伴ってコンボリューション演算速度をK倍だけ増加させることができるようになる。この際、調整特徴マップ400Bのチャンネルの個数は、1xKコンボリューション演算を遂行する後続コンボリューションレイヤ123のカーネル個数、すなわち、フィルタの個数に対応し得る。一例として、後続コンボリューションレイヤ123のカーネル個数をMとする場合、調整特徴マップ400BのチャンネルはM個になり得る。
一方、前記では1xKコンボリューション演算を使用する方法を説明したが、トレーニングイメージまたはこれを加工した特徴マップ300のK個のチャンネルの特徴を幅方向にコンカチネートした後、Kx1コンボリューション演算を遂行することもできる。
そして、図3と図5aを参照すると、図3のトレーニングイメージまたはこれを加工した特徴マップ300上のピクセルであるC1F11に対応するK個のチャンネルの特徴であるC1F11、C2F11、…、CKF11を幅方向にコンカチネートし、トレーニングイメージまたはこれを加工した特徴マップ300上のピクセルC1F12に対応するK個のチャンネルの特徴であるC1F12、C2F12、…、CKF12を幅方向にコンカチネートし、トレーニングイメージまたはこれを加工した特徴マップ300上のピクセルC1FWHに対応するK個のチャンネルの特徴であるC1FWH、C2FWH、…、CKFWHを幅の方向にコンカチネートすることと同じである。つまり、トレーニングイメージまたはこれを加工した特徴マップ300上のすべてのピクセルに対応してそれぞれK個のチャンネルの特徴を幅方向にコンカチネートしてリシェイプ済み特徴マップ500Aを生成するようになる。
この際、リシェイプ済み特徴マップ500Aは、幅WxK、高さH、チャンネル
Figure 0006857369
になる。そして、リシェイプ済み特徴マップ500Aのそれぞれのチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ300のK個のチャンネルから構成されたそれぞれのグループに対応し得る。すなわち、リシェイプ済み特徴マップ500Aの最初のチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ300の最初のチャンネルないしK番目のチャンネルに対応し、リシェイプ済み特徴マップ500Aの二番目のチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ300のK+1番目のチャンネルないし2xK番目のチャンネルに対応し得る。そして、リシェイプ済み特徴マップ500Aの
Figure 0006857369
番目のチャンネルは、トレーニングイメージまたはこれを加工した特徴マップ300の
Figure 0006857369
番目のチャンネルないしL番目のチャンネルに対応し得る。
次に、学習装置100は、後続コンボリューションレイヤ123をもって、リシェイプ済み特徴マップ500Aに対してKx1コンボリューション演算を適用させてボリュームが調整された調整特徴マップ500Bを生成させることができる。
一例として、図5aと図5bを参照すると、図5aのリシェイプ済み特徴マップのKx1サイズに対応するC1F11、C2F11、…、CKF11に対してKx1コンボリューション演算を適用してC1F11”ピクセルの特徴を生成し、C1F12、C2F12、…、CKF12に対してKx1コンボリューション演算を適用してC1F12”ピクセルの特徴を生成し、C1FWH、C2FWH、…、CKFWHに対してKx1コンボリューション演算を適用してC1FWH”ピクセルの特徴を生成することと同じである。この際、Kx1サイズは、コンボリューションレイヤのカーネルサイズであり得る。その結果、図5aのリシェイプ済み特徴マップ500Aに対してKx1コンボリューション演算を適用して図5bのように幅W、高さHである調整特徴マップ500Bを生成するようになる。
次に、学習装置100は、後処理(Post−Processing)レイヤ124をもって、後続コンボリューションレイヤ123から出力される調整特徴マップ500Bを後処理させることができる。この際、後処理レイヤ124は、コンボリューションレイヤ、バッチ正規化レイヤ、アクティベーションレイヤ、プーリングレイヤ、FCレイヤのうち少なくとも一つを含むことができ、後続コンボリューションレイヤ123から出力される調整特徴マップ500Bまたはこれを加工した特徴マップの分類された特徴を表す確率情報を生成することができる。しかし、後処理レイヤ124はこれに限定されず、後処理レイヤ124はイメージ処理のためのCNNを構成するそれぞれのレイヤを含むことができる。
次に、学習装置100は、出力レイヤ125をもって、調整特徴マップ500Bまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成させ、ロスレイヤ126をもって、前記出力とこれに対応する原本正解とを参照して少なくとも一つのロスを算出させることにより、ロスをバックプロパゲーションして後続コンボリューションレイヤのパラメータを少なくとも一部学習することができる。この場合、学習装置100は後処理レイヤ124をもって、調整特徴マップ500Bを後処理させずに調整特徴マップ500Bを直接的に出力レイヤ122に入力することもできる。
図6は、本発明の一実施例による1xKまたはKx1コンボリューション演算を利用してCNNをテストするテスト装置を簡略に示したものであって、図6を参照すると、テスト装置200は通信部210とプロセッサ220とを含むことができる。
また、テスト装置は、次のプロセスを遂行するためのコンピュータ読取り可能なインストラクション(Instruction)を格納することができるメモリ215をさらに含むことができる。一実施例によると、プロセッサ、メモリ、媒体等は統合プロセッサ(Integrated Processor)として統合され得る。
先ず、通信部210は、少なくとも一つのテストイメージを取得するか、他の装置をもって取得するように支援することができる。
この際、本発明の一実施例による1xKまたはKx1コンボリューション演算を利用したCNNは、図2ないし図5bを参照して説明した学習方法によって学習された状態であり得る。
参考までに、以下の説明で混同を避けるために「学習用」という文句は、先に説明した学習プロセスと関連する用語について追加され、「テスト用」という文句はテストプロセスと関連する用語について追加される。
つまり、少なくとも一つのトレーニングイメージが取得されると、学習装置が、(a)リシェイプレイヤ(Reshaping Layer)をもって、トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の学習用特徴それぞれを2次元的にコンカチネート(Concatenating)させて学習用リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、学習用リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された学習用調整特徴マップ(Adjusted Feature Map)を出力させるプロセスを遂行した状態であり得る。ここで、前記学習用加工した特徴マップは、(i)トレーニングイメージに対してコンボリューション演算を少なくとも一回適用する方法、(ii)前記(i)の方法の結果に対して後続演算(例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など)を適用する方法、及び(iii)前記(ii)の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。学習装置が、(b)出力レイヤをもって、学習用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの学習用出力を生成させ、ロスレイヤをもって、学習用出力とこれに対応する少なくとも一つの原本正解とを参照して少なくとも一つのロスを算出させることにより、ロスをバックプロパゲーションして後続コンボーションレイヤの少なくとも一部のパラメータを学習するプロセスを遂行した状態であり得る。
次に、プロセッサ220はリシェイプレイヤをもって、テストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを2次元的にコンカチネートさせてテスト用リシェイプ済み特徴マップを生成させ、後続コンボリューションレイヤをもって、テスト用リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリュームが調整されたテスト用調整特徴マップを生成させるプロセスを遂行することができる。ここで、前記テスト用加工した特徴マップは、(i)テストイメージに対してコンボリューション演算を少なくとも一回適用する方法、(ii)前記(i)の方法の結果に対して後続演算(例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など)を適用する方法、及び(iii)前記(ii)の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。そして、プロセッサ220は出力レイヤをもって、テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させることができる。
この際、本発明の一実施例によるテスト装置200は、コンピューティング装置であって、プロセッサを搭載して演算能力を備えた装置であればいくらでも本発明によるテスト装置200として採択され得る。また、図6では一つのテスト装置200のみを示したが、これに限定されず、テスト装置は複数個に分けて役割を遂行することもできる。
このように構成された本発明の一実施例によるテスト装置200を利用して、1xKまたはKx1コンボリューション演算を利用したCNNをテストする方法を、図7を参照して説明すると以下のとおりである。以下の説明において、図1ないし図5bを参照して説明した学習方法から容易に理解可能な部分については、詳細な説明を省略することとする。
まず、図1ないし図7を参照して説明した学習方法によって後続コンボリューションレイヤ223が学習された状態で、テストイメージが入力されると、テスト装置200が、前処理レイヤ221をもって、テストイメージを前処理させてテスト用加工した特徴マップを生成させることができる。
この際、前処理レイヤ221は、コンボリューションレイヤ、バッチ正規化レイヤ、アクティベーションレイヤ、プーリングレイヤのうち少なくとも一つを含むことができ、テストイメージに対してコンボリューション演算を適用してテスト用加工した特徴マップを生成することができる。ここで、前記テスト用加工した特徴マップは、(i)テストイメージに対してコンボリューション演算を少なくとも一回適用する方法、(ii)前記(i)の方法の結果に対して後続演算(例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など)を適用する方法、及び(iii)前記(ii)の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。しかし、前処理レイヤ221はこれに限定されず、前処理レイヤ221はイメージ処理のためのCNNを構成するそれぞれのレイヤを含むことができる。
次に、テスト装置200は、リシェイプレイヤ222をもって、テストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを2次元的にコンカチネートさせてテスト用リシェイプ済み特徴マップを生成させることができる。ここで、前記テスト用加工した特徴マップは、(i)テストイメージに対してコンボリューション演算を少なくとも一回適用する方法、(ii)前記(i)の方法の結果に対して後続演算(例えば、バッチ正規化演算、アクティベーション演算、プーリング演算など)を適用する方法、及び(iii)前記(ii)の方法の結果に対してコンボリューション演算をさらに適用する方法のうち少なくとも一つによって生成された特徴マップである。この際、テスト装置200は前処理レイヤ221をもって、テストイメージを前処理させずにテストイメージを直接的にリシェイプレイヤ222に入力することもできる。
この場合、テストイメージまたはこれを加工した特徴マップのチャンネルの個数がKの倍数でない場合、テスト装置200はリシェイプレイヤ222をもって、それぞれのピクセルに対応するチャンネルに少なくとも一つのダミーチャンネル(Dummy Channel)を追加させて少なくとも一つのダミーチャンネルを含むチャンネルの個数がKの倍数になるようにした後、テストイメージまたはこれを加工した特徴マップの少なくとも一つのダミーチャンネルを含む全てのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせることができる。
すなわち、テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、テスト装置200は、リシェイプレイヤ222をもって、(i)幅W、高さHxK、チャンネル
Figure 0006857369
であるテスト用リシェイプ済み特徴マップを生成させるか、(ii)幅WxK、高さH、チャンネル
Figure 0006857369
であるテスト用リシェイプ済み特徴マップを生成させることができる。そして、
Figure 0006857369
番目のチャンネル上のテスト用リシェイプ済み特徴マップの最終部分のサイズが幅W、高さHxKであるサイズにならない場合には、テスト装置200はリシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて
Figure 0006857369
番目のチャンネル上のテスト用リシェイプ済み特徴マップの最終部分のサイズが幅W、高さHxKであるサイズになるようにするか、
Figure 0006857369
番目のチャンネル上のテスト用リシェイプ済み特徴マップの最終部分のサイズが幅WxK、高さHであるサイズにならない場合には、テスト装置200はリシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて
Figure 0006857369
番目のチャンネル上のリシェイプ済み特徴マップの最終部分のサイズが幅WxK、高さHであるサイズになるようにすることができる。
この際、テスト用リシェイプ済み特徴マップは、幅W、高さHxK、チャンネル
Figure 0006857369
になる。そして、テスト用リシェイプ済み特徴マップのそれぞれのチャンネルは、テストイメージまたはこれを加工した特徴マップのK個のチャンネルから構成されたそれぞれのグループに対応し得る。つまり、テスト用リシェイプ済み特徴マップの最初のチャンネルは、テストイメージまたはこれを加工した特徴マップの最初のチャンネルないしK番目のチャンネルに対応し、テスト用リシェイプ済み特徴マップの二番目のチャンネルは、テストイメージまたはこれを加工した特徴マップのK+1番目のチャンネルないし2xK番目のチャンネルに対応し得る。そして、テスト用リシェイプ済み特徴マップの
Figure 0006857369
番目のチャンネルは、テストイメージまたはこれを加工した特徴マップの
Figure 0006857369
番目のチャンネルないしL番目のチャンネルに対応し得る。
以後、テスト装置200は、後続コンボリューションレイヤ223をもって、テスト用リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用してボリュームが調整されたテスト用調整特徴マップを生成させることができる。この際、テスト用調整特徴マップのチャンネルの個数は、1xKコンボリューション演算を遂行する後続コンボリューションレイヤ223のカーネル個数、すなわち、フィルタの個数に対応し得る。一例として、後続コンボリューションレイヤ223のカーネル個数をMとする場合、テスト用調整特徴マップのチャンネルはM個になり得る。
一方、前記では1xKコンボリューション演算のための方法を説明したが、テストイメージまたはこれを加工した特徴マップのK個のチャンネルの特徴を幅方向にコンカチネートした後、Kx1コンボリューション演算を遂行することもできる。
つまり、図5aを参照して説明したように、テスト用リシェイプ済み特徴マップは幅WxK、高さH、チャンネル
Figure 0006857369
になり得る。この際、テスト用リシェイプ済み特徴マップのそれぞれのチャンネルは、テストイメージまたはこれを加工した特徴マップのK個のチャンネルから構成されたそれぞれのグループに対応し得る。
そして、テスト装置200は、後続コンボリューションレイヤ223をもって、テスト用リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用してボリュームが調整されたテスト用調整特徴マップを生成させることができる。
次に、テスト装置100は、後処理レイヤ224をもって、後続コンボリューションレイヤ223から出力されるテスト用調整特徴マップを後処理させることができる。この際、後処理レイヤ224は、コンボリューションレイヤ、バッチ正規化レイヤ、アクティベーションレイヤ、プーリングレイヤ、FCレイヤのうち少なくとも一つを含むことができ、後続コンボリューションレイヤ223から出力されるテスト用調整特徴マップまたはこれを加工した特徴マップの分類された特徴を表す確率情報を生成することができる。しかし、後処理レイヤ224はこれに限定されず、イメージ処理のためのCNNを構成するそれぞれのレイヤを含むことができる。
次に、テスト装置200は、出力レイヤ225をもって、テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させることができる。
本発明による方法は、KPI(Key Performance Index、重要業績評価指標)を満たすハードウェア最適化に使用されるために提供され得る。
また、以上にて説明された本発明による実施例は、多様なコンピュータの構成要素を通じて遂行することができるプログラム命令語の形態で具現されて、コンピュータ読取り可能な記録媒体に格納され得る。前記コンピュータ読取り可能な記録媒体は、プログラム命令語、データファイル、データ構造などを単独で又は組み合わせて含むことができる。前記コンピュータ読取り可能な記録媒体に格納されるプログラム命令語は、本発明のために特別に設計され、構成されたものであるか、コンピュータソフトウェア分野の当業者に公知にされて使用可能なものであり得る。コンピュータ読取り可能な記録媒体の例には、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスク(Floptical Disk)のような磁気−光メディア(Magneto−Optical Media)、及びROM、RAM、フラッシュメモリなどのようなプログラム命令語を格納して遂行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるもののような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行される高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を実行するために一つ以上のソフトウェアモジュールとして作動するように構成され得、その反対も同様である。
以上にて本発明が具体的な構成要素などのような特定事項と限定された実施例及び図面によって説明されたが、これは本発明のより全般的な理解の一助とするために提供されたものであるに過ぎず、本発明が前記実施例に限られるものではなく、本発明が属する技術分野において通常の知識を有する者であれば、係る記載から多様な修正及び変形が行われ得る。
従って、本発明の思想は、前記説明された実施例に局限されて定められてはならず、後述する特許請求の範囲だけでなく、本特許請求の範囲と均等または等価的に変形されたものすべては、本発明の思想の範囲に属するといえる。
100:学習装置
200:テスト装置
110、210:通信部
120、220:プロセッサ
130:データベース

Claims (28)

  1. 1xKコンボリューション演算またはKx1コンボリューション演算を利用してCNNのパラメータを学習する方法において、
    (a)少なくとも一つのトレーニングイメージが取得されると、学習装置は、リシェイプレイヤ(Reshaping Layer)をもって、前記トレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを2次元的にコンカチネート(Concatenating)させてリシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された調整特徴マップ(Adjusted Feature Map)を生成させる段階;及び
    (b)前記学習装置は、出力レイヤをもって、前記調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成し、ロスレイヤをもって、前記出力とこれに対応する少なくとも一つの原本正解(Ground Truth)とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習する段階;
    を含むことを特徴とする学習方法。
  2. 前記(a)段階で、
    前記トレーニングイメージまたはこれを加工した特徴マップのチャンネル個数がKの倍数でない場合、前記学習装置は、前記リシェイプレイヤをもって、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がKの倍数になるようにした後、前記トレーニングイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するK個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項1に記載の学習方法。
  3. 前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネル個数をLとする場合、
    前記(a)段階で、
    前記学習装置は、
    前記リシェイプレイヤをもって、幅W、高さHxK、チャンネル
    Figure 0006857369
    である前記リシェイプ済み特徴マップを生成させることを特徴とする請求項1に記載の学習方法。
  4. 前記後続コンボリューションレイヤのカーネル(Kernel)個数をMとする場合、
    前記(a)段階で、
    前記学習装置は、
    前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記調整特徴マップを生成させることを特徴とする請求項3に記載の学習方法。
  5. 前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネル個数をLとする場合、
    前記(a)段階で、
    前記学習装置は、
    前記リシェイプレイヤをもって、幅WxK、高さH、チャンネル
    Figure 0006857369
    である前記リシェイプ済み特徴マップを生成させることを特徴とする請求項1に記載の学習方法。
  6. 前記後続コンボリューションレイヤのカーネル個数をMとする場合、
    前記(a)段階で、
    前記学習装置は、
    前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記調整特徴マップを生成させることを特徴とする請求項5に記載の学習方法。
  7. 前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネル個数をLとする場合、
    前記(a)段階で、
    前記学習装置が、
    前記リシェイプレイヤをもって、(i)幅W、高さHxK、チャンネル
    Figure 0006857369
    である前記リシェイプ済み特徴マップを生成させるか、(ii)幅WxK、高さH、チャンネル
    Figure 0006857369
    である前記リシェイプ済み特徴マップを生成させ、
    前記
    Figure 0006857369
    番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分(Final Part)のサイズが幅W、高さHxKであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング(Zero Padding)を追加させて前記
    Figure 0006857369
    番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅W、高さHxKであるサイズになるようにするか、前記
    Figure 0006857369
    番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記
    Figure 0006857369
    番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズになるようにすることを特徴とする請求項1に記載の学習方法。
  8. 1xKコンボリューション演算またはKx1コンボリューション演算を利用してCNNをテストする方法において、
    (a)学習装置が、(i)リシェイプレイヤ(Reshaping Layer)をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の学習用特徴それぞれを2次元的にコンカチネート(Concatenating)させて学習用リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、前記学習用リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された学習用調整特徴マップ(Adjusted Feature Map)を生成させ、(ii)出力レイヤをもって、前記学習用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して、少なくとも一つの学習用出力を生成させ、ロスレイヤをもって、前記学習用出力とこれに対応する少なくとも一つの原本正解(Ground Truth)とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習した状態で、少なくとも一つのテストイメージが取得されると、テスト装置は、前記リシェイプレイヤ(Reshaping Layer)をもって、前記テストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを2次元的にコンカチネート(Concatenating)させてテスト用リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、前記後続(Subsequent)コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整されたテスト用調整特徴マップ(Adjusted Feature Map)を生成させる段階;及び
    (b)前記テスト装置が、前記出力レイヤをもって、前記テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させる段階;
    を含むことを特徴とするテスト方法。
  9. 前記(a)段階で、
    前記テストイメージまたはこれを加工した特徴マップのチャンネル個数がKの倍数でない場合、前記テスト装置は、前記リシェイプレイヤをもって、前記テストイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がKの倍数になるようにした後、前記テストイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するK個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項8に記載のテスト方法。
  10. 前記テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、
    前記(a)段階で、
    前記テスト装置は、
    前記リシェイプレイヤをもって、幅W、高さHxK、チャンネル
    Figure 0006857369
    である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする請求項8に記載のテスト方法。
  11. 前記後続コンボリューションレイヤのカーネル(Kernel)個数をMとする場合、
    前記(a)段階で、
    前記テスト装置は、
    前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする請求項10に記載のテスト方法。
  12. 前記テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、
    前記(a)段階で、
    前記テスト装置は、
    前記リシェイプレイヤをもって、幅WxK、高さH、チャンネル
    Figure 0006857369
    である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする請求項10に記載のテスト方法。
  13. 前記後続コンボリューションレイヤのカーネル個数をMとする場合、
    前記(a)段階で、
    前記テスト装置は、
    前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする請求項12に記載のテスト方法。
  14. 前記テストイメージまたは前記これを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、
    前記(a)段階で、
    前記テスト装置が、
    前記リシェイプレイヤをもって、(i)幅W、高さHxK、チャンネル
    Figure 0006857369
    である前記テスト用リシェイプ済み特徴マップを生成させるか、(ii)幅WxK、高さH、チャンネル
    Figure 0006857369
    である前記テスト用リシェイプ済み特徴マップを生成させ、
    前記
    Figure 0006857369
    番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分(Final Part)のサイズが幅W、高さHxKであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング(Zero Padding)を追加させて前記
    Figure 0006857369
    番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅W、高さHxKであるサイズになるようにするか、前記
    Figure 0006857369
    番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記
    Figure 0006857369
    番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズになるようにすることを特徴とする請求項8に記載のテスト方法。
  15. 1xKコンボリューション演算またはKx1コンボリューション演算を利用してCNNのパラメータを学習する学習装置において、
    インストラクションを格納する少なくとも一つのメモリと、
    (I)リシェイプレイヤ(Reshaping Layer)をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれを2次元的にコンカチネート(Concatenating)させてリシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された調整特徴マップ(Adjusted Feature Map)を生成させるプロセス、及び(II)出力レイヤをもって、前記調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの出力を生成させ、ロスレイヤをもって、前記出力とこれに対応する少なくとも一つの原本正解(Ground Truth)とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、
    を含むことを特徴とする学習装置。
  16. 前記(I)プロセスで、
    前記トレーニングイメージまたはこれを加工した特徴マップのチャンネル個数がKの倍数でない場合、前記プロセッサは、前記リシェイプレイヤをもって、前記トレーニングイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がKの倍数になるようにした後、前記トレーニングイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するK個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項15に記載の学習装置。
  17. 前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、
    前記(I)プロセスで、
    前記プロセッサは、前記リシェイプレイヤをもって、幅W、高さHxK、チャンネル
    Figure 0006857369
    である前記リシェイプ済み特徴マップを生成させることを特徴とする請求項15に記載の学習装置。
  18. 前記後続コンボリューションレイヤのカーネル(Kernel)個数をMとする場合、
    前記(I)プロセスで、
    前記プロセッサは、前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記調整特徴マップを生成させることを特徴とする請求項17に記載の学習装置。
  19. 前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、
    前記(I)プロセスで、
    前記プロセッサは、
    前記リシェイプレイヤをもって、幅WxK、高さH、チャンネル
    Figure 0006857369
    である前記リシェイプ済み特徴マップを生成させることを特徴とする請求項15に記載の学習装置。
  20. 前記後続コンボリューションレイヤのカーネル個数をMとする場合、
    前記(I)プロセスで、
    前記プロセッサは、
    前記後続コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記調整特徴マップを生成させることを特徴とする請求項19に記載の学習装置。
  21. 前記トレーニングイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、
    前記(I)プロセスで、
    前記プロセッサは、
    前記リシェイプレイヤをもって、(i)幅W、高さHxK、チャンネル
    Figure 0006857369
    である前記リシェイプ済み特徴マップを生成させるか、(ii)幅WxK、高さH、チャンネル
    Figure 0006857369
    である前記リシェイプ済み特徴マップを生成させ、
    前記
    Figure 0006857369
    番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分(Final Part)のサイズが幅W、高さHxKであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング(Zero Padding)を追加させて前記
    Figure 0006857369
    番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅W、高さHxKであるサイズになるようにするか、前記
    Figure 0006857369
    番目のチャンネル上における前記リシェイプ済み特徴マップの最終部分のサイズが幅WxK、高さHであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記
    Figure 0006857369
    番目のチャンネル上における前記リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズとなるようにすることを特徴とする請求項15に記載の学習装置。
  22. 1xKコンボリューション演算またはKx1コンボリューション演算を利用してCNNをテストするテスト装置において、
    インストラクションを格納する少なくとも一つのメモリと、
    学習装置は、(i)リシェイプレイヤ(Reshaping Layer)をもって、少なくとも一つのトレーニングイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内の学習用特徴それぞれを2次元的にコンカチネート(Concatenating)させて学習用リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、後続(Subsequent)コンボリューションレイヤをもって、前記学習用リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された学習用調整特徴マップ(Adjusted Feature Map)を生成させ、(ii)出力レイヤをもって、前記学習用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つの学習用出力を生成させ、ロスレイヤをもって、前記学習用出力とこれに対応する少なくとも一つの原本正解(Ground Truth)とを参照して少なくとも一つのロスを算出させることにより、前記ロスをバックプロパゲーションして前記後続コンボリューションレイヤの少なくとも一部のパラメータを学習した状態で、(I)リシェイプレイヤ(Reshaping Layer)をもって、少なくとも一つのテストイメージまたはこれを加工した特徴マップのすべてのチャンネルのうちでそれぞれの対応するK個のチャンネルから構成されたそれぞれのグループ内のテスト用特徴それぞれを2次元的にコンカチネート(Concatenating)させてリシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、前記後続(Subsequent)コンボリューションレイヤをもって、前記リシェイプ済み特徴マップに対して1xKコンボリューション演算またはKx1コンボリューション演算を適用させてボリューム(Volume)が調整された調整特徴マップ(Adjusted Feature Map)を生成させるプロセス、及び(II)前記出力レイヤをもって、前記テスト用調整特徴マップまたはこれを加工した特徴マップ上の特徴を参照して少なくとも一つのテスト用出力を生成させるプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、
    を含むことを特徴とするテスト装置。
  23. 前記(I)プロセスで、
    前記テストイメージまたはこれを加工した特徴マップのチャンネル個数がKの倍数でない場合、
    前記プロセッサは、前記リシェイプレイヤをもって、前記テストイメージまたはこれを加工した特徴マップのチャンネルに少なくとも一つのダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記ダミーチャンネルを含む前記チャンネルの個数がKの倍数になるようにした後、前記テストイメージまたはこれを加工した特徴マップの少なくとも一つの前記ダミーチャンネルを含む前記すべてのチャンネルのうちでそれぞれの対応するK個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項22に記載のテスト装置。
  24. 前記テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、
    前記(I)プロセスで、
    前記プロセッサは、
    前記リシェイプレイヤをもって、幅W、高さHxK、チャンネル
    Figure 0006857369
    である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする請求項22に記載のテスト装置。
  25. 前記後続コンボリューションレイヤのカーネル(Kernel)個数をMとする場合、
    前記(I)プロセスで、
    前記プロセッサは、
    前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対して1xKコンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする請求項24に記載のテスト装置。
  26. 前記テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、
    前記(I)プロセスで、
    前記プロセッサは、
    前記リシェイプレイヤをもって、幅WxK、高さH、チャンネル
    Figure 0006857369
    である前記テスト用リシェイプ済み特徴マップを生成させることを特徴とする請求項24に記載のテスト装置。
  27. 前記後続コンボリューションレイヤのカーネル個数をMとする場合、
    前記(I)プロセスで、
    前記プロセッサは、
    前記後続コンボリューションレイヤをもって、前記テスト用リシェイプ済み特徴マップに対してKx1コンボリューション演算を適用させて幅W、高さH、チャンネルMであるWxHxMのボリュームを有する前記テスト用調整特徴マップを生成させることを特徴とする請求項26に記載のテスト装置。
  28. 前記テストイメージまたはこれを加工した特徴マップの幅をW、高さをHとし、チャンネルの個数をLとする場合、
    前記(I)プロセスで、
    前記プロセッサは、
    前記リシェイプレイヤをもって、(i)幅W、高さHxK、チャンネル
    Figure 0006857369
    である前記テスト用リシェイプ済み特徴マップを生成させるか、(ii)幅WxK、高さH、チャンネル
    Figure 0006857369
    である前記テスト用リシェイプ済み特徴マップを生成させ、
    前記
    Figure 0006857369
    番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分(Final Part)のサイズが幅W、高さHxKであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディング(Zero Padding)を追加させて前記
    Figure 0006857369
    番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅W、高さHxKであるサイズになるようにするか、前記
    Figure 0006857369
    番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの最終部分のサイズが幅WxK、高さHであるサイズにならない場合、前記リシェイプレイヤをもって、少なくとも一つのゼロパディングを追加させて前記
    Figure 0006857369
    番目のチャンネル上の前記テスト用リシェイプ済み特徴マップの前記最終部分のサイズが幅WxK、高さHであるサイズになるようにすることを特徴とする請求項22に記載のテスト装置。
JP2020001966A 2019-01-23 2020-01-09 Cnnを学習する方法及び学習装置、それを利用したテスト方法及びテスト装置 Active JP6857369B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/255,109 2019-01-23
US16/255,109 US11461653B2 (en) 2019-01-23 2019-01-23 Learning method and learning device for CNN using 1xK or Kx1 convolution to be used for hardware optimization, and testing method and testing device using the same

Publications (2)

Publication Number Publication Date
JP2020119535A JP2020119535A (ja) 2020-08-06
JP6857369B2 true JP6857369B2 (ja) 2021-04-14

Family

ID=69159558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020001966A Active JP6857369B2 (ja) 2019-01-23 2020-01-09 Cnnを学習する方法及び学習装置、それを利用したテスト方法及びテスト装置

Country Status (5)

Country Link
US (1) US11461653B2 (ja)
EP (1) EP3686794B1 (ja)
JP (1) JP6857369B2 (ja)
KR (1) KR102337383B1 (ja)
CN (1) CN111476247B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10303980B1 (en) * 2018-09-05 2019-05-28 StradVision, Inc. Learning method, learning device for detecting obstacles and testing method, testing device using the same
CN111988609B (zh) * 2019-05-22 2024-07-16 富士通株式会社 图像编码装置、概率模型生成装置和图像解码装置
US10943353B1 (en) 2019-09-11 2021-03-09 International Business Machines Corporation Handling untrainable conditions in a network architecture search
US11023783B2 (en) * 2019-09-11 2021-06-01 International Business Machines Corporation Network architecture search with global optimization
KR20230137594A (ko) 2022-03-22 2023-10-05 동원산업 주식회사 인공 신경망을 이용한 어류 등급 판정 방법 및 장치

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10083395B2 (en) * 2015-05-21 2018-09-25 Google Llc Batch processing in a neural network processor
CN106558025B (zh) * 2015-09-29 2021-02-09 腾讯科技(深圳)有限公司 一种图片的处理方法和装置
CN108475331B (zh) * 2016-02-17 2022-04-05 英特尔公司 用于对象检测的方法、装置、***和计算机可读介质
JP6869676B2 (ja) * 2016-09-27 2021-05-12 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
JP6929047B2 (ja) * 2016-11-24 2021-09-01 キヤノン株式会社 画像処理装置、情報処理方法及びプログラム
US10067509B1 (en) * 2017-03-10 2018-09-04 TuSimple System and method for occluding contour detection
KR102474168B1 (ko) * 2017-03-17 2022-12-06 포틀랜드 스테이트 유니버시티 적응형 컨볼루션 및 적응형 분리형 컨볼루션을 통한 프레임 인터폴레이션
CN110383292A (zh) * 2017-04-07 2019-10-25 英特尔公司 用于深度神经网络的经预算和经简化的训练的方法和***
JP6744838B2 (ja) * 2017-04-18 2020-08-19 Kddi株式会社 エンコーダデコーダ畳み込みニューラルネットワークにおける解像感を改善するプログラム
CN109145927A (zh) * 2017-06-16 2019-01-04 杭州海康威视数字技术股份有限公司 一种对形变图像的目标识别方法及装置
US10474988B2 (en) * 2017-08-07 2019-11-12 Standard Cognition, Corp. Predicting inventory events using foreground/background processing
US10049323B1 (en) * 2017-10-13 2018-08-14 StradVision, Inc. Method and device for performing activation and convolution operation at the same time and learning method and learning device for the same
SG10202108020VA (en) 2017-10-16 2021-09-29 Illumina Inc Deep learning-based techniques for training deep convolutional neural networks
NZ759880A (en) 2017-10-16 2022-04-29 Illumina Inc Aberrant splicing detection using convolutional neural networks (cnns)
CN109166100A (zh) * 2018-07-24 2019-01-08 中南大学 基于卷积神经网络的多任务学习细胞计数方法
CN109086886A (zh) * 2018-08-02 2018-12-25 工极(北京)智能科技有限公司 一种基于极限学习机的卷积神经网络学习算法

Also Published As

Publication number Publication date
US20200234135A1 (en) 2020-07-23
KR20200091795A (ko) 2020-07-31
EP3686794B1 (en) 2024-07-24
US11461653B2 (en) 2022-10-04
JP2020119535A (ja) 2020-08-06
CN111476247A (zh) 2020-07-31
KR102337383B1 (ko) 2021-12-10
CN111476247B (zh) 2023-09-26
EP3686794A1 (en) 2020-07-29

Similar Documents

Publication Publication Date Title
JP6857369B2 (ja) Cnnを学習する方法及び学習装置、それを利用したテスト方法及びテスト装置
JP6853560B2 (ja) 高精度イメージを分析するディープラーニングネットワークの学習に利用するためのトレーニングイメージをオートラベリングするための方法、及びこれを利用したオートラベリング装置{method for auto−labeling training images for use in deep learning network to analyze images with high precision, and auto−labeling device using the same}
JP6923960B2 (ja) 自動駐車システムを提供するために決定地点間の関係及び決定地点に対するリグレッション結果を利用して駐車スペースを検出する学習方法及び学習装置、そしてこれを利用したテスティング方法及びテスティング装置
JP6856851B2 (ja) イメージエンコーディングのための方法及び装置そしてこれを利用したテスト方法及びテスト装置
KR102337376B1 (ko) 레인 마스크(Lane Mask)를 사용하여 후처리 없이 입력 이미지에 포함된 하나 이상의 차선을 검출하는 방법 및 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치
JP6857368B2 (ja) Cnn学習方法及び学習装置、これを利用したテスト方法及びテスト装置
JP6858382B2 (ja) ハードウェア最適化に使用される1xHコンボリューションを利用したCNN基盤の物体検出器を学習する方法及び学習装置、それを利用したテスト方法及びテスト装置
JP6957050B2 (ja) モバイルデバイスまたは小型ネットワークに適用可能なハードウェアを最適化するのに利用可能なroiをプーリングするために、マスキングパラメータを利用する方法及び装置、そしてこれを利用したテスト方法及びテスト装置{learning method and learning device for pooling roi by using masking parameters to be used for mobile devices or compact networks via hardware optimization, and testing method and testing device using the same}
JP6964353B2 (ja) ハードウェア最適化に使用されるイメージ認識のための1x1コンボリューションを利用したCNN学習方法及び学習装置、それを利用したテスト方法及びテスト装置{LEARNING METHOD AND LEARNING DEVICE FOR CONVOLUTIONAL NEURAL NETWORK USING 1×1 CONVOLUTION FOR IMAGE RECOGNITION TO BE USED FOR HARDWARE OPTIMIZATION, AND TESTING METHOD AND TESTING DEVICE USING THE SAME}
JP2020126624A (ja) ディープニューラルネットワーク基盤の多重パッチ組み合わせを利用して顔を認識し、極度の状況でフォールトトレランス及びフラクチュエーションロバスト性を向上させる方法
JP7252120B2 (ja) 核心性能指数を満たすことができるハードウェア最適化が行われるように、cnnで複数のブロック内の入力イメージから特徴を抽出する学習方法及び学習装置、それを利用したテスト方法及びテスト装置
JP2020038666A (ja) 自律走行状況で障害物検出のための学習用データセットの生成方法及びこれを利用したコンピューティング装置、学習方法及び学習装置
JP6856906B2 (ja) 自律走行車両レベル4を満たすために領域のクラスに応じてモードを切り換えるためにグリッド生成器を利用するニューラルネットワーク演算方法及びこれを利用した装置
JP6856957B2 (ja) 写真スタイル変換を使用してランタイム入力の変換によりリアル世界で使用されるバーチャル世界で学習されたcnnを許容するための学習方法及び学習装置、そしてこれを利用したテスト方法及びテスト装置
CN114821580A (zh) 一种分阶段融入去噪模块的含噪图像分割方法
JP6853592B2 (ja) ハードウェア最適化に使用される1x1コンボリューションを利用したCNN基盤の物体検出器を学習する方法及び学習装置、これを利用したテスト方法及びテスト装置{LEARNING METHOD AND LEARNING DEVICE FOR OBJECT DETECTOR BASED ON CNN USING 1×1 CONVOLUTION TO BE USED FOR HARDWARE OPTIMIZATION, AND TESTING METHOD AND TESTING DEVICE USING THE SAME}
JP6856852B2 (ja) 横フィルタマスクを利用して自律走行車の走行経路を計画するために車線要素を検出する方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210312

R150 Certificate of patent or registration of utility model

Ref document number: 6857369

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250