JP2017049996A - 画像認識に用いられるニューラルネットワークの訓練方法及び訓練装置 - Google Patents
画像認識に用いられるニューラルネットワークの訓練方法及び訓練装置 Download PDFInfo
- Publication number
- JP2017049996A JP2017049996A JP2016169239A JP2016169239A JP2017049996A JP 2017049996 A JP2017049996 A JP 2017049996A JP 2016169239 A JP2016169239 A JP 2016169239A JP 2016169239 A JP2016169239 A JP 2016169239A JP 2017049996 A JP2017049996 A JP 2017049996A
- Authority
- JP
- Japan
- Prior art keywords
- dimensional space
- size
- training
- points
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 133
- 238000012549 training Methods 0.000 title claims abstract description 130
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 70
- 239000011159 matrix material Substances 0.000 claims abstract description 109
- 238000009499 grossing Methods 0.000 claims abstract description 44
- 230000003094 perturbing effect Effects 0.000 claims abstract description 14
- 230000008569 process Effects 0.000 claims description 41
- 238000010586 diagram Methods 0.000 claims description 39
- 238000009826 distribution Methods 0.000 claims description 24
- 230000009466 transformation Effects 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000009827 uniform distribution Methods 0.000 claims description 7
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000013527 convolutional neural network Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/772—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】該方法は、サンプル画像を高次元空間における点の集合として表現するステップであって、高次元空間の大きさはサンプル画像の空間領域の大きさとサンプル画像の強度領域の大きさとの積である、ステップと、高次元空間の大きさと同じ大きさの第1ランダム摂動行列を生成するステップと、第1ランダム摂動行列を平滑化するステップと、平滑化後の第1ランダム摂動行列を用いて高次元空間における点の集合を摂動させて、摂動後の点の集合を取得するステップと、摂動後の点の集合を新しいサンプルとしてニューラルネットワークを訓練するステップとを含む。
【選択図】図2
Description
2.画像認識に用いられるニューラルネットワークの訓練装置
3.本願の方法及び装置を実施するためのコンピュータ装置
<1.画像認識に用いられるニューラルネットワークの訓練方法>
本発明の方法では、訓練セットのサンプルについてランダム変形の方法を用い、即ち訓練セットのサンプルに対してランダム摂動を行うことで、訓練セットを拡張するという目的を達成する。
図7は本発明の1つの実施例に係る画像認識に用いられるニューラルネットワークの訓練装置700の例示的な構成を示すブロック図である。
以上、具体的な実施例を用いて本発明の基本原理について説明したが、強調すべきなのは、本発明の方法と装置の全て又はいずれのステップ又は構成要素が、任意の計算装置(プロセッサや記憶媒体等を含む)または計算装置のネットワークにおいて、ハードウェア、ファームウェア、ソフトウェアまたはそれらの組合せにより実現できることは、当業者にとって理解されるところである。また、これは当業者が本発明の明細書を読んだ上で彼らの基本的なプログラミングスキルを利用して実現できるものである。
(付記1)
画像認識に用いられるニューラルネットワークの訓練方法であって、
サンプル画像を高次元空間における点の集合として表現するステップであって、前記高次元空間の大きさは前記サンプル画像の空間領域の大きさと前記サンプル画像の強度領域の大きさとの積である、ステップと、
前記高次元空間の大きさと同じ大きさの第1ランダム摂動行列を生成するステップと、
前記第1ランダム摂動行列を平滑化するステップと、
平滑化後の第1ランダム摂動行列を用いて前記高次元空間における点の集合を摂動させて、摂動後の点の集合を取得するステップと、
摂動後の点の集合を新しいサンプルとしてニューラルネットワークを訓練するステップと、を含む、訓練方法。
(付記2)
前記空間領域の大きさは前記サンプル画像の幅と高さとの積であり、前記強度領域の大きさはD1×D2×…×Dnであり、nは前記強度領域の次元数であり、D1、D2、…Dnはそれぞれ各次元の大きさである、付記1に記載の訓練方法。
(付記3)
摂動後の点の集合を新しいサンプルとしてニューラルネットワークを訓練するステップは、
前記摂動後の点の集合を前記高次元空間の二次元又は三次元の空間に投影して投影後の画像を取得し、投影後の画像を新しいサンプルとしてニューラルネットワークを訓練するステップ、を含む、付記1に記載の訓練方法。
(付記4)
所定の確率分布により前記第1ランダム摂動行列を生成し、
前記所定の確率分布は、ガウス分布又は一様分布である、付記1に記載の訓練方法。
(付記5)
前記第1ランダム摂動行列と同じ次元数の低域フィルタを用いて前記第1ランダム摂動行列を平滑化し、
前記低域フィルタは、ガウスフィルタ、平均値フィルタ及びメディアンフィルタのうち1つである、付記1に記載の訓練方法。
(付記6)
平滑化後の第1ランダム摂動行列を用いて前記高次元空間における点の集合を摂動させるステップは、
前記高次元空間における点の集合の各点の値に、前記平滑化後の第1ランダム摂動行列における対応要素の値を加算するステップ、を含む、付記1に記載の訓練方法。
(付記7)
第2ランダム摂動行列を生成するステップと、
前記第2ランダム摂動行列を平滑化するステップと、
平滑化後の第2ランダム摂動行列を用いて、ニューラルネットワークの訓練プロセスにおいて畳み込み層により出力された特徴図を摂動させるステップと、をさらに含み、
前記第2ランダム摂動行列の大きさは、前記特徴図の長さと幅と前記特徴図の数との積である、付記1に記載の訓練方法。
(付記8)
平滑化後の第2ランダム摂動行列を用いてニューラルネットワークの訓練プロセスにおいて畳み込み層により出力された特徴図を摂動させるステップは、
前記特徴図の値に、重み付けされた第2ランダム摂動行列の対応値を加算するステップ、を含み、
前記特徴図の絶対値が大きいほど、重み付け係数が大きくなる、付記7に記載の訓練方法。
(付記9)
画像認識に用いられるニューラルネットワークの訓練方法であって、
サンプル画像を変換して、前記サンプル画像の変換領域の表現を取得するステップと、
変換後のサンプル画像を高次元空間における点の集合として表現するステップと、
前記高次元空間の大きさと同じ大きさのランダム摂動行列を生成するステップと、
前記ランダム摂動行列を平滑化するステップと、
平滑化後のランダム摂動行列を用いて前記高次元空間における点の集合を摂動させて、摂動後の点の集合を取得するステップと、
摂動後の点の集合を前記高次元空間の変換領域のサブ空間に投影して、摂動後のサンプル画像の変換領域の表現を取得するステップと、
前記摂動後のサンプル画像の変換領域の表現を逆変換して、摂動後の画像を取得するステップと、
前記摂動後の画像を新しいサンプルとしてニューラルネットワークを訓練するステップと、を含む、訓練方法。
(付記10)
前記変換は、離散フーリエ変換又は離散コサイン変換である、付記9に記載の訓練方法。
(付記11)
画像認識に用いられるニューラルネットワークの訓練装置であって、
サンプル画像を高次元空間における点の集合として表現する高次元空間表現手段であって、前記高次元空間の大きさは前記サンプル画像の空間領域の大きさと前記サンプル画像の強度領域の大きさとの積である、高次元空間表現手段と、
前記高次元空間の大きさと同じ大きさの第1ランダム摂動行列を生成する第1ランダム摂動行列生成手段と、
前記第1ランダム摂動行列を平滑化する第1平滑化手段と、
平滑化後の第1ランダム摂動行列を用いて前記高次元空間における点の集合を摂動させて、摂動後の点の集合を取得する第1摂動手段と、
摂動後の点の集合を新しいサンプルとしてニューラルネットワークを訓練する訓練サンプル決定手段と、を含む、訓練装置。
(付記12)
前記空間領域の大きさは前記サンプル画像の幅と高さとの積であり、前記強度領域の大きさはD1×D2×…×Dnであり、nは前記強度領域の次元数であり、D1、D2、…Dnはそれぞれ各次元の大きさである、付記11に記載の訓練装置。
(付記13)
前記訓練サンプル決定手段は、前記摂動後の点の集合を前記高次元空間の二次元又は三次元の空間に投影して投影後の画像を取得し、投影後の画像を新しいサンプルとしてニューラルネットワークを訓練する、付記11に記載の訓練装置。
(付記14)
前記第1ランダム摂動行列は、所定の確率分布によりを生成され、
前記所定の確率分布は、ガウス分布又は一様分布である、請求項1に記載の訓練方法。
(付記15)
前記第1平滑化手段は、前記第1ランダム摂動行列と同じ次元数の低域フィルタを用いて前記第1ランダム摂動行列を平滑化し、
前記低域フィルタは、ガウスフィルタ、平均値フィルタ及びメディアンフィルタのうち1つである、付記11に記載の訓練装置。
(付記16)
前記第1摂動手段は、前記高次元空間における点の集合の各点の値に、前記平滑化後の第1ランダム摂動行列における対応要素の値を加算する、付記11に記載の訓練装置。
(付記17)
第2ランダム摂動行列を生成する第2ランダム摂動行列生成手段と、
前記第2ランダム摂動行列を平滑化する第2平滑化手段と、
平滑化後の第2ランダム摂動行列を用いて、ニューラルネットワークの訓練プロセスにおいて畳み込み層により出力された特徴図を摂動させる第2摂動手段と、をさらに含み、
前記第2ランダム摂動行列の大きさは、前記特徴図の長さと幅と前記特徴図の数との積である、付記11に記載の訓練装置。
(付記18)
前記第2摂動手段は、前記特徴図の値に、重み付けされた第2ランダム摂動行列の対応値を加算し、
前記特徴図の絶対値が大きいほど、重み付け係数が大きくなる、付記17に記載の訓練装置。
Claims (10)
- 画像認識に用いられるニューラルネットワークの訓練方法であって、
サンプル画像を高次元空間における点の集合として表現するステップであって、前記高次元空間の大きさは前記サンプル画像の空間領域の大きさと前記サンプル画像の強度領域の大きさとの積である、ステップと、
前記高次元空間の大きさと同じ大きさの第1ランダム摂動行列を生成するステップと、
前記第1ランダム摂動行列を平滑化するステップと、
平滑化後の第1ランダム摂動行列を用いて前記高次元空間における点の集合を摂動させて、摂動後の点の集合を取得するステップと、
摂動後の点の集合を新しいサンプルとしてニューラルネットワークを訓練するステップと、を含む、訓練方法。 - 前記空間領域の大きさは前記サンプル画像の幅と高さとの積であり、前記強度領域の大きさはD1×D2×…×Dnであり、nは前記強度領域の次元数であり、D1、D2、…Dnはそれぞれ各次元の大きさである、請求項1に記載の訓練方法。
- 摂動後の点の集合を新しいサンプルとしてニューラルネットワークを訓練するステップは、
前記摂動後の点の集合を前記高次元空間の二次元又は三次元の空間に投影して投影後の画像を取得し、投影後の画像を新しいサンプルとしてニューラルネットワークを訓練するステップ、を含む、請求項1に記載の訓練方法。 - 所定の確率分布により前記第1ランダム摂動行列を生成し、
前記所定の確率分布は、ガウス分布又は一様分布である、請求項1に記載の訓練方法。 - 前記第1ランダム摂動行列と同じ次元数の低域フィルタを用いて前記第1ランダム摂動行列を平滑化し、
前記低域フィルタは、ガウスフィルタ、平均値フィルタ及びメディアンフィルタのうち1つである、請求項1に記載の訓練方法。 - 第2ランダム摂動行列を生成するステップと、
前記第2ランダム摂動行列を平滑化するステップと、
平滑化後の第2ランダム摂動行列を用いて、ニューラルネットワークの訓練プロセスにおいて畳み込み層により出力された特徴図を摂動させるステップと、をさらに含み、
前記第2ランダム摂動行列の大きさは、前記特徴図の長さと幅と前記特徴図の数との積である、請求項1に記載の訓練方法。 - 平滑化後の第2ランダム摂動行列を用いてニューラルネットワークの訓練プロセスにおいて畳み込み層により出力された特徴図を摂動させるステップは、
前記特徴図の値に、重み付けされた第2ランダム摂動行列の対応値を加算するステップ、を含み、
前記特徴図の絶対値が大きいほど、重み付け係数が大きくなる、請求項6に記載の訓練方法。 - 画像認識に用いられるニューラルネットワークの訓練方法であって、
サンプル画像を変換して、前記サンプル画像の変換領域の表現を取得するステップと、
変換後のサンプル画像を高次元空間における点の集合として表現するステップと、
前記高次元空間の大きさと同じ大きさのランダム摂動行列を生成するステップと、
前記ランダム摂動行列を平滑化するステップと、
平滑化後のランダム摂動行列を用いて前記高次元空間における点の集合を摂動させて、摂動後の点の集合を取得するステップと、
摂動後の点の集合を前記高次元空間の変換領域のサブ空間に投影して、摂動後のサンプル画像の変換領域の表現を取得するステップと、
前記摂動後のサンプル画像の変換領域の表現を逆変換して、摂動後の画像を取得するステップと、
前記摂動後の画像を新しいサンプルとしてニューラルネットワークを訓練するステップと、を含む、訓練方法。 - 前記変換は、離散フーリエ変換又は離散コサイン変換である、請求項8に記載の訓練方法。
- 画像認識に用いられるニューラルネットワークの訓練装置であって、
サンプル画像を高次元空間における点の集合として表現する高次元空間表現手段であって、前記高次元空間の大きさは前記サンプル画像の空間領域の大きさと前記サンプル画像の強度領域の大きさとの積である、高次元空間表現手段と、
前記高次元空間の大きさと同じ大きさの第1ランダム摂動行列を生成する第1ランダム摂動行列生成手段と、
前記第1ランダム摂動行列を平滑化する第1平滑化手段と、
平滑化後の第1ランダム摂動行列を用いて前記高次元空間における点の集合を摂動させて、摂動後の点の集合を取得する第1摂動手段と、
摂動後の点の集合を新しいサンプルとしてニューラルネットワークを訓練する訓練サンプル決定手段と、を含む、訓練装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510556368.0A CN106485192B (zh) | 2015-09-02 | 2015-09-02 | 用于图像识别的神经网络的训练方法和装置 |
CN201510556368.0 | 2015-09-02 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017049996A true JP2017049996A (ja) | 2017-03-09 |
JP6825269B2 JP6825269B2 (ja) | 2021-02-03 |
Family
ID=56684444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016169239A Active JP6825269B2 (ja) | 2015-09-02 | 2016-08-31 | 画像認識に用いられるニューラルネットワークの訓練方法及び訓練装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10296813B2 (ja) |
EP (1) | EP3139310A1 (ja) |
JP (1) | JP6825269B2 (ja) |
CN (1) | CN106485192B (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018174438A1 (en) * | 2017-03-23 | 2018-09-27 | Samsung Electronics Co., Ltd. | Electronic apparatus for operating machine learning and method for operating machine learning |
JP2018156632A (ja) * | 2017-12-25 | 2018-10-04 | 株式会社コナミデジタルエンタテインメント | サーバ装置、及びそれに用いられるコンピュータプログラム |
JP2019153293A (ja) * | 2018-02-28 | 2019-09-12 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 人工ニューラルネットワークを用いたocrシステムのための、線認識最大−最小プーリングを用いたテキスト画像の処理 |
JP2020508531A (ja) * | 2017-09-08 | 2020-03-19 | ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド | 画像品質の評価方法及び画像品質の評価システム |
WO2021049005A1 (ja) | 2019-09-13 | 2021-03-18 | 三菱電機株式会社 | 情報処理装置およびそれを備えた電子機器 |
CN113554179A (zh) * | 2020-04-23 | 2021-10-26 | 丰田自动车株式会社 | 信息处理*** |
JP2021530777A (ja) * | 2018-07-18 | 2021-11-11 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 人工知能に基づく医療ソリューションを開発するための患者のシミュレーション |
JP2022553768A (ja) * | 2020-06-10 | 2022-12-26 | 上▲海▼商▲湯▼智能科技有限公司 | 顔画像の真偽を識別する方法、装置、デバイス及び媒体並びにコンピュータプログラム |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102347204B1 (ko) * | 2016-05-20 | 2022-01-03 | 매직 립, 인코포레이티드 | 콘볼루셔널 이미지 변환 추정을 수행하기 위한 방법 및 시스템 |
CN106157307B (zh) * | 2016-06-27 | 2018-09-11 | 浙江工商大学 | 一种基于多尺度cnn和连续crf的单目图像深度估计方法 |
CN108932459B (zh) * | 2017-05-26 | 2021-12-10 | 富士通株式会社 | 脸部识别模型训练方法和装置及脸部识别方法 |
KR102301232B1 (ko) * | 2017-05-31 | 2021-09-10 | 삼성전자주식회사 | 다채널 특징맵 영상을 처리하는 방법 및 장치 |
US10783393B2 (en) * | 2017-06-20 | 2020-09-22 | Nvidia Corporation | Semi-supervised learning for landmark localization |
CN107463960A (zh) * | 2017-08-07 | 2017-12-12 | 石林星 | 一种图像识别方法及装置 |
CN107564063B (zh) * | 2017-08-30 | 2021-08-13 | 广州方硅信息技术有限公司 | 一种基于卷积神经网络的虚拟物显示方法及装置 |
CN107563434B (zh) * | 2017-08-30 | 2020-12-15 | 山东大学 | 一种基于三维卷积神经网络的脑部mri图像分类方法、装置 |
CN107644428A (zh) * | 2017-09-29 | 2018-01-30 | 广东电网有限责任公司中山供电局 | 一种基于多域度重映射的输电线路漂浮物图像分割方法 |
US10650072B2 (en) * | 2017-10-30 | 2020-05-12 | Facebook, Inc. | System and method for determination of a digital destination based on a multi-part identifier |
US10810277B1 (en) | 2017-10-30 | 2020-10-20 | Facebook, Inc. | System and method for determination of a digital destination based on a multi-part identifier |
CN108090451B (zh) * | 2017-12-20 | 2019-12-24 | 湖北工业大学 | 一种人脸识别方法及*** |
KR102174777B1 (ko) | 2018-01-23 | 2020-11-06 | 주식회사 날비컴퍼니 | 이미지의 품질 향상을 위하여 이미지를 처리하는 방법 및 장치 |
WO2019147020A1 (ko) * | 2018-01-23 | 2019-08-01 | 주식회사 날비컴퍼니 | 이미지의 품질 향상을 위하여 이미지를 처리하는 방법 및 장치 |
CN108845759B (zh) * | 2018-04-28 | 2021-08-24 | 北京猎户星空科技有限公司 | 一种数据序列构建方法、装置及电子设备 |
CN108615071B (zh) * | 2018-05-10 | 2020-11-24 | 创新先进技术有限公司 | 模型测试的方法及装置 |
CN111542841A (zh) * | 2018-06-08 | 2020-08-14 | 北京嘀嘀无限科技发展有限公司 | 一种内容识别的***和方法 |
US12014267B2 (en) * | 2018-07-13 | 2024-06-18 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems and methods for sequential event prediction with noise-contrastive estimation for marked temporal point process |
CN110795976B (zh) * | 2018-08-03 | 2023-05-05 | 华为云计算技术有限公司 | 一种训练物体检测模型的方法、装置以及设备 |
US10719737B2 (en) | 2018-08-23 | 2020-07-21 | Denso International America, Inc. | Image classification system for resizing images to maintain aspect ratio information |
WO2020261552A1 (en) * | 2019-06-28 | 2020-12-30 | Nec Corporation | Spoofing detection apparatus, spoofing detection method, and computer-readable storage medium |
CN110728661A (zh) * | 2019-09-18 | 2020-01-24 | 清华大学 | 基于随机生成样本的图像畸变评价网络训练方法及装置 |
CN111652966B (zh) * | 2020-05-11 | 2021-06-04 | 北京航空航天大学 | 一种基于无人机多视角的三维重建方法及装置 |
CN111652330B (zh) * | 2020-08-05 | 2020-11-13 | 深圳市优必选科技股份有限公司 | 图像处理方法、装置、***、电子设备及可读存储介质 |
CN112101294B (zh) | 2020-09-29 | 2022-08-09 | 支付宝(杭州)信息技术有限公司 | 针对图像识别模型的增强训练方法及装置 |
US11615782B2 (en) * | 2020-11-12 | 2023-03-28 | Sony Interactive Entertainment Inc. | Semi-sorted batching with variable length input for efficient training |
CN112784494B (zh) * | 2021-01-27 | 2024-02-06 | 中国科学院苏州生物医学工程技术研究所 | 假阳性识别模型的训练方法、目标识别方法及装置 |
CN113066165B (zh) * | 2021-03-19 | 2022-06-21 | 北京邮电大学 | 多阶段无监督学习的三维重建方法、装置和电子设备 |
CN112990205B (zh) * | 2021-05-11 | 2021-11-02 | 创新奇智(北京)科技有限公司 | 手写字符样本的生成方法及装置、电子设备、存储介质 |
CN113222873B (zh) * | 2021-06-01 | 2023-06-16 | 平安科技(深圳)有限公司 | 基于二维高斯分布的图像数据增强方法、装置及存储介质 |
CN113343295B (zh) * | 2021-06-07 | 2023-01-24 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的图像处理方法、装置、设备和存储介质 |
CN113627475A (zh) * | 2021-07-07 | 2021-11-09 | 厦门市美亚柏科信息股份有限公司 | 一种对样本进行不确定性估计的方法及装置 |
CN113284142B (zh) * | 2021-07-16 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 图像检测方法、装置、计算机可读存储介质及计算机设备 |
CN115861740B (zh) * | 2023-02-27 | 2023-05-30 | 常州微亿智造科技有限公司 | 工业检测中的样本生成方法、样本生成装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0863601A (ja) * | 1994-08-22 | 1996-03-08 | Nec Corp | 領域分割方法および装置 |
JP2008009745A (ja) * | 2006-06-29 | 2008-01-17 | Mitsubishi Electric Corp | 顔検出装置 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5903884A (en) * | 1995-08-08 | 1999-05-11 | Apple Computer, Inc. | Method for training a statistical classifier with reduced tendency for overfitting |
US7130776B2 (en) * | 2002-03-25 | 2006-10-31 | Lockheed Martin Corporation | Method and computer program product for producing a pattern recognition training set |
US6859764B2 (en) * | 2003-04-03 | 2005-02-22 | The United States Of America As Represented By The Secretary Of The Army | Detecting, classifying and localizing minor amounts of an element within a sample of material |
US7558622B2 (en) * | 2006-05-24 | 2009-07-07 | Bao Tran | Mesh network stroke monitoring appliance |
US9907473B2 (en) * | 2015-04-03 | 2018-03-06 | Koninklijke Philips N.V. | Personal monitoring system |
CN101231672A (zh) * | 2008-02-02 | 2008-07-30 | 湖南大学 | 基于改进型bp神经网络的模拟电路软故障诊断方法 |
US8588286B2 (en) * | 2010-05-25 | 2013-11-19 | Xw, Llc | Processor, modem and method for cancelling alien noise in coordinated digital subscriber lines |
WO2012089288A1 (en) * | 2011-06-06 | 2012-07-05 | Bridge Mediatech, S.L. | Method and system for robust audio hashing |
JP5897343B2 (ja) * | 2012-02-17 | 2016-03-30 | 株式会社日立製作所 | 残響除去パラメータ推定装置及び方法、残響・エコー除去パラメータ推定装置、残響除去装置、残響・エコー除去装置、並びに、残響除去装置オンライン会議システム |
CN103034868B (zh) * | 2012-11-29 | 2015-07-08 | 中国地质大学(武汉) | 一种针对小样本以及高维图像的分类方法 |
US9251437B2 (en) * | 2012-12-24 | 2016-02-02 | Google Inc. | System and method for generating training cases for image classification |
CN104346622A (zh) * | 2013-07-31 | 2015-02-11 | 富士通株式会社 | 卷积神经网络分类器及其分类方法和训练方法 |
CN105849804A (zh) * | 2013-12-23 | 2016-08-10 | 美国亚德诺半导体公司 | 过滤噪声的计算高效方法 |
CN104765728B (zh) * | 2014-01-08 | 2017-07-18 | 富士通株式会社 | 训练神经网络的方法和装置以及确定稀疏特征向量的方法 |
US10417554B2 (en) * | 2014-05-22 | 2019-09-17 | Lee J. Scheffler | Methods and systems for neural and cognitive processing |
CN103984959B (zh) * | 2014-05-26 | 2017-07-21 | 中国科学院自动化研究所 | 一种基于数据与任务驱动的图像分类方法 |
US20150369756A1 (en) * | 2014-06-20 | 2015-12-24 | Manchester Metropolitan University | Scanning apparatus |
US20160078359A1 (en) * | 2014-09-12 | 2016-03-17 | Xerox Corporation | System for domain adaptation with a domain-specific class means classifier |
US9717417B2 (en) * | 2014-10-29 | 2017-08-01 | Spectral Md, Inc. | Reflective mode multi-spectral time-resolved optical imaging methods and apparatuses for tissue classification |
CN104504362A (zh) * | 2014-11-19 | 2015-04-08 | 南京艾柯勒斯网络科技有限公司 | 基于卷积神经网络的人脸检测方法 |
US10839510B2 (en) * | 2015-08-19 | 2020-11-17 | Colorado Seminary, Which Owns And Operates The University Of Denver | Methods and systems for human tissue analysis using shearlet transforms |
-
2015
- 2015-09-02 CN CN201510556368.0A patent/CN106485192B/zh active Active
-
2016
- 2016-07-14 EP EP16179423.5A patent/EP3139310A1/en not_active Ceased
- 2016-08-31 JP JP2016169239A patent/JP6825269B2/ja active Active
- 2016-09-01 US US15/254,249 patent/US10296813B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0863601A (ja) * | 1994-08-22 | 1996-03-08 | Nec Corp | 領域分割方法および装置 |
JP2008009745A (ja) * | 2006-06-29 | 2008-01-17 | Mitsubishi Electric Corp | 顔検出装置 |
Non-Patent Citations (1)
Title |
---|
PATRICE Y. SIMARD, ET AL.: "Best practices for convolutional neural networks applied to visual document analysis", SEVENTH INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION, 2003. PROCEEDINGS., JPN6020024530, 6 August 2003 (2003-08-06), US, ISSN: 0004302592 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018174438A1 (en) * | 2017-03-23 | 2018-09-27 | Samsung Electronics Co., Ltd. | Electronic apparatus for operating machine learning and method for operating machine learning |
US11907826B2 (en) | 2017-03-23 | 2024-02-20 | Samsung Electronics Co., Ltd | Electronic apparatus for operating machine learning and method for operating machine learning |
JP2020508531A (ja) * | 2017-09-08 | 2020-03-19 | ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド | 画像品質の評価方法及び画像品質の評価システム |
JP2018156632A (ja) * | 2017-12-25 | 2018-10-04 | 株式会社コナミデジタルエンタテインメント | サーバ装置、及びそれに用いられるコンピュータプログラム |
JP7252009B2 (ja) | 2018-02-28 | 2023-04-04 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 人工ニューラルネットワークを用いたocrシステムのための、線認識最大-最小プーリングを用いたテキスト画像の処理 |
JP2019153293A (ja) * | 2018-02-28 | 2019-09-12 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 人工ニューラルネットワークを用いたocrシステムのための、線認識最大−最小プーリングを用いたテキスト画像の処理 |
JP7446278B2 (ja) | 2018-07-18 | 2024-03-08 | メラティヴ ユーエス エル.ピー. | 人工知能に基づく医療ソリューションを開発するための患者のシミュレーション |
JP2021530777A (ja) * | 2018-07-18 | 2021-11-11 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 人工知能に基づく医療ソリューションを開発するための患者のシミュレーション |
WO2021049005A1 (ja) | 2019-09-13 | 2021-03-18 | 三菱電機株式会社 | 情報処理装置およびそれを備えた電子機器 |
JP2021174199A (ja) * | 2020-04-23 | 2021-11-01 | トヨタ自動車株式会社 | 情報処理システム |
JP7279685B2 (ja) | 2020-04-23 | 2023-05-23 | トヨタ自動車株式会社 | 情報処理システム |
CN113554179B (zh) * | 2020-04-23 | 2024-02-09 | 丰田自动车株式会社 | 信息处理*** |
CN113554179A (zh) * | 2020-04-23 | 2021-10-26 | 丰田自动车株式会社 | 信息处理*** |
JP7251000B2 (ja) | 2020-06-10 | 2023-04-03 | 上▲海▼商▲湯▼智能科技有限公司 | 顔画像の真偽を識別する方法、装置、デバイス及び媒体並びにコンピュータプログラム |
JP2022553768A (ja) * | 2020-06-10 | 2022-12-26 | 上▲海▼商▲湯▼智能科技有限公司 | 顔画像の真偽を識別する方法、装置、デバイス及び媒体並びにコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20170061246A1 (en) | 2017-03-02 |
EP3139310A1 (en) | 2017-03-08 |
JP6825269B2 (ja) | 2021-02-03 |
CN106485192B (zh) | 2019-12-06 |
CN106485192A (zh) | 2017-03-08 |
US10296813B2 (en) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6825269B2 (ja) | 画像認識に用いられるニューラルネットワークの訓練方法及び訓練装置 | |
WO2020155907A1 (zh) | 用于生成漫画风格转换模型的方法和装置 | |
US9767596B2 (en) | Method and apparatus for processing depth image | |
CN110929780A (zh) | 视频分类模型构建、视频分类的方法、装置、设备及介质 | |
US20130208967A1 (en) | Probability Density Function Estimation | |
JP2021524973A (ja) | パタン認識装置、パタン認識方法、及びプログラム | |
CN109902763B (zh) | 用于生成特征图的方法和装置 | |
CN113377909B (zh) | 释义分析模型训练方法、装置、终端设备及存储介质 | |
US11636575B2 (en) | Method and apparatus for acquiring feature data from low-bit image | |
CN108921801B (zh) | 用于生成图像的方法和装置 | |
WO2023103887A1 (zh) | 图像分割标签的生成方法、装置、电子设备及存储介质 | |
CN106663210A (zh) | 基于感受的多媒体处理 | |
US8433145B2 (en) | Coefficient learning apparatus and method, image processing apparatus and method, program, and recording medium | |
CN115239655A (zh) | 一种甲状腺超声影像肿瘤分割分类方法及装置 | |
JP6787981B2 (ja) | 機械学習タスクを容易にするための最適なマザーウェーブレットを得るためのシステムおよび方法 | |
US9558554B1 (en) | Defining basis function requirements for image reconstruction | |
KR20200110255A (ko) | 영상의 특징을 측정하는 방법 및 장치 | |
CN112101396A (zh) | 一种分类方法、装置、设备和存储介质 | |
US11526691B2 (en) | Learning device, learning method, and storage medium | |
Qin et al. | Hybrid NSS features for no‐reference image quality assessment | |
Emchinov et al. | Research and Development of Deep Learning Algorithms for the Classification of Pneumonia Type and Detection of Ground-Glass Loci on Radiological Images | |
US8208735B2 (en) | Image processing device, image processing method, learning device, learning method, and program | |
Chesseboeuf | A greedy algorithm for brain MRI’s registration | |
Anver et al. | Learning Based Image Super Resolution Using Sparse Online Greedy Support Vector Regression | |
Huang et al. | Dynamic Neural Networks for Adaptive Implicit Image Compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200605 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200909 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6825269 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |