JP5214679B2 - 学習装置、方法及びプログラム - Google Patents
学習装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5214679B2 JP5214679B2 JP2010192253A JP2010192253A JP5214679B2 JP 5214679 B2 JP5214679 B2 JP 5214679B2 JP 2010192253 A JP2010192253 A JP 2010192253A JP 2010192253 A JP2010192253 A JP 2010192253A JP 5214679 B2 JP5214679 B2 JP 5214679B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- groups
- unit
- image
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Description
第1各実施形態では、画像に含まれる物体の認識に用いられる評価基準の生成(学習)を例に取り、学習装置について説明する。
第2実施形態では、第1実施形態で生成した評価基準を用いて画像の特徴量を計算する例について説明する。以下では、第1実施形態との相違点の説明を主に行い、第1実施形態と同様の機能を有する構成要素については、第1実施形態と同様の名称・符号を付し、その説明を省略する。
第3実施形態では、入力された画像の画像特徴を抽出し、抽出した画像特徴の特徴量を計算する例について説明する。以下では、第2実施形態との相違点の説明を主に行い、第2実施形態と同様の機能を有する構成要素については、第2実施形態と同様の名称・符号を付し、その説明を省略する。
第4実施形態では、特徴量の類似度を計算する例について説明する。以下では、第3実施形態との相違点の説明を主に行い、第3実施形態と同様の機能を有する構成要素については、第3実施形態と同様の名称・符号を付し、その説明を省略する。
上記各実施形態において、学習部116は、複数種類の学習方法を切り替えて識別基準を学習するようにしてもよい。例えば学習部116は、上述したサポートベクターマシンやブースティングなど複数種類の既存の学習手法を切り替えて識別器を学習するようにしてもよい。
上記各実施形態において、学習部により生成された評価基準を用いて、学習サンプルの特徴量を計算し、計算した特徴量を学習サンプルとして学習サンプル記憶部に格納するようにしてもよい。つまり、学習サンプルを学習して生成した評価基準を用いて計算した学習サンプルの特徴量を、更に学習サンプルに用いることで、評価基準の学習を再帰的に行うようにしてもよい。以下では、第1実施形態との相違点の説明を主に行い、第1実施形態と同様の機能を有する構成要素については、第2実施形態と同様の名称・符号を付し、その説明を省略する。
上記第3〜第4実施形態において、学習サンプル記憶部312は、学習サンプルとして、画像毎に複数種類の画像特徴を記憶するようにしてもよい。この場合、選択部114は、どの画像特徴を選択するかだけでなく、どの種類の画像特徴を用いるのかも選択し、抽出部332は、画像から複数画像の画像特徴を抽出する。選択部114の選択方法はどのような方法を用いてもよい。例えば、選択部114は、画像特徴の種類を無作為に選択してもよいし、これまで選択されていない画像特徴を優先的に選択するようにしてもよい。
上記各実施形態及び上記各変形例では、画像に含まれる物体認識に用いられる評価基準の生成(学習)を例に取り、学習サンプルが画像や画像特徴である例について説明した。但し、これに限定されるものではなく、例えば音声認識など様々な分野に適用可能である。例えば、音声認識に適用する場合であれば、学習サンプルを音声信号とすればよい。この場合も認識対象の音声信号をDs次元のベクトルで表すことができ、ベクトルの要素を音声信号の値とすればよい。このように、認識対象に応じた学習サンプルを用意し、認識対象のデータをDs次元のベクトルで表し、ベクトルの要素を認識対象に応じた値とすれば、どのような分野においても容易に適用することができる。
112 学習サンプル記憶部
114 選択部
116 学習部
118 評価基準記憶部
222 入力部
224 入力受付部
226 特徴量計算部
332 抽出部
442 基準特徴量記憶部
444 類似度計算部
552 サンプル特徴量計算部
Claims (9)
- 各学習サンプルが複数のカテゴリのいずれかに分類される複数の学習サンプルを記憶する学習サンプル記憶部と、
前記学習サンプル記憶部から学習サンプルを1以上含むグループを複数選択する選択処理を複数回行う選択部と、
選択された複数のグループ毎に当該複数のグループを識別する識別基準を学習し、学習した複数の識別基準を含む評価基準を生成する学習部と、
を備え、
前記選択部は、選択する複数のグループのそれぞれに含まれる学習サンプルのカテゴリ数のグループ間の差が予め定められた範囲内に収まるように、前記複数のグループを無作為に選択することを特徴とする学習装置。 - 前記学習サンプルは、画像であり、
物体が含まれる画像の入力を受け付ける入力受付部と、
前記評価基準を用いて、前記画像の特徴量を計算する特徴量計算部と、を更に備えることを特徴とする請求項1に記載の学習装置。 - 前記学習サンプルは、画像特徴であり、
前記画像の画像特徴を抽出する抽出部を、更に備え、
前記特徴量計算部は、前記評価基準を用いて、前記画像特徴の特徴量を計算することを特徴とする請求項2に記載の学習装置。 - 前記特徴量と認識基準となる基準特徴量との類似度を計算する類似度計算部を更に備えることを特徴とする請求項2又は3に記載の学習装置。
- 前記学習部は、複数種類の学習方法を切り替えて前記識別基準を学習することを特徴とする請求項1〜4のいずれか1つに記載の学習装置。
- 前記評価基準を用いて、学習サンプルの特徴量を計算し、計算した特徴量を学習サンプルとして前記学習サンプル記憶部に格納するサンプル特徴量計算部を更に備えることを特徴とする請求項1〜5のいずれか1つに記載の学習装置。
- 前記学習サンプル記憶部は、前記学習サンプルとして、複数種類の画像特徴を記憶することを特徴とする請求項3又は4に記載の学習装置。
- 選択部が、各学習サンプルが複数のカテゴリのいずれかに分類される複数の学習サンプルを記憶する学習サンプル記憶部から学習サンプルを1以上含むグループを複数選択する選択処理を複数回行う選択ステップと、
学習部が、選択された複数のグループ毎に当該複数のグループを識別する識別基準を学
習し、学習した複数の識別基準を含む評価基準を生成する学習ステップと、
を含み、
前記選択ステップでは、選択する複数のグループのそれぞれに含まれる学習サンプルのカテゴリ数のグループ間の差が予め定められた範囲内に収まるように、前記複数のグループを無作為に選択することを特徴とする学習方法。 - 各学習サンプルが複数のカテゴリのいずれかに分類される複数の学習サンプルを記憶する学習サンプル記憶部から学習サンプルを1以上含むグループを複数選択する選択処理を複数回行う選択ステップと、
選択された複数のグループ毎に当該複数のグループを識別する識別基準を学習し、学習した複数の識別基準を含む評価基準を生成する学習ステップと、
をコンピュータに実行させ、
前記選択ステップでは、選択する複数のグループのそれぞれに含まれる学習サンプルのカテゴリ数のグループ間の差が予め定められた範囲内に収まるように、前記複数のグループを無作為に選択することを特徴とする学習プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010192253A JP5214679B2 (ja) | 2010-08-30 | 2010-08-30 | 学習装置、方法及びプログラム |
US13/215,462 US9058748B2 (en) | 2010-08-30 | 2011-08-23 | Classifying training method and apparatus using training samples selected at random and categories |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010192253A JP5214679B2 (ja) | 2010-08-30 | 2010-08-30 | 学習装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012048624A JP2012048624A (ja) | 2012-03-08 |
JP5214679B2 true JP5214679B2 (ja) | 2013-06-19 |
Family
ID=45697736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010192253A Active JP5214679B2 (ja) | 2010-08-30 | 2010-08-30 | 学習装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9058748B2 (ja) |
JP (1) | JP5214679B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5214760B2 (ja) | 2011-03-23 | 2013-06-19 | 株式会社東芝 | 学習装置、方法及びプログラム |
JP5214762B2 (ja) | 2011-03-25 | 2013-06-19 | 株式会社東芝 | 認識装置、方法及びプログラム |
JP6017335B2 (ja) | 2013-02-06 | 2016-10-26 | 株式会社東芝 | パターン認識装置、その方法、及び、そのプログラム |
JP2015133085A (ja) * | 2014-01-15 | 2015-07-23 | キヤノン株式会社 | 情報処理装置およびその方法 |
WO2016117358A1 (ja) * | 2015-01-21 | 2016-07-28 | 三菱電機株式会社 | 検査データ処理装置および検査データ処理方法 |
CN105513597B (zh) * | 2015-12-30 | 2018-07-10 | 百度在线网络技术(北京)有限公司 | 声纹认证处理方法及装置 |
US10528889B2 (en) * | 2016-03-25 | 2020-01-07 | Futurewei Technologies, Inc. | Stereoscopic learning for classification |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3833430B2 (ja) * | 2000-02-14 | 2006-10-11 | 三菱電機株式会社 | データ照合装置及びデータ照合方法 |
JP2006268825A (ja) | 2005-02-28 | 2006-10-05 | Toshiba Corp | オブジェクト検出装置、学習装置、オブジェクト検出システム、方法、およびプログラム |
JP4767595B2 (ja) * | 2005-06-15 | 2011-09-07 | パナソニック株式会社 | 対象物検出装置及びその学習装置 |
JP4956273B2 (ja) * | 2007-05-17 | 2012-06-20 | 日本放送協会 | 投球球種識別装置、識別器生成装置、投球球種識別プログラム及び識別器生成プログラム |
-
2010
- 2010-08-30 JP JP2010192253A patent/JP5214679B2/ja active Active
-
2011
- 2011-08-23 US US13/215,462 patent/US9058748B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20120052473A1 (en) | 2012-03-01 |
US9058748B2 (en) | 2015-06-16 |
JP2012048624A (ja) | 2012-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10909455B2 (en) | Information processing apparatus using multi-layer neural network and method therefor | |
JP5214760B2 (ja) | 学習装置、方法及びプログラム | |
JP5214679B2 (ja) | 学習装置、方法及びプログラム | |
US9070041B2 (en) | Image processing apparatus and image processing method with calculation of variance for composited partial features | |
JP6798619B2 (ja) | 情報処理装置、情報処理プログラム及び情報処理方法 | |
US10783402B2 (en) | Information processing apparatus, information processing method, and storage medium for generating teacher information | |
WO2019158015A1 (zh) | 样本获取方法、目标检测模型生成方法、目标检测方法 | |
US9633044B2 (en) | Apparatus and method for recognizing image, and method for generating morphable face images from original image | |
JP6448325B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN110717554B (zh) | 图像识别方法、电子设备及存储介质 | |
JP5214716B2 (ja) | 識別装置 | |
CN109919252B (zh) | 利用少数标注图像生成分类器的方法 | |
JP2016134175A (ja) | ワイルドカードを用いてテキスト−画像クエリを実施するための方法およびシステム | |
JP2011013732A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2014232533A (ja) | Ocr出力検証システム及び方法 | |
CN105760488B (zh) | 基于多层次特征融合的图像表达方法和装置 | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
WO2012132418A1 (ja) | 属性推定装置 | |
JP2011096136A (ja) | オブジェクト識別装置及びオブジェクト識別方法 | |
WO2021042505A1 (zh) | 基于文字识别技术的笔记生成方法、装置和计算机设备 | |
JP5776694B2 (ja) | 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム | |
Dong et al. | A supervised dictionary learning and discriminative weighting model for action recognition | |
CN115620083A (zh) | 模型训练方法、人脸图像质量评价方法、设备及介质 | |
KR102321039B1 (ko) | 머신러닝 기반의 비디오 분류 장치, 방법 및 컴퓨터 프로그램 | |
Robbins | Robustness to Atmospheric Turbulence with Improved Feature Invariance in Deep Learning-Based Face Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120814 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130227 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5214679 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |