WO2023053569A1

WO2023053569A1 - 機械学習装置、機械学習方法、および機械学習プログラム

Info

Publication number: WO2023053569A1
Application number: PCT/JP2022/021173
Authority: WO
Inventors: 晋吾木田; 英樹竹原; 尹誠楊; 真季高見
Original assignee: 株式会社Ｊｖｃケンウッド
Priority date: 2021-09-28
Filing date: 2022-05-24
Publication date: 2023-04-06

Abstract

基本クラスに比べて少数の新規クラスを継続学習する機械学習装置（２００）を提供する。基本クラス特徴抽出部（５０）は、基本クラスの特徴ベクトルを抽出する。新規クラス特徴抽出部（５２）は、新規クラスの特徴ベクトルを抽出する。混合特徴算出部（６０）は、基本クラスの特徴ベクトルと新規クラスの特徴ベクトルを混合し、基本クラスと新規クラスの混合特徴ベクトルを算出する。学習部（８０）は、投影空間上でクエリセットのクエリサンプルの混合特徴ベクトルの位置と各クラスの分類重みベクトルの位置との距離にもとづいてクエリセットのクエリサンプルをクラス分類し、クラス分類の損失を最小化するように新規クラスの分類重みベクトルを学習する。

Description

機械学習装置、機械学習方法、および機械学習プログラム

　本発明は、機械学習技術に関する。

　人間は長期にわたる経験を通して新しい知識を学習することができ、昔の知識を忘れないように維持することができる。一方、畳み込みニューラルネットワーク（Convolutional Neural Network(CNN)）の知識は学習に使用したデータセットに依存しており、データ分布の変化に適応するためにはデータセット全体に対してＣＮＮのパラメータの再学習が必要となる。ＣＮＮでは、新しいタスクについて学習していくにつれて、昔のタスクに対する推定精度は低下していく。このようにＣＮＮでは連続学習を行うと新しいタスクの学習中に昔のタスクの学習結果を忘れてしまう致命的忘却(catastrophic forgetting)が避けられない。

　致命的忘却を回避する手法として、継続学習（incremental learningまたはcontinual learning）が提案されている。継続学習とは、新しいタスクや新しいデータが発生した時に、最初からモデルを学習するのではなく、現在の学習済みのモデルを改善して学習する学習方法である。

　他方、新しいタスクは数少ないサンプルデータしか利用できないことが多いため、少ない教師データで効率的に学習する手法として、少数ショット学習（few-shot learning）が提案されている。少数ショット学習では、一度学習したパラメータを再学習せずに、別の少量のパラメータを用いて新しいタスクを学習する。

　基本（ベース）クラスの学習結果に対して致命的忘却を伴わずに新規クラスを学習する継続学習と、基本クラスに比べて少数しかない新規クラスを学習する少数ショット学習とを組み合わせた継続少数ショット学習（incremental few-shot learning(IFSL)）と呼ばれる手法が提案されている（非特許文献１）。継続少数ショット学習では、基本クラスについては大規模なデータセットから学習し、新規クラスについては少数のサンプルデータから学習することができる。

Yoon, S. W., Kim, D. Y., Seo, J., & Moon, J. (2020, November). XtarNet: Learning to extract task-adaptive representation for incremental few-shot learning. In International Conference on Machine Learning (pp. 10852-10860). PMLR.

　継続少数ショット学習手法として非特許文献１に記載のＸｔａｒＮｅｔがある。ＸｔａｒＮｅｔは、継続少数ショット学習においてタスク適応表現（task-adaptive representation (TAR)）の抽出を学習するが、抽出のためのメタ学習は、損失が収束しにくく、学習に時間がかかるという課題があった。

　本発明はこうした状況に鑑みてなされたものであり、その目的は、損失が収束しやすく、学習時間を短縮することができる機械学習技術を提供することにある。

　上記課題を解決するために、本実施形態のある態様の機械学習装置は、基本クラスに比べて少数の新規クラスを継続学習する機械学習装置であって、基本クラスの特徴ベクトルを抽出する基本クラス特徴抽出部と、新規クラスの特徴ベクトルを抽出する新規クラス特徴抽出部と、基本クラスの特徴ベクトルと新規クラスの特徴ベクトルを混合し、基本クラスと新規クラスの混合特徴ベクトルを算出する混合特徴算出部と、投影空間上でクエリセットのクエリサンプルの混合特徴ベクトルの位置と各クラスの分類重みベクトルの位置との距離にもとづいてクエリセットのクエリサンプルをクラス分類し、クラス分類の損失を最小化するように新規クラスの分類重みベクトルを学習する学習部とを含む。

　本実施形態の別の態様は、機械学習方法である。この方法は、基本クラスに比べて少数の新規クラスを継続学習する機械学習方法であって、基本クラスの特徴ベクトルを抽出する基本クラス特徴抽出ステップと、新規クラスの特徴ベクトルを抽出する新規クラス特徴抽出ステップと、基本クラスの特徴ベクトルと新規クラスの特徴ベクトルを混合し、基本クラスと新規クラスの混合特徴ベクトルを算出する混合特徴算出ステップと、投影空間上でクエリセットのクエリサンプルの混合特徴ベクトルの位置と各クラスの分類重みベクトルの位置との距離にもとづいてクエリセットのクエリサンプルをクラス分類し、クラス分類の損失を最小化するように新規クラスの分類重みベクトルを学習する学習ステップとを含む。

　なお、以上の構成要素の任意の組合せ、本実施形態の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本実施形態の態様として有効である。

　本実施形態によれば、損失が収束しやすく、学習時間を短縮することができる機械学習技術を提供することができる。

事前トレーニングモジュールの構成を説明する図である。継続少数ショット学習モジュールの構成を説明する図である。エピソード形式のトレーニングを説明する図である。サポートセットからタスク適応表現を算出するためのタスク固有の混合重みベクトルを生成する構成を説明する図である。サポートセットからタスク適応表現を算出し、タスク適応表現に基づいて分類重みベクトルセットＷを生成する構成を説明する図である。クエリセットからタスク適応表現を算出し、タスク適応表現とタスク調整後の分類重みベクトルセットに基づいてクエリサンプルをクラス分類し、クラス分類の損失を最小化する構成を説明する図である。投影空間の概念図である。図５（ａ）～図５（ｃ）は、従来のエピソード形式の学習手順を説明する図である。本発明の実施の形態１に係る機械学習装置の構成図である。図７（ａ）～図７（ｃ）は、実施の形態１のエピソード形式の学習手順を説明する図である。図８（ａ）～図８（ｃ）は、従来のクエリサンプルに対する損失算出手順を説明する図である。従来のクエリサンプルに対する損失算出手順を示すフローチャートである。本発明の実施の形態２に係る機械学習装置の構成図である。図１１（ａ）～図１１（ｃ）は、実施の形態２のクエリサンプルに対する損失算出手順を説明する図である。実施の形態２のクエリサンプルに対する損失算出手順を示すフローチャートである。

　最初にＸｔａｒＮｅｔによる継続少数ショット学習の概要を説明する。ＸｔａｒＮｅｔはタスク適応表現（ＴＡＲ）の抽出を学習する。まず、基本クラスのデータセットで事前トレーニングされたバックボーンネットワークを利用し、基本クラスの特徴を得る。次に新規クラスのエピソード全体でメタトレーニングされた追加モジュールを使用し、新規クラスの特徴を得る。基本クラスの特徴と新規クラスの特徴の混合物をタスク適応表現（ＴＡＲ）と呼ぶ。基本クラスおよび新規クラスの分類器は、このＴＡＲを利用して与えられたタスクにすばやく適応し、分類タスクを実行する。

　図１Ａ～図１Ｃを参照してＸｔａｒＮｅｔの学習手順の概要を説明する。

　図１Ａは、事前トレーニングモジュール２０の構成を説明する図である。事前トレーニングモジュール２０は、バックボーンＣＮＮ２２と基本クラス分類重み２４を含む。

　基本クラスのデータセット１０はＮ個のサンプルを含む。サンプルの一例は画像であるが、これに限定されない。バックボーンＣＮＮ２２は、基本クラスのデータセット１０を事前学習する畳み込みニューラルネットワークである。基本クラス分類重み２４は、基本クラスの分類器の重みベクトルＷ_ｂａｓｅであり、基本クラスのデータセット１０のサンプルの平均特徴量を示すものである。

　学習ステージ１では、バックボーンＣＮＮ２２が基本クラスのデータセット１０によって事前トレーニングされる。

　図１Ｂは、継続少数ショット学習モジュール１００の構成を説明する図である。継続少数ショット学習モジュール１００は、図１Ａの事前トレーニングモジュール２０にメタモジュール群３０と新規クラス分類重み３４を追加したものである。メタモジュール群３０は、後述の３つの多層ニューラルネットワークを含み、新規クラスのデータセットを事後学習する。新規クラスのデータセットに含まれるサンプルの数は、基本クラスのデータセットに含まれるサンプルの数に比べて少数である。新規クラス分類重み３４は、新規クラスの分類器の重みベクトルＷ_{ｎｏｖｅｌ}であり、新規クラスのデータセットのサンプルの平均特徴量を示すものである。

　学習ステージ２では、事前トレーニングモジュール２０をベースにして、メタモジュール群３０がエピソード形式でトレーニングされる。

　図１Ｃは、エピソード形式のトレーニングを説明する図である。エピソード形式のトレーニングは、メタトレーニングステージとテストステージを含む。メタトレーニングステージは、エピソード毎に実行され、メタモジュール群３０と新規クラス分類重み３４が更新される。テストステージは、メタトレーニングステージで更新されたメタモジュール群３０と新規クラス分類重み３４を用いて分類のテストを実行する。

　各エピソードは、サポートセットＳとクエリセットＱから構成される。サポートセットＳは新規クラスのデータセット１２で構成され、クエリセットＱは基本クラスのデータセット１４と新規クラスのデータセット１６で構成される。学習ステージ２では、各エピソードにおいて、与えられたサポートセットＳのサポートサンプルに基づいて、クエリセットＱに含まれる基本クラスと新規クラスの両方のクエリサンプルをクラス分類し、クラス分類の損失を最小化するようにメタモジュール群３０のパラメータと新規クラス分類重み３４を更新する。

　図２Ａおよび図２Ｂを参照して、ＸｔａｒＮｅｔにおけるサポートセットＳの処理に係る構成を説明し、図３を参照して、ＸｔａｒＮｅｔにおけるクエリセットＱの処理に係る構成と学習プロセスを説明する。

　ＸｔａｒＮｅｔでは、バックボーンＣＮＮ２２に加えて、メタモジュール群３０として、以下の３つの異なるメタ学習可能なモジュールを利用する。
（１）ＭｅｔａＣＮＮ：新規クラスの特徴を抽出するニューラルネットワーク
（２）ＭｅｒｇｅＮｅｔ：基本クラスの特徴と新規クラスの特徴を混合するニューラルネットワーク
（３）ＴｃｏｎＮｅｔ：分類器の重みを調整するニューラルネットワーク

　図２Ａは、サポートセットＳからタスク適応表現ＴＡＲを算出するためのタスク固有の混合重みベクトルω_ｐｒｅとω_ｍｅｔａを生成する構成を説明する図である。

　サポートセットＳは、新規クラスのデータセット１２を含む。サポートセットＳの各サポートサンプルをバックボーンＣＮＮ２２に入力する。バックボーンＣＮＮ２２はサポートサンプルを処理して基本クラスの特徴ベクトル（「基本特徴ベクトル」と呼ぶ）を出力し、平均部２３に供給する。平均部２３は、バックボーンＣＮＮ２２が出力する基本特徴ベクトルをすべてのサポートサンプルに対して平均化して平均基本特徴ベクトルを計算し、ＭｅｒｇｅＮｅｔ３６に入力する。

　ＭｅｔａＣＮＮ３２にはバックボーンＣＮＮ２２の中間層の出力が入力される。ＭｅｔａＣＮＮ３２は、バックボーンＣＮＮ２２の中間層の出力を処理して新規クラスの特徴ベクトル（「新規特徴ベクトル」と呼ぶ）を出力し、平均部３３に供給する。平均部３３は、ＭｅｔａＣＮＮ３２が出力する新規特徴ベクトルをすべてのサポートサンプルに対して平均化して平均新規特徴ベクトルを計算し、ＭｅｒｇｅＮｅｔ３６に入力する。

　ＭｅｒｇｅＮｅｔ３６は、平均基本特徴ベクトルおよび平均新規特徴ベクトルをニューラルネットワークで処理して、タスク適応表現ＴＡＲを算出するためのタスク固有の混合重みベクトルω_ｐｒｅとω_ｍｅｔａを出力する。

　バックボーンＣＮＮ２２は、入力ｘに対して基本特徴ベクトルを抽出する基本特徴ベクトル抽出器ｆ_θとして動作し、入力ｘに対して基本特徴ベクトルｆ_θ（ｘ）を出力する。入力ｘに対するバックボーンＣＮＮ２２の中間層出力をａ_θ（ｘ）とする。ＭｅｔａＣＮＮ３２は、中間層出力ａ_θ（ｘ）に対して新規特徴ベクトルを抽出する新規特徴ベクトル抽出器ｇとして動作し、中間層出力ａ_θ（ｘ）に対して新規特徴ベクトルｇ（ａ_θ（ｘ））を出力する。

　図２Ｂは、サポートセットＳからタスク適応表現ＴＡＲを算出し、タスク適応表現ＴＡＲに基づいて分類重みベクトルセットＷを生成する構成を説明する図である。

　ベクトル積演算器２５は、サポートセットＳの各サポートサンプルｘに対してバックボーンＣＮＮ２２から出力される基本特徴ベクトルｆ_θ（ｘ）とＭｅｒｇｅＮｅｔ３６から出力される混合重みベクトルω_ｐｒｅの間の要素毎の積を算出し、ベクトル和演算器３７に与える。

　ベクトル積演算器３５は、サポートセットＳの各サポートサンプルｘに対するバックボーンＣＮＮ２２の中間層出力ａ_θ（ｘ）に対してＭｅｔａＣＮＮ３２から出力される新規特徴ベクトルｇ（ａ_θ（ｘ））とＭｅｒｇｅＮｅｔ３６から出力される混合重みベクトルω_ｍｅｔａの間の要素毎の積を算出し、ベクトル和演算器３７に与える。

　ベクトル和演算器３７は、基本特徴ベクトルｆ_θ（ｘ）と混合重みベクトルω_ｐｒｅの積と、新規特徴ベクトルｇ（ａ_θ（ｘ））と混合重みベクトルω_ｍｅｔａの積とのベクトル和を算出し、サポートセットＳの各サポートサンプルｘのタスク適応表現ＴＡＲとして出力し、ＴｃｏｎＮｅｔ３８と投影空間構築部４０に与える。タスク適応表現ＴＡＲは、基本特徴ベクトルと新規特徴ベクトルを混合した混合特徴ベクトルである。

　タスク適応表現ＴＡＲの計算式は、ベクトルの成分ごとの積を×で表記すると、以下のようになる。
　ＴＡＲ＝ω_ｐｒｅ×ｆ_θ（ｘ）＋ω_ｍｅｔａ×ｇ（ａ_θ（ｘ））
　タスク適応表現ＴＡＲの計算式は、混合重みベクトルと特徴ベクトルの間の要素ごとの積の合計を求めるものである。サポートセットＳの各サポートサンプルに対してタスク適応表現ＴＡＲを算出する。

　ＴｃｏｎＮｅｔ３８は、分類重みベクトルセットＷ＝［Ｗ_ｂａｓｅ，Ｗ_{ｎｏｖｅｌ}］の入力を受け取り、各サポートサンプルのタスク適応表現ＴＡＲを利用して、タスク調整後の分類重みベクトルセットＷ^＊を出力する。

　投影空間構築部４０は、各サポートサンプルのタスク適応表現ＴＡＲのクラスｋ毎の平均｛Ｃ_ｋ｝とタスク調整後のＷ^＊が投影空間Ｍ上で一致するように、タスク適応投影空間Ｍを構築する。

　図３は、クエリセットＱからタスク適応表現ＴＡＲを算出し、タスク適応表現ＴＡＲとタスク調整後の分類重みベクトルセットＷ^＊に基づいてクエリサンプルをクラス分類し、クラス分類の損失を最小化する構成を説明する図である。

　ベクトル積演算器２５は、クエリセットＱの各クエリサンプルｘに対してバックボーンＣＮＮ２２から出力される基本特徴ベクトルｆ_θ（ｘ）とＭｅｒｇｅＮｅｔ３６から出力される混合重みベクトルω_ｐｒｅの間の要素毎の積を算出し、ベクトル和演算器３７に与える。

　ベクトル積演算器３５は、クエリセットＱの各クエリサンプルｘに対するバックボーンＣＮＮ２２の中間層出力ａ_θ（ｘ）に対してＭｅｔａＣＮＮ３２から出力される新規特徴ベクトルｇ（ａ_θ（ｘ））とＭｅｒｇｅＮｅｔ３６から出力される混合重みベクトルω_ｍｅｔａの間の要素毎の積を算出し、ベクトル和演算器３７に与える。

　ベクトル和演算器３７は、基本特徴ベクトルｆ_θ（ｘ）と混合重みベクトルω_ｐｒｅの積と、新規特徴ベクトルｇ（ａ_θ（ｘ））と混合重みベクトルω_ｍｅｔａの積とのベクトル和を算出し、クエリセットＱの各クエリサンプルｘのタスク適応表現ＴＡＲとして出力し、投影空間クエリ分類部４２に与える。

　ＴｃｏｎＮｅｔ３８が出力するタスク調整後の分類重みベクトルセットＷ^＊は投影空間クエリ分類部４２に入力される。

　投影空間クエリ分類部４２は、投影空間Ｍ上で、クエリセットＱの各クエリサンプルに対して計算されたタスク適応表現ＴＡＲの位置と分類対象クラスの平均特徴ベクトルの位置との間のユークリッド距離を計算し、クエリサンプルを最も近いクラスに分類する。ここで、投影空間構築部４０の働きによって、投影空間Ｍ上で、分類対象クラスの平均位置は、タスク調整後の分類重みベクトルセットＷ^＊と一致することに留意する。

　損失最適化部４４は、クエリサンプルのクラス分類の損失をクロスエントロピー関数によって評価し、クエリセットＱのクラス分類結果が正解に近づき、クラス分類の損失を最小化するよう学習を進める。これにより、クエリサンプルに対して計算されたタスク適応表現ＴＡＲの位置と、分類対象クラスの平均特徴ベクトルの位置すなわちタスク調整後の分類重みベクトルセットＷ^＊の位置との間の距離が小さくなるように、ＭｅｔａＣＮＮ３２、ＭｅｒｇｅＮｅｔ３６、ＴｃｏｎＮｅｔ３８の学習可能なパラメータおよび新規クラス分類重みＷ_{ｎｏｖｅｌ}が更新される。

　図４は、投影空間Ｍの概念図である。２００個の基本クラスＢ１～Ｂ２００の基準位置（タスク調整後の基本クラス分類重みＷ_ｂａｓｅ ^＊に一致する）、５個の新規クラスＮ１～Ｎ５の基準位置（タスク調整後の新規クラス分類重みＷ_{ｎｏｖｅｌ} ^＊に一致する）、およびクエリセットＱのクエリサンプルのタスク適応表現ＴＡＲが投影空間Ｍ上に投影され、投影空間Ｍは共同分類空間として機能する。なお、便宜上、同図には基本クラスＢ１１～Ｂ１９０は図示していない。

　損失最適化部４４は、投影空間Ｍ上で、クエリサンプルのタスク適応表現ＴＡＲの位置と、基本クラスと新規クラスを合わせた２０５個の各クラスの平均特徴ベクトルとのユークリッド距離に基づいて各クラスの確率分布を推定し、クロスエントロピー関数を用いてクラス分類の損失を算出し、損失を最小化する。

　次に、本発明の実施の形態１について、解決すべき課題とその解決手段を説明する。

　図５（ａ）～図５（ｃ）は、従来のエピソード形式の学習手順を説明する図である。図５（ａ）に示すように、エピソード１では、２００個の基本クラスＢ１～Ｂ２００と５個の新規クラスＮ１～Ｎ５を合わせた２０５クラスが分類対象クラスである。図５（ｂ）に示すように、エピソード２では、２００個の基本クラスＢ１～Ｂ２００と５個の新規クラスＮ６～Ｎ１０を合わせた２０５クラスが分類対象クラスである。図５（ｃ）に示すように、エピソード３では、２００個の基本クラスＢ１～Ｂ２００と５個の新規クラスＮ１１～Ｎ１５を合わせた２０５クラスが分類対象クラスである。

　このように従来の学習では、各エピソードに対して、分類対象クラス数はすべて２０５クラスである。分類対象クラスが全クラスとなるため、クロスエントロピー関数で表した損失が収束しにくく、かつ、全クラス分のユークリッド距離を計算して確率分布を推定する手間がかかるため、全体的に学習時間が長くなるという課題があった。

　図６は、本発明の実施の形態１に係る機械学習装置２００の構成図である。ここでは、ＸｔａｒＮｅｔと共通する構成については適宜説明を省略し、ＸｔａｒＮｅｔに対して追加する構成を中心に説明する。

　機械学習装置２００は、基本クラス特徴抽出部５０、新規クラス特徴抽出部５２、混合特徴算出部６０、調整部７０、学習部８０、重み選択部９０、および基本クラスラベル情報保存部９２を含む。

　基本クラスのデータセット１４と新規クラスのデータセット１６で構成されるクエリセットＱを基本クラス特徴抽出部５０に入力する。基本クラス特徴抽出部５０は、一例としてバックボーンＣＮＮ２２である。基本クラス特徴抽出部５０は、クエリセットＱの各クエリサンプルの基本特徴ベクトルを抽出して出力する。

　新規クラス特徴抽出部５２は、基本クラス特徴抽出部５０の中間出力を入力として受け取る。新規クラス特徴抽出部５２は、一例としてＭｅｔａＣＮＮ３２である。新規クラス特徴抽出部５２は、クエリセットＱの各クエリサンプルの新規特徴ベクトルを抽出して出力する。

　混合特徴算出部６０は、各クエリサンプルの基本特徴ベクトルと新規特徴ベクトルを混合して混合特徴ベクトルをタスク適応表現ＴＡＲとして算出し、調整部７０と学習部８０に与える。混合特徴算出部６０は、一例としてＭｅｒｇｅＮｅｔ３６である。

　調整部７０は、各クエリサンプルのタスク適応表現ＴＡＲを用いてタスク調整後の分類重みベクトルセットＷ^＊を算出し、重み選択部９０に与える。調整部７０は、一例としてＴｃｏｎＮｅｔ３８である。

　メタ学習において、クエリセットＱの基本クラスにはラベルが付与されている。基本クラスラベル情報保存部９２は、各エピソードのクエリセットＱに選出された基本クラスに付与されたラベル情報を保存し、エピソード毎に基本クラスのラベル情報を重み選択部９０に与える。

　重み選択部９０は、各エピソードにおいて、調整部７０から出力されたタスク調整後の分類重みベクトルセットＷ^＊から、クエリセットＱに選出された基本クラスのラベル情報に対応する基本クラスの分類器の重みを選択し、選択された分類器の重みを投影空間Ｍ上に投影する。

　学習部８０は、投影空間Ｍ上で、クエリサンプルのタスク適応表現ＴＡＲの位置と選択された分類器の重みとの間の距離に基づいてクエリサンプルをクラス分類し、クラス分類の損失を最小化するように学習する。学習部８０は、一例として投影空間クエリ分類部４２と損失最適化部４４である。

　図７（ａ）～図７（ｃ）は、実施の形態１のエピソード形式の学習手順を説明する図である。メタ学習において、クエリセットＱの基本クラスにはラベルが付与されている。この基本クラスのラベル情報を利用し、クエリセットＱとして選出される所定数の基本クラスをエピソード毎に順次追加して処理する。

　図７（ａ）に示すように、エピソード１では、エピソード１のクエリセットに選出された５個の基本クラスＢ１～Ｂ５と５個の新規クラスＮ１～Ｎ５を投影空間Ｍ上に投影する。エピソード１では、５個の基本クラスＢ１～Ｂ５と５個の新規クラスＮ１～Ｎ５を合わせた１０クラスが分類対象クラスである。

　図７（ｂ）に示すように、エピソード２では、エピソード１のクエリセットに選出された５個の基本クラスＢ１～Ｂ５に加えて、新たにエピソード２のクエリセットに選出された５個の基本クラスＢ６～Ｂ１０と５個の新規クラスＮ６～Ｎ１０を投影空間Ｍ上に投影する。エピソード２では、１０個の基本クラスＢ１～Ｂ１０と５個の新規クラスＮ６～Ｎ１０を合わせた１５クラスが分類対象クラスである。

　図７（ｃ）に示すように、エピソード３では、エピソード１とエピソード２のクエリセットに選出された１０個の基本クラスＢ１～Ｂ１０に加えて、新たにエピソード３のクエリセットに選出された５個の基本クラスＢ１１～Ｂ１５と５個の新規クラスＮ１１～Ｎ１５を投影空間Ｍ上に投影する。エピソード３では、１５個の基本クラスＢ１～Ｂ１５と５個の新規クラスＮ１１～Ｎ１５を合わせた２０クラスが分類対象クラスである。

　なお、図７（ａ）～図７（ｃ）において、説明の便宜上、投影空間Ｍ上の分類対象クラスの位置が全く移動していないように図示しているが、実際にはエピソード毎の学習によって分類対象クラスの位置は変動していくことに留意する。また、説明の便宜上、エピソード毎にクエリセットに選出された５個の基本クラスが追加されるとしたが、実際にはクエリセットにこれまでにない基本クラスが新しく登場した場合に追加されるので、必ずしも常に５個追加されるとは限られないことに留意する。

　このように、すべての基本クラスＢ１～Ｂ２００を投影空間Ｍ上に投影するのではなく、クエリセットに選出される所定数（たとえばクエリセットに選出される新規クラスの数と同じ数、ここでは５個）の基本クラスを順次追加することにより、すべての基本クラスが投影されるまでの期間は分類対象クラス数を削減でき、損失が収束しやすくなり、学習時間を短縮することができる。

　次に、本発明の実施の形態２について、解決すべき課題とその解決手段を説明する。

　図８（ａ）～図８（ｃ）は、従来のクエリサンプルに対する損失算出手順を説明する図である。図８（ａ）に示すように、クエリサンプル１では、２００個の基本クラスＢ１～Ｂ２００と５個の新規クラスＮ１～Ｎ５を合わせた２０５クラスが分類対象クラスである。図８（ｂ）に示すように、クエリサンプル２では、２００個の基本クラスＢ１～Ｂ２００と５個の新規クラスＮ６～Ｎ１０を合わせた２０５クラスが分類対象クラスである。図８（ｃ）に示すように、クエリサンプル３では、２００個の基本クラスＢ１～Ｂ２００と５個の新規クラスＮ１１～Ｎ１５を合わせた２０５クラスが分類対象クラスである。

　このように従来の損失算出では、あるエピソードにおける各クエリサンプルに対して、分類対象クラス数はすべて２０５クラスである。クエリ損失の計算が全クラス対象となるため、クエリサンプルのタスク適応表現ＴＡＲとの距離が遠い、すなわち関連性の低いクラスも計算に加味されることになり、分類精度の低下を招く恐れがある。また、損失が収束しにくく、学習に時間がかかるという課題があった。

　図９は、従来のクエリサンプルに対する損失算出手順を示すフローチャートである。クエリサンプルのタスク適応表現ＴＡＲと全クラスの分類器の重みＷ^＊を投影空間Ｍ上に投影する（Ｓ１０）。クエリサンプルのタスク適応表現ＴＡＲと全クラスの分類器の重みＷ^＊とのユークリッド距離を計算する（Ｓ２０）。全クラスの確率分布をユークリッド距離に応じて推定する（Ｓ３０）。全クラスの確率分布を用いて、クエリサンプルのクラス分類に対するクロスエントロピー損失を算出する（Ｓ４０）。

　図１０は、本発明の実施の形態２に係る機械学習装置２１０の構成図である。ここでは、ＸｔａｒＮｅｔと共通する構成については適宜説明を省略し、ＸｔａｒＮｅｔに対して追加する構成を中心に説明する。

　機械学習装置２１０は、基本クラス特徴抽出部５０、新規クラス特徴抽出部５２、混合特徴算出部６０、調整部７０、学習部８０、および近傍クラス選択部９４を含む。

　混合特徴算出部６０は、各クエリサンプルの基本特徴ベクトルと新規特徴ベクトルを混合して混合特徴ベクトルをタスク適応表現ＴＡＲとして算出し、調整部７０と近傍クラス選択部９４と学習部８０に与える。混合特徴算出部６０は、一例としてＭｅｒｇｅＮｅｔ３６である。

　調整部７０は、各クエリサンプルのタスク適応表現ＴＡＲを用いてタスク調整後の分類重みベクトルセットＷ^＊を算出し、近傍クラス選択部９４に与える。調整部７０は、一例としてＴｃｏｎＮｅｔ３８である。

　近傍クラス選択部９４は、投影空間Ｍ上でクエリサンプルのタスク適応表現ＴＡＲと全クラスのタスク調整後の分類重みベクトルセットＷ^＊とのユークリッド距離に基づいて、クエリサンプルのタスク適応表現ＴＡＲの位置から所定の距離以内になる所定数のクラスを近傍クラスとして選択し、選択された所定数の近傍クラスの分類器の重みを学習部８０に与える。

　近傍クラス選択部９４は、投影空間Ｍ上でクエリサンプルのタスク適応表現ＴＡＲの位置から所定の距離以内にあるクラスに正解のラベルをもつクラスが含まれない場合、正解クラスが含まれるまで対象範囲を広げて近傍クラスを選択する。

　学習部８０は、投影空間Ｍ上で、クエリサンプルのタスク適応表現ＴＡＲの位置と選択された分類器の重みとの間の距離によってクエリサンプルをクラス分類し、クラス分類の損失を最小化するように学習する。学習部８０は、一例として投影空間クエリ分類部４２と損失最適化部４４である。

　図１１（ａ）～図１１（ｃ）は、実施の形態２のクエリサンプルに対する損失算出手順を説明する図である。

　図１１（ａ）に示すように、クエリサンプル１では、クエリサンプル１のＴＡＲとの距離が近い５個の近傍クラスＢ１９８、Ｂ３、Ｎ３、Ｂ１３、Ｎ４を選択して損失算出の対象クラスとする。

　図１１（ｂ）に示すように、クエリサンプル２では、クエリサンプル２のＴＡＲとの距離が近い５個の近傍クラスＢ１９８、Ｎ３、Ｂ９、Ｂ２００、Ｂ１３を選択して損失算出の対象クラスとする。

　図１１（ｃ）に示すように、クエリサンプル３では、クエリサンプル３のＴＡＲとの距離が近い５個の近傍クラスにクエリサンプル３の正解クラスが含まれていないため、正解クラスが含まれるまで対象範囲を広げる。この例ではＴＡＲから７番目に近いクラスにおいて初めて正解クラスが現れたため、７個の近傍クラスＢ１１、Ｂ２、Ｂ１９７、Ｂ８、Ｂ１９８，Ｂ３、Ｎ３を損失算出の対象クラスとする。

　このように、クエリサンプルのタスク適応表現ＴＡＲとの距離が近い、すなわち関連性の高いクラスを選択し、選択したクラスを対象としてクラス分類の損失を計算する。これによりクエリセットの分類精度が向上するとともに、損失算出の対象クラス数を削減することにより損失が収束しやすくなる。

　図１２は、実施の形態２のクエリサンプルに対する損失算出手順を示すフローチャートである。クエリサンプルのタスク適応表現ＴＡＲと全クラスの分類器の重みＷ^＊を投影空間Ｍ上に投影する（Ｓ５０）。クエリサンプルのタスク適応表現ＴＡＲと全クラスの分類器の重みＷ^＊とのユークリッド距離を計算する（Ｓ６０）。

　クエリサンプルのタスク適応表現ＴＡＲの近傍にある所定数のクラスを選択する（Ｓ７０）。選択されたクラスの中に正解クラスが含まれている場合（Ｓ８０のＹ）、ステップＳ１００に進む。選択されたクラスの中に正解クラスが含まれていない場合（Ｓ８０のＮ）、正解クラスが含まれるまで近傍範囲を拡張して近傍クラスを選択し（Ｓ９０）、ステップＳ１００に進む。

　選択されたクラスの確率分布をユークリッド距離に応じて推定する（Ｓ１００）。選択されたクラスの確率分布を用いて、クエリサンプルのクラス分類に対するクロスエントロピー損失を算出する（Ｓ１１０）。

　以上説明した機械学習装置２００、２１０の各種の処理は、ＣＰＵやメモリ等のハードウェアを用いた装置として実現することができるのは勿論のこと、ＲＯＭ（リード・オンリ・メモリ）やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバと送受信することも、地上波あるいは衛星ディジタル放送のデータ放送として送受信することも可能である。

　以上述べたように、従来のＸｔａｒＮｅｔなどの継続少数ショット学習手法では、メタ学習において、クエリ損失の計算時に、事前学習したすべての基本クラスが投影空間（共同分類空間）上に投影され、すべての基本クラスを対象としてクエリ損失を計算するため、損失が収束しにくく、学習に時間がかかる。それに対して、実施の形態１の機械学習装置２００によれば、メタ学習時の損失計算に関連する分類対象クラスを最適化することにより、損失が収束しやすくなり、学習時間を短縮することができる。

　より具体的には、メタ学習においてクエリセットの基本クラスにはラベルが付与されている。この基本クラスのラベル情報を利用し、クエリ損失の計算時に、各エピソードのクエリセットに選出された基本クラスを投影空間上に順次追加することにより、事前学習したすべての基本クラスが投影空間に投影されるまでの期間は分類対象クラスを削減することができる。これにより、損失が収束しやすくなり、学習時間を短縮することができる。

　また、従来のＸｔａｒＮｅｔなどの継続少数ショット学習手法では、メタ学習において、事前学習したすべての基本クラスおよび新規クラスが投影空間（共同分類空間）上に投影され、すべてクラスを対象としてクエリ損失を計算するため、クエリサンプルのタスク適応表現と関連性の低いクラスも計算に加味されることになり、分類精度の低下を招く恐れがある。また、損失が収束しにくく、学習に時間がかかる。それに対して、実施の形態２の機械学習装置２１０によれば、メタ学習時の損失計算における分類対象クラスをタスク適応表現と関連性の高いクラスに限定することにより、損失が収束しやすくなり、分類精度を上げることができる。

　以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

　本発明は、機械学習技術に利用できる。

　１０　基本クラスのデータセット、　１２　新規クラスのデータセット、　１４　基本クラスのデータセット、　１６　新規クラスのデータセット、　２０　事前トレーニングモジュール、　２２　バックボーンＣＮＮ、　２３　平均部、　２４　基本クラス分類重み、　３０　メタモジュール群、　３２　ＭｅｔａＣＮＮ、　３３　平均部、　３４　新規クラス分類重み、　３６　ＭｅｒｇｅＮｅｔ、　３８　ＴｃｏｎＮｅｔ、　４０　投影空間構築部、　４２　投影空間クエリ分類部、　４４　損失最適化部、　５０　基本クラス特徴抽出部、　５２　新規クラス特徴抽出部、　６０　混合特徴算出部、　７０　調整部、　８０　学習部、　９０　重み選択部、　９２　基本クラスラベル情報保存部、　９４　近傍クラス選択部、　１００　継続少数ショット学習モジュール、　２００　機械学習装置、　２１０　機械学習装置。

Claims

　基本クラスに比べて少数の新規クラスを継続学習する機械学習装置であって、
　基本クラスの特徴ベクトルを抽出する基本クラス特徴抽出部と、
　新規クラスの特徴ベクトルを抽出する新規クラス特徴抽出部と、
　基本クラスの特徴ベクトルと新規クラスの特徴ベクトルを混合し、基本クラスと新規クラスの混合特徴ベクトルを算出する混合特徴算出部と、
　投影空間上でクエリセットのクエリサンプルの混合特徴ベクトルの位置と各クラスの分類重みベクトルの位置との距離にもとづいてクエリセットのクエリサンプルをクラス分類し、クラス分類の損失を最小化するように新規クラスの分類重みベクトルを学習する学習部とを含むことを特徴とする機械学習装置。
　エピソード単位でクエリセットを学習する際に、クエリセットに選出される基本クラスの分類重みベクトルを投影空間上に順次追加する重み選択部をさらに含むことを特徴とする請求項１に記載の機械学習装置。
　前記投影空間上でクエリサンプルの混合特徴ベクトルの位置から所定の距離以内にある所定数のクラスを近傍クラスとして選択する近傍選択部をさらに含み、
　前記近傍選択部は、前記投影空間上でクエリサンプルの混合特徴ベクトルの位置から所定の距離以内にあるクラスに正解のラベルをもつクラスが含まれない場合、正解のラベルをもつクラスが含まれるまで対象範囲を広げて近傍クラスを選択し、
　前記学習部は、前記投影空間上でクエリサンプルの混合特徴ベクトルの位置と選択された所定数の近傍クラスの分類重みベクトルの位置との距離にもとづいてクエリセットのクエリサンプルをクラス分類し、クラス分類の損失を最小化するように新規クラスの分類重みベクトルを学習することを特徴とする請求項１または２に記載の機械学習装置。
　基本クラスに比べて少数の新規クラスを継続学習する機械学習方法であって、
　基本クラスの特徴ベクトルを抽出する基本クラス特徴抽出ステップと、
　新規クラスの特徴ベクトルを抽出する新規クラス特徴抽出ステップと、
　基本クラスの特徴ベクトルと新規クラスの特徴ベクトルを混合し、基本クラスと新規クラスの混合特徴ベクトルを算出する混合特徴算出ステップと、
　投影空間上でクエリセットのクエリサンプルの混合特徴ベクトルの位置と各クラスの分類重みベクトルの位置との距離にもとづいてクエリセットのクエリサンプルをクラス分類し、クラス分類の損失を最小化するように新規クラスの分類重みベクトルを学習する学習ステップとを含むことを特徴とする機械学習方法。
　基本クラスに比べて少数の新規クラスを継続学習する機械学習プログラムであって、
　基本クラスの特徴ベクトルを抽出する基本クラス特徴抽出ステップと、
　新規クラスの特徴ベクトルを抽出する新規クラス特徴抽出ステップと、
　基本クラスの特徴ベクトルと新規クラスの特徴ベクトルを混合し、基本クラスと新規クラスの混合特徴ベクトルを算出する混合特徴算出ステップと、
　投影空間上でクエリセットのクエリサンプルの混合特徴ベクトルの位置と各クラスの分類重みベクトルの位置との距離にもとづいてクエリセットのクエリサンプルをクラス分類し、クラス分類の損失を最小化するように新規クラスの分類重みベクトルを学習する学習ステップとをコンピュータに実行させることを特徴とする機械学習プログラム。