JP2023138908A - コンピュータ実施方法、システム及びコンピュータプログラム(予測のための安定な局所的に解釈可能なモデル) - Google Patents

コンピュータ実施方法、システム及びコンピュータプログラム(予測のための安定な局所的に解釈可能なモデル) Download PDF

Info

Publication number
JP2023138908A
JP2023138908A JP2023031271A JP2023031271A JP2023138908A JP 2023138908 A JP2023138908 A JP 2023138908A JP 2023031271 A JP2023031271 A JP 2023031271A JP 2023031271 A JP2023031271 A JP 2023031271A JP 2023138908 A JP2023138908 A JP 2023138908A
Authority
JP
Japan
Prior art keywords
model
kernel width
computer
final
kernel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023031271A
Other languages
English (en)
Inventor
ミン マ シャオ
Xiao Ming Ma
アル ハン シ
Si Er Han
イン ジャン シュエ
xue ying Zhang
ペイ ユ ウェン
wen pei Yu
シュ ジン
Jing Xu
ジェームズ シュ ジン
Jing James Xu
ガオ レイ
Lei Gao
ペン ジャン エー
A Peng Zhang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2023138908A publication Critical patent/JP2023138908A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】分類器の予測を理解するための従来の手法は、そのような手法の結果の信頼度の計算も提示も提供できない、及び局所的モデルを構築するためのレコードの適切な重みを決定する適切なカーネル幅の選択を提供できない。【解決手段】本明細書に記載される例は、機械学習モデルのためのカーネル幅を決定する段階を含むコンピュータ実施方法を提供する。この方法は、カーネル幅を使用して局所的に解釈可能な線形モデルを構築する段階をさらに含む。この方法は、局所的に解釈可能な線形モデルの特徴の寄与度及び信頼度を計算する段階をさらに含む。この方法は、局所的に解釈可能な線形モデルを更新して最終モデルを生成し、最終モデルの全体的な信頼度を計算する段階をさらに含む。【選択図】図3

Description

本明細書に記載される実施形態は、概して機械学習に関し、より具体的には、予測のための安定な局所的に解釈可能なモデルに関する。
「機械学習」という語句は、データから学習する電子システムの機能を広く説明している。機械学習システム、エンジン、若しくはモジュール、又はそれらの組み合わせは、入力と現在は未知である出力との間の機能的関係を学習するようにトレーニングされ得るトレーニング可能機械学習アルゴリズムを含むことができ、結果として得られる機械学習モデルを、トレーニングに関連付けられたタスクを遂行するため(入力データに基づいて出力を予測するためなど)に使用することができる。機械学習機能は、現在は未知の機能を遂行するようにトレーニングされる能力を有する人工ニューラルネットワーク(ANN)を使用して実施され得る。機械学習及び認知科学では、ANNは、動物の生物学的ニューラルネットワーク、特に脳に触発された統計学習モデルの系統である。ANNを使用して、多数の入力に依存するシステム及び機能を推定又は近似できる。
分類器の予測を理解するための従来の手法は、そのような手法の結果の信頼度の計算も提示も提供できない、及び局所的モデルを構築するためのレコードの適切な重みを決定する適切なカーネル幅の選択を提供できない。
例示的な一実施形態では、予測のための安定な局所的に解釈可能なモデルのためのコンピュータ実施方法が提供される。この方法は、機械学習モデルのためのカーネル幅を決定する段階を含む。この方法は、カーネル幅を使用して局所的に解釈可能な線形モデルを構築する段階をさらに含む。この方法は、局所的に解釈可能な線形モデルの特徴の寄与度及び信頼度を計算する段階をさらに含む。この方法は、局所的に解釈可能な線形モデルを更新して最終モデルを生成し、最終モデルの全体的な信頼度を計算する段階をさらに含む。
本明細書に記載される1つ又は複数の特徴に追加して、又は代替として、この方法のさらなる実施形態は、デフォルトのカーネル幅の値を用いてデフォルトの局所的モデルを構築する段階、徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する偏移局所的モデルを、停止条件に達するまで構築する段階、及び前記デフォルトの局所的モデル及び前記偏移局所的モデルに少なくとも部分的に基づいて最終的なカーネル幅を選択する段階を含み得る。本明細書に記載される1つ又は複数の特徴に追加して、又は代替として、この方法のさらなる実施形態は、前記停止条件は、最大反復回数、収束条件が満たされていること、又は精度が閾値を満たすことのうちの少なくとも1つであることを含み得る。
本明細書に記載される1つ又は複数の特徴に追加して、又は代替として、この方法のさらなる実施形態は、前記最終モデルの前記全体的な信頼度を計算する段階は、前記局所的に解釈可能な線形モデルの前記特徴の前記寄与度及び信頼度に少なくとも部分的に基づいていることを含み得る。
本明細書に記載される1つ又は複数の特徴に追加して、又は代替として、この方法のさらなる実施形態は、前記局所的に解釈可能な線形モデルの追加の特徴の追加の寄与度及び信頼度を計算する段階を含み得る。本明細書に記載される1つ又は複数の特徴に追加して、又は代替として、この方法のさらなる実施形態は、前記最終モデルの前記全体的な信頼度が、前記追加の特徴の前記追加の寄与度及び信頼度を使用して計算されることを含み得る。
別の例示的な実施形態では、機械学習モデルのためのカーネル幅を決定する方法が、デフォルトのカーネル幅の値を用いてデフォルトの局所的モデルを構築する段階を含む。この方法は、徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する偏移局所的モデルを、停止条件に達するまで構築する段階をさらに含む。この方法は、前記デフォルトの局所的モデル及び前記偏移局所的モデルに少なくとも部分的に基づいて最終的なカーネル幅を選択する段階をさらに含む。
本明細書に記載される1つ又は複数の特徴に追加して、又は代替として、このシステムのさらなる実施形態は、前記最終的なカーネル幅は、収束を生じさせるカーネル幅の識別に少なくとも部分的に基づいて、前記徐々に増加するカーネル幅及び徐々に減少するカーネル幅から選択されることを含み得る。
本明細書に記載される1つ又は複数の特徴に追加して、又は代替として、このシステムのさらなる実施形態は、徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する前記偏移局所的モデルの構築中に収束を生じさせるカーネル幅を識別しないことに応答して、前記最終的なカーネル幅は前記デフォルトのカーネル幅として選択されることを含み得る。
本明細書に記載される他の実施形態は、上記の方法の特徴を、コンピュータシステム及びコンピュータプログラム製品で実施する。
本明細書に記載される1つ又は複数の実施形態によれば、カーネル幅の選択は、モデルをより安定させる。本明細書に記載される1つ又は複数の実施形態は、より良い適用のために局所的に解釈可能なモデルに信頼度を提供する。本明細書に記載される1つ又は複数の実施形態は、ユーザが適用において適切な特徴を重視するように、各特徴の寄与度の安定性の評価を提供し、対応する信頼度を提供する。
本開示の上記の特徴及び利点、並びに他の特徴及び利点は、以下の詳細な説明を添付の図面と関連させて解釈すれば容易に明らかになる。
本明細書に記載される排他的権利の明細が特に指し示されており、明細書の結論における請求項で明確に主張されている。本発明の実施形態の上述の及び他の特徴並びに利点は、添付の図面と関連させて解釈される以下の詳細な説明から明らかである。
線形モデルが安定していない、又は信頼できないインスタンスを示す。 線形モデルが安定していない、又は信頼できないインスタンスを示す。
種々のデータ値に対するブラックボックス予測のプロットを示す。
本明細書に記載される1つ又は複数の実施形態による、機械学習モデルを評価するための方法の流れ図を示す。
本明細書に記載される1つ又は複数の実施形態による、図3で評価されている機械学習モデルのためのカーネル幅を決定する方法の流れ図を示す。
本明細書に記載される1つ又は複数の実施形態による、カーネル幅を徐々に増加させて構築される局所的モデルを有する表を示す。
本明細書に記載される1つ又は複数の実施形態による、カーネル幅を徐々に減少させて構築される局所的モデルを有する表を示す。
本明細書に記載される1つ又は複数の実施形態による局所的に解釈可能なモデルの例示的なプロットを示す。
本明細書に記載される1つ又は複数の実施形態によるクラウドコンピューティング環境を示す。
本明細書に記載される1つ又は複数の実施形態による抽象化モデル層を示す。
本明細書に記載される1つ又は複数の実施形態を実施するための処理システムのブロック図を示す。
本明細書に図示される図は例示的である。本発明の範囲から逸脱することなく、そこに記載されている図又は動作には多くの変形があり得る。例えば、異なる順序で動作を遂行することができ、又は、動作を追加、削除若しくは修正することができる。また、「結合(coupled)」という用語及びその変形は、2つの要素の間に連絡経路が存在することを説明しており、それらの間に介入する要素/接続が存在しない要素間の直接接続を示唆するものではない。これらの変形の全ては、明細書の一部とみなされる。
本発明の1つ又は複数の実施形態は、予測のための安定な局所的に解釈可能なモデルを提供する。機械学習では、入力データに基づいて出力を予測するように機械学習モデルをトレーニングできる。分類は、観測値(すなわち、入力データ)が一連のカテゴリのいずれに属するかを予測することに関する機械学習のサブセットである。分類を遂行するためのトレーニングされたアルゴリズムは、「分類器」と呼ばれる。これらの機械学習モデル、特に分類器は、これらのモデルの予測の背後にある推論を理解することは困難であるという点において、ほとんど「ブラックボックス」である。
分類器の予測を理解するための従来の手法の1つは、局所的に解釈可能なモデルにとらわれない説明(LIME)と呼ばれる。概して、LIMEは、分類器に対して局所的に正確である解釈可能な表現に関する解釈可能なモデルの識別を提供する。LIMEについては、Riberio他による「「Why Should I Trust You?」Explaining the Predictions of Any ClassiFier」でさらに説明されており、参照によりその全体が本明細書に組み込まれる。ブラックボックスモデルの複雑な決定関数fはLIMEには認識されておらず、線形モデルではうまく近似できない。LIMEはインスタンスを標本抽出し、モデルの複雑な決定関数fを使用して予測を行い、被説明インスタンスへの近さによってそれらの重み付けを行う。学習された説明は、全体的にではないが、局所的に正確であることが観察される場合がある。
LIMEなどの従来の手法は、いくつかのインスタンスでは安定していないか、又は信頼できないことがあり、そこでは、例えば、特定のインスタンスでの線形モデルが安定していない、若しくはそのモデルの方向が安定していない、又はその両方である。図1A及び図1Bはインスタンス111、112を示しており、ここでは線形モデル101、102はそれぞれ安定しておらず又は信頼できず、それは、インスタンス111、112の位置での線形モデル101、102が安定しておらず、モデル101、102の方向が安定していないからである。
さらに、LIMEなどの従来の手法は、インスタンスの重み(被説明インスタンスまでの距離)に敏感である。例えば、図2は、種々のデータ値「x」に対するブラックボックス予測のプロット200を示している。この図は、インスタンスx=1.6の予測の説明を示している。単一の特徴に依存するブラックボックスモデルの予測が線201で示され、データの分布はラグ202で示されている。異なるカーネル幅、すなわち0.1(線203)、0.75(線204)、及び2(線205)を有する3つの局所的代理モデルが計算されている。結果として得られる線形回帰モデルはカーネル幅に依存し、プロット100から、その特徴がx=1.6に関して負の効果、正の効果、又は中立(無)の効果を有するかどうかを続いて決定することができる。カーネル幅が小さいということは、インスタンスは近くにあって、局所的モデルに影響を与えていることを意味し、カーネル幅が大きいということは、さらに離れたインスタンスもモデルに影響を与えることを意味する。
したがって、分類器の予測を理解するための従来の手法は、そのような手法の結果の信頼度の計算も提示も提供できない、及び局所的モデルを構築するためのレコードの適切な重みを決定する適切なカーネル幅の選択を提供できない。
本明細書に記載される1つ又は複数の実施形態は、予測のための安定な局所的に解釈可能なモデルを提供することにより、従来技術の欠点に対処する。本明細書に記載される1つ又は複数の実施形態によれば、カーネル幅(「kernel_width」)を選択して、標本抽出されたインスタンスの重みを計算し、安定な局所的モデルを構築する方法が提供される。本明細書に記載される1つ又は複数の実施形態によれば、方法は、インスタンスの特徴の周辺の擾乱を識別し、各特徴の寄与度の安定性及びそれに関連する信頼度を計算する。本明細書に記載される1つ又は複数の実施形態によれば、最終的な局所的に解釈可能なモデルが更新され、モデルの全体的な信頼度を計算できる。
カーネル幅を考慮しておらず、LIME手法の説明結果の信頼度を計算及び提示できていない、機械学習モデルを評価する現在の方法に対する技術的改善を、本発明の1つ又は複数の実施形態は提供する。本発明の1つ又は複数の実施形態は、既存の解決策のこれらの欠点の1つ又は複数に対する技術的解決策を提供しており、そのために、カーネル幅を選択してモデルをより安定させ、より良い適用のために局所的に解釈可能なモデルに信頼度を提供し、ユーザが適用において適切な特徴を重視するように、各特徴の寄与度の安定性を評価して対応する信頼度を提供し、及び/又はそれらの組み合わせを含む同様のことをしている。
ここで図3に移ると、方法300の流れ図が、本明細書に記載される1つ又は複数の実施形態による、機械学習モデル(例えば、人工ニューラルネットワーク)の評価を提供している。特に、方法300は、本明細書に記載される1つ又は複数の実施形態による、予測のための安定な局所的に解釈可能なモデルの構築を提供する。方法300を、任意の好適なシステム若しくはデバイス、又はそれらの組み合わせを使用して実施することができ、その例には、図9の処理システム900、図7の1つ又は複数のクラウドコンピューティングノード10、又はそれらの組み合わせ及び/若しくは重複を含む同様のものがある。
ブロック302で、処理システム900は、評価されている機械学習モデルのためのカーネル幅を決定する。カーネル幅を決定するプロセスは、図4、5A、及び5Bを参照して本明細書でより詳細に説明される。
ブロック304で、処理システム900は、ブロック302で決定されたカーネル幅を使用して、局所的に解釈可能な線形モデルを構築する(例えば、図4を参照のこと)。図6は、本明細書に記載される1つ又は複数の実施形態による局所的に解釈可能なモデル600の例示的なプロットを示す。2つの点601及び602が示されており、点601は安定しておらず(「不安定点601」とも呼ばれる)、点602は安定している(「安定点602」とも呼ばれる)。これらの点のそれぞれは、モデル600の特徴に対応する。植物が有毒か食用に適するかの例示的な予測を考えてみよう。臭気、胞子紋色、茎の表面特性若しくは同様のもの、又はそれらの組み合わせなど、これらの特徴の1つ又は複数について、モデル600を評価することができる。線形モデルでの特徴の係数βを、予測の対応する寄与度として使用する。各特徴の説明を評価して、安定性が存在するかどうかを決定する。すなわち、特徴の値の周辺に擾乱が観察されたときに、特徴(例えば、点601、点602など)上の線形方向が安定したままであるかどうかが決定される。不安定点601に関して、点601の周辺では、線601a、601bが示すように、モデルは不安定であることが観察され得る。対照的に、線602a、602bが示すように、点602は安定していることが観察され得る。安定性/不安定性に関するこれらの決定は、モデル600の予測の説明を提供する。
306で、処理システム900は、局所的に解釈可能な線形モデル(例えば、図6のモデル600)の特徴(例えば、特徴F)の寄与度及び信頼度を計算する。例えば、元の被説明インスタンス(例えば、特徴F)の周辺で、「l」インスタンスだけ擾乱が生成される。特徴Fの値Vの周辺での擾乱を使用して値V+αΔを生成することができ、ここで、ΔはFの標準偏差であり、αはα∈(-0.1,0.1)であって、ランダムに生成される。本明細書に記載される1つ又は複数の実施形態によれば、他の特徴の値は一定に保たれる(例えば、それらは変更されない)。いくつかの例では、各インスタンスに複数の局所的線形モデルが生成されるとともに、特徴Fの寄与度β1、β1、…β1が取得され、他方で、元のインスタンスFの寄与度をβ1とする。
次に、特徴Fの最終的な寄与度及び信頼度を計算することができる。最初に、値β1avg及び値β1stdが計算され、次の式を使用して元の局所的モデルを更新する。
ここで、「ι」は、新しく生成されたインスタンスの数である。
値β1avgは、特徴Fの寄与度を表す。係数(例えば、β1、β1、β1、…β1)の標準偏差β1stdも、次の式を使用して計算することができる。
次に、更新されたモデルの精度AccF1を計算できる。例として、元のβ1の代わりにβ1avgを使用して、モデルを更新する。次に、更新されたモデルを使用して、局所的モデルを構築するためのデータで予測値を計算する。精度AccF1は、局所的モデルを構築するための予測値及び元の目標値の間の精度を表す。
次に、特徴Fのモデルの安定性は、決定された平均及び標準偏差値に基づいて、次の式で表される。
この値が減少するにつれて、安定性は小さくなることを理解するべきである。
次に、更新されたモデルの特徴の安定性及び精度を組み合わせて、次の式を使用して特徴Fの信頼度を計算する。
結果として得られる信頼度(ConfF1)は、特徴Fの寄与度に対する最終的な信頼度である。すなわち、値ConfF1は、特徴Fの信頼度を表す。
次に、この手法を使用して寄与度βiavg及び信頼度ConfFiを特徴FからFについて計算して、各特徴FからFの特徴寄与度を得る。
ブロック308で、処理システム900は、局所的に解釈可能な線形モデルを更新して最終モデルを生成し、最終モデルの全体的な信頼度を計算する。例として、元のβ1の代わりにβ1avgを使用して、各特徴の更新されたモデルを取得する。すなわち、インスタンス予測の説明の全体的な信頼度は、各特徴FからFの寄与度βiavg及び信頼度ConfFiを使用して計算できる。特に、インスタンス予測の説明の全体的な信頼度は、次の式を使用して計算できる。
追加のプロセスが含まれる場合もあり、図3に示すプロセスは例示を表すとともに、本開示の範囲から逸脱することなく、他のプロセスを追加してもよく、又は既存のプロセスを除去、修正、若しくは再構成してもよいことを理解するべきである。
ここで図4に移ると、方法400の流れ図が、本明細書に記載される1つ又は複数の実施形態による、評価されている機械学習モデルのためのカーネル幅の決定を提供している。方法400を、任意の好適なシステム若しくはデバイス、又はそれらの組み合わせを使用して実施することができ、その例には、図9の処理システム900、図7の1つ又は複数のクラウドコンピューティングノード10、又はそれらの組み合わせ及び/若しくは重複を含む同様のものがある。
ブロック402で、処理システム900は、デフォルトのカーネル幅の値を用いてデフォルトの局所的モデルを構築する。例えば、デフォルトのカーネル幅を用いて、モデル係数(β1、β2、…)及び精度Accを有する局所的モデル(例えば、線形モデル)Mが構築される。デフォルトのカーネル幅を、0.75などの任意の好適な値にすることができる。
ブロック404で、処理システム900は、徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する偏移局所的モデルを、停止条件に達するまで構築する。すなわち、2セットのモデル、つまり、徐々に増加するカーネル幅を有する第1セットのモデル、及び徐々に減少するカーネル幅を有する第2セットのモデルが構築される。これは、図5A及び5Bの表にそれぞれ示されている。例えば、図5Aは、徐々に増加するカーネル幅を用いて構築されている局所的モデルM(例えば、第1セットのモデル)を有する表500を示す。表500には、モデルの第1セットの各モデル(例えば、MB1、MB2、…MBn)がそれぞれ、£の値の倍数ずつ徐々に増加するカーネル幅(例えば、0.75+£、0.75+2£、…0.75+n£)、モデル係数(例えば、(β1B1、β2B1、…)、(β1B2、β2B2、…)、…(β1Bn、β2Bn、…))、及び精度(例えば、AccB1、AccB2、…AccBn)と共に示されている。図5Bは、徐々に減少するカーネル幅を用いて構築されている局所的モデルMを有する表501を示す。図5Aと同様に、図5Bの表501はモデルの第2セットの各モデル(例えば、MS1、MS2、…MSn)を、それぞれ、£の値の倍数ずつ徐々に減少するカーネル幅(例えば、0.75-£,0.75-2£,…0.75-n£)、モデル係数(例えば、(β1S1、β2S1、…)、(β1S2、β2S2、…)、…(β1Sn、β2Sn、…))、及び精度(例えば、AccS1、AccS2、…AccSn)と共に示されている。£の値は任意の好適な値になり得ることを理解するべきである。
偏移局所的モデル(例えば、モデルの第1セット及びモデルの第2セット)は、停止条件に達するまで構築される。例として、停止条件を、最大反復回数(例えば、5、7、10、30など)にすることができる。別の例として、停止条件を、収束条件が満たされることにすることができる。例えば、次の式が満たされたときに、収束は満たされていると言える。
別の例として、停止条件を、モデルの精度Accが閾値を満たした場合にすることができる。例えば、モデルの精度AccがAcc未満の場合に、停止条件は満たされている。ひとたびブロック404で第1セットのモデル及び第2セットのモデルが構築されると、方法400はブロック406に続き、処理システム900は、デフォルトの局所的モデル及び偏移局所的モデルに少なくとも部分的に基づいて最終的なカーネル幅を選択する。例えば、停止条件が収束条件であり、収束条件が満たされていると決定された場合、最終的なカーネル幅は、最適化が収束に到達したときの(例えば、収束条件を満たすようにさせた)カーネル幅になるように選択される。別の例として、停止条件が最大反復回数の場合、ひとたび最大反復回数を満たすと、最終的なカーネル幅は、最小値を有するカーネル幅になるように選択される。そのような例では、反復中に、次の式は徐々に小さくなっている。
そうでなければ、デフォルトのカーネル幅が最終的なカーネル幅として選択される。これは、例えば、収束しない場合である。
追加のプロセスが含まれる場合もあり、図4に示すプロセスは例示を表すとともに、他のプロセスを追加してもよく、又は本開示の範囲から逸脱することなく、既存のプロセスを除去、変更、若しくは再構成してもよいことを理解するべきである。
この開示はクラウドコンピューティングに関する詳細な説明を含んでいるが、本明細書に記載される教示の実施は、クラウドコンピューティング環境に限定されないことを理解するべきである。むしろ、本発明の実施形態は、現在知られている又は今後に開発される任意の他の種類のコンピューティング環境と共に実施されることが可能である。
クラウドコンピューティングは、最小限の管理労力又はサービスのプロバイダとの対話で、迅速にプロビジョニング及びリリースができる構成可能コンピューティングリソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、格納、アプリケーション、仮想マシン、及びサービス)の共有プールへの便利なオンデマンド型ネットワークアクセスを可能にするサービスデリバリモデルである。このクラウドモデルは、少なくとも5つの特性、少なくとも3つのサービスモデル、及び少なくとも4つの展開モデルを含んでもよい。
以下が特性である。
オンデマンドのセルフサービス:クラウド消費者は、サービスのプロバイダとの人間による対話を必要とせずに、必要に応じて自動的に、サーバ時間及びネットワーク格納などのコンピューティング能力を一方的にプロビジョニングできる。
幅広いネットワークアクセス:ネットワークを介して能力を利用可能であり、異種混交のシンクライアントプラットフォーム又はシッククライアントプラットフォーム(例えば、携帯電話、ラップトップ、及び、PDA)による使用を促進する標準的なメカニズムを通して能力にアクセスする。
リソースのプール化:プロバイダのコンピューティングリソースをプールし、マルチテナントモデルを使用して複数の消費者にサービスを提供しており、異なる物理及び仮想リソースが需要に従って動的に割り当てられ、再割り当てされる。消費者は、概して、提供されるリソースの厳密な位置を制御も、又はそれを知ることもできないが、より高い抽象レベル(例えば、国、州、又はデータセンタ)では位置を指定可能である点で、位置的独立感がある。
迅速な伸縮性:場合によっては自動的に、能力を迅速かつ伸縮自在にプロビジョニングして素早くスケールアウトすることも、迅速にリリースして素早くスケールインすることも可能である。消費者にとって、多くの場合、プロビジョニングに使用できる能力は無制限に表示され、いつでも任意の数量で購入できる。
計測サービス:サービスの種類(例えば、格納、処理、帯域幅、及びアクティブなユーザアカウント)に対して適切な、ある抽象レベルで計量能力を活用することにより、クラウドシステムはリソースの使用を自動的に制御及び最適化する。リソースの使用量を監視、制御、報告できるため、利用したサービスのプロバイダと消費者の両方に透明性を提供できる。
以下がサービスモデルである。
サービスとしてのソフトウェア(SaaS):消費者に提供される能力は、クラウドインフラストラクチャで実行されているプロバイダのアプリケーションの使用である。アプリケーションには、ウェブブラウザ(例えば、ウェブベースのメール)等のシンクライアントインターフェースを介してさまざまなクライアントデバイスからアクセスできる。消費者は、ネットワーク、サーバ、オペレーティングシステム、格納、又は個々のアプリケーション能力をも含む、基盤となるクラウドインフラストラクチャを管理も、又は制御もしないが、限定されたユーザ固有のアプリケーション構成設定が例外になることはあり得る。
サービスとしてのプラットフォーム(PaaS):消費者に提供される能力は、プロバイダがサポートするプログラミング言語及びツールを使用して作成された、消費者作成又は取得のアプリケーションのクラウドインフラストラクチャ上への展開である。消費者は、ネットワーク、サーバ、オペレーティングシステム、又は格納を含む、基盤となるクラウドインフラストラクチャを管理も、又は制御もしないが、展開されたアプリケーションと、場合によってはアプリケーションのホスティング環境構成とを制御できる。
サービスとしてのインフラストラクチャ(IaaS):消費者に提供される能力は、処理、格納、ネットワーク、その他の基本的なコンピューティングリソースのプロビジョニングであり、ここで、消費者は任意のソフトウェア(オペレーティングシステムとアプリケーションを含み得る)を展開及び実行できる。消費者は基盤となるクラウドインフラストラクチャを管理も、又は制御もしないが、オペレーティングシステム、格納、展開されたアプリケーションを制御でき、場合によっては選ばれたネットワーク構成要素(例えば、ホストファイアウォール)を限定的に制御できる。
以下が展開モデルである。
プライベートクラウド:クラウドインフラストラクチャは組織専用に動作する。これは組織又はサードパーティによって管理され、オンプレミス又はオフプレミスに存在する場合がある。
コミュニティクラウド:クラウドインフラストラクチャは複数の組織で共有され、懸念事項(例えば、ミッション、セキュリティ要件、方針、及びコンプライアンスの考慮事項)を共有してきた特定のコミュニティをサポートしている。これは組織又はサードパーティによって管理され、オンプレミス又はオフプレミスに存在する場合がある。
パブリッククラウド:クラウドインフラストラクチャは、一般市民又は大規模業界団体が利用でき、クラウドサービスを販売する組織が所有している。
ハイブリッドクラウド:クラウドインフラストラクチャは、2つ又はそれより多くのクラウド(プライベート、コミュニティ、又はパブリック)の合成体であり、それらは独自のエンティティでありながら、データとアプリケーションの移植性(例えば、クラウド間の負荷均衡化のためのクラウドバースト)を可能にする標準化された又は独自開発の技術によって結びつけられている。
クラウドコンピューティング環境は、ステートレス性、低結合性、モジュール性、及びセマンティック相互運用性を重視したサービス指向型である。クラウドコンピューティングの中核には、相互接続されたノードからなるネットワークを含むインフラストラクチャが存在する。
ここで図7を参照すると、例示的なクラウドコンピューティング環境50が示されている。図示のように、クラウドコンピューティング環境50は、1つ又は複数のクラウドコンピューティングノード10を備えており、これらを相手に、クラウド消費者が使用するローカルコンピューティングデバイス(例えば、携帯情報端末(PDA)又は携帯電話54A、デスクトップコンピュータ54B、ラップトップコンピュータ54C、若しくは自動車コンピュータシステム54N、又はそれらの組み合わせ等)は通信することができる。ノード10は互いに通信してもよい。それらを、1つ又は複数のネットワーク(上記で説明したようなプライベートクラウド、コミュニティクラウド、パブリッククラウド、若しくはハイブリッドクラウド、又はそれらの組み合わせなど)において、物理的又は仮想的にグループ化してもよい(図示せず)。これにより、クラウドコンピューティング環境50は、インフラストラクチャ、プラットフォーム、若しくはソフトウェア、又はそれらの組み合わせをサービスとして提供できるようになり、そのために、クラウド消費者がローカルコンピューティングデバイス上にリソースを維持する必要はない。図7に示すコンピューティングデバイス54A~Nの型式は例示のみを意図しており、コンピューティングノード10及びクラウドコンピューティング環境50は任意の種類のネットワーク、若しくはネットワークアドレス可能な接続、又はそれらの組み合わせを通して(例えば、ウェブブラウザを使用して)任意の種類のコンピュータ化デバイスと通信できることが理解される。
ここで、図8を参照すると、クラウドコンピューティング環境50(図7)によって提供された機能抽象化層のセットが示してある。図8に示された構成要素、層、及び機能は、例示のみを意図するものであり、発明の実施形態がそれに限定されないことを、事前に理解されるべきである。図示のように、以下の層及び対応する機能が提供される。
ハードウェア層及びソフトウェア層60は、ハードウェア及びソフトウェア構成要素を備える。ハードウェア構成要素の例には、メインフレーム61、RISC(縮小命令セットコンピュータ)アーキテクチャベースのサーバ62、サーバ63、ブレードサーバ64、格納デバイス65、並びにネットワーク及びネットワーク構成要素66が含まれている。いくつかの実施形態において、ソフトウェア構成要素には、ネットワーク・アプリケーション・サーバ・ソフトウェア67及びデータベース・ソフトウェア68が含まれる。
仮想化層70が提供する抽象化層から提供され得る仮想エンティティの例には、仮想サーバ71、仮想ストレージ72、仮想プライベートネットワークを含む仮想ネットワーク73、仮想アプリケーション及びオペレーティングシステム74、並びに仮想クライアント75がある。
一例では、管理層80は、以下で説明する機能を提供してもよい。リソースプロビジョニング81では、クラウドコンピューティング環境内でタスクを遂行するのに利用されるコンピューティングリソース及び他のリソースの動的調達を提供する。計量及び価格設定82は、リソースがクラウドコンピューティング環境内で利用される際のコスト追跡と、これらのリソースの消費に対する勘定又は請求を提供する。一例では、これらのリソースは、アプリケーション・ソフトウェア・ライセンスを含んでもよい。セキュリティが、クラウド消費者とタスクの身元証明、及びデータとその他のリソースの保護を提供する。ユーザポータル83は、消費者及びシステム管理者にクラウドコンピューティング環境へのアクセスを提供する。サービスレベル管理84は、必要なサービスレベルに適合するように、クラウドコンピューティングリソースの割り当て及び管理を提供する。サービスレベルアグリーメント(SLA)の計画及び履行85は、SLAに従って将来の必要性が予想されるクラウドコンピューティングリソースの事前編成と獲得を提供する。
作業負荷層90は、クラウドコンピューティング環境を利用し得る機能の例を提供する。この層から提供することができる作業負荷及び機能の例には、マッピング及びナビゲーション91、ソフトウェア開発及びライフサイクル管理92、仮想教室教育デリバリ93、データ解析処理94、トランザクション処理95、及び機械学習モデルの評価96が含まれる。
本明細書に記載される1つ又は複数の実施形態を、現在知られている、又は後に開発される他の任意の種類のコンピューティング環境と組み合わせて実施できることが理解される。例えば、図9は、本明細書に記載される技術を実施するための処理システム900のブロック図を示す。本明細書に記載される1つ又は複数の実施形態によれば、処理システム900は図7のクラウドコンピューティングノード10の例である。例では、処理システム900は、1つ又は複数の中央処理装置(「プロセッサ」又は「処理リソース」又は「処理デバイス」)921a、921b、921cなど(集合的又は包括的にプロセッサ921若しくは処理デバイス、又はその両方で呼ばれる)を有する。本開示の態様では、各プロセッサ921は、縮小命令セットコンピュータ(RISC)マイクロプロセッサを含み得る。プロセッサ921は、システムバス933を介して、システムメモリ(例えば、ランダムアクセスメモリ(RAM)924)及び他のさまざまな構成要素に結合されている。読み出し専用メモリ(ROM)922は、システムバス933に結合され、処理システム900の特定の基本機能を制御する基本入出力システム(BIOS)を含み得る。
システムバス933に結合された入力/出力(I/O)アダプタ927及びネットワークアダプタ926がさらに示されている。I/Oアダプタ927は、ハードディスク923若しくは格納デバイス925、又はそれらの組み合わせ、又は他の任意の同様の構成要素と通信する小型コンピュータシステムインターフェース(SCSI)アダプタであってもよい。I/Oアダプタ927、ハードディスク923、及び格納デバイス925は、本明細書ではまとめて大容量ストレージ934と呼ばれる。処理システム900上で実行するためのオペレーティングシステム940を、大容量ストレージ934に格納してもよい。ネットワークアダプタ926は、システムバス933を外部ネットワーク936と相互接続して、処理システム900が他のそのようなシステムと通信できるようにする。
ディスプレイ935(例えば、ディスプレイモニタ)は、ディスプレイアダプタ932によってシステムバス933に接続されており、このディスプレイアダプタは、グラフィックス多用アプリケーション及びビデオコントローラのパフォーマンスを向上させるためのグラフィックスアダプタを備えてもよい。本開示の一態様では、アダプタ926、927、若しくは932、又はそれらの組み合わせを、中間バスブリッジ(図示せず)を介してシステムバス933に接続された1つ又は複数のI/Oバスに接続してもよい。ハードディスクコントローラー、ネットワークアダプタ、及びグラフィックスアダプタなどの周辺デバイスを接続するための好適なI/Oバスは、通常、ペリフェラル・コンポーネント・インターコネクト(PCI)などの一般的なプロトコルを含む。追加の入出力デバイスが、ユーザインターフェースアダプタ928及びディスプレイアダプタ932を介してシステムバス933に接続されているものとして示されている。キーボード929、マウス930、及びスピーカ931を、ユーザインターフェースアダプタ928を介してシステムバス933に相互接続してもよく、このユーザインターフェースアダプタは、例えば、複数のデバイスアダプタを単一の集積回路に統合するスーパーI/Oチップを備えてもよい。
本開示のいくつかの態様では、処理システム900は、グラフィック処理ユニット937を備える。グラフィックス処理ユニット937は、メモリを操作及び変更して、ディスプレイへの出力を意図するフレームバッファ内の画像の作成を加速するように設計された特殊な電子回路である。一般に、グラフィックス処理ユニット937は、コンピュータグラフィックス及び画像処理の操作において非常に効率的であり、大きなデータブロックの処理が並列で行われるアルゴリズムについて、汎用CPUよりもそれを効果的にする高度な並列構造を有する。
したがって、本明細書で構成されるように、処理システム900は、プロセッサ921の形態をした処理能力、システムメモリ(例えば、RAM924)及び大容量ストレージ934を含む格納能力、キーボード929及びマウス930などの入力手段、及びスピーカ931及びディスプレイ935を含む出力能力を備える。本開示のいくつかの態様では、システムメモリの一部(例えば、RAM924)及び大容量ストレージ934は、IBMコーポレーションのAIX(登録商標)オペレーティングシステムのようなオペレーティングシステム940を集合的に格納して、処理システム900に示されているさまざまな構成要素の機能を調整する。
本発明のさまざまな実施形態は、関連図面を参照して本明細書に記載される。本発明の代替的な実施形態は、本発明の範囲から逸脱することなく工夫され得る。以下の説明及び図面における要素間で、さまざまな接続関係及び位置関係(例えば、上方、下方、隣接など)が記載される。これらの接続関係若しくは位置関係、又はそれらの組み合わせは、別途指定がない限り、直接的又は間接的であり得、本発明はこの点で限定的であることは意図していない。したがって、エンティティ間の連結は、直接的又は間接的な連結を指してよく、エンティティ間の位置関係は、直接的又は間接的な位置関係であり得る。さらに、本明細書に記載されるさまざまなタスク及びプロセス段階は、本明細書で詳細に説明されない追加の段階又は機能を有する、より広範囲の手順又はプロセスに組み込まれ得る。
以下の定義及び略語は、特許請求の範囲及び明細書の解釈に使用される。本明細書において使用されるように、「備える(comprises)」、「備える(comprising)」、「含む(includes)」、「含む(including)」、「有する(has)」、「有する(having)」、「含む(contains)」、若しくは「含む(containing)」という用語、又はそれらの他の任意の変形は、非排他的包含をカバーすることを意図している。例えば、要素のリストを含む組成物、混合物、プロセス、方法、物品、又は装置は、必ずしもこれらの要素のみに限定されず、明示的に列挙されていない、又はそのような組成物、混合物、プロセス、方法、物品、又は装置に固有の他の要素のリストを含んでもよい。
さらに、「例示的」という用語は、本明細書において、「例、インスタンス、又は例示として機能する」ことを意味するために使用される。「例示的」として本明細書に記載される任意の実施形態又は設計は、必ずしも、他の実施形態又は設計よりも好ましい又は有利であると解釈されるものではない。「少なくとも1つ」及び「1つ又は複数」という用語は、1以上の任意の整数、すなわち、1、2、3、4などを含むように理解され得る。「複数」という用語は、2以上の任意の整数、すなわち、2、3、4、5などを含むように理解され得る。「接続」という用語は、間接的な「接続」及び直接的な「接続」の両方を含み得る。
「約(about)」、「実質的に(substantially)」、「およそ(approximately)」という用語及びそれらの変形は、出願時に利用可能な機器に基づいて特定の数量の測定に関連付けられた誤差の程度を含むことを意図している。例えば、「約」とは、所与の値の、±8%又は5%、又は2%の範囲を含み得る。
簡潔さのために、本発明の態様を作成及び使用することに関連する従来の技術は、本明細書で詳細に説明されても、又はされなくてもよい。特に、コンピューティングシステム、及び本明細書に記載されるさまざまな技術的特徴を実施するための具体的なコンピュータプログラムのさまざまな態様は周知である。したがって、簡潔の目的で、多くの従来の実施の詳細は本明細書では簡潔にのみ言及されるか、あるいは、周知のシステム若しくはプロセス、又はその両方の詳細を提供することなく完全に省略される。
本発明は、任意の可能な技術的詳細レベルで統合化されたシステム、方法、若しくはコンピュータプログラム製品、又はそれらの組み合わせであってもよい。コンピュータプログラム製品は、プロセッサに本発明の態様を実施させるためのコンピュータ可読プログラム命令を有するコンピュータ可読格納媒体を含んでもよい。
コンピュータ可読格納媒体は、命令実行デバイスによる使用のために命令を保持及び格納することができる有形デバイスとすることができる。コンピュータ可読格納媒体は、例えば、電子格納デバイス、磁気格納デバイス、光学格納デバイス、電磁格納デバイス、半導体格納デバイス、又は上述のものの任意の好適な組み合わせであってもよいが、これらに限定されない。コンピュータ可読格納媒体のより具体的な例の非包括的なリストは、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROM又はフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピディスク、パンチカード又は命令が記録されている溝内の***構造等の機械的にエンコードされたデバイス、及び、前述のものの任意の好適な組み合わせを含む。コンピュータ可読格納媒体は、本明細書において使用される場合、電波若しくは他の自由に伝搬する電磁波、導波路若しくは他の伝送媒体を通じて伝搬する電磁波(例えば、光ファイバケーブルを通過する光パルス)、又はワイヤを通じて伝送される電気信号等の一過性の信号それ自体とは解釈されるべきではない。
本明細書に記載されるコンピュータ可読プログラム命令は、コンピュータ可読格納媒体からそれぞれのコンピューティング/処理デバイスにダウンロードされてもよく、あるいは、ネットワーク、例えば、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、若しくは無線ネットワーク、又はそれらの組み合わせを介して、外部コンピュータ又は外部格納デバイスにダウンロードされてもよい。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータ、若しくはエッジサーバ、又はそれらの組み合わせを備え得る。各コンピューティング/処理デバイスにおけるネットワークアダプタカード又はネットワークインタフェースが、ネットワークからコンピュータ可読プログラム命令を受け取り、それらのコンピュータ可読プログラム命令を、それぞれのコンピューティング/処理デバイス内のコンピュータ可読格納媒体への格納のために転送する。
本発明の動作を実行するコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路の構成データであってもよく、Smalltalk(登録商標)又はC++などといったオブジェクト指向プログラミング言語、及び「C」プログラミング言語又は同様のプログラミング言語といった手続き型プログラミング言語を含む1つ又は複数のプログラミング言語の任意の組み合わせで記述したソースコード又はオブジェクトコードであってもよい。コンピュータ可読プログラム命令を、スタンドアロンのソフトウェアパッケージとして、全体的にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、部分的にユーザのコンピュータ上かつ部分的に遠隔のコンピュータ上で、又は、全体的に遠隔のコンピュータ若しくはサーバ上で実行することができる。後者のシナリオでは、遠隔のコンピュータは、ローカルエリアネットワーク(LAN)若しくはワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されてもよく、又はその接続は、外部コンピュータに対して(例えば、インターネットサービスプロバイダを使用してインターネットを介して)行われてもよい。いくつかの実施形態において、例えば、プログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)、又はプログラマブルロジックアレイ(PLA)を含む電子回路は、本発明の態様を遂行するべく、コンピュータ可読プログラム命令の状態情報を利用して電子回路をパーソナライズすることにより、コンピュータ可読プログラム命令を実行し得る。
本発明の態様は、本発明の実施形態による方法、装置(システム)、及びコンピュータプログラム製品のフローチャート図若しくはブロック図、又はそれらの組み合わせを参照して本明細書に記載される。フローチャート図若しくはブロック図、又はそれらの組み合わせの各ブロック、及びフローチャート図若しくはブロック図、又はその両方におけるブロックの組み合わせは、コンピュータ可読プログラム命令によって実施することができることは理解されよう。
これらのコンピュータ可読プログラム命令を汎用コンピュータ、専用コンピュータ又は他のプログラム可能なデータ処理装置のプロセッサに提供して、コンピュータ又は他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャート及び/又はブロック図の1つ若しくは複数のブロックにおいて指定されている機能/動作を実施する手段を作成するようなマシンを作り出してもよい。これらのコンピュータ可読プログラム命令を、コンピュータ、プログラム可能なデータ処理装置若しくは他のデバイス、又はそれらの組み合わせを特定の様式で機能するよう方向付けることができるコンピュータ可読格納媒体に格納することで、命令を格納したコンピュータ可読格納媒体が、フローチャート及び/又はブロック図の1つ若しくは複数のブロックにおいて指定された機能/行為の態様を実施する命令を含む製造品を備えるようにしてもよい。
また、コンピュータ可読プログラム命令は、コンピュータ、他のプログラマブルデータ処理装置、又は、他のデバイスにロードして、コンピュータ、他のプログラマブル装置、又は、他のデバイス上で一連の動作段階を遂行させることでコンピュータ実施プロセスを作ることもでき、これにより、コンピュータ、他のプログラマブル装置、又は、他のデバイス上で実行される命令が、フローチャート及び/又はブロック図の1つ若しくは複数のブロックにおいて指定される機能/動作を実施するようになる。
図面内のフローチャート及びブロック図は、本発明のさまざまな実施形態によるシステム、方法、及びコンピュータプログラム製品の可能な実施のアーキテクチャ、機能、及び動作を例示する。この点で、フローチャート又はブロック図の各ブロックは、モジュール、セグメント、又は命令の一部を表すことができ、これらは、指定された論理機能を実施するための1つ又は複数の実行可能命令を含んでいる。いくつかの代替的実施では、ブロックに記載されている機能は、図に記載されている順序とは異なる順序で行われる場合がある。例えば、連続して示されている2つのブロックは、実際には、実質的に同時に実行されてもよいし、ブロックは、関与する機能に依存して逆の順序で実行される場合もあり得る。ブロック図若しくはフローチャート図、又はそれらの組み合わせの各ブロック、及び、ブロック図若しくはフローチャート図又はそれらの組み合わせにおけるブロックの組み合わせが、指定された機能若しくは動作を遂行する、又は特定用途向けハードウェア及びコンピュータ命令の組み合わせを実施する、特定用途向けハードウェアベースのシステムによって実施され得ることにも留意されたい。
本発明のさまざまな実施形態の説明は、例示のために提示されているが、網羅的であることも、開示された実施形態に限定することも意図していない。説明された実施形態の範囲から逸脱することなく、多くの修正及び変形が、当業者には明らかであろう。本明細書で使用される用語は、実施形態の原理、実際の用途、若しくは市場で見られる技術に対する技術的改善を最も良く説明するため、あるいは、他の当業者が本明細書に記載される実施形態を理解することを可能にするために選択された。

Claims (25)

  1. 機械学習モデルを評価するためのコンピュータ実施方法であって、
    前記機械学習モデルのためのカーネル幅を決定する段階;
    前記カーネル幅を使用して局所的に解釈可能な線形モデルを構築する段階;
    前記局所的に解釈可能な線形モデルの特徴の寄与度及び信頼度を計算する段階;及び
    前記局所的に解釈可能な線形モデルを更新して最終モデルを生成し、前記最終モデルの全体的な信頼度を計算する段階
    を備えるコンピュータ実施方法。
  2. 前記機械学習モデルのための前記カーネル幅を決定する段階は、
    デフォルトのカーネル幅の値を用いてデフォルトの局所的モデルを構築する段階;
    徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する偏移局所的モデルを、停止条件に達するまで構築する段階;及び
    前記デフォルトの局所的モデル及び前記偏移局所的モデルに少なくとも部分的に基づいて最終的なカーネル幅を選択する段階
    を有する、請求項1に記載のコンピュータ実施方法。
  3. 前記停止条件は、最大反復回数、収束条件が満たされていること、又は精度が閾値を満たすことのうちの少なくとも1つである、請求項2に記載のコンピュータ実施方法。
  4. 前記最終モデルの前記全体的な信頼度を計算する段階は、前記局所的に解釈可能な線形モデルの前記特徴の前記寄与度及び信頼度に少なくとも部分的に基づいている、請求項1から3のいずれか一項に記載のコンピュータ実施方法。
  5. 前記局所的に解釈可能な線形モデルの追加の特徴の追加の寄与度及び信頼度を計算する段階
    をさらに備える、請求項1から3のいずれか一項に記載のコンピュータ実施方法。
  6. 前記追加の特徴の前記追加の寄与度及び信頼度は、前記最終モデルの前記全体的な信頼度を計算するために使用される、請求項5に記載のコンピュータ実施方法。
  7. コンピュータ可読命令を有するメモリ;
    前記コンピュータ可読命令を実行するための処理デバイス、ここで前記コンピュータ可読命令は、機械学習モデルを評価するための動作を遂行するように前記処理デバイスを制御し、前記動作は、
    前記機械学習モデルのためのカーネル幅を決定する段階;
    前記カーネル幅を使用して局所的に解釈可能な線形モデルを構築する段階;
    前記局所的に解釈可能な線形モデルの特徴の寄与度及び信頼度を計算する段階;及び
    前記局所的に解釈可能な線形モデルを更新して最終モデルを生成し、前記最終モデルの全体的な信頼度を計算する段階
    を含む
    を備えるシステム。
  8. 前記機械学習モデルのための前記カーネル幅を決定する段階は、
    デフォルトのカーネル幅の値を用いてデフォルトの局所的モデルを構築する段階;
    徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する偏移局所的モデルを、停止条件に達するまで構築する段階;及び
    前記デフォルトの局所的モデル及び前記偏移局所的モデルに少なくとも部分的に基づいて最終的なカーネル幅を選択する段階
    を有する、請求項7に記載のシステム。
  9. 前記停止条件は、最大反復回数、収束条件が満たされていること、又は精度が閾値を満たすことのうちの少なくとも1つである、請求項8に記載のシステム。
  10. 前記最終モデルの前記全体的な信頼度を計算する段階は、前記局所的に解釈可能な線形モデルの前記特徴の前記寄与度及び信頼度に少なくとも部分的に基づいている、請求項7から9のいずれか一項に記載のシステム。
  11. 前記動作は、
    前記局所的に解釈可能な線形モデルの追加の特徴の追加の寄与度及び信頼度を計算する段階
    をさらに含む、請求項7から9のいずれか一項に記載のシステム。
  12. 前記最終モデルの前記全体的な信頼度は、前記追加の特徴の前記追加の寄与度及び信頼度を使用して計算される、請求項11に記載のシステム。
  13. 機械学習モデルを評価するためのコンピュータプログラムであって、プロセッサに、
    前記機械学習モデルのためのカーネル幅を決定する手順;
    前記カーネル幅を使用して局所的に解釈可能な線形モデルを構築する手順;
    前記局所的に解釈可能な線形モデルの特徴の寄与度及び信頼度を計算する手順;及び
    前記局所的に解釈可能な線形モデルを更新して最終モデルを生成し、前記最終モデルの全体的な信頼度を計算する手順
    を実行させるためのコンピュータプログラム。
  14. 前記機械学習モデルのための前記カーネル幅を決定する手順は、
    デフォルトのカーネル幅の値を用いてデフォルトの局所的モデルを構築する手順;
    徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する偏移局所的モデルを、停止条件に達するまで構築する手順;及び
    前記デフォルトの局所的モデル及び前記偏移局所的モデルに少なくとも部分的に基づいて最終的なカーネル幅を選択する手順
    を有する、請求項13に記載のコンピュータプログラム。
  15. 前記停止条件は、最大反復回数、収束条件が満たされていること、又は精度が閾値を満たすことのうちの少なくとも1つである、請求項14に記載のコンピュータプログラム。
  16. 前記最終モデルの前記全体的な信頼度を計算する手順は、前記局所的に解釈可能な線形モデルの前記特徴の前記寄与度及び信頼度に少なくとも部分的に基づいている、請求項13から15のいずれか一項に記載のコンピュータプログラム。
  17. 前記プロセッサに、
    前記局所的に解釈可能な線形モデルの追加の特徴の追加の寄与度及び信頼度を計算する手順
    をさらに実行させる、請求項13から15のいずれか一項に記載のコンピュータプログラム。
  18. 前記最終モデルの前記全体的な信頼度は、前記追加の特徴の前記追加の寄与度及び信頼度を使用して計算される、請求項17に記載のコンピュータプログラム。
  19. 機械学習モデルのためのカーネル幅を決定するコンピュータ実施方法であって、
    デフォルトのカーネル幅の値を用いてデフォルトの局所的モデルを構築する段階;
    徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する偏移局所的モデルを、停止条件に達するまで構築する段階;及び
    前記デフォルトの局所的モデル及び前記偏移局所的モデルに少なくとも部分的に基づいて最終的なカーネル幅を選択する段階
    を備えるコンピュータ実施方法。
  20. 前記最終的なカーネル幅は、収束を生じさせるカーネル幅の識別に少なくとも部分的に基づいて、前記徐々に増加するカーネル幅及び徐々に減少するカーネル幅から選択される、請求項19に記載のコンピュータ実施方法。
  21. 徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する前記偏移局所的モデルの前記構築中に収束を生じさせるカーネル幅を識別しないことに応答して、前記最終的なカーネル幅は前記デフォルトのカーネル幅の値として選択される、請求項20に記載のコンピュータ実施方法。
  22. プロセッサに、
    デフォルトのカーネル幅の値を用いてデフォルトの局所的モデルを構築する手順;
    徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する偏移局所的モデルを、停止条件に達するまで構築する手順;及び
    前記デフォルトの局所的モデル及び前記偏移局所的モデルに少なくとも部分的に基づいて最終的なカーネル幅を選択する手順
    を実行させるためのコンピュータプログラム。
  23. 前記最終的なカーネル幅は、収束を生じさせるカーネル幅の識別に少なくとも部分的に基づいて、前記徐々に増加するカーネル幅及び徐々に減少するカーネル幅から選択される、請求項22に記載のコンピュータプログラム。
  24. 徐々に増加するカーネル幅及び徐々に減少するカーネル幅を有する前記偏移局所的モデルの前記構築中に収束を生じさせるカーネル幅を識別しないことに応答して、前記最終的なカーネル幅は前記デフォルトのカーネル幅の値として選択される、請求項23に記載のコンピュータプログラム。
  25. 前記停止条件は、最大反復回数、収束条件が満たされていること、又は精度が閾値を満たすことのうちの少なくとも1つである、請求項22から24のいずれか一項に記載のコンピュータプログラム。
JP2023031271A 2022-03-21 2023-03-01 コンピュータ実施方法、システム及びコンピュータプログラム(予測のための安定な局所的に解釈可能なモデル) Pending JP2023138908A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/699,613 US20230306312A1 (en) 2022-03-21 2022-03-21 Stable local interpretable model for prediction
US17/699,613 2022-03-21

Publications (1)

Publication Number Publication Date
JP2023138908A true JP2023138908A (ja) 2023-10-03

Family

ID=88046907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023031271A Pending JP2023138908A (ja) 2022-03-21 2023-03-01 コンピュータ実施方法、システム及びコンピュータプログラム(予測のための安定な局所的に解釈可能なモデル)

Country Status (3)

Country Link
US (1) US20230306312A1 (ja)
JP (1) JP2023138908A (ja)
CN (1) CN116796861A (ja)

Also Published As

Publication number Publication date
CN116796861A (zh) 2023-09-22
US20230306312A1 (en) 2023-09-28

Similar Documents

Publication Publication Date Title
US11836576B2 (en) Distributed machine learning at edge nodes
JP7052016B2 (ja) 訓練データを更新するための方法、システム、およびコンピュータ・プログラム
AU2018203274A1 (en) Training an RGB-D classifier with only depth data and privileged information
US10585718B2 (en) Hybrid acceleration in a processing environment
US20200175381A1 (en) Candidate visualization techniques for use with genetic algorithms
US11302096B2 (en) Determining model-related bias associated with training data
JP2022080302A (ja) コンピュータ実装方法、コンピュータプログラム製品、およびコンピュータシステム(ニューラルネットワークを用いたデータパーティショニング)
US20200387760A1 (en) Decision boundary enhancement for learning models
US10657230B2 (en) Analysis of output files
US11030015B2 (en) Hardware and software resource optimization
WO2023103688A1 (en) Federated machine learning based on partially secured spatio-temporal data
WO2023077989A1 (en) Incremental machine learning for a parametric machine learning model
US20230289650A1 (en) Continuous machine learning system for containerized environment with limited resources
WO2022227792A9 (en) Federated training of machine learning models
WO2022111112A1 (en) Automatically adjusting data access policies in data analytics
CN117716373A (zh) 基于期望的度量值提供机器学习模型
JP2023138908A (ja) コンピュータ実施方法、システム及びコンピュータプログラム(予測のための安定な局所的に解釈可能なモデル)
US20180074947A1 (en) Using run time and historical customer profiling and analytics to iteratively design, develop, test, tune, and maintain a customer-like test workload
US11182727B2 (en) Automatically detecting inconsistencies between a business process model and a corresponding tutorial video
JP2023521695A (ja) 空間的閉じ込め制約を伴う協調型ニューラル・ネットワーク
US20220076079A1 (en) Distributed machine learning scoring
US20180074946A1 (en) Using customer profiling and analytics to create a relative, targeted, and impactful customer profiling environment/workload questionnaire
US20230306288A1 (en) Reducing computational requirements for machine learning model explainability
US11386265B2 (en) Facilitating information technology solution templates
US20230040767A1 (en) Automatic capture of user interface screenshots for software product documentation