JP7479387B2 - デプロイされた機械学習モデルの信頼尺度 - Google Patents

デプロイされた機械学習モデルの信頼尺度 Download PDF

Info

Publication number
JP7479387B2
JP7479387B2 JP2021544257A JP2021544257A JP7479387B2 JP 7479387 B2 JP7479387 B2 JP 7479387B2 JP 2021544257 A JP2021544257 A JP 2021544257A JP 2021544257 A JP2021544257 A JP 2021544257A JP 7479387 B2 JP7479387 B2 JP 7479387B2
Authority
JP
Japan
Prior art keywords
input data
machine learning
model
measure
modified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021544257A
Other languages
English (en)
Other versions
JPWO2020156864A5 (ja
JP2022520731A (ja
Inventor
マティアス レンガ
ラファエル ウィームカー
トビアス クリンダー
マーティン バーグトホルト
ヘイケ カロルス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2022520731A publication Critical patent/JP2022520731A/ja
Publication of JPWO2020156864A5 publication Critical patent/JPWO2020156864A5/ja
Application granted granted Critical
Publication of JP7479387B2 publication Critical patent/JP7479387B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/18Image warping, e.g. rearranging pixels individually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Image Analysis (AREA)

Description

本発明は、概して機械学習に関し、特にデプロイされた機械学習モデルの信頼尺度を取得することに関する。
最近の技術的進歩により、(例えば医学的特徴を特定するため、及び/又は臨床決定を行うために)データ分析を支援する機械学習(ML)モデルが使用されている。典型的なデータ分析アプリケーションには、認識、描画(例えばセマンティックセグメンテーション、ボクセルラベリング)及び分類(例えばカテゴリー化)が含まれる。
MLモデルは、典型的には、サイズ及び/又は多様性が限られたトレーニングデータセットを使用してトレーニングされる。例えば、医療分野では、大規模なデータベースがないため、トレーニングデータの多様性は限られている。したがって、いわゆる「拡張」方法が一般的に採用されて、トレーニングデータセットのサイズ及び/又は多様性を高めて、MLモデルのパフォーマンス、信頼性、及び/又は堅牢性が向上されている。
トレーニング及びデプロイメント後、最終決定された(固定された)MLモデルがクライアントによって使用されて、入力データ(例えば新しい医療ケース)が評価される。
クライアントにとって(つまりクライアント側では)、MLコンポーネント/システムは、典型的には、入力データを受信し、入力データに基づいて結果又は決定を生成/出力する閉じた/固定された「ブラックボックス」である。したがって、典型的な使用例では、MLコンポーネント/システムは「封印」(又は固定)されており、MLモデルをクライアント側で再トレーニングすることはできない。MLコンポーネント/システムのこのような封印(又は固定)は、計算リソースの制限、ライセンスの問題、オンサイトラベル修正の実現不可能性、又はFDAの制限など、多くの異なる理由によるものである。
本発明は、独立請求項に規定されるシステム及び方法を提供する。従属請求項は、有利な実施形態を提供する。
機械学習(ML)モデルの信頼尺度を取得するための方法が提供されている。この方法は、MLモデルを用いて入力データを処理して一次結果を生成するステップと、入力データの複数の修正インスタンスを生成するステップと、MLモデルを用いて入力データの複数の修正インスタンスを処理して対応する複数の二次結果を生成するステップと、二次結果に基づいて、一次結果に関連する信頼尺度を決定するステップとを含む。
デプロイされたMLモデルに関連する信頼の尺度(つまり、信頼尺度)を決定するための概念が提案されている。特に、信頼尺度は、入力データを修正(又は拡張)し、修正(又は拡張)された入力データについてMLモデルによって提供される結果を分析することによって決定され得ることが提案されている。このような提案は、許容可能なMLモデルは「うまく挙動する」べきである、例えば、入力データへの小さな摂動が、モデル出力に小さな、対応する影響を与えるべきであるという概念に依存している。
例えば、入力データには、自動的にいくつかの修正(又は拡張)が加えられ、その後、MLモデルによって処理される。修正(又は拡張)されたデータに関連する結果に基づいて、結果の変動が分析されて、結果の堅牢性又は多様性が評価される。これにより、MLモデルの信頼尺度が決定される。例えば、特定の入力データに固有の信頼尺度が決定され、これは、MLモデルが特定の入力データの修正(又は拡張)されたバージョンを処理することによって提供される結果の分散に基づいる。
提案される実施形態は、例えば(例えば特定の入力データを処理することで提供される)クライアント側のMLモデルの結果が信頼できるかどうかを特定するのに有用である。
さらに、実施形態により、MLモデルの出力又は結果に関連する不確実性に関する追加情報の提供が容易になる。
したがって、提案される実施形態は、デプロイされた(例えばクライアント側の)MLモデルの出力の認識される精度又は信頼性を示すことが望ましい用途において特に有利である。 一例として、これは、医師がMLモデルの結果を理解して評価する(そして、それに応じてMLモデルの決定を受け入れるか又は適応させる)必要がある医療分野では、特に重要になる。
(例えばモデル提供者によるグローバル/一般的な信頼レベルの指示と共に提供される)従来のMLモデルとは異なり、提案される実施形態は、入力データ(例えば単一の医療ケース)に固有の信頼尺度を提供できる。
したがって、一般的又はグローバルな信頼レベルを単に強調する従来のアプローチを超えた概念を提供できる。例えば、提案される実施形態では、MLモデルへの特定の入力データについてのMLモデル結果/出力に信頼尺度を関連付けることができる。これにより、補足情報(画像オーバーレイや関連するテキスト説明など)を結果と共に提供でき、これにより、専門家(例えば臨床専門家、技術者、データアナリスト、エンジニア、医師、放射線技師など)が、信頼尺度の高い結果/出力に注目することによって、モデルの結果を素早く評価できる。
実施形態で使用されるMLモデルは、従来の機械学習及び/又は画像処理技術を使用して構築することができ、これにより、履歴データ及び/又は確立された知識を活用して、提案される実施形態によって提供される決定/結果の精度を向上できる。
一実施形態では、特定の入力データ(例えば画像の特徴又は領域)に関連する結果についての信頼の推定値(例えば不確実性の尺度)を提供できる。このようにして、実施形態は、MLモデルの不確実性が高い入力データ及び/又は出力結果を特定するのに役立ち得る。
したがって、提案される実施形態では、MLモデル出力に重要な入力データ(例えば医用画像領域)を特定し、また、その入力データに、ユーザ(例えば医師など)に有用な視覚的特徴(例えば関連するテキスト説明を有する画像オーバーレイ)を関連付けることができる。これにより、ユーザは、モデルの結果を迅速かつ簡単に検証し、モデルが正しい又は信頼できる決定を行わないケースを特定できる。さらに、実施形態により、各入力データ(例えば各医療ケース)に関連する不確実性(すなわち、信頼尺度)を特定できる。これにより、ユーザ(医師など)は、例えば、最も不確実な(すなわち、信頼尺度が最も低い)出力からモデル出力をレビューできる。
したがって、提案される実施形態によって、データ分析及びケース診断の向上(例えばより正確及び/又は容易)が促進される。実施形態はまた、臨床意思決定支援(CDS)システムの効率性及び/又は有効性を向上させるためにも使用できる。これにより、提案される実施形態によって、CDSの概念が向上される。
したがって、提案される実施形態は、医用データ分析及び医用画像分析に特に適切である。例えば、MLモデルの入力/出力データ(例えば医療ケース又は医用画像特徴)を特定し、入力データについてのMLモデル出力に関連する不確実性(すなわち、信頼尺度)を特定するのに役立つ。したがって、提案される概念はまた、医学分析を使用して被験者の健康状態を正確に評価又は診断することを促進する。したがって、入力データには、例えば、医用データ、医用画像、又は医用の特徴が含まれる。また、MLモデルを用いて入力データを処理することで生成される結果には、推論、医学的決定、診断、判断、又は推奨事項が含まれ得る。
いくつかの提案される実施形態では、信頼尺度を決定するステップは、二次結果の分布又は分散の尺度を決定するステップと、分布又は分散の決定された尺度に基づいて信頼尺度を決定するステップとを含み得る。例えば、二次結果の分布又は分散の尺度を決定するステップは、二次結果の逆分散、二次結果のシャノンエントロピー、二次結果のジニ係数、二次結果のカルバック-ライブラー発散、及び二次結果の集中尺度のうち少なくとも1つを決定するステップを含み得る。したがって、機械学習モデルの信頼尺度を決定するために、単純な数学的方法又は公式を使用できる。したがって、MLモデルを使用した正確なデータ分析及び/又は情報に基づくデータ分析を容易にする、単純かつ複雑さが低減された実装が実現できる。
様々なアプローチ、方法、又は機能を使用して、二次結果に基づいて信頼尺度が提供されることが理解されるべきである。例えば、いくつかの実施形態では、二次結果の逆分散が使用され、他の実施形態では、シャノンエントロピー、ジニ係数、カルバック-ライブラー(Kullback-Liebler:KL)発散などのカテゴリデータのヒストグラムを測定するための方法が使用される。あるいは又はさらに、経験分布の集中尺度を使用してもよい。
いくつかの実施形態では、入力データの複数の修正ンスタンスを生成するステップは、入力データに第1の空間ワーピング変換を適用して、入力データの第1の修正インスタンスを生成するステップを含み得る。したがって、単純な修正/拡張方法を使用して、入力データの修正インスタンスを生成できる。これはまた、加えられた修正を制御することを可能にする。したがって、入力データの修正インスタンスを生成するための単純かつ複雑さが低減された実装が実現できる。
また、実施形態はさらに、入力データの第1の修正インスタンスに対して生成された二次結果に、第1の逆空間ワーピング変換を適用するステップを含み得る。このようにして、結果は、未修正入力データについての結果との比較のために変換して戻されるため、容易及び/又は正確な評価が可能になる。
いくつかの実施形態では、入力データの複数の修正ンスタンスを生成するステップは、入力データにノイズを追加して、入力データの第2の修正インスタンスを生成するステップを含み得る。ノイズを追加すると、ランダム修正の単純な追加を可能にし、これにより、小さなランダムな摂動が行われることが確実にされる。したがって、入力データの小さな又は小規模な修正を容易にする簡単かつ複雑さが低減された実装が、提案される実施形態によって実現できる。
また、入力データの複数の修正ンスタンスを生成するステップは、入力データに局所変形変換(例えばワーピング関数)を適用して、入力データの第3の修正インスタンスを生成するステップを含み得る。さらに、このような実施形態はまた、入力データの第3の修正インスタンスに対して生成された二次結果に、第1の逆局所変形変換を適用するステップを含み得る。
一例として、機械学習モデルは、人工ニューラルネットワーク、敵対的生成ネットワーク(GAN)、ベイジアンネットワーク、又はこの組み合わせを含む。
実施形態はさらに、決定された信頼尺度を一次結果に関連付けるステップも含み得る。
実施形態はさらに、決定された信頼度測定に基づいて出力信号を生成するステップを含み得る。このような出力信号を、被験者、医師、医用イメージング装置オペレータ、及び放射線技師のうちの少なくとも1つに提供するように実施形態を適応してもよい。したがって、計算された結果/決定及びその関連する信頼尺度を示すために、出力信号をユーザ又は医療機器に提供してもよい。
いくつかの実施形態はさらに、決定された信頼尺度に基づいてグラフィック要素を制御するための制御信号を生成するステップを含み得る。その後、グラフィック要素は、制御信号に従って表示され得る。このようにして、ユーザ(放射線技師など)は、機械学習モデルによって提供される結果に関する情報を受信及び表示できる適切に構成された表示システムを有することができる。したがって、実施形態により、ユーザは、デプロイされた(例えばクライアント側の)機械学習モデルからの結果(例えば出力、決定、推論など)をリモートで分析できる。
本発明のさらに別の態様によれば、機械学習モデルの信頼尺度を取得するためのコンピュータプログラム製品が提供される。コンピュータプログラム製品は、コンピュータ可読プログラムコードが具現化されているコンピュータ可読ストレージ媒体を含み、コンピュータ可読プログラムコードは、少なくとも1つのプロセッサで実行されると、一実施形態のステップの全てを行う。
一実施形態によるコンピュータプログラム製品と、そのコンピュータプログラム製品のコンピュータ可読プログラムコードの実行により、一実施形態による方法を行う1つ以上のプロセッサとを含むコンピュータシステムが提供され得る。
さらなる態様では、本発明は、処理デバイスによって実行されると、一実施形態による被験者の医用イメージングにおける特徴特定のための方法のステップを実行する命令を含むコンピュータ可読非一時的ストレージ媒体に関連する。
本発明の別の態様によれば、機械学習モデルの信頼尺度を取得するためのシステムが提供されている。このシステムは、入力データを取得する入力インターフェースと、入力データの複数の修正インスタンスを生成するデータ修正構成要素と、入力データ及び入力データの複数の修正インスタンスを機械学習モデルに通信し、さらに、機械学習モデルが入力データを処理することによって生成される一次結果を受信し、機械学習モデルが入力データの対応する複数の修正インスタンスを処理することによって生成される複数の二次的結果を受信する機械学習モデルインターフェースと、二次結果に基づいて一次結果に関連する信頼尺度を決定する分析構成要素とを含む。
提案されるシステムのすべて又は一部が、1つ以上のデータプロセッサを含み得ることが理解されるであろう。例えば、システムは、デプロイされた機械学習モデルの信頼尺度を決定するために、データ処理を行う単一のプロセッサを使用して実装できる。
機械学習モデルの信頼尺度を取得するためのシステムは、機械学習モデルから離れた場所にあってもよく、通信リンクを介して機械学習モデルとシステムユニットとの間でデータが通信され得る。
システムは、入力インターフェース、データ修正構成要素、及び機械学習モデルインターフェースを含むサーバデバイスと、分析構成要素を含むクライアントデバイスとを含んでいてもよい。したがって、信頼尺度を決定するために専用のデータ処理手段を使用できるため、システムの他の構成要素又はデバイスの処理要件又は能力を低減できる。
システムは、入力インターフェース、データ修正構成要素、クライアント側機械学習モデル、及び分析構成要素を含むクライアントデバイスを含む。つまり、ユーザ(医療従事者など)は、受信した入力データ(例えば医療データなど)を処理して一次結果及び関連する信頼尺度を生成する、適切に構成されたクライアントデバイス(ラップトップ、タブレットコンピュータ、携帯電話機、PDAなど)を持つことができる。
したがって、入力データが生成及び/又は処理される場所とは異なる場所で処理を行うことができる。例えば、コンピューティング効率の理由から、特定の場所で処理の一部のみを実行することで、関連するコスト、処理能力、伝送要件などを低減することが有利な場合がある。
したがって、処理能力は、所定の制約及び/又は処理リソースの可用性に応じて、システム全体に様々に分散され得ることを理解されたい。
実施形態により、処理負荷の一部をシステム全体に分散することもできる。例えば、データ収集システム(例えば医用イメージング/センシングシステムなど)で前処理が実行される。あるいは又はさらに、通信ゲートウェイで処理が実行されてもよい。いくつかの実施形態では、リモートゲートウェイ又はサーバで処理が行われるため、エンドユーザ又は出力デバイスから処理要件が放棄される。このような処理及び/又はハードウェアの分散によって、(例えば複雑な又は高価なハードウェアを好ましい場所に集中させることによって)メンテナンス能力を向上できる。また、利用可能な処理能力に応じて、計算負荷及び/又はトラフィックをネットワークシステム内で設計又は位置させることもできる。好ましいアプローチは、初期/ソースデータをローカルで処理し、抽出したデータをリモートサーバでの完全な処理のために送信することである。
実施形態は、既存の、予めインストールされた、又は別の方法で別個に提供された機械学習モデルと組み合わせて実装できる。他の実施形態は、機械学習モデルを含む新しい装置が提供(例えば統合)されていてもよい。
本発明のこれらの及び他の態様は、以下に説明される実施形態から明らかになり、また、当該実施形態を参照して説明される。
本発明の態様による例について、添付の図面を参照して詳細に説明する。
図1は、一実施形態による機械学習モデルの信頼尺度を取得するためのシステムの簡略ブロック図である。 図2は、一実施形態による機械学習モデルの信頼尺度を取得するための方法のフロー図である。 図3は、別の実施形態による機械学習モデルの信頼尺度を取得するためのシステムの簡略ブロック図である。
機械学習モデルの信頼尺度を取得するための概念が提案されている。さらに、信頼尺度は、機械学習モデルに提供される特定の入力データに関連付けられる。したがって、実施形態は、モデル出力の評価に有用である情報を提供できる。
特に、信頼尺度は、入力データを修正(又は拡張)し、修正(又は拡張)された入力データについてMLモデルによって提供される結果を分析することよって決定される。例えば、入力データには、自動的にいくつかの異なる修正(又は拡張)が加えられ、その後、MLモデルによって処理される。その後、修正(又は拡張)されたデータについてのMLモデル出力(すなわち結果)を分析して、結果の堅牢性又は多様性が評価される。これにより、MLモデルの信頼尺度が決定される。
例えば、MLモデルの入力データに関連付けられた信頼尺度が決定され、これは、修正(又は拡張)された入力データについてのMLモデル出力(すなわち結果)の分散に基づき得る。
このような信頼尺度とMLモデルの入力データとの関連付けにより、入力データについてのMLモデル出力に指示(例えば関連する信頼尺度のテキストによる説明を有するグラフィックオーバーレイ)が関連付けられることが可能になる。これにより、(例えばモデルの信頼が低い出力を特定することによって)MLモデルの結果を簡単かつ迅速に評価できる。
実施形態は、MLモデル出力に関する不確実性の推定を提供する。したがって、提案される実施形態は、例えば、(例えば特定の入力データを処理することで提供される)クライアント側のMLモデルの出力が信頼できるかどうかを特定するのに有用である。
実施形態は、例えば、被験者の医用データ分析の向上に有用である。したがって、例示的な実施形態は、病院、病棟、研究施設など、様々な種類の医学的評価装置及び/医学的評価施設において活用できる。
一例として、MLモデルの出力信頼評価は、MLモデルによってなされた決定を理解及び/又は評価するのに有用である。提案される実施形態を使用して、ユーザは、例えば、信頼性の低い又は高いモデル出力/結果を特定できる。
さらに、実施形態をデータ分析システム又はML決定システムに統合して、結果に関する情報をユーザ(例えば技術者、データアナリストなど)にリアルタイムで提供することもできる。このような情報を使用して、技術者はモデルの出力及び/又は決定を確認し、必要に応じて出力及び/又は決定を適応又は修正できる。
提案される実施形態は、MLモデルからの不確実な決定又は出力を特定し得る。次に、このような決定/出力に焦点を当てるか、及び/又は改善する(例えばさらなる情報源からの学習を通じて)。
例示的な実施形態の要素及び機能の説明のコンテキストを示すために、例示的な実施形態の態様の実装方法の例として、図を以下に示す。したがって、図は単なる例であり、本発明の態様又は実施形態が実施され得る環境、システム、又は方法に関する限定を表明又は暗示することを意図したものではないことを理解すべきである。
本発明の実施形態は、MLモデルの結果が潜在的に分類されることを可能にすることを対象としている。これは、例えば、不確実な決定又は結果を特定することによって、デプロイされた(例えばクライアント側の)MLモデルを評価するのに有用である。これは、誤った又は不正確な決定による影響を軽減するのに役立ち、したがって、データ分析が向上される。したがって、実施形態は、例えば、医用画像分析モデルが特定の被験者及び/又は医用スキャンプロセスに適しているかどうかを評価するために、リアルタイムのデータ評価目的に有用である。
図1は、一実施形態によるMLモデル105の信頼尺度を取得するためのシステム100の一実施形態を示している。ここでは、MLモデル105はクライアントにデプロイされているため、すでにトレーニングされて、最終決定されている。したがって、クライアント側でのMLモデル105の再トレーニングは実行できない又は不可能である。
システム100は、入力データ10を取得するインターフェース構成要素110を含む。ここでは、インターフェース構成要素110は、医用イメージング装置115(MRIデバイスなど)から医用画像10の形式の入力データ10を受信する。
医用画像10は、有線又は無線接続を介してインターフェース構成要素110に通信される。一例として、無線接続は、短中距離通信リンクを含む。誤解を避けるために、短中距離通信リンクは、最大約100メートルの距離を有する短距離又は中距離通信リンクを意味するものとして解釈され得る。非常に短い通信距離用に設計された短距離通信リンクでは、信号は典型的には数センチから数メートルまで伝わるが、短中通信距離用に設計された中距離通信リンクでは、信号は典型的には最大100メートルまで伝わる。短距離無線通信リンクの例としては、ANT+、Bluetooth(登録商標)、Bluetooth Low Energy、IEEE 802.15.4、ISA100a、赤外線(IrDA)、近距離無線通信(NFC)、RFID、6LoWPAN、UWB、ワイヤレスHART、ワイヤレスHD、ワイヤレスUSB、ZigBee(登録商標)が挙げられる。中距離通信リンクの例としては、Wi-Fi(登録商標)、ISMバンド、Z-Waveが挙げられる。ここでは、出力信号は、有線又は無線接続を介して安全に通信するために暗号化されていない。しかしながら、他の実施形態では、信号/データの通信のために1つ以上の暗号化技術及び/又は1つ以上の安全な通信リンクがシステムにおいて採用され得ることは理解されるであろう。
システム100はまた、入力データの複数の修正インスタンスを生成するデータ修正構成要素120を含む。特に、この実施形態のデータ修正構成要素120は、医用画像10に複数の異なる空間ワーピング変換を適用して、医用画像10の対応する複数の修正インスタンスを生成する。このようにして、データ修正構成要素120は、医用画像10に小さな/小規模な修正を行い、医用画像の複数の修正(又は拡張)バージョンを生成する。
システム100はさらに、医用画像10と医用画像の複数の修正インスタンスをMLモデル105に通信するMLモデルインターフェース122を含む。この目的のために、システム100の機械学習モデルインターフェース122は、インターネット又は「クラウド」50を介して機械学習モデル105と通信する。
医用画像10及び医用画像の複数の修正インスタンスの受信に応答して、MLモデルは、受信したデータを処理してそれぞれの結果を生成する。より具体的には、医用画像10がMLモデル105によって処理されて一次結果が生成され、入力データの修正インスタンスがMLモデル105によって処理されて対応する複数の二次結果が生成される。
MLモデル105によって生成されたこれらの結果は、次に、システム100に戻される。したがって、機械学習モデルインターフェース122はさらに、(MLモデル105が医用画像10を処理することによって生成された)一次結果を受信し、また、(MLモデル105が医用画像10の対応する複数の修正インスタンスを処理することによって生成された)対応する複数の二次結果を受信する。
この実施形態では、データ修正構成要素120が医用画像10に複数の異なる空間ワーピング変換を適用して(医用画像10の対応する複数の修正インスタンスを生成して)いるため、データ修正構成要素120はさらに、受信した複数の二次結果に対応する逆空間ワーピング変換を適用する。このようにして、二次結果は、一次結果に対する参照のために戻される、すなわち、正規化される。
ここでは、変換及び/又は逆変換を適用するために、データ修正構成要素120は、インターネット又は「クラウド」50において利用可能な1つ以上のデータ処理リソースと通信し得ることに留意されたい。このようなデータ処理リソースは、変換の実装に必要な処理の一部又はすべてを実施し得る。したがって、この実施形態が分散処理原理を採用し得ることが理解されるであろう。
システム100はさらに、二次結果に基づいて信頼尺度を決定する分析構成要素124を含む。ここでは、分析構成要素124は、二次結果の逆分散に基づいて信頼尺度を決定する。したがって、二次結果の分散が低いときに、信頼尺度の値が高くなる。逆に、二次結果の分散が高いときに、信頼尺度の値は低くなる。次に、信頼尺度は、入力された医用画像10と、MLモデル105によって処理されることによってもたらされるその一次結果とに関連付けられる。
ここでも、二次結果に基づいて信頼尺度を決定するために、分析構成要素124は、インターネット又は「クラウド」50において利用可能な1つ以上のデータ処理リソースと通信し得ることに留意されたい。このようなデータ処理リソースは、信頼尺度の決定に必要な処理の一部又はすべてを実施し得る。したがって、この実施形態が分散処理原理を採用し得ることが理解されるであろう。
分析構成要素124はさらに、一次結果及び決定された信頼尺度を表す出力信号130を生成する。つまり、一次結果の信頼性レベルを決定した後、一次結果の信頼性レベルを表す出力信号130が生成される。
システムはさらに、1人以上のユーザに情報を提供するためのグラフィカルユーザインターフェース(GUI)160を含む。出力信号130は、有線又は無線接続を介してGUI160に通信される。一例として、無線接続は、短中距離通信リンクを含む。図1に示されるように、出力信号130は、データ処理ユニット110からGUI160に提供される。しかしながら、システムがインターネット又はクラウド50を介してデータ処理リソースを使用している場合は、出力信号は、インターネット又はクラウド50を介してGUI160で使用できるようにされてもよい。
GUI160は、出力信号130に基づいて、GUI160の表示領域に1つ以上のグラフィック要素を表示することで情報を伝える。このようにして、システムは、MLモデル105を用いた医用画像10の処理結果に関する情報を伝えることができる。これは、処理結果に関連する確実性又は信頼のレベルを示すのに有用である。例えば、GUI160を使用して、グラフィック要素を医師、データアナリスト、エンジニア、医用イメージング装置のオペレータ、技術者などに表示できる。
上記の図1の例示的な実施形態は、医用イメージングに関連して説明されているが、提案される概念は、医療症例記録、エンジニアリング画像などの他の形式の入力データにも拡張され得ることが理解されるであろう。
また、上記の説明から、MLモデルが任意の適切な形式であってもよいことが理解されるであろう。例えば、MLモデルは、人工ニューラルネットワーク、敵対的生成ネットワーク(GAN)、ベイジアンネットワーク、又はこの組み合わせを含む。
上記の図1の説明から、実施形態がMLモデルから返された結果の信頼の推定値を提供し得ることが理解されるであろう。信頼性の推定値は、入力データの拡張/修正によって導出され、クライアント側にデプロイされたMLモデルに対して取得される。
実施形態は、正確な、又は、信頼性の高い/信頼できるMLモデルが「うまく挙動する」べきである、すなわち、入力データへの小さな摂動が、出力データに小さな、対応する影響を与えるべきであるという提案を前提としている。MLモデルを分析するために、処理されるべき入力データ(例えば新しいケース)、新しいケースは、複数の拡張/修正を受け、これらはすべて次にMLモデルによって処理される。次に、拡張/修正された入力を処理することによってもたらされる分散を使用して、信頼尺度(これは、MLモデルの精度、堅牢性、又は信頼性を表す)が決定される。このようにして、実施形態は、入力に固有の(例えばケースに固有の)信頼尺度を提供することができ、これはMLモデルの提供者が行った要求又は提案とは無関係であり得る。
したがって、提案される実施形態は、MLモデルの汎化能力を連続性特性として解釈するという提案に基づいているものとしてまとめることができる。つまり、MLモデル(ニューラルネットワークなど)が初見の入力データ(例えばケースC)に対して適切に一般化される場合、入力データ(C)に対する小さな摂動は、MLモデル出力に小さな対応する影響しか有さないべきである。
実施形態を、深層学習モジュールのクライアント側のデプロイメントフェーズ(トレーニングフェーズではない)に適用できる。
さらなる例として、一実施形態によるMLモデルの信頼尺度を取得するための方法を次のとおりにまとめる。
(i)新しいケースCがMLモデルに入力され、特定の一次結果Rが得られる。ボクセル単位のラベリングによるセマンティックセグメンテーションの場合、Cは入力画像ボリュームに対応し、Rは各ボクセルにラベル情報(例えばC内の対応する画像ボクセルにクラスを指定する単一の整数値)が含まれる等サイズのボリュームに対応する。あるいは、Rには、Cからの各ボクセルに対して、関連するクラス確率に対応するエントリを有する確率ベクトルが含まれ得る。例えば、n個の異なるクラスを選択できるMLモデルでは、特定の画像ボクセルに関連付けられたベクトルは、単位元になるn個のエントリで構成される。
(ii)ケースCは、例えば、他の患者への空間的な位置合わせ、任意の局所変形(ワープ)、ノイズなどの追加、又はこれらの方法の組み合わせなどによって、複数の方法で修正(「拡張」)される。セマンティックセグメンテーションでは、空間変換を適用すると、ワープされた画像内の各ボクセルに対して、元の画像内の座標が保存される。
(iii)Cの拡張バージョンである各CもMLモデルに渡され、1つの対応する結果Rが得られる。セマンティックセグメンテーションでは、一般的に使用されるMLモデルは、U-Netアーキテクチャである。
(iv)一次結果Rはユーザに提供され、一次結果Rに関連する信頼レベルを示すセット{R}の多様性が補足される(信頼レベルはセット{R}の多様性に反比例する)。セマンティックセグメンテーションでは、各ボクセルの信頼レベルは個別に計算される。
の各ボクセルについて、各Cの対応する場所を検索し、RからMLアルゴリズムの出力を収集する。検討下のボクセルに関連するすべての出力は、ヒストグラム(クラス周波数の概要)を使用してまとめられる。ヒストグラムの解析及び関連する経験分布に基づき、シャノンエントロピー(すなわち、
Figure 0007479387000001
、ここで、piは、所与の記号の確率である)又はジニ係数(完全な均等線の下の領域(定義では0.5)からローレンツ曲線の下の領域を引いた値を、完全な均等線の下の領域で除算した値である。つまり、ローレンツ曲線と完全な均等線との間の面積を2倍にする)などの様々な確実性尺度を計算できる。
ボクセル単位のラベリング(例えばセマンティックセグメンテーション)及び位置特定タスクでは、微分同相写像(diffeomorphic)拡散空間変換(例えば剛体、アフィン、微分同相写像ワープ)による拡張を使用することで、実施形態が、生成されたラベル画像又は位置特定座標を元のボクセルグリッドに(逆変換を適用することにより)一意に変換して戻ることができる。したがって、ラベリングタスクでは、元のボクセルグリッドの各ボクセルに対して、ラベルの全母集団が生成される。上記のシャノンエントロピー又はジニ係数に加えて、このラベル母集団のサンプル分散を使用して、定量的なボクセル単位の信頼尺度を導出できる。より正確に言えば、信頼はサンプル分散又はシャノンエントロピーに逆相関している。
視覚化のために、クラスラベルの色相を使用して、信頼をディスプレイにおいて色の彩度又は不透明度としてコード化できる。位置特定タスクでは、点の場所のセット全体が生成され、その分布も同様に、個別の点として、又は、正規分布を使用するなど、適合した点密度関数を介してオーバーレイできる。
分類タスクでは、(ネットワークによってCに割り当てられた)Rから逸脱しているクラス割り当て{R}の比率が、拡張に使用される変換に対する堅牢性の尺度(すなわち、信頼尺度)を提供する。
図2を参照すると、MLモデルの信頼尺度を取得するための方法200のフロー図が示されている。この例では、MLモデルは、人工ニューラルネットワーク、敵対的生成ネットワーク(GAN)、及びベイズネットワークのうちの少なくとも1つを含む。
図2では、ステップ210は、MLモデルを用いて入力データdを処理して、一次結果Rを生成することを含む。
ステップ220は、入力データdの複数の修正インスタンス(d、dii、diii)を生成することを含む。さらに具体的には、入力データの複数の修正インスタンスを生成するステップ220は、複数のステップ、すなわち、ステップ222、224、226を含む。ステップ222は、入力データdに第1の空間ワーピング変換(例えば剛体変換又はアフィン変換)を適用して、入力データの第1の修正インスタンスdを生成することを含む。ステップ224は、入力データdにノイズを追加して、入力データの第2の修正インスタンスdiiを生成することを含む。ステップ226は、入力データdに局所変形変換を適用して、入力データの第3の修正インスタンスdiiiを生成することを含む。
ステップ230は、MLモデルを用いて入力データの複数の修正インスタンス(d、dii、diii)を処理して、対応する複数の二次結果(R、Rii、Riii)を生成することを含む。ここでは、必要に応じて、二次結果を、対応する逆変換を使用して変換(正規化)して、一次結果Rと比較できるようにしてもよいことに留意されたい。例えば、入力データの第1の修正インスタンスdに対して生成された二次結果Rには、逆空間ワーピング変換が適用される。また、入力データの第3の修正インスタンスdiiiに対して生成された二次結果Riiiには、逆局所変形変換が適用される。
ステップ240は、(正規化された)二次結果(R、Rii、Riii)に基づいて、MLモデルに関連する信頼尺度を決定することを含む。ここでは、信頼尺度を決定することは、(正規化された)二次結果(R、Rii、Riii)の逆分散に基づいて信頼尺度を決定することを含む。前述のように、他の実施形態では、信頼尺度を決定することは、シャノンエントロピー又はジニ係数を決定することを含み得る。
また、図2の模範的な実施形態には、決定された信頼尺度を一次結果Rに関連付けるステップ250も含まれている。このようにして、一次結果Rの信頼性の単純な表現を生成し、一次結果Rに関連付けることができる。これにより、MLモデルの入力データdに対する決定又は出力の分析に関して、一次結果Rの重要性及び/又は関連性を迅速かつ簡単に特定及び評価できる。
図3を参照すると、適合されたMLモデル410を含む、本発明によるシステムの別の実施形態が示されている。ここでは、MLモデル410は、例えば、医療/臨床判断サービスでの使用に利用可能である、従来のニューラルネットワーク410を含む。
ニューラルネットワーク410は、入力データを処理したことによる結果又は決定を表す出力信号を、(例えば有線又は無線接続を使用して)インターネット420を介して、遠隔にあるデータ処理システム430(サーバなど)に通信して、MLモデルの信頼尺度を取得する。
データ処理システム430は、提案される実施形態による方法に従って入力データを取得して処理して、MLモデル410の信頼尺度を特定する。
より具体的には、データ処理システム430は、入力データを取得し、入力データの複数の修正インスタンスを生成する。次に、データ処理システム430は、入力データと、入力データの複数の修正インスタンスとをMLモデル410に通信する。MLモデル410は、データ処理システム430から受信したデータを処理して、対応する結果を生成する。より具体的には、入力データがMLモデル410によって処理されて一次結果が生成され、入力データの修正インスタンスがMLモデル410によって処理されて対応する複数の二次結果が生成される。次に、データ処理システム430は、MLモデル410から、一次結果と、複数の二次結果とを取得する。データ処理システム430は、二次結果の多様性に基づいて、MLモデル410によって作成された一次結果の信頼尺度を決定する。
データ処理システム430はさらに、信頼尺度を表す出力信号を生成する。したがって、データ処理システム430は、入力データを受信し、1つ以上のアルゴリズムを実行して、入力データについてMLモデル410によって出力された一次結果(例えば決定)の信頼性を特定及び分類できる、中央からアクセス可能な処理リソースを提供する。取得した信頼尺度に関する情報は、データ処理システムによって(例えばデータベース内に)保存され、システムの他の構成要素に提供できる。MLモデル及び一次結果に関するこのような情報の提供は、(例えばインターネット420を介する)要求の受信に応答して行われてもよいし、及び/又は、要求なし(例えば「プッシュ」)で行われてもよい。
MLモデル又は一次結果の信頼性に関する情報を受信し、したがって、モデル/データの分析又は評価を可能にするために、システムはさらに、第1のモバイルコンピューティングデバイス440と第2のモバイルコンピューティングデバイス450とを含む。
ここでは、第1のモバイルコンピューティングデバイス440は、信頼尺度を表すグラフィック要素を表示するためのディスプレイを備えた携帯電話デバイス(スマートフォンなど)である。第2のモバイルコンピューティングデバイス450は、MLモデルの結果及び関連する信頼尺度を表すグラフィック要素を表示するためのディスプレイを備えたラップトップコンピュータやタブレットコンピュータなどのモバイルコンピュータである。
データ処理システム430は、(例えば有線又は無線接続を使用する)インターネット420を介して第1のモバイルコンピューティングデバイス440及び第2のモバイルコンピューティングデバイス450に出力信号を通信する。前述のように、これは、第1のモバイルコンピューティングデバイス440及び第2のモバイルコンピューティングデバイス450からの要求の受信に応答して行われ得る。
第1のモバイルコンピューティングデバイス440及び第2のモバイルコンピューティングデバイス450は、受信した出力信号に基づいて、それぞれのディスプレイで提供される表示エリアに1つ以上のグラフィック要素を表示する。このために、第1のモバイルコンピューティングデバイス440及び第2のモバイルコンピューティングデバイス450は、各々、受信した出力信号を処理、復号化、及び/又は解釈してグラフィック要素を表示する方法を決定するためのソフトウェアアプリケーションを含む。したがって、第1のモバイルコンピューティングデバイス440及び第2のモバイルコンピューティングデバイス450は、各々、信頼尺度を表す1つ以上の値を決定し、信頼尺度に基づいてグラフィック要素のサイズ、形状、位置、方向、脈動、又は色のうちの少なくとも1つを修正するための表示制御信号を生成する処理配置を含む。
したがって、システムは、MLモデルの結果内の特徴に関する情報を、第1のモバイルコンピューティングデバイス440及び第2のモバイルコンピューティングデバイス450のユーザに通信できる。例えば、第1のモバイルコンピューティングデバイス440及び第2のモバイルコンピューティングデバイス450の各々を使用して、医師、データアナリスト、又は技術者にグラフィック要素を表示できる。
図3のシステムの実装は、(i)データ処理システム430が、例えば、従来の画像又はウェブページ表示(ウェブベースのブラウザなどであり得る)を使用してモバイルコンピューティングデバイスのユーザに単純に表示されるグラフィック要素(例えばJPEG又は他の画像形式にある)を含む表示データを含む表示の準備が整ったデータを通信する状況から、(ii)データ処理システム430が生データ情報を通信して、この生データ情報を、受信側のモバイルコンピューティングデバイスが(例えばモバイルコンピューティングデバイスで実行されるローカルソフトウェアを使用して)処理して一次結果及び関連する信頼尺度を生成する状況と様々であり得る。当然ながら、他の実装では、処理は、データ処理システム430と受信側モバイルコンピューティングデバイスとの間で共有されて、データ処理システム430で生成されたデータの一部が、モバイルコンピューティングデバイスのローカル専用ソフトウェアによってさらに処理されるように、モバイルコンピューティングデバイスに送信され得る。したがって、実施形態は、サーバ側の処理、クライアント側の処理、又はその組み合わせを採用できる。
さらに、データ処理システム430が情報(例えば出力信号)を「プッシュ」せず、むしろ、要求の受信に応答して情報を通信する場合、そのような要求を行うデバイスのユーザは、情報を通信するために、ID及び/又はセキュリティ認証情報を確認又は認証する必要がある。
本発明は、機械学習モデルの信頼尺度を取得するためのシステム、方法、及び/又はコンピュータプログラム製品である。コンピュータプログラム製品には、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令をその上に有しているコンピュータ可読ストレージ媒体(又は複数可)が含まれ得る。
コンピュータ可読ストレージ媒体は、命令実行デバイスが使用する命令を保持及び保存できる有形デバイスである。コンピュータ可読ストレージ媒体は、例えば、電子ストレージデバイス、磁気ストレージデバイス、光学ストレージデバイス、電磁ストレージデバイス、半導体ストレージデバイス、又は上記の任意の適切な組み合わせを含み得るがこれらに限定されない。コンピュータ可読ストレージ媒体のより具体的な例の非包括的なリストには、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラム可能読み取り専用メモリ(EPROM又はフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピー(登録商標)ディスク、パンチカードや命令が記録されている溝内の***した構造などの機械的にエンコードされたデバイス、及び上記の任意の適切な組み合わせが含まれる。本明細書で使用される場合、コンピュータ可読ストレージ媒体は、電波や他の自由に伝搬する電磁波、導波管や他の伝送媒体を伝搬する電磁波(例えば光ファイバケーブルを通過する光パルス)、又はワイヤを介して送信される電気信号など、それ自体が一時的である信号とは解釈されない。
本明細書に説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体から、対応するコンピューティング/処理デバイスに、又は、外部コンピュータ若しくは外部ストレージデバイスに、例えば、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、及び/又は無線ネットワークであるネットワークを介してダウンロードできる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータ、及び/又はエッジサーバを含み得る。各コンピューティング/処理デバイスのネットワークアダプタカード又はネットワークインタフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、コンピュータ可読プログラム命令を、それぞれのコンピューティング/処理デバイス内のコンピュータ可読ストレージ媒体への保存のために転送する。
コンピュータ可読プログラム命令は、ユーザのコンピュータ上で完全に、ユーザのコンピュータ上で部分的に、スタンドアロンのソフトウェアとして、ユーザのコンピュータ上で部分的にかつリモートコンピュータ上で部分的に、又は、リモートコンピュータ若しくはサーバ上で完全に実行され得る。後者のシナリオでは、リモートコンピュータは、ローカルエリアネットワーク(LAN)又はワイドエリアネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータに接続され得る。又は、(例えばインターネットサービスプロバイダを使用してインターネット経由で)外部コンピュータへの接続を確立することもできる。いくつかの実施形態では、例えば、プログラム可能論理回路、フィールドプログラマブルゲートアレイ(FPGA)、又はプログラム可能論理アレイ(PLA)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによってコンピュータ可読プログラム命令を実行して電子回路をカスタマイズして、本発明の態様を実行できる。
本発明の態様は、本明細書では、本発明の実施形態による、方法、装置(システム)及びコンピュータプログラム製品のフローチャート図及び/又はブロック図を参照して説明されている。フローチャート図及び/又はブロック図の各ブロック、並びにフローチャート図及び/又はブロック図のブロックの組み合わせは、コンピュータ可読プログラム命令によって実装できることを理解されたい。
このようなコンピュータ可読プログラム命令は、汎用コンピュータ、特殊目的コンピュータ、又は他のプログラム可能なデータ処理装置のプロセッサに提供されて、命令が、コンピュータ又は他のプログラム可能データ処理装置のプロセッサを介して実行され、フローチャート及び/又はブロック図の1つ以上のブロックで指定された機能/行為を実装するための手段を作成するようなマシンを生成する。これらのコンピュータ可読プログラム命令はまた、コンピュータ、プログラム可能なデータ処理装置、及び/又は他のデバイスが特定のやり方で機能するように命令できるコンピュータ可読ストレージ媒体に保存され、これにより、命令を保存したコンピュータ可読ストレージ媒体は、フローチャート及び/又はブロック図の1つ以上のブロックで指定された機能/行為の態様を実装する命令を含む製造品を含む。
コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラム可能なデータ処理装置、又は他のデバイスにロードされて、当該コンピュータ、他のプログラム可能な装置、又は他のデバイスで一連の動作ステップを実行させて、コンピュータ実施プロセスを生成でき、これにより、当該コンピュータ、他のプログラム可能装置、又は他のデバイス上で実行される命令は、フローチャート及び/又はブロック図の1つ以上のブロックで指定された機能/行為を実装する。
図のフローチャート及びブロック図は、本発明の様々な実施形態によるシステム、方法、及びコンピュータプログラム製品の可能な実装のアーキテクチャ、機能、及び動作を示している。この点で、フローチャート又はブロック図の各ブロックは、指定された論理関数(複数可)を実装するための1つ以上の実行可能命令を含むモジュール、セグメント、又は命令の一部を表すことができる。いくつかの代替の実装では、ブロックに示されている機能は、図に示されている順序とは異なる順序で生じてもよい。例えば、連続して示されている2つのブロックは、実際には実質的に同時に実行される場合もあれば、関与する機能に応じて逆の順序で実行される場合もある。また、ブロック図及び/又はフローチャート図の各ブロック、及び、ブロック図及び/又はフローチャート図のブロックの組み合わせは、指定された機能又は行為を行うか、又は、特殊目的ハードウェアとコンピュータ命令との組み合わせを実行する、特殊目的ハードウェアベースのシステムによって実装できることも留意されたい。
したがって、上記の説明から、実施形態は、MLモデルの提供者の要求に関係なく信頼尺度を決定する際に有用であることが理解されるであろう。この信頼尺度は、入力データに固有(例えば入力ケースに固有)であり得る。したがって、実施形態は、分類及び検出タスクの堅牢性尺度として使用できる情報を提供できる。また、データの修正/拡張も、特定の使用ケースに関して特別に設計できる。
したがって、提案された実施形態は、医療データ分析や臨床意思決定支援用途を含む、幅広いデータ分析概念/分野に適用可能である。例えば、被験者の医用画像を使用して被験者を調査又は評価する医用画像スクリーニングに、実施形態が有用である。このような場合、分類の不確実性に関するピクセルレベルの情報(例えば決定の信頼)が提供され、この情報は、医療従事者(例えば放射線技師)にMLモデル出力を説明又は補足できる。
説明は、例示及び説明のために提示されており、網羅的であるか又は開示された形式の発明に限定されることを意図するものではない。多くの修正及び変形が当業者には明らかであろう。実施形態は、提案された実施形態の原理、実践的応用を最もよく説明し、様々な修正を含む多様な実施形態が企図されていることを当業者が理解できるようにするために選択され、記述されている。

Claims (9)

  1. 機械学習モデルの信頼尺度を取得するためのコンピュータ実施の方法であって、前記方法は、
    前記機械学習モデルを用いて入力データを処理して、一次結果を生成するステップと、
    前記入力データの複数の修正インスタンスを生成するステップと、
    前記機械学習モデルを用いて前記入力データの前記複数の修正インスタンスを処理して、対応する複数の二次結果を生成するステップと、
    前記二次結果に基づいて、前記一次結果に関連する信頼尺度を決定するステップと、
    を含み、前記信頼尺度を決定するステップは、
    前記二次結果の分布又は分散の尺度を決定するステップと、
    前記分布又は分散の決定された前記尺度に基づいて前記信頼尺度を決定するステップと、
    を含み、前記二次結果の分布又は分散の前記尺度を決定するステップは、
    前記二次結果の逆分散、
    前記二次結果のシャノンエントロピー、
    前記二次結果のジニ係数、
    前記二次結果のカルバック-ライブラー発散、及び
    前記二次結果の集中尺度、
    のうちの少なくとも1つを決定するステップを含み、前記入力データの複数の修正インスタンスを生成するステップは、
    前記入力データに、剛体変換又はアフィン変換である第1の空間ワーピング変換を適用して、前記入力データの第1の修正インスタンスを生成するステップと、
    前記入力データの前記第1の修正インスタンスに対して生成された前記二次結果に、前記第1の空間ワーピング変換に対応する逆変換である第1の逆空間ワーピング変換を適用するステップとを含む、方法。
  2. 前記入力データの複数の修正インスタンスを生成するステップは、
    前記入力データにノイズを追加して、前記入力データの第2の修正インスタンスを生成するステップを含む、請求項1に記載の方法。
  3. 前記入力データの複数の修正インスタンスを生成するステップは、
    前記入力データに局所変形変換を適用して、前記入力データの第3の修正インスタンスを生成するステップを含む、請求項1又は2に記載の方法。
  4. 前記入力データの前記第3の修正インスタンスに対して生成された前記二次結果に、第1の逆局所変形変換を適用するステップをさらに含む、請求項3に記載の方法。
  5. 前記機械学習モデルは、
    人工ニューラルネットワーク、
    敵対的生成ネットワーク、及び
    ベイズネットワーク、
    のうちの少なくとも1つを含む、請求項1から4のいずれか一項に記載の方法。
  6. 決定された前記信頼尺度を前記一次結果と関連付けるステップをさらに含む、請求項1から5のいずれか一項に記載の方法。
  7. 機械学習モデルの信頼尺度を取得するためのコンピュータ可読プログラムコードが具現化されているコンピュータ可読ストレージ媒体であって、前記コンピュータ可読プログラムコードは、少なくとも1つのプロセッサで実行されると、請求項1から6のいずれか一項に記載のステップの全てを行う、コンピュータプログラム可読ストレージ媒体。
  8. 少なくとも1つのプロセッサと、
    請求項7に記載のコンピュータプログラム可読ストレージ媒体と、
    を含む、システム。
  9. 機械学習モデルの信頼尺度を取得するためのシステムであって、
    入力データを取得する入力インターフェースと、
    前記入力データの複数の修正インスタンスを生成するデータ修正構成要素と、
    前記入力データ及び前記入力データの前記複数の修正インスタンスを機械学習モデルに通信し、さらに、前記機械学習モデルが前記入力データを処理することによって生成される一次結果を受信し、前記機械学習モデルが前記入力データの対応する前記複数の修正インスタンスを処理することによって生成される複数の二次結果を受信する機械学習モデルインターフェースと、
    前記二次結果に基づいて、前記一次結果に関連する信頼尺度を決定する分析構成要素と、
    を含み、前記データ修正構成要素は、前記入力データに、剛体変換又はアフィン変換である第1の空間ワーピング変換を適用して、前記入力データの第1の修正インスタンスを生成し、前記分析構成要素は、前記二次結果の分布又は分散の尺度を決定し、前記分布又は分散の決定された前記尺度に基づいて前記信頼尺度を決定し、前記前記二次結果の分布又は分散の尺度を決定することは、
    前記二次結果の逆分散、
    前記二次結果のシャノンエントロピー、
    前記二次結果のジニ係数、
    前記二次結果のカルバック-ライブラー発散、及び
    前記二次結果の集中尺度、
    のうちの少なくとも1つを決定することを含み、前記データ修正構成要素はさらに、前記入力データの前記第1の修正インスタンスに対して生成された前記二次結果に、前記第1の空間ワーピング変換に対応する逆変換である第1の逆空間ワーピング変換を適用する、システム。
JP2021544257A 2019-02-01 2020-01-21 デプロイされた機械学習モデルの信頼尺度 Active JP7479387B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19154992.2A EP3690739A1 (en) 2019-02-01 2019-02-01 Confidence measure for a deployed machine learning model
EP19154992.2 2019-02-01
PCT/EP2020/051317 WO2020156864A1 (en) 2019-02-01 2020-01-21 Confidence measure for a deployed machine learning model

Publications (3)

Publication Number Publication Date
JP2022520731A JP2022520731A (ja) 2022-04-01
JPWO2020156864A5 JPWO2020156864A5 (ja) 2023-07-06
JP7479387B2 true JP7479387B2 (ja) 2024-05-08

Family

ID=65408873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021544257A Active JP7479387B2 (ja) 2019-02-01 2020-01-21 デプロイされた機械学習モデルの信頼尺度

Country Status (5)

Country Link
US (1) US11880432B2 (ja)
EP (2) EP3690739A1 (ja)
JP (1) JP7479387B2 (ja)
CN (1) CN113661498A (ja)
WO (1) WO2020156864A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210264283A1 (en) * 2020-02-24 2021-08-26 International Business Machines Corporation Dataset creation for deep-learning model
US11775764B2 (en) * 2020-04-20 2023-10-03 International Business Machines Corporation Estimating output confidence for black-box API
US20220335315A1 (en) * 2021-04-20 2022-10-20 Red Hat, Inc. Application of local interpretable model-agnostic explanations on decision systems without training data

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005001740A3 (en) 2003-06-25 2005-06-09 Siemens Medical Solutions Systems and methods for automated diagnosis and decision support for breast imaging
JP2010250161A (ja) 2009-04-17 2010-11-04 Nippon Telegr & Teleph Corp <Ntt> 相違度利用型識別的学習装置とその方法、そのプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11319A (ja) * 1997-06-13 1999-01-06 Nec Corp 生体内部活動部位推定装置
US10417575B2 (en) * 2012-12-14 2019-09-17 Microsoft Technology Licensing, Llc Resource allocation for machine learning
US9373087B2 (en) * 2012-10-25 2016-06-21 Microsoft Technology Licensing, Llc Decision tree training in machine learning
WO2016161115A1 (en) * 2015-03-31 2016-10-06 Mayo Foundation For Medical Education And Research System and methods for automatic polyp detection using convolutional neural networks
CN107810519B (zh) * 2015-06-30 2022-01-25 皇家飞利浦有限公司 用于配准图像的配准装置和方法
US10510144B2 (en) 2015-09-10 2019-12-17 Magentiq Eye Ltd. System and method for detection of suspicious tissue regions in an endoscopic procedure
WO2020082029A1 (en) * 2018-10-18 2020-04-23 The Regents Of The University Of California Serodiagnostic testing device and system for early-stage lyme disease using a multiplexed immunoassay
US11829896B2 (en) * 2019-07-11 2023-11-28 Ghost Autonomy Inc. Uncertainty-based data filtering in a vehicle
US20210209509A1 (en) * 2020-01-07 2021-07-08 Alegion, Inc. System and method for guided synthesis of training data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005001740A3 (en) 2003-06-25 2005-06-09 Siemens Medical Solutions Systems and methods for automated diagnosis and decision support for breast imaging
JP2010250161A (ja) 2009-04-17 2010-11-04 Nippon Telegr & Teleph Corp <Ntt> 相違度利用型識別的学習装置とその方法、そのプログラム

Also Published As

Publication number Publication date
EP3918521A1 (en) 2021-12-08
EP3918521B1 (en) 2023-10-04
US20220101626A1 (en) 2022-03-31
JP2022520731A (ja) 2022-04-01
CN113661498A (zh) 2021-11-16
EP3690739A1 (en) 2020-08-05
WO2020156864A1 (en) 2020-08-06
US11880432B2 (en) 2024-01-23

Similar Documents

Publication Publication Date Title
US10885383B2 (en) Unsupervised cross-domain distance metric adaptation with feature transfer network
US11645833B2 (en) Generative adversarial network medical image generation for training of a classifier
US11244435B2 (en) Method and apparatus for generating vehicle damage information
US10937540B2 (en) Medical image classification based on a generative adversarial network trained discriminator
US10540578B2 (en) Adapting a generative adversarial network to new data sources for image classification
US11392792B2 (en) Method and apparatus for generating vehicle damage information
JP7479387B2 (ja) デプロイされた機械学習モデルの信頼尺度
US20190272438A1 (en) Method and apparatus for detecting text
US20190220977A1 (en) Cross-Domain Image Analysis and Cross-Domain Image Synthesis Using Deep Image-to-Image Networks and Adversarial Networks
US11314989B2 (en) Training a generative model and a discriminative model
US20160210749A1 (en) Method and system for cross-domain synthesis of medical images using contextual deep network
CN108229485B (zh) 用于测试用户界面的方法和装置
US11301995B2 (en) Feature identification in medical imaging
CN112400187A (zh) 用于检测生物医学图像中的异常的敲除自动编码器
US20220092407A1 (en) Transfer learning with machine learning systems
CN111445457A (zh) 网络模型的训练方法及装置、识别方法及装置、电子设备
Nakanishi Approximate inverse model explanations (AIME): unveiling local and global insights in machine learning models
US11501451B2 (en) Detecting subject motion in medical imaging
KR102528405B1 (ko) 이미지를 분류하도록 훈련된 신경망을 이용하는 이미지 분류 장치 및 방법
CN116453049A (zh) 餐盘形状识别方法、装置、设备和计算机可读介质
CN116797859A (zh) 图像处理方法、装置、计算机设备、存储介质及程序产品

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230628

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231010

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240326

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240423

R150 Certificate of patent or registration of utility model

Ref document number: 7479387

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150