JP6463572B1 - 対象システムの内部状態を推定する支援システム - Google Patents

対象システムの内部状態を推定する支援システム Download PDF

Info

Publication number
JP6463572B1
JP6463572B1 JP2018557944A JP2018557944A JP6463572B1 JP 6463572 B1 JP6463572 B1 JP 6463572B1 JP 2018557944 A JP2018557944 A JP 2018557944A JP 2018557944 A JP2018557944 A JP 2018557944A JP 6463572 B1 JP6463572 B1 JP 6463572B1
Authority
JP
Japan
Prior art keywords
module
state
replica
data
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018557944A
Other languages
English (en)
Other versions
JPWO2019022085A1 (ja
Inventor
佐藤 友美
友美 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Axion Research Inc
Original Assignee
Axion Research Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axion Research Inc filed Critical Axion Research Inc
Application granted granted Critical
Publication of JP6463572B1 publication Critical patent/JP6463572B1/ja
Publication of JPWO2019022085A1 publication Critical patent/JPWO2019022085A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Child & Adolescent Psychology (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

対象システムの内部状態を推定する支援システム(10)であって、第1の検査データに基づいて、予め定められた少なくとも1つのルールにしたがって推定された第1の推定された状態を出力するように構成された推論モジュール(22)と、第1の検査データおよび第1の推定された状態に基づき、対象システムの状態を推定することを学習するように構成された学習モジュール(210)を含み、第2の検査データに対して第2の推定された状態を出力するように構成されたAIモジュール(21)と、推論モジュールにより推定された状態と、人工知能モジュールにより推定された状態との精度を検証するように構成された検証モジュール(23)と、検証モジュールの検証結果により推論モジュールにより推定された状態とAIモジュールにより推定された状態との優先順位を切り替えて出力する判定モジュール(28)とを含む支援システムを提供する。

Description

本発明は、対象システムの内部状態を推定する支援システムであって、人工知能モジュールを含む支援システムに関するものである。
日本国特開2017−91586号公報には、健康管理対象者の食事や健康状態から適切なアドバイスメッセージを生成して、健康管理のカリキュラム実行のモチベーションを向上させることができる健康管理サーバを提供することが記載されている。この文献には、健康管理対象者が保有する端末とネットワークを介して接続された健康管理サーバであって、健康管理対象者が選択したカリキュラム情報を端末から受信する受信部と、健康管理対象者の行動パターンを記憶する記憶部と、カリキュラム情報に基づく行動が継続されている場合の継続パターンと、カリキュラム情報に基づく行動が停滞した場合の停滞パターンと、に分析する分析部と、将来予測される健康管理対象者の身体情報および容姿を推測する人工知能部と、身体情報および容姿を生成する生成部と、画像情報または文例情報として端末に送信する送信部とを備える。
人工知能を用いて、様々な対象物に関するデータに基づいて、対象物を解析、分析、検査し、対象物の状態を診断(診察、推定、探査、判断)し、対象物の将来を予測するシステムが提案されている。しかしながら、人工知能を用いて、実際の診断支援等に役に立つシステムを構築することは容易ではない。
本発明の一態様は、対象システムの内部状態を推定する支援システムであって、モジュールのセットを有する。モジュールのセットは、対象システムに関する第1の検査データに基づいて、予め定められた少なくとも1つのルールにしたがって推定された上記対象システムの第1の推定された状態を出力するように構成された推論モジュールと、第2の検査データに対して上記対象システムの第2の推定された状態を出力するように構成された人工知能モジュールと、推論モジュールにより推定された状態と、人工知能モジュールにより推定された状態との精度を検証するように構成された検証モジュールと、検証モジュールの検証結果により推論モジュールにより推定された状態と人工知能モジュールにより推定された状態との優先順位を切り替えて出力する判定モジュールとを含む。さらに、人工知能モジュールは、第1の検査データおよび第1の推定された状態に基づき、対象システムの状態を推定することを学習するように構成された学習モジュールを含む。対象システムは、人体であってもよく、エンジンなどのメカトロニクスであってもよく、金融・投資などのサービスであってもよく、ゲームであってもよい。
支援システムは、学習モジュールの学習初期においては、推論モジュールにより推定された状態を優先して当該支援システムの推定結果として出力し、学習モジュールの学習が進み人工知能モジュールにより推定された状態(推定結果)の精度が推論エンジンにより推定された状態(推定結果)の精度を上回ると、人工知能モジュールが推定した状態を当該支援システムの推定結果として優先して出力する。学習が進んだ学習モジュールを含む人工知能モジュールの推定結果を、所定のルールに基づいて推論モジュールにより推定された結果と比較することにより、一方の推定結果を他方の推定結果で検証することが可能となる。このため、推論モジュールに含まれるルールでは対応が難しいケースに対して、学習が進んだ学習モジュールを含む人工知能モジュールであれば内部状態を比較的高い精度で推定できるようになる可能性があり、その推定結果を推論モジュールの推定結果により検証できる。また、推論モジュールに含まれるルールの適用可能な範囲が限定的な場合であっても、人工知能モジュールの学習により推定可能な範囲を拡張できる可能性がある。
モジュールのセットは、さらに、学習モジュールの学習用として対象システムの検査データのレプリカを生成するように構成されたレプリカ生成モジュールを含んでもよい。学習モジュールの学習を大量のレプリカを処理させることで促進できる。モジュールのセットは、さらに、検証モジュールにより検証された、人工知能モジュールにより推定された状態の精度に基づいて、レプリカ生成モジュールに対しレプリカの最適化方針を提供するように構成された最適化モジュールを含んでもよい。人工知能モジュールにより推定された状態の精度が低い結果に対して学習を促進できる。また、実データが不足する現象に対しても、レプリカを量産することにより、学習モジュールの学習を促進させることができる。レプリカによる学習は、推論モジュールが関与する実データと同様に教師あり学習であってもよく、推論モジュールが関与しない教師なし学習であってもよく、検証モジュールで曖昧性などの精度を報酬とした強化学習であってもよい。
レプリカ生成モジュールは、対象システムの検査データに含まれる複数のパラメータの値の実分布を反映したレプリカを生成するモジュールを含んでもよい。実分布を反映した多量のレプリカを訓練データとして、学習モジュールが自動的に、対象システムの内部状態を示す特徴量を学習してもよい。レプリカ生成モジュールは、対象システムの内部状態を示す内部レプリカと、内部レプリカの変化範囲から逆に推定した検査データのレプリカを生成するモジュールを含んでもよい。学習モジュールは、内部レプリカをラベルとした検査データのレプリカにより教師付き学習をおこなってもよい。
モジュールのセットは、さらに、対象システムの検査データを予め定められたルールにより前処理して推論モジュールおよび人工知能モジュールに入力される検査データに変換するように構成された入力処理モジュールを含んでもよい。検査データを、所定のルールにしたがって事前に統計処理したり、相関処理したりすることにより、人工知能モジュールの推論をトレースしやすくしたり、推論根拠を推定しやすくできる可能性がある。入力処理モジュールは、一例として、検査データに含まれる各パラメータ同士の相関を示すマップを生成するモジュールを含んでもよい。複雑系のシステムでは、パラメータ同士の相関は膨大な数になる可能性があるが、2次元または3次元にマップ化することにより画像認識による学習の対象とすることが可能となる。
検証モジュールは、推論モジュールまたは人工知能モジュールにより推定された状態の曖昧性を判断するモジュールと、曖昧性により追加情報を外部から取得するモジュールとを含んでもよい。追加情報は、対象システムの診断専門家のフィードバック、経過観察、追加試験の結果の少なくともいずれかを含んでもよい。曖昧性の高い(曖昧な余地の大きな)推定結果の曖昧性を改善することが可能となり、推論モジュールの推定結果の曖昧性を改善したり、学習モジュールに対して曖昧性の少ない推定結果を用いて教育できる。
モジュールのセットは、さらに、判定モジュールにより選択された推定された状態を対象システムの診断情報として出力するモジュールを含んでもよい。診断情報の出力方法は、診断情報を受け取る側(ユーザー)に依存して変更してもよく、例えば、対象システムの診断情報をデジタルアバタの症状として表現してもよく、ユーザーのソーシャルタイプを予め分析して、そのソーシャルタイプが受け取りやすい、または親近感を覚える方法で出力してもよい。
支援システムは、モジュールのセットをプログラム(プログラム製品)として格納するメモリと、メモリに格納されたプログラムをロードして実行するプロセッサとを有していてもよい。
本発明の他の態様の1つは、上記に開示した少なくとも1つの支援システムと、対象システムの診断専門家の端末とがクラウドにより接続されており、少なくとも1つの支援システムの出力がクラウド(インターネット、その他のコンピュータネットワーク)を介して参照される、クラウドシステムである。支援システムと、対象システムの診断専門家の端末と、対象システムの経過観察が可能な機関とがクラウドにより接続されているシステムにおいては、検証モジュールが、クラウドを介して診断専門家のアドバイスまたは経過観察をオーダーしてもよい。
本発明の他の態様の1つは、コンピュータを上記の支援システムとして機能させる命令を有するプログラム(プログラム製品)である。プログラムは適当な記録媒体に記録して提供してもよい。
本発明の、さらに異なる他の態様の1つは、対象システムの内部状態を推定する支援システムの制御方法である。支援システムは、対象システムに関する第1の検査データに基づいて、予め定められた少なくとも1つのルールにしたがって推定された上記対象システムの第1の推定された状態を出力するように構成された推論モジュールと、第1の検査データおよび第1の推定された状態に基づき、上記対象システムの状態を推定することを学習するように構成された学習モジュールを含み、第2の検査データに対して上記対象システムの第2の推定された状態を出力するように構成された人工知能モジュールと、推論モジュールにより推定された状態と、人工知能モジュールにより推定された状態との精度を検証するように構成された検証モジュールとを含む。制御方法は、推論モジュールにより推定された状態を、人工知能モジュールにより推定された状態より優先して出力することと、人工知能モジュールにより推定された状態を、推論モジュールにより推定された状態より優先して出力することとを含む。
支援システムは、さらに、学習モジュールの学習用として対象システムの検査データのレプリカを生成するように構成されたレプリカ生成モジュールを含んでもよく、制御方法は、さらに、検証モジュールにより検証された、人工知能モジュールにより推定された状態の精度に基づいて、レプリカ生成モジュールに対し前記レプリカの最適化方針を提供することを含む。
診断支援システムの一例を示すブロック図。 相関処理モジュールの一例を示すブロック図。 ヒートマップの一例を示す図。 ヒートマップの一部を拡大して示す図。 ヒートマップの他の例を示す図。 ヒートマップのさらに異なる例を示す図。 複数のヒートマップを比較する図。 ヒートマップのさらに異なる例を示す図。 ベクトルマップの一例を示す図。 ヒートマップが状態とともに変化する様子を示す図。 相関が状態とともに変化する様子を示す図。 個別マトリクスの一例を示す図。 学習システムの一例を示すブロック図。 推論エンジンの一例を示すブロック図。 検証過程の一例を示すブロック図。 検証エンジンの一例を示すブロック図。 支援エンジンの制御過程の一例を示す図。 最終決定・判定モジュールの一例を示すブロック図。 出力処理モジュールの機能の一例を示すブロック図。 レプリカ生成モジュールの一例を示すブロック図。 クラウドサービスの一例を示すブロック図。 クラウドサービスの機能の一例を示すブロック図。 クラウドサービスの拡張の一例を示すブロック図。
発明の実施の形態
図1に、本発明に係る支援システムの一例を示している。この支援システム10は、人(人体、人間)を診断の対象(対象物、対象システム)とした、診断支援システムの一例である。この支援システム(アクシオンシステム)10は、学習モジュール210を含む人工知能(AI)エンジン(AIモジュール)21と、対象物である人間の診察者(診断者)である医者のエキスパートシステムとしての機能を含む推論エンジン(推論モジュール)22と、対象システムに関する検査データである入力データ11に対するAIエンジンと推論エンジン22との推定結果に対して人工エンジン21の学習モジュール210を教育するための教師データとしてレプリカ13を生成する教育システム(学習システム)30とを含むハイブリッドエンジン(診断支援エンジン、アクシオンエンジン、AXiRエンジン)20を含む。
支援システム10は、各種データおよびプログラム(プログラム製品)115などを格納するメモリ101と、プログラム115として格納されたモジュールのセット110を実行するプロセッサ102とを含む。プログラム(プログラム製品)115は、メモリ101およびプロセッサ102を含むコンピュータ105を支援エンジン20および支援システム10として機能させるための複数の命令を含むものである。
支援エンジン20は、プロセッサ102で実行可能な複数のモジュールの1つのセット110として提供される。以降の説明において、モジュールのセット110は、支援エンジン20として説明される。プロセッサ102は、汎用型のプロセッサであってもよく、専用回路を備えたASICであってもよく、FPGAあるいはDRPなどの再構成型のプロセッサであってもよい。
1. システムの概要
この支援エンジン20は、人体を、その内部状態を推定する対象システムとした診断支援エンジン20である。診断支援エンジン20は対象システムの人体に関する第1の検査データ(第1の入力データ)に基づいて、予め定められた少なくとも1つのルールにしたがって推定された対象システムの第1の推定された状態を出力するように構成された推論モジュール(推論エンジン)22と、第1の検査データおよび第1の推定された状態に基づき、対象システムの状態を推定することを学習するように構成された学習モジュール210を含む人工知能モジュール(AIモジュール、AIエンジン)21とを含む。AIエンジン21は、学習モジュール210の学習が進むと、第2の検査データに対して、推論エンジン22が推定する状態とは異なる第2の推定された状態を出力するように構成されてもよい。診断支援エンジン20は、さらに、推論エンジン22により推定された状態と、AIエンジン20により推定された状態との精度を検証するように構成された検証モジュール(検証エンジン)23と、検証エンジン23の検証結果により推論エンジン22により推定された状態とAIエンジン21により推定された状態との優先順位を切り替えて出力する判定モジュール(最終判定・決定モジュール)28とを含む。
支援エンジン20は、さらに、学習モジュール210の学習用として対象システムの検査データ11のレプリカ13を生成するように構成されたレプリカ生成モジュール19と、検証エンジン23により検証された、AIエンジン20により推定された状態の精度に基づいて、レプリカ生成モジュール19に対しレプリカ13の最適化方針を提供するように構成された最適化モジュール(最適化エンジン)24を含む。支援エンジン20は、さらに、対象システムの検査データ11を予め定められたルールにより前処理して推論モジュール22および人工知能モジュール21に入力される検査データに変換するように構成された入力処理モジュール25を含む。支援エンジン20は、さらに、判定モジュール28により選択された推定された状態を対象システムの診断情報(出力データ)12として出力するモジュール29を含む。出力処理モジュール29は、対象システムの診断情報をデジタルアバタの症状として表現して出力するアバタ処理モジュール291と、ユーザーのソーシャルタイプを予め分析して、そのソーシャルタイプが受け取りやすい、または親近感を覚える方法で出力するソーシャルタイプ解析モジュール292とを含んでいてもよい。
この支援エンジン20においては、まず、AIエンジン21の学習モジュール210は、入力データ(検査データ)11に対して推論エンジン22に実装されている所定のルールにより解析あるいは推論された結果を教師データとして学習する。さらに、学習モジュール210は、検証エンジン23と最適化エンジン24からのフィードバックを受けて生成される入力レプリカ13により教育され、診断精度の自動あるいは自律的な向上が実現される。次に、支援エンジン20は、推論エンジン22とAIエンジン21の2つをハイブリッド実装しているので、AIエンジン21が教育された後に、医療エキスパートシステムである推論エンジン22と、AIエンジン21との両方の視点から、非侵襲・侵襲の測定データを含む入力データ11から人体内部要素の活性状態(健康度・不健康度・未病)や機能不全・不具合(疾病度合い)、劣化・腫瘍・癌化に関する推測・推定を行いアドバイスや参考となる健康情報や見落としがちな視点(可能性・危険性)を提供することができる。
すなわち、診断支援エンジン20は、予測・推論精度を向上させる目的で、AIエンジン21の自己学習機能と検証エンジン23と最適化エンジン24の2つが機能してこれを支援する点が特徴となっている。特に、推論エンジン22とAIエンジン21は、ハイブリッド型として機能するが、また、AIエンジン21が連続して予測・推論精度が推論エンジン22のそれを上回ると切り替わる点が特徴となっている。少ない入力データ量でも機能する様に、外部にレプリカ生成モジュール19が存在しており、最適化エンジン24の指示で、レプリカ生成のバリエーションが変化する構造となっている。
1.1 AIエンジン概要
実装されるAIエンジン21は、ディープラーニング(深層学習)を基本とするが、AIエンジン21は複数のタイプの異なる学習モジュール210を備えていてもよい。学習システム30は、AIエンジン21の学習モジュール210を、少ない入力データ11でも機能する様に(自律的に教育されるように)3つのエンジン、推論エンジン22、検証エンジン23、および最適化エンジン24を使用し、AIエンジン21のサポートと自己学習機能の一部役割を果たしてAIエンジン21の成長を支援する。また、学習システム30の3つのエンジン22〜24は、診断支援エンジン20およびAIエンジン21の予測精度・推論精度を向上させる機能も担っている。すなわち、学習システム30は、一種の精度向上のためのフィードバック回路の様な機能を担う。
学習システム30により、段階的にAIエンジン21は、推論エンジン22の予測精度を超えることになる。AIエンジン21と推論エンジン22との勝率は、検証エンジン23およびその下流で最終判定を行う最終判定・決定モジュール28が判断することなり、初期段階では、これらのエンジン23およびモジュール28は、推論エンジン22の診断結果(推論、予測)を優先する。その後、例えば、AIエンジン21が3カ月間平均で80%の勝率を超えたり、勝率90%を連続して超えた場合は、検証エンジン23および最終判定・決定モジュール28はAIエンジン21の診断結果を優先し、推論エンジン22はバックアップ側に回り、その推論や予測は当面利用されない。しかしながら、検証エンジン23および最適化エンジン24は、AIエンジン21がメイン動作している場合でも機能は継続して支援する。
したがって、この診断支援エンジン20の機能、性質、能力などは、学習システム30に含まれる3つのエンジン、すなわち、推論エンジン22、検証エンジン23および最適化エンジン24により左右される。これらのエンジン22〜24は、基本的にメタ・モデルという概念を基本とする。つまり、診断の対象物、例えば、人体の高精度の異常・故障の予測を必要とする複雑な系に対して、これを構成するシステム要素・構成部品が存在し、この要素・部品の機能がこれらの予測根拠となり、システムの入力と出力が定義可能であるようにする。診断の対象物の、好調・不調・障害・故障が、その程度は別として内部構成要素や部品の不具合から発生していると想定可能であり、その原因や問題点を測定データ・観測データから予測し、対応についてアドバイスを行い、必要とされる情報や期待される情報を提供するという事を想定して設計できる。
これらのエンジン22、23および24の機能を記述するメタ・モデル記述ファイル14により、診断支援エンジン20の外部、すなわち、システム独自、またはクラウド上のメモリ101に可能な限り定義体や相関情報・入力情報・統計情報・評価情報をモデル記述しておいて、複数のシステムやアプリケーションに対して、この記述情報を変更する事で対応可能な構成としている。したがって、支援エンジン20は、入力データ11及びメタ・モデル記述ファイル14が変更される事で、その役割や守備範囲・対応が違ったものとなる。また、同一のアプリケーション対象分野であっても、特化した入力データ11とする事で、専門性・性格の異なる支援エンジン20を作成(教育)する事が可能となる。以下では、ヘルスケア分野での健康度測定、乳癌や膵臓癌、腎臓癌、肺癌、胃癌、肝臓癌、大腸癌など違った分野の入力データ(検査データ)11を前提としたメタ・モデル記述ファイル14を前提として説明するが、本診断支援エンジン20が適用できる分野はヘルスケアに限定されず、ガスタービンエンジン、ファクトリオートメーションなどの工業的分野、金融などの商業あるいはサービス分野、およびゲームなどの娯楽分野などであってもよい。
1.2 推論エンジン概要
さらに具体的には、診断支援エンジン20を形成する中心の1つである推論エンジン22は、測定データ、問診データなどを含む検査に関する入力データ11から推論して、診断対象である人体の内部状態の推定し、疾病やガンなどの異常の有無を推定する。推論エンジン22は、医者などの医療関係者からの情報、過去の疾病に関する情報や経験などに基づき生成された1つまたは複数のルールを含むエキスパートシステムである。入力データ11は、問診・血液・尿・統計・microRNA・遺伝などの複数の要素を含み、それに基づき推論される人体の状態を幾つかの候補をあげて絞り込む機能を含む。AIエンジン21の予測・推定精度が十分で無い場合は、当面、推論エンジン22が主導で、診断支援エンジン20における診断支援サービスを実行する。最終判定・決定モジュール28は、AIエンジン21と推論エンジン22との推定結果の優先のスイッチングのタイミングと判断とを、メタ・モデル記述ファイル14に従って実行する。診断支援の中心がAIエンジン21に切り替わった場合でも、バックグラウンドでは推論エンジン22はその機能を継続して、AIエンジン21の推定結果と常に比較され、AIエンジン21の推定結果を常に検証する機能を果たす。
診断支援エンジン20の推論エンジン22は、診断対象の複雑なシステムの良・不良・不調・故障・破損と因果関係にある、または、直接関係する内部パーツと、それらの関係性・活性度・リカバリー機能・免疫力・調整メカニズム・劣化要因の推定根拠となる入力データ11を利用して、診断対象のシステムの内部状態を推定する。診断対象の複雑なシステムの良・不良・不調・故障・破損と因果関係にある、または、直接関係する内部パーツ、および、それらの関係性・活性度・リカバリー機能・免疫力・調整メカニズム・劣化要因と、入力データ11に含まれる各検査パラメータ、数値などのと相関は、メタ・モデル記述ファイル14により与えられてもよい。推定エンジン22に実装されるルールの1つは、入力データ11から、診断対象物の内部レプリカを推定して1次予測とし、1次予測が、ある範囲で信頼可能とすれば、2次予測として、入力データを再推定するものであってもよい。この2次予測から、その先に懸念されるシステムの良・不良・不調・故障・破損(限界)の時期と被害を3次予測として推定してもよい。
診断支援エンジン20の最終的な推論結果(診断情報)となる出力データ12を決定する場合、入力データ(測定データ及び問診表などを含んでもよい)11と、これから推定される内部状態(内部レプリカ)、更に、その内部レプリカのバリエーションからの再度生成された入力レプリカ、これと測定データとの差分値(分散値)の最小のものを有力な推論結果の候補として上げてもよい。
推論エンジン22は、推定結果を、入力データ11との相関性を記述した入出力相関テーブル/記述ファイル15から推定するルールを含んでいてもよい。推定されうる状態の絞込みが難しい場合は、検証エンジン23が判断し、追試を行って新しい入力データ11および問診データを得ることで推定精度を向上するルールを設けてもよい。このルールを最適化エンジン24に利用してもよく、予測・推定精度向上に貢献する。入出力相関テーブル/記述ファイル15は、この精度向上を確実にする意味でも、定期的に見直しをして更新する必要がある。相関テーブル情報は、入力データや問診情報と人体の内部パーツ(臓器・血管・骨・脊髄・その他)との関係性を示すものを含むようにしてもよい。
1.3 検証エンジン概要
検証エンジン23は、推論エンジン22またはAIエンジン21の推定結果231に含まれる、推定された内部状態(内部レプリカ)に対して、メタ・モデル記述ファイル14の評価式(アルゴリズムや式・最小二乗法その他)にしたがって、予測あるいは推定された状態の精度を検証してもよい。内部レプリカから再生成される入力再生成レプリカを対象として、推定結果の精度を検証してもよい。推定結果231の精度が不足し、曖昧さが大きな場合は、検証エンジン23は、メディカルドクター(MD)や追試の検査、2週間単位での継続検査を要求する検証結果を示してもよい。さらに、判定で曖昧さが残り、断定できない、あるいは絞り込みが不足する場合、検証エンジン23は、推定結果に対し、継続検査(検証)フラグを立て経過監査を継続する検証結果を示してもよい。すなわち、検証エンジン23は、AIエンジン21および/または推論エンジン22の推定結果231の評価が、その時点では確定できないと判断すると、それらの推定結果231を、タイムライン(タイムカプセル)にポストし、検証を、時間が経過した後に行えるようにする機能(経過観察機能)を含んでもよい。これらのオプションは、メタ・モデル記述ファイル14に含めてもよい。
検証エンジン23は、AIエンジン21および/または推論エンジン22の推定結果231の評価のために、入力データ11が不足していると判断すると、さらなる情報の入手を試みる機能を含んでもよい。例えば、入力データ11として、健康度を決定する為の測定データは、血液検査、尿検査、呼気・皮膚ガス測定、体温・内臓脂肪・皮下脂肪・筋肉量・体脂肪率・推定骨量・血圧・血流・心拍数・自律神経興奮度等の測定値と画像診断結果、microRNA・ncRNA・DNAの各情報が想定されるがこれらに限定されない。これらの情報と問診票による情報とが、検査データとして入力データ11に含まれてもよい。検証エンジン23は、追加のテストを提案する機能を含んでもよく、例えば、AIエンジン21および/または推論エンジン22の推定結果231から想定される疾病候補とリンクされ、候補となる疾病の可能性を確認するための追試をオーダーする機能を含んでもよい。その際に、メディカルドクターの提案を受け入れ、それを優先する機能を含んでもよい。検証のための追加測定項目については、順次追加する方式を採用してもよい。
検証エンジン23は、これらの追試が何らかの事情で即時実施が難しかったり、追加の測定の即時実施が難しい場合は、タイムカプセルにポストし、ペンディングとして数ヶ月、半年、1年間、経過後、再度測定をしてその差分から、疑問の残る予測・推論については戻した形でのフィードバックを実行する機能を含んでもよい。この機能は経過観察機能の一部に含むことが可能であり、経過観察を続ける必要がある場合、例えば、2週間単位で精密検査を行い、これを数回実施して、その差分から健康体へと向かっているのか、病体側へと悪化しているのかを微分係数的に観察するという手法を採用してもよい。
1.4 最適化エンジン概要
最適化エンジン24は、基本的にAIエンジン21の予測・推定精度が上がる様にレプリカ13が最適化される方針を指示する。そのために、最適化エンジン24は、記述ファイル14中にある初期パラメータを調整してもよく、推論精度・予測精度を高めるために利用しているアルゴリズムの変更を指示してもよい。例えば、ある特定職場や地域・組織での感染症に疑いがある場合、最適化エンジン24は、これに関係する予測や推定の優先順位を上げるようにレプリカ13を生成する方針を指示してもよい。もし、診断対象のシステムの特定の部品に、製造不良やバラつきが多くみられる場合は、最適化エンジン24は、それらの不良の推定に関係するパラメータ強化を行い、それらの不良の推定の学習に有効なレプリカの生成するレベルを上げる指示をおこなってもよい。
2. レプリカ
2.1 レプリカ生成モジュール概要
深層学習は、なんでもできますという様な誤解を与えているが、最終的には、膨大な数の入力データの学習により完成度を上げる必要がある。つまり、従来のデバッグとシステム構築という観点から、全く別物と考えるべきである。特に、システムが複雑な場合、単一機能ではないので、修正や期待した結果を得るには一定の手順が必要で厄介である。
これを可能な限り、入力側の制御により容易化するのが、レプリカ生成モジュール19となる。例えば、パイロット用の入力パターンを準備しておいて、入力データの学習によりその精度を測定して、短時間で精度向上を実現するために、あるタイミングから次の入力タイミングまで、いくつかの複数パターンを準備してその複数結果を比較しながら、どの様な入力レプリカ生成が良い結果となるかを比較する方法で精度の測定を行えば段階的に意図的な性能向上が可能となる。これは、推論エンジン22の推理結果とAIエンジン21の推論結果とを比較して、それらの推論結果が違ったパターンから学習成果を評価し、入力レプリカを変えるという方法で予測・推論精度を向上させてもよい。レプリカ生成モジュール19は、自己学習のためのレプリカの生成パターンをルール化して、自力で学習させながらフィードバックを行う自己学習モデルを提供できる。
古典的システム工学的な手法では、単一機能のモジュールを組み合わせて、システムを構築していく方法が安全であり信頼性の高いシステムを保証可能となる。但し、柔軟性はあまり高いとは言えない。しかしながら、デバックするときに、単一機能であると、どこに原因があるのかがわかり易くバックアップも対応し易いし、将来の障害やトラブルに対しても特定と対策が容易となる。
レプリカ生成モジュール19は、外部ツールとして提供されてもよい。支援エンジン20にレプリカ生成モジュール19を組み込んでもよく、内部の入力処理側から最適化エンジン24の指定によりレプリカ生成を制御することが可能となる。AIエンジン21は、基本的に入力データ11により学習することにより基本的な特徴量を学習し、さらに膨大なレプリカ13により自己学習を行うことにより推論エンジン22が想定していない特徴を学習することを含めて、AIエンジン21を進化させることができる。
レプリカ生成モジュール19は、推論エンジン22、検証エンジン23および最適化エンジン24とともに学習システム30を構成するための重要な要素の1つである。レプリカ生成モジュール19は、十分な量の実データが揃わない状態において、その実データの不足を補い、AIエンジン21の学習を加速させる為の入力データと、推論・検証・最適化の各エンジンを助けるモジュールとして位置づけられる。レプリカ生成モジュール19は、特に、検証を容易とするために、比較やエラー・不具合・不整合・不良・損傷・破壊を明確に示す内部要素の状態(レプリカ)を生成するためのツールであってもよい。機能の活動状況をより比較して推論の精度を確認する目的で、レプリカ生成モジュール19は、生成した内部レプリカ13bから入力レプリカを再生成する方法を備えていてもよく、その場合、最初に生成した入力レプリカ13aまたは入力データ11から生成した内部レプリカ13bのバリエーションを推定して、そのバリエーションから考えられる再生成入力レプリカ13cを用意してもよい。実データ(入力データ)11と比較して、内部レプリカ13bのバリエーションとして可能性の高いレプリカを増やし、AIエンジン21の予測・推定精度を向上できる。
レプリカ生成モジュール19は、AIエンジン21の機械学習を効率よく進めるツールとしての機能を含んでもよい。例えば、人体が診断対象物の場合、疾病・病体や健康体・未病と分類される境界領域の判定と精度を向上するために、レプリカ生成モジュール19は、複数の実測データに基づき、統計的にバリエーションを増やしたレプリカ(入力レプリカ)13aを自動的に生成する機能を備えていてもよい。
現在の検査コストは、血液検査や尿検査、CTやMRI、X線などを想定した場合、5〜6万円/人が必要とされている。一方、AIエンジン21の完成を上げるには、数万人から数百万人が理想とされるが、これらのデータを短期間に収集可能な体制や、予算を確保することは容易ではない。レプリカ生成モジュール19は、複数の実測データ(検査データ)11をベースに、AIエンジン21の学習に要するデータを、バリエーションも含めて自動的に増やすことことが可能となる。このため、比較的少数のデータに基づいて、短期間にAIエンジン21の自己学習を進めるための有効なツールである。また、症例が少なく、実測されうる検査データ11が少ない場合においては、レプリカ生成モジュール19は、レプリカ13を用いて、AIエンジン21の自己学習結果をフィードバックし、AIエンジン21の推定精度を向上するための最良パスとして機能する。
レプリカ生成モジュール19は、単独でレプリカを生成してもよい。レプリカ生成モジュール19は、推論エンジン22における推定過程の内部レプリカの生成と連動させてもよく、その結果を、AIエンジン21の自己学習のためのレプリカ生成に利用してもよい。生成するレプリカは、入力データレプリカ(入力レプリカ)13aと、内部レプリカ13bと、再生成入力レプリカ13cの3種類を含んでもよい。レプリカ生成モジュール19は、入力レプリカ生成モジュール19a、内部レプリカ生成モジュール19b、再生成入力レプリカ生成モジュール19cを含んでもよい。入力レプリカ生成モジュール19aは、対象システムの検査データ11に含まれる複数のパラメータの値の実分布を反映した入力レプリカ13aを生成するモジュールであってもよい。内部レプリカ生成モジュール19bは対象システムの内部状態を示す内部レプリカ19bを生成するモジュールであってもよく、再生成入力レプリカ生成モジュール19cは、内部レプリカ13bの変化範囲から逆に推定した検査データ11のレプリカ(再生成入力レプリカ)13cを生成するモジュールであってもよい。
2.2 入力データレプリカ
入力データレプリカ(入力レプリカ)13aは、統計データや実データを元に確率モデルから生成され、実際の検査データ(入力データ)11の代わりなるデータであってもよい。平均値と分散値から指定された確率モデルで、ヘルスケアにおける入力データ11は、血液検査、尿検査、呼気・皮膚ガス測定、体温・内臓脂肪・皮下脂肪・筋肉量・体脂肪率・推定骨量・血圧・血流・心拍数・自律神経興奮度等の測定値と画像診断結果、microRNA・ncRNA・DNA等とも共に問診票などもこのデータに含まれる。
入力レプリカ生成モジュール19aは、統計データ、及び実際のデータに基づき、実際の測定データの代わりをするデータ(入力レプリカ)13aを生成するモジュールである。入力データのレプリカ13aは、生態データに対しては、大きく2つのモデル(単純モデルと階層モデル)を想定した確率モデルに基づいて生成してもよい。確率分布の一例は、一様分布等の単純な分布数種と正規分布である。
非相関モデル(単純モデルともいう)はデータ間に相関がないモデルであり、これは、スーパーノーマルと呼ばれるような超健康体のモデルをベースに生成する。レプリカの要素Yiは以下の式(1)で表現する正規分布に従う。
Yi=N(μi,σi2)・・・(1)
ここでのμi、σi2は定数であり、それらを要素毎に設定することでそれぞれの確率モデルが決定される。
相関モデル(階層モデルともいう)はデータ間に相関があるケースであり、主に病体を想定したモデルである。このケースでは、μiとσi2は定数ではなく、他の要素と関連させて算出した値となる。そこで、要素の平均μiと分散σi2に他の要素の値から算出した階層モデルを導入すれば、このような要素間の相関を統計モデルに反映することができる。ある要因(説明変数)となる変数をxとし、それにより他の要素の平均Y1、Y2が増減する場合、次式(2)で表現することで、相関をもった要素を生成することができる。このケースでは、xの指定とa1、a2、b1、b2を定数として定義する。
μ1=a1x+b1
μ2=a2x+b2 ・・・(2)
なお、x自身をレプリカの要素として出力することも可能である。また、分散値も同様に指定可能である。
2.3 内部レプリカ
内部レプリカ13bは、入力データ11に対する内部の部品の状態、すなわち診断対象物の状態を推定したデータであり、本来は、入力レプリカ13aに対する教師データの役目を担うデータである。本エンジン20では、推論エンジン22の推論、および/または、AIエンジン21の推論に基づいて、入力データ11から推定した内部レプリカ13bを生成してもよい。ヘルスケアにおける内部の部品は、主に人体の要素であり、臓器・血管・骨・脊髄・その他からなり、この内部レプリカ13bは、これらの部品の活性度を数値で指標するものであってもよい。これらに関する情報は、入出力相関テーブル15により提供してもよい。
内部レプリカ13bの具体的な例の1つは、入力データ11に含まれる以下のような測定(検査)データに対し、相関のある臓器の状態を活性率などの指標を使い、その指標値がとり得る範囲を確率モデルで生成したものであってもよい。内部レプリカ生成モジュール19bは、測定データ(問診含む)に対し、入出力相関テーブル15および最適化エンジン24からの指定により、内部レプリカ13bを生成する。学習を目的として生成される入力レプリカ13aが、それを生成する段階で、臓器の状態が定義されている場合は、この生成モジュール19bを用いなくても、入力レプリカ13aと臓器の状態のセットで教師付きデータとして、AIエンジン21の学習用のデータとして、また、その評価用のデータとして、そのまま利用できる。医者の所見付きの測定データ(入力データ)11も、測定データと臓器の所見のセットになるので、その扱いは基本的に教師付きデータと同様である。一方、医者の所見のない入力データ(測定データ)11から内部の状態を推論するためには、入出力相関テーブル15を参照し、その都度、測定データ11に対し、可能性のある内部レプリカ13bのバリエーションを生成する必要がある。後にこの内部レプリカ13bのバリエーションから生成された再生成入力レプリカ13cは、入力データ11と比較され、最適な内部レプリカ13bと再生成入力レプリカ13cとのセットが教師付きデータとして利用される。
内部レプリカ生成モジュール19bは、測定データ(問診含む)11から入出力相関テーブル15および最適化エンジン24からの指定により、フェーズ#1として生成された入力レプリカ13aをベースに内部レプリカ13bを生成してもよい。フェーズ#1では、入力データ(測定データ・問診・他)11に基づいて限られた自由度から入力レプリカ13aを生成し、入力レプリカ13aと1対1で内部レプリカ13bを生成してもよい。
入出力相関テーブル15は、後述するように、入力データ(検査データ)11と内部の状態指標(各パーツの活性率などで)との相関を定義したファイルである。統計モデルとしては、測定データについて正常な範囲と異常な範囲が統計的に分るものについて、それらが関連する内部の状態を指標として、正常な範囲を100、異常な範囲をその異常の程度により、階段状に減じた値を与えることで定義してもよい。疾病データについては、その測定データに対し、医者の判定をベースに内部の状態の指標を定義してもよい。問診データについては、設問時に予め紐付けされた内部とその状態の指標に従い、問診結果に対する指標を定義してもよい。このテーブル15は、再生入力レプリカ生成モジュール19cにおいて利用してもよい。
内部レプリカ生成モジュール19bは、内部レプリカ13bを、多段階のレプリカとして生成してもよい。例えば、1次内部レプリカは入力データ11と統計予測から生成されてもよい。対象となる入力データは、入力データ(測定データ・問診を除く)11または入力レプリカ13aである。1次内部レプリカ生成では、1つ以上の入力データ11の相関は参考にしてもよい(弱い相関)。1次内部レプリカの生成では、未解決(Unknown)な要素を許す構造としてもよい。
2次内部レプリカは、入力データ相関/疾病から生成されるレプリカであってもよい。対象となる入力データは1次内部レプリカであり、入力データ相関と相関テーブル(強い相関:病気や疾病・病歴・遺伝・その他)から生成されてもよい。最適化エンジン24から指定されて生成パターンを変えてもよい。
3次内部レプリカは、問診によるフィルター/絞込みにより生成されるレプリカであってもよい。対象となる入力データは2次内部レプリカと問診データである。3次内部レプリカは、問診データから2次内部レプリカを再度チェックし、補正や修正・除外を実行してもよい。最適化エンジン24から指定されてこれらの処理を実行してもよい。
4次内部レプリカは、インフルエンザ・感染症の拡大への対応を考慮して生成されるレプリカであってもよい。対象となる入力データは3次内部レプリカと、後述するクラウドサービス(P−HARP)から指定される状況あるいは情報であってもよい。4次内部レプリカは、P−HARPからの指定により3次内部レプリカを再度チェックし、補正や修正・除外を実行する。最適化エンジン24から指定されてこれを実行してもよい。
5次内部レプリカ生成は、パンデミックへの対応を考慮して生成されてもよい。対象となる入力データは4次内部レプリカとP−HARPから指定される状況あるいは情報であってもよい。5次内部レプリカは、P−HARPからの指定により4次内部レプリカを再度チェックし、補正や修正・除外を実行する。最適化エンジン24から指定されてこれを実行してもよい。
2.4 再生成入力レプリカ
再生成入力レプリカ13cは、入出力相関テーブル15を逆方向に読み、内部レプリカ13bから入力データ11を推定したデータ(レプルカ)である。このレプリカ13cは、基本的に入力データ11と同じ種類のものが対象となるが、生成されるデータは異常が検出された内部エレメントに相関のあるデータだけであってもよい。AIエンジン21はこの再生入力レプリカ13cと実際の入力データ11を比較し、その評価関数から入力データ11に最も近い内部レプリカ13bをそのバリエーションの中から特定することで、内部の状態の予測・推論をすることを学習してもよい。
入力レプリカ13aが、健常者や疾患、あるいはその間の未病等の群をベースにした分布にしがたって生成されるのに対し、再生成入力レプリカ13cは、臓器の活性率をベースにしている点で異なる。つまり、再生成入力レプリカ13cは、活性率からそれらがとり得る検査値の範囲を確率モデルで生成したものであってもよい。
再生成入力レプリカ生成モジュール19cは、生成された内部レプリカ13bのバリエーションに対し、逆に入力データ11の変化範囲を推定して入力データ11を再構成(再生成入力レプリカの生成)するモジュールであってもよい。統計的な手法で生成された入力レプリカ13aとは別に内部レプリカ13bを生成して、この内部レプリカ13bから再度、入力レプリカ(再生成レプリカ)13cを生成することで、統計的にレプリカの可能性を広げるという操作と、広げた可能性からより絞り込んだ要因(状態)を示すレプリカを生成することが可能となり、AIエンジン21の推定精度を向上することができると考えられる。
内部レプリカ13bおよび再生成レプリカ13cを生成することは、診断対象のシステム内部の部品を直接的に確認可能とすることにつながり、検証確度を向上させることに貢献する。診断対象の人体の構成部品と病気や健康状態を特徴付けるデータ相関を使ったレプリカを生成することが可能となり、統計処理により生成された最初の入力レプリカ13aよりも、精密検査や病気が確定してから測定された病体モデルを反映したレプリカとすることが可能となり、AIエンジン21の学習効果を、疾病に絞込んで行うためには有効であると考えられる。
再生入力レプリカ生成モジュール19cは、入力レプリカ生成モジュール19aと共通する構成を含み、必要に応じて、機能強化を実施し、原則、モデルファイルの指定を変えるだけで、必要な再生入力レプリカ13cの生成を可能としてもよい。再生入力レプリカ13cを生成するための条件は、内部レプリカ13bと同様に、入出力制御テーブル15に記述されていてもよい。内部レプリカ13bとは逆方向に読み出すことで、これを利用してもよい。メタ・モデル記述ファイル14は入出力相関テーブル15と共に再生入力レプリカ13cの生成に必要な定義ファイルであってもよい。
再生入力レプリカ生成モジュール19cは、相関情報を、入出力相関テーブル15とメタ・モデル14から得て、多次的に入力レプリカを再生してもよい。内部レプリカ13bの生成とは逆方向に入出力相関テーブル15を読むことで内部レプリカ13bのバリエーションから生成された再生入力レプリカ13cは、検証エンジン23によって、測定データ11との差分値(分散値)を求め、その結果から人体内部パーツの活性状態・稼働状態・不良状態(不調・疲労・劣化)を特定してもよい。
1次レプリカ再生成は、統計予測による内部レプリカ13bから行われてもよい。検査データ間に相関がないケースの統計データに基づき、臓器の状態(活性率)に応じて、再生入力レプリカ13cを確率モデルで生成してもよい。2次レプリカ再生成は、入力データ相関/疾病から生成されてもよい。1次レプリカ再生成よりも複雑なケースとして、検査データ間に相関がある固有の疾病のケースを想定した統計データに基づき、臓器の状態(活性率)に応じて、再生入力レプリカを確率モデルで生成してもよい。3次レプリカ再生成は、問診によるフィルター/絞込みで行われてもよい。臓器の状態(活性率)に応じて、問診データを再生入力レプリカとして確率モデルで生成してもよい。4次レプリカ再生成は、インフルエンザ・感染症の拡大への対応として生成されてもよい。特定の疾病に対する2次レプリカ再生成に属するものであるが、緊急性を要する事態に迅速に対応することを優先して、単純化した相関データを作成し、対応してもよい。5次レプリカ再生成は、パンデミックへの対応として生成されてもよい。特定の疾病に対する2次レプリカ再生成に属するものであるが、緊急性と共にその重大性の見地から、その状況に最も適した相関データを、緊急性を持って作成し、対応してもよい。
3.システムのデータ構造
3.1 メタ・モデル記述ファイル
メタ・モデル記述ファイル14は、診断エンジン20が、様々なアプリケーション領域に利用・応用される事を容易にするために設けられてもよい。メタ・モデル(メタモデル)は診断エンジン20が診断の対象とするシステムを、ソフトウェアで利用可能なデータあるいはコンセプトの集合として記述したモデルである。診断エンジン20が診断の対象とするシステムは、多数の内部パーツで構成される複雑なシステムであってもよく、内部パースの1つ1つの稼働状態や好調・不調・不良・故障の状態があり、これらの1つがある限界を超えるとシステムとして異常・破綻となる様な系であってもよい。対象システムの検査データ(観測データ、測定データ・入力データ・補足データ)11から、内部パーツや構成部品の状態を推定して、これらの内部状態のバリエーションから検査データ11がどうあるのかを再推定して、実際の検査データ11と再推定した検査データの差分値(分散値)から予測・推論をするものである。支援エンジン20の応用の1つのターゲットは、ヘルスケアであり、診断対象のシステムは人体である。
3.2 入力データ
診断支援エンジン20への入力データは検査データ11であり、血液・尿・呼気・インナースキャン他などの測定データと問診データに分けられる。測定データは、一般検診で見られる様な項目(パラメータ)を含むデータと、より精密検査で得られる様な項目(パラメータ)を含むデータに分けてもよい。測定データは、負荷時の心拍数や正常値に戻る迄の時間、筋肉量や肥満度、インナースキャンで得られる情報を含んでいてもよい。問診で得られる情報(問診データ)は、家族の膵臓癌等の病歴や自分の病歴、免疫度を示す様な質問を、複数違った視点から問い合わせて得られたものであることが望ましい。測定データの測定環境は、個人によって変わることがあり、問診データがある程度、個人の測定環境の差を埋める役割を果たすことになってもよい。
さらに具体的には、ヘルスケアを対象とした検査データ11の種類としては、血液、尿、呼気・皮膚ガス、体温・内臓脂肪・皮下脂肪・筋肉量・体脂肪率・推定骨量、血圧・血流・心拍数・自律神経興奮度等の測定値と画像診断結果、microRNA・ncRNA・DNAの各情報と問診表等が含まれていてもよい。支援エンジン20において、過去のデータを検査データ11として参照する場合、上記のデータは、必ずしも全てが揃うという訳では無いが、いくつかのデータが揃っていれば推論が可能な様に機能させることが可能である。
検査データ11の最初の入力形式は、分類、一般名称と略称、数値、単位から構成されてもよい。検査データ11は、画像診断等のデータを含んでいてもよい。画像データの解析負担が大きいことから、検査データ11は、体の内部パーツと腫瘍・癌の位置、サイズ、進行状況を記述して代替させたものであってもよい。問診表に関しては、医療関係者が利用しているものを最初の問診として使用してもよい。検査データ11は、検証エンジン23から要請された追加テストの結果や、2〜3ヶ月後、6ヶ月後、1年後に再測定データ、経過観察の結果などを含んでいてもよい。検査データ11は、2週間などの単位での連測測定を数回実施した結果や、健康体へシフト(回復)しているのか病体(悪化)しているのかを判定する為の微分係数要素を含むものであってもよい。
3.3 出力データ
出力データ処理モジュール29は、出力データ12を、基本的に本プロジェクトに参加をしているメディカルドクターの視点で、各疾病と関係するマーカーとなる内部状態あるいは物質を中心に、各疾病と相関が取れるような形式で出力してもよい。出力データ12は、メタ・データの評価関数と相関関数を中心に纏めてもよい。入力データ11の蓄積量と時間軸での各入力項目の増減を単独またはグループで評価を行い、これらの傾向も加えた形で出力データ12との相関を取れるような形式で出力してもよい。診断対象のシステムに対し、注目すべきと判断あるいは推定される状態のトップ10〜30を優先して、メディカルドクターに対しアドバイスする形式で出力データ12をまとめてもよい。
出力処理モジュール29は、対象システムとしてあまり重大では無い領域である推定される状態についても、1〜3年先、5年先の心配事項・懸念事項はメッセージとして出力データ12に含ませておいてもよい。ヘルスケアの場合は、法律的な制限もあることからメディカルドクターのチェックは受けることが前提になるが、出力データ12の推論(予測)は診断支援という点で重要であり、ある条件での予測であること、確率的な要素を含んでいることを出力データ12に含ませておいてもよい。継続して診断支援エンジン20の出力を何回か利用しているユーザーに対しては、前回の出力データ12との差分をより意識したメッセージを出力データ12に含ませてもよい。
出力データ12は、複数の性質の情報が提供可能な様にしてもよい。この診断支援エンジン20の目的の1つは、健康度の予測・推定を行い個人や企業レベルで健康な状態を維持し易いツールを提供して健康予防や先制医療への貢献を行うことであってもよい。従来の画像診断装置、特に、1回〜2回の健康診断ではトレースに限界があり、個人が健康管理する場合に限界がある。診断支援エンジン20およびそれを含むシステム10を普及させることにより、疾病(腫瘍・癌・成人病・感染症・他)などへの注意喚起や未病から病体へと移行リスクがある場合の注意メッセージを早い段階で届けることを可能にできる。それにより、健康対策や維持を容易にして、個人的にも経済負担を少なくして、国全体が負担する医療費の低減を実現することが可能となる。診断支援エンジン20は、それぞれ専門性のあるエンジンであってもよく、その出力情報12も経験値に比例して具体的で詳細になる様な設計であってもよい。出力データ12には、人体内部パーツの活性状態・稼働状態・不良状態(不調・疲労・劣化)が確率と一緒に情報(健康度:安心・警告)として提供されてもよい。また、出力データ12には、これらに合わせて、今後健康増進、対策としてのアドバイス情報も参考程度に追加されてもよい。
出力処理モジュール29が生成する出力データ12のデータ構成は、音声出力・テキスト出力・画像出力であってもよい。診断対象システムの内部構成部品の活性化率・稼働率(貢献・機能)とその複数組み合わせのマトリックス(数値)とそれぞれの出力インデックス及び補助情報テーブル(追加)を連携させて、出力データ12を決定する様にしてもよい。
出力データ12は、健康度という情報を含んでもよい。健康度は、単純な一次元的な数値情報となるが、これは、消化器官・呼吸器官・咽喉・泌尿器・脳・心臓・循環系・血管・自律神経・骨・脊髄・その他に分類すれば、その経時変化、悪化・改善・急激・緩やかと考えると、ベクトル量というよりテンソル量として階層化した表現形式が有用である。
西洋医学的な分析・解析の観点からは、内部の部品間の相互作用とその時間経過と悪化・改良の情報が見える予測推定が出力データ12に含まれていてもよい。これらの情報は、個人ヘルスケアサービスの利用・有用度としても価値がある。例えば、内部の部品の活動状態が数値化されて、また、経時変化が測定される様になると、物理学的な加速や減速というイメージからも想像が容易となり、回復や病体の悪化がより明確になる。個人の注意を喚起したり、運動や食事療法の効果を確認して計画を立てたりと分かり易くなる。
メタ・モデルの記述ファイル14には、入力データ11と内部構成要素(部品)を関連付ける相関式が記述されてもよい。また、メタ・モデルの記述ファイル14には、最終的に外部で観測される健康度・未病度・病体度といった情報が記述されていてもよい。これは、一般的には、病気の種類や分類の推定根拠となる情報となる。出力データ12は、複数の入力データ(測定値)11間の相関性と内部構成要素間の活性度や不調度、これをリカバリーする簡単なヒントやガイドラインを含んでいてもよい。但し、出力データ12は、メディカルドクター(MD)の一般的なアドバイス的情報であり、病院や専門医に相談する様に進める記述を含んでいてもよい。
出力処理モジュール29は、出力データ12を、WEBサーバーを介して提供してもよい。WEBサーバーとAIサーバーは、TCP/IPを用いて通信を行ってもよい。使用するライブラリはPythonであればsocketライブラリであってもよい。WEBサーバーとの通信では、テキストまたはファイルを用いてもよい。WEBサーバー側への表示を指示する方法は、WEBサーバーと診断支援エンジン20側で同一のテーブルを保持し、診断支援エンジン20側がインデックス番号を指示することにより実現してもよい。WEBサーバーが表示する内容は、画像情報・音声情報・テキスト情報であってもよい。診断エンジン20は、複数のその他の診断支援エンジン(人工知能を含む)や、メディカルドクター(人間)と端末を介して通信を行うことにより、精度の高いディシジョンの為のコミュニケーションを行ってもよい。この時、AIプロトコルとAIゲートウェイを利用して通信してもよい。AIゲートウェイは、人間とのコミュニケーションを行う場合に必要となる。
診断支援エンジン20または出力処理モジュール29は、ユーザーの最大関心事を示すユーザーの検索・行動履歴をベースに、ユーザーが気になると想定される情報を出力データ12に含めて提供してもよい。また、出力処理モジュール29は、ユーザーが特定のヘルスケア・プラットフォームで特定のランクのメンバーになることで、通信KEYを受取り、クラウド経由のサービスを利用できる機能を含んでいてもよい。ユーザーは、自身の問診データがあれば、診断支援エンジン20から、自身の健康状態についてWEBサーバーを通して、推定結果を受け取ってもよい。また、診断支援エンジン20は、健康状態と同時に医療行為にならない程度の健康アドバイスも行ってもよい。
診断支援エンジン20または出力処理モジュール29は、複数のエンジン同士のやりとりやメディカルドクターとの通信を実現するためにAIプロトコル/AIゲートウェイを通してクラウド経由のサービスに接続する機能を含んでいてもよい。可能な限り対称性を維持するために、複数の診断支援エンジン20が、AIユニフォーム(AIシェル/AIスーツ)を実装して他のAIとのリンクを統一的に扱える様にしてもよい。
アプリケーション開発からは、出力データ12は、こういうライブラリで呼び出せますよと具体的な記述をAPIとして用意して提供(公開)されてもよい。その場合、ファイルまたはテキストベースのコミュニケーションでやりとりが可能であってもよい。WEBサーバーとつなぐ目的は複数であってもよい。その目的は、AIプロトコルに従って高精度ディシジョンの為のコミュニケーションを実現することを含んでいてもよい。その目的は、逆に、コミュニケーションをする仕掛けを通して、ユーザーの検索などを元に必要な情報を推定して、ユーザーが気にする情報を段階的に提供することを含んでいてもよい。
特定のサービス会社のヘルスケア・プラットフォームのメンバーになれば、クラウド経由のサービスの世界に入れるようにしてもよい。クラウド経由で自分の問診データを入れれば、ある程度の予測がクラウド経由で診断支援エンジン20から取得できるようにしてもよい。WEBサーバーで限界がある場合は、診断支援エンジン20で扱うプラットフォーム上で、クラウドを介してユーザーと対話型で進めることができるエンジンであってもよい。クラウドサービスの入り口にたどり着くためのの風景・ナビゲーション、必要な情報をガイドライン的に示す機能を診断支援エンジン20が備えていてもよい。
クラウドサービスなどで提供される問診票には、問診に答えるためのアドバイスが実装されていてもよい。ユーザーの健康状態マップ的なものがわかる一連のQ&Aや、問診に対する回答に対して複数のエンジン同士がやりとりできる機構を実装してもよく、問診に対する回答の解析を含めて、メディカルドクターと複数の診断支援エンジン20がクラウドなどを介してやりとりをして予測をするシステムは有効である。
3.3.1 デジタルアバタ
出力データ12のはアバタ処理モジュール291が提供するデジタルアバタ(DigitalAvatar)であってもよい。デジタルアバタは一般のクラウド上でアクセスできてもよいが、特定のサービス会社が提供する限られたクラウドサービス、例えば、P−HARPのようなセキュリティの確保が容易なプラットフォームを介してアクセスできるようにしてもよい。デジタルアバタは、RW(RealWorld、実空間)一人に対して、複数設定が可能であってもよい。また、その複数のデジタルアバタは、完全に同一のヘルスケア特性であっても良いし、その可能な複数バリエーションであっても良い。VR(仮想現実)では、複数のVR空間が存在して、1つのVR空間には1つのアバタを残して、同一次元の別のVRのサイバー空間へ移動するようにしてもよい。移動を実行する場合は、元のVR空間とは切り離されてもよく、最大移動回数が規定されてもよい。自分の制御しているデジタルアバタが、1つ存在してアクティベートされるが、これ以外は、全て影となり、あるルールに従って自動更新されてもよい。RWからVRへのアクセス(サイバー空間)は、原則、1対1、または1対Nに対して実行されてもよい。N対Mを可能としてもよい。例えば、セキュリティ上の問題からシステム運用側でその必要がある場合にこれを実行してもよい。
VR空間は、(1)DNA空間(血縁)、(2)地理空間(国・都市・地方)、(3)Working空間(職場・学校・アルバイト)、(4)ファミリー空間(親族)、(5)運動空間(歩行、ランニング、スポーツ9、(6)趣味空間 (音楽、読書、絵画、芸術、ヨガ、瞑想、ゲーム)、(7)イベント(飲み会・コンペ・デート・引越し・卒業・転職・転勤・退職・旅行・休暇・結婚・出産・葬儀・他)、(8)個体特性空間(年齢・性別・体重・身長・胸囲・ウェスト・座高・内臓脂肪・筋肉量・その他)、(9)ライフ/環境空間(食事・仕事・勉強・運動・睡眠・趣味・会話・瞑想)などに分類されてもよい。限られた空間から他のサイバー空間に設定を行い拡大してもよい。VR内では、自分の関心が他の空間へ移動しても、自動的に自分の基礎数値(健康度・疲労度・ストレス度・ヘルスケア数値、過去データ)は、更新されて継承されてもよい。
デジタルアバタとVRは、RWに存在する個人が、様々な環境や状況に応じてどう変化していくかをシミュレートするものであり、RWの自分のQoL(クオリティーオブライフ)を大幅に向上するゲームとも見ることも可能である。この中で、健康度・疲労度・ストレス・心的状態と充実感が、今後、活性化してより健康な状態へ移行するのか、さらに悪化するのか、などの色々な角度からシミュレータを通して、その原因や今後の健康度を上げる1つの指針を得るゲームとして提供することも可能である。
RWとVRとの一致性や精度を求める場合は、スーパーバイザのアドバイスやガイドラインに従って、デジタルアバタと自分の一致性を高める測定や問診などを定期的に受けてもよい。VRの中には、スポンサー企業が多くいて、健康度を向上する提案を行うようにしてもよい。VRだけでは無く、RWで、同様のシステムを構築してもよい。
デジタルアバタとして情報を提供する際のセキュリティ(プロテクション)に必要なキーは、デジタルアバタとスーパーバイザと呼ばれるVRの管理者とこれから派遣されるKey−Makerにより発行されてもよい。Key−Makerは、時間と場所、デジタルアバタのIDに対して、キーを発行して、これがセキュリティとして利用されるが、スーパーバイザから、定期的にキーの変更が要求されてもよい。1つのRWの人間(参加者)が、複数のVRの違った世界へとアバタとして写像されてマッピングされると、それぞれの視点でのビッグデータ比較と推定精度を上げる事が期待されてもよい。自分の近親者(血縁者)に、もし膵臓癌の罹患者が1人いれば、膵臓癌になるリスクは普通の人に比較して高くなるというようなケースにおいては、例えば、サイバー空間の(4)ファミリー空間では、この様な相関情報からの推定やアドバイスはより強い形で表現されてもよい。今後、検証を要する相関やその他の仮説は、1つの条件として推論エンジン22に反映されてもよい。AIエンジン21は、実測データを含む入力データ11とレプリカ13により学習して成長するため、パンデミックや感染症に対する予測は、それらが社会的に問題とならない限り、必要以上に強く反映されなくてもよい。
クラウドサービスでデジタルアバタにより出力データ12を提供する場合、デジタルアバタを最初にエントリーする段階でセキュリティ確認が実行される。RWからVRへとダイブする場合に、AR(AugmentedReality)と呼ばれる手法でスイッチしてもよい。そのダイブは、本人の好む方法で実行されてもよい。RWからのダイブは、本人と合意された方法でのダイブとなり、セキュリティ・サイバー・エージェントがこれを監視してもよい。本人だけが知り得る情報や場所(存在)、バイオ認証その他を使ったセキュリティによる保護をおこなってもよい。RWでも本人と分からない様に偽装したり変装したりする手法が取られるが、複数のデジタルアバタの活動するVRまたはサイバー空間では、本人が所有するヘルスケア情報を継承しながら、外側から観測可能な状態については簡単に変更可能な形で、追跡が難しい環境を提供することができる。デジタルアバタを通してRWへのアクセスは、原則として本人だけが行うようにできるが、必要な場合は、サイバー・エージェントを通してホットラインをオープンして実現するようにしてもよい。VRのサイバー空間に存在する各種アイテムは、RWにも存在するので、その効果を確認する場合は、RWでの利用を経験して、その結果を自分のデジタルアバタを通してVRサイバー空間へと持ち込んでもよい。
3.4 入出力相関テーブル記述ファイル
入出力相関テーブル記述ファイル(相関情報DB、相関情報)15は、相関処理モジュール27と推論エンジン22で使用する情報であり、ウェブ上で確認可能な相関に信頼性のあるものとメディカルドクター(専門医や医療系研究者)が、確認して正しいと思われる情報をベースにして生成されたものである。
入出力相関テーブル記述ファイル15は、入力データ11の種類と数値を分類して、内部状態(各パーツの稼働状態及び活性化率など)の相関表を作成して、結果的に、この膨大な組み合わせから出力データ順位と確度(確率%)を決定する。逆に、内部状態(バリエーション)が分かれば、入力データ11が推定可能な構造を持つことを意味する。現在の西洋医学における、内部構成部品の不調・不良・破損・異能不全が、病気に繋がっているという考え方から処方箋をプランするという発想が反映されていてもよい。現在、使用されている医療機器・装置の多くがこの考え方を支持する様に開発されている。従って、入出力相関テーブル記述ファイル15は、この様な環境を想定して、それを可能な限り反映させる様な構成・スタイルとするのが良い。相関情報15は、現在の疾病や病気・感染症等の上位10〜20に関しては、相関性を示す判断用インデックスを記述してもよい。
4. 診断エンジンの各モジュールの詳細
4.1 入力処理モジュール
入力処理モジュール25は、推論エンジン22およびAIエンジン21に対し共通のデータフォーマットとなる様に検査データ11を整えるとともに、検査データ11を予め定められたルールにしたがって前処理する機能を含んでいてもよい。本例の入力処理モジュール25は、入力データ処理モジュール250と、プリプロセッシングモジュール26と、検査データ11に含まれる各パラメータ同士の相関を示すマップを生成する相関処理モジュール27とを含む。
4.1.1 入力データ処理モジュール
入力データ処理モジュール250は、推論エンジン22およびAIエンジン21に対し共通のデータフォーマットとなる様に入力データ11のアライメントを実現する機能を含んでもよい。入力データ11を出来るだけ統一したフォーマットに変換あるいは整理し、プリプロセッシング処理を通して、血液データ・尿データ・インナースキャンデータ・皮膚ガス・呼気・問診データを統一的に処理可能なフォーマットへと変換を行ってもよい。また、相関処理を通して、この中のデータ、例えばクレアチニンが、腎機能の低下や腎不全へ繋がる様な数値のどの段階にあるのかをマーキング(ラベリング)してもよい。糖尿病であれば、グルコース値・HbA1Cが参考として良く使用されるので、これらの数値レベルからその進み具合が推定可能となる。
入力データ11に問診データが含まれる場合は、曖昧さが残るので複数の質問から数値へと変換する処理を実行してもよい。これらは、予め記述ファイルで指示された様に数値データへと変換を実行してもよい。乳癌の場合は、その***形状やボディライン、ある程度の容量(サイズ)を推定可能な様に問診を構成する必要がある。特に、システム内部構成部品の活性度や機能貢献を推定する場合、内部レプリカ13bによっては入力データ中の測定データから推定できない場合もあり、これらは、全て問診データを複数用意して推定する様にしてもよい。膵臓疾患の場合は、家族や親族に膵臓癌の患者がいるという様な情報があれば、その確率・危険率が上がるように入力データ11を生成してもよい。
支援エンジン20では、処理の関係上、入力データ11を、できる限り統一的に扱うために、数値データとして扱いたい。実測データには、例えば、血液データであれば数値になっているが、問診データの場合は、あいまい性が存在しており、数値データへと変換する必要がある。例えば、問診票に、”とてもあてはまる”、”あてはまる”、”どちらともいえない”、”あてはまらない”、”まったくあてはまらない”というものがあれば、”とてもあてはまる”を4、”あてはまる”を3、”どちらともいえない”を2、”あてはまらない”を1、”まったくあてはまらない”を0と変換することができる。ただし、問診データの場合、その数値が問診票の回答を数値化したことがわかるようなラベルを用いることが望ましい。
入力データ処理モジュール250は、その他の、入力データ11とシステムの構成要素(ex.体の内部構成要素)との対応関係を明確にしておく処理を実施してもよい。例えば、支援エンジン20は、各病気の専門AIエンジン21を学習により生成して活用する支援システムであってもよい。入力処理モジュール25は、専門のAIエンジン21の推論結果と、その推論結果の検証過程などで、エンジン20が外側の専門医との間で行う情報交換を、検査データ11として含める入力処理を含んでいてもよい。複数で違った角度からの推論に役立つ付加情報を検査データ11に入れることで、診断処理対象システムの全体については知っているとともに、さらに専門領域では詳細な知識を持っている支援エンジン20を提供できる。
入力データ処理モジュール250は、入力データ11に含まれる各パラメータの値に相関がある場合は、相関を表すテーブルを作成してもよい。入力データ処理モジュール25は、入力データ11に含まれる各パラメータと、対象システムの構成要素の対応関係を表すテーブルの作成をおこなってもよい。
4.1.2 プリプロセッシングモジュール
プリプロセッシングモジュール(変換・統計・他)26は、相関処理モジュール27に対して、性質の違っている入力データ11を変換して、共通化して推論エンジン22・検証エンジン23・最適化エンジン24、AIエンジン21が扱える様にする機能を含んでもよい。例えば、腎機能の障害の1つのマーカー物質としてクレアチニンという物質が存在するが、この物質は、年齢や性別により数値と腎機能の障害度に違いがあることが分かっている。これは、変換を行って正規化処理をする様にしないと単純に数値間の比較が意味をなさない。この様な医学的視点からの測定データの前処理をしないと単純に比較が困難となる。血糖値に関しても空腹時なのか食事後どの程度の時間が経過しているのかによって、インシュリンの活性度を推定するのに全く違った状況となる。これは、通常は、問診と一緒に判断してある程度数値の意味を比較可能な様に変換・正規化する必要がある。
4.1.3 相関処理モジュール
相関処理モジュール27は、実際に、入力データ11に含まれる各パラメータの数値の変換を行って正規化処理してもよく、数値間の比較から意味を掴めるようにマップ化してもよい。図2に、統計的な手法を用いて入力データ11を相関処理して推論エンジン22およびAIエンジン21に提供する相関処理モジュールの一例を示している。
図3に、相関処理に用いられるヒートマップ130の一例を示している。また、図4に、ヒートマップ130の一部を拡大して示している。このヒートマップ130は、正常状態(超健康体)のヒートマップ131の一例である。ヒートマップ(静的マトリクス)130は、検査対象の患者が含まれる人種毎、性別毎、特定の地域毎の人々、あるいは人類全体といった多数の人間(多数の検査対象のシステム)を母集団とする検査結果の統計データから作成される相関図の集合体である。1つ(1種類)のヒートマップ130は、母集団に含まれる人間が経る可能性がある、いくつかの状況・状態の1つを代表し、複数の状態に対して、複数のヒートマップ130が用意される。正常状態のヒートマップ131は、患者が属する母集団の中で、健康診断などで正常と判断された患者の検査結果の統計データの相関を解析した結果の一例である。
ヒートマップ130は、患者が属するする母集団を形成する複数の患者の各個人の各検査項目(各パラメータ)の検査結果(測定点)が、各検査項目間の相関を示すようにX軸とY軸とに配置されており、各検査項目間の相関を示す多数の散布図139の集合体(マトリクス)である。なお、検査データ(入力データ)11の項目(パラメータ)間の相関の一例は、散布図を用いた相関であり、多数の患者の検査データのうち、異なる2つの検査項目(パラメータ)の数値をX座標およびY座標とした点をプロットした散布図における相関である。異なる複数の検査項目の数値を多次元で示した相関であってもよい。
検査内容としては、血液検査、尿検査、呼気・皮膚ガス測定、体温・内臓脂肪・皮下脂肪・筋肉量・体脂肪率・推定骨量・血圧・血流・心拍数・自律神経興奮度等の測定値と、画像診断結果と、microRNA・ncRNA・DNA等とも共に問診票なども、検査に含まれ、これらの検査により得られる測定値が散布図139の対象となる。例えば、血液検査の測定項目の一例は、TG(中性脂肪)、HDL(HRLコレステロール)、LDL(LDLコレステロール)、FBS(グルコース(空腹時))、HbA1c(ヘモグロビンA1c)、AST(アスパラギン酸アミノトランスフェラーゼ)、ALT(アラニンアミノトランスフェラーゼ)、gGT(γ-グルタミールトランスファラーゼ)、ALP(アルカリホスファターゼ)、LD(乳酸脱水素酵素)、TP(総たんぱく)、TC(総コレステロール)、BUN(尿素窒素)、Cr(クレアチニン)、eGFR(推算糸球体濾過量)、UA(尿酸)、RBC(赤血球数)、Hb(ヘモグロビン)、Ht(ヘマトクリット)、MCV(平均赤血球容積)、MCH(平均赤血球色素量)、MCHC(平均赤血球色素濃度)が挙げられる。
ヒートマップ130は静的マトリクスの一例であり、例えば、超健康体と判断された患者についての、上記の検査項目と、他の項目、例えば、Weist(腹囲)、BMI、BP_H(最高血圧)、BP_L(最低血圧)などの身体あるいは心肺検査項目とを含む多数の検査項目間の多数の散布図139が、画像認識しやすいように2次元に配置された例である。ヒートマップ130においては、検査項目間の相関を示すように、全ての数値を点として並べたものが左下の三角形で、その相関を図式と数値で表現したものが右上の三角形となる。殆ど相関の見られないものは、小さな数値で+正を示してあり、−数値は負の相関を示している。大きな相関があるものは大きな数値で表現している。
図5に、ヒートマップ130の異なる例を示している。図5に示すヒートマップ130は、準正常状態(未病)のヒートマップ132の一例であり、患者が属する母集団の中で、健康診断などで正常とも非正常とも判断されなかった多数の患者の検査結果の統計データの相関を解析した結果の一例である。未病とは、測定データ・入力データ群の中で、超健康体と病体を除いたものを指す。超健康体とは、臨床医や人間ドックで全ての項目(測定データ・入力データ・問診)で正常値を示している患者を示し、病体とは、医者から病気と判断された患者を示す。通常、もっとも多数の患者が属する可能性がある状態であり、未病は、健康体に近い状態から、病体に近い状態を複数の段階的な状態で定義し、それぞれについてヒートマップを用意することも可能である。
図6に、ヒートマップ130のさらに異なる例を示している。図6に示すヒートマップ130は、非正常状態(病体)のヒートマップ133の一例であり、患者が属する母集団の中で、医師に特定の病気であると判断された多数の患者の検査結果の統計データの相関を解析した結果の一例である。病体のヒートマップ133は、特定の疾病(疾患)について、その疾病の進行段階毎に、用意することができる。
図7に、超健康体のヒートマップ131、未病のヒートマップ132および病体のヒートマップ133の各状態のヒートマップを並べて配置している。現状、各状態に含まれる患者の数に差があるため、各ヒートマップに含まれる散布図の測定値の数にばらつきがあり、各状態を示すヒートマップとしては完全ではない。しかしながら、各状態で、強い相関が認められる検査項目に増減があり、各状態で、多数の検査項目間の相関をまとめたヒートマップ(静的マトリクス)130が異なることがわかる。したがって、これらのヒートマップ130を、各患者の検査データ11に含まれる多数の検査項目間の関係と、これらのヒートマップ130とを比較することにより、各患者の検査時における状態を推定することができる。
なお、検査項目間の関係の一例は、2次元の関係のマトリクスであり、多数の検査項目の数値のうち、異なる2つの検査項目の数値をX座標およびY座標としたプロットした図を、ヒートマップに対応して2次元に配置したものである。多数の検査項目の数値を、多数の検査項目のそれぞれを座標とする多次元の位置(関係)で示してもよい。
超健康体から病体まで、以下のような各状態のヒートマップ(静的マトリクス)130を用意することが可能である。
レベル0:超健康体
健康体の中で、現在知られている疾患リスクの兆候が全く無い人を指す。所謂、超健康体、スーパーノーマルと言われる人で、人間ドック受診者の数パーセントしかいないという統計がある。
レベル1:未病の始まり/健康体予備軍
超健康体と比較して、標準偏差値が45〜50の範囲にあって、疾患を示すマーカー物質や入力値の組み合わせが1つ以上検出されている場合を示す。但し、レベル2には該当しない場合をレベル1とする。
レベル2:未病の進行開始/非健康状態
標準偏差値が40〜50の範囲にあり、疾患を示すマーカー物質や入力値の組み合わせが、2つ以上検出されている場合。レベル1・3では無い。
レベル3:未病の代表的位置/疾患リスクの顕在化
標準偏差値が35〜45の範囲にあり、疾患を示すマーカー物質や入力値の組み合わせが、3つ以上検出されている場合。レベル4では無い。
レベル4:未病の要注意状態/疾患リスク注意
標準偏差値が30〜40の範囲にあり、疾患を示すマーカー物質や入力値の組み合わせが、4つ以上検出されている場合。可能であれば、一度、医療機関で精密検査を受けた方が良いかも知れません。レベル5では、無い。
レベル5:未病から疾患への明確な移行期/疾患リスク警告
標準偏差値20〜35の範囲にあり、疾患を示すマーカー物質や入力値の組み合わせが、5つ以上検出されている場合。特定の疾患または合併症だと医療機関で指摘される危険領域に進んでいる可能性がある。急いで、精密検査を受けた方が良い領域に入っている。
図8に、ヒートマップ130に含まれる各散布図139の相関を確率分布でも示した例を示している。各散布図139に、統計的な確率(標準偏差)の異なる領域を、等高線を用いて示している。本願の発明者により、散布図139にまとめられた2つの検査項目の検査データの相関が1つの正規分布で表現できるケースと、複数の正規分布の混合として表現することが必要なケースとが見出されている。相関が複数の正規分布の混合として示される場合は、それらの正規分布が1対1で混合されていてもよく、異なる比で混合されていてもよい。検査項目間の相関を確率分布で表現することにより、後述するように、各患者の検査項目間の関係を画像化するフィルターとしてヒートマップ130を使用することができる。また、統計データの数が少ないときにレプリカから統計的に意味がある数のサンプルを仮想的に生成して、ヒートマップ130を生成したり、ヒートマップ130の散布図139の一部あるいは全部を補充してもよい。
図9に、ベクトル付きヒートマップ140の一例を示している。このベクトル付きヒートマップ(ベクトルマップ)140は、動的マトリクスの一例であり、病体(非正常)のヒートマップ143に含まれる1つのベクトル付き散布図149を示している。図9に示した散布図149は、検査項目のうちの、総コレステロール値(TC)と、低比重リボ蛋白質(ND LDL)との相関を示したものである。動的マトリクスの一例であるベクトルマップ140は、各状態のヒートマップ(静的マトリクス)130の間の多数の相関の変位を含み、患者が含まれる母集団の経時的な状態の変化を反映したものである。本例のベクトルマップ140は、相関の変位を、散布図149に、方向と量とを矢印(ベクトル)で示したものである。
図10に、各状態のヒートマップ130の総コレステロール値(TC)と低比重リボ蛋白質(ND LDL)と相関(散布図)139を示している。図10(a)は超健康体、図10(b)は未病、図10(c)は病体の散布図139を示す。図11(a)に、総コレステロール値(TC)の測定値の各状態における分布を示し、図11(b)に、低比重リボ蛋白質(ND LDL)の測定値の各状態における分布を示している。図11(a)および(b)に示すように、超健康体の分布135は低いピークのカーブを示し、病体の分布137は高いピークのカーブを示し、未病の分布136はそれらの間になる。したがって、図10(a)〜(c)に示すように、総コレステロール値(TC)と低比重リボ蛋白質(ND LDL)と相関は、超健康体のヒートマップ131の散布図139の相関がほとんど見られない状態から、未病のヒートマップ132の散布図139の相関が表れる状態を経て、病体のヒートマップ133の散布図139の高い相関がみられる状態に、散布図のプロットが移動する。
このため、前回の検査結果が得られた第1の時点から時間が経過した次回の検査結果の第2の時点における多数の検査項目間の相関をベクトルマップ140として捉えることにより、患者の状態を推定することができる。したがって、ヒートマップ130から推定され状態を、ベクトルマップ140から推定される状態と比較することにより、動的に推移する状態を含めて推定できる。このため、ヒートマップ130およびベクトルマップ140を用いた推定を行うことにより、診断対象のシステムの内部状態を、より精度の高い確率で、時間経過を含めて推定できる。
図12に、ヒートマップ130に含まれる個別マトリクス170の一例を示している。この個別マトリクス170は、個別マトリクス170に含まれる検査項目間の関係として、中性脂肪(TG)とHRLコレステロール(HDL)との関係を示している。例として、3人の患者の関係をプロットしており、患者Aの測定値(関係)は相関が低い(確率が低い)位置であるので面積の小さなドット171で表示される。一方、患者Cの測定値は、相関の中心179に近い、相関が高い(確率が高い)位置であるので面積の大きなドット173で表示される。患者Bの測定値は、相関が中間(確率が中間)の位置であるので、面積が中間のドット172で表示される。したがって、例えば、患者Aの第1回目の検査結果は、各状態のヒートマップ130をフィルターとして、位置が共通し、面積が異なる多数のドットからなる画像を含む複数の個別マトリクス170に変換される。患者が異なり、同一の患者でも検査結果が異なれば、多数のドットの位置が異なり、各ドットの面積も異なる。したがって、各患者の各検査で、各状態で異なる画像を備えた個別マトリクス170が生成される。AIエンジン21の学習モジュール210は、個別マトリクス170に含まれる画像を、画像認識処理することにより、患者の検査結果に対応する状態を推定することを学習できる。学習が進むと、AIエンジン21は、過去の多数の患者の同様の画像と比較して、患者の現在の状態の推定することができる。
各個人の測定データは、図12に示すように、ヒートマップ(未病レベル3)に対して、いくつか違った等高線上(似た傾向を示す人達の位置と重ねた場所を示す)にある。これを最も多い中心(2軸の平均値:標準偏差値 50:50)からのユークリッド距離に比例させて、そのドットの大きさや色(輝度)をフィルタリングして表示する様にしてもよい。AIエンジン21は、その代表的な中心に近ければ、大きなサイズのドットとして認識し、そこから離れていれば、小さなサイズのドットとして認識する。XY軸(2軸)という事で、それぞれ違った大きさの2つドットでの表現を、特徴を示すパターンとして最終的には認識されようにしているが、ドットの表現は、上述したように、色や輝度であってもよい。他の表現としては、例えば、(sizeTG, sizeHDL)としてベクトル量として扱う等が考えられる。その場合でも、中心からのユークリッド距離に合わせて、ドットのサイズを変えることで、明確にその相関の中でのポジションを示すことで、強調処理を施してAIエンジン21の判定が容易になる様に準備してもよい。ベクトルマップ140については、ベクトルが、ベクトルマップの密度の低い個所(レアケース)に位置する場合はベクトル量を小さくし、密度の高い個所に位置する場合はベクトル量を大きくして強調してもよい。多数のベクトルまたはドットの位置が異なり、各ベクトルの大きさも異なるベクトルマップ140を画像としてAIエンジン21が学習し、動的な状態の推移を推定するようにしてもよい。
図2に戻って、相関処理モジュール27は、モジュール(ブロック)275aにおいて、入力される検査データ11に含まれる計測した項目についての閾値の判定を行う。具体的には、個別のユーザに対して、検査データ11の各項目が外部定義ファイル271a〜271cに指定している基準値及びカットオフ値を超えているのかどうかを判定する。超健康体の分散・平均を保持するDB271bは、これまで集めたユーザ/被験者のデータ及び外部のDBにあるデータを用いて超健康体に関しての各データについての統計指標が保持される。超健康体のデータは、健康体/未病レベル1を詳細に分析して、疾患リスクの予測推定を行う場合に重要となる。それは、病体データや未病のグループのデータを使う場合に比べて、より正確で精度の高い予想を可能とするからである。
未病の分散・平均を保持するDB271aは、これまで集めたユーザ/被験者のデータ及び外部のDBにあるデータを用いて未病のグループに関しての各データについての統計指標が保持される。未病は、未病レベル1〜未病レベル5と分散も広くその目的に応じてグループを変える事も想定した疾患リスクや健康度の予測推定を進める様に準備する。病体の分散・平均を保持するDB271cは、これまで集めたユーザ/被験者のデータ及び外部のDBにあるデータを用いて病体に関しての各データについての統計指標が保持される。外部定義ファイルのデータ更新期限指示ファイル272を含んでいてもよい。
さらに、モジュール275bにおいて、計測した項目の統計指標のクラスタリングを行う。個別のユーザに対して各入力データの閾値の判定結果で、超健康体・未病・病体のクラスタリングを行う。超健康体は基準値を外れた項目が一つ以下である。未病は超健康体と病体の間にある。未病レベル1〜未病レベル5、病体はカットオフ/異常値を超える項目が5つ以上であると定義する。次に、モジュール275cにおいて、ユーザのデータを用いた統計指標の計算を行う。外部のDBに保持されている複数のユーザの各データ(血液データ、尿データ、バイタルデータ、自律神経レベル、問診、その他の検査データ)について、クラスタリング対象ごとに各項目について正規分布と対数分布のどちらの確率モデルを用いるかを外部定義ファイルで指定して統計指標の計算を行い、それぞれを超健康体の分散・平均を保持するDB271a、未病の分散・平均を保持するDB271b、病体の分散・平均を保持するDB271cとして保存する。
さらに、モジュール273において、疲労・睡眠・運動/ストレスについて判定する。未病レベル1〜5で、疲労・睡眠・運動・ストレスは、免疫活性に非常に高い相関がある事が知られていることから、被験者/ユーザのデータから統計指標を計算して、更に、疲労・睡眠・運動・ストレスの項目から、免疫系の活性度や今後の疾患リスクとそのパス、健康へと回復する可能性を計算する。
また、モジュール274において、免疫系・その他/生活パターンについて判定する。免疫レベルをそれぞれ単独で、疲労・睡眠・運動・ストレスから推定する事とは別に、生活パターンを解析・分析する事で、疾患リスク及び疾患へとシフト/遷移する時間や時期、或いは、健康体へと回復する可能性を予測・推定する。
上記のプロセスと並列に、モジュール276aにおいて、ヒートマップの位置相関と特定する。未病グループのデータを使って、ユーザ/被験者のデータが、現在どの位置に相当するかを特定する。また、相関処理としては、今後、疾患パスのどの方向へシフト/遷移する可能性があるのかを予測推定する。ただし、疾患リスクがどの程度の期間でという時間的な分析・解析はしない。ベクトルマップでこれは実行する。次にモジュール276bにおいて、ヒートマップから疾患パス候補をアップする。未病グループのデータを使って、ユーザ/被験者のデータが、現在どの位置に相当するかを特定して、将来の疾患リスクの可能性・危険性の候補を上げる。さらに、モジュール276cにおいて、 ヒートマップから疾患パスとリスクを判断する。リストアップされた疾患パスの候補について、そのリスクの度合いをいくつかの疾患に絞った解析と予測推定を実行する。
さらに、上記のプロセスと並列に、モジュール277aにおいて、ベクトルマップの位置相関と特定する。未病グループのデータを使って、ユーザ/被験者のデータが、現在どの位置に相当するかを特定する。また、相関処理としては、今後、疾患パスのどの方向へシフト/遷移する危険性があるのかを予測推定する。続いて、モジュール277bにおいて、ベクトルマップから疾患移行予測情報を生成する。ベクトルマップには、免疫レベルの情報が一部内在していることもあり、ユーザ/被験者のデータから、今後の疾患移行予測を推定することが可能となる。さらに、モジュール277cにおいて、ベクトルマップから疾患リスク予測順位を生成する。ヒートマップ情報とベクトルマップからは、疾患リスクへのシフト/遷移を予測して、過去のユーザ/被験者のデータがあれば、疾患リスクは、前段の疾患移行時間と合わせてそのリスク順位を推定する。
これらのプロセスの後、モジュール278において、対推論エンジン/対AIエンジン出力処理を行う。推論エンジン22への出力は、対象となるユーザ/被験者のポジションを、統計処理をベースにして特定するのと免疫レベル(活性度)をベースにして、疾患リスクや健康回復の数値的な情報を準備してもよい。ヒートマップやベクトルマップの生成と比較から疾患リスクとして遷移/シフトする時間も推定する様に準備してもよい。AIエンジン21への出力は、ヒートマップとベクトルマップが中心となり、免疫レベルの情報は、ベクトルマップの中に取り込まれていることにしてもよい。
4.2 AIエンジン
人工知能、“AI”は、従来の手続き型プログラミング言語では難しかったアプリケーション領域に応用可能な事例が多く見られる様になり、その成果もあって最近注目される様になった。現在期待されている”AI”の適用アプリケーション領域は、言語処理・画像処理・音声処理・制御技術・最適化と推論の5つで付加価値の高い実装が公開される様になった。AIは、現在、ある程度のレベルには達していて、今後、高性能化へと向かうと期待されている。AIエンジン21には、現在および今後開発されるいずれのタイプの人工知能であっても適用できる。現在開発されている主なAIエンジンの種類とその特徴は以下の通りである。
SVMは教師データ間のマージンが最大になる場所で分類する。般化能力が高いが主成分分析を用いた次元削減により特徴量を設計してもよい。決定木は教師データを分割するときに最も平均情報量が大きくなる特徴量を用いて分類する。入力と出力の因果関係がわかりやすいが、主成分分析を用いた次元削減により特徴量の設計をしてもよい。K近傍分類器は入力データの近くにあるK個の教師データラベルの多数決で分類する。新しい教師データを分類器に適応させるのが容易であるが、入力データを分類する計算量が、教師データが増えるごとに増加する傾向がある。階層型ニューラルネットワークは、教師データから、特徴量などをバックプロパゲーションで学習して分類する。教師データから、バックプロパゲーションを用いて特徴量を自動で学習するが、入力層に近づくほど、勾配が消失して学習が難しくなる傾向がある。深層学習は、教師データから、特徴量などを自己復号化器で学習して分類する。教師データから、自己復号化器を用いて特徴量を自動で学習するが、入力と出力の因果関係の説明は特に表れない。
強化学習(例:Q−Learning)は、ある状態におけるエージェントの行動に対して報酬を与えることで最適な行動を学習する。報酬の与え方によって、エージェントに学習させる行動を変更可能であり、報酬の設計によって最適な行動を学習させることができる。教師なし学習(例:K−means)は、構造が不明なデータに対しクラスタリングを実施する。教師データがない状況でデータ間の類似度に基づいてクラスタリング可能であり、データ群がクラスタリングされた理由は、必要であれば人間が考えてもよい。
診断支援エンジン20のAIエンジン21に適しているAIの1つは深層学習である。深層学習を用いた手法は、画像認識の分野において、非常に有用な結果を残している。この性能を診断支援エンジン20に応用することが望ましく、精度の高いAIエンジン21を提供できる。AIエンジン21は、例えば2〜3週間単位での継続的測定を実施して健康度解析を進める。2〜3ヶ月または6ヶ月、1年間の継続的測定と健康度の解析で予測推論の確度が明確になる。診断精度向上のポイントは、最適化エンジン24の自己予測精度向上(メタ・モデル記述ファイルに初期条件として与えられた相関から、差分データの相関を調べてヒューリステックに予測推論精度を上げる)、1〜数回の追試(追加の精密測定と問診)、2〜3週間毎に実行して経時変化をトレースして検証を行う3つとなる。また、性能指標としては、入力データ量に対するスループット及びターンアラウンドタイムを重視した設計としてもよい。特に、ビッグデータ解析として、最終的に10〜100万件のトランザクションを数時間〜数日以内で処理を保証可能なシステム構成として、1つの入力データの処理が、数分程度で完了する程度の能力を備えていてもよい。AIエンジン21の予測・推定の精度は、医者が行う場合と比較して、誤差が10%未満で重大な見落としが無いレベルにすることが可能であり、さらに、95%程度の信頼性を認めてもらえるような予測推論を実現することが可能である。
図13に、支援エンジン20におけるAIエンジン21の学習イメージを示している。支援エンジン20は、推論エンジン22およびAIエンジン21が検査データ11に基づいて診断対象のシステムの内部状態を推定する基本システム40と、AIエンジン21の学習システム30とを含んでもよい。学習システム30は、ユーザデータ(実データ)である検査データ(入力データ)11を教師データ(学習データ)35とするパスと、レプリカ生成モジュール(レプリカジェネレータ)19により生成されるレプリカ13を学習データ35とするパスとを含む。レプリカジェネレータ19は、最適化エンジン24の指示にしたがい、実データである検査データ11では不足する量および範囲のレプリカ13を生成してAIエンジン21の学習を促進させる。すなわち、この支援エンジン20の制御方法は、検証モジュール23により検証された、AIエンジン21により推定された状態の精度に基づいて、レプリカ生成モジュール19に対しレプリカの最適化方針を提供することを含む。
検証エンジン23は推論エンジン22の推定結果の精度と、AIエンジン21の推定結果の精度とを検証して、エンジン精度DB(データベース)16に格納する。最終決定判定モジュール28は、予測精度の高い方の推定結果を出力データ12として出力する。最終決定判定モジュール28は、AIエンジン21の推定結果の精度が推論エンジン22の推定結果の精度を下回る状態が継続している間は、推論エンジン22の推定結果を優先して出力し、AIエンジン21の推定結果の精度が推論エンジン22の推定結果の精度を上回る状態が継続するようになればAIエンジン21の推定結果を優先して出力するモジュールあるいは論理を備えていてもよい。
4.3 推論エンジン
図14に推論エンジン22のさらに詳しい構成を示している。推論エンジン22を構成するメタ・モデルの情報として、記述ファイル14は、推論を実行させるための評価関数式や、生成されたレプリカのバリエーションを絞り込むための情報を含んでいてもよい。また、入力される検査データ11に関してもプリプロセッシングするルールを、入出力相関テーブル記述ファイル15に設定しておいてもよい。推論エンジン22は、レプリカを生成したり、入力データ・問診から内部状態を推論してもよい。
レプリカはレプリカ生成モジュール19も生成する。レプリカ生成モジュール19は、独立してレプリカ生成を実行する機能を持つが診断支援エンジン20の最適化エンジン24の指定で、レプリカ生成のバリエーションを変更することが可能である。レプリカ生成モジュール19は、主に統計データとレプリカの生成比率指定テーブルをベースに実行するが、予測機能を持たない構造であってもよい。レプリカ生成モジュール19は、指定された内容の入力レプリカ・内部レプリカ・再生入力レプリカを生成するのが主要な機能となる。レプリカ生成は、入力データ(測定データと問診・他)からそれらの情報から得られる範囲で想定されるレプリカをある一定範囲でそれらのレプリカ生成を行う点が、推論エンジン22とは異なる部分であってもよい。
推論エンジン22は、生成されたレプリカや入力データ・問診から推論を実行する。推論エンジン22は、相関テーブル15、過去の履歴221、テンソル量、メディカルドクターからのアドバイス情報を参考にしながら、推定された状態の絞込を行い、複数の可能性についての推論の候補を作り出してもよい。問診では、DNAデータを使用せずに遺伝的な問題が無いかをQ&Aで調べる様な手法も取り入れてこれを行ってもよい。例えば、自分の家族・親戚に膵臓疾患者が家族にいる場合は、膵臓疾患の可能性はそうで無い場合よりも高く推論あるいは予測されるように、推論エンジン22のルールを設定してもよい。また、過去に免疫系の機能が弱いと想像される問診を回答している場合は、その高熱経験や疾病からの回復期間を考慮して免疫活性率について推論・予測されるように、推論エンジン22のルールを設定してもよい。
推論エンジン22に実装されるルール(予測モデル)は、内部レプリカのバリエーションと再生成された複数の入力レプリカを比較する評価関数で定義されてもよい。推論エンジン22の推論ルールが、検証エンジン23の結果を入れて、最適化エンジン24へとフィードバックされてもよい。AIエンジン21が学習する学習モデルに、このフィードバックから最適化の方法が含まれてもよい。推論エンジン22に実装されるルールの1つは、入力データ(実測値+入力レプリカ)11と、内部レプリカとから再生成された複数の再生成入力レプリカとの差分を分散(数値:σ)で比較して、一番、少ない差の候補を、検査対象のシステムの内部状態を示す内部レプリカとして正しい候補とするものであってもよい。複数の内部レプリカが示す複数の内部状態を数値化して確率として複数候補を提示してもよい。内部状態には、超健康、未病、病気、腫瘍、癌、疾病などが含まれてもよい。
すなわち、推論エンジン22は、入力データ11と統計データから内部状態の仮説として、内部レプリカの候補を複数生成してもよい。
推論エンジン22は、レプリカジェネレータ19が生成した複数の候補と、データ間の相関や、地域性、年齢、病歴などの詳細なデータから、入力データ11を再生成してもよい。推論エンジン22側では、レプリカジェネレータ19が生成した複数個の内部レプリカ13bに対して、詳細なデータを用いて、どの内部レプリカ13bがより実態に近いのかを推測してもよい。推論エンジン22は、内部構成部品の活性度や不良・不具合の推論結果を検証エンジン23へと渡してもよい。
推論エンジン22の主な動作に以下の3つが含まれていてもよい。
1つ目は、外部テーブルを元に入力データ11から臓器の状態を推論する部分である。
2つ目は、推論した臓器(内部レプリカ)の状態から再度入力データ(再生成レプリカ)の推論を行う部分である。
3つ目は、推論した入力データ(再生成レプリカ)から、実際の入力データ及びレプリカデータを元に精度の高そうな入力データを決定し、内部レプリカを再評価する部分である。
推論エンジン22は、入力データ11から臓器の状態を推論する部分では、以下に示す様式に従った外部テーブル14および15を参照して推論を行ってもよい。推論を行う際のルールとして、指標と臓器の状態(活性度・不良・異常)が1対1で対応している場合(1対1モデル)、1対N(1対Nモデル)で対応している場合、M対Nモデル(合併症含む)の場合の3つを考慮してもよい。
異常と特定可能なマーカー物質が1つ確定するとこれに対応する内部要素(内部構成部品:臓器・他)が1つ対応する1対1モデルの場合は、1つの指標さえわかれば臓器の状態が推定可能であるから、臓器に関連付けられた指標を上から順番に対応(該当)するラベルを探索して決定してもよい。
異常と推定されるマーカー物質が1つ以上存在している場合で、これに対応する内部要素(内部構成部品:臓器・他)が1つ以上ある場合、1対Nモデル/M対Nモデルの場合は、外部相関テーブル15に記述してある各指標に対しての重みを参照して、複数の指標を考慮した形で臓器の状態をそれぞれ個別に推定してもよい。合併症の場合など、判断が困難な推定は後から実装してもよい。また、複数の候補が存在する場合、各マーカー物質のそれぞれは、線形であると仮定して指標に対して係数だけ変化させる実装を採用してもよい。つまり、単純に、複数の不良要因があった場合、その症状により係数を掛けて加算する方式としてもよい。免疫その他のリカバリー要素が関係する場合は、それらのそれぞれに対して逆に係数の影響を独立して減らす様にしてもよい。結果的に、プラス係数とマイナス係数をそれぞれこれに関係する要因を独立してプラス・マイナスして、当面は、連立方程式を解く様な実装としてもよい。
次に、臓器の状態から再度、入力データの推論を行う部分に関しては、1対1モデルの場合は、外部テーブルを用いて、臓器の状態から、各指標の取り得る値を決める。
最後に、推論した入力データと実際のデータの比較を行う部分では、推論した入力データと実際のデータとの距離を比較して、各データとの距離の長さがもっとも短かった推論した入力データの上位5つを推論結果として、再度、入力レプリカの生成を行い、各入力データの上位5つと再生成した入力レプリカを出力として、検証エンジン23に渡してもよい。
さらに詳しく推論エンジン22の一例の構成を説明する。図14に示したモジュール2210においては、増減マトリックス推定を行う。急増(急減)は、健康度を考えた場合には、急変する危険性があるサインと考えられる。個人の過去の測定データについては、経時変化を考えてその増減を考慮して、現在の検診データを補正・修正する。検診データの増減は、増減マトリクスとして、個人の過去の測定値をもとに増減をデータと日付のマトリクスとして定義する。推論エンジン22としては、急激に悪化しているところを発見したいので、係数を用いて、2−3年前の過去のデータよりも2−3週間前の直近のデータの変化を考慮する必要がある。最終的には、マトリクスの増減だけを見れば推定が可能となる。
モジュール2220においては、現在値の健康度の推定を行う。相関データをもとにして、ルールベースで推定を行う。相関データ15には、1対1や1対多の推定、多対多の推定があるので、各相関データにおいて推定手法を変更する必要がある。
様々な要因が検診データに対して影響を与えていると考えられるので、正しい推論を実施するには、補正をかける必要がある。補正には、補正テーブル222を用いる。補正テーブル222に関しては医者・専門医と作成してもよい。補正テーブル222の内容をもとに、検診データに対して、差分の加減、あるいは、補正係数をかけてもよい。補正方法は、内部構成要素を示すインデックスを選択することで、検診データに対して補正を行う方式としてもよい。内部インデックスを選択した場合に、記述テーブルに従って、インデックスが示す内容の補正を行うような実装を行ってもよい。
具体的には、モジュール2221において、問診その他補正を本人の自己申告により行ってもよい。疲労・睡眠などの自己申告(2222)、免疫系その他の自己申告(2223)などが含まれる。モジュール2224において、メディカルドクター、その他の補正を行い、主治医・医者や医療関係者からのフィードバックにより補正してもよい。モジュール2225において、感染症の補正をインタ−ネットや医療機関からの警告などにより行ってもよい。モジュール2226において、パンデミックの補正をインタ−ネットや医療機関からの警告などにより行ってもよい。
モジュール2227において、候補の正規化を行う。検査データ/入力データ11の全ての検査値を、標準偏差として正規化してもよい。男性・女性年齢で、正規化を変えてもよい。企業や地域、都市、地方、国、環境条件によりこの標準偏差が変化してもよく、正規化はその目的により、対応を変えてもよい。
モジュール2228において、序列化を行う。序列化では、特に注意すべき疾患リスクのある臓器や健康維持に関係する部位はどこかを具体的に知るために、各臓器や部位に序列を与える。序列の与え方は、健康度が低い(疾患リスクの高い)臓器や部位について、降順に並べる手法を採用してもよい。
モジュール2230において、補正前のデータに対して逆推定データを生成してもよい。体内の臓器や部位の活性度に対して、レプリカジェネレータ19は、入力データ/検査データ11を逆推定して、その可能性をある範囲で算出する。1つの検査データ/入力データ11は、必ずしも1つの臓器や部位に対して1対1に対応せずに複数の箇所と連携した数値となるケースが多くあるので、徐々(段階的)に逆推定データを補正してもよい。入力データ/検査データ11の逆推定をした値をR(Reverse、Ra・Rb、Rbは補正前の逆推定データ、Raは補正後の逆推定データ)とする。逆推定では、検診データ11と相関データ15から推定した、各臓器と部位の健康度に対して、健康度(免疫レベルやストレス・疲労・睡眠・運動など)と相関データ15を参考にして、入力データ/検査データ11の逆推定を行ってもよい。
モジュール2231において、比較推定を行う。補正前の逆推定データと補正後の逆推定データに対して比較を行う。比較推定は、体内の個々の各臓器や部位に対して行う。比較推定の役割としては、補正した場合にレプリカジェネレータが算出するRa・Rb予測値との差分及びその許容値について、どの範囲で収まっているのかを確認することにある。この結果をもとに、補正をかける度合いも調整して、精度を向上させる。
モジュール2232において、絞り込み処理を行う。体内の臓器や部位に対して、疾患リスクの高い候補についての絞り込みを実行する。絞り込みの基準は、ズレが少なくて、陽性+3レベルで、過去の差分を見たときに増加傾向にある臓器や部位、正常な人は0以上で、数値が低い場合の臓器や部位で、過去分との差分からその疾患リスクが増加しているものを上げてもよい。
モジュール2250において、推論決定処理を行う。推論決定処理の役割は、絞り込みまでやったものに対して出力処理を行う。具体的には、検証エンジンに対して、推論エンジン22が生成したI(内部状態、内部レプリカ、または内部臓器および部品)とR(逆推定、再生成レプリカ)を渡す。他の処理に対して、なぜ、その推定を決定したのか、すなわち、推定の根拠に関する情報を出力してもよい。例えば、異常度が90%の臓器が10個あるが、その内の5個しか出力ができない場合には、推論決定処理の部分でどの臓器や部位を出力するのかを決定する。つまり、絞込み処理で絞り込めなかった場合には、推論決定処理で行ってもよい。具体的には、統計処理や、過去のデータ、遺伝との寒冷性を調べる意味で、家族や親族の疾患履歴を参照してもよい。検証エンジン23に渡すデータは外部ファイルを経由せず、アプリケーション内部で直接、渡してしまう実装としてもよい。
モジュール2260において、履歴データベース(DB)221の更新を行う。個人の現在の入力データ/検査データを標準偏差値として、履歴DB221に登録して参照可能としてもよい。
さらに、推論エンジン22は、モジュール2261において、QV−Score(カテゴリ変数のスコアリング)の計算を行う。推論エンジン22では疾患リスクと各臓器の健康度の算出をおこなってもよい。QV−Scoreは、バイオマーカ(バイナリ)から疾患リスクの推定を行う。特に、ユーザが記入した問診データから疾患リスクの推定をおこなってもよい。以下、各種の癌リスク(膵臓癌・肝臓癌・肺癌・大腸癌・その他)ごとに計算を実行してもよい。
モジュール2262にいて、CV−Score(連続変数のスコアリング)の計算を行う。CV−Scoreは、疾患リスクの算出に用いられ、特に、ユーザのバイオマーカ(連続変数)から疾患リスクの推定を行う。以下、各種の癌リスク(膵臓癌・肝臓癌・肺癌・大腸癌・その他)ごとに計算してもよい。モジュール2281においては、CVスコアとQVスコアとを所定の配分比率に基づいて換算し、疾病リスクを算出してもよい。
モジュール2271および2272においては、平均偏差・偏差値の計算を行う。疾患との関連性マトリックス(データと疾病(臓器)との関連付けを表す表)を元に、評価対象ついて関連している項目の偏差値を二乗し、重みづけをした上で、その和の平均を求める。個々の偏差値は必要に応じ、定義ファイルで重みづけが可能としてもよい。
モジュール2282において、健康度指標の計算を行う。平均偏差から健康度指標(HealthScore)への変換は以下の式を適用してもよい。式を以下に示す。
Health Score=100−SDmean×25
SDmean:平均偏差(評価対象に関連する項目の偏差を基に重みづけをした平均値)
Health Score:計算値が0以下になる場合は、0に丸める。
さらにモジュール2283において、ヒートマップの解析と予測推定を行う。ヒートマップは、上述したように、入力データ(血液データ、尿データ、バイタルデータ、自律神経レベル、問診、その他の検査データ)の全てについて、XY相関(二軸の相関性を正規化して調べる)を計算して二次元に配置したものを示す。さらに、全てのXY相関について、疾患リスク(赤系)と健康(青系)が明確になる様に、濃度差に反映して画像情報へと変換したものであってもよい。XY相関とするので、X側とY側のそれぞれの検査データに対しての赤と青の濃淡が反映された画像となり、一種の疾患リスク・健康状態を示す個人レベルでの画像となる。例えば、平均値に近い場合は、白系の色画像となる。実際は、赤・青・白の濃淡の混入状態の画像が、個人の健康度や疾患リスクに対応して作成される。
この画像を蓄積して、分類すると疾患リクス及び健康状態についての遷移マップが膨大に作成される。疾患リスクは、未病レベル5が最も疾患の顕在化リスクが高く、実際に具体的な疾患傾向が顕著になる。また、未病レベル4は、未病レベル5ヘシフトする手前となる。未病レベル3は、健康状態と疾患へと進行する途中にある。健康体に近いのが、未病レベル1であり未病レベル2は、未病レベル3ヘと遷移する途中となる。未病レベル1であっても、疾患リスクがある場合は、その傾向が赤系の濃淡で見える。疾患リスクの予測推定は、この健康度・疾患リスクの位置により、スタティック(変化量や動きは考慮しない)な位置を特定して、その位置から、今後、疾患リスクがどの方向へとシフト/遷移するリスクがあるのかを予測推定してもよい。
モジュール2284において、ベクトルマップの解析と予測推定を行う。ベクトルマップは、先に説明したように、自律神経レベルや疲労・ストレス・睡眠・運動などをベースから免疫レベル(免疫活性度を直接白血球/NK細胞・B細胞・T細胞・マクロファージの検査により決定する事も可)を考慮しながら、過去の入力データ/検査データ(偏差値)を時間変化として見て、変化量を疾患リスクへ向かうベクトルとして表現された図(マップ)である。被験者の入力データ/検査データ(偏差値)11と一致するベクトルを探して、自分の現在の状態からどの様な疾患リスクへと向かう危険性があるのかを推定してもよい。或いは、逆に、回復して健康状態へと戻ろうとしているのかを予測推定してもよい。
4.4 検証エンジン
図15に、検証エンジン23により実行される検証サイクル45の概要を示している。推論エンジン22およびAIエンジン21の推定精度を、検証エンジン23が要求する追試データまたは時間経過した患者や未病の人の健康状態により向上させてもよい。追試データは、メディカルドクターが指定するテストに従う。例えば、病気の可能性のある検査項目を実行する。但し、健康体と思われる場合は、複数実行しても結果は全て良好となる。
検証エンジン23が推論エンジン22およびAIエンジン21の推定精度の評価に用いる評価モデル23Mとしては、測定データ・問診表・統計データなどの検査データ11と、内部レプリカ13bから再生成した入力レプリカ13cと差分を取り、その分散の最も優秀なものを選択してもよい。この評価モデル23Mは、AIエンジン21がメインで動作する場合でも動作する。但し、複数の予測・推論候補があり、その差が少ない場合は、追加の測定を実行して、この結果を、評価モデル23Mが考慮して再評価する。検証エンジン23は、時間軸の過去で、過去に似た様なケースがあった場合、この過去の検証(ペンディング)で決定出来ない状況にあったものを再評価して決定させる機能を備えていてもよい。検証エンジン23は、評価に問題がある場合(明確化が出来ないなど)、再度、疑いのある項目に関して、再度追加の問診を実施する機能を備えていてもよい。検証エンジン23は、検証されたデータを元に、入力レプリカ生成方法・AIエンジンの出力方法に変更を加える機能も備えていてもよい。
図16に、検証エンジン23のさらに詳し構成の一例を示している。検証エンジン23は、モジュール2310において、推論エンジン22およびAIエンジン21の出力(状態を推定した値)について、評価モデル23Mによる検証を行う。上述した評価モデル23Mまたは外部に定義した評価モデル232を読み込むことにより、入力データ11と推論エンジン22またはAIエンジン21の推論結果(推定結果)に対して検証を実施する。モジュール2320において、推定結果の曖昧性を判定する。検証結果を受け取った曖昧性判定モジュール2320は、検証結果を元に推論エンジン22およびAIエンジン21の推論結果の精度を図る。曖昧性判定モジュール2320では、評価モデルによる検証モジュールの結果からどのような点で曖昧性が残っているのかを判定してもよい。判定基準は外部定義ファイルである曖昧性判定基準ファイル233を参照してもよい。
精度が低い(曖昧性が高い)と判定された場合には、次の3つの追加での検証を行ってもよい。追加での検証内容は、より詳細な質問内容をユーザに回答してもらう追試(1)と、メディカルドクターに診断の依頼をする検査依頼(2)と、2週間の継続して検査を行う継続検査(3)とであってもよい。曖昧性判定モジュール2320では、(1)から順次、追加での検証を行っていき曖昧性がなくなった時点で検証結果決定モジュール2380に検証結果を渡してもよい。曖昧性判定モジュール2320は、どのような検証に対してどのような曖昧性判定をしたかの記録も検証結果決定モジュール2380に渡してもよい。
モジュール2321は、追試内容を決定する。追試内容決定モジュール2321では、曖昧性判定モジュール2320の判定を元にどのような追試内容を行うかを決定する。追試内容は外部定義ファイルである追試内容ファイル234を参照してもよい。モジュール2322は、追試実施を制御するモジュールであり、クラウドサービス(P−HARP)側へ追試内容を送信する。クラウドサービス側では、追試実施モジュール(検証エンジン)2322から受けとった内容を元に追試の実施を行う。
モジュール2323は、メディカルドクタ(MD)の選定を行う。選択モジュール2323は、曖昧性判定モジュール2320の結果をもとにメディカルドクターに対して、追加の検査の依頼を行う。依頼先のMDは、外部定義ファイルであるMDファイル235を参照して判断してもよい。モジュール2324は、MDへの調査依頼を制御する。検査依頼モジュール2324では、実際にMDファイル235に定義されているMDに対して検査依頼を行う。
モジュール2325は、継続検査DB2326への登録モジュール2325である。MDへの検査依頼をしてもそれでも曖昧性が残る場合には、さらに2週間、継続して検査を行うために、継続検査DB2326へユーザを登録してもよい。継続検査DB2326へ登録されたユーザは、2週間の継続した検査結果を入力することになる。継続検査の途中で曖昧性がなくなればその時点で検査を終了し、継続検査DB2326からユーザを削除してもよい。
モジュール2331は、経過観察フラグを生成するモジュールである。2週間の継続した検査(継続検査)をおこなっても曖昧性が残った場合には経過観察フラグモジュール2331により経過観察フラグがつけられる。経過を定期的に観察することで、曖昧性がなくなるのかについての確認を行う。モジュール2332は、経過観察フラグモジュール2331において経過観察フラグがつけられたユーザを経過観察DBへ登録する。経過観察結果モジュール2335は、定期的に経過を観察した結果、曖昧性がなくなるかどうかを確認する。曖昧性がなくなればその時点で経過の観察を中止し、経過観察DBからユーザを削除してもよい。経過観察DBおよび継続検査DBは過去履歴ファイルDB231に含まれていてもよい。
検証結果決定モジュール2380は、曖昧性判定モジュール2320が曖昧性がなくなったと判定した時点での結果を受け取る。評価モデルによる検証結果と曖昧性判定モジュール2320が受け取った入力データ及び検証内容と、それまでの曖昧性判定の記録を受け取り、評価モデルによる検証結果を最終決定判定モジュール28に渡す。
検証結果決定モジュール2380は、検証内容と曖昧性判定の記録を過去の類似事象の探索モジュール2381に渡してもよい。過去の類似事象の探索モジュール2381では、検証内容と曖昧性判定の記録を元に類似の状態になっているユーザ(事象)が存在しないのかを経過観察DBおよび継続検査DBから確認する。経過観察DB及び継続検査DBには、各ユーザの検証内容と曖昧性判定の記録が残されていることが望ましい。経過観察DB及び継続検査DBに類似の状態になっているユーザが存在すれば、過去の類似事象への結果の反映モジュール2382へ類似ユーザと類似の検証内容と曖昧性判定の記録を渡す。過去の類似事象への結果の反映モジュール2382は、受け取った類似ユーザと類似の検証内容と曖昧性判定の記録を元にして、類似ユーザの曖昧性判定の前の評価モデルに対して結果の反映をして曖昧性判定の実施を行う。この時点で曖昧性がなくなれば、継続検査および経過観察を中止してもよい。
レプリカジェレータ出力方法変更モジュール2383は、検証結果と外部に定義されたファイルを基にしてレプリカ生成モジュール19の出力方法を変更させてもよい。AIエンジン出力方法変更モジュール2384は、検証結果と外部に定義されたファイルを基にしてAIエンジン21の出力方法を変更させてもよい。
検証エンジン23においては、検証結果決定モジュール2380により選択された推定結果およびその判断理由を最終判定・決定モジュール28および最適化エンジン24に提供してもよく、さらに、臓器の活性度・疾患リスクを判断してから推定結果などを提供してもよい。モジュール2350は、本人・医者の知見に基づき臓器等健康度再計算する。検証を行うためには、推論エンジン22およびAIエンジン21が予測するべき臓器の活性度・疾患リスクを求めておいてもよい。モジュール2350においては、医者が算出した臓器の活性度及び疾患リスクを、推論エンジン22およびAIエンジン21が予測するべき臓器の活性度・疾患リスクとして扱ってもよい。このモジュール2350では、ユーザからの入力されたデータ、感染情報2360およびパンデミック情報2361をもとに医者が臓器の活性度及び疾患リスクに関して計算をおこなってもよい。
検証エンジン23は、最終決定・判定モジュール28が推論エンジン22およびAIエンジン21のどちらの予測を用いるのかを決定するための情報を出力してもよい。推論各臓器の活性度現在過去の差分計算モジュール2351では、ユーザから入力されたデータに対して、本人・医者の知見・臓器等健康度再計算モジュール2350においての結果と推論エンジン22およびAIエンジン21の各予測結果の差分を計算し、その結果をDB231に保持する。
推論各臓器の活性度現在過去の差分計算モジュールの結果は過去分もDB231に保持されていてもよい。最終判定情報整理モジュール2352は、推論各臓器の活性度現在過去の差分計算モジュールの過去分の結果及び現在の結果から最終判定・決定モジュール28で必要になる情報(現在の結果と過去の結果の平均値など)を計算する。
検証エンジン23では、最適化に用いる情報を収集可能であれば収集してもよい。推論結果と過去比較モジュール2353は、現在の推論結果に関して過去の結果と比較を行い、情報(推論精度の推移など)を収集する。最適化情報出力モジュール2354では、推論結果と過去比較モジュールで収集した情報から最適化に用いる情報を最適化エンジン24へ提供する。
このように、検証エンジン23は、推論エンジン22またはAIエンジン21により推定された状態の曖昧性を判断するモジュール2320と、曖昧性により追加情報を外部から取得するモジュール2321〜2325とを含んでいることが望ましい。追加情報は、診断対象システムの診断専門家のフィードバック、経過観察、追加試験の結果の少なくともいずれかを含んでいることが望ましい。
4.5 最適化エンジン
最適化エンジン24の役割は、推論エンジン22およびAIエンジン21の推論精度を高める点にある。そのため、最適化エンジン24は、検証エンジン23の検証結果を元にして、レプリカジェネレータ19に対して最適化を行う。最適化においては、微分ができない場合にどうするのかといった点や、局所解に陥らないようにするにはどうするかいった点が考慮されてもよい。最適化手法の一例は、GA(遺伝的アルゴリズム)、シミュレーテッドアニーリングなどである。数学的手法であってもよく、ラグランジュの未定乗数法、フーリエ級数のように係数を用いて近似を行ってもよい。実際の最適化手法については、メタ記述ファイル14により指定される。
最適化のための情報は、スタティックな正規分布を含んでいてもよく、ベイズ推定を含んでいてもよい。時間方向と追試を元にベイズ推定を行って、修正を加えることで、誤差を減らしてもよい。予測するバリエーションをいくつか変えて、未来で予測値が決定された場合に、フィードバックをおこなってもよい。本当の未来を利用するのと、現在を未来と仮定して修正を実施してもよい。
4.6 最終判定・決定モジュール
最終判定・決定モジュール28は、推論エンジン22や検証エンジン23が検証した結果を元に、最終的な判定を下す。最終判定・決定の基準は、メタファイルとして、事前に作成しておき、最終判定・決定モジュール28は、意思決定基準と検証結果を元に最終的な判定・決定を下してもよい。検証結果が、意思決定基準に従って、実データをよく反映できていると判定されれば、最終判定・決定モジュール28は、検証結果を受け入れる。一方、検証結果が、意思決定基準に従って、実データを反映できていないと判定された場合や検証結果として複数の仮説が存在していると判定された場合には、最終判定・決定モジュール28は検証エンジン23側に、再検証を実施させる。
図17に示すように、最終判定・決定モジュール28は、AIエンジン21と推論エンジン22の推論精度からどちらの推論を優先するのかといった決定を行う機能を含んでもよい。したがって、AIエンジン21と推論エンジン22とを含む支援エンジン20の制御方法としては、検証エンジン23の検証結果により、推論エンジン22により推定された状態を、AIエンジン21により推定された状態より優先して出力する段階ST1と、AIエンジン21により推定された状態を、推論エンジン22により推定された状態より優先して出力する段階ST2とを含む。
図18に、最終判定・決定モジュール28の一例の構成を示している。検証結果精度判定モジュール284は、精度の決定方法について外部定義ファイル281を参照し、実際の検証結果を用いて検証結果についての精度の計算を行う。判定結果処理モジュール287は、AIエンジン21、推論エンジン22それぞれの検証結果についての精度の比較を行う。それぞれに重みをつけて比較するなど、比較の仕方については、外部定義ファイルである意思決定基準ファイル281および重み決定ファイル282を参照してもよい。判定結果から、出力処理モジュール29に出力するのか、検証エンジン23に再検証させるかを、出力先変更定義ファイル283を参照して決めてもよい。判定結果保存モジュール288は、判定結果について外部のDBに保存する。
インターネットや医療機関・政府系・メディアから感染症情報285が流れた場合、これを取り込み疾患リスクの予測推定の最終判定の材料の1つとしてもよい。また、インターネットや医療機関・政府系・メディアからパンデミック情報286が流れた場合、これを取り込み疾患リスクの予測推定の最終判定の材料の1つとしてもよい。特に、広範囲にその拡散が見られる場合は、その情報を入れて反映する様にしてもよい。
4.7 出力データ処理モジュール
図19に、出力データ処理モジュール29の処理概要を示す。出力データ処理モジュール29では、予測結果を利用者に提示する際に、医療行為と間違われないようにするために表現方法等に修正を加えて、WEBサーバーに送信する機能を備えていてもよい。出力データの種類としては、音声情報・画像情報・テキスト情報があり、出力データ処理モジュール29は、推論エンジン22またはAIエンジン21および最終決定モジュール28の指示に従って、該当する出力情報テーブル290のインデックス情報をクラウドサービス(P−HARP/Webサーバー)50に依頼する方式であってもよい。メタ・モデルという性格から、このインデックス情報は、制御テーブルの出力側の規則に従った方式で、実現されてもよい。
4.8 レプリカ生成モジュール(レプリカジェネレータ)
図20に、レプリカ生成モジュール19の構成の一例を示している。モジュール1910は、サンプル処理および統計的特徴量の抽出を行う。このモジュール1910は、最初に、サンプル処理/特徴量抽出により、レプリカ生成が対象とする入力データ/検査データを確認する処置をスタートする。このモジュール1910の処理は、前処理であってもよい、レプリカ制御ファイル191より、どの様な性質のレプリカ生成を実行するのかという指示と合わせてレプリカ生成の方向付けを行う。レプリカ制御ファイル191を通して、最適化エンジン24は、予測精度向上のためのレプリカ生成制御を実現してもよい。レプリカ制御ファイル191およびモデルファイル192に明確な指示の記述が無ければ、統計的特徴量抽出を、モジュール1910を通して行い、XY相関情報のあるレプリカ生成確率密度からその拘束条件の範囲で、レプリカ生成を実行する準備を行ってもよい。
モジュール1911は、混合正規分布解析および1〜Nの重ね合わせを行う。入力データ/検査データ11の数量が膨大に多くなるとその増加に応じて、大数の法則/中心極限定理に従って正規分布に従うことは、統計学として公知である。しかしながら、検査データ11の数が十分で無い場合、サンプルがあるグループに限定されている場合、また、統計的特徴量を入力データ/検査データ11の全部でXY相関を取る場合などにおいては、必ずしも正規分布が明確に表れないことがある。特に、XY相関を取る場合に、統計的な特徴量を確率密度や分散を複数の正規分布が重ね合わさって構成される二次元的な分布として解析をする解析手法を導入してもよい。これにより正の相関や負の相関、また、複数の大小の正規分布が合成された様な二次元的な特徴を拘束条件として、乱数を使って、その特徴量に合う様な合成をする解析を実行してもよい。これは、1つの正規分布で単純に解析可能な場合もあり、XY相関データによっては、2〜Nへと複数の大小の正規分布が重なった形がその統計データの特徴となる場合もあり、これらの解析をこのモジュール1911で実行してもよい。
モジュール1912は、分散・確率密度、および相関と拘束条件といった特徴量を求める処理を行う。統計データの特徴量として、確率密度と分散(平均・代表値など)があり、全ての入力データ/検査データ11のXY相関を調べることで、明確に正の相関や負の相関を見つけることが可能となる。求められた特徴量および拘束条件は、レプリカ生成を実行する場合の拘束条件として機能させてもよい。単純なルール、例えば、正規分布だけを仮定して、確率密度もこれに従った形でレプリカ生成を実行してもよい。しかしながら、実際のデータとは、乖離したレプリカが生成される可能性が高い。例えば、人間の体を1つのシステムと考えた場合、1つの臓器や部位に問題が発生すると、それに関係する入力データ/検査データ11は、あるまとまったグループ同士が関連して数値が悪くなったり良くなったりすることが認められる。このため、1つ1つのデータ(検査データ11に含まれる各パラメータの値)は、独立している訳では無く、関係性を持っていることが多い。それら複数のパラメータの値の増減をマトリックス化することにより、関係性が表れることがあり、そのような場合には、統計的な特徴量を維持した形でのレプリカ生成を行うことが望ましい。このモジュール1912はそのための準備処理を行ってもよい。
モジュール1915は、レプリカデータ(X、I、R/Gr)を生成する。モジュール1915は、入力データ/検査データ11をベースに、疑似入力データ・複製データ(X:測定データ、入力レプリカ)、そのインプット情報に対応する内部の臓器や部位の活性度(I:内部レプリカ)、さらに、その内部のI値を見て再度、再生成される疑似複製データ(R:再生レプリカ、再生成レプリカ)を生成する。生成されたレプリカはレプリカファイル193に格納されてもよい。
この支援エンジン20において、学習システム30は、現在知り得ている情報から、ある仮定をして実際のデータと一連の予測推定を通して得られるデータとの差を比較することにより、その補正を行うことが可能となるパスを提供する機能を含む。人工知能(学習モジュール210およびAIモジュール21)は、膨大なデータから潜在的ルールを予測推定してその精度を上げることに貢献する。学習システム30は、予測推定を検証可能なパスとして機能し、複雑なシステムの解析を自律的に、あるいは自己学習により進めることを可能とする。現在の医療システムにおいて、体内の部位や臓器と入力データ/検査データ11との関係を単純な形で解析できない。レプリカを用いた学習システム30は、複雑なシステムに対し、それを部品として観測して疾患との関係を推定する仕組みに非常に似た構造を入れることが可能であり、複雑なシステムが疾患に対してどのように対応しているかの内部状態を追跡しやすくできる。モジュール1915は、疾患リスクが見え始めると、そのグループGr.レベル(疾患グループ)で拘束されるパラメータ変動をリンクさせてレプリカを生成することにより、さらに、疾患リスクの予測推定精度をアップさせることに貢献してもよい。
モジュール1920は、ヒートマップ相関(ヒートマップ)194、特に、正の相関について、スケーリング(疾患に対して)処理を行う。ヒートマップ194は、XY相関を全ての入力データ/検査データ11のパラメータに対して散布図などにより示したものであり、さらに、標準偏差からその疾患傾向や健康の強弱を赤系と青系の濃度差、また、平均に近い場合は無色の白色として、そのパターンから健康位置や疾患リスクのポジションを決定する手段を提供している。正の相関がある場合、例えば、レプリカ生成を1桁〜2桁増加させてもよい。増加傾向と増加した場合の数値がどうなるかという条件を追加する形で、レプリカ生成を行ってもよく、実際にサンプル数が増加した場合の一致精度を上げることが確認された。サンプルデータ数が限定されている中で、スケールさせる数をランダムに選択して、それをある比率で拡大しながら外挿してもよい。誤差は存在するが、スケールしない場合に比較してその一致精度は格段に高くなる。例えば、300サンプルの母集団の平均をランダムに、20、40、70、100、130と選んだ得た平均を外挿して算出したラインと、実際の測定済みの母集団サンプルとはよく一致することが判明した。確率密度・分布の傾向に関しても外挿が有効となる。ただし、明確な相関があるデータに限定される。
モジュール1921は、ヒートマップ相関194、特に負の相関について、スケーリング(疾患に対して)処理を行う。負の相関に関しても、正の相関と同様であり、スケーリングを行う場合は、同様な手法で外挿することができ、予測精度をアップさせることが可能となる。
モジュール1922は、ヒートマップ相関194のミキシング・混合を行う。ヒートマップを利用して、入力データ/検査データ11のレプリカ生成をスケーリングして実行する際に、疾患の罹患率や出現頻度を参照しながらこれらを混成・混合させてもよい。
モジュール1930は、ベクトルマップ相関(ベクトルマップ)195、特に正の相関のスケーリング(疾患に対して)を行う。ベクトルマップ195は、自律神経レベルや疲労・ストレス・睡眠・運動などをベースから免疫レベル(免疫活性度を直接白血球/NK細胞・B細胞・T細胞・マクロファージの検査により決定する事も可)を考慮しながら、過去の入力データ/検査データ(偏差値)を時間変化として見て、変化量を疾患リスクへ向かうベクトルとして表現する図(マップ)である。モジュール1930は、ベクトルマップ195に、疾患リスクおよび時間方向で、正の相関があれば、それを考慮した形で、ベクトルマップの拡大を行う。被験者の入力データ/検査データ(偏差値)と一致するベクトルを探して、自分の現在の状態からどの様な疾患リスクへと向かう危険性があるのかを推定して、拡大させるファクターの数を増加させてもよい。
モジュール1931は、ベクトルマップ相関195、特に負の相関のスケーリング(疾患に対して)を行う。ベクトルマップ195が負の相関にある場合は、健康側への相関が強くあることを示している。これは、回復して健康状態へと戻ろうとしているのかを予測推定して、拡大させるファクターの数を増加させてもよい。
モジュール1932は、ベクトルマップ相関195のミキシング・混合を行う。ベクトルマップ195を利用して、入力データ/検査データのレプリカ生成をスケーリングして実行する場合に、疾患の罹患率や出現頻度を参照しながらこれらを混成・混合させる処理を行ってもよい。
モジュール1950は、ヒートマップ194、ベクトルマップ195による得られる拘束を外さない範囲で、レプリカデータを疾病リスク対応の入力レプリカXn、疾病リスク対応の内部レプリカIn、疾病リスク対応の再生成レプリカRnに拡大して生成してもよい。モジュール1960は、学習データとなるレプリカデータ13を出力する。モジュール1960は、実測データA、測定レプリカ(入力レプリカ)X、内部レプリカIおよび再生成レプリカRを出力してもよい。
5. クラウドサービス(P−HARP:Precision Health Analysis Research Platform)
図21に、本願の出願人が提供するクラウドサービス(P−HARP)50の概要を示している。P−HARP50は、乳癌や膵臓癌・腎臓癌(腎不全)・その他疾病の入力データや相関性を学習している診断支援エンジン20および診断支援エンジン(AXiRエンジン)20を含む診断支援システム10と、専門家51による意思決定チームを形成できるクラウド上のプラットフォームである。P−HARP50においては、AIユニフォーム55と呼ばれるAIスーツ・AIシェルを通して、AIプロトコルが可能とする他のAI58やアプリケーションであれば、P−HARP50に接続された他のメンバーとの間で共通のインターフェースおよびAPIが提供され、自由または適当に制限されたコミュニケーションが可能となる。
P−HARP50は、複数の診断支援エンジン20とヘルスケアの専門(メディカルドクター、MD)51、スポンサー52、評価検証最適化ユニット53および管理ユニット54を含み、これらの構成要員がイントラネットまたはインターネットなどのコンピュータネットワーク59で接続される拡張性の高いクラウド上のグローバルプラットフォームである。P−HARP50においては、複数の同一または異なる専門分野のAIエンジン58の接続を容易にする為に、AIユニフォーム(AIシェル・AIスーツ)55と呼ばれる共通化IFを通して診断エンジン20および他の構成要員(メンバー)が接続される。
例えば、糖尿病患者や腎臓の機能に不安があるメンバー(スポンサー)52が、P−HARP50にメンバー登録をして、自分の血糖値・HbA1cやクレアチン値を入力すると、問診や血液データ、尿データの情報入力を要求される。そしてメンバー52からの要望・希望があれば、これに関する分析・解析の情報を提供する。また、健康の維持や改善についてのヘルスケア情報やサービスについては、その関心のあるカテゴリーに対してアドバイス情報をシェア可能となる。
有償会員(スポンサー、メンバ)52に対しては、ある一定期間のヘルスケア情報サービスを提供することで、その個人が良好な状態へと進んでいるのか、逆に、悪い方向へと進んでいるのかの情報とアドバイスは行うことが可能である。ただし、原則、健康状態を保証するものでは無い事と擬陽性・偽陰性という問題が常にあるので、最終的には専門医や病院での相談をお願いするアドバイスとなってもよい。
P−HARP50は、ローカル性を持たせてもよい。この場合、個人情報(ログイン名で個人特定は不要)を可能な限り排除してもよい。本人の主な活動エリア(生活圏・居住区・職場・学校)を入力して貰うことで、感染症、インフルエンザやその他に対しての広がりを把握することが可能となる。したがって、P−HARP50により、疫病や感染症の拡大を予測したり、早めの対策を取る事が可能となる。つまり、P−HARP50により複数のメンバー52、診断支援エンジン20などを接続することにより、社会的には、地位的な感染の拡大状況をリアルタイムで把握して、予測する事が可能となる。すなわち、P−HARP50により、1つの個体情報が、社会全体のプロテクションとして機能する事に貢献するシステムを提供できる。
図22に示すように、P−HARP50は、さらに、複数の診断支援エンジン20が違った視点で推論を進める共同作業の場を提供するスタジアムとしての機能を含んでもよい。これは、人間社会で言えば、総合病院や裁判所の様に、患者や被告人がいて、専門医や医療スタッフ・医療設備、弁護士や検察・判事・裁判官(警察)が参加して問題解決を進めるという、この治療やその量刑を決定・実行したりする場所に近い概念で、多数の参加者により診断対象物に対する診断をより高い精度で行うためのスタジアムとして機能してもよい。つまり、役割分担された複数の診断エンジン20と専門のメディカルドクター51がP−HARP50に参加して予測精度・推測精度を上げる事を実現することが可能である。
P−HARP50は、異なるAI間のインターフェイスをAIプロトコルとして提供し、人間とのインターフェースを実現する機能としてAIゲートウェイを提供する。実世界(RealWorld)のメンバー各自は、ネットワーク上(インターネットまたはイントラネット)で、自分のヘルスケア情報を仮想現実(VR:Virtual Reality)の中のアバター(Avatar)にマッピング可能である。この中では、実世界とのリンクを仮定したり利用したりする事が自由に出来る。専門のメディカルドクターのチームは、事前に登録された協力メンバーや実世界のヘルスケアデータをベースに、その健康度や疾病リスクの予測をアバタに対して、個人やグループに対して実施する。また、トレースや追加の検査・チェックを個人やグループの希望があれば実施する。
メンバー52は、サービスの提供を受ける個人あるいは団体だけではなく、スポンサー企業であってもよい。スポンサー企業は、VRの中でアイテムを提供しても良いしRWの中でこれを要求や希望に応じて実行しても良く、P−HARP50により集積される実験データなどを解析し、それぞれ1つの参考値として公開しても良く、集積されるビッグデータを解析することにより新たなビジネスを探ってもよく、メンバー52に追加の情報を提供するビジネスをおこなってもよい。これらは、P−HARP50に接続されるメンバー52が、個人データが利用可能な状況が発生するとある合意されたインセンティブと交換される場合があることを意味する。
図23に示すように、P−HARP50は、複数の専門性のある診断支援エンジン20および専門家(医者や研究者)51、エンジニア、当事者などが、クラウドを介して意見交換や情報交換を行い、ビッグデータ解析を進めながら、全体の予測精度を向上させてワールドワイドに利用可能な高精度測定ヘルスケア解析研究プラットフォームを提供してもよい。診断支援エンジン20の検証エンジン23はP−HARP50を通して、メディカルドクター51の判断を確認可能となる。また、検証エンジン23は、診断結果が微妙なケースで、例えば、未病状態にあり、病気の発病前で進行が遅い場合は、通常の方法(測定入力データ1回による予測)では、その予測推定の検証確認が難しい場合が想定される。この場合は、検証エンジン23は、P−HARP50を介して経過観察をP−HARP50に接続された医師、病院などに依頼することも可能となる。検証エンジン23はP−HARP50を介して予め用意された手順に従って追試を行うようにしてもよい。
P−HARP50と診断支援エンジン20および診断支援システム10とは、相互に接続可能で通信という意味では対称である。例えば、複数のN:M接続が可能という意味で、上位・下位の概念は無い。P−HARP50は図23に示すように、複数であっても良く、地域・国・感染症を防ぐ境界・その他の単位でグルーピングしてもよく、単一でカバーするようにしても良い。1つのP−HARP50は、複数の診断支援エンジン20または診断支援システム10を接続してもよく、人間の専門家51を入れても良い。接続される複数の診断支援エンジン20は、異なる入力データと学習により、違った専門性を持ち異なる視点を持つ違う推論能力のエンジンであってもよい。P−HARP50は、ハードウェア規模に応じて診断支援エンジン20の接続数がスケールしてもよい。
また、P−HARP50は、スポンサー単位で形成されてもよい。ビジネスモデルを制限しない様に、それぞれのスポンサーの設計自由度やビジネスの実装が、最大となる構造を許すように構築できる。例えば、チケット発行やユーザー募集、運用方法は、これを所有し管理する所有者の考えるビジネスモデルにより決定する。インターフェース条件は、原則、TCP/IPプロトコルと呼ばれるインターネット接続方式をベースに構築できるする。但し、アクシオンリサーチ社のAIプロトコルとAIゲートウェイに従う方式を採用する。将来的には、ハードウェアセキュリティを採用したより高度なサービスと一般的なサービスが、所有者・管理者を通して提供される可能性がある。
すなわち、P−HARP50は、P−Health Analysis Research Platformの略で、ヘルスケア向けに開発されたプラットフォームを指す。P−HARP50は、AXiREngineと称される診断支援エンジン20(診断支援システム10)や、他のAI、専門家やユーザー・パートナー・メンバー・スポンサーが、相互接続する場を提供し、複雑なシステムの現在状態・活性度・不調度・不具合・異常・緊急事態・暴走等などに対して、解析を行い予測・推論するサービスを提供する。P−HARP50は、その所有者・管理者の制御を前提に、インターネット上に存在し、専門性と経験則を使って、これへの接続及びコミュニケーションが許さているアプリケーションを通して、診断支援エンジン20およびその他が相互接続されるシステム・プラットフォームを指す。また、他のP−HARP50との接続する機能も実装する。自然言語処理、音声処理、AIユニフォーム(AIシェル・AIスーツ)と呼ばれるゲートウェイ等を用いてP−HARP50は、外部にあるWatsonやその他のAIを利用できる。
上記においては、第1の診断対象物の診断を行う推論エンジン22と、前記推論エンジンと並列に設けられた人工知能21と、入力データ11に対する前記推論エンジンの診断結果と人工知能の診断結果とに対して前記人工知能を教育するための前記入力データ11のレプリカを生成する教育システム30とを有するハイブリッドシステム20が開示されている。ハイブリッドシステム20は、教育開始直後においては、前記推論エンジン22の診断結果を優先して当該ハイブリッドシステム20の診断結果または診断支援結果として優先し、前記人工知能21の診断結果の精度が前記推論エンジン22の診断結果の精度を上回ると、前記人工知能21の診断結果を当該ハイブリッドシステム20の診断結果として優先して出力する最終判定・決定モジュール28を有してもよい。前記教育システム30は、前記推論エンジン22の診断結果と前記人工知能21の診断結果とを検証する検証エンジン23と、前記検証エンジンの検証結果に基づいて入力データのレプリカの最適化方針を生成する最適化エンジン24と、前記入力データ11および前記最適化エンジン24の指示に基づいて前記入力データ11のレプリカ13を生成するレプリカ生成モジュール19とを含んでもよい。
前記レプリカ生成モジュール19は、入力データの第1のレプリカと、前記第1の診断対象物の状態を示す第2のレプリカと、前記第2のレプリカの変化範囲から逆に推定した入力データのレプリカとなる第3のレプリカとを生成してもよい。前記検証エンジン23は、前記推論エンジン22の診断結果および前記人工知能21の診断結果の検証が困難であると判断すると、前記第1の診断対象物の診断専門家のアドバイスおよび/または経過観察を要求する機能を含んでもよい。前記推論エンジン22の診断結果または前記人工知能21の診断結果を、デジタルアバタの状態として出力する出力モジュール29を有してもよい。
また、少なくとも1つのハイブリッドシステム20と、前記第1の診断対象物の診断専門家の端末とがクラウドにより接続されており、前記少なくとも1つのハイブリッドシステムの診断結果が前記クラウドを介して参照されるクラウドシステム50が開示されている。クラウドシステム50には、前記第1の診断対象物の診断専門家の端末51と、前記第1の診断対象物の経過観察が可能な機関52とがクラウドにより接続されており、前記少なくとも1つのハイブリッドシステムの前記検証エンジン23は、前記クラウドを介して前記診断専門家のアドバイスおよび/または前記経過観察をオーダーするようにしてもよい。
上記におけるポイントの第1は、人命に関係する重大な発見があった場合に、これを最優先に記憶する様な機構を実装することである。致命的な事象とは外的な要因と内部的な要因をカバーしたものである。システムとしての致命的な発見があった場合に、これを最優先させる機構が追加される。ヘルスケアの場合は、癌化や感染症、生命の維持や健康状態を良好に保つ事に困難を伴う様な事象や兆候のシェアと警告、この原因と相関を調べて診断エンジン20及びP−HARP50に蓄積してシェアを進める機能が実装される。複雑なシステムや系で、同様に、システム維持や個体の維持に困難を伴う事象(イベント)に対する兆候のシェアと警告は重要な機能となるので、組み入れる。
上記におけるポイントの第2は、緊急対応必要な事象(イベントや突発的経時変化など)についてである。24時間監視やモニタリング(連続計測)する場合に、緊急対応を要求する事態が発生した場合に、その前後関係、特に、その時点で不明であっても解析を要するデータは、保持しておきその後のデータ解析に利用する。また、上記第1のポイントと同じ意味で、緊急性が高い場合は、被害を最少とする手続きの実行に入る事を実装する。これは、監視の機能を超えて、具体的に、システムの停止や緊急措置の発動を伴う様な事も含める。
上記におけるポイントの第3は、自己最適化(自己学習)である。最適化エンジン24は、検証エンジン23の結果からAIエンジン21の推論(予測)精度を上げる様にレプリカジェネレータ19を制御する。メタ・モデルの記述ファイル14にある評価関数と検証データとの差分(誤差)が少なくなる様に調整を進める。AIエンジン21の場合は、実測データ・追加精密検査結果(入力)から学習を進めるが、問診データやレプリカデータにより学習を加速させる事が出来る。
上記におけるポイントの第4は、外部のAIを利用する発想や視点である。音声認識技術、文献や文章の作成技術、論文解析技術、会話(通訳)機能などを含み、Watsonの様な、外部AIの成果を利用可能とするAIシェルインターフェースやAIプロトコルを含む。人間の専門家を入れた場合、AIゲートウェイがカバーする。
上記におけるポイントの第5は、推論エンジン22とAIエンジン21の切り替えである。これらの2つをスイッチングして、自己学習する機構はAIエンジン21を短時間で教育できる機構として重要である。このスイッチは、後戻りしてもよい。
上記におけるポイントの第6は、OPEN/CLOSEのシステムの暴走(異常)を防ぐことである。システムが、OPENで運用される場合とCLOSEで運用される場合に、その制御や外部からのアクセスが可能な様に、VPN的な内部へのホットラインを含む。診断エンジン20とAIスーツは、正常動作を保証するタイマー/HWのセキュリティ・リング方式認証トレースSWを実装しており、PrimaryMasterとSecondary Masterが各メンバー状況を決められたAIプロトコルに従ってそのプロファイルを定期的に確認する。これが、一定期間そのアクティビティと貢献・反応が確認されなければ、全体のセキュリティ・リングから遮断されて内部へのアクセスが不可能となる。デジタルアバタのVRのサイバー空間移動では、この移動の実行に別のKeyの交換が必要となり、移動の自由度はあるがトレースが残る方式となる。
上記におけるポイントの第7は、判定処理を過去の傾向と未来傾向から類推することである。動的に専門家との対話を通して類推することを含む。検証エンジン23が、検証可能なケースとペンディングにするケースの扱いとして、追加試験、経過観察を行う(オーダーする)機能を持つ。追試の精密検査という方法と経時変化を利用して、1〜2週間単位でグレーゾーン対象者/ペンディング対象者が、どの状態へと進んでいるのかという観点から、追試の精密検査を実施して、これを何回か繰り返す事で、全体の中で不明確な対象者数を減らすことができる。
なお、以上においては、診断支援の対象システムが人体の例を説明しているが、診断支援の対象は人体に限らず、他のシステム、特に多数の要素を含む複雑系であってもよく、プラント、エンジンなどのメカトロニクスであってもよく、金融・投資などのサービスであってもよく、ゲームであってもよく、他のビッグデータが伴うシステムであってもよい。

Claims (16)

  1. 対象システムの内部状態を推定する支援システムであって、
    モジュールのセットを有し、前記モジュールのセットは、
    前記対象システムに関する第1の検査データに基づいて、予め定められた少なくとも1つのルールにしたがって推定された前記対象システムの第1の推定された状態を出力するように構成された推論モジュールと、
    前記第1の検査データおよび前記第1の推定された状態に基づき、前記対象システムの状態を推定することを学習するように構成された学習モジュールを含み、第2の検査データに対して前記対象システムの第2の推定された状態を出力するように構成された人工知能モジュールと、
    前記推論モジュールにより推定された状態と、前記人工知能モジュールにより推定された状態との精度を検証するように構成された検証モジュールと、
    検証モジュールの検証結果により前記推論モジュールにより推定された状態と前記人工知能モジュールにより推定された状態との優先順位を切り替えて出力する判定モジュールと、
    前記学習モジュールの学習用として前記対象システムの検査データのレプリカを生成するように構成されたレプリカ生成モジュールと、
    前記検証モジュールにより検証された、前記人工知能モジュールにより推定された状態の精度に基づいて、前記レプリカ生成モジュールに対し前記レプリカの最適化方針を提供するように構成された最適化モジュールとを含む、支援システム。
  2. 請求項において、
    前記レプリカ生成モジュールは、前記対象システムの検査データに含まれる複数のパラメータの値の実分布を反映した前記レプリカを生成するモジュールを含む、支援システム。
  3. 請求項1または2において、
    前記レプリカ生成モジュールは、前記対象システムの内部状態を示す内部レプリカと、前記内部レプリカの変化範囲から逆に推定した検査データのレプリカとを生成するモジュールを含む、支援システム。
  4. 対象システムの内部状態を推定する支援システムであって、
    モジュールのセットを有し、前記モジュールのセットは、
    前記対象システムに関する第1の検査データに基づいて、予め定められた少なくとも1つのルールにしたがって推定された前記対象システムの第1の推定された状態を出力するように構成された推論モジュールと、
    前記第1の検査データおよび前記第1の推定された状態に基づき、前記対象システムの状態を推定することを学習するように構成された学習モジュールを含み、第2の検査データに対して前記対象システムの第2の推定された状態を出力するように構成された人工知能モジュールと、
    前記推論モジュールにより推定された状態と、前記人工知能モジュールにより推定された状態との精度を検証するように構成された検証モジュールと、
    検証モジュールの検証結果により前記推論モジュールにより推定された状態と前記人工知能モジュールにより推定された状態との優先順位を切り替えて出力する判定モジュールと、
    前記学習モジュールの学習用として前記対象システムの検査データのレプリカを生成するように構成されたレプリカ生成モジュールとを含み、
    前記レプリカ生成モジュールは、前記対象システムの検査データに含まれる複数のパラメータの値の実分布を反映した前記レプリカを生成するモジュールを含む、支援システム。
  5. 対象システムの内部状態を推定する支援システムであって、
    モジュールのセットを有し、前記モジュールのセットは、
    前記対象システムに関する第1の検査データに基づいて、予め定められた少なくとも1つのルールにしたがって推定された前記対象システムの第1の推定された状態を出力するように構成された推論モジュールと、
    前記第1の検査データおよび前記第1の推定された状態に基づき、前記対象システムの状態を推定することを学習するように構成された学習モジュールを含み、第2の検査データに対して前記対象システムの第2の推定された状態を出力するように構成された人工知能モジュールと、
    前記推論モジュールにより推定された状態と、前記人工知能モジュールにより推定された状態との精度を検証するように構成された検証モジュールと、
    検証モジュールの検証結果により前記推論モジュールにより推定された状態と前記人工知能モジュールにより推定された状態との優先順位を切り替えて出力する判定モジュールと、
    前記学習モジュールの学習用として前記対象システムの検査データのレプリカを生成するように構成されたレプリカ生成モジュールとを含み、
    前記レプリカ生成モジュールは、前記対象システムの内部状態を示す内部レプリカと、前記内部レプリカの変化範囲から逆に推定した検査データのレプリカとを生成するモジュールを含む、支援システム。
  6. 請求項1ないし5のいずれかにおいて、
    前記モジュールのセットは、さらに、
    前記対象システムの検査データを予め定められたルールにより前処理して前記推論モジュールおよび前記人工知能モジュールに入力される検査データに変換するように構成された入力処理モジュールを含む、支援システム。
  7. 請求項6において、
    前記入力処理モジュールは、前記検査データに含まれる各パラメータ同士の相関を示すマップを生成するモジュールを含む、支援システム。
  8. 請求項1ないし7のいずれかにおいて、
    前記検証モジュールは、前記推論モジュールまたは前記人工知能モジュールにより推定された状態の曖昧性を判断するモジュールと、
    曖昧性により追加情報を外部から取得するモジュールとを含む、支援システム。
  9. 請求項8において、
    前記追加情報は、前記対象システムの診断専門家のフィードバック、経過観察、追加試験の結果の少なくともいずれかを含む、支援システム。
  10. 請求項1ないし9のいずれかにおいて、
    前記モジュールのセットは、さらに、
    前記判定モジュールにより選択された前記推定された状態を前記対象システムの診断情報として出力するモジュールを含む、支援システム。
  11. 請求項1ないし10のいずれかにおいて、
    前記対象システムは人体である、支援システム。
  12. 請求項1ないし11のいずれかにおいて、さらに、
    前記モジュールのセットをプログラムとして格納するメモリと、
    前記メモリに格納された前記プログラムをロードして実行するプロセッサとを有する、支援システム。
  13. 請求項1ないし12のいずれかに記載の少なくとも1つの支援システムと、
    前記対象システムの診断専門家の端末とがクラウドにより接続されており、前記少なくとも1つの支援システムの出力が前記クラウドを介して参照される、クラウドシステム。
  14. 請求項9に記載の少なくとも1つの支援システムと、
    前記対象システムの診断専門家の端末と、
    前記対象システムの経過観察が可能な機関とがクラウドにより接続されており、前記少なくとも1つの支援システムの前記検証モジュールは、前記クラウドを介して前記診断専門家のアドバイスまたは前記経過観察をオーダーする、クラウドシステム。
  15. 請求項1ないし12のいずれかに記載の支援システムとして、コンピュータを機能させる命令を有するプログラム。
  16. 対象システムの内部状態を推定する支援システムの制御方法であって、
    前記支援システムは、前記対象システムに関する第1の検査データに基づいて、予め定められた少なくとも1つのルールにしたがって推定された前記対象システムの第1の推定された状態を出力するように構成された推論モジュールと、
    前記第1の検査データおよび前記第1の推定された状態に基づき、前記対象システムの状態を推定することを学習するように構成された学習モジュールを含み、第2の検査データに対して前記対象システムの第2の推定された状態を出力するように構成された人工知能モジュールと、
    前記推論モジュールにより推定された状態と、前記人工知能モジュールにより推定された状態との精度を検証するように構成された検証モジュールと、
    前記学習モジュールの学習用として前記対象システムの検査データのレプリカを生成するように構成されたレプリカ生成モジュールとを含み、
    当該制御方法は、
    前記推論モジュールにより推定された状態を、前記人工知能モジュールにより推定された状態より優先して出力することと、
    前記人工知能モジュールにより推定された状態を、前記推論モジュールにより推定された状態より優先して出力することと、
    前記検証モジュールにより検証された、前記人工知能モジュールにより推定された状態の精度に基づいて、前記レプリカ生成モジュールに対し前記レプリカの最適化方針を提供することとを含む、制御方法。
JP2018557944A 2017-07-24 2018-07-24 対象システムの内部状態を推定する支援システム Active JP6463572B1 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2017143065 2017-07-24
JP2017143065 2017-07-24
JP2018021518 2018-02-09
JP2018021518 2018-02-09
JP2018094644 2018-05-16
JP2018094644 2018-05-16
PCT/JP2018/027735 WO2019022085A1 (ja) 2017-07-24 2018-07-24 対象システムの内部状態を推定する支援システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018247561A Division JP7278571B2 (ja) 2017-07-24 2018-12-28 対象システムの内部状態を推定する支援システム

Publications (2)

Publication Number Publication Date
JP6463572B1 true JP6463572B1 (ja) 2019-02-06
JPWO2019022085A1 JPWO2019022085A1 (ja) 2019-07-25

Family

ID=65039677

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2018557944A Active JP6463572B1 (ja) 2017-07-24 2018-07-24 対象システムの内部状態を推定する支援システム
JP2018247561A Active JP7278571B2 (ja) 2017-07-24 2018-12-28 対象システムの内部状態を推定する支援システム
JP2023073916A Pending JP2023100777A (ja) 2017-07-24 2023-04-28 対象システムの内部状態を推定する支援システム

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2018247561A Active JP7278571B2 (ja) 2017-07-24 2018-12-28 対象システムの内部状態を推定する支援システム
JP2023073916A Pending JP2023100777A (ja) 2017-07-24 2023-04-28 対象システムの内部状態を推定する支援システム

Country Status (4)

Country Link
US (1) US20200126664A1 (ja)
EP (1) EP3660752A4 (ja)
JP (3) JP6463572B1 (ja)
WO (1) WO2019022085A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7382633B2 (ja) 2019-12-05 2023-11-17 学校法人明治大学 学習モデル構築装置、学習モデル構築方法及びコンピュータプログラム

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11354590B2 (en) * 2017-11-14 2022-06-07 Adobe Inc. Rule determination for black-box machine-learning models
US10609434B2 (en) 2018-08-07 2020-03-31 Adobe Inc. Machine-learning based multi-step engagement strategy generation and visualization
US11107115B2 (en) 2018-08-07 2021-08-31 Adobe Inc. Machine-learning based multi-step engagement strategy modification
US10931659B2 (en) * 2018-08-24 2021-02-23 Bank Of America Corporation Federated authentication for information sharing artificial intelligence systems
GB2576917B (en) * 2018-09-06 2021-04-07 Samsung Electronics Co Ltd Improvements in and relating to intelligent systems
JP6860602B2 (ja) * 2019-02-26 2021-04-14 三菱Ufj信託銀行株式会社 汎用人工知能装置及び汎用人工知能プログラム
JP7338858B2 (ja) * 2019-08-06 2023-09-05 Necソリューションイノベータ株式会社 行動学習装置、行動学習方法、行動決定装置及び行動決定方法
CN114586107A (zh) * 2019-10-15 2022-06-03 索尼集团公司 信息处理装置、信息处理方法以及程序
EP4048151A4 (en) * 2019-10-23 2023-04-05 The Johns Hopkins University CAPILLAROSCOPE WITH OFFSET ILLUMINATION
TR201916791A1 (tr) * 2019-10-31 2021-05-21 Muhammed Kutub Abdurrahman Bi̇r hasta deneyi̇m ölçüm si̇stemi̇
JP7426068B2 (ja) 2019-11-07 2024-02-01 株式会社Bhy 未病識別システム
KR102301792B1 (ko) * 2019-11-15 2021-09-14 한국전자기술연구원 지능형 컴포넌트를 통한 양방향 연속적 정보 전달 서비스 지원 방법
JP7451156B2 (ja) * 2019-12-04 2024-03-18 キヤノンメディカルシステムズ株式会社 診療支援装置
WO2021140670A1 (ja) * 2020-01-10 2021-07-15 オリンパス株式会社 情報伝達装置および情報伝達方法
JP7388250B2 (ja) 2020-03-06 2023-11-29 富士通株式会社 出力プログラム,情報処理装置及び出力方法
JP7443109B2 (ja) 2020-03-19 2024-03-05 キヤノンメディカルシステムズ株式会社 医用情報処理装置、医用情報処理方法及びプログラム
JP7489059B2 (ja) * 2020-04-21 2024-05-23 国立大学法人横浜国立大学 画像生成装置、表示装置、画像生成方法、提示方法およびプログラム
US11436579B2 (en) 2020-05-04 2022-09-06 Bank Of America Corporation Performing enhanced deposit item processing using cognitive automation tools
WO2022059285A1 (ja) * 2020-09-17 2022-03-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 情報処理方法、情報処理装置、及びプログラム
JP7244120B2 (ja) * 2021-02-25 2023-03-22 株式会社ミヤワキ 測定データ送信システム及びサーバ
KR102570064B1 (ko) * 2021-02-26 2023-08-24 (주)커넥슨 통합형 의료 검진 장치
US20220375621A1 (en) * 2021-05-23 2022-11-24 Innovision LLC Digital twin
US20230162546A1 (en) * 2021-11-22 2023-05-25 Johnson Controls Tyco IP Holdings LLP System to evaluate and manage people entering a building based on infection risk data, environmental data, and building entrant health data
JP7365736B1 (ja) * 2022-05-17 2023-10-20 Edgewater株式会社 免疫状態予測提供システム、免疫状態データ予測方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002133390A (ja) * 2000-10-18 2002-05-10 Matsushita Electric Ind Co Ltd 学習装置および記録媒体
JP2013165780A (ja) * 2012-02-14 2013-08-29 Canon Inc 診断支援装置及びその制御方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996012187A1 (en) * 1994-10-13 1996-04-25 Horus Therapeutics, Inc. Computer assisted methods for diagnosing diseases
JPH08303210A (ja) * 1995-05-11 1996-11-19 Hitachi Ltd 火力発電プラントの自律適応最適化制御システム
US7801591B1 (en) * 2000-05-30 2010-09-21 Vladimir Shusterman Digital healthcare information management
WO2009103156A1 (en) * 2008-02-20 2009-08-27 Mcmaster University Expert system for determining patient treatment response
US8977959B2 (en) 2009-03-25 2015-03-10 International Business Machines Corporation Visualization of medical conditions in a virtual universe
JP5668090B2 (ja) 2013-01-09 2015-02-12 キヤノン株式会社 医療診断支援装置及び医療診断支援方法
US10294512B2 (en) * 2013-10-21 2019-05-21 Sung-Chun Kim Method and apparatus for analyzing biomolecules by using oligonucleotide
CA2935138C (en) * 2013-10-22 2021-04-20 Sung-Chun Kim Marker for generating binding information on biomolecules and nucleic acids, preparation method therefor, and method and apparatus for analyzing biomolecule by using same
JP6110281B2 (ja) 2013-11-19 2017-04-05 日本電信電話株式会社 移動手段予測モデル生成装置、移動手段予測モデル生成方法及び移動手段予測モデル生成プログラム
US10417388B2 (en) 2014-04-07 2019-09-17 Chung Ang University Industry Academic Cooperation Foundation Apparatus and method for providing virtual treatment experience
CN107438398A (zh) * 2015-01-06 2017-12-05 大卫·伯顿 移动式可穿戴的监控***
US11144825B2 (en) * 2016-12-01 2021-10-12 University Of Southern California Interpretable deep learning framework for mining and predictive modeling of health care data
US20190374160A1 (en) * 2017-01-05 2019-12-12 The Trustees Of Princeton University Hierarchical health decision support system and method
JP2017091586A (ja) 2017-02-13 2017-05-25 株式会社FiNC 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002133390A (ja) * 2000-10-18 2002-05-10 Matsushita Electric Ind Co Ltd 学習装置および記録媒体
JP2013165780A (ja) * 2012-02-14 2013-08-29 Canon Inc 診断支援装置及びその制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7382633B2 (ja) 2019-12-05 2023-11-17 学校法人明治大学 学習モデル構築装置、学習モデル構築方法及びコンピュータプログラム

Also Published As

Publication number Publication date
JP7278571B2 (ja) 2023-05-22
EP3660752A1 (en) 2020-06-03
US20200126664A1 (en) 2020-04-23
JP2019204484A (ja) 2019-11-28
JPWO2019022085A1 (ja) 2019-07-25
WO2019022085A1 (ja) 2019-01-31
JP2023100777A (ja) 2023-07-19
EP3660752A4 (en) 2021-04-14

Similar Documents

Publication Publication Date Title
JP6463572B1 (ja) 対象システムの内部状態を推定する支援システム
Jiwani et al. Machine Learning Approaches for Analysis in Smart Healthcare Informatics
JP7398155B2 (ja) 人体の健康状態を推定するシステム
Ambilwade et al. Medical expert systems for diabetes diagnosis: A survey
Orfanoudaki et al. Algorithm, Human, or the Centaur: How to Enhance Clinical Care?
Pratama Self-Diagnosis of Web-Based Pregnancy and Childbirth Disorders Using Forward Chaining Methods
Al-Khasawneh et al. A predictive E-Health information system: Diagnosing diabetes mellitus using neural network based decision support system
Allahverdi Applications of fuzzy approach in medicine. problems and perspectives
Al Sukar et al. Identifying a drug addict person using artificial neural networks
Prasad et al. Applications of artificial intelligence in biomedical engineering
Sleeman et al. Detecting and resolving inconsistencies between domain experts’ different perspectives on (classification) tasks
Khalaf Machine Learning Approaches and Web-Based System to the Application of Disease Modifying Therapy for Sickle Cell
Moreira Performance Evaluation of Smart Decision Support Systems on Healthcare
Nino et al. Wearable devices and decision theory in the emergency triage process
KR102510347B1 (ko) 위암 수술 이후 제2형 당뇨병 예후의 예측 방법
KR102536982B1 (ko) 문진표를 이용한 인공지능 기반의 질병 예측 방법 및 장치
Nel et al. A novel screening tool to predict severe acute malnutrition through automated monitoring of weight‐for‐age growth curves
Dong et al. Readmission prediction of diabetic patients based on AdaBoost-RandomForest mixed model
Ghori A Health Diagnostic Tool for Tracking and Predicting Diseases from Blood Examination Report
Swan Improving patient outcomes through data driven medical decision making
Su Personalized Treatment Response Prediction under Dynamic and Time-Varying Treatment Strategies for Sepsis Patients
Khorsheed JOURNAL LA MULTIAPP
Rønhovde Modeling Cardiovascular Patient Pathways in an Accident and Emergency Department from a System Dynamic Perspective Using a Patient Oriented Modeling Approach
Sharma et al. Fuzzy Systems in Medicine and Healthcare: Need, Challenges and Applications
Jamshidnezhad et al. A computer based model in comparison with sonography imaging to diagnosis of acute appendicitis in Iran

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181112

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20181112

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20181129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181228

R150 Certificate of patent or registration of utility model

Ref document number: 6463572

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250