JP2022153142A - 情報処理システム、生体試料処理装置及びプログラム - Google Patents

情報処理システム、生体試料処理装置及びプログラム Download PDF

Info

Publication number
JP2022153142A
JP2022153142A JP2021056228A JP2021056228A JP2022153142A JP 2022153142 A JP2022153142 A JP 2022153142A JP 2021056228 A JP2021056228 A JP 2021056228A JP 2021056228 A JP2021056228 A JP 2021056228A JP 2022153142 A JP2022153142 A JP 2022153142A
Authority
JP
Japan
Prior art keywords
data
unit
learning
feature amount
measurement data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021056228A
Other languages
English (en)
Inventor
志織 笹田
Shiori SASADA
一樹 相坂
Kazuki Aisaka
健治 山根
Kenji Yamane
潤一郎 榎
Junichiro Enoki
由幸 小林
Yoshiyuki Kobayashi
雅人 石井
Masato Ishii
健二 鈴木
Kenji Suzuki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Group Corp filed Critical Sony Group Corp
Priority to JP2021056228A priority Critical patent/JP2022153142A/ja
Priority to PCT/JP2022/004610 priority patent/WO2022209299A1/ja
Priority to CN202280023526.4A priority patent/CN117136303A/zh
Priority to US18/550,762 priority patent/US20240161298A1/en
Publication of JP2022153142A publication Critical patent/JP2022153142A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Radiology & Medical Imaging (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Surgery (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Image Analysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

【課題】推定精度を向上する。【解決手段】情報処理システムは、患者または被験者の健康状態の推定を行う学習済みモデルの生成に使用された学習データの特徴量に基づく調整情報を取得する取得部と、前記調整情報に基づき、判定対象である生体試料に対し処理を行う処理部と、前記処理によって取得した測定データを、前記学習済みモデルに入力して診断結果を推定する推定部と、を備える。【選択図】図9

Description

本開示は、情報処理システム、生体試料処理装置及びプログラムに関する。
近年、病理画像等である医療画像から学習モデルによる診断の推定結果を出力することで、医師等による診断を支援する診断支援システムが開発されている。
国際公開第2020/174863号
しかしながら、デジタル化された医療画像を用いてAI(Artificial Intelligence)による診断支援を行う際、学習された画像と、診断結果の推定(以下、判定ともいう)に用いたい画像のドメインが異なると、十分な推定精度(判定制度ともいう)が得られない可能性が存在する。
そこで本開示は、推定精度を向上することを可能にする情報処理システム、情報処理装置及び情報処理方法を提案する。
上記の課題を解決するために、本開示に係る一形態の情報処理システムは、患者または被験者の健康状態の推定を行う学習済みモデルの生成に使用された学習データの特徴量に基づく調整情報を取得する取得部と、前記調整情報に基づき、判定対象である生体試料に対し処理を行う処理部と、前記処理によって取得した測定データを、前記学習済みモデルに入力して診断結果を推定する推定部と、を備える。
一実施形態に係る診断支援システムの全体概要例を示す模式図である。 アナログ工程と、各アナログ工程で使用される機材薬剤、及び、各アナログ工程がデジタルパラメータへ与えると予想される影響の例を示す図である。 病理ワークフローの具体例を示すフローチャートである。 一実施形態に係る学習データセット及び特徴パラメータセットの一例を示す図である。 一実施形態に係る情報処理システムの概略構成例を示すブロック図である。 一実施形態に係る診断支援システムの概略構成例を示す図である。 一実施形態に係る導出装置の構成例を示すブロック図である。 一実施形態に係る学習モデルの学習を説明するための図である。 一実施形態に係る学習済みモデルを用いて診断結果を推定する場合の動作を説明するための図である。 一実施形態に係る前処理モデルを用いて第1前処理を実行する場合の動作を説明するための図である。 一実施形態に係る学習済みモデルの再学習を説明するための図である。 一実施形態に係るパラメータ調整用ユーザインタフェースの一例を示す図である。 一実施形態に係るパラメータ調整用ユーザインタフェースの他の一例を示す図である。 一実施形態に係るモデル管理テーブルの一例を示す図である。 一実施形態に係るモデル選択用ユーザインタフェースの一例を示す図である。 本開示に係る技術を実現するコンピュータの一例を示すハードウエア構成図である。
以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。
以下に示す項目順序に従って本開示を説明する。
0.はじめに
1.一実施形態
1.1 全体概要
1.2 病理ワークフローにおけるアナログ工程について
1.3 学習データセットの例
1.4 情報処理システムの概略
1.5 システム構成
1.6 導出装置
1.7 学習モデルの学習
1.8 学習済みモデルを用いた診断結果の推定
1.9 ニューラルネットワークを用いた前処理
1.10 前処理モデルの学習(転移学習)
1.11 前処理モデルの作成/更新手法
1.11.1 学習済みモデルがホワイトボックスである場合
1.11.2 前処理モデルがブラックボックスである場合
1.11.3 その他
1.12 モデルの選択による推定精度の向上
1.13 フォーマットの統一
1.14 デジタルパラメータ調整用のユーザインタフェース例
1.15 モデル選択用のユーザインタフェース例
2.ハードウエア構成
0.はじめに
医療支援システムの推定精度を向上させるためには膨大な量の医療画像を学習データとして学習モデルを学習(トレーニングともいう)する必要があるが、1つの医療施設で十分な量の医療情報を収集することは難しい。そこで、膨大な学習データを用いて学習された学習モデルを個別の医療施設に導入することが考えられるが、医療施設ごとに医療設備やそのデバイス特性や測定条件等が異なるため、学習モデルの学習に使用された学習データの特徴と個別の医療施設で取得される測定データの特徴とが異なる、すなわち学習データと測定エータとでドメインが異なることが多々あり、十分な精度の診断結果を推定することが困難な場合が存在する。
そこで以下の実施形態では、病理スライドなどの医療画像が、薄切・染色・スキャニングなどの様々な物理工程を経てデジタル化されることに着目し、これらの工程の差異がパラメータとして反映されたキャリブレーションを行うことで、推定精度の向上を可能にする転移学習を含む前処理を提案する。
また、以下の実施形態では、例えば、医療画像を取得する際の測定機器(種類や型式等)やそのデバイス特性や測定条件(環境条件や設定値等を含む)など(以下、これらをまとめて物理的な条件ともいう)で定まるパラメータをデジタル上で調整ができるパラメータと調整ができないパラメータとに分類し、この分類に従って病理のデジタル・アナログ工程の設定(例えば、カバーガラスの種類、病理切片の厚み、薬剤、染色時間など)を変更するように、ユーザにフィードバックを提供するための構成についても提案する。
さらに、以下の実施形態では、学習に用いられた画像又はその特徴から精度が確保できる特徴量の範囲を可視化し、変換後の判定対象画像の特徴量がその範囲内に入るかを確認できるようにするための構成についても提案する。その際、変換後の判定対象画像を人が確認できるように提示する手段が提供されてもよい。
さらにまた、以下の実施形態では、前例の無い疾患例に対し、この疾患例の画像に最も近い画像群から生成された学習モデルを転移学習させる場合、疾患例の画像と候補となる画像群それぞれとの特徴の近似性を元に、転移元の学習モデルを選択できるようにするための構成についても提案する。
1.一実施形態
1.1 全体概要
以下、本開示の一実施形態に係る診断支援システム(情報処理システム、情報処理装置、情報処理方法)の全体概要について説明する。図1は、本実施形態に係る診断支援システムの全体概要例を示す模式図である。
図1に示すように、本実施形態では、医師や病理医などのユーザによる診断を支援するための情報を推定するAI2が、例えば、学習に十分な量の医療情報を収集することが可能な病院Aで収集された学習データの集合(以下、学習データセットという)を用いて学習される。学習されたAI2は、他の病院B~Eに導入される。なお、病院Aは、例えば、研究機関や大学病院など、膨大な医療情報を収集可能な医療施設であってよく、また、他の病院B~Eは、例えば、研究機関や大学病院や個人病院や診療所やクリニックなどの種々の医療施設であってよい。
この導入にあたり、病院Aにおける医療設備やそのデバイス特性や測定条件等と他の病院B~Eにおけるそれらとが異なる場合、病院Aで収集された学習データセットを用いて学習されたAI2をそのまま他の病院に導入すると、病院Aで収集された学習データの特徴と他の病院で取得された判定対象である測定データの特徴との違い、すなわち、学習に用いた学習データと判定対象である測定データとのドメインの違いから、十分な精度の診断結果を推定することが困難な場合が存在する。
そこで、本実施形態では、他の病院(例えば病院B)で取得された測定データの特徴をAI2の学習に用いた学習データセットの特徴に近づける前処理を実行する。なお、学習データセットの特徴とは、例えば、学習データセットを構成する学習データの各特徴量(以下、パラメータともいう)の分布や平均値などであってもよい。
本実施形態では、学習データ及び測定データが、患者から歳出した組織切片を撮像することで得られた画像データである場合を例示する。その場合、学習データや測定データの特徴とは、例えば、学習データ及び測定データの明度(色調であってもよい)や色相やホワイトバランスやガンマ値やカラーチャートなどであってよい。ただし、これに限定されず、ただし、学習データ及び測定データは、テキストデータや波形データ(音データを含む)など、種々のデータ又はそれらのうちの2以上の混合データであってもよい。例えば、学習データ及び測定データがテキストデータである場合には、それらの特徴は、言語の種類(日本語、英語等)や構文のパターン(癖など)や同義語/類義語の違いなどであってもよい。
本実施形態に係る前処理には、取得された測定データの特徴を調整(補正ともいう)する処理(以下、第1前処理という)や、測定データを取得する工程(本説明では、アナログ工程ともいう)における測定条件等を調整/変更する処理(以下、第2前処理という)が含まれ得る。
第1前処理では、いわゆる転移学習において課題として知られているドメイン適応に対する処理であり、AI2の学習に使用した学習データの特徴に近づけるように、デジタル化された測定データの特徴を直接的に調整する。この調整は、自動で行われてもよいし、手動で行われてもよい。手動で行われる場合には、例えば明度(色調であってもよい)や色相やホワイトバランスやガンマ値やカラーチャートなどの各特徴量(以下、デジタルパラメータともいう)を調整するために、コントロールスライドなどのユーザインタフェースがユーザに提供されてもよい。その場合、このユーザインタフェースは、学習済みのAI2に測定データを入力する段階でユーザに提供されてもよいし、測定データを取得する際にユーザに提供されてもよい。言い換えれば、デジタルパラメータ調整用のユーザインタフェースは、測定データに基づく判定を実行する判定器側に設けられてもよいし、測定データを取得する測定器側に設けられてもよい。
なお、デジタルパラメータとは、明度(色調であってもよい)や色相やホワイトバランスやガンマ値やカラーチャートなど、デジタル処理により調整することが可能な種々の特徴量であってよい。また、画像データを学習データとする本実施形態においては、デジタルパラメータは、上述した学習データや測定データの特徴と同義であってもよい。
一方、第2前処理では、測定により取得される測定データの特徴がAI2の学習に使用した学習データの特徴に近づくように、測定データを取得する際の推奨される物理的な条件(以下、アナログパラメータという)が特定される。特定されたアナログパラメータは、例えば、病理システム20の表示装置24を介してユーザに提示される。ユーザは、例えば、提示されたアナログパラメータに応じて測定条件等を調整/変更する。それにより、測定段階(すなわち、アナログ工程)で測定データのドメインを学習データセットのドメインに近づけることが可能となるため、病院Aで収集された学習データセットにて学習されたAI2の病院B~Eへの転移学習を容易化することが可能となる。
アナログパラメータとしては、例えば、測定対象が染色された組織切片である場合には、組織切片の種類、厚さ等、ブロックから組織切片をスライスする薄切機の種類、型式、製造メーカ等、染色に使用した染色マーカの種類、製造メーカ、染色濃度、染色時間等、染色に使用した染色機の種類、型式、製造メーカ等、組織切片を封入するカバーバラスの材料、厚さ等、撮影するカメラ(スキャナともいう)の型式、製造メーカ、ガンマ値、圧縮率等、励起光源の種類、製造メーカ、出力ワット数等、学習データ又は測定データを取得する際のアナログ工程においてユーザにより手動で調整される種々のパラメータであって、例えば、デジタル処理で調整できない種々のパラメータが含まれ得る。また、本実施形態において、アナログパラメータには、計測データを取得した際の温度や湿度や照度等や、測定データを取得した技術士や医師などの情報がパラメータとして含まれてもよい。
1.2 病理ワークフローにおけるアナログ工程について
ここで、図2に、測定対象を組織切片とした場合の病理ワークフローにおけるアナログ工程の例と、各アナログ工程で使用される機材薬剤の例、及び、各アナログ工程がデジタルパラメータへ与えると予想される影響の例とをまとめた表を示す。
図2に示すように、アナログ工程としては、例えば、「固定」、「脱水~包埋」、「薄切」、「染色」、「封入」、及び、「撮像」が挙げられる。
「固定」では、例えば、生体ブロックをホルマリン溶液に漬けることで、生物試料を自己分解や腐敗による劣化から保護するための化学処理が実行される。この工程は、間接的には、生体試料を撮像することで得られた画像の色相に影響する可能性が存在する。
「脱水~包埋」では、固定された生体ブロックが、例えば、エタノールやアセトンなどの水溶液を用いて脱水される。そして、脱水された生体ブロックが、樹脂などの包埋剤とパラフィンとを用いて包埋される。この工程は、間接的には、生体試料を撮像することで得られた画像の色相に影響する可能性が存在する。
「薄切」では、例えば、包埋された生体ブロックからミクロトームなどを用いて薄切片が切り出される。切り出された薄切片の厚みは、生体試料を撮像することで得られた画像の明度に直接的に影響し得る。また、間接的には、画像の色相や色彩に影響する可能性がある。
「染色」では、切り出された薄切片が薬剤を用いて染色される。染色に使用された染色剤や染色濃度や染色時間は、生体試料を撮像することで得られた画像の色相に影響し得る。
「封入」では、例えば、染色後の薄切片がスライドガラス上に載置され、その上からカバースリップ(カバーガラス、またはカバーフィルム)が覆い被せられることで、薄切片の標本が作製される。また、カバースリップで覆われた薄切片標本は、所定の乾燥工程を経ることで乾燥される。この工程で使用される封入剤や乾燥時間やカバースリップの材質及び厚さ等は、生体試料を撮像することで得られた画像の明度や色相や色彩に影響し得る。
「撮像」では、乾燥後の薄切片標本の撮像が行われる。この工程では、フォーカス位置や撮像倍率や撮像領域などのパラメータが、生体試料を撮像することで得られた画像の明度や色相や色彩に影響し得る。
つづいて、上述したアナログ工程を含む病理ワークフローについて、具体例を挙げて説明する。図3は、病理ワークフローの具体例を示すフローチャートである。
図3に示すように、病理ワークフローでは、例えば、まず、包理ブロックが作製される(ステップS101)。具体的には、観察対象である生体試料が、パラフィン等の疎水性の包埋剤によって包埋、すなわち周囲を覆い固められる。
つづいて、薄切片が作製される(ステップS102)。具体的には、薄切片作製装置を用いることで、生体試料が包埋された包埋ブロックから厚さ3~5μm程度の極薄の薄切片が作製される。
次に、薄切片標本が作製される(ステップS103)。具体的には、薄切片作製装置で作製された薄切片を例えばスライドガラスの上面に定置することで、理化学実験や顕微鏡観察等に用いられる薄切片標本が作製される。
次に、薄切片標本の染色と、染色された薄切片にカバースリップを覆い被せる処理とが実行される(ステップS104)。薄切片標本の染色は、例えば、ネガティブ染色法やマイカフレーク法など、種々の染色手法が用いられてよい。また、染色からカバースリップの被覆までの処理は、一連の自動作業によって完了されてもよい。
次に、所定の乾燥工程を経た後、染色済み薄切片標本の撮像が実行される(ステップS105)。撮像では、例えば、薄切片標本の低解像度撮像と高解像度撮像とが実行されてよい。例えば、薄切片標本全体を低解像度で撮像し、これにより得られた低解像度画像から標本中に存在する薄切片の領域が特定される。そして、高解像度撮影では、薄切片の領域が1又は複数の領域に分割され、分割された領域毎の高解像度撮影が実行される。なお、高解像度撮像で取得された高解像度画像には、スティッチングの際の糊代として用いられる重畳領域が含まれてよい。
次に、取得された高解像度画像をスティッチングすることで、薄切片全体の高解像度画像(ホールスライドイメージ(WSI))が作成され、そして、作成されたWSIを段階的に低解像度化してレイアごとの画像データを生成することで、階層的に解像度が変化するミップマップが作成される(ステップS106)。その後、本動作が終了する。
1.3 学習データセットの例
AI2の学習に使用される学習データには、その特徴を示す情報(例えば、上述したデジタルパラメータ及び/又はアナログパラメータ。以下、特徴パラメータという)が紐付けられていてもよい。この特徴パラメータは、いわゆるメタデータであってよく、必要に応じて病院B~Eへ提供されてもよい。ただし、病院B~Eへ特徴パラメータが提供されない場合若しくは学習時に特徴パラメータが作成されない場合には、病院B~Eにおいて、学習済みのAI2及び/又は学習データから、特徴パラメータ自体、又は、測定データの特徴を学習データの特徴に近づけるための変換式が生成されてもよい。なお、特徴パラメータは、例えば、学習データ自体を解析することで生成されてもよい。一方、変換式は、例えば、学習データの各デジタルパラメータを変化させつつ実際に判定を行った結果に基づいて生成されてもよい。
図4は、本実施形態に係る学習データセット及び特徴パラメータセットの一例を示す図である。図4に示すように、学習データセットは、例えば、学習データである診断画像(染色画像G1、G2、…)と、正解データである診断対象の病変領域(正解領域画像R1、R2、…)との組み合わせ(学習データに相当)の集合で構成されている。個々の診断画像には、例えば、それぞれを一意に識別するためのデータIDが付されていてもよい。
また、学習データセットに付加される特徴パラメータセットは、アナログパラメータセットと、デジタルパラメータセットとを含む。アナログパラメータセットは、例えば、組織切片に関するパラメータとしての組織の厚さ、染色に関するパラメータとしての染色マーカの製造メーカ、染色濃度及び染色時間、組織切片の封入に関するパラメータとしてのカバーガラスの厚さ等を含んでもよい。一方、デジタルパラメータは、例えば、撮影に関するパラメータとしてのガンマ値及び画像の圧縮率等を含んでもよい。ただし、これらに限定されず、上述した各種パラメータを含め、種々変形されてよい。また、個々のパラメータは、学習データセットにおける各学習データに対応付けられていてよい。
1.4 情報処理システムの概略
次に、本実施形態に係る情報処理システムの概略構成について、例を挙げて説明する。図5は、本実施形態に係る情報処理システム100の概略構成例を示すブロック図である。図5に示すように、情報処理システム100は、取得部102と、処理部103と、推定部104と、学習部107と、表示部106とを備える。
取得部102は、患者または被験者の健康状態の推定を行う学習済みモデル105の生成に使用された学習データ109の特徴量に基づく調整情報を取得する。
処理部103は、取得部102で取得された調整情報に基づき、判定対象である生体試料101に対し所定の処理を実行する。
推定部104は、学習済みモデル105を有し、処理部103によって取得された測定データを学習済みモデル105(例えば、図1のAI2)に入力して診断結果を推定する。
学習部107は、学習モデル108を学習データ109を用いてトレーニング(学習)することで、測定データから診断結果を推定するための学習済みモデル105を生成する。
表示部106は、推定部104で推定された診断結果を医師や病理医などのユーザに提示する。
1.5 システム構成
次に、図5に示す情報処理システム100を医療現場等に導入した際の具体的なシステム構成例について説明する。図6は、本実施形態に係る診断支援システム(情報処理システム、情報処理装置)の構成例を示すブロック図である。なお、本説明では、病理システム10からAI2(後述する学習モデルに相当)をトレーニングするための学習データセットを取得し、これを用いてトレーニングされた学習済みのAI2(後述する学習済みモデル55に相当)を病理システム20へ提供する場合を例示する。ただし、これに限定されず、学習データセットは病理システム10及び20などの複数の病理システムから収集されるなど、適宜変形されてよい。
図6は、本実施形態に係る診断支援システムの概略構成例を示す図である。図6に示すように、診断支援システム1は、病理システム10と、病理システム20と、医療情報システム30と、導出装置40とを含む。
(病理システム10/20)
病理システム10は、主に病理医が使用するシステムであり、例えば、図1における病院Aに相当し得る。図6に示すように、病理システム10は、測定機器11と、サーバ12と、表示制御装置13と、表示装置14とを含む。
測定機器11は、例えば、DPI(Digital Pathology Imaging)スキャナ、CT(Computed Tomography)/MRI(Magnetic Resonance Imaging)/PET(Positron Emission Tomography)、顕微鏡、内視鏡など、患部の画像データや患者から採取した組織切片等の画像データを取得する1以上の医療機器や情報処理装置などであってよい。なお、本例では、画像データは、例えば、患者や患者から採取した組織切片等の染色画像であってよい。本説明において、画像データは、例えば、染色画像であってよい。
サーバ12は、病理システム10において医師や病理医等のユーザに対する診断の支援や測定機器11で取得された画像データの保持、管理等を実行する。なお、測定機器11によって取得された画像データは、例えば、サーバ12が備える、又は、サーバに接続された記憶部等に格納されてよい。
表示制御装置13は、患者に関する電子カルテや診断結果や推定された診断結果等の各種情報の閲覧要求をユーザから受け付け、受け付けられた閲覧要求をサーバ12に送る。そして、表示制御装置13は、閲覧要求に対してサーバ12から受信した各種情報を表示するように表示装置14を制御する。
表示装置14は、例えば、液晶、EL(Electro‐Luminescence)、CRT(Cathode Ray Tube)などが用いられた画面を有する。表示装置14は4Kや8Kに対応していてもよいし、複数の表示装置により形成されてもよい。表示装置14は、例えば、図5に示した構成における表示部106に相当し得、表示制御装置13からの制御に応じて各種情報をユーザに表示する。
病理システム20は、病理システム10と異なる病院に適用されるシステムであり、例えば、図1における病院B~Eに相当し得る。病理システム20は、例えば病理システム10と同様に、測定機器21と、サーバ22と、表示制御装置23と、表示装置24とを備えてもよい。その場合、病理システム20に含まれる各部は病理システム10と同様であってよいため、それらの説明を省略する。
(医療情報システム30)
医療情報システム30は、いわゆる電子カルテシステムであり、患者に対して医師や病理医等が現在又は過去に行った診断の結果等(以下、診断データともいう)の保持、管理等を実行する。診断データは、学習データにおける正解データであり、例えば、図4における診断対象の病変領域(正解領域画像R1、R2、…)であってよい。なお、診断データには、例えば、診断データと画像データとを紐付ける識別情報(例えば、データID)が含まれてよい。その他、診断データには、患者を識別する情報、患者の疾患情報、患者の既往歴、診断に用いた検査情報、処方薬などが含まれてもよい。
(導出装置40)
導出装置40は、例えば、病理システム10のサーバ12において日々蓄積されている画像データを取得する。また、導出装置40は、医療情報システム30において日々蓄積されている診断データを取得する。導出装置40は、収集した画像データ及び診断データから学習データセットを生成し、生成された学習データセットを教師データとして学習モデルをトレーニングすることで、画像データに基づいて患者の診断結果を推定するための学習済みモデルを生成する。
なお、診断支援システム1に含まれる病理システムは3以上であってもよい。この場合、導出装置40は、それぞれの病理システムに蓄積される測定情報を収集し、収集した画像データ及び診断データから学習データセットを生成して学習モデルをトレーニングしてもよい。また、上記例において、医療情報システム30は、病理システム10及び/又は20に組み込まれてもよい。その場合、収集された画像データ及び診断データは、サーバ12及び/又は22に保存されてもよい。
また、本実施形態に係る導出装置40は、ネットワーク上に配置されたサーバやクラウドサーバ等により実現されてもよいし、病理システム10/20に配置されたサーバ12/22により実現されてもよい。もしくは、導出装置40の一部がネットワーク上に配置されたサーバやクラウドサーバ等により実現され、残りの一部が病理システム10/20のサーバ12/22により実現されるなど、ネットワークを介して構築されたシステム上に分散配置されることで実現されてもよい。
1.6 導出装置
つづいて、本実施形態に係る導出装置40の構成例について説明する。図7は、本実施形態に係る導出装置の構成例を示すブロック図である。図7に示すように、導出装置40は、通信部41と、記憶部42と、制御部43とを備える。
通信部41は、例えば、NIC(Network Interface Card)等によって実現される。通信部41は、図示しないネットワークと有線又は無線で接続され、ネットワークを介して、病理システム10、病理システム20、医療情報システム30等との間で情報の送受信を行う。後述する制御部43は、通信部41を介して、これらの装置との間で情報の送受信を行う。
記憶部42は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部42は、制御部43によって生成される学習済みモデル55を記憶する。学習済みモデル55については後述する。
制御部43は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)が、導出装置40内部に記憶されたプログラム(診断支援プログラムの一例)がRAM(random Access Memory)等を作業領域として実行することにより実現されてよい。ただし、制御部43は、例えばASIC(Application specific Integrated Circuit)やFPGA(Field Programmable gate Array)等の集積回路により実行されてもよい。
図7に示すように、制御部43は、画像データ取得部51と、診断データ取得部52と、学習部53と、導出部54と、前処理部56と、評価部57とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部43の内部構成は、図7に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
画像データ取得部51は、学習部53で行われる学習モデルのトレーニングに用いられる画像データを、例えばサーバ12から通信部41を介して取得する。この画像データには、アナログ工程において記録されたアナログパラメータセットと、画像データを解析することで得られたデジタルパラメータとを含む特徴パラメータセット対応付けられていてよい。また、画像データ取得部51は、導出部54で行われる診断結果の推定(判定)に用いられる画像データ(図1における測定データに相当)を、例えばサーバ22から通信部41を介して取得する。取得された測定データは、適宜、記憶部42等に蓄積されてもよい。なお、以下の説明において、学習モデルのトレーニングに用いられる画像データと診断結果の推定(判定)に用いられる画像データとを区別する場合、前者を学習用画像データといい、後者を測定データという。
診断データ取得部52は、学習部53で行われる学習モデルのトレーニングに用いられる学習データの1つである診断データを、例えばサーバ12や医療情報システム30から通信部41を介して取得する。取得された診断データは、適宜、記憶部42等に蓄積されてもよい。
学習部53は、例えば、図5に示した構成における学習部107に相当し得、画像データ取得部51によって各学習用画像データと、診断データ取得部52によって取得された各診断データとの紐付けから、学習モデルをトレーニングするための教師データセットを生成し、生成された学習データセットを用いて学習モデルをトレーニングする。これによりトレーニングされた学習済みモデル55は、例えば記憶部42に格納され、必要に応じて適宜読み出される。
なお、学習部53による学習モデルのトレーニング手法はいかなるアルゴリズムの基づくものであってもよい。例えば、学習部53は、多層のニューラルネットワーク(Deep Neural Network)による機械学習手法である深層学習(ディープラーニング)、サポートベクターマシン(support vector machine)、クラスタリング、強化学習等の各種学習アルゴリズムを用いて学習済みモデル55を生成することができる。
導出部54は、例えば、図5に示した構成における推定部104に相当し得、サーバ12/22を介してユーザから特定の患者に対する診断結果の推定が要求されると、指定された患者の測定データを取得して学習済みモデル55に入力することで、学習済みモデル55に診断結果を推定させる。これにより推定された診断結果は、例えば、サーバ12/22へ送信され、表示制御装置13/23による制御の下、表示装置14/24に表示される。
前処理部56は、例えば、図5に示した構成における取得部102及び処理部103に相当し得、上述した第1及び第2前処理を実行する。例えば、第1前処理では、前処理部56は、病理システム20から取得された測定データに対し、その特徴が学習データセットにおける学習用画像データの特徴に近づくように前処理を実行する。ここでいう特徴は、デジタルパラメータであってよい。例えば、前処理部56は、測定データの明度(色調であってもよい)や色相やホワイトバランスやガンマ値やカラーチャートなどの各デジタルパラメータが学習用画像データ全体の各デジタルパラメータの分布に対して設定されたターゲット範囲内に入るように、測定データの各デジタルパラメータを調整する。または、前処理部56は、測定データの各デジタルパラメータが学習用画像データ全体の各デジタルパラメータの分布における中央値(又は平均値)や重心値等に近づくように、測定データの各デジタルパラメータを調整する。なお、ターゲット範囲とは、目標とする推定精度を達成するための各デジタルパラメータの範囲であってよく、例えば、導出部54(すなわち、学習済みモデル55)により導出される推定結果の信頼度(例えば、スコア)があらかじめ設定しておいた値以上となる範囲又は当該値以上となることが見込まれる範囲であってよい。
また、第2前処理では、前処理部56は、測定データの各デジタルパラメータを学習用画像データの各デジタルパラメータに近づけるために測定段階でユーザが物理的に調整/変更すべきアナログパラメータに関する情報(以下、推奨情報という)を生成し、生成した推奨情報をサーバ22へ送信する。送信された推奨情報は、例えば、表示制御装置23による制御の下、表示装置24に表示される。ユーザが表示装置24に表示された推奨情報に基づき、組織切片の種類、厚さ等、染色に使用したマーカの種類、製造メーカ、染色濃度、染色時間等、組織切片を封入するカバーバラスの種類、厚さ等、撮影するカメラの型式、製造メーカ、ガンマ値、圧縮率等、励起光源の種類、製造メーカ、出力ワット数等、測定時の温度や湿度や照度等、測定を行う技術士や医師などのアナログパラメータを調整/変更することで、学習用画像データの特徴に近い特徴を備える判定用測定情報を取得することが可能となる。ここでいう特徴は、デジタルパラメータであってよい。
評価部57は、例えば、導出部54により導出される診断結果の信頼度(例えば、スコア)を算出して学習済みモデル55を評価する。なお、評価部57により算出された信頼度は、上述したように、前処理部56による測定データのデジタルパラメータの自動調整及び/又はユーザへ提供する推奨情報の生成等に使用されてもよい。
また、評価部57は、エラーが発生した測定データ(例えば、診断結果の信頼度が予め設定しておいた閾値よりも低い測定データ)に対して因子解析を行い、診断結果の推定に悪影響を与えている因子(本説明では、デジタルパラメータ)を特定してもよい。悪影響を与えている因子は、例えば、正解データである診断結果と導出された推定結果の信頼度とに基づいて測定データを分類し、この分類においてどのデジタルパラメータが結果の推定に強く寄与していたかを因子解析を用いて算出することで特定されてもよい。
これに対し、前処理部56は、悪影響を与えているとして特定されたデジタルパラメータを調整してもよい。そして、導出部54は、パラメータ調整後の測定データを用いて再度、診断結果の推定を実行してもよい。
悪影響を与えているとして特定されたデジタルパラメータの調整は、自動であっても手動であってもよい。自動で調整する場合には、例えば、エラーが発生した測定データを特定し、この測定データのデジタルパラメータうちの悪影響を与えているデジタルパラメータをターゲット範囲内となるように又は中央値等により近づくように調整してもよい。
1.7 学習モデルの学習
次に、制御部43における学習モデルの学習について説明する。図8は、本実施形態に係る学習モデルの学習を説明するための図である。図8に示すように、学習モデルの学習では、例えば記憶部42に格納されている学習前の学習モデルが学習部53に読み込まれる。また、学習部53には、画像データ取得部51で取得された学習用画像データ及び診断データ取得部52で取得された診断データよりなる学習データセットのうち、学習用画像データ(本説明では、染色画像)が入力される。それにより、学習部53からは、学習モデルにより導出された診断結果(本説明では、病変領域画像)が出力される。
学習部53から出力された診断結果は、評価部57に入力される。評価部57には、学習データセットにおける診断データ(正解データ。本説明では、正解領域画像)も入力される。評価部57は、入力された診断結果(推定結果)と診断データ(正解データ)とから学習モデルの推定精度を評価し、その評価結果に基づいて学習モデルのハイパーパラメータを更新する。このような動作を所定回数又は所望の推定精度が得られるまで繰り返すことで、学習データセットによりトレーニングされた学習済みモデル55が生成される。
1.8 学習済みモデルを用いた診断結果の推定
つづいて、以上のように生成された学習済みモデル55を用いて診断結果を推定する場合について説明する。図9は、本実施形態に係る学習済みモデルを用いて診断結果を推定する場合の動作を説明するための図である。
図9に示すように、学習済みモデルを用いた診断結果の推定では、前処理部56は、学習済みモデル55の導入元(例えば、病院A)から提供された特徴パラメータセットにおける各デジタルパラメータの統計情報と、導入先(例えば、病院B~E)で収集した1又は複数の測定データに関する各デジタルパラメータ又はその統計情報とに基づいて、学習用画像データの特徴と1又は複数の測定データの特徴とを近づける第1前処理を実行する。以下の説明において、学習データセットに紐付けられた特徴パラメータセットを学習特徴パラメータセットといい、1又は複数の測定データに紐付けられた特徴パラメータ又は特徴パラメータセットを測定特徴パラメータ又は測定特徴パラメータセットという。
そこで、前処理部56には、例えば、学習データセットに紐付けられた学習特徴パラメータセットが入力される。前処理部56は、入力された学習特徴パラメータセットに基づいて、学習特徴パラメータセットにおける各デジタルパラメータの統計情報(例えば、分散値及び中央値(又は平均値)若しくは重心値など)を算出してよい。ただし、例えば、病院A(図1参照)において学習特徴パラメータセットの統計情報が算出されている場合には、前処理部56には、学習特徴パラメータセットに代えて、病院Aが保持する統計情報が入力されてもよい。
また、前処理部56には、測定データの各デジタルパラメータが入力される。ただし、デジタルパラメータに代えて、測定データ自体が入力されてもよい。その場合、前処理部56は、入力された測定データから各デジタルパラメータの値を算出する。なお、判定対象の測定データが複数存在し、これらから一括して診断結果を推定する場合、前処理部56には、この複数の測定データに関する各デジタルパラメータの統計情報(例えば、分散値及び中央値(又は平均値)若しくは重心値など)が入力されてもよい。若しくは、前処理部56には、複数の測定データ自体又は各測定データのデジタルパラメータが入力されてもよい。その場合、前処理部56は、入力された複数の測定データ又はそのデジタルパラメータに基づいて、各デジタルパラメータの統計情報(例えば、分散値及び中央値(又は平均値)若しくは重心値など)を算出してよい。
前処理部56は、学習特徴パラメータセットにおける各デジタルパラメータの統計情報と、1又は複数の測定データに関する各デジタルパラメータ又はその統計情報とから、1又は複数の測定データの各デジタルパラメータが学習特徴パラメータセットにおける各デジタルパラメータの分布に対して設定されたターゲット範囲内に入るように、又は、1又は複数の測定データの各デジタルパラメータが学習特徴パラメータセットにおける各デジタルパラメータの分布の中央値(又は平均値)や重心値等に近づくように、1又は複数の測定データの各デジタルパラメータを調整するための変換式を生成する。この変換式には、例えば、単純な行列式など、種々の数式が用いられてよい。若しくは、変換式は、例えば、各測定データの各デジタルパラメータを、学習特徴パラメータセットにおける各デジタルパラメータの分布の中央値(又は平均値)若しくは重心値に単純に置き換えるような変換式であってもよい。
このようにして変換式を生成すると、前処理部56は、入力された1又は複数の測定データ(染色画像)の各デジタルパラメータを、生成された変換式を用いて調整する。これにより、1又は複数の測定データの各デジタルパラメータが、学習データセットにおける学習用画像データの各デジタルパラメータに近づくように調整される。そして、前処理部56は、パラメータ調整後の測定データを導出部54へ出力する。
導出部54に入力されたパラメータ調整後の測定データは、記憶部42から読み出された学習済みモデル55に入力される。したがって、導出部54では、学習データセットにおける学習用画像データの各デジタルパラメータに近づくように各デジタルパラメータが調整された測定データに基づいて診断結果(病変領域画像)が推定されるため、より信頼度の高い診断結果を得ることが可能となる。
1.9 ニューラルネットワークを用いた前処理
図9を用いた説明では、前処理部56が、学習特徴パラメータセットにおける各デジタルパラメータの統計情報と、1又は複数の測定データに関する各デジタルパラメータ又はその統計情報とから、変換式を生成する場合を例示したが、本実施形態に係る前処理(第1前処理)は、変換式を用いてデジタルパラメータを調整する手法に限定されない。例えば、学習特徴パラメータセットにおける各デジタルパラメータ又はその統計情報と、1又は複数の測定データに関する各デジタルパラメータ又はその統計情報とを入力としたニューラルネットワーク(以下、前処理モデルという)を用いて第1前処理が実行されてもよい。前処理モデルには、画像データを入力として画像データを出力する種々の学習モデルが用いられてよい。
図10は、本実施形態に係る前処理モデルを用いて第1前処理を実行する場合の動作を説明するための図である。図10に示すように、本例では、前処理モデルを生成するための前処理推定部58が新たに設けられている。
前処理推定部58には、例えば、学習データセットに紐付けられた学習特徴パラメータセットが入力される。前処理推定部58は、入力された学習特徴パラメータセットに基づいて、学習特徴パラメータセットにおける各デジタルパラメータの統計情報(例えば、分散値及び中央値(又は平均値)若しくは重心値など)を算出してよい。ただし、例えば、病院A(図1参照)において学習特徴パラメータセットの統計情報が算出されている場合には、前処理推定部58には、学習特徴パラメータセットに代えて、病院Aが保持する学習特徴パラメータセットの統計情報が入力されてもよい。
また、前処理推定部58には、測定データの各デジタルパラメータが入力される。ただし、デジタルパラメータに代えて、測定データ自体が入力されてもよい。その場合、前処理推定部58は、入力された測定データから各デジタルパラメータの値を算出する。なお、判定対象の測定データが複数存在し、これらから一括して診断結果を推定する場合、前処理推定部58には、この複数の測定データに関する各デジタルパラメータの統計情報(例えば、分散値及び中央値(又は平均値)若しくは重心値など)が入力されてもよい。若しくは、前処理推定部58には、複数の測定データ自体又は各測定データのデジタルパラメータが入力されてもよい。その場合、前処理推定部58は、入力された複数の測定データ又はそのデジタルパラメータに基づいて、各デジタルパラメータの統計情報(例えば、分散値及び中央値(又は平均値)若しくは重心値など)を算出してよい。
前処理推定部58は、学習特徴パラメータセットにおける各デジタルパラメータの統計情報と、1又は複数の測定データに関する各デジタルパラメータ又はその統計情報とを入力すると、入力されたこれらの情報に基づいて、前処理モデルにおけるニューロン間のつながりの強さを示す重みパラメータwを生成する。これにより、前処理モデルが、1又は複数の測定データに関する各デジタルパラメータ又はその統計情報を学習特徴パラメータセットにおける各デジタルパラメータの統計情報に近づけるようにチューニングされる。なお、重みパラメータwの生成手法、すなわち前処理モデルの作成/更新手法については、後述において説明する。
前処理推定部58によりチューニングされた前処理モデルは、前処理部56に読み込まれる。前処理部56は、入力された1又は複数の測定データ(染色画像)を前処理モデルに入力することで、1又は複数の測定データ(染色画像)の各デジタルパラメータを調整する。これにより、1又は複数の測定データの各デジタルパラメータが、学習データセットにおける学習用画像データの各デジタルパラメータに近づくように調整される。そして、前処理部56は、パラメータ調整後の測定データを導出部54へ出力する。
1.10 前処理モデルの学習(転移学習)
また、病院B~Eなど、学習済みモデル55の導入先においてある程度の量の診断済みの測定データが蓄積されている場合、この導入先において蓄積されている測定データを用いて前処理モデルを再学習(転移学習)することで、導出部54による推定精度を向上させることが可能である。図11は、本実施形態に係る学習済みモデルの再学習を説明するための図である。なお、図11には、図10をベースとした場合が例示されている。また、図11では、蓄積されている複数の測定データと各測定データに対する診断において示された診断データ(本例では、正解領域画像)との組み合わせが転移学習データセットとして示され、個々の診断済み測定データが転移学習用画像データとして示されている。
図11に示すように、導入先において蓄積されている転移学習用画像データを用いて前処理モデルを学習する場合、図10を用いて説明した構成と同様の構成において、導出部54から出力された診断結果が評価部57に入力される。なお、評価部57には、各転移学習用画像データに対する診断において示された診断データ(本例では、正解領域画像)も入力される。
評価部57は、例えば、入力された診断結果と診断データ(正解領域画像)とから学習済みモデル55の推定精度を評価し、その評価結果に基づいて前処理部56が備える前処理モデルを更新する。それにより、導出部54による推定精度が向上するように前処理を最適化できるため、導出部54による推定精度を向上させることが可能となる。
1.11 前処理モデルの作成/更新手法
ここで、前処理モデルの作成/更新は、学習済みモデル55のアーキテクチャに応じて最適化することが可能である。ただし、学習済みモデル55がホワイトボックスであるかブラックボックスであるか、すなわち、学習済みモデル55の内部の計算処理が分かるか分からないかでその作成/更新手法が異なる。なお、前処理モデルの作成/更新は、評価部57が実行してもよいし、前処理部56が実行してもよい。
1.11.1 学習済みモデルがホワイトボックスである場合
学習済みモデル55がホワイトボックスである、すなわち、学習済みモデル55の内部の計算処理が厳密に分かる場合、例えば、ロス関数を用いて算出される学習済みモデル55の推定精度の悪さ(損失ともいう)に基づいて、前処理モデルが最適化されてもよい。
推定精度の悪さには、例えば、画素ごとに組織や病変の識別を行う場合、画素ごとの識別損失(クロスエントロピー損失)の平均値を用いることができる。また、特定の病変領域の検出を行う場合には、検出した病変領域と正解領域との位置ずれ誤差を推定精度の悪さとすることができる。
前処理モデルの最適化では、学習特徴パラメータセットの統計情報から求められた前処理モデルから離れすぎないように、各重みパラメータwが調整されるとよい。これにより、学習特徴パラメータセットの統計情報から考えて妥当な範囲内の前処理モデルを学習結果として獲得でき、導入先での少ない転移学習用画像データに過剰に適合した診断結果の推定を回避することが可能となる。例えば、損失をL、学習特徴パラメータセットから推定した重みパラメータをw’とすると、学習で最小化すべき目的関数は、以下の式(1)とすることができる。
Figure 2022153142000002
なお、学習済みモデル55の内部の計算処理が厳密に分かる場合には、目的関数の勾配が計算可能であるため、通常のニューラルネットワークの学習と同様に、前処理モデルの学習を行うことができる。例えば、計算した勾配を用いて確率的勾配降下法で前処理モデルの重みパラメータwの更新を繰り返すことで、損失を最小化するように学習することが可能である。
Figure 2022153142000003
1.11.2 前処理モデルがブラックボックスである場合
一方、学習済みモデル55がブラックボックスである場合、すなわち、学習済みモデル55の内部の計算処理が不明である場合、例えば、学習済みモデル55の推定精度が向上するような前処理モデルの重みパラメータwを探索することで、前処理モデルが最適化されてもよい。
重みパラメータwの探索では、例えば、学習特徴パラメータセットから推定された重みパラメータw’から一定以上離れない範囲で、学習済みモデル55の推定精度を向上させる重みパラメータwが探索されてよい。この探索には、例えばベイズ最適化や遺伝的アルゴリズム(進化的計算)など、ブラックボックス関数の最適化に一般に用いられる手法が用いられてもよい。
1.11.3 その他
なお、前処理モデルの作成/更新では、例えば、診断結果の推定に対する寄与度が低いデジタルパラメータが存在する場合には、このデジタルパラメータに対する第1前処理(パラメータ値の調整)が省略されてもよい。
また、上述では、学習特徴パラメータセットの統計情報から推定された前処理モデルから離れすぎないという制限の下で前処理モデルの重みパラメータwを生成/更新することで、効果的に転移学習を実行する場合を例示したが、これに限定されるものではない。例えば、学習特徴パラメータセットの統計情報から測定データ(染色画像)の各デジタルパラメータの分布を推定し、第1前処理後の測定データの各デジタルパラメータが推定された分布から離れないように、前処理モデルの重みパラメータwが学習されるなど、種々変更されてもよい。
1.12 モデルの選択による推定精度の向上
また、例えば、学習済みモデル55が複数あり、それぞれが異なるドメイン(すなわち、異なる学習データセット)で学習されている場合、病理システム20で取得された測定データに適した学習済みモデルが複数の学習済みモデル55の中から選択されてもよい。この選択は、手動で行われてもよいし、自動で行われてもよい。自動で行う場合には、例えば、推論したい疾患に対し、その疾患と同種の疾患で学習された学習済みモデルがない場合、前処理部56は、複数の学習済みモデル55のうち、推論したい疾患から取得された測定データの特徴と最も近い特徴を備える学習データセットを用いて学習された学習済みモデルを自動的に選択してもよい。その場合、学習部53は、選択された学習済みモデルを同種の疾患例で再学習してもよい。このように、特徴が近いドメインで学習された学習済みモデル55を自動的に選択することで、症例数が少ない事例に対する推定精度を向上させることが可能となる。
さらに、例えば、前処理モデルが複数あり、それぞれに異なる重みパラメータwが設定されている場合、判定対象の測定データに対してより適した前処理モデル、すなわち、学習済みモデル55のより推定精度が向上される前処理モデルが選択されてもよい。この選択は、手動で行われてもよいし、自動で行われてもよい。自動で行う場合、前処理部56又は前処理推定部58は、例えば、それぞれの前処理モデルを用いて測定データに対する第1前処理を実行し、それにより得られたパラメータ調整後の測定データそれぞれを学習済みモデル55に入力した場合に得られた診断結果に対する評価に基づいて、より適した前処理モデルを選択してもよい。
1.13 フォーマットの統一
学習モデルによっては、入力とし得るデータのフォーマットが限定されている場合がある。例えば、画像データを入力とするほとんどの畳み込みニューラルネットワーク(CNN)を使用した深層学習アーキテクチャは、正方形の画像を入力画像としている。このため、正方形でない画像が入力されたときは、入力画像データを正方形に変更する処理が発生する。また、医療施設ごとで取得するデジタルパラメータやアナログパラメータが異なる場合には、前処理において調整する対象が一致せず、適切に前処理が実行できない場合が存在する。
例えば、導入元(例えば、病院A)と導入先(例えば、病院B~E)とで取得する画像データのサイズが異なる場合、前処理部56又は前処理推定部58は、導入先で取得された画像データのサイズを学習済みモデル55に適したサイズに変換してもよい。また、例えば、導入元(例えば、病院A)と導入先(例えば、病院B~E)とで取得するデジタルパラメータが異なる場合、前処理部56又は前処理推定部58は、導入先で収集されたデジタルパラメータ又は測定データから必要なデジタルパラメータを生成してもよい。なお、アナログパラメータに関しては、例えば、導入元(例えば、病院A)と導入先(例えば、病院B~E)とに管理すべきアナログパラメータを事前に提示するようにしてもよい。
1.14 デジタルパラメータ調整用のユーザインタフェース例
次に、前処理部56が実行する第1前処理において、ユーザに手動でデジタルパラメータを調整させる場合にユーザに提供されるパラメータ調整用ユーザインタフェースについて、いくつか例を挙げて説明する。なお、パラメータ調整用ユーザインタフェースは、例えば、前処理部56から病理システム20へ送信された情報に基づき、サーバ22が表示制御装置23を介して表示装置24に表示してもよい。
図12は、本実施形態に係るパラメータ調整用ユーザインタフェースの一例を示す図である。なお、図12では、判定用測定情報のデジタルパラメータのうちの1つのパラメータ#1(例えば、明度(又は色調)、色相、ホワイトバランス、ガンマ値、カラーチャート等のうちの1つ)を調整する際にユーザに提供されるユーザインタフェースの一例が示されている。
図12に示すように、パラメータ調整用ユーザインタフェースでは、例えば、学習用測定情報全体のパラメータ#1の分布D1を示すグラフが表示される。このグラフでは、横軸がパラメータ#1の値を示し、縦軸が学習用測定情報における各値の出現頻度を示してもよい。ただし、これに限定されず、縦軸は、例えば、パラメータ#1の各値で推定した際に導出される診断結果の正解率(例えば、信頼度)など、種々変更されてよい。また、このグラフには、所望の正解率を得られるパラメータ#1の値の範囲R11、及び/又は、学習用測定情報全体のパラメータ#1の分布の中央値(又は平均値)C1が示されていてもよい。
このようなグラフに対し、パラメータ調整用インタフェースでは、調整対象の判定用測定情報のパラメータ#1の値を示すスライダ110が表示される。このスライダ110は、例えば、横軸に沿って移動可能であり、初期状態では、調整対象の判定用測定情報のパラメータ#1の現在値を示している。前処理部56は、例えば、ユーザがキーボードやマウスやタッチパネルなどの入力デバイスを用いてスライダ110をスライドさせると、スライド後のスライダ110が示すパラメータ#1の調整値となるように、調整対象の判定用測定情報のパラメータ#1の値を調整する。したがって、ユーザは、範囲R11内に位置するように、若しくは、中央値C1に近づくように、スライダ110を移動させることで、所望の正解率を得られるように、又は、正解率が改善するように、調整対象の判定用測定情報のパラメータ#1の値を調整することができる。
また、図13は、本実施形態に係るパラメータ調整用ユーザインタフェースの他の一例を示す図である。なお、図13では、判定用測定情報のデジタルパラメータのうちの2つのパラメータ#1及び#2(例えば、明度(又は色調)、色相、ホワイトバランス、ガンマ値、カラーチャート等のうちの2つ)を調整する際にユーザに提供されるユーザインタフェースの一例が示されている。
図13に示すように、パラメータ調整用ユーザインタフェースの他の例では、例えば、学習用測定情報全体における各測定情報のパラメータ#1及び#2の2次元分布D2を示すグラフが表示される。このグラフでは、横軸がパラメータ#1の値を示し、縦軸がパラメータ#2の値を示してもよい。また、このグラフには、所望の正解率を得られるパラメータ#1及び#2の組合せの範囲R12、及び/又は、学習用測定情報全体のパラメータ#1及び#2の分布の重心値C2が示されていてもよい。
このようなグラフに対し、パラメータ調整用インタフェースでは、調整対象の判定用測定情報のパラメータ#1及び#2の値を示すプロット120が表示される。このプロット120は、例えば、縦軸及び横軸が示す2次元座標系において移動可能であり、初期状態では、調整対象の判定用測定情報のパラメータ#1及び#2の現在値を示している。前処理部56は、例えば、ユーザがキーボードやマウスやタッチパネルなどの入力デバイスを用いてプロット120を移動させると、移動後のプロット120が示すパラメータ#1及び#2の値となるように、調整対象の判定用測定情報のパラメータ#1及び#2の値を調整する。したがって、ユーザは、範囲R12内に位置するように、若しくは、重心値C2に近づくように、プロット120を移動させることで、所望の正解率を得られるように、又は、正解率が改善するように、調整対象の判定用測定情報のパラメータ#1及び#2の値を調整することができる。なお、組み合わせるパラメータ#1及び#2は、互いに相関のあるデジタルパラメータであってもよいし、相関の無いデジタルパラメータであってもよい。
なお、上述では、各判定用測定情報、すなわち、1つ1つの画像データのデジタルパラメータをパラメータ調整用インタフェースを用いて手動で調整する場合を例示したが、これに限定されず、複数の判定用測定情報全体のデジタルパラメータをパラメータ調整用インタフェースを用いて一括して調整できてもよい。その場合、図12に示すスライダ110又は図13に示すプロット120は、複数の判定用測定情報全体のパラメータ#1又は#1及び#2の平均値、中央値、重心値等であってもよい。また、スライダ110又はプロット120を用いた調整後の判定用測定情報それぞれの各デジタルパラメータは、複数の判定用測定情報全体の各デジタルパラメータの分布の広がり(例えば、分散値や半値全幅等)が小さくなるように調整されてもよい。
1.15 モデル選択用のユーザインタフェース例
続いて、学習済みモデル55/前処理モデルが複数存在する場合に、ユーザに複数の学習済みモデル55/前処理モデルの中から所望するモデルを手動で選択させるためのユーザインタフェース(以下、モデル選択用ユーザインタフェースという)について、例を挙げて説明する。なお、以下の説明では、前処理モデルを手動で選択させるための構成を例示するが、学習済みモデル55を手動で選択させるための構成も同様の構成であってよい。
図14は、本実施形態に係るモデル管理テーブルの一例を示す図である。図15は、本実施形態に係るモデル選択用ユーザインタフェースの一例を示す図である。
図14に示すように、前処理部56に読み込まれる前処理モデルに複数の候補(前処理モデルa、b、…)が存在する場合、前処理部56又は前処理推定部58は、前処理モデルa、b、…それぞれで第1前処理を行った場合に学習済みモデル55から出力される診断結果に対する評価部57による評価結果を管理するモデル管理テーブルを作成してもよい。なお、評価結果は、例えば、転移学習用画像データに対して過去の診断によって付された正解ラベル(正解ラベル(正解領域画像)に相当)と導入先の学習済みモデル55により推定された推定ラベル(診断結果)との面積一致率、正解ラベルが付された領域と推定ラベルが付された領域との一致率、正解ラベルが付された領域でない領域に付された推定ラベルの数(擬陽性数)などであってもよい。
以上のようなモデル管理テーブルで管理されている評価結果は、図15に示すように、前処理モデルa、b、…ごとの診断結果と共に、モデル選択用ユーザインタフェースを介してユーザに提示されてもよい。また、モデル選択用ユーザインタフェースでは、診断結果の推定に使用した測定データ(染色画像)と、学習済みモデル55で導出された診断結果(推定ラベル。病変領域画像に相当)とが、前処理モデルa、b、…ごとに提示されてもよい。なお、図15において、実線で囲まれた領域は、転移学習用画像データに対して過去の診断によって付された正解ラベル(正解ラベル(正解領域画像)に相当)を示し、破線で囲まれた領域は、導入先において推定された推定ラベル(診断結果)を示している。また、このモデル選択用ユーザインタフェースは、前処理部56又は前処理推定部58において生成され、表示装置24に表示されてもよいし、前処理部56又は前処理推定部58から必要な情報を受信したサーバ22又は表示制御装置23において生成され、表示装置24に表示されてもよい。
モデル選択用ユーザインタフェースを用いた前処理モデルの選択では、ユーザは、例えば、モデル選択用ユーザインタフェースに表示された各前処理モデルの診断結果及び評価結果を参考に、表示されているいずれかのイメージ又はテキストを選択してもよい。この選択の入力に対し、前処理部56又は前処理推定部58は、選択された前処理モデルを読み込む又は前処理部56に読み込ませる。それにより、前処理部56においてユーザにより指定された前処理モデルを用いた第1前処理が実行される。
2.ハードウエア構成
上述してきた実施形態及びその変形例に係るサーバ12/22、表示制御装置13/23、医療情報システム30、導出装置40等は、例えば図16に示すような構成のコンピュータ1000によって実現され得る。図16は、サーバ12/22、表示制御装置13/23、医療情報システム30、導出装置40等の機能を実現するコンピュータ1000の一例を示すハードウエア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インタフェース1500、及び入出力インタフェース1600を有する。コンピュータ1000の各部は、バス1050によって接続される。
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、CPU1100は、ROM1300又はHDD1400に格納されたプログラムをRAM1200に展開し、各種プログラムに対応した処理を実行する。
ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるBIOS(Basic Input Output System)等のブートプログラムや、コンピュータ1000のハードウエアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、HDD1400は、プログラムデータ1450の一例である本開示に係る各動作を実行するためのプログラムを記録する記録媒体である。
通信インタフェース1500は、コンピュータ1000が外部ネットワーク1550(例えばインターネット)と接続するためのインタフェースである。例えば、CPU1100は、通信インタフェース1500を介して、他の機器からデータを受信したり、CPU1100が生成したデータを他の機器へ送信したりする。
入出力インタフェース1600は、上述したI/F部18を含む構成であり、入出力デバイス1650とコンピュータ1000とを接続するためのインタフェースである。例えば、CPU1100は、入出力インタフェース1600を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、CPU1100は、入出力インタフェース1600を介して、ディスプレイやスピーカやプリンタ等の出力デバイスにデータを送信する。また、入出力インタフェース1600は、所定の記録媒体(メディア)に記録されたプログラム等を読み取るメディアインタフェースとして機能してもよい。メディアとは、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が上述の実施形態に係るサーバ12/22、表示制御装置13/23、医療情報システム30、導出装置40等として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、サーバ12/22、表示制御装置13/23、医療情報システム30、導出装置40等の機能を実現する。また、HDD1400には、本開示に係るプログラム等が格納される。なお、CPU1100は、プログラムデータ1450をHDD1400から読み取って実行するが、他の例として、外部ネットワーク1550を介して、他の装置からこれらのプログラムを取得してもよい。
[その他]
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述した実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。
なお、本技術は以下のような構成も取ることができる。
(1)
患者または被験者の健康状態の推定を行う学習済みモデルの生成に使用された学習データの特徴量に基づく調整情報を取得する取得部と、
前記調整情報に基づき、判定対象である生体試料に対し処理を行う処理部と、
前記処理によって取得した測定データを、前記学習済みモデルに入力して診断結果を推定する推定部と、
を備える情報処理システム。
(2)
前記学習済みモデルは、複数の前記学習データを含む学習データセットを用いて生成され、
前記取得部は、前記学習データセットに含まれる前記複数の学習データの特徴量についての統計情報に基づいて前記調整情報を取得する
前記処理部による前記処理は、前記調整情報に基づく前記測定データの特徴量の調整である
前記(1)に記載の情報処理システム。
(3)
前記処理部は、調整後の前記測定データの特徴量が前記複数の学習データの特徴量についての前記統計情報に対して設定された所定の範囲内に入るように、前記測定データの特徴量を調整する
前記(2)に記載の情報処理システム。
(4)
前記所定の範囲は、前記学習済みモデルから出力される推定結果の信頼度があらかじめ設定しておいた値以上となる範囲又は当該値以上となることが見込まれる範囲である
前記(3)に記載の情報処理システム。
(5)
前記処理部は、調整後の前記測定データの特徴量が前記複数の学習データの特徴量についての前記統計情報における中央値、平均値又は重心値に近づくように、前記測定データの特徴量を調整する
前記(2)に記載の情報処理システム。
(6)
前記処理部は、前記複数の学習データの特徴量についての前記統計情報と前記測定データの特徴量とから、前記測定データの特徴量を前記学習データの特徴量に近づけるように変換する変換式を生成し、前記変換式を用いて前記測定データの特徴量を調整する
前記(2)~(5)の何れか1つに記載の情報処理システム。
(7)
前記処理部は、画像データを入力とするニューラルネットワークを用いて、前記特徴量が前記学習データの特徴量に近づくように調整された前記測定データを出力し、
前記推定部は、前記学習済みモデルに調整後の前記測定データを入力して診断結果を推定する
前記(2)~(5)の何れか1つに記載の情報処理システム。
(8)
前記複数の学習データの特徴量についての前記統計情報に基づいて前記ニューラルネットワークの重みパラメータを調整する前処理推定部をさらに備える
前記(7)に記載の情報処理システム。
(9)
前記学習済みモデルにより推定された前記診断結果を評価し、当該評価に基づいて前記ニューラルネットワークの前記重みパラメータを調整する評価部をさらに備える
前記(8)に記載の情報処理システム。
(10)
前記学習済みモデルにより推定された前記診断結果を評価する評価部をさらに備え、
前記処理部は、互いに異なる複数のニューラルネットワークそれぞれを用いた場合に前記学習済みモデルから出力される診断結果それぞれに対して前記評価部が出力した評価に基づいて、前記複数のニューラルネットワークのうちの1つを選択する
前記(9)に記載の情報処理システム。
(11)
前記処理部は、複数のニューラルネットワークそれぞれを用いた場合に前記学習済みモデルから出力される診断結果それぞれに対して前記評価部が出力した評価を提示するユーザインタフェースに対してユーザが選択したニューラルネットワークに基づいて、前記複数のニューラルネットワークのうちの1つを選択する
前記(9)に記載の情報処理システム。
(12)
前記評価部は、前記測定データの特徴量のうち、前記学習済みモデルによる前記診断結果の推定に悪影響を与えている特徴量を特定し、
前記処理部は、前記評価部により特定された前記特徴量をさらに調整する
前記(9)~(11)の何れか1つに記載の情報処理システム。
(13)
前記処理部は、前記複数の学習データの特徴量についての前記統計情報と前記測定データの特徴量との関係を提示するユーザインタフェースに対してユーザが入力した前記測定データの特徴量の調整値となるように、前記測定データの特徴量を調整する
前記(2)に記載の情報処理システム。
(14)
前記処理部は、異なる学習データで学習された複数の学習済みモデルのうちから前記測定データの特徴量に近い特徴量を持つ学習データで学習された前記学習済みモデルを選択する
前記(1)~(13)の何れか1つに記載の情報処理システム。
(15)
前記学習データ及び前記測定データは、画像データであり、
前記特徴量は、明度、色相、ホワイトバランス、ガンマ値及びカラーチャートのうちの少なくとも1つを含む
前記(1)~(14)の何れか1つに記載の情報処理システム。
(16)
ユーザに対して情報を提示する表示部をさらに備え、
前記特徴量は、前記学習データを取得する際の物理的な条件を含み、
前記処理部は、前記測定データの特徴量を前記学習データの特徴量に近づけるために推奨される前記測定データを取得する際の物理的な条件を特定し、
前記表示部は、前記処理部により特定された前記物理的な条件をユーザに提示する
前記(1)~(15)の何れか1つに記載の情報処理システム。
(17)
前記物理的な条件は、前記学習データ又は前記測定データを取得する際の工程においてユーザにより手動で調整されるパラメータである
前記(16)に記載の情報処理システム。
(18)
前記学習データ及び前記測定データは、医療画像である
前記(1)~(17)の何れか1つに記載の情報処理システム。
(19)
コンピュータを機能させるためのプログラムであって、
前記コンピュータを、
患者または被験者の健康状態の推定を行う学習済みモデルの生成に使用された学習データの特徴量を取得する取得部と、
判定対象である生体試料の測定データの特徴量と前記学習データの特徴量の比較結果に基づき、処理部の調整情報を出力する出力部と、
として機能させるためのプログラム。
(20)
患者または被験者の健康状態の推定を行う学習済みモデルの生成に使用された学習データの特徴量に基づく調整情報を取得する取得部と、
前記調整情報に基づき、判定対象である生体試料に対し処理を行う処理部と、
を備える、生体試料処理装置。
(21)
コンピュータを機能させるためのプログラムであって、
前記コンピュータを、
患者または被験者の健康状態の推定を行う学習済みモデルの生成に使用された学習データの特徴量に基づき処理を行った、生体試料の測定データを取得する取得部と、
前記測定データを、前記学習済みモデルに入力して診断結果を推定する推定部と
として機能させるためのプログラム。
1 診断支援システム
2 AI
10、20 病理システム
11、21 測定機器
12、22 サーバ
13、23 表示制御装置
14、24 表示装置
30 医療情報システム
40 導出装置
41 通信部
42 記憶部
43 制御部
51 画像データ取得部
52 診断データ取得部
53 学習部
54 導出部
55 学習済みモデル
56 前処理部
57 評価部
58 前処理推定部
100 情報処理システム
101 生体試料
102 取得部
103 処理部
104 推定部
105 学習済みモデル
106 表示部
107 学習部
108 学習モデル
109 学習データ

Claims (21)

  1. 患者または被験者の健康状態の推定を行う学習済みモデルの生成に使用された学習データの特徴量に基づく調整情報を取得する取得部と、
    前記調整情報に基づき、判定対象である生体試料に対し処理を行う処理部と、
    前記処理によって取得した測定データを、前記学習済みモデルに入力して診断結果を推定する推定部と、
    を備える情報処理システム。
  2. 前記学習済みモデルは、複数の前記学習データを含む学習データセットを用いて生成され、
    前記取得部は、前記学習データセットに含まれる前記複数の学習データの特徴量についての統計情報に基づいて前記調整情報を取得する
    前記処理部による前記処理は、前記調整情報に基づく前記測定データの特徴量の調整である
    請求項1に記載の情報処理システム。
  3. 前記処理部は、調整後の前記測定データの特徴量が前記複数の学習データの特徴量についての前記統計情報に対して設定された所定の範囲内に入るように、前記測定データの特徴量を調整する
    請求項2に記載の情報処理システム。
  4. 前記所定の範囲は、前記学習済みモデルから出力される推定結果の信頼度があらかじめ設定しておいた値以上となる範囲又は当該値以上となることが見込まれる範囲である
    請求項3に記載の情報処理システム。
  5. 前記処理部は、調整後の前記測定データの特徴量が前記複数の学習データの特徴量についての前記統計情報における中央値、平均値又は重心値に近づくように、前記測定データの特徴量を調整する
    請求項2に記載の情報処理システム。
  6. 前記処理部は、前記複数の学習データの特徴量についての前記統計情報と前記測定データの特徴量とから、前記測定データの特徴量を前記学習データの特徴量に近づけるように変換する変換式を生成し、前記変換式を用いて前記測定データの特徴量を調整する
    請求項2に記載の情報処理システム。
  7. 前記処理部は、画像データを入力とするニューラルネットワークを用いて、前記特徴量が前記学習データの特徴量に近づくように調整された前記測定データを出力し、
    前記推定部は、前記学習済みモデルに調整後の前記測定データを入力して診断結果を推定する
    請求項2に記載の情報処理システム。
  8. 前記複数の学習データの特徴量についての前記統計情報に基づいて前記ニューラルネットワークの重みパラメータを調整する前処理推定部をさらに備える
    請求項7に記載の情報処理システム。
  9. 前記学習済みモデルにより推定された前記診断結果を評価し、当該評価に基づいて前記ニューラルネットワークの前記重みパラメータを調整する評価部をさらに備える
    請求項8に記載の情報処理システム。
  10. 前記学習済みモデルにより推定された前記診断結果を評価する評価部をさらに備え、
    前記処理部は、互いに異なる複数のニューラルネットワークそれぞれを用いた場合に前記学習済みモデルから出力される診断結果それぞれに対して前記評価部が出力した評価に基づいて、前記複数のニューラルネットワークのうちの1つを選択する
    請求項9に記載の情報処理システム。
  11. 前記処理部は、複数のニューラルネットワークそれぞれを用いた場合に前記学習済みモデルから出力される診断結果それぞれに対して前記評価部が出力した評価を提示するユーザインタフェースに対してユーザが選択したニューラルネットワークに基づいて、前記複数のニューラルネットワークのうちの1つを選択する
    請求項9に記載の情報処理システム。
  12. 前記評価部は、前記測定データの特徴量のうち、前記学習済みモデルによる前記診断結果の推定に悪影響を与えている特徴量を特定し、
    前記処理部は、前記評価部により特定された前記特徴量をさらに調整する
    請求項9に記載の情報処理システム。
  13. 前記処理部は、前記複数の学習データの特徴量についての前記統計情報と前記測定データの特徴量との関係を提示するユーザインタフェースに対してユーザが入力した前記測定データの特徴量の調整値となるように、前記測定データの特徴量を調整する
    請求項2に記載の情報処理システム。
  14. 前記処理部は、異なる学習データで学習された複数の学習済みモデルのうちから前記測定データの特徴量に近い特徴量を持つ学習データで学習された前記学習済みモデルを選択する
    請求項1に記載の情報処理システム。
  15. 前記学習データ及び前記測定データは、画像データであり、
    前記特徴量は、明度、色相、ホワイトバランス、ガンマ値及びカラーチャートのうちの少なくとも1つを含む
    請求項1に記載の情報処理システム。
  16. ユーザに対して情報を提示する表示部をさらに備え、
    前記特徴量は、前記学習データを取得する際の物理的な条件を含み、
    前記処理部は、前記測定データの特徴量を前記学習データの特徴量に近づけるために推奨される前記測定データを取得する際の物理的な条件を特定し、
    前記表示部は、前記処理部により特定された前記物理的な条件をユーザに提示する
    請求項1に記載の情報処理システム。
  17. 前記物理的な条件は、前記学習データ又は前記測定データを取得する際の工程においてユーザにより手動で調整されるパラメータである
    請求項16に記載の情報処理システム。
  18. 前記学習データ及び前記測定データは、医療画像である
    請求項1に記載の情報処理システム。
  19. コンピュータを機能させるためのプログラムであって、
    前記コンピュータを、
    患者または被験者の健康状態の推定を行う学習済みモデルの生成に使用された学習データの特徴量を取得する取得部と、
    判定対象である生体試料の測定データの特徴量と前記学習データの特徴量の比較結果に基づき、処理部の調整情報を出力する出力部と、
    として機能させるためのプログラム。
  20. 患者または被験者の健康状態の推定を行う学習済みモデルの生成に使用された学習データの特徴量に基づく調整情報を取得する取得部と、
    前記調整情報に基づき、判定対象である生体試料に対し処理を行う処理部と、
    を備える、生体試料処理装置。
  21. コンピュータを機能させるためのプログラムであって、
    前記コンピュータを、
    患者または被験者の健康状態の推定を行う学習済みモデルの生成に使用された学習データの特徴量に基づき処理を行った、生体試料の測定データを取得する取得部と、
    前記測定データを、前記学習済みモデルに入力して診断結果を推定する推定部と
    として機能させるためのプログラム。
JP2021056228A 2021-03-29 2021-03-29 情報処理システム、生体試料処理装置及びプログラム Pending JP2022153142A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2021056228A JP2022153142A (ja) 2021-03-29 2021-03-29 情報処理システム、生体試料処理装置及びプログラム
PCT/JP2022/004610 WO2022209299A1 (ja) 2021-03-29 2022-02-07 情報処理システム、生体試料処理装置及びプログラム
CN202280023526.4A CN117136303A (zh) 2021-03-29 2022-02-07 信息处理***、生物样品处理装置和程序
US18/550,762 US20240161298A1 (en) 2021-03-29 2022-02-07 Information processing system, biological sample processing device, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021056228A JP2022153142A (ja) 2021-03-29 2021-03-29 情報処理システム、生体試料処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2022153142A true JP2022153142A (ja) 2022-10-12

Family

ID=83455837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021056228A Pending JP2022153142A (ja) 2021-03-29 2021-03-29 情報処理システム、生体試料処理装置及びプログラム

Country Status (4)

Country Link
US (1) US20240161298A1 (ja)
JP (1) JP2022153142A (ja)
CN (1) CN117136303A (ja)
WO (1) WO2022209299A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024090265A1 (ja) * 2022-10-28 2024-05-02 株式会社biomy 情報処理装置、情報処理方法及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10163028B2 (en) * 2016-01-25 2018-12-25 Koninklijke Philips N.V. Image data pre-processing
JP6925786B2 (ja) * 2016-06-06 2021-08-25 キヤノンメディカルシステムズ株式会社 X線ct装置
US20210319880A1 (en) * 2018-07-31 2021-10-14 Lily Medtech Inc. Diagnostic Support System and a Diagnostic Support Method
JP7134805B2 (ja) * 2018-09-20 2022-09-12 キヤノンメディカルシステムズ株式会社 医用情報処理装置および医用情報処理システム
JP7003953B2 (ja) * 2019-03-14 2022-01-21 オムロン株式会社 学習装置、推定装置、データ生成装置、学習方法、及び学習プログラム
WO2020194961A1 (ja) * 2019-03-28 2020-10-01 パナソニックIpマネジメント株式会社 識別情報付与装置、識別情報付与方法、及びプログラム
CN112233118A (zh) * 2020-12-15 2021-01-15 南京可信区块链与算法经济研究院有限公司 一种基于增量学习的眼底病变图像识别方法和***

Also Published As

Publication number Publication date
WO2022209299A1 (ja) 2022-10-06
US20240161298A1 (en) 2024-05-16
CN117136303A (zh) 2023-11-28

Similar Documents

Publication Publication Date Title
US11850021B2 (en) Dynamic self-learning medical image method and system
CN1977283B (zh) 用于医疗诊断的智能定性和定量分析的***
CN109800805A (zh) 基于人工智能的图像处理***以及计算机设备
JP6807820B2 (ja) 画像検索装置、方法およびプログラム
US8831327B2 (en) Systems and methods for tissue classification using attributes of a biomarker enhanced tissue network (BETN)
EP3499509B1 (en) Method for memorable image generation for anonymized three-dimensional medical image workflows
CN113743463B (zh) 一种基于影像数据和深度学习的肿瘤良恶性识别方法和***
CN109448854A (zh) 一种肺结核检测模型的构建方法及应用
US20230057933A1 (en) Storage medium, diagnosis support apparatus and diagnosis support method
US20230169647A1 (en) Information processing apparatus, information processing method, and information processing system
JPWO2019220833A1 (ja) 診断支援システム、診断支援装置および診断支援方法
CN112241678A (zh) 评价支援方法、评价支援***以及计算机可读介质
CN114746953A (zh) 用于预测审查2d/3d***图像的阅读时间和阅读复杂度的ai***
WO2022209299A1 (ja) 情報処理システム、生体試料処理装置及びプログラム
CN108701493A (zh) 用于验证医学图像的图像相关信息的设备、***和方法
Senapati et al. Bayesian neural networks for uncertainty estimation of imaging biomarkers
US20220148714A1 (en) Diagnosis support program, diagnosis support system, and diagnosis support method
WO2022190891A1 (ja) 情報処理システム及び情報処理方法
JP2007528763A (ja) インタラクティブコンピュータ支援診断方法及び装置
Radutoiu et al. Accurate localization of inner ear regions of interests using deep reinforcement learning
Ghoshal et al. Bayesian deep active learning for medical image analysis
Kollmann et al. Cardiac function in a large animal model of myocardial infarction at 7 T: deep learning based automatic segmentation increases reproducibility
US20240225447A1 (en) Dynamic self-learning medical image method and system
EP4339961A1 (en) Methods and systems for providing a template data structure for a medical report
CN113421270B (zh) 基于单中心标定数据实现医学图像域自适应分割的方法、***、装置、处理器及其存储介质