JP2023508358A - 2次元及び3次元画像データを分析するためのシステム及び方法 - Google Patents
2次元及び3次元画像データを分析するためのシステム及び方法 Download PDFInfo
- Publication number
- JP2023508358A JP2023508358A JP2022538707A JP2022538707A JP2023508358A JP 2023508358 A JP2023508358 A JP 2023508358A JP 2022538707 A JP2022538707 A JP 2022538707A JP 2022538707 A JP2022538707 A JP 2022538707A JP 2023508358 A JP2023508358 A JP 2023508358A
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- image
- annotated
- images
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 219
- 238000013528 artificial neural network Methods 0.000 claims abstract description 181
- 210000000481 breast Anatomy 0.000 claims abstract description 96
- 230000015654 memory Effects 0.000 claims abstract description 39
- 230000003211 malignant effect Effects 0.000 claims abstract description 27
- 206010028980 Neoplasm Diseases 0.000 claims description 177
- 201000011510 cancer Diseases 0.000 claims description 144
- 238000012549 training Methods 0.000 claims description 113
- 230000036210 malignancy Effects 0.000 claims description 89
- 239000002131 composite material Substances 0.000 claims description 42
- 238000001514 detection method Methods 0.000 claims description 12
- 238000000205 computational method Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 159
- 238000012360 testing method Methods 0.000 description 69
- 230000003902 lesion Effects 0.000 description 47
- 238000012216 screening Methods 0.000 description 45
- 238000009607 mammography Methods 0.000 description 26
- 238000003384 imaging method Methods 0.000 description 18
- 238000013459 approach Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 13
- 230000035945 sensitivity Effects 0.000 description 12
- 238000002405 diagnostic procedure Methods 0.000 description 10
- 230000004807 localization Effects 0.000 description 9
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 206010006187 Breast cancer Diseases 0.000 description 6
- 208000026310 Breast neoplasm Diseases 0.000 description 6
- 238000012952 Resampling Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000036541 health Effects 0.000 description 5
- 230000007170 pathology Effects 0.000 description 5
- 238000003325 tomography Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000013145 classification model Methods 0.000 description 4
- 238000013434 data augmentation Methods 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 238000001574 biopsy Methods 0.000 description 3
- 230000002308 calcification Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 241000220010 Rhode Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000010626 work up procedure Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10112—Digital tomosynthesis [DTS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30068—Mammography; Breast
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Image Analysis (AREA)
Abstract
本開示は、患者の***組織に関する悪性の可能性に関するコンピュータによる方法を提供する。この方法は、コンピュータプロセッサを用いて***組織の画像を受け取り、学習済みニューラルネットワークを含むモデルに***組織の画像を提供し、モデルからインジケータを受け取り、インジケータを含むレポートをメモリ又はディスプレイの少なくとも1つに出力することを含み、学習済みニューラルネットワークは、第1のニューラルネットワークをトレーニングし、第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化し、第2のニューラルネットワークをトレーニングし、第2のニューラルネットワークを学習済みニューラルネットワークとして出力するように、予めトレーニングされる。
【選択図】図2
【選択図】図2
Description
<関連出願の相互参照>
本出願は、2019年12月23日に出願された米国仮特許出願第62/953,033の優先権の利益を主張するものであり、その全内容は引用により本明細書に盛り込まれているものとする。
本出願は、2019年12月23日に出願された米国仮特許出願第62/953,033の優先権の利益を主張するものであり、その全内容は引用により本明細書に盛り込まれているものとする。
<連邦政府による資金提供を受けた研究開発の記載>
該当せず。
該当せず。
乳がんは依然として世界的な課題であり、2018年には60万人以上が死亡している。早期のがん検出を達成するために、世界中の保健機関は、乳がんの死亡率を20%から40%減少させると推定されるスクリーニングマンモグラフィを推奨している。スクリーニングマンモグラフィの価値にもかかわらず、熟練の読影者の在籍可能性の不均一性に加えて、顕著な偽陽性及び偽陰性率により、品質及びアクセスを改善する機会が残されている。
デジタル***トモシンセシス(DBT)などの技術的改善にもかかわらず、がんが検出されたマンモグラムをレビューした研究では、がんの存在の兆候は、正常と判断された以前の検査で20%から60%の確率で目に見えるものと推定されている。DBTは、***の3次元(3D)イメージングを提供し、ビューごとに***の薄いスライス(つまり、厚さ約1mm)を表す10個から150個、又はそれ以上の2次元(2D)画像を生成することができる。含まれるスライスの数が多いことから、DBTは2次元イメージング(例えば、2Dフルフィールドデジタルマンモグラフィ)と比較して追加の時間を必要とし、したがって放射線科医は高速での読み取りが迫られる。しかしながら、2Dイメージングはがんの存在を予測するための3Dイメージングほど詳細を医療従事者に提供しない場合がある。
したがって、2D及び/又は3Dマンモグラフィデータをより効率的かつ正確に分析するとともに、2D及び/又は3Dマンモグラフィデータを使用して悪性腫瘍及び/又は病変を均一に推定するシステム及び方法を有することが望まれている。
本開示は、2D及び/又は3Dマンモグラフィデータを効率的かつ正確に分析するとともに、2D及び/又は3Dマンモグラフィデータを使用して悪性腫瘍及び/又は病変を均一に推定するためのシステム及び方法を提供する。1つの非限定的な態様では、本開示は、患者の***組織における悪性の可能性に関するコンピュータによる方法を提供する。この方法は、コンピュータプロセッサを使用して、***組織の画像を受け取る工程と、学習済みニューラルネットワークを含むモデルに***組織の画像を提供する工程と、モデルからインジケータを受け取る工程と、インジケータを含むレポートをメモリ又はディスプレイの少なくとも1つに出力する工程と、を含み、学習済みニューラルネットワークは以下のように予めトレーニングされ、即ち、2次元画像の第1のグループから導出されるアノテーション済みパッチのセットであって、各アノテーション済みパッチがパッチレベルのラベルと2次元画像の第1のグループに含まれる2次元画像の一部とを含むアノテーション済みパッチのセットに基づいて、第1のニューラルネットワークをトレーニングし、第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化し、アノテーション済み画像の第1のセットであって、アノテーション済み画像の第1のセットに含まれる少なくとも1つのアノテーション済み画像が2次元画像の第2のグループに含まれる2次元画像と少なくとも1つのバウンディングボックスと少なくとも1つのバウンディングボックスに関連付けられた少なくとも1つの悪性ラベルとを含むアノテーション済み画像の第1のセットに基づいて、第2のニューラルネットワークをトレーニングし、アノテーション済み画像の第2のセットであって、アノテーション済み画像の第2のセットに含まれる各アノテーション済み画像が2次元画像の第3のグループに含まれる2次元画像と画像レベルの悪性可能性スコアとを含むアノテーション済み画像の第2のセットに基づいて、第2のニューラルネットワークをトレーニングし、第2のニューラルネットワークを学習済みニューラルネットワークとして出力するように、予めトレーニングされる。
本方法において、***組織の画像は2次元デジタルマンモグラムであってもよい。
本方法において、***組織の画像は、デジタル***トモシンセシス画像に基づいて生成された合成2次元画像であってもよい。いくつかの構成において、デジタル***トモシンセシス画像は複数のスライスを含み、合成2次元画像は画素のアレイを含み、画素のアレイに含まれる複数の画素の少なくとも一部が有する画素強度値は、複数のスライスの少なくとも一部を第2の学習済みニューラルネットワークに提供し、悪性可能性スコアを各々が含む複数のインジケータを、第2の学習済みニューラルネットワークから受け取り、画素のアレイに含まれるターゲット画素について、複数のインジケータに含まれる第1のインジケータであって複数のインジケータに含まれる第2のインジケータよりも大きい悪性可能性スコアを含む第1のインジケータに基づいてターゲット画素強度を決定することによって、予め生成される。いくつかの構成において、画素のアレイに含まれる複数の画素の少なくとも一部が有する画素強度値は、画素のアレイに含まれる第2のターゲット画素について、複数の画素に含まれる画素が、第2のターゲット画素に関連する画素位置を含まないことを決定し、第2のターゲット画素に含まれる画素強度を、複数のスライスに含まれるデフォルトスライスに含まれるデフォルト画素であってターゲット画素に関連する画素位置を含むデフォルト画素と同じに設定することで、予め生成されてもよい。いくつかの構成において、複数のスライスに含まれる各スライスは位置値に関連付けられており、デフォルトスライスは中間位置値に関連付けられていてもよい。いくつかの構成において、デジタル***トモシンセシス画像は複数のスライスを含んでもよく、複数のスライスに含まれる各スライスは位置値に関連付けられており、合成2次元画像は、所定範囲の位置値に含まれる位置値に関連付けられた複数のスライスのサブセットに基づいて生成されてもよい。いくつかの構成において、複数のスライスのサブセットは複数のスライスの約80パーセントを構成してもよい。
本方法において、第2のニューラルネットワークは、バックボーン部分、回帰部分及び分類部分を含んでもよく、本方法は、バックボーン部分及び分類部分を再トレーニングすることなく、アノテーション済み画像の第1のセットに基づいて回帰部分をトレーニングすることをさらに含んでもよい。いくつかの構成において、アノテーション済み画像の第2のセットに基づいて第2のニューラルネットワークをトレーニングすることは、回帰部分をトレーニングすることなくバックボーン部分及び分類部分をトレーニングすることを含んでもよい。
本方法において、第1のニューラルネットワークは第1の複数の重みを含んでもよく、第2のニューラルネットワークは、第2の複数の重みを含むバックボーン部分を含んでもよく、第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化することは、第2の複数の重みに含まれる重みを第1の複数の重みに含まれる重みと同じに設定することを含んでもよい。いくつかの構成において、第1のニューラルネットワークは深層残留ネットワークを含んでもよく、第2のニューラルネットワークはシングルステージオブジェクト検出ネットワークを含んでもよい。
本方法において、インジケータは患者悪性可能性スコアを含んでもよい。
本方法において、インジケータは、***組織の画像のエリアを含んでもよい。
別の非限定的な態様において、本開示は、患者の***組織についての悪性の可能性を評価するためのシステムを提供する。このシステムは、***組織の画像を保存するように構成されたメモリと、メモリにアクセスするように構成されたプロセッサと、を備え、プロセッサは、学習済みニューラルネットワークを含むモデルに***組織の画像を提供し、モデルからインジケータを受け取り、インジケータを含むレポートをメモリ又はディスプレイの少なくとも1つに出力するよう構成され、この学習済みニューラルネットワークは以下のように予めトレーニングされたものであり、即ち、2次元画像の第1のグループから導出されるアノテーション済みパッチのセットであって、各アノテーション済みパッチがパッチレベルのラベルと2次元画像の第1のグループに含まれる2次元画像の一部とを含むアノテーション済みパッチのセットに基づいて、第1のニューラルネットワークをトレーニングし、第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化し、アノテーション済み画像の第1のセットであって、アノテーション済み画像の第1のセットに含まれる少なくとも1つのアノテーション済み画像が2次元画像の第2のグループに含まれる2次元画像と少なくとも1つのバウンディングボックスと少なくとも1つのバウンディングボックスに関連付けられた少なくとも1つの悪性ラベルとを含むアノテーション済み画像の第1のセットに基づいて、第2のニューラルネットワークをトレーニングし、アノテーション済み画像の第2のセットであって、アノテーション済み画像の第2のセットに含まれる各アノテーション済み画像が2次元画像の第3のグループに含まれる2次元画像と画像レベルの悪性可能性スコアとを含むアノテーション済み画像の第2のセットに基づいて第2のニューラルネットワークをトレーニングし、第2のニューラルネットワークを学習済みニューラルネットワークとして出力するように、予めトレーニングされたものである。
本方法において、***組織の画像は2次元デジタルマンモグラムであってもよい。
本方法において、***組織の画像は、デジタル***トモシンセシス画像に基づいて生成された合成2次元画像であってもよい。いくつかの構成において、デジタル***トモシンセシス画像は複数のスライスを含んでもよく、合成2次元画像は画素のアレイを含んでもよく、画素のアレイに含まれる複数の画素の少なくとも一部が有する画素強度値は、複数のスライスの少なくとも一部を第2の学習済みニューラルネットワークに提供し、悪性可能性スコアを各々が含む複数のインジケータを第2の学習済みニューラルネットワークから受け取り、画素のアレイに含まれるターゲット画素について、複数のインジケータに含まれる第1のインジケータであって複数のインジケータに含まれる第2のインジケータよりも大きい悪性可能性スコアを含む第1のインジケータに基づいてターゲット画素強度を決定することによって、予め生成されたものである。いくつかの構成において、画素のアレイに含まれる複数の画素の少なくとも一部が有する画素強度値は、画素のアレイに含まれる第2のターゲット画素について、複数の画素に含まれる画素が、第2のターゲット画素に関連する画素位置を含まないことを決定し、第2のターゲット画素に含まれる画素強度を、複数のスライスに含まれるデフォルトスライスに含まれるデフォルト画素であって第2のターゲット画素に関連する画素位置を含むデフォルト画素と同じに設定することで、予め生成されたものであってもよい。いくつかの構成において、複数のスライスに含まれる各スライスは位置値に関連付けられていてもよく、デフォルトスライスは中間位置値に関連付けられていてもよい。いくつかの構成において、デジタル***トモシンセシス画像は複数のスライスを含んでもよく、複数のスライスに含まれる各スライスは位置値に関連付けられており、合成2次元画像は、所定の範囲の位置値に含まれる位置値に関連付けられた複数のスライスのサブセットに基づいて生成されてもよい。いくつかの構成において、複数のスライスのサブセットは、複数のスライスの約80パーセントを構成してもよい。
本方法において、第2のニューラルネットワークは、バックボーン部分、回帰部分及び分類部分を含んでもよく、本方法は、バックボーン部分及び分類部分を再トレーニングすることなく、アノテーション済み画像の第1のセットに基づいて回帰部分をトレーニングすることをさらに含んでもよい。いくつかの構成において、アノテーション済み画像の第2のセットに基づいて第2のニューラルネットワークをトレーニングすることは、回帰部分をトレーニングすることなくバックボーン部分及び分類部分をトレーニングすることを含んでもよい。
本方法において、第1のニューラルネットワークは第1の複数の重みを含んでもよく、第2のニューラルネットワークは、第2の複数の重みを含むバックボーン部分を含んでもよく、第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化することは、第2の複数の重みに含まれる重みを第1の複数の重みに含まれる重みと同じに設定することを含んでもよい。
本方法において、第1のニューラルネットワークは深層残留ネットワークを含んでもよく、第2のニューラルネットワークはシングルステージオブジェクト検出ネットワークを含んでもよい。
本方法において、インジケータは患者悪性可能性スコアを含んでもよい。
本方法において、インジケータは***組織の画像のエリアを含んでもよい。
さらに別の非限定的な態様において、本開示は、患者の***組織に関する悪性可能性スコアを決定するための方法を提供する。本方法は、***組織の画像を受け取る工程と、学習済みニューラルネットワークを含むモデルに***組織の画像を提供する工程と、モデルから悪性可能性スコアを受け取る工程と、患者悪性可能性スコアを含むレポートをメモリ又はディスプレイの少なくとも1つに出力する工程と、を含み、学習済みニューラルネットワークは以下のように予めトレーニングされ、即ち、2次元画像の第1のグループから導出されるアノテーション済みパッチのセットであって、各アノテーション済みパッチが悪性度スコアと2次元画像の第1のグループに含まれる2次元画像の一部とを含むアノテーション済みパッチのセットに基づいて、第1のニューラルネットワークをトレーニングし、第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化し、アノテーション済み画像の第1のセットであって、アノテーション済み画像の第1のセットに含まれる少なくとも1つのアノテーション済み画像が2次元画像の第2のグループに含まれる2次元画像と少なくとも1つのバウンディングボックスと少なくとも1つのバウンディングボックスに関連付けられた少なくとも1つの悪性可能性スコアとを含むアノテーション済み画像の第1のセットに基づいて、第2のニューラルネットワークをトレーニングし、アノテーション済み画像の第2のセットであって、アノテーション済み画像の第2のセットに含まれる各アノテーション済み画像が2次元画像の第3のグループに含まれる2次元画像と画像レベルの悪性可能性スコアとを含むアノテーション済み画像の第2のセットに基づいて、第2のニューラルネットワークをトレーニングし、第2のニューラルネットワークを学習済みニューラルネットワークとして出力するように、予めトレーニングされる。
さらに別の非限定的な態様において、本開示は、患者の***組織に関する悪性可能性スコアを生成するためのシステムを提供する。このシステムは、***組織の画像を保存するように構成されたメモリと、メモリにアクセスするように構成されたプロセッサと、を備え、プロセッサは、学習済みニューラルネットワークを含むモデルに***組織の画像を提供し、モデルから悪性可能性スコアを受け取り、悪性可能性スコアを含むレポートをメモリ又はディスプレイの少なくとも1つに出力するよう構成され、学習済みニューラルネットワークは以下のように予めトレーニングされたものであり、即ち、2次元画像の第1のグループから導出されるアノテーション済みパッチのセットであって、各アノテーション済みパッチが悪性可能性スコアと2次元画像の第1のグループに含まれる2次元画像の一部とを含むアノテーション済みパッチのセットに基づいて、第1のニューラルネットワークをトレーニングし、第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化し、アノテーション済み画像の第1のセットであって、アノテーション済み画像の第1のセットに含まれる少なくとも1つのアノテーション済み画像が2次元画像の第2のグループに含まれる2次元画像と少なくとも1つのバウンディングボックスと少なくとも1つのバウンディングボックスに関連付けられた少なくとも1つの悪性可能性スコアとを含むアノテーション済み画像の第1のセットに基づいて、第2のニューラルネットワークをトレーニングし、アノテーション済み画像の第2のセットであって、アノテーション済み画像の第2のセットに含まれる各アノテーション済み画像が2次元画像の第3のグループに含まれる2次元画像と画像レベルの悪性可能性スコアとを含むアノテーション済み画像の第2のセットに基づいて、第2のニューラルネットワークをトレーニングし、第2のニューラルネットワークを学習済みニューラルネットワークとして出力するように、予めトレーニングされたものである。
本明細書に記載されるように、2次元(2D)マンモグラフィデータ及び/又は3次元(3D)トモグラフィデータの関連領域を効率的かつ均一に表示するとともに、機械学習技術を用いて2Dマンモグラフィデータ及び/又は3Dトモグラフィデータにおける悪性を決定するための例示的なシステム及び方法が提供される。
2Dマンモグラフィデータ及び/若しくは3Dトモシンセシスデータの関連領域を分析するため並びに/又は***組織の腫瘍及び/若しくは病変の悪性を決定するための以下に記載するシステム及び方法以外のアプローチが存在し得るが、これらは全て欠点を有する。1つのアプローチは、3Dマンモグラムに含まれる全てのスライスの関連領域に、人間の医療従事者がラベル付けをするというものである。人間ベースのアプローチは、特に3Dマンモグラムの場合、各2Dスライスを人間の医療従事者がラベル付けするのに時間がかかるため、コストがかかり遅いことがある。さらに、人間ベースのアプローチは、人間の医療従事者間で好み/専門知識レベルが異なること、及び人間によるラベル付けの補助に利用できる情報(即ち、放射線レポート、病理学レポートなど)の量が異なることから、一貫性に欠ける可能性がある。
別のアプローチは、3Dトモグラフィデータセット全体(即ち、3Dトモグラフィデータセットに含まれる全てのスライス)を受け取り、***組織に存在する腫瘍及び/又は病変の悪性を示す悪性可能性スコアを出力する機械学習モデルをトレーニングするというものである。このアプローチは、データ処理システムのデータのサイズ及びメモリの限度のために実行不可能であり、また、過剰適合を起こしやすい可能性がある。
さらに別のアプローチは、2Dスライスのセットからスライスをランダムに選択するか、又は2Dスライスのセットのデフォルトスライス(即ち、25番目のスライス又は中間のスライス)を選択し、このスライスに基づいて悪性可能性スコアを出力するよう機械学習モデルをトレーニングすることを含む。このアプローチもまた、腫瘍及び/又は病変が存在していたとしてもスライスにこれが含まれない可能性が高いため、過剰適合を起こしやすい可能性がある。
さらに別のアプローチでは、弱ラベル又は強ラベルトレーニングデータのみを用いて機械学習モデルをトレーニングすることができるが、これは、臨床的に有用な悪性及び/又は関連領域の十分正確な予測を提供できない可能性がある。強ラベル済みデータのみに関するトレーニングは、モデルをトレーニングできるデータの量を制限する可能性があることから精度が制限され、一方、弱ラベル済みデータのみに関するトレーニングは、過剰適合及び一般化パフォーマンス不良を引き起こす可能性がある。
図1を参照すると、3Dデジタル***トモシンセシス(DBT)システムなどのX線イメージングシステム100の例が示されている。X線イメージングシステム100は、アーム102の第1の端部110に結合されたX線源アセンブリ108を含むことができる。X線検出器アセンブリ112は、対向端部114に近接して結合されてもよい。X線源アセンブリ108は、アーム102に対して実質的に垂直に延在し、X線検出器アセンブリ112の方へ向けられてもよい。X線検出器アセンブリ112もアーム102から延在しており、X線検出器アセンブリ112が、X線源アセンブリ108によって生成され、***を透過し、X線検出器アセンブリ112に入射するX線放射を受け取るよう構成されている。***支持プレート116及び***圧迫プレート118は、X線源アセンブリ108とX線検出器アセンブリ112の間に配置される。X線源アセンブリ108は、固定型又は可動型とすることができる。X線イメージングシステム100は、3D DBTデータを含む再構成画像を生成することができる。3D DBTデータは、多数の2Dスライスを含むことができる。いくつかの構成において、再構成画像は、約1mmの厚さを有する複数の2Dスライスを含む3Dトモグラフィデータを含むことができる。2Dスライスを用いて合成2D画像を作成することができるが、これについては以下に説明する。いくつかの構成において、X線イメージングシステム100は、例えば、2Dスライスのサブセットの最大強度投影を表す中間の2次元「スラブ」を生成することができる。例えば、10個のスライスから1つの最大強度投影スラブを生成することができ、100個のスライスから10個のスラブを生成するなど複数のスライスから複数のスラブを生成することができる。再構成画像は、メモリを含むことができる、大容量記憶装置128内に画像を保存するコンピュータ126へ入力することができる。コンピュータ126は、再構成画像の生成を制御するために、X線イメージングシステム100に命令を提供することもできる。
図2を参照すると、入力2次元(2D)画像204についての関心領域(ROI)を生成するためのモデル200の例示的な実施形態が示されている。ROIはインジケータと称されることがある。いくつかの構成において、2D画像204は、ネイティブな2Dマンモグラム画像(例えば、2Dフルフィールドデジタルマンモグラフィシステムによって生成された画像)、合成2Dマンモグラム画像(例えば、3D画像データに基づいて生成された2D画像)、及び/又は3D DBTデータの2Dスライスであってもよい。
モデル200は、2D画像204を受け入れ、任意の数のROIを出力することができ、例えば、第1のエリア208A及び第1のスコア208Bを含む第1のROI、並びに第2のエリア212A及び第2のスコア212Bを含む第2のROIを受け入れることができる。いくつかの構成において、各ROIは、例えば75個の2Dスライスのセットの4番目のスライスなど、ROIの生成の基とされた2Dスライスを示すスライス番号と関連付けることができる。以下に説明するように、スライス番号は、ROIを選択して及び/又は組み合わせて合成画像を作成する際に使用することができる。可能性のある悪性を十分に示す領域が2D画像204にまったくないと見なされる場合などの2D画像204の特性に応じて、ゼロのROIが出力されてもよい。各ROIは、2D画像204のサブ領域となり得るエリアを含むことができる。上述のように、各2D画像は画素のアレイとしてフォーマットすることができる。サブ領域は画素のアレイのサブセットとすることができる。いくつかの構成において、モデル200は、2D画像内のオブジェクトを検出するように構成された1つ以上のニューラルネットワークを含むことができる。オブジェクトはROIとすることができる。
いくつかの構成において、モデル200は、所定の形状に従うROIを出力することができる。例えば、長方形のバウンディングボックスを用いて、腫瘍又は病変の潜在的候補を囲むことができる。不規則な形状(例えば、画素の「ブロブ」)を使用して、潜在的な腫瘍又は病変をよりよく輪郭付けることができると考えられる。ROIのトレーニングデータベースを作成する際、1人又は複数の人間の医療従事者は、他の形状よりも長方形のバウンディングボックスを使用する方が直感的であるとすることがあるであろう。オブジェクトを特定するためにセグメント化マスクベースのアプローチを用いるニューラルネットワークを用いて、不規則な形状の予測ROIを出力することができる。次いで、モデル200を、2D画像204に含まれる画素のサブアレイを含む長方形形状のROIを特定するようにトレーニングすることができる。ROIの画素は、1つ以上の色強度値(例えば、白色強度値)と、2D画像204内の位置(例えば、2000×1500画素スライス内の所与の(x,y)位置での画素)とを含むことができる。いくつかのマンモグラフィイメージングシステムは***組織のグレイスケール画像を生成するが、このモデルは色付けされた2D画像と共に使用できることが理解される。
ROIは、画素のサブアレイに加えて、画素のサブアレイが悪性可能性スコアを決定することにどの程度関連性があるかを示す関連性スコアを含むことができる。以下で詳細に説明するように、関連性スコアは、1つ以上のROIを用いて合成2D画像を作成するため及び/又は患者について悪性可能性スコアを生成するために使用することができる。関連性スコアは、0から1までのような数値範囲から選択することができる。トレーニングデータセットのためのROIを特定する際、人間の医療従事者は、各ROIの関連性スコアを値の範囲内で割り当てることができる。人間の医療従事者は、例えば0から100(悪性腫瘍の可能性が高い程スコアが高い)などの異なるスケール用いて関連性スコアを割り当てることができ、これを次にモデル200によって用いられる関連性スコア範囲に正規化することができる。いくつかの構成において、人間の医療従事者は、悪性の可能性があるROIを特定するためにモデル200をよりよくトレーニングするために、ROIを良性であると特定することができる。
いくつかの構成において、モデル200は、回帰型ニューラルネットワークなどのニューラルネットワークを含むことができる。モデル200をトレーニングするために、フルフィールドデジタルマンモグラフィ(FFDM)画像及び/又は3Dトモシンセシス画像のセットからのスライスから成る2Dデータ、並びに(例えば、1人又は複数の医療従事者によって)予め特定されたROIを含むトレーニングデータセットを用いて、モデルをトレーニングすることができる。
2Dデータの少なくとも一部は強アノテーション済みデータとすることができる。強アノテーション済みデータは所定のROIを含むことができる。人間の医療従事者は、所与の2D画像(例えば、2Dスライス又は2D FFDM画像)を調べ、長方形ボックスのような所定の形状を用いて関心領域となり得る領域の輪郭を描き、そして腫瘍及び/又は病変の評価における医学的専門知識及び/又は経験に基づいて上記所定の形状に関連性スコアを割り当てることによって、ROIを特定することができる。あるいは、病変が悪性か否かを示す病理結果に基づいて関連性スコアを割り当てることもできる。
2Dデータの少なくとも一部は弱アノテーション済みデータとすることができる。弱アノテーション済みデータは、画像におけるバウンディングボックス又は他の輪郭線が付いたエリアを全く含まない画像レベル関連性スコアを含むことができる。弱アノテーション済みデータを生成するために、医療従事者は、2D画像を、悪性である(例えば、「1」)又は悪性でない(例えば、「0」)とアノテーションすることができる。例えば、患者の右***に悪性腫瘍が含まれていることを病理検査結果を通して決定することができ、次に右***の全てのマンモグラフィ画像に「1」のラベルを与えることができる。大量のトレーニングデータベースは、複数のFFDM画像又は3Dトモシンセシス画像(例えば、複数の患者の画像)のスライスから得られた2D画像内のROIを、1人又は複数の医療従事者が特定し(例えば、アノテーションする)、2D画像全体を悪性(例えば、「1」)又は悪性でないとアノテーションすることによって生成することができる。
トレーニングデータにおいてFFDM画像を使用する利点は、現在、より公的に入手可能なのは、アノテーション済3Dトモシンセシス画像よりもアノテーション済みFFDM画像であるということである。さらに、2D画像は3Dトモシンセシス画像よりもアノテーションが容易であり、3Dトモシンセシス画像では各3Dトモシンセシス画像に含まれる多数の個々のスライスをアノテーションする必要がある。トレーニングが終わると、モデル200は、入力2Dスライスを受け取って1つ以上のROIを出力することができ、各ROIには推定関連性スコア及び入力2Dスライスの画素のサブアレイが含まれる。
モデル200は、畳み込みレイヤーのような多数のレイヤーを含むことができる。モデル200のいくつかの構成では、レイヤーの数が異なるか、レイヤーの配列が異なるか、又は他の相違を有し得ることが理解される。但し、全ての構成において、モデル200は、入力2D入力スライスを受け取り、入力2D入力スライスに関連するあらゆる関心領域を出力することができる。モデル200は、1つ以上のサブネットワークを含むシングルステージ検出ネットワークとすることができる。いくつかの構成において、モデル200はRetinaNetを含むことができる。
モデル200は、1次サブネットワーク216を含むことができる。1次サブネットワーク216は、1つ以上のレイヤー218A~Cを有するフィードフォワードニューラルネットワークとすることができる。いくつかの構成において、1次サブネットワーク216は、深層残留ネットワーク(deep residual network)(「ResNet」)を含むことができる。いくつかの構成において、深層残留ネットワークは、ResNet-50ニューラルネットワークとすることができる。以下に記載するように、1次サブネットワーク216は、最初に独立してトレーニングされ、次にモデル200に統合させることができる。2次サブネットワーク220は、1次サブネットワーク216をネットワークのバックボーンとして使用して、単一のニューラルネットワークを効果的に作成するために、1次サブネットワークの上に構築することができる。1次サブネットワーク216は、モデル200のバックボーン部分と称することができる。2次サブネットワーク220は、第1のレイヤー222A、第2のレイヤー222B及び第3のレイヤー222Cを含む複数のレイヤーを含むことができるが、他の数のレイヤー(即ち、5つのレイヤー)を用いることもでき、ここでは簡単にするために3つのレイヤーを示す。例えば、ResNet-50ニューラルネットワークは50個のレイヤーを含むことができる。
第1のレイヤー222A、第2のレイヤー222B及び第3のレイヤー222Cの各々は、畳み込みレイヤーとすることができる。各レイヤーは多数のビルディングブロック(不図示)で構成することができる。各ビルディングブロックは3つのパラメータレイヤーなどの多数のパラメータレイヤーを含むことができ、各パラメータレイヤーは、所定のフィルタサイズ(例えば3×3)を有する多数(例えば256個)のフィルタを含む。第1のレイヤー222A、第2のレイヤー222B及び第3のレイヤー222Cは、各々、144×144、72×72及び36×36などの関連出力サイズを有することができる。出力サイズは、前処理条件及び/又はパラメータに基づいて入力スライス間でさまざまとすることができる。2次サブネットワーク220のレイヤー間で出力サイズが減少するにつれて、パラメータレイヤーのフィルタの数は比例的に増加することができ、即ち、出力サイズを半分にするとフィルタの数が倍増することになる。2次サブネットワークには、最終レイヤー(即ち、第3のレイヤー222C)に結合されたグローバル平均プーリングレイヤーと、グローバル平均プーリングレイヤーに結合された全結合レイヤーと、全結合レイヤーに結合され、1×1の出力サイズ(即ち、単一の値)を有するソフトマックスレイヤーとを含むこともできる。
モデル200は、第1の3次ネットワーク224A、第2の3次ネットワーク224B及び第3の3次ネットワーク224Cなどの複数の3次サブネットワークを含むことができる。3次ネットワーク224A~Cは、各々、2次サブネットワーク220のレイヤーに結合することができる。第1の3次ネットワーク224Aは第1のレイヤー222Aに結合することができ、第2の3次ネットワーク224Bは第2のレイヤー222Bに結合することができ、第3の3次ネットワーク224Cは第3のレイヤー222Cに結合することができる。各3次ネットワークは、異なるレベルのスケールで腫瘍及び/又は病変を検出するために、2次サブネットワーク220のレイヤーから特徴を受け取ることができる。
各3次ネットワークは、ボックス回帰サブネットワーク226を含むことができる。ボックス回帰サブネットワーク226は、それぞれ整流化線形(ReLU)活性化が後に続く1つ以上の畳み込みレイヤー228A~Bと、2次サブネットワーク220のレイヤーのうちの1つの一部に関連するアンカーに対応する(そして、入力2D画像204の画素のアレイに対応する)回帰座標を出力するように構成された最終畳み込みレイヤー230とを含むことができる。アンカーは、2次サブネットワーク220の種々のレイヤーの所定のサブアレイとすることができる。回帰座標は、アンカーと予測バウンディングボックスとの間の予測オフセットを表すことができる。ROIに含まれる各バウンディングボックスについて、回帰座標のセット(例えば、4つの回帰座標)及び対応するアンカーを使用して、バウンディングボックスの座標を計算することができる。モデル200は、第1の3次ネットワーク224A、第2の3次ネットワーク224B及び第3の3次ネットワーク224Cに含まれるボックス回帰サブネットワークを含む回帰部分を含むことができる。
各3次ネットワークは、分類サブネットワーク232を含むことができる。分類サブネットワーク232は、それぞれReLU活性化が後に続く1つ以上の畳み込みレイヤー234A~Bと、オブジェクトの存在(即ち、悪性腫瘍及び/又は病変の存在)の予測を出力するシグモイド活性化が後に続く最終畳み込みレイヤー238と、を含むことができる。分類サブネットワーク232は、患者が2D画像204の様々な空間的位置に悪性腫瘍及び/又は病変を有するか否かについての1つ以上の推定を得るために使用することができる。より具体的には、各バウンディングボックスを、分類サブネットワークによる推定スコア出力と関連付けることができる。いくつかの構成において、各推定スコアの値はゼロから1に及ぶ。空間的位置の1つは、2次サブネットワーク220のレイヤー全体、即ち第1のレイヤー222Aを含むことができる。このようにして、分類サブネットワーク232は、患者が悪性腫瘍及び/又は病変を有するか否かの推定を、2Dスライスに基づいて出力することができる。例えば複数の悪性のレベル(例えば、低リスク領域、高リスク領域など)などの複数のタイプの悪性領域を分類するためにトレーニングされたモデルにおいて、最終畳み込みレイヤー238の後にソフトマックス活性化が続くことができると考えられる。モデル200は、第1の3次ネットワーク224A、第2の3次ネットワーク224B及び第3の3次ネットワーク224Cに含まれる分類サブネットワークを含む分類部分を含むことができる。
モデル200は、異なるスケールにわたってデータを正規化し、バウンディングボックス座標を計算し、及び/又は低いスコアリングバウンディングボックス予測をフィルタで除去するための出力レイヤー250を含むことができる。出力レイヤー250は3次サブネットワーク224A~Cからの出力を受け取って1つ以上のROIを出力し、各ROIは2D画像204のアレイサイズにスケールされた画素のアレイ及び関連スコアを含む。画素のアレイは、回帰座標とアンカーに基づいて計算されるバウンディングボックス(例えば、長方形のバウンディングボックス)とすることができる。出力レイヤー250は、例えば0.5などの所定の閾値を下回るあらゆるスコアをフィルタで除去することができる。いくつかの構成において、出力レイヤー250は、3次サブネットワーク224A~Cから出力を受け取り、単一の悪性可能性スコアを出力することができる。いくつかの構成において、単一の悪性可能性スコアは、最も高いスコアリングバウンディングボックスコアとなるように選択することができる。
図2及び図3を参照すると、ニューラルネットワークをトレーニングするためのプロセス300が示されている。ニューラルネットワークはモデル200に含めることができる。プロセス300は、データ処理システムに含まれる1つ以上のメモリ上の命令として実装することができる。データ処理システムは、1つ以上のメモリと通信し命令を実行するように構成された1つ以上のプロセッサをさらに含むことができる。1つ以上のプロセッサはメモリにアクセスするように構成することができ、メモリは、大容量記憶装置128に含めることができ、トレーニングデータが保存されている。
304において、プロセス300は、アノテーション済みパッチのセットを受け取ることができる。アノテーション済みパッチは、2次元画像の第1のグループ(例えば、ネイティブの2Dマンモグラム)から導出することができる。各アノテーション済みパッチは、ラベルと、2次元画像の第1のグループに含まれる2次元画像の一部とを含むことができる。各パッチは、2次元画像の一部を含むことができる。いくつかの構成において、アノテーション済みパッチのセットを生成するために、プロセス300は、2次元画像の生のパッチをランダムに選択することができ、そして、パッチをランダムに回転させる、パッチを最大20%ランダムにサイズ変更する、及び/又はパッチをランダムに縦方向にミラーリングさせることができる。いくつかの構成において、プロセス300は、画素値を所定の範囲(例えば、[127.5,127.5]の範囲)に正規化することによって、生のパッチを前処理することができる。ランダム化及び/又は前処理は事前に行うことができる。いくつかの構成において、病変を含むパッチを生成するために、プロセス300は、医療従事者によって生成された病変境界内のランダムな位置を、病変を含むパッチの中心として選択することができる。次に、得られたパッチにおいて病変マスクを含む画素の数が所定の数(例えば、6画素)より少ない場合、パッチを廃棄し、新しいパッチをサンプリングすることができる。いくつかの構成において、プロセス300は、アノテーション済みパッチのセットから、***フォアグランドを10%未満しか含まないパッチ(例えば、大津の方法により決定される、及び/又は画像中の最小画素値を用いる閾値方法により決定される)を除去することができる。いくつかの態様において、ラベルは病変のタイプ(例えば、腫瘤、石灰化、局所的非対称性、構造歪み又は病変なし)を示すことができる。いくつかの態様において、ラベルは悪性のタイプ(例えば、正常、良性又は悪性)を示すことができる。アノテーション済みパッチのセットは、強アノテーション済みと称することができる。その後、プロセス300は308に進むことができる。
308において、プロセス300は、アノテーション済みパッチのセットに基づいて第1のニューラルネットワークをトレーニングすることができる。いくつかの構成において、1次サブネットワーク216は、第1のニューラルネットワークの少なくとも一部を含むことができる。例えば、1次サブネットワーク216は、第1のニューラルネットワークに含まれる少なくともいくつかの畳み込みレイヤーを含むことができるが、第1のニューラルネットワークに含まれる分類レイヤーは含まない。第1のニューラルネットワークはResNet-50ニューラルネットワークとすることができる。第1のニューラルネットワークは、ImageNet事前トレーニング重みに基づいて初期化することができる。いくつかの構成において、プロセス300は、病変タイプによってラベル付けされるアノテーション済みパッチのセットに含まれるパッチに基づいて病変タイプを分類するために、第1のニューラルネットワークをトレーニングすることができる。いくつかの構成において、病変タイプは、腫瘤、石灰化、局所的非対称性、構造歪み又は病変なしとすることができる。第1のニューラルネットワークが病変タイプを分類するためにトレーニングされた後、プロセス300は、悪性タイプによってラベル付けされたアノテーション済みパッチのセットに含まれるパッチに基づいて悪性タイプを決定するよう第1のニューラルネットワークをトレーニングすることができる。いくつかの構成において、悪性タイプは、正常、良性又は悪性とすることができる。いくつかの構成において、16であるバッチサイズを用いて第1のニューラルネットワークをトレーニングすることができる。いくつかの構成において、学習率1e5を有するアダムオプティマイザーを用いて、第1のニューラルネットワークをトレーニングすることができる。その後、プロセス300は312に進むことができる。
312において、プロセス300は、第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化することができる。第2のニューラルネットワークは、モデル200の1つ以上のコンポーネントを含むことができる。いくつかの構成において、第2のニューラルネットワークは、シングルステージオブジェクト検出ネットワーク(例えば、RetinaNet)とすることができる。いくつかの構成において、第2のニューラルネットワークは、バックボーン部分(例えば、1次サブネットワーク216)、回帰部分(例えば、第1の3次ネットワーク224A、第2の3次ネットワーク224B及び第3の3次ネットワーク224Cに含まれるボックス回帰サブネットワーク)、及び分類部分(例えば、第1の3次ネットワーク224A、第2の3次ネットワーク224B及び第3の3次ネットワーク224Cに含まれる分類サブネットワーク)を含むことができる。いくつかの構成において、プロセス300は、第1のニューラルネットワークに基づいてバックボーン部分を初期化することができる。プロセス300は、第1のニューラルネットワークに含まれる重みに基づいてバックボーン部分に含まれる重みを初期化することができる。その後、プロセス300は316に進むことができる。
316において、プロセス300は、アノテーション済み画像の第1のセットを受け取ることができる。アノテーション済み画像は、2次元画像の第2のグループ(例えば、ネイティブな2Dマンモグラム)に基づいて生成することができる。各アノテーション済み画像は1つ以上のROIを含むことができ、各ROIはアノテーション済み画像の中に含まれるラベル及びバウンディングボックスを含む。いくつかの態様において、ラベルは、悪性タイプ(例えば、正常、良性又は悪性)を示すことができる。いくつかの構成において、プロセス300は、画素値を所定の範囲(例えば、[127.5,127.5]の範囲)に正規化すること、及び/又は画像の高さを所定の高さ(例えば、1750画素)に正規化することによって、生の画像を前処理することができる。いくつかの構成において、アノテーション済み画像の第1のセットを生成するために、プロセス300は、画像を最大15%ランダムにサイズ変更する、及び/又は画像をランダムに縦方向にミラーリングリングすることができる。いくつかの構成において、プロセス300は、アノテーション済み画像のバックグラウンド部分を切り出すことができる。ランダム化及び/又は前処理は事前に行うことができる。アノテーション済み画像の第1のセットは、強アノテーション済みと称することができる。その後、プロセス300は320に進むことができる。
320において、プロセスは、アノテーション済み画像の第1のセットに基づいて第2のニューラルネットワークをトレーニングすることができる。プロセス300は、悪性タイプによってラベル付けされたアノテーション済み画像の第1のセットに基づいて、悪性タイプ及びバウンディングボックスを含むROIを生成するために、第2のニューラルネットワークをトレーニングすることができる。いくつかの構成において、悪性タイプは、正常、良性又は悪性とすることができる。いくつかの構成において、1であるバッチサイズを用いて第1のニューラルネットワークをトレーニングすることができる。いくつかの構成において、1e5の学習率及び0.001の値を有する勾配ノルムクリッピングを有するアダムオプティマイザーを用いて、第1のニューラルネットワークをトレーニングすることができる。その後、プロセス300は324に進むことができる。
324において、プロセス300は、アノテーション済み画像の第2のセットを受け取ることができる。アノテーション済み画像は、2次元画像の第3のグループ(例えば、ネイティブな2Dマンモグラム)に基づいて生成することができる。アノテーション済み画像の第2のセットに含まれる各アノテーション済み画像は、2D画像と画像レベルのラベルとを含むことができる。画像レベルは、バイナリ悪性ラベル(例えば、悪性である又は悪性でない)とすることができる。いくつかの構成において、プロセス300は、画素値を所定の範囲(例えば、[127.5,127.5]の範囲)に正規化すること、及び/又は画像の高さを所定の高さ(例えば、1750画素)に正規化することによって、生の画像を前処理することができる。いくつかの構成において、アノテーション済み画像の第2のセットを生成するために、プロセス300は、画像を最大15%ランダムにサイズ変更する、及び/又は画像をランダムに縦方向にミラーリングリングすることができる。いくつかの構成において、プロセス300は、アノテーション済み画像のバックグラウンド部分を切り出すことができる。ランダム化及び/又は前処理は事前に行うことができる。アノテーション済み画像の第2のセットは、弱アノテーション済みと称することができる。
328において、プロセス300は、アノテーション済み画像の第2のセットに基づいて第2のニューラルネットワークをトレーニングすることができる。これまでオブジェクト検出モデルとして用いられていた第2のニューラルネットワークは、バウンディングボックス分類スコアの全てにわたって最大値を出力するように出力レイヤー250を変更することによって、画像分類モデルに変換することができる。このようにして、第2のニューラルネットワークは、バイナリラベルを用いるエンドツーエンドのトレーニングを可能にしながら完全に弁別可能とすることができる。いくつかの構成において、プロセス300は、学習率2.5e6で開始するアダムオプティマイザーを用いてモデルをトレーニングすることができ、学習率は、所定の繰り返し数で(例えば、100,000回の繰り返しごと、合計300,000回の繰り返しで)4分の1に減少させた。いくつかの構成において、プロセス300は、AUCパフォーマンスに基づき第2のニューラルネットワークは完全学習済みであると決定することができる。例えば、プロセス300は、4000回の繰り返しごとに画像の検証セットのAUCパフォーマンスを決定することができ、そして、AUCパフォーマンスが減少するか、又は同じままであれば、第2のニューラルネットワークは完全学習済みであると決定することができる。いくつかの構成において、プロセス300は、モデルが完全学習済みであると決定した後、完全学習済みモデルを微調整することができる。いくつかの構成において、プロセス300は、アノテーション済み画像の第1のセットに基づいて回帰部分を微調整することができる。より具体的には、プロセス300は、学習済みモデルのバックボーン部分及び分類部分に含まれる重みをフリーズさせて、回帰部分のみをトレーニングすることができる。このようにして、プロセス300は、回帰部分が更新されないアノテーション済み画像の第2のセットについての前のトレーニング中におけるバックボーン部分の重みのあらゆる変更に、回帰部分を適応させることができる。いくつかの構成において、プロセス300は、上で記載したものと同じ前処理技術及びデータ拡張技術を用いて、所定の学習率(例えば、2.5e6)で所定の繰り返し数(例えば、50,000回)、学習済みモデルをトレーニングすることができる。その後、プロセス300は332に進むことができる。
332において、プロセス300は、学習済みニューラルネットワークを出力することができる。学習済みニューラルネットワークは、第2の学習済みニューラルネットワークを含むことができる。プロセス300は、学習済みニューラルネットワークを(例えば、メモリ内に)保存させることができる。その後、プロセス300は終了できる。
図1、図2、図3及び図4を参照すると、2D***画像に基づく悪性インジケータを生成するためのプロセス400が示されている。プロセス400は、データ処理システムに含まれる1つ以上のメモリ上の命令として実装することができる。データ処理システムは、1つ以上のメモリと通信し命令を実行するように構成された1つ以上のプロセッサをさらに含むことができる。1つ以上のプロセッサはメモリにアクセスするように構成することができ、メモリは、大容量記憶装置128に含めることができ、2D***画像が保存されている。
404において、プロセス400は、2D***画像を受け取ることができる。2D***画像は、ネイティブな2Dマンモグラム画像(例えば、2Dフルフィールドデジタルマンモグラフィシステムによって生成された画像)とすることができる。2D***画像は患者と関連付けることができる。その後、プロセス400は408に進むことができる。
408において、プロセス400は、学習済みモデルに2D***画像を提供することができる。学習済みモデルは、プロセス300を用いて生成された学習済みニューラルネットワークを含むことができる。その後、プロセス400は412に進むことができる。
412において、プロセス400は、学習済みモデルからインジケータを受け取ることができる。いくつかの構成において、インジケータは、患者悪性可能性スコア及び2D***画像のエリアを含むことができる。2D***画像のエリアは学習済みモデルによって生成されたバウンディングボックスと関連付けることができ、患者悪性可能性スコアは病変を含み得る2D***画像のエリアの悪性と関連付けることができる。いくつかの構成において、インジケータは、2D***画像全体に関連する患者の悪性スコア(即ち、画像レベルスコア)を含むことができる。インジケータのコンポーネントは、出力レイヤー250を修正することによって、医療従事者の好みに基づいて修正することができる。いくつかの構成において、プロセス400は、複数のインジケータを受け取ることができる(例えば、2D***画像が複数の病変を有する場合)。その後、プロセス400は416に進むことができる。
416において、プロセス400は、保存及び/若しくは別のプロセスによる使用のためにメモリへ、並びに/又は人間の医療従事者が見る用にコンピュータモニタなどのディスプレイへ、インジケータを出力することができる。例えば、プロセス400は、医療施設内のディスプレイにインジケータを出力して、医療従事者がインジケータを見ることができるようにし、場合によっては、インジケータに基づいて患者の診断を決定できるようにする。インジケータは、乳がん患者の将来の分析及び/又は研究のために、医療記録のデータベースに保存されてもよい。いくつかの構成において、プロセス400は、412で受け取ったインジケータの1つ以上を、保存及び/若しくは別のプロセスによる使用のために、並びに/又は人間の医療従事者が見る用にコンピュータモニタなどのディスプレイへ、出力することもできる。プロセス400は、インジケータをレポートとして出力することができる。その後、プロセス400は終了できる。
図1、図2及び図5を参照すると、3Dトモシンセシスデータの2Dスライス内のROIを検出するためにトレーニングされたモデルを用いて合成画像を作成するためのプロセス500が示されている。プロセス500は、モデルから出力される最も関連性のあるROIを1つ以上選択しROIを用いて合成画像を作成するための1つ以上のステップを含むことができる。プロセス500は、データ処理システムに含まれる1つ以上のメモリ上の命令として実装することができる。データ処理システムは、1つ以上のメモリと通信し命令を実行するように構成された1つ以上のプロセッサをさらに含むことができる。1つ以上のプロセッサはメモリにアクセスするように構成することができ、メモリは、大容量記憶装置128に含めることができ、多数の2次元スライスを含む3Dトモシンセシスデータが保存されている。
504において、プロセス500は、患者の***組織の3Dトモシンセシスデータを受け取ることができる。3Dトモシンセシスデータは、X線イメージングシステム100などの3Dマンモグラフィイメージングシステムによって生成することができる。3Dトモシンセシスデータは、***組織の所定の厚さ、例えば1mmなど、に対応する多数の2Dスライスを含むことができる。3Dトモシンセシスデータは、患者及び/又はイメージングシステムに応じて、約10個から150個の又はそれ以上の2Dスライスを含むことができる。各2Dスライスは、多数の2Dスライスにおける2Dスライスの位置を示すスライス番号に関連付けることができる。各2Dスライスは、2000×1500画素などの所定サイズを有する画素のアレイとすることができる。その後、プロセス500は508に進むことができる。
508において、プロセス500は、多数の2Dスライスの各々を、2Dスライスに基づいてROIを検出することができる学習済みモデルに個別に提供することができる。学習済みモデルは上述したモデル200とすることができる。いくつかの構成において、一連のスライス番号と関連付けられたスライスなどの2Dスライスのサブセットを、モデルに提供することができる。一連のスライス番号は、2Dスライスの中間パーセンテージを含むことができる。例えば、スライスのサブセットは、2Dスライスの中間80パーセントを含むことができる(例えば、100個のスライスのうち10番目から90番目のスライス)。2Dスライスの中央範囲を使用すると、DBTスタックの端近くにあるノイズの多い画像を除去することができる。いくつかの構成において、医療従事者によってアノテーションされた2次元フルフィールドデジタルマンモグラフィ画像を含む画像データセットに基づいて、学習済みモデルをトレーニングすることができる。いくつかの構成において、図4と関連して記載されるプロセスを用いて学習済みモデルをトレーニングすることができる。その後、プロセス500は512に進むことができる。
512において、プロセス500は、モデルに提供された各2Dスライスについて、モデルが出力する多数のROIを受け取ることができる。モデルは、ゼロ個のROI、1つのROI、又は複数のROIを出力してもよい。2Dスライス及び/又はモデルによっては、スライスの大部分はROIを全く有していない場合がある。上で記載したように、ROIは、スコア及び2Dスライスの画素のサブアレイを含むことができ、各画素は強度値と2Dスライス内の位置とを有する。各ROIは、ROIが3Dトモシンセシスデータのどの2Dスライスから生成されたかを示すスライス番号と関連付けることができる。その後、プロセス500は516に進むことができる。
516において、プロセス500は、多数のROIから、所定の閾値未満のスコアを有するROIをフィルタで除去することができる。閾値の選択は、(より低い閾値又はより高い閾値をそれぞれ選択することによって)最終合成画像により多い又はより少ないROIを含めるため、及び/又は、(より低い値を選択することによって)可能性のある偽陰性を減らすため、及び/又は(より高い値を選択することによって)可能性のある偽陽性を減らすために行うことができる。例えば、ユーザは、スコアが0から1の範囲となり得るならば、閾値0.5を選択することができる。次に、プロセス500は、多数のROIから、0.5未満のスコアを有するROIを除去することができる。その後、プロセス500は520に進むことができる。いくつかの構成において、プロセス500は、いかなるROIもフィルタで除去することなく、512から520に進むことができる(例えば、閾値はゼロ)。
520において、プロセス500は、多数のROIが少なくとも1つのROIを含むか否かを決定することができる。その後、プロセス500は524に進むことができる。
524において、プロセス500は、多数のROIが少なくとも1つのROIを含まない(524での「NO」)と決定すると、528に進むことができる。あるいは、プロセス500は、多数のROIが少なくとも1つのROIを含むと決定すると、532に進むことができる。
528において、プロセス500は、ROIを全く使用せずに最終合成画像を生成することができる。いくつかの構成において、プロセスは、最終合成画像として使用するために、3Dトモシンセシスデータに含まれる2Dスライスのデフォルトスライスを選択することができる。デフォルトスライスは、2Dスライスの中間スライス(たとえば、75個の2Dスライスの38番目のスライス)とすることができる。その後、デフォルトスライスの画素を最終合成画像の画素として含めることができる。その後、プロセス500は終了できる。
532において、プロセス500は、多数のROIに含まれる1つ以上のROIを有する予備合成画像の領域を入力(populate)することができる。予備合成画像は、画素強度値の各々に対してヌル値で初期化された最終合成画像と同サイズのアレイとすることができる。その後、プロセス500は、予備合成画像に1つ以上のROIを追加することができる。ROIは、1つ以上の基準に基づいて追加することができる。いくつかの構成において、プロセスは、各画素位置について最も高いスコアを有するROIを決定することができる。次いで、画素位置における予備合成画像の強度値を画素位置におけるROIの強度値と等しくなるように設定することができる。言い換えれば、プロセス532は、予備合成画像を入力するために最大疑い手法(maximum suspicion technique)を利用することができる。複数のROIが所与の画素位置で同じスコアを有する場合には、画素の数が最大のROI、画素位置を囲む画素の数が最大のROI、及び/又は、画素位置での強度値が最も高いROIを、画素位置に対するROIとして選択することができる。いくつかの構成において、IoU(intersection-over-union)閾値(例えば0.2のIoU)に基づく非最大値抑制(NMS)を用いて予備合成画像を入力することができる。所与の画素において複数のROIがオーバーラップする場合、プロセス500は、スコアの低いROIを不使用とすることで、スコアの最も高いROI以外の全てのROIを「抑制」して、予備合成画像を入力することができる。例えば、スコア0.85及び0.75のROIを用いて予備画像を入力することができる。スコア0.85のROIは、スコア0.65のより低いスコアのROIとオーバーラップする(例えば、スコア0.65のROIと同じ画素位置のうちの少なくとも1つを占める)ことがあり、スコア0.75のROIは、スコア0.65のROIとオーバーラップしないことがある。また、予備合成画像の各画素は、所与の画素の所与の強度値を入力するために使用されるROIのスライス番号に関連付けることができる。その後、プロセス500は536に進むことができる。
536において、プロセス500は、予備合成画像の未入力領域を埋めることができる。いくつかの構成において、プロセス500は、デフォルトスライスに基づいて予備合成画像の未入力領域を埋めることができる。いくつかの構成において、プロセスは、予備合成スライスの未入力領域を埋めるのに使用するために、3Dトモシンセシスデータに含まれる2Dスライスのデフォルトスライスを選択することができる。デフォルトスライスは、2Dスライスの中間スライス(たとえば、75個の2Dスライスの38番目のスライス)とすることができる。その後、プロセス500は540に進むことができる。
540において、プロセス500は、保存及び/若しくは別のプロセスによる使用のためにメモリへ、並びに/又は人間の医療従事者が見る用にコンピュータモニタなどのディスプレイへ、最終合成画像を出力することができる。その後、プロセス500は終了できる。
図1から図5及び図6を参照すると、ニューラルネットワークをトレーニングするための別のプロセス600が示されている。特に、プロセス600は、3D画像に基づいて悪性を検出するためのニューラルネットワークをトレーニングすることができる。ニューラルネットワークはモデル200に含めることができる。プロセス600は、データ処理システムに含まれる1つ以上のメモリ上の命令として実装することができる。データ処理システムは、1つ以上のメモリと通信し命令を実行するように構成された1つ以上のプロセッサをさらに含むことができる。1つ以上のプロセッサはメモリにアクセスするように構成することができ、メモリは、大容量記憶装置128に含めることができ、トレーニングデータが保存されている。
604において、プロセス600は部分学習済みニューラルネットワークを受け取ることができる。部分学習済みニューラルネットワークは、プロセス300における320及び/又は328の後に第2の学習済みニューラルネットワークとすることができる。言い換えれば、部分学習済みニューラルネットワークは、アノテーション済み画像の第1のセットに基づいてトレーニングすることができる。その後、プロセス600は608に進むことができる。
608において、プロセス600はアノテーション済み3D画像のセットを受け取ることができる。いくつかの構成において、アノテーション済み3D画像のセットに含まれる各3D画像は、画像レベルのラベルでラベル付けされたDBT画像とすることができる。画像レベルは、バイナリ悪性ラベル(例えば、悪性である又は悪性でない)とすることができる。アノテーション済み画像の第2のセットは、弱アノテーション済みと称することができる。その後、プロセス600は612に進むことができる。
612において、プロセス600は複数の合成画像を生成することができる。いくつかの構成において、プロセス600は、アノテーション済み3D画像のセットと共に、プロセス500を使用して、複数の合成画像に含まれる各合成画像を生成することができる。例えば、プロセス500は、アノテーション済み3D画像のセットに含まれる3D画像ごとに、最大疑い2D画像を生成することができる。各合成画像は、合成画像を生成するために使用される3D画像に関連するラベルと関連付けることができる。その後、プロセス600は616に進むことができる。
616において、プロセス600は、複数の合成画像に基づいて部分学習済みニューラルネットワークをトレーニングすることができる。これまでオブジェクト検出モデルとして用いられていた部分学習済みニューラルネットワークは、バウンディングボックス分類スコアの全てにわたって最大値を出力するように出力レイヤー250を変更することによって、画像分類モデルに変換することができる。このようにして、部分学習済みニューラルネットワークは、バイナリラベルを用いるエンドツーエンドのトレーニングを可能にしながら完全に弁別可能とすることができる。いくつかの構成において、プロセス600は、学習率2.5e6で開始するアダムオプティマイザーを用いてモデルをトレーニングすることができ、学習率は所定の繰り返し数で4分の1に減少させた。プロセス600は、利用可能なDBTデータが少ないために、プロセス600において第2の学習済みニューラルネットワークがトレーニングされる繰り返し数よりも少ない繰り返し数で、部分学習済みニューラルネットワークをトレーニングすることができる。いくつかの構成において、プロセス600は、AUCパフォーマンスに基づき第2のニューラルネットワークは完全学習済みであると決定することができる。例えば、プロセス600は、4000回の繰り返しごとに画像の検証セットのAUCパフォーマンスを決定することができ、そして、AUCパフォーマンスが減少するか、又は同じままであれば、部分学習済みニューラルネットワークは完全学習済みであると決定することができる。いくつかの構成において、プロセス600は、モデルが完全学習済みであると決定した後、完全学習済みモデルを微調整することができる。いくつかの構成において、プロセス600は、アノテーション済み画像の2Dセットに基づいて回帰部分を微調整することができる。より具体的には、プロセス600は、学習済みモデルのバックボーン部分及び分類部分に含まれる重みをフリーズさせて、回帰部分のみをトレーニングすることができる。このようにして、プロセス600は、回帰部分が更新されないアノテーション済み画像の第2のセットについての前のトレーニング中におけるバックボーン部分の重みのあらゆる変更に、回帰部分を適応させることができる。いくつかの構成において、プロセス600は、上で記載したものと同じ前処理技術及びデータ拡張技術を用いて、所定の学習率(例えば、2.5e6)で所定の繰り返し数(例えば、50,000回)、学習済みモデルをトレーニングすることができる。その後、プロセス600は620に進むことができる。
620において、プロセス600は、学習済みニューラルネットワークを出力することができる。学習済みニューラルネットワークは、616にて生成された完全学習済みニューラルネットワークを含むことができる。プロセス600は、学習済みニューラルネットワークを(例えば、メモリ内に)保存させることができる。その後、プロセス600は終了できる。
図1、図2、図5、図6及び図7を参照すると、3D***画像に基づく悪性インジケータを生成するためのプロセス700が示されている。プロセス600は、データ処理システムに含まれる1つ以上のメモリ上の命令として実装することができる。データ処理システムは、1つ以上のメモリと通信し命令を実行するように構成された1つ以上のプロセッサをさらに含むことができる。1つ以上のプロセッサはメモリにアクセスするように構成することができ、メモリは、大容量記憶装置128に含めることができ、3D***画像が保存されている。
704において、プロセス700は、3D***画像を受け取ることができる。3D***画像はDBT画像とすることができる。3D***画像は患者と関連付けることができる。その後、プロセス700は708に進むことができる。
708において、プロセス700は、3D***画像に基づいて合成2D画像を生成することができる。プロセス700は、プロセス500を用いて合成2D画像を生成することができる。その後、プロセス700は712に進むことができる。
712において、プロセス700は、合成2D画像を学習済みモデルに提供することができる。学習済みモデルは、プロセス600を用いて生成された学習済みニューラルネットワークを含むことができる。その後、プロセス700は716に進むことができる。
716において、プロセス700は、学習済みモデルからインジケータを受け取ることができる。いくつかの構成において、インジケータは、患者悪性可能性スコア及び合成2D画像のエリアを含むことができる。いくつかの構成において、合成画像のエリア及び/又は画素を、合成2D画像を生成するために使用される(複数の)元のスライスを示す1つ以上のスライス番号と関連付けることができる。このようにして、医療従事者は病変を含む1つ以上のスライスを見ることができる。いくつかの構成において、インジケータは、合成2D画像のエリアを生成するために使用されるスライスのランク付けされた順序付けを含むことができる(例えば、所与のスライスに基づいて生成される合成2D画像のエリアのパーセンテージによって順序付けされたスライス)。このようにして、医療従事者は最も関連性のあるスライスを見ることができる。合成2D画像のエリアは、学習済みモデルによって生成されたバウンディングボックスと関連付けることができ、そして患者悪性可能性スコアは、病変を含み得る合成2D画像のエリアの悪性と関連付けることができる。いくつかの構成において、インジケータは、合成2D画像全体に関連する患者の悪性スコア(即ち、画像レベルスコア)を含むことができる。インジケータのコンポーネントは、出力レイヤー250を修正することによって、医療従事者の好みに基づいて修正することができる。いくつかの構成において、プロセス700は、複数のインジケータを受け取ることができる(例えば、合成2D画像が複数の病変を有する場合)。その後、プロセス700は720に進むことができる。
720において、プロセス700は、保存及び/若しくは別のプロセスによる使用のためにメモリへ、並びに/又は人間の医療従事者が見る用にコンピュータモニタなどのディスプレイへ、インジケータを出力することができる。例えば、プロセス700は、医療施設内のディスプレイにインジケータを出力して、医療従事者がインジケータを見ることができるようにし、場合によっては、インジケータに基づいて患者の診断を決定できるようにする。インジケータは、乳がん患者の将来の分析及び/又は研究のために、医療記録のデータベースに保存されてもよい。いくつかの構成において、プロセス700は、716で受け取ったインジケータの1つ以上を、保存及び/若しくは別のプロセスによる使用のために、並びに/又は人間の医療従事者が見る用にコンピュータモニタなどのディスプレイへ、出力することもできる。プロセス700は、インジケータをレポートとして出力することができる。その後、プロセス700は終了できる。
<テスト>
テストにおいて、プロセス300と共にトレーニングされたモデルは、人間の医療従事者及びいくつかの代替的な予測アプローチをしのぐことが示された。表1は、モデルのトレーニング及びテストに用いたデータソースをまとめたものである。データセットOMI-DBとDDSMに加えて、サイトA、B、Cと示されるトレーニングのための3つの米国臨床サイトからデータセットを収集した。テストに用いたデータは、モデルトレーニング又は選択に一度も用いられていない3つのデータセットに加えて、OMI-DB及び「サイトA-DM」データセットのテストパーティションを含む。これらのテスト専用データセットは、読影者研究に使用されるマサチューセッツ州の保健システムからのスクリーニングDM(デジタルマンモグラフィ、例えば2Dマンモグラフィ)データセット(サイトD)、中国の都市部の病院からの診断DMデータセット(サイトE)、及びオレゴン州の地域病院からのスクリーニングDBTデータセット(サイトA-DBT)を含む。ここで、スクリーニングマンモグラムのテストは可能なときにはいつでも行われたが、サイトEのデータセットについては、中国でのスクリーニング率が低いことから診断検査(即ち、女性が症状を呈する検査)を用いる必要があった。
テストにおいて、プロセス300と共にトレーニングされたモデルは、人間の医療従事者及びいくつかの代替的な予測アプローチをしのぐことが示された。表1は、モデルのトレーニング及びテストに用いたデータソースをまとめたものである。データセットOMI-DBとDDSMに加えて、サイトA、B、Cと示されるトレーニングのための3つの米国臨床サイトからデータセットを収集した。テストに用いたデータは、モデルトレーニング又は選択に一度も用いられていない3つのデータセットに加えて、OMI-DB及び「サイトA-DM」データセットのテストパーティションを含む。これらのテスト専用データセットは、読影者研究に使用されるマサチューセッツ州の保健システムからのスクリーニングDM(デジタルマンモグラフィ、例えば2Dマンモグラフィ)データセット(サイトD)、中国の都市部の病院からの診断DMデータセット(サイトE)、及びオレゴン州の地域病院からのスクリーニングDBTデータセット(サイトA-DBT)を含む。ここで、スクリーニングマンモグラムのテストは可能なときにはいつでも行われたが、サイトEのデータセットについては、中国でのスクリーニング率が低いことから診断検査(即ち、女性が症状を呈する検査)を用いる必要があった。
読影者研究は「インデックス」及び「プレインデックス」がん検査の両方を用いて、両レジメンの専門放射線科医を直接比較するために行われた。具体的には、インデックス検査は、生検で悪性と診断される3ヵ月前までに取得されたマンモグラムと定義される。プレインデックス検査は、インデックス検査の12ヵ月から24ヵ月前に取得されたものと定義され、臨床診療においては陰性と判断された。BIRADS基準に従い、BIRADSスコア1又は2を陰性判断とみなし、陰性検査とその後の追加のBIRADS1~2スクリーニングとして「確認済み陰性」をさらに定義した。読影者研究で使用された全ての陰性は確認済み陰性であった。
図8は、読影者研究の「インデックス」コンポーネントの結果をまとめた受信者操作特性(ROC)プロットである。この研究には5人の放射線科医が参加し、それぞれ***画像診断のフェローシップトレーニングを受けており、現場で常勤で業務していた。スクリーニングDM事例で構成されるデータは、トレーニングデータのあらゆるソースとは米国の異なる州にある地域保健システムから過去にさかのぼって収集された。図8は、事例(症例)レベルのパフォーマンスに基づくROCプロットであり、131件のインデックスがん検査及び154件の確認済み陰性のセットについて、開示された技術を使用してトレーニングされた深層学習モデルと読影者とを比較したものである。各読影者を表す点は全てモデルのROC曲線を下回っており、モデルが5名の放射線科医全員をしのいだことを示している。平均読影者特異度にて、モデルは14.2%の絶対的感度増加を達成した(95%信頼区間(CI):9.2~18.5%;p<0.0001)。平均読影者感度にて、モデルは24.0%の絶対的特異度増加を達成した(95%CI:17.4~30.4%;p<0.0001)。連続的な「悪性の可能性」スコアに基づく読影者ROC曲線も作成され、これにおいて、モデルによる同様のより高いパフォーマンスが示された。さらに、このモデルは、読影者のシミュレーションされた組み合せの全てをしのぎ、またこのデータセットに関する他の最近発表されたモデルにも引けを取らない。
図9は、同じ患者からの「プレインデックス」検査を用いた読影者研究の第2のコンポーネントをまとめたROCプロットである。図9は、120件のプレインデックスがん検査(これはがんが発見されたインデックス検査の12ヵ月から24ヵ月前に陰性と判断されたマンモグラムとして定義される)及び154件の確認済み陰性を含むデータセットに基づいて作成された。研究によって、乳がんは典型的にはマンモグラフィによる発見の3年以上前に存在すると推定されるため、プレインデックス検査はほとんどチャレンジングな偽陰性と考えることができる。深層学習モデルは、早期発見及びプレインデックスパラダイムにおいて5名の読影者全員をしのいだ。読影者及びモデルの絶対パフォーマンスは、インデックスがん検査でよりもプレインデックスがん検査でのほうが低く、これは後者の困難さを考慮すると予想されたものである。それにもかかわらず、モデルは、依然として、平均読影者特異度にて17.5%の絶対的感度増加を示し(95%CI:6.0~26.2%;p=0.0009)、平均読影者感度にて16.2%の絶対的特異度増加を示した(95%CI:7.3~24.6%;p=0.0008)。90%の特異度では、モデルは、プレインデックス(例えば、「見逃し」)がん事例の45.8%(95%CI:28.8~57.1%)について、追加の精密検査とのフラグを付けたと考えられる。モデルはさらに、プレインデックスデータセットに関して、最近発表されたモデルよりも高いパフォーマンスを示した。
モデルの判断可能なローカライゼーション出力を考えると、正確なローカライゼーションを必要としながら感度を評価することも可能である。左右レベル及び四分円レベルのローカライゼーションの両方について、モデルは、再度、読影者研究において、インデックスの場合及びプレインデックスの場合の両方について感度の向上を示す。また、病変のタイプ、がんのタイプ、がんの大きさ及び***密度などの因子を考慮すると、より高いモデルパフォーマンスの傾向が適用できる。
読影者研究のパフォーマンスを基に、異なる集団、機器製造業者及びモダリティにまたがるより大規模で多様なデータセットについて、単独のパフォーマンスが評価された。これらの結果は表2にまとめられており、これらはインデックスがん検査を用いて計算された。
表2において、全ての結果は、陰性が未確認のものであるサイトEを除き、がん事例についての「インデックス」検査及び非がん事例についての「確認済み」陰性を使用したものに相当する。列1及び列2は、OMI-DB(がん1205件、陰性1538件)及びサイトA(がん254件、陰性7697件)データセットのホールドアウト(held-out)テストセットについてプロセス300を用いてトレーニングした2D深層学習モデルのパフォーマンスを示す。列3及び列4は、中国の病院で収集されたデータセットでのパフォーマンスを示す(サイトE;がん533件、陰性1000件)。データセットは、中国におけるスクリーニングマンモグラフィの普及率が低いことを考慮して、完全に診断検査で構成される。それにもかかわらず、ブートストラップリサンプリングを用いて腫瘍サイズを調整して米国のスクリーニング集団で期待される腫瘍サイズの分布に近似させる場合でも、モデルは依然として高パフォーマンスを達成している(列7)。列5から列7は、DBTデータ(サイトA-DBT;がん78件、陰性518件)でのパフォーマンスを示している。列5は、DBT研究にてDM画像を拡張/置換するために作成された、製造業者が生成した合成2D画像で微調整された2Dモデルの結果を含む(*はこの微調整されたモデルを示す)。列6は、プロセス600を用いてトレーニングされた弱教師あり3Dモデルの結果を含み、DBTスライスから計算されたプロセス500を介して生成された合成画像で評価された場合の強いパフォーマンスを示している。ここで、DBTボリュームを全スライスにわたって最大バウンディングボックスコアとしてスコアリングする際に、合成画像を作成するために使用された強教師あり2Dモデルは、0.865±0.020のAUCを示す。よって、このモデルをプロセス500にしたがって作成された合成画像で微調整することで、そのパフォーマンスが著しく向上する。列7は、プロセス600にしたがってトレーニングされた最終3Dモデルと、プロセス300にしたがってトレーニングされた2Dモデルとにおける予測を組み合わせた場合の結果を示す。各AUC値の標準偏差はブートストラップ法により計算された。
1205件のがん及び1538件の確認済み陰性を含むOMI-DBのテストパーティションから開始して、開示された技術を用いてトレーニングされたモデルは、AUCが0.963±0.003(全1976件の陰性-確認済み及び未確認-を用いた場合0.961±0.003)である英国のスクリーニング集団からのDM検査に対して強いパフォーマンスを示す。254件のがん及び7697件の確認済み陰性を含むサイトA-DMデータセットのテストパーティションについて、モデルは0.927±0.008(全16,369件の陰性を用いた場合0.931±0.008)のAUCを達成し、これは、他のテストされた米国スクリーニングDMデータセット(サイトD;p=0.22)での結果と統計的な差はない。サイトA-DMデータセットは、他のデータセットの大部分について使用されたHologic社製機器とは対照的に、GE社製機器を使用して取得されたマンモグラムで構成される。
プロセス400にしたがってトレーニングされたモデルの一般化可能性をさらにテストするために、中国の都市部の病院(サイトE)で収集されたDMデータセットでパフォーマンスを評価した。中国でのスクリーニング率が低いこと、及びアジア人集団で高密度***の女性の割合が多いなど欧米人集団とアジア人集団の間でマンモグラムに見いだされ、知られている(及び場合によっては知られていない)生物学的差異を考慮すると、このデータセットへの一般化をテストすることは特に有意義である。中国の病院でローカルに評価されたモデルは、この集団によく一般化され、0.971±0.005のAUCを達成した(全て陰性を用いたが、フォローアップスクリーニングを欠いていることを考慮すると「確認」は不可能である)。腫瘍サイズを米国のスクリーニング集団で期待される統計量とほぼ一致するように調整した場合でも、モデルは0.956±0.020のAUCを達成した。
最後に、プロセス600のアプローチにしたがってトレーニングされたモデルは、DBTモデルトレーニングに使用されていないサイトで評価した場合、良好に機能する。モデルは0.947±0.012(78件のがん及び519件の確認済み陰性;全11,609件の陰性検査を用いた場合0.950±0.01)のAUCを達成した。強教師あり2Dモデルが、代わりに、各DBT研究においてデフォルトで生成される製造業者が生成した合成2D画像で微調整された場合、得られたモデルは、テストセットについて0.922±0.016のAUC(全て陰性を用いた場合0.923±0.015のAUC)を達成する。製造業者が生成した合成画像とプロセス500にしたがって生成された合成画像とについて予測を平均化すると、全体パフォーマンスは0.957±0.010(全て陰性を用いた場合0.959±0.008)となる。
<方法>
・データセットの記述
表1に記載の全利用データセットの詳細を以下に示す。全ての非公開データセットはIRBの承認のもとに収集され、モデルのトレーニング及びテストの前に識別解除された。各データソースにおいて患者レベルでデータ分割が作成され、つまり、特定の患者からの検査が全て同じ分割に含まれていたことを意味する。分割は、トレーニング、モデル選択及びテストで構成され、モデル選択分割は、最終モデルを選ぶため及びモデルトレーニングを停止する時を決定するために使用される。トレーニングデータのラベル割り当て及び事例選択のルールは、収集期間及び利用可能なメタデータ(後述する)のばらつきがあるため、データセット間でわずかに異なっていた。但し、テストセット及びラベル基準の定義は、特に明記しない限り、データセット間で標準化した。ラベルの割り当てには以下の定義を用いた。
インデックスがん-がんの診断前3ヵ月以内に撮影されたマンモグラム。
プレインデックスがん-BIRADSカテゴリの1又は2と判断され、インデックス検査の12ヵ月から24ヵ月前に取得されたマンモグラム。
陰性-乳がんの過去の又は将来の病歴のない患者からの、BIRADSの1又は2と判断されたマンモグラム。
確認済み陰性-陰性検査に続いて、9ヵ月から39ヵ月後の次のスクリーニング検査時(これは、3ヵ月のバッファを伴うスクリーニングパラダイムに応じた1年間から3年間のフォローアップを表す)に追加でBIRADSの1又は2と判断されたもの。時間窓は、3年を超えて、3年毎のスクリーニング(例、英国)を含めるように延長された。終始、「プレインデックス」事例は陽性として扱われ、何故なら、適切なフォローアップによって病理診断されたがんが判定できたか保証できないとはいえ、これらの検査の大部分については取得の時点でがんが存在していた可能性が高いからである。
・データセットの記述
表1に記載の全利用データセットの詳細を以下に示す。全ての非公開データセットはIRBの承認のもとに収集され、モデルのトレーニング及びテストの前に識別解除された。各データソースにおいて患者レベルでデータ分割が作成され、つまり、特定の患者からの検査が全て同じ分割に含まれていたことを意味する。分割は、トレーニング、モデル選択及びテストで構成され、モデル選択分割は、最終モデルを選ぶため及びモデルトレーニングを停止する時を決定するために使用される。トレーニングデータのラベル割り当て及び事例選択のルールは、収集期間及び利用可能なメタデータ(後述する)のばらつきがあるため、データセット間でわずかに異なっていた。但し、テストセット及びラベル基準の定義は、特に明記しない限り、データセット間で標準化した。ラベルの割り当てには以下の定義を用いた。
インデックスがん-がんの診断前3ヵ月以内に撮影されたマンモグラム。
プレインデックスがん-BIRADSカテゴリの1又は2と判断され、インデックス検査の12ヵ月から24ヵ月前に取得されたマンモグラム。
陰性-乳がんの過去の又は将来の病歴のない患者からの、BIRADSの1又は2と判断されたマンモグラム。
確認済み陰性-陰性検査に続いて、9ヵ月から39ヵ月後の次のスクリーニング検査時(これは、3ヵ月のバッファを伴うスクリーニングパラダイムに応じた1年間から3年間のフォローアップを表す)に追加でBIRADSの1又は2と判断されたもの。時間窓は、3年を超えて、3年毎のスクリーニング(例、英国)を含めるように延長された。終始、「プレインデックス」事例は陽性として扱われ、何故なら、適切なフォローアップによって病理診断されたがんが判定できたか保証できないとはいえ、これらの検査の大部分については取得の時点でがんが存在していた可能性が高いからである。
全てのデータセットは、サイトDを除いて、テストセットを作成するために同じアルゴリズムを共有した(後述の対応するセクションで詳細に記載する)。研究は、上で記載した基準に基づいて、「インデックス」、「プレインデックス」、「確認済み陰性」、「未確認陰性」、又は「なし」としてラベル付けされた。テストセットのなかの各患者について、1つの研究が、「インデックス」、「プレインデックス」、「確認済み陰性」、「未確認陰性」の上から順の優先順に選ばれた。患者が、選ばれたラベルで複数回検査を受けた場合、1つの検査がランダムにサンプリングされた。患者がインデックス検査を受けた場合は、1つのプレインデックス検査も可能な場合には含めた。全てのトレーニング及びテストについて、頭尾方向(CC)及び内外斜方向(MLO)マンモグラフィ像のみが用いられた。全てのテストセットは、中国でのスクリーニング率が低いことを考慮して全てのテストされた検査が診断検査であるサイトEを除いては、スクリーニング検査(即ち、スクリーニングインデックスがん、スクリーニング陰性)のみを含む。ここで、確認済み陰性と未確認陰性の割合はサイトによって大きなばらつきがあり、何故なら、検査取得の期間が異なる(即ち、確認に十分な時間が経過していなかった可能性がある)、スクリーニングパラダイムが異なる、及び/又はBIRADS情報収集範囲が異なるからである。パフォーマンスは、陰性の厳密な定義で結果を検討しつつより多量のデータについても評価するために、可能な場合には、確認済み陰性と未確認陰性の両方を用いて報告された。
トレーニングでは、各トレーニングインスタンス(例えば、画像又はバウンディングボックス)について、がんについては「1」のラベル、非がんについては「0」のラベルを割り当てて、ラベル付けした。画像に「1」(がん)のラベルを割り当てる主な決定は、がんの確認(生検)と画像取得の間で許される時間窓の中でなされる。米国のデータセットについては、この窓は15ヵ月に設定されている。この時間窓は、トレーニング用のいくつかのプレインデックスがん検査を含めながら過剰適合のリスクをバランスさせるように選択された。米国のデータセット(インデックスがんのみを有するDDSMを除く)については、ローカライゼーションアノテーションが利用できなかったため、時間窓をさらに広げることで、より潜行性のがんについての過剰適合につながる可能性がある。それにもかかわらず、米国での年1回と隔年のスクリーニングをミックスすることにより、15ヵ月間の時間窓を用いていくつかのプレインデックスがんを含めることが可能となる。英国のOMI-DBについては、データセットに強ラベル済みデータが高い割合で含まれているため、そして標準的なスクリーニング間隔は英国の方が長いことから、この窓は1年延長されている。非がんについては、特に記載のない限り、がんの病歴のない患者からのスクリーニング陰性検査(BIRADSの1又は2)が使用され、可能な場合には、がんの病歴のない患者からの病理的に確認された良性事例が使用された。病理的に確認された良性事例については、スクリーニング検査と診断検査の両方についてトレーニングを行った。がんについては、スクリーニング検査及び診断検査の両方がトレーニングに追加で含まれた。診断検査に関するトレーニングは、スクリーニング検査のみで評価した場合でもパフォーマンスを向上させることができる(その逆も同様)ことが分かった。スクリーニング検査のみに関するトレーニングが行われた唯一のデータセットはサイトA-DMデータセットであり、良性の生検情報が不足していれば、トレーニングに含まれることとなる診断検査の全てががんとなってしまうため、このようなバイアスを避けるために診断検査は全て除外された。1人の患者につき1つの検査しか含まないモデルテストとは対照的に、所定の患者についての全適格検査がトレーニングに使用された。以下に、データセットのさらなる詳細を記載する。
・スクリーニングマンモグラフィのデジタルデータベース(DDSM)
DDSMは、検証済み病理情報を有する正常、良性、悪性にカテゴライズされた事例を含む米国のスキャンされたフィルムマンモグラフィ研究の公開データベースである。このデータセットには、検出された病変ごとに放射線科医が描いた分割マップが含まれる。データは90%/10%でトレーニング/モデル選択の分割に分割され、結果として、がん732件、良性743件、及び正常807件のトレーニングのための研究が得られた。DDSMからのデータは、スキャンされたフィルムデータセットであることを考慮して、テストには使用されなかった。
DDSMは、検証済み病理情報を有する正常、良性、悪性にカテゴライズされた事例を含む米国のスキャンされたフィルムマンモグラフィ研究の公開データベースである。このデータセットには、検出された病変ごとに放射線科医が描いた分割マップが含まれる。データは90%/10%でトレーニング/モデル選択の分割に分割され、結果として、がん732件、良性743件、及び正常807件のトレーニングのための研究が得られた。DDSMからのデータは、スキャンされたフィルムデータセットであることを考慮して、テストには使用されなかった。
・最適マンモグラフィイメージングデータベース(OMI-DB)
OMI-DBは英国の公開データセットであり、主にHologic社製機器を用いて得られたスクリーニング及び診断用デジタルマンモグラムを含んでいる。患者のユニークなリストを60%/20%/20%でトレーニング/モデル選択/テストの分割に分割した。結果として、がん研究5233件(バウンディングボックス付き2332件)、良性研究1276件(バウンディングボックス付き296件)、及び陰性研究16,887件のトレーニングセットが得られた。ここで、OMI-DBにおける陰性に対する陽性の割合はスクリーニング集団で期待される割合よりもはるかに高いものの、陽性及び陰性自体はそれぞれの集団からランダムにサンプリングされた。したがって、ROC曲線の発生率に対する不変性を考慮すると、この集団におけるテストセットのAUCでは、自然発生率を有する全集団と比較してバイアスは予測されない。
OMI-DBは英国の公開データセットであり、主にHologic社製機器を用いて得られたスクリーニング及び診断用デジタルマンモグラムを含んでいる。患者のユニークなリストを60%/20%/20%でトレーニング/モデル選択/テストの分割に分割した。結果として、がん研究5233件(バウンディングボックス付き2332件)、良性研究1276件(バウンディングボックス付き296件)、及び陰性研究16,887件のトレーニングセットが得られた。ここで、OMI-DBにおける陰性に対する陽性の割合はスクリーニング集団で期待される割合よりもはるかに高いものの、陽性及び陰性自体はそれぞれの集団からランダムにサンプリングされた。したがって、ROC曲線の発生率に対する不変性を考慮すると、この集団におけるテストセットのAUCでは、自然発生率を有する全集団と比較してバイアスは予測されない。
・サイトA
サイトAはオレゴン州の地域病院である。サイトAからのデータセットは主にスクリーニングマンモグラムで構成されており、2010年から2015年のDMデータはほぼ全てGE社製機器から収集され、2016年から2017年のDBTデータはほぼ全てHologic社製機器から収集された。DMデータについては、患者の40%がトレーニングに使用され、20%がモデル選択に使用され、40%がテストに使用された。DBTデータは、他の利用されたDBTデータセットと比較してスクリーニング検査の割合が高いことから、テストのためのみに使用された。ローカル病院のがん登録を用いて、両方のモダリティについてのグランドトゥルースのがんの状態が得られた。放射線レポートにも各研究が添付され、BIRADS情報が含まれた。DBTデータについては、良性のリストが病院から追加提供されたが、DMデータについてはそのような情報は入手できなかった。DMデータセットに存在する縦断的データの程度と、このデータのための確認済みの良性病理情報の欠如を考慮して、非がんはトレーニングのためにより厳密に選択され、特に、検査の前後18か月間、患者に関する非スクリーニング手順又は非正常判断の記録を持たないことが陰性には必要とされた。結果として、サイトA-DMデータセットでのトレーニングについて、がん研究466件、陰性研究48,248件が得られた。
サイトAはオレゴン州の地域病院である。サイトAからのデータセットは主にスクリーニングマンモグラムで構成されており、2010年から2015年のDMデータはほぼ全てGE社製機器から収集され、2016年から2017年のDBTデータはほぼ全てHologic社製機器から収集された。DMデータについては、患者の40%がトレーニングに使用され、20%がモデル選択に使用され、40%がテストに使用された。DBTデータは、他の利用されたDBTデータセットと比較してスクリーニング検査の割合が高いことから、テストのためのみに使用された。ローカル病院のがん登録を用いて、両方のモダリティについてのグランドトゥルースのがんの状態が得られた。放射線レポートにも各研究が添付され、BIRADS情報が含まれた。DBTデータについては、良性のリストが病院から追加提供されたが、DMデータについてはそのような情報は入手できなかった。DMデータセットに存在する縦断的データの程度と、このデータのための確認済みの良性病理情報の欠如を考慮して、非がんはトレーニングのためにより厳密に選択され、特に、検査の前後18か月間、患者に関する非スクリーニング手順又は非正常判断の記録を持たないことが陰性には必要とされた。結果として、サイトA-DMデータセットでのトレーニングについて、がん研究466件、陰性研究48,248件が得られた。
・サイトB
サイトBは、ロードアイランド州の入院医療センター及び関連イメージングセンターで構成されている。このサイトからのデータは、Hologic社製機器からのDBTマンモグラムを含み、2016年から2017年の間にさかのぼって収集されたスクリーニング検査及び診断検査がミックスされている。がんの状態、良性結果、及びBIRADSは、ローカルデータベースを用いて決定された。ユニークな患者のリストが、80%/20%でトレーニング/モデル選択の分割に分割された。トレーニングに利用できるDBTの量が比較的少なく、トレーニングに使用されていないデータセットでのテストが望ましいことを考慮し、サイトBはモデル開発にのみ使用された。トレーニング用分割は、陰性13,767件、良性379件、がん263件で構成されている。製造業者が生成した合成2D画像も最終2Dモデルのための弱教師ありトレーニングに含まれた。
サイトBは、ロードアイランド州の入院医療センター及び関連イメージングセンターで構成されている。このサイトからのデータは、Hologic社製機器からのDBTマンモグラムを含み、2016年から2017年の間にさかのぼって収集されたスクリーニング検査及び診断検査がミックスされている。がんの状態、良性結果、及びBIRADSは、ローカルデータベースを用いて決定された。ユニークな患者のリストが、80%/20%でトレーニング/モデル選択の分割に分割された。トレーニングに利用できるDBTの量が比較的少なく、トレーニングに使用されていないデータセットでのテストが望ましいことを考慮し、サイトBはモデル開発にのみ使用された。トレーニング用分割は、陰性13,767件、良性379件、がん263件で構成されている。製造業者が生成した合成2D画像も最終2Dモデルのための弱教師ありトレーニングに含まれた。
・サイトC
サイトCはサイトAとは別のオレゴン州の保健システムである。サイトCからはDBT事例が2017年から2018年の間にさかのぼって収集された。データは、ほぼ全てHologic社製機器を用いて取得されたスクリーニング事例と診断事例のミックスで構成されている。ユニークな患者のリストが、70%/30%でトレーニング/モデル選択の分割に分割された。地域がん登録を用いて、がんの状態が決定された。サイトBと同様に、サイトCはモデル開発のみに使用された。過去のBIRADS情報は、サイトCの全事例について容易に入手できなかったため、地域がん登録に登録されていない患者の事例が非がんとしてトレーニングに用いられた。サイトCとサイトAの地理的近接性を考慮し、サイトAについてテストを行う際には、両セットで重複する少数の患者が使用された。ここで、製造業者が生成した合成2D画像は、最終2Dモデルの弱教師ありトレーニングにも含まれていた。
サイトCはサイトAとは別のオレゴン州の保健システムである。サイトCからはDBT事例が2017年から2018年の間にさかのぼって収集された。データは、ほぼ全てHologic社製機器を用いて取得されたスクリーニング事例と診断事例のミックスで構成されている。ユニークな患者のリストが、70%/30%でトレーニング/モデル選択の分割に分割された。地域がん登録を用いて、がんの状態が決定された。サイトBと同様に、サイトCはモデル開発のみに使用された。過去のBIRADS情報は、サイトCの全事例について容易に入手できなかったため、地域がん登録に登録されていない患者の事例が非がんとしてトレーニングに用いられた。サイトCとサイトAの地理的近接性を考慮し、サイトAについてテストを行う際には、両セットで重複する少数の患者が使用された。ここで、製造業者が生成した合成2D画像は、最終2Dモデルの弱教師ありトレーニングにも含まれていた。
・サイトD
サイトDからのデータは読影者研究に使用され、4つの異なるイメージング収集センターを有するマサチューセッツ州の1つの保健システムからさかのぼって収集された405件のスクリーニングDM検査で構成されている。このサイトからのデータは、これまでモデルのトレーニング又は選択には使用されていない。研究に含まれる検査は、2011年7月から2014年6月の間に取得された。405件の研究のうち、154件が陰性、131件がインデックスがん検査、120件がプレインデックスがん検査であった。全ての陰性は確認済み陰性であった。インデックスがん検査は、疑わしいと判断され、取得後3ヵ月以内に病理的に悪性であることが確認されたスクリーニングマンモグラムであった。プレインデックス検査はインデックス検査と同じ一組の女性から得られ、BIRADSの1又は2と判断されインデックス検査の12ヵ月から24ヵ月前に取得されたスクリーニング検査で構成されている。全ての研究はHologic社製機器を用いて取得された。事例選択は複数ステップにわたって行われた。まず、ローカルがん登録を用いて、指定された期間にわたり、適格なインデックス及びプレインデックス検査を受けた全患者を取り出すことで、研究に含まれるがん患者が選択された。PACSによる制限のため、一部のプレインデックス事例は得ることができなかった。次に、バケッティングを用いて、がん事例と比較して患者の年齢と***密度において同様の分布があるように、非がん事例が選ばれた。合計で、285人の女性から、非がんマンモグラム154件、インデックスがんマンモグラム131件、プレインデックスがんマンモグラム120件が収集された。
サイトDからのデータは読影者研究に使用され、4つの異なるイメージング収集センターを有するマサチューセッツ州の1つの保健システムからさかのぼって収集された405件のスクリーニングDM検査で構成されている。このサイトからのデータは、これまでモデルのトレーニング又は選択には使用されていない。研究に含まれる検査は、2011年7月から2014年6月の間に取得された。405件の研究のうち、154件が陰性、131件がインデックスがん検査、120件がプレインデックスがん検査であった。全ての陰性は確認済み陰性であった。インデックスがん検査は、疑わしいと判断され、取得後3ヵ月以内に病理的に悪性であることが確認されたスクリーニングマンモグラムであった。プレインデックス検査はインデックス検査と同じ一組の女性から得られ、BIRADSの1又は2と判断されインデックス検査の12ヵ月から24ヵ月前に取得されたスクリーニング検査で構成されている。全ての研究はHologic社製機器を用いて取得された。事例選択は複数ステップにわたって行われた。まず、ローカルがん登録を用いて、指定された期間にわたり、適格なインデックス及びプレインデックス検査を受けた全患者を取り出すことで、研究に含まれるがん患者が選択された。PACSによる制限のため、一部のプレインデックス事例は得ることができなかった。次に、バケッティングを用いて、がん事例と比較して患者の年齢と***密度において同様の分布があるように、非がん事例が選ばれた。合計で、285人の女性から、非がんマンモグラム154件、インデックスがんマンモグラム131件、プレインデックスがんマンモグラム120件が収集された。
・サイトE
サイトEは、2012年から2017年の間の連続する期間からさかのぼって収集された中国の都市部の病院からのデータセットで構成されている。この期間にわたって、全ての病理的に証明されたがんが非がんの一様にランダムなサンプルとともに収集され、その結果、がん533件、陰性(BIRADSの1又は2との判断)1000件、及び病理的に証明された良性100件が得られた。中国ではスクリーニング率が低いため、データは診断検査(即ち、患者が症状を呈した検査)から得られたものであり、したがって、がん事例からの腫瘍サイズの分布には、典型的な米国のスクリーニング集団で予測されるよりも大きな腫瘍(例えば、64%が2cmを超える)が含まれていた。米国のスクリーニング集団とより良く比較するために、サイトEの結果もまた、ブートストラップ再サンプリング法を用いて米国放射線データ登録に従った米国の集団からの腫瘍サイズの分布とほぼ一致するように、算出された。このアプローチを用いて、5Kのブートストラップされた集団について平均AUCが算出された。サイトEはテストにのみ使用され、これまでモデル開発には使用されていない。さらに、深層学習システムは病院でローカルに評価され、データは決してサイトから出ることはなかった。
サイトEは、2012年から2017年の間の連続する期間からさかのぼって収集された中国の都市部の病院からのデータセットで構成されている。この期間にわたって、全ての病理的に証明されたがんが非がんの一様にランダムなサンプルとともに収集され、その結果、がん533件、陰性(BIRADSの1又は2との判断)1000件、及び病理的に証明された良性100件が得られた。中国ではスクリーニング率が低いため、データは診断検査(即ち、患者が症状を呈した検査)から得られたものであり、したがって、がん事例からの腫瘍サイズの分布には、典型的な米国のスクリーニング集団で予測されるよりも大きな腫瘍(例えば、64%が2cmを超える)が含まれていた。米国のスクリーニング集団とより良く比較するために、サイトEの結果もまた、ブートストラップ再サンプリング法を用いて米国放射線データ登録に従った米国の集団からの腫瘍サイズの分布とほぼ一致するように、算出された。このアプローチを用いて、5Kのブートストラップされた集団について平均AUCが算出された。サイトEはテストにのみ使用され、これまでモデル開発には使用されていない。さらに、深層学習システムは病院でローカルに評価され、データは決してサイトから出ることはなかった。
・モデル開発及びトレーニング
上で記載したテストでは、テストに使用されたモデルのトレーニングの第1ステージはパッチレベルの分類(例えば、図3の308)で構成されていた。元の画像が1750画素の高さにサイズ変更された後、DDSM及びOMI-DBデータセットから275x275画素のサイズのパッチが作成された。また、ランダムな360度回転、最大20%のサイズ変更、及び縦方向ミラーリングなどを含むデータ拡張も、パッチを作成する際に使用された。前処理は、画素値を[-127.5,127.5]の範囲に正規化することを含む。病変を含むパッチを作成する際、病変境界内のランダムな位置がパッチの中心として選択された。得られたパッチにおいて病変マスクを含む画素が6画素未満であった場合は、このパッチは廃棄され、新たなパッチがサンプリングされた。全てのパッチについて、DDSMについては大津の方法で、OMI-DBについては画像中の最小画素値を用いる閾値法での決定に基づき、パッチに含まれる***フォアグランドが10%未満であった場合には、このパッチは廃棄された。合計で、病変を有するパッチと有さないパッチは同数として、200万個のパッチが作成された。パッチ分類モデルについて、ResNet-50ネットワークが使用された。パッチベースのトレーニングステージ自体は、2つのトレーニングシーケンスで構成されていた。まず、ImageNet事前学習重みから開始して、ResNet-50モデルを、腫瘤、石灰化、局所的非対称性、構造歪み、又は病変なしの病変タイプの5クラス分類について、トレーニングした。DDSM及びOMI-DBからのパッチを、各データセットにおけるがん事例数に比例してサンプリングした。このモデルは、バッチサイズ16で、62,500個のバッチについてトレーニングされ、全ての病変タイプから等しくサンプリングされた。アダムオプティマイザーは学習率1e-5で使用された。次に、パッチレベルモデルが、正常、良性又は悪性のラベルを用いて、3クラス分類のためにトレーニングされ、ここでも、3つのカテゴリ全てから等しくサンプリングされた。パッチレベルのトレーニングのこのステージについても同じトレーニングパラメータが用いられた。
上で記載したテストでは、テストに使用されたモデルのトレーニングの第1ステージはパッチレベルの分類(例えば、図3の308)で構成されていた。元の画像が1750画素の高さにサイズ変更された後、DDSM及びOMI-DBデータセットから275x275画素のサイズのパッチが作成された。また、ランダムな360度回転、最大20%のサイズ変更、及び縦方向ミラーリングなどを含むデータ拡張も、パッチを作成する際に使用された。前処理は、画素値を[-127.5,127.5]の範囲に正規化することを含む。病変を含むパッチを作成する際、病変境界内のランダムな位置がパッチの中心として選択された。得られたパッチにおいて病変マスクを含む画素が6画素未満であった場合は、このパッチは廃棄され、新たなパッチがサンプリングされた。全てのパッチについて、DDSMについては大津の方法で、OMI-DBについては画像中の最小画素値を用いる閾値法での決定に基づき、パッチに含まれる***フォアグランドが10%未満であった場合には、このパッチは廃棄された。合計で、病変を有するパッチと有さないパッチは同数として、200万個のパッチが作成された。パッチ分類モデルについて、ResNet-50ネットワークが使用された。パッチベースのトレーニングステージ自体は、2つのトレーニングシーケンスで構成されていた。まず、ImageNet事前学習重みから開始して、ResNet-50モデルを、腫瘤、石灰化、局所的非対称性、構造歪み、又は病変なしの病変タイプの5クラス分類について、トレーニングした。DDSM及びOMI-DBからのパッチを、各データセットにおけるがん事例数に比例してサンプリングした。このモデルは、バッチサイズ16で、62,500個のバッチについてトレーニングされ、全ての病変タイプから等しくサンプリングされた。アダムオプティマイザーは学習率1e-5で使用された。次に、パッチレベルモデルが、正常、良性又は悪性のラベルを用いて、3クラス分類のためにトレーニングされ、ここでも、3つのカテゴリ全てから等しくサンプリングされた。パッチレベルのトレーニングのこのステージについても同じトレーニングパラメータが用いられた。
パッチレベルのトレーニング後、トレーニングの第2ステージ、即ち、強教師ありの、画像レベルのトレーニング(例えば、図3の320)のために、ResNet-50重みを用いて、ポピュラーな検出モデルであるRetinaNetのバックボーン部分が初期化された。画像の前処理は、1750画素の高さまでサイズ変更し(元のアスペクト比を維持)、上で記載した閾値法を用いてバックグラウンドをクロップアウトし、画素値を[-127.5,127.5]の範囲に正規化することを含む。トレーニング中のデータ拡張は、最大15%のランダムサイズ変更、及びランダム縦方向ミラーリングを含む。マンモグラフィの高いクラスアンバランス(陰性よりも陽性がはるかに少ない)を考慮して、悪性例と非悪性例を等確率でサンプリングすることによりトレーニング中にクラスバランシングが行われた。このクラスバランシングはデータセット内で実行され、データセット間のがんの異なる割合のバイアスをモデルが学習することを防止した。この強教師ありの画像レベルトレーニングステージについて、OMI-DBデータセット及びDDSMデータセット内のバウンディングボックスが使用された。3クラスバウンディングボックス分類は、正常、良性又は悪性のラベルを用いて行なわれた。RetinaNetモデルは、バッチサイズ1で、100Kの繰り返し数、トレーニングされた。アダムオプティマイザーが、学習率1e-5で、0.001の値での勾配ノルムクリッピングで、使用された。RetinaNet損失にはデフォルトのハイパーパラメータが用いられたが、但し、回帰損失には0.5の重みが与えられ、分類損失には1.0の重みが与えられた。
弱教師ありトレーニングステージ(例えば、図3の328及び図6の616)については、バイナリクロスエントロピー損失を用いてバイナリがん/非がん分類が行われた。強教師ありトレーニングステージと同じ画像入力処理ステップが用いられた。RetinaNetアーキテクチャは、バウンディングボックス分類スコアの全てにわたって最大値をとることによって分類モデルに変換され、バイナリラベルを用いるエンドツーエンドのトレーニングを可能にしながら完全に弁別可能なままであるモデルが得られた。2Dについては、トレーニングはアダムオプティマイザーを用いて300Kの繰り返し数で構成され、学習率は2.5e-6で開始し、これは100Kの繰り返し数ごとに4分の1に減少させた。最終モデル重みは、4Kの繰り返し数ごとに検証セット上でAUCパフォーマンスをモニタリングすることにより選ばれた。
DBTについては、プロセス500において記載した「最大疑い投影」(MSP)アプローチは、他の方法ではオーバーラップする組織によって不明瞭となる可能性のある病変に最適な視野を提供することにおいてDBTの値によって、及び、転移学習の適用可能性を示唆するDBT画像とDM画像の間の類似性によって、動機付けられる。さらに、2Dマンモグラフィの集合的性質は、大きなDBTボリュームでのエンドツーエンドのトレーニングと比較して、過剰適合を減らすのに役立つと特に考えられる。この目的のために、3Dモデルについての弱教師ありステージにおいて、プロセス500を通して作成された合成画像(「MSP画像」)は、追加の学習率2.5e-6を用いる50Kのトレーニング繰り返し数の後に、上で記載した2D強教師ありトレーニングから得られたモデルを用いて作成された。MSP画像を作成するために、DBTスタックのスライスごとに2Dモデルが評価され、但し、スライスの最初と最後の10%(これらはしばしばノイズを有する)は除いた。最小バウンディングボックスコア閾値は、OMI-DB検証セットで99%の感度を達成するレベルに設定された。全ての評価されたスライスにわたるバウンディングボックスが、0.2のIoU閾値を用いて、非最大値抑制(NMS)を用いてフィルタ処理された。次いで、フィルタ処理されたバウンディングボックスによって定義された画像パッチが、さらなるモデルトレーニングのために最適化された画像を表す単一の2D画像アレイにコラップスさせた(collapsed)。プロジェクション内の「空の」画素は、DBTスタックの中心スライスから対応する画素で埋め込まれ、最終MSP画像が得られた。全体として、MSPプロセスは最大強度投影(MIP)に似ているが、但し、最大値が、画素レベル強度について計算されるのではなく、代わりにAIモデルによって予測されるROI悪性疑いについて計算される点が異なる。結果として得られたMSP画像に関するトレーニングは、モデルが100Kの繰り返し数トレーニングされる点を除き、2D弱教師ありアプローチと同様に行われた。2D画像に使用された入力処理パラメータはDBTスライス及びMSP画像に再利用された。
2D及び3Dモデルの両方に対する弱教師ありトレーニング後、トレーニングの第2ステージで使用された強ラベル済みデータに対して、RetinaNetアーキテクチャの回帰部分の微調整が行われた。具体的には、ネットワークのバックボーン部分及び分類部分をフリーズさせ、回帰部分のみがこの微調整中に更新された。これにより、回帰部分は、回帰部分が更新されない弱教師ありトレーニングステージの間、ネットワークのバックボーン部分における重みのあらゆる変化に適応することができる。この回帰微調整ステージでは、前のステージと同じ前処理とデータ拡張手順を用いて、学習率2.5e-6で50Kの繰り返し数、ネットワークをトレーニングした。最終モデル選択は、ホールドアウトモデル選択データパーティションのパフォーマンスに基づいている。最終モデルは、異なるランダムシードから始まる3つの等しくトレーニングされたモデルの集合であった。ある画像の予測スコアは、画像の両方の水平方向に対する3つのモデルの予測を平均する(即ち、6つのスコアの平均)ことによって計算された。バウンディングボックスアンカーの回帰座標は、3つのモデルにわたって追加で平均化された。各***には、そのビューの全ての平均スコアをとることにより悪性スコアが割り当てられた。各研究には、その2つの***レベルのうち大きい方をとることによりスコアが割り当てられた。
・読影者研究
読影者研究は、記載された深層学習システムのパフォーマンスを、専門の放射線科医と比較して直接評価するために行われた。読影者研究は確かに人工的な設定であるが、そのような研究は、レトロスペクティブなパフォーマンス比較に内在する「ゲートキーパーバイアス」を回避し、なぜなら、各事例のグランドトゥルースは読影者研究において先験的に確立されているからである。また、最近のエビデンスも、読影者研究における高陽性率自体が読影者集団ROCパフォーマンスにほとんど影響を及ぼさないだろうことを示唆している。
読影者研究は、記載された深層学習システムのパフォーマンスを、専門の放射線科医と比較して直接評価するために行われた。読影者研究は確かに人工的な設定であるが、そのような研究は、レトロスペクティブなパフォーマンス比較に内在する「ゲートキーパーバイアス」を回避し、なぜなら、各事例のグランドトゥルースは読影者研究において先験的に確立されているからである。また、最近のエビデンスも、読影者研究における高陽性率自体が読影者集団ROCパフォーマンスにほとんど影響を及ぼさないだろうことを示唆している。
・読影者の選択
読影者研究の読影者として、5名の委員会認定放射線科医及びMQSA認定放射線科医を募集した。読影者は全員、***画像診断のトレーニングを受けたフェローシップであり、フェローシップ後平均5年間(2年間から12年間の範囲)経験を積んでいる。読影者は読影者研究の前年に平均6969個のマンモグラムを読影し(2921個から9260個の範囲)、その60%がDM、40%がDBTであった。
読影者研究の読影者として、5名の委員会認定放射線科医及びMQSA認定放射線科医を募集した。読影者は全員、***画像診断のトレーニングを受けたフェローシップであり、フェローシップ後平均5年間(2年間から12年間の範囲)経験を積んでいる。読影者は読影者研究の前年に平均6969個のマンモグラムを読影し(2921個から9260個の範囲)、その60%がDM、40%がDBTであった。
<研究デザイン>
読影者研究用のデータは上で記載したサイトDから入手した。本研究は2回のセッションで行った。第1のセッションでは、放射線科医は131件のインデックスがん検査及び76件の陰性検査を読影した。第2のセッションでは、放射線科医は120件のプレインデックス検査及び残りの78件の陰性検査を読影した。読影者ごとに2回のセッション間に少なくとも4週間のウォッシュアウト期間が設けられた。読影者には、各事例について強制BIRADSスコア(1から5)を提供するよう指示した。BIRADSの1及び2は想起なし、BIRADSの3,4及び5は想起ありと考えられた。放射線科医は患者に関する情報(過去の病歴、放射線科のレポート、その他の患者記録など)を全く持っておらず、研究データセットにはスクリーニングで観察される標準的な有病率と比較してがんマンモグラムが豊富に含まれていることを知らされたが、事例タイプの割合については知らされていなかった。放射線科医全員が、各自の臨床診療に類似した環境の専用のマンモグラフィワークステーションで研究を閲覧し、判断(読影)した。読影者は電子事例報告書に各自の判断を記録した。読影者は、強制的なBIRADSに加えて、***密度分類を提供し、そして、検出された病変ごとに、病変のタイプ、左右差、四分円差、及び0から100の悪性スコアの可能性(最大4つの病変について)を提供した。BIRADSを用いた読影者バイナリ想起決定が分析に用いられ、何故ならこれは臨床診療をより入念に反映するからである。
読影者研究用のデータは上で記載したサイトDから入手した。本研究は2回のセッションで行った。第1のセッションでは、放射線科医は131件のインデックスがん検査及び76件の陰性検査を読影した。第2のセッションでは、放射線科医は120件のプレインデックス検査及び残りの78件の陰性検査を読影した。読影者ごとに2回のセッション間に少なくとも4週間のウォッシュアウト期間が設けられた。読影者には、各事例について強制BIRADSスコア(1から5)を提供するよう指示した。BIRADSの1及び2は想起なし、BIRADSの3,4及び5は想起ありと考えられた。放射線科医は患者に関する情報(過去の病歴、放射線科のレポート、その他の患者記録など)を全く持っておらず、研究データセットにはスクリーニングで観察される標準的な有病率と比較してがんマンモグラムが豊富に含まれていることを知らされたが、事例タイプの割合については知らされていなかった。放射線科医全員が、各自の臨床診療に類似した環境の専用のマンモグラフィワークステーションで研究を閲覧し、判断(読影)した。読影者は電子事例報告書に各自の判断を記録した。読影者は、強制的なBIRADSに加えて、***密度分類を提供し、そして、検出された病変ごとに、病変のタイプ、左右差、四分円差、及び0から100の悪性スコアの可能性(最大4つの病変について)を提供した。BIRADSを用いた読影者バイナリ想起決定が分析に用いられ、何故ならこれは臨床診療をより入念に反映するからである。
・ローカライゼーションに基づく分析
上で記載した主な読影者研究結果は事例レベルの分類パフォーマンスに対応しているが、ローカライゼーションに基づく分析も行った。本研究では、読影者は、想起を正当化するために、決定された各病変についての***の左右差及び四分円差を報告した。悪性病変についてのグランドトゥルースの左右差及び四分円差は、病理及び放射線学レポートとともにマンモグラム画像を調べることにより、読影者研究の臨床主導により提供された。プレインデックス事例について、グランドトゥルース位置は、病変がプレインデックス検査では見えないと見なされた場合でも、対応するインデックス事例のグランドトゥルース位置に設定された。考慮される深層学習モデルは、バウンディングボックスのかたちでローカライゼーションを提供する。読影者と比較するため及びモデル出力判断可能性においてエクササイズとしての役割も果たすために、読影者研究サイトとは異なるプラクティスからのMQSA資格を有する放射線科医が、モデルの出力されたボックスを***の左右と四分円にマップした。この放射線科医は事例のグランドトゥルースを知らされておらず、与えられたバウンディングボックスごとに重心(centroid)の位置を推定するように指示され、推定は1つの四分円に制限された。
上で記載した主な読影者研究結果は事例レベルの分類パフォーマンスに対応しているが、ローカライゼーションに基づく分析も行った。本研究では、読影者は、想起を正当化するために、決定された各病変についての***の左右差及び四分円差を報告した。悪性病変についてのグランドトゥルースの左右差及び四分円差は、病理及び放射線学レポートとともにマンモグラム画像を調べることにより、読影者研究の臨床主導により提供された。プレインデックス事例について、グランドトゥルース位置は、病変がプレインデックス検査では見えないと見なされた場合でも、対応するインデックス事例のグランドトゥルース位置に設定された。考慮される深層学習モデルは、バウンディングボックスのかたちでローカライゼーションを提供する。読影者と比較するため及びモデル出力判断可能性においてエクササイズとしての役割も果たすために、読影者研究サイトとは異なるプラクティスからのMQSA資格を有する放射線科医が、モデルの出力されたボックスを***の左右と四分円にマップした。この放射線科医は事例のグランドトゥルースを知らされておらず、与えられたバウンディングボックスごとに重心(centroid)の位置を推定するように指示され、推定は1つの四分円に制限された。
左右に基づくローカライゼーション感度と四分円に基づくローカライゼーション感度の両方が考慮され、事例を想起することに加え、対応するレベルでの正確なローカライゼーションが必要とされた。読影者は、大多数の事例(90%)について最大でも1つの病変を報告したため、また、多くの位置を含む予測に報酬が与えられるシナリオを避けるため、最初の分析では、予測位置を最高スコアの病変に対応する位置に制限している。モデルについて、これは最高のスコアリングの左右の中で最高のスコアリングのバウンディングボックスをとることに相当する。読影者について、各病変について提供された悪性可能性スコアを用いて、最高のスコアリング位置が選択された。複数の悪性病変を有する場合は、読影者又はモデルの位置がいずれかの悪性病変の位置と一致していれば、真陽性が割り当てられた。所定の読影者の特異度に一致するモデルスコア閾値を選択することにより、各読影者の感度がモデルと比較された。モデルも同様の様態で読影者平均と比較された。
・統計的分析
主な評価方法としてテストを通して受信者操作特性(ROC)曲線用いられた。ここで、ROC分析は、陽性例と陰性例の比率に対して不変であること、考え得る想起率の全範囲(即ち、操作点)にわたってパフォーマンスを比較することが可能であることから、診断パフォーマンスを評価するための標準的な方法である。AUCの信頼区間及び標準偏差、並びに平均読影者感度及び特異度は、10,000回のランダムリサンプリングを伴うブートストラップ法を介して計算された。考えられるモデルの感度及び特異度と平均読影者感度及び特異度とを比較するためのp値は、ブートストラップリサンプリングにわたって、モデルと読影者との差分が0未満であった回数の割合をとることにより計算された。10,000回のランダムリサンプリングを伴うブートストラップ法を用いて、データセット間のAUCパフォーマンスが比較された。
主な評価方法としてテストを通して受信者操作特性(ROC)曲線用いられた。ここで、ROC分析は、陽性例と陰性例の比率に対して不変であること、考え得る想起率の全範囲(即ち、操作点)にわたってパフォーマンスを比較することが可能であることから、診断パフォーマンスを評価するための標準的な方法である。AUCの信頼区間及び標準偏差、並びに平均読影者感度及び特異度は、10,000回のランダムリサンプリングを伴うブートストラップ法を介して計算された。考えられるモデルの感度及び特異度と平均読影者感度及び特異度とを比較するためのp値は、ブートストラップリサンプリングにわたって、モデルと読影者との差分が0未満であった回数の割合をとることにより計算された。10,000回のランダムリサンプリングを伴うブートストラップ法を用いて、データセット間のAUCパフォーマンスが比較された。
本発明について1つ又は複数の好適な構成に関して記載したが、明示的に記載されたものを除いて、多くの同等物、代替物、バリエーション及び修正が可能であり本発明の範囲内であることは理解されるべきである。
Claims (30)
- 患者の***組織における悪性の可能性に関するコンピュータによる方法であって、
コンピュータプロセッサを使用して、前記***組織の画像を受け取る工程と、
学習済みニューラルネットワークを含むモデルに前記***組織の前記画像を提供する工程と、
前記モデルからインジケータを受け取る工程と、
前記インジケータを含むレポートをメモリ又はディスプレイの少なくとも1つに出力する工程と、を含み、
前記学習済みニューラルネットワークは、
2次元画像の第1のグループから導出されるアノテーション済みパッチのセットに基づいて第1のニューラルネットワークをトレーニングし、ここで、各前記アノテーション済みパッチは、パッチレベルのラベルと、前記2次元画像の前記第1のグループに含まれる2次元画像の一部とを含むものであり、
前記第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化し、
アノテーション済み画像の第1のセットに基づいて前記第2のニューラルネットワークをトレーニングし、ここで、前記アノテーション済み画像の前記第1のセットに含まれる少なくとも1つのアノテーション済み画像は、2次元画像の第2のグループに含まれる2次元画像と、少なくとも1つのバウンディングボックスと、前記少なくとも1つのバウンディングボックスに関連付けられた少なくとも1つの悪性ラベルとを含むものであり、
アノテーション済み画像の第2のセットに基づいて前記第2のニューラルネットワークをトレーニングし、ここで、前記アノテーション済み画像の前記第2のセットに含まれる各アノテーション済み画像は、2次元画像の第3のグループに含まれる2次元画像と、画像レベルの悪性可能性スコアとを含むものであり、
前記第2のニューラルネットワークを前記学習済みニューラルネットワークとして出力するように、予めトレーニングされる、方法。 - 前記***組織の前記画像は2次元デジタルマンモグラムである、請求項1に記載の方法。
- 前記***組織の前記画像は、デジタル***トモシンセシス画像に基づいて生成された合成2次元画像である、請求項1に記載の方法。
- 前記デジタル***トモシンセシス画像は複数のスライスを含み、
前記合成2次元画像は画素のアレイを含み、
前記画素のアレイに含まれる複数の画素の少なくとも一部が有する画素強度値は、
前記複数のスライスの少なくとも一部を第2の学習済みニューラルネットワークに提供し、
悪性可能性スコアを各々が含む複数のインジケータを、前記第2の学習済みニューラルネットワークから受け取り、
前記画素のアレイに含まれるターゲット画素について、前記複数のインジケータに含まれる第1のインジケータであって前記複数のインジケータに含まれる第2のインジケータよりも大きい悪性可能性スコアを含む第1のインジケータに基づいてターゲット画素強度を決定することによって、予め生成される、請求項3に記載の方法。 - 前記画素のアレイに含まれる複数の画素の少なくとも一部が有する画素強度値は、
前記画素のアレイに含まれる第2のターゲット画素について、前記複数の画素に含まれる画素が、前記第2のターゲット画素に関連する画素位置を含まないことを決定し、
前記第2のターゲット画素に含まれる画素強度を、前記複数のスライスに含まれるデフォルトスライスに含まれるデフォルト画素であって前記ターゲット画素に関連する画素位置を含むデフォルト画素と同じに設定することで、予め生成される、請求項4に記載の方法。 - 前記複数のスライスに含まれる各スライスは位置値に関連付けられており、前記デフォルトスライスは中間位置値に関連付けられている、請求項5に記載の方法。
- 前記デジタル***トモシンセシス画像は複数のスライスを含み、
前記複数のスライスに含まれる各スライスは、位置値に関連付けられており、
前記合成2次元画像は、所定範囲の位置値に含まれる位置値に関連付けられた前記複数のスライスのサブセットに基づいて生成される、請求項3に記載の方法。 - 前記複数のスライスの前記サブセットは、前記複数のスライスの約80パーセントを構成する、請求項7に記載の方法。
- 前記第2のニューラルネットワークは、バックボーン部分、回帰部分及び分類部分を含み、
前記方法は、前記バックボーン部分及び前記分類部分を再トレーニングすることなく、前記アノテーション済み画像の前記第1のセットに基づいて前記回帰部分をトレーニングすることをさらに含む、請求項1に記載の方法。 - 前記アノテーション済み画像の前記第2のセットに基づいて前記第2のニューラルネットワークをトレーニングすることは、前記回帰部分をトレーニングすることなく前記バックボーン部分及び前記分類部分をトレーニングすることを含む、請求項9に記載の方法。
- 前記第1のニューラルネットワークは、第1の複数の重みを含み、
前記第2のニューラルネットワークは、第2の複数の重みを含むバックボーン部分を含み、
前記第1のニューラルネットワークに基づいて前記第2のニューラルネットワークを初期化することは、前記第2の複数の重みに含まれる重みを前記第1の複数の重みに含まれる重みと同じに設定することを含む、請求項1に記載の方法。 - 前記第1のニューラルネットワークは深層残留ネットワークを含み、前記第2のニューラルネットワークはシングルステージオブジェクト検出ネットワークを含む、請求項11に記載の方法。
- 前記インジケータは、患者悪性可能性スコアを含む、請求項1に記載の方法。
- 前記インジケータは、前記***組織の前記画像のエリアを含む、請求項1に記載の方法。
- 患者の***組織に関する悪性の可能性を評価するためのシステムであって、
前記***組織の画像を保存するように構成されたメモリと、
前記メモリにアクセスするように構成されたプロセッサと、を備え、
前記プロセッサは、
前記***組織の前記画像を、学習済みニューラルネットワークを含むモデルに提供し、
前記モデルからインジケータを受け取り、
前記インジケータを含むレポートをメモリ又はディスプレイの少なくとも1つに出力するよう構成され、
前記学習済みニューラルネットワークは、
2次元画像の第1のグループから導出されるアノテーション済みパッチのセットに基づいて第1のニューラルネットワークをトレーニングし、ここで、各前記アノテーション済みパッチは、パッチレベルのラベルと、前記2次元画像の前記第1のグループに含まれる2次元画像の一部とを含むものであり、
前記第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化し、
アノテーション済み画像の第1のセットに基づいて前記第2のニューラルネットワークをトレーニングし、ここで、前記アノテーション済み画像の前記第1のセットに含まれる少なくとも1つのアノテーション済み画像は、2次元画像の第2のグループに含まれる2次元画像と、少なくとも1つのバウンディングボックスと、前記少なくとも1つのバウンディングボックスに関連付けられた少なくとも1つの悪性ラベルとを含むものであり、
アノテーション済み画像の第2のセットに基づいて前記第2のニューラルネットワークをトレーニングし、ここで、前記アノテーション済み画像の前記第2のセットに含まれる各アノテーション済み画像は、2次元画像の第3のグループに含まれる2次元画像と、画像レベルの悪性可能性スコアとを含むものであり、
前記第2のニューラルネットワークを前記学習済みニューラルネットワークとして出力するように、予めトレーニングされたものである、システム。 - 前記***組織の前記画像は2次元デジタルマンモグラムである、請求項15に記載のシステム。
- 前記***組織の前記画像は、デジタル***トモシンセシス画像に基づいて生成された合成2次元画像である、請求項15に記載のシステム。
- 前記デジタル***トモシンセシス画像は複数のスライスを含み、
前記合成2次元画像は画素のアレイを含み、
前記画素のアレイに含まれる複数の画素の少なくとも一部が有する画素強度値は、
前記複数のスライスの少なくとも一部を第2の学習済みニューラルネットワークに提供し、
悪性可能性スコアを各々が含む複数のインジケータを、前記第2の学習済みニューラルネットワークから受け取り、
前記画素のアレイに含まれるターゲット画素について、前記複数のインジケータに含まれる第1のインジケータであって前記複数のインジケータに含まれる第2のインジケータよりも大きい悪性可能性スコアを含む第1のインジケータに基づいてターゲット画素強度を決定することによって、予め生成されたものである、請求項17に記載のシステム。 - 前記画素のアレイに含まれる複数の画素の少なくとも一部が有する画素強度値は、
前記画素のアレイに含まれる第2のターゲット画素について、前記複数の画素に含まれる画素が、前記第2のターゲット画素に関連する画素位置を含まないことを決定し、
前記第2のターゲット画素に含まれる画素強度を、前記複数のスライスに含まれるデフォルトスライスに含まれるデフォルト画素であって前記第2のターゲット画素に関連する画素位置を含むデフォルト画素と同じに設定することで、予め生成されたものである、請求項18に記載のシステム。 - 前記複数のスライスに含まれる各スライスは位置値に関連付けられており、前記デフォルトスライスは中間位置値に関連付けられている、請求項19に記載のシステム。
- 前記デジタル***トモシンセシス画像は複数のスライスを含み、
前記複数のスライスに含まれる各スライスは、位置値に関連付けられており、
前記合成2次元画像は、所定の範囲の位置値に含まれる位置値に関連付けられた前記複数のスライスのサブセットに基づいて生成される、請求項17に記載のシステム。 - 前記複数のスライスの前記サブセットは、前記複数のスライスの約80パーセントを構成する、請求項21に記載のシステム。
- 前記第2のニューラルネットワークは、バックボーン部分、回帰部分及び分類部分を含み、
前記方法は、前記バックボーン部分及び前記分類部分を再トレーニングすることなく、前記アノテーション済み画像の前記第1のセットに基づいて前記回帰部分をトレーニングすることをさらに含む、請求項15に記載のシステム。 - 前記アノテーション済み画像の前記第2のセットに基づいて前記第2のニューラルネットワークをトレーニングすることは、前記回帰部分をトレーニングすることなく前記バックボーン部分及び前記分類部分をトレーニングすることを含む、請求項23に記載のシステム。
- 前記第1のニューラルネットワークは、第1の複数の重みを含み、
前記第2のニューラルネットワークは、第2の複数の重みを含むバックボーン部分を含み、
前記第1のニューラルネットワークに基づいて前記第2のニューラルネットワークを初期化することは、前記第2の複数の重みに含まれる重みを前記第1の複数の重みに含まれる重みと同じに設定することを含む、請求項15に記載のシステム。 - 前記第1のニューラルネットワークは深層残留ネットワークを含み、前記第2のニューラルネットワークはシングルステージオブジェクト検出ネットワークを含む、請求項15に記載のシステム。
- 前記インジケータは、患者悪性可能性スコアを含む、請求項15に記載のシステム。
- 前記インジケータは、前記***組織の前記画像のエリアを含む、請求項15に記載のシステム。
- 患者の***組織に関する悪性可能性スコアを決定するための方法であって、
前記***組織の画像を受け取る工程と、
学習済みニューラルネットワークを含むモデルに前記***組織の前記画像を提供する工程と、
前記モデルから前記悪性可能性スコアを受け取る工程と、
前記患者の前記悪性可能性スコアを含むレポートを、メモリ又はディスプレイの少なくとも1つに出力する工程と、を含み、
前記学習済みニューラルネットワークは、
2次元画像の第1のグループから導出されるアノテーション済みパッチのセットに基づいて第1のニューラルネットワークをトレーニングし、ここで、各前記アノテーション済みパッチは、悪性可能性スコアと、前記2次元画像の前記第1のグループに含まれる2次元画像の一部とを含むものであり、
前記第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化し、
アノテーション済み画像の第1のセットに基づいて前記第2のニューラルネットワークをトレーニングし、ここで、前記アノテーション済み画像の前記第1のセットに含まれる少なくとも1つのアノテーション済み画像は、2次元画像の第2のグループに含まれる2次元画像と、少なくとも1つのバウンディングボックスと、前記少なくとも1つのバウンディングボックスに関連付けられた少なくとも1つの悪性可能性スコアとを含むものであり、
アノテーション済み画像の第2のセットに基づいて前記第2のニューラルネットワークをトレーニングし、ここで、前記アノテーション済み画像の前記第2のセットに含まれる各アノテーション済み画像は、2次元画像の第3のグループに含まれる2次元画像と、画像レベルの悪性可能性スコアとを含むものであり、
前記第2のニューラルネットワークを前記学習済みニューラルネットワークとして出力するように、予めトレーニングされる、方法。 - 患者の***組織に関する悪性可能性スコアを生成するためのシステムであって、
前記***組織の画像を保存するように構成されたメモリと、
前記メモリにアクセスするように構成されたプロセッサと、を備え、
前記プロセッサは、
前記***組織の前記画像を、学習済みニューラルネットワークを含むモデルに提供し、
前記モデルから前記悪性可能性スコアを受け取り、
前記悪性可能性スコアを含むレポートをメモリ又はディスプレイの少なくとも1つに出力するよう構成され、
前記学習済みニューラルネットワークは、
2次元画像の第1のグループから導出されるアノテーション済みパッチのセットに基づいて第1のニューラルネットワークをトレーニングし、ここで、各前記アノテーション済みパッチは、悪性可能性スコアと、前記2次元画像の前記第1のグループに含まれる2次元画像の一部とを含むものであり、
前記第1のニューラルネットワークに基づいて第2のニューラルネットワークを初期化し、
アノテーション済み画像の第1のセットに基づいて前記第2のニューラルネットワークをトレーニングし、ここで、前記アノテーション済み画像の前記第1のセットに含まれる少なくとも1つのアノテーション済み画像は、2次元画像の第2のグループに含まれる2次元画像と、少なくとも1つのバウンディングボックスと、前記少なくとも1つのバウンディングボックスに関連付けられた少なくとも1つの悪性可能性スコアとを含むものであり、
アノテーション済み画像の第2のセットに基づいて前記第2のニューラルネットワークをトレーニングし、ここで、前記アノテーション済み画像の前記第2のセットに含まれる各アノテーション済み画像は、2次元画像の第3のグループに含まれる2次元画像と、画像レベルの悪性可能性スコアとを含むものであり、
前記第2のニューラルネットワークを前記学習済みニューラルネットワークとして出力するように、予めトレーニングされたものである、システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962953033P | 2019-12-23 | 2019-12-23 | |
US62/953,033 | 2019-12-23 | ||
PCT/US2020/066912 WO2021133954A1 (en) | 2019-12-23 | 2020-12-23 | Systems and methods for analyzing two-dimensional and three-dimensional image data |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023508358A true JP2023508358A (ja) | 2023-03-02 |
Family
ID=76575673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022538707A Pending JP2023508358A (ja) | 2019-12-23 | 2020-12-23 | 2次元及び3次元画像データを分析するためのシステム及び方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230091506A1 (ja) |
EP (1) | EP4081952A4 (ja) |
JP (1) | JP2023508358A (ja) |
WO (1) | WO2021133954A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114846512A (zh) | 2019-10-25 | 2022-08-02 | 永康智能股份有限公司 | 用于分析三维图像数据的***和方法 |
CN117392468B (zh) * | 2023-12-11 | 2024-02-13 | 山东大学 | 基于多示例学习的癌症病理图像分类***、介质及设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10565707B2 (en) * | 2017-11-02 | 2020-02-18 | Siemens Healthcare Gmbh | 3D anisotropic hybrid network: transferring convolutional features from 2D images to 3D anisotropic volumes |
US20200372636A1 (en) * | 2017-11-22 | 2020-11-26 | The Trustees Of Columbia University In The City Of New York | System method and computer-accessible medium for determining breast cancer response using a convolutional neural network |
US10580137B2 (en) * | 2018-01-30 | 2020-03-03 | International Business Machines Corporation | Systems and methods for detecting an indication of malignancy in a sequence of anatomical images |
CN110473192B (zh) * | 2019-04-10 | 2021-05-14 | 腾讯医疗健康(深圳)有限公司 | 消化道内镜图像识别模型训练及识别方法、装置及*** |
-
2020
- 2020-12-23 JP JP2022538707A patent/JP2023508358A/ja active Pending
- 2020-12-23 WO PCT/US2020/066912 patent/WO2021133954A1/en unknown
- 2020-12-23 US US17/787,772 patent/US20230091506A1/en active Pending
- 2020-12-23 EP EP20904783.6A patent/EP4081952A4/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230091506A1 (en) | 2023-03-23 |
EP4081952A4 (en) | 2024-01-24 |
EP4081952A1 (en) | 2022-11-02 |
WO2021133954A1 (en) | 2021-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Debelee et al. | Survey of deep learning in breast cancer image analysis | |
Sahiner et al. | Effect of CAD on radiologists' detection of lung nodules on thoracic CT scans: analysis of an observer performance study by nodule size | |
US7418123B2 (en) | Automated method and system for computerized image analysis for prognosis | |
US20120014578A1 (en) | Computer Aided Detection Of Abnormalities In Volumetric Breast Ultrasound Scans And User Interface | |
El-Baz et al. | Three-dimensional shape analysis using spherical harmonics for early assessment of detected lung nodules | |
US20100104154A1 (en) | Computerized Detection of Breast Cancer on Digital Tomosynthesis Mamograms | |
US20190150870A1 (en) | Classification of a health state of tissue of interest based on longitudinal features | |
Maitra et al. | Automated digital mammogram segmentation for detection of abnormal masses using binary homogeneity enhancement algorithm | |
US20180053297A1 (en) | Methods and Apparatuses for Detection of Abnormalities in Low-Contrast Images | |
CN112561869B (zh) | 一种胰腺神经内分泌肿瘤术后复发风险预测方法 | |
US11783476B2 (en) | System and method for analyzing three-dimensional image data | |
JP2023508358A (ja) | 2次元及び3次元画像データを分析するためのシステム及び方法 | |
Yoshiyasu et al. | Radiomics technology for identifying early-stage lung adenocarcinomas suitable for sublobar resection | |
CN111265234A (zh) | 一种肺部纵膈***的性质判定方法及*** | |
Ponomaryov | Computer-aided detection system based on PCA/SVM for diagnosis of breast cancer lesions | |
J. Lado, Pablo G. Tahoces, Arturo J. Méndez, Miguel Souto, Juan J. Vidal | Evaluation of an automated wavelet-based system dedicated to the detection of clustered microcalcifications in digital mammograms | |
Robinson | Machine learning on medical imaging for breast cancer risk assessment | |
Thakur et al. | A systematic review of machine and deep learning techniques for the identification and classification of breast cancer through medical image modalities | |
WO2022153100A1 (en) | A method for detecting breast cancer using artificial neural network | |
Nguyen et al. | Detect abnormalities in mammograms by local contrast thresholding and rule-based classification | |
Horsthemke et al. | Predicting LIDC diagnostic characteristics by combining spatial and diagnostic opinions | |
Tourassi | Current status of computerized decision support systems in mammography | |
Sayyouh et al. | Lung Nodule: Imaging Features and Evaluation in the Age of Machine Learning | |
Chan et al. | Computer-aided diagnosis of breast cancer | |
Bunnell | Early Breast Cancer Diagnosis via Breast Ultrasound and Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231207 |