JP2021513697A - 完全畳み込みニューラル・ネットワークを用いた心臓ctaにおける解剖学的構造のセグメンテーションのためのシステム - Google Patents

完全畳み込みニューラル・ネットワークを用いた心臓ctaにおける解剖学的構造のセグメンテーションのためのシステム Download PDF

Info

Publication number
JP2021513697A
JP2021513697A JP2020538806A JP2020538806A JP2021513697A JP 2021513697 A JP2021513697 A JP 2021513697A JP 2020538806 A JP2020538806 A JP 2020538806A JP 2020538806 A JP2020538806 A JP 2020538806A JP 2021513697 A JP2021513697 A JP 2021513697A
Authority
JP
Japan
Prior art keywords
segmentation
image
network
anatomical structures
segmented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020538806A
Other languages
English (en)
Other versions
JP2021513697A5 (ja
JP7102531B2 (ja
Inventor
タン、フイ
モラディ、メディ
ハローニ、アハメド エル
ハローニ、アハメド エル
ワン、ホングジィ
ベニ、ゴパルクリシュナ
プラサンナ、プラサンス
シダ−マムード、タンバー、ファシマ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2021513697A publication Critical patent/JP2021513697A/ja
Publication of JP2021513697A5 publication Critical patent/JP2021513697A5/ja
Application granted granted Critical
Publication of JP7102531B2 publication Critical patent/JP7102531B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30048Heart; Cardiac
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30101Blood vessel; Artery; Vein; Vascular
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2211/00Image generation
    • G06T2211/40Computed tomography
    • G06T2211/404Angiography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Pathology (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

方法は、(a)複数の臓器のそれぞれについて(i)軸位断で走査された1組の胸部コンピュータ断層撮影血管造影(CTA)画像、および(ii)画像の手動セグメンテーションを収集することと、(b)同じ視野(FOV)を共有するように画像を前処理することと、(c)画像とその手動セグメンテーションの両方を使用して教師ありディープ・ラーニング・セグメンテーション・ネットワークを訓練することであって、損失が、複数の臓器すべてについてのダイス・スコアの合計であるマルチダイス・スコアから決定され、各ダイス・スコアが臓器のうちの1つについての手動セグメンテーションとネットワークの出力との間の類似度として計算される、訓練することと、(d)訓練されたネットワーク上で所与の(入力)前処理済み画像をテストし、それによって所与の画像のセグメント化された出力を取得することと、(e)所与の画像のセグメント化された出力を平滑化することとを含む。【選択図】図3

Description

本出願は、一般に、改良されたデータ処理装置および方法に関し、より詳細には、完全畳み込みニューラル・ネットワークを用いた心臓CTAにおける解剖学的構造のセグメンテーションのためのメカニズムに関する。
心腔、肺の異なるセグメント、および大動脈の異なるセグメントなどの胸部の解剖学的構造をセグメント化することは、多くの自動疾患検出アプリケーションにおける重要なステップである。マルチアトラス・ベースの方法は、このタスクのために開発され、安定した優れた結果を実現する。しかしながら、これらは、非剛体レジストレーション(deformable registration)・ステップが必要であるため、しばしば計算コストが高くなり、処理時間の点でボトルネックが生じる。対照的に、2Dまたは3Dカーネルを用いた畳み込みニューラル・ネットワーク(CNN:convolutional neural network)は、訓練には時間がかかるが、デプロイメント段階では非常に高速であり、医用撮像のセグメンテーション・タスクを解決するために採用されている。V−Netと呼ばれる完全畳み込みアーキテクチャにおける重みを最適化するためにダイス類似度係数(DSC:dice similarity coefficient)を使用すると、医用画像セグメンテーションにおけるニューラル・ネットワークの性能が向上することが最近報告された。しかしながら、以前の作業では、1つの前景オブジェクトに対して計算されたDSCのみが最適化され、その結果DSCベースのセグメンテーションCNNは、2値セグメンテーションを実行することしかできない。
完全畳み込みニューラル・ネットワークを用いた胸部CTAにおける解剖学的構造のセグメンテーションのためのメカニズムを提供する。
本発明によれば、提供される方法は、(a)複数の臓器のそれぞれについて(i)軸位断(axial view)で走査された1組の胸部コンピュータ断層撮影血管造影(CTA:computed tomography angiography)画像、および(ii)画像の手動セグメンテーションを収集することと、(b)同じ視野(FOV:field of view)を共有するように画像を前処理することと、(c)画像とその手動セグメンテーションの両方を使用して教師ありディープ・ラーニング・セグメンテーション・ネットワークを訓練することであって、損失が、複数の臓器すべてについてのダイス・スコアの合計であるマルチダイス・スコアから決定され、各ダイス・スコアが臓器のうちの1つについての手動セグメンテーションとネットワークの出力との間の類似度として計算される、使用して訓練することと、(d)訓練されたネットワーク上で所与の(入力)前処理済み画像をテストし、それによって所与の画像のセグメント化された出力を取得することと、(e)所与の画像のセグメント化された出力を平滑化することとを含む。
他の例示的な実施形態では、コンピュータ可読プログラムを有するコンピュータ使用可能または可読媒体を含むコンピュータ・プログラム製品が提供される。コンピュータ可読プログラムは、コンピューティング・デバイス上で実行されると、コンピューティング・デバイスに、方法の例示的な実施形態に関して上で概説した動作の様々なものおよびそれらの組合せを実行させる。
さらに別の例示的な実施形態では、システム/装置が提供される。システム/装置は、1つまたは複数のプロセッサ、および1つまたは複数のプロセッサに結合されたメモリを備え得る。メモリは、1つまたは複数のプロセッサによって実行されると、1つまたは複数のプロセッサに、方法の例示的な実施形態に関して上で概説した動作の様々なものおよびそれらの組合せを実行させる命令を含み得る。
本発明のこれらおよび他の特徴および利点は、本発明の例示的な実施形態の以下の詳細な説明において説明され、または本発明の例示的な実施形態の以下の詳細な説明に鑑みて当業者には明らかになるであろう。
本発明、ならびに好ましい使用モードならびにそのさらなる目的および利点は、添付の図面と併せて読まれるとき、例示的な実施形態の以下の詳細な説明を参照することによって最もよく理解されるであろう。
例示的な実施形態の態様が実装され得る分散型データ処理システムの例示的な図である。 例示的な実施形態の態様が実装され得るコンピューティング・デバイスの例示的なブロック図である。 異なる方法についての各解剖学的組織のDSCおよび平均DSCの棒グラフである。 例示的な実施形態による、元の画像のセグメンテーションの2D視覚表現である。 例示的な実施形態による、マルチラベルV−Netによる結果のセグメンテーションの2D視覚表現である。 例示的な実施形態による、後処理後の結果のセグメンテーションの2D視覚表現である。 例示的な実施形態による、グラウンド・トゥルースのセグメンテーションの2D視覚表現である。 例示的な実施形態による、マルチラベルV−Netによる結果のセグメンテーションの3Dボリューム・レンダリングである。 例示的な実施形態による、後処理後の結果のセグメンテーションの3Dボリューム・レンダリングである。 例示的な実施形態による、グラウンド・トゥルースのセグメンテーションの3Dボリューム・レンダリングである。 例示的な実施形態による、マルチラベルV−Netを用いた心臓CTAにおける解剖学的構造のセグメンテーションのためのニューラル・ネットワーク訓練エンジンを示すブロック図である。 例示的な実施形態による、マルチラベルV−Netを用いた心臓CTAにおける解剖学的構造のセグメンテーションのためのニューラル・ネットワーク・テスト・エンジンのブロック図である。 例示的な実施形態による、心臓CTAにおける解剖学的構造のセグメンテーションのための教師ありディープ・ラーニング・ネットワークを訓練するためのメカニズムの動作を示すフローチャートである。 例示的な実施形態による、心臓CTAにおける解剖学的構造のセグメンテーションのための訓練されたネットワークをテストするためのメカニズムの動作を示すフローチャートである。
心腔、肺の異なるセグメント、および大動脈の異なるセグメントなどの胸部の解剖学的構造をセグメント化することは、多くの自動疾患検出アプリケーションにおける重要なステップである。マルチアトラス・ベースの方法は、このタスクのために開発され、安定した優れた結果を実現する。しかしながら、これらは、非剛体レジストレーション(deformable registration)・ステップが必要であるため、しばしば計算コストが高くなり、処理時間の点でボトルネックが生じる。対照的に、2Dまたは3Dカーネルを用いた畳み込みニューラル・ネットワーク(CNN:convolutional neural network)は、訓練には時間がかかるが、デプロイメント段階では非常に高速であり、医用撮像のセグメンテーション・タスクを解決するために採用されている。V−Netと呼ばれる完全畳み込みアーキテクチャにおける重みを最適化するためにダイス類似度係数(DSC:dice similarity coefficient)を使用すると、医用画像セグメンテーションにおけるニューラル・ネットワークの性能が向上することが最近報告された。しかしながら、以前の作業では、1つの前景オブジェクトに対して計算されたDSCのみが最適化され、その結果DSCベースのセグメンテーションCNNは、2値セグメンテーションを実行することしかできない。本書では、V−Net2値アーキテクチャをマルチラベル・セグメンテーション・ネットワークに拡張し、心臓CTAにおける複数の解剖学的構造をセグメント化するためにそれを使用する。方法は、すべての解剖学的組織に対するDSCを合計することによって最適化されたマルチラベルV−Netを使用し、その後、セグメンテーションの表面をリファインするための後処理方法を使用する。この方法は、CTAボリューム全体をセグメント化するのに平均で10秒未満かかる。この方法は、4分割交差検証(four-fold cross validation)を使用して、16のセグメント化された解剖学的組織に対して77%の平均DSCを実現する。
例示的な実施形態の様々な態様の説明を始める前に、この説明全体を通して「メカニズム」という用語は、様々な動作、機能などを実行する本発明の要素を指すために使用されることを最初に理解されたい。本明細書で使用される「メカニズム」という用語は、装置、手順、またはコンピュータ・プログラム製品の形での例示的な実施形態の機能または態様の実装であり得る。手順の場合、手順は、1つまたは複数のデバイス、装置、コンピュータ、データ処理システムなどによって実施される。コンピュータ・プログラム製品の場合、コンピュータ・プログラム製品内またはコンピュータ・プログラム製品上で実施されるコンピュータ・コードまたは命令によって表されるロジックは、特定の「メカニズム」に関連する機能を実装するため、または特定の「メカニズム」に関連する動作を実行するために、1つまたは複数のハードウェア・デバイスによって実行される。したがって、本明細書に記載のメカニズムは、専用ハードウェアとして、汎用ハードウェア上で実行されるソフトウェアとして、命令が専用または汎用ハードウェアによって容易に実行可能であるように媒体に記憶されたソフトウェア命令として、機能を実行するための手順もしくは方法として、またはこれらのいずれかの組合せとして実装される場合がある。
本説明および特許請求の範囲は、例示的な実施形態の特定の特徴および要素に関して、「1つの(a)」、「のうちの少なくとも1つ(at least one of)」、および「のうちの1つまたは複数(one or more of)」という用語を使用することがある。これらの用語および句は、特定の例示的な実施形態に存在する特定の特徴または要素のうちの少なくとも1つが存在するが、2つ以上も存在し得ることを示すように意図したものであることを理解されたい。すなわち、これらの用語/句は、説明または特許請求の範囲を、存在する単一の特徴/要素に限定すること、または複数のそのような特徴/要素が存在するよう要求すること意図するものではない。それとは反対に、これらの用語/句は、複数のそのような機能/要素が説明および特許請求の範囲の範囲内にある可能性がある、少なくとも単一の機能/要素のみを必要とする。
さらに、「エンジン」という用語の使用は、本発明の実施形態および特徴の説明に関して本明細書で使用される場合、エンジンに起因する、またはエンジンによって実行される、あるいはその両方の動作、ステップ、プロセスなどを、実現する、または実行する、あるいはその両方のための任意の特定の実装を限定することを意図するものではないことを理解されたい。エンジンは、ソフトウェア、ハードウェア、またはファームウェアあるいはその組合せ、あるいは、機械可読メモリにロードまたは格納され、プロセッサによって実行される適切なソフトウェアと組み合わせた汎用または専用あるいはその両方のプロセッサの任意の使用を含むがこれらに限定されない指定された機能を実行するその任意の組合せとすることができるが、これらに限定されない。さらに、特定のエンジンに関連するいずれの名称も、特に指定されていない限り、参照の利便性を目的としており、特定の実装に限定することを意図したものではない。さらに、エンジンに起因するいずれの機能も、複数のエンジンによって同等に実行され、同じまたは異なるタイプの別のエンジンの機能に組み込まれるか、または組み合わされるか、あるいはその両方とされるか、あるいは、様々な構成の1つまたは複数のエンジンに分散されてもよい。
明示的および暗黙的な他の定義が、以下に含まれ得る。
アトラス:解剖学的組織の集合に関するCTA画像および手動セグメンテーション・マスク。
マルチアトラス:解剖学的組織の集合に関する複数のCTA画像およびそれらの手動セグメンテーション・マスク。
ニューラル・ネットワーク:人工ニューラル・ネットワーク(ANN:artificial neural network)またはコネクショニスト・システムは、動物の脳を構成する生物学的な神経回路網から漠然と着想を得たコンピューティング・システムである。このようなシステムは、一般にタスク固有のプログラミングなしで、例を考察することによってタスクを「学習」する(すなわち、徐々に性能を向上させる)。
畳み込みニューラル・ネットワーク:畳み込みニューラル・ネットワーク(CNN)は、上部に(典型的なANNにおける層と一致する)全結合層を有する1つまたは複数の畳み込み層で構成される、深層順伝播型ネットワークのクラスである。CNNは、結合重みおよびプーリング層を使用する。このアーキテクチャにより、CNNは入力データの2D構造を利用することができる。
ダイス:セグメンテーションが良好であるかどうかを判定する尺度。ダイス・スコアは、一般に0から1の間であり、ダイス・スコアが高いほど、良好なセグメンテーションを示す。
ダイス類似度係数(DSC):2つの臨床例で示される、手動セグメンテーションの再現性とMR画像の自動化された確率的部分セグメンテーションの空間重なり精度との両方の性能を評価するための統計的検証メトリックとして使用される係数。
損失:モデルがテストと訓練の2つのセットに対してどの程度うまく機能しているかを示す、訓練とテストで計算される尺度。損失が少ないほど良好である。
コンピュータ断層撮影血管造影(CTA):コンピュータ断層撮影血管造影(CT血管造影またはCTAとも呼ばれる)は、全身の動脈血管および静脈血管を視覚化するために使用されるコンピュータ断層撮影技法である。これは、脳に到達する動脈から、肺、腎臓、腕、および脚に血液を運ぶ動脈にまで及ぶ。
V−Net:ボリューム医用画像セグメンテーションのための完全畳み込みニューラル・ネットワーク。
さらに、以下の説明では、例示的な実施形態の例示的な実装をさらに示すため、および例示的な実施形態のメカニズムの理解を助けるために、例示的な実施形態の様々な要素について複数の様々な例を使用していることを理解されたい。これらの例は、非限定的であることが意図されており、例示的な実施形態のメカニズムを実装するための様々な可能性を網羅するものではない。本明細書に鑑みて、本発明の思想および範囲から逸脱することなく、本明細書で提供される例に加えて、または本明細書で提供される例の代わりに利用され得るこれらの様々な要素について多くの他の代替実装が存在することが当業者には明らかであろう。
本発明は、システム、方法、またはコンピュータ・プログラム製品、あるいはその組合せであってもよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体(または複数の媒体)を含み得る。
コンピュータ可読記憶媒体は、命令実行デバイスによる使用のための命令を保持および記憶することができる有形のデバイスであってもよい。コンピュータ可読記憶媒体は、例えば、電子記憶デバイス、磁気記憶デバイス、光記憶デバイス、電磁記憶デバイス、半導体記憶デバイス、またはこれらの任意の適切な組合せであり得るが、これらに限定されない。コンピュータ可読記憶媒体のさらに具体的な例の非網羅的なリストには、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読取専用メモリ(ROM)、消去可能プログラマブル読取専用メモリ(EPROMまたはフラッシュ・メモリ)、静的ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク読取専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)、メモリ・スティック、フロッピー(R)・ディスク、パンチカードまたは命令が記憶されている溝の中の***構造などの機械的に符号化されるデバイス、および、これらの任意の適切な組合せが含まれる。本明細書で使用されるコンピュータ可読記憶媒体は、それ自体が、電波もしくは他の自由に伝播する電磁波、導波路もしくは他の送信媒体を介して伝播する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、またはワイヤを介して送信される電気信号などの一過性の信号であると解釈されるべきではない。
本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から各コンピューティング・デバイス/処理デバイスに、またはネットワーク、例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワーク、あるいはその組合せを介して外部コンピュータまたは外部記憶デバイスにダウンロードされ得る。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組合せを備え得る。各コンピューティング・デバイス/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、コンピュータ可読プログラム命令をネットワークから受信し、コンピュータ可読プログラム命令を各コンピューティング・デバイス/処理デバイス内のコンピュータ可読記憶媒体に記憶するために転送する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはJava(R)、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語もしくは類似のプログラミング言語などの従来の手続型プログラミング言語を含む1つまたは複数のプログラミング言語の任意の組合せで記述されたソース・コードもしくはオブジェクト・コードであってもよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で全体的に実行すること、ユーザのコンピュータ上であるスタンドアロン・ソフトウェア・パッケージとして部分的に実行すること、ユーザのコンピュータ上およびリモート・コンピュータ上でそれぞれ部分的に実行すること、またはリモート・コンピュータ上もしくはサーバ上で全体的に実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)または広域ネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータに接続されてもよく、または接続は、(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して行われてもよい。いくつかの実施形態では、本発明の態様を実行するために、例えばプログラマブル論理回路、フィールドプログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによって、電子回路を個人化するためのコンピュータ可読プログラム命令を実行してもよい。
発明の態様は、本明細書において、本発明の実施形態による方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、およびフローチャート図またはブロック図あるいはその両方におけるブロックの組合せが、コンピュータ可読プログラム命令によって実施され得ることが理解されよう。
これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令がフローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックで指定された機能/動作を実施するための手段を作り出すように、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてマシンを生成するものであってもよい。これらのコンピュータ可読プログラム命令は、命令が記憶されたコンピュータ可読記憶媒体がフローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作の態様を実施する命令を含む製造品を備えるように、コンピュータ可読記憶媒体に記憶され、コンピュータ、プログラム可能なデータ処理装置または他のデバイスあるいはその組合せに特定の方式で機能するように指示できるものであってもよい。
コンピュータ可読プログラム命令は、コンピュータ上、他のプログラム可能な装置上、または他のデバイス上で実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックに指定される機能/動作を実施するように、コンピュータ上、他のプログラム可能なデータ処理装置上、または他のデバイス上にロードされ、一連の動作ステップを、コンピュータ上、他のプログラム可能な装置上、または他のデバイス上で実行させてコンピュータ実装プロセスを生成してもよい。
図面のフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータ・プログラム製品の可能な実装形態のアーキテクチャ、機能性、および動作を示す。これに関して、フローチャートまたはブロック図における各ブロックは、指定された論理機能を実施するための1つまたは複数の実行可能命令を含む、命令のモジュール、セグメント、または一部を表す場合がある。いくつかの代替実装形態では、ブロックに示された機能は、図面に示された順序と異なる順序で行われてもよい。例えば、連続して図示されている2つのブロックは、実際には、含まれている機能性に応じて、実質的に同時に実行されるか、または場合によっては反対の順序で実行されてもよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、およびブロック図またはフローチャート図あるいはその両方におけるブロックの組合せは、指定された機能または動作を実行するか、または専用ハードウェアとコンピュータ命令の組合せを実行する専用ハードウェアベースのシステムによって実装され得ることも留意されたい。
例示的な実施形態は、多くの異なるタイプのデータ処理環境で利用されてもよい。例示的な実施形態の特定の要素および機能性の説明のためのコンテキストを提供するために、以下に例示的な実施形態の態様が実施され得る例示的な環境として図1および図2が提供されている。図1および図2は単なる例であり、本発明の態様または実施形態が実施され得る環境に関するいかなる制限も、主張または示唆することを意図していないことを理解されたい。本発明の思想および範囲から逸脱することなく、示された環境に対する多くの修正を行うことができる。
図1は、例示的な実施形態の態様が実施され得る例示的な分散型データ処理システムの図形的表現を示す。分散型データ処理システム100は、例示的な実施形態の態様が実施され得るコンピュータのネットワークを含んでもよい。分散型データ処理システム100は、分散型データ処理システム100内で互いに接続された様々なデバイスとコンピュータとの間の通信リンクを提供するために使用される媒体である少なくとも1つのネットワーク102を含む。ネットワーク102は、有線、無線通信リンク、または光ファイバ・ケーブルなどの接続部を含んでもよい。
図示の例では、サーバ104およびサーバ106は、記憶ユニット108とともにネットワーク102に接続されている。さらに、クライアント110、112、および114もネットワーク102に接続されている。これらのクライアント110、112、および114は、例えば、パーソナル・コンピュータ、ネットワーク・コンピュータなどであってもよい。図示の例では、サーバ104は、ブート・ファイル、オペレーティング・システム・イメージ、およびアプリケーションなどのデータをクライアント110、112、および114に提供する。クライアント110、112、および114は、図示の例では、サーバ104に対するクライアントである。分散型データ処理システム100は、図示されていない追加のサーバ、クライアント、および他のデバイスを含んでもよい。
図示の例では、分散型データ処理システム100は、相互に通信するためにプロトコルの伝送制御プロトコル/インターネット・プロトコル(TCP/IP)スイートを使用するネットワークおよびゲートウェイの世界規模の集合体を表す、ネットワーク102を伴うインターネットである。インターネットの中心には、データおよびメッセージを送る数千の商業系、政府系、教育系、および他のコンピュータ・システムで構成された、主要ノードまたはホスト・コンピュータ間の高速データ通信回線のバックボーンがある。当然ながら、分散型データ処理システム100は、例えば、イントラネット、ローカル・エリア・ネットワーク(LAN)、広域ネットワーク(WAN)などの多数の異なるタイプのネットワークを含むように実装されてもよい。上述のように、図1は、本発明の異なる実施形態のアーキテクチャ上の制限としてではなく、一例として意図しており、したがって、図1に示す特定の要素は、本発明の例示的な実施形態が実施され得る環境に関して限定するものと見なされるべきではない。
図1に示すように、1つまたは複数のコンピューティング・デバイス、例えば、サーバ104は、完全畳み込みニューラル・ネットワークを用いた心臓CTAにおける解剖学的構造のセグメンテーションを実装するように特に構成され得る。コンピューティング・デバイスの構成は、例示的な実施形態に関して本明細書に記載されている動作の実行および出力の生成を容易にするために、特定用途向けハードウェア、ファームウェアなどの提供を含む場合がある。コンピューティング・デバイスの構成は、または代替として、例示的な実施形態に関して本明細書に記載されている動作を実行し出力を生成するようにプロセッサを構成するソフトウェア・アプリケーションをコンピューティング・デバイスの1つまたは複数のハードウェア・プロセッサに実行させるために、1つまたは複数の記憶デバイスに格納され、サーバ104などのコンピューティング・デバイスのメモリにロードされる、ソフトウェア・アプリケーションの提供を含む場合がある。さらに、例示的な実施形態の思想および範囲から逸脱することなく、特定用途向けハードウェア、ファームウェア、ハードウェア上で実行されるソフトウェア・アプリケーションなどの任意の組合せが使用されてもよい。
コンピューティング・デバイスがこれらの方法の1つで構成されると、コンピューティング・デバイスは、例示的な実施形態のメカニズムを実装するように特に構成された専用のコンピューティング・デバイスになり、汎用コンピューティング・デバイスではないことを理解されたい。さらに、後述するように、例示的な実施形態のメカニズムの実装は、コンピューティング・デバイスの機能性を向上させ、完全畳み込みニューラル・ネットワークを用いた心臓CTAにおける解剖学的構造のセグメンテーションを容易にする有用かつ具体的な結果をもたらす。
上記のように、例示的な実施形態のメカニズムは、特に構成されたコンピューティング・デバイスまたはデータ処理システムを利用して、完全畳み込みニューラル・ネットワークを用いた心臓CTAにおける解剖学的構造のセグメンテーションのための動作を実行する。これらのコンピューティング・デバイス、またはデータ処理システムは、ハードウェア構成、ソフトウェア構成、またはハードウェア構成とソフトウェア構成の組合せのいずれかによって、本明細書に記載のシステム/サブシステムのうちの1つまたは複数を実装するように特に構成される、様々なハードウェア要素を含み得る。図2は、例示的な実施形態の態様が実装され得るごく一例のデータ処理システムのブロック図である。データ処理システム200は、図1におけるサーバ104などのコンピュータの一例であり、本発明の例示的な実施形態のプロセスおよび態様を実装するコンピュータ使用可能コードまたは命令は、本明細書に記載のような例示的な実施形態の動作、出力、および外部効果を実現するように配置されるか、または実行されるか、あるいはその両方としてもよい。
図示の例では、データ処理システム200は、ノース・ブリッジおよびメモリ・コントローラ・ハブ(NB/MCH)202ならびにサウス・ブリッジおよび入力/出力(I/O)コントローラ・ハブ(SB/ICH)204を含むハブ・アーキテクチャを採用している。処理ユニット206、メイン・メモリ208、およびグラフィックス・プロセッサ210は、NB/MCH202に接続される。グラフィックス・プロセッサ210は、アクセラレイテッド・グラフィックス・ポート(AGP)を介してNB/MCH202に接続され得る。
図示の例では、ローカル・エリア・ネットワーク(LAN)アダプタ212は、SB/ICH204に接続している。オーディオ・アダプタ216、キーボードおよびマウス・アダプタ220、モデム222、読取専用メモリ(ROM)224、ハード・ディスク・ドライブ(HDD)226、CD−ROMドライブ230、ユニバーサル・シリアル・バス(USB)ポートおよび他の通信ポート232、ならびにPCI/PCIeデバイス234は、バス238およびバス240を介してSB/ICH204に接続している。PCI/PCIeデバイスには、例えば、Ethernet(R)アダプタ、アドイン・カード、およびノートブック・コンピュータ用のPCカードが含まれ得る。PCIはカード・バス・コントローラを使用するが、PCIeは使用しない。ROM224は、例えば、フラッシュ基本入出力システム(BIOS)であってもよい。
HDD226およびCD−ROMドライブ230は、バス240を介してSB/ICH204に接続している。HDD226およびCD−ROMドライブ230は、例えば、統合ドライブ・エレクトロニクス(IDE)またはシリアル・アドバンスト・テクノロジー・アタッチメント(SATA)インターフェースを使用してもよい。スーパーI/O(SIO)デバイス236は、SB/ICH204に接続される場合がある。
オペレーティング・システムは、処理ユニット206上で実行される。オペレーティング・システムは、図2のデータ処理システム200内の様々なコンポーネントの制御を調整および提供する。クライアントとして、オペレーティング・システムは、Microsoft(R)Windows(R)7(R)などの市販のオペレーティング・システムとすることができる。Java(R)(TM)プログラミング・システムなどのオブジェクト指向プログラミング・システムは、オペレーティング・システムとともに実行することができ、データ処理システム200上で実行されるJava(R)(TM)プログラムまたはアプリケーションからのオペレーティング・システムに対する呼び出しを提供する。
サーバとして、データ処理システム200は、例えば、Advanced Interactive Executive(AIX(R))オペレーティング・システムまたはLINUX(R)オペレーティング・システムを実行する、IBM eServer(TM)System p(R)コンピュータ・システム、Power(TM)プロセッサ・ベースのコンピュータ・システムなどとすることができる。データ処理システム200は、処理ユニット206内に複数のプロセッサを含む対称型マルチプロセッサ(SMP:symmetric multiprocessor)システムとすることができる。代替として、シングル・プロセッサ・システムを用いることもできる。
オペレーティング・システム、オブジェクト指向プログラミング・システム、およびアプリケーションまたはプログラムに対する命令は、HDD226などの記憶デバイス上に配置されてもよく、処理ユニット206による実行のためにメイン・メモリ208にロードされてもよい。本発明の例示的な実施形態のプロセスは、例えば、メイン・メモリ208、ROM224などのメモリ内または1つもしくは複数の周辺デバイス226および230内に配置され得るコンピュータ使用可能プログラム・コードを使用して、処理ユニット206によって実行されてもよい。
図2に示すようなバス238またはバス240などのバス・システムは、1つまたは複数のバスで構成され得る。当然ながら、バス・システムは、ファブリックまたはアーキテクチャに取り付けられた異なるコンポーネントまたはデバイス間のデータ転送を提供する任意のタイプの通信ファブリックまたはアーキテクチャを使用して実装されてもよい。図2のモデム222またはネットワーク・アダプタ212などの通信ユニットは、データの送信および受信に使用される1つまたは複数のデバイスを含み得る。メモリは、例えば、メイン・メモリ208、ROM224、または図2のNB/MCH202に見られるようなキャッシュとすることができる。
上述のように、いくつかの例示的な実施形態では、例示的な実施形態のメカニズムは、特定用途向けハードウェア、ファームウェアなど、処理ユニット206などの1つまたは複数のハードウェア・プロセッサによって実行するためにHDD226などの記憶デバイスに格納され、メイン・メモリ208などのメモリにロードされるアプリケーション・ソフトウェアなどとして実装され得る。したがって、図2に示すコンピューティング・デバイスは、例示的な実施形態のメカニズムを実装するように特に構成され、完全畳み込みニューラル・ネットワークを用いた心臓CTAにおける解剖学的構造のセグメンテーションに関して後述される動作を実行し、出力を生成するように特に構成されるようになる。
当業者であれば、図1および図2のハードウェアが実装によって異なる場合があることを理解するであろう。図1および図2に示すハードウェアに加えて、またはその代わりに、フラッシュ・メモリ、同等の不揮発性メモリ、または光ディスク・ドライブなどの他の内部ハードウェアまたは周辺デバイスが使用されてもよい。また、例示的な実施形態のプロセスは、本発明の思想および範囲から逸脱することなく、前述のSMPシステム以外のマルチプロセッサ・データ処理システムに適用されてもよい。
さらに、データ処理システム200は、クライアント・コンピューティング・デバイス、サーバ・コンピューティング・デバイス、タブレット・コンピュータ、ラップトップ・コンピュータ、電話または他の通信デバイス、携帯情報端末(PDA:personal digital assistant)などを含む、多数の異なるデータ処理システムのいずれかの形をとることができる。いくつかの例示的な例では、データ処理システム200は、例えば、オペレーティング・システム・ファイルまたはユーザ生成データあるいはその両方を格納するための不揮発性メモリを提供するフラッシュ・メモリで構成されるポータブル・コンピューティング・デバイスとすることができる。本質的に、データ処理システム200は、アーキテクチャ上の制限なく、任意の知られた、または後に開発されるデータ処理システムとすることができる。
コントラストが強化された胸部コンピュータ断層撮影(CT)は、心室および心房の機能を評価し、肺塞栓症、上大静脈の閉塞の疑い、冠状動脈アテローム性硬化症などの血管の異常、大動脈瘤、大動脈解離を含む、心臓、肺、または胸部の主要動脈の多くの障害を示すことができる。心室および心房の機能を評価するには、心筋重量および心腔の容積などのいくつかのバイオマーカーを定量化する必要がある。さらに、胸部の主要動脈の位置特定は、多くの疾患検出アルゴリズムの前処理ステップとしても使用される。解剖学的構造のセグメンテーションは、バイオマーカーの定量化および疾患検出にとって重要である。
心臓の解剖学および大血管のセグメンテーションのために、アクティブ・アピアランス・モデル、マルチアトラス・レジストレーションおよびマージナル空間学習などの多くの手法が提案されている。マルチアトラス・セグメンテーションは、その高い堅牢性および卓越した性能により、心腔のセグメンテーションおよび胸部解剖学的組織全体のセグメンテーションに広く使用されている。マルチアトラス・セグメンテーション・アルゴリズムは、対象画像に複数のアトラスを位置合せする非剛体レジストレーション・ステップ、および複数のアトラスによって作成された競合するラベルを解決するラベル融合ステップを含む。しかしながら、レジストレーション・ステップおよびボクセル単位のラベル融合ステップにおける計算が大量であるため、マルチアトラス・ベースの方法は非常に時間がかかる。その結果、研究者らはこれらの手法に伴う計算コストの削減に関する研究を報告している。従来技術の手法の1つは、レジストレーション・ステップの前にアトラス選択法を実行して、より良いセグメンテーション精度を実現し、計算コストを削減した。別の従来技術の手法は、脳組織セグメンテーション用に非局所的ラベル融合技法を使用した。さらに別の従来技術の手法は、マルチアトラス学習のスピード・アップにおける修正学習の役割を調査するために実験的研究を行った。これらは、最初に低解像度空間でマルチアトラス・セグメンテーションを実行し、元の高解像度空間にアップサンプリングする。結果として生じるセグメンテーション誤差は、教師あり学習を用いて修正される。この方法は、高解像度空間から直接得られる結果に近いセグメンテーション精度を維持するとともに、時間コストを劇的に削減する。
CNNは、2次元(2D)タスクと3次元(3D)タスクの両方の医用画像セグメンテーションにおいて有望な結果を示している。完全畳み込みネットワーク(FCN:fully convolutional network)は、自然な赤、緑、青(RGB)の画像セグメンテーション用に提案されており、さらに短軸医用共鳴画像法(MRI:medical resonance imaging)の心臓セグメンテーションに使用されている。別の従来技術の手法は、U−Netネットワークを提案し、それを透過光顕微鏡画像に適用した。隣接するスライスからのコンテキストを組み込むために、M−Netアーキテクチャは、複数のスライスを1つのスライスにフラット化し、2D CNNセグメンテーション・ネットワークに送り込むことを提案した。M−Netは、MRIの脳組織セグメンテーションに適用された。別の従来技術の手法は、すべての2Dコンポーネントを3Dに置き換えることによってU−Netを拡張した。
特定の従来技術の手法の1つは、3Dボリューム・セグメンテーションのためのV−Net構造を提案した。V−Netの主な貢献のうちの1つは、DSCが損失層で計算および最適化され、ネットワークの重みを最適化するために逆伝播されることである。V−NetはMRIの前立腺セグメンテーションでテストされている。しかしながら、元のV−Netは、2値セグメンテーション・タスク用に開発されている。マルチラベル・セグメンテーション・タスクに適用する場合、新しいDSCベースの損失層が開発されるべきである。
例示的な実施形態は、2値V−Netをマルチラベル・セグメンテーション・ネットワークに拡張する。例示的な実施形態は、損失層において対象となるすべての解剖学的構造について計算されたDSCの合計を使用する。次いで、マルチラベルV−Netからのセグメンテーション結果を平滑化して小さなセグメンテーション誤差を取り除き、オブジェクトの表面をリファインする。
例示的な実施形態は、1人の放射線科医によって16の解剖学的構造について注釈が付けられた48の心臓CTAボリュームを収集する。16の解剖学的組織は、胸骨、上行大動脈/下行大動脈/大動脈弓/大動脈根、左肺動脈/右肺動脈/肺動脈幹、椎骨、左心房/右心房、左心室/右心室、左心室筋、および上大静脈/下大静脈と同様のものである。我々の研究で用いた心臓CT検査は、CTスキャナによって取得された。各画像は、1mm×1mm未満の等方性の面内解像度を有する。スライスの厚さは0.8mmから2.0mmまで変化する。すべての画像は、患者間の強度変動を排除するために強度が均一化され、すべての次元でボクセル・サイズ1.5mmに再サンプリングされる。
V−Netをボリューム画像セグメンテーションのための強力なディープ・ネットワークにする3つの態様がある。1つ目の態様は、各畳み込み層においてボリューム・カーネルを使用する。2つ目の態様は、異なる解像度の各段階で残余関数を学習する。3つ目の態様は、背景と前景のボリューム間の不均衡を回避するように前景オブジェクトのDSCを最適化する。従来技術の手法の1つは、サンプルの再重み付けにより多項ロジスティック損失を最適化することによって訓練された同じアーキテクチャと比較して、セグメンテーション結果が改善されたと報告した。しかしながら、従来の作業では、単一の前景のDSCのみが最適化される。
V−Netをマルチラベル・ネットワークに拡張するために、
Figure 2021513697

を確立することによって、解剖学的構造iのセグメンテーション・マスク画像Fを見いだすことを目標とするセグメンテーションの問題を考える。式中、
Figure 2021513697

は、i番目のセグメント化された前景のj番目のボクセルであり、
Figure 2021513697

がi番目のグラウンド・トゥルース構造内にあるグラウンド・トゥルースを条件とし、適用例では1<i<16である。セグメンテーションとグラウンド・トゥルースの間の全体的なDSCを、i番目のセグメンテーションのj番目のボクセルで微分して、以下の勾配を求める。
Figure 2021513697
式中、Nは画像中のボクセルの総数である。3D畳み込みのメモリ要件が高いため、入力画像は2mm×2mm×3.5mmにダウンサンプリングされ、サイズ128×192×64のサブ画像は元の画像の中心からクロッピングされてネットワークに送られる。テスト時には、マルチラベルV−Netの出力が元の解像度にアップサンプリングされ、評価のために元の画像サイズにパディングされる。
入力がダウンサンプリングされるので、マルチラベルV−Netからのセグメンテーション結果は、元の解像度にアップサンプリングして戻った後に粗くなる。また、V−Netは、形状の事前情報を組み込まない。その結果、結果は通常平滑化を必要とする。1つ目の問題については、ハードウェアの将来のアップグレードが役立つ可能性がある。2つ目の問題については、従来技術の手法の1つは、オートエンコーダを訓練し、コード化されたセグメンテーションとグラウンド・トゥルースとの間の平均絶対差を損失として使用することを提案した。しかしながら、この手法をDSCに基づいて計算される損失関数に拡張することは、容易ではない。
例示的な実施形態は、表面曲率を前面輪郭の進化速度として使用して表面を進化させることによって、セグメンテーションの表面を平滑化することを提案する。セグメンテーションの突然の不連続性の一部は、その表面の曲率が高くなることによって消失する。平滑化の最終ステップとして、例示的な実施形態は、各前景の最大の独立成分を抽出する。
図3は、異なる方法についての各解剖学的組織のDSCおよび平均DSCの棒グラフである。図4〜図7は、セグメンテーションの2D視覚表現であり、図4:元の画像、図5:マルチラベルV−Netによる結果、図6:後処理後の結果、図7:グラウンド・トゥルースである。図8〜図10は、セグメンテーションの3Dボリューム・レンダリングであり、図8:マルチラベルV−Netによる結果、図9:後処理後の結果、図10:グラウンド・トゥルースである。
例示的な実施形態は、4分割交差検証を使用して、提案されたマルチラベルV−Netネットワークを評価する。異なる解剖学的組織に対する平均DSC値を図3に示す。平滑化の前は、平均DSCは、平滑化後の0.77と比較して0.72である。図3に見られるように、16の解剖学的組織のうち15の解剖学的組織について、平滑化後にDSCが改善された。
図4は、例示的な実施形態による、元の画像のセグメンテーションの2D視覚表現である。図5は、例示的な実施形態による、マルチラベルV−Netによる結果のセグメンテーションの2D視覚表現である。図6は、例示的な実施形態による、後処理後の結果のセグメンテーションの2D視覚表現である。図7は、例示的な実施形態による、グラウンド・トゥルースのセグメンテーションの2D視覚表現である。
図8は、例示的な実施形態による、マルチラベルV−Netによる結果のセグメンテーションの3Dボリューム・レンダリングである。図9は、例示的な実施形態による、後処理後の結果のセグメンテーションの3Dボリューム・レンダリングである。図10は、例示的な実施形態による、グラウンド・トゥルースのセグメンテーションの3Dボリューム・レンダリングである。
例示的な実施形態は、セグメンテーション結果を、これまでで最速である公開されたマルチアトラス・レジストレーションおよびラベル融合法と比較する。その文献の結果は、全体の平均DSCが0.78であることを示している。しかしながら、これは48のデータセットのサブセットで実現された。公平な比較のために、例示的な実施形態は、拡張されたセットに対して実験を繰り返した。例示的な実施形態は、すべての構造にわたって平均すると、従来技術のマルチアトラス法の同じデータでの0.82と比較して、0.77のDSCを実現する。例示的な実施形態は画像を2mm×2mm×3.5mmのサイズにダウンサンプリングしたが、アトラスは1.5mm×1.5mm×6mmの再サンプリングされたボクセル・サイズであったので、直接比較は依然として困難であることに留意されたい。
例示的な実施形態の主な利点は、特にグラフィックス処理ユニット(GPU)で実行されるときに、テスト/デプロイメント段階での時間コストを削減することにある。マルチラベルV−Netが12GBのメモリを搭載した1つのTITAN X GPUで3Dボリュームをセグメント化するのに要する時間は10秒未満であり、一方、周波数2.10GHzのインテル(R)Xeon(R)CPU E5−2620v2のマルチアトラス・セグメンテーション方法では約10分を要する。これは、異なるアトラスのレジストレーションを並列化した後に実現された。
マルチアトラス・ラベル融合法の利点は、小さい解剖学的構造をより正確にセグメント化することにある。例示的な実施形態の適用において、これは、ほとんどの場合に欠落している左肺動脈、上大静脈および大動脈弓の場合に顕著である。図3に示すように、左肺動脈について、マルチアトラス・ラベル融合法はDSC0.82を返しており、平滑化されたV−Netは、DSC0.68という結果になる。
例示的な実施形態は、胸部CTA内の主要な解剖学的構造をセグメント化するために、異なる前景の全体的なDSCに基づくマルチラベルV−Net目的関数を提案する。この方法は、4分割交差検証を使用して訓練および評価され、大きい解剖学的組織のための最先端のマルチアトラス・セグメンテーション方法に近い結果を実現する。方法は、デプロイメント時に非常に有効である。
図11は、例示的な実施形態による、マルチラベルV−Netを用いた心臓CTAにおける解剖学的構造のセグメンテーションのためのニューラル・ネットワーク訓練エンジンを示すブロック図である。ニューラル・ネットワーク訓練エンジン610は、複数のグラウンド・トゥルースCTAボリューム605を受け取る。これらのCTAボリューム605は、1人または複数の放射線科医によって複数の解剖学的構造について注釈が付けられる訓練インスタンスである。複数の解剖学的構造には、例えば、上行大動脈/下行大動脈/大動脈弓/大動脈根、左肺動脈/右肺動脈/肺動脈幹、椎骨、左心房/右心房、左心室/右心室、左心室筋、または上大静脈/下大静脈が含まれ得る。
ニューラル・ネットワーク訓練エンジン610は、前処理コンポーネント611、ニューラル・ネットワーク訓練コンポーネント612、および後処理コンポーネント613を含む。前処理コンポーネント611は、グラウンド・トゥルースCTAボリューム605に対して1つ以上の前処理動作を実行する。一実施形態では、前処理動作は、CTAボリューム605における画像をダウンサンプリングおよびクロッピングすることを含み得る。より具体的には、前処理動作は、患者間の強度変動を排除するために画像の強度を均一化し、次いでより大きいボクセル・サイズに再サンプリングすることを含み得る。
ニューラル・ネットワーク訓練コンポーネント612は、グラウンド・トゥルースCTAボリューム605を使用して、ニューラル・ネットワークを訓練し、セグメント化されたCTAボリューム625を生成する。例示的な実施形態によれば、ニューラル・ネットワークは、複数の解剖学的構造のセグメンテーション・マスク画像を見いだすことを目標とするセグメンテーションの問題を考慮するためにマルチラベル・ネットワークに拡張されたV−Netニューラル・ネットワークとすることができる。したがって、ニューラル・ネットワークは、臓器などの複数の解剖学的構造を同時に識別するように訓練される。ニューラル・ネットワーク訓練コンポーネント612は、画像および手動セグメンテーションを使用して教師ありディープ・ラーニング・セグメンテーション・ネットワークを訓練することによって、ニューラル・ネットワークを訓練し、損失が、複数の解剖学的構造についてのダイス・スコアの合計であるマルチダイス・スコアから決定される。
後処理コンポーネント613は、セグメンテーション・コンポーネント612の結果に対して少なくとも1つの後処理動作を実行する。一実施形態では、後処理動作は、セグメンテーション・コンポーネント612の結果をアップサンプリングおよび平滑化することを含む。より具体的には、後処理動作は、表面曲率を前面輪郭の進化速度として使用して表面を進化させることによって、セグメンテーションの表面を平滑化することを含み得る。
図12は、例示的な実施形態による、マルチラベルV−Netを用いた心臓CTAにおける解剖学的構造のセグメンテーションのためのニューラル・ネットワーク・テスト・エンジンのブロック図である。ニューラル・ネットワーク・テスト・エンジン710は、複数のテストCTAボリューム705を受け取る。これらのCTAボリューム705は、1人または複数の放射線科医によって複数の解剖学的構造について注釈が付けられ得るテスト・インスタンスである。複数の解剖学的構造には、例えば、上行大動脈/下行大動脈/大動脈弓/大動脈根、左肺動脈/右肺動脈/肺動脈幹、椎骨、左心房/右心房、左心室/右心室、左心室筋、または上大静脈/下大静脈が含まれ得る。
ニューラル・ネットワーク・テスト・エンジン710は、前処理コンポーネント711、訓練されたニューラル・ネットワーク712、および後処理コンポーネント713を含む。前処理コンポーネント711は、グラウンド・トゥルースCTAボリューム705に対して1つまたは複数の前処理動作を実行する。一実施形態では、前処理動作は、CTAボリューム705における画像をダウンサンプリングおよびクロッピングすることを含み得る。より具体的には、前処理動作は、患者間の強度変動を排除するために画像の強度を均一化し、次いでより大きいボクセル・サイズに再サンプリングすることを含み得る。
訓練されたニューラル・ネットワーク712は、テストCTAボリューム705をセグメント化して、セグメント化されたCTAボリューム725を生成するように動作する。例示的な実施形態によれば、訓練されたニューラル・ネットワーク712は、複数の解剖学的構造のセグメンテーション・マスク画像を見いだすことを目標とするセグメンテーションの問題を考慮するためにマルチラベル・ネットワークに拡張されたV−Netニューラル・ネットワークとすることができる。ニューラル・ネットワーク712は、臓器などの複数の解剖学的構造を同時に識別するように訓練される。ニューラル・ネットワーク712は、教師ありディープ・ラーニング・セグメンテーション・ネットワークであり、損失が、複数の解剖学的構造についてのダイス・スコアの合計であるマルチダイス・スコアから決定される。
後処理コンポーネント713は、訓練されたニューラル・ネットワーク712の結果に対して少なくとも1つの後処理動作を実行する。一実施形態では、後処理動作は、訓練されたニューラル・ネットワーク712の結果をアップサンプリングおよび平滑化することを含む。より具体的には、後処理動作は、表面曲率を前面輪郭の進化速度として使用して表面を進化させることによって、セグメンテーションの表面を平滑化することを含み得る。
図13は、例示的な実施形態による、心臓CTAにおける解剖学的構造のセグメンテーションのための教師ありディープ・ラーニング・ネットワークを訓練するためのメカニズムの動作を示すフローチャートである。動作が開始し(ブロック800)、メカニズムは、訓練CTA画像のセットを受け取り(ブロック801)、複数の臓器の画像の手動セグメンテーションを受け取る(ブロック802)。メカニズムは、前処理を実行する(ブロック803)。前処理は、訓練CTAボリュームにおける画像をダウンサンプリングすることを含み得る。
メカニズムは、訓練画像および手動セグメンテーションを使用して教師ありディープ・ラーニング・ネットワークを訓練し、損失が、マルチダイス・スコアから決定される(ブロック804)。例示的な実施形態によれば、メカニズムは、複数の解剖学的構造のセグメンテーション・マスク画像を見いだすことを目標とするセグメンテーションの問題を考慮するためにマルチラベル・ネットワークに拡張された教師ありディープ・ラーニング・ネットワークを訓練する。ニューラル・ネットワークは、臓器などの複数の解剖学的構造を同時に識別するように訓練される。メカニズムは、画像および手動セグメンテーションを使用することによって教師ありディープ・ラーニング・セグメンテーション・ネットワークを訓練し、損失が、複数の解剖学的構造についてのダイス・スコアの合計であるマルチダイス・スコアから決定される。その後、動作は終了する(ブロック805)。
図14は、例示的な実施形態による、心臓CTAにおける解剖学的構造のセグメンテーションのための訓練されたネットワークをテストするためのメカニズムの動作を示すフローチャートである。動作が開始し(ブロック900)、メカニズムはテストCTA画像を受け取る(ブロック901)。メカニズムは前処理を実行する(ブロック902)。前処理は、訓練CTAボリュームにおける画像をダウンサンプリングすることを含み得る。
メカニズムは、訓練された教師ありディープ・ラーニング・ネットワークを使用して、テスト画像のセグメント化された出力を取得する(ブロック903)。例示的な実施形態によれば、教師ありディープ・ラーニング・ネットワークは、複数の解剖学的構造のセグメンテーション・マスク画像を見いだすことを目標とするセグメンテーションの問題を考慮するように訓練される。ニューラル・ネットワークは、臓器などの複数の解剖学的構造を同時に識別するように訓練される。
次いで、メカニズムは、V−Netマルチラベル・セグメンテーションを実行した結果に対して後処理を実行する(ブロック904)。後処理は、セグメンテーション動作によって得られた画像に対する平滑化を含み得る。その後、動作は終了する(ブロック905)。
上記のように、例示的な実施形態は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、またはハードウェア要素とソフトウェア要素の両方を含む実施形態の形をとり得ることを理解されたい。例示的な一実施形態では、例示的な実施形態のメカニズムは、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むがこれらに限定されないソフトウェアまたはプログラム・コードにおいて実装される。
プログラム・コードを格納するため、または実行するため、あるいはその両方に適したデータ処理システムは、例えば、システム・バスなどの通信バスを介してメモリ要素に直接または間接的に結合された少なくとも1つのプロセッサを含むことになる。メモリ要素は、プログラム・コードの実際の実行中に使用されるローカル・メモリ、大容量記憶装置、および実行中に大容量記憶装置からコードを取得しなければならない回数を低減するために少なくともいくつかのプログラム・コードの一時的記憶領域を提供するキャッシュ・メモリを含み得る。メモリは、ROM、PROM、EPROM、EEPROM、DRAM、SRAM、フラッシュ・メモリ、ソリッド・ステート・メモリなどを含むがこれらに限定されない様々なタイプのものであってよい。
入力/出力デバイスすなわちI/Oデバイス(キーボード、ディスプレイ、ポインティング・デバイスなどが含まれるがこれらに限定されない)は、直接または介在する有線または無線のI/Oインターフェースまたはコントローラあるいはその両方などを介してシステムに結合され得る。I/Oデバイスは、例えば、従来のキーボード、ディスプレイ、ポインティング・デバイスなど以外にも、例えば、スマートフォン、タブレット・コンピュータ、タッチ・スクリーン・デバイス、音声認識デバイスなどを含むがこれらに限定されない有線または無線接続を介して結合された通信デバイスなど、多くの様々な形をとることができる。任意の知られたまたは後に開発されるI/Oデバイスは、例示的な実施形態の範囲内にあることを意図したものである。
データ処理システムが、介在するプライベート・ネットワークまたはパブリックネット・ワークを介して他のデータ処理システムまたはリモート・プリンタもしくは記憶デバイスに結合できるように、ネットワーク・アダプタをシステムに結合することもできる。モデム、ケーブル・モデム、およびEthernet(R)カードは、有線通信用ネットワーク・アダプタの現在利用可能なタイプのごく一部である。802.11a/b/g/n無線通信アダプタ、Bluetooth(R)無線アダプタなどを含むがこれらに限定されない無線通信ベースのネットワーク・アダプタを利用することもできる。任意の知られたまたは後に開発されるネットワーク・アダプタは、本発明の思想および範囲内にあることを意図したものである。
本発明の説明は、例示および説明の目的で提示されており、網羅的であること、または開示された形態の本発明に限定することを意図したものではない。説明された実施形態の範囲から逸脱することなく、多くの修正および変形が当業者には明らかであろう。実施形態は、本発明の原理、実際の適用を最もよく説明し、当業者が企図される特定の用途に適した様々な変更を加えた様々な実施形態の本発明を理解できるようにするために選択および説明された。本明細書で使用される用語は、実施形態の原理、市場で見られる技術に対する実際の適用または技術的改良を最もよく説明するため、または当業者が本明細書で開示される実施形態を理解できるようにするために選択された。

Claims (20)

  1. プロセッサおよびメモリを含むデータ処理システムにおける方法であって、前記メモリが、完全畳み込みニューラル・ネットワークを用いた心臓コンピュータ断層撮影血管造影(CTA)における解剖学的構造のセグメンテーションのためのシステムを実装するように前記プロセッサを特に構成するように前記プロセッサによって実行される命令を含み、前記方法が、
    (a)複数の解剖学的構造のそれぞれについて(i)軸位断で走査された1組の胸部CTA画像、および(ii)前記画像の手動セグメンテーションを収集することと、
    (b)同じ視野(FOV)を共有するように前記画像を前処理することと、
    (c)前記画像と前記手動セグメンテーションの両方を使用して教師ありディープ・ラーニング・セグメンテーション・ネットワークを訓練することであって、損失が、前記複数の解剖学的構造すべてについてのダイス・スコアの合計であるマルチダイス・スコアから決定され、各ダイス・スコアが前記解剖学的構造のうちの1つについての前記手動セグメンテーションと前記ネットワークの出力との間の類似度として計算される、訓練することと、
    (d)前記訓練されたネットワーク上で所与の前処理済み画像をテストし、それによって前記所与の画像のセグメント化された出力を取得することと、
    (e)前記所与の画像の前記セグメント化された出力に対して後処理を実行することと
    を含む方法。
  2. 前記画像を前処理することが、前記所与の画像の前記セグメント化された出力をダウンサンプリングすることを含む、請求項1に記載の方法。
  3. 後処理を実行することが、前記所与の画像の前記セグメント化された出力に対してアップサンプリングを実行することを含む、請求項2に記載の方法。
  4. 後処理を実行することが、前記所与の画像の前記セグメント化された出力に対して平滑化を実行することを含む、請求項2に記載の方法。
  5. 前記教師ありディープ・ラーニング・セグメンテーション・ネットワークが、マルチラベル・ネットワークに拡張され、
    Figure 2021513697
    を確立することによって、解剖学的構造iのセグメンテーション・マスク画像Fを見いだすことを目標とし、ここで、
    Figure 2021513697
    が、i番目のセグメント化された前景のj番目のボクセルであり、
    Figure 2021513697
    がi番目のグラウンド・トゥルース構造内にあるグラウンド・トゥルースであり、前記セグメンテーションと前記グラウンド・トゥルースとの間の全体的なダイス・スコアを、i番目のセグメンテーションのj番目のボクセルで微分して、以下の勾配を求め、
    Figure 2021513697
    ここで、Nが前記画像中のボクセルの総数である、請求項1に記載の方法。
  6. 前記所与の画像の前記セグメント化された出力が、前記複数の解剖学的構造についてセグメント化される、請求項1に記載の方法。
  7. 複数の解剖学的構造が、上行大動脈、下行大動脈、大動脈弓、大動脈根、左肺動脈、右肺動脈、肺動脈幹、椎骨、左心房、右心房、左心室、右心室、左心室筋、および上大静脈、下大静脈を含む、請求項1に記載の方法。
  8. 前記画像を前処理することが、患者間の強度変動を排除するために前記画像の強度を均一化することを含む、請求項1に記載の方法。
  9. 格納されたコンピュータ可読プログラムを有するコンピュータ可読記憶媒体を備えるコンピュータ・プログラム製品であって、前記コンピュータ可読プログラムが、コンピューティング・デバイス上で実行されると、前記コンピューティング・デバイスに、完全畳み込みニューラル・ネットワークを用いた心臓コンピュータ断層撮影血管造影(CTA)における解剖学的構造のセグメンテーションのためのシステムを実装させ、前記コンピュータ可読プログラムが、前記コンピューティング・デバイスに、
    (a)複数の解剖学的構造のそれぞれについて(i)軸位断で走査された1組の胸部CTA画像、および(ii)前記画像の手動セグメンテーションを収集することと、
    (b)同じ視野(FOV)を共有するように前記画像を前処理することと、
    (c)前記画像と前記手動セグメンテーションの両方を使用して教師ありディープ・ラーニング・セグメンテーション・ネットワークを訓練することであって、損失が、前記複数の解剖学的構造すべてについてのダイス・スコアの合計であるマルチダイス・スコアから決定され、各ダイス・スコアが前記解剖学的構造のうちの1つについての前記手動セグメンテーションと前記ネットワークの出力との間の類似度として計算される、訓練することと、
    (d)前記訓練されたネットワーク上で所与の前処理済み画像をテストし、それによって前記所与の画像のセグメント化された出力を取得することと、
    (e)前記所与の画像の前記セグメント化された出力に対して後処理を実行することと
    を実行させる、コンピュータ・プログラム製品。
  10. 前記画像を前処理することが、前記所与の画像の前記セグメント化された出力をダウンサンプリングすることを含む、請求項9に記載のコンピュータ・プログラム製品。
  11. 後処理を実行することが、前記所与の画像の前記セグメント化された出力に対してアップサンプリングを実行することを含む、請求項10に記載のコンピュータ・プログラム製品。
  12. 後処理を実行することが、前記所与の画像の前記セグメント化された出力に対して平滑化を実行することを含む、請求項10に記載のコンピュータ・プログラム製品。
  13. 前記教師ありディープ・ラーニング・セグメンテーション・ネットワークが、マルチラベル・ネットワークに拡張され、
    Figure 2021513697
    を確立することによって、解剖学的構造iのセグメンテーション・マスク画像Fを見いだすことを目標とし、ここで、
    Figure 2021513697
    が、i番目のセグメント化された前景のj番目のボクセルであり、
    Figure 2021513697
    がi番目のグラウンド・トゥルース構造内にあるグラウンド・トゥルースであり、前記セグメンテーションと前記グラウンド・トゥルースとの間の全体的なダイス・スコアを、i番目のセグメンテーションのj番目のボクセルで微分して、以下の勾配を求め、
    Figure 2021513697
    ここで、Nが前記画像中のボクセルの総数である、請求項9に記載のコンピュータ・プログラム製品。
  14. 前記所与の画像の前記セグメント化された出力が、前記複数の解剖学的構造についてセグメント化される、請求項9に記載のコンピュータ・プログラム製品。
  15. 複数の解剖学的構造が、上行大動脈、下行大動脈、大動脈弓、大動脈根、左肺動脈、右肺動脈、肺動脈幹、椎骨、左心房、右心房、左心室、右心室、左心室筋、および上大静脈、下大静脈を含む、請求項9に記載のコンピュータ・プログラム製品。
  16. 前記画像を前処理することが、患者間の強度変動を排除するために前記画像の強度を均一化することを含む、請求項9に記載のコンピュータ・プログラム製品。
  17. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに結合されたメモリと
    を備える装置であって、前記メモリが、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、完全畳み込みニューラル・ネットワークを用いた心臓コンピュータ断層撮影血管造影(CTA)における解剖学的構造のセグメンテーションのためのシステムを実装させる命令を含み、前記命令が、前記少なくとも1つのプロセッサに、
    (a)複数の解剖学的構造のそれぞれについて(i)軸位断で走査された1組の胸部CTA画像、および(ii)前記画像の手動セグメンテーションを収集することと、
    (b)同じ視野(FOV)を共有するように前記画像を前処理することと、
    (c)前記画像と前記手動セグメンテーションの両方を使用して教師ありディープ・ラーニング・セグメンテーション・ネットワークを訓練することであって、損失が、前記複数の解剖学的構造すべてについてのダイス・スコアの合計であるマルチダイス・スコアから決定され、各ダイス・スコアが前記解剖学的構造のうちの1つについての前記手動セグメンテーションと前記ネットワークの出力との間の類似度として計算される、訓練することと、
    (d)前記訓練されたネットワーク上で所与の前処理済み画像をテストし、それによって前記所与の画像のセグメント化された出力を取得することと、
    (e)前記所与の画像の前記セグメント化された出力に対して後処理を実行することと
    を実行させる、装置。
  18. 前記画像を前処理することが、前記所与の画像の前記セグメント化された出力をダウンサンプリングすることを含み、後処理を実行することが、前記所与の画像の前記セグメント化された出力に対してアップサンプリングを実行することを含む、請求項17に記載の装置。
  19. 後処理を実行することが、前記所与の画像の前記セグメント化された出力に対して平滑化を実行することを含む、請求項18に記載の装置。
  20. 前記教師ありディープ・ラーニング・セグメンテーション・ネットワークが、マルチラベル・ネットワークに拡張され、
    Figure 2021513697
    を確立することによって、解剖学的構造iのセグメンテーション・マスク画像Fを見いだすことを目標とし、ここで、
    Figure 2021513697
    が、i番目のセグメント化された前景のj番目のボクセルであり、
    Figure 2021513697
    がi番目のグラウンド・トゥルース構造内にあるグラウンド・トゥルースであり、前記セグメンテーションと前記グラウンド・トゥルースとの間の全体的なダイス・スコアを、i番目のセグメンテーションのj番目のボクセルで微分して、以下の勾配を求め、
    Figure 2021513697
    ここで、Nが前記画像中のボクセルの総数である、請求項17に記載の装置。
JP2020538806A 2018-02-07 2019-01-17 コンピュータ断層撮影血管造影における解剖学的構造のセグメンテーションのための方法、コンピュータ・プログラム、コンピュータ可読記憶媒体、および装置 Active JP7102531B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862627306P 2018-02-07 2018-02-07
US62/627,306 2018-02-07
US15/963,442 US10896508B2 (en) 2018-02-07 2018-04-26 System for segmentation of anatomical structures in cardiac CTA using fully convolutional neural networks
US15/963,442 2018-04-26
PCT/IB2019/050377 WO2019155306A1 (en) 2018-02-07 2019-01-17 A system for segmentation of anatomical structures in cardiac cta using fully convolutional neural networks

Publications (3)

Publication Number Publication Date
JP2021513697A true JP2021513697A (ja) 2021-05-27
JP2021513697A5 JP2021513697A5 (ja) 2021-07-29
JP7102531B2 JP7102531B2 (ja) 2022-07-19

Family

ID=67476883

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020538806A Active JP7102531B2 (ja) 2018-02-07 2019-01-17 コンピュータ断層撮影血管造影における解剖学的構造のセグメンテーションのための方法、コンピュータ・プログラム、コンピュータ可読記憶媒体、および装置

Country Status (6)

Country Link
US (1) US10896508B2 (ja)
JP (1) JP7102531B2 (ja)
CN (1) CN111557020B (ja)
DE (1) DE112019000708T5 (ja)
GB (1) GB2583682B (ja)
WO (1) WO2019155306A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023157439A1 (ja) * 2022-02-18 2023-08-24 富士フイルム株式会社 画像処理装置及びその作動方法、推論装置並びに学習装置

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011085341A1 (en) 2010-01-11 2011-07-14 Waters Technologies Corporation Static and dynamic seals
EP3921778A1 (en) * 2019-02-06 2021-12-15 Oxford University Innovation Limited Method and apparatus for quality prediction
JP7387340B2 (ja) * 2019-08-30 2023-11-28 株式会社 資生堂 生体構造識別装置、生体構造識別方法及び生体構造識別用コンピュータプログラム
CN110555836A (zh) * 2019-09-05 2019-12-10 李肯立 一种超声图像中胎儿标准切面的自动识别方法和***
EP3813016A1 (en) * 2019-10-25 2021-04-28 RaySearch Laboratories AB System and method for segmentation of images
CN112365504A (zh) * 2019-10-29 2021-02-12 杭州脉流科技有限公司 Ct左心室分割方法、装置、设备和存储介质
CN110874860B (zh) * 2019-11-21 2023-04-25 哈尔滨工业大学 基于混合损失函数的对称监督模型的目标提取方法
CN111028217A (zh) * 2019-12-10 2020-04-17 南京航空航天大学 一种基于全卷积神经网络的图像裂缝分割方法
CN111062963B (zh) * 2019-12-16 2024-03-26 上海联影医疗科技股份有限公司 一种血管提取方法、***、设备及存储介质
CN111340813B (zh) * 2020-02-25 2023-09-01 北京字节跳动网络技术有限公司 图像实例分割方法、装置、电子设备及存储介质
CN113362271B (zh) * 2020-03-06 2022-09-09 深圳睿心智能医疗科技有限公司 血管三维影像分割方法、装置、计算机设备和存储介质
CN111445478B (zh) * 2020-03-18 2023-09-08 吉林大学 一种用于cta图像的颅内动脉瘤区域自动检测***和检测方法
CN111815569B (zh) * 2020-06-15 2024-03-29 广州视源电子科技股份有限公司 基于深度学习的图像分割方法、装置、设备和存储介质
CN111754534B (zh) * 2020-07-01 2024-05-31 杭州脉流科技有限公司 基于深度神经网络的ct左心室短轴图像分割方法、装置、计算机设备和存储介质
WO2022087853A1 (zh) * 2020-10-27 2022-05-05 深圳市深光粟科技有限公司 一种图像分割方法、装置及计算机可读存储介质
CN112862837B (zh) * 2021-01-27 2023-06-23 南京信息工程大学 一种基于卷积神经网络的图像处理方法和***
CN113223704B (zh) * 2021-05-20 2022-07-26 吉林大学 基于深度学习的计算机断层扫描主动脉瘤的辅助诊断方法
CN113298830B (zh) * 2021-06-22 2022-07-15 西南大学 一种基于自监督的急性颅内ich区域图像分割方法
US11992274B2 (en) 2021-07-08 2024-05-28 Medtronic Navigation, Inc. Systems and methods for automatic oblique lateral interbody fusion (OLIF) corridor planning
CN114663651B (zh) * 2022-03-24 2023-01-24 北京安德医智科技有限公司 一种根据颅内cta图像识别血管闭塞状态的方法和装置
CN114842004B (zh) * 2022-07-04 2022-10-21 真健康(北京)医疗科技有限公司 基于神经网络模型的穿刺位置验证方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170109881A1 (en) * 2015-10-14 2017-04-20 The Regents Of The University Of California Automated segmentation of organ chambers using deep learning methods from medical imaging
WO2017091833A1 (en) * 2015-11-29 2017-06-01 Arterys Inc. Automated cardiac volume segmentation
CN107203989A (zh) * 2017-04-01 2017-09-26 南京邮电大学 基于全卷积神经网络的端对端胸部ct图像分割方法
WO2018009405A1 (en) * 2016-07-08 2018-01-11 Avent, Inc. System and method for automatic detection, localization, and semantic segmentation of anatomical objects

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5903664A (en) 1996-11-01 1999-05-11 General Electric Company Fast segmentation of cardiac images
US7809190B2 (en) 2006-04-27 2010-10-05 Siemens Medical Solutions Usa, Inc. General framework for image segmentation using ordered spatial dependency
US7916919B2 (en) 2006-09-28 2011-03-29 Siemens Medical Solutions Usa, Inc. System and method for segmenting chambers of a heart in a three dimensional image
US8494236B2 (en) 2009-10-07 2013-07-23 Siemens Aktiengesellschaft System and method for cardiac segmentation in MR-cine data using inverse consistent non-rigid registration
US9262834B2 (en) 2012-07-30 2016-02-16 General Electric Company Systems and methods for performing segmentation and visualization of images
US9824456B2 (en) 2014-06-26 2017-11-21 The Governors Of The University Of Alberta Automatic segmentation of image frames in anatomical scan based on non-rigid registration with manually segmented frame
US10368956B2 (en) 2016-02-16 2019-08-06 The Johns Hopkins University MR-levelcheck-2: method for localization of structures in projection images
US9767557B1 (en) * 2016-06-23 2017-09-19 Siemens Healthcare Gmbh Method and system for vascular disease detection using recurrent neural networks
CN106897993B (zh) 2017-01-12 2019-07-26 华东师范大学 基于定量磁化率成像人脑灰质核团概率图谱的构建方法
CN109493347B (zh) * 2017-09-12 2021-03-23 深圳科亚医疗科技有限公司 在图像中对稀疏分布的对象进行分割的方法和***
CN110249365B (zh) * 2017-11-10 2023-05-30 上海联影医疗科技股份有限公司 用于图像重建的***和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170109881A1 (en) * 2015-10-14 2017-04-20 The Regents Of The University Of California Automated segmentation of organ chambers using deep learning methods from medical imaging
WO2017091833A1 (en) * 2015-11-29 2017-06-01 Arterys Inc. Automated cardiac volume segmentation
WO2018009405A1 (en) * 2016-07-08 2018-01-11 Avent, Inc. System and method for automatic detection, localization, and semantic segmentation of anatomical objects
CN107203989A (zh) * 2017-04-01 2017-09-26 南京邮电大学 基于全卷积神经网络的端对端胸部ct图像分割方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MAJD ZREIK, 外7名: ""Deep learning analysis of the myocardium in coronary CT angiography for identification of patients", COMPUTER VISION AND PATTERN RECOGNITION, JPN7022002934, 6 December 2017 (2017-12-06), pages 1 - 13, ISSN: 0004812867 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023157439A1 (ja) * 2022-02-18 2023-08-24 富士フイルム株式会社 画像処理装置及びその作動方法、推論装置並びに学習装置

Also Published As

Publication number Publication date
GB2583682B (en) 2021-03-10
GB2583682A (en) 2020-11-04
JP7102531B2 (ja) 2022-07-19
GB202012077D0 (en) 2020-09-16
CN111557020B (zh) 2023-12-05
US10896508B2 (en) 2021-01-19
WO2019155306A1 (en) 2019-08-15
DE112019000708T5 (de) 2020-11-05
US20190244357A1 (en) 2019-08-08
CN111557020A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
JP7102531B2 (ja) コンピュータ断層撮影血管造影における解剖学的構造のセグメンテーションのための方法、コンピュータ・プログラム、コンピュータ可読記憶媒体、および装置
JP7383010B2 (ja) 医用画像認識方法及びシステム、並びに、モデルトレーニング方法、コンピュータ装置、及びプログラム
US10706333B2 (en) Medical image analysis method, medical image analysis system and storage medium
Tang et al. Construction and verification of retinal vessel segmentation algorithm for color fundus image under BP neural network model
US9968257B1 (en) Volumetric quantification of cardiovascular structures from medical imaging
CN110475505B (zh) 利用全卷积网络的自动分割
Khan et al. Deep neural architectures for medical image semantic segmentation
JP6993334B2 (ja) 自動化された心臓ボリュームセグメンテーション
US20210249142A1 (en) Simulating abnormalities in medical images with generative adversarial networks
Jafari et al. Automatic biplane left ventricular ejection fraction estimation with mobile point-of-care ultrasound using multi-task learning and adversarial training
Habijan et al. Whole heart segmentation from CT images using 3D U-net architecture
US20220012890A1 (en) Model-Based Deep Learning for Globally Optimal Surface Segmentation
JP7346553B2 (ja) 深層学習を使用する3dデータセット内のオブジェクトの成長率の決定
WO2022193750A1 (zh) 一种基于深度学习的乳腺图像配准方法
Sharan et al. Encoder modified U-net and feature pyramid network for multi-class segmentation of cardiac magnetic resonance images
Yang et al. A deep learning segmentation approach in free‐breathing real‐time cardiac magnetic resonance imaging
Qian et al. Breast cancer diagnosis using evolving deep convolutional neural network based on hybrid extreme learning machine technique and improved chimp optimization algorithm
CN110570394A (zh) 医学图像分割方法、装置、设备及存储介质
Guo et al. Cardiac MRI left ventricle segmentation and quantification: A framework combining U-Net and continuous max-flow
CN112164447B (zh) 图像处理方法、装置、设备及存储介质
Yuan et al. Pulmonary arteries segmentation from CT images using PA‐Net with attention module and contour loss
Yao et al. Graph matching and deep neural networks based whole heart and great vessel segmentation in congenital heart disease
CN112750110A (zh) 基于神经网络对肺部病灶区进行评估的评估***和相关产品
JP7456928B2 (ja) 胸部x線画像の異常表示制御方法、異常表示制御プログラム、異常表示制御装置、及びサーバ装置
US11263481B1 (en) Automated contrast phase based medical image selection/exclusion

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210614

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210623

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220628

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220706

R150 Certificate of patent or registration of utility model

Ref document number: 7102531

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150