JP2022548453A - 画像分割方法及び装置、電子デバイス並びに記憶媒体 - Google Patents

画像分割方法及び装置、電子デバイス並びに記憶媒体 Download PDF

Info

Publication number
JP2022548453A
JP2022548453A JP2021576593A JP2021576593A JP2022548453A JP 2022548453 A JP2022548453 A JP 2022548453A JP 2021576593 A JP2021576593 A JP 2021576593A JP 2021576593 A JP2021576593 A JP 2021576593A JP 2022548453 A JP2022548453 A JP 2022548453A
Authority
JP
Japan
Prior art keywords
image
target object
pixels
segmented
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021576593A
Other languages
English (en)
Inventor
▲韓▼泓▲澤▼
▲劉▼星▲龍▼
黄▲寧▼
▲孫▼▲輝▼
▲張▼少霆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Sensetime Intelligent Technology Co Ltd
Original Assignee
Shanghai Sensetime Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN202010827077.1A external-priority patent/CN111899268B/zh
Application filed by Shanghai Sensetime Intelligent Technology Co Ltd filed Critical Shanghai Sensetime Intelligent Technology Co Ltd
Publication of JP2022548453A publication Critical patent/JP2022548453A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/94Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20036Morphological image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30028Colon; Small intestine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30092Stomach; Gastric

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

Figure 2022548453000001
本開示は、画像分割方法及び装置、電子デバイス並びに記憶媒体に関する。前記画像分割方法は、処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップと、を含む。

Description

(関連出願への相互参照)
本開示は、出願番号が202010827077.1で、出願日が2020年8月17日である中国特許に基づいて提案され、当該中国特許出願の優先権を主張し、当該中国特許の全ての内容がここで参照により本開示に組み込まれる。
本開示は、画像処理技術分野に関し、特に画像分割方法及び装置、電子デバイス並びに記憶媒体に関する。
画像分割とは、画像をいくつかの特定の、独特性質を持っている領域に分割し、関心のあるターゲットを提示する技術及びプロセスを指す。画像分割は、画像処理から画像分析までの重要なステップである。関連技術における画像分割方法は、主に、閾値に基づく分割方法、領域に基づく分割方法、エッジに基づく分割方法及び特定の理論に基づく分割方法などに分類される。
本開示は、画像分割方法及び装置、電子デバイス並びに記憶媒体を提供する。
本開示の一態様による画像分割方法は、
処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップと、を含む。
処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得し、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得することにより、より正確でロバストな分割結果を取得することができる。
1つの可能な実施形態では、前記初歩的分割画像において、予測された、前記ターゲットオブジェクトに属する画素の画素値は、第1の予め設定された値であり、予測された、前記ターゲットオブジェクトに属していない画素の画素値は、第2の予め設定された値であり、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップは、
前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得するステップと、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する前記第1の分割結果を取得するステップと、を含む。
当該実施形態では、前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得することにより、処理待ち画像に対応する第1の分割結果にターゲットオブジェクトの器官の内部をカバーさせ、例えば肺内などの肺実質部分、消化管(例えば胃腸管)の内部などをカバーさせることができる。即ち、上記実施形態を採用することにより、画像分割後にターゲットオブジェクトの内部(例えば人体内)に漏れた空洞を埋めることができる。前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得することにより、処理待ち画像内の背景部分(即ち、ターゲットオブジェクトに属していない部分)がターゲットオブジェクトに属するものに分割される確率を低減させることができる。
1つの可能な実施形態では、前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得するステップは、
前記初歩的分割画像の周辺に予め設定された幅の辺をスプライスし、スプライスされた初歩的分割画像を取得するステップであって、スプライスされた前記予め設定された幅の辺にある画素の画素値が前記第2の予め設定された値である、ステップと、
前記スプライスされた初歩的分割画像の画像エッジにある画素をシードポイントとして選択し、前記スプライスされた初歩的分割画像に対してフラッディング充填操作を行い、前記充填された初歩的分割画像を取得するステップと、を含む。
前記初歩的分割画像の周辺に予め設定された幅の辺をスプライスし、前記スプライスされた初歩的分割画像の画像エッジにある画素をシードポイントとして選択することにより、フラッディング充填操作が行われたシードポイントが背景部分(即ちターゲットオブジェクトに属していない部分)に属することを確保することができ、これにより、処理待ち画像に対応する第1の分割結果にターゲットオブジェクトの器官の内部をカバーさせることができ、さらにより正確な分割結果が得られる。
1つの可能な実施形態では、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する前記第1の分割結果を取得するステップは、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像における前記ターゲットオブジェクトのエッジに含まれる最大連通ドメインを確定するステップと、
前記充填された初歩的分割画像における前記最大連通ドメイン以外の画素の画素値を前記第2の予め設定された値に調整し、前記処理待ち画像に対応する前記第1の分割結果を取得するステップと、を含む。
当該実施形態により、ターゲットオブジェクトに接続されていない偽陽性領域を除去することができるため、背景部分がターゲットオブジェクトに属するものに誤って分けられる確率を大幅に下げることができ、それによって画像分割の精度を向上させることができる。例えば、ターゲットオブジェクトが人体である場合、この例により、人体に接続されていない偽陽性領域を除去することができ、これにより、背景部分(例えばベッドボードなど)が人体に属するものに誤って分けられる確率を大幅に下げることができる。
1つの可能な実施形態では、前記処理待ち画像に対応する第1の分割結果を取得するステップの後、前記画像分割方法は、
前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するステップと、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップと、をさらに含む。
当該実施形態により、処理待ち画像と第2の分割結果の連続性を確保することができ、それによってよりスムーズでより正確な3次元分割結果を得ることに役立つ。例えば、前記ターゲットオブジェクトが人体である場合、処理待ち画像と隣接する画像における人体との連続性を確保することができ、それによってよりスムーズでより正確な3次元人体分割結果を得ることに役立つ。例えば、当該実施形態を採用してCT画像シーケンスにおける各CT画像に対応する分割結果を取得することができ、これにより、よりスムーズでより正確な3次元人体分割結果を得る。
1つの可能な実施形態では、前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップは、
前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する前記第3の分割結果を取得するステップを含む。
前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得することにより、前記隣接する画像における前記処理待ち画像に比較的関連する画素に対応する分割結果に基づいて、前記処理待ち画像に対応する第1の分割結果を調整することができ、これにより、前記処理待ち画像に対応する最終分割結果の精度の向上に役立つ。
1つの可能な実施形態では、前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する前記第3の分割結果を取得するステップは、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された画素に基づいて、第1の画素セットを取得するステップと、
前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得するステップと、
前記第1の分割結果における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する前記第3の分割結果を取得するステップと、を含む。
前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得し、前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得し、前記第1の分割結果における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する第3の分割結果を取得することにより、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像に比較的に関連する画素に基づいて、前記処理待ち画像に対応する第1の分割結果を調整することができ、それによって前記処理待ち画像に対応する最終分割結果の精度の向上に役立つ。
1つの可能な実施形態では、
処理待ち画像におけるターゲットオブジェクトに属する画素を予測するステップの前に、前記画像分割方法は、トレーニング画像と前記トレーニング画像のラベル付きデータに基づいてニューラルネットワークをトレーニングするステップであって、前記トレーニング画像のラベル付きデータには、前記トレーニング画像における前記ターゲットオブジェクトに属する画素の真の値が含まれる、ステップをさらに含み、
処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップは、前記処理待ち画像を前記ニューラルネットワークに入力し、前記ニューラルネットワークによって前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報を予測するステップと、前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報に基づいて、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、を含む。
当該実施形態では、前記ニューラルネットワークによって前記処理待ち画像におけるターゲットオブジェクトに属する部分を予測する。例えば、前記待ち処理画像がCT画像であり、前記ターゲットオブジェクトが人体である場合、当該実施形態は、CT画像における様々なベッドボードを除去し、即ち、人体以外の部分に注目せず、CT画像における人体部分に重点を置くという分割が考慮されないため、大量の異形ベッドボードデータでの分割結果の精度及びロバスト性を確保することができる。即ち、処理待ち画像に異形ベッドボードが含まれている場合でも、当該実施形態を採用すると正確でロバストな分割結果を得ることができる。
1つの可能な実施形態では、
前記トレーニング画像は、コンピュータ断層撮影(CT)画像であり、
トレーニング画像と前記トレーニング画像のラベル付きデータに基づいてニューラルネットワークをトレーニングするステップは、予め設定されたCT値範囲に応じて、前記トレーニング画像の画素値を正規化し、正規化されたトレーニング画像を取得するステップと、前記正規化されたトレーニング画像と前記トレーニング画像のラベル付きデータに基づいて前記ニューラルネットワークをトレーニングするステップと、を含む。
当該実施形態では、予め設定されたCT値範囲に応じて、前記トレーニング画像の画素値を正規化し、正規化されたトレーニング画像を取得し、前記正規化されたトレーニング画像と前記トレーニング画像のラベル付きデータに基づいて前記ニューラルネットワークをトレーニングすることにより、前記ニューラルネットワークの計算量を減らし、前記ニューラルネットワークの収束速度を向上させることに役立つ。
本開示の一態様による画像分割方法は、
処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、
前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するステップと、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップと、を含む。
1つの可能な実施形態では、前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップは、
前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する前記第4の分割結果を取得するステップを含む。
1つの可能な実施形態では、前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップは、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得するステップと、
前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得するステップと、
前記初歩的分割画像における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップと、を含む。
本開示の一態様による画像分割装置は、
処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するように構成される第1の分割部と、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するように構成される第1の調整部と、を備える。
1つの可能な実施形態では、前記初歩的分割画像において、予測された、前記ターゲットオブジェクトに属する画素の画素値は、第1の予め設定された値であり、予測された、前記ターゲットオブジェクトに属していない画素の画素値は、第2の予め設定された値であり、
前記第1の調整モジュールは、
前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得し、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するように構成される。
1つの可能な実施形態では、前記第1の調整モジュールは、
前記初歩的分割画像の周辺に予め設定された幅の辺をスプライスし、スプライスされた初歩的分割画像を取得し、スプライスされた前記予め設定された幅の辺にある画素の画素値が前記第2の予め設定された値であり、
前記スプライスされた初歩的分割画像の画像エッジにある画素をシードポイントとして選択し、前記スプライスされた初歩的分割画像に対してフラッディング充填操作を行い、充填された初歩的分割画像を取得するように構成される。
1つの可能な実施形態では、前記第1の調整モジュールは、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像における前記ターゲットオブジェクトのエッジに含まれる最大連通ドメインを確定し、
前記充填された初歩的分割画像における前記最大連通ドメイン以外の画素の画素値を前記第2の予め設定された値に調整し、前記処理待ち画像に対応する第1の分割結果を取得するように構成される。
1つの可能な実施形態では、前記画像分割装置は、
前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するように構成される第2の取得モジュールと、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するように構成される第3の調整モジュールと、をさらに備える。
1つの可能な実施形態では、前記第3の調整モジュールは、
前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するように構成される。
1つの可能な実施形態では、前記第3の調整モジュールは、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得し、
前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得し、
前記第1の分割結果における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する第3の分割結果を取得するように構成される。
1つの可能な実施形態では、
前記画像分割装置は、トレーニング画像と前記トレーニング画像のラベル付きデータに基づいてニューラルネットワークをトレーニングするように構成されるトレーニングモジュールであって、前記トレーニング画像のラベル付きデータには、前記トレーニング画像における前記ターゲットオブジェクトに属する画素の真の値が含まれる、トレーニングモジュールをさらに備え、
前記第1の分割モジュールは、処理待ち画像を前記ニューラルネットワークに入力し、前記ニューラルネットワークによって前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報を予測し、前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報に基づいて、前記処理待ち画像に対応する初歩的分割画像を取得するように構成される。
1つの可能な実施形態では、
前記トレーニング画像は、コンピュータ断層撮影(CT)画像であり、
前記トレーニングモジュールは、予め設定されたCT値範囲に応じて、前記トレーニング画像の画素値を正規化し、正規化されたトレーニング画像を取得し、前記正規化されたトレーニング画像と前記トレーニング画像のラベル付きデータに基づいて前記ニューラルネットワークをトレーニングするように構成される。
本開示の一態様による画像分割装置は、
処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するように構成される第2の分割部と、
前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するように構成される第1の取得部と、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するように構成される第2の調整部と、を備える。
1つの可能な実施形態では、前記第2の調整モジュールは、
前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するように構成される。
1つの可能な実施形態では、前記第2の調整モジュールは、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得し、
前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得し、
前記初歩的分割画像における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する第4の分割結果を取得するように構成される。
本開示の一態様による電子デバイスは、1つ又は複数のプロセッサと、実行可能な命令を記憶するメモリと、を備え、前記1つ又は複数のプロセッサは、前記メモリに記憶された実行可能な命令を呼び出して、上記画像分割方法を実行する。
本開示の一態様によるコンピュータ可読記憶媒体は、プロセッサに上記方法を実行させるためのコンピュータプログラム命令を記憶している。
本開示の実施例では、処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得し、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得することにより、より正確でロバストな分割結果を取得することができる。
本開示の一態様によるコンピュータプログラムは、電子デバイスで実行される場合、前記電子デバイス内のプロセッサに、上記画像分割方法を実行させるためのコンピュータ可読コードを含む。
以上の一般的な説明及び以下の詳細な説明が例示的及び解釈的なものだけであり、本開示を制限するものではないことを理解すべきである。
以下の図面に基づく例示的な実施例への詳細な説明によれば、本開示の他の特徴及び態様は明らかになる。
本開示の実施例による画像分割方法の適用シーンを示す概略図1である。 本開示の実施例による画像分割方法の適用シーンを示す概略図2である。 本開示の実施例による画像分割方法を示すフローチャートである。 本開示の実施例によるU型畳み込みニューラルネットワークを示す概略図である。 本開示の実施例による初歩的分割画像の周辺に予め設定された幅の辺をスプライスし、スプライスされた初歩的分割画像を取得することを示す概略図である。 本開示の別の実施例による画像分割方法を示すフローチャートである。 本開示の実施例による画像分割装置を示すブロック図である。 本開示の実施例による画像分割装置を示す別のブロック図である。 本開示の実施例による電子デバイス800を示すブロック図である。 本開示の実施例による電子デバイス1900を示すブロック図である。
ここでの添付図面は、本明細書に組み込まれて本明細書の一部を構成し、これらの図面は、本開示に一致する実施例を示しており、明細書と共に本開示の技術的解決案を解釈するために使用される。
以下に図面を参照しながら本開示の各種の例示的な実施例、特徴及び態様を詳しく説明する。図面における同じ符号は、機能が同じ又は類似する素子を表す。図面に実施例の様々な態様が示されているが、特に断りのない限り、図面は必ずしも一定の縮尺で描かれているわけではない。
ここで専門用語「例示的」は、「例、実施例又は説明的として機能する」を意味する。ここで「例示的」として説明されるいかなる実施例は、必ずしも他の実施例よりも優れ又は良いものと解釈されるべきではない。
本明細書では「及び/又は」という用語は、関連付けられたオブジェクトの関連関係を説明するためのものだけであり、3種類の関係が存在できることを示し、例えば、A及び/又はBは、Aが単独で存在すること、A及びBが同時に存在すること、Bが単独で存在することの3つの状況を示すことができる。また、本明細書では「少なくとも1種類」という用語は、複数種類のうちの任意の1種類又は複数種類のうちの少なくとも2種類の任意の組み合わせを示し、例えば、A、B、Cのうちの少なくとも1種類を含むことは、A、BとCからなるセットから選択された任意の1つ又は複数の要素を含むことを示すことができる。
また、本開示をより良く説明するために、以下の具体的な実施形態において多くの詳細が示されている。当業者は、いくつかの詳細がなくても、本開示が同様に実施できることを理解すべきである。いくつかの実施例では、本開示の要旨を明らかにするように、当業者がよく知っている方法、手段、素子及び回路が詳細に説明されていない。
人体に対してコンピュータ断層撮影(CT:Computed Tomography)を行うプロセスは、CT機器のベッドボードは、スキャンされたCT画像シーケンスにおけるアーティファクトになる。このアーティファクトは、コンピュータ支援ソフトウェアによる人体の3次元可視化(即ち、CT画像シーケンスから3次元人体モデルを得る)及び後の処理プロセスにおいて、大きな干渉を引き起こす。これは、様々な形状のベッドボードが3次元可視化するときに人体を遮り、人体内の器官が分割されると、人体の外部にあるいくつかの異形ベッドボードが偽陽性として識別される可能性があるためである。
関連技術では、CT画像に対して人体分割を行う場合、主に閾値及び形態学的操作によってCT画像におけるベッドボードを除去し、CT画像における人体部分を保持する。通常、ベッドボードの形状、CT画像におけるベッドボードのCT値、CT画像におけるベッドボードのCT値の均一性は、人体と大きく異なり、閾値及び形態学操作の方法により除去されてもよい。しかしながら、いくつかの異常な状況では、関連技術により、正確な分割結果を取得することができない。例えば、人体に密着した曲面皮質ベッドボードは、CT画像において、人体に密着しており、境界がはっきりせず、CT値も比較的近く、人体から分離しにくい。また、例えば、ベッドボードの両側にバッフルがあり、人体の腕がバッフルの外側に置き、バッフルが体の両側に挟まれ、この場合、関連技術によりCT画像からベッドボードを分割することも困難である。ここで、CT値は、人体のある局部組織又は器官の密度を測定するための計算単位であり、ハウンズフィールド単位(HU:Hounsfield Unit)とも呼ばれる。
上記のような技術的問題を解決するために、本開示の実施例は、処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得し、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得することにより、より正確でロバストな分割結果を取得することができる画像分割方法及び装置、電子デバイス並びに記憶媒体を提供する。
前記画像分割方法の実行本体は、画像分割装置であってもよい。例えば、前記画像分割方法は、端末デバイス又はサーバー又は他の処理デバイスによって実行されてもよい。ここで、端末デバイスは、ユーザデバイス(UE:User Equipment)、モバイルデバイス、ユーザ端末、端末、セルラー電話、コードレス電話、パーソナルデジタルアシスタント(PDA:Personal Digital Assistant)、ハンドヘルドデバイス、コンピューティングデバイス、車載デバイス又はウェアラブルデバイスなどであってもよい。いくつかの可能な実施形態では、前記画像分割方法は、プロセッサがメモリに記憶されたコンピュータ可読命令を呼び出すことで実現されてもよい。
以下、本開示の実施例による画像分割方法の適用シーンを説明する。
1つの可能な実施形態では、図1-1に示す画像分割方法の適用シーンを示す概略図1を参照すると、画像分割装置10は、処理装置11及び画像収集装置12を含むことができ、このように、画像分割装置11は、画像収集装置12によって分割待ち画像を収集し、処理装置12によって分割待ち画像を分割して第1の分割結果を得ることができる。例えば、画像分割装置は、CTマシンとして実施されてもよく、CTスキャナによって分割待ちCT画像を収集し、収集された分割待ちCT画像に対して画像分割処理を行う。
別の可能な実施形態では、図1-2に示す画像分割方法の適用シーンを示す概略図2を参照すると、画像分割装置10は、ネットワーク14を介して他のデバイス13によって伝送されたリアルタイムに収集された分割待ち画像を受信することができ、このように、画像分割装置10は、受信された分割待ち画像に対して、分割処理を行って第1の分割結果を得ることができる。例えば、画像分割装置は、スマートフォンとして実施されてもよく、スマートフォンは、ネットワークを介して、CTマシンによって送信された分割待ちCT画像を収集することができ、このように、スマートフォンは、受信された分割待ちCT画像に対して画像分割処理を行うことができる。
上記適用シーンに基づいて、本開示の実施例による画像分割方法が説明され、図1は本開示の実施例による画像分割方法のフローチャートを示す。図2に示すように、前記画像分割方法は、ステップS11とステップS12を含む。
ステップS11において、処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得する。
本開示の実施例では、処理待ち画像は、画像分割を行う必要がある画像を表すことができる。前記処理待ち画像は、2次元画像であってもよいし、3次元画像であってもよい。いくつかの可能な実施形態では、前記処理待ち画像は、医用画像であってもよい。例えば、前記処理待ち画像は、CT画像、MRI(Magnetic Resonance Imaging:磁気共鳴イメージング)画像などであってもよい。当然、前記処理待ち画像は、医用画像以外の画像分割を必要とするいかなる画像であってもよい。
本開示の実施例では、ターゲット画像は、分割を必要とするオブジェクトを表すことができる。例えば、ターゲットオブジェクトは、人体、動物体、人体の器官、動物体の器官等であってもよい。
本開示の実施例では、処理待ち画像における各画素がターゲットオブジェクトに属するか否かを予測することができる。例えば、処理待ち画像における各画素がターゲットオブジェクトに属する確率を予測することができる。処理待ち画像における任意の画素について、当該画素がターゲットオブジェクトに属する確率が予め設定された閾値以上である場合、当該画素は、ターゲットオブジェクトに属すると判定されてもよく、当該画素がターゲットオブジェクトに属する確率が予め設定された閾値未満である場合、当該画素は、ターゲット画素に属していないと判定されてもよい。例えば、予め設定された閾値は、0.5であってもよい。
本開示の実施例では、予測された、処理待ち画像におけるターゲットオブジェクトに属する画素に基づいて、処理待ち画像に対応する二値化された初歩的分割画像を取得することができる。ここで、初歩的分割画像のサイズは、処理待ち画像のサイズと同じであってもよい。例えば、処理待ち画像の高さをHとし、幅をWとすると、初歩的分割画像の高さもHであり、幅もWである。1つの可能な実施形態では、前記初歩的分割画像において、予測された、前記ターゲットオブジェクトに属する画素の画素値は、第1の予め設定された値であり、予測された、前記ターゲットオブジェクトに属していない画素の画素値は、第2の予め設定された値であり、第1の予め設定された値は、第2の予め設定された値に等しくない。例えば、処理待ち画像内の任意の画素について、当該画素がターゲットオブジェクトに属すると予測される場合、初歩的分割画像における当該画素の画素値は、第1の予め設定された値であり、当該画素がターゲットオブジェクトに属していないと予測される場合、初歩的分割画像における当該画素の画素値は、第2の予め設定された値である。例えば、第1の予め設定された値が1であり、第2の予め設定された値が0であり、即ち、初歩的分割画像における予測された、ターゲットオブジェクトに属する画素の画素値は1であり、予測された、ターゲットオブジェクトに属していない画素値は0である。本開示の実施例では、第1の予め設定された値と第2の予め設定された値は限定されなく、第1の予め設定された値と第2の予め設定された値は異なればよい。また、例えば、第1の予め設定された値は0であってもよく、第2の予め設定された値は255であってもよい。
1つの可能な実施形態では、処理待ち画像におけるターゲットオブジェクトに属する画素を予測するステップの前に、前記画像分割方法は、トレーニング画像と前記トレーニング画像のラベル付きデータに基づいてニューラルネットワークをトレーニングするステップであって、前記トレーニング画像のラベル付きデータには、前記トレーニング画像における前記ターゲットオブジェクトに属する画素の真の値が含まれる、ステップをさらに含み、前記処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップは、処理待ち画像を前記ニューラルネットワークに入力し、前記ニューラルネットワークによって前記処理待ち画像におけるターゲットオブジェクトに属する画素の情報を予測するステップと、前記処理待ち画像におけるターゲットオブジェクトに属する画素の情報に基づいて、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、を含む。
当該実施形態の一例として、前記トレーニング画像のラベル付きデータは、前記トレーニング画像に対応するマスクを含むことができ、前記トレーニング画像に対応するマスクのサイズは、前記トレーニング画像のサイズと同じであってもよい。前記トレーニング画像における任意の画素の真の値がターゲットオブジェクトに属するものである場合、前記トレーニング画像に対応するマスクでは、当該画素の画素値は、第1の予め設定された値であってもよく、例えば、第1の予め設定された値は1であってもよく、前記トレーニング画像では、当該画素の真の値がターゲットオブジェクトに属していないものである場合、前記トレーニング画像に対応するマスクでは、当該画素の画素値は、第2の予め設定された値であってもよく、例えば、第2の予め設定された値は0であってもよい。当然、前記トレーニング画像のラベル付きデータは、マスクで表されることに限定されない。例えば、前記トレーニング画像のラベル付きデータは、マトリックス、テーブルなどの方式で表されても良い。
当該実施形態では、前記トレーニング画像を前記ニューラルネットワークに入力し、前記ニューラルネットワークを介して前記トレーニング画像の予測分割結果を出力することができ、前記トレーニング画像の予測分割結果は、前記トレーニング画像における各画素がターゲットオブジェクトに属する確率を含むことができ、前記トレーニング画像のラベル付きデータ、及び前記トレーニング画像の予測分割結果に基づいて、前記トレーニング画像に対応する損失関数の値を取得し、前記トレーニング画像に対応する損失関数の値に基づいて、前記ニューラルネットワークをトレーニングする。
当該実施形態の一例として、前記ニューラルネットワークによって取得されたトレーニング画像の予測分割結果、及び前記トレーニング画像のラベル付きデータに基づいて、ダイス(Dice)損失関数の値を取得することができる。例えば、前記ニューラルネットワークによって取得されたトレーニング画像の予測分割結果はPであり、前記トレーニング画像のラベル付きデータはMであり、ダイス損失関数の値
Figure 2022548453000002
である。他の例では、クロスエントロピー損失関数などの損失関数も使用することができる。
当該実施形態の一例として、前記損失関数の値を逆導出によって層ごとにニューラルネットワークの各パラメータに渡すことができ、適応行列推定(Adam:Adaptive moment estimation)(例えば、学習率が0.0003である)、確率的勾配降下(SGD:Stochastic Gradient Descent)などのオプティマイザーによってニューラルネットワークのパラメータを更新することができる。
当該実施形態の一例として、前記ニューラルネットワークによって予測された前記処理待ち画像におけるターゲットオブジェクトに属する画素の情報は、前記処理待ち画像における各画素がターゲットオブジェクトに属する確率を含むことができる。この例では、前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報に基づいて、前記処理待ち画像に対応する初歩的分割画像を取得するステップは、任意の画素について、処理待ち画像における当該画素がターゲットオブジェクトに属する確率が予め設定された閾値以上である場合、前記処理待ち画像に対応する初歩的分割画像における当該画素の画素値が第1の予め設定された値となるステップと、前記処理待ち画像における当該画素がターゲットオブジェクトに属する確率が予め設定された閾値未満である場合、前記処理待ち画像に対応する初歩的分割画像における当該画素の画素値が第2の予め設定された値となるステップと、を含むことができる。
当該実施形態の別の例として、前記ニューラルネットワークによって予測された前記処理待ち画像におけるターゲットオブジェクトに属する画素の情報は、処理待ち画像におけるターゲットオブジェクトに属する画素の位置情報を含むことができる。この例では、前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報に基づいて、前記処理待ち画像に対応する初歩的分割画像を取得するステップは、任意の画素について、前記処理待ち画像におけるターゲットオブジェクトに属する画素の位置情報が当該画素の位置を含む場合、前記処理待ち画像に対応する初歩的分割画像における当該画素の画素値が第1の予め設定された値となるステップと、前記処理待ち画像におけるターゲットオブジェクトに属する画素の位置情報が当該画素の位置を含めない場合、前記処理待ち画像に対応する初歩的分割画像における当該画素の画素値が第2の予め設定された値となるステップと、を含むことができる。
当該実施形態では、前記ニューラルネットワークによって前記処理待ち画像におけるターゲットオブジェクトに属する部分を予測する。例えば、前記待ち処理画像がCT画像であり、前記ターゲットオブジェクトが人体である場合、当該実施形態は、CT画像における様々なベッドボードを除去し、即ち、人体以外の部分に注目せず、CT画像における人体部分に重点を置くという分割が考慮されないため、大量の異形ベッドボードデータでの分割結果の精度及びロバスト性を確保することができる。即ち、処理待ち画像に異形ベッドボードが含まれている場合でも、当該実施形態を採用すると正確でロバストな分割結果を得ることができる。
当該実施形態の一例として、前記ニューラルネットワークは、深層学習に基づくニューラルネットワークであってもよい。例えば、前記ニューラルネットワークは、U型畳み込みニューラルネットワークであってもよい。図3は本開示の実施例によるU型畳み込みニューラルネットワークを示す概略図である。図3では、データフローの方向は、左から右であり、U型畳み込みニューラルネットワークには圧縮プロセスと解凍プロセスが含まれる。図3に示すように、処理待ち画像を512×512のサイズにトリミング又はズームした後、前記U型畳み込みニューラルネットワークに入力し、U型畳み込みニューラルネットワークによって処理待ち画像内の人体部分をフィッティングさせ、最後に初歩的分割画像を出力することができる。図3に示す例では、処理待ち画像に対して「畳み込み-正規化-アクティブ化-プーリング」操作を4回実行することができ、畳み込むたびに画像のチャネルの数が倍になり、プーリングするときにサイズは、半分になり、画像のチャネル数は、32から256に増やし、画像サイズは、512×512から64×64に小さくなり、さらに「畳み込み-正規化-アクティブ化-プーリング」操作を4回実行し、画像を元のサイズに復元し、アップサンプリングする前に、前の圧縮プロセスでの同じサイズの特徴マップをマージする必要があり、かつ畳み込むたびにチャネル数が半分になり、マージについて結合(concatenate)操作を採用することができ、さらに一回の畳み込み及びアクティブ化操作により、画像のチャネル数を1に復元して画像を正規化する。ここで、「畳み込み-正規化-アクティブ化」は、残差ブロック(Residual Block)、深層畳み込みモジュール(Inception Block)、高密度ブロック(Dense Block)などに置き換えることができる。プーリングについては、最大プーリング又は平均プーリングを採用することができ、ステップサイズが2である畳み込み層で置き換えることもできる。
1つの例では、前記トレーニング画像は、2次元CT画像であり、前記ニューラルネットワークは、2次元畳み込みニューラルネットワークである。
当該実施形態の一例として、トレーニング画像を増幅させることができる。例えば、トレーニング画像を0.6~1.4倍にランダムにズームし、さらにズームされた画像の中央から512×512のサイズでトリミングして、異なるズームスケールでの同じサイズのトレーニング画像を取得することができる。それに応じて、トレーニング画像に対応するマスクについても同様の操作を行う。
当該実施形態の一例として、トレーニング画像をトレーニングセットと検証セットに分けることができる。例えば、トレーニング画像を4:1の比率でトレーニングセットと検証セットに分けることができる。
当該実施形態の一例として、前記ニューラルネットワークの検証セットにおける損失が0.03以下に低下するまで、トレーニング画像を使用して前記ニューラルネットワークを繰り返してトレーニングすることができる。
関連技術では形態学などの操作により画像を分割するため、大量のハイパーパラメータ、例えば二値化するときに選択された閾値、オン/オフ操作の回数、腐食/膨張するときに選択された構造物のサイズなどを導入する必要があり、人体の異なる部分(頭、胴体、手、ペダル)に対して、通常の分割を得るために、閾値を変更する必要がある。当該実施形態では、ニューラルネットワークによってトレーニング画像におけるターゲットオブジェクトを分割することにより、同類のタスクに広く適用することができ、スーパーパラメータを設定する必要がなく、そのため、ロバスト性が高い。
当該実施形態の一例として、前記トレーニング画像は、コンピュータ断層撮影(CT)画像であり、トレーニング画像と前記トレーニング画像のラベル付きデータに基づいてニューラルネットワークをトレーニングするステップは、予め設定されたCT値範囲に応じて、前記トレーニング画像の画素値を正規化し、正規化されたトレーニング画像を取得するステップと、前記正規化されたトレーニング画像と前記トレーニング画像のラベル付きデータに基づいて前記ニューラルネットワークをトレーニングするステップと、を含む。
1つの例では、ターゲットオブジェクトのCT値範囲に応じて、予め設定されたCT値範囲を確定することができる。例えば、ターゲットオブジェクトが人体である場合、人体の器官のCT値範囲に応じて、予め設定されたCT値範囲を[-500、1200]に設定することができる。
1つの例では、予め設定されたCT値範囲に応じて、前記トレーニング画像の画素値を正規化し、正規化されたトレーニング画像を取得するステップは、前記トレーニング画像内の任意の画素について、前記予め設定されたCT値の範囲に応じて、前記画素の画素値を前処理し、前記画素の前処理された画素値を取得するステップであって、前記画素の前処理された画素値が前記予め設定されたCT値範囲にあるステップと、第1の差と第2の差との比を前記画素の正規化された画素値として使用するステップであって、前記第1の差が前記画素の前処理された画素値と前記予め設定されたCT値範囲の下限値との差に等しく、前記第2の差が前記予め設定されたCT値範囲の上限値と前記画素の前処理された画素値との差に等しいステップと、を含む。例えば、前記画素の前処理された画素値がhであり、前記予め設定されたCT値範囲の下限値がhminであり、前記予め設定されたCT値範囲の上限値がhmaxである場合、前記画素の正規化された画素値は、
Figure 2022548453000003
に等しくすることができる。前記トレーニング画像における各画素の正規化された画素値に基づいて、正規化されたトレーニング画像を取得することができる。即ち、前記正規化されたトレーニング画像では、任意の画素の画素値は当該画素の正規化された画素値である。
ここで、前記トレーニング画像における任意の画素について、前記予め設定されたCT値範囲に応じて、前記画素の画素値を前処理し、前記画素の前処理された画素値を取得するステップは、トレーニング画像における任意の画素について、前記画素の画素値が前記予め設定されたCT値範囲の下限値よりも小さい場合、前記下限値を前記画素の前処理された画素値として使用することができるステップと、前記画素の画素値が前記予め設定されたCT値範囲の上限値よりも大きい場合、前記上限値を前記画素の前処理された画素値として使用することができるステップと、前記画素の画素値が前記予め設定されたCT値範囲内にある場合、前記画素の画素値を前記画素の前処理された画素値として使用することができるステップとを含む。例えば、予め設定されたCT値範囲は[-500、1200]であり、前記予め設定されたCT値範囲の下限値は-500であり、前記予め設定されたCT値範囲の上限値は1200である。トレーニング画像内のある画素の画素値が-505である場合、-500を当該画素の前処理された画素値として使用することができ、トレーニング画像内のある画素の画素値が1250である場合、12000を当該画素の前処理された画素値として使用することができ、トレーニング画像内のある画素の画素値が800である場合、800を当該画素の前処理された画素値として使用することができる。
この例では、予め設定されたCT値範囲に応じて、前記トレーニング画像の画素値を正規化し、正規化されたトレーニング画像を取得し、前記正規化されたトレーニング画像と前記トレーニング画像のラベル付きデータに基づいて前記ニューラルネットワークをトレーニングすることにより、前記ニューラルネットワークの計算量を減らし、前記ニューラルネットワークの収束速度を向上させることに役立つ。
ステップS12において、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得する。
本開示の実施例では、エッジ検出方法を使用して、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報を確定することができる。例えば、キャニー(Canny)アルゴリズム、ソーベル(Sobel)アルゴリズムなどのエッジ検出方法を使用して、処理待ち画像における前記ターゲットオブジェクトのエッジ情報を確定することができる。ここで、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報は、前記処理待ち画像における前記ターゲットオブジェクトのエッジに属する画素の位置情報を含むことができる。
1つの可能な実施形態では、前記第1の分割結果を前記処理待ち画像に対応する最終分割結果として使用することができる。
本開示の実施例では、処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得し、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得することにより、ターゲットオブジェクトが人体又は動物体である場合、ターゲットオブジェクトの器官の内部の画素をターゲットオブジェクトに属するものに分割することができ、それによってより正確かつロバストな分割結果を取得することができる。例えば、処理待ち画像は、CT画像であり、ターゲットオブジェクトは、人体であり、本開示の実施例によって提供される画像分割方法を使用してCT画像を分割すると、CT画像内の人体部分を正確に分割し、CT画像内の人体外の干渉物(例えば、ベッドボード、ベンチレータのパイプライン、頭部の固定装置など)を正確に除去することができる。
1つの可能な実施形態では、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップは、前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得するステップと、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップと、を含む。
いくつかの器官の内部(例えば肺の内部、消化管の内部)には低密度の空気が含まれており、ターゲットオブジェクト(例えば人体)の外部も空気であるため、初歩的分割画像では、これらの器官の内部は、背景部分に属するものに分割される可能性がある。当該実施形態では、前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得することにより、処理待ち画像に対応する第1の分割結果にターゲットオブジェクトの器官の内部をカバーさせ、例えば肺内などの肺実質部分、消化管(例えば胃腸管)の内部などをカバーさせることができる。即ち、上記実施形態を採用することにより、画像分割後にターゲットオブジェクトの内部(例えば人体内)に漏れた空洞を埋めることができる。前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得することにより、処理待ち画像内の背景部分(即ちターゲットオブジェクトに属していない部分)がターゲットオブジェクトに属するものに分割される確率を低減させることができる。
当該実施形態の一例として、前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得するステップは、前記初歩的分割画像の周辺に予め設定された幅の辺をスプライスし、スプライスされた初歩的分割画像を取得するステップであって、スプライスされた予め設定された幅の辺にある画素の画素値が前記第2の予め設定された値である、ステップと、前記スプライスされた初歩的分割画像の画像エッジにある画素をシードポイントとして選択し、前記スプライスされた初歩的分割画像に対してフラッディング充填操作を行い、充填された初歩的分割画像を取得するステップと、を含む。
この例では、予め設定された幅は1画素以上であってもよい。例えば、予め設定された幅は1画素であってもよい。図4は初歩的分割画像の周辺に予め設定された幅の辺をスプライスし、スプライスされた初歩的分割画像を取得することを示す概略図である。図4に示す例では、予め設定された幅は1画素である。図4に示すように、初歩的分割画像の周辺に予め設定された幅の辺をスプライスすることができる。他の例では、初歩的分割画像の1辺、2辺又は3辺に予め設定された幅の辺をスプライスすることもできる。
この例では、前記スプライスされた初歩的分割画像の画像エッジにある画素は、前記スプライスされた初歩的分割画像の位置上のエッジの画素、例えば前記スプライスされた初歩的分割画像の最上側の画素、最下側の画素、最左側の画素、最右側の画素などを指すことができる。例えば、前記スプライスされた初歩的分割画像の左上隅の画素は、シードポイントとして使用されてもよい。
この例では、前記初歩的分割画像の周辺に予め設定された幅の辺をスプライスし、前記スプライスされた初歩的分割画像の画像エッジにある画素をシードポイントとして選択することにより、フラッディング充填操作が行われたシードポイントが背景部分(即ちターゲットオブジェクトに属していない部分)に属することを確保することができ、これにより、処理待ち画像に対応する第1の分割結果にターゲットオブジェクトの器官の内部をカバーさせることができ、さらにより正確な分割結果が得られる。
当該実施形態の一例として、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップは、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像における前記ターゲットオブジェクトのエッジに含まれる最大連通ドメインを確定するステップと、前記充填された初歩的分割画像における前記最大連通ドメイン以外の画素の画素値を前記第2の予め設定された値に調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップと、を含む。この例では、ターゲットオブジェクトに接続されていない偽陽性領域を除去することができるため、背景部分がターゲットオブジェクトに属するものに誤って分けられる確率を大幅に下げることができ、それによって画像分割の精度を向上させることができる。例えば、ターゲットオブジェクトが人体である場合、この例により、人体に接続されていない偽陽性領域を除去することができ、これにより、背景部分(例えばベッドボードなど)が人体に属するものに誤って分けられる確率を大幅に下げることができる。
1つの可能な実施形態では、前記処理待ち画像に対応する第1の分割結果を取得するステップの後、前記画像分割方法は、前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するステップと、前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップと、をさらに含む。
当該実施形態では、前記処理待ち画像に隣接する画像は、前記処理待ち画像と同じ画像シーケンスに属し、かつ前記処理待ち画像に隣接する画像であってもよい。例えば、前記処理待ち画像はCT画像であり、前記隣接する画像は、前記処理待ち画像と同じCT画像シーケンスに属し、かつ前記処理待ち画像に隣接する画像であってもよい。前記第2の分割結果は、前記隣接する画像に対応する最終分割結果を指すことができる。
当該実施形態により、処理待ち画像と第2の分割結果との連続性を確保することができ、それによってよりスムーズでより正確な3次元分割結果を得ることに役立つ。例えば、前記ターゲットオブジェクトが人体である場合、処理待ち画像と隣接する画像における人体との連続性を確保することができ、それによってよりスムーズでより正確な3次元人体分割結果を得ることに役立つ。例えば、当該実施形態を採用してCT画像シーケンスにおける各CT画像に対応する分割結果を取得することができ、これにより、よりスムーズでより正確な3次元人体分割結果が得られる。
当該実施形態の一例として、前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップは、前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップを含む。
この例では、前記隣接する画像と前記処理待ち画像における同じ位置にある画素値の差は、隣接する画像と処理待ち画像における同じ位置にある正規化された画素値の差を指すことができる。例えば、第3の予め設定された値は0.1であってもよい。当然、隣接する画像と前記処理待ち画像における同じ位置にある元の画素値を比較することも可能である。
この例では、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得することにより、前記隣接する画像における前記処理待ち画像に比較的関連する画素に対応する分割結果に基づいて、前記処理待ち画像に対応する第1の分割結果を調整することができ、これにより、前記処理待ち画像に対応する最終分割結果の精度の向上に役立つ。ここで、前記隣接する画像の任意の画素に対応する分割結果とは、前記第2の分割結果において、当該画素がターゲットオブジェクトに属するか否かを指すことができる。
1つの例では、前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップは、前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得するステップと、前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得するステップと、前記第1の分割結果における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップと、を含む。
この例では、第1の画素セットにおけるいずれかの画素の前記処理待ち画像及び前記隣接する画像における画素値の差は、第3の予め設定された値以下である。第2の画素セットにおける任意の画素の前記処理待ち画像及び前記隣接する画像における画素値の差は、第3の予め設定された値以下であり、かつ前記第2の分割結果において前記ターゲットオブジェクトに属する。例えば、第1の分割結果がAであり、第1の画素セットがBであり、前記第2の分割結果がCである場合、第3の分割結果は、S=A∪(B∩C)であってもよい。
上記の例では、前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得し、前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得し、前記第1の分割結果における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する第3の分割結果を取得することにより、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像に比較的に関連する画素に基づいて、前記処理待ち画像に対応する第1の分割結果を調整することができ、それによって前記処理待ち画像に対応する最終分割結果の精度の向上に役立つ。
いくつかの可能な実施形態では、前記第3の分割結果を前記処理待ち画像に対応する最終分割結果として使用することができる。
図5は本開示の実施例による画像分割方法を示す別のフローチャートである。前記画像分割方法の実行本体は、画像分割装置であってもよい。例えば、前記画像分割方法は、端末デバイス又はサーバー又は他の処理デバイスによって実行されてもよい。ここで、端末デバイスは、ユーザデバイス、モバイルデバイス、ユーザ端末、端末、セルラー電話、コードレス電話、パーソナルデジタルアシスタント、ハンドヘルドデバイス、コンピューティングデバイス、車載デバイス又はウェアラブルデバイスなどであってもよい。いくつかの可能な実施形態では、前記画像分割方法は、プロセッサがメモリに記憶されたコンピュータ可読命令を呼び出すことで実現されてもよい。図5に示すように、前記画像分割方法は、ステップS41からステップS43を含む。
ステップS41において、処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得する。
ステップS42において、前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得する。
本開示の実施例では、前記処理待ち画像に隣接する画像は、前記処理待ち画像と同じ画像シーケンスに属し、かつ前記処理待ち画像に隣接する画像であってもよい。例えば、前記処理待ち画像はCT画像であり、前記隣接する画像は、前記処理待ち画像と同じCT画像シーケンスに属し、かつ前記処理待ち画像に隣接する画像であってもよい。前記第2の分割結果は、前記隣接する画像に対応する最終分割結果を指すことができる。
ステップS43において、前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、処理待ち画像に対応する第4の分割結果を取得する。
本開示の実施例では、処理待ち画像と第2の分割結果との連続性を確保することができ、それによってよりスムーズでより正確な3次元分割結果を得ることに役立つ。例えば、前記ターゲットオブジェクトが人体である場合、処理待ち画像と隣接する画像における人体との連続性を確保することができ、それによってよりスムーズでより正確な3次元人体分割結果を得ることに役立つ。例えば、本開示の実施例を採用してCT画像シーケンスにおける各CT画像に対応する分割結果を取得することができ、これにより、よりスムーズでより正確な3次元人体分割結果が得られる。
1つの可能な実施形態では、前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップは、前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップを含む。
この例では、前記隣接する画像と前記処理待ち画像における同じ位置にある画素値の差は、前記隣接する画像と前記処理待ち画像における同じ位置にある正規化された画素値の差を指すことができる。例えば、第3の予め設定された値は0.1であってもよい。当然、前記隣接する画像と前記処理待ち画像における同じ位置にある元の画素値を比較することも可能である。
当該実施形態では、前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得することにより、前記隣接する画像のうち、前記処理待ち画像に比較的関連する画素に対応する分割結果に基づいて、前記処理待ち画像に対応する初歩的分割画像を調整することができ、これにより、前記処理待ち画像に対応する最終分割結果の精度の向上に役立つ。ここで、前記隣接する画像の任意の画素に対応する分割結果とは、前記第2の分割結果において、当該画素がターゲットオブジェクトに属するか否かを指すことができる。
当該実施形態の一例として、前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップは、前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得するステップと、前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得するステップと、前記初期分割結画像における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップと、を含む。
この例では、第1の画素セットにおける任意の画素の前記処理待ち画像及び前記隣接する画像における画素値の差は、第3の予め設定された値以下である。第2の画素セットにおける任意の画素の前記処理待ち画像及び前記隣接する画像における画素値の差は、第3の予め設定された値以下であり、かつ前記第2の分割結果において前記ターゲットオブジェクトに属する。例えば、第1の分割結果がAであり、第1の画素セットがBであり、前記第2の分割結果がCである場合、第3の分割結果は、S=A∪(B∩C)であってもよい。
この例では、前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得し、前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得し、前記第1の分割結果における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する第3の分割結果を取得することにより、前記第2の分割結果における前記ターゲットオブジェクトに属し、前記処理待ち画像に比較的に関連する画素に基づいて、前記処理待ち画像に対応する第1の分割結果を調整することができ、それによって前記処理待ち画像に対応する最終分割結果の精度の向上に役立つ。
いくつかの可能な実施形態では、前記第4の分割結果を前記処理待ち画像に対応する最終分割結果として使用することができる。
1つの可能な実施形態では、前記処理待ち画像に対応する第4の分割結果を取得するステップの後、前記画像分割方法は、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記第4の分割結果において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第5の分割結果を取得するステップをさらに含む。
当該実施形態の一例として、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記第4の分割結果において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第5の分割結果を取得するステップは、前記第4の分割結果における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、前記第4の分割結果に対応する充填された初歩的分割画像を取得するステップと、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する第5の分割結果を取得するステップと、を含む。
一例では、前記第4の分割結果における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、前記第4の分割結果に対応する充填された初歩的分割画像を取得するステップは、前記第4の分割結果の周辺に予め設定された幅の辺をスプライスし、スプライスされた第4の分割結果を取得するステップであって、スプライスされた前記予め設定された幅の辺にある画素の画素値が前記第2の予め設定された値である、ステップと、前記スプライスされた第4の分割結果の画像エッジにある画素をシードポイントとして選択し、前記スプライスされた第4の分割結果に対してフラッディング充填操作を行い、前記第4の分割結果に対応する充填された初歩的分割画像を取得するステップと、を含む。
一例では、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記第4の分割結果において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第5の分割結果を取得するステップは、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像における前記ターゲットオブジェクトのエッジに含まれる最大連通ドメインを確定するステップと、前記充填された初歩的分割画像における前記最大連通ドメイン以外の画素の画素値を前記第2の予め設定された値に調整し、前記処理待ち画像に対応する第5の分割結果を取得するステップと、を含む。
ここで、「前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記第4の分割結果において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第5の分割結果を取得する」の具体的な実施形態は、上記の「前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得する」の具体的な実施形態と類似するため、ここでは説明を省略する。
1つの可能な実施形態では、前記第5の分割結果を前記処理待ち画像に対応する最終分割結果として使用することができる。
本開示で言及される各方法の実施例は、原理的論理に反することなく、いずれも互いに組み合わせられて、組み合わせた実施例を形成することができことが理解可能であり、紙幅に限定されるため、本開示で説明を省略する。当業者は、具体的な実施形態の上記方法において、各ステップの具体的な実行順序がその機能及び内部論理で確定されるべきであることを理解できる。
以下、1つの具体的な適用シーンによって本開示の実施例を説明する。
まず、トレーニング画像とトレーニング画像に対応するマスクを取得する。当該トレーニング画像は人体のCT画像であり、ここでは、人体のすべての組織や器官のCT値に基づいて、予め設定されたCT値範囲を[-500、1200]に設定することができ、これにより、人体のすべての組織や器官をカバーする。
予め設定されたCT値範囲に基づいて、トレーニング画像における任意の画素を前処理し、前処理された画素値を取得する。具体的には、トレーニング画像における任意の画素について、前記画素の画素値が前記予め設定されたCT値範囲の下限値未満である場合、前記下限値を前記画素の前処理された画素値として使用することができ、前記画素の画素値が前記予め設定されたCT値範囲の上限値よりも大きい場合、前記上限値を前記画素の前処理された画素値として使用することができ、前記画素の画素値が前記予め設定されたCT値範囲内にある場合、前記画素の画素値を前記画素の前処理された画素値として使用することができ、例えば、トレーニング画像におけるある画素の画素値が-505である場合、-500を当該画素の前処理された画素値として使用することができ、トレーニング画像におけるある画素の画素値が1250である場合、12000を当該画素の前処理された画素値として使用することができ、トレーニング画像内のある画素の画素値が800である場合、800を画素の前処理された画素値として使用することができる。
次に、予め設定されたCT値範囲に応じて、前記トレーニング画像の任意の画素の画素値を正規化し、正規化されたトレーニング画像を取得する。ここで、式(1)を使用してトレーニング画像の任意の画素の画素値を正規化することができる。
Figure 2022548453000004
ここで、hは、前記画素の前処理された画素値であり、hminは、前記予め設定されたCT値範囲の下限値であり、hmaxは、前記予め設定されたCT値範囲の上限値である。このように、トレーニング画像の各画素に対して上記の処理を行うことにより、正規化されたトレーニング画像を取得することができる。
ここで、正規化されたトレーニング画像を増幅させることができる。例えば、正規化されたトレーニング画像を0.6~1.4倍にランダムにズームし、さらにズームされた画像の中央から512×512のサイズでトリミングして、異なるズームスケールでの同じサイズのトレーニング画像を取得することができる。それに応じて、トレーニング画像に対応するマスクについても同様の操作を行う。
さらに、正規化処理及び増幅されたトレーニング画像をトレーニングセットと検証セットに分けることができる。例えば、処理されたトレーニング画像を4:1の比率でトレーニングセットと検証セットに分けることができる。
このように、前記U型畳み込みニューラルネットの検証セットにおける損失が0.03以下に低下するまで、トレーニングセットを使用してU型畳み込みニューラルネットワークを繰り返してトレーニングし、トレーニングされたU型畳み込みニューラルネットワークを取得することができる。
実際の応用において、処理待ちCT画像を取得し、前記処理待ちCT画像をトレーニングされたU型畳み込みニューラルネットワークに入力し、前記U型畳み込みニューラルネットワークによって前記処理待ちCT画像のうち、ターゲットオブジェクトに属する画素の情報を予測し、前記処理待ちCT画像における前記ターゲットオブジェクトに属する画素の情報に基づいて、前記処理待ちCT画像に対応する初歩的分割画像を取得する。
前記初歩的分割画像が取得された後、前記初歩的分割画像の周辺に1画素の幅の辺をスプライスし、スプライスされた初歩的分割画像を取得し、前記スプライスされた初歩的分割画像の左上隅にある画素をシードポイントとして選択し、前記スプライスされた初歩的分割画像に対してフラッディング充填操作を行い、充填された初歩的分割画像を取得することができる。ここで、前記処理待ちCT画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像における前記ターゲットオブジェクトのエッジに含まれる最大連通ドメインを確定し、前記充填された初歩的分割画像における前記最大連通ドメイン以外の画素の画素値を前記第2の予め設定された値に調整し、前記処理待ちCT画像に対応する第1の分割結果を取得することができる。前記第1の分割結果が取得された後、前記処理待ちCT画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得することができる。
さらに、前記処理待ちCT画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得し、前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得し、前記第1の分割結果における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ちCT画像に対応する第3の分割結果を取得することができる。
また、本開示は、本開示で提供されるいずれかの画像分割方法を実現するために利用可能な画像分割装置、電子デバイス、コンピュータ可読可読記憶媒体、プログラムをさらに提供し、対応する技術的解決策及び技術的効果については、方法部分の対応する記載を参照できるため、説明を省略する。
図6は本開示の実施例による画像分割装置を示すブロック図である。図6に示すように、前記画像分割装置は、処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するように構成される第1の分割部51と、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するように構成される第1の調整部52と、を備える。
1つの可能な実施形態では、前記初歩的分割画像において、予測された前記ターゲットオブジェクトに属する画素の画素値が前記第1の予め設定された値であり、予測された前記ターゲットオブジェクトに属していない画素の画素値が第2の予め設定された値であり、前記第1の調整部52は、前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域における画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得し、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するように構成される。
1つの可能な実施形態では、前記第1の調整部52は、前記初歩的分割画像の周辺に予め設定された幅の辺をスプライスし、スプライスされた初歩的分割画像を取得し、スプライスされた前記予め設定された幅の辺にある画素の画素値が前記第2の予め設定された値であり、前記スプライスされた初歩的分割画像の画像エッジにある画素をシードポイントとして選択し、前記スプライスされた初歩的分割画像に対してフラッディング充填操作を行い、充填された初歩的分割画像を取得するように構成される。
1つの可能な実施形態では、前記第1の調整部52は、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像における前記ターゲットオブジェクトのエッジに含まれる最大連通ドメインを確定し、前記充填された初歩的分割画像における前記最大連通ドメイン以外の画素の画素値を前記第2の予め設定された値に調整し、前記処理待ち画像に対応する第1の分割結果を取得するように構成される。
1つの可能な実施形態では、前記画像分割装置は、前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するように構成される第2の取得部と、前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するように構成される第3の調整部と、をさらに備える。
1つの可能な実施形態では、前記第3の調整部は、前記隣接する画像のうち、第2の分割結果における前記ターゲットオブジェクトに属し、かつ処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応第3の分割結果を取得するように構成される。
1つの可能な実施形態では、前記第3の調整部は、前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得し、前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得し、前記第1の分割結果における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する第3の分割結果を取得するように構成される。
1つの可能な実施形態では、前記画像分割装置は、トレーニング画像と前記トレーニング画像のラベル付きデータに基づいてニューラルネットワークをトレーニングするように構成され、前記トレーニング画像のラベル付きデータには、前記トレーニング画像における前記ターゲットオブジェクトに属する画素の真の値が含まれるトレーニング部をさらに備え、前記第1の分割部51は、処理待ち画像を前記ニューラルネットワークに入力し、前記ニューラルネットワークによって前記処理待ち画像におけるターゲットオブジェクトに属する画素の情報を予測し、前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報に基づいて、前記処理待ち画像に対応する初歩的分割画像を取得するように構成される。
1つの可能な実施形態では、前記トレーニング画像は、コンピュータ断層撮影(CT)画像であり、前記トレーニング部は、予め設定されたCT値範囲に応じて、前記トレーニング画像の画素値を正規化し、正規化されたトレーニング画像を取得し、正規化されたトレーニング画像と前記トレーニング画像のラベル付きデータに基づいて前記ニューラルネットワークをトレーニングするように構成される。
本開示の実施例では、処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、処理待ち画像に対応する初歩的分割画像を取得し、処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づ、初歩的分割画像において、ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得することにより、より正確でロバストな分割結果を取得することができる。
図7は本開示の実施例による画像分割装置を示す別のブロック図である。図7に示すように、前記画像分割装置は、処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するように構成される第2の分割部61と、前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するように構成される第1の取得部62と、前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するように構成される第2の調整部63と、を備える。
1つの可能な実施形態では、前記第2の調整部63は、前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、初歩的分割画像を調整し、処理待ち画像に対応する第4の分割結果を取得するように構成される。
1つの可能な実施形態では、前記第2の調整部63は、前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得し、前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得し、前記初歩的分割画像における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する第4の分割結果を取得するように構成される。
1つの可能な実施形態では、前記画像分割装置は、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記第4の分割結果において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第5の分割結果を取得するように構成される第4の調整部と、をさらに備える。
1つの可能な実施形態では、前記第4の調整部は、前記第4の分割結果における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、前記第4の分割結果に対応する充填された初歩的分割画像を取得し、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する第5の分割結果を取得するように構成される。
1つの可能な実施形態では、前記第4の調整部は、前記第4の分割結果の周辺に予め設定された幅の辺をスプライスし、スプライスされた第4の分割結果を取得し、スプライスされた前記予め設定された幅の辺にある画素の画素値が前記第2の予め設定された値であり、前記スプライスされた第4の分割結果の画像エッジにある画素をシードポイントとして選択し、前記スプライスされた第4の分割結果に対してフラッディング充填操作を行い、前記第4の分割結果に対応する充填された初歩的分割画像を取得するように構成される。
1つの可能な実施形態では、前記第4の調整部は、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像における前記ターゲットオブジェクトのエッジに含まれる最大連通ドメインを確定し、前記充填された初歩的分割画像における前記最大連通ドメイン以外の画素の画素値を前記第2の予め設定された値に調整し、前記処理待ち画像に対応する第5の分割結果を取得するように構成される。
本開示の実施例では、処理待ち画像と第2の分割結果との連続性を確保することができ、それによってよりスムーズでより正確な3次元分割結果を得ることに役立つ。例えば、前記ターゲットオブジェクトが人体である場合、処理待ち画像と隣接する画像における人体との連続性を確保することができ、それによってよりスムーズでより正確な3次元人体分割結果を得ることに役立つ。例えば、本開示の実施例を採用してCT画像シーケンスにおける各CT画像に対応する分割結果を取得することができ、これにより、よりスムーズでより正確な3次元人体分割結果が得られる。
いくつかの実施例では、本開示の実施例によって提供される装置が備える機能又はそれに含まれる部分は、上記の方法の実施例で説明される方法を実行するように構成され、その具体的な実現及び技術的効果については上記方法の実施例の説明を参照することができ、簡潔するために、ここで説明を省略する。
本開示の実施例及び他の実施例では、「部分」は、部分の回路、部分のプロセッサ、部分のプログラム又はソフトウェアなどであってもよく、当然、ユニットであってもよく、また、モジュールであってもよく、モジュール化されていないものであってもよい。
本開示の実施例は、プロセッサに、上記方法を実行させるためのコンピュータプログラム命令を記憶したコンピュータ可読記憶媒体をさらに提供する。ここで、前記コンピュータ可読記憶媒体は、不揮発性コンピュータ可読記憶媒体、又は揮発性コンピュータ可読記憶媒体であってもよい。
本開示の実施例によるコンピュータプログラムは、電子デバイスで実行される場合、前記電子デバイスでのプロセッサに、上記画像分割方法を実行させるためのコンピュータ可読コードを含む。
本開示の実施例によるコンピュータプログラム製品は、コンピュータ可読命令を記憶するために使用され、命令が実行されるとコンピュータに上記の任意の実施例による画像分割方法の操作を実行させる。
本開示の実施例による電子デバイスは、1つ又は複数のプロセッサと、実行可能な命令を記憶するメモリと、を備え、前記1つ又は複数のプロセッサが前記メモリに記憶された実行可能な命令を呼び出して、上記方法を実行する。
電子デバイスは、端末、サーバー又は他の形態のデバイスとして提供されてもよい。
図8は本開示の実施例による電子デバイス800を示すブロック図である。例えば、電子デバイス800は、携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信機器、ゲーム機、タブレットデバイス、医療機器、フィットネス機器、パーソナルデジタルアシスタント等であってもよい。
図8を参照すると、電子デバイス800は、処理コンポーネント802、メモリ804、電源コンポーネント806、マルチメディアコンポーネント808、オーディオコンポーネント810、入力/出力(I/O)インターフェース812、センサコンポーネント814、及び通信コンポーネント816のうちの1つ又は複数を含むことができる。
処理コンポーネント802は、通常、電子デバイス800の全体動作、例えば、表示、電話コール、データ通信、カメラの動作及び記録動作と関連する動作を制御する。処理コンポーネント802は、上記方法の全て又は一部のステップを完了するために命令を実行する1つ又は複数のプロセッサ820を含むことができる。処理コンポーネント802と他のコンポーネントとのインタラクションを容易にするために、処理コンポーネント802は、1つ又は複数の部分を含むことができる。例えば、マルチメディアコンポーネント808と処理コンポーネント802の間のインタラクションを容易にするために、処理コンポーネント802は、マルチメディアコンポーネントを含むことができる。
メモリ804は、様々なタイプのデータを記憶して電子デバイス800での動作をサポートするように構成される。これらのデータの例は、電子デバイス800で動作するいずれかのアプリケーションプログラム又は方法のための命令、連絡先データ、電話帳データ、メッセージ、イメージ、ビデオなどを含む。メモリ804は、スタティックランダムアクセスメモリ(SRAM)、電気的消去可能プログラマブル読み取り専用メモリ(EEPROM)、消去可能プログラマブル読み取り専用メモリ(EPROM)、プログラマブル読み取り専用メモリ(PROM)、読み取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスク又は光ディスクなどの任意のタイプの揮発性又は不揮発性記憶装置又はそれらの組み合わせにより実現されてもよい。
電源コンポーネント806は、電子デバイス800の様々なコンポーネントに電力を供給する。電源コンポーネント806は、電源管理システム、1つ又は複数の電源、及び電子デバイス800のための電力の生成、管理及び割り当てに関連する他のコンポーネントを含むことができる。
マルチメディアコンポーネント808は、前記電子デバイス800とユーザの間にある1つの出力インターフェースを提供するスクリーンを含む。いくつかの実施例において、スクリーンは、液晶ディスプレイ(LCD)とタッチパネル(TP)を含むことができる。スクリーンがタッチパネルを含む場合、スクリーンは、ユーザからの入力信号を受信するために、タッチスクリーンとして実現されてもよい。タッチパネルは、タッチ、スライドとタッチパネル上のジェスチャをセンシングするために1つ又は複数のタッチセンサを含む。前記タッチセンサは、タッチ又はスライド動作の境界をセンシングするだけでなく、タッチ又はスライド動作に関連する持続時間及び圧力を検出することができる。いくつかの実施例において、マルチメディアコンポーネント808は、一つのフロントカメラ及び/又はリアカメラを含む。電子デバイス800が撮影モード又はビデオモードなどの動作モードにある場合、フロントカメラ及び/又はリアカメラは、外部のマルチメディアデータを受信することができる。各フロントカメラ及び/又はリアカメラは、1つの固定された光学レンズシステムであってもよく、又は焦点距離及び光学ズーム能力を持っている。
オーディオコンポーネント810は、オーディオ信号を出力及び/又は入力するように構成される。例えば、オーディオコンポーネント810は、1つのマイクロホン(MIC)を含み、電子デバイス800がコールモード、記録モード及び音声識別モードなどの動作モードにある場合、マイクロホンは、外部のオーディオ信号を受信するように構成される。受信されたオーディオ信号は、さらにメモリ804に記憶又は通信コンポーネント816を介して送信されることができる。いくつかの実施例において、オーディオコンポーネント810は、オーディオ信号を出力するためのスピーカを含む。
I/Oインターフェース812は、処理コンポーネント802と周辺インターフェースモジュールの間にインターフェースを提供し、周辺インターフェースモジュールは、キーボード、クリックホイール、ボタンなどであってもよい。ボタンは、ホームボタン、音量ボタン、スタートボタンとロックボタンを含むことができるがこれらに限定されない。
センサコンポーネント814は、電子デバイス800に様々な態様の状態評価を提供するための1つ又は複数のセンサを含む。例えば、センサコンポーネント814は、電子デバイス800のオン/オフ状態、コンポーネントの相対的な位置を検出することができ、例えば前記コンポーネントが電子デバイス800のディスプレイ及びキーパッドであり、センサコンポーネント814は、さらに電子デバイス800又は電子デバイス800の1つのコンポーネントの位置変化、ユーザと電子デバイス800との接触の有無、電子デバイス800の方位又は加速/減速と電子デバイス800の温度変化を検出することができる。センサコンポーネント814は、いかなる物理的な接触がない時に近くの物体の存在を検出するように構成される近接センサを含むことができる。センサコンポーネント814は、イメージングアプリケーションで使用される相補型金属酸化物半導体(CMOS)又は電荷結合装置(CCD)画像センサなどの光センサをさらに含むことができる。いくつかの実施例において、当該センサコンポーネント814は、加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ又は温度センサをさらに含むことができる。
通信コンポーネント816は、電子デバイス800と他のデバイスの間の有線又は無線方式の通信を容易にするように構成される。電子デバイス800は、無線ネットワーク(Wi-Fi)、第2世代移動通信技術(2G)、第3世代移動通信技術(3G)、第4世代移動通信技術(4G)/ユニバーサル移動通信技術の長期進化(LTE)、第5世代移動通信技術(5G)又はそれらの組み合わせなどの通信規格に基づく無線ネットワークにアクセスすることができる。1つの例示的な実施例では、通信コンポーネント816は、放送チャネルを介して外部の放送管理システムからの放送信号又は放送関連情報を受信する。1つの例示的な実施例では、前記通信コンポーネント816は、短距離通信を容易にするために、近距離通信(NFC)モジュールをさらに含む。例えば、NFCモジュールは、無線周波数識別(RFID)技術、赤外線通信協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標)(BT)技術及び他の技術に基づいて実現されてもよい。
例示的な実施例では、電子デバイス800は、上記方法を実行するために、1つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブル論理デバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサ又は他の素子により実現されてもよい。
例示的な実施例では、不揮発性コンピュータ可読記憶媒体、上記方法を完了するために電子デバイス800のプロセッサ820によって実行可能なコンピュータプログラム命令を含むメモリ804をさらに提供する。
図9は本開示の実施例による電子デバイス1900を示すブロック図である。例えば、電子デバイス1900は、サーバーとして提供されてもよい。図9を参照すると、電子デバイス1900は、処理コンポーネント1922を含み、処理コンポーネント1922は、さらに1つ又は複数のプロセッサと、処理コンポーネント922で実行可能な命令、例えばアプリケーションプログラムを記憶するためのメモリ1932によって表されるメモリリソースとを含む。メモリ1932に記憶されたアプリケーションプログラムは、それぞれが1グループの命令に対応する1つ又は複数の部分を含むことができる。また、処理コンポーネント1922は、上記方法を実行するための命令を実行するように構成される。
電子デバイス1900は、電子デバイス1900の電源管理を実行するように構成される電源コンポーネント1926と、電子デバイス1900をネットワークに接続するように構成される有線又は無線ネットワークインターフェース1950と、入出力(I/O)インターフェース1958とをさらに含むことができる。電子デバイス1900は、メモリ1932に記憶されたオペレーティングシステム、例えば、マイクロソフトサーバオペレーティングシステム(Windows(登録商標) ServerTM)、アップル社によって導入されたグラフィカルユーザインターフェースオペレーティングシステム(Mac OS XTM)、マルチユーザ及びマルチプロセスコンピュータオペレーティングシステム(Unix(登録商標))、フリー及びのオープンソースコードのUNIX(登録商標)のようなオペレーティングシステム(Linux(登録商標))、オープンソースコードのUnix(登録商標)のようなオペレーティングシステム(FreeBSDTM)又はこれらの類似するものに基づいて動作することができる。
例示的な実施例では、不揮発性コンピュータ可読記憶媒体、例えば、上記方法を完了するために電子デバイス1900のプロセッサ1922によって実行可能なコンピュータプログラム命令を含むメモリ1932をさらに提供する。
本開示は、システム、方法及び/又はコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、プロセッサが本開示の様々な態様を実現することを可能にするためのコンピュータ可読プログラム命令をロードしているコンピュータ可読記憶媒体を含むことができる。
コンピュータ可読記憶媒体は、命令実行デバイスによって使用される命令を保持及び記憶することができる有形デバイスであってもよい。コンピュータ可読記憶媒体は、電気記憶デバイス、磁気記憶デバイス、光学記憶デバイス、電磁気記憶デバイス、半導体記憶デバイス又は上記のそれらの任意の適切な組み合わせであってもよいがこれらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非網羅的なリスト)は、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM:Random Access Memory)、読み取り専用メモリ(ROM)、消去可能プログラマブルランダムアクセスメモリ(EPROM)、フラッシュメモリ、スタティックランダムアクセスメモリ(SRAMy)、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM:Compact Disc Read-Only Memory)、デジタル多用途ディスク(DVD:Digital Video Disc)、メモリースティック、フロッピー(登録商標)ディスク、機械的コーディングデバイス、例えば命令を記憶しているパンチカード又は溝内突出構造、及び上記のそれらの任意の適切な組み合わせを含む。ここで使用されるコンピュータ可読記憶媒体は、無線電波又は他の自由に伝播する電磁波、導波路又は他の伝送媒体を介して伝播する電磁波(例えば、光ファイバケーブルを通る光パルス)、又は電線を介して伝送される電気信号などの一時的信号自体として解釈されるべきではない。
ここで説明されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から各コンピューティング/処理デバイスにダウンロードさてもよく、又はインターネット、ローカルエリアネットワーク、広域ネットワーク及び/又はワイヤレスネットワークなどのネットワークを介して外部コンピュータ又は外部記憶デバイスにダウンロードされてもよい。ネットワークは、銅製伝送ケーブル、光ファイバ伝送、無線伝送、ルーター、ファイアウォール、スイッチ、ゲートウェイコンピューター及び/又はエッジサーバーを含むことができる。各コンピューティング/処理デバイス内のネットワークアダプタカード又はネットワークインターフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、各コンピューティング/プロセッシングデバイスのコンピュータ可読記憶媒体に保存するために当該コンピュータ可読プログラム命令を転送する。
本開示の動作を実行するためのコンピュータプログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、器械関連命令、マイクロコード、ファームウェア命令、状態設定データ、又は1つ又は複数のプログラミング言語の任意の組み合わせで書かれたソースコード又はターゲットコードであってもよく、前記プログラミング言語は、Smalltalk、C++などのオブジェクト向けプログラミング言語、及び「C」言語などの従来の手続き型プログラミング言語又は類似するプログラミング言語を含む。コンピュータ可読プログラムコードは、ユーザのコンピュータで完全に実行されたり、ユーザのコンピュータで部分的に実行されたり、1つの独立したソフトウェアパッケージとして実行されたり、ユーザコンピュータで部分的に実行されたり、遠隔コンピュータで部分的に実行されたり、又は遠隔コンピュータ又はサーバーで完全に実行されたりすることができる。リモートコンピュータに係る場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)又はワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介してユーザコンピュータに接続されてもよく、又は、外部コンピュータに接続されてもよい(例えばインターネットサービスプロバイダーによってインターネットを介して接続される)。いくつかの実施例では、コンピュータ可読プログラム命令の状態情報により電子回路、例えばプログラマブルロジック回路、フィールドプログラマブルゲートアレイ(FPGA)又はプログラマブルロジックアレイ(PLA)をパーソナライズしてカスタマイズすることにより、当該電子回路は、コンピュータ可読プログラム命令を実行して、本開示の様々な態様を実現することができる。
ここで本開示の各態様は、本開示の実施例の方法、装置(システム)とコンピュータプログラム製品のフローチャート及び/又はブロック図を参照して説明される。フローチャート及び/又はブロック図の各ブロック、並びにフローチャート及び/又はブロック図の各ブロックの組み合わせがコンピュータ可読プログラム命令によって実現されてもよいことを理解すべきである。
これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサに提供されてもよく、これにより、これらの命令がコンピュータ又は他のプログラマブルデータ処理装置のプロセッサによって実行される場合、フローチャート及び/又はブロック図の1つ又は複数のブロックで規定された機能/動作を実現するデバイスを生じるように機械が製造される。これらのコンピュータ可読プログラム命令をコンピュータ可読記憶媒体に記憶することができ、これらの命令により、コンピュータ、プログラマブルデータ処理装置及び/又は他のデバイスが特定の方式で動作し、これにより、命令を記憶しているコンピュータ可読媒体は、フローチャート及び/又はブロック図の1つ又は複数のブロックで規定された機能/動作の各態様を実現するための命令を含む製品を含む。
コンピュータ可読プログラム命令をコンピュータ、他のプログラマブルデータ処理装置、又は他のデバイスにロードすることもでき、これにより、コンピュータ、他のプログラマブルデータ処理装置又は他のデバイスで一連の操作ステップを実行し、コンピュータで実現されるプロセスを生成し、それによってコンピュータ、他のプログラマブルデータ処理装置、又は他のデバイスで実行される命令により、フローチャート及び/又はブロック図の1つ又は複数のブロックで規定された機能/動作が実現される。
図面におけるフローチャート及びブロック図には本開示の複数の実施例によるシステム、方法及びコンピュータプログラム製品の実現可能なアーキテクチャ、機能及び操作が示されている。この点において、フローチャート又はブロック図の各ブロックは、1つの部分、プログラムセグメント又は命令の一部を表すことができ、前記部分、プログラムセグメント又は命令の一部は、所定の論理機能を実現するための1つ又は複数の実行可能命令を含む。いくつかの代替実現では、ブロックで表記された機能は、図面で表記されたものとは異なる順序で発生することもできる。例えば、2つの連続するブロックは、実際には基本的に並行して実行されてもよく、それらは、関連する機能によって逆の順序で実行され得る場合もある。注意すべきこととして、ブロック図及び/又はフローチャートの各ブロック、及びブロック図及び/又はフローチャートのブロックの組み合わせは、所定の機能又は動作を実行するための専用の、ハードウェアに基づくシステムで実現されてもよく、又は専用ハードウェアとコンピュータ命令の組み合わせで実現されてもよい。
当該コンピュータプログラム製品は、具体的にはハードウェア、ソフトウェア又はそれらの組み合わせによって実現されてもよい。1つの選択可能な実施例では、前記コンピュータプログラム製品は、具体的にはコンピュータ記憶媒体として具体化され、他の選択可能な実施例では、コンピュータプログラム製品は、ソフトウェア開発キット(SDK:Software Development Kit)などのソフトウェア製品として具体的に具体化されている。
以上に本開示の各実施例について説明したが、上記の説明は、例示的であり、網羅的ではなく、かつ開示される各実施例に限定されない。上記の実施例の範囲及び精神から逸脱することなく、多くの修正及び変更は、当業者にとって明らかである。本明細書で使用されている用語の選択は、各実施例の原理、実際の用途又は市場の技術に対する改善を最もよく説明すること、又は当業者が本明細書で開示される各実施例を理解することを可能にすることを目的とする。
本開示の実施例では、処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得し、前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得する。このように、ターゲットオブジェクトが人体又は動物体である場合、ターゲットオブジェクトの器官の内部の画素をターゲットオブジェクトに属するものに分割することもでき、これにより、より正確でロバストな分割結果を取得することができる。
以上の一般的な説明及び以下の詳細な説明が例示的及び解釈的なものだけであり、本開示を制限するものではないことを理解すべきである。
例えば、本願は以下の項目を提供する。
(項目1)
画像分割方法であって、
処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップと、を含む、画像分割方法。
(項目2)
前記初歩的分割画像において、予測された、前記ターゲットオブジェクトに属する画素の画素値は、第1の予め設定された値であり、予測された、前記ターゲットオブジェクトに属していない画素の画素値は、第2の予め設定された値であり、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップは、
前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得するステップと、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する前記第1の分割結果を取得するステップと、を含むことを特徴とする
項目1に記載の画像分割方法。
(項目3)
前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得するステップは、
前記初歩的分割画像の周辺に予め設定された幅の辺をスプライスし、スプライスされた初歩的分割画像を取得するステップであって、スプライスされた前記予め設定された幅の辺にある画素の画素値が前記第2の予め設定された値である、ステップと、
前記スプライスされた初歩的分割画像の画像エッジにある画素をシードポイントとして選択し、前記スプライスされた初歩的分割画像に対してフラッディング充填操作を行い、前記充填された初歩的分割画像を取得するステップと、を含むことを特徴とする
項目2に記載の画像分割方法。
(項目4)
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する前記第1の分割結果を取得するステップは、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像における前記ターゲットオブジェクトのエッジに含まれる最大連通ドメインを確定するステップと、
前記充填された初歩的分割画像における前記最大連通ドメイン以外の画素の画素値を前記第2の予め設定された値に調整し、前記処理待ち画像に対応する前記第1の分割結果を取得するステップと、を含むことを特徴とする
項目2又は3に記載の画像分割方法。
(項目5)
前記処理待ち画像に対応する第1の分割結果を取得するステップの後、前記画像分割方法は、
前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するステップと、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップと、をさらに含むことを特徴とする
項目1-4のいずれか一項に記載の画像分割方法。
(項目6)
前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップは、
前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する前記第3の分割結果を取得するステップを含むことを特徴とする
項目5に記載の画像分割方法。
(項目7)
前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する前記第3の分割結果を取得するステップは、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得するステップと、
前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得するステップと、
前記第1の分割結果における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する前記第3の分割結果を取得するステップと、を含むことを特徴とする
項目6に記載の画像分割方法。
(項目8)
前記処理待ち画像におけるターゲットオブジェクトに属する画素を予測するステップの前に、前記画像分割方法は、トレーニング画像と前記トレーニング画像のラベル付きデータに基づいてニューラルネットワークをトレーニングするステップであって、前記トレーニング画像のラベル付きデータには、前記トレーニング画像における前記ターゲットオブジェクトに属する画素の真の値が含まれる、ステップをさらに含み、
前記処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップは、前記処理待ち画像を前記ニューラルネットワークに入力し、前記ニューラルネットワークによって前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報を予測するステップと、前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報に基づいて、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、を含むことを特徴とする
項目1-7のいずれか一項に記載の画像分割方法。
(項目9)
前記トレーニング画像は、コンピュータ断層撮影(CT)画像であり、
トレーニング画像と前記トレーニング画像のラベル付きデータに基づいてニューラルネットワークをトレーニングするステップは、予め設定されたCT値範囲に応じて、前記トレーニング画像の画素値を正規化し、正規化されたトレーニング画像を取得するステップと、前記正規化されたトレーニング画像と前記トレーニング画像のラベル付きデータに基づいて前記ニューラルネットワークをトレーニングするステップと、を含むことを特徴とする
項目8に記載の画像分割方法。
(項目10)
画像分割方法であって、
処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、
前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するステップと、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップと、を含む、画像分割方法。
(項目11)
前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップは、
前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する前記第4の分割結果を取得するステップを含むことを特徴とする
項目10に記載の画像分割方法。
(項目12)
前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する前記第4の分割結果を取得するステップは、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得するステップと、
前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得するステップと、
前記初歩的分割画像における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する前記第4の分割結果を取得するステップと、を含むことを特徴とする
項目11に記載の画像分割方法。
(項目13)
画像分割装置であって、
処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するように構成される第1の分割部と、
前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するように構成される第1の調整部と、を備える、画像分割装置。
(項目14)
画像分割装置であって、
処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するように構成される第2の分割部と、
前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するように構成される第1の取得部と、
前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するように構成される第2の調整部と、を備える、画像分割装置。
(項目15)
実行可能な命令を記憶するメモリと、
前記メモリに記憶された実行可能な命令を呼び出して、項目1-12のいずれか一項に記載の画像分割方法を実行する1つ又は複数のプロセッサと、を備える、電子デバイス。
(項目16)
プロセッサにより実行される場合、前記プロセッサに項目1-12のいずれか一項に記載の画像分割方法を実行させるためのコンピュータプログラム命令を記憶した、コンピュータ可読記憶媒体。
(項目17)
電子デバイスで実行される場合、前記電子デバイス内のプロセッサに項目1-12のいずれか一項に記載の画像分割方法を実行させるためのコンピュータ可読コードを含む、コンピュータプログラム。

Claims (17)

  1. 画像分割方法であって、
    処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、
    前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップと、を含む、画像分割方法。
  2. 前記初歩的分割画像において、予測された、前記ターゲットオブジェクトに属する画素の画素値は、第1の予め設定された値であり、予測された、前記ターゲットオブジェクトに属していない画素の画素値は、第2の予め設定された値であり、
    前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するステップは、
    前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得するステップと、
    前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する前記第1の分割結果を取得するステップと、を含むことを特徴とする
    請求項1に記載の画像分割方法。
  3. 前記初歩的分割画像における画素値が前記第2の予め設定された値である閉鎖領域の画素値を前記第1の予め設定された値に調整し、充填された初歩的分割画像を取得するステップは、
    前記初歩的分割画像の周辺に予め設定された幅の辺をスプライスし、スプライスされた初歩的分割画像を取得するステップであって、スプライスされた前記予め設定された幅の辺にある画素の画素値が前記第2の予め設定された値である、ステップと、
    前記スプライスされた初歩的分割画像の画像エッジにある画素をシードポイントとして選択し、前記スプライスされた初歩的分割画像に対してフラッディング充填操作を行い、前記充填された初歩的分割画像を取得するステップと、を含むことを特徴とする
    請求項2に記載の画像分割方法。
  4. 前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像の画素値を調整し、前記処理待ち画像に対応する前記第1の分割結果を取得するステップは、
    前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記充填された初歩的分割画像における前記ターゲットオブジェクトのエッジに含まれる最大連通ドメインを確定するステップと、
    前記充填された初歩的分割画像における前記最大連通ドメイン以外の画素の画素値を前記第2の予め設定された値に調整し、前記処理待ち画像に対応する前記第1の分割結果を取得するステップと、を含むことを特徴とする
    請求項2又は3に記載の画像分割方法。
  5. 前記処理待ち画像に対応する第1の分割結果を取得するステップの後、前記画像分割方法は、
    前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するステップと、
    前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップと、をさらに含むことを特徴とする
    請求項1-4のいずれか一項に記載の画像分割方法。
  6. 前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する第3の分割結果を取得するステップは、
    前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する前記第3の分割結果を取得するステップを含むことを特徴とする
    請求項5に記載の画像分割方法。
  7. 前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記第1の分割結果を調整し、前記処理待ち画像に対応する前記第3の分割結果を取得するステップは、
    前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得するステップと、
    前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得するステップと、
    前記第1の分割結果における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する前記第3の分割結果を取得するステップと、を含むことを特徴とする
    請求項6に記載の画像分割方法。
  8. 前記処理待ち画像におけるターゲットオブジェクトに属する画素を予測するステップの前に、前記画像分割方法は、トレーニング画像と前記トレーニング画像のラベル付きデータに基づいてニューラルネットワークをトレーニングするステップであって、前記トレーニング画像のラベル付きデータには、前記トレーニング画像における前記ターゲットオブジェクトに属する画素の真の値が含まれる、ステップをさらに含み、
    前記処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップは、前記処理待ち画像を前記ニューラルネットワークに入力し、前記ニューラルネットワークによって前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報を予測するステップと、前記処理待ち画像における前記ターゲットオブジェクトに属する画素の情報に基づいて、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、を含むことを特徴とする
    請求項1-7のいずれか一項に記載の画像分割方法。
  9. 前記トレーニング画像は、コンピュータ断層撮影(CT)画像であり、
    トレーニング画像と前記トレーニング画像のラベル付きデータに基づいてニューラルネットワークをトレーニングするステップは、予め設定されたCT値範囲に応じて、前記トレーニング画像の画素値を正規化し、正規化されたトレーニング画像を取得するステップと、前記正規化されたトレーニング画像と前記トレーニング画像のラベル付きデータに基づいて前記ニューラルネットワークをトレーニングするステップと、を含むことを特徴とする
    請求項8に記載の画像分割方法。
  10. 画像分割方法であって、
    処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するステップと、
    前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するステップと、
    前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップと、を含む、画像分割方法。
  11. 前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するステップは、
    前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する前記第4の分割結果を取得するステップを含むことを特徴とする
    請求項10に記載の画像分割方法。
  12. 前記隣接する画像のうち、前記第2の分割結果における前記ターゲットオブジェクトに属し、かつ前記処理待ち画像と同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する前記第4の分割結果を取得するステップは、
    前記処理待ち画像と前記隣接する画像における同じ位置にある画素値の差が第3の予め設定された値以下である画素に基づいて、第1の画素セットを取得するステップと、
    前記第1の画素セットのうち、前記第2の分割結果における前記ターゲットオブジェクトに属する画素に基づいて、第2の画素セットを取得するステップと、
    前記初歩的分割画像における前記第2の画素セットの画素を前記ターゲットオブジェクトに属するものに調整し、前記処理待ち画像に対応する前記第4の分割結果を取得するステップと、を含むことを特徴とする
    請求項11に記載の画像分割方法。
  13. 画像分割装置であって、
    処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するように構成される第1の分割部と、
    前記処理待ち画像における前記ターゲットオブジェクトのエッジ情報に基づいて、前記初歩的分割画像において、前記ターゲットオブジェクトのエッジに含まれる閉鎖領域における、予測された、前記ターゲットオブジェクトに属していない画素の画素値を調整し、前記処理待ち画像に対応する第1の分割結果を取得するように構成される第1の調整部と、を備える、画像分割装置。
  14. 画像分割装置であって、
    処理待ち画像におけるターゲットオブジェクトに属する画素を予測し、前記処理待ち画像に対応する初歩的分割画像を取得するように構成される第2の分割部と、
    前記処理待ち画像に隣接する画像、及び前記隣接する画像に対応する第2の分割結果を取得するように構成される第1の取得部と、
    前記処理待ち画像と前記隣接する画像における同じ位置にある画素の画素値、及び前記第2の分割結果に基づいて、前記初歩的分割画像を調整し、前記処理待ち画像に対応する第4の分割結果を取得するように構成される第2の調整部と、を備える、画像分割装置。
  15. 実行可能な命令を記憶するメモリと、
    前記メモリに記憶された実行可能な命令を呼び出して、請求項1-12のいずれか一項に記載の画像分割方法を実行する1つ又は複数のプロセッサと、を備える、電子デバイス。
  16. プロセッサにより実行される場合、前記プロセッサに請求項1-12のいずれか一項に記載の画像分割方法を実行させるためのコンピュータプログラム命令を記憶した、コンピュータ可読記憶媒体。
  17. 電子デバイスで実行される場合、前記電子デバイス内のプロセッサに請求項1-12のいずれか一項に記載の画像分割方法を実行させるためのコンピュータ可読コードを含む、コンピュータプログラム。
JP2021576593A 2020-08-17 2020-12-21 画像分割方法及び装置、電子デバイス並びに記憶媒体 Pending JP2022548453A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010827077.1A CN111899268B (zh) 2020-08-17 2020-08-17 图像分割方法及装置、电子设备和存储介质
CN202010827077.1 2020-08-17
PCT/CN2020/138131 WO2022036972A1 (zh) 2020-08-17 2020-12-21 图像分割方法及装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
JP2022548453A true JP2022548453A (ja) 2022-11-21

Family

ID=80268933

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021576593A Pending JP2022548453A (ja) 2020-08-17 2020-12-21 画像分割方法及び装置、電子デバイス並びに記憶媒体

Country Status (2)

Country Link
JP (1) JP2022548453A (ja)
KR (1) KR20220012407A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113870169A (zh) * 2020-06-12 2021-12-31 杭州普健医疗科技有限公司 一种医学影像标注方法、介质及电子设备
CN116962698A (zh) * 2023-09-20 2023-10-27 江苏游隼微电子有限公司 一种高压缩率的图像压缩及解压缩方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104143190A (zh) * 2014-07-24 2014-11-12 东软集团股份有限公司 Ct图像中组织的分割方法及***
CN105894517A (zh) * 2016-04-22 2016-08-24 北京理工大学 基于特征学习的ct图像肝脏分割方法及***
US20180308237A1 (en) * 2017-04-21 2018-10-25 Samsung Electronics Co., Ltd. Image segmentation method and electronic device therefor
CN109949309A (zh) * 2019-03-18 2019-06-28 安徽紫薇帝星数字科技有限公司 一种基于深度学习的肝脏ct图像分割方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104143190A (zh) * 2014-07-24 2014-11-12 东软集团股份有限公司 Ct图像中组织的分割方法及***
CN105894517A (zh) * 2016-04-22 2016-08-24 北京理工大学 基于特征学习的ct图像肝脏分割方法及***
US20180308237A1 (en) * 2017-04-21 2018-10-25 Samsung Electronics Co., Ltd. Image segmentation method and electronic device therefor
CN109949309A (zh) * 2019-03-18 2019-06-28 安徽紫薇帝星数字科技有限公司 一种基于深度学习的肝脏ct图像分割方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113870169A (zh) * 2020-06-12 2021-12-31 杭州普健医疗科技有限公司 一种医学影像标注方法、介质及电子设备
CN116962698A (zh) * 2023-09-20 2023-10-27 江苏游隼微电子有限公司 一种高压缩率的图像压缩及解压缩方法
CN116962698B (zh) * 2023-09-20 2023-12-08 江苏游隼微电子有限公司 一种高压缩率的图像压缩及解压缩方法

Also Published As

Publication number Publication date
KR20220012407A (ko) 2022-02-03

Similar Documents

Publication Publication Date Title
CN111899268B (zh) 图像分割方法及装置、电子设备和存储介质
CN110458127B (zh) 图像处理方法、装置、设备以及***
WO2022151755A1 (zh) 目标检测方法及装置、电子设备、存储介质、计算机程序产品和计算机程序
TWI755853B (zh) 圖像處理方法、電子設備和電腦可讀儲存介質
CN109978886B (zh) 图像处理方法及装置、电子设备和存储介质
WO2020088328A1 (zh) 一种结肠息肉图像的处理方法和装置及***
TWI754375B (zh) 圖像處理方法、電子設備、電腦可讀儲存介質
KR20220009451A (ko) 신경망 훈련 방법 및 장치, 전자 기기 및 저장 매체
JP2022521130A (ja) ネットワークトレーニング、画像処理方法および電子機器、記憶媒体並びにコンピュータプログラム
CN112767329B (zh) 图像处理方法及装置、电子设备
KR20210153700A (ko) 이미지 처리 방법 및 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램
CN111091576A (zh) 图像分割方法、装置、设备及存储介质
JP2022535219A (ja) 画像分割方法及び装置、電子機器並びに記憶媒体
KR20220013404A (ko) 이미지 처리 방법 및 장치, 전자 기기, 저장 매체 및 프로그램 제품
CN113222038B (zh) 基于核磁图像的乳腺病灶分类和定位方法及装置
WO2023050691A1 (zh) 图像处理方法及装置、电子设备、存储介质和程序
US11928825B2 (en) Unsupervised image segmentation method and electronic device
TWI765386B (zh) 神經網路訓練及圖像分割方法、電子設備和電腦儲存介質
CN114820584A (zh) 肺部病灶定位装置
WO2022022350A1 (zh) 图像处理方法及装置、电子设备、存储介质和计算机程序产品
CN113034491B (zh) 一种冠脉钙化斑块检测方法及装置
JP2022548453A (ja) 画像分割方法及び装置、電子デバイス並びに記憶媒体
CN110033005A (zh) 图像处理方法及装置、电子设备和存储介质
CN111640114B (zh) 图像处理方法及装置
CN116843647A (zh) 肺野面积确定、肺发育评估方法及装置、电子设备和介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211223

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221219

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230707