JP2021069667A - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP2021069667A
JP2021069667A JP2019198016A JP2019198016A JP2021069667A JP 2021069667 A JP2021069667 A JP 2021069667A JP 2019198016 A JP2019198016 A JP 2019198016A JP 2019198016 A JP2019198016 A JP 2019198016A JP 2021069667 A JP2021069667 A JP 2021069667A
Authority
JP
Japan
Prior art keywords
image
noise
medical
medical image
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019198016A
Other languages
English (en)
Inventor
高橋 和彦
Kazuhiko Takahashi
和彦 高橋
律也 富田
Ritsuya Tomita
律也 富田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019198016A priority Critical patent/JP2021069667A/ja
Publication of JP2021069667A publication Critical patent/JP2021069667A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Eye Examination Apparatus (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 OCT等で得た断層画像や正面画像等の医用画像のノイズを効果的に低減する。【解決手段】 画像処理装置は、被写体を撮像して得た第1の医用画像におけるノイズの位置を検出する手段と、第1の医用画像における検出されたノイズの位置の画素値を低減させた第2の医用画像と、第1の医用画像におけるノイズが低減されたと推定される推定画像とを生成する手段と、第2の医用画像と推定画像との差に関する第1項と推定画像に関する第2項とを含む目的関数を用いて、推定画像を変更する手段と、目的関数が所定の条件を満たすように変更して得た推定画像をノイズ低減画像として出力する手段と、を有する。【選択図】 図4

Description

開示の技術は、画像処理装置、画像処理方法及びプログラムに関する。
光干渉断層計(OCT;Optical Coherence Tomography)は、光の干渉を利用して断層像を撮影する装置であり、被写体は光を透過する物質なら何でもよい。特に眼科用の光干渉断層計は被写体が眼であり、網膜層内部の状態を三次元的に観察することが可能であり、断層画像撮影装置と呼ばれる。この断層画像撮影装置は、疾病の診断をより的確に行うのに有用であることから近年注目を集めている。OCTの形態として、広帯域な光源とマイケルソン干渉計を組み合わせたTD−OCT(Time domain OCT)がある。これは、被検眼に光が入射した際に生じる後方散乱光と参照光との干渉光を計測し、参照光の光路長と後方散乱光の光路長が一致するときに反射強度が大きくなることを利用して、被検眼の深さ方向の情報を得るように構成されたものである。TD−OCTは1回の計測により深さ方向のある1点の情報しか得られない。このため、TD−OCTは、参照光を反射させる参照光ミラーを機械的に動かすことにより、参照光の光路長を変更しながら、深さ方向の複数点の情報を取得する必要がある。そのため、より高速に画像を取得する方法として、FD−OCT(Fourier domain OCT)が開発された。FD−OCTは、1回の計測により深さ方向の情報がすべて得られる。このため、FD−OCTでは、深さ方向の機械的走査が不要となり、TD−OCTより高速に計測することができる。FD−OCTには、2種類のOCTが知られている。一つは、広帯域光源を用いて分光器でインターフェログラムを取得してフーリエ空間で情報を得るSD−OCT(Spectral domain OCT)である。もう一つは、光源の発信波長を高速に変化させることにより光波の干渉をフーリエ空間で行うSS−OCT(Swept Source OCT)である。FD−OCTの断層画像は、観測信号をフーリエ変換して得られる複素データの絶対値成分である。この絶対値成分の信号は、輝度画像や強度画像と呼ばれている。
ここで、OCTの画像のノイズ低減方法として、畳み込みフィルタによる方法(例えば、3x3のサイズのガウシアンフィルタを画像に適用する方法)がある。この方法は、局所的な画像領域に対してノイズ低減を適用する方法である。具体的には、画像全体の個々の局所的な部分に対してこのノイズ低減を順次適用することにより、画像全体としてノイズ低減が行われる。また、OCTの画像のノイズ低減方法として、全変動ノイズ低減法(全変動ノイズ除去法)という方法が知られている(特許文献1)。この方法は、画像全体の変動成分の量を考慮して、ノイズ低減を行う方法である。すなわち、ノイズ低減後の画像全体の変動成分量がある値になるようにノイズ低減が行われる。ここで、変動成分とは、隣の画素との差分の絶対値である。例えば、画像全体の変動成分量がゼロの場合とは、画像の全部の画素値が同じ値の場合である。画像全体の変動成分量をコントロールすることにより、ノイズ低減の効果の強さが決まる。変動成分量が少なくなるようにノイズ低減を行う場合、エッジ成分やランダムノイズ成分のような変動成分が削減されて、出力画像は「のっぺり」した感じになる。反対に、変動成分量が多くなるようにノイズ低減を行う場合、エッジ成分やランダムノイズ成分が削減されないため、ノイズ低減の効果は弱くなる。
特表2018−531773号公報
ところで、OCTの画像に従来の全変動ノイズ低減法をそのまま適用しても、黒点ノイズを効果的に低減することが難しいために、効果的にノイズ低減が行われない場合があることが分かった。ここで、黒点ノイズとは、図7(b)のようなものである。なお、図7(a)は、OCTの断層画像であり、この一部を拡大したものが図7(b)である。図7(b)ように黒い点が多く点在しており(以下、黒点と呼ぶ)、これが画質を低減する要因の一つとなっている。特に、構造物である網膜層の上に黒点が存在し、医者が網膜層を観察するときに、この黒点が邪魔をするため、診断を難しくさせる場合があった。
開示の技術の目的の一つは、上記課題に鑑みてなされたものであり、OCT等で得た断層画像や正面画像等の医用画像のノイズを効果的に低減することである。
なお、上記目的に限らず、後述する発明を実施するための形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本件の他の目的の1つとして位置付けることができる。
開示の画像処理装置の一つは、
被写体を撮像して得た第1の医用画像におけるノイズの位置を検出する手段と、
前記第1の医用画像における前記検出されたノイズの位置の画素値を低減させた第2の医用画像と、前記第1の医用画像におけるノイズが低減されたと推定される推定画像とを生成する手段と、
前記第2の医用画像と前記推定画像との差に関する第1項と前記推定画像に関する第2項とを含む目的関数を用いて、前記推定画像を変更する手段と、
前記目的関数が所定の条件を満たすように変更して得た推定画像をノイズ低減画像として出力する手段と、を有する。
開示の技術の一つによれば、OCT等で得た断層画像や正面画像等の医用画像のノイズを効果的に低減することができる。
画像処理システムの構成を示す図。 眼部の構造と断層画像と眼底画像を説明するための図。 画像処理システムにおける処理の流れを示すフローチャート。 画像処理装置におけるノイズ低減部を説明するためのブロック図。 比率λを変更するGUIの一例。 乱数で黒点の位置を予測する場合のノイズ低減部を説明するためのブロック図。 黒点ノイズを説明するための図。 高画質化処理の一例を説明するための図。 機械学習モデルとして用いられるニューラルネットワークの構成の一例。 機械学習モデルとして用いられるニューラルネットワークの構成の一例。
(第1の実施形態)
以下、図面を参照しながら、第1の実施形態に係る画像処理装置を備える画像処理システムと、眼の構造ならびに画像処理システムで取得する眼の画像について、詳細を説明する。
まず、図2は、画像処理システムで取得する眼の構造と画像を示す図である。図2(a)に眼球の模式図を示す。図2(a)において、Cは角膜、CLは水晶体、Vは硝子体、Mは黄斑部(黄斑の中心部は中心窩を表す)、Dは視神経乳頭部を表す。本実施形態にかかる断層画像撮影装置200は、主に、硝子体、黄斑部、視神経乳頭部を含む網膜の後極部を撮影する場合について説明を行う。なお、本実施形態では説明をしないが、断層画像撮影装置200は、角膜、水晶体の前眼部を撮影することも可能である。
また、図1は、本実施形態に係る画像処理装置300を備える画像処理システム100の構成を示す図である。図1に示すように、画像処理システム100は、画像処理装置300が、インタフェースを介して断層画像撮影装置(OCTとも言う)200、眼底画像撮影装置400、外部記憶部500、表示部600、入力部700と接続されることにより構成されている。
ここで、断層画像撮影装置200は、不図示の被写体である眼を撮像し、眼網膜層の断層画像を生成する。なお、断層画像は、被写体を撮像して得た第1の医用画像の一例である。このとき、断層画像撮影装置200は、測定光を照射した被検眼からの戻り光と測定光に対応する参照光とによる干渉光を受光するように構成される。また、断層画像撮影装置200は、フーリエドメイン型のOCT装置が好適に用いられる。また、断層画像撮影装置200は、例えば、干渉光を受光する受光手段がラインセンサ等により構成されるSD−OCTや、波長掃引光源が用いられるSS−OCTにより構成される。また、断層画像撮影装置200は、画像処理装置300と通信可能に接続されるが、画像処理装置300を断層画像撮影装置200の内部に組み込むように構成されていても良い。なお、断層画像撮影装置200は、既知の装置であるため詳細な説明は省略し、ここでは、画像処理装置300からの指示により行われる断層画像の撮影について説明を行う。
まず、図1において、走査手段の一例であるガルバノミラー201は、測定光の眼底における走査を行うためのものであり、OCTによる眼底の撮影範囲を規定する。また、駆動制御部202は、ガルバノミラー201の駆動範囲および速度を制御することで、眼底における平面方向の撮影範囲及び走査線数(平面方向の走査速度)を規定する。また、駆動制御部202は、被検眼の同一位置で測定光を走査するように走査手段を制御する。ここでは、簡単のためガルバノミラーは一つのユニットとして示したが、実際にはXスキャン用のミラーとYスキャン用の2枚のミラーで構成され、眼底上で所望の範囲を測定光で走査できる。
また、フォーカス203は被写体である眼の前眼部を介し、眼底の網膜層にフォーカスするためのものである。測定光は、非図示のフォーカスレンズにより、被写体である眼の前眼部を介し、眼底の網膜層にフォーカスされる。眼底を照射した測定光は各網膜層で反射・散乱して戻る。なお、硝子体を詳細に観察する場合には、網膜層よりも前眼部側にフォーカスを移動させ、硝子体にフォーカスを合わせる。
また、内部固視灯204は、表示部241、レンズ242で構成される。表示部241として複数の発光ダイオード(LD)がマトリックス状に配置されたものを用いる。発光ダイオードの点灯位置は、駆動制御部202の制御により撮影したい部位に合わせて変更される。表示部241からの光は、レンズ242を介し、被検眼に導かれる。表示部241から出射される光は520nmで、駆動制御部202により所望のパターンが表示される。
また、コヒーレンスゲートステージ205は、被検眼の眼軸長の相違等に対応するため、駆動制御部202により制御されている。コヒーレンスゲートとは、OCTにおける測定光と参照光の光学距離が等しい位置を表す。さらには、撮影方法としてコヒーレンスゲートの位置を制御することにより、網膜層側か、あるいは網膜層より深部側とする撮影を行うことを制御する。ここで、断層画像撮影装置200で取得される断層画像について図2(b)を用いて説明する。図2(b)において、Vは硝子体、Mは黄斑部、Dは視神経乳頭部を表す。また、L1は内境界膜(ILM)と神経線維層(NFL)との境界、L2は神経線維層と神経節細胞層(GCL)との境界、L3は視細胞内節外節接合部(ISOS)、L4は網膜色素上皮層(RPE)、L5はブルッフ膜(BM)、L6は脈絡膜を表す。断層画像において、横軸(OCTの主走査方向)をx軸、縦軸(深さ方向)をz軸とする。
また、眼底画像撮影装置400は、眼部の眼底画像を撮影する装置であり、当該装置としては、例えば、眼底カメラやSLO(Scanning Laser Ophothalmoscope)等が挙げられる。図2(c)に眼部の眼底画像を示す。図2(c)において、Mは黄斑部、Dは視神経乳頭部を表し、太い曲線は網膜の血管を表す。眼底画像において、横軸(OCTの主走査方向)をx軸、縦軸(OCTの副走査方向)をy軸とする。なお、断層画像撮影装置200と眼底画像撮影装置400の装置構成は、一体型でもよいし別体型でもよい。
また、画像処理装置300は、画像取得部301、記憶部302、画像処理部303、指示部304、表示制御部305を備える。画像取得部301は、断層画像生成部311からなり、断層画像撮影装置200により撮影された断層画像の信号データを取得し、信号処理を行うことで断層画像の生成を行う。また、眼底画像撮影装置400により撮影された眼底画像データを取得する。そして、生成した断層画像と眼底画像を記憶部302に格納する。画像処理部303は、位置合わせ部331、検出部332、算出部333、ノイズ低減部334からなる。位置合わせ部331は、複数個の断層画像間の断層画像位置合わせや断層画像と眼底画像の位置合わせを行う。検出部332では、硝子体境界や硝子体領域を検出する。算出部333は、硝子体境界と網膜上層とで規定される領域に関する特徴を数値化する。ノイズ低減部334は、算出部333で算出を行う領域の指定を行う。
また、外部記憶部500は、被検眼に関する情報(患者の氏名、年齢、性別など)と、撮影した画像データ、撮影パラメータ、画像解析パラメータ、操作者によって設定されたパラメータをそれぞれ関連付けて保持している。
また、入力部700は、例えば、マウス、キーボード、タッチ操作画面などであり、操作者は、入力部700を介して、画像処理装置300や断層画像撮影装置200、眼底画像撮影装置400へ指示を行う。
次に、図3と図4を参照して本実施形態の画像処理装置300の処理手順を示す。図3は、本実施形態における本システム全体の動作処理の流れを示すフローチャートである。図4は、本実施形態における画像処理部303のノイズ低減部334に関するブロック図である。
<ステップS301>
ステップS301では、不図示の被検眼情報取得部は、被検眼を同定する情報として被検者識別番号を外部から取得する。そして、被検者識別番号に基づいて、外部記憶部500が保持している当該被検眼に関する情報を取得して記憶部302に記憶する。
<ステップS302>
ステップS302では被検眼をスキャンして撮影を行う。被検眼のスキャンは、操作者が非図示のスキャン開始を選択すると、断層画像撮影装置200は、駆動制御部202を制御し、ガルバノミラー201を動作させて被検眼のスキャンを行う。ガルバノミラー201は、水平方向用のXスキャナと垂直方向用のYスキャナで構成される。そのため、これらのスキャナの向きをそれぞれ変更すると、装置座標系における水平方向(X)、垂直方向(Y)それぞれの方向に走査することが出来る。そして、これらのスキャナの向きを同時に変更させることで、水平方向と垂直方向とを合成した方向に走査することが出来るため、眼底平面上の任意の方向に走査することが可能となる。
撮影を行うにあたり各種撮影パラメータの調整を行う。具体的には、内部固視灯の位置、スキャン範囲、スキャンパターン、コヒーレンスゲート位置、フォーカスを設定する。駆動制御部202は、表示部241の発光ダイオードを制御して、黄斑部中心や視神経乳頭に撮影を行うように内部固視灯204の位置を制御する。スキャンパターンは、3次元ボリュームを撮影するラスタースキャンや放射状スキャン、クロススキャンなどのスキャンパターンを設定する。本実施形態はCスキャンとする。コヒーレンスゲート位置は硝子体側とし、フォーカスも硝子体に合わせて撮影を行うとする。
これら撮影パラメータの調整終了後、操作者が非図示の撮影開始を選択することで、撮影を行う。撮影を開始すると、Aスキャン毎に干渉信号を出力する。
<ステップS303>
ステップS303では、被写体を撮像して得た第1の医用画像の一例である断層画像の生成を行う。断層画像生成部311は、それぞれの干渉信号に対して、一般的な再構成処理を行うことで、断層画像を生成する。
まず、断層画像生成部311は、干渉信号から固定パターンノイズ除去を行う。固定パターンノイズ除去は検出した複数のAスキャン信号を平均することで固定パターンノイズを抽出し、これを入力した干渉信号から減算することで行われる。
次に、断層画像生成部311は、有限区間でフーリエ変換した場合にトレードオフの関係となる深さ分解能とダイナミックレンジを最適化するために、所望の窓関数処理を行う。次に、FFT処理を行った結果に、絶対値の演算を施すことにより、絶対値の断層画像を得る。この絶対値の断層画像に対数演算を行ったものがOCTの断層画像であり、輝度画像や強度画像と呼ばれるものである。
<ステップS304>
ステップS304では、ノイズ低減部334が断層画像のノイズを低減する。図4にノイズ低減部334のブロック図を示す。ノイズ低減部は、黒点を考慮した全変動ノイズ低減法(total variation de−noising)を使用する。黒点とは、周囲の画素に比較して極端に暗い画素である。
ここで、従来の全変動ノイズ低減法について説明する。従来の全変動ノイズ低減法は、次式で表現される。
Figure 2021069667
数式1において、Vは評価関数、g(x,y)は入力画像、f(x,y)は出力画像である。出力画像f(x,y)は入力画像g(x,y)のノイズを低減した画像である。入力画像g(x,y)の大きさと出力画像f(x,y)の大きさは同じである。数式1のΣ( )は画素毎に括弧の中を計算して画像全体について総和を計算し、d/dxはx方向の微分を計算し、d/dyはy方向の微分を計算する。λは、第1項と第2項の割合を決めるための比率である。評価関数Vのうち、f(x,y)が変数であり、その他は固定値である。評価関数Vの値はゼロ以上の値である。
全変動ノイズ低減法は、入力画像g(x,y)が与えられたときに、評価関数Vを最小化するような出力画像f(x,y)を求める方法である。ここで評価関数Vの意味について言及する。第1項は入力画像と出力画像の差の二乗であるので、出力画像が入力画像と似ていれば第1項は小さくなり、第2項は出力画像の微分の大きさであるので、出力画像が滑らかであれば第2項は小さくなる。このことから、評価関数Vを小さくすることは、「出力画像は入力画像と似ているが、似ているだけでなく出力画像は滑らかである」ということを要請していることになる。第1項と第2項の割合はλの大きさで決定し、λが小さければ全体に占める第1項の割合が大きくなるので出力画像が入力画像と似ていることを強く要請することになる。λが大きければ全体に占める第2項の割合が大きくなるので、出力画像が滑らかであることを強く要請することになる。
ノイズ除去するなら、第2項だけでもよいように思えるが、もし評価関数が第2項だけで構成されていると、f(x,y)=5とかf(x,y)=7などの、f(x,y)の全画素が一定値のケースが求解されてしまう。なぜなら、全画素が一定値の場合、第2項はゼロとなり、その結果、評価関数はゼロとなり、最小値となるためである。全画素が一定値の場合、入力画像のノイズ低減の意味をなさない。そのため、第1項と第2項の両方が必要である。第1項を誤差項、第2項を全変動正則化項と呼ぶ。λは、全変動正則化項と前記誤差項の比率を変更するためのパラメータである。
出力画像f(x,y)を求めるアルゴリズムとしては、最急降下法、ADMM(Alternating Direction Method of Multipliers)、主−双対近接分離法、Iteratively Reweighted Least Squares法などが知られている。これらはいずれも反復法である。反復法であるから評価関数を徐々に最小化していくわけだが、このとき最小化に向かっている途中の状態の出力画像f(x,y)はノイズ低減画像の推定画像と呼ぶ。最小化した状態の出力画像f(x,y)はノイズ低減画像とか、ノイズ低減された画像と呼ぶ。ノイズ低減画像の推定画像は図4の目的関数最小化部3344が生成する。なお、目的関数の最小化は、目的関数が満たすべき所定の条件の一例であり、このとき、目的関数が所定の条件を満たすように変更して得た推定画像がノイズ低減画像として出力される。
全変動ノイズ低減法は人物写真や風景写真のノイズ低減に効果的に働く。しかし、上記数式1の入力画像g(x,y)に断層画像を与えて、出力画像f(x,y)を求解した場合、出力画像はノイズが十分に除去されない。理由は断層画像にガウス性のノイズだけでなく、黒点が多く含まれていることが原因である。第1項は出力画像と入力画像とが似ていることを要請しているわけであるが、入力画像の黒点が出力画像の同じ位置に黒点が存在することを要請してしまうためである。そのため、数式1を改良した次の評価関数V1を採用する方法がよい。本実施形態は、このV1を目的関数として使用する。
Figure 2021069667
ここで、h(x,y)は、OCT装置が被写体を撮像して得た断層画像または正面画像の一例である第1の医用画像であって、第1の医用画像におけるノイズの位置の画素値を欠損(低減)させた画像であり、第2の医用画像(欠損画像)の一例である。本実施形態では、g(x,y)において黒点の位置の画素をゼロにした画像である。A(x,y)は、黒点の位置の画素をゼロ、その他の画素を1にした画像であり、ノイズの位置について画素値をマスクしたマスク画像である。本実施形態ではA(x,y)を観測行列と呼ぶ。
数式2は、次式でも同じである。
Figure 2021069667
A(x,y)の導入により、評価関数V1の第1項は、入力画像の黒点と同じ位置に出力画像の黒点が存在しない場合に評価関数の値が大きくならないようになる。すなわち、検出されたノイズ(黒点)の位置については、入力画像と出力画像との画素毎における画素値の差を考慮しないようにすることができる。このおかげで、出力画像に黒点が存在しなくなる、または黒点の数が軽減されることになり、従来の全変動ノイズ低減法よりも断層画像のノイズ低減の効果が高くなる。すなわち、ノイズ(黒点)の位置の画素値が改善された(ノイズの位置以外の画素値は似ているが、ノイズの位置の画素値は似ていない)出力画像を生成することが可能となる。このA(x,y)の生成は、ノイズ低減部334の内部ブロックの、観測行列生成部3342で行われる。
本実施形態では出力画像f(x,y)は、ステップS303でFFT処理を行った結果に、絶対値の演算を施して、さらに対数演算を行った画像を考えているが、その対数演算を行わない画像を与えてもよい。この場合、評価関数はV2を使用するとよい。
Figure 2021069667
評価関数V2において、δは対数演算を行う際に使用する定数である。評価関数V2を使用する場合は、求解アルゴリズムにより出力画像f(x,y)を求めたのちに、対数演算を施して、断層画像のノイズ低減画像を得る。具体的には
Figure 2021069667
を演算して対数画像を得て、断層画像のノイズ低減画像を得る。
画像処理システム100は、ノイズ低減部334に、ステップS303で生成した断層画像と、ステップS302の撮影パラメータを入力する。ノイズ低減部334は、断層画像と撮影パラメータをノイズ検出部3341に入力する。また、ノイズ低減部334は、断層画像を目的関数最小化部3344に入力する。
ノイズ検出部3341は、断層画像からノイズの一種である黒点を検出して、黒点の画素位置を特定する。黒点を検出する方法としては、平均画像を作成して、平均画像と断層画像を比較するという方法がある。具体的には、断層画像の画素値が平均画像の画素値より70%以下の画素を黒点と判断する。なお、この70%という数字を説明の便宜上、数Aと呼ぶ。数Aが70%とは本実施形態のケースであり、その他の実施形態として、数Aが70%より大きくても、また、小さくてもよい。黒点の発生は、撮影パラメータと関係性があるため、黒点が多く発生することが撮影パラメータから判断できるケースは、ノイズ検出部3341が数Aを自動的に大きくするようにしてもよい。例えば、数Aに初期値があり、黒点が多く発生することが撮影パラメータから判断できるケースは、初期値より大きくするという方法がある。この方法は相対的に設定するケースである。または、黒点が多く発生することが撮影パラメータから判断できるケースにおいて、ノイズ検出部3341が数Aを設定してもよい。この方法は絶対的に設定するケースである。黒点が少なく発生することが撮影パラメータから判断できるケースは自動的に数Aを小さくする方法を採ってもよい。つまり、数Aは黒点を検出するための閾値である。
または、黒点の割合が画素全体の20%となるように、ノイズ検出部3341が数Aを探索的に決定してもよい。この20%という数字を説明の便宜上、数Bと呼ぶ。数Bが大きいと黒点が多く検出することを意味し、数Bが小さいと黒点が少なく検出することを意味する。数Aを決定すると画素の割合が決まる関係にあるので、黒点の割合が画素全体の20%となるように数Aを探索的に決定するとは、数Aを100%から少しずつ減少させながら、数Bが略20%となる数Aを見つけることを意味する。なお、本実施形態では、数Bは20%であるが、その他の実施形態としては、20%より大きくても、また、小さくてもよい。上述したように黒点の発生は、撮影パラメータと関係性があるため、黒点が多く発生することが撮影パラメータから判断できるケースは、ノイズ検出部3341が数Bを自動的に大きくするようにしてもよい。この場合、数Aが探索的に決定されて、数Aは大きくなる。つまり、数Bも黒点を検出するための閾値である。
ノイズ検出部3341が黒点の画素位置x、yを特定したら、ノイズ検出部3341は黒点の画素位置を観測行列生成部3342へ入力する。観測行列生成部3342は入力された黒点の画素位置を使用して、評価関数V1やV2の、A(x,y)を生成する。A(x,y)の値は、黒点の位置の値がゼロで、それ以外が1である。ノイズ低減部334は、観測行列生成部3342が生成したA(x,y)を目的関数最小化部3344へ入力する。
さらに、ノイズ低減部334は、撮影パラメータを比率λ生成部3343に入力する。比率λ生成部3343は、評価関数V1やV2の比率λを生成するブロックである。比率λはノイズ低減の効果の強さを決めるパラメータであり、λが大きいほどノイズ低減の効果は大きくなる。ノイズの多さは撮影パラメータと関係があるため、比率λ生成部3343は撮影パラメータと関係して比率λを生成する。なお、別の実施形態として、比率λの生成は撮影パラメータに依存しなくてもよい。ノイズ低減部334は、比率λ生成部3343が生成したλを目的関数最小化部3344へ入力する。
目的関数最小化部3344は、目的関数を最小化するブロックである。本実施形態の目的関数は評価関数V1である。目的関数最小化部3344は、入力された断層画像を入力画像g(x,y)とし、入力されたA(x,y)と入力されたλを使用して、目的関数を最小化する。目的関数最小化部3344は、反復を繰り返しても目的関数の値が変化しない状態にあることを検出したときに、目的関数が最小化したと判定する。本実施形態の最小化アルゴリズムは、ADMMを使用するが、このアルゴリズムである必要はなく、目的関数を最小化することができるアルゴリズムを使用すればよい。最小化で得られる出力画像f(x,y)がノイズ低減された断層画像である。ノイズ低減部334は、目的関数最小化部3344が生成したノイズ低減された断層画像をノイズ低減部334の外部へ出力する。画像処理システム100は、ノイズ低減された断層画像を、記憶部302で記憶する。
なお、比率λは、画像処理システム100が自動的に決めるのではなく、画像処理システムを操作する人間が変更する手段があってもよい。図5は、表示部と入力部を合わせたGUIである。このGUIは、画像表示部6001と比率λ入力部7001がある。画像表示部6001はノイズ低減された断層画像を表示する領域であり、比率λ入力部7001は比率λを連続的または離散的に値を変更するためのスライダーである。本実施形態はスライダーであるが、スライダーではなく、ボタンや直接数値を入力するようなGUIであってもよい。図5は、比率λ入力部により比率λを変更すると、それに応じてノイズ低減部334が動作して、ノイズ低減された断層画像を画像表示部6001に表示するGUIの一例である。
また、本実施形態では、ノイズ検出部3341が黒点を検出したが、その他の実施形態としてノイズ検出部3341が白とび画素の位置を検出して観測行列生成部3342が白とび画素の位置をマスクするA(x,y)を生成してもよい。ここで、白とび画素とは、信号レベルが周辺近傍より極端に大きい画素である。または、その他の実施形態として、ノイズ検出部3341は、黒点と白とび画素の両方の位置を検出し、観測行列生成部3342が黒点と白とび画素の位置をマスクするA(x,y)を生成する構成であってもよい。
<ステップS305>
ステップS305では、検出部332がステップS303で生成した断層画像、または、ステップS304で生成したノイズ低減された断層画像から、網膜層の層境界を検出して、層境界線を出力する。本実施形態はステップS304で生成したノイズ低減された断層画像を使用する。検出部332は、まず、ステップS304でノイズ低減した断層画像にエッジ検出演算を施して、次に線強調フィルタを施す。線強調フィルタは、例えば、ヘッセ行列固有値に基づく強調フィルタなどがある。層検出部332は、エッジ検出演算の結果と、線強調フィルタの結果を用いて、層境界の位置を判断する。
<ステップS307>
ステップS307では、表示制御部305は、ノイズ低減した断層画像を表示部600に表示させる。すなわち、表示制御部305は、ノイズ低減画像を表示部600に表示させる。このとき、層検出部により検出した層境界線を断層画像に重畳して、表示部600に表示してもよい。
<ステップS308>
ステップS308において、不図示の指示取得部は、画像処理システム100による断層画像の撮影を終了するか否かの指示を外部から取得する。この指示は、入力部700を用いて、操作者によって入力される。処理を終了する指示を取得した場合には、画像処理システム100はその処理を終了する。一方、処理を終了せずに、撮影を続ける場合には、ステップS302に処理を戻して撮影を続行する。
以上によって、画像処理システム100の処理が行われる。
(第2の実施形態)
以下、第2の実施形態について説明する。なお、本実施形態に係る画像処理装置を備える画像処理システムは、第1の実施形態と共通している部分がある。以下では、異なる点についてのみ、説明する。
第1の実施形態では、1枚の断層画像をスキャンしていた。第2の実施形態では、同じ箇所において複数回スキャンを繰り返して複数個の断層画像を得て、これらを加算平均してノイズ低減を行うとともに、ノイズ低減部334のノイズ低減を行う。なお、加算平均による処理は、複数の推定画像を合成する合成処理の一例であり、また、加算平均して得た加算平均画像は、合成画像の一例である。まず、第1の実施形態のステップS302に加えて、本実施形態では、撮影を行うにあたり各種撮影パラメータの調整を行う際に、加算平均する個数N(N≧2)も設定する。また、第1の実施形態のステップS302のスキャンパターンに関して、3次元ボリュームを撮影するラスタースキャンや放射状スキャン、クロススキャンなどのスキャンパターンを設定するところは同じであるが、本実施形態は、各スキャンパターンにおいて、一つのライン上を繰り返し撮影する点が異なる。加算平均する個数Nが繰り返し撮影する回数である。また、第1の実施形態のステップS303では、1枚のCスキャンの断層画像を生成するが、本実施形態は、N枚のCスキャンの断層画像を生成する。さらに、第1の実施形態のステップS304はノイズ低減を行うが、本実施形態は、ノイズ低減の前に、ステップS203で生成したN個(N≧2)のCスキャンの断層画像を用いて、位置合わせ部331が絶対値の断層画像の位置合わせを行う。本実施形態では絶対値の断層画像を使用するが、絶対値の断層画像に対数演算を施した画像を使用してもよい。位置合わせ処理としては、例えば、2つの断層画像の類似度を表す評価関数を事前に定義しておき、この評価関数の値が最も良くなるように絶対値の断層画像を変形する。評価関数としては、画素値で評価する方法が挙げられる(例えば、相関係数を用いて評価を行う方法が挙げられる)。
Cスキャンの絶対値の断層画像同士の類似度を評価することはデータ量が多いため、処理時間がかかる。処理時間の高速化のために、Cスキャンの絶対値の断層画像から代表的な複数のBスキャンの断層画像を取り出して絶対値の断層画像集合を作り、絶対値の断層画像集合毎に類似度を計算する。
類似度を表す評価関数として相関係数を用いた場合の式を数式6に示す。
Figure 2021069667
数式6において、1枚目の絶対値の断層画像の領域をf(x,z)、2枚目の絶対値の断層画像の領域をg(x,z)とする。
Figure 2021069667
は、それぞれ領域f(x,z)と領域g(x,z)の平均を表す。なお数式6のfとgは、数式1〜4のfとgとは別物である。ここで領域とは位置合わせに用いるための画像領域であり、通常断層画像のサイズ以下の領域が設定され、眼の断層画像においては網膜層領域を含むように設定される事が望ましい。画像の変形処理としては、アフィン変換を用いて並進や回転を行ったり、拡大率を変化させたりする処理が挙げられる。次に、画像処理システム100は、位置合わせ部331が位置合わせした断層画像N個に対し、ノイズ低減部334で1枚ずつノイズ低減を行う。ノイズ低減部334は、N個のノイズ低減された断層画像を出力する。その後、画像処理システム100が、N個のノイズ低減された断層画像について、同じ座標のピクセル同士の加算平均を行い、加算平均をした断層画像を生成する。これらの処理を各ラインにおける複数の絶対値の断層画像に対して実行する。加算平均処理を行うことで、ノイズを減らし硝子体や網膜の信号を強調した高画質な画像を生成する事が出来る。
本実施形態によれば、加算平均のノイズ低減効果だけでなく、ノイズ低減部334によるノイズ低減効果が得られる。そのため、N回のスキャン回数の加算平均のみで得られるノイズ低減効果と同じ効果を、Nより少ないスキャン回数で得ることができる。スキャン回数が少ないと、患者を検査する時間が短くなるので、患者の負担を少なくする効果がある。なお、本実施形態では、スキャンの方法はCスキャンであるが、他の実施形態として、クロススキャンやマルチクロススキャンであってもよい。また、本実施形態では位置合わせしてからノイズ低減部334によるノイズ低減を行ったが、ノイズ低減部334によるノイズ低減を行った後に位置合わせして加算平均してもよい。
本実施形態では、N回のスキャン回数に対応するN個の断層画像に関して、ノイズ低減部334によるノイズ低減を行った。しかし、N個の全部に対してノイズ低減を行うのではなく、そのうち一部についてのみノイズ低減を行うという実施形態であってもよい。ノイズ低減部334の実行処理時間が長い場合は、N個の全部に対してノイズ低減を行うよりも一部に対して行う方が全体の処理時間を短くすることができる。また、本実施形態では、ノイズ検出部3341が黒点の位置を検出したが、黒点の位置を検出する時間を節約するために、乱数で黒点の位置を予測してもよい。この場合、乱数で生成した位置が黒点であるとは限らないため、複数回の乱数生成とノイズ低減を実行し、その結果を加算平均することでノイズ低減された断層画像として出力する。図6は、そのブロック図である。図6の画像1は、1回目の処理であり、乱数生成で黒点の位置を決定し、第1の実施形態で説明したように目的関数最小化部で評価関数を最小化して得られた画像である。図6の画像2は、2回目の処理であり、1回目と同様に乱数生成で黒点の位置を決定し、第1の実施形態で説明したように目的関数最小化部で評価関数を最小化して得られた画像である。これをM回繰り返して(複数回繰り返して)、画像1〜画像Mを得る。最後に画像1〜画像Mを加算平均して、ノイズ低減された断層画像として出力する。本実施形態はノイズの位置を予測するときに乱数で生成するが、このとき画素数全体に占めるノイズの割合を固定値とする。その他の実施形態として、OCT装置の撮影時の制御パラメータに応じて、画素数全体に占めるノイズの割合を変更してもよい。
(第3の実施形態)
以下、第3の実施形態について説明する。なお、本実施形態に係る画像処理装置を備える画像処理システムは、第1の実施形態と第2の実施形態と共通している部分がある。以下では、異なる点についてのみ、説明する。
第1および第2の実施形態では、目的関数最小化部3344で使用した目的関数は数式2のV1であるが、本実施形態では出力画像f(x,y)の代わりに、深層学習の分野で知られているCAE(Convolutional Autoencoder:畳み込みオートエンコーダ)を使用して生成する。CAEに与える入力は、入力画像g(x,y)とする。その他の実施形態として、CAEの代わりに、画像を入力して画像を出力する画像生成関数であればよく、例えば、AE(Autoencoder:オートエンコーダ)が考えられる。以下の説明のため、CAEおよび上述の画像生成関数をまとめて関数h(Image,x,y)と記す。
関数hは、画像Imageを入力して評価関数V1の入力画像g(x,y)と同じ大きさの画像を生成する関数である。便宜的にその生成画像を画像h_outと呼ぶと、画像h_outの位置x,yにおける画素値は、h(Image,x,y)である。画像h_outの位置x,yにおける画素値は、画像Imageの複数の画素値に依存し、かつ、画像Imageの複数の画素を用いた非線形関数で計算され、この非線形関数は関数の形を変更するためのパラメータを複数持っている。このように関数hは複数のパラメータを有しており、パラメータを変更すると画像h_outが変更される。本実施形態の場合の目的関数最小化部は、第1および第2の実施形態のように出力画像f(x,y)の画素を変更するのではなく、関数hを構成するパラメータを変更することにより、間接的に出力画像f(x,y)の画素を変更する。数式2〜4の出力画像f(x,y)は位置x,yに関する値が格納されており、第1および第2の実施形態の目的関数最小化部3344は、その格納されている値を変更することにより目的関数を最小化した。これに対し本実施形態は、関数hを構成するパラメータを変更することで目的関数を最小化する。CAEを用いて最小化する方法は深層学習の分野で知られており、各種の方法があるが本実施形態は最急降下法を使用する。本実施形態によれば、CAEを使用することにより、出力を非負値制約条件、つまりh(Image,x,y)≧0となる条件を付することができるようになる。例えば、CAEの最終層の活性化関数にシグモイド関数を使うことで実現できる。深層学習における学習とは目的関数を最小化することであるから、本実施形態もその意味において学習していると言えるが、少なくとも以下の事が異なる。まず、第1に、本実施形態は、深層学習で知られているような、多数の教師データを与えて学習するということを行わない。深層学習の教師データに相当するデータは本実施形態ではただ1つであり、入力画像g(x,y)である。また、第2に、深層学習は学習処理ステップと推論処理ステップを持つが、本実施形態は学習処理ステップのみであり推論処理ステップは無い。本実施形態は評価関数V1を目的関数として使用し、出力画像f(x,y)の代わりに関数h(Image,x,y)を使用して生成したが、数式4の評価関数V2を目的関数として使用し、出力画像f(x,y)の代わりに関数h(Image,x,y)を使用して生成した構成でもよい。
(第4の実施形態)
本実施形態に係る画像処理装置におけるノイズ低減部334は、断層画像を高画質化(ノイズ低減)する高画質化手段(ノイズ低減手段)の一例であり、上述した実施形態における加算平均による処理(合成処理)の代わりに、機械学習による高画質化処理を適用するものである。なお、ノイズ低減部334は、高画質化部ともよぶ。このとき、高画質化部は、少ない枚数の断層画像から生成した低画質な断層画像を機械学習モデルに入力することにより、多数枚の断層画像から生成した場合と同等の高画質な(低ノイズかつ高コントラストな)断層画像を生成する。ここで、本実施形態に係る機械学習モデルとは、処理対象として想定される所定の撮影条件で取得された低画質な画像である入力データと、入力データに対応する高画質画像である出力データ(正解データ)のペア群で構成された学習データを用いて機械学習を行うことにより生成した関数のことを指す。なお、所定の撮影条件には撮影部位、撮影方式、撮影画角、及び画像サイズ等が含まれる。
ここで、低画質な断層画像は、例えば、以下のように取得される。まず、操作者が入力部700を操作して撮影画面(プレビュー画面)中の撮影開始(Capture)ボタンを押下することにより、操作者からの指示に応じて設定された撮影条件によるOCT撮影が開始される。このとき、指示部304は、断層画像撮影装置200に対して操作者が指示した設定に基づいてOCT撮影を実施することを指示し、断層画像撮影装置200が対応するOCT断層画像を取得する。また、断層画像撮影装置200は、SLO画像の取得も行い、SLO動画像に基づく追尾処理を実行する。ここで、撮影条件の設定は、例えば、1)Macular Disease検査セットの登録、2)OCTスキャンモードの選択、3)以下の撮影パラメータ、等の設定である。また、撮影パラメータとしては、例えば、3−1)走査パターン:300Aスキャン(本)×300Bスキャン(枚)、3−2)走査領域サイズ:6×6mm、3−3)主走査方向:水平方向、等が設定される。また、撮影パラメータとしては、更に、例えば、3−4)走査間隔:0.01mm、3−5)固視灯位置:黄斑(中心窩)、3−6)コヒーレンスゲート位置:硝子体側、3−7)既定表示レポート種別:単眼検査用レポート、等が設定する。そして、表示制御部305は、取得された断層画像や撮影条件に関する情報等を表示部600に表示させる。このとき、本実施形態では、操作者が入力部700を操作して表示画面(解析結果等を表示するためのレポート画面)における不図示の高画質化ボタンを押下することにより、高画質化部が断層画像に対する高画質化処理を実施するものとする。すなわち、高画質化ボタンは、高画質化処理の実行を指示するためのボタンである。もちろん、高画質化ボタンは、(高画質化ボタンを押下する前に生成された)高画質画像の表示を指示するためのボタンであってもよい。
本実施形態において、学習データとして用いる入力データは、断層画像数の少ない単一クラスタから生成された低画質の断層画像とする。また、学習データとして用いる出力データ(正解データ)は、位置合わせ済の複数の断層画像を加算平均して得られた高画質の断層画像とする。なお、学習データとして用いる出力データはこれに限らず、例えば、多数枚の断層画像で構成される単一クラスタから生成された高画質な断層画像でもよい。また、学習データとして用いる出力データは、入力画像より高解像度な(高倍率な)断層画像を入力画像と同解像度(同倍率)にすることによって得られた高画質な断層画像でもよい。なお、機械学習モデルのトレーニングに用いる入力画像と出力画像のペアは上記に限られるものではなく、任意の公知の画像の組み合わせを用いてよい。例えば、断層画像撮影装置200や他の装置で取得した断層画像に第一のノイズ成分を付加した画像を入力画像とし、該(断層画像撮影装置200や他の装置で取得した)断層画像に(第一のノイズ成分とは異なる)第二のノイズ成分を付加した画像を出力画像として機械学習モデルのトレーニングに用いてもよい。すなわち、高画質化部は、眼底の断層画像を含む学習データを学習して得た高画質化用の学習済モデルを用いて、入力画像として入力された断層画像を高画質化するものであれば何でもよい。
本実施形態に係る高画質化部における機械学習モデルの構成例を図8に示す。機械学習モデルは、畳み込みニューラルネットワーク(Convolutional Neural Network;CNN)であり、入力値群を加工して出力する処理を担う複数の層群によって構成される。なお、上記構成に含まれる層の種類として、畳み込み(Convolution)層、ダウンサンプリング(Downsampling)層、アップサンプリング(Upsampling)層、合成(Merger)層がある。畳み込み層は、設定されたフィルタのカーネルサイズ、フィルタの数、ストライドの値、ダイレーションの値等のパラメータに従い、入力値群に対して畳み込み処理を行う層である。なお、入力される画像の次元数に応じて、上記フィルタのカーネルサイズの次元数も変更してもよい。ダウンサンプリング層は、入力値群を間引いたり、合成したりすることによって、出力値群の数を入力値群の数よりも少なくする処理である。具体的には、例えば、Max Pooling処理がある。アップサンプリング層は、入力値群を複製したり、入力値群から補間した値を追加したりすることによって、出力値群の数を入力値群の数よりも多くする処理である。具体的には、例えば、線形補間処理がある。合成層は、ある層の出力値群や画像を構成する画素値群といった値群を、複数のソースから入力し、それらを連結したり、加算したりして合成する処理を行う層である。このような構成では、入力画像1301を構成する画素値群が畳み込み処理ブロックを経て出力された値群と、入力画像1301を構成する画素値群が、合成層で合成される。その後、合成された画素値群は最後の畳み込み層で高画質画像1302に成形される。なお、図示はしないが、CNNの構成の変更例として、例えば、畳み込み層の後にバッチ正規化(Batch Normalization)層や、正規化線形関数(Rectifier Linear Unit)を用いた活性化層を組み込む等をしても良い。なお、図8では説明を簡単にするため処理対象画像を2次元画像として説明しているが、本発明はこれに限定されない。例えば、3次元の低画質の断層画像を高画質化部に入力して3次元の高画質の断層画像を出力する場合も本発明に含まれる。
ここで、GPUは、データをより多く並列処理することで効率的な演算を行うことができる。このため、ディープラーニングのような学習モデルを用いて複数回に渡り学習を行う場合には、GPUで処理を行うことが有効である。そこで、本実施形態では、学習部(不図示)の一例である画像処理部303による処理には、CPUに加えてGPUを用いる。具体的には、学習モデルを含む学習プログラムを実行する場合に、CPUとGPUが協働して演算を行うことで学習を行う。なお、学習部の処理は、CPUまたはGPUのみにより演算が行われても良い。また、高画質化部も、学習部と同様にGPUを用いても良い。また、学習部は、不図示の誤差検出部と更新部とを備えてもよい。誤差検出部は、入力層に入力される入力データに応じてニューラルネットワークの出力層から出力される出力データと、正解データとの誤差を得る。誤差検出部は、損失関数を用いて、ニューラルネットワークからの出力データと正解データとの誤差を計算するようにしてもよい。また、更新部は、誤差検出部で得られた誤差に基づいて、その誤差が小さくなるように、ニューラルネットワークのノード間の結合重み付け係数等を更新する。この更新部は、例えば、誤差逆伝播法を用いて、結合重み付け係数等を更新する。誤差逆伝播法は、上記の誤差が小さくなるように、各ニューラルネットワークのノード間の結合重み付け係数等を調整する手法である。
また、操作者は入力部700を用いてOCT計測処理(例えば、後述するような、解析結果生成、診断結果生成、物体認識、セグメンテーション等の種々の計測処理)の開始を指示することができる。例えば、操作者からの指示に応じて、高画質化用の学習済モデルにより高画質化された断層画像を用いて、後述するような種々の計測処理を実行することができるため、これらの計測処理の精度を向上することができる。
なお、上述した本実施形態において、断層画像に関して説明を行ったが、これに限らない。本実施形態に係る表示、高画質化、及び画像解析等の処理に関する画像は、正面画像やモーションコントラスト画像等であってもよい。さらには、断層画像だけではなく、SLO画像、眼底写真、又は蛍光眼底写真など、異なる画像であっても構わない。その場合、高画質化処理を実行するためのユーザーインターフェースは、種類の異なる複数の画像に対して高画質化処理の実行を指示するもの、種類の異なる複数の画像から任意の画像を選択して高画質化処理の実行を指示するものがあってもよい。
このような構成により、本実施形態に係る高画質化部が処理した画像を表示制御部305が表示部600に表示することができる。このとき、上述したように、高画質画像の表示、解析結果の表示、表示される正面画像の深度範囲等に関する複数の条件のうち少なくとも1つが選択された状態である場合には、表示画面が遷移されても、選択された状態が維持されてもよい。
また、上述したように、複数の条件のうち少なくとも1つが選択された状態である場合には、他の条件が選択された状態に変更されても、該少なくとも1つが選択された状態が維持されてもよい。例えば、表示制御部305は、解析結果の表示が選択状態である場合に、検者からの指示に応じて(例えば、不図示の高画質化ボタンが指定されると)、低画質画像の解析結果の表示を高画質画像の解析結果の表示に変更してもよい。また、表示制御部305は、解析結果の表示が選択状態である場合に、検者からの指示に応じて(例えば、不図示の高画質化ボタンの指定が解除されると)、高画質画像の解析結果の表示を低画質画像の解析結果の表示に変更してもよい。
また、表示制御部305は、高画質画像の表示が非選択状態である場合に、検者からの指示に応じて(例えば、解析結果の表示の指定が解除されると)、低画質画像の解析結果の表示を低画質画像の表示に変更してもよい。また、表示制御部305は、高画質画像の表示が非選択状態である場合に、検者からの指示に応じて(例えば、解析結果の表示が指定されると)、低画質画像の表示を低画質画像の解析結果の表示に変更してもよい。また、表示制御部305は、高画質画像の表示が選択状態である場合に、検者からの指示に応じて(例えば、解析結果の表示の指定が解除されると)、高画質画像の解析結果の表示を高画質画像の表示に変更してもよい。また、表示制御部305は、高画質画像の表示が選択状態である場合に、検者からの指示に応じて(例えば、解析結果の表示が指定されると)、高画質画像の表示を高画質画像の解析結果の表示に変更してもよい。
また、高画質画像の表示が非選択状態で且つ第1の種類の解析結果の表示が選択状態である場合を考える。この場合には、表示制御部305は、検者からの指示に応じて(例えば、第2の種類の解析結果の表示が指定されると)、低画質画像の第1の種類の解析結果の表示を低画質画像の第2の種類の解析結果の表示に変更してもよい。また、高画質画像の表示が選択状態で且つ第1の種類の解析結果の表示が選択状態である場合を考える。この場合には、表示制御部305は、検者からの指示に応じて(例えば、第2の種類の解析結果の表示が指定されると)、高画質画像の第1の種類の解析結果の表示を高画質画像の第2の種類の解析結果の表示に変更してもよい。
なお、経過観察用の表示画面においては、上述したように、これらの表示の変更が、異なる日時で得た複数の画像に対して一括で反映されるように構成してもよい。ここで、解析結果の表示は、解析結果を任意の透明度により画像に重畳表示させたものであってもよい。このとき、解析結果の表示への変更は、例えば、表示されている画像に対して任意の透明度により解析結果を重畳させた状態に変更したものであってもよい。また、解析結果の表示への変更は、例えば、解析結果と画像とを任意の透明度によりブレンド処理して得た画像(例えば、2次元マップ)の表示への変更であってもよい。
また、上述した実施形態において、表示制御部305は、高画質化部によって生成された高画質画像と入力画像のうち、検者からの指示に応じて選択された画像を表示部600に表示させることができる。また、表示制御部305は、検者からの指示に応じて、表示部600上の表示を撮影画像(入力画像)から高画質画像に切り替えてもよい。すなわち、表示制御部305は、検者からの指示に応じて、低画質画像の表示を高画質画像の表示に変更してもよい。また、表示制御部305は、検者からの指示に応じて、高画質画像の表示を低画質画像の表示に変更してもよい。
さらに、高画質化部が、高画質化エンジン(高画質化用の学習済モデル)による高画質化処理の開始(高画質化エンジンへの画像の入力)を検者からの指示に応じて実行し、表示制御部305が、高画質化部によって生成された高画質画像を表示部600に表示させてもよい。これに対し、撮影装置(断層画像撮影装置200)によって入力画像が撮影されると、高画質化エンジンが自動的に入力画像に基づいて高画質画像を生成し、表示制御部305が、検者からの指示に応じて高画質画像を表示部600に表示させてもよい。ここで、高画質化エンジンとは、上述した画質向上処理(高画質化処理)を行う学習済モデルを含む。
なお、これらの処理は解析結果の出力についても同様に行うことができる。すなわち、表示制御部305は、検者からの指示に応じて、低画質画像の解析結果の表示を高画質画像の解析結果の表示に変更してもよい。また、表示制御部305は、検者からの指示に応じて、高画質画像の解析結果の表示を低画質画像の解析結果の表示に変更してもよい。もちろん、表示制御部305は、検者からの指示に応じて、低画質画像の解析結果の表示を低画質画像の表示に変更してもよい。また、表示制御部305は、検者からの指示に応じて、低画質画像の表示を低画質画像の解析結果の表示に変更してもよい。また、表示制御部305は、検者からの指示に応じて、高画質画像の解析結果の表示を高画質画像の表示に変更してもよい。また、表示制御部305は、検者からの指示に応じて、高画質画像の表示を高画質画像の解析結果の表示に変更してもよい。
また、表示制御部305は、検者からの指示に応じて、低画質画像の解析結果の表示を低画質画像の他の種類の解析結果の表示に変更してもよい。また、表示制御部305は、検者からの指示に応じて、高画質画像の解析結果の表示を高画質画像の他の種類の解析結果の表示に変更してもよい。
ここで、高画質画像の解析結果の表示は、高画質画像の解析結果を任意の透明度により高画質画像に重畳表示させたものであってもよい。また、低画質画像の解析結果の表示は、低画質画像の解析結果を任意の透明度により低画質画像に重畳表示させたものであってもよい。このとき、解析結果の表示への変更は、例えば、表示されている画像に対して任意の透明度により解析結果を重畳させた状態に変更したものであってもよい。また、解析結果の表示への変更は、例えば、解析結果と画像とを任意の透明度によりブレンド処理して得た画像(例えば、2次元マップ)の表示への変更であってもよい。
(変形例1)
上述した様々な実施形態において、ノイズの一例である黒点の位置の検出または予測は、機械学習による物体認識用の機械学習モデルやセグメンテーション用の機械学習モデルを用いて行われてもよい。このとき、撮影して得た医用画像から、被写体の医用画像を含む学習データを学習して得た学習済モデルを用いて、ノイズの位置が検出または予測される。ここで、本変形例に係る機械学習モデルとは、医用画像の一例である断層画像である入力データと、該断層画像におけるノイズの位置がラベル付け(アノテーション)されたデータ(正解データ)のペア群で構成された学習データを用いて機械学習を行うことにより生成した関数のことを指す。なお、機械学習モデルや学習部の処理等については、図8等のような上述した種々の手法が適用可能である。また、後述の敵対的生成ネットワーク又はオートエンコーダを用いた異常部位の検出の手法により、上述のノイズの位置の検出または予測を行ってもよい。
(変形例2)
上述した様々な実施形態及び変形例における表示制御部305は、表示画面のレポート画面において、所望の層の層厚や各種の血管密度等の解析結果を表示させてもよい。また、視神経乳頭部、黄斑部、血管領域、神経線維束、硝子体領域、黄斑領域、脈絡膜領域、強膜領域、篩状板領域、網膜層境界、網膜層境界端部、視細胞、血球、血管壁、血管内壁境界、血管外側境界、神経節細胞、角膜領域、隅角領域、シュレム管等の少なくとも1つを含む注目部位に関するパラメータの値(分布)を解析結果として表示させてもよい。このとき、例えば、各種のアーチファクトの低減処理が適用された医用画像を解析することで、精度の良い解析結果を表示させることができる。なお、アーチファクトは、例えば、血管領域等による光吸収により生じる偽像領域や、プロジェクションアーチファクト、被検眼の状態(動きや瞬き等)によって測定光の主走査方向に生じる正面画像における帯状のアーチファクト等であってもよい。また、アーチファクトは、例えば、被検者の所定部位の医用画像上に撮影毎にランダムに生じるような写損領域であれば、何でもよい。また、上述したような様々なアーチファクト(写損領域)の少なくとも1つを含む領域に関するパラメータの値(分布)を解析結果として表示させてもよい。また、ドルーゼン、新生血管、白斑(硬性白斑)、シュードドルーゼン等の異常部位等の少なくとも1つを含む領域に関するパラメータの値(分布)を解析結果として表示させてもよい。
また、解析結果は、解析マップや、各分割領域に対応する統計値を示すセクタ等で表示されてもよい。なお、解析結果は、医用画像の解析結果を学習データとして学習して得た学習済モデル(解析結果生成エンジン、解析結果生成用の学習済モデル)を用いて生成されたものであってもよい。このとき、学習済モデルは、医用画像とその医用画像の解析結果とを含む学習データや、医用画像とその医用画像とは異なる種類の医用画像の解析結果とを含む学習データ等を用いた学習により得たものであってもよい。また、学習済モデルは、輝度正面画像及びモーションコントラスト正面画像のように、所定部位の異なる種類の複数の医用画像をセットとする入力データを含む学習データを用いた学習により得たものであってもよい。ここで、輝度正面画像は断層画像のEn−Face画像に対応し、モーションコントラスト正面画像はOCTAのEn−Face画像に対応する。また、高画質化用の学習済モデルにより生成された高画質画像を用いて得た解析結果が表示されるように構成されてもよい。なお、高画質化用の学習済モデルは、第一の画像を入力データとし、第一の画像よりも高画質な第二の画像を正解データとする学習データを学習して得たものであってもよい。このとき、第二の画像は、例えば、複数の第一の画像の重ね合わせ処理(例えば、位置合わせして得た複数の第一の画像の平均化処理)等によって、高コントラスト化やノイズ低減等が行われたような高画質な画像であってもよい。
また、学習データに含まれる入力データとしては、高画質化用の学習済モデルにより生成された高画質画像であってもよいし、低画質画像と高画質画像とのセットであってもよい。また、学習データは、例えば、解析領域を解析して得た解析値(例えば、平均値や中央値等)、解析値を含む表、解析マップ、画像におけるセクタ等の解析領域の位置等の少なくとも1つを含む情報を(教師あり学習の)正解データとして、入力データにラベル付け(アノテーション)したデータであってもよい。なお、検者からの指示に応じて、解析結果生成用の学習済モデルにより得た解析結果が表示されるように構成されてもよい。例えば、画像処理部303は、(高画質化用の学習済モデルとは異なる)解析結果生成用の学習済モデルを用いて、上述のノイズ低減画像から、該ノイズ低減画像に関連する解析結果を生成することができる。また、例えば、表示制御部305は、被写体の医用画像を含む学習データを学習して得た解析結果生成用の学習済モデルを用いて上述のノイズ低減画像から生成された該ノイズ低減画像に関連する解析結果を表示部600に表示させることができる。
また、上述した様々な実施形態及び変形例における表示制御部305は、表示画面のレポート画面において、緑内障や加齢黄斑変性等の種々の診断結果を表示させてもよい。このとき、例えば、上述したような各種のアーチファクトの低減処理が適用された医用画像を解析することで、精度の良い診断結果を表示させることができる。また、診断結果としては、特定された異常部位等の位置が画像上に表示されてもよいし、また、異常部位の状態等が文字等によって表示されてもよい。また、異常部位等の分類結果(例えば、Curtin分類)が診断結果として表示されてもよい。また、分類結果としては、例えば、異常部位毎の確からしさを示す情報(例えば、割合を示す数値)が表示されてもよい。また、医師が診断を確定させる上で必要な情報が診断結果として表示されてもよい。上記必要な情報としては、例えば、追加撮影等のアドバイスが考えられる。例えば、OCTA画像における血管領域に異常部位が検出された場合には、OCTAよりも詳細に血管を観察可能な造影剤を用いた蛍光撮影を追加で行う旨が表示されてもよい。
なお、診断結果は、医用画像の診断結果を学習データとして学習して得た学習済モデル(診断結果生成エンジン、診断結果生成用の学習済モデル)を用いて生成されたものであってもよい。また、学習済モデルは、医用画像とその医用画像の診断結果とを含む学習データや、医用画像とその医用画像とは異なる種類の医用画像の診断結果とを含む学習データ等を用いた学習により得たものであってもよい。また、高画質化用の学習済モデルにより生成された高画質画像を用いて得た診断結果が表示されるように構成されてもよい。
また、学習データに含まれる入力データとしては、高画質化用の学習済モデルにより生成された高画質画像であってもよいし、低画質画像と高画質画像とのセットであってもよい。また、学習データは、例えば、診断名、病変(異常部位)の種類や状態(程度)、画像における病変の位置、注目領域に対する病変の位置、所見(読影所見等)、診断名の根拠(肯定的な医用支援情報等)、診断名を否定する根拠(否定的な医用支援情報)等の少なくとも1つを含む情報を(教師あり学習の)正解データとして、入力データにラベル付け(アノテーション)したデータであってもよい。なお、検者からの指示に応じて、診断結果生成用の学習済モデルにより得た診断結果が表示されるように構成されてもよい。例えば、画像処理部303は、(高画質化用の学習済モデルとは異なる)診断結果生成用の学習済モデルを用いて、上述のノイズ低減画像から、該ノイズ低減画像に関連する診断結果を生成することができる。また、例えば、表示制御部305は、被写体の医用画像を含む学習データを学習して得た診断結果生成用の学習済モデルを用いて上述のノイズ低減画像から生成された該ノイズ低減画像に関連する診断結果を表示部600に表示させることができる。
また、上述した様々な実施形態及び変形例における表示制御部305は、表示画面のレポート画面において、上述したような注目部位、アーチファクト、異常部位等の物体認識結果(物体検出結果)やセグメンテーション結果を表示させてもよい。このとき、例えば、画像上の物体の周辺に矩形の枠等を重畳して表示させてもよい。また、例えば、画像における物体上に色等を重畳して表示させてもよい。なお、物体認識結果やセグメンテーション結果は、物体認識やセグメンテーションを示す情報を正解データとして医用画像にラベル付け(アノテーション)した学習データを学習して得た学習済モデル(物体認識エンジン、物体認識用の学習済モデル、セグメンテーションエンジン、セグメンテーション用の学習済モデル)を用いて生成されたものであってもよい。なお、上述した解析結果生成や診断結果生成は、上述した物体認識結果やセグメンテーション結果を利用することで得られたものであってもよい。例えば、物体認識やセグメンテーションの処理により得た注目部位等の部分領域に対して解析結果生成や診断結果生成の処理を行ってもよい。例えば、画像処理部303は、(高画質化用の学習済モデルとは異なる)物体認識用の学習済モデルを用いて、上述のノイズ低減画像から、該ノイズ低減画像に関連する物体認識結果を生成することができる。また、例えば、画像処理部303は、(高画質化用の学習済モデルとは異なる)セグメンテーション用の学習済モデルを用いて、上述のノイズ低減画像から、該ノイズ低減画像に関連するセグメンテーション結果を生成することができる。また、例えば、表示制御部305は、被写体の医用画像を含む学習データを学習して得た物体認識用の学習済モデルを用いて上述のノイズ低減画像から生成された物体認識結果を表示部600に表示させることができる。また、例えば、表示制御部305は、被写体の医用画像を含む学習データを学習して得たセグメンテーション用の学習済モデルを用いて上述のノイズ低減画像から生成されたセグメンテーション結果を表示部600に表示させることができる。このとき、物体認識結果やセグメンテーション結果は、例えば、ノイズ低減画像から検出された部分領域である。
また、異常部位を検出する場合には、敵対的生成ネットワーク(GAN:Generative Adversarial Netwoks)や変分オートエンコーダ―(VAE:Variational auto−encoder)を用いてもよい。例えば、断層画像の生成を学習して得た生成器と、生成器が生成した新たな断層画像と本物の眼底正面画像との識別を学習して得た識別器とからなるDCGAN(Deep Convolutional GAN)を機械学習モデルとして用いることができる。
DCGANを用いる場合には、例えば、識別器が入力された断層画像をエンコードすることで潜在変数にし、生成器が潜在変数に基づいて新たな断層画像を生成する。その後、入力された断層画像と生成された新たな断層画像との差分を異常部位として抽出(検出)することができる。また、VAEを用いる場合には、例えば、入力された断層画像をエンコーダーによりエンコードすることで潜在変数にし、潜在変数をデコーダーによりデコードすることで新たな断層画像を生成する。その後、入力された断層画像と生成された新たな断層画像像との差分を異常部位として抽出(検出)することができる。なお、入力データの例として断層画像を例として説明したが、眼底画像や前眼の正面画像等を用いてもよい。
さらに、情報処理装置は、畳み込みオートエンコーダ(CAE:Convolutional Auto−Encoder)を用いて、異常部位を検出してもよい。CAEを用いる場合には、学習時に入力データ及び出力データとして同じ画像を学習させる。これにより、推定時に異常部位がある画像をCAEに入力すると、学習の傾向に従って異常部位がない画像が出力される。その後、CAEに入力された画像とCAEから出力された画像の差分を異常部位として抽出(検出)することができる。なお、この場合にも、断層画像だけでなく、眼底画像や前眼の正面画像等を入力データとして用いてもよい。
これらの場合、情報処理装置は、敵対的生成ネットワーク又はオートエンコーダを用いて得た医用画像と、該敵対的生成ネットワーク又はオートエンコーダに入力された医用画像との差に関する情報を異常部位に関する情報として生成することができる。これにより、情報処理装置は、高速に精度よく異常部位を検出することが期待できる。ここで、オートエンコーダには、VAEやCAE等が含まれる。例えば、画像処理部303は、上述のノイズ低減画像から敵対的生成ネットワーク又はオートエンコーダを用いて得た医用画像と該ノイズ低減画像との差に関する情報を、異常部位に関する情報として生成することができる。また、例えば、表示制御部305は、上述のノイズ低減画像から敵対的生成ネットワーク又はオートエンコーダを用いて得た医用画像と該ノイズ低減画像との差に関する情報を、異常部位に関する情報として表示部600に表示させることができる。
また、疾病眼では、疾病の種類に応じて画像特徴が異なる。そのため、上述した様々な実施形態や変形例において用いられる学習済モデルは、疾病の種類毎又は異常部位毎にそれぞれ生成・用意されてもよい。この場合には、例えば、画像処理装置300は、操作者からの被検眼の疾病の種類や異常部位等の入力(指示)に応じて、処理に用いる学習済モデルを選択することができる。なお、疾病の種類や異常部位毎に用意される学習済モデルは、網膜層の検出や領域ラベル画像等の生成に用いられる学習済モデルに限られず、例えば、画像の評価用のエンジンや解析用のエンジン等で用いられる学習済モデルであってもよい。このとき、画像処理装置300は、別に用意された学習済モデルを用いて、画像から被検眼の疾病の種類や異常部位を識別してもよい。この場合には、画像処理装置300は、当該別に用意された学習済モデルを用いて識別された疾病の種類や異常部位に基づいて、上記処理に用いる学習済モデルを自動的に選択することができる。なお、当該被検眼の疾病の種類や異常部位を識別するための学習済モデルは、断層画像や眼底画像等を入力データとし、疾病の種類やこれら画像における異常部位を出力データとした学習データのペアを用いて学習を行ってよい。ここで、学習データの入力データとしては、断層画像や眼底画像等を単独で入力データとしてもよいし、これらの組み合わせを入力データとしてもよい。
また、特に診断結果生成用の学習済モデルは、被検者の所定部位の異なる種類の複数の医用画像をセットとする入力データを含む学習データにより学習して得た学習済モデルであってもよい。このとき、学習データに含まれる入力データとして、例えば、眼底のモーションコントラスト正面画像及び輝度正面画像(あるいは輝度断層画像)をセットとする入力データが考えられる。また、学習データに含まれる入力データとして、例えば、眼底の断層画像(Bスキャン画像)及びカラー眼底画像(あるいは蛍光眼底画像)をセットとする入力データ等も考えられる。また、異なる種類の複数の医療画像は、異なるモダリティ、異なる光学系、又は異なる原理等により取得されたものであれば何でもよい。
また、特に診断結果生成用の学習済モデルは、被検者の異なる部位の複数の医用画像をセットとする入力データを含む学習データにより学習して得た学習済モデルであってもよい。このとき、学習データに含まれる入力データとして、例えば、眼底の断層画像(Bスキャン画像)と前眼部の断層画像(Bスキャン画像)とをセットとする入力データが考えられる。また、学習データに含まれる入力データとして、例えば、眼底の黄斑の三次元OCT画像(三次元断層画像)と眼底の視神経乳頭のサークルスキャン(又はラスタースキャン)断層画像とをセットとする入力データ等も考えられる。
なお、学習データに含まれる入力データは、被検者の異なる部位及び異なる種類の複数の医用画像であってもよい。このとき、学習データに含まれる入力データは、例えば、前眼部の断層画像とカラー眼底画像とをセットとする入力データ等が考えられる。また、上述した学習済モデルは、被検者の所定部位の異なる撮影画角の複数の医用画像をセットとする入力データを含む学習データにより学習して得た学習済モデルであってもよい。また、学習データに含まれる入力データは、パノラマ画像のように、所定部位を複数領域に時分割して得た複数の医用画像を貼り合わせたものであってもよい。このとき、パノラマ画像のような広画角画像を学習データとして用いることにより、狭画角画像よりも情報量が多い等の理由から画像の特徴量を精度良く取得できる可能性があるため、各処理の結果を向上することができる。例えば、推定時(予測時)において、広画角画像における複数の位置で異常部位が検出された場合に、各異常部位の拡大画像を順次表示可能に構成させる。これにより、複数の位置における異常部位を効率よく確認することができるため、例えば、検者の利便性を向上することができる。このとき、例えば、異常部位が検出された広画角画像上の各位置を検者が選択可能に構成され、選択された位置における異常部位の拡大画像が表示されるように構成されてもよい。また、学習データに含まれる入力データは、被検者の所定部位の異なる日時の複数の医用画像をセットとする入力データであってもよい。
また、上述した解析結果と診断結果と物体認識結果とセグメンテーション結果とのうち少なくとも1つの結果が表示される表示画面は、レポート画面に限らない。このような表示画面は、例えば、撮影確認画面、経過観察用の表示画面、及び撮影前の各種調整用のプレビュー画面(各種のライブ動画像が表示される表示画面)等の少なくとも1つの表示画面に表示されてもよい。例えば、上述した学習済モデルを用いて得た上記少なくとも1つの結果を撮影確認画面に表示させることにより、検者は、撮影直後であっても精度の良い結果を確認することができる。また、上述した低画質画像と高画質画像との表示の変更は、例えば、低画質画像の解析結果と高画質画像の解析結果との表示の変更であってもよい。
ここで、上述した様々な学習済モデルは、学習データを用いた機械学習により得ることができる。機械学習には、例えば、多階層のニューラルネットワークから成る深層学習(Deep Learning)がある。また、多階層のニューラルネットワークの少なくとも一部には、例えば、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を機械学習モデルとして用いることができる。また、多階層のニューラルネットワークの少なくとも一部には、オートエンコーダ(自己符号化器)に関する技術が用いられてもよい。また、学習には、バックプロパゲーション(誤差逆伝搬法)に関する技術が用いられてもよい。ただし、機械学習としては、深層学習に限らず、画像等の学習データの特徴量を学習によって自ら抽出(表現)可能なモデルを用いた学習であれば何でもよい。ここで、機械学習モデルとは、ディープラーニング等の機械学習アルゴリズムによる学習モデルをいう。また、学習済モデルとは、任意の機械学習アルゴリズムによる機械学習モデルに対して、事前に適切な学習データを用いてトレーニングした(学習を行った)モデルである。ただし、学習済モデルは、それ以上の学習を行わないものではなく、追加の学習を行うこともできるものとする。また、学習データとは、入力データ及び出力データ(正解データ)のペアで構成される。ここで、学習データを教師データという場合もあるし、あるいは、正解データを教師データという場合もある。
なお、GPUは、データをより多く並列処理することで効率的な演算を行うことができる。このため、ディープラーニングのような学習モデルを用いて複数回に渡り学習を行う場合には、GPUで処理を行うことが有効である。そこで、本変形例では、学習部(不図示)の一例である画像処理部303による処理には、CPUに加えてGPUを用いる。具体的には、学習モデルを含む学習プログラムを実行する場合に、CPUとGPUが協働して演算を行うことで学習を行う。なお、学習部の処理は、CPUまたはGPUのみにより演算が行われても良い。また、上述した様々な学習済モデルを用いた処理を実行する処理部(推定部)も、学習部と同様にGPUを用いても良い。また、学習部は、不図示の誤差検出部と更新部とを備えてもよい。誤差検出部は、入力層に入力される入力データに応じてニューラルネットワークの出力層から出力される出力データと、正解データとの誤差を得る。誤差検出部は、損失関数を用いて、ニューラルネットワークからの出力データと正解データとの誤差を計算するようにしてもよい。また、更新部は、誤差検出部で得られた誤差に基づいて、その誤差が小さくなるように、ニューラルネットワークのノード間の結合重み付け係数等を更新する。この更新部は、例えば、誤差逆伝播法を用いて、結合重み付け係数等を更新する。誤差逆伝播法は、上記の誤差が小さくなるように、各ニューラルネットワークのノード間の結合重み付け係数等を調整する手法である。
また、高画質化やセグメンテーション等に用いられる機械学習モデルとしては、複数のダウンサンプリング層を含む複数の階層からなるエンコーダーの機能と、複数のアップサンプリング層を含む複数の階層からなるデコーダーの機能とを有するU−net型の機械学習モデルが適用可能である。U−net型の機械学習モデルでは、エンコーダーとして構成される複数の階層において曖昧にされた位置情報(空間情報)を、デコーダーとして構成される複数の階層において、同次元の階層(互いに対応する階層)で用いることができるように(例えば、スキップコネクションを用いて)構成される。
また、高画質化やセグメンテーション等に用いられる機械学習モデルとしては、例えば、FCN(Fully Convolutional Network)、又はSegNet等を用いることもできる。また、所望の構成に応じて領域単位で物体認識を行う機械学習モデルを用いてもよい。物体認識を行う機械学習モデルとしては、例えば、RCNN(Region CNN)、fastRCNN、又はfasterRCNNを用いることができる。さらに、領域単位で物体認識を行う機械学習モデルとして、YOLO(You Only Look Once)、又はSSD(Single Shot Detector)を用いることもできる。
また、機械学習モデルは、例えば、カプセルネットワーク(Capsule Network;CapsNet)でもよい。ここで、一般的なニューラルネットワークでは、各ユニット(各ニューロン)はスカラー値を出力するように構成されることによって、例えば、画像における特徴間の空間的な位置関係(相対位置)に関する空間情報が低減されるように構成されている。これにより、例えば、画像の局所的な歪みや平行移動等の影響が低減されるような学習を行うことができる。一方、カプセルネットワークでは、各ユニット(各カプセル)は空間情報をベクトルとして出力するように構成されることよって、例えば、空間情報が保持されるように構成されている。これにより、例えば、画像における特徴間の空間的な位置関係が考慮されたような学習を行うことができる。
また、高画質化エンジン(高画質化用の学習済モデル)は、高画質化エンジンにより生成された少なくとも1つの高画質画像を含む学習データを追加学習して得た学習済モデルであってもよい。このとき、高画質画像を追加学習用の学習データとして用いるか否かを、検者からの指示により選択可能に構成されてもよい。なお、これらの構成は、高画質化用の学習済モデルに限らず、上述した様々な学習済モデルに対しても適用可能である。また、上述した様々な学習済モデルの学習に用いられる正解データの生成には、ラベル付け(アノテーション)等の正解データを生成するための正解データ生成用の学習済モデルが用いられてもよい。このとき、正解データ生成用の学習済モデルは、検者がラベル付け(アノテーション)して得た正解データを(順次)追加学習することにより得られたものであってもよい。すなわち、正解データ生成用の学習済モデルは、ラベル付け前のデータを入力データとし、ラベル付け後のデータを出力データとする学習データを追加学習することにより得られたものであってもよい。また、動画像等のような連続する複数フレームにおいて、前後のフレームの物体認識やセグメンテーション等の結果を考慮して、結果の精度が低いと判定されたフレームの結果を修正するように構成されてもよい。このとき、検者からの指示に応じて、修正後の結果を正解データとして追加学習するように構成されてもよい。
(変形例3)
上述した様々な実施形態及び変形例において、物体認識用の学習済モデルやセグメンテーション用の学習済モデルを用いて被検眼の領域(部分領域)を検出する場合には、検出した領域毎に所定の画像処理を施すこともできる。例えば、硝子体領域、網膜領域、及び脈絡膜領域のうちの少なくとも2つの領域を検出する場合を考える。この場合には、検出された少なくとも2つの領域に対してコントラスト調整等の画像処理を施す際に、それぞれ異なる画像処理のパラメータを用いることで、各領域に適した調整を行うことができる。各領域に適した調整が行われた画像を表示することで、操作者は領域毎の疾病等をより適切に診断することができる。なお、検出された領域毎に異なる画像処理のパラメータを用いる構成については、例えば、学習済モデルを用いずに検出された被検眼の領域について同様に適用されてもよい。
(変形例4)
上述した様々な実施形態及び変形例におけるプレビュー画面において、ライブ動画像の少なくとも1つのフレーム毎に上述した学習済モデルが用いられるように構成されてもよい。このとき、プレビュー画面において、異なる部位や異なる種類の複数のライブ動画像が表示されている場合には、各ライブ動画像に対応する学習済モデルが用いられるように構成されてもよい。これにより、例えば、ライブ動画像であっても、処理時間を短縮することができるため、検者は撮影開始前に精度の高い情報を得ることができる。このため、例えば、再撮影の失敗等を低減することができるため、診断の精度や効率を向上させることができる。なお、複数のライブ動画像は、例えば、XYZ方向のアライメントのための前眼部の動画像、及び眼底観察光学系のフォーカス調整やOCTフォーカス調整のための眼底の正面動画像であってよい。また、複数のライブ動画像は、例えば、OCTのコヒーレンスゲート調整(測定光路長と参照光路長との光路長差の調整)のための眼底の断層動画像等であってもよい。このとき、上述した物体認識用の学習済モデルやセグメンテーション用の学習済モデルを用いて検出された領域が所定の条件を満たすように、上述した各種調整が行われるように構成されてもよい。例えば、物体認識用の学習済モデルやセグメンテーション用の学習済モデルを用いて検出された硝子体領域やRPE等の所定の網膜層等に関する値(例えば、コントラスト値あるいは強度値)が閾値を超える(あるいはピーク値になる)ように、OCTフォーカス調整等の各種調整が行われるように構成されてもよい。また、例えば、物体認識用の学習済モデルやセグメンテーション用の学習済モデルを用いて検出された硝子体領域やRPE等の所定の網膜層が深さ方向における所定の位置になるように、OCTのコヒーレンスゲート調整が行われるように構成されてもよい。
また、上述した学習済モデルを適用可能な動画像は、ライブ動画像に限らず、例えば、記憶部302に記憶(保存)された動画像であってもよい。このとき、例えば、記憶部302に記憶(保存)された眼底の断層動画像の少なくとも1つのフレーム毎に位置合わせして得た動画像が表示画面に表示されてもよい。例えば、硝子体領域を好適に観察したい場合には、まず、フレーム上に硝子体領域ができるだけ存在する等の条件を基準とする基準フレームを選択してもよい。このとき、各フレームは、XZ方向の断層画像(Bスキャン像)である。そして、選択された基準フレームに対して他のフレームがXZ方向に位置合わせされた動画像が表示画面に表示されてもよい。このとき、例えば、動画像の少なくとも1つのフレーム毎に高画質化用の学習済モデルにより順次生成された高画質画像(高画質フレーム)を連続表示させるように構成してもよい。
なお、上述したフレーム間の位置合わせの手法としては、X方向の位置合わせの手法とZ方向(深度方向)の位置合わせの手法とは、同じ手法が適用されてもよいし、全て異なる手法が適用されてもよい。また、同一方向の位置合わせは、異なる手法で複数回行われてもよく、例えば、粗い位置合わせを行った後に、精密な位置合わせが行われてもよい。また、位置合わせの手法としては、例えば、断層画像(Bスキャン像)をセグメンテーション処理して得た網膜層境界を用いた(Z方向の粗い)位置合わせ、断層画像を分割して得た複数の領域と基準画像との相関情報(類似度)を用いた(X方向やZ方向の精密な)位置合わせ、断層画像(Bスキャン像)毎に生成した1次元投影像を用いた(X方向の)位置合わせ、2次元正面画像を用いた(X方向の)位置合わせ等がある。また、ピクセル単位で粗く位置合わせが行われてから、サブピクセル単位で精密な位置合わせが行われるように構成されてもよい。
ここで、各種の調整中では、被検眼の網膜等の撮影対象がまだ上手く撮像できていない可能性がある。このため、学習済モデルに入力される医用画像と学習データとして用いられた医用画像との違いが大きいために、精度良く高画質画像が得られない可能性がある。そこで、断層画像(Bスキャン)の画質評価等の評価値が閾値を超えたら、高画質動画像の表示(高画質フレームの連続表示)を自動的に開始するように構成してもよい。また、断層画像(Bスキャン)の画質評価等の評価値が閾値を超えたら、高画質化ボタンを検者が指定可能な状態(アクティブ状態)に変更するように構成されてもよい。なお、高画質化ボタンは、高画質化処理の実行を指定するためのボタンである。もちろん、高画質化ボタンは、高画質画像の表示を指示するためのボタンであってもよい。
また、走査パターン等が異なる撮影モード毎に異なる高画質化用の学習済モデルを用意して、選択された撮影モードに対応する高画質化用の学習済モデルが選択されるように構成されてもよい。また、異なる撮影モードで得た様々な医用画像を含む学習データを学習して得た1つの高画質化用の学習済モデルが用いられてもよい。
(変形例5)
上述した様々な実施形態及び変形例においては、学習済モデルが追加学習中である場合、追加学習中の学習済モデル自体を用いて出力(推論・予測)することが難しい可能性がある。このため、追加学習中の学習済モデルに対する医用画像の入力を禁止することがよい。また、追加学習中の学習済モデルと同じ学習済モデルをもう一つ予備の学習済モデルとして用意してもよい。このとき、追加学習中には、予備の学習済モデルに対して医用画像の入力が実行できるようにすることがよい。そして、追加学習が完了した後に、追加学習後の学習済モデルを評価し、問題なければ、予備の学習済モデルから追加学習後の学習済モデルに置き換えればよい。また、問題があれば、予備の学習済モデルが用いられるようにしてもよい。なお、学習済モデルの評価としては、例えば、高画質化用の学習済モデルで得た高画質画像を他の種類の画像と分類するための分類用の学習済モデルが用いられてもよい。分類用の学習済モデルは、例えば、高画質化用の学習済モデルで得た高画質画像と低画質画像とを含む複数の画像を入力データとし、これらの画像の種類がラベル付け(アノテーション)されたデータを正解データとして含む学習データを学習して得た学習済モデルであってもよい。このとき、推定時(予測時)の入力データの画像の種類が、学習時の正解データに含まれる画像の種類毎の確からしさを示す情報(例えば、割合を示す数値)と合わせて表示されてもよい。なお、分類用の学習済モデルの入力データとしては、上記の画像以外にも、複数の低画質画像の重ね合わせ処理(例えば、位置合わせして得た複数の低画質画像の平均化処理)等によって、高コントラスト化やノイズ低減等が行われたような高画質な画像が含まれても良い。
また、撮影部位毎に学習して得た学習済モデルを選択的に利用できるようにしてもよい。具体的には、第1の撮影部位(肺、被検眼等)を含む学習データを用いて得た第1の学習済モデルと、第1の撮影部位とは異なる第2の撮影部位を含む学習データを用いて得た第2の学習済モデルと、を含む複数の学習済モデルを用意することができる。そして、画像処理部303は、これら複数の学習済モデルのいずれかを選択する選択手段(不図示)を有してもよい。このとき、画像処理部303は、選択された学習済モデルに対して追加学習として実行する制御手段(不図示)を有してもよい。制御手段は、検者からの指示に応じて、選択された学習済モデルに対応する撮影部位と該撮影部位の撮影画像とがペアとなるデータを検索し、検索して得たデータを学習データとする学習を、選択された学習済モデルに対して追加学習として実行することができる。なお、選択された学習済モデルに対応する撮影部位は、データのヘッダの情報から取得したり、検者により手動入力されたりしたものであってよい。また、データの検索は、例えば、病院や研究所等の外部施設のサーバ等からネットワークを介して行われてよい。これにより、学習済モデルに対応する撮影部位の撮影画像を用いて、撮影部位毎に効率的に追加学習することができる。
なお、選択手段及び制御手段は、画像処理部303のCPUやMPU等のプロセッサによって実行されるソフトウェアモジュールにより構成されてよい。また、選択手段及び制御手段は、ASIC等の特定の機能を果たす回路や独立した装置等によって構成されてもよい。
また、追加学習用の学習データを、病院や研究所等の外部施設のサーバ等からネットワークを介して取得する際には、改ざんや、追加学習時のシステムトラブル等による信頼性低下を低減したい。そこで、デジタル署名やハッシュ化による一致性の確認を行うことで、追加学習用の学習データの正当性を検出してもよい。これにより、追加学習用の学習データを保護することができる。このとき、デジタル署名やハッシュ化による一致性の確認した結果として、追加学習用の学習データの正当性が検出できなかった場合には、その旨の警告を行い、その学習データによる追加学習を行わない。なお、サーバは、その設置場所を問わず、例えば、クラウドサーバ、フォグサーバ、エッジサーバ等のどのような形態でもよい。
(変形例6)
上述した様々な実施形態及び変形例において、検者からの指示は、手動による指示(例えば、ユーザーインターフェース等を用いた指示)以外にも、音声等による指示であってもよい。このとき、例えば、機械学習により得た音声認識モデル(音声認識エンジン、音声認識用の学習済モデル)を含む機械学習モデルが用いられてもよい。また、手動による指示は、キーボードやタッチパネル等を用いた文字入力等による指示であってもよい。このとき、例えば、機械学習により得た文字認識モデル(文字認識エンジン、文字認識用の学習済モデル)を含む機械学習モデルが用いられてもよい。また、検者からの指示は、ジェスチャー等による指示であってもよい。このとき、機械学習により得たジェスチャー認識モデル(ジェスチャー認識エンジン、ジェスチャー認識用の学習済モデル)を含む機械学習モデルが用いられてもよい。
また、検者からの指示は、表示部600における表示画面上の検者の視線検出結果等であってもよい。視線検出結果は、例えば、表示部600における表示画面の周辺から撮影して得た検者の動画像を用いた瞳孔検出結果であってもよい。このとき、動画像からの瞳孔検出は、上述したような物体認識エンジンを用いてもよい。また、検者からの指示は、脳波、体を流れる微弱な電気信号等による指示であってもよい。
このような場合、例えば、学習データとしては、上述したような種々の学習済モデルの処理による結果の表示の指示を示す文字データ又は音声データ(波形データ)等を入力データとし、種々の学習済モデルの処理による結果等を実際に表示部に表示させるための実行命令を正解データとする学習データであってもよい。また、学習データとしては、例えば、高画質化用の学習済モデルで得た高画質画像の表示の指示を示す文字データ又は音声データ等を入力データとし、高画質画像の表示の実行命令及び高画質化ボタンをアクティブ状態に変更するための実行命令を正解データとする学習データであってもよい。もちろん、学習データとしては、例えば、文字データ又は音声データ等が示す指示内容と実行命令内容とが互いに対応するものであれば何でもよい。また、音響モデルや言語モデル等を用いて、音声データから文字データに変換してもよい。また、複数のマイクで得た波形データを用いて、音声データに重畳しているノイズデータを低減する処理を行ってもよい。また、文字又は音声等による指示と、マウス、タッチパネル等による指示とを、検者からの指示に応じて選択可能に構成されてもよい。また、文字又は音声等による指示のオン・オフを、検者からの指示に応じて選択可能に構成されてもよい。
ここで、機械学習には、上述したような深層学習があり、また、多階層のニューラルネットワークの少なくとも一部には、例えば、再帰型ニューラルネットワーク(RNN:Recurrernt Neural Network)を用いることができる。ここで、本変形例に係る機械学習モデルの一例として、時系列情報を扱うニューラルネットワークであるRNNに関して、図9(a)及び(b)を参照して説明する。また、RNNの一種であるLong short−term memory(以下、LSTM)に関して、図10(a)及び(b)を参照して説明する。
図9(a)は、機械学習モデルであるRNNの構造を示す。RNN3520は、ネットワークにループ構造を持ち、時刻tにおいてデータx3510を入力し、データh3530を出力する。RNN3520はネットワークにループ機能を持つため、現時刻の状態を次の状態に引き継ぐことが可能であるため、時系列情報を扱うことができる。図9(b)には時刻tにおけるパラメータベクトルの入出力の一例を示す。データx3510にはN個(Params1〜ParamsN)のデータが含まれる。また、RNN3520より出力されるデータh3530には入力データに対応するN個(Params1〜ParamsN)のデータが含まれる。
しかし、RNNでは誤差逆伝搬時に長期時間の情報を扱うことができないため、LSTMが用いられることがある。LSTMは、忘却ゲート、入力ゲート、及び出力ゲートを備えることで長期時間の情報を学習することができる。ここで、図10(a)にLSTMの構造を示す。LSTM3540において、ネットワークが次の時刻tに引き継ぐ情報は、セルと呼ばれるネットワークの内部状態ct−1と出力データht−1である。なお、図の小文字(c、h、x)はベクトルを表している。
次に、図10(b)にLSTM3540の詳細を示す。図10(b)において、FGは忘却ゲートネットワーク、IGは入力ゲートネットワーク、OGは出力ゲートネットワークを示し、それぞれはシグモイド層である。そのため、各要素が0から1の値となるベクトルを出力する。忘却ゲートネットワークFGは過去の情報をどれだけ保持するかを決め、入力ゲートネットワークIGはどの値を更新するかを判定するものである。CUは、セル更新候補ネットワークであり、活性化関数tanh層である。これは、セルに加えられる新たな候補値のベクトルを作成する。出力ゲートネットワークOGは、セル候補の要素を選択し次の時刻にどの程度の情報を伝えるか選択する。
なお、上述したLSTMのモデルは基本形であるため、ここで示したネットワークに限らない。ネットワーク間の結合を変更してもよい。LSTMではなく、QRNN(Quasi Recurrent Neural Network)を用いてもよい。さらに、機械学習モデルは、ニューラルネットワークに限定されるものではなく、ブースティングやサポートベクターマシン等が用いられてもよい。また、検者からの指示が文字又は音声等による入力の場合には、自然言語処理に関する技術(例えば、Sequence toSequence)が適用されてもよい。また、検者に対して文字又は音声等による出力で応答する対話エンジン(対話モデル、対話用の学習済モデル)が適用されてもよい。
(変形例7)
上述した様々な実施形態及び変形例において、高画質画像等は、検者からの指示に応じて記憶部302に保存されてもよい。このとき、高画質画像等を保存するための検者からの指示の後、ファイル名の登録の際に、推奨のファイル名として、ファイル名のいずれかの箇所(例えば、最初の箇所、最後の箇所)に、高画質化用の学習済モデルを用いた処理(高画質化処理)により生成された画像であることを示す情報(例えば、文字)を含むファイル名が、検者からの指示に応じて編集可能な状態で表示されてもよい。
また、レポート画面等の種々の表示画面において、表示部600に高画質画像を表示させる際に、表示されている画像が高画質化用の学習済モデルを用いた処理により生成された高画質画像であることを示す表示が、高画質画像とともに表示されてもよい。この場合には、検者は、当該表示によって、表示された高画質画像が撮影によって取得した画像そのものではないことが容易に識別できるため、誤診断を低減させたり、診断効率を向上させたりすることができる。なお、高画質化用の学習済モデルを用いた処理により生成された高画質画像であることを示す表示は、入力画像と当該処理により生成された高画質画像とを識別可能な表示であればどのような態様のものでもよい。また、高画質化用の学習済モデルを用いた処理だけでなく、上述したような種々の学習済モデルを用いた処理についても、その種類の学習済モデルを用いた処理により生成された結果であることを示す表示が、その結果とともに表示されてもよい。
このとき、レポート画面等の表示画面は、検者からの指示に応じて、画像データとして記憶部302に保存されてもよい。例えば、高画質画像等と、これらの画像が高画質化用の学習済モデルを用いた処理により生成された高画質画像であることを示す表示とが並んだ1つの画像としてレポート画面が記憶部302に保存されてもよい。
また、高画質化用の学習済モデルを用いた処理により生成された高画質画像であることを示す表示について、高画質化用の学習済モデルがどのような学習データによって学習を行ったものであるかを示す表示が表示部に表示されてもよい。当該表示としては、学習データの入力データと正解データの種類の説明や、入力データと正解データに含まれる撮影部位等の正解データに関する任意の表示を含んでよい。なお、高画質化用の学習済モデルを用いた処理だけでなく、上述したような種々の学習済モデルを用いた処理についても、その種類の学習済モデルがどのような学習データによって学習を行ったものであるかを示す表示が表示部に表示されてもよい。
また、高画質化用の学習済モデルを用いた処理により生成された画像であることを示す情報(例えば、文字)を、高画質画像等に重畳した状態で表示又は保存されるように構成されてもよい。このとき、画像上に重畳する箇所は、撮影対象となる注目部位等が表示されている領域には重ならない領域(例えば、画像の端)であればどこでもよい。また、重ならない領域を判定し、判定された領域に重畳させてもよい。
また、レポート画面の初期表示画面として、高画質化ボタンがアクティブ状態(高画質化処理がオン)となるようにデフォルト設定されている場合には、検者からの指示に応じて、高画質画像等を含むレポート画面に対応するレポート画像が外部記憶部500等のサーバに送信されるように構成されてもよい。また、高画質化ボタンがアクティブ状態となるようにデフォルト設定されている場合には、検査終了時(例えば、検者からの指示に応じて、撮影確認画面やプレビュー画面からレポート画面に変更された場合)に、高画質画像等を含むレポート画面に対応するレポート画像がサーバに(自動的に)送信されるように構成されてもよい。このとき、デフォルト設定における各種設定(例えば、レポート画面の初期表示画面におけるEn−Face画像の生成のための深度範囲、解析マップの重畳の有無、高画質画像か否か、経過観察用の表示画面か否か等の少なくとも1つに関する設定)に基づいて生成されたレポート画像がサーバに送信されるように構成されもよい。
(変形例8)
上述した様々な実施形態及び変形例において、上述したような種々の学習済モデルのうち、第1の種類の学習済モデルで得た画像(例えば、高画質画像、解析マップ等の解析結果を示す画像、物体認識結果を示す画像、セグメンテーション結果を示す画像)を、第1の種類とは異なる第2の種類の学習済モデルに入力してもよい。このとき、第2の種類の学習済モデルの処理による結果(例えば、解析結果、診断結果、物体認識結果、セグメンテーション結果)が生成されるように構成されてもよい。
また、上述したような種々の学習済モデルのうち、第1の種類の学習済モデルの処理による結果(例えば、解析結果、診断結果、物体認識結果、セグメンテーション結果)を用いて、第1の種類の学習済モデルに入力した画像から、第1の種類とは異なる第2の種類の学習済モデルに入力する画像を生成してもよい。このとき、生成された画像は、第2の種類の学習済モデルにより処理する画像として適した画像である可能性が高い。このため、生成された画像を第2の種類の学習済モデルに入力して得た画像(例えば、高画質画像、解析マップ等の解析結果を示す画像、物体認識結果を示す画像、セグメンテーション結果を示す画像)の精度を向上することができる。
また、上述したような種々の学習済モデルは、被検体の2次元の医用画像を含む学習データを学習して得た学習済モデルであってもよいし、また、被検体の3次元の医用画像を含む学習データを学習して得た学習済モデルであってもよい。
また、上述したような学習済モデルの処理による解析結果や診断結果等を検索キーとして、サーバ等に格納された外部のデータベースを利用した類似症例画像検索を行ってもよい。なお、データベースにおいて保存されている複数の画像が、既に機械学習等によって該複数の画像それぞれの特徴量を付帯情報として付帯された状態で管理されている場合等には、画像自体を検索キーとする類似症例画像検索エンジン(類似症例画像検索モデル、類似症例画像検索用の学習済モデル)が用いられてもよい。例えば、画像処理部303は、(高画質化用の学習済モデルとは異なる)類似症例画像検索用の学習済モデルを用いて、上述のノイズ低減画像から、該ノイズ低減画像に関連する類似症例画像の検索を行うことができる。また、例えば、表示制御部305は、被写体の医用画像を含む学習データを学習して得た類似症例画像検索用の学習済モデルを用いて上述のノイズ低減画像から得た該ノイズ低減画像に関連する類似症例画像を表示部600に表示させることができる。
(変形例9)
上述した様々な実施形態及び変形例において、上記各種処理は、断層画像の輝度値に基づいて行われる構成に限られない。上記各種処理は、断層画像撮影装置200で取得された干渉信号、干渉信号にフーリエ変換を施した信号、該信号に任意の処理を施した信号、及びこれらに基づく断層画像等を含む断層データに対して適用されてよい。これらの場合も、上記構成と同様の効果を奏することができる。例えば、分割手段として光カプラを使用したファイバ光学系を用いているが、コリメータとビームスプリッタを使用した空間光学系を用いてもよい。また、断層画像撮影装置200の構成は、上記の構成に限られず、断層画像撮影装置200に含まれる構成の一部を断層画像撮影装置200と別体の構成としてもよい。また、上記の構成では、断層画像撮影装置200の干渉光学系としてマイケルソン型干渉計の構成が用いられているが、干渉光学系の構成はこれに限られない。例えば、断層画像撮影装置200の干渉光学系は、マッハツェンダー干渉計の構成を有していてもよい。また、OCT装置として、SLDを光源として用いたスペクトラルドメインOCT(SD−OCT)装置について述べられているが、OCT装置の構成はこれに限られない。例えば、出射光の波長を掃引することができる波長掃引光源を用いた波長掃引型OCT(SS−OCT)装置等の他の任意の種類のOCT装置にも本発明を適用することができる。また、ライン光を用いたLine−OCT装置(あるいはSS−Line−OCT装置)に対して本発明を適用することもできる。また、エリア光を用いたFull Field−OCT装置(あるいはSS−Full Field−OCT装置)にも本発明を適用することもできる。また、画像処理部303は、断層画像撮影装置200で取得された干渉信号や画像処理部で生成された三次元断層画像等を取得しているが、画像処理部303がこれらの信号や画像を取得する構成はこれに限られない。例えば、画像処理部303は、LAN、WAN、又はインターネット等を介して接続されるサーバや撮影装置からこれらの信号を取得してもよい。
なお、学習済モデルは、画像処理部303に設けられることができる。学習済モデルは、例えば、CPU等のプロセッサによって実行されるソフトウェアモジュール等で構成されることができる。また、学習済モデルは、画像処理部303と接続される別のサーバ等に設けられてもよい。この場合には、画像処理部303は、インターネット等の任意のネットワークを介して学習済モデルを備えるサーバに接続することで、学習済モデルを用いて高画質化処理を行うことができる。
(変形例10)
また、上述した様々な実施形態及び変形例による画像処理装置又は画像処理方法によって処理される画像は、任意のモダリティ(撮影装置、撮影方法)を用いて取得された医用画像を含む。処理される医用画像は、任意の撮影装置等で取得された医用画像や、上記実施形態及び変形例による画像処理装置又は画像処理方法によって作成された画像を含むことができる。
さらに、処理される医用画像は、被検者(被検体)の所定部位の画像であり、所定部位の画像は被検者の所定部位の少なくとも一部を含む。また、当該医用画像は、被検者の他の部位を含んでもよい。また、医用画像は、静止画像又は動画像であってよく、白黒画像又はカラー画像であってもよい。さらに医用画像は、所定部位の構造(形態)を表す画像でもよいし、その機能を表す画像でもよい。機能を表す画像は、例えば、OCTA画像、ドップラーOCT画像、fMRI画像、及び超音波ドップラー画像等の血流動態(血流量、血流速度等)を表す画像を含む。なお、被検者の所定部位は、撮影対象に応じて決定されてよく、人眼(被検眼)、脳、肺、腸、心臓、すい臓、腎臓、及び肝臓等の臓器、頭部、胸部、脚部、並びに腕部等の任意の部位を含む。
また、医用画像は、被検者の断層画像であってもよいし、正面画像であってもよい。正面画像は、例えば、眼底正面画像や、前眼部の正面画像、蛍光撮影された眼底画像、OCTで取得したデータ(三次元のOCTデータ)について撮影対象の深さ方向における少なくとも一部の範囲のデータを用いて生成したEn−Face画像を含む。En−Face画像は、三次元のOCTAデータ(三次元のモーションコントラストデータ)について撮影対象の深さ方向における少なくとも一部の範囲のデータを用いて生成したOCTAのEn−Face画像(モーションコントラスト正面画像)でもよい。また、三次元のOCTデータや三次元のモーションコントラストデータは、三次元の医用画像データの一例である。
ここで、モーションコントラストデータとは、被検眼の同一領域(同一位置)において測定光が複数回走査されるように制御して得た複数のボリュームデータ間での変化を示すデータである。このとき、ボリュームデータは、異なる位置で得た複数の断層画像により構成される。そして、異なる位置それぞれにおいて、略同一位置で得た複数の断層画像の間での変化を示すデータを得ることで、モーションコントラストデータをボリュームデータとして得ることができる。なお、モーションコントラスト正面画像は、血流の動きを測定するOCTアンギオグラフィ(OCTA)に関するOCTA正面画像(OCTAのEn−Face画像)とも呼ばれ、モーションコントラストデータはOCTAデータとも呼ばれる。モーションコントラストデータは、例えば、2枚の断層画像又はこれに対応する干渉信号間の脱相関値、分散値、又は最大値を最小値で割った値(最大値/最小値)として求めることができ、公知の任意の方法により求められてよい。このとき、2枚の断層画像は、例えば、被検眼の同一領域(同一位置)において測定光が複数回走査されるように制御して得ることができる。
また、En−Face画像は、例えば、2つの層境界の間の範囲のデータをXY方向に投影して生成した正面画像である。このとき、正面画像は、光干渉を用いて得たボリュームデータ(三次元の断層画像)の少なくとも一部の深度範囲であって、2つの基準面に基づいて定められた深度範囲に対応するデータを二次元平面に投影又は積算して生成される。En−Face画像は、ボリュームデータのうちの、検出された網膜層に基づいて決定された深度範囲に対応するデータを二次元平面に投影して生成された正面画像である。なお、2つの基準面に基づいて定められた深度範囲に対応するデータを二次元平面に投影する手法としては、例えば、当該深度範囲内のデータの代表値を二次元平面上の画素値とする手法を用いることができる。ここで、代表値は、2つの基準面に囲まれた領域の深さ方向の範囲内における画素値の平均値、中央値又は最大値などの値を含むことができる。また、En−Face画像に係る深度範囲は、例えば、検出された網膜層に関する2つの層境界の一方を基準として、より深い方向又はより浅い方向に所定の画素数分だけ含んだ範囲であってもよい。また、En−Face画像に係る深度範囲は、例えば、検出された網膜層に関する2つの層境界の間の範囲から、操作者の指示に応じて変更された(オフセットされた)範囲であってもよい。
また、撮影装置とは、診断に用いられる画像を撮影するための装置である。撮影装置は、例えば、被検者の所定部位に光、X線等の放射線、電磁波、又は超音波等を照射することにより所定部位の画像を得る装置や、被写体から放出される放射線を検出することにより所定部位の画像を得る装置を含む。より具体的には、上述した様々な実施形態及び変形例に係る撮影装置は、少なくとも、X線撮影装置、CT装置、MRI装置、PET装置、SPECT装置、SLO装置、OCT装置、OCTA装置、眼底カメラ、及び内視鏡等を含む。
なお、OCT装置としては、タイムドメインOCT(TD−OCT)装置やフーリエドメインOCT(FD−OCT)装置を含んでよい。また、フーリエドメインOCT装置はスペクトラルドメインOCT(SD−OCT)装置や波長掃引型OCT(SS−OCT)装置を含んでよい。また、SLO装置やOCT装置として、波面補償光学系を用いた波面補償SLO(AO−SLO)装置や波面補償OCT(AO−OCT)装置等を含んでよい。また、SLO装置やOCT装置として、偏光位相差や偏光解消に関する情報を可視化するための偏光SLO(PS−SLO)装置や偏光OCT(PS−OCT)装置等を含んでよい。
(その他の実施形態)
上記のそれぞれの実施形態は、画像処理装置として実現したものである。しかしながら、本発明は画像処理装置のみに限定されるものではない。本発明をコンピュータ上で動作するソフトウェアとして実現することも可能である。画像処理装置のCPUは、RAMやROMに格納されたコンピュータプログラムやデータを用いてコンピュータ全体の制御を行う。また、画像処理装置の各部に対応するソフトウェアの実行を制御して、各部の機能を実現する。また、ボタンなどのユーザーインターフェースや表示のレイアウトは上記で示したものに限定されるものではない。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した様々な実施形態及び変形例の1以上の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、上述した様々な実施形態及び変形例の1以上の機能を実現するソフトウェア(プログラム)を、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータがプログラムを読出し実行する処理でも実現可能である。コンピュータは、1つ又は複数のプロセッサ若しくは回路を有し、コンピュータ実行可能命令を読み出し実行するために、分離した複数のコンピュータ又は分離した複数のプロセッサ若しくは回路のネットワークを含みうる。
このとき、プロセッサ又は回路は、中央演算処理装置(CPU)、マイクロプロセッシングユニット(MPU)、グラフィクスプロセッシングユニット(GPU)、特定用途向け集積回路(ASIC)、又はフィールドプログラマブルゲートウェイ(FPGA)を含みうる。また、プロセッサ又は回路は、デジタルシグナルプロセッサ(DSP)、データフロープロセッサ(DFP)、又はニューラルプロセッシングユニット(NPU)を含みうる。

Claims (27)

  1. 被写体を撮像して得た第1の医用画像におけるノイズの位置を検出する手段と、
    前記第1の医用画像における前記検出されたノイズの位置の画素値を低減させた第2の医用画像と、前記第1の医用画像におけるノイズが低減されたと推定される推定画像とを生成する手段と、
    前記第2の医用画像と前記推定画像との差に関する第1項と前記推定画像に関する第2項とを含む目的関数を用いて、前記推定画像を変更する手段と、
    前記目的関数が所定の条件を満たすように変更して得た推定画像をノイズ低減画像として出力する手段と、
    を有する画像処理装置。
  2. OCT装置の撮影時の制御パラメータに応じて、前記ノイズの位置を検出するための閾値を変更する手段を更に有する請求項1に記載の画像処理装置。
  3. 前記ノイズの位置を検出する手段は、前記第1の医用画像における信号レベルが周辺近傍より大きい画素と、前記第1の医用画像における信号レベルが周辺近傍より小さい画素との少なくとも1つを、前記ノイズの位置として検出する請求項1または2に記載の画像処理装置。
  4. 被写体を撮影して得た第1の医用画像におけるノイズの位置を予測する手段と、
    前記第1の医用画像における前記予測されたノイズの位置の画素値を低減させた第2の医用画像と、前記第1の医用画像におけるノイズが低減されたと推定される推定画像とを生成する手段と、
    前記第2の医用画像と前記推定画像との差に関する第1項と前記推定画像に関する第2項とを含む目的関数を用いて、前記推定画像を変更する手段と、
    前記目的関数が所定の条件を満たすように変更して得た推定画像であって、前記ノイズの位置を乱数として予測して得た複数の前記推定画像を合成して得た合成画像をノイズ低減画像として出力する手段と、
    を有する画像処理装置。
  5. 前記ノイズの位置が乱数として予測される際に、OCT装置の撮影時の制御パラメータに応じて、前記第1の医用画像における画素数に占めるノイズに関する画素数の割合を変更する請求項4に記載の画像処理装置。
  6. 前記目的関数は、前記第1項である誤差項と前記第2項である全変動正則化項との比率を変更するためのパラメータを有する請求項1乃至5のいずれか1項に記載の画像処理装置。
  7. 操作者からの指示に応じて、前記パラメータを設定する手段を更に有する請求項6に記載の画像処理装置。
  8. 前記パラメータは、OCT装置の撮影時の制御パラメータに応じて変更される請求項6または7に記載の画像処理装置。
  9. 前記第1の医用画像は、OCT装置が前記被写体を撮像して得た断層画像または正面画像である請求項1乃至8のいずれか1項に記載の画像処理装置。
  10. 前記被写体は、被検眼である請求項1乃至9のいずれか1項に記載の画像処理装置。
  11. 前記目的関数が最小化された場合に、前記目的関数が所定の条件を満たしたと判定する手段を更に有する請求項1乃至10のいずれか1項に記載の画像処理装置。
  12. 前記推定画像を変更する手段は、オートエンコーダを用いて前記推定手段を変更する請求項1乃至10のいずれか1項に記載の画像処理装置。
  13. 前記被写体の同じ箇所が複数回スキャンされるように、測定光の走査を制御する手段を用いて得た複数の前記第1の医用画像を用いて得た前記ノイズ低減画像が位置合わせされ、前記位置合わせして得た複数のノイズ低減画像が加算平均される請求項1乃至12のいずれか1項に記載の画像処理装置。
  14. 前記被写体の同じ箇所が複数回スキャンされるように、測定光の走査を制御する手段を用いて得た複数の前記第1の医用画像が位置合わせされ、前記位置合わせして得た複数の第1の医用画像を用いて得た複数の前記ノイズ低減画像が加算平均される請求項1乃至12のいずれか1項に記載の画像処理装置。
  15. 被写体の医用画像を含む学習データを学習して得た高画質化用の学習済モデルを用いて、前記ノイズ低減画像から、該ノイズ低減画像を高画質化処理して得た高画質画像が生成される請求項1乃至12のいずれか1項に記載の画像処理装置。
  16. 前記ノイズ低減画像を表示手段に表示させる表示制御手段を更に有する請求項1乃至15のいずれか1項に記載の画像処理装置。
  17. 前記表示制御手段は、被写体の医用画像を含む学習データを学習して得た解析結果生成用の学習済モデルを用いて前記ノイズ低減画像から生成された該ノイズ低減画像に関連する解析結果を前記表示手段に表示させる請求項16に記載の画像処理装置。
  18. 前記表示制御手段は、被写体の医用画像を含む学習データを学習して得た診断結果生成用の学習済モデルを用いて前記ノイズ低減画像から生成された該ノイズ低減画像に関連する診断結果を前記表示手段に表示させる請求項16または17に記載の画像処理装置。
  19. 前記表示制御手段は、被写体の医用画像を含む学習データを学習して得た物体認識用の学習済モデルまたは被写体の医用画像を含む学習データを学習して得たセグメンテーション用の学習済モデルを用いて前記ノイズ低減画像から検出された部分領域を前記表示手段に表示させる請求項16乃至18のいずれか1項に記載の画像処理装置。
  20. 前記表示制御手段は、前記ノイズ低減画像から敵対的生成ネットワーク又はオートエンコーダを用いて得た医用画像と該ノイズ低減画像との差に関する情報を、異常部位に関する情報として前記表示手段に表示させる請求項16乃至19のいずれか1項に記載の画像処理装置。
  21. 前記表示制御手段は、被写体の医用画像を含む学習データを学習して得た類似症例画像検索用の学習済モデルを用いて前記ノイズ低減画像から得た該ノイズ低減画像に関連する類似症例画像を前記表示手段に表示させる請求項16乃至20のいずれか1項に記載の画像処理装置。
  22. 前記ノイズの位置は、前記第1の医用画像から、被写体の医用画像を含む学習データを学習して得た学習済モデルを用いて、検出または予測される請求項1乃至21のいずれか1項に記載の画像処理装置。
  23. 被写体を撮像して得た第1の医用画像を取得する手段と、
    被写体の医用画像を含む学習データを学習して得た学習済モデルを用いて、前記取得された第1の医用画像から、前記取得された第1の医用画像におけるノイズの位置を検出する手段と、
    を有する画像処理装置。
  24. 請求項1乃至23のいずれか1項に記載の画像処理装置と、
    前記第1の医用画像を断層画像として取得するためのOCT装置と、を有するシステム。
  25. 被写体を撮像して得た第1の医用画像におけるノイズの位置を検出する工程と、
    前記第1の医用画像における前記検出されたノイズの位置の画素値を低減させた第2の医用画像と、前記第1の医用画像におけるノイズが低減されたと推定される推定画像とを生成する工程と、
    前記第2の医用画像と前記推定画像との差に関する第1項と前記推定画像に関する第2項とを含む目的関数を用いて、前記推定画像を変更する工程と、
    前記目的関数が所定の条件を満たすように変更して得た推定画像をノイズ低減画像として出力する工程と、
    を有する画像処理方法。
  26. 被写体を撮影して得た第1の医用画像におけるノイズの位置を予測する工程と、
    前記第1の医用画像における前記予測されたノイズの位置の画素値を低減させた第2の医用画像と、前記第1の医用画像におけるノイズが低減されたと推定される推定画像とを生成する工程と、
    前記第2の医用画像と前記推定画像との差に関する第1項と前記推定画像に関する第2項とを含む目的関数を用いて、前記推定画像を変更する工程と、
    前記目的関数が所定の条件を満たすように変更して得た推定画像であって、前記ノイズの位置を乱数として予測して得た複数の前記推定画像を合成して得た合成画像をノイズ低減画像として出力する工程と、
    を有する画像処理方法。
  27. 請求項25または26に記載の画像処理方法の各工程を実行するプログラム。
    7
JP2019198016A 2019-10-30 2019-10-30 画像処理装置、画像処理方法及びプログラム Pending JP2021069667A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019198016A JP2021069667A (ja) 2019-10-30 2019-10-30 画像処理装置、画像処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019198016A JP2021069667A (ja) 2019-10-30 2019-10-30 画像処理装置、画像処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2021069667A true JP2021069667A (ja) 2021-05-06

Family

ID=75711854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019198016A Pending JP2021069667A (ja) 2019-10-30 2019-10-30 画像処理装置、画像処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2021069667A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024095624A1 (ja) * 2022-10-31 2024-05-10 LeapMind株式会社 画像処理装置、学習方法及び推論方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024095624A1 (ja) * 2022-10-31 2024-05-10 LeapMind株式会社 画像処理装置、学習方法及び推論方法

Similar Documents

Publication Publication Date Title
JP7229881B2 (ja) 医用画像処理装置、学習済モデル、医用画像処理方法及びプログラム
JP7250653B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP7341874B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7269413B2 (ja) 医用画像処理装置、医用画像処理システム、医用画像処理方法及びプログラム
WO2020183791A1 (ja) 画像処理装置および画像処理方法
JP7305401B2 (ja) 画像処理装置、画像処理装置の作動方法、及びプログラム
JP7362403B2 (ja) 画像処理装置および画像処理方法
WO2020202680A1 (ja) 情報処理装置及び情報処理方法
JP7374615B2 (ja) 情報処理装置、情報処理方法及びプログラム
WO2021029231A1 (ja) 眼科装置、眼科装置の制御方法、及びプログラム
JP2020166813A (ja) 医用画像処理装置、医用画像処理方法及びプログラム
JP2021037239A (ja) 領域分類方法
JP7332463B2 (ja) 制御装置、光干渉断層撮影装置、光干渉断層撮影装置の制御方法、及びプログラム
WO2020138128A1 (ja) 画像処理装置、画像処理方法、及びプログラム
WO2020075719A1 (ja) 画像処理装置、画像処理方法及びプログラム
WO2021100694A1 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7344847B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2021164535A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2021086560A (ja) 医用画像処理装置、医用画像処理方法及びプログラム
WO2019230643A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP2021097989A (ja) 眼科装置、眼科装置の制御方法、及びプログラム
JP2021069667A (ja) 画像処理装置、画像処理方法及びプログラム
JP7406901B2 (ja) 情報処理装置及び情報処理方法
JP2022062620A (ja) 画像処理装置、画像処理方法及びプログラム
WO2020049828A1 (ja) 画像処理装置、画像処理方法、及びプログラム