JP6006112B2 - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP6006112B2
JP6006112B2 JP2012287572A JP2012287572A JP6006112B2 JP 6006112 B2 JP6006112 B2 JP 6006112B2 JP 2012287572 A JP2012287572 A JP 2012287572A JP 2012287572 A JP2012287572 A JP 2012287572A JP 6006112 B2 JP6006112 B2 JP 6006112B2
Authority
JP
Japan
Prior art keywords
image
images
evaluation value
sequence
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012287572A
Other languages
English (en)
Other versions
JP2014128390A (ja
Inventor
陽一 矢口
陽一 矢口
呂仁 朝戸
呂仁 朝戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Priority to JP2012287572A priority Critical patent/JP6006112B2/ja
Priority to PCT/JP2013/084188 priority patent/WO2014103903A1/ja
Priority to EP13868323.0A priority patent/EP2940652A4/en
Priority to CN201380068133.6A priority patent/CN104885118B/zh
Publication of JP2014128390A publication Critical patent/JP2014128390A/ja
Priority to US14/697,272 priority patent/US9349159B2/en
Application granted granted Critical
Publication of JP6006112B2 publication Critical patent/JP6006112B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00009Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/04Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor combined with photographic or television appliances
    • A61B1/041Capsule endoscopes for imaging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10068Endoscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Surgery (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Molecular Biology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Optics & Photonics (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pathology (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Endoscopes (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Description

本発明は、画像処理装置、画像処理方法及びプログラム等に関する。
所与の時間間隔により時系列的に静止画の撮像を継続した場合、空間的な広がりを持つ被写体を多数の画像により網羅した場合、或いは動画像を撮像した上で当該動画像を構成する各画像を静止画像としてとらえた場合等では、時間的或いは空間的に連続する非常に大量の画像(以下、画像列とも記載する)が取得されることになる。このような場合には、画像列中で近くにある(つまり時間的或いは空間的に近くにある)画像同士は似通った画像である可能性が高く、撮像した内容を把握するに当たって大量の画像のすべてをチェックする必要性は高くない。そもそも、画像の枚数は数万枚以上となることも珍しくなく、ユーザの手ですべてをチェックすること自体、負担が大きい。
そのため、画像列から一部の画像を削除することで元の画像列より枚数の少ない画像列に要約する(以下、この処理を画像要約処理と記載する)需要がある。例えば特許文献1には、画像列の中のシーンが変化する境目の画像や、画像列を代表する画像を抽出することで、画像列の内容を把握しやすい画像を残す画像要約処理手法が開示されている。
特開2009−5020号公報 特開2007−257287号公報
例えば医学分野に画像要約技術を適用する場合、疾患の見逃しを避ける観点から、画像を削除したことによって観察できなくなる領域の発生を抑える必要がある。特に病変領域や異常領域のような重要領域は観察できなくなる領域に含まれてはならない。
しかし特許文献1の手法のようにシーンが変化する境目の画像だけを残したり、或いは要約後の画像列が直感的に見やすいかどうかといった観点で画像要約を行ったりすると、画像が削除される事によって観察できなくなる領域が発生する可能性があり好ましくない。また、観察できなくなる領域の発生の程度は画像の内容に依存するため、従来の画像要約処理の手法では疾患の見逃し等の程度を制御することが困難であった。
本発明の幾つかの態様によれば、画像間の変形情報に基づいて、画像を削除することで観察できなくなる領域の発生を抑止し、且つ大域的に最適化された画像要約処理を行う画像処理装置、画像処理方法及びプログラム等を提供することができる。
本発明の一態様は、第1〜第N(Nは2以上の整数)の画像を構成画像として有する画像列を取得する画像列取得部と、前記画像列取得部が取得した前記画像列の前記第1〜第Nの画像の一部を削除して要約画像列を生成する画像要約処理を行う処理部と、を含み、前記処理部は、前記入力画像列の第s(sは0≦s≦N+1を満たす整数)の画像を仮定要約画像として選択し、前記入力画像列の第t(tは0≦t≦s−1を満たす整数)の画像を仮定直前要約画像として選択し、前記入力画像列の第u(uはt<u<sを満たす整数)の画像を判定対象画像として選択し、前記仮定要約画像と前記判定対象画像の間の変形情報、及び前記仮定直前要約画像と前記判定対象画像の間の前記変形情報に基づいて、前記判定対象画像の削除評価値を求め、第t+1〜第s−1の画像の前記削除評価値に基づいて、前記第t+1〜第s−1の画像を削除した場合の評価値である要約区間評価値G(t,s)を求め、前記要約区間評価値に基づいて、前記画像要約処理を行う画像処理装置に関係する。
本発明の一態様では、第t+1〜第s−1の画像を削除した場合の評価値である要約区間評価値G(t,s)を求め、求めた要約区間評価値に基づいて画像要約処理を行う。よって、要約画像列の候補が複数あった場合に、各候補について入力画像列から削除される画像に対応する要約区間評価値を用いることで、当該候補の評価値を算出することができ、これらを比較することで、最適な要約画像列を決定する(つまりは大域的に最適化された画像要約処理を行う)こと等が可能になる。
また、本発明の一態様では、前記処理部は、前記要約区間評価値に基づいて、前記第1〜第Nの画像の各画像の累計評価値E(1)〜E(N)を求め、前記累計評価値に基づいて前記画像要約処理を行ってもよい。
これにより、各画像の累計評価値に基づいた画像要約処理が可能になる。
また、本発明の一態様では、前記処理部は、仮想画像である第0の画像の前記累計評価値をE(0)=0とし、第v(vは1≦v≦N+1を満たす整数)の画像の前記累計評価値を、第w(wは0≦w≦v−1を満たす整数)の画像の前記累計評価値E(w)、及び第w+1〜第v−1の画像を削除した場合の前記要約区間評価値G(w,v)を用いて、E(v)=max(E(w)+G(w,v))として求めてもよい。
これにより、ある画像の累計評価値を、当該画像よりも画像列において前方にある画像の累計評価値を用いて求めること等が可能になる。
また、本発明の一態様では、前記処理部は、下式(1)を満たす第xの画像を、前記第vの画像の最適直前要約画像として選択してもよい。
これにより、処理対象の画像の累計評価値を求めるだけでなく、当該画像の最適直前要約画像を求めること等が可能になる。
また、本発明の一態様では、前記処理部は、前記仮想画像である第N+1の画像の前記累計評価値E(N+1)を求め、前記第N+1の画像を要約画像列決定処理における最初の処理対象画像とし、前記処理対象画像の前記最適直前要約画像が前記第0の画像でない場合には、前記最適直前要約画像を前記要約画像列に含める処理を行うとともに、前記最適直前要約画像を新たな前記処理対象画像とする更新処理を行って前記要約画像列決定処理を継続し、前記処理対象画像の前記最適直前要約画像が前記第0の画像である場合には、前記要約画像列決定処理を終了してもよい。
これにより、終点から始点に向かって、最適直前要約画像をたどっていくことで要約画像列を決定すること等が可能になる。
また、本発明の一態様では、前記処理部は、前記第sの画像と前記第uの画像の間の前記変形情報、及び前記第tの画像と前記第uの画像の間の前記変形情報に基づいて、前記第sの画像及び前記第tの画像により前記第uの画像が被覆される割合である前記第uの画像の被覆率を算出し、前記被覆率に基づいて前記削除評価値を算出し、前記第t+1〜第s−1の画像についての前記削除評価値を合計した値を前記第t+1〜第s−1の画像を削除した場合の前記要約区間評価値G(t,s)として求めてもよい。
これにより、被覆率に基づいて要約区間評価値を求めること等が可能になる。
また、本発明の一態様では、前記処理部は、前記第sの画像と前記第uの画像の間の前記変形情報、及び前記第tの画像と前記第uの画像の間の前記変形情報に基づいて、前記第uの画像の削除可否の判定を行い、前記第t+1〜第s−1の画像のうち、少なくとも1枚の前記構成画像が削除不可と判定された場合は、前記第t+1〜第s−1の画像を削除した場合の前記要約区間評価値G(t,s)として、第1の値を設定してもよい。
これにより、第tの画像と第sの画像により間の画像を十分カバーできない場合には、要約区間評価値として有意ではない値(狭義には第tの画像が第sの画像の最適直前要約画像として選択される可能性がない程度の値)を設定すること等が可能になる。
また、本発明の一態様では、前記処理部は、前記第t+1〜第s−1の画像の全てが削除可能と判定された場合は、前記第t+1〜第s−1の画像の画像枚数に基づいて、前記第t+1〜第s−1の画像を削除した場合の前記要約区間評価値G(t,s)を求めてもよい。
これにより、削除可能となる画像の枚数に基づいて要約区間評価値を求めること等が可能になる。
また、本発明の一態様では、前記処理部は、t=s−1からt=0まで、−1ずつtを更新しながら前記第tの画像を前記仮定直前要約画像として選択し、前記第tの画像と前記第uの画像の間の前記変形情報、及び前記第sの画像と前記第uの画像の間の前記変形情報に基づいて打ち切り判定処理を行い、前記打ち切り判定処理によって打ち切り判定されたtについて、第x(xは0≦x≦tを満たす整数)の画像と前記第sの画像との間の前記構成画像を削除したときの前記要約区間評価値G(x,s)として、第1の値を設定し、前記第sの画像を前記仮定要約画像とした処理を終了してもよい。
これにより、仮定直前要約画像の更新処理を打ち切ることで、計算量を削減すること等が可能になる。
また、本発明の一態様では、前記処理部は、前記第1の値として、負の無限大、又は前記累計評価値に基づいて決定される所与の閾値以下の値を設定してもよい。
これにより、上記第1の値を具体的に設定すること等が可能になる。
また、本発明の一態様では、前記処理部は、第0〜第s−1の画像のうち、第s−α〜第s−1の画像(αは正の整数)の画像を前記仮定直前要約画像として選択してもよい。
これにより、仮定直前要約画像として選択される画像の枚数を限定することで、計算量を削減すること等が可能になる。
また、本発明の一態様では、前記処理部は、前記画像列からシーンチェンジを検出し、前記画像列から第i(iは整数)のシーンチェンジと、前記第iのシーンチェンジの次の第i+1のシーンチェンジを検出した場合に、前記画像列の複数の前記構成画像のうち、前記第iのシーンチェンジの後方で、且つ前記第i+1のシーンチェンジの前方の前記構成画像を部分画像列として設定し、設定した前記部分画像列に対して前記画像要約処理を行ってもよい。
これにより、シーンチェンジに基づいて設定した部分画像列を対象とすることで、計算量を削減すること等が可能になる。
また、本発明の他の態様は、第1〜第N(Nは2以上の整数)の画像を構成画像として有する画像列を取得し、前記入力画像列の第s(sは0≦s≦N+1を満たす整数)の画像を仮定要約画像として選択し、前記入力画像列の第t(tは0≦t≦s−1を満たす整数)の画像を仮定直前要約画像として選択し、前記入力画像列の第u(uはt<u<sを満たす整数)の画像を判定対象画像として選択し、前記仮定要約画像と前記判定対象画像の間の変形情報、及び前記仮定直前要約画像と前記判定対象画像の間の前記変形情報に基づいて、前記判定対象画像の削除評価値を求め、第t+1〜第s−1の画像の前記削除評価値に基づいて、前記第t+1〜第s−1の画像を削除した場合の評価値である要約区間評価値G(t,s)を求め、前記要約区間評価値に基づいて、前記画像列の前記第1〜第Nの画像の一部を削除して要約画像列を生成する画像要約処理を行う画像処理方法に関係する。
また、本発明の他の態様は、上記の各部としてコンピュータを機能させるプログラムに関係する。
第1の実施形態の画像処理装置の構成例。 被覆率を用いた処理の説明図。 被覆率を用いた処理の説明図。 第1の実施形態の画像要約処理を説明するフローチャート。 図5(A)、図5(B)は画像要約処理の具体例。 図6(A)、図6(B)は画像要約処理の具体例。 図7(A)、図7(B)は画像要約処理の具体例。 図8(A)、図8(B)は画像要約処理の具体例。 図9(A)〜図9(C)は基準画像と判定対象画像の選択手法を説明する図。 図10(A)、図10(B)は複数の基準画像を用いる場合の選択手法を説明する図。 図11(A)、図11(B)はシーンチェンジと部分画像列の関係を説明する図。 動的計画法の説明図。 第2の実施形態の画像処理装置の構成例。 非被覆領域に対する構造要素による収縮処理を説明する図。 図15(A)〜図15(E)は非被覆領域に対する構造要素による収縮処理の詳細を説明する図。 第2の実施形態の画像要約処理を説明するフローチャート。 図17(A)、図17(B)は判定対象画像に対する構造要素による収縮処理を説明する図。 被覆領域と要被覆領域の包含判定の例。 図19(A)、図19(B)は構造要素を用いた他の処理を説明する図。 被覆率と構造要素の両方を用いた判定処理の例。 画像処理装置の基本的な構成例。
以下、本実施形態について説明する。なお、以下に説明する本実施形態は、特許請求の範囲に記載された本発明の内容を不当に限定するものではない。また本実施形態で説明される構成の全てが、本発明の必須構成要件であるとは限らない。
1.本実施形態の手法
まず本実施形態の手法について説明する。時間的或いは空間的に連続する大量の画像から構成される画像列が取得された場合、当該画像列を用いてユーザが何らかの処理(例えば内視鏡画像列であれば診断等の医療行為)を行う際に、画像要約処理を行うことが望ましい。なぜなら、画像列に含まれる画像の枚数は非常に多く、ユーザがその全てを見た上で判断を行うことは多大な労力を要するためである。また、画像列に含まれる画像の中には、互いに似通った画像が存在する可能性が高く、そのような似通った画像を全てチェックしたとしても取得できる情報量は限られ、労力に見合わない。
具体例としては、カプセル内視鏡を用いて撮像される画像列が考えられる。カプセル内視鏡とは、小型カメラを内蔵したカプセル形状の内視鏡であり、所与の時間間隔(例えば1秒に2回等)で画像を撮像する。カプセル内視鏡は、内服から排出までに数時間(場合によっては十数時間)を要するため、1ユーザの1回の検査において数万枚の撮像画像が取得されることになる。また、カプセル内視鏡は生体内での移動の際に、当該生体の動きの影響を受けること等により、同じ場所にとどまったり、逆方向へ戻ったりする。そのため、大量の画像の中には他の画像と同じような被写体を撮像していて、病変の発見等において有用性の高くない画像も多数存在してしまう。
従来の画像要約処理では、シーンが変化する境目の画像や、画像列を代表する画像を抽出していた。しかしこのような手法では、画像を削除する際に、その削除対象となる画像に撮像されていた被写体と、残す画像に撮像されている被写体との関係は特に考慮していない。そのため、要約前の画像列に含まれる画像上に撮像されていた被写体が、要約後の画像列に含まれるどの画像上にも撮像されていないということが起こりえる。また、画像要約処理により画像列のどの画像にも含まれなくなる被写体がどの程度生じるかという度合いは、処理対象となる画像列に依存するため、従来手法においては当該度合いの制御が困難であった。
このことは特に医療分野での画像要約処理においては好ましくない。医療分野では、その目的上、注目すべき領域(例えば病変部)の見落としは極力抑止しなくてはならない。そのためには、生体内のできるだけ広い範囲を撮像することが望ましく、画像要約処理において、所与の画像を削除することで観察できなくなる被写体範囲が生じることは抑止すべきである。
そこで本出願人は、基準画像(残す画像、実施形態によっては残す候補となる画像)と判定対象画像(削除するか否かの判定の対象画像)とを選択し、基準画像と判定対象画像の間の変形情報に基づいた画像要約処理を行う手法を提案する。
変形情報を用いる画像要約処理の一例としては、図2に示したように、基準画像を変形することで判定対象画像上に被覆領域を算出することが考えられる。この場合、基準画像で撮像された被写体と、判定対象画像の被覆領域上に撮像された被写体とは対応することになる。つまり、判定対象画像における被覆領域外の範囲(以下、非被覆領域と表記する)は、当該判定対象画像を削除した場合、基準画像を残したとしてもカバーすることができない領域となる。
よって、一例としては判定対象画像に占める被覆領域の割合等を被覆率として算出し、算出した被覆率に基づいて判定対象画像を削除するか否かを判定することで、観察できなくなる被写体範囲の発生度合いを制御する。例えば被覆率が閾値以上である際に判定対象画像を削除し、被覆率が閾値未満の際に判定対象画像を削除しないものとすれば、閾値の設定に応じてカバーできない領域の発生度合いを制御できる。
変形情報を用いた画像要約処理の別の例としては、非被覆領域に対する構造要素(注目領域に対応する)による収縮処理の結果に基づいて、判定対象画像の削除可否を判定してもよい。収縮処理は図15(A)〜図15(E)に示す処理である。詳細については後述するが、この場合、判定対象画像を削除したとしても当該判定対象画像上に撮像された構造要素のサイズ以上の領域の少なくとも一部は、基準画像上に撮像されることを保証できる。そのため、判定対象画像に注目領域全体が撮像されていた場合に、当該注目領域の判定対象画像上の位置によらず、その少なくとも一部を基準画像により観察できるため、注目領域の見逃し可能性を抑止することが可能になる。
変形情報を用いた画像要約処理を行うことで、カバーできない領域を一定以下にすること、或いは注目領域の見逃し可能性を抑止することが可能になるが、その結果として得られる要約画像列の最適化については別途考慮する必要がある。ここで、要約画像列を用いたその後の処理(ドクターによる診断等)を考慮した場合、要約画像列に含まれる要約画像の枚数は少ないほど好ましいし、被覆率を用いた処理であれば被覆率の積算値等が大きいほど、カバーできない領域が少ないと言うことであるから望ましい要約画像列ということになる。つまり、要約画像列の候補が複数あるのであれば、より要約画像の枚数が少なく、被覆率の積算値等が大きいものを最終的な出力とすべきであるが、変形情報を用いた処理だけではそれを実現することはできず、何らかの最適化手法を用いる必要がある。
変形情報を用いた画像要約処理のうち、最適化を考慮しないものとしては例えば、図9(A)に示したように、N枚の画像からなる入力画像列の1番目の画像を基準画像とし、2番目以降の画像を順次判定対象画像として、判定対象画像の削除可否判定をする手法が考えられる。この場合、2番目の画像が削除可能であれば図9(B)に示したように3番目の画像を新たな判定対象画像とする判定対象画像の更新処理を行い、削除不可と判定される画像を探索する。そして、図9(C)のように2〜k−1番目の画像が削除可能で、k番目の画像が削除不可であれば、2〜k−1番目の画像は削除しても1番目の画像により十分カバーされる。そして、1番目の画像ではカバーしきれないk番目の画像は要約画像列に残すものとして新たな基準画像に設定する。
図9(A)〜図9(C)の手法では、ある画像を要約画像とした場合に、その次の要約画像ができるだけ離れた位置とすることで、要約画像の枚数が少なくなるようにしている。しかしこの手法では、1番目の画像との対比においてk番目の画像を決定したに過ぎず、k+1〜N番目の画像を含めた入力画像列全体を考慮したものではない。仮に、k+1〜N番目の画像の被写体と対比した場合に、k番目の画像の被写体よりもk−1番目の画像の被写体の方が似通っているならば、あえてk−1番目の画像を要約画像とすることで、その後の画像のカバー度合いを高くでき、結果として得られる要約画像列の画像枚数を少なくできる可能性もある。
また、図10(A)、図10(B)に示すように、基準画像として第1,第2の基準画像を設定し、その両方によるカバー度合い(被覆率)に基づいて画像要約処理を行うことで、画像枚数の削減効果の向上等が期待できる。しかしこの場合も、入力画像列の一部分のみを対象として基準画像を設定していったのでは、画像列全体を見たときに最適な基準画像を選択することが保証できない点では図9(A)〜図9(C)の場合と同様である。
そこで本出願人は、所与の区間の画像を削除した場合の評価値である要約区間評価値Gに基づいて、大域的に最適化された要約画像列を求める手法を提案する。具体的には、第1〜第N(Nは2以上の整数)の画像を構成画像として有する画像列を入力とした場合に、第s(sは0≦s≦N+1を満たす整数)の画像、第t(tは0≦t≦s−1を満たす整数)の画像を上記基準画像として設定し、第t+1〜第s−1の各画像を判定対象画像として設定した場合の削除評価値を被覆率等から求める。そして、第t+1〜第s−1の画像の削除評価値に基づいて、第t+1〜第s−1の画像を削除した場合の評価値である要約区間評価値G(t,s)を求め、要約区間評価値に基づいて画像要約処理を行う。
要約区間評価値G(t,s)は、言い換えれば第tの画像と第sの画像を要約画像として要約画像列に残すことを仮定した場合の評価値である。よって、例えば第0〜第N+1の画像(後述するように、第0の画像と第N+1の画像は仮想画像)について、N+2
=(N+2)(N+1)/2個のGを求めることで、入力画像列全体を考慮した画像要約処理が可能になる。ただし計算量等を考慮して、一部のGについては算出処理をスキップしてもよく、詳細については後述する。
また、算出されたGから最適な要約画像列を決定する際に、全ての要約画像列について総当たりで評価を行うものとすると、第1〜第Nの画像それぞれについて削除するか否かの2通りを考える必要があるため、2個の候補についてGを用いた評価を行うことになり、計算量が膨大なものとなる。よって以下では、動的計画法を用いて最適な要約画像列を決定するものとする。
つまり本実施形態に係る画像処理装置は、図21に示したように、第1〜第N(Nは2以上の整数)の画像を構成画像として有する画像列を取得する画像列取得部200と、画像列取得部200が取得した画像列の第1〜第Nの画像の一部を削除して要約画像列を生成する画像要約処理を行う処理部100を含む。そして処理部100は、入力画像列の第s(sは0≦s≦N+1を満たす整数)の画像を仮定要約画像として選択し、入力画像列の第t(tは0≦t≦s−1を満たす整数)の画像を仮定直前要約画像として選択し、入力画像列の第u(uはt<u<sを満たす整数)の画像を判定対象画像として選択し、仮定要約画像と判定対象画像の間の変形情報、及び仮定直前要約画像と判定対象画像の間の変形情報に基づいて、判定対象画像の削除評価値を求め、第t+1〜第s−1の画像の削除評価値に基づいて、第t+1〜第s−1の画像を削除した場合の評価値である要約区間評価値G(t,s)を求め、要約区間評価値に基づいて、画像要約処理を行う。
以下、第1の実施形態では変形情報を用いた処理として、被覆率に基づく処理を行う手法について説明する。第1の実施形態では、要約区間評価値Gは当該区間に含まれる画像枚数(つまり当該区間が選択された場合に削除可能な枚数)と被覆率に基づいて算出される。第2の実施形態では変形情報を用いた処理として、構造要素を用いた収縮処理を行う手法について説明する。第2の実施形態では、要約区間評価値Gは当該区間に含まれる画像枚数(つまり当該区間が選択された場合に削除可能な枚数)に基づいて算出される。また、変形例としては第1の実施形態と第2の実施形態の手法を組み合わせてもよく、当該変形例についても説明する。
2.第1の実施形態
本実施形態では、被覆率を用いた手法について説明する。具体的には、まず動的計画法について簡単に説明し、画像要約処理への適用手法について述べる。次に画像処理装置のシステム構成例を説明し、フローチャートを用いて処理の流れを説明する。その後、図5(A)〜図8(B)を用いて本実施形態の処理の具体例について説明し、計算量の削減を考慮した変形例についても述べる。
2.1 動的計画法の簡単な説明
動的計画法は最適経路の探索やマッチング等、種々の手法で用いられる。例えば、図12において、点Aから点Bまでの最適経路を求める場合に用いることができる。図12の例では、点Aから点Bまでは右方向、上方向、或いは右上方向のいずれかに移動するものであり、後戻りは考えない。そして、各ノード間には、当該ルートを移動する場合の評価値(ここでは大きいほどよい)がp1〜p12等のように設定されているものとする。この場合、点Aから点Bまでの最適経路とは、例えば当該経路をたどった場合に通過する各枝の評価値の総和を最大にするものと定義することが可能である。
ここで、点Aから点Bまでの全てのルートについて評価値の総和を算出し、その最大値を与えるルートを最適経路とすれば図12の問題を解くことができる。図12ではAB間が近く、各ノードから次のノードへの経路も最大3通りに限定されることから全ルート数が少ないものとなり、全てを計算することは可能である。しかし、大規模な問題(例えば本実施形態が対象とする画像要約であれば、ノード数は画像枚数に相当するため数万のオーダーとなる)では全経路について評価値を積算することは現実的でない。
動的計画法は、このような問題に対して現実的な計算量で解を与えることが可能となる。具体的には、直接Bでの評価値を求めるのではなく、Aに近いノードから各ノードの評価値(具体的には評価値の候補のうちの最大値)及び当該ノードの1つ前のノードを決定していく。そして次のノードの評価値を決定する際には、それまでに求めた各ノードの評価値を利用するものとする。
具体例を図12に示す。まず点N1に至るルートはA―N1だけを考えればよいため、N1の評価値E(N1)=p1となる。同様に点N2の評価値E(N2)=p2となる。次に点N3の評価値を求める場合は、AからN3までの全ルートを考える必要はなく、N3の1つ前のノードからの経路を求める。具体的には、N3の1つ前としては、A,N1,N2の3つのノードを考えればよく、E(A)=0,E(N1)=p1,E(N2)=p2であることが求められている。つまりN3の評価値は、E(A)+p5、E(N1)+p3,E(N2)+p4のうち、最大値を求めればよい。
点N3を対象とした段階では計算上の利点は少ないが、評価値算出の対象ノードが起点(ここではA)から離れるほど動的計画法の利点は大きくなる。例えば、A―N5の全てのルートを求める場合には、5通りのルートについて評価値の候補を計算して比較する必要があるが、E(N1)、E(N3)、E(N4)の算出ができていれば、E(N5)はE(N1)+p9,E(N4)+p7,E(N3)+p8の3つのうちの最大値を求める処理ですむ。
この処理をAからBに向けて進めていけば、最後に点Bを対象とするときにも、E(B)をE(N8)+p12,E(N9)+p10,E(N10)+p11の3つのうちの最大値を求めることで決定でき、AB間の全ルートについて直接に評価値を求める場合に比べて遙かに計算量を削減できる。
この場合、最適経路はBから1つ前の点を逆順にたどっていけばよい。例えばE(B)を求める際に、N8〜N10のうちBの1つ前の点として最適な点(E(B)を最大とする点)が決定されている。仮に当該点がN8であるとすれば、最適経路の一部としてN8―Bという経路が定まる。そして、N8についても、そのさらに1つ前の点としてE(N8)を最大とする最適な点がN5〜N7の3つのうちから決定されているはずである。仮に当該点がN5であるとすれば、最適経路の一部としてN5―N8―Bという経路が定まる。この処理を繰り返していき、1つ前の最適な点がAに到達したら、Bから1つ前の最適点をたどりAに至るルートは、最適経路を逆順にたどったものに他ならない。
本実施形態の画像要約処理に動的計画法を適用する場合には、入力画像列の各画像を経路のノードとして捉え、当該入力画像列の先頭画像から最後の画像まで、要約画像列に残される画像のみを経由する経路を考える。そして、そのうちの最適経路を探索する問題として画像要約処理を捉えればよい。
例えば第1〜第5の画像から構成される入力画像列については、全ての画像を残す場合には1―2―3―4―5という経路を考えることができるし、第2,第4の画像だけを残す場合には2−4という経路を考えることができる。つまりこの場合、各画像を残すか否かについて2=32通りの経路のうち最適なものを探索する問題に落とし込めば、最適な要約画像列を動的計画法により求めることができる。なお、経路の起点を第1の画像、終点を第5の画像とすると、第1,第5の画像が必ず要約画像列に残されることになってしまい、最適解を求めるには不適切である。よって本実施形態では、N枚の画像を含む入力画像列については、仮想的な第0の画像及び第N+1の画像を設定し、第0の画像を起点(図12でいう点A)、第N+1の画像を終点(図12でいう点B)としている。
この際、各点の評価値(以下、累計評価値E)を求めるには、ノード間の評価値(上述のp1等)が必要となるが、本実施形態では画像間の変形情報を用いて求められる要約区間評価値Gをその値とする。つまり、ノード2とノード4の間の枝の評価値は、第2,第4の画像を残し、第3の画像を削除すると仮定した場合の、要約区間評価値G(2,4)を用いればよい。
2.2 システム構成例
図1に本実施形態における画像処理装置のシステム構成例を示す。画像処理装置は、処理部100と、画像列取得部200と、記憶部300を含む。
処理部100は、画像列取得部200が取得した画像列に対して、当該画像列に含まれる複数の画像の一部を削除することで、画像要約処理を行う。この処理部100の機能は、各種プロセッサ(CPU等)、ASIC(ゲートアレイ等)などのハードウェアや、プログラムなどにより実現できる。
画像列取得部200は、画像要約処理の対象となる画像列を取得する。取得する画像列は、時系列順に並んだRGB3チャンネル画像が考えられる。或いは、横一列に並べられた撮像機器により撮影された、空間的に並んだ画像列のように空間的に連続する画像列であってもよい。なお、画像列を構成する画像はRGB3チャンネル画像に限定されるものではなく、Gray1チャンネル画像等、他の色空間を用いてもよい。
記憶部300は、画像列取得部200が取得した画像列を記憶する他、処理部100等のワーク領域となるもので、その機能はRAM等のメモリーやHDD(ハードディスクドライブ)などにより実現できる。
また、処理部100は、図1に示したように変形推定部1001と、仮定要約画像選択部1002と、仮定直前要約画像選択部1003と、判定対象画像選択部1004と、被覆率算出部1005と、要約区間評価値算出部1006と、仮定累計評価値算出部1007と、最適直前要約画像決定部1008と、累計評価値更新部1009と、要約画像列決定部1010とを含む。なお処理部100は、図1の構成に限定されず、これらの一部の構成要素を省略したり、他の構成要素を追加するなどの種々の変形実施が可能である。また上述の各部は、処理部100で実行される画像要約処理を複数のサブルーチンに分割した際に、各サブルーチンを説明するために設定したものであり、必ずしも処理部100が上述の各部を構成要件として有するわけではない。
変形推定部1001は、2つの画像間の変形推定処理を行い変形情報を取得する。ここで変形情報とは、一方の画像において撮像された範囲が、他方の画像においてどのような形状(範囲)として撮像されているかを表すものであり、例えば特許文献2に開示されている変形パラメータ等であってもよい。本実施形態では、変形推定部1001は、仮定要約画像選択部1002で選択された仮定要約画像と判定対象画像選択部1004で選択された判定対象画像の間の変形情報、及び仮定直前要約画像選択部1003と判定対象画像の間の変形情報を取得し、取得した変形情報に基づいて被覆率の算出処理が行われる。
ただし、変形推定部1001は、基準画像(ここでは仮定要約画像及び仮定直前要約画像)と判定対象画像の間の変形情報を直接求めるものに限定されない。例えば、処理対象となる画像列において、隣り合う画像間の変形情報を求めておき、隣り合わない画像間での変形情報は、隣り合う画像間の変形情報を組み合わせて算出するものであってもよい。この場合、基準画像と判定対象画像の間の変形情報は、基準画像、判定対象画像、及びその間の画像での隣り合う画像間の変形情報を(狭義には全て)組み合わせることで求めることになる。
このようにすることで、変形情報の算出処理の負荷を軽くすることが可能になる。なぜなら、変形情報は特許文献2等で示した手法により算出できるが、一般的に変形情報を一から算出する処理に比べて、複数の変形情報を複合する処理は非常に軽いものとなるためである。例えば、変形情報が行列等であれば、2つの画像情報から当該行列を求める処理は負荷が大きいが、すでに求めてある複数の行列を合成することは(例えば行列の積を取るだけでよいため)非常に容易となる。
例えば、画像列取得部200により取得された画像列がN枚の画像を含んでいた場合、その中から2枚の画像を選択する組み合わせはN×(N−1)/2通り考えられるため、基準画像と判定対象画像の間の変形情報を直接求めるとすると、負荷の重い処理(変形情報を一から算出する処理)をNのオーダーの回数だけ行う可能性がある。それに対して、隣り合う画像間の変形情報を用いるようにすれば、負荷の重い処理はN−1回ですむ。
仮定要約画像選択部1002は、画像列の先頭の画像の1つ前に仮想的に配置された画像(第0の画像)から画像列の最後の画像の1つ後に仮想的に配置された画像(第N+1の画像)まで時系列順に画像を選択し、選択した画像を仮定要約画像とする。ここで仮定要約画像とは、上述した累計評価値Eの算出対象となる画像である。
仮定直前要約画像選択部1003は、仮定直前要約画像を選択する。ここで仮定直前要約画像とは、仮定要約画像の1つ前の要約画像の候補となる画像である。仮定直前要約画像の累計評価値Eが求められていれば、当該累計評価値と、仮定直前要約画像と仮定要約画像との間の要約区間評価値とから、仮定要約画像の累計評価値の候補を求めることが可能である。
ここで、第kの画像が仮定要約画像である場合、その1つ前の要約画像としては、第k−1の画像が残されるケース、第k−1の画像は削除されるが第k−2の画像は残されるケース、第k−1,k−2の画像は削除されるが第k−3の画像は残されるケース、・・・、第1〜第k−1の画像の全てが削除されるケースが考えられる。つまり、全ての場合を尽くすのであれば、仮定直前要約画像としては、仮定要約画像の1つ前の画像から第0の画像までの全てを順次選択するとよい。
なお、本実施形態で対象とする入力画像列に含まれる画像は、画像列中での位置が近いほど似通っている可能性が高いことが想定される。つまり、仮定要約画像と仮定直前要約画像は近い方が、遠い場合に比べてその間の画像は被覆率が高い(全て削除可能と判定される)可能性が高い。そして後述するように、仮定要約画像と仮定直前要約画像間の画像の少なくとも1枚が削除不可であり、且つその際の被覆率が極端に低い場合には、仮定直前要約画像をそれ以上仮定要約画像から遠ざけずに処理を打ち切る場合も考えられる。よって仮定直前要約画像選択部1003は、処理の効率を考えて、仮定要約画像の1枚前の画像を最初の仮定直前要約画像として選択し、順次仮定直前要約画像を1つずつ前の画像に更新していくものとする。
判定対象画像選択部1004は、仮定要約画像と仮定直前要約画像の間の画像を順次判定対象画像として選択する。ここでは、仮定要約画像の1枚前の画像を最初の判定対象画像として、仮定直前要約画像の1枚後の画像に至るまで、順次判定対象画像を1つずつ前の画像に更新するものとする。
被覆率算出部1005は、仮定要約画像と判定対象画像の間の第1の変形情報、及び仮定直前要約画像と判定対象画像の間の第2の変形情報に基づいて、判定対象画像の被覆率を算出する。被覆率の算出処理の例を図2,図3に示す。図3では仮定要約画像を第1の変形情報を用いて変形して判定対象画像に射影した領域である第1の被覆領域を求める。それとともに、仮定直前要約画像を第2の変形情報を用いて変形して判定対象画像に射影した領域である第2の被覆領域を求める。さらに、第1の被覆領域と第2の被覆領域の和領域(第1の被覆領域と第2の被覆領域の少なくとも一方に含まれる領域)を最終的な被覆領域とする。そして、判定対象画像に占める被覆領域の割合(狭義には判定対象画像の面積に対する被覆領域の面積の割合)を被覆率とすればよい。
なお、全ての判定対象画像で被覆率が閾値k1以上であれば、被覆率を用いた要約区間評価値の算出処理に移行する。一方、少なくとも1枚の判定対象画像で被覆率がk1未満の場合には、そのときの仮定要約画像と仮定直前要約画像を残して、間の画像を全て削除することが適切でないということになる。よって、そのような要約画像列が選択されないように(当該経路が最適とされないように)、要約区間評価値は具体的な値を計算せずに十分小さい値(例えば−∞)を設定する。また、被覆率がk1>k2となるk2未満の場合には、その際の仮定要約画像と仮定直前要約画像では間の画像のカバー度合いが極端に低いということになる。その場合、仮定直前要約画像を仮定要約画像からさらに遠い位置に更新したとしても適切に間の画像をカバーできる可能性は低いことが想定される。その場合には、判定対象画像の更新処理だけでなく、仮定直前要約画像の更新処理も打ち切って、仮定要約画像の更新処理に移行してもよい。この処理の分岐については図4のフローチャートを用いて詳述する。
要約区間評価値算出部1006は、被覆率、及び仮定直前要約画像と仮定要約画像の間の画像枚数に基づいて要約区間評価値を算出する。これは上述したように、削除できる画像枚数が多いほど、また被覆率が高いほど、要約画像列として適切であるという観点に基づくものである。具体的には、全ての判定対象画像についての被覆率の総和から第1の評価値を求め、仮定直前要約画像と仮定要約画像の間の画像枚数を第2の評価値として求める。そして、第1の評価値と第2の評価値を重み付け加算して要約区間評価値を求めればよい。例えば、被覆率が0から1の値で表現する場合には、要約区間評価値GとしてG=(第1の評価値)+(第2の評価値)×(画像列の総枚数)により求められる値を用いてもよい。この場合、画像列の総枚数という重みによる寄与が大きいため、画像の削除枚数をより重視して最適な要約画像列を決定することが可能になる。ただし、要約区間評価値の算出手法はこれに限定されるものではない。
仮定累計評価値算出部1007は、仮定要約画像の仮定累計評価値(累計評価値の候補となる値)を算出する。具体的には、各仮定直前要約画像について、当該仮定直前要約画像の累計評価値と、仮定要約画像と仮定直前要約画像の間で求められた要約区間評価値の和を仮定累計評価値とすればよい。なお、第0の画像の累計評価値は0とするため、仮定直前要約画像が第0の画像の場合は、仮定累計評価値は要約区間評価値の値そのものとなる。
最適直前要約画像決定部1008は、仮定累計評価値算出部1007で求められた1以上の仮定累計評価値の中から、最適なもの(狭義には最大のもの)を与える仮定直前要約画像を、最適直前要約画像として決定する。
累計評価値更新部1009は、仮定累計評価値のうち最適なもの(狭義には最大のもの)を、当該仮定要約画像における累計評価値として決定する。
要約画像列決定部1010は、第N+1の画像の累計評価値E(N+1)が求められた後に、最適直前要約画像をたどることで要約画像列を設定する。具体的には、第N+1の画像を最初の処理対象画像とした場合に、処理対象画像の最適直前要約画像が第0の画像でない場合には、当該最適直前要約画像を要約画像列に残すとともに、当該最適直前要約画像を新たな処理対象画像とする。一方、最適直前要約画像が第0の画像である場合には、要約画像列決定処理を終了する。これにより、第N+1の画像から第0の画像まで最適直前要約画像をたどっていき、その経路上のノードである画像を要約画像列とする処理を行うことができる。
2.3 処理の詳細
図4のフローチャートを用いて、本実施形態の画像要約処理の流れを説明する。この処理が開始されると、まず変形推定処理が行われる(S101)。これは例えば、入力画像列において隣り合う画像間の変形情報を取得する処理となる。
次に仮定要約画像を選択する処理を行う(S102)。S102の処理が初めて行われる場合には、仮想画像である第0の画像を仮定要約画像として選択する。それ以降にS102の処理が再度行われる場合には、仮定要約画像を入力画像列における1つ後ろの画像に更新する処理が行われることになる。
仮定要約画像が選択されたら、仮定直前要約画像の選択処理を行う(S103)。ここではまず仮定要約画像の1つ前の画像を仮定直前要約画像として選択する。そして、S102の仮定要約画像の更新処理が行われることなくS103の処理が再度行われた場合(S105やS107からS103に戻った場合)には、仮定直前要約画像を1つ前の画像に更新する処理が行われる。
仮定要約画像と仮定直前要約画像が選択されたら、その間の画像を順次判定対象画像として選択する(S104)。判定対象画像が選択されたら、仮定要約画像と判定対象画像の間の第1の変形情報、及び仮定直前要約画像と判定対象画像の間の第2の変形情報を用いて被覆率を算出する(S105)。第1,第2の変形情報はS101の変形推定処理の結果を利用して求めればよい。
被覆率に基づいて判定対象画像が削除可能(例えば被覆率が閾値k1以上)であれば、S104に戻って判定対象画像を更新する。判定対象画像が削除可能である限り、S104とS105の処理を繰り返し、仮定要約画像と仮定直前要約画像の間の全画像について処理を行う。
仮定要約画像と仮定直前要約画像の間の全画像が削除可能である場合には、S106に移行して、要約区間評価値を算出し、当該要約区間評価値と仮定直前要約画像の累計評価値とに基づいて、仮定要約画像の仮定累計評価値を算出する(S107)。S107の処理後はS102に戻り仮定直前要約画像の更新処理を行う。
一方、仮定要約画像と仮定直前要約画像の間の少なくとも1枚の画像が削除不可であり、且つ打ち切り判定はされなかった(例えばk2≦被覆率<k1)の場合には、その際の仮定要約画像と仮定直前要約画像の組み合わせでは間の画像を十分にカバーできないということになる。よって、要約区間評価値を−∞等の十分小さい値に設定し、その際の仮定要約画像と仮定直前要約画像の組み合わせが要約画像として採用されないようにする。しかし、処理を打ち切るという判定がされるほど被覆率の値は悪くないため、S103に戻り仮定直前要約画像の更新処理を行う。通常、仮定要約画像と仮定直前要約画像の間が広がるほど削除不可とされる可能性は高くなる傾向にあるが、被写体等によっては仮定要約画像と仮定直前要約画像の間を広げたほうがかえって間の画像のカバー度合いがよくなる可能性も考えられるためである。
また、判定対象画像の被覆率が極端に低い(例えば被覆率がk2未満)場合には、その際の仮定要約画像と仮定直前要約画像の組み合わせでは間の画像を十分にカバーできず、且つ仮定要約画像と仮定直前要約画像を広げる更新処理を行ったとしても、被覆率の改善可能性が非常に低いと考えられる。よってこの場合には、S103〜S107のループ処理を打ち切り、S108に移行する。この際、S108以降の処理を考えて、仮定直前要約画像の探索区間に含まれる画像であって、S103において仮定直前要約画像として選択されなかった画像についての要約区間評価値に十分小さい値を設定する処理を行ってもよい。例えば、第k−1の画像から第0の画像まで仮定直前要約画像として選択する予定であったが、第k−zの画像で打ち切り判定されてしまった場合には、第k−z−1の画像から第0の画像を仮定直前要約画像として選択した場合の要約区間評価値が設定されないことになってしまうため、それらの値として−∞を設定すればよい。
また、S103による仮定直前要約画像の更新処理が繰り返され、全探索区間を探索した場合にもS108に移行する。これは例えば、仮定要約画像の1つ前の画像から第0の画像までの全てを仮定直前要約画像として選択して処理を行った状態に対応する。また、計算量の削減のため、仮定直前要約画像として選択される画像をα枚に限定している場合であれば、仮定要約画像の1つ前の画像からα枚を仮定直前要約画像として選択して処理を行った状態に対応する。
S108に移行した段階では、S102で選択した仮定要約画像に対して、1又は複数の仮定直前要約画像の各画像を直前の要約画像とした場合の累計評価値である仮定累計評価値が算出されている。よって、その仮定累計評価値のうち最適なもの(狭義には最大のもの)を与える仮定直前要約画像を最適直前要約画像として決定し(S108)、その際の評価値をその仮定要約画像の累計評価値とする(S109)。
S103〜S109の処理を適宜ループを繰り返して行うことで、S102で選択した仮定要約画像の累計評価値を求めることができる。よってS109の後はS102に戻って仮定要約画像を更新し、S103〜S109の処理を繰り返して、第0〜第N+1の全画像について累計評価値を求めればよい。
第N+1の画像の累計評価値が算出されたら、S102で選択する画像がないということになるため、S110の要約画像列決定処理に移行する。具体的には、第N+1の画像からスタートし、処理対象画像の最適直前要約画像を順次、第0の画像に至るまでたどっていく経路を選択すればよい。本実施形態の処理では当該経路上の画像から構成される画像列(ただし仮想画像である第0の画像と第N+1の画像は除く)が要約画像列となる。
2.4 処理の具体例
本実施形態の具体的な処理の例について、図5(A)〜図8(B)を用いて説明する。ここでは、第1〜第6の画像から構成される画像列が入力された場合を例にとる。図面下部の0〜7の数字は入力画像列の構成画像を表し、その下の数字は当該画像の累計評価値を表す。また図面上部の格子は、各交点に付された値が当該交点から右下及び左下に位置する2つの画像間の要約区間評価値を表すものとする。また太い直線は仮定要約画像から最適直前要約画像を経由して第0の画像に至るルートを表す。
まず図5(A)に示したように、第0の画像についてはその累計評価値E(0)は0であるものとする。
そして図5(B)に示したように第1の画像を仮定要約画像とし、それ以前の画像を仮定直前要約画像とする。ここでは第0の画像を仮定直前要約画像とし、第0の画像と第1の画像の間の要約区間評価値G(0,1)を求める。この場合、間に画像がないため判定対象画像は選択されない。仮定直前要約画像としては第0の画像以外は選択されないため、E(1)=E(0)+G(0,1)=0、最適直前要約画像は第0の画像となる。
次に図6(A)に示したように、仮定要約画像を第2の画像に更新する。そして、第1の画像を仮定直前要約画像としてG(1,2)を求める。さらに第0の画像を仮定直前要約画像としてG(0,2)を求める。G(0,2)を求める場合には第1の画像が判定対象画像として選択される。
その後、仮定累計評価値として、E(0)+G(0,2)と、E(1)+G(1,2)を求め、そのうちの最適値をE(2)とするとともに、その値を与える仮定直前要約画像を最適直前要約画像とする。この場合、E(2)=1093、最適直前要約画像が第0の画像となる。
以降同様に、第3の画像を仮定要約画像とした場合には、第2〜第0の画像を順次仮定直前要約画像として選択する。そして、仮定要約画像と仮定直前要約画像の間に1又は複数の画像がある場合には、それらを順次判定対象画像として選択して被覆率を求めることで、要約区間評価値Gを算出する。仮定直前要約画像として選択された画像枚数に対応した数の仮定累計評価値(図6(B)の場合であれば3つ)が求められるため、そのうちの最適値を累計評価値E(3)とし、その値を与える第0の画像を最適直前要約画像とする。
図7(A)〜図8(A)についても同様である。なお図7(A)では仮定直前要約画像を第0の画像とした場合、第1〜第3の画像のいずれかが削除不可(いずれかを判定対象画像とした場合の被覆率が所与の閾値未満)であるため、G(0,4)=−∞となっている。また、最適直前要約画像が第0の画像ではないため、最適直前要約画像を対象とした場合に、さらに最適直前要約画像を考えることが可能である。
この処理を繰り返し、入力画像列の最後の画像のさらに後ろに設定された仮定画像の累計評価値(図8(B)ではE(7))を求める。そして、第7の最適直前要約画像が第5の画像であり、第5の画像の最適直前要約画像が第2の画像、第2の画像の最適直前要約画像が第0の画像であることから、これにより図8(B)に示したように、第0の画像から第7の画像に至る最適経路が、0−2−5−7として求められる。第0,第7の画像が仮想画像であることに鑑みれば、第1〜第6の画像から構成される入力画像列の最適な要約画像列は、第2の画像及び第5の画像から構成される画像列であると決定することができる。
2.5 変形例
図4のフローチャート等を用いて説明した上述の処理は、画像要約処理の対象となる画像列全体を入力画像列としていた。しかし動的計画法の処理時間は処理区間長(例えば経路長により決定される値であり、本実施形態であれば入力画像列に含まれる画像枚数により決定される)の2乗に比例して増加することが知られている。つまり、本実施形態のように画像要約処理の対象である画像列に含まれる画像枚数が非常に多い場合には、動的計画法を用いたとしても現実的な処理時間で最適解を求めることが困難となる可能性も考えられる。
そこで処理時間を短縮するために、画像列を複数の部分画像列に分割し、各部分画像列を入力画像列として上述の処理を行ってもよい。このようにすれば、上記処理区間長を短くすることができるため、全体として処理時間を短縮することが可能になる。
具体的には例えば、画像列からシーンチェンジを検出し、検出したシーンチェンジに基づいて、画像列を複数の部分画像列に分割すればよい。ここでのシーンチェンジは種々の手法により求めることが可能であるが、例えば特許文献2に記載された方法で変形推定を行った際に、正確にレジストレーションできる領域の面積(当該領域を表すマスク画像の画素数)が所与の閾値以下の場合に、変形推定が失敗していると判定し、変形推定が失敗している隣接画像間をシーンチェンジとすることが考えられる。
このようにすれば、本実施形態の処理(特に動的計画法を用いた処理)の対象となる入力画像列に含まれる画像枚数を少なくすることができ、処理時間を短縮できる。さらに、変形推定が失敗している画像間に部分画像列の境界を設けることで、当該画像間の変形情報を処理に用いる必要がなくなる。つまり、変形推定が失敗したと判定される程度に不正確な変形情報を処理から除外することができるため、変形情報を用いた処理の精度(例えば被覆率の算出精度)を向上させることも可能になる。
例えば、図11(A)、図11(B)に示すように、画像列中にA1〜A3の3つのシーンチェンジが検出された場合には、当該シーンチェンジを境界としてB1〜B4という4つの部分画像列を設定すればよい。
なお、シーンチェンジに基づいて複数の部分画像列が設定された場合には、当該複数の部分画像列を1つずつ順次処理していくものには限定されない。処理部100の構成が並列処理に適している(例えば処理部100として複数のコアを有するCPUが用いられている)場合や、複数のコンピュータにより本実施形態の画像処理装置が構成され、各コンピュータで分散処理が行われる場合等では、複数の部分画像列に対して並列に、上述の画像要約処理を行ってもよい。このようにすれば、画像要約処理に要する時間を短縮すること等が可能になる。
以上の本実施形態では、画像処理装置は図1(或いは図21)に示したように、第1〜第N(Nは2以上の整数)の画像を構成画像として有する画像列を取得する画像列取得部200と、画像列取得部200が取得した画像列の第1〜第Nの画像の一部を削除して要約画像列を生成する画像要約処理を行う処理部100を含む。そして処理部100は、入力画像列の第s(sは0≦s≦N+1を満たす整数)の画像を仮定要約画像として選択し、入力画像列の第t(tは0≦t≦s−1を満たす整数)の画像を仮定直前要約画像として選択し、入力画像列の第u(uはt<u<sを満たす整数)の画像を判定対象画像として選択する。さらに処理部100は、仮定要約画像と判定対象画像の間の変形情報、及び仮定直前要約画像と判定対象画像の間の変形情報に基づいて、判定対象画像の削除評価値を求め、第t+1〜第s−1の画像の削除評価値に基づいて、第t+1〜第s−1の画像を削除した場合の評価値である要約区間評価値G(t,s)を求め、要約区間評価値に基づいて、画像要約処理を行う。
これにより、要約区間評価値に基づいた画像要約処理が可能になる。要約区間評価値G(t,s)は、第tの画像と第sの画像を要約画像列に残し、第t+1〜第s−1の画像を全て削除する場合の評価値である。つまり、仮に要約画像列に第aの画像、第bの画像、第cの画像の3つを残すとした場合、当該要約画像列の評価値はG(a,b)及びG(b,c)から求めることができる(仮定画像として第0,第N+1の画像を想定すれば、G(0,a),G(c,N+1)も併用する)。よって、第1〜第Nの画像のうち任意の2枚の画像間の要約区間評価値を全て求めれば、入力画像列から生成される任意の要約画像列の評価値を求めることができ、複数の要約画像列の候補の中から最適なものを探索することが可能になる。なお、第1〜第Nの画像(或いは仮想画像まで含めて第0〜第N+1の画像)から2枚の画像を選択する全ての組み合わせについて要約区間評価値Gを求めてもよいが、計算量削減の観点から、一部のGについて算出処理をスキップしてもよい。この際に、要約区間評価値を画像間の変形情報に基づいて求めているため、画像を削除することで観察することができなくなる領域の発生度合いを制御すること等が可能になる。
また、処理部100は、要約区間評価値に基づいて、第1〜第Nの画像の各画像の累計評価値E(1)〜E(N)を求め、累計評価値に基づいて画像要約処理を行ってもよい。
これにより累計評価値に基づいた画像要約処理が可能になる。本実施形態の累計評価値E(k)とは、第0の画像及び第kの画像を残すことを仮定した場合の評価値のうち、最適なものを表す(なお、第k+1〜第N+1の画像については考慮しない)。第0の画像及び第kの画像を残す場合には、第1〜第k−1の画像についてそれぞれ残すか削除するかの2通りの可能性があるため、2k−1通りの場合のうち最適なもの(或いは最適であると判定されたもの)がE(k)となる。つまりE(k)を求めることで、第kの画像を残す前提での、第1〜第k−1の画像の削除可否について最適な組み合わせを決定できる。つまり、仮想画像である第N+1の画像についてE(N+1)を求めれば、第1〜第Nの画像の削除可否について最適な組み合わせを決定できることになり、これは大域的に最適な要約画像列を求める処理に他ならない。ただし、計算量を削減するために本実施形態では動的計画法を用いることを想定している。その場合、E(N+1)を直接求めるのではなく、起点(第0の画像)に近い方から順次累計評価値Eを求め、所与の画像の累計評価値E(k)を求める場合にはそれ以前の処理結果(E(1)〜E(k−1))を用いる。よって本実施形態の画像要約処理においては、第1〜第Nの画像の各画像の累計評価値E(1)〜E(N)を求めることで画像要約処理を行うものとしている。
また、処理部100は、仮想画像である第0の画像の累計評価値をE(0)=0とし、第v(vは1≦v≦N+1を満たす整数)の画像の累計評価値を、第w(wは0≦w≦v−1を満たす整数)の画像の累計評価値E(w)、及び第w+1〜第v−1の画像を削除した場合の要約区間評価値G(w,v)を用いて、E(v)=max(E(w)+G(w,v))として求めてもよい。
これにより、動的計画法を用いて累計評価値Eを求めることが可能になる。この場合、E(v)を求めるに当たって、第0〜第vの画像を削除するか否かの全ての場合を考慮しなくても、E+Gをv回計算しその最適値(狭義には最大値)を求めるだけでよいことになる。つまり、E(N+1)を求める際に、E(1)〜E(N)を求める必要は生じるものの、直接的にE(N+1)を求める場合に比べて計算量を大幅に削減することが可能になる。
また、処理部100は、下式(1)を満たす第xの画像を、第vの画像の最適直前要約画像として選択してもよい。
Figure 0006006112
また、処理部100は、仮想画像である第N+1の画像の累計評価値E(N+1)を求め、第N+1の画像を要約画像列決定処理における最初の処理対象画像としてもよい。そして処理部100は、処理対象画像の最適直前要約画像が第0の画像でない場合には、最適直前要約画像を要約画像列に含める処理を行うとともに、最適直前要約画像を新たな処理対象画像とする更新処理を行って要約画像列決定処理を継続する。一方、処理対象画像の最適直前要約画像が第0の画像である場合には、要約画像列決定処理を終了する。
これにより、E(v)を求めた際に、第vの画像の最適直前要約画像を選択するとともに、最適直前要約画像を用いて要約画像列決定処理を行うことが可能になる。動的計画法においては、それまでの処理結果を活用する観点から、処理対象ノードについてはその直前ノードを決定すればよく、起点から当該直前ノードまでの経路については処理対象ノードの処理時点においては考慮する必要がない。しかし、各ノードについて直前ノードさえ決定しておけば、終点から順次直前ノードをさかのぼることで、最適経路を決定することができる。本実施形態ではこの処理を画像列に当てはめたものであり、具体的には仮定直前要約画像のうち、仮定要約画像の仮定累計評価値を最大にするものを、最適直前要約画像とすればよい。要約画像列決定処理は、第N+1の画像から第0の画像に至るまで、最適直前要約画像をたどっていく処理となる。
また、処理部100は、第sの画像と第uの画像の間の変形情報、及び第tの画像と第uの画像の間の変形情報に基づいて、第sの画像及び第tの画像により第uの画像が被覆される割合である第uの画像の被覆率を算出してもよい。そして処理部100は、被覆率に基づいて削除評価値を算出し、第t+1〜第s−1の画像についての削除評価値を合計した値を第t+1〜第s−1の画像を削除した場合の要約区間評価値G(t,s)として求める。
これにより、被覆率に基づいて要約区間評価値を求めることが可能になる。被覆率は例えば、図2,図3に示したように被覆領域を用いて求めてもよいし、他の手法により求めてもよい。この場合、要約区間評価値の算出に被覆率が用いられることから、当該要約区間評価値に基づき決定される要約画像列は、被覆率が高い(つまり観察できなくなる領域の発生が抑止された)画像列となることが期待できる。
また、処理部100は、第sの画像と第uの画像の間の変形情報、及び第tの画像と第uの画像の間の変形情報に基づいて、第uの画像の削除可否の判定を行ってもよい。そして処理部100は、第t+1〜第s−1の画像のうち、少なくとも1枚の構成画像が削除不可と判定された場合は、第t+1〜第s−1の画像を削除した場合の要約区間評価値G(t,s)として、第1の値を設定する。
この際処理部100は、第1の値として、負の無限大、又は累計評価値に基づいて決定される所与の閾値以下の値を設定してもよい。
これにより、第t+1〜第s−1の画像のうち、少なくとも1枚の構成画像が削除不可と判定された場合、すなわち第tの画像と第sの画像ではその間の画像を十分にカバーできない場合には、削除可能な画像枚数や被覆率等の観点を用いずに、要約画像列の評価値として所与の値を設定することが可能になる。具体的には、要約画像列の評価値としては第tの画像が第sの画像の最適直前要約画像として選択される可能性がないような値を設定する。ここでは、累計評価値は大きいほどよいものとしているため、上記第1の値として−∞を用いれば、当該第1の値である要約区間評価値により算出される仮定累計評価値は、第1の値以外の値である要約区間評価値(第t+1〜第s−1の画像が全て削除可能な場合に相当)により算出される仮定累計評価値より必ず小さい値となる。
ただし、(削除不可の場合の仮定累計評価値のうちの最大値)<(削除可能な場合の仮定累計評価値の最小値)が満たされれば第1の値は−∞でなくてもよい。この場合、仮定累計評価値が、仮定直前要約画像の累計評価値と、要約区間評価値により決定されることに鑑みれば、第1の値は累計評価値に基づいて決定されることになる。例えば、累計評価値として考えられる値に比べてオーダーが大きく異なる程度に絶対値が大きい負の値を第1の値としてもよい。或いは、(仮定要約画像の累計評価値として取りうる最小値)−(仮定直前要約画像の累計評価値)よりも小さい値を第1の値としてもよく、この場合も第tの画像が第sの画像の最適直前要約画像として選択される可能性がないという要件を満たす。
また、処理部100は、第t+1〜第s−1の画像の全てが削除可能と判定された場合は、第t+1〜第s−1の画像の画像枚数に基づいて、第t+1〜第s−1の画像を削除した場合の要約区間評価値G(t,s)を求めてもよい。
これにより、削除可能な画像枚数に基づいて要約区間評価値を求めることが可能になる。削除可能な画像枚数が多いほど、要約画像列に含まれる画像枚数を少なくできるため、画像要約処理の効果を向上させることができる。なお、ここでの削除可否の判定は、上述したように被覆率の値と所与の閾値(k1)との比較処理により行ってもよい。ただしこれに限定されず、第2の実施形態で後述するように構造要素を用いた収縮処理の結果に基づいて判定してもよいし、図20に示すように2つの手法を組み合わせて判定してもよい。
また、処理部100は、t=s−1からt=0まで、−1ずつtを更新しながら第tの画像を仮定直前要約画像として選択し、第tの画像と第uの画像の間の変形情報、及び第sの画像と第uの画像の間の変形情報に基づいて打ち切り判定処理を行ってもよい。そして、打ち切り判定処理によって打ち切り判定されたtについて、第x(xは0≦x≦tを満たす整数)の画像と前記第sの画像との間の構成画像を削除したときの要約区間評価値G(x,s)として、第1の値を設定し、第sの画像を仮定要約画像とした処理を終了する。
これにより、打ち切り判定を行うことが可能になる。上述したように、本実施形態の画像列に含まれる画像は、画像列中での位置が近いほど被写体は似通っていることが想定される。つまり、第tの画像と第sの画像による第t+1〜第s−1の画像のカバー度合いが非常に低い場合には、仮定直前要約画像を更新したとしても、第t−1の画像と第sの画像による第t〜第s−1の画像のカバー度合いも低いと考えられる。その場合には、第0〜第t−1の画像を仮定直前要約画像とする処理をスキップしたとしても問題が生じる可能性が低く、当該スキップ処理により計算量を削減することが可能になる。その際、第0〜第t−1の画像を仮定直前要約画像とした場合の要約区間評価値としては上記第1の値を設定すればよい。
また、処理部100は、第0〜第s−1の画像のうち、第s−α〜第s−1の画像(αは正の整数)の画像を仮定直前要約画像として選択してもよい。
これにより、仮定直前要約画像の設定範囲(最適直前要約画像を探索する範囲)を狭くすることができるため、計算量を削減することが可能になる。本実施形態の入力画像列では、仮定要約画像と仮定直前要約画像が離れすぎると、間の画像をカバーできる可能性は低くなる傾向にある。つまり、仮定直前要約画像を仮定要約画像から極端に離れた位置に設定したとしても、当該仮定直前要約画像が最適直前要約画像として選択される可能性は非常に低く、当該仮定直前要約画像に対する処理は有用とは言い難い。よってここでは、仮定直前要約画像の設定範囲を限定してもよいものとしている。
また、処理部100は、画像列からシーンチェンジを検出し、画像列から第i(iは整数)のシーンチェンジと、第iのシーンチェンジの次の第i+1のシーンチェンジを検出した場合に、画像列の複数の構成画像のうち、第iのシーンチェンジの後方で、且つ第i+1のシーンチェンジの前方の構成画像を部分画像列として設定し、設定した部分画像列に対して画像要約処理を行ってもよい。
これにより、入力画像列を複数の部分画像列に分割し、部分画像列毎に処理を行うことが可能になる。動的計画法の処理時間は処理区間長の2乗に比例することから、部分画像列毎に処理を行うことで処理時間を短縮することが可能になる。また、複数の部分画像列に対して並列処理を行うことで、さらなる処理時間の短縮を図ってもよい。
なお、本実施形態の画像処理装置等は、その処理の一部または大部分をプログラムにより実現してもよい。この場合には、CPU等のプロセッサがプログラムを実行することで、本実施形態の画像処理装置等が実現される。具体的には、非一時的な情報記憶媒体に記憶されたプログラムが読み出され、読み出されたプログラムをCPU等のプロセッサが実行する。ここで、情報記憶媒体(コンピュータにより読み取り可能な媒体)は、プログラムやデータなどを格納するものであり、その機能は、光ディスク(DVD、CD等)、HDD(ハードディスクドライブ)、或いはメモリ(カード型メモリ、ROM等)などにより実現できる。そして、CPU等のプロセッサは、情報記憶媒体に格納されるプログラム(データ)に基づいて本実施形態の種々の処理を行う。即ち、情報記憶媒体には、本実施形態の各部としてコンピュータ(操作部、処理部、記憶部、出力部を備える装置)を機能させるためのプログラム(各部の処理をコンピュータに実行させるためのプログラム)が記憶される。
3.第2の実施形態
次に構造要素を用いた収縮処理に基づいて、注目領域の見逃し可能性を判定する手法について説明する。
3.1 システム構成例。
第2の実施形態の画像処理装置の構成例を図13に示す。図13に示したように、第1の実施形態の画像処理装置(図1)と比較した場合に、被覆率算出部1005が除かれ、注目領域見逃し判定部1011が追加された構成となっている。その他の各部については、要約区間評価値算出部1006での要約区間評価値Gの算出手法を除き、第1の実施形態と同様であるため、詳細な説明は省略する。
仮定要約画像、仮定直前要約画像、判定対象画像の選択後、注目領域見逃し判定部1011は、当該判定対象画像が削除された場合に、判定対象画像上に撮像された注目領域が、仮定要約画像及び仮定直前要約画像のいずれにおいても撮像されない状況となる(つまり注目領域を見逃す状況となる)可能性についての判定処理を行う。
3.2 注目領域見逃し可能性判定及び要約区間評価値算出処理
具体的な処理の流れを説明する。注目領域見逃し判定部1011は、注目領域(カプセル内視鏡であれば見逃しが望ましくない病変部等)に基づいて構造要素を生成しておく。ここでは、注目領域の典型的な大きさ等を考慮して、見逃すことが好ましくないサイズ、形状の領域を構造要素として設定する。例えば、注目領域が病変部であり、画像上で直径30ピクセルの円よりも大きい病変は深刻度が高く見逃すべきではない、ということがわかっているのであれば、構造要素は直径30ピクセルの円を設定することになる。
仮定要約画像、仮定直前要約画像、及び判定対象画像が選択されたら、変形推定部1001での変形推定処理の結果を用いて、仮定要約画像と判定対象画像の間の第1の変形情報と、仮定直前要約画像と判定対象画像の間の第2の変形情報を取得する。そして第1の実施形態と同様に、取得された変形情報を利用して、仮定要約画像と仮定直前要約画像を判定対象画像上へ射影し、被覆領域を求める。
被覆領域が算出されたら、注目領域見逃し判定部1011は、注目領域の見逃し可能性を判定する。具体的には、判定対象画像のうち被覆領域以外の領域である非被覆領域に対して、図14に示すように構造要素を用いた収縮処理を行い、残留領域があるか否かの判定を行う。
収縮処理の具体例について図15(A)〜図15(E)を用いて説明する。非被覆領域は図15(A)に示したように、必ず閉じた領域となり、その境界を設定することができる。例えば、図15(A)では外側境界であるBO1と、内側境界であるBO2を設定することになる。
この際、構造要素による収縮処理とは、当該構造要素の基準点を非被覆領域の境界上に設定した場合に、非被覆領域と構造要素の重複領域を削る処理となる。例えば、構造要素として円形状の領域を設定し、その基準点を円の中心とした場合には、非被覆領域の境界上に中心を有する円を描き、当該円と非被覆領域とが重なる部分を非被覆領域から除外する処理を行うことになる。具体的には、図15(A)に示したように、非被覆領域の外側境界BO1上の点を中心とする円を描き、非被覆領域との重複領域(ここでは、斜線で示した半円形状の領域)を除外する。
外側境界BO1は離散的に処理されることを考えれば複数の点から構成されていることになるため、当該複数の点の各点について上述した処理を行えばよい。一例としては、図15(A)に示したように境界上の一点を起点として、所与の方向において順次境界BO1上の点を中心とする円を描き、非被覆領域との重複領域を非被覆領域から除外していけばよい。
非被覆領域の境界の一部が判定対象画像の境界と一致する場合等では、非被覆領域の境界は1つの場合も考えられ、その際には当該1つの境界について上述の処理を行えばよい。また、図15(A)に示したように、非被覆領域の境界としてBO1とBO2の2つが考えられる場合には、それぞれについて上述の処理を行う。具体的には、図15(B)に示したように、内側境界BO2についても、BO2上に中心を有する円を描き、非被覆領域との重複領域を除外する処理を行い、この処理をBO2を構成する各点について繰り返せばよい。
このような収縮処理を行うことで、非被覆領域の面積は小さくなる。例えば、図15(A)の非被覆領域の左部に着目した場合、図15(A)で示したBO1での収縮処理、及び図15(B)で示したBO2での収縮処理により、非被覆領域は完全に削除され、残留する領域は存在しない。一方、非被覆領域の右下部分に着目した場合、図15(C)に示したように、BO1での収縮処理でもBO2での収縮処理でも除外対象とならずに残存する残留領域REが生じる。よって、ここでの非被覆領域全体に対して構造要素による収縮処理を行った結果は、図15(D)のようになり、残留領域REが生じることになる。
ここで、半径rの円を構造要素とした場合の収縮処理の持つ意味について考える。閉じた領域である非被覆領域は、境界(BO1とBO2のように異なる境界であってもよいし、1つの境界であってもよい)の内側にある領域と考えることができる。この境界について上述の収縮処理を行うことで、非被覆領域に含まれる点のうち、上記境界上の点から距離r以内にある点は削除の対象となる。つまり、削除対象とならなかった残留領域に含まれる点を考えた場合、当該点からは境界上の任意の点までの距離がrより大きくなるということである。よって、残留領域上の任意の点を中心とする半径rの円を描いた場合に、当該円の円周はどの境界とも交差することがない。これは言い換えれば、半径rの円で表される注目領域が、残留領域中の点をその中心とすることで、非被覆領域の中に完全に収まってしまうという状況を表す。なお、構造要素として円以外の形状(四角形等)を用いた場合であっても、基本的な考え方は同一である。
つまり、残留領域が存在する場合とは、図15(E)の右下に示したように、構造要素に対応する領域が非被覆領域に含まれる場合となり、そのような位置に病変部等の注目領域があった場合には、判定対象画像を削除してしまうと、基準画像を残したとしても注目領域を観察できない可能性が生じてしまう。逆に、残留領域が存在しない場合とは、図15(E)の左上に示したように、注目領域の少なくとも一部は被覆領域に含まれることになり、判定対象画像を削除したとしても、注目領域の少なくとも一部は基準画像に残すことができる。以上のことより、注目領域見逃し判定部1011では、非被覆領域に対して構造要素による収縮処理を行い、残留領域が存在するか否かに基づいて、判定対象画像の削除可否判定を行う。
本実施形態の要約区間評価値算出部1006は、上述の削除可否判定の結果に基づいて要約区間評価値を算出する。具体的には、仮定要約画像と仮定直前要約画像の間の全ての画像が削除可能と判定された場合には、削除可能な画像の枚数(要約区間に含まれる画像枚数)を要約区間評価値とする。一方、仮定要約画像と仮定直前要約画像の間の少なくとも1枚の画像が削除不可と判定された場合には、要約区間評価値として−∞等の十分小さな値を設定する。
要約区間評価値の算出後の処理は第1の実施形態と同様である。
3.3 処理の詳細
第2の実施形態の画像要約処理の流れを図16のフローチャートを用いて説明する。この処理のS201〜S204については、図4のS101〜S104と同様である。そして、S204で判定対象画像が選択された後は、図15(A)〜図15(E)を用いて説明したように注目領域の見逃し可能性を判定する。削除可能である(残留領域がない)場合にはS204に戻る。そして、削除不可(残留領域がある)場合には要約区間評価値として十分小さい値を設定し、S203に戻って仮定直前要約画像の更新処理を行う。
S204で選択する画像がない(具体的には、全ての判定対象画像が削除可能である)場合には、仮定要約画像と仮定直前要約画像の間の画像の枚数を要約区間評価値として算出する(S206)。それ以降のS207〜S210の処理は、図4のS107〜S210の処理と同様であるため詳細な説明は省略する。
3.4 変形例
なお、構造要素による収縮処理の対象は非被覆領域に限定されるものではない。例えば、図17(A)に示したように、判定対象画像を対象として構造要素による収縮処理を行ってもよい。この場合、収縮処理により削られる領域内に注目領域が完全に収まってしまわないように設定する(典型的には構造要素として注目領域の2倍のサイズの要素を設定する)ことで、図17(B)に示したように、残存領域は基準画像により被覆されることが求められる要被覆領域となる。つまりこの場合、要被覆領域全体が仮定要約画像と仮定直前要約画像の少なくとも一方により被覆されているか否かにより削除可否判定を行えばよく、具体的には図18に示したように、仮定要約画像と仮定直前要約画像を変形情報により変形して被覆領域を求め、被覆領域と要被覆領域を用いた包含判定を行えばよい。要被覆領域が被覆画像に包含される場合には、判定対象画像は削除可能となり、包含されない部分があれば判定対象画像は削除不可となる。
また、構造要素を用いた削除可否判定処理は収縮処理を用いるものに限定されず、非被覆領域に構造要素が含まれるか否かを判定する処理であればよい。例えば、図19(A)や図19(B)に示したように、被覆領域の境界上の点(p1〜p6等)から判定対象画像の境界までの距離(k1〜k6等)、或いは判定対象画像の境界上の点から被覆領域の境界までの距離に基づいて、非被覆領域の最大径に相当する値を求め、求めた値と構造要素(この場合注目領域と同等のサイズ)の最小径との比較処理を行うような、簡易的な手法であってもよい。なお、図19(A)は判定対象画像が四角形の例、図19(B)は判定対象画像が円形状である例を示したものである。
また、第1の実施形態で説明した被覆率算出処理と、第2の実施形態で説明した注目領域見逃し可能性判定処理を組み合わせてもよい。例えば、図4のS105や図16のS205に相当する箇所で、被覆率算出処理と注目領域見逃し可能性判定処理の両方を行った上で、図20に示すような分岐処理を行えばよい。
具体的には、被覆率と注目領域の両方の判定において削除可能である場合に、S104に戻り判定対象画像を更新し、全ての画像が削除可能である場合に、S106に移行して被覆率と削除画像枚数を用いて要約区間評価値Gを算出する。一方、被覆率と注目領域の少なくとも一方の判定において削除不可である場合には、要約区間評価値として十分小さい値を設定する。また、被覆率による判定で打ち切りとされた場合には、第1の実施形態と同様に処理を打ち切ってもよい。
このようにすることで、判定対象画像の削除可否の判定精度を向上させ、より適切な要約画像列を求めることが可能になる。
以上、本発明を適用した2つの実施の形態1〜2およびその変形例について説明したが、本発明は、各実施の形態1〜2やその変形例そのままに限定されるものではなく、実施段階では、発明の要旨を逸脱しない範囲内で構成要素を変形して具体化することができる。また、上記した各実施の形態1〜2や変形例に開示されている複数の構成要素を適宜組み合わせることによって、種々の発明を形成することができる。例えば、各実施の形態1〜2や変形例に記載した全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態や変形例で説明した構成要素を適宜組み合わせてもよい。また、明細書又は図面において、少なくとも一度、より広義または同義な異なる用語と共に記載された用語は、明細書又は図面のいかなる箇所においても、その異なる用語に置き換えることができる。このように、発明の主旨を逸脱しない範囲内において種々の変形や応用が可能である。
E 累計評価値、G 要約区間評価値、100 処理部、200 画像列取得部、
300 記憶部、1001 変形推定部、1002 仮定要約画像選択部、
1003 仮定直前要約画像選択部、1004 判定対象画像選択部、
1005 被覆率算出部、1006 要約区間評価値算出部、
1007 仮定累計評価値算出部、1008 最適直前要約画像決定部、
1009 累計評価値更新部、1010 要約画像列決定部、
1011 注目領域見逃し判定部

Claims (14)

  1. 第1〜第N(Nは2以上の整数)の画像を構成画像として有する画像列を取得する画像列取得部と、
    前記画像列取得部が取得した前記画像列の前記第1〜第Nの画像の一部を削除して要約画像列を生成する画像要約処理を行う処理部と、
    を含み、
    前記処理部は、
    前記入力画像列の第s(sは0≦s≦N+1を満たす整数)の画像を仮定要約画像として選択し、
    前記入力画像列の第t(tは0≦t≦s−1を満たす整数)の画像を仮定直前要約画像として選択し、
    前記入力画像列の第u(uはt<u<sを満たす整数)の画像を判定対象画像として選択し、
    前記仮定要約画像と前記判定対象画像の間の変形情報、及び前記仮定直前要約画像と前記判定対象画像の間の前記変形情報に基づいて、前記判定対象画像の削除評価値を求め、
    第t+1〜第s−1の画像の前記削除評価値に基づいて、前記第t+1〜第s−1の画像を削除した場合の評価値である要約区間評価値G(t,s)を求め、
    前記要約区間評価値に基づいて、前記画像要約処理を行うことを特徴とする画像処理装置。
  2. 請求項1において、
    前記処理部は、
    前記要約区間評価値に基づいて、前記第1〜第Nの画像の各画像の累計評価値E(1)〜E(N)を求め、前記累計評価値に基づいて前記画像要約処理を行うことを特徴とする画像処理装置。
  3. 請求項2において、
    前記処理部は、
    仮想画像である第0の画像の前記累計評価値をE(0)=0とし、
    第v(vは1≦v≦N+1を満たす整数)の画像の前記累計評価値を、第w(wは0≦w≦v−1を満たす整数)の画像の前記累計評価値E(w)、及び第w+1〜第v−1の画像を削除した場合の前記要約区間評価値G(w,v)を用いて、
    E(v)=max(E(w)+G(w,v))
    として求めることを特徴とする画像処理装置。
  4. 請求項3において、
    前記処理部は、
    Figure 0006006112
    を満たす第xの画像を、前記第vの画像の最適直前要約画像として選択することを特徴とする画像処理装置。
  5. 請求項4において、
    前記処理部は、
    前記仮想画像である第N+1の画像の前記累計評価値E(N+1)を求め、
    前記第N+1の画像を要約画像列決定処理における最初の処理対象画像とし、
    前記処理対象画像の前記最適直前要約画像が前記第0の画像でない場合には、前記最適直前要約画像を前記要約画像列に含める処理を行うとともに、前記最適直前要約画像を新たな前記処理対象画像とする更新処理を行って前記要約画像列決定処理を継続し、
    前記処理対象画像の前記最適直前要約画像が前記第0の画像である場合には、前記要約画像列決定処理を終了することを特徴とする画像処理装置。
  6. 請求項1乃至5のいずれかにおいて、
    前記処理部は、
    前記第sの画像と前記第uの画像の間の前記変形情報、及び前記第tの画像と前記第uの画像の間の前記変形情報に基づいて、前記第sの画像及び前記第tの画像により前記第uの画像が被覆される割合である前記第uの画像の被覆率を算出し、
    前記被覆率に基づいて前記削除評価値を算出し、
    前記第t+1〜第s−1の画像についての前記削除評価値を合計した値を前記第t+1〜第s−1の画像を削除した場合の前記要約区間評価値G(t,s)として求めることを特徴とする画像処理装置。
  7. 請求項1乃至6のいずれかにおいて、
    前記処理部は、
    前記第sの画像と前記第uの画像の間の前記変形情報、及び前記第tの画像と前記第uの画像の間の前記変形情報に基づいて、前記第uの画像の削除可否の判定を行い、
    前記第t+1〜第s−1の画像のうち、少なくとも1枚の前記構成画像が削除不可と判定された場合は、前記第t+1〜第s−1の画像を削除した場合の前記要約区間評価値G(t,s)として、第1の値を設定することを特徴とする画像処理装置。
  8. 請求項7において、
    前記処理部は、
    前記第t+1〜第s−1の画像の全てが削除可能と判定された場合は、前記第t+1〜第s−1の画像の画像枚数に基づいて、前記第t+1〜第s−1の画像を削除した場合の前記要約区間評価値G(t,s)を求めることを特徴とする画像処理装置。
  9. 請求項1乃至8のいずれかにおいて、
    前記処理部は、
    t=s−1からt=0まで、−1ずつtを更新しながら前記第tの画像を前記仮定直前要約画像として選択し、
    前記第tの画像と前記第uの画像の間の前記変形情報、及び前記第sの画像と前記第uの画像の間の前記変形情報に基づいて打ち切り判定処理を行い、
    前記打ち切り判定処理によって打ち切り判定されたtについて、第x(xは0≦x≦tを満たす整数)の画像と前記第sの画像との間の前記構成画像を削除したときの前記要約区間評価値G(x,s)として、第1の値を設定し、
    前記第sの画像を前記仮定要約画像とした処理を終了することを特徴とする画像処理装置。
  10. 請求項7乃至9のいずれかにおいて、
    前記処理部は、
    前記第1の値として、負の無限大、又は前記累計評価値に基づいて決定される所与の閾値以下の値を設定することを特徴とする画像処理装置。
  11. 請求項1乃至10のいずれかにおいて、
    前記処理部は、
    第0〜第s−1の画像のうち、第s−α〜第s−1の画像(αは正の整数)の画像を前記仮定直前要約画像として選択することを特徴とする画像処理装置。
  12. 請求項1乃至11のいずれかにおいて、
    前記処理部は、
    前記画像列からシーンチェンジを検出し、
    前記画像列から第i(iは整数)のシーンチェンジと、前記第iのシーンチェンジの次の第i+1のシーンチェンジを検出した場合に、
    前記画像列の複数の前記構成画像のうち、前記第iのシーンチェンジの後方で、且つ前記第i+1のシーンチェンジの前方の前記構成画像を部分画像列として設定し、
    設定した前記部分画像列に対して前記画像要約処理を行うことを特徴とする画像処理装置。
  13. 第1〜第N(Nは2以上の整数)の画像を構成画像として有する画像列を取得し、
    前記入力画像列の第s(sは0≦s≦N+1を満たす整数)の画像を仮定要約画像として選択し、
    前記入力画像列の第t(tは0≦t≦s−1を満たす整数)の画像を仮定直前要約画像として選択し、
    前記入力画像列の第u(uはt<u<sを満たす整数)の画像を判定対象画像として選択し、
    前記仮定要約画像と前記判定対象画像の間の変形情報、及び前記仮定直前要約画像と前記判定対象画像の間の前記変形情報に基づいて、前記判定対象画像の削除評価値を求め、
    第t+1〜第s−1の画像の前記削除評価値に基づいて、前記第t+1〜第s−1の画像を削除した場合の評価値である要約区間評価値G(t,s)を求め、
    前記要約区間評価値に基づいて、前記画像列の前記第1〜第Nの画像の一部を削除して要約画像列を生成する画像要約処理を行うことを特徴とする画像処理方法。
  14. 第1〜第N(Nは2以上の整数)の画像を構成画像として有する画像列を取得する画像列取得部と、
    前記画像列取得部が取得した前記画像列の前記第1〜第Nの画像の一部を削除して要約画像列を生成する画像要約処理を行う処理部として、
    コンピュータを機能させ、
    前記処理部は、
    前記入力画像列の第s(sは0≦s≦N+1を満たす整数)の画像を仮定要約画像として選択し、
    前記入力画像列の第t(tは0≦t≦s−1を満たす整数)の画像を仮定直前要約画像として選択し、
    前記入力画像列の第u(uはt<u<sを満たす整数)の画像を判定対象画像として選択し、
    前記仮定要約画像と前記判定対象画像の間の変形情報、及び前記仮定直前要約画像と前記判定対象画像の間の前記変形情報に基づいて、前記判定対象画像の削除評価値を求め、
    第t+1〜第s−1の画像の前記削除評価値に基づいて、前記第t+1〜第s−1の画像を削除した場合の評価値である要約区間評価値G(t,s)を求め、
    前記要約区間評価値に基づいて、前記画像要約処理を行うことを特徴とするプログラム。
JP2012287572A 2012-12-28 2012-12-28 画像処理装置、画像処理方法及びプログラム Expired - Fee Related JP6006112B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2012287572A JP6006112B2 (ja) 2012-12-28 2012-12-28 画像処理装置、画像処理方法及びプログラム
PCT/JP2013/084188 WO2014103903A1 (ja) 2012-12-28 2013-12-20 画像処理装置、画像処理方法及びプログラム
EP13868323.0A EP2940652A4 (en) 2012-12-28 2013-12-20 IMAGE PROCESSING PROGRAM, METHOD, AND DEVICE
CN201380068133.6A CN104885118B (zh) 2012-12-28 2013-12-20 图像处理装置、图像处理方法
US14/697,272 US9349159B2 (en) 2012-12-28 2015-04-27 Image processing device, image processing method, and information storage device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012287572A JP6006112B2 (ja) 2012-12-28 2012-12-28 画像処理装置、画像処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014128390A JP2014128390A (ja) 2014-07-10
JP6006112B2 true JP6006112B2 (ja) 2016-10-12

Family

ID=51020988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012287572A Expired - Fee Related JP6006112B2 (ja) 2012-12-28 2012-12-28 画像処理装置、画像処理方法及びプログラム

Country Status (5)

Country Link
US (1) US9349159B2 (ja)
EP (1) EP2940652A4 (ja)
JP (1) JP6006112B2 (ja)
CN (1) CN104885118B (ja)
WO (1) WO2014103903A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868417A (zh) * 2016-05-27 2016-08-17 维沃移动通信有限公司 一种图像处理方法及移动终端
US11586961B2 (en) * 2018-08-16 2023-02-21 Raytheon Company System and method for identifying a preferred sensor

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11220689A (ja) * 1998-01-31 1999-08-10 Media Link System:Kk 映像ソフト処理装置及び同処理プログラム記録記憶媒体
JP4654773B2 (ja) * 2005-05-31 2011-03-23 富士フイルム株式会社 情報処理装置、動画像符号化装置、情報処理方法及び情報処理プログラム
US20070060798A1 (en) 2005-09-15 2007-03-15 Hagai Krupnik System and method for presentation of data streams
JP2007195586A (ja) * 2006-01-23 2007-08-09 Olympus Medical Systems Corp カプセル型医療装置、医療用制御装置、医療用画像処理装置及びプログラム
JP2007257287A (ja) * 2006-03-23 2007-10-04 Tokyo Institute Of Technology 画像レジストレーション方法
JP5147308B2 (ja) * 2007-06-20 2013-02-20 オリンパス株式会社 画像抽出装置および画像抽出プログラム
JP2009050321A (ja) 2007-08-23 2009-03-12 Olympus Corp 画像処理装置
JP5379442B2 (ja) * 2008-10-14 2013-12-25 オリンパスメディカルシステムズ株式会社 画像表示装置
EP2177149A1 (en) 2008-10-14 2010-04-21 Olympus Medical Systems Corporation Image display device, image display method, and image display program
JP2010158308A (ja) * 2009-01-06 2010-07-22 Olympus Corp 画像処理装置、画像処理方法および画像処理プログラム
JP5213123B2 (ja) * 2009-01-15 2013-06-19 株式会社日立製作所 映像出力方法及び映像出力装置
JP5457688B2 (ja) * 2009-02-04 2014-04-02 オリンパス株式会社 画像処理装置、画像処理プログラムおよび画像処理方法
JP5712489B2 (ja) * 2010-03-03 2015-05-07 富士ゼロックス株式会社 画像処理装置、画像処理システム及びプログラム
JP5710940B2 (ja) * 2010-11-09 2015-04-30 オリンパス株式会社 画像処理装置、画像処理方法及び画像処理プログラム
CN106127796B (zh) * 2012-03-07 2019-03-26 奥林巴斯株式会社 图像处理装置和图像处理方法
EP2839770A4 (en) * 2012-04-18 2015-12-30 Olympus Corp Image processing device, program and image processing method
JP5948200B2 (ja) * 2012-09-27 2016-07-06 オリンパス株式会社 画像処理装置、プログラム及び画像処理方法
JP6242072B2 (ja) * 2012-09-27 2017-12-06 オリンパス株式会社 画像処理装置、プログラム及び画像処理装置の作動方法
WO2014126093A1 (ja) * 2013-02-14 2014-08-21 株式会社日立国際電気 画像処理装置

Also Published As

Publication number Publication date
EP2940652A1 (en) 2015-11-04
US20150228056A1 (en) 2015-08-13
US9349159B2 (en) 2016-05-24
JP2014128390A (ja) 2014-07-10
WO2014103903A1 (ja) 2014-07-03
CN104885118B (zh) 2018-09-07
EP2940652A4 (en) 2016-10-12
CN104885118A (zh) 2015-09-02

Similar Documents

Publication Publication Date Title
US10037468B2 (en) Image processing device, information storage device, and image processing method
WO2013133370A1 (ja) 画像処理装置、プログラム及び画像処理方法
US9576362B2 (en) Image processing device, information storage device, and processing method to acquire a summary image sequence
JP6242072B2 (ja) 画像処理装置、プログラム及び画像処理装置の作動方法
WO2020148797A1 (ja) 画像処理システム、学習済みモデル及び画像処理方法
JP2019194857A (ja) 物体追跡方法および装置
JP5948200B2 (ja) 画像処理装置、プログラム及び画像処理方法
JP2019503214A (ja) ヒューリスティックグラフ探索による階層画像の高速自動区分化
JP5963480B2 (ja) 画像要約装置及びプログラム
JP6006112B2 (ja) 画像処理装置、画像処理方法及びプログラム
Wissel et al. Cascaded learning in intravascular ultrasound: coronary stent delineation in manual pullbacks
JP5973771B2 (ja) 画像処理装置、プログラム及び画像処理方法
Liu et al. Mavot: Memory-augmented video object tracking
JP5973783B2 (ja) 画像処理装置、プログラム及び画像処理方法
JP5973770B2 (ja) 画像処理装置、プログラム及び画像処理方法
JP5980567B2 (ja) 画像処理装置、プログラム及び画像処理装置の作動方法
Le et al. Speed up temporal median filter and its application in background estimation
JP5896791B2 (ja) 画像処理装置、プログラム及び画像処理方法
Dwijayanto et al. Real-Time Object Recognition for Football Field Landmark Detection Based on Deep Neural Networks
CN113470001B (zh) 一种用于红外图像的目标搜索方法
JP2015099571A (ja) 対象物位置特定システム、および対象物位置特定方法
CN118314332A (en) Target identification method and device and intelligent equipment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160908

R151 Written notification of patent or utility model registration

Ref document number: 6006112

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees