发明内容
有鉴于此,本申请提出了一种眼底图像黄斑区域的识别检测方法,可以有效提高眼底图像黄斑区的识别和检测结果的准确率。
根据本申请的一方面,提供了一种眼底图像黄斑区域的识别检测方法,包括:
读取当前待定位检测的眼底图像;
采用目标检测模型对所述眼底图像中的黄斑区域进行检测;
在未检测到所述眼底图像中的黄斑区域时,对所述眼底图像中的视盘区域进行检测,并基于检测出的所述视盘区域,对所述黄斑区域进行识别定位;
基于所述黄斑区域的定位结果,由所述眼底图像中提取出所述黄斑区域所对应的黄斑图像;
对所述黄斑图像进行多模态处理,将多模态处理得到的图像进行融合,得到融合图像,并根据所述融合图像对所述黄斑区域进行是否合格的检测。
在一种可能的实现方式中,基于检测出的所述视盘区域,对所述黄斑区域进行定位,包括:
获取所述视盘区域的中心坐标;
根据所述视盘区域的中心坐标,结合多元线性回归模型得到所述黄斑区域的中心坐标。
在一种可能的实现方式中,根据所述视盘区域的中心坐标,结合多元线性回归模型得到所述黄斑区域的中心坐标时,根据公式:
计算得到所述黄斑区域的中心坐标;
其中,Y为所述黄斑区域的中心坐标,X为所述视盘区域的中心坐标,W和B均为矩阵参数。
在一种可能的实现方式中,对所述黄斑图像进行多模态处理包括:对所述黄斑图像进行限制对比度自适应直方图增强处理、高斯滤波增强处理、HSV色彩空间处理中的至少一种。
在一种可能的实现方式中,根据所述融合图像对所述黄斑区域进行是否合格的检测,包括:
将所述融合图像输入至预先训练好的匹配网络中,由所述匹配网络对所述融合图像进行检测;
其中,所述匹配网络包括依次级联的特征提取网络、特征关联网络、相似性度量网络和注意力分配网络。
根据本申请的另一方面,还提供了一种眼底图像黄斑区域的识别检测装置,包括图像读取模块、黄斑区域第一定位模块、黄斑区域第二定位模块、黄斑区域提取模块和黄斑区域检测模块;
所述图像读取模块,被配置为读取当前待定位检测的眼底图像;
所述黄斑区域第一定位模块,被配置为采用目标检测模型对所述眼底图像中的黄斑区域进行检测;
所述黄斑区域第二定位模块,被配置为在所述黄斑区域第一定位模块未检测到所述眼底图像中的黄斑区域时,对所述眼底图像中的视盘区域进行检测,并基于检测出的所述视盘区域,对所述黄斑区域进行识别定位;
所述黄斑区域提取模块,被配置为基于所述黄斑区域的定位结果,由所述眼底图像中提取出所述黄斑区域所对应的黄斑图像;
所述黄斑区域检测模块,被配置为对所述黄斑图像进行多模态处理,将多模态处理得到的图像进行融合,得到融合图像,并根据所述融合图像对所述黄斑区域进行是否合格的检测。
在一种可能的实现方式中,所述黄斑区域第二定位模块包括:坐标获取子模块和黄斑定位子模块;
所述坐标获取子模块,被配置为获取所述视盘区域的中心坐标;
所述黄斑定位子模块,被配置为根据所述视盘区域的中心坐标,结合多元线性回归模型得到所述黄斑区域的中心坐标。
在一种可能的实现方式中,所述黄斑定位子模块,被配置为根据所述视盘区域的中心坐标,结合多元线性回归模型得到所述黄斑区域的中心坐标时,根据公式:
计算得到所述黄斑区域的中心坐标;
其中,Y为所述黄斑区域的中心坐标,X为所述视盘区域的中心坐标,W和B均为矩阵参数。
在一种可能的实现方式中,所述黄斑区域检测模块包括多模态扩增子模块;
所述多模态扩增子模块,被配置为对所述黄斑图像进行多模态处理;
其中,对所述黄斑图像进行多模态处理包括:对所述黄斑图像进行限制对比度自适应直方图增强处理、高斯滤波增强处理、HSV色彩空间处理中的至少一种。
根据本申请的另一方面,还提供了一种眼底图像黄斑区域的定位检测设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述可执行指令时实现前面任一所述的方法。
通过采用目标检测模型对眼底图像中的黄斑区域进行检测,在未检测到眼底图像中的黄斑区域时,对眼底图像中的视盘区域进行检测,并基于检测出的视盘区域对黄斑区域进行识别定位,实现了综合考虑黄斑区和视盘区的位置关系进行黄斑区域的识别定位,相较于基于深度学习的黄斑区域定位方法完全依赖眼底黄斑区域的标注情况的方式,使得在进行眼底图像的黄斑区域的识别定位时更加准确。同时,在检测出黄斑区域后,由眼底图像中提取出黄斑区域所对应的黄斑图像,对黄斑图像进行多模态处理,将多模态处理得到的图像进行融合得到融合图像后,再根据融合图像对黄斑区域进行是否合格的检测。其通过对黄斑图像进行多模态融合处理,从而能够采用基于少样本量学习的方式进行建模,以达到对黄斑图像进行合格和异常分类的效果,极大地提高了黄斑图像的识别能力。
根据下面参考附图对示例性实施例的详细说明,本申请的其它特征及方面将变得清楚。
具体实施方式
以下将参考附图详细说明本申请的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本申请,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本申请的主旨。
图1示出根据本申请一实施例的眼底图像黄斑区域的识别检测方法的流程图。如图1所示,该方法包括:步骤S100,读取当前待定位检测的眼底图像。步骤S200,采用目标检测模型对眼底图像中的黄斑区域进行检测。此处,需要说明的是,所采用的目标检测模型可以为Faster Rcnn神经网络。步骤S300,在未检测到眼底图像中的黄斑区域时,对眼底图像中的视盘区域进行检测,并基于所检测出的视盘区域,对黄斑区域进行识别定位。进而再执行步骤S400,基于黄斑区域的识别定位结果,由眼底图图像中提取出黄斑区域所对应的黄斑图像。最后再通过步骤S500,对黄斑图像进行多模态处理,将多模态处理得到的图像进行融合得到融合图像后,根据融合图像对黄斑区域进行是否合格的检测。
由此,本申请实施例的眼底图像黄斑区域的识别检测方法,通过采用目标检测模型对眼底图像中的黄斑区域进行检测,在未检测到眼底图像中的黄斑区域时,对眼底图像中的视盘区域进行检测,并基于检测出的视盘区域对黄斑区域进行识别定位,实现了综合考虑黄斑区和视盘区的位置关系进行黄斑区域的定位,相较于基于深度学习的黄斑区域定位方法完全依赖眼底黄斑区域的标注情况的方式,使得在进行眼底图像的黄斑区域的识别定位时更加准确。同时,在检测出黄斑区域后,由眼底图像中提取出黄斑区域所对应的黄斑图像,对黄斑图像进行多模态处理,将多模态处理得到的图像进行融合得到融合图像后,再根据融合图像对黄斑区域进行是否合格的检测。其通过对黄斑图像进行多模态融合处理,从而能够采用基于少样本量学习的方式进行建模,以达到对黄斑图像进行合格和异常分类的效果,极大地提高了黄斑图像的识别能力。
其中,在一种可能的实现方式中,在基于检测出的视盘区域对黄斑区域进行识别定位时,可以通过获取视盘区域的中心坐标,然后根据视盘区域的中心坐标,结合多元线性回归模型得到黄斑区域的中心坐标的方式得到。
具体的,在根据视盘区域的中心坐标,结合多元线性回归模型得到黄斑区域的中心坐标时,可以根据公式:
计算得到黄斑区域的中心坐标。其中,Y为黄斑区域的中心坐标,X为视盘区域的中心坐标,W和B均为矩阵参数。此处,需要说明的是,W和B的取值可以通过最小二乘法确定。
即,在采用最小二乘法确定W和B的取值时,可以通过以下矩阵求解公式来实现:
其中,根据前面所述可知,W和B均为矩阵参数,Y为黄斑区域的中心坐标,X为视盘区域的中心坐标。X0为矩阵向量,由X矩阵向量和1向量组成。
同时,还需要说明的是,在通过上述方式,采用多元线性回归模型进行黄斑区域的中心坐标的确定时,还可以分别针对左眼和右眼构建不同的多元线性回归模型,从而基于当前待处理的眼底图像为左眼或右眼的属性采用对应的多元线性回归模型进行黄斑区域中心坐标的确定。
此外,还需要指出的是,根据前面所述,由于在本申请实施例的方法中,对眼底图像进行黄斑区域和视盘区域的检测时采用的是目标检测模型。因此,在对待识别检测的眼底图像进行黄斑区域和视盘区域的识别定位之前,还需要先对目标检测模型进行训练,以使所使用的目标检测模型收敛。
即,对收集到的样本数据(即,眼底图像数据)进行标注,标注的内容包括黄斑区和视盘区所在眼底图像中的位置(可以用矩形框标注),以及黄斑区域和视盘区域的中心坐标(可以用坐标点标注)。
然后,将标注后的各样本数据依次输入至目标检测模型(Faster Rcnn)中,对目标检测模型进行训练,使其能够对眼底图像中的黄斑区和视盘区进行检测定位。
其中,参阅图2,在对待定位检测的眼底图像进行黄斑区域的定位时,首先通过步骤S200,采用预先训练好的目标检测模型对眼底图像进行黄斑区域的检测。同时,执行步骤S200’,判断是否检测出黄斑区域。如果直接检测到黄斑区域,则通过步骤S300’,直接定位出黄斑区域在眼底图像中的位置。如果没有检测到黄斑区域,则执行步骤S310,采用训练好的目标检测模型对眼底图像进行视盘区域的检测,并判断是否检测出视盘区域。如果视盘区域也没有检测出来的话,则表明该眼底图像存在问题,不适宜进行黄斑区域的识别分类。此时则通过步骤S340,发出检测失败的提示,并直接读取下一张眼底图像进行黄斑区域的定位检测。如果检测出视盘区域,则通过步骤S320,获取视盘区域的中心坐标,并使用多元线性回归模型,根据定位出的视盘区域的中心坐标进行黄斑区域的中心坐标的计算确定。由此,定位出黄斑区域的中心坐标后,再通过步骤S330,采用预先设置相应尺寸的矩形框或圆形框等框体,以所定位出的黄斑区域的中心坐标为中心,进行黄斑区域的识别定位。
在一种可能的实现方式中,在根据视盘区域的中心坐标定位出黄斑区域的中心坐标后,以预设尺寸大小的矩形框或圆形框等框体进行黄斑区域的识别定位时,可以直接采用所定位出的视盘区域的尺寸大小进行黄斑区域的定位。
其中,采用所定位出的视盘区域的尺寸大小进行黄斑区域的定位时,可以以所确定的黄斑区域的中心坐标为中心,所定位出的视盘区域的1倍—1.5倍大小尺寸进行黄斑区域的裁剪。如:可以以所定位出的视盘区域的1.5倍大小尺寸进行黄斑区域的裁剪。
在通过上述方式定位出眼底图像中的黄斑区域后,即可将该黄斑区域由眼底图像中剪切并输出,从而提取得到黄斑区域所对应的黄斑图像。
进一步的,通过上述任一方式得到黄斑图像后,即可基于所得到的黄斑图像对黄斑区域进行是否合格的检测。此处,本领域技术人员可以理解的是,对黄斑区域进行是否合格的检测,指的是对所定位出的黄斑区域是否正常,有无异常情况的检测。
其中,根据前面所述,在本申请实施例的方法中,对黄斑区域进行是否合格的检测之前,还包括对黄斑图像进行多模态处理,将多模态处理得到的图像进行融合得到融合图像的操作。
在一种可能的实现方式中,对黄斑图像进行多模态处理包括限制对比度自适应直方图增强处理、高斯滤波增强处理、HSV色彩空间处理中的至少一种。优选的,参阅图3,对黄斑图像进行的多模态处理包括限制对比度自适应直方图增强处理、高斯滤波增强处理和HSV色彩空间处理。
即,通过构建多模态扩增模块,多模态扩增模块包括限制对比度自适应直方图增强处理单元、高斯滤波增强处理单元和HSV色彩空间处理单元,分别由限制对比度自适应直方图增强处理单元、高斯滤波增强处理单元和HSV色彩空间处理单元对黄斑图像进行相应的处理,得到限制对比度自适应直方图增强(CLAHE)图像、高斯滤波增强图像和HSV色彩空间图。
然后,再由多模态扩增模块中的融合单元采用原始图像(即,剪切提取出来的黄斑图像)、限制对比度自适应直方图增强(CLAHE)图像、高斯滤波增强图像和HSV色彩空间图四种模态的图像进行融合,得到融合图像以作为输入图像。进而再将得到的融合图像输入至预先训练好的匹配网络中,由匹配网络对融合图像进行检测,最终得到黄斑图像合格或异常的检测结果。
其中,在将四种模态下的图像进行融合时,可以通过图像通道叠加的方式进行融合。即,对于原始图像(即,剪切提取出来的黄斑图像)、限制对比度自适应直方图增强(CLAHE)图像、高斯滤波增强图像和HSV色彩空间图四种模态的图像,每一种模态的图像均具有3个通道,通过图像通道叠加可得到12个通道的数据作为匹配网络的输入。
此处,应当指出的是,在将得到的融合图像输入至匹配网络中进行是否合格的检测时,匹配网络也是需要预先训练至收敛的。
其中,参阅图4,对匹配网络的训练具体包括:步骤S001,构建黄斑图像数据集,包括合格黄斑图像(即,正常的黄斑图像)以及异常黄斑图像(如:黄斑前膜、黄斑裂孔、年龄性黄斑变性、中心性浆液性脉络膜视网膜病变、中心性渗出性脉络膜视网膜病变等黄斑病变图像)。
进而通过步骤S002,构建多模态扩增模块,采用原始图像、限制对比度自适应直方图增强(CLAHE)图像、高斯滤波增强图像、HSV色彩空间图四种模态的图像进行融合作为模型训练的输入图像。
然后,执行步骤S003,将多模融合的图像分为支撑数据集和目标数据集,并通过步骤S004,将支撑数据集和目标数据集依次输入至匹配网络中进行训练学习以及测试应用。
进一步的,参阅图5,在本申请实施例的方法中,所设计采用的匹配网络的网络结构可以为包括依次级联的特征提取网络、特征关联网络、相似性度量网络和注意力分配网络。其中,特征提取网络可以使用基于卷积神经网络分别对支撑图像和目标图像进行特征提取(如:可以采用ResNet50),特征关联网络使用循环神经网络来解析支撑图像和目标图像内部和外部的关联性(如:可以采用16层LSTM单元网络),相似性度量模块在网络中不进行训练(如:可以采用余弦相似性进行度量),注意力分配网络用于提高模型的训练效率和性能(如:可以采用softmax函数进行注意力分配)。
通过该网络用于学习目标图像与支撑图像的相似性,进而达到使用少量样本达到对目标图像进行分类的效果。
通过将多模融合得到的融合图像输入至训练好的匹配网络中,由匹配网络对融合图像依次进行特征提取、特征关联和相似性度量以及注意力分配后即可得到最终的分类结果。
相应的,基于前面任一所述的眼底图像黄斑区域的识别检测方法,本申请还提供了一种眼底图像黄斑区域的识别检测装置。由于本申请提供的眼底图像黄斑区域的识别检测装置的工作原理,与本申请的眼底图像黄斑区域的识别检测方法的原理相同或相似,因此重复之处不再赘述。
参阅图6,本申请提供的眼底图像黄斑区域的识别检测装置100,包括图像读取模块110、黄斑区域第一定位模块120、黄斑区域第二定位模块130、黄斑区域提取模块140和黄斑区域检测模块150。其中,图像读取模块110,被配置为读取当前待定位检测的眼底图像。黄斑区域第一定位模块120,被配置为采用目标检测模型对眼底图像中的黄斑区域进行检测。黄斑区域第二定位模块130,被配置为在黄斑区域第一定位模块120未检测到眼底图像中的黄斑区域时,对眼底图像中的视盘区域进行检测,并基于检测出的视盘区域,对黄斑区域进行识别定位。黄斑区域提取模块140,被配置为基于黄斑区域的定位结果,由眼底图像中提取出黄斑区域所对应的黄斑图像。黄斑区域检测模块150,被配置为对黄斑图像进行多模态处理,将多模态处理得到的图像进行融合,得到融合图像,并根据融合图像对黄斑区域进行是否合格的检测。
在一种可能的实现方式中,黄斑区域第二定位模块130包括:坐标获取子模块和黄斑定位子模块(图中未示出)。其中,坐标获取子模块,被配置为获取视盘区域的中心坐标。黄斑定位子模块,被配置为根据视盘区域的中心坐标,结合多元线性回归模型得到黄斑区域的中心坐标。
在一种可能的实现方式中,黄斑定位子模块,被配置为根据视盘区域的中心坐标,结合多元线性回归模型得到黄斑区域的中心坐标时,根据公式:
计算得到黄斑区域的中心坐标。其中,Y为黄斑区域的中心坐标,X为视盘区域的中心坐标,W和B均为矩阵参数。
在一种可能的实现方式中,黄斑区域检测模块150包括多模态扩增子模块(图中未示出)。多模态扩增子模块,被配置为对黄斑图像进行多模态处理。其中,对黄斑图像进行多模态处理包括:对黄斑图像进行限制对比度自适应直方图增强处理、高斯滤波增强处理、HSV色彩空间处理中的至少一种。
进一步的,在本申请实施例的眼底图像黄斑区域的定位检测装置100中,黄斑区域检测模块150还包括检测子模块(图中未示出)。此处,需要指出的是,检测子模块可以通过所设计的图像检测识别的神经网络来实现。
具体的,参阅图5,该神经网络(即,匹配网络)包括依次级联的特征提取网络、特征关联网络、相似性度量网络和注意力分配网络。通过该网络用于学习目标图像与支撑图像的相似性,从而能够达到使用少量样本达到对目标图像进行分类检测的效果。
更进一步地,根据本申请的另一方面,还提供了一种眼底图像黄斑区域的识别检测设备200。参阅图7,本申请实施例的眼底图像黄斑区域的识别检测设备200包括处理器210以及用于存储处理器210可执行指令的存储器220。其中,处理器210被配置为执行可执行指令时实现前面任一所述的眼底图像黄斑区域的识别检测方法。
此处,应当指出的是,处理器210的个数可以为一个或多个。同时,在本申请实施例的眼底图像黄斑区域的定位检测设备200中,还可以包括输入装置230和输出装置240。其中,处理器210、存储器220、输入装置230和输出装置240之间可以通过总线连接,也可以通过其他方式连接,此处不进行具体限定。
存储器220作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序和各种模块,如:本申请实施例的眼底图像黄斑区域的定位检测方法所对应的程序或模块。处理器210通过运行存储在存储器220中的软件程序或模块,从而执行眼底图像黄斑区域的定位检测设备200的各种功能应用及数据处理。
输入装置230可用于接收输入的数字或信号。其中,信号可以为产生与设备/终端/服务器的用户设置以及功能控制有关的键信号。输出装置240可以包括显示屏等显示设备。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。