发明内容
基于此,有必要针对上述问题,提出一种基于机器学习的病理切片质量评价方法、***、计算机设备及存储介质,以提高对病理切片质量评价得客观性和准确性。
一种基于机器学习的病理切片质量评价方法,所述方法包括:
获取病理切片图像,对所述病理切片图像进行数字化扫描,生成数字病理切片图像;
对所述数字病理切片图像的问题区域进行识别,得到待评价病理切片图像;
通过预设的基于机器学习的质量分类器对所述待评价病理切片图像的质量进行分类,得到质量类别。
一种基于机器学习的病理切片质量评价***,所述***包括:
扫描模块,用于获取病理切片图像,对所述病理切片图像进行数字化扫描,生成数字病理切片图像;
识别模块,用于对所述数字病理切片图像的问题区域进行识别,得到待评价病理切片图像;
评价模块,用于通过预设的基于机器学习的质量分类器对所述待评价病理切片图像的质量进行分类,得到质量类别。
一种设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取病理切片图像,对所述病理切片图像进行数字化扫描,生成数字病理切片图像;
对所述数字病理切片图像的问题区域进行识别,得到待评价病理切片图像;
通过预设的基于机器学习的质量分类器对所述待评价病理切片图像的质量进行分类,得到质量类别。
一种计算机可读介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取病理切片图像,对所述病理切片图像进行数字化扫描,生成数字病理切片图像;
对所述数字病理切片图像的问题区域进行识别,得到待评价病理切片图像;
通过预设的基于机器学习的质量分类器对所述待评价病理切片图像的质量进行分类,得到质量类别。
上述基于机器学习的病理切片质量评价方法、***、计算机设备及存储介质,通过获取病理切片图像,对所述病理切片图像进行数字化扫描,生成数字病理切片图像;对所述数字化病理切片的问题区域进行识别,得到待评价病理切片图像;通过预设的基于机器学习的质量分类器对所述待评价病理切片图像的质量进行分类,得到质量类别,通过机器学习模型对病理切片图像质量进行自动化评价,提高了病理质量评价得准确性和客观性。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,在一个实施例中,提供了一种基于机器学习的病理切片质量评价方法,该基于机器学习的病理切片质量评价方法既可以应用于终端,也可以应用于服务器,本实施例以应用于服务器举例说明。该基于机器学习的病理切片质量评价方法具体包括以下步骤:
步骤102,获取病理切片图像,对病理切片图像进行数字化扫描,生成数字病理切片图像。
其中,病理切片图像是对人体或人体某部分内部组织以HE染色、巴氏染色、特殊染色、免疫组化、免疫荧光或者电子显微镜等非侵入方式取得的图像,用于结合临床资料进行病理学诊断确定疾病的良恶性、类型分组、恶性程度、判断预后、指导临床治疗等。数字病理切片图像是指将病理切片以数字图像的方式进行显示、保存的病理切片图像。具体地,可以通过数字病理扫描仪对活检样本的病理切片图像进行数字扫描后获取得到。以便后续基于该数字病理切片图像进行进一步处理。
步骤104,对数字病理切片图像的问题区域进行识别,得到待评价病理切片图像。
其中,问题区域是指数字病理切片中质量不满足预设条件的部分图像,例如,数字病理切片图像对应的病理切片的细胞核、浆染色不清,或者数字病理切片图像对应的病理切片的厚度不满足条件的问题区域等。可以理解地,在利用数字病理切片图像进行疾病诊断时,如果数字病理切片图像存在问题区域,即数字病理切片质量不满足预设条件,则会影响病理诊断,导致漏诊和误诊,因此,本实施例中,采用计算机视觉技术,对数字病理切片图像中的问题区域进行识别和提取,得到待评价病理切片图像。具体地,可以根据数字病理切片图像的像素大小与预设像素值确定问题区域,即可得到待评价病理切片图像。
步骤106,通过预设的基于机器学习的质量分类器对待评价病理切片图像的质量进行分类,得到质量类别。
其中,质量类别是用于作为反映病理切片质量问题类型的指标数据,在一具体实施方式中,该问题类别包括但不限于是细胞核、浆染色不清,组织块切不全、小空洞,染色不均,切片厚、震刀,切片皱折,切片皱折、坍塌,切片太厚等质量类别。机器学习是一种基于对数据进行表征学习的方法。观测值(例如图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如人脸识别)。机器学习用于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本,用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征,能够有利于提高预测结果的客观性和准确性。质量分类器是一种分类器,可通过样本学习具备分类能力的机器学习算法模型,本实施例的质量分类器用于将不同的待评价病理切片图像划分到多个目标质量类别(如染色不均,切片厚、震刀,切片皱折,切片皱折、坍塌,切片太厚等质量类别)中的的一类。具体地,可以利用至少一个机器学习模型进行分类的分类器。其中的机器学习模型可以是如下的一个或者多个:神经网络(例如,卷积神经网络、BP神经网络等)、逻辑回归模型、支持向量机、决策树、随机森林、感知器以及其它机器学习模型。作为这样的机器学习模型的训练的部分,训练输入是各种有效病理区域对应图像,通过训练,建立待评价病理切片图像与各个质量类别的对应的关系分类器。使得该质量分类器具备判断输入的待评价病理切片图像对应的是质量类别中的哪一类别的能力。本实施例中,该质量分类器为多分类器,即得到多个分类结果,即实现了对病理切片图像对应的病理切片的质量得评价,可以理解地,通过机器学习的方式对病理切片图像对应的病理切片的质量进行评价,实现了对病理切片质量的自动评估,提高了对病理切片质量评价得的准确性和客观性。
上述基于机器学习的病理切片质量评价方法,通过获取病理切片图像,对病理切片图像进行数字化扫描,生成数字病理切片图像;对数字病理切片图像的问题区域进行识别,得到待评价病理切片图像;通过预设的基于机器学习的质量分类器对待评价病理切片图像的质量进行分类,得到质量类别,实现了对病理切片质量的自动评估,提高了对病理切片质量评价得的准确性和客观性。
如图2所示,在一个实施例中,对数字化病理切片的问题区域进行识别,得到待评价病理切片图像,包括:
步骤104A,将数字病理切片图像进行二值化处理,得到灰度图像;
步骤104B,从灰度图像中提取出灰度值不满足预设灰度阈值的问题区域作为待评价病理切片图像。
在这个实施例中,根据数字病理切片图像的像素确定出问题区域,可以理解地,每个预设条件均对应一个预设像素值,将数字病理切片图像与各个预设像素值进行比较,即可识别出问题区域。具体地,通过数字病理切片图像进行二值化处理,其中的二值化处理包括但不限于是全局二值化、基于直方图的最优阈值方法或者基于聚类的OTSU大津阈值方法,即将彩色图片颜色值转变为灰度图像,从灰度图像中提取出灰度值不满足预设灰度阈值的区域,本实施例中的预设灰度阈值即为各个预设条件对应的灰度值,从而提取出了待评价病理切片图像,以便后续基于待评价病理切片图像对病理切的质量进行评价。
如图3所示,在一个实施例中,在对数字化病理切片的问题区域进行识别,得到待评价病理切片图像之前,还包括:
步骤108,将识别出的问题区域图像发送至专家审核端进行审核;
步骤110,将审核后反馈的问题区域图像确定为待评价病理切片图像。
其中,专家审核端是指通过专业医生进行人工审核的用户端。具体地,服务端将步骤104中识别出的问题区域图像发送给进行二次人工审核,然后,将审核后反馈的问题区域图像确定为待评价病理切片图像,采用人工复核的方式,进一步提高了待评价病理切片图像识别得准确性,进而有利于提高对待评价病理切片图像对应的病理切片评价得准确性。
如图4所示,在一个实施例中,在得到质量类别之后,还包括:
步骤112,获取待评价病理切片图像的目标质量类别,从预设质量类别与改进措施的对应关系表中确定与目标质量类别对应的目标改进措施;
步骤114,按照目标改进措施对待评价病理切片图像对应的病理切片进行处理,得到目标病理切片。
其中,预设质量类别与改进措施的对应关系表是指服务器预先存储的各个质量类别与改进措施的映射关系表,即每个质量类别对应一个改进措施,例如,细胞核、浆染色不清的质量类别,其对应的改进措施为更换脱水液或延长脱水时间;组织块切不全,小空洞的质量类别,其对应的改进措施为改进切片手法,精修蜡块;染色不均的质量类别,其对应的改进措施为更换脱水液或延长脱水时间和更换染色液;切片厚、震刀的质量类别,其对应的改进措施为改善组织脱水,夹紧蜡块;切片皱折的质量类别,其对应的改进措施为捞片充分展开,水温升高;切片皱折、坍塌的质量类别,其对应的改进措施为避免气泡产生;切片太厚的质量类别,其对应的改进措施为调整切片的厚度等对应关系。可以理解地,通过按照目标改进措施对待评价病理切片图像对应的病理切片进行处理,得到目标病理切片,从而提高了目标病理切片的质量,有利于提高病理诊断效果。
如图5所示,在一个实施例中,该方法还包括:
步骤116,获取训练样本集,训练样本集中包括多个训练问题区域图像和对应的训练质量类别;
步骤118,将训练问题区域图像作为预设的分类器的输入,将训练质量类别作为期望的输出,对预设的分类器进行训练,得到训练完成的质量分类器。
具体地,获取通过医生进行标注的问题区域对应的质量类别的样本集,将训练问题区域图像作为预设的分类器的输入,训练质量类别作为期望的输出,对预设的分类器进行训练,可生成与训练样本集中的训练问题区域图像相应的训练质量类别,从而根据与当前训练问题区域图像对应的期望的输出,训练预设的分类器,得到训练完成的质量分类器。
本实施例中,训练样本集包括多个质量类别,保证了训练样本集的全面性,利用这样训练样本集训练出的质量类别能够学习到更加全面准确的质量类别分类规则,提高了训练机器学习预设分类器的效率,从而可以进一步提高对问题区域图像对应的病理切片的质量评价得效率。
如图6所示,在一个实施例中,将训练问题区域图像作为预设的分类器的输入,将训练质量类别作为期望的输出,对预设的分类器进行训练,得到训练完成的质量分类器,包括:
步骤118A,获取测试样本集,测试样本集包括测试问题区域图像和对应的测试质量类别;
步骤118B,将测试问题区域图像输入预设的分类器;
步骤118C,获取输出的验证质量类别,获取验证质量类别与质量病理类别之间的误差,在误差小于预设误差的情况下,确定预设的分类器训练完毕,得到质量分类器;或者,获取预设的分类器对应的训练次数,在训练次数达到最大预设次数的情况下,确定预设的分类器训练完毕,得到质量分类器。
具体地,获取测试样本集,测试样本包括测试问题区域图像和对应的测试质量类别,并利用训练的机器学习的分类器对测试样本集进行预测,获取测试样本集已知的分类结果即期望的质量类别,将预测得到的预测结果与已知的分类结果比较,得到相应机器学习分类器的分类预测正确率,获取验证质量类别与期望的质量类别之间的误差,在误差小于预设误差的情况下,其中的误差可以通过敏感性和特异性的大小作为判断指标,例如,当敏感性>99%或者特异性>95%时,确定预设的分类器训练完毕,或者,获取预设的分类器对应的训练次数,在训练次数达到最大预设次数的情况下,确定预设的分类器训练完毕,获取该机器学习的分类器所用的参数取值,否则,利用获取的参数取值以及测试样本集继续训练机器学习分类器。
本实施例中,利用测试样本集粗略定位参数取值,通过获取验证质量类别与期望的质量类别之间的误差,或者训练次数,可以尽可能找到最合适的参数取值,从而利用该参数取值以及测试样本集进行训练,训练出的机器学习分类器对质量类别进行区分可以达到更高的正确率。
如图7所示,在一个实施例中,在将测试问题区域图像输入预设的分类器,获取输出的验证质量类别之后,还包括:
步骤120,将验证质量类别发送至专家审核端进行审核;
步骤122,在审核结果通过的情况下,判定预设的分类器训练完毕。
在这个实施例中,服务器将验证质量类别发送至专家审核端进行二次人工审核,在审核结果通过的情况下,判定预设的分类器训练完毕,通过人工复核的方式,一进步保证了质量分类器的精确性。
如图8所示,在一个实施例中,提出了一种基于机器学习的病理切片质量评价***,所述***包括:
扫描模块802,用于获取病理切片图像,对所述病理切片图像进行数字化扫描,生成数字病理切片图像;
识别模块804,用于对所述数字病理切片图像的问题区域进行识别,得到待评价病理切片图像;
评价模块806,用于通过预设的基于机器学习的质量分类器对所述待评价病理切片图像的质量进行分类,得到质量类别。
图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是服务器,所述服务器包括但不限于高性能计算机和高性能计算机集群。如图9所示,该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作***,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现基于机器学习的病理切片质量评价方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行基于机器学习的病理切片质量评价方法。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的基于机器学习的病理切片质量评价方法可以实现为一种计算机程序的形式,计算机程序可在如图9所示的计算机设备上运行。计算机设备的存储器中可存储组成基于机器学习的病理切片质量评价***的各个程序模板。比如,扫描模块802,识别模块804,评价模块806。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:获取病理切片图像,对所述病理切片图像进行数字化扫描,生成数字病理切片图像;对所述数字病理切片图像的问题区域进行识别,得到待评价病理切片图像;通过预设的基于机器学习的质量分类器对所述待评价病理切片图像的质量进行分类,得到质量类别。
在一个实施例中,对所述数字化病理切片的问题区域进行识别,得到待评价病理切片图像,包括:将所述数字病理切片图像进行二值化处理,得到灰度图像;从所述灰度图像中提取出灰度值不满足预设灰度阈值的问题区域作为待评价病理切片图像。
在一个实施例中,在所述对所述数字化病理切片的问题区域进行识别,得到待评价病理切片图像之前,还包括:将识别出的所述问题区域图像发送至专家审核端进行审核;将审核后反馈的问题区域图像确定为所述待评价病理切片图像。
在一个实施例中,在所述得到质量类别之后,还包括:获取所述待评价病理切片图像的目标质量类别,从预设质量类别与改进措施的对应关系表中确定与所述目标质量类别对应的目标改进措施;按照所述目标改进措施对所述待评价病理切片图像对应的病理切片进行处理,得到目标病理切片。
在一个实施例中,所述方法还包括:获取训练样本集,所述训练样本集中包括多个训练问题区域图像和对应的训练质量类别;将所述训练问题区域图像作为预设的分类器的输入,将所述训练质量类别作为期望的输出,对预设的分类器进行训练,得到训练完成的所述质量分类器。
在一个实施例中,将所述训练问题区域图像作为预设的分类器的输入,将所述训练质量类别作为期望的输出,对预设的分类器进行训练,得到训练完成的所述质量分类器,包括:获取测试样本集,所述测试样本集包括测试问题区域图像和对应的测试质量类别;将所述测试问题区域图像输入预设的分类器;获取输出的验证质量类别,获取验证质量类别与质量病理类别之间的误差,在误差小于预设误差的情况下,确定所述预设的分类器训练完毕,得到所述质量分类器;或者,获取所述预设的分类器对应的训练次数,在所述训练次数达到最大预设次数的情况下,确定所述预设的分类器训练完毕,得到所述质量分类器。
在一个实施例中,在所述将所述测试问题区域图像输入预设的分类器,获取输出的验证质量类别之后,还包括:将所述验证质量类别发送至专家审核端进行审核;在审核结果通过的情况下,判定所述预设的分类器训练完毕。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如下步骤:获取病理切片图像,对所述病理切片图像进行数字化扫描,生成数字病理切片图像;对所述数字病理切片图像的问题区域进行识别,得到待评价病理切片图像;通过预设的基于机器学习的质量分类器对所述待评价病理切片图像的质量进行分类,得到质量类别。
在一个实施例中,对所述数字化病理切片的问题区域进行识别,得到待评价病理切片图像,包括:将所述数字病理切片图像进行二值化处理,得到灰度图像;从所述灰度图像中提取出灰度值不满足预设灰度阈值的问题区域作为待评价病理切片图像。
在一个实施例中,在所述对所述数字化病理切片的问题区域进行识别,得到待评价病理切片图像之前,还包括:将识别出的所述问题区域图像发送至专家审核端进行审核;将审核后反馈的问题区域图像确定为所述待评价病理切片图像。
在一个实施例中,在所述得到质量类别之后,还包括:获取所述待评价病理切片图像的目标质量类别,从预设质量类别与改进措施的对应关系表中确定与所述目标质量类别对应的目标改进措施;按照所述目标改进措施对所述待评价病理切片图像对应的病理切片进行处理,得到目标病理切片。
在一个实施例中,所述方法还包括:获取训练样本集,所述训练样本集中包括多个训练问题区域图像和对应的训练质量类别;将所述训练问题区域图像作为预设的分类器的输入,将所述训练质量类别作为期望的输出,对预设的分类器进行训练,得到训练完成的所述质量分类器。
在一个实施例中,将所述训练问题区域图像作为预设的分类器的输入,将所述训练质量类别作为期望的输出,对预设的分类器进行训练,得到训练完成的所述质量分类器,包括:获取测试样本集,所述测试样本集包括测试问题区域图像和对应的测试质量类别;将所述测试问题区域图像输入预设的分类器;获取输出的验证质量类别,获取验证质量类别与质量病理类别之间的误差,在误差小于预设误差的情况下,确定所述预设的分类器训练完毕,得到所述质量分类器;或者,获取所述预设的分类器对应的训练次数,在所述训练次数达到最大预设次数的情况下,确定所述预设的分类器训练完毕,得到所述质量分类器。
在一个实施例中,在所述将所述测试问题区域图像输入预设的分类器,获取输出的验证质量类别之后,还包括:将所述验证质量类别发送至专家审核端进行审核;在审核结果通过的情况下,判定所述预设的分类器训练完毕。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。