CN113780444A - 基于渐进式学习的舌苔图像分类模型的训练方法 - Google Patents

基于渐进式学习的舌苔图像分类模型的训练方法 Download PDF

Info

Publication number
CN113780444A
CN113780444A CN202111086464.5A CN202111086464A CN113780444A CN 113780444 A CN113780444 A CN 113780444A CN 202111086464 A CN202111086464 A CN 202111086464A CN 113780444 A CN113780444 A CN 113780444A
Authority
CN
China
Prior art keywords
target
resolution
classification model
tongue
image classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111086464.5A
Other languages
English (en)
Other versions
CN113780444B (zh
Inventor
李楠楠
周宸
陈远旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111086464.5A priority Critical patent/CN113780444B/zh
Publication of CN113780444A publication Critical patent/CN113780444A/zh
Application granted granted Critical
Publication of CN113780444B publication Critical patent/CN113780444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于渐进式学习的舌苔图像分类模型的训练方法,包括:获取至少包括多个舌苔图像的原始训练数据集;按照预设的渐进式学习的分辨率扩增方式确定出目标分辨率集合;按照预设的渐进式学习的正则化强度扩增方式确定出正则化强度值集合;对原始训练数据集中的每个舌苔图像执行预设的分辨率重置操作,以得到目标训练数据集集合;基于目标训练数据集集合和正则化强度值集合,对预设的舌苔图像分类模型进行多次训练。可见,本发明能够对不同分辨率的舌苔图像使用不同的正则化强度进行模型的训练,从而能够加快舌苔图像分类模型的训练速度,提高训练完成的舌苔图像分类模型的分类准确性。本发明可以应用在数字医疗***。

Description

基于渐进式学习的舌苔图像分类模型的训练方法
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于渐进式学习的舌苔图像分类模型的训练方法、装置、计算机设备以及存储介质。
背景技术
随着深度学习和人工智能的快速发展,使用基于卷积神经网络的舌苔图像分类算法,辅助用户进行舌苔图像的分类已成为现实。根据人工神经网络的技术特点,舌苔图像分类模型的分类准确性一定程度上会受舌苔图像分类模型的训练过程的影响。在现有的研究中,为了提高舌苔图像分类模型的分类准确性,人们尝试通过增大训练数据中的舌苔图像的分辨率来提升苔图像分类模型的训练效果,以此来提升舌苔图像分类模型的分类准确性。但是,实践发现,这种方式在舌苔图像的分辨率增大到一定的程度之后,反而会容易出现分类准确性降低的情况。可见,如何对舌苔图像分类模型进行科学有效的训练,以提升舌苔图像分类模型的分类准确性,是一个亟需解决的技术问题。
发明内容
本发明所要解决的技术问题在于,在目前的舌苔图像分类模型的训练方法中,舌苔图像分类模型的分类准确性较低。
为了解决上述技术问题,本发明第一方面公开了一种基于渐进式学习的舌苔图像分类模型的训练方法,所述方法包括:
获取待处理的目标视频;
基于预设的动态目标检测模型对所述目标视频进行动态目标检测,得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息;
根据所述动态目标区域和所述非动态目标区域确定出所述目标视频的图像***区域;
根据所述动态目标区域对应的深度信息确定出所述目标视频的图像***区域对应的目标深度信息;
将预先确定出的广告图像***至所述目标视频的图像***区域中所述目标深度信息对应的位置,以完成对所述目标视频的处理。
本发明第二方面公开了一种基于渐进式学习的舌苔图像分类模型的训练装置,所述装置包括:
获取模块,用于获取待处理的目标视频;
检测模块,用于基于预设的动态目标检测模型对所述目标视频进行动态目标检测,得到所述目标视频中的动态目标区域、非动态目标区域和所述动态目标区域对应的深度信息;
确定模块,用于根据所述动态目标区域和所述非动态目标区域确定出所述目标视频的图像***区域;
所述确定模块,还用于根据所述动态目标区域对应的深度信息确定出所述目标视频的图像***区域对应的目标深度信息;
***模块,用于将预先确定出的广告图像***至所述目标视频的图像***区域中所述目标深度信息对应的位置,以完成对所述目标视频的处理。
本发明第三方面公开了一种计算机设备,所述计算机设备包括:
存储有可执行程序代码的存储器;
与所述存储器连接的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的基于渐进式学习的舌苔图像分类模型的训练方法中的部分或全部步骤。
本发明第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的基于渐进式学习的舌苔图像分类模型的训练方法中的部分或全部步骤。
本发明实施例中,获取包括多个舌苔图像的原始训练数据集,按照预设的渐进式学习的分辨率扩增方式确定出目标分辨率集合,按照预设的渐进式学习的正则化强度扩增方式确定出与目标分辨率集合对应的正则化强度值集合,对原始训练数据集中的每个舌苔图像执行预设的分辨率重置操作,以得到目标训练数据集集合,最后基于目标训练数据集集合和正则化强度值集合,对预设的舌苔图像分类模型进行多次训练,使舌苔图像分类模型的目标损失函数收敛,以完成对舌苔图像分类模型的训练。通过预先确定出目标分辨率集合和与目标分辨率集合对应的正则化强度值集合,然后将原始训练数据集中多个舌苔图像的分辨率重置为目标分辨率集合中的目标分辨率,以形成包括多种分辨率的舌苔图像的目标训练数据集集合,从而能够在对舌苔图像分类模型进行训练时,对不同分辨率的舌苔图像使用不同的正则化强度进行模型的训练,从而能够加快舌苔图像分类模型的训练速度,提高训练完成的舌苔图像分类模型的分类准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种基于渐进式学习的舌苔图像分类模型的训练方法的流程示意图;
图2是本发明实施例公开的一种基于渐进式学习的舌苔图像分类模型的训练装置的结构示意图;
图3是本发明实施例公开的一种计算机设备的结构示意图;
图4是本发明实施例公开的一种计算机存储介质的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明公开了一种基于渐进式学习的舌苔图像分类模型的训练方法、装置、计算机设备以及存储介质,获取包括多个舌苔图像的原始训练数据集,按照预设的渐进式学习的分辨率扩增方式确定出目标分辨率集合,按照预设的渐进式学习的正则化强度扩增方式确定出与目标分辨率集合对应的正则化强度值集合,对原始训练数据集中的每个舌苔图像执行预设的分辨率重置操作,以得到目标训练数据集集合,最后基于目标训练数据集集合和正则化强度值集合,对预设的舌苔图像分类模型进行多次训练,使舌苔图像分类模型的目标损失函数收敛,以完成对舌苔图像分类模型的训练。通过预先确定出目标分辨率集合和与目标分辨率集合对应的正则化强度值集合,然后将原始训练数据集中多个舌苔图像的分辨率重置为目标分辨率集合中的目标分辨率,以形成包括多种分辨率的舌苔图像的目标训练数据集集合,从而能够在对舌苔图像分类模型进行训练时,对不同分辨率的舌苔图像使用不同的正则化强度进行模型的训练,从而能够加快舌苔图像分类模型的训练速度,提高训练完成的舌苔图像分类模型的分类准确性。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种基于渐进式学习的舌苔图像分类模型的训练方法的流程示意图。如图1所示,该基于渐进式学习的舌苔图像分类模型的训练方法可以包括以下操作:
101、获取至少包括多个舌苔图像的原始训练数据集。
在上述步骤101中,原始训练数据集中可以包括多个拍摄有人体舌苔的图像(即舌苔图像),并且每个舌苔图像均可以存在对应的标注标签,其中,标注标签用于将舌苔图像分类为正常舌苔、剥落苔、少苔以及无苔,共四种类型。每个舌苔图像的标注标签可以是人工进行设置的。可选地,原始训练数据集中的舌苔图像可以是在医院的数字医疗***上获取的,数字医疗***中可以设置有舌苔图像库,用于存储由数字医疗***中的各个图像采集终端上传的舌苔图像。
102、按照预设的渐进式学习的分辨率扩增方式确定出目标分辨率集合。
在上述步骤102中,渐进式学习策略即是一种使用逐步增大的分辨率的舌苔图像对舌苔图像分类模型进行训练的模型训练策略。具体地,对舌苔图像分类模型进行一次又一次的训练,并且在每次训练中所使用的舌苔图像的分辨率是逐步增大的。为此,在每次对舌苔图像分类模型的训练中,使用何种分辨率的舌苔图像进行训练是一个重要的问题。可以预先计算出每次训练所使用的分辨率(即目标分辨率),然后将目标分辨率组成目标分辨率集合。具体的目标分辨率的计算方式,稍后进行具体描述。
103、按照预设的渐进式学习的正则化强度扩增方式确定出正则化强度值集合,其中,所述正则化强度值集合中的正则化强度值与所述目标分辨率集合中的目标分辨率一一对应,且所述目标分辨率对应的正则化强度值跟随所述目标分辨率的增大而增大。
在上述步骤103中,在计算出每个目标分辨率之后,即可以继续计算出跟随着每个目标分辨率的增大而增大的正则化强度值,以形成正则化强度值集合。具体的正则化强度值的计算方式,稍后进行具体描述。
104、对所述原始训练数据集中的每个舌苔图像执行预设的分辨率重置操作,以得到目标训练数据集集合,其中,所述目标训练数据集集合中的目标训练数据集与所述目标分辨率集合中的目标分辨率一一对应,且每组目标训练数据集中的舌苔图像的分辨率为该组目标训练数据集对应的目标分辨率。
在上述步骤104中,在计算出每个目标分辨率之后,即可以按照每个目标分辨率将原始训练数据集中所有的舌苔图像的分辨率进行重置,以得到每个目标分辨率对应的目标训练数据集,从而形成目标训练数据集集合。例如,目标分辨率包括256*256、512*512和1024*1024,则进行分辨率重置后,将会得到舌苔图像的分辨率均为256*256的目标训练数据集、舌苔图像的分辨率均为512*512的目标训练数据集、舌苔图像的分辨率均为1024*1024的目标训练数据集,从而形成目标训练数据集集合。
105、基于所述目标训练数据集集合和所述正则化强度值集合,对预设的舌苔图像分类模型进行多次训练,使所述舌苔图像分类模型的目标损失函数收敛,以完成对所述舌苔图像分类模型的训练。
在上述步骤105中,例如,目标训练数据集集合中的目标训练数据集对应的目标分辨率依次为256*256、512*512和1024*1024,对应的正则化强度值依次为0.2、0.3、0.4。此时,则可以使用目标分辨率为256*256的目标训练数据集、正则化强度值为0.2对舌苔图像分类模型进行第一次训练,使用目标分辨率为512*512的目标训练数据集、正则化强度值为0.3对舌苔图像分类模型进行第二次训练,使用目标分辨率为1024*1024的目标训练数据集、正则化强度值为0.4对舌苔图像分类模型进行第三次训练,从而使舌苔图像分类模型的目标损失函数收敛,以完成对舌苔图像分类模型的训练。可选地,舌苔图像分类模型采用EfficientNetV2的网络结构。在过去的研究中,多位学者曾试图通过增大训练数据中的舌苔图像的分辨率来提升训练完成的舌苔图像分类模型的分类准确性,但是,实践发现,在分辨率提升到一定程度之后,分辨率的增加反而容易导致分类准确性的降低。发明人经过多次实践、分析之后,发现出现这种情况的原因是:对于相同的网络结构,输入图像的分辨率越高,其需要的网络容量越大,需要的正则化强度也越大,若在提高输入图像的分辨率的同时,依然保持正则化的强度不变,势必会引起分类效果的下降。为此,本发明实施例提出了一种对不同分辨率的舌苔图像使用不同的正则化强度的模型训练方式,实践发现,这种模型训练方式能够达到加快舌苔图像分类模型的训练速度,提高训练完成的舌苔图像分类模型的分类准确性的效果。
可选地,目标分辨率、正则化强度、图像的分辨率重置操作以及对舌苔图像分类模型的训练均可以由数字医疗***中具有较强计算能力的中心终端来完成,在完成舌苔图像分类模型的训练之后,即可以由中心终端将训练完成的舌苔图像分类模型发送至数字医疗***中的各个终端,以进行图像分类的任务。
可见,实施图1所描述的基于渐进式学习的舌苔图像分类模型的训练方法,获取包括多个舌苔图像的原始训练数据集,按照预设的渐进式学习的分辨率扩增方式确定出目标分辨率集合,按照预设的渐进式学习的正则化强度扩增方式确定出与目标分辨率集合对应的正则化强度值集合,对原始训练数据集中的每个舌苔图像执行预设的分辨率重置操作,以得到目标训练数据集集合,最后基于目标训练数据集集合和正则化强度值集合,对预设的舌苔图像分类模型进行多次训练,使舌苔图像分类模型的目标损失函数收敛,以完成对舌苔图像分类模型的训练。通过预先确定出目标分辨率集合和与目标分辨率集合对应的正则化强度值集合,然后将原始训练数据集中多个舌苔图像的分辨率重置为目标分辨率集合中的目标分辨率,以形成包括多种分辨率的舌苔图像的目标训练数据集集合,从而能够在对舌苔图像分类模型进行训练时,对不同分辨率的舌苔图像使用不同的正则化强度进行模型的训练,从而能够加快舌苔图像分类模型的训练速度,提高训练完成的舌苔图像分类模型的分类准确性。
在一个可选的实施例中,所述按照预设的渐进式学习的分辨率扩增方式确定出目标分辨率集合,包括:
确定所述目标分辨率集合对应的最大分辨率和最小分辨率;
按照预设的目标分辨率确定方式从所述最大分辨率和所述最小分辨率之间的区间中确定出多个目标分辨率,以作为目标分辨率集合。
在该可选的实施例中,在计算目标分辨率集合的目标分辨率时,可以先确定出最大分辨率和最小分辨率,然后从最大分辨率和最小分辨率之间选取出多个目标分辨率,以形成目标分辨率集合。
可见,实施该可选的实施例,通过先确定出最大分辨率和最小分辨率,然后从最大分辨率和最小分辨率之间选取出多个目标分辨率,以形成目标分辨率集合,从而能够实现目标分辨率的计算。
在一个可选的实施例中,所述按照预设的目标分辨率确定方式从所述最大分辨率和所述最小分辨率之间的区间中确定出多个目标分辨率,以作为目标分辨率集合,包括:
通过以下公式从所述最大分辨率和所述最小分辨率之间的区间中确定出多个目标分辨率,以作为目标分辨率集合:
Figure BDA0003265733490000071
其中,Si是所述目标分辨率集合中第i个目标分辨率,S0是所述最小分辨率,Se是所述最大分辨率,N为目标分辨率集合中目标分辨率的总数量。
在该可选的实施例中,N为目标分辨率集合中目标分辨率的总数量,也是对舌苔图像分类模型进行训练的代数。舌苔图像分类模型的每一代训练都需要使用不同的目标分辨率和正则化强度值。通过上述公式即可以计算出舌苔图像分类模型的每一代训练所使用的目标分辨率。例如,最小分辨率S0设置为256*256,最大分辨率Se设置为512*512,目标分辨率集合中目标分辨率的总数量(也即对舌苔图像分类模型进行训练的代数)N设置为50,则计算出的目标分辨率Si依次为256*256、261.12*261.12、266.24*266.24、271.36*271.36……
可见,实施该可选的实施例,通过上述公式能够按照相同的间隔,从预设的最大分辨率和最小分辨率之间,选取出多个目标分辨率,以形成目标分辨率集合,从而使训练时所使用的目标分辨率能够均匀分布至最大分辨率和最小分辨率之间的区间,提升对舌苔图像分类模型的训练效果。
在一个可选的实施例中,所述按照预设的渐进式学习的正则化强度扩增方式确定出正则化强度值集合,包括:
确定所述正则化强度值集合对应的最大正则化强度值和最小正则化强度值;
按照预设的正则化强度值确定方式从所述最大正则化强度值和所述最小正则化强度值之间的区间中确定出多个正则化强度值,以作为正则化强度值集合。
在该可选的实施例中,在计算正则化强度值集合的正则化强度值时,可以先确定出最大正则化强度值和最小正则化强度值,然后从最大正则化强度值和最小正则化强度值之间选取出多个正则化强度值,以形成正则化强度值集合。
可见,实施该可选的实施例,通过先确定出最大正则化强度值和最小正则化强度值,然后从最大正则化强度值和最小正则化强度值之间选取出多个正则化强度值,以形成正则化强度值集合,从而能够实现正则化强度值的计算。
在一个可选的实施例中,所述按照预设的正则化强度值确定方式从所述最大正则化强度值和所述最小正则化强度值之间的区间中确定出多个正则化强度值,以作为正则化强度值集合,包括:
通过以下公式从所述最大正则化强度值和所述最小正则化强度值之间的区间中确定出多个正则化强度值,以作为正则化强度值集合:
Figure BDA0003265733490000091
其中,Di是所述正则化强度值集合中第i个正则化强度值,其与所述目标分辨率集合中第i个目标分辨率对应,D0是所述最小正则化强度值,De是所述最大正则化强度值,N为所述正则化强度值集合中正则化强度值的总数量。
在该可选的实施例中,N为正则化强度值集合中正则化强度值的总数量,也是对舌苔图像分类模型进行训练的代数。舌苔图像分类模型的每一代训练都需要使用不同的目标分辨率和正则化强度值。通过上述公式即可以计算出舌苔图像分类模型的每一代训练所使用的正则化强度值。例如,最小正则化强度值D0设置为0.1,最大正则化强度值De设置为0.6,正则化强度值集合中正则化强度值的总数量(也即对舌苔图像分类模型进行训练的代数)N设置为50,则计算出的正则化强度值Di依次为0.1、0.11、0.12、0.13……
可见,实施该可选的实施例,通过上述公式能够按照相同的间隔,从预设的最大正则化强度值和最小正则化强度值之间,选取出多个正则化强度值,以形成正则化强度值集合,从而使训练时所使用的正则化强度值能够均匀分布至最大正则化强度值和最小正则化强度值之间的区间,提升对舌苔图像分类模型的训练效果。
在一个可选的实施例中,所述原始训练数据集还包括每个所述舌苔图像对应的标注标签;
以及,所述基于所述目标训练数据集集合和所述正则化强度值集合,对预设的舌苔图像分类模型进行多次训练,使所述舌苔图像分类模型的目标损失函数收敛,以完成对所述舌苔图像分类模型的训练之后,所述方法还包括:
基于训练完成的所述舌苔图像分类模型对所述原始训练数据集中的每个所述舌苔图像进行分类预测,得到每个所述舌苔图像对应的预测标签和预测概率值;
根据每个所述舌苔图像对应的预测标签、预测概率值和标注标签,从所有的舌苔图像中筛选出噪声舌苔图像,其中,所述噪声舌苔图像是指所对应的预测标签和标注标签不一致,且预测概率值低于预设的预测概率值阈值的舌苔图像;
将所述噪声舌苔图像和所述噪声舌苔图像对应的标注标签从所述原始训练数据集中删除,以实现对所述原始训练数据集的清洗。
在该可选的实施例中,在实际应用中,原始训练数据集中每个舌苔图像对应的标注标签可能会出现错误,如,正常舌苔的舌苔图像的标注标签可能会被设置为剥落苔。若使用这些被错误标注的舌苔图像对舌苔图像分类模型进行训练,反而会影响舌苔图像分类模型的分类效果。为此,可以对原始训练数据集进行清洗,以将这些被错误标注的舌苔图像从原始训练数据集中清除。具体地,可以使用训练完成的舌苔图像分类模型对原始训练数据集中的舌苔图像进行预测,若某一舌苔图像的预测标签与原本的标注标签不一致,且预测概率值低于预测概率值阈值,则可以确定该舌苔图像的标注标签出现错误,可以将其确定为噪声舌苔图像,并将其从原始训练数据集中删除,从而实现对原始训练数据集的清洗。可以继续重复这些步骤,对原始训练数据集进行清洗3-7次。使用清洗后的原始训练数据集进行模型的训练,能够进一步提升舌苔图像分类模型的分类效果。
可见,实施该可选的实施例,在完成模型的训练之后,使用训练完成的模型对原始训练数据集中的舌苔图像进行预测,得到舌苔图像的预测标签和预测概率值,然后根据舌苔图像的预测标签、预测概率值和原本的标注标签筛选出噪声舌苔图像,最后将噪声舌苔图像从原始训练数据集中删除,以实现对原始训练数据集的清洗,从而能够进一步提升舌苔图像分类模型的分类效果。
在一个可选的实施例中,所述舌苔图像分类模型的目标损失函数为:
Figure BDA0003265733490000101
其中,yj为第j个舌苔图像对应的标注标签,pj是第j个舌苔图像对应的预测概率值,M为所述原始训练数据集中舌苔图像的总数量。
在该可选的实施例中,在对舌苔图像分类模型的训练中,通过使用上述目标损失函数对模型进行训练,有利于提升模型的收敛速度以及模型最终的分类效果。
可选地,还可以:将所述基于渐进式学习的舌苔图像分类模型的训练方法的基于渐进式学习的舌苔图像分类模型的训练信息上传至区块链中。
具体来说,基于渐进式学***台、平台产品服务层以及应用服务层等。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
实施例二
请参阅图2,图2是本发明实施例公开的一种基于渐进式学习的舌苔图像分类模型的训练装置的结构示意图。如图2所示,该基于渐进式学习的舌苔图像分类模型的训练装置可以包括:
获取模块201,用于获取至少包括多个舌苔图像的原始训练数据集;
确定模块202,用于按照预设的渐进式学习的分辨率扩增方式确定出目标分辨率集合;
所述确定模块202,还用于按照预设的渐进式学习的正则化强度扩增方式确定出正则化强度值集合,其中,所述正则化强度值集合中的正则化强度值与所述目标分辨率集合中的目标分辨率一一对应,且所述目标分辨率对应的正则化强度值跟随所述目标分辨率的增大而增大;
分辨率重置模块203,用于对所述原始训练数据集中的每个舌苔图像执行预设的分辨率重置操作,以得到目标训练数据集集合,其中,所述目标训练数据集集合中的目标训练数据集与所述目标分辨率集合中的目标分辨率一一对应,且每组目标训练数据集中的舌苔图像的分辨率为该组目标训练数据集对应的目标分辨率;
训练模块204,用于基于所述目标训练数据集集合和所述正则化强度值集合,对预设的舌苔图像分类模型进行多次训练,使所述舌苔图像分类模型的目标损失函数收敛,以完成对所述舌苔图像分类模型的训练。
对于上述基于渐进式学习的舌苔图像分类模型的训练装置的具体描述可以参照上述基于渐进式学习的舌苔图像分类模型的训练方法的具体描述,为避免重复,在此不再一一赘述。
实施例三
请参阅图3,图3是本发明实施例公开的一种计算机设备的结构示意图。如图3所示,该计算机设备可以包括:
存储有可执行程序代码的存储器301;
与存储器301连接的处理器302;
处理器302调用存储器301中存储的可执行程序代码,执行本发明实施例一公开的基于渐进式学习的舌苔图像分类模型的训练方法中的步骤。
实施例四
请参阅图4,本发明实施例公开了一种计算机存储介质401,计算机存储介质401存储有计算机指令,该计算机指令被调用时,用于执行本发明实施例一公开的基于渐进式学习的舌苔图像分类模型的训练方法中的步骤。
以上所描述的装置实施例仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
最后应说明的是:本发明实施例公开的一种基于渐进式学习的舌苔图像分类模型的训练方法、装置、计算机设备以及存储介质所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims (10)

1.一种基于渐进式学习的舌苔图像分类模型的训练方法,其特征在于,所述方法包括:
获取至少包括多个舌苔图像的原始训练数据集;
按照预设的渐进式学习的分辨率扩增方式确定出目标分辨率集合;
按照预设的渐进式学习的正则化强度扩增方式确定出正则化强度值集合,其中,所述正则化强度值集合中的正则化强度值与所述目标分辨率集合中的目标分辨率一一对应,且所述目标分辨率对应的正则化强度值跟随所述目标分辨率的增大而增大;
对所述原始训练数据集中的每个舌苔图像执行预设的分辨率重置操作,以得到目标训练数据集集合,其中,所述目标训练数据集集合中的目标训练数据集与所述目标分辨率集合中的目标分辨率一一对应,且每组目标训练数据集中的舌苔图像的分辨率为该组目标训练数据集对应的目标分辨率;
基于所述目标训练数据集集合和所述正则化强度值集合,对预设的舌苔图像分类模型进行多次训练,使所述舌苔图像分类模型的目标损失函数收敛,以完成对所述舌苔图像分类模型的训练。
2.根据权利要求1所述的基于渐进式学习的舌苔图像分类模型的训练方法,其特征在于,所述按照预设的渐进式学习的分辨率扩增方式确定出目标分辨率集合,包括:
确定所述目标分辨率集合对应的最大分辨率和最小分辨率;
按照预设的目标分辨率确定方式从所述最大分辨率和所述最小分辨率之间的区间中确定出多个目标分辨率,以作为目标分辨率集合。
3.根据权利要求2所述的基于渐进式学习的舌苔图像分类模型的训练方法,其特征在于,所述按照预设的目标分辨率确定方式从所述最大分辨率和所述最小分辨率之间的区间中确定出多个目标分辨率,以作为目标分辨率集合,包括:
通过以下公式从所述最大分辨率和所述最小分辨率之间的区间中确定出多个目标分辨率,以作为目标分辨率集合:
Figure FDA0003265733480000021
其中,Si是所述目标分辨率集合中第i个目标分辨率,S0是所述最小分辨率,Se是所述最大分辨率,N为目标分辨率集合中目标分辨率的总数量。
4.根据权利要求3所述的基于渐进式学习的舌苔图像分类模型的训练方法,其特征在于,所述按照预设的渐进式学习的正则化强度扩增方式确定出正则化强度值集合,包括:
确定所述正则化强度值集合对应的最大正则化强度值和最小正则化强度值;
按照预设的正则化强度值确定方式从所述最大正则化强度值和所述最小正则化强度值之间的区间中确定出多个正则化强度值,以作为正则化强度值集合。
5.根据权利要求4所述的基于渐进式学习的舌苔图像分类模型的训练方法,其特征在于,所述按照预设的正则化强度值确定方式从所述最大正则化强度值和所述最小正则化强度值之间的区间中确定出多个正则化强度值,以作为正则化强度值集合,包括:
通过以下公式从所述最大正则化强度值和所述最小正则化强度值之间的区间中确定出多个正则化强度值,以作为正则化强度值集合:
Figure FDA0003265733480000022
其中,Di是所述正则化强度值集合中第i个正则化强度值,其与所述目标分辨率集合中第i个目标分辨率对应,D0是所述最小正则化强度值,De是所述最大正则化强度值,N为所述正则化强度值集合中正则化强度值的总数量。
6.根据权利要求1-5任一项所述的基于渐进式学习的舌苔图像分类模型的训练方法,其特征在于,所述原始训练数据集还包括每个所述舌苔图像对应的标注标签;
以及,所述基于所述目标训练数据集集合和所述正则化强度值集合,对预设的舌苔图像分类模型进行多次训练,使所述舌苔图像分类模型的目标损失函数收敛,以完成对所述舌苔图像分类模型的训练之后,所述方法还包括:
基于训练完成的所述舌苔图像分类模型对所述原始训练数据集中的每个所述舌苔图像进行分类预测,得到每个所述舌苔图像对应的预测标签和预测概率值;
根据每个所述舌苔图像对应的预测标签、预测概率值和标注标签,从所有的舌苔图像中筛选出噪声舌苔图像,其中,所述噪声舌苔图像是指所对应的预测标签和标注标签不一致,且预测概率值低于预设的预测概率值阈值的舌苔图像;
将所述噪声舌苔图像和所述噪声舌苔图像对应的标注标签从所述原始训练数据集中删除,以实现对所述原始训练数据集的清洗。
7.根据权利要求1-5任一项所述的基于渐进式学习的舌苔图像分类模型的训练方法,其特征在于,所述舌苔图像分类模型的目标损失函数为:
Figure FDA0003265733480000031
其中,yj为第j个舌苔图像对应的标注标签,pj是第j个舌苔图像对应的预测概率值,M为所述原始训练数据集中舌苔图像的总数量。
8.一种基于渐进式学习的舌苔图像分类模型的训练装置,其特征在于,所述装置包括:
获取模块,用于获取至少包括多个舌苔图像的原始训练数据集;
确定模块,用于按照预设的渐进式学习的分辨率扩增方式确定出目标分辨率集合;
所述确定模块,还用于按照预设的渐进式学习的正则化强度扩增方式确定出正则化强度值集合,其中,所述正则化强度值集合中的正则化强度值与所述目标分辨率集合中的目标分辨率一一对应,且所述目标分辨率对应的正则化强度值跟随所述目标分辨率的增大而增大;
分辨率重置模块,用于对所述原始训练数据集中的每个舌苔图像执行预设的分辨率重置操作,以得到目标训练数据集集合,其中,所述目标训练数据集集合中的目标训练数据集与所述目标分辨率集合中的目标分辨率一一对应,且每组目标训练数据集中的舌苔图像的分辨率为该组目标训练数据集对应的目标分辨率;
训练模块,用于基于所述目标训练数据集集合和所述正则化强度值集合,对预设的舌苔图像分类模型进行多次训练,使所述舌苔图像分类模型的目标损失函数收敛,以完成对所述舌苔图像分类模型的训练。
9.一种计算机设备,其特征在于,所述计算机设备包括:
存储有可执行程序代码的存储器;
与所述存储器连接的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7任一项所述的基于渐进式学习的舌苔图像分类模型的训练方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的基于渐进式学习的舌苔图像分类模型的训练方法。
CN202111086464.5A 2021-09-16 2021-09-16 基于渐进式学习的舌苔图像分类模型的训练方法 Active CN113780444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111086464.5A CN113780444B (zh) 2021-09-16 2021-09-16 基于渐进式学习的舌苔图像分类模型的训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111086464.5A CN113780444B (zh) 2021-09-16 2021-09-16 基于渐进式学习的舌苔图像分类模型的训练方法

Publications (2)

Publication Number Publication Date
CN113780444A true CN113780444A (zh) 2021-12-10
CN113780444B CN113780444B (zh) 2023-07-25

Family

ID=78851364

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111086464.5A Active CN113780444B (zh) 2021-09-16 2021-09-16 基于渐进式学习的舌苔图像分类模型的训练方法

Country Status (1)

Country Link
CN (1) CN113780444B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094966A (zh) * 2023-08-21 2023-11-21 青岛美迪康数字工程有限公司 基于图像扩增的舌图像识别方法、装置和计算机设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109345469A (zh) * 2018-09-07 2019-02-15 苏州大学 一种基于条件生成对抗网络的oct成像中散斑去噪方法
CN109657722A (zh) * 2018-12-20 2019-04-19 山东农业大学 基于深度学习算法的舌苔图像识别方法及***
CN110738235A (zh) * 2019-09-16 2020-01-31 平安科技(深圳)有限公司 肺结核判定方法、装置、计算机设备及存储介质
WO2021016131A1 (en) * 2019-07-19 2021-01-28 The Jackson Laboratory Convolutional neural networks for classification of cancer histological images
CN112766155A (zh) * 2021-01-19 2021-05-07 山东华宇航天空间技术有限公司 一种基于深度学习的海水养殖区提取方法
CN112884648A (zh) * 2021-01-25 2021-06-01 汉斯夫(杭州)医学科技有限公司 多类模糊图像超分辨率重建的方法和***
CN112991183A (zh) * 2021-04-09 2021-06-18 华南理工大学 一种基于多帧注意力机制渐进式融合的视频超分辨率方法
CN113379602A (zh) * 2021-06-08 2021-09-10 中国科学技术大学 利用零样本学习的光场超分辨率增强方法
CN113392845A (zh) * 2021-06-15 2021-09-14 广州观必达数据技术有限责任公司 一种基于u-net的深度学习遥感图像语义分割方法及***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109345469A (zh) * 2018-09-07 2019-02-15 苏州大学 一种基于条件生成对抗网络的oct成像中散斑去噪方法
CN109657722A (zh) * 2018-12-20 2019-04-19 山东农业大学 基于深度学习算法的舌苔图像识别方法及***
WO2021016131A1 (en) * 2019-07-19 2021-01-28 The Jackson Laboratory Convolutional neural networks for classification of cancer histological images
CN110738235A (zh) * 2019-09-16 2020-01-31 平安科技(深圳)有限公司 肺结核判定方法、装置、计算机设备及存储介质
CN112766155A (zh) * 2021-01-19 2021-05-07 山东华宇航天空间技术有限公司 一种基于深度学习的海水养殖区提取方法
CN112884648A (zh) * 2021-01-25 2021-06-01 汉斯夫(杭州)医学科技有限公司 多类模糊图像超分辨率重建的方法和***
CN112991183A (zh) * 2021-04-09 2021-06-18 华南理工大学 一种基于多帧注意力机制渐进式融合的视频超分辨率方法
CN113379602A (zh) * 2021-06-08 2021-09-10 中国科学技术大学 利用零样本学习的光场超分辨率增强方法
CN113392845A (zh) * 2021-06-15 2021-09-14 广州观必达数据技术有限责任公司 一种基于u-net的深度学习遥感图像语义分割方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094966A (zh) * 2023-08-21 2023-11-21 青岛美迪康数字工程有限公司 基于图像扩增的舌图像识别方法、装置和计算机设备
CN117094966B (zh) * 2023-08-21 2024-04-05 青岛美迪康数字工程有限公司 基于图像扩增的舌图像识别方法、装置和计算机设备

Also Published As

Publication number Publication date
CN113780444B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
CN111666857B (zh) 基于环境语义理解的人体行为识别方法、装置及存储介质
CN110363220B (zh) 行为类别检测方法、装置、电子设备和计算机可读介质
CN110443222B (zh) 用于训练脸部关键点检测模型的方法和装置
CN111933284B (zh) 一种并发症风险预测***、方法、装置、设备及介质
CN111767707A (zh) 雷同病例检测方法、装置、设备及存储介质
CN111414946B (zh) 基于人工智能的医疗影像的噪声数据识别方法和相关装置
CN112528764B (zh) 人脸表情识别方法、***、装置及可读存储介质
CN110956615B (zh) 图像质量评估模型训练方法、装置、电子设备及存储介质
CN111738351A (zh) 模型训练方法、装置、存储介质及电子设备
CN112560964A (zh) 基于半监督学习训练中草药病虫害识别模型的方法与***
CN110288085B (zh) 一种数据处理方法、装置、***及存储介质
CN110379491B (zh) 识别脑胶质瘤方法、装置、设备和存储介质
US20200160119A1 (en) Sequential learning maintaining a learned concept
CN111724370A (zh) 一种基于不确定性和概率的多任务无参考图像质量评估方法及***
CN111368911A (zh) 一种图像分类方法、装置和计算机可读存储介质
CN113705685A (zh) 疾病特征识别模型训练、疾病特征识别方法、装置及设备
CN113780444A (zh) 基于渐进式学习的舌苔图像分类模型的训练方法
CN115222443A (zh) 客户群体划分方法、装置、设备及存储介质
CN111489803A (zh) 基于自回归模型的报告单编码模型生成方法、***和设备
CN113177554B (zh) 甲状腺结节识别与分割方法、***、存储介质及设备
CN112818946A (zh) 年龄识别模型的训练、年龄识别方法、装置及电子设备
CN117252847A (zh) 一种上颌前牙牙槽骨缺损检测与识别方法及装置
CN115713669B (zh) 一种基于类间关系的图像分类方法、装置、存储介质及终端
JP7238905B2 (ja) 認識器訓練装置、認識装置、データ処理システム、データ処理方法、およびプログラム
CN112668710A (zh) 模型训练、管状物提取、数据识别方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant