CN114863242B - 一种面向图像识别的深度学习网络的优化方法及*** - Google Patents

一种面向图像识别的深度学习网络的优化方法及*** Download PDF

Info

Publication number
CN114863242B
CN114863242B CN202210447416.2A CN202210447416A CN114863242B CN 114863242 B CN114863242 B CN 114863242B CN 202210447416 A CN202210447416 A CN 202210447416A CN 114863242 B CN114863242 B CN 114863242B
Authority
CN
China
Prior art keywords
label
distance
image data
initial
image recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210447416.2A
Other languages
English (en)
Other versions
CN114863242A (zh
Inventor
袁潮
赵月峰
其他发明人请求不公开姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhuohe Technology Co Ltd
Original Assignee
Beijing Zhuohe Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhuohe Technology Co Ltd filed Critical Beijing Zhuohe Technology Co Ltd
Priority to CN202210447416.2A priority Critical patent/CN114863242B/zh
Publication of CN114863242A publication Critical patent/CN114863242A/zh
Application granted granted Critical
Publication of CN114863242B publication Critical patent/CN114863242B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供的一种面向图像识别的深度学习网络的优化方法及***,具体应用于图像识别领域,采集待训练图像数据;其中,待训练图像数据携带有初始标签;构建深度学习网络模型;将待训练图像数据输入深度学习网络模型,通过改进比例积分控制器训练深度学习网络模型的参数,构建第一图像识别模型;根据第一图像识别模型,确定待训练图像数据的修正标签;采用FASTA算法,计算初始标签和修正标签之间的距离;根据距离,筛选待训练图像数据的修正标签;将筛选后的携带修正标签的待训练图像数据输入第一图像识别模型,通过改进比例积分控制器训练第一图像识别模型的参数,获得第二图像识别模型。由此提高图像识别模型的识别效率和准确率。

Description

一种面向图像识别的深度学习网络的优化方法及***
技术领域
本申请涉及图像识别领域,更具体地,涉及一种面向图像识别的深度学习网络的优化方法及***。
背景技术
图像识别是指利用计算机对图像进行处理、分析和理解,以识别各种不同的目标和对象的技术,随着计算机技术的发展,人们使用深度学习算法进行实践应用。例如,图像识别包括人脸识别、车辆识别等。
随着深度学习技术的发展,在可控环境下,基于深度网络模型的图像识别的精度取得了令人满意的精度。但随着采集图像的质量和数量的减少,图像识别方法的精度下降得很显著。进而导致图像识别方法在推理阶段缺乏区分特征的能力,不能满足使用者的实际需求。
因此在使用深度学习网络模型时,如何利用低质量且少量的图像数据,训练出高准确度的图像识别模型,是一项亟待解决的问题。
发明内容
本发明实施例的目的在于提供一种面向图像识别的深度学习网络的优化方法及***,通过具有四个卷积层和四个池化层的前向传播网络和具有两个卷积层、四个膨胀卷积层和四个池化层的后向传播网络的深度学习网络模型,修正待训练图像数据的标签,同时引入FASTA算法计算标签之间的距离,提高修正标签的准确性,进而优化图像识别模型的识别效率和准确率。具体技术方案如下:
在本发明实施例的第一方面,提供一种面向图像识别的深度学习网络的优化方法,包括:采集待训练图像数据;其中,所述待训练图像数据携带有初始标签;构建深度学习网络模型;所述深度学习网络模型是卷积神经网络模型,包括前向传播网络和后向传播网络;其中,所述前向传播网络包括四个卷积层和四个池化层,所述后向传播网络包括两个卷积层、四个膨胀卷积层和四个池化层;将所述待训练图像数据输入所述深度学习网络模型,通过改进比例积分控制器训练所述深度学习网络模型的参数,构建第一图像识别模型;根据所述第一图像识别模型,确定所述待训练图像数据的修正标签;采用FASTA算法,计算所述初始标签和所述修正标签之间的距离;根据所述距离,筛选所述待训练图像数据的修正标签;将筛选后的携带修正标签的待训练图像数据输入第一图像识别模型,通过改进比例积分控制器训练所述第一图像识别模型的参数,获得第二图像识别模型。
可选地,所述通过改进比例积分控制器训练所述深度学习网络模型的参数,构建第一图像识别模型,包括:根据当前步梯度的估计值,更新模型参数,判断上一步梯度的方向与当前步梯度的方向是否一致,若一致,则采用动量优化算法进行参数训练;若不一致,则采用随机梯度下降算法进行参数训练,直至模型满足预设训练终止条件。
可选地,根据以下公式判断上一步梯度的方向与当前步梯度的方向是否一致:
Figure GDA0003887820600000021
其中,dic表示判断值,sgn(·)表示符号函数,
Figure GDA0003887820600000022
表示当前步t的梯度,vt表示当前步t的速度。
可选地,若所述判断值为1,则上一步梯度的方向与当前步梯度的方向一致;若所述判断值为-1,则上一步梯度的方向与当前步梯度的方向不一致。
可选地,所述采用FASTA算法,计算所述初始标签和所述修正标签之间的距离,包括:采用脱氧核苷酸序列的参考格式编码所述初始标签和所述修正标签,获得第一初始标签序列和第一修正标签序列;计算所述第一初始标签序列和所述第一修正标签序列之间的距离,作为第一距离;采用one-hot编码所述初始标签和所述修正标签,获得第二初始标签序列和第二修正标签序列;计算所述第二初始标签序列和所述第二修正标签序列之间的距离,作为第二距离;对所述第一距离和所述第二距离进行加权求和处理,得到的结果作为所述初始标签和所述修正标签之间的距离。
可选地,所述采用脱氧核苷酸序列的参考格式编码所述初始标签和所述修正标签,包括:采用脱氧核苷酸序列的参考格式编码所述初始标签的声调和所述修正标签的声调;其中所述脱氧核苷酸序列的参考格式的腺嘌呤脱氧核苷酸A对应第一声、胸腺嘧啶脱氧核苷酸T对应第二声、胞嘧啶脱氧核苷酸C对应第三声以及鸟嘌呤脱氧核苷酸G对应第四声。
可选地,所述根据所述距离,筛选所述待训练图像数据的修正标签,包括:归一化处理所述距离,获得归一化距离;若所述归一化距离大于预设阈值,则去除相应的待训练图像数据的修正标签;反之,则保留相应的待训练图像数据的修正标签。
可选地,通过以下公式计算所述归一化距离:
Figure GDA0003887820600000031
其中,ε表示调节系数,初始标签的个数为n,tf(i)表示初始标签i的出现次数,SIMi,j表示初始标签i和对应的修正标签j之间的距离。
可选地,该方法还包括:获取待识别图像数据;通过所述第二图像识别模型对所述待识别图像数据进行识别,获得图像识别结果。
在本发明实施例的又一方面,提供一种面向图像识别的深度学习网络的优化***,包括:数据采集模块,用于采集待训练图像数据;其中,所述待训练图像数据携带有初始标签;深度学习网络模型构建模块,用于构建深度学习网络模型;所述深度学习网络模型是卷积神经网络模型,包括前向传播网络和后向传播网络;其中,所述前向传播网络包括四个卷积层和四个池化层,所述后向传播网络包括两个卷积层、四个膨胀卷积层和四个池化层;第一图像识别模型构建模块,用于将所述待训练图像数据输入所述深度学习网络模型,通过改进比例积分控制器训练所述深度学习网络模型的参数,构建第一图像识别模型;修正标签确定模块,用于根据所述第一图像识别模型,确定所述待训练图像数据的修正标签;距离计算模块,用于采用FASTA算法,计算所述初始标签和所述修正标签之间的距离;修正标签筛选模块,用于根据所述距离,筛选所述待训练图像数据的修正标签;第二图像识别模型构建模块,用于将筛选后的携带修正标签的待训练图像数据输入第一图像识别模型,通过改进比例积分控制器训练所述第一图像识别模型的参数,获得第二图像识别模型。
可选地,所述第一图像识别模型构建模块,进一步用于:根据当前步梯度的估计值,更新模型参数,判断上一步梯度的方向与当前步梯度的方向是否一致,若一致,则采用动量优化算法进行参数训练;若不一致,则采用随机梯度下降算法进行参数训练,直至模型满足预设训练终止条件。
可选地,根据以下公式判断上一步梯度的方向与当前步梯度的方向是否一致:
Figure GDA0003887820600000041
其中,dic表示判断值,sgn(·)表示符号函数,
Figure GDA0003887820600000042
表示当前步t的梯度,vt表示当前步t的速度。
可选地,若所述判断值为1,则上一步梯度的方向与当前步梯度的方向一致;若所述判断值为-1,则上一步梯度的方向与当前步梯度的方向不一致。
可选地,所述距离计算模块,进一步用于:采用脱氧核苷酸序列的参考格式编码所述初始标签和所述修正标签,获得第一初始标签序列和第一修正标签序列;计算所述第一初始标签序列和所述第一修正标签序列之间的距离,作为第一距离;采用one-hot编码所述初始标签和所述修正标签,获得第二初始标签序列和第二修正标签序列;计算所述第二初始标签序列和所述第二修正标签序列之间的距离,作为第二距离;对所述第一距离和所述第二距离进行加权求和处理,得到的结果作为所述初始标签和所述修正标签之间的距离。
进一步地,所述采用脱氧核苷酸序列的参考格式编码所述初始标签和所述修正标签,包括:采用脱氧核苷酸序列的参考格式编码所述初始标签的声调和所述修正标签的声调;其中所述脱氧核苷酸序列的参考格式的腺嘌呤脱氧核苷酸A对应第一声、胸腺嘧啶脱氧核苷酸T对应第二声、胞嘧啶脱氧核苷酸C对应第三声以及鸟嘌呤脱氧核苷酸G对应第四声。
可选地,所述修正标签筛选模块,进一步用于:归一化处理所述距离,获得归一化距离;若所述归一化距离大于预设阈值,则去除相应的待训练图像数据的修正标签;反之,则保留相应的待训练图像数据的修正标签。
进一步地,通过以下公式计算所述归一化距离:
Figure GDA0003887820600000051
其中,ε表示调节系数,初始标签的个数为n,tf(i)表示初始标签i的出现次数,SIMi,j表示初始标签i和对应的修正标签j之间的距离。
可选地,该***还包括图像识别模块,用于获取待识别图像数据;通过所述第二图像识别模型对所述待识别图像数据进行识别,获得图像识别结果。
有益效果:
(1)将携带初始标签的待训练图像数据用于训练第一图像识别模型,根据第一图像识别模型识别出修正标签,再将修正标签输入第一图像识别模型,进一步训练出第二图像识别模型;这一过程中,还进行了修正标签的筛选,引入FASTA编码和one-hot编码,计算初始标签和修正标签之间的距离;提出全新的归一化距离计算方式,筛选修正标签;通过两次训练和标签筛选,提高图像识别模型的识别效率和准确率。
(2)采用前向传播网络和后向传播网络的卷积神经网络模型构建深度学习网络模型;其中所述前向传播网络包括四个卷积层和四个池化层,所述后向传播网络包括两个卷积层、四个膨胀卷积层和四个池化层。这种深度学习网络架构,能够在不增加推理计算开销的同时,提升模型的识别性能。
(3)将动量优化算法和随机梯度下降算法的优势结合起来,提出改进比例积分控制器,并用于深度学习网络模型,加快模型收敛速度,避免陷入局部最优解。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的面向图像识别的深度学习网络的优化方法的流程图;
图2是本申请实施例提供的图像识别方法的流程图;
图3是本申请实施例提供的面向图像识别的深度学习网络的优化***的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种面向图像识别的深度学习网络的优化方法及***,具体包括:采集待训练图像数据;其中,所述待训练图像数据携带有初始标签;构建深度学习网络模型;将所述待训练图像数据输入所述深度学习网络模型,通过改进比例积分控制器训练所述深度学习网络模型的参数,构建第一图像识别模型;根据所述第一图像识别模型,确定所述待训练图像数据的修正标签;采用FASTA算法,计算所述初始标签和所述修正标签之间的距离;根据所述距离,筛选所述待训练图像数据的修正标签;将筛选后的携带修正标签的待训练图像数据输入第一图像识别模型,通过改进比例积分控制器训练所述第一图像识别模型的参数,获得第二图像识别模型。由此提高图像识别模型的识别效率和准确率。
该面向图像识别的深度学***板电脑、智能蓝牙设备、笔记本电脑、或者个人电脑(Persona l Computer,PC)等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。
可以理解的是,本实施例的该面向图像识别的深度学习网络的优化方法及***可以是在终端上执行的,也可以是在服务器上执行,还可以由终端和服务器共同执行的。以上举例不应理解为对本申请的限制。
人工智能(Art i ficia l I nte l l i gence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用装置。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
近年来,随着人工智能技术研究和进步,人工智能技术在多个领域得到广泛应用,本公开实施例提供的方案涉及计算机视觉技术、人工智能的机器学习/深度学习等技术,具体通过如下实施例进行说明:
请参阅图1,图1示出根据本公开一实施例提供的面向图像识别的深度学习网络的优化方法的流程图,该方法具体包括如下步骤:
S110、采集待训练图像数据;其中,所述待训练图像数据携带有初始标签。
S120、构建深度学习网络模型;所述深度学习网络模型是卷积神经网络模型,包括前向传播网络和后向传播网络;其中,所述前向传播网络包括四个卷积层和四个池化层,所述后向传播网络包括两个卷积层、四个膨胀卷积层和四个池化层。
这种深度学习网络架构,能够在不增加推理计算开销的同时,提升模型的识别性能。
S130、将所述待训练图像数据输入所述深度学习网络模型,通过改进比例积分控制器训练所述深度学习网络模型的参数,构建第一图像识别模型。
在一种实施方式中,所述步骤S130可以具体包括以下步骤:
S131、根据当前步梯度的估计值,更新模型参数。
S132、判断上一步梯度的方向与当前步梯度的方向是否一致。
具体地,通过以下公式判断上一步梯度的方向与当前步梯度的方向是否一致:
Figure GDA0003887820600000091
其中,dic表示判断值,sgn(·)表示符号函数,
Figure GDA0003887820600000092
表示当前步t的梯度,vt表示当前步t的速度。
进一步地,若所述判断值为1,即dic=1,则上一步梯度的方向与当前步梯度的方向一致;若所述判断值为-1,即dic=-1,则上一步梯度的方向与当前步梯度的方向不一致。
S133、若上一步梯度的方向与当前步梯度的方向一致,则采用动量优化算法进行参数训练;若上一步梯度的方向与当前步梯度的方向不一致,则采用随机梯度下降算法进行参数训练。
具体地,所述动量优化算法的迭代公式为:
θt+1=θt-vt+1
其中,θt表示当前步t的模型参数,θt+1表示下一步t+1的模型参数,vt+1表示下一步t+1的速度。
所述随机梯度下降算法的迭代公式为:
Figure GDA0003887820600000093
其中,θt表示当前步t的模型参数,θt+1表示下一步t+1的模型参数,
Figure GDA0003887820600000094
表示当前步t的梯度,r表示学习率,也表示梯度每次逼近的步长,L(θt)表示当前步t的损失函数。
S134、直至模型满足预设训练终止条件。
其中,预设损失函数,若损失数据满足预设损失函数,则停止训练。
由此将动量优化算法和随机梯度下降算法的优势结合起来训练深度神经网络模型,加快模型收敛速度,避免陷入局部最优解。
S140、根据所述第一图像识别模型,确定所述待训练图像数据的修正标签。
S150、采用FASTA算法,计算所述初始标签和所述修正标签之间的距离。
在一种实施方式中,步骤S150可以具体包括以下步骤:
S151、采用脱氧核苷酸序列的参考格式编码所述初始标签和所述修正标签,获得第一初始标签序列和第一修正标签序列。
其中,FASTA算法是一种基于基因遗传序列提出的算法,其中包括四种脱氧核苷酸,而汉字的声调也是四种,因此提出采用脱氧核苷酸序列的参考格式编码标签的声调,此处的参考格式是指对标签的编码格式,沿用参考脱氧核苷酸序列的格式。
具体地,采用脱氧核苷酸序列的参考格式编码所述初始标签的声调和所述修正标签的声调;其中所述脱氧核苷酸序列的参考格式的腺嘌呤脱氧核苷酸A对应第一声、胸腺嘧啶脱氧核苷酸T对应第二声、胞嘧啶脱氧核苷酸C对应第三声以及鸟嘌呤脱氧核苷酸G对应第四声。例如,初始标签为“男明星”,编码后得到第一初始标签序列为{TTA},相应的修正标签为“喜剧男明星”,编码后得到第一修正标签序列为{CGTTA}。
S152、计算所述第一初始标签序列和所述第一修正标签序列之间的距离,作为第一距离。
例如,计算第一初始标签序列{TTA}与第一修正标签序列{CGTTA}之间的编辑距离。
S153、采用one-hot编码所述初始标签和所述修正标签,获得第二初始标签序列和第二修正标签序列。
S154、计算所述第二初始标签序列和所述第二修正标签序列之间的距离,作为第二距离。
其中,第二距离具体可以是编辑距离。
S155、对所述第一距离和所述第二距离进行加权求和处理,得到的结果作为所述初始标签和所述修正标签之间的距离。
具体地,可以通过以下公式计算初始标签i和其对应的修正标签j之间的距离:
|SIMi,j|=α×SIM1+β×SIM2
其中,α和β表示权重参数,SIM1表示第一距离,SIM2表示第二距离。
该实施例中将A编码与one-hot编码结合,同时考虑标签的声调信息和特征信息,由此修正标签筛选的准确性。
S160、根据所述距离,筛选所述待训练图像数据的修正标签。
在一种实施方式中,步骤S160可以具体包括以下步骤:
S161、归一化处理所述距离,获得归一化距离。
具体地,可以通过以下公式计算所述归一化距离:
Figure GDA0003887820600000111
其中,ε表示调节系数,初始标签的个数为n,tf(i)表示初始标签i的出现次数,SIMi,j表示初始标签i和对应的修正标签j之间的距离。
该归一化距离计算方式,能够进一步提高修正标签筛选的准确性。
S162、若所述归一化距离大于预设阈值,则去除相应的待训练图像数据的修正标签;反之,则保留相应的待训练图像数据的修正标签。
S170、将筛选后的携带修正标签的待训练图像数据输入第一图像识别模型,通过改进比例积分控制器训练所述第一图像识别模型的参数,获得第二图像识别模型。
由此通过模型的两次训练和标签筛选,提高图像识别模型的识别效率和准确率。
图2示出了本申请实施例提供的图像识别方法的流程图,请参考图2,具体包括如下步骤:
S210、获取待识别图像数据。
本实施例中,利用图像识别装置获取待识别图像数据,可以理解的是,图像识别装置部署在终端设备上,待识别图像数据可以是通过终端设备的摄像头实时拍摄后得到的图像数据,也可以是存储在终端设备本地的图像数据。
其中,待识别图像数据可以是静态图像或动态图像,具体可以是人脸图像数据,动物图像数据、行人图像数据像或者车辆图像数据。
S220、通过所述第二图像识别模型对所述待识别图像数据进行识别,获得图像识别结果。
可选地,该步骤之前,预处理所述待识别图像数据。例如,灰度化、几何变换以及基于空间域法的图像增强等预处理技术。
其中,所述第二图像识别模型可以是上述图像识别模型训练过程得到的。
本实施方式通过第二图像识别模型进行图像识别,可以提高图像识别结果的精确度。
本实施例还提供面向图像识别的深度学习网络的优化***,如图3所示,该***包括:
数据采集模块310,用于采集待训练图像数据;其中,所述待训练图像数据携带有初始标签。
深度学习网络模型构建模块320,用于构建深度学习网络模型;所述深度学习网络模型是卷积神经网络模型,包括前向传播网络和后向传播网络;其中,所述前向传播网络包括四个卷积层和四个池化层,所述后向传播网络包括两个卷积层、四个膨胀卷积层和四个池化层。
第一图像识别模型构建模块330,用于将所述待训练图像数据输入所述深度学习网络模型,通过改进比例积分控制器训练所述深度学习网络模型的参数,构建第一图像识别模型。
修正标签确定模块340,用于根据所述第一图像识别模型,确定所述待训练图像数据的修正标签。
距离计算模块350,用于采用FASTA算法,计算所述初始标签和所述修正标签之间的距离。
修正标签筛选模块360,用于根据所述距离,筛选所述待训练图像数据的修正标签。
第二图像识别模型构建模块370,用于将筛选后的携带修正标签的待训练图像数据输入第一图像识别模型,通过改进比例积分控制器训练所述第一图像识别模型的参数,获得第二图像识别模型。
可选地,所述第一图像识别模型构建模块330,进一步用于:根据当前步梯度的估计值,更新模型参数,判断上一步梯度的方向与当前步梯度的方向是否一致,若一致,则采用动量优化算法进行参数训练;若不一致,则采用随机梯度下降算法进行参数训练,直至模型满足预设训练终止条件。
可选地,根据以下公式判断上一步梯度的方向与当前步梯度的方向是否一致:
Figure GDA0003887820600000131
其中,dic表示判断值,sgn(·)表示符号函数,
Figure GDA0003887820600000141
表示当前步t的梯度,vt表示当前步t的速度。
可选地,若所述判断值为1,则上一步梯度的方向与当前步梯度的方向一致;若所述判断值为-1,则上一步梯度的方向与当前步梯度的方向不一致。
可选地,所述距离计算模块350,进一步用于:采用脱氧核苷酸序列的参考格式编码所述初始标签和所述修正标签,获得第一初始标签序列和第一修正标签序列;计算所述第一初始标签序列和所述第一修正标签序列之间的距离,作为第一距离;采用one-hot编码所述初始标签和所述修正标签,获得第二初始标签序列和第二修正标签序列;计算所述第二初始标签序列和所述第二修正标签序列之间的距离,作为第二距离;对所述第一距离和所述第二距离进行加权求和处理,得到的结果作为所述初始标签和所述修正标签之间的距离。
进一步地,所述采用脱氧核苷酸序列的参考格式编码所述初始标签和所述修正标签,包括:采用脱氧核苷酸序列的参考格式编码所述初始标签的声调和所述修正标签的声调;其中所述脱氧核苷酸序列的参考格式的腺嘌呤脱氧核苷酸A对应第一声、胸腺嘧啶脱氧核苷酸T对应第二声、胞嘧啶脱氧核苷酸C对应第三声以及鸟嘌呤脱氧核苷酸G对应第四声。
可选地,所述修正标签筛选模块360,进一步用于:归一化处理所述距离,获得归一化距离;若所述归一化距离大于预设阈值,则去除相应的待训练图像数据的修正标签;反之,则保留相应的待训练图像数据的修正标签。
进一步地,通过以下公式计算所述归一化距离:
Figure GDA0003887820600000142
其中,ε表示调节系数,初始标签的个数为n,tf(i)表示初始标签i的出现次数,SIMi,j表示初始标签i和对应的修正标签j之间的距离。
可选地,该***还包括第二图像识别模块370,用于获取待识别图像数据;通过所述第二图像识别模型对所述待识别图像数据进行识别,获得图像识别结果。
由此该***能够提高图像识别模型的识别效率和准确率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置中模块/单元/子单元/组件的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-On l y Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种面向图像识别的深度学习网络的优化方法,其特征在于,该方法包括:
采集待训练图像数据;其中,所述待训练图像数据携带有初始标签;
构建深度学习网络模型;所述深度学习网络模型是卷积神经网络模型,包括前向传播网络和后向传播网络;其中,所述前向传播网络包括四个卷积层和四个池化层,所述后向传播网络包括两个卷积层、四个膨胀卷积层和四个池化层;
将所述待训练图像数据输入所述深度学习网络模型,通过改进比例积分控制器训练所述深度学习网络模型的参数,构建第一图像识别模型;
根据所述第一图像识别模型,确定所述待训练图像数据的修正标签;
采用FASTA算法,计算所述初始标签和所述修正标签之间的距离;
所述采用FASTA算法,计算所述初始标签和所述修正标签之间的距离,包括:
采用脱氧核苷酸序列的参考格式编码所述初始标签和所述修正标签,获得第一初始标签序列和第一修正标签序列;
计算所述第一初始标签序列和所述第一修正标签序列之间的距离,作为第一距离;
采用one-hot编码所述初始标签和所述修正标签,获得第二初始标签序列和第二修正标签序列;
计算所述第二初始标签序列和所述第二修正标签序列之间的距离,作为第二距离;
对所述第一距离和所述第二距离进行加权求和处理,得到的结果作为所述初始标签和所述修正标签之间的距离;
根据所述距离,筛选所述待训练图像数据的修正标签;
将筛选后的携带修正标签的待训练图像数据输入第一图像识别模型,通过改进比例积分控制器训练所述第一图像识别模型的参数,获得第二图像识别模型。
2.根据权利要求1所述的方法,其特征在于,所述通过改进比例积分控制器训练所述深度学习网络模型的参数,构建第一图像识别模型,包括:
根据当前步梯度的估计值,更新模型参数,判断上一步梯度的方向与当前步梯度的方向是否一致,若一致,则采用动量优化算法进行参数训练;若不一致,则采用随机梯度下降算法进行参数训练,直至模型满足预设训练终止条件。
3.根据权利要求2所述的方法,其特征在于,根据以下公式判断上一步梯度的方向与当前步梯度的方向是否一致:
dic=sgn(▽L(θt))sgn(vt)
其中,dic表示判断值,sgn(·)表示符号函数,▽L(θt)表示当前步t的梯度,vt表示当前步t的速度。
4.根据权利要求3所述的方法,其特征在于,若所述判断值为1,则上一步梯度的方向与当前步梯度的方向一致;若所述判断值为-1,则上一步梯度的方向与当前步梯度的方向不一致。
5.根据权利要求1所述的方法,其特征在于,所述采用脱氧核苷酸序列的参考格式编码所述初始标签和所述修正标签,包括:
采用所述脱氧核苷酸序列的参考格式编码所述初始标签的声调和所述修正标签的声调;其中,所述脱氧核苷酸序列的参考格式的腺嘌呤脱氧核苷酸A对应第一声、胸腺嘧啶脱氧核苷酸T对应第二声、胞嘧啶脱氧核苷酸C对应第三声以及鸟嘌呤脱氧核苷酸G对应第四声。
6.根据权利要求5所述的方法,其特征在于,所述根据所述距离,筛选所述待训练图像数据的修正标签,包括:
归一化处理所述距离,获得归一化距离;
若所述归一化距离大于预设阈值,则去除相应的待训练图像数据的修正标签;
反之,则保留相应的待训练图像数据的修正标签。
7.根据权利要求6所述的方法,其特征在于,通过以下公式计算所述归一化距离:
Figure FDA0003887820590000031
其中,ε表示调节系数,初始标签的个数为n,tf(i)表示初始标签i的出现次数,SIMi,j表示初始标签i和对应的修正标签j之间的距离。
8.根据权利要求1所述的方法,其特征在于,该方法还包括:
获取待识别图像数据;
通过所述第二图像识别模型对所述待识别图像数据进行识别,获得图像识别结果。
9.一种基于权利要求1-8任一项所述方法的面向图像识别的深度学习网络的优化***,其特征在于,该***包括:
数据采集模块,用于采集待训练图像数据;其中,所述待训练图像数据携带有初始标签;
深度学习网络模型构建模块,用于构建深度学习网络模型;所述深度学习网络模型是卷积神经网络模型,包括前向传播网络和后向传播网络;其中,所述前向传播网络包括四个卷积层和四个池化层,所述后向传播网络包括两个卷积层、四个膨胀卷积层和四个池化层;
第一图像识别模型构建模块,用于将所述待训练图像数据输入所述深度学习网络模型,通过改进比例积分控制器训练所述深度学习网络模型的参数,构建第一图像识别模型;
修正标签确定模块,用于根据所述第一图像识别模型,确定所述待训练图像数据的修正标签;
距离计算模块,用于采用FASTA算法,计算所述初始标签和所述修正标签之间的距离;
所述距离计算模块,进一步用于采用脱氧核苷酸序列的参考格式编码所述初始标签和所述修正标签,获得第一初始标签序列和第一修正标签序列;
计算所述第一初始标签序列和所述第一修正标签序列之间的距离,作为第一距离;
采用one-hot编码所述初始标签和所述修正标签,获得第二初始标签序列和第二修正标签序列;
计算所述第二初始标签序列和所述第二修正标签序列之间的距离,作为第二距离;
对所述第一距离和所述第二距离进行加权求和处理,得到的结果作为所述初始标签和所述修正标签之间的距离;
修正标签筛选模块,用于根据所述距离,筛选所述待训练图像数据的修正标签;
第二图像识别模型构建模块,用于将筛选后的携带修正标签的待训练图像数据输入第一图像识别模型,通过改进比例积分控制器训练所述第一图像识别模型的参数,获得第二图像识别模型。
CN202210447416.2A 2022-04-26 2022-04-26 一种面向图像识别的深度学习网络的优化方法及*** Active CN114863242B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210447416.2A CN114863242B (zh) 2022-04-26 2022-04-26 一种面向图像识别的深度学习网络的优化方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210447416.2A CN114863242B (zh) 2022-04-26 2022-04-26 一种面向图像识别的深度学习网络的优化方法及***

Publications (2)

Publication Number Publication Date
CN114863242A CN114863242A (zh) 2022-08-05
CN114863242B true CN114863242B (zh) 2022-11-29

Family

ID=82634184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210447416.2A Active CN114863242B (zh) 2022-04-26 2022-04-26 一种面向图像识别的深度学习网络的优化方法及***

Country Status (1)

Country Link
CN (1) CN114863242B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543920A (zh) * 2019-09-12 2019-12-06 北京达佳互联信息技术有限公司 图像识别模型的性能检测方法、装置、服务器及存储介质
CN111353549A (zh) * 2020-03-10 2020-06-30 创新奇智(重庆)科技有限公司 图像标签的核验方法及装置、电子设备、存储介质
WO2020243469A1 (en) * 2019-05-31 2020-12-03 Kiromic BioPharma, Inc. Methods for identifying and using disease-associated antigens
AU2020103613A4 (en) * 2020-11-23 2021-02-04 Agricultural Information and Rural Economic Research Institute of Sichuan Academy of Agricultural Sciences Cnn and transfer learning based disease intelligent identification method and system
CN113469236A (zh) * 2021-06-25 2021-10-01 江苏大学 一种自我标签学习的深度聚类图像识别***及方法
CN113658643A (zh) * 2021-07-22 2021-11-16 西安理工大学 一种基于注意力机制对lncRNA和mRNA的预测方法
CN113903395A (zh) * 2021-10-28 2022-01-07 聊城大学 一种改进粒子群优化的bp神经网络拷贝数变异检测方法与***
CN113963258A (zh) * 2021-09-28 2022-01-21 上海东普信息科技有限公司 工牌佩戴识别方法、装置、设备和存储介质
CN113971183A (zh) * 2020-07-22 2022-01-25 阿里巴巴集团控股有限公司 实体打标模型训练的方法、装置及电子设备
CN114119403A (zh) * 2021-11-23 2022-03-01 北京拙河科技有限公司 基于红色通道引导的图像去雾方法和***

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210118559A1 (en) * 2019-10-22 2021-04-22 Tempus Labs, Inc. Artificial intelligence assisted precision medicine enhancements to standardized laboratory diagnostic testing
CN112598020A (zh) * 2020-11-24 2021-04-02 深兰人工智能(深圳)有限公司 目标识别方法及***
CN112529210A (zh) * 2020-12-09 2021-03-19 广州云从鼎望科技有限公司 模型训练方法、装置以及计算机可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020243469A1 (en) * 2019-05-31 2020-12-03 Kiromic BioPharma, Inc. Methods for identifying and using disease-associated antigens
CN110543920A (zh) * 2019-09-12 2019-12-06 北京达佳互联信息技术有限公司 图像识别模型的性能检测方法、装置、服务器及存储介质
CN111353549A (zh) * 2020-03-10 2020-06-30 创新奇智(重庆)科技有限公司 图像标签的核验方法及装置、电子设备、存储介质
CN113971183A (zh) * 2020-07-22 2022-01-25 阿里巴巴集团控股有限公司 实体打标模型训练的方法、装置及电子设备
AU2020103613A4 (en) * 2020-11-23 2021-02-04 Agricultural Information and Rural Economic Research Institute of Sichuan Academy of Agricultural Sciences Cnn and transfer learning based disease intelligent identification method and system
CN113469236A (zh) * 2021-06-25 2021-10-01 江苏大学 一种自我标签学习的深度聚类图像识别***及方法
CN113658643A (zh) * 2021-07-22 2021-11-16 西安理工大学 一种基于注意力机制对lncRNA和mRNA的预测方法
CN113963258A (zh) * 2021-09-28 2022-01-21 上海东普信息科技有限公司 工牌佩戴识别方法、装置、设备和存储介质
CN113903395A (zh) * 2021-10-28 2022-01-07 聊城大学 一种改进粒子群优化的bp神经网络拷贝数变异检测方法与***
CN114119403A (zh) * 2021-11-23 2022-03-01 北京拙河科技有限公司 基于红色通道引导的图像去雾方法和***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Gene2vec: gene subsequence embedding for prediction of mammalian N6-methyladenosine sites from mRNA;Quan Zou etal.;《RNA》;20181113;第25卷(第2期);全文 *
VMD-PE 协同 SNN 的输电线路故障辨识方法;付华等;《电子测量与仪器学报》;20200630;第34卷(第6期);全文 *

Also Published As

Publication number Publication date
CN114863242A (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN108133188B (zh) 一种基于运动历史图像与卷积神经网络的行为识别方法
CN110223292B (zh) 图像评估方法、装置及计算机可读存储介质
CN111950723B (zh) 神经网络模型训练方法、图像处理方法、装置及终端设备
CN108230291B (zh) 物体识别***训练方法、物体识别方法、装置和电子设备
CN110188829B (zh) 神经网络的训练方法、目标识别的方法及相关产品
CN112329476B (zh) 一种文本纠错方法及装置、设备、存储介质
CN111126470B (zh) 基于深度度量学习的图片数据迭代聚类分析方法
CN111709398A (zh) 一种图像识别的方法、图像识别模型的训练方法及装置
CN114282059A (zh) 视频检索的方法、装置、设备及存储介质
CN112766062A (zh) 一种基于双流深度神经网络的人体行为识别方法
CN114170484B (zh) 图片属性预测方法、装置、电子设备和存储介质
CN115690797A (zh) 字符识别方法、装置、设备及存储介质
CN113128526B (zh) 图像识别方法、装置、电子设备和计算机可读存储介质
CN114863242B (zh) 一种面向图像识别的深度学习网络的优化方法及***
CN113723410A (zh) 一种数码管数字识别方法及装置
CN116051924A (zh) 一种图像对抗样本的分治防御方法
CN115546554A (zh) 敏感图像的识别方法、装置、设备和计算机可读存储介质
CN111340329B (zh) 演员评估方法、装置及电子设备
CN112084371B (zh) 一种电影多标签分类方法、装置、电子设备以及存储介质
CN114630238A (zh) 舞台音箱音量控制方法、装置、电子设备及介质
CN114743170A (zh) 一种基于ai算法的自动驾驶场景标注方法
CN114724009B (zh) 一种基于改进的深度学习网络的图像识别方法及装置
CN107609645B (zh) 用于训练卷积神经网络的方法和装置
CN117496582B (zh) 人脸识别模型训练方法、装置、电子设备及存储介质
CN109508742A (zh) 基于arm平台和独立循环神经网络的手写数字识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant