CN114648656A - 图像识别方法、装置、终端设备及可读存储介质 - Google Patents

图像识别方法、装置、终端设备及可读存储介质 Download PDF

Info

Publication number
CN114648656A
CN114648656A CN202011510805.2A CN202011510805A CN114648656A CN 114648656 A CN114648656 A CN 114648656A CN 202011510805 A CN202011510805 A CN 202011510805A CN 114648656 A CN114648656 A CN 114648656A
Authority
CN
China
Prior art keywords
target
sample
training
neural network
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011510805.2A
Other languages
English (en)
Inventor
李佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCL Technology Group Co Ltd
Original Assignee
TCL Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TCL Technology Group Co Ltd filed Critical TCL Technology Group Co Ltd
Priority to CN202011510805.2A priority Critical patent/CN114648656A/zh
Publication of CN114648656A publication Critical patent/CN114648656A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请适用于神经网络模型技术领域,提供了图像识别方法、装置、终端设备及可读存储介质,该方法包括:获取待识别图像;使用目标神经网络模型对待识别图像进行识别,得到识别结果,目标神经网络模型为经过目标样本训练集训练的模型,目标样本训练集中的样本类型包括至少两种,每种样本类型对应的目标样本的数量均相同。本申请可以一定程度上可以解决图像识别的准确率不稳定的问题。

Description

图像识别方法、装置、终端设备及可读存储介质
技术领域
本申请属于神经网络模型领域,尤其涉及一种图像识别方法、装置、终端设备及可读存储介质。
背景技术
随着科学技术的发展,神经网络模型已经被应用到各个领域。比如,使用神经网络模型进行图像识别。
进行图像识别的神经网络模型包括R-CNN模型、SSD模型、YOLO模型以及基于tensorflow平台的mobilenet模型等。其中,基于tensorflow平台的mobilenet模型包括ssdlite_mobilenet_v2_coco等模型。
然而,在利用神经网络模型进行图像识别的过程中,图像识别的准确率严重依赖于神经网络模型在训练时的训练样本的数量。比如,当汽车的训练样本的数量为2万个时,利用该模型识别汽车的准确率可能达到90%以上,而当苹果的训练样本的数量为3000个时,利用该模型识别苹果的准确率可能在60%以下。
因此,目前在不同样本类型对应的训练样本数量不相同的情况下,会导致在进行图像识别时准确率不稳定。
发明内容
本申请实施例提供了一种图像识别方法、装置、终端设备及可读存储介质,可以一定程度上解决不同样本类型对应的训练样本数量不相同的情况下导致的图像识别的准确率不稳定的问题。
第一方面,本申请实施例提供了图像识别方法,包括:
获取待识别图像;
使用目标神经网络模型对上述待识别图像进行识别,得到识别结果,上述目标神经网络模型为经过目标样本训练集训练的模型,上述目标样本训练集中的样本类型包括至少两种,每种上述样本类型对应的目标样本的数量相同。
第二方面,本申请实施例提供了图像识别装置,包括:
获取模块,用于获取待识别图像;
识别模块,用于使用目标神经网络模型对上述待识别图像进行识别,得到识别结果,上述目标神经网络模型为经过目标样本训练集训练的模型,上述目标样本训练集中的样本类型包括至少两种,每种上述样本类型对应的目标样本的数量相同。
第三方面,本申请实施例提供了一种终端设备,终端设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面提供的方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上述第一方面提供的方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中提供的图像识别方法。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
本申请实施例与现有技术相比存在的有益效果是:
本申请提供一种图像识别方法,首先,获取待识别图像。然后使用目标神经网络模型对待识别图像进行识别,得到识别结果。由于该目标神经网络模型为经过目标样本训练集训练的模型,且该目标样本训练集中的样本类型包括至少两种,每种样本类型对应的目标样本的数量相同。因此,在使用经过该目标样本训练集训练的目标神经网络模型进行图像识别时,不会出现准确率有时高有时低的问题,进而使得准确率保存稳定。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的图像识别方法的流程示意图;
图2是本申请一实施例提供的目标神经网络模型的测试结果示意图;
图3是本申请一实施例提供的现有技术中的神经网络模型的测试结果示意图;
图4是本申请一实施例提供的图像识别装置的结构示意图;
图5是本申请实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例提供的图像识别方法可以应用于手机、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。
为了说明本申请提供的技术方案,下面通过具体实施例来进行说明。
实施例一
下面对本申请实施例一提供的一种图像识别方法进行描述,请参阅附图1,该方法包括:
步骤S101、获取待识别图像。
在步骤S101中,待识别图像可以通过本实施例的终端设备采集,也可以通过其他终端设备采集后,再发送至本实施例的终端设备进行处理。在本实施例中,对采集待识别图像的终端设备不做限定。
步骤S102、使用目标神经网络模型对待识别图像进行识别,得到识别结果,目标神经网络模型为经过目标样本训练集训练的模型,目标样本训练集中的样本类型包括至少两种,每种样本类型对应的目标样本的数量相同。
在步骤S102中,终端设备在获取到待识别图像后,再使用目标神经网络模型对待识别图像进行识别,从而得到该待识别图像对应的识别结果。
在一些实施例中,在获取待识别图像之前,该方法还包括:
获取原始样本训练集,原始样本训练集包括至少两种样本类型的训练样本;
根据每种样本类型对应的样本数量确定原始中位数,并将原始中位数与预设阈值之间的较大值确定为目标样本数量;
分别从每种样本类型对应的训练样本中获取目标样本数量的目标样本,并组合每种样本类型对应的目标样本,得到目标样本训练集;
使用目标样本训练集对预设的神经网络模型进行训练,得到目标神经网络模型。
在本实施例中,原始样本训练集可以为开源的数据集以及用户自己人工标注的数据集。原始样本训练集中包括的样本类型以及样本类型的数量可以根据实际情况进行选择。比如,当该神经网络模型应用于购物场景时,原始样本训练集中可以包括适合购物场景的40个样本类型。本申请在此不做具体限定。
在获取到原始样本训练集之后,可以将每种样本类型的样本数量进行降序排序或升序排序,从而确定每种样本类型的样本数量中的原始中位数。在确定原始中位数之后,将原始中位数与预设阈值进行比较,取原始中位数与预设阈值之间的较大值,并将原始中位数与预设阈值之间的较大值确定为目标样本数量。比如,预设阈值为6000,原始中位数为7000,则将7000作为目标样本数量。又比如,预设阈值为8000,原始中位数为5000,则将8000作为目标样本数量。预设阈值可以为训练一个样本类型所需要的最低样本数。对于预设阈值的设置用户可根据实际情况进行选择。本申请在此不做具体限定。
在确定目标样本数量之后,分别从每种样本类型对应的训练样本中获取目标样本数量的目标样本,从而使得每种样本类型的训练样本的数量一致,均为目标样本数量。然后组合每种样本类型对应的目标样本,从而得到目标样本训练集。
在另一些实施例中,组合每种样本类型对应的目标样本,得到目标样本训练集,包括:
从每种样本类型中均选取一个目标样本;
将选取的各个目标样本按照随机规则进行排列,并返回执行从每种样本类型中均选取一个目标样本,直至所有目标样本被选取,得到目标样本训练集。
由于神经网络模型可以识别的目标的类型的数量严重依赖于训练时的终端设备的图像处理器(Graphics Processing Unit,GPU)的显卡的内存的大小。当图像处理器的显卡的内存较小时,可以训练的样本类型的数量较少。一旦训练的样本类型的数量较多,会导致利用神经网络模型进行检测目标时出现准确率较低的现象。比如,一个16G的显卡,训练20个类别的样本可能没问题;但是训练40个类别的样本时评估值可能一直不能收敛。
因此,在本实施例中,先从每种样本类型中均选取一个目标样本且不放回,然后按照随机规则进行排列。接着返回执行从每种样本类型中均选取一个目标样本,直至所有目标样本被选取,从而得到目标样本训练集。由于从每种样本类型中选取一个目标样本之后,按照随机规则进行排列。因此,即使图像处理器的显卡的内存较小,也可以保证每种样本类型被均匀地训练。
比如,一个16G的显卡,本来可能只能训练20个样本类型,一次只能训练24个训练样本。假设神经网络模型需要检测的目标的样本类型的数量为40个,即需要训练40个样本类型。此时,训练5次之后,一共训练了120个样本。由于选取目标样本之后,将目标样本按照随机规则进行排列。因此,训练5次之后,可以保证40个样本类型对应的训练样本都被训练到了3次。从而使得在图像处理器的显卡的内存较小时,也可以训练较多种样本类型。
在另一些实施例中,分别从每种样本类型对应的训练样本中获取目标样本数量的目标样本,包括:
若样本类型对应的训练样本的样本数量大于目标样本数量,则根据预设选取规则从样本类型对应的训练样本中选取目标样本数量的目标样本。
在本实施例中,当样本类型对应的训练样本的样本数量大于目标样本时,需要从样本类型对应的训练样本中选取目标样本数量的目标样本。此时,可以按照预设选取规则从样本类型对应的训练样本中选取目标样本数量的目标样本。预设选取规则可以根据待识别的目标在样本上所占的面积的大小,以及待识别的目标是否被遮挡等设置。本申请在此不做具体限定。
在另一些实施例中,分别从每种样本类型对应的训练样本中获取目标样本数量的目标样本,包括:
若样本类型对应的训练样本的样本数量小于目标样本数量,则对样本类型对应的训练样本进行扩容处理,得到目标样本数量的目标样本。
在本实施例中,当样本类型对应的训练样本的样本数量小于目标样本数量时,需要对样本类型对应的训练样本进行扩容处理,从而使得该样本类型对应的训练样本的数量为目标样本数量。应理解,扩容处理可以包括图像模糊、增加噪声、图像旋转、图像裁剪中的至少一种。本申请在此不做具体限定。
在得到目标样本训练集之后,再使用目标样本训练对预设的神经网络模型进行训练。
下面对使用目标样本训练集对预设的神经网络模型进行训练的过程进行说明。
首先使用目标样本训练集对预设的神经网络模型进行训练,得到目标损失值,并记录预设的神经网络模型的训练次数。若训练次数小于预设次数且目标损失值大于预设损失阈值,则根据目标损失值更新预设的神经网络模型的参数,并返回执行使用目标样本训练集对预设的神经网络模型进行训练。或者,
若训练次数大于或等于预设次数,或者,目标损失值小于或等于预设损失阈值,则停止训练,得到目标神经网络模型。
在得到目标神经网络模型之后,再使用测试样本集对目标神经网络模型进行测试,得到各个目标评估值。然后确定各个目标评估值的变化趋势。若各个目标评估值的变化趋势为不变趋势,则说明该目标神经网络模型的参数不需要再进行优化,此时,可以直接使用该目标神经网络模型去识别待识别图像。若各个目标评估值的变化趋势为增加趋势,则说明该目标神经网络模型的参数可以再进行优化。此时,可以使用目标样本训练集对该目标神经网络模型再次进行训练。若各个目标评估值的变化趋势不是增加趋势或不变趋势,则说明该目标神经网络模型的训练出现错误,此时,需要人为地修改该目标神经网络模型的参数或者修改样本训练集,然后再进行训练。
比如,设置目标样本训练集中包括40种样本类型,目标神经网络模型选取ssdlite_mobilenet_v2_coco模型。然后使用样本测试集对经过该目标样本训练集训练过的目标神经网络模型进行测试。测试的结果如图2所示。当各个目标评估值的变化趋势为图2中的201(图2中的横坐标表示训练的次数,纵坐标表示目标评估值)时,即此时的变化趋势为增加趋势,此时,用目标样本训练集对该目标神经网络模型再次进行训练。当各个目标评估值的变化趋势为图2中的202时,即此时的变化趋势为不变趋势(即此时目标评估值已经收敛),此时,可以直接使用该目标神经网络模型去检测待检测的目标,不需要再次进行训练。
并且,从图2中可知,当训练的次数为6万次时,目标评估值已经收敛。并且训练的时长较短。而使用样本测试集对没有经过本申请的目标样本训练集训练的神经网络模型的测试结果如图3所示(此时,该神经网络模型训练的样本类型的数量也为40个,该神经网络模型也选取ssdlite_mobilenet_v2_coco模型)。从图3可知,当训练的次数达到220万次时,目标评估值还没收敛。并且训练的时长较长。因此,本申请的训练方法,提高了可以训练的样本类型的数量,减少了模型训练的时长,使得目标评估值快速地收敛。
综上所述,本申请提供一种图像识别方法,首先,获取待识别图像。然后使用目标神经网络模型对待识别图像进行识别,得到识别结果。由于该目标神经网络模型为经过目标样本训练集训练的模型,且该目标样本训练集中的样本类型包括至少两种,每种样本类型对应的目标样本的数量相同。因此,在使用经过该目标样本训练集训练的目标神经网络模型进行图像识别时,不会出现准确率有时高有时低的问题,进而使得准确率保存稳定。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
实施例二
图4示出了一种识别装置的示例,为了便于说明,仅示出了与本申请实施例相关的部分。该装置400包括:
获取模块401,用于获取待识别图像。
识别模块402,用于使用目标神经网络模型对待识别图像进行识别,得到识别结果,目标神经网络模型为经过目标样本训练集训练的模型,目标样本训练集中的样本类型包括至少两种,每种样本类型对应的目标样本的数量相同。
可选地,该装置400还包括训练模块,该训练模块具体包括:
训练集获取单元,用于获取原始样本训练集,原始样本训练集包括至少两种样本类型的训练样本。
确定单元,用于根据每种样本类型对应的样本数量确定原始中位数,并将原始中位数与预设阈值之间的较大值确定为目标样本数量。
获取组合单元,用于分别从每种样本类型对应的训练样本中获取目标样本数量的目标样本,并组合每种样本类型对应的目标样本,得到目标样本训练集。
训练单元,用于使用目标样本训练集对预设的神经网络模型进行训练,得到目标神经网络模型。
可选地,获取组合单元用于执行:
从每种样本类型中均选取一个目标样本;
将选取的各个目标样本按照随机规则进行排列,并返回执行从样本类型中均选取一个目标样本,直至所有目标样本被选取,得到目标样本训练集。
可选地,获取组合单元用于执行:
若样本类型对应的训练样本的样本数量大于目标样本数量,则根据预设选取规则从样本类型对应的训练样本中选取目标样本数量的目标样本。
可选地,获取组合单元用于执行:
若样本类型对应的训练样本的样本数量小于目标样本数量,则对样本类型对应的训练样本进行扩容处理,得到目标样本数量的目标样本。
可选地,扩容处理包括图像模糊、增加噪声、图像旋转、图像裁剪中的至少一种。
可选地,训练单元用于执行:
使用目标样本训练集对预设的神经网络模型进行训练,得到目标损失值,并记录预设的神经网络模型的训练次数;
若训练次数小于预设次数且目标损失值大于预设损失阈值,则根据目标损失值更新预设的神经网络模型的参数,并返回执行使用目标样本训练集对预设的神经网络模型进行训练;或者,
若训练次数大于或等于预设次数,或者,目标损失值小于或等于预设损失阈值,则停止训练,得到目标神经网络模型。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例一基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例一部分,此处不再赘述。
实施例三
图5是本申请实施例三提供的终端设备的示意图。如图5所示,该实施例的终端设备500包括:处理器501、存储器502以及存储在上述存储器502中并可在上述处理器501上运行的计算机程序503。上述处理器501执行上述计算机程序503时实现上述各个方法实施例中的步骤。或者,上述处理器501执行上述计算机程序503时实现上述各装置实施例中各模块/单元的功能。
示例性的,上述计算机程序503可以被分割成一个或多个模块/单元,上述一个或者多个模块/单元被存储在上述存储器502中,并由上述处理器501执行,以完成本申请。上述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述上述计算机程序503在上述终端设备500中的执行过程。例如,上述计算机程序503可以被分割成获取模块以及识别模块,各模块具体功能如下:
获取待识别图像;
使用目标神经网络模型对待识别图像进行识别,得到识别结果,目标神经网络模型为经过目标样本训练集训练的模型,目标样本训练集中的样本类型包括至少两种,每种样本类型对应的目标样本的数量相同。
上述终端设备可包括,但不仅限于,处理器501、存储器502。本领域技术人员可以理解,图5仅仅是终端设备500的示例,并不构成对终端设备500的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如上述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器501可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件插件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述存储器502可以是上述终端设备500的内部存储单元,例如终端设备500的硬盘或内存。上述存储器502也可以是上述终端设备500的外部存储设备,例如上述终端设备500上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,上述存储器502还可以既包括上述终端设备500的内部存储单元也包括外部存储设备。上述存储器502用于存储上述计算机程序以及上述终端设备所需的其它程序和数据。上述存储器502还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述***中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或插件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述各个方法实施例中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上上述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种图像识别方法,其特征在于,包括:
获取待识别图像;
使用目标神经网络模型对所述待识别图像进行识别,得到识别结果,所述目标神经网络模型为经过目标样本训练集训练的模型,所述目标样本训练集中的样本类型包括至少两种,每种所述样本类型对应的目标样本数量均相同。
2.如权利要求1所述的方法,其特征在于,在所述获取待识别图像之前,所述方法还包括:
获取原始样本训练集,所述原始样本训练集包括至少两种样本类型的训练样本;
根据每种所述样本类型对应的样本数量确定原始中位数,并将所述原始中位数与预设阈值之间的较大值确定为所述目标样本数量;
分别从每种所述样本类型对应的训练样本中获取所述目标样本数量的目标样本,并组合每种所述样本类型对应的目标样本,得到所述目标样本训练集;
使用所述目标样本训练集对预设的神经网络模型进行训练,得到所述目标神经网络模型。
3.如权利要求2所述的方法,其特征在于,所述组合每种所述样本类型对应的目标样本,得到所述目标样本训练集,包括:
从每种所述样本类型中均选取一个目标样本;
将选取的各个所述目标样本按照随机规则进行排列,并返回执行从每种所述样本类型中均选取一个目标样本,直至所有所述目标样本被选取,得到所述目标样本训练集。
4.如权利要求2或3所述的方法,其特征在于,所述分别从每种所述样本类型对应的训练样本中获取所述目标样本数量的目标样本,包括:
若所述样本类型对应的训练样本的样本数量大于所述目标样本数量,则根据预设选取规则从所述样本类型对应的训练样本中选取所述目标样本数量的目标样本。
5.如权利要求2或3所述的方法,其特征在于,所述分别从每种所述样本类型对应的训练样本中获取所述目标样本数量的目标样本,包括:
若所述样本类型对应的训练样本的样本数量小于所述目标样本数量,则对所述样本类型对应的训练样本进行扩容处理,得到所述目标样本数量的目标样本。
6.如权利要求5所述的方法,其特征在于,所述扩容处理包括图像模糊、增加噪声、图像旋转、图像裁剪中的至少一种。
7.如权利要求2所述的方法,其特征在于,所述使用所述目标样本训练集对预设的神经网络模型进行训练,得到所述目标神经网络模型,包括:
使用所述目标样本训练集对预设的神经网络模型进行训练,得到目标损失值,并记录所述预设的神经网络模型的训练次数;
若所述训练次数小于预设次数且所述目标损失值大于预设损失阈值,则根据所述目标损失值更新所述预设的神经网络模型的参数,并返回执行使用所述目标样本训练集对所述预设的神经网络模型进行训练;或者,
若所述训练次数大于或等于预设次数,或者,所述目标损失值小于或等于预设损失阈值,则停止训练,得到所述目标神经网络模型。
8.一种图像识别装置,其特征在于,包括:
获取模块,用于获取待识别图像;
识别模块,用于使用目标神经网络模型对所述待识别图像进行识别,得到识别结果,所述目标神经网络模型为经过目标样本训练集训练的模型,所述目标样本训练集中的样本类型包括至少两种,每种所述样本类型对应的目标样本的数量相同。
9.一种终端设备,其特征在于,所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的方法。
CN202011510805.2A 2020-12-18 2020-12-18 图像识别方法、装置、终端设备及可读存储介质 Pending CN114648656A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011510805.2A CN114648656A (zh) 2020-12-18 2020-12-18 图像识别方法、装置、终端设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011510805.2A CN114648656A (zh) 2020-12-18 2020-12-18 图像识别方法、装置、终端设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN114648656A true CN114648656A (zh) 2022-06-21

Family

ID=81991357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011510805.2A Pending CN114648656A (zh) 2020-12-18 2020-12-18 图像识别方法、装置、终端设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN114648656A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132174A (zh) * 2023-10-26 2023-11-28 扬宇光电(深圳)有限公司 一种应用于工业流水线质量检测的模型训练方法与***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132174A (zh) * 2023-10-26 2023-11-28 扬宇光电(深圳)有限公司 一种应用于工业流水线质量检测的模型训练方法与***
CN117132174B (zh) * 2023-10-26 2024-01-30 扬宇光电(深圳)有限公司 一种应用于工业流水线质量检测的模型训练方法与***

Similar Documents

Publication Publication Date Title
CN109815147B (zh) 测试案例生成方法、装置、服务器和介质
CN110705651A (zh) 用于对视频识别准确率测试的方法、装置、设备及介质
CN111273891A (zh) 基于规则引擎的业务决策方法、装置及终端设备
CN111427732A (zh) 一种老化测试方法、装置、终端和计算机可读存储介质
CN114676040A (zh) 一种测试覆盖率验证方法、装置及存储介质
CN110297764B (zh) 漏洞测试模型训练方法和装置
CN111693294A (zh) 车辆检测方法、装置、终端设备及存储介质
CN111627167A (zh) 基于储物柜的存放方法、装置、储物柜和存储介质
CN107071553B (zh) 一种修改视频语音的方法、装置和计算机可读存储介质
CN113140012B (zh) 图像处理方法、装置、介质及电子设备
CN113138916B (zh) 基于标注样本的图片结构化算法的自动测试方法及***
CN114648656A (zh) 图像识别方法、装置、终端设备及可读存储介质
CN113936232A (zh) 一种碎屏识别方法、装置、设备和存储介质
CN113780163A (zh) 一种页面加载时间的检测方法、装置、电子设备及介质
CN111275071B (zh) 预测模型训练、预测方法、装置及电子设备
CN113254932B (zh) 应用程序的风险检测方法、装置、电子设备和介质
CN110135464B (zh) 一种图像处理方法、装置、电子设备及存储介质
CN113806737A (zh) 一种恶意进程风险等级评估方法、终端设备及存储介质
CN114237182A (zh) 机器人调度方法及***
CN113949887A (zh) 对于网络直播数据的处理方法及装置
CN108958929B (zh) 应用算法库的方法、装置、存储介质及电子设备
CN113342430A (zh) 故障码的处理方法、装置、终端设备及可读存储介质
CN111738311A (zh) 面向多任务的特征提取方法、装置及电子设备
CN111510457A (zh) 函数攻击的检测方法、装置、电子设备及可读介质
CN114138972B (zh) 文本类别的识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination