CN110147852A

CN110147852A - 图像识别的方法、装置、设备及存储介质

Info

Publication number: CN110147852A
Application number: CN201910458493.6A
Authority: CN
Inventors: 张志伟; 李岩; 吴丽军
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2019-05-29
Filing date: 2019-05-29
Publication date: 2019-08-20
Also published as: US11263483B2; US20200293824A1

Abstract

本公开是关于一种图像识别的方法、装置、设备及存储介质，方法包括：获取目标训练数据集中的待标注训练数据的标注结果；当任一待标注训练数据的标注结果包含多种时，获取每一种标注结果的权重系数；基于每一种标注结果与对应的权重系数，获取待标注训练数据的标签，将标注了标签的训练数据作为训练机器学习模型的目标训练数据，利用基于目标训练数据训练得到的识别模型进行图像识别。提高了识别模型的识别结果的准确性以及识别结果的参考性和可信性。

Description

图像识别的方法、装置、设备及存储介质

技术领域

本公开涉及人工智能领域，尤其涉及一种图像识别的方法、装置、设备及存储介质。

背景技术

深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。以卷积神经网络(convolution neural network,CNN)为例，CNN因其超强的拟合能力以及端到端的全局优化能力，使得机器识别准确率大幅提高。虽然使用CNN模型，机器学习模型的识别准确率得到了显著的提升。但一个满足识别要求的机器学习模型依赖于包含标签的训练数据。相关技术中，训练数据标签需要通过人工进行标注后得到。但人工对待标注训练数据进行标注时，由于受到人的主观思维影响，导致待标注训练数据可能产生多种标注结果。

相关技术中，对于包含多种标注结果的待标注训练数据，将出现次数最多的一种标注结果作为待标注训练数据的标签。这种硬性获取待标注训练数据的标签的方式影响了利用训练数据训练得到的识别模型的识别结果的准确性，继而影响识别结果的参考性和可信性。

发明内容

本公开提供一种图像识别的方法、装置、设备及存储介质，能够克服相关技术中对于包含多种标注结果的待标注训练数据，获取待标注训练数据的标签的方式，影响利用训练数据训练得到的识别模型的识别结果的准确性，继而影响识别结果的参考性和可信性问题。

根据本公开实施例的第一方面，提供一种图像识别的方法，所述方法包括：获取目标训练数据集中的待标注训练数据的标注结果；当任一待标注训练数据的标注结果包含多种时，获取每一种标注结果的权重系数；基于每一种标注结果与对应的权重系数，获取所述待标注训练数据的标签，将标注了标签的训练数据作为训练机器学习模型的目标训练数据；利用基于所述目标训练数据训练得到的识别模型进行图像识别。

可选地，所述获取目标训练数据集中的待标注训练数据的标注结果，包括：获取目标训练数据集中的待标注训练数据的初始标注结果，确定所述待标注训练数据的初始标注结果是否满足标注条件；将满足标注条件的标注结果作为所述待标注训练数据的标注结果

可选地，所述获取每一种标注结果的权重系数，包括：获取每一种标注结果在标注时出现的次数以及所有标注结果在标注时出现的次数；根据所述每一种标注结果在标注时出现的次数占所述所有标注结果在标注时出现的次数的比例，得到所述每一种标注结果的权重系数。

可选地，所述基于每一种标注结果与对应的权重系数，获取所述待标注训练数据的标签，将标注了标签的训练数据作为训练机器学习模型的目标训练数据之后，所述方法还包括：在通过所述目标训练数据进行机器学习模型训练时，将所述机器学习模型的损失函数设置为目标损失函数。

可选地，所述目标损失函数包括相对熵函数，所述相对熵函数如下式所示：

式中：loss为相对熵函数的损失值；X为目标训练数据构成的目标训练集；M为将目标训练数据划分成的批次数量；x为任一目标训练数据；N为任一目标训练数据包含的标注结果的类别集合；k为标注结果的类别集合中的任一标注结果；P(x)^k为使用目标训练数据训练得到的机器学习模型，将所述任一目标训练数据的识别结果识别为k的预测概率；Q(x)^k为标注结果k的权重系数。

根据本公开实施例的第二方面，提供一种图像识别的装置，所述装置包括：第一获取模块，被配置为执行获取目标训练数据集中的待标注训练数据的标注结果；第二获取模块，被配置为执行当任一待标注训练数据的标注结果包含多种时，获取每一种标注结果的权重系数；第三获取模块，被配置为执行基于每一种标注结果与对应的权重系数，获取所述待标注训练数据的标签，将标注了标签的训练数据作为训练机器学习模型的目标训练数据；图像识别模块，被配置为执行利用基于所述目标训练数据训练得到的识别模型进行图像识别。

可选地，所述第一获取模块，被配置为执行获取目标训练数据集中的待标注训练数据的初始标注结果，确定所述待标注训练数据的初始标注结果是否满足标注条件；将满足标注条件的标注结果作为所述待标注训练数据的标注结果。

可选地，所述第二获取模块，被配置为执行获取每一种标注结果在标注时出现的次数以及所有标注结果在标注时出现的次数；根据所述每一种标注结果在标注时出现的次数占所述所有标注结果在标注时出现的次数的比例，得到所述每一种标注结果的权重系数。

可选地，所述第三获取模块，还被配置为执行在通过所述目标训练数据进行机器学习模型训练时，将所述机器学习模型的损失函数设置为目标损失函数。

根据本公开实施例的第三方面，提供一种电子设备，包括：一个或多个处理器；用于存储所述一个或多个处理器可执行指令的一个或多个存储器；其中，所述一个或多个处理器被配置为执行第一方面或第一方面的任一种可能的实施方式中的方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，包括：当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行第一方面或第一方面的任一种可能的实施方式中的方法。

根据本公开实施例的第五方面，提供了一种计算机程序(产品)，所述计算机程序(产品)包括：计算机程序代码，当所述计算机程序代码被计算机运行时，使得所述计算机执行上述各方面中的方法。

本公开的实施例提供的技术方案至少可以包括以下有益效果：

当对任一待标注训练数据的标注结果包含多种时，获取每一种标注结果的权重系数，基于每一种标注结果与对应的权重系数，获取待标注训练数据的标签，得到训练机器学习模型的目标训练数据。由于得到的待标注训练数据的标签不是一个固定的标注结果，而是基于得到的多种标注结果与其对应的权重作为标签内容。使得用目标训练数据对机器学习模型进行训练得到的识别模型进行图像识别时，提高了识别模型的识别结果的准确性以及识别结果的参考性和可信性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1是根据一示例性实施例示出的一种图像识别的方法的流程图；

图2是根据一示例性实施例示出的一种图像识别的方法的流程图；

图3是根据一示例性实施例示出的一种图像识别的方法的流程图；

图4是根据一示例性实施例示出的一种图像识别的装置的框图；

图5是根据一示例性实施例示出的一种电子设备的框图；

图6是根据一示例性实施例示出的一种终端的示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完成地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

相关技术中，对训练数据进行标注时，会采用多人同时对一个带标注训练数据进行标注，得到标注结果。或者是使用多个不同的、已经训练好的、可以用于识别待标注训练数据的机器学习模型分别待标注训练数据进行识别，将得到的识别结果作为标注结果。由此会会产生同一待标准训练数据包含多种标注结果。

当得到多个标注结果时，会将出现次数最多的标注结果作为训练数据的标签。这种硬性确定待标注训练数据的标签的方式会影响识别模型的识别结果的准确性，继而影响识别结果的参考性和可信性。对此，本申请实施例提供了对于包含多种标注结果的待标注训练数据，确定待标注训练数据的标签的方法。

图1是根据一示例性实施例示出的一种图像识别的方法的流程图，该图像识别的方法用于计算机设备，如终端或服务器中，本申请实施例以终端进行说明。如图1所示，包括以下步骤。

S11，获取目标训练数据集中的待标注训练数据的标注结果。

示例性地，待标注训练数据的标注结果的获取方式可以是当待标注训练数据所在终端接收到标注操作信号时，触发所在终端的数据传输程序，将接收到标注数据传输到终端，使得终端将实时获取到标注数据作为待标注训练数据的标注结果。

也可以是在终端上设置多个标注区域，对任意一个待标注训练数据，当终端接收到所有标注区域的标注数据标注完成的信号时，触发终端数据传输程序，将标注数据传输给终端，使得终端将实时获取到标注数据作为待标注训练数据的标注结果。本申请实施例不对获取标注结果的方式进行限定。

作为本申请一个可选实施方式，步骤S11包括，

首先，获取目标训练数据集中的待标注训练数据的初始标注结果，确定待标注训练数据的初始标注结果是否满足标注条件；

其次，将满足标注条件的标注结果作为待标注训练数据的标注结果。

示例性地，对获取到的待标注训练数据的标注结果的种类的判定过程中，可以是首先去除明显标注错误的初始标注结果，再确定最终的标注结果的种类。例如若一个待标注训练数据为一张风景图，需要对该风景图的漂亮程度进行标注时。可能有的标注结果为“好看”、“一般”、“不好看”，若得到的一标注结果为“好吃”，则该标注结果明显为错误的标注结果，该错误的标注结果为不满足标注条件的标注结果，因而此时得到的初始标注结果的种类即为三种。或者是若在终端中规定某一目标训练数据集中对待标注训练数据的初始标注结果以数字的形式表示，比如一个待标注训练数据为一张风景图。需要对该风景图的漂亮程度进行标注时，可能有的初始标注结果为“好看”、“一般”、“不好看”，那么终端中规定用数字“0”代表“好看”，用数字“1”代表“一般”，用数字“2”代表“不好看”，那么如果终端接收到的标注数据为其他数字，则该标注结果明显为错误的标注结果。因而将错误的初始标注结果进行剔除，将满足标注条件的标注结果作为待标注训练数据的标注结果。

S12，当任一待标注训练数据的标注结果包含多种时，获取每一种标注结果的权重系数。

作为本申请一个可选实施方式，如图2所示，步骤S12，该方法包括：

S121，获取每一种标注结果在标注时出现的次数以及所有标注结果在标注时出现的次数；

S122，根据每一种标注结果在标注时出现的次数占所有标注结果在标注时出现的次数的比例，得到每一种标注结果的权重系数。

示例性地，对每一种标注结果在标注时出现的次数的统计，可以是当待标注训练数据所在终端的标注区域检测到标注数据时，将该标注数据传输给终端，此时终端将接收到标注数据作为标注结果，同时对不同的标注结果的数量分别进行记录，继而得到每一种标注结果在标注时出现的次数以及所有标注结果在标注时出现的次数。根据每一种标注结果在标注时出现的次数占所有标注结果在标注时出现的次数的比例，得到每一种标注结果的权重系数。

S13，基于每一种标注结果与对应的权重系数，获取待标注训练数据的标签，将标注了标签的训练数据作为训练机器学习模型的目标训练数据。

示例性地，同样若一个待标注训练数据为一张风景图sample，得到对该风景图的漂亮程度进行标注的标注结果为“好看”、“一般”、“不好看”，对应的每一个标注结果权重系数为0.5、0.4、0.1，则得到的标签可以是sample(好看)＝0.5；sample(一般)＝0.4；sample(不好看)＝0.1。同时也可以用数字代表标注结果，比如用“0”代表“好看”、“1”代表“一般”、“2”代表“不好看”，则得到的标签可以为sample(0)＝0.5；sample(1)＝0.4；sample(2)＝0.1。因为若是对风景图的好看程度进行识别，一般会有大量的风景图作为训练数据，所以可以规定不同的数字代表的含义，使得得到的标签更为简洁。本申请实施例不对标签的标注方式进行限定，只要最终的标签可以体现出不同的标注结果以及对应的权重系数即可。

S14，利用基于目标训练数据训练得到的识别模型进行图像识别。

本申请实施例提供的图像识别的方法，当对任一待标注训练数据的标注结果包含多种时，获取每一种标注结果的权重系数，基于每一种标注结果与对应的权重系数合获取待标注训练数据的标签，得到训练机器学习模型的目标训练数据。由于得到的待标注训练数据的标签不是一个固定的标注结果，而是将得到的多种标注结果与其对应的权重一起作为标签内容。使得用目标训练数据对机器学习模型进行训练得到的识别模型进行图像识别时，提高了识别模型的识别结果的准确性以及识别结果的参考性和可信性。

作为本申请一个可选实施方式，如图3所示，步骤S13之后，该方法还包括：

S15，在通过目标训练数据进行机器学习模型训练时，将机器学习模型的损失函数设置为目标损失函数。

示例性地，该目标损失函数可以是交叉熵损失函数、欧氏距离。通过设置损失函数可以确定通过目标训练数据进行机器学习模型的收敛程度，当收敛程度满足目标条件，即将当前收敛程度对应的机器学习模型视为训练好的机器学习模型。收敛程度的确定方式可以是根据获取到的损失函数的损失值，判定目标时间内的损失函数的损失值是否在目标范围内浮动，当在目标时间内的损失函数的损失值在目标范围内浮动时，即表示机器学习模型训练结束，得到满足识别要求的识别模型。该目标时间和目标范围，本领域技术人员可以根据实际使用需要确定，本申请实施例对此不作限定。

作为本申请一个可选实施方式，该目标损失函数包括相对熵函数，该相对熵函数如下式(1)所示：

式中：loss为相对熵函数的损失值；X为目标训练数据构成的目标训练集；M为将目标训练数据划分成的批次数量；x为任一目标训练数据；N为任一目标训练数据包含的标注结果的类别集合；k为标注结果的类别集合中的任一标注结果；P(x)^k为使用目标训练数据训练得到的机器学习模型，将任一目标训练数据的识别结果识别为k的预测概率；Q(x)^k为标注结果k的权重系数。

将机器学习模型的损失函数设置为相对熵函数，通过得到相对熵损失函数的损失值确定使用目标训练数据训练得到的机器学习模型的收敛程度，可以提高得到的识别模型的准确率。本申请实施例对损失函数的类别不作限定，本领域技术人员也可以使用其他损失函数来获取机器学习模型。

图4是根据一示例性实施例示出的一种图像识别的装置框图。参照图4，该装置包括第一获取模块41、第二获取模块42、第三获取模块43、图像识别模块44。

第一获取模块41，被配置为执行获取目标训练数据集中的待标注训练数据的标注结果；

第二获取模块42，被配置为执行当任一待标注训练数据的标注结果包含多种时，获取每一种标注结果的权重系数；

第三获取模块43，被配置为执行基于每一种标注结果与对应的权重系数，获取待标注训练数据的标签，将标注了标签的训练数据作为训练机器学习模型的目标训练数据；

图像识别模块44，被配置为执行利用基于目标训练数据训练得到的识别模型进行图像识别。

本申请实施例提供的图像识别的装置，当对任一待标注训练数据的标注结果包含多种时，获取每一种标注结果的权重系数，将每一种标注结果与对应的权重系数合并处理为待标注训练数据的标签，得到训练机器学习模型的目标训练数据。由于得到的待标注训练数据的标签不是一个固定的标注结果，而是将得到的多种标注结果与其对应的权重一起作为标签内容。使得用目标训练数据对机器学习模型进行训练得到的识别模型进行图像识别时，提高了识别模型的识别结果的准确性以及识别结果的参考性和可信性。

作为本申请一个可选实施方式，第一获取模块41，被配置为执行获取目标训练数据集中的待标注训练数据的初始标注结果，确定待标注训练数据的初始标注结果是否满足标注条件；将满足标注条件的标注结果作为待标注训练数据的标注结果。

作为本申请一个可选实施方式，第二获取模块42，被配置为执行获取每一种标注结果在标注时出现的次数以及所有标注结果在标注时出现的次数；根据每一种标注结果在标注时出现的次数占所有标注结果在标注时出现的次数的比例，得到每一种标注结果的权重系数。

作为本申请一个可选实施方式，第三获取模块43，还被配置为执行在通过目标训练数据进行机器学习模型训练时，将机器学习模型的损失函数设置为目标损失函数。

作为本申请一个可选实施方式，该目标损失函数包括相对熵函数，相对熵函数如下式(1)所示：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

基于相同构思，本申请实施例还提供一种电子设备，如图5所示，所述设备包括：

一个或多个处理器51；

用于存储所述一个或多个处理器51可执行指令的一个或多个存储器52；

其中，所述一个或多个处理器51被配置为执行上述实施例所述的图像识别的方法。处理器51和存储器52通过通信总线53连接。

应理解的是，上述处理器可以是中央处理器(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(digital signal processing，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field－programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是，处理器可以是支持进阶精简指令集机器(advanced RISC machines，ARM)架构的处理器。

进一步地，在一种可选的实施例中，上述存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据。存储器还可以包括非易失性随机存取存储器。例如，存储器还可以存储设备类型的信息。

该存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用。例如，静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(dynamic random access memory，DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data dateSDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(directrambus RAM，DR RAM)。

图6是根据一示例性实施例示出的一种终端600的框图。该终端600可以是：智能手机、平板电脑、笔记本电脑或台式电脑。终端600还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端600包括有：处理器601和存储器602。

处理器601可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器601可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器601可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器601还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器602可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器602中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器601所执行以实现本申请中方法实施例提供的图像识别的方法。

在一些实施例中，终端600还可选包括有：***设备接口603和至少一个***设备。处理器601、存储器602和***设备接口603之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口603相连。具体地，***设备包括：射频电路604、显示屏605、摄像头606、音频电路607、定位组件608和电源609中的至少一种。

***设备接口603可被用于将I/O(Input/Output，输入/输出)相关的至少一个***设备连接到处理器601和存储器602。在一些实施例中，处理器601、存储器602和***设备接口603被集成在同一芯片或电路板上；在一些其他实施例中，处理器601、存储器602和***设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路604用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路604包括：天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路604还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏605用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏605是触摸显示屏时，显示屏605还具有采集在显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。此时，显示屏605还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏605可以为一个，设置终端600的前面板；在另一些实施例中，显示屏605可以为至少两个，分别设置在终端600的不同表面或呈折叠设计；在再一些实施例中，显示屏605可以是柔性显示屏，设置在终端600的弯曲表面上或折叠面上。甚至，显示屏605还可以设置成非矩形的不规则图形，也即异形屏。显示屏605可以采用LCD(LiquidCrystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件606用于采集图像或视频。可选地，摄像头组件606包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器601进行处理，或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路607还可以包括耳机插孔。

定位组件608用于定位终端600的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件608可以是基于美国的GPS(GlobalPositioning System，全球定位***)、中国的北斗***、俄罗斯的格雷纳斯***或欧盟的伽利略***的定位组件。

电源609用于为终端600中的各个组件进行供电。电源609可以是交流电、直流电、一次性电池或可充电电池。当电源609包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端600还包括有一个或多个传感器610。该一个或多个传感器610包括但不限于：加速度传感器611、陀螺仪传感器612、压力传感器613、指纹传感器614、光学传感器615以及接近传感器616。

加速度传感器611可以检测以终端600建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器611可以用于检测重力加速度在三个坐标轴上的分量。处理器601可以根据加速度传感器611采集的重力加速度信号，控制触摸显示屏605以横向视图或纵向视图进行用户界面的显示。加速度传感器611还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器612可以检测终端600的机体方向及转动角度，陀螺仪传感器612可以与加速度传感器611协同采集用户对终端600的3D动作。处理器601根据陀螺仪传感器612采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器613可以设置在终端600的侧边框和/或触摸显示屏605的下层。当压力传感器613设置在终端600的侧边框时，可以检测用户对终端600的握持信号，由处理器601根据压力传感器613采集的握持信号进行左右手识别或快捷操作。当压力传感器613设置在触摸显示屏605的下层时，由处理器601根据用户对触摸显示屏605的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器614用于采集用户的指纹，由处理器601根据指纹传感器614采集到的指纹识别用户的身份，或者，由指纹传感器614根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器601授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器614可以被设置终端600的正面、背面或侧面。当终端600上设置有物理按键或厂商Logo时，指纹传感器614可以与物理按键或厂商Logo集成在一起。

光学传感器615用于采集环境光强度。在一个实施例中，处理器601可以根据光学传感器615采集的环境光强度，控制触摸显示屏605的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏605的显示亮度；当环境光强度较低时，调低触摸显示屏605的显示亮度。在另一个实施例中，处理器601还可以根据光学传感器615采集的环境光强度，动态调整摄像头组件606的拍摄参数。

接近传感器616，也称距离传感器，通常设置在终端600的前面板。接近传感器616用于采集用户与终端600的正面之间的距离。在一个实施例中，当接近传感器616检测到用户与终端600的正面之间的距离逐渐变小时，由处理器601控制触摸显示屏605从亮屏状态切换为息屏状态；当接近传感器616检测到用户与终端600的正面之间的距离逐渐变大时，由处理器601控制触摸显示屏605从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图6中示出的结构并不构成对终端600的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

本申请提供了一种计算机程序，当计算机程序被计算机执行时，可以使得处理器或计算机执行上述方法实施例中对应的各个步骤和/或流程。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid StateDisk)等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims

1.一种图像识别的方法，其特征在于，所述方法包括：

获取目标训练数据集中的待标注训练数据的标注结果；

当任一待标注训练数据的标注结果包含多种时，获取每一种标注结果的权重系数；

基于每一种标注结果与对应的权重系数，获取所述待标注训练数据的标签，将标注了标签的训练数据作为训练机器学习模型的目标训练数据；

利用基于所述目标训练数据训练得到的识别模型进行图像识别。

2.根据权利要求1所述的图像识别的方法，其特征在于，所述获取目标训练数据集中的待标注训练数据的标注结果，包括：

获取目标训练数据集中的待标注训练数据的初始标注结果，确定所述待标注训练数据的初始标注结果是否满足标注条件；

将满足标注条件的标注结果作为所述待标注训练数据的标注结果。

3.根据权利要求1所述的图像识别的方法，其特征在于，所述获取每一种标注结果的权重系数，包括：

获取每一种标注结果在标注时出现的次数以及所有标注结果在标注时出现的次数；

根据所述每一种标注结果在标注时出现的次数占所述所有标注结果在标注时出现的次数的比例，得到所述每一种标注结果的权重系数。

4.根据权利要求1-3中任一项所述的图像识别的方法，其特征在于，所述基于每一种标注结果与对应的权重系数，获取所述待标注训练数据的标签，将标注了标签的训练数据作为训练机器学习模型的目标训练数据之后，所述方法还包括：

在通过所述目标训练数据进行机器学习模型训练时，将所述机器学习模型的损失函数设置为目标损失函数。

5.根据权利要求4所述的图像识别的方法，其特征在于，所述目标损失函数包括相对熵函数，所述相对熵函数如下式所示：

6.一种图像识别的装置，其特征在于，所述装置包括：

第一获取模块，被配置为执行获取目标训练数据集中的待标注训练数据的标注结果；

第二获取模块，被配置为执行当任一待标注训练数据的标注结果包含多种时，获取每一种标注结果的权重系数；

第三获取模块，被配置为执行基于每一种标注结果与对应的权重系数，获取所述待标注训练数据的标签，将标注了标签的训练数据作为训练机器学习模型的目标训练数据；

图像识别模块，被配置为执行利用基于所述目标训练数据训练得到的识别模型进行图像识别。

7.根据权利要求6所述的图像识别的装置，其特征在于，所述第一获取模块，被配置为执行获取目标训练数据集中的待标注训练数据的初始标注结果，确定所述待标注训练数据的初始标注结果是否满足标注条件；将满足标注条件的标注结果作为所述待标注训练数据的标注结果。

8.根据权利要求6所述的图像识别的装置，其特征在于，所述第二获取模块，被配置为执行获取每一种标注结果在标注时出现的次数以及所有标注结果在标注时出现的次数；根据所述每一种标注结果在标注时出现的次数占所述所有标注结果在标注时出现的次数的比例，得到所述每一种标注结果的权重系数。

9.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的一个或多个存储器；

其中，所述处理器被配置为执行权利要求1-5中任一项所述的图像识别的方法。

10.一种存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行权利要求1-5中任一项所述的图像识别的方法。