WO2017041366A1

WO2017041366A1 - 图像识别方法和装置

Info

Publication number: WO2017041366A1
Application number: PCT/CN2015/096132
Authority: WO
Inventors: 龚龙; 张彦福; 顾嘉唯
Original assignee: 北京百度网讯科技有限公司
Priority date: 2015-09-08
Filing date: 2015-12-01
Publication date: 2017-03-16
Also published as: US10796685B2; US20180204562A1; CN105095919A

Abstract

本申请公开了图像识别方法和装置。该方法的一具体实施方式包括：获取包含有待识别对象的待识别图像；将待识别图像发送至服务器，以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数；当置信度参数大于置信度阈值时，将目标对象的标识信息作为识别结果；当置信度参数小于置信度阈值时，从第三方平台获取与待识别图像相关联的标注信息，以及将标注信息作为识别结果。实现了将服务器自动识别与第三方标注信息进行结合，提升识别准确率，以及利用第三方标注信息对服务器使用的机器学习识别方式对应的识别模型进行训练，提升识别模型的训练效果。

Description

图像识别方法和装置

相关申请的交叉引用

本申请要求于2015年09月08日提交的中国专利申请号为“201510567452.2”的优先权，其全部内容作为整体并入本申请中。

技术领域

本申请涉及计算机领域，具体涉及图像识别领域，尤其涉及图像识别方法和装置。

背景技术

在日常生活中，用户有时会有对拍摄的图像进行识别的需求。在已知的技术中，图像识别是通过对海量图像的特征进行分析而建立识别模型，采用识别模型对图像进行识别。然而，当采用上述方式对图像进行识别时，一方面，由于在识别过程中消耗资源较大，不适用于个人用户，另一方面，仅能根据机器输出的识别结果对识别模型进行调整，当输出的识别结果出现较多错误时，会引起识别模型的调整出现偏差，进而导致识别准确率降低。

发明内容

本申请提供了图像识别方法和装置，用于解决上述背景技术部分存在的技术问题。

第一方面，本申请提供了图像识别方法，该方法包括：获取包含有待识别对象的待识别图像；将待识别图像发送至服务器，以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数，置信度参数表征待识别对象为目标对象的概率；当置信度参数大于置信度阈值时，将目标对象的标识信息作为识别结果；当置信度参数小于置信度阈值时，从第三方平台获取与待识别图像相关联的标注信息，以及将标注信息作为识别结果。

第二方面，本申请提供了图像识别方法，该方法包括：接收客户端发送的包含有待识别对象的待识别图像；对待识别图像进行识别，得到待识别对象对应的目标对象的标识信息以及置信度参数，置信度参数表征待识别对象为目标对象的概率；将目标对象的标识信息以及置信度参数发送至客户端。

第三方面，本申请提供了图像识别装置，该装置包括：获取单元，配置用于获取包含有待识别对象的待识别图像；交互单元，配置用于将待识别图像发送至服务器，以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数，置信度参数表征待识别对象为目标对象的概率；判断单元，配置用于当置信度参数大于置信度阈值时，将目标对象的标识信息作为识别结果；当置信度参数小于置信度阈值时，从第三方平台获取与待识别图像相关联的标注信息，以及将标注信息作为识别结果。

第四方面，本申请提供了图像识别装置，该装置包括：接收单元，配置用于接收客户端发送的包含有待识别对象的待识别图像；识别单元，配置用于对待识别图像进行识别，得到待识别对象对应的目标对象的标识信息以及置信度参数，置信度参数表征待识别对象为目标对象的概率；发送单元，配置用于将目标对象的标识信息以及置信度参数发送至客户端。

本申请提供的图像识别方法和装置，通过获取包含有待识别对象的待识别图像；将待识别图像发送至服务器，以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数；当置信度参数大于置信度阈值时，将目标对象的标识信息作为识别结果；当置信度参数小于置信度阈值时，从第三方平台获取与待识别图像相关联的标注信息，以及将标注信息作为识别结果。实现了将服务器自动识别与第三方标注信息进行结合，提升识别准确率，以及利用第三方标注信息对服务器使用的机器学习识别方式对应的识别模型进行训练，以提升训练效果，从而进一步提升识别准确率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请可以应用于其中的示例性***架构图；

图2示出了根据本申请的图像识别方法的一个实施例的流程图；

图3示出了根据本申请的图像识别方法的另一个实施例的流程图；

图4示出了根据本申请的图像识别装置的一个实施例的结构示意图；

图5示出了根据本申请的图像识别装置的另一个实施例的结构示意图；

图6是适于用来实现本申请实施例的终端设备或服务器的计算机***的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的图像识别方法或图像识别装置的实施例的示例性***架构100。

如图1所示，***架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供传输链路的介质。网络104可以包括各种连接类型，例如有线、无线传输链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯应用，例如图像识别类应用、即时通信工具等。

终端设备101、102、103可以是具有显示屏并且支持网络通信的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上的图像识别类应用提供支持的后台服务器。后台服务器可以对接收到的待识别图像等数据进行分析等处理，并将处理结果(目标对象)反馈给终端设备。

需要说明的是，本申请实施例中，可以将获取待识别图像的一端称之为客户端，客户端并不特指某一类型终端，其可以为终端设备101、102、103或服务器105。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

请参考图2，其示出了根据本申请的图像识别方法的一个实施例的流程200。需要说明的是，本申请实施例所提供的图像识别方法一般由终端设备101、102、103执行，相应地，图像识别装置一般设置于终端设备101、102、103中。该方法包括以下步骤：

步骤201，获取包含有待识别对象的待识别图像。

在本实施例中，可以通过摄像头采集待识别图像，摄像头可以设置于终端设备上，终端设备可以包括但不限于移动终端、可穿戴设备(例如智能眼镜)。以摄像头设置于智能眼镜上为例，可以在用户佩戴智能眼镜时，可以利用摄像头采集摄像头的视角范围内的图像作为待识别图像。在本实施例中，可以响应于输入的图像采集指令，开启摄像头进行图像采集。例如，可以通过麦克风接收用户输入的语音信息，对语音信息进行解析得到图像采集指令，触发摄像头进行图像采集。在本实施例中，待识别图像中包含待识别对象，例如，当用户进入会议现场时，可以利用其佩戴的可穿戴设备上的摄像头采集与会议现场这一场景相关联的图像，则采集到的待识别图像中可以包含会议现场中的桌子、椅子等待识别对象。

在本实施例的一些可选的实现方式中，待识别对象包括以下至少一项：物体对象、场景对象、颜色对象。

步骤202，将待识别图像发送至服务器，以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数。

在本实施例中，置信度参数表征待识别对象为目标对象的概率。在获取待识别图像之后，可以将待识别图像发送至服务器以对图像中的待识别对象进行识别，然后可以接收经服务器对待识别图像进行识别后得到的待识别对象对应的目标对象以及置信度参数。其中，服务器对待识别图像进行识别的一种可选识别方式为机器学习识别方式。在本实施例中，置信度参数可以用于表征在对待识别图像进行识别时，待识别对象为目标对象的概率即待识别对象与目标对象的样本数据的相似度。置信度参数的数值越高，则待识别对象为目标对象的概率越大。

步骤203，当置信度参数大于置信度阈值时，将目标对象的标识信息作为识别结果；当置信度参数小于置信度阈值时，从第三方平台获取与待识别图像相关联的标注信息，以及将标注信息作为识别结果。

在本实施例中，一种可选的标注信息包括由第三方平台的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息。在本实施例中，在得到服务器返回的置信度参数之后，可以进一步确定对待识别图像的识别结果。当置信度参数大于置信度阈值时，则可以将目标对象的标识信息作为识别结果。当置信度参数小于置信度阈值时，则可以从第三方平台获取与待识别图像相关联的标注信息。以待识别图像中包含一个圆形的桌子和三把椅子为例，当通过服务器以机器识别方式对该待识别图像进行识别时，例如，将待识别对象与目标对象即圆形桌子对象和椅子对象的样本数据进行匹配，在置信度参数大于置信度阈值的情况下，则可以将目标对象桌子对象、椅子对象的标识信息即桌子、椅子作为识别结果。在置信度参数小于置信度阈值的情况下，则可以将待识别图像发送至服务器，接收服务器返回的标注信息，以及将标注信息作为识别结果。

在本实施例中，可以采用以下方式获取对待识别对象的标注信息：可以将待识别图像发送至与服务器相关联的第三方平台，该第三方平台可以提供问答服务，其中，问答服务可以用于将用户咨询的问题以任务形式进行下发，由该第三方平台的注册用户将对该问题的答案发布在第三方平台。在将待识别图像发送至第三方平台之后，可以利用第三方平台上的问答服务来生成对待识别图像进行识别的任务，然后将任务下发给第三方平台上的注册用户。当注册用户接受对待识别图像进行识别的任务时，可以在向注册用户展示待识别图像的同时，提供信息输入区。注册用户可以判断待识别图像中包含哪些目标对象，然后可以将目标对象的名称、个数等信息在信息输入区进行填写，从而生成标注信息。例如，注册用户接受的对待识别图像进行识别的任务中的待识别图像包括一个圆形的桌子和三把椅子，则注册用户可以在信息输入区采用以下格式填写信息：圆形、桌子、一个、椅子、三把。然后，可以基于注册用户填写的信息，生成标注信息。该标注信息中包含有待识别对象对应的目标对象的标识信息即“圆形桌子、椅子”，还可以包含表征目标对象的个数的信息即“一个、三把”。

在本实施例的一些可选的实现方式中，还包括：将识别结果转换为语音信息，以及播放语音信息。这种实现方式中，在得到最终的识别结果之后，可以将识别结果转换为语音信息，然后将语音信息播报给用户。

在本实施例的一些可选的实现方式中，还包括：当置信度参数小于置信度阈值时，将标注信息发送至服务器，以作为训练样本用于对服务器所使用的机器学习识别方式对应的识别模型的训练。

本实施例的应用场景可以为：用户(例如盲人用户)利用佩戴的可穿戴设备上的摄像头采集当前所处的场景(例如会议现场)相关联的待识别图像(例如包含会议现场中的桌子、椅子等待识别对象的待识别图像)。然后，可以将待识别图像发送至服务器以对待识别图像进行识别，接收服务器返回待识别对象对应的目标对象的标识信息和置信度参数。当置信度参数大于置信度阈值时(例如正确识别出桌子、椅子对象)，可以作为待识别对象对应的目标对象的标识信息作为识别结果，当置信度参数小于置信度阈值时，则可以将待识别图像发送至第三方平台，由第三方平台的注册用户确定待识别对象对应的目标对象(例如注册用户确定出待识别图像中包含桌子、椅子等目标对象)，然后可以接收第三方平台返回的包含待识别对象对应的目标对象的标识信息的标注信息，将标注信息作为识别结果。在确定识别结果之后，可以将识别结果转换为语音信息进行播放。从而使得用户可以基于采集到的图像，较为准确地了解当前所处的场景的情况(例如场景中包含哪些物体)。进一步地，当置信度参数小于置信度阈值时，还可以将标注数据发送至服务器，以作为样本数据对服务器所使用的机器学习识别方式对应的识别模型进行训练，以提升识别模型的训练效果，使得在后续图像识别中，进一步提升识别准确率。

请参考图3，其示出了根据本申请的图像识别方法的一个实施例的流程300。需要说明的是，本申请实施例所提供的图像识别方法一般由服务器105执行，相应地，图像识别装置一般设置于服务器105中。该方法包括以下步骤：

步骤301，接收客户端发送的包含有待识别对象的待识别图像。

在本实施例中，待识别图像中包含待识别对象，例如，当用户进入会议现场时，可以利用智能眼镜上的摄像头采集图像，则采集到的图像中可以包含桌子、椅子等待识别对象。

步骤302，对待识别图像进行识别，得到待识别对象对应的目标对象的标识信息以及置信度参数。

在本实施例中，置信度参数表征待识别对象为目标对象的概率。对待识别对象进行识别的一种可选方式为机器学习方式。机器学习方式可以包括但不限于：自动编码器(Auto Encoder)、稀疏编码(Sparse Coding)、深信度网络(Deep Belief Networks)。上述机器学习方式也可称之为深度学习。

在本实施例的一些可选的实现方式中，对待识别图像进行识别包括：采用卷积神经网络模型对待识别图像进行识别。

在本实施例中，可以首先建立与识别待识别图像使用的机器学习识别方式对应的识别模型，然后，利用识别模型对待识别图像进行识别。利用机器学习方式对应的识别模型对待识别图像进行识别的原理概述如下：在利用识别模型(例如卷积神经网络模型)对待识别图像进行识别时，可以将待识别图像中的待识别对象用一些特征(例如尺度不变特征变换特征点)进行表示，生成输入向量，在经过识别模型对待识别图像进行识别后，可以得到表征待识别对象对应的目标对象的输出向量，识别模型可以用于指示输入向量到输出向量的映射关系，然后可以基于该映射关系，对待识别图像进行识别。

在本实施例中，在利用识别模型对待识别图像进行识别时，可以利用一些特征(例如尺度不变特征变换特征点)来表征待识别图像中的待识别对象，可以将待识别对象(例如桌子对象)在待识别图像中的特征与目标对象(例如桌子对象的样本数据)进行匹配，得到表征待识别对象为目标对象概率的置信度参数。

在本实施例的一些可选的实现方式中，还包括：接收客户端发送的训练用识别结果，训练用识别结果包括从第三方平台获取的与待识别图像相关联的标注信息，标注信息包括由第三方平台的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息；利用训练用识别结果，对机器学习方式对应的识别模型进行训练。

在本实施例中，客户端发送的训练用识别结果可以为在以机器学***台获取的与待识别图像相关联的标注信息。标注信息包括由第三方平台的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息。以待识别图像中包含一个圆形的桌子和三把椅子为例，当以机器学***台(例如提供问答服务的第三方平台)以获得对图像的标注信息。该标注信息可以为第三方平台上的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息。例如，标注信息包括“圆形桌子、一个、椅子、三把”。

在本实施例中，可以利用标注信息对识别模型进行训练。以识别模型为卷积神经网络为例，可以将待识别图像的特征(例如尺度不变特征变换特征点)作为卷积神经网络的输入向量，将标注信息作为卷积神经网络的理想输出向量，由输入向量与输出向量组成向量对来对卷积神经网络进行训练，从而可以利用正确的识别结果即经过第三方平台的注册用户以人工方式对待识别图像进行识别后获取的标注信息，对识别模型进行训练，从而提高识别模型的训练效果，进而在后续的对待识别图像的识别中，提升识别准确率。

在本实施例中，可以根据待识别对象的类型，预先设置与待识别对象的类型对应的样本数据，然后利用样本数据对识别模型进行训练。例如，可以预先获取一些常见的应用场景的图像和以及对图像的标注信息作为训练数据。

步骤303，将目标对象的标识信息以及置信度参数发送至客户端。

在本实施例中，在对待识别图像进行识别之后，可以将待识别图像中的待识别对象对应的目标对象的标识信息以及得到的置信度参数发送至客户端。

请参考图4，其示出了根据本申请的图像识别装置的一个实施例的结构示意图。装置400包括：获取单元401，交互单元402，判断单元403。其中，获取单元401配置用于获取包含有待识别对象的待识别图像；交互单元402配置用于将待识别图像发送至服务器，以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数，置信度参数表征待识别对象为目标对象的概率；判断单元403配置用于当置信度参数大于置信度阈值时，将目标对象的标识信息作为识别结果；当置信度参数小于置信度阈值时，从第三方平台获取与待识别图像相关联的标注信息，以及将标注信息作为识别结果。

在本实施例的一些可选的实现方式中，标注信息包括由第三方平台的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息。

在本实施例的一些可选的实现方式中，装置400还包括：播放单元(未示出)，配置用于将识别结果转换为语音信息，以及播放语音信息。

在本实施例的一些可选的实现方式中，装置400还包括：标注信息发送单元(未示出)，配置用于当置信度参数小于置信度阈值时，将标注信息发送至服务器，以作为训练样本用于对服务器使用的机器学习识别方式对应的识别模型的训练。

请参考图5，其示出了根据本申请的图像识别装置的另一个实施例的结构示意图。装置500包括：接收单元501，识别单元502，发送单元503。其中，接收单元501配置用于接收客户端发送的包含有待识别对象的待识别图像；识别单元502配置用于对待识别图像进行识别，得到待识别对象对应的目标对象的标识信息以及置信度参数，置信度参数表征待识别对象为目标对象的概率；发送单元503配置用于将目标对象的标识信息以及置信度参数发送至客户端。

在本实施例的一些可选的实现方式中，识别单元502包括：神经网络子单元(未示出)，配置用于采用卷积神经网络模型对待识别图像进行识别。

在本实施例的一些可选的实现方式中，装置500还包括：识别结果接收单元(未示出)，配置用于接收客户端发送的训练用识别结果，训练用识别结果包括从第三方平台获取的与待识别图像相关联的标注信息，标注信息包括由第三方平台的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息；训练单元(未示出)，配置用于利用训练用识别结果，对机器学习方式对应的识别模型进行训练。

下面参考图6，其示出了适于用来实现本申请实施例的终端设备或服务器的计算机***600的结构示意图。

如图6所示，计算机***600包括中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有***600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。

附图中的流程图和框图，图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

本申请实施例中所涉及到的单元或模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中，例如，可以描述为：一种处理器包括获取单元，接收单元，处理单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，获取单元还可以被描述为“获取包含有待识别对象的待识别图像”。

作为另一方面，本申请还提供了一种非易失性计算机存储介质，该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质；也可以是单独存在，未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序，当所述一个或者多个程序被一个设备执行时，使得所述设备：获取包含有待识别对象的待识别图像；将所述待识别图像发送至服务器，以及接收服务器返回的对所述待识别图像进行识别而得到的所述待识别对象对应的目标对象的标识信息以及置信度参数，所述置信度参数表征所述待识别对象为所述目标对象的概率；当所述置信度参数大于置信度阈值时，将所述目标对象的标识信息作为识别结果；当所述置信度参数小于置信度阈值时，从第三方平台获取与所述待识别图像相关联的标注信息，以及将所述标注信息作为识别结果。上述非易失性计算机存储介质存储有一个或者多个程序，当所述一个或者多个程序被一个设备执行时，使得所述设备：接收客户端发送的包含有待识别对象的待识别图像；对待识别图像进行识别，得到待识别对象对应的目标对象的标识信息以及置信度参数，置信度参数表征待识别对象为目标对象的概率；将目标对象的标识信息以及置信度参数发送至客户端。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

一种图像识别方法，其特征在于，所述方法包括：

获取包含有待识别对象的待识别图像；

将所述待识别图像发送至服务器，以及接收所述服务器返回的对所述待识别图像进行识别而得到的所述待识别对象对应的目标对象的标识信息以及置信度参数，所述置信度参数表征所述待识别对象为所述目标对象的概率；

当所述置信度参数大于置信度阈值时，将所述目标对象的标识信息作为识别结果；当所述置信度参数小于置信度阈值时，从第三方平台获取与所述待识别图像相关联的标注信息，以及将所述标注信息作为识别结果。
根据权利要求1所述的方法，其特征在于，所述标注信息包括由所述第三方平台的注册用户发布的包含所述待识别对象对应的目标对象的标识信息的信息。
根据权利要求2所述的方法，其特征在于，所述方法还包括：将所述识别结果转换为语音信息，以及播放所述语音信息。
根据权利要求1所述的方法，其特征在于，所述方法还包括：当所述置信度参数小于置信度阈值时，将所述标注信息发送至所述服务器，以作为训练样本用于对所述服务器所使用的机器学习识别方式对应的识别模型的训练。
根据权利要求1-4之一所述的方法，其特征在于，所述待识别对象包括以下至少一项：物体对象、场景对象、颜色对象。
一种图像识别方法，其特征在于，所述方法包括：

接收客户端发送的包含有待识别对象的待识别图像；

对所述待识别图像进行识别，得到待识别对象对应的目标对象的标识信息以及置信度参数，所述置信度参数表征所述待识别对象为所述目标对象的概率；

将所述目标对象的标识信息以及置信度参数发送至所述客户端。
根据权利要求6所述的方法，其特征在于，所述对所述待识别图像进行识别包括：采用卷积神经网络模型对所述待识别图像进行识别。
根据权利要求7所述的方法，其特征在于，所述方法还包括：

接收客户端发送的训练用识别结果，所述训练用识别结果包括从第三方平台获取的与所述待识别图像相关联的标注信息，所述标注信息包括由所述第三方平台的注册用户发布的包含所述待识别对象对应的目标对象的标识信息的信息；

利用所述训练用识别结果，对识别待识别图像所使用的机器学习识别方式对应的识别模型进行训练。
一种图像识别装置，其特征在于，所述装置包括：

获取单元，配置用于获取包含有待识别对象的待识别图像；

交互单元，配置用于将所述待识别图像发送至服务器，以及接收服务器返回的对所述待识别图像进行识别而得到的所述待识别对象对应的目标对象的标识信息以及置信度参数，所述置信度参数表征所述待识别对象为所述目标对象的概率；

判断单元，配置用于当所述置信度参数大于置信度阈值时，将所述目标对象的标识信息作为识别结果；当所述置信度参数小于置信度阈值时，从第三方平台获取与所述待识别图像相关联的标注信息，以及将所述标注信息作为识别结果。
根据权利要求9所述的装置，其特征在于，所述标注信息包括由所述第三方平台的注册用户发布的包含所述待识别对象对应的目标对象的标识信息的信息。
根据权利要求9所述的装置，其特征在于，所述装置还包括:

播放单元，配置用于将所述识别结果转换为语音信息，以及播放所述语音信息。
根据权利要求9所述的装置，其特征在于，所述装置还包括：

标注信息发送单元，配置用于当所述置信度参数小于置信度阈值时，将所述标注信息发送至所述服务器，以作为训练样本用于对所述服务器所使用的机器学习识别方式对应的识别模型的训练。
根据权利要求9-12之一所述的装置，其特征在于，所述待识别对象包括以下至少一项：物体对象、场景对象、颜色对象。
一种图像识别装置，其特征在于，所述装置包括：

接收单元，配置用于接收客户端发送的包含有待识别对象的待识别图像；

识别单元，配置用于对所述待识别图像进行识别，得到待识别对象对应的目标对象的标识信息以及置信度参数，所述置信度参数表征所述待识别对象为所述目标对象的概率；

发送单元，配置用于将所述目标对象的标识信息以及置信度参数发送至所述客户端。
根据权利要求14所述的装置，其特征在于，所述识别单元包括：

神经网络子单元，配置用于采用卷积神经网络模型对所述待识别图像进行识别。
根据权利要求15所述的装置，其特征在于，所述装置还包括：

识别结果接收单元，配置用于接收客户端发送的训练用识别结果，所述训练用识别结果包括从第三方平台获取的与所述待识别图像相关联的标注信息，所述标注信息包括由所述第三方平台的注册用户发布的包含所述待识别对象对应的目标对象的标识信息的信息；

训练单元，配置用于利用所述训练用识别结果，对识别待识别图像所使用的机器学习识别方式对应的识别模型进行训练。
一种设备，包括：

处理器；和

存储器，

所述存储器中存储有能够被所述处理器执行的计算机可读指令，在所述计算机可读指令被执行时，所述处理器执行权利要求1至8中任一项所述的方法。
一种非易失性计算机存储介质，所述计算机存储介质存储有能够被处理器执行的计算机可读指令，当所述计算机可读指令被处理器执行时，所述处理器执行权利要求1至8中任一项所述的方法。