CN112580674A

CN112580674A - 一种图片识别方法、计算机设备、存储介质

Info

Publication number: CN112580674A
Application number: CN201910926845.6A
Authority: CN
Inventors: 李建; 吴攀
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2019-09-27
Filing date: 2019-09-27
Publication date: 2021-03-30

Abstract

本申请实施例公开了一种图片识别方法。所述方法包括：获取内容信息，所述内容信息包括多个信息元素，所述多个信息元素包括至少一个图片信息元素，提取所述内容信息中信息元素的特征数据，根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据，根据所述特征数据以及差异数据，确定所述内容信息的特征类型，引入了图片间的差异这一维度的分析，更能够从内容信息的整体上分析特征类型，避免了依赖单一图片分析特征时准确率较低的问题，提高了确定内容信息的特征类型的准确率。

Description

一种图片识别方法、计算机设备、存储介质

技术领域

本申请涉及数据处理技术领域，具体涉及一种图片识别方法、一种计算机设备、一种计算机可读存储介质。

背景技术

随着移动互联网的普及，网络交易量越来越大，虚假评价的监督治理，营造良好网购环境日益迫切。然而职业好评、差评、“收评价”已经形成了一条专业的灰色产业链。

在电商交易中，对交易商品的品质、使用感受等的商品评价是正常的。但是评价内容中非客观描述目标商品，而是为了引导用户购买其他商品等目的而加入的其他信息，包括但不限于通讯帐号、优惠信息、网页链接等，这种广告评价是不正常的，属于具有风险的评价内容。

申请人经研究发现，恶意评价的形式变异非常快，而且恶意图片的识别比恶意文本的识别更加困难。例如，图片中包含各种隐藏性的广告信息，由于广告信息在图片中会采取模糊，隐藏，变异等手段，通过OCR(Optical Character Recognition，光学字符识别)等基于单张图片识别广告的方式存在准确率较低的问题。

发明内容

鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的图片识别方法以及计算机设备、计算机可读存储介质。

依据本申请的一个方面，提供了一种图片识别方法，包括：

获取内容信息，所述内容信息包括多个信息元素，所述多个信息元素包括至少一个图片信息元素；

提取所述内容信息中信息元素的特征数据；

根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据；

根据所述特征数据以及差异数据，确定所述内容信息的特征类型。

可选地，所述根据所述特征数据以及差异数据，确定所述内容信息的特征类型包括：

以所述信息元素的特征数据作为输入，根据特征值识别模型，确定所述信息元素的特征值；

根据所述特征值和差异数据，确定所述内容信息的特征类型。

可选地，在所述以所述信息元素的特征数据作为输入，根据特征值识别模型，确定所述信息元素的特征值之前，所述方法还包括：

采用信息元素样本以及对应标记的特征类型，训练所述特征值识别模型。

可选地，所述内容信息包括文本信息元素，所述特征数据包括描述信息，所述根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据包括：

根据所述图片信息元素的描述信息和文本信息元素的描述信息，确定所述图片信息元素和文本信息元素之间的差异数据。

可选地，所述根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据包括：

对所述图片信息元素之间的特征数据进行比对，得到所述图片信息元素之间的差异数据。

根据所述特征数据，对多个图片信息元素进行聚类；

计算图片聚类之间的差异数据，作为所述图片信息元素之间的差异数据。

可选地，在所述提取所述内容信息中信息元素的特征数据之前，所述方法还包括：

查找所述内容信息的关联信息，所述关联信息包括以下至少一种：图片信息元素、文本信息元素、视频信息元素；

将所述关联信息添加到所述内容信息中。

可选地，所述关联信息包括图片信息元素，在所述查找所述内容信息的关联信息之前，所述方法还包括：

确定所述内容信息中的图片信息元素的数量不符合预设要求。

可选地，所述内容信息包括评论内容信息、视频内容信息中至少一种。

可选地，所述内容信息为视频内容信息时，在所述提取所述内容信息中信息元素的特征数据之前，所述方法还包括：

提取所述视频内容信息中的多个视频帧，作为所述图片信息元素。

依据本申请的另一个方面，提供了一种图片识别装置，包括：

信息获取模块，用于获取内容信息，所述内容信息包括多个信息元素，所述多个信息元素包括至少一个图片信息元素；

数据提取模块，用于提取所述内容信息中信息元素的特征数据；

差异确定模块，用于根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据；

类型确定模块，用于根据所述特征数据以及差异数据，确定所述内容信息的特征类型。

可选地，所述类型确定模块包括：

特征值确定子模块，用于以所述信息元素的特征数据作为输入，根据特征值识别模型，确定所述信息元素的特征值；

类型确定子模块，用于根据所述特征值和差异数据，确定所述内容信息的特征类型。

可选地，所述装置还包括：

训练模块，用于在所述以所述信息元素的特征数据作为输入，根据特征值识别模型，确定所述信息元素的特征值之前，采用信息元素样本以及对应标记的特征类型，训练所述特征值识别模型。

可选地，所述内容信息包括文本信息元素，所述特征数据包括描述信息，所述差异确定模块包括：

差异确定子模块，用于根据所述图片信息元素的描述信息和文本信息元素的描述信息，确定所述图片信息元素和文本信息元素之间的差异数据。

可选地，所述差异确定模块包括：

比对子模块，用于对所述图片信息元素之间的特征数据进行比对，得到所述图片信息元素之间的差异数据。

可选地，所述差异确定模块包括：

聚类子模块，用于根据所述特征数据，对多个图片信息元素进行聚类；

计算子模块，用于计算图片聚类之间的差异数据，作为所述图片信息元素之间的差异数据。

可选地，所述装置还包括：

查找模块，用于在所述提取所述内容信息中信息元素的特征数据之前，查找所述内容信息的关联信息，所述关联信息包括以下至少一种：图片信息元素、文本信息元素、视频信息元素；

添加模块，用于将所述关联信息添加到所述内容信息中。

可选地，所述关联信息包括图片信息元素，所述装置还包括：

确定模块，用于在所述查找所述内容信息的关联信息之前，确定所述内容信息中的图片信息元素的数量不符合预设要求。

可选地，所述内容信息为视频内容信息时，所述装置还包括：

视频帧提取模块，用于在所述提取所述内容信息中信息元素的特征数据之前，提取所述视频内容信息中的多个视频帧，作为所述图片信息元素。

依据本申请的另一个方面，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述一个或多个的方法。

依据本申请的另一个方面，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述一个或多个的方法。

依据本申请实施例，通过获取内容信息，所述内容信息包括多个信息元素，所述多个信息元素包括至少一个图片信息元素，提取所述内容信息中信息元素的特征数据，根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据，根据所述特征数据以及差异数据，确定所述内容信息的特征类型，引入了图片间的差异这一维度的分析，更能够从内容信息的整体上分析特征类型，避免了依赖单一图片分析特征时准确率较低的问题，提高了确定内容信息的特征类型的准确率。

进一步，通过查找所述内容信息的关联信息，将所述关联信息添加到所述内容信息中，实现对获取的内容信息的补充，解决了内容信息中信息元素不足的问题，克服了信息元素不足无法实施该方式的问题，或者通过增加信息元素的数量，可以增加对内容信息进行特征分析的维度，进一步提供特征分析的准确率。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了图片识别过程的示意图；

图2示出了根据本申请实施例一的一种图片识别方法实施例的流程图；

图3示出了商品评论的风险识别过程的示意图；

图4示出了根据本申请实施例二的一种图片识别方法实施例的流程图；

图5示出了根据本申请实施例三的一种图片识别装置实施例的结构框图；

图6示出了可被用于实现本公开中所述的各个实施例的示例性***。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

为使本领域技术人员更好地理解本申请，以下对本申请涉及的概念进行说明：

内容信息包括图片、文本、视频、音频等形式的信息，在本申请中，内容信息由多个信息元素组成且多个信息元素中包括至少一个图片信息元素。信息元素可以包括图片、文本、视频、音频等形式，或者其他任意适用形式的信息元素，本申请实施例对此不做限制。内容信息可以有单一形式的信息元素，也可以有多种形式的信息元素。各种信息元素可以有一个或多个。

例如，在电商交易中，对交易商品提交的商品评价属于一种内容信息，其中可以包括图片信息元素、文本信息元素等，或者商品详情页面中问答区的内容也属于一种内容信息。或者在视频网络平台中，影视剧等视频属于一种内容信息，视频由视频帧序列组成，视频的视频帧可以作为图片信息元素，视频的音频可以作为音频信息元素。

特征数据包括用于表征信息元素的各种数据，例如，对于图片信息元素来说，采用空间向量模型来表示各个图片信息元素，将各个图片信息元素进行向量化，或者其他任意适用的特征数据，本申请实施例对此不做限制。信息元素的描述信息也可以看作是一种特征数据，例如，文本信息元素的主题词是一种描述信息，可以使用TextCNN(文本卷积神经网络)模型得到文本的主题，主题词可以描述文本的某种特性，因此主题词可以看作是文本信息元素的一种特征数据。具体可以包括任意适用的描述信息，本申请实施例对此不做限制。

信息元素之间的差异数据用于表征信息元素之间的差异的大小，具体可以通过比较信息元素的特征数据来得到差异数据，或者其他任意适用的方式，本申请实施例对此不做限制。差异数据可以是两个信息元素之间的差异数据，也可以是多个信息元素之间的差异数据，其中，多个信息元素之间的差异数据可以包括信息元素两两之间的差异数据的和值或者均值等，本申请实施例对此不做限制。

在本申请中，为了克服依赖单一的图片信息元素难以识别恶意图片的问题，需要确定的差异数据是图片信息元素和其他的图片信息元素或非图片形式的信息元素之间的。图片信息元素与其他的信息元素的差异越大，则该图片信息元素是恶意图片的可能性越大，继而该内容信息是恶意信息的可能性也越大。反之，图片信息元素与其他的信息元素的差异越小，则该图片信息元素是恶意图片的可能性越小，继而该内容信息是恶意信息的可能性也越小。

例如，对于图片信息元素之间的差异数据，图片信息元素可以用向量表示，一种方式可以采用余弦相似度计算得到差异数据，通过计算两个图片信息元素的向量的余弦值可以评估两者的相似度，即得到了两者的差异数据；另一种方式可以采用皮尔逊相关系数(Pearson correlation coefficient)计算得到差异数据，通过计算两个图片信息元素的向量之间的协方差和标准差的商可以评估两者的相关性，即得到了两者的差异数据，具体可以采用任意适用的方式得到差异数据，本申请实施例对此不做限制。

内容信息根据信息元素的特征数据以及差异数据可以被归于某种特征类型，特征类型用于表征内容信息的某个维度的特性，例如，对于商品评价来说，特征类型可以分为广告评价和正常评价，或者可以分为恶意评价和非恶意评价，或者可以分为严重违规、轻微违规、涉嫌违规、未违规等多种；对于视频来说，特征类型可以分为替换广告和未替换广告，或者可以分为换脸或未换脸，或者可以分为换图像或未换图像，或者可以分为换视频或未换视频等多种，具体可以包括任意适用的特征类型，本申请实施例对此不做限制。

在本申请的一种可选实施例中，为了确定内容信息的特征类型，可以先确定内容信息中的信息元素在该种特征维度上的程度，记为特征值。信息元素的特征值用于表征信息元素在对应的特征上的程度值。以特征为恶意程度为例，在0-1的数值区间内，数值越大表示恶意程度越严重，某个信息元素的恶意程度为0.6，表示比较严重的恶意。可以理解的是，也可以采用文字或符号来表示特征值，例如信息元素的恶意程度为十级(例如，1级-10级对应之前的0-1的数值区间)。

为此，可以采用特征值识别模型来确定，将信息元素的特征数据输入该特征值识别模型，模型经过计算可以输出信息元素的特征值。之所以可以输出信息元素的特征值，是因为该特征值识别模型采用有监督的学习方式，根据大量的标记特征类型的信息元素样本对模型进行训练，使得特征值识别模型可以对信息元素的特征值进行评估。

例如，收集大量的广告评价和正常评价的图片信息元素，采用广告评价和正常评价两种特征类型对图片信息元素进行标记，采用有监督学习方式训练得到二分类模型，该二分类模型可以将图片信息元素归于广告评价或正常评价两种特征类型，但是本申请并不需要二分类模型输出的图片信息元素归于某一种特征类型，而是输出二分类模型中可以表征该图片信息元素在该特征类型上的程度的参数，作为图片信息元素的特征值。

在本申请的一种可选实施例中，当内容信息包括文本信息元素时，为了确定图片信息元素和文本信息元素之间的差异数据，需要先得到信息元素的描述信息，描述信息也属于一种特征数据。

例如，文本信息元素的描述信息可以采用TextCNN模型或者利用TF-IDF(termfrequency–inverse document frequency，词频-逆词频)算法等方式得到文本信息元素中的主题词作为描述信息。图片信息元素的描述信息可以采用Mask R-CNN(Mask Region-based Convolutional Neural Network，掩膜基于区域的卷积神经网络)模型或者图片场景识别模型等方式得到图片信息元素中包括的主要目标或所处场景作为描述信息。具体可以采用任意适用的方式得到信息元素的描述信息，本申请实施例对此不做限制。

在本申请的一种可选实施例中，内容信息在一个应用***或数据***中存在与之具有关联的信息，记为关联信息。关联信息包括以下至少一种：图片信息元素、文本信息元素、视频信息元素，或者其他任意适用的形式，本申请实施例对此不做限制。

例如，对于商品评论这类内容信息来说，商品评论所针对的商品在电商平台中会有该商品的详情信息，这些详情信息就是一种商品评论的关联信息。其中，包括有描述该商品的文本、该商品的展示图、甚至还有该商品使用过程的演示视频等。存储商品评论时会对应存储该商品ID(标识)，根据商品ID进行查询，可以查找到该商品的详情信息，从中提取出所需的信息元素即可。具体可以采用任意适用的查找方式，本申请实施例对此不做限制。

在本申请的一种可选实施例中，内容信息为视频内容信息时，即获取到的内容信息为一个视频格式的数据，视频是由视频帧序列组成的，视频帧可以看作是图片信息元素。

例如，本申请方案可用于篡改检测的应用场景下，影视剧作品中，广告商在视频中的某个场景植入了一个广告的商品，但侵权者对视频进行加工，在部分时间的视频中将广告的商品篡改成了其他商品。或者用于视频广告检测的应用场景下，即检测视频中是否存在植入广告的视频帧。或者用于个人隐私检测的应用场景下，即检测视频中是否存在涉及个人隐私的内容的视频帧。

针对上述应用场景的一种实现方式中：获取视频中该场景下不同时间的视频帧，将获取的视频帧作为图片信息元素，提取图片信息元素的特征数据，确定图片信息元素之间的差异数据，继而根据特征数据和差异数据，确定视频是否是被篡改的视频或植入广告的视频或涉及个人隐私的视频。

针对上述应用场景的另一种实现方式中：内容信息包括待检测视频和样本视频帧(如包括被篡改的视频帧、或植入广告的视频帧、或涉及个人隐私的视频帧等)，将待检测的视频帧序列输入，进行篡改或广告检测，提取待检测的视频帧和样本视频帧的特征数据，确定待检测的视频帧和样本视频帧之间的差异数据，继而根据特征数据和差异数据，确定视频是否是被篡改的视频或植入广告的视频或涉及个人隐私的视频。其中，样本视频帧可以有正向样本，也可以有负向样本。例如，正向样本是未篡改的视频帧，那么负向样本就是篡改的视频帧；正向样本是植入广告的视频帧，那么负向样本就是未植入广告的视频帧。

根据本申请的一种实施例，当评价内容中包括恶意图片时，如恶意图片中包含各种隐藏性的广告信息等，基于单张图片识别恶意的方式存在准确率较低的问题。如图1所示的图片识别过程的示意图，本申请提供了一种图片识别机制，通过获取内容信息，所述内容信息包括多个信息元素，所述多个信息元素包括至少一个图片信息元素，提取所述内容信息中信息元素的特征数据，根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据，根据所述特征数据以及差异数据，确定所述内容信息的特征类型，引入了图片间的差异这一维度的分析，更能够从内容信息的整体上分析特征类型，避免了依赖单一图片分析特征时准确率较低的问题，提高了确定内容信息的特征类型的准确率。本申请适用但不局限于上述应用场景。

参照图2，示出了根据本申请实施例一的一种图片识别方法实施例的流程图，该方法具体可以包括以下步骤：

步骤101，获取内容信息，所述内容信息包括多个信息元素，所述多个信息元素包括至少一个图片信息元素。

在本申请实施例中，为了解决难以识别恶意图片的问题，首先获取待确定特征类型的内容信息，该内容信息是由多个信息元素组成且包括至少一个图片信息元素。

例如，在电商交易中，用户对交易商品提交商品评价时，在将该商品评价显示到评论页面之前，先从电商的数据***中获取该商品评价进行分析，以避免存在问题的商品评价被发布到评论页面。或者在视频网络平台中，用户上传了自制的视频后，在将该视频提供给其他用户观看之前，先从视频网络平台的数据***中获取该视频进行分析，当然，对于视频内容信息来说，需要从视频中提取视频帧作为图片信息元素。

步骤102，提取所述内容信息中信息元素的特征数据。

在本申请实施例中，提取内容信息中信息元素的特征数据的实现方式包括多种，对于图片信息元素来说，可以将图片信息元素进行向量化，将得到的向量作为图片信息元素的特征数据，若后续需要确定图片信息元素和文本信息元素之间的差异数据，则可以对图片信息元素进行目标识别或场景识别，得到图片中包括的主要目标或所处场景等描述信息，作为特征数据。对于文本信息元素来说，可以识别文本的主题词等描述信息，作为特征数据。具体可以采用任意适用的提取方式，本申请实施例对此不做限制。

例如，如图3所示的商品评论的风险识别过程的示意图，该商品评论中包括1个文本信息元素和5个图片信息元素。对各个图片信息元素进行向量化表示，得到各个图片信息元素对应的向量，作为图片信息元素的特征数据。识别文本信息元素的主题词，作为文本信息元素的特征数据。

步骤103，根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据。

在本申请实施例中，根据信息元素的特征数据，可以确定图片信息元素和其他的信息元素之间的差异数据。当内容信息包括多个图片信息元素时，图片信息元素和其他的信息元素包括图片信息元素和其他的图片信息元素，也可以包括图片信息元素和非图片形式的其他的信息元素。当内容信息包括一个图片信息元素时，图片信息元素和其他的信息元素包括图片信息元素和非图片形式的其他的信息元素。

在本申请实施例中，确定图片信息元素和其他的信息元素之间的差异数据的实现方式可以包括多种，例如，对图片信息元素之间进行特征数据的比对，得到图片信息元素之间的差异数据；或者根据所述特征数据，对多个图片信息元素进行聚类，计算图片聚类之间的差异数据，作为所述图片信息元素之间的差异数据；或者根据图片信息元素的描述信息和文本信息元素的描述信息，确定图片信息元素和文本信息元素之间的差异数据，或者其他任意适用的实现方式，本申请实施例对此不做限制。

例如，如图3所示，对5个图片信息元素的两两之间进行比对，通过比对图片信息元素对应的特征数据，得到5个图片信息元素两两之间的差异程度值，即差异数据，可以直接使用得到的5个差异数据，或者也可以选取5个差异数据中表示差异最大的1个或多个差异数据来使用，或者还可以计算5个差异数据的均值得到一个总的差异数据来使用，或者其他任意适用的方式，本申请实施例对此不做限制。

步骤104，根据所述特征数据以及差异数据，确定所述内容信息的特征类型。

在本申请实施例中，根据信息元素的特征数据以及上一步得到的差异数据可以将内容信息归于某种特征类型。具体来说，可以根据内容信息中所有的信息元素的特征数据以及上一步得到的差异数据来确定，或者可以根据内容信息中部分的信息元素的特征数据以及上一步得到的差异数据来确定，本申请实施例对此不做限制。

在本申请实施例中，确定所述内容信息的特征类型的实现方式可以包括多种，例如，以信息元素的特征数据作为输入，根据特征值识别模型，确定信息元素的特征值，根据特征值和差异数据，确定内容信息的特征类型，或者其他任意适用的实现方式，本申请实施例对此不做限制。

例如，如图3所示，将商品评论中的1个文本信息元素的特征数据，即主题词，将文本信息元素的特征数据输入针对文本的风险值识别模型，得到该文本信息元素的风险值，再根据该风险值和上一步得到的差异程度值进行加权平均计算，得到一个综合风险值，若该综合风险值超过预先给定的阈值，则确定该商品评论属于有风险的特征类型。

参照图4，示出了根据本申请实施例二的一种图片识别方法实施例的流程图，该方法具体可以包括以下步骤：

步骤201，获取内容信息，所述内容信息包括多个信息元素，所述多个信息元素包括至少一个图片信息元素。

在本申请实施例中，此步骤的具体实现方式可以参见前述实施例中的描述，此处不另赘述。

在本申请实施例中，可选地，内容信息包括评论内容信息、视频内容信息中至少一种。例如，在电商交易中，用户针对商品提交的商品评价属于一种评论内容信息。在视频网络平台中，用户上传的自制视频属于一种视频内容信息。具体可以任意适用的评论内容信息或视频内容信息，本申请实施例对此不做限制。

步骤202，查找所述内容信息的关联信息，所述关联信息包括以下至少一种：图片信息元素、文本信息元素、视频信息元素。

在本申请实施例中，在提取所述内容信息中信息元素的特征数据之前，还可以查找内容信息的关联信息。例如，对于商品评论来说，查找商品评论所针对的商品的详情信息，将详情信息中的图片确定为关联信息，具体可以根据实际需要进行查找，本申请实施例对此不做限制。

在本申请实施例中，可选地，在一些实施场景下，需要图片信息元素之间的差异数据，需要查找的关联信息中包括图片信息元素。在查找所述内容信息的关联信息之前，还可以包括：确定内容信息中的图片信息元素的数量不符合预设要求。具体可以根据实际需要设定预设要求的数量，本申请实施例对此不做限制。

例如，商品评论中仅包括1个图片信息元素，而预设要求的数量为2，在确定该商品评论中图片信息元素的数量不符合预设要求时，表明内容信息中图片信息元素不足。根据商品评论查找该商品的详情信息中的图片作为关联信息，补充到内容信息中。

步骤203，将所述关联信息添加到所述内容信息中。

在本申请实施例中，将查找到的关联信息添加到内容信息中，实现对获取的内容信息的补充，解决了内容信息中信息元素不足的问题，克服了信息元素不足无法实施该方式的问题，或者通过增加信息元素的数量，可以增加对内容信息进行特征分析的维度，进一步提供特征分析的准确率。

步骤204，提取提取所述内容信息中信息元素的特征数据。

步骤205，根据所述特征数据，对多个图片信息元素进行聚类。

在本申请实施例中，在计算多个图片信息元素之间的差异数据时，可以对多个图片信息元素采用聚类的方式，将多个图片信息元素分成由类似的图片信息元素组成的多个类的过程，称为聚类。

在本申请实施例中，对多个图片信息元素的特征数据进行聚类，即为对多个图片信息元素进行聚类。由聚类所生成的簇是一组图片信息元素的集合，这些图片信息元素与同一个簇中的图片信息元素彼此相似，与其他簇中的图片信息元素相异，将一个簇的图片信息元素记为一个图片聚类。例如，对商品评论中的5个图片信息元素进行聚类，其中3个图片信息元素归于一个图片聚类，另2个图片信息元素归于另一个图片聚类。

步骤206，计算图片聚类之间的差异数据，作为所述图片信息元素之间的差异数据。

在本申请实施例中，在进行聚类后，可以计算图片聚类之间的差异数据，作为图片信息元素之间的差异数据。计算图片聚类之间的差异数据的实现方式可以包括多种，例如，计算一个图片聚类中的各个图片信息元素与另一个图片聚类中的各个图片信息元素之间的差异数据，得到多个差异数据，再计算多个差异数据的平均值，即得到了两个图片聚类之间的差异数据。具体可以包括任意适用的计算方式，本申请实施例对此不做限制。

在本申请实施例中，可选地，内容信息包括文本信息元素，特征数据包括描述信息，根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据的一种实现方式可以包括：根据图片信息元素的描述信息和文本信息元素的描述信息，确定图片信息元素和文本信息元素之间的差异数据。

对图片信息元素的描述信息和文本信息元素的描述信息进行比对，可以得到图片信息元素和文本信息元素之间的差异数据。描述信息之间的差异可以表征图片信息元素和文本信息元素之间差异。例如，对两个描述信息进行文本向量化，计算两个描述信息对应的向量之间的距离可以得到差异数据，图片信息元素的描述信息为“袜子”，当文本信息元素的描述信息为“棉布”时所得到的差异数据就会比当文本信息元素的描述信息为“塑料”时所得到的差异数据小。

步骤207，以所述信息元素的特征数据作为输入，根据特征值识别模型，确定所述信息元素的特征值。

在本申请实施例中，采用特征值识别模型确定信息元素的特征值时，输入的数据为信息元素的特征数据，特征值识别模型经过计算，可以输出该信息元素的特征值。

在本申请实施例中，可选地，在以所述信息元素的特征数据作为输入，根据特征值识别模型，确定所述信息元素的特征值之前，还可以包括：采用信息元素样本以及对应标记的特征类型，训练所述特征值识别模型。

特征值识别模型需要经过训练，才能准确的识别出信息元素的特征值。收集大量信息元素样本，并对信息元素样本进行标记，标记各个信息元素对应的特征类型，将信息元素样本输入特征值识别模型，特征值识别模型中的参数不断被学习更新，直至达到所需的性能。

步骤208，根据所述特征值和差异数据，确定所述内容信息的特征类型。

在本申请实施例中，采用特征值识别模型得到特征值后，将该特征值与差异数据进行综合，一起确定内容信息的特征类型。例如，将特征值和差异数据进行加权平均计算，得到一个综合值后，若该综合值超过预设的阈值，则确定该内容信息为一种特征类型，若该综合值未超过预设的阈值，则确定该内容信息为另一种特征类型，具体可以采用任意适用的实现方式，本申请实施例对此不做限制。

依据本申请实施例，通过获取内容信息，所述内容信息包括多个信息元素，所述多个信息元素包括至少一个图片信息元素，提取所述内容信息中信息元素的特征数据，根据所述特征数据，对多个图片信息元素进行聚类，计算图片聚类之间的差异数据，作为所述图片信息元素之间的差异数据，以所述信息元素的特征数据作为输入，根据特征值识别模型，确定所述信息元素的特征值，根据所述特征值和差异数据，确定所述内容信息的特征类型，引入了图片间的差异这一维度的分析，更能够从内容信息的整体上分析特征类型，避免了依赖单一图片分析特征时准确率较低的问题，提高了确定内容信息的特征类型的准确率。

参照图5，示出了根据本申请实施例三的一种图片识别装置实施例的结构框图，具体可以包括：

信息获取模块301，用于获取内容信息，所述内容信息包括多个信息元素，所述多个信息元素包括至少一个图片信息元素；

数据提取模块302，用于提取所述内容信息中信息元素的特征数据；

差异确定模块303，用于根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据；

类型确定模块304，用于根据所述特征数据以及差异数据，确定所述内容信息的特征类型。

在本申请实施例中，可选地，所述类型确定模块包括：

在本申请实施例中，可选地，所述装置还包括：

在本申请实施例中，可选地，所述内容信息包括文本信息元素，所述特征数据包括描述信息，所述差异确定模块包括：

在本申请实施例中，可选地，所述差异确定模块包括：

在本申请实施例中，可选地，所述装置还包括：

添加模块，用于将所述关联信息添加到所述内容信息中。

在本申请实施例中，可选地，所述关联信息包括图片信息元素，所述装置还包括：

在本申请实施例中，可选地，所述内容信息包括评论内容信息、视频内容信息中至少一种。

在本申请实施例中，可选地，所述内容信息为视频内容信息时，所述装置还包括：

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本公开的实施例可被实现为使用任意适当的硬件，固件，软件，或及其任意组合进行想要的配置的***。图6示意性地示出了可被用于实现本公开中所述的各个实施例的示例性***(或装置)700。

对于一个实施例，图6示出了示例性***700，该***具有一个或多个处理器702、被耦合到(一个或多个)处理器702中的至少一个的***控制模块(芯片组)704、被耦合到***控制模块704的***存储器706、被耦合到***控制模块704的非易失性存储器(NVM)/存储设备708、被耦合到***控制模块704的一个或多个输入/输出设备710，以及被耦合到***控制模块706的网络接口712。

处理器702可包括一个或多个单核或多核处理器，处理器702可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中，***700能够作为本申请实施例中所述的浏览器。

在一些实施例中，***700可包括具有指令的一个或多个计算机可读介质(例如，***存储器706或NVM/存储设备708)以及与该一个或多个计算机可读介质相合并被配置为执行指令以实现模块从而执行本公开中所述的动作的一个或多个处理器702。

对于一个实施例，***控制模块704可包括任意适当的接口控制器，以向(一个或多个)处理器702中的至少一个和/或与***控制模块704通信的任意适当的设备或组件提供任意适当的接口。

***控制模块704可包括存储器控制器模块，以向***存储器706提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。

***存储器706可被用于例如为***700加载和存储数据和/或指令。对于一个实施例，***存储器706可包括任意适当的易失性存储器，例如，适当的DRAM。在一些实施例中，***存储器706可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。

对于一个实施例，***控制模块704可包括一个或多个输入/输出控制器，以向NVM/存储设备708及(一个或多个)输入/输出设备710提供接口。

例如，NVM/存储设备708可被用于存储数据和/或指令。NVM/存储设备708可包括任意适当的非易失性存储器(例如，闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如，一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。

NVM/存储设备708可包括在物理上作为***700被安装在其上的设备的一部分的存储资源，或者其可被该设备访问而不必作为该设备的一部分。例如，NVM/存储设备708可通过网络经由(一个或多个)输入/输出设备710进行访问。

(一个或多个)输入/输出设备710可为***700提供接口以与任意其他适当的设备通信，输入/输出设备710可以包括通信组件、音频组件、传感器组件等。网络接口712可为***700提供接口以通过一个或多个网络通信，***700可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信，例如接入基于通信标准的无线网络，如WiFi，2G，3G，4G或5G，或它们的组合进行无线通信。

对于一个实施例，(一个或多个)处理器702中的至少一个可与***控制模块704的一个或多个控制器(例如，存储器控制器模块)的逻辑封装在一起。对于一个实施例，(一个或多个)处理器702中的至少一个可与***控制模块704的一个或多个控制器的逻辑封装在一起以形成***级封装(SiP)。对于一个实施例，(一个或多个)处理器702中的至少一个可与***控制模块704的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例，(一个或多个)处理器702中的至少一个可与***控制模块704的一个或多个控制器的逻辑集成在同一模具上以形成片上***(SoC)。

在各个实施例中，***700可以但不限于是：浏览器、工作站、台式计算设备或移动计算设备(例如，膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中，***700可具有更多或更少的组件和/或不同的架构。例如，在一些实施例中，***700包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。

其中，如果显示器包括触摸面板，显示屏可以被实现为触屏显示器，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。

本申请实施例还提供了一种非易失性可读存储介质，该存储介质中存储有一个或多个模块(programs)，该一个或多个模块被应用在终端设备时，可以使得该终端设备执行本申请实施例中各方法步骤的指令(instructions)。

在一个示例中提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如本申请实施例的方法。

在一个示例中还提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如本申请实施例的一个或多个的方法。

本申请实施例公开了一种图片识别方法和装置，示例1包括一种图片识别方法，包括：

提取所述内容信息中信息元素的特征数据；

示例2可包括示例1所述的方法，其中，所述根据所述特征数据以及差异数据，确定所述内容信息的特征类型包括：

示例3可包括示例1和/或示例2所述的方法，其中，在所述以所述信息元素的特征数据作为输入，根据特征值识别模型，确定所述信息元素的特征值之前，所述方法还包括：

示例4可包括示例1-示例3一个或多个所述的方法，其中，所述内容信息包括文本信息元素，所述特征数据包括描述信息，所述根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据包括：

示例5可包括示例1-示例4一个或多个所述的方法，其中，所述根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据包括：

示例6可包括示例1-示例5一个或多个所述的方法，其中，所述根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据包括：

根据所述特征数据，对多个图片信息元素进行聚类；

示例7可包括示例1-示例6一个或多个所述的方法，其中，在所述提取所述内容信息中信息元素的特征数据之前，所述方法还包括：

将所述关联信息添加到所述内容信息中。

示例8可包括示例1-示例7一个或多个所述的方法，其中，所述关联信息包括图片信息元素，在所述查找所述内容信息的关联信息之前，所述方法还包括：

示例9可包括示例1-示例8一个或多个所述的方法，其中，所述内容信息包括评论内容信息、视频内容信息中至少一种。

示例10可包括示例1-示例6一个或多个所述的方法，其中，所述内容信息为视频内容信息时，在所述提取所述内容信息中信息元素的特征数据之前，所述方法还包括：

示例11包括一种图片识别装置，包括：

示例12可包括示例11所述的装置，其中，所述类型确定模块包括：

示例13可包括示例11和/或示例12所述的装置，其中，所述装置还包括：

示例14可包括示例11-示例13一个或多个所述的装置，其中，所述内容信息包括文本信息元素，所述特征数据包括描述信息，所述差异确定模块包括：

示例15可包括示例11-示例14一个或多个所述的装置，其中，所述差异确定模块包括：

示例16可包括示例11-示例15一个或多个所述的装置，其中，所述差异确定模块包括：

示例17可包括示例11-示例16一个或多个所述的装置，其中，所述装置还包括：

添加模块，用于将所述关联信息添加到所述内容信息中。

示例18可包括示例11-示例17一个或多个所述的装置，其中，所述关联信息包括图片信息元素，所述装置还包括：

示例19可包括示例11-示例18一个或多个所述的装置，其中，所述内容信息包括评论内容信息、视频内容信息中至少一种。

示例20可包括示例11-示例19一个或多个所述的装置，其中，所述内容信息为视频内容信息时，所述装置还包括：

示例21包括一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如示例1-10一个或多个的方法。

示例22包括一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如示例1-10一个或多个的方法。

虽然某些实施例是以说明和描述为目的的，各种各样的替代、和/或、等效的实施方案、或计算来达到同样的目的实施例示出和描述的实现，不脱离本申请的实施范围。本申请旨在覆盖本文讨论的实施例的任何修改或变化。因此，显然本文描述的实施例仅由权利要求和它们的等同物来限定。

Claims

1.一种图片识别方法，其特征在于，包括：

提取所述内容信息中信息元素的特征数据；

2.根据权利要求1所述的方法，其特征在于，所述根据所述特征数据以及差异数据，确定所述内容信息的特征类型包括：

3.根据权利要求2所述的方法，其特征在于，在所述以所述信息元素的特征数据作为输入，根据特征值识别模型，确定所述信息元素的特征值之前，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述内容信息包括文本信息元素，所述特征数据包括描述信息，所述根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述特征数据，确定所述图片信息元素和其他的信息元素之间的差异数据包括：

根据所述特征数据，对多个图片信息元素进行聚类；

7.根据权利要求1所述的方法，其特征在于，在所述提取所述内容信息中信息元素的特征数据之前，所述方法还包括：

将所述关联信息添加到所述内容信息中。

8.根据权利要求7所述的方法，其特征在于，所述关联信息包括图片信息元素，在所述查找所述内容信息的关联信息之前，所述方法还包括：

9.根据权利要求1所述的方法，其特征在于，所述内容信息包括评论内容信息、视频内容信息中至少一种。

10.根据权利要求1所述的方法，其特征在于，所述内容信息为视频内容信息时，在所述提取所述内容信息中信息元素的特征数据之前，所述方法还包括：

11.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-10一个或多个的方法。

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-10一个或多个的方法。