CN109299460B

CN109299460B - 分析店铺的评价数据的方法、装置、电子设备及存储介质

Info

Publication number: CN109299460B
Application number: CN201811089947.9A
Authority: CN
Inventors: 朱静雅; 朱青祥
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2018-09-18
Filing date: 2018-09-18
Publication date: 2022-07-12
Anticipated expiration: 2038-09-18
Also published as: CN109299460A

Abstract

本申请提供一种分析店铺的评价数据方法、装置、电子设备及可读存储介质，以提高预测单个评价文本表征店铺具有个性化特征的概率。所述方法包括：获得店铺的多个样本评价文本，每个所述样本评价文本携带标记，该标记表示单个所述样本评价文本是否表征所述店铺具有个性化特征；将所述店铺的历史评价文本输入用于预测单个评价文本表征所述店铺具有所述个性化特征的概率的评价文本分析模型，以确定所述历史评价文本表征所述店铺具有所述个性化特征的概率，所述历史评价文本不同于所述样本评价文本，其中，所述评价文本分析模型是以多个所述样本评价文本为输入对第一预设模型进行训练所得到的模型。

Description

分析店铺的评价数据的方法、装置、电子设备及存储介质

技术领域

本申请涉及数据处理技术领域，尤其涉及一种分析店铺的评价数据的方法、装置、电子设备及可读存储介质。

背景技术

随着社会经济的发展，越来越多的店铺出现在人们的日常生活中。消费者在面对众多的店铺时，往往希望能够发现更有个性化特征的店铺，例如：提供独家菜品的店铺、由智能机器人提供服务的店铺、店面装修环境独特的店铺、店主是明星的店铺、某个明星经常光临的店铺等。消费者在决定是否去一家店铺消费时，通常会参考曾经去过该店铺的顾客对该店铺做出的评价，以获知该店铺是否具有个性化特征。

以个性化特征为店主是明星为例，相关技术中，通过对曾经去过同一店铺的多个顾客做出的评价文本分别进行分析，采用关键词匹配的方法预测该店铺的店主是明星的概率。示例地，通过判断评价文本中是否包含有“老板是明星”的描述，预测店铺的店主是明星的概率。

然而，一方面，相关技术中关键词的数量有限，匹配过程中采用的关键词不可能覆盖所有含义等同的描述，由此导致某些评价文本根本未参与匹配或者匹配结果错误；另一方面，相关技术采用的关键词匹配的方法较为简单，存在较大的匹配误差，可靠性不足。

发明内容

本申请提供一种分析店铺的评价数据方法、装置、电子设备及可读存储介质，以提高预测单个评价文本表征店铺具有个性化特征的概率。

本申请实施例第一方面提供了一种分析店铺的评价数据的方法，所述方法包括：

获得店铺的多个样本评价文本，每个所述样本评价文本携带标记，该标记表示单个所述样本评价文本是否表征所述店铺具有个性化特征；

将所述店铺的历史评价文本输入用于预测单个评价文本表征所述店铺具有所述个性化特征的概率的评价文本分析模型，以确定所述历史评价文本表征所述店铺具有所述个性化特征的概率，所述历史评价文本不同于所述样本评价文本，

其中，所述评价文本分析模型是以多个所述样本评价文本为输入对第一预设模型进行训练所得到的模型。

可选地，所述历史评价文本的数量是多个；将所述店铺的历史评价文本输入所述评价文本分析模型，以确定所述历史评价文本表征所述店铺具有所述个性化特征的概率，包括：

将多个所述历史评价文本分别输入用于预测单个评价文本表征所述店铺具有所述个性化特征的概率的评价文本分析模型，以确定每个所述历史评价文本表征所述店铺具有所述个性化特征的概率；

统计多个所述历史评价文本中对应的概率大于预设概率阈值的历史评价文本的总数量；

在所述总数量大于第一预设数量的条件下，确定所述店铺具有所述个性化特征。

可选地，所述个性化特征包括人名；所述方法还包括：

获得特征模板文本，每个特征模板文本包含人名数据库中的人名；

将多个所述历史评价文本分别与所述特征模板文本进行对比，以确定每个所述历史评价文本是否包含所述人名；

在包含所述人名的历史评价文本的数量大于第二预设数量的条件下，建立所述店铺与所述人名之间的关联关系。

可选地，所述方法还包括：

以多个样本人名文本为输入，对第二预设模型进行训练，得到人名扩展模型，所述人名扩展模型用于基于参考人名扩展与所述参考人名相关联的其他人名；

将预设人名输入所述人名扩展模型，以得到多个与所述预设人名相关联的其他人名，所述人名数据库包括多个相互关联的人名。

可选地，所述个性化特征包括人名；所述方法还包括：

对所述店铺的多个历史评价图像进行人脸识别，以确定每个所述历史评价图像是否包含所述人名对应的人脸特征；

在包含所述人名对应的人脸特征的历史评价图像的数量大于第三预设数量的条件下，建立所述店铺与所述人名之间的关联关系。

可选地，所述方法还包括：

获得多个样本图像，每个所述样本图像携带标记，该标记表征单个所述样本图像是否包含所述人名对应的人脸特征；

以多个所述样本图像为输入，对第三预设模型进行训练，得到人脸识别模型，所述人脸识别模型用于识别图像是否包含所述人名对应的人脸特征；

对所述店铺的多个历史评价图像进行人脸识别，包括：

将所述店铺的多个历史评价图像分别输入所述人脸识别模型。

可选地，在建立所述店铺与所述人名之间的关联关系之后，在所述总数量大于第一预设数量的条件下，确定所述店铺具有所述个性化特征，包括：

在所述总数量大于所述第一预设数量的条件下，确定所述店铺具有与所述人名相关联的个性化特征。

本申请实施例第二方面提供一种分析店铺的评价数据的装置，所述装置包括：

第一获得模块，用于获得店铺的多个样本评价文本，每个所述样本评价文本携带标记，该标记表示单个所述样本评价文本是否表征所述店铺具有个性化特征；

确定模块，用于将所述店铺的历史评价文本输入用于预测单个评价文本表征所述店铺具有所述个性化特征的概率的评价文本分析模型，以确定所述历史评价文本表征所述店铺具有所述个性化特征的概率，所述历史评价文本不同于所述样本评价文本，

可选地，所述历史评价文本的数量是多个；所述确定模块包括：

输入子模块，用于将多个所述历史评价文本分别输入所述评价文本分析模型，以确定每个所述历史评价文本表征所述店铺具有所述个性化特征的概率；

统计子模块，用于统计多个所述历史评价文本中对应的概率大于预设概率阈值的历史评价文本的总数量；

第一确定子模块，用于在所述总数量大于第一预设数量的条件下，确定所述店铺具有所述个性化特征。

可选地，所述个性化特征包括人名；所述装置还包括：

第二获得模块，用于获得特征模板文本，每个特征模板文本包含人名数据库中的人名；

对比模块，用于将多个所述历史评价文本分别与所述特征模板文本进行对比，以确定每个所述历史评价文本是否包含所述人名；

第一建立模块，用于在包含所述人名的历史评价文本的数量大于第二预设数量的条件下，建立所述店铺与所述人名之间的关联关系。

可选地，所述装置还包括：

第二训练模块，用于以多个样本人名文本为输入，对第二预设模型进行训练，得到人名扩展模型，所述人名扩展模型用于基于参考人名扩展与所述参考人名相关联的其他人名；

输入模块，用于将预设人名输入所述人名扩展模型，以得到多个与所述预设人名相关联的其他人名，所述人名数据库包括多个相互关联的人名。

可选地，所述个性化特征包括人名；所述装置还包括：

识别模块，用于对所述店铺的多个历史评价图像进行人脸识别，以确定每个所述历史评价图像是否包含所述人名对应的人脸特征；

第二建立模块，用于在包含所述人名对应的人脸特征的历史评价图像的数量大于第三预设数量的条件下，建立所述店铺与所述人名之间的关联关系。

可选地，所述装置还包括：

第三获得模块，用于获得多个样本图像，每个所述样本图像携带标记，该标记表征单个所述样本图像是否包含所述人名对应的人脸特征；

第三训练模块，用于以多个所述样本图像为输入，对第三预设模型进行训练，得到人脸识别模型，所述人脸识别模型用于识别图像是否包含所述人名对应的人脸特征；

所述识别模块包括：

识别子模块，用于将所述店铺的多个历史评价图像分别输入所述人脸识别模型。

可选地，所述确定模块包括：

第二确定子模块，用于在所述总数量大于所述第一预设数量的条件下，确定所述店铺具有与所述人名相关联的个性化特征。

本申请实施例第三方面提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请第一方面所述的方法中的步骤。

本申请实施例第四方面提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现本申请第一方面所述的方法的步骤。

采用本申请实施例提供的分析店铺的评价数据的方法，由于评价文本分析模型的训练基础来源于已标记的样本评价文本，而已标记的样本评价文本对应的概率是准确的(如果一个样本评价文本表征店铺具有个性化特征，则相当于该样本评价文本对应的概率为100％；如果一个样本评价文本表征店铺不具有个性化特征，则相当于该样本评价文本对应的概率为0％)，所以基于已标记的样本评价文本得到的评价文本分析模型是可靠的，准确度较高。因而，采用评价文本分析模型预测单个评价文本表征店铺具有个性化特征的概率，可靠度较高、准确度较高。

附图说明

为了更清楚地说明本申请各个实施例的技术方案，下面将对本申请各个实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例提出的分析店铺的评价数据的方法的流程图；

图2是本申请另一实施例提供的分析店铺的评价数据的方法的流程图；

图3是本申请一实施例提供的确定人名的方法的流程图；

图4是本申请另一实施例提供的确定人名的方法的流程图；

图5是本申请另一实施例提供的确定人名的方法的流程图；

图6是本申请另一实施例提供的分析店铺的评价数据的方法的流程图；

图7是本申请另一实施例提供的分析店铺的评价数据的方法的示意图；

图8是本申请一实施例提供的分析店铺的评价数据的装置的示意图。

具体实施方式

下面将结合本申请各个实施例中的附图，对本申请各个实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的各个实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

参考图1，图1是本申请一实施例提出的分析店铺的评价数据的方法的流程图。如图1所示，该方法包括以下步骤：

步骤S11：获得店铺的多个样本评价文本，每个所述样本评价文本携带标记，该标记表示单个所述样本评价文本是否表征所述店铺具有个性化特征。

在本申请的各个实施例中，个性化特征特征可以是店铺提供的用于吸引顾客的个性化特征特征，例如：提供独家菜品、由智能机器人提供服务、店面装修环境独特、店主是明星、某个明星经常光临该店铺等。

在本申请的各个实施例中，店铺的评价数据是顾客对店铺进行评价而生成的数据，包括但不限于评价文本和评价图像。其中，评价文本即为顾客对该店铺进行评价的文本，而评价图像即为顾客拍摄的该店铺的图像。

在本申请的各个实施例中，历史评价文本是相对于样本评价文本而言的，如未特别区分说明，评价文本与历史评价文本含义等同。同理，历史评价图像是相对于样本评价图像而言的，如未特别区分说明，评价图像与历史评价图像含义等同。

在本申请的一个实施例中，通过对店铺的评价文本进行分析，确定单个评价文本表征店铺具有个性化特征的概率。下面对如何确定单个评价文本表征店铺具有个性化特征的概率，进行说明。

通常情况下，店铺的顾客众多，因而店铺的评价文本数量众多。将其中一部分作为样本评价文本，将剩余的一部分作为历史评价文本。首先，针对每个样本评价文本，根据该样本评价文本是否表征店铺具有个性化特征，对该样本评价文本进行标记。标记过程可以由人工完成，即人工判断该样本评价文本是否描述了该店铺具有个性化特征，进而对该样本评价文本进行标记，使得该样本评价文本携带标记。示例地，一个样本评价文本是：这家店的老板是明星，则该样本评价文本的标记是：是；另一个样本评价文本是：这家店没有明星来过，则该样本评价文本的标记是：否。

按照上述过程对每个样本评价文本进行标记，进而得到多个携带标记的样本评价文本。

步骤S12：将所述店铺的历史评价文本输入用于预测单个评价文本表征所述店铺具有所述个性化特征的概率的评价文本分析模型，以确定所述历史评价文本表征所述店铺具有所述个性化特征的概率，所述历史评价文本不同于所述样本评价文本，

在一种实施方式中，得到评价文本分析模型的实施方式有且不限于以下实施方式：

以多个所述样本评价文本为输入，对第一预设模型进行训练，得到评价文本分析模型，所述评价文本分析模型用于预测单个评价文本表征所述店铺具有所述个性化特征的概率。

其中，第一预设模型是用于进行文本分类的模型，在一种实施方式中，第一预设模型可以是基于深度学习的文本分类模型，例如TextCNN+softmax模型，其中TextCNN具有自动提取文本特征的功能，softmax用于文本分类，需要对softmax进行训练，使得训练后的softmax具有预测单个评价文本表征店铺具有个性化特征的概率的功能。

在另一种实施方式中，第一预设模型也可以是贝叶斯、SVM(Support VectorMachine，支持向量机)、xgboost(eXtreme Gradient Boosting)等分类器。在此种实施方式中，首先需要采用TF-IDF(Term Frequency–Inverse Document Frequency，词频-逆向文件频率)或统计词频等方式提取特征，然后对上述分类器进行训练，使得训练后的上述分类器具有预测单个评价文本表征店铺具有个性化特征的概率的功能。

在实际实施过程中，在得到多个携带标记的样本评价文本之后，考虑到第一预设模型对输入的文本长度的要求，首先对执行步骤S11后得到的各个携带标记的样本评价文本进行分词(分词是一种对文本进行词组拆分的操作，具体可参考相关技术中关于分词的说明)，对分词后的各个携带标记的样本评价文本进行特征提取(例如通过上述CNN进行特征提取，或者通过TF-IDF或统计词频等方式进行特征提取)，然后将提取的特征输入到分类器(例如：softmax、贝叶斯、SVM、xgboost)进行训练，直到训练后的第一预设模型具有预测单个评价文本表征店铺具有个性化特征的概率的功能，该训练后的第一预设模型即为评价文本分析模型。

在得到评价文本模型后，针对店铺的单个评价文本，例如：任一历史评价文本，即可将该单个评价文本输入评价文本分析模型，通过该评价文本分析模型预测该评价文本表征店铺具有个性化特征的概率。

在该实施例中，由于评价文本分析模型的训练基础来源于已标记的样本评价文本，而已标记的样本评价文本对应的概率是准确的(如果一个样本评价文本表征店铺具有个性化特征，则相当于该样本评价文本对应的概率为100％；如果一个样本评价文本表征店铺不具有个性化特征，则相当于该样本评价文本对应的概率为0％)，所以基于已标记的样本评价文本得到的评价文本分析模型是可靠的，准确度较高。因而，采用评价文本分析模型预测的概率是可靠的，准确度较高。

结合上述实施例，在本申请的另一个实施例中，通过对多个评价文本进行分析，确定店铺是否具有该个性化特征。参考图2，图2是本申请另一实施例提供的分析店铺的评价数据的方法的流程图。如图2所示，该方法除包括步骤S11-步骤S12外，还包括以下步骤：

步骤S13：将多个所述历史评价文本分别输入所述评价文本分析模型，以确定每个所述历史评价文本表征所述店铺具有所述个性化特征的概率；

步骤S14：统计多个所述历史评价文本中对应的概率大于预设概率阈值的历史评价文本的总数量；

步骤S15：在所述总数量大于第一预设数量的条件下，确定所述店铺具有所述个性化特征。

在本实施例中，预设概率阈值是预先设定的概率值，如果一个历史评价文本对应的概率大于预设概率阈值，则该历史评价文本表征店铺具有个性化特征，例如：预设概率阈值为0.5。第一预设数量也是预先设定的数值，如果有足够多(数量大于第一预设数量)的历史评价文本表征店铺具有个性化特征，则确定店铺具有个性化特征。

具体地，考虑到历史评价文本的数量是多个，针对每个历史评价文本，首先，将该历史评价文本输入评价文本分析模型，得到该历史评价文本表征店铺具有个性化特征的概率。对其他历史评价文本进行相同的处理，进而得到每个历史评价文本表征店铺具有个性化特征的概率。然后，将多个历史评价文本各自对应的概率分别与预设概率阈值进行比较，从中筛选出对应的概率阈值大于预设概率阈值的历史评价文本，即筛选出表征店铺具有个性化特征的历史评价文本。接着，统计对应的概率阈值大于预设概率阈值的历史评价文本的数量，如果该数量大于第一预设数量，则确定店铺具有个性化特征。

在该实施例中，基于店铺的众多顾客的评价文本，通过评价文本模型，实时感知店铺是否具有个性化特征，提供了一种高效且准确的个性化特征预测方法。

在本申请另一实施例中，个性化特征包括人名，例如：明星的名字。相应的个性化特征为：店主是某个明星，或者某个明星经常光临一个店铺。由于明星带来的商业效益日益凸显，通常粉丝为了支持明星，会去该明星经营的店铺消费。或者，明星经常去一家店铺，粉丝为了遇见明星，也会去该店铺消费。因而，在个性化特征包括人名的场景下，有必要明确该人名具体是什么。为此本申请提供了两种实施例，在一种实施例中，根据对评价文本的分析，确定人名是什么。在另一种实施例中，根据对评价图像的分析，确定人名是什么。可以理解的是，上述确定店铺是否具有个性化特征的实施例，与此处确定人名是什么的实施例可以分别独立实施，也可以是在实施确定店铺是否具有个性化特征的实施例之后，如果店铺具有个性化特征且个性化特征保护人名，再实施此处的确定人名是什么的实施例，本申请不做限定。下面对如何根据评价文本确定人名是什么，进行说明。

参考图3，图3是本申请一实施例提供的确定人名的方法的流程图。如图3所示，该方法包括以下步骤：

步骤S31：获得特征模板文本，每个特征模板文本包含人名数据库中的人名；

步骤S32：将多个所述历史评价文本分别与所述特征模板文本进行对比，以确定每个所述历史评价文本是否包含所述人名；

步骤S33：在包含所述人名的历史评价文本的数量大于第二预设数量的条件下，建立所述店铺与所述人名之间的关联关系。

在一种实施方式中，如图3所示，上述人名数据库通过以下步骤得到：

步骤S30a：以多个样本人名文本为输入，对第二预设模型进行训练，得到人名扩展模型，所述人名扩展模型用于基于参考人名扩展与所述参考人名相关联的其他人名；

步骤S30b：将预设人名输入所述人名扩展模型，以得到多个与所述预设人名相关联的其他人名，所述人名数据库包括多个相互关联的人名。

在本实施例中，通过将评价文本中的人名与人名数据库中各个人名进行对比，确定个性化特征包含的人名是什么。其中，人名数据库可以是预先设定的或者预先从其他数据存储设备中获取的，也可以是按照以下方式得到：

首先，获得多个样本人名文本，每个样本人名文本可以是预先标记的可以作为样本的人名文本，标记过程可以由人工完成，即人工判断某一人名文本是否可以作为样本，如果该人名文本可以作为样本，则对该人名文本进行标记，并作为样本人名文本。以人名数据库是明星名字库为例，人工判断某一人名文本是否是明星的名字，如果该人名文本是明星的名字，则对其进行标记，该人名文本作为样本人名文本。反复执行上述过程，直到得到多个样本评价文本。

然后，将多个样本评价文本输入第二预设模型，第二预设模型是用于寻找相似词组的模型，例如，第二预设模型可以是word2vec模型。对第二预设模型进行训练，直到训练后的第二预设模型具有基于其中一个样本评价文本扩展出其他样本评价文本的功能，该训练后的第二预设模型即为人名扩展模型。

接着，将预设人名(或者称为种子词)输入人名扩展模型，以得到多个与预设人名相关联的其他人名，多个相互关联的人名即组成人名数据库。以得到名人名字库为例，种子词为诸葛亮，将诸葛亮这个人名输入人名扩展模型，即可得到与诸葛亮相关联的名字：刘备、关羽等，基本均为名人的名字，如此，通过将不同的名人名字输入人名扩展模型，扩充名人名字库。

采用此种实施方式得到人名数据库的更新速度较快，实时将所有相关的人名归入人名数据库，数据库中的人名较为全面，在将顾客的评价文本与人名数据库中的人名对比的过程中，不易遗漏未归入人名数据库中的人名，提高了人名确定方法的可靠度和准确度。

在得到人名数据库后，将人名数据库中的各个人名添加到模板文本中，得到特征模板文本，例如：“xx是老板”“xxx的店”等，其中，xx可以是人名数据库中的任一人名。

针对每个历史评价文本，首先，将该历史评价文本与特征模板文本进行对比，确定该历史评价文本是否包含特征评价文本中的人名。对其他历史评价文本进行相同的处理，进而得到每个历史评价文本是否包含特征评价文本中的人名。然后，统计包含特征模板文本中的人名的历史评价文本的数量，如果该数量大于第二预设数量，则建立店铺与特征模板文本中的人名之间的关联关系。示例地，如果100个历史评价文本中有80个历史评价文本包括店主是特定名人的表述，则可以建立店铺与特定名人之间的关联关系。

其中，第二预设数量也是预先设定的数值，如果有足够多(数量大于第二预设数量)的历史评价文本包含特征模板文本中的人名，则确定店铺与该人名具有关联关系。

下面对如何根据评价图像确定人名是什么，进行说明。

参考图4，图4是本申请另一实施例提供的确定人名的方法的流程图。如图4所示，该方法包括以下步骤：

步骤S41：对所述店铺的多个历史评价图像进行人脸识别，以确定每个所述历史评价图像是否包含所述人名对应的人脸特征；

步骤S42：在包含所述人名对应的人脸特征的历史评价图像的数量大于第三预设数量的条件下，建立所述店铺与所述人名之间的关联关系。

在一种实施方式中，如图5所示，图5是本申请另一实施例提供的确定人名的方法的流程图。图5中，步骤S41中的人脸识别通过以下步骤实现：

步骤S40a：获得多个样本图像，每个所述样本图像携带标记，该标记表征单个所述样本图像是否包含所述人名对应的人脸特征；

步骤S40b：以多个所述样本图像为输入，对第三预设模型进行训练，得到人脸识别模型，所述人脸识别模型用于识别图像是否包含所述人名对应的人脸特征；

步骤S41’：将所述店铺的多个历史评价图像分别输入所述人脸识别模型。

在本实施例中，通过对评价图像进行人脸识别，确定评价图像是否包含个性化特征包含的人名对应的人脸特征(为描述方便，下文简称目标人脸特征)。示例地，个性化特征为店主是特定名人，则个性化特征中人名对应的人脸特征(即目标人脸特征)为特定名人的人脸特征。其中，对评价图像进行人脸识别可以参考相关技术实现，也可以首先按照如下方式获得人脸识别模型，然后将评价图像输入人脸识别模型实现人脸识别。其中，人脸识别模型可以是按照以下方式得到：

首先，获得多个携带标记的样本图像。与店铺的评价文本类似，通常情况下，店铺的顾客众多，因而店铺的评价图像数量众多。将其中一部分作为样本图像，将剩余的一部分作为历史评价图像。或者，将其他人物图库(例如：新闻资讯中的人物图片集)作为样本图像，将所有的评价图像作为历史评价图像。首先，针对每个样本图像，根据该样本图像是否包含个性化特征中人名对应的人脸特征(示例地，个性化特征为店主是特定名人，则个性化特征中人名对应的人脸特征为该特定名人的人脸特征)，对该样本图像进行标记。标记过程可以由人工完成，即人工判断该样本图像是否包含个性化特征中人名对应的人脸特征(为描述方便，简称目标人脸特征)，进而对该样本图像进行标记。示例地，一个样本图像包含目标人脸特征，则在该样图像中圈出目标人脸特征组成的图像；另一个样本图像不包含目标人脸特征，则对该样本图像画叉。

按照上述过程对每个样本图像进行标记，进而得到多个携带标记的样本图像。

然后，将多个携带标记的样本图像输入第三预设模型进行训练，直到训练后的第三预设模型具有人脸识别的功能，该训练后的第三预设模型即为人脸识别模型。其中，第三预设模型是用于图像处理的模型，例如：GoogleNet，ResNet等深度学习网络，或者VGGNET)。

由于人脸识别模型的训练基础来源于携带标记的样本图像，而携带标记的样本图像对应的概率是准确的(如果一个样本图像包括目标人脸特征，则相当于该样本图像对应的概率为100％；如果一个样本图像不包括目标人脸特征，则相当于该样本图像对应的概率为0％)，所以基于携带标记的样本图像得到的训练后的图像处理模型是可靠的，准确度较高。因而，采用训练后的图像处理模型是可靠的，准确度较高。在采用人脸识别模型对评价图像进行人脸识别时，可以根据人脸识别的准确度需求设置阈值，如果训练后的图像处理模型预测的概率大于该阈值，则确定该评价图像包含目标人脸特征。

本实施例中，针对每个历史评价图像，首先，通过上述人脸识别模型后或者采用相关技术中的人脸识别方法，对该历史评价图像进行人脸识别，确定该历史评价图像是否包含目标人脸特征。对其他历史评价图像进行相同的处理，进而得到每个历史评价图像是否包含目标人脸特征。然后，统计包含目标人脸特征的历史评价图像的数量，如果该数量大于第三预设数量，则建立店铺与目标人脸特征对应的人名之间的关联关系。示例地，如果100个历史评价图像中有80个历史评价图像包括特定名人的人脸特征，则可以建立店铺与特定名人之间的关联关系。

其中，第三预设数量也是预先设定的数值，如果有足够多(数量大于第三预设数量)的历史评价图像包含特征模板文本中的人名，则确定店铺与该人名具有关联关系。

如上文所述，一方面，通过本申请一些实施例，确定店铺是否具有个性化特征。另一方面，在个性化特征包含人名的情况下，通过本申请另一些实施例确定人名是什么，进而建立了店铺与人名的关联关系。则针对店铺具有个性化特征且个性化特征包含人名的情况下，在执行上述两方面所涉及的实施例之后，可以明确店铺具有的个性化特征具体是什么。参考图6，图6是本申请另一实施例提供的分析店铺的评价数据的方法的流程图。如图6所示，该方法包括上述步骤S11-步骤S14、步骤S31-步骤S33或步骤S41-步骤S42以及步骤S15’：

步骤S15’：在所述总数量大于所述第一预设数量的条件下，确定所述店铺具有与所述人名相关联的个性化特征。

在本实施例中，通过店铺评价文本可以确定店铺是否具有个性化特征，在确定店铺具有个性化特征之后，如果该个性化特征包括人名，则可以进一步确定店铺与该人名是否具有关联关系，如果进一步确定店铺与该人名有关联关系，则可以最终确定店铺具有与该人名相关联的个性化特征。

示例地，通过执行上述步骤S11-步骤S15，对店铺评价文本的分析，确定店铺具有个性化特征，且个性化特征为：店主是明星。然后执行上述步骤S31-步骤S33或步骤S41-步骤S42，确定与店铺关联的明星的名字，假设该名字为特定名人的名字。最后，执行步骤S16’，确定店铺的个性化特征是：店主是该特定名人。

在实际实施过程中，步骤S31-步骤S33或步骤S41-步骤S42可以择一执行，即通过对评价文本分析确定人名是什么，或者通过对评价图像分析确定人名是什么。当然，也可以分别执行步骤S31-步骤S33或步骤S41-步骤S42，如果两种实施方式得到的人名不一致，则比较包含人名的历史评价文本的数量与包含该人名对应的人脸特征的历史评价图像的数量，如果包含人名的历史评价文本的数量较大，则以通过对历史评价文本分析得到的人名为准，如果包含该人名对应的人脸特征的历史评价图像的数量较大，则以通过对历史评价图像分析得到的人名为准。此外，分别执行步骤S31-步骤S33或步骤S41-步骤S42，也可以实现两种实施方式得到的人名的相互验证，提高确定人名的准确度和可靠度。

下面以一个示例说明本申请各实施例提供的分析店铺的评价数据的方法。参考图7，图7是本申请另一实施例提供的分析店铺的评价数据的方法的示意图。如图7所示，该方法包括以下步骤：

1)针对单个样本评价文本，标注其是否为名人开店相关的描述(是或者否)，对多个样本评价文本进行相同处理，得到多个样本评价文本；

2)对多个样本评价文本分别进行分词；

3)将分词后的样本评价文本输入基于深度学习的文本模型(TextCNN)，对该模型进行训练，得到评价文本分析模型；

4)针对每个历史评价文本，将该历史评价文本输入评价文本分析模型，得到其包含“名人开店”的概率，其中，概率>0.5表示其为明星开店的描述。对多个历史评价文本进行相同处理，得到该店铺的概率>0.5的历史评价文本的总次数；

5)将历史评价文本中的人名作为样本人名文本，输入到word2vec模型，对其进行训练，得到人名扩展模型；

6)将种子词(如“诸葛亮”等名人)输入到人名扩展模型，通过人名扩展模型寻找其相似词(与诸葛亮相似的也基本均为名人，“刘备”“关羽”等)，构成名人名字库；

7)针对每个历史评价文本，将该历史评价文本与包含名人名字库中任一名字的模板文本进行模式串匹配识别(诸如“xx是老板”“xx的店”等，其中，xx可以是名人名字库中任一名字)，确认该历史评价文本所描述的具体的名人，对多个历史评价文本进行相同处理，确认与该店铺关联的名人；

8)针对单个样本评价图像，标注其是否包含名人的人脸特征，对多个样本评价图像进行相同处理，得到多个样本评价图像；

9)将多个样本评价图像输入VGGnet模型，对该模型进行训练，得到人脸识别模型；

10)针对每个历史评价图像，通过上述人脸识别模型识别该历史评价图像中的名人，对多个历史评价图像进行相同处理，确认与该店铺关联的名人。

通过执行以上步骤，分别从评价文本中获取了具体的名人，和包含名人开店相关描述的评价文本的总次数，并通过评价图像结合人脸识别技术获得了评价图像中包含的名人。如此，累计获取了每个店铺关联的具体的名人和包含名人开店相关描述的评价文本的总次数。最后，针对关联了具体名人名字的店铺，且其关于该名人开店相关描述的评价文本的总次数大于预设次数(例如3次)的，确定该店铺的个性化特征是：店主是该名人。

基于同一发明构思，本申请一实施例提供一种分析店铺的评价数据的装置。参考图8，图8是本申请一实施例提供的分析店铺的评价数据的装置的示意图。如图8所示，该装置包括：

第一获得模块801，用于获得店铺的多个样本评价文本，每个所述样本评价文本携带标记，该标记表示单个所述样本评价文本是否表征所述店铺具有个性化特征；

确定模块802，用于将所述店铺的历史评价文本输入用于预测单个评价文本表征所述店铺具有所述个性化特征的概率的评价文本分析模型，以确定所述历史评价文本表征所述店铺具有所述个性化特征的概率，所述历史评价文本不同于所述样本评价文本，

可选地，所述个性化特征包括人名；所述装置还包括：

可选地，所述装置还包括：

可选地，所述个性化特征包括人名；所述装置还包括：

可选地，所述装置还包括：

所述识别模块包括：

可选地，所述确定模块包括：

基于同一发明构思，本申请另一实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请上述任一实施例所述的方法中的步骤。

基于同一发明构思，本申请另一实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现本申请上述任一实施例所述的方法中的步骤。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种分析店铺的评价数据的方法、装置、存储介质和电子设备，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种分析店铺的评价数据的方法，其特征在于，所述方法包括：

将所述店铺的多个历史评价文本分别输入用于预测单个评价文本表征所述店铺具有所述个性化特征的概率的评价文本分析模型，以确定所述历史评价文本表征所述店铺具有所述个性化特征的概率，所述历史评价文本不同于所述样本评价文本，其中，所述评价文本分析模型是以多个所述样本评价文本为输入对第一预设模型进行训练所得到的模型；

统计多个所述历史评价文本中对应的概率大于预设概率阈值的历史评价文本的总数量；在所述总数量大于第一预设数量的条件下，确定所述店铺具有所述个性化特征。

2.根据权利要求1所述的方法，其特征在于，所述个性化特征包括人名；所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述个性化特征包括人名；所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

对所述店铺的多个历史评价图像进行人脸识别，包括：

6.根据权利要求2-5任一所述的方法，其特征在于，在建立所述店铺与所述人名之间的关联关系之后，在所述总数量大于第一预设数量的条件下，确定所述店铺具有所述个性化特征，包括：

7.一种分析店铺的评价数据的装置，其特征在于，所述装置包括：

确定模块，用于将所述店铺的多个历史评价文本分别输入用于预测单个评价文本表征所述店铺具有所述个性化特征的概率的评价文本分析模型，以确定所述历史评价文本表征所述店铺具有所述个性化特征的概率，还用于统计多个所述历史评价文本中对应的概率大于预设概率阈值的历史评价文本的总数量，在所述总数量大于第一预设数量的条件下，确定所述店铺具有所述个性化特征；其中，所述历史评价文本不同于所述样本评价文本；所述评价文本分析模型是以多个所述样本评价文本为输入对第一预设模型进行训练所得到的模型。

8.根据权利要求7所述的装置，其特征在于，所述个性化特征包括人名；所述装置还包括：

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

10.根据权利要求7所述的装置，其特征在于，所述个性化特征包括人名；所述装置还包括：

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

所述识别模块包括：

12.根据权利要求8-11任一所述的装置，其特征在于，所述确定模块包括：

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-6任一所述的方法中的步骤。

14.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行时实现如权利要求1-6任一所述的方法的步骤。