CN116860969A - 一种客户评论分析方法、***、设备及介质 - Google Patents

一种客户评论分析方法、***、设备及介质 Download PDF

Info

Publication number
CN116860969A
CN116860969A CN202310812427.0A CN202310812427A CN116860969A CN 116860969 A CN116860969 A CN 116860969A CN 202310812427 A CN202310812427 A CN 202310812427A CN 116860969 A CN116860969 A CN 116860969A
Authority
CN
China
Prior art keywords
intermediate data
emotion
target
keywords
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310812427.0A
Other languages
English (en)
Inventor
韩纯子
赵海兴
赵子墨
蒋晓晨
申传旺
邱阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Original Assignee
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chaozhou Zhuoshu Big Data Industry Development Co Ltd filed Critical Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority to CN202310812427.0A priority Critical patent/CN116860969A/zh
Publication of CN116860969A publication Critical patent/CN116860969A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种客户评论分析方法、***、设备及介质,其中方法包括:获取目标评论数据,对目标评论数据进行预处理,以得到中间数据及中间数据对应的词向量;对中间数据进行关键词提取,以得到中间数据对应的关键词;基于关键词对应的词向量,对关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对中间数据进行情感特征分析,以得到中间数据中与各关键词相关的情感特征值;基于情感特征值,以及关键词提取聚类,确定目标产品对应的产品属性权重评分。研发者可快速、全面的了解客户对产品的总体评价,可总结出客户对产品提出的建议与意见,可根据分析出的情感特征来总结客户对产品需求的趋向,来研发新的更符合大众需求的产品。

Description

一种客户评论分析方法、***、设备及介质
技术领域
本申请涉及自然语言处理领域,具体涉及一种客户评论分析方法、***、设备及介质。
背景技术
近年来,随着各种软件应用的多样化发展,用户对软件的内容和功能要求越来越高,而研发人员获取用户对产品的意见与建议最主要途径就是用户的评论反馈。随着社交媒体在网络上的***性增长(例如,评论,论坛讨论,博客,微博,Twiter,评论和社交网站上的帖子),个人和组织越来越多地使用这些媒体中的内容进行决策。如今,如果想购买一种消费产品,不再局限于向朋友和家人征求意见,因为在Web上的公共论坛上有很多关于该产品的用户评论和讨论,对于组织而言,可能不再需要进行问卷,民意调查和焦点小组采收集公众意见,因为有大量此类信息可以公开获得。然而,由于各种网站的激增,在网上寻找和监测意见网站并从中提取信息仍然是一项艰巨的任务。每个网站通常都包含大的观点文太,而在冗长的博客和论坛帖子中,这些文本并不总是容易被解读。一般的人举违者很难识别相关的网站,并提取和总结其中的观点。因此需要自动化的情绪分析***。
但是通过研发人员或客户经理逐条阅读分析评论反馈,以此获取用户的意见及建议,过于依赖于个人偏好及研发经验,且效率较低。
发明内容
为了解决上述问题,本申请提出了一种方法、设备及介质,其中方法包括:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
在一个示例中,所述对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量,具体包括:基于预设停用词表,对所述目标评论数据进行去停用词操作,以得到第一中间数据;通过正则表达式删除所述第一中间数据中的符号数据,以得到第二中间数据;所述符号数据包括错误符号以及网络表情中的至少一种;通过基于变压器的双向编码器表达,提取所述第二中间数据的主干信息,并将索引长度标准化;使用Bert嵌入层抽取所述主干信息中的词序列,并将所述词序列转化为所述词向量。
在一个示例中,所述关键词提取并聚类,具体包括:基于文档主题生成模型,提取所述中间数据对应的关键词;基于所述关键词分别对应的词向量,确定所述关键词之间的相似度;基于所述关键词之间的相似度,对所述关键词进行聚类操作,以得到第一数量个关键词提取聚类。
在一个示例中,所述情感特征分析,具体包括:确定预设的情感词典、预设否定词表以及预设程度副词表;基于所述中间数据中的情感词,确定所述中间数据对应的情感分数;基于所述中间数据中所述情感词前的否定词以及程度副词,确定所述情感分数对应的情感极性;基于所述情感极性以及所述情感分数,确定所述中间数据对应的情感特征值分析。
在一个示例中,所述基于预设情感词典,对所述中间数据进行情感特征分析之前,所述方法还包括:将Opinion Lexicon情感词典作为初始情感词典;使用情感倾向点互信息算法对所述初始情感词典进行扩充,以得到所述预设情感词典。
在一个示例中,,所述基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分,具体包括:确定目标产品属性对应的目标关键词提取聚类;确定所述目标关键词提取聚类中所包含的目标关键词,以及包含所述目标关键词的目标中间数据;获取所述目标中间数据对应的情感特征值,并通过如下公式,确定所述目标关键词提取聚类对应的聚类权重评分:
其中,R为聚类权重评分,n为目标关键词提取聚类中包含的目标关键词个数,ui为目标关键词提取聚类中第i个目标关键词对应的情感特征值,ti为ui对应的时间修正系数,与目标中间数据对应的评论发布时间相关;将所述目标产品属性中各目标关键词提取聚类分别对应的聚类权重评分加权,以得到所述产品属性权重评分。
在一个示例中,所述确定目标产品对应的产品属性权重评分之后,所述方法还包括:获取所述目标产品对应的全部目标产品属性;并基于所述全部目标产品属性分别对应的产品属性权重评分,确定所述目标产品对应的产品调研报告;将所述产品调研报告通过报表格式,呈现给工作人员。
本申请还提供了一种客户评论分析***,包括:预处理模块,获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;关键词提取模块,对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;聚类模块,基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;情感分析模块,基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;权重评分模块,基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
本申请还提供了一种客户评论分析设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行:获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
本申请还提供了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
通过本申请提出的方法能够带来如下有益效果:研发者可快速、全面的了解客户对产品的总体评价,可总结出客户对产品提出的建议与意见,可根据分析出的情感特征来总结客户对产品需求的趋向,来研发新的更符合大众需求的产品。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中一种客户评论分析方法的流程示意图;
图2为本申请实施例中一种客户评论分析***的模块示意图;
图3为本申请实施例中一种客户评论分析设备的机构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本说明书一个或多个实施例提供的一种客户评论分析方法的流程示意图。该方法可以应用于不同类型的产品,比如,互联网金融产品、电商产品、即时通讯产品、游戏产品、公务产品等。该流程可以由相应领域的计算设备(比如,支付业务对应的风控服务器或者智能移动终端等)执行,流程中的某些输入参数或者中间结果允许人工干预调节,以帮助提高准确性。
本申请实施例涉及的分析方法的实现可以为终端设备,也可以为服务器,本申请对此不作特殊限制。为了方便理解和描述,以下实施例均以服务器为例进行详细描述。
需要说明的是,该服务器可以是单独的一台设备,可以是由多台设备组成的***,即,分布式服务器,本申请对此不做具体限定。
如图1所示,本申请实施例提供一种客户评论分析方法,包括:
S101:获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量。
首先获取与目标产品相关的目标评论数据,并对目标评论数据进行预处理,从而得到中间数据以及与中间数据对应的词向量。这里的中间数据指的是经过清洗、去停用词等操作后剩余的评论数据。
在一个实施例中,上述目标评论数据可以预先存储在计算机设备的存储装置中,当需要对目标产品的评论数据进行分析时,计算机设备可以从存储装置中选取目标评论数据。当然,计算机设备还可以从其它外部设备中获取该目标评论数据。比如,将目标评论数据存储在云端,当需要目标产品的评论数据进行分析时,计算机设备可以从云端获取目标评论数据,本实施例对目标评论数据的获取方式不做限定。
在一个实施例中,在进行预处理时,首先需要基于预设停用词表,对目标评论数据进行去停用词操作,以得到第一中间数据,然后可通过正则表达式删除第一中间数据中的符号数据,以得到第二中间数据,这里的符号数据包括错误符号以及网络表情等符号数据。然后通过基于变压器的双向编码器表达,提取第二中间数据的主干信息,以得到中间数据,将索引长度标准化后,使用Bert嵌入层抽取主干信息中的词序列,并将词序列转化为词向量。
S102:对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词。
S103:基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类。
在一个实施例中,在进行关键词提取并进行聚类时,可以基于文档主题生成模型,提取中间数据对应的关键词,然后基于关键词分别对应的词向量,确定关键词之间的相似度,最后基于关键词之间的相似度,对关键词进行聚类操作,以得到第一数量个关键词提取聚类。
S104:基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值。
在一个实施例中,在进行情感特征值分析时,首先确定预设的情感词典、预设否定词表以及预设程度副词表,然后基于中间数据中的情感词,确定中间数据对应的情感分数,然后基于中间数据中情感词前的否定词以及程度副词,确定情感分数对应的情感极性,最后基于情感极性以及情感分数,确定中间数据对应的情感特征值分析。最后得到的情感特征值有正负之分,分数越高月趋近于正面,分数越低越趋近于负面。
在一个实施例中,将Opinion Lexicon情感词典作为初始情感词典,并使用情感倾向点互信息算法对初始情感词典进行扩充,以得到预设情感词典。
S105:基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
在一个实施例中,在确定产品属性对应的权重评分时,首先要确定需要进行评估的产品属性,如食物产品的产品属性可以是包装属性、味道属性、外观属性等。然后确定目标产品属性对应的目标关键词提取聚类,如味道属性下可以对应有口感、酸甜等关键词提取聚类,然后确定目标关键词提取聚类中所包含的目标关键词,以及包含目标关键词的目标中间数据。需要说明的是,这里跌目标关键词提取聚类指的是目标产品属性所对应的全部关键词提取聚类,目标关键词指的是某一目标关键提取聚类中的全部关键词,目标中间数据指的是某一目标关键词所对应的全部中间数据。然后获取目标中间数据对应的情感特征值,并通过如下公式,确定目标关键词提取聚类对应的聚类权重评分:
其中,R为聚类权重评分,n为目标关键词提取聚类中包含的目标关键词个数,ui为目标关键词提取聚类中第i个目标关键词对应的情感特征值,ti为ui对应的时间修正系数,与目标中间数据对应的评论发布时间相关。可以理解地,越是邻近当前时间节点的评论数据,对目标产品的分析影响比重越大,因此此处引入时间修正系数。最后,将目标产品属性中各目标关键词提取聚类分别对应的聚类权重评分加权,即可得到产品属性权重评分。
在一个实施例中,在得到了目标产品各产品属性的权重评分之后,为了更加方便工作人员对目标产品的产品属性进行分析,可以生成目标产品的调研报告,具体地,首先需要获取目标产品对应的全部目标产品属性,并基于全部目标产品属性分别对应的产品属性权重评分,确定目标产品对应的产品调研报告,最后将产品调研报告通过报表格式,呈现给工作人员。
如图2所示,本申请实施例还提供了一种客户评论分析***,包括:
预处理模块201,获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量。
关键词提取模块202,对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词。
聚类模块203,基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类。
情感分析模块204,基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值。
权重评分模块205,基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
如图3所示,本申请实施例还提供了一种客户评论分析设备,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
本申请实施例还提供了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(trans itory med i a),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种客户评论分析方法,其特征在于,包括:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;
对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;
基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;
基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;
基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量,具体包括:
基于预设停用词表,对所述目标评论数据进行去停用词操作,以得到第一中间数据;
通过正则表达式删除所述第一中间数据中的符号数据,以得到第二中间数据;所述符号数据包括错误符号以及网络表情中的至少一种;
通过基于变压器的双向编码器表达,提取所述第二中间数据的主干信息,并将索引长度标准化;
使用Bert嵌入层抽取所述主干信息中的词序列,并将所述词序列转化为所述词向量。
3.根据权利要求1所述的方法,其特征在于,所述关键词提取并聚类,具体包括:
基于文档主题生成模型,提取所述中间数据对应的关键词;
基于所述关键词分别对应的词向量,确定所述关键词之间的相似度;
基于所述关键词之间的相似度,对所述关键词进行聚类操作,以得到第一数量个关键词提取聚类。
4.根据权利要求1所述的方法,其特征在于,所述情感特征分析,具体包括:
确定预设的情感词典、预设否定词表以及预设程度副词表;
基于所述中间数据中的情感词,确定所述中间数据对应的情感分数;
基于所述中间数据中所述情感词前的否定词以及程度副词,确定所述情感分数对应的情感极性;
基于所述情感极性以及所述情感分数,确定所述中间数据对应的情感特征值分析。
5.根据权利要求1所述的方法,其特征在于,所述基于预设情感词典,对所述中间数据进行情感特征分析之前,所述方法还包括:
将Opinion Lexicon情感词典作为初始情感词典;
使用情感倾向点互信息算法对所述初始情感词典进行扩充,以得到所述预设情感词典。
6.根据权利要求1所述的方法,其特征在于,所述基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分,具体包括:
确定目标产品属性对应的目标关键词提取聚类;
确定所述目标关键词提取聚类中所包含的目标关键词,以及包含所述目标关键词的目标中间数据;
获取所述目标中间数据对应的情感特征值,并通过如下公式,确定所述目标关键词提取聚类对应的聚类权重评分:
其中,R为聚类权重评分,n为目标关键词提取聚类中包含的目标关键词个数,ui为目标关键词提取聚类中第i个目标关键词对应的情感特征值,ti为ui对应的时间修正系数,与目标中间数据对应的评论发布时间相关;
将所述目标产品属性中各目标关键词提取聚类分别对应的聚类权重评分加权,以得到所述产品属性权重评分。
7.根据权利要求6所述的方法,其特征在于,所述确定目标产品对应的产品属性权重评分之后,所述方法还包括:
获取所述目标产品对应的全部目标产品属性;
并基于所述全部目标产品属性分别对应的产品属性权重评分,确定所述目标产品对应的产品调研报告;
将所述产品调研报告通过报表格式,呈现给工作人员。
8.一种客户评论分析***,其特征在于,包括:
预处理模块,获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;
关键词提取模块,对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;
聚类模块,基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;
情感分析模块,基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;
权重评分模块,基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
9.一种客户评论分析设备,其特征在于,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;
对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;
基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;
基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;
基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
10.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:
获取目标评论数据,对所述目标评论数据进行预处理,以得到中间数据及所述中间数据对应的词向量;
对所述中间数据进行关键词提取,以得到所述中间数据对应的关键词;
基于所述关键词对应的词向量,对所述关键词进行聚类,以得到关键词提取聚类;
基于预设情感词典,对所述中间数据进行情感特征分析,以得到所述中间数据中与各关键词相关的情感特征值;
基于所述情感特征值,以及所述关键词提取聚类,确定目标产品对应的产品属性权重评分。
CN202310812427.0A 2023-07-03 2023-07-03 一种客户评论分析方法、***、设备及介质 Pending CN116860969A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310812427.0A CN116860969A (zh) 2023-07-03 2023-07-03 一种客户评论分析方法、***、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310812427.0A CN116860969A (zh) 2023-07-03 2023-07-03 一种客户评论分析方法、***、设备及介质

Publications (1)

Publication Number Publication Date
CN116860969A true CN116860969A (zh) 2023-10-10

Family

ID=88235253

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310812427.0A Pending CN116860969A (zh) 2023-07-03 2023-07-03 一种客户评论分析方法、***、设备及介质

Country Status (1)

Country Link
CN (1) CN116860969A (zh)

Similar Documents

Publication Publication Date Title
US9514405B2 (en) Scoring concept terms using a deep network
US9449271B2 (en) Classifying resources using a deep network
US9576075B2 (en) Context aware query selection
CN111324784B (zh) 一种字符串处理方法及装置
CN105989040B (zh) 智能问答的方法、装置及***
US10762150B2 (en) Searching method and searching apparatus based on neural network and search engine
US8719025B2 (en) Contextual voice query dilation to improve spoken web searching
US10073839B2 (en) Electronically based thesaurus querying documents while leveraging context sensitivity
US10706359B2 (en) Method and system for generating predictive models for scoring and prioritizing leads
CN106708871B (zh) 一种社交业务特征用户的识别方法和装置
CN111143551A (zh) 文本预处理方法、分类方法、装置及设备
CN110795613B (zh) 商品搜索方法、装置、***及电子设备
CN117688155A (zh) 业务问题的回复方法、装置、存储介质以及电子设备
CN110825954A (zh) 关键词推荐方法、装置和电子设备
CN107038193B (zh) 一种文本信息的处理方法和装置
CN116522912A (zh) 一种包装设计语言模型的训练方法、装置、介质及设备
US11966440B2 (en) Metadata tag identification
Ali et al. Identifying and Profiling User Interest over time using Social Data
CN106971306B (zh) 产品问题的识别方法及***
CN113076450B (zh) 一种目标推荐列表的确定方法和装置
CN116860969A (zh) 一种客户评论分析方法、***、设备及介质
CN111783453B (zh) 文本的情感信息处理方法及装置
CN112434126B (zh) 一种信息处理方法、装置、设备和存储介质
US10896461B2 (en) Method and apparatus for data mining based on users' search behavior
CN110019771B (zh) 文本处理的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination