CN109684531A - 一种对用户评价进行情感分析的方法和装置 - Google Patents
一种对用户评价进行情感分析的方法和装置 Download PDFInfo
- Publication number
- CN109684531A CN109684531A CN201811565927.4A CN201811565927A CN109684531A CN 109684531 A CN109684531 A CN 109684531A CN 201811565927 A CN201811565927 A CN 201811565927A CN 109684531 A CN109684531 A CN 109684531A
- Authority
- CN
- China
- Prior art keywords
- product
- module
- user
- popular
- contrast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及情感分析技术领域,尤其是一种对用户评价进行情感分析的方法,包括以下步骤:建立网络数据库,利用搜索引擎检索用户对产品的评论页面总数;根据具体的观测数据从市场竞争的产品中筛选出热门的对比产品;获取网络用户热门的评论,抓取搜索引擎检索结果的摘要,将检索的结果摘要数据储存用于抽取热门比对产品的比较句;抽取并筛选合格比较句;利用特征计分结合情感词典计算热门对比产品在不同特征下的数据分值;本发明利用基于比较句数目的热门指数和差距指数筛选热门对比产品,能更好地识别竞争产品以及判断竞争产品的用户情感取向;本发明通过对比关系反映出的用户情感倾向具有更高的可信度。
Description
技术领域
本发明涉及情感分析技术领域,尤其涉及一种对用户评价进行情感分析的方法和装置。
背景技术
随着计算机技术和网络技术的飞速发展,互联网(Internet)在人们的日常生活、学习和工作中发挥的作用也越来越大,而且随着移动互联网的发展,互联网也在向移动化发展,用户通常会在互联网上对各种新闻、产品或服务等做出自己的主观评论,对产品的评价通常带有丰富的情感色彩和主观性,对这些评论中的用户情感进行分析,是实现智能和情景搜索的一个重要维度;
情感分析在当今互联网的各种产品中,起着越来越重要的作用。例如:随着SNS尤其微博的发展,很多企业的微博上进行产品推广和用户反馈收集,那么对这些用户反馈的自动情感分析,将有助于商家对产品的改进,另外,互联网舆论监控和舆情控制越来越重要,例如在热门敏感的新闻,微博事件中,用户的评论是否违反了相关法律,是否不利社会和谐,通过相应算法的自动情感分析和舆情监测,能有效地实现网络舆论的监管;
以往的情感分析研究多基于用户评论语句,而非比较句,有的研究通过机器学习的方法建立分类器以判断评论的有效性,也有研究通过分析商品评论中的用户情感倾向,统计不同用户在同一件商品上的额情感倾向,以此进行反应,然而用户的情感具有主观形,针对同一事物,不同的个体会有不同的情感表达,单独分析不同用户的情感倾向得出的结论不够客观。
发明内容
本发明的目的在于提供一种对用户评价进行情感分析的方法和装置,以解决上述背景技术中提出的问题。
为了实现上述目的,本发明采用了如下技术方案:
设计一种对用户评价进行情感分析的方法,包括以下步骤:
步骤一、建立网络数据库,利用搜索引擎检索用户对产品的评论页面总数;
步骤二、根据具体的观测数据从市场竞争的产品中筛选出热门的对比产品;
步骤三、获取网络用户热门的评论,抓取搜索引擎检索结果的摘要,将检索的结果摘要数据储存用于抽取热门比对产品的比较句;
步骤四、抽取并筛选合格比较句;
S1、将获取的摘要进行分句、分词、产品词替换、比较词替换,将每个分句中的产品词进行统一的比较;
S2、使用规则匹配方法抽取热对比产品的比较句,并将结果进行储存;
S3、筛选出符合语义且包含产品特征对比关系的比较句;
步骤五、利用特征计分结合情感词典计算热门对比产品在不同特征下的数据分值;
步骤六、利用可视化分析对产品特征分值作图,可视化其特征对比关系,分析产品的优劣。
优选的,步骤三中,筛选出的热门对比产品为检索词。
优选的,步骤五中,将不同的产品特征进行分类。
优选的,包括网络用户数据库、处理***和属性***,所述网络用户数据库包括网络用户评论模块、抓取模块和情感词典储存模块,所述处理***包括筛选热门对比模块,所述对比评论模块依次与对比评论模块、筛选比较句模块、特征分析模块和竞争性分析结论储存模块电路连接,所述属性***包括市场竞争资料库,所述市场竞争资料库依次与产品特征模块和分类模块电路连接;
所述网络用户评论模块与筛选热门对比模块电路连接;
所述抓取模块与对比评论数据模块电路连接;
所述特征分析模块分别与情感词典储存模块和分类模块电路连接。
本发明提出的一种,有益效果在于:
1、本发明利用基于比较句数目的热门指数和差距指数筛选热门对比产品,从比较句中抽取特征并根据情感词典计算竞争产品的特征得分,能更好地识别竞争产品以及判断竞争产品的用户情感取向;
2、本发明通过对比关系反映出的用户情感倾向具有更高的可信度,对于文本的挖掘,网络用户情感分析具有非常重要的价值。
附图说明
图1为本发明原理结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例1,参照图1,一种对用户评价进行情感分析的方法,包括以下步骤:
步骤一、建立网络数据库,利用搜索引擎检索用户对产品的评论页面总数;
步骤二、根据具体的观测数据从市场竞争的产品中筛选出热门的对比产品;
步骤三、获取网络用户热门的评论,抓取搜索引擎检索结果的摘要,将检索的结果摘要数据储存用于抽取热门比对产品的比较句,筛选出的热门对比产品为检索词;
步骤四、抽取并筛选合格比较句;
S1、将获取的摘要进行分句、分词、产品词替换、比较词替换,将每个分句中的产品词进行统一的比较;
S2、使用规则匹配方法抽取热对比产品的比较句,并将结果进行储存;
S3、筛选出符合语义且包含产品特征对比关系的比较句;
步骤五、利用特征计分结合情感词典计算热门对比产品在不同特征下的数据分值,将不同的产品特征进行分类;
步骤六、利用可视化分析对产品特征分值作图,可视化其特征对比关系,分析产品的优劣。
一种对用户评价进行情感分析的装置,包括网络用户数据库、处理***和属性***,所述网络用户数据库包括网络用户评论模块、抓取模块和情感词典储存模块,所述处理***包括筛选热门对比模块,所述对比评论模块依次与对比评论模块、筛选比较句模块、特征分析模块和竞争性分析结论储存模块电路连接,所述属性***包括市场竞争资料库,所述市场竞争资料库依次与产品特征模块和分类模块电路连接;
所述网络用户评论模块与筛选热门对比模块电路连接;
所述抓取模块与对比评论数据模块电路连接;
所述特征分析模块分别与情感词典储存模块和分类模块电路连接。
在另一个实施例中,本文步骤四、抽取并筛选合格比较句的替换方案;
S1、采用CRF算法识别句子中的实体对象;
S2、实体对象的位置信息将作为比较句识别分类算法的一个特征,选取了SVM算法作为分类器;
S3、对比较结果进行抽取,进一步对比较句进行分类;
S4、筛选出符合语义且包含产品特征对比关系的比较句。
利用CRF算法识别出实体对象,然后增加实体对象的信息作为特征,显著提高了比较句识别的准确率。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (4)
1.一种对用户评价进行情感分析的方法,其特征在于:包括以下步骤:
步骤一、建立网络数据库,利用搜索引擎检索用户对产品的评论页面总数;
步骤二、根据具体的观测数据从市场竞争的产品中筛选出热门的对比产品;
步骤三、获取网络用户热门的评论,抓取搜索引擎检索结果的摘要,将检索的结果摘要数据储存用于抽取热门比对产品的比较句;
步骤四、抽取并筛选合格比较句;
S1、将获取的摘要进行分句、分词、产品词替换、比较词替换,将每个分句中的产品词进行统一的比较;
S2、使用规则匹配方法抽取热对比产品的比较句,并将结果进行储存;
S3、筛选出符合语义且包含产品特征对比关系的比较句;
步骤五、利用特征计分结合情感词典计算热门对比产品在不同特征下的数据分值;
步骤六、利用可视化分析对产品特征分值作图,可视化其特征对比关系,分析产品的优劣。
2.根据权利要求1所述的一种对用户评价进行情感分析的方法,其特征在于:步骤三中,筛选出的热门对比产品为检索词。
3.根据权利要求1所述的一种对用户评价进行情感分析的方法,其特征在于:步骤五中,将不同的产品特征进行分类。
4.根据权利要求1所述的一种对用户评价进行情感分析的装置,其特征在于:包括网络用户数据库、处理***和属性***,所述网络用户数据库包括网络用户评论模块、抓取模块和情感词典储存模块,所述处理***包括筛选热门对比模块,所述对比评论模块依次与对比评论模块、筛选比较句模块、特征分析模块和竞争性分析结论储存模块电路连接,所述属性***包括市场竞争资料库,所述市场竞争资料库依次与产品特征模块和分类模块电路连接;
所述网络用户评论模块与筛选热门对比模块电路连接;
所述抓取模块与对比评论数据模块电路连接;
所述特征分析模块分别与情感词典储存模块和分类模块电路连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811565927.4A CN109684531A (zh) | 2018-12-20 | 2018-12-20 | 一种对用户评价进行情感分析的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811565927.4A CN109684531A (zh) | 2018-12-20 | 2018-12-20 | 一种对用户评价进行情感分析的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109684531A true CN109684531A (zh) | 2019-04-26 |
Family
ID=66188362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811565927.4A Pending CN109684531A (zh) | 2018-12-20 | 2018-12-20 | 一种对用户评价进行情感分析的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109684531A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443646A (zh) * | 2019-07-30 | 2019-11-12 | 合肥工业大学 | 产品竞争关系网络分析方法和*** |
CN113420122A (zh) * | 2021-06-24 | 2021-09-21 | 平安科技(深圳)有限公司 | 分析文本的方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455562A (zh) * | 2013-08-13 | 2013-12-18 | 西安建筑科技大学 | 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器 |
WO2017051425A1 (en) * | 2015-09-23 | 2017-03-30 | Devanathan Giridhari | A computer-implemented method and system for analyzing and evaluating user reviews |
-
2018
- 2018-12-20 CN CN201811565927.4A patent/CN109684531A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455562A (zh) * | 2013-08-13 | 2013-12-18 | 西安建筑科技大学 | 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器 |
WO2017051425A1 (en) * | 2015-09-23 | 2017-03-30 | Devanathan Giridhari | A computer-implemented method and system for analyzing and evaluating user reviews |
Non-Patent Citations (1)
Title |
---|
彭浩等: "基于比较句的网络用户评论情感分析", 《现代图书情报技术》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443646A (zh) * | 2019-07-30 | 2019-11-12 | 合肥工业大学 | 产品竞争关系网络分析方法和*** |
CN110443646B (zh) * | 2019-07-30 | 2022-04-19 | 合肥工业大学 | 产品竞争关系网络分析方法和*** |
CN113420122A (zh) * | 2021-06-24 | 2021-09-21 | 平安科技(深圳)有限公司 | 分析文本的方法、装置、设备及存储介质 |
CN113420122B (zh) * | 2021-06-24 | 2024-06-04 | 平安科技(深圳)有限公司 | 分析文本的方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI518528B (zh) | Method, apparatus and system for identifying target words | |
CN105653444A (zh) | 基于互联网日志数据的软件缺陷故障识别方法和*** | |
CN106156372B (zh) | 一种互联网网站的分类方法及装置 | |
CN108230085A (zh) | 一种基于用户评论的商品评价***及方法 | |
TW201115370A (en) | Systems and methods for capturing and managing collective social intelligence information | |
Briliani et al. | Hate speech detection in indonesian language on instagram comment section using K-nearest neighbor classification method | |
KR20120108095A (ko) | 소셜 데이터 분석 시스템 | |
CN112488716B (zh) | 一种异常事件检测*** | |
CN107943514A (zh) | 一种软件文档中核心代码元素的挖掘方法及*** | |
CN106537387B (zh) | 检索/存储与事件相关联的图像 | |
Rastogi et al. | Effective opinion spam detection: A study on review metadata versus content | |
Urolagin | Text mining of tweet for sentiment classification and association with stock prices | |
CN106681989A (zh) | 一种预测微博转发概率的方法 | |
Suciati et al. | Twitter buzzer detection for Indonesian presidential election | |
Ghankutkar et al. | Modelling machine learning for analysing crime news | |
CN109684531A (zh) | 一种对用户评价进行情感分析的方法和装置 | |
TW201640383A (zh) | 網路事件自動蒐集分析方法及系統 | |
JP2009157450A (ja) | メール分類システム、メール検索システム、メール宛先分類システム | |
CN112200260B (zh) | 一种基于丢弃损失函数的人物属性识别方法 | |
CN110209811A (zh) | 一种商品自动分类方法及*** | |
Saha et al. | The corporeality of infotainment on fans feedback towards sports comment employing convolutional long-short term neural network | |
Dumitru et al. | Fake and Hyper-partisan News Identification. | |
Wang et al. | Twiinsight: Discovering topics and sentiments from social media datasets | |
Shah et al. | Cyber-bullying detection in hinglish languages using machine learning | |
TW202234285A (zh) | 對話資料處理系統、其方法及電腦可讀媒介 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |