CN104731770A - 基于规则和统计模型的中文微博情感分析方法 - Google Patents
基于规则和统计模型的中文微博情感分析方法 Download PDFInfo
- Publication number
- CN104731770A CN104731770A CN201510127310.4A CN201510127310A CN104731770A CN 104731770 A CN104731770 A CN 104731770A CN 201510127310 A CN201510127310 A CN 201510127310A CN 104731770 A CN104731770 A CN 104731770A
- Authority
- CN
- China
- Prior art keywords
- emotion
- sentence
- word
- participle
- microblogging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种基于规则和统计模型的中文微博情感分析方法,利用规则挖掘和统计模型,对中文微博进行情感分析,并通过基于中文微博文本对微博进行情感分类的方法,将微博文本分类为正面情感、负面情感和中性情感,进一步将微博划分为喜好、愤怒、悲伤、恐惧、厌恶、惊讶和平静七类情感。通过情感划分,可以直观的显示出微博文本的情感倾向,而对微博文本情感倾向的研究可以延伸到各领域,具有广泛的应用前景。
Description
技术领域
本发明涉及中文文本情感分析领域,特别是涉及一种基于规则和统计模型的中文微博情感分析方法。
背景技术
随着信息技术的不断发展,互联网的普及利用,各种终端设备记录了人类社会复杂频繁的信息行为,从而产生了惊人的数据量。据国际数据公司(IDC)的研究报告预测,到2020 年,全球将拥有35ZB(1ZB=10 亿TB)的数据量。微博作为近年来最热门的新型社交媒体和信息交流平台,亦贡献了海量的数据。仅就新浪微博来说,其数据中心发布的2014年用户发展报告显示,截止2014年9月30日,新浪微博月活跃用户数(MAU)已经达到1.67亿人,较去年同期增长36%,日活跃用户也已达到7660万人。每秒钟数以千计的新微博发布数量,是人们交流想法,表达情感的一种重要体现。用户通过微博发布的信息中包含着不同趋向的情感特征,深度分析这些特征对于舆情监控、市场营销、谣言控制都有着重要意义。
由于微博的内容极其简洁,一般控制在140个中文字符内,所以表达的信息有限。用户也可以随时发布微博,发布的内容也是各种各样,用户可以抒发当时的情绪,也可以对某热点话题表达自己的观点,亦可发表对影视作品的评论等等,所以,将微博进行情感分类就显得尤为必要。由于微博文本较短,同时伴有话题、表情符号等等,因此需要用特殊的方式进行分类。
发明内容
本发明主要解决的技术问题是提供一种基于规则和统计模型的中文微博情感分析方法,将微博文本分类为正面情感、负面情感和中性情感,而对微博的情感分析并不止于此,通过对微博文本的深入分析,进一步将微博划分为喜好、愤怒、悲伤、恐惧、厌恶、惊讶和平静七类情感。通过情感的进一步划分,可以直观的显示出微博文本的情感倾向,而对微博文本情感倾向的研究可以延伸到各领域,具有广泛的应用前景。
为解决上述技术问题,本发明采用的一个技术方案是:
提供一种基于规则和统计模型的中文微博情感分析方法,其包括:
步骤一:文本预处理及观点句识别,即针对每个句子,首先判断出该条句子观点句还是非观点句;
步骤二:情感极性分析,即在情感词典的基础上,对观点句进行分词处理,从而抽取词语特征,构建SVM模型,对观点句进行情感极性分类;
步骤三:情感划分,即在情感极性判断基础上,将观点句进行具体的情感划分。
在本发明一个较佳实施例中,所述情感极性包括正面情感(Pos),负面情感(Neg)和中性情感(NEUTRAL)。
在本发明一个较佳实施例中,所述文本预处理及观点句识别的具体步骤包括:
预处理:
(1.1)对微博语料进行预处理,删除无意义微博,所述无意义微博包括垃圾微博文本和广告营销微博文本;
(1.2)删除微博中的话题标签,即去除“#”和其间的文字内容,得到预处理语料;
(1.3)创建主观词词典,并标注主观词的词性;
观点句判断:
(2.1)对预处理语料进行分词并标注词性,进行句子分词和特征提取,构建特征分类模型;
(2.2)将分词语句与主观词词典进行匹配,并判断主观词是否为动词词性;
(2.3)如果主观词为动词词性,则在分词语句的前后找代词和情感词;
(2.4)在分词语句中寻找名词或名词短语,如果出现名词或名词短语,则判定该分词语句为观点句;
(2.5)如果没有出现名词或名词短语,并且满足步骤(2.3)和步骤(2.4)的要求,则直接判定该分词语句为非观点句。
在本发明一个较佳实施例中,所述情感极性分析的具体步骤包括:
创建或引用对照词典,并对对照词典中的词语进行情感极性标注;
创建网络用语词典和表情符号词典,并对词典中的词语进行情感极性标注;
对观点句进行分词,获得极性分词;
采用十折交叉验证法,将极性分词投入特征分类模型中进行训练,得到极性分词的情感极性,其中,60%的极性分词用来作训练集,40%的极性分词作测试集;
根据极性分词的情感极性,得到观点句的情感极性。
在本发明一个较佳实施例中,所述情感极性标注包括正面评价词语、负面评价词语、负面情感词语、正面情感词语、程度级别词语以及主张词语。
在本发明一个较佳实施例中,所述情感划分的具体步骤包括:
创建和收集语料库,所述语料库包括教材、科学杂志、期刊、报纸,童话故事和文学名著;
对语料进行情感标注,创建语料库的标注体系,即对每一个待标注的语料进行情感信息的填充和集合;
将微博语料逐句切割成分类句,并将分类句放入语句解析器中,语句解析器将会对句子的情感复杂程度进行分类;
提取分类好的分类句的语义特征,并对语义特征进行解析;
将解析结果传到条件随机场CRFs,利用语料库计算微博语料中每个分类句表示的情感色彩,得到文章的情感链;
对情感链进行分析评估;
根据情感链的分析评估结果和观点句的情感极性,得出最终情感划分。
在本发明一个较佳实施例中,所述对情感链进行分析评估的具体步骤包括:采用多句互相影响联合评估法对语料进行情感划分;采用共现的多元情感在语料标注中匹配的准确率来衡量情感标注的连贯性。
在本发明一个较佳实施例中,所述采用多句互相影响联合评估法对语料进行情感划分的具体步骤包括:对每个分类句进行情感评估;判断分类句之间的情感联系,即上下文的联系以及语法语义之间的联系;在表达情感及句意相似或相同的基础上进行多句互相影响联合评估。
本发明的有益效果是:对中文微博进行情感分析,利用中文微博文本对微博进行情感分类的方法,可以直观的显示出微博文本的情感倾向,而对微博文本情感倾向的研究可以延伸到各领域,具有广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
图1是本发明的步骤文本预处理及观点句识别的流程示意图;
图2是本发明的步骤情感极性分析的流程示意图;
图3是本发明的步骤情感划分的流程示意图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1-3,本发明实施例包括:
一种基于规则和统计模型的中文微博情感分析方法,步骤包括:
一、语料预处理及观点句识别
将微博语料进行预处理,删除垃圾微博和广告营销微博文本等无意义微博,具体可以参考贝叶斯垃圾邮件过滤算法,本发明中所用到的垃圾微博过滤方法是在贝叶斯垃圾邮件过滤算法基础上的设计,主要做法是构建无意义微博词语词库,设置门槛值为0.9,当概率大于等于0.9时判断出这是一条无意义微博。
删除微博中的话题标签,即去除“#”和其间的文字内容。
然后进行语料分词和词性标注,进行特征提取,构建分类模型,判断是否为观点句。
观点句判断算法如下:
步骤一:将词语与主观词语词典进行匹配,并判断该词词性是否为动词。
步骤二:在主观词(动词词性)的前后找代词和情感词。
步骤三:在句子中寻找名词或名词短语,如果出现则不过滤。如果没有出现,并且满足第一二两条则直接判定为非观点句。
二、情感极性分析
此步骤的关键是需要一个完整且正确的对照词典,本发明采用知网中文词库(HowNet)作为对照词典,有3730 个表示正面评价的词语、3116 个表示负面评价的词语、1254 个表示负面情感的词语、836 个表示正面情感的词语、 219个表示程度级别的词语以及 38 个表示主张的词语,具体词语例子见表1。
表1 HowNet词库词语示例
由于微博中流行着大量的网络用语,所以总结来源于百度的网络用语,补充了网络用语词典,同时,表情符号作为微博上最直接能够表达用户情感的特色符号,也作为了情感极性分析的一部分,所以本发明也构建了表情符号词典。
通常情感词的极性被定量地表示为一个在区间[-1, 1]中的值。如果极性值大于 0,说明词语的情感极性为正面(褒义);如果极性值小于 0,说明词语的情感极性为负面(贬义)。极性值的绝对值代表情感词的情感强度。
情感极性分析具体操作步骤如下:
步骤一:对微博语料进行预处理。
步骤二:识别观点句。
步骤三:对观点句进行分词。
步骤四:将数据投入 SVM 向量机中进行训练。训练测试采用十折交叉验证,60%用来作训练集,40%作测试集。
三、情感划分
首先进行语料库收集,语料库收集必须坚持范围广,题材丰富,科学合理的原则,本发明所采用的语料库包括中学语文教材,科学杂志、期刊,***,童话故事和文学名著。
然后,进行语料标注,语料库的标注体系就是指对语料的加工程度,即一个待标注的单元需要填充的信息集合。标注体系决定了语料标注的粒度。语料力度要粗细得当,避免粒度过粗和划分过细的情况出现。
最后,对情感进行划分,采用多句互相影响联合评估法进行情感划分,此方法的灵感来源于BLEU评测方法,采用共现的多元情感在标准标注中匹配的准确率来衡量情感标注的连贯性。
具体实施案例
下面对本发明做进一步的详细说明,使本领域的研究人员更好的理解和实施本发明的方案方法。
(1)整理HowNet词典,构建表情符词典和网络用语词典。综合以上词典,构建完整词典库,用与情感极性分析。同时需要单独构建主观词语词典和否定词词典,主观词语词典包含常用的可表示主观意愿及想法的动词,如:喜欢、愿意、肯定、期望、可以、相信、感到等62个词语,用于观点句识别。否定词词典主要包括现实生活中常用的否定词,如:不打头的词语不可以、不能、不想等,没打头的词语没有、没能等,否打头的词语如否定等,以及含有非、无的词语总计46个词语。
(2)对微博语料进行观点句识别,去除非观点句,进行数据预处理。
(3)对提取的观点句分词处理,从而进行特征选取,并对非情感极性相关句子进行过滤。
(4)计算情感词权重,构建情感极性分类器。
计算情感词权重公式如公式1-1所示:
公式1-1
其中 表示情感词的情感值,表示程度副词的作用系数,表示否定副词的作用系数,表示情感词的权重, 表示表情符号的权重。
公式1-2
公式1-2中,C计算出包含n个词语情感值的微博文本情感值,当C的值大于0时表示该条微博表达正面情感,等于0为中性情感,小于0则为负面情感。
本发明所采用的数据来源于新浪微博,共80168条关于12个话题的微博文本信息,12个话题分别是小米,韩剧,雾霾,房价,转基因,林书豪,跑男,陈赫,恒大,纸牌屋,一步之遥以及新年红包。
常用的评价指标,即正确率(Precision),召回率(Recall)以及综合评价指标(F-Measure)。正确率指的是在测试集中与人工标注结果相同的微博文本占所有测试集中微博文本的百分比,召回率是指测试集中与人工标注结果相同的微博文本占测试集中所有被人工判定为该类的文本的比例,即被正确预测的文本与所有属于该类文本的数量比。
情感极性分析结果,见表2。
表2 情感极性分析实验结果
(5)完成了情感极性分析,需要进一步进行情感划分,首先进行情感语料库建设,语料库建设是一个复杂且繁琐的过程。标注的粒度有词汇、语句两个等级,语料库完全可以应用于中文微博的情感分析,同时,两个等级的设计也为它的进一步更新和维护提供了基础。目前已标注完成的语料有821306个字词,27318个句子。
将待处理语料放入语句解析器中,语句解析器将会对句子的情感复杂程度进行分类,从而进一步提炼出语义特征,解析完成后,会将结果传到CRFs,计算文章中每个语句所表示的情感色彩,得到文章的情感链,对情感链进行分析评估,得出最终情感划分。
由于采用多句互相影响联合评估法对语句进行情感评估,具体做法是先将每个句子进行情感评估,同时关注句子之间的情感联系,即上下文的联系以及语法语义之间的联系,在表达情感及句意相似或相同的基础上进行多句互相影响联合评估。
公式1-3
公式1-3中表示n个连续句子的情感标注准确率,函数f(k,n)表示在微博文本中从k开始取n个标注的情感句与正确情感标注匹配,如果全相等则为1,否则为0。i表示第i个微博文本,表示第i个微博文本的句子总数。
同样要注意的是,否定词的使用也会导致情感转移,研究数据表明,当有否定词修饰时,“喜好”通常会转移为“厌恶”,而“愤怒”、“悲伤”、“惊讶”、“恐惧”有较大概率会转移为“无情感”。与此同时,根据中文文法的输入习惯,转折词的出现多意味着是对其后出现内容的强调,如“但是”、“然而”后常跟表达情感的语句,深入分析这些重点语句,会增加整段微博文本情感划分的准确率,所以在构建模型时,要将以上两点纳入考虑。
由于情感极性分析和情感划分采取两种不同的模型构造方法,同时,情感极性分析已经将微博文本分类成为三类情感极性的一种,而情感极性与七种情感划分有着一定程度的联系,如喜好属于正面情感,愤怒、厌恶都属于负面情感,而平静则属于中性情感,综合两种评价体系,互作修正因子,可以更好的得出实验结果。
对微博六种情感划分的评价标准主要集中在准确率上,下面给出准确率的计算公式。
公式1-4
为比较本发明的技术优势,现设立对比方案,为使用情感词典进行关键字匹配的方法,通过情感词词频计算句子情感,将此种方案命名为Smatch方法。
两种方法的实验结果对比如表3所示。
表3 实验结果比较
通过上述分析可见,本发明对中文微博的情感有良好的分析效果,采用本发明后,可以更加直观的分析出中文微博文本所表达的情感倾向。因此,本发明特别适合对大数据体系下的舆情分析、情感统计等领域。由此可见,本发明具有实质性技术特点和显著的技术进步,其应用前景非常广阔。
本发明基于规则和统计模型的中文微博情感分析方法的有益效果是:
(1)通过对微博文本、表情符号以及标点符号的分析,迅速地判断出情感倾向。
(2)基于规则的情感计算和基于统计模型的情感分类两个角度对微博文本展开情感分析,具有较强的可实施性。
(3)方法简便,可扩展性高,可用于多领域研究,如舆情分析、市场营销、谣言控制等方面。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种基于规则和统计模型的中文微博情感分析方法,其特征在于,包括:
步骤一:文本预处理及观点句识别,即针对每个句子,首先判断出该条句子观点句还是非观点句;
步骤二:情感极性分析,即在情感词典的基础上,对观点句进行分词处理,并抽取特征,构建SVM模型,对观点句进行情感极性分类;
步骤三:情感划分,即在情感极性判断基础上,将观点句进行具体的情感划分。
2.根据权利要求1所述的基于规则和统计模型的中文微博情感分析方法,其特征在于,所述情感极性包括正面情感(Pos),负面情感(Neg)和中性情感(NEUTRAL)。
3.根据权利要求1所述的基于规则和统计模型的中文微博情感分析方法,其特征在于,所述文本预处理及观点句识别的具体步骤包括:
预处理:
(1.1)对微博语料进行预处理,删除无意义微博,所述无意义微博包括垃圾微博文本和广告营销微博文本;
(1.2)删除微博中的话题标签,即去除“#”和其间的文字内容,得到预处理语料;
(1.3)创建主观词词典,并标注主观词的词性;
观点句判断:
(2.1)对预处理语料进行分词并标注词性,进行句子分词和特征提取,构建特征分类模型;
(2.2)将分词语句与主观词词典进行匹配,并判断主观词是否为动词词性;
(2.3)如果主观词为动词词性,则在分词语句的前后找代词和情感词;
(2.4)在分词语句中寻找名词或名词短语,如果出现名词或名词短语,则判定该分词语句为观点句;
(2.5)如果没有出现名词或名词短语,并且满足步骤(2.3)和步骤(2.4)的要求,则直接判定该分词语句为非观点句。
4.根据权利要求3所述的基于规则和统计模型的中文微博情感分析方法,其特征在于,所述情感极性分类的具体步骤包括:
创建或引用对照词典,并对对照词典中的词语进行情感极性标注;
创建网络用语词典和表情符号词典,并对词典中的词语进行情感极性标注;
对观点句进行分词,获得极性分词;
采用十折交叉验证法,将极性分词投入特征分类模型中进行训练,得到极性分词的情感极性,其中,60%的极性分词用来作训练集,40%的极性分词作测试集;
根据极性分词的情感极性,得到观点句的情感极性。
5.根据权利要求4所述的基于规则和统计模型的中文微博情感分析方法,其特征在于,所述情感极性标注包括正面评价词语、负面评价词语、负面情感词语、正面情感词语、程度级别词语以及主张词语。
6.根据权利要求4所述的基于规则和统计模型的中文微博情感分析方法,其特征在于,所述情感划分的具体实施步骤包括:
创建和收集语料库,所述语料库包括教材、科学杂志、期刊、报纸,童话故事和文学名著;
对语料进行情感标注,创建语料库的标注体系,即对每一个待标注的语料进行情感信息的填充和集合;
将微博语料逐句切割成短句,并将短句放入语句解析器中,语句解析器将会对句子的情感复杂程度进行分类;
提取分类好的分类句的语义特征,并对语义特征进行解析;
将解析结果传到条件随机场CRFs,利用语料库计算微博语料中每个分类句表示的情感色彩,得到文章的情感链;
对情感链进行分析评估;
根据情感链的分析评估结果和观点句的情感极性,得出最终情感划分。
7.根据权利要求6所述的基于规则和统计模型的中文微博情感分析方法,其特征在于,所述对情感链进行分析评估的具体步骤包括:
采用多句互相影响联合评估法对语料进行情感划分;
采用共现的多元情感在语料标注中匹配的准确率来衡量情感标注的连贯性。
8.根据权利要求7所述的基于规则和统计模型的中文微博情感分析方法,其特征在于,所述采用多句互相影响联合评估法对语料进行情感划分的具体步骤包括:
对每个分类句进行情感评估;
判断分类句之间的情感联系,即上下文的联系以及语法语义之间的联系;
在表达情感及句意相似或相同的基础上进行多句互相影响联合评估。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510127310.4A CN104731770A (zh) | 2015-03-23 | 2015-03-23 | 基于规则和统计模型的中文微博情感分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510127310.4A CN104731770A (zh) | 2015-03-23 | 2015-03-23 | 基于规则和统计模型的中文微博情感分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104731770A true CN104731770A (zh) | 2015-06-24 |
Family
ID=53455668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510127310.4A Pending CN104731770A (zh) | 2015-03-23 | 2015-03-23 | 基于规则和统计模型的中文微博情感分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104731770A (zh) |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105354183A (zh) * | 2015-10-19 | 2016-02-24 | Tcl集团股份有限公司 | 一种家电产品互联网评论的分析方法、装置及*** |
CN105354305A (zh) * | 2015-11-05 | 2016-02-24 | 北京邮电大学 | 一种网络谣言的识别方法及装置 |
CN105930359A (zh) * | 2016-04-11 | 2016-09-07 | 百度在线网络技术(北京)有限公司 | 倾向性监控方法及装置 |
CN106126502A (zh) * | 2016-07-07 | 2016-11-16 | 四川长虹电器股份有限公司 | 一种基于支持向量机的情感分类***及方法 |
CN106503049A (zh) * | 2016-09-22 | 2017-03-15 | 南京理工大学 | 一种基于svm融合多种情感资源的微博情感分类方法 |
CN106649519A (zh) * | 2016-10-17 | 2017-05-10 | 北京邮电大学 | 一种产品特征的挖掘与评价方法 |
CN106815192A (zh) * | 2015-11-27 | 2017-06-09 | 北京国双科技有限公司 | 模型训练方法及装置和语句情感识别方法及装置 |
CN107015965A (zh) * | 2017-03-24 | 2017-08-04 | 苏州希格玛科技有限公司 | 一种中文文本情感分析装置及方法 |
CN107102980A (zh) * | 2016-02-19 | 2017-08-29 | 北京国双科技有限公司 | 情感信息的提取方法及装置 |
CN107220238A (zh) * | 2017-05-24 | 2017-09-29 | 电子科技大学 | 一种基于混合网络模型的文本对象抽取方法 |
CN107329953A (zh) * | 2017-06-27 | 2017-11-07 | 联想(北京)有限公司 | 自然语言语料数据的处理方法及电子设备 |
CN107506346A (zh) * | 2017-07-10 | 2017-12-22 | 北京享阅教育科技有限公司 | 一种基于机器学习的中文阅读难度分级方法及*** |
CN107783961A (zh) * | 2017-11-08 | 2018-03-09 | 郑州云海信息技术有限公司 | 一种热点话题识别的方法、装置及可读存储介质 |
CN107945033A (zh) * | 2017-11-14 | 2018-04-20 | 李勇 | 一种网络舆情的分析方法、***及相关装置 |
CN108345969A (zh) * | 2017-01-23 | 2018-07-31 | 广东天亿马信息产业股份有限公司 | 一种用于社会管理网格化服务的***及其数据管理方法 |
CN108388654A (zh) * | 2018-03-01 | 2018-08-10 | 合肥工业大学 | 一种基于转折句语义块划分机制的情感分类方法 |
CN108647212A (zh) * | 2018-05-18 | 2018-10-12 | 大连民族大学 | 机器学习的影评情感倾向性分析中形成特征集合的方法 |
CN108804608A (zh) * | 2018-05-30 | 2018-11-13 | 武汉烽火普天信息技术有限公司 | 一种基于层次attention的微博谣言立场检测方法 |
CN109284381A (zh) * | 2018-09-27 | 2019-01-29 | 南通大学 | 融合表情符号库和主题模型的方面观点褒贬态度挖掘方法 |
CN109948146A (zh) * | 2019-02-12 | 2019-06-28 | 吉林工程技术师范学院 | 一种出版文化语言库词汇分析方法 |
CN110096696A (zh) * | 2018-06-11 | 2019-08-06 | 电子科技大学 | 一种中文长文本情感分析方法 |
CN110399484A (zh) * | 2019-06-25 | 2019-11-01 | 平安科技(深圳)有限公司 | 长文本的情感分析方法、装置、计算机设备和存储介质 |
CN110532386A (zh) * | 2019-08-12 | 2019-12-03 | 新华三大数据技术有限公司 | 文本情感分类方法、装置、电子设备及存储介质 |
CN110569355A (zh) * | 2019-07-24 | 2019-12-13 | 中国科学院信息工程研究所 | 一种基于词块的观点目标抽取和目标情感分类联合方法及*** |
CN111460158A (zh) * | 2020-04-01 | 2020-07-28 | 安徽理工大学 | 一种基于情感分析的微博话题公众情感预测方法 |
CN111611455A (zh) * | 2020-05-22 | 2020-09-01 | 安徽理工大学 | 一种微博热点话题下基于用户情感行为特征的用户群体划分方法 |
CN112464646A (zh) * | 2020-11-23 | 2021-03-09 | 中国船舶工业综合技术经济研究院 | 一种面向国防领域防务智库的文本情感分析方法 |
CN113010689A (zh) * | 2021-03-22 | 2021-06-22 | 平安科技(深圳)有限公司 | 佛学知识甄别方法、装置、设备及存储介质 |
CN114579740A (zh) * | 2022-01-20 | 2022-06-03 | 马上消费金融股份有限公司 | 文本分类方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007018234A (ja) * | 2005-07-07 | 2007-01-25 | National Institute Of Information & Communication Technology | 感情表現語句辞書自動生成方法及び装置、並びにテキストに対する感情尺度評価値自動付与方法及び装置 |
CN101782898A (zh) * | 2010-03-25 | 2010-07-21 | 中国科学院计算技术研究所 | 一种情感词倾向性的分析方法 |
CN102663046A (zh) * | 2012-03-29 | 2012-09-12 | 中国科学院自动化研究所 | 一种面向微博短文本的情感分析方法 |
CN103034626A (zh) * | 2012-12-26 | 2013-04-10 | 上海交通大学 | 情感分析***及方法 |
-
2015
- 2015-03-23 CN CN201510127310.4A patent/CN104731770A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007018234A (ja) * | 2005-07-07 | 2007-01-25 | National Institute Of Information & Communication Technology | 感情表現語句辞書自動生成方法及び装置、並びにテキストに対する感情尺度評価値自動付与方法及び装置 |
CN101782898A (zh) * | 2010-03-25 | 2010-07-21 | 中国科学院计算技术研究所 | 一种情感词倾向性的分析方法 |
CN102663046A (zh) * | 2012-03-29 | 2012-09-12 | 中国科学院自动化研究所 | 一种面向微博短文本的情感分析方法 |
CN103034626A (zh) * | 2012-12-26 | 2013-04-10 | 上海交通大学 | 情感分析***及方法 |
Non-Patent Citations (3)
Title |
---|
SHIYANG WEN 等: "Emotion Classification in Microblog Texts Using Class Sequential Rules", 《PROCEEDINGS OF THE TWENTY-EIGHTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE》 * |
喻琦: "中文微博情感分析技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
徐琳宏: "基于语义资源的文本情感计算", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105354183A (zh) * | 2015-10-19 | 2016-02-24 | Tcl集团股份有限公司 | 一种家电产品互联网评论的分析方法、装置及*** |
CN105354305A (zh) * | 2015-11-05 | 2016-02-24 | 北京邮电大学 | 一种网络谣言的识别方法及装置 |
CN106815192A (zh) * | 2015-11-27 | 2017-06-09 | 北京国双科技有限公司 | 模型训练方法及装置和语句情感识别方法及装置 |
CN106815192B (zh) * | 2015-11-27 | 2020-04-21 | 北京国双科技有限公司 | 模型训练方法及装置和语句情感识别方法及装置 |
CN107102980A (zh) * | 2016-02-19 | 2017-08-29 | 北京国双科技有限公司 | 情感信息的提取方法及装置 |
CN105930359A (zh) * | 2016-04-11 | 2016-09-07 | 百度在线网络技术(北京)有限公司 | 倾向性监控方法及装置 |
CN106126502A (zh) * | 2016-07-07 | 2016-11-16 | 四川长虹电器股份有限公司 | 一种基于支持向量机的情感分类***及方法 |
CN106126502B (zh) * | 2016-07-07 | 2018-10-30 | 四川长虹电器股份有限公司 | 一种基于支持向量机的情感分类***及方法 |
CN106503049A (zh) * | 2016-09-22 | 2017-03-15 | 南京理工大学 | 一种基于svm融合多种情感资源的微博情感分类方法 |
CN106649519A (zh) * | 2016-10-17 | 2017-05-10 | 北京邮电大学 | 一种产品特征的挖掘与评价方法 |
CN108345969A (zh) * | 2017-01-23 | 2018-07-31 | 广东天亿马信息产业股份有限公司 | 一种用于社会管理网格化服务的***及其数据管理方法 |
CN107015965A (zh) * | 2017-03-24 | 2017-08-04 | 苏州希格玛科技有限公司 | 一种中文文本情感分析装置及方法 |
CN107220238A (zh) * | 2017-05-24 | 2017-09-29 | 电子科技大学 | 一种基于混合网络模型的文本对象抽取方法 |
CN107329953A (zh) * | 2017-06-27 | 2017-11-07 | 联想(北京)有限公司 | 自然语言语料数据的处理方法及电子设备 |
CN107506346A (zh) * | 2017-07-10 | 2017-12-22 | 北京享阅教育科技有限公司 | 一种基于机器学习的中文阅读难度分级方法及*** |
CN107783961A (zh) * | 2017-11-08 | 2018-03-09 | 郑州云海信息技术有限公司 | 一种热点话题识别的方法、装置及可读存储介质 |
CN107945033A (zh) * | 2017-11-14 | 2018-04-20 | 李勇 | 一种网络舆情的分析方法、***及相关装置 |
CN108388654A (zh) * | 2018-03-01 | 2018-08-10 | 合肥工业大学 | 一种基于转折句语义块划分机制的情感分类方法 |
CN108388654B (zh) * | 2018-03-01 | 2020-03-17 | 合肥工业大学 | 一种基于转折句语义块划分机制的情感分类方法 |
CN108647212A (zh) * | 2018-05-18 | 2018-10-12 | 大连民族大学 | 机器学习的影评情感倾向性分析中形成特征集合的方法 |
CN108804608A (zh) * | 2018-05-30 | 2018-11-13 | 武汉烽火普天信息技术有限公司 | 一种基于层次attention的微博谣言立场检测方法 |
CN108804608B (zh) * | 2018-05-30 | 2021-08-27 | 武汉烽火普天信息技术有限公司 | 一种基于层次attention的微博谣言立场检测方法 |
CN110096696A (zh) * | 2018-06-11 | 2019-08-06 | 电子科技大学 | 一种中文长文本情感分析方法 |
CN109284381A (zh) * | 2018-09-27 | 2019-01-29 | 南通大学 | 融合表情符号库和主题模型的方面观点褒贬态度挖掘方法 |
CN109284381B (zh) * | 2018-09-27 | 2023-12-08 | 南通大学 | 融合表情符号库和主题模型的方面观点褒贬态度挖掘方法 |
CN109948146A (zh) * | 2019-02-12 | 2019-06-28 | 吉林工程技术师范学院 | 一种出版文化语言库词汇分析方法 |
CN110399484A (zh) * | 2019-06-25 | 2019-11-01 | 平安科技(深圳)有限公司 | 长文本的情感分析方法、装置、计算机设备和存储介质 |
CN110569355A (zh) * | 2019-07-24 | 2019-12-13 | 中国科学院信息工程研究所 | 一种基于词块的观点目标抽取和目标情感分类联合方法及*** |
CN110569355B (zh) * | 2019-07-24 | 2022-05-03 | 中国科学院信息工程研究所 | 一种基于词块的观点目标抽取和目标情感分类联合方法及*** |
CN110532386A (zh) * | 2019-08-12 | 2019-12-03 | 新华三大数据技术有限公司 | 文本情感分类方法、装置、电子设备及存储介质 |
CN111460158B (zh) * | 2020-04-01 | 2022-09-23 | 安徽理工大学 | 一种基于情感分析的微博话题公众情感预测方法 |
CN111460158A (zh) * | 2020-04-01 | 2020-07-28 | 安徽理工大学 | 一种基于情感分析的微博话题公众情感预测方法 |
CN111611455A (zh) * | 2020-05-22 | 2020-09-01 | 安徽理工大学 | 一种微博热点话题下基于用户情感行为特征的用户群体划分方法 |
CN112464646A (zh) * | 2020-11-23 | 2021-03-09 | 中国船舶工业综合技术经济研究院 | 一种面向国防领域防务智库的文本情感分析方法 |
CN113010689A (zh) * | 2021-03-22 | 2021-06-22 | 平安科技(深圳)有限公司 | 佛学知识甄别方法、装置、设备及存储介质 |
CN114579740A (zh) * | 2022-01-20 | 2022-06-03 | 马上消费金融股份有限公司 | 文本分类方法、装置、电子设备及存储介质 |
CN114579740B (zh) * | 2022-01-20 | 2023-12-05 | 马上消费金融股份有限公司 | 文本分类方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104731770A (zh) | 基于规则和统计模型的中文微博情感分析方法 | |
Boudad et al. | Sentiment analysis in Arabic: A review of the literature | |
Ren et al. | Sarcasm detection with sentiment semantics enhanced multi-level memory network | |
Al-Ayyoub et al. | Lexicon-based sentiment analysis of Arabic tweets | |
Huang et al. | Detecting suicidal ideation in Chinese microblogs with psychological lexicons | |
CN104331451B (zh) | 一种基于主题的网络用户评论的推荐度评分方法 | |
Sykora et al. | Emotive ontology: Extracting fine-grained emotions from terse, informal messages | |
Shen et al. | Emotion mining research on micro-blog | |
CN106503049A (zh) | 一种基于svm融合多种情感资源的微博情感分类方法 | |
Kaur et al. | Emotion detection and sentiment analysis in text corpus: a differential study with informal and formal writing styles | |
CN101520802A (zh) | 一种问答对的质量评价方法和*** | |
CN103544246A (zh) | 互联网多种情感词典构建方法及*** | |
CN104331394A (zh) | 一种基于观点的文本分类方法 | |
CN106202584A (zh) | 一种基于标准词典和语义规则的微博情感分析方法 | |
CN105183717A (zh) | 一种基于随机森林和用户关系的osn用户情感分析方法 | |
CN106446147A (zh) | 一种基于结构化特征的情感分析方法 | |
Jucker | Corpus pragmatics | |
Van Hee et al. | Monday mornings are my fave:)# not exploring the automatic recognition of irony in english tweets | |
Khan et al. | Summarizing customer review based on product feature and opinion | |
Min et al. | Comparative evaluation of lexicons in performing sentiment analysis | |
Matsumoto et al. | Estimation of word emotions based on part of speech and positional information | |
Mittal et al. | A hybrid approach for twitter sentiment analysis | |
Krommyda et al. | Emotion detection in Twitter posts: a rule-based algorithm for annotated data acquisition | |
Jain et al. | TANA: The amalgam neural architecture for sarcasm detection in indian indigenous language combining LSTM and SVM with word-emoji embeddings | |
Trye et al. | Harnessing Indigenous Tweets: The Reo Māori Twitter corpus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150624 |
|
RJ01 | Rejection of invention patent application after publication |