CN103455562A - 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器 - Google Patents

一种文本倾向性分析方法及基于该方法的商品评论倾向判别器 Download PDF

Info

Publication number
CN103455562A
CN103455562A CN2013103557046A CN201310355704A CN103455562A CN 103455562 A CN103455562 A CN 103455562A CN 2013103557046 A CN2013103557046 A CN 2013103557046A CN 201310355704 A CN201310355704 A CN 201310355704A CN 103455562 A CN103455562 A CN 103455562A
Authority
CN
China
Prior art keywords
word
emotion
sentence
polarity
tendency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013103557046A
Other languages
English (en)
Inventor
董丽丽
赵繁荣
张翔
王茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Architecture and Technology
Original Assignee
Xian University of Architecture and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Architecture and Technology filed Critical Xian University of Architecture and Technology
Priority to CN2013103557046A priority Critical patent/CN103455562A/zh
Publication of CN103455562A publication Critical patent/CN103455562A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种文本倾向性分析方法包括步骤:对评论文本进行预处理;识别中文句法的依存关系结构;计算情感词的上下文极性值;完成评价对象和评价词的二元组抽取,确定评价对象间的从属关系;对情感词倾向值加权求和得到句子倾向值,实现句子级倾向性判别;通过句子级极性值的正负,判别评论情感的褒贬倾向;根据极性绝对值大小,判别评论褒贬情感的强弱。商品评论倾向判别器包括:采集模块、预处理模块、句法分析模块、情感计算引擎、二元组挖掘引擎、上下文控制器和情感判别器。本发明结合组合情感词典并将领域本体加入文本倾向性分析,提高了情感词极性计算与<评价对象,评价词>二元组抽取的准确率,实现了对论坛商品评论的倾向性分析。

Description

一种文本倾向性分析方法及基于该方法的商品评论倾向判别器
技术领域
本发明涉及文本的倾向性分析技术领域,尤其是涉及一种文本倾向性分析方法及基于该方法的面向论坛的商品评论倾向判别器。
背景技术
随着互联网的迅速发展,特别是Web2.0理念的逐渐深入,形形色色的虚拟社会网络层出不穷,如腾讯微博、Facebook和论坛(BBS)等,这些虚拟社会网络聚集了大量用户并且在这些用户之间形成了无形的虚拟社会,传播着各种各样的信息。人们现在越来越依赖网络来获取信息。例如用户可以在网易汽车论坛中对某款车型发表关于汽车性价比、油耗等个人看法,同时企业也可以通过各种论坛中用户所反馈的问题对其产品进行改善,及时调整下一代产品的改进方案及营销策略,以提高企业在市场中的竞争力。因此论坛的商品评论对于企业及消费者来说均是举足轻重的。然而面对如此庞大的互联网环境,不可能依靠人工对相关评论信息进行筛选、归纳,因此一套具有自动检索、筛选、总结相关信息的***便有了迫切的市场需求。
通过对国内外大量文献进行分析,可以发现目前针对特定领域的网络论坛商品评论的倾向性分析技术仍然存在以下问题:(1)目前以互联网为桥梁,利用信息检索、自然语言处理等技术开发一个成熟、开放的针对某领域的倾向性分析***实例比较少;(2)目前针对中文的情感词典不多,尤其是领域情感词典,现在较为流行的有HowNet(知网),在构建情感词典的过程中未考虑评价对象对情感极性的影响,也忽略了网络语言灵活性的特点,从而导致没有一个针对网络和特定领域的专有情感词典;(3)基于语义规则的评价对象抽取方法还只能找出频繁的评价对象,对于非频繁评价对象抽取的准确率较低,而且可扩展性差。
发明内容
本发明所要解决的技术问题是:提供一种文本倾向性分析方法及基于该方法的面向论坛的商品评论倾向判别器,提出通过将领域本体加入文本倾向性分析,设计并实现对论坛商品评论的倾向性分析。
为解决上述技术问题,本发明的技术方案是:一种文本倾向性分析方法,包括以下步骤:
(1)对评论文本进行预处理,通过采集模块中相应的爬虫工具对目标网页的爬取,并在预处理模块中,针对评论内容的HTML标签进行抽取、去噪,以筛选出有用的评论文本;
(2)针对预处理后的评论文本,句法分析模块经句法分析器识别出中文句法的依存关系结构;
(3)情感计算引擎根据情感词典计算出情感词的上下文极性值;
(4)将领域本体引入到SBV极性传递算法当中,二元组挖掘引擎根据本体知识,完成了评价对象和评价词的二元组抽取,并确定评价对象间的从属关系;
(5)通过对情感词倾向值加权求和得到句子倾向值,实现句子级倾向性判别;
(6)通过句子级极性值的正负,判别评论情感的褒贬倾向;根据极性绝对值大小,判别评论褒贬情感的强弱。
进一步的,所述情感词典包括静态情感词典、动态情感词典和修饰词词典;其中考虑到网络评论信息的随意性,将网络术语和特定的领域未登录词融入到静态情感词典中;动态情感词典主要采用人工方式构建;修饰词词典综合前人已有的研究成果并加以归并构成。
进一步的,采用SO-PMI处理未登录词,利用搜索引擎返回的结果计算词与词之间的贡献概率,同时获得单独词出现的概率,其公式为:
PMI ( W 1 , W 2 ) = log 2 ( 1 N hits ( W 1 NEARW 2 ) 1 N hits ( W 1 ) &times; 1 N hits ( W 2 ) ) - - - ( 1 )
其中,hits(word)表示搜索引擎查询词语word所返回的页面数hits(W1 NEAR W2)表示W1与W2在共现窗口内出现的次数;
在此基础上,利用公式(4)计算词语word的情感倾向:
StaticPolarity ( word ) = SO - PMI ( word )
= &Sigma; Pword &Element; Pwords PMI ( word , Pword ) - &Sigma; Nword &Element; Nwords PMI ( word , Nword )
                    (2)
进一步的,在步骤(4)中,商品本体的概念包括实体与属性两部分,其分类模型分别对应于森林与树,且该方法为每一个分类模型中的结点赋予一个权值,如果需要计算本体中一个结点的极性值时,只需要将其子节点的极性值加权,其计算公式如下:
Figure BSA0000093965030000034
进一步的,在步骤(4)中,将商品本体融入到SBV算法当中,利用本体概念关系实现评价实体及属性的识别,当评论文本中存在属性概念时,评价实体的极性值是通过对属性倾向值加权求和来获取,算法描述如下:
1)利用本体判断语句中是否含有评价实体Entity;
c.若无实体,表示此句无意义,则不处理本句,结束;
d.否则表示含有Entity,对Entity使用SBV算法进行处理,得到ContextualPolarity(Entity),执行2);
2)利用本体查找语句中存在的属性关键词Attribute;
a.若不含属性关键词,执行4);
b.否则使用SBV算法处理评论文本,得到ContextualPolarity(Attribute),标记其中处理过的属性关键词。对于处理过的情感词,也打上标签,执行3);
3)经过SBV算法,
d.继续查找整个句子,找到没有标记过的属性关键词,记为UnMarkedAttribute;
e.找到包含UnMarkedAttribute的ATT关系对,对于其中出现的词noun,查找所以包含noun的关系对,直至找到含有情感词adj的关系对;
f.如果ContextualPolarity(adj)≠0,则
ContextualPolarity(UnMarkedAttribute)=ContextualPolarity(adj);
4)记录以上所有使用过的情感词,查找没有标记过的情感词,即UnMarkedPolar,
a.如果UnMarkedPolar存在,向前查找最邻近的属性主题词,将ContextualPolarity(UnMarkedPolar)作为调整参数,调整属性主题词的极性,即ContextualPolarity(Attribute)←ContextualPolarity(UnMarkedPolar)
b.如果UnMarkedPolar不存在,执行5);
5)利用公式(3),对Attribute与UnMarkedAttribute极性值加权求和,利用所得结果调整ContextualPolarity(Entity)。
进一步的,在步骤(5)中,将研究粒度定为句子级别,句子的情感倾向值WS(sentence)通过对情感词和情感词短语倾向值加权求和的方法来获得,WS(sentence)的计算方法如公式(5)所示,
WS ( sentence ) = &Sigma; i = 1 n [ ContextualPolarity ( phrase i ) &times; W ( phrase i ) ] - - - ( 5 )
其中,phrasek(k=1,2,Λ n)表示出现在sentence中的情感倾向词。W(phrasei)表示phrasei在句子中所占的权重值。
&Sigma; i = 1 n W ( phrase i ) = 1 - - - ( 6 )
定义句子中带情感倾向的各个短语权重计算公式(7)如下所示,
Figure BSA0000093965030000053
其中,n1表示句子中情感短语的总数,n2表示转折分句的个数,如果n2=0表明不存在转折句,则W(phrase)相等,据此便可求得句子的情感倾向值,以0为分界线,结果的正负表示褒贬倾向,绝对值大小表示情感倾向的强弱程度。
为解决上述技术问题,本发明的另一技术方案是:一种商品评论倾向判别器,主要包括:
采集模块,用于获取原始评论文本;
预处理模块,用于对待分析文本进行去噪、评论提取等预处理;
句法分析模块,用于分析评论文本的句法关系;
情感计算引擎,用于情感词的极性计算;
二元组挖掘引擎,用于<评论对象,评价词>二元组抽取;
上下文控制器,用于句子上下文极性计算;
情感判别器,用于句子级极性判别。
优选的,所述情感计算引擎包括:
静态情感词典,所述静态情感词典是指具有绝对褒贬倾向的情感词,用于静态情感词极性计算;
动态情感词典,所述动态情感词典是指当修饰目标不同时,倾向会发生变化的情感词,用于动态情感词极性计算;
修饰词情感词典,所述修饰词情感词典是指具有绝对褒贬倾向的情感词,用于结合修饰词的情感词极性计算。
优选的,所述二元组挖掘引擎包括:
概念提取模块,用于提取领域知识中的核心概念;
本体构建模块,用于构建商品本体知识库;
二元组挖掘模块,用于挖掘<评论对象,评价词>二元组。
采用了上述技术方案,本发明的有益效果为:通过构建组合情感词典并结合情感词上下文极性计算算法,提高了情感词极性计算的准确率,显著降低了统计方法在语义极性计算方面的不确定性;通过将领域本体引入SBV算法中,提高了<评价对象,评价词>二元组抽取的准确率,有效改进了句子级的倾向性分析方法;通过商品评论倾向判别器,结合领域本体,可从不同性能指标对评论文本进行统计,最终将倾向性分析结果以直观的方式展现给用户。
附图说明
图1是本发明实施例的倾向性分析流程图;
图2是本发明的***架构示意图。
具体实施方式
下面以汽车论坛为例,结合附图和实施例对本发明进一步说明。
本发明首先需要构建一个面向商品领域的领域本体,本发明采用组合式领域概念获取方法,主要步骤包括:首先将文本语料切分成一系列词串,然后进行粗降维;由于领域专业术语由合成词组成的概率较大,而分词后的术语常常被切分为散串,因此利用互信息值获取合成词,并引入似然比识别低频词;概念并不等同于术语,同一个概念语义可以由多个不同术语表达,因此直接将获取的术语作为概念并不完全正确,例如术语“电脑”和“计算机”,它们互为同义词,本方法通过AP算法来识别术语中的同义词,以获取概念集合。
本方法将文本分析中评价级别结果限定在本体中的叶子结点上,父结点的极性值可以通过加权求和得到,通过为每一个结点赋予一个权值,如果需要计算一个结点的极性值时,只需要将其子节点的极性值加权就行,如公式(1)。
Figure BSA0000093965030000081
Figure BSA0000093965030000082
其中,hits(w)的值等于在搜索引擎中查询词语w所返回的页面数。
如图1所示,一种文本倾向性分析方法,包括以下步骤:
(1)对评论文本进行预处理,通过采集模块中相应的爬虫工具对目标网页的爬取,并在预处理模块中,针对评论内容的HTML标签进行抽取、去噪,以筛选出有用的评论文本;
(2)针对预处理后的评论文本,句法分析模块经句法分析器识别出中文句法的依存关系结构;
(3)情感计算引擎根据情感词典计算出情感词的上下文极性值;
(4)将领域本体引入到SBV极性传递算法当中,二元组挖掘引擎根据本体知识,完成了评价对象和评价词的二元组抽取,并确定评价对象间的从属关系;
(5)通过对情感词倾向值加权求和得到句子倾向值,实现句子级倾向性判别;
(6)通过句子级极性值的正负,判别评论情感的褒贬倾向;根据极性绝对值大小,判别评论褒贬情感的强弱。
本实施例中,情感词典包括静态情感词典、动态情感词典和修饰词词典;其中考虑到网络评论信息的随意性,将网络术语和特定的领域未登录词融入到静态情感词典中;动态情感词典主要采用人工方式构建;修饰词词典综合前人已有的研究成果并加以归并构成。采用SO-PMI处理未登录词,利用搜索引擎返回的结果计算词与词之间的贡献概率,同时获得单独词出现的概率,其公式为:
PMI ( W 1 , W 2 ) = log 2 ( 1 N hits ( W 1 NEARW 2 ) 1 N hits ( W 1 ) &times; 1 N hits ( W 2 ) ) - - - ( 3 )
其中,hits(word)表示搜索引擎查询词语word所返回的页面数hits(W1 NEAR W2)表示W1与W2在共现窗口内出现的次数;
在此基础上,利用公式(4)计算词语word的情感倾向:
StaticPolarity ( word ) = SO - PMI ( word )
= &Sigma; Pword &Element; Pwords PMI ( word , Pword ) - &Sigma; Nword &Element; Nwords PMI ( word , Nword )
                  (4)
在步骤(4)中,将商品本体融入到SBV算法当中,利用本体概念关系实现评价实体及属性的识别,当评论文本中存在属性概念时,评价实体的极性值是通过对属性倾向值加权求和来获取,算法描述如下:
1)利用本体判断语句中是否含有评价实体Entity;
e.若无实体,表示此句无意义,则不处理本句,结束;
f.否则表示含有Entity,对Entity使用SBV算法进行处理,得到ContextualPolarity(Entity),执行2);
2)利用本体查找语句中存在的属性关键词Attribute;
a.若不含属性关键词,执行4);
b.否则使用SBV算法处理评论文本,得到ContextualPolarity(Attribute),标记其中处理过的属性关键词。对于处理过的情感词,也打上标签,执行3);
3)经过SBV算法,
g.继续查找整个句子,找到没有标记过的属性关键词,记为UnMarkedAttribute;
h.找到包含UnMarkedAttribute的ATT关系对,对于其中出现的词noun,查找所以包含noun的关系对,直至找到含有情感词adj的关系对;
i.如果ContextualPolarity(adj)≠0,则
ContextualPolarity(UnMarkedAttribute)=ContextualPolarity(adj);
4)记录以上所有使用过的情感词,查找没有标记过的情感词,即UnMarkedPolar,
a.如果UnMarkedPolar存在,向前查找最邻近的属性主题词,将ContextualPolarity(UnMarkedPolar)作为调整参数,调整属性主题词的极性,即ContextualPolarity(Attribute)←ContextualPolarity(UnMarkedPolar)
b.如果UnMarkedPolar不存在,执行5);
5)利用公式
对Attribute与UnMarkedAttribute极性值加权求和,利用所得结果调整ContextualPolarity(Entity)。
进一步的,在步骤(5)中,将研究粒度定为句子级别,句子的情感倾向值WS(sentence)通过对情感词和情感词短语倾向值加权求和的方法来获得,WS(sentence)的计算方法如公式(5)所示,
WS ( sentence ) = &Sigma; i = 1 n [ ContextualPolarity ( phrase i ) &times; W ( phrase i ) ] - - - ( 5 )
其中,phrasek(k=1,2,Λ n)表示出现在sentence中的情感倾向词。W(phrasei)表示phrasei在句子中所占的权重值。
&Sigma; i = 1 n W ( phrase i ) = 1 - - - ( 6 )
定义句子中带情感倾向的各个短语权重计算公式(7)如下所示,
Figure BSA0000093965030000113
其中,n1表示句子中情感短语的总数,n2表示转折分句的个数,如果n2=0表明不存在转折句,则W(phrase)相等,据此便可求得句子的情感倾向值,以0为分界线,结果的正负表示褒贬倾向,绝对值大小表示情感倾向的强弱程度。
如图2所示,一种商品评论倾向判别器,主要包括:
所述采集模块,用于面向商品论坛,获取原始评论文本。
所述预处理模块,用于根据HTML标签对原始评论文本进行评论提取、去噪等预处理。
所述句法分析模块,用于对中文评论文本进行分词、词性标注及句法关系分析等自然语言处理。
所述情感计算引擎,用于组合情感词典的构建及情感词的极性计算,见公式(3)、(4)。,其中组合情感词典又包括静态、动态及修饰词情感词典三部分。
所述二元组挖掘引擎,用于<评论对象,评价词>二元组抽取。包括:概念提取模块,用于提取领域知识中的核心概念;本体构建模块,用于构建商品本体知识库;二元组挖掘模块,用于挖掘<评论对象,评价词>二元组。
所述上下文控制器,用于句子上下文极性计算,通过对情感词和情感词短语倾向值加权求和的方法来获得,见公式(5)、(6)、(7)。
所述情感判别器,用于句子级极性判别。
优选的,所述情感计算引擎包括:静态情感词典,所述静态情感词典是指具有绝对褒贬倾向的情感词,用于静态情感词极性计算;动态情感词典,所述动态情感词典是指当修饰目标不同时,倾向会发生变化的情感词,用于动态情感词极性计算;修饰词情感词典,所述修饰词情感词典是指具有绝对褒贬倾向的情感词,用于结合修饰词的情感词极性计算。
优选的,所述二元组挖掘引擎包括:概念提取模块,用于提取领域知识中的核心概念;本体构建模块,用于构建商品本体知识库;二元组挖掘模块,用于挖掘<评论对象,评价词>二元组。
应用所述面向论坛的商品评论倾向判别器,对于一条评论文本,以“荣威的内饰很好看,但空间小。”为例:
首先,经过采集模块的爬取、预处理模块的评论抽取等,已具备倾向性分析的基础特质。
其次,经过句法分析模块的自然语言处理,其依存关系如图1示:
表1  依存关系结果
再次,经过领域本体的引入、二元组挖掘引擎对二元组抽取,可得二元组<内饰,好看>、<空间,小>,很明显,“内饰”与“空间”又均是评价实体“荣威”的属性,即“内饰(0.23)”属于“部件(0.3)”,“空间(0.18)”属于“参数(0.4)”。结合情感计算引擎及公示(1)、(2),可得各评价对象极性如表2示:
表2  I-SBV计算结果
最后,利用上下文控制器,对评价实体“荣威”的极性进行调整。评论中存在转折关联连词“但”(CNJ关联结构),结合公式(5)、(6)、(7)等得到句子级的倾向性值结果:
WS ( sentence ) = &Sigma; i = 1 n [ ContextualPolarity ( phrase i ) &times; W ( phrase i ) ]
= ( + 1.5 ) &times; 0.23 &times; 0.3 &times; 1 3 + ( - 1 ) &times; 0.18 &times; 0.4 &times; 2 3
= - 0.0135
因此,对评价实体“荣威”倾向值进行修正,其值为-0.0135。由计算结果可以得到该评论者更倾向于表达贬义情感,虽然对内饰表达了褒义情感,但是由于评论存在转折连词,加重了对转折句子的情感,所以最终结果为负值,即评论者对荣威这款车型表达的是贬义。
最后应该说明的是,虽然本说明书结合附图描述了本发明实施例中的许多特殊技术细节,但是这些不应被理解为对所要求保护或可要求保护的范围的限制,相反的应理解为对特定实施例的特征的描述。
类似的,虽然附图中以特定顺序对文本倾向性分析流程进行了描述,但是这些不应被理解为要求这些操作必须以所示的顺序执行,或者要执行所有操作。附图中的各***组件,不应被理解为在所有实施例中要求这样的划分,其应当被理解为所描述的组件可以集成到一个软件产品,也可封装到多个软件产品中。
本发明不局限于上述具体的实施方式,本领域的普通技术人员从上述构思出发,不经过创造性的劳动,所做出的种种变换,均在本发明的保护范围之内。

Claims (9)

1.一种文本倾向性分析方法,其特征在于,包括以下步骤: 
(1)对评论文本进行预处理,通过采集模块中相应的爬虫工具对目标网页的爬取,并在预处理模块中,针对评论内容的HTML标签进行抽取、去噪,以筛选出有用的评论文本; 
(2)针对预处理后的评论文本,句法分析模块经句法分析器识别出中文句法的依存关系结构; 
(3)情感计算引擎根据情感词典计算出情感词的上下文极性值; 
(4)将领域本体引入到SBV极性传递算法当中,二元组挖掘引擎根据本体知识,完成评价对象和评价词的二元组抽取,并确定评价对象间的从属关系; 
(5)通过对情感词倾向值加权求和得到句子倾向值,实现句子级倾向性判别; 
(6)通过句子级极性值的正负,判别评论情感的褒贬倾向;根据极性绝对值大小,判别评论褒贬情感的强弱。 
2.如权利要求1所述的一种文本倾向性分析方法,其特征在于,在步骤(3)中,所述情感词典包括静态情感词典、动态情感词典和修饰词词典;其中考虑到网络评论信息的随意性,将网络术语和特定的领域未登录词融入到静态情感词典中;动态情感词典主要采用人工方式构建;修饰词词典综合前人已有的研究成果并加以归并构成。 
3.如权利要求2所述的一种文本倾向性分析方法,其特征在于,采用SO-PMI处理未登录词,利用搜索引擎返回的结果计算词与词之间的共现概率,同时获得单独词出现的概率,其公式为: 
Figure FSA0000093965020000021
其中,hits(word)表示搜索引擎查询词语word所返回的页面数hits(W1 NEAR W2)表示W1与W2在共现窗口内出现的次数; 
在此基础上,计算词语word的情感倾向: 
Figure FSA0000093965020000022
4.如权利要求1所述的一种文本倾向性分析方法,其特征在于,在步骤(4)中,商品本体的概念包括实体与属性两部分,其分类模型分别对应于森林与树,且该方法为每一个分类模型中的结点赋予一个权值,如果需要计算本体中一个结点的极性值时,只需要将其子节点的极性值加权,其计算公式如下: 
Figure FSA0000093965020000024
Figure FSA0000093965020000025
5.如权利要求1所述的一种文本倾向性分析方法,其特征在于,在步骤(4)中,将商品本体融入到SBV算法当中,利用本体概念关系实现评价实体及属性的识别,当评论文本中存在属性概念时,评价实体的极性值是通过对属性倾向值加权求和来获取,算法描述如下: 
1)利用本体判断语句中是否含有评价实体Entity; 
a.若无实体,表示此句无意义,则不处理本句,结束; 
b.否则表示含有Entity,对Entity使用SBV算法进行处理,得到 ContextualPolarity(Entity),执行2); 
2)利用本体查找语句中存在的属性关键词Attribute; 
a.若不含属性关键词,执行4); 
b.否则使用SBV算法处理评论文本,得到ContextualPolarity(Attribute),标记其中处理过的属性关键词。对于处理过的情感词,也打上标签,执行3); 
3)经过SBV算法, 
a.继续查找整个句子,找到没有标记过的属性关键词,记为UnMarked Attribute; 
b.找到包含UnMarkedAttribute的ATT关系对,对于其中出现的词noun,查找所以包含noun的关系对,直至找到含有情感词adj的关系对; 
c.如果ContextualPolarity(adj)≠0,则 
ContextualPolarity(UnMarkedAttribute)=ContextualPolarity(adj); 
4)记录以上所有使用过的情感词,查找没有标记过的情感词,即UnMarkedPolar, 
a.如果UnMarkedPolar存在,向前查找最邻近的属性主题词,将ContextualPolarity(UnMarkedPolar)作为调整参数,调整属性主题词的极性,即ContextualPolarity(Attribute)←ContextualPolarity(UnMarkedPolar) 
b.如果UnMarkedPolar不存在,执行5); 
5)利用权利要求4中的公式,对Attribute与UnMarkedAttribute极性值加权求和,利用所得结果调整ContextualPolarity(Entity)。 
6.如权利要求1所述的一种文本倾向性分析方法,其特征在于,在步骤(5)中,将研究粒度定为句子级别,句子的情感倾向值WS(sentence)通过对情感词和情感词短语倾向值加权求和的方法来获得,WS(sentence)的计算公式为: 
Figure FSA0000093965020000041
其中,phrasek(k=1,2,Λn)表示出现在sentence中的情感倾向词。W(phrasei)表示phrasei在句子中所占的权重值。 
Figure FSA0000093965020000042
定义句子中带情感倾向的各个短语权重计算公式如下所示: 
Figure FSA0000093965020000043
其中,n1表示句子中情感短语的总数,n2表示转折分句的个数,如果n2=0表明不存在转折句,则W(phrase)相等,据此便可求得句子的情感倾向值,以0为分界线,结果的正负表示褒贬倾向,绝对值大小表示情感倾向的强弱程度。 
7.一种商品评论倾向判别器,其特征在于,主要包括: 
采集模块,用于获取原始评论文本; 
预处理模块,用于对待分析文本进行去噪、评论提取等预处理; 
句法分析模块,用于分析评论文本的句法关系; 
情感计算引擎,用于情感词的极性计算; 
二元组挖掘引擎,用于<评论对象,评价词>二元组抽取; 
上下文控制器,用于句子上下文极性计算; 
情感判别器,用于句子级极性判别。 
8.如权利要求7所述的一种商品评论倾向判别器,其特征在于,所述情感计算引擎包括: 
静态情感词典,所述静态情感词典是指具有绝对褒贬倾向的情感词,用于静态情感词极性计算; 
动态情感词典,所述动态情感词典是指当修饰目标不同时,倾向会发生变化的情感词,用于动态情感词极性计算; 
修饰词情感词典,所述修饰词情感词典是指具有绝对褒贬倾向的情感词,用于结合修饰词的情感词极性计算。 
9.如权利要求7所述的一种商品评论倾向判别器,其特征在于,所述二元组挖掘引擎包括: 
概念提取模块,用于提取领域知识中的核心概念; 
本体构建模块,用于构建商品本体知识库; 
二元组挖掘模块,用于挖掘<评论对象,评价词>二元组。 
CN2013103557046A 2013-08-13 2013-08-13 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器 Pending CN103455562A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013103557046A CN103455562A (zh) 2013-08-13 2013-08-13 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013103557046A CN103455562A (zh) 2013-08-13 2013-08-13 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器

Publications (1)

Publication Number Publication Date
CN103455562A true CN103455562A (zh) 2013-12-18

Family

ID=49737925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013103557046A Pending CN103455562A (zh) 2013-08-13 2013-08-13 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器

Country Status (1)

Country Link
CN (1) CN103455562A (zh)

Cited By (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199845A (zh) * 2014-08-08 2014-12-10 杭州电子科技大学 基于主体模型的网上评论情感分类方法
CN104463180A (zh) * 2014-12-31 2015-03-25 深圳市华星光电技术有限公司 识别导电粒子压痕的方法
CN105718446A (zh) * 2016-03-08 2016-06-29 徐勇 一种基于情感分析的ugc模糊综合评价方法
CN105760502A (zh) * 2016-02-23 2016-07-13 常州普适信息科技有限公司 一种基于大数据文本挖掘的商品质量情感词典构建***
CN105808594A (zh) * 2014-12-30 2016-07-27 广州市动景计算机科技有限公司 浏览器导航页显示方法、装置及设备
CN105912720A (zh) * 2016-05-04 2016-08-31 南京大学 一种计算机中涉及情感的文本数据分析方法
CN105975453A (zh) * 2015-12-01 2016-09-28 乐视网信息技术(北京)股份有限公司 评论标签提取方法和装置
CN106021433A (zh) * 2016-05-16 2016-10-12 北京百分点信息科技有限公司 一种商品评论数据的口碑分析方法和装置
CN106022878A (zh) * 2016-05-19 2016-10-12 华南理工大学 基于社区评论情感倾向性分析的手游排行榜构建方法
CN106294324A (zh) * 2016-08-11 2017-01-04 上海交通大学 一种基于自然语言句法分析树的机器学习情感分析器
CN106407236A (zh) * 2015-08-03 2017-02-15 北京众荟信息技术有限公司 一种面向点评数据的情感倾向性检测方法
CN106469145A (zh) * 2016-09-30 2017-03-01 中科鼎富(北京)科技发展有限公司 文本情感分析方法及装置
CN106610955A (zh) * 2016-12-13 2017-05-03 成都数联铭品科技有限公司 基于词典的多维度情感分析方法
CN106776574A (zh) * 2016-12-28 2017-05-31 Tcl集团股份有限公司 用户评论文本挖掘方法及装置
CN106844403A (zh) * 2015-12-07 2017-06-13 北京国双科技有限公司 信息处理方法和装置
CN106910512A (zh) * 2015-12-18 2017-06-30 株式会社理光 语音文件的分析方法、装置及***
CN107291689A (zh) * 2017-05-31 2017-10-24 温州市鹿城区中津先进科技研究院 一种基于大数据中文网络评论语句主题语义倾向的分析方法
CN107391493A (zh) * 2017-08-04 2017-11-24 青木数字技术股份有限公司 一种舆情信息提取方法、装置、终端设备及存储介质
CN107767195A (zh) * 2016-08-16 2018-03-06 阿里巴巴集团控股有限公司 描述信息的展示***和展示、生成方法及电子设备
WO2018045910A1 (zh) * 2016-09-09 2018-03-15 阿里巴巴集团控股有限公司 情感倾向的识别方法、对象分类方法及数据处理***
CN107918818A (zh) * 2016-10-10 2018-04-17 香港纺织及成衣研发中心有限公司 基于大数据技术的供应链管理决策支持***
CN107967260A (zh) * 2017-12-07 2018-04-27 东软集团股份有限公司 一种数据处理方法、设备、***及计算机程序产品
CN107992613A (zh) * 2017-12-18 2018-05-04 广东广业开元科技有限公司 一种基于机器学习的文本挖掘技术消费维权指标分析方法
CN108021548A (zh) * 2016-10-28 2018-05-11 北京国双科技有限公司 一种情感特征的识别方法及装置
CN108073640A (zh) * 2016-11-17 2018-05-25 广州市动景计算机科技有限公司 页面推送方法和***
CN108171589A (zh) * 2018-01-29 2018-06-15 北京小度信息科技有限公司 验证方法及装置
CN108197100A (zh) * 2017-12-07 2018-06-22 东软集团股份有限公司 情感分析方法、装置、计算机可读存储介质及电子设备
CN108255803A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 文档情感的判断方法和装置
CN108319588A (zh) * 2018-02-13 2018-07-24 北京易真学思教育科技有限公司 文本情感分析***及方法、存储介质
CN109118562A (zh) * 2018-08-31 2019-01-01 百度在线网络技术(北京)有限公司 虚拟形象的讲解视频制作方法、装置以及终端
CN109117470A (zh) * 2017-06-22 2019-01-01 北京国双科技有限公司 一种评价文本信息的评价关系提取方法及装置
CN109190121A (zh) * 2018-09-03 2019-01-11 重庆工商大学 基于汽车本体和词性规则的汽车评论情感分析方法
CN109426987A (zh) * 2017-09-05 2019-03-05 本田技研工业株式会社 评价装置、评价方法、噪声消除装置和程序存储介质
CN109597984A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 一种印象标签抽取方法和装置
CN109684531A (zh) * 2018-12-20 2019-04-26 郑州轻工业学院 一种对用户评价进行情感分析的方法和装置
CN109886773A (zh) * 2019-01-17 2019-06-14 平安城市建设科技(深圳)有限公司 基于租客信用评价的推荐方法、装置、设备及存储介质
CN110033022A (zh) * 2019-03-08 2019-07-19 腾讯科技(深圳)有限公司 文本的处理方法、装置和存储介质
CN110135690A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 产品评论数据分析方法、装置、计算机设备和存储介质
CN110555109A (zh) * 2019-06-28 2019-12-10 西安理工大学 基于个人计算机电商评论的多粒度观点挖掘方法
CN110659828A (zh) * 2019-09-23 2020-01-07 上海海事大学 一种基于评论数据的软件特征评价方法
CN110706028A (zh) * 2019-09-26 2020-01-17 四川长虹电器股份有限公司 基于属性特征的商品评价情感分析***
CN110750978A (zh) * 2019-09-25 2020-02-04 深圳市金证优智科技有限公司 情感倾向分析方法、装置、电子设备及存储介质
CN110796565A (zh) * 2019-10-14 2020-02-14 广州供电局有限公司 监理日志的分析方法及分析***
CN110929528A (zh) * 2019-11-21 2020-03-27 腾讯科技(深圳)有限公司 对语句情感分析的方法、装置、服务器及存储介质
CN111274807A (zh) * 2020-02-03 2020-06-12 华为技术有限公司 文本信息的处理方法及装置、计算机设备和可读存储介质
CN111339752A (zh) * 2020-02-18 2020-06-26 哈尔滨工业大学 一种多任务联合学习的面向评价对象的情感分析方法
CN111523300A (zh) * 2020-04-14 2020-08-11 北京精准沟通传媒科技股份有限公司 一种车辆综合评价方法、装置及电子设备
CN112199956A (zh) * 2020-11-02 2021-01-08 天津大学 一种基于深度表示学习的实体情感分析方法
CN113327140A (zh) * 2021-08-02 2021-08-31 深圳小蝉文化传媒股份有限公司 基于大数据分析的视频广告投放效果智能分析管理***
CN113378578A (zh) * 2021-05-08 2021-09-10 重庆航天信息有限公司 食药舆情分析方法
CN113792118A (zh) * 2021-09-08 2021-12-14 浙江力石科技股份有限公司 基于景区评价的满意度提升***和方法
CN113837531A (zh) * 2016-05-30 2021-12-24 中国计量大学 一种基于网络评论的产品质量问题发现及风险评估方法
CN114880994A (zh) * 2022-05-25 2022-08-09 重庆邮电大学 一种直白文本到反讽文本的文本风格转换方法及装置
CN115794988A (zh) * 2022-09-13 2023-03-14 广东美云智数科技有限公司 用于提取文本的观点的方法、装置以及计算机存储介质
CN116320621A (zh) * 2023-05-17 2023-06-23 苏州极易科技股份有限公司 一种基于nlp的流媒体内容分析方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894102A (zh) * 2010-07-16 2010-11-24 浙江工商大学 一种主观性文本情感倾向性分析方法和装置
KR20120014277A (ko) * 2010-08-09 2012-02-17 숭실대학교산학협력단 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법
CN102609424A (zh) * 2011-01-21 2012-07-25 日电(中国)有限公司 评价信息抽取方法和设备
CN102663046A (zh) * 2012-03-29 2012-09-12 中国科学院自动化研究所 一种面向微博短文本的情感分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894102A (zh) * 2010-07-16 2010-11-24 浙江工商大学 一种主观性文本情感倾向性分析方法和装置
KR20120014277A (ko) * 2010-08-09 2012-02-17 숭실대학교산학협력단 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법
CN102609424A (zh) * 2011-01-21 2012-07-25 日电(中国)有限公司 评价信息抽取方法和设备
CN102663046A (zh) * 2012-03-29 2012-09-12 中国科学院自动化研究所 一种面向微博短文本的情感分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
姚天昉等: "汉语语句主题语义倾向分析方法的研究", 《中文信息学报》 *
郭叶: "中文句子情感倾向分析", 《中国优秀硕士学位论文全文数据库》 *

Cited By (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199845A (zh) * 2014-08-08 2014-12-10 杭州电子科技大学 基于主体模型的网上评论情感分类方法
CN104199845B (zh) * 2014-08-08 2018-05-29 杭州电子科技大学 基于主体模型的网上评论情感分类方法
CN105808594A (zh) * 2014-12-30 2016-07-27 广州市动景计算机科技有限公司 浏览器导航页显示方法、装置及设备
CN105808594B (zh) * 2014-12-30 2020-03-06 广州市动景计算机科技有限公司 浏览器导航页显示方法、装置及设备
US10126912B2 (en) 2014-12-30 2018-11-13 Guangzhou Ucweb Computer Technology Co., Ltd. Method, apparatus, and devices for displaying browser navigation page
CN104463180A (zh) * 2014-12-31 2015-03-25 深圳市华星光电技术有限公司 识别导电粒子压痕的方法
CN104463180B (zh) * 2014-12-31 2018-01-12 深圳市华星光电技术有限公司 识别导电粒子压痕的方法
CN106407236B (zh) * 2015-08-03 2019-07-23 北京众荟信息技术股份有限公司 一种面向点评数据的情感倾向性检测方法
CN106407236A (zh) * 2015-08-03 2017-02-15 北京众荟信息技术有限公司 一种面向点评数据的情感倾向性检测方法
CN105975453A (zh) * 2015-12-01 2016-09-28 乐视网信息技术(北京)股份有限公司 评论标签提取方法和装置
WO2017092337A1 (zh) * 2015-12-01 2017-06-08 乐视控股(北京)有限公司 评论标签提取方法和装置
CN106844403A (zh) * 2015-12-07 2017-06-13 北京国双科技有限公司 信息处理方法和装置
CN106844403B (zh) * 2015-12-07 2020-04-14 北京国双科技有限公司 信息处理方法和装置
CN106910512A (zh) * 2015-12-18 2017-06-30 株式会社理光 语音文件的分析方法、装置及***
CN105760502A (zh) * 2016-02-23 2016-07-13 常州普适信息科技有限公司 一种基于大数据文本挖掘的商品质量情感词典构建***
CN105718446A (zh) * 2016-03-08 2016-06-29 徐勇 一种基于情感分析的ugc模糊综合评价方法
CN105912720B (zh) * 2016-05-04 2019-02-22 南京大学 一种计算机中涉及情感的文本数据分析方法
CN105912720A (zh) * 2016-05-04 2016-08-31 南京大学 一种计算机中涉及情感的文本数据分析方法
CN106021433B (zh) * 2016-05-16 2019-05-10 北京百分点信息科技有限公司 一种商品评论数据的口碑分析方法和装置
CN106021433A (zh) * 2016-05-16 2016-10-12 北京百分点信息科技有限公司 一种商品评论数据的口碑分析方法和装置
CN106022878A (zh) * 2016-05-19 2016-10-12 华南理工大学 基于社区评论情感倾向性分析的手游排行榜构建方法
CN113837531A (zh) * 2016-05-30 2021-12-24 中国计量大学 一种基于网络评论的产品质量问题发现及风险评估方法
CN106294324A (zh) * 2016-08-11 2017-01-04 上海交通大学 一种基于自然语言句法分析树的机器学习情感分析器
CN106294324B (zh) * 2016-08-11 2019-04-05 上海交通大学 一种基于自然语言句法分析树的机器学习情感分析器
CN107767195A (zh) * 2016-08-16 2018-03-06 阿里巴巴集团控股有限公司 描述信息的展示***和展示、生成方法及电子设备
WO2018045910A1 (zh) * 2016-09-09 2018-03-15 阿里巴巴集团控股有限公司 情感倾向的识别方法、对象分类方法及数据处理***
CN106469145A (zh) * 2016-09-30 2017-03-01 中科鼎富(北京)科技发展有限公司 文本情感分析方法及装置
CN107918818B (zh) * 2016-10-10 2022-01-21 香港纺织及成衣研发中心有限公司 基于大数据技术的供应链管理决策支持***
CN107918818A (zh) * 2016-10-10 2018-04-17 香港纺织及成衣研发中心有限公司 基于大数据技术的供应链管理决策支持***
CN108021548A (zh) * 2016-10-28 2018-05-11 北京国双科技有限公司 一种情感特征的识别方法及装置
CN108073640A (zh) * 2016-11-17 2018-05-25 广州市动景计算机科技有限公司 页面推送方法和***
CN106610955A (zh) * 2016-12-13 2017-05-03 成都数联铭品科技有限公司 基于词典的多维度情感分析方法
CN106776574A (zh) * 2016-12-28 2017-05-31 Tcl集团股份有限公司 用户评论文本挖掘方法及装置
CN106776574B (zh) * 2016-12-28 2020-01-24 Tcl集团股份有限公司 用户评论文本挖掘方法及装置
CN108255803A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 文档情感的判断方法和装置
CN107291689A (zh) * 2017-05-31 2017-10-24 温州市鹿城区中津先进科技研究院 一种基于大数据中文网络评论语句主题语义倾向的分析方法
CN109117470A (zh) * 2017-06-22 2019-01-01 北京国双科技有限公司 一种评价文本信息的评价关系提取方法及装置
CN107391493A (zh) * 2017-08-04 2017-11-24 青木数字技术股份有限公司 一种舆情信息提取方法、装置、终端设备及存储介质
CN107391493B (zh) * 2017-08-04 2020-10-30 青木数字技术股份有限公司 一种舆情信息提取方法、装置、终端设备及存储介质
CN109426987A (zh) * 2017-09-05 2019-03-05 本田技研工业株式会社 评价装置、评价方法、噪声消除装置和程序存储介质
US11132699B2 (en) 2017-09-05 2021-09-28 Honda Motor Co., Ltd. Apparatuses, method, and computer program for acquiring and evaluating information and noise removal
CN109597984A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 一种印象标签抽取方法和装置
CN107967260A (zh) * 2017-12-07 2018-04-27 东软集团股份有限公司 一种数据处理方法、设备、***及计算机程序产品
CN107967260B (zh) * 2017-12-07 2021-09-14 东软集团股份有限公司 一种数据处理方法、设备、***及计算机可读介质
CN108197100A (zh) * 2017-12-07 2018-06-22 东软集团股份有限公司 情感分析方法、装置、计算机可读存储介质及电子设备
CN107992613A (zh) * 2017-12-18 2018-05-04 广东广业开元科技有限公司 一种基于机器学习的文本挖掘技术消费维权指标分析方法
CN108171589A (zh) * 2018-01-29 2018-06-15 北京小度信息科技有限公司 验证方法及装置
CN108319588A (zh) * 2018-02-13 2018-07-24 北京易真学思教育科技有限公司 文本情感分析***及方法、存储介质
CN108319588B (zh) * 2018-02-13 2021-02-02 北京世纪好未来教育科技有限公司 文本情感分析***及方法、存储介质
CN109118562A (zh) * 2018-08-31 2019-01-01 百度在线网络技术(北京)有限公司 虚拟形象的讲解视频制作方法、装置以及终端
CN109190121A (zh) * 2018-09-03 2019-01-11 重庆工商大学 基于汽车本体和词性规则的汽车评论情感分析方法
CN109684531A (zh) * 2018-12-20 2019-04-26 郑州轻工业学院 一种对用户评价进行情感分析的方法和装置
CN109886773A (zh) * 2019-01-17 2019-06-14 平安城市建设科技(深圳)有限公司 基于租客信用评价的推荐方法、装置、设备及存储介质
CN110033022A (zh) * 2019-03-08 2019-07-19 腾讯科技(深圳)有限公司 文本的处理方法、装置和存储介质
CN110135690A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 产品评论数据分析方法、装置、计算机设备和存储介质
CN110555109A (zh) * 2019-06-28 2019-12-10 西安理工大学 基于个人计算机电商评论的多粒度观点挖掘方法
CN110659828A (zh) * 2019-09-23 2020-01-07 上海海事大学 一种基于评论数据的软件特征评价方法
CN110659828B (zh) * 2019-09-23 2022-03-08 上海海事大学 一种基于评论数据的软件特征评价方法
CN110750978A (zh) * 2019-09-25 2020-02-04 深圳市金证优智科技有限公司 情感倾向分析方法、装置、电子设备及存储介质
CN110706028A (zh) * 2019-09-26 2020-01-17 四川长虹电器股份有限公司 基于属性特征的商品评价情感分析***
CN110796565A (zh) * 2019-10-14 2020-02-14 广州供电局有限公司 监理日志的分析方法及分析***
CN110929528B (zh) * 2019-11-21 2023-09-05 腾讯科技(深圳)有限公司 对语句情感分析的方法、装置、服务器及存储介质
CN110929528A (zh) * 2019-11-21 2020-03-27 腾讯科技(深圳)有限公司 对语句情感分析的方法、装置、服务器及存储介质
CN111274807B (zh) * 2020-02-03 2022-05-10 华为技术有限公司 文本信息的处理方法及装置、计算机设备和可读存储介质
CN111274807A (zh) * 2020-02-03 2020-06-12 华为技术有限公司 文本信息的处理方法及装置、计算机设备和可读存储介质
CN111339752A (zh) * 2020-02-18 2020-06-26 哈尔滨工业大学 一种多任务联合学习的面向评价对象的情感分析方法
CN111523300B (zh) * 2020-04-14 2021-03-05 北京精准沟通传媒科技股份有限公司 一种车辆综合评价方法、装置及电子设备
CN111523300A (zh) * 2020-04-14 2020-08-11 北京精准沟通传媒科技股份有限公司 一种车辆综合评价方法、装置及电子设备
CN112199956A (zh) * 2020-11-02 2021-01-08 天津大学 一种基于深度表示学习的实体情感分析方法
CN113378578B (zh) * 2021-05-08 2023-04-18 重庆航天信息有限公司 食药舆情分析方法
CN113378578A (zh) * 2021-05-08 2021-09-10 重庆航天信息有限公司 食药舆情分析方法
CN113327140A (zh) * 2021-08-02 2021-08-31 深圳小蝉文化传媒股份有限公司 基于大数据分析的视频广告投放效果智能分析管理***
CN113327140B (zh) * 2021-08-02 2021-10-29 深圳小蝉文化传媒股份有限公司 基于大数据分析的视频广告投放效果智能分析管理***
CN113792118A (zh) * 2021-09-08 2021-12-14 浙江力石科技股份有限公司 基于景区评价的满意度提升***和方法
CN114880994A (zh) * 2022-05-25 2022-08-09 重庆邮电大学 一种直白文本到反讽文本的文本风格转换方法及装置
CN114880994B (zh) * 2022-05-25 2024-06-11 重庆邮电大学 一种直白文本到反讽文本的文本风格转换方法及装置
CN115794988A (zh) * 2022-09-13 2023-03-14 广东美云智数科技有限公司 用于提取文本的观点的方法、装置以及计算机存储介质
CN116320621A (zh) * 2023-05-17 2023-06-23 苏州极易科技股份有限公司 一种基于nlp的流媒体内容分析方法及***
CN116320621B (zh) * 2023-05-17 2023-08-04 苏州极易科技股份有限公司 一种基于nlp的流媒体内容分析方法及***

Similar Documents

Publication Publication Date Title
CN103455562A (zh) 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器
CN103049435B (zh) 文本细粒度情感分析方法及装置
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
CN108052593A (zh) 一种基于主题词向量和网络结构的主题关键词提取方法
CN104915446A (zh) 基于新闻的事件演化关系自动提取方法及其***
CN107247780A (zh) 一种基于知识本体的专利文献相似性度量方法
US20150178273A1 (en) Unsupervised Relation Detection Model Training
CN103544242A (zh) 面向微博的情感实体搜索***
CN104391942A (zh) 基于语义图谱的短文本特征扩展方法
CN107239439A (zh) 基于word2vec的舆情倾向性分析方法
CN105528437B (zh) 一种基于结构化文本知识提取的问答***构建方法
CN103365867A (zh) 一种对用户评价进行情感分析的方法和装置
CN103617157A (zh) 基于语义的文本相似度计算方法
CN110020189A (zh) 一种基于中文相似性计算的文章推荐方法
CN103390051A (zh) 一种基于微博数据的话题发现与追踪方法
CN103544255A (zh) 基于文本语义相关的网络舆情信息分析方法
CN103064969A (zh) 自动建立关键词索引表的方法
CN108920482B (zh) 基于词汇链特征扩展和lda模型的微博短文本分类方法
CN104978332B (zh) 用户生成内容标签数据生成方法、装置及相关方法和装置
CN104484343A (zh) 一种对微博进行主题发现与追踪的方法
CN103678275A (zh) 一种基于主客观语义的双层次文本相似度计算方法
CN102033919A (zh) 文本关键词提取方法及***
CN110209818B (zh) 一种面向语义敏感词句的分析方法
Chen et al. An integration of fuzzy association rules and WordNet for document clustering
CN108763348A (zh) 一种扩展短文本词特征向量的分类改进方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20131218