CN102200973A - 生成具有基于情感导向的影响关系的观点对的设备和方法 - Google Patents
生成具有基于情感导向的影响关系的观点对的设备和方法 Download PDFInfo
- Publication number
- CN102200973A CN102200973A CN2010101315227A CN201010131522A CN102200973A CN 102200973 A CN102200973 A CN 102200973A CN 2010101315227 A CN2010101315227 A CN 2010101315227A CN 201010131522 A CN201010131522 A CN 201010131522A CN 102200973 A CN102200973 A CN 102200973A
- Authority
- CN
- China
- Prior art keywords
- viewpoint
- emotion
- influence
- relation
- viewpoints
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 46
- 238000000605 extraction Methods 0.000 claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- 230000008451 emotion Effects 0.000 claims description 133
- 230000004044 response Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 abstract description 8
- 230000000295 complement effect Effects 0.000 abstract 1
- 230000002996 emotional effect Effects 0.000 abstract 1
- 230000035807 sensation Effects 0.000 description 40
- 230000000694 effects Effects 0.000 description 37
- 238000011156 evaluation Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000000047 product Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000004438 eyesight Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
提供了一种用于生成具有基于情感导向的影响关系的观点对的设备,包括:接收单元,接收多个面向对象的观点;提取单元,在所述多个面向对象的观点中提取有影响关系的观点;分析单元,分析所提取的各个观点的情感导向;以及生成单元,在具有基于情感导向的影响关系的观点之间建立关联,以生成具有基于情感导向的影响关系的观点对。本公开通过从大量的观点中检测影响关系,可以发现更多隐含观点作为补充观点,有助于关注不同对象的用户获得更全面的评论和总结。
Description
技术领域
本公开涉及用于生成或检索具有基于情感导向的影响关系的观点对的方法和设备。
背景技术
随着网络的广泛应用和电子商务的快速拓展,越来越多的人在网上表达他们的意见和评论。这些意见和评论对潜在客户、产品制造商和在线商家有很大帮助,并且客户和制造商常常想要知道对于某些指定对象的特定意见。近年来,面向对象的意见挖掘技术可以检测客户对指定对象所表达的意见,通过总结这些意见,用户可以容易的发现哪些对象是客户最关心的,以及对每一个对象的总的情感导向。通常,人们会关心产品的不同方面,并集中在某些方面来表达意见。例如,购买了笔记本计算机的一个客户对笔记本计算机的显卡方面和屏幕方面给出了他的评论,另外一个客户在电池的待机时间方面表达了他的评论,总结所有客户的评论有助于全面反映产品的各个方面。然而,想要知道用这款笔记本计算机玩游戏的性能的客户则无法从上述两个客户的评论中发现任何直接有帮助的意见。
发明内容
根据本公开的一个方面,提供了一种用于生成具有基于情感导向的影响关系的观点对的设备,包括:接收单元,接收多个面向对象的观点;提取单元,在所述多个面向对象的观点中提取有影响关系的观点;分析单元,分析所提取的各个观点的情感导向;以及生成单元,在具有基于情感导向的影响关系的观点之间建立关联,以生成具有基于情感导向的影响关系的观点对。
根据本公开的另一个方面,提供了一种用于生成具有基于情感导向的影响关系的观点对的方法,包括:接收步骤,接收多个面向对象的观点;提取步骤,在所述多个面向对象的观点中提取有影响关系的观点;分析步骤,分析所提取的各个观点的情感导向;以及生成步骤,在具有基于情感导向的影响关系的观点之间建立关联,以生成具有基于情感导向的影响关系的观点对。
根据本公开的再一个方面,提供了一种用于检索具有影响关系的观点的设备,包括:检索单元,响应于从外部接收的查询,在数据库中检索与所述查询的对象具有影响关系的观点,所述查询的对象与所述观点具有基于情感导向的影响关系,其中被影响的观点为隐含观点。
根据本公开的另一个方面,提供了一种用于检索具有影响关系的观点的方法,包括:从外部接收查询;以及在数据库中检索与所述查询的对象有影响关系的观点,所述查询的对象与所述观点具有基于情感导向的影响关系,其中被影响的观点为隐含观点。
本公开通过从大量观点中检测情感影响关系,可以发现更多隐含观点作为补充观点,有助于关注不同对象的客户获取更全面的评论和总结。
附图说明
从下面结合附图对本公开的实施例的详细描述中,本公开的这些和/或其它方面和优点将变得更加清楚并更容易理解,其中,
图1是举例示出各个对象的情感导向之间的影响关系的图示。
图2是示出根据本公开一个实施例的用于生成具有基于情感导向的影响关系的观点对的设备的方框图。
图3是示出根据本公开另一个实施例的用于生成/检索具有影响关系的观点的设备的方框图。
图4是示出根据本公开一个实施例的用于生成具有基于情感导向的影响关系的观点对的方法的流程图。
图5是示出根据本公开再一个实施例的用于检索具有影响关系的观点的设备的方框图。
图6是示出根据本公开再一个实施例的用于检索具有影响关系的观点的方法的流程图。
具体实施方式
下面将结合附图详细描述本公开的具体实施例。如果对某些相关现有技术的详细描述可能会混淆本公开的要点,则不会在这里提供其详细描述。在各个实施例中,相同的附图标记用于表示执行同样功能的元件或单元。
首先描述本公开中使用的部分术语的含义。
观点(评价、意见等):是对某一对象的主观评价。
情感极性(或情感导向):是对某一对象的主观评价的情感倾向性,可以是正极性(褒义)或者负极性(贬义)。
(情感)影响关系:表示一种关系,即一个对象A的情感导向在一定程度上会影响另一个对象B的情感导向。
对某一对象的观点(评价、意见等):一般情况下可以用“对象+情感导向”来表示。
隐含观点:是没有直接表达在意见、评论、观点等的文本中的观点,但是可以根据被挖掘的影响关系推断出来。
观点对:是具有基于情感导向的影响关系的两个以上的观点的组合。
在不同的对象间通常存在相关性,而在对不同对象的情感导向之间也存在影响关系。
图1是举例示出各个对象的情感导向之间的影响关系的图示。
在图1中,以笔记本计算机为例示出了部分对象的不同情感导向的影响关系的图示。例如,笔记本计算机包括屏幕、电池、显卡等部件,对于屏幕,用户的评价可能涉及例如尺寸、显示效果等属性,而对于电池,用户最关心的评价可能涉及电池的待机时间等属性,对于显卡,用户关心的问题可能是显卡的性能。在这里,作为笔记本计算机的部件的屏幕、电池、显卡,以及作为属性的尺寸、显示效果、待机时间、性能等均被称为对象,而对它们的情感导向则分别可以是大或小(针对屏幕的尺寸)、清晰或模糊(针对显示效果)、长或短(针对电池的待机时间)、高或低(针对显卡的性能)等。根据本公开的实施例,在各个对象的情感导向之间存在着影响关系,例如,显卡的性能高会使屏幕的显示效果清晰,屏幕的尺寸大也会使显示效果清晰,而屏幕的尺寸大则会使电池的待机时间变短。
在本公开中,提出了根据检测到的情感影响关系来挖掘隐含观点以及生成观点对的方法和设备。如上面已经提到的,在不同对象的情感导向之间存在一定的影响关系。本公开的方法是在分析大量评论文本的基础上挖掘情感影响关系。首先,针对多个面向对象的评论文本(观点)进行接收(检测)。接着,在被接收的观点中提取对其他对象有影响关系的观点。然后,通过对这些有影响关系的观点进行情感分析,可以获得具有基于情感导向的影响关系的观点对。最后,通过统计大量观点的情感影响关系(包括可以进一步计算这些关系的置信度),可以建立包含具有情感影响关系的大量观点对的数据库。在所统计的具有基于情感导向的影响关系的大量观点对中,被施加了影响的观点可以作为施加影响的观点的隐含观点。根据所挖掘的情感影响关系,只涉及到一个对象的观点将通过挖掘与其它对象具有情感影响关系的观点而得到补充。
图2是示出根据本公开的实施例的用于生成具有基于情感导向的影响关系的观点的设备的方框图。如图2所示,根据本公开实施例的用于生成具有基于情感导向的影响关系的观点的设备200包括接收单元205、提取单元210、分析单元215以及生成单元220。接收单元205、提取单元210、分析单元215以及生成单元220分别顺序连接。接收单元205、提取单元210、分析单元215以及生成单元220也可以通过数据和/或命令总线相互连接,并按照需要传递必要的控制信息和/或数据。
根据本公开实施例的用于生成具有基于情感导向的影响关系的观点的设备200还可以包括:中央处理单元(CPU),用于执行相关的程序,以处理各种数据并控制设备200中的各个单元的操作;只读存储器(ROM),用于存储CPU进行各种处理和控制所需的各种程序;随机存取存储器(RAM),用于存储CPU在处理和控制过程中临时产生的中间数据;输入/输出(I/O)部件,用于与外部设备连接,以在外部设备和本设备200之间传输各种数据;用户接口(I/F)部件,包括键盘、鼠标,以及可以用各种显示装置实现的、用于输入/输出可视数据的显示部件,和可以输入/输出声音的音频部件,用于与用户进行交互操作,并接收用户输入的操作命令等;以及存储器,用于存储设备200所生成的各种观点数据。
上述各个部件不对本公开的范围构成限制。根据本公开的一个实施例,也可以通过与上述CPU、ROM、RAM、I/O、I/F以及存储器等相结合的功能软件来实现接收单元205、提取单元210、分析单元215以及生成单元220中的一个或多个的功能。并且,接收单元205、提取单元210、分析单元215以及生成单元220中的一个或多个的功能也可以合并为一个单元来实现。
根据本公开的实施例,接收单元205接收(例如通过在网络上进行搜索/检测)多个面向对象的观点。如图2所示,这些观点可以是输入到接收单元205中的大量的评论文字和/或原始意见等,可以称为“原始观点”。这些观点也可以是网络上或其它信息源中存在的观点,接收单元205通过在网络上进行搜索/检测等方式来获得。该网络可以是包括互联网、城际网、企业内联网等的广域网,也可以是局域网,可以是有线网络,也可以是无线网络等。这些观点可以存在于网络中的某些节点的数据库中。接收单元205从网络接收的观点例如可以是“显卡性能,高”,“显示效果,清晰”,“屏幕尺寸,大”,“待机时间,长”,“玩游戏的感觉,好”等。
对观点的检测、接收,在技术上称为观点挖掘(Opinion Mining),其首先要确认观点(评论)中的情感所作用的对象,也就是评论对象,然后再分析关于这个评论对象的评论的情感倾向性。例如,评论“这款电脑的屏幕很清晰”。其中,“屏幕[显示]”就是这则评论的对象。“很清晰”是情感词,其情感倾向性为褒义,也就是说该评论是关于电脑“屏幕”的一则褒义评价。
接收单元205从互联网或者其它信息源接收(搜索/检测)观点的方法可以使用但不限于如下的方法:第一步,需要从互联网或者其他信息源抓取信息,通常使用搜索的网络爬虫技术。第二步,对抓取的信息进行过滤,去除非评论性信息(客观信息),保留评论性信息(主观信息)。技术上多使用分类的技术,将信息分为两类,即主观性的和非主观性的。第三步,抽取评论中的评论对象。目前,主要使用的技术方法有:(1)基于规则的方法,通过制定关注评论对象的内部语法构成特点和上下文规则,来进行评论对象的抽取。例如:评论对象一般为名词(N)结构短语,可以将名词构成的短语提取出来作为评论对象,或者形容词或者情感词修饰的对象通常是评论对象等等。(2)基于学习(有指导)的方法,这种方法多通过标注训练样例来训练一个实体识别模型,来自动地识别评论对象。(3)借助半结构的方法,这种方法多是通过评论本身的一些结构化(layout)信息,来推导可能的评论对象,如产品说明书,产品评论中总结性的短语评论等等,如很多评论网站提供的总结性评论,评论者被推荐使用简短的评论来总结自己对产品的观点,如“待机时间长”,简单的切分或者与正文匹配(基于同一个用户的用语习惯在同一个评论中变化不大的假设)就可以获得。第四步(可缺省),由于用户的用语习惯各不相同,当他们在表达同样的事物时可能用词有所不同,例如:甲说“屏幕”,乙说“显示屏”,它们指的都是同样的事物,为此,将评论对象按语义相关聚集在一起,有利于找到更多与评论对象相关的评论。目前,多使用基于主题模型的(Topic Model)的技术,就是将评论对象的上下文作为语义特征,再使用主题模型将这些语义的分布进行聚类,将具有相近语义分布的评论对象指定为语义相关的评论对象。此外,评论中有很多隐含对象,如“这款手机很漂亮!”中的评论对象是手机的“外观”,可以通过使用观点词“漂亮”推导对象词“外观”的方法获得。同样,对一些对象进行细化也可以使用同样的方法,如“这款电脑的屏幕很清晰”中的评论对象“屏幕”可以通过观点词“清晰”推导细化到“屏幕[显示]”。
如前所述,所接收的观点的表达结构例如可以是“对象,情感”这种结构,其表示作用在该对象上的主观评价。例如如上所示的观点“显卡性能,高”,“显示效果,清晰”,“屏幕尺寸,大”,“待机时间,长”,“玩游戏的感觉,好”等。
上述方法不对本公开的技术范围构成限制,本领域的技术人员可以使用其它方法来进行观点的接收(检测)。
接收单元205可以将接收到的面向对象的观点输出给提取单元210,也可以将接收到的面向对象的观点存储于例如存储器中。该存储器中可以存储大量的面向对象的观点。
提取单元210在从接收单元205接收的多个面向对象的观点中提取有影响关系的观点。提取有影响关系的观点的方式可以是利用语义规则、上下文共现等方式对已获取的临近观点进行分析,判断他们是否是具有潜在影响关系的观点。
更具体地,本领域的技术人员可以通过但不限于以下两种方式提取有影响关系的观点:(1)规则的方法。具有因果或者影响关系的观点,很多情况下是由某些连词连接的,如“我很喜欢大屏幕的相机,可是这种手机一般待机时间都太短了!”。例句中的连词“可是”可以推出上下两个观点对有一定的影响关系“屏幕[尺寸],大”→“待机时间,短”。为此,通过将相关连词附近的观点进行关联,可以获得相互间具有影响关系的潜在观点。(2)共现统计的方法。常常共同出现在临近上下文中的观点具有一定的关联影响关系,通过统计共现关系中频度高的观点可以获得可能性较高的具有影响关系的对象间的观点。通过使用上述这些方法,可以获得相互间具有影响关系的潜在观点。
这里举例说明的提取方式不对本公开的范围构成限制。本领域的技术人员也可以利用其它方式来提取这些有影响关系的观点。
提取单元210将所提取的有影响关系的观点的数据输出给分析单元215。分析单元215对从提取单元210接收的所提取的各个观点进行分析,即分析各个观点的情感导向,并获得各个相关联的观点之间的情感影响关系。
分析观点的情感导向及情感导向间的影响关系的情感分析技术是一种分类技术,即将观点分为褒义(正极性)、贬义(负极性)两种类别。可使用机器学习的方法训练一个分类器,也可以使用情感词表的方法,通过词表中记录的情感词的极向性来计算观点的情感极向性。通过情感分析方法分析所有观点中观点的情感倾向性(褒义、贬义),以此判断观点间的情感影响关系,并将对象间的观点转换为对象间的情感影响关系。
上述分析方法不对本公开的技术范围构成限制,本领域的技术人员可以使用其它分析方法来获取观点的情感导向及情感导向间的影响关系。
根据情感分析的结果,情感导向可以是正极性或者负极性。例如,如图1中所示,“显卡性能,高”对“显示效果,清晰”的情感导向是正极性,“屏幕尺寸,大”对“显示效果,清晰”的情感导向也是正极性,即前者对后者存在积极的、有利的影响。“屏幕尺寸,大”对“待机时间,长”的情感导向则是负极性,即有消极的、不利的影响。还有,“显示效果,清晰”、“屏幕尺寸,大”、“待机时间,长”等观点对“玩游戏的感觉,好”的情感导向也是正极性。然后,分析单元215将上述分析结果输出给生成单元220。
生成单元220根据从分析单元215输入的分析结果,在具有基于情感导向的影响关系的观点之间建立关联,形成具有基于情感导向的影响关系的“关系对”,即“观点对”,该观点对中的被影响的观点称为隐含观点。例如,通过在分析单元215中所获得的情感影响关系,可以获得如下的观点对:
“显卡性能,高”→“显示效果,清晰”(正极性),
“屏幕尺寸,大”→“显示效果,清晰”(正极性),
“屏幕尺寸,大”→“待机时间,短”(负极性),
“屏幕尺寸,大”→“玩游戏的感觉,好”(正极性),
“显示效果,清晰”→“玩游戏的感觉,好”(正极性),
“待机时间,长”→“玩游戏的感觉,好”(正极性),
另外,根据本公开的另一个实施例,在“显卡性能,高”→“显示效果,清晰”(正极性),以及“显示效果,清晰”→“玩游戏的感觉,好”(正极性)的基础上,还可以获得进一步的观点对:
“显卡性能,高”→“玩游戏的感觉,好”(正极性)。
这里,每个具有情感影响关系的观点对中位于后面的被影响的观点是隐含观点,例如“显示效果,清晰”、“待机时间,短”和“玩游戏的感觉,好”等。
生成单元220可以统计大量的观点,以生成包含具有基于情感导向的影响关系的观点对的数据库。即,通过统计大量的面向对象的观点,获得大量的如上所示的具有情感影响关系的观点对,由此建立情感影响关系数据库。
统计大量观点以形成数据库的方法可以是但不限于如下方式:在收集到的大量观点中统计具有基于情感导向的影响关系的观点对“对象_1,极性_1”→“对象_2,极性_2”的所有情况。总共有四种情况,分别为:
“对象_1,正极性”→“对象_2,正极性”;
“对象_1,正极性”→“对象_2,负极性”;
“对象_1,负极性”→“对象_2,正极性”;和
“对象_1,负极性”→“对象_2,负极性”。
上述情况表示了对象_1和对象_2之间情感影响关系的分布情况。生成单元220通过统计这种分布,并为每种影响关系确定一个置信度(confidencescore)来表示对象间的某种影响关系的可信度和权重。将这些具有情感影响关系的观点对和他们的置信度存储在数据库中,就形成了上述的情感影响关系数据库,可以用于对隐含观点的搜索和使用。
置信度可以简单地通过计算每种情况占所有情况的分布比例来获得,也可以通过其它的统计方法来获得。例如,置信度的计算可以是但不限于以下述方式来进行:在计算置信度时,考虑各个观点对的情感影响关系的分布。例如,在计算观点“屏幕尺寸,大”(后面称为施加影响的观点)对“显示效果,清晰”(后面称为被施加影响的观点,即隐含观点)的置信度时,要考虑该隐含观点共受到多少个施加影响的观点的影响。这里,由于共有两个施加影响的观点“屏幕尺寸,大”和“显卡性能,高”会对隐含观点“显示效果,清晰”产生影响,因此施加影响的观点“屏幕尺寸,大”或者“显卡性能,高”对隐含观点“显示效果,清晰”的置信度分别为50%,其表示从施加影响的观点“屏幕尺寸,大”或者“显卡性能,高”可以推知隐含观点“显示效果,清晰”的可能性、并对隐含观点“显示效果,清晰”的影响度分别为50%。
由上所述,可知上述计算置信度的方法是:
其含义为,某一施加影响的观点针对某一隐含观点的置信度(影响度)是对该隐含观点施加影响的所有观点的数量分之一。
根据如上所述,并通过结合所计算的置信度,可以获得如下的观点对:
“显卡性能,高”→“显示效果,清晰”(正极性50%),
“屏幕尺寸,大”→“显示效果,清晰”(正极性50%),
“屏幕尺寸,大”→“待机时间,短”(负极性100%),
“屏幕尺寸,大”→“玩游戏的感觉,好”(正极性33.33%),
“显示效果,清晰”→“玩游戏的感觉,好”(正极性33.33%),
“待机时间,长”→“玩游戏的感觉,好”(正极性33.33%)。
根据本公开的另一个实施例,根据“显卡性能,高”→“显示效果,清晰”正极性(50%),以及“显示效果,清晰”→“玩游戏的感觉,好”正极性(33.33%),还可以得出观点“显卡性能,高”对“玩游戏的感觉,好”的置信度为:
50%×33.33%=16.67%,
即可以获得观点对:
“显卡性能,高”→“玩游戏的感觉,好”(正极性16.67%)。
上述计算置信度的方法不对本公开的范围构成限制,本领域的技术人员可以采用其它各种方法来计算置信度,而不影响本公开的范围。
所建立的情感影响关系数据库可以位于本公开的设备200的内部并存储于存储器中,也可以位于本公开设备200的外部。根据本公开的另一个实施例,当在原始观点中存在具有情感影响关系的观点对时,也可以直接将这种情感影响关系的观点对存储到情感影响关系数据库中。例如,在原始评价中,有例如“显卡很好,玩游戏感觉不错”的评价,这时可以直接获得:“显卡性能,高”→“玩游戏的感觉,好”的具有情感影响关系的观点对。
在考虑情感影响关系时,可以考虑其在一般领域的影响,也可以考虑其在特定领域内的影响。例如,在考虑“屏幕尺寸,大”时,可以仅在所针对的笔记本计算机的特定领域内进行情感影响关系的建立,例如其对“显示效果,清晰”是正极性。当然,也可以在一般领域内建立情感影响关系,例如“屏幕尺寸,大”对“视力,好”是正极性等。这里,“视力,好”与“显示效果,清晰”相比,是更一般领域的观点。这样,根据本公开的另一个实施例,可以针对不同的需求建立不同的情感影响关系数据库,该数据库内容的范围可根据需要而适当设置。
图3是示出根据本公开另一实施例的用于生成/检索具有基于情感导向的影响关系的观点的设备的方框图。对于图3中与图2中所示出的相同单元,用相同的附图标记表示,并省略对它们的详细描述。
与图2中所示出的设备200不同的是,图3所示的根据本公开另一个实施例的用于生成/检索具有基于情感导向的影响关系的观点的设备300还包括检索单元330,检索单元330连接到情感影响关系数据库225。检索单元330响应于从外部接收的查询,在数据库中检索与该查询的对象具有影响关系的观点。该查询的对象与该观点之间具有基于情感导向的影响关系,其中被影响的观点为隐含观点。
根据本公开的一个实施例,用户可以在例如浏览器的显示界面的输入窗口中直接输入要查询的问题来进行搜索。例如,用户可以直接在浏览器的显示界面的输入窗口中输入“某款笔记本计算机的型号”和“玩游戏的感觉怎么样?”的问题。在点击“搜索”按钮后,浏览器开始在互联网上进行搜索,但是并没有获得要查询的有关该款笔记本计算机的“玩游戏的感觉”的信息。在这种情况下,浏览器可以自动启动检索单元330,或者浏览器也可以反馈(在显示界面上显示文字或图标或者用语音进行通知)未搜索到相关信息的消息,并由该用户手动点击在屏幕上显示的“启动”按钮来启动检索单元330。在接收到启动命令后,检索单元330从上述查询的问题中提取出要查询的对象“玩游戏的感觉”,并根据输入的“该款笔记本计算机的型号”设定检索范围,然后在影响关系数据库225中进行检索,寻找与该对象有影响关系的观点。当检索单元330在影响关系数据库225中检索到与“玩游戏的感觉”具有基于情感导向的影响关系的观点时,就通过用户接口装置(如显示器)输出检索到的观点对或者仅输出检索到的隐含观点,以向该用户通知所找到的各个观点,例如:“屏幕尺寸,大”→“玩游戏的感觉,好”(正极性33.33%),“显示效果,清晰”→“玩游戏的感觉,好”(正极性33.33%),“待机时间,长”→“玩游戏的感觉,好”(正极性33.33%),“显卡性能,高”→“玩游戏的感觉,好”(正极性16.67%),等等。
由此,该用户可以根据他在上述检索结果中看到的上述各个观点,获得他所关注的其它用户对用该款笔记本计算机“玩游戏的感觉”的评价。这样,根据用本公开的方法和设备所生成的具有基于情感导向的影响关系的观点数据库,仅涉及到一个对象的观点会通过与该对象具有情感影响关系的其它观点而得到补充。
根据本公开的另一个实施例,当本公开的设备300的用户通过网络浏览等操作接收到有关某个对象的观点或评论时,如果这些观点不是该用户期望获得的观点,则该用户可以通过I/O装置等向检索单元330发出指令,直接针对从外部接收的这些观点,在影响关系数据库225中进行检索,寻找与所接收的观点有基于情感导向的影响关系的观点。当检索单元330在影响关系数据库225中检索到相关的观点时,就向外部输出检索到的观点,以通过用户接口装置(如显示器、扬声器等)向该用户通知所找到的观点。
例如,一个用户对某一款笔记本计算机感兴趣,并且希望在网络上寻找有关利用该款笔记本计算机玩游戏的一些评价,但是他在网页上看到的仅仅是“显卡很好”的评价,而该用户又不知道“显卡很好”与玩游戏之间是什么样的关系。这时,该用户可以在浏览器的显示界面的输入窗口中输入“显卡很好”或类似的文字,并点击“搜索”,以向检索单元330发出启动检索的指令。在接到指令后,检索单元330开始在影响关系数据库225中进行检索,寻找与所接收的该观点有影响关系的观点。当检索单元330在影响关系数据库225中检索到与“显卡,好”相关的观点例如“显示效果,清晰”和“玩游戏的感觉,好”时,就输出检索到的上述观点,以通过用户接口装置(如显示器)向该用户通知所找到的观点。这时,所输出的观点例如“显示效果,清晰”和“玩游戏的感觉,好”是所查询的对象“显卡很好”的隐含观点。由此,该用户可以根据他在网页上看到的“显卡很好”的评价,获得他所关注的“玩游戏的感觉,好”的评价。另外,该用户也可以通过直接在浏览器的显示界面上点击“显卡很好”的链接来向检索单元330发出启动检索的指令。
触发检索单元330进行检索的方式不对本公开的范围构成限制,本领域的技术人员也可以通过其它已知的方式来启动检索单元330的检索操作。
图4是示出根据本公开的实施例的用于生成具有基于情感导向的影响关系的观点对的方法的流程图。
如图4所示,在步骤S405中,接收多个面向对象的观点。在步骤S410中,在多个面向对象的观点中提取有影响关系的观点。在步骤S415中,分析所提取的各个观点的情感导向。在步骤S420中,根据分析结果,将具有基于情感导向的影响关系的观点关联为观点对,其中被施加影响的观点形成为隐含观点。
上述步骤S405可以由根据本公开的设备200或设备300中的接收单元205来完成,上述步骤S410可以由根据本公开的设备200或设备300中的提取单元210来完成,上述步骤S415可以由根据本公开的设备200或设备300中的分析单元215来完成,上述步骤S420可以由根据本公开的设备200或设备300中的生成单元220来完成。
根据本公开的一个实施例还可以包括步骤:计算(情感)影响关系的置信度,以表示情感影响关系的权重,即表示某一对象的观点的情感导向对另一对象的观点的情感导向的影响的权重。上述步骤可以由根据本公开的设备200或设备300中的生成单元220来完成。
根据本公开的一个实施例还包括步骤:统计大量观点,以生成(情感)影响关系数据库。即,通过统计大量的面向对象的观点,获得大量的如上所示的具有情感影响关系的观点对,由此建立影响关系数据库。上述步骤可以由根据本公开的设备200或设备300中的生成单元220来完成。
根据本公开的另一个实施例还包括步骤:响应于从外部接收的查询,在上述影响关系数据库中检索与该查询有影响关系的观点。上述步骤可以由根据本公开的设备300中的检索单元330来完成。
图5是示出根据本公开的另一个实施例的用于检索具有影响关系的观点的设备的方框图。如图5所示,根据本公开的另一个实施例的用于检索具有情感影响关系的观点的设备500包括检索单元530。
根据本公开的另一个实施例的用于检索具有情感影响关系的观点的设备500还可以包括:中央处理单元(CPU),用于执行相关的程序,以处理各种数据并控制设备500中的各个部件的操作;只读存储器(ROM),用于存储CPU进行各种处理和控制所需的各种程序;随机存取存储器(RAM),用于存储CPU在处理和控制过程中临时产生的中间数据;输入/输出(I/O)部件,用于与外部设备连接,以在外部设备和本公开的设备500之间传输各种数据;用户接口(I/F)部件,包括键盘、鼠标,以及可以用各种显示装置实现的、用于输入/输出可视数据的显示部件,和可以输入/输出声音的音频部件,用于与用户进行交互操作,并接收用户输入的操作命令等;以及存储器,用于存储根据本公开的设备500的各种数据。
上述各个部件不对本公开的范围构成限制。根据本公开的一个实施例,也可以通过与上述CPU、ROM、RAM、I/O、I/F以及存储器等相结合的功能软件来实现检索单元530的功能。
检索单元530响应于从外部接收的查询,在数据库525中检索与该查询的对象具有影响关系的观点。该查询的对象与该观点之间具有基于情感导向的影响关系,其中被影响的观点为隐含观点。根据本公开的一个实施例,用户可以在例如浏览器的显示界面的输入窗口中直接输入要查询的问题来进行搜索。例如,用户可以直接在浏览器的显示界面的输入窗口中输入“某款笔记本计算机的型号”和“玩游戏的感觉怎么样?”的问题。在点击“搜索”按钮后,浏览器开始在互联网上进行搜索,但是并没有获得要查询的有关该款笔记本计算机的“玩游戏的感觉”的信息。在这种情况下,浏览器可以自动启动检索单元530,或者浏览器也可以反馈(在显示界面上显示文字或图标或者用语音进行通知)未搜索到相关信息的消息,并由该用户手动点击在屏幕上显示的“启动”按钮来启动检索单元530。在接收到启动命令后,检索单元530从上述查询的问题中提取出要查询的对象“玩游戏的感觉”,并根据输入的“该款笔记本计算机的型号”设定检索范围,然后在影响关系数据库525中进行检索,寻找与该对象有基于情感导向的影响关系的观点。当检索单元530在影响关系数据库225中检索到与“玩游戏的感觉”有基于情感导向的影响关系的观点时,就通过用户接口装置(如显示器)输出检索到的观点,以向该用户通知所找到的各个观点,例如:“屏幕尺寸,大”→“玩游戏的感觉,好”,“显示效果,清晰”→“玩游戏的感觉,好”,“待机时间,长”→“玩游戏的感觉,好”,“显卡性能,高”→“玩游戏的感觉,好”等。
由此,该用户可以根据他在上述检索结果中看到的上述各个观点,获得他所关注的其它用户对用该款笔记本计算机“玩游戏的感觉”的评价。这样,基于根据用本公开的方法和设备所生成的具有基于情感导向的影响关系的观点数据库,仅涉及到一个对象的观点会通过与该对象具有情感影响关系的其它观点而得到补充。
根据本公开的另一个实施例,检索单元530还可以直接响应于从外部接收的观点,在影响关系数据库525中检索与所接收的观点有基于情感导向的影响关系的观点,并输出检索到的观点。更具体地,检索单元530从外部接收他人的观点(评价),例如用户通过浏览器从网络上搜索到他人的观点。根据用户从I/O接口等输入的指令,检索单元530基于所获得的他人的观点,在影响关系数据库525中搜索与该观点具有影响关系的观点,并输出所获得的各个观点,作为扩展的观点。这里,影响关系数据库525中包括基于情感导向而具有影响关系的大量观点的观点对,这些观点对中的被影响的观点为隐含观点。
例如,用户在网络上寻找到有关某款笔记本计算机的评论“屏幕尺寸大”的评论,但是该用户直接关注的是有关显示效果的评论,在这种情况下,用户可以通过在浏览器的显示界面的输入窗口中输入“屏幕尺寸大”或类似的文字,并点击“搜索”按钮,以向检索单元530发出启动检索的指令。在接收到该指令后,检索单元530在数据库525中进行检索。当在数据库525中检索到“屏幕,大”→“显示效果,清晰”(正极性50%),“屏幕尺寸,大”→“待机时间,短”(负极性100%),以及“屏幕尺寸,大”→“玩游戏的感觉,好”(正极性33.33%)等观点对时,检索单元530就会通过显示器等用户界面来输出所检索到的上述各个观点对。这时,所输出的观点对中的例如“显示效果,清晰”,“待机时间,短”,以及“玩游戏的感觉,好”等是所查询的对象“屏幕尺寸大”的隐含观点。由此,该用户可以获得有关其想要获得的该款笔记本计算机的显示效果的其他用户的观点。另外,该用户也可以通过直接在浏览器的显示界面上点击“屏幕尺寸大”的链接来向检索单元530发出启动检索的指令。启动检索单元530进行检索的方式不对本公开的范围构成限制,本领域的技术人员也可以通过其它已知的方式来启动检索单元530的检索操作。
图6是根据本公开的另一个实施例的用于检索具有影响关系的观点的方法的流程图。
如图6所示,在步骤S605中,从外部接收查询。在步骤S610中,在数据库中检索与所接收的查询的对象有影响关系的观点。在步骤S615中,输出检索到的观点,其中该查询的对象与检索到的观点具有基于情感导向的影响关系,其中被影响的观点为隐含观点。
上述步骤S605、S610和S615可以由图5中所示的检索单元530来完成。
本公开的上述实施例仅为示例性描述,其中的影响关系数据库的内容不限于所列举的示例,还可以包括网络上存在的所有种类的用户观点和评价。
本公开的上述实施例仅为示例性描述,它们的具体结构和操作不对本公开的范围构成限制,本领域的技术人员可以将上述各个实施例中的不同部分和操作进行组合,产生新的实施方式,同样符合本公开的构思。
本公开的实施例可以通过硬件、软件、固件或它们之间结合的方式来实现,其实现方式不对本公开的范围构成限制。
本公开的实施例中的各个功能元件(单元)相互之间的连接关系不对本公开的范围构成限制,其中的一个或多个功能元件可以包括或连接于其它任意的功能元件。
虽然上面已经结合附图示出并描述了本公开的一些实施例,但是本领域的技术人员应当理解,在不偏离本公开的原则和精神的情况下,可以对这些实施例进行变化和修改,但它们仍然落在本公开的权利要求及其等价物的范围之内。
Claims (13)
1.一种用于生成具有基于情感导向的影响关系的观点对的设备,包括:
接收单元,接收多个面向对象的观点;
提取单元,在所述多个面向对象的观点中提取有影响关系的观点;
分析单元,分析所提取的各个观点的情感导向;以及
生成单元,在具有基于情感导向的影响关系的观点之间建立关联,以生成具有基于情感导向的影响关系的观点对。
2.如权利要求1所述的设备,其中所述生成单元计算所述基于情感导向的影响关系的置信度,以形成所述影响关系的权重。
3.如权利要求1所述的设备,其中所述生成单元统计大量观点,以生成影响关系数据库。
4.如权利要求3所述的设备,还包括检索单元,响应于从外部接收的查询,在所述影响关系数据库中检索与所述查询的对象有基于情感导向的影响关系的观点。
5.如权利要求4所述的设备,所述观点对中的被影响的观点为隐含观点,并且与所述查询的对象有基于情感导向的影响关系的所述观点是所述查询对象的隐含观点。
6.如权利要求1所述的方法,其中情感导向是正极性或者负极性。
7.一种用于生成具有基于情感导向的影响关系的观点对的方法,包括:
接收步骤,接收多个面向对象的观点;
提取步骤,在所述多个面向对象的观点中提取有影响关系的观点;
分析步骤,分析所提取的各个观点的情感导向;以及
生成步骤,在具有基于情感导向的影响关系的观点之间建立关联,以生成具有基于情感导向的影响关系的观点对。
8.如权利要求7所述的方法,还包括步骤:计算所述基于情感导向的影响关系的置信度,以表示所述影响关系的权重。
9.如权利要求7所述的方法,还包括步骤:统计大量观点,以生成影响关系数据库。
10.如权利要求9所述的方法,还包括步骤:响应于从外部接收的查询,在所述影响关系数据库中检索与所述查询的对象有基于情感导向的影响关系的观点。
11.如权利要求10所述的设备,所述观点对中的被影响的观点为隐含观点,并且与所述查询的对象有基于情感导向的影响关系的所述观点是所述查询的对象的隐含观点。
12.一种用于检索具有影响关系的观点的设备,包括:
检索单元,响应于从外部接收的查询,在数据库中检索与所述查询的对象具有影响关系的观点,
所述查询的对象与所述观点具有基于情感导向的影响关系,其中被影响的观点为隐含观点。
13.一种用于检索具有影响关系的观点的方法,包括:
从外部接收查询;以及
在数据库中检索与所述查询的对象有影响关系的观点,
所述查询的对象与所述观点具有基于情感导向的影响关系,其中被影响的观点为隐含观点。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101315227A CN102200973A (zh) | 2010-03-22 | 2010-03-22 | 生成具有基于情感导向的影响关系的观点对的设备和方法 |
US13/053,360 US9015168B2 (en) | 2010-03-22 | 2011-03-22 | Device and method for generating opinion pairs having sentiment orientation based impact relations |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101315227A CN102200973A (zh) | 2010-03-22 | 2010-03-22 | 生成具有基于情感导向的影响关系的观点对的设备和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102200973A true CN102200973A (zh) | 2011-09-28 |
Family
ID=44648061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010101315227A Pending CN102200973A (zh) | 2010-03-22 | 2010-03-22 | 生成具有基于情感导向的影响关系的观点对的设备和方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9015168B2 (zh) |
CN (1) | CN102200973A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577452A (zh) * | 2012-07-31 | 2014-02-12 | 国际商业机器公司 | 用于丰富网站内容的方法和装置、网站服务器 |
CN106528519A (zh) * | 2015-09-09 | 2017-03-22 | 佳能信息技术(北京)有限公司 | 文本挖掘的方法和装置 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9129017B2 (en) | 2009-12-01 | 2015-09-08 | Apple Inc. | System and method for metadata transfer among search entities |
US11113299B2 (en) | 2009-12-01 | 2021-09-07 | Apple Inc. | System and method for metadata transfer among search entities |
US10275525B2 (en) * | 2012-06-14 | 2019-04-30 | Excalibur Ip, Llc | Method and system for mining trends around trending terms |
US20190019094A1 (en) * | 2014-11-07 | 2019-01-17 | Google Inc. | Determining suitability for presentation as a testimonial about an entity |
CN104516986B (zh) * | 2015-01-16 | 2018-01-16 | 青岛理工大学 | 一种语句识别方法及装置 |
RU2635257C1 (ru) | 2016-07-28 | 2017-11-09 | Общество с ограниченной ответственностью "Аби Продакшн" | Сентиментный анализ на уровне аспектов и создание отчетов с использованием методов машинного обучения |
US11003716B2 (en) * | 2017-01-10 | 2021-05-11 | International Business Machines Corporation | Discovery, characterization, and analysis of interpersonal relationships extracted from unstructured text data |
US10679010B2 (en) * | 2018-03-28 | 2020-06-09 | Wipro Limited | Method and system of generating dialogue responses for users in real-time |
CN111259159A (zh) * | 2018-11-30 | 2020-06-09 | 北京京东尚科信息技术有限公司 | 数据挖掘方法、装置和计算机可读存储介质 |
US10984388B2 (en) | 2018-12-14 | 2021-04-20 | International Business Machines Corporation | Identifying complaints from messages |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7953219B2 (en) * | 2001-07-19 | 2011-05-31 | Nice Systems, Ltd. | Method apparatus and system for capturing and analyzing interaction based content |
US8200477B2 (en) * | 2003-10-22 | 2012-06-12 | International Business Machines Corporation | Method and system for extracting opinions from text documents |
WO2006020497A2 (en) * | 2004-08-11 | 2006-02-23 | Evalubase Research, Inc. | Apparatus, system, and methods for collaborative research |
US20060053156A1 (en) * | 2004-09-03 | 2006-03-09 | Howard Kaushansky | Systems and methods for developing intelligence from information existing on a network |
US20090048823A1 (en) * | 2007-08-16 | 2009-02-19 | The Board Of Trustees Of The University Of Illinois | System and methods for opinion mining |
US8417713B1 (en) * | 2007-12-05 | 2013-04-09 | Google Inc. | Sentiment detection as a ranking signal for reviewable entities |
US20090164408A1 (en) * | 2007-12-21 | 2009-06-25 | Ilya Grigorik | Method, System and Computer Program for Managing Delivery of Online Content |
US20100121707A1 (en) * | 2008-11-13 | 2010-05-13 | Buzzient, Inc. | Displaying analytic measurement of online social media content in a graphical user interface |
US8694358B2 (en) * | 2009-04-14 | 2014-04-08 | Vital Insights Inc. | Systems, methods, and media for survey management |
US20110099052A1 (en) * | 2009-10-28 | 2011-04-28 | Xerox Corporation | Automatic checking of expectation-fulfillment schemes |
-
2010
- 2010-03-22 CN CN2010101315227A patent/CN102200973A/zh active Pending
-
2011
- 2011-03-22 US US13/053,360 patent/US9015168B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103577452A (zh) * | 2012-07-31 | 2014-02-12 | 国际商业机器公司 | 用于丰富网站内容的方法和装置、网站服务器 |
CN106528519A (zh) * | 2015-09-09 | 2017-03-22 | 佳能信息技术(北京)有限公司 | 文本挖掘的方法和装置 |
CN106528519B (zh) * | 2015-09-09 | 2019-04-30 | 佳能信息技术(北京)有限公司 | 文本挖掘的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
US9015168B2 (en) | 2015-04-21 |
US20110231448A1 (en) | 2011-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102200973A (zh) | 生成具有基于情感导向的影响关系的观点对的设备和方法 | |
CN107491531B (zh) | 基于集成学习框架的中文网络评论情感分类方法 | |
CN107832286B (zh) | 智能交互方法、设备及存储介质 | |
CN103853824B (zh) | 一种基于深度语义挖掘的内文广告发布方法与*** | |
CN104969173B (zh) | 动态应用过滤运算器的自适应对话状态管理方法和*** | |
CN106570106A (zh) | 一种输入过程中将语音信息转化为表情的方法和装置 | |
CN106462640B (zh) | 对多媒体内容进行的场境搜索 | |
JP5711674B2 (ja) | 大量のコメント文章を用いた質問回答プログラム、サーバ及び方法 | |
JP2017215931A (ja) | 会議支援システム、会議支援装置、会議支援方法及びプログラム | |
CN108062304A (zh) | 一种基于机器学习的商品评论数据的情感分析方法 | |
CN104836720A (zh) | 交互式通信中进行信息推荐的方法及装置 | |
JP5494126B2 (ja) | 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム | |
JP6529133B2 (ja) | 複数地域でのトピックの評価を分析する装置、プログラム及び方法 | |
JP6994289B2 (ja) | キャラクタ属性に応じた対話シナリオを作成するプログラム、装置及び方法 | |
Shekhawat | Sentiment classification of current public opinion on BREXIT: Naïve Bayes classifier model vs Python’s TextBlob approach | |
Ahmed et al. | Sentiment analysis for smart cities: state of the art and opportunities | |
Hong et al. | Automatically extracting word relationships as templates for pun generation | |
Rathan et al. | Every post matters: a survey on applications of sentiment analysis in social media | |
Andriotis et al. | Smartphone message sentiment analysis | |
Welivita et al. | Fine-grained emotion and intent learning in movie dialogues | |
US9965766B2 (en) | Method to expand seed keywords into a relevant social query | |
JP2016162357A (ja) | 商品に対するユーザの感情分析装置及びプログラム | |
KR20090126862A (ko) | 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체 | |
JP6676699B2 (ja) | 予約語及び属性言語間の関連度を用いた情報提供方法及び装置 | |
Tao et al. | Mining Pain Points from Hotel Online Comments Based on Sentiment Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110928 |