CN110737845A - 一种实现信息分析的方法、计算机存储介质及*** - Google Patents
一种实现信息分析的方法、计算机存储介质及*** Download PDFInfo
- Publication number
- CN110737845A CN110737845A CN201910977377.5A CN201910977377A CN110737845A CN 110737845 A CN110737845 A CN 110737845A CN 201910977377 A CN201910977377 A CN 201910977377A CN 110737845 A CN110737845 A CN 110737845A
- Authority
- CN
- China
- Prior art keywords
- entity
- product
- social media
- determining
- consumer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种实现信息分析的方法、计算机存储介质及***,包括:根据预设的行业规则,对经过自然语言处理的社交媒体信息进行匹配分析,识别出所述社交媒体信息中包含的实体并对所述实体进行标记;通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,以确定所述社交媒体信息中实体之间的关系。本发明实施例通过关系模型对实体之间的关联关系进行了确定,提升了同时提及方法的信息分析质量。
Description
技术领域
本文涉及但不限于数据处理技术,尤指一种实现信息分析的方法、计算机存储介质及***。
背景技术
随着移动互联网的应用发展,社交媒体应用成为人们获取产品信息、信息交流及分享的重要渠道。通过社交媒体账号,可以实现对用户的初步分析;通过一定数量社交媒体账号发表的信息,可以了解他们正在热议的品牌、产品及功能、关注的关键意见领袖(KOL,Key Opinion Leader)及知名人物,能够帮助企业进行市场分析、掌握品牌热度、更准确的进行商业活动(包括挑选KOL及代言人等);通过获取一定时长内社交媒体账户发布的信息,可以进行用户画像,通过用户画像能够为企业直观、全面的分析用户的消费信息,从而准确的把握用户的消费需求,为用户提供个性化的商品及服务。
当前,对社交媒体中用户发布的信息,主要依靠同时提及的分析方式,梳理出与产品相关的系列、品牌、成分、功效、代言人等信息。图1为相关技术进行信息分析的结果示意图,如图1所示,采用同时提及方式进行信息分析时,通过预设的成分关键词、品牌关键词、类别关键词,可以分析用户发布的信息中,在提及成分芦荟时,还提及的品牌、类别。相关技术中,同时提及的分析方法分析结果只能反映出用户发布的信息中包含的关键词,无法进行全面的信息分析,分析结果价值不高。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供一种实现信息分析的方法、装置、计算机存储介质及终端,能够提升同时提及方法的信息分析质量。
本发明实施例提供了一种实现信息分析的方法,包括:
根据预设的行业规则,对经过自然语言处理的社交媒体信息进行匹配分析,识别出所述社交媒体信息中包含的实体并对所述实体进行标记;
通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,以确定所述社交媒体信息中实体之间的关系。
在一种示例性实施例中,所述行业规则涉及的行业包括以下一种或任意组合:美妆行业、汽车行业、母婴行业、服装行业、家电行业、影视行业;
一个所述行业规则包括作为实体的一行业词汇及用于识别该行业词汇的关键词,所述关键词包括包含词,或者包括包含词和排除词。
在一种示例性实施例中,所述对所述实体进行标记包括:标记所述实体的类别;
所述确定所述社交媒体信息中所述实体之间的关系包括:类别为产品的实体与以下一种或一种以上类别的实体之间的关系:品牌、产品系列、功效、成份、竞品、活动、节目、代言人、关键意见领袖KOL、使用场景。
在一种示例性实施例中,所述对所述实体进行标记包括:标记所述实体的类别;
所述确定所述社交媒体信息中所述实体之间的关系包括:类别为消费者的实体与以下一种或一种以上类别的实体之间的关系:KOL、产品、品牌、明星、活动、节目、兴趣爱好。
在一种示例性实施例中,所述通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,包括以下一种或一种以上方式:
通过品牌+第一谓语+产品的关系模型,在所述社交媒体信息的同一文本块中出现品牌实体、产品实体和预设的表示包含关系的第一谓语时,确定所述品牌实体与所述产品实体之间存在包含关系;
通过产品系列+第二谓语+产品的关系模型,在所述社交媒体信息的同一文本块中出现产品系列实体、产品实体和预设的表示包含关系的第二谓语时,确定所述产品系列实体与所述产品实体之间存在包含关系;
通过产品+第三谓语+成分的关系模型,在所述社交媒体信息的同一文本块中出现产品实体、成分实体和预设的表示包含关系的第三谓语时,确定所述产品实体与所述成分实体之间存在包含关系;
通过产品+第四谓语+功效的关系模型,在所述社交媒体信息的同一文本块中出现产品实体、功效实体和预设的表示包含关系的第四谓语时,确定所述产品实体与所述功效之间存在包含关系;
通过KOL提及产品+情感判定的关系模型,在KOL实体通过所述社交媒体信息发表的文章中出现产品实体和预设的情感词时,如通过情感词确定情感判定为正面,确定所述KOL实体对于所述产品实体是给予好评的KOL,如通过情感词确定情感判定为负面,确定所述KOL实体对于所述产品实体是给予差评的KOL。
在一种示例性实施例中,所述通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,包括以下一种或一种以上方式:
通过产品+使用场景+情感判定的关系模型,在所述社交媒体信息的同一文本块中出现产品实体、使用场景实体和预设的情感词时,通过情感词判定确定所述产品实体与所述使用场景实体间存在正面情感关系或负面情感关系;
通过两个或两个以上产品+第五谓语的关系模型,在所述社交媒体信息的同一文本块中出现两个或两个以上产品实体且存在预设的表示竞争关系的第五谓语时,确定所述产品实体之间是产品与竞品的关系。
在一种示例性实施例中,所述通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,包括以下一种或一种以上方式:
通过消费者提及产品+情感判定的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现产品实体和预设的情感词时,如通过情感词确定情感判定为正面,确定所述消费者实体对于所述产品实体是给予好评的消费者,如通过情感词确定情感判定为负面,确定所述消费者实体对于所述产品实体是给予差评的消费者;
通过消费者提及品牌+情感判定的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现品牌实体和预设的情感词时,如通过情感词确定情感判定为正面,确定所述消费者实体对于所述品牌实体是给予好评的消费者,如通过情感词确定情感判定为负面,确定所述消费者实体对于所述品牌实体是给予差评的消费者;
通过消费者提及功效的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现功效实体时,根据预设时长内出现功效实体的频次,确定消费者对功效的关注度;
通过消费者提及兴趣的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现兴趣实体时,根据预设时长内出现的各兴趣实体的频次,确定消费者对各兴趣的偏好;
通过消费者提及节目的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现节目实体时,根据预设时长内出现的各节目实体的频次,确定消费者对各节目的偏好。
在一种示例性实施例中,所述根据通过关系模型确定的所述实体之间的关系构建社交媒体的知识图谱,包括:
根据通过关系模型确定的所述实体之间的关系,以及预设的部分实体之间的固定关系,构建社交媒体的知识图谱。
另一方面,本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述实现信息分析的方法。
再一方面,本发明实施例还提供一种***,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行上述实现信息分析的方法。
与相关技术相比,本申请技术方案包括:根据预设的行业规则,对经过自然语言处理的社交媒体信息进行匹配分析,识别出所述社交媒体信息中包含的实体并对所述实体进行标记;通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,以确定所述社交媒体信息中实体之间的关系。本发明实施例通过关系模型对实体之间的关联关系进行了确定,提升了同时提及方法的信息分析质量。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为相关技术进行信息分析的结果示意图;
图2为本发明实施例实现信息分析的方法的流程图;
图3为本发明实施例设定行业规则的示意图;
图4为本发明实施例应用知识图谱进行信息查询的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2为本发明实施例实现信息分析的方法的流程图,如图2所示,包括:
步骤201、根据预设的行业规则,对经过自然语言处理的社交媒体信息进行匹配分析,识别出所述社交媒体信息中包含的实体并对所述实体进行标记;
在一种示例性实施例中,所述行业规则涉及的行业包括以下一种或任意组合:美妆行业、汽车行业、母婴行业、服装行业、家电行业、影视行业;
一个所述行业规则包括作为实体的一行业词汇及用于识别该行业词汇的关键词,所述关键词包括包含词,或者包括包含词和排除词。
本发明实施例,家电行业包括3C行业,3C包括计算机Computer、通信Communication和消费类电子产品Consumer Electronics;本发明实施例上述行业规则可以包括但不限于:自然语言处理技术(NLP)与本领域技术人员预先设定的相关规则。行业规则可以包括:由技术人员根据需要分析的关键词构建的规则。图3为本发明实施例设定行业规则的示意图,如图3所示,本发明实施例在设定某一产品的行业规则时,可以首先确定行业名称、行业规则中的包含词和排除词;以某一品牌手机为例,设置该品牌手机的行业规则中的包含词可以包括:该品牌手机的所有型号、该品牌的中文名称、英文名称;排除词可以包括:同时包含中文和英文的名称、带国名的手机名称、及手机 (不包含品牌)。
步骤202、通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,以确定所述社交媒体信息中实体之间的关系。
通过分析发现,相关技术中建立的实体之间关联主要由技术人员人为构建,关联关系数量较少,对于经常变化的实体关系,无法通过人为构建方式获得,包括产品与品牌、产品与KOL、产品与代言人等。本发明实施例通过训练好的关系模型,实现了实体关系的收取,提升了确定实体之间关联关系的效率。
在一种示例性实施例中,,所述对所述实体进行标记包括:标记所述实体的类别;
所述确定所述社交媒体信息中所述实体之间的关系包括:类别为产品的实体与以下一种或一种以上类别的实体之间的关系:品牌、产品系列、功效、成份、竞品、活动、节目、代言人、关键意见领袖KOL、使用场景。
在一种示例性实施例中,所述通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,包括以下一种或一种以上方式:
通过品牌+第一谓语+产品的关系模型,在所述社交媒体信息的同一文本块中出现品牌实体、产品实体和预设的表示包含关系的第一谓语时,确定所述品牌实体与所述产品实体之间存在包含关系;第一谓语可以包括发布在内的表示包含关系的谓语,例如、A品牌发布了B产品,在这句话中发布为预设的第一谓语,表示A品牌中包含B产品;
通过产品系列+第二谓语+产品的关系模型,在所述社交媒体信息的同一文本块中出现产品系列实体、产品实体和预设的表示包含关系的第二谓语时,确定所述产品系列实体与所述产品实体之间存在包含关系;
通过产品+第三谓语+成分的关系模型,在所述社交媒体信息的同一文本块中出现产品实体、成分实体和预设的表示包含关系的第三谓语时,确定所述产品实体与所述成分实体之间存在包含关系;这里第三谓语可以包括使用、添加、包含等词,例如、我的皮肤之所以变好,是因为我用的C产品中包含 (或添加)了D成分。这句话中包含为第三谓语,表示C产品中有D成分。
通过产品+第四谓语+功效的关系模型,在所述社交媒体信息的同一文本块中出现产品实体、功效实体和预设的表示包含关系的第四谓语时,确定所述产品实体与所述功效之间存在包含关系;例如、跑步后我喜欢用E沐浴露,这款沐浴露可以促进保湿因子生成,滋润保湿(功效);促进为第四谓语,表示产品E具有滋润保湿的作用;
通过KOL提及产品+情感判定的关系模型,在KOL实体通过所述社交媒体信息发表的文章中出现产品实体和预设的情感词时,如通过情感词确定情感判定为正面,确定所述KOL实体对于所述产品实体是给予好评的KOL,如通过情感词确定情感判定为负面,确定所述KOL实体对于所述产品实体是给予差评的KOL;
在一种示例性实施例中,本发明实施例方法还包括:通过监测KOL发帖后参与转发、评论和点赞的粉丝,确定KOL的活跃粉丝;
在一种示例性实施例中,所述通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,包括以下一种或一种以上方式:
通过产品+使用场景+情感判定的关系模型,在所述社交媒体信息的同一文本块中出现产品实体、使用场景实体和预设的情感词时,通过情感词判定确定所述产品实体与所述使用场景实体之间存在正面情感关系或负面情感关系;这里,情感词可以包括喜欢、中意、推荐等表述情感的词,关联关系可以包括:明星对产品的喜好。例如、这天立夏,你确定午餐点点什么新鲜的了吗?G(明星)推荐的今日上线的产品F,推荐去试试。
通过两个或两个以上产品+第五谓语的关系模型,在所述社交媒体信息的同一文本块中出现两个或两个以上产品实体且存在预设的表示竞争关系的第五谓语时,确定所述产品实体之间是产品与竞品的关系;
在一种示例性实施例中,本发明实施例所述通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,包括以下一种或一种以上方式:
通过功效相同的关系模型,在多个产品实体有超过设定比例的功效相同时,确定所述多个产品实体之间是产品与竞品的关系;
通过活动中包含产品的关系模型,在社交媒体信息的活动实体中包含产品实体时,确定所述活动实体是推广所述产品实体的活动;
通过节目中出现产品的关系模型,将节目实体的视频转化为图像、音频转化为文本,如果转化得到的图像出现产品实体和/或转化后的文本中提及产品实体时,确定所述节目实体是推广所述产品实体的节目。
在一种示例性实施例中,文本块可以是整篇文章、帖子,一个段落,一个句子,或多个字符;可以由本领域技术人员根据不同场景、关联关系的确定设定为不同的范围。
在一种示例性实施例中,所述对所述实体进行标记包括:标记所述实体的类别;
所述确定所述社交媒体信息中所述实体之间的关系包括:类别为消费者的实体与以下一种或一种以上类别的实体之间的关系:KOL、产品、品牌、明星、活动、节目、兴趣爱好。
在一种示例性实施例中,所述通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,包括以下一种或一种以上方式:
通过消费者提及产品+情感判定的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现产品实体和预设的情感词时,如通过情感词确定情感判定为正面,确定所述消费者实体对于所述产品实体是给予好评的消费者,如通过情感词确定情感判定为负面,确定所述消费者实体对于所述产品实体是给予差评的消费者;
通过消费者提及品牌+情感判定的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现品牌实体和预设的情感词时,如通过情感词确定情感判定为正面,确定所述消费者实体对于所述品牌实体是给予好评的消费者,如通过情感词确定情感判定为负面,确定所述消费者实体对于所述品牌实体是给予差评的消费者;
通过消费者提及功效的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现功效实体时,根据预设时长内出现功效实体的频次,确定消费者对功效的关注度;
通过消费者提及兴趣的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现兴趣实体时,根据预设时长内出现的各兴趣实体的频次,确定消费者对各兴趣的偏好;
通过消费者提及节目的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现节目实体时,根据预设时长内出现的各节目实体的频次,确定消费者对各节目的偏好。
在一种示例性实施例中,所述根据通过关系模型确定的所述实体之间的关系构建社交媒体的知识图谱,包括:
根据通过关系模型确定的所述实体之间的关系,以及预设的部分实体之间的固定关系,构建社交媒体的知识图谱。
在一种示例性实施例中,确定实体之间的关联关系后,本发明实施例可以参照相关技术中知识图谱的构建方法进行本发明实施例知识图谱的构建。本发明实施例构建的知识图谱可以是围绕用户和产品的双中心的知识图谱。图4为本发明实施例应用知识图谱进行信息查询的示意图,如图4所示,用户输入查询关键词后,通过构建的知识图谱可以快速查询到与该关键词相关的各类信息,包括相关的拓展信息;例如、查询的某一产品后,其功效、成分、竞品、产品、品牌、类别、特性,及产品相关的节目、代言人、消费群体、相关活动、话题等。显示的查询结果的组成,可以由用户根据需求进行设置调整。
在一种示例性实施例中,本发明实施例方法还包括:通过接收到的查询关键字,对知识图谱中的分析结果进行查询。
本发明示例依托构建的知识图谱,可以参照相关理论设计查询***,通过查询知识图谱,可以帮助企业高效的进行社交媒体的信息。
本发明实施例通过构建的知识图谱,能够解决社交媒体信息孤立的问题,在采用较少的人工训练和算法的帮助下,通过确定实体之间的关联关系,能够快速的建立知识图谱。提升了社交媒体信息的分析处理效率,通过构建的知识图谱可以高效、全面的进行数据查询,为用户提供更为准确的信息分析结果。
与相关技术相比,本申请技术方案包括:根据预设的行业规则,对经过自然语言处理的社交媒体信息进行匹配分析,识别出所述社交媒体信息中包含的实体并对所述实体进行标记;通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,以确定所述社交媒体信息中实体之间的关系。本发明实施例通过关系模型对实体之间的关联关系进行了确定,提升了同时提及方法的信息分析质量。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述实现信息分析的方法。
本发明实施例还提供一种***,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行上述实现信息分析的方法。
本发明实施例上述***可以设置在云端服务器中,实现包括信息分析在内的功能的应用。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的每个模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (10)
1.一种信息处理方法,其特征在于,包括:
根据预设的行业规则,对经过自然语言处理的社交媒体信息进行匹配分析,识别出所述社交媒体信息中包含的实体并对所述实体进行标记;
通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,以确定所述社交媒体信息中实体之间的关系。
2.根据权利要求1所述的方法,其特征在于,所述行业规则涉及的行业包括以下一种或任意组合:美妆行业、汽车行业、母婴行业、服装行业、家电行业、影视行业;
一个所述行业规则包括作为实体的一行业词汇及用于识别该行业词汇的关键词,所述关键词包括包含词,或者包括包含词和排除词。
3.根据权利要求1所述的方法,其特征在于,所述对所述实体进行标记包括:标记所述实体的类别;
所述确定所述社交媒体信息中所述实体之间的关系包括:类别为产品的实体与以下一种或一种以上类别的实体之间的关系:品牌、产品系列、功效、成份、竞品、活动、节目、代言人、关键意见领袖KOL、使用场景。
4.根据权利要求1所述的方法,其特征在于,所述对所述实体进行标记包括:标记所述实体的类别;
所述确定所述社交媒体信息中所述实体之间的关系包括:类别为消费者的实体与以下一种或一种以上类别的实体之间的关系:KOL、产品、品牌、明星、活动、节目、兴趣爱好。
5.根据权利要求3所述的方法,其特征在于,所述通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,包括以下一种或一种以上方式:
通过品牌+第一谓语+产品的关系模型,在所述社交媒体信息的同一文本块中出现品牌实体、产品实体和预设的表示包含关系的第一谓语时,确定所述品牌实体与所述产品实体之间存在包含关系;
通过产品系列+第二谓语+产品的关系模型,在所述社交媒体信息的同一文本块中出现产品系列实体、产品实体和预设的表示包含关系的第二谓语时,确定所述产品系列实体与所述产品实体之间存在包含关系;
通过产品+第三谓语+成分的关系模型,在所述社交媒体信息的同一文本块中出现产品实体、成分实体和预设的表示包含关系的第三谓语时,确定所述产品实体与所述成分实体之间存在包含关系;
通过产品+第四谓语+功效的关系模型,在所述社交媒体信息的同一文本块中出现产品实体、功效实体和预设的表示包含关系的第四谓语时,确定所述产品实体与所述功效之间存在包含关系;
通过KOL提及产品+情感判定的关系模型,在KOL实体通过所述社交媒体信息发表的文章中出现产品实体和预设的情感词时,如通过情感词确定情感判定为正面,确定所述KOL实体对于所述产品实体是给予好评的KOL,如通过情感词确定情感判定为负面,确定所述KOL实体对于所述产品实体是给予差评的KOL。
6.根据权利要求3所述的方法,其特征在于,所述通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,包括以下一种或一种以上方式:
通过产品+使用场景+情感判定的关系模型,在所述社交媒体信息的同一文本块中出现产品实体、使用场景实体和预设的情感词时,通过情感词判定确定所述产品实体与所述使用场景实体间存在正面情感关系或负面情感关系;
通过两个或两个以上产品+第五谓语的关系模型,在所述社交媒体信息的同一文本块中出现两个或两个以上产品实体且存在预设的表示竞争关系的第五谓语时,确定所述产品实体之间是产品与竞品的关系。
7.根据权利要求4所述的方法,其特征在于,所述通过训练好的关系模型,对标记后的所述社交媒体信息进行实体关系抽取,包括以下一种或一种以上方式:
通过消费者提及产品+情感判定的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现产品实体和预设的情感词时,如通过情感词确定情感判定为正面,确定所述消费者实体对于所述产品实体是给予好评的消费者,如通过情感词确定情感判定为负面,确定所述消费者实体对于所述产品实体是给予差评的消费者;
通过消费者提及品牌+情感判定的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现品牌实体和预设的情感词时,如通过情感词确定情感判定为正面,确定所述消费者实体对于所述品牌实体是给予好评的消费者,如通过情感词确定情感判定为负面,确定所述消费者实体对于所述品牌实体是给予差评的消费者;
通过消费者提及功效的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现功效实体时,根据预设时长内出现功效实体的频次,确定消费者对功效的关注度;
通过消费者提及兴趣的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现兴趣实体时,根据预设时长内出现的各兴趣实体的频次,确定消费者对各兴趣的偏好;
通过消费者提及节目的关系模型,在消费者实体通过所述社交媒体信息发表的文章中出现节目实体时,根据预设时长内出现的各节目实体的频次,确定消费者对各节目的偏好。
8.根据权利要求1~7任一项所述的方法,其特征在于,所述根据通过关系模型确定的所述实体之间的关系构建社交媒体的知识图谱,包括:
根据通过关系模型确定的所述实体之间的关系,以及预设的部分实体之间的固定关系,构建社交媒体的知识图谱。
9.一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1~8中任一项所述的实现信息分析的方法。
10.一种***,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行权利要求1~8中任一项所述的实现信息分析的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910977377.5A CN110737845A (zh) | 2019-10-15 | 2019-10-15 | 一种实现信息分析的方法、计算机存储介质及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910977377.5A CN110737845A (zh) | 2019-10-15 | 2019-10-15 | 一种实现信息分析的方法、计算机存储介质及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110737845A true CN110737845A (zh) | 2020-01-31 |
Family
ID=69269329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910977377.5A Pending CN110737845A (zh) | 2019-10-15 | 2019-10-15 | 一种实现信息分析的方法、计算机存储介质及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110737845A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182244A (zh) * | 2020-09-28 | 2021-01-05 | 时趣互动(北京)科技有限公司 | 品牌知识图谱构建方法、装置及终端 |
CN112463915A (zh) * | 2021-02-02 | 2021-03-09 | 冠传网络科技(南京)有限公司 | 美妆产品社交媒体评论挖掘的方法、***及存储介质 |
CN113420677A (zh) * | 2021-06-25 | 2021-09-21 | 联仁健康医疗大数据科技股份有限公司 | 确定合理图像的方法、装置、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090216563A1 (en) * | 2008-02-25 | 2009-08-27 | Michael Sandoval | Electronic profile development, storage, use and systems for taking action based thereon |
CN103984777A (zh) * | 2014-06-06 | 2014-08-13 | 浪潮电子信息产业股份有限公司 | 一种基于数据库同步的舆情分析***优化方法 |
CN104199972A (zh) * | 2013-09-22 | 2014-12-10 | 中科嘉速(北京)并行软件有限公司 | 一种基于深度学习的命名实体关系抽取与构建方法 |
CN106327211A (zh) * | 2016-08-25 | 2017-01-11 | 互动派科技股份有限公司 | 一种基于社交媒体的scrm***及其开发方法 |
CN108038200A (zh) * | 2017-12-12 | 2018-05-15 | 北京百度网讯科技有限公司 | 用于存储数据的方法和装置 |
CN108984675A (zh) * | 2018-07-02 | 2018-12-11 | 北京百度网讯科技有限公司 | 基于评价的数据查询方法和装置 |
CN110188191A (zh) * | 2019-04-08 | 2019-08-30 | 北京邮电大学 | 一种用于网络社区文本的实体关系图谱构建方法和*** |
-
2019
- 2019-10-15 CN CN201910977377.5A patent/CN110737845A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090216563A1 (en) * | 2008-02-25 | 2009-08-27 | Michael Sandoval | Electronic profile development, storage, use and systems for taking action based thereon |
CN104199972A (zh) * | 2013-09-22 | 2014-12-10 | 中科嘉速(北京)并行软件有限公司 | 一种基于深度学习的命名实体关系抽取与构建方法 |
CN103984777A (zh) * | 2014-06-06 | 2014-08-13 | 浪潮电子信息产业股份有限公司 | 一种基于数据库同步的舆情分析***优化方法 |
CN106327211A (zh) * | 2016-08-25 | 2017-01-11 | 互动派科技股份有限公司 | 一种基于社交媒体的scrm***及其开发方法 |
CN108038200A (zh) * | 2017-12-12 | 2018-05-15 | 北京百度网讯科技有限公司 | 用于存储数据的方法和装置 |
CN108984675A (zh) * | 2018-07-02 | 2018-12-11 | 北京百度网讯科技有限公司 | 基于评价的数据查询方法和装置 |
CN110188191A (zh) * | 2019-04-08 | 2019-08-30 | 北京邮电大学 | 一种用于网络社区文本的实体关系图谱构建方法和*** |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182244A (zh) * | 2020-09-28 | 2021-01-05 | 时趣互动(北京)科技有限公司 | 品牌知识图谱构建方法、装置及终端 |
CN112463915A (zh) * | 2021-02-02 | 2021-03-09 | 冠传网络科技(南京)有限公司 | 美妆产品社交媒体评论挖掘的方法、***及存储介质 |
CN113420677A (zh) * | 2021-06-25 | 2021-09-21 | 联仁健康医疗大数据科技股份有限公司 | 确定合理图像的方法、装置、电子设备及存储介质 |
CN113420677B (zh) * | 2021-06-25 | 2024-06-11 | 联仁健康医疗大数据科技股份有限公司 | 确定合理图像的方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107346336B (zh) | 基于人工智能的信息处理方法和装置 | |
CN106302085B (zh) | 即时通讯群组的推荐方法及*** | |
EP2506522B1 (en) | Method and device for pushing data | |
WO2019084810A1 (zh) | 一种信息处理方法及终端、计算机存储介质 | |
CN108520046B (zh) | 搜索聊天记录的方法及设备 | |
KR20160055930A (ko) | 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법 | |
US20120016661A1 (en) | System, method and device for intelligent textual conversation system | |
CN110737845A (zh) | 一种实现信息分析的方法、计算机存储介质及*** | |
WO2015196987A1 (zh) | 支持自然语言的数据查询方法、开放平台及用户终端 | |
CN109992781B (zh) | 文本特征的处理方法、装置和存储介质 | |
CN111107444B (zh) | 用户评论生成方法、电子设备及存储介质 | |
CN111027838B (zh) | 一种众包任务推送方法、装置、设备及其存储介质 | |
CN108600083A (zh) | 消息提醒方法及设备 | |
CN110505143A (zh) | 一种用于发送目标视频的方法与设备 | |
Hou et al. | How do scholars and non-scholars participate in dataset dissemination on Twitter | |
JP2011053992A (ja) | 質問推薦装置及び方法及びプログラム | |
Santovena Casal | Conversations, debates and affiliation networks on Twitter. | |
CN110475158B (zh) | 视频学习素材的提供方法、装置、电子设备及可读介质 | |
CN112732951A (zh) | 一种人机交互的方法及装置 | |
JP2014142738A (ja) | 管理方法、管理装置および管理プログラム | |
CN111787042A (zh) | 用于推送信息的方法和装置 | |
CN110633410A (zh) | 信息处理方法及装置、存储介质、电子装置 | |
CN107483595B (zh) | 信息推送方法和装置 | |
JP5102883B2 (ja) | ユーザ発言抽出装置とその方法と、プログラム | |
WO2021051874A1 (zh) | 一种信息推送方法和相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20201224 Address after: A108, 1 / F, curling hall, winter training center, 68 Shijingshan Road, Shijingshan District, Beijing 100041 Applicant after: Beijing second hand Artificial Intelligence Technology Co.,Ltd. Address before: 100080 area C, 3rd floor, building 2, zone B, Dongsheng Science Park, Zhongguancun, Haidian District, Beijing Applicant before: ADMASTER TECHNOLOGY (BEIJING) Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200131 |