CN110968699A - 一种基于事理推荐的逻辑图谱构建及预警方法和装置 - Google Patents
一种基于事理推荐的逻辑图谱构建及预警方法和装置 Download PDFInfo
- Publication number
- CN110968699A CN110968699A CN201911059165.5A CN201911059165A CN110968699A CN 110968699 A CN110968699 A CN 110968699A CN 201911059165 A CN201911059165 A CN 201911059165A CN 110968699 A CN110968699 A CN 110968699A
- Authority
- CN
- China
- Prior art keywords
- event
- events
- recommendation
- affair
- early warning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于事理推荐的逻辑图谱构建及预警方法和装置。该方法包括:指定事件之间的逻辑关系类型;根据指定的事件之间的逻辑关系类型进行事理抽取;根据事理抽取结果建立事理图谱,所述事理图谱是有向有环图,其中的节点代表事件,有向边代表事件之间的逻辑关系。然后基于建立的事理图谱进行事件推荐,包括事件联想的推荐、事理逻辑的推荐、历史实证的推荐、关联数据的推荐。基于构建的事理图谱,通过监测事理图谱中事件及事件指标的变动情况,进行基于事理逻辑链条的链式反应预警,包括数据预警和舆情预警。本发明可以较好地保证逻辑图谱的正确性,能够提升事理逻辑推荐的准确性与效率,能够最大程度上实时地完成预警服务。
Description
技术领域
本发明涉及一种基于事理推荐的逻辑图谱构建及预警方法和装置,属于自然语言处理领域,属于一种知识库构建及运用方法。
背景技术
知识库是目前解决认知智能的一个关键组件,是人工智能通向语义理解的基石,如何将海量的文档数据转换成供计算机使用的高质量、大规模的结构化知识是目前各领域知识工程面临的一大难题。以“事件”为核心,以描述事件之间的逻辑演化关系如顺承、因果、转折、对立、并列、包含等知识的事理图谱正受到广泛关注,这类图谱可以对动作性的事件知识进行很好的表示,并支持事件预测、逻辑问答、逻辑检验等多种应用。
从文档中抽取出事件逻辑涉及到事件表示、事件抽取、关系识别、事件融合等自然语言处理核心技术且难度较大。其中:事件表示技术解决如何使用合适的“字符串序列”来描述事件丰富的语义信息,通常包括基于动词、动词关联实体组合、事件框架的形式;事件关系识别技术解决关联事件之间的关系及其方向性的判别,涉及事件关系的确定、事件关系的发现等内容。事件融合技术解决的是强相似事件之间的对齐与归一化,旨在降低知识库中事件之间关联的稀疏性并增强整个事件的语义能力。
受限于当前自然语言处理技术的水平,目前事件逻辑知识库的构建和应用上还存在以下不足:
1、全自动抽取性能不高。目前基于全自动方式构建提取的事件及事件关系数据精度不高。以依存句法或正则规则模板抽取的方法能够得到较高的召回率,但错误率较高;以深度学习序列标注方法进行抽取能够保证较高的准确率,但需要大规模的标注语料。
2、事理逻辑类型规定不清。事件之间的事理逻辑关系有多种类型,典型的包括有因果关系、顺承关系、上下位关系等,需要有一个更为完备的事理逻辑关系类型体系。
3、对于基于事理逻辑图谱的应用探索相对不足。事理逻辑图谱可以支持预警路径生成等多方面的应用,但目前针对该方面的应用还相对不足。
发明内容
针对现有技术中存在的上述技术问题,本发明的目的在于提出一种基于事理推荐的逻辑图谱构建及预警方法和装置。
本发明的思想为:通过设定事理逻辑关系,借助依存规则、正则模板、深度学习的方式抽取事理逻辑,形成事理逻辑基础库;提供事件逻辑图谱编辑组件,为专业人员构建图谱提供事件联想、事理推荐、数据推荐等辅助组件,以一种人机组合的方式完成高质量逻辑图谱构建,进而基于构建的逻辑图谱完成图谱预警。
本发明的一种基于事理推荐的逻辑图谱构建方法,包括以下步骤:
指定事件之间的逻辑关系类型;
根据指定的事件之间的逻辑关系类型进行事理抽取;
根据事理抽取结果建立事理图谱,所述事理图谱是有向有环图,其中的节点代表事件,有向边代表事件之间的逻辑关系。
进一步地,所述事理图谱是一个有向有环图,节点代表事件,有向边代表事件之间的因果、条件、互斥、组成、转折、上下位等逻辑关系。事理图谱既关注事件外部之间的演化逻辑关系,又关注事件本身的丰富属性信息,是抽象事件与事件知识库两者的统一结合体。
进一步地,所述事理图谱中的事理关系包括:因果事理、条件事理、上下位事理、并列事理、互斥事理、顺承事理、转折事理、组成事理等。
进一步地,所述事理图谱中的事理抽取方法指根据指定的事理关系类型,采用以下方法进行事理抽取:基于关系词规则模板的抽取方法;基于关系词限定、词性过滤与事件成立性的抽取方法;基于关系词与依存句法规则的抽取方法;基于序列标注的事理抽取方法;以及基于搜索问答的事理抽取方法。
进一步地,基于建立的事理图谱进行事件推荐,包括:事件联想的推荐、事理逻辑的推荐、历史实证的推荐、关联数据的推荐。
所述事件联想的推荐,指针对用户输入的事件字符自动地推荐与该事件最为相关或重要性程度较高的事件。在具体实施上包括事件权重计算、事件情绪值计算、候选事件得分计算、候选事件相似度计算以及强相关事件集获取等内容。
所述事理逻辑的推荐,指根据用户输入的事件推荐相关的事理事件。该方法的主要思想为根据用户输入的事件,基于后台事理图谱库进行检索得到特定事理关系的事件集合,再根据事件重要性判定方法对事件集合进行打分排序,输出结果事件集合。具体步骤上包括相似事件检索、强相似事件筛选、关联事理抽取、关联事理的聚类与排序等几个环节。
所述历史实证的推荐,指根据用户选定事件及事件边,给出支持该事件与事件边的事件数据。该方法的思想是:通过用户给定的事件对,通过同义词及上下位词泛化的方法对给定的事件对进行扩展和泛化,对泛化好的事件在方法逻辑事件库进行检索,并对事件所在描述进行高亮显示。具体包括事件对的组合与扩展、基于历史事件库的检索两个内容。
所述关联数据的推荐,指根据用户给定事件,对事件潜在关联的数据进行推荐。该方法的思想为,针对用户输入的事件,将该事件与数据指标中的数据标签进行比对和相似性检索,并根据数据更新频度、事件点击频率等指对指标数据的相关性进行大小排序。具体实现包括指标数据标签整理、候选数据指标的获取、数据指标的排序三个环节。
本发明还提供一种基于构建的事理图谱事理预警方法,所述事理预警指基于已构建事理图谱,通过监测事理图谱中事件及事件指标的变动情况,从而完成基于事理逻辑链条的链式反应预警。该方法主要思想为:针对已构建好的事理图谱,基于事件关联数据推荐方法完成事件数据关联,并设定预警规则,一旦数据异常,则触发预警条件;采集海量资讯网站,并将资讯关联到具体事件上,通过舆情分析等手段对事件节点进行监测,并依据舆情变动,发出相关预警。具体包括数据预警和舆情预警两个子组件。
所述数据预警,指基于事件关联数据推荐方法完成事件数据关联,并设定预警规则,一旦数据异常,则触发预警条件,确定异常事件点,然后根据事件逻辑脉络,得到风险逻辑图谱脉络图。具体实施包括数据关联、数据预警规则设定、数据监测与预警路径生成、预警动作四个环节的内容。
所述舆情预警,指利用文本采集和事件分类技术方法,对已建逻辑图谱中的事件进行实时监测,并自动生成预警路径的过程。指的基利用事件标签方法和情感分析技术对事件关联的资讯文本进行分类和情感判定,形成以事件节点的热度和情感强度。对建成的逻辑事理图谱中的各个事件的热度值和强度值进行监测,当高于某个阈值时,触发相应规则,并生成预警路径。在实施上,包括文本采集、时间标签与分类、事件情绪热度计算、事件情绪预警与路径生成、预警动作四个环节。
基于同一发明构思,本发明还提供一种基于事理推荐的逻辑图谱构建和预警装置,其包括:
事理图谱构建模块,负责指定事件之间的逻辑关系类型;根据指定的事件之间的逻辑关系类型进行事理抽取;根据事理抽取结果建立事理图谱,所述事理图谱是有向有环图,其中的节点代表事件,有向边代表事件之间的逻辑关系;
推荐模块,负责基于建立的事理图谱进行事件推荐,包括:事件联想的推荐、事理逻辑的推荐、历史实证的推荐、关联数据的推荐;
预警模块,负责基于建立的事理图谱,通过监测事理图谱中事件及事件指标的变动情况,进行基于事理逻辑链条的链式反应预警。
与现有技术相比,本发明具有以下优点:
1、本发明提出了一套基于限定与事理推荐的逻辑图谱构建方法,该方法采用机器推荐、人工混合的方式进行有效协作,可以较好地保证逻辑图谱的正确性。
2、本发明提出了因果、顺承、互斥、上下位、组成、并列、转折等事理逻辑关系,能够较好的涵盖目前常见的逻辑事理类型,并明确了基于关系词限定、词性过滤与事件成立性的抽取方法,基于关系词与依存句法规则的抽取方法,基于序列标注的事理抽取方法等方法融合并行的方法,可以较高的准确率。
3、本发明在进行事理推荐时通过利用事理上下文信息对事理进行领域细分,能够提升事理逻辑推荐的准确性与效率,有效降低无关事理带来的困扰。
4、本发明提出了基于既定事理图谱库的事件联想推荐、事理逻辑推荐、历史实证推荐、关联数据推荐等组件方法,可辅助用户完成高质量的逻辑图谱。
5、本发明提出了一套基于已建逻辑图谱的预警装置,基于数据预警和事件舆情预警,能够最大程度上实时地完成预警服务。
附图说明
图1为本发明的整体构成图。
图2为基础事理图谱构建框架图。
图3为事件联想推荐流程图。
图4为事理逻辑推荐流程图。
图5为历史实证推荐流程图。
图6为关联数据推荐流程图。
图7为数据预警流程图。
图8为舆情预警流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面通过具体实施例和附图,对本发明做进一步详细说明。
如图1所示,本发明主要包括基础事理图谱构建、基于事理图谱的推荐、事理逻辑预警三个部分。各个部分的技术流程遵循以下步骤:
一.事理图谱库构建
1、界定事理图谱的概念
所述事理图谱是一个有向有环图,节点代表事件,有向边代表事件之间的因果、条件、互斥、转折、上下位等逻辑关系。事理图谱既关注事件外部之间的演化逻辑关系,又关注事件本身的丰富属性信息,是抽象事件与事件知识库两者的统一结合体。
2、规定事件之间的逻辑关系类型
本发明中将所述事件之间的逻辑关系类型分成八种,如图2所示,类型包括:
1)因果事理。用于描述某一事件导致某一事件发生,形如<智利地震,有色金属上涨>;
2)条件事理。表示某一事件条件下另一事件发生,如<中美贸易达成协议,中美贸易战缓和>;
3)互斥事理。某一事件与另一事件形成对立,如<美国攻打***,美国拯救***>
4)顺承事理。表示某一时间紧接着另一事件发生,如<到售票口,刷身份证>
5)上下位事理。某事件是另一事件的上层抽象,如<人民币贬值,货币贬值>
6)组成事理。表示某事件是另一事件的组成部分,如<奏国歌,升国旗仪式>
7)并列事理。表示某事件与另一事件同时发生,如<奏国歌,升国旗>
8)转折事理。表示本该发生的事件未能发生,如<刻苦学习,成绩下降>。
3、事理抽取
所述事理抽取的方法指根据指定的事理关系类型,采用以下方法进行事理抽取:基于关系词模板限定的抽取方法;基于关系词限定、词性过滤与事件成立性的抽取方法;基于关系词与依存句法规则的抽取方法;基于序列标注的事理抽取方法;以及基于搜索问答的事理抽取方法。
1)基于关系词模板限定的抽取方法。关系限定词指能够明显显示事理成分的关联指示词,如“导致”,“因为-所以”等因果关联词;通过关系词限定,抽取出事件描述字段。通过定位关联词,根据前后事件描述与关联词之间的关系进行描述截取,抽取得到事件的描述字段
2)基于关系词限定的、词性过滤与事件成立性的抽取方法。关系限定词指能够明显显示事理成分的关联指示词,如“导致”,“因为-所以”等因果关联词;通过关系词限定,抽取出事件描述字段;词性过滤指通过使用中文分词器进行分词和词性标注后设定需要保留的词性类别;事件成立性指事件需包含特定的事件成分,如事件动作、事件主体、客体等。
3)基于关系词与依存句法规则的抽取方法。具体包括通过对关系限定词对候选事件进行确定,借助依存句法分析手段,确定关联词对应的事件主体和事件客体,并通过修饰词之间的语义关系对事件进行扩展。
4)基于序列标注的方法,包括利用BIO或BIOS等标记集对事件起始描述和终止事件描述描述进行标注,最后训练序列标注模型进行标注。
5)基于搜索问答的方法,将事理抽取问题转换成事理的分类问题,通过识别出事件,并将事件之间的关系问题转变成搜索问答的方法。
二.事理图谱推荐
所述事理图谱推荐,包括事件联想的推荐、事理逻辑的推荐、历史实证的推荐、关联数据的推荐四个子推荐模块,每个推荐模块互相独立,分别提供不同的服务。
1、事件联想的推荐
事件的联想,指针对用户输入的事件字符自动地推荐与该事件最为相关且重要性程度较高的事件。例如,输入“中美”这一事件字符后,得到“中美贸易摩擦”、“中美贸易”等相关事件。该方法的主要思想为:考虑事件的频次、热度、来源、事件在整个事理图谱的外部关系强度、事件与事件字符之间的相似度等多个方面的特征,输出的事件联想的结果根据相关性综合得分进行排序。具体遵从图3所示的流程,包括以下步骤:
1)计算图谱事件权重。使用随机游走方法、图神经网络等对建成的事理图谱进行游走,得到事件图谱重要性权重。
2)计算图谱事件的情绪值。使用基于情感词与依存规则的情感评分方法对图谱事件进行情绪计算,得到事件的情感方向,以及事件情绪的强度。
3)候选事件得分计算。收集输入字符与事件之间的候选相关事件集。事先将事件的出现频次,事件的图谱权重、事件的来源、事件的情绪值存入搜索服务器当中,修改相似性评分函数为考虑频次、图谱权重、事件情绪值的综合打分函数,返回前N条最相关事件及事件得分。其中搜索服务器即指对图3中事理图谱的搜索服务器存储库,如ES事理库,即Elasticsearch数据库等。
4)候选事件相似度计算。针对上一步得到的候选相关事件集,对输入字符串及候选事件中的事件进行向量表示,计算向量之间的距离作为每个候选事件的相似性得分。
5)强相关事件集获取。将步骤3)得到的候选事件相似度得分与步骤4)得到的候选事件得分进行加权求和,求和公式为:a*候选事件相似度得分+b*候选事件得分,其中a,b默认值均为0.5,该系数可由实际情况进行调优更改。随后并设定得分阈值,将大于得分阈值的事件对加权和按照大小顺序进行排序,得到相关性事件集合。
2、事理逻辑的推荐
所述事理逻辑的推荐,指根据用户输入的事件推荐相关的事理事件。例如给定“避险情绪上升”这一事件,可以推荐出“信贷投放意愿减弱”、“美元阶段性走强”、“资产遭抛售”等结果事件;“宏观经济下行”、“商品暴跌”、“汇率贬值”、“信用风险事件增加”等原因事件。该方法的主要思想为:根据用户输入的事件,基于后台事理图谱库进行检索得到特定事理关系的事件集合,再根据事件重要性判定方法对事件集合进行打分排序,输出结果事件集合。具体遵循图4所示的流程,包括以下步骤:
1)相似事件检索。将实现抽取形成的多关系事理图谱中的事件存入搜索服务器(如ES)当中,使用用户输入事件以及该事件的关联领域进行相似事件检索,返回与该事件最为相似的前N条事件记录。
2)强相似事件筛选。根据上一步得到的事件粗筛结果,对用户输入事件及事件集合中的每个事件进行向量化,并计算向量之间的距离作为两个事件之间的相似度。利用基于情感词典与依存规则的方法或基于机器学习的情感分析方法对事件进行情感分析,若同时满足两个事件之间的相似度大于某个阈值且事件之间的情绪方向一致,则将该事件加入到强相似事件集合当中。
3)关联事理的获取。根据上一步得到的强相似事件,获取该事件对应的事理事件,如原因事件、结果事件。
4)关联事理的聚类与排序。根据上一步得到的特定类型的关联事理事件集。运用向量化方法对事件进行向量化表示,并使用聚类算法对事件集合进行聚类,形成若干个的事件簇,同时以该事件簇的中心事件作为每一类事件的中心表示;针对每一簇中的每一个事件,获取该事件在图谱中的权重、归一化频次、情感强度等信息的加权求和作为该事件的重要性权值,并将簇内所有事件重要性权值的平均值作为该事件类的重要性权值;根据重要性权值的大小,对关联事理事件进行从大到小排序,得到最终的关联事理集合。
3、历史实证的推荐
所述历史实证的推荐指根据用户选定事件及事件边,给出支持该事件与事件边的事件数据。该方法的思想是:通过用户给定的事件对,通过同义词及上下位词泛化的方法对给定的事件对进行扩展和泛化,对泛化好的事件在事理泛化库中进行检索,并对事件所在描述进行高亮显示。具体遵从图5所示的流程,包括以下步骤:
1)事件对的组合与扩展。针对用户输入的事件对,用特定符号将事件对进行组合,形成事件对整体;对事件进行分词处理,并对事件词列表中的词进行相似词、上位词以及下位词的替换,形成组合扩展事件。
2)基于历史事件库的检索和历史实证的高亮。对历史实证事件库中的事件对按照事件对组合扩展的原则进行扩展,并存入搜索引擎据库中;利用1)得到的用户输入组合扩展事件进行短语匹配检索并设定短语之间可间隔词语数目,得到强相似的历史事件对,并返回该事件对所对应的事件描述对在原文中的高亮结果。
4、关联数据的推荐
所述关联数据的推荐,指根据用户给定事件,对事件潜在关联的数据进行推荐。该方法的思想为,针对用户输入的事件,将该事件与数据指标中的数据标签进行比对和相似性检索,并根据数据更新频度、事件点击频率等对指标数据的相关性进行大小排序。具体执行图6所示的流程,包括以下步骤:
1)指标数据标签整理。进行指标数据库整理,从公开数据源(指标数据库)或者自有数据中获取相关的数据指标。利用分词工具对数据指标名称进行分词及词性标注,保留名词和动词性成分作为指标数据的标签。
2)候选数据指标的获取。将数据指标及对应的数据标签存入搜索服务器当中,得到指标数据标签库。将用户输入的事件与指标数据标签库的数据标签进行语义向量化表示,并计算数据指标与事件之间的距离作为相似度,形成候选数据指标集。
3)数据指标的排序。针对上一步得到的候选数据指标集,获取数据的更新频度、事件点击频率、事件关联度等数值,对数值进行加权求和,得到事件数据关联强度。以事件数据关联强度按照大小进行排序,得到关联数据集合。
三.事理预警
所述事理预警指基于已构建事理图谱,通过监测事理图谱中事件及事件指标的变动情况,从而完成基于事理逻辑链条的链式反应预警。该方法主要思想为:针对已构建好的事理图谱,基于关联数据的推荐方法(前文第二部分第4点)完成事件数据关联,并设定预警规则,一旦数据异常,则触发预警条件;采集海量资讯网站,并将资讯关联到具体事件上,通过舆情分析等手段对事件节点进行监测,并依据舆情变动,发出相关预警。具体包括数据预警和舆情预警两个子组件。具体步骤图如下:
1、数据预警
所述数据预警,指基于事件关联数据推荐方法完成事件数据关联,并设定预警规则,一旦数据异常,则触发预警条件,确定异常事件点,然后根据事件逻辑脉络,得到风险逻辑图谱脉络图。具体步骤如图7所示,包括:
1)数据关联。根据数据关联推荐方法推荐的指标数据进行选择最佳的关联数据。
2)数据预警规则设定。对已关联的数据设定已经规则,分别设定数据上限阈值与数据下限阈值。上限阈值指该数据所能接受的最高数值,下限阈值指该数据所能接受的最低数值;若后续监测的数据指标中的数值高于上限阈值或低于下限阈值,则触发预警。
3)数据监测与预警路径生成。数据监测,指对接入的数据源,按照一定时间进行数值监控,并实时判定数据预警规则,将结果进行反馈,最终形成预警路径,并在界面上突出显示;预警路径,指在已构建好的事理图谱中的传导逻辑链条。该传导链条以发生异常的事件节点为起始节点以及与该节点存在单向路径的其他节点构成。
4)预警提示与处理。基于得到的预警事件路径,通过短信、微信、邮件等多种渠道第一时间进行预警提示,告知相关人及时关注相关预警结果。
2、舆情预警
所述舆情预警,指利用文本采集和事件分类技术方法,对已建逻辑图谱中的事件进行实时监测,并自动生成预警路径的过程。指的是利用事件标签方法和情感分析技术对事件关联的资讯文本进行分类和情感判定,形成事件节点的热度和情感强度。对建成的逻辑事理图谱中的各个事件的热度值和强度值进行监测,当高于某个阈值时,触发相应规则,并生成预警路径。具体步骤如图8所示,包括:
1)文本采集。基于文本采集技术,依照设定的采集频率,实时地采集各类资讯文本如公众号、微博、资讯等数据。
2)事件标签与分类。针对采集到的文本数据,利用基于特征词集合或文本分类模型的方法进行事件标签分类,使得文本数据能够挂载和分类到具体的事件当中。
3)事件情绪热度计算。针对已挂载和分类到某一事件中的资讯,利用基于情感词与依存规则或长文本情感分类模型对文本进行情感评分。结合资讯来源的重要性以及情感得分,进行加权求积,得到单篇文本的情绪得分;将该事件下的所有文本的事件情绪得分进行求和,并进行归一化,最终得到事件情绪热度。
4)事件情绪预警与事件预警路径生成。设定情绪热度阈值,针对逻辑图谱中的每个事件中的情绪热度进行比对,将高于该热度阈值的事件列为预警事件;以该预警事件为起始节点,生成预警路径,该路径以发生异常的事件节点为起始节点以及与该节点存在单向路径的其他节点构成。
5)预警提示与处理。基于得到的预警事件路径,通过短信、微信、邮件等多种渠道第一时间进行预警提示,告知相关人及时关注相关预警结果。
基于同一发明构思,本发明另一实施例提供一种基于事理推荐的逻辑图谱构建和预警装置,对应图1中的三个部分,该装置包括:
事理图谱构建模块,负责指定事件之间的逻辑关系类型;根据指定的事件之间的逻辑关系类型进行事理抽取;根据事理抽取结果建立事理图谱,所述事理图谱是有向有环图,其中的节点代表事件,有向边代表事件之间的逻辑关系;
推荐模块,负责基于建立的事理图谱进行事件推荐,包括:事件联想的推荐、事理逻辑的推荐、历史实证的推荐、关联数据的推荐;
预警模块,负责基于建立的事理图谱,通过监测事理图谱中事件及事件指标的变动情况,进行基于事理逻辑链条的链式反应预警。
本发明未详细阐述的部分属于本领域技术人员的公知技术。
以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明的原理和范围,本发明的保护范围应以权利要求书所述为准。
Claims (10)
1.一种基于事理推荐的逻辑图谱构建方法,其特征在于,包括以下步骤:
指定事件之间的逻辑关系类型;
根据指定的事件之间的逻辑关系类型进行事理抽取;
根据事理抽取结果建立事理图谱,所述事理图谱是有向有环图,其中的节点代表事件,有向边代表事件之间的逻辑关系。
2.根据权利要求1所述的方法,其特征在于,所述事件之间的逻辑关系类型包括:因果事理、条件事理、上下位事理、并列事理、互斥事理、顺承事理、转折事理、组成事理;采用以下方法中的一种或多种进行事理抽取:基于关系词规则模板的抽取方法;基于关系词限定、词性过滤与事件成立性的抽取方法;基于关系词与依存句法规则的抽取方法;基于序列标注的事理抽取方法;基于搜索问答的事理抽取方法。
3.根据权利要求1所述的方法,其特征在于,基于建立的事理图谱进行事件推荐,包括:事件联想的推荐、事理逻辑的推荐、历史实证的推荐、关联数据的推荐。
4.根据权利要求3所述的方法,其特征在于,所述事件联想的推荐包括以下步骤:
1)计算图谱事件的重要性权重;
2)计算图谱事件的情绪值;
3)采用考虑事件的频次、事件的重要性权重、事件情绪值的综合打分函数,计算候选事件的得分,得到候选相关事件集;
4)针对候选相关事件集,对输入字符串及候选事件中的事件进行向量表示,计算向量之间的距离作为每个候选事件的相似性得分;
5)根据候选事件的相似性得分,获取强相关事件集。
5.根据权利要求3所述的方法,其特征在于,所述事理逻辑的推荐包括以下步骤:
1)将事理图谱中的事件存入搜索服务器中,使用用户输入的事件以及该事件的关联领域进行相似事件检索;
2)根据步骤1)的检索结果进行强相似事件筛选;
3)根据得到的强相似事件,得到对应的关联事理事件;
4)对关联事理事件进行聚类与排序,得到最终的关联事理集合。
6.根据权利要求3所述的方法,其特征在于,所述历史实证的推荐包括:
1)通过同义词及上下位词泛化的方法对用户给定的事件对进行扩展和泛化;
2)对泛化好的事件在事理泛化库中进行检索,并对事件所在描述进行高亮显示。
7.根据权利要求3所述的方法,其特征在于,所述关联数据的推荐包括:
1)将用户输入的事件与指标数据标签库的标签进行语义向量化表示,并计算指标数据与事件之间的距离作为相似度,形成候选数据指标集;
2)针对候选数据指标集,获取数据的更新频度、事件点击频率、事件关联度,对其进行加权求和,得到事件数据关联强度;
3)以事件数据关联强度按照大小进行排序,得到关联数据集合。
8.一种基于事理图谱的事理预警方法,其特征在于,基于权利要求1~8中任一权利要求所述方法构建的事理图谱,通过监测事理图谱中事件及事件指标的变动情况,进行基于事理逻辑链条的链式反应预警。
9.根据权利要求8所述的方法,其特征在于,包括数据预警和舆情预警;
所述数据预警,指基于关联数据的推荐完成事件数据关联,并设定预警规则,一旦数据异常,则触发预警条件,确定异常事件点,然后根据事件逻辑脉络,得到风险逻辑图谱脉络图;
所述舆情预警,指利用事件标签方法和情感分析技术对事件关联的资讯文本进行分类和情感判定,形成事件节点的热度和情感强度;对建成的事理图谱中的各个事件的热度值和情感强度值进行监测,当高于某个阈值时,触发相应规则,并生成预警路径。
10.一种基于事理推荐的逻辑图谱构建和预警装置,其特征在于,包括:
事理图谱构建模块,负责指定事件之间的逻辑关系类型;根据指定的事件之间的逻辑关系类型进行事理抽取;根据事理抽取结果建立事理图谱,所述事理图谱是有向有环图,其中的节点代表事件,有向边代表事件之间的逻辑关系;
推荐模块,负责基于建立的事理图谱进行事件推荐,包括:事件联想的推荐、事理逻辑的推荐、历史实证的推荐、关联数据的推荐;
预警模块,负责基于建立的事理图谱,通过监测事理图谱中事件及事件指标的变动情况,进行基于事理逻辑链条的链式反应预警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911059165.5A CN110968699B (zh) | 2019-11-01 | 2019-11-01 | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911059165.5A CN110968699B (zh) | 2019-11-01 | 2019-11-01 | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110968699A true CN110968699A (zh) | 2020-04-07 |
CN110968699B CN110968699B (zh) | 2023-07-18 |
Family
ID=70029971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911059165.5A Active CN110968699B (zh) | 2019-11-01 | 2019-11-01 | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110968699B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111583072A (zh) * | 2020-04-27 | 2020-08-25 | 北京北大软件工程股份有限公司 | 法条上下位关系判断方法及处理终端 |
CN111738532A (zh) * | 2020-08-14 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 一种事件对对象影响度的获取方法和*** |
CN111753102A (zh) * | 2020-07-02 | 2020-10-09 | 武汉卓尔数字传媒科技有限公司 | 一种基于事理图谱的舆情分析方法、装置及电子设备 |
CN112199512A (zh) * | 2020-10-15 | 2021-01-08 | 北京大学 | 面向科技服务的事理图谱构建方法、装置、设备及存储介质 |
CN112200624A (zh) * | 2020-09-28 | 2021-01-08 | 深圳市其乐游戏科技有限公司 | 商品推荐方法、装置、终端设备以及存储介质 |
CN112417164A (zh) * | 2020-11-17 | 2021-02-26 | 珠海格力电器股份有限公司 | 信息的推荐方法和装置、存储介质、电子装置 |
CN112507691A (zh) * | 2020-12-07 | 2021-03-16 | 数地科技(北京)有限公司 | 一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置 |
CN112819164A (zh) * | 2021-02-02 | 2021-05-18 | 京东数科海益信息科技有限公司 | 事理图谱的推理方法、装置及计算机设备 |
CN112905774A (zh) * | 2021-02-22 | 2021-06-04 | 武汉市聚联科软件有限公司 | 一种基于事理图谱的人机对话深度意图理解方法 |
CN112948552A (zh) * | 2021-02-26 | 2021-06-11 | 北京信息科技大学 | 一种事理图谱在线扩展方法及装置 |
CN113159451A (zh) * | 2021-05-13 | 2021-07-23 | 长江水利委员会水文局 | 一种基于事件知识图谱构建的流域旱涝事件长期预测方法 |
CN113190593A (zh) * | 2021-05-12 | 2021-07-30 | 《中国学术期刊(光盘版)》电子杂志社有限公司 | 一种基于数字人文知识图谱的搜索推荐方法 |
CN113449116A (zh) * | 2021-06-22 | 2021-09-28 | 青岛海信网络科技股份有限公司 | 一种图谱构建、预警方法、设备及介质 |
CN113590744A (zh) * | 2021-06-30 | 2021-11-02 | 中山大学 | 一种面向可解释的情感溯源方法 |
CN113656602A (zh) * | 2021-09-01 | 2021-11-16 | 中国人民解放军31007部队 | 一种事理图谱的创建方法和装置 |
CN114611816A (zh) * | 2022-03-21 | 2022-06-10 | 中国电信股份有限公司 | 潜在事件预测方法、装置、设备及存储介质 |
CN114707004A (zh) * | 2022-05-24 | 2022-07-05 | 国网浙江省电力有限公司信息通信分公司 | 基于图像模型和语言模型的事理关系抽取处理方法及*** |
CN114925160A (zh) * | 2022-04-18 | 2022-08-19 | 北京急救中心 | 一种基于知识图谱技术的院前急救指导推荐***和方法 |
CN117012374A (zh) * | 2023-10-07 | 2023-11-07 | 之江实验室 | 一种融合事件图谱和深度强化学习的医疗随访***及方法 |
CN117688042A (zh) * | 2023-12-01 | 2024-03-12 | 合肥大智慧财汇数据科技有限公司 | 实现多源相似事件实时去重的方法、***和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180025322A1 (en) * | 2016-07-20 | 2018-01-25 | Linkedin Corporation | Skill-based recommendation of events to users |
CN108052576A (zh) * | 2017-12-08 | 2018-05-18 | 国家计算机网络与信息安全管理中心 | 一种事理知识图谱构建方法及*** |
CN109460479A (zh) * | 2018-11-19 | 2019-03-12 | 广州合摩计算机科技有限公司 | 一种基于事理图谱的预测方法、装置和*** |
CN109726293A (zh) * | 2018-11-14 | 2019-05-07 | 数据地平线(广州)科技有限公司 | 一种因果事件图谱构建方法、***、装置及存储介质 |
CN110134797A (zh) * | 2019-04-29 | 2019-08-16 | 贳巽(北京)国际商业数据技术股份公司 | 一种基于事理图谱和多因子模型研判金融市场变化的方法 |
-
2019
- 2019-11-01 CN CN201911059165.5A patent/CN110968699B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180025322A1 (en) * | 2016-07-20 | 2018-01-25 | Linkedin Corporation | Skill-based recommendation of events to users |
CN108052576A (zh) * | 2017-12-08 | 2018-05-18 | 国家计算机网络与信息安全管理中心 | 一种事理知识图谱构建方法及*** |
CN109726293A (zh) * | 2018-11-14 | 2019-05-07 | 数据地平线(广州)科技有限公司 | 一种因果事件图谱构建方法、***、装置及存储介质 |
CN109460479A (zh) * | 2018-11-19 | 2019-03-12 | 广州合摩计算机科技有限公司 | 一种基于事理图谱的预测方法、装置和*** |
CN110134797A (zh) * | 2019-04-29 | 2019-08-16 | 贳巽(北京)国际商业数据技术股份公司 | 一种基于事理图谱和多因子模型研判金融市场变化的方法 |
Non-Patent Citations (2)
Title |
---|
单晓红 等: "基于事理图谱的网络舆情演化路径分析——以医疗舆情为例", 《情报理论与实践》 * |
开放知识图谱: "刘挺|从知识图谱到事理图谱", 《HTTPS://BLOG.CSDN.NET/TGQDT3GGAMDKHASLZV/ARTICLE/DETAILS/》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111583072A (zh) * | 2020-04-27 | 2020-08-25 | 北京北大软件工程股份有限公司 | 法条上下位关系判断方法及处理终端 |
CN111583072B (zh) * | 2020-04-27 | 2023-11-07 | 北京北大软件工程股份有限公司 | 法条上下位关系判断方法及处理终端 |
CN111753102A (zh) * | 2020-07-02 | 2020-10-09 | 武汉卓尔数字传媒科技有限公司 | 一种基于事理图谱的舆情分析方法、装置及电子设备 |
CN111738532A (zh) * | 2020-08-14 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 一种事件对对象影响度的获取方法和*** |
CN112200624A (zh) * | 2020-09-28 | 2021-01-08 | 深圳市其乐游戏科技有限公司 | 商品推荐方法、装置、终端设备以及存储介质 |
CN112199512A (zh) * | 2020-10-15 | 2021-01-08 | 北京大学 | 面向科技服务的事理图谱构建方法、装置、设备及存储介质 |
CN112417164A (zh) * | 2020-11-17 | 2021-02-26 | 珠海格力电器股份有限公司 | 信息的推荐方法和装置、存储介质、电子装置 |
CN112507691A (zh) * | 2020-12-07 | 2021-03-16 | 数地科技(北京)有限公司 | 一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置 |
CN112819164A (zh) * | 2021-02-02 | 2021-05-18 | 京东数科海益信息科技有限公司 | 事理图谱的推理方法、装置及计算机设备 |
CN112819164B (zh) * | 2021-02-02 | 2024-05-24 | 京东科技信息技术有限公司 | 事理图谱的推理方法、装置及计算机设备 |
CN112905774A (zh) * | 2021-02-22 | 2021-06-04 | 武汉市聚联科软件有限公司 | 一种基于事理图谱的人机对话深度意图理解方法 |
CN112948552A (zh) * | 2021-02-26 | 2021-06-11 | 北京信息科技大学 | 一种事理图谱在线扩展方法及装置 |
CN112948552B (zh) * | 2021-02-26 | 2023-06-02 | 北京信息科技大学 | 一种事理图谱在线扩展方法及装置 |
CN113190593A (zh) * | 2021-05-12 | 2021-07-30 | 《中国学术期刊(光盘版)》电子杂志社有限公司 | 一种基于数字人文知识图谱的搜索推荐方法 |
CN113159451A (zh) * | 2021-05-13 | 2021-07-23 | 长江水利委员会水文局 | 一种基于事件知识图谱构建的流域旱涝事件长期预测方法 |
CN113449116A (zh) * | 2021-06-22 | 2021-09-28 | 青岛海信网络科技股份有限公司 | 一种图谱构建、预警方法、设备及介质 |
CN113590744A (zh) * | 2021-06-30 | 2021-11-02 | 中山大学 | 一种面向可解释的情感溯源方法 |
CN113590744B (zh) * | 2021-06-30 | 2024-05-24 | 中山大学 | 一种面向可解释的情感溯源方法 |
CN113656602A (zh) * | 2021-09-01 | 2021-11-16 | 中国人民解放军31007部队 | 一种事理图谱的创建方法和装置 |
CN114611816B (zh) * | 2022-03-21 | 2024-02-27 | 中国电信股份有限公司 | 潜在事件预测方法、装置、设备及存储介质 |
CN114611816A (zh) * | 2022-03-21 | 2022-06-10 | 中国电信股份有限公司 | 潜在事件预测方法、装置、设备及存储介质 |
CN114925160A (zh) * | 2022-04-18 | 2022-08-19 | 北京急救中心 | 一种基于知识图谱技术的院前急救指导推荐***和方法 |
CN114925160B (zh) * | 2022-04-18 | 2024-06-21 | 北京急救中心 | 一种基于知识图谱技术的院前急救指导推荐***和方法 |
CN114707004B (zh) * | 2022-05-24 | 2022-08-16 | 国网浙江省电力有限公司信息通信分公司 | 基于图像模型和语言模型的事理关系抽取处理方法及*** |
CN114707004A (zh) * | 2022-05-24 | 2022-07-05 | 国网浙江省电力有限公司信息通信分公司 | 基于图像模型和语言模型的事理关系抽取处理方法及*** |
CN117012374A (zh) * | 2023-10-07 | 2023-11-07 | 之江实验室 | 一种融合事件图谱和深度强化学习的医疗随访***及方法 |
CN117012374B (zh) * | 2023-10-07 | 2024-01-26 | 之江实验室 | 一种融合事件图谱和深度强化学习的医疗随访***及方法 |
CN117688042A (zh) * | 2023-12-01 | 2024-03-12 | 合肥大智慧财汇数据科技有限公司 | 实现多源相似事件实时去重的方法、***和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110968699B (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110968699A (zh) | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 | |
CN110968700B (zh) | 融合多类事理与实体知识的领域事件图谱构建方法和装置 | |
CN111475623B (zh) | 基于知识图谱的案件信息语义检索方法及装置 | |
CN113806563B (zh) | 面向多源异构建筑人文史料的建筑师知识图谱构建方法 | |
CN108073569A (zh) | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 | |
US11609959B2 (en) | System and methods for generating an enhanced output of relevant content to facilitate content analysis | |
Whitney et al. | Don’t want to get caught? don’t say it: The use of emojis in online human sex trafficking ads | |
CN113742493A (zh) | 一种病理知识图谱的构建方法及装置 | |
CN114153978A (zh) | 模型训练方法、信息抽取方法、装置、设备及存储介质 | |
KR20220068937A (ko) | 기계학습 방법론을 이용한 한국 표준 산업/직업 분류 방법 | |
CN110880142A (zh) | 一种风险实体获取方法及装置 | |
CN117574898A (zh) | 基于电网设备的领域知识图谱更新方法及*** | |
Celikyilmaz et al. | A graph-based semi-supervised learning for question-answering | |
Sandhiya et al. | A review of topic modeling and its application | |
Addepalli et al. | A proposed framework for measuring customer satisfaction and product recommendation for ecommerce | |
Hussain et al. | A technique for perceiving abusive bangla comments | |
Skondras et al. | Efficient Resume Classification through Rapid Dataset Creation Using ChatGPT | |
WO2024087754A1 (zh) | 一种多维度文本综合辨识方法 | |
CN110807096A (zh) | 一种小样本集上的信息对匹配方法及*** | |
Rachidi et al. | Classifying toxicity in the Arabic Moroccan dialect on Instagram: a machine and deep learning approach | |
Huda et al. | Aspect-based sentiment analysis in tourism industry for tourism recommender system | |
CN110928985A (zh) | 一种基于深度学习算法自动提取近义词的科技项目查重方法 | |
Al-Mutairi et al. | Predicting the Popularity of Trending Arabic Wikipedia Articles Based on External Stimulants Using Data/Text Mining Techniques | |
CN116628628B (zh) | 基于检索信息的用户信息素养分析方法、***及存储介质 | |
Amin et al. | Enhancing the detection of fake news in social media based on machine learning models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220715 Address after: Room 888-6, building 4, artificial intelligence Industrial Park, No. 266, Chuangyan Road, Qilin science and Technology Innovation Park, Nanjing, Jiangsu 211100 Applicant after: Digital workshop (Nanjing) Technology Co.,Ltd. Address before: 100080 v21, 17 / F, 1 Zhongguancun Street, Haidian District, Beijing Applicant before: Digital technology (Beijing) Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |