CN111597349A - 一种基于人工智能的轨道交通规范实体关系自动补全方法 - Google Patents

一种基于人工智能的轨道交通规范实体关系自动补全方法 Download PDF

Info

Publication number
CN111597349A
CN111597349A CN202010363261.5A CN202010363261A CN111597349A CN 111597349 A CN111597349 A CN 111597349A CN 202010363261 A CN202010363261 A CN 202010363261A CN 111597349 A CN111597349 A CN 111597349A
Authority
CN
China
Prior art keywords
entity
sentence
rail transit
entity relationship
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010363261.5A
Other languages
English (en)
Other versions
CN111597349B (zh
Inventor
朱磊
冯林林
黑新宏
刘尧林
吕泓瑾
张晋源
林泓
刘瑞
刘旭华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN202010363261.5A priority Critical patent/CN111597349B/zh
Publication of CN111597349A publication Critical patent/CN111597349A/zh
Application granted granted Critical
Publication of CN111597349B publication Critical patent/CN111597349B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于人工智能的轨道交通规范实体关系自动补全方法,包括构建实体关系补全模型,对轨道交通规范和其中名词词性分词输入到实体关系补全模型中,判断输入的规范是否为简单句,若是简单句,查找轨道交通规范中实体相关属性,生成实体关系三元组,若不是简单句,抽取轨道交通规范后句属性词和实体,使前句实体与后句属性词n:n匹配,或判断是否前句语法为主谓宾,后句为宾补,若是,将前句实体与宾语直接匹配,后句关键词与宾语实体直接匹配,生成实体关系三元组,若不是,对词汇相关度超过阈值的实体与实体关系进行输出,生成实体关系三元组,得到完整的语义结构实体规范,即完成轨道交通规范实体关系的自动补全。

Description

一种基于人工智能的轨道交通规范实体关系自动补全方法
技术领域
本发明属于人工智能自然语言处理技术领域,涉及一种基于人工智能的轨道交通规范实体关系自动补全方法。
背景技术
知识图谱是一种语义知识库,知识图谱采用三元组储存知识。知识图谱能够促进计算机更好的理解自然语言,为人们提供更好的服务,实现人机自然切换,实体识别和关系抽取是构建知识图谱的重要过程。
由于中文语法复杂,句子结构无序,没有严格的限制,部分标准文档中实体成分缺失,但满足基本语义便能生成了描述文本。这些原因导致了各个专业领域的规范在书写上也有较大差异。因此在专业领域的知识图谱构建时,虽然可以从规范条目中提取出实体,但是由于缺失实体成分却不能判断出实体之间的关系。
最近几年我国的轨道交通发展迅猛,不仅深刻影响着人民的生产生活方式,同时极大促进了社会生产力的发展。而《轨道交通设计规范》是轨道交通设计、修建、检测和维护的主要依据,它对轨道交通设计的各个部分提出了明确的要求和解释说明。所以,将该规范中的实体和关系抽取出来构建知识图谱,再结合知识图谱的检索、推理和查询等技术制作成地铁的设计、检测和施工。并且在其知识图谱相关生成的网站或者应用程序上按照关键字查寻便可以将各单个物体多个约束查询出来。修建人员在修建轨道交通中各个单独的物体时便可根据查询结果设计修建,检测人员在检测工程是否符合规范便可直接根据显示的约束进行比对。由此可以使建筑人员更加方便的设计和检测地铁设计的是否符合规范。
对缺失的实体关系成分进行补全,是知识图谱构建工作中非常重要的基础。缺失的实体关系直接会影响信息抽取,进而影响图谱中的节点和边的结构,使得知识图谱的推理性能大大降低。通过补全实体关系,才能进行轨道交通规范的自动化构建图谱及后期的查询、推理和智能问答。
由于现在对各领域图谱构建和规范的自然语言处理都处于萌芽阶段,现存的概率模型和基于词典都缺失大量的精确标注文档。但是这些问题需要专业的从业人员进行大量分析处理,进行人工实体关系补全,过程费时费力;而且设计规范涉及到30多个行业,从而人员只能从自身现有经验进行补全处理,这样导致补全实体关系的准确率低等问题。
发明内容
本发明的目的是提供一种基于人工智能的轨道交通规范实体关系自动补全方法,解决了现有轨道交通规范实体关系补全方法只能通过人工进行,费时费力,准确率低的问题。
本发明所采用的技术方案是,一种基于人工智能的轨道交通规范实体关系自动补全方法,包括以下步骤:
步骤1:根据轨道交通规范构建实体关系补全模型;
步骤2:对轨道交通规范进行词性标注,提取轨道交通规范中的名词词性分词;
步骤3:将所有轨道交通规范和提取的名词词性分词输入到实体关系补全模型中,提取的名词词性分词作为待补全的实体;用符号检测法判断输入的每一个轨道交通规范是否为简单句,若是简单句,进行步骤4,若不是简单句,进行步骤5;
步骤4:查找轨道交通规范中实体相关属性,判断实体与实体关系,生成实体关系三元组,并进行存储;
步骤5:对轨道交通规范进行基于深度学习的依存句法分析,若前句是并列结构的名词词组(Noun Phrase,NP),进行步骤6,若不是,进行步骤7;
步骤6:抽取后句属性词和实体,使前句实体与后句属性词n:n匹配,生成实体关系三元组,并进行存储;
步骤7:判断是否前句语法为主谓宾,后句为宾补,若是,进行步骤8,若不是,进行步骤9;
步骤8:将前句实体与宾语直接匹配,后句关键词与宾语实体直接匹配,生成实体关系三元组,并进行存储;
步骤9:计算词汇相关度,对相关度超过阈值的实体与实体关系进行输出,生成实体关系三元组,并进行存储;
步骤10:将步骤4、步骤8和步骤9中生成的实体关系三元组输出,得到完整的语义结构实体规范,即完成轨道交通规范实体关系的自动补全。
本发明的技术特征还在于,
实体关系三元组为“实体-动词-实体”或“实体-程度-属性”。
步骤1的具体操作步骤如下:
步骤1.1:获取轨道交通规范原文数据,对获取的轨道交通规范原文数据进行预处理和训练,生成字典;
步骤1.2:对字典进行处理,挖掘缺失特征,提取实体补全规则和方法;
步骤1.3:采用提取的实体补全规则和方法构建实体关系补全模型。
步骤2中,采用Bi-LSTM+CRF词性标注模型对轨道交通规范进行词性标注,形容词性分词划分为属性词,动词词性分词用来判断实体和实体之间的关系。
步骤3中,简单句为只含有顿号和一个句号的句子。
步骤4的具体操作步骤如下:
步骤4.1:查找轨道交通规范中实体相关的属性和动作关系;
步骤4.2:提取动词,判断实体与实体关系,并进行词性分析提取属性;
步骤4.4:根据实体与实体关系以及提取的属性,生成实体关系三元组,存储实体关系。
步骤9的具体操作步骤如下:
步骤9.1:判断轨道交通规范是否前句为非并列结构,且后句存在指代词,若是,对指代词后属性词与前句所有实体进行词汇相关度计算,若不是,命名实体识别词组,计算所有分词之间的词汇相关度;
步骤9.2:将词汇相关度超过阈值的实体与实体关系进行输出,生成实体关系三元组,并进行存储。
步骤9中,采用基于知网词库的词汇相关度计算算法来计算词汇相关度。
基于知网词库的词汇相关度计算算法如下:
rel(w1,w2)=max{a1*sim(s1,s2)+(1-a1)*asso(s1,s2)}
Figure BDA0002475839530000051
ssso(s1,s2)=∑ri*asso(p1,p2)
上式中,rel(w1,w2)表示词汇w1与词汇w2的相关度,sim(s1,s2)表示词汇w1与词汇w2的相似度,asso(s1,s2)表示实体s1和s2的语义关联度;ɑ1表示可调节参数,用于将相似度与语义关联度进行线性调和,它的取值范围为[0,1];sli表示词汇w1的义项,i=1,...,n表示词汇w1具有n个义项;s2j表示词汇w2的义项,j=1,...,m表示词汇w2具有m个义项;γi表示实体概念中不同部分的义原关联系数,是对两个概念每部分的拟合,同时必须满足∑ri=1,p1为义项s1的义原,p2为义项s2的义原。
本发明的有益效果是,通过深度学习得到轨道交通规范的关系,然后根据知网的义原方法进行实体类型名词间的关系进行补充,完成知识图谱构建过程中的关系补全,大大减少了人工构建图谱和关系数据库的工作量,提高了轨道交通规范实体关系补全的准确性,同时提高了轨道交通规范知识图谱的结构准确性,为基于知识图谱的轨道交通智能查询、推理和问答奠定基础;
通过深度学习,提高了实体及其关系的识别度,并且采用《知网》中实体类词语的语义相似度进行自动化判定,从而实现实体关系的补充,为构建知识图谱构建提供坚持基础。
附图说明
图1是本发明基于人工智能的轨道交通规范实体关系自动补全方法的流程示意图;
图2是本发明轨道交通规范实体关系自动补全方法中采用BI+LSTM+CRF词性标注模型对轨道交通规范进行词性标注的过程示意图;
图3是本发明轨道交通规范实体关系自动补全方法中采用基于知网词库的词汇相关度计算算法来计算词汇相关度的过程示意图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种基于人工智能的轨道交通规范实体关系自动补全方法,参照图1,包括以下步骤:
步骤1:根据轨道交通规范构建实体关系补全模型
步骤1.1:从城市轨道交通技术规范中获取轨道交通规范原文数据,对获取的原文数据进行格式检查,删除不必要的信息,例如空格等,获得预处理后的数据,然后对预处理后的数据进行训练,生成字典;
步骤1.2:对字典中数据进行处理,挖掘缺失特征,提取实体补全规则和方法;
步骤1.3:采用提取的实体补全规则和方法构建实体关系补全模型。
步骤2:参照图2,采用Bi-LSTM+CRF词性标注模型对轨道交通规范进行词性标注,先将字典中数据转换为hdf5格式,然后输入到Bi-LSTM+CRF词性标注模型中,输出提取的轨道交通规范中名词词性分词,将形容词性分词划分为属性词,动词词性分词用来判断实体和实体之间的关系。
其中,采用Bi-LSTM+CRF词性标注模型对轨道交通规范进行词性标注的具体过程如下表所示:
Figure BDA0002475839530000071
步骤3:将所有轨道交通规范原文和提取的名词词性分词输入到实体关系补全模型中,提取的名词词性分词作为待补全的实体;然后用符号检测法判断输入的每一个轨道交通规范是否为简单句,简单句为只含有顿号和一个句号的句子,包含一个主语,一个谓语,或者一个宾语;
若是简单句,进行步骤4,若不是简单句,则是复杂句,复杂句中通常含有多个主语,多个谓语,多个宾语,进行步骤5;
步骤4:查找所述轨道交通规范中实体相关属性,判断实体与实体关系,生成实体关系三元组,并进行存储;具体包括以下操作步骤:
步骤4.1:查找所述轨道交通规范中实体相关的属性和动作关系;
步骤4.2:提取动词,判断实体与实体关系,并进行词性分析提取属性;
步骤4.4:根据实体与实体关系以及提取的属性,生成实体关系三元组,存储实体关系。
步骤5:对所述轨道交通规范进行基于深度学习的依存句法分析,若前句是并列结构的NP词组,进行步骤6,若不是,进行步骤7;
步骤6:抽取后句属性词和实体,使前句实体与后句属性词n:n匹配,生成实体关系三元组,即“实体-动词-实体”或“实体-程度-属性”,并进行存储;
步骤7:判断是否前句语法为主谓宾,后句为宾补,若是,进行步骤8,若不是,进行步骤9;
步骤8:将前句实体与宾语直接匹配,后句关键词与宾语实体直接匹配,生成实体关系三元组,即“实体-动词-实体”或“实体-程度-属性”,并进行存储;
步骤9:参照图3,采用基于知网词库的词汇相关度计算算法来计算词汇相关度,对相关度超过阈值的实体与实体关系进行输出,生成实体关系三元组,即“实体-动词-实体”或“实体-程度-属性”,并进行存储;
步骤9的具体操作步骤如下:
步骤9.1:判断所述轨道交通规范是否前句为非并列结构,且后句存在指代词,若是,对指代词后属性词与前句所有实体进行词汇相关度计算,若不是,命名实体识别词组,然后对所有分词进行词汇相关度计算,计算所有分词之间相关度;
其中,基于知网词库的词汇相关度计算算法如下所示:
Figure BDA0002475839530000091
Figure BDA0002475839530000101
《知网》采用了义原为最基本的,不宜与分割的最小单位,其共采用1618个义原,并且对62174个概念实体进行了描述。在《知乎》中,设实体类义原词组w1和w2,如果w1有那个不同概念(义项):s11,s12,……,s1n,w2有那个不同概念(义项):s21,s22,……,s2m,基于知网词库的词汇相关度计算算法如下:
rel(wl,w2)=max{a1*sim(s1,s2)-(1-a1)*asso(s1,s2)}
Figure BDA0002475839530000102
asso(s1,s2)=Σri*asso(p1,p2)
上式中,rel(w1,w2)表示词汇w1与词汇w2的相关度,sim(s1,s2)表示词汇w1与词汇w2的相似度,asso(s1,s2)表示实体s1和s2的语义关联度;ɑ1表示可调节参数,用于将相似度与语义关联度进行线性调和,它的取值范围为[0,1];s1i表示词汇w1的义项,i=1,…,n表示词汇w1具有n个义项;s2j表示词汇w2的义项,j=1,…,m表示词汇w2具有m个义项;γi表示实体概念中不同部分的义原关联系数,是对两个概念每部分的拟合,同时必须满足∑ri=1,p1为义项s1的义原,p2为义项s2的义原。
根据上面三个公式,本发明将两个词语的实体之间语义相似度进行计算。如果实体的相似度越高,则他们间的相关度也就越高;两个词语的实体义原之间的关联度越大,则他们的相似度也就越高。然后将相似度与关联度进行线性组合调节后进行了计算,得到最终的语义相似度。
步骤9.2:将词汇相关度超过阈值的实体与实体关系进行输出,生成实体关系三元组,即“实体-动词-实体”或“实体-程度-属性”,并进行存储。其中,阈值在轨道交通规范条目中通过初步实验来确定。
步骤10:将步骤4、步骤8和步骤9中生成的实体关系三元组输出,得到完整的语义结构实体规范,即完成轨道交通规范实体关系的自动补全。
例如:列车在平面曲线上的运行速度应按照曲线半径大小进行计算,其未被平衡横向加速度不宜超过0.4m/s2。首先,分析出该语句结构,按照规则,可以得出“半径”是“平面曲线”的属性,“运行速度”和“平衡横向加速度”均为“列车”的属性。又如“转向架性能、主要尺寸应与车体、线路相互匹配,并应保证相关部件在允许磨耗限度内,能确保列车以最高允许速度安全平稳运行。”首先,将其划分为复杂句,其首句“性能”“尺寸”为并列属性,“转向架”是他们的实体,“性能”“尺寸”又通过“匹配”“车体”、“线路”,“相关部件”根据词汇相关度可判别为“转向架”的属性词,“列车”与“速度”为属性关系,与“运行”为动作关系。
本发明轨道交通规范实体关系自动补全方法合理有效地解决了在实体缺失关系时,由于没有明确语义而导致实体、属性、关系、之间导致的实体关系错误补全。在按照本发明所述模型处理后,能够提高补全实体缺失的语义关系,提高实体之间的关联性和实体关系的准确性。

Claims (9)

1.一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,包括以下步骤:
步骤1:根据轨道交通规范构建实体关系补全模型;
步骤2:对轨道交通规范进行词性标注,提取轨道交通规范中的名词词性分词;
步骤3:将所有轨道交通规范和提取的名词词性分词输入到实体关系补全模型中,提取的名词词性分词作为待补全的实体;用符号检测法判断输入的每一个轨道交通规范是否为简单句,若是简单句,进行步骤4,若不是简单句,进行步骤5;
步骤4:查找所述轨道交通规范中实体相关属性,判断实体与实体关系,生成实体关系三元组,并进行存储;
步骤5:对所述轨道交通规范进行基于深度学习的依存句法分析,若前句是并列结构的NP词组,进行步骤6,若不是,进行步骤7;
步骤6:抽取后句属性词和实体,使前句实体与后句属性词n:n匹配,生成实体关系三元组,并进行存储;
步骤7:判断是否前句语法为主谓宾,后句为宾补,若是,进行步骤8,若不是,进行步骤9;
步骤8:将前句实体与宾语直接匹配,后句关键词与宾语实体直接匹配,生成实体关系三元组,并进行存储;
步骤9:计算词汇相关度,对相关度超过阈值的实体与实体关系进行输出,生成实体关系三元组,并进行存储;
步骤10:将步骤4、步骤8和步骤9中生成的实体关系三元组输出,得到完整的语义结构实体规范,即完成轨道交通规范实体关系的自动补全。
2.根据权利要求1所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述实体关系三元组为“实体-动词-实体”或“实体-程度-属性”。
3.根据权利要求1所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤1的具体操作步骤如下:
步骤1.1:获取轨道交通规范原文数据,对获取的轨道交通规范原文数据进行预处理和训练,生成字典;
步骤1.2:对字典进行处理,挖掘缺失特征,提取实体补全规则和方法;
步骤1.3:采用提取的实体补全规则和方法构建实体关系补全模型。
4.根据权利要求1所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤2中,采用Bi-LSTM+CRF词性标注模型对轨道交通规范进行词性标注,形容词性分词划分为属性词,动词词性分词用来判断实体和实体之间的关系。
5.根据权利要求4所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤3中,简单句为只含有顿号和一个句号的句子。
6.根据权利要求5所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤4的具体操作步骤如下:
步骤4.1:查找所述轨道交通规范中实体相关的属性和动作关系;
步骤4.2:提取动词,判断实体与实体关系,并进行词性分析提取属性;
步骤4.4:根据实体与实体关系以及提取的属性,生成实体关系三元组,存储实体关系。
7.根据权利要求1所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤9的具体操作步骤如下:
步骤9.1:判断所述轨道交通规范是否前句为非并列结构,且后句存在指代词,若是,对指代词后属性词与前句所有实体进行词汇相关度计算,若不是,命名实体识别词组,计算所有分词之间的词汇相关度;
步骤9.2:将词汇相关度超过阈值的实体与实体关系进行输出,生成实体关系三元组,并进行存储。
8.根据权利要求7所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述步骤9中,采用基于知网词库的词汇相关度计算算法来计算词汇相关度。
9.根据权利要求8所述的一种基于人工智能的轨道交通规范实体关系自动补全方法,其特征在于,所述基于知网词库的词汇相关度计算算法如下:
rel(w1,w2)=max{a1*sim(s1,s2)+(1-a1)*asso(s1,s2)}
Figure FDA0002475839520000031
asso(s1,s2)=∑ri*asso(p1,p2)
上式中,rel(w1,w2)表示词汇w1与词汇w2的相关度,sim(s1,s2)表示词汇w1与词汇w2的相似度,asso(s1,s2)表示实体s1和s2的语义关联度;ɑ1表示可调节参数,用于将相似度与语义关联度进行线性调和,它的取值范围为[0,1];s1i表示词汇w1的义项,i=1,…,n表示词汇w1具有n个义项;s2j表示词汇w2的义项,j=1,…,m表示词汇w2具有m个义项;γi表示实体概念中不同部分的义原关联系数,是对两个概念每部分的拟合,同时必须满足∑ri=1,p1为义项s1的义原,p2为义项s2的义原。
CN202010363261.5A 2020-04-30 2020-04-30 一种基于人工智能的轨道交通规范实体关系自动补全方法 Active CN111597349B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010363261.5A CN111597349B (zh) 2020-04-30 2020-04-30 一种基于人工智能的轨道交通规范实体关系自动补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010363261.5A CN111597349B (zh) 2020-04-30 2020-04-30 一种基于人工智能的轨道交通规范实体关系自动补全方法

Publications (2)

Publication Number Publication Date
CN111597349A true CN111597349A (zh) 2020-08-28
CN111597349B CN111597349B (zh) 2022-10-11

Family

ID=72185606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010363261.5A Active CN111597349B (zh) 2020-04-30 2020-04-30 一种基于人工智能的轨道交通规范实体关系自动补全方法

Country Status (1)

Country Link
CN (1) CN111597349B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112463960A (zh) * 2020-10-30 2021-03-09 完美世界控股集团有限公司 一种实体关系的确定方法、装置、计算设备及存储介质
CN112949280A (zh) * 2021-03-02 2021-06-11 中国联合网络通信集团有限公司 一种数据处理方法和装置
CN116049148A (zh) * 2023-04-03 2023-05-02 中国科学院成都文献情报中心 一种元出版环境下领域元知识引擎的构建方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170032275A1 (en) * 2015-07-28 2017-02-02 Linkedin Corporation Entity matching for ingested profile data
CN106815293A (zh) * 2016-12-08 2017-06-09 中国电子科技集团公司第三十二研究所 一种面向情报分析的构建知识图谱的***及方法
CN108763353A (zh) * 2018-05-14 2018-11-06 中山大学 基于规则和远程监督的百度百科关系三元组抽取方法
CN109241538A (zh) * 2018-09-26 2019-01-18 上海德拓信息技术股份有限公司 基于关键词和动词依存的中文实体关系抽取方法
CN109614501A (zh) * 2018-12-13 2019-04-12 浙江工商大学 一种基于知识图谱的工业隐患规范化上报方法及***
CN110263019A (zh) * 2019-06-18 2019-09-20 中南民族大学 实体关系抽取模型的构建方法、装置和存储介质
CN110287704A (zh) * 2019-06-25 2019-09-27 北京中科微澜科技有限公司 一种基于漏洞图谱的漏洞软件依赖关系构建方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170032275A1 (en) * 2015-07-28 2017-02-02 Linkedin Corporation Entity matching for ingested profile data
CN106815293A (zh) * 2016-12-08 2017-06-09 中国电子科技集团公司第三十二研究所 一种面向情报分析的构建知识图谱的***及方法
CN108763353A (zh) * 2018-05-14 2018-11-06 中山大学 基于规则和远程监督的百度百科关系三元组抽取方法
CN109241538A (zh) * 2018-09-26 2019-01-18 上海德拓信息技术股份有限公司 基于关键词和动词依存的中文实体关系抽取方法
CN109614501A (zh) * 2018-12-13 2019-04-12 浙江工商大学 一种基于知识图谱的工业隐患规范化上报方法及***
CN110263019A (zh) * 2019-06-18 2019-09-20 中南民族大学 实体关系抽取模型的构建方法、装置和存储介质
CN110287704A (zh) * 2019-06-25 2019-09-27 北京中科微澜科技有限公司 一种基于漏洞图谱的漏洞软件依赖关系构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIE SUN ET AL.: ""Knowledge Map Completion Method Based on Metric Space and Relational Path"", 《INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE & EDUCATION》 *
乔晶晶: ""多源知识库实体对齐与属性补全"", 《万方数据知识服务平台》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112463960A (zh) * 2020-10-30 2021-03-09 完美世界控股集团有限公司 一种实体关系的确定方法、装置、计算设备及存储介质
CN112463960B (zh) * 2020-10-30 2021-07-27 完美世界控股集团有限公司 一种实体关系的确定方法、装置、计算设备及存储介质
CN112949280A (zh) * 2021-03-02 2021-06-11 中国联合网络通信集团有限公司 一种数据处理方法和装置
CN112949280B (zh) * 2021-03-02 2023-07-07 中国联合网络通信集团有限公司 一种数据处理方法和装置
CN116049148A (zh) * 2023-04-03 2023-05-02 中国科学院成都文献情报中心 一种元出版环境下领域元知识引擎的构建方法
CN116049148B (zh) * 2023-04-03 2023-07-18 中国科学院成都文献情报中心 一种元出版环境下领域元知识引擎的构建方法

Also Published As

Publication number Publication date
CN111597349B (zh) 2022-10-11

Similar Documents

Publication Publication Date Title
CN110442760B (zh) 一种问答检索***的同义词挖掘方法及装置
CN110059311B (zh) 一种面向司法文本数据的关键词提取方法及***
CN109271529B (zh) 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法
Rahman et al. Narrowing the modeling gap: A cluster-ranking approach to coreference resolution
CN111325029B (zh) 一种基于深度学习集成模型的文本相似度计算方法
CN111597349B (zh) 一种基于人工智能的轨道交通规范实体关系自动补全方法
US20150227505A1 (en) Word meaning relationship extraction device
Xie et al. Topic enhanced deep structured semantic models for knowledge base question answering
CN110502744B (zh) 一种针对历史公园评价的文本情感识别方法及装置
Sahu et al. Prashnottar: a Hindi question answering system
WO2010132790A1 (en) Methods and systems for knowledge discovery
CN112183059B (zh) 一种中文结构化事件抽取方法
CN111444704B (zh) 基于深度神经网络的网络安全关键词抽取方法
CN113168499A (zh) 检索专利文档的方法
CN109446313B (zh) 一种基于自然语言分析的排序***及方法
CN113196277A (zh) 用于检索自然语言文档的***
CN109522396B (zh) 一种面向国防科技领域的知识处理方法及***
CN110675962A (zh) 一种基于机器学习和文本规则的中药药理作用识别方法及***
CN116775874B (zh) 一种基于多重语义信息的资讯智能分类方法及***
CN113196278A (zh) 训练自然语言检索***的方法、检索***以及对应的用途
CN116775812A (zh) 一种基于自然语音处理的中医药专利分析与挖掘工具
CN110399603A (zh) 一种基于意群划分的文本处理技术方法和***
CN115033659A (zh) 基于深度学习的子句级自动摘要模型***及摘要生成方法
CN111241299A (zh) 一种法律咨询的知识图谱自动构建方法及其检索***
CN114219248A (zh) 一种基于lda模型、依存句法和深度学习的人岗匹配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant