CN107766556B - 一种基于进化算法的交互式本体匹配方法和计算机设备 - Google Patents

一种基于进化算法的交互式本体匹配方法和计算机设备 Download PDF

Info

Publication number
CN107766556B
CN107766556B CN201711070247.0A CN201711070247A CN107766556B CN 107766556 B CN107766556 B CN 107766556B CN 201711070247 A CN201711070247 A CN 201711070247A CN 107766556 B CN107766556 B CN 107766556B
Authority
CN
China
Prior art keywords
ontology
matching
user
inspection
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711070247.0A
Other languages
English (en)
Other versions
CN107766556A (zh
Inventor
薛醒思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian University of Technology
Original Assignee
Fujian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian University of Technology filed Critical Fujian University of Technology
Priority to CN201711070247.0A priority Critical patent/CN107766556B/zh
Publication of CN107766556A publication Critical patent/CN107766556A/zh
Application granted granted Critical
Publication of CN107766556B publication Critical patent/CN107766556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Genetics & Genomics (AREA)
  • Physiology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种基于进化算法的交互式本体匹配方法,包括本体划分阶段,将大规模的本体划分为小规模的本体分块,使得后续的本体匹配过程是在本体分块中进行;基于进化算法的本体匹配阶段,利用进化算法实现自动化的本体匹配过程,自适应地确定用户介入的时间点;用户检验和检验结果扩散阶段,将自动确定的候选本体匹配结果呈现给用户检验,在用户检验的过程中自动处理剩余的候选本体匹配结果,最后扩散可信的用户检验结果;本体分块匹配结果集成与评价阶段,集成不同本体分块匹配结果,并利用本体的参考匹配结果计算最终结果的f度量。

Description

一种基于进化算法的交互式本体匹配方法和计算机设备
技术领域
本发明涉及一种本体匹配方法和可执行该方法的计算机设备。
背景技术
本体:对某个领域中的知识的概念化明确的规范说明,即对某个领域中存在的对象、概念、其他实体以及它们之间的关系的正式的和规范化描述。
本体匹配过程:确定两个异质本体中语义相同的实体对集合的过程。
本体匹配技术可以解决本体异质问题(同一个概念在不同本体有不同的名字),实现基于本体的应用程序在语义层面上的协作。
本体作为语义网的核心技术,是一种共享的、正式的信息交换参考模型,它描述了某个领域中存在的对象、概念、其他实体以及它们之间的关系[1]。本体技术在知识管理、信息检索、电子商务和生物医学等领域都具有重要应用,目前语义网上已公布的本体中含有的实体规模已经达到31亿之巨。然而,这些本体间的异质问题(同一个概念在不同本体有不同的名字)是实现语义网中不同应用间语义协作的最大障碍,也是制约语义网发展的瓶颈问题。本体匹配技术是当前解决本体异质问题最有效的方法[2]。可是截至本专利申报书完成之前(2017年2月),已有的本体匹配技术对语义网上已公布的5亿个实体匹配结果有接近45%是错误的[3,4]。因此,业内急需一种能够获取高质量本体匹配结果的技术。由于本体匹配过程的复杂性,自动化本体匹配技术获取的本体匹配结果需要通过用户验证来确保其质量。令用户和自动化本体匹配技术在合理的时间内互相协作以获取高质量的本体匹配结果的过程称为交互式本体匹配过程。本体匹配***无法要求用户验证一个本体匹配结果中的全部实体匹配对,因此在交互式本体匹配过程中存在的主要挑战问题之一是如何最小化用户的工作量的同时最大化用户检验结果的价值。
在最小化用户工作量的工作中,Shi等[5]提出通过交互式算法确定的阈值和相似度扩散图来选择最有信息量的问题匹配对让用户验证。Jiménez-Ruiz等[6]提出了三个原则(即一致性,局部性和保留性原则)来过滤候选实体匹配对。Beisswanger等[7]提出了一些质量检查标准来度量本体匹配结果的可复用性,并使用其确定候选实体匹配集。Cruz[8]等选择让不同的本体匹配器无法达成一致结果的问题实体匹配对给用户。类似地,SAMBO[9]通过之前用户验证过的知识来减少不必要的用户干预。GOMMA[10]采用的是基于组合和差异性的自适应算法来复用不受影响的实体匹配对。PROMPT[11]通过最新的用户干预的结果来确定候选实体匹配集。
相似度扩散算法可以依据本体概念体系结构将用户验证的结果扩散到其邻居概念中去,是最大化用户验证结果的有效方法。Shi等[5]提出了一种主动学习框架,可以向用户提供最有信息量的候选匹配结果给用户验证,并将用户验证结果依据本体概念体系结构扩散以提高匹配的准确性。AgreementMaker[8]使用签名向量来讲用户的反馈结果扩散到其他实体匹配对中去,通过一个线性函数来实现对相关匹配对相似度值的增加和减少。
归结目前这些现有的本体匹配方法,存在下述缺点:
(1)由于每次迭代过程都要用户介入,增加了用户不必要的工作量;
(2)需要用户逐个验证候选匹配结果,无法依据用户的验证结果自动处理剩余的候选匹配结果,增加了用户的工作量;
(3)容易扩散错误的用户验证结果,从而降低了本体匹配的质量。
[1]Garrido A.Logical Foundations of Artificial Intelligence[J].BRAIN.Broad Research in Artificial Intelligence and Neuroscience,2010,1(2):149-152.
[2]Shvaiko P,Euzenat J.Ontology matching:state of the art and futurechallenges[J].IEEE Transactions on knowledge and data engineering,2013,25(1):158-176.
[3]Liu W.Truth discovery to resolve object conflicts in linked data[J].arXiv preprint arXiv:1509.00104,2015.
[4]Liu W,Liu J,Duan H,et al.Exploiting Source-Object Network toResolve Object Conflicts in Linked Data[J].arXiv preprint arXiv:1604.08407,2016.
[5]F.Shi,J.Li,J.Tang,G.Xie,and H.Li,“Actively learning ontologymatching via user interaction,”in International Semantic WebConference.Springer,2009,pp.585–600.
[6]E.Jiménez-Ruiz,B.C.Grau,I.Horrocks,and R.Berlanga,“Logic-basedassessment of the compatibility of umls ontology sources,”Journal ofbiomedical semantics,vol.2,no.1,p.S2,2011.
[7]E.Beisswanger and U.Hahn,“Towards valid and reusable reference
Figure GDA0002970714710000031
basic quality checks for ontology alignments and theirapplication to three different reference data sets,”Journal of biomedicalsemantics,vol.3,no.1,p.S4,2012.
[8]I.F.Cruz,C.Stroe,and M.Palmonari,“Interactive user feedback inontology matching using signature vectors,”in 2012IEEE 28th InternationalConference on Data Engineering.IEEE,2012,pp.1321–1324.
[9]P.Lambrix and R.Kaliyaperumal,“A session-based approach foraligning large ontologies,”in Extended Semantic Web Conference.Springer,2013,pp.46–60.
[10]A.Groβ,J.C.Dos Reis,M.Hartung,C.Pruski,and E.Rahm,“Semi-automaticadaptation of mappings between life science ontologies,”in InternationalConference on Data Integration inthe Life Sciences.Springer,2013,pp.90–104.
[11]N.F.Noy,M.A.Musen et al.,“Algorithm and tool for automatedontology merging and alignment,”in Proceedings of the 17th NationalConference on Artificial Intelligence(AAAI-00).Available as SMI technicalreport SMI-2000-0831,2000.
发明内容
本发明要解决的技术问题,在于提供一种基于进化算法的交互式本体匹配方法,能够自适应地确定用户介入的时间点,自动确定数量有限的本体匹配候选集让用户检验,并扩散用户检验的结果以实现最大化用户检验结果的价值的目的。
本发明方法是这样实现的:一种基于进化算法的交互式本体匹配方法,包括:
本体划分阶段,将大规模的本体划分为小规模的本体分块,使得后续的本体匹配过程是在本体分块中进行;
基于进化算法的本体匹配阶段,利用进化算法实现自动化的本体匹配过程,自适应地确定用户介入的时间点;
用户检验和检验结果扩散阶段,将自动确定的候选本体匹配结果呈现给用户检验,在用户检验的过程中自动处理剩余的候选本体匹配结果,最后扩散可信的用户检验结果;
本体分块匹配结果集成与评价阶段,集成不同本体分块匹配结果,并利用本体的参考匹配结果计算最终结果的f度量。
进一步的,所述本体划分阶段的具体过程是:
(1)首先通过SemanticAccuaracy度量本体结构的分散性和不平衡性来选择可靠性较强的本体作为源本体;
(2)然后利用扩展自SCAN算法的本体划分算法将源本体划分为源本体分块;
(3)对每个源本体分块,利用概念相关度度量来确定其相似的目标本体分块。
进一步的,所述基于进化算法的本体匹配阶段包括建模过程和匹配过程;
所述建模过程具体是:
S11、将本体O定义为O={C,P,I},其中C,P和I分别表示本体中的概念集合,属性集合和实例集合,其中概念,属性和实例统称本体的实体;本体匹配结果A是一个实体匹配对的集合,每一个实体匹配对可以表示为一个四元组{e,e',n,rel},其中e和e'分别表示元本体和目标本体的实体,n是e和e'关系的可信度值,rel是e和e'之间的等价关系;
S12、给定本体匹配结果A,其质量由f(A)来度量:
Figure GDA0002970714710000041
其中,|A|是A中的匹配对数量,MF(A)是计算A的MatchFmeasure值,δi是A中第i个匹配对的相似度值,α∈[0,1]是用于权衡本体匹配结果的查全率和查准率主调整参数;
S13、给定源本体分块Osrc和目标本体分块Otgt,设计单目标本体匹配问题的优化模型如下:
Figure GDA0002970714710000051
其中,fi(X),i=1,2,...,m计算第i个本体匹配器结果的f()值,|Osrc|和|Otgt|分别表示本体Osrc和Otgt的实体集合的基数,xi,i=1,2,...,|Osrc|表示第i个实体匹配对;
所述匹配过程具体是:
S21、配置算法控制参数,包括数值精度,种群规模,选择概率,交叉概率和变异概率;
S22、随机初始化种群,并在种群中选出适应度值最高的个体作为精英解的初始化值;
S23、进入进化过程,首先评价种群中每一个个体的适应度值f(),通过赌轮盘选择,以及通过单点交叉和单点变异标准进化算子操作之后选择生成下一代种群;
S24、重新评价种群的适应度值f()并尝试更新精英解,直到满足终止条件,并输出本体分块匹配结果,若精英解连续若干代无法更新而进化,此时让用户介入引导算法的进化方向。
进一步的,所述用户检验和检验结果扩散阶段的具体过程是:
(1)首先将精英解中实体匹配对在相似度阈值为0.4附近的“问题”匹配对让用户检验;
(2)然后对于目标本体中一个实体有多个源本体实体对应的匹配,让用户选出其中一个正确的匹配对,其余的匹配对的可信度设置为0;
(3)最后对于用户检验过的结果,将相似度值高于阈值0.9的匹配对的可信扩散到其周边概念中。
进一步的,所述α值同查全率呈正比,同查准率成反比。所述α的建议取值是0.35。
此外,本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时能够执行上述本发明方法的过程。
本发明具有如下优点:
(1)利用进化算法自适应地决定用户介入的时机,减少了不必要的用户交互;
(2)自动根据用户检验结果处理剩余候选匹配对,减少了用户的工作量,提高了用户检验过程的效率;
(3)将用户检验过的高于阈值的实体匹配对扩散到周边概念中,以减少错误的用户检验结果带来的不良影响,在最大化用户检验结果的价值的同时提高本体匹配过程的效率和最终本体匹配结果的质量。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明方法执行流程图。
图2为本发明方法中用户检验和检验结果扩散阶段的执行流程图。
具体实施方式
请参阅图1所示,本发明的基于进化算法的交互式本体匹配方法,包括本体划分阶段,基于进化算法的本体匹配阶段,用户检验和检验结果扩散阶段,以及本体分块匹配结果集成与评价阶段。
所述本体划分阶段,将大规模的本体划分为小规模的本体分块,使得后续的本体匹配过程是在本体分块中进行;其具体过程是:
(1)首先通过SemanticAccuaracy(Sánchez D,Batet M,Martínez S,etal.Semantic variance:an intuitive measure for ontology accuracy evaluation[J].Engineering Applications of Artificial Intelligence,2015,39:89-99)度量本体结构的分散性和不平衡性来选择可靠性较强的本体作为源本体;
(2)然后利用扩展自SCAN算法的本体划分算法将源本体划分为源本体分块;
(3)对每个源本体分块,利用概念相关度度量来确定其相似的目标本体分块(X.Xue,J.Pan,A segment-based approach for large-scale ontology matching,Knowledge and Information Systems(2017)1–18)。
所述基于进化算法的本体匹配阶段,利用进化算法实现自动化的本体匹配过程,自适应地确定用户介入的时间点;所述基于进化算法的本体匹配阶段包括建模过程和匹配过程;
所述建模过程具体是:
S11、将本体O定义为O={C,P,I},其中C,P和I分别表示本体中的概念集合,属性集合和实例集合,其中概念,属性和实例统称本体的实体;本体匹配结果A是一个实体匹配对的集合,每一个实体匹配对可以表示为一个四元组{e,e',n,rel},其中e和e'分别表示元本体和目标本体的实体,n是e和e'关系的可信度值,rel是e和e'之间的等价关系;
S12、给定本体匹配结果A,其质量由f(A)来度量:
Figure GDA0002970714710000071
其中,|A|是A中的匹配对数量,MF(A)是计算A的MatchFmeasure值,δi是A中第i个匹配对的相似度值,α∈[0,1]是用于权衡本体匹配结果的查全率和查准率主调整参数;所述α值同查全率呈正比,同查准率成反比;所述α的建议取值是0.35;
S13、给定源本体分块Osrc和目标本体分块Otgt,设计单目标本体匹配问题的优化模型如下:
Figure GDA0002970714710000072
其中fi(X),i=1,2,...,m计算第i个本体匹配器结果的f()值,|Osrc|和|Otgt|分别表示本体Osrc和Otgt的实体集合的基数,xi,i=1,2,...,|Osrc|表示第i个实体匹配对;
所述匹配过程具体是:
S21、配置算法控制参数,包括数值精度,种群规模,选择概率,交叉概率和变异概率;
S22、随机初始化种群,并在种群中选出适应度值最高的个体作为精英解的初始化值;
S23、进入进化过程,首先评价种群中每一个个体的适应度值f(),通过赌轮盘选择,以及通过单点交叉和单点变异标准进化算子操作之后选择生成下一代种群;
S24、重新评价种群的适应度值f()并尝试更新精英解,直到满足终止条件,并输出本体分块匹配结果,若精英解连续若干代无法更新而进化,此时让用户介入引导算法的进化方向。
所述用户检验和检验结果扩散阶段,将自动确定的候选本体匹配结果呈现给用户检验,在用户检验的过程中自动处理剩余的候选本体匹配结果,最后扩散可信的用户检验结果;其具体过程是:
(1)首先将精英解中实体匹配对在相似度阈值为0.4附近的“问题”匹配对让用户检验;
(2)然后对于目标本体中一个实体有多个源本体实体对应的匹配,让用户选出其中一个正确的匹配对,其余的匹配对的可信度设置为0;
(3)最后对于用户检验过的结果,将相似度值高于阈值0.9的匹配对的可信扩散到其周边概念中;
例如,对于用户检验过的匹配对{e,e',0.92,=},分别找出e和e'在各自本体概念体系结构中的所有父概念集合Supe和Supe',若是
Figure GDA0002970714710000081
Figure GDA0002970714710000082
已经是匹配上的实体对,则将其可信度加上0.3。
所述本体分块匹配结果集成与评价阶段,通过贪心算法集成不同本体分块匹配结果,并利用本体的参考匹配结果计算最终结果的f度量。
需要说明的是:本发明的本体划分算法也可以通过其他的本体划分算法来代替;本发明采用的近似本体匹配结果的度量技术也可以采用其他的近似本体匹配结果度量技术代替;本发明采用的进化算法也可以使用其他群智能算法代替。此外,本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时能够执行上述本发明方法的过程。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。

Claims (10)

1.一种基于进化算法的交互式本体匹配方法,其特征在于:包括:
本体划分阶段,将大规模的本体划分为小规模的本体分块,使得后续的本体匹配过程是在本体分块中进行;
基于进化算法的本体匹配阶段,利用进化算法实现自动化的本体匹配过程,自适应地确定用户介入的时间点;
用户检验和检验结果扩散阶段,将自动确定的候选本体匹配结果呈现给用户检验,在用户检验的过程中自动处理剩余的候选本体匹配结果,最后扩散可信的用户检验结果;
本体分块匹配结果集成与评价阶段,集成不同本体分块匹配结果,并利用本体的参考匹配结果计算最终结果的f度量;
其中,所述基于进化算法的本体匹配阶段包括建模过程和匹配过程;
所述建模过程具体是:
S11、将本体O定义为O={C,P,I},其中C,P和I分别表示本体中的概念集合,属性集合和实例集合,其中概念,属性和实例统称本体的实体;本体匹配结果A是一个实体匹配对的集合,每一个实体匹配对可以表示为一个四元组{e,e',n,rel},其中e和e'分别表示元本体和目标本体的实体,n是e和e'关系的可信度值,rel是e和e'之间的等价关系;
S12、给定本体匹配结果A,其质量由f(A)来度量:
Figure FDA0003019752700000011
其中,|A|是A中的匹配对数量,MF(A)是计算A的MatchFmeasure值,δi是A中第i个匹配对的相似度值,α∈[0,1]是用于权衡本体匹配结果的查全率和查准率主调整参数;
S13、给定源本体分块Osrc和目标本体分块Otgt,设计单目标本体匹配问题的优化模型如下:
Figure FDA0003019752700000021
其中,fi(X),i=1,2,...,m计算第i个本体匹配器结果的f()值,|Osrc|和|Otgt|分别表示本体Osrc和Otgt的实体集合的基数,xi,i=1,2,...,|Osrc|表示第i个实体匹配对;
所述匹配过程具体是:
S21、配置算法控制参数,包括数值精度,种群规模,选择概率,交叉概率和变异概率;
S22、随机初始化种群,并在种群中选出适应度值最高的个体作为精英解的初始化值;
S23、进入进化过程,首先评价种群中每一个个体的适应度值f(),通过赌轮盘选择,以及通过单点交叉和单点变异标准进化算子操作之后选择生成下一代种群;
S24、重新评价种群的适应度值f()并尝试更新精英解,直到满足终止条件,并输出本体分块匹配结果,若精英解连续若干代无法更新而进化,此时让用户介入引导算法的进化方向,进行用户检验和检验结果扩散阶段。
2.根据权利要求1所述的一种基于进化算法的交互式本体匹配方法,其特征在于:所述本体划分阶段的具体过程是:
(1)首先通过SemanticAccuaracy度量本体结构的分散性和不平衡性来选择可靠性较强的本体作为源本体;
(2)然后利用扩展自SCAN算法的本体划分算法将源本体划分为源本体分块;
(3)对每个源本体分块,利用概念相关度度量来确定其相似的目标本体分块。
3.根据权利要求1所述的一种基于进化算法的交互式本体匹配方法,其特征在于:所述用户检验和检验结果扩散阶段的具体过程是:
(1)首先将精英解中实体匹配对在相似度阈值为0.4附近的“问题”匹配对让用户检验;
(2)然后对于目标本体中一个实体有多个源本体实体对应的匹配,让用户选出其中一个正确的匹配对,其余的匹配对的可信度设置为0;
(3)最后对于用户检验过的结果,将相似度值高于阈值0.9的匹配对的可信扩散到其周边概念中。
4.根据权利要求1所述的一种基于进化算法的交互式本体匹配方法,其特征在于:所述α值同查全率呈正比,同查准率成反比。
5.根据权利要求1或4所述的一种基于进化算法的交互式本体匹配方法,其特征在于:所述α的取值是0.35。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下过程:
本体划分阶段,将大规模的本体划分为小规模的本体分块,使得后续的本体匹配过程是在本体分块中进行;
基于进化算法的本体匹配阶段,利用进化算法实现自动化的本体匹配过程,自适应地确定用户介入的时间点;
用户检验和检验结果扩散阶段,将自动确定的候选本体匹配结果呈现给用户检验,在用户检验的过程中自动处理剩余的候选本体匹配结果,最后扩散可信的用户检验结果;
本体分块匹配结果集成与评价阶段,集成不同本体分块匹配结果,并利用本体的参考匹配结果计算最终结果的f度量;
其中,所述基于进化算法的本体匹配阶段包括建模过程和匹配过程;
所述建模过程具体是:
S11、将本体O定义为O={C,P,I},其中C,P和I分别表示本体中的概念集合,属性集合和实例集合,其中概念,属性和实例统称本体的实体;本体匹配结果A是一个实体匹配对的集合,每一个实体匹配对可以表示为一个四元组{e,e',n,rel},其中e和e'分别表示元本体和目标本体的实体,n是e和e'关系的可信度值,rel是e和e'之间的等价关系;
S12、给定本体匹配结果A,其质量由f(A)来度量:
Figure FDA0003019752700000041
其中,|A|是A中的匹配对数量,MF(A)是计算A的MatchFmeasure值,δi是A中第i个匹配对的相似度值,α∈[0,1]是用于权衡本体匹配结果的查全率和查准率主调整参数;
S13、给定源本体分块Osrc和目标本体分块Otgt,设计单目标本体匹配问题的优化模型如下:
Figure FDA0003019752700000042
其中,fi(X),i=1,2,...,m计算第i个本体匹配器结果的f()值,|Osrc|和|Otgt|分别表示本体Osrc和Otgt的实体集合的基数,xi,i=1,2,...,|Osrc|表示第i个实体匹配对;
所述匹配过程具体是:
S21、配置算法控制参数,包括数值精度,种群规模,选择概率,交叉概率和变异概率;
S22、随机初始化种群,并在种群中选出适应度值最高的个体作为精英解的初始化值;
S23、进入进化过程,首先评价种群中每一个个体的适应度值f(),通过赌轮盘选择,以及通过单点交叉和单点变异标准进化算子操作之后选择生成下一代种群;
S24、重新评价种群的适应度值f()并尝试更新精英解,直到满足终止条件,并输出本体分块匹配结果,若精英解连续若干代无法更新而进化,此时让用户介入引导算法的进化方向,进入所述用户检验和检验结果扩散阶段。
7.根据权利要求6所述的一种计算机设备,其特征在于:所述本体划分阶段的具体过程是:
(1)首先通过SemanticAccuaracy度量本体结构的分散性和不平衡性来选择可靠性较强的本体作为源本体;
(2)然后利用扩展自SCAN算法的本体划分算法将源本体划分为源本体分块;
(3)对每个源本体分块,利用概念相关度度量来确定其相似的目标本体分块。
8.根据权利要求6或7所述的一种计算机设备,其特征在于:所述用户检验和检验结果扩散阶段的具体过程是:
(1)首先将精英解中实体匹配对在相似度阈值为0.4附近的“问题”匹配对让用户检验;
(2)然后对于目标本体中一个实体有多个源本体实体对应的匹配,让用户选出其中一个正确的匹配对,其余的匹配对的可信度设置为0;
(3)最后对于用户检验过的结果,将相似度值高于阈值0.9的匹配对的可信扩散到其周边概念中。
9.根据权利要求7所述的一种计算机设备,其特征在于:所述α值同查全率呈正比,同查准率成反比。
10.根据权利要求7或9所述的一种计算机设备,其特征在于:所述α的取值是0.35。
CN201711070247.0A 2017-11-03 2017-11-03 一种基于进化算法的交互式本体匹配方法和计算机设备 Active CN107766556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711070247.0A CN107766556B (zh) 2017-11-03 2017-11-03 一种基于进化算法的交互式本体匹配方法和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711070247.0A CN107766556B (zh) 2017-11-03 2017-11-03 一种基于进化算法的交互式本体匹配方法和计算机设备

Publications (2)

Publication Number Publication Date
CN107766556A CN107766556A (zh) 2018-03-06
CN107766556B true CN107766556B (zh) 2021-07-30

Family

ID=61273656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711070247.0A Active CN107766556B (zh) 2017-11-03 2017-11-03 一种基于进化算法的交互式本体匹配方法和计算机设备

Country Status (1)

Country Link
CN (1) CN107766556B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860913B (zh) * 2021-02-24 2024-03-08 广州汇通国信科技有限公司 一种知识图谱的本体创建方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631882A (zh) * 2013-11-14 2014-03-12 北京邮电大学 基于图挖掘技术的语义化业务生成***和方法
CN103810388A (zh) * 2014-02-19 2014-05-21 福建工程学院 基于面向映射的分块技术的大规模本体映射方法
CN104866626A (zh) * 2015-06-15 2015-08-26 ***通信集团黑龙江有限公司 一种电信业务的推荐方法及装置
WO2016093405A1 (en) * 2014-12-12 2016-06-16 University-Industry Cooperation Group Of Kyung Hee University Adaptive semantic based mediation system and method
CN106227798A (zh) * 2016-07-21 2016-12-14 福州职业技术学院 一种基于紧凑协同进化算法的本体匹配方法
CN106855886A (zh) * 2016-12-26 2017-06-16 武汉大学 基于位置描述的显著性结构的位置概念结构化提取方法
CN107193858A (zh) * 2017-03-28 2017-09-22 福州金瑞迪软件技术有限公司 面向多源异构数据融合的智能服务应用平台和方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9747563B2 (en) * 2013-11-27 2017-08-29 University-Industry Cooperation Group Of Kyung Hee University Apparatus and method for matching large-scale biomedical ontologies

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631882A (zh) * 2013-11-14 2014-03-12 北京邮电大学 基于图挖掘技术的语义化业务生成***和方法
CN103810388A (zh) * 2014-02-19 2014-05-21 福建工程学院 基于面向映射的分块技术的大规模本体映射方法
WO2016093405A1 (en) * 2014-12-12 2016-06-16 University-Industry Cooperation Group Of Kyung Hee University Adaptive semantic based mediation system and method
CN104866626A (zh) * 2015-06-15 2015-08-26 ***通信集团黑龙江有限公司 一种电信业务的推荐方法及装置
CN106227798A (zh) * 2016-07-21 2016-12-14 福州职业技术学院 一种基于紧凑协同进化算法的本体匹配方法
CN106855886A (zh) * 2016-12-26 2017-06-16 武汉大学 基于位置描述的显著性结构的位置概念结构化提取方法
CN107193858A (zh) * 2017-03-28 2017-09-22 福州金瑞迪软件技术有限公司 面向多源异构数据融合的智能服务应用平台和方法

Also Published As

Publication number Publication date
CN107766556A (zh) 2018-03-06

Similar Documents

Publication Publication Date Title
Lin et al. CIDR: Ultrafast and accurate clustering through imputation for single-cell RNA-seq data
Xue et al. Collaborative ontology matching based on compact interactive evolutionary algorithm
Peng et al. Lime: Low-cost and incremental learning for dynamic heterogeneous information networks
Yu et al. A three-way cluster ensemble approach for large-scale data
Xue et al. Using NSGA‐III for optimising biomedical ontology alignment
Zhang et al. Hybrid fuzzy clustering method based on FCM and enhanced logarithmical PSO (ELPSO)
CN110807474A (zh) 聚类方法及装置、存储介质、电子设备
EP3001329A1 (en) Method, controller, program and data storage system for performing reconciliation processing
Xue et al. Using MOEA/D for optimizing ontology alignments
Srivastava et al. A parallel framework for constraint-based Bayesian network learning via Markov blanket discovery
Lv et al. Solving ontology meta-matching problem through an evolutionary algorithm with approximate evaluation indicators and adaptive selection pressure
Huang et al. Semantic integration of sensor knowledge on artificial internet of things
Ponmalar et al. Hybrid Whale Tabu algorithm optimized convolutional neural network architecture for intrusion detection in big data
CN107766556B (zh) 一种基于进化算法的交互式本体匹配方法和计算机设备
Diao et al. Clustering by Detecting Density Peaks and Assigning Points by Similarity‐First Search Based on Weighted K‐Nearest Neighbors Graph
Cruz et al. Quality-based model for effective and robust multi-user pay-as-you-go ontology matching 1
CN112131587A (zh) 一种智能合约伪随机数安全检验方法、***、介质和装置
de Araujo et al. Impact of feature selection methods on the classification of DDoS attacks using XGBoost
CN111897809A (zh) 一种基于生成对抗网络的指挥信息***数据生成方法
CN116705192A (zh) 基于深度学习的药物虚拟筛选方法及装置
Du et al. Combining quantum-behaved PSO and K2 algorithm for enhancing gene network construction
Sun et al. An evolutionary many-objective algorithm based on decomposition and hierarchical clustering selection
Lv et al. A novel compact fireworks algorithm for solving ontology meta-matching
Zeng et al. Local epochs inefficiency caused by device heterogeneity in federated learning
Pirgazi et al. TIGRNCRN: Trustful inference of gene regulatory network using clustering and refining the network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant