CN1564161A - 一种构造和浏览语义链的方法 - Google Patents

一种构造和浏览语义链的方法 Download PDF

Info

Publication number
CN1564161A
CN1564161A CN 200410030280 CN200410030280A CN1564161A CN 1564161 A CN1564161 A CN 1564161A CN 200410030280 CN200410030280 CN 200410030280 CN 200410030280 A CN200410030280 A CN 200410030280A CN 1564161 A CN1564161 A CN 1564161A
Authority
CN
China
Prior art keywords
semantic links
semantic
network
links network
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200410030280
Other languages
English (en)
Other versions
CN100362514C (zh
Inventor
诸葛海
贾瑞祥
刘洁
李向
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Huilian Information Technology Co., Ltd.
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CNB2004100302807A priority Critical patent/CN100362514C/zh
Publication of CN1564161A publication Critical patent/CN1564161A/zh
Application granted granted Critical
Publication of CN100362514C publication Critical patent/CN100362514C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及计算机技术领域的构造和浏览语义链网络的方法,在语义链网络构造时采用了树型数据结构并支持多种类型的语义链网络的构造。步骤如下:步骤S1,输入一个资源文件;步骤S2,对该文档进行三种标记;步骤S3,对构造好的语义链网络进行校验;步骤S4,将这些语义链网络以扩展标记语言格式分别保存为文档内容文件和语义链网络文件;步骤S5,在生成的语义链网络文件的基础上对语义链网络所包含的语义信息进行大粒度推理和小粒度推理;步骤S6,将文档内容文件和语义链网络文件转换成超文本标记语言格式的文件;步骤S7,浏览语义链网络。该文档可被当前的各种浏览器浏览。

Description

一种构造和浏览语义链的方法
技术领域
本发明涉及计算机技术领域,特别是一种构造和浏览语义链的方法,以及互联网资源间语义链(关系)的构建与浏览。
技术背景
自超文本标记语言(HTML)被发明后,网页逐渐成为一种人们进行信息交流的媒介。随着各种网页开发工具的推出,互联网上网页的数量急剧增长。这使得用户获取所需要的信息变得非常困难。造成这种情况的原因是超文本标记语言对语义的表达能力非常有限,它几乎不能表达语义关系。因此当前的互联网(Web)很难对检索的信息进行精确的定位,同时上述情况也使得在互联网上开发智能化的服务变得非常困难。
为了解决上述问题,语义互联网(Semantic Web)被提出。语义互联网的目标是建立一种能被机器理解的文档,使得计算机和人能够很好地协同工作。基于语义互联网的理念,包括XML,RDF,RDF-SCHEMA,Ontology(本体)在内的技术和标准已经被提出和采用。
不同于语义互联网,我们所提出的语义链网络是对当前的超级链接的一个自然而平稳的扩展。它由七种基本类型构成:因果链接、实例链接、隐含链接、引用链接、相似链接、顺序链接、子类链接等。大量分布的语义链网络通过语义链相互链接构成了世界范围的语义链网络。在语义链网络中,语义的表达十分简洁,而且语义链网络的传递性和推理规则支持语义链网络进行语义推理和智能应用程序开发。
发明内容
本发明的目的在于提供一种构造和浏览语义链的方法。
本发明的目的是快速构造并浏览语义链网络,解决互联网领域中有关语义链网络的构建和浏览问题。本发明先在一个初始文档的基础上构造语义链网络,并将构造好的语义链网络以扩展标记语言格式存储,然后将此存储文件转换成一个可浏览的超文本标记语言格式的文件。本方法主要包括以下几点:根据语义链网络的特点,在表示、构造和存储语义链网络时采用了树型结构,这既解决了语义链网络在计算机中的存储问题,又使得语义链网络的构造变得非常直观;采用校验过程以确保构造的语义链网络的正确性;在构造基于图像的语义链网络时集成了图像预览技术;采用了通用解释模板技术;为了能充分展示语义链网络在显示语义方面的特点,在通用解释模板中加入了语义链网络推理的过程;在浏览语义链网络时既综合了语义链网络推理的结果,同时又采用了树型的浏览结构,使得浏览内容既层次化,又包含丰富的语义信息。
本发明所述的推理规则或推理是一种使用机器推理而非人为的推理。
发明技术方案
一种构造和浏览语义链网络的方法,该方法首先在源文件的基础上构造各种类型的语义链网络,然后将构造好的语义链网络以扩展标记语言(XML)格式存储,再将生成的语义链网络转换成以超文本标记语言(HTML)格式存储的网页供用户浏览;在语义链网络的构造和存储过程中采用了树型结构,在构造过程中进行校验,在将语义链网络转换成超文本标记语言格式存储的网页的过程中加入语义链网络的推理机制。该技术方案有以下几个技术特征:
1)构造语义链网络时采用了树型结构方式逐级构造。
2)构造过程中可以随时校验构造过程是否正确。
3)能构造各种类型的语义链网络。该方法不仅能构造常用类型的语义链网络,还能构造基于图像类型和自定义类型的语义链网络。
4)用该方法构造的语义链网络以扩展标记语言格式存储,并将文档内容和语义链网络分别存储。
5)将存储的语义链网络转换成超文本标记语言格式的过程中采用了通用解释模板技术,该模板对所遇到的所有标记进行分析和解释,并将这些标记转换成相应的超文本标记语言标记。
6)采用了语义链网络矩阵来表示语义链网络。
7)在解释模板中加入了语义链推理,主要包括大粒度推理和小粒度推理两部分,大粒度推理利用语义链网络之间的语义包含关系来进行推理;小粒度推理利用语义链的传递性和推理规则进行推理。
8)在浏览用本方法生成的超文本标记语言所表示的语义链网络时,本方法又将语义链网络以树型的结构表示出来,并融合了语义链的推理结果,使得浏览内容包含了极其丰富的语义信息。
附图说明
图1是本发明的语义链网络定义和浏览的流程图。
具体实施方式
首先简单地描述一下本方法的实现流程,具体参见图1。具体实施步骤如下:步骤S1,输入一个资源文件,步骤S2,对该文档进行三种标记:常用类型语义链网络标记、图像类型语义链网络标记和自定义类型语义链网络标记。步骤S3,本方法对构造好的语义链网络进行校验,校验完成后转到步骤S4。步骤S4,将这些语义链网络以扩展标记语言格式分别保存为文档内容文件和语义链网络文件。步骤S5,在生成的语义链网络文件的基础上对语义链网络所包含的语义信息进行大粒度推理和小粒度推理。步骤S6,综合步骤S5的推理结果,本方法将文档内容文件和语义链网络文件转换成超文本标记语言格式的文件,该类型的文件可以被当前流行的网络浏览器浏览,步骤S7,浏览语义链网络。
本方法支持三种类型的语义链网络的构造:常用语义链标记和自定义标记的构造、语义链网络的构造和图像类型的语义链网络的构造。从严格意义上来讲,常用语义链标记并不属于语义链网络的范畴,它们仅仅是一些需要特别处理的语义标记,但是这些标记的定义有助于读者对该文档的理解,因此把它们都放在一起讨论。下面以论文的结构为例来说明本方法所采用的常用语义链标记。主要有文章标题(ArticleTitle),作者(Author),作者地址(AuthorAddress),邮箱(Email),论文摘要(Abstract),论文简介(Introduction),论文引用(References)等等。本方法在实现上面所说的这些语义链标记时是在所选中的文字的前后以扩展标记语言的格式添加上相应的标记。例如,如果我们对一篇论文进行语义链标记,假设论文的作者是“张三”。如果我们想对作者“张三”添加“作者”语义链标记,那么在本方法的作用下添加后的结果就是“<作者>张三</作者>”。
下面介绍本方法中语义链网络的构造机制。从本质上讲,一个语义链网络的构造过程类似一棵多叉树的构造过程。树根就是将要用语义链网络进行描述的一段文本,树枝是各种语义链网络的类型或者是一些语义链的地址信息和语义信息,但是树叶只能由超文本链接组成。具体的结构如下:
<Entity PredecessorID=string PredecessorText=string>
     <SemanticRelation>
        <Similar-to>
           Link specification
       </Similar-to>
      <Sequential>
         Link specification
      </Sequential>
     <Reference>
         Link specification
      </Reference>
    <SubType>
        Link specification
     </SubType>
    <Instance>
        Link specification
     </Instance>
    <Cause-effective>
        Link specification
     </Cause-effective>
    <Implication>
        Link specification
           </Implication>
    </SemanticRelation>
</Entity>,
其中“Link Specification”定义如下:
        <Link>
           <SuccessorID>    </SuccessorID>
           <SuccessorText>  </SuccessorText>
        </Link>
        …
        <Link>
           <SuccessorID>    </SuccessorID>
           <SuccessorText>   </SuccessorText>
        </Link>
任何一个语义链都存在一个前驱节点和后继节点。在上面的数据结构中,这两个节点分别用“PredecessorID”和“SuccessorID”来表示。在本方法中这两个标记的值是自动维护的。“PredecessorText”和“SuccessorText”指的是前驱节点和后继节点所代表的文本内容。前驱节点和后继节点之间可能存在多种语义关系,这就是上面数据结构中所描述的“Similar-to”、“Cause-effective”、“Instance”和“Subtype”等等。构造语义链网络是遵循着以下的顺序:前驱节点的文本——前驱节点和后继节点之间存在的各种语义类型——后继节点的文本。在此基础上后继节点的文本又可能成为下一个前驱节点的文本,这样就形成了一个语义链构造的递归,最终形成一个语义链网络。但是在语义链网络中如果一个语义链的后继节点指向一个超文本链接(既存在文本又存在超文本链接),那么该语义链网络在该语义关系分支上终止。
在本方法中语义链网络的校验是指根据上述数据结构进行的校验和有关语义链标记的校验。在校验过程中如果发现语义链网络不是按照上述数据结构的格式构造的,本方法会提示用户重新构造。对语义链标记的校验主要是校验语义链标记是否交叉嵌套。举例来说,假设我们有两段文本text1和text2,我们分别对text1和text2进行了语义标记Mark1和Mark2。则如下的标记结果就是错误的:<Mark1>text1<Mark2></Mark1>text2</Mark2>。因为它们的标记定义存在交叉的地方,这不符合扩展标记语言的语法规则。
本方法在存储语义链网络时,文档的内容(数据文件)和语义链(语义链网络文件)分别存放在两个文件中,并且都是以扩展标记语言的格式来存储的。这样可以方便查找,提高检索的准确性。
对于图像类型的语义链网络的构造,其构造方法和通用类型的语义链网络的构造方法基本相同,但是为了便于选择合适的图片,图像类型的语义链网络构成过程集成了图像的预览方法。
本方法提出了两种推理方法来增强语义链网络的浏览效果,这两种方法分别是大粒度推理和小粒度推理。大粒度推理主要是从一个语义链网络的集合中找出语义信息最丰富的一个,主要采用了图论中的匹配技术。从实现的角度来讲首先把各个语义链网络用语义链网络矩阵表示出来。语义链网络矩阵的行和列代表的是语义链网络中的各个节点,矩阵的每个元素代表的是对应的两个节点之间的所有语义关系。有了语义链网络矩阵,判定各个语义链网络之间的关系问题就转换为判断各个语义链网络矩阵之间的关系问题。下面是判断这两个矩阵之间存在关系的核心算法。假设两个语义链网络为G1=(V1,E1)和G2=(V2,E2),如果V1V2,并且E1中的每一条边都在E2中,那么G1G2。即语义链网络G2中含有比G1更丰富的语义关系。据此,可以把两个语义链网络之间的关系分为五种:包含关系(对两个有序语义链网络点对<G1,G2>,G1中的点和边都在G2中)、反向包含关系、相等关系、相交关系和空关系(无交集关系)。当然在具体实现算法时要将上述算法的核心思想用语义链网络矩阵描述出来才能在计算机上使用。小粒度推理意思是在一个语义链网络的集合中根据语义链的推理规则找出与一条语义链相关的所有语义链。下面用一个例子来说明。假设存在一个语义链V1→V2,V1和V2之间存在因果关系(ce)。小粒度推理的目标在一个语义链网络的集合中找出所有以V2为前驱节点并且具有因果关系的语义链或者是以前面所找出的语义链的后继节点作为前驱节点并且具有因果关系的语义链。下面是小粒度推理的算法。首先将放到一个队列中,然后对该队列进行如下操作。
1)如果该队列为空,返回结果集ResultSet。
2)如果该队列非空,取出队列头部的规则,记为 同时将该规则放入结果集ResultSet。
3)从语义链网络集合中找出所有以Vt为前驱节点且具有因果关系的语义链,然后把这些语义链放到队列的尾部。
在实现语义链网络的浏览方面,本方法提出了通用解释模板技术。具体说来就是生成一个超文本标记语言格式的文件,在这个文件中要对每一个在语义链网络和其它语义标记的构造时可能出现的标记进行分析和解释,然后根据相应标记的含义将其转换为超文本标记语言格式的文件,同时在解释的过程中要加入语义链网络的推理信息。为了在浏览时显示更多的语义信息,在进行转换的过程中采用了树型的浏览结构技术。在超文本标记语言中,树型浏览技术已经非常成熟,具体可参考相关的技术文档。
最后生成的文档可被当前的各种浏览器浏览。

Claims (10)

1.一种构造和浏览语义链网络的方法,该方法首先在源文件的基础上构造各种类型的语义链网络,然后将构造好的语义链网络以扩展标记语言(XML)格式存储,再将生成的语义链网络文件转换成以超文本标记语言(HTML)格式存储的网页供用户浏览;其特征在于,在语义链网络的构造和存储过程中采用了树型结构,在构造过程中进行校验,在将语义链网络转换成超文本标记语言格式存储的网页的过程中加入了语义链网络的推理机制。
2.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,构造语义链网络时采用了树型结构方式逐级构造。
3.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,构造过程中可以随时校验构造过程是否正确。
4.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,该方法不仅能构造常用类型的语义链网络,还能构造基于图像类型和自定义类型的语义链网络。
5.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,用该方法构造的语义链网络以扩展标记语言格式存储,并将文档内容和语义链网络分别存储。
6.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,将存储的语义链网络转换成超文本标记语言格式的过程中采用了通用解释模板技术,该模板对所遇到的所有标记进行分析和解释,并将这些标记转换成相应的超文本标记语言标记。
7.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,采用了语义链网络矩阵来表示语义链网络。
8.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,在解释模板中加入了语义链推理,主要包括大粒度推理和小粒度推理两部分,大粒度推理利用语义链网络之间的语义包含关系来进行推理;小粒度推理利用语义链的传递性和推理规则进行推理。
9.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,在浏览用本方法生成的超文本标记语言所表示的语义链网络时,本方法又将语义链网络以树型的结构表示出来,并融合了语义链的推理结果,使得浏览内容包含了极其丰富的语义信息。
10.根据权利要求1的构造和浏览语义链网络的方法,其具体步骤如下:
步骤S1,输入一个资源文件;
步骤S2,对该文档进行三种标记:常用类型语义链网络标记、图像类型语义链网络标记和自定义类型语义链网络标记;
步骤S3,对构造好的语义链网络进行校验,通过校验后转步骤S4;
步骤S4,将这些语义链网络以扩展标记语言格式分别保存为文档内容文件和语义链网络文件;
步骤S5,在生成的语义链网络文件的基础上对语义链网络所包含的语义信息进行大粒度推理和小粒度推理;
步骤S6,将文档内容文件和语义链网络文件转换成超文本标记语言格式的文件,该类型的文件可以被当前流行的网络浏览器浏览;
步骤S7,浏览语义链网络。
CNB2004100302807A 2004-03-23 2004-03-23 一种构造和浏览语义链的方法 Expired - Fee Related CN100362514C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100302807A CN100362514C (zh) 2004-03-23 2004-03-23 一种构造和浏览语义链的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100302807A CN100362514C (zh) 2004-03-23 2004-03-23 一种构造和浏览语义链的方法

Publications (2)

Publication Number Publication Date
CN1564161A true CN1564161A (zh) 2005-01-12
CN100362514C CN100362514C (zh) 2008-01-16

Family

ID=34481072

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100302807A Expired - Fee Related CN100362514C (zh) 2004-03-23 2004-03-23 一种构造和浏览语义链的方法

Country Status (1)

Country Link
CN (1) CN100362514C (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101198978A (zh) * 2005-04-22 2008-06-11 谷歌公司 建议广告的目标信息,如网站和/或网站类别
CN100399335C (zh) * 2005-11-15 2008-07-02 李利鹏 把源文档转换成目标网页文件的方法
CN100585591C (zh) * 2005-07-15 2010-01-27 国际商业机器公司 用于实现交互式浏览的***和方法
CN102004799A (zh) * 2010-12-28 2011-04-06 天津神舟通用数据技术有限公司 数据库冗余数据一致性检验方法
CN102096715A (zh) * 2011-02-11 2011-06-15 深圳市同洲电子股份有限公司 获取网页模版方法、***,及生成单机网站的方法、***
CN110765777A (zh) * 2019-10-17 2020-02-07 上海大学 一种基于关联语义链网络的事件相关度计算方法
CN110781679A (zh) * 2019-10-15 2020-02-11 上海大学 一种基于关联语义链网络的新闻事件关键词挖掘方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101917413B (zh) * 2010-07-29 2013-07-17 清华大学 基于服务质量优化和语义信息集成的服务组装***及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6249794B1 (en) * 1997-12-23 2001-06-19 Adobe Systems Incorporated Providing descriptions of documents through document description files
US6993476B1 (en) * 1999-08-26 2006-01-31 International Business Machines Corporation System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework
AU1758501A (en) * 1999-11-09 2001-06-06 Vocal Point, Inc. System and method for accessing web content using limited display devices
KR100505265B1 (ko) * 2000-03-07 2005-07-29 니폰덴신뎅와 가부시키가이샤 의미 정보 네트워크
MXPA03011976A (es) * 2001-06-22 2005-07-01 Nervana Inc Sistema y metodo para la recuperacion, manejo, entrega y presentacion de conocimientos.

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101198978A (zh) * 2005-04-22 2008-06-11 谷歌公司 建议广告的目标信息,如网站和/或网站类别
CN100585591C (zh) * 2005-07-15 2010-01-27 国际商业机器公司 用于实现交互式浏览的***和方法
CN100399335C (zh) * 2005-11-15 2008-07-02 李利鹏 把源文档转换成目标网页文件的方法
CN102004799A (zh) * 2010-12-28 2011-04-06 天津神舟通用数据技术有限公司 数据库冗余数据一致性检验方法
CN102004799B (zh) * 2010-12-28 2012-10-03 天津神舟通用数据技术有限公司 数据库冗余数据一致性检验方法
CN102096715A (zh) * 2011-02-11 2011-06-15 深圳市同洲电子股份有限公司 获取网页模版方法、***,及生成单机网站的方法、***
CN110781679A (zh) * 2019-10-15 2020-02-11 上海大学 一种基于关联语义链网络的新闻事件关键词挖掘方法
CN110781679B (zh) * 2019-10-15 2023-09-15 上海大学 一种基于关联语义链网络的新闻事件关键词挖掘方法
CN110765777A (zh) * 2019-10-17 2020-02-07 上海大学 一种基于关联语义链网络的事件相关度计算方法
CN110765777B (zh) * 2019-10-17 2023-09-15 上海大学 一种基于关联语义链网络的事件相关度计算方法

Also Published As

Publication number Publication date
CN100362514C (zh) 2008-01-16

Similar Documents

Publication Publication Date Title
US7761451B2 (en) Efficient querying and paging in databases
US7624114B2 (en) Automatically generating web forms from database schema
KR101176079B1 (ko) 문서 설명의 문구 기반 생성
KR101223172B1 (ko) 정보 검색 시스템에서의 문구 기반 서치
CN100547581C (zh) 生成结构模式候选对象的方法、***
KR101190230B1 (ko) 정보 검색 시스템에서의 문구 식별
US8204856B2 (en) Database replication
US20100174692A1 (en) Graph store
US11907203B2 (en) Path encoded tree structures for operations
KR101581980B1 (ko) 계층적 데이터의 페이징
CA2657418A1 (en) Joint optimization of wrapper generation and template detection
US20060036631A1 (en) High performance XML storage retrieval system and method
CN101686146A (zh) 模糊查询、查询结果处理和过滤条件处理的方法及设备
CN1159665C (zh) 创建定制数据库的方法和设备
WO2010085523A1 (en) Graph store
US20120254189A1 (en) Multilevel indexing system
CN100397397C (zh) 基于关系数据库的xml数据存储与访问方法
CN1564161A (zh) 一种构造和浏览语义链的方法
CN102043802B (zh) 基于结构摘要的xml关键字检索方法
US20090307187A1 (en) Tree automata based methods for obtaining answers to queries of semi-structured data stored in a database environment
Kanda et al. Practical rearrangement methods for dynamic double‐array dictionaries
Kim et al. DOM tree browsing of a very large XML document: Design and implementation
Karanasos et al. The ViP2P platform: XML views in P2P
CN1588371A (zh) 包装器的生成方法
Bleul et al. Large-scale service composition in semantic service discovery

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: BEIJING ZHONGKE HUILIAN INFORMATION TECHNOLOGY CO.

Free format text: FORMER OWNER: INSTITUTE OF COMPUTING TECHNOLOGY, CHINESE ACADEMY OF SCIENCES

Effective date: 20121224

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100080 HAIDIAN, BEIJING TO: 100083 HAIDIAN, BEIJING

TR01 Transfer of patent right

Effective date of registration: 20121224

Address after: North Fourth Ring Road 100083 Beijing Haidian District City 229 Haitai building 527

Patentee after: Beijing Zhongke Huilian Information Technology Co., Ltd.

Address before: 100080 No. 6 South Road, Zhongguancun Academy of Sciences, Beijing

Patentee before: Institute of Computing Technology, Chinese Academy of Sciences

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080116

Termination date: 20160323