CN102521244A - 一种基于学习式owl建模的用户资料分析*** - Google Patents

一种基于学习式owl建模的用户资料分析*** Download PDF

Info

Publication number
CN102521244A
CN102521244A CN2011103576796A CN201110357679A CN102521244A CN 102521244 A CN102521244 A CN 102521244A CN 2011103576796 A CN2011103576796 A CN 2011103576796A CN 201110357679 A CN201110357679 A CN 201110357679A CN 102521244 A CN102521244 A CN 102521244A
Authority
CN
China
Prior art keywords
owl
module
ontology
inverted index
modeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011103576796A
Other languages
English (en)
Inventor
王楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU LIANZHU INDUSTRIAL CO LTD
Original Assignee
JIANGSU LIANZHU INDUSTRIAL CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU LIANZHU INDUSTRIAL CO LTD filed Critical JIANGSU LIANZHU INDUSTRIAL CO LTD
Priority to CN2011103576796A priority Critical patent/CN102521244A/zh
Publication of CN102521244A publication Critical patent/CN102521244A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于学习式OWL建模的用户资料分析***,其特征在于:其包括人工处理模块、倒排索引建库模块和OWL模型比较模块,其中:人工处理模块,以人工操作的方式建立用户资料的OWL知识模型作为种子模型;倒排索引建库模块,从互联网上采集用户资料信息并将其转换成OWL本体实例,以用户作为该OWL本体实例的本体元,建立用户的倒排索引数据库;OWL模型比较模块,对种子模型和倒排索引数据库中的用户进行比较,将属于同一用户资料的属性补充到种子模型中以完善种子模型。本发明是将人工干预和自动学习结合起来,从而实现对用户资料的OWL建模,并自动将互联网上搜索的相关信息补充进来。为建立广泛而完整的用户资料计算机模型提供了一种极具操作性的解决思路。

Description

一种基于学习式OWL建模的用户资料分析***
技术领域
本发明属于计算机技术领域,具体涉及一种OWL建模***。
背景技术
今天,互联网已经深入人类社会的每个角落,而且可以预见其将在人类文明发展进程中扮演越来越重要的角色。互联网上具有海量的信息,可以为人们提供各种商机,例如用户资料;但是如何在这些海量的信息中准确获取自己需要的知识是目前的困难。
让计算机理解互联网,从而更加智能化地从海量的信息中选取合适的信息来服务于人类是未来发展的方向。为了实现这个目的,人们做了许多尝试,例如:可以用知识结构重新构造互联网,即:语义互联网,它主要采用W3C的互联网本体语言(Ontology of Web Language,简称:OWL)建立语义网络。如果所有人都按OWL创建互联网,互联网本身就成为一个计算机可以在一定程度上“理解”的知识结构。在这个基础上软件工程师们可以为计算机设计一系列推理规则和引擎,在OWL语义网络上让计算机自己“理解”互联网信息内容,并做出正确的判断和操作。
如何利用OWL的构思在互联网上准确获取需要的用户资料信息是本发明要解决的问题。
发明内容
本发明提供了一种解决上述问题的方案,提供一种半自动化学习式、高效、准确的OWL建模***。
本发明的原理是:在互联网有大量的用户资料,对每一个用户都有一套描述,包括:用户名、电子邮箱、个人信息、职业、爱好、需求,等等。利用搜索引擎或互联网网站注册***获得尽可能多的用户资料信息,同时,利用半自动化学习式OWL建模工具,先人工建立一个互联网用户资料知识结构的种子模型,然后,对获得的所有用户信息进行“学习”,使互联网用户资料知识模型不断完善。
本发明的技术方案是提供一种基于学习式OWL建模的用户资料分析***,其特征在于:其包括人工处理模块、倒排索引建库模块和OWL模型比较模块,其中:
人工处理模块,以人工操作的方式建立用户资料的OWL知识模型作为种子模型;
倒排索引建库模块,从互联网上采集用户资料信息并将其转换成OWL本体实例,以用户作为该OWL本体实例的本体元,建立用户的倒排索引数据库;
OWL模型比较模块,对种子模型和倒排索引数据库中的用户进行比较,将属于同一用户资料的属性补充到种子模型中以完善种子模型。
优选的,其还包括OWL本体模型库,用于存储所述人工处理模块建立的种子模型和所述倒排索引建库模块转换后的OWL本体实例。
优选的,所述倒排索引建库模块包括以下模块:
原始文档管理***,负责通过搜索引擎从互联网采集各种用户资料信息;
OWL本体转换模块,负责将原始文档管理***采集的信息转换成OWL本体实例,并存入OWL本体实例库;
提炼OWL本体元模块,提炼OWL本体实例库中所有OWL本体实例的用户作为本体元;
本体实例倒排索引模块,建立提炼OWL本体元模块获得的本体元的倒排索引,并存入所述倒排索引数据库。
优选的,所述人工处理模块还包括辞典维护模块,负责建立并维护OWL本体辞典,所述OWL本体转换模块根据所述OWL本体辞典将原始文档管理***采集的信息转换成OWL本体实例。
优选的,所述人工处理模块还包括OWL兼容性规则人工维护模块,负责建立和维护OWL兼容性规则库,所述OWL模型比较模块根据所述OWL兼容性规则库中的OWL兼容性规则对所述种子模型和倒排索引数据库中的本体元进行比较。
优选的,所述人工处理模块还包括疑难问题人工处理模块,负责处理所述OWL模型比较模块中的异常,并人工调整所述种子模型。
优选的,所述用户资料包括以下信息之一或多种:用户姓名、电子邮箱、个人信息、职业、爱好和需求。
本发明的一种基于学习式OWL建模的用户资料分析***是将人工干预和自动学习结合起来,从而实现对用户资料的OWL建模,并自动将互联网上搜索的相关信息补充进来。为建立广泛而完整的用户资料计算机模型提供了一种极具操作性的解决思路。其具有高效、准确等优点。
附图说明
图1是本发明的一种基于学习式OWL建模的用户资料分析***的原理框架图。
具体实施方式
下面对本发明的具体实施方式作进一步详细的描述。
如图1所示,本发明的一种基于学习式OWL建模的用户资料分析***有以下部分组成:
1)         原始文档管理***从搜索引擎采集来的、或通过互联网网站注册***得到的互联网用户资料信息;
2)         OWL转换模块将原始文档管理***提供的用户资料信息做OWL转换,并存入本体实例数据库;
3)         提炼OWL本体元模块从本体实例库每一个本体实例中提取本体元(即:用户);
4)         本体实例倒排索引模块完成对本体元的倒排索引,并存入本体元倒排索引库;
5)         OWL模型比较模块,以人工建造的互联网知识结构OWL种子知识模型为基础,对本体元倒排索引表中的每一个本体元进行比对,利用人工维护的兼容性规则判断哪些本体元属于种子知识模型的同一知识范畴,判断一个新的用户在互联网用户资料知识结构中的位置和意义,无法判断时,向人工处理模块抛出异常;疑难问题人工处理模块受理OWL模型比较模块抛出的异常,人工调整模型;
6)         模型比较的合理结果和人工干预的结果送到模型更新模块对种子模型进行修改、升级,存入OWL模型库;
7)         兼容性规则模块负责人机交互,完成对兼容性规则的维护,结果存入兼容性规则库;
8)         OWL种子模型和OWL辞典库都是通过“OWL本体建模、辞典的人工维护”模块维护的,OWL知识模型和OWL辞典在OWL转换过程中也要用到。
具体来说,本发明的一种基于学习式OWL建模的用户资料分析***的主流程如下:
1、         知识管理员通过人工建模工具建立互联网用户资料的种子模型;
2、         通过搜索引擎或其他信息采集手段获取互联网用户资料信息,并存入原始文档管理***;
3、         ***对原始信息做OWL本体实例转换、本体元倒排索引,并存入本体元倒排索引表;
4、         ***利用人工创建的种子知识模型与***初步提炼的(存在倒排索引表中的)每一个本体元进行模型对比,在兼容性规则的帮助下,识别同类知识;
5、         把符合“合理知识”标准的本体元直接输出给OWL模型更新模块,把有“疑问”的知识提交人工处理模块,把无关的知识抛弃;
6、         知识管理员根据***的提问,对知识模型做适当的调整,并输出给OWL模型更新模块;
7、         OWL模型更新模块负责修改、升级种子知识模型;
8、         不断重复步骤1到7,OWL知识模型就会越来越完善;
9、         需要时,人工调整兼容性规则、OWL辞典库、甚至OWL模型本身。
以上实施例仅为本发明其中的一种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。 

Claims (7)

1.一种基于学习式OWL建模的用户资料分析***,其特征在于:其包括人工处理模块、倒排索引建库模块和OWL模型比较模块,其中:
人工处理模块,以人工操作的方式建立用户资料的OWL知识模型作为种子模型;
倒排索引建库模块,从互联网上采集用户资料信息并将其转换成OWL本体实例,以用户作为该OWL本体实例的本体元,建立用户的倒排索引数据库;
OWL模型比较模块,对种子模型和倒排索引数据库中的用户进行比较,将属于同一用户资料的属性补充到种子模型中以完善种子模型。
2.根据权利要求1所述的一种基于学习式OWL建模的用户资料分析***,其特征在于:其还包括OWL本体模型库,用于存储所述人工处理模块建立的种子模型和所述倒排索引建库模块转换后的OWL本体实例。
3.根据权利要求1所述的一种基于学习式OWL建模的用户资料分析***,其特征在于:所述倒排索引建库模块包括以下模块:
原始文档管理***,负责通过搜索引擎从互联网采集各种用户资料信息;
OWL本体转换模块,负责将原始文档管理***采集的信息转换成OWL本体实例,并存入OWL本体实例库;
提炼OWL本体元模块,提炼OWL本体实例库中所有OWL本体实例的用户作为本体元;
本体实例倒排索引模块,建立提炼OWL本体元模块获得的本体元的倒排索引,并存入所述倒排索引数据库。
4.根据权利要求3所述的一种基于学习式OWL建模的用户资料分析***,其特征在于:所述人工处理模块还包括辞典维护模块,负责建立并维护OWL本体辞典,所述OWL本体转换模块根据所述OWL本体辞典将将原始文档管理***采集的信息转换成OWL本体实例。
5.根据权利要求1所述的一种基于学习式OWL建模的用户资料分析***,其特征在于:所述人工处理模块还包括OWL兼容性规则人工维护模块,负责建立和维护OWL兼容性规则库,所述OWL模型比较模块根据所述OWL兼容性规则库中的OWL兼容性规则对所述种子模型和倒排索引数据库中的本体元进行比较。
6.根据权利要求1所述的一种基于学习式OWL建模的用户资料分析***,其特征在于:所述人工处理模块还包括疑难问题人工处理模块,负责处理所述OWL模型比较模块中的异常,并人工调整所述种子模型。
7.根据权利要求1所述的一种基于学习式OWL建模的用户资料分析***,其特征在于:所述用户资料包括以下信息之一或多种:用户姓名、电子邮箱、个人信息、职业、爱好和需求。
CN2011103576796A 2011-11-14 2011-11-14 一种基于学习式owl建模的用户资料分析*** Pending CN102521244A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011103576796A CN102521244A (zh) 2011-11-14 2011-11-14 一种基于学习式owl建模的用户资料分析***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011103576796A CN102521244A (zh) 2011-11-14 2011-11-14 一种基于学习式owl建模的用户资料分析***

Publications (1)

Publication Number Publication Date
CN102521244A true CN102521244A (zh) 2012-06-27

Family

ID=46292166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011103576796A Pending CN102521244A (zh) 2011-11-14 2011-11-14 一种基于学习式owl建模的用户资料分析***

Country Status (1)

Country Link
CN (1) CN102521244A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107918618A (zh) * 2016-10-10 2018-04-17 腾讯科技(北京)有限公司 数据处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101393565A (zh) * 2008-11-07 2009-03-25 北京航空航天大学 基于本体的面向虚拟博物馆的搜索方法
CN101582073A (zh) * 2008-12-31 2009-11-18 北京中机科海科技发展有限公司 一种基于领域本体的智能检索***及方法
US20090287678A1 (en) * 2008-05-14 2009-11-19 International Business Machines Corporation System and method for providing answers to questions

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090287678A1 (en) * 2008-05-14 2009-11-19 International Business Machines Corporation System and method for providing answers to questions
CN101393565A (zh) * 2008-11-07 2009-03-25 北京航空航天大学 基于本体的面向虚拟博物馆的搜索方法
CN101582073A (zh) * 2008-12-31 2009-11-18 北京中机科海科技发展有限公司 一种基于领域本体的智能检索***及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107918618A (zh) * 2016-10-10 2018-04-17 腾讯科技(北京)有限公司 数据处理方法及装置

Similar Documents

Publication Publication Date Title
CN101334784B (zh) 计算机辅助报告与知识库产生的方法
CN103714084B (zh) 推荐信息的方法和装置
CN1967533A (zh) 采用元推荐引擎的门户个性化推荐服务方法和***
CN107423343A (zh) 一种基于混合协同过滤的图书馆图书推荐方法及***
CN101710343A (zh) 一种基于文本挖掘的本体自动构建***及方法
CN103136337A (zh) 用于复杂网络的分布式知识数据挖掘装置和挖掘方法
CN103617169A (zh) 一种基于Hadoop的微博热点话题提取方法
CN106557967A (zh) 一种产品设计知识构建处理方法
CN100485612C (zh) 软件需求获取***
CN103279458A (zh) 一种领域本体的构建及实例化方法
CN106372145A (zh) 一种大数据环境下基于本体语义的查询方法及***
Fallah et al. Forward patent citations as predictive measures for diffusion of emerging technologies
CN102521244A (zh) 一种基于学习式owl建模的用户资料分析***
CN102521241B (zh) 一种半自动化学习式owl建模***
CN102436493A (zh) 一种基于学习式owl建模的产品服务模型生成***
Jiang [Retracted] Hotspot Mining in the Field of Library and Information Science under the Environment of Big Data
Sixin et al. A New Governance Architecture for Government Information Resources Based on Big Data Ecological Environment in China
CN102436467B (zh) 自学习式owl推理引擎
CN102521239B (zh) 一种基于owl的互联网问答信息匹配***及其匹配方法
Biagioli et al. Law making environment: perspectives
Wang et al. A thesaurus and online encyclopedia merging method for large scale domain-ontology automatic construction
CN102508911B (zh) 基于学习式owl建模的网站知识结构分析***
CN102436497A (zh) 基于学习式owl建模的主流媒体报道热点分析***
CN102426605A (zh) 一种基于owl模型的语义匹配***
Chen et al. Ontology-driven extraction of enterprise competitive intelligence in the Internet

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120627