CN111008190A - 一种知识收集处理和检索*** - Google Patents
一种知识收集处理和检索*** Download PDFInfo
- Publication number
- CN111008190A CN111008190A CN201911270663.4A CN201911270663A CN111008190A CN 111008190 A CN111008190 A CN 111008190A CN 201911270663 A CN201911270663 A CN 201911270663A CN 111008190 A CN111008190 A CN 111008190A
- Authority
- CN
- China
- Prior art keywords
- data
- knowledge
- management
- processing
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 39
- 230000010354 integration Effects 0.000 claims abstract description 19
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000004140 cleaning Methods 0.000 claims abstract description 5
- 238000007726 management method Methods 0.000 claims description 61
- 230000006870 function Effects 0.000 claims description 43
- 238000003860 storage Methods 0.000 claims description 21
- 238000005516 engineering process Methods 0.000 claims description 16
- 238000005065 mining Methods 0.000 claims description 12
- 238000013475 authorization Methods 0.000 claims description 6
- 238000007418 data mining Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000013500 data storage Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 4
- 238000011084 recovery Methods 0.000 claims description 4
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 238000013523 data management Methods 0.000 claims description 3
- 230000008676 import Effects 0.000 claims description 3
- 238000007639 printing Methods 0.000 claims description 2
- 230000002265 prevention Effects 0.000 claims 3
- 238000012098 association analyses Methods 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000009792 diffusion process Methods 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 abstract description 10
- 230000008859 change Effects 0.000 abstract description 4
- 230000009466 transformation Effects 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 11
- 238000012423 maintenance Methods 0.000 description 6
- 238000013467 fragmentation Methods 0.000 description 5
- 238000006062 fragmentation reaction Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000009960 carding Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000004258 portal system Anatomy 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 238000010972 statistical evaluation Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/214—Database migration support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24552—Database cache management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Quality & Reliability (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种知识收集处理和检索***,对知识中心进行升级优化,尤其是数据底层进行优化,升级优化后,实现数据清洗和整合,建立全网元数据标准、数据加工标引标准、***集成规范、知识管理和服务规范及相关标准接口、升级智能检索功能、获取业务数据建立知识地图和知识社区、提供知识跟踪分析和简报生产等智能服务,辅助知识中心由文献保障转型转变为知识知识服务型,完成由被动服务到主动服务的改变。
Description
技术领域
本发明涉及网络信息处理***,具体的涉及一种知识收集处理和检索***。
背景技术
现有的电网知识***是基于海量大数据的信息服务,亟待对海量信息进行深入整合和挖掘,从而提供更加精准的知识信息和知识资源。因此对于电网企业来说,构建基于全网统一的知识和知识服务平台,对平台内资源按着业务需求和服务特点进行整合挖掘,对知识***功能和服务频道进行集成优化,有着重要意义。整合海量非结构化资源,降低信息服务的成本,提高用户知识资源查准效率;避免信息***的重复建设,建立数据中心和服务中心,统一提供知识和知识服务;打通各类资源之间的关联,提高信息服务的质量;构建知识的云平台架构,实现企业知识服务一体化;使知识服务与知识服务结合起来,建设企业业务知识库,将知识转换化生产力。
发明内容
本发明的目的是为目前电网知识***海量数据进行重新梳理和整合优化,进而为电力行业需求提供高效的知识和知识服务。。
为了实现上述目的,本发明采用了如下技术方案:
一种知识收集处理和检索***,包括,知识分析跟踪模块、智能数据挖掘分析模块、检索模块、知识数据库、浏览检索界面,其特征在于:还包括,数据中心管理应用***,其可以对数据进行管理、数据访问接口和安全访问认证;数据加工标引***,包括元数据自动识别及标引、加工和管理;知识管理服务模块,其包括专业知识库、兴趣模型库、专题知识库;整个***基于中心异构数据整合,对不同来源的数据进行导出和导入操作,可抽取业务***中对应数据生成知识库并存储到知识数据库,***可以实现数据预处理和更新管理,对元数据字段对应和转换,实现数据更新。数据加工标引***包括元数据自动识别及标引,根据元数据标准,对需要加工的资源通过人机交互的界面进行提取和标注;对于格式比较固定的资源在加工标引时可以配置模板,根据模板自动识别出元数据项并自动抽取;数据加工和管理:实现对知识知识加工、数据清洗预处理加工。数据中心管理应用***具体为:数据管理,采用分布存储的方式,***能够根据数据量大小和时间自动分表存储;同时根据数据中心中注册的存储结点自动分配最合适的存储节点和存储单元进行管理,具体包含数据存储结点管理,数据备份及恢复管理,数据归档和数据缓存管理;数据访问接口,为方便后期项目和服务对数据中心各数据的调取和使用,按需求建立一下标准数据接口:数据库列表获取接口;数据查询接口;数据更新接口;资源访问授权;资源访问授权;数字对象下载接口;安全访问认证,为了确保数据中心数据的安全,可对访问者进行认证和验证,只有在***中注册并且授权的用户才能访问有权限的资源。知识分析跟踪模块以本地资源和互联网资源为基础,对用户设定的专题知识进行热点分析及跟踪。
其还包括有内容管理模块 包括统一认证和权限管理、资源版权管理,其整个***按层设计,每层之间通过松散耦合的方式相互通信,其整体数据构架基于SOA***和云存储平台。
与现有技术相比,本发明具备以下优点:本***功能强大,操作简单好用。将众多不同平台的信息资源数据库集成于一个统一的平台,实现跨库查询、定制推送、知识服务功能,为用户提供统一、直观、便捷的信息检索、信息获取手段,并拓展信息服务功能,实现信息服务个性化、网络化,使用户通过统一的***完成各项需求。知识资源和服务延伸到公司所有员工桌面,成为各级领导、专业技术和管理人员在日常工作中获取科技、管理、创新源泉的主窗口和主渠道;极大地方便了企业员工对行业信息资源的深层挖掘和利用。
附图说明
图1为本发明***总体技术架构
图2为本发明的***总体网络架构。
具体实施方式
下面将结合本发明的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
本发明的底层数据构架是基于SOA体系和云存储平台,构建知识中心底层数据架构,整个***按层设计,每层之间通过松散耦合的方式相互通信,其详细的架构如图1所示。本发明的***总体网络架构如图2,三层结构是将应用功能分成表示层、业务逻辑层和数据层三部分。在逻辑上使其独立。相比较传统的两层(C/S)结构而言,具有如下优点:***管理简单,大大减少客户机维护工作量;具有灵活的软、硬件***构成;提高程序的可维护性和可扩展性;增加了***的安全性。
基于SOA的先进理念,实现灵活可扩展的***架构,达到开放性和可扩展性相结合。以服务为导向的体系架构SOA,是目前领先的、具有强大整合能力的应用体系架构,是通过业务服务的概念来提供IT的各项基本应用功能,这些服务可以自由地排列组合、互通互连、融会贯通,能随时弹性配合未来的、新的需求而调整。与当下最热的大数据技术结合,管理海量的大数据资源,利用数据分析和挖掘技术,对海量数据进行精细化处理,并在海量的数据资源中挖掘有用的知识知识,以期摆脱低层次的数据应用,向信息智能和知识发现的多维度应用发展。***基于云平台架构,实现可伸缩、可扩展的企业级云平台,包括云数据中心和云服务平台。通过引入优化技术增强平台功能,以较小的成本搭建高性能的计算和存储平台,满足本项目的海量信息采集、处理、存储和检索需求。而***的资源数据库具有:标准数据库、专利库、科技成果库、知识产品库、期刊库、论文库、电力图书库、南网企业文库、业务生产知识库、网络咨询库、视频多媒体库、图片库、电力机构库、电力学者库
对***的调整建设,需要考虑与其他各业务***、网络资源的接口,方便相关软件方面的集成和相关功能的集成,使用户能够更加便捷地进行操作、管理和利用多方面的数据。与公司业务***的数据接口:与网络资源数据的接口;与南方电网期刊***的接口; 与分子公司知识***的数据接口;与公司其他***的数据接口。
对知识中心的所有数据按着电力行业的特点进行梳理,形成全网统一的元数据标准,并建立论文库﹑建立标准库﹑建立成果库等数据库。包括元数据仓储平台改造及相关标准建设、业务***数据获取和数据预处理和更新管理等功能。
建立全网统一的元数据标准,自动采集内部数据库的元数据,实现元数据整合及调度。对于能获得元数据的资源,***优先采用元数据整合方式。平台基于KBase全文数据库管理***,支持对于各种非结构化全文数据的海量信息快速全文检索能力。通过MetaServer元数据整合引擎和OpenQuery关系型数据库整合网关,将各种资源迁移、同步、采集、转换到KBase全文数据库中,组成一个统一元数据仓储,采用KBase强大的全文检索能力,实现对于所有元数据进行WEB检索和发布,实现资源的深度整合和增值服务。检索速度和方式不受不同数据源的约束,通过这种方式整合检索,效率最高。同时,也将进行数据标准规范建设,并进行元数据导出,将知识中心现有***的数据导出,进行迁移,统一迁移到KBase数据库中,可以通过多种方式将原始资源库中的数据批量导出,包括数据库网关、API接口、Web检索驱动等。将各种外购的资源、自建资源、内部业务数据等通过多种途径,统一转换并同步保存到数据中心相应的数据库表中。根据不同资源平台的特点和接口方式,可通过多种整合方式进行整合。业务数据获取梳理南方电网的各个业务***,将业务部门的生产管理数据进行挖掘整理,并与数据中心的相关资源进行关联,为生产管理部门的实际业务应用起到一定的指导和决策作用。
数据加工标引***要用于对特殊和重点资源进行结构化和碎片化加工,如电力标准、科技成果等资源通过人机交互的方式完成对各个元数据项的标引工作以及xml数据加工,并拆分文章的章节、图片、表格、公式、知识点等信息。完成对标准数据的指标提取和结构化,方便不同企业的同一标准之间进行指标比对。
包括元数据标引、自动识别和实现知识知识碎片化等功能,据元数据标准,对需要加工的资源通过人机交互的界面进行提取和标注。提供机辅标引和手工标引功能和操作界面,便于操作员操作。
对于格式比较固定的资源在加工标引时可以配置模板,根据模板自动识别出元数据项并自动抽取。实现知识知识碎片化:实现知识知识碎片化、数据清洗等预处理加工,以及数据XML加工管理。对需要进行知识碎片化处理的数据资源进行更细致的字段梳理,特别是对内容里面的字段,建立字段表。根据字段表对此类型资源进行再加工,将一条数据资源加工成若干条知识;也可以利用计算机的智能数据挖掘分析功能,根据字段表自动对数据资源进行扫描分析,自动提取出相关的知识条目,然后进行人工审核,达到知识碎片化的目的。对于知识元,***能够自动提取电网技术相关的名词、术语、概念、定义等知识元,并对知识元进行关联性分析。
数据中心管理模块是知识数据中心的核心,它是对整合过来的各类数据,包括数据库和文档进行统一仓储、管理、组织和服务。数据导入和访问都通过数据中心统一提供的接口进行操作,数据中心内部通过云平台架构对数据进行存储和管理,从而构建南方电网海量非结构化知识数据中心。采用分布存储的方式,***能够根据数据量大小和时间自动分表存储;同时根据数据中心中注册的存储结点自动分配最合适的存储节点和存储单元进行管理,具体包含数据存储结点管理,数据备份及恢复管理,数据归档和数据缓存管理。实现的功能包括:数据存储管理:采用分布存储的方式,***能够根据数据量大小和时间自动分表存储。同时根据数据中心中注册的存储结点自动分配最合适的存储节点和存储单元。具体包含数据存储结点管理,数据备份及恢复管理,数据归档和数据缓存管理。
安全访问认证:为了数据中心的安全,可对访问者进行认证和验证,只有在***中注册并且授权的用户才能访问有权限的资源。提供多种认证方式,包括用户名/密码、IP限定、证书认证等。
资源访问授权:管理员可以分配调用者可以访问的数据库、字段、具体数字对象。只有授权调用者才能得到数据访问结果列表。支持帐户密码、IP地址等多种验证方式。通过管理后台,管理员可对用户账号进行授权。
对于***的数据操作,通过用户组和信息分类进行控制,用户隶属于不同的用户组,不同的用户组可以操作不同的信息分类,不同的用户组对于资源可以执行不同的数据操作,包括增加、修改、删除、浏览等,从而定义用户可以操作和访问的信息分类下的信息文档,实现对于数据操作的安全控制,保证不同用户只能操作用户组所授权的资源文档。
还主要包括知识中心门户***的改版和部分***功能的升级改造,其中要对现知识中心服务门户架构和页面具体布局进行调整和新子频道架构及页面布局进行设计和个性化定制,并对***功能进行升级改造,包括个性化与全文智能检索、网省二级智能联合参考咨询和原文传递服务升级改造、知识需求项目功能集成等。保留目前比较重复利用率高的栏目和频道,同时需要对原有各个频道和功能进行完善。主要表现在如下几个方面:优化检索功能,使其更加智能和精确。***能够对用户的检索条件进行预处理,从而达到更好的检索效果;对订阅推送功能改进算法和策略,做到精确推送。减少垃圾信息,做到“精而少”;界面风格与原有***保持一致,习题适应现有用户的使用习惯:对各类数据和功能进行梳理,把属于同一类别的数据和功能放到一起,方便用户查找:对标准数据进行精加工,提供更加丰富的标准服务:增加业务知识库查询和知识提交的入口:整合深圳供电局项目和武大项目中的优势功能:增加知识分享和交流的功能。
对知识中心网站的功能进行拓展,以数据中心的数据为基础,提供知识智能分析处理功能。
成果登记***升级:根据用户对现有知识中心的成果登记***的使用反馈,保留***使用反响良好的地方,改进用户使用不便的地方。
使用目前最流行的设计风格和开发技术,对成果登记***、会员中心进行升级改造,提升用户的使用体验感。
实现知识智能分析处理:对知识热点分析及跟踪(包括互联网数据),对期刊、论文、报告、图书﹑互联网数据等各类资源进行挖掘,通过聚类和主题抽取,挖掘出某段时间内的研究热点和技术热点。并对此热点进行持续的跟踪分析,掌握技术发展动态和趋势。
在数据中心和智能挖掘引擎的基础上,针对电网技术板块为集团提供电网相关技术方面的研究热点、前沿、发展趋势等知识监测和跟踪,并为领导和研究人员提供可参考的知识简报。
本模块是一个知识专题监测和跟踪***,所以主要是监测和跟踪为主,其核心模块主要如下:
知识热点分析及跟踪功能,对期刊、论文、报告、图书等各类资源进行挖掘,通过聚类和主题抽取,挖掘出某段时间内的研究热点和技术热点。并对此热点进行持续的跟踪分析,掌握技术发展动态和趋势。
知识管理和服务模块是此***是与电网业务相关的知识库***,是一个开放的平台,将业务部门的生产管理数据进行挖掘整理,并与数据中心的相关资源进行关联,为生产管理部门的实际业务应用起到一定的指导和决策作用。比如:可以将变电站事故记录数据建成一个专题知识库,标注每一次事故的时间、地点、原因、解决办法等信息。通过这些数据的分析一方面可以帮助其他维护人员快速解决问题,另一方面通过数据分析可有效预防事故的发生。
统已实现了学术论文总库资源下载、阅读、访问次数,栏目访问和分省公司访问统计等多维度的评价和统计,结果保存在数据库中,以优化、调整未来的资源采购方向和范围,及计算知识资源的价值。
***通过智能挖掘引擎自动挖掘各个知识之间的关联关系,动态地提取每一条知识的特征向量,在用户浏览知识时根据这个特征向量检索相似索引并动态地关联出与些知识最相关的知识。
另外***会挖掘用户行为和访问日志,将用户访问的知识进行统计和归类,访问某一知识时自动关联出与之同类并被其他用户大量访问的知识,从而形成一个网状的知识关联图。
主题词挖掘引擎定期对知识库进行统计,自动挖掘每一条知识的主题词,并计算各个主题词之间的关联关系,根据关联关系和关联度大小形成一个网状的主题词导航图,其效果如下图所示,每点击其中的一个主题词则将以些主题为中心又向外关联。
知识社区,根据网、省公司两级运维人员的日常工作情况,开发了各种咨询服务和日常更新维护的综合统计分析评价功能。提供图表呈现并基于此全面考核二级运维人员的服务质量。功能包括***访问、操作日志、***运行维护统计数据和数据分析等功能。
为了方便获取员工头脑中隐性知识,建立内部员工网络社区,实现个人相互关注、资源上传分享、推荐、评价;针对相关专题,发起内部讨论和圈子,收集隐性知识,并汇生产报告。知识社区为所有用户提供的一个知识问答、知识分享和知识沉淀的交流互动社区,挖掘专家的隐性知识,形成一个个的专题知识库。
知识社区实现如下功能:用户交流功能,包括主题概览和细览、发言、回复、短消息、投票等;辅助交流功能,些辅助功能包括精华区、排行、检索、在线用户列表、打印、收藏等;在线讨论功能——提供聊天室功能,以方便用户自由讨论,并提供嘉宾访谈功能,可浏览交流内容记录并对发言排序;个性化内容推送——可以为用户提供个性化的内容推送功能,Email推送、版面帖子订阅、帖子推荐功能;日常管理监控功能——提供管理员社区参数及内容的全面管理功能,提供对缓冲池的监控和访问统计等监控功能;安全性控制功能——需要提供用户及组策略管理,版面授权访问控制,发帖信息过滤审核,IP管理等。
本发明应用异构数据整合技术、智能检索技术、文本挖掘技术等前沿技术将众多异构的信息资源数据库进行集成、整合,实现一站式跨库检索、多语言检索、检索结果智能分类;对知识中心进行升级优化,升级优化后,实现数据清洗和整合,建立全网元数据标准、数据加工标引标准、***集成规范、数据管理规范和服务规范及相关标准接口、升级智能检索功能、获取业务数据建立知识地图和知识社区、提供知识跟踪分析和简报生产等智能服务,辅助知识中心由文献保障转型转变为知识知识服务型,完成由被动服务到主动服务的改变。
Claims (10)
1.一种知识收集处理和检索***,包括,知识分析跟踪模块、智能数据挖掘分析模块、检索模块、知识数据库、浏览检索界面,其特征在于:还包括,数据中心管理应用***,其可以对数据进行管理、数据访问接口和安全访问认证;数据加工标引***,包括元数据自动识别及标引、加工和管理;知识管理服务模块,其包括专业知识库、兴趣模型库、专题知识库;整个***基于中心异构数据整合,对不同来源的数据进行导出和导入操作,可抽取业务***中对应数据生成知识库并存储到知识数据库,***可以实现数据预处理和更新管理,对元数据字段对应和转换,实现数据更新。
2.如权利要求1所述的知识收集处理和检索***,其特征在于:数据加工标引***包括元数据自动识别及标引,根据元数据标准,对需要加工的资源通过人机交互的界面进行提取和标注;对于格式比较固定的资源在加工标引时可以配置模板,根据模板自动识别出元数据项并自动抽取;数据加工和管理:实现对知识知识加工、数据清洗预处理加工。
3.如权利要求1所述的知识收集处理和检索***,其特征在于:数据中心管理应用***具体为:数据管理,采用分布存储的方式,***能够根据数据量大小和时间自动分表存储;同时根据数据中心中注册的存储结点自动分配最合适的存储节点和存储单元进行管理,具体包含数据存储结点管理,数据备份及恢复管理,数据归档和数据缓存管理;数据访问接口,为方便后期项目和服务对数据中心各数据的调取和使用,按需求建立一下标准数据接口:数据库列表获取接口;数据查询接口;数据更新接口;资源访问授权;资源访问授权;数字对象下载接口;安全访问认证,为了确保数据中心数据的安全,可对访问者进行认证和验证,只有在***中注册并且授权的用户才能访问有权限的资源。
4.如权利要求1所述的知识收集处理和检索***,其可为用户提供多种个性化的智能检索功能,包括检索智能提示、智能纠错、智能转换、分项检索智能检索功能。
5.如权利要求1所述的知识收集处理和检索***,其知识分析跟踪模块以本地资源和互联网资源为基础,对用户设定的专题知识进行热点分析及跟踪。
6.如权利要求1所述的知识收集处理和检索***,知识管理服务模块其包括有知识地体,主要对知识按不同的维度进行导航和关联,形成一个知识网络。所述的专业知识库包括设备知识、岗位知识、部门知识、技术专题知识。
7.如权利要求1所述的知识收集和检索***,其还包括有内容管理模块
包括统一认证和权限管理、资源版权管理,其中:统一认证和权限管理,实现统一身份认证和单点登录功能,对平台中用户的角色、权限、资源密级情况及发布进行管理;资源版权管理,对文档进行密级控制和加密管理,通过多种加密技术,实现对密级文件的使用方式、范围管理、防拷贝,防打印、防扩散传播功能。
8.如权利要求1所述的知识收集和检索***,其可对现有的项目进行数据挖掘和智能处理,进行数据关联分析、数据自动聚类、分类、标引以及用户行为分析和日志挖掘、数据挖掘智能处理。
9.如权利要求1所述的知识收集和检索***,其整个***按层设计,每层之间通过松散耦合的方式相互通信。
10.如权利要求1所述的知识收集和检索***,其整体数据构架基于SOA***和云存储平台。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911270663.4A CN111008190A (zh) | 2019-12-12 | 2019-12-12 | 一种知识收集处理和检索*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911270663.4A CN111008190A (zh) | 2019-12-12 | 2019-12-12 | 一种知识收集处理和检索*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111008190A true CN111008190A (zh) | 2020-04-14 |
Family
ID=70114281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911270663.4A Pending CN111008190A (zh) | 2019-12-12 | 2019-12-12 | 一种知识收集处理和检索*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111008190A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094025A (zh) * | 2021-04-06 | 2021-07-09 | 国家电网有限公司客户服务中心 | 基于知识库的电力营业厅服务*** |
-
2019
- 2019-12-12 CN CN201911270663.4A patent/CN111008190A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094025A (zh) * | 2021-04-06 | 2021-07-09 | 国家电网有限公司客户服务中心 | 基于知识库的电力营业厅服务*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107819824B (zh) | 一种城市数据开放与信息服务***及服务方法 | |
CN104767813B (zh) | 基于openstack的公众行大数据服务平台 | |
CN111221887A (zh) | 一种对数据湖服务器中的数据进行管理和访问的方法 | |
CN103929473A (zh) | 使用单一app程序访问包含个性化数据分布式存储的多子***和公共子***的方法和*** | |
CN102609526A (zh) | 互联网网站内容管理*** | |
Zhang et al. | Research on the integration of heterogeneous information resources in university management informatization based on data mining algorithms | |
CN103745302A (zh) | 一种数字化档案资料管理*** | |
US20200334314A1 (en) | Emergency disposal support system | |
CN110826974A (zh) | 一种科技成果转化/孵化大数据云平台互联网+*** | |
CN114756567A (zh) | 基于大数据技术的智慧政务服务分析平台 | |
CN111008190A (zh) | 一种知识收集处理和检索*** | |
Lv et al. | The exploring on university archives management system based on information system | |
CN114003634A (zh) | 基于es技术的大数据分析检索***及方法 | |
Gu | Integration and optimization of ancient literature information resources based on big data technology | |
CN111597332A (zh) | 财政百科应用*** | |
Ziegler et al. | PAL: toward a recommendation system for manuscripts | |
Sixin et al. | A New Governance Architecture for Government Information Resources Based on Big Data Ecological Environment in China | |
Pan et al. | An open sharing pattern design of massive power big data | |
Kunanets et al. | Modeling of consolidated information resource for social data institutions | |
Zhao et al. | Design and Implementation of Enterprise Public Data Management Platform Based on Artificial Intelligence | |
Ling-ping et al. | Application of Three-dimensional Digital Model in Digital Archive Ubiquitous Intelligent Service | |
CN110704421A (zh) | 数据处理方法、装置、设备和计算机可读存储介质 | |
Yun | Design and Development of Online Booking Clients for University Books and Materials under the Background of Big Data | |
Tang | The construction of intelligent professional discipline service platforms of libraries | |
Taylor et al. | A new information architecture, website and services for the CMS experiment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200414 |