CN111858236A - 知识图谱监控方法、装置、计算机设备及存储介质 - Google Patents

知识图谱监控方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111858236A
CN111858236A CN202010584068.4A CN202010584068A CN111858236A CN 111858236 A CN111858236 A CN 111858236A CN 202010584068 A CN202010584068 A CN 202010584068A CN 111858236 A CN111858236 A CN 111858236A
Authority
CN
China
Prior art keywords
knowledge
monitoring
knowledge graph
content
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010584068.4A
Other languages
English (en)
Other versions
CN111858236B (zh
Inventor
张学琴
杨飞飞
王树华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Fulian Jingjiang Technology Co ltd
Original Assignee
Shenzhen Jingjiang Yunchuang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jingjiang Yunchuang Technology Co Ltd filed Critical Shenzhen Jingjiang Yunchuang Technology Co Ltd
Priority to CN202010584068.4A priority Critical patent/CN111858236B/zh
Publication of CN111858236A publication Critical patent/CN111858236A/zh
Application granted granted Critical
Publication of CN111858236B publication Critical patent/CN111858236B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及知识图谱技术领域,提供一种知识图谱监控方法、装置、计算机设备及存储介质,包括:响应于接收到的对待测知识图谱进行监控的监控请求,根据所述监控请求获取所述待测知识图谱的备案信息;根据所述备案信息为所述待测知识图谱配置多个第一知识库;对所述多个第一知识库中的内容进行分级得到多个第二知识库;结构化处理所述多个第二知识库得到标准监控模板;调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果;根据所述扫描结果生成监控报告。本发明能够对知识图谱进行精准和定制化监控,监控质量高,能够辅助提高知识图谱的服务能力。

Description

知识图谱监控方法、装置、计算机设备及存储介质
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种知识图谱监控方法、装置、计算机设备及存储介质。
背景技术
随着技术的发展,越来越多的人工岗位将被以人工智能知识图谱为核心技术的软件***或者与之相关的服务机器人代替,知识图谱作为一种语义网络拥有极强的表达能力和建模灵活性,在生活中的应用场景非常广阔。
虽然目前市面上人工智能知识图谱***比较多,但是与之相对应的图谱服务合规性的监控***及服务能力认证的***却没有,因而无法判断应用在日常工作服务中的知识图谱,其工作服务内容是否具有合规性及其工作服务内容是否与目前社会所期待的服务能力相匹配。
因此,有必要提供一种用于对知识图谱进行监控的方案,以提高知识图谱的服务能力。
发明内容
有鉴于此,本发明的主要目的在于提供一种知识图谱监控方法、装置、计算机设备及存储介质,旨在解决现有技术中无法对知识图谱进行监控的技术问题。
本发明的第一方面提供一种知识图谱监控方法,应用于计算机设备中,所述方法包括:
响应于接收到的对待测知识图谱进行监控的监控请求,根据所述监控请求获取所述待测知识图谱的备案信息;
根据所述备案信息为所述待测知识图谱配置多个第一知识库;
对所述多个第一知识库中的内容进行分级得到多个第二知识库;
结构化处理所述多个第二知识库得到标准监控模板;
调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果;
根据所述扫描结果生成监控报告。
根据本发明的一个可选的实施例,根据所述监控请求获取所述待测知识图谱的备案信息包括:
解析出所述监控请求中的所述待测知识图谱的名称;
发送所述待测知识图谱的名称至预设终端;
接收所述预设终端发送的与所述待测知识图谱的名称对应的备案信息。
根据本发明的一个可选的实施例,所述对所述多个第一知识库中的内容进行分级得到多个第二知识库包括:
读取每个第一知识库中的每条内容;
对所述内容进行语义解析得到影响程度;
确定根据所述影响程度对应的影响等级;
根据所述影响等级对所述内容进行分级;
将内容分级后的第一知识库作为第二知识库。
根据本发明的一个可选的实施例,所述结构化处理所述多个第二知识库得到标准监控模板包括:
针对每一分级,读取所述第二知识库中对应所述分级的第一数据并以预设数据格式存储所述第一数据得到第二数据;
获取所述第一数据中的元数据,并基于所述元数据生成三元组转换规则;
读取所述第二数据,并将所述第二数据与所述三元组转换规则中定义的实体类型、各个实体类型之间的关联关系以及各个实体类型对应的属性和属性值分别进行匹配,得到三元组数据;
基于所述三元组数据得到标准监控模板。
根据本发明的一个可选的实施例,所述基于所述元数据生成三元组转换规则包括:
将所述元数据中每列数据的含义和各列之间的关系输入预设规则生成模板中,通过所述规则生成模板的解析并输出三元组转换规则。
根据本发明的一个可选的实施例,所述调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果包括:
逐行比对所述标准监控模板中的第一内容与对应的所述待测知识图谱中的第二内容;
当所述第一内容与所述第二内容比对一致时,确定所述扫描结果为扫描成功;
当所述第一内容与所述第二内容比对不一致时,确定所述扫描结果为扫描失败。
根据本发明的一个可选的实施例,所述对所述扫描结果进行分析并根据分析结果生成监控报告包括:
针对每一分级,获取扫描成功的扫描结果并计算所述扫描成功的扫描结果的数量;
计算所述数量与所述扫描结果的总数量之间的比值;
比较所述比值是否在预设阈值范围内;
获取不在所述预设阈值范围内的目标比值对应的目标分级及所述目标分级对应的目标扫描结果;
根据所述目标扫描结果生成监控报告。
本发明的第二方面提供一种知识图谱监控装置,运行于计算机设备中,所述装置包括:
信息获取模块,用于响应于接收到的对待测知识图谱进行监控的监控请求,根据所述监控请求获取所述待测知识图谱的备案信息;
知识库配置模块,用于根据所述备案信息为所述待测知识图谱配置多个第一知识库;
内容分级模块,用于对所述多个第一知识库中的内容进行分级得到多个第二知识库;
结构化处理模块,用于结构化处理所述多个第二知识库得到标准监控模板;
图谱扫描模块,用于调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果;
报告生成模块,用于根据所述扫描结果生成监控报告。
本发明的第三方面提供一种计算机设备,所述计算机设备包括:存储器,用于存储至少一个指令;处理器,用于执行所述至少一个指令时实现所述的知识图谱监控方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被处理器执行时实现所述的知识图谱监控方法。
本发明通过获取待测知识图谱的备案信息并根据所述备案信息为所述待测知识图谱配置知识库,实现了知识图谱的个性化和定制化的数据配置的过程,从而根据配置的知识库实现待测知识图谱的精准监控;对所述多个第一知识库中的内容进行分级并结构化处理后即可得到标准监控模板,便于通过所述标准监控模板对所述待测知识图谱进行扫描,得到的扫描结果更加准确,监控准确率高;最后分级生成监控报告,便于待测知识图谱的相关人员快速定位出所述待测知识图谱中不符合要求的内容,从而及时调整和修改,以提高知识图谱的服务能力
附图说明
图1为本发明第一实施例的计算机设备的结构示意图。
图2为本发明第二实施例的知识图谱监控方法的流程示意图。
图3为本发明实施例的多个第一知识库的示意图。
图4为本发明第三实施例的知识图谱监控装置的功能模块示意图。
具体实施方式
以下描述将参考附图以更全面地描述本发明内容。附图中所示为本发明的示例性实施例。然而,本发明可以以许多不同的形式来实施,并且不应该被解释为限于在此阐述的示例性实施例。提供这些示例性实施例是为了使本发明透彻和完整,并且将本发明的范围充分地传达给本领域技术人员。类似的附图标记表示相同或类似的组件。
本文使用的术语仅用于描述特定示例性实施例的目的,而不意图限制本发明。如本文所使用的,除非上下文另外清楚地指出,否则单数形式“一”和“一个”旨在也包括复数形式。此外,当在本文中使用时,“包括”和/或“包含”或“包括”和/或“包括”或“具有”和/或“具有”,整数,步骤,操作,组件和/或组件,但不排除存在或添加一个或多个其它特征,区域,整数,步骤,操作,组件,组件和/或其群组。
除非另外定义,否则本文使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员通常理解的相同的含义。此外,除非文中明确定义,诸如在通用字典中定义的那些术语应该被解释为具有与其在相关技术和本发明内容中的含义一致的含义,并且将不被解释为理想化或过于正式的含义。
以下内容将结合附图对示例性实施例进行描述。须注意的是,参考附图中所描绘的组件不一定按比例显示;而相同或类似的组件将被赋予相同或相似的附图标记表示或类似的技术用语。
图1为本发明实施例一提供的计算机设备的结构示意图。
所述计算机设备1用于对知识图谱进行合规性监控,可以包括至少一个存储器10、至少一个处理器12、至少一条通信总线14、至少一个输入接口16及至少一个输出接口18。
在一些实施例中,所述至少一个存储器10包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
在一些实施例中,所述至少一个处理器12可以包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线14被设置为实现所述至少一个存储器10、所述至少一个处理器12、所述至少一个输入接口16及所述至少一个输出接口18等之间的连接通信。
在一些实施例中,所述至少一个输入接口可以为图形用户界面。
在一些实施例中,所述至少一个输出结果用于输出监控结果。
所述至少一个存储器10中存储有计算机程序,所述计算机程序为计算机可读指令。所述至少一个处理器12可调用所述至少一个存储器10中存储的计算机程序以执行相关的功能。例如,图4中所述的各个模块是存储在所述至少一个存储器10中的计算机程序,并由所述至少一个处理器12所执行,从而实现所述各个模块的功能以达到知识图谱监控的目的。
本领域技术人员应该了解,图1示出的计算机设备1的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述计算机设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
参阅图2所示,为本发明实施例二的知识图谱监控方法的流程图。
所述知识图谱监控方法应用于计算机设备中,具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,计算机设备响应于接收到的对待测知识图谱进行监控的监控请求,根据所述监控请求获取所述待测知识图谱的备案信息。
不同的知识图谱提供不同的服务和功能,例如,接待知识图谱提供接待服务,翻译知识图谱提供翻译功能,法律咨询知识图谱提供法律咨询与解答,售后知识图谱提供售后服务,心理咨询知识图谱提供心理咨询服务,金融服务知识图谱提供与金融业务相关的服务等。对外提供服务的知识图谱在上线时,需要到国家相关部门进行备案。
在一个可选的实施例中,所述计算机设备根据所述监控请求获取所述待测知识图谱的备案信息包括:
解析出所述监控请求中的所述待测知识图谱的名称;
发送所述待测知识图谱的名称至预设终端;
接收所述预设终端发送的与所述待测知识图谱的名称对应的备案信息。
所述计算机设备还可以提供通信接口,通过所述通信接口与国家相关部门的终端通信连接。计算机设备接收到针对某一个知识图谱的监控请求时,从国家相关部门的终端获取所述知识图谱的备案信息。
在一个可选的实施例中,所述备案信息可以包括,但不限于:知识图谱的名称,备案编号,应用范围(例如,金融业),服务领域(例如,金融咨询),服务国家(例如,中国),服务地区范围(例如,北京/上海),上线时间,发行公司,服务器托管地,所遵循的法律体系以及法律体系中的法律详细清单,所遵循的伦理道德准则及详细内容,所遵循的生活习惯的国家/地区及具体内容,所遵循的标准体系及具体标准清单,每个标准清单所对应的标准内容,知识图谱所遵循的职业能力有哪些。
在其他实施例中,所述备案信息可以包括知识图谱所遵循的多样性和公平性的内容,多样性的分类分布,每个分类分布的具体数据。
S12,计算机设备根据所述备案信息为所述待测知识图谱配置多个第一知识库。
由于知识图谱在目前人们的生活中扮演的是职业服务者的角色,而这些职业服务者在社会生活中是具有社会公知,职业道德,职业能力的人,具有社会公知,职业道德,职业能力的人不仅遵守法律法规,遵守相关行业的国际/国家/行业标准,遵守伦理道德和职业道德,并且还具备一定的职业能力,因此所述计算机设备在对所述待测知识图谱进行监控时,首先针对所述待测知识图谱的备案信息来精确的配置知识库,从而实现精准和个性化的监控的目的。
示例性的,如图3所示,所述计算机设备配置的多个第一知识库可以包括:法律体系第一知识库301,标准体系第一知识库302,伦理道德第一知识库303,职业能力第一知识库304,生活习惯第一知识库305,宗教信仰第一知识库306。其中,所述伦理道德第一知识库303包括以下中的一种或多种的组合:医学伦理,道德伦理,科学伦理。所述宗教信仰知识库可以包括***,天主教,***教,佛教等。
根据不同的需求,配置的第一知识库不同。计算机设备可以增加其他第一知识库,或者删除部分第一知识库,或者对配置的第一知识库进行修改。
S13,计算机设备对所述多个第一知识库中的内容进行分级得到多个第二知识库。
所述计算机设备在根据所述待测知识图谱的备案信息完成了对第一知识库的配置后,对每一个第一知识库中的每一条内容进行分级,并将内容分级后的第一知识库作为第二知识库。
在一个可选的实施例中,所述计算机设备对所述多个第一知识库中的内容进行分级得到多个第二知识库包括:
读取每个第一知识库中的每条内容;
对所述内容进行语义解析得到影响程度;
确定根据所述影响程度对应的影响等级;
根据所述影响等级对所述内容进行分级;
将内容分级后的第一知识库作为第二知识库。
其中,对所述内容进行语义解析可以得到违反严重性的影响程度,危害性的影响程度及性质恶劣的影响程度。
对所述法律体系第一知识库301、所述标准体系第一知识库302、所述伦理道德第一知识库303、所述职业能力第一知识库304、所述生活习惯第一知识库305及所述宗教信仰第一知识库306中的每一条内容的分级可以按照法律法规的司法解释、标准体系的必要内容、职业能力认定具备的重要能力等进行语义解析,从而得到影响程度。所述计算机设备中预先存储有影响程度与影响等级之间的对应关系,根据所述对应关系,可以确定每一个影响程度对应的影响等级。违反严重性越大,危害性越高,恶劣影响程度越大的内容的分级等级越高;违反严重性越小,危害性越低,恶劣影响程度越小的内容的分级等级越低。可以对所述第一知识库中的每一个知识库中的每一条内容划分为N个等级,其中,N为大于1的自然数,例如4,5,6,7。
示例性的,假设将内容分为6个等级:5,4,3,2,1,0,其中,等级5代表违反严重性、危害性及恶劣影响程度最大的,等级1代表违反严重性、危害性及恶劣影响程度相对较弱的,0代表不存在违反严重性、危害性及恶劣影响程度。
S14,计算机设备结构化处理所述多个第二知识库得到标准监控模板。
所述计算机设备对所述多个第一知识库中的内容进行分级后,再对分级的每一条内容进行结构化处理。
在一个可选的实施例中,所述计算机设备结构化处理所述多个第二知识库得到标准监控模板包括:
针对每一分级,读取所述第二知识库中对应所述分级的第一数据并以预设数据格式存储所述第一数据得到第二数据;
获取所述第一数据中的元数据,并基于所述元数据生成三元组转换规则;
读取所述第二数据,并将所述第二数据与所述三元组转换规则中定义的实体类型、各个实体类型之间的关联关系以及各个实体类型对应的属性和属性值分别进行匹配,得到三元组数据;
基于所述三元组数据得到标准监控模板。
为了理解第二数据库中的数据和数据之间的关联关系,所述计算机设备采用资源描述框架(resource description framework,RDF)来描述数据。RDF的基本思想是:(1)将一切可以在Web上标识的事物(具体的或抽象的,存在的或不存的)统称为“资源”;(2)用URI(Universal Resource Identifier,通用资源标识)来标识资源;(3)用属性(property)和属性值来描述资源。在RDF中任何表达式的基本结构是一个三元组的集合,每个三元组由主语,谓语和宾语构成。主语对应于资源,是可拥有URI的任何事物。计算机设备通过RDF技术生成的标准监控模板实际上为标准化的知识图谱。
计算机设备以一种预设数据格式进行存储,使得后续对第二数据库中的数据的处理不需要考虑格式的不同,简化了三元组数据的转换方法。
所述元数据是用于描述所述第二数据库中数据的数据。所述计算机设备可以通过预先开发的数据分析工具,自动化地对第二数据库中的数据进行分析,获取该第二数据库中数据的元数据。
所述计算机设备可以根据分级的严重性由强到弱,或者由弱到强的顺序来对分级的每一条内容进行结构化处理。示例性的,假设计算机设备对所述第一知识库中的内容划分为6个等级,那么对分级的每一条内容进行结构化处理的顺序可以为:5级,4级,3级,2级,1级,0级。即,先完成5级的结构化处理过程,再对4级的内容进行结构化处理,接着分别对3级,2级,1级,0级的内容进行结构化处理。或者,对分级的每一条内容进行结构化处理的顺序为:0级,1级,2级,3级,4级,5级。即,先完成0级的结构化处理过程,再对1级的内容进行结构化处理,接着分别对2级,3级,4级,5级的内容进行结构化处理。
在一个可选的实施例中,所述计算机设备基于所述元数据生成三元组转换规则包括:
将所述元数据中每列数据的含义和各列之间的关系输入预设规则生成模板中,通过所述规则生成模板的解析并输出三元组转换规则。
所述计算机设备可以预先生成规则生成模板,将元数据包括的第二数据库中每列数据的含义和各列之间的关系输入至所述规则生成模板,所述规则生成模板对输入的内容进行解析后,得到三元组转换规则。
S15,计算机设备调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果。
所述计算机设备对多个第二知识库进行结构化处理后,按照结构化的内容在所述待测知识图谱中进行匹配扫描。
在一个可选的实施例中,所述计算机设备调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果包括:
逐行比对所述标准监控模板中的第一内容与对应的所述待测知识图谱中的第二内容;
当所述第一内容与所述第二内容比对一致时,确定所述扫描结果为扫描成功;
当所述第一内容与所述第二内容比对不一致时,确定所述扫描结果为扫描失败。
该可选的实施例中,所述计算机设备通过对所述标准监控模板及所述待测知识图谱中的内容进行一一比对,来确定所述待测知识图谱是否合规。
在一个可选的实施例中,所述计算机设备在调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果之后,按照预设表格对所述扫描结果进行分区块标记化存储。
S16,计算机设备根据所述扫描结果生成监控报告。
所述监控报告主要包括:报警显示,统计分析,日志记录。
在一些实施例中,所述计算机设备可以按照所述第一知识库中的法律法规、伦理道德、标准体系、职业能力、宗教信仰及生活习惯等内容的违反严重性、危害性及恶劣影响的程度的分级来生成监控报告。
在一些可选的实施例中,所述计算机设备根据所述扫描结果生成监控报告包括:
针对每一分级,获取扫描成功的扫描结果并计算所述扫描成功的扫描结果的数量;
计算所述数量与所述扫描结果的总数量之间的比值;
比较所述比值是否在预设阈值范围内;
获取不在所述预设阈值范围内的目标比值对应的目标分级及所述目标分级对应的目标扫描结果;
根据所述目标扫描结果生成监控报告。
其中,所述预设阈值范围可以是(0.95,1)。
当某一分级后的扫描结果对应的比值在所述预设阈值范围内,表明该分级后的扫描结果是符合要求的;当某一分级后的扫描结果对应的比值不在所述预设阈值范围内,表明该分级后的扫描结果是不符合要求的。某一分级后的扫描结果对应的比值越接近所述预设阈值范围的上限值,表明该分级后的扫描结果越好。
列出不在所述预设阈值范围内的目标比值对应的目标分级及所述目标分级对应的扫描结果,使得所述待测知识图谱的相关人员对其进行改进。
本实施例中所述的知识图谱监控方法,通过获取待测知识图谱的备案信息并根据所述备案信息为所述待测知识图谱配置知识库,实现了知识图谱的个性化和定制化的数据配置的过程,从而根据配置的知识库实现待测知识图谱的精准监控;对所述多个第一知识库中的内容进行分级并结构化处理后即可得到标准监控模板,便于通过所述标准监控模板对所述待测知识图谱进行扫描,得到的扫描结果更加准确,监控准确率高;最后分级生成监控报告,便于待测知识图谱的相关人员快速定位出所述待测知识图谱中不符合要求的内容,从而及时调整和修改,以提高知识图谱的服务能力。
图4是本发明实施例三提供的知识图谱监控装置的功能模块图。
知识图谱监控装置40可以包括多个由计算机程序段所组成的功能模块。所述知识图谱监控装置40中的各个程序段的计算机程序可以存储于计算机设备的存储器中,并由计算机设备的至少一个处理器所执行,以执行知识图谱监控方法的功能。
本实施例中,所述知识图谱监控装置40根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:信息获取模块401、知识库配置模块402、内容分级模块403、结构化处理模块404、图谱扫描模块405及报告生成模块406。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述信息获取模块401,用于计算机设备响应于接收到的对待测知识图谱进行监控的监控请求,根据所述监控请求获取所述待测知识图谱的备案信息。
不同的知识图谱提供不同的服务和功能,例如,接待知识图谱提供接待服务,翻译知识图谱提供翻译功能,法律咨询知识图谱提供法律咨询与解答,售后知识图谱提供售后服务,心理咨询知识图谱提供心理咨询服务,金融服务知识图谱提供与金融业务相关的服务等。对外提供服务的知识图谱在上线时,需要到国家相关部门进行备案。
在一个可选的实施例中,所述信息获取模块401根据所述监控请求获取所述待测知识图谱的备案信息包括:
解析出所述监控请求中的所述待测知识图谱的名称;
发送所述待测知识图谱的名称至预设终端;
接收所述预设终端发送的与所述待测知识图谱的名称对应的备案信息。
所述计算机设备还可以提供通信接口,通过所述通信接口与国家相关部门的终端通信连接。计算机设备接收到针对某一个知识图谱的监控请求时,从国家相关部门的终端获取所述知识图谱的备案信息。
在一个可选的实施例中,所述备案信息可以包括,但不限于:知识图谱的名称,备案编号,应用范围(例如,金融业),服务领域(例如,金融咨询),服务国家(例如,中国),服务地区范围(例如,北京/上海),上线时间,发行公司,服务器托管地,所遵循的法律体系以及法律体系中的法律详细清单,所遵循的伦理道德准则及详细内容,所遵循的生活习惯的国家/地区及具体内容,所遵循的标准体系及具体标准清单,每个标准清单所对应的标准内容,知识图谱所遵循的职业能力有哪些。
在其他实施例中,所述备案信息可以包括知识图谱所遵循的多样性和公平性的内容,多样性的分类分布,每个分类分布的具体数据。
所述知识库配置模块402,用于根据所述备案信息为所述待测知识图谱配置多个第一知识库。
由于知识图谱在目前人们的生活中扮演的是职业服务者的角色,而这些职业服务者在社会生活中是具有社会公知,职业道德,职业能力的人,具有社会公知,职业道德,职业能力的人不仅遵守法律法规,遵守相关行业的国际/国家/行业标准,遵守伦理道德和职业道德,并且还具备一定的职业能力,因此所述计算机设备在对所述待测知识图谱进行监控时,首先针对所述待测知识图谱的备案信息来精确的配置知识库,从而实现精准和个性化的监控的目的。
示例性的,如图3所示,所述计算机设备配置的多个第一知识库可以包括:法律体系第一知识库301,标准体系第一知识库302,伦理道德第一知识库303,职业能力第一知识库304,生活习惯第一知识库305,宗教信仰第一知识库306。其中,所述伦理道德第一知识库303包括以下中的一种或多种的组合:医学伦理,道德伦理,科学伦理。所述宗教信仰知识库可以包括***,天主教,***教,佛教等。
根据不同的需求,配置的第一知识库不同。计算机设备可以增加其他第一知识库,或者删除部分第一知识库,或者对配置的第一知识库进行修改。
所述内容分级模块403,用于对所述多个第一知识库中的内容进行分级得到多个第二知识库。
所述计算机设备在根据所述待测知识图谱的备案信息完成了对第一知识库的配置后,对每一个第一知识库中的每一条内容进行分级,并将内容分级后的第一知识库作为第二知识库。
在一个可选的实施例中,所述内容分级模块403对所述多个第一知识库中的内容进行分级得到多个第二知识库包括:
读取每个第一知识库中的每条内容;
对所述内容进行语义解析得到影响程度;
确定根据所述影响程度对应的影响等级;
根据所述影响等级对所述内容进行分级;
将内容分级后的第一知识库作为第二知识库。
其中,对所述内容进行语义解析可以得到违反严重性的影响程度,危害性的影响程度及性质恶劣的影响程度。
对所述法律体系第一知识库301、所述标准体系第一知识库302、所述伦理道德第一知识库303、所述职业能力第一知识库304、所述生活习惯第一知识库305及所述宗教信仰第一知识库306中的每一条内容的分级可以按照法律法规的司法解释、标准体系的必要内容、职业能力认定具备的重要能力等进行语义解析,从而得到影响程度。所述计算机设备中预先存储有影响程度与影响等级之间的对应关系,根据所述对应关系,可以确定每一个影响程度对应的影响等级。违反严重性越大,危害性越高,恶劣影响程度越大的内容的分级等级越高;违反严重性越小,危害性越低,恶劣影响程度越小的内容的分级等级越低。可以对所述第一知识库中的每一个知识库中的每一条内容划分为N个等级,其中,N为大于1的自然数,例如4,5,6,7。
示例性的,假设将内容分为6个等级:5,4,3,2,1,0,其中,等级5代表违反严重性、危害性及恶劣影响程度最大的,等级1代表违反严重性、危害性及恶劣影响程度相对较弱的,0代表不存在违反严重性、危害性及恶劣影响程度。
所述结构化处理模块404,用于结构化处理所述多个第二知识库得到标准监控模板。
所述计算机设备对所述多个第一知识库中的内容进行分级后,再对分级的每一条内容进行结构化处理。
在一个可选的实施例中,所述结构化处理模块404结构化处理所述多个第二知识库得到标准监控模板包括:
针对每一分级,读取所述第二知识库中对应所述分级的第一数据并以预设数据格式存储所述第一数据得到第二数据;
获取所述第一数据中的元数据,并基于所述元数据生成三元组转换规则;
读取所述第二数据,并将所述第二数据与所述三元组转换规则中定义的实体类型、各个实体类型之间的关联关系以及各个实体类型对应的属性和属性值分别进行匹配,得到三元组数据;
基于所述三元组数据得到标准监控模板。
为了理解第二数据库中的数据和数据之间的关联关系,所述计算机设备采用资源描述框架(resource description framework,RDF)来描述数据。RDF的基本思想是:(1)将一切可以在Web上标识的事物(具体的或抽象的,存在的或不存的)统称为“资源”;(2)用URI(Universal Resource Identifier,通用资源标识)来标识资源;(3)用属性(property)和属性值来描述资源。在RDF中任何表达式的基本结构是一个三元组的集合,每个三元组由主语,谓语和宾语构成。主语对应于资源,是可拥有URI的任何事物。计算机设备通过RDF技术生成的标准监控模板实际上为标准化的知识图谱。
计算机设备以一种预设数据格式进行存储,使得后续对第二数据库中的数据的处理不需要考虑格式的不同,简化了三元组数据的转换方法。
所述元数据是用于描述所述第二数据库中数据的数据。所述计算机设备可以通过预先开发的数据分析工具,自动化地对第二数据库中的数据进行分析,获取该第二数据库中数据的元数据。
所述计算机设备可以根据分级的严重性由强到弱,或者由弱到强的顺序来对分级的每一条内容进行结构化处理。示例性的,假设计算机设备对所述第一知识库中的内容划分为6个等级,那么对分级的每一条内容进行结构化处理的顺序可以为:5级,4级,3级,2级,1级,0级。即,先完成5级的结构化处理过程,再对4级的内容进行结构化处理,接着分别对3级,2级,1级,0级的内容进行结构化处理。或者,对分级的每一条内容进行结构化处理的顺序为:0级,1级,2级,3级,4级,5级。即,先完成0级的结构化处理过程,再对1级的内容进行结构化处理,接着分别对2级,3级,4级,5级的内容进行结构化处理。
在一个可选的实施例中,所述计算机设备基于所述元数据生成三元组转换规则包括:
将所述元数据中每列数据的含义和各列之间的关系输入预设规则生成模板中,通过所述规则生成模板的解析并输出三元组转换规则。
所述计算机设备可以预先生成规则生成模板,将元数据包括的第二数据库中每列数据的含义和各列之间的关系输入至所述规则生成模板,所述规则生成模板对输入的内容进行解析后,得到三元组转换规则。
所述图谱扫描模块405,用于调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果。
所述计算机设备对多个第二知识库进行结构化处理后,按照结构化的内容在所述待测知识图谱中进行匹配扫描。
在一个可选的实施例中,所述图谱扫描模块405调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果包括:
逐行比对所述标准监控模板中的第一内容与对应的所述待测知识图谱中的第二内容;
当所述第一内容与所述第二内容比对一致时,确定所述扫描结果为扫描成功;
当所述第一内容与所述第二内容比对不一致时,确定所述扫描结果为扫描失败。
该可选的实施例中,所述计算机设备通过对所述标准监控模板及所述待测知识图谱中的内容进行一一比对,来确定所述待测知识图谱是否合规。
在一个可选的实施例中,所述计算机设备在调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果之后,按照预设表格对所述扫描结果进行分区块标记化存储。
所述报告生成模块406,用于根据所述扫描结果生成监控报告。
所述监控报告主要包括:报警显示,统计分析,日志记录。
在一些实施例中,所述计算机设备可以按照所述第一知识库中的法律法规、伦理道德、标准体系、职业能力、宗教信仰及生活习惯等内容的违反严重性、危害性及恶劣影响的程度的分级来生成监控报告。
在一些可选的实施例中,所述报告生成模块406根据所述扫描结果生成监控报告包括:
针对每一分级,获取扫描成功的扫描结果并计算所述扫描成功的扫描结果的数量;
计算所述数量与所述扫描结果的总数量之间的比值;
比较所述比值是否在预设阈值范围内;
获取不在所述预设阈值范围内的目标比值对应的目标分级及所述目标分级对应的目标扫描结果;
根据所述目标扫描结果生成监控报告。
其中,所述预设阈值范围可以是(0.95,1)。
当某一分级后的扫描结果对应的比值在所述预设阈值范围内,表明该分级后的扫描结果是符合要求的;当某一分级后的扫描结果对应的比值不在所述预设阈值范围内,表明该分级后的扫描结果是不符合要求的。某一分级后的扫描结果对应的比值越接近所述预设阈值范围的上限值,表明该分级后的扫描结果越好。
列出不在所述预设阈值范围内的目标比值对应的目标分级及所述目标分级对应的扫描结果,使得所述待测知识图谱的相关人员对其进行改进。
本实施例中所述的知识图谱监控装置,通过获取待测知识图谱的备案信息并根据所述备案信息为所述待测知识图谱配置知识库,实现了知识图谱的个性化和定制化的数据配置的过程,从而根据配置的知识库实现待测知识图谱的精准监控;对所述多个第一知识库中的内容进行分级并结构化处理后即可得到标准监控模板,便于通过所述标准监控模板对所述待测知识图谱进行扫描,得到的扫描结果更加准确,监控准确率高;最后分级生成监控报告,便于待测知识图谱的相关人员快速定位出所述待测知识图谱中不符合要求的内容,从而及时调整和修改,以提高知识图谱的服务能力。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被处理器执行时实现所述的知识图谱监控方法的全部或者部分步骤,例如,上述步骤S11-S16。或者,所述至少一个指令被处理器执行时实现所述的知识图谱监控装置中的全部或者部分功能,例如,上述模块401-406。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于所述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是所述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种知识图谱监控方法,应用于计算机设备中,其特征在于,所述方法包括:
响应于接收到的对待测知识图谱进行监控的监控请求,根据所述监控请求获取所述待测知识图谱的备案信息;
根据所述备案信息为所述待测知识图谱配置多个第一知识库;
对所述多个第一知识库中的内容进行分级得到多个第二知识库;
结构化处理所述多个第二知识库得到标准监控模板;
调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果;
根据所述扫描结果生成监控报告。
2.如权利要求1所述的知识图谱监控方法,其特征在于,根据所述监控请求获取所述待测知识图谱的备案信息包括:
解析出所述监控请求中的所述待测知识图谱的名称;
发送所述待测知识图谱的名称至预设终端;
接收所述预设终端发送的与所述待测知识图谱的名称对应的备案信息。
3.如权利要求1所述的知识图谱监控方法,其特征在于,所述对所述多个第一知识库中的内容进行分级得到多个第二知识库包括:
读取每个第一知识库中的每条内容;
对所述内容进行语义解析得到影响程度;
确定根据所述影响程度对应的影响等级;
根据所述影响等级对所述内容进行分级;
将内容分级后的第一知识库作为第二知识库。
4.如权利要求3所述的知识图谱监控方法,其特征在于,所述结构化处理所述多个第二知识库得到标准监控模板包括:
针对每一分级,读取所述第二知识库中对应所述分级的第一数据并以预设数据格式存储所述第一数据得到第二数据;
获取所述第一数据中的元数据,并基于所述元数据生成三元组转换规则;
读取所述第二数据,并将所述第二数据与所述三元组转换规则中定义的实体类型、各个实体类型之间的关联关系以及各个实体类型对应的属性和属性值分别进行匹配,得到三元组数据;
基于所述三元组数据得到标准监控模板。
5.如权利要求4所述的知识图谱监控方法,其特征在于,所述基于所述元数据生成三元组转换规则包括:
将所述元数据中每列数据的含义和各列之间的关系输入预设规则生成模板中,通过所述规则生成模板的解析并输出三元组转换规则。
6.如权利要求3至5中任意一项所述的知识图谱监控方法,其特征在于,所述调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果包括:
逐行比对所述标准监控模板中的第一内容与对应的所述待测知识图谱中的第二内容;
当所述第一内容与所述第二内容比对一致时,确定所述扫描结果为扫描成功;
当所述第一内容与所述第二内容比对不一致时,确定所述扫描结果为扫描失败。
7.如权利要求6所述的知识图谱监控方法,其特征在于,所述对所述扫描结果进行分析并根据分析结果生成监控报告包括:
针对每一分级,获取扫描成功的扫描结果并计算所述扫描成功的扫描结果的数量;
计算所述数量与所述扫描结果的总数量之间的比值;
比较所述比值是否在预设阈值范围内;
获取不在所述预设阈值范围内的目标比值对应的目标分级及所述目标分级对应的目标扫描结果;
根据所述目标扫描结果生成监控报告。
8.一种知识图谱监控装置,运行于计算机设备中,其特征在于,所述装置包括:
信息获取模块,用于响应于接收到的对待测知识图谱进行监控的监控请求,根据所述监控请求获取所述待测知识图谱的备案信息;
知识库配置模块,用于根据所述备案信息为所述待测知识图谱配置多个第一知识库;
内容分级模块,用于对所述多个第一知识库中的内容进行分级得到多个第二知识库;
结构化处理模块,用于结构化处理所述多个第二知识库得到标准监控模板;
图谱扫描模块,用于调用所述标准监控模板对所述待测知识图谱进行扫描并获取扫描结果;
报告生成模块,用于根据所述扫描结果生成监控报告。
9.一种计算机设备,其特征在于,所述计算机设备包括:
存储器,用于存储至少一个指令;
处理器,用于执行所述至少一个指令时实现如权利要求1至7中任意一项所述的知识图谱监控方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至7中任意一项所述的知识图谱监控方法。
CN202010584068.4A 2020-06-23 2020-06-23 知识图谱监控方法、装置、计算机设备及存储介质 Active CN111858236B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010584068.4A CN111858236B (zh) 2020-06-23 2020-06-23 知识图谱监控方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010584068.4A CN111858236B (zh) 2020-06-23 2020-06-23 知识图谱监控方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111858236A true CN111858236A (zh) 2020-10-30
CN111858236B CN111858236B (zh) 2022-12-16

Family

ID=72988433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010584068.4A Active CN111858236B (zh) 2020-06-23 2020-06-23 知识图谱监控方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111858236B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113408738A (zh) * 2021-05-17 2021-09-17 桂林电子科技大学 一种基于强化学习设计伦理智能体的方法
WO2024027071A1 (zh) * 2022-08-01 2024-02-08 中电科大数据研究院有限公司 一种数据监控方法及***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150379414A1 (en) * 2014-06-27 2015-12-31 Nuance Communications, Inc. Utilizing large-scale knowledge graphs to support inference at scale and explanation generation
CN110019824A (zh) * 2017-07-20 2019-07-16 苏州狗尾草智能科技有限公司 基于知识图谱的人机交互方法、装置及***
CN110704635A (zh) * 2019-09-16 2020-01-17 金色熊猫有限公司 一种知识图谱中三元组数据的转换方法及装置
CN110704634A (zh) * 2019-09-06 2020-01-17 平安科技(深圳)有限公司 知识图谱链接错误的查修方法、装置及存储介质
CN110727804A (zh) * 2019-10-11 2020-01-24 北京明略软件***有限公司 利用知识图谱处理维修案例的方法、装置及电子设备
CN111275277A (zh) * 2018-12-05 2020-06-12 北京国双科技有限公司 行政要素结构的监测方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150379414A1 (en) * 2014-06-27 2015-12-31 Nuance Communications, Inc. Utilizing large-scale knowledge graphs to support inference at scale and explanation generation
CN110019824A (zh) * 2017-07-20 2019-07-16 苏州狗尾草智能科技有限公司 基于知识图谱的人机交互方法、装置及***
CN111275277A (zh) * 2018-12-05 2020-06-12 北京国双科技有限公司 行政要素结构的监测方法及装置
CN110704634A (zh) * 2019-09-06 2020-01-17 平安科技(深圳)有限公司 知识图谱链接错误的查修方法、装置及存储介质
CN110704635A (zh) * 2019-09-16 2020-01-17 金色熊猫有限公司 一种知识图谱中三元组数据的转换方法及装置
CN110727804A (zh) * 2019-10-11 2020-01-24 北京明略软件***有限公司 利用知识图谱处理维修案例的方法、装置及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113408738A (zh) * 2021-05-17 2021-09-17 桂林电子科技大学 一种基于强化学习设计伦理智能体的方法
WO2024027071A1 (zh) * 2022-08-01 2024-02-08 中电科大数据研究院有限公司 一种数据监控方法及***

Also Published As

Publication number Publication date
CN111858236B (zh) 2022-12-16

Similar Documents

Publication Publication Date Title
CN113434485B (zh) 一种基于多维分析技术的数据质量健康度分析方法及***
CN108628748B (zh) 自动化测试管理方法和自动化测试管理***
CN111061733B (zh) 数据处理方法、装置、电子设备和计算机可读存储介质
CN111858236B (zh) 知识图谱监控方法、装置、计算机设备及存储介质
CN111400288A (zh) 数据质量检查方法及***
CN112836018A (zh) 应急预案的处理方法及装置
CN112416778A (zh) 测试用例推荐方法、装置和电子设备
CN111897806A (zh) 大数据离线数据质量检查方法及装置
CN114840519A (zh) 一种数据打标签的方法、设备及存储介质
CN116823464A (zh) 数据资产管理平台、电子设备及计算机可读存储介质
CN114722789B (zh) 数据报表集成方法、装置、电子设备及存储介质
CN113791980B (zh) 测试用例的转化分析方法、装置、设备及存储介质
CN114492324A (zh) 组件数据统计方法及装置
CN116010349B (zh) 基于元数据的数据检核方法和装置、电子设备和存储介质
CN111143322A (zh) 一种数据标准治理***及方法
CN115185923B (zh) 一种气象观测元数据管理的方法、***和智能终端
CN110019109B (zh) 用于处理数据仓库数据的方法及装置
CN113190805B (zh) 一种代码资产管理***
CN118051557A (zh) 基于图像化显示技术的空间数据呈现方法及***
CN117573653A (zh) 数据字典的生成方法、装置、设备及存储介质
CN118069627A (zh) 基于数据清洗技术的空间数据开发方法及***
CN117493324A (zh) 基于数据质量的人力资源信息检测方法和检测***
CN117909392A (zh) 一种智能化数据资产盘点的方法和***
CN117236881A (zh) 一种文档交付物自动流转***、方法及电子设备
CN111582754A (zh) 风险排查方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 518109, 1st Floor, Building B3, Foxconn Industrial Park, No. 2 East Ring 2nd Road, Fukang Community, Longhua Street, Longhua District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen Fulian Jingjiang Technology Co.,Ltd.

Address before: 518109 Zone A and Zone 1 of Foxconn Science Park Zone D1 Plastic Mould Factory, No.2 East Ring Road, Longhua Street, Longhua District, Shenzhen City, Guangdong Province

Patentee before: SHENZHEN JINGJIANG YUNCHUANG TECHNOLOGY Co.,Ltd.