CN110503236A - 基于知识图谱的风险预测方法、装置、设备以及存储介质 - Google Patents

基于知识图谱的风险预测方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN110503236A
CN110503236A CN201910609954.5A CN201910609954A CN110503236A CN 110503236 A CN110503236 A CN 110503236A CN 201910609954 A CN201910609954 A CN 201910609954A CN 110503236 A CN110503236 A CN 110503236A
Authority
CN
China
Prior art keywords
entity
knowledge
map
information
company
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910609954.5A
Other languages
English (en)
Inventor
曹红姣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201910609954.5A priority Critical patent/CN110503236A/zh
Publication of CN110503236A publication Critical patent/CN110503236A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/027Frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Accounting & Taxation (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Databases & Information Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种基于知识图谱的风险预测方法、装置、设备以及存储介质,所述方法包括:从前端服务器中采集用于构建企业知识图谱的数据;在采集的数据中提取实体、实体的属性信息以及各实体之间的关系信息;根据所提取实体、实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;获取企业当前的风险因子,并将风险因子导入企业知识图谱中;基于企业知识图谱,计算风险因子与企业知识图谱中每一实体之间的相关性值,若存在实体与风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。本发明提供基于知识图谱的风险预测方法,能够为客户提供高效的风险实体查询,以及更准确、便捷地风险预测方法。

Description

基于知识图谱的风险预测方法、装置、设备以及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于知识图谱的风险预测方法、装置、设备以及存储介质。
背景技术
目前,在投资行业的风控领域上,并没有较好的知识图谱把控风险因子,导致客户投资期间风险的把控能力差,无法准确地判断企业中存在的风险实体,并且目前外购的风险把控数据库虽然数据很多、种类也很多,但是企业风险实体的查询效率低下,无法为客户提供便捷的风险预测方法。
发明内容
有鉴于此,本发明实施例提供一种基于知识图谱的风险预测方法、装置、设备以及存储介质,能够为客户提供高效的风险实体查询,以及更准确、便捷地风险预测方法。
一方面,本发明实施例提供了一种基于知识图谱的风险预测方法,该方法包括:
从前端服务器中采集用于构建企业知识图谱的数据;
在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息;
根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;
获取企业当前的风险因子,并将所述风险因子导入所述企业知识图谱中;
基于所述企业知识图谱,计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,若存在实体与所述风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。
另一方面,本发明实施例提供了一种基于知识图谱的风险预测装置,所述装置包括:
采集单元,用于从前端服务器中采集用于构建企业知识图谱的数据;
提取单元,用于在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息;
构建单元,用于根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;
获取导入单元,用于获取企业当前的风险因子,并将所述风险因子导入所述企业知识图谱中;
风险实体显示单元,用于基于所述企业知识图谱,计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,若存在实体与所述风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。
又一方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的基于知识图谱的风险预测方法。
再一方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序可被一个或者一个以上的处理器执行,以实现如上所述的基于知识图谱的风险预测方法。
本发明实施例提供一种基于知识图谱的风险预测方法、装置、计算机设备以及存储介质,其中方法包括:从前端服务器中采集用于构建企业知识图谱的数据;在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息;根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;获取企业当前的风险因子,并将所述风险因子导入所述企业知识图谱中;基于所述企业知识图谱,计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,若存在实体与所述风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。本发明提供一种基于知识图谱的风险预测方法,能够为客户提供高效的风险实体查询,以及更准确、便捷地风险预测方法。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于知识图谱的风险预测方法的应用场景示意图;
图2是本发明实施例提供的一种基于知识图谱的风险预测方法的示意流程图;
图3是本发明实施例提供的一种基于知识图谱的风险预测方法的另一示意流程图;
图4是本发明实施例提供的一种基于知识图谱的风险预测方法的另一示意流程图;
图5是本发明实施例提供的一种基于知识图谱的风险预测装置的示意性框图;
图6是本发明实施例提供的一种基于知识图谱的风险预测装置的另一示意性框图;
图7是本发明实施例提供的一种基于知识图谱的风险预测装置的另一示意性框图;
图8是本发明实施例提供的一种基于知识图谱的风险预测装置的另一示意性框图;
图9是本发明实施例提供的一种计算机设备的结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的一种基于知识图谱的风险预测方法的应用场景示意图,图2为本发明实施例提供的一种基于知识图谱的风险预测方法的流程示意图。该基于知识图谱的风险预测方法应用于服务器或终端中,其中终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。作为一应用,如图1所示,该基于知识图谱的风险预测方法应用于服务器10中,该服务器10可以为分布式服务平台中的一台服务器,该服务器10执行数据处理指令,并将执行结果反馈在终端20中。
需要说明的是,图1中仅仅示意出一台终端20,在实际操作过程中,服务器10可以将执行结果反馈至多台终端20中。
请参阅图2,图2为本发明实施例提供的一种基于知识图谱的风险预测方法的示意流程图。如图2所示,该方法包括以下步骤S101~S105。
S101,从前端服务器中采集用于构建企业知识图谱的数据。
在本发明实施例中,知识图谱是一种图结构的知识库,可以将不同来源、不同类型、不同结构的知识单元通过链接关联成图,基于各学科的元数据,为用户提供更广度、更深度的知识体系并不断扩充。其本质上是将领域知识数据体系化、关系化,并以图的方式将知识可视化。简单来说,知识图谱是基于信息***建立的知识体系,通过数据采集、数据挖掘、信息处理、图形绘制等技术对元数据进行展示。所述前端服务器为Web服务器,所述从前端服务器中采集用于构建企业知识图谱的数据,具体为:从Web服务器中采集用于构建企业知识图谱的数据,其中,该数据包括各种企业的基于信息,例如:注册资本、财务信息、各类新闻舆情、法律判决文书、工商信息等等。
S102,在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息。
在本发明实施例中,需要对采集的数据提取出实体、实体的属性信息以及各实体之间的关系信息,用户通过Web服务器采集的数据中一般包括注册资本、财务信息、各类新闻舆情、法律判决文书、工商信息,其中,财务信息包括财务支出、财务收入等,各类新闻舆情包括经营异常、行政处理、严重违法、欠税公告等,法律判决文书包括法律诉讼、法律公告、失信人、被执行人、开庭公告等,工商信息包括股票行情、参股控股、上市公告、十大股东、股权结构、股本变动、分红情况等。将采集的数据中的注册资本、财务支出、财务收入、经营异常、行政处理、严重违法、欠税公告、法律诉讼、法律公告、失信人、被执行人、开庭公告、股票行情、参股控股、上市公告、十大股东、股权结构、股本变动、分红情况都可视为实体,将各实体的具体内容视为实体的属性信息,将各实体之间的关联关系视为各实体之间的关系信息;并将提取出的实体、所述实体的属性信息以及各实体之间的关系信息采用RDF(Resource Description Framework)三元组存储格式进行存储,例如,可将提取的各实体、实体的属性信息以及各实体之间的关系信息以稀疏矩阵的形式进行存储,从而将构建企业知识图谱的数据由繁化简,以提供更直观的参考内容。
S103,根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱。
在本发明实施例中,在提取实体、实体的属性信息以及各实体之间的关系信息之后,就可以根据所提取的信息构建企业知识图谱。
其中,企业知识图谱包括并表图谱以及广义图谱,并表图谱可以查看企业的上三代、下三代子公司列表(名称、持股占比等数据),主要是查看企业的组成结构,及企业的骨架组成。广义图谱:主要从参控股、担保关系、主要客户、竞争对手、高管、股东、热词、法律诉讼8个维度展开,对企业的信息全面掌控。
具体的,并表图谱以及广义图谱的逻辑结构分为两个层次,分别为数据层和模式层;对于数据层,知识以事实(fact)为单位存储在图数据库。如果以[实体-关系-实体]或者[实体-属性-值]三元组作为事实的基本表达方式,则存储在图数据库中的所有数据将构成庞大的实体关系网络,形成企业知识图谱。模式层在数据层之上,是知识图谱的核心,在模式层存储的是经过提炼的知识,通常采用本体库来管理知识图谱的模式层,借助本体库对公理、规则和约束条件的支持能力来规范实体、关系以及实体的类型和属性等对象之间的联系。本体库在知识图谱中的地位相当于知识库的模具,拥有本体库的知识库冗余知识较少。
进一步地,如图3所示,所述步骤S103包括步骤S201~S202。
S201,对所提取的实体、所述实体的属性信息以及各实体之间的关系信息进行知识抓取和实体链接,得到知识图谱信息。
在本发明实施例中,从实体、实体的属性信息以及各实体之间的关系信息中进行知识抓取和实体链接,并加入到结构化知识库中,以构建知识图谱。
具体的,对所提取的实体、所述实体的属性信息以及各实体之间的关系信息进行知识抓取,即从实体、所述实体的属性信息以及各实体之间的关系信息中抓取出实体、属性以及实体之间的关联关系;然后,对所抓取的知识进行实体连接,即对知识进行整合,形成各实体之间有关系的知识图谱信息。
S202,将所述知识图谱信息存储到结构化知识库中,形成所述企业知识图谱。
具体的,对整合后得到的知识图谱信息加入到结构化知识库中,利用知识库的知识推理进行知识图谱演示,从而得到企业知识图谱。
再进一步地,如图4所示,所述步骤S103还包括以下步骤S301~S302。
S301,将存储的包括所述实体、所述实体的属性信息以及各实体之间的关系信息的RDF三元组转化为图数据。
S302,将所述图数据存储到结构化知识库中,形成所述企业知识图谱。
具体的,将存储的包括实体、实体的属性信息以及各实体之间的关系信息的RDF(Resource Description Framework)三元组转化为图数据,其中,图数据作为非关系型数据存储的形式,更有利于实体数据的扩充,并且更为直观;在实际应用中,本实施例可以采用编程的方式将实体、实体的属性信息以及各实体之间的关系信息的RDF三元组进行编程从而转化为图数据,然后,对转化的图数据进行整合,形成各实体之间有关系的企业知识图谱。
S104,获取企业当前的风险因子,并将所述风险因子导入所述企业知识图谱中。
在本发明实施例中,通过终端上传企业当前的风险因子,其中,所述风险因子一般包括撤资信息(撤资金额、转让股权等)、企业退市、宣布破产等风险数据都可视为风险因子。并将所述风险因子导入所述企业知识图谱中。
S105,基于所述企业知识图谱,计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,若存在实体与所述风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。
在本发明实施例中,使用皮尔森相关系数法计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值。具体的,可以通过皮尔森相关系数法计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,并所计算的相关性值与预设阈值进行比较,从而确定出企业中自身存在的风险实体并进行显示。在具体实施过程中,为了更准确地从选择出企业中的风险实体,本实施例可以预先设置一个预定阈值,当计算的相关性值的绝对值大于所预设的阈值时,则确定对应的实体为风险实体,最后将确定出的企业中自身存在风险的实体并进行显示。
需要说明的是,将确定出的企业中自身存在风险的实体进行显示,具体为以推送消息的形式在当前显示界面中显示所述风险实体,即将所述风险实体对应的文字信息以推送消息的形式显示在当前显示界面中,其中,若存在多个风险实体时,则以推送消息的形式在当前显示界面的显示方式可以按照一栏一栏的方式进行显示,一个推送消息占用一个推送消息显示栏,也可以按照推送消息的推送顺序进行显示。
更具体地,在本步骤中,使用以下公式一计算当前风险因子与实体之间的相关性大小:
公式一:其中,ρX,Y表示风险因子X、实体Y之间的相关性值,E是数学期望,cov表示协议差,σ表示样本标准差,相关性值ρX,Y的取值范围在-1到1之间;需要说明的是:正值表示风险因子与实体之间存在正相关关系,负值表示两个股票因子之间存在负相关关系。
由以上可见,本发明实施例通过从前端服务器中采集用于构建企业知识图谱的数据;在采集的数据中提取实体、实体的属性信息以及各实体之间的关系信息;根据所提取实体、实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;获取企业当前的风险因子,并将风险因子导入企业知识图谱中;基于企业知识图谱,计算风险因子与企业知识图谱中每一实体之间的相关性值,若存在实体与风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。本发明提供基于知识图谱的风险预测方法,能够为客户提供高效的风险实体查询,以及更准确、便捷地风险预测方法。
请参阅图5,对应上述一种基于知识图谱的风险预测方法,本发明实施例还提出一种基于知识图谱的风险预测装置,该装置100包括:采集单元101、提取单元102、构建单元103、获取导入单元104、风险实体显示单元105。
其中,采集单元101,用于从前端服务器中采集用于构建企业知识图谱的数据;
提取单元102,用于在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息;
构建单元103,用于根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;
获取导入单元104,用于获取企业当前的风险因子,并将所述风险因子导入所述企业知识图谱中;
风险实体显示单元105,用于基于所述企业知识图谱,计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,若存在实体与所述风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。
由以上可见,本发明实施例通过从前端服务器中采集用于构建企业知识图谱的数据;在采集的数据中提取实体、实体的属性信息以及各实体之间的关系信息;根据所提取实体、实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;获取企业当前的风险因子,并将风险因子导入企业知识图谱中;基于企业知识图谱,计算风险因子与企业知识图谱中每一实体之间的相关性值,若存在实体与风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。本发明提供基于知识图谱的风险预测方法,能够为客户提供高效的风险实体查询,以及更准确、便捷地风险预测方法。
请参阅图6,所述提取单元102,包括:
提取子单元102a,用于在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息,并将提取出的各实体、各实体的属性信息以及各实体之间的关系信息采用RDF三元组存储格式进行存储。
请参阅图7,所述构建单元103,包括:
抓取链接单元103a,用于对所提取的实体、所述实体的属性信息以及各实体之间的关系信息进行知识抓取和实体链接,得到知识图谱信息;
企业知识图谱形成单元103b,用于将所述知识图谱信息存储到结构化知识库中,形成所述企业知识图谱。
请参阅图8,所述构建单元103,包括:
转化单元103c,用于将存储的包括所述实体、所述实体的属性信息以及各实体之间的关系信息的RDF三元组转化为图数据;
形成单元103d,将所述图数据存储到结构化知识库中,形成所述企业知识图谱。
上述基于知识图谱的风险预测装置与上述基于知识图谱的风险预测方法一一对应,其具体的原理和过程与上述实施例所述方法相同,不再赘述。
上述基于知识图谱的风险预测装置可以实现为一种计算机程序的形式,计算机程序可以在如图9所示的计算机设备上运行。
图9为本发明一种计算机设备的结构组成示意图。该设备可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式装置等具有通信功能和语音输入功能的电子装置。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。参照图9,该计算机设备500包括通过***总线501连接的处理器502、非易失性存储介质503、内存储器504和网络接口505。其中,该计算机设备500的非易失性存储介质503可存储操作***5031和计算机程序5032,该计算机程序5032被执行时,可使得处理器502执行一种基于知识图谱的风险预测方法。该计算机设备500的处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序被处理器执行时,可使得处理器502执行一种基于知识图谱的风险预测方法。计算机设备500的网络接口505用于进行网络通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502执行所述计算机程序时实现如下操作:
从前端服务器中采集用于构建企业知识图谱的数据;
在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息;
根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;
获取企业当前的风险因子,并将所述风险因子导入所述企业知识图谱中;
基于所述企业知识图谱,计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,若存在实体与所述风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。
在一个实施例中,所述在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息,包括:
在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息,并将提取出的各实体、各实体的属性信息以及各实体之间的关系信息采用RDF三元组存储格式进行存储。
在一个实施例中,所述根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱,包括:
对所提取的实体、所述实体的属性信息以及各实体之间的关系信息进行知识抓取和实体链接,得到知识图谱信息;
将所述知识图谱信息存储到结构化知识库中,形成所述企业知识图谱。
在一个实施例中,所述根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱,包括:
将存储的包括所述实体、所述实体的属性信息以及各实体之间的关系信息的RDF三元组转化为图数据;
将所述图数据存储到结构化知识库中,形成所述企业知识图谱。
在一个实施例中,所述计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,包括:
使用皮尔森相关系数法计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值。
本领域技术人员可以理解,图9中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图9所示实施例一致,在此不再赘述。
本发明提供了一种计算机可读存储介质,计算机可读存储介质存储有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序可被一个或者一个以上的处理器执行,以实现以下步骤:
从前端服务器中采集用于构建企业知识图谱的数据;
在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息;
根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;
获取企业当前的风险因子,并将所述风险因子导入所述企业知识图谱中;
基于所述企业知识图谱,计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,若存在实体与所述风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。
在一个实施例中,所述在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息,包括:
在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息,并将提取出的各实体、各实体的属性信息以及各实体之间的关系信息采用RDF三元组存储格式进行存储。
在一个实施例中,所述根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱,包括:
对所提取的实体、所述实体的属性信息以及各实体之间的关系信息进行知识抓取和实体链接,得到知识图谱信息;
将所述知识图谱信息存储到结构化知识库中,形成所述企业知识图谱。
在一个实施例中,所述根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱,包括:
将存储的包括所述实体、所述实体的属性信息以及各实体之间的关系信息的RDF三元组转化为图数据;
将所述图数据存储到结构化知识库中,形成所述企业知识图谱。
在一个实施例中,所述计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,包括:
使用皮尔森相关系数法计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值。
本发明前述的存储介质包括:磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等各种可以存储程序代码的介质。
本发明所有实施例中的单元可以通过通用集成电路,例如CPU(CentralProcessing Unit,中央处理器),或通过ASIC(Application Specific IntegratedCircuit,专用集成电路)来实现。
本发明实施例基于知识图谱的风险预测方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例基于知识图谱的风险预测装置中的单元可以根据实际需要进行合并、划分和删减。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于知识图谱的风险预测方法,其特征在于,所述方法包括:
从前端服务器中采集用于构建企业知识图谱的数据;
在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息;
根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;
获取企业当前的风险因子,并将所述风险因子导入所述企业知识图谱中;
基于所述企业知识图谱,计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,若存在实体与所述风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。
2.如权利要求1所述的方法,其特征在于,所述在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息,包括:
在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息,并将提取出的各实体、各实体的属性信息以及各实体之间的关系信息采用RDF三元组存储格式进行存储。
3.如权利要求1所述的方法,其特征在于,所述根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱,包括:
对所提取的实体、所述实体的属性信息以及各实体之间的关系信息进行知识抓取和实体链接,得到知识图谱信息;
将所述知识图谱信息存储到结构化知识库中,形成所述企业知识图谱。
4.如权利要求2所述的方法,其特征在于,所述根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱,包括:
将存储的包括所述实体、所述实体的属性信息以及各实体之间的关系信息的RDF三元组转化为图数据;
将所述图数据存储到结构化知识库中,形成所述企业知识图谱。
5.如权利要求1所述的方法,其特征在于,所述计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,包括:
使用皮尔森相关系数法计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值。
6.一种基于知识图谱的风险预测装置,其特征在于,所述装置包括:
采集单元,用于从前端服务器中采集用于构建企业知识图谱的数据;
提取单元,用于在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息;
构建单元,用于根据所提取实体、所述实体的属性信息以及各实体之间的关系信息,构建企业知识图谱;
获取导入单元,用于获取企业当前的风险因子,并将所述风险因子导入所述企业知识图谱中;
风险实体显示单元,用于基于所述企业知识图谱,计算所述风险因子与所述企业知识图谱中每一实体之间的相关性值,若存在实体与所述风险因子之间的相关性值大于预设阈值,确定出企业中自身存在风险的实体并进行显示。
7.如权利要求6所述的装置,其特征在于,所述提取单元,包括:
提取子单元,用于在采集的所述数据中提取实体、所述实体的属性信息以及各实体之间的关系信息,并将提取出的各实体、各实体的属性信息以及各实体之间的关系信息采用RDF三元组存储格式进行存储。
8.如权利要求6所述的装置,其特征在于,所述构建单元,包括:
抓取链接单元,用于对所提取的实体、所述实体的属性信息以及各实体之间的关系信息进行知识抓取和实体链接,得到知识图谱信息;
企业知识图谱形成单元,用于将所述知识图谱信息存储到结构化知识库中,形成所述企业知识图谱。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-5任一项所述的基于知识图谱的风险预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序可被一个或者一个以上的处理器执行,以实现如权利要求1-5任一项所述的基于知识图谱的风险预测方法。
CN201910609954.5A 2019-07-08 2019-07-08 基于知识图谱的风险预测方法、装置、设备以及存储介质 Pending CN110503236A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910609954.5A CN110503236A (zh) 2019-07-08 2019-07-08 基于知识图谱的风险预测方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910609954.5A CN110503236A (zh) 2019-07-08 2019-07-08 基于知识图谱的风险预测方法、装置、设备以及存储介质

Publications (1)

Publication Number Publication Date
CN110503236A true CN110503236A (zh) 2019-11-26

Family

ID=68585478

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910609954.5A Pending CN110503236A (zh) 2019-07-08 2019-07-08 基于知识图谱的风险预测方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN110503236A (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889556A (zh) * 2019-11-28 2020-03-17 福建亿榕信息技术有限公司 一种企业经营风险预测方法和***
CN111027832A (zh) * 2019-11-28 2020-04-17 卓尔智联(武汉)研究院有限公司 一种税务风险确定方法、装置及存储介质
CN111191853A (zh) * 2020-01-06 2020-05-22 支付宝(杭州)信息技术有限公司 风险预测方法及装置、风险查询方法及装置
CN111309824A (zh) * 2020-02-18 2020-06-19 中国工商银行股份有限公司 实体关系图谱显示方法及***
CN111861281A (zh) * 2020-08-05 2020-10-30 中国银行股份有限公司 基于知识图谱的风险员工发现方法及装置
CN111951079A (zh) * 2020-08-14 2020-11-17 国网电子商务有限公司 一种基于知识图谱的信用评级方法、装置及电子设备
CN111967976A (zh) * 2020-08-19 2020-11-20 中国银行股份有限公司 基于知识图谱的风险企业确定方法及装置
CN112015909A (zh) * 2020-08-19 2020-12-01 普洛斯科技(重庆)有限公司 知识图谱的构建方法及装置、电子设备、存储介质
CN112200382A (zh) * 2020-10-27 2021-01-08 支付宝(杭州)信息技术有限公司 一种风险预测模型的训练方法和装置
CN112215711A (zh) * 2020-10-13 2021-01-12 中国银行股份有限公司 产品风险评估方法及装置
CN112598507A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 基于知识图谱的过度授信风险预测***和方法
CN112613763A (zh) * 2020-12-25 2021-04-06 北京知因智慧科技有限公司 数据传导方法及装置
CN112699249A (zh) * 2020-12-31 2021-04-23 上海浦东发展银行股份有限公司 基于知识图谱的信息处理方法、装置、设备及存储介质
CN112927082A (zh) * 2021-03-22 2021-06-08 中国工商银行股份有限公司 信用风险的预测方法、装置、设备、介质和程序产品
CN112926855A (zh) * 2021-02-24 2021-06-08 北京通付盾人工智能技术有限公司 一种基于知识图谱的营销活动风险控制***及方法
CN112966924A (zh) * 2021-03-02 2021-06-15 杭州全视软件有限公司 一种基于风险图谱的数据治理***及方法
CN113449046A (zh) * 2021-06-29 2021-09-28 平安资产管理有限责任公司 基于企业知识图谱的模型训练方法、***及相关装置
CN113590835A (zh) * 2021-07-28 2021-11-02 上海致景信息科技有限公司 纺织行业数据的知识图谱构建方法、装置及处理器
CN113989019A (zh) * 2021-10-27 2022-01-28 平安银行股份有限公司 识别风险的方法、装置、设备及存储介质
CN114022058A (zh) * 2022-01-06 2022-02-08 成都晓多科技有限公司 基于时序知识图谱的中小企业失信风险预测方法
CN114168757A (zh) * 2022-02-11 2022-03-11 子长科技(北京)有限公司 公司事件风险预测方法、装置、存储介质及电子设备
CN115081918A (zh) * 2022-07-07 2022-09-20 北京交通大学 基于数据驱动的轨道交通风险点预测方法及***
CN115269879A (zh) * 2022-09-05 2022-11-01 北京百度网讯科技有限公司 知识结构数据的生成方法、数据搜索方法和风险告警方法
CN116010467A (zh) * 2023-01-10 2023-04-25 北京天融信网络安全技术有限公司 基于通联图谱的风险发现方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107945024A (zh) * 2017-12-12 2018-04-20 厦门市美亚柏科信息股份有限公司 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
CN108596439A (zh) * 2018-03-29 2018-09-28 北京中兴通网络科技股份有限公司 一种基于知识图谱的企业风险预测方法及***
CN109064318A (zh) * 2018-08-24 2018-12-21 苏宁消费金融有限公司 一种基于知识图谱的互联网金融风险监测***
CN109345399A (zh) * 2018-10-23 2019-02-15 平安科技(深圳)有限公司 理赔风险评估方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107945024A (zh) * 2017-12-12 2018-04-20 厦门市美亚柏科信息股份有限公司 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
CN108596439A (zh) * 2018-03-29 2018-09-28 北京中兴通网络科技股份有限公司 一种基于知识图谱的企业风险预测方法及***
CN109064318A (zh) * 2018-08-24 2018-12-21 苏宁消费金融有限公司 一种基于知识图谱的互联网金融风险监测***
CN109345399A (zh) * 2018-10-23 2019-02-15 平安科技(深圳)有限公司 理赔风险评估方法、装置、计算机设备及存储介质

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889556A (zh) * 2019-11-28 2020-03-17 福建亿榕信息技术有限公司 一种企业经营风险预测方法和***
CN111027832A (zh) * 2019-11-28 2020-04-17 卓尔智联(武汉)研究院有限公司 一种税务风险确定方法、装置及存储介质
CN111191853A (zh) * 2020-01-06 2020-05-22 支付宝(杭州)信息技术有限公司 风险预测方法及装置、风险查询方法及装置
CN111191853B (zh) * 2020-01-06 2022-07-15 支付宝(杭州)信息技术有限公司 风险预测方法及装置、风险查询方法及装置
CN111309824A (zh) * 2020-02-18 2020-06-19 中国工商银行股份有限公司 实体关系图谱显示方法及***
CN111309824B (zh) * 2020-02-18 2023-09-15 中国工商银行股份有限公司 实体关系图谱显示方法及***
CN111861281A (zh) * 2020-08-05 2020-10-30 中国银行股份有限公司 基于知识图谱的风险员工发现方法及装置
CN111951079A (zh) * 2020-08-14 2020-11-17 国网电子商务有限公司 一种基于知识图谱的信用评级方法、装置及电子设备
CN111951079B (zh) * 2020-08-14 2024-04-02 国网数字科技控股有限公司 一种基于知识图谱的信用评级方法、装置及电子设备
CN111967976B (zh) * 2020-08-19 2024-04-16 中国银行股份有限公司 基于知识图谱的风险企业确定方法及装置
CN112015909B (zh) * 2020-08-19 2024-04-30 普洛斯科技(重庆)有限公司 知识图谱的构建方法及装置、电子设备、存储介质
CN111967976A (zh) * 2020-08-19 2020-11-20 中国银行股份有限公司 基于知识图谱的风险企业确定方法及装置
CN112015909A (zh) * 2020-08-19 2020-12-01 普洛斯科技(重庆)有限公司 知识图谱的构建方法及装置、电子设备、存储介质
CN112215711B (zh) * 2020-10-13 2023-09-19 中国银行股份有限公司 产品风险评估方法及装置
CN112215711A (zh) * 2020-10-13 2021-01-12 中国银行股份有限公司 产品风险评估方法及装置
CN112200382A (zh) * 2020-10-27 2021-01-08 支付宝(杭州)信息技术有限公司 一种风险预测模型的训练方法和装置
CN112200382B (zh) * 2020-10-27 2022-11-22 支付宝(杭州)信息技术有限公司 一种风险预测模型的训练方法和装置
CN112613763B (zh) * 2020-12-25 2024-04-16 北京知因智慧科技有限公司 数据传导方法及装置
CN112598507A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 基于知识图谱的过度授信风险预测***和方法
CN112613763A (zh) * 2020-12-25 2021-04-06 北京知因智慧科技有限公司 数据传导方法及装置
CN112699249A (zh) * 2020-12-31 2021-04-23 上海浦东发展银行股份有限公司 基于知识图谱的信息处理方法、装置、设备及存储介质
CN112926855A (zh) * 2021-02-24 2021-06-08 北京通付盾人工智能技术有限公司 一种基于知识图谱的营销活动风险控制***及方法
CN112966924A (zh) * 2021-03-02 2021-06-15 杭州全视软件有限公司 一种基于风险图谱的数据治理***及方法
CN112927082A (zh) * 2021-03-22 2021-06-08 中国工商银行股份有限公司 信用风险的预测方法、装置、设备、介质和程序产品
CN113449046A (zh) * 2021-06-29 2021-09-28 平安资产管理有限责任公司 基于企业知识图谱的模型训练方法、***及相关装置
CN113590835A (zh) * 2021-07-28 2021-11-02 上海致景信息科技有限公司 纺织行业数据的知识图谱构建方法、装置及处理器
CN113989019A (zh) * 2021-10-27 2022-01-28 平安银行股份有限公司 识别风险的方法、装置、设备及存储介质
CN114022058A (zh) * 2022-01-06 2022-02-08 成都晓多科技有限公司 基于时序知识图谱的中小企业失信风险预测方法
CN114168757B (zh) * 2022-02-11 2022-04-29 子长科技(北京)有限公司 公司事件风险预测方法、装置、存储介质及电子设备
CN114168757A (zh) * 2022-02-11 2022-03-11 子长科技(北京)有限公司 公司事件风险预测方法、装置、存储介质及电子设备
CN115081918A (zh) * 2022-07-07 2022-09-20 北京交通大学 基于数据驱动的轨道交通风险点预测方法及***
CN115269879A (zh) * 2022-09-05 2022-11-01 北京百度网讯科技有限公司 知识结构数据的生成方法、数据搜索方法和风险告警方法
CN116010467A (zh) * 2023-01-10 2023-04-25 北京天融信网络安全技术有限公司 基于通联图谱的风险发现方法、装置、设备及存储介质
CN116010467B (zh) * 2023-01-10 2024-02-02 北京天融信网络安全技术有限公司 基于通联图谱的风险发现方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110503236A (zh) 基于知识图谱的风险预测方法、装置、设备以及存储介质
Sietsma et al. Progress in climate change adaptation research
WO2017211051A1 (zh) 目标对象的社交账号挖掘方法、服务器和存储介质
Khoo-Lattimore et al. Assessing gender representation in knowledge production: A critical analysis of UNWTO’s planned events
Marshall et al. Advances in monitoring the human dimension of natural resource systems: an example from the Great Barrier Reef
Nasir et al. Information and communication technology-enabled modern services export performances of Asian economies
CN101588392A (zh) 信息处理设备、信息处理方法以及程序
CN104008182B (zh) 社交网络交流影响力的测定方法及***
Derudder et al. The connectivity of South Asian cities in infrastructure networks
Kumar et al. International research collaborations of ASEAN Nations in economics, 1979–2010
Mooney et al. Can Volunteered Geographic Information be a participant in eEnvironment and SDI?
CN114186694A (zh) 一种高效安全,低通信的纵向联邦学习方法
Ponzoa et al. EU27 and USA institutions in the digital ecosystem: Proposal for a digital presence measurement index
Hidayat et al. Data-driven journalism based on big data analytics: A model development from Indonesia’s experience
CN105247501B (zh) 处理日历应用的输入流的***和方法
Shin et al. The urbanising dynamics of global China: Speculation, articulation, and translation in global capitalism
JP7176188B2 (ja) 情報生成システム、情報生成方法、情報処理装置、プログラム
Wachowicz et al. Developing a streaming data processing workflow for querying space–time activities from geotagged tweets
Wang [Retracted] Subjective Employment Obstacle of College Students and Its Predictor Model Based on Deep Learning
Markolf et al. The implications of scope and boundary choice on the establishment and success of metropolitan greenhouse gas reduction targets in the United States
Jansen İnternational media and cultural flows: A critical political economy of media organisations in the 21st century, a case of the Reuters news agency
Grein et al. A dynamic analysis of country clusters, the role of corruption, and implications for global firms
Kruse On sustainability in regional innovation studies and smart specialisation
Sievert First Tests of the Dashboard in Europe: An Empirical Contribution to the Global Navigation of International Corporate Communications
Wei et al. Unfolding the complexity in water reallocation decision-making in the Heihe River Basin, China

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191126