CN114090752A - 一种问题线索发掘方法、装置、计算机设备及介质 - Google Patents
一种问题线索发掘方法、装置、计算机设备及介质 Download PDFInfo
- Publication number
- CN114090752A CN114090752A CN202111364231.7A CN202111364231A CN114090752A CN 114090752 A CN114090752 A CN 114090752A CN 202111364231 A CN202111364231 A CN 202111364231A CN 114090752 A CN114090752 A CN 114090752A
- Authority
- CN
- China
- Prior art keywords
- user
- knowledge graph
- node
- clues
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000005065 mining Methods 0.000 title claims abstract description 50
- 230000002159 abnormal effect Effects 0.000 claims description 21
- 238000010276 construction Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 206010000117 Abnormal behaviour Diseases 0.000 abstract description 12
- 238000011835 investigation Methods 0.000 abstract description 11
- 230000003993 interaction Effects 0.000 abstract description 5
- 230000000007 visual effect Effects 0.000 abstract description 5
- 238000009412 basement excavation Methods 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004900 laundering Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种问题线索发掘方法、装置、计算机设备及介质,涉及人工智能领域。该方法包括:获取用户关系知识图谱;基于用户关系知识图谱中节点之间的关联关系计算相应节点的特征值;根据特征值确定隐藏问题线索,显示隐藏问题线索。本发明实施例通过用户关系知识图谱进行问题线索发掘,提升问题线索发掘的智能化水平,实现全面、准确的发现潜在的问题线索;通过提供可视化的交互方式,展示并发掘人员异常行为问题线索,满足相关考察工作的实际业务需求。
Description
技术领域
本发明实施例涉及人工智能领域,尤其涉及一种问题线索发掘方法、装置、计算机设备及介质。
背景技术
在用户考察工作中,问题线索一般通过人工主观印象、信访和举报等方式发现,整体工作前置的效率不高,在发现问题后处置可能带来的风险损失相对难以控制。由于现有的问题线索发掘方案是基于人员的主观意识实现,信息来源较窄,对于复杂关系的信息难以发掘,无法全面、有效的挖掘出潜在的问题线索。
发明内容
本发明实施例提供一种问题线索发掘方法、装置、计算机设备及介质,可以提升问题线索发掘的智能化水平。
第一方面,本发明实施例提供了一种问题线索发掘方法,包括:
获取用户关系知识图谱;
基于用户关系知识图谱中节点之间的关联关系计算相应节点的特征值;
根据特征值确定隐藏问题线索,显示隐藏问题线索。
第二方面,本发明实施例还提供了一种问题线索发掘装置,该装置包括:
知识图谱获取模块,用于获取用户关系知识图谱;
特征值计算模块,用于基于用户关系知识图谱中节点之间的关联关系计算相应节点的特征值;
问题线索显示模块,用于根据特征值确定隐藏问题线索,显示隐藏问题线索。
第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如发明任意实施例所述的问题线索发掘方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明任意实施例所述的问题线索发掘方法。
第五方面,本发明实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本发明任意实施例所述的问题线索发掘方法。
本发明实施例提供一种问题线索发掘方案,通过基于用户关系知识图谱中节点之间的关联关系计算相应节点的特征值,再根据特征值确定隐藏问题线索,显示该隐藏问题线索。本发明实施例通过用户关系知识图谱进行问题线索发掘,提升问题线索发掘的智能化水平,实现全面、准确的发现潜在的问题线索;通过提供可视化的交互方式,展示并发掘人员异常行为问题线索,满足相关考察工作的实际业务需求。
附图说明
图1为本发明实施例提供的一种问题线索发掘方法的流程图;
图2为一种异常关系与异常问题线索的定义示意图;
图3为本发明实施例提供的另一种问题线索发掘方法的流程图;
图4为人与人之间关系的实体和关系宽表的结构示意图;
图5为表示人与其它类型实体关系的实体和关系宽表的结构示意图;
图6为一种用户关系知识图谱示意图;
图7为本发明实施例提供的又一种问题线索发掘方法的流程图;
图8为一种紧密中心性算法实例图;
图9为一种中介中心性算法实例图;
图10为本发明实施例提供的基于用户关系知识图谱的问题线索发掘流程图;
图11为本发明实施例提供的一种问题线索发掘装置的结构框图;
图12为本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
为了便于理解,对下文可能出现的词语进行解释。
数据湖是一个以原始格式存储数据的存储库或***,它按照原样存储数据,而无需事先对数据进行结构化处理。一个数据湖可以存储结构化数据、半结构化数据、非结构化数据和二进制数据等。
数据仓库是一个面向主题的、集成的、相对稳定的、反应历史变化的数据集合,用于支持管理决策。
数据集市,也叫数据市场,数据集市就是满足特定的部门或者用户需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。
数据血缘即数据的来龙去脉,主要包括数据的来源、数据的加工方式、映射关系以及数据出口。在数据的实际应用中,根据实际需要会对原始数据进行多个步骤的加工,最后产生出新的数据,在这个过程中会产生很多数据表,将这些数据表之间的链路关系称为数据血缘。
知识图谱是一种揭示实体之间关系的语义网络。知识图谱在逻辑结构上可分为模式层与数据层两个层次。数据层主要由一系列的知识组成,而知识以事实为单位进行存储。如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储介质。模式层构建在数据层之上,主要是通过本体库来规范数据层的一系列事实表达。本体是结构化知识库的概念模板,列出了实体的类型。连接它们的关系以及对实体和关系组合方式的限定。也可以理解为,在某种程度上,本体定义了实体在世界中如何连接的规则。
问题线索发掘的一般过程如下:
1)考察工作相关人员对信访和举报进行核实认证。
2)根据考察工作相关人员对于对象的主观印象进行问题线索甄别。
3)数据采集获取,对采集的数据进行数据ETL(数据抽取、转换和加载)处理,统一加载存储于企业数据湖和数据仓库中。
4)通过预定义规则建立人员问题线索分析库,随后应用于评价问题线索是否有效。
上述问题线索发掘方法是基于人员的主观意识进行问题线索甄别,信息来源较窄,对于复杂关系的信息难以发掘隐藏的问题线索,智能程度较低,准确性不高。
对于使用预定义规则难以发现隐藏的问题线索的情况,本发明实施例构建并使用用户关系知识图谱辅助进行隐藏问题线索的挖掘。
其中,用户关系知识图谱是从实际的业务流程及各项规章制度中提炼相关数据和管理要求,建立的人员异常行为问题线索发掘的知识图谱。由于用户考察管理是以人员为核心的管理流程,而人员往往涉及各种各样的复杂关系,知识图谱因其关系表达能力可以很好的结合到用户考察管理中。根据监管要求,对已有数据进行总结和抽象,提取出能够表达问题线索的实体和关系,基于实体和关系形成人员问题线索发掘管理的用户关系知识图谱。
具体地,基于对数据集市的财务报销、人力资源、差旅、信贷、存款、交易流水、采购、不动产、不良资产、风险评分、航旅、工商企业、内控合规、反洗钱、反欺诈、巡视等多维度的关键数据的采集、获取、加工、分析和挖掘,构建较为智能的用户关系知识图谱,助力提升问题线索发掘工作数字化、科学化和智能化管理。
需要说明的是,本发明技术方案中对于用户个人信息的采集、存储、使用和处理等操作遵循国家有关个人信息安全的相关法律法规。
图1为本发明实施例提供的一种问题线索发掘方法的流程图,本实施例可适用于人员异常行为问题监察的情况,该方法可以由问题线索发掘装置来执行,该装置可以由软件和/或硬件实现,并通过配置于计算机设备中。该方法包括:
步骤110、获取用户关系知识图谱。
示例性地,在需要进行人员异常问题线索监察时,获取预先基于数据集市中的数据构建的用户关系知识图谱。
步骤120、基于用户关系知识图谱中节点之间的关联关系计算相应节点的特征值。
其中,关联关系可以是某个节点对其它节点的影响程度。例如,关联关系包括一个节点到达其它节点的难易程度,以及一个节点担任其它两个节点之间最短路径的桥梁的次数的比重。
示例性地,计算用户关系知识图谱中各个节点与其它节点的距离平均值的倒数,将倒数作为对应节点的紧密中心性值;确定用户关系知识图谱中任意一个节点担任其它两个节点之间最短路径的桥梁的次数以及对应两个节点之间的最短路径数量,计算次数与最短路径数量的比值将计算结果作为对应节点的中介中心性值;关联存储节点的节点标识、紧密中心性值和中介中心性值。
可选地,可以通过数据表关联存储节点标识、对应节点的紧密中心性值和中介中心性值。还可以根据紧密中心性值和中介中心性值作为属性添加至三元组,以通过更新后的三元组生成用户关系知识图谱,以在用户关系知识图谱的节点中显示对应的紧密中心性值和中介中心性值。
步骤130、根据特征值确定隐藏问题线索,显示隐藏问题线索。
示例性地,比较各个节点的特征值与预设阈值,确定特征值大于预设阈值的目标节点;将目标节点以及与目标节点通过边连接的其它节点作为隐藏问题线索,显示隐藏问题线索。由于特征值不止一个,可以比对各个节点的紧密中心性值与预设紧密中心性阈值,得到第一比对结果;比对各个节点的中介中心性值与预设中介中心性阈值,得到第二比对结果。若第一比对结果和第二比对结果中至少一个是大于对应阈值,则确定该节点为特征值大于预设阈值的目标节点。将目标节点以及与目标节点有边连接的其它节点作为隐藏问题线索,即需要考察与目标节点存在联系的其它节点,以确定实体之间是否存在异常行为问题。
可选地,可以在显示用户关系知识图谱时,通过将目标节点与其它节点之间的边显示为预设颜色的方式提醒用户。还可以在显示用户关系知识图谱时,通过将目标节点与其它节点的边框显示为预设颜色的方式提醒用户。或者,还可以在显示用户关系知识图谱时,通过在目标节点与其它节点的边框内填充预设颜色的方式提醒用户。
可选地,在比较各个节点的特征值与预设阈值之前,还包括:根据节点标识查询预设数据表得到对应节点的特征值,其中,预设数据表中关联存储节点标识和特征值。例如,通过节点标识查询预设数据表得到对应节点的紧密中心性值和中介中心性值。
可选地,在比较各个节点的特征值与预设阈值之前,还包括:获取用户关系知识图谱中各个节点对应的特征值,其中,特征值显示于用户关系知识图谱的节点中。例如,通过节点标识查询对应节点的三元组数据得到紧密中心性值和中介中心性值。
本实施例的技术方案,通过基于用户关系知识图谱中节点之间的关联关系计算相应节点的特征值,再根据特征值确定隐藏问题线索,显示该隐藏问题线索。本发明实施例通过用户关系知识图谱进行问题线索发掘,提升问题线索发掘的智能化水平,实现全面、准确的发现潜在的问题线索;通过提供可视化的交互方式,展示并发掘人员异常行为问题线索,满足相关考察工作的实际业务需求。
在上述技术方案的基础上,在根据特征值确定隐藏问题线索之后,还可以包括如下附加技术特征:采用异常关系规则验证隐藏问题线索的有效性。其中,异常关系规则是根据监管要求从已有数据中总结得到的异常行为问题的判定规则。异常关系规则包括但不限于:利用本人账户或控制账户与对公信贷客户及其关联企业发生资金往来,或与对公信贷客户及其关联企业的高管人员个人账户发生资金往来;协助企业或个人套取银行贷款,再高息转贷他人;为信贷客户筹集还贷资金,用于“回收再贷”;是否与客户发生资金往来。
图2为一种异常关系与异常问题线索的定义示意图。图2以思维导图的方式展示了基于异常关系规则延伸出来的人员异常关系和异常问题线索的定义。对于员工关联违规事件,人员自身为异常事件的关联对象。比如,员工关联违规事件包括串通涉案、异常惩罚、不良贷款以及暂缓升职等等。对于违规关联,人员与异常事件的核心对象存在正常关系。比如,人员为串通投标核心对象的亲属、同事以及校友等。对于异常同手机号,在人员的正常行为推理中,不应该存在的关系。比如,在他人的***等账户信息中留存自己的手机号等。对于异常资金往来,短期内与同一交易对手频繁发生大额交易,疑似存在资金交易异常行为。
由于通过用户关系知识图谱发掘的隐藏的异常行为问题线索有时候可能是无效的线索,本发明实施例在根据特征值确定隐藏问题线索之后,采用预先定义的异常关系规则验证隐藏问题线索的有效性,可以排除掉无效地隐藏问题线索,减少需用户核实的隐藏问题线索的数据量,提高了隐藏问题线索核实效率。
在上述技术方案的基础上,在获取用户关系知识图谱之前,还包括构建用户关系知识图谱的附加技术特征。
图3为本发明实施例提供的另一种问题线索发掘方法的流程图,如图3所示,该方法包括:
步骤310、获取模型构建数据表和关系明细表。
其中,模型构建数据表用于存储构建知识图谱的实体信息,关系明细表用于存储实体与实体之间的关系。
示例性地,可以预先根据对数据源和数据血缘的分析,从已有数据湖和数据仓库中获取、加工可构建知识图谱的业务数据。可选地,业务数据可以是筛选出以人员为中心的数据,并整合成如表1所示的表示实体信息的模型构建数据表。
表1为一种模型构建数据表。
序号 | 表名 |
1 | 人员亲属与供应商串通标签表 |
2 | 人员亲属回避标签表 |
3 | 人员借记卡信息表 |
4 | 人员基本信息表 |
5 | 疑似串通报价标签溯源表 |
…… | …… |
其中,围绕人员的表达,实体类型包括人员、事件、机构、手机号、账户、设备等。更具体地,人员涵盖人员、客户、亲属等。事件主要有信息化记录中各类人员参与的违规事件。例如,暂缓升职、不良贷款、涉案等,人员可通过事件产生关系。机构主要涉及不同人员会产生关系的机构,比如工作机构、学校等。即在同一个工作机构的人员可能是同事。在同一个学校的人员可能是同学。手机号为用户的私有物品,在考察业务中,手机号为必要信息留存在各类事件中,私有手机可能会作为辅助工具登记到其他人名下,产生异常关联,因此也作为实体表示。账户可以包括唯一标识、***、账号和客户编号等。需要说明的是,实体类型并不限于上述列举的几种,如果在在实际业务运行过程中产生新类型的实体,可以将新类型实体的实体信息添加至模型构建数据表。
通过各类实体之间的关系进行挖掘构建如表2所示的表示实体与实体关系的关系明细表。
其中,实体与实体之间的关系包括人与人之间的关系、人与账户之间的关系、人与手机号之间的关系、人与事件之间的关系、人与机构之间的关系、账户与账户之间的关系、账户与手机号之间的关系、账户与事件之间的关系、账户与机构之间的关系、手机号与机构之间的关系以及事件与机构之间的关系。需要说明的是,实体与实体之间的关系并不限于上述列举的关系,如果在实际业务运行过程中产生新的关系类型,可以将新的关系类型纳入上述实体与实体关系的关系明细表。
步骤320、采用知识图谱生成工具基于模型构建数据表和关系明细表构建用户关系知识图谱。
示例性地,确定模型构建数据表包括的实体;根据关系明细表确定各实体之间的关系;根据实体和关系确定用于构建知识图谱的三元组,基于三元组构建用户关系知识图谱。
具体地,在通过模型构建数据表和关系明细表构建用户关系知识图谱之前,还需要基于上述两类数据表设计实体与关系宽表,以构建形成知识图谱的三元组。图4为人与人之间关系的实体和关系宽表的结构示意图。图5为表示人与其它类型实体关系的实体和关系宽表的结构示意图。可选地,在生成用户关系知识图谱之前,还包括定义实体类型和关系类型。
示例性地,基于模型构建数据表和关系明细表生成多个实体和关系宽表,以使模型构建数据表和实体与实体关系的关系明细表的数据满足图数据库的处理要求。其中,上述实体和关系宽表可以包括实体和关系三元组关系。将实体和关系宽表输入图数据库,以通过图数据库构建用户关系知识图谱。图6为一种用户关系知识图谱示意图。图6展示了人员、机构、账户、联系方式、借记卡账号和违规事件之间的关系。其中,实体类型定义和关系类型定义如下表所示。
表3为实体类型定义表。
表4为关系类型定义表。
关系名称 | 关系类型 | 开始节点 | 结束节点 |
亲属 | RELATIVES | Person | Person |
同乡 | COUNTRYMEN | Person | Person |
校友 | ALUMNUS | Person | Person |
同事 | COLLEAGUE | Person | Person |
担保 | GUARANTEE | Person | Person |
账号从属 | ACCOUNT_BELONG_TO | Account | Person |
手机号从属 | PHONENUMBER_BELONG_TO | PhoneNumber | Person |
手机号从属 | PHONENUMBER_BELONG_TO | PhoneNumber | Organization |
异常事件关联 | RELATE_TO_EVENT | Organization | Event |
异常事件关联 | RELATE_TO_EVENT | Person | Event |
董事 | DIRECTOR | Person | Externallnstitutions |
监事 | SUPERVISOR | Person | Externallnstitutions |
高管 | MANAGEMENT | Person | Externallnstitutions |
从属机构 | BELONG_TO_ORG | Person | InternalOrganization |
交易 | TRANSACTION | Account | Account |
步骤330、获取用户关系知识图谱。
步骤340、基于用户关系知识图谱中节点之间的关联关系计算相应节点的特征值。
步骤350、根据特征值确定隐藏问题线索,显示隐藏问题线索。
本发明实施例的技术方案,通过从实际运行的业务流程及各项规章制度中提炼相关数据和管理要求,构建用户关系知识图谱,提升问题线索发掘的智能化水平。
在上述技术方案的基础上,在获取用户关系知识图谱之后,还包括如下附加技术特征:响应于用户的查询信息对用户关系知识图谱进行裁剪,显示裁剪后的用户关系知识图谱。
图7为本发明实施例提供的又一种问题线索发掘方法的流程图,如图7所示,该方法包括:
步骤710、获取用户关系知识图谱。
步骤720、基于用户关系知识图谱中节点之间的关联关系计算相应节点的特征值。
示例性地,特征值包括紧密中心性值和中介中心性值。计算某个节点到达其它节点的难易程度,也就是计算某个节点到其它所有节点距离的平均值的倒数。可以表示为式子:raw closeness centrality(node)=1/sum(distance from node to all othernodes)
图8为一种紧密中心性算法实例图。根据图8中节点之间的关系可以推断节点C到达其它节点的平均距离最短,其次是节点B和节点D,到达其它节点的平均距离最远的是节点A和节点E。采用上述式子计算的紧密中心性的计算结果可验证上述结论。
中介中心性是一种检测节点对图中信息流的影响程度的方法。计算网络中任意两个节点的所有最短路径,如果这些路径中有很多条都经过某个节点,那么就认为这个节点的中介中心性高。具体地计算公式如下:
其中,σst表示节点s到节点t的最短路径数量;σst(v)表示节点s到节点t的最短路径中经过节点v的数量。
图9为一种中介中心性算法实例图。根据图9中节点和关系可以发现A节点关联关系最多,可以推断该节点对信息流侧影响程度最大,即该节点的中介中心性最高,其次是C节点。采用计算公式计算的中介中心性的计算结果可验证上述结论。
步骤730、根据特征值确定隐藏问题线索。
可选地,在根据特征值确定隐藏问题线索之后,还可以采用预设的异常关系规则验证隐藏问题线索是否有效。或者,采用通过机器学习模型训练的异常行为问题特征验证隐藏问题线索是否有效。
步骤740、响应于用户的查询信息对用户关系知识图谱进行裁剪,在裁剪后的用户关系知识图谱中显示隐藏问题线索。
具体地,获取用户输入的员工标识;根据员工标识从用户关系知识图谱中选择对应的第一节点,删除用户关系知识图谱中与第一节点不相连的第二节点,删除第二节点之间的边;基于删除后的用户关系知识图谱显示隐藏问题线索。
可选地,响应于用户的查询信息对用户关系知识图谱进行裁剪,在裁剪后的用户关系知识图谱中显示隐藏问题线索,包括:获取用户输入的至少两个待查询人员的员工标识;根据员工标识从用户关系知识图谱中确定对应的至少两个第四节点,删除用户关系知识图谱除第四节点之外的第五节点,删除第五节点之间的边;基于删除后的用户关系知识图谱显示隐藏问题线索。
需要说明的是,在用户关系知识图谱中显示隐藏问题线索的方式可以有很多种,本发明实施例并不作具体限定。例如,可以采用调整隐藏问题线索对应的边的显示属性的方式,在用户关系知识图谱中显示隐藏问题线索。可以采用调整隐藏问题线索对应的节点的显示属性的方式,在用户关系知识图谱中显示隐藏问题线索。还可以同时调整隐藏问题线索对应的边和节点的显示属性。
步骤750、响应于用户输入的线索推送请求,将隐藏问题线索推送给用户的上级用户,以指示上级用户判断隐藏问题线索是否有效。
步骤760、响应于上级用户对无效的隐藏问题线索的取消线索操作,修改无效的隐藏问题线索对应的边或节点的显示属性。
本发明实施例的技术方案,通过提供可视化的交互方式,对业务形成有力的支撑,满足相关考察工作的实际业务需求。
图10为本发明实施例提供的基于用户关系知识图谱的问题线索发掘流程图。图10所述步骤已经在对图1的描述中涵盖,为了更加清晰,在图10中标出关键步骤。如图10所示,呈现问题线索发掘的主要流程。首先,接入数据源,然后将来自数据源的数据做统一处理。统一处理后标准化的数据进入数据仓库,在数据仓库中对数据进行加工处理。随后,通过加工处理后的数据构建用户关系知识图谱。采用紧密中心性算法和中介中心性算法计算用户关系知识图谱中各个节点的紧密中心性值和中介中心性值。根据紧密中心性值和中介中心性值发现隐藏的问题线索。在当前用户完成基于所发现的问题线索的有效性判断之后,将问题线索推送给权限更高一级的用户,以请求权限更高一级的用户判断隐藏问题线索是否有效。可选地,在发现隐藏的问题线索之后,还可以根据异常关系规则和/或通过机器学习算法训练的异常行为特征验证所发现的隐藏问题线索的有效性。
使用本发明可以适应不断变化的业务需求,运用用户关系知识图谱提升问题线索发掘的数字化、智能化和科学化;通过实施本发明实施例能够提升问题线索发掘的有效性和准确性,能够在一定程度上满足各类业务中问题线索发掘的相关需求;为用户提供了较为友好的应用和展示界面,使用户操作简单、便捷、易用。
图11为本发明实施例提供的一种问题线索发掘装置的结构框图,该装置可以执行本发明任意实施例的问题线索发掘方法,并通过执行上述方法实现隐藏问题线索发掘。该装置可以由软件和/或硬件实习,并被配置于计算机设备中。如图11所示,该装置包括:
知识图谱获取模块1110,用于获取用户关系知识图谱;
特征值计算模块1120,用于基于用户关系知识图谱中节点之间的关联关系计算相应节点的特征值;
问题线索显示模块1130,用于根据特征值确定隐藏问题线索,显示隐藏问题线索。
本发明实施例提供一种问题线索发掘装置,通过用户关系知识图谱进行问题线索发掘,提升问题线索发掘的智能化水平,实现全面、准确的发现潜在的问题线索;通过提供可视化的交互方式,展示并发掘人员异常行为问题线索,满足相关考察工作的实际业务需求。
可选地,该装置还包括:
线索验证模块,用于在根据特征值确定隐藏问题线索之后,采用异常关系规则验证隐藏问题线索的有效性。
可选地,该装置还包括:
图谱构建模块,用于在获取用户关系知识图谱之前,获取模型构建数据表和关系明细表,其中,模型构建数据表用于存储构建知识图谱的实体信息,关系明细表用于存储实体与实体之间的关系;采用知识图谱生成工具基于模型构建数据表和关系明细表构建用户关系知识图谱。
可选地,图谱建模模块还具体用于:
确定模型构建数据表包括的实体;
根据预设的关系明细表确定各实体之间的关系;
根据实体和关系确定用于构建知识图谱的三元组,基于三元组构建用户关系知识图谱。
可选地,特征值计算模块1120具体用于:
计算用户关系知识图谱中各个节点与其它节点的距离平均值的倒数,将倒数作为对应节点的紧密中心性值;
根据用户关系知识图谱中任意一个节点担任其它两个节点之间最短路径的桥梁的次数以及对应两个节点之间的最短路径数量,计算对应节点的中介中心性值;
关联存储节点的节点标识、紧密中心性值和中介中心性值。
可选地,问题线索显示模块1130具体用于:
比较各个节点的特征值与预设阈值,确定特征值大于预设阈值的目标节点;
将目标节点以及与目标节点通过边连接的其它节点作为隐藏问题线索,显示隐藏问题线索。
可选地,该装置还包括:
特征值确定模块,用于在比较各个节点的特征值与预设阈值之前,根据节点标识查询预设数据表得到对应节点的特征值,其中,预设数据表中关联存储节点标识和特征值。
可选地,特征值确定模块,还用于在比较各个节点的特征值与预设阈值之前,获取用户关系知识图谱中各个节点对应的特征值,其中,特征值显示于用户关系知识图谱的节点中。
可选地,问题线索显示模块还具体用于:
响应于用户的查询信息对用户关系知识图谱进行裁剪,在裁剪后的用户关系知识图谱中显示隐藏问题线索。
可选地,问题线索显示模块进一步用于:
获取用户输入的员工标识;
根据员工标识从用户关系知识图谱中选择对应的第一节点,删除用户关系知识图谱中与第一节点不相连的第二节点,删除第二节点之间的边;
基于删除后的用户关系知识图谱显示隐藏问题线索。
可选地,问题线索显示模块进一步用于:
获取用户输入的至少两个待查询人员的员工标识;
根据员工标识从用户关系知识图谱中确定对应的至少两个第四节点,删除用户关系知识图谱除第四节点之外的第五节点,删除第五节点之间的边;
基于删除后的用户关系知识图谱显示隐藏问题线索。
可选地,该装置还包括:
线索判断模块,用于在根据特征值确定隐藏问题线索,显示隐藏问题线索之后,响应于用户输入的线索推送请求,将隐藏问题线索推送给用户的上级用户,以指示上级用户判断隐藏问题线索是否有效;响应于上级用户对无效的隐藏问题线索的取消线索操作,修改无效的隐藏问题线索对应的边或节点的显示属性。
本发明实施例所提供的问题线索发掘装置可执行本发明任意实施例所提供的问题线索发掘方法,具备执行方法相应的功能模块和有益效果。
图12为本发明实施例提供的一种计算机设备的结构示意图,如图12所示,该计算机设备包括处理器1210、存储器1220、输入装置1230和输出装置1240;计算机设备中处理器1210的数量可以是一个或多个,图12中以一个处理器1210为例;计算机设备中的处理器1210、存储器1220、输入装置1230和输出装置1240可以通过总线或其他方式连接,图12中以通过总线连接为例。
存储器1220作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的问题线索发掘方法对应的程序指令/模块(例如,问题线索发掘装置中的知识图谱获取模块1110、特征值计算模块1120和问题线索显示模块1130)。处理器1210通过运行存储在存储器1220中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的问题线索发掘方法。
存储器1220可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器1220可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器1220可进一步包括相对于处理器1210远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置1230可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置1240可包括显示屏等显示设备。通过输出装置1240显示知识图谱及隐藏问题线索等。
本发明实施例还提供一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行一种问题线索发掘方法,该方法包括:
获取用户关系知识图谱;
基于用户关系知识图谱中节点之间的关联关系计算相应节点的特征值;
根据特征值确定隐藏问题线索,显示隐藏问题线索。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的问题线索发掘方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述问题线索发掘装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (15)
1.一种问题线索发掘方法,其特征在于,包括:
获取用户关系知识图谱;
基于所述用户关系知识图谱中节点之间的关联关系计算相应节点的特征值;
根据所述特征值确定隐藏问题线索,显示所述隐藏问题线索。
2.根据权利要求1所述的方法,其特征在于,在根据所述特征值确定隐藏问题线索之后,还包括:
采用异常关系规则验证所述隐藏问题线索的有效性。
3.根据权利要求1所述的方法,其特征在于,在获取用户关系知识图谱之前,还包括:
获取模型构建数据表和关系明细表,其中,所述模型构建数据表用于存储构建知识图谱的实体信息,所述关系明细表用于存储实体与实体之间的关系;
采用知识图谱生成工具基于所述模型构建数据表和关系明细表构建用户关系知识图谱。
4.根据权利要求3所述的方法,其特征在于,所述采用知识图谱生成工具基于所述模型构建数据表和关系明细表构建用户关系知识图谱,包括:
确定所述模型构建数据表包括的实体;
根据所述关系明细表确定各所述实体之间的关系;
根据所述实体和关系确定用于构建知识图谱的三元组,基于所述三元组构建用户关系知识图谱。
5.根据权利要求1所述的方法,其特征在于,所述基于所述用户关系知识图谱中节点之间的关联关系计算相应节点的特征值,包括:
计算所述用户关系知识图谱中各个节点与其它节点的距离平均值的倒数,将所述倒数作为对应节点的紧密中心性值;
根据所述用户关系知识图谱中任意一个节点担任其它两个节点之间最短路径的桥梁的次数以及对应两个节点之间的最短路径数量,计算对应节点的中介中心性值;
关联存储所述节点的节点标识、紧密中心性值和中介中心性值。
6.根据权利要求1所述的方法,其特征在于,所述根据所述特征值确定隐藏问题线索,显示所述隐藏问题线索,包括:
比较各个所述节点的特征值与预设阈值,确定所述特征值大于所述预设阈值的目标节点;
将所述目标节点以及与目标节点通过边连接的其它节点作为隐藏问题线索,显示所述隐藏问题线索。
7.根据权利要求6所述的方法,其特征在于,在比较各个所述节点的特征值与预设阈值之前,还包括:
根据节点标识查询预设数据表得到对应节点的特征值,其中,所述预设数据表中关联存储节点标识和特征值。
8.根据权利要求6所述的方法,其特征在于,在比较各个所述节点的特征值与预设阈值之前,还包括:
获取所述用户关系知识图谱中各个节点对应的特征值,其中,所述特征值显示于所述用户关系知识图谱的节点中。
9.根据权利要求1所述的方法,其特征在于,显示所述隐藏问题线索,包括:
响应于用户的查询信息对所述用户关系知识图谱进行裁剪,在裁剪后的用户关系知识图谱中显示隐藏问题线索。
10.根据权利要求9所述的方法,其特征在于,所述响应于用户的查询信息对所述用户关系知识图谱进行裁剪,在裁剪后的用户关系知识图谱中显示隐藏问题线索,包括:
获取用户输入的员工标识;
根据所述员工标识从所述用户关系知识图谱中选择对应的第一节点,删除所述用户关系知识图谱中与所述第一节点不相连的第二节点,删除所述第二节点之间的边;
基于删除后的用户关系知识图谱显示隐藏问题线索。
11.根据权利要求9所述的方法,其特征在于,所述响应于用户的查询信息对所述用户关系知识图谱进行裁剪,在裁剪后的用户关系知识图谱中显示隐藏问题线索,包括:
获取用户输入的至少两个待查询人员的员工标识;
根据所述员工标识从所述用户关系知识图谱中确定对应的至少两个第四节点,删除所述用户关系知识图谱除所述第四节点之外的第五节点,删除所述第五节点之间的边;
基于删除后的用户关系知识图谱显示隐藏问题线索。
12.根据权利要求1所述的方法,其特征在于,在根据所述特征值确定隐藏问题线索,显示所述隐藏问题线索之后,还包括:
响应于用户输入的线索推送请求,将所述隐藏问题线索推送给所述用户的上级用户,以指示所述上级用户判断所述隐藏问题线索是否有效;
响应于所述上级用户对无效的隐藏问题线索的取消线索操作,修改所述无效的隐藏问题线索对应的边或节点的显示属性。
13.一种问题线索发掘装置,其特征在于,包括:
知识图谱获取模块,用于获取用户关系知识图谱;
特征值计算模块,用于基于所述用户关系知识图谱中节点之间的关联关系计算相应节点的特征值;
问题线索显示模块,用于根据所述特征值确定隐藏问题线索,显示所述隐藏问题线索。
14.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的问题线索发掘方法。
15.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-12中任一所述的问题线索发掘方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111364231.7A CN114090752A (zh) | 2021-11-17 | 2021-11-17 | 一种问题线索发掘方法、装置、计算机设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111364231.7A CN114090752A (zh) | 2021-11-17 | 2021-11-17 | 一种问题线索发掘方法、装置、计算机设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114090752A true CN114090752A (zh) | 2022-02-25 |
Family
ID=80301660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111364231.7A Pending CN114090752A (zh) | 2021-11-17 | 2021-11-17 | 一种问题线索发掘方法、装置、计算机设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114090752A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106878174A (zh) * | 2017-03-21 | 2017-06-20 | 哈尔滨工程大学 | 基于中介中心性的网络传播节点影响力发现方法 |
CN107909178A (zh) * | 2017-08-31 | 2018-04-13 | 上海壹账通金融科技有限公司 | 电子装置、失联修复率预测方法和计算机可读存储介质 |
CN109710701A (zh) * | 2018-12-14 | 2019-05-03 | 浪潮软件股份有限公司 | 一种用于公共安全领域大数据知识图谱的自动化构建方法 |
CN110717824A (zh) * | 2019-10-17 | 2020-01-21 | 北京明略软件***有限公司 | 基于知识图谱的银行对公客群风险传导测算的方法及装置 |
CN111309824A (zh) * | 2020-02-18 | 2020-06-19 | 中国工商银行股份有限公司 | 实体关系图谱显示方法及*** |
CN112182174A (zh) * | 2020-09-24 | 2021-01-05 | 南方电网数字电网研究院有限公司 | 业务问答知识查询方法、装置、计算机设备和存储介质 |
-
2021
- 2021-11-17 CN CN202111364231.7A patent/CN114090752A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106878174A (zh) * | 2017-03-21 | 2017-06-20 | 哈尔滨工程大学 | 基于中介中心性的网络传播节点影响力发现方法 |
CN107909178A (zh) * | 2017-08-31 | 2018-04-13 | 上海壹账通金融科技有限公司 | 电子装置、失联修复率预测方法和计算机可读存储介质 |
CN109710701A (zh) * | 2018-12-14 | 2019-05-03 | 浪潮软件股份有限公司 | 一种用于公共安全领域大数据知识图谱的自动化构建方法 |
CN110717824A (zh) * | 2019-10-17 | 2020-01-21 | 北京明略软件***有限公司 | 基于知识图谱的银行对公客群风险传导测算的方法及装置 |
CN111309824A (zh) * | 2020-02-18 | 2020-06-19 | 中国工商银行股份有限公司 | 实体关系图谱显示方法及*** |
CN112182174A (zh) * | 2020-09-24 | 2021-01-05 | 南方电网数字电网研究院有限公司 | 业务问答知识查询方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mardani et al. | A novel extended approach under hesitant fuzzy sets to design a framework for assessing the key challenges of digital health interventions adoption during the COVID-19 outbreak | |
WO2020253358A1 (zh) | 业务数据的风控分析处理方法、装置和计算机设备 | |
JP7313597B2 (ja) | 暗号通貨取引の分析方法及びシステム | |
US8674993B1 (en) | Graph database system and method for facilitating financial and corporate relationship analysis | |
WO2020048058A1 (zh) | 基金知识推理方法、***、计算机设备和存储介质 | |
Didimo et al. | Combining network visualization and data mining for tax risk assessment | |
US20200242615A1 (en) | First party fraud detection | |
WO2019019630A1 (zh) | 反欺诈识别方法、存储介质、承载平安脑的服务器及装置 | |
Yang | Construction of logistics financial security risk ontology model based on risk association and machine learning | |
US20080172257A1 (en) | Health Insurance Fraud Detection Using Social Network Analytics | |
CN111192012B (zh) | 事项处理方法、装置、服务器及存储介质 | |
TWI524199B (zh) | 用以找出複雜二元或多重交易方關係之多維遞迴學習方法和系統 | |
CN107633093A (zh) | 一种供电决策知识图谱的构建及其查询方法 | |
CN112927082A (zh) | 信用风险的预测方法、装置、设备、介质和程序产品 | |
CN112215616B (zh) | 一种基于网络的自动识别资金异常交易的方法和*** | |
Cifci et al. | Data mining usage and applications in health services | |
Nie et al. | Decision analysis of data mining project based on Bayesian risk | |
Navdeep et al. | Role of big data analytics in analyzing e-Governance projects | |
CN112991079B (zh) | 多卡共现就医欺诈行为检测方法、***、云端及介质 | |
CN110162521A (zh) | 一种支付***交易数据处理方法及*** | |
CN112631889A (zh) | 针对应用***的画像方法、装置、设备及可读存储介质 | |
CN112669039A (zh) | 基于知识图谱的客户风险管控***及方法 | |
CN111177653A (zh) | 一种信用评估方法和装置 | |
CN114090752A (zh) | 一种问题线索发掘方法、装置、计算机设备及介质 | |
CN115496130A (zh) | 新发卡实时审批模型的训练及审批方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |