CN116975774A - 机构名称融合方法、终端设备及计算机可读存储介质 - Google Patents

机构名称融合方法、终端设备及计算机可读存储介质 Download PDF

Info

Publication number
CN116975774A
CN116975774A CN202310764967.6A CN202310764967A CN116975774A CN 116975774 A CN116975774 A CN 116975774A CN 202310764967 A CN202310764967 A CN 202310764967A CN 116975774 A CN116975774 A CN 116975774A
Authority
CN
China
Prior art keywords
fused
node
nodes
organization
node set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310764967.6A
Other languages
English (en)
Inventor
卢毅
胡斌
厉彦皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Merchants Bank Co Ltd
Original Assignee
China Merchants Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Merchants Bank Co Ltd filed Critical China Merchants Bank Co Ltd
Priority to CN202310764967.6A priority Critical patent/CN116975774A/zh
Publication of CN116975774A publication Critical patent/CN116975774A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了机构名称融合方法、终端设备及计算机可读存储介质,该方法包括:获取待融合机构,并对所述待融合机构建立机构节点集;根据所述待融合机构的固定属性,对机构节点进行融合,更新所述机构节点集并删除已融合的所述机构节点;根据所述机构节点集的节点关联信息计算相似度,对机构节点进行融合,生成新机构节点并删除已融合的所述机构节点;基于所述新机构节点与所述机构节点集中的其它节点关联信息计算相似度,完成机构融合。解决了金融***在对来自不同渠道的机构信息进行整合时,无法应对机构更名或者多个机构共用同一机构简称,导致机构信息融合不到位的问题,达到了提高机构信息融合的准确性的效果。

Description

机构名称融合方法、终端设备及计算机可读存储介质
技术领域
本申请涉及数据处理领域,尤其涉及机构名称融合方法、终端设备及计算机可读存储介质。
背景技术
目前,金融机构在不同***和渠道维护的名称通常各有不同。机构名称常见的用法包括规范名称和非规范名称。规范名称是指由权威机构发布的某一机构实体的名称。非规范名称是指同一机构的多种变异名称,包括但不限于简称、中文简繁体名称、多语言译称、错误名称、曾用名或者其它别称等。
为了对来自不同***和渠道收集到的机构信息进行整合,通常需要将同一机构的信息关联起来。若同一机构存在不同名称,则需要通过机构名称融合的方法,将机构名称拆解后提取词法、语义特征,再构建模型进行相似度比较,实现机构名称统一。但这种方法无法应对机构更名或者多个机构共用同一机构简称的情况。导致在各数据源机构名称不标准、不统一的情况下,机构信息融合不准确。
发明内容
本申请实施例通过提供一种机构名称融合方法、终端设备及计算机可读存储介质,解决了金融***在对来自不同渠道的机构信息进行整合时,无法应对机构更名或者多个机构共用同一机构简称,导致机构信息融合不到位的问题,达到了提高机构信息融合的准确性的效果。
本申请实施例提供了一种机构名称融合方法、终端设备及计算机可读存储介质,所述机构名称融合方法包括:
获取待融合机构,并对所述待融合机构建立机构节点集;
根据所述待融合机构的固定属性,对机构节点进行融合,更新所述机构节点集并删除已融合的所述机构节点;
根据所述机构节点集的节点关联信息计算相似度,对机构节点进行融合,生成新机构节点并删除已融合的所述机构节点;
基于所述新机构节点与所述机构节点集中的其它节点关联信息计算相似度,完成机构融合。
可选地,所述根据所述待融合机构的固定属性,对机构节点进行融合,更新所述机构节点集并删除已融合的所述机构节点的步骤包括:
获取第一机构节点集中,所述固定属性相同的待融合机构;
对所述待融合机构的子节点进行融合,生成所述新的待融合机构节点,并更新所述第一机构节点集。
可选地,所述对所述待融合机构的子节点进行融合,生成所述新机构节点的步骤之后,还包括:
获取所述第一机构节点集和第二机构节点集中,所述固定属性相同的待融合机构;
将所述第一机构节点集中的所述待融合机构,融合至所述第二机构节点集对应的待融合机构中,完成所述机构节点的融合。
可选地,所述根据所述待融合机构的固定属性,对机构节点进行融合,更新所述机构节点集并删除已融合的所述机构节点的步骤还包括:
获取所述待融合机构中,对同一产品具备相同关联关系的待融合机构节点;
判断所述待融合机构节点是否属于第二机构节点集,若属于,则将所述待融合机构节点融合进所述第二机构节点集对应的待融合机构节点中。
可选地,所述根据所述机构节点集的节点关联信息计算相似度,对机构节点进行融合,生成新机构节点并删除已融合的所述机构节点的步骤包括:
基于预设算法,计算所述机构节点集中,各个机构节点对应的节点向量;
对所述节点向量计算余弦相似度,并记录超过预设阈值的余弦相似度值,以及所述余弦相似度值对应的待融合节点向量。
可选地,所述对所述节点向量计算余弦相似度,并记录超过预设阈值的余弦相似度值,以及所述余弦相似度值对应的待融合节点向量的步骤之后,包括:
获取第一机构节点集中,各个记录了所述余弦相似度值对应的所述待融合节点;
获取第二机构节点集中,与所述待融合节点的所述余弦相似度值最高的第二机构节点,并将所述待融合节点与所述第二机构节点进行融合。
可选地,所述获取待融合机构,并对所述待融合机构建立机构节点集的步骤包括:
获取数据***中维护的产品,以及所述产品的关联信息,并以所述产品的产品名称为基础,构建产品节点集;
基于所述产品节点集,获取与所述产品存在关联关系的机构;
根据所述机构的机构名称、数据来源和/或机构编码,构建所述机构节点集。
可选地,所述根据所述机构的机构名称、数据来源和/或机构编码,构建所述机构节点集的步骤之后,包括:
根据所述产品与所述机构的关联关系,构建关系节点集;
将所述产品节点集,所述机构节点集和所述关系节点集录入到图数据库中。
此外,为实现上述目的,本发明实施例还提供一种终端设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的机构名称融合程序,所述处理器执行所述机构名称融合程序时,实现如上所述的方法。
此外,为实现上述目的,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有机构名称融合程序,所述机构名称融合程序被处理器执行时,实现如上所述的方法。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
首先获取来自不同***、不同渠道的待融合机构,并对待融合机构根据各自的属性,建立机构节点集。根据机构节点集的节点关联信息计算相似度,对机构节点进行融合,生成新机构节点并删除已融合的机构节点。基于新机构节点与机构节点集中的其它机构节点的关联信息计算相似度,完成机构融合。或者根据待融合机构的固定属性,对机构节点进行融合,生成新机构节点并删除已融合的机构节点。通过相似度融合和机构固定属性融合,可以有效提高机构信息融合的准确性。
附图说明
图1为本申请机构名称融合方法实施例一的流程示意图;
图2为本申请机构名称融合方法实施例二的流程示意图;
图3为本申请机构名称融合方法实施例三的流程示意图;
图4为本申请一实施例方案涉及的硬件运行环境的终端结构示意图。
具体实施方式
为了解决金融***在对来自不同渠道不同***的机构信息进行融合时,无法应对机构更名或者多个机构共用同一机构简称,导致机构信息融合不到位的问题。本申请提供一种机构名称融合方法,获取来自不同***、不同渠道的待融合机构,并对待融合机构根据各自的属性,建立机构节点集。根据机构节点集的节点关联信息计算相似度,对机构节点进行融合,生成新机构节点并删除已融合的机构节点。基于新机构节点与机构节点集中的其它机构节点的关联信息计算相似度,完成机构融合。或者根据待融合机构的固定属性,对机构节点进行融合,生成新机构节点并删除已融合的机构节点。达到了提高机构信息融合的准确性的效果。
为了更好的理解上述技术方案,下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一
在本实施例中,提供一种机构名称融合方法。
参照图1,本实施例的机构名称融合方法包括以下步骤:
步骤S100:获取待融合机构,并对所述待融合机构建立机构节点集;
在本实施例中,待融合机构指的是在不同***和不同渠道中,记录的名称不同但实质相同的金融机构。将不同的金融机构名称融合至同一实体,能够实现多源机构属性的整合,从而实现准确的机构画像。机构节点集即机构模型,可以将来自相同***的机构作为一个模型,也可以将维护同类产品的机构作为一个模型。用户可以根据实际情况设定机构模型的归类方法。
作为一种可选实施方式,可以将维护同类产品的机构作为一个机构节点集。先获取数据***中维护的产品,以及产品的关联信息,并以产品的产品名称为基础,构建产品节点集。
示例性地,获取托管的各个数据***中维护的产品p,例如某一基金产品。获取该基金产品的产品名,资产代码,基金经理,数据来源***信息等,将上述信息与产品名关联,作为一个产品子节点。获取数据***中各类产品,分别将各类产品作为一个产品子节点,构建产品节点集P。
作为另一种可选实施方式,基于所述产品节点集,获取与所述产品存在关联关系的机构;根据所述机构的机构名称、数据来源和/或机构编码,构建所述机构节点集。
示例性地,获取与某类产品相关的机构,比如获取某类基金产品相关的机构。并检测数据***中,存在该基金产品的所有机构,将类型相同且来自同一渠道的所有机构作为一个机构节点。其中,每个管理人、委托人、账管人或者托管人关系分别作为一种类型。将基于该基金产品所构建的机构节点记录为一个机构节点集。由于一个机构节点中,来自不同渠道的机构可能存在不同的机构名称,例如简称、别称等,为了便于数据检索,可以将各个机构的名称作为该机构节点的属性。
作为又一种可选实施方式,在构建机构节点集之后,根据所述产品与所述机构的关联关系,构建关系节点集;将所述产品节点集,所述机构节点集和所述关系节点集录入到图数据库中。
示例性地,基于各个机构节点集中各类产品之间存在的关联关系,构建关系节点集。例如获取A基金产品对应的所有客户号,再获取与A基金产品同一数据***内维护的客户层级,如母公司、子公司、控股等。将该客户层级关联的所有客户c1,c2,c3,……,cn作为一个节点,录入节点集。该节点集可以机构名称、机构代码为属性,再建立该基金产品与所有客户c1,c2,c3,……,cn之间的关系,生成关系节点集。
可选地,在生成产品节点集、机构节点集和关系节点集后,将各个节点集录入到图数据库中,以便后续实现机构融合。使用图数据库实现机构融合时,无需预先建立融合规则,用户可以根据实际需求生成融合规则。
步骤S200:根据所述待融合机构的固定属性,对机构节点进行融合,更新所述机构节点集并删除已融合的所述机构节点;
在本实施例中,固定属性指的是机构的统一社会信用代码,组织机构代码信息等不可变动的信息。机构融合指的是将两个机构节点中相同的信息进行融合,将不同的信息并列记录,生成新的机构节点,再将已融合的机构节点删除。
作为一种可选实施方式,可以获取机构的工商信息,将工商信息相同的机构作为一个机构节点。
示例性地,获取非工商个体户的企业工商信息,构建机构节点,将机构名、曾用名、统一社会信用代码和组织机构代码信息作为节点属性,形成节点集。
作为另一种可选实施方式,在以机构的固定属性为基础进行机构节点融合时,获取所述待融合机构中,对同一产品具备相同关联关系的待融合机构节点;判断所述待融合机构节点是否属于第二机构节点集,若属于,则将所述待融合机构节点融合进所述第二机构节点集对应的待融合机构节点中。
示例性地,当两个机构节点对同一个产品具有相同的关系时,如都为管理人关系,可以对两各机构节点进行融合。当其中一个机构为工商来源机构节点时,优先将数据融合进该工商机构节点中。由于工商机构来源的节点数据具有较高的准确性,因此优先件节点数据融入工商来源机构节点中。
步骤S300:根据所述机构节点集的节点关联信息计算相似度,对机构节点进行融合,生成新机构节点并删除已融合的所述机构节点;
步骤S400:基于所述新机构节点与所述机构节点集中的其它节点关联信息计算相似度,完成机构融合。
在本实施例中,可以根据各个机构节点集内的机构节点的关联信息,计算相似度,将相似度高于预设阈值的节点进行融合操作,并生成新阈值。再重复进行相似度计算,直至不存在高于预设阈值的机构节点,完成机构融合。
作为一种可选实施方式,可以基于已经整合的机构节点集,进行多轮融合。对每个非工商机构节点,依次对存在关联的工商机构节点进行相似度计算,对高于预设阈值的节点进行融合操作,生成新阈值。
示例性地,与非工商机构节点E存在关联关系的工商机构节点有a,b,c,d。依次计算机构节点E与机构节点a,机构节点b,机构节点c和机构节点d的相似度。若与结构节点a的相似度均高于预设阈值,则将非工商机构节点E与工商机构节点a进行融合,消除非工商机构节点E。以此类推,直至不存在相似度值高于预设阈值的非工商机构节点,规范机构节点集中的存在的节点数据。
在本实施例中,在获取待融合结构,建立机构节点模型后,可以将各个机构节点固定属性相同的机构节点进行融合,生成新机构节点。在根据固定属性完成初步融合后,再根据机构节点集中各节点的关联信息计算节点相似度,进行机构融合。由于不是简单的根据机构节点的名称进行机构融合,而是可以通过机构节点相似度和机构节点的固定属性进行机构融合,可以有效提高机构融合的准确性。
实施例二
基于实施例一,提出本申请的另一实施例,参照图2,根据所述待融合机构的固定属性,对机构节点进行融合,更新所述机构节点集并删除已融合的所述机构节点的步骤包括:
步骤S401:获取第一机构节点集中,所述固定属性相同的待融合机构;
步骤S402:对所述待融合机构的子节点进行融合,生成所述新的待融合机构节点,并更新所述第一机构节点集。
在本实施例中,可以根据机构的固定属性进行机构融合。第一机构节点集指的是非工商机构节点集。
作为一种可选实施方式,获取非工商机构节点集中的机构信息,录入到机构节点集中,一个机构节点中含有多个子节点,如机构名称,机构来源,机构统一编码等。基于子节点信息进行机构融合,融合完成后,生成新的机构节点。
示例性地,机构节点A1和机构节点A2均为非工商机构节点,机构节点A1的机构名称为第一基金,机构来源为清算***,机构统一编码为00101。机构节点A2的机构来源为核算***,机构统一编码为00101。由于机构节点A1和机构节点A2的机构统一编码相同,因此可以将两个机构节点进行融合,生成机构节点A3,机构节点的属性为A1和A2,机构名称为第一基金,机构来源为网托***和核算***,机构统一编码为00101。将机构节点A3更新到机构节点集中,并将机构节点A1和机构节点A2删除。
步骤S403:获取所述第一机构节点集和第二机构节点集中,所述固定属性相同的待融合机构;
步骤S404:将所述第一机构节点集中的所述待融合机构,融合至所述第二机构节点集对应的待融合机构中,完成所述机构节点的融合。
在本实施例中,第一机构节点集指的是数据来源于非工商机构的机构节点集,如企业内部记录的机构信息,非工商机构记录的机构名称较不规范,可能存在简称、译称或者错别字等。第二机构节点集指的是数据来源于工商管理机构的机构节点集,工商管理机构记录的机构信息较规范。当待融合的机构节点既有工商来源机构又有非工商来源机构时,将非工商来源机构融合至工商来源机构节点中,以规范机构信息,方便管理。并且当机构改名时,可以直接根据工商来源***更新机构节点集。
作为一种可选实施方式,可以获取第一机构节点集中,具备机构代码这一固定属性的所有机构节点,将第一机构节点集中具有相同机构代码的机构节点先进行融合,更新第一机构节点集。再将更新后的第一机构节点集中的各项机构节点与第二机构节点集中的机构节点进行比对,若存在机构代码相同的机构节点,则将第一机构节点集中的机构节点数据融合至第二机构节点集中。
示例性地,可以先对每个机构节点集进行预排歧,即对每个机构节点,如维护了相同组织机构代码,或未维护组织机构代码但机构名称相同的机构节点进行预先融合。将机构节点集内部,节点属性去重融合后合并为同一节点,若融合的节点的名称不同,则将不同名称记录为新节点的别名属性,并记录节点来源,以便后续进行数据查找时,可以获取相应的数据。
在本实施例中,可以根据待融合机构的固定属性进行机构融合,由于固定属性通常是不变的,因此使用固定属性进行机构融合时,即使机构名称产生变化,也不会影响机构融合。
实施例三
基于上述实施例,提出本申请的另一实施例,参照图3,根据所述机构节点集的节点关联信息计算相似度,对机构节点进行融合,生成新机构节点并删除已融合的所述机构节点的步骤包括:
步骤S201:基于预设算法,计算所述机构节点集中,各个机构节点对应的节点向量;
步骤S202:对所述节点向量计算余弦相似度,并记录超过预设阈值的余弦相似度值,以及所述余弦相似度值对应的待融合节点向量。
在本实施例中,预设算法为Node2Vec算法,机构节点集存在于图数据库中,节点向量即为Embedding向量。
作为一种可选实施方式,在计算各个机构节点的Embedding向量后,再对节点向量计算余弦相似度值。记录超过预设阈值的余弦相似度值,以及各个余弦相似度值对应的机构节点。
示例性地,分别计算非工商机构节点集和工商机构节点集对应的Embedding向量。分别对两个机构节点集中的每个节点通过Node2Vec算法计算得到每个节点对应的Embedding向量。将每个非工商机构节点集中的节点向量,与每个工商机构节点向量计算余弦相似度,记录超过预设阈值的工商机构节点的相似度值。同时获取超过预设阈值时对应的工商机构节点和非工商机构节点。判断两个机构节点中是否存在可融合的信息,若两个机构节点中不存在交叉信息,表明二者无法融合,结束本次机构节点融合。若两个机构节点中存在交叉信息,则执行机构融合动作。
步骤S203:获取第一机构节点集中,各个记录了所述余弦相似度值对应的所述待融合节点;
步骤S204:获取第二机构节点集中,与所述待融合节点的所述余弦相似度值最高的第二机构节点,并将所述待融合节点与所述第二机构节点进行融合。
在本实施例中,第一机构节点集为非工商机构节点集,第二机构节点集的初始化状态即为工商机构节点集。其中,第二机构节点集为完成排歧后的节点集,也即第二机构节点集中不存在组织机构代码相同,但机构名称不同的节点。
作为一种可选实施方式,先分别对非工商机构节点集和工商机构节点集中各个机构节点计算余弦相似度。获取记录了余弦相似度的非工商机构节点,并将每个所述非工商机构节点与余弦相似度值最高的工商机构节点进行融合,在完成融合后,清除已融合机构节点的相似度。只有当存在余弦相似度时,机构节点存在关联关系,可进行融合。在全部融合完毕后,最终构建的机构节点集中各个机构节点为并列关系,不存在关联关系。
示例性地,在进行机构节点融合时,可以根据实际情况调整余弦相似度的阈值,余弦相似度阈值越高,容忍性越大;余弦相似度阈值越低,容忍性越小。在机构融合过程中,余弦相似度阈值可以从低到高依次调整,直至不存在相似度值高于预设阈值的非工商机构节点。将所有非工商机构节点融合到工商机构节点中,可以有效提高机构节点的规范性。
可选地,每轮相似度阈值调整可通过以下公式确定:
其中,nt-1为上一次机构融合前的非工商机构节点数量,nt为本次融合的非工商机构节点数量,相似度阈值初始值α0可根据人工识别的同一个机构的不同节点间相似度最小值设定。
在本实施例中,通过不断调整相似度阈值,进行机构融合,实现将非工商机构节点都融入到工商机构节点中。即使后续非工商机构节点的数据频繁变动,***也能在已完成融合的工商机构节点中查找到该机构节点对应的历史数据。
实施例四
在本申请实施例中,提出一种机构名称融合装置。
参照图4,图4为本申请一实施例方案涉及的硬件运行环境的终端结构示意图。
如图4所示,该控制终端可以包括:处理器1001,例如CPU,网络接口1003,存储器1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。网络接口1003可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1004可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1004可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图4中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图4所示,作为一种计算机存储介质的存储器1004中可以包括操作***、网络通信模块、以及机构名称融合程序。
在图4所示的机构名称融合设备硬件结构中,处理器1001可以调用存储器1004中存储的机构名称融合程序,并执行以下操作:
获取待融合机构,并对所述待融合机构建立机构节点集;
根据所述待融合机构的固定属性,对机构节点进行融合,更新所述机构节点集并删除已融合的所述机构节点;
根据所述机构节点集的节点关联信息计算相似度,对机构节点进行融合,生成新机构节点并删除已融合的所述机构节点;
基于所述新机构节点与所述机构节点集中的其它节点关联信息计算相似度,完成机构融合。
可选地,处理器1001可以调用存储器1004中存储的机构名称融合程序,还执行以下操作:
获取第一机构节点集中,所述固定属性相同的待融合机构;
对所述待融合机构的子节点进行融合,生成所述新的待融合机构节点,并更新所述第一机构节点集。
可选地,处理器1001可以调用存储器1004中存储的机构名称融合程序,还执行以下操作:
获取所述第一机构节点集和第二机构节点集中,所述固定属性相同的待融合机构;
将所述第一机构节点集中的所述待融合机构,融合至所述第二机构节点集对应的待融合机构中,完成所述机构节点的融合。
可选地,处理器1001可以调用存储器1004中存储的机构名称融合程序,还执行以下操作:
获取所述待融合机构中,对同一产品具备相同关联关系的待融合机构节点;
判断所述待融合机构节点是否属于第二机构节点集,若属于,则将所述待融合机构节点融合进所述第二机构节点集对应的待融合机构节点中。
可选地,处理器1001可以调用存储器1004中存储的机构名称融合程序,还执行以下操作:
基于预设算法,计算所述机构节点集中,各个机构节点对应的节点向量;
对所述节点向量计算余弦相似度,并记录超过预设阈值的余弦相似度值,以及所述余弦相似度值对应的待融合节点向量。
可选地,处理器1001可以调用存储器1004中存储的机构名称融合程序,还执行以下操作:
获取第一机构节点集中,各个记录了所述余弦相似度值对应的所述待融合节点;
获取第二机构节点集中,与所述待融合节点的所述余弦相似度值最高的第二机构节点,并将所述待融合节点与所述第二机构节点进行融合。
可选地,处理器1001可以调用存储器1004中存储的机构名称融合程序,还执行以下操作:
获取数据***中维护的产品,以及所述产品的关联信息,并以所述产品的产品名称为基础,构建产品节点集;
基于所述产品节点集,获取与所述产品存在关联关系的机构;
根据所述机构的机构名称、数据来源和/或机构编码,构建所述机构节点集。
可选地,处理器1001可以调用存储器1004中存储的机构名称融合程序,还执行以下操作:
根据所述产品与所述机构的关联关系,构建关系节点集;
将所述产品节点集,所述机构节点集和所述关系节点集录入到图数据库中。
此外,为实现上述目的,本发明实施例还提供一种终端设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的机构名称融合程序,所述处理器执行所述机构名称融合程序时,实现如上所述的机构名称融合方法。
此外,为实现上述目的,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有机构名称融合程序,所述机构名称融合程序被处理器执行时,实现如上所述的机构名称融合方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本申请可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种机构名称融合方法,其特征在于,所述机构名称融合方法包括以下步骤:
获取待融合机构,并对所述待融合机构建立机构节点集;
根据所述待融合机构的固定属性,对机构节点进行融合,更新所述机构节点集并删除已融合的所述机构节点;
根据所述机构节点集的节点关联信息计算相似度,对机构节点进行融合,生成新机构节点并删除已融合的所述机构节点;
基于所述新机构节点与所述机构节点集中的其它节点关联信息计算相似度,完成机构融合。
2.如权利要求1所述的机构名称融合方法,其特征在于,所述根据所述待融合机构的固定属性,对机构节点进行融合,更新所述机构节点集并删除已融合的所述机构节点的步骤包括:
获取第一机构节点集中,所述固定属性相同的待融合机构;
对所述待融合机构的子节点进行融合,生成所述新的待融合机构节点,并更新所述第一机构节点集。
3.如权利要求2所述的机构名称融合方法,其特征在于,所述对所述待融合机构的子节点进行融合,生成所述新机构节点的步骤之后,还包括:
获取所述第一机构节点集和第二机构节点集中,所述固定属性相同的待融合机构;
将所述第一机构节点集中的所述待融合机构,融合至所述第二机构节点集对应的待融合机构中,完成所述机构节点的融合。
4.如权利要求1所述的机构名称融合方法,其特征在于,所述根据所述待融合机构的固定属性,对机构节点进行融合,更新所述机构节点集并删除已融合的所述机构节点的步骤还包括:
获取所述待融合机构中,对同一产品具备相同关联关系的待融合机构节点;
判断所述待融合机构节点是否属于第二机构节点集,若属于,则将所述待融合机构节点融合进所述第二机构节点集对应的待融合机构节点中。
5.如权利要求1所述的机构名称融合方法,其特征在于,所述根据所述机构节点集的节点关联信息计算相似度,对机构节点进行融合,生成新机构节点并删除已融合的所述机构节点的步骤包括:
基于预设算法,计算所述机构节点集中,各个机构节点对应的节点向量;
对所述节点向量计算余弦相似度,并记录超过预设阈值的余弦相似度值,以及所述余弦相似度值对应的待融合节点向量。
6.如权利要求5所述的机构名称融合方法,其特征在于,所述对所述节点向量计算余弦相似度,并记录超过预设阈值的余弦相似度值,以及所述余弦相似度值对应的待融合节点向量的步骤之后,包括:
获取第一机构节点集中,各个记录了所述余弦相似度值对应的所述待融合节点;
获取第二机构节点集中,与所述待融合节点的所述余弦相似度值最高的第二机构节点,并将所述待融合节点与所述第二机构节点进行融合。
7.如权利要求1所述的机构名称融合方法,其特征在于,所述获取待融合机构,并对所述待融合机构建立机构节点集的步骤包括:
获取数据***中维护的产品,以及所述产品的关联信息,并以所述产品的产品名称为基础,构建产品节点集;
基于所述产品节点集,获取与所述产品存在关联关系的机构;
根据所述机构的机构名称、数据来源和/或机构编码,构建所述机构节点集。
8.如权利要求7所述的机构名称融合方法,其特征在于,所述根据所述机构的机构名称、数据来源和/或机构编码,构建所述机构节点集的步骤之后,包括:
根据所述产品与所述机构的关联关系,构建关系节点集;
将所述产品节点集,所述机构节点集和所述关系节点集录入到图数据库中。
9.一种终端设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的机构名称融合程序,所述处理器执行所述机构名称融合程序时,实现权利要求1-8任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有机构名称融合程序,所述机构名称融合程序被处理器执行时,实现权利要求1-8任一所述的方法。
CN202310764967.6A 2023-06-26 2023-06-26 机构名称融合方法、终端设备及计算机可读存储介质 Pending CN116975774A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310764967.6A CN116975774A (zh) 2023-06-26 2023-06-26 机构名称融合方法、终端设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310764967.6A CN116975774A (zh) 2023-06-26 2023-06-26 机构名称融合方法、终端设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN116975774A true CN116975774A (zh) 2023-10-31

Family

ID=88482345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310764967.6A Pending CN116975774A (zh) 2023-06-26 2023-06-26 机构名称融合方法、终端设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN116975774A (zh)

Similar Documents

Publication Publication Date Title
WO2020147488A1 (zh) 异常群体识别方法及装置
CN109255586B (zh) 一种面向电子政务办事的在线个性化推荐方法
US9104709B2 (en) Cleansing a database system to improve data quality
CN111382956A (zh) 企业集团关系的挖掘方法和装置
CN111538794B (zh) 一种数据融合方法、装置及设备
CN110020427B (zh) 策略确定方法和装置
US20210089667A1 (en) System and method for implementing attribute classification for pii data
CN111949643A (zh) 基于业务建模的数据处理方法及***
WO2020259325A1 (zh) 一种适用于机器学习的特征处理方法及装置
CN112925664A (zh) 目标用户的确定方法、装置、电子设备及存储介质
CN112037026A (zh) 自动化异常交易工单处理方法、装置和***
CN110990403A (zh) 业务数据的存储方法、***、计算机设备及存储介质
CN111242774A (zh) 银行客户资产图谱构建方法和装置
CN115840738A (zh) 一种数据迁移方法、装置、电子设备及存储介质
CN113506113B (zh) 一种基于关联网络的***套现团伙挖掘方法及***
CN114219596A (zh) 一种基于决策树模型的数据处理方法及相关设备
CN110765100B (zh) 标签的生成方法、装置、计算机可读存储介质及服务器
CN112801784A (zh) 一种数字货币交易所的比特币地址挖掘方法及装置
CN117291722A (zh) 对象管理方法、相关设备及计算机可读介质
WO2023175413A1 (en) Mutual exclusion data class analysis in data governance
US8832110B2 (en) Management of class of service
CN115543428A (zh) 一种基于策略模板的模拟数据生成方法和装置
CN116975774A (zh) 机构名称融合方法、终端设备及计算机可读存储介质
CN113901046A (zh) 虚拟维度表构建方法及装置
CN113449005B (zh) 账户管理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination