CN117271713A - 关联对象识别方法、装置、电子设备及存储介质 - Google Patents

关联对象识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117271713A
CN117271713A CN202210657389.1A CN202210657389A CN117271713A CN 117271713 A CN117271713 A CN 117271713A CN 202210657389 A CN202210657389 A CN 202210657389A CN 117271713 A CN117271713 A CN 117271713A
Authority
CN
China
Prior art keywords
information
upstream
target
downstream
industry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210657389.1A
Other languages
English (en)
Inventor
余电
王梦晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SF Technology Co Ltd
Original Assignee
SF Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SF Technology Co Ltd filed Critical SF Technology Co Ltd
Priority to CN202210657389.1A priority Critical patent/CN117271713A/zh
Priority to PCT/CN2023/112319 priority patent/WO2023237135A1/zh
Publication of CN117271713A publication Critical patent/CN117271713A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种关联对象识别方法、装置、电子设备及存储介质,包括:获取待识别的目标对象;根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息;根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。本方法一方面可以通过目标对象的物流信息,对目标对象的经营范围信息进行修正,得到较为精确的实际经营信息,并根据较为精确的实际经营信息进行关联对象的识别,进而得到的目标对象关联的上游对象和/或下游对象更加准确。另一方面,本方法采用的数据为较为常见的经营范围信息和物流信息,因此泛用性更强。

Description

关联对象识别方法、装置、电子设备及存储介质
技术领域
本申请涉及信息识别技术领域,具体涉及一种关联对象识别方法、装置、电子设备及存储介质。
背景技术
关联对象识别是一种近年来新兴的技术领域,用于识别数个对象之间的关联关系。例如可以通过关联对象识别技术,向企业推荐潜在的交易对象,或者在企业进行交易时,对交易对象进行识别,判断是否可能存在交易风险。
然而,目前的关联对象识别方法虽然能够进行简单的识别,但是识别精度不高,容易判断错误。
发明内容
本申请提供一种关联对象识别方法、装置、电子设备及存储介质,旨在解决目前的关联对象识别方法识别精度不高的问题。
第一方面,本申请提供一种关联对象识别方法,包括:
获取待识别的目标对象;
根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息;
根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
在本申请一种可能的实现方式中,所述根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息,包括:
获取与所述目标对象的行业信息相同的多个第二候选对象;
提取所述多个第二候选对象的经营范围信息中出现次数大于预设次数阈值的第一关键词信息;
通过预设的关联关系识别模型,对所述目标对象的物流信息、所述目标对象的经营范围信息和所述第一关键词信息进行处理,得到所述目标对象对应的第一目标系数;
根据所述第一目标系数,对所述第一关键词信息进行加权处理,并将加权后的第一关键词信息与所述目标对象的经营范围信息进行融合,得到所述目标对象的实际经营信息;
所述根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象之前,所述方法还包括:
获取与第一候选对象的行业信息相同的多个第三候选对象;
提取所述多个第三候选对象的经营范围信息中出现次数大于预设次数阈值的第二关键词信息;
通过预设的关联关系识别模型,对所述第一候选对象的物流信息、所述第一候选对象的经营范围信息和所述第二关键词信息进行处理,得到所述第一候选对象对应的第二目标系数;
根据所述第二目标系数,对所述第二关键词信息进行加权处理,并将加权后的第二关键词信息与所述第一候选对象的经营范围信息进行融合,得到所述第一候选对象的实际经营信息。
在本申请一种可能的实现方式中,所述预设的关联关系识别模型通过以下方法训练得到:
获取订单类型为目标类型的目标订单信息,并将同一目标订单信息中的寄件对象和所述同一目标订单信息中的收件对象分别作为上游对象,以及与所述上游对象关联的第一下游对象;
根据所述上游对象的经营范围信息和物流信息,和所述第一下游对象的经营范围信息和物流信息,构建正样本数据;
通过所述正样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型。
在本申请一种可能的实现方式中,所述通过所述正样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型,包括:
针对每一个上游对象,根据对应的第一下游对象的行业信息,从预设的样本对象中选择所述每一个上游对象对应的第二下游对象,其中,所述每一个上游对象对应的第二下游对象是指与所述每一个上游对象不是上下游关系的样本对象;
根据所述上游对象的经营范围信息和寄件信息,以及所述上游对象对应的第二下游对象的经营范围信息和寄件信息,构建负样本数据;
根据所述正样本数据和所述负样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型。
在本申请一种可能的实现方式中,所述针对每一个上游对象,根据对应的第一下游对象的行业信息,从预设的样本对象中选择所述每一个上游对象对应的第二下游对象,包括:
针对每一个上游对象,统计所述每一个上游对象对应的第一下游对象的行业信息,得到所述每一个上游对象对应的下游行业分布信息,其中,行业分布信息中包含多个不同行业信息的行业占比;
统计所有第一下游对象的行业信息,得到全局行业分布信息;
根据所述样本对象的行业信息,分别从所述每一个上游对象对应的下游行业分布信息中确定所述每一个上游对象对应的个体行业占比,以及从所述全局行业分布信息中确定所述样本对象对应的全局行业占比;
根据所述每一个上游对象对应的个体行业占比,以及所述样本对象对应的全局行业占比,从所述样本对象中选择所述每一个上游对象对应的第二下游对象。
在本申请一种可能的实现方式中,所述根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象,包括:
获取所述目标对象的对象身份信息,以及预设的第一候选对象的对象身份信息;
根据所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
在本申请一种可能的实现方式中,所述根据所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象,包括:
对所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息进行融合处理,得到融合信息;
通过预设的关联关系识别模型,对所述融合信息进行预测处理,得到所述目标对象与所述第一候选对象之间的关联概率;
将关联概率大于预设概率阈值的第一候选对象设置为所述目标对象关联的上游和/或下游对象。
第二方面,本申请提供一种关联对象识别装置,包括:
获取单元,用于获取待识别的目标对象;
确定单元,用于根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息;
选择单元,用于根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
在本申请一种可能的实现方式中,确定单元还用于:
获取与所述目标对象的行业信息相同的多个第二候选对象;
提取所述多个第二候选对象的经营范围信息中出现次数大于预设次数阈值的第一关键词信息;
通过预设的关联关系识别模型,对所述目标对象的物流信息、所述目标对象的经营范围信息和所述第一关键词信息进行处理,得到所述目标对象对应的第一目标系数;
根据所述第一目标系数,对所述第一关键词信息进行加权处理,并将加权后的第一关键词信息与所述目标对象的经营范围信息进行融合,得到所述目标对象的实际经营信息;
所述根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象之前,所述方法还包括:
获取与第一候选对象的行业信息相同的多个第三候选对象;
提取所述多个第三候选对象的经营范围信息中出现次数大于预设次数阈值的第二关键词信息;
通过预设的关联关系识别模型,对所述第一候选对象的物流信息、所述第一候选对象的经营范围信息和所述第二关键词信息进行处理,得到所述第一候选对象对应的第二目标系数;
根据所述第二目标系数,对所述第二关键词信息进行加权处理,并将加权后的第二关键词信息与所述第一候选对象的经营范围信息进行融合,得到所述第一候选对象的实际经营信息。
在本申请一种可能的实现方式中,确定单元还用于:
获取订单类型为目标类型的目标订单信息,并将同一目标订单信息中的寄件对象和所述同一目标订单信息中的收件对象分别作为上游对象,以及与所述上游对象关联的第一下游对象;
根据所述上游对象的经营范围信息和物流信息,和所述第一下游对象的经营范围信息和物流信息,构建正样本数据;
通过所述正样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型。
在本申请一种可能的实现方式中,确定单元还用于:
针对每一个上游对象,根据对应的第一下游对象的行业信息,从预设的样本对象中选择所述每一个上游对象对应的第二下游对象,其中,所述每一个上游对象对应的第二下游对象是指与所述每一个上游对象不是上下游关系的样本对象;
根据所述上游对象的经营范围信息和寄件信息,以及所述上游对象对应的第二下游对象的经营范围信息和寄件信息,构建负样本数据;
根据所述正样本数据和所述负样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型。
在本申请一种可能的实现方式中,确定单元还用于:
针对每一个上游对象,统计所述每一个上游对象对应的第一下游对象的行业信息,得到所述每一个上游对象对应的下游行业分布信息,其中,行业分布信息中包含多个不同行业信息的行业占比;
统计所有第一下游对象的行业信息,得到全局行业分布信息;
根据所述样本对象的行业信息,分别从所述每一个上游对象对应的下游行业分布信息中确定所述每一个上游对象对应的个体行业占比,以及从所述全局行业分布信息中确定所述样本对象对应的全局行业占比;
根据所述每一个上游对象对应的个体行业占比,以及所述样本对象对应的全局行业占比,从所述样本对象中选择所述每一个上游对象对应的第二下游对象。
在本申请一种可能的实现方式中,选择单元还用于:
获取所述目标对象的对象身份信息,以及预设的第一候选对象的对象身份信息;
根据所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
在本申请一种可能的实现方式中,选择单元还用于:
对所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息进行融合处理,得到融合信息;
通过预设的关联关系识别模型,对所述融合信息进行预测处理,得到所述目标对象与所述第一候选对象之间的关联概率;
将关联概率大于预设概率阈值的第一候选对象设置为所述目标对象关联的上游和/或下游对象。
第三方面,本申请还提供一种电子设备,电子设备包括处理器、存储器以及存储于存储器中并可在处理器上运行的计算机程序,处理器调用存储器中的计算机程序时执行本申请提供的任一种关联对象识别方法中的步骤。
第四方面,本申请还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器执行时实现本申请提供的任一种关联对象识别方法中的步骤。
综上所述,本申请实施例提供的关联对象识别方法,包括:获取待识别的目标对象;根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息;根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
可见,本申请实施例提供的关联对象识别方法,一方面可以通过目标对象的物流信息,对目标对象的经营范围信息进行修正,得到较为精确的实际经营信息,并根据较为精确的实际经营信息进行关联对象的识别,进而得到的目标对象关联的上游对象和/或下游对象更加准确。另一方面,本申请实施例提供的关联对象识别方法采用的数据为较为常见的经营范围信息和物流信息,因此泛用性更强。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的关联对象识别方法的应用场景示意图;
图2是本申请实施例中提供的关联对象识别方法的一种流程示意图;
图3是本申请实施例中提供的得到实际经营信息的一种流程示意图;
图4是本申请实施例中提供的预设的关联关系识别模型的结构示意图;
图5是本申请实施例中提供的得到预设的关联关系识别模型的一种流程示意图;
图6是本申请实施例中提供的得到预设的关联关系识别模型的另一种流程示意图;
图7是本申请实施例中提供的关联对象识别方法的另一种流程示意图;
图8是本申请实施例中提供的预设的关联关系识别模型的又一种结构示意图;
图9是本申请实施例中提供的关联对象识别装置的一个实施例结构示意图;
图10是本申请实施例中提供的电子设备的一个实施例结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请实施例的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
为了使本领域任何技术人员能够实现和使用本申请,给出了以下描述。在以下描述中,为了解释的目的而列出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况下也可以实现本申请。在其它实例中,不会对公知的过程进行详细阐述,以避免不必要的细节使本申请实施例的描述变得晦涩。因此,本申请并非旨在限于所示的实施例,而是与符合本申请实施例所公开的原理和特征的最广范围相一致。
本申请实施例提供一种关联对象识别方法、装置、电子设备和存储介质。其中,该关联对象识别装置可以集成在电子设备中,该电子设备可以是服务器,也可以是终端等设备。
本申请实施例关联对象识别方法的执行主体可以为本申请实施例提供的关联对象识别装置,或者集成了该关联对象识别装置的服务器设备、物理主机或者用户设备(UserEquipment,UE)等不同类型的电子设备,其中,关联对象识别装置可以采用硬件或者软件的方式实现,UE具体可以为智能手机、平板电脑、笔记本电脑、掌上电脑、台式电脑或者个人数字助理(Personal Digital Assistant,PDA)等终端设备。
该电子设备可以采用单独运行的工作方式,或者也可以采用设备集群的工作方式。
参见图1,图1是本申请实施例所提供的关联对象识别***的场景示意图。其中,该关联对象识别***可以包括电子设备101,电子设备101中集成有关联对象识别装置。
另外,如图1所示,该关联对象识别***还可以包括存储器102,用于存储数据,如存储文本数据。
需要说明的是,图1所示的关联对象识别***的场景示意图仅仅是一个示例,本申请实施例描述的关联对象识别***以及场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着关联对象识别***的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
下面,开始介绍本申请实施例提供的关联对象识别方法,本申请实施例中以电子设备作为执行主体,为了简化与便于描述,后续方法实施例中将省略该执行主体,该关联对象识别方法包括:获取待识别的目标对象;根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息;根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
参照图2,图2是本申请实施例提供的关联对象识别方法的一种流程示意图。需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。该关联对象识别方法具体可以包括以下步骤201-步骤203,其中:
201、获取待识别的目标对象。
本申请实施例提供的关联对象识别方法可以应用于多种场景。
在一些实施例中,本申请实施例提供的关联对象识别方法可以应用于供应链中企业之间的交易预警。例如,当快递公司接受到供应链中上游企业的寄件请求时,可以通过本申请实施例提供的关联对象识别方法,识别收件的对象是否为供应链中该上游企业可能的下游企业,在收件的对象被识别为该上游企业对应的非下游企业时,为该上游企业提供预警。
其中,供应链中的上游企业可以理解为在供应链中处于上游的企业,供应链中的下游企业可以理解为在供应链中处于下游的企业。例如在新能源电池的供应链中,上游企业可以是指正极材料、负极材料、电解液、隔膜、固体电解质、结构件、氢氧化镍等原材料的供应企业,供应链中的下游企业可以是指销售新能源汽车、电动自行车、电动摩托车等产品的企业。
在另一些实施例中,本申请实施例提供的关联对象识别方法还可以应用于交易对象的推荐领域。示例性地,用户可以通过本申请实施例提供的关联对象识别方法,从多个预设的企业中查询得到潜在的交易对象。例如,将个体商户的个人商户主作为用户时,用户可以通过本申请实施例提供的关联对象识别方法,从多个预设的企业中查询得到可以作为进货渠道商的交易对象。
其中,上述预设的企业可以包括所有企业,由人工采集后存储在第一预设数据库中。第一预设数据库可以是用户在查询时采用的软件的后台数据库,其中至少存储有所有企业的行业信息。
从上文可知,步骤201中的目标对象既可以是指企业,也可以是指个人,本申请实施例对此不进行限制。在下文中为了方便理解,默认本申请实施例的应用场景为供应链中企业之间的交易预警,目标对象是指供应链中的企业,既可以是指供应链中的上游企业,可以是指供应链中的下游企业。例如,当本申请实施例中的关联对象识别方法应用于新能源电池的供应链时,目标对象既可以是指正极材料、负极材料、电解液、隔膜、固体电解质、结构件、氢氧化镍等原材料的供应企业,即供应链中的上游企业,也可以是指销售新能源电池驱动的新能源汽车、新能源电池驱动的电动自行车、新能源电池驱动的电动摩托车等产品的销售企业,即供应链中的下游企业。
示例性地,当本申请实施例的应用场景为,快递公司为供应链中的企业提供交易预警时,电子设备可以获取待发货快递订单,从待发货快递订单中筛选得到寄件对象和收件对象均为企业的候选订单,然后将候选订单中的寄件对象作为目标对象。例如,电子设备可以获取待发货快递订单,然后通过命名实体识别技术(Named Entity Recognition,NER)提取待发货快递订单中的寄件对象和待发货快递订单中的收件对象,然后判断得到的寄件对象和收件对象是否为企业,若得到的寄件对象和收件对象均为企业,则将该待发货快递订单作为候选订单,将得到的寄件对象作为目标对象。判断时,可以将寄件对象和收件对象分别与第二预设数据库中的预设企业进行匹配,若第二预设数据库中包含进行匹配的对象,则说明对象为企业。其中,第二预设数据库可以是快递公司的后台管理数据库,在第二预设数据库中至少存储有经过人工采集后得到的所有企业的企业名称等数据。
可以理解的,第一预设数据库中必然包含所有企业的企业名称。因此,第一预设数据库和第二预设数据库中的数据可以相同,也可以不相同,例如第一预设数据库中包含所有企业的行业信息,以及所有企业的企业名称时,第二预设数据库中可以同时包含所有企业的行业信息和企业名称,也可以仅包含企业的企业名称。
其中,命名实体识别技术是识别文本中具有特定意义的实体的技术。例如,在本申请实施例中可以采用知识图谱(Knowledge Graph)模型进行命名实体识别。在一些实施例中,可以采用TransE模型进行命名实体识别。
其中,TransE模型是一种将知识图谱中的关系看作实体间的某种平移向量,以进行实体命名的模型。
202、根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息。
经营范围信息中可以包括企业所有的经营产品信息。例如,目标对象为供应链中的上游企业时,目标对象的经营范围信息中可以包括正极材料、负极材料、电解液、隔膜、固体电解质、结构件、氢氧化镍等目标对象经营的产品的信息。
在一些实施例中,电子设备可以通过网络,查询得到目标对象的经营范围信息。例如,电子设备可以通过网络中的搜索引擎搜索目标对象的名称,然后从公开了企业的经营产品信息的网页中得到目标对象的经营范围信息。
物流信息可以包括企业的寄件信息。例如,物流信息可以包括企业的历史寄件产品种类、各历史寄件产品种类的历史寄件数量和各历史寄件产品种类的平均历史寄件间隔等等。其中,历史寄件产品种类是指企业在历史时间内寄件的种类,每个历史寄件产品种类的历史寄件数量是指对于该历史寄件产品种类,在历史时间内的寄件数量,每个历史寄件产品种类的平均历史寄件间隔是指对于该历史寄件产品种类,在历史时间内的平均寄件间隔,历史时间可以由实际场景的需求进行设定,例如,可以将候选订单的生成时间的前3个月作为目标对象对应的历史时间,候选订单的说明可以参考上文,具体不进行赘述。
在一些实施例中,电子设备可以读取快递公司的后台管理数据库,以得到目标对象的物流信息。
需要说明的是,目标对象的经营范围信息和目标对象的物流信息均为预先获取并存储在数据库中的数据,在执行步骤202时,电子设备可以查询对应的数据库,以得到目标对象的经营范围信息和目标对象的物流信息。目标对象的经营范围信息和目标对象的物流信息各自的来源可以参考上文。
实际经营信息可以包括企业实际的经营产品信息。经营范围信息与实际经营信息的差别在于,经营范围信息除了包括实际经营信息之外,还可能包括企业未实际经营的产品信息。例如企业在公开经营范围信息时,通常会将当前实际经营的产品信息、未来可能经营的产品信息、以及为了招商引资虚构的经营产品信息同时公开,此时若电子设备从公开了企业的经营产品信息的网页中得到目标对象的经营范围信息,则得到的经营范围信息中还包括未来可能经营的产品信息,以及为了招商引资虚构的经营产品信息,即未实际经营的产品信息,如果直接通过经营产品信息进行供应链中企业之间的交易预警,则可能会出现误判。因此,在本申请实施例中,可以通过目标对象的物流信息和目标对象的经营范围信息,得到较为精确的实际经营信息,并根据目标对象的实际经营信息,进行供应链中企业之间的交易预警。
在一些实施例中,电子设备可以对经营范围信息进行分词处理,得到经营范围信息中企业公开的各经营产品信息,然后将物流信息中历史寄件产品的信息与各经营产品信息进行匹配,得到既包含在历史寄件产品的信息中,又包含在各经营产品信息中的目标产品信息,将目标产品信息作为目标对象的实际经营信息,可以理解的,目标产品信息可以包括一种或者多种产品的信息。
其中,电子设备可以通过word2vec等开源模型对经营范围信息进行分词处理,以得到经营范围信息中企业公开的各经营产品信息。
word2vec模型是一个将词转换成向量形式的模型,包含分词等功能。
203、根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
其中,预设的第一候选对象可以由所有能够采集到经营范围信息的企业构成。或者,为了减少电子设备执行步骤203时的计算量,可以从快递公司的后台管理数据库中读取历史快递订单信息,得到历史快递订单信息中的寄件对象和收件对象,并将寄件对象和收件对象作为第一候选对象包含的企业,可见,通过该方法,第一候选对象中仅包含了存在寄件和/或收件行为的企业,可以除去空头企业等不会涉及供应链的企业。又或者,可以将候选订单中目标对象对应的所有寄件对象和/或所有收件对象作为预设的第一候选对象,例如候选订单包括“寄件对象A发送至收件对象B”、“寄件对象A发送至收件对象C”、“寄件对象A发送至收件对象D”、“寄件对象E发送至收件对象A”、“寄件对象F发送至收件对象A”共5个订单时,若将对象A作为待识别的目标对象,则可以将对象B、对象C、对象D、对象E和对象F作为预设的第一候选对象。
为了方便理解,在下文中若未作特别声明,则认为将候选订单中目标对象对应的所有寄件对象和/或所有收件对象作为预设的第一候选对象。
获取第一候选对象的实际经营信息的方法可以参考步骤202,具体不进行赘述。
示例性地,电子设备可以将目标对象的实际经营信息与每个第一候选对象的实际经营信息分别进行相似度对比,从第一候选对象中选择相似度大于预设的相似度阈值的对象,将选择得到的对象作为目标对象关联的上游对象和/或下游对象。以上文中的例子进行说明,若将对象B、对象C、对象D、对象E和对象F作为预设的第一候选对象,将对象A作为待识别的目标对象,并且对象B、对象C、对象D、对象E和对象F中,对应的实际经营信息与对象A的实际经营信息之间的相似度大于预设的相似度阈值的是对象B和对象E,因此对象B和对象E是选择后得到的与目标对象关联的对象,由于对象B是对象A的寄件目标,因此可以将对象B作为对象A的下游对象,由于对象A是对象E的寄件目标,因此可以将对象E作为对象A的上游对象。
需要说明的是,此处的相似度对比是指分别将目标对象的实际经营信息,以及每个第一候选对象的实际经营信息进行编码,得到对应的语义特征,再将语义特征进行相似度对比。示例性地,电子设备可以采用word2vec模型等开源模型,分别将目标对象的实际经营信息,以及每个第一候选对象的实际经营信息进行编码,得到对应的语义特征,word2vec模型的说明可以参考上文,具体不进行赘述。
其中,预设的相似度阈值可以根据实际场景需求进行设置,例如,可以将相似度阈值设置为0.9。
综上所述,本申请实施例提供的关联对象识别方法,包括:获取待识别的目标对象;根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息;根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
可见,本申请实施例提供的关联对象识别方法,一方面可以通过目标对象的物流信息,对目标对象的经营范围信息进行修正,得到较为精确的实际经营信息,并根据较为精确的实际经营信息进行关联对象的识别,进而得到的目标对象关联的上游对象和/或下游对象更加准确。另一方面,本申请实施例提供的关联对象识别方法采用的数据为较为常见的经营范围信息和物流信息,因此泛用性更强。
在一些实施例中,除了步骤202中的方法之外,还可以从行业信息与目标对象的行业信息相同的多个对象中,统计得到在该行业对应的经营范围信息中频繁出现的产品信息,并根据频繁出现的产品信息,确定目标对象的实际经营信息。
参考图3,此时,步骤“根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息”,包括:
301、获取与所述目标对象的行业信息相同的多个第二候选对象。
多个第二候选对象可以由所有能够采集到经营范围信息的企业构成。示例性地,电子设备可以从第一预设数据库中查询得到目标对象的目标行业信息,并根据目标行业信息从第一预设数据库中读取得到所有对应行业信息为目标行业信息的第二候选对象,或者,也可以根据目标行业信息从第一预设数据库中读取得到预设数量的对应行业信息为目标行业信息的第二候选对象,预设数量可以根据实际场景的需求进行设置。
其中,对象的行业信息中包含了该对象经营业务对应的行业。例如,对于经营业务为新能源电池的正极材料、负极材料、电解液、隔膜、固体电解质、结构件、氢氧化镍等原材料的供应企业,其对应的行业信息可以是指电池原料供应行业。对于销售新能源电池驱动的新能源汽车、新能源电池驱动的电动自行车、新能源电池驱动的电动摩托车的销售企业等企业,其对应的行业信息可以是指新能源车行业。当对象是指企业时,对象的行业信息可以由人工采集后与第一预设数据库中的对象进行关联,第一预设数据库的说明可以参考上文,具体不进行赘述。
可以理解的,行业信息与经营范围信息之间的区别在于,行业信息用于指代对象对应的行业,可以是指该对象对应行业的名称,经营范围信息用于指代对象的经营产品,或者经营业务,可以是指对象经营产品的产品名称,或者是指对象经营业务的业务名称。同一行业信息可以对应多种经营范围信息,例如经营范围信息“新能源电池的正极材料、负极材料、电解液、隔膜、固体电解质、结构件、氢氧化镍”可以对应行业信息“电池原料供应行业”,或者,经营范围信息“新能源电池的电解液、隔膜、固体电解质”也可以对应行业信息“电池原料供应行业”。
而物流信息与行业信息、经营范围信息的区别在于,物流信息中包含的信息与经营产品/经营业务可能相关,也可能无关,其中可能包括了办公用品等与经营产品/经营业务无关的信息,也可能包括了实际经营的产品等与经营产品/经营业务相关的信息,因此需要同时根据经营范围信息和物流信息,才能准确得到实际经营信息,筛除物流信息中与经营产品/经营业务无关的信息。
302、提取所述多个第二候选对象的经营范围信息中出现次数大于预设次数阈值的第一关键词信息。
上文中已经说明,对象的经营范围信息中可以包括企业所有的经营产品信息,因此可以理解的,第一关键词信息可以是指在多个第二候选对象的经营范围信息中,出现次数大于预设次数阈值的经营产品信息,其中包含了对于经营业务在目标行业内的企业,常见的经营产品。示例性地,电子设备可以对各第二候选对象的经营范围信息进行分词处理,并统计分词后得到的各类经营产品信息的数量,将对应数量大于预设次数阈值的经营产品信息作为第一关键词信息。其中,可以采用word2vec模型等开源模型对各第二候选对象的经营范围信息进行分词处理,word2vec模型的说明可以参考上文,具体不进行赘述。
为了方便理解,以下举例进行示例性说明:假设上述目标行业信息是指电池原料供应行业,预设次数阈值为2,第二候选对象包括:原材料的供应企业G、原材料的供应企业H和原材料的供应企业I,并且G、H和I分别对应的经营范围信息中包括的经营产品信息为“正极材料、负极材料、电解液”、“正极材料、负极材料、隔膜”和“正极材料、负极材料、氢氧化镍”,则经过分词处理后,可以得到的各类经营产品信息为“正极材料”、“负极材料”、“电解液”、“隔膜”和“氢氧化镍”,因此统计后得到的第一关键词信息为“正极材料”和“负极材料”,说明对于经营业务在电池原料供应行业中的企业,其常见的经营产品为正极材料和负极材料。
其中,预设次数阈值可以根据实际场景的需求进行设置,不能将上述例子中的预设次数阈值作为对本申请实施例的限制。
303、通过预设的关联关系识别模型,对所述目标对象的物流信息、所述目标对象的经营范围信息和所述第一关键词信息进行处理,得到所述目标对象对应的第一目标系数。
目标对象对应的第一目标系数用于融合目标对象对应的第一关键词信息,以及目标对象的经营范围信息,以得到实际经营信息,由此得到的实际经营信息可以更加准确地体现目标对象实际经营的产品信息。
其中,预设的关联关系识别模型用于对象之间的关联关系识别,在本申请实施例中,可以用于供应链中企业之间的上下游关系识别。参考图4,图4中提供了一种关联关系识别模型400的结构模型,关联关系识别模型400包括:
自注意力层401,用于对物流信息、经营范围信息和关键词信息进行处理,得到对象对应的目标系数,并根据目标系数,融合对象对应的关键词信息,以及对象的经营范围信息,以得到对象的实际经营信息,此处的对象可以包括目标对象和第一候选对象中的任意一者,即自注意力层401可以用于获取目标对象的实际经营信息,也可以用于获取第一候选对象的实际经营信息。
特征融合层402,用于融合目标对象的实际经营信息,以及第一候选对象的实际经营信息,得到融合信息,进行特征融合的目的是将两种信息融合为一种信息,以方便后续的预测。例如,可以将目标对象的实际经营信息和第一候选对象的实际经营信息进行拼接,以得到融合信息。在融合信息中,包含了目标对象的实际经营信息,以及第一候选对象的实际经营信息。
识别层403,用于根据融合信息,预测目标对象与第一候选对象之间的关联概率,并根据关联概率从第一候选对象中选择与目标对象关联的上游对象和/或下游对象,例如,可以将关联概率大于预设的概率阈值的第一候选对象作为与目标对象关联的上游对象和/或下游对象,预设的概率阈值可以根据实际场景需求进行设置。
示例性地,电子设备可以通过图4中关联关系识别模型400的自注意力层401,采用式子(1)确定目标对象的第一目标系数:
其中,ω1是指目标对象的第一目标系数,W1、W2、W3、b1、b2、b3均为训练好的参数,是指对目标对象的物流信息进行编码后,得到的语义特征,/>是指对目标对象的经营范围信息进行编码后,得到的语义特征、/>是指对目标对象对应的第一关键词信息进行编码后,得到的语义特征。
可见,式子(1)在计算目标对象的第一目标系数时,考虑到了目标对象的物流信息、目标对象的经营范围信息和目标对象的第一关键词信息,其中包含的信息更加丰富。第一目标系数可以理解为注意力权重,用于表征第一关键词信息的重要性程度。
需要说明的是,在获取第一候选对象的实际经营信息的过程中,通过图4中关联关系识别模型400的自注意力层401得到第一候选对象的第一目标系数时,既可以根据第一候选对象的行业信息,提取得到第一候选对象对应的第二关键词信息,根据第二关键词信息得到第一候选对象的实际经营信息,也可以将目标对象对应的第一关键词信息作为第一候选对象对应的第二关键词信息,根据第二关键词信息得到第一候选对象的实际经营信息。若根据第一候选对象的行业信息,提取得到第一候选对象对应的第二关键词信息,则可以在计算第二目标系数时,融入第一候选对象对应的行业中常见的经营产品信息,因此通过特征融合层402得到的融合信息中,同时包含了第一候选对象对应的行业中常见的经营产品信息,以及目标对象对应的行业中常见的经营产品信息,进而提高识别的准确度。而直接采用目标对象对应的第一关键词信息时,无需进行提取操作,以得到第一候选对象对应的第二关键词信息,因此可以降低本申请提供的关联对象识别方法的算力需求,同时,在计算第一候选对象的第二目标系数时,既考虑到了目标对象对应的行业中,常见的经营产品信息与第一候选对象的经营范围信息,以及第一候选对象的物流信息之间的差异,同样可以提高识别的准确度。在构建自注意力层401时,可以根据实际的需要进行设置。
以直接采用目标对象对应的第一关键词信息得到第一候选对象的第二目标系数为例,电子设备可以通过图4中关联关系识别模型400的自注意力层401,采用式子(2)确定第一候选对象的第二目标系数:
其中,ω2是指第一候选对象的第二目标系数,W1、W2、W3、b1、b2、b3均为训练好的参数,是指对第一候选对象的物流信息进行编码后,得到的语义特征,/>是指对第一候选对象的经营范围信息进行编码后,得到的语义特征、/>是指对目标对象的第二关键词信息进行编码后,得到的语义特征。
为了方便理解,下文中若未做特别声明,则认为电子设备直接采用目标对象对应的第一关键词信息得到第一候选对象的第二目标系数,即下文中的第二关键词信息是指目标对象的第一关键词信息。
304、根据所述第一目标系数,对所述第一关键词信息进行加权处理,并将加权后的第一关键词信息与所述目标对象的经营范围信息进行融合,得到所述目标对象的实际经营信息。
以下给出一种得到第一候选对象的实际经营信息的方法:
(A)获取与第一候选对象的行业信息相同的多个第三候选对象。
(B)提取所述多个第三候选对象的经营范围信息中出现次数大于预设次数阈值的第二关键词信息。
(C)通过预设的关联关系识别模型,对所述第一候选对象的物流信息、所述第一候选对象的经营范围信息和所述第二关键词信息进行处理,得到所述第一候选对象对应的第二目标系数。
(D)根据所述第二目标系数,对所述第二关键词信息进行加权处理,并将加权后的第二关键词信息与所述第一候选对象的经营范围信息进行融合,得到所述第一候选对象的实际经营信息。
其中,第三候选对象的获取方法可以参考第二候选对象。第二关键词信息、第二目标系数的说明和处理方法可以参考上文中第一关键词信息和第一目标系数的说明和处理方法,预设的关联关系识别模型可以是指关联关系识别模型400。
示例性地,电子设备可以通过图4中关联关系识别模型400的自注意力层401,对第一关键词信息进行加权处理,并将加权后的第一关键词信息与目标对象的经营范围信息进行融合,得到目标对象的实际经营信息。同时,电子设备还可以通过图4中关联关系识别模型400的自注意力层401,将加权后的第一关键词信息与第一候选对象的经营范围信息进行融合,得到第一候选对象的实际经营信息。
在执行步骤304之后,电子设备还可以通过图4中关联关系识别模型400的特征融合层402和识别层403,根据目标对象的实际经营信息,以及第一候选对象的实际经营信息,从第一候选对象中选择与目标对象关联的上游对象和/或下游对象。例如,电子设备可以通过图4中关联关系识别模型400的特征融合层402,将目标对象的实际经营信息和每个第一候选对象的实际经营信息分别进行融合,得到各第一候选对象对应的融合信息,并通过图4中关联关系识别模型400的识别层403,对每个融合信息分别进行预测,得到各第一候选对象对应的关联概率,并根据各第一候选对象对应的关联概率,从第一候选对象中选择关联概率较大的对象,作为目标对象关联的上游对象和/或下游对象,具体可以参考步骤203中的说明。融合的方法,以及根据融合信息获取关联概率的方法可以参考上文,例如,可以将目标对象的实际经营信息和每个第一候选对象的实际经营信息分别进行拼接,得到各第一候选对象对应的融合信息,并通过图4中关联关系识别模型400的识别层403,对每个融合信息分别进行预测,得到各第一候选对象对应的关联概率。
其中,预设的关联关系识别模型可以由正样本数据训练得到,为了快速地得到正样本数据,可以对历史快递订单的订单类型,对历史快递订单进行筛选,根据筛选后得到的快递订单信息,构建正样本数据。参考图5,此时,预设的关联关系识别模型通过以下方法训练得到:
501、获取订单类型为目标类型的目标订单信息,并将同一目标订单信息中的寄件对象和所述同一目标订单信息中的收件对象分别作为上游对象,以及与所述上游对象关联的第一下游对象。
其中,订单可以是指快递订单,目标类型可以是指商务订单,即用于发送合同、协议等商务文件的订单。
将商务订单作为目标类型的原因是即使不是在供应链中为上下游关系的两个企业之间,也可能会产生快递订单,但是只有在供应链中为上下游关系的两个企业之间,才会相互发送合同、协议等商务文件,因此根据发送商务文件的商务订单构建得到的正样本数据更加准确,并且可以直接根据订单类型进行筛选,同时降低人力消耗。
其中,历史快递订单的订单类型可以由历史快递订单携带,存储在快递公司的后台管理数据库中。
示例性地,电子设备可以提取同一目标订单信息中的寄件对象和收件对象,将寄件对象作为上游对象,将收件对象作为该上游对象对应的第一下游对象,可以理解的,第一下游对象是作为与对应的上游对象在供应链中为上下游关系的对象。
需要说明的是,每一个上游对象对应的第一下游对象可以仅有一个,也可以有多个,例如有多个目标订单信息的寄件对象均为对象J,而各目标订单信息的收件对象分别为对象K、对象L和对象M时,若将对象J作为上游对象,则该上游对象对应的第一下游对象包括对象K、对象L和对象M,共3个。
502、根据所述上游对象的经营范围信息和物流信息,和所述第一下游对象的经营范围信息和物流信息,构建正样本数据。
上游对象的经营范围信息和物流信息,以及第一下游对象的经营范围信息和物流信息的获取方法可以参考上文,具体不进行赘述。通过步骤502得到的正样本数据中,包含多组上下游对象,各组上下游对象中上游对象的经营范围信息和物流信息,以及各组上下游对象中第一下游对象的经营范围信息和物流信息。
其中,本步骤中的构建正样本数据是指将信息作为下文中初始的关联关系识别模型的待输入数据,可以理解的,正样本数据中包含上游对象的经营范围信息和物流信息,和第一下游对象的经营范围信息和物流信息。
503、通过所述正样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型。
其中,初始的关联关系识别模型的结构可以参考图4,具体不进行赘述。
为了进一步提高训练的效果,得到高质量的预设的关联关系识别模型,电子设备在训练初始的关联关系识别模型时,还可以同时获取负样本数据。负样本是通过分类错误的标签,反向对机器学习模型进行训练,提高机器学习模型的预测能力的样本。
参考图6,此时,步骤“通过所述正样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型”,包括:
601、针对每一个上游对象,根据对应的第一下游对象的行业信息,从预设的样本对象中选择所述每一个上游对象对应的第二下游对象。
其中,预设的样本对象可以包括所有企业,例如,可以包括上文中第一预设数据库中存储的所有企业。
行业信息的说明和获取方法可以参考上文,具体不进行赘述。
上游对象的第二下游对象是指在样本对象中,与该上游对象并不会在供应链上为上下游关系的对象。
在一些实施例中,电子设备可以选择行业信息与第一下游对象的行业信息不同的样本对象,将其作为上游对象对应的第二下游对象。例如对于上游对象O,其对应的第一下游对象仅有一个,并且对应的行业为新能源电池行业时,可以从样本对象中,选择对应的行业并非是新能源电池行业的对象作为上游对象O的第二下游对象,进而由上游对象O和上游对象O对应的第二下游对象所构成的样本能够作为负样本数据对初始的关联关系识别模型进行训练。又例如,对于上述上游对象J,其对应的第一下游对象包括对象K、对象L和对象M,共3个,并且对象K、对象L和对象M分别对应的行业为新能源电池行业、餐饮行业和服装行业时,可以从样本对象中,选择对应的行业并非是新能源电池行业、餐饮行业或服装行业的对象作为上游对象J的第二下游对象,进而由上游对象J和上游对象J对应的第二下游对象所构成的样本能够作为负样本数据对初始的关联关系识别模型进行训练。
同样地,第二下游对象可以只有一个,也可以有多个,本申请实施例对此不进行限制。
但是,通过上述方法得到的负样本数据仍然不准确。因此在另一些实施例中,对于每一个上游对象,电子设备还可以统计其对应的第一下游对象的分布情况,以及在正样本数据中所有第一下游对象的分布情况,并结合上游对象对应的第一下游对象的分布情况,以及在正样本数据中所有第一下游对象的分布情况,选择每个上游对象对应的第二下游对象。此时,步骤“针对每一个上游对象,根据对应的第一下游对象的行业信息,从预设的样本对象中选择所述每一个上游对象对应的第二下游对象”,包括:
(1)针对每一个上游对象,统计所述每一个上游对象对应的第一下游对象的行业信息,得到所述每一个上游对象对应的下游行业分布信息。
行业分布信息中包含多个不同行业信息的行业占比。
其中,上游对象的下游行业分布信息包括对于该上游对象,其对应的第一下游对象中各行业的行业占比,可以理解为不同行业的企业作为第一下游对象的热门程度。下游行业分布信息中的各行业占比可以由各行业对应的第一下游对象数量计算得到,为了方便理解,继续以上文中的上游对象J为例进行说明,若上游对象J对应的第一下游对象包括对象K、对象L和对象M,共3个,并且对象K、对象L和对象M分别对应的行业为新能源电池行业、餐饮行业和服装行业时,则上游对象J的下游行业分布信息中,包括了新能源电池行业、餐饮行业和服装行业分别对应的行业占比。示例性地,可以通过式子(3)-式子(5)分别计算新能源电池行业、餐饮行业和服装行业分别对应的行业占比:
B1 J=I1 J/Iall J式子(3)
B2 J=I2 J/Iall J式子(4)
B3 J=I3 J/Iall J式子(5)
其中,B1 J为新能源电池行业对应的行业占比,I1 J为在上游对象J的第一下游对象中,新能源电池行业对应的第一下游对象数量,Iall J为上游对象J的第一下游对象总数量。B2 J为餐饮行业对应的行业占比,I2 J为在上游对象J的第一下游对象中,餐饮行业对应的第一下游对象数量。B3 J为服装行业对应的行业占比,I3 J为在上游对象J的第一下游对象中,服装行业对应的第一下游对象数量。
由于I1 J、I2 J和I3 J均为1,因此B1 J、B2 J和B3 J均为1/3,即对于上游对象J,其对应的下游行业分布信息中包含了:B1 J、B2 J和B3 J均为1/3的信息,即对象K、对象L和对象M中经营业务分别在服装行业、餐饮行业和服装行业中的对象数量占比均为1/3。
通过每个上游对象对应的下游行业分布信息,电子设备可以得到不同行业的企业对于该上游对象的第一下游对象的热门程度,热门程度越大,说明对应行业的企业作为该上游对象的第一下游对象的可能性越大,热门程度越小,说明对应行业的企业作为该上游对象的第一下游对象的可能性越小。
(2)统计所有第一下游对象的行业信息,得到全局行业分布信息。
其中,全局行业分布信息可以包括在所有第一下游对象中,不同行业对应的第一下游对象数量占第一下游对象总数量的比例,如步骤(1)所述,全局行业分布信息中同样包括多个行业占比。例如,若第一下游对象总数量为200,其中新能源电池行业对应的第一下游对象数量为100,餐饮行业对应的第一下游对象数量为50,服装行业对应的第一下游对象数量为50,则新能源电池行业的行业占比为0.5,餐饮行业和服装行业的行业占比均为0.25,即全局行业分布信息包括0.5、0.25和0.25共3个比例。
统计得到全局行业分布信息的目的是为了从行业全局判断各行业中的企业作为第一下游对象的热门程度,热门程度越大,说明对应行业的企业作为第一下游对象的可能性越大,热门程度越小,说明对应行业的企业作为第一下游对象的可能性越小。
可见,通过步骤(1)-步骤(2),电子设备可以得到对于每个上游对象个体,不同行业作为第一下游对象的可能性,以及不考虑上游对象的差异,即从全局考虑时,不同行业作为第一下游对象的可能性,进而结合对于个体,不同行业作为第一下游对象的可能性,以及对于全局,不同行业作为第一下游对象的可能性,提高构建负样本数据的准确性。
(3)根据所述样本对象的行业信息,从所述每一个上游对象对应的下游行业分布信息中确定所述每一个上游对象对应的个体行业占比,并从所述全局行业分布信息中确定所述样本对象的行业信息所对应的全局行业占比。
其中,上游对象对应的个体行业占比是指对于该上游对象,样本对象的行业在该上游对象对应的下游行业分布信息中,对应的行业占比,当样本对象是指所有企业时,上游对象对应的个体行业占比是指对于该上游对象,所有企业的行业在该上游对象对应的下游行业分布信息中,对应的行业占比,此时,由于所有企业包括了上游对象,因此若上游对象对应的第二下游对象中包括了上游对象本身,应当将其除去。为了方便理解,继续以步骤(1)中的例子进行说明,假设对于上游对象J,除了自身之外样本对象共包含a和b共2个企业,若样本对象a的行业为新能源电池行业,则对于样本对象a,上游对象J对应的个体行业占比为1/3,说明对于样本对象a而言,其对应的行业“新能源电池行业”在上游对象J的下游企业中,占比为1/3,即上游对象J的下游企业中有1/3的企业对应的行业为“新能源电池行业”。若样本对象b的行业为餐饮行业,则对于样本对象b,上游对象J对应的个体行业占比同样为1/3,说明对于样本对象b而言,其对应的行业“餐饮行业”在上游对象J的下游企业中,占比为1/3,即上游对象J的下游企业中有1/3的企业对应的行业为“餐饮行业”。
其中,样本对象对应的全局行业占比是指样本对象的行业在全局行业分布信息中,对应的行业占比。为了方便理解,继续以步骤(2)中的例子进行说明,若样本对象c的行业为新能源电池行业,则样本对象c对应的全局行业占比为0.5,若样本对象d的行业为餐饮行业,则样本对象d对应的全局行业占比为0.25。
个体行业占比与全局行业占比的区别在于,全局行业占比不考虑每个上游对象之间的个体差异,用于表征样本对象的行业作为下游对象的行业的可能性,全局行业占比越高,说明样本对象的行业作为下游对象的行业的可能性越高。而个体行业占比考虑每个上游对象之间的个体差异,计算的是对于每个上游对象,样本对象的行业信息在该上游对象对应的下游对象行业中,所占的比例。
(4)根据所述每一个上游对象对应的个体行业占比,以及所述样本对象对应的全局行业占比,从所述样本对象中选择所述每一个上游对象对应的第二下游对象。
示例性地,可以通过式子(6)计算得到对于每一个上游对象,样本对象作为其对应的第二下游对象的概率,并根据得到的概率,从样本对象中选择每一个上游对象对应的第二下游对象。
Pi j=(1-Bi j)Tj式子(6)
其中,Pi j是样本对象中第j个对象作为第i个上游对象对应的第二下游对象的概率,Bi j是对于样本对象中的第j个对象,第i个上游对象对应的个体行业占比,Tj是样本对象中第j个对象的全局行业占比。
可见,通过式子(6),Bi j越小,即对于第i个上游对象,样本对象中第j个对象的行业中的企业作为该上游对象的第一下游对象的概率越低,样本对象中第j个对象作为第i个上游对象对应的第二下游对象的概率越低,而从全局考虑,Tj越大,即样本对象中第j个对象的行业中的企业作为第一下游对象的概率越高,样本对象中第j个对象作为第i个上游对象对应的第二下游对象的概率越高,进而可以筛选得到合理的第二下游对象。
在另一些实施例中,还可以进一步统计样本对象中各对象的行业信息,得到各行业的又一全局行业分布信息,并在计算对于每一个上游对象,样本对象作为其对应的第二下游对象的概率时,融入该又一全局行业分布信息。又一全局行业分布信息的计算方法可以参考步骤(2),具体不进行赘述。
例如,可以通过式子(7)计算得到对于每一个上游对象,样本对象作为其对应的第二下游对象的概率。
Pi j=(1-Bi j)TjHj式子(7)
其中,Pi j是样本对象中第j个对象作为第i个上游对象对应的第二下游对象的概率,Bi j是对于样本对象中的第j个对象,第i个上游对象对应的个体行业占比,Tj是样本对象中第j个对象的全局行业占比,Hj是样本对象中第j个对象的又一全局行业分布信息。
602、根据所述上游对象的经营范围信息和寄件信息,以及所述上游对象对应的第二下游对象的经营范围信息和寄件信息,构建负样本数据。
上游对象的经营范围信息和物流信息,以及第二下游对象的经营范围信息和物流信息的获取方法可以参考上文,具体不进行赘述。通过步骤603得到的负样本数据中,包含多组上下游对象,各组上下游对象中上游对象的经营范围信息和物流信息,以及各组上下游对象中第二下游对象的经营范围信息和物流信息。
在另一些实施例中,还可以在获取每一个上游对象的经营范围信息和寄件信息,以及每一个上游对象对应的第二下游对象的经营范围信息和寄件信息,并构建得到初始样本数据之后,进一步从得到的初始样本数据中筛选得到用于训练的负样本数据。例如,可以通过正例无标记(Positive and unlabeled)算法中的间谍算法(Spy technology),对初始样本数据进行筛选,以得到用于训练的负样本数据。
其中,间谍算法是一种从正样本数据中随机挑选部分正样本为间谍样本,并隐藏其标签,再将挑选的间谍样本混入上述初始样本数据中,借助于间谍样本与初始样本数据中正样本行为的高度一致性,从初始样本数据中筛选高可信度的负样本数据的算法。
603、根据所述正样本数据和所述负样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型。
在一些实施例中,为了进一步提高关联对象识别的准确度,在执行步骤203时,电子设备还可以同时获取对象的对象身份信息,并结合各对象的对象身份信息、物流信息和实际经营信息,从第一候选对象中选择与目标对象关联的上游对象和/或下游对象。参考图7,此时,步骤“根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象”,包括:
701、获取所述目标对象的对象身份信息,以及预设的第一候选对象的对象身份信息。
对象身份信息用于说明对象的身份。例如对象是指企业时,对象身份信息可以包括企业法人、企业地址等等用于说明企业身份信息。其中,对象的对象身份信息可以在人工采集后,存储在上文中的第一预设数据库中,电子设备在执行步骤701时,从第一预设数据库中读取对象的对象身份信息。
702、根据所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
示例性地,电子设备可以通过图8中的关联关系识别模型800,根据各对象的实际经营信息、对象身份信息和物流信息,从第一候选对象中选择与目标对象关联的上游对象和/或下游对象。其中,关联关系识别模型800包括:
自注意力层801,用于对物流信息、经营范围信息和第一关键词信息进行处理,得到对象对应的目标系数,并根据目标系数,融合对象对应的关键词信息,以及对象的经营范围信息,以得到对象的实际经营信息,此处的对象可以包括目标对象和第一候选对象中的任意一者,即自注意力层401可以用于获取目标对象的实际经营信息,也可以用于获取第一候选对象的实际经营信息。
特征融合层802,用于融合目标对象的实际经营信息,以及第一候选对象的实际经营信息,得到融合信息,进行特征融合的目的是将两种信息融合为一种信息,以方便后续的预测。例如,可以将目标对象的实际经营信息和第一候选对象的实际经营信息进行拼接,以得到融合信息。在融合信息中,包含了目标对象的实际经营信息、对象身份信息和物流信息,以及第一候选对象的实际经营信息、对象身份信息和物流信息。
识别层803,用于根据融合信息,确定目标对象与第一候选对象之间的关联概率,并根据关联概率从第一候选对象中选择与目标对象关联的上游对象和/或下游对象。
此时,步骤“根据所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象”,可以包括:
(i)对所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息进行融合处理,得到融合信息。
其中,融合处理的方式可以与上文相同,即通过拼接的方法进行融合。在步骤701中,融合信息中同时包含目标对象的实际经营信息、对象身份信息和物流信息,以及第一候选对象的实际经营信息、对象身份信息和物流信息,目的是整合信息以便后续进行预测。
(ii)通过预设的关联关系识别模型,对所述融合信息进行预测处理,得到所述目标对象与所述第一候选对象之间的关联概率。
预设的关联关系识别模型可以是指关联关系识别模型800。
(iii)将关联概率大于预设概率阈值的第一候选对象设置为所述目标对象关联的上游和/或下游对象。
其中,预设概率阈值用于评估关联概率的大小,可以根据实际场景的需要进行设置。
示例性地,电子设备可以通过关联关系识别模型800的识别层803实现步骤(i)和步骤(iii),具体不进行赘述。
为了更好实施本申请实施例中的关联对象识别方法,在关联对象识别方法基础之上,本申请实施例中还提供一种关联对象识别装置,如图9所示,为本申请实施例中关联对象识别装置的一个实施例结构示意图,该关联对象识别装置900包括:
获取单元901,用于获取待识别的目标对象;
确定单元902,用于根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息;
选择单元903,用于根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
在本申请一种可能的实现方式中,确定单元902还用于:
获取与所述目标对象的行业信息相同的多个第二候选对象;
提取所述多个第二候选对象的经营范围信息中出现次数大于预设次数阈值的第一关键词信息;
通过预设的关联关系识别模型,对所述目标对象的物流信息、所述目标对象的经营范围信息和所述第一关键词信息进行处理,得到所述目标对象对应的第一目标系数;
根据所述第一目标系数,对所述第一关键词信息进行加权处理,并将加权后的第一关键词信息与所述目标对象的经营范围信息进行融合,得到所述目标对象的实际经营信息;
所述根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象之前,所述方法还包括:
获取与第一候选对象的行业信息相同的多个第三候选对象;
提取所述多个第三候选对象的经营范围信息中出现次数大于预设次数阈值的第二关键词信息;
通过预设的关联关系识别模型,对所述第一候选对象的物流信息、所述第一候选对象的经营范围信息和所述第二关键词信息进行处理,得到所述第一候选对象对应的第二目标系数;
根据所述第二目标系数,对所述第二关键词信息进行加权处理,并将加权后的第二关键词信息与所述第一候选对象的经营范围信息进行融合,得到所述第一候选对象的实际经营信息。
在本申请一种可能的实现方式中,确定单元902还用于:
获取订单类型为目标类型的目标订单信息,并将同一目标订单信息中的寄件对象和所述同一目标订单信息中的收件对象分别作为上游对象,以及与所述上游对象关联的第一下游对象;
根据所述上游对象的经营范围信息和物流信息,和所述第一下游对象的经营范围信息和物流信息,构建正样本数据;
通过所述正样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型。
在本申请一种可能的实现方式中,确定单元902还用于:
针对每一个上游对象,根据对应的第一下游对象的行业信息,从预设的样本对象中选择所述每一个上游对象对应的第二下游对象,其中,所述每一个上游对象对应的第二下游对象是指与所述每一个上游对象不是上下游关系的样本对象;
根据所述上游对象的经营范围信息和寄件信息,以及所述上游对象对应的第二下游对象的经营范围信息和寄件信息,构建负样本数据;
根据所述正样本数据和所述负样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型。
在本申请一种可能的实现方式中,确定单元902还用于:
针对每一个上游对象,统计所述每一个上游对象对应的第一下游对象的行业信息,得到所述每一个上游对象对应的下游行业分布信息,其中,行业分布信息中包含多个不同行业信息的行业占比;
统计所有第一下游对象的行业信息,得到全局行业分布信息;
根据所述样本对象的行业信息,分别从所述每一个上游对象对应的下游行业分布信息中确定所述每一个上游对象对应的个体行业占比,以及从所述全局行业分布信息中确定所述样本对象对应的全局行业占比;
根据所述每一个上游对象对应的个体行业占比,以及所述样本对象对应的全局行业占比,从所述样本对象中选择所述每一个上游对象对应的第二下游对象。
在本申请一种可能的实现方式中,选择单元903还用于:
获取所述目标对象的对象身份信息,以及预设的第一候选对象的对象身份信息;
根据所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
在本申请一种可能的实现方式中,选择单元903还用于:
对所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息进行融合处理,得到融合信息;
通过预设的关联关系识别模型,对所述融合信息进行预测处理,得到所述目标对象与所述第一候选对象之间的关联概率;
将关联概率大于预设概率阈值的第一候选对象设置为所述目标对象关联的上游和/或下游对象。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由于该关联对象识别装置可以执行任意实施例中关联对象识别方法中的步骤,因此,可以实现本申请任意实施例中关联对象识别方法所能实现的有益效果,详见前面的说明,在此不再赘述。
此外,为了更好实施本申请实施例中关联对象识别方法,在关联对象识别方法
基础之上,本申请实施例还提供一种电子设备,参阅图10,图10示出了本申请实施例电子设备的一种结构示意图,具体的,本申请实施例提供的电子设备包括处理器1001,处理器1001用于执行存储器1002中存储的计算机程序时实现任意实施例中关联对象识别方法的各步骤;或者,处理器1001用于执行存储器1002中存储的计算机程序时实现如图9对应实施例中各单元的功能。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器1002中,并由处理器1001执行,以完成本申请实施例。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
电子设备可包括,但不仅限于处理器1001、存储器1002。本领域技术人员可以理解,示意仅仅是电子设备的示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
处理器1001可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分。
存储器1002可用于存储计算机程序和/或模块,处理器1001通过运行或执行存储在存储器1002内的计算机程序和/或模块,以及调用存储在存储器1002内的数据,实现计算机装置的各种功能。存储器1002可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的关联对象识别装置、电子设备及其相应单元的具体工作过程,可以参考任意实施例中关联对象识别方法的说明,具体在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,存储介质上存储有计算机程序,该计算机程序被处理器执行时执行本申请任意实施例中关联对象识别方法中的步骤,具体操作可参考任意实施例中关联对象识别方法的说明,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请任意实施例中关联对象识别方法中的步骤,因此,可以实现本申请任意实施例中关联对象识别方法所能实现的有益效果,详见前面的说明,在此不再赘述。
以上对本申请实施例所提供的一种关联对象识别方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种关联对象识别方法,其特征在于,包括:
获取待识别的目标对象;
根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息;
根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
2.根据权利要求1所述的关联对象识别方法,其特征在于,所述根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息,包括:
获取与所述目标对象的行业信息相同的多个第二候选对象;
提取所述多个第二候选对象的经营范围信息中出现次数大于预设次数阈值的第一关键词信息;
通过预设的关联关系识别模型,对所述目标对象的物流信息、所述目标对象的经营范围信息和所述第一关键词信息进行处理,得到所述目标对象对应的第一目标系数;
根据所述第一目标系数,对所述第一关键词信息进行加权处理,并将加权后的第一关键词信息与所述目标对象的经营范围信息进行融合,得到所述目标对象的实际经营信息;
所述根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象之前,所述方法还包括:
获取与第一候选对象的行业信息相同的多个第三候选对象;
提取所述多个第三候选对象的经营范围信息中出现次数大于预设次数阈值的第二关键词信息;
通过预设的关联关系识别模型,对所述第一候选对象的物流信息、所述第一候选对象的经营范围信息和所述第二关键词信息进行处理,得到所述第一候选对象对应的第二目标系数;
根据所述第二目标系数,对所述第二关键词信息进行加权处理,并将加权后的第二关键词信息与所述第一候选对象的经营范围信息进行融合,得到所述第一候选对象的实际经营信息。
3.根据权利要求2所述的关联对象识别方法,其特征在于,所述预设的关联关系识别模型通过以下方法训练得到:
获取订单类型为目标类型的目标订单信息,并将同一目标订单信息中的寄件对象和所述同一目标订单信息中的收件对象分别作为上游对象,以及与所述上游对象关联的第一下游对象;
根据所述上游对象的经营范围信息和物流信息,和所述第一下游对象的经营范围信息和物流信息,构建正样本数据;
通过所述正样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型。
4.根据权利要求3所述的关联对象识别方法,其特征在于,所述通过所述正样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型,包括:
针对每一个上游对象,根据对应的第一下游对象的行业信息,从预设的样本对象中选择所述每一个上游对象对应的第二下游对象,其中,所述每一个上游对象对应的第二下游对象是指与所述每一个上游对象不是上下游关系的样本对象;
根据所述上游对象的经营范围信息和寄件信息,以及所述上游对象对应的第二下游对象的经营范围信息和寄件信息,构建负样本数据;
根据所述正样本数据和所述负样本数据,对初始的关联关系识别模型进行训练,得到预设的关联关系识别模型。
5.根据权利要求4所述的关联对象识别方法,其特征在于,所述针对每一个上游对象,根据对应的第一下游对象的行业信息,从预设的样本对象中选择所述每一个上游对象对应的第二下游对象,包括:
针对每一个上游对象,统计所述每一个上游对象对应的第一下游对象的行业信息,得到所述每一个上游对象对应的下游行业分布信息,其中,行业分布信息中包含多个不同行业信息的行业占比;
统计所有第一下游对象的行业信息,得到全局行业分布信息,其中,所述全局行业分布信息包括多个对应不同行业信息的行业占比;
根据所述样本对象的行业信息,分别从所述每一个上游对象对应的下游行业分布信息中确定所述每一个上游对象对应的个体行业占比,以及从所述全局行业分布信息中确定所述样本对象对应的全局行业占比;
根据所述每一个上游对象对应的个体行业占比,以及所述样本对象对应的全局行业占比,从所述样本对象中选择所述每一个上游对象对应的第二下游对象。
6.根据权利要求1-5任一项所述的关联对象识别方法,其特征在于,所述根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象,包括:
获取所述目标对象的对象身份信息,以及预设的第一候选对象的对象身份信息;
根据所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
7.根据权利要求6所述的关联对象识别方法,其特征在于,所述根据所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象,包括:
对所述目标对象的实际经营信息、对象身份信息和物流信息,以及所述第一候选对象的实际经营信息、对象身份信息和物流信息进行融合处理,得到融合信息;
通过预设的关联关系识别模型,对所述融合信息进行预测处理,得到所述目标对象与所述第一候选对象之间的关联概率;
将关联概率大于预设概率阈值的第一候选对象设置为所述目标对象关联的上游和/或下游对象。
8.一种关联对象识别装置,其特征在于,包括:
获取单元,用于获取待识别的目标对象;
确定单元,用于根据所述目标对象的经营范围信息和所述目标对象的物流信息,确定所述目标对象的实际经营信息;
选择单元,用于根据所述目标对象的实际经营信息,以及预设的第一候选对象的实际经营信息,从所述第一候选对象中选择与所述目标对象关联的上游对象和/或下游对象。
9.一种电子设备,其特征在于,所述电子设备包括处理器、存储器以及存储于所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的关联对象识别方法中的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的关联对象识别方法中的步骤。
CN202210657389.1A 2022-06-10 2022-06-10 关联对象识别方法、装置、电子设备及存储介质 Pending CN117271713A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210657389.1A CN117271713A (zh) 2022-06-10 2022-06-10 关联对象识别方法、装置、电子设备及存储介质
PCT/CN2023/112319 WO2023237135A1 (zh) 2022-06-10 2023-08-10 关联对象识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210657389.1A CN117271713A (zh) 2022-06-10 2022-06-10 关联对象识别方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117271713A true CN117271713A (zh) 2023-12-22

Family

ID=89117614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210657389.1A Pending CN117271713A (zh) 2022-06-10 2022-06-10 关联对象识别方法、装置、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN117271713A (zh)
WO (1) WO2023237135A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117854091B (zh) * 2024-01-15 2024-06-07 金锋馥(滁州)科技股份有限公司 基于图像特征检测的包裹多面密集标签信息提取方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112487794B (zh) * 2019-08-21 2023-09-22 顺丰科技有限公司 行业分类方法、装置、终端设备及存储介质
CN112561412B (zh) * 2019-09-10 2022-07-08 顺丰科技有限公司 目标对象标识的确定方法、装置、服务器及存储介质
CN110990529B (zh) * 2019-11-28 2024-04-09 爱信诺征信有限公司 企业的行业明细划分方法及***
CN113743838A (zh) * 2020-05-27 2021-12-03 顺丰恒通支付有限公司 目标用户识别方法、装置、计算机设备和存储介质
CN111915191A (zh) * 2020-08-03 2020-11-10 支付宝(杭州)信息技术有限公司 一种产业链识别方法及装置

Also Published As

Publication number Publication date
WO2023237135A1 (zh) 2023-12-14

Similar Documents

Publication Publication Date Title
WO2020249125A1 (zh) 用于自动训练机器学习模型的方法和***
US11526675B2 (en) Fact checking
CN109033229B (zh) 问答处理方法和装置
CN107463605B (zh) 低质新闻资源的识别方法及装置、计算机设备及可读介质
WO2019214245A1 (zh) 一种信息推送方法、装置、终端设备及存储介质
US20230376527A1 (en) Generating congruous metadata for multimedia
CN108550065B (zh) 评论数据处理方法、装置及设备
CN112364204B (zh) 视频搜索方法、装置、计算机设备及存储介质
CN104778186B (zh) 将商品对象挂载到标准产品单元的方法及***
WO2019169978A1 (zh) 资源推荐方法及装置
CN104573130A (zh) 基于群体计算的实体解析方法及装置
Zhong et al. Predicting pinterest: Automating a distributed human computation
CN109784368A (zh) 一种应用程序分类的确定方法和装置
CN110287292A (zh) 一种裁判量刑偏离度预测方法及装置
CN113360768A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
WO2023237135A1 (zh) 关联对象识别方法、装置、电子设备及存储介质
Zhang et al. RankMatch: Fostering confidence and consistency in learning with noisy labels
CN109144999B (zh) 一种数据定位方法、装置及存储介质、程序产品
CN111367986A (zh) 一种基于弱监督学习的联合信息抽取方法
CN116361428A (zh) 一种问答召回方法、装置和存储介质
CN115269998A (zh) 信息推荐方法、装置、电子设备及存储介质
CN114529191A (zh) 用于风险识别的方法和装置
CN112632284A (zh) 用于未标注文本数据集的信息抽取方法及***
CN116823069B (zh) 基于文本分析的智能客服服务质检方法及相关设备
CN110969011B (zh) 文本情感分析方法、装置、存储介质及处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination