CN115496158A - 对象价值预测方法、装置、计算机设备和存储介质 - Google Patents

对象价值预测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN115496158A
CN115496158A CN202211199417.6A CN202211199417A CN115496158A CN 115496158 A CN115496158 A CN 115496158A CN 202211199417 A CN202211199417 A CN 202211199417A CN 115496158 A CN115496158 A CN 115496158A
Authority
CN
China
Prior art keywords
predicted
value
current
prediction value
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211199417.6A
Other languages
English (en)
Inventor
范伟杰
王保山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pudong Development Bank Co Ltd
Original Assignee
Shanghai Pudong Development Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pudong Development Bank Co Ltd filed Critical Shanghai Pudong Development Bank Co Ltd
Priority to CN202211199417.6A priority Critical patent/CN115496158A/zh
Publication of CN115496158A publication Critical patent/CN115496158A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种对象价值预测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:通过对待预测对象集中各个待预测对象的对象特征进行聚类,基于每个对象群中各个待预测对象的资源剩余峰值,确定第一预测价值;将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到第二预测价值;针对待预测对象集中每个待预测对象,基于当前待预测对象与每个第一对象之间的多维度关系数据,确定第三预测价值;基于当前待预测对象的资源剩余峰值,确定四预测价值;基于第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。采用本方法能够提高对象价值预测准确度。

Description

对象价值预测方法、装置、计算机设备和存储介质
技术领域
本申请涉及人工智能技术领域,特别是涉及一种对象价值预测方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
现代企业大多拥有大量的业务对象,对不同价值的业务对象进行分层互动,对提升企业的整体业务水平有重要作用。实际业务中,往往有很大一部分业务对象的活跃度偏低,业务对象的价值无法直接获得,从而需要进行价值预测。
现有的对象价值预测方法中,通常由人工根据业务专家规则形成对象的价值指标。然而这种对象价值预测方法只能根据客户已经展现出来的数据进行分类,无法预测对象的潜在价值,存在对象价值预测准确度低的问题。
发明内容
基于此,有必要针对传统的对象价值预测方法准确度低的问题,提供一种能够提高对象价值预测准确度的对象价值预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种对象价值预测方法。所述方法包括:
获取待预测对象集中各个待预测对象的对象特征;
通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值;
将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到待预测对象集中各个待预测对象的第二预测价值;
针对待预测对象集中每个待预测对象,确定当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据;基于多维度关系数据,确定当前待预测对象的第三预测价值;
针对待预测对象集中每个待预测对象,基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值;
基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。
在其中一个实施例中,回归模型的训练步骤,包括:
获取训练对象的对象特征以及训练对象的价值标签;
将训练对象的对象特征输入至当前训练模型,得到训练对象的预测价值,基于预测价值和价值标签判断当前训练模型是否满足预设停止条件,若满足,则将当前训练模型作为回归模型,若不满足,则对当前训练模型继续进行训练,直到当前训练模型满足预设停止条件。
在其中一个实施例中,基于多维度关系数据,确定当前待预测对象的第三预测价值,包括:
在待预测对象集的知识图谱上确定当前待预测对象对应的子图谱;
对于待预测对象集中除当前待预测对象外每个第一对象,将当前待预测对象与当前第一对象的多维度关系数据进行加权平均,获得当前待预测对象与当前第一对象的亲密距离;
根据当前待预测对象与当前第一对象的亲密距离,获得当前待预测对象与当前第一对象之间的传播权重;
基于当前待预测对象与各个第一对象之间的传播权重,在当前待预测对象对应的子图谱中,确定当前待预测对象的第三预测价值。
在其中一个实施例中,在待预测对象集的知识图谱上确定当前待预测对象对应的子图谱,包括:
构建待预测对象集的知识图谱,其中,待预测对象集中每个待预测对象与知识图谱中的一个节点相对应;
以当前待预测对象对应的节点为中心,在知识图谱中选取当前待预测对象的预设级数关系范围内的关系节点;
基于当前待预测对象对应的节点和关系节点,确定当前待预测对象对应的子图谱。
在其中一个实施例中,基于当前待预测对象与各个第一对象之间的传播权重,在当前待预测对象对应的子图谱中,确定当前待预测对象的第三预测价值,包括:
在当前待预测对象对应的子图谱中,确定每一关系节点到当前待预测对象对应的节点的最短路径,以及最短路径经过的目标节点;
获取目标节点中相邻两个目标节点之间的传播权重;
获取每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值;
基于目标节点中相邻两个目标节点之间的传播权重,以及每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值,确定每一关系节点对应的待预测对象对当前待预测对象的价值影响;
将各关系节点对应的待预测对象对当前待预测对象的价值影响求和,确定当前待预测对象的第三预测价值。
在其中一个实施例中,基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值,包括:
针对待预测对象集中每个待预测对象,从当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中选取最大值,并将最大值作为当前待预测对象的对象价值。
第二方面,本申请还提供了一种对象价值预测装置。所述装置包括:
特征获取模块,用于获取待预测对象集中各个待预测对象的对象特征;
第一价值获取模块,用于通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值;
第二价值获取模块,用于将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到待预测对象集中各个待预测对象的第二预测价值;
第三价值获取模块,用于针对待预测对象集中每个待预测对象,确定当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据;基于多维度关系数据,确定当前待预测对象的第三预测价值;
第四价值获取模块,用于针对待预测对象集中每个待预测对象,基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值;
价值确定模块,用于基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待预测对象集中各个待预测对象的对象特征;
通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值;
将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到待预测对象集中各个待预测对象的第二预测价值;
针对待预测对象集中每个待预测对象,确定当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据;基于多维度关系数据,确定当前待预测对象的第三预测价值;
针对待预测对象集中每个待预测对象,基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值;
基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待预测对象集中各个待预测对象的对象特征;
通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值;
将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到待预测对象集中各个待预测对象的第二预测价值;
针对待预测对象集中每个待预测对象,确定当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据;基于多维度关系数据,确定当前待预测对象的第三预测价值;
针对待预测对象集中每个待预测对象,基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值;
基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待预测对象集中各个待预测对象的对象特征;
通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值;
将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到待预测对象集中各个待预测对象的第二预测价值;
针对待预测对象集中每个待预测对象,确定当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据;基于多维度关系数据,确定当前待预测对象的第三预测价值;
针对待预测对象集中每个待预测对象,基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值;
基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。
上述对象价值预测方法、装置、计算机设备、存储介质和计算机程序产品,通过对待预测对象集中各个待预测对象的对象特征进行聚类,获得多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,能够确定同一对象群中各个待预测对象的第一预测价值;将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,通过回归模型能够得到待预测对象集中各个待预测对象的第二预测价值;针对待预测对象集中每个待预测对象,基于当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据,确定当前待预测对象的第三预测价值;基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值;基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。这种通过聚类、回归模型、多维度关系数据以及资源剩余价值多种角度预测对象价值的方法,能够避免单一角度预测对象价值带来的偏差,预测角度更加全面,提高了预测结果的准确性。
附图说明
图1为一个实施例中对象价值预测方法的应用环境图;
图2为一个实施例中对象价值预测方法的流程示意图;
图3为一个实施例中S204的子流程示意图;
图4为一个实施例中S302的子流程示意图;
图5为一个实施例中S308的子流程示意图;
图6为另一个实施例中对象价值预测方法的流程示意图;
图7为一个实施例中对象价值预测装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的对象价值预测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储***可以存储服务器104需要处理的数据。数据存储***可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102获取待预测对象集中各个待预测对象的对象特征;通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值;将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到待预测对象集中各个待预测对象的第二预测价值;针对待预测对象集中每个待预测对象,确定当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据;基于多维度关系数据,确定当前待预测对象的第三预测价值;针对待预测对象集中每个待预测对象,基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值;基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种对象价值预测方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
S201,获取待预测对象集中各个待预测对象的对象特征。
其中,待预测对象集中包括至少一个待预测对象,待预测对象是需要进行价值预测的对象。对象特征指的是待预测对象的与具体业务相关的特征,对象特征的类型包括状态类特征、产品类特征或者事件类特征中的任一种。示例性地,状态类特征包括但不限于对象的基本信息、开户情况或者业务状态中的任一种。产品类特征包括但不限于资源转移情况、资源持有数量或者对象等级中的任一种。事件类特征包括但不限于资源转入转出事件、资源转移流水或者登录流水中的任一种。
终端获取待预测对象集中各个待预测对象的对象特征包括,终端获取待预测对象集中各个待预测对象的业务数据,对所述业务数据进行特征工程处理,获得待预测对象集中各个待预测对象的对象特征。特征工程指的是用一系列工程化的方式从业务数据中筛选出更好的数据特征,以提升模型的训练效果。特征工程包括但不限于数据预处理、特征选择、降维中的任一种。示例性地,特征工程还包括缺失值补充,缺失值补充指的是将业务数据中的数值型的空值替换为预设数值,将业务数据中字符型的空值或者空字符串替换为预设字符。示例性地,特征工程还包括独热编码,独热编码指的是将业务数据中的类别变量替换为多个变量,为每个类别引入一个新的特征,从而表示任意数量的类别。
S202,通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值。
其中,聚类指的是采用聚类算法对各个待预测对象的对象特征进行分类的方法。聚类算法以相似性为基础,通过聚类算法得到的各个待预测对象的对象群中,每个对象群中各个待预测对象之间具有较高的相似性。常见的聚类算法包括但不限于Kmeans(K均值)、DBSCAN(Density-Based Spatial Clustering of Applications with Noise,基于密度的聚类算法)、谱聚类、拉普拉斯映射、PCA(Principal Component Analysis,主成分分析)、GMM(Gaussian Mixture Model,高斯混合模型)、MeanShift(均值迁移)以及层次聚类。具体地,终端通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群。
资源剩余峰值指的是待预测对象在预设时间段内,资源剩余数值分布中数值最大的资源剩余数值。基于聚类算法进行对象价值预测,能够提高对象价值预测的效率。基于聚类算法确定的多个对象群中,每个对象群中各个待预测对象具有较高的相似性,终端将每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,作为每个对象群中各个待预测对象的第一预测价值,每个对象群中各个待预测对象的第一预测价值相同,有利于获得每个对象群中各个待预测对象的预测价值,提高对象价值预测的准确性。
S203,将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到待预测对象集中各个待预测对象的第二预测价值。
其中,回归模型是有监督学习的机器学习模型,用来建立自变量和观测值之间的映射关系。常见的回归模型包括但不限于线性回归、多项式回归、岭回归、lasso回归、弹性网络回归或者XGBoost(eXtreme Gradient Boosting,极端梯度提升)中的任一种。回归模型是训练好的机器学习模型。在终端将待预测对象集中各个待预测对象的对象特征分别输入至回归模型之前,终端还需要对回归模型进行训练,直到满足预测停止条件,获得的训练后的机器学习模型,即为回归模型。终端将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到待预测对象集中各个待预测对象的第二预测价值。
S204,针对待预测对象集中每个待预测对象,确定当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据;基于多维度关系数据,确定当前待预测对象的第三预测价值。
其中,第一对象指的是待预测对象集中除当前待预测对象外的待预测对象。多维度关系数据指的是待预测对象与第一对象之间在多维度下的关系数据。多维度关系数据包括但不限于资源转移关系数据、资源推荐关系数据、IP地址(Internet Protocol Address,国际网络协议地址)亲密性、登陆地址经纬度的相似性或者资源转出组织关系数据中的任一种。当前待预测对象与第一对象之间的多维度关系是有向的,具体地,可以为单向的,也可以为双向的。针对待预测对象集中每个待预测对象,终端确定当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据,根据当前待预测对象与第一对象之间的多维度关系数据和待预测对象集的知识图谱,确定当前待预测对象的第三预测价值。待预测对象集的知识图谱是反映待预测对象集中各个待预测对象的关系的网状知识结构。
S205,针对待预测对象集中每个待预测对象,基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值。
其中,针对待预测对象集中每个待预测对象,终端获取当前待预测对象在第二预设时间段内的资源剩余峰值,将当前待预测对象在第二预设时间段内的资源剩余峰值,作为当前待预测对象的第四预测价值。
S206,基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。
其中,终端将待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值进行融合,将融合结果作为每个待预测对象的对象价值。终端将通过四种方法得到的预测价值结果融合在一起,确定的对象价值是能够同时满足四个角度的预测条件,对象价值具有较高的准确性。
上述对象价值预测方法中,通过对待预测对象集中各个待预测对象的对象特征进行聚类,获得多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,能够确定同一对象群中各个待预测对象的第一预测价值;将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,通过回归模型能够得到待预测对象集中各个待预测对象的第二预测价值;针对待预测对象集中每个待预测对象,基于当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据,确定当前待预测对象的第三预测价值;基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值;基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。这种通过聚类、回归模型、多维度关系数据以及资源剩余价值多种角度预测对象价值的方法,能够避免单一角度预测对象价值带来的偏差,预测角度更加全面,提高了预测结果的准确性。
在一个实施例中,回归模型的训练步骤,包括:获取训练对象的对象特征以及训练对象的价值标签;将训练对象的对象特征输入至当前训练模型,得到训练对象的预测价值,基于预测价值和价值标签判断当前训练模型是否满足预设停止条件,若满足,则将当前训练模型作为回归模型,若不满足,则对当前训练模型继续进行训练,直到当前训练模型满足预设停止条件。
其中,训练对象是对象价值已知的对象。价值标签是用来表征训练对象的对象价值的标签信息。当前训练模型指的是模型训练前的回归模型,当前训练模型经过模型训练得到回归模型。
终端获得训练对象的对象特征以及训练对象的价值标签,将训练对象的对象特征输入至当前训练模型,得到训练对象的预测价值。终端将训练对象的预测价值和价值标签进行比较,获得当前训练模型的损失函数。判断损失函数是否在预设损失范围内,若损失函数在预设损失范围内,则当前训练模型满足预设条件,终端将当前训练模型作为回归模型,若损失函数不在预设损失范围内,则当前训练模型不满足预设条件,终端对当前训练模型继续进行训练,直到损失函数在预设范围内,当前训练模型满足预设停止条件。损失函数包括但不限于RMSE(Root Mean Squared Errors,均方根误差)、MSE(Mean Square Error,均方误差)、MAE(Mean Absolute Error,平均绝对误差)、SD(Standard Deviation,标准差)或者R2(R-Square,R平方)中的任一种。
本实施例中,通过获取训练对象的对象特征以及训练对象的价值标签,将训练对象的对象特征输入至当前训练模型,得到训练对象的预测价值,基于预测价值和价值标签来判断当前训练模型是否满足预设停止条件,这种基于训练对象的价值标签进行模型训练,能够保证训练得到的回归模型具有较高的对象价值预测准确性。
在一个实施例中,如图3所示,基于多维度关系数据,确定当前待预测对象的第三预测价值,包括:
S302,在待预测对象集的知识图谱上确定当前待预测对象对应的子图谱。
其中,知识图谱是以符号形式描述资源转移数据流经的资源转移节点以及资源转移数据流经资源转移节点的顺序的知识结构。待测对象集的知识图谱中包括待预测对象集中每个待预测对象。子图谱是知识图谱上有当前待预测对象对应的节点以及当前待预测对象直接相连或者间接相连的节点组成的图谱。终端在待预测对象集的知识图谱上确定当前待预测对象对应的子图谱。
S304,对于待预测对象集中除当前待预测对象外每个第一对象,将当前待预测对象与当前第一对象的多维度关系数据进行加权平均,获得当前待预测对象与当前第一对象的亲密距离。
其中,对于待预测对象集中除当前待预测对象外每个第一对象,终端将当前待预测对象与当前第一对象的多维度关系数据进行加权平均,获得当前待预测对象与当前第一对象的亲密距离。在一些实施例中,多维度关系数据可以为多维度下的亲密度,亲密度的范围在0到1之间。亲密度越接近0表示两个对象在当前维度关系下越亲密。亲密度越接近1表示两个对象在当前维度关系下越疏远。示例性地,定义维度k下当前待预测对象与当前第一对象之间的亲密度为
Figure BDA0003871875660000121
其中
Figure BDA0003871875660000122
当前待预测对象与当前第一对象的亲密距离可表示为:
Figure BDA0003871875660000123
S306,根据当前待预测对象与当前第一对象的亲密距离,获得当前待预测对象与当前第一对象之间的传播权重。
其中,传播权重指的是当前待预测对象与当前第一对象之间进行资源转移的权重,亲密距离越大,传播权重越小,亲密距离越小,传播权重越大。终端将当前待预测对象与当前第一对象的亲密距离与1的差值作为当前待预测对象与当前第一对象之间的传播权重。
S308,基于当前待预测对象与各个第一对象之间的传播权重,在当前待预测对象对应的子图谱中,确定当前待预测对象的第三预测价值。
其中,终端获取当前待预测对象与各个第一对象之间的传播权重。在当前待预测对象对应的子图谱中,各个第一对象只包括当前待预测对象直接或者间接相关的对象。在当前待预测对象对应的子图谱中,结合当前待预测对象与当前待预测对象直接或者间接相关的对象之间的传播权重,确定当前待预测对象的第三预测价值。
本实施例中,通过在待预测对象集的知识图谱上确定当前待预测对象对应的子图谱,对于待预测对象集中除当前待预测对象外每个第一对象,将当前待预测对象与当前第一对象的多维度关系数据进行加权平均,获得当前待预测对象与当前第一对象的亲密距离,以及传播权重,能够在当前待预测对象的子图谱中,基于当前待预测对象与各个第一对象之间的多维度数据,确定第三预测价值,有利于提高当前待预测对象的对象价值预测准确性。
在一个实施例中,如图4所示,在待预测对象集的知识图谱上确定当前待预测对象对应的子图谱,包括:
S402,构建待预测对象集的知识图谱,其中,待预测对象集中每个待预测对象与知识图谱中的一个节点相对应。
其中,终端构建待预测对象集的知识图谱。知识图谱的基本组成单位是实体-关系-实体三元组以及实体及其相关属性,实体通过关系相互连接,构成知识图谱。其中,待预测对象集中每个待预测对象与待测对象集的知识图谱中的一个节点一一对应。每个待预测对象之间的关系构成待测对象集的知识图谱中实体与实体之间的关系。
S404,以当前待预测对象对应的节点为中心,在知识图谱中选取当前待预测对象的预设级数关系范围内的关系节点。
其中,关系节点在与当前待预测对象直接或者间接相连的待预测对象。其中,若当前待预测对象与关系节点直接相连,则将该关系节点称为待预测对象的第一级数关系范围内的关系节点。若当前待预测对象与关系节点之间通过一个节点间接相连,则将该关系节点称为待预测对象的第二级数关系范围内的关系节点。相应地,若当前待预测对象与关系节点之间通过N个节点间接相连,则将该关系节点称为待预测对象的第N级数关系范围内的关系节点。终端以当前待预测对象对应的节点为中心,在知识图谱中选取当前待预测对象的预设级数关系范围内的关系节点。
S406,基于当前待预测对象对应的节点和关系节点,确定当前待预测对象对应的子图谱。
其中,终端将当前待预测对象对应的节点和关系节点作为当前待预测对象对应的子图谱中的实体,将当前待预测对象对应的节点与关系节点之间的连接关系作为子图谱中实体与实体之间的关系,从而确定当前待预测对象对应的子图谱。
本实施例中,通过构建待预测对象集的知识图谱,以当前待预测对象对应的节点为中心,在知识图谱中选取当前待预测对象的预设级数关系范围内的关系节点,从而确定当前待预测对象对应的子图谱。当前待预测对象对应的子图谱由当前待预测对象对应的节点、关系节点以及当前待预测对象对应的节点与关系节点之间的连接关系确定,在当前待预测对象对应的子图谱中对当前待预测对象进行价值预测,能够提高对象价值预测的准确性。
在一个实施例中,如图5所示,基于当前待预测对象与各个第一对象之间的传播权重,在当前待预测对象对应的子图谱中,确定当前待预测对象的第三预测价值,包括:
S501,在当前待预测对象对应的子图谱中,确定每一关系节点到当前待预测对象对应的节点的最短路径,以及最短路径经过的目标节点。
其中,在当前待预测对象对应的子图谱中,每一关系节点都可以直接或者间接到达当前待预测对象对应的节点。在当前待预测对象对应的子图谱中,终端确定每一关系节点到当前待预测对象对应的节点的最短路径,以及最短路径经过的目标节点。在一些实施例中,每一关系节点到达当前待预测对象对应的节点的路径只有唯一一条,终端确定该唯一路径以及该唯一路径经过的目标节点。在另一些实施例中,每一关系节点到达当前待预测对象对应的节点的路径包括多条,终端从多条路径中选择一条最短路径作为每一关系节点到当前待预测对象对应的节点的最短路径,并获得该最短路径经过的目标节点。
S502,获取目标节点中相邻两个目标节点之间的传播权重。
其中,终端获取目标节点中相邻两个目标节点之间的传播权重。即终端获取目标节点中相邻两个目标节点对应的待预测对象之间的传播权重。
S503,获取每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值。
其中,终端获取每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值。
S504,基于目标节点中相邻两个目标节点之间的传播权重,以及每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值,确定每一关系节点对应的待预测对象对当前待预测对象的价值影响。
其中,终端将目标节点中相邻两个目标节点之间的传播权重累乘,确定累乘结果,将累乘结果与每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值相乘,确定每一关系节点对应的待预测对象对当前待预测对象的价值影响。
S505,将各关系节点对应的待预测对象对当前待预测对象的价值影响求和,确定当前待预测对象的第三预测价值。
其中,终端将各关系节点对应的待预测对象对当前待预测对象的价值影响求和,获得求和结果,将求和结果作为当前待预测对象的第三预测价值。在一些实施例中,定义Pi为当前待预测对象对应的节点,每个关系节点pj对应的待预测对象在第三预设时间段内的资源剩余峰值为αj,pj到Pi的最短路径为j—k1—k2—…—kl—i,则节点pj对节点Pi的价值影响为:
Figure BDA0003871875660000151
其中k0=j、kl+1=i,节点Pi的第三预测价值V可表示为:
Figure BDA0003871875660000152
本实施例中,通过在当前待预测对象对应的子图谱中,确定每一关系节点到当前待预测对象对应的节点的最短路径,以及最短路径经过的目标节点。基于传播权重、以及资源剩余峰值,确定每一关系节点对应的价值影响,当前待预测对象的第三预测价值为各个关系节点对应的价值影响之和。这种通过将当前待预测对象对应的子图谱中,各个关系节点对当前待预测对象的价值影响之和来确定第三预测价值的方法,能够提高对象价值预测的准确性。
在一个实施例中,基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值,包括:针对待预测对象集中每个待预测对象,从当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中选取最大值,并将最大值作为当前待预测对象的对象价值。
其中,针对待预测对象集中每个待预测对象,终端从当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中选取最大值,并将最大值作为当前待预测对象的对象价值。在一些实施例中,终端还可以从当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中选取任一值作为当前待预测对象的对象价值。在另一些实施例中,终端还可以将当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中任意数量的数值,将这些数值的均值作为当前待预测对象的对象价值。
本实施例中,通过将当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中的最大值作为当前待预测对象的对象价值,能够避免单一角度预测对象价值带来的偏差,预测角度更加全面,提高了预测结果的准确性。
为详细说明本方案中对象价值预测方法及效果,下面以一个最详细实施例进行说明:
针对金融领域的对象价值预测应用领域。如图6所示为对象价值预测方法的流程示意图。终端获取待预测对象集中各个待预测对象的业务数据,对所述业务数据进行特征工程处理,获得待预测对象集中各个待预测对象的对象特征。
通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值。采用的聚类算法包括但不限于Mini-batchKmeans(小批量k均值算法)。采用MSE损失函数对聚类算法进行评估。
将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到待预测对象集中各个待预测对象的第二预测价值。采用的回归模型包括但不限于Xgboost回归模型。回归模型的训练步骤包括:获取训练对象的对象特征以及训练对象的价值标签;将训练对象的对象特征输入至当前训练模型,得到训练对象的预测价值,基于预测价值和价值标签判断当前训练模型是否满足预设停止条件,若满足,则将当前训练模型作为回归模型,若不满足,则对当前训练模型继续进行训练,直到当前训练模型满足预设停止条件。其中,训练对象是对象价值已知的对象。价值标签是用来表征训练对象的对象价值的标签信息。当前训练模型指的是模型训练前的回归模型,当前训练模型经过模型训练得到回归模型。
针对待预测对象集中每个待预测对象,确定当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据,基于多维度关系数据,确定当前待预测对象的第三预测价值。多维度关系数据指的是待预测对象与第一对象之间在多维度下的关系数据。多维度关系数据包括但不限于资源转移关系数据、资源推荐关系数据、IP地址亲密性、登陆地址经纬度的相似性或者资源转出组织关系数据中的任一种。
基于多维度关系数据,确定当前待预测对象的第三预测价值,包括:构建待预测对象集的知识图谱,其中,待预测对象集中每个待预测对象与知识图谱中的一个节点相对应,以当前待预测对象对应的节点为中心,在知识图谱中选取当前待预测对象的预设级数关系范围内的关系节点,基于当前待预测对象对应的节点和关系节点,确定当前待预测对象对应的子图谱,子图谱
Figure BDA0003871875660000171
可以表示为:
Figure BDA0003871875660000172
其中,节点Pi为当前待预测对象对应的节点,节点pj为关系节点,mindji表示节点pj到节点Pi的最短路径的距离,节点Pi的m阶邻居子图即为当前待预测对象对应的子图谱。
对于待预测对象集中除当前待预测对象外每个第一对象,将当前待预测对象与当前第一对象的多维度关系数据进行加权平均,获得当前待预测对象与当前第一对象的亲密距离。多维度关系数据可以为多维度下的亲密度,亲密度的范围在0到1之间。亲密度越接近0表示两个对象在当前维度关系下越亲密。亲密度越接近1表示两个对象在当前维度关系下越疏远。示例性地,定义维度k下当前待预测对象与当前第一对象之间的亲密度为
Figure BDA0003871875660000173
其中
Figure BDA0003871875660000174
当前待预测对象与当前第一对象的亲密距离可表示为:
Figure BDA0003871875660000175
根据当前待预测对象与当前第一对象的亲密距离,获得当前待预测对象与当前第一对象之间的传播权重ωij:ωij=1-dij
在当前待预测对象对应的子图谱中,确定每一关系节点到当前待预测对象对应的节点的最短路径,以及最短路径经过的目标节点。获取目标节点中相邻两个目标节点之间的传播权重,获取每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值。基于目标节点中相邻两个目标节点之间的传播权重,以及每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值,确定每一关系节点对应的待预测对象对当前待预测对象的价值影响,将各关系节点对应的待预测对象对当前待预测对象的价值影响求和,确定当前待预测对象的第三预测价值。定义Pi为当前待预测对象对应的节点,每个关系节点pj对应的待预测对象在第三预设时间段内的资源剩余峰值为αj,pj到Pi的最短路径为j—k1—k2—…—kl—i,则节点pj对节点Pi的价值影响为:
Figure BDA0003871875660000181
其中k0=j、kl+1=i,节点Pi的第三预测价值V可表示为:
Figure BDA0003871875660000182
针对待预测对象集中每个待预测对象,终端获取当前待预测对象在第二预设时间段内的资源剩余峰值,将当前待预测对象在第二预设时间段内的资源剩余峰值,作为当前待预测对象的第四预测价值。
针对待预测对象集中每个待预测对象,终端从当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中选取最大值,并将最大值作为当前待预测对象的对象价值。在一些实施例中,终端还可以从当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中选取任一值作为当前待预测对象的对象价值。在另一些实施例中,终端还可以将当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中任意数量的数值,将这些数值的均值作为当前待预测对象的对象价值。
上述对象价值预测方法,通过对待预测对象集中各个待预测对象的对象特征进行聚类,获得多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,能够确定同一对象群中各个待预测对象的第一预测价值;将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,通过回归模型能够得到待预测对象集中各个待预测对象的第二预测价值;针对待预测对象集中每个待预测对象,基于当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据,确定当前待预测对象的第三预测价值;基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值;基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。这种通过聚类、回归模型、多维度关系数据以及资源剩余价值多种角度预测对象价值的方法,能够避免单一角度预测对象价值带来的偏差,预测角度更加全面,提高了预测结果的准确性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的对象价值预测方法的对象价值预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个对象价值预测装置实施例中的具体限定可以参见上文中对于对象价值预测方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种对象价值预测装置100,包括:特征获取模块110、第一价值获取模块120、第二价值获取模块130、第三价值获取模块140、第四价值获取模块150和价值确定模块160,其中:
特征获取模块110,用于获取待预测对象集中各个待预测对象的对象特征。
第一价值获取模块120,用于通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值。
第二价值获取模块130,用于将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到待预测对象集中各个待预测对象的第二预测价值。
第三价值获取模块140,用于针对待预测对象集中每个待预测对象,确定当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据;基于多维度关系数据,确定当前待预测对象的第三预测价值。
第四价值获取模块150,用于针对待预测对象集中每个待预测对象,基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值。
价值确定模块160,用于基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。
上述对象价值预测装置,通过对待预测对象集中各个待预测对象的对象特征进行聚类,获得多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,能够确定同一对象群中各个待预测对象的第一预测价值;将待预测对象集中各个待预测对象的对象特征分别输入至回归模型,通过回归模型能够得到待预测对象集中各个待预测对象的第二预测价值;针对待预测对象集中每个待预测对象,基于当前待预测对象与,待预测对象集中除当前待预测对象外每个第一对象之间的多维度关系数据,确定当前待预测对象的第三预测价值;基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定当前待预测对象的第四预测价值;基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。这种通过聚类、回归模型、多维度关系数据以及资源剩余价值多种角度预测对象价值的方法,能够避免单一角度预测对象价值带来的偏差,预测角度更加全面,提高了预测结果的准确性。
在一个实施例中,在回归模型的训练方面,第二价值获取模块130还用于:获取训练对象的对象特征以及训练对象的价值标签;将训练对象的对象特征输入至当前训练模型,得到训练对象的预测价值,基于预测价值和价值标签判断当前训练模型是否满足预设停止条件,若满足,则将当前训练模型作为回归模型,若不满足,则对当前训练模型继续进行训练,直到当前训练模型满足预设停止条件。
在一个实施例中,在基于多维度关系数据,确定当前待预测对象的第三预测价值方面,第三价值获取模块140还用于:在待预测对象集的知识图谱上确定当前待预测对象对应的子图谱;对于待预测对象集中除当前待预测对象外每个第一对象,将当前待预测对象与当前第一对象的多维度关系数据进行加权平均,获得当前待预测对象与当前第一对象的亲密距离;根据当前待预测对象与当前第一对象的亲密距离,获得当前待预测对象与当前第一对象之间的传播权重;基于当前待预测对象与各个第一对象之间的传播权重,在当前待预测对象对应的子图谱中,确定当前待预测对象的第三预测价值。
在一个实施例中,在待预测对象集的知识图谱上确定当前待预测对象对应的子图谱方面,第三价值获取模块140还用于:构建待预测对象集的知识图谱,其中,待预测对象集中每个待预测对象与知识图谱中的一个节点相对应;以当前待预测对象对应的节点为中心,在知识图谱中选取当前待预测对象的预设级数关系范围内的关系节点;基于当前待预测对象对应的节点和关系节点,确定当前待预测对象对应的子图谱。
在一个实施例中,在基于当前待预测对象与各个第一对象之间的传播权重,在当前待预测对象对应的子图谱中,确定当前待预测对象的第三预测价值方面,第三价值获取模块140还用于:在当前待预测对象对应的子图谱中,确定每一关系节点到当前待预测对象对应的节点的最短路径,以及最短路径经过的目标节点;获取目标节点中相邻两个目标节点之间的传播权重;获取每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值;基于目标节点中相邻两个目标节点之间的传播权重,以及每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值,确定每一关系节点对应的待预测对象对当前待预测对象的价值影响;将各关系节点对应的待预测对象对当前待预测对象的价值影响求和,确定当前待预测对象的第三预测价值。
在一个实施例中,在基于待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值方面,价值确定模块160还用于:针对待预测对象集中每个待预测对象,从当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中选取最大值,并将最大值作为当前待预测对象的对象价值。
上述对象价值预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过***总线连接,通信接口通过输入/输出接口连接到***总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储待预测对象集、对象特征、对象群、资源剩余峰值、回归模型、多维度关系数据、第一预测价值、第二预测价值、第三预测价值以及第四预测价值。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对象价值预测方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种对象价值预测方法,其特征在于,所述方法包括:
获取待预测对象集中各个待预测对象的对象特征;
通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值;
将所述待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到所述待预测对象集中各个待预测对象的第二预测价值;
针对待预测对象集中每个待预测对象,确定当前待预测对象与,所述待预测对象集中除所述当前待预测对象外每个第一对象之间的多维度关系数据;基于所述多维度关系数据,确定所述当前待预测对象的第三预测价值;
针对待预测对象集中每个待预测对象,基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定所述当前待预测对象的第四预测价值;
基于所述待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。
2.根据权利要求1所述的方法,其特征在于,所述回归模型的训练步骤,包括:
获取训练对象的对象特征以及训练对象的价值标签;
将所述训练对象的对象特征输入至当前训练模型,得到所述训练对象的预测价值,基于所述预测价值和所述价值标签判断所述当前训练模型是否满足预设停止条件,若满足,则将所述当前训练模型作为所述回归模型,若不满足,则对所述当前训练模型继续进行训练,直到所述当前训练模型满足所述预设停止条件。
3.根据权利要求1所述的方法,其特征在于,所述基于所述多维度关系数据,确定所述当前待预测对象的第三预测价值,包括:
在所述待预测对象集的知识图谱上确定所述当前待预测对象对应的子图谱;
对于所述待预测对象集中除所述当前待预测对象外每个第一对象,将所述当前待预测对象与当前第一对象的多维度关系数据进行加权平均,获得所述当前待预测对象与当前第一对象的亲密距离;
根据所述当前待预测对象与当前第一对象的亲密距离,获得所述当前待预测对象与当前第一对象之间的传播权重;
基于当前待预测对象与各个第一对象之间的传播权重,在所述当前待预测对象对应的子图谱中,确定当前待预测对象的第三预测价值。
4.根据权利要求3所述的方法,其特征在于,所述在所述待预测对象集的知识图谱上确定所述当前待预测对象对应的子图谱,包括:
构建所述待预测对象集的知识图谱,其中,所述待预测对象集中每个待预测对象与所述知识图谱中的一个节点相对应;
以当前待预测对象对应的节点为中心,在所述知识图谱中选取所述当前待预测对象的预设级数关系范围内的关系节点;
基于当前待预测对象对应的节点和所述关系节点,确定所述当前待预测对象对应的子图谱。
5.根据权利要求4所述的方法,其特征在于,所述基于当前待预测对象与各个第一对象之间的传播权重,在所述当前待预测对象对应的子图谱中,确定当前待预测对象的第三预测价值,包括:
在所述当前待预测对象对应的子图谱中,确定每一关系节点到所述当前待预测对象对应的节点的最短路径,以及所述最短路径经过的目标节点;
获取所述目标节点中相邻两个目标节点之间的传播权重;
获取每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值;
基于所述目标节点中相邻两个目标节点之间的传播权重,以及每一关系节点对应的待预测对象在第三预设时间段内的资源剩余峰值,确定每一关系节点对应的待预测对象对所述当前待预测对象的价值影响;
将各关系节点对应的待预测对象对所述当前待预测对象的价值影响求和,确定当前待预测对象的第三预测价值。
6.根据权利要求1所述的方法,其特征在于,所述基于所述待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值,包括:
针对所述待预测对象集中每个待预测对象,从当前待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值中选取最大值,并将所述最大值作为当前待预测对象的对象价值。
7.一种对象价值预测装置,其特征在于,所述装置包括:
特征获取模块,用于获取待预测对象集中各个待预测对象的对象特征;
第一价值获取模块,用于通过对各个待预测对象的对象特征进行聚类,将各个待预测对象分为多个对象群,基于每个对象群中各个待预测对象在第一预设时间段内的资源剩余峰值,确定每个对象群中各个待预测对象的第一预测价值;
第二价值获取模块,用于将所述待预测对象集中各个待预测对象的对象特征分别输入至回归模型,得到所述待预测对象集中各个待预测对象的第二预测价值;
第三价值获取模块,用于针对待预测对象集中每个待预测对象,确定当前待预测对象与,所述待预测对象集中除所述当前待预测对象外每个第一对象之间的多维度关系数据;基于所述多维度关系数据,确定所述当前待预测对象的第三预测价值;
第四价值获取模块,用于针对待预测对象集中每个待预测对象,基于当前待预测对象在第二预设时间段内的资源剩余峰值,确定所述当前待预测对象的第四预测价值;
价值确定模块,用于基于所述待预测对象集中每个待预测对象的第一预测价值、第二预测价值、第三预测价值以及第四预测价值,确定每个待预测对象的对象价值。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202211199417.6A 2022-09-29 2022-09-29 对象价值预测方法、装置、计算机设备和存储介质 Pending CN115496158A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211199417.6A CN115496158A (zh) 2022-09-29 2022-09-29 对象价值预测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211199417.6A CN115496158A (zh) 2022-09-29 2022-09-29 对象价值预测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN115496158A true CN115496158A (zh) 2022-12-20

Family

ID=84471585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211199417.6A Pending CN115496158A (zh) 2022-09-29 2022-09-29 对象价值预测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN115496158A (zh)

Similar Documents

Publication Publication Date Title
CN112163963B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN114297509A (zh) 用户兴趣向量生成方法、产品推荐方法、装置、设备、介质
CN113554175A (zh) 一种知识图谱构建方法、装置、可读存储介质及终端设备
CN115114484A (zh) 异常事件检测方法、装置、计算机设备和存储介质
US11144938B2 (en) Method and system for predictive modeling of consumer profiles
CN112215655B (zh) 一种客户画像的标签管理方法及***
CN113591881A (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN116737373A (zh) 负载均衡方法、装置、计算机设备、存储介质
Evans Robust Spatial Network Analysis
CN116894721A (zh) 一种指标预测方法、装置、计算机设备
US20230101510A1 (en) Information processing system, method for processing information, and non-transitory computer-readable recording medium
CN115883172A (zh) 异常监测方法、装置、计算机设备和存储介质
CN115496158A (zh) 对象价值预测方法、装置、计算机设备和存储介质
CN115860099A (zh) 神经网络模型的压缩方法、装置、计算机设备和存储介质
CN115169637A (zh) 社交关系预测方法、装置、设备和介质
CN112884028A (zh) 一种***资源调整方法、装置及设备
CN112182320A (zh) 聚类数据处理方法、装置、计算机设备及存储介质
CN117435279A (zh) 个人资源管理方法、装置、计算机设备和存储介质
US20230077998A1 (en) Systems and Methods for Smart Instance Selection
CN117314556A (zh) 虚拟资源推荐方法、装置、计算机设备和存储介质
CN116127195A (zh) 套餐推荐方法、装置、计算机设备、存储介质和程序产品
CN116881450A (zh) 资讯分类方法、装置、计算机设备、存储介质和程序产品
CN117665972A (zh) 天气信息的预测方法、装置、服务器和存储介质
CN117151884A (zh) 资产管理数据处理方法、装置、计算机设备和存储介质
CN114756654A (zh) 动态地名地址匹配方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination