CN111325372A - 预测模型的建立方法、预测方法、装置、介质及设备 - Google Patents

预测模型的建立方法、预测方法、装置、介质及设备 Download PDF

Info

Publication number
CN111325372A
CN111325372A CN201811526578.5A CN201811526578A CN111325372A CN 111325372 A CN111325372 A CN 111325372A CN 201811526578 A CN201811526578 A CN 201811526578A CN 111325372 A CN111325372 A CN 111325372A
Authority
CN
China
Prior art keywords
age
user
behavior
behavior data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811526578.5A
Other languages
English (en)
Inventor
吴轶杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201811526578.5A priority Critical patent/CN111325372A/zh
Publication of CN111325372A publication Critical patent/CN111325372A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种用户年龄预测模型的建立方法、用户年龄的预测方法、装置、计算机可读介质及电子设备,该用户年龄预测模型的建立方法包括:采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,得到N个年龄段作为样本标签,其中,N为正整数;获取所述N个年龄段的历史用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段的历史用户对应的行为特征值;根据所述样本标签和所述行为特征值训练机器学习模型,得到用户年龄预测模型。本发明实施例的技术方案有利于提高用户年龄的预测精确率。

Description

预测模型的建立方法、预测方法、装置、介质及设备
技术领域
本发明涉及计算机数据处理技术领域,具体而言,涉及一种用户年龄预测模型的建立方法、用户年龄的预测方法、用户年龄预测模型的建立装置、用户年龄的预测装置、计算机可读介质及电子设备。
背景技术
在电商领域中,根据用户的性别、年龄、偏好等特征数据,商家为用户提供个性化的服务,以提高用户的使用体验。但是随着用户隐私意识的加强,为了规避隐私数据泄漏等问题,商家获取用户的特征数据的难度不断增加。
现有技术方中,为了获取用户的特征数据,采用根据历史用户的行为数据建模,进而通过数学模型实现对当前用户的年龄进行的预测。
然而,现有技术提供的预测方法的预测精确率有待提高。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种用户年龄预测模型的建立方法、用户年龄的预测方法、用户年龄预测模型的建立装置、用户年龄的预测装置、计算机可读介质及电子设备,进而至少在一定程度上克服现有技术提供的预测方法的预测精确率较低的问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供了一种用户年龄预测模型的建立方法,包括:
采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,得到N个年龄段作为样本标签,其中,N为正整数;
获取所述N个年龄段的历史用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段的历史用户对应的行为特征值;
根据所述样本标签和所述行为特征值训练机器学习模型,得到用户年龄预测模型。
在本发明的一些实施例中,基于前述方案,采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,得到N个年龄段作为样本标签,包括:
统计所述海量历史用户的年龄样本数据,得到年龄上限值和年龄下限值;
根据预设的年龄段的个数N和所述年龄上限值和年龄下限值确定每个所述年龄段的初步年龄段范围值;
以动态规划的方式对所述初步年龄段范围值进行分段,确定多个中间年龄段范围值;
计算所述多个中间年龄段范围值的基尼不纯度,并将基尼不纯度最小的中间年龄段范围值作为最终年龄段范围值,以完成对样本标签的确定。
在本发明的一些实施例中,基于前述方案,获取所述N个年龄段的历史用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段的历史用户对应的行为特征值,包括:
对于所述N个年龄段的历史用户,获取所述历史用户针对多个类目的行为数据和所述行为数据对应的权值;
根据所述行为数据和所述行为数据对应的权值计算所述历史用户在各个类目上的活跃度;
根据所述活跃度在所述N个年龄段下的分布,确定所述样本标签对对应的行为特征值。
在本发明的一些实施例中,基于前述方案,根据所述活跃度在所述N个年龄段下的分布,确定所述样本标签对对应的行为特征值,包括:
按照所述历史用户在各个类目上的活跃度由高到低的顺序将所述活跃度进行排序,并根据所述活跃度的最大值确定每个所述活跃度对应的序号值;
统计所述序号值在所述N个年龄段下的分布,确定所述样本标签对对应的行为特征值。
在本发明的一些实施例中,基于前述方案,获取所述历史用户针对多个类目的行为数据和所述行为数据对应的权值,包括:
获取所述历史用户针对多个类目的浏览数据、点击数据、关注数据、加购物车数据、下单数据中的至少一种作为初步行为数据;
在所述初步行为数据中确定有效行为数据;
根据所述有效行为数据占所述初始行为数据的比例确定所述行为数据对应的权值。
根据本发明实施例的第二方面,提供了一种用户年龄的预测方法,包括:
获取待测用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述待测用户对应的待测行为特征值;
将所述待测行为特征值输入用户年龄预测模型,根据所述用户年龄预测模型的输出完成对所述待测用户的年龄预测。
在本发明的一些实施例中,基于前述方案,获取待测用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述待测用户对应的待测行为特征值,包括:
获取所述待测用户针对多个类目的行为数据和所述行为数据对应的权值;
根据所述行为数据和所述行为数据对应的权值计算所述待测用户在各个类目上的活跃度;
根据所述活跃度确定所述待测用户对应的待测行为特征值。
根据本发明实施例的第三方面,提供了一种用户年龄预测模型的建立装置,包括:
样本标签确定模块,用于采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,得到N个年龄段作为样本标签,其中,N为正整数;
特征值确定模块,用于获取所述N个年龄段的历史用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段的历史用户对应的行为特征值;
预测模型确定模块,用于根据所述样本标签和所述行为特征值训练机器学习模型,得到用户年龄预测模型。
根据本发明实施例的第四方面,提供了一种用户年龄的预测装置,包括:
待测行为特征值获取模块,用于获取待测用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述待测用户对应的待测行为特征值;
预测模块,用于将所述待测行为特征值输入用户年龄预测模型,根据所述用户年龄预测模型的输出完成对所述待测用户的年龄预测。。
根据本发明实施例的第五方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的用户年龄预测模型的建立方法,以及实现如上述实施例中第二方面所述的用户年龄的预测方法。
根据本发明实施例的第六方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的用户年龄预测模型的建立方法,以及实现如上述实施例中第二方面所述的用户年龄的预测方法。
本发明实施例提供的技术方案可以包括以下有益效果:
在本发明的一些实施例所提供的技术方案中,在建立用户年龄预测模型的过程中,一方面对于样本标签:采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,从而得到的作为样本标签的N个年龄段贴近于实际状况,克服了采用固定方式划分年龄段带来的预测精确率低的问题;另一方面,对于行为特征值:采用对行为数据加权的方式,使得行为特征值贴合用户实际的喜好状态,从而有利于提高用户年龄预测模型的预测精确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了根据本发明的实施例的用户年龄预测模型的建立方法的流程示意图;
图2示出了根据本发明的实施例的样本标签的确定方法的流程示意图;
图3示出了根据本发明的实施例的行为特征值的确定方法的流程示意图;
图4示出了根据本发明的另一实施例的行为特征值的确定方法的流程示意图;
图5示出了根据本发明的再一实施例的行为特征值的确定方法的流程示意图;
图6示出了根据本发明的实施例的用户年龄的预测方法的流程示意图;
图7示出了根据本发明的实施例的待测行为特征值的确定方法的流程示意图;
图8示出了根据本发明的实施例的用户年龄预测模型的建立装置的结构示意图;
图9示出了根据本发明的实施例的用户年龄的预测装置的结构示意图;
图10示出了适于用来实现本发明实施例的电子设备的计算机***的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
互联网电商的应用场景中,处于相同年龄段内的用户群体,在购物行为中会隐含某些共同的特征和模式,通过对用户购物行为进行合理的计算和转化,提取核心行为特征,并建立基于用户行为的年龄预测模型,对用户行为下隐藏的模式进行研究和挖掘,可以有效的获取用户的年龄段分布,从而对其提供个性化的购物服务,提高用户购物体验。
现有技术中的一种方式中将年龄作为连续变量,可以使用逻辑回归模型及逻辑回归模型的各类变种模型进行回归。然而,将用户的年龄预测作为回归问题时,由于年龄相近的人群有较大概率会存在相同的行为特征,从而很可能导致回归模型预测精确率过低。
现有技术中的另一种方式中将年龄作为离散变量或预处理分段,可以使用贝叶斯及各类变种、决策树等方式进行分类。然而,将用户的年龄预测作为分类问题时,一般采用固定分段的方式划分用户年龄作为模型标签,由于对于年龄段的划分缺乏有效方式,同样会影响预测精确率的提高。
并且,现有技术中的上述另种方式中,对用户的行为特征值的缺乏处理,从而对用户年龄的预测效果受初始化状态及随机成分影响较大,影响预测精确率的提高。
图1示出了根据本发明的实施例的一种用户年龄预测模型的建立方法的流程示意图,至少在一定程度上克服现有技术提供的预测方法的预测精确率较低的问题。本实施例的执行主体为建立用户年龄预测模型的装置,例如可以是服务器等。
参考图1,该实施例提供的一种用户年龄预测模型的建立方法,包括:
步骤S101,采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,得到N个年龄段作为样本标签,其中,N为正整数;
步骤S102,获取所述N个年龄段的历史用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段的历史用户对应的行为特征值;以及,
步骤S103,根据所述样本标签和所述行为特征值训练机器学习模型,得到用户年龄预测模型。
在图1所示实施例所提供的技术方案中,在建立用户年龄预测模型的过程中,一方面对于样本标签:采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,从而得到的作为样本标签的N个年龄段贴近于实际状况,克服了采用固定方式划分年龄段带来的预测精确率低的问题;另一方面,对于行为特征值:采用对行为数据加权的方式,使得行为特征值贴合用户实际的喜好状态,从而有利于提高用户年龄预测模型的预测精确率。
以下对图1所示实施例的各个步骤的具体实施方式进行详细阐述:
图2示出了根据本发明的实施例的样本标签的确定方法的流程示意图。以下结合图2对步骤S101的具体实施方式进行解释说明。参考图2,该方法包括步骤S201-步骤S204。
在步骤S201中,统计所述海量历史用户的年龄样本数据,得到年龄上限值和年龄下限值。
在示例性的实施例中,首先获取历史用户的特征信息。示例性的,可以基于用户自行维护的个人信息来获取用户的特征信息,例如:用户注册邮箱的用户名或其他用户名中包含数字模式为“YYYY”或“YYYYMMDD”的数字来匹配用户生日,具体地,“YYYY”用于匹配历史用户的出生年份,“MM”用于匹配历史用户的出生月份,“DD”用于匹配历史用户的出生日。需要注意的是,对于海外站点,上述数字模式修改为“DDMMYYYY”。
然后,将匹配后的信息中明显不符合生日信息的数字剔除,例如匹配后的年份信息为“3011”,匹配后的月份信息为“21”,等这些数据明显不属于用户的出生年份,则将其作为异常数据进行剔除。并根据剔除议程数据后的信息计算用户年龄,以作为用户年龄预测模型的样本数据。
进一步地,在获取到的样本数据中获取年龄上限值Max_Age和年龄下限值Min_Age。
在步骤S202中,根据预设的年龄段的个数N和所述年龄上限值和年龄下限值确定每个所述年龄段的初步年龄段范围值,所述初步年龄段范围值包括基准值和浮动值。
在示例性的实施例中,预设的年龄段个数N为根据实际需求设定的数值。通过
Figure BDA0001904604040000081
确定每个所述年龄段的初步年龄段范围值的基准值。例如,样本数据中年龄上限值Max_Age=58岁、年龄下限值Min_Age=8岁,预设的年龄段个数N=5,则每个所述年龄段的初步年龄段范围值的基准值
Figure BDA0001904604040000082
也就是说,若按照固定方式划分年龄段的话,每个年龄段中年龄范围为10岁,即8~17岁为第一个年龄段S1、18~27岁为第二份年龄段S2、…、47~58岁为第五个年龄段S5。然而,固定方式划分年龄段的方式缺乏与实际状态的比较,从而造成预测精确率较低。
本实施例提供的技术方案中,预先设置阈值threshold,并和上述初步年龄段范围值的基准值一起确定初步年龄段范围值的浮动值
Figure BDA0001904604040000083
根据上述实施例,若设置阈值threshold=0.2,则初步年龄段范围值的浮动值
Figure BDA0001904604040000084
本实施例通过设置浮动值的方式来避免由于划分年龄段的先验分布不均而导致用户年龄预测模型预测精确率下降的问题。
在步骤S203中,以s为步长,根据所述初步年龄段范围值确定多个中间年龄段范围值,其中,s为正整数。以及,在步骤S204中,计算所述多个中间年龄段范围值的基尼不纯度,并将基尼不纯度最小的中间年龄段范围值作为最终年龄段范围值,以完成对样本标签的确定。
在示例性的实施例中,步骤S203中步长s取值为1,根据初步年龄段范围值的浮动值F=8~12,确定5个中间年龄段范围值为8、9、10、11、12。
在步骤S204中,步长s取值为1时,以第一个年龄段为例进行说明。
中间年龄段范围值取值为8时,第一个年龄段S11为8~15岁,对第一个年龄段S11内用户计算基尼不纯度J11,J11用于表示第一个年龄段S11内用户的行为相似度。
中间年龄段范围值取值为9时,第一个年龄段S12为8~16岁,对第一个年龄段S12内用户计算基尼不纯度J12,J12用于表示第一个年龄段S12内用户的行为相似度。
以此类推,中间年龄段范围值取值分别为10、11、12时,分别第一个年龄段S13、S14、S15基尼不纯度,得到对应的基尼不纯度J13、J14、J15
进一步地,在多个中间年龄段范围值的基尼不纯度中获取最小值,即获得用户行为相似度最高的年龄段,并将最小值的基尼不纯度对应的中间年龄段范围值作为最终年龄段范围值,以完成对样本标签的确定。
在图2所示实施例所提供的技术方案中,在建立用户年龄预测模型的过程中,通过设置年龄范围的浮动值的方式实现动态划分年龄段的方式,进一步,通过计算基尼不纯度的方式获取用户行为相似度最高的年龄段,从而得到的作为样本标签的N个年龄段贴近于实际状况,克服了采用固定方式划分年龄段带来的预测精确率低的问题。
继续参看图1,在步骤S102中获取所述N个年龄段的历史用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段的历史用户对应的行为特征值。
在示例性的实施例中,图3示出了根据本发明的实施例的行为特征值的确定方法的流程示意图。以下结合图3对步骤S102的具体实施方式进行解释说明。参考图3,该方法包括步骤S301-步骤S303。
在步骤S301中,对于所述N个年龄段的历史用户,获取所述历史用户针对多个类目的行为数据和所述行为数据对应的权值。
在示例性的实施例中,图4示出了根据本发明的另一实施例的行为特征值的确定方法的流程示意图,具体可以用于解释步骤S301的具体实施方式。参考图4,该方法包括,对于每个年龄段的历史用户:
步骤S401,获取所述历史用户针对多个类目的浏览数据、点击数据、关注数据、加购物车数据、下单数据中的至少一种作为初步行为数据;步骤S402,在所述初步行为数据中确定有效行为数据;以及,步骤S403,根据所述有效行为数据占所述初始行为数据的比例确定所述行为数据对应的权值。
在示例性的实施例中,上述类目可以表示不同的电商类别,包括:家电类、家纺类、家具类、美妆类等等,但不限于此;上述初步行为数据可以包括:浏览次数、浏览时长、点击次数、是否关注、是否加入购物车、是否下单、向其他用户的推荐次数等等,但不限于此。
在示例性的实施例中,当某商品最终被用户购买成功之后,则此用户在购买之前对此商品的初始行为数据,则为有效行为数据。行为数据对应的权值同于限定在当前行为数据在模型训练中的贡献或作用。
在步骤S302中,根据所述行为数据和所述行为数据对应的权值计算所述历史用户在各个类目上的活跃度。
在示例性的实施例中,通过以下公式计算历史用户Q在各类目上的活跃度L;
Figure BDA0001904604040000101
其中,w)表示行为数据对应的权重;
Figure BDA0001904604040000102
表示历史用户Q在一天内以行为i作用类目k的次数,行为i的种类包括但不限于浏览、点击、关注、加入购物车、下单、推荐;Mk表示历史用户Q作用类目k的行为种类数量;Nk表示历史用户Q对类目k作用的天数;Lk表示历史用户Q作用在类目k上的活跃度;P为用户作用过的类目的数量。
继续参考图3,在确定每个年龄段内的历史用户在各个类目上的活跃度之后,执行步骤S303。在步骤S303中,根据所述活跃度在所述N个年龄段下的分布,确定所述样本标签对对应的行为特征值。
在示例性的实施例中,图5示出了根据本发明的再一实施例的行为特征值的确定方法的流程示意图,具体可以用于解释步骤S303的具体实施方式。参考图5,该方法包括,对于每个年龄段内的历史用户:
步骤S501,按照所述历史用户在各个类目上的活跃度由高到低的顺序将所述活跃度进行排序,并根据所述活跃度的最大值确定每个所述活跃度对应的序号值;以及,步骤S502,统计所述序号值在所述N个年龄段下的分布,确定所述样本标签对对应的行为特征值。
在示例性的实施例中,对于每个年龄段内的每个历史用户,将各个历史用户的活跃值转换为0~1之内的序号值,例如:在第一年龄段内,用户A的活跃度由高到低的顺序将所述活跃度进行排序为:60(Max_L)、50、20、15、6,则将这些活跃度转化为序号值的方法可以是:使用
Figure BDA0001904604040000111
乘以每一个活跃度得到活跃度对应的序号值,依次为:1、0.83、0.33、0.25、0.1。相类似地,将第一年龄段内其他用户的活跃度做相同的处理,从而确定第一年龄段内所有历史用户对应的序号值的分布情况。进一步地,根据相同的方法可以确定每个年龄段内历史用户对应的序号值的分布情况。
在示例性的实施例中,对于每一年龄段内独有历史用户对应的序号值的分布情况,计算序号值的方差,并仅保留方差大于八分位数的序号值对应的活跃度,以完成对各个年龄段内行为特征值的处理。本实施例提供的技术方案采用使用数据支撑特征筛选,有利于降低随机成分对用户年龄预测模型的预测结果的影响;使用编号值方式对活跃度进行处理,可以解决不同用户行为量级不同带来的问题,并且有利于规避特征矩阵稀疏以及不同用户特征值差异带来的影响,进而,有利于提高用户年龄预测模型的预测结果的精确率。
在图3-图5所示实施例所提供的技术方案中,在建立用户年龄预测模型的过程中,采用对行为数据加权的方式,使得行为特征值贴合用户实际的喜好状态,从而有利于提高用户年龄预测模型的预测精确率。
继续参考图1,在步骤S103中,根据图2所示实施例确定的样本标签,以及图3-图5所示实施例确定的行为特征值训练机器学习模型,得到用户年龄预测模型。
在示例性的实施例中,上述机器学习模型可以是决策树、随机森林、SVM等支持分类的模型。可以根据实际需要选择机器学习模型,在此不作限制。
相比前述相关的用户年龄预测模型的建立方法,通过实施例提供的技术方案确定的用户年龄预测模型,其及召回率以及精确率均得到大幅提升。
图6示出了根据本发明的实施例的用户年龄的预测方法的流程示意图,可以在一定程度上克服现有技术提供的预测方法的预测精确率较低的问题。本实施例的执行主体为预测用户年龄的装置,例如可以是服务器等。
参考图6,该实施例提供的用户年龄的预测方法,包括:
步骤S601,获取待测用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述待测用户对应的待测行为特征值;以及,
步骤S602,将所述待测行为特征值输入用户年龄预测模型,根据所述用户年龄预测模型的输出完成对所述待测用户的年龄预测。
在示例性的实施例中,图7示出了根据本发明的实施例的待测行为特征值的确定方法的流程示意图,具体可以用于解释步骤S601的具体实施方式。参考图7,该方法包括步骤S701-步骤S703。
在步骤S701中,获取所述待测用户针对多个类目的行为数据和所述行为数据对应的权值;在步骤S702中,根据所述行为数据和所述行为数据对应的权值计算所述待测用户在各个类目上的活跃度;以及,在步骤S703中,根据所述活跃度确定所述待测用户对应的待测行为特征值。
由于图7示出的实施例中对待测行为特征值的确定方法与图3所示实施例的具体实施方式相对应,因此在此不再赘述。
在示例性的实施例中,上述用户年龄预测模型为根据图1-图5任一图对应的实施例提供的技术方案建立的。因此,对于步骤S602中的用户年龄预测模型的建立方法可以参考图1-图5所示实施例,在此不再赘述。
以下介绍本发明的用户年龄预测模型的建立装置实施例,可以用于执行本发明上述图1至图5示出的用户年龄预测模型的建立方法。
图8示出了根据本发明的实施例的用户年龄预测模型的建立装置的结构示意图,参考图8,用户年龄预测模型的建立装置800,包括:样本标签确定模块801、特征值确定模块802以及预测模型确定模块803。
其中,样本标签确定模块801用于采用动态分段的方式处理获取到的海量用户的年龄样本数据,得到N个年龄段作为样本标签,其中,N为正整数;
特征值确定模块802用于获取所述N个年龄段的用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段用户对应的行为特征值;
预测模型确定模块803用于根据所述样本标签和所述行为特征值训练机器学习模型,得到用户年龄预测模型。
在本发明的一些实施例中,基于前述方案,样本标签确定模块801,包括:统计单元、初步年龄段范围值确定单元、中间年龄段范围值确定单元以及样本标签确定单元。
其中,统计单元用于统计所述海量用户的年龄样本数据,得到年龄上限值和年龄下限值;
初步年龄段范围值确定单元用于根据预设的年龄段的个数N和所述年龄上限值和年龄下限值确定每个所述年龄段的初步年龄段范围值,所述初步年龄段范围值包括基准值和浮动值;
中间年龄段范围值确定单元用于:以s为步长,根据所述初步年龄段范围值确定多个中间年龄段范围值,其中,s为正整数;
样本标签确定单元用于:计算所述多个中间年龄段范围值的基尼不纯度,并将基尼不纯度最小的中间年龄段范围值作为最终年龄段范围值,以完成对样本标签的确定。
在本发明的一些实施例中,基于前述方案,特征值确定模块802,包括:获取单元、计算单元以及确定单元。
其中,获取单元用于:对于所述N个年龄段的用户,获取所述用户针对多个类目的行为数据和所述行为数据对应的权值;
计算单元用于:根据所述行为数据和所述行为数据对应的权值计算所述用户在各个类目上的活跃度;
确定单元用于:根据所述活跃度在所述N个年龄段下的分布,确定所述样本标签对对应的行为特征值。
在本发明的一些实施例中,基于前述方案,所述确定单元,具体用于:
按照所述用户在各个类目上的活跃度由高到低的顺序将所述活跃度进行排序,并根据所述活跃度的最大值确定每个所述活跃度对应的序号值;以及,统计所述序号值在所述N个年龄段下的分布,确定所述样本标签对对应的行为特征值。
在本发明的一些实施例中,基于前述方案,所述获取单元,具体用于:
获取所述用户针对多个类目的浏览数据、点击数据、关注数据、加购物车数据、下单数据中的至少一种作为初步行为数据;在所述初步行为数据中确定有效行为数据;以及,根据所述有效行为数据占所述初始行为数据的比例确定所述行为数据对应的权值。
由于本发明的示例实施例的用户年龄预测模型的建立装置的各个功能模块与上述图1至图5示出的用户年龄预测模型的建立方法的示例实施例的步骤对应,因此对于本发明用户年龄预测模型的建立装置实施例中未披露的细节,请参照本发明上述图1至图5示出的用户年龄预测模型的建立方法的实施例。
以下介绍本发明的用户年龄的预测装置实施例,可以用于执行本发明上述图5、图6的用户年龄的预测方法。
图9示出了根据本发明的实施例的用户年龄的预测装置的结构示意图,参考图9,用户年龄的预测900,包括:待测行为特征值获取模块901和预测模块902。
其中,待测行为特征值获取模块901用于获取待测用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述待测用户对应的待测行为特征值;
预测模块902用于将所述待测行为特征值输入用户年龄预测模型,根据所述用户年龄预测模型的输出完成对所述待测用户的年龄预测
在本发明的一些实施例中,基于前述方案,待测行为特征值获取模块901,具体用于:
获取所述待测用户针对多个类目的行为数据和所述行为数据对应的权值;根据所述行为数据和所述行为数据对应的权值计算所述待测用户在各个类目上的活跃度;以及,根据所述活跃度确定所述待测用户对应的待测行为特征值。
由于本发明的示例实施例的用户年龄的预测装置的各个功能模块与上述图5、图6示出的用户年龄的预测方法的示例实施例的步骤对应,因此对于本发明用户年龄的预测装置实施例中未披露的细节,请参照本发明上述图5、图6示出的用户年龄的预测方法的实施例。
下面参考图10,其示出了适于用来实现本发明实施例的电子设备的计算机***1000的结构示意图。图10示出的电子设备的计算机***1000仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机***1000包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有***操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本申请的***中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的数据处理方法。
例如,所述的电子设备可以实现如图1中所示的:步骤S101,采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,得到N个年龄段作为样本标签,其中,N为正整数;步骤S102,获取所述N个年龄段的历史用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段的历史用户对应的行为特征值;步骤S103,根据所述样本标签和所述行为特征值训练机器学习模型,得到用户年龄预测模型。
又如,所述的电子设备可以实现如图2至图7任一图所示的各个步骤。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (11)

1.一种用户年龄预测模型的建立方法,其特征在于,包括:
采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,得到N个年龄段作为样本标签,其中,N为正整数;
获取所述N个年龄段的历史用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段的历史用户对应的行为特征值;
根据所述样本标签和所述行为特征值训练机器学习模型,得到用户年龄预测模型。
2.根据权利要求1所述的方法,其特征在于,采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,得到N个年龄段作为样本标签,包括:
统计所述海量历史用户的年龄样本数据,得到年龄上限值和年龄下限值;
根据预设的年龄段的个数N和所述年龄上限值和年龄下限值确定每个所述年龄段的初步年龄段范围值,所述初步年龄段范围值包括基准值和浮动值;
以s为步长,根据所述初步年龄段范围值确定多个中间年龄段范围值,其中,s为正整数;
计算所述多个中间年龄段范围值的基尼不纯度,并将基尼不纯度最小的中间年龄段范围值作为最终年龄段范围值,以完成对样本标签的确定。
3.根据权利要求1或2所述的方法,其特征在于,获取所述N个年龄段的历史用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段的历史用户对应的行为特征值,包括:
对于所述N个年龄段的历史用户,获取所述历史用户针对多个类目的行为数据和所述行为数据对应的权值;
根据所述行为数据和所述行为数据对应的权值计算所述历史用户在各个类目上的活跃度;
根据所述活跃度在所述N个年龄段下的分布,确定所述样本标签对对应的行为特征值。
4.根据权利要求3所述的方法,其特征在于,根据所述活跃度在所述N个年龄段下的分布,确定所述样本标签对对应的行为特征值,包括:
按照所述历史用户在各个类目上的活跃度由高到低的顺序将所述活跃度进行排序,并根据所述活跃度的最大值确定每个所述活跃度对应的序号值;
统计所述序号值在所述N个年龄段下的分布,确定所述样本标签对对应的行为特征值。
5.根据权利要求3所述的方法,其特征在于,获取所述历史用户针对多个类目的行为数据和所述行为数据对应的权值,包括:
获取所述历史用户针对多个类目的浏览数据、点击数据、关注数据、加购物车数据、下单数据中的至少一种作为初步行为数据;
在所述初步行为数据中确定有效行为数据;
根据所述有效行为数据占所述初始行为数据的比例确定所述行为数据对应的权值。
6.一种基于权利要求1至5任一项所述的方法建立的用户年龄预测模型进行用户年龄的预测方法,其特征在于,包括:
获取待测用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述待测用户对应的待测行为特征值;
将所述待测行为特征值输入用户年龄预测模型,根据所述用户年龄预测模型的输出完成对所述待测用户的年龄预测。
7.根据权利要求6所述的方法,其特征在于,获取待测用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述待测用户对应的待测行为特征值,包括:
获取所述待测用户针对多个类目的行为数据和所述行为数据对应的权值;
根据所述行为数据和所述行为数据对应的权值计算所述待测用户在各个类目上的活跃度;
根据所述活跃度确定所述待测用户对应的待测行为特征值。
8.一种用户年龄预测模型的建立装置,其特征在于,包括:
样本标签确定模块,用于采用动态分段的方式处理获取到的海量历史用户的年龄样本数据,得到N个年龄段作为样本标签;
特征值确定模块,用于获取所述N个年龄段的历史用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述N个年龄段的历史用户对应的行为特征值;
预测模型确定模块,用于根据所述样本标签和所述行为特征值训练机器学习模型,得到用户年龄预测模型。
9.一种用户年龄的预测装置,其特征在于,包括:
待测行为特征值获取模块,用于获取待测用户在多个类目上的行为数据以及所述多个类目上的行为数据对应的权值,并处理所述行为数据和所述权值获得所述待测用户对应的待测行为特征值;
预测模块,用于将所述待测行为特征值输入用户年龄预测模型,根据所述用户年龄预测模型的输出完成对所述待测用户的年龄预测。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至5中任一项所述的用户年龄预测模型的建立方法,以及实现如权利要求6或7所述的用户年龄的预测方法。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至5中任一项所述的用户年龄预测模型的建立方法,以及实现如权利要求6或7所述的用户年龄的预测方法。
CN201811526578.5A 2018-12-13 2018-12-13 预测模型的建立方法、预测方法、装置、介质及设备 Pending CN111325372A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811526578.5A CN111325372A (zh) 2018-12-13 2018-12-13 预测模型的建立方法、预测方法、装置、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811526578.5A CN111325372A (zh) 2018-12-13 2018-12-13 预测模型的建立方法、预测方法、装置、介质及设备

Publications (1)

Publication Number Publication Date
CN111325372A true CN111325372A (zh) 2020-06-23

Family

ID=71172214

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811526578.5A Pending CN111325372A (zh) 2018-12-13 2018-12-13 预测模型的建立方法、预测方法、装置、介质及设备

Country Status (1)

Country Link
CN (1) CN111325372A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115049395A (zh) * 2022-08-15 2022-09-13 山东双仁信息技术有限公司 一种移动支付安全检测方法及***
CN115578132A (zh) * 2022-12-08 2023-01-06 智慧足迹数据科技有限公司 年龄校准方法、装置、电子设备及可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927675A (zh) * 2014-04-18 2014-07-16 北京京东尚科信息技术有限公司 判断用户年龄段的方法及装置
CN104143097A (zh) * 2013-05-09 2014-11-12 腾讯科技(深圳)有限公司 分类函数获取方法、人脸年龄识别方法、装置和设备
US20150332156A1 (en) * 2014-05-15 2015-11-19 Cellco Partnership D/B/A Verizon Wireless Predictive Modeling Based on Summary Data and Modeling User's Age at Line Level
US20170011420A1 (en) * 2015-07-10 2017-01-12 The Nielsen Company (Us), Llc Methods and apparatus to analyze and adjust age demographic information
CN106503863A (zh) * 2016-11-10 2017-03-15 北京红马传媒文化发展有限公司 基于决策树模型的年龄特征的预测方法、***及终端
CN106651057A (zh) * 2017-01-03 2017-05-10 有米科技股份有限公司 一种基于安装包序列表的移动端用户年龄预测方法
CN108022116A (zh) * 2016-11-01 2018-05-11 北京京东尚科信息技术有限公司 对用户建模的方法、***及终端设备
CN108335131A (zh) * 2018-01-19 2018-07-27 北京奇艺世纪科技有限公司 一种预估用户年龄段的方法、装置及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104143097A (zh) * 2013-05-09 2014-11-12 腾讯科技(深圳)有限公司 分类函数获取方法、人脸年龄识别方法、装置和设备
CN103927675A (zh) * 2014-04-18 2014-07-16 北京京东尚科信息技术有限公司 判断用户年龄段的方法及装置
US20150332156A1 (en) * 2014-05-15 2015-11-19 Cellco Partnership D/B/A Verizon Wireless Predictive Modeling Based on Summary Data and Modeling User's Age at Line Level
US20170011420A1 (en) * 2015-07-10 2017-01-12 The Nielsen Company (Us), Llc Methods and apparatus to analyze and adjust age demographic information
CN108022116A (zh) * 2016-11-01 2018-05-11 北京京东尚科信息技术有限公司 对用户建模的方法、***及终端设备
CN106503863A (zh) * 2016-11-10 2017-03-15 北京红马传媒文化发展有限公司 基于决策树模型的年龄特征的预测方法、***及终端
CN106651057A (zh) * 2017-01-03 2017-05-10 有米科技股份有限公司 一种基于安装包序列表的移动端用户年龄预测方法
CN108335131A (zh) * 2018-01-19 2018-07-27 北京奇艺世纪科技有限公司 一种预估用户年龄段的方法、装置及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115049395A (zh) * 2022-08-15 2022-09-13 山东双仁信息技术有限公司 一种移动支付安全检测方法及***
CN115578132A (zh) * 2022-12-08 2023-01-06 智慧足迹数据科技有限公司 年龄校准方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN106651542B (zh) 一种物品推荐的方法及装置
CN109214585B (zh) 用户消费预测方法、装置、电子设备及存储介质
CN109840730B (zh) 用于数据预测的方法及装置
CN109299356B (zh) 基于大数据的活动推荐方法、装置、电子设备及存储介质
CN109685537B (zh) 用户行为的分析方法、装置、介质和电子设备
CN109034853B (zh) 基于种子用户寻找相似用户方法、装置、介质和电子设备
CN111400613A (zh) 物品推荐方法、装置、介质及计算机设备
CN112017042A (zh) 基于tweedie分布的资源配额确定方法、装置和电子设备
CN112348321A (zh) 风险用户的识别方法、装置及电子设备
CN111582394B (zh) 一种群体评估方法、装置、设备及介质
CN113407854A (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN110197317B (zh) 目标用户确定方法及装置、电子设备及存储介质
CN111325372A (zh) 预测模型的建立方法、预测方法、装置、介质及设备
CN111563628A (zh) 房地产客户成交时间预测方法、装置及存储介质
CN111754287A (zh) 物品筛选方法、装置、设备和存储介质
CN110197316B (zh) 运营数据的处理方法、装置、计算机可读介质及电子设备
US11334935B2 (en) Method, system, and manufacture for light hypergraph based recommendation
CN111488517A (zh) 用于训练点击率预估模型的方法和装置
CN109885745A (zh) 一种用户画像方法、装置、可读存储介质及终端设备
CN110310162B (zh) 样本生成的方法及装置
CN113159213A (zh) 一种业务分配方法、装置及设备
CN113761350A (zh) 一种数据推荐方法、相关装置和数据推荐***
CN109460778B (zh) 活动评估方法、装置、电子设备及存储介质
CN107357847B (zh) 数据处理方法及其装置
CN113568739B (zh) 用户资源额度分配方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination