CN108764997A - 收入识别方法、装置和计算机可读存储介质 - Google Patents

收入识别方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN108764997A
CN108764997A CN201810513505.6A CN201810513505A CN108764997A CN 108764997 A CN108764997 A CN 108764997A CN 201810513505 A CN201810513505 A CN 201810513505A CN 108764997 A CN108764997 A CN 108764997A
Authority
CN
China
Prior art keywords
income
user
identified
coefficient
purchase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810513505.6A
Other languages
English (en)
Inventor
敖滨
程建波
彭南博
张瑞军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Financial Technology Holding Co Ltd
Original Assignee
Beijing Jingdong Financial Technology Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Financial Technology Holding Co Ltd filed Critical Beijing Jingdong Financial Technology Holding Co Ltd
Priority to CN201810513505.6A priority Critical patent/CN108764997A/zh
Publication of CN108764997A publication Critical patent/CN108764997A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种收入识别方法、装置和计算机可读存储介质,涉及数据处理领域。收入识别方法包括:获取待识别用户对每个特征商品的购买次数信息;根据购买次数信息和每种特征商品对应的购买次数比例信息,确定待识别用户的收入系数,其中,购买次数比例信息是每种特征商品的购买总次数中收入在预设收入范围内的用户的购买次数占比,购买次数信息、待识别用户的收入系数与购买次数比例信息成正相关关系;根据收入系数和预设阈值,确定待识别用户的收入范围。本发明的实施例可以根据用户的购买习惯以及特征商品在不同收入范围用户中的被购次数分布情况,确定待识别用户的收入范围。从而,本发明对于稀疏的数据也能够进行准确的收入识别。

Description

收入识别方法、装置和计算机可读存储介质
技术领域
本发明涉及数据处理领域,特别涉及一种收入识别方法、装置和计算机可读存储介质。
背景技术
近年来随着互联网科技的飞速发展,以互联网为载体的消费金融,借助金融科技的力量,呈现出了爆发式的增长。互联网金融不同于以往传统金融的一个重要特点在于其“在线”的特点,这就使得信贷人员很难使用传统的线下的方式去做金融产品的营销和风控。在新业务模式下的爆发式增长,互联网金融企业只能依靠大数据来判断用户的营销价值及其背后的风险。
在这样的背景下,对用户的“人群画像”就变得至关重要了。而在通常的人群画像中,“收入”是与互联网金融各业务诉求最为紧密的特征之一了。因此,对用户收入特征的预测在互联网金融业务线条中,有着至关重要的作用。
在相关技术中,主要采用以下几种方法来识别用户的收入水平。
第一类方法为聚类算法,包括混合高斯模型、混合泊松模型等基于模型的无监督聚类算法,以及k平均算法等非基于模型的聚类算法等等。通过对用户进行分类后类别对应的收入水平来确定用户的收入水平。
第二类方法为混合算法,例如先对训练数据的特征本身进行聚类,然后以降维后所聚的类为特征训练模型。
发明内容
发明人对相关技术进行分析后发现,用户电商行为数据的主要特征是:电商商品本身数量较大,但有收入属性识别价值的商品的使用人群却往往不大。这给使用现有算法来对用户人群进行性别识别带来困难。
对于无监督聚类算法,由于商品的使用人群往往较小,所以其使用行为的概率分布往往不易准确推知。因而基于模型的无监督聚类算法的精度通常不能达到投放的要求。对于混合算法,同样会因为用户人群小,导致一开始的聚类不准确的问题。因此相关技术均无法准确地识别用户的收入。
本发明实施例所要解决的一个技术问题是:如何提升用户收入识别的准确性。
根据本发明一些实施例的第一个方面,提供一种收入识别方法,包括:获取待识别用户对每个特征商品的购买次数信息;根据购买次数信息和每种特征商品对应的购买次数比例信息,确定待识别用户的收入系数,其中,购买次数比例信息与每种特征商品的购买总次数中收入在预设收入范围内的用户的购买次数占比成正相关关系;根据收入系数和预设阈值,确定待识别用户的收入范围。
在一些实施例中,购买次数信息、待识别用户的收入系数与购买次数比例信息成正相关关系。
在一些实施例中,根据购买次数信息和每种特征商品对应的购买次数比例信息,确定待识别用户的收入系数包括:构建包括多个待识别用户对每个特征商品的购买次数信息的购买次数信息矩阵;构建等式关系,在等式关系中,购买次数信息矩阵与收入系数向量的乘积等于购买次数比例信息向量,收入系数向量为未知数并且包括每个待识别用户的收入系数,购买次数比例信息向量为预先确定的并且包括每种特征商品对应的购买次数比例信息;采用压缩感知方法求解等式关系,获得收入系数向量的值,以确定每个待识别用户的收入系数。
在一些实施例中,收入识别方法还包括:采用训练数据中用户对每个特征商品的购买次数信息构建用于训练的购买次数信息矩阵;采用训练数据中用户的收入系数构建用于训练的收入系数向量;根据用于训练的购买次数信息矩阵与用于训练的收入系数向量的乘积获得购买次数比例信息向量。
在一些实施例中,根据购买次数信息、每种特征商品的购买总次数中收入在第一预设收入范围内的用户的第一购买次数比例信息,确定待识别用户的第一收入系数,其中,待识别用户的第一收入系数与第一购买次数比例信息成正相关关系;根据第一收入系数和第一预设收入范围,确定待识别用户的第一收入范围;根据购买次数信息、每种特征商品的购买总次数中收入在第二预设收入范围内的用户的第二购买次数比例信息,确定待识别用户的第二收入系数,其中,第一收入范围包括第二预设收入范围,待识别用户的第二收入系数与第二购买次数比例信息成正相关关系;根据第二收入系数和第二预设收入范围,确定待识别用户的第二收入范围。
在一些实施例中,根据收入系数和预设阈值,确定待识别用户的收入范围包括:在收入系数大于预设阈值的情况下,判定待识别用户的收入属于预设收入范围,其中,预设阈值属于0到1之间;在收入系数小于1与预设阈值之差的情况下,判定待识别用户的收入不属于预设收入范围。
在一些实施例中,收入识别方法还包括:根据特征商品的浏览次数、点击率、购买率的乘积,确定特征商品的购买次数信息。
根据本发明一些实施例的第二个方面,提供一种收入识别装置,包括:购买次数信息获取模块,被配置为获取待识别用户对每个特征商品的购买次数信息;收入系数确定模块,被配置为根据购买次数信息和每种特征商品对应的购买次数比例信息,确定待识别用户的收入系数,其中,购买次数比例信息与每种特征商品的购买总次数中收入在预设收入范围内的用户的购买次数占比成正相关关系;收入范围确定模块,被配置为根据收入系数和预设阈值,确定待识别用户的收入范围。
在一些实施例中,购买次数信息、待识别用户的收入系数与购买次数比例信息成正相关关系。
在一些实施例中,收入系数确定模块进一步被配置为构建包括多个待识别用户对每个特征商品的购买次数信息的购买次数信息矩阵;构建等式关系,在等式关系中,购买次数信息矩阵与收入系数向量的乘积等于购买次数比例信息向量,收入系数向量为未知数并且包括每个待识别用户的收入系数,购买次数比例信息向量为预先确定的并且包括每种特征商品对应的购买次数比例信息;采用压缩感知方法求解等式关系,获得收入系数向量的值,以确定每个待识别用户的收入系数。
在一些实施例中,收入识别装置还包括购买次数比例信息向量确定模块,被配置为采用训练数据中用户对每个特征商品的购买次数信息构建用于训练的购买次数信息矩阵;采用训练数据中用户的收入系数构建用于训练的收入系数向量;根据用于训练的购买次数信息矩阵与用于训练的收入系数向量的乘积获得购买次数比例信息向量。
在一些实施例中,收入系数确定模块进一步被配置为根据购买次数信息、每种特征商品的购买总次数中收入在第一预设收入范围内的用户的第一购买次数比例信息,确定待识别用户的第一收入系数,其中,待识别用户的第一收入系数与第一购买次数比例信息成正相关关系;以及,根据购买次数信息、每种特征商品的购买总次数中收入在第二预设收入范围内的用户的第二购买次数比例信息,确定待识别用户的第二收入系数,其中,第一收入范围包括第二预设收入范围,待识别用户的第二收入系数与第二购买次数比例信息成正相关关系;收入范围确定模块进一步被配置为根据第一收入系数和第一预设收入范围,确定待识别用户的第一收入范围;根据第二收入系数和第二预设收入范围,确定待识别用户的第二收入范围。
在一些实施例中,收入范围确定模块进一步被配置为在收入系数大于预设阈值的情况下,判定待识别用户的收入属于预设收入范围,其中,预设阈值属于0到1之间;在收入系数小于1与预设阈值之差的情况下,判定待识别用户的收入不属于预设收入范围。
在一些实施例中,收入识别装置还包括购买次数信息确定模块,被配置为根据特征商品的浏览次数、点击率、购买率的乘积,确定特征商品的购买次数信息。
根据本发明一些实施例的第三个方面,提供一种收入识别装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行前述任意一种收入识别方法。
根据本发明一些实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任意一种收入识别方法。
上述发明中的一些实施例具有如下优点或有益效果:本发明的实施例可以根据用户的购买习惯以及特征商品在不同收入范围用户中的被购次数分布情况,确定待识别用户的收入范围。从而,本发明对于稀疏的数据也能够进行准确的收入识别。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明一些实施例的收入识别方法的示例性流程图。
图2为根据本发明一些实施例的待识别用户的收入系数的确定方法的示例性流程图。
图3为根据本发明一些实施例的购买次数比例信息向量确定方法的示例性流程图。
图4为根据本发明另一些实施例的收入识别方法的示例性流程图。
图5为根据本发明一些实施例的收入识别装置的示例性结构图。
图6为根据本发明另一些实施例的收入识别装置的示例性结构图。
图7为根据本发明又一些实施例的收入识别装置的示例性结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1为根据本发明一些实施例的收入识别方法的示例性流程图。如图1所示,该实施例的收入识别方法包括步骤S102~S106。
在步骤S102中,获取待识别用户对每个特征商品的购买次数信息。
待识别用户可以是电子商务网站的用户,根据待识别用户的用户标识等用户属性信息,可以查询用户的电子商务网站的行为记录,例如浏览记录、点击记录、收藏记录、购买记录等等。
特征商品指用于进行收入识别而作为一种特征信息来描述用户的商品,是电子商务网站中商品的子集。特征商品可以是需求量较大的商品,例如单位时间内的销量大于预设值的商品;或者在以往的识别过程中发现的对用户的收入水平较为敏感的商品。
购买次数信息可以根据待识别用户购买某个特征商品的次数确定。例如,购买次数信息可以是待识别用户购买某个特征商品的次数与所有用户购买同一特征商品的次数的比值。这里的“所有用户”是指等待识别的所有用户。如果用户没有购买过某特征商品,则该特征商品对应的购买次数信息可以置为0。
在一些实施例中,可以根据特征商品的浏览次数、点击率、购买率共同确定购买次数信息。点击率指商品的被点击数与被浏览次数的比值,购买率指商品的被购买次数与被点击次数的比值。购买是用户表达对商品的兴趣的比较强烈的兴趣信号,而浏览和点击同样也是用户对商品兴趣的体现。因此,这种方法可以综合地体现用户对特征商品的兴趣和关注度。
在一些实施例中,可以根据特征商品的浏览次数、点击率、购买率的乘积,确定特征商品的购买次数信息。例如,某个特征商品在预设的时间段内被浏览了1000次,其点击率为2%,购买率为1%,则这1000次的浏览可以被折算为1000*2%*1%=0.2次等价购买,而所有待识别用户对同一特征商品的等价购买次数总和为10。那么用户对该特征商品的购买次数信息为0.02。
在步骤S104中,根据购买次数信息和每种特征商品对应的购买次数比例信息,确定待识别用户的收入系数,其中,购买次数比例信息与每种特征商品的购买总次数中收入在预设收入范围内的用户的购买次数占比成正相关关系。
在一些实施例中,购买次数信息、待识别用户的收入系数与购买次数比例信息成正相关关系。
购买次数比例信息是预先获得的,可以根据已知收入范围的用户的购买信息确定。例如,可以预先获取已知收入范围的用户中收入大于预设收入范围的用户对特征商品的第一购买次数信息以及所有用户对同一特征商品的第二购买次数信息,根据第一购买次数信息和第二购买次数信息的比值确定特征商品所对应的购买次数比例信息。
在一些实施例中,用户收入越高,收入系数越大,则在对特征商品购买同样次数的情况下该特征商品对应的购买次数比例信息越大。因此,通过构建购买次数信息、待识别用户的收入系数的乘积等于特征商品对应的购买次数比例信息的等式关系,可以求得待识别用户的收入系数。
在一些实施例中,可以获取多个待识别用户对每个特征商品的购买次数信息、形成购买次数信息矩阵,从而可以一次性地获得多个待识别用户的收入范围。
在步骤S106中,根据收入系数和预设阈值,确定待识别用户的收入范围。例如,可以根据收入系数和预设阈值的比较结果来判断待识别用户的收入范围是否在预设收入范围内。
在一些实施例中,在收入系数大于预设阈值的情况下,判定待识别用户的收入属于预设收入范围,其中,预设阈值属于0到1之间;在收入系数小于1与预设阈值之差的情况下,判定待识别用户的收入不属于预设收入范围。如果收入系数不在前述两种范围内,可以将相应的待识别用户作为待定,采用其他方式、或者进一步收集数据以再次进行判断。
例如,设预设收入范围为大于10000,预设阈值为0.8。如果用户的收入系数大于0.8,则判定用户的收入范围大于10000;如果用户的收入系数小于(1-0.8),即小于0.2,则判定用户的收入范围小于10000。如果用户的收入系数介于0.2至0.8之间,则将该待识别用户判定为待定状态。预设阈值的具体数值可以根据需要设定,一般为介于0.5和1之间的纯小数。预设阈值越大,准确率越高,召回率越低;预设阈值越小,准确率越低,召回率越高。
通过上述实施例的方法,可以根据用户的购买习惯以及特征商品在不同收入范围用户中的被购次数分布情况,确定待识别用户的收入范围。从而,本发明对于稀疏的数据也能够进行准确的收入识别。
下面参考图2描述本发明待识别用户的收入系数的确定方法的实施例。
图2为根据本发明一些实施例的待识别用户的收入系数的确定方法的示例性流程图。如图2所示,该实施例的收入系数的确定方法包括步骤S202~S206。
在步骤S202中,构建包括多个待识别用户对每个特征商品的购买次数信息的购买次数信息矩阵。
在步骤S204中,构建等式关系,在等式关系中,购买次数信息矩阵与收入系数向量的乘积等于购买次数比例信息向量,收入系数向量为未知数并且包括每个待识别用户的收入系数,购买次数比例信息向量为预先确定的并且包括每种特征商品对应的购买次数比例信息。
设购买次数信息矩阵P为m×n的矩阵,则矩阵P例如可以参考公式(1)。
在公式(1)中,m表示特征商品的种类,n表示待识别用户的数量,pij表示用户j对特征商品i的购买次数信息。在一些实施例中,可以首先计算每个待识别用户对每个特征商品的等价购买次数,形成等价购买次数矩阵,然后再对矩阵的每一行进行归一化处理,得到购买次数信息矩阵。即,购买次数信息矩阵的每一行之和可以为1。
收入系数向量E可以如公式(2)所示,其中,n表示待识别用户的数量。
E=[e1,e2,…en]T (2)
购买次数比例信息向量R可以如公式(3)所示,其中,m表示特征商品的种类。
R=[r1,r2,…rm]T (3)
从而,构建的等式关系可以如公式(4)所示。
在公式(4)中,E=[e1,e2,…en]T是未知数,求解目标即为E=[e1,e2,…en]T中各个元素的值。
在步骤S206中,采用压缩感知方法求解等式关系,获得收入系数向量的值,以确定每个待识别用户的收入系数。
由于电子商务网站中的商品非常多,即使在识别过程中提供了数量众多的特征商品,单一用户购买过的商品也很难覆盖到特征商品中的每一种,使得购买次数信息矩阵呈稀疏状态。
发明人经过分析后发现,上述等式方程通常为欠定方程,即通常m<n,一般来说存在无数个解。然而,对于上述场景,压缩感知方法在矩阵P为稀疏时可以解得上述方程的唯一解。因此,虽然在收入识别过程中存在数据比较稀疏的问题,但是正可以借助数据稀疏的特色、采用压缩感知方法求解,获得待识别用户的收入系数。
在一些应用场景中,收入高的用户是少数、而收入低的用户是多数。由于收入低的用户的收入系数会比较小、甚至接近于0,因此,可能出现矩阵E中多数元素都近似于0的情况,即,矩阵E也可能是稀疏的,进一步有助于压缩感知方法的求解。从而,在一些实施例中,可以令预设收入范围中属于高收入用户的区间窄于预设值,以提高预测的准确性。
通过上述实施例的方法,可以基于购买次数信息稀疏的特点,采用压缩感知方法确定待识别用户的收入系数,进一步提高了收入识别的准确性。
在预先确定购买次数比例信息向量时,也可以采用类似的过程。下面参考图3描述本发明购买次数比例信息向量确定方法的实施例。
图3为根据本发明一些实施例的购买次数比例信息向量确定方法的示例性流程图。如图3所示,该实施例的购买次数比例信息向量确定方法包括步骤S302~S306。
在步骤S302中,采用训练数据中用户对每个特征商品的购买次数信息构建用于训练的购买次数信息矩阵。该矩阵的具体形式可以参考公式(1)。
在步骤S304中,采用训练数据中用户的收入系数构建用于训练的收入系数向量。由于训练数据中用户的收入水平是已知的,因此可以获取每个用户的收入系数。
收入系数可以根据用于判定用户收入范围的预设阈值、预设的收入范围以及用户的收入水平确定。例如,识别目的是分辨收入大于InA和不大于InA的用户,用于判定用户收入范围的预设阈值是t,用户的收入水平为Earn,M为预设的参数,则可以将作为用户的收入系数。根据需要,还可以采用其他方式确定收入系数,例如可以令不属于预设收入范围的用户的收入系数为0、属于预设收入范围的用户的收入系数为1等等。
在步骤S306中,根据用于训练的购买次数信息矩阵与用于训练的收入系数向量的乘积获得购买次数比例信息向量。从而可以获得每种特征商品对应的购买比例信息。
训练数据可以视为待测数据的均匀抽样,而且多数商品在使用人群中都有稳定的分布。因此通过上述实施例的方法,可以通过训练数据准确地确定用于训练的收入系数向量,进一步提高了收入识别的准确性。
本发明的实施例可以用于二分类问题,还可以通过迭代执行解决多分类问题。下面参考图4描述本发明收入识别方法的另一个实施例。
图4为根据本发明另一些实施例的收入识别方法的示例性流程图。如图4所示,该实施例的收入识别方法包括步骤S402~S408。
在步骤S402中,根据购买次数信息、每种特征商品的购买总次数中收入在第一预设收入范围内的用户的第一购买次数比例信息,确定待识别用户的第一收入系数,其中,待识别用户的第一收入系数与第一购买次数比例信息成正相关关系。
在步骤S404中,根据第一收入系数和第一预设收入范围,确定待识别用户的第一收入范围。
在步骤S406中,根据购买次数信息、每种特征商品的购买总次数中收入在第二预设收入范围内的用户的第二购买次数比例信息,确定待识别用户的第二收入系数,其中,第一收入范围包括第二预设收入范围,待识别用户的第二收入系数与第二购买次数比例信息成正相关关系。
在步骤S408中,根据第二收入系数和第二预设收入范围,确定待识别用户的第二收入范围。
上述实施例仅仅是以收入识别过程中的两次迭代为例。根据需要,本领域技术人员可以进行任意次数的迭代,而不仅仅限于进行两次迭代。
上述实施例的一个应用例为,计划将待识别用户的月收入划分为[0,5000)、[5000,10000)、[10000,15000)、[15000,∞)几个类别,则可以先以>10000作为预设的收入范围,判别用户是否属于该范围。如果识别出的用户的月收入>10000,则可以再以>15000作为预设的收入范围,判别用户是否属于该范围。如果识别出的用户的月收入<10000,则可以再以>5000作为预设的收入范围,判别用户是否属于该范围。如果有进一步的划分,可以继续执行上述方法。
通过上述实施例的方法,可以根据需要设置识别的收入范围,提高了收入识别的灵活性和适用广度。
下面参考图5描述本发明收入识别装置的实施例。
图5为根据本发明一些实施例的收入识别装置的示例性结构图。如图5所示,该实施例的收入识别装置50包括:购买次数信息获取模块510,被配置为获取待识别用户对每个特征商品的购买次数信息;收入系数确定模块520,被配置为根据购买次数信息和每种特征商品对应的购买次数比例信息,确定待识别用户的收入系数,其中,购买次数比例信息与每种特征商品的购买总次数中收入在预设收入范围内的用户的购买次数占比成正相关关系;收入范围确定模块530,被配置为根据收入系数和预设阈值,确定待识别用户的收入范围。
在一些实施例中,购买次数信息、待识别用户的收入系数与购买次数比例信息成正相关关系。
在一些实施例中,收入系数确定模块520可以进一步被配置为构建包括多个待识别用户对每个特征商品的购买次数信息的购买次数信息矩阵;构建等式关系,在等式关系中,购买次数信息矩阵与收入系数向量的乘积等于购买次数比例信息向量,收入系数向量为未知数并且包括每个待识别用户的收入系数,购买次数比例信息向量为预先确定的并且包括每种特征商品对应的购买次数比例信息;采用压缩感知方法求解等式关系,获得收入系数向量的值,以确定每个待识别用户的收入系数。
在一些实施例中,收入识别装置50还可以包括购买次数比例信息向量确定模块540,被配置为采用训练数据中用户对每个特征商品的购买次数信息构建用于训练的购买次数信息矩阵;采用训练数据中用户的收入系数构建用于训练的收入系数向量;根据用于训练的购买次数信息矩阵与用于训练的收入系数向量的乘积获得购买次数比例信息向量。
在一些实施例中,收入系数确定模块520可以进一步被配置为根据购买次数信息、每种特征商品的购买总次数中收入在第一预设收入范围内的用户的第一购买次数比例信息,确定待识别用户的第一收入系数,其中,待识别用户的第一收入系数与第一购买次数比例信息成正相关关系;以及,根据购买次数信息、每种特征商品的购买总次数中收入在第二预设收入范围内的用户的第二购买次数比例信息,确定待识别用户的第二收入系数,其中,第一收入范围包括第二预设收入范围,待识别用户的第二收入系数与第二购买次数比例信息成正相关关系;收入范围确定模块530可以进一步被配置为根据第一收入系数和第一预设收入范围,确定待识别用户的第一收入范围;根据第二收入系数和第二预设收入范围,确定待识别用户的第二收入范围。
在一些实施例中,收入范围确定模块530可以进一步被配置为在收入系数大于预设阈值的情况下,判定待识别用户的收入属于预设收入范围,其中,预设阈值属于0到1之间;在收入系数小于1与预设阈值之差的情况下,判定待识别用户的收入不属于预设收入范围。
在一些实施例中,收入识别装置50还可以包括购买次数信息确定模块550,被配置为根据特征商品的浏览次数、点击率、购买率的乘积,确定特征商品的购买次数信息。
图6为根据本发明另一些实施例的收入识别装置的示例性结构图。如图6所示,该实施例的收入识别装置600包括:存储器610以及耦接至该存储器610的处理器620,处理器620被配置为基于存储在存储器610中的指令,执行前述任意一个实施例中的收入识别方法。
其中,存储器610例如可以包括***存储器、固定非易失性存储介质等。***存储器例如存储有操作***、应用程序、引导装载程序(Boot Loader)以及其他程序等。
图7为根据本发明又一些实施例的收入识别装置的示例性结构图。如图7所示,该实施例的收入识别装置700包括:存储器710以及处理器720,还可以包括输入输出接口730、网络接口740、存储接口750等。这些接口730,740,750以及存储器710和处理器720之间例如可以通过总线760连接。其中,输入输出接口730为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口740为各种联网设备提供连接接口。存储接口750为SD卡、U盘等外置存储设备提供连接接口。
本发明的实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任意一种收入识别方法。
本领域内的技术人员应当明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种收入识别方法,包括:
获取待识别用户对每个特征商品的购买次数信息;
根据所述购买次数信息和每种特征商品对应的购买次数比例信息,确定待识别用户的收入系数,其中,所述购买次数比例信息与每种特征商品的购买总次数中收入在预设收入范围内的用户的购买次数占比成正相关关系;
根据所述收入系数和预设阈值,确定待识别用户的收入范围。
2.根据权利要求1所述的收入识别方法,其中,所述购买次数信息、待识别用户的收入系数与所述购买次数比例信息成正相关关系。
3.根据权利要求2所述的收入识别方法,其中,所述根据所述购买次数信息和每种特征商品对应的购买次数比例信息,确定待识别用户的收入系数包括:
构建包括多个待识别用户对每个特征商品的购买次数信息的购买次数信息矩阵;
构建等式关系,在所述等式关系中,所述购买次数信息矩阵与收入系数向量的乘积等于购买次数比例信息向量,收入系数向量为未知数并且包括每个待识别用户的收入系数,购买次数比例信息向量为预先确定的并且包括每种特征商品对应的购买次数比例信息;
采用压缩感知方法求解所述等式关系,获得收入系数向量的值,以确定每个待识别用户的收入系数。
4.根据权利要求3所述的收入识别方法,还包括:
采用训练数据中用户对每个特征商品的购买次数信息构建用于训练的购买次数信息矩阵;
采用训练数据中用户的收入系数构建用于训练的收入系数向量;
根据用于训练的购买次数信息矩阵与用于训练的收入系数向量的乘积获得购买次数比例信息向量。
5.根据权利要求1~4中任一项所述的收入识别方法,其中,
根据所述购买次数信息、每种特征商品的购买总次数中收入在第一预设收入范围内的用户的第一购买次数比例信息,确定待识别用户的第一收入系数,其中,所述待识别用户的第一收入系数与所述第一购买次数比例信息成正相关关系;
根据所述第一收入系数和所述第一预设收入范围,确定待识别用户的第一收入范围;
根据所述购买次数信息、每种特征商品的购买总次数中收入在第二预设收入范围内的用户的第二购买次数比例信息,确定待识别用户的第二收入系数,其中,第一收入范围包括第二预设收入范围,所述待识别用户的第二收入系数与所述第二购买次数比例信息成正相关关系;
根据所述第二收入系数和所述第二预设收入范围,确定待识别用户的第二收入范围。
6.根据权利要求1~4中任一项所述的收入识别方法,其中,所述根据所述收入系数和预设阈值,确定待识别用户的收入范围包括:
在所述收入系数大于预设阈值的情况下,判定待识别用户的收入属于所述预设收入范围,其中,所述预设阈值属于0到1之间;
在所述收入系数小于1与预设阈值之差的情况下,判定待识别用户的收入不属于所述预设收入范围。
7.根据权利要求1~4中任一项所述的收入识别方法,还包括:
根据特征商品的浏览次数、点击率、购买率的乘积,确定特征商品的购买次数信息。
8.一种收入识别装置,包括:
购买次数信息获取模块,被配置为获取待识别用户对每个特征商品的购买次数信息;
收入系数确定模块,被配置为根据所述购买次数信息和每种特征商品对应的购买次数比例信息,确定待识别用户的收入系数,其中,所述购买次数比例信息与每种特征商品的购买总次数中收入在预设收入范围内的用户的购买次数占比成正相关关系;
收入范围确定模块,被配置为根据所述收入系数和预设阈值,确定待识别用户的收入范围。
9.根据权利要求8所述的收入识别装置,其中,所述购买次数信息、待识别用户的收入系数与所述购买次数比例信息成正相关关系。
10.根据权利要求9所述的收入识别装置,其中,所述收入系数确定模块进一步被配置为构建包括多个待识别用户对每个特征商品的购买次数信息的购买次数信息矩阵;构建等式关系,在所述等式关系中,所述购买次数信息矩阵与收入系数向量的乘积等于购买次数比例信息向量,收入系数向量为未知数并且包括每个待识别用户的收入系数,购买次数比例信息向量为预先确定的并且包括每种特征商品对应的购买次数比例信息;采用压缩感知方法求解所述等式关系,获得收入系数向量的值,以确定每个待识别用户的收入系数。
11.根据权利要求10所述的收入识别装置,还包括购买次数比例信息向量确定模块,被配置为采用训练数据中用户对每个特征商品的购买次数信息构建用于训练的购买次数信息矩阵;采用训练数据中用户的收入系数构建用于训练的收入系数向量;根据用于训练的购买次数信息矩阵与用于训练的收入系数向量的乘积获得购买次数比例信息向量。
12.根据权利要求8~11中任一项所述的收入识别装置,其中,
所述收入系数确定模块进一步被配置为根据所述购买次数信息、每种特征商品的购买总次数中收入在第一预设收入范围内的用户的第一购买次数比例信息,确定待识别用户的第一收入系数,其中,所述待识别用户的第一收入系数与所述第一购买次数比例信息成正相关关系;以及,根据所述购买次数信息、每种特征商品的购买总次数中收入在第二预设收入范围内的用户的第二购买次数比例信息,确定待识别用户的第二收入系数,其中,第一收入范围包括第二预设收入范围,所述待识别用户的第二收入系数与所述第二购买次数比例信息成正相关关系;
所述收入范围确定模块进一步被配置为根据所述第一收入系数和所述第一预设收入范围,确定待识别用户的第一收入范围;根据所述第二收入系数和所述第二预设收入范围,确定待识别用户的第二收入范围。
13.根据权利要求8~11中任一项所述的收入识别装置,其中,所述收入范围确定模块进一步被配置为在所述收入系数大于预设阈值的情况下,判定待识别用户的收入属于所述预设收入范围,其中,所述预设阈值属于0到1之间;在所述收入系数小于1与预设阈值之差的情况下,判定待识别用户的收入不属于所述预设收入范围。
14.根据权利要求8~11中任一项所述的收入识别装置,还包括购买次数信息确定模块,被配置为根据特征商品的浏览次数、点击率、购买率的乘积,确定特征商品的购买次数信息。
15.一种收入识别装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1~7中任一项所述的收入识别方法。
16.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1~7中任一项所述的收入识别方法。
CN201810513505.6A 2018-05-25 2018-05-25 收入识别方法、装置和计算机可读存储介质 Pending CN108764997A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810513505.6A CN108764997A (zh) 2018-05-25 2018-05-25 收入识别方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810513505.6A CN108764997A (zh) 2018-05-25 2018-05-25 收入识别方法、装置和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN108764997A true CN108764997A (zh) 2018-11-06

Family

ID=64006263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810513505.6A Pending CN108764997A (zh) 2018-05-25 2018-05-25 收入识别方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108764997A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360032A (zh) * 2018-12-07 2019-02-19 泰康保险集团股份有限公司 客户评估方法、装置、设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577472A (zh) * 2012-08-03 2014-02-12 纽海信息技术(上海)有限公司 个人信息获得、推定、商品的分类、检索方法及***
CN106330095A (zh) * 2016-09-27 2017-01-11 华北电力大学 一种大型光伏电站汇集***故障定位方法
CN106372151A (zh) * 2016-08-30 2017-02-01 多盟睿达科技(中国)有限公司 一种基于用户性别识别的消息推送方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577472A (zh) * 2012-08-03 2014-02-12 纽海信息技术(上海)有限公司 个人信息获得、推定、商品的分类、检索方法及***
CN106372151A (zh) * 2016-08-30 2017-02-01 多盟睿达科技(中国)有限公司 一种基于用户性别识别的消息推送方法及装置
CN106330095A (zh) * 2016-09-27 2017-01-11 华北电力大学 一种大型光伏电站汇集***故障定位方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360032A (zh) * 2018-12-07 2019-02-19 泰康保险集团股份有限公司 客户评估方法、装置、设备以及存储介质
CN109360032B (zh) * 2018-12-07 2021-04-06 泰康保险集团股份有限公司 客户评估方法、装置、设备以及存储介质

Similar Documents

Publication Publication Date Title
CN110309119B (zh) 用于实现数据上传、处理和预测查询api公开的***、方法和装置
CN106530010B (zh) 融合时间因素的协同过滤方法和装置
CN108205768A (zh) 数据库建立方法和数据推荐方法及装置、设备和存储介质
CN107516246B (zh) 用户类型的确定方法、确定装置、介质及电子设备
WO2020238229A1 (zh) 交易特征生成模型的训练、交易特征的生成方法和装置
CN107886241B (zh) 资源分析方法、装置、介质和电子设备
CN108734587A (zh) 金融产品的推荐方法及终端设备
CN102682153A (zh) 信息处理和呈现装置、终端装置、评估得分计算法和程序
WO2020015112A1 (zh) 产品功能推荐方法、终端设备及计算机可读存储介质
CN110598183A (zh) 一种流量分配方法、装置、设备及存储介质
CN109784352A (zh) 一种评估分类模型的方法和装置
CN115797005A (zh) 预测模型的训练、商品推荐方法、装置、电子设备及介质
CN115170244A (zh) 新产品的冷启动推荐方法、装置、电子设备和介质
CN115130811A (zh) 电力用户画像的建立方法、装置及电子设备
CN108428138A (zh) 一种基于客户分群的客户生存率分析装置及分析方法
CN109978306B (zh) 数据处理方法及装置
CN113297486A (zh) 一种点击率预测方法及相关装置
CN108764997A (zh) 收入识别方法、装置和计算机可读存储介质
CN108062415A (zh) 用户行为的统计方法、装置及终端设备
CN107357847B (zh) 数据处理方法及其装置
CN116186541A (zh) 一种推荐模型的训练方法及装置
CN115827994A (zh) 一种数据处理方法、装置、设备、存储介质
CN108629506A (zh) 风控模型的建模方法、装置、计算机设备和存储介质
CN108629023A (zh) 数据挖掘方法、装置以及计算机可读存储介质
CN107633422A (zh) 一种基于用户行为的市场预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100176 Beijing Daxing District Beijing Economic Development Zone, Chuang Chuang eleven Street 18 hospital C block 2 floor, 221 rooms.

Applicant after: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.

Address before: 100176 Beijing Daxing District Beijing Economic Development Zone, Chuang Chuang eleven Street 18 hospital C block 2 floor, 221 rooms.

Applicant before: BEIJING JINGDONG FINANCIAL TECHNOLOGY HOLDING Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 221, 2nd floor, C Block, 18 Kechuang 11th Street, Beijing Daxing District, Beijing

Applicant after: Jingdong Technology Holding Co.,Ltd.

Address before: Room 221, 2nd floor, C Block, 18 Kechuang 11th Street, Beijing Daxing District, Beijing

Applicant before: Jingdong Digital Technology Holding Co.,Ltd.

Address after: Room 221, 2nd floor, C Block, 18 Kechuang 11th Street, Beijing Daxing District, Beijing

Applicant after: Jingdong Digital Technology Holding Co.,Ltd.

Address before: Room 221, 2nd floor, C Block, 18 Kechuang 11th Street, Beijing Daxing District, Beijing

Applicant before: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.

CB02 Change of applicant information