CN109658193A - ***对象重要性的确定方法、装置、电子设备及存储介质 - Google Patents
***对象重要性的确定方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN109658193A CN109658193A CN201811565644.XA CN201811565644A CN109658193A CN 109658193 A CN109658193 A CN 109658193A CN 201811565644 A CN201811565644 A CN 201811565644A CN 109658193 A CN109658193 A CN 109658193A
- Authority
- CN
- China
- Prior art keywords
- system object
- importance
- weight
- multidimensional characteristic
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 93
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 52
- 238000010606 normalization Methods 0.000 claims description 47
- 241000406668 Loxodonta cyclotis Species 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 103
- 238000010586 diagram Methods 0.000 description 13
- 230000001174 ascending effect Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000006854 communication Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000018199 S phase Effects 0.000 description 2
- 230000003466 anti-cipated effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000020509 sex determination Effects 0.000 description 2
- 235000011888 snacks Nutrition 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0621—Item configuration or customization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/12—Hotels or restaurants
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例公开了一种***对象重要性的确定方法、装置、电子设备及存储介质。该方法包括:确定***对象的多维特征;基于训练算法,确定所述***对象的多维特征对应的特征权重;根据所述***对象的多维特征及特征权重,确定所述***对象的重要性。本公开实施例采用***对象的多维特征衡量***对象的重要性,增加了***对象的重要性数据的准确率,同时还采用最小错误率训练算法确定多维特征的特征权重,能够有效避免人工设定***对象特效的权重而带来的主观性,使得***对象的重要性数据更加客观而准确。
Description
技术领域
本公开涉及计算机技术领域,具体涉及一种***对象重要性的确定方法、装置、电子设备及存储介质。
背景技术
随着信息技术的发展,电子商务已经深入到各个领域,网络上出现了众多的信息平台,例如外卖点餐平台,这些信息平台上的信息、产品等的提供方通过在信息平台上的***对象提供各种服务,供用户在线定制使用。基于***对象所提供的服务的不同,每个***对象所凝聚的用户群体也不同。而对于信息平台而言,最重要的是用户数量以及用户特征数据。因此,能为信息平台带来更多的用户以及用户特征数据,那么***对象对于信息平台而言则更加重要。因此,如何确定***对象的重要性,进而根据***对象的重要性以有助于信息平台的长期发展为目标而采取相应的策略,是当前信息平台亟需解决的技术问题之一。
发明内容
本公开实施例提供一种***对象重要性的方法、装置、电子设备及计算机可读存储介质。
第一方面,本公开实施例中提供了一种***对象重要性的方法。
具体的,所述***对象重要性的方法,包括:
确定***对象的多维特征;
基于训练算法,确定所述***对象的多维特征对应的特征权重;
根据所述***对象的多维特征及特征权重,确定所述***对象的重要性。
结合第一方面,本公开在第一方面的第一种实现方式中,确定***对象的多维特征,包括:
确定所述***对象的所述多维特征的原始特征值;
对所述原始特征值进行归一化处理,确定所述多维特征的归一化特征值。
结合第一方面和/或第一方面的第一种实现方式,确定所述多维特征的归一化特征值,包括:
在所述多维特征与所述***对象的重要性呈正相关关系时,所述多维特征的归一化特征值确定为所述原始特征值与所述***对象个数的比值;
在所述多维特征与所述***对象的重要性呈负相关关系时,所述多维特征的归一化特征值确定为1减去所述原始特征值与所述***对象个数的比值。
结合第一方面的第一种实现方式,本公开在第一方面的第二种实现方式中,根据所述***对象的多维特征及特征权重,确定所述***对象的重要性,包括:
根据所述特征权重对所述多维特征的归一化特征值进行加权后确定所述***对象的重要性。
结合第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,根据所述特征权重对所述多维特征的归一化特征值进行加权后确定所述***对象的重要性,包括:
通过下式计算所述***对象i的重要性值:
其中,N表示所述***对象i的特征维度数目,wj表示所述多维特征中的第j个特征的特征权重;f_scoreij表示***对象i的第j个特征的归一化特征值。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式或第一方面的第三种实现方式,本公开在第一方面的第四种实现方式中,基于训练算法,确定所述***对象的多维特征对应的特征权重,包括:
获取训练样本;其中,所述训练样本包括多个所述***对象两两之间重要性的第一比对结果;
利用所述训练样本以及最小错误率训练算法对所述多维特征对应的所述特征权重进行训练,进而确定所述多维特征对应的特征权重。
结合第一方面的第四种实现方式,本公开在第一方面的第五种实现方式中,利用所述训练样本以及最小错误率训练算法对所述多维特征对应的所述特征权重进行训练,进而确定所述多维特征对应的特征权重,包括:
对于所述多维特征中的目标特征对应的目标特征权重,在所述多维特征中的其他特征对应的特征权重不变的情况下,确定多个所述***对象在所述目标特征权重任意取值下的候选重要性;
根据所述训练样本中的所述第一比对结果以及所述候选重要性确定所述目标特征权重。
结合第一方面的第五种实现方式,本公开在第一方面的第六种实现方式中,根据所述训练样本中的所述第一比对结果以及所述候选重要性确定所述目标特征权重,包括:
确定至少两个所述***对象的候选重要性相等时的候选特征权重;
确定所述候选特征权重下两两***对象的候选重要性的第二比对结果;
确定所述第二比对结果与所述训练样本中相应的所述第一比对结果的相符程度;其中,所述相符程度的大小与第二比对结果和第一比对结果的相同数量相关;
将所述相符程度最高的候选特征权重确定为所述目标特征权重。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第五种实现方式或第一方面的第六种实现方式,本公开在第一方面的第七种实现方式中,所述***对象的多维特征至少包括用户在最近的第一时间周期内的复购率、用户平均客单价、新客转化率、凝聚新用户数、单均用户资源量、新用户单均资源量及是否连锁商户中的两个或两个以上。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第五种实现方式或第一方面的第六种实现方式,本公开在第一方面的第八种实现方式中,所述方法还包括:根据所述***对象的重要性确定使用所述***对象的用户参数。
结合第一方面的第八种实现方式,本公开在第一方面的第九种实现方式中,根据所述***对象的重要性确定使用所述***对象的用户参数,包括:
确定所述用户参数的各离散取值,以及确定所述各离散取值在所述各离散取值所在范围中对应的多个第一分数位;
将多个所述***对象按照所述重要性进行排序,并确定所述***对象的排序位置在整个排序中对应的第二分数位;
将使用所述***对象的用户参数确定为与所述第二分数位相等的第一分数位对应的所述离散取值。
第二方面,本公开实施例提供了一种***对象重要性的确定装置,包括:
第一确定模块,被配置为确定***对象的多维特征;
第二确定模块,被配置为基于训练算法,确定所述***对象的多维特征对应的特征权重;
第三确定模块,被配置为根据所述***对象的多维特征及特征权重,确定所述***对象的重要性。
结合第二方面,本公开在第二方面的第一种实现方式中,第一确定模块,包括:
第一确定子模块,被配置为确定所述***对象的所述多维特征的原始特征值;
第二确定子模块,被配置为对所述原始特征值进行归一化处理,确定所述多维特征的归一化特征值。
结合第二方面和/或第二方面的第一种实现方式,所述第二确定子模块,包括:
第一归一化子模块,被配置为在所述多维特征与所述***对象的重要性呈正相关关系时,所述多维特征的归一化特征值确定为所述原始特征值与所述***对象个数的比值;
第二归一化子模块,被配置为在所述多维特征与所述***对象的重要性呈负相关关系时,所述多维特征的归一化特征值确定为1减去所述原始特征值与所述***对象个数的比值。
结合第二方面的第一种实现方式,本公开在第二方面的第二种实现方式中,第三确定模块,包括:
第三确定子模块,被配置为根据所述特征权重对所述多维特征的归一化特征值进行加权后确定所述***对象的重要性。
结合第二方面的第二种实现方式,本公开在第二方面的第三种实现方式中,第三确定子模块,包括:计算子模块,被配置为通过下式计算所述***对象i的重要性值:
其中,N表示所述***对象i的特征维度数目,wj表示所述多维特征中的第j个特征的特征权重;f_scoreij表示***对象i的第j个特征的归一化特征值。
结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式或第二方面的第三种实现方式,本公开在第二方面的第四种实现方式中,第二确定模块,包括:
第一获取子模块,被配置为获取训练样本;其中,所述训练样本包括多个所述***对象两两之间重要性的第一比对结果;
第四确定子模块,被配置为利用所述训练样本以及最小错误率训练算法对所述多维特征对应的所述特征权重进行训练,进而确定所述多维特征对应的特征权重。
结合第二方面的第四种实现方式,本公开在第二方面的第五种实现方式中,第四确定子模块,包括:
第五确定子模块,被配置为对于所述多维特征中的目标特征对应的目标特征权重,在所述多维特征中的其他特征对应的特征权重不变的情况下,确定多个所述***对象在所述目标特征权重任意取值下的候选重要性;
第六确定子模块,被配置为根据所述训练样本中的所述第一比对结果以及所述候选重要性确定所述目标特征权重。
结合第二方面的第四种实现方式,本公开在第二方面的第六种实现方式中,第六确定子模块,包括:
第七确定子模块,被配置为确定至少两个所述***对象的候选重要性相等时的候选特征权重;
第八确定子模块,被配置为确定所述候选特征权重下两两***对象的候选重要性的第二比对结果;
第九确定子模块,被配置为确定所述第二比对结果与所述训练样本中相应的所述第一比对结果的相符程度;其中,所述相符程度的大小与第二比对结果和第一比对结果的相同数量相关;
第十确定子模块,被配置为将所述相符程度最高的候选特征权重确定为所述目标特征权重。
结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第五种实现方式或第二方面的第六种实现方式,本公开在第二方面的第七种实现方式中,所述***对象的多维特征至少包括用户在最近的第一时间周期内的复购率、用户平均客单价、新客转化率、凝聚新用户数、单均用户资源量、新用户单均资源量及是否连锁商户中的两个或两个以上。
结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第五种实现方式或第二方面的第六种实现方式,本公开在第二方面的第八种实现方式中,所述装置还包括:
第四确定模块,被配置为根据所述***对象的重要性确定使用所述***对象的用户参数。
结合第二方面的第八种实现方式,本公开在第二方面的第九种实现方式中,所述第四确定模块,包括:
第十一确定子模块,被配置为确定所述用户参数的各离散取值,以及确定所述各离散取值在所述各离散取值所在范围中对应的多个第一分数位;
第十二确定子模块,被配置为将多个所述***对象按照所述重要性进行排序,并确定所述***对象的排序位置在整个排序中对应的第二分数位;
第十三确定子模块,被配置为将使用所述***对象的用户参数确定为与所述第二分数位相等的第一分数位对应的所述离散取值。
所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,***对象重要性的确定装置的结构中包括存储器和处理器,所述存储器用于存储一条或多条支持***对象重要性的确定装置执行上述第一方面中***对象重要性的确定方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。所述***对象重要性的确定装置还可以包括通信接口,用于***对象重要性的确定装置与其他设备或通信网络通信。
第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现第一方面所述的方法步骤。
第四方面,本公开实施例提供了一种计算机可读存储介质,用于存储***对象重要性的确定装置所用的计算机指令,其包含用于执行上述第一方面中方法所涉及的计算机指令。
本公开实施例确定了***对象的多维特征后,利用训练算法进一步确定***对象的多维特征对应的特征权重;并根据***对象的多维特征及特征权重确定***对象的重要性。该技术方案采用***对象的多维特征衡量***对象的重要性,增加了***对象的重要性数据的准确率,同时本公开实施例还采用训练算法确定多维特征的特征权重,能够有效避免人工设定***对象特效的权重而带来的主观性,使得***对象的重要性数据更加客观而准确。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。在附图中:
图1示出根据本公开一实施方式的***对象重要性的确定方法的流程图;
图2示出根据图1所示实施方式的步骤S102的流程图;
图3示出根据图2所示实施方式的步骤S202的流程图;
图4示出根据本公开一实施方式的5个***对象关于目标特征权重的重要性值的坐标示意图;
图5示出根据图3所示实施方式的步骤S302的流程图;
图6示出根据本公开一实施方式的***对象重要性的确定装置的结构框图;
图7示出根据图6所示实施方式的第二确定模块602的结构框图;
图8示出根据图7所示实施方式的第四确定子模块702的结构框图;
图9示出根据图8所示实施方式的第六确定子模块802的结构框图;
图10是适于用来实现根据本公开一实施方式的***对象重要性的确定方法的电子设备的结构示意图。
具体实施方式
下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。
在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
基于已有技术中存在的问题,本公开实施例提出了一种***对象重要性的确定方法,该***对象重要性的确定方法包括:确定***对象的多维特征;基于训练算法,确定所述***对象的多维特征对应的特征权重;根据所述***对象的多维特征及特征权重,确定所述***对象的重要性。
图1示出根据本公开一实施方式的***对象重要性的确定方法的流程图。如图1所示,所述***对象重要性的确定方法包括以下步骤S101-S103:
在步骤S101中,确定***对象的多维特征;
在步骤S102中,基于训练算法,确定所述***对象的多维特征对应的特征权重;
在步骤S103中,根据所述***对象的多维特征及特征权重,确定所述***对象的重要性。
在下文中将对步骤S101、S102和S103分别做进一步的描述。
步骤S101
信息平台作为信息提供者将多个信息、产品等服务提供方所提供的服务发布在互联网中,供用户在线定制各个服务提供方提供的服务。信息平台将不同的服务提供方虚拟为信息平台中的***对象,每个***对象在信息平台上又可以提供一个或多个服务。例如外卖点餐平台将各种餐饮提供方虚拟为外卖点餐平台中的各个虚拟店铺,用户登录外卖点餐平台后,可以进入虚拟店铺进行点餐。本公开实施例中的信息平台不限于上述外卖点餐平台,只要是面向用户,且能够提供一个或多个拥有服务产品并能够为用户提供服务产品的***对象的平台,都在本公开实施例的信息平台范围内。
***对象可以是信息平台中发布的、拥有一个或多个面向用户的服务的虚拟对象,且每个***对象可以对应现实生活中的一个或多个服务提供商。信息平台中的一个***对象可以为用户提供一个或多个服务,用户可以通过信息平台上定制***对象所提供的服务,且在用户通过信息平台定制了服务之后,***对象对应的服务提供商可以为用户提供现实生活中的服务。服务可以包括但不限于信息、实物产品、虚拟产品等。
***对象基于所提供的服务的不同、客户群体的不同、自身属性的不同等具有不同的特征。本公开实施例提取不同***对象所具有的不同特征,并通过多维度的特征确定***对象在信息平台中的重要性。***对象在信息平台中的重要性与其所凝聚的用户相关,例如某个***对象能够为信息平台带来更多的用户,则该***对象的重要性较高,如果某个***对象无法为信息平台带来用户,则该***对象对信息平台而言重要性较低。不同性质的信息平台对于***对象的重要性的定义可以有所不同,而同一信息平台也可以基于不同的目的为***对象定义不同的重要性。而无论哪种情形,***对象对于信息平台的重要性通常都体现在***对象的不同特征上,例如***对象对应的现实生活中实体商家所具有的特征、该***对象在信息平台上发布后为用户提供服务过程中体现出来的一些特征等,具体会涉及哪些特征,与信息平台对于***对象的期望方向等实际情况有关,在此不做限制。
下面以外卖点餐平台为例,***对象在凝聚客户这方面的重要性所涉及到的多维特征可以如下表所示:
本领域技术人员可以理解,以上列表中的特征仅仅是外卖点餐平台的示例,不同信息平台、不同侧重点所对应的特征可以不同。而且本领域技术人员可以理解,根据本公开实施例的***对象的重要性确定技术方案可以用于各种信息平台,而不限于外卖点餐平台。
步骤S102
***对象的特征通常都可以量化,也即每个***对象的特征都会对应有特征值,而对于不同特征而言,可以根据特征对于***对象的重要性的影响程度确定不同的特征权重。本实施例基于训练算法确定***对象的多维特征的特征权重。特征权重可以是指***对象的重要性中每一维特征所占的权重。现有技术中主要是通过人为方式设定特征权重,但是这种人为设定的方式会造成***对象重要性的判断强烈依赖人工经验,主观性比较强,而且必须投入人力,容易造成人力资源的浪费等问题。因此,本实施例中,采用训练算法确定所述***对象的多维特征对应的特征权重,一方面可以避免人工设计权重,另一方面依赖于***对象的技术数据和历史订单数据,更加科学客观。
步骤S103
在本实施例中,在确定***对象的重要性时,可以根据所述***对象的多维特征及特征权重来做出综合判断,由于特征权重是基于训练算法得到的,较为客观,因此计算得到的***对象的重要性也比较客观,能够真实反映***对象在信息平台中的重要性。***对象的重要性可以体现为对***对象的评分、评估结果或评价结果等,评分、评估结果或评价结果等越高,***对象就越重要。***对象的重要性的具体算法可以根据实际需要而定,例如可以采用简单的线性运算得到,也可以利用机器学习算法得到,机器学习算法包括但不限于:神经网络、逻辑回归、支持向量机、决策树和马尔可夫决策过程等算法。
本公开实施例确定了***对象的多维特征后,利用训练算法进一步确定***对象的多维特征对应的特征权重;并根据***对象的多维特征及特征权重确定***对象的重要性。该技术方案采用***对象的多维特征衡量***对象的重要性,增加了***对象的重要性数据的准确率,同时本公开实施例还采用训练算法确定多维特征的特征权重,能够有效避免人工设定***对象特效的权重而带来的主观性,使得***对象的重要性数据更加客观而准确。
在本实施例的一个可选实现方式中,所述步骤S101,即确定***对象的多维特征的步骤,进一步包括以下步骤:
确定所述***对象的所述多维特征的原始特征值;
对所述原始特征值进行归一化处理,确定所述多维特征的归一化特征值。
该可选的实现方式中,通过统计或者计算等方式获取所述***对象的所述多维特征的原始特征值。每个特征的原始特征值的量化方式基于特征的不同而不同,但基本上可以基于***对象相关的历史数据和/或经验数据确定。例如凝聚新用户数及***对象是否对应连锁(KA)商户可以通过统计方式获取,而用户(在一些实施例中可以仅考虑新用户)转化率可以通过计算方式获取。由于***对象的每维特征的特征值量化方式不一致,因此在对多维特征的特征值综合计算之前,可以对所述原始特征值进行归一化处理,并基于归一化后的特征值确定***对象的重要性。不同***对象特征的特征值归一化方法可以不同。例如,用户(在一些实施例中可以仅考虑新用户)在最近的第一时间周期内的复购率、用户(在一些实施例中可以仅考虑新用户)平均客单价、用户(在一些实施例中可以仅考虑新用户)转化率、凝聚新用户数等原始特征值越高的***用户,***用户对应的重要性越高,那么原始特征值与归一化后的特征值呈正相关关系;而单均用户资源量、新用户单均资源量等原始特征值越高的***对象,***对象对应的重要性反而越低,那么原始特征值与归一化后的特征值呈负相关关系。本公开实施例虽然以外卖点餐平台为例进行说明,但本公开并不限于此,也就是说,本公开实施例的技术方案可以应用于各种信息平台。
在本实施例的一个可选实现方式中,确定所述多维特征的归一化特征值,包括:
在所述多维特征与所述***对象的重要性呈正相关关系时,所述多维特征的归一化特征值确定为所述原始特征值与所述***对象个数的比值;
在所述多维特征与所述***对象的重要性呈负相关关系时,所述多维特征的归一化特征值确定为1减去所述原始特征值与所述***对象个数的比值。
该可选的实现方式中,对于每一维特征,对所有***对象的该特征对应的原始特征值按照由小到大升序排序,按照排序顺序计算每个***对象的该维特征归一化后的特征值。***对象i的各个特征归一化的特征值计算过程为:
对于与归一化后的特征值呈正相关关系的特征,归一化的特征值可以表示为:
其中,f-scoreij表示***对象i的特征j归一化的特征值,f-rankij表示对所有***对象按照特征j的原始特征值升序排序后,***对象i在该排序后的列表中的排序位置,M表示所有***对象的个数。
对于与归一化后的特征值呈负相关关系的特征,归一化的特征值可以表示为:
其中,f_scoreij表示***对象i的特征j归一化的特征值,f_rankij表示对所有***对象按照特征j的原始特征值升序排序后,***对象i在该排序后的列表中的排序位置,M表示所有***对象的个数。
对于特征“是否连锁商户”,归一化后特征值表示为:
在本实施例的一个可选实现方式中,所述步骤S103,即根据所述***对象的多维特征及特征权重,确定所述***对象的重要性的步骤,包括:
根据所述特征权重对所述多维特征的归一化特征值进行加权后确定所述***对象的重要性。
***对象的重要性可以直接由所述多维特征的归一化特征值确定,也可以经过加权后再确定。在不加权的情形下,各维特征对于***对象的重要性的影响程度是一样的。但是在实际情况下,不同特征对于***对象的重要性的影响程度所有不同,因此采用加权后的特征值确定***对象的重要性更为客观。因此,在本实施例中,可以根据所述特征权重对所述多维特征的归一化特征值进行加权后确定所述***对象的重要性。
在本实施例的一个可选实现方式中,可以通过下式计算所述***对象i的重要性值:
其中,N表示所述***对象i的特征维度数目,wj表示所述多维特征中的第j个特征的特征权重;f_scoreij表示***对象i的第j个特征的归一化特征值。
在本实施例的一个可选实现方式中,如图2所示,所述步骤S102,即确定***对象的多维特征的步骤,进一步包括以下步骤S201-S202:
在步骤S201中,获取训练样本;其中,所述训练样本包括多个所述***对象两两之间重要性的第一比对结果;
在步骤S202中,利用所述训练样本以及最小错误率训练算法对所述多维特征对应的所述特征权重进行训练,进而确定所述多维特征对应的特征权重。
步骤S201
在本实施例中,可以根据历史数据和/或历史经验获取大量的训练样本,并通过人工标注的方式,标注多个***对象两两之间重要性的第一比对结果,例如***对象i的重要性大于***对象j的重要性等。下文以外卖点餐平台中***对象两两之间重要性的第一比对结果为例进行说明,例如“肯德基应该比田老师有更多的资源,即肯德基比田老师的重要性大”、“麦当劳应该比肯德基的资源少,即麦当劳比肯德基的重要性小”等,可以将这些所述***对象两两之间重要性的第一比对结果作为训练样本,这些训练样本的数量可根据具体业务需求确定,在本公开中不做限定。
步骤S202
在本实施例中,确定了训练样本的情况下,可以采用最小错误率训练算法对***对象的特征权重进行训练,最终目的是使得训练得到的各个特征的特征权重能够最大程度的与训练样本中的第一比对结果相吻合。
利用最小错误率训练算法(mert)可以对***对象的多维特征的权重进行调整。最小错误率训练算法可以为每个多维特征选出最佳的一个特征权重,且所选择出来的特征权重使得计算得到的***对象的重要性与已知的***对象之间的重要性对比关系最符合。例如,***对象1对应的商家为连锁商家,而***对象2对应的商家为非常小的一个小卖店,那么根据历史经验可以知道,对于信息平台而言,***对象1的重要性要大于***对象2。最小错误率训练算法是基于各个***对象的重要性之间的一些已知对比关系,为***对象的多维特征中的每一维选择最佳的一个特征权重,使得根据这些特征权重计算得到的***对象的重要性最符合上述对比关系。
例如,首先确定所有维特征对应的特征权重的初始值,可以采用将所有维特征对应的特征权重设置为预设值的方法,其中预设值可以为某个固定数值,例如1;也可以通过机器自动产生随机数的方式为所有维特征对应的特征权重赋值;还可以根据训练样本,采用常用的机器学习算法获取所有维特征对应的特征权重的初始值。由于训练样本的标注数据可以在一定程度上体现***对象两两之间重要性比对结果,当确定完所有维特征对应的特征权重的初始值之后,可以利用训练样本,通过最小错误率训练算法对所述多维特征对应的所述特征权重进行训练,从而确定所述多维特征对应的特征权重。
在本实施例的一个可选实现方式中,如图3所示,所述步骤S202,即利用所述训练样本以及最小错误率训练算法对所述多维特征对应的所述特征权重进行训练,进而确定所述多维特征对应的特征权重的步骤,进一步包括以下步骤S301-S302:
在步骤S301中,对于所述多维特征中的目标特征对应的目标特征权重,在所述多维特征中的其他特征对应的特征权重不变的情况下,确定多个所述***对象在所述目标特征权重任意取值下的候选重要性;
在步骤S302中,根据所述训练样本中的所述第一比对结果以及所述候选重要性确定所述目标特征权重。
步骤S301
在本实施例中,最小错误率训练算法可以利用迭代的方式对***对象的多维特征的特征权重进行优化。在对***对象的多维特征对应的特征权重进行优化的过程中,每次迭代中可以只优化所述***对象的一个特征对应的特征权重。例如,从所述***对象多维特征中任意选取一个目标特征p对应的目标特征权重wp,对该目标特征权重wp进行优化。在对上述目标特征权重wp进行优化时,多维特征中的其他特征对应的特征权重保持不变。其中,多维特征中的其他特征对应的特征权重不变是指,对于已经优化过的特征对应的特征权重,其特征权重为优化后的特征权重;对于其他未优化的特征对应的特征权重,其特征权重可以为一初始值(固定值或随机数)。此时,所述***对象i重要性值Scorei可以表示为一个斜率为f_scoreip的直线:
当目标特征权重wp取不同值的时候,所述***对象i的重要性值不同,可以确定所述***对象i在所述目标特征权重wp任意取值下的候选重要性值,也即该斜率为f_scoreip的直线对应的所有y值(x值为目标特征权重wp)。
采用上述同样的方法可以确定信息平台上多个所述***对象在所述目标特征权重任意取值下的候选重要性。本公开实施例将以5个***对象的目标特征权重wp为例进行说明,如图4所示,5个***对象的重要性值Score分别可以表示为斜率为f_score1p、f_score2p、f_score3p、f_score4p和f_score5p的直线,这五条直线对应的y值则分别为5个***对象的候选重要性。
步骤S302
在确定了每个***对象的候选重要性之后,可以根据训练样本中的第一比对结果从这些候选重要性中确定能够最大程度地满足第一比对结果的重要性对应的目标特征权重。
在本实施例的一个可选实现方式中,如图5所示,所述步骤S302,即根据所述训练样本中的所述第一比对结果以及所述候选重要性确定所述目标特征权重的步骤,进一步包括以下步骤S501-S504:
在步骤S501中,确定至少两个所述***对象的候选重要性相等时的候选特征权重;
在步骤S502中,确定所述候选特征权重下两两***对象的候选重要性的第二比对结果。
在步骤S503中,确定所述第二比对结果与所述训练样本中相应的所述第一比对结果的相符程度;其中,所述相符程度的大小与第二比对结果和第一比对结果的相同数量相关;
在步骤S504中,将所述相符程度最高的候选特征权重确定为所述目标特征权重。
在本实施例中,每个***对象的候选重要性值可以表示为一条直线,如图4所示,不同***对象的候选重要性值对应的直线之间具有交点,而且只有在交点的位置处才会改变***对象的重要性,因此,首先确定至少两个所述***对象的候选重要性相等时(也即两直线交点处)的候选特征权重(在图4中总共有10个交点,也即能够确定十个候选特征权重);其次确定所述候选特征权重下两两***对象的候选重要性的第二比对结果;然后判断第二比对结果和对应的第一比对结果是否相同,并且统计相同的数量,例如,在某一候选特征权重下q0,第一比对结果总共有10个,而与其对应的第二比对结果与之相同的数量为9;而在另一候选特征权重q1下,与第一比对结果对应的第二比对结果与之相同的数量为8,那么相较于候选特征权重q1,可以认为在候选特征权重q0下,第二比对结果与第一比对结果的相符程度更高。最后可以将相符程度最高的候选特征权重确定为目标特征权重。
在本实施例的一个可选实现方式中,所述***对象的多维特征至少包括用户(在一些实施例中可以仅考虑新用户)在最近的第一时间周期内的复购率、用户(在一些实施例中可以仅考虑新用户)平均客单价、新客转化率、凝聚新用户数、单均用户资源量、新用户单均资源量及***对象是否连锁商户中的两个或两个以上。例如可以包括新客转化率和凝聚新用户数,或者包括凝聚新用户数、单均用户资源量、新用户单均资源量。实现充分利用***对象的多维特征,而不局限于少数特征,从而实现更客观的体现***对象的重要性判定。
在本实施例的一个可选实现方式中,所述方法还进一步包括以下步骤:
根据所述***对象的重要性确定使用所述***对象的用户参数。
该可选的实现方式中,所述用户参数确定方法包括以下步骤:根据***对象的重要性确定使用***对象的用户参数;其中,所述***对象的重要性根据本公开实施例中的***重要性的确定方法确定。
在本实施例中,在确定了***重要性之后,还可以根据***重要性确定用户参数。用户参数可以包括但不限于信息平台为用户提供的资源。在一些实施例中,***对象的重要性越高,信息平台为该***对象所凝聚的用户提供的资源可以越多,这样能够促进***对象凝聚更多的用户,为信息平台提供更多的用户资源。
在本实施例的一个可选实现方式中,根据所述***对象的重要性确定使用所述***对象的用户参数的步骤,进一步包括以下步骤:
确定所述用户参数的各离散取值,以及确定所述各离散取值在所述各离散取值所在范围中对应的多个第一分数位;
将多个所述***对象按照所述重要性进行排序,并确定所述***对象的排序位置在整个排序中对应的第二分数位;
将使用所述***对象的用户参数确定为与所述第二分数位相等的第一分数位对应的所述离散取值。
该可选的实现方式中,通过下面一个具体的应用场景描述用户参数的确定过程,需要说明的是本公开实施例不限于该应用场景。
首先将所有***对象的重要性按照从小到大的顺序排序;其次根据配置的用户参数区间的大小划分用户参数的分位数,并将所划分得到的分位数确定为分位节点;再次根据该分位节点,将排序后的所述***对象进行分组;最后根据***对象分组情况,从小到大将用户对应的参数区间中的参数确定为用户的参数。例如:运营配置的用户参数区间为[3,7],则参数区间大小为5,分位数可以分别为0.20,0.40,0.60,0.80,1.00。首先将所有***对象的重要性按照从小到大的顺序排序,其次分别找到20%分位节点、40%分位节点、60%分位节点和80%分位节点,然后将排序位置小于20%分位节点的***对象的用户参数取值为3,将排序位置为20%至40%的***对象的用户参数取值为4,将排序位置为40%至60%的***对象的用户参数取值为5,将排序位置为60%至80%的***对象的用户参数取值为6,将排序位置大于80%的***对象的用户参数取值为7。
本实施例中的其他细节可参见上述对***对象的重要性确定方法实施例的描述,在此不再赘述。
下述为本公开装置实施例,可以用于执行本公开方法实施例。
图6示出根据本公开一实施方式的***对象重要性的确定装置的结构框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图6所示,所述***对象重要性的确定装置包括第一确定模块601、第二确定模块602和第三确定模块603:
第一确定模块601,被配置为确定***对象的多维特征;
第二确定模块602,被配置为基于训练算法,确定所述***对象的多维特征对应的特征权重;
第三确定模块603,被配置为根据所述***对象的多维特征及特征权重,确定所述***对象的重要性。
在下文中将对第一确定模块601、第二确定模块602和第三确定模块603分别做进一步的描述。
第一确定模块601
信息平台作为信息提供者将多个信息、产品等服务提供方所提供的服务发布在互联网中,供用户在线定制各个服务提供方提供的服务。信息平台将不同的服务提供方虚拟为信息平台中的***对象,每个***对象在信息平台上又可以提供一个或多个服务。例如外卖点餐平台将各种餐饮提供方虚拟为外卖点餐平台中的各个虚拟店铺,用户登录外卖点餐平台后,可以进入虚拟店铺进行点餐。本公开实施例中的信息平台不限于上述外卖点餐平台,只要是面向用户,且能够提供一个或多个拥有服务产品并能够为用户提供服务产品的***对象的平台,都在本公开实施例的信息平台范围内。
***对象可以是信息平台中发布的、拥有一个或多个面向用户的服务的虚拟对象,且每个***对象可以对应现实生活中的一个或多个服务提供商。信息平台中的一个***对象可以为用户提供一个或多个服务,用户可以通过信息平台上定制***对象所提供的服务,且在用户通过信息平台定制了服务之后,***对象对应的服务提供商可以为用户提供现实生活中的服务。服务可以包括但不限于信息、实物产品、虚拟产品等。
***对象基于所提供的服务的不同、客户群体的不同、自身属性的不同等具有不同的特征。本公开实施例提取不同***对象所具有的不同特征,并通过多维度的特征确定***对象在信息平台中的重要性。***对象在信息平台中的重要性与其所凝聚的用户相关,例如某个***对象能够为信息平台带来更多的用户,则该***对象的重要性较高,如果某个***对象无法为信息平台带来用户,则该***对象对信息平台而言重要性较低。不同性质的信息平台对于***对象的重要性的定义可以有所不同,而同一信息平台也可以基于不同的目的为***对象定义不同的重要性。而无论哪种情形,***对象对于信息平台的重要性通常都体现在***对象的不同特征上,例如***对象对应的现实生活中实体商家所具有的特征、该***对象在信息平台上发布后为用户提供服务过程中体现出来的一些特征等,具体会涉及哪些特征,与信息平台对于***对象的期望方向等实际情况有关,在此不做限制。
下面以外卖点餐平台为例,***对象在凝聚客户这方面的重要性所涉及到的多维特征可以如下表所示:
本领域技术人员可以理解,以上列表中的特征仅仅是外卖点餐平台的示例,不同信息平台、不同侧重点所对应的特征可以不同。而且本领域技术人员可以理解,根据本公开实施例的***对象的重要性确定技术方案可以用于各种信息平台,而不限于外卖点餐平台。
第二确定模块602
***对象的特征通常都可以量化,也即每个***对象的特征都会对应有特征值,而对于不同特征而言,可以根据特征对于***对象的重要性的影响程度确定不同的特征权重。本实施例基于训练算法确定***对象的多维特征的特征权重。特征权重可以是指***对象的重要性中每一维特征所占的权重。现有技术中主要是通过人为方式设定特征权重,但是这种人为设定的方式会造成***对象重要性的判断强烈依赖人工经验,主观性比较强,而且必须投入人力,容易造成人力资源的浪费等问题。因此,本实施例中,采用训练算法确定所述***对象的多维特征对应的特征权重,一方面可以避免人工设计权重,另一方面依赖于***对象的技术数据和历史订单数据,更加科学客观。
第三确定模块603
在本实施例中,在确定***对象的重要性时,可以根据所述***对象的多维特征及特征权重来做出综合判断,由于特征权重是基于训练算法得到的,较为客观,因此计算得到的***对象的重要性也比较客观,能够真实反映***对象在信息平台中的重要性。***对象的重要性可以体现为对***对象的评分、评估结果或评价结果等,评分、评估结果或评价结果等越高,***对象就越重要。***对象的重要性的具体算法可以根据实际需要而定,例如可以采用简单的线性运算得到,也可以利用机器学习算法得到,机器学习算法包括但不限于:神经网络、逻辑回归、支持向量机、决策树和马尔可夫决策过程等算法。
本公开实施例确定了***对象的多维特征后,利用训练算法进一步确定***对象的多维特征对应的特征权重;并根据***对象的多维特征及特征权重确定***对象的重要性。该技术方案采用***对象的多维特征衡量***对象的重要性,增加了***对象的重要性数据的准确率,同时本公开实施例还采用训练算法确定多维特征的特征权重,能够有效避免人工设定***对象特效的权重而带来的主观性,使得***对象的重要性数据更加客观而准确。
在本实施例的一个可选实现方式中,所述第一确定模块601,进一步包括:
第一确定子模块,被配置为确定所述***对象的所述多维特征的原始特征值;
第二确定子模块,被配置为对所述原始特征值进行归一化处理,确定所述多维特征的归一化特征值。
该可选的实现方式中,通过统计或者计算等方式获取所述***对象的所述多维特征的原始特征值。每个特征的原始特征值的量化方式基于特征的不同而不同,但基本上可以基于***对象相关的历史数据和/或经验数据确定。例如凝聚新用户数及***对象是否对应连锁(KA)商户可以通过统计方式获取,而用户(在一些实施例中可以仅考虑新用户)转化率可以通过计算方式获取。由于***对象的每维特征的特征值量化方式不一致,因此在对多维特征的特征值综合计算之前,可以对所述原始特征值进行归一化处理,并基于归一化后的特征值确定***对象的重要性。不同***对象特征的特征值归一化方法可以不同。例如,用户(在一些实施例中可以仅考虑新用户)在最近的第一时间周期内的复购率、用户(在一些实施例中可以仅考虑新用户)平均客单价、用户(在一些实施例中可以仅考虑新用户)转化率、凝聚新用户数等原始特征值越高的***用户,***用户对应的重要性越高,那么原始特征值与归一化后的特征值呈正相关关系;而单均用户资源量、新用户单均资源量等原始特征值越高的***对象,***对象对应的重要性反而越低,那么原始特征值与归一化后的特征值呈负相关关系。本公开实施例虽然以外卖点餐平台为例进行说明,但本公开并不限于此,也就是说,本公开实施例的技术方案可以应用于各种信息平台。
在本实施例的一个可选实现方式中,所述第二确定子模块,包括:
第一归一化子模块,被配置为在所述多维特征与所述***对象的重要性呈正相关关系时,所述多维特征的归一化特征值确定为所述原始特征值与所述***对象个数的比值;
第二归一化子模块,被配置为在所述多维特征与所述***对象的重要性呈负相关关系时,所述多维特征的归一化特征值确定为1减去所述原始特征值与所述***对象个数的比值。
该可选的实现方式中,对于每一维特征,对所有***对象的该特征对应的原始特征值按照由小到大升序排序,按照排序顺序计算每个***对象的该维特征归一化后的特征值。***对象i的各个特征归一化的特征值计算过程为:
对于与归一化后的特征值呈正相关关系的特征,归一化的特征值可以表示为:
其中,f_scoreij表示***对象i的特征j归一化的特征值,f_rankij表示对所有***对象按照特征j的原始特征值升序排序后,***对象i在该排序后的列表中的排序位置,M表示所有***对象的个数。
对于与归一化后的特征值呈负相关关系的特征,归一化的特征值可以表示为:
其中,f_scoreij表示***对象i的特征j归一化的特征值,f_rankij表示对所有***对象按照特征j的原始特征值升序排序后,***对象i在该排序后的列表中的排序位置,M表示所有***对象的个数。
对于特征“是否连锁商户”,归一化后特征值表示为:
在本实施例的一个可选实现方式中,所述第三确定模块603,包括:
第三确定子模块,被配置为根据所述特征权重对所述多维特征的归一化特征值进行加权后确定所述***对象的重要性。
***对象的重要性可以直接由所述多维特征的归一化特征值确定,也可以经过加权后再确定。在不加权的情形下,各维特征对于***对象的重要性的影响程度是一样的。但是在实际情况下,不同特征对于***对象的重要性的影响程度所有不同,因此采用加权后的特征值确定***对象的重要性更为客观。因此,在本实施例中,可以根据所述特征权重对所述多维特征的归一化特征值进行加权后确定所述***对象的重要性。
在本实施例的一个可选实现方式中,可以通过下式计算所述***对象i的重要性值:
其中,N表示所述***对象i的特征维度数目,wj表示所述多维特征中的第j个特征的特征权重;f_scoreij表示***对象i的第j个特征的归一化特征值。
在本实施例的一个可选实现方式中,如图7所示,所述第二确定模块602,包括:
第一获取子模块701,被配置为获取训练样本;其中,所述训练样本包括多个所述***对象两两之间重要性的第一比对结果;
第四确定子模块702,被配置为利用所述训练样本以及最小错误率训练算法对所述多维特征对应的所述特征权重进行训练,进而确定所述多维特征对应的特征权重。
第一获取子模块701
在本实施例中,可以根据历史数据和/或历史经验获取大量的训练样本,并通过人工标注的方式,标注多个***对象两两之间重要性的第一比对结果,例如***对象i的重要性大于***对象j的重要性等。下文以外卖点餐平台中***对象两两之间重要性的第一比对结果为例进行说明,例如“肯德基应该比田老师有更多的资源,即肯德基比田老师的重要性大”、“麦当劳应该比肯德基的资源少,即麦当劳比肯德基的重要性小”等,可以将这些所述***对象两两之间重要性的第一比对结果作为训练样本,这些训练样本的数量可根据具体业务需求确定,在本公开中不做限定。
第四确定子模块702
在本实施例中,确定了训练样本的情况下,可以采用最小错误率训练算法对***对象的特征权重进行训练,最终目的是使得训练得到的各个特征的特征权重能够最大程度的与训练样本中的第一比对结果相吻合。
利用最小错误率训练算法(mert)可以对***对象的多维特征的权重进行调整。最小错误率训练算法可以为每个多维特征选出最佳的一个特征权重,且所选择出来的特征权重使得计算得到的***对象的重要性与已知的***对象之间的重要性对比关系最符合。例如,***对象1对应的商家为连锁商家,而***对象2对应的商家为非常小的一个小卖店,那么根据历史经验可以知道,对于信息平台而言,***对象1的重要性要大于***对象2。最小错误率训练算法是基于各个***对象的重要性之间的一些已知对比关系,为***对象的多维特征中的每一维选择最佳的一个特征权重,使得根据这些特征权重计算得到的***对象的重要性最符合上述对比关系。
例如,首先确定所有维特征对应的特征权重的初始值,可以采用将所有维特征对应的特征权重设置为预设值的方法,其中预设值可以为某个固定数值,例如1;也可以通过机器自动产生随机数的方式为所有维特征对应的特征权重赋值;还可以根据训练样本,采用常用的机器学习算法获取所有维特征对应的特征权重的初始值。由于训练样本的标注数据可以在一定程度上体现***对象两两之间重要性比对结果,当确定完所有维特征对应的特征权重的初始值之后,可以利用训练样本,通过最小错误率训练算法对所述多维特征对应的所述特征权重进行训练,从而确定所述多维特征对应的特征权重。
在本实施例的一个可选实现方式中,如图8所示,所述第四确定子模块702,包括:
第五确定子模块801,被配置为对于所述多维特征中的目标特征对应的目标特征权重,在所述多维特征中的其他特征对应的特征权重不变的情况下,确定多个所述***对象在所述目标特征权重任意取值下的候选重要性;
第六确定子模块802,被配置为根据所述训练样本中的所述第一比对结果以及所述候选重要性确定所述目标特征权重。
第五确定子模块801
在本实施例中,最小错误率训练算法可以利用迭代的方式对***对象的多维特征的特征权重进行优化。在对***对象的多维特征对应的特征权重进行优化的过程中,每次迭代中可以只优化所述***对象的一个特征对应的特征权重。例如,从所述***对象多维特征中任意选取一个目标特征p对应的目标特征权重wp,对该目标特征权重wp进行优化。在对上述目标特征权重wp进行优化时,多维特征中的其他特征对应的特征权重保持不变。其中,多维特征中的其他特征对应的特征权重不变是指,对于已经优化过的特征对应的特征权重,其特征权重为优化后的特征权重;对于其他未优化的特征对应的特征权重,其特征权重可以为一初始值(固定值或随机数)。此时,所述***对象i重要性值Scorei可以表示为一个斜率为f_scoreip的直线:
当目标特征权重wp取不同值的时候,所述***对象i的重要性值不同,可以确定所述***对象i在所述目标特征权重wp任意取值下的候选重要性值,也即该斜率为f_scoreip的直线对应的所有y值(x值为目标特征权重wp)。
采用上述同样的方法可以确定信息平台上多个所述***对象在所述目标特征权重任意取值下的候选重要性。本公开实施例将以5个***对象的目标特征权重wp为例进行说明,如图4所示,5个***对象的重要性值Score分别可以表示为斜率为f_score1p、f_score2p、f_score3p、f_score4p和fscore5p的直线,这五条直线对应的y值则分别为5个***对象的候选重要性。
第六确定子模块802
在确定了每个***对象的候选重要性之后,可以根据训练样本中的第一比对结果从这些候选重要性中确定能够最大程度地满足第一比对结果的重要性对应的目标特征权重。
在本实施例的一个可选实现方式中,如图9所示,所述第六确定子模块802,包括:
第七确定子模块901,被配置为确定至少两个所述***对象的候选重要性相等时的候选特征权重;
第八确定子模块902,被配置为所述候选特征权重下两两***对象的候选重要性的第二比对结果。
第九确定子模块903,被配置为确定所述第二比对结果与所述训练样本中相应的所述第一比对结果的相符程度;其中,所述相符程度的大小与第二比对结果和第一比对结果的相同数量相关;
第十确定子模块904,被配置为将所述相符程度最高的候选特征权重确定为所述目标特征权重。
在本实施例中,每个***对象的候选重要性值可以表示为一条直线,如图4所示,不同***对象的候选重要性值对应的直线之间具有交点,而且只有在交点的位置处才会改变***对象的重要性,因此,首先通过第七确定子模块901确定至少两个所述***对象的候选重要性相等时(也即两直线交点处)的候选特征权重(在图4中总共有10个交点,也即能够确定十个候选特征权重);其次通过第八确定子模块902确定所述候选特征权重下两两***对象的候选重要性的第二比对结果;然后通过第九确定子模块903判断第二比对结果和对应的第一比对结果是否相同,并且统计相同的数量,例如,在某一候选特征权重下q0,第一比对结果总共有10个,而与其对应的第二比对结果与之相同的数量为9;而在另一候选特征权重q1下,与第一比对结果对应的第二比对结果与之相同的数量为8,那么相较于候选特征权重q1,可以认为在候选特征权重q0下,第二比对结果与第一比对结果的相符程度更高。最后通过第十确定子模块904可以将相符程度最高的候选特征权重确定为目标特征权重。
在本实施例的一个可选实现方式中,所述***对象的多维特征至少包括用户(在一些实施例中可以仅考虑新用户)在最近的第一时间周期内的复购率、用户(在一些实施例中可以仅考虑新用户)平均客单价、新客转化率、凝聚新用户数、单均用户资源量、新用户单均资源量及***对象是否连锁商户中的两个或两个以上。例如可以包括新客转化率和凝聚新用户数,或者包括凝聚新用户数、单均用户资源量、新用户单均资源量。实现充分利用***对象的多维特征,而不局限于少数特征,从而实现更客观的体现***对象的重要性判定。
在本实施例的一个可选实现方式中,***对象重要性的确定装置还包括:
第四确定模块,被配置为根据所述***对象的重要性确定使用所述***对象的用户参数。
在本实施例中,在确定了***重要性之后,还可以根据***重要性确定用户参数。用户参数可以包括但不限于信息平台为用户提供的资源。在一些实施例中,***对象的重要性越高,信息平台为该***对象所凝聚的用户提供的资源可以越多,这样能够促进***对象凝聚更多的用户,为信息平台提供更多的用户资源。
在本实施例的一个可选实现方式中,所述第四确定模块,包括:
第十一确定子模块,被配置为确定所述用户参数的各离散取值,以及确定所述各离散取值在所述各离散取值所在范围中对应的多个第一分数位;
第十二确定子模块,被配置为将多个所述***对象按照所述重要性进行排序,并确定所述***对象的排序位置在整个排序中对应的第二分数位;
第十三确定子模块,被配置为将使用所述***对象的用户参数确定为与所述第二分数位相等的第一分数位对应的所述离散取值。
该可选的实现方式中,通过下面一个具体的应用场景描述用户参数的确定过程,需要说明的是本公开实施例不限于该应用场景。
首先将所有***对象的重要性按照从小到大的顺序排序;其次根据配置的用户参数区间的大小划分用户参数的分位数,并将所划分得到的分位数确定为分位节点;再次根据该分位节点,将排序后的所述***对象进行分组;最后根据***对象分组情况,从小到大将用户对应的参数区间中的参数确定为用户的参数。例如:运营配置的用户参数区间为[3,7],则参数区间大小为5,分位数可以分别为0.20,0.40,0.60,0.80,1.00。首先将所有***对象的重要性按照从小到大的顺序排序,其次分别找到20%分位节点、40%分位节点、60%分位节点和80%分位节点,然后将排序位置小于20%分位节点的***对象的用户参数取值为3,将排序位置为20%至40%的***对象的用户参数取值为4,将排序位置为40%至60%的***对象的用户参数取值为5,将排序位置为60%至80%的***对象的用户参数取值为6,将排序位置大于80%的***对象的用户参数取值为7。
本实施例中的其他细节可参见上述对***对象的重要性确定方法实施例的描述,在此不再赘述。
图10是适于用来实现根据本公开实施方式的***对象重要性的确定方法的电子设备的结构示意图。
如图10所示,电子设备1000包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)1003中的程序而执行上述图1所示的实施方式中的各种处理。在RAM1003中,还存储有电子设备1000操作所需的各种程序和数据。CPU1001、ROM1002以及RAM1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
特别地,根据本公开的实施方式,上文参考图1描述的方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行图1的方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。
附图中的流程图和框图,图示了按照本公开各种实施方式的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种***对象重要性的确定方法,其特征在于,包括:
确定***对象的多维特征;
基于训练算法确定所述***对象的多维特征对应的特征权重;
根据所述***对象的多维特征及特征权重,确定所述***对象的重要性。
2.根据权利要求1所述的方法,其特征在于,确定***对象的多维特征,包括:
确定所述***对象的所述多维特征的原始特征值;
对所述原始特征值进行归一化处理,确定所述多维特征的归一化特征值。
3.根据权利要求2所述的方法,其特征在于,确定所述多维特征的归一化特征值,包括:
在所述多维特征与所述***对象的重要性呈正相关关系时,所述多维特征的归一化特征值确定为所述原始特征值与所述***对象个数的比值;
在所述多维特征与所述***对象的重要性呈负相关关系时,所述多维特征的归一化特征值确定为1减去所述原始特征值与所述***对象个数的比值。
4.根据权利要求2或3所述的方法,其特征在于,根据所述***对象的多维特征及特征权重,确定所述***对象的重要性,包括:
根据所述特征权重对所述多维特征的归一化特征值进行加权后确定所述***对象的重要性。
5.根据权利要求4所述的方法,其特征在于,根据所述特征权重对所述多维特征的归一化特征值进行加权后确定所述***对象的重要性,包括:
通过下式计算所述***对象i的重要性值:
其中,N表示所述***对象i的特征维度数目,wj表示所述多维特征中的第j个特征的特征权重;f_scoreij表示***对象i的第j个特征的归一化特征值。
6.根据权利要求1-3、5任一项所述的方法,其特征在于,基于训练算法,确定所述***对象的多维特征对应的特征权重,包括:
获取训练样本;其中,所述训练样本包括多个所述***对象两两之间重要性的第一比对结果;
利用所述训练样本以及最小错误率训练算法对所述多维特征对应的所述特征权重进行训练,进而确定所述多维特征对应的特征权重。
7.根据权利要求6所述的方法,其特征在于,利用所述训练样本以及最小错误率训练算法对所述多维特征对应的所述特征权重进行训练,进而确定所述多维特征对应的特征权重,包括:
对于所述多维特征中的目标特征对应的目标特征权重,在所述多维特征中的其他特征对应的特征权重不变的情况下,确定多个所述***对象在所述目标特征权重任意取值下的候选重要性;
根据所述训练样本中的所述第一比对结果以及所述候选重要性确定所述目标特征权重。
8.一种***对象重要性的确定装置,其特征在于,包括:
第一确定模块,被配置为确定***对象的多维特征;
第二确定模块,被配置为基于训练算法,确定所述***对象的多维特征对应的特征权重;
第三确定模块,被配置为根据所述***对象的多维特征及特征权重,确定所述***对象的重要性。
9.一种电子设备,其特征在于,包括存储器和处理器;其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现权利要求1-7任一项所述的方法步骤。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-7任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811565644.XA CN109658193A (zh) | 2018-12-20 | 2018-12-20 | ***对象重要性的确定方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811565644.XA CN109658193A (zh) | 2018-12-20 | 2018-12-20 | ***对象重要性的确定方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109658193A true CN109658193A (zh) | 2019-04-19 |
Family
ID=66115402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811565644.XA Pending CN109658193A (zh) | 2018-12-20 | 2018-12-20 | ***对象重要性的确定方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109658193A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473317A (zh) * | 2013-09-12 | 2013-12-25 | 百度在线网络技术(北京)有限公司 | 提取关键词的方法和设备 |
CN108038735A (zh) * | 2017-12-26 | 2018-05-15 | 北京小度信息科技有限公司 | 数据生成方法及装置 |
US20180276291A1 (en) * | 2017-03-27 | 2018-09-27 | Alibaba Group Holding Limited | Method and device for constructing scoring model and evaluating user credit |
-
2018
- 2018-12-20 CN CN201811565644.XA patent/CN109658193A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473317A (zh) * | 2013-09-12 | 2013-12-25 | 百度在线网络技术(北京)有限公司 | 提取关键词的方法和设备 |
US20180276291A1 (en) * | 2017-03-27 | 2018-09-27 | Alibaba Group Holding Limited | Method and device for constructing scoring model and evaluating user credit |
CN108038735A (zh) * | 2017-12-26 | 2018-05-15 | 北京小度信息科技有限公司 | 数据生成方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190005518A1 (en) | Social network content item federation based on item utility value | |
Wangphanich et al. | Analysis of the bullwhip effect in multi-product, multi-stage supply chain systems–a simulation approach | |
US7805431B2 (en) | System and method for generating a display of tags | |
US11080608B2 (en) | Agent aptitude prediction | |
US10572912B2 (en) | System and method for integrating retail price optimization for revenue and profit with business rules | |
US9715702B2 (en) | System and method for determining retail-business-rule coefficients from current prices | |
US11182841B2 (en) | Prospect recommendation | |
CN112068962B (zh) | 一种基于深度学习的云渲染资源兑换方法 | |
US20200098031A1 (en) | Product recommending apparatus and non-transitory computer readable medium | |
CN106156965A (zh) | 一种物流服务调度方法与设备 | |
JP2018077615A (ja) | 広告画像生成装置、広告画像生成方法、広告画像生成装置用プログラム | |
CN112070545B (zh) | 用于优化信息触达的方法、装置、介质和电子设备 | |
CN111340522A (zh) | 资源推荐方法、装置、服务器及存储介质 | |
CN110738508A (zh) | 一种数据分析方法和装置 | |
CN109934523A (zh) | 信息处理方法和装置 | |
JP7206761B2 (ja) | 情報処理装置 | |
US9235655B2 (en) | Task-based design evaluation | |
Hemmati et al. | A new decision making structure for managing arriving orders in MTO environments | |
CN113763031A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
CN116797235A (zh) | 消费信息的处理方法、装置、存储介质及计算机设备 | |
CN109658193A (zh) | ***对象重要性的确定方法、装置、电子设备及存储介质 | |
Borissova et al. | Generalized approach to support business group decision-making by using of different strategies | |
CN101739621A (zh) | 一种基于Web服务的技术资产价值评估方法和*** | |
CN110163701A (zh) | 推送信息的方法和装置 | |
Osman et al. | Application of fuzzy logic for adaptive food recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190419 |