CN112632137A - 业务数据的推送方法、装置和服务器 - Google Patents
业务数据的推送方法、装置和服务器 Download PDFInfo
- Publication number
- CN112632137A CN112632137A CN202011501811.1A CN202011501811A CN112632137A CN 112632137 A CN112632137 A CN 112632137A CN 202011501811 A CN202011501811 A CN 202011501811A CN 112632137 A CN112632137 A CN 112632137A
- Authority
- CN
- China
- Prior art keywords
- data
- pushing
- push
- data object
- data objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 230000000694 effects Effects 0.000 claims abstract description 79
- 238000009826 distribution Methods 0.000 claims description 40
- 238000012163 sequencing technique Methods 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 14
- 238000012512 characterization method Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 18
- 238000004422 calculation algorithm Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011451 sequencing strategy Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书提供了业务数据的推送方法、装置和服务器。基于该方法,结合人工智能技术,在通过利用预设的推送结果预测模型预测出数据对象的推送成功率,并基于该推送成功率生成相应排序的第一推送名单之后,还进一步确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量,并通过利用上述数据对第一推送名单中的排序进行调整,以消除预设的推送结果预测模型由于没有考虑到不同数据对象类型组之间的公平性以及数据对象与推送规则之间的关联性而导致的误差,得到排序相对更加准确的第二推送名单;进而可以根据第二推送名单,向多个数据对象推送目标业务数据,从而可以得到较好的推送效果。
Description
技术领域
本说明书属于人工智能技术领域,尤其涉及业务数据的推送方法、装置和服务器。
背景技术
在向客户推送业务数据时,往往会先利用基于人工智能技术(例如,有监督的学习算法)训练得到的预测模型,预测出客户的推送成功率;再基于预测出的上述推送成功率对客户进行排序,生成客户的推送名单;进而可以根据该推送名单向客户推送相应业务数据。
但是,上述预测模型由于受限于训练机制以及所考虑的因素的局限性,模型本身在学习训练的过程中就会存在偏差。导致后续利用基于上述预测模型所预测出推送成功率进行排序所生成的推送名单也会存在误差,影响后续的推送效果。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书提供了一种业务数据的推送方法、装置和服务器,以生成排序相对更加准确、合理的第二推送名单,并基于该第二推送名单更加精准地向数据对象推送目标业务数据,得到较好的推送效果。
本说明书提供了一种业务数据的推送方法,包括:
获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果;
调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;
根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单;
根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;
根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单;
根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
在一个实施例中,数据对象的属性数据包括以下至少之一:数据对象的学历、数据对象的月收入、数据对象的职业。
在一个实施例中,所述历史推送结果包括以下所述结果中的一种或多种:已推送,且确定推送成功;已推送,且确定推送失败;未推送。
在一个实施例中,根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,包括:
根据数据对象的属性数据,确定出所述多个数据对象中的各个数据对象所属的数据对象类型组;
根据各个数据对象类型组中的数据对象的历史推送记录,分别计算各个数据对象类型组的公平性价值参数;其中,所述公平性价值参数用于表征预设的推送结果预测模型对数据对象类型组的偏袒程度;
根据各个数据对象类型组中的数据对象的历史推送记录,分别计算各个数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值;
根据所述各个数据对象类型组的公平性价值参数、各个数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值,确定出不同数据对象类型组之间的推送成效的差异程度。
在一个实施例中,根据数据对象的属性数据,确定出所述多个数据对象中的各个数据对象所属的数据对象类型组,包括:
根据所述多个数据对象的属性数据,通过对所述多个数据对象进行聚类处理,以确定出所述多个数据对象中的各个数据对象所属的数据对象类型组。
在一个实施例中,根据所述各个数据对象类型组的公平性价值参数、各个数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值,确定出不同数据对象类型组之间的推送成效的差异程度,包括:
按照以下算式计算编号为i的数据对象类型组与编号为j的数据对象类型组之间的推送成效的差异程度:
其中,为编号为i的数据对象类型组与编号为j的数据对象类型组之间的推送成效的差异程度,Infoτ(Gi)为编号为i的数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值,Infoτ(Gj)为编号为j的数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值,Value(Gi)为编号为i的数据对象类型组的公平性价值参数,Value(Gj)为编号为j的数据对象类型组的公平性价值参数。
在一个实施例中,根据多个数据对象的属性数据,以及历史推送记录,确定出推送规则与数据对象的关联性的无偏估计量,包括:
根据数据对象的属性数据,以及历史推送规则,构建相应的无偏估计量求解损失函数;
根据历史推送结果,确定数据对象相对于历史推送规则的显性相关性参数;
根据数据对象的推送成功率和显性相关性参数,计算数据对象排序的全局无偏估计量;
根据所述数据对象的全局无偏估计量,和所述无偏估计量求解损失函数,计算出对应的推送规则与数据对象的关联性的无偏估计量。
在一个实施例中,根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单,包括:
按照以下算式确定出各个数据对象在第二推送名单中排序位置:
其中,στ为数据对象在第二推送名单中的排序位置,d为数据对象,D为多个数据对象所构成的数据对象集,τ为时间,v为历史推送规则,V为多个历史推送规则所构成的历史推送规则集,λ为调整参数,为推送规则与数据对象的关联性的无偏估计量。
在一个实施例中,在得到第二推送名单之后,所述方法还包括:
根据多个数据对象的属性数据,以及历史推送记录,确定数据对象的多样性分布概率;
根据所述数据对象的多样性分布概率,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单;
相应的,
根据所述第三推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
在一个实施例中,根据所述数据对象的多样性分布概率,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单,包括:
根据所述数据对象的属性数据和所述数据对象的多样性分布概率,训练基于LSTM模型的处理模型,并通过所述处理模型中的隐藏层提取抽象的特征表征向量;
根据所述数据对象的多样性分布概率和所述抽象的特征表征向量,计算平均多样性指标;
根据所述平均多样性指标,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单。
在一个实施例中,所述数据对象包括客户对象,所述目标推送规则包括当前所采用的营销方案,所述目标业务数据包括当前待推广的业务产品或业务服务。
本说明书还提供了一种业务数据的推送装置,包括:
获取模块,用于获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果;
第一确定模块,用于调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;
第一排序模块,用于根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单;
第二确定模块,用于根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;
第二排序模块,用于根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单;
推送模块,用于根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
在一个实施例中,所述装置还包括第三确定模块和第三排序模块,其中,
所述第三确定模块,用于根据多个数据对象的属性数据,以及历史推送记录,确定数据对象的多样性分布概率;
所述第三排序模块,用于根据所述数据对象的多样性分布概率,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单;
相应的,
所述推送模块,用于根据所述第三推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
本说明书提供了一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果;调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单;根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单;根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
本说明书还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果;调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单;根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单;根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
本说明书提供的一种业务数据的推送方法、装置和服务器,在向多个数据对象推送目标业务数据前,可以先获取数据对象的属性数据,以及历史推送记录;并调用预设的推送结果预测模型根据数据对象的属性预测出数据对象的推送成功率,并基于推送成功率对数据对象的身份标识进行排序,得到相应的第一推送名单;进一步,还可以通过根据数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量,并利用上述数据对第一推送名单中的排序进行相应调整,以消除预设的推送结果预测模型由于没有考虑到不同数据对象类型组之间预测时的公平性以及数据对象与推送规则之间的关联性而导致的误差,得到排序相对更加准确、合理的第二推送名单;进而可以根据上述第二推送名单,更加精准、更有针对性地向多个数据对象推送目标业务数据,从而可以得到较好的推送效果,提高推送成效,解决现有方法中存在的所生成的推送名单中数据对象的排序不准确、不合理,以及基于该推送名单向数据对象推送业务数据时推送效果差的技术问题。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是应用本说明书实施例提供的业务数据的推送方法的***的结构组成的一个实施例的示意图;
图2是本说明书的一个实施例提供的业务数据的推送方法的流程示意图;
图3是本说明书的一个实施例提供的服务器的结构组成示意图;
图4是本说明书的一个实施例提供的业务数据的推送装置的结构组成示意图;
图5是在一个场景示例中,应用本说明书实施例提供的业务数据的推送方法的一种实施例的示意图;
图6是在一个场景示例中,应用本说明书实施例提供的业务数据的推送方法的一种实施例的示意图;
图7是在一个场景示例中,应用本说明书实施例提供的业务数据的推送方法的一种实施例的示意图;
图8是在一个场景示例中,应用本说明书实施例提供的业务数据的推送方法的一种实施例的示意图;
图9是在一个场景示例中,应用本说明书实施例提供的业务数据的推送方法的一种实施例的示意图;
图10是在一个场景示例中,应用本说明书实施例提供的业务数据的推送方法的一种实施例的示意图;
图11是在一个场景示例中,应用本说明书实施例提供的业务数据的推送方法的一种实施例的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
考虑到现有方法在向数据对象(例如,客户等)推送目标业务数据时,往往是先利用训练好的预测模型预测出各个数据对象的推送成功率;再根据各个数据对象的推送成功率对数据对象进行排序,得到相应的推送名单;最后根据上述推送名单向数据对象进行目标业务数据的推送。
但是,通过创造性的分析后发现:所使用的上述预测模型受限于训练机制,以及所考虑的因素的局限性,本身在学习训练的过程中就存在偏差。
具体的,首先,上述预测模型通常是利用正样本数据(例如,曾经推送成功的客户数据)和负样本数据(例如,曾经推送失败的客户数据)进行模型训练的,使得和正样本数据相似的属于同一个类型组的数据对象会持续地得到的更高的预测概率;而和负样本数据相似的数据对象得到的预测概率则会持续偏低。这样导致所训练的预测模型没有考虑到预测结果的公平性,在生成预测结果时会更倾向于偏袒与正样本数据相似的数据对象,导致预测结果会存在偏见和误差,出现例如“富人越富,穷人越穷”的现象。
其次,上述预测模型在训练学习的过程中也没有考虑到在推送目标业务数据时基于具体的推送规则进行推送。例如,在向客户营销某件业务产品时,是基于某个特定营销方案来对该客户进行营销的。因此,上述预测模型往往忽略了数据对象与推送规则在交互急案的关联性、契合度等因素,导致所生成的预测结果会存在偏差。
基于上述两点原因,如果直接基于预测模型的预测结果对数据对象进行排序势必是不合理,存在误差的。
正是发现并注意到了上述问题,通过创造性的劳动,本说明书考虑在通过利用预设的推送结果预测模型预测出数据对象的推送成功率,并基于该推送成功率生成第一推送名单之后,可以进一步确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量,并利用上述数据对第一推送名单进行调整,以消除预设的推送结果预测模型由于没有考虑到不同数据对象类型组之间的公平性以及数据对象与推送规则之间的关联性而导致的误差,得到排序相对更加准确、更合理的第二推送名单;进而可以根据该第二推送名单,更加精准地向多个数据对象推送目标业务数据,从而可以得到较好的推送效果,提高推送成效。
本说明书实施例提供了一种业务数据的推送方法,该方法具体可以应用于包含有第一服务器、第二服务器和终端设备的***中。
具体的,可以参阅图1所示,第一服务器、第二服务器和终端设备可以通过有线或无线的方式相连,以进行数据交互。其中,上述终端设备负责数据对象的相关数据的采集。第一服务器负责对数据对象排序并生成相应的推送名单。第二服务器负责向数据对象推送目标业务数据。
具体实施时,终端设备可以采集多个数据对象的属性数据,以及历史推送记录。其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果。并将上述多个数据对象的属性数据,以及历史推送记录发送至第一服务器。
相应的,第一服务器接收终端设备发送的多个数据对象的属性数据,以及历史推送记录发送至第一服务器。
第一服务器先调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;并根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单。
进一步,第一服务器可以根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;并根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单。再将上述第二推送名单发送至第二服务器。
相应的,第二服务器接收并根据该第二推送名单,按照相应的目标推送规则,向多个数据对象推送目标业务数据。
在本实施例中,所述第一服务器、第二服务器具体可以包括一种应用于业务数据处理平台一侧,能够实现数据传输、数据处理等功能的后台服务器。具体的,所述第一服务器、第二服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述第一服务器、第二服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述第一服务器、第二服务器所包含的服务器的数量。所述第一服务器、第二服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
在本实施例中,所述终端设备具体可以包括一种应用于用户一侧,能够实现数据采集、数据传输等功能的前端设备。具体的,所述终端设备例如可以为台式电脑、平板电脑、***的数据接口等。
参阅图2所示,本说明书实施例提供了一种业务数据的推送方法。其中,该方法具体应用于服务器一侧。具体实施时,该方法可以包括以下内容。
S21:获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果。
S22:调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率。
S23:根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单。
S24:根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量。
S25:根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单。
S26:根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
通过上述实施例,可以确定并利用不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量来消除预设的推送结果预测模型由于没有考虑到不同数据对象类型组之间的公平性以及数据对象与推送规则之间的关联性而导致的误差,得到排序相对更加准确、更合理的第二推送名单,进而可以根据该第二推送名单,更加精准地向多个数据对象推送目标业务数据,获得较好的推送效果,提高推送成效。
在本实施例中,上述数据对象具体可以包括用户对象。具体实施时,根据具体的应用场景,上述用户对象可以是不同类型的用户对象。
具体的,例如,在银行的理财产品推广场景中,上述用户对象可以是银行的客户对象。又例如,在电商的商品推送场景中,上述用户对象可以是购物网站的购物者等。当然,上述所列举的数据对象只是一种示意性说明。具体实施时,结合具体的应用场景,上述数据对象还可以包括其他类型的用户对象。对此,本说明书不作限定。
在本实施例中,上述数据对象的属性数据具体可以理解为能够反映数据对象的某些属性特征的参数数据。
在一个实施例中,数据对象的属性数据具体可以包括以下至少之一:数据对象的学历、数据对象的月收入、数据对象的职业等。当然,上述所列举的属性数据只是一种示意性说明。结合具体的应用场景和处理需求,还可以引入其他类型的属性数据。
通过上述实施例,服务器可以获取并利用更多类型更多样化的属性数据,以便能够更加准确、全面地对多个数据对象进行排序。
在本实施例中,上述历史推送记录具体可以记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果等信息。
在一个实施例中,所述历史推送结果包括以下所述结果中的一种或多种:已推送,且确定推送成功;已推送,且确定推送失败;未推送等。当然,上述所列举的历史推送结果只是一种示意性说明。具体实施时,根据具体的应用场景和具体的处理情况,还可以作进一步的细化,得到更加精细的推送结果。
在本实施例中,通过上述方式可以避免像现有方式那样只是简单地考虑与正样本数据对应的推送成功、与负样本数据对应的推送失败这两种历史推送结果,导致忽略了根据历史推送规则向数据对象推送历史业务数据过程中的细节信息,可以记录并获得更加丰富、精细的历史推送结果,以便后续可以根据上述历史推送结果进一步分析数据对象与推送规则、推送的业务数据之间的关联性,以弥补预设的推送结果预测模型的不足。
在本实施例中,需要说明的是,通常在推送业务数据时,为了提高推送的成功率,使得数据对象更愿意接受并参加业务数据所涉及的业务活动,往往基于某些具体的推送规则来向数据对象进行业务数据的推送的。
具体的,例如,在向银行客户推送银行所推出的理财产品或理财服务(可以理解为一种业务数据)时,可以基于某个具体的营销方案或营销策略(可以理解为一种推送规则)向银行客户进行具体推送营销,以促使银行客户愿意购买该理财产品或理财服务,提高成单率。
在本实施例中,进一步,上述历史推送记录还可以记录有数据对象的历史推送时间、被推送的历史业务数据的发起方、历史推送规则等其他该数据对象的历史推送经历相关的信息,以便后续可以利用上述历史推送记录更加全面、准确地分析数据对象在基于目标推送规则被推送相应的目标业务数据的接受程度,以及推送成效。
在一个实施例中,上述预设的推送结果预测模型具体可以理解为一种利用正样本数据和负样本数据训练得到的,能够根据数据对象的属性数据,预测出向该数据对象推送业务数据的推送成功率的模型。
在一个实施例中,具体实施时,可以先利用预设的推送结果预测模型对各个数据对象的属性数据进行处理,以预测出各个数据对象的推送成功率。再根据各个数据对象的推送成功率,将数据对象的身份标识(例如,数据对象的姓名、账户名、对象编号等)按照推送成功率由大到小的顺序进行排序,得到对应的第一推送名单。
在一个实施例中,上述预设的推送结果预测模型具体可以按照以下方式训练得到:获取多个样本数据;其中,每一个样本数据至少包含有所对应的样本数据对象的属性数据,以及推送结果;根据所述样本数据的推送结果,将推送结果为推送成功的样本数据标注为正样本数据,将推送结果为失败的样本数据标注为负样本数据,得到标注后的样本数据;利用标注后的样本数据进行模型训练,得到预设的推送结果预测模型。
在本实施例中,需要说明的是,通过上述方式训练得到预设的推送结果预测模型由于没有考虑到预测结果的公平性,导致利用该模型进行预测时会更倾向于偏袒与正样本数据相似的属于同一数据对象类型组的数据对象,造成预测偏差,影响模型精度。
在一个实施例中,在得到第一推送名单后,还考虑到了不同数据对象类型组之间的公平性以及数据对象与推送规则之间的关联性而导致的误差,进一步确定出并根据不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量,来对上述第一推送名单中数据对象的身份标识的排序进行针对性调整,以得到排序更加合理、准确的第二推送名单。
在本实施例中,每一个数据对象类型组中所包含的多个数据对象至少在一个属性数据上具有共性特征。
在本实施例中,上述不同数据对象类型组之间的推送成效的差异程度具体可以理解为一种能够量化地反映出预设的推送结果预测模型在预测时对不同数据对象类型组的不公平性程度的参数数据。
在本实施例中,可以通过确定并利用上述不同数据对象类型组之间的推送成效的差异程度,来弥补单独使用没有考虑到预测结果的公平性的预设的推送结果预测模型所引入的偏差,得到排序更为合理、准确的推送名单。
在一个实施例中,上述根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,具体实施时,可以包括以下内容。
S1:根据数据对象的属性数据,确定出所述多个数据对象中的各个数据对象所属的数据对象类型组;
S2:根据各个数据对象类型组中的数据对象的历史推送记录,分别计算各个数据对象类型组的公平性价值参数;其中,所述公平性价值参数用于表征预设的推送结果预测模型对数据对象类型组的偏袒程度;
S3:根据各个数据对象类型组中的数据对象的历史推送记录,分别计算各个数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值;
S4:根据所述各个数据对象类型组的公平性价值参数、各个数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值,确定出不同数据对象类型组之间的推送成效的差异程度。
通过上述实施例,可以较为准确采用量化的方式确定出不同数据对象类型组之间的推送成效的差异程度。
在一个实施例中,上述根据数据对象的属性数据,确定出所述多个数据对象中的各个数据对象所属的数据对象类型组,具体实施时,可以包括以下内容:根据所述多个数据对象的属性数据,通过对所述多个数据对象进行聚类处理,以确定出所述多个数据对象中的各个数据对象所属的数据对象类型组。
通过上述实施例,可以高效地将多个数据对象划分到对应的数据对象类型组中。
当然,上述所列举的确定数据对象所属的数据对象类型组的方式只是一种示意性说明。具体实施时,还可以根据具体的应用场景,设置不同数据对象类型组的划分规则;进而可以根据划分规则,以及数据对象的属性数据,确定出各个数据对象所属的数据对象类型组。
在一个实施例中,上述根据所述各个数据对象类型组的公平性价值参数、各个数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值,确定出不同数据对象类型组之间的推送成效的差异程度,具体实施时,可以包括以下内容:
按照以下算式计算编号为i的数据对象类型组与编号为j的数据对象类型组之间的推送成效的差异程度:
其中,具体可以表示为编号为i的数据对象类型组与编号为j的数据对象类型组之间的推送成效的差异程度,Infoτ(Gi)具体可以表示为编号为i的数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值,Infoτ(Gj)具体可以表示为编号为j的数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值,Value(Gi)具体可以表示为编号为i的数据对象类型组的公平性价值参数,Value(Gj)具体可以表示为编号为j的数据对象类型组的公平性价值参数。
在本实施例中,上述推送规则与数据对象的关联性的无偏估计量具体可以理解为一种能够量化地反映出预设的推送结果预测模型在预测时没有考虑到的数据对象与推送规则之间的契合度对推送成效的影响的参数数据。
在本实施例中,可以通过确定并利用上述推送规则与数据对象的关联性的无偏估计量,来弥补单独使用没有考虑到数据对象与推送规则的关联性的预设的推送结果预测模型所引入的偏差,得到排序进一步更为合理、准确的推送名单。
在一个实施例中,上述根据多个数据对象的属性数据,以及历史推送记录,确定出推送规则与数据对象的关联性的无偏估计量,具体实施时,可以包括以下内容。
S1:根据数据对象的属性数据,以及历史推送规则,构建相应的无偏估计量求解损失函数;
S2:根据历史推送结果,确定数据对象相对于历史推送规则的显性相关性参数;
S3:根据数据对象的推送成功率和显性相关性参数,计算数据对象排序的全局无偏估计量;
S4:根据所述数据对象的全局无偏估计量,和所述无偏估计量求解损失函数,计算出对应的推送规则与数据对象的关联性的无偏估计量。
通过上述实施例,可以较为准确采用量化的方式确定出推送规则与数据对象的关联性的无偏估计量。
在一个实施例中,可以根据所述推送成效的差异程度,以及所述关联性的无偏估计量,基于第一推送名单中数据对象的身份标识的排序位置,进行针对性的调整;再基于调整后的数据对象的身份标识的排序,得到相应的排序更加合理、准确的第二推送名单。
在一个实施例中,上述根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单,具体实施时,可以包括以下内容:
按照以下算式确定出各个数据对象中的任意一个数据对象d在第二推送名单中排序位置:
其中,στ具体可以表示为数据对象在第二推送名单中的排序位置,d具体可以表示为数据对象,D具体可以表示为多个数据对象所构成的数据对象集,τ具体可以表示为时间,v具体可以表示为历史推送规则,V具体可以表示为多个历史推送规则所构成的历史推送规则集,λ具体可以表示为调整参数,具体可以表示为推送规则与数据对象的关联性的无偏估计量。
通过上述实施例,可以同时利用所述推送成效的差异程度,以及所述关联性的无偏估计量,对第一推送名单中数据对象的身份标识的排序位置进行针对性的调整,得到对应的第二推送名单。这样得到第二推送名单中数据对象的身份标识的排序相对于第一推送名单更加的合理、准确,具有更高的参考价值。
在本实施例中,上述第二推送名单中身份标识排序靠前的数据对象在被推送目标业务数据时会具有相对更高的推送成功率。例如,第二推送名单中身份标识排序靠前的客户相对更容易被营销成功,购买所推广的理财产品。
在一个实施例中,可以根据第二推送名单,将多个数据对象划分成多个不同的推送层级;再对不同推送层级的数据对象进行区分,按照目标推送规则,分别进行目标业务数据的推送。
具体的,例如,可以将第二推送名单中身份标识靠前(例如,位于前30%)的一批数据对象划分为第一推送层级,将第二推送名单中剩下的数据对象划分为第二推送层级。
由于第一推送层级的数据对象推送成功率相对较高,可以根据目标推送规则,对第一推送层级中的数据对象进行基于推送方式1(例如,短信推送)和推送方式2(例如,邮件推送)两种推送方式的组合方式,推送一次目标业务数据。
由于第二推送层级的数据对象的推送成功率相对较低,对第二推送层级中的数据对象进行基于推送方式1、推送方式2,和推送方式3(例如,电话推送)三种推送方式的组合方式,连续推送三次目标业务数据,从而可以得到较好的推送效果。
在本实施例中,在向多个数据对象推送目标业务数据前,可以先通过获取数据对象的属性数据,以及历史推送记录;再调用预设的推送结果预测模型根据数据对象的属性预测数据对象的推送成功率,并基于推送成功率对数据对象的身份标识进行排序,得到第一推送名单;进一步,还可以通过根据数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量,并利用上述数据对第一推送名单进行相应调整,以消除预设的推送结果预测模型由于没有考虑到不同数据对象类型组之间的公平性以及数据对象与推送规则之间的关联性而导致的误差,得到排序相对更加准确、更合理的第二推送名单;进而可以根据该第二推送名单,更加精准地向多个数据对象推送目标业务数据,从而可以得到较好的推送效果,提高推送成效,解决现有方法中存在的所生成的推送名单中数据对象的排序不准确、不合理,导致基于该推送名单向数据对象推送业务数据时推送效果差的技术问题。
在一个实施例中,进一步,又考虑到预设的推送结果处理模型在学习、训练时,由于也没有考虑到数据对象个体之间的多样性对预测结果所产生的影响,导致模型在预测时也会出现偏差。为了能够在第二推送名单的基础,得到排序相对更加精准、合理的推送名单,可以进一步确定出并利用数据对象的多样性分布概率,来对第二推送名单中的排序再次进行调整,以得到排序相对更加准确、合理的第三推送名单。
在一个实施例中,在得到第二推送名单之后,所述方法具体实施时,还可以包括以下内容:根据多个数据对象的属性数据,以及历史推送记录,确定数据对象的多样性分布概率;根据所述数据对象的多样性分布概率,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单;相应的,根据所述第三推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
通过上述实施例可以得到排序相对更加精准、合理的第三推送名单,进而可以使用第三推送名单代替第二推送名单,来对数据对象进行目标业务数据的推送。从而可以进一步提高目标业务数据的推送效果。
在一个实施例中,上述根据所述数据对象的多样性分布概率,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单,具体实施时,可以包括以下内容。
S1:根据所述数据对象的属性数据和所述数据对象的多样性分布概率,训练基于LSTM模型的处理模型,并通过所述处理模型中的隐藏层提取抽象的特征表征向量;
S2:根据所述数据对象的多样性分布概率和所述抽象的特征表征向量,计算平均多样性指标;
S3:根据所述平均多样性指标,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单。
在本实施例中,具体实施时,可以通过所述处理模型中的最后一层隐藏层提取出效果相对较好的抽象的特征表征向量,以备后续使用。
在本实施例中,上述平均多样性指标具体可以理解为一种能够量化地反映出预设的推送结果预测模型在预测时没有考虑到的数据对象的多样性因素影响推送成效的参数数据。
通过上述实施例,可以以量化的方式较为准确地确定出平均多样性指标,进而可以利用上述多样性指标通过对第二推送名单中的排序进行基于数据对象的多样性因素的调整,得到排序相对更加准确、合理,推送效果更好的第三推送名单。
在一个实施例中,上述方法可以应用于多种不同应用场景中,以有效地进行多种不同应用场景中相关业务数据的推送,得到较好的推送效果。
在一个实施例中,上述方法具体可以应用于产品的营销场景。在产品营销场景中,所述数据对象具体可以包括客户对象,例如,某银行的理财客户等。所述目标业务数据包括当前待推广的业务产品或业务服务,例如,某银行新推出的理财服务等。所述目标推送规则具体可以包括当前所采用的营销方案,例如,某银行当前针对该理财服务所设计的营销策略等。
进而,可以利用本说明书所提供的方法确定出上述营销场景中客户对象的第三推送名单,再根据第三推送名单对客户对象进行区分,利用相应的营销方案来推广业务产品,从而可以得到较好的营销效果,提高成单率。
当然,上述所列举的营销场景只是一种示意性说明。具体实施时,该方法还可以应用于其他类型的应用场景。相应的,上述数据对象、推送规则、目标业务数据还可以包括其他类型的应用场景中的相关数据。对此,本说明书不作限定。
在一个实施例中,具体实施时,还可以将上述第三推送名单与第一推动名单中的排序进行比较,得到比较结果;根据比较结果,反过来对预设的推送结果预测模型进行针对性的调整,对预设的推送结果预测模型进行更新。从而可以缩小预设的推送结果预测模型的误差,提高模型精度,后续利用更新后的预设的推送结果预测模型可以得到相对更加准确合理的推送成功率。
由上可见,本说明书实施例提供的业务数据的推送方法,在向多个数据对象推送目标业务数据前,可以先通过获取数据对象的属性数据,以及历史推送记录;再调用预设的推送结果预测模型根据数据对象的属性预测数据对象的推送成功率,并基于推送成功率对数据对象的身份标识进行排序,得到第一推送名单;进一步,还可以通过根据数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量,并利用上述数据对第一推送名单进行相应调整,以消除预设的推送结果预测模型由于没有考虑到不同数据对象类型组之间的公平性以及数据对象与推送规则之间的关联性而导致的误差,得到排序相对更加准确、更合理的第二推送名单;进而可以根据该第二推送名单,更加精准地向多个数据对象推送目标业务数据,从而可以得到较好的推送效果,提高推送成效,解决现有方法中存在的所生成的推送名单中数据对象的排序不准确、不合理,导致基于该推送名单向数据对象推送业务数据时推送效果差的技术问题。还通过在确定出第二推送名单之后,引入对数据对象的多样性因素的考量,根据数据对象的多样性分布概率,确定出平均多样性指标;再利用上述平均多样性指标,对第二推送名单中数据对象的排序进行再次调整,得到排序相对更准确、合理,推送效果更好的第三推送名单;进而可以利用上述第三推送名单,来向数据对象推送目标业务数据,从而可以进一步提高推送效果。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果;调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单;根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单;根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
为了能够更加准确地完成上述指令,参阅图3所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口31、处理器32以及存储器33,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口31,具体可以用于获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果。
所述处理器32,具体可以用于调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单;根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单;根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
所述存储器33,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口31可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行FTP数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器32可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器33可以包括多个层次,在数字***中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在***中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供了一种基于上述业务数据的推送方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果;调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单;根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单;根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图4所示,在软件层面上,本说明书实施例还提供了一种业务数据的推送装置,该装置具体可以包括以下的结构模块。
获取模块41,具体可以用于获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果;
第一确定模块42,具体可以用于调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;
第一排序模块43,具体可以用于根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单;
第二确定模块44,具体可以用于根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;
第二排序模块45,具体可以用于根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单;
推送模块46,具体可以用于根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
在一个实施例中,所述装置具体还可以包括第三确定模块和第三排序模块,其中,
所述第三确定模块,具体可以用于根据多个数据对象的属性数据,以及历史推送记录,确定数据对象的多样性分布概率;
所述第三排序模块,具体可以用于根据所述数据对象的多样性分布概率,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单;
相应的,
所述推送模块,具体可以用于根据所述第三推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,本说明书实施例提供的业务数据的推送装置,在通过利用预设的推送结果预测模型预测出数据对象的推送成功率,并基于该推送成功率生成第一推送名单之后,还通过确定不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量,并利用上述数据对第一推送名单进行调整,以消除预设的推送结果预测模型由于没有考虑到不同数据对象类型组之间的公平性以及数据对象与推送规则之间的关联性而导致的误差,得到排序相对更加准确的第二推送名单;进而可以根据第二推送名单,向多个数据对象推送目标业务数据,从而可以得到较好的推送效果。
在一个具体的场景示例中,可以应用本说明书提供的业务数据的推送方法来生成相应的客户营销名单,并基于该名单对客户进行营销,得到较好的营销效果。具体实施可以参阅以下内容。
针对营销场景,具体实施时,可以基于本说明书提供的业务数据的推送方法构建相应的***负责具体的业务营销。
基于功能处理层面,该***具体可以包括:客户营销概率预测模块、公平无偏动态调整模块、多样性重排序模块、客户营销标注模块4个主要功能模块。
基于***结构层面,可以参阅图5所示,该***可以包括机器学***无偏动态调整装置和重排序装置。其中,客户营销概率预测模块在机器学***无偏动态调整模块在公平无偏动态调整装置中实现,多样性重排序模块在重排序装置中实现。客户营销***可以包括业务营销装置。其中,客户营销标注模块在业务营销装置中实现。
具体的,可以参阅图6所示。主要的功能模块中的客户营销概率预测模块1:使用有监督的机器学***无偏动态调整模块2:动态调整公平性度量,实现预测排序的公平无偏动态调整(例如,确定并根据不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量,对第一推送名单中的排序进行调整,得到第二推送名单)。多样性重排序模块3:调整预测排序的多样性,实现预测重排序(例如,利用基于数据对象的多样性分布概率所确定的平均多样性指标,对第二推送名单中数据对象的身份标识的排序进行调整,得到第三推送名单)。客户营销标注模块4:标注客户营销结果,反馈机器学习模块。
具体实施时,参阅图7所示,客户营销概率预测模块1具体运行时可以包括以下内容。
步骤S101:设计特征变量(例如,数据对象的属性数据)。根据建模目的,设计模型特征变量。可以根据常见的客户特点,设计营销模型特征变量。
步骤S102:标注客户标识。采集客户标注,主要分为营销成功客户和未营销成功客户。采集建模数据集以客户为维度,一条客户记录作为一条样本数据。营销成功客户和未营销成功客户记录数构成建模的总样本数据集。
记客户群为D,对每个客户d,有d∈D。客户特征集为X,对每个客户的特征变量xd,有xd∈X。
进一步,还考虑了时间因素,建立时序数据,对每个时间点,分别有:t=1,...,τ。
记营销方案(例如,推送规则)集为V,对每个方案v,有v∈V。营销方案特征变量集Z。对每个营销方案的特征变量zv,有zv∈Z。
对于每个营销方案v,可以收集到以下标注信息:
其中,yt(d|v)是营销策略和客户的契合程度的显性关联性,其背后的隐性关联性是relt(d|v)∈[0,1]。理想状态下,yt(d|v)=E[relt(d|v)]。
步骤S103:生成模型预测时序结果。取时序数据,对每个时间t=1,...,τ,生成对应每个客户在不同营销方案下的营销概率pt(d|v)。
参阅图8所示,公平无偏动态调整模块2具体运行时可以包括以下内容。
步骤S201:公平性差异度计量。按客户群体分类(例如,确定数据对象所属的数据对象的类型组),G={G1,...,Gm}。
客户群体的分类方法可以根据专家规则按照客户特征属性划分类别,也可以根据聚类模型等机器学***无偏动态调整的方法,可以提升类似客户群的排序。
其中,Rt(d|v)是客户在不同时刻不同营销方案中的全局排序值。先计算每个客户在不同时刻不同营销方案下的平均全局排序值。再计算同一类客户群体的平均公平性价值。公平性价值越高,说明该群体营销清单上的排名平均比较靠前。
计算营销差异程度,差异越大表示不同群体间被营销概率和成效差异越大,调整后的营销概率目的是为了缩小差异距离。
计算营销概率的信息值。计算每个客户在不同时刻平均营销概率,再计算该客户群体的平均营销概率:
对全部营销方案,有:
计算营销成效的信息值。计算每个客户在不同时刻平均营销成效,再计算该客户群体的平均营销成效:
对全部营销方案,有:
利用熵的概念计算营销信息平均值,有:
计算不同客户群体间的营销差异程度(例如,不同数据对象类型组之间的推送成效的差异程度):
Ωτ表示两个群体间的差异程度。值越大差异度越大。
步骤S202:无偏性计量。计算营销策略和客户的契合程度的关联性relt(d|v)无偏估计量和客户营销排序的全局排序R(d|v)无偏估计量。
其无偏估计量求解损失函数为:
步骤S203:公平动态调整。计算全局排序策略。具体可以按照以下算式计算每个客户的营销排序(例如,排序位置):
其中,超参数λ用于调整排序策略,调节营销差异度对排序的影响程度。本发明取营销差异程度差异度的加总。根据不同的使用需要,Ωτ可以调整为营销差异程度的最大值、最小值、中位数。λ越高表示对原始排序的调整越大。
需要补充的是,上述营销方案V的数量,可以动态调整。如果对某个营销方案设计客户排序,则对上述公式中,令V=1。
参阅图9所示,多样性重排序模块3具体运行时可以包括以下内容。
步骤301:多样性理想分布计算。计算理想状态的客户多样性分布形态。
记营销方案集为V,对每个方案v,有v∈V。设计营销方案理想状态下多样性的特征变量集Zideal。对每个营销方案的特征变量有比如,特征变量集为[教育程度分布、资产分布]。教育程度分布[高中,本科,本科以上],资产分布[10万,10万-100万,100万-500万,500万以上]。对于每个营销方案设计其理想状态的多样性分布。比如营销方案v1目标不同教育程度分布的客户多样性,则设计的one-hot特征向量为[1,1,1],不考虑资产分布。如果营销方案v2目标同时考虑多教育程度且资产在100万以内的客户多样性,设计的one-hot特征向量为[1,1,1,1,1,0,0]。
记理想分布集为F,对每个v存在理想分布fv,有fv∈F。计算客户群D和营销方案v特征间的Hellinger距离:
步骤302:Context Embedding Vector参数计算。
目标输出是前述步骤S301的理想概率分布。
其中Context Embedding Vector具体可以通过取hiddenn层的输出得到。
步骤303:多样性计量。计算平均多样性指标。
可以采用Hellinger距离计算相似度:
需要说明的是,该公式表示考虑加权排序值时加入了多样性的考虑。其中,k表示第k维Context Embedding Vector特征向量。
在计算多样性时,取步骤S203中排序σt接入前述步骤的LSTM模型。
取每个客户的hiddenn作为Context Embedding Vector。其中,γ是超参数,越高表示多样性越丰富。
步骤304:客户重排序。通过调整超参数λ和γ,来调整期望达到的公平无偏性和多样性的程度。
按照以下算式,评价排序的效用价值函数:
其中,στ(d)表示客户d在στ的排序值。Utility表示整体的排序效用值。要求在满足一定多样性条件下,使得效用达到期望的目标。ExpectedUtility,floor,cap为设定值。
在求得满足效用的排序值后,按照满足期望结果的客户按σ重排序。得到最终的客户营销清单(例如,第三推送名单)。
参阅图10所示,客户营销标注模块4具体运行时可以包括以下内容。
步骤S401:客户营销。在客户营销***中,根据客户清单开展营销。
步骤S402:扩充营销标注数据。基于动态调整后的客户营销清单,记录客户是否被营销,购买相应产品。扩充原有营销模型中未捕捉到的标注信息,也可以用于更新客户营销模型。
将上述过程与现有方法进行比较,可以参阅图11所示。其中,上部分(对应实施前)是基于现有方法的***架构状态和数据流。下部分(对应实施后)是基于本方法的***架构状态和数据流。
通过比较发现,基于现有方法,客户营销模型采用有监督算法模型根据客户的特征变量预测客户被营销成功的概率,根据概率高低获取客户营销清单。这种算法基本原理是采集客户是否被成功营销的样本数据,根据客户特征变量和正负样本训练预测和调整模型。算法上,和正样本(曾经成功营销的客户)相似的客户得到的预测概率更高;和负样本(尚未成功营销的客户)相似的客户得到的预测概率偏低。该算法存在的问题:一是算法未考虑预测结果公平性。结果偏袒正样本客户,高概率的客户继续得到高的概率,低概率的客户继续得到低概率,存在“富人越富,穷人越穷”的状态。二是算法未考虑预测结果无偏性。算法未计算营销策略和客户的偏好的相关性,预测结果存在有偏。三是算法未考虑客户类型的多样性。算法中未显式考虑营销策略中客户的分布和类型,容易造成客户类型的单一化。
相对于现有方法,本方法在原营销预测模型结果上,增加公平性无偏调整算法策略,提升预测结果的公平无偏性,增加多样化重排序策略,实现结果的多样性。算法实施装置可以根据数据变化自适应动态调整客户在营销清单上的排序,将调整排序后的清单对接营销业务***。做到对原业务***透明化,不影响业务***的业务操作流程。
通过上述场景示例,验证了基于本说明书提供的方法,在客户营销预测算法中,加入了公平无偏和多样性的动态调整机制。一是算法增加预测结果公平性和无偏性。缩小“富人越富,穷人越穷”的状态。二是算法增加了多样性的评价计量。将客户多样性纳入至算法。三是本算法调整机制可以无缝对接原有业务流程,实现全流程的动态闭环。并且每个功能模块采用低耦合高内聚的设计思想。在应用上,可以在原有***架构上增加节点和数据流程,高效地实现相应的数据处理。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (15)
1.一种业务数据的推送方法,其特征在于,包括:
获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果;
调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;
根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单;
根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;
根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单;
根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
2.根据权利要求1所述的方法,其特征在于,数据对象的属性数据包括以下至少之一:数据对象的学历、数据对象的月收入、数据对象的职业。
3.根据权利要求1所述的方法,其特征在于,所述历史推送结果包括以下所述结果中的一种或多种:已推送,且确定推送成功;已推送,且确定推送失败;未推送。
4.根据权利要求1所述的方法,其特征在于,根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,包括:
根据数据对象的属性数据,确定出所述多个数据对象中的各个数据对象所属的数据对象类型组;
根据各个数据对象类型组中的数据对象的历史推送记录,分别计算各个数据对象类型组的公平性价值参数;其中,所述公平性价值参数用于表征预设的推送结果预测模型对数据对象类型组的偏袒程度;
根据各个数据对象类型组中的数据对象的历史推送记录,分别计算各个数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值;
根据所述各个数据对象类型组的公平性价值参数、各个数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值,确定出不同数据对象类型组之间的推送成效的差异程度。
5.根据权利要求4所述的方法,其特征在于,根据数据对象的属性数据,确定出所述多个数据对象中的各个数据对象所属的数据对象类型组,包括:
根据所述多个数据对象的属性数据,通过对所述多个数据对象进行聚类处理,以确定出所述多个数据对象中的各个数据对象所属的数据对象类型组。
6.根据权利要求4所述的方法,其特征在于,根据所述各个数据对象类型组的公平性价值参数、各个数据对象类型组中的数据对象针对历史推送规则的推送成效的平均值,确定出不同数据对象类型组之间的推送成效的差异程度,包括:
按照以下算式计算编号为i的数据对象类型组与编号为j的数据对象类型组之间的推送成效的差异程度:
7.根据权利要求2所述的方法,其特征在于,根据多个数据对象的属性数据,以及历史推送记录,确定出推送规则与数据对象的关联性的无偏估计量,包括:
根据数据对象的属性数据,以及历史推送规则,构建相应的无偏估计量求解损失函数;
根据历史推送结果,确定数据对象相对于历史推送规则的显性相关性参数;
根据数据对象的推送成功率和显性相关性参数,计算数据对象排序的全局无偏估计量;
根据所述数据对象的全局无偏估计量,和所述无偏估计量求解损失函数,计算出对应的推送规则与数据对象的关联性的无偏估计量。
9.根据权利要求1所述的方法,其特征在于,在得到第二推送名单之后,所述方法还包括:
根据多个数据对象的属性数据,以及历史推送记录,确定数据对象的多样性分布概率;
根据所述数据对象的多样性分布概率,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单;
相应的,
根据所述第三推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
10.根据权利要求9所述的方法,其特征在于,根据所述数据对象的多样性分布概率,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单,包括:
根据所述数据对象的属性数据和所述数据对象的多样性分布概率,训练基于LSTM模型的处理模型,并通过所述处理模型中的隐藏层提取抽象的特征表征向量;
根据所述数据对象的多样性分布概率和所述抽象的特征表征向量,计算平均多样性指标;
根据所述平均多样性指标,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单。
11.根据权利要求1所述的方法,其特征在于,所述数据对象包括客户对象,所述目标推送规则包括当前所采用的营销方案,所述目标业务数据包括当前待推广的业务产品或业务服务。
12.一种业务数据的推送装置,其特征在于,包括:
获取模块,用于获取多个数据对象的属性数据,以及历史推送记录;其中,所述历史推送记录记录有数据对象基于历史推送规则被推送的历史业务数据,以及相应的历史推送结果;
第一确定模块,用于调用预设的推送结果预测模型,根据所述多个数据对象的属性数据,确定出向所述多个数据对象中的各个数据对象推送目标业务数据的推送成功率;
第一排序模块,用于根据所述推送成功率,对所述多个数据对象的身份标识进行排序,得到第一推送名单;
第二确定模块,用于根据多个数据对象的属性数据,以及历史推送记录,确定出不同数据对象类型组之间的推送成效的差异程度,以及推送规则与数据对象的关联性的无偏估计量;
第二排序模块,用于根据所述推送成效的差异程度,以及所述关联性的无偏估计量,调整所述第一推送名单中数据对象的身份标识的排序,得到第二推送名单;
推送模块,用于根据所述第二推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括第三确定模块和第三排序模块,其中,
所述第三确定模块,用于根据多个数据对象的属性数据,以及历史推送记录,确定数据对象的多样性分布概率;
所述第三排序模块,用于根据所述数据对象的多样性分布概率,调整所述第二推送名单中数据对象的身份标识的排序,得到第三推送名单;
相应的,
所述推送模块,用于根据所述第三推送名单,以及目标推送规则,向多个数据对象推送目标业务数据。
14.一种服务器,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至11中任一项所述方法的步骤。
15.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,所述指令被执行时实现权利要求1至11中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011501811.1A CN112632137A (zh) | 2020-12-18 | 2020-12-18 | 业务数据的推送方法、装置和服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011501811.1A CN112632137A (zh) | 2020-12-18 | 2020-12-18 | 业务数据的推送方法、装置和服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112632137A true CN112632137A (zh) | 2021-04-09 |
Family
ID=75316850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011501811.1A Pending CN112632137A (zh) | 2020-12-18 | 2020-12-18 | 业务数据的推送方法、装置和服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112632137A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114448968A (zh) * | 2021-12-15 | 2022-05-06 | 广州市玄武无线科技股份有限公司 | 推送量校验方法和装置、电子设备、存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018010591A1 (zh) * | 2016-07-12 | 2018-01-18 | 腾讯科技(深圳)有限公司 | 一种信息推送方法及装置、服务器、存储介质 |
CN108205766A (zh) * | 2016-12-19 | 2018-06-26 | 阿里巴巴集团控股有限公司 | 信息推送方法、装置及*** |
CN110472143A (zh) * | 2019-07-22 | 2019-11-19 | 平安科技(深圳)有限公司 | 一种信息推送方法、装置、可读存储介质及终端设备 |
CN111090822A (zh) * | 2019-12-18 | 2020-05-01 | 浙江口碑网络技术有限公司 | 业务对象的推送方法及装置 |
-
2020
- 2020-12-18 CN CN202011501811.1A patent/CN112632137A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018010591A1 (zh) * | 2016-07-12 | 2018-01-18 | 腾讯科技(深圳)有限公司 | 一种信息推送方法及装置、服务器、存储介质 |
CN108205766A (zh) * | 2016-12-19 | 2018-06-26 | 阿里巴巴集团控股有限公司 | 信息推送方法、装置及*** |
CN110472143A (zh) * | 2019-07-22 | 2019-11-19 | 平安科技(深圳)有限公司 | 一种信息推送方法、装置、可读存储介质及终端设备 |
CN111090822A (zh) * | 2019-12-18 | 2020-05-01 | 浙江口碑网络技术有限公司 | 业务对象的推送方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114448968A (zh) * | 2021-12-15 | 2022-05-06 | 广州市玄武无线科技股份有限公司 | 推送量校验方法和装置、电子设备、存储介质 |
CN114448968B (zh) * | 2021-12-15 | 2023-01-10 | 广州市玄武无线科技股份有限公司 | 推送量校验方法和装置、电子设备、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11659050B2 (en) | Discovering signature of electronic social networks | |
Ding et al. | Time-aware cloud service recommendation using similarity-enhanced collaborative filtering and ARIMA model | |
CN110503531B (zh) | 时序感知的动态社交场景推荐方法 | |
Sahoo et al. | A hidden Markov model for collaborative filtering | |
Bakshi et al. | Enhancing scalability and accuracy of recommendation systems using unsupervised learning and particle swarm optimization | |
CN108399564B (zh) | 信用评分方法及装置 | |
CN108304935B (zh) | 机器学习模型训练方法、装置和计算机设备 | |
CN103473291A (zh) | 一种基于隐语义概率模型的个性化服务推荐***及方法 | |
KR20130062442A (ko) | 협업 필터링 추천 방식을 이용한 추천 방법 및 추천 시스템 | |
CN112380449B (zh) | 信息推荐方法、模型训练方法及相关装置 | |
CN111797320B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN114418035A (zh) | 决策树模型生成方法、基于决策树模型的数据推荐方法 | |
CN112241494A (zh) | 基于用户行为数据的关键信息推送方法及装置 | |
Alswailim et al. | A reputation system to evaluate participants for participatory sensing | |
CN108182633B (zh) | 贷款数据处理方法、装置、计算机设备和存储介质 | |
CN112148986A (zh) | 一种基于众包的top-N服务再推荐方法及*** | |
CN115829683A (zh) | 一种基于逆奖赏学习优化的电力积分商品推荐方法及*** | |
WO2023024408A1 (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN110427545B (zh) | 一种信息推送方法及*** | |
US20160171228A1 (en) | Method and apparatus for obfuscating user demographics | |
CN112632137A (zh) | 业务数据的推送方法、装置和服务器 | |
CN113850669A (zh) | 用户分群方法、装置、计算机设备及计算机可读存储介质 | |
CN111984842B (zh) | 银行客户数据处理方法及装置 | |
CN110457387B (zh) | 一种应用于网络中用户标签确定的方法及相关装置 | |
CN115964570A (zh) | 基于QoS多时段变化特征预测的云服务推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |