CN116911892A - 目标客群识别及竞价方法、装置、计算机设备和存储介质 - Google Patents

目标客群识别及竞价方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN116911892A
CN116911892A CN202310739215.4A CN202310739215A CN116911892A CN 116911892 A CN116911892 A CN 116911892A CN 202310739215 A CN202310739215 A CN 202310739215A CN 116911892 A CN116911892 A CN 116911892A
Authority
CN
China
Prior art keywords
user
list
information
user information
marketable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310739215.4A
Other languages
English (en)
Inventor
周峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Shuhe Information Technology Co Ltd
Original Assignee
Shanghai Shuhe Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Shuhe Information Technology Co Ltd filed Critical Shanghai Shuhe Information Technology Co Ltd
Priority to CN202310739215.4A priority Critical patent/CN116911892A/zh
Publication of CN116911892A publication Critical patent/CN116911892A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种目标客群识别及竞价方法、装置、计算机设备和存储介质。所述方法包括:获取***信息名单;在所述***信息名单中筛选出可营销名单;根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分;根据每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单;对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。本方法能够准确的从取***信息中找到目标客群。对于目标客户也可以根据用户的质量评分做到精准出价。

Description

目标客群识别及竞价方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据处理技术领域,特别是涉及一种目标客群识别及竞价方法、装置、计算机设备和存储介质。
背景技术
在广告领域,可通过多种渠道获取***信息,从而进一步在这些取***信息中找到目标客群,然后对目标客群进行竞价推送广告。
精准营销顾名思义,就是为了准确的找到目标客群,并且对这些用户做到精准地做出营销行为。但是目前从取***信息中找到目标客群的方式是依赖现有的数据,只能做到排查已注册用户,排除黑名单用户等,但是这些数据在整个目标客群中占比很低,排除的数据有限,剩余的用户信息的质量难以预测,从而无法合理进行竞价,造成给出的推送广告的竞价与用户质量不匹配,竞价结果产生偏差,造成高质量用户流失,低质量用户占比增加。
发明内容
基于此,有必要针对上述技术问题,提供一种目标客群识别及竞价方法、装置、计算机设备和存储介质,能够解决目前无法精准的从取***信息中找到目标客群,并无法合理进行竞价,造成目标客群偏离及竞价结果产生偏差的技术问题。
一方面,提供一种目标客群识别及竞价方法,所述方法包括:
获取***信息名单;
在所述***信息名单中筛选出可营销名单;
根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分;
根据获得的所述可营销名单中每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单;
对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。
在其中一个实施例中,所述获取***信息名单步骤包括:获取代理商提供的撞库名单信息;
在所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤之后还包括:将设置竞价价格的最终可营销名单发送至所述代理商。
在其中一个实施例中,所述在所述***信息名单中筛选出可营销名单步骤包括:
在数据库中存储包含可营销用户信息的客户名单,在数据库中设置用于判断不允许营销的黑名单和用于判断允许营销的白名单;
在数据库中配置噪音干预方式,所述噪音干预方式包括在筛选出的用户信息中删除部分用户信息;
获取代理商发出的请求识别是否为所述客户名单中用户信息的撞库名单信息,并识别撞库名单信息中的用户信息;
在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单;
采用所述噪音干预方式,在所述命中撞库白名单中删除部分用户信息形成可营销名单。
在其中一个实施例中,所述在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单步骤包括:
获取所述撞库名单信息中每一用户信息的用户标签;
根据所述撞库名单信息中每一用户信息的用户标签筛选出未超过访问频控次数的用户信息;
根据所述撞库名单信息中每一用户信息的用户标签判断筛选出的未超过访问频控次数的用户信息是否为黑名单中的信息;
若是则禁止访问客户名单,若否则判断是否为白名单中的信息;
若是则将筛选出的不在黑名单中但在白名单中的用户信息形成命中撞库白名单。
在其中一个实施例中,在所述获取所述撞库名单信息中每一用户信息的用户标签步骤之前还包括:
判断进行所述撞库名单信息的时间是否在允许访问数据库中客户名单的时间段内;
若是,则获取发出所述撞库名单信息的代理商信息,根据所述代理商信息查询该代理商每日允许在撞库名单信息中填写用户信息的最大名额数量值;
判断所述撞库名单信息中的用户信息数量是否小于等于最大名额数量值,若是则执行下一步。
在其中一个实施例中,所述根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分步骤包括:
获取每一用户的用户信息,所述用户信息包括年龄、性别、职业、喜好、学历、收入、地域、财产、家庭情况、消费水平价位、用户点击数据、用户观看时长中的至少一种;
使用的XGBoost算法构建分类模型,所述分类模型中包含多个决策树;
根据每一决策树中的分类参数,设置决策树末端叶子节点的预测值;
根据每一用户的用户信息在决策树中进行分类至决策树末端叶子节点,将该决策树末端叶子节点的预测值作为该用户对应决策树分类类别的评分;
将每一用户的所有分类对应的评分求和得到该用户的质量评分。
在其中一个实施例中,所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤包括:
获取每一用户的用户信息中的手机号Md5信息,将所述手机号Md5信息通过Hash算法变换成固定长度的散列值,获取散列值的末尾数值;
根据每一用户对应的散列值的末尾数值将用户分组为第一实验组、第二实验组和对照组并设置对应的竞价价格;
第一实验组采用第一实验数据调整其竞价价格,第二实验组采用第二实验数据调整其竞价价格,对照组不调整其竞价价格;
对比第一实验组、第二实验组和对照组的综合收益数据,采用综合收益数据最高的分组的竞价调整方式对后续用户设置竞价价格。
另一方面,提供了一种目标客群识别及竞价装置,所述装置包括:
***信息获取模块,用于获取***信息名单;
筛选可营销名单模块,用于在所述***信息名单中筛选出可营销名单;
集成学习评分模块,用于根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分;
形成最终可营销名单模块,用于根据获得的所述可营销名单中每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单;
竞价价格出价模块,用于对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。
再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取***信息名单;
在所述***信息名单中筛选出可营销名单;
根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分;
根据获得的所述可营销名单中每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单;
对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。
又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取***信息名单;
在所述***信息名单中筛选出可营销名单;
根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分;
根据获得的所述可营销名单中每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单;
对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。
上述目标客群识别及竞价方法、装置、计算机设备和存储介质,通过对用户的用户信息进行分类评分,再将所有分类对应的评分求和得到该用户的质量评分,根据质量评分可准确的从取***信息中找到目标客群。对于目标客户也可以根据用户的质量评分做到精准出价,高价值客户出高价以此来增加获客的几率,低价值的客户降低出价以此来降低成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中目标客群识别及竞价方法的目标客群识别规则图;
图2为一个实施例中目标客群识别及竞价方法的判断逻辑步骤示意图;
图3为一个实施例中目标客群识别及竞价方法的应用环境图;
图4为一个实施例中目标客群识别及竞价方法的流程示意图;
图5为一个实施例中采用所述噪音干预方式,在所述命中撞库白名单中删除部分用户信息形成可营销名单步骤的应用流程示意图;
图6为一个实施例中在命中撞库白名单中删除所述噪音排除清单中的用户信息,并排除部分数据的流程示意图;
图7为一个实施例中根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分步骤的流程示意图;
图8为一个实施例中对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤的流程示意图;
图9为一个实施例中目标客群识别及竞价装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
如背景技术所述,目前无法精准的从取***信息中找到目标客群,并无法合理进行竞价,造成目标客群偏离及竞价结果产生偏差的技术问题。
为解决上述问题,本发明实施例中创造性的提出了一种目标客群识别及竞价方法,就是解决从外部引入数据后,如何依据分险策略和AI模型来识别出用户的价值,从而来甄别用户。对于目标客户也可以做到精准出价,高价值客户出高价以此来增加获客的几率。低价值的客户降低出价,以此来降低成本。
所述目标客群识别及竞价方法的目标客群识别规则如图1所示。对应图1的排除规则,具体的判断逻辑步骤如图2所示。通过图1、图2所示的漏斗排除,可以有效的去掉运营公司不需要的客户,同时通过音效频次控制又能保证客户不会在运营公司要求的时间范围内多次接收到运营公司的营销短信,以此对客户造成一定的困扰。而且在状况前筛漏斗方式筛选出前筛状况可营销名单之后,进一步通过精准策略漏斗继续筛选出是否为需要的用户,分类为通过精准策略筛选的用户和拒绝通过精准策略筛选的用户,并给出不同的出价形成最终可营销名单。
为了便于通过精准策略漏斗继续筛选,本实施例从三方(如代理商、媒体渠道)处获取到用户画像,如用户年龄、学历、家庭情况如是否有孩子有几个孩子,手机中安装的app等数据,将这些数据作为输入项,利用XGBoost模型计算每个客户的模型分,再依据模型分来判断用户是否要,如果要的那么出价是多少,分数越高则出价越高。
对于XGBoost模型的各个分支的得分,则依据历史已有的数据进行训练,利用已有数据对XGBoost模型各分支得分进行拟合,最终再依据此数据和三方的用户画像数据计算模型分。
对于上面计算出来的XGBoost模型分对应的出价要做各种实验,再利用数据来优化出价,以此得出最优解,具体实验方法如下:
利用用户信息中的手机号Md5信息(含字母和数子输出数子)进行hash运算,然后取末尾值(得出0-9)这样可以保证数据随机分流,用这个数据对用户做分组,例如取末尾值为0、1、2的用户信息作为第一实验组,取末尾值为3、4、5的用户信息作为第二实验组,取末尾值为6、7、8、9的用户信息作为对照组。第一实验组和第二实验组为通过实验数据调整竞价价格(出价),对照组的数据不做任何处理,不改变任何出价,等数据积累到一定的量级后,再反过来优化实验组的出价。
具体是根据用户画像(即用户信息)如年龄、学历、收入、地域等通过模型计算出质量分。然后通过每日曝光、点击、注册进来的用户查的用户的质量分,将实时高质量分的用户占比与历史数据进行对比判断,预测下一时段的用户质量。从而调整执行的策略,实现广告位的竞价与用户质量相匹配。
Hash,一般翻译做散列、杂凑,或音译为哈希,是把任意长度的输入(又叫做预映射pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
本申请提供的广告位的竞价调整方法,可以应用于如图3所示的应用环境中。其中,终端102通过网络与媒体广告平台103通过网络进行通信,媒体广告平台103与广告主服务器104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,客户可以通过终端102浏览头条、腾讯等广告信息,媒体广告平台103包括头条、腾讯等服务器,媒体广告平台103及广告主服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图4所示,提供了一种目标客群识别及竞价方法,以该方法应用于图3中的广告主服务器104为例进行说明,包括以下步骤:
步骤S1,获取***信息名单;
步骤S2,在所述***信息名单中筛选出可营销名单;
步骤S3,根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分;
步骤S4,根据获得的所述可营销名单中每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单;
步骤S5,对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。
其中,步骤S3中,一个用户具有至少一个分类,对用户的每一类分类类别进行评分,然后将评分求和得到该用户的质量评分。
在本实施例中,所述获取***信息名单步骤包括:获取代理商提供的撞库名单信息;
在所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤之后还包括:将设置竞价价格的最终可营销名单发送至所述代理商。
在本实施例中,所述在所述***信息名单中筛选出可营销名单步骤包括:
在数据库中存储包含可营销用户信息的客户名单,在数据库中设置用于判断不允许营销的黑名单和用于判断允许营销的白名单;
在数据库中配置噪音干预方式,所述噪音干预方式包括在筛选出的用户信息中删除部分用户信息;
获取代理商发出的请求识别是否为所述客户名单中用户信息的撞库名单信息,并识别撞库名单信息中的用户信息;
在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单;
采用所述噪音干预方式,在所述命中撞库白名单中删除部分用户信息形成可营销名单。
其中,撞库名单信息是指通过访问数据库识别是否可以对其中保存的用户信息进行营销或发送营销信息。撞库就是试探获取数据库中存储的客户名单信息和黑名单信息的意思。
在本实施例中,所述在数据库中设置用于判断不允许营销的黑名单和用于判断允许营销的白名单步骤包括:
将信誉度低、态度不友好、收入低于最低水平、未达到合适年龄的用户信息形成黑名单;
将信誉度高、态度友好、收入大于等于最低水平、达到合适年龄的用户信息形成白名单。
其中,噪音计划具体为:因为所有的代理商都要经过运营公司服务判断是否发送,为了防止代理商那他们的全量用户来撞运营公司的数据,获取被运营公司排除掉的用户为黑名单用户,拿到运营公司的全量黑名单用于其他客户。因此运营公司做了噪音计划,做法如下:即使代理商发送过来的用户都过通过了筛选,运营公司也会排除掉一定比例的用户,用于防止代理商获取我公司的黑名单、首登等用户信息,用于扰动。
具体使用如图5所示,噪音计划的逻辑为随机排除掉部分数据,并且这部分数据对于其他代理商也是需要排除的。
在本实施例中,所述在数据库中配置噪音干预方式步骤包括:设置所述噪音干预方式包括在所述白名单中选取部分用户信息形成的噪音排除清单或者设置所述噪音干预方式包括在所述客户名单中选取部分首登用户信息形成的噪音排除清单;
所述采用所述噪音干预方式步骤包括:在所述命中撞库白名单中删除所述噪音排除清单中的用户信息形成可营销名单。
在本实施例中,所述在数据库中配置噪音干预方式步骤还包括:设置所述噪音干预方式包括在所述白名单中选取部分用户信息形成的噪音排除清单或者设置所述噪音干预方式包括在所述客户名单中选取部分首登用户信息形成的噪音排除清单,并在删除所述噪音排除清单中的用户信息之后的用户信息中排除部分数据,具体排除剩余数据的15%-35%;
所述采用所述噪音干预方式步骤包括:在所述命中撞库白名单中删除所述噪音排除清单中的用户信息,并排除部分数据,具体排除剩余数据的15%-35%后形成可营销名单。
其中本实施例优选排除剩余数据的30%后形成可营销名单。
在本实施例中,如图6所示,在所述命中撞库白名单中删除所述噪音排除清单中的用户信息,并排除部分数据的方法为通过AI模型计算出噪音比例。统计代理商分配相应的营销名额的转化率,对于转化效果越好的代理商分配的噪音比例越低,被排除的数据越少。转化率为通过营销成功的阶段性成功数据除以营销名额总数的占比综合计算获得。营销成功的阶段性成功数据包括注册、首登、授信、借款数据。
具体的,在所述命中撞库白名单中删除所述噪音排除清单中的用户信息,并排除部分数据的方法包括:
构建AI模型,所述AI模型采用XGBoost算法;
设置所述AI模型的输入参数为营销名额总数、注册数量、首登数量、授信数量、借款数据,所述AI模型的输出为噪音比例;
采用所述AI模型对代理商计算各自的噪音比例,基于计算获得的噪音比例计算被排除的数据占比;
根据每一代理商对应的被排除的数据占比,对其在删除所述噪音排除清单中的用户信息之后的用户信息中排除对应数据占比的部分数据。
其中,XGBoost算法的详细说明见下文内容。
在另一实施例中,所述在数据库中配置噪音干预方式步骤包括:设置所述噪音干预方式包括在所述黑名单中选取收入低于最低水平、未达到合适年龄的用户信息形成的噪音干扰清单;
所述采用所述噪音干预方式步骤包括:在所述命中撞库白名单中增加当前用户信息总量第一占比(5%-15%)的干扰信息形成可营销名单,所述干扰信息选自所述噪音排除清单中的部分用户信息。
在本实施例中,所述在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单步骤包括:
获取所述撞库名单信息中每一用户信息的用户标签;
根据所述撞库名单信息中每一用户信息的用户标签筛选出未超过访问频控次数的用户信息;
根据所述撞库名单信息中每一用户信息的用户标签判断筛选出的未超过访问频控次数的用户信息是否为黑名单中的信息;
若是则禁止访问客户名单,若否则判断是否为白名单中的信息;
若是则将筛选出的不在黑名单中但在白名单中的用户信息形成命中撞库白名单。
可理解的是,若用户信息无用户标签时,本申请还采用兜底频控规则进行判断是否未超过访问频控次数,若是则识别判断是否为黑名单中的信息(不可营销名单)。
在本实施例中,在所述获取所述撞库名单信息中每一用户信息的用户标签步骤之前还包括:
判断进行所述撞库名单信息的时间是否在允许访问数据库中客户名单的时间段内;
若是,则获取发出所述撞库名单信息的代理商信息,根据所述代理商信息查询该代理商每日允许在撞库名单信息中填写用户信息的最大名额数量值;
判断所述撞库名单信息中的用户信息数量是否小于等于最大名额数量值,若是则执行下一步。
在本实施例中,在形成可营销名单之后还包括:
记录所述可营销名单,记录形成的所述可营销名单的代理商信息,并记录对应所述代理商信息的采用所述噪音干预方式所删除的部分用户信息;
更新所述数据库中的客户名单对应所述可营销名单的用户信息的访问频控次数;
在接收到其他代理商发出撞库名单信息请求返回可营销名单时,根据更新后的客户名单以及先前噪音干预方式所删除的部分用户信息形成新的可营销名单。
上述方法中,通过对代理商发出的撞库名单信息的反馈结果进行噪音干预,能够避免数据库中存储的客户名单泄露,实现对访问请求进行限制管理,不容易泄露客户名单信息和黑名单信息,避免无形资产损失,保护了数据库数据安全。
如图7所示,在本实施例中,所述根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分步骤包括:
步骤S31,获取每一用户的用户信息,所述用户信息包括年龄、性别、职业、喜好、学历、收入、地域、财产、家庭情况、消费水平价位、用户点击数据、用户观看时长中的至少一种;
步骤S32,使用的XGBoost算法构建分类模型,所述分类模型中包含多个决策树;
步骤S33,根据每一决策树中的分类参数,设置决策树末端叶子节点的预测值;
步骤S34,根据每一用户的用户信息在决策树中进行分类至决策树末端叶子节点,将该决策树末端叶子节点的预测值作为该用户对应决策树分类类别的评分;
步骤S35,将每一用户的所有分类对应的评分求和得到该用户的质量评分。
其中,XGBoost是一种集成学习方法,全称是eXtreme Gradient Boosting,是一种梯度提升决策树算法的实现,它是目前最快最好的开源boosting tree工具包,比常见的工具包快10倍以上。
集成学习(Ensemble Learning)即融合了多个弱模型(基模型)而成的模型,其潜在的思想是即便某一个弱模型得到了错误的预测,其他的弱模型也可以将错误纠正回来。一般有两种融合策略,Bagging和Boosting,XGBoost就是一种Boosting集成学习的优秀代表。
XGBoost的优点在于拟合能力非常强大,在传统机器学习算法中几乎可以说是最强的,缺点在于超参数较多,需要理解并熟练调参难度较大。
实务中大量模型都是使用的XGBoost算法,可以说是最常用的模型算法也不为过。
XGBoost算法是一个可拓展的Tree boosting算法。XGBoost的基本组成元素是:决策树;我们将这些决策树成为”弱学习器“,这些”弱学习器“共同组成了XGBoost。生成每棵决策树使用的数据集,是整个数据集。所以可以将每棵决策树的生成都看作是一个完整的决策树生成过程。
XGBoost的“弱学习器”是“决策树”,每棵“决策树”都是目标函数值最小时的模型。只有这棵“决策树”的目标函数值最小,才会被选为“弱学习器”。
总共t棵树对样本i的预测值=前t-1棵预测树的预测值+第t棵树的预测值。
其中,所述使用的XGBoost算法构建分类模型,所述分类模型中包含多个决策树步骤,包括:
设置每一决策树中包含多个分类参数,所述决策树能够将每一用户通过分类参数被分类至决策树的末端叶子节点;
表示总共t棵决策树一起预测的值;/>表示“前t-1棵决策树”对样本i的预测值;yi表示样本i的实际值;ft(xi)表示“第t棵决策树”对样本i的预测值;表示与yi,/>有关的损失函数;Ω(fj)表示第j棵树的模型复杂度;
设置分类模型的预测值为:
设置分类模型的损失函数为:其中,表示与yi,/>有关的损失函数,也就是偏差;/>表示第j棵树的复杂项;
对损失函数进行简化:
其中,表示前t-1个模型;
对损失函数泰勒展开:
其中,gift(xi)为残差的一阶导数,为残差的二阶导数;
将树的参数带入损失函数:
其中,表ωj示该树中,第j个叶子结点的值;T表示叶子结点数量;Ij表示位于第j个叶子结点具有的样本;/>表示所有属于第j个叶子结点的样本的gi总和;/>表示表示所有属于第j个叶子结点的样本的hi总和;γT表示二次函数。
则在设置叶子结点的值时,将叶子结点的值ωj设为/>此时该树的目标函数最小。
叶子结点的值和目标函数的大小,与“前k-1个决策树”的偏差有关。且每个决策树在结构确定的前提下,目标函数最小为也就是:先求每个叶子结点中的样本的偏差的一次导数和二次导数相除,再对所有叶子节点求和。
如图8所示,在本实施例中,所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤包括:
步骤S51,获取每一用户的用户信息中的手机号Md5信息,将所述手机号Md5信息通过Hash算法(即哈希算法或散列算法)变换成固定长度的散列值,获取散列值的末尾数值;
步骤S52,根据每一用户对应的散列值的末尾数值将用户分组为第一实验组、第二实验组和对照组并设置对应的竞价价格;
步骤S53,第一实验组采用第一实验数据调整其竞价价格,第二实验组采用第二实验数据调整其竞价价格,对照组不调整其竞价价格;
步骤S54,对比第一实验组、第二实验组和对照组的综合收益数据,采用综合收益数据最高的分组的竞价调整方式对后续用户设置竞价价格。
上述目标客群识别及竞价方法中,通过对用户的用户信息进行分类评分,再将所有分类对应的评分求和得到该用户的质量评分,根据质量评分可准确的从取***信息中找到目标客群。对于目标客户也可以根据用户的质量评分做到精准出价,高价值客户出高价以此来增加获客的几率,低价值的客户降低出价以此来降低成本。
应该理解的是,虽然图4、图7、图8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图4、图7、图8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种目标客群识别及竞价装置10,包括:***信息获取模块1、筛选可营销名单模块2、集成学习评分模块3、形成最终可营销名单模块4、竞价价格出价模块5。
所述***信息获取模块1用于获取***信息名单。
所述筛选可营销名单模块2用于在所述***信息名单中筛选出可营销名单。
所述集成学习评分模块3用于根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分。
所述形成最终可营销名单模块4用于根据获得的所述可营销名单中每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单。
所述竞价价格出价模块5用于对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。
在本实施例中,所述获取***信息名单步骤包括:获取代理商提供的撞库名单信息;
在所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤之后还包括:将设置竞价价格的最终可营销名单发送至所述代理商。
在本实施例中,所述在所述***信息名单中筛选出可营销名单步骤包括:
在数据库中存储包含可营销用户信息的客户名单,在数据库中设置用于判断不允许营销的黑名单和用于判断允许营销的白名单;
在数据库中配置噪音干预方式,所述噪音干预方式包括在筛选出的用户信息中删除部分用户信息;
获取代理商发出的请求识别是否为所述客户名单中用户信息的撞库名单信息,并识别撞库名单信息中的用户信息;
在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单;
采用所述噪音干预方式,在所述命中撞库白名单中删除部分用户信息形成可营销名单。
在本实施例中,所述在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单步骤包括:
获取所述撞库名单信息中每一用户信息的用户标签;
根据所述撞库名单信息中每一用户信息的用户标签筛选出未超过访问频控次数的用户信息;
根据所述撞库名单信息中每一用户信息的用户标签判断筛选出的未超过访问频控次数的用户信息是否为黑名单中的信息;
若是则禁止访问客户名单,若否则判断是否为白名单中的信息;
若是则将筛选出的不在黑名单中但在白名单中的用户信息形成命中撞库白名单。
在本实施例中,在所述获取所述撞库名单信息中每一用户信息的用户标签步骤之前还包括:
判断进行所述撞库名单信息的时间是否在允许访问数据库中客户名单的时间段内;
若是,则获取发出所述撞库名单信息的代理商信息,根据所述代理商信息查询该代理商每日允许在撞库名单信息中填写用户信息的最大名额数量值;
判断所述撞库名单信息中的用户信息数量是否小于等于最大名额数量值,若是则执行下一步。
在本实施例中,所述根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分步骤包括:
获取每一用户的用户信息,所述用户信息包括年龄、性别、职业、喜好、学历、收入、地域、财产、家庭情况、消费水平价位、用户点击数据、用户观看时长中的至少一种;
使用的XGBoost算法构建分类模型,所述分类模型中包含多个决策树;
根据每一决策树中的分类参数,设置决策树末端叶子节点的预测值;
根据每一用户的用户信息在决策树中进行分类至决策树末端叶子节点,将该决策树末端叶子节点的预测值作为该用户对应决策树分类类别的评分;
将每一用户的所有分类对应的评分求和得到该用户的质量评分。
在本实施例中,所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤包括:
获取每一用户的用户信息中的手机号Md5信息,将所述手机号Md5信息通过Hash算法(即哈希算法或散列算法)变换成固定长度的散列值,获取散列值的末尾数值;
根据每一用户对应的散列值的末尾数值将用户分组为第一实验组、第二实验组和对照组并设置对应的竞价价格;
第一实验组采用第一实验数据调整其竞价价格,第二实验组采用第二实验数据调整其竞价价格,对照组不调整其竞价价格;
对比第一实验组、第二实验组和对照组的综合收益数据,采用综合收益数据最高的分组的竞价调整方式对后续用户设置竞价价格。
上述目标客群识别及竞价装置中,通过对用户的用户信息进行分类评分,再将所有分类对应的评分求和得到该用户的质量评分,根据质量评分可准确的从取***信息中找到目标客群。对于目标客户也可以根据用户的质量评分做到精准出价,高价值客户出高价以此来增加获客的几率,低价值的客户降低出价以此来降低成本。
关于目标客群识别及竞价装置的具体限定可以参见上文中对于目标客群识别及竞价方法的限定,在此不再赘述。上述目标客群识别及竞价装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标客群识别及竞价数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标客群识别及竞价方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
获取***信息名单;
在所述***信息名单中筛选出可营销名单;
根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分;
根据获得的所述可营销名单中每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单;
对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
所述获取***信息名单步骤包括:获取代理商提供的撞库名单信息;
在所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤之后还包括:将设置竞价价格的最终可营销名单发送至所述代理商。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
所述在所述***信息名单中筛选出可营销名单步骤包括:
在数据库中存储包含可营销用户信息的客户名单,在数据库中设置用于判断不允许营销的黑名单和用于判断允许营销的白名单;
在数据库中配置噪音干预方式,所述噪音干预方式包括在筛选出的用户信息中删除部分用户信息;
获取代理商发出的请求识别是否为所述客户名单中用户信息的撞库名单信息,并识别撞库名单信息中的用户信息;
在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单;
采用所述噪音干预方式,在所述命中撞库白名单中删除部分用户信息形成可营销名单。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
所述在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单步骤包括:
获取所述撞库名单信息中每一用户信息的用户标签;
根据所述撞库名单信息中每一用户信息的用户标签筛选出未超过访问频控次数的用户信息;
根据所述撞库名单信息中每一用户信息的用户标签判断筛选出的未超过访问频控次数的用户信息是否为黑名单中的信息;
若是则禁止访问客户名单,若否则判断是否为白名单中的信息;
若是则将筛选出的不在黑名单中但在白名单中的用户信息形成命中撞库白名单。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
在所述获取所述撞库名单信息中每一用户信息的用户标签步骤之前还包括:
判断进行所述撞库名单信息的时间是否在允许访问数据库中客户名单的时间段内;
若是,则获取发出所述撞库名单信息的代理商信息,根据所述代理商信息查询该代理商每日允许在撞库名单信息中填写用户信息的最大名额数量值;
判断所述撞库名单信息中的用户信息数量是否小于等于最大名额数量值,若是则执行下一步。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
所述根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分步骤包括:
获取每一用户的用户信息,所述用户信息包括年龄、性别、职业、喜好、学历、收入、地域、财产、家庭情况、消费水平价位、用户点击数据、用户观看时长中的至少一种;
使用的XGBoost算法构建分类模型,所述分类模型中包含多个决策树;
根据每一决策树中的分类参数,设置决策树末端叶子节点的预测值;
根据每一用户的用户信息在决策树中进行分类至决策树末端叶子节点,将该决策树末端叶子节点的预测值作为该用户对应决策树分类类别的评分;
将每一用户的所有分类对应的评分求和得到该用户的质量评分。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤包括:
获取每一用户的用户信息中的手机号Md5信息,将所述手机号Md5信息通过Hash算法(即哈希算法或散列算法)变换成固定长度的散列值,获取散列值的末尾数值;
根据每一用户对应的散列值的末尾数值将用户分组为第一实验组、第二实验组和对照组并设置对应的竞价价格;
第一实验组采用第一实验数据调整其竞价价格,第二实验组采用第二实验数据调整其竞价价格,对照组不调整其竞价价格;
对比第一实验组、第二实验组和对照组的综合收益数据,采用综合收益数据最高的分组的竞价调整方式对后续用户设置竞价价格。
关于处理器执行计算机程序时实现步骤的具体限定可以参见上文中对于目标客群识别及竞价的方法的限定,在此不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取***信息名单;
在所述***信息名单中筛选出可营销名单;
根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分;
根据获得的所述可营销名单中每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单;
对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
所述获取***信息名单步骤包括:获取代理商提供的撞库名单信息;
在所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤之后还包括:将设置竞价价格的最终可营销名单发送至所述代理商。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
所述在所述***信息名单中筛选出可营销名单步骤包括:
在数据库中存储包含可营销用户信息的客户名单,在数据库中设置用于判断不允许营销的黑名单和用于判断允许营销的白名单;
在数据库中配置噪音干预方式,所述噪音干预方式包括在筛选出的用户信息中删除部分用户信息;
获取代理商发出的请求识别是否为所述客户名单中用户信息的撞库名单信息,并识别撞库名单信息中的用户信息;
在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单;
采用所述噪音干预方式,在所述命中撞库白名单中删除部分用户信息形成可营销名单。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
所述在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单步骤包括:
获取所述撞库名单信息中每一用户信息的用户标签;
根据所述撞库名单信息中每一用户信息的用户标签筛选出未超过访问频控次数的用户信息;
根据所述撞库名单信息中每一用户信息的用户标签判断筛选出的未超过访问频控次数的用户信息是否为黑名单中的信息;
若是则禁止访问客户名单,若否则判断是否为白名单中的信息;
若是则将筛选出的不在黑名单中但在白名单中的用户信息形成命中撞库白名单。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
在所述获取所述撞库名单信息中每一用户信息的用户标签步骤之前还包括:
判断进行所述撞库名单信息的时间是否在允许访问数据库中客户名单的时间段内;
若是,则获取发出所述撞库名单信息的代理商信息,根据所述代理商信息查询该代理商每日允许在撞库名单信息中填写用户信息的最大名额数量值;
判断所述撞库名单信息中的用户信息数量是否小于等于最大名额数量值,若是则执行下一步。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
所述根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分步骤包括:
获取每一用户的用户信息,所述用户信息包括年龄、性别、职业、喜好、学历、收入、地域、财产、家庭情况、消费水平价位、用户点击数据、用户观看时长中的至少一种;
使用的XGBoost算法构建分类模型,所述分类模型中包含多个决策树;
根据每一决策树中的分类参数,设置决策树末端叶子节点的预测值;
根据每一用户的用户信息在决策树中进行分类至决策树末端叶子节点,将该决策树末端叶子节点的预测值作为该用户对应决策树分类类别的评分;
将每一用户的所有分类对应的评分求和得到该用户的质量评分。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤包括:
获取每一用户的用户信息中的手机号Md5信息,将所述手机号Md5信息通过Hash算法(即哈希算法或散列算法)变换成固定长度的散列值,获取散列值的末尾数值;
根据每一用户对应的散列值的末尾数值将用户分组为第一实验组、第二实验组和对照组并设置对应的竞价价格;
第一实验组采用第一实验数据调整其竞价价格,第二实验组采用第二实验数据调整其竞价价格,对照组不调整其竞价价格;
对比第一实验组、第二实验组和对照组的综合收益数据,采用综合收益数据最高的分组的竞价调整方式对后续用户设置竞价价格。
关于计算机程序被处理器执行时实现步骤的具体限定可以参见上文中对于目标客群识别及竞价的方法的限定,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种目标客群识别及竞价方法,其特征在于,包括:
获取***信息名单;
在所述***信息名单中筛选出可营销名单;
根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分;
根据获得的所述可营销名单中每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单;
对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。
2.根据权利要求1所述的目标客群识别及竞价方法,其特征在于,
所述获取***信息名单步骤包括:获取代理商提供的撞库名单信息;
在所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤之后还包括:将设置竞价价格的最终可营销名单发送至所述代理商。
3.根据权利要求2所述的目标客群识别及竞价方法,其特征在于,所述在所述***信息名单中筛选出可营销名单步骤包括:
在数据库中存储包含可营销用户信息的客户名单,在数据库中设置用于判断不允许营销的黑名单和用于判断允许营销的白名单;
在数据库中配置噪音干预方式,所述噪音干预方式包括在筛选出的用户信息中删除部分用户信息;
获取代理商发出的请求识别是否为所述客户名单中用户信息的撞库名单信息,并识别撞库名单信息中的用户信息;
在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单;
采用所述噪音干预方式,在所述命中撞库白名单中删除部分用户信息形成可营销名单。
4.根据权利要求3所述的目标客群识别及竞价方法,其特征在于,所述在所述撞库名单信息中筛选出不在黑名单中但在白名单中的用户信息,形成命中撞库白名单步骤包括:
获取所述撞库名单信息中每一用户信息的用户标签;
根据所述撞库名单信息中每一用户信息的用户标签筛选出未超过访问频控次数的用户信息;
根据所述撞库名单信息中每一用户信息的用户标签判断筛选出的未超过访问频控次数的用户信息是否为黑名单中的信息;
若是则禁止访问客户名单,若否则判断是否为白名单中的信息;
若是则将筛选出的不在黑名单中但在白名单中的用户信息形成命中撞库白名单。
5.根据权利要求4所述的目标客群识别及竞价方法,其特征在于,在所述获取所述撞库名单信息中每一用户信息的用户标签步骤之前还包括:
判断进行所述撞库名单信息的时间是否在允许访问数据库中客户名单的时间段内;
若是,则获取发出所述撞库名单信息的代理商信息,根据所述代理商信息查询该代理商每日允许在撞库名单信息中填写用户信息的最大名额数量值;
判断所述撞库名单信息中的用户信息数量是否小于等于最大名额数量值,若是则执行下一步。
6.根据权利要求1所述的目标客群识别及竞价方法,其特征在于,所述根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分步骤包括:
获取每一用户的用户信息,所述用户信息包括年龄、性别、职业、喜好、学历、收入、地域、财产、家庭情况、消费水平价位、用户点击数据、用户观看时长中的至少一种;
使用的XGBoost算法构建分类模型,所述分类模型中包含多个决策树;
根据每一决策树中的分类参数,设置决策树末端叶子节点的预测值;
根据每一用户的用户信息在决策树中进行分类至决策树末端叶子节点,将该决策树末端叶子节点的预测值作为该用户对应决策树分类类别的评分;
将每一用户的所有分类对应的评分求和得到该用户的质量评分。
7.根据权利要求1所述的目标客群识别及竞价方法,其特征在于,所述对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格步骤包括:
获取每一用户的用户信息中的手机号Md5信息,将所述手机号Md5信息通过Hash算法变换成固定长度的散列值,获取散列值的末尾数值;
根据每一用户对应的散列值的末尾数值将用户分组为第一实验组、第二实验组和对照组并设置对应的竞价价格;
第一实验组采用第一实验数据调整其竞价价格,第二实验组采用第二实验数据调整其竞价价格,对照组不调整其竞价价格;
对比第一实验组、第二实验组和对照组的综合收益数据,采用综合收益数据最高的分组的竞价价格调整方式对后续用户设置竞价价格。
8.一种目标客群识别及竞价装置,其特征在于,所述装置包括:
***信息获取模块,用于获取***信息名单;
筛选可营销名单模块,用于在所述***信息名单中筛选出可营销名单;
集成学习评分模块,用于根据所述可营销名单中每一用户的用户信息对用户进行分类并评分,将每一用户的所有分类对应的评分求和得到该用户的质量评分;
形成最终可营销名单模块,用于根据获得的所述可营销名单中每一用户的质量评分判断是否竞价,将所有判定为进行竞价的用户的用户信息汇总为最终可营销名单;
竞价价格出价模块,用于对所述最终可营销名单中的每一用户根据其质量评分设置竞价价格,所述竞价价格与所述质量评分正相关。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202310739215.4A 2023-06-20 2023-06-20 目标客群识别及竞价方法、装置、计算机设备和存储介质 Pending CN116911892A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310739215.4A CN116911892A (zh) 2023-06-20 2023-06-20 目标客群识别及竞价方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310739215.4A CN116911892A (zh) 2023-06-20 2023-06-20 目标客群识别及竞价方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN116911892A true CN116911892A (zh) 2023-10-20

Family

ID=88355405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310739215.4A Pending CN116911892A (zh) 2023-06-20 2023-06-20 目标客群识别及竞价方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN116911892A (zh)

Similar Documents

Publication Publication Date Title
CN110263242B (zh) 内容推荐方法、装置、计算机可读存储介质和计算机设备
US20210056458A1 (en) Predicting a persona class based on overlap-agnostic machine learning models for distributing persona-based digital content
US20090125382A1 (en) Quantifying a Data Source's Reputation
CN112163963B (zh) 业务推荐方法、装置、计算机设备和存储介质
US20200327470A1 (en) Cognitively-Derived Knowledge Base of Supply Chain Risk Management
CN109376237A (zh) 客户稳定性的预测方法、装置、计算机设备和存储介质
WO2022100382A1 (zh) 一种基于区块链的信贷推荐方法、设备及存储介质
CN111008335B (zh) 一种信息处理方法、装置、设备及存储介质
CN113379301A (zh) 通过决策树模型对用户进行分类的方法、装置和设备
US20230049817A1 (en) Performance-adaptive sampling strategy towards fast and accurate graph neural networks
CN111695084A (zh) 模型生成方法、信用评分生成方法、装置、设备及存储介质
CN115423578B (zh) 基于微服务容器化云平台的招投标方法和***
CN113869931A (zh) 广告投放策略确定方法、装置、计算机设备和存储介质
CN116402558A (zh) 广告位的竞价调整方法、装置、设备和存储介质
CN114371946B (zh) 基于云计算和大数据的信息推送方法及信息推送服务器
CN115914363A (zh) 消息推送方法、装置、计算机设备和存储介质
CN116911892A (zh) 目标客群识别及竞价方法、装置、计算机设备和存储介质
CN112818235B (zh) 基于关联特征的违规用户识别方法、装置和计算机设备
CN116150429A (zh) 异常对象识别方法、装置、计算设备以及存储介质
CN117853171A (zh) 可营销用户数据识别分配处理方法、装置、设备和介质
US20230377004A1 (en) Systems and methods for request validation
CN112580916B (zh) 数据评估方法、装置、计算机设备和存储介质
US20230057792A1 (en) Training data fidelity for machine learning applications through intelligent merger of curated auxiliary data
CN113468389B (zh) 一种基于特征序列比对的用户画像建立方法和装置
US20210241297A1 (en) Artificial Intelligence Sales Technology Stack Prospecting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination