CN109597940A - 基于商业兴趣的目标人群确定及信息推送方法和*** - Google Patents

基于商业兴趣的目标人群确定及信息推送方法和*** Download PDF

Info

Publication number
CN109597940A
CN109597940A CN201811491017.6A CN201811491017A CN109597940A CN 109597940 A CN109597940 A CN 109597940A CN 201811491017 A CN201811491017 A CN 201811491017A CN 109597940 A CN109597940 A CN 109597940A
Authority
CN
China
Prior art keywords
commercial interest
target group
tag along
along sort
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811491017.6A
Other languages
English (en)
Inventor
谢常亮
吴安新
吴超
唐亚光
黄声声
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Huandian Information Technology Co Ltd
Original Assignee
Shanghai Bilibili Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Bilibili Technology Co Ltd filed Critical Shanghai Bilibili Technology Co Ltd
Priority to CN201811491017.6A priority Critical patent/CN109597940A/zh
Publication of CN109597940A publication Critical patent/CN109597940A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于商业兴趣的目标人群确定及信息推送方法和***,属于互联网技术领域。目标人群确定方法包括:对已有的商业兴趣分类标签进一步分类标注,得到创意分类标签,作为所属商业兴趣二级类目的训练数据;并进行机器学习,得到基于所述的商业兴趣分类标签的相关度分值;确定具有信息推送价值的目标人群;推送方法包括:一服务器利用上述的确定方法确定目标人群后,该终端向目标人群推送信息;***包括:服务器和信息接收终端,其中服务器包括处理器和存储器,存储器上存储有计算机程序,该计算机程序被处理器执行时,实现上述的目标人群确定方法。与现有技术相比,本发明具有无需自定义特征关键词组、自动化程度高以及易于实现等优点。

Description

基于商业兴趣的目标人群确定及信息推送方法和***
技术领域
本发明涉及互联网技术领域,特别涉及信息推送领域,具体是指一种基于商业兴趣的目标人群确定及信息推送方法和***。
背景技术
用户在数据源上注册后,用户在数据源上会进行各种行为,为了准确描述用户在数据源中进行的相关行为,需要对用户行为进行分析,广告商可以根据分析出的用户行为向符合广告商要求的用户推送广告,以宣传产品或服务。常用的技术手段可以是将提取出的用户标签与设定的标准兴趣进行相似性匹配计算,以将用户标签归类到最准确的兴趣类别下,从而分析出用户行为,进而根据分析出的用户行为向符合广告商要求的兴趣类型的用户推送广告。但是现有技术中商业兴趣对应的用户标签是人工指定的,自动化程度不高,不能自动捕捉用户的兴趣动态并调整商业兴趣定向人群。
专利CN104090888A提出了一种用户行为数据的分析方法和装置方法,通过综合多渠道数据提取用户的关键词作为基础,然后定义定向类目的特征关键词组,匹配定向类目的特征关键词与用户的关键词,匹配分值超过一定阈值的用户即为定向类目的人群。然而这种方法在实际应用时,需要人工定义定向类目的特征关键词组,且实际广告投放环节作为用户的行为定向使用时需要不断调整特征关键词组已达到更好的效果,人工调整环节较多,自动化程度不高。
发明内容
本发明的目的是针对上述问题提供一种自动化程度高以及易于实现的基于商业兴趣的目标人群确定及信息推送方法和***。
本发明的目的可以通过以下技术方案来实现:
一种基于商业兴趣的目标人群确定方法,所述的方法包括以下步骤:
(1)对已有的商业兴趣分类标签进一步分类标注,得到创意分类标签;
(2)根据所述的创意分类标签,获取训练数据并进行机器学习,得到基于所述的商业兴趣分类标签的相关度分值;
(3)根据所述的相关度分值,确定具有信息推送价值的目标人群。
优选地,所述步骤(1)具体为:根据已有的商业兴趣分类标签的结构类型,按照相应的创意分类内容进行结构延伸和类目划分,得到创意分类标签。
优选地,所述商业兴趣分类标签为二级结构,所述创意分类标签为三级结构,所述创意分类标签的上二级结构与商业兴趣分类标签一致。
优选地,所述步骤(2)具体包括以下步骤:
(21)根据所述的创意分类标签,获取历史用户的操作日志;
(22)根据所述的操作日志,得到训练数据;
(23)根据所述的训练数据进行机器学习,得到基于所述的创意分类标签对应的商业兴趣分类标签的相关度分值。
优选地,所述步骤(22)具体包括以下步骤:
(221)根据所述的操作日志,通过样本划分得到用于机器学习的样本数据;
(222)根据所述的操作日志,提取分类特征,构造特征字典;
(223)将所述的样本数据与所述的分类特征进行关联,得到所述的训练数据。
优选地,所述步骤(221)具体为:遍历所述的操作日志,将其中被点击的广告日志确定为正样本,曝光未点击的广告日志确定为负样本,得到用于机器学习的样本数据。
优选地,所述步骤(221)还包括:将所述的操作日志中的异常数据进行清洗过滤。
优选地,所述步骤(222)具体为:根据所述的操作日志中的具体行为提取用户对应的分类特征,并对所述的分类特征进行编号,得到所述的特征字典。
优选地,所述具体行为包括:搜索、播放、分享、收藏和投币。
优选地,所述步骤(23)具体包括以下步骤:
(231)判断所述的操作日志数量是否达到训练阈值,若是则进入步骤(232),若否则返回步骤(21);
(232)根据机器学习的需求,划分训练数据,得到训练集、测试集和验证集,并选择训练算法进行机器学习;
(233)将机器学习得到的分数结果通过归一化划分到0至1之间,得到基于所述的创意分类标签对应的商业兴趣分类标签的相关度分值。
优选地,所述划分训练数据具体为:根据5折交叉验证的方式对训练数据进行划分。
优选地,所述训练算法具体为XGBoost算法。
优选地,所述XGBoost算法中梯度提升的具体公式为:
其中,h为预测值,为样本类别标签,为样本,K为构成梯度提升树模型的树的个数,fi为对应的第i树的结构q以及对应的叶子节点的权重w,F为表征决策树的函数空间的一个泛函,w为对应的叶子节点的权重,为树结构,T为一个决策树的叶子结点的数目,R为w的样本空间。
优选地,所述步骤(3)具体包括以下步骤:
(31)根据所述的相关度分值,将所述的商业兴趣分类标签进行倒序排序;
(32)根据排序结果,判断对应的商业兴趣分类标签是否达到信息推送条件,若是则表明该商业兴趣分类标签对应的对象为具有信息推送价值的目标人群。
优选地,所述信息推送条件具体为:通过验证集进行验证后的点击通过率达到提升阈值。
一种基于商业兴趣向目标人群推送信息的方法,所述的方法包括以下步骤:
(a)一服务器利用权利要求1所述的基于商业兴趣的目标人群确定方法确定具有信息推送价值的目标人群;
(b)该服务器向所述的目标人群推送信息。
优选地,所述步骤(b)具体包括以下步骤:
(b1)该终端判断所述的目标人群是否达到自动推送信息的条件,若是自动向所述的目标人群推送信息,若否则进入步骤(b2);
(b2)在接收到用户的推送指令时,向所述的目标人群推送信息。
优选地,所述自动推送信息的条件具体为:所述的目标人群数量达到设定阈值。
一种服务器,包括处理器和存储器,所述的存储器上存储有计算机程序,该计算机程序被所述处理器执行时,实现上述中任一项所述基于商业兴趣的目标人群确定方法。
一种基于商业兴趣向目标人群推送信息的***,所述***包括:
如上所述的服务器,用于确定基于商业兴趣的目标人群,并向所述的目标人群推送信息;
信息接收终端,用于接收所述的服务器推送的信息。
与现有技术相比,本发明具有以下有益效果:
(1)本发明提出的基于商业兴趣的目标人群确定方法,通过对已有的商业兴趣分类标签进行进一步分类标注,从而得到创意分类标签,再基于该创意分类标签来获取训练数据并进行机器学习,最后根据机器学习的结果确定商业兴趣人群目标,与现有技术相比,本申请中的创意分类标签是在已有的商业兴趣分类标签上进行的进一步详细划分,之后基于此标签来提取分类特征,比起对比文件中通过综合多渠道数据提取用户的关键词作为基础再定义特征关键词组来说,本申请中的方法无需过多的人为干预,自动化程度较高。
(2)本发明提出的基于商业兴趣的目标人群确定方法,根据划分的创意分类标签来获取对应的操作日志,再利用操作日志分别进行样本划分和分类特征提取,并将样本和分类特征对应从而得到训练数据,从而可以通过机器学习得到用户基于商业兴趣分类标签的相关度分值,对于相关度分值高且达到信息推送条件的对象作为商业兴趣人群目标(即通过验证集验证后的点击通过率达到提升阈值的商业兴趣分类标签下的人群),这样的整个寻找过程人为干预度极低,利用机器学习可以基本上自动实现商业兴趣人群目标的寻找,因此适合范围广,易于实现。
(3)本发明提出的基于商业兴趣向目标人群推送信息的方法,在通过上述的寻找方法确定商业兴趣人群目标后,在对应的目标数达到阈值时自动对其推送信息,在目标数未达到阈值时,根据用户的推送指令决定是否推送信息,这种信息推送方式既满足了高自动化的需求,同时也可以灵活配置,根据用户实际需求进行信息推送,适用范围广。
附图说明
图1为本发明基于商业兴趣的目标人群确定方法的步骤流程图;
图2为本发明基于商业兴趣向目标人群推送信息的方法的步骤流程图;
图3为实施例中对商业兴趣人群进行挖掘的算法流程图;
图4为梯度提升树模型的原理阐述图。
具体实施方式
为了能够更清楚地理解本发明的技术内容,特举以下实施例详细说明。
请参阅图1所示,为本发明基于商业兴趣的目标人群确定方法的步骤流程图。
在一种实施方式中,如图2所示,为该基于商业兴趣的目标人群确定方法,包括以下步骤:
(1)对已有的商业兴趣分类标签进一步分类标注,得到创意分类标签,具体为:根据已有的商业兴趣分类标签的结构类型,按照相应的创意分类内容进行结构延伸和类目划分,得到创意分类标签,其中商业兴趣分类标签为二级结构,创意分类标签为三级结构,创意分类标签的上二级结构与商业兴趣分类标签一致;
设计二级的商业兴趣类目与三级创意分类体系,两者的关系是商业兴趣的前两级内容与与创意分类的前二级内容相同;操作人员对广告创意做所属创意分类三级类目的标注,被标注广告创意的曝光、点击人群,作为所属商业兴趣二级类目的训练数据;
(2)根据创意分类标签,获取训练数据并进行机器学习,得到基于所述的商业兴趣分类标签的相关度分值,具体包括以下步骤:
(21)根据创意分类标签,获取历史用户的操作日志;
(22)根据操作日志,得到训练数据,具体包括以下步骤:
(221)根据所述的操作日志,通过样本划分得到用于机器学习的样本数据,具体为:遍历操作日志,将其中被点击的广告日志确定为正样本,曝光未点击的广告日志确定为负样本,得到用于机器学习的样本数据,除此之外还包括:将操作日志中的异常数据进行清洗过滤;
(222)根据操作日志,提取分类特征,构造特征字典,具体为:根据操作日志中的具体行为(包括搜索、播放、分享、收藏和投币等)提取用户对应的分类特征,并对分类特征进行编号,得到特征字典;
(223)将样本数据与分类特征进行关联,得到训练数据;
(23)根据训练数据进行机器学习,得到基于创意分类标签对应的商业兴趣分类标签的相关度分值,具体包括以下步骤:
(231)判断操作日志数量是否达到训练阈值,若是则进入步骤(232),若否则返回步骤(21);
(232)根据机器学习的需求,划分训练数据(具体为根据5折交叉验证的方式对训练数据进行划分),得到训练集、测试集和验证集,并选择训练算法(本实施例中为XGBoost算法)进行机器学习,其中XGBoost算法中梯度提升的具体公式为:
其中,h为,为,为,K为构成梯度提升树模型的树的个数,fi为,F为表征决策树的函数空间的一个泛函,f为,w为一个向量,为,T为一个决策树的叶子结点的数目,R为;
(233)将机器学习得到的分数结果通过归一化划分到0~1之间,得到创意分类标签对应的商业兴趣分类标签的相关度分值;
(3)根据相关度分值,确定具有信息推送价值的目标人群,具体包括以下步骤:
(31)根据相关度分值,将商业兴趣分类标签进行倒序排序;
(32)根据排序结果,判断对应的商业兴趣分类标签是否达到信息推送条件(具体为通过验证集进行验证后的点击通过率达到提升阈值),若是则表明该商业兴趣分类标签对应的对象为具有信息推送价值的目标人群。
除了上述的寻找方法外,本实施例还提出了一种基于商业兴趣向目标人群推送信息的方法,参阅图2所示,具体包括以下步骤:
(a)一服务器利用上述的基于商业兴趣的目标人群确定方法确定具有信息推送价值的目标人群;
(b)该服务器向目标人群推送信息:
(b1)该终端判断目标人群是否达到自动推送信息的条件(具体为目标人群数量达到设定阈值),若是自动向目标人群推送信息,若否则进入步骤(b2);
(b2)在接收到用户的推送指令时,向目标人群推送信息。
基于上述的寻找方法,本实施例中还对应的提出了一种服务器,包括处理器和存储器,存储器上存储有计算机程序,该计算机程序被所述处理器执行时,实现上述中任一项所述基于商业兴趣的目标人群确定方法;以及一种基于商业兴趣向目标人群推送信息的***,包括:如上所述的服务器,用于确定基于商业兴趣的目标人群,并向所述的目标人群推送信息;以及信息接收终端,用于接收所述的服务器推送的信息。
在实际应用中,本发明基于商业兴趣的目标人群确定方法的具体实现方式,通过以下实施例说明。
实施例1
本实施例中,基于商业兴趣的目标人群确定方法的几个具体环节如下表所示:
表1商业兴趣人群目标的寻找环节
下面将表1结合上文中提到的基于商业兴趣的目标人群确定方法进行具体阐述,从表中可以看出,步骤(1)中提出的对已有的商业兴趣分类标签进一步分类标注在本实施例中主要就是进行创意分类标注,即将已有的商业兴趣分类标签进一步细化为创意分类标签,本实施例中,商业兴趣是一个二级的类目数,用于广告定向的定向类目。创意分类的是一个三级结构,用于给广告创意进行分类标注,创意分类与商业兴趣分类的关系是,创意分类的一二级即是商业兴趣的一二级,即创意分类是商业兴趣的细化。商业兴趣、创意分类的用法概略介绍如下:商业兴趣是二级结构,由运营人群在进行效果广告投放时作为人群定向使用;创意分类是三级结构,用于效果广告的创意标注,由运营人群在广告投放端对创意进行标注;商业兴趣人群定向体系训练使用经过标注的创意的曝光、点击数据作为训练数据源,通过机器学习算法训练生成,本实施例中关于商业兴趣和创意分类二者之间对应的完整的结构化数据具体划分十分复杂,具体以其中一种举例说明:以商业兴趣的一级结构为家用电器为例,该商业兴趣的二级结构为对应在家用电器下的个护健康、生活电器和厨房电器,则对应的创意分类作为三级结构分别为:对应于个护健康下的电吹风、直发器、理发器、体重秤/健康秤、体脂秤、眼部按摩器、按摩足疗机、保健项圈/手环、牙刷头、足部按摩走毯、电动牙刷、牙齿美白仪、头部按摩机、按摩床垫、矫资用品配件和其他个护健康用品;对应于生活电器下的吸尘器、电热毯、电风扇、加湿器和暖风机/取暖器;以及对应于厨房电器下的煮蛋器/蒸蛋器、电磁炉、电热/火锅、巧克力喷泉机、炒冰机、爆米花机、商用烘烤炉/烤箱、烹饪锅、***、饮水机、咖啡机、电饭锅、保健/养生/煎药壶、榨汁机、电热饭盒、微波炉、电热水壶、豆浆机、制冰机、果蔬消毒清洗机、电压力锅、酸奶机、面包机和电热炉。
在划分好创意分类标签后进入步骤(2),即开始获取训练数据并进行机器学习,从而得到基于商业兴趣分类标签的相关度分值,从表1中可以看出,在获取训练数据的过程中,首先是通过创意分类标签获取历史用户的操作日志,在得到相关的操作日志后,利用它可以分别进行样本清洗环节和特征工程提取环节,样本清洗环节中,正负标签标定原则为:我们假定有点击行为的用户是对该商业标签感兴趣的用户,即为正样本;曝光未点击用户表示对该商业标签没有兴趣的用户,即为负样本;其中close行为(即用户明确表示不感兴趣的行为)的用户是及其珍贵的负样本。因此可以从操作日志中拉取历史用户的广告点击曝光日志,对于这些广告点击曝光日志,将被点击的日志作为正样本,而曝光未点击的日志则标定为负样本,对于一些异常数据,如未登录用户的日志等,则过滤掉避免影响机器学习的准确性。
除了利用操作日志进行样本清洗外,还可以利用操作日志进行特征工程的提取,从表1中可以进一步看出,通过操作日志可以根据用户最近一段时间的操作行为来提取标签(tag)特征,本实施例中是对用户近一个月内的搜索、播放、分享、收藏以及投币等行为提取的标签特征,在实际应用中时间段和对应的行为均可以根据实际情况进行选择,不限于本实施例中提出的内容,在提取了标签特征后,可以对特征编号,构造特征字典。
通过上述两个环节,可以得到样本数据和特征字典,此时只需将清洗好的样本数据和提取的标签特征进行关联,便可得到训练数据,从表1中可以看出,本实施例中在将样本数据和tag特征关联后再实用multi-hot编码,得到最终的训练数据。
在得到训练数据后,为了顺利进行机器学习,还需要对训练数据进行划分,本实施例中,划分的具体方式为:使用5折交叉验证的方式来训练模型,即训练集:测试集按4:1原则划分。并且采用最近一天完整的曝光日志样本数据做验证集。这样就能保证验证集的数据与实际线上的曝光数据保持统一分布。避免线上效果与离线评估的误差。验证集的主要作用就是作为人群得分划分的依据。在划分好训练集、测试集和验证集后,就相当于做好了机器学习的准备,可以进行训练了,但是在实验过程中发现当商业标签的训练数据过于稀少时,由于特征本身较多,就容易造成模型学习过拟合,失去泛化能力,对于新用户预测效果不甚理想。因此在本实施例中设定,当操作日志达到训练阈值时才开始进行训练,本实施例中具体为训练日志达到250W以上时才触发该商业标签的模型训练。
本实施例中的训练过程最终采取的是XGBoost算法,XGBoost是一个梯度提升树(Gradient tree boosting)模型,该梯度提升树模型的具体原理思路如图4所示。从图中可以看出,该算法的具体思路就是,对于一个复杂的问题,将多个专家的判断进行适当的综合所得出的判断,要比任何一个专家单独判断好。每一步产生一个弱预测模型(如决策树),并加权累加到总模型中,如果每一步的弱预测模型生成都是依据损失函数的梯度方向,则称之为梯度提升(Gradient boosting)。
其数学公式描述如下:
其中,h为预测值,为样本类别标签,为样本,K为构成梯度提升树模型的树的个数,fi为对应的第i树的结构q以及对应的叶子节点的权重w,F为表征决策树的函数空间的一个泛函,w为对应的叶子节点的权重,为树结构,T为一个决策树的叶子结点的数目,R为w的样本空间。
在通过XGBoost算法进行训练后,可以得到对应的商业兴趣分类标签的相关度分值,然而由于训练集中的曝光于点击样本成非平衡分布,最终预测的兴趣得分是一个非常小的浮点值。为了满足人为直观的表示,我们将得分归一化到0~1之间。便于最终的人群划分。
在完成了归一化后,可以得到每个商业兴趣分类标签对应的相关度分值,此时从表1中可以看出,商业兴趣人群目标是对应商业兴趣分类标签下的对象,在这些对象中,并不是所有商业兴趣分类标签对应的对象都是具有信息推送价值的商业兴趣人群目标,而是达到信息推送条件的商业兴趣分类标签下的对象才算目标人群,本实施例中,信息推送条件为CTR(点击通过率)表现在验证数据集上提升20%,在实际应用中可以根据实际情况对信息推送条件进行修改,并不局限于20%这个值。
实施例2
本实施例中的基于商业兴趣的目标人群确定方法与实施例1中的方法基本相同,区别在于本实施例中在确定了商业兴趣人群目标后,会对商业兴趣人群目标进行信息推送,完整的流程如图3所示,从图3中可以看出,在完成了上面确定商业兴趣人群目标的寻找过程后,还会按照CTR提升一级人群大小要求划分用户群,即在满足CTR在验证数据集上提升20%后,还会对商业兴趣人群目标中的人群数量进行判断,如果人群数量超过了设定阈值,此时***会自动向商业兴趣人群目标们推送信息,这样可以大大提升商业兴趣人群目标信息推送的自动化程度。本实施例中的设定阈值设置为50万,当然也可以根据实际情况灵活调整此阈值。如果商业兴趣人群目标未达到阈值,此时***不会自动推送信息。但是用户可以通过指定人群标签(关键词)的方式进行定向投放,保证对目标人群的触达。
实施例3
本实施例基于实施例1中具体阐述的基于商业兴趣的目标人群确定方法,描述了在发布吸尘器广告时,如何找到目标人群的过程,具体过程如下:首先由广告投放人员对创意进行三级创意分类的标注,针对于吸尘器的标注具体为:家用电器-生活电器-吸尘器。
在确定了吸尘器具体的创意分类标注后,由于创意分类的标注为三级,而前两级对应的就是该创意分类所属的商业标签的所属类别,因此可确定吸尘器所在的商业标签为家用电器-生活电器,因此拉取生活电器对应的历史用户的广告点击曝光日志,进行样本划分,其中被点击的日志标定为正样本,曝光未点击的日志标定为负样本,同时对未登录用户的日志进行过滤;除了划分样本,还要进行特征提取,具体是根据用户最近一个月的搜索、播放、分享、收藏和投币等行为,提取用户对应的标签特征,并对特征编号从而构造特征字典。在特征字典构造好后将划分的样本和标签特征进行关联,从而构造出训练数据。
在训练数据达到一定值时,利用实施例1中的训练过程进行训练,本实施例中具体为:在生活电器这一标签下拉取的创意,往前追溯有数据的11天内(日期可以不连续)累计广告曝光量达到250万时,触发对生活电器这一标签的训练。
训练完成后,针对于生活电器这一商业兴趣下的各个创意分类,即吸尘器、电热毯、电风扇、加湿器、暖风机/取暖器这些创意分类分别得到对应的相关度分值,根据相关度分值的倒序将这些创意分类标签进行排序,并分别通过验证数据集,利用上述的训练过程中涉及到的算法进行验证,如果验证结果中点击通过率的提升程度达到20%,则说明该创意分类标签下对应的对象为吸尘器广告推送的目标人群,此时服务器可以进行进一步判断,如果当前创意分类标签下对应的目标人群数量超过50万,则服务器可以自动向该这些目标人群推送吸尘器广告,否则用户则可以手动选择是否向确定的目标人群推送吸尘器广告。
在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以做出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。

Claims (20)

1.一种基于商业兴趣的目标人群确定方法,其特征在于,所述的方法包括以下步骤:
(1)对已有的商业兴趣分类标签进一步分类标注,得到创意分类标签;
(2)根据所述的创意分类标签,获取训练数据并进行机器学习,得到基于所述的商业兴趣分类标签的相关度分值;
(3)根据所述的相关度分值,确定具有信息推送价值的目标人群。
2.根据权利要求1所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(1)具体为:根据已有的商业兴趣分类标签的结构类型,按照相应的创意分类内容进行结构延伸和类目划分,得到创意分类标签。
3.根据权利要求2所述基于商业兴趣的目标人群确定方法,其特征在于,所述商业兴趣分类标签为二级结构,所述创意分类标签为三级结构,所述创意分类标签的上二级结构与商业兴趣分类标签一致。
4.根据权利要求1所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(2)具体包括以下步骤:
(21)根据所述的创意分类标签,获取历史用户的操作日志;
(22)根据所述的操作日志,得到训练数据;
(23)根据所述的训练数据进行机器学习,得到基于所述的创意分类标签对应的商业兴趣分类标签的相关度分值。
5.根据权利要求4所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(22)具体包括以下步骤:
(221)根据所述的操作日志,通过样本划分得到用于机器学习的样本数据;
(222)根据所述的操作日志,提取分类特征,构造特征字典;
(223)将所述的样本数据与所述的分类特征进行关联,得到所述的训练数据。
6.根据权利要求5所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(221)具体为:遍历所述的操作日志,将其中被点击的广告日志确定为正样本,曝光未点击的广告日志确定为负样本,得到用于机器学习的样本数据。
7.根据权利要求6所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(221)还包括:将所述的操作日志中的异常数据进行清洗过滤。
8.根据权利要求5所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(222)具体为:根据所述的操作日志中的具体行为提取用户对应的分类特征,并对所述的分类特征进行编号,得到所述的特征字典。
9.根据权利要求8所述基于商业兴趣的目标人群确定方法,其特征在于,所述具体行为包括:搜索、播放、分享、收藏和投币。
10.根据权利要求4所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(23)具体包括以下步骤:
(231)判断所述的操作日志数量是否达到训练阈值,若是则进入步骤(232),若否则返回步骤(21);
(232)根据机器学习的需求,划分训练数据,得到训练集、测试集和验证集,并选择训练算法进行机器学习;
(233)将机器学习得到的分数结果通过归一化划分到0至1之间,得到基于所述的创意分类标签对应的商业兴趣分类标签的相关度分值。
11.根据权利要求10所述基于商业兴趣的目标人群确定方法,其特征在于,所述划分训练数据具体为:根据5折交叉验证的方式对训练数据进行划分。
12.根据权利要求10所述基于商业兴趣的目标人群确定方法,其特征在于,所述训练算法具体为XGBoost算法。
13.根据权利要求12所述基于商业兴趣的目标人群确定方法,其特征在于,所述XGBoost算法中梯度提升的具体公式为:
其中,h为预测值,为样本类别标签,为样本,K为构成梯度提升树模型的树的个数,fi为对应的第i树的结构q以及对应的叶子节点的权重w,F为表征决策树的函数空间的一个泛函,w为对应的叶子节点的权重,为树结构,T为一个决策树的叶子结点的数目,R为w的样本空间。
14.根据权利要求1所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(3)具体包括以下步骤:
(31)根据所述的相关度分值,将所述的商业兴趣分类标签进行倒序排序;
(32)根据排序结果,判断对应的商业兴趣分类标签是否达到信息推送条件,若是则表明该商业兴趣分类标签对应的对象为具有信息推送价值的目标人群。
15.根据权利要求14所述基于商业兴趣的目标人群确定方法,其特征在于,所述信息推送条件具体为:通过验证集进行验证后的点击通过率达到提升阈值。
16.一种基于商业兴趣向目标人群推送信息的方法,其特征在于,所述的方法包括以下步骤:
(a)一服务器利用权利要求1所述的基于商业兴趣的目标人群确定方法确定具有信息推送价值的目标人群;
(b)该服务器向所述的目标人群推送信息。
17.根据权利要求16所述基于商业兴趣向目标人群推送信息的方法,其特征在于,所述步骤(b)具体包括以下步骤:
(b1)该终端判断所述的目标人群是否达到自动推送信息的条件,若是自动向所述的目标人群推送信息,若否则进入步骤(b2);
(b2)在接收到用户的推送指令时,向所述的目标人群推送信息。
18.根据权利要求17所述基于商业兴趣向目标人群推送信息的方法,其特征在于,所述自动推送信息的条件具体为:所述的目标人群数量达到设定阈值。
19.一种服务器,包括处理器和存储器,所述的存储器上存储有计算机程序,其特征在于,该计算机程序被所述处理器执行时,实现权利要求1至15中任一项所述基于商业兴趣的目标人群确定方法。
20.一种基于商业兴趣向目标人群推送信息的***,其特征在于,所述***包括:
如权利要求19所述的服务器,用于确定基于商业兴趣的目标人群,并向所述的目标人群推送信息;
信息接收终端,用于接收所述的服务器推送的信息。
CN201811491017.6A 2018-12-06 2018-12-06 基于商业兴趣的目标人群确定及信息推送方法和*** Pending CN109597940A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811491017.6A CN109597940A (zh) 2018-12-06 2018-12-06 基于商业兴趣的目标人群确定及信息推送方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811491017.6A CN109597940A (zh) 2018-12-06 2018-12-06 基于商业兴趣的目标人群确定及信息推送方法和***

Publications (1)

Publication Number Publication Date
CN109597940A true CN109597940A (zh) 2019-04-09

Family

ID=65961411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811491017.6A Pending CN109597940A (zh) 2018-12-06 2018-12-06 基于商业兴趣的目标人群确定及信息推送方法和***

Country Status (1)

Country Link
CN (1) CN109597940A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070391A (zh) * 2019-04-17 2019-07-30 同盾控股有限公司 数据处理方法、装置、计算机可读介质及电子设备
CN110457576A (zh) * 2019-07-08 2019-11-15 深圳壹账通智能科技有限公司 账户分类方法、装置、计算机设备和存储介质
CN111368210A (zh) * 2020-05-27 2020-07-03 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置以及电子设备
CN113011922A (zh) * 2021-03-18 2021-06-22 北京百度网讯科技有限公司 相似人群的确定方法、装置、电子设备和存储介质
CN114117240A (zh) * 2021-12-09 2022-03-01 诸暨黑石大数据技术有限公司 基于大数据需求分析的互联网内容推送方法及ai***
CN115905702A (zh) * 2022-12-06 2023-04-04 鄄城县馨宁网络科技有限公司 基于用户需求分析的数据推荐方法及***
CN116800831A (zh) * 2023-06-25 2023-09-22 中国农业银行股份有限公司北京市分行 一种业务数据推送方法、装置、存储介质及处理器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012071696A1 (zh) * 2010-11-29 2012-06-07 华为技术有限公司 基于用户兴趣学习的个性化广告推送方法与***
CN108629608A (zh) * 2017-03-22 2018-10-09 腾讯科技(深圳)有限公司 用户数据处理方法及装置
CN108763314A (zh) * 2018-04-26 2018-11-06 深圳市腾讯计算机***有限公司 一种兴趣推荐方法、装置、服务器及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012071696A1 (zh) * 2010-11-29 2012-06-07 华为技术有限公司 基于用户兴趣学习的个性化广告推送方法与***
CN108629608A (zh) * 2017-03-22 2018-10-09 腾讯科技(深圳)有限公司 用户数据处理方法及装置
CN108763314A (zh) * 2018-04-26 2018-11-06 深圳市腾讯计算机***有限公司 一种兴趣推荐方法、装置、服务器及存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070391A (zh) * 2019-04-17 2019-07-30 同盾控股有限公司 数据处理方法、装置、计算机可读介质及电子设备
CN110457576A (zh) * 2019-07-08 2019-11-15 深圳壹账通智能科技有限公司 账户分类方法、装置、计算机设备和存储介质
CN111368210A (zh) * 2020-05-27 2020-07-03 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置以及电子设备
CN113011922A (zh) * 2021-03-18 2021-06-22 北京百度网讯科技有限公司 相似人群的确定方法、装置、电子设备和存储介质
CN113011922B (zh) * 2021-03-18 2023-08-04 北京百度网讯科技有限公司 相似人群的确定方法、装置、电子设备和存储介质
CN114117240A (zh) * 2021-12-09 2022-03-01 诸暨黑石大数据技术有限公司 基于大数据需求分析的互联网内容推送方法及ai***
CN115905702A (zh) * 2022-12-06 2023-04-04 鄄城县馨宁网络科技有限公司 基于用户需求分析的数据推荐方法及***
CN115905702B (zh) * 2022-12-06 2023-10-10 雨果跨境(厦门)科技有限公司 基于用户需求分析的数据推荐方法及***
CN116800831A (zh) * 2023-06-25 2023-09-22 中国农业银行股份有限公司北京市分行 一种业务数据推送方法、装置、存储介质及处理器

Similar Documents

Publication Publication Date Title
CN109597940A (zh) 基于商业兴趣的目标人群确定及信息推送方法和***
Freyne et al. Recipe recommendation: accuracy and reasoning
Ge et al. Using tags and latent factors in a food recommender system
Hartmann et al. Consumer perception and behaviour regarding sustainable protein consumption: A systematic review
McAuley et al. Hidden factors and hidden topics: understanding rating dimensions with review text
Mathys et al. What drives the market popularity of celebrities? A longitudinal analysis of consumer interest in film stars
Freyne et al. Intelligent food planning: personalized recipe recommendation
CN107391582B (zh) 基于上下文本体树计算用户偏好相似度的信息推荐方法
CN112288517A (zh) 结合rpa与ai的商品推荐方法和装置
CN110223757A (zh) 食谱方案的推荐方法、装置、介质、电子设备
Rokicki et al. Plate and prejudice: Gender differences in online cooking
TW200926020A (en) Personalized meal planning method and system thereof
CN109509117A (zh) 一种菜品推荐方法、装置及***
CN109191242A (zh) 餐品推送方法及装置
Lobo et al. Marketing of organic food in urban China: An analysis of consumers’ lifestyle segments
KR102657384B1 (ko) 개인 선호 기반의 식이 구성 및 추천 방법
Barbosa Escobar et al. Crossmodal associations between visual textures and temperature concepts
Cui et al. The impact of Internet access on household dietary quality: Evidence from rural China
US20220293238A1 (en) Proposal system, proposal method, and program
JP6211683B2 (ja) 購買履歴分類システム及び購買履歴分類方法
CN113158036A (zh) 一种自动化食谱推荐方法、装置、终端及存储介质
KR102095592B1 (ko) 서바이벌 게임을 이용한 끼니별 음식메뉴 선택 서비스 제공 방법
Yu et al. Do good recipes need butter? Predicting user ratings of online recipes
Hobbs et al. Analysis of consumer perception of product attributes in pet food: implications for marketing and brand strategy
Ajami et al. A Food Recommender System in Academic Environments Based on Machine Learning Models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190926

Address after: 201203 Shanghai City, Pudong New Area China (Shanghai) free trade zone 2277 Zuchongzhi Road No. 1 Lane 905, room 906

Applicant after: SHANGHAI HUANDIAN INFORMATION TECHNOLOGY CO., LTD.

Address before: Room 1641, room 1945, Siping Road, Yangpu District, Shanghai

Applicant before: Shanghai beep Technology Co., Ltd.

TA01 Transfer of patent application right