CN111126614A - 归因方法、装置及存储介质 - Google Patents

归因方法、装置及存储介质 Download PDF

Info

Publication number
CN111126614A
CN111126614A CN201811293288.0A CN201811293288A CN111126614A CN 111126614 A CN111126614 A CN 111126614A CN 201811293288 A CN201811293288 A CN 201811293288A CN 111126614 A CN111126614 A CN 111126614A
Authority
CN
China
Prior art keywords
channels
channel
target
training set
paths
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811293288.0A
Other languages
English (en)
Other versions
CN111126614B (zh
Inventor
王晓元
叶峻
沈璠
周振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811293288.0A priority Critical patent/CN111126614B/zh
Publication of CN111126614A publication Critical patent/CN111126614A/zh
Application granted granted Critical
Publication of CN111126614B publication Critical patent/CN111126614B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种归因方法、装置及存储介质。该方法包括:确定目标渠道的标识;将所述目标渠道的标识输入至机器学习模型,得到所述目标渠道的特征权重,所述特征权重用于表示所述目标渠道的归因结果;其中,所述机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型。本发明提高了归因结果的准确性。

Description

归因方法、装置及存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种归因方法、装置及存储介质。
背景技术
在信息投放领域,信息通常可以通过多种渠道进行投放。
现有技术中,通过多种渠道对信息进行投放时,需要确定不同投放渠道的归因结果,即不同投放渠道对于信息的转化的贡献程度。这里,转化例如可以为下载、咨询、购买等。目前,在确定多种渠道中各渠道的归因结果时,只考虑发生了转化的用户浏览路径(即,转化路径)道,而未考虑未发生转化的用户浏览路径(即,未转化路径)。
因此,现有技术中,存在归因结果不准确的问题。
发明内容
本发明实施例提供一种归因方法、装置及存储介质,用以解决现有技术中归因结果不准确的问题。
第一方面,本发明提供一种归因方法,包括:
确定目标渠道的标识;
将所述目标渠道的标识输入至机器学习模型,得到所述目标渠道的特征权重,所述特征权重用于表示所述目标渠道的归因结果;
其中,所述机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型。
在一种可能的实现中,所述方法还包括:根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,并根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例;
根据所述训练集合对机器学习模型进行训练。
在一种可能的实现中,所述根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,包括:
随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例。
在一种可能的实现中,所述特定数量为预设的数量,或者,所述特定数量根据所述正例中的渠道总数确定。
在一种可能的实现中,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:
随机抽取所述目标时长范围内所有未转化路径的最后一个渠道中特定数量的渠道作为所述训练集合的负例。
所述根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例,包括:
将所述目标时长范围内所有转化路径的最后一个渠道均作为所述训练集合的正例。
在一种可能的实现中,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:
随机抽取所述目标时长范围内所有未转化路径的全部渠道中特定数量的渠道作为所述训练集合的负例。
所述根据所述目标时长范围内转化路径中的渠道确定所述训练集合中的正例,包括:
将所述目标时长范围内所有转化路径的全部渠道均作为所述训练集合的正例。
在一种可能的实现中,所述方法还包括:
根据特征权重的数值范围与归因结果的数值范围的关系,对所述目标渠道的所述特征权重进行范围转换,得到所述目标渠道的归因结果。
第二方面,本发明提供一种归因装置,包括:
确定模块,用于确定目标渠道的标识;
得到模块,用于将所述确定模块确定的所述目标渠道的标识输入至机器学习模型,得到所述目标渠道的特征权重,所述特征权重用于表示所述目标渠道的归因结果;
其中,所述机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型。
在一种可能的实现中,所述装置还包括训练模块,用于:
根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,并根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例;
根据所述训练集合对机器学习模型进行训练。
在一种可能的实现中,所述训练模块用于根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,具体包括:
随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例。
在一种可能的实现中,所述特定数量为预设的数量,或者,所述特定数量根据所述正例中的渠道总数确定。
在一种可能的实现中,所述训练模块用于随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,具体包括:
随机抽取所述目标时长范围内所有未转化路径的最后一个渠道中特定数量的渠道作为所述训练集合的负例。
所述训练模块用于根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例,具体包括:
将所述目标时长范围内所有转化路径的最后一个渠道均作为所述训练集合的正例。
在一种可能的实现中,所述训练模块用于随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,具体包括:
随机抽取所述目标时长范围内所有未转化路径的全部渠道中特定数量的渠道作为所述训练集合的负例。
所述训练模块用于根据所述目标时长范围内转化路径中的渠道确定所述训练集合中的正例,具体包括:
将所述目标时长范围内所有转化路径的全部渠道均作为所述训练集合的正例。
在一种可能的实现中,所述装置还包括:转换模块,用于根据特征权重的数值范围与归因结果的数值范围的关系,对所述目标渠道的所述特征权重进行范围转换,得到所述目标渠道的归因结果。
第三方面,本发明提供一种归因装置,包括:
处理器以及用于存储计算机指令的存储器;所述处理器运行所述计算机指令执行上述第一方面任一项所述的方法。
第四方面,本发明提供一种计算机可读存储介质,当所述存储介质中的指令由归因装置的处理器执行时,使得归因装置能够执行上述第一方面任一项所述的方法。
本发明提供的归因方法、装置及存储介质,通过确定目标渠道的标识,并将目标渠道的标识输入至机器学习模型,得到目标渠道的特征权重,特征权重用于表示目标渠道的归因结果,其中,机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型,实现了在确定渠道的归因结果时可以考虑转化路径和未转化路径中的渠道,避免了只考虑转化路径中的该渠道,所确定的归因结果只体现通过该渠道获得信息并发生信息转化的用户的数量,而无法体现通过该渠道获得信息并发生信息转化的用户数占通过该渠道获得信息的用户数的占比,从而导致归因结果不准确的问题,提高了归因结果的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的归因方法的应用场景示意图;
图2为本发明实施例提供的归因方法实施例一的流程示意图;
图3为本发明实施例提供的归因方法实施例二的流程示意图;
图4为本发明实施例提供的归因方法实施例三的流程示意图;
图5为本发明实施例提供的归因装置的结构示意图;
图6为本发明实施例提供的归因装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的归因方法的应用场景示意图。如图1所示,该应用场景可以包括终端、服务器和归因装置。其中,信息投放方可以通过终端提供的不同渠道对同一推广主题的信息进行投放,这里,渠道具体是指信息的推广渠道,例如微信、微博、邮箱等均可以认为是推广渠道。需要说明的是,不同推广渠道对应同一推广主题的信息可以不同。
用户可以通过多个渠道获取到一个推广主题的信息,例如,用户在一段时间内可以先通过查看渠道1提供的该推广主题的信息获得,然后通过查看渠道2提供的该推广主题的信息获得,之后通过查看渠道3提供的该推广主题的信息获得。此时,渠道1->渠道2->渠道3可以认为是该段时间内的一条用户浏览路径,进一步的,当在渠道3中触发了信息转化时,渠道1->渠道2->渠道3可以认为是该段时间内的转化路径;当在渠道3中未触发信息转化时,渠道1->渠道2->渠道3可以认为是该段时间内的未转化路径。
这里,信息转化是指由信息所触发的能够给信息投放方带来相应价值的转化行为。例如,对于电子商务网站的卖家来说,转化行为可能是指成交;对于致力于推广应用程序的广告主来说,转化行为可能是指下载;而对于某些咨询类公司而言,转化行为则可能是指咨询。
其中,服务器可以收集用户查看不同渠道提供的信息的事件。进一步的,可以基于服务器收集的一段时间内用户查看不同渠道提供的信息的事件,确定该段时间内未转化路径以及转化路径中的渠道。其中,该段时间内未转化路径以及转化路径中的渠道,具体可以为该段时间内一个信息投放方所投放的一个或多个推广主题的信息的未转化路径以及转化路径中的渠道。
其中,归因装置可以基于该段时间内未转化路径以及转化路径中的渠道,训练得到能够用于根据渠道的标识,得到渠道的特征权重的机器学习模型,渠道的特征权重可以表示渠道的归因结果。进一步的,可以由归因装置确定待确定归因结果的渠道(即目标渠道)的标识,并将目标渠道的标识输入至机器学习模型,从而得到目标渠道的特征权重。
需要说明的是,图1中以由归因装置对机器学习模型进行训练为例,也可以不由归因装置对机器学习模型进行训练。
需要说明的是,用户查看不同渠道提供的信息的事件,可以由同一个服务器收集,也可以由不同服务器收集,本发明对此不作限定。
图2为本发明实施例提供的归因方法实施例一的流程示意图。如图2所示,本实施例的方法可以包括:
步骤201,确定目标渠道的标识。
本步骤中,所述目标渠道具体可以是指待确定归因结果的渠道。所述目标渠道的标识例如可以为目标渠道的名称。可选的,可以通过用户输入确定目标渠道的标识,例如,用户可以输入目标渠道的标识,或者用户可以选择目标渠道;或者,可以从其他设备获得目标渠道的标识,例如,接收其他设备发送的目标渠道的标识。
步骤202,将所述目标渠道的标识输入至机器学习模型,得到所述目标渠道的特征权重,所述特征权重用于表示所述目标渠道的归因结果。
本步骤中,所述机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型。可选的,目标时长范围具体可以标识最近一段时长范围内,例如最近10天,最近一个月等。由于机器学习模型为根据目标时长范围内未转化路径中的渠道以及转化路径中的渠道进行训练得到的模型,使得模型可以学习到根据渠道的标识,确定渠道的特征权重的能力。可选的,所述机器学习模型具体可以为(Neural Network,NN)神经网络模型,例如卷积神经网络(Convolutional Neural Network,CNN)模型。
这里,由于机器学习模型时根据目标范围内未转化路径中的渠道以及转化路径中的渠道进行训练得到的模型,因此训练好的所述机器学习模型,得到的渠道的特征权重所表示的渠道的归因结果,可以考虑未转化路径中的渠道。
由于信息投放方通常是针对用户通过一个渠道获得该信息投放方投放的信息的行为来付费,因此基于投资回报率的考虑,在确定一个渠道的归因结果时,不仅需要考虑转化路径中的该渠道,而且还需要考虑非转化路径中的该渠道。
如果在确定归因结果时仅考虑转化路径中的该渠道,而没有考虑非转化路径中的该渠道,则只是考虑了信息投放方对于该渠道信息投放的部分投资,该部分投资为转化路径该渠道的投资,而未考虑信息投放方对于该渠道投放的其他部分投资,该其他部分投资为未转化路径该渠道的投资,因此归因结果不准确。可以看出,如果只考虑转化路径中的该渠道,所确定的归因结果只体现通过该渠道获得信息并发生信息转化的用户的数量,而无法体现通过该渠道获得信息并发生信息转化的用户数占通过该渠道获得信息的用户数的占比。例如,假设转化路径中包括渠道1的次数是4,渠道2的次数是5,非转化路径中包括渠道1的次数是2,渠道2的次数也是5,如果只考虑转化路径则渠道2对于信息转化的贡献程度肯定大于渠道1,如果考虑转化路径和非转化路径则渠道2对于信息转化的贡献程度不一定大于渠道1。例如,假设渠道的归因结果越大表示贡献程度越大,且渠道的归因结果等于转换路径中的次数减去0.5倍的非转化路径中的次数,则渠道1的归因结果等于3,渠道2的归因结果等于2.5。
本实施例提供的归因方法,通过确定目标渠道的标识,并将目标渠道的标识输入至机器学习模型,得到目标渠道的特征权重,特征权重用于表示目标渠道的归因结果,其中,机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型,实现了在确定渠道的归因结果时可以考虑转化路径和未转化路径中的渠道,避免了只考虑转化路径中的该渠道,所确定的归因结果只体现通过该渠道获得信息并发生信息转化的用户的数量,而无法体现通过该渠道获得信息并发生信息转化的用户数占通过该渠道获得信息的用户数的占比,从而导致归因结果不准确的问题,提高了归因结果的准确性。
图3为本发明实施例提供的归因方法实施例二的流程示意图。本实施例在图2所示实施例的基础上主要描述了对机器学习模型进行训练的一种可选的实现方式。如图3所示,本实施例的方法可以包括:
步骤301,根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例。
本步骤中,负例也可以称为负样本(negative samples)。可选的,可以将所述目标时长范围内未转化路径中的渠道作为训练集合中的负例。
考虑到可以为信息投资方投放信息带来相应价值的是信息转化,因此为了避免负例过多,导致占比在确定归因结果时的重要性过大,从而导致无法突出信息转化为投资方带来的价值的问题,可以对负例的数量进行限制。因此,可选的,步骤301具体可以包括:随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例。可选的,所述特定数量为预设的数量;或者,所述特定数量根据所述训练集合中正例中的渠道总数确定,例如可以为该渠道总数的10%。
步骤302,根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例。
本步骤中,负例也可以称为负样本(positive samples)。可选的,可以将所述目标时长范围内转化路径中的渠道作为训练集合中的正例。
考虑到虽然转化路径中的渠道个数可以为多个,而触发信息转化的渠道通常为转换路径中的最后一个渠道。可选的,步骤302具体可以包括:将所述目标时长范围内所有转化路径的最后一个渠道均作为所述训练集合的正例。进一步的,为了确保负例与正例含义的一致性,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:随机抽取所述目标时长范围内所有未转化路径的最后一个渠道中特定数量的渠道作为所述训练集合的负例。
考虑到虽然转化路径中的渠道个数可以为多个,而用户第一次获得信息的渠道通常为转换路径中的第一个渠道。可选的,步骤302具体可以包括:将所述目标时长范围内所有转化路径的第一个渠道均作为所述训练集合的正例。进一步的,为了确保负例与正例含义的一致性,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:随机抽取所述目标时长范围内所有未转化路径的第一个渠道中特定数量的渠道作为所述训练集合的负例。
考虑到转化路径中的渠道个数可以为多个,用户通过转化路径中的多个渠道不断获得信息,最终触发了信息转化。可选的,步骤302具体可以包括:将所述目标时长范围内所有转化路径的全部渠道均作为所述训练集合的正例。进一步的,为了确保负例与正例含义的一致性,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:随机抽取所述目标时长范围内所有未转化路径的全部渠道中特定数量的渠道作为所述训练集合的负例。
可选的,所述目标渠道的特征权重即为所述目标渠道的归因结果。
需要说明的是,步骤302与步骤301之间没有先后顺序的限制。
步骤303,根据所述训练集合对机器学习模型进行训练。
本步骤中,由于正例是根据目标时长范围内转化路径中的渠道确定的,因此根据正例对机器学习模型进行训练后,训练好的机器学习模型可以考虑到通过一个渠道获得信息并发生信息转化的用户的数量对于该渠道的归因结果的正面影响,即通过一个渠道获得信息并发生信息转化的用户的数量越多,该渠道对于信息转化的贡献越大。
由于负例是根据目标时长范围内非转化路径中的渠道确定的,因此根据负例对机器学习模型进行训练后,训练好的机器学习模型可以考虑到一个渠道下通过一个渠道获得信息并发生信息转化的用户数占通过该渠道获得信息的用户数的占比对于该渠道的归因结果的负面影响,即通过一个渠道获得信息并发生信息转化的用户数占通过该渠道获得信息的用户数的占比越大,该渠道对于信息转化的贡献越小。
本实施例提供的归因方法,通过根据目标时长范围内未转化路径中的渠道确定训练集合中的负例,根据目标时长范围内转化路径中的渠道确定训练集合中的正例,并根据训练集合对机器学习模型进行训练,使得基于训练好的机器学习模型所确定的目标渠道的特征权重,可以考虑转化路径和未转化路径中的渠道,避免了只考虑转化路径中的该渠道,所确定的归因结果只体现通过该渠道获得信息并发生信息转化的用户的数量,而无法体现通过该渠道获得信息并发生信息转化的用户数占通过该渠道获得信息的用户数的占比,从而导致归因结果不准确的问题,提高了归因结果的准确性。
图4为本发明实施例提供的归因方法实施例三的流程示意图。本实施例在图2所示实施例的基础上主要描述了根据特征权重得到归因结果的一种可选的实现方式。如图4所示,本实施例的方法可以包括:
步骤401,确定目标渠道的标识。
需要说明的是,步骤401与步骤201类似,在此不再赘述。
步骤402,将所述目标渠道的标识输入至机器学习模型,得到所述目标渠道的特征权重,所述特征权重用于表示所述目标渠道的归因结果。
其中,所述机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型。
需要说明的是,步骤402与步骤202类似,在此不再赘述。
步骤403,根据特征权重的数值范围与归因结果的数值范围的关系,对所述目标渠道的所述特征权重进行范围转换,得到所述目标渠道的归因结果。
本步骤中,当目标渠道的特征权重不能直接作为目标渠道的归因结果时,可以对目标渠道的特征权重进行范围转换,得到目标渠道的归因结果。例如,假设特征权重的数值范围为0至1,归因结果的数值范围为0-100,则可以将目标渠道的特征权重乘以100得到的结果,作为目标渠道的归因结果。
本实施例提供的归因方法,通过根据特征权重的数值范围与归因结果的数值范围的关系,对所述目标渠道的所述特征权重进行范围转换,得到所述目标渠道的归因结果,实现了当目标渠道的特征权重不能直接作为目标渠道的归因结果时,根据目标渠道的特征权重确定目标渠道的归因结果。
图5为本发明实施例提供的归因装置的结构示意图,本实施例提供的装置可以应用于上述方法实施例中。如图5所示,本实施例的装置可以包括:确定模块51和得到模块52。其中,
确定模块51,用于确定目标渠道的标识;
得到模块52,用于将确定模块51确定的所述目标渠道的标识输入至机器学习模型,得到所述目标渠道的特征权重,所述特征权重用于表示所述目标渠道的归因结果;
其中,所述机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型。
在一种可能的实现中,该装置还包括训练模块53,用于:
根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,并根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例;
根据所述训练集合对机器学习模型进行训练。
在一种可能的实现中,训练模块53用于根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,具体包括:
随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例。
在一种可能的实现中,所述特定数量为预设的数量,或者,所述特定数量根据所述正例中的渠道总数确定。
在一种可能的实现中,训练模块53用于随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,具体包括:
随机抽取所述目标时长范围内所有未转化路径的最后一个渠道中特定数量的渠道作为所述训练集合的负例。
训练模块53用于根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例,具体包括:
将所述目标时长范围内所有转化路径的最后一个渠道均作为所述训练集合的正例。
在一种可能的实现中,训练模块53用于随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,具体包括:
随机抽取所述目标时长范围内所有未转化路径的全部渠道中特定数量的渠道作为所述训练集合的负例。
训练模块53用于根据所述目标时长范围内转化路径中的渠道确定所述训练集合中的正例,具体包括:
将所述目标时长范围内所有转化路径的全部渠道均作为所述训练集合的正例。
在一种可能的实现中,该装置还包括:转换模块54,用于根据特征权重的数值范围与归因结果的数值范围的关系,对所述目标渠道的所述特征权重进行范围转换,得到所述目标渠道的归因结果。
本实施例的装置,可以用于执行上述方法所示实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图6为本发明实施例提供的归因装置的结构示意图,如图6所示,该归因装置可以包括:处理器61以及用于存储计算机指令的存储器62。
其中,处理器61运行该计算机指令执行以下方法:
确定目标渠道的标识;
将所述目标渠道的标识输入至机器学习模型,得到所述目标渠道的特征权重,所述特征权重用于表示所述目标渠道的归因结果;
其中,所述机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型。
在一种可能的实现中,所述方法还包括:根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,并根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例;
根据所述训练集合对机器学习模型进行训练。
在一种可能的实现中,所述根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,包括:
随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例。
在一种可能的实现中,所述特定数量为预设的数量,或者,所述特定数量根据所述正例中的渠道总数确定。
在一种可能的实现中,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:
随机抽取所述目标时长范围内所有未转化路径的最后一个渠道中特定数量的渠道作为所述训练集合的负例。
所述根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例,包括:
将所述目标时长范围内所有转化路径的最后一个渠道均作为所述训练集合的正例。
在一种可能的实现中,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:
随机抽取所述目标时长范围内所有未转化路径的全部渠道中特定数量的渠道作为所述训练集合的负例。
所述根据所述目标时长范围内转化路径中的渠道确定所述训练集合中的正例,包括:
将所述目标时长范围内所有转化路径的全部渠道均作为所述训练集合的正例。
在一种可能的实现中,所述方法还包括:
根据特征权重的数值范围与归因结果的数值范围的关系,对所述目标渠道的所述特征权重进行范围转换,得到所述目标渠道的归因结果。
本发明实施例还提供一种计算机可读存储介质,当该存储介质中的指令由归因装置的处理器执行时,使得归因装置能够执行一种归因方法,该方法包括:
确定目标渠道的标识;
将所述目标渠道的标识输入至机器学习模型,得到所述目标渠道的特征权重,所述特征权重用于表示所述目标渠道的归因结果;
其中,所述机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型。
在一种可能的实现中,所述方法还包括:根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,并根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例;
根据所述训练集合对机器学习模型进行训练。
在一种可能的实现中,所述根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,包括:
随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例。
在一种可能的实现中,所述特定数量为预设的数量,或者,所述特定数量根据所述正例中的渠道总数确定。
在一种可能的实现中,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:
随机抽取所述目标时长范围内所有未转化路径的最后一个渠道中特定数量的渠道作为所述训练集合的负例。
所述根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例,包括:
将所述目标时长范围内所有转化路径的最后一个渠道均作为所述训练集合的正例。
在一种可能的实现中,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:
随机抽取所述目标时长范围内所有未转化路径的全部渠道中特定数量的渠道作为所述训练集合的负例。
所述根据所述目标时长范围内转化路径中的渠道确定所述训练集合中的正例,包括:
将所述目标时长范围内所有转化路径的全部渠道均作为所述训练集合的正例。
在一种可能的实现中,所述方法还包括:
根据特征权重的数值范围与归因结果的数值范围的关系,对所述目标渠道的所述特征权重进行范围转换,得到所述目标渠道的归因结果。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种归因方法,其特征在于,包括:
确定目标渠道的标识;
将所述目标渠道的标识输入至机器学习模型,得到所述目标渠道的特征权重,所述特征权重用于表示所述目标渠道的归因结果;
其中,所述机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,并根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例;
根据所述训练集合对机器学习模型进行训练。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标时长范围内未转化路径中的渠道确定训练集合中的负例,包括:
随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例。
4.根据权利要求3所述的方法,其特征在于,所述特定数量为预设的数量,或者,所述特定数量根据所述正例中的渠道总数确定。
5.根据权利要求3或4所述的方法,其特征在于,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:
随机抽取所述目标时长范围内所有未转化路径的最后一个渠道中特定数量的渠道作为所述训练集合的负例;
所述根据所述目标时长范围内转化路径中的渠道确定训练集合中的正例,包括:
将所述目标时长范围内所有转化路径的最后一个渠道均作为所述训练集合的正例。
6.根据权利要求3或4所述的方法,其特征在于,所述随机抽取所述目标时长范围内未转化路径中特定数量的渠道作为所述训练集合中的负例,包括:
随机抽取所述目标时长范围内所有未转化路径的全部渠道中特定数量的渠道作为所述训练集合的负例;
所述根据所述目标时长范围内转化路径中的渠道确定所述训练集合中的正例,包括:
将所述目标时长范围内所有转化路径的全部渠道均作为所述训练集合的正例。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据特征权重的数值范围与归因结果的数值范围的关系,对所述目标渠道的所述特征权重进行范围转换,得到所述目标渠道的归因结果。
8.一种归因装置,其特征在于,包括:
确定模块,用于确定目标渠道的标识;
得到模块,用于将所述确定模块确定的所述目标渠道的标识输入至机器学习模型,得到所述目标渠道的特征权重,所述特征权重用于表示所述目标渠道的归因结果;
其中,所述机器学习模型为根据目标时长范围内未转化路径以及转化路径中的渠道进行训练得到的模型。
9.一种归因装置,其特征在于,包括:
处理器以及用于存储计算机指令的存储器;所述处理器运行所述计算机指令执行权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由归因装置的处理器执行时,使得归因装置能够执行权利要求1-7任一项所述的方法。
CN201811293288.0A 2018-11-01 2018-11-01 归因方法、装置及存储介质 Active CN111126614B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811293288.0A CN111126614B (zh) 2018-11-01 2018-11-01 归因方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811293288.0A CN111126614B (zh) 2018-11-01 2018-11-01 归因方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111126614A true CN111126614A (zh) 2020-05-08
CN111126614B CN111126614B (zh) 2024-01-16

Family

ID=70494171

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811293288.0A Active CN111126614B (zh) 2018-11-01 2018-11-01 归因方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111126614B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200618A (zh) * 2020-10-29 2021-01-08 上海优扬新媒信息技术有限公司 消息渠道归因方法、装置及***

Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030025696A1 (en) * 1999-12-22 2003-02-06 Mulgan Nicholas John Method and system for generating a graphical representation
CN103562946A (zh) * 2011-05-27 2014-02-05 谷歌公司 对于广告开支回报的多个归因模型
CN103605745A (zh) * 2013-11-20 2014-02-26 北京国双科技有限公司 转化路径的处理方法、装置及***
CN103733217A (zh) * 2011-04-11 2014-04-16 谷歌公司 用图说明跨渠道转化路径
CN104133837A (zh) * 2014-06-24 2014-11-05 上海交通大学 一种基于分布式计算的互联网信息投放渠道优化***
CN105069654A (zh) * 2015-08-07 2015-11-18 新一站保险代理有限公司 一种基于用户识别的网站实时/非实时营销投放方法及***
CN105160545A (zh) * 2015-08-07 2015-12-16 百度在线网络技术(北京)有限公司 投放信息样式确定方法及装置
CN105408891A (zh) * 2013-06-03 2016-03-16 机械地带有限公司 用于多用户多语言通信的***和方法
CN105447730A (zh) * 2015-12-25 2016-03-30 腾讯科技(深圳)有限公司 目标用户定向方法及装置
CN105960656A (zh) * 2013-12-05 2016-09-21 谷歌公司 用于创建用于向多个事件分配归因得分的数据驱动归因模型的方法和***
CN106529721A (zh) * 2016-11-08 2017-03-22 安徽大学 一种深度特征提取的广告点击率预测***及其预测方法
US20170213237A1 (en) * 2016-01-25 2017-07-27 Adobe Systems Incorporated Simulation-based evaluation of a marketing channel attribution model
CN107346496A (zh) * 2016-05-05 2017-11-14 腾讯科技(北京)有限公司 目标用户定向方法及装置
DE102016210886A1 (de) * 2016-06-17 2017-12-21 Robert Bosch Gmbh Konzept zum Steuern eines Verkehrs innerhalb eines Parkplatzes
CN107563781A (zh) * 2016-06-30 2018-01-09 阿里巴巴集团控股有限公司 一种信息投放效果归因方法及装置
CN107741967A (zh) * 2017-10-09 2018-02-27 北京京东尚科信息技术有限公司 用于行为数据处理的方法、装置以及电子设备
CN108171528A (zh) * 2016-12-07 2018-06-15 阿里巴巴集团控股有限公司 一种归因方法及归因***
CN108280670A (zh) * 2017-01-06 2018-07-13 腾讯科技(深圳)有限公司 种子人群扩散方法、装置以及信息投放***
CN108320170A (zh) * 2017-01-16 2018-07-24 北京京东尚科信息技术有限公司 提高购物车中的物品的转化率的方法、装置和电子装置
US20180260715A1 (en) * 2017-03-09 2018-09-13 Adobe Systems Incorporated Determining algorithmic multi-channel media attribution based on discrete-time survival modeling
CN108564398A (zh) * 2018-03-29 2018-09-21 北京酷云互动科技有限公司 一种渠道广告转化率的评估方法、***和存储介质

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030025696A1 (en) * 1999-12-22 2003-02-06 Mulgan Nicholas John Method and system for generating a graphical representation
CN103733217A (zh) * 2011-04-11 2014-04-16 谷歌公司 用图说明跨渠道转化路径
CN103562946A (zh) * 2011-05-27 2014-02-05 谷歌公司 对于广告开支回报的多个归因模型
CN105408891A (zh) * 2013-06-03 2016-03-16 机械地带有限公司 用于多用户多语言通信的***和方法
CN103605745A (zh) * 2013-11-20 2014-02-26 北京国双科技有限公司 转化路径的处理方法、装置及***
CN105960656A (zh) * 2013-12-05 2016-09-21 谷歌公司 用于创建用于向多个事件分配归因得分的数据驱动归因模型的方法和***
CN104133837A (zh) * 2014-06-24 2014-11-05 上海交通大学 一种基于分布式计算的互联网信息投放渠道优化***
CN105160545A (zh) * 2015-08-07 2015-12-16 百度在线网络技术(北京)有限公司 投放信息样式确定方法及装置
CN105069654A (zh) * 2015-08-07 2015-11-18 新一站保险代理有限公司 一种基于用户识别的网站实时/非实时营销投放方法及***
CN105447730A (zh) * 2015-12-25 2016-03-30 腾讯科技(深圳)有限公司 目标用户定向方法及装置
US20170213237A1 (en) * 2016-01-25 2017-07-27 Adobe Systems Incorporated Simulation-based evaluation of a marketing channel attribution model
CN107346496A (zh) * 2016-05-05 2017-11-14 腾讯科技(北京)有限公司 目标用户定向方法及装置
DE102016210886A1 (de) * 2016-06-17 2017-12-21 Robert Bosch Gmbh Konzept zum Steuern eines Verkehrs innerhalb eines Parkplatzes
CN107563781A (zh) * 2016-06-30 2018-01-09 阿里巴巴集团控股有限公司 一种信息投放效果归因方法及装置
CN106529721A (zh) * 2016-11-08 2017-03-22 安徽大学 一种深度特征提取的广告点击率预测***及其预测方法
CN108171528A (zh) * 2016-12-07 2018-06-15 阿里巴巴集团控股有限公司 一种归因方法及归因***
CN108280670A (zh) * 2017-01-06 2018-07-13 腾讯科技(深圳)有限公司 种子人群扩散方法、装置以及信息投放***
CN108320170A (zh) * 2017-01-16 2018-07-24 北京京东尚科信息技术有限公司 提高购物车中的物品的转化率的方法、装置和电子装置
US20180260715A1 (en) * 2017-03-09 2018-09-13 Adobe Systems Incorporated Determining algorithmic multi-channel media attribution based on discrete-time survival modeling
CN107741967A (zh) * 2017-10-09 2018-02-27 北京京东尚科信息技术有限公司 用于行为数据处理的方法、装置以及电子设备
CN108564398A (zh) * 2018-03-29 2018-09-21 北京酷云互动科技有限公司 一种渠道广告转化率的评估方法、***和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蔡丽华;黄婷;蔡丽平;: "用户电子服务渠道偏好研究与应用", 中国电力企业管理, no. 26, pages 61 - 63 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200618A (zh) * 2020-10-29 2021-01-08 上海优扬新媒信息技术有限公司 消息渠道归因方法、装置及***

Also Published As

Publication number Publication date
CN111126614B (zh) 2024-01-16

Similar Documents

Publication Publication Date Title
CN105373887B (zh) 一种终端应用的质量评估方法和***
CN110580282B (zh) 通过仿真用户与客服交互的方法及装置
JP2018503158A (ja) ソーシャルプラットフォームに基づくデータマイニング方法及び装置
US10699297B2 (en) Method, system and software product for optimizing the delivery of content to a candidate
CN103647800A (zh) 推荐应用资源的方法及***
CN109040852A (zh) 一种弹幕筛选方法及装置
US11226991B2 (en) Interest tag determining method, computer device, and storage medium
CN107330718B (zh) 一种媒体反作弊方法及装置、存储介质、终端
CN104320682B (zh) 一种制订任务点播方法及***、相关设备
CN109067637A (zh) 网络信息安全意识教育方法及装置、存储介质
CN111615680A (zh) 在线小配件推荐***和方法
CN112765364A (zh) 群聊会话排序方法、装置、存储介质和电子设备
CN113055751B (zh) 数据处理方法、装置、电子设备和存储介质
CN111126614A (zh) 归因方法、装置及存储介质
CN105740276B (zh) 适用于商业化搜索的点击反馈模型的估算方法和装置
CN109558542A (zh) 一种信息质量评估方法、信息推送方法及装置
CN110222297B (zh) 一种标签用户的识别方法以及相关设备
CN108229993B (zh) 一种数据处理的方法及装置
CN113076450B (zh) 一种目标推荐列表的确定方法和装置
CN109413459B (zh) 一种直播平台中用户的推荐方法以及相关设备
CN106971306B (zh) 产品问题的识别方法及***
CN114429362A (zh) 广告产品投放方法及装置、电子设备及可读存储介质
CN113723982B (zh) 广告对用户体验影响评估方法、装置、服务器及存储介质
CN108009168A (zh) 用户帐号识别方法及装置
TW202014953A (zh) 收款控制方法、裝置、伺服器及可讀儲存媒體

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant