CN110852793A - 文案推荐方法及装置、电子设备 - Google Patents

文案推荐方法及装置、电子设备 Download PDF

Info

Publication number
CN110852793A
CN110852793A CN201911033495.7A CN201911033495A CN110852793A CN 110852793 A CN110852793 A CN 110852793A CN 201911033495 A CN201911033495 A CN 201911033495A CN 110852793 A CN110852793 A CN 110852793A
Authority
CN
China
Prior art keywords
file
data
candidate
case
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911033495.7A
Other languages
English (en)
Inventor
赵阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shenyan Intelligent Technology Co ltd
Original Assignee
Beijing Shenyan Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shenyan Intelligent Technology Co ltd filed Critical Beijing Shenyan Intelligent Technology Co ltd
Priority to CN201911033495.7A priority Critical patent/CN110852793A/zh
Publication of CN110852793A publication Critical patent/CN110852793A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0276Advertisement creation

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种文案推荐方法及装置、电子设备。其中,该方法包括:获取候选文案集合,其中,候选文案集合中包含有多个待推荐的候选文案;确定每个候选文案的文案特征,并获取当前操作用户的用户特征;将文案特征和用户特征输入至文案预估模型进行分析,得到目标文案,其中,文案预估模型是通过多组特征数据和文案预估结果训练得到的,文案预估模型计算每个候选文案的预估点击率,并推送预估点击率最高的目标文案;将目标文案作为推荐结果推送给目标终端。本发明解决了相关技术中制作的广告文案并未考虑不同用户特征,导致用户对投放的广告兴趣下降,影响广告投放的效果的技术问题。

Description

文案推荐方法及装置、电子设备
技术领域
本发明涉及信息处理技术领域,具体而言,涉及一种文案推荐方法及装置、电子设备。
背景技术
相关技术中,在互联网广告投放中,广告文案的选择基本上是基于素材-文案或商品-文案的固定搭配,即通过文案素材库选取与文案主题对应的文案素材,然后制作出广告文案,或者通过待制作的文案所对应的商品确定出文案风格和文案内容。但是这种制作广告文案的方案方式,并未考虑到不同的人所感兴趣的语言风格或者词汇是不同的,影响了广告投放的效果。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种文案推荐方法及装置、电子设备,以至少解决相关技术中制作的广告文案并未考虑不同用户特征,导致用户对投放的广告兴趣下降,影响广告投放的效果的技术问题。
根据本发明实施例的一个方面,提供了一种文案推荐方法,包括:获取候选文案集合,其中,所述候选文案集合中包含有多个待推荐的候选文案;确定每个所述候选文案的文案特征,并获取当前操作用户的用户特征;将所述文案特征和所述用户特征输入至文案预估模型进行分析,得到目标文案,其中,所述文案预估模型是通过多组特征数据和文案预估结果训练得到的,所述文案预估模型计算每个所述候选文案的预估点击率,并推送预估点击率最高的目标文案;将所述目标文案作为推荐结果推送给目标终端。
可选地,在获取候选文案集合之前,所述文案推荐方法还包括:获取文案库中记载的历史文案;以所述文案库为语料库,利用词向量解析技术学习所述历史文案中的词向量,得到所述历史文案中的词到对应词向量的映射关系;确定词向量映射关系集合。
可选地,在获取候选文案集合之前,所述文案推荐方法还包括:提取历史广告投放数据和用户点击广告数据,并将所述历史广告投放数据作为训练样本数据,将所述用户点击广告数据作为样本结果数据;解析所述训练样本数据和所述样本结果数据,得到样本特征数据,并以所述样本特征数据训练所述文案预估模型。
可选地,所述样本特征数据至少包括:用户特征、文案特征,则解析所述训练样本数据和所述样本结果数据,得到样本特征数据的步骤,包括:分析用户注册信息、用户历史点击广告和用户历史访问行为,得到多个用户特征,所述用户特征包括下述至少之一:性别、年龄、常驻地、点击行为偏好、文案喜好类型;利用中文分词技术将所述训练样本数据中的历史广告投放数据的历史文案解析成词组;利用关键词提取技术提取所述词组中预设数量的关键词;基于词向量映射关系集合和提取的关键词,确定固定长度的文案特征。
可选地,所述样本特征数据还包括下述至少之一:流量上下文特征、素材特征、商品特征,则解析所述训练样本数据和所述样本结果数据,得到样本特征数据的步骤,包括:解析所述训练样本数据中每个历史文案的流量上下文特征,其中,所述流量上下文特征包括下述至少之一:媒体、广告位、时间、地理位置等;将素材标识作为非数值型特征,以确定素材特征;将商品标识作为非数值型特征,以确定商品特征。
可选地,以所述样本特征数据训练所述文案预估模型的步骤,包括:按照时间序列分割所述样本特征数据,确定训练数据集和验证数据集;利用预设训练算法训练所述文案预估模型,以使所述文案预估模型拟合所述训练数据集;使用验证数据集验证所述文案预估模型,直至所述文案预估模型满足预设模型条件。
可选地,在将所述文案特征和所述用户特征输入至文案预估模型进行分析,得到目标文案之后,所述文案推荐方法包括:将所述文案特征、所述用户特征以及其它特征输入至所述文案预估模型,其中,所述文案预估模型计算每个候选文案的预估点击率,所述其它特征包括下述至少之一:流量上下文特征、素材特征、商品特征;对所有的候选文案按照所述预估点击率进行排序;选取预估点击率最大的候选文案作为所述目标文案。
可选地,所述文案预估模型为DeepFM模型。
根据本发明实施例的另一方面,还提供了一种文案推荐装置,包括:获取单元,用于获取候选文案集合,其中,所述候选文案集合中包含有多个待推荐的候选文案;确定单元,用于确定每个所述候选文案的文案特征,并获取当前操作用户的用户特征;分析单元,用于将所述文案特征和所述用户特征输入至文案预估模型进行分析,得到目标文案,其中,所述文案预估模型是通过多组特征数据和文案预估结果训练得到的,所述文案预估模型计算每个所述候选文案的预估点击率,并推送预估点击率最高的目标文案;推送单元,用于将所述目标文案作为推荐结果推送给目标终端。
可选地,所述文案推荐装置还包括:第一获取模块,用于在获取候选文案集合之前,获取文案库中记载的历史文案;学习模块,用于以所述文案库为语料库,利用词向量解析技术学习所述历史文案中的词向量,得到所述历史文案中的词到对应词向量的映射关系;第一确定模块,用于确定词向量映射关系集合。
可选地,所述文案推荐装置还包括:第一提取模块,用于在获取候选文案集合之前,提取历史广告投放数据和用户点击广告数据,并将所述历史广告投放数据作为训练样本数据,将所述用户点击广告数据作为样本结果数据;第一解析模块,用于解析所述训练样本数据和所述样本结果数据,得到样本特征数据,并以所述样本特征数据训练所述文案预估模型。
可选地,所述样本特征数据至少包括:用户特征、文案特征,所述第一解析模块包括:第一分析子模块,用于分析用户注册信息、用户历史点击广告和用户历史访问行为,得到多个用户特征,所述用户特征包括下述至少之一:性别、年龄、常驻地、点击行为偏好、文案喜好类型;第一解析子模块,用于利用中文分词技术将所述训练样本数据中的历史广告投放数据的历史文案解析成词组;第一提取子模块,用于利用关键词提取技术提取所述词组中预设数量的关键词;第一确定子模块,用于基于词向量映射关系集合和提取的关键词,确定固定长度的文案特征。
可选地,所述样本特征数据还包括下述至少之一:流量上下文特征、素材特征、商品特征,所述第一解析模块还包括:第二解析子模块,用于解析所述训练样本数据中每个历史文案的流量上下文特征,其中,所述流量上下文特征包括下述至少之一:媒体、广告位、时间、地理位置等;第二确定子模块,用于将素材标识作为非数值型特征,以确定素材特征;第三确定子模块,用于将商品标识作为非数值型特征,以确定商品特征。
可选地,还所述第一解析模块包括:分割子模块,用于按照时间序列分割所述样本特征数据,确定训练数据集和验证数据集;训练子模块,用于利用预设训练算法训练所述文案预估模型,以使所述文案预估模型拟合所述训练数据集;验证子模块,用于使用验证数据集验证所述文案预估模型,直至所述文案预估模型满足预设模型条件。
可选地,所述文案推荐装置包括:输入单元,用于在将所述文案特征和所述用户特征输入至文案预估模型进行分析,得到目标文案之后,将所述文案特征、所述用户特征以及其它特征输入至所述文案预估模型,其中,所述文案预估模型计算每个候选文案的预估点击率,所述其它特征包括下述至少之一:流量上下文特征、素材特征、商品特征;排序单元,用于对所有的候选文案按照所述预估点击率进行排序;选取单元,用于选取预估点击率最大的候选文案作为所述目标文案。
可选地,所述文案预估模型为DeepFM模型。
根据本发明实施例的另一方面,还提供了一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的文案推荐方法。
在本发明实施例中,采用获取候选文案集合,其中,候选文案集合中包含有多个待推荐的候选文案,然后确定每个候选文案的文案特征,并获取当前操作用户的用户特征,之后可以将文案特征和用户特征输入至文案预估模型进行分析,得到目标文案,其中,文案预估模型是通过多组特征数据和文案预估结果训练得到的,文案预估模型计算每个候选文案的预估点击率,并推送预估点击率最高的目标文案,最后将目标文案作为推荐结果推送给目标终端。在该实施例中,可以对于不同用户的用户特征,利用文案预估模型,推荐预估点击率最高的文案,形成对应不同用户的个性化文案推荐,,以提高广告的点击率,优化广告点击效果,从而解决相关技术中制作的广告文案并未考虑不同用户特征,导致用户对投放的广告兴趣下降,影响广告投放的效果的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的文案推荐方法的流程图;
图2是根据本发明实施例的一种可选的文案推荐装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于本领域技术人员理解本发明,下面对本发明各实施例中涉及的部分术语或名词做出解释:
Word2vec,是一群用来产生词向量的相关模型。这种模型为浅层双层的神经网络,用来训练以重新构建语言学之词文本,通过Word2vec可以映射每个词到一个向量,表示词与词之间的关系。
CBOW模型,Continuous Bag-of-Words,连续词袋模型,输入为某一个特征词的上下文相关的词对应的词向量,输出为特定的词的词向量。
AUC指标,是一种模型评价指标,可衡量二分类模型的优劣,表示预测的正例排在负例前面的概率。
本发明下述实施例可以应用于各种文案制作、文案推荐中,文案的类型包括但不限于:广告文案、演讲文案等。在该实施例中,可以深度模型学习文案特征和用户特征等的高阶交叉与点击之间的规律,形成千人千面的个性化文案,推荐适应于每个用户特征的文案。
实施例一
根据本发明实施例,提供了一种文案推荐方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的文案推荐方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取候选文案集合,其中,候选文案集合中包含有多个待推荐的候选文案;
步骤S104,确定每个候选文案的文案特征,并获取当前操作用户的用户特征;
步骤S106,将文案特征和用户特征输入至文案预估模型进行分析,得到目标文案,其中,文案预估模型是通过多组特征数据和文案预估结果训练得到的,文案预估模型计算每个候选文案的预估点击率,并推送预估点击率最高的目标文案;
步骤S108,将目标文案作为推荐结果推送给目标终端。
通过上述步骤,可以采用获取候选文案集合,其中,候选文案集合中包含有多个待推荐的候选文案,然后确定每个候选文案的文案特征,并获取当前操作用户的用户特征,之后可以将文案特征和用户特征输入至文案预估模型进行分析,得到目标文案,其中,文案预估模型是通过多组特征数据和文案预估结果训练得到的,文案预估模型计算每个候选文案的预估点击率,并推送预估点击率最高的目标文案,最后将目标文案作为推荐结果推送给目标终端。在该实施例中,可以对于不同用户的用户特征,利用文案预估模型,推荐预估点击率最高的文案,形成对应不同用户的个性化文案推荐,,以提高广告的点击率,优化广告点击效果,从而解决相关技术中制作的广告文案并未考虑不同用户特征,导致用户对投放的广告兴趣下降,影响广告投放的效果的技术问题。
下面结合各步骤对本发明实施例进行详细说明。
在使用文案推荐时,可以先学习词向量和生成样本数据,以训练模型,得到文案预估模型。
第一步,学习词向量
作为本发明可选的实施例,在获取候选文案集合之前,文案推荐方法还包括:获取文案库中记载的历史文案;以文案库为语料库,利用词向量解析技术学习历史文案中的词向量,得到历史文案中的词到对应词向量的映射关系;确定词向量映射关系集合。
可选的,上述词向量解析技术包括但不限于word2vec技术。即可以利用word2vec技术,以文案库为语料库,训练CBOW模型学习词向量,形成文案中的词到对应词向量的映射。
本发明实施例使用的词向量学习方法并不限于上述的word2vec,还可以使用glove、ELMo、BERT。
第二步,生成样本数据以及训练文案预估模型
作为本发明另一种可选的实施例,在获取候选文案集合之前,文案推荐方法还包括:提取历史广告投放数据和用户点击广告数据,并将历史广告投放数据作为训练样本数据,将用户点击广告数据作为样本结果数据;解析训练样本数据和样本结果数据,得到样本特征数据,并以样本特征数据训练文案预估模型。
可选的,样本特征数据至少包括:用户特征、文案特征,则解析训练样本数据和样本结果数据,得到样本特征数据的步骤,包括:分析用户注册信息、用户历史点击广告和用户历史访问行为,得到多个用户特征,用户特征包括下述至少之一:性别、年龄、常驻地、点击行为偏好、文案喜好类型;利用中文分词技术将训练样本数据中的历史广告投放数据的历史文案解析成词组;利用关键词提取技术提取词组中预设数量的关键词;基于词向量映射关系集合和提取的关键词,确定固定长度的文案特征。
在本发明实施例中,可以针对每个用户,从不同渠道获取到用户特征,例如,通过调查问卷、注册用户信息统计、不同用户ID映射等得到用户特征。上述的常驻地可以理解为用户登录网站、网页的物理地址、IP地址等,也可以为实际所处地理定位;点击行为偏好可以理解为用户在历史过程中点击的偏好文案。
在得到文案特征时,可以利用中文分词技术将文案解析成词组,然后利用关键词提取技术提取top-K个关键词(如K=3,如果文案的词语不足K个,则用空向量补充,空向量在步骤1中生成),最后利用上述得到的词向量映射关系集合映射成词向量,形成固定长度的文案特征。
在本发明可选的实施例中,样本特征数据还包括下述至少之一:流量上下文特征、素材特征、商品特征,则解析训练样本数据和样本结果数据,得到样本特征数据的步骤,包括:解析训练样本数据中每个历史文案的流量上下文特征,其中,流量上下文特征包括下述至少之一:媒体、广告位、时间、地理位置等;将素材标识作为非数值型特征,以确定素材特征;将商品标识作为非数值型特征,以确定商品特征。
上述的素材标识和商品标识,可以包括但不限于:ID、编号等。即可以将素材ID直接作为非数值型特征加入模型训练,以及将商品ID直接作为非数值型特征加入模型训练。
作为本发明可选的实施例,以样本特征数据训练文案预估模型的步骤,包括:按照时间序列分割样本特征数据,确定训练数据集和验证数据集;利用预设训练算法训练文案预估模型,以使文案预估模型拟合训练数据集;使用验证数据集验证文案预估模型,直至文案预估模型满足预设模型条件。
即可以在训练文案预估模型时,可以将生成的样本数据按照时间顺序分割成训练数据集和验证数据集。
在具体训练文案预估模型时,可以利用mini-batch方法进行训练,使得模型拟合训练数据集,直到验证数据集的AUC指标不再提高为止(满足预设模型条件)。
可选的,文案预估模型的类型包括但不限于:DeepFM、FM、DNN、Wide and Deep、DIN。优选的,文案预估模型为DeepFM模型,采用深度学习模型DeepFM作为文案预估模型,以预估广告文案的点击率。
在得到文案预估模型后,可以应用于广告文案的推荐中,具体实施方案如下。
步骤S102,获取候选文案集合,其中,候选文案集合中包含有多个待推荐的候选文案。
在文案推荐阶段,遍历候选文案集合,得到已经形成的候选文案。该候选文案集合中可以包含适应不同用户特征的候选文案,文案类型多样化,文案数量和文案模板多样化。
步骤S104,确定每个候选文案的文案特征,并获取当前操作用户的用户特征。
步骤S106,将文案特征和用户特征输入至文案预估模型进行分析,得到目标文案,其中,文案预估模型是通过多组特征数据和文案预估结果训练得到的,文案预估模型计算每个候选文案的预估点击率,并推送预估点击率最高的目标文案。
作为本发明可选的实施例,在将文案特征和用户特征输入至文案预估模型进行分析,得到目标文案之后,文案推荐方法包括:将文案特征、用户特征以及其它特征输入至文案预估模型,其中,文案预估模型计算每个候选文案的预估点击率,其它特征包括下述至少之一:流量上下文特征、素材特征、商品特征;对所有的候选文案按照预估点击率进行排序;选取预估点击率最大的候选文案作为目标文案。
即可以在文案推荐阶段,遍历候选文案集合,对于每个文案,将文案转换为文案特征,与用户特征、流量上下文特征、素材特征、商品特征等一起输入到模型中,计算点击率,选择点击率最大的候选文案作为推荐结果。
步骤S108,将目标文案作为推荐结果推送给目标终端。
通过上述实施例,可以利用词向量学习技术(例如,word2vec技术)将文案映射成词向量,可以很好的学习到文案的语言特征;采用深度模型学习文案特征和用户特征等的高阶交叉与点击之间的规律,形成千人千面的个性化文案推荐;利用训练好的模型进行线上点击率预估,选择预估点击率最高的候选文案,优化广告点击效果。
实施例二
图2是根据本发明实施例的一种可选的文案推荐装置的示意图,如图2所示,该文案推荐装置可以包括:获取单元21,确定单元23,分析单元25,推送单元27,其中,
获取单元21,用于获取候选文案集合,其中,候选文案集合中包含有多个待推荐的候选文案;
确定单元23,用于确定每个候选文案的文案特征,并获取当前操作用户的用户特征;
分析单元25,用于将文案特征和用户特征输入至文案预估模型进行分析,得到目标文案,其中,文案预估模型是通过多组特征数据和文案预估结果训练得到的,文案预估模型计算每个候选文案的预估点击率,并推送预估点击率最高的目标文案;
推送单元27,用于将目标文案作为推荐结果推送给目标终端。
上述文案推荐装置,可以通过获取单元21获取候选文案集合,其中,候选文案集合中包含有多个待推荐的候选文案,然后通过确定单元23确定每个候选文案的文案特征,并获取当前操作用户的用户特征,之后可以通过分析单元25将文案特征和用户特征输入至文案预估模型进行分析,得到目标文案,其中,文案预估模型是通过多组特征数据和文案预估结果训练得到的,文案预估模型计算每个候选文案的预估点击率,并推送预估点击率最高的目标文案,最后通过推送单元27将目标文案作为推荐结果推送给目标终端。在该实施例中,可以对于不同用户的用户特征,利用文案预估模型,推荐预估点击率最高的文案,形成对应不同用户的个性化文案推荐,,以提高广告的点击率,优化广告点击效果,从而解决相关技术中制作的广告文案并未考虑不同用户特征,导致用户对投放的广告兴趣下降,影响广告投放的效果的技术问题。
可选的,文案推荐装置还包括:第一获取模块,用于在获取候选文案集合之前,获取文案库中记载的历史文案;学习模块,用于以文案库为语料库,利用词向量解析技术学习历史文案中的词向量,得到历史文案中的词到对应词向量的映射关系;第一确定模块,用于确定词向量映射关系集合。
另一种可选的,文案推荐装置还包括:第一提取模块,用于在获取候选文案集合之前,提取历史广告投放数据和用户点击广告数据,并将历史广告投放数据作为训练样本数据,将用户点击广告数据作为样本结果数据;第一解析模块,用于解析训练样本数据和样本结果数据,得到样本特征数据,并以样本特征数据训练文案预估模型。
作为本发明可选的实施例,样本特征数据至少包括:用户特征、文案特征,第一解析模块包括:第一分析子模块,用于分析用户注册信息、用户历史点击广告和用户历史访问行为,得到多个用户特征,用户特征包括下述至少之一:性别、年龄、常驻地、点击行为偏好、文案喜好类型;第一解析子模块,用于利用中文分词技术将训练样本数据中的历史广告投放数据的历史文案解析成词组;第一提取子模块,用于利用关键词提取技术提取词组中预设数量的关键词;第一确定子模块,用于基于词向量映射关系集合和提取的关键词,确定固定长度的文案特征。
可选的,样本特征数据还包括下述至少之一:流量上下文特征、素材特征、商品特征,第一解析模块还包括:第二解析子模块,用于解析训练样本数据中每个历史文案的流量上下文特征,其中,流量上下文特征包括下述至少之一:媒体、广告位、时间、地理位置等;第二确定子模块,用于将素材标识作为非数值型特征,以确定素材特征;第三确定子模块,用于将商品标识作为非数值型特征,以确定商品特征。
在本发明实施例中,还第一解析模块包括:分割子模块,用于按照时间序列分割样本特征数据,确定训练数据集和验证数据集;训练子模块,用于利用预设训练算法训练文案预估模型,以使文案预估模型拟合训练数据集;验证子模块,用于使用验证数据集验证文案预估模型,直至文案预估模型满足预设模型条件。
可选的,文案推荐装置包括:输入单元,用于在将文案特征和用户特征输入至文案预估模型进行分析,得到目标文案之后,将文案特征、用户特征以及其它特征输入至文案预估模型,其中,文案预估模型计算每个候选文案的预估点击率,其它特征包括下述至少之一:流量上下文特征、素材特征、商品特征;排序单元,用于对所有的候选文案按照预估点击率进行排序;选取单元,用于选取预估点击率最大的候选文案作为目标文案。
可选的,文案预估模型为DeepFM模型。
上述的文案推荐装置还可以包括处理器和存储器,上述获取单元21,确定单元23,分析单元25,推送单元27等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
上述处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来将目标文案作为推荐结果推送给目标终端。
上述存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
根据本发明实施例的另一方面,还提供了一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的文案推荐方法。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取候选文案集合,其中,候选文案集合中包含有多个待推荐的候选文案;确定每个候选文案的文案特征,并获取当前操作用户的用户特征;将文案特征和用户特征输入至文案预估模型进行分析,得到目标文案,其中,文案预估模型是通过多组特征数据和文案预估结果训练得到的,文案预估模型计算每个候选文案的预估点击率,并推送预估点击率最高的目标文案;将目标文案作为推荐结果推送给目标终端。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种文案推荐方法,其特征在于,包括:
获取候选文案集合,其中,所述候选文案集合中包含有多个待推荐的候选文案;
确定每个所述候选文案的文案特征,并获取当前操作用户的用户特征;
将所述文案特征和所述用户特征输入至文案预估模型进行分析,得到目标文案,其中,所述文案预估模型是通过多组特征数据和文案预估结果训练得到的,所述文案预估模型计算每个所述候选文案的预估点击率,并推送预估点击率最高的目标文案;
将所述目标文案作为推荐结果推送给目标终端。
2.根据权利要求1所述的方法,其特征在于,在获取候选文案集合之前,所述文案推荐方法还包括:
获取文案库中记载的历史文案;
以所述文案库为语料库,利用词向量解析技术学习所述历史文案中的词向量,得到所述历史文案中的词到对应词向量的映射关系;
确定词向量映射关系集合。
3.根据权利要求1所述的方法,其特征在于,在获取候选文案集合之前,所述文案推荐方法还包括:
提取历史广告投放数据和用户点击广告数据,并将所述历史广告投放数据作为训练样本数据,将所述用户点击广告数据作为样本结果数据;
解析所述训练样本数据和所述样本结果数据,得到样本特征数据,并以所述样本特征数据训练所述文案预估模型。
4.根据权利要求3所述的方法,其特征在于,所述样本特征数据至少包括:用户特征、文案特征,则解析所述训练样本数据和所述样本结果数据,得到样本特征数据的步骤,包括:
分析用户注册信息、用户历史点击广告和用户历史访问行为,得到多个用户特征,所述用户特征包括下述至少之一:性别、年龄、常驻地、点击行为偏好、文案喜好类型;
利用中文分词技术将所述训练样本数据中的历史广告投放数据的历史文案解析成词组;利用关键词提取技术提取所述词组中预设数量的关键词;基于词向量映射关系集合和提取的关键词,确定固定长度的文案特征。
5.根据权利要求3所述的方法,其特征在于,所述样本特征数据还包括下述至少之一:流量上下文特征、素材特征、商品特征,则解析所述训练样本数据和所述样本结果数据,得到样本特征数据的步骤,包括:
解析所述训练样本数据中每个历史文案的流量上下文特征,其中,所述流量上下文特征包括下述至少之一:媒体、广告位、时间、地理位置等;
将素材标识作为非数值型特征,以确定素材特征;
将商品标识作为非数值型特征,以确定商品特征。
6.根据权利要求5所述的方法,其特征在于,以所述样本特征数据训练所述文案预估模型的步骤,包括:
按照时间序列分割所述样本特征数据,确定训练数据集和验证数据集;
利用预设训练算法训练所述文案预估模型,以使所述文案预估模型拟合所述训练数据集;
使用验证数据集验证所述文案预估模型,直至所述文案预估模型满足预设模型条件。
7.根据权利要求5所述的方法,其特征在于,在将所述文案特征和所述用户特征输入至文案预估模型进行分析,得到目标文案之后,所述文案推荐方法包括:
将所述文案特征、所述用户特征以及其它特征输入至所述文案预估模型,其中,所述文案预估模型计算每个候选文案的预估点击率,所述其它特征包括下述至少之一:流量上下文特征、素材特征、商品特征;
对所有的候选文案按照所述预估点击率进行排序;
选取预估点击率最大的候选文案作为所述目标文案。
8.根据权利要求1至7中任意一项所述的方法,其特征在于,所述文案预估模型为DeepFM模型。
9.一种文案推荐装置,其特征在于,包括:
获取单元,用于获取候选文案集合,其中,所述候选文案集合中包含有多个待推荐的候选文案;
确定单元,用于确定每个所述候选文案的文案特征,并获取当前操作用户的用户特征;
分析单元,用于将所述文案特征和所述用户特征输入至文案预估模型进行分析,得到目标文案,其中,所述文案预估模型是通过多组特征数据和文案预估结果训练得到的,所述文案预估模型计算每个所述候选文案的预估点击率,并推送预估点击率最高的目标文案;
推送单元,用于将所述目标文案作为推荐结果推送给目标终端。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至8中任意一项所述的文案推荐方法。
CN201911033495.7A 2019-10-28 2019-10-28 文案推荐方法及装置、电子设备 Pending CN110852793A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911033495.7A CN110852793A (zh) 2019-10-28 2019-10-28 文案推荐方法及装置、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911033495.7A CN110852793A (zh) 2019-10-28 2019-10-28 文案推荐方法及装置、电子设备

Publications (1)

Publication Number Publication Date
CN110852793A true CN110852793A (zh) 2020-02-28

Family

ID=69598039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911033495.7A Pending CN110852793A (zh) 2019-10-28 2019-10-28 文案推荐方法及装置、电子设备

Country Status (1)

Country Link
CN (1) CN110852793A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111475671A (zh) * 2020-03-12 2020-07-31 支付宝(杭州)信息技术有限公司 语音文案处理方法、装置以及服务器
CN111782960A (zh) * 2020-07-27 2020-10-16 支付宝(杭州)信息技术有限公司 文案推送方法、装置及电子设备
CN111901411A (zh) * 2020-07-24 2020-11-06 北京字节跳动网络技术有限公司 用于推送信息的方法和装置
CN112232067A (zh) * 2020-11-03 2021-01-15 汉海信息技术(上海)有限公司 文案生成方法、文案评估模型的训练方法、装置及设备
CN112487141A (zh) * 2020-11-26 2021-03-12 北京三快在线科技有限公司 推荐文案的生成方法、装置、设备及存储介质
CN112487151A (zh) * 2020-12-14 2021-03-12 深圳市欢太科技有限公司 文案生成方法及装置、存储介质与电子设备
CN112712339A (zh) * 2020-12-31 2021-04-27 京东数字科技控股股份有限公司 业务流程的执行方法、装置、电子设备和计算机可读介质
CN112749330A (zh) * 2020-06-05 2021-05-04 腾讯科技(深圳)有限公司 信息推送方法、装置、计算机设备和存储介质
CN112883725A (zh) * 2020-12-29 2021-06-01 上海讯飞瑞元信息技术有限公司 一种文案生成方法、装置、电子设备、存储介质
CN112989205A (zh) * 2021-04-14 2021-06-18 北京有竹居网络技术有限公司 媒体文案推荐方法、装置、介质及电子设备
CN113222647A (zh) * 2021-04-26 2021-08-06 西安点告网络科技有限公司 基于点击率预估模型的广告推荐方法、***及存储介质
CN113254633A (zh) * 2021-05-10 2021-08-13 中国民生银行股份有限公司 消息文案生成方法和装置
CN113744020A (zh) * 2021-01-15 2021-12-03 北京沃东天骏信息技术有限公司 一种商品文案处理方法、装置、电子设备和存储介质
WO2022095798A1 (zh) * 2020-11-04 2022-05-12 北京沃东天骏信息技术有限公司 一种文案生成方法、装置、电子设备、存储介质和程序
CN114548076A (zh) * 2022-02-28 2022-05-27 深圳市和讯华谷信息技术有限公司 内容文案的智能评分方法以及相关装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104965890A (zh) * 2015-06-17 2015-10-07 深圳市腾讯计算机***有限公司 广告推荐的方法和装置
CN105631707A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 基于决策树的广告点击率预估方法与应用推荐方法及装置
CN108665310A (zh) * 2018-05-08 2018-10-16 多盟睿达科技(中国)有限公司 一种基于探测预估技术的广告投放方法及***
CN109447706A (zh) * 2018-10-25 2019-03-08 深圳前海微众银行股份有限公司 广告文案生成方法、装置、设备以及可读存储介质
JP2019040386A (ja) * 2017-08-25 2019-03-14 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
CN109582862A (zh) * 2018-10-31 2019-04-05 网易传媒科技(北京)有限公司 点击率预估方法、介质、***和计算设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104965890A (zh) * 2015-06-17 2015-10-07 深圳市腾讯计算机***有限公司 广告推荐的方法和装置
CN105631707A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 基于决策树的广告点击率预估方法与应用推荐方法及装置
JP2019040386A (ja) * 2017-08-25 2019-03-14 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
CN108665310A (zh) * 2018-05-08 2018-10-16 多盟睿达科技(中国)有限公司 一种基于探测预估技术的广告投放方法及***
CN109447706A (zh) * 2018-10-25 2019-03-08 深圳前海微众银行股份有限公司 广告文案生成方法、装置、设备以及可读存储介质
CN109582862A (zh) * 2018-10-31 2019-04-05 网易传媒科技(北京)有限公司 点击率预估方法、介质、***和计算设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴笛: "《基于语义网的个性化网络学习服务》", 30 April 2017 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111475671A (zh) * 2020-03-12 2020-07-31 支付宝(杭州)信息技术有限公司 语音文案处理方法、装置以及服务器
CN111475671B (zh) * 2020-03-12 2023-09-26 支付宝(杭州)信息技术有限公司 语音文案处理方法、装置以及服务器
CN112749330B (zh) * 2020-06-05 2023-12-12 腾讯科技(深圳)有限公司 信息推送方法、装置、计算机设备和存储介质
CN112749330A (zh) * 2020-06-05 2021-05-04 腾讯科技(深圳)有限公司 信息推送方法、装置、计算机设备和存储介质
CN111901411A (zh) * 2020-07-24 2020-11-06 北京字节跳动网络技术有限公司 用于推送信息的方法和装置
CN111782960A (zh) * 2020-07-27 2020-10-16 支付宝(杭州)信息技术有限公司 文案推送方法、装置及电子设备
CN112232067A (zh) * 2020-11-03 2021-01-15 汉海信息技术(上海)有限公司 文案生成方法、文案评估模型的训练方法、装置及设备
WO2022095798A1 (zh) * 2020-11-04 2022-05-12 北京沃东天骏信息技术有限公司 一种文案生成方法、装置、电子设备、存储介质和程序
CN112487141A (zh) * 2020-11-26 2021-03-12 北京三快在线科技有限公司 推荐文案的生成方法、装置、设备及存储介质
CN112487151A (zh) * 2020-12-14 2021-03-12 深圳市欢太科技有限公司 文案生成方法及装置、存储介质与电子设备
CN112883725A (zh) * 2020-12-29 2021-06-01 上海讯飞瑞元信息技术有限公司 一种文案生成方法、装置、电子设备、存储介质
CN112712339A (zh) * 2020-12-31 2021-04-27 京东数字科技控股股份有限公司 业务流程的执行方法、装置、电子设备和计算机可读介质
CN113744020A (zh) * 2021-01-15 2021-12-03 北京沃东天骏信息技术有限公司 一种商品文案处理方法、装置、电子设备和存储介质
CN112989205A (zh) * 2021-04-14 2021-06-18 北京有竹居网络技术有限公司 媒体文案推荐方法、装置、介质及电子设备
CN113222647A (zh) * 2021-04-26 2021-08-06 西安点告网络科技有限公司 基于点击率预估模型的广告推荐方法、***及存储介质
CN113222647B (zh) * 2021-04-26 2023-11-28 西安点告网络科技有限公司 基于点击率预估模型的广告推荐方法、***及存储介质
CN113254633A (zh) * 2021-05-10 2021-08-13 中国民生银行股份有限公司 消息文案生成方法和装置
CN113254633B (zh) * 2021-05-10 2024-05-03 中国民生银行股份有限公司 消息文案生成方法和装置
CN114548076A (zh) * 2022-02-28 2022-05-27 深圳市和讯华谷信息技术有限公司 内容文案的智能评分方法以及相关装置

Similar Documents

Publication Publication Date Title
CN110852793A (zh) 文案推荐方法及装置、电子设备
CN105160545B (zh) 投放信息样式确定方法及装置
KR20210036184A (ko) 사용자 취향정보 파악 방법 및 사용자 취향 정보에 기반한 아이템 추천 모듈
CN110298029A (zh) 基于用户语料的好友推荐方法、装置、设备及介质
CN111400586A (zh) 群组展示方法、终端、服务器、***及存储介质
CN105069077A (zh) 搜索方法及装置
CN110162609B (zh) 用于向用户推荐咨询问题的方法及装置
CN111259231A (zh) 应用程序的推荐方法和装置
CN113704509B (zh) 多媒体推荐方法、装置、电子设备及存储介质
CN115147130A (zh) 问题预测方法、设备、存储介质及程序产品
KR101652433B1 (ko) Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법
CN114223012A (zh) 推送对象确定方法、装置、终端设备及存储介质
CN114222000A (zh) 信息推送方法、装置、计算机设备和存储介质
CN106383857A (zh) 一种信息处理方法及电子设备
CN111597469A (zh) 展示位置的确定方法、确定装置、电子设备及存储介质
CN114282119B (zh) 一种基于异构信息网络的科技信息资源检索方法及***
CN110717094A (zh) 信息推荐方法、装置、计算机设备和存储介质
CN114579867A (zh) 资源推荐的方法和装置、电子设备和存储介质
CN114840659A (zh) 信息推荐方法、装置、电子设备及存储介质
CN110020120A (zh) 内容投放***中的特征词处理方法、装置及存储介质
CN112307298B (zh) 个人品牌标签的生成方法及其装置
CN113724044A (zh) 基于用户画像的商品推荐、装置、计算机设备和存储介质
KR20100129667A (ko) 웹 마이닝 기반 상황지식 추출 장치 및 방법과 이를 이용한 상황인지 모바일 광고 시스템
JP5677999B2 (ja) 分類装置、分類システム、分類方法及び分類プログラム
JP5802597B2 (ja) 分類装置、分類システム、分類方法及び分類プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200228

RJ01 Rejection of invention patent application after publication