CN113111259A - 订阅号的内容推送方法、装置、设备及存储介质 - Google Patents

订阅号的内容推送方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113111259A
CN113111259A CN202110384050.4A CN202110384050A CN113111259A CN 113111259 A CN113111259 A CN 113111259A CN 202110384050 A CN202110384050 A CN 202110384050A CN 113111259 A CN113111259 A CN 113111259A
Authority
CN
China
Prior art keywords
content
operation record
push
candidate
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110384050.4A
Other languages
English (en)
Inventor
江惠文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202110384050.4A priority Critical patent/CN113111259A/zh
Publication of CN113111259A publication Critical patent/CN113111259A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请提供一种订阅号的内容推送方法、装置、设备及存储介质,在向订阅号用户推送消息时,增加个性化推送内容。该方法包括:通过获取关注订阅号的目标用户的操作记录的内容以及与操作记录匹配的多个候选内容,确定操作记录的内容以及每个候选内容的特征向量,经特征向量的数据处理,从多个候选内容中确定与操作记录的内容相似度最大的第一推送内容,向目标用户端的终端发送第一推送内容。由于采用向量匹配方法选取订阅号的推送内容,在实现个性化推送的同时,还提升了推送内容的多样化。通过对推送内容的优化,可提升用户点击率。

Description

订阅号的内容推送方法、装置、设备及存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及一种订阅号的内容推送方法、装置、设备及存储介质。
背景技术
订阅号为媒体和个人提供一种新的信息传播方式,主要功能是在终端应用程序上给用户传达资讯,例如推送文章、活动、产品等内容。
在订阅号推送场景中,以推送文章为例,由于单次推送的文章种类和数量有所限制,故大多数推荐方法都是给关注订阅号的所有用户推送一模一样的文章列表,选取的文章主要是近期热门文章。可见,目前的订阅号无法实现个性化推荐。
发明内容
本申请实施例提供一种订阅号的内容推送方法、装置、设备及存储介质,实现订阅号的个性化推荐,提高用户体验。
本申请实施例的第一方面提供一种订阅号的内容推送方法,包括:
获取关注订阅号的目标用户的操作记录的内容,以及与所述操作记录匹配的多个候选内容;
确定所述操作记录的内容以及每个候选内容的特征向量;
根据所述操作记录的内容以及每个候选内容的特征向量,从所述多个候选内容中确定第一推送内容;所述第一推送内容是与所述操作记录的内容相似度最大的候选内容;
向所述目标用户的终端发送所述第一推送内容。
在本申请的一个实施例中,所述确定所述操作记录的内容以及每个候选内容的特征向量,包括:
利用语言模型BERT对所述操作记录的内容以及每个候选内容进行文本特征提取,得到所述操作记录的内容的第一特征向量以及每个候选内容的第二特征向量。
在本申请的一个实施例中,利用语言模型BERT对所述操作记录的内容以及每个候选内容进行文本特征提取,得到所述操作记录的内容的第一特征向量以及每个候选内容的第二特征向量,包括:
获取所述操作记录的内容的第一文本信息,以及每个候选内容的第二文本信息;
利用所述语言模型BERT的预设字典,将所述第一文本信息转换成第一数字序列,将每个候选内容的第二文本信息转换成第二数字序列;
分别将所述第一数字序列以及每个候选内容的第二数字序列,输入至所述语言模型BERT中,得到所述第一特征向量以及每个候选内容的第二特征向量。
在本申请的一个实施例中,利用所述语言模型BERT的预设字典,将所述第一文本信息转换成第一数字序列,将每个候选内容的第二文本信息转换成第二数字序列之前,所述方法还包括:
分别对所述第一文本信息以及每个候选内容的第二文本信息,进行文本预处理,所述文本预处理至少包括分词处理。
在本申请的一个实施例中,所述根据所述操作记录的内容以及每个候选内容的特征向量,从所述多个候选内容中确定第一推送内容,包括:
确定所述操作记录的内容的第一特征向量与每个候选内容的第二特征向量的余弦相似度;
将所述余弦相似度的值最接近1的候选内容作为所述第一推送内容。
在本申请的一个实施例中,所述第一推送内容位于所述订阅号的推送界面的推送列表的顶部。
在本申请的一个实施例中,所述方法还包括:
向所述目标用户的终端发送第二推送内容,所述第二推送内容是根据所述目标用户所在用户组的所有用户的操作记录确定的。
在本申请的一个实施例中,所述方法还包括:
获取与所述目标用户在同一用户组的每个用户的操作记录的内容;
确定所述用户组中每个用户的操作记录的内容的特征向量;
根据所述用户组中每个用户的操作记录的内容的特征向量,确定平均特征向量;
根据所述平均特征向量以及所述用户组的多个候选内容的特征向量,从所述用户组的多个候选内容中确定所述第二推送内容。
在本申请的一个实施例中,所述获取与所述目标用户在同一用户组的每个用户的操作记录的内容,包括:
获取与所述目标用户展示的所述第一推送内容相同的多个其他用户;
将所述目标用户与所述多个其他用户划分到同一用户组;
获取与所述目标用户在同一用户组的每个用户的操作记录的内容。
可选的,所述操作记录包括浏览记录、下单记录、加购记录的至少一项。
本申请实施例的第二方面提供一种订阅号的内容推送装置,包括:
获取模块,用于获取关注订阅号的目标用户的操作记录的内容,以及与所述操作记录匹配的多个候选内容;
处理模块,用于确定所述操作记录的内容以及每个候选内容的特征向量;
根据所述操作记录的内容以及每个候选内容的特征向量,从所述多个候选内容中确定第一推送内容;所述第一推送内容是与所述操作记录的内容相似度最大的候选内容;
发送模块,用于向所述目标用户的终端发送所述第一推送内容。
在本申请的一个实施例中,处理模块,具体用于:
利用语言模型BERT对所述操作记录的内容以及每个候选内容进行文本特征提取,得到所述操作记录的内容的第一特征向量以及每个候选内容的第二特征向量。
在本申请的一个实施例中,获取模块,具体用于:
获取所述操作记录的内容的第一文本信息,以及每个候选内容的第二文本信息;
处理模块,具体用于:
利用所述语言模型BERT的预设字典,将所述第一文本信息转换成第一数字序列,将每个候选内容的第二文本信息转换成第二数字序列;
分别将所述第一数字序列以及每个候选内容的第二数字序列,输入至所述语言模型BERT中,得到所述第一特征向量以及每个候选内容的第二特征向量。
在本申请的一个实施例中,处理模块利用所述语言模型BERT的预设字典,将所述第一文本信息转换成第一数字序列,将每个候选内容的第二文本信息转换成第二数字序列之前,还用于:
分别对所述第一文本信息以及每个候选内容的第二文本信息,进行文本预处理,所述文本预处理至少包括分词处理。
在本申请的一个实施例中,处理模块,具体用于:
确定所述操作记录的内容的第一特征向量与每个候选内容的第二特征向量的余弦相似度;
将所述余弦相似度的值最接近1的候选内容作为所述第一推送内容。
在本申请的一个实施例中,所述第一推送内容位于所述订阅号的推送界面的推送列表的顶部。
在本申请的一个实施例中,发送模块,还用于:向所述目标用户的终端发送第二推送内容,所述第二推送内容是根据所述目标用户所在用户组的所有用户的操作记录确定的。
在本申请的一个实施例中,获取模块,还用于:
获取与所述目标用户在同一用户组的每个用户的操作记录的内容;
处理模块,还用于:
确定所述用户组中每个用户的操作记录的内容的特征向量;
根据所述用户组中每个用户的操作记录的内容的特征向量,确定平均特征向量;
根据所述平均特征向量以及所述用户组的多个候选内容的特征向量,从所述用户组的多个候选内容中确定所述第二推送内容。
在本申请的一个实施例中,获取模块,具体用于:
获取与所述目标用户展示的所述第一推送内容相同的多个其他用户;
处理模块,还用于将所述目标用户与所述多个其他用户划分到同一用户组;
获取模块,还用于获取与所述目标用户在同一用户组的每个用户的操作记录的内容。
可选的,所述操作记录包括浏览记录、下单记录、加购记录的至少一项。
本申请实施例的第三方面提供一种电子设备,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面中任一项所述的方法。
本申请实施例的第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如第一方面中任一项所述的方法。
本申请实施例的第五方面提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项所述的方法。
本申请实施例提供一种订阅号的内容推送方法、装置、设备及存储介质,在向订阅号用户推送消息时,增加个性化推送内容。该方法包括:通过获取关注订阅号的目标用户的操作记录的内容以及与操作记录匹配的多个候选内容,确定操作记录的内容以及每个候选内容的特征向量,经特征向量的数据处理,从多个候选内容中确定与操作记录的内容相似度最大的第一推送内容,向目标用户端的终端发送第一推送内容。由于采用向量匹配方法选取订阅号的推送内容,在实现个性化推送的同时,还提升了推送内容的多样化。通过对推送内容的优化,可提升用户点击率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的订阅号的内容推送方法的场景示意图;
图2为本申请实施例提供的订阅号的内容推送方法的流程示意图一;
图3为本申请实施例提供的文本特征提取的流程示意图;
图4为本申请实施例提供的订阅号的内容推送方法的流程示意图二;
图5为本申请实施例提供的订阅号的内容推送方法的流程示意图三;
图6为本申请实施例提供的订阅号的推送界面的推送消息的示意图;
图7为本申请实施例提供的订阅号的内容推送装置的结构示意图;
图8为本申请实施例提供的电子设备的硬件结构图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,本文中使用的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
订阅号推送场景包括订阅号中的新品上架推送、热门产品推送、运营活动推送、新闻推送、专题推送等。以产品推送为例,目前最常用的引流手段就是通过推送包含用户兴趣关键词的标题内容来吸引用户点击。但是收到订阅号对每次推送内容的样式种类以及每个月推送的频率的限制,导致订阅号的推送无法针对每个订阅号粉丝进行一对一具有针对性的、完全与用户兴趣相关的个性化推送。
针对上述问题,本申请实施例提供一种订阅号的内容推送方法,设计一种尽可能体现个性化的推送策略,在满足订阅号的各项限制条件的情况下,最大幅度地增加推荐的个性化程度,进而提升用户在订阅号中的点击率(或转化率)。目前的订阅号一次可以推送最多N个链接,N通常取10以内,例如5。发明人在考虑推送链接(或推送文章/卡片)的数量限制的情况下,设计顶部链接对应用户的个性化内容,剩余链接对应现有方案的群发内容或者用户所在组内的热门内容,通过该方式实现有针对性的订阅号的内容推荐,提高用户的点击率。
另外,上述处理过程设计推送内容的确定,可以采用文字精准匹配的方法,来确定用户个性化内容以及用户所在组内的热门内容,然而发明人还考虑到中文文字的表达不同、但语义相同的情况,为了进一步提高推送内容的准确度,提出利用文字的特征向量的模糊匹配方法,来确定上述推送内容,从而可以有效解决近义词匹配问题,使得推送内容扩展到更多相关内容中。
在介绍本申请提供的内容推送方案之前,首先对内容推送方案的应用场景进行简要介绍。
示例性的,图1为本申请实施例提供的订阅号的内容推送方法的场景示意图,如图1所示,该场景包括终端设备11、第一服务器12以及至少一个第二服务器,例如图1所示的第二服务器13和14,终端设备11与第一服务器12通信连接,第一服务器12与第二服务器13和14通信连接。
终端设备11可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、笔记本电脑、台式计算机等。
第一服务器12可以是提供各种网络信息的服务器,例如电商平台的服务器,社交平台的服务器等。
第二服务器13或14是独立于第一服务器12的数据处理服务器,可以理解为一个第三方服务器,例如第二服务器13为订阅号A的服务平台,第二服务器14为订阅号B的服务平台。
在本申请的一个实施例中,用户通过终端设备11访问第一服务器12,获取各类资讯。第一服务器12记录了用户的操作记录。例如第一服务器12为社交平台的服务器,服务器记录了用户的浏览记录;又例如第一服务器12为电商平台的服务器,服务器除了记录用户的浏览记录外,还记录有用户的下单记录、加购(加入购物车)记录等。
在本申请的一个实施例中,用户通过终端设备11订阅第一服务器12上的一些订阅号。第一服务器12通过订阅号定期地向用户发送推送内容。例如第一服务器12为社交平台的服务器,用户关注社交平台的公众号,服务器每天或每周向用户发送公众号的推文;又例如第一服务器12为电商平台的服务器,用户关注电商平台上某家店铺的账号,服务器每周或每月向用户发送店铺上新产品。
在本申请的一个实施例中,第二服务器13或14通过调用第一服务器12提供的接口,将推送内容发送至第一服务器12,再由第一服务器12向用户的终端进行内容推送。
在本申请实施例中,订阅号可以是公众号、服务号、企业号等,对此本申请实施例不作任何限制。其中,订阅号主要为用户传达资讯,通常都是每天只可以发送一条消息。服务号主要为服务交互,例如银行、提供服务查询的企业、号码查询等,通常都是每个月发送几条消息。企业号主要为公司内容通讯使用,可以以小组形式推送信息。
下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本申请实施例提供的订阅号的内容推送方法的流程示意图一。本实施例提供的内容推送方法可应用于图1所示的第二服务器13或14。如图2所示,该内容推送方法具体包括如下步骤:
步骤101、获取关注订阅号的目标用户的操作记录的内容,以及与操作记录匹配的多个候选内容。
在本实施例中,目标用户的操作记录包括目标用户在关注的订阅号内或者订阅号的应用程序内的浏览记录、下单记录、加购记录的至少一项。
可选的,目标用户的操作记录可以指目标用户在当前时刻之前的预设时段内的操作记录。
在本申请的一个实施例中,可通过第二服务器(订阅号的服务器)或者第一服务器(应用程序服务器)的日志文件获取关注订阅号的目标用户的操作记录的内容。日志文件中记录了用户在订阅号或应用程序内的历史行为,通过用户的历史行为,可以了解到用户的兴趣偏好,并预测用户未来一段时间内可能的需求,例如购买产品或服务的需求、阅读话题新闻的需求。
上述操作记录的内容,具体是指操作记录对应的产品或资讯等。例如,操作记录为浏览记录,浏览记录的内容包括浏览的产品、文章、视频等;又例如,操作记录为下单记录,下单记录的内容包括下单产品的类别、下单产品的数量、下单产品的详情等;再例如,操作记录为加购记录,加购记录的内容包括加购产品的类别、加购数量、加购产品的详情等。
示例性的,以电商订阅号为例,可通过电商订阅号的服务器的日志文件收集用户行为,获取用户的操作记录的内容。收集的用户行为有:用户购物车里的所有的产品详情;用户在三天内浏览同一产品类目次数超过三次的产品集合;用户在过去五天内,有三天都浏览了同一产品类目的产品集合。通过收集的用户行为,读取用户行为所对应的操作记录的具体内容,从而获知用户近期感兴趣的产品。
在本实施例中,与操作记录匹配的多个候选内容可以指与操作记录的内容相似度高的多个候选产品或多个候选资讯(资讯包括文章、视频、音频等)。
示例性的,以候选内容为候选产品集合为例,可通过目标用户的操作记录的具体内容,确定目标用户购买产品的偏好,从而从产品集合中初步筛选出推荐的候选产品集合,将候选产品集合中的所有产品作为与目标用户的操作记录匹配的多个候选内容。
步骤102、确定操作记录的内容以及每个候选内容的特征向量。
在本申请的一个实施例中,可利用语言模型BERT对操作记录的内容以及每个候选内容进行文本特征提取,得到操作记录的内容的第一特征向量以及每个候选内容的第二特征向量。
其中,BERT是一个自然语言处理(Natural language processing,简称NLP)领域的语言模型,可用来对文本形式的内容进行编码处理,得到文本内容对应的数值型特征向量。
示例性的,图3为本申请实施例提供的文本特征提取的流程示意图,如图3所示,步骤102,具体包括如下步骤:
步骤1021、获取操作记录的内容的第一文本信息,以及每个候选内容的第二文本信息。
由上文可知,操作记录的内容包括操作记录对应的产品或资讯,获取操作记录的内容的第一文本信息可以理解为获取操作记录对应的产品或资讯中包括标题和/或正文的文本信息。同理,获取每个候选内容的第二文本信息可以理解为获取每个候选产品或资讯中包括标题和/正文的文本信息。
步骤1022、利用语言模型BERT的预设字典,将第一文本信息转换成第一数字序列,将每个候选内容的第二文本信息转换成第二数字序列。
语言模型BERT的预设字典即token-id字典,其中token是NLP中文本的最小处理单元,预设字典包括文本与数字的对应关系。
例如,文本为“今天天气真好”,本文中每个字分别对应数字16、24、24、86、55、70。又例如,文本为英文单词“unbeautiful”,根据单词的前后缀将该单词切分为三部分“un/beauti/ful”,切分后的词组分别对应数字2、3、4。
通过语言模型BERT的预设字典将文本信息中的中文和/或英文单词转换成机器可识别的自然语言处理文本,即数字序列,再将数字序列依次输入至语言模型BERT中,得到数字序列对应的特征向量。
可选的,在一些实施例中,利用语言模型BERT的预设字典,将第一文本信息转换成第一数字序列,将每个候选内容的第二文本信息转换成第二数字序列之前,还包括:分别对第一文本信息以及每个候选内容的第二文本信息,进行文本预处理,文本预处理至少包括分词处理。
上述示例已示出了一种英文文本的分词处理方式,即根据前后缀将单个英文单词进行切分。如遇到字典中不存在的单词,可以将该单词直接按照字母拆分,例如单词unknown,可切分为un/k/n/o/w/n。
上述示例已示出了一种中文文本的分词处理方式,即根据单个字的形式进行切分,实际上是分字。
可选的,在一些实施例中,文本预处理除了包括分词处理外,还包括:去除停用词、标点符号、大小写转换的至少一项。
其中,停用词是指文本中诸如“的”、“了”、“是”等对文本特征构建作用不大的词,可根据预设的停用词词典将其从文本信息中剔除。标点符号对语义特征的贡献不大,也应该剔除。大小写转换主要涉及英文文本,例如“5G”转换为“5g”,“APPLE”转换为“apple”等,便于统一进行特征表达处理。
可选的,在一些实施例中,文本预处理还包括:添加开始与结束标志。按照BERT模型输入格式的要求,要在文本前后分别加入“[CLS]”和“[SEP]”这两个token,作为文本的起始和结束标识,增加的这两个token被看作是两个“字”的大小。
例如,“[CLS]今天天气真好[SEP]”,该文本的长度为8。需要说明的是,预设字典还包括增加的两个token对应的数字,例如[CLS]对应数字0,[SEP]对应数字1,那么文本“[CLS]今天天气真好[SEP]”对应的数字序列为[0 16 24 24 86 55 70 1]。
步骤1023、将第一数字序列输入至语言模型BERT中,得到第一特征向量。
步骤1024、分别将每个候选内容的第二数字序列输入至语言模型BERT中,得到每个候选内容的第二特征向量。
第一特征向量和第二特征向量为文本特征向量,表征文本的语义特征。上述两个步骤用于提取特征向量,将步骤1022得到的各数字序列依次输入到经过GPU(图像处理器,即显卡)加速的语言模型BERT中,模型的最后一层输出的特征即为所需的文本特征向量。
步骤103、根据操作记录的内容以及每个候选内容的特征向量,从多个候选内容中确定第一推送内容。
步骤104、向目标用户的终端发送第一推送内容。
其中,第一推送内容是与操作记录的内容相似度最大的候选内容。
在本申请的一个实施例中,可根据操作记录的内容与每个候选内容的特征向量的相似度,从多个候选内容中确定第一推送内容。
可选的,两个特征向量之间的相似度可通过计算余弦相似度确定。
可选的,两个特征向量之间的相似度还可以通过欧氏距离、曼哈顿距离等计算公式确定。
在本申请的一个实施例中,通过确定操作记录的内容的第一特征向量与每个候选内容的第二特征向量的余弦相似度,将余弦相似度的值最接近1的候选内容作为第一推送内容。第一推送内容是与目标用户的操作记录的内容最相关的推送内容。
在本申请的一个实施例中,第一推送内容位于订阅号的推送界面的推送列表的顶部。
例如,用户的操作记录包括用户最近3天浏览产品的记录,第一推送内容是与该用户浏览产品相同或相似度最高的产品,可以将该产品作为订阅号推送文章中的“大图”文章(即推送列表或卡片的顶部),从而提升用户点击率和转化率。其中,转化率包括搜索转化率、UV(unique visitor的简写,指通过互联网访问、浏览店铺页面的人)订单转化率等。
通过上述步骤可实现对订阅号中每个用户进行个性化推荐,包括推荐个性化的产品、文章、视频、音频、活动等。
本实施例中,考虑到文本的精准匹配(或称为关键词匹配),仅仅只能为目标用户匹配与其历史行为绝对吻合的产品或资讯的标题文本,而无法匹配到不同词语表达但语义相同的标题文本,更无法扩展到其他与目标用户兴趣相关但并不完全相同的产品或资讯当中,本申请提出利用向量的模糊匹配替换上述文本匹配,可有效解决近义词匹配的问题,更可以通过调整相似度阈值,使得匹配结果扩展到其他相关产品或资讯中,提升推荐的多样性。
本实施例提供一种订阅号的内容推送方法,在向订阅号用户推送消息时,增加个性化推送内容。该方法包括:通过获取关注订阅号的目标用户的操作记录的内容以及与操作记录匹配的多个候选内容,确定操作记录的内容以及每个候选内容的特征向量,经特征向量的数据处理,从多个候选内容中确定与操作记录的内容相似度最大的第一推送内容,向目标用户端的终端发送第一推送内容。由于采用向量匹配方法选取订阅号的推送内容,在实现个性化推送的同时,还提升了推送内容的多样化。通过对推送内容的优化,可提升用户点击率。
考虑到订阅号的推送文章通常有数量限制,即一次只能发送最多N篇文章,例如N取5,通过上文实施例可以确定N篇文章中的顶部文章,那么剩余N-1篇文章是如何确定的。现有方案中,N篇文章均为近期比较热门的文章,没有针对用户进行针对性的推送。
为了增加目标用户对剩余N-1篇文章的点击率,可以考虑对订阅号的用户进行用户分组,例如根据用户的兴趣偏好划分为多个用户组,可以基于用户组内所有用户的操作记录情况匹配合适的文章,而不是向所有用户群发的剩余N-1篇文章完全相同,这样可以进一步提升用户组内用户对剩余N-1篇文章的点击率。
图4为本申请实施例提供的订阅号的内容推送方法的流程示意图二。本实施例提供的内容推送方法同样可应用于图1所示的第二服务器13或14。如图4所示,该内容推送方法具体包括如下步骤:
步骤201、获取与目标用户在同一用户组的每个用户的操作记录的内容。
在本申请的一个实施例中,目标用户所在的用户组可以是根据最近一次向目标用户推送的第一推送内容确定的。
具体的,获取与目标用户展示的第一推送内容相同的多个其他用户,将目标用户与多个其他用户划分到同一用户组,获取与目标用户在同一用户组的每个用户的操作记录的内容。
步骤202、确定用户组中每个用户的操作记录的内容的特征向量。
本实施例中,确定用户组中每个用户的操作记录的内容的特征向量可参照上述实施例步骤102中确定目标用户的操作记录的内容的特征向量的实现方式,此处不再赘述。
步骤203、根据用户组中每个用户的操作记录的内容的特征向量,确定平均特征向量。
在确定用户组中每个用户的操作记录的内容的特征向量后,分别计算用户组中所有用户在特征向量的每个特征维度的平均特征值,即可确定用户组所有用户的操作记录对应的平均特征向量。
示例性的,用户组包括用户1、用户2、用户3,用户1的操作记录对应的特征向量可表示为
Figure BDA0003014116130000131
用户2的操作记录对应的特征向量可表示为
Figure BDA0003014116130000132
用户3的操作记录对应的特征向量可表示为
Figure BDA0003014116130000133
该用户组的所有用户的平均特征向量可表示为:
Figure BDA0003014116130000134
步骤204、根据平均特征向量以及用户组的多个候选内容的特征向量,从用户组的多个候选内容中确定第二推送内容。
步骤205、向目标用户的终端发送第二推送内容。
第二推送内容是根据目标用户所在用户组的所有用户的操作记录确定的。
其中,第二推送内容的数量是至少一个,即可以从用户组的多个候选内容中确定至少一个第二推送内容。如果订阅号对于推送内容的数量限制为N个,那么第二推送内容的数量为N-1,其中N为大于或等于2的正整数。
在本申请的一个实施例中,可根据平均特征向量以及用户组的多个候选内容的特征向量的相似度,从用户组的多个候选内容中确定第二推送内容。
同上文实施例,两个特征向量之间的相似度可通过计算余弦相似度确定。
在本申请的一个实施例中,通过确定平均特征向量与用户组的每个候选内容的特征向量的余弦相似度,按照余弦相似度的大小排序,取前N-1个候选内容作为第二推送内容。第二推送内容是与用户组所有用户的操作记录的内容最相关的推送内容。示例性的,以产品推荐为例,第二推送内容是用户组下最多用户可能感兴趣的产品集合,产品集合包括N-1个推荐的产品。
在本申请的一个实施例中,第二推送内容位于订阅号的推送界面的顶部第一推送内容的下方,以展开或收起两种形式展示。第一推送内容下方展示的第二推送内容即订阅号推送文章中的“小图”文章。
需要说明的是,同一用户组的用户将会收到相同的第二推送内容,但同一用户组的用户收到的第一推送内容一般是不同的。
本实施例提供一种订阅号的内容推送方法,在向订阅号用户推送消息时,考虑用户所在用户组的其他用户的操作情况,推送用户组最多用户感兴趣的内容。该方法包括:通过获取与目标用户在同一用户组的每个用户的操作记录的内容,确定用户组中所有用户的操作记录的内容的平均特征向量,通过对平均特征向量以及用户组的多个候选内容的特征向量的相似度计算,从用户组的多个候选内容中选择合适的第二推送内容,从而向用户组的所有用户推送第二推送内容。由于采用向量匹配方法选取用户组内用户的推送内容,实现向用户推送近似用户群体的热门内容,可提升用户点击率。
图5为本申请实施例提供的订阅号的内容推送方法的流程示意图三。本实施例提供的内容推送方法同样可应用于图1所示的第二服务器13或14。如图5所示,该内容推送方法具体包括如下步骤:
步骤301、获取关注订阅号的目标用户的操作记录的内容,以及与操作记录匹配的多个候选内容。
步骤302、确定操作记录的内容以及每个候选内容的特征向量。
步骤303、根据操作记录的内容以及每个候选内容的特征向量,从多个候选内容中确定第一推送内容。
步骤304、获取与目标用户在同一用户组的每个用户的操作记录的内容。
步骤305、确定用户组中每个用户的操作记录的内容的特征向量。
步骤306、根据用户组中每个用户的操作记录的内容的特征向量,确定平均特征向量。
步骤307、根据平均特征向量以及用户组的多个候选内容的特征向量,从用户组的多个候选内容中确定第二推送内容。
步骤308、向目标用户的终端发送第一推送内容和第二推送内容。
上述步骤的具体实现原理和技术效果可参见上述几个实施例,此处不再赘述。
本实施例提供的订阅号内容推送方法,在向目标用户推送一个最感兴趣的第一推送内容的同时,还向目标用户推送近似用户群组中最多用户感兴趣的第二推送内容。上述方案在满足推送文章数量限制的情况下,考虑用户自身的兴趣偏好以及用户所在用户组的所有用户的兴趣偏好,最大化地提升每个用户获得个性化内容推荐的程度。另外,采用语言模型对用户操作记录的内容以及候选内容进行特征构建,克服了关键词匹配无法解决近义词匹配的问题,可将内容推荐扩展到相似但不相同的其他内容中,增加了推荐内容的多样化。
示例性的,图6为本申请实施例提供的订阅号的推送界面的推送消息的示意图,如图6所示,推送界面401的推送消息包括一个第一推送内容以及3个第二推送内容,其中第一推送内容是与目标用户的兴趣偏好直接相关的内容,第二推送内容是与目标用户所在用户组的所有用户的整体兴趣偏好相关的内容。
一种可能的实现方式中,3个第二推送内容可以以平铺形式展示在推送界面,如图6的(a)。
一种可能的实现方式中,推送界面仅展示第一推送内容,3个第二推送内容同时被收起(即隐藏),如图6的(b)。
一种可能的实现方式中,推送界面展示第一推送内容以及一个第二推送内容,其余的第二推送内容被收起,如图6的(c)。
用户可通过点击箭头查看被收起的第二推送内容。
本申请实施例可以根据上述方法实施例对订阅号的内容推送装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以使用硬件的形式实现,也可以使用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。下面以使用对应各个功能划分各个功能模块为例进行说明。
图7为本申请实施例提供的订阅号的内容推送装置的结构示意图。如图7所示,本实施例提供的内容推送装置500,包括:获取模块501,处理模块502以及发送模块503。
获取模块501,用于获取关注订阅号的目标用户的操作记录的内容,以及与所述操作记录匹配的多个候选内容;
处理模块502,用于确定所述操作记录的内容以及每个候选内容的特征向量;
根据所述操作记录的内容以及每个候选内容的特征向量,从所述多个候选内容中确定第一推送内容;所述第一推送内容是与所述操作记录的内容相似度最大的候选内容;
发送模块503,用于向所述目标用户的终端发送所述第一推送内容。
在本申请的一个实施例中,处理模块502,具体用于:
利用语言模型BERT对所述操作记录的内容以及每个候选内容进行文本特征提取,得到所述操作记录的内容的第一特征向量以及每个候选内容的第二特征向量。
在本申请的一个实施例中,获取模块501,具体用于:
获取所述操作记录的内容的第一文本信息,以及每个候选内容的第二文本信息;
处理模块502,具体用于:
利用所述语言模型BERT的预设字典,将所述第一文本信息转换成第一数字序列,将每个候选内容的第二文本信息转换成第二数字序列;
分别将所述第一数字序列以及每个候选内容的第二数字序列,输入至所述语言模型BERT中,得到所述第一特征向量以及每个候选内容的第二特征向量。
在本申请的一个实施例中,处理模块502利用所述语言模型BERT的预设字典,将所述第一文本信息转换成第一数字序列,将每个候选内容的第二文本信息转换成第二数字序列之前,还用于:
分别对所述第一文本信息以及每个候选内容的第二文本信息,进行文本预处理,所述文本预处理至少包括分词处理。
在本申请的一个实施例中,处理模块502,具体用于:
确定所述操作记录的内容的第一特征向量与每个候选内容的第二特征向量的余弦相似度;
将所述余弦相似度的值最接近1的候选内容作为所述第一推送内容。
在本申请的一个实施例中,所述第一推送内容位于所述订阅号的推送界面的推送列表的顶部。
在本申请的一个实施例中,发送模块503,还用于:向所述目标用户的终端发送第二推送内容,所述第二推送内容是根据所述目标用户所在用户组的所有用户的操作记录确定的。
在本申请的一个实施例中,获取模块501,还用于:
获取与所述目标用户在同一用户组的每个用户的操作记录的内容;
处理模块502,还用于:
确定所述用户组中每个用户的操作记录的内容的特征向量;
根据所述用户组中每个用户的操作记录的内容的特征向量,确定平均特征向量;
根据所述平均特征向量以及所述用户组的多个候选内容的特征向量,从所述用户组的多个候选内容中确定所述第二推送内容。
在本申请的一个实施例中,获取模块501,具体用于:
获取与所述目标用户展示的所述第一推送内容相同的多个其他用户;
处理模块502,还用于将所述目标用户与所述多个其他用户划分到同一用户组;
获取模块501,还用于获取与所述目标用户在同一用户组的每个用户的操作记录的内容。
可选的,所述操作记录包括浏览记录、下单记录、加购记录的至少一项。
本实施例提供的订阅号的内容推送装置,可以执行上述任一方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图8为本申请实施例提供的电子设备的硬件结构图,如图8所示,本实施例提供的电子设备600,包括:
存储器601;
处理器602;以及
计算机程序;
其中,计算机程序存储在存储器601中,并被配置为由处理器602执行以实现上述任一方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
可选的,存储器601既可以是独立的,也可以跟处理器602集成在一起。当存储器601是独立于处理器602之外的器件时,电子设备600还包括:总线604,用于连接存储器601和处理器602。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器602执行以实现如前述任一方法实施例中的技术方案。
本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如前述任一方法实施例中的技术方案。
本申请实施例还提供了一种芯片,包括:处理模块与通信接口,该处理模块能执行前述任一方法实施例中的技术方案。
进一步地,该芯片还包括存储模块(如,存储器),存储模块用于存储指令,处理模块用于执行存储模块存储的指令,并且对存储模块中存储的指令的执行使得处理模块执行前述任一方法实施例中的技术方案。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备中。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例的技术方案的范围。

Claims (14)

1.一种订阅号的内容推送方法,其特征在于,包括:
获取关注订阅号的目标用户的操作记录的内容,以及与所述操作记录匹配的多个候选内容;
确定所述操作记录的内容以及每个候选内容的特征向量;
根据所述操作记录的内容以及每个候选内容的特征向量,从所述多个候选内容中确定第一推送内容;所述第一推送内容是与所述操作记录的内容相似度最大的候选内容;
向所述目标用户的终端发送所述第一推送内容。
2.根据权利要求1所述的方法,其特征在于,所述确定所述操作记录的内容以及每个候选内容的特征向量,包括:
利用语言模型BERT对所述操作记录的内容以及每个候选内容进行文本特征提取,得到所述操作记录的内容的第一特征向量以及每个候选内容的第二特征向量。
3.根据权利要求2所述的方法,其特征在于,利用语言模型BERT对所述操作记录的内容以及每个候选内容进行文本特征提取,得到所述操作记录的内容的第一特征向量以及每个候选内容的第二特征向量,包括:
获取所述操作记录的内容的第一文本信息,以及每个候选内容的第二文本信息;
利用所述语言模型BERT的预设字典,将所述第一文本信息转换成第一数字序列,将每个候选内容的第二文本信息转换成第二数字序列;
分别将所述第一数字序列以及每个候选内容的第二数字序列,输入至所述语言模型BERT中,得到所述第一特征向量以及每个候选内容的第二特征向量。
4.根据权利要求3所述的方法,其特征在于,利用所述语言模型BERT的预设字典,将所述第一文本信息转换成第一数字序列,将每个候选内容的第二文本信息转换成第二数字序列之前,所述方法还包括:
分别对所述第一文本信息以及每个候选内容的第二文本信息,进行文本预处理,所述文本预处理至少包括分词处理。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述操作记录的内容以及每个候选内容的特征向量,从所述多个候选内容中确定第一推送内容,包括:
确定所述操作记录的内容的第一特征向量与每个候选内容的第二特征向量的余弦相似度;
将所述余弦相似度的值最接近1的候选内容作为所述第一推送内容。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述第一推送内容位于所述订阅号的推送界面的推送列表的顶部。
7.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:向所述目标用户的终端发送第二推送内容,所述第二推送内容是根据所述目标用户所在用户组的所有用户的操作记录确定的。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
获取与所述目标用户在同一用户组的每个用户的操作记录的内容;
确定所述用户组中每个用户的操作记录的内容的特征向量;
根据所述用户组中每个用户的操作记录的内容的特征向量,确定平均特征向量;
根据所述平均特征向量以及所述用户组的多个候选内容的特征向量,从所述用户组的多个候选内容中确定所述第二推送内容。
9.根据权利要求8所述的方法,其特征在于,所述获取与所述目标用户在同一用户组的每个用户的操作记录的内容,包括:
获取与所述目标用户展示的所述第一推送内容相同的多个其他用户;
将所述目标用户与所述多个其他用户划分到同一用户组;
获取与所述目标用户在同一用户组的每个用户的操作记录的内容。
10.根据权利要求1至4中任一项所述的方法,其特征在于,所述操作记录包括浏览记录、下单记录、加购记录的至少一项。
11.一种订阅号的内容推送装置,其特征在于,包括:
获取模块,用于获取关注订阅号的目标用户的操作记录的内容,以及与所述操作记录匹配的多个候选内容;
处理模块,用于确定所述操作记录的内容以及每个候选内容的特征向量;
根据所述操作记录的内容以及每个候选内容的特征向量,从所述多个候选内容中确定第一推送内容;所述第一推送内容是与所述操作记录的内容相似度最大的候选内容;
发送模块,用于向所述目标用户的终端发送所述第一推送内容。
12.一种电子设备,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1至10中任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1至10中任一项所述的方法。
14.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法。
CN202110384050.4A 2021-04-09 2021-04-09 订阅号的内容推送方法、装置、设备及存储介质 Pending CN113111259A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110384050.4A CN113111259A (zh) 2021-04-09 2021-04-09 订阅号的内容推送方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110384050.4A CN113111259A (zh) 2021-04-09 2021-04-09 订阅号的内容推送方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN113111259A true CN113111259A (zh) 2021-07-13

Family

ID=76715315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110384050.4A Pending CN113111259A (zh) 2021-04-09 2021-04-09 订阅号的内容推送方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113111259A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114650268A (zh) * 2022-04-14 2022-06-21 北京字跳网络技术有限公司 内容推送方法、装置、电子设备、介质及程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106168971A (zh) * 2016-07-08 2016-11-30 北京麒麟合盛网络技术有限公司 信息订阅方法及装置
CN110209931A (zh) * 2019-05-17 2019-09-06 腾讯科技(深圳)有限公司 媒体内容的推送方法和装置、存储介质、电子装置
CN111708950A (zh) * 2020-06-22 2020-09-25 腾讯科技(深圳)有限公司 内容推荐方法、装置及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106168971A (zh) * 2016-07-08 2016-11-30 北京麒麟合盛网络技术有限公司 信息订阅方法及装置
CN110209931A (zh) * 2019-05-17 2019-09-06 腾讯科技(深圳)有限公司 媒体内容的推送方法和装置、存储介质、电子装置
CN111708950A (zh) * 2020-06-22 2020-09-25 腾讯科技(深圳)有限公司 内容推荐方法、装置及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114650268A (zh) * 2022-04-14 2022-06-21 北京字跳网络技术有限公司 内容推送方法、装置、电子设备、介质及程序产品
CN114650268B (zh) * 2022-04-14 2024-01-30 北京字跳网络技术有限公司 内容推送方法、装置、电子设备、介质及程序产品

Similar Documents

Publication Publication Date Title
JP6511487B2 (ja) 情報プッシュ用の方法及び装置
US8725717B2 (en) System and method for identifying topics for short text communications
US20150324448A1 (en) Information Recommendation Processing Method and Apparatus
CN106033415B (zh) 文本内容推荐方法及装置
CN102215300B (zh) 电信业务推荐方法和***
CN107885717B (zh) 一种关键词提取方法及装置
CN106776860A (zh) 一种搜索摘要生成方法及装置
US9390168B1 (en) Customer keyword-based item recommendations
CN107332905A (zh) 信息推送方法、装置及服务器
CN108021619A (zh) 一种事件描述对象推荐方法及装置
CN111191454A (zh) 一种实体匹配的方法及装置
CN111429214B (zh) 一种基于交易数据的买卖双方匹配方法及装置
KR20080019392A (ko) 문서 자동 편집 장치 및 그 방법
CN115018588A (zh) 产品推荐方法、装置、电子设备及可读存储介质
CN108470289B (zh) 基于电商购物平台的虚拟物品发放方法及设备
CN113111259A (zh) 订阅号的内容推送方法、装置、设备及存储介质
CN113821727A (zh) 物品推荐方法、计算机设备及计算机可读存储介质
CN111353836B (zh) 商品推荐方法、装置及设备
CN116823410A (zh) 数据处理方法、对象处理方法、推荐方法及计算设备
CN108694171B (zh) 信息推送的方法及装置
CN111091218A (zh) 竞价预测模型的生成以及广告投放自动出价方法和装置
CN114255067A (zh) 数据定价方法和装置、电子设备、存储介质
CN109978645B (zh) 一种数据推荐方法和装置
CN109947947B (zh) 一种文本分类方法、装置及计算机可读存储介质
CN109408725B (zh) 用于确定用户兴趣的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination