CN115905670A - 内容推荐方法、装置、设备及可读存储介质 - Google Patents
内容推荐方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN115905670A CN115905670A CN202110960463.2A CN202110960463A CN115905670A CN 115905670 A CN115905670 A CN 115905670A CN 202110960463 A CN202110960463 A CN 202110960463A CN 115905670 A CN115905670 A CN 115905670A
- Authority
- CN
- China
- Prior art keywords
- account
- content
- category
- determining
- media content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种内容推荐方法、装置、设备及可读存储介质,属于人工智能技术领域。方法包括:获取待推荐内容;获取待推荐内容对应的第一账号的信息,第一账号是目标对象在第一应用程序的账号,目标对象为发布待推荐内容的对象;基于第一账号的信息,确定账号质量指标,账号质量指标用于表征第一账号的质量;基于账号质量指标,确定待推荐内容在第一应用程序的推荐结果。实现了将优质账号的内容推荐给用户,提高推荐内容的质量。
Description
技术领域
本申请实施例涉及人工智能技术领域,特别涉及一种内容推荐方法、装置、设备及可读存储介质。
背景技术
在信息流场景中,媒体内容的推荐至关重要。一般来说,应用程序推荐的媒体内容质量越高、与用户兴趣的相关度越高,越能吸引用户点击媒体内容,提高应用程序的使用时长。
相关技术中,应用程序推荐目标对象的媒体内容时,根据其他对象对各个待推荐内容的行为信息,从各个待推荐内容中确定目标内容,并基于应用程序将目标内容推荐给目标对象。其他对象是除目标对象之外的对象,其他对象对待推荐内容的行为信息包括但不限于点赞待推荐内容的行为信息、关注待推荐内容的行为信息、分享待推荐内容的行为信息等。
上述内容推荐方式仅根据其他对象对待推荐内容的行为信息,将待推荐内容中的目标内容推荐给目标对象,推荐内容的质量较差,准确性较低,导致信息流的生态环境较差,应用程序的使用时长较低。
发明内容
本申请实施例提供了一种内容推荐方法、装置、设备及可读存储介质,可用于提高推荐内容的质量和准确性,完善信息流的生态环境,增加应用程序的使用时长,所述技术方案包括如下内容。
一方面,本申请实施例提供了一种内容推荐方法,所述方法包括:
获取待推荐内容;
获取所述待推荐内容对应的第一账号的信息,所述第一账号是目标对象在第一应用程序的账号,所述目标对象为发布所述待推荐内容的对象;
基于所述第一账号的信息,确定账号质量指标,所述账号质量指标用于表征所述第一账号的质量;
基于所述账号质量指标,确定所述待推荐内容在所述第一应用程序的推荐结果。
在一种可能的实现方式中,所述第一账号的信息包括所述第一账号中的各个媒体内容的发布时间;
所述基于所述第一账号的信息,确定账号质量指标,包括:
基于所述各个媒体内容的发布时间,确定发布时间方差;
基于所述发布时间方差,确定所述账号质量指标。
在一种可能的实现方式中,所述基于所述各个媒体内容的发布时间,确定发文波动指标,包括:
基于所述各个媒体内容的发布时间,确定至少一个分位数,所述分位数用于表征目标时间段的媒体内容的数量与所述各个媒体内容的数量的占比;
基于所述至少一个分位数,确定所述发文波动指标。
在另一种可能的实现方式中,所述基于所述第一账号的信息,确定账号质量指标,包括:
基于所述访问所述第一账号的对象数量、所述第一账号对应的资源数量、所述第一账号中的各个媒体内容的评论数量、所述各个媒体内容的分享数量、所述各个媒体内容的点击数量、所述各个媒体内容的点赞数量、所述各个媒体内容的观看完成数量或所述各个媒体内容的曝光数量中的至少一项,确定账号受欢迎指标,所述账号受欢迎指标用于表征所述第一账号受所述第一应用程序中的对象的欢迎程度;
基于所述账号受欢迎指标,确定所述账号质量指标。
在另一种可能的实现方式中,所述基于所述账号质量指标,确定所述待推荐内容在所述第一应用程序的推荐结果之后,还包括:
响应于所述待推荐内容的推荐结果为推荐,基于所述第一应用程序对所述待推荐内容进行推荐;
响应于所述待推荐内容的推荐结果为不推荐,过滤掉所述待推荐内容。
另一方面,本申请实施例提供了一种内容推荐装置,所述装置包括:
获取模块,用于获取待推荐内容;
所述获取模块,还用于获取所述待推荐内容对应的第一账号的信息,所述第一账号是目标对象在第一应用程序的账号,所述目标对象为发布所述待推荐内容的对象;
确定模块,用于基于所述第一账号的信息,确定账号质量指标,所述账号质量指标用于表征所述第一账号的质量;
所述确定模块,还用于基于所述账号质量指标,确定所述待推荐内容在所述第一应用程序的推荐结果。
在一种可能的实现方式中,所述确定模块,用于基于所述第一账号的信息和所述第一应用程序中各个账号的关注行为信息,确定第一对象影响力指标,所述第一对象影响力指标用于表征所述目标对象在所述第一应用程序的影响力;基于所述第一对象影响力指标,确定所述账号质量指标。
在一种可能的实现方式中,所述确定模块,用于获取所述待推荐内容对应的至少一个第二账号的等级信息,所述第二账号是所述目标对象在第二应用程序的账号,所述第二应用程序为除所述第一应用程序之外的应用程序;基于各个第二账号的等级信息,确定第二对象影响力指标,所述第二对象影响力指标用于表征所述目标对象在所述第二应用程序的影响力;基于所述第一对象影响力指标和所述第二对象影响力指标,确定所述账号质量指标。
在一种可能的实现方式中,所述第一账号的信息包括所述第一账号中的各个媒体内容的发布时间;
所述确定模块,用于基于所述各个媒体内容的发布时间,确定发布时间方差;基于所述发布时间方差,确定所述账号质量指标。
在一种可能的实现方式中,所述第一账号的信息包括所述第一账号中的各个媒体内容的内容信息和所述各个媒体内容中第一内容的数量;
所述确定模块,用于基于所述各个媒体内容的内容信息,确定内容质量指标,所述内容质量指标用于表征媒体内容的质量;基于所述第一内容的数量,确定第一内容概率,所述第一内容概率用于表征所述目标对象发布第一内容的概率;基于所述内容质量指标和所述第一内容概率,确定所述账号质量指标。
在一种可能的实现方式中,所述确定模块,用于基于所述各个媒体内容的内容信息,确定第一关键词;基于所述各个媒体内容中存在所述第一关键词的媒体内容的数量和所述第一应用程序中目标账号的数量,确定所述内容质量指标,所述目标账号为账号中的媒体内容存在所述第一关键词的账号。
在一种可能的实现方式中,所述第一账号的信息包括至少一个第一类别,所述第一类别为所述第一账号中的媒体内容所属的类别;
所述确定模块,用于基于所述各个媒体内容所属的第一类别,确定各个第一类别对应的媒体内容占比;基于所述各个第一类别对应的媒体内容占比确定第一类别指标,所述第一类别指标用于表征所述第一账号中第一类别的集中程度;基于所述第一类别指标,确定所述账号质量指标。
在一种可能的实现方式中,所述第一账号的信息包括所述第一账号的简介信息、所述第一账号的名称信息以及至少一个第一类别,所述第一类别为所述第一账号中的媒体内容所属的类别;
所述确定模块,用于基于所述第一账号中的各个媒体内容所属的类别,从所述至少一个第一类别中确定媒体内容数据最多的目标类别;基于所述简介信息和所述名称信息,确定所述第一账号属于各个第二类别的概率;从所述第一账号属于各个第二类别的概率中提取所述第一账号属于目标类别的概率;基于所述第一账号属于目标类别的概率,确定所述账号质量指标。
在一种可能的实现方式中,所述第一账号的信息包括所述第一账号中的各个媒体内容的内容信息;
所述确定模块,用于基于所述各个媒体内容的内容信息,确定所述第一账号的搬运特征,所述搬运特征用于表征所述各个媒体内容中属于搬运的媒体内容;基于所述第一账号的搬运特征,确定所述第一账号属于搬运账号的概率,所述搬运账号中的媒体内容为搬运的媒体内容;基于所述第一账号属于搬运账号的概率,确定所述账号质量指标。
在一种可能的实现方式中,所述确定模块,用于基于所述各个媒体内容的内容信息,确定第二关键词;基于样本搬运账号中的各个样本搬运内容的内容信息,确定第三关键词;基于样本非搬运账号中的各个样本非搬运内容的内容信息,确定第四关键词;基于所述第二关键词、所述第三关键词和所述第四关键词,确定所述第一账号的搬运特征。
在一种可能的实现方式中,所述第一账号的信息包括所述第一账号中的各个媒体内容所属的第一类别和所述各个媒体内容的发布时间;
所述确定模块,用于基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定类别波动指标,所述类别波动指标用于表征所述目标对象发布媒体内容的类别波动程度;基于所述各个媒体内容的发布时间,确定发文波动指标,所述发文波动指标用于表征所述目标对象发布媒体内容的时间波动程度;基于所述类别波动指标和所述发文波动指标,确定所述账号质量指标。
在一种可能的实现方式中,所述确定模块,用于基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定第一波动指标,所述第一波动指标用于表征所述目标对象发布的任意一个媒体内容的类别波动程度;基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定第二波动指标,所述第二波动指标用于表征所述目标对象发布的任意两个媒体内容之间的类别波动程度;基于所述第一波动指标和所述第二波动指标,确定所述类别波动指标。
在一种可能的实现方式中,所述确定模块,用于基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定所述各个媒体内容按照发布时间排序后的前第一数量个媒体内容的第一类别;对第一类别序列进行切分,得到至少两个类别段,所述第一类别序列是按照发布时间排序后的所述各个媒体内容的第一类别所组成的序列;基于所述至少两个类别段,确定相邻类别段之间的类别相似度;基于所述相邻类别段之间的类别相似度和所述前第一数量个媒体内容的第一类别,确定第一波动指标。
在一种可能的实现方式中,所述确定模块,用于基于所述各个媒体内容所属的第一类别,确定相邻媒体内容之间的类别相似度,所述相邻媒体内容是所述各个媒体内容按照发布时间排序后的相邻的媒体内容;
基于所述相邻媒体内容之间的类别相似度,确定第二波动指标。
在一种可能的实现方式中,所述确定模块,用于基于所述各个媒体内容的发布时间,确定至少一个分位数,所述分位数用于表征目标时间段的媒体内容的数量与所述各个媒体内容的数量的占比;基于所述至少一个分位数,确定所述发文波动指标。
在一种可能的实现方式中,所述确定模块,用于基于所述访问所述第一账号的对象数量、所述第一账号对应的资源数量、所述第一账号中的各个媒体内容的评论数量、所述各个媒体内容的分享数量、所述各个媒体内容的点击数量、所述各个媒体内容的点赞数量、所述各个媒体内容的观看完成数量或所述各个媒体内容的曝光数量中的至少一项,确定账号受欢迎指标,所述账号受欢迎指标用于表征所述第一账号受所述第一应用程序中的对象的欢迎程度;基于所述账号受欢迎指标,确定所述账号质量指标。
在一种可能的实现方式中,所述装置还包括:
推荐模块,用于响应于所述待推荐内容的推荐结果为推荐,基于所述第一应用程序对所述待推荐内容进行推荐;
过滤模块,用于响应于所述待推荐内容的推荐结果为不推荐,过滤掉所述待推荐内容。
另一方面,本申请实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以使所述电子设备实现上述任一所述的内容推荐方法。
另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以使计算机实现上述任一所述的内容推荐方法。
另一方面,还提供了一种计算机程序或计算机程序产品,所述计算机程序或计算机程序产品中存储有至少一条计算机指令,所述至少一条计算机指令由处理器加载并执行,以使计算机实现上述任一种内容推荐方法。
本申请实施例提供的技术方案至少带来如下有益效果:
本申请实施例提供的技术方案基于待推荐内容对应的第一账号的信息,确定账号质量指标,该账号质量指标用于表征第一账号的质量,基于账号质量指标,确定待推荐内容在第一应用程序的推荐结果,实现了将优质账号的内容推荐给用户,提高推荐内容的质量和准确性,完善信息流的生态环境,从而提高应用程序的使用时长。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种内容推荐方法的实施环境示意图;
图2是本申请实施例提供的一种内容推荐方法的流程图;
图3是本申请实施例提供的一种号文一致性的检测流程图;
图4是本申请实施例提供的一种因子分解机(Factorization Machines,FM)模型的结构示意图;
图5是本申请实施例提供的一种深度神经网络(Deep Neural Networks,DNN)模型的结构示意图;
图6是本申请实施例提供的一种深度因子分解机(Deep-FactorizationMachines,Deep-FM)模型的结构示意图;
图7是本申请实施例提供的一种文章推荐的示意图;
图8是本申请实施例提供的一种内容推荐装置的结构示意图;
图9是本申请实施例提供的一种终端设备的结构示意图;
图10是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1是本申请实施例提供的一种内容推荐方法的实施环境示意图,如图1所示该实施环境包括电子设备11,本申请实施例中的内容推荐方法可以由电子设备11执行。示例性地,电子设备11可以包括终端设备或者服务器中的至少一项。
终端设备可以是智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器和膝上型便携计算机中的至少一种。
服务器可以为一台服务器,或者为多台服务器组成的服务器集群,或者为云计算平台和虚拟化中心中的任意一种,本申请实施例对此不加以限定。服务器可以与终端设备通过有线网络或无线网络进行通信连接。服务器可以具有数据处理、数据存储以及数据收发等功能,在本申请实施例中不加以限定。
本申请实施例的内容推荐方法是基于人工智能技术实现的,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是人工智能的核心,属于人工智能的一个分支,是一个大的领域。ML让计算机拥有像人一样的学习能力,模拟和实现人的学习行为和能力,像人一样具有识别和判断的能力,可以看作是仿生学。机器学习的核心就是数据、算法(模型)和算力(计算机运算能力)。它是多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
基于上述实施环境,本申请实施例提供了一种内容推荐方法,以图2所示的本申请实施例提供的一种内容推荐方法的流程图为例,该方法可由图1中的电子设备11执行。如图2所示,该方法包括步骤21-步骤24。
步骤21,获取待推荐内容。
待推荐内容是目标对象在第一应用程序中发布的媒体内容。待推荐内容为至少一个,包括但不限于文本内容、图像内容、音频内容、视频内容等中的至少一项。待推荐内容可以是用户原创的媒体内容,也可以是用户电子设备本地存储的媒体内容,还可以是网络抓取得到的媒体内容,在本申请实施例中不做限定。
目标对象包括但不限于人物、智能机器人等。本申请也不对第一应用程序的类型不做限定,示例性的,第一应用程序包括但不限于视频类应用程序、美食类应用程序、文本类应用程序、音乐类应用程序、游戏类应用程序、即时通信类应用程序等。
步骤22,获取待推荐内容对应的第一账号的信息,第一账号是目标对象在第一应用程序的账号,目标对象为发布待推荐内容的对象。
本申请实施例中,目标对象在第一应用程序中注册有第一账号,目标对象在第一应用程序中发布媒体内容时,使用第一账号发布该媒体内容。因此,待推荐内容与第一账号存在对应关系,在获取到待推荐内容后,可以直接获取到待推荐内容对应的第一账号,从而获取到第一账号的信息。
本申请实施例中,对第一账号的信息不做限定。示例性的,第一账号的信息包括但不限于第一账号中各个媒体内容的发布时间、第一账号中各个媒体内容的内容信息、第一账号中各个媒体内容的类别等、第一账号所对应的目标对象的信息、关注第一账号的对象所对应的行为信息、取消关注第一账号的对象所对应的行为信息等。
步骤23,基于第一账号的信息,确定账号质量指标,账号质量指标用于表征第一账号的质量。
本申请实施例中,按照如下所示的步骤231-步骤238中的至少一项,确定账号质量指标。
步骤231,基于第一账号的信息,确定账号质量指标,包括:基于第一账号的信息和第一应用程序中各个账号的关注行为信息,确定第一对象影响力指标,第一对象影响力指标用于表征目标对象在第一应用程序的影响力;基于第一对象影响力指标,确定账号质量指标。
其中,第一账号的信息包括关注第一账号的对象所对应的关注行为信息、取消关注第一账号的对象所对应的关注行为信息、关注第一账号的对象数量或取消关注第一账号的对象数量中的至少一项。
关注行为信息包括但不限于关注行为的相关信息(例如关注时间、关注的账号等)、取消关注行为(例如取消关注的时间、取消关注的账号等)。
关注第一账号的对象所对应的关注行为信息包括但不限于:关注第一账号的对象所对应的关注时间(即对象关注第一账号的时间)、关注第一账号的对象所关注的账号(即对象关注的第一应用程序的账号)、关注第一账号的对象所取消关注的账号(即对象取消关注的第一应用程序的账号)等。
取消关注第一账号的对象所对应的关注行为信息包括但不限于:取消关注第一账号的对象所对应的关注时间(即对象关注第一账号的时间)、取消关注第一账号的对象所对应的取消关注时间(即对象取消关注第一账号的时间)、取消关注第一账号的对象所关注的账号(即对象关注的第一应用程序的账号)、取消关注第一账号的对象所取消关注的账号(即对象取消关注的第一应用程序的账号)等。
第一应用程序中各个账号的关注行为信息包括但不限于:第一应用程序中存在关注行为的账号、第一应用程序中存在取消关注行为的账号。
在一种可能的实现方式中,按照如下所示的公式(1),基于第一账号的信息和第一应用程序中各个账号的行为信息,确定第一对象影响力指标。
其中,si为第一对象影响力指标,Ai为关注第一账号的对象数量,η为表征平滑作用的参数(即平滑系数),η的取值不做限定,示例性的,η=10。为关注第一账号的对象集合,为关注第一账号的对象u的权重,t0为当前时间,为对象u关注第一账号的时间,σ为表征平滑作用的参数,σ的取值不做限定,示例性的,σ=1。为取消关注第一账号的对象集合,为取消关注第一账号的对象u的权重,为对象u取消关注第一账号的时间,α为控制参数,α的取值不做限定,示例性的,α=2。P+为第一应用程序中存在关注行为的账号集合,P-为第一应用程序中存在取消关注行为的账号集合,为对象u所关注的第一应用程序的账号集合,为对象u所取消关注的第一应用程序的账号集合。
其中,基于第一对象影响力指标,确定账号质量指标,包括:获取待推荐内容对应的至少一个第二账号的等级信息,第二账号是目标对象在第二应用程序的账号,第二应用程序为除第一应用程序之外的应用程序;基于各个第二账号的等级信息,确定第二对象影响力指标,第二对象影响力指标用于表征目标对象在第二应用程序的影响力;基于第一对象影响力指标和第二对象影响力指标,确定账号质量指标。
第一应用程序与第二应用程序是不同的应用程序,第二应用程序为至少一个,一个对象在第一应用程序中注册第一账号,在各个第二应用程序中注册对应的第二账号。
本申请实施例中,在获取到待推荐内容后,可以确定出待推荐内容对应的第一账号的信息,从而确定第一账号对应的目标对象。获取目标对象在各个第二应用程序的第二账号,从而获取到目标对象对应的各个第二账号的等级信息。
需要说明的是,不同第二应用程序中的第二账号的等级信息可以不同。例如,第二应用程序A的等级为1-5共五个等级,目标对象的第二账号的等级信息为1-5中的任意一个。第二应用程序B的等级为1-30共三十个等级,目标对象的第二账号的等级信息为1-30中的任意一个。
在一种可能的实现方式中,按照如下所示的公式(2),基于各个第二账号的等级信息,确定第二对象影响力指标。
其中,Si为第二对象影响力指标,Pi为目标对象在第二应用程序的账号集合,lp为目标对象在第二应用程序的账号p的等级信息。
本申请实施例中,确定出第一对象影响力指标之后,对第一对象影响力指标进行归一化处理,确定出第二对象影响力指标之后,对第二对象影响力指标进行归一化处理。之后,基于第一对象影响力指标的权重、归一化处理的第一对象影响力指标、第二对象影响力指标的权重、归一化处理的第二对象影响力指标,确定目标对象影响力指标。其中,第一对象影响力指标的权重和第二对象影响力指标的权重大小和确定方式不做限定。
之后,将目标对象影响力指标作为账号质量指标,或者基于目标对象影响力指标确定账号质量指标。
步骤232,第一账号的信息包括第一账号中的各个媒体内容的发布时间;基于第一账号的信息,确定账号质量指标,包括:基于各个媒体内容的发布时间,确定发布时间方差;基于发布时间方差,确定账号质量指标。
其中,发布时间方差为第一时间段的发布时间方差,第一时间段为至少两个。第一时间段包括至少两个单位时间,单位时间不做限定。示例性的,单位时间为若干小时、若干天、若干周、若干月、若干年等,若干为正整数,且大于或者等于1。
本申请实施例中,基于各个媒体内容的发布时间,确定第一发布时间段内的媒体内容,第一发布时间段包括至少两个第一时间段。基于第一发布时间段内各个媒体内容的发布时间,确定平均发布时间。基于各个第一时间段内各个媒体内容的发布时间,确定各个第一时间段的发布时间方差。基于各个第一时间段的发布时间方差,确定发布时间方差的方差,基于各个第一时间段的发布时间方差和发布时间方差的方差,确定发布时间指标,该发布时间指标用于表征目标对象发布媒体内容的稳定性。
在一种可能的实现方式中,按照如下所示的公式(3),基于各个媒体内容的发布时间,确定至少两个第一时间段的发布时间方差,基于各个第一时间段的发布时间方差,确定发布时间指标。
其中,Hi为发布时间指标,η为平滑系数,η的取值不做限定,α为控制参数,α的取值不做限定,β为控制参数,β的取值不做限定,σ1为第一时间段的发布时间方差,σ2为发布时间方差的方差。在理想情况下,σ1和σ2均为0,表示发布时间的稳定性非常高。
之后,将发布时间指标作为账号质量指标,或者基于发布时间指标,确定账号质量指标。
步骤233,第一账号的信息包括第一账号中的各个媒体内容的内容信息和各个媒体内容中第一内容的数量;基于第一账号的信息,确定账号质量指标,包括:基于各个媒体内容的内容信息,确定内容质量指标,内容质量指标用于表征媒体内容的质量;基于第一内容的数量,确定第一内容概率,第一内容概率用于表征目标对象发布第一内容的概率;基于内容质量指标和第一内容概率,确定账号质量指标。
本申请实施例中,媒体内容的内容信息包括但不限于标题信息、标签信息、正文信息等。第一内容是带有第一标签的内容,第一标签包括但不限于原创、优质等,因此,第一内容包括但不限于原创内容、优质内容等。
在一种可能的实现方式中,基于各个媒体内容的内容信息,确定内容质量指标,包括:基于各个媒体内容的内容信息,确定第一关键词;基于各个媒体内容中存在第一关键词的媒体内容的数量和第一应用程序中目标账号的数量,确定内容质量指标,目标账号为账号中的媒体内容存在第一关键词的账号。
对各个媒体内容的内容信息进行分词,得到多个词语,将多个词语中的停用词过滤掉,得到第一关键词,其中,分词的方式在本申请实施例中不做限定,可以基于停用词表,将多个词语中的停用词过滤掉。其中,第一关键词为至少一个。
对于每一个第一关键词,统计第一应用程序中目标账号的数量,并基于第一账号中的各个媒体内容的内容信息,确定存在该第一关键词的媒体内容的数量。基于目标账号的数量和存在各个第一关键词的媒体内容的数量,按照如下所示的公式(4)确定内容质量指标。
其中,Si为内容质量指标,T为基于各个媒体内容的内容信息所确定的第一关键词集合,α为控制参数,α的取值不做限定,示例性的,α=0.5。TFt为第一关键词指标,用于表征第一关键词t对于第一账号的重要性,nt为第一账号中的各个媒体内容中存在第一关键词的媒体内容的数量,N为第一账号中的媒体内容的数量。IDFt为第二关键词指标,用于表征第一关键词t对于第一应用程序中的账号的重要性,M为第一应用程序中的账号的数量,mt为第一应用程序中账号的媒体内容存在第一关键词t的目标账号的数量。
需要说明的是,在公式(4)中,第一关键词指标越大,表示第一关键词t对于第一账号越重要,第二关键词指标越大,表示第一关键词t越稀少,第一关键词t对于第一应用程序中的账号越重要。
本申请实施例中,统计第一账号中各个媒体内容中第一内容的数量以及第一账号中媒体内容的数量,基于威尔逊得分(Wilson Score)排序算法,即如下所示的公式(5),确定第一内容概率。
n=u+v
p=u/n 公式(5)
其中,u为第一账号中各个媒体内容中第一内容的数量,v为第一账号中各个媒体内容中非第一内容的数量,n为第一账号中媒体内容的数量,p为第一账号中第一内容的占比,S为第一内容概率,za为置信度,置信度的取值不做限定,示例性的,za=2,表征95%的置信度。
之后,基于内容质量指标、内容质量指标对应的权重、第一内容概率和第一内容概率对应的权重,确定目标媒体内容指标,目标媒体内容指标用于表征第一账号中媒体内容的质量。
之后,将目标媒体内容指标作为账号质量指标,或者基于目标媒体内容指标确定账号质量指标。
步骤234,第一账号的信息包括至少一个第一类别,第一类别为第一账号中的媒体内容所属的类别;基于第一账号的信息,确定账号质量指标,包括:基于各个媒体内容所属的第一类别,确定各个第一类别对应的媒体内容占比;基于各个第一类别对应的媒体内容占比确定第一类别指标,第一类别指标用于表征第一账号中第一类别的集中程度;基于第一类别指标,确定账号质量指标。
第一类别为媒体内容所属的类别,第一类别包括但不限于美食类别、动漫类别、军事类别、宠物类别、育儿类别等。
本申请实施例中,一个媒体内容所属至少一个第一类别。任意两个媒体内容可以所属相同的第一类别,也可以所属不同的第一类别,还可以所属部分相同的第一类别。
基于第一账号中的各个媒体内容所属的第一类别,确定各个第一类别对应的媒体内容的数量。对于任一个第一类别,确定该第一类别对应的媒体内容的数量和第一账号中的媒体内容的数量之比,得到该第一类别对应的媒体内容占比。
基于各个第一类别对应的媒体内容占比,按照如下所示的公式(6)确定第一类别指标。
其中,H为第一类别指标,n为第一账号中的第一类别总数,Pi为第i个第一类别对应的媒体内容占比。
本申请实施例中,将第一类别指标作为账号质量指标,或者基于第一类别指标,确定账号质量指标。
步骤235,第一账号的信息包括第一账号的简介信息、第一账号的名称信息以及至少一个第一类别,第一类别为第一账号中的媒体内容所属的类别;基于第一账号的信息,确定账号质量指标,包括:基于第一账号中的各个媒体内容所属的类别,从至少一个第一类别中确定媒体内容数据最多的目标类别;基于简介信息和名称信息,确定第一账号属于各个第二类别的概率;从第一账号属于各个第二类别的概率中提取第一账号属于目标类别的概率;基于第一账号属于目标类别的概率,确定账号质量指标。
第一账号的简介信息是介绍第一账号的信息,第一账号的名称信息是第一账号的账号名,第一账号的简介信息和名称信息可以反映第一账号的媒体内容所属的类别。
本申请实施例中,基于各个媒体内容所属的第一类别,确定各个第一类别对应的媒体内容的数量,从各个第一类别中确定媒体内容数据最多的第一类别,得到目标类别。
将简介信息和名称信息拼接在一起,得到拼接后的信息,对拼接后的信息进行分类,得到第一账号属于各个第二类别的概率。在一种可能的实现方式中,将拼接后的信息输入至分类模型,如基于变压器的双向编码器表示(Bidirectional EncoderRepresentations From Transformers,BERT)模型,由BERT模型输出第一账号属于各个第二类别的概率。
之后,从第一账号属于各个第二类别的概率中,挑选出第一账号属于目标类别的概率。将第一账号属于目标类别的概率作为账号质量指标,或者基于第一账号属于目标类别的概率,确定账号质量指标。
如图3所示,图3是本申请实施例提供的一种号文一致性的检测流程图。将第一账号的简介信息+第一账号的名称信息输入至基于变压器的双向编码器表示模型,由该模型输出概率,该概率为第一账号属于各个第二类别的概率。第二类别包括美食、动漫、军事、宠物、育儿等类别,即模型输出第一账号属于美食类别的概率、第一账号属于动漫类别的概率、第一账号属于军事类别的概率、第一账号属于宠物类别的概率、第一账号属于育儿类别的概率等。获取第一账号中的各个媒体内容,统计各个媒体内容所属的类别,媒体内容所属的类别包括美食、动漫、军事、宠物、育儿等类别,从而得到美食类别对应的媒体内容的数量、动漫类别对应的媒体内容的数量、军事类别对应的媒体内容的数量、宠物类别对应的媒体内容的数量、育儿类别对应的媒体内容的数量等,基于美食类别对应的媒体内容的数量、动漫类别对应的媒体内容的数量、军事类别对应的媒体内容的数量、宠物类别对应的媒体内容的数量、育儿类别对应的媒体内容的数量等,确定媒体内容的数量最多的目标类别,如目标类别为宠物类别。基于目标类别和输出概率,得到号文一致性结果,其中,号文一致性结果为输出概率中第一账号属于目标类别的概率。
示例性的,目标类别为宠物类别,则号文一致性结果为第一账号属于宠物类别的概率。
可以理解的是,BERT模型是一种自然语言处理(NLP)模型。NLP是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。
需要说明的是,可以对第一账号属于目标类别的概率进行归一化处理,得到归一化处理后的概率。将归一化处理后的概率作为账号质量指标,或者基于归一化处理后的概率,确定账号质量指标。
步骤236,第一账号的信息包括第一账号中的各个媒体内容的内容信息;基于第一账号的信息,确定账号质量指标,包括:基于各个媒体内容的内容信息,确定第一账号的搬运特征,搬运特征用于表征各个媒体内容中属于搬运的媒体内容;基于第一账号的搬运特征,确定第一账号属于搬运账号的概率,搬运账号中的媒体内容为搬运的媒体内容;基于第一账号属于搬运账号的概率,确定账号质量指标。
目标对象在使用第一账号发布的媒体内容时,所发布的媒体内容可能是搬运其他对象的媒体内容。基于该原因,本申请实施例基于第一账号中各个媒体内容的内容信息,确定第一账号的搬运特征,以基于第一账号的搬运特征确定第一账号属于搬运账号的概率。
其中,基于各个媒体内容的内容信息,确定第一账号的搬运特征,包括:基于各个媒体内容的内容信息,确定第二关键词;基于样本搬运账号中的各个样本搬运内容的内容信息,确定第三关键词;基于样本非搬运账号中的各个样本非搬运内容的内容信息,确定第四关键词;基于第二关键词、第三关键词和第四关键词,确定第一账号的搬运特征。
本申请实施例中,对第一账号中的各个媒体内容的内容信息进行分词,得到各个词语,去除各个词语中的停用词,得到第二关键词。按照该方式,基于样本搬运账号中的各个样本搬运内容的内容信息确定第三关键词,基于样本非搬运账号中的各个样本非搬运内容的内容信息确定第四关键词。
其中,第二关键词、第三关键词和第四关键词均为至少一个,第二关键词、第三关键词和第四关键词中的词汇数量不做限定,示例性的,第二关键词包含一个词汇,第三关键词包含2-4个词汇,第四关键词也包含2-4个词汇。
将第二关键词、第三关键词和第四关键词作为一个n元词带,统计第一账号的词袋,将第一账号的词袋作为第一账号的搬运特征,其中,基于n元词带,统计第一账号的词袋的方式不做限定。
之后,基于第一账号的搬运特征,确定第一账号属于搬运账号的概率。在一种可能的实现方式中,将第一账号的搬运特征输入至神经网络模型中,由神经网络模型输出第一账号属于搬运账号的概率,该概率大于等于0且小于等于1。神经网络模型的结构和大小不做限定。示例性的,神经网络模型为因子分解机(Factorization Machines,FM)模型,或者深度神经网络(Deep Neural Networks,DNN),或者为深度因子分解机(Deep-Factorization Machines,Deep-FM)模型。
如图4所示,图4是本申请实施例提供的一种FM模型的结构示意图。FM模型包括稀疏编码层、稠密编码层、因子分解机层和输出层。其中,稀疏编码层用于对第一账号的搬运特征进行稀疏编码处理,稠密编码层用于对稀疏编码处理后的搬运特征进行稠密编码处理,因子分解机层用于基于稀疏编码处理后的搬运特征和稠密编码处理后的搬运特征进行特征处理,得到一个实数,输出层用于将该实数归一化为一个概率值,该概率值为第一账号属于搬运账号的概率。
如图5所示,图5是本申请实施例提供的一种DNN模型的结构示意图。DNN模型包括稀疏编码层、稠密编码层、隐藏层和输出层。其中,稀疏编码层用于对第一账号的搬运特征进行稀疏编码处理,稠密编码层用于对稀疏编码处理后的搬运特征进行稠密编码处理,隐藏层用于基于稀疏编码处理后的搬运特征和稠密编码处理后的搬运特征进行卷积处理,输出层用于将卷积处理结果归一化为一个概率值,该概率值为第一账号属于搬运账号的概率。
如图6所示,图6是本申请实施例提供的一种Deep-FM模型的结构示意图。Deep-FM模型是由FM模型和DNN模型组成,包括稀疏编码层、稠密编码层、隐藏层和输出层。其中,稀疏编码层用于对第一账号的搬运特征进行稀疏编码处理,稠密编码层用于对稀疏编码处理后的搬运特征进行稠密编码处理,隐藏层用于基于稀疏编码处理后的搬运特征和稠密编码处理后的搬运特征进行卷积处理,因子分解机层用于基于稀疏编码处理后的搬运特征和稠密编码处理后的搬运特征进行特征处理,得到一个实数,输出层用于将卷积处理结果和该实数归一化为一个概率值,该概率值为第一账号属于搬运账号的概率。
本申请实施例中,将第一账号属于搬运账号的概率,作为账号质量指标,或者基于第一账号属于搬运账号的概率,确定账号质量指标。在一种可能的实现方式中,对第一账号属于搬运账号的概率进行归一化处理,将归一化处理后的概率作为账号质量指标,或者基于归一化处理后的概率确定账号质量指标。
通过确定第一账号属于搬运账号的概率,来确定账号质量指标,从而基于账号质量指标确定待推荐内容的推荐结果,提高应用程序中的对象原创媒体内容的积极性,完善信息流的生态环境。
步骤237,第一账号的信息包括第一账号中的各个媒体内容所属的第一类别和各个媒体内容的发布时间;基于第一账号的信息,确定账号质量指标,包括:基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定类别波动指标,类别波动指标用于表征目标对象发布媒体内容的类别波动程度;基于各个媒体内容的发布时间,确定发文波动指标,发文波动指标用于表征目标对象发布媒体内容的时间波动程度;基于类别波动指标和发文波动指标,确定账号质量指标。
第一类别、发布时间的说明,可在前文中找到对应的描述,在此不再赘述。
本申请实施例中,基于各个媒体内容所属的第一类别和各个媒体内容的发布时间确定类别波动指标,且基于各个媒体内容的发布时间确定发文波动指标。之后,基于类别波动指标、类别波动指标对应的权重、发文波动指标和发文波动指标对应的权重,确定账号质量指标。
其中,类别波动指标对应的权重和波动指标对应的权重的确定方式不做限定,且权重的大小也不做限定。
其中,基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定类别波动指标,包括:基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定第一波动指标,第一波动指标用于表征目标对象发布的任意一个媒体内容的类别波动程度;基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定第二波动指标,第二波动指标用于表征目标对象发布的任意两个媒体内容之间的类别波动程度;基于第一波动指标和第二波动指标,确定类别波动指标。
本申请实施例中,基于各个媒体内容所属的第一类别和各个媒体内容的发布时间确定第一波动指标,且基于各个媒体内容所属的第一类别和各个媒体内容的发布时间确定第二波动指标。之后,基于第一波动指标、第一波动指标对应的权重、第二波动指标和第二波动指标对应的权重,确定类别波动指标。
其中,第一波动指标对应的权重和第二波动指标对应的权重的确定方式不做限定,且权重的大小也不做限定。
在一种可能的实现方式中,基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定第一波动指标,包括:基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定各个媒体内容按照发布时间排序后的前第一数量个媒体内容的第一类别;对第一类别序列进行切分,得到至少两个类别段,第一类别序列是按照发布时间排序后的各个媒体内容的第一类别所组成的序列;基于至少两个类别段,确定相邻类别段之间的类别相似度;基于相邻类别段之间的类别相似度和前第一数量个媒体内容的第一类别,确定第一波动指标。
本申请实施例中,基于第一账号中的各个媒体内容的发布时间,对各个媒体内容按照发布时间排序进行排序,提取排序后的前第一数量个媒体内容,统计前第一数量个媒体内容各自的第一类别,第一数量的大小不做限定,示例性的,第一数量为5~10中的任意一个数值。
对各个媒体内容按照发布时间排序进行排序后,基于各个媒体内容的第一类别得到第一类别序列,对第一类别序列进行切分,得到至少两个类别段。切分方式可以是均等切分,也可以是非均等切分。
示例性的,排序后的媒体内容为媒体内容1-5,其中,媒体内容1的第一类别为第一类别a,媒体内容2的第一类别为第一类别a,媒体内容3的第一类别为第一类别b,媒体内容4的第一类别为第一类别a,媒体内容5的第一类别为第一类别c。此时,第一类别序列为第一类别a、第一类别a、第一类别b、第一类别a、第一类别c。将第一类别序列切分成两段,得到一个类别段为第一类别a、第一类别a和第一类别b,另一个类别段位第一类别a和第一类别c。
之后,基于至少两个类别段,确定相邻类别段之间的类别相似度。在确定类别相似度时,对于每两个相邻类别段,利用这两个相邻类别段包含的第一类别,构成词袋,该词袋作为这两个相邻类别段的类别段特征。将类别段特征输入至相似度确定模型,由相似度确定模型输出这两个相邻类别段之间的类别相似度。其中,相似度确定模型的模型结构和模型大小不做限定。
本申请实施例中,基于相邻类别段之间的类别相似度和前第一数量个媒体内容的第一类别,按照如下所示的公式(7)确定第一波动指标。
其中,C为第一波动指标,n为第二发布时间段内第一账号中的媒体内容的数量,第二发布时间段的大小不做限定,示例性的,第二发布时间段为一个月。i为第二发布时间段内第一账号中的各个媒体内容按照发布时间排序后的第i个媒体内容,CntChanni为将第二发布时间段内第一账号中的各个媒体内容按照发布时间排序后,第i个媒体内容的第一类别在前第一数量个媒体内容中出现的次数。windowLength为滑动窗口大小,windowLength等于第一数量,Simi,i+1为至少两个类别段中相邻类别段之间的类别相似度。
其中,基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定第二波动指标,包括:基于各个媒体内容所属的第一类别,确定相邻媒体内容之间的类别相似度,相邻媒体内容是各个媒体内容按照发布时间排序后的相邻的媒体内容;基于相邻媒体内容之间的类别相似度,确定第二波动指标。
媒体内容携带标签信息,基于该标签信息确定媒体内容所属的第一类别。在确定相邻媒体内容之间的类别相似度时,按照类别相似度=(标签交集大小)/(标签并集大小)的方式确定,标签交集大小等于相邻媒体内容之间的标签重复数,标签并集大小等于相邻媒体内容之间的总标签数。
本申请实施例中,按照如下所示的公式(8),基于相邻媒体内容之间的类别相似度,确定第二波动指标。
其中,T为第二波动指标,n为第三发布时间段内第一账号中的媒体内容的数量,第三发布时间段的大小不做限定,示例性的,第三发布时间段为一个月。i为第三发布时间段内第一账号中的各个媒体内容按照发布时间排序后的第i个媒体内容,IntersectionSizei,i+1为第i个媒体内容和第i+1个媒体内容之间的标签交集大小,UnionSizei,i+1为第i个媒体内容和第i+1个媒体内容之间的标签并集大小。
在一种可能的实现方式中,基于各个媒体内容的发布时间,确定发文波动指标,包括:基于各个媒体内容的发布时间,确定至少一个分位数,分位数用于表征目标时间段的媒体内容的数量与所述各个媒体内容的数量的占比;基于至少一个分位数,确定发文波动指标。
本申请实施例中,目标时间段为分位数所对应的时间段。基于各个媒体内容的发布时间,确定至少两个第二时间段的媒体内容数量。第二时间段的大小不做限定,示例性的,第二时间段为一周。基于各个媒体内容的发布时间,确定各个第二时间段的媒体内容数量,使用二分位数、四分位数、百分位数等分位数确定算法,确定出至少一个分位数,基于至少一个分位数,确定发文波动指标。
在一种可能的实现方式中,分位数为两个,分别记为第一分位数和第二分位数。示例性的,使用四分位数确定算法,确定出四个分位数,将第一个分位数作为第一分位数,将第三个分位数作为第二分位数。
之后,确定第一分位数和第二分位数之差,得到分位数差值。基于第四发布时间段内第一账号中的媒体内容的数量,基于该数量与分位数差值,确定发文波动指标。其中,第四发布时间段的大小不做限定,示例性的,第四发布时间段为最近一周。
在基于该数量与分位数差值确定发文波动指标时,可以先确定目标倍数与分位数差值的乘积,将该数量与乘积结果的差值,作为发文波动指标。目标倍数的大小不做限定,示例性的,目标倍数为1.5。
本申请实施例中,在确定出第一波动指标、第二波动指标和发文波动指标后,基于第一波动指标和第二波动指标确定类别波动指标,基于类别波动指标和发文波动指标,确定账号波动指标,该账号波动指标用于表征第一账号内媒体内容的波动情况。即基于第一波动指标、第二波动指标和发文波动指标确定账号波动指标。
在一种可能的实现方式中,对第一波动指标、第二波动指标和发文波动指标进行归一化处理,基于归一化处理后的第一波动指标、第一波动指标的权重、归一化处理后的第二波动指标、第二波动指标的权重、归一化处理后的发文波动指标和发文波动指标的权重,确定账号波动指标。
之后,将账号波动指标作为账号质量指标,或者基于账号波动指标确定账号质量指标。
步骤238,第一账号的信息包括访问第一账号的对象数量、第一账号对应的资源数量、第一账号中的各个媒体内容的评论数量、各个媒体内容的分享数量、各个媒体内容的点击数量、各个媒体内容的点赞数量、各个媒体内容的观看完成数量或各个媒体内容的曝光数量中的至少一项;基于第一账号的信息,确定账号质量指标,包括:基于访问第一账号的对象数量、第一账号对应的资源数量、第一账号中的各个媒体内容的评论数量、各个媒体内容的分享数量、各个媒体内容的点击数量、各个媒体内容的点赞数量、各个媒体内容的观看完成数量或各个媒体内容的曝光数量中的至少一项,确定账号受欢迎指标,账号受欢迎指标用于表征第一账号受第一应用程序中的对象的欢迎程度;基于账号受欢迎指标,确定账号质量指标。
本申请实施例中,对访问第一账号的对象数量、第一账号对应的资源数量进行归一化,基于归一化后的对象数量、对象数量的权重、归一化后的资源数量、资源数量的权重,确定第一受欢迎指标,第一受欢迎指标用于表征第一账号受第一应用程序中的对象的欢迎程度。
获取第一账号中的各个媒体内容的评论数量、各个媒体内容的分享数量、各个媒体内容的点击数量、各个媒体内容的点赞数量、各个媒体内容的观看完成数量、各个媒体内容的曝光数量等信息。对于每一个媒体内容,利用前述提及的公式(5)分别确定评论概率、分享概率、点击概率、点赞概率、观看概率。
以基于该媒体内容的评论数量和该媒体内容的曝光数量,利用公式(5)确定评论概率为例,u为该媒体内容的评论数量,v为该媒体内容的曝光数量与该媒体内容的评论数量之差,n为该媒体内容的曝光数量。
同样地,基于该媒体内容的分享数量和该媒体内容的曝光数量,利用公式(5)确定分享概率。基于该媒体内容的点击数量和该媒体内容的曝光数量,利用公式(5)确定点击概率。基于该媒体内容的点赞数量和该媒体内容的曝光数量,利用公式(5)确定点赞概率。基于该媒体内容的观看完成数量和该媒体内容的曝光数量,利用公式(5)确定观看完成概率。
对于每一个媒体内容,基于评论概率、评论概率的权重、分享概率、分享概率的权重、点击概率、点击概率的权重、点赞概率、点赞概率的权重、观看概率和观看概率的权重,确定该媒体内容对应的受欢迎指标,该媒体内容对应的受欢迎指标用于表征该媒体内容受第一应用程序中的对象的欢迎程度。
基于各个媒体内容对应的受欢迎指标,按照如下所示的公式(9)确定第二受欢迎指标,第二受欢迎指标用于表征第一账号受第一应用程序中的对象的欢迎程度。
其中,Score为第二受欢迎指标,N为第一账号中的媒体内容的数量,Scoreiy为第一账号中第i个媒体内容对应的受欢迎指标,α为可调整系数,可调整系数的大小不做限定,示例性的,α=0.5。y为控制系数,控制系数的大小不做限定。
本申请实施例中,基于第一受欢迎指标、第一受欢迎指标的权重、第二受欢迎指标和第二受欢迎指标的权重,确定账号受欢迎指标。将账号受欢迎指标作为账号质量指标,或者基于账号受欢迎指标,确定账号质量指标。
需要说明的是,本申请实施例可以基于目标对象影响力指标、发布时间指标、目标媒体内容指标、第一类别指标、第一账号属于目标类别的概率、第一账号属于搬运账号的概率、账号波动指标或账号受欢迎指标中的至少一项,确定账号质量指标。
在一种可能的实现方式中,从目标对象影响力指标、发布时间指标、目标媒体内容指标、第一类别指标、第一账号属于目标类别的概率、第一账号属于搬运账号的概率、账号波动指标或账号受欢迎指标中的至少一项中,选择最大值,作为账号增长指标,用于表征第一账号的增长潜力。
在一种可能的实现方式中,基于目标对象影响力指标、发布时间指标、目标媒体内容指标、第一类别指标、第一账号属于目标类别的概率、第一账号属于搬运账号的概率、账号波动指标、账号受欢迎指标和账号增长指标中的至少一项,确定账号质量指标。
示例性的,按照如下所示的公式(10)确定账号质量指标。
其中,Score为账号质量指标,M为账号的指标数量,示例性的,账号的指标包括目标对象影响力指标、发布时间指标、目标媒体内容指标、第一类别指标、第一账号属于目标类别的概率、第一账号属于搬运账号的概率、账号波动指标、账号受欢迎指标、账号增长指标,则M=9。i为账号的第i个指标,ηi为账号的第i个指标对应的平滑系数,平滑系数的取值不做限定。Si为账号的第i个指标的值,wi为账号的第i个指标对应的权重,权重的取值不做限定。
步骤24,基于账号质量指标,确定待推荐内容在第一应用程序的推荐结果。
本申请实施例中,对于任意一个待推荐内容,先按照步骤23的方式,确定账号质量指标,之后,基于账号质量指标,确定该待推荐内容在第一应用程序的推荐结果为推荐或者不推荐。
其中,基于账号质量指标,确定待推荐内容在第一应用程序的推荐结果之后,还包括:响应于待推荐内容的推荐结果为推荐,基于第一应用程序对待推荐内容进行推荐;响应于待推荐内容的推荐结果为不推荐,过滤掉待推荐内容。
当待推荐内容在第一应用程序的推荐结果为推荐时,基于第一应用程序对待推荐内容进行推荐,以使第一应用程序中的对象查看该媒体内容,使优质账号的媒体内容得到推广。
待推荐内容在第一应用程序的推荐结果为不推荐时,过滤掉待推荐内容,以限制第一应用程序中的对象查看该媒体内容,使非优质账号的媒体内容得到推广限制。
上述方法基于待推荐内容对应的第一账号的信息,确定账号质量指标,该账号质量指标用于表征第一账号的质量,基于账号质量指标,确定待推荐内容在第一应用程序的推荐结果,实现了将优质账号的内容推荐给用户,提高推荐内容的质量和准确性,完善信息流的生态环境,从而提高应用程序的使用时长。
上述从方法步骤的角度详细介绍了本申请实施例的内容推荐方法,下面将以新闻类应用程序为场景进行详细说明。在新闻类应用程序中,媒体内容包括但不限于文章、视频等。
以文章为例,如图7所示,图7是本申请实施例提供的一种文章推荐的示意图。任意对象可以使用其对应的第一账号在新闻类应用程序中发布文章,新闻类应用程序中的任意对象可以针对任意文章进行如关注行为、点赞行为、评论行为、观看行为等的行为信息。本申请实施例中,基于目标对象使用第一账号在新闻类应用程序中发布的文章以及新闻类应用程序中各对象的行为信息,可以确定出如下所示的十个指标。
(1)基于使用第一账号在新闻类应用程序中发布的文章以及新闻类应用程序中各对象的行为信息,确定目标对象影响力指标,详见前文有关目标对象影响力指标的相关说明,在此不再赘述。
(2)基于使用第一账号在新闻类应用程序中发布的文章,确定发布时间指标,详见前文有关发布时间指标的相关说明,在此不再赘述。
(3)基于使用第一账号在新闻类应用程序中发布的文章,确定目标媒体内容指标,详见前文有关目标媒体内容指标的相关说明,在此不再赘述。
(4)基于使用第一账号在新闻类应用程序中发布的文章,确定第一类别指标,详见前文有关第一类别指标的相关说明,在此不再赘述。
(5)基于使用第一账号在新闻类应用程序中发布的文章,确定第一账号属于目标类别的概率,详见前文有关第一账号属于目标类别的概率的相关说明,在此不再赘述。
(6)基于使用第一账号在新闻类应用程序中发布的文章,确定第一账号属于搬运账号的概率,详见前文有关第一账号属于搬运账号的概率的相关说明,在此不再赘述。
(7)基于使用第一账号在新闻类应用程序中发布的文章,确定账号波动指标,详见前文有关账号波动指标的相关说明,在此不再赘述。
(8)基于新闻类应用程序中各对象的行为信息,确定第一受欢迎指标,详见前文有关第一受欢迎指标的相关说明,在此不再赘述。
(9)基于使用第一账号在新闻类应用程序中发布的文章以及新闻类应用程序中各对象的行为信息,确定第二受欢迎指标,详见前文有关第二受欢迎指标的相关说明,在此不再赘述。
(10)基于使用第一账号在新闻类应用程序中发布的文章以及新闻类应用程序中各对象的行为信息,确定账号增长指标,详见前文有关账号增长指标的相关说明,在此不再赘述。
基于上述(1)-(10)中的十个指标,即基于目标对象影响力指标、发布时间指标、目标媒体内容指标、第一类别指标、第一账号属于目标类别的概率、第一账号属于搬运账号的概率、账号波动指标、第一受欢迎指标、第二受欢迎指标和账号增长指标,确定账号质量指标。
之后,基于账号质量指标,确定文章在新闻类应用程序中的推荐结果,即文章在新闻类应用程序中的推荐结果为推荐,则基于新闻类应用程序对文章进行推荐,文章在新闻类应用程序中的推荐结果为不推荐,则过滤掉文章,以将优质账号中的文章推荐给用户,提高推荐内容的质量。
将本申请实施例的内容推荐方法应用于图文类应用程序中后,图文类应用程序的使用时长最少增长0.24%,图文类应用程序的使用总时长增长0.236%,日活跃用户数量(Daily Active User,DAU)七日留存率增长0.217%,平均使用时长最少增长0.242%。
将本申请实施例的内容推荐方法应用于短视频类应用程序中后,短视频类应用程序的独立访客(Unique Visitor,UV)点击率增长0.19%,短视频类应用程序中有关图文的页面浏览量(Page View,PV)降低0.11%,UV转换率提高0.227%,DAU次日留存率提高0.188%,短视频类应用程序的UV平均点击率增长0.186%。其中,短视频是指视频时长小于或者等于第一目标时长的视频,第一目标时长的数值不做限定,示例性的,第一目标时长为3分钟。
将本申请实施例的内容推荐方法应用于小视频类应用程序中后,小视频类应用程序的使用时长最少增长0.31%,DAU次日留存率提高0.129%,小视频类应用程序的使用总时长增长0.333%,曝光量增长0.105%,消费对象的次日留存率提高0.149%。其中,小视频是指视频时长大于或者等于第二目标时长,且小于或者等于第三目标时长的视频,第二目标时长大于或者等于第一目标时长,且小于第三目标时长,第二目标时长、第三目标时长的数值不做限定,示例性的,第二目标时长为10分钟,第三目标时长为30分钟。
由此可知,通过本申请实施例的内容推荐,提高了推荐内容的质量和准确性,完善信息流的生态环境,从而提高应用程序的使用时长。
图8所示为本申请实施例提供的一种内容推荐装置的结构示意图,如图8所示,该装置包括获取模块81和确定模块82。
获取模块81,用于获取待推荐内容;
获取模块81,还用于获取待推荐内容对应的第一账号的信息,第一账号是目标对象在第一应用程序的账号,目标对象为发布待推荐内容的对象;
确定模块82,用于基于第一账号的信息,确定账号质量指标,账号质量指标用于表征第一账号的质量;
确定模块82,还用于基于账号质量指标,确定待推荐内容在第一应用程序的推荐结果。
在一种可能的实现方式中,确定模块82,用于基于第一账号的信息和第一应用程序中各个账号的关注行为信息,确定第一对象影响力指标,第一对象影响力指标用于表征目标对象在第一应用程序的影响力;基于第一对象影响力指标,确定账号质量指标。
在一种可能的实现方式中,确定模块82,用于获取待推荐内容对应的至少一个第二账号的等级信息,第二账号是目标对象在第二应用程序的账号,第二应用程序为除第一应用程序之外的应用程序;基于各个第二账号的等级信息,确定第二对象影响力指标,第二对象影响力指标用于表征目标对象在第二应用程序的影响力;基于第一对象影响力指标和第二对象影响力指标,确定账号质量指标。
在一种可能的实现方式中,第一账号的信息包括第一账号中的各个媒体内容的发布时间;
确定模块82,用于基于各个媒体内容的发布时间,确定发布时间方差;基于发布时间方差,确定账号质量指标。
在一种可能的实现方式中,第一账号的信息包括第一账号中的各个媒体内容的内容信息和各个媒体内容中第一内容的数量;
确定模块82,用于基于各个媒体内容的内容信息,确定内容质量指标,内容质量指标用于表征媒体内容的质量;基于第一内容的数量,确定第一内容概率,第一内容概率用于表征目标对象发布第一内容的概率;基于内容质量指标和第一内容概率,确定账号质量指标。
在一种可能的实现方式中,确定模块82,用于基于各个媒体内容的内容信息,确定第一关键词;基于各个媒体内容中存在第一关键词的媒体内容的数量和第一应用程序中目标账号的数量,确定内容质量指标,目标账号为账号中的媒体内容存在第一关键词的账号。
在一种可能的实现方式中,第一账号的信息包括至少一个第一类别,第一类别为第一账号中的媒体内容所属的类别;
确定模块82,用于基于各个媒体内容所属的第一类别,确定各个第一类别对应的媒体内容占比;基于各个第一类别对应的媒体内容占比确定第一类别指标,第一类别指标用于表征第一账号中第一类别的集中程度;基于第一类别指标,确定账号质量指标。
在一种可能的实现方式中,第一账号的信息包括第一账号的简介信息、第一账号的名称信息以及至少一个第一类别,第一类别为第一账号中的媒体内容所属的类别;
确定模块82,用于基于第一账号中的各个媒体内容所属的类别,从至少一个第一类别中确定媒体内容数据最多的目标类别;基于简介信息和名称信息,确定第一账号属于各个第二类别的概率;从第一账号属于各个第二类别的概率中提取第一账号属于目标类别的概率;基于第一账号属于目标类别的概率,确定账号质量指标。
在一种可能的实现方式中,第一账号的信息包括第一账号中的各个媒体内容的内容信息;
确定模块82,用于基于各个媒体内容的内容信息,确定第一账号的搬运特征,搬运特征用于表征各个媒体内容中属于搬运的媒体内容;基于第一账号的搬运特征,确定第一账号属于搬运账号的概率,搬运账号中的媒体内容为搬运的媒体内容;基于第一账号属于搬运账号的概率,确定账号质量指标。
在一种可能的实现方式中,确定模块82,用于基于各个媒体内容的内容信息,确定第二关键词;基于样本搬运账号中的各个样本搬运内容的内容信息,确定第三关键词;基于样本非搬运账号中的各个样本非搬运内容的内容信息,确定第四关键词;基于第二关键词、第三关键词和第四关键词,确定第一账号的搬运特征。
在一种可能的实现方式中,第一账号的信息包括第一账号中的各个媒体内容所属的第一类别和各个媒体内容的发布时间;
确定模块82,用于基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定类别波动指标,类别波动指标用于表征目标对象发布媒体内容的类别波动程度;基于各个媒体内容的发布时间,确定发文波动指标,发文波动指标用于表征目标对象发布媒体内容的时间波动程度;基于类别波动指标和发文波动指标,确定账号质量指标。
在一种可能的实现方式中,确定模块82,用于基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定第一波动指标,第一波动指标用于表征目标对象发布的任意一个媒体内容的类别波动程度;基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定第二波动指标,第二波动指标用于表征目标对象发布的任意两个媒体内容之间的类别波动程度;基于第一波动指标和第二波动指标,确定类别波动指标。
在一种可能的实现方式中,确定模块82,用于基于各个媒体内容所属的第一类别和各个媒体内容的发布时间,确定各个媒体内容按照发布时间排序后的前第一数量个媒体内容的第一类别;对第一类别序列进行切分,得到至少两个类别段,第一类别序列是按照发布时间排序后的各个媒体内容的第一类别所组成的序列;基于至少两个类别段,确定相邻类别段之间的类别相似度;基于相邻类别段之间的类别相似度和前第一数量个媒体内容的第一类别,确定第一波动指标。
在一种可能的实现方式中,确定模块82,用于基于各个媒体内容所属的第一类别,确定相邻媒体内容之间的类别相似度,相邻媒体内容是各个媒体内容按照发布时间排序后的相邻的媒体内容;
基于相邻媒体内容之间的类别相似度,确定第二波动指标。
在一种可能的实现方式中,确定模块82,用于基于各个媒体内容的发布时间,确定至少一个分位数,分位数用于表征目标时间段的媒体内容的数量与各个媒体内容的数量的占比;基于至少一个分位数,确定发文波动指标。
在一种可能的实现方式中,确定模块82,用于基于访问第一账号的对象数量、第一账号对应的资源数量、第一账号中的各个媒体内容的评论数量、各个媒体内容的分享数量、各个媒体内容的点击数量、各个媒体内容的点赞数量、各个媒体内容的观看完成数量或各个媒体内容的曝光数量中的至少一项,确定账号受欢迎指标,账号受欢迎指标用于表征第一账号受第一应用程序中的对象的欢迎程度;基于账号受欢迎指标,确定账号质量指标。
在一种可能的实现方式中,装置还包括:
推荐模块,用于响应于待推荐内容的推荐结果为推荐,基于第一应用程序对待推荐内容进行推荐;
过滤模块,用于响应于待推荐内容的推荐结果为不推荐,过滤掉待推荐内容。
上述装置基于待推荐内容对应的第一账号的信息,确定账号质量指标,该账号质量指标用于表征第一账号的质量,基于账号质量指标,确定待推荐内容在第一应用程序的推荐结果,实现了将优质账号的内容推荐给用户和准确性,完善信息流的生态环境,提高推荐内容的质量,从而提高应用程序的使用时长。
应理解的是,上述图8提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图9示出了本申请一个示例性实施例提供的终端设备900的结构框图。该终端设备900可以是便携式移动终端,比如:智能手机、平板电脑、MP3(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端设备900还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端设备900包括有:处理器901和存储器902。
处理器901可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器901可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器901可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器901还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器902可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器902中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器901所执行以实现本申请中方法实施例提供的内容推荐方法。
在一些实施例中,终端设备900还可选包括有:***设备接口903和至少一个***设备。处理器901、存储器902和***设备接口903之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口903相连。具体地,***设备包括:射频电路904、显示屏905、摄像头组件906、音频电路907、定位组件908和电源909中的至少一种。
***设备接口903可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器901和存储器902。在一些实施例中,处理器901、存储器902和***设备接口903被集成在同一芯片或电路板上;在一些其他实施例中,处理器901、存储器902和***设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路904用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路904将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路904包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路904还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏905用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时,显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时,显示屏905还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏905可以为一个,设置在终端设备900的前面板;在另一些实施例中,显示屏905可以为至少两个,分别设置在终端设备900的不同表面或呈折叠设计;在另一些实施例中,显示屏905可以是柔性显示屏,设置在终端设备900的弯曲表面上或折叠面上。甚至,显示屏905还可以设置成非矩形的不规则图形,也即异形屏。显示屏905可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件906用于采集图像或视频。可选地,摄像头组件906包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件906还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器901进行处理,或者输入至射频电路904以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端设备900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器901或射频电路904的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路907还可以包括耳机插孔。
定位组件908用于定位终端设备900的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件908可以是基于美国的GPS(GlobalPositioning System,全球定位***)、中国的北斗***或俄罗斯的伽利略***的定位组件。
电源909用于为终端设备900中的各个组件进行供电。电源909可以是交流电、直流电、一次性电池或可充电电池。当电源909包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端设备900还包括有一个或多个传感器910。该一个或多个传感器910包括但不限于:加速度传感器911、陀螺仪传感器912、压力传感器913、指纹传感器914、光学传感器915以及接近传感器916。
加速度传感器911可以检测以终端设备900建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器911可以用于检测重力加速度在三个坐标轴上的分量。处理器901可以根据加速度传感器911采集的重力加速度信号,控制显示屏905以横向视图或纵向视图进行用户界面的显示。加速度传感器911还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器912可以检测终端设备900的机体方向及转动角度,陀螺仪传感器912可以与加速度传感器911协同采集用户对终端设备900的3D动作。处理器901根据陀螺仪传感器912采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器913可以设置在终端设备900的侧边框和/或显示屏905的下层。当压力传感器913设置在终端设备900的侧边框时,可以检测用户对终端设备900的握持信号,由处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在显示屏905的下层时,由处理器901根据用户对显示屏905的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器914用于采集用户的指纹,由处理器901根据指纹传感器914采集到的指纹识别用户的身份,或者,由指纹传感器914根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器901授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器914可以被设置在终端设备900的正面、背面或侧面。当终端设备900上设置有物理按键或厂商Logo时,指纹传感器914可以与物理按键或厂商Logo集成在一起。
光学传感器915用于采集环境光强度。在一个实施例中,处理器901可以根据光学传感器915采集的环境光强度,控制显示屏905的显示亮度。具体地,当环境光强度较高时,调高显示屏905的显示亮度;当环境光强度较低时,调低显示屏905的显示亮度。在另一个实施例中,处理器901还可以根据光学传感器915采集的环境光强度,动态调整摄像头组件906的拍摄参数。
接近传感器916,也称距离传感器,通常设置在终端设备900的前面板。接近传感器916用于采集用户与终端设备900的正面之间的距离。在一个实施例中,当接近传感器916检测到用户与终端设备900的正面之间的距离逐渐变小时,由处理器901控制显示屏905从亮屏状态切换为息屏状态;当接近传感器916检测到用户与终端设备900的正面之间的距离逐渐变大时,由处理器901控制显示屏905从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图9中示出的结构并不构成对终端设备900的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图10为本申请实施例提供的服务器的结构示意图,该服务器1000可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(Central Processing Units,CPU)1001和一个或多个的存储器1002,其中,该一个或多个存储器1002中存储有至少一条程序代码,该至少一条程序代码由该一个或多个处理器1001加载并执行以实现上述各个方法实施例提供的内容推荐方法。当然,该服务器1000还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1000还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,该存储介质中存储有至少一条程序代码,该至少一条程序代码由处理器加载并执行,以使电子设备实现上述任一种内容推荐方法。
可选地,上述计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-OnlyMemory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品中存储有至少一条计算机指令,该至少一条计算机指令由处理器加载并执行,以使计算机实现上述任一种内容推荐方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (15)
1.一种内容推荐方法,其特征在于,所述方法包括:
获取待推荐内容;
获取所述待推荐内容对应的第一账号的信息,所述第一账号是目标对象在第一应用程序的账号,所述目标对象为发布所述待推荐内容的对象;
基于所述第一账号的信息,确定账号质量指标,所述账号质量指标用于表征所述第一账号的质量;
基于所述账号质量指标,确定所述待推荐内容在所述第一应用程序的推荐结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一账号的信息,确定账号质量指标,包括:
基于所述第一账号的信息和所述第一应用程序中各个账号的关注行为信息,确定第一对象影响力指标,所述第一对象影响力指标用于表征所述目标对象在所述第一应用程序的影响力;
基于所述第一对象影响力指标,确定所述账号质量指标。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一对象影响力指标,确定所述账号质量指标,包括:
获取所述待推荐内容对应的至少一个第二账号的等级信息,所述第二账号是所述目标对象在第二应用程序的账号,所述第二应用程序为除所述第一应用程序之外的应用程序;
基于各个第二账号的等级信息,确定第二对象影响力指标,所述第二对象影响力指标用于表征所述目标对象在所述第二应用程序的影响力;
基于所述第一对象影响力指标和所述第二对象影响力指标,确定所述账号质量指标。
4.根据权利要求1所述的方法,其特征在于,所述第一账号的信息包括所述第一账号中的各个媒体内容的内容信息和所述各个媒体内容中第一内容的数量;
所述基于所述第一账号的信息,确定账号质量指标,包括:
基于所述各个媒体内容的内容信息,确定内容质量指标,所述内容质量指标用于表征媒体内容的质量;
基于所述第一内容的数量,确定第一内容概率,所述第一内容概率用于表征所述目标对象发布第一内容的概率;
基于所述内容质量指标和所述第一内容概率,确定所述账号质量指标。
5.根据权利要求4所述的方法,其特征在于,所述基于所述各个媒体内容的内容信息,确定内容质量指标,包括:
基于所述各个媒体内容的内容信息,确定第一关键词;
基于所述各个媒体内容中存在所述第一关键词的媒体内容的数量和所述第一应用程序中目标账号的数量,确定所述内容质量指标,所述目标账号为账号中的媒体内容存在所述第一关键词的账号。
6.根据权利要求1所述的方法,其特征在于,所述第一账号的信息包括至少一个第一类别,所述第一类别为所述第一账号中的媒体内容所属的类别;
所述基于所述第一账号的信息,确定账号质量指标,包括:
基于所述各个媒体内容所属的第一类别,确定各个第一类别对应的媒体内容占比;
基于所述各个第一类别对应的媒体内容占比确定第一类别指标,所述第一类别指标用于表征所述第一账号中第一类别的集中程度;
基于所述第一类别指标,确定所述账号质量指标。
7.根据权利要求1所述的方法,其特征在于,所述第一账号的信息包括所述第一账号的简介信息、所述第一账号的名称信息以及至少一个第一类别,所述第一类别为所述第一账号中的媒体内容所属的类别;
所述基于所述第一账号的信息,确定账号质量指标,包括:
基于所述第一账号中的各个媒体内容所属的类别,从所述至少一个第一类别中确定媒体内容数据最多的目标类别;
基于所述简介信息和所述名称信息,确定所述第一账号属于各个第二类别的概率;
从所述第一账号属于各个第二类别的概率中提取所述第一账号属于目标类别的概率;
基于所述第一账号属于目标类别的概率,确定所述账号质量指标。
8.根据权利要求1所述的方法,其特征在于,所述第一账号的信息包括所述第一账号中的各个媒体内容的内容信息;
所述基于所述第一账号的信息,确定账号质量指标,包括:
基于所述各个媒体内容的内容信息,确定所述第一账号的搬运特征,所述搬运特征用于表征所述各个媒体内容中属于搬运的媒体内容;
基于所述第一账号的搬运特征,确定所述第一账号属于搬运账号的概率,所述搬运账号中的媒体内容为搬运的媒体内容;
基于所述第一账号属于搬运账号的概率,确定所述账号质量指标。
9.根据权利要求8所述的方法,其特征在于,所述基于所述各个媒体内容的内容信息,确定所述第一账号的搬运特征,包括:
基于所述各个媒体内容的内容信息,确定第二关键词;
基于样本搬运账号中的各个样本搬运内容的内容信息,确定第三关键词;
基于样本非搬运账号中的各个样本非搬运内容的内容信息,确定第四关键词;
基于所述第二关键词、所述第三关键词和所述第四关键词,确定所述第一账号的搬运特征。
10.根据权利要求1所述的方法,其特征在于,所述第一账号的信息包括所述第一账号中的各个媒体内容所属的第一类别和所述各个媒体内容的发布时间;
所述基于所述第一账号的信息,确定账号质量指标,包括:
基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定类别波动指标,所述类别波动指标用于表征所述目标对象发布媒体内容的类别波动程度;
基于所述各个媒体内容的发布时间,确定发文波动指标,所述发文波动指标用于表征所述目标对象发布媒体内容的时间波动程度;
基于所述类别波动指标和所述发文波动指标,确定所述账号质量指标。
11.根据权利要求10所述的方法,其特征在于,所述基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定类别波动指标,包括:
基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定第一波动指标,所述第一波动指标用于表征所述目标对象发布的任意一个媒体内容的类别波动程度;
基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定第二波动指标,所述第二波动指标用于表征所述目标对象发布的任意两个媒体内容之间的类别波动程度;
基于所述第一波动指标和所述第二波动指标,确定所述类别波动指标。
12.根据权利要求11所述的方法,其特征在于,所述基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定第一波动指标,包括:
基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定所述各个媒体内容按照发布时间排序后的前第一数量个媒体内容的第一类别;
对第一类别序列进行切分,得到至少两个类别段,所述第一类别序列是按照发布时间排序后的所述各个媒体内容的第一类别所组成的序列;
基于所述至少两个类别段,确定相邻类别段之间的类别相似度;
基于所述相邻类别段之间的类别相似度和所述前第一数量个媒体内容的第一类别,确定第一波动指标。
13.根据权利要求12所述的方法,其特征在于,所述基于所述各个媒体内容所属的第一类别和所述各个媒体内容的发布时间,确定第二波动指标,包括:
基于所述各个媒体内容所属的第一类别,确定相邻媒体内容之间的类别相似度,所述相邻媒体内容是所述各个媒体内容按照发布时间排序后的相邻的媒体内容;
基于所述相邻媒体内容之间的类别相似度,确定第二波动指标。
14.一种内容推荐装置,其特征在于,所述装置包括:
获取模块,用于获取待推荐内容;
所述获取模块,还用于获取所述待推荐内容对应的第一账号的信息,所述第一账号是目标对象在第一应用程序的账号,所述目标对象为发布所述待推荐内容的对象;
确定模块,用于基于所述第一账号的信息,确定账号质量指标,所述账号质量指标用于表征所述第一账号的质量;
所述确定模块,还用于基于所述账号质量指标,确定所述待推荐内容在所述第一应用程序的推荐结果。
15.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以使所述电子设备实现如权利要求1至13任一所述的内容推荐方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110960463.2A CN115905670A (zh) | 2021-08-20 | 2021-08-20 | 内容推荐方法、装置、设备及可读存储介质 |
PCT/CN2022/108833 WO2023020252A1 (zh) | 2021-08-20 | 2022-07-29 | 内容推荐方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110960463.2A CN115905670A (zh) | 2021-08-20 | 2021-08-20 | 内容推荐方法、装置、设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115905670A true CN115905670A (zh) | 2023-04-04 |
Family
ID=85240035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110960463.2A Pending CN115905670A (zh) | 2021-08-20 | 2021-08-20 | 内容推荐方法、装置、设备及可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115905670A (zh) |
WO (1) | WO2023020252A1 (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9342854B2 (en) * | 2013-05-08 | 2016-05-17 | Yahoo! Inc. | Identifying communities within a social network based on information propagation data |
CN106446218A (zh) * | 2016-09-30 | 2017-02-22 | 北京奇虎科技有限公司 | 推荐数据的方法及装置 |
CN111212303B (zh) * | 2019-12-30 | 2022-05-10 | 咪咕视讯科技有限公司 | 视频推荐方法、服务器和计算机可读存储介质 |
CN112153426B (zh) * | 2020-09-21 | 2023-08-29 | 腾讯科技(深圳)有限公司 | 一种内容账号管理方法、装置、计算机设备及存储介质 |
CN112989169B (zh) * | 2021-02-23 | 2023-07-25 | 腾讯科技(深圳)有限公司 | 目标对象识别方法、信息推荐方法、装置、设备及介质 |
-
2021
- 2021-08-20 CN CN202110960463.2A patent/CN115905670A/zh active Pending
-
2022
- 2022-07-29 WO PCT/CN2022/108833 patent/WO2023020252A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023020252A1 (zh) | 2023-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740068B (zh) | 媒体数据推荐方法、装置及存储介质 | |
CN110458360B (zh) | 热门资源的预测方法、装置、设备及存储介质 | |
CN110852100A (zh) | 关键词提取方法、装置、电子设备及介质 | |
CN109784351B (zh) | 行为数据分类方法、分类模型训练方法及装置 | |
CN112069414A (zh) | 推荐模型训练方法、装置、计算机设备及存储介质 | |
CN111104980B (zh) | 确定分类结果的方法、装置、设备及存储介质 | |
CN113515942A (zh) | 文本处理方法、装置、计算机设备及存储介质 | |
CN111368525A (zh) | 信息搜索方法、装置、设备及存储介质 | |
CN110555102A (zh) | 媒体标题识别方法、装置及存储介质 | |
CN113269612A (zh) | 物品推荐方法、装置、电子设备及存储介质 | |
CN111931075B (zh) | 一种内容推荐方法、装置、计算机设备及存储介质 | |
CN114281936A (zh) | 分类方法、装置、计算机设备及存储介质 | |
CN114691860A (zh) | 文本分类模型的训练方法、装置、电子设备及存储介质 | |
CN112287070A (zh) | 词语的上下位关系确定方法、装置、计算机设备及介质 | |
CN112749329A (zh) | 内容搜索方法、装置、计算机设备及存储介质 | |
CN113486260B (zh) | 互动信息的生成方法、装置、计算机设备及存储介质 | |
CN113762585B (zh) | 数据的处理方法、账号类型的识别方法及装置 | |
CN113343709B (zh) | 意图识别模型的训练方法、意图识别方法、装置及设备 | |
CN115905670A (zh) | 内容推荐方法、装置、设备及可读存储介质 | |
CN114741602A (zh) | 对象推荐方法、目标模型的训练方法、装置及设备 | |
CN114281937A (zh) | 嵌套实体识别模型的训练方法、嵌套实体识别方法及装置 | |
CN113420217A (zh) | 生成文案的方法、装置、电子设备和计算机可读存储介质 | |
CN114764480A (zh) | 群组类型识别方法、装置、计算机设备及介质 | |
CN112232890A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN112070586A (zh) | 基于语义识别的物品推荐方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40085230 Country of ref document: HK |