CN107832437B

CN107832437B - 音/视频推送方法、装置、设备及存储介质

Info

Publication number: CN107832437B
Application number: CN201711137183.1A
Authority: CN
Inventors: 任金鹏
Original assignee: Beijing Xiaomi Mobile Software Co Ltd
Current assignee: Beijing Xiaomi Mobile Software Co Ltd
Priority date: 2017-11-16
Filing date: 2017-11-16
Publication date: 2021-03-02
Anticipated expiration: 2037-11-16
Also published as: CN107832437A

Abstract

本公开提供一种音/视频推送方法、装置、设备及存储介质，所述方法包括：基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，所述用户信息包括个人资料、音/视频的历史观看记录中的一种或多种；向所述目标用户推送目标用户偏好的音/视频。本公开实施例可以避免推送给用户造成打扰，同时便于用户快速获取符合自己喜好的音/视频，提高用户观看音/视频的观看欲，进而提高用户满意度。

Description

音/视频推送方法、装置、设备及存储介质

技术领域

本申请涉及音/视频技术领域，尤其涉及音/视频推送方法、装置、设备及存储介质。

背景技术

随着音/视频技术的发展，每天都有大量音/视频产生，同时随着互联网技术的发展，为人们提供了更加便利的途径以观看音/视频。小米视频、腾讯视频、喜马拉雅等音/视频播放应用程序提供有大量的音/视频，而音/视频过多导致用户无法快速地从中获取符合自己喜好的音/视频。鉴于此，向用户推送适合用户的音/视频显得尤为重要。

发明内容

为克服相关技术中存在的问题，本公开提供了音/视频推送方法、装置、设备及存储介质。

根据本公开实施例的第一方面，提供一种音/视频推送方法，所述方法包括：

基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，所述用户信息包括个人资料、音/视频的历史观看记录中的一种或多种；

向所述目标用户推送目标用户偏好的音/视频。

在一个可选的实现方式中，所述基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，包括：

在信息推送条件满足时，基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频；

所述信息推送条件包括以下一种或多种条件：

推送时间达到；

指定资源池中发生音/视频添加事件。

在一个可选的实现方式中，所述指定资源池基于至少一种筛选条件对音/视频进行筛选获得；所述指定资源池包括热点音/视频资源池、评分高的音/视频资源池、高点击通过率的音/视频资源池、近期内上传的音/视频资源池中的一种或多种；所述近期内是距离当前时间为预设时间段的时间内。

在一个可选的实现方式中，所述个人资料包括目标用户的性别、年龄、职业、所在地域中的一种或多种。

在一个可选的实现方式中，所述音/视频历史观看记录包括音/视频的已观看时长、点击次数、观看完整度、所属分类中一种或多种。

在一个可选的实现方式中，以用户信息中每项信息为一种兴趣特征的特征值，每个音/视频所对应的用户信息构成特征组，特征组中包括兴趣特征的特征值集合；所述方法还包括：

针对音/视频所对应的特征组，以特征组中兴趣特征的特征值作为输入数据、以视频是否点击作为输出数据构建训练样本集；

利用所构建的训练样本集对初始化模型进行训练，获得用于预测音/视频是否会被目标用户点击的偏好模型。

获取指定资源池中音/视频所对应的特征组；

将所获取的特征组输入所述偏好模型，获得指定资源池中所述目标用户偏好的音/视频。

利用所构建的训练样本集对初始化模型进行训练，获得每个兴趣特征的权重值，并基于兴趣特征的权重值获得用于预测音/视频被目标用户点击的点击概率的偏好模型。

获取指定资源池中音/视频所对应的特征组；

将所获取的特征组输入所述偏好模型，获得目标用户点击指定资源池中音/视频的点击概率；

基于所述点击概率获得指定资源池中所述目标用户偏好的音/视频。

在一个可选的实现方式中，所述音/视频历史观看记录包括近期历史记录、短期历史记录和长期历史记录中的一种或多种记录；所述近期历史记录为目标用户前指定次数观看音/视频的音/视频历史观看记录，所述短期历史记录为距离当前时间为预设短时间段内的音/视频历史观看记录，所述长期历史记录为距离当前时间为预设长时间段内的音/视频历史观看记录。

在一个可选的实现方式中，所述偏好模型包括基于近期历史记录训练获得的近期偏好子模型、基于短期历史记录训练获得的短期偏好子模型、基于长期历史记录训练获得的长期偏好子模型中的一种或多种子模型。

在一个可选的实现方式中，所述偏好模型至少包括两种偏好子模型，所述将所获取的特征组输入所述偏好模型，获得指定资源池中所述目标用户偏好的音/视频，包括：

将所获取的特征组输入不同的偏好子模型；

确定指定资源池内音/视频被不同偏好子模型确定为会被目标用户点击的次数，并基于次数对指定资源池内音/视频进行排序；

基于排序的音/视频，获得指定资源池中所述目标用户偏好的音/视频。

在一个可选的实现方式中，所述偏好模型至少包括两种偏好子模型，不同偏好子模型对应配置有优先级权重值；

所述将所获取的特征组输入所述偏好模型，获得目标用户点击指定资源池中音/视频的点击概率，包括：

将所获取的特征组输入不同的偏好子模型，获得每个偏好子模型输出的点击概率；

根据所获得的点击概率以及偏好子模型对应的优先级权重值，获得目标用户点击指定资源池中音/视频的点击概率。

根据本公开实施例的第二方面，提供一种音/视频推送装置，所述装置包括：

信息获取模块，被配置为基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，所述用户信息包括个人资料、音/视频的历史观看记录中的一种或多种；

信息推送模块，被配置为向所述目标用户推送目标用户偏好的音/视频。

在一个可选的实现方式中，所述信息获取模块具体配置为：

所述信息推送条件包括以下一种或多种条件：

推送时间达到；

指定资源池中发生音/视频添加事件。

在一个可选的实现方式中，所述个人资料包括目标用户的性别、年龄、职业、所在地域中的一种或多种；所述音/视频历史观看记录包括音/视频的已观看时长、点击次数、观看完整度、所属分类中一种或多种。

在一个可选的实现方式中，以用户信息中每项信息为一种兴趣特征的特征值，每个音/视频所对应的用户信息构成特征组，特征组中包括兴趣特征的特征值集合；所述装置还包括第一模型预构建模块，被配置为：

在一个可选的实现方式中，所述信息获取模块包括：

第一特征组获取子模块，被配置为获取指定资源池中音/视频所对应的特征组；

第一结果获得子模块，被配置为将所获取的特征组输入所述偏好模型，获得指定资源池中所述目标用户偏好的音/视频。

在一个可选的实现方式中，以用户信息中每项信息为一种兴趣特征的特征值，每个音/视频所对应的用户信息构成特征组，特征组中包括兴趣特征的特征值集合；所述装置还包括第二模型预构建模块，被配置为：

在一个可选的实现方式中，所述信息获取模块包括：

第二特征组获取子模块，被配置为获取指定资源池中音/视频所对应的特征组；

点击概率获得子模块，被配置为将所获取的特征组输入所述偏好模型，获得目标用户点击指定资源池中音/视频的点击概率；

第二结果获得子模块，被配置为基于所述点击概率获得指定资源池中所述目标用户偏好的音/视频。

在一个可选的实现方式中，所述音/视频历史观看记录包括近期历史记录、短期历史记录和长期历史记录中的一种或多种记录；所述近期历史记录为目标用户前指定次数观看音/视频的音/视频历史观看记录，所述短期历史记录为距离当前时间为预设短时间段内的音/视频历史观看记录，所述长期历史记录为距离当前时间为预设长时间段内的音/视频历史观看记录；

所述偏好模型包括基于近期历史记录训练获得的近期偏好子模型、基于短期历史记录训练获得的短期偏好子模型、基于长期历史记录训练获得的长期偏好子模型中的一种或多种子模型。

在一个可选的实现方式中，所述偏好模型至少包括两种偏好子模型，所述第一结果获得子模块具体配置为：

将所获取的特征组输入不同的偏好子模型；

所述点击概率获得子模块具体配置为：

根据本公开实施例的第三方面，提供一种服务端设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

向所述目标用户推送目标用户偏好的音/视频。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一项所述方法的步骤。

本公开的实施例提供的技术方案可以包括以下有益效果：

本公开实施例基于目标用户的用户信息，从指定资源池中获取目标用户偏好的音/视频，并向该目标用户推送目标用户偏好的音/视频，个性化推荐可以避免推送给用户造成打扰，同时便于用户快速获取符合自己喜好的音/视频，提高用户观看音/视频的观看欲，进而提高用户满意度以及活跃率。

本公开实施例只有在信息推送条件满足时，才进行音/视频推送操作，可以避免实时计算以及推送给用户带来困扰，避免造成资源浪费。

本公开实施例中，由于指定资源池基于至少一种筛选条件对音/视频进行筛选获得，可见，指定资源池是对音/视频的粗粒度筛选，从指定资源池中获取目标用户偏好的音/视频，是对音/视频的细粒度筛选，实现双重筛选，提高获得目标用户偏好的音/视频的效率。

本公开实施例中，以特征组中兴趣特征的特征值作为输入数据、以视频是否点击作为输出数据构建训练样本集，利用所构建的训练样本集对初始化模型进行训练，获得用于预测音/视频是否会被目标用户点击的偏好模型，训练效率高。

本公开实施例中，以特征组中兴趣特征的特征值作为输入数据、以视频是否点击作为输出数据构建训练样本集，并利用所构建的训练样本集对初始化模型进行训练，获得每个兴趣特征的权重值，并基于兴趣特征的权重值获得用于预测音/视频被目标用户点击的点击概率的偏好模型，从而在应用阶段，利用偏好模型确定指定资源池中目标用户偏好的音/视频，可以提高确定准确率。

本公开实施例中，基于时间的不同将音/视频历史观看记录进行划分，而基于不同时期的历史观看记录训练获得的偏好子模型则具有不同的重要程度，从而实现从不同时期体现用户偏好习惯，进而提高获得目标用户偏好的音/视频的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是本公开根据一示例性实施例示出的一种音/视频推送方法的流程图。

图2是本公开根据一示例性实施例示出的一种音/视频推送方法的应用场景图。

图3是本公开根据一示例性实施例示出的一种偏好模型预构建方法的流程图。

图4是本公开根据一示例性实施例示出的另一种偏好模型预构建方法的流程图。

图5是本公开根据一示例性实施例示出的一种音/视频推送装置的框图。

图6是本公开根据一示例性实施例示出的另一种音/视频推送装置的框图。

图7是本公开根据一示例性实施例示出的另一种音/视频推送装置的框图。

图8是本公开根据一示例性实施例示出的一种用于音/视频推送的装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本公开可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

随着音/视频技术的发展，每天都有大量音/视频产生，同时随着互联网技术的发展，为人们提供了更加便利的途径以观看音/视频。小米视频、腾讯视频、喜马拉雅等音/视频播放应用程序提供有大量的音/视频，而音/视频过多导致用户无法快速地从中获取符合自己喜好的音/视频。然而，如果对所有用户都推送相同的音/视频，随着推送的音/视频越来越多，可能会对用户造成打扰，丧失推送音/视频的意义。

鉴于此，为了避免推送的音/视频给用户造成打扰，本公开实施例提供一种音/视频推送方法，该方法基于目标用户的用户信息，从指定资源池中获取目标用户偏好的音/视频，并向该目标用户推送目标用户偏好的音/视频，个性化推荐可以避免推送给用户造成打扰，同时便于用户快速获取符合自己喜好的音/视频，提高用户观看音/视频的观看欲，进而提高用户满意度。

接下来结合附图对本公开方案进行示例说明。

如图1所示，图1是本公开根据一示例性实施例示出的一种音/视频推送方法的流程图，该方法可以用于服务端设备中，包括以下步骤：

在步骤102中，基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，所述用户信息包括个人资料、音/视频的历史观看记录中的一种或多种。

在步骤104中，向所述目标用户推送目标用户偏好的音/视频。

本公开实施例中，服务端设备可以向用户端设备推送音/视频。其中，服务端设备可以是服务器、服务器集群、云端服务器等。用户端设备可以是智能手机、平板电脑、PDA(Personal Digital Assistant，个人数字助理)、电视机、多媒体播放器等具有音/视频播放功能的电子设备。在电子设备中可以安装有音/视频播放应用程序，目标用户可以利用音/视频播放应用程序登录服务端，也可以利用音/视频播放应用程序播放音/视频。如图2所示，图2是本公开根据一示例性实施例示出的一种音/视频推送方法的应用场景图。用于提供音/视频的视频服务器可以通过网络向用户终端推送目标用户偏好的音/视频，所述目标用户可以是利用该用户终端中音/视频播放应用程序登录服务端的用户。

在一个可选的实现方式中，还可以为推送设置触发条件，以实现在触发条件满足时才执行本实施例方法。例如，可以在信息推送条件满足时，基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频。以下列举几种信息推送条件进行示例说明。信息推送条件包括以下一种或多种条件：

条件一：推送时间达到。

其中，推送时间可以是推送时刻，例如，每天八点进行音/视频推送。推送时间也可以是推送间隔时段，例如，每间隔6小时进行音/视频推送。

在一个例子中，推送时间还可以基于用户信息获得。例如，可以根据用户的年龄段、所属职业等预测出用户便于观看音/视频的时间。又如，可以根据用户的历史观看记录预测出用户便于观看音/视频的时间。可见，基于用户信息获得的推送时间具有个性化，可以避免在用户不方便的时候向用户推送音/视频给用户造成的困扰。

条件二：指定资源池中发生音/视频添加事件。

当存在满足指定资源池要求的音/视频需添加至指定资源池时，可以判定指定资源池中发生音/视频添加事件。可见，在指定资源池中发生音/视频添加事件，可以启动音/视频信息推送功能，实现在有新资源添加时进行推送。

可以理解的是，信息推送条件不限于上述所列举条件，针对其他可以触发启动音/视频推送的条件也可以，在此不一一赘述。

关于用户信息，用户信息可以是用于确定目标用户对音/视频偏好的信息。能预测目标用户对音/视频偏好的信息可以作为本实施例所指用户信息。例如，用户信息可以包括个人资料、音/视频的历史观看记录中的一种或多种。其中，个人资料可以是用于描述用户基本情况、且能用于预测目标用户对音/视频偏好的信息。例如，目标用户的个人资料可以包括目标用户的性别、年龄、职业、所在地域中的一种或多种。音/视频历史观看记录可以是用户观看音/视频而产生的记录。例如，所述音/视频历史观看记录可以包括音/视频的已观看时长、点击次数、观看完整度、所属分类中一种或多种。在本公开实施例中，可以以用户信息中每项信息为一种兴趣特征的特征值，即用户信息中的属性可以作为兴趣特征，用户信息中属性所对应的内容可以作为兴趣特征的特征值，从而实现从多维兴趣特征的角度预测目标用户偏好的音/视频。

由于不同年龄阶段、不同性别、不同职业、不同地区的目标用户所喜好的音/视频可能不一样，因此，可以将个人资料中的各项属性作为兴趣特征，并根据目标用户的个人资料对兴趣特征进行赋值，获得特征值。可以理解的是，本实施例所指特征值不限于具体数值，还可以是除数值以外的其他字符。例如，个人资料可以包括性别、年龄、职业、所在地域等属性，目标用户的个人资料包括各种属性对应的具体内容。因此，可以将性别作为一维兴趣特征，将目标用户的性别作为该维兴趣特征的特征值；可以将年龄作为一维兴趣特征，将目标用户的年龄作为该维兴趣特征的特征值等。

由于目标用户观看音/视频的历史记录也可以体现出目标用户的音/视频偏好，因此，可以将音/视频的历史观看记录中每项信息作为兴趣特征的特征值。例如，音/视频历史观看记录可以包括音/视频的已观看时长、点击次数、观看完整度、所属分类等中一维或多维兴趣特征的特征值。

其中，无论是音频还是视频，同一音/视频可能存在单个文件和多个文件的情况。以视频为例，当视频的类型为电影时，该视频为单个文件；当视频的类型为电视剧时，该视频为多个文件，每集可以作为一个独立的视频文件。因此，在视频为单个文件时，已观看时长可以是该视频文件中已观看部分的播放时长；在视频为多个文件时，已观看时长可以是所有视频文件中已观看部分的播放时长总和。

关于点击次数，可以是目标用户点击音/视频的次数。本实施例中，可以通过点击次数反应目标用户对这类音/视频的喜好程度。

关于观看完整度，可以是针对某音/视频，已观看部分占完整部分的比例。由于目标用户对喜欢的音/视频往往会完整观看，因此，观看完整度也是反应目标用户对音/视频的喜好程度的因素之一。

关于所属分类，针对音/视频，可以从不同的维度进行分类，还可以进行粗分类和细分类。例如，可以将视频粗分类为电影、电视剧、综艺、新闻、游戏、动漫、短视频等，针对粗分类又可以按不同维度进行细分类，例如针对电影类，可以按电影出产地的维度进行细分类，划分为内地、香港、美国、日本等细分类；可以按故事情节的维度划分为动作片、爱情片、喜剧片、惊悚片、科幻片等细分类；可以按时间的维度划分为2017、2016、2015等细分类；可以按评分的维度划分为5分以下、5到6分、6到7分、7到8分、8到9分、9到10分。又如，可以将音频粗分类为有声书、儿童、相声评述、音乐、脱口秀等分类。针对有声书又可以分为悬疑、都市、文学、武侠等。

可以理解的是，根据划分的维度不同，可以实现从不用维度对音/视频进行介绍。音/视频所属分类的数量可以不做限制，可以是一种分类，也可以是多种分类。例如，针对视频A，其所属分类可以包括：电影类、内地、动作片等。

此外，兴趣特征不限于包括上述所列举的兴趣特征，还可以包括其他兴趣特征，只要能作为评判目标用户是否喜欢音/视频的影响因子即可。例如，兴趣特征还可以是音/视频的标签，标签也是对音/视频的介绍，以弥补固定分类的局限，可以扩展介绍音/视频的维度。例如，标签可以是情感因素标签，利用情感因素对音/视频进行评价。如，该音/视频属于欢快、悲伤、恐惧等情感分类。该标签可以是从音/视频的名称中提取关键字获得，也可以是管理员为音/视频创建的标签，还可以是用户为音/视频创建的标签，以实现从用户的角度对音/视频进行介绍。例如，用户可以在观看完音/视频后对音/视频进行贴标签，或者对已有标签进行投票。为了避免同一音/视频具有过多的标签，可以按标签的出现频率或者标签的投票数筛选出出现频率较高或投票数较高的标签，将筛选出的标签作为音/视频的标签。

关于指定资源池，指定资源池可以基于至少一种筛选条件对音/视频进行筛选获得。筛选条件可以包括热点、评分高于或等于设定分数阈值的音/视、点击通过率(Click-Through-Rate，CTR)高于或等于设定通过率阈值、近期内上传等中的一种或多种条件。所述近期内是距离当前时间为预设时间段的时间内。

例如，指定资源池包括热点音/视频资源池、评分高的音/视频资源池、高点击通过率的音/视频资源池、近期内上传的音/视频资源池中的一种或多种。又如，指定资源池为热点且评分高的音/视频资源池，指定资源池为高点击通过率且近期内上传的音/视频资源池等。

其中，热点音/视频资源池可以是比较受广大群众关注或者欢迎的音/视频的集合。评分高的音/视频资源池可以是评分高于或等于设定分数阈值的音/视频的集合。例如，可以基于播放数量、评论数量、点赞数量、分享状态、用户评价等多维度对音/视频进行打分，获得每个音/视频的评分，将评分高于设定阈值的音/视频构成评分高的音/视频资源池。高点击通过率可以是点击通过率高于或等于设定通过率阈值的音/视频的集合。点击通过率可以是该音/视频的实际点击次数与所有音/视频的展现量的比值，可以是用于衡量音/视频展示效果的一项重要指标。

近期内上传的音/视频资源池可以是在近期内上传的音/视频的集合。近期可以是以当前时间为基准时间向历史时间倒推一个预设时间段的时间，例如，可以是过去一周内、过去一个月内、过去一个小时内等。

可见，指定资源池是对音/视频的粗粒度筛选，从指定资源池中获取目标用户偏好的音/视频，是对音/视频的细粒度筛选，从而实现双重筛选，提高获得目标用户偏好的音/视频的效率。

从指定资源池中获取目标用户偏好的音/视频时，可以是从指定资源池的所有音/视频中获取目标用户偏好的音/视频，也可以是从指定资源池的部分音/视频中获取目标用户偏好的音/视频。例如，指定资源池包括近期内上传的音/视频资源池时，可以判断近期内上传的音/视频资源池中每个音/视频是否为目标用户偏好的音/视频。又如，当信息推送条件为指定资源池中发生音/视频添加事件时，则可以判断资源池中音/视频添加事件所对应的音/视频是否为目标用户偏好的音/视频，从而实现在有添加事件发生时，对发生添加事件的音/视频进行判断，进而推送至相应的用户。

接下来，对如何基于目标用户的用户信息从指定资源池中获取目标用户偏好的音/视频进行示例说明。

在一个可选的实现方式中，目标用户对音/视频的偏好，可以利用一个具体的值进行度量，以实现确定出目标用户对音/视频的偏好程度。

在一个例子中，可以利用用户点击目标音/视频的点击概率衡量用户对音/视频的偏好程度。可以理解的是，也可以利用其它参数表示用户对音/视频的偏好程度，例如，利用目标用户对音/视频的评分表示用户对音/视频的偏好程度等。

例如，所述基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，可以包括：

获取指定资源池中音/视频所对应的特征组；

将所获取的特征组输入所述偏好模型，获得目标用户点击指定资源池中音/视频的点击概率；所述偏好模型用于预测音/视频被目标用户点击的点击概率；

其中，由于音/视频历史观看记录与音/视频存在对应关系，而个人资料也可以作为评判目标用户是否喜欢音/视频的因子，因此，针对每个音/视频存在对应的用户信息，用户信息可以包括个人资料和该音/视频的历史观看记录。可见，不仅可以用音/视频的历史观看记录体现出目标用户与该音/视频的偏好关系，还可以用目标用户的个人资料体现出目标用户与该音/视频的偏好关系。

进一步的，每个音/视频所对应的用户信息可以构成特征组，特征组中包括兴趣特征的特征值集合。以个人资料包括：性别为女、年龄段为20-30；该视频的历史观看记录包括：已观看时长为60min、点击次数为2次、观看完整度为50％、所属分类为电影、悬疑片为例，则该视频的兴趣特征包括：性别、年龄段、已观看时长、点击次数、观看完整度、所属分类等。特征组可以如下：

性别女

年龄段20-30

已观看时长60min

点击次数2次

观看完整度50％

所属分类电影、悬疑片

为了预测目标用户点击音/视频的点击概率，可以预先基于用户信息建立一个能体现目标用户偏好的偏好模型，在利用训练样本进行训练时，可以获得各个兴趣特征的权重值，进而获得用于预测音/视频是否被点击偏好模型。例如，如图3所示，图3是本公开根据一示例性实施例示出的一种偏好模型预构建方法的流程图，以用户信息中每项信息为一种兴趣特征的特征值，每个音/视频所对应的用户信息构成特征组，特征组中包括兴趣特征的特征值集合；所述方法可以包括：

在步骤302中，针对音/视频所对应的特征组，以特征组中兴趣特征的特征值作为输入数据、以视频是否点击作为输出数据构建训练样本集；

在步骤304中，利用所构建的训练样本集对初始化模型进行训练，获得每个兴趣特征的权重值，并基于兴趣特征的权重值获得用于预测音/视频被目标用户点击的点击概率的偏好模型。

其中，兴趣特征的权重值可以体现出该兴趣特征对目标用户对音/视频偏好的影响程度。利用所构建的训练样本集对初始化模型进行训练获得的模型，可以用于预测音/视频是否会被目标用户点击，并且获得每个兴趣特征的权重值，而在预测音/视频是否会被目标用户点击前，某些例子中可以计算音/视频被目标用户点击的点击概率，以便基于点击概率预测音/视频是否会被目标用户点击，鉴于此，在一个例子中，可以将模型中用于预测音/视频被目标用户点击的点击概率的部分提出来获得偏好模型。在另一个例子中，由于每个兴趣特征的权重值已确定，则可以直接根据兴趣特征的权重值获得用于预测音/视频被目标用户点击的点击概率的偏好模型。例如，偏好模型可以是兴趣特征的特征值与权重值加权求和的模型等。

训练样本中的输入数据可以是单个兴趣特征的特征值，也可以是由特征组中两两兴趣特征的特征值组成的键值对，通过组合成键值对作为训练样本的输入数据，可以拓宽输入数据的维度，从而训练获得判断准确性更高的偏好模型。

在获得偏好模型后，在线上进行推送时，可以获取指定资源池中音/视频所对应的特征组。当音/视频是用户已观看过的音/视频时，音/视频所对应的特征组中各兴趣特征的特征值不为空，而当音/视频是用户未观看过的音/视频时，音/视频所对应的特征组中部分兴趣特征的特征值为空。

作为其中一种实现方式，可以将为空的特征值设置为0，进而基于所获取的特征组以及所述偏好模型，获得目标用户点击音/视频的点击概率。例如，可以将音/视频所对应的特征组中的特征值输入偏好模型，利用偏好模型确定目标用户点击音/视频的点击概率。

作为另一种实现方式，针对音/视频所对应的特征组中部分兴趣特征的特征值为空的情况，获取与目标用户具有相似性的其他用户，根据其他用户观看该音/视频的历史观看记录，确定兴趣特征的特征值，将该特征值作为音/视频所对应的特征组中兴趣特征的特征值，实现对特征组中兴趣特征进行赋值。在赋值成功后，可以基于所获得的特征组以及偏好模型，获得目标用户点击音/视频的点击概率。

在获得目标用户点击指定资源池中音/视频的点击概率后，可以基于所述点击概率获得指定资源池中所述目标用户偏好的音/视频。例如，可以将不同资源池中点击概率满足概率条件的音/视频确定为目标用户偏好的音/视频。概率条件可以是点击概率大于或等于概率阈值，则将资源池中点击概率大于或等于概率阈值的音/视频确定为目标用户偏好的音/视频。

实际应用中，可能存在指定资源池包括至少两个资源池的情况。在一个例子中，可以将不同资源池中点击概率满足概率条件的音/视频确定为目标用户偏好的音/视频。

在另一个例子中，每个资源池设置有相应的权重值，在获得目标用户点击指定资源池中音/视频的点击概率后，可以将所确定的点击概率与该指定资源池对应的权重值相乘，并将乘积大于或等于概率阈值的音/视频确定为目标用户偏好的音/视频。

可见，针对不同资源池设置不同权值，可以实现不同资源池具有不同重要性，进而提高获得偏好音/视频的准确度。

在一个可选的实现方式中，可以将基于时间的不同对音/视频历史观看记录进行划分，例如，所述音/视频历史观看记录包括近期历史记录、短期历史记录和长期历史记录中的一种或多种记录。所述近期历史记录为目标用户前指定次数观看音/视频的音/视频历史观看记录。前指定次数可以是以当前观看为起始次数向历史观看倒推指定次数。如，指定次数为自然数N，则前指定次数为前N次。例如，近期历史记录可以是用户上一次观看音/视频的历史观看记录，又如，近期历史记录可以是用户前5次观看音/视频的历史观看记录。所述短期历史记录为距离当前时间为预设短时间段内的音/视频历史观看记录。预设短时间段可以灵活配置，例如，可以是一周，一个月等。所述长期历史记录为距离当前时间为预设长时间段内的音/视频历史观看记录。预设长时间段可以灵活配置，例如，可以是半年、一年等。

相应的，所述偏好模型包括基于近期历史记录训练获得的近期偏好子模型、基于短期历史记录训练获得的短期偏好子模型、基于长期历史记录训练获得的长期偏好子模型中的一种或多种子模型。

如果偏好模型至少包括两种偏好子模型，不同偏好子模型对应配置有优先级权重值。优先级与优先级权重值可以呈正相关关系，优先级越大，优先级权重值越大；优先级越小，优先级权重值越小。例如，由于距离当前时间越短，越能体现出用户的喜好，鉴于此，近期偏好子模型的优先级权重值高于短期偏好子模型的优先级权重值，短期偏好子模型的优先级权重值高于长期偏好子模型的优先级权重值。

由于有多个偏好子模型，针对同一个音/视频，每个偏好子模型可以输出一个点击概率，则可以根据所获得的点击概率以及偏好子模型对应的优先级权重值，获得目标用户点击该音/视频的点击概率。

可见，针对不同偏好子模型设置不同优先级权值，可以区分基于不同时期历史记录训练获得的模型的重要性，进而提高获得偏好音/视频的准确度。

上述实施例仅列举出几种确定点击概率的方式，还可以采用其他方式获得目标用户点击音/视频的点击概率，在此不一一列举。

在另一个可选的实现方式中，目标用户对目标音/视频的偏好，可以从两个维度体现偏好结果，例如，偏好(感兴趣)和不偏好(不感兴趣)。

在一个例子中，可以利用目标用户是否点击音/视频表示用户是否偏好该音/视频。为了预测目标用户是否点击音/视频，可以预先基于用户信息建立一个能体现目标用户是否点击音/视频的偏好模型。例如，如图4所示，图4是本公开根据一示例性实施例示出的另一种偏好模型预构建方法的流程图，以用户信息中每项信息为一种兴趣特征的特征值，每个音/视频所对应的用户信息构成特征组，特征组中包括兴趣特征的特征值集合；所述方法还包括：

在步骤402中，针对音/视频所对应的特征组，以特征组中兴趣特征的特征值作为输入数据、以视频是否点击作为输出数据构建训练样本集。

在步骤404中，利用所构建的训练样本集对初始化模型进行训练，获得用于预测音/视频是否会被目标用户点击的偏好模型。

其中，图4与图3中相关技术相似，在此不一一赘述。

在获得用于预测音/视频是否会被目标用户点击的偏好模型时，所述基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，可以包括：

获取指定资源池中音/视频所对应的特征组；

在该实施例中，若根据偏好模型预测音/视频会被目标用户点击时，判定目标用户偏好该音/视频，若根据偏好模型预测音/视频不会被目标用户点击时，判定目标用户不偏好该音/视频。

可见，通过偏好和不偏好两个角度描述用户的偏好程度，可以提高确定偏好模型的效率。

实际应用中，可能存在指定资源池包括至少两个资源池的情况。在一个例子中，可以将不同资源池中会被目标用户点击的音/视频确定为目标用户偏好的音/视频，实现多维度获得目标用户偏好的音/视频。

在另一个例子中，每个资源池设置有相应的优先级，在获得目标用户是否点击指定资源池中音/视频后，可以将优先级高的资源池中会被目标用户点击的音/视频排列在前，将优先级低的资源池中会被目标用户点击的音/视频排列在后，并将排列靠前的前指定个数的音/视频确定为目标用户偏好的音/视频。可见，既考虑多维度确定目标用户偏好的音/视频，又考虑不同资源池对目标用户偏好音/视频的影响度。

在另一个例子中，在获得目标用户是否点击指定资源池中音/视频后，可以筛选出不同资源池中被目标用户点击的音/视频，并将筛选获得的音/视频中出现次数高于指定次数的音/视频确定为目标用户偏好的音/视频，从而提高确定偏好音/视频的准确性。

在一个可选的实现方式中，可以将基于时间的不同对音/视频历史观看记录进行划分，例如，所述音/视频历史观看记录包括近期历史记录、短期历史记录和长期历史记录中的一种或多种记录。所述近期历史记录为目标用户前指定次数观看音/视频的音/视频历史观看记录。例如，近期历史记录可以是用户上一次观看音/视频的历史观看记录，又如，近期历史记录可以是用户前5次观看音/视频的历史观看记录。所述短期历史记录为距离当前时间为预设短时间段内的音/视频历史观看记录。预设短时间段可以灵活配置，例如，可以是一周，一个月等。所述长期历史记录为距离当前时间为预设长时间段内的音/视频历史观看记录。预设长时间段可以灵活配置，例如，可以是半年、一年等。

如果偏好模型至少包括两种偏好子模型，所述将所获取的特征组输入所述偏好模型，获得指定资源池中所述目标用户偏好的音/视频，可以包括：

将所获取的特征组输入不同的偏好子模型；

其中，音/视频可能被偏好子模型确定为会被目标用户点击(结果一)或不会被目标用户点击(结果二)两种结果之一，本实施例欲统计音/视频被不同偏好模型判定为结果一的次数。由于有多个偏好子模型，针对同一个音/视频，每个偏好子模型可以输出一个判断结果(会被点击或不会被点击)，则可以确定指定资源池内同一音/视频被不同偏好子模型确定为会被目标用户点击的次数，并基于次数对指定资源池内音/视频进行排序，进而根据排序，筛选出排列靠前的指定个数的音/视频作为目标用户偏好的音/视频。

以上实施方式中的各种技术特征可以任意进行组合，只要特征之间的组合不存在冲突或矛盾，但是限于篇幅，未进行一一描述，因此上述实施方式中的各种技术特征的任意进行组合也属于本说明书公开的范围。

与前述音/视频推送方法的实施例相对应，本公开还提供了音/视频推送装置、装置所应用的设备以及存储介质的实施例。

如图5所示，图5是本公开根据一示例性实施例示出的一种音/视频推送装置的框图，所述装置包括：

信息获取模块51，被配置为基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，所述用户信息包括个人资料、音/视频的历史观看记录中的一种或多种。

信息推送模块52，被配置为向所述目标用户推送目标用户偏好的音/视频。

在一个可选的实现方式中，所述信息获取模块51具体配置为：

所述信息推送条件包括以下一种或多种条件：

推送时间达到；

指定资源池中发生音/视频添加事件。

如图6所示，图6是本公开根据一示例性实施例示出的另一种音/视频推送装置的框图，该实施例在前述图5所示实施例的基础上，以用户信息中每项信息为一种兴趣特征的特征值，每个音/视频所对应的用户信息构成特征组，特征组中包括兴趣特征的特征值集合；所述装置还包括第一模型预构建模块53，被配置为：

针对音/视频所对应的特征组，以特征组中兴趣特征的特征值作为输入数据、以视频是否点击作为输出数据构建训练样本集；利用所构建的训练样本集对初始化模型进行训练，获得用于预测音/视频是否会被目标用户点击的偏好模型。

所述信息获取模块51包括：

第一特征组获取子模块511，被配置为获取指定资源池中音/视频所对应的特征组。

第一结果获得子模块512，被配置为将所获取的特征组输入所述偏好模型，获得指定资源池中所述目标用户偏好的音/视频。

如图7所示，图7是本公开根据一示例性实施例示出的另一种音/视频推送装置的框图，该实施例在前述图5所示实施例的基础上，以用户信息中每项信息为一种兴趣特征的特征值，每个音/视频所对应的用户信息构成特征组，特征组中包括兴趣特征的特征值集合；所述装置还包括第二模型预构建模块54，被配置为：

针对音/视频所对应的特征组，以特征组中兴趣特征的特征值作为输入数据、以视频是否点击作为输出数据构建训练样本集；利用所构建的训练样本集对初始化模型进行训练，获得每个兴趣特征的权重值，并基于兴趣特征的权重值获得用于预测音/视频被目标用户点击的点击概率的偏好模型；

所述信息获取模块51包括：

第二特征组获取子模块513，被配置为获取指定资源池中音/视频所对应的特征组。

点击概率获得子模块514，被配置为将所获取的特征组输入所述偏好模型，获得目标用户点击指定资源池中音/视频的点击概率。

第二结果获得子模块515，被配置为基于所述点击概率获得指定资源池中所述目标用户偏好的音/视频。

在一个可选的实现方式中，所述偏好模型至少包括两种偏好子模型，所述第一结果获得子模块512具体配置为：

将所获取的特征组输入不同的偏好子模型；

在一个可选的实现方式中，所述偏好模型至少包括两种偏好子模型，不同偏好子模型对应配置有优先级权重值；所述点击概率获得子模块514具体配置为：

相应的，本公开还提供一种服务端设备，所述设备包括有处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为：

向所述目标用户推送目标用户偏好的音/视频。

相应的，本公开还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一项所述方法的步骤。

本公开可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体，可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于：相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

上述装置中各个模块的功能和作用的实现过程具体详情见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

如图8所示，图8是根据一示例性实施例示出的一种用于音/视频推送的装置的框图。

例如，装置800可以被提供为服务端设备。参照图8，装置800包括处理组件822，其进一步包括一个或多个处理器，以及由存储器832所代表的存储器资源，用于存储可由处理部件822的执行的指令，例如应用程序。存储器832中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件822被配置为执行指令，以执行上述音/视频推送方法。

装置800还可以包括一个电源组件826被配置为执行装置800的电源管理，一个有线或无线网络接口850被配置为将装置800连接到网络，和一个输入输出(I/O)接口858。装置800可以操作基于存储在存储器832的操作***。

其中，当所述存储器832中的指令由所述处理组件822执行时，使得装置800能够执行一种音/视频推送方法，包括：

基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，所述用户信息包括个人资料、音/视频的历史观看记录中的一种或多种。

向所述目标用户推送目标用户偏好的音/视频。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

以上所述仅为本公开的较佳实施例而已，并不用以限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开保护的范围之内。

Claims

1.一种音/视频推送方法，其特征在于，所述方法包括：

基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，所述用户信息包括个人资料、音/视频的历史观看记录中的一种或多种；以用户信息中每项信息为一种兴趣特征的特征值，每个音/视频所对应的用户信息构成特征组，特征组中包括兴趣特征的特征值集合；

向所述目标用户推送目标用户偏好的音/视频；

所述目标用户偏好的音/视频的获得方式包括：

将指定资源池中音/视频所对应的特征组输入用于预测音/视频是否会被目标用户点击的偏好模型对应的不同的偏好子模型；所述偏好模型至少包括两种偏好子模型；

基于排序的音/视频，获得所述目标用户偏好的音/视频；

或者，

将指定资源池中音/视频所对应的特征组输入用于预测音/视频被目标用户点击的点击概率的偏好模型对应的不同的偏好子模型，获得每个偏好子模型输出的点击概率；所述偏好模型至少包括两种偏好子模型，不同偏好子模型对应配置有优先级权重值；

根据所获得的点击概率以及偏好子模型对应的优先级权重值，获得目标用户点击指定资源池中音/视频的点击概率；

基于所述点击概率，获得所述目标用户偏好的音/视频；

其中，所述偏好子模型包括以下任一：基于近期历史记录训练获得的近期偏好子模型、基于短期历史记录训练获得的短期偏好子模型、或基于长期历史记录训练获得的长期偏好子模型；所述近期历史记录为目标用户前指定次数观看音/视频的音/视频历史观看记录，所述短期历史记录为距离当前时间为预设短时间段内的音/视频历史观看记录，所述长期历史记录为距离当前时间为预设长时间段内的音/视频历史观看记录。

2.根据权利要求1所述的方法，其特征在于，所述基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，包括：

所述信息推送条件包括以下一种或多种条件：

推送时间达到；

指定资源池中发生音/视频添加事件。

3.根据权利要求1所述的方法，其特征在于，所述指定资源池基于至少一种筛选条件对音/视频进行筛选获得；所述指定资源池包括热点音/视频资源池、评分高的音/视频资源池、高点击通过率的音/视频资源池、近期内上传的音/视频资源池中的一种或多种；所述近期内是距离当前时间为预设时间段的时间内；

所述个人资料包括目标用户的性别、年龄、职业、所在地域中的一种或多种；所述音/视频历史观看记录包括音/视频的已观看时长、点击次数、观看完整度、所属分类中一种或多种。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

利用所构建的训练样本集对初始化模型进行训练，获得用于预测音/视频是否会被目标用户点击的偏好模型；

所述基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，包括：

获取指定资源池中音/视频所对应的特征组；

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

利用所构建的训练样本集对初始化模型进行训练，获得每个兴趣特征的权重值，并基于兴趣特征的权重值获得用于预测音/视频被目标用户点击的点击概率的偏好模型；

获取指定资源池中音/视频所对应的特征组；

6.一种音/视频推送装置，其特征在于，所述装置包括：

信息获取模块，被配置为基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，所述用户信息包括个人资料、音/视频的历史观看记录中的一种或多种；以用户信息中每项信息为一种兴趣特征的特征值，每个音/视频所对应的用户信息构成特征组，特征组中包括兴趣特征的特征值集合；

信息推送模块，被配置为向所述目标用户推送目标用户偏好的音/视频；

所述目标用户偏好的音/视频的获得方式包括：

基于排序的音/视频，获得所述目标用户偏好的音/视频；

或者，

基于所述点击概率，获得所述目标用户偏好的音/视频；

7.根据权利要求6所述的装置，其特征在于，所述信息获取模块具体配置为：

所述信息推送条件包括以下一种或多种条件：

推送时间达到；

指定资源池中发生音/视频添加事件。

8.根据权利要求6所述的装置，其特征在于，所述指定资源池基于至少一种筛选条件对音/视频进行筛选获得；所述指定资源池包括热点音/视频资源池、评分高的音/视频资源池、高点击通过率的音/视频资源池、近期内上传的音/视频资源池中的一种或多种；所述近期内是距离当前时间为预设时间段的时间内；

9.根据权利要求6所述的装置，其特征在于，所述装置还包括第一模型预构建模块，被配置为：

所述信息获取模块包括：

10.根据权利要求6所述的装置，其特征在于，所述装置还包括第二模型预构建模块，被配置为：

所述信息获取模块包括：

11.一种服务端设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

基于目标用户的用户信息，从指定资源池中获取所述目标用户偏好的音/视频，所述用户信息包括个人资料、音/视频的历史观看记录中的一种或多种；以用户信息中每项信息为一种兴趣特征的特征值，每个音/视频所对应的用户信息构成特征组，特征组中包括兴趣特征的特征值集合；所述目标用户偏好的音/视频的获得方式包括：将指定资源池中音/视频所对应的特征组输入用于预测音/视频是否会被目标用户点击的偏好模型后获得、或输入用于预测音/视频被目标用户点击的点击概率的偏好模型后获得；

向所述目标用户推送目标用户偏好的音/视频；

所述目标用户偏好的音/视频的获得方式包括：

基于排序的音/视频，获得所述目标用户偏好的音/视频；

或者，

基于所述点击概率，获得所述目标用户偏好的音/视频；

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至5任一项所述方法的步骤。