CN117235371A

CN117235371A - 视频推荐方法、模型训练方法及装置

Info

Publication number: CN117235371A
Application number: CN202311411913.8A
Authority: CN
Inventors: 张帅兵
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2023-10-27
Filing date: 2023-10-27
Publication date: 2023-12-15

Abstract

本公开提出了一种视频推荐方法、模型训练方法及装置，涉及人工智能技术领域，具体为深度学习和大模型等技术领域，视频推荐方法包括：获取用户针对第一视频的行为数据，将行为数据输入至大模型，通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像，根据用户的用户画像和第一视频的视频画像，确定用户的推荐视频，由此，本公开通过大模型对行为数据进行分析处理，可以更加了解用户的真实需求，提高了确定用户的推荐视频的准确率，提升了用户的体验感。

Description

视频推荐方法、模型训练方法及装置

技术领域

本公开涉及人工智能技术领域，具体为深度学习和大模型等技术领域，尤其涉及一种视频推荐方法、模型训练方法、装置、电子设备、存储介质和计算机程序产品。

背景技术

短视频发展迅速，用户在短视频平台的频次和时长都在日益增多，在视频列表中产出的行为数据也是繁多杂乱，随着人工智能技术的不断发展，大语言模型具有泛化性好等优点，在信息提取、文本可信度评估、机器翻译等领域中得到了广泛应用，然而，相关技术中的视频推荐方法，在视频推荐过程中存在的准确率较低的问题。

发明内容

本公开提出了一种视频推荐方法、模型训练方法、装置、电子设备、存储介质和计算机程序产品。

根据本公开的第一方面，提出了一种视频推荐方法，包括：获取用户针对第一视频的行为数据；将所述行为数据输入至大模型，通过所述大模型基于所述行为数据，生成所述用户的用户画像和所述第一视频的视频画像；根据所述用户的用户画像和所述第一视频的视频画像，确定所述用户的推荐视频。

根据本公开的第二方面，提出了一种模型训练方法，包括：获取训练样本，其中，所述训练样本包括样本用户针对样本视频的样本行为数据、所述样本用户的样本用户画像以及所述样本视频的样本视频画像；根据所述训练样本，对大模型进行训练。

根据本公开的第三方面，提出了一种视频推荐装置，包括：获取模块，用于获取用户针对第一视频的行为数据；生成模块，用于将所述行为数据输入至大模型，通过所述大模型基于所述行为数据，生成所述用户的用户画像和所述第一视频的视频画像；推荐模块，用于根据所述用户的用户画像和所述第一视频的视频画像，确定所述用户的推荐视频。

根据本公开的第四方面，提出了一种模型训练装置，包括第一获取模块，用于获取训练样本，其中，所述训练样本用于样本用户针对样本视频的样本行为数据、所述样本用户的样本用户画像以及所述样本视频的样本视频画像；训练模块，用于根据所述训练样本，对大模型进行训练。

根据本公开的第五方面，提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述第一方面提出的视频推荐方法，或者执行上述第二方面提出的模型训练方法。

根据本公开的第六方面，提出了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行上述第一方面提出的视频推荐方法，或者执行上述第二方面提出的模型训练方法。

根据本公开的第七方面，提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述第一方面提出的视频推荐方法，或者实现上述第二方面提出的模型训练方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1为本公开一实施例的视频推荐方法的流程示意图；

图2为本公开另一实施例的视频推荐方法的流程示意图；

图3为本公开另一实施例的视频推荐方法的流程示意图；

图4为本公开另一实施例的视频推荐方法的流程示意图；

图5为本公开另一实施例的模型训练方法的流程示意图；

图6为本公开一实施例的视频推荐装置的结构示意图；

图7为本公开一实施例的模型训练装置的结构示意图；

图8为本公开一实施例的电子设备的示意性框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

人工智能(Artificial Intelligence，简称AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门技术科学。目前，AI技术具有自动化程度高、精确度高、成本低的优点，得到了广泛的应用。

深度学习(Deep Learning，简称DL)是机器学习(Machine Learning，简称ML)领域中一个新的研究方向，是学习样本数据的内在规律和表示层次，使得机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据的一门科学，广泛应用于语音和图像识别。

大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型，需要大量的计算资源和存储空间来训练和存储，并且往往需要进行分布式计算和特殊的硬件加速技术，大模型具有更强的泛化能力和表达能力。

图1为本公开一实施例的视频推荐方法的流程示意图。如图1所示，该方法包括：

S101，获取用户针对第一视频的行为数据。

需要说明的是，本公开实施例的广告召回方法的执行主体可为具有数据信息处理能力的硬件设备和/或驱动该硬件设备工作所需必要的软件。可选地，执行主体可包括工作站、服务器，计算机、用户终端及其他智能设备。其中，用户终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。

需要说明的是，本公开对于获取用户针对第一视频的行为数据的具体方式不作限定，可以根据实际情况进行选取。

可选地，可以通过网络接口获取用户在第一视频的场景下对应的交互日志记录，从交互日志记录中获取用户针对第一视频的行为数据。

其中，行为数据可以为理解为用户在第一视频的场景下的交互行为数据。

可选地，用户针对第一视频的行为数据可以为用户针对第一视频的正向行为数据和负向行为数据。

举例而言，用户针对第一视频的点赞、评论、收藏、完播等正向行为数据；用户针对第一视频的不感兴趣、快划、快进等负向行为数据。

S102，将行为数据输入至大模型，通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像。

需要说明的是，大模型为采用深度学习算法进行预先训练完成的，将行为数据输入至大模型，可以通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像。

其中，用户画像即用户标签，例如：性别、年龄、教育程度、用户对不同类型视频的观看偏好、观看习惯等。

举例而言，针对用户A的用户画像，用户A通常在早晨7:00观看健身类型的视频，用户A通常在晚上8:00观看影视解说类型的视频。

其中，视频画像即视频标签，例如：视频类型和视频内容等。

举例而言，视频画像可以为美食类、影视类、搞笑类等类型，可以按照视频内容对视频类型进行细化，例如：针对美食类，可以按照视频内容将美食类视频分为美食教程类、美食吃播类等。

S103，根据用户的用户画像和第一视频的视频画像，确定用户的推荐视频。

在本公开实施例中，在获取到用户画像和视频画像后，可以根据用户的用户画像和第一视频的视频画像，确定用户的推荐视频。

需要说明的是，本公开对于根据用户画像和视频画像，确定用户的推荐视频的具体方式不作限定，可以根据实际情况进行选取。

可选地，可以根据用户的用户画像和第一视频的视频画像，确定用户针对第一视频的偏好度，基于偏好度，确定推荐视频。

本公开提出的视频推荐方法，通过获取用户针对第一视频的行为数据，将行为数据输入至大模型，通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像，根据用户的用户画像和第一视频的视频画像，确定用户的推荐视频，由此，本公开通过大模型对行为数据进行分析处理，可以更加了解用户的真实需求，提高了确定用户的推荐视频的准确率，提升了用户的体验感。

图2是根据本公开第二实施例的视频推荐方法的流程示意图。

如图2所示，在图1所示实施例的基础上，本公开实施例的视频推荐方法具体可包括以下步骤：

S201，获取用户针对第一视频的行为数据。

S202，将行为数据输入至大模型，通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像。

需要说明的是，在用户观看视频的过程中，用户的行为数据在不断变化，因此，为了提高视频推荐的准确率，需要对用户画像和视频画像进行更新。

可选地，若当前满足画像的更新条件，获取距离当前时刻设定时长内用户针对第二视频的行为数据，将重新获取的行为数据输入至大模型，通过大模型基于重新获取的行为数据，重新生成用户的用户画像，并生成第二视频的视频画像，将原有的用户的用户画像更新为重新生成的用户的用户画像，以及将第一视频的视频画像更新为第二视频的视频画像。

需要说明的是，本公开对于画像的更新条件的设置不作限定，可以根据实际情况进行设定。

可选地，可以设置画像的更新条件为画像每隔一周进行更新；可选地，可以设置画像的更新条件为根据用户对推荐视频的行为数据进行自定义更新。

步骤S201-S202的相关内容，可参见上述实施例，这里不再赘述。

上述实施例中的步骤S103“根据用户的用户画像和第一视频的视频画像，确定用户的推荐视频”具体可包括以下步骤S203和S204。

S203，根据用户的用户画像和第一视频的视频画像，确定用户针对第一视频的偏好度。

需要说明的是，本公开对于根据用户画像和视频画像，确定用户针对第一视频的偏好度的具体方式不作限定，可以根据实际情况进行选取。

可选地，可以通过人工智能技术，对用户画像和第一视频的视频画像进行分析，以获取用户针对第一视频的偏好度。

其中，用户针对第一视频的偏好度可以衡量第一视频的权重，当第一视频的偏好度越高即第一视频的权重值越高，当第一视频的偏好度越低即第一视频的权重值越低。

S204，基于偏好度，确定推荐视频。

可选地，若第一视频对应的偏好度大于第三设定阈值，将第一视频作为目标视频，从视频库中筛选出与目标视频相似的候选视频，作为推荐视频。

需要说明的是，本公开对于第三设定阈值的设置不作限定，可以根据实际情况进行设定。

需要说明的是，在获取到目标视频后，可以计算目标视频与视频库中视频的相似度，可以根据目标视频与视频库中视频的相似度，确定推荐视频。

可选地，若目标视频与视频库中视频的相似度之间的相似度大于相似度阈值，将大于相似度阈值的候选视频确定为推荐视频。

可选地，可以对视频库中视频按照相似度降序排序，将排序前M个的候选视频确定为推荐视频，其中，M为正整数。

需要说明的是，在获取到推荐视频后，可以按照预设的推荐策略，将推荐视频推荐给用户。

可选地，可以获取推荐视频的权重，按照权重高低依次推荐给用户；可选地，可以将推荐视频按照随机的方式，推荐给用户。

本公开提出的视频推荐方法，通过获取用户针对第一视频的行为数据，将行为数据输入至大模型，通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像，根据用户的用户画像和第一视频的视频画像，确定用户针对第一视频的偏好度,基于偏好度，确定推荐视频，由此，本公开通过用户针对第一视频的偏好度，确定推荐视频，可以更加准确地挖掘用户的真实潜在需求，可以更加准确地感知用户对视频的喜好，提升了用户的体验感。

图3是根据本公开第二实施例的视频推荐方法的流程示意图。

如图3所示，在图3所示实施例的基础上，本公开实施例的视频推荐方法具体可包括以下步骤：

S301，获取用户针对第一视频的行为数据。

S302，将行为数据输入至大模型，通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像。

S303，根据用户的用户画像和第一视频的视频画像，确定用户的推荐视频。

步骤S301-S303的相关内容，可参见上述实施例，这里不再赘述。

S304，若用户为非流失用户，根据用户的用户画像和第一视频的视频画像，获取用户的流失概率。

需要说明的是，本公开对于判断用户是否为流失用户的具体方式不作限定，可以根据实际情况进行选取。

可选地，可以通过预训练的模型，对用户的特征数据进行分析处理，判断用户是否为流失用户。

可选地，可以获取用户针对视频平台的活跃指标数据，例如：视频平台的登录数据、视频平台的消费数据等，判断用户是否为流失用户。

举例而言，若用户在设定时长内(例如：7天)登录过视频应用端，则可以确定用户为非流失用户。

需要说明的是，本公开对于根据用户画像和视频画像，获取用户的流失概率的具体方式不做限定，可以根据实际情况进行选取。

可选地，可以通过流失概率预测模型基于用户画像和视频画像，获取用户的流失概率。

S305，若流失概率大于或者等于第一设定阈值，调整用户的运营策略。

在本申请实施例中，在获取到流失概率后，可以将流失概率与第一设定阈值进行对比，若流失概率大于或者等于第一设定阈值，可以对用户的运营策略进行调整。

可选地，可以根据用户画像和视频画像，确定用户的挽留策略，通过挽留策略挽留用户。

S306，若用户为流失用户，根据用户的用户画像和第一视频的视频画像，对用户的流失进行根因分析。

需要说明的是，判断用户是否为流失用户的具体过程可参见上述实施例，此处不再赘述。

需要说明的是，若用户为流失用户，可以根据用户的用户画像和第一视频的视频画像，获取流失用户的流失类型，以对用户的流失进行根因分析，可选地，流失根因可以为视频质量差、视频涉及广告营销等。

综上，本公开提出的视频推荐方法，通过获取用户针对第一视频的行为数据，将行为数据输入至大模型，通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像，根据用户的用户画像和第一视频的视频画像，确定用户的推荐视频，若用户为非流失用户，根据用户的用户画像和第一视频的视频画像，获取用户的流失概率，若流失概率大于或者等于第一设定阈值，调整用户的运营策略，若用户为流失用户，根据用户的用户画像和第一视频的视频画像，对用户的流失进行根因分析，由此，本公开通过预测用户的流失概率，根据流失概率调整用户的运营策略以挽留用户，提升用户的留存率，进而提升日活跃用户数量。

图4是根据本公开第四实施例的视频推荐方法的流程示意图。

如图4所示，在图1所示实施例的基础上，本公开实施例的视频推荐方法具体可包括以下步骤：

S401，获取用户针对第一视频的行为数据。

S402，将行为数据输入至大模型，通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像。

S403，根据用户的用户画像和第一视频的视频画像，确定用户的推荐视频。

步骤S401-S403的相关内容，可参见上述实施例，这里不再赘述。

S404，获取用户群中任意两个用户的用户画像之间的相似度。

在本申请实施例中，当用户群中任意两个用户为第一用户和第二用户，可选地，可以获取第一用户的用户画像与第二用户的用户画像之间的目标相似度。

需要说明的是，当第一用户的用户画像与第二用户的用户画像之间的目标相似度越高时，表明第一用户和第二用户拥有的共同特征点越多。

S405，基于相似度，对用户群进行划分，得到多个用户子群。

需要说明的是，用户子群中的用户，往往拥有共同喜好，例如：偏好美食教程类视频，又例如：偏好影视解说类视频。

可选地，可以对多个第二用户按照目标相似度进行降序排序，将第一用户与排序前N个的第二用户划分到同一用户子群，其中，N为正整数。

需要说明的是，本公开对于N的数量的设置不作限定，可以根据实际情况进行设定。例如：可以设定N为1000；又例如：可以设定N为2000。

举例而言，针对N为1000，可以对多个第二用户按照目标相似度降序排序，根据排序结果将排序前1000个的第二用户，将第一用户与排序前1000个的第二用户划分到同一用户子群。

可选地，若任意两个用户对应的相似度大于第二设定阈值，将任意两个用户划分到同一用户子群。

需要说明的是，本公开对于第二设定阈值的设置不作限定，可以根据实际情况进行设定。例如：可以设定第二设定阈值为90％；又例如：可以设定第二设定阈值为85％。

举例而言，针对第二设定阈值为90％，若第三用户和第四用户之间的相似度大于90％，则将第三用户和第四用户划分到同一用户子群。

综上，本公开提出的视频推荐方法，通过获取用户针对第一视频的行为数据，将行为数据输入至大模型，通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像，根据用户的用户画像和第一视频的视频画像，确定用户的推荐视频，获取用户群中任意两个用户的用户画像之间的相似度，基于相似度，对用户群进行划分，得到多个用户子群，由此，本公开通过获取任意两个用户的用户画像之间的相似度，可以进行引导沉淀为社交群组，有利于提升用户对视频平台的粘性，达到沉淀用户的目的，提升用户体验感。

图5为本公开一实施例的模型训练方法的流程示意图。如图5所示，该方法包括：

S501获取训练样本，其中，训练样本包括样本用户针对样本视频的样本行为数据、样本用户的样本用户画像以及样本视频的样本视频画像。

需要说明的是，本公开实施例的模型训练方法的执行主体可为具有数据信息处理能力的硬件设备和/或驱动该硬件设备工作所需必要的软件。可选地，执行主体可包括工作站、服务器，计算机、用户终端及其他智能设备。其中，用户终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。

需要说明的是，本公开对于获取训练样本的具体方式不作限定，可以根据实际情况进行选取。

可选地，可以采集样本用户针对样本视频的历史交互行为数据，并对历史交互行为数据进行预处理，例如：对历史交互行为数据进行清洗、归一化和特征提取、去除异常数据和噪音等预处理操作，基于预处理后的历史交互行为数据，获取样本行为数据、样本用户的样本用户画像以及样本视频的样本视频画像，进而得到训练样本。

S502，根据训练样本，对大模型进行训练。

在本公开实施例中，在获取到训练样本后，可以根据训练样本，对大模型进行训练。

需要说明的是，针对大模型的类型，可以根据实际情况进行选取，这里不做过多限定。

可选地，可以将训练样本中的样本行为数据输入至大模型中，由大模型输出样本用户的预测样本用户画像以及样本视频的预测样本视频画像，基于预测样本用户画像和样本用户画像、预测样本视频画像和样本视频画像，对大模型进行训练。

举例而言，可以基于预测样本用户画像和样本用户画像、预测样本视频画像和样本视频画像，获取大模型的损失函数，基于损失函数对大模型的模型参数进行更新，并返回采用下一个训练样本，继续对调整模型参数后的大模型进行训练，直至满足模型训练结束条件。

需要说明的是，本公开对于模型训练结束条件的设置不作限定，可以根据实际情况进行设置模型训练结束条件。

可选地，可以设置模型训练结束条件为损失函数值小于预设的损失阈值；可选地，还可以置模型训练结束条件为大模型的模型参数的调整次数达到预设次数阈值。

本公开提出的模型训练方法，通过获取训练样本，其中，训练样本包括样本用户针对样本视频的样本行为数据、样本用户的样本用户画像以及样本视频的样本视频画像，根据训练样本，对大模型进行训练，从而训练过程中大模型可学习到样本行为数据与预测样本用户画像和预测样本视频画像之间的关系，从而训练完成的大模型可基于行为数据，生成用户画像和视频画像，以实现视频推荐。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种视频推荐装置，用于实现上述的视频推荐方法。

图6是根据本公开一实施例的视频推荐装置的框图。

如图6所示，视频推荐装置600，包括：获取模块601、生成模块602和推荐模块603。

获取模块601，用于获取用户针对第一视频的行为数据；

生成模块602，用于将所述行为数据输入至大模型，通过所述大模型基于所述行为数据，生成所述用户的用户画像和所述第一视频的视频画像；

推荐模块603，用于根据所述用户的用户画像和所述第一视频的视频画像，确定所述用户的推荐视频。

在本公开的一个实施例中，装置600还用于：若所述用户为非流失用户，根据所述用户的用户画像和所述第一视频的视频画像，获取所述用户的流失概率。

在本公开的一个实施例中，装置600还用于：若所述流失概率大于或者等于第一设定阈值，调整所述用户的运营策略。

在本公开的一个实施例中，装置600还用于：若所述用户为流失用户，根据所述用户的用户画像和所述第一视频的视频画像，对所述用户的流失进行根因分析。

在本公开的一个实施例中，装置600还用于：获取用户群中任意两个用户的用户画像之间的相似度；基于所述相似度，对所述用户群进行划分，得到多个用户子群。

在本公开的一个实施例中，装置600还用于：若任意两个用户对应的相似度大于第二设定阈值，将所述任意两个用户划分到同一用户子群。

在本公开的一个实施例中，装置600还用于：获取第一用户的用户画像与第二用户的用户画像之间的目标相似度，其中，所述用户群用于所述第一用户、所述第二用户；所述基于所述相似度，对所述用户群进行划分，得到多个用户子群，包括：对多个所述第二用户按照所述目标相似度进行降序排序；将所述第一用户与排序前N个的第二用户划分到同一用户子群，其中，N为正整数。

在本公开的一个实施例中，装置600还用于：若当前满足画像的更新条件，获取距离当前时刻设定时长内所述用户针对第二视频的行为数据；将重新获取的行为数据输入至所述大模型，通过所述大模型基于重新获取的行为数据，重新生成所述用户的用户画像，并生成所述第二视频的视频画像；将原有的用户的用户画像更新为重新生成的用户的用户画像，以及将所述第一视频的视频画像更新为所述第二视频的视频画像。

在本公开的一个实施例中，确定模块603，用于：根据所述用户的用户画像和所述第一视频的视频画像，确定所述用户针对所述第一视频的偏好度；基于所述偏好度，确定所述推荐视频。

在本公开的一个实施例中，确定模块603，用于：若所述第一视频对应的偏好度大于第三设定阈值，将所述第一视频作为目标视频；从视频库中筛选出与所述目标视频相似的候选视频，作为所述推荐视频。

本公开提出的视频推荐装置，通过获取用户针对第一视频的行为数据，将行为数据输入至大模型，通过大模型基于行为数据，生成用户的用户画像和第一视频的视频画像，根据用户的用户画像和第一视频的视频画像，确定用户的推荐视频，由此，本公开通过大模型对行为数据进行分析处理，可以更加了解用户的真实需求，提高了确定用户的推荐视频的准确率，提升了用户的体验感。

根据本公开的实施例，本公开还提供了一种模型训练装置，用于实现上述的模型训练方法。

图7是根据本公开一实施例的模型训练装置的框图。

如图7所示，模型训练装置700，包括：第一获取模块701和训练模块702。

第一获取模块701，用于获取训练样本，其中，所述训练样本用于样本用户针对样本视频的样本行为数据、所述样本用户的样本用户画像以及所述样本视频的样本视频画像；

训练模块702，用于根据所述训练样本，对大模型进行训练。

本公开提出的模型训练装置，通过获取训练样本，其中，训练样本包括样本用户针对样本视频的样本行为数据、样本用户的样本用户画像以及样本视频的样本视频画像，根据训练样本，对大模型进行训练，从而训练过程中大模型可学习到样本行为数据与预测样本用户画像和预测样本视频画像之间的关系，从而训练完成的大模型可基于行为数据，生成用户画像和视频画像，以实现视频推荐。

根据本公开的实施例，本公开还提出了一种电子设备、一种可读存储介质和一种计算机程序产品。

图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图8所示，设备800包括计算单元801，其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序，来执行各种适当的动作和处理。在RAM 803中，还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

设备800中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元806，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如视频推荐方法、模型训练方法。例如，在一些实施例中，视频推荐方法、模型训练方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时，可以执行上文描述的视频推荐方法、模型训练方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行视频推荐方法、模型训练方法。

本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提出给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提出与用户账号的交互，可以在计算机上实施此处描述的***和技术，该计算机具有：用于向用户账号显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户账号可以通过该键盘和该指向装置来将输入提出给计算机。其它种类的装置还可以用于提出与用户账号的交互；例如，提出给用户账号的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户账号的输入。

可以将此处描述的***和技术实施在包括后台部件的计算***(例如，作为数据服务器)、或者包括中间件部件的计算***(例如，应用服务器)、或者包括前端部件的计算***(例如，具有图形用户账号界面或者网络浏览器的用户账号计算机，用户账号可以通过该图形用户账号界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将***的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式***的服务器，或者是结合了区块链的服务器。

根据本公开的实施例，本公开还提供了一种计算机程序产品，包括计算机程序，其中，所述计算机程序被处理器执行时实现本公开上述实施例所述的视频推荐方法、模型训练方法的步骤。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种视频推荐方法，包括：

获取用户针对第一视频的行为数据；

将所述行为数据输入至大模型，通过所述大模型基于所述行为数据，生成所述用户的用户画像和所述第一视频的视频画像；

根据所述用户的用户画像和所述第一视频的视频画像，确定所述用户的推荐视频。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

若所述用户为非流失用户，根据所述用户的用户画像和所述第一视频的视频画像，获取所述用户的流失概率。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

若所述流失概率大于或者等于第一设定阈值，调整所述用户的运营策略。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

若所述用户为流失用户，根据所述用户的用户画像和所述第一视频的视频画像，对所述用户的流失进行根因分析。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取用户群中任意两个用户的用户画像之间的相似度；

基于所述相似度，对所述用户群进行划分，得到多个用户子群。

6.根据权利要求5所述的方法，其特征在于，所述基于所述相似度，对所述用户群进行划分，得到多个用户子群，包括：

若任意两个用户对应的相似度大于第二设定阈值，将所述任意两个用户划分到同一用户子群。

7.根据权利要求5所述的方法，其特征在于，所述获取用户群中任意两个用户的用户画像之间的相似度，包括：

获取第一用户的用户画像与第二用户的用户画像之间的目标相似度，其中，所述用户群包括所述第一用户、所述第二用户；

所述基于所述相似度，对所述用户群进行划分，得到多个用户子群，包括：

对多个所述第二用户按照所述目标相似度进行降序排序；

将所述第一用户与排序前N个的第二用户划分到同一用户子群，其中，N为正整数。

8.根据权利要求1-7中任一项所述的方法，其特征在于，所述方法还包括：

若当前满足画像的更新条件，获取距离当前时刻设定时长内所述用户针对第二视频的行为数据；

将重新获取的行为数据输入至所述大模型，通过所述大模型基于重新获取的行为数据，重新生成所述用户的用户画像，并生成所述第二视频的视频画像；

将原有的用户的用户画像更新为重新生成的用户的用户画像，以及将所述第一视频的视频画像更新为所述第二视频的视频画像。

9.根据权利要求1-7中任一项所述的方法，其特征在于，所述根据所述用户的用户画像和所述第一视频的视频画像，确定所述用户的推荐视频，包括：

根据所述用户的用户画像和所述第一视频的视频画像，确定所述用户针对所述第一视频的偏好度；

基于所述偏好度，确定所述推荐视频。

10.根据权利要求9所述的方法，其特征在于，所述基于所述偏好度，确定所述推荐视频，包括：

若所述第一视频对应的偏好度大于第三设定阈值，将所述第一视频作为目标视频；

从视频库中筛选出与所述目标视频相似的候选视频，作为所述推荐视频。

11.一种模型训练方法，其特征在于，包括：

获取训练样本，其中，所述训练样本包括样本用户针对样本视频的样本行为数据、所述样本用户的样本用户画像以及所述样本视频的样本视频画像；

根据所述训练样本，对大模型进行训练。

12.一种视频推荐装置，包括：

获取模块，用于获取用户针对第一视频的行为数据；

生成模块，用于将所述行为数据输入至大模型，通过所述大模型基于所述行为数据，生成所述用户的用户画像和所述第一视频的视频画像；

推荐模块，用于根据所述用户的用户画像和所述第一视频的视频画像，确定所述用户的推荐视频。

13.根据权利要求12所述的装置，其特征在于，所述装置还用于：

14.根据权利要求13所述的装置，其特征在于，所述装置还用于：

15.根据权利要求12所述的装置，其特征在于，所述装置还用于：

16.根据权利要求12所述的装置，其特征在于，所述装置还用于：

获取用户群中任意两个用户的用户画像之间的相似度；

17.根据权利要求16所述的装置，其特征在于，所述装置，用于：

18.根据权利要求16所述的装置，其特征在于，所述装置，用于：

获取第一用户的用户画像与第二用户的用户画像之间的目标相似度，其中，所述用户群用于所述第一用户、所述第二用户；

对多个所述第二用户按照所述目标相似度进行降序排序；

19.根据权利要求12-18中任一项所述的装置，其特征在于，所述装置还用于：

20.根据权利要求12-18中任一项所述的装置，其特征在于，所述确定模块，用于：

基于所述偏好度，确定所述推荐视频。

21.根据权利要求20所述的装置，其特征在于，所述确定模块，用于：

22.一种模型训练装置，其特征在于，用于：

第一获取模块，用于获取训练样本，其中，所述训练样本用于样本用户针对样本视频的样本行为数据、所述样本用户的样本用户画像以及所述样本视频的样本视频画像；

训练模块，用于根据所述训练样本，对大模型进行训练。

23.一种电子设备，其特征在于，包括处理器和存储器；

其中，所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于实现如权利要求1-10或权利要求11中任一项所述的方法。

24.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-10或权利要求11中任一项所述的方法。

25.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-10或权利要求11中任一项所述的方法。