CN116910304B - 替换视频推荐理由的方法、装置、电子设备及存储介质 - Google Patents
替换视频推荐理由的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116910304B CN116910304B CN202311140182.8A CN202311140182A CN116910304B CN 116910304 B CN116910304 B CN 116910304B CN 202311140182 A CN202311140182 A CN 202311140182A CN 116910304 B CN116910304 B CN 116910304B
- Authority
- CN
- China
- Prior art keywords
- keyword
- video
- recall
- keywords
- click rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012216 screening Methods 0.000 claims abstract description 16
- 238000004590 computer program Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 10
- 238000011084 recovery Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 241000219000 Populus Species 0.000 description 4
- 101100456831 Caenorhabditis elegans sams-5 gene Proteins 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/251—Learning process for intelligent management, e.g. learning user preferences for recommending movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4667—Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种替换视频推荐理由方法、装置、电子设备及存储介质。该方法包括:获取与第一视频关联的召回源,召回源用于筛选指定类型的视频;确定每个召回源关联的候选关键词,候选关键词包括点击率大于或等于预设阈值的关键词;将每个召回源关联的候选关键词进行组合,得到符合预设条件的关键词组合,预设条件为关键词组合中包括至少一个与第一视频内容相关的实体词;根据每个关键词组合中每个候选关键词的点击率以及对应的召回源的点击率,计算得到每个关键词组合的分值;基于分值最高的关键词组合,生成新的推荐理由,用于替换第一视频的当前推荐理由。利用本申请实施例能够提升视频推荐效果,提高视频点击率。
Description
技术领域
本申请涉及视频推荐技术领域,尤其涉及一种替换视频推荐理由的方法、装置、电子设备及计算机可读存储介质。
背景技术
通常,视频平台在推荐视频时,经常会为推荐的视频搭配展示一条推荐理由,推荐理由通常为对视频主要内容或亮点的简短描述,引起用户的关注或共鸣,合适的推荐理由能够吸引用户的注意力,使得用户对视频产生兴趣并点击观看,可提高视频点击率。
由于视频的推荐理由通常具有一定的时效性,因此随着时间的推移,最初设定的推荐理由可能与视频不再匹配,或者当前的推荐理由已经无法吸引用户的注意,导致推荐效果很难维持。现有技术中存在较多提取或生成视频推荐理由的方法,但是对于如何维持推荐效果,尚缺乏合理且有效的解决方案。比如:在名称为“一种视频推荐文本的生成方法、模型训练方法及相关装置”,申请号为“202210692931 .7”的中国专利文献中,获取目标视频对应的文本信息,文本信息包括与目标视频相关联的描述信息和至少一个标签信息;将描述信息和至少一个标签信息输入至预先训练的文本生成模型,得到目标视频的推荐文本。虽然利用训练模型能够自动生成推荐文本,但是其并不考虑较长时间后推荐文本的时效性和推荐效果,可能出现推荐效果不理想的问题。
发明内容
有鉴于此,本申请实施例提供一种替换视频推荐理由的方法、装置、电子设备、计算机可读存储介质及计算机程序产品,用于解决至少一种技术问题。
本申请实施例提供一种替换视频推荐理由的方法,所述方法应用于第一视频,第一视频的推荐理由包括一个或多个关键词;所述方法包括:获取与第一视频关联的一个或多个召回源,所述召回源用于筛选指定类型的视频;确定每个召回源关联的一个或多个候选关键词,所述候选关键词包括点击率大于或等于预设阈值的关键词;将每个召回源关联的一个或多个候选关键词进行组合,得到符合预设条件的一个或多个关键词组合,所述预设条件为关键词组合中包括至少一个与第一视频内容相关的实体词;根据每个关键词组合中每个候选关键词的点击率以及对应的召回源的点击率,计算得到每个关键词组合的分值,所述关键词组合的分值用于表示用户对相应关键词组合的感兴趣程度;基于分值最高的关键词组合,生成新的推荐理由,用于替换所述第一视频的当前推荐理由。
根据本申请实施例的方法,根据每个关键词组合中每个候选关键词点击率与对应的召回源点击率乘积之和,确定该关键词组合的分值。
根据本申请实施例的方法,利用以下公式计算每个关键词组合的分值:
其中,R(recallj)为所述第一视频的第j个召回源中包括第i个候选关键词的关键词组合分值;p(wi|recallj)为第j个召回源关联的多个候选关键词中第i个候选关键词的点击率;p(recallj)为第j个召回源的点击率;n为第j个召回源关联的候选关键词的个数。
根据本申请实施例的方法,所述预设阈值包括关键词类型点击率,所述关键词类型点击率为该关键词所属类型中所有关键词的点击率的平均值。
根据本申请实施例的方法,在所述确定与第一视频关联的一个或多个召回源之前,所述方法还包括:将所述第一视频的当前推荐理由拆分为多个关键词;如果多个关键词中存在至少一个关键词的点击率大于或等于关键词点击率阈值,则保留当前推荐理由,不做替换处理。
根据本申请实施例的方法,如果多个关键词中至少一个关键词为首次出现的关键词时,则保留当前推荐理由,不做替换处理。
根据本申请实施例的方法,在确定每个召回源关联的一个或多个候选关键词之前,所述方法还包括:获取每个召回源关联的一个或多个关键词,如果关键词与所述第一视频相匹配,则将所述关键词确定为候选关键词。
根据本申请实施例的方法,所述关键词的类型包括:时间词、量词、形容词和实体词。
第二方面,本申请实施例提供一种替换视频推荐理由装置,包括:获取模块,用于获取与第一视频关联的一个或多个召回源,所述召回源用于筛选指定类型的视频;确定模块,用于确定每个召回源关联的一个或多个候选关键词,所述候选关键词包括点击率大于或等于预设阈值的关键词;组合模块,用于将每个召回源关联的一个或多个候选关键词进行组合,得到符合预设条件的一个或多个关键词组合,所述预设条件为关键词组合中包括至少一个与第一视频内容相关的实体词;计算模块,用于根据每个关键词组合中每个候选关键词的点击率以及对应的召回源的点击率,计算得到每个关键词组合的分值,所述关键词组合的分值用于表示用户对相应关键词组合的感兴趣程度;生成模块,用于基于分值最高的关键词组合,生成新的推荐理由,用于替换所述第一视频的当前推荐理由。
第三方面,本申请的实施例提供一种电子设备,所述电子设备包括:处理器以及存储有计算机程序指令的存储器;所述电子设备执行所述计算机程序指令时实现如上所述的方法。
第四方面,本申请的实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如上所述的方法。
采用本申请的实施例,根据候选关键的点击率和召回源的点击率计算相应关键词组合的分值,能够客观、准确反映用户的感兴趣程度;基于分值最高的关键词组合,生成新的推荐理由,替换视频的当前推荐理由,能够及时替换不再适合的推荐理由,使每次推荐的理由均是当前最受欢迎或最匹配的理由,尽可能地使得推荐视频达到最佳的推荐效果,提高点击率。
附图说明
为了更清楚地说明本申请实施例的技术方案,以下对本申请实施例中的附图作简单介绍。
图1是本申请实施例的***架构的示意图。
图2是本申请实施例的替换视频推荐理由方法的流程框图。
图3是本申请实施例的生成视频推荐理由的处理过程示意图。
图4是本申请实施例的替换视频推荐理由装置的结构框图。
图5示出本申请实施例的电子设备的硬件结构示意图。
实施方式
以下将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,提供这些实施方式的目的是为了使本申请的原理和精神更加清楚和透彻,使本领域技术人员能够更好地理解进而实现本申请的原理和精神。本文中提供的示例性实施方式仅是本申请的一部分实施方式,而不是全部的实施方式。基于本文中的实施方式,本领域普通技术人员在不付出创造性劳动前提下所获得的所有其他实施方式,都属于本申请保护的范围。
本申请的实施例涉及终端设备和/或服务器。本领域技术人员知晓,本申请的实施方式可以实现为一种***、装置、设备、方法、计算机可读存储介质或计算机程序产品。因此,本公开可以具体实现为以下至少一种形式:完全的硬件、完全的软件,或者硬件与软件结合的形式。根据本申请的实施方式,本申请请求保护一种替换视频推荐理由的方法、装置、电子设备、计算机可读存储介质及计算机程序产品。图1示出了本申请实施例的一种***架构的示意图。如图1所示,该***包括终端设备102和服务器104。其中,终端设备102可以包括以下至少一项:智能手机、平板电脑、笔记本电脑、台式电脑、智能电视、各类可穿戴设备、增强现实AR设备、虚拟现实VR设备等等。终端设备102上可以安装客户端,例如,该客户端可以为专门执行特定功能的客户端(如应用程序app),或者为内嵌有多种应用小程序(不同功能)的客户端,还可以是通过浏览器登录的客户端。用户可以在终端设备102上进行操作,比如,用户可以打开终端设备102上安装的客户端,并通过客户端操作输入指令,或者,用户可以打开终端设备102上安装的浏览器,并通过浏览器操作输入指令。在终端设备102接收到用户输入的指令之后,将包含指令的请求信息发送至服务器104。服务器104接收到请求信息之后执行相应的处理,然后将处理结果信息返回给终端设备102。通过一系列数据处理和信息交互完成用户指令。
在本文中,诸如第一、第二、第三之类的用语,仅用来将一个实体(或操作)与另一个实体(或操作)区分开来,而不在于要求或暗示这些实体(或操作)之间存在任何顺序或关联。
以下对本申请实施例中可能涉及的概念和技术术语等相关内容进行简要描述。
召回源用于在海量资源中筛选出指定类型视频的词条,一个视频可以关联多个召回源。一个召回源关联有一个或多个关键词。视频的推荐理由用于描述视频的内容或亮点,吸引用户点击该视频。一个视频关联有一个推荐理由。推荐理由中包括一个或多个关键词,关键词的类型包括:时间词、量词、形容词和实体词。
视频的点击率为该视频被点击的次数与被曝光次数之比。同理,召回源的点击率和关键词的点击率计算方式相同。当该视频被点击次数+1时,与之关联的召回源及推荐理由中的关键词的点击次数也+1。
图2示出了本申请实施例的替换视频推荐理由方法的流程框图,该方法包括以下步骤:
S101:获取与第一视频关联的一个或多个召回源,所述召回源用于筛选指定类型的视频;
S102:确定每个召回源关联的一个或多个候选关键词,所述候选关键词包括点击率大于或等于预设阈值的关键词;
S103:将每个召回源关联的一个或多个候选关键词进行组合,得到符合预设条件的一个或多个关键词组合,所述预设条件为关键词组合中包括至少一个与第一视频内容相关的实体词;
S104:根据每个关键词组合中每个候选关键词的点击率以及对应的召回源的点击率,计算得到每个关键词组合的分值,所述关键词组合的分值用于表示用户对相应关键词组合的感兴趣程度;
S105:基于分值最高的关键词组合,生成新的推荐理由,用于替换所述第一视频的当前推荐理由。
本申请的方法应用于推荐视频,利用本申请的方法,能够计算出一个当前最佳的推荐理由与该推荐视频关联,使得该推荐视频的曝光效果最大化,达到最大的点击率。具体而言,首先,获取与第一视频关联的一个或多个召回源,在每个召回源中筛选出一个或多个候选关键词。因为一些关键词具有时效性,此前符合筛选要求,现在可能就不符合筛选要求。所以,在每次生成新的推荐理由之前,均需要重新筛选候选关键词,从而保证候选关键词的时效性和具有较强的推荐效果。其中筛选条件可以包括:关键词组合中包括至少一个与第一视频内容相关的实体词以及关键词组合中同一种类型的关键词只出现一次。
然后,将一个或多个候选关键词组合得到一个或多个关键词组合,关键词组合可以是由一个或多个关键词组成的集合。通过统计最近一段时间内第一视频的曝光和点击记录,能够计算出与第一视频关联的候选关键的点击率和召回源的点击率。二者的点击率均能够反映当前用户的喜爱程度。因此,根据候选关键的点击率和召回源的点击率计算相应关键词组合的分值,能够客观、准确反映用户的感兴趣程度。最后,基于分值最高的关键词组合,生成新的推荐理由,用于替换所述第一视频的当前推荐理由。新推荐理由不仅与第一视频的匹配度最高,而且能达到最佳推荐效果,提高第一视频的点击率。
根据本申请的实施例,可选地,根据每个关键词组合中每个候选关键词的点击率与对应的召回源的点击率乘积之和,确定该关键词组合的分值。基于点击率分值越高,用户感兴趣程度越高的原理,将每个候选关键词的点击率与对应的召回源的点击率乘积之和得到关键词组合的分值,将多个关键词组合的分值比较,能够准确、快速地获得用户最感兴趣的关键词组合,缩短生成新推荐理由的时间。
根据本申请的实施例,可选地,利用以下公式计算每个关键词组合的分值:
其中,R(recallj)为所述第一视频的第j个召回源中包括第i个候选关键词的关键词组合分值;p(wi|recallj)为第j个召回源关联的多个候选关键词中第i个候选关键词的点击率;p(recallj)为第j个召回源的点击率;n为第j个召回源关联的候选关键词的个数。关键词组合分值大小能够反应用户的感兴趣程度,从而客观、直接地确定关键词组合的推荐效果。
根据本申请的实施例,可选地,所述预设阈值包括关键词类型点击率,所述关键词类型点击率为该关键词所属类型中所有关键词的点击率的平均值。当关键词的点击率低于关键词类型点击率时,视为该关键词不受用户欢迎,为“非优质关键词”。因此,候选关键词是筛选后的“优质关键词”,是生成优质推荐理由的必要筛选手段。
根据本申请的实施例,可选地,在所述确定与第一视频关联的一个或多个召回源之前,所述方法还包括:将所述第一视频的当前推荐理由拆分为多个关键词;如果多个关键词中存在至少一个关键词的点击率大于或等于关键词点击率阈值,则保留当前推荐理由,不做替换处理。当判断出当前推荐理由依然受到广大用户欢迎时,则不做替换处理,缩短推荐时间。
根据本申请的实施例,可选地,如果多个关键词中至少一个关键词为首次出现的关键词时,则保留当前推荐理由,不做替换处理。当关键词为首次出现时,因没有曝光记录,无法获取点击率大小,则保留当前推荐理由,待推荐一段时间后,再判断是否需要替换。
根据本申请的实施例,可选地,在确定每个召回源关联的一个或多个候选关键词之前,所述方法还包括:获取每个召回源关联的一个或多个关键词,如果关键词与所述第一视频相匹配,则将所述关键词确定为候选关键词。相匹配即关键词描述与推荐视频的内容、推荐视频的实际情况相符合。确保候选关键词与第一视频相匹配,使得生成的推荐理由与第一视频的内容或实际情况相符合,增加信服力。
根据本申请的实施例,可选地,所述关键词的类型包括:时间词、量词、形容词和实体词。关键词包括多种类型的词,能够从多个维度描述推荐视频的内容或亮点,吸引用户注意力,提高曝光率。
以上通过多个实施例描述了本申请实施例的实现方式以及带来的优势。以下结合具体的例子,详细描述本申请实施例的具体处理过程。
图3示出了本申请实施例的生成视频推荐理由的处理过程示意图。服务器端在收到用户推荐请求后,会根据该用户画像在视频库中召回多个用户感兴趣的视频作为待推荐视频,然后将待推荐视频发送给用户。待推荐视频中的视频可能会关联一个推荐理由,以吸引用户的注意力。在将带有推荐理由的推荐视频发送给用户之前,需要先判断当前的推荐理由是否需要替换。针对某一个待推荐的视频,分为如下三种情况判断是否替换推荐理由。
1)如果待推荐视频的推荐理由中的关键词在候选关键词示例集合中,则保留该关键词,保留当前推荐理由,不做替换。候选关键词集合即关键词的点击率大于预设阈值(关键词类型点击率)的关键词集合。
2)如果推荐理由中任意一个关键词是新关键词,则保留当前推荐理由,不做替换。新关键词即在现有的关键词库中首次出现。
3)如果推荐理由所有的关键词均低于对应的预设阈值(关键词类型点击率)时,则需要替换推荐理由。当推荐理由中所有的关键词均低于预设阈值时,说明当前推荐理由吸引力不足,无法达到最佳的推荐效果。
结合图3,以下以待推荐视频为舞蹈视频为例,详细描述使用本申请的实施例替换推荐理由的操作流程。
首先,获取用户在该舞蹈视频的曝光点击行为日志信息,根据某一段时间窗口期(比如最近10刷数据)收集的信息,提取每个视频上的推荐理由及召回源及兴趣点(若有)。参考图2,该舞蹈视频关联有召回源R1-R5,而与该舞蹈视频相关的推荐理由有T1-Tn。将推荐理由T1-Tn拆分为多个关键词,并提取出召回源R1-R5与拆分后的关键词的关联关系。
关键词有多个类型,参考图2,编号1为时间词,例如:昨天、7天、长期…;编号2为量词,例如:第一名、前90%、十大……;编号3为形容词,例如:都在看、不可不看、正在看……;编号4为实体词1,例如:xx老师,飞儿……;编号5为实体词2,例如:鬼步舞、旗袍、流行舞……;编号n为实体词n,《舞动三江》、《别知己》、《映山红》……。
然后,根据该舞蹈视频在某一段时间窗口期内曝光和被点击的次数,计算出召回源点击率p(recall),关键词点击率p(w|recall)和关键词类型点击率p(type(w))。
其中,召回源点击率p(recall)反应一段时间内(例如在一个session会话中,最近10刷)被点击的次数,反应广大用户的喜爱程度。每个曝光的视频都关联有不同的召回源,比如该舞蹈视频关联的召回源有:mp3_映山红,uid_1855210,subcat_265等,当该舞蹈视频曝光1次,其关联的召回源就曝光1次,当该舞蹈视频被点击1次,其内含的召回源就被点击1次,累计该召回源所有关联的视频之后即算出各个召回源的点击率p(recall)。
关键词点击率p(w|recall)即对应关键词被点击和被曝光次数的比值,能够反应广大用户的喜爱程度。例如,关键词为:“昨天”、“第一名”、“鬼步舞”、“舞动三江”等推荐理由文案拆分后的关键词。与上述计算召回源点击率方法相同,当该舞蹈视频被点击1次,其对应的推荐理由中的所有关键词的点击次数都+1,并在一段时间内(一个session中)统计所有单独的关键词的点击率p(w|recall)。
关键词类型点击率p(type(w))用于表示每个类型中所有关键词点击率的平均值。例如,“昨天”、“7天”、“长期”对应的时间类型的关键词,简称关键词类型,利用已知的关键词的点击率即可计算对应所属类型的平均关键词点击率即关键词类型点击率p(type(w))。
最后,将拆分后的关键词按照预设条件进行二次筛选,得到候选关键词,将候选关键词组合为一个或多个关键词组合,并在其中选出最优的关键词组合。
利用以下公式进行第一次筛选:
其中,p(wi|recallj)为第j个召回源关联的多个关键词中第i个关键词的点击率;p(type(wi)|recallj) 第j个召回源关联的多个关键词中第i个关键词所属关键词类型的点击率。利用公式(1)能够筛选出高于该类型中平均点击率的优质关键词。
利用以下公式进行第二次筛选:
其中,r(wi|vid)表示第i个关键词与视频vid是否相关,当相关时,r(wi|vid)=1,当不相关时,r(wi|vid)=0。利用公式(2)能够确保生成新的推荐理由与该舞蹈视频相匹配。比如,与第i个关键词为“第一名”,但是该第一视频现在已经不是第一名,因此该关键词与该舞蹈视频情况不符,则需要剔除,保证推荐理由的真实性。
二次筛选后,将候选关键词按照至少包括一个实体词进行组合,得到多个关键词组合,根据公式(3)计算每一个关键词组合的分值:
其中,R(recallj)为所述该舞蹈视频的第j个召回源中包括第i个候选关键词的关键词组合分值;p(wi|recallj)为第j个召回源关联的多个候选关键词中第i个候选关键词的点击率;p(recallj)为第j个召回源的点击率;n为第j个召回源关联的候选关键词的个数。关键词组合分值大小能够反应用户的感兴趣程度,从而客观、直接地确定关键词组合的推荐效果。
本申请以具体实例的方式,介绍利用公式(3)计算关键词组合分值的过程。例如,第一视频的标题为:杨某某《希望你》原创32步弹跳循环跳加间奏一看就会的舞蹈视频为例。其推荐理由为:“多人正在看的舞曲《希望你》”。
将以上的推荐理由文案,拆分两个关键词类型,①协同观看类型的“多人正在看”,②舞曲实体类型的“《希望你》”。通过查找用户对该2个关键词类型的点击率后确定“多人正在看”关键词的点击率小于“协同观看”关键词类型的点击率,以及“《希望你》”关键词的点击率小于“舞曲实体”关键词类型的点击率,则说明需要替换原推荐理由“多人正在看的舞曲《希望你》”。
通过查找,获取该视频关联的所有召回源有:mp3_希望你,subcat弹跳舞,tag_32步,follow_杨某某。
获取“mp3_希望你”关联的所有关键词,并经过二次筛选得到候选关键词。候选关键词包括:“3日内”、“第一名”。因为推荐理由至少满足一种实体,所以针对“mp3_希望你”召回源提取的推荐理由无效。
获取“subcat_弹跳舞”关联的所有关键词,并经过二次筛选得到候选关键词。候选关键词包括:“3日内”、“第一名”、“弹跳舞”。“subcat_弹跳舞”及多个关键词的点击率如下表1所示:
表1
根据公式(3)计算出关键词组合分值最大的组合为(弹跳舞,三日内,第一名),组成的推荐理由为:3日内弹跳舞第一名。
获取“tag_32步”关联的所有关键词,并经过二次筛选得到候选关键词。候选关键词包括:“32步”、“第一名”、“前10名”。“tag_32步”及多个关键词的点击率如下表2所示:
表2
根据公式(3)计算出关键词组合分值最大的组合为(32步,前10名),组成的推荐理由为:32步入门前10名。
获取“follow_杨某某”关联的所有关键词,并经过二次筛选得到候选关键词。候选关键词包括:“杨某某”、“关注的”。“follow_杨某某”及多个关键词的点击率如下表3所示:
表3
根据公式(3)计算出关键词组合分值最大的组合为(杨某某,关注的),组成的推荐理由为:你关注的杨某某老师作品。
由上述可知,关键词组合为(弹跳舞,三日内,第一名)的分值最高,其生成的推荐理由为:“3日内弹跳舞第一名”。将“3日内弹跳舞第一名”作为新的推荐理由替换当前推荐理由“多人正在看的舞曲《希望你》”,完成替换工作。
与本申请的方法实施例对应地,本申请还提供一种替换视频推荐理由装置,如图4所示,替换视频推荐理由装置100包括:
获取模块110,用于获取与第一视频关联的一个或多个召回源,召回源用于筛选指定类型的视频;
确定模块120,用于确定每个召回源关联的一个或多个候选关键词,候选关键词包括点击率大于或等于预设阈值的关键词;
组合模块130,用于将每个召回源关联的一个或多个候选关键词进行组合,得到符合预设条件的一个或多个关键词组合,预设条件为关键词组合中包括至少一个与第一视频内容相关的实体词;
计算模块140,用于根据每个关键词组合中每个候选关键词的点击率以及对应的召回源的点击率,计算得到每个关键词组合的分值,关键词组合的分值用于表示用户对相应关键词组合的感兴趣程度;
生成模块150,用于基于分值最高的关键词组合,生成新的推荐理由,用于替换第一视频的当前推荐理由。
本申请实施例中的电子设备可以是用户终端设备,可以是服务器,还可以是其他计算设备,也可以是云端服务器。图5示出本申请实施例的电子设备的硬件结构示意图,该电子设备可以包括处理器601以及存储有计算机程序指令的存储器602,处理器601执行计算机程序指令时实现上述任一实施例方法的流程或功能。
具体地,处理器601可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecific Integrated Circuit ,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。存储器602可以包括用于数据或指令的大容量存储器。举例来说,存储器602可以是以下至少一者:硬盘驱动器(Hard Disk Drive,HDD)、只读存储器(ROM),随机存取存储器(RAM)、软盘驱动器、闪存、光盘、磁光盘、磁带、通用串行总线(Universal Serial Bus,USB)驱动器或其他物理/有形的存储器存储设备。又如,存储器602可包括可移除或不可移除(或固定)的介质。再如,存储器602可在综合网关容灾设备的内部或外部。存储器602可以是非易失性固态存储器。换句话说,通常存储器602包括编码有计算机可执行指令的有形(非暂态)计算机可读存储介质(如存储器设备),并且当该软件被执行(如由一个或多个处理器执行)时,可执行本申请实施例的方法所描述的操作。处理器601通过读取并执行存储器602中存储的计算机程序指令,实现上述实施例中任一种方法的流程或功能。
在一个示例中,图5所示的电子设备还可包括通信接口603和总线610。其中,处理器601、存储器602、通信接口603通过总线610连接并完成相互间的通信。通信接口603主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。总线610包括硬件、软件或两者皆有,可将在线数据流量计费设备的部件彼此耦接在一起。举例来说,总线可包括以下至少一者:加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、***组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线。总线610可包括一个或多个总线。尽管本申请实施例描述或示出了特定的总线,但本申请实施例可考虑任何合适的总线或互连方式。
结合上述实施例中的方法,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述实施例中任一种方法的流程或功能。
另外,本申请实施例还提供一种计算机程序产品,该计算机程序产品上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述实施例中任一种方法的流程或功能。
以上示例性地描述了本申请实施例的方法、装置、***和计算机程序产品的流程图和/或框图,并描述了相关的各个方面。应当理解,流程图和/或框图中的每个方框或其组合,可以由计算机程序指令实现,也可以由执行指定功能或动作的专用硬件来实现,还可由专用硬件和计算机指令的组合来实现。例如,这些计算机程序指令可被提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,以形成一种机器可使得经由这种处理器执行的这些指令使能对流程图和/或框图中的每个方框或其组合中指定的功能/动作的实现。这种处理器可以是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。
本申请实施例的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等;当以软件方式实现时,是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在存储器中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
需说明,本申请并不局限于上文所描述或在图中示出的特定配置和处理。以上所述仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,所描述的***、设备、模块或单元的具体工作过程,可以参考方法实施例中的对应过程,不需再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (10)
1.一种替换视频推荐理由的方法,其特征在于,所述方法应用于第一视频,第一视频的推荐理由包括一个或多个关键词,第一视频的推荐理由用于描述视频内容或亮点,以使用户点击该视频;所述方法包括:
获取与第一视频关联的一个或多个召回源,所述召回源用于筛选指定类型的视频;
确定每个召回源关联的一个或多个候选关键词,所述候选关键词包括点击率大于或等于预设阈值的关键词;
将每个召回源关联的一个或多个候选关键词进行组合,得到符合预设条件的一个或多个关键词组合,所述预设条件为关键词组合中包括至少一个与第一视频内容相关的实体词;
根据每个关键词组合中每个候选关键词的点击率以及对应的召回源的点击率,计算得到每个关键词组合的分值,所述关键词组合的分值用于表示用户对相应关键词组合的感兴趣程度;
基于分值最高的关键词组合,生成新的推荐理由,用于替换所述第一视频的当前推荐理由;
其中,根据每个关键词组合中每个候选关键词点击率与对应的召回源点击率乘积之和,确定该关键词组合的分值。
2.根据权利要求1所述的方法,其特征在于,其中,利用以下公式计算每个关键词组合的分值:
其中,R(recallj)为所述第一视频的第j个召回源中包括第i个候选关键词的关键词组合分值;
p(wi|recallj)为第j个召回源关联的多个候选关键词中第i个候选关键词的点击率;
p(recallj)为第j个召回源的点击率;n为第j个召回源关联的候选关键词的个数。
3.根据权利要求1所述的方法,其特征在于,其中,所述预设阈值包括关键词类型点击率,所述关键词类型点击率为该关键词所属类型中所有关键词的点击率的平均值。
4.根据权利要求1或3所述的方法,其特征在于,在所述确定与第一视频关联的一个或多个召回源之前,所述方法还包括:
将所述第一视频的当前推荐理由拆分为多个关键词;
如果多个关键词中存在至少一个关键词的点击率大于或等于关键词点击率阈值,则保留当前推荐理由,不做替换处理。
5.根据权利要求4所述的方法,其特征在于,其中,如果多个关键词中至少一个关键词为首次出现的关键词时,则保留当前推荐理由,不做替换处理。
6.根据权利要求1所述的方法,其特征在于,其中,在确定每个召回源关联的一个或多个候选关键词之前,所述方法还包括:
获取每个召回源关联的一个或多个关键词,如果关键词与所述第一视频相匹配,则将所述关键词确定为候选关键词。
7.根据权利要求1所述的方法,其特征在于,其中,所述关键词的类型包括:时间词、量词、形容词和实体词。
8.一种替换视频推荐理由装置,其特征在于,包括:
获取模块,用于获取与第一视频关联的一个或多个召回源,所述召回源用于筛选指定类型的视频;
确定模块,用于确定每个召回源关联的一个或多个候选关键词,所述候选关键词包括点击率大于或等于预设阈值的关键词;
组合模块,用于将每个召回源关联的一个或多个候选关键词进行组合,得到符合预设条件的一个或多个关键词组合,所述预设条件为关键词组合中包括至少一个与第一视频内容相关的实体词;
计算模块,用于根据每个关键词组合中每个候选关键词的点击率以及对应的召回源的点击率,计算得到每个关键词组合的分值,所述关键词组合的分值用于表示用户对相应关键词组合的感兴趣程度,其中,根据每个关键词组合中每个候选关键词点击率与对应的召回源点击率乘积之和,确定该关键词组合的分值;
生成模块,用于基于分值最高的关键词组合,生成新的推荐理由,用于替换所述第一视频的当前推荐理由,其中,第一视频的推荐理由用于描述视频内容或亮点,以使用户点击该视频。
9.一种电子设备,其特征在于,所述电子设备包括:处理器以及存储有计算机程序指令的存储器;所述电子设备执行所述计算机程序指令时实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311140182.8A CN116910304B (zh) | 2023-09-06 | 2023-09-06 | 替换视频推荐理由的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311140182.8A CN116910304B (zh) | 2023-09-06 | 2023-09-06 | 替换视频推荐理由的方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116910304A CN116910304A (zh) | 2023-10-20 |
CN116910304B true CN116910304B (zh) | 2023-12-08 |
Family
ID=88356735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311140182.8A Active CN116910304B (zh) | 2023-09-06 | 2023-09-06 | 替换视频推荐理由的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116910304B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104219575A (zh) * | 2013-05-29 | 2014-12-17 | 酷盛(天津)科技有限公司 | 相关视频推荐方法及*** |
CN116010630A (zh) * | 2022-09-16 | 2023-04-25 | 北京奇艺世纪科技有限公司 | 推荐视频的实时筛选方法、装置、电子设备及存储介质 |
CN116089567A (zh) * | 2023-01-04 | 2023-05-09 | 浙江极氪智能科技有限公司 | 一种搜索关键词的推荐方法、装置、设备和存储介质 |
WO2023134407A1 (zh) * | 2022-01-17 | 2023-07-20 | 北京字跳网络技术有限公司 | 内容搜索方法、装置、设备及介质 |
CN116521935A (zh) * | 2022-01-20 | 2023-08-01 | ***通信有限公司研究院 | 一种信息推荐方法、装置及电子设备 |
-
2023
- 2023-09-06 CN CN202311140182.8A patent/CN116910304B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104219575A (zh) * | 2013-05-29 | 2014-12-17 | 酷盛(天津)科技有限公司 | 相关视频推荐方法及*** |
WO2023134407A1 (zh) * | 2022-01-17 | 2023-07-20 | 北京字跳网络技术有限公司 | 内容搜索方法、装置、设备及介质 |
CN116521935A (zh) * | 2022-01-20 | 2023-08-01 | ***通信有限公司研究院 | 一种信息推荐方法、装置及电子设备 |
CN116010630A (zh) * | 2022-09-16 | 2023-04-25 | 北京奇艺世纪科技有限公司 | 推荐视频的实时筛选方法、装置、电子设备及存储介质 |
CN116089567A (zh) * | 2023-01-04 | 2023-05-09 | 浙江极氪智能科技有限公司 | 一种搜索关键词的推荐方法、装置、设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
Towards semantic and affective content-based video recommendation;Taiga Yoshida, et al;2013 IEEE International Conference on Multimedia and Expo Workshops (ICMEW);全文 * |
基于特征工程的视频点击率预测算法;匡俊;唐卫红;陈雷慧;陈辉;曾炜;董启民;高明;;华东师范大学学报(自然科学版)(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116910304A (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10567329B2 (en) | Methods and apparatus for inserting content into conversations in on-line and digital environments | |
CN110413875B (zh) | 一种文本信息推送的方法以及相关装置 | |
CN111625635A (zh) | 问答处理、语言模型的训练方法、装置、设备及存储介质 | |
WO2020088058A1 (zh) | 生成信息的方法和装置 | |
CN106339507B (zh) | 流媒体消息推送方法和装置 | |
CN109509010B (zh) | 一种多媒体信息处理方法、终端及存储介质 | |
CN113383362B (zh) | 用户识别方法及相关产品 | |
EP3117339A1 (en) | Systems and methods for keyword suggestion | |
US10331685B2 (en) | Method and apparatus for sorting related searches | |
WO2017206376A1 (zh) | 搜索方法、装置及非易失性计算机存储介质 | |
CN111597446B (zh) | 基于人工智能的内容推送方法、装置、服务器和存储介质 | |
CN111104590A (zh) | 信息推荐方法、装置、介质及电子设备 | |
CN112052297A (zh) | 信息生成方法、装置、电子设备和计算机可读介质 | |
CN110209780B (zh) | 一种问题模板生成方法、装置、服务器及存储介质 | |
CN104881447A (zh) | 搜索方法及装置 | |
CN113407775B (zh) | 视频搜索方法、装置及电子设备 | |
CN109472028B (zh) | 用于生成信息的方法和装置 | |
CN116910304B (zh) | 替换视频推荐理由的方法、装置、电子设备及存储介质 | |
CN111625619B (zh) | 查询省略方法、装置、计算机可读介质及电子设备 | |
CN110971973A (zh) | 一种视频推送方法、装置及电子设备 | |
CN114491093B (zh) | 多媒体资源推荐、对象表征网络的生成方法及装置 | |
CN108363707B (zh) | 用于生成网页的方法和装置 | |
CN110659419B (zh) | 确定目标用户的方法及相关装置 | |
CN112672202B (zh) | 弹幕处理方法、设备和存储介质 | |
WO2017201904A1 (zh) | 搜索方法、装置、设备及非易失性计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |