CN113032589B - 多媒体文件推荐方法、装置、电子设备及可读存储介质 - Google Patents

多媒体文件推荐方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN113032589B
CN113032589B CN202110336117.7A CN202110336117A CN113032589B CN 113032589 B CN113032589 B CN 113032589B CN 202110336117 A CN202110336117 A CN 202110336117A CN 113032589 B CN113032589 B CN 113032589B
Authority
CN
China
Prior art keywords
sample
multimedia file
tag set
recommended
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110336117.7A
Other languages
English (en)
Other versions
CN113032589A (zh
Inventor
查强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202110336117.7A priority Critical patent/CN113032589B/zh
Publication of CN113032589A publication Critical patent/CN113032589A/zh
Application granted granted Critical
Publication of CN113032589B publication Critical patent/CN113032589B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了多媒体文件推荐方法、装置、电子设备及可读存储介质,涉及计算机技术领域,可以向用户推荐用户感兴趣的多媒体文件。本发明实施例包括:获取待推荐用户的历史访问记录,历史访问记录为待推荐用户在指定时间段内访问过的多媒体文件。然后基于历史访问记录包括的多媒体文件,生成待推荐用户的历史访问标签集合。同时获取每个待推荐多媒体文件的标签集合。再基于预设深度语义匹配模型,确定历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度。接着根据历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,选择为待推荐用户推荐的待推荐文件。

Description

多媒体文件推荐方法、装置、电子设备及可读存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及多媒体文件推荐方法、装置、电子设备及可读存储介质。
背景技术
随着网络技术的发展,用户越来越频繁地访问各种网站,以通过网站来浏览自己感兴趣的多媒体文件。例如,用户常常通过访问视频网站来观看自己喜爱的视频。
但是,网站向每个用户所推荐的内容是一样的。而对于不同用户而言,每个用户感兴趣的多媒体文件是不相同的。这样,使得网站所推荐的内容无法满足用户的个性化需求。
发明内容
本发明实施例的目的在于提供多媒体文件推荐方法、装置、电子设备及可读存储介质,以向用户推荐用户感兴趣的多媒体文件,从而实现个性化推荐。具体技术方案如下:
第一方面,本发明实施例提供了一种多媒体文件推荐方法,可以包括:
获取待推荐用户的历史访问记录,所述历史访问记录为所述待推荐用户在指定时间段内访问过的多媒体文件;
基于所述历史访问记录包括的多媒体文件,生成所述待推荐用户的历史访问标签集合;
获取每个待推荐多媒体文件的标签集合;
基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度;其中,所述预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型,所述样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合;针对每个样本用户,该样本用户的样本历史访问标签集合包括:该样本用户在历史时间段内访问过的多媒体文件对应的标签;该样本用户的正样本标签集合包括:该样本用户最近一次访问的多媒体文件对应的标签;该样本用户的负样本标签集合包括:预设数量的其他样本用户在所述历史时间段内访问过的多媒体文件对应的标签;
根据所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,选择为所述待推荐用户推荐的待推荐文件。
在一种可能的实现方式中,所述预设深度语义匹配模型通过以下步骤训练获得:
构建所述样本训练集;
将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型,获取所述初始深度语义模型输出的第一相似度和第二相似度,所述第一相似度为样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度,所述第二相似度为样本用户的样本历史访问标签集合与负样本标签之间的语义相似度;
基于所述第一相似度和所述第二相似度计算损失函数值,根据所述损失函数值,判断所述初始深度语义匹配模型是否收敛;
如果所述初始深度语义匹配模型未收敛,则根据所述损失函数值调整所述初始深度语义匹配模型的网络参数,并返回将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型的步骤;
如果所述初始深度语义匹配模型收敛,则将当前的初始深度语义匹配模型作为所述预设深度语义匹配模型。
在一种可能的实现方式中,所述构建所述样本训练集,包括:
针对每个样本用户,获取该样本用户在所述历史时间段内访问过的多媒体文件;
对获取到的多媒体文件的属性信息进行分词,得到该样本用户的样本历史访问标签集合;
对该样本用户最近一次访问的多媒体文件的属性信息进行分词,得到该样本用户的正样本标签集合;
对所有样本用户中,除该样本用户之外的其他样本用户进行随机负采样,获取预设数量的其他样本用户的样本历史访问标签集合,作为该样本用户的负样本标签集合;
将多个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合构建为所述样本训练集。
在一种可能的实现方式中,所述基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,包括:
针对每个待推荐多媒体文件,将该待推荐多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义匹配模型,获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。
在一种可能的实现方式中,所述基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,包括:
针对每个待推荐多媒体文件,将该多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义模型,获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的第一语义向量,以及所述历史访问标签集合对应的第二语义向量;基于预设相似度算法,计算所述第一语义向量与所述第二语义向量之间的相似度。
在一种可能的实现方式中,所述基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,包括:
针对每个待推荐多媒体文件,从缓存文件中获取该多媒体文件的标签集合中的每个标签的词向量,根据获取到的每个标签的词向量计算该多媒体文件对应的语义向量;所述缓存文件中缓存有多个标签的词向量,所述多个标签的词向量为:将各多媒体文件的标签集合输入所述预设深度语义匹配模型后,所述预设深度语义模型的词向量表达层输出的每个标签对应的词向量;
从所述缓存文件中获取所述历史访问标签集合包括的每个标签的词向量,根据所述历史访问标签集合包括的每个标签的词向量,计算所述历史访问标签集合对应的语义向量;
基于预设相似度算法,计算该多媒体文件对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。
第二方面,本发明实施例提供了一种多媒体文件推荐装置,包括:
获取模块,用于获取待推荐用户的历史访问记录,所述历史访问记录为所述待推荐用户在指定时间段内访问过的多媒体文件;
生成模块,用于基于所述获取模块获取的所述历史访问记录包括的多媒体文件,生成所述待推荐用户的历史访问标签集合;
所述获取模块,还用于获取每个待推荐多媒体文件的标签集合;
确定模块,用于基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度;其中,所述预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型,所述样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合;针对每个样本用户,该样本用户的样本历史访问标签集合包括:该样本用户在历史时间段内访问过的多媒体文件对应的标签;该样本用户的正样本标签集合包括:该样本用户最近一次访问的多媒体文件对应的标签;该样本用户的负样本标签集合包括:预设数量的其他样本用户在所述历史时间段内访问过的多媒体文件对应的标签;
选择模块,用于根据所述确定模块确定的所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,选择为所述待推荐用户推荐的待推荐文件。
在一种可能的实现方式中,所述装置还包括训练模块,所述训练模块用于:
构建所述样本训练集;
将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型,获取所述初始深度语义模型输出的第一相似度和第二相似度,所述第一相似度为样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度,所述第二相似度为样本用户的样本历史访问标签集合与负样本标签之间的语义相似度;
基于所述第一相似度和所述第二相似度计算损失函数值,根据所述损失函数值,判断所述初始深度语义匹配模型是否收敛;
如果所述初始深度语义匹配模型未收敛,则根据所述损失函数值调整所述初始深度语义匹配模型的网络参数,并返回将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型的步骤;
如果所述初始深度语义匹配模型收敛,则将当前的初始深度语义匹配模型作为所述预设深度语义匹配模型。
在一种可能的实现方式中,所述训练模块,具体用于:
针对每个样本用户,获取该样本用户在所述历史时间段内访问过的多媒体文件;
对获取到的多媒体文件的属性信息进行分词,得到该样本用户的样本历史访问标签集合;
对该样本用户最近一次访问的多媒体文件的属性信息进行分词,得到该样本用户的正样本标签集合;
对所有样本用户中,除该样本用户之外的其他样本用户进行随机负采样,获取预设数量的其他样本用户的样本历史访问标签集合,作为该样本用户的负样本标签集合;
将多个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合构建为所述样本训练集。
在一种可能的实现方式中,所述确定模块,具体用于:
针对每个待推荐多媒体文件,将该待推荐多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义匹配模型,获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。
在一种可能的实现方式中,所述确定模块,具体用于:
针对每个待推荐多媒体文件,将该多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义模型,获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的第一语义向量,以及所述历史访问标签集合对应的第二语义向量;基于预设相似度算法,计算所述第一语义向量与所述第二语义向量之间的相似度。
在一种可能的实现方式中,所述确定模块,具体用于:
针对每个待推荐多媒体文件,从缓存文件中获取该多媒体文件的标签集合中的每个标签的词向量,根据获取到的每个标签的词向量计算该多媒体文件对应的语义向量;所述缓存文件中缓存有多个标签的词向量,所述多个标签的词向量为:将各多媒体文件的标签集合输入所述预设深度语义匹配模型后,所述预设深度语义模型的词向量表达层输出的每个标签对应的词向量;
从所述缓存文件中获取所述历史访问标签集合包括的每个标签的词向量,根据所述历史访问标签集合包括的每个标签的词向量,计算所述历史访问标签集合对应的语义向量;
基于预设相似度算法,计算该多媒体文件对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。
第三方面,本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。
第四方面,本发明实施例还提供了一种可读存储介质,可读存储介质内存储有计算机程序,计算机程序被电子设备的处理器执行时实现第一方面任一项所述的方法步骤。
第五方面,本发明实施例还提供了一种计算机程序产品,当其在电子设备上运行时,使得电子设备的处理器执行时实现第一方面任一项所述的方法步骤。
本发明实施例提供的多媒体文件推荐方法、装置、电子设备及可读存储介质,可以根据用户历史访问过的多媒体文件,生成历史访问标签集合,然后根据历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,按照相似度选择为用户推荐的文件。即本发明实施例基于用户历史访问过的多媒体文件与待推荐多媒体文件之间的相似度,为用户推荐与用户历史访问的多媒体文件相似的文件,由于用户对历史访问的文件感兴趣,所以用户对与历史访问的多媒体文件相似的文件感兴趣的可能性较高,因此本发明实施例可以向用户推荐其感兴趣的多媒体文件,实现了个性化推荐。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种多媒体文件推荐方法的流程图;
图2为本发明实施例提供的一种预设深度语义匹配模型训练方法的流程图;
图3为本发明实施例提供的一种构建训练样本集方法的流程图;
图4为本发明实施例提供的一种预设深度语义匹配模型训练过程的示例性示意图;
图5为本发明实施例提供的一种多媒体文件推荐装置的结构示意图;
图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
在相关技术中,网站向每个用户所推荐的内容是一样的。而对于不同用户而言,每个用户感兴趣的多媒体文件是不相同的。这使得网站所推荐的内容无法满足用户的个性化需求。
为了解决上述技术问题,本发明实施例提供了一种多媒体文件推荐方法、装置、电子设备及可读存储介质。
下面先对本发明实施例提供的多媒体文件推荐方法进行说明。
可以理解的是,本发明实施例提供的多媒体文件推荐方法应用于电子设备。该电子设备包括但并不局限于台式电脑、笔记本、手机和服务器。图1为本发明实施例提供的一种多媒体文件推荐方法的流程图。参见图1,该方法可以包括如下步骤:
S101,获取待推荐用户的历史访问记录。其中,历史访问记录为待推荐用户在指定时间段内访问过的多媒体文件。
S102,基于历史访问记录包括的多媒体文件,生成待推荐用户的历史访问标签集合。
S103,获取每个待推荐多媒体文件的标签集合。
S104,基于预设深度语义匹配模型,确定历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度。
其中,预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型,样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合;针对每个样本用户,该样本用户的样本历史访问标签集合包括:该样本用户在历史时间段内访问过的多媒体文件对应的标签;该样本用户的正样本标签集合包括:该样本用户最近一次访问的多媒体文件对应的标签;该样本用户的负样本标签集合包括:预设数量的其他样本用户在历史时间段内访问过的多媒体文件对应的标签。
S105,根据历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,选择为待推荐用户推荐的待推荐文件。
本发明实施例提供的多媒体文件推荐方法,可以根据用户历史访问过的多媒体文件,生成历史访问标签集合,然后根据历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,按照相似度选择为用户推荐的文件。即本发明实施例基于用户历史访问过的多媒体文件与待推荐多媒体文件之间的相似度,为用户推荐与用户历史访问的多媒体文件相似的文件,由于用户对历史访问的文件感兴趣,所以用户对与历史访问的多媒体文件相似的文件感兴趣的可能性较高,因此本发明实施例可以向用户推荐其感兴趣的多媒体文件,实现了个性化推荐。
下面结合具体示例,对本发明实施例提供的多媒体文件推荐方法进行说明。
针对上述S101,获取待推荐用户的历史访问记录。其中,历史访问记录为待推荐用户在指定时间段内访问过的多媒体文件。
可以理解的是,多媒体文件包括但并不局限于视频、音频和图片。举例而言,获取的待推荐用户在历史上访问过的多媒体文件为:电视剧视频1、电视剧视频2、电影视频3、广告视频4和广告视频5。
指定时间段可以是最近一周、或者最近一个月、或者从待推荐用户访问第一个多媒体文件开始至当前时刻。
可选的,待推荐用户在指定时间段内访问过的多媒体文件满足预设的感兴趣条件。设置感兴趣条件能够更准确地筛选出用户历史访问过的该用户感兴趣的多媒体文件,减少用户历史访问过的不感兴趣的多媒体文件对确定推荐的多媒体文件的影响。
例如,感兴趣条件包括但不限于:待推荐用户对多媒体文件的访问时长超过预设时长、待推荐用户对多媒体文件的访问次数超过预设次数、以及待推荐用户对多媒体文件设置有感兴趣标记中的任意一种或多种。
其中,预设时长可以设置为10秒,预设次数可以设置为2次。可以理解的是,用户对多媒体文件的访问时长超过10秒,可以认为用户对该多媒体文件的访问行为是有效观看行为,用户对所观看的多媒体文件感兴趣。
针对上述S102,基于历史访问记录包括的多媒体文件,生成待推荐用户的历史访问标签集合。
一种实施方式中,针对历史访问记录包括的每个多媒体文件,可以基于词典分词算法对该多媒体文件的属性信息进行分词。从而得到待推荐用户的历史访问标签集合。
词典分词算法能够按照预设的分词策略,对多媒体文件的属性信息进行分词,分词后得到多个汉字字符串。将汉字字符串与预设的词典中的词条进行匹配。若在词典中找到与字符串相同的词条,则匹配成功。将各匹配成功的字符串作为标签,构建为历史访问标签集合。
其中,将汉字字符串与预设的词典中的词条进行匹配时,可以利用正向匹配、逆向匹配算法、最大匹配或者最小匹配算法。当然,对多媒体文件的属性信息进行分词的方法并不局限于此。
多媒体文件的属性信息包括但不限于:标题信息、简介信息、发布者信息、格式信息和时长信息中的任意一种或多种。
以多媒体文件为视频为例,多媒体文件的属性信息可以包括:标题信息、简介信息、发布者信息、格式信息和时长信息中的任意一种或多种。
例如,待推荐用户在指定时间段内访问过视频A,视频A的属性信息包括标题信息时,可以基于词典分词算法对该标题信息进行分词,得到分词结果。从而获得待推荐用户的历史访问标签集合。
针对上述S103,获取每个待推荐多媒体文件的标签集合。
一种实施方式中,针对每个待推荐多媒体文件,可以基于词典分词算法对该待推荐多媒体文件的属性信息进行分词。从而得到每个待推荐多媒体文件的标签集合。
对待推荐多媒体文件的分词方法可参考上述S102中的分词方法,此处不再赘述。
针对上述S104,基于预设深度语义匹配模型(Deep Structured SemanticModels,DSSM),确定历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度。
在本发明实施例中,可以基于DSSM,计算历史访问标签集合对应的语义向量,以及每个待推荐多媒体文件的标签集合对应的语义向量。其中,历史访问标签集合对应的语义向量可以记为待推荐用户的嵌入(embedding)向量,每个待推荐多媒体文件的标签集合对应的语义向量可以记为每个待推荐多媒体文件的embedding向量。之后计算待推荐用户的embedding向量分别与每个待推荐多媒体文件的embedding向量之间的相似度。
针对上述S105,根据历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,选择为待推荐用户推荐的待推荐文件。
一种实施方式中,可以确定与待推荐用户的embedding向量相似度大于预设相似度的待推荐多媒体文件的embedding向量,将确定的待推荐多媒体文件的embedding向量对应的多媒体文件,作为为待推荐用户推荐的待推荐文件。
通过本发明实施例提供的多媒体文件推荐方法,基于用户历史上访问过的多媒体文件,给用户推荐与用户历史上访问过的多媒体文件较为相似的多媒体文件,可以给用户推荐该用户感兴趣的多媒体文件,实现了个性化推荐。与给每个用户推荐的相同的多媒体文件的方式相比,本发明实施例可以实现更为精准地推荐,提高推荐成功率。
参见图2,上述S104中的深度语义匹配模型可以通过以下步骤训练获得:
S201,构建样本训练集。
S202,将样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入初始深度语义匹配模型,获取初始深度语义模型输出的第一相似度和第二相似度。
其中,第一相似度为样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度,第二相似度为样本用户的样本历史访问标签集合与负样本标签之间的语义相似度。
在本发明实施例中,初始深度语义匹配模型可以是DSSM模型。
S203,基于第一相似度和第二相似度计算损失函数值,根据损失函数值,判断初始深度语义匹配模型是否收敛。如果初始深度语义匹配模型未收敛,则执行S204;如果初始深度语义匹配模型收敛,则执行S205。
在本发明实施例中,第一相似度与损失函数值负相关,第二相似度与损失函数值正相关。损失函数值越小,初始深度语义匹配模型的识别结果越准确。因此在损失函数值最小时,确定初始深度语义匹配模型收敛。
一种实施方式中,可以计算本次计算的损失函数值与迭代过程中上次计算的损失函数值之间的差值,确定该差值是否小于预设差值。若是,则确定初始深度语义匹配模型收敛;若否,则确定初始深度语义匹配模型未收敛。
另一种实施方式中,可以确定本次计算的损失函数值是否小于预设阈值。若是,则确定初始深度语义匹配模型收敛;若否,则确定初始深度语义匹配模型未收敛。
S204,根据损失函数值调整初始深度语义匹配模型的网络参数,并返回 S202。
一种实施方式中,可以根据损失函数值,采用梯度下降的方式调整初始深度语义匹配模型的网络参数,并基于调整后的初始深度语义匹配模型,执行 S202。
S205,将当前的初始深度语义匹配模型作为预设深度语义匹配模型。
在本发明实施例中,由于第一相似度与损失函数值负相关,第二相似度与损失函数值正相关,因此最小化损失函数,能够使得第一损失函数越大,且第二损失函数越小,也就是使得利用初始深度语义匹配模型,得到的样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度更高,并且样本用户的样本历史访问标签集合与负样本标签集合之间的语义相似度更低。从而提高预设深度语义匹配模型的识别准确性。
针对上述S201,参见图3,构建样本训练集的方式包括以下步骤:
S2011,针对每个样本用户,获取该样本用户在历史时间段内访问过的多媒体文件。
S2011获取多媒体文件的方式与上述S101获取多媒体文件的方式相同,可参考上述S101中的描述,此处不再赘述。
S2012,对获取到的多媒体文件的属性信息进行分词,得到该样本用户的样本历史访问标签集合。
针对S2011和S2012举例,样本用户包括样本用户1、样本用户2、…、样本用户10000。其中,样本用户1在历史时间段内访问了视频1、视频2和视频3。其中,对视频1的标题进行分词,对视频2的标题进行分词,对视频3的标题进行分词。从而,可以获得样本用户1的样本历史访问标签集合。
S2012对多媒体文件的属性信息进行分词的方式,与上述S102的分词方式相同,可参考上述S102中的描述,此处不再赘述。
S2013,对该样本用户最近一次访问的多媒体文件的属性信息进行分词,得到该样本用户的正样本标签集合。
可以理解的是,用户最近一次访问的多媒体文件一般是用户目前最感兴趣的多媒体文件。因此将该样本用户最近一次访问的多媒体文件的属性信息的分词结果,作为该样本用户的正样本标签集合。
可选的,样本用户最近一次访问的多媒体文件满足预设的感兴趣条件。例如,感兴趣条件包括但不限于:待推荐用户对多媒体文件的访问时长超过预设时长、待推荐用户对多媒体文件的访问次数超过预设次数、以及待推荐用户对多媒体文件设置有感兴趣标记中的任意一种或多种。
多媒体文件的属性信息包括但不限于:标题信息、简介信息、发布者信息、格式信息和时长信息中的任意一种或多种。
S2013对多媒体文件的属性信息进行分词的方式,与上述S102的分词方式相同,可参考上述S102中的描述,此处不再赘述。
S2014,对所有样本用户中,除该样本用户之外的其他样本用户进行随机负采样,获取预设数量的其他样本用户的样本历史访问标签集合,作为该样本用户的负样本标签集合。
可以理解的是,每个用户的兴趣大部分集中于某一类多媒体文件,例如游戏类视频。因此对于一个样本用户,其他样本用户感兴趣的多媒体文件,大概率是该样本用户不感兴趣的。因此将预设数量的其他样本用户的样本历史访问标签集合,作为该样本用户的负样本标签集合。
例如,预设数量为4。
S2015,将多个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合构建为样本训练集。
由于每个用户的兴趣大部分集中于一类多媒体文件,而其他类型的多媒体文件一般是该用户不感兴趣的,因此本发明实施例可以设置较大的预设数量,得到数据量较大的负样本标签集合,从而提升训练初始深度语义匹配模型的准确性。
以下结合图4,对本发明实施例训练预设深度语义匹配模型的整体流程进行说明:
参见图4,在一种实施方式中,图4中的三个虚线方框组成的整体结构表示初始深度语义匹配模型。
针对一个样本用户,图4中左边的虚线方框表示对该样本用户的正样本标签集合的处理过程,可以记作正向项目(item)塔。正向item塔下方的t1至tn 表示输入正向item塔的标签集合。中间的虚线方框表示对该样本用户的样本历史访问标签集合的处理过程,可以记作用户(user)塔。user塔下方的t1至tm表示输入user塔的标签集合。右边的虚线方框表示对该样本用户的负样本标签集合的处理过程,可以记作负向item塔。负向item塔下方的t1至tl表示输入负向item 塔的标签集合。初始深度语义匹配模型对每个标签集合的处理过程相同,输入的标签集合从下往上依次经过嵌入层(embedding layer)、堆积层(cumulate layer)、隐藏层(hidden layer)和表达层(representation layer)。
其中,embedding layer的处理包括词嵌入(word embedding)。cumulate layer的处理包括词袋模型(bag of words,BOW)和逆文本频率指数(Inverse DocumentFrequency,IDF)。hidden layer的处理包括线性整流函数(Rectified Linear Unit,ReLU)。representation layer的处理包括ReLU。
针对一个样本用户,经过左边虚线方框对该样本用户的正样本标签集合处理后,得到正样本语义向量;经过中间虚线方框对该样本用户的样本历史访问标签集合处理后,得到历史访问语义向量;经过右边虚线方框对该样本用户的负样本标签集合处理后,得到负样本语义向量。然后经过相似度计算层,计算正样本语义向量和历史访问语义向量之间的余弦相似度(cosine similarity)得到R+,并计算历史访问语义向量与负样本语义向量之间的cosine similarity得到 R-。之后在合页损失(hinge loss)层基于R+和R-,利用排序损失(Ranking loss) 的方式计算损失函数值。
基于损失函数值确定初始深度语义匹配模型是否收敛。如果初始深度语义匹配模型未收敛,则根据损失函数值调整初始深度语义匹配模型的网络参数,并将另一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入初始深度语义匹配模型继续训练。如果初始深度语义匹配模型收敛,则将当前的初始深度语义匹配模型的user塔和正向item塔作为预设深度语义匹配模型,或者将当前的初始深度语义匹配模型的user塔和负向item塔作为预设深度语义匹配模型。
在这种情况下,上述S104可以实现为:电子设备针对每个待推荐多媒体文件,将该多媒体文件的标签集合和待推荐用户的历史访问标签集合输入预设深度语义模型,获取预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的第一语义向量,以及历史访问标签集合对应的第二语义向量。然后电子设备再基于预设相似度算法,计算第一语义向量与第二语义向量之间的相似度。
例如,预设相似度算法可以是余弦相似度算法、杰卡德相似系数算法或者皮尔森相关系数算法等,本发明实施例对此不作具体限定。
在本发明实施例中,将该待推荐多媒体文件的标签集合输入预设深度语义匹配模型的item塔,将待推荐用户的历史访问标签集合输入预设深度语义匹配模型的user塔。
参见图4,在本发明实施例的另一种实施方式中,图4中的三个虚线方框以及相似度计算层组成的整体结构表示初始深度语义匹配模型。在初始深度语义匹配模型训练完成后,将当前的初始深度语义匹配模型中,user塔、正向item 塔以及相似度计算层作为预设深度语义匹配模型,或者将user塔、负向item塔以及相似度计算层作为预设深度语义匹配模型。
在这种情况下,上述S104可以实现为:电子设备针对每个待推荐多媒体文件,将该待推荐多媒体文件的标签集合和待推荐用户的历史访问标签集合输入预设深度语义匹配模型,获取预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的语义向量与历史访问标签集合对应的语义向量之间的相似度。
在本发明实施例中,将该待推荐多媒体文件的标签集合输入预设深度语义匹配模型的item塔,将待推荐用户的历史访问标签集合输入预设深度语义匹配模型的user塔。
参见图4,在本发明实施例的另一种实施方式中,图4中的三个嵌入层组成的整体结构表示初始深度语义匹配模型。此时,正向item塔包括左边的嵌入层, user塔包括中间的嵌入层,负向item塔包括右边的嵌入层。在初始深度语义匹配模型训练完成后,将当前的初始深度语义匹配模型中,user塔和正向item塔作为预设深度语义匹配模型,或者将user塔和负向item塔作为预设深度语义匹配模型。
在这种情况下,上述S104可以实现为以下三个步骤:
步骤一,针对每个待推荐多媒体文件,从缓存文件中获取该多媒体文件的标签集合中的每个标签的词向量,根据获取到的每个标签的词向量计算该多媒体文件对应的语义向量。
其中,缓存文件中缓存有多个标签的词向量,多个标签的词向量为:将各多媒体文件的标签集合输入预设深度语义匹配模型后,预设深度语义模型的词向量表达层输出的每个标签对应的词向量。参见图4,预设深度语义模型的词向量表达层为嵌入层。
可以理解的是,由于多媒体文件的属性信息一般是不变的,因此对多媒体文件的属性信息进行分词得到的多媒体文件的标签集合,以及每个标签对应的词向量是不变的。为了减少确定推荐的多媒体文件的计算量,提高多媒体文件的推荐速度,可以预先将各多媒体文件的标签集合输入预设深度语义匹配模型,得到预设深度语义模型的词向量表达层输出的每个标签对应的词向量,并将得到的词向量缓存在缓存文件中。
然后电子设备根据获取到的每个标签的词向量,经过如图4所示的堆积层、隐藏层和表达层,计算得到该多媒体文件对应的语义向量。
步骤二,从缓存文件中获取历史访问标签集合包括的每个标签的词向量,根据历史访问标签集合包括的每个标签的词向量,计算历史访问标签集合对应的语义向量。
步骤二计算历史访问标签集合对应的语义向量的方式,与步骤一计算待推荐多媒体文件对应的语义向量的方式相同,可参考步骤一中的描述,此处不再赘述。
步骤三,基于预设相似度算法,计算该多媒体文件对应的语义向量与历史访问标签集合对应的语义向量之间的相似度。
电子设备经过如图4所示的相似度计算层,基于预设相似度算法,计算该多媒体文件对应的语义向量与历史访问标签集合对应的语义向量之间的相似度。
本发明实施例可以模拟DSSM模型应用于自然语言处理领域时,对于查询 (query)和点击(doc)相关性的计算方式,使用DSSM模型来计算用户历史访问过的多媒体文件与待推荐多媒体文件之间的相似性,从而给用户推荐与用户历史访问过的多媒体文件相似度较高的待推荐多媒体文件。
基于相同的发明构思,对应于上述方法实施例,本发明实施例还提供了一种多媒体文件推荐装置,参见图5,该装置包括:获取模块501、生成模块502、确定模块503和选择模块504;
获取模块501,用于获取待推荐用户的历史访问记录,历史访问记录为待推荐用户在指定时间段内访问过的多媒体文件;
生成模块502,用于基于获取模块501获取的历史访问记录包括的多媒体文件,生成待推荐用户的历史访问标签集合;
获取模块501,还用于获取每个待推荐多媒体文件的标签集合;
确定模块503,用于基于预设深度语义匹配模型,确定历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度;其中,预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型,样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合;针对每个样本用户,该样本用户的样本历史访问标签集合包括:该样本用户在历史时间段内访问过的多媒体文件对应的标签;该样本用户的正样本标签集合包括:该样本用户最近一次访问的多媒体文件对应的标签;该样本用户的负样本标签集合包括:预设数量的其他样本用户在历史时间段内访问过的多媒体文件对应的标签;
选择模块504,用于根据确定模块503确定的历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,选择为待推荐用户推荐的待推荐文件。
可选的,该装置还包括训练模块,训练模块用于:
构建样本训练集;
将样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入初始深度语义匹配模型,获取初始深度语义模型输出的第一相似度和第二相似度,第一相似度为样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度,第二相似度为样本用户的样本历史访问标签集合与负样本标签之间的语义相似度;
基于第一相似度和第二相似度计算损失函数值,根据损失函数值,判断初始深度语义匹配模型是否收敛;
如果初始深度语义匹配模型未收敛,则根据损失函数值调整初始深度语义匹配模型的网络参数,并返回将样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入初始深度语义匹配模型的步骤;
如果初始深度语义匹配模型收敛,则将当前的初始深度语义匹配模型作为预设深度语义匹配模型。
可选的,训练模块,具体用于:
针对每个样本用户,获取该样本用户在历史时间段内访问过的多媒体文件;
对获取到的多媒体文件的属性信息进行分词,得到该样本用户的样本历史访问标签集合;
对该样本用户最近一次访问的多媒体文件的属性信息进行分词,得到该样本用户的正样本标签集合;
对所有样本用户中,除该样本用户之外的其他样本用户进行随机负采样,获取预设数量的其他样本用户的样本历史访问标签集合,作为该样本用户的负样本标签集合;
将多个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合构建为样本训练集。
可选的,确定模块503,具体用于:
针对每个待推荐多媒体文件,将该待推荐多媒体文件的标签集合和待推荐用户的历史访问标签集合输入预设深度语义匹配模型,获取预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的语义向量与历史访问标签集合对应的语义向量之间的相似度。
可选的,确定模块503,具体用于:
针对每个待推荐多媒体文件,将该多媒体文件的标签集合和待推荐用户的历史访问标签集合输入预设深度语义模型,获取预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的第一语义向量,以及历史访问标签集合对应的第二语义向量;基于预设相似度算法,计算第一语义向量与第二语义向量之间的相似度。
可选的,确定模块503,具体用于:
针对每个待推荐多媒体文件,从缓存文件中获取该多媒体文件的标签集合中的每个标签的词向量,根据获取到的每个标签的词向量计算该多媒体文件对应的语义向量;缓存文件中缓存有多个标签的词向量,多个标签的词向量为:将各多媒体文件的标签集合输入预设深度语义匹配模型后,预设深度语义模型的词向量表达层输出的每个标签对应的词向量;
从缓存文件中获取历史访问标签集合包括的每个标签的词向量,根据历史访问标签集合包括的每个标签的词向量,计算历史访问标签集合对应的语义向量;
基于预设相似度算法,计算该多媒体文件对应的语义向量与历史访问标签集合对应的语义向量之间的相似度。
相应于上述方法实施例,本发明实施例还提供了一种电子设备,参见图6,可以包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器 601,通信接口602,存储器603通过通信总线604完成相互间的通信;
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现上述方法实施例中的方法步骤。
相应于上述方法实施例,本发明实施例还提供了一种可读存储介质,该可读存储介质为计算机可读存储介质,可读存储介质内存储有计算机程序,计算机程序被电子设备的处理器执行时实现上述任一项多媒体文件推荐方法的方法步骤。
相应于上述方法实施例,本发明实施例还提供了一种计算机程序产品,当其在电子设备上运行时,使得电子设备的处理器执行时实现上述任一项多媒体文件推荐方法的方法步骤。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备和可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (14)

1.一种多媒体文件推荐方法,其特征在于,包括:
获取待推荐用户的历史访问记录,所述历史访问记录为所述待推荐用户在指定时间段内访问过的多媒体文件;
基于所述历史访问记录包括的多媒体文件,生成所述待推荐用户的历史访问标签集合;
获取每个待推荐多媒体文件的标签集合;
基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度;其中,所述预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型,所述样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合;针对每个样本用户,该样本用户的样本历史访问标签集合包括:该样本用户在历史时间段内访问过的多媒体文件对应的标签;该样本用户的正样本标签集合包括:该样本用户最近一次访问的多媒体文件对应的标签;该样本用户的负样本标签集合包括:预设数量的其他样本用户在所述历史时间段内访问过的多媒体文件对应的标签;
根据所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,选择为所述待推荐用户推荐的待推荐文件;
所述基于所述历史访问记录包括的多媒体文件,生成所述待推荐用户的历史访问标签集合,包括:
针对所述历史访问记录包括的每个多媒体文件,基于词典分词算法对该多媒体文件的属性信息进行分词,得到所述待推荐用户的历史访问标签集合;
所述获取每个待推荐多媒体文件的标签集合,包括:
针对每个待推荐多媒体文件,基于词典分词算法对该待推荐多媒体文件的属性信息进行分词,得到每个待推荐多媒体文件的标签集合;
其中,词典分词算法为:按照预设的分词策略,对多媒体文件的属性信息进行分词,得到多个汉字字符串,将每个汉字字符串与预设的词典中的词条进行匹配,将各匹配成功的字符串作为标签,构建为标签集合;其中,多媒体文件的属性信息包括:标题信息、简介信息、发布者信息、格式信息和时长信息中的任意一种或多种。
2.根据权利要求1所述的方法,其特征在于,所述预设深度语义匹配模型通过以下步骤训练获得:
构建所述样本训练集;
将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型,获取所述初始深度语义模型输出的第一相似度和第二相似度,所述第一相似度为样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度,所述第二相似度为样本用户的样本历史访问标签集合与负样本标签之间的语义相似度;
基于所述第一相似度和所述第二相似度计算损失函数值,根据所述损失函数值,判断所述初始深度语义匹配模型是否收敛;
如果所述初始深度语义匹配模型未收敛,则根据所述损失函数值调整所述初始深度语义匹配模型的网络参数,并返回将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型的步骤;
如果所述初始深度语义匹配模型收敛,则将当前的初始深度语义匹配模型作为所述预设深度语义匹配模型。
3.根据权利要求2所述的方法,其特征在于,所述构建所述样本训练集,包括:
针对每个样本用户,获取该样本用户在所述历史时间段内访问过的多媒体文件;
对获取到的多媒体文件的属性信息进行分词,得到该样本用户的样本历史访问标签集合;
对该样本用户最近一次访问的多媒体文件的属性信息进行分词,得到该样本用户的正样本标签集合;
对所有样本用户中,除该样本用户之外的其他样本用户进行随机负采样,获取预设数量的其他样本用户的样本历史访问标签集合,作为该样本用户的负样本标签集合;
将多个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合构建为所述样本训练集。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,包括:
针对每个待推荐多媒体文件,将该待推荐多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义匹配模型,获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,包括:
针对每个待推荐多媒体文件,将该多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义模型,获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的第一语义向量,以及所述历史访问标签集合对应的第二语义向量;基于预设相似度算法,计算所述第一语义向量与所述第二语义向量之间的相似度。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,包括:
针对每个待推荐多媒体文件,从缓存文件中获取该多媒体文件的标签集合中的每个标签的词向量,根据获取到的每个标签的词向量计算该多媒体文件对应的语义向量;所述缓存文件中缓存有多个标签的词向量,所述多个标签的词向量为:将各多媒体文件的标签集合输入所述预设深度语义匹配模型后,所述预设深度语义模型的词向量表达层输出的每个标签对应的词向量;
从所述缓存文件中获取所述历史访问标签集合包括的每个标签的词向量,根据所述历史访问标签集合包括的每个标签的词向量,计算所述历史访问标签集合对应的语义向量;
基于预设相似度算法,计算该多媒体文件对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。
7.一种多媒体文件推荐装置,其特征在于,包括:
获取模块,用于获取待推荐用户的历史访问记录,所述历史访问记录为所述待推荐用户在指定时间段内访问过的多媒体文件;
生成模块,用于基于所述获取模块获取的所述历史访问记录包括的多媒体文件,生成所述待推荐用户的历史访问标签集合;
所述获取模块,还用于获取每个待推荐多媒体文件的标签集合;
确定模块,用于基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度;其中,所述预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型,所述样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合;针对每个样本用户,该样本用户的样本历史访问标签集合包括:该样本用户在历史时间段内访问过的多媒体文件对应的标签;该样本用户的正样本标签集合包括:该样本用户最近一次访问的多媒体文件对应的标签;该样本用户的负样本标签集合包括:预设数量的其他样本用户在所述历史时间段内访问过的多媒体文件对应的标签;
选择模块,用于根据所述确定模块确定的所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,选择为所述待推荐用户推荐的待推荐文件;
所述生成模块,具体用于:
针对所述历史访问记录包括的每个多媒体文件,基于词典分词算法对该多媒体文件的属性信息进行分词,得到所述待推荐用户的历史访问标签集合;
所述获取模块,具体用于:
针对每个待推荐多媒体文件,基于词典分词算法对该待推荐多媒体文件的属性信息进行分词,得到每个待推荐多媒体文件的标签集合;
其中,词典分词算法为:按照预设的分词策略,对多媒体文件的属性信息进行分词,得到多个汉字字符串,将每个汉字字符串与预设的词典中的词条进行匹配,将各匹配成功的字符串作为标签,构建为标签集合;其中,多媒体文件的属性信息包括:标题信息、简介信息、发布者信息、格式信息和时长信息中的任意一种或多种。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括训练模块,所述训练模块用于:
构建所述样本训练集;
将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型,获取所述初始深度语义模型输出的第一相似度和第二相似度,所述第一相似度为样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度,所述第二相似度为样本用户的样本历史访问标签集合与负样本标签之间的语义相似度;
基于所述第一相似度和所述第二相似度计算损失函数值,根据所述损失函数值,判断所述初始深度语义匹配模型是否收敛;
如果所述初始深度语义匹配模型未收敛,则根据所述损失函数值调整所述初始深度语义匹配模型的网络参数,并返回将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型的步骤;
如果所述初始深度语义匹配模型收敛,则将当前的初始深度语义匹配模型作为所述预设深度语义匹配模型。
9.根据权利要求8所述的装置,其特征在于,所述训练模块,具体用于:
针对每个样本用户,获取该样本用户在所述历史时间段内访问过的多媒体文件;
对获取到的多媒体文件的属性信息进行分词,得到该样本用户的样本历史访问标签集合;
对该样本用户最近一次访问的多媒体文件的属性信息进行分词,得到该样本用户的正样本标签集合;
对所有样本用户中,除该样本用户之外的其他样本用户进行随机负采样,获取预设数量的其他样本用户的样本历史访问标签集合,作为该样本用户的负样本标签集合;
将多个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合构建为所述样本训练集。
10.根据权利要求7-9任一项所述的装置,其特征在于,所述确定模块,具体用于:
针对每个待推荐多媒体文件,将该待推荐多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义匹配模型,获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。
11.根据权利要求7-9任一项所述的装置,其特征在于,所述确定模块,具体用于:
针对每个待推荐多媒体文件,将该多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义模型,获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的第一语义向量,以及所述历史访问标签集合对应的第二语义向量;基于预设相似度算法,计算所述第一语义向量与所述第二语义向量之间的相似度。
12.根据权利要求7-9任一项所述的装置,其特征在于,所述确定模块,具体用于:
针对每个待推荐多媒体文件,从缓存文件中获取该多媒体文件的标签集合中的每个标签的词向量,根据获取到的每个标签的词向量计算该多媒体文件对应的语义向量;所述缓存文件中缓存有多个标签的词向量,所述多个标签的词向量为:将各多媒体文件的标签集合输入所述预设深度语义匹配模型后,所述预设深度语义模型的词向量表达层输出的每个标签对应的词向量;
从所述缓存文件中获取所述历史访问标签集合包括的每个标签的词向量,根据所述历史访问标签集合包括的每个标签的词向量,计算所述历史访问标签集合对应的语义向量;
基于预设相似度算法,计算该多媒体文件对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。
13.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
14.一种可读存储介质,其特征在于,所述可读存储介质内存储有计算机程序,所述计算机程序被电子设备的处理器执行时实现权利要求1-6任一所述的方法步骤。
CN202110336117.7A 2021-03-29 2021-03-29 多媒体文件推荐方法、装置、电子设备及可读存储介质 Active CN113032589B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110336117.7A CN113032589B (zh) 2021-03-29 2021-03-29 多媒体文件推荐方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110336117.7A CN113032589B (zh) 2021-03-29 2021-03-29 多媒体文件推荐方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN113032589A CN113032589A (zh) 2021-06-25
CN113032589B true CN113032589B (zh) 2024-01-23

Family

ID=76452759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110336117.7A Active CN113032589B (zh) 2021-03-29 2021-03-29 多媒体文件推荐方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113032589B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836413A (zh) * 2021-09-24 2021-12-24 北京爱奇艺科技有限公司 一种推荐信息确定方法、装置、电子设备及存储介质
CN113919446A (zh) * 2021-11-12 2022-01-11 北京达佳互联信息技术有限公司 多媒体资源的模型训练及相似度确定方法和装置
CN114117212A (zh) * 2021-11-12 2022-03-01 北京达佳互联信息技术有限公司 媒体数据处理方法、装置、电子设备及存储介质
CN117076387B (zh) * 2023-08-22 2024-03-01 北京天华星航科技有限公司 基于磁带的海量小文件的快速归档恢复***
CN118133046A (zh) * 2024-04-30 2024-06-04 江苏中天互联科技有限公司 产业数据匹配方法及相关设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647227A (zh) * 2018-03-26 2018-10-12 北京奇艺世纪科技有限公司 一种推荐方法及装置
CN109447813A (zh) * 2018-09-05 2019-03-08 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
CN110442788A (zh) * 2019-07-23 2019-11-12 北京奇艺世纪科技有限公司 一种信息推荐方法及装置
CN110727785A (zh) * 2019-09-11 2020-01-24 北京奇艺世纪科技有限公司 推荐模型的训练、搜索文本的推荐方法、装置及存储介质
CN110781321A (zh) * 2019-08-28 2020-02-11 腾讯科技(深圳)有限公司 一种多媒体内容推荐方法及装置
KR102080323B1 (ko) * 2018-08-17 2020-02-21 주식회사 아이포트폴리오 학습 로드맵을 제공하는 시스템 및 이의 운용 방법
CN110990600A (zh) * 2019-12-04 2020-04-10 腾讯科技(深圳)有限公司 多媒体文件推荐、参数调整方法、装置、介质及电子设备
CN111143678A (zh) * 2019-12-27 2020-05-12 第四范式(北京)技术有限公司 推荐***和推荐方法
CN111597446A (zh) * 2020-05-13 2020-08-28 腾讯科技(深圳)有限公司 基于人工智能的内容推送方法、装置、服务器和存储介质
CN114007710A (zh) * 2019-07-08 2022-02-01 威尔乌集团 内容项推荐

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8027977B2 (en) * 2007-06-20 2011-09-27 Microsoft Corporation Recommending content using discriminatively trained document similarity
US9767102B2 (en) * 2014-12-01 2017-09-19 Comcast Cable Communications, Llc Content recommendation system
US11429405B2 (en) * 2017-11-28 2022-08-30 Intuit, Inc. Method and apparatus for providing personalized self-help experience
US11153619B2 (en) * 2018-07-02 2021-10-19 International Business Machines Corporation Cognitively derived multimedia streaming preferences

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647227A (zh) * 2018-03-26 2018-10-12 北京奇艺世纪科技有限公司 一种推荐方法及装置
KR102080323B1 (ko) * 2018-08-17 2020-02-21 주식회사 아이포트폴리오 학습 로드맵을 제공하는 시스템 및 이의 운용 방법
CN109447813A (zh) * 2018-09-05 2019-03-08 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
CN114007710A (zh) * 2019-07-08 2022-02-01 威尔乌集团 内容项推荐
CN110442788A (zh) * 2019-07-23 2019-11-12 北京奇艺世纪科技有限公司 一种信息推荐方法及装置
CN110781321A (zh) * 2019-08-28 2020-02-11 腾讯科技(深圳)有限公司 一种多媒体内容推荐方法及装置
CN110727785A (zh) * 2019-09-11 2020-01-24 北京奇艺世纪科技有限公司 推荐模型的训练、搜索文本的推荐方法、装置及存储介质
CN110990600A (zh) * 2019-12-04 2020-04-10 腾讯科技(深圳)有限公司 多媒体文件推荐、参数调整方法、装置、介质及电子设备
CN111143678A (zh) * 2019-12-27 2020-05-12 第四范式(北京)技术有限公司 推荐***和推荐方法
CN111597446A (zh) * 2020-05-13 2020-08-28 腾讯科技(深圳)有限公司 基于人工智能的内容推送方法、装置、服务器和存储介质

Also Published As

Publication number Publication date
CN113032589A (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
CN113032589B (zh) 多媒体文件推荐方法、装置、电子设备及可读存储介质
US10795939B2 (en) Query method and apparatus
US11960519B2 (en) Classifying data objects
US9594826B2 (en) Co-selected image classification
CN106951422B (zh) 网页训练的方法和装置、搜索意图识别的方法和装置
US9846836B2 (en) Modeling interestingness with deep neural networks
US11023506B2 (en) Query pattern matching
US20190266257A1 (en) Vector similarity search in an embedded space
US11294974B1 (en) Golden embeddings
US20130060769A1 (en) System and method for identifying social media interactions
CN110717099B (zh) 一种推荐影片的方法及终端
US10318543B1 (en) Obtaining and enhancing metadata for content items
US20100191758A1 (en) System and method for improved search relevance using proximity boosting
WO2019169024A1 (en) Content channel curation
US10929036B2 (en) Optimizing static object allocation in garbage collected programming languages
CN112434533B (zh) 实体消歧方法、装置、电子设备及计算机可读存储介质
CN110019948B (zh) 用于输出信息的方法和装置
CN112667780A (zh) 一种评论信息的生成方法、装置、电子设备及存储介质
WO2015044934A1 (en) A method for adaptively classifying sentiment of document snippets
CN111984867B (zh) 一种网络资源确定方法及装置
Yang et al. Music playlist recommendation with long short-term memory
EP4364050A1 (en) Privacy-sensitive neural network training
CN111460177A (zh) 影视类表情搜索方法、装置、存储介质、计算机设备
CN112883232B (zh) 一种资源搜索方法、装置及设备
US20240020476A1 (en) Determining linked spam content

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant