CN113792163A - 多媒体推荐方法、装置、电子设备及存储介质 - Google Patents

多媒体推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113792163A
CN113792163A CN202110908672.2A CN202110908672A CN113792163A CN 113792163 A CN113792163 A CN 113792163A CN 202110908672 A CN202110908672 A CN 202110908672A CN 113792163 A CN113792163 A CN 113792163A
Authority
CN
China
Prior art keywords
multimedia
target
information
keyword
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110908672.2A
Other languages
English (en)
Other versions
CN113792163B (zh
Inventor
刘艺语
牛亚男
王昶平
宋洋
田雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110908672.2A priority Critical patent/CN113792163B/zh
Publication of CN113792163A publication Critical patent/CN113792163A/zh
Application granted granted Critical
Publication of CN113792163B publication Critical patent/CN113792163B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种多媒体推荐方法、装置、电子设备及存储介质。该方法包括:获取关联关系图;根据关联关系图中与多个待推荐多媒体具有关联关系的第一关键词,确定多个待推荐多媒体各自的多媒体特征;对关联关系图进行剪枝处理,得到目标子图;目标子图包括目标对象、多个待推荐多媒体、目标历史多媒体和目标关键词;基于目标历史多媒体和目标关键词,确定目标对象的第一对象特征;根据多媒体特征和第一对象特征,确定多个待推荐多媒体的推荐信息;基于推荐信息,向目标对象推荐多个待推荐多媒体。根据本公开提供的技术方案,可以提高多媒体推荐的精度和效率。

Description

多媒体推荐方法、装置、电子设备及存储介质
技术领域
本公开涉及互联网应用技术领域,尤其涉及一种多媒体推荐方法、装置、电子设备及存储介质。
背景技术
互联网应用平台越来越关注推荐业务,比如多媒体推荐业务,相关技术中,为了提高推荐的精准度,一般通过多模态数据融合方法实时抽取多媒体内容以实现对多媒体的精准理解,而这种实时抽取的方式给服务器造成很大处理压力,推荐效率较低,适用场景的扩展性较差。
发明内容
本公开提供一种多媒体推荐方法、装置、电子设备及存储介质,以至少解决相关技术中如何多媒体推荐精度和效率问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种多媒体推荐方法,包括:
获取关联关系图,所述关联关系图包括目标对象、多个多媒体和多个关键词三种节点以及相邻节点之间的边,所述多个多媒体包括多个待推荐多媒体和所述目标对象执行过预设行为的多个历史多媒体,所述边表征所述相邻节点之间具有关联关系;
根据所述关联关系图中与所述多个待推荐多媒体具有关联关系的第一关键词,确定所述多个待推荐多媒体各自的多媒体特征;
对所述关联关系图进行剪枝处理,得到目标子图;所述目标子图包括所述目标对象、所述多个待推荐多媒体、目标历史多媒体和目标关键词,所述目标历史多媒体为所述多个历史多媒体中的至少一个,所述目标关键词为所述多个关键词中的至少一个;
基于所述目标历史多媒体和所述目标关键词,确定所述目标对象的第一对象特征;
根据所述多媒体特征和所述第一对象特征,确定所述多个待推荐多媒体的推荐信息;
基于所述推荐信息,向所述目标对象推荐所述多个待推荐多媒体。
在一种可能的实现方式中,所述根据所述关联关系图中与所述多个待推荐多媒体具有关联关系的第一关键词,确定所述多个待推荐多媒体各自的多媒体特征步骤包括:
将所述多个待推荐多媒体和所述第一关键词输入第一注意力网络,得到所述第一关键词的第一权重信息;
根据所述第一权重信息对所述多个待推荐多媒体各自对应的第一关键词进行加权处理,得到所述多个待推荐多媒体各自的所述多媒体特征。
在一种可能的实现方式中,所述目标历史多媒体与所述目标对象的关联度满足第一预设条件;所述目标关键词与所述目标历史多媒体的关联度满足第二预设条件。
在一种可能的实现方式中,所述对所述关联关系图进行剪枝处理,得到目标子图步骤包括:
确定所述多个历史多媒体各自在所述目标对象下的第一关联度信息、以及第二关键词在所述多个历史多媒体下的第二关联度信息;所述第二关键词为与所述多个历史多媒体具有关联关系的关键词;
基于所述第一关联度信息和所述第二关联度信息,对所述关联关系图中的边和/或节点进行剪枝处理,得到所述目标子图。
在一种可能的实现方式中,所述确定所述多个历史多媒体各自在所述目标对象下的第一关联度信息、以及第二关键词在所述多个历史多媒体下的第二关联度信息步骤包括:
基于所述多个历史多媒体和所述第二关键词,确定所述目标对象的第二对象特征;
将所述多个历史多媒体和所述第二对象特征输入第一关联度预测模型,对所述目标对象与所述多个历史多媒体之间的关联度进行预测处理,得到所述第一关联度信息和所述第一关联度预测模型中的门循环单元输出的中间特征信息;
将所述多个历史多媒体、所述第二关键词和所述中间特征信息输入第二关联度预测模型,对所述多个历史多媒体与所述第二关键词之间的关联度进行预测处理,得到所述第二关联度信息。
在一种可能的实现方式中,所述基于所述多个历史多媒体和所述第二关键词,确定所述目标对象的第二对象特征步骤包括:
将所述多个历史多媒体和所述第二关键词输入第二注意力网络,得到所述第二关键词的第二权重信息;
将所述目标对象和所述多个历史多媒体输入第三注意力网络,得到所述多个历史多媒体的第三权重信息;
根据所述第二关键词、所述第二权重信息和所述第三权重信息,确定所述第二对象特征。
在一种可能的实现方式中,所述获取关联关系图步骤包括:
获取所述多个待推荐多媒体、所述目标对象执行过预设行为的多个历史多媒体、以及所述多个待推荐多媒体各自关联的第一文本信息和所述多个历史多媒体各自关联的第二文本信息;
分别对所述第一文本信息和所述第二文本信息进行分词处理,得到多个第一初始关键词和多个第二初始关键词;
确定所述多个第一初始关键词对于所述多个待推荐多媒体的第一重要程度信息、以及所述多个第二初始关键词对于所述多个历史多媒体的第二重要程度信息;
基于所述第一重要程度信息和所述第二重要程度信息,从所述多个第一初始关键词和所述多个第二初始关键词中筛选出所述多个关键词;
基于所述目标对象、所述多个历史多媒体、所述多个待推荐多媒体和所述多个关键词三种节点之间的关联关系,构建所述关联关系图。
在一种可能的实现方式中,所述方法还包括:
获取样本关联关系图以及标签信息,所述样本关联关系图包括多个样本对象、多个样本多媒体和多个样本词三种样本节点以及相邻样本节点之间的边,所述多个样本多媒体为所述目标对象执行过预设行为的多媒体,所述相邻样本节点之间的边表征所述相邻样本节点之间具有关联关系,所述标签信息表征所述样本多媒体与所述样本对象的关联度;
基于所述多个样本多媒体和所述样本词,确定所述多个样本对象各自的样本对象特征;
将所述多个样本多媒体和所述样本对象特征输入第一预设模型,对所述样本对象与所述多个样本多媒体之间的关联度进行预测处理,得到样本预测信息;
重复上述输入步骤直至预设次数,对所述预设次数对应的样本预测信息进行统计处理,得到目标样本预测信息;
根据所述目标样本预测信息和所述标签信息,确定损失信息;
基于所述损失信息训练所述第一预设模型,得到所述第一关联度预测模型。
根据本公开实施例的第二方面,提供一种多媒体推荐装置,包括:
关联关系图获取模块,被配置为执行获取关联关系图,所述关联关系图包括目标对象、多个多媒体和多个关键词三种节点以及相邻节点之间的边,所述多个多媒体包括多个待推荐多媒体和所述目标对象执行过预设行为的多个历史多媒体,所述边表征所述相邻节点之间具有关联关系;
多媒体特征确定模块,被配置为执行根据所述关联关系图中与所述多个待推荐多媒体具有关联关系的第一关键词,确定所述多个待推荐多媒体各自的多媒体特征;
剪枝模块,被配置为执行对所述关联关系图进行剪枝处理,得到目标子图;所述目标子图包括所述目标对象、所述多个待推荐多媒体、目标历史多媒体和目标关键词,所述目标历史多媒体为所述多个历史多媒体中的至少一个,所述目标关键词为所述多个关键词中的至少一个;
第一对象特征确定模块,被配置为执行基于所述目标历史多媒体和所述目标关键词,确定所述目标对象的第一对象特征;
推荐信息确定模块,被配置为执行根据所述多媒体特征和所述第一对象特征,确定所述多个待推荐多媒体的推荐信息;
推荐模块,被配置为执行基于所述推荐信息,向所述目标对象推荐所述多个待推荐多媒体。
在一种可能的实现方式中,所述多媒体特征确定模块包括:
第一权重信息获取单元,被配置为执行将所述多个待推荐多媒体和所述第一关键词输入第一注意力网络,得到所述第一关键词的第一权重信息;
多媒体特征确定单元,被配置为执行根据所述第一权重信息对所述多个待推荐多媒体各自对应的第一关键词进行加权处理,得到所述多个待推荐多媒体各自的所述多媒体特征。
在一种可能的实现方式中,所述目标历史多媒体与所述目标对象的关联度满足第一预设条件;所述目标关键词与所述目标历史多媒体的关联度满足第二预设条件。
在一种可能的实现方式中,所述剪枝模块包括:
关联度确定单元,被配置为执行确定所述多个历史多媒体各自在所述目标对象下的第一关联度信息、以及第二关键词在所述多个历史多媒体下的第二关联度信息;所述第二关键词为与所述多个历史多媒体具有关联关系的关键词;
目标子图获取单元,被配置为执行基于所述第一关联度信息和所述第二关联度信息,对所述关联关系图中的边和/或节点进行剪枝处理,得到所述目标子图。
在一种可能的实现方式中,所述关联度确定单元包括:
第二对象特征确定子单元,被配置为执行基于所述多个历史多媒体和所述第二关键词,确定所述目标对象的第二对象特征;
第一关联度信息和中间特征信息获取子单元,被配置为执行将所述多个历史多媒体和所述第二对象特征输入第一关联度预测模型,对所述目标对象与所述多个历史多媒体之间的关联度进行预测处理,得到所述第一关联度信息和所述第一关联度预测模型中的门循环单元输出的中间特征信息;
第二关联度信息获取子单元,被配置为执行将所述多个历史多媒体、所述第二关键词和所述中间特征信息输入第二关联度预测模型,对所述多个历史多媒体与所述第二关键词之间的关联度进行预测处理,得到所述第二关联度信息。
在一种可能的实现方式中,所述第二对象特征确定子单元包括:
第二权重信息获取子单元,被配置为执行将所述多个历史多媒体和所述第二关键词输入第二注意力网络,得到所述第二关键词的第二权重信息;
第三权重信息获取子单元,被配置为执行将所述目标对象和所述多个历史多媒体输入第三注意力网络,得到所述多个历史多媒体的第三权重信息;
第二对象特征获取子单元,被配置为执行根据所述第二关键词、所述第二权重信息和所述第三权重信息,确定所述第二对象特征。
在一种可能的实现方式中,所述关联关系图获取模块包括:
节点信息获取单元,被配置为执行获取所述多个待推荐多媒体、所述目标对象执行过预设行为的多个历史多媒体、以及所述多个待推荐多媒体各自关联的第一文本信息和所述多个历史多媒体各自关联的第二文本信息;
分词处理单元,被配置为执行分别对所述第一文本信息和所述第二文本信息进行分词处理,得到多个第一初始关键词和多个第二初始关键词;
重要程度信息确定单元,被配置为执行确定所述多个第一初始关键词对于所述多个待推荐多媒体的第一重要程度信息、以及所述多个第二初始关键词对于所述多个历史多媒体的第二重要程度信息;
多个关键词筛选单元,被配置为执行基于所述第一重要程度信息和所述第二重要程度信息,从所述多个第一初始关键词和所述多个第二初始关键词中筛选出所述多个关键词;
关联关系图构建单元,被配置为执行基于所述目标对象、所述多个历史多媒体、所述多个待推荐多媒体和所述多个关键词三种节点之间的关联关系,构建所述关联关系图。
在一种可能的实现方式中,所述装置还包括:
样本数据获取模块,被配置为执行获取样本关联关系图以及标签信息,所述样本关联关系图包括多个样本对象、多个样本多媒体和多个样本词三种样本节点以及相邻样本节点之间的边,所述多个样本多媒体为所述目标对象执行过预设行为的多媒体,所述相邻样本节点之间的边表征所述相邻样本节点之间具有关联关系,所述标签信息表征所述样本多媒体与所述样本对象的关联度;
样本对象特征确定模块,被配置为执行基于所述多个样本多媒体和所述样本词,确定所述多个样本对象各自的样本对象特征;
样本预测信息获取模块,被配置为执行将所述多个样本多媒体和所述样本对象特征输入第一预设模型,对所述样本对象与所述多个样本多媒体之间的关联度进行预测处理,得到样本预测信息;
目标样本预测信息获取模块,被配置为执行重复上述输入步骤直至预设次数,对所述预设次数对应的样本预测信息进行统计处理,得到目标样本预测信息;
损失信息确定模块,被配置为执行根据所述目标样本预测信息和所述标签信息,确定损失信息;
第一关联度预测模型获取模块,被配置为执行基于所述损失信息训练所述第一预设模型,得到所述第一关联度预测模型。
根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如上述第一方面中任一项所述的方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行本公开实施例的第一方面中任一所述方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时,使得计算机执行本公开实施例的第一方面中任一项所述方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过在关联关系图中包括关键词等三种节点,充分利用了多媒体下的文本数据,提高对多媒体理解的同时,由于不需要实时抽取多媒体内容,还可以降低处理压力以及提高对多媒体理解的效率;并且,选择对关联关系图进行剪枝处理,使得剪枝后的目标子图中三种节点间的关联程度较高且图结构更加精简,能够对关联关系图中的关联关系进行有效去噪,从而可以提升对目标对象兴趣点的捕捉精度和效率,提升多媒体推荐的精度和效率,使得该多媒体推荐处理的适用场景的扩展性较佳。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种应用环境的示意图。
图2是根据一示例性实施例示出的一种多媒体推荐方法的流程图。
图3a是根据一示例性实施例示出的一种关联关系图的示意图。
图3b是根据一示例性实施例示出的一种目标子图的示意图。
图4是根据一示例性实施例示出的一种根据关联关系图中与多个待推荐多媒体具有关联关系的第一关键词,确定多个待推荐多媒体各自的多媒体特征的方法流程图。
图5是根据一示例性实施例示出的一种获取关联关系图的方法流程图。
图6是根据一示例性实施例示出的一种对关联关系图进行剪枝处理,得到目标子图的方法流程图。
图7是根据一示例性实施例示出的一种确定多个历史多媒体各自在目标对象下的第一关联度信息、以及第二关键词在多个历史多媒体下的第二关联度信息的方法流程图。
图8是根据一示例性实施例示出的一种剪枝网络的示意图。
图9是根据一示例性实施例示出的一种基于多个历史多媒体和第二关键词,确定目标对象的第二对象特征的方法流程图。
图10是根据一示例性实施例示出的一种第一关联度预测模型和第二关联度预测模型的示意图。
图11是根据一示例性实施例示出的一种第一关联度预测模型的训练方法流程图。
图12是根据一示例性实施例示出的一种多媒体推荐装置框图。
图13是根据一示例性实施例示出的一种用于多媒体推荐的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
近年来,随着人工智能技术研究和进步,人工智能技术在多个领域得到广泛应用,本申请实施例提供的方案涉及机器学习/深度学习等技术,具体通过如下实施例进行说明:
请参阅图1,图1是根据一示例性实施例示出的一种应用环境的示意图,如图1所示,该应用环境可以包括服务器01和终端02。
在一个可选的实施例中,服务器01可以用于多媒体推荐处理。具体的,服务器01可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一个可选的实施例中,终端02可以用于展示推荐的多媒体。具体的,终端02可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、智能可穿戴设备等类型的电子设备。可选的,电子设备上运行的操作***可以包括但不限于安卓***、IOS***、linux、windows等。
此外,需要说明的是,图1所示的仅仅是本公开提供的图像处理方法的一种应用环境。
本说明书实施例中,上述服务器01以及终端02可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
需要说明的是,以下图中示出的是一种可能的步骤顺序,实际上并不限定必须严格按照此顺序。有些步骤可以在互不依赖的情况下并行执行。本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息、用户行为信息等)和数据(包括但不限于用于展示的数据、训练的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
图2是根据一示例性实施例示出的一种多媒体推荐方法的流程图。如图2所示,可以包括以下步骤。
在步骤S201中,获取关联关系图。
其中,关联关系图可以包括目标对象、多个多媒体和多个关键词三种节点以及相邻节点之间的边,该多个多媒体可以包括多个待推荐多媒体和目标对象执行过预设行为的多个历史多媒体,这些边可以表征相邻节点之间具有关联关系,如图3a所示。
本说明书实施例中,目标对象可以是指目标用户,目标用户可以是多媒体推荐平台中多个用户中的一个。预设行为可以包括点赞、转发、展示等行为,本公开对此不作限定。
实际应用中,可以获取目标对象执行过预设行为的多个历史多媒体、以及与目标对象的兴趣匹配的待推荐多媒体,并可以获取历史多媒体和待推荐多媒体各自关联的关键词,从而可以基于目标对象、多媒体(历史多媒体和待推荐多媒体)、关键词三种节点以及三种节点之间的关联关系,构建三种节点之间的异构图作为关联关系图。其中,多媒体节点可以是目标对象的一阶邻居节点、关键词可以是目标对象的二阶邻居节点,关键词可以是多媒体的一阶邻居节点,如图3a所示。
在步骤S203中,根据关联关系图中与多个待推荐多媒体具有关联关系的第一关键词,确定多个待推荐多媒体各自的多媒体特征。
本说明书实施例中,为了提升多媒体的可解释性,可以通过与多媒体关联的关键词来表征多媒体。基于此,可以根据关联关系图中与每个待推荐多媒体具有关联关系的第一关键词,确定每个待推荐多媒体的多媒体特征。例如,可以将第一关键词的词特征进行拼接或加权,得到待推荐多媒体的多媒体特征。其中,第一关键词可以是多个关键词中的至少一个。
需要说明的是,这里的词特征和多媒体特征可以是向量的形式,以下关于模型输入的信息或特征也可以是向量的形式,均可以通过预训练好的嵌入层网络实现向量表征,本公开对此不作限定。
在步骤S205中,对关联关系图进行剪枝处理,得到目标子图;目标子图包括目标对象、多个待推荐多媒体、目标历史多媒体和目标关键词,目标历史多媒体为多个历史多媒体中的至少一个,目标关键词可以为多个关键词中的至少一个。
本说明书实施例中,考虑到目标对象执行过预设行为的历史多媒体中存在目标对象不感兴趣的多媒体,例如在多视频的单列流式推荐场景中,用户点击过的视频不一定是用户喜欢的视频,导致关联关系图中用户与多媒体的交互信息存在冗余,这给捕捉用户兴趣增加了较多的噪声。基于此,本公开选择对关联关系图进行剪枝处理,以通过剪枝后的目标子图进行多媒体的推荐。
在一个示例中,目标历史多媒体与目标对象的关联度可以满足第一预设条件;目标关键词与目标历史多媒体的关联度可以满足第二预设条件。其中,目标历史多媒体与目标对象的关联度可以利用目标对象与目标历史多媒体的交互信息表征,相应地,第一预设条件可以是指交互信息大于或等于交互阈值,例如目标对象对目标历史多媒体的点击次数大于第一次数阈值。基于此,可以将目标对象点击次数低于第一次数阈值的历史多媒体删除,得到目标历史多媒体。
与上述类似,目标关键词与目标历史多媒体的关联度可以利用目标历史多媒体下目标关键词的频次来表征。相应地,第二预设条件可以是指关键词的频次大于或等于频次阈值,例如目标关键词在目标历史多媒体下出现的次数大于或等于第二次数阈值。基于此,可以获取每个历史多媒体关联的关键词(与历史多媒体具有边的关键词)在每个历史多媒体下出现的次数,可以将出现的次数小于第二次数阈值的关键词删除,从而将未删除的关键词作为目标关键词。本公开对第一次数阈值和第二次数阈值不作限定。这种通过相邻节点间的关联度进行的剪枝处理,可以实现对关联关系图的有效去噪。
进一步地,可以基于目标对象、多个待推荐多媒体、目标历史多媒体和目标关键词三种节点之间的关联关系,获取目标子图,如图3b所示,实现对关联关系图的剪枝处理。
在步骤S207中,基于目标历史多媒体和目标关键词,确定目标对象的第一对象特征。
为了有效地表征目标对象的特征,可以基于目标历史多媒体和目标关键词,通过将目标关键词的信息向目标历史多媒体传递、目标历史多媒体的信息向目标对象传递,使得目标对象可以基于目标历史多媒体和目标关键词,确定目标对象的第一对象特征,实现第一对象特征能够覆盖更加丰富的信息。在一个示例中,可以对目标历史多媒体和目标关键词进行聚合处理以得到第一对象特征,例如可以基于目标关键词的词特征确定每个目标历史多媒体的多媒体特征,从而可以对目标历史多媒体的多媒体特征进行加权或拼接处理,得到第一对象特征,本公开对加权和拼接处理不作限定。这里的聚合处理可以是基于注意力机制的聚合处理,可以参见下述S901~S905的方式,本公开对此不作限定。
在步骤S209中,根据多媒体特征和第一对象特征,确定多个待推荐多媒体的推荐信息。
实际应用中,推荐信息可以是推荐概率,或者可以是推荐分类信息,例如推荐或不推荐,本公开对此不作限定。在一个示例中,利用预先训练的推荐预测模型确定推荐信息,例如,该步骤S209可以包括以下步骤:
对多媒体特征和第一对象特征进行点积处理,得到关联特征;
根据关联特征,确定多个待推荐多媒体的推荐信息。
实际应用中,可以通过推荐预测模型对多媒体特征和第一对象特征进行点积处理,得到关联特征,并可以基于预设激活函数对关联特征进行处理,得到多个待推荐多媒体的推荐信息。通过机器学习模型确定推荐信息,可以提高推荐信息的效率和精度。
在步骤S211中,基于推荐信息,向目标对象推荐多个待推荐多媒体。
本说明书实施例中,可以基于推荐信息,从多个待推荐多媒体中选择出目标多媒体,向目标对象推荐目标多媒体;或者,可以基于推荐信息对多个待推荐多媒体进行排序,得到排序结果,可以基于排序结果,依次向目标对象推荐多个待推荐多媒体。本公开对此不作限定,只要能够保证与目标对象匹配度较高的待推荐多媒体能够被优先地推荐给目标用户即可。
通过在关联关系图中包括关键词等三种节点,充分利用了多媒体下的文本数据,提高对多媒体理解的同时,由于不需要实时抽取多媒体内容,还可以降低处理压力以及提高对多媒体理解的效率;并且,选择对关联关系图进行剪枝处理,使得剪枝后的目标子图中三种节点间的关联程度较高且图结构更加精简,能够对关联关系图中的关联关系进行有效去噪,从而可以提升对目标对象兴趣点的捕捉精度和效率,提升多媒体推荐的精度和效率,使得该多媒体推荐处理的适用场景的扩展性较佳。
图4是根据一示例性实施例示出的一种根据关联关系图中与多个待推荐多媒体具有关联关系的第一关键词,确定多个待推荐多媒体各自的多媒体特征的方法流程图。如图4所示,在一种可能的实现方式中,该步骤S203可以包括:
在步骤S401中,将多个待推荐多媒体和第一关键词输入第一注意力网络,得到第一关键词的第一权重信息;
在步骤S403中,根据第一权重信息对多个待推荐多媒体各自对应的第一关键词进行加权处理,得到多个待推荐多媒体各自的多媒体特征。
实际应用中,可以利用注意力机制神经网络对第一关键词进行聚合处理,得到基于第一关键词表征的多媒体特征。例如,可以将多个待推荐多媒体和第一关键词输入第一注意力网络,得到第一关键词的第一权重信息。这里输入的多个待推荐多媒体可以是多个待推荐多媒体的标识特征、第一关键词可以是第一关键词的词特征,本公开对此不作限定。
进一步地,可以根据第一权重信息对多个待推荐多媒体各自对应的第一关键词进行加权处理,得到多个待推荐多媒体各自的多媒体特征。举例来说,待推荐多媒体V1、与V1具有关联关系的第一关键词包括e1、e2、e5;e1、e2、e5在V1下的第一权重信息可以是0.3、0.8、0.5,e1、e2、e5各自对应的词特征可以是c1、c2、c5;进而V1的多媒体特征可以为0.3*c1+0.8*c2+0.5*c5。
其中,第一注意力网络可以是图注意力机制网络GAT(Graph AttentionNetwork),上述加权处理实现聚合的方式可以基于聚合函数(AGG(aggregation)函数)实现,本公开对此不作限定
通过注意力机制获取待推荐多媒体下第一关键词的第一权重信息,可以提高第一权重信息的精度和效率,从而可以提高多媒体特征的精度和效率。
图5是根据一示例性实施例示出的一种获取关联关系图的方法流程图。如图5所示,在一种可能的实现方式中,该步骤S201可以包括:
在步骤S501中,获取多个待推荐多媒体、目标对象执行过预设行为的多个历史多媒体、以及多个待推荐多媒体各自关联的第一文本信息和多个历史多媒体各自关联的第二文本信息。
本说明书实施例中,可以获取与目标对象有过交互的多个历史多媒体,例如目标对象执行过预设行为的多个历史多媒体。并可以获取与目标对象匹配的多个待推荐多媒体,比如通过召回方式,获取与目标对象的兴趣匹配的多媒体作为多个待推荐多媒体。进一步地,可以从多个待推荐多媒体和多个历史多媒体各自的主题、标签、话题和评论中获取各自关联的第一文本信息和第二文本信息。
在步骤S503中,分别对第一文本信息和第二文本信息进行分词处理,得到多个第一初始关键词和多个第二初始关键词。
实际应用中,可以利用分词工具分别对第一文本信息和第二文本信息进行分词处理,得到多个第一初始关键词和多个第二初始关键词。这里的分词工具可以是jieba分词工具(结巴分词工具),本公开对此不作限定。可选地,可以构建多媒体推荐场景下的词库,结合该词库进行上述分词处理,以提高分词精度。
在步骤S505中,确定多个第一初始关键词对于多个待推荐多媒体的第一重要程度信息、以及多个第二初始关键词对于多个历史多媒体的第二重要程度信息。
本说明书实施例中,可以基于TFIDF(term frequency–inverse documentfrequency,词频-逆文本频率指数)确定第一重要程度信息和第二重要程度信息。例如,可以利用下面公式(1)确定第一重要程度信息E_t(i,j):
Figure BDA0003202858640000121
其中,E_t(i,j)可以是指第j个待推荐多媒体关联的第一文本信息中第i个第一初始关键词对于该第j个待推荐多媒体的第一重要程度信息;
Figure BDA0003202858640000131
可以是指第j个待推荐多媒体关联的第一文本信息中第i个第一初始关键词在该第j个待推荐多媒体关联的第一文本信息中出现的次数;Cj可以是指第j个待推荐多媒体关联的第一文本信息中第一初始关键词的总数;V可以是指待推荐多媒体和历史多媒体的多媒体总数(即第一文本信息和第二文本信息的文本总数);Vi可以是指待推荐多媒体和历史多媒体中包括第i个第一初始关键词的多媒体数量,即第一文本信息和第二文本信息中包括第i个第一初始关键词的文本数量。
相应地,第二重要程度信息也可以根据第一重要程度信息相同的方式确定,在此不再赘述。
在步骤S507中,基于第一重要程度信息和第二重要程度信息,从多个第一初始关键词和多个第二初始关键词中筛选出多个关键词。
在一个示例中,可以基于第一重要程度信息和第二重要程度信息,分别对多个第一初始关键词和多个第二初始关键词进行排序,可以将排序靠前的第一初始关键词和第二初始关键词作为多个关键词。
在另一个示例中,可以从多个第一初始关键词和多个第二初始关键词中,筛选出第一重要程度信息和第二重要程度信息大于重要程度阈值的第一初始关键词和第二初始关键词,作为该多个关键词。
在步骤S509中,基于目标对象、多个历史多媒体、多个待推荐多媒体和多个关键词三种节点之间的关联关系,构建关联关系图。
本说明书实施例中,可以将目标对象、多个历史多媒体和多个待推荐多媒体、多个关键词设置为三种节点,如图3a所示,多媒体可以作为中间节点,关键词可以作为目标对象的二阶邻居节点、作为多媒体的一阶邻居节点。并可以基于目标对象、多个历史多媒体、多个待推荐多媒体和多个关键词三种节点之间的关联关系,构建相邻节点之间的边,从而可以构建关联关系图,如图3a所示。
通过关联关系图的建立,并基于初始关键词对于多媒体的重要程度对初始关键词进行筛选,使得筛选出的多个关键词与多媒体具有更强的关联关系,为后续通过关键词精准表征多媒体的特征提供了保障。
图6是根据一示例性实施例示出的一种对关联关系图进行剪枝处理,得到目标子图的方法流程图。如图6所示,在一种可能的实现方式中,该步骤S205可以包括:
在步骤S601中,确定多个历史多媒体各自在目标对象下的第一关联度信息、以及第二关键词在多个历史多媒体下的第二关联度信息;第二关键词为与多个历史多媒体具有关联关系的关键词;
在步骤S603中,基于第一关联度信息和第二关联度信息,对关联关系图中的边和/或节点进行剪枝处理,得到目标子图。
本说明书实施例中,第一预设条件和第二预设条件可以相同,例如可以为大于或等于关联度阈值;或者,第一预设条件和第二预设条件可以不相同,例如第一预设条件可以是指在第一关联度信息排序中处于第一预设数量的排序之前;第二预设条件可以是指在第二关联度信息排序中处于第二预设数量的排序之前。基于此,可以将小于关联度阈值的第一关联度信息和第二关联度信息对应的边均剪掉;或者,可以基于第一关联信息对多个历史多媒体进行排序,基于排序结果,从多个历史多媒体中保留第一预设数量的历史多媒体,例如可以按照排序从高至低,从多个历史多媒体中保留第一预设数量的历史多媒体;其中,排序越高,表征目标对象与历史多媒体的关联度越强。以及可以基于第二关联信息对多个第二关键词进行排序,基于排序结果,从多个第二关键词中保留第二预设数量的第二关键词,例如可以按照排序从高至低,从多个第二关键词中保留第二预设数量的第二关键词;其中,排序越高,表征第二关键词与历史多媒体的关联度越强。从而将保留的历史多媒体和第二关键词之外的历史多媒体和第二关键词对应的边删除。
进一步地,在对边进行剪枝后,可以将多个历史多媒体中与目标对象和第二关键词均没有边的历史多媒体删除、将多个关键词中与历史多媒体和待推荐多媒体均没有边的关键词删掉,从而得到目标子图,如图3b所示。
通过节点之间的关联程度对关联关系图进行剪枝,可以对关联关系图进行有效去噪,使得剪枝得到的目标子图能够更好地用于捕捉用户兴趣,进而可以提升推荐精度。
图7是根据一示例性实施例示出的一种确定多个历史多媒体各自在目标对象下的第一关联度信息、以及第二关键词在多个历史多媒体下的第二关联度信息的方法流程图。如图7所示,在一种可能的实现方式中,该步骤S601可以包括:
在步骤S701中,基于多个历史多媒体和第二关键词,确定目标对象的第二对象特征。
实际应用中,如图3b所示,可以利用关键词的词特征表征关联的多媒体的多媒体特征,再利用多媒体特征表征关联对象的对象特征,实现从右向左的信息传递。比如,可以利用一个历史多媒体关联的第二关键词的特征的和作为该一个历史多媒体的多媒体特征,然后将所有历史多媒体的多媒体特征的和作为目标对象的第二对象特征。
在一个示例中,如图8所示的剪枝网络可以包括第二注意力网络、第三注意力网络、第一关联度预测模型和第二关联度预测模型。需要说明的是,第二注意力网络和第三注意力网络均可以是图注意力机制网络。
如图8和图9所示,该步骤S701可以包括:
在步骤S901中,将多个历史多媒体和第二关键词输入第二注意力网络,得到第二关键词的第二权重信息;
在步骤S903中,将目标对象和多个历史多媒体输入第三注意力网络,得到多个历史多媒体的第三权重信息;
在步骤S905中,根据第二关键词、第二权重信息和第三权重信息,确定第二对象特征。
作为一个示例,可以利用下面公式(2)确定第二对象特征U2:
U2=Wm1*(W1*c1+W2*c2)+Wm2*(W3*c1+W4*c3+W5*c8) (2)
其中,历史多媒体包括m1和m2,W1和W2为m1关联的第二关键词e1和e2分别对应的第二权重信息,W3、W4和W5为为m2关联的第二关键词e1、e3和e5分别对应的第二权重信息;Wm1和Wm2为历史多媒体m1和m2各自的第三权重信息;e1、e2、e3和e5分别对应的词特征为c1、c2、c3和c5。
通过注意力机制确定关键词在多媒体下的权重以及多媒体在目标对象下的权重,可以更有效地捕捉与目标对象关联的多媒体和关键词,从而可以使得第二对象特征更精准;另外基于注意力机制的剪枝,在不同用户均留下相同的多媒体时,也可以使得不同用户关注相同多媒体的不同关键词,从而可以有效区别用户的兴趣。
在步骤S703中,将多个历史多媒体和第二对象特征输入第一关联度预测模型,对目标对象与多个历史多媒体之间的关联度进行预测处理,得到第一关联度信息和第一关联度预测模型中的门循环单元输出的中间特征信息;
在步骤S705中,将多个历史多媒体、第二关键词和中间特征信息输入第二关联度预测模型,对多个历史多媒体与第二关键词之间的关联度进行预测处理,得到第二关联度信息。
在一个示例中,第一关联度预测模型可以包括依次连接的门循环单元GRU(GateRecurrent Unit)、多层感知机MLP(Multilayer Perceptron)和分类器,该分类器可以基于Gumbel Softmax实现分类,本公开对此不作限定。第二关联度预测模型的结构与第一关联度预测模型的结构可以相同。
如图10所示,第一关联度预测模型可以包括依次连接的门循环单元1、多层感知机1和分类器1;第二关联度预测模型可以包括依次连接的门循环单元2、多层感知机2和分类器2。这里的第一关联度信息和第二关联度信息可以是0~1之间的数值,这样便于比较多媒体与关键词之间的关联程度、以及目标对象与多媒体之间的关联程度。其中,中间特征信息可以是门循环单元1的输出。
通过神经网络模型确定三种节点之间的关联程度,使得关联程度信息的确定更加高效,能够有效适应大数据处理和实时性要求较高的场景,进一步提升了该多媒体推荐处理的可扩展性;另外,通过第一关联度预测模型的中间特征信息作为第二关联度预测模型的输入,由于中间特征信息能够表征目标对象下各历史多媒体的第一关联度,使得第二关联度预测模型的输入中关于历史多媒体的信息更加丰富,从而可以提高第二关联度信息的精准度。
图11是根据一示例性实施例示出的一种第一关联度预测模型的训练方法流程图。如图11所示,在一种可能的实现方式中,可以包括:
在步骤S1101中,获取样本关联关系图以及标签信息,该样本关联关系图可以包括多个样本对象、多个样本多媒体和多个样本词三种样本节点以及相邻样本节点之间的边,多个样本多媒体为目标对象执行过预设行为的多媒体,相邻样本节点之间的边表征相邻样本节点之间具有关联关系,标签信息表征样本多媒体与样本对象的关联度。
实际应用中,可以获取多个样本对象以及该多个样本对象执行过预设行为的多媒体,例如可以获取十万用户在连续两天内点击多媒体的记录,可以从该记录中,获取多个样本对象和多个样本多媒体。对应样本词的获取方式和该样本关联关系图的构建可以参见上述步骤S201,在此不再赘述。标签信息可以是预先标注的0~1之间的数值,本公开对此不作限定。
在步骤S1103中,基于多个样本多媒体和样本词,确定多个样本对象各自的样本对象特征;该步骤的实现方式可以参见上述步骤S207,在此不再赘述。
在步骤S1105中,将多个样本多媒体和样本对象特征输入第一预设模型,对样本对象与多个样本多媒体之间的关联度进行预测处理,得到样本预测信息;该步骤的实现方式可以参见上述步骤S903,在此不再赘述。
在步骤S1107中,重复上述输入步骤直至预设次数,对预设次数对应的样本预测信息进行统计处理,得到目标样本预测信息。
实际应用中,为了提升第一关联度预测模型的稳定性,可以重复上述输入步骤S1205直至预设次数,对预设次数对应的样本预测信息进行统计处理,例如进行平均值处理,得到目标样本预测信息。
在步骤S1109中,根据目标样本预测信息和标签信息,确定损失信息。
本说明书实施例中,可以利用交叉熵损失函数确定损失信息,本公开对此不作限定。
在步骤S1111中,基于损失信息训练第一预设模型,得到第一关联度预测模型。
本说明书实施例中,可以基于损失信息确定梯度信息,从而基于梯度信息更新第一预设模型的模型参数,直至预设条件,将满足预设条件时的第一预设模型作为第一关联度预测模型。
在一个示例中,预设条件可以是验证结果连续一定次数不提升。例如,可以计算AUC(area under the curve,曲线下面积)等指标,这些可以反映模型的表现。在每轮(S1205~S1207)进行一次指标验证,当验证结果连续5次没有提升时,模型停止迭代。
可选地,在第一预设模型包括Gumbel Softmax的情况下,在模型训练初期可以设置较高的温度,并可以控制温度随迭代次数增多而逐渐降低,可以便于模型的有效学习。
通过在训练中对样本对象与多个样本多媒体之间的关联度的预测处理进行预设次数,对预设次数对应的样本预测信息进行统计处理,得到目标样本预测信息以用于损失信息的计算,使得损失信息更加精准,从而可以使得基于损失信息训练得到的第一关联度预测模型的预测结果更加精准。
图12是根据一示例性实施例示出的一种多媒体推荐装置框图。参照图12,该装置可以包括:
关联关系图获取模块1201,被配置为执行获取关联关系图,关联关系图包括目标对象、多个多媒体和多个关键词三种节点以及相邻节点之间的边,多个多媒体包括多个待推荐多媒体和目标对象执行过预设行为的多个历史多媒体,边表征相邻节点之间具有关联关系;
多媒体特征确定模块1203,被配置为执行根据关联关系图中与多个待推荐多媒体具有关联关系的第一关键词,确定多个待推荐多媒体各自的多媒体特征;
剪枝模块1205,被配置为执行对关联关系图进行剪枝处理,得到目标子图;目标子图包括目标对象、多个待推荐多媒体、目标历史多媒体和目标关键词,目标历史多媒体为多个历史多媒体中的至少一个,目标关键词为多个关键词中的至少一个;
第一对象特征确定模块1207,被配置为执行基于目标历史多媒体和目标关键词,确定目标对象的第一对象特征;
推荐信息确定模块1209,被配置为执行根据多媒体特征和第一对象特征,确定多个待推荐多媒体的推荐信息;
推荐模块1211,被配置为执行基于推荐信息,向目标对象推荐多个待推荐多媒体。
通过在关联关系图中包括关键词等三种节点,充分利用了多媒体下的文本数据,提高对多媒体理解的同时,由于不需要实时抽取多媒体内容,还可以降低处理压力以及提高对多媒体理解的效率;并且,选择对关联关系图进行剪枝处理,使得剪枝后的目标子图中三种节点间的关联程度较高且图结构更加精简,能够对关联关系图中的关联关系进行有效去噪,从而可以提升对目标对象兴趣点的捕捉精度和效率,提升多媒体推荐的精度和效率,使得该多媒体推荐处理的适用场景的扩展性较佳。
在一种可能的实现方式中,多媒体特征确定模块1203可以包括:
第一权重信息获取单元,被配置为执行将多个待推荐多媒体和第一关键词输入第一注意力网络,得到第一关键词的第一权重信息;
多媒体特征确定单元,被配置为执行根据第一权重信息对多个待推荐多媒体各自对应的第一关键词进行加权处理,得到多个待推荐多媒体各自的多媒体特征。
在一种可能的实现方式中,目标历史多媒体与目标对象的关联度满足第一预设条件;目标关键词与目标历史多媒体的关联度满足第二预设条件。
在一种可能的实现方式中,剪枝模块1205可以包括:
关联度确定单元,被配置为执行确定多个历史多媒体各自在目标对象下的第一关联度信息、以及第二关键词在多个历史多媒体下的第二关联度信息;第二关键词为与多个历史多媒体具有关联关系的关键词;
目标子图获取单元,被配置为执行基于第一关联度信息和第二关联度信息,对关联关系图中的边和/或节点进行剪枝处理,得到目标子图。
在一种可能的实现方式中,关联度确定单元可以包括:
第二对象特征确定子单元,被配置为执行基于多个历史多媒体和第二关键词,确定目标对象的第二对象特征;
第一关联度信息和中间特征信息获取子单元,被配置为执行将多个历史多媒体和第二对象特征输入第一关联度预测模型,对目标对象与多个历史多媒体之间的关联度进行预测处理,得到第一关联度信息和第一关联度预测模型中的门循环单元输出的中间特征信息;
第二关联度信息获取子单元,被配置为执行将多个历史多媒体、第二关键词和中间特征信息输入第二关联度预测模型,对多个历史多媒体与第二关键词之间的关联度进行预测处理,得到第二关联度信息。
在一种可能的实现方式中,上述第二对象特征确定子单元可以包括:
第二权重信息获取子单元,被配置为执行将多个历史多媒体和第二关键词输入第二注意力网络,得到第二关键词的第二权重信息;
第三权重信息获取子单元,被配置为执行将目标对象和多个历史多媒体输入第三注意力网络,得到多个历史多媒体的第三权重信息;
第二对象特征获取子单元,被配置为执行根据第二关键词、第二权重信息和第三权重信息,确定第二对象特征。
在一种可能的实现方式中,关联关系图获取模块1201可以包括:
节点信息获取单元,被配置为执行获取多个待推荐多媒体、目标对象执行过预设行为的多个历史多媒体、以及多个待推荐多媒体各自关联的第一文本信息和多个历史多媒体各自关联的第二文本信息;
分词处理单元,被配置为执行分别对第一文本信息和第二文本信息进行分词处理,得到多个第一初始关键词和多个第二初始关键词;
重要程度信息确定单元,被配置为执行确定多个第一初始关键词对于多个待推荐多媒体的第一重要程度信息、以及多个第二初始关键词对于多个历史多媒体的第二重要程度信息;
多个关键词筛选单元,被配置为执行基于第一重要程度信息和第二重要程度信息,从多个第一初始关键词和多个第二初始关键词中筛选出多个关键词;
关联关系图构建单元,被配置为执行基于目标对象、多个历史多媒体、多个待推荐多媒体和多个关键词三种节点之间的关联关系,构建关联关系图。
在一种可能的实现方式中,该装置还可以包括:
样本数据获取模块,被配置为执行获取样本关联关系图以及标签信息,样本关联关系图包括多个样本对象、多个样本多媒体和多个样本词三种样本节点以及相邻样本节点之间的边,多个样本多媒体为目标对象执行过预设行为的多媒体,相邻样本节点之间的边表征相邻样本节点之间具有关联关系,标签信息表征样本多媒体与样本对象的关联度;
样本对象特征确定模块,被配置为执行基于多个样本多媒体和样本词,确定多个样本对象各自的样本对象特征;
样本预测信息获取模块,被配置为执行将多个样本多媒体和样本对象特征输入第一预设模型,对样本对象与多个样本多媒体之间的关联度进行预测处理,得到样本预测信息;
目标样本预测信息获取模块,被配置为执行重复上述输入步骤直至预设次数,对预设次数对应的样本预测信息进行统计处理,得到目标样本预测信息;
损失信息确定模块,被配置为执行根据目标样本预测信息和标签信息,确定损失信息;
第一关联度预测模型获取模块,被配置为执行基于损失信息训练第一预设模型,得到第一关联度预测模型。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图13是根据一示例性实施例示出的一种用于多媒体推荐的电子设备的框图,该电子设备可以是服务器,其内部结构图可以如图13所示。该电子设备包括通过***总线连接的处理器、存储器和网络接口。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多媒体推荐的方法。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种电子设备,包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器被配置为执行该指令,以实现如本公开实施例中的多媒体推荐方法。
在示例性实施例中,还提供了一种计算机可读存储介质,当该计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开实施例中的多媒体推荐方法。计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例中的多媒体推荐的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种多媒体推荐方法,其特征在于,包括:
获取关联关系图,所述关联关系图包括目标对象、多个多媒体和多个关键词三种节点以及相邻节点之间的边,所述多个多媒体包括多个待推荐多媒体和所述目标对象执行过预设行为的多个历史多媒体,所述边表征所述相邻节点之间具有关联关系;
根据所述关联关系图中与所述多个待推荐多媒体具有关联关系的第一关键词,确定所述多个待推荐多媒体各自的多媒体特征;
对所述关联关系图进行剪枝处理,得到目标子图;所述目标子图包括所述目标对象、所述多个待推荐多媒体、目标历史多媒体和目标关键词,所述目标历史多媒体为所述多个历史多媒体中的至少一个,所述目标关键词为所述多个关键词中的至少一个;
基于所述目标历史多媒体和所述目标关键词,确定所述目标对象的第一对象特征;
根据所述多媒体特征和所述第一对象特征,确定所述多个待推荐多媒体的推荐信息;
基于所述推荐信息,向所述目标对象推荐所述多个待推荐多媒体。
2.根据权利要求1所述的多媒体推荐方法,其特征在于,所述根据所述关联关系图中与所述多个待推荐多媒体具有关联关系的第一关键词,确定所述多个待推荐多媒体各自的多媒体特征步骤包括:
将所述多个待推荐多媒体和所述第一关键词输入第一注意力网络,得到所述第一关键词的第一权重信息;
根据所述第一权重信息对所述多个待推荐多媒体各自对应的第一关键词进行加权处理,得到所述多个待推荐多媒体各自的所述多媒体特征。
3.根据权利要求1所述的多媒体推荐方法,其特征在于,所述目标历史多媒体与所述目标对象的关联度满足第一预设条件;所述目标关键词与所述目标历史多媒体的关联度满足第二预设条件。
4.根据权利要求1或3所述的多媒体推荐方法,其特征在于,所述对所述关联关系图进行剪枝处理,得到目标子图步骤包括:
确定所述多个历史多媒体各自在所述目标对象下的第一关联度信息、以及第二关键词在所述多个历史多媒体下的第二关联度信息;所述第二关键词为与所述多个历史多媒体具有关联关系的关键词;
基于所述第一关联度信息和所述第二关联度信息,对所述关联关系图中的边和/或节点进行剪枝处理,得到所述目标子图。
5.根据权利要求4所述的多媒体推荐方法,其特征在于,所述确定所述多个历史多媒体各自在所述目标对象下的第一关联度信息、以及第二关键词在所述多个历史多媒体下的第二关联度信息步骤包括:
基于所述多个历史多媒体和所述第二关键词,确定所述目标对象的第二对象特征;
将所述多个历史多媒体和所述第二对象特征输入第一关联度预测模型,对所述目标对象与所述多个历史多媒体之间的关联度进行预测处理,得到所述第一关联度信息和所述第一关联度预测模型中的门循环单元输出的中间特征信息;
将所述多个历史多媒体、所述第二关键词和所述中间特征信息输入第二关联度预测模型,对所述多个历史多媒体与所述第二关键词之间的关联度进行预测处理,得到所述第二关联度信息。
6.根据权利要求5所述的多媒体推荐方法,其特征在于,所述基于所述多个历史多媒体和所述第二关键词,确定所述目标对象的第二对象特征步骤包括:
将所述多个历史多媒体和所述第二关键词输入第二注意力网络,得到所述第二关键词的第二权重信息;
将所述目标对象和所述多个历史多媒体输入第三注意力网络,得到所述多个历史多媒体的第三权重信息;
根据所述第二关键词、所述第二权重信息和所述第三权重信息,确定所述第二对象特征。
7.一种多媒体推荐装置,其特征在于,包括:
关联关系图获取模块,被配置为执行获取关联关系图,所述关联关系图包括目标对象、多个多媒体和多个关键词三种节点以及相邻节点之间的边,所述多个多媒体包括多个待推荐多媒体和所述目标对象执行过预设行为的多个历史多媒体,所述边表征所述相邻节点之间具有关联关系;
多媒体特征确定模块,被配置为执行根据所述关联关系图中与所述多个待推荐多媒体具有关联关系的第一关键词,确定所述多个待推荐多媒体各自的多媒体特征;
剪枝模块,被配置为执行对所述关联关系图进行剪枝处理,得到目标子图;所述目标子图包括所述目标对象、所述多个待推荐多媒体、目标历史多媒体和目标关键词,所述目标历史多媒体为所述多个历史多媒体中的至少一个,所述目标关键词为所述多个关键词中的至少一个;
第一对象特征确定模块,被配置为执行基于所述目标历史多媒体和所述目标关键词,确定所述目标对象的第一对象特征;
推荐信息确定模块,被配置为执行根据所述多媒体特征和所述第一对象特征,确定所述多个待推荐多媒体的推荐信息;
推荐模块,被配置为执行基于所述推荐信息,向所述目标对象推荐所述多个待推荐多媒体。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的多媒体推荐方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至6中任一项所述的多媒体推荐方法。
10.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1至6中任一项所述的多媒体推荐方法。
CN202110908672.2A 2021-08-09 2021-08-09 多媒体推荐方法、装置、电子设备及存储介质 Active CN113792163B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110908672.2A CN113792163B (zh) 2021-08-09 2021-08-09 多媒体推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110908672.2A CN113792163B (zh) 2021-08-09 2021-08-09 多媒体推荐方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113792163A true CN113792163A (zh) 2021-12-14
CN113792163B CN113792163B (zh) 2022-12-27

Family

ID=79181534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110908672.2A Active CN113792163B (zh) 2021-08-09 2021-08-09 多媒体推荐方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113792163B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920527A (zh) * 2018-06-07 2018-11-30 桂林电子科技大学 一种基于知识图谱的个性化推荐方法
CN110659395A (zh) * 2019-08-14 2020-01-07 平安科技(深圳)有限公司 关系网络图谱构建方法、装置、计算机设备和存储介质
CN110795627A (zh) * 2019-10-28 2020-02-14 苏州跃盟信息科技有限公司 信息推荐方法及装置、电子设备
CN111708964A (zh) * 2020-05-27 2020-09-25 北京百度网讯科技有限公司 多媒体资源的推荐方法、装置、电子设备和存储介质
CN112035636A (zh) * 2020-08-28 2020-12-04 康键信息技术(深圳)有限公司 医疗问诊***的问答管理方法、装置、设备及存储介质
CN112313697A (zh) * 2018-06-21 2021-02-02 三星电子株式会社 用于生成描述角度增强的可解释的基于描述的推荐的***和方法
US20210117509A1 (en) * 2019-10-17 2021-04-22 Adobe Inc. Creating a knowledge graph based on text-based knowledge corpora
CN112765450A (zh) * 2020-12-24 2021-05-07 神策网络科技(北京)有限公司 推荐内容确定方法、装置及存储介质
CN112818251A (zh) * 2021-04-13 2021-05-18 腾讯科技(深圳)有限公司 视频推荐方法、装置、电子设备以及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920527A (zh) * 2018-06-07 2018-11-30 桂林电子科技大学 一种基于知识图谱的个性化推荐方法
CN112313697A (zh) * 2018-06-21 2021-02-02 三星电子株式会社 用于生成描述角度增强的可解释的基于描述的推荐的***和方法
CN110659395A (zh) * 2019-08-14 2020-01-07 平安科技(深圳)有限公司 关系网络图谱构建方法、装置、计算机设备和存储介质
US20210117509A1 (en) * 2019-10-17 2021-04-22 Adobe Inc. Creating a knowledge graph based on text-based knowledge corpora
CN110795627A (zh) * 2019-10-28 2020-02-14 苏州跃盟信息科技有限公司 信息推荐方法及装置、电子设备
WO2021082123A1 (zh) * 2019-10-28 2021-05-06 苏州跃盟信息科技有限公司 信息推荐方法及装置、电子设备
CN111708964A (zh) * 2020-05-27 2020-09-25 北京百度网讯科技有限公司 多媒体资源的推荐方法、装置、电子设备和存储介质
CN112035636A (zh) * 2020-08-28 2020-12-04 康键信息技术(深圳)有限公司 医疗问诊***的问答管理方法、装置、设备及存储介质
CN112765450A (zh) * 2020-12-24 2021-05-07 神策网络科技(北京)有限公司 推荐内容确定方法、装置及存储介质
CN112818251A (zh) * 2021-04-13 2021-05-18 腾讯科技(深圳)有限公司 视频推荐方法、装置、电子设备以及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘国梁等: "基于加权网络结构的冷门资源推荐算法", 《计算机工程与科学》 *

Also Published As

Publication number Publication date
CN113792163B (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
CN110598206B (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN110737801B (zh) 内容分类方法、装置、计算机设备和存储介质
CN112131350B (zh) 文本标签确定方法、装置、终端及可读存储介质
CN110795657B (zh) 文章推送及模型训练方法、装置、存储介质和计算机设备
CN113627447B (zh) 标签识别方法、装置、计算机设备、存储介质及程序产品
CN111651671B (zh) 用户对象推荐方法、装置、计算机设备和存储介质
CN111382361A (zh) 信息推送方法、装置、存储介质和计算机设备
EP3717984A1 (en) Method and apparatus for providing personalized self-help experience
CN111625715B (zh) 信息提取方法、装置、电子设备及存储介质
CN111783903B (zh) 文本处理方法、文本模型的处理方法及装置、计算机设备
CN116010684A (zh) 物品推荐方法、装置及存储介质
CN113051468B (zh) 一种基于知识图谱和强化学习的电影推荐方法及***
CN112989212A (zh) 媒体内容推荐方法、装置和设备及计算机存储介质
CN113761291A (zh) 标签分类的处理方法和装置
CN116975271A (zh) 文本相关性的确定方法、装置、计算机设备和存储介质
CN114693409A (zh) 产品匹配方法、装置、计算机设备、存储介质和程序产品
CN114329051A (zh) 数据信息识别方法、装置、设备、存储介质及程序产品
CN114329004A (zh) 数字指纹生成、数据推送方法、装置和存储介质
CN117095460A (zh) 基于长短时关系预测编码的自监督群体行为识别方法及其识别***
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
CN113792163B (zh) 多媒体推荐方法、装置、电子设备及存储介质
CN111552827B (zh) 标注方法和装置、行为意愿预测模型训练方法和装置
CN114329065A (zh) 视频标签预测模型的处理方法、视频标签预测方法和装置
CN113822291A (zh) 一种图像处理方法、装置、设备及存储介质
CN111091198A (zh) 一种数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant