CN112685578A - 一种多媒体信息内容提供方法及装置 - Google Patents

一种多媒体信息内容提供方法及装置 Download PDF

Info

Publication number
CN112685578A
CN112685578A CN202011559490.0A CN202011559490A CN112685578A CN 112685578 A CN112685578 A CN 112685578A CN 202011559490 A CN202011559490 A CN 202011559490A CN 112685578 A CN112685578 A CN 112685578A
Authority
CN
China
Prior art keywords
content
behavior
request
data
multimedia information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011559490.0A
Other languages
English (en)
Other versions
CN112685578B (zh
Inventor
刘亚虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202011559490.0A priority Critical patent/CN112685578B/zh
Publication of CN112685578A publication Critical patent/CN112685578A/zh
Application granted granted Critical
Publication of CN112685578B publication Critical patent/CN112685578B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种多媒体信息内容提供方法及装置。该方法在接收目标账户的内容提供请求后,根据内容提供请求获取所述目标账户的行为请求信息,将目标账户的行为请求信息输入已训练的兴趣模型,得到内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据;利用已训练的排序模型,对召回数据进行排序,并输出。该方法实现了推荐服务中账户行为数据和搜索服务中账户行为数据的相互借鉴,能够更加充分地覆盖用户需求,提高了用户体验。

Description

一种多媒体信息内容提供方法及装置
技术领域
本申请涉及通信技术领域,尤其涉及一种多媒体信息内容提供方法及装置。
背景技术
随着4G/5G移动互联网和智能手机的快速普及,以图文,短视频,直播为载体的多媒体内容生产越来越丰富,诞生了类似抖音、快手等以推荐技术为内容分发核心,个性化内容消费的公司。同时为了满足用户一些主动型搜索需求,基于短视频和直播的字面描述做了搜索引擎。
市面上内容行业的应用程序(Application,APP),搜索***和推荐***是分开的。推荐***的推荐服务解决用户探索型浏览需求,搜索***的搜索服务解决用户主动查询型需求。
然而,目前推荐服务中用户的行为数据与搜索服务中用户的行为数据,没有做到相互借鉴,使得在推荐服务或搜索服务中网页所展现的信息无法充分覆盖用户需求。
发明内容
本申请实施例提供一种多媒体信息内容提供方法及装置,解决了现有技术存在的上述问题,能够更加充分地覆盖用户需求,提高了用户体验。
第一方面,提供了一种多媒体信息内容提供方法,该方法可以包括:
接收目标账户的内容提供请求;
根据所述内容提供请求获取所述目标账户的行为请求信息,将所述目标账户的行为请求信息输入已训练的兴趣模型,得到所述内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据;
其中,所述行为请求信息至少包括本次请求操作的类型,所述本次请求操作的类型表征搜索请求行为或推荐请求行为,且当所述本次请求操作的类型表征搜索请求行为时,所述行为请求信息中还包括搜索关键词;所述兴趣模型是根据各账户的历史搜索行为数据和历史浏览行为数据训练得到的,所述兴趣模型的输入为所述目标账户的行为请求信息,输出为所述目标账户的兴趣标签,以及各兴趣标签对应的内容特征标签;
利用已训练的排序模型,对所述召回数据进行排序,并输出。
在一个可能的实现中,所述兴趣模型根据如下方式训练:
基于目标平台的内容标准知识库,对所述目标平台涉及的多媒体信息进行内容理解,得到多媒体信息的内容正排表,所述内容正排表包括各多媒体信息对应的内容特征标签;所述内容特征标签包括内容描述的主题词和相应的内容类目;所述目标平台涉及的多媒体信息包括推荐请求行为对应的多媒体信息和搜索请求行为对应的多媒体信息;
以及,对所述各账户输入的历史搜索关键词进行关键词分析,得到关键词特征列表,所述关键词特征列表包括历史关键词中的主题词、主题词类目和主题词类目等级;
根据所述各账户的历史搜索行为数据对应的关键词特征列表和搜索频次,以及历史浏览行为数据对应的内容正排表和浏览频次,确定所述各账户的兴趣标签;
基于所述各账户的兴趣标签和各兴趣标签与多媒体信息的内容特征标签的对应关系,对待训练的兴趣模型进行特征融合训练,得到所述目标平台的兴趣模型;
其中,所述兴趣模型包括所述各账户的兴趣标签对应的不同内容类目、相应内容类目对应的主题词类目和相应主题词类目等级间的对应关系。
在一个可能的实现中,基于目标平台的内容标准知识库,对所述目标平台涉及的多媒体信息进行内容理解,得到多媒体信息的内容正排表,包括:
利用所述目标平台的内容标准知识库,对所述目标平台中的内容理解样本的对应关系进行学***台的内容理解模型;其中,内容理解样本包括多媒体信息和多媒体信息的预设内容特征标签;所述内容标准知识库包括多媒体信息和相应多媒体信息的内容特征标签的对应关系;
利用学***台涉及的多媒体信息进行内容理解,得到每个多媒体信息的内容特征标签,并基于所述每个多媒体信息的内容特征标签生成内容正排表。
在一个可能的实现中,所述排序模型的训练过程包括:
利用所述各账户的历史搜索行为数据和历史浏览行为数据学***台中内容提供服务的服务关系和所述目标平台中内容提供服务输入的行为请求数据,从所述目标平台的服务响应数据库中筛选出召回数据;
其中,所述服务关系是指所述内容提供服务输入的行为请求数据与召回数据之间的特征匹配关系;
按照预设排序规则,对各召回数据进行排序:
根据排序结果和所述输入的行为请求数据对应的预设召回数据,调整所述排序模型的模型参数,直至确定所述排序模型的服务准确度达到设定值时,确定训练出排序模型。
在一个可能的实现中,按照预设排序规则,对各召回数据进行排序,包括:
按照所述目标平台关注的业务指标,对各召回数据进行排序。
在一个可能的实现中,得到所述内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据之后,所述方法还包括:
基于所述目标账户对所述召回数据的操作行为,以及所述操作行为操作的多媒体信息,获取所述目标账户的兴趣标签和所述操作行为操作的多媒体信息的内容特征标签的对应关系;
基于所述兴趣标签和所述操作行为操作的多媒体信息的内容特征标签的对应关系,对所述兴趣模型进行更新。
在一个可能的实现中,所述内容特征标签中的所述内容类目包括不同内容类目等级;
获得该内容特征标签对应的召回数据,包括:
获得该内容特征标签中不同内容类目等级的内容类目对应的召回数据。
第二方面,提供了一种多媒体信息内容提供装置,该装置可以包括:接收模块、获取模块、排序模块和输出模块;
所述接收模块,用于接收目标账户的内容提供请求;
所述获取模块,用于根据所述内容提供请求获取所述目标账户的行为请求信息,将所述目标账户的行为请求信息输入已训练的兴趣模型,得到所述内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据;
其中,所述行为请求信息至少包括本次请求操作的类型,所述本次请求操作的类型表征搜索请求行为或推荐请求行为,且当所述本次请求操作的类型表征搜索请求行为时,所述行为请求信息中还包括搜索关键词;
所述兴趣模型是根据各账户的历史搜索行为数据和历史浏览行为数据训练得到的,所述兴趣模型的输入为所述目标账户的行为请求信息,输出为所述目标账户的兴趣标签,以及各兴趣标签对应的内容特征标签;
所述排序模块,用于利用已训练的排序模型,对所述召回数据进行排序;
所述输出模块,用于输出携带排序后的召回数据的内容提供响应。
在一个可能的实现中,所述装置还包括第一训练模块;
所述第一训练模块,用于执行以下步骤:
基于目标平台的内容标准知识库,对所述目标平台涉及的多媒体信息进行内容理解,得到多媒体信息的内容正排表,所述内容正排表包括各多媒体信息对应的内容特征标签;所述内容特征标签包括内容描述的主题词和相应的内容类目;所述目标平台涉及的多媒体信息包括推荐请求行为对应的多媒体信息和搜索请求行为对应的多媒体信息;
以及,对所述各账户输入的历史搜索关键词进行关键词分析,得到关键词特征列表,所述关键词特征列表包括历史关键词中的主题词、主题词类目和主题词类目等级;
根据所述各账户的历史搜索行为数据对应的关键词特征列表和搜索频次,以及历史浏览行为数据对应的内容正排表和浏览频次,确定所述各账户的兴趣标签;
基于所述各账户的兴趣标签和各兴趣标签与多媒体信息的内容特征标签的对应关系,对待训练的兴趣模型进行特征融合训练,得到所述目标平台的兴趣模型;
其中,所述兴趣模型包括所述各账户的兴趣标签对应的不同内容类目、相应内容类目对应的主题词类目和相应主题词类目等级间的对应关系。
在一个可能的实现中,所述装置还包括生成模块;
所述获取模块,还用于利用所述目标平台的内容标准知识库,对所述目标平台中的内容理解样本的对应关系进行学***台的内容理解模型;其中,内容理解样本包括多媒体信息和多媒体信息的预设内容特征标签;所述内容标准知识库包括多媒体信息和相应多媒体信息的内容特征标签的对应关系;
以及,利用学***台涉及的多媒体信息进行内容理解,得到每个多媒体信息的内容特征标签;
所述生成模块,用于基于所述每个多媒体信息的内容特征标签,生成内容正排表。
在一个可能的实现中,所述装置还包括第二训练模块;
所述第二训练模块,用于执行以下步骤:
利用所述各账户的历史搜索行为数据和历史浏览行为数据学***台中内容提供服务的服务关系和所述目标平台中内容提供服务输入的行为请求数据,从所述目标平台的服务响应数据库中筛选出召回数据;
其中,所述服务关系是指所述内容提供服务输入的行为请求数据与召回数据之间的特征匹配关系;
按照预设排序规则,对各召回数据进行排序:
根据排序结果和所述输入的行为请求数据对应的预设召回数据,调整所述排序模型的模型参数,直至确定所述排序模型的服务准确度达到设定值时,确定训练出排序模型。
在一个可能的实现中,所述排序模块,具体用于按照所述目标平台关注的业务指标,对各召回数据进行排序。
在一个可能的实现中,所述装置还包括更新模块;
所述获取模块,还用于基于所述目标账户对所述召回数据的操作行为,以及所述操作行为操作的多媒体信息,获取所述目标账户的兴趣标签和所述操作行为操作的多媒体信息的内容特征标签的对应关系;
所述更新模块,用于基于所述兴趣标签和所述操作行为操作的多媒体信息的内容特征标签的对应关系,对所述兴趣模型进行更新。
在一个可能的实现中,所述内容特征标签中的所述内容类目包括不同内容类目等级;
所述获取模块,还用于获得该内容特征标签中不同内容类目等级的内容类目对应的召回数据。
第三方面,提供了一种电子设备,该电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的方法步骤。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一所述的方法步骤。
本发明实施例提供的多媒体信息内容提供方法,在接收目标账户的内容提供请求后,根据内容提供请求获取所述目标账户的行为请求信息,将目标账户的行为请求信息输入已训练的兴趣模型,得到内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据;其中,行为请求信息至少包括本次请求操作的类型,本次请求操作的类型表征搜索请求行为或推荐请求行为,且当所述本次请求操作的类型表征搜索请求行为时,行为请求信息中还包括搜索关键词;兴趣模型是根据各账户的历史搜索行为数据和历史浏览行为数据训练得到的,兴趣模型的输入为目标账户的行为请求信息,输出为目标账户的兴趣标签,以及各兴趣标签对应的内容特征标签;利用已训练的排序模型,对召回数据进行排序,并输出。该方法实现了推荐服务中账户行为数据和搜索服务中账户行为数据的相互借鉴,能够更加充分地覆盖用户需求,提高了用户体验。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1A为本发明实施例提供的一种多媒体信息内容提供方法的应用环境图;
图1B为本发明实施例提供的一种搜索推荐协同***的结构示意图;
图2为本发明实施例提供的一种多媒体信息内容提供方法的流程示意图;
图3A为本发明实施例提供的一种兴趣模型的训练方法的流程示意图;
图3B为本发明实施例提供的一种内容正排表和关键词特征列表的生成示意图;
图3C为本发明实施例提供的一种兴趣模型的结构示意图;
图3D为本发明实施例提供的一种排序模型的训练方法的流程示意图;
图4为本发明实施例提供的一种多媒体信息内容提供装置的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,并不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供的多媒体信息内容提供方法是针对垂直行业实施的,可以应用在图1A所示的***架构中。如图1A所示,该***包括服务器和终端。其中,垂直行业是指属于某一特定领域的行业,如电商行业、在线教育行业、汽车领域等。
服务器可以是云服务器,也可以是应用服务器。终端可以是具有显示屏的移动电话、智能电话、笔记本电脑、数字广播接收器、个人数字助理(PDA)、平板电脑(PAD)等用户设备(User Equipment,UE)、手持设备、车载设备、可穿戴设备等。
服务器可以包括搜索推荐协同***,本申请的多媒体信息内容提供方法应用在搜索推荐协同***中。
搜索推荐协同***,用于在搜索***为终端用户实现搜索服务时,为终端用户推荐曾浏览的相关多媒体信息;以及,在推荐***为终端用户实现推荐服务时,为终端用户推荐曾搜索的相关多媒体信息。即实现推荐场景下采用搜索词补充召回和搜索场景下采用账户兴趣推荐召回。
终端可以接收终端用户通过账户触发的内容提供请求,该内容提供请求可以包括携带搜索关键词的搜索服务请求和推荐服务请求;并向服务器发送上述接收的内容提供请求。
如图1B所示,服务器中的搜索推荐协同***接收内容提供请求,并根据内容提供请求,获取行为请求信息,如通过信息提取的方式,提取内容提供请求中的行为请求信息,其中,行为请求信息至少包括本次请求操作的类型,本次请求操作的类型表征搜索请求行为或推荐请求行为,且当本次请求操作的类型表征搜索请求行为时,行为请求信息中还包括搜索关键词;
将目标账户的行为请求信息输入已训练的兴趣模型,得到内容提供请求对应的内容特征标签;兴趣模型是根据各账户的历史搜索行为数据和历史浏览行为数据训练得到的,兴趣模型的输入为目标账户的行为请求信息,输出为目标账户的兴趣标签,以及各兴趣标签对应的内容特征标签;
查找目标平台涉及的多媒体信息,即目标平台的多媒体信息库,获得该内容特征标签对应的召回数据;
利用已训练的排序模型,对召回数据进行排序,并输出排序后的召回数据,即排序后的多媒体信息。
上述方案实现了推荐服务中账户行为数据和搜索服务中账户行为数据的相互借鉴,能够更加充分地覆盖用户需求,提高了用户体验。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图2为本发明实施例提供的一种多媒体信息内容提供方法的流程示意图。该方法的执行主体为搜索推荐协同***,如图2所示,该方法可以包括:
步骤210、接收目标账户的内容提供请求。
该内容提供请求用于指示提供该请求对应的多媒体信息,多媒体信息可以包括文本、声音和图像等形式的数据。例如直播视频、图集、短视频等均为多媒体数据。
内容提供请求可以是目标账户的搜索服务请求,也可以是目标账户的推荐服务请求。
步骤220、根据内容提供请求获取目标账户的行为请求信息,将目标账户的行为请求信息输入已训练的兴趣模型,得到内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据。
在执行该步骤之前,为了能够实现在推荐服务下,不仅提供推荐结果作为一部分召回数据,还可以提供账户输入的历史搜索关键词相关的多媒体信息作为补充召回数据;在搜索服务下,不仅提供搜索结果作为一部分召回数据,还可以提供账户兴趣标签对应的多媒体信息作为补充召回数据的技术效果,需要将推荐服务与搜索服务各自的服务日志进行协同统一建立兴趣模型,如图3A所示,兴趣模型的具体训练过程可以包括以下步骤:
步骤310、基于目标平台的内容标准知识库,对目标平台涉及的多媒体信息进行内容理解,得到多媒体信息的内容正排表。
具体实施中,如图3B所示,利用目标平台的内容标准知识库,对目标平台中的内容理解样本的对应关系进行学***台的内容理解模型。
其中,内容理解样本包括多媒体信息和多媒体信息的内容特征标签。内容标准知识库包括多媒体信息和相应多媒体信息的内容特征标签的对应关系。内容特征标签可以包括多媒体信息的内容描述的主题词、多媒体信息标识和内容类目等与多媒体信息相关的信息。
利用学***台涉及的多媒体信息进行内容理解,就可得到相应多媒体信息的内容特征标签;
其中,目标平台涉及的多媒体信息包括推荐请求行为对应的多媒体信息和搜索请求行为对应的多媒体信息。
基于每个多媒体信息的内容特征标签,生成内容正排表。
步骤320、对各账户输入的历史搜索关键词进行关键词分析,得到关键词特征列表,关键词特征列表包括历史关键词中的主题词、主题词类目和主题词类目等级。
具体实施中,如图3B所示,利用学***台的关键词分析模型,依次对目标平台中各账户输入的历史搜索关键词,得到每个历史搜索关键词的关键词特征,并基于每个历史搜索关键词的关键词特征,生成关键词特征列表;其中,关键词分析模型是通过对目标平台中的预设搜索关键词与相应预设的关键词特征样本进行学习得到的。
例如,历史搜索关键词为“苹果手机的价格”;
将“苹果手机的价格”输入关键词分析模型,关键词分析模型对该“苹果手机的价格”进行关键词分析,得到主题词为“苹果手机”;主题词类目为手机类;主题词类目等级为该手机类目下的二级类目。
可以理解的是,还可以通过自然语言处理(Natural Language Processing,NLP)算法等语义分析方法,对各账户输入的历史搜索关键词进行关键词分析,具体分析方式本发明实施例在此不做限定。
需要说明的是,步骤310与步骤320的执行间没有先后顺序,即也可以先执行步骤320再执行步骤330,具体执行顺序可根据实际需要进行设置,本发明实施例再次不做限定。
步骤330、根据各账户的历史搜索行为数据对应的关键词特征列表和搜索频次,以及历史浏览行为数据对应的内容正排表和浏览频次,确定各账户的兴趣标签。
具体实施中,获取目标平台中各账户的历史行为日志,其包括各账户的历史搜索行为数据和历史浏览行为数据;
其中,历史搜索行为数据包括账户的搜索行为对应的曾搜索的多媒体信息和对相应多媒体信息的操作信息。操作信息可以包括搜索次数、搜索时长等信息。以及,历史浏览行为数据账户的浏览行为对应的曾浏览的多媒体信息和对相应多媒体信息的操作信息。操作信息可以包括浏览次数、浏览时长、忽略等信息。
利用关键词分析模型对历史搜索行为数据输入的搜索关键词进行关键词分析,得到关键词特征列表和搜索频次;
以及,利用内容理解模型对历史浏览行为数据中浏览的多媒体信息进行内容特征分析,得到内容正排表和浏览频次;
基于关键词特征列表和相应搜索频次,以及内容正排表和相应浏览频次,确定各账户的行为偏好的特征,即各账户的兴趣标签。
例如,若账户经常浏览美食类的多媒体信息,或者经常搜索美妆类的多媒体信息,则表明该账户对美食类的多媒体信息或美妆类的多媒体信息感兴趣。
步骤340、基于各账户的兴趣标签和各兴趣标签与多媒体信息的内容特征标签的对应关系,对待训练的兴趣模型进行训练,得到目标平台的兴趣模型。
利用各账户的关键词特征列表和内容正排表中内容类目、相应内容类目所属的主题词类目和相应主题词类目等级,采用统计的方法,对待训练的兴趣模型进行特征融合训练,得到目标平台的兴趣模型。
也就是说,该兴趣模型包括各账户的兴趣标签与内容特征标签的对应关系,即各账户的兴趣标签与不同内容类目、相应内容类目所属的主题词类目和相应主题词类目等级间的对应关系。
其中,如图3C所示,各账户的兴趣标签可以存储在兴趣模型的账户兴趣标签集中,可以以账户信息,如账户标识与不同兴趣标签的对应关系的形式存在,如账户A与兴趣标签a和兴趣标签b对应,账户B与兴趣标签x和兴趣标签y对应。
各内容特征标签可以存储在兴趣模型的内容特征标签集中,可以以每个兴趣标签与相应内容特征标签的对应关系的形式存在,如兴趣标签a与内容特征标签1和内容特征标签2对应,兴趣标签b与内容特征标签3对应,兴趣标签x与内容特征标签4对应,兴趣标签y与内容特征标签5对应。
需要说明的是,图3C所示的兴趣模型的结构只是一种表现形式,还可以存在其他形式的结构来实现兴趣模型的模型功能,本发明实施例在此不做限定。
可选地,可采用搜索频次和浏览频次,对兴趣模型中的对应关系进行排序。
在一个例子中,某一账户在一段时间内,曾经搜索过的历史搜索关键词包括:
q=四川旅游,q=花木兰壁纸,q=新宿事件,q=金刚川,q=风犬少年的天空,q-马拉多纳,q=王者荣耀;
同时,该账户在一段时间内,曾经浏览过的多媒体信息的主题词包括:
Title=1800元买一堆海鲜,请朋友吃海鲜大餐;
Title=教你如何拍出旅行大片;云南大理七日游晒照片;
Title=全世界都知道他要投篮,乔丹十大经典镜头;
Title=去哈尔滨雪乡旅游的朋友注意。真实的驴友经历;
进一步的,把搜索服务和推荐服务的行为做联合建模,映射到不同主题词类目等级,具体为,基于上述历史搜索关键词和曾浏览的多媒体信息,获取关键词特征列表和内容正排表;
并基于获取的关键词特征列表和内容正排表中的内容类目、相应内容类目所属的主题词类目和相应主题词类目等级进行联合建模,得到该账户的兴趣模型。
其中,该账户的兴趣模型至少包括以下对应关系:
旅行-国内游-四川/哈尔滨/云南大理(频次为12.8);
电影-亚洲电影-新宿事件/金刚川/风犬少年的天空(频次为10.7);
运动-足球-马拉多纳(频次为4.2);
运动-NBA-乔丹(频次为4.1);
游戏-***-王者荣耀(频次为3.8);
美食-中国美食-海鲜(频次为3.6)。
由此回到步骤220,根据内容提供请求,获取该请求中目标账户的行为请求信息;其中,行为请求信息至少包括本次请求操作的类型,还包括账户信息,且该本次请求操作的类型表征搜索请求行为或推荐请求行为。
当本次请求操作的类型表征搜索请求行为时,行为请求信息中还包括搜索关键词。
如图3C所示,将获取的目标账户的行为请求信息输入兴趣模型中,兴趣模型基于该行为请求信息查找兴趣模型中账户兴趣标签集中目标账户的兴趣标签;基于查找到的兴趣标签,获取兴趣模型中内容特征标签集中该兴趣标签对应的内容特征标签,并输出内容提供请求对应的内容特征标签;
基于内容特征标签,查找目标平台涉及的多媒体信息,获得该内容特征标签对应的召回数据,即该内容特征标签对应的多媒体信息。
步骤230、利用已训练的排序模型,对召回数据进行排序,并输出。
在执行该步骤之前,可以按照图3D所示的流程训练得到排序模型,该流程包括以下步骤:
步骤3001、利用各账户的历史搜索行为数据和历史浏览行为数据学***台中内容提供服务的服务关系和目标平台中内容提供服务输入的行为请求数据,从目标平台的服务响应数据库中筛选出召回数据。
其中,内容提供服务的服务关系是指内容提供服务输入的行为请求数据与召回数据之间的特征匹配关系。
步骤3002、按照预设排序规则,对各召回数据进行排序。
具体实施时,可以按照预设的热度、发布时间、与服务输入数据之间的匹配度等规则,对各召回数据进行排序,进而可按照热度、匹配度从高到低的顺序,或按照发布时间与当前时间的时间段从小到大的顺序,对各召回数据进行排序。
此外,为了满足目标平台的业务要求,预设排序规则可以为目标平台关注的业务指标值从大到小的顺序规则,或从小到大的顺序规则;
其中,目标平台关注的业务指标可以包括账户满意度、浏览时长、网站交易金额(Gross Merchandise Volume,GMV)、流量(Page View,PV)和关注量等。
故,按照预设排序规则,对各召回数据进行排序,包括:
按照目标平台关注的业务指标,对各召回数据进行排序。
进一步的,为了满足目标平台的业务要求和账户兴趣,还可以获取兴趣模型中目标账户对召回数据中每个召回数据的操作频次,以及每个召回数据对应的频次概率;
其中,该操作频次可以是根据实际业务需求确定的搜索频次或浏览频次,还可以是根据实际业务需求确定的搜索频次和浏览频次的频次总和,相应的频次概率可以是搜索频次概率或浏览频次概率或频次总和对应的概率。
之后,可以基于每个召回数据对应的频次概率和目标平台关注的业务指标,对各召回数据进行排序。
在一些实施例中,可筛选出各召回数据对应的频次概率中频次概率大于预设概率阈值的召回数据,并将大于预设概率阈值的召回数据,按照目标平台关注的业务指标从大到小的顺序规则进行排序。
步骤3003、根据排序结果和输入的行为请求数据对应的预设召回数据,调整所述排序模型的模型参数,直至确定排序模型的服务准确度达到设定值时,确定训练出排序模型。
回到步骤230,利用上述训练出的排序模型,对召回数据进行排序,并输出。
进一步的,内容特征标签中的内容类目可以包括不同内容类目等级。
例如,美妆类目可以包括口红类目、粉底类目。其中,美妆类目为一级类目,口红类目和粉底类目分别为美妆类目下的二级类目;
故,若内容类目为美妆类目,则该内容类目的类目等级为一级类目;
若内容类目为口红类目或粉底类目,则该内容类目的类目等级为美妆类目下的二级类目;
此外,若内容类目为口红的制作类目,则该内容类目的类目等级为口红类目下的三级类目;
也就是说,根据不同内容类目等级,可以得到该内容特征标签中不同内容类目等级的内容类目对应的召回数据。
由此,训练出的排序模型不仅可以按照预设排序规则,对得到的召回数据进行排序,在一些具体实施例中还可以按照不同内容类目等级,对得到的召回数据进行排序。例如,按照内容类目等级从高到底,或从底到高的顺序进行排序。其中,具体的排序方式可根据目标平台的实际业务需要对排序模型进行训练,本发明实施例在此不做限定。
在一些具体的实施例中,利用上述训练出的排序模型,对召回数据进行排序之后,可以按照需求,对排序后的召回数据进行数量删减,得到预设数量个排序后的召回数据,并输出。
其中,若对排序后的召回数据进行数量删减的依据是按照目标平台关注的业务指标值进行的数量删减,则相应的预设数量个排序后的召回数据是目标平台关注的业务指标值最大的预设数量个召回数据;
若对排序后的召回数据进行数量删减的依据是按照内容类目等级的高低顺序进行的数量删减,则相应的预设数量个排序后的召回数据是内容类目等级最高的预设数量个召回数据;
若对排序后的召回数据进行数量删减的依据是按照近期关注量的高低顺序进行的数量删减,则相应的预设数量个排序后的召回数据是近期关注量最高的预设数量个召回数据;
需要说明的是,还可以包括除上述三种数量删减方式外的其他方式,本发明实施例在此不做限定。
在一个可选的实施例中,为了进一步满足用户的需求,在获得该内容特征标签对应的召回数据之后,还可以获取目标账户对召回数据的操作行为和操作行为操作的多媒体信息;
基于目标账户对召回数据的操作行为,以及操作行为操作的多媒体信息,获取目标账户的兴趣标签和操作行为操作的多媒体信息的内容特征标签的对应关系;
基于该兴趣标签和操作行为操作的多媒体信息的内容特征标签的对应关系,对该兴趣模型进行更新。
具体实施中,实时获取目标账户对召回数据的操作行为,如点击浏览行为和操作的多媒体信息,并进行日志存储;
对该操作行为进行分析,如频次分析、对操作行为对应的搜索关键词进行关键词分析,以及对操作的多媒体信息进行内容理解,得到目标账户的兴趣标签、搜索关键词对应的关键词特征和操作的多媒体信息对应的内容特征标签;
按照不同的时间粒度,如分钟粒度或小时粒度,对兴趣模型中目标账户的兴趣标签、相应兴趣标签对应的内容特征标签和关键词特征进行更新,如替换、增加和删除。
其中,需要根据实际的业务需求,设置更新兴趣模型的时间粒度。
本发明实施例提供的多媒体信息内容提供方法,在接收目标账户的内容提供请求后,根据内容提供请求获取所述目标账户的行为请求信息,将目标账户的行为请求信息输入已训练的兴趣模型,得到内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据;其中,行为请求信息至少包括本次请求操作的类型,本次请求操作的类型表征搜索请求行为或推荐请求行为,且当所述本次请求操作的类型表征搜索请求行为时,行为请求信息中还包括搜索关键词;兴趣模型是根据各账户的历史搜索行为数据和历史浏览行为数据训练得到的,兴趣模型的输入为目标账户的行为请求信息,输出为目标账户的兴趣标签,以及各兴趣标签对应的内容特征标签;利用已训练的排序模型,对召回数据进行排序,并输出。该方法实现了推荐服务中账户行为数据和搜索服务中账户行为数据的相互借鉴,能够更加充分地覆盖用户需求,提高了用户体验。
基于同一发明构思,本发明实施例提供以下的设备和介质。
与上述方法对应的,本发明实施例还提供一种多媒体信息内容提供装置,如图4所示,该多媒体信息内容提供装置40包括:接收模块410、获取模块420、排序模块430和输出模块440;
接收模块410,用于接收目标账户的内容提供请求;
获取模块420,用于根据所述内容提供请求获取所述目标账户的行为请求信息,将所述目标账户的行为请求信息输入已训练的兴趣模型,得到所述内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据;
其中,所述行为请求信息至少包括本次请求操作的类型,所述本次请求操作的类型表征搜索请求行为或推荐请求行为,且当所述本次请求操作的类型表征搜索请求行为时,所述行为请求信息中还包括搜索关键词;
所述兴趣模型是根据各账户的历史搜索行为数据和历史浏览行为数据训练得到的,所述兴趣模型的输入为所述目标账户的行为请求信息,输出为所述目标账户的兴趣标签,以及各兴趣标签对应的内容特征标签;
排序模块430,用于利用已训练的排序模型,对所述召回数据进行排序;
输出模块440,用于输出携带排序后的召回数据的内容提供响应。
在一个可能的实现中,所述装置还包括第一训练模块540;
第一训练模块450,用于执行以下步骤:
基于目标平台的内容标准知识库,对所述目标平台涉及的多媒体信息进行内容理解,得到多媒体信息的内容正排表,所述内容正排表包括各多媒体信息对应的内容特征标签;所述内容特征标签包括内容描述的主题词和相应的内容类目;所述目标平台涉及的多媒体信息包括推荐请求行为对应的多媒体信息和搜索请求行为对应的多媒体信息;
以及,对所述各账户输入的历史搜索关键词进行关键词分析,得到关键词特征列表,所述关键词特征列表包括历史关键词中的主题词、主题词类目和主题词类目等级;
根据所述各账户的历史搜索行为数据对应的关键词特征列表和搜索频次,以及历史浏览行为数据对应的内容正排表和浏览频次,确定所述各账户的兴趣标签;
基于所述各账户的兴趣标签和各兴趣标签与多媒体信息的内容特征标签的对应关系,对待训练的兴趣模型进行特征融合训练,得到所述目标平台的兴趣模型;
其中,所述兴趣模型包括所述各账户的兴趣标签对应的不同内容类目、相应内容类目对应的主题词类目和相应主题词类目等级间的对应关系。
在一个可能的实现中,所述装置还包括生成模块460;
获取模块420,还用于利用所述目标平台的内容标准知识库,对所述目标平台中的内容理解样本的对应关系进行学***台的内容理解模型;其中,内容理解样本包括多媒体信息和多媒体信息的预设内容特征标签;所述内容标准知识库包括多媒体信息和相应多媒体信息的内容特征标签的对应关系;
以及,利用学***台涉及的多媒体信息进行内容理解,得到每个多媒体信息的内容特征标签;
生成模块460,用于基于所述每个多媒体信息的内容特征标签,生成内容正排表。
在一个可能的实现中,所述装置还包括第二训练模块470;
第二训练模块470,用于执行以下步骤:
利用所述各账户的历史搜索行为数据和历史浏览行为数据学***台中内容提供服务的服务关系和所述目标平台中内容提供服务输入的行为请求数据,从所述目标平台的服务响应数据库中筛选出召回数据;其中,所述服务关系是指所述内容提供服务输入的行为请求数据与召回数据之间的特征匹配关系;
按照预设排序规则,对各召回数据进行排序:
根据排序结果和所述输入的行为请求数据对应的预设召回数据,调整所述排序模型的模型参数,直至确定所述排序模型的服务准确度达到设定值时,确定训练出排序模型。
在一个可能的实现中,排序模块430,具体用于按照所述目标平台关注的业务指标,对各召回数据进行排序。
在一个可能的实现中,所述装置还包括更新模块480;
获取模块420,还用于基于所述目标账户对所述召回数据的操作行为,以及所述操作行为操作的多媒体信息,获取所述目标账户的兴趣标签和所述操作行为操作的多媒体信息的内容特征标签的对应关系;
更新模块480,用于基于所述兴趣标签和所述操作行为操作的多媒体信息的内容特征标签的对应关系,对所述兴趣模型进行更新。
在一个可能的实现中,所述内容特征标签中的所述内容类目包括不同内容类目等级;
获取模块420,还用于获得该内容特征标签中不同内容类目等级的内容类目对应的召回数据。
本发明上述实施例提供的多媒体信息内容提供装置的各功能单元的功能,可以通过上述各方法步骤来实现,因此,本发明实施例提供的多媒体信息内容提供装置中的各个单元的具体工作过程和有益效果,在此不复赘述。
图5是根据一示例性实施例示出的一种电子设备的硬件结构示意图。如图5所示,电子设备50包括但不限于:射频单元51、网络模块52、音频输出单元53、输入单元54、传感器55、显示单元56、用户输入单元57、接口单元58、存储器59、处理器510、以及电源511等部件。
本领域技术人员可以理解,图5中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本公开实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器510,耦合到存储器,用于:
接收目标账户的内容提供请求;
根据所述内容提供请求获取所述目标账户的行为请求信息,将所述目标账户的行为请求信息输入已训练的兴趣模型,得到所述内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据;
其中,所述行为请求信息至少包括本次请求操作的类型,所述本次请求操作的类型表征搜索请求行为或推荐请求行为,且当所述本次请求操作的类型表征搜索请求行为时,所述行为请求信息中还包括搜索关键词;
所述兴趣模型是根据各账户的历史搜索行为数据和历史浏览行为数据训练得到的,所述兴趣模型的输入为所述目标账户的行为请求信息,输出为所述目标账户的兴趣标签,以及各兴趣标签对应的内容特征标签;
利用已训练的排序模型,对所述召回数据进行排序,并输出。
在一个可能的实现中,所述兴趣模型根据如下方式训练:
基于目标平台的内容标准知识库,对所述目标平台涉及的多媒体信息进行内容理解,得到多媒体信息的内容正排表,所述内容正排表包括各多媒体信息对应的内容特征标签;所述内容特征标签包括内容描述的主题词和相应的内容类目;所述目标平台涉及的多媒体信息包括推荐请求行为对应的多媒体信息和搜索请求行为对应的多媒体信息;以及,
对所述各账户输入的历史搜索关键词进行关键词分析,得到关键词特征列表,所述关键词特征列表包括历史关键词中的主题词、主题词类目和主题词类目等级;
根据所述各账户的历史搜索行为数据对应的关键词特征列表和搜索频次,以及历史浏览行为数据对应的内容正排表和浏览频次,确定所述各账户的兴趣标签;
基于所述各账户的兴趣标签和各兴趣标签与多媒体信息的内容特征标签的对应关系,对待训练的兴趣模型进行特征融合训练,得到所述目标平台的兴趣模型;
其中,所述兴趣模型包括所述各账户的兴趣标签对应的不同内容类目、相应内容类目对应的主题词类目和相应主题词类目等级间的对应关系。
在一个可能的实现中,基于目标平台的内容标准知识库,对所述目标平台涉及的多媒体信息进行内容理解,得到多媒体信息的内容正排表,包括:
利用所述目标平台的内容标准知识库,对所述目标平台中的内容理解样本的对应关系进行学***台的内容理解模型;
其中,内容理解样本包括多媒体信息和多媒体信息的预设内容特征标签;所述内容标准知识库包括多媒体信息和相应多媒体信息的内容特征标签的对应关系;
利用学***台涉及的多媒体信息进行内容理解,得到每个多媒体信息的内容特征标签,并基于所述每个多媒体信息的内容特征标签生成内容正排表。
在一个可能的实现中,所述排序模型的训练过程包括:
利用所述各账户的历史搜索行为数据和历史浏览行为数据学***台中内容提供服务的服务关系和所述目标平台中内容提供服务输入的行为请求数据,从所述目标平台的服务响应数据库中筛选出召回数据;
其中,所述服务关系是指所述内容提供服务输入的行为请求数据与召回数据之间的特征匹配关系;
按照预设排序规则,对各召回数据进行排序:
根据排序结果和所述输入的行为请求数据对应的预设召回数据,调整所述排序模型的模型参数,直至确定所述排序模型的服务准确度达到设定值时,确定训练出排序模型。
在一个可能的实现中,按照预设排序规则,对各召回数据进行排序,包括:
按照所述目标平台关注的业务指标,对各召回数据进行排序。
在一个可能的实现中,得到所述内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据之后,所述方法还包括:
基于所述目标账户对所述召回数据的操作行为,以及所述操作行为操作的多媒体信息,获取所述目标账户的兴趣标签和所述操作行为操作的多媒体信息的内容特征标签的对应关系;
基于所述兴趣标签和所述操作行为操作的多媒体信息的内容特征标签的对应关系,对所述兴趣模型进行更新。
在一个可能的实现中,所述内容特征标签中的所述内容类目包括不同内容类目等级;
获得该内容特征标签对应的召回数据,包括:
获得该内容特征标签中不同内容类目等级的内容类目对应的召回数据。
存储器59,用于存储可在处理器510上运行的计算机程序,该计算机程序被处理器510执行时,实现处理器510所实现的上述功能。
应理解的是,本公开实施例中,射频单元51可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510处理;另外,将上行的数据发送给基站。通常,射频单元51包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元51还可以通过无线通信***与网络和其他设备通信。
电子设备通过网络模块52为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元53可以将射频单元51或网络模块52接收的或者在存储器59中存储的音频数据转换成音频信号并且输出为声音。
而且,音频输出单元53还可以提供与电子设备50执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元53包括扬声器、蜂鸣器以及受话器等。
输入单元54用于接收音频或视频信号。输入单元54可以包括图形处理器(Graphics Processing Unit,GPU)541和麦克风542,图形处理器541对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元56上。经图形处理器541处理后的图像帧可以存储在存储器59(或其它存储介质)中或者经由射频单元51或网络模块52进行发送。麦克风542可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元51发送到移动通信基站的格式输出。
电子设备50还包括至少一种传感器55,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板561的亮度,接近传感器可在电子设备50移动到耳边时,关闭显示面板561和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器55还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元56用于显示由用户输入的信息或提供给用户的信息。显示单元56可包括显示面板561,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板561。
用户输入单元57可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元57包括触控面板571以及其他输入设备572。触控面板571,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板571上或在触控面板571附近的操作)。触控面板571可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器510,接收处理器510发来的命令并加以执行。
此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板571。除了触控面板571,用户输入单元57还可以包括其他输入设备572。具体地,其他输入设备572可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板571可覆盖在显示面板561上,当触控面板571检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板561上提供相应的视觉输出。虽然在图5中,触控面板571与显示面板561是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板571与显示面板561集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元58为外部装置与电子设备50连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元58可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备50内的一个或多个元件或者可以用于在电子设备50和外部装置之间传输数据。
存储器59可用于存储软件程序以及各种数据。存储器59可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。
此外,存储器59可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器59内的软件程序和/或模块,以及调用存储在存储器59内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
电子设备50还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理***与处理器510逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。
另外,电子设备50包括一些未示出的功能模块,在此不再赘述。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由于上述实施例中电子设备的各器件解决问题的实施方式以及有益效果可以参见图2所示的实施例中的各步骤来实现,因此,本发明实施例提供的电子设备的具体工作过程和有益效果,在此不复赘述。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的多媒体信息内容提供方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的多媒体信息内容提供方法。
本领域内的技术人员应明白,本申请实施例中的实施例可提供为方法、***、或计算机程序产品。因此,本申请实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例中是参照根据本申请实施例中实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例中实施例进行各种改动和变型而不脱离本申请实施例中实施例的精神和范围。这样,倘若本申请实施例中实施例的这些修改和变型属于本申请实施例中权利要求及其等同技术的范围之内,则本申请实施例中也意图包含这些改动和变型在内。

Claims (10)

1.一种多媒体信息内容提供方法,其特征在于,所述方法包括:
接收目标账户的内容提供请求;
根据所述内容提供请求获取所述目标账户的行为请求信息,将所述目标账户的行为请求信息输入已训练的兴趣模型,得到所述内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据;其中,所述行为请求信息至少包括本次请求操作的类型,所述本次请求操作的类型表征搜索请求行为或推荐请求行为,且当所述本次请求操作的类型表征搜索请求行为时,所述行为请求信息中还包括搜索关键词;所述兴趣模型是根据各账户的历史搜索行为数据和历史浏览行为数据训练得到的,所述兴趣模型的输入为所述目标账户的行为请求信息,输出为所述目标账户的兴趣标签,以及各兴趣标签对应的内容特征标签;
利用已训练的排序模型,对所述召回数据进行排序,并输出。
2.如权利要求1所述的方法,其特征在于,所述兴趣模型根据如下方式训练:
基于目标平台的内容标准知识库,对所述目标平台涉及的多媒体信息进行内容理解,得到多媒体信息的内容正排表,所述内容正排表包括各多媒体信息对应的内容特征标签;所述内容特征标签包括内容描述的主题词和相应的内容类目;所述目标平台涉及的多媒体信息包括推荐请求行为对应的多媒体信息和搜索请求行为对应的多媒体信息;以及,
对所述各账户输入的历史搜索关键词进行关键词分析,得到关键词特征列表,所述关键词特征列表包括历史关键词中的主题词、主题词类目和主题词类目等级;
根据所述各账户的历史搜索行为数据对应的关键词特征列表和搜索频次,以及历史浏览行为数据对应的内容正排表和浏览频次,确定所述各账户的兴趣标签;
基于所述各账户的兴趣标签和各兴趣标签与多媒体信息的内容特征标签的对应关系,对待训练的兴趣模型进行特征融合训练,得到所述目标平台的兴趣模型;其中,所述兴趣模型包括所述各账户的兴趣标签对应的不同内容类目、相应内容类目对应的主题词类目和相应主题词类目等级间的对应关系。
3.如权利要求2所述的方法,其特征在于,基于目标平台的内容标准知识库,对所述目标平台涉及的多媒体信息进行内容理解,得到多媒体信息的内容正排表,包括:
利用所述目标平台的内容标准知识库,对所述目标平台中的内容理解样本的对应关系进行学***台的内容理解模型;其中,内容理解样本包括多媒体信息和多媒体信息的预设内容特征标签;所述内容标准知识库包括多媒体信息和相应多媒体信息的内容特征标签的对应关系;
利用学***台涉及的多媒体信息进行内容理解,得到每个多媒体信息的内容特征标签,并基于所述每个多媒体信息的内容特征标签生成内容正排表。
4.如权利要求1所述的方法,其特征在于,所述排序模型根据如下方式训练:
利用所述各账户的历史搜索行为数据和历史浏览行为数据学***台中内容提供服务的服务关系和所述目标平台中内容提供服务输入的行为请求数据,从所述目标平台的服务响应数据库中筛选出召回数据;其中,所述服务关系是指所述内容提供服务输入的行为请求数据与召回数据之间的特征匹配关系;
按照预设排序规则,对各召回数据进行排序:
根据排序结果和所述输入的行为请求数据对应的预设召回数据,调整所述排序模型的模型参数,直至确定所述排序模型的服务准确度达到设定值时,确定训练出排序模型。
5.如权利要求4所述的方法,其特征在于,按照预设排序规则,对各召回数据进行排序,包括:
按照所述目标平台关注的业务指标,对各召回数据进行排序。
6.如权利要求1或2所述的方法,其特征在于,得到所述内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据之后,所述方法还包括:
基于所述目标账户对所述召回数据的操作行为,以及所述操作行为操作的多媒体信息,获取所述目标账户的兴趣标签和所述操作行为操作的多媒体信息的内容特征标签的对应关系;
基于所述兴趣标签和所述操作行为操作的多媒体信息的内容特征标签的对应关系,对所述兴趣模型进行更新。
7.如权利要求1所述的方法,其特征在于,所述内容特征标签中的所述内容类目包括不同内容类目等级;
获得该内容特征标签对应的召回数据,包括:
获得该内容特征标签中不同内容类目等级的内容类目对应的召回数据。
8.一种多媒体信息内容提供装置,其特征在于,所述装置包括:接收模块、获取模块、排序模块和输出模块;
所述接收模块,用于接收目标账户的内容提供请求;
所述获取模块,用于根据所述内容提供请求获取所述目标账户的行为请求信息,将所述目标账户的行为请求信息输入已训练的兴趣模型,得到所述内容提供请求对应的内容特征标签,并获得该内容特征标签对应的召回数据;其中,所述行为请求信息至少包括本次请求操作的类型,所述本次请求操作的类型表征搜索请求行为或推荐请求行为,且当所述本次请求操作的类型表征搜索请求行为时,所述行为请求信息中还包括搜索关键词;所述兴趣模型是根据各账户的历史搜索行为数据和历史浏览行为数据训练得到的,所述兴趣模型的输入为所述目标账户的行为请求信息,输出为所述目标账户的兴趣标签,以及各兴趣标签对应的内容特征标签;
所述排序模块,用于利用已训练的排序模型,对所述召回数据进行排序;
所述输出模块,用于输出携带排序后的召回数据的内容提供响应。
9.一种电子设备,其特征在于,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存储的程序时,实现权利要求1-7任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。
CN202011559490.0A 2020-12-25 2020-12-25 一种多媒体信息内容提供方法及装置 Active CN112685578B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011559490.0A CN112685578B (zh) 2020-12-25 2020-12-25 一种多媒体信息内容提供方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011559490.0A CN112685578B (zh) 2020-12-25 2020-12-25 一种多媒体信息内容提供方法及装置

Publications (2)

Publication Number Publication Date
CN112685578A true CN112685578A (zh) 2021-04-20
CN112685578B CN112685578B (zh) 2024-06-28

Family

ID=75453156

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011559490.0A Active CN112685578B (zh) 2020-12-25 2020-12-25 一种多媒体信息内容提供方法及装置

Country Status (1)

Country Link
CN (1) CN112685578B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113360779A (zh) * 2021-08-09 2021-09-07 智者四海(北京)技术有限公司 内容推荐方法及装置、计算机设备及可读介质
CN113704510A (zh) * 2021-07-30 2021-11-26 北京达佳互联信息技术有限公司 一种媒体内容推荐方法、装置、电子设备及存储介质
CN114417194A (zh) * 2021-12-30 2022-04-29 北京百度网讯科技有限公司 推荐***排序方法、参数预测模型训练方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913273A (zh) * 2015-12-14 2016-08-31 乐视网信息技术(北京)股份有限公司 智能推荐的全端显示方法及装置
CN110442790A (zh) * 2019-08-07 2019-11-12 腾讯科技(深圳)有限公司 推荐多媒体数据的方法、装置、服务器和存储介质
WO2020007164A1 (zh) * 2018-07-04 2020-01-09 腾讯科技(深圳)有限公司 用户特征的生成方法、装置、设备及计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913273A (zh) * 2015-12-14 2016-08-31 乐视网信息技术(北京)股份有限公司 智能推荐的全端显示方法及装置
WO2020007164A1 (zh) * 2018-07-04 2020-01-09 腾讯科技(深圳)有限公司 用户特征的生成方法、装置、设备及计算机可读存储介质
CN110442790A (zh) * 2019-08-07 2019-11-12 腾讯科技(深圳)有限公司 推荐多媒体数据的方法、装置、服务器和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704510A (zh) * 2021-07-30 2021-11-26 北京达佳互联信息技术有限公司 一种媒体内容推荐方法、装置、电子设备及存储介质
CN113704510B (zh) * 2021-07-30 2024-02-06 北京达佳互联信息技术有限公司 一种媒体内容推荐方法、装置、电子设备及存储介质
CN113360779A (zh) * 2021-08-09 2021-09-07 智者四海(北京)技术有限公司 内容推荐方法及装置、计算机设备及可读介质
CN114417194A (zh) * 2021-12-30 2022-04-29 北京百度网讯科技有限公司 推荐***排序方法、参数预测模型训练方法及装置

Also Published As

Publication number Publication date
CN112685578B (zh) 2024-06-28

Similar Documents

Publication Publication Date Title
CN106528745B (zh) 在移动终端上推荐资源的方法、装置及移动终端
CN112685578B (zh) 一种多媒体信息内容提供方法及装置
CN104239535A (zh) 一种为文字配图的方法、服务器、终端及***
CN112104642B (zh) 一种异常账号确定方法和相关装置
WO2021120875A1 (zh) 搜索方法、装置、终端设备及存储介质
CN109165320B (zh) 一种信息收藏方法及移动终端
CN113378556A (zh) 提取文本关键字的方法及装置
CN114357278B (zh) 一种话题推荐方法、装置及设备
CN112214605A (zh) 一种文本分类方法和相关装置
CN108595107B (zh) 一种界面内容处理方法及移动终端
WO2021139486A1 (zh) 文本增量方法、装置及终端设备
CN115022098A (zh) 人工智能安全靶场内容推荐方法、装置及存储介质
CN110196833A (zh) 应用程序的搜索方法、装置、终端及存储介质
CN112862021B (zh) 一种内容标注方法和相关装置
CN114281936A (zh) 分类方法、装置、计算机设备及存储介质
WO2021073434A1 (zh) 对象行为的识别方法、装置及终端设备
CN116758362A (zh) 图像处理方法、装置、计算机设备及存储介质
CN114707075B (zh) 一种冷启动推荐方法和设备
CN116205686A (zh) 一种多媒体资源推荐的方法、装置、设备和存储介质
CN115687745A (zh) 多媒体数据推荐方法、装置、存储介质及计算机设备
CN113360796A (zh) 数据排序方法及装置、数据排序模型训练方法及装置
CN111859240A (zh) 一种图片导出的方法、相关装置及存储介质
CN115080840A (zh) 一种内容推送方法、装置及存储介质
CN111428060B (zh) 一种媒体内容推荐的方法以及相关装置
CN116431886A (zh) 内容查询方法、装置、电子设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant