CN106484777B - 一种多媒体数据处理方法以及装置 - Google Patents

一种多媒体数据处理方法以及装置 Download PDF

Info

Publication number
CN106484777B
CN106484777B CN201610821282.0A CN201610821282A CN106484777B CN 106484777 B CN106484777 B CN 106484777B CN 201610821282 A CN201610821282 A CN 201610821282A CN 106484777 B CN106484777 B CN 106484777B
Authority
CN
China
Prior art keywords
multimedia data
user
target
hidden
operation behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610821282.0A
Other languages
English (en)
Other versions
CN106484777A (zh
Inventor
黄昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610821282.0A priority Critical patent/CN106484777B/zh
Publication of CN106484777A publication Critical patent/CN106484777A/zh
Application granted granted Critical
Publication of CN106484777B publication Critical patent/CN106484777B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种多媒体数据处理方法以及装置,其中方法包括:根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;基于稀疏自编码神经网络,并根据多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;当接收到与目标用户对应的推荐请求,且历史用户群包含目标用户时,获取目标用户的个人操作行为信息中的多个多媒体数据,并根据目标用户对应的用户特征向量以及个人操作行为信息中各多媒体数据分别对应的隐含特征向量对个人操作行为信息中的多个多媒体数据进行推荐处理。采用本发明,可保证所推荐的歌曲是用户所喜欢的歌曲,以提高推荐效果。

Description

一种多媒体数据处理方法以及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种多媒体数据处理方法以及装置。
背景技术
随着互联网技术的发展,各式各样的应用层出不穷,例如,即时通信应用、游戏应用、多媒体数据应用等等。以多媒体数据应用为例,用户可以通过多媒体数据应用收听各式各样的歌曲,而且也可以通过推测用户所喜欢的歌曲,以将相应歌曲推荐给用户。目前,推测用户所喜欢的歌曲的方式可以包括:将用户所收藏(或下载)的歌曲认定为用户所喜欢的歌曲,因此,可以推测用户所喜欢的歌曲包括与所收藏(或下载)的歌曲相类似的歌曲,进而向用户推荐这些相类似的歌曲。当用户没有收藏(或下载)歌曲时,将完整播放完的歌曲认定为用户所喜欢的歌曲,进而进行相似歌曲的推荐。但是完整播放完的歌曲并不代表是用户在听的歌曲(如用户临时离开电脑,而电脑中的音乐播放器继续播放),进而也无法代表是用户所喜欢的歌曲,所以若直接将完整播放完的歌曲认定为用户所喜欢的歌曲,则无法保证所推荐的歌曲是用户所喜欢的歌曲,导致推荐效果不佳。
发明内容
本发明实施例提供一种用于多媒体数据处理方法以及装置,可保证所推荐的歌曲是用户所喜欢的歌曲,以提高推荐效果。
本发明实施例提供了一种多媒体数据处理方法,包括:
根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;
基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;
当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。
相应地,本发明实施例还提供了一种多媒体数据处理装置,包括:
矩阵生成模块,用于根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;
特征计算模块,用于基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;
推荐模块,用于当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。
本发明实施例通过根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵,并基于稀疏自编码神经网络,并根据多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量,由此可见,隐含特征向量可以准确表征历史用户群对一个多媒体数据的喜好程度信息,且用户特征向量可以准确表征一个历史用户对多个多媒体数据的喜好程度信息,所以通过隐含特征向量和用户特征向量可以对目标用户实现准确的个性化推荐,即可保证所推荐的歌曲是目标用户所喜欢的歌曲,以提高推荐效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种网络架构的示意图;
图2是本发明实施例提供的一种多媒体数据处理方法的流程示意图;
图3是本发明实施例提供的另一种多媒体数据处理方法的流程示意图;
图4是本发明实施例提供的一种多媒体数据处理装置的结构示意图;
图5是本发明实施例提供的一种特征计算模块的结构示意图;
图6是本发明实施例提供的一种推荐模块的结构示意图;
图7是本发明实施例提供的一种隐含特征生成单元的结构示意图;
图8是本发明实施例提供的一种用户特征生成单元的结构示意图;
图9是本发明实施例提供的另一种多媒体数据处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,是本发明实施例提供的一种网络架构的示意图。所述网络架构可以包括后台服务器和多个客户端,各个客户端均可以通过网络与所述后台服务器连接,所述后台服务器可以将各个客户端分别对应的用户确定为历史用户群,所述后台服务器还可以收集各个客户端分别对应的操作行为(如某客户端的听歌行为,具体包括该客户端对应的用户所收听过的歌曲)。因此,所述后台服务器可以根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵,并基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息。当某个客户端向所述后台服务器发送推荐请求时,所述后台服务器可以获取多个与该客户端对应的目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。
请参见图2,是本发明实施例提供的一种多媒体数据处理方法的流程示意图,所述方法可以包括:
S101,根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;
具体的,基于多媒体数据应用的后台服务器可以获取历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为。所述多媒体数据库可以为音乐库,每一个多媒体数据均可以为音乐库中的一首歌,因此,所述操作行为可以包括所述历史用户群中的各历史用户对各个多媒体数据的收听行为,所述收听行为包括已收听行为和未收听行为,并且所述后台服务器可以为不同的收听行为设置不同的特征值,以生成与所述操作行为相应的多媒体数据操作行为矩阵。如下表1所示的历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为的特征表:
歌曲1 歌曲2 歌曲3 歌曲4
用户1 1 0 0 1
用户2 1 1 1 0
用户3 0 0 1 0
用户4 1 1 1 1
表1
其中,表1中的特征值“1”表示该用户收听过这首歌曲,特征值“0”表示该用户未收听过这首歌曲,如用户1与歌曲1之间的特征值为“1”,则说明用户1收听过歌曲1;又如用户3与歌曲2之间的特征值为“0”,则说明用户3未收听过歌曲2。因此,根据表1中的所有特征值即可生成与所述操作行为相应的多媒体数据操作行为矩阵,即所述多媒体数据操作行为矩阵中的元素Pui可以表示用户u对歌曲i的收听行为对应的特征值(Pui=1,说明用户u收听过歌曲i;Pui=0,说明用户u未收听歌曲i)。
S102,基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;
具体的,所述后台服务器可以将所述多媒体数据操作行为矩阵输入到所述稀疏自编码神经网络对应的稀疏自编码器的输入层,即将所述多媒体数据操作行为矩阵中的各个收听行为对应的特征值输入到所述输入层中;所述稀疏自编码器包括所述输入层、隐藏层、输出层以及所述隐藏层与所述输出层之间的目标参数;所述隐藏层包括预设数量的隐藏节点;所述隐藏节点的数量可以通过平衡所述后台服务器的计算效率和用户/歌曲的特征描述准确性,以推测出来(可以根据经验值推测)。其中,所述输入层的维度与所述输出层的维度相同。
所述稀疏自编码器可以根据所述输入层中的参数(即所述多媒体数据操作行为矩阵)以及预设的用于训练所述目标参数和所述隐藏节点的隐藏参数的目标函数,对所述目标参数和所述隐藏节点的隐藏参数进行偏导数训练;其中,所述目标函数可以为:
Figure BDA0001113170140000051
其中,x是所述多媒体数据操作行为矩阵;A是由W1 (1)、W2 (1)、W3 (1)、……、Wk+1 (1)组成的矩阵,W1 (1)、W2 (1)、W3 (1)、……、Wk+1 (1)分别为K+1个隐藏节点中的隐藏参数(如W1 (1)表示第一个隐藏节点的隐藏参数),且K+1个隐藏节点中的最后一个隐藏节点为截距项,该截距项的隐藏参数为1,通过保留该截距项可以重构出所述输出层。s是由bN1、bN2、bN3、……、bNK组成的矩阵,bN1、bN2、bN3、……、bNK是所述隐藏层到所述输出层之间的目标参数,N为输入层的维度,本发明实施例中,已指定了隐藏节点数K+1,可对隐藏层稀疏要求放宽,因此将s的1范数近似为2范数。其中,由于有些用户虽然没有对某些歌曲进行收听行为,但是并不代表这些用户不喜欢这些歌曲,同样的,即使有些用户听过某些歌曲,也不能直接表示这些用户喜欢这些歌曲,所以本发明实施例通过在所述目标函数中的增加了一个用户兴趣因子项C,以提高所训练出来的所述隐藏层中的s矩阵与用户对歌曲的喜好程度之间的关联关系;所述用户兴趣因子项C包括所述各历史用户分别对所述多媒体数据库中各多媒体数据的兴趣值cui(cui表示用户u对歌曲i的兴趣值);一个兴趣值是基于一个历史用户对一个多媒体数据的操作行为类型、操作次数以及完整操作率计算得到的。其中,对所述用户兴趣因子项C中的各个兴趣值cui的计算公式可以为:cui=1+αlog(1+εrui);其中,当用户u直接收藏/下载歌曲i时,rui=1;当用户u仅仅是收听过歌曲i时(即没有收藏/下载操作),rui=[min(nui,5)/5]*fui,其中,nui是指用户u收听歌曲i的次数,fui是完整收听率(即所述完整操作率),fui=完整收听歌曲i的人数/所有听歌人数(即所述历史用户群);当用户u没有收听过歌曲i时,cui=0。
所述稀疏自编码器在进行偏导数训练的过程中可以重复交替执行步骤S1和步骤S2;步骤S1为:固定A,对s求导,用最小二乘法得到最优解;步骤S2为:固定s,对A求导,用最小二乘法得到最优解。
进一步的,当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近(即输出层的参数与所述输入层的参数之间的匹配度达到预设匹配度阈值)时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,此时所述稀疏自编码器停止执行步骤S1和步骤S2,并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵,即所述隐含特征矩阵为训练后的矩阵A。为了保证后台服务器的工作效率,因此,所述稀疏自编码器中的隐藏层的维度是要小于所述输入层的维度,所以所述隐藏层中的隐藏参数也可以视为所述输入层中的参数的压缩形式,即所述隐含特征矩阵为所述多媒体数据操作行为矩阵对应的压缩矩阵;其中,所述隐含特征矩阵包括各多媒体数据分别对应的隐含特征向量,例如,可以将所述隐含特征矩阵的第一列特征确定为歌曲1的隐含特征向量,将所述隐含特征矩阵的第二列特征确定为歌曲2的隐含特征向量等等,其中,歌曲1的隐含特征向量可以表征为所述历史用户群对歌曲1的喜好程度信息。
进一步的,由于所述稀疏自编码器的数量为一个,所以可以从所述稀疏自编码器中训练后的目标参数对应的参数矩阵s中提取出所述历史用户群中各历史用户分别对应的用户特征向量。所述后台服务器计算出所述历史用户群中各历史用户分别对应的用户特征向量以及所述多媒体数据库中各多媒体数据分别对应的隐含特征向量后,可以存储各个用户特征向量和各个隐含特征向量,以便于后续根据用户特征向量和隐含特征向量进行用户个性化的歌曲推荐。
S103,当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理;
具体的,当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,可以检测目标用户对应的个人操作行为信息中是否包含已收藏的多媒体数据;若检测为包含已收藏的多媒体数据,则获取所述已收藏的多媒体数据(即推荐源)对应的第一相似多媒体数据,并将所述第一相似多媒体数据作为所述目标用户的推荐数据;若检测为未包含已收藏的多媒体数据,则进一步判断所述个人操作行为信息中是否包含已完整操作的多媒体数据(即完整收听的歌曲)。当所述目标用户对应的个人操作行为信息中包含已完整操作的多媒体数据时,将所述目标用户对应的用户特征向量与所述已完整操作的多媒体数据对应的隐含特征向量进行点乘运算,得到个性化特征值,并当所述个性化特征值大于预设特征值阈值时,获取所述已完整操作的多媒体数据(即推荐源)对应的第二相似多媒体数据,并将所述第二相似多媒体数据作为所述目标用户的推荐数据。
可选的,当所述目标用户对应的个人操作行为信息不包含已完整操作的多媒体数据时,获取多个候选多媒体数据,并将所述标用户对应的用户特征向量分别与各候选多媒体数据对应的隐含特征向量进行点乘运算,得到所述各候选多媒体数据分别对应的个性化特征值;按照各个性化特征值从大到小的顺序对所述多个候选多媒体数据进行排序,并根据排序结果将预设推荐数量的候选多媒体数据作为所述目标用户的推荐数据。例如,若用户A的个人操作行为信息不包含已完整收听的歌曲,且候选歌曲包括歌曲A、歌曲B以及歌曲C,则可以将用户A的用户特征向量与歌曲A的隐含特征向量进行点乘,得到个性化特征值a;将用户A的用户特征向量与歌曲B的隐含特征向量进行点乘,得到个性化特征值b;将用户A的用户特征向量与歌曲C的隐含特征向量进行点乘,得到个性化特征值c;对个性化特征值进行排序后,得到b>c>a,若预设推荐数量为2,则可以将个性化特征值b对应的歌曲B和个性化特征值c对应的歌曲C推荐给用户A。
可选的,在计算所述个性化特征值时,还可以参考显性特征值,即用户u对歌曲i的个性化特征值=用户u对歌曲i的显性特征值+用户u的用户特征向量与歌曲i的隐含特征向量的点乘结果。所述显示特征值可以根据歌曲的标签和用户的标签之间的匹配度计算得到;歌曲的标签可以包括该歌曲对应的曲风类型、语种类型、节奏类型等等;用户的标签可以包括该用户所喜欢的曲风类型、语种类型、节奏类型等等。通过增加所述显性特征值,可以使所述个性化特征值能够更准确的描述用户u对歌曲i的喜好程度。
可选的,当接收到与目标用户对应的推荐请求,且所述历史用户群不包含所述目标用户时,说明所述目标用户还未在后台服务器所提供的多媒体数据平台上收听过歌曲,则可以按照所述各候选多媒体数据对应的隐含特征向量的向量值从大到小的顺序对所述多个候选多媒体数据进行排序,并根据排序结果将预设推荐数量的候选多媒体数据作为所述目标用户的推荐数据。
可选的,所述后台服务器可以周期性的根据新的操作行为计算和更新各历史用户分别对应的用户特征向量,以及各多媒体数据分别对应的隐含特征向量,使得在对目标用户进行推荐时,可以保证所获取到的与所述目标用户相关的隐含特征向量和用户特征向量是始终贴合用户的兴趣变化,即可以保证所计算出的个性化特征值的准确性。其中,所述目标用户每听一首歌曲,均可更新一次所述目标用户的推荐源,以便于后续在向所述目标用户推荐歌曲时,可以直接获取与最近更新的推荐源相似的多媒体数据,以将相似的多媒体数据推荐给用户,以提高推荐效率;而在客户端的用户界面上可以显示“歌曲B是根据你试听的歌曲A推荐”,其中,歌曲A即为推荐源,歌曲B即为与推荐源相似的多媒体数据。
本发明实施例通过根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵,并基于稀疏自编码神经网络,并根据多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量,由此可见,隐含特征向量可以准确表征历史用户群对一个多媒体数据的喜好程度信息,且用户特征向量可以准确表征一个历史用户对多个多媒体数据的喜好程度信息,所以通过隐含特征向量和用户特征向量可以对目标用户实现准确的个性化推荐,即可保证所推荐的歌曲是目标用户所喜欢的歌曲,以提高推荐效果。
再请参见图3,是本发明实施例提供的另一种多媒体数据处理方法的流程示意图,所述方法可以包括:
S201,根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;
具体的,S201步骤的具体实现方式可以参见上述图2对应实施例中的S101,这里不再进行赘述。
S202,将所述多媒体数据操作行为矩阵输入到所述稀疏自编码神经网络对应的稀疏自编码器的输入层;所述稀疏自编码器包括所述输入层、隐藏层、输出层以及所述隐藏层与所述输出层之间的目标参数;所述隐藏层包括预设数量的隐藏节点;
具体的,所述后台服务器可以将所述多媒体数据操作行为矩阵输入到所述稀疏自编码神经网络对应的稀疏自编码器的输入层,即将所述多媒体数据操作行为矩阵中的各个收听行为对应的特征值输入到所述输入层中;所述稀疏自编码器包括所述输入层、隐藏层、输出层以及所述隐藏层与所述输出层之间的目标参数;所述隐藏层包括预设数量的隐藏节点;所述隐藏节点的数量可以通过平衡所述后台服务器的计算效率和用户/歌曲的特征描述准确性,以推测出来(可以根据经验值推测)。其中,所述输入层的维度与所述输出层的维度相同。
S203,所述稀疏自编码器根据所述输入层中的参数以及预设的用于训练所述目标参数和所述隐藏节点的隐藏参数的目标函数,对所述目标参数和所述隐藏节点的隐藏参数进行偏导数训练;
所述稀疏自编码器可以根据所述输入层中的参数(即所述多媒体数据操作行为矩阵)以及预设的用于训练所述目标参数和所述隐藏节点的隐藏参数的目标函数,对所述目标参数和所述隐藏节点的隐藏参数进行偏导数训练;其中,所述目标函数可以为:
Figure BDA0001113170140000091
其中,x是所述多媒体数据操作行为矩阵;A是由W1 (1)、W2 (1)、W3 (1)、……、Wk+1 (1)组成的矩阵,W1 (1)、W2 (1)、W3 (1)、……、Wk+1 (1)分别为K+1个隐藏节点中的隐藏参数(如W1 (1)表示第一个隐藏节点的隐藏参数),且K+1个隐藏节点中的最后一个隐藏节点为截距项,该截距项的隐藏参数为1,通过保留该截距项可以重构出所述输出层。s是由bN1、bN2、bN3、……、bNK组成的矩阵,bN1、bN2、bN3、……、bNK是所述隐藏层到所述输出层之间的目标参数,N为输入层的维度,本发明实施例中,已指定了隐藏节点数K+1,可对隐藏层稀疏要求放宽,因此将s的1范数近似为2范数。其中,由于有些用户虽然没有对某些歌曲进行收听行为,但是并不代表这些用户不喜欢这些歌曲,同样的,即使有些用户听过某些歌曲,也不能直接表示这些用户喜欢这些歌曲,所以本发明实施例通过在所述目标函数中的增加了一个用户兴趣因子项C,以提高所训练出来的所述隐藏层中的s矩阵与用户对歌曲的喜好程度之间的关联关系;所述用户兴趣因子项C包括所述各历史用户分别对所述多媒体数据库中各多媒体数据的兴趣值cui(cui表示用户u对歌曲i的兴趣值);一个兴趣值是基于一个历史用户对一个多媒体数据的操作行为类型、操作次数以及完整操作率计算得到的。其中,对所述用户兴趣因子项C中的各个兴趣值cui的计算公式可以为:cui=1+αlog(1+εrui);其中,当用户u直接收藏/下载歌曲i时,rui=1;当用户u仅仅是收听过歌曲i时(即没有收藏/下载操作),rui=[min(nui,5)/5]*fui,其中,nui是指用户u收听歌曲i的次数,fui是完整收听率(即所述完整操作率),fui=完整收听歌曲i的人数/所有听歌人数(即所述历史用户群);当用户u没有收听过歌曲i时,cui=0。
所述稀疏自编码器在进行偏导数训练的过程中可以重复交替执行步骤S1和步骤S2;步骤S1为:固定A,对s求导,用最小二乘法得到最优解;步骤S2为:固定s,对A求导,用最小二乘法得到最优解。
S204,当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数确定为目标输入源;
具体的,所述后台服务器也可以预设至少两个稀疏自编码器,当第一个稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,即第一个稀疏自编码器完成训练,此时,可以将第一个稀疏自编码器中满足所述收敛条件的各隐藏节点的隐藏参数确定为目标输入源。
S205,根据预设数量的稀疏自编码器,将所述目标输入源输入到下一个稀疏自编码器的输入层,所述下一个稀疏自编码器根据所述目标函数训练所述目标输入源对应的隐藏参数,并将所述下一个稀疏自编码器中训练后的隐藏参数作为目标输入源,重复执行本步骤,直至最后一个稀疏自编码器训练出隐藏参数;
具体的,所述后台服务器可以进一步根据预设数量的稀疏自编码器,将所述目标输入源输入到下一个稀疏自编码器的输入层,所述下一个稀疏自编码器根据所述目标函数训练所述目标输入源对应的隐藏参数,并将所述下一个稀疏自编码器中训练后的隐藏参数作为目标输入源,重复执行本步骤,直至最后一个稀疏自编码器训练出隐藏参数。其中,第一个稀疏自编码器所训练出的隐藏参数可以称为一阶特征参数,第二个稀疏自编码器所训练出的隐藏参数可以称为二阶特征参数,以此类推,第n个稀疏自编码器所训练出的隐藏参数可以称为n阶特征参数,n值越大,则n阶特征参数可以越精确的描述用户对多媒体数据的喜好程度。其中,所述第一个稀疏自编码器中的目标函数可以包含所述用户兴趣因子项C,而除了所述第一个稀疏自编码器以外的其他稀疏自编码器中的目标函数可以不包含所述用户兴趣因子项C。其中,每个稀疏自编码器的收敛条件都是相同的,即收敛条件都是为所述输出层中的参数与所述输入层中的参数相近。
S206,将所述最后一个稀疏自编码器训练出的隐藏参数组合为隐含特征矩阵;
S207,当所述稀疏自编码器的数量为至少两个时,获取各历史用户分别对应的个人操作行为信息,分别将各个人操作行为信息中已操作的多媒体数据对应的隐含特征向量进行向量平均计算,并将计算出的各平均向量分别作为各历史用户分别对应的用户特征向量;
具体的,当所述稀疏自编码器的数量为至少两个时,可以获取各历史用户分别对应的个人操作行为信息,分别将各个人操作行为信息中已操作的多媒体数据对应的隐含特征向量进行向量平均计算,并将计算出的各平均向量分别作为各历史用户分别对应的用户特征向量。例如,历史用户A对应的个人操作行为信息可以包括用户A所收听过的歌曲,被用户A收听过的歌曲可以包括歌曲1、歌曲2、歌曲3,则历史用户A对应的用户特征向量可以为歌曲1的隐含特征向量、歌曲2的隐含特征向量以及歌曲3的隐含特征向量的平均向量。
S208,当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理;
其中,S208步骤的具体实现方式可以参见上述图2对应实施例中的S101,这里不再进行赘述。
本发明实施例通过根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵,并基于稀疏自编码神经网络,并根据多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量,由此可见,隐含特征向量可以准确表征历史用户群对一个多媒体数据的喜好程度信息,且用户特征向量可以准确表征一个历史用户对多个多媒体数据的喜好程度信息,所以通过隐含特征向量和用户特征向量可以对目标用户实现准确的个性化推荐,即可保证所推荐的歌曲是目标用户所喜欢的歌曲,以提高推荐效果。
请参见图4,是本发明实施例提供的一种多媒体数据处理装置的结构示意图。所述多媒体数据处理装置1可以应用于后台服务器中,所述多媒体数据处理装置1可以包括:矩阵生成模块10、特征计算模块20、推荐模块30;
所述矩阵生成模块10,用于根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;
具体的,所述矩阵生成模块10可以获取历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为。所述多媒体数据库可以为音乐库,每一个多媒体数据均可以为音乐库中的一首歌,因此,所述操作行为可以包括所述历史用户群中的各历史用户对各个多媒体数据的收听行为,所述收听行为包括已收听行为和未收听行为,所述矩阵生成模块10可以为不同的收听行为设置不同的特征值,以生成与所述操作行为相应的多媒体数据操作行为矩阵。再以上述图2对应实施例中的表1为例,表1中的特征值“1”表示该用户收听过这首歌曲,特征值“0”表示该用户未收听过这首歌曲,如用户1与歌曲1之间的特征值为“1”,则说明用户1收听过歌曲1;又如用户3与歌曲2之间的特征值为“0”,则说明用户3未收听过歌曲2。因此,所述矩阵生成模块10根据所述表1中的所有特征值即可生成与所述操作行为相应的多媒体数据操作行为矩阵,即所述多媒体数据操作行为矩阵中的元素Pui可以表示用户u对歌曲i的收听行为对应的特征值(Pui=1,说明用户u收听过歌曲i;Pui=0,说明用户u未收听歌曲i)。
所述特征计算模块20,用于基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;
具体的,请一并参见图5,是所述特征计算模块20的结构示意图,所述特征计算模块20可以包括:输入单元201、训练单元202、隐含特征生成单元203、用户特征生成单元204;
所述输入单元201,用于将所述多媒体数据操作行为矩阵输入到所述稀疏自编码神经网络对应的稀疏自编码器的输入层;所述稀疏自编码器包括所述输入层、隐藏层、输出层以及所述隐藏层与所述输出层之间的目标参数;所述隐藏层包括预设数量的隐藏节点;
所述训练单元202,用于控制所述稀疏自编码器根据所述输入层中的参数以及预设的用于训练所述目标参数和所述隐藏节点的隐藏参数的目标函数,对所述目标参数和所述隐藏节点的隐藏参数进行偏导数训练;
所述隐含特征生成单元203,用于当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵;所述隐含特征矩阵为所述多媒体数据操作行为矩阵对应的压缩矩阵,所述隐含特征矩阵包括各多媒体数据分别对应的隐含特征向量;
所述用户特征生成单元204,用于根据训练后的目标参数或所述隐含特征矩阵计算所述历史用户群中各历史用户分别对应的用户特征向量;
其中,当所述稀疏自编码器的数量为一个时,所计算出来的隐藏参数为一阶特征参数,即所述隐含特征矩阵包括所述一阶特征参数。所述输入单元201、所述训练单元202、所述隐含特征生成单元203、所述用户特征生成单元204的具体实现方式可以参见上述图2对应实施例中的S102,这里不再进行赘述。
所述推荐模块30,用于当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理;
具体的,请一并参见图6,是所述推荐模块30的结构示意图,所述推荐模块30可以包括:检测单元301、相似推荐单元302、获取判断单元303、点乘运算单元304、排序推荐单元305;
所述检测单元301,用于当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,检测目标用户对应的个人操作行为信息中是否包含已收藏的多媒体数据;
所述相似推荐单元302,用于若所述检测单元301检测为包含已收藏的多媒体数据,则获取所述已收藏的多媒体数据对应的第一相似多媒体数据,并将所述第一相似多媒体数据作为所述目标用户的推荐数据;
所述获取判断单元303,用于若所述检测单元301检测为未包含已收藏的多媒体数据,则进一步判断所述个人操作行为信息中是否包含已完整操作的多媒体数据;
所述点乘运算单元304,用于当所述个人操作行为信息中包含已完整操作的多媒体数据时,将所述目标用户对应的用户特征向量与所述已完整操作的多媒体数据对应的隐含特征向量进行点乘运算,得到个性化特征值;
所述相似推荐单元302,还用于当所述个性化特征值大于预设特征值阈值时,获取所述已完整操作的多媒体数据对应的第二相似多媒体数据,并将所述第二相似多媒体数据作为所述目标用户的推荐数据;
所述点乘运算单元304,还用于当所述个人操作行为信息不包含已完整操作的多媒体数据时,获取多个候选多媒体数据,将所述标用户对应的用户特征向量分别与各候选多媒体数据对应的隐含特征向量进行点乘运算,得到所述各候选多媒体数据分别对应的个性化特征值;
所述排序推荐单元305,用于按照各个性化特征值对所述多个候选多媒体数据进行排序,并根据排序结果将预设推荐数量的候选多媒体数据作为所述目标用户的推荐数据;
其中,所述检测单元301、所述相似推荐单元302、所述获取判断单元303、所述点乘运算单元304、所述排序推荐单元305的具体实现方式可以参见上述图2对应实施例中的S103,这里不再进行赘述。
可选的,所述推荐模块30在计算所述个性化特征值时,还可以参考显性特征值,即用户u对歌曲i的个性化特征值=用户u对歌曲i的显性特征值+用户u的用户特征向量与歌曲i的隐含特征向量的点乘结果。所述显示特征值可以根据歌曲的标签和用户的标签之间的匹配度计算得到;歌曲的标签可以包括该歌曲对应的曲风类型、语种类型、节奏类型等等;用户的标签可以包括该用户所喜欢的曲风类型、语种类型、节奏类型等等。通过增加所述显性特征值,可以使所述个性化特征值能够更准确的描述用户u对歌曲i的喜好程度。
可选的,当接收到与目标用户对应的推荐请求,且所述历史用户群不包含所述目标用户时,说明所述目标用户还未在后台服务器所提供的多媒体数据平台上收听过歌曲,则所述推荐模块30可以按照所述各候选多媒体数据对应的隐含特征向量的向量值从大到小的顺序对所述多个候选多媒体数据进行排序,并根据排序结果将预设推荐数量的候选多媒体数据作为所述目标用户的推荐数据。
可选的,所述特征计算模块20可以周期性的根据新的操作行为计算和更新各历史用户分别对应的用户特征向量,以及各多媒体数据分别对应的隐含特征向量,使得在对目标用户进行推荐时,可以保证所获取到的与所述目标用户相关的隐含特征向量和用户特征向量是始终贴合用户的兴趣变化,即可以保证所述推荐模块30所计算出的个性化特征值的准确性。其中,所述目标用户每听一首歌曲,所述推荐模块30均可更新一次所述目标用户的推荐源,以便于后续在向所述目标用户推荐歌曲时,所述推荐模块30可以直接获取与最近更新的推荐源相似的多媒体数据,以将相似的多媒体数据推荐给用户,以提高推荐效率;而在客户端的用户界面上可以显示“歌曲B是根据你试听的歌曲A推荐”,其中,歌曲A即为推荐源,歌曲B即为与推荐源相似的多媒体数据。
进一步的,请一并参见图7,是本发明实施例提供的一种隐含特征生成单元203的结构示意图,所述隐含特征生成单元203包括:确定子单元2031、深度学习子单元2032、组合子单元2033;
所述确定子单元2031,用于当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数确定为目标输入源;
所述深度学习子单元2032,用于根据预设数量的稀疏自编码器,将所述目标输入源输入到下一个稀疏自编码器的输入层,所述下一个稀疏自编码器根据所述目标函数训练所述目标输入源对应的隐藏参数,并将所述下一个稀疏自编码器中训练后的隐藏参数作为目标输入源,重复执行本步骤,直至最后一个稀疏自编码器训练出隐藏参数;
所述组合子单元2033,用于将所述最后一个稀疏自编码器训练出的隐藏参数组合为隐含特征矩阵;
其中,第一个稀疏自编码器所训练出的隐藏参数可以称为一阶特征参数,第二个稀疏自编码器所训练出的隐藏参数可以称为二阶特征参数,以此类推,第n个稀疏自编码器所训练出的隐藏参数可以称为n阶特征参数,n值越大,则n阶特征参数可以越精确的描述用户对多媒体数据的喜好程度。所述确定子单元2031、所述深度学习子单元2032、所述组合子单元2033的具体实现方式可以参见上述图3对应实施例中的S204-S206,这里不再进行赘述。
进一步的,再请一并参见图8,是本发明实施例提供的一种用户特征生成单元204的结构示意图,所述用户特征生成单元204包括:提取子单元2041、平均计算子单元2042;
所述提取子单元2041,用于当所述稀疏自编码器的数量为一个时,从所述稀疏自编码器中训练后的目标参数对应的参数矩阵中提取出所述历史用户群中各历史用户分别对应的用户特征向量;
所述平均计算子单元2042,用于当所述稀疏自编码器的数量为至少两个时,获取各历史用户分别对应的个人操作行为信息,分别将各个人操作行为信息中已操作的多媒体数据对应的隐含特征向量进行向量平均计算,并将计算出的各平均向量分别作为各历史用户分别对应的用户特征向量;
具体的,当所述稀疏自编码器的数量为至少两个时,所述平均计算子单元2042可以获取各历史用户分别对应的个人操作行为信息,分别将各个人操作行为信息中已操作的多媒体数据对应的隐含特征向量进行向量平均计算,并将计算出的各平均向量分别作为各历史用户分别对应的用户特征向量。例如,历史用户A对应的个人操作行为信息可以包括用户A所收听过的歌曲,被用户A收听过的歌曲可以包括歌曲1、歌曲2、歌曲3,则历史用户A对应的用户特征向量可以为歌曲1的隐含特征向量、歌曲2的隐含特征向量以及歌曲3的隐含特征向量的平均向量。
本发明实施例通过根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵,并基于稀疏自编码神经网络,并根据多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量,由此可见,隐含特征向量可以准确表征历史用户群对一个多媒体数据的喜好程度信息,且用户特征向量可以准确表征一个历史用户对多个多媒体数据的喜好程度信息,所以通过隐含特征向量和用户特征向量可以对目标用户实现准确的个性化推荐,即可保证所推荐的歌曲是目标用户所喜欢的歌曲,以提高推荐效果。
请参见图9,是本发明实施例提供的另一种多媒体数据处理装置的结构示意图。如图9所示,所述多媒体数据处理装置1000可以应用于后台服务器中,所述多媒体数据处理装置1000可以包括:至少一个处理器1001,例如CPU,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图9所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及设备控制应用程序。
在图9所示的多媒体数据处理装置1000中,网络接口1004主要用于连接客户端,以向客户端推荐多媒体数据;而用户接口1003主要用于为用户提供输入的接口,获取用户输出的数据;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现
根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;
基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;
当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。
在一个实施例中,所述处理器1001在执行基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量时,具体执行以下步骤:
将所述多媒体数据操作行为矩阵输入到所述稀疏自编码神经网络对应的稀疏自编码器的输入层;所述稀疏自编码器包括所述输入层、隐藏层、输出层以及所述隐藏层与所述输出层之间的目标参数;所述隐藏层包括预设数量的隐藏节点;
控制所述稀疏自编码器根据所述输入层中的参数以及预设的用于训练所述目标参数和所述隐藏节点的隐藏参数的目标函数,对所述目标参数和所述隐藏节点的隐藏参数进行偏导数训练;
当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵;所述隐含特征矩阵为所述多媒体数据操作行为矩阵对应的压缩矩阵,所述隐含特征矩阵包括各多媒体数据分别对应的隐含特征向量;
根据训练后的目标参数或所述隐含特征矩阵计算所述历史用户群中各历史用户分别对应的用户特征向量。
在一个实施例中,所述处理器1001在执行当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵时,具体执行以下步骤:
当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数确定为目标输入源;
根据预设数量的稀疏自编码器,将所述目标输入源输入到下一个稀疏自编码器的输入层,所述下一个稀疏自编码器根据所述目标函数训练所述目标输入源对应的隐藏参数,并将所述下一个稀疏自编码器中训练后的隐藏参数作为目标输入源,重复执行本步骤,直至最后一个稀疏自编码器训练出隐藏参数;
将所述最后一个稀疏自编码器训练出的隐藏参数组合为隐含特征矩阵。
在一个实施例中,所述目标函数包括预设的用户兴趣因子项,所述用户兴趣因子项包括所述各历史用户分别对所述多媒体数据库中各多媒体数据的兴趣值;
一个兴趣值是基于一个历史用户对一个多媒体数据的操作行为类型、操作次数以及完整操作率计算得到的。
在一个实施例中,所述处理器1001在执行根据训练后的目标参数或所述隐含特征矩阵计算所述历史用户群中各历史用户分别对应的用户特征向量时,具体执行以下步骤:
当所述稀疏自编码器的数量为一个时,从所述稀疏自编码器中训练后的目标参数对应的参数矩阵中提取出所述历史用户群中各历史用户分别对应的用户特征向量;
当所述稀疏自编码器的数量为至少两个时,获取各历史用户分别对应的个人操作行为信息,分别将各个人操作行为信息中已操作的多媒体数据对应的隐含特征向量进行向量平均计算,并将计算出的各平均向量分别作为各历史用户分别对应的用户特征向量。
在一个实施例中,所述处理器1001在执行当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理时,具体执行以下步骤:
当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,检测目标用户对应的个人操作行为信息中是否包含已收藏的多媒体数据;
若检测为包含已收藏的多媒体数据,则获取所述已收藏的多媒体数据对应的第一相似多媒体数据,并将所述第一相似多媒体数据作为所述目标用户的推荐数据;
若检测为未包含已收藏的多媒体数据,则进一步判断所述个人操作行为信息中是否包含已完整操作的多媒体数据;
当所述个人操作行为信息中包含已完整操作的多媒体数据时,将所述目标用户对应的用户特征向量与所述已完整操作的多媒体数据对应的隐含特征向量进行点乘运算,得到个性化特征值;
当所述个性化特征值大于预设特征值阈值时,获取所述已完整操作的多媒体数据对应的第二相似多媒体数据,并将所述第二相似多媒体数据作为所述目标用户的推荐数据。
在一个实施例中,所述处理器1001还执行以下步骤:
当所述个人操作行为信息不包含已完整操作的多媒体数据时,获取多个候选多媒体数据,将所述标用户对应的用户特征向量分别与各候选多媒体数据对应的隐含特征向量进行点乘运算,得到所述各候选多媒体数据分别对应的个性化特征值;
按照各个性化特征值对所述多个候选多媒体数据进行排序,并根据排序结果将预设推荐数量的候选多媒体数据作为所述目标用户的推荐数据。
本发明实施例通过根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵,并基于稀疏自编码神经网络,并根据多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量,由此可见,隐含特征向量可以准确表征历史用户群对一个多媒体数据的喜好程度信息,且用户特征向量可以准确表征一个历史用户对多个多媒体数据的喜好程度信息,所以通过隐含特征向量和用户特征向量可以对目标用户实现准确的个性化推荐,即可保证所推荐的歌曲是目标用户所喜欢的歌曲,以提高推荐效果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (16)

1.一种多媒体数据处理方法,其特征在于,包括:
根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;
基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;所述隐含特征向量为隐含特征矩阵中的向量,所述隐含特征矩阵是由满足收敛条件的所述稀疏自编码神经网络中隐藏节点的隐藏参数所组合得到;所述用户特征向量是基于历史用户的个人操作行为信息中已操作的多媒体数据对应的隐含特征向量所计算得到;
当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。
2.如权利要求1所述的方法,其特征在于,所述基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量,包括:
将所述多媒体数据操作行为矩阵输入到所述稀疏自编码神经网络对应的稀疏自编码器的输入层;所述稀疏自编码器包括所述输入层、隐藏层、输出层以及所述隐藏层与所述输出层之间的目标参数;所述隐藏层包括预设数量的隐藏节点;
所述稀疏自编码器根据所述输入层中的参数以及预设的用于训练所述目标参数和所述隐藏节点的隐藏参数的目标函数,对所述目标参数和所述隐藏节点的隐藏参数进行偏导数训练;
当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵;所述隐含特征矩阵为所述多媒体数据操作行为矩阵对应的压缩矩阵,所述隐含特征矩阵包括各多媒体数据分别对应的隐含特征向量;
根据训练后的目标参数或所述隐含特征矩阵计算所述历史用户群中各历史用户分别对应的用户特征向量。
3.如权利要求2所述的方法,其特征在于,所述当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵,包括:
当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数确定为目标输入源;
根据预设数量的稀疏自编码器,将所述目标输入源输入到下一个稀疏自编码器的输入层,所述下一个稀疏自编码器根据所述目标函数训练所述目标输入源对应的隐藏参数,并将所述下一个稀疏自编码器中训练后的隐藏参数作为目标输入源,重复执行本步骤,直至最后一个稀疏自编码器训练出隐藏参数;
将所述最后一个稀疏自编码器训练出的隐藏参数组合为隐含特征矩阵。
4.如权利要求2所述的方法,其特征在于,所述目标函数包括预设的用户兴趣因子项,所述用户兴趣因子项包括所述各历史用户分别对所述多媒体数据库中各多媒体数据的兴趣值;
一个兴趣值是基于一个历史用户对一个多媒体数据的操作行为类型、操作次数以及完整操作率计算得到的。
5.如权利要求3所述的方法,其特征在于,所述根据训练后的目标参数或所述隐含特征矩阵计算所述历史用户群中各历史用户分别对应的用户特征向量,包括:
当所述稀疏自编码器的数量为一个时,从所述稀疏自编码器中训练后的目标参数对应的参数矩阵中提取出所述历史用户群中各历史用户分别对应的用户特征向量;
当所述稀疏自编码器的数量为至少两个时,获取各历史用户分别对应的个人操作行为信息,分别将各个人操作行为信息中已操作的多媒体数据对应的隐含特征向量进行向量平均计算,并将计算出的各平均向量分别作为各历史用户分别对应的用户特征向量。
6.如权利要求1所述的方法,其特征在于,所述当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理,包括:
当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,检测目标用户对应的个人操作行为信息中是否包含已收藏的多媒体数据;
若检测为包含已收藏的多媒体数据,则获取所述已收藏的多媒体数据对应的第一相似多媒体数据,并将所述第一相似多媒体数据作为所述目标用户的推荐数据;
若检测为未包含已收藏的多媒体数据,则进一步判断所述个人操作行为信息中是否包含已完整操作的多媒体数据;
当所述个人操作行为信息中包含已完整操作的多媒体数据时,将所述目标用户对应的用户特征向量与所述已完整操作的多媒体数据对应的隐含特征向量进行点乘运算,得到个性化特征值;
当所述个性化特征值大于预设特征值阈值时,获取所述已完整操作的多媒体数据对应的第二相似多媒体数据,并将所述第二相似多媒体数据作为所述目标用户的推荐数据。
7.如权利要求6所述的方法,其特征在于,还包括:
当所述个人操作行为信息不包含已完整操作的多媒体数据时,获取多个候选多媒体数据,将所述标用户对应的用户特征向量分别与各候选多媒体数据对应的隐含特征向量进行点乘运算,得到所述各候选多媒体数据分别对应的个性化特征值;
按照各个性化特征值对所述多个候选多媒体数据进行排序,并根据排序结果将预设推荐数量的候选多媒体数据作为所述目标用户的推荐数据。
8.一种多媒体数据处理装置,其特征在于,包括:
矩阵生成模块,用于根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;
特征计算模块,用于基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;所述隐含特征向量为隐含特征矩阵中的向量,所述隐含特征矩阵是由满足收敛条件的所述稀疏自编码神经网络中隐藏节点的隐藏参数所组合得到;所述用户特征向量是基于历史用户的个人操作行为信息中已操作的多媒体数据对应的隐含特征向量所计算得到;
推荐模块,用于当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。
9.如权利要求8所述的装置,其特征在于,所述特征计算模块包括:
输入单元,用于将所述多媒体数据操作行为矩阵输入到所述稀疏自编码神经网络对应的稀疏自编码器的输入层;所述稀疏自编码器包括所述输入层、隐藏层、输出层以及所述隐藏层与所述输出层之间的目标参数;所述隐藏层包括预设数量的隐藏节点;
训练单元,用于控制所述稀疏自编码器根据所述输入层中的参数以及预设的用于训练所述目标参数和所述隐藏节点的隐藏参数的目标函数,对所述目标参数和所述隐藏节点的隐藏参数进行偏导数训练;
隐含特征生成单元,用于当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵;所述隐含特征矩阵为所述多媒体数据操作行为矩阵对应的压缩矩阵,所述隐含特征矩阵包括各多媒体数据分别对应的隐含特征向量;
用户特征生成单元,用于根据训练后的目标参数或所述隐含特征矩阵计算所述历史用户群中各历史用户分别对应的用户特征向量。
10.如权利要求9所述的装置,其特征在于,所述隐含特征生成单元包括:
确定子单元,用于当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数确定为目标输入源;
深度学习子单元,用于根据预设数量的稀疏自编码器,将所述目标输入源输入到下一个稀疏自编码器的输入层,所述下一个稀疏自编码器根据所述目标函数训练所述目标输入源对应的隐藏参数,并将所述下一个稀疏自编码器中训练后的隐藏参数作为目标输入源,重复执行本步骤,直至最后一个稀疏自编码器训练出隐藏参数;
组合子单元,用于将所述最后一个稀疏自编码器训练出的隐藏参数组合为隐含特征矩阵。
11.如权利要求9所述的装置,其特征在于,所述目标函数包括预设的用户兴趣因子项,所述用户兴趣因子项包括所述各历史用户分别对所述多媒体数据库中各多媒体数据的兴趣值;
一个兴趣值是基于一个历史用户对一个多媒体数据的操作行为类型、操作次数以及完整操作率计算得到的。
12.如权利要求10所述的装置,其特征在于,所述用户特征生成单元包括:
提取子单元,用于当所述稀疏自编码器的数量为一个时,从所述稀疏自编码器中训练后的目标参数对应的参数矩阵中提取出所述历史用户群中各历史用户分别对应的用户特征向量;
平均计算子单元,用于当所述稀疏自编码器的数量为至少两个时,获取各历史用户分别对应的个人操作行为信息,分别将各个人操作行为信息中已操作的多媒体数据对应的隐含特征向量进行向量平均计算,并将计算出的各平均向量分别作为各历史用户分别对应的用户特征向量。
13.如权利要求8所述的装置,其特征在于,所述推荐模块包括:
检测单元,用于当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,检测目标用户对应的个人操作行为信息中是否包含已收藏的多媒体数据;
相似推荐单元,用于若所述检测单元检测为包含已收藏的多媒体数据,则获取所述已收藏的多媒体数据对应的第一相似多媒体数据,并将所述第一相似多媒体数据作为所述目标用户的推荐数据;
获取判断单元,用于若所述检测单元检测为未包含已收藏的多媒体数据,则进一步判断所述个人操作行为信息中是否包含已完整操作的多媒体数据;
点乘运算单元,用于当所述个人操作行为信息中包含已完整操作的多媒体数据时,将所述目标用户对应的用户特征向量与所述已完整操作的多媒体数据对应的隐含特征向量进行点乘运算,得到个性化特征值;
所述相似推荐单元,还用于当所述个性化特征值大于预设特征值阈值时,获取所述已完整操作的多媒体数据对应的第二相似多媒体数据,并将所述第二相似多媒体数据作为所述目标用户的推荐数据。
14.如权利要求13所述的装置,其特征在于,所述推荐模块还包括:
所述点乘运算单元,还用于当所述个人操作行为信息不包含已完整操作的多媒体数据时,获取多个候选多媒体数据,将所述标用户对应的用户特征向量分别与各候选多媒体数据对应的隐含特征向量进行点乘运算,得到所述各候选多媒体数据分别对应的个性化特征值;
排序推荐单元,用于按照各个性化特征值对所述多个候选多媒体数据进行排序,并根据排序结果将预设推荐数量的候选多媒体数据作为所述目标用户的推荐数据。
15.一种多媒体数据处理装置,其特征在于,包括:处理器、存储器以及网络接口;
所述处理器与所述存储器、所述网络接口相连,其中,所述网络接口用于提供数据通信功能,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1-7任一项所述的方法。
16.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-7任一项所述的方法。
CN201610821282.0A 2016-09-12 2016-09-12 一种多媒体数据处理方法以及装置 Active CN106484777B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610821282.0A CN106484777B (zh) 2016-09-12 2016-09-12 一种多媒体数据处理方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610821282.0A CN106484777B (zh) 2016-09-12 2016-09-12 一种多媒体数据处理方法以及装置

Publications (2)

Publication Number Publication Date
CN106484777A CN106484777A (zh) 2017-03-08
CN106484777B true CN106484777B (zh) 2020-09-08

Family

ID=58273774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610821282.0A Active CN106484777B (zh) 2016-09-12 2016-09-12 一种多媒体数据处理方法以及装置

Country Status (1)

Country Link
CN (1) CN106484777B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10757218B2 (en) * 2017-03-29 2020-08-25 Alibaba Group Holding Limited Method and apparatus for generating push notifications
CN107577736B (zh) * 2017-08-25 2021-12-17 武汉数字智能信息科技有限公司 一种基于bp神经网络的文件推荐方法及***
CN108345697A (zh) * 2018-03-22 2018-07-31 山东财经大学 面向大学生群体的智慧课程推荐方法、***及存储介质
CN108846097B (zh) * 2018-06-15 2021-01-29 北京搜狐新媒体信息技术有限公司 用户的兴趣标签表示方法、文章推荐方法、及装置、设备
CN109034953B (zh) * 2018-07-02 2021-11-23 西南交通大学 一种电影推荐方法
CN108959603B (zh) * 2018-07-13 2022-03-29 北京印刷学院 基于深度神经网络的个性化推荐***及方法
CN109491704A (zh) * 2018-11-08 2019-03-19 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN109522333A (zh) * 2018-11-23 2019-03-26 北京锐安科技有限公司 数据分析方法、装置、设备和介质
CN110213325B (zh) * 2019-04-02 2021-09-24 腾讯科技(深圳)有限公司 数据处理方法以及数据推送方法
CN111061907B (zh) * 2019-12-10 2023-06-20 腾讯科技(深圳)有限公司 媒体数据处理方法、装置及存储介质
CN112733014A (zh) * 2020-12-30 2021-04-30 上海众源网络有限公司 推荐方法、装置、设备及存储介质
CN114491093B (zh) * 2021-12-22 2023-03-28 北京达佳互联信息技术有限公司 多媒体资源推荐、对象表征网络的生成方法及装置
CN115174997B (zh) * 2022-06-29 2023-11-28 Vidaa国际控股(荷兰)公司 显示设备和媒资推荐方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102135991A (zh) * 2011-03-11 2011-07-27 桂林电子科技大学 基于后向学习的动态多属***选择方法
CN102426686A (zh) * 2011-09-29 2012-04-25 南京大学 一种基于矩阵分解的互联网信息产品推荐方法
CN103377250B (zh) * 2012-04-27 2017-08-04 杭州载言网络技术有限公司 基于邻域的top‑k推荐方法
CN102831234B (zh) * 2012-08-31 2015-04-22 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN104123315B (zh) * 2013-04-28 2018-01-30 北京音之邦文化科技有限公司 多媒体文件的推荐方法和推荐服务器
CN103383702A (zh) * 2013-07-17 2013-11-06 中国科学院深圳先进技术研究院 一种基于用户投票排名的个性化新闻推荐的方法及***
CN104765728B (zh) * 2014-01-08 2017-07-18 富士通株式会社 训练神经网络的方法和装置以及确定稀疏特征向量的方法
CN104063481B (zh) * 2014-07-02 2017-11-14 山东大学 一种基于用户实时兴趣向量的电影个性化推荐方法
US20160078520A1 (en) * 2014-09-12 2016-03-17 Microsoft Corporation Modified matrix factorization of content-based model for recommendation system
US10567838B2 (en) * 2014-10-01 2020-02-18 Adobe Inc. Digital content consumption analysis
CN104504055B (zh) * 2014-12-19 2017-12-26 常州飞寻视讯信息科技有限公司 基于图像相似度的商品相似计算方法及商品推荐***
CN104731954B (zh) * 2015-04-01 2018-01-26 天翼爱音乐文化科技有限公司 基于群透视音乐推荐方法与***
CN104834686B (zh) * 2015-04-17 2018-12-28 中国科学院信息工程研究所 一种基于混合语义矩阵的视频推荐方法
CN105512681A (zh) * 2015-12-07 2016-04-20 北京信息科技大学 一种目标类别图片的获取方法及***
CN105915949A (zh) * 2015-12-23 2016-08-31 乐视网信息技术(北京)股份有限公司 一种视频内容推荐方法、设备和***

Also Published As

Publication number Publication date
CN106484777A (zh) 2017-03-08

Similar Documents

Publication Publication Date Title
CN106484777B (zh) 一种多媒体数据处理方法以及装置
CN105701191B (zh) 一种推送信息点击率估计方法和装置
CN108427708B (zh) 数据处理方法、装置、存储介质和电子装置
CN107451894B (zh) 数据处理方法、装置和计算机可读存储介质
CN107451832B (zh) 推送信息的方法和装置
WO2018103718A1 (zh) 应用推荐的方法、装置及服务器
CN106251174A (zh) 信息推荐方法及装置
CN103761254A (zh) 多领域服务主题匹配推荐方法
CN106951527B (zh) 一种歌曲推荐方法及装置
CN111209477B (zh) 一种信息推荐的方法及装置、电子设备、存储介质
CN108921587B (zh) 一种数据处理方法、装置及服务器
CN107203558B (zh) 对象推荐方法和装置、推荐信息处理方法和装置
WO2018137420A1 (zh) 一种信息推荐列表的生成方法及装置
KR20190128246A (ko) 검색 방법 및 장치 및 비-일시적 컴퓨터-판독가능 저장 매체
CN109410001A (zh) 一种商品推荐方法、***、电子设备和存储介质
CN110969172A (zh) 一种文本的分类方法以及相关设备
CN115187345A (zh) 智能家居建材推荐方法、装置、设备及存储介质
CN112784998A (zh) 数据处理方法及装置、计算设备
CN110909258A (zh) 一种信息推荐方法、装置、设备及存储介质
WO2017000341A1 (zh) 一种信息处理方法、装置以及终端
CN113886697A (zh) 基于聚类算法的活动推荐方法、装置、设备及存储介质
CN110019832B (zh) 语言模型的获取方法和装置
JP2014074961A (ja) 商品推薦装置及び方法及びプログラム
CN111368195B (zh) 一种模型训练方法、装置、设备及存储介质
CN111667018A (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant