CN113127674B - 歌单推荐方法、装置、电子设备及计算机存储介质 - Google Patents
歌单推荐方法、装置、电子设备及计算机存储介质 Download PDFInfo
- Publication number
- CN113127674B CN113127674B CN201911407361.7A CN201911407361A CN113127674B CN 113127674 B CN113127674 B CN 113127674B CN 201911407361 A CN201911407361 A CN 201911407361A CN 113127674 B CN113127674 B CN 113127674B
- Authority
- CN
- China
- Prior art keywords
- song
- user
- period
- determining
- behavior data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/638—Presentation of query results
- G06F16/639—Presentation of query results using playlists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种歌单推荐方法、装置、电子设备及计算机存储介质。该歌单推荐方法包括:获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据;其中,用户第一时段歌曲行为数据所属的第一时段在用户第二时段歌曲行为数据所属的第二时段之后;利用用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,确定目标歌单;向用户终端发送目标歌单。根据本发明实施例,能够提高歌单推荐的准确性。
Description
技术领域
本发明属于数据处理技术领域,尤其涉及一种歌单推荐方法、装置、电子设备及计算机存储介质。
背景技术
目前,移动终端除了具有通信功能之外,音乐播放功能已经成为一项必不可少的附加功能。然而,面对如今海量的歌曲资源库,用户面临着新的问题:如何快速地找到适合自己的歌曲。对此,传统的在线音乐推送方法将歌曲进行大致分类,诸如民谣、摇滚、爵士等,然后提供给用户以进行选择,如果用户选择其中的一种或多种分类,则推送选择的分类下的相应歌曲。通过分类而进行的传统在线音乐推送方法虽然可以免去用户自己搜索、选择和播放的过程,但是用户仍然很难听到自己想听的歌曲,这是由于:第一,歌曲的分类过于简单和笼统,因为随着歌曲创作的多样化,很难用某一单词完全描述其类型和风格;第二,仅提供歌曲的简单分类供用户选择,很难满足用户的多元化需求。
因此如何提高歌单推荐的准确性是本领域技术人员亟需解决的技术问题。
发明内容
本发明实施例提供一种歌单推荐方法、装置、设备及计算机存储介质,能够提高歌单推荐的准确性。
第一方面,提供了一种歌单推荐方法,包括:
获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据;其中,用户第一时段歌曲行为数据所属的第一时段在用户第二时段歌曲行为数据所属的第二时段之后;
利用用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,确定目标歌单;
向用户终端发送目标歌单。
可选地,利用用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,确定目标歌单,包括:
基于权值打分算法,利用用户第一时段歌曲行为数据,确定第一歌单和每个第一歌单对应的第一评分;
基于余弦相似性算法,利用用户第二时段歌曲行为数据,确定第二歌单和第二歌单对应的第二评分;
根据第一歌单的第一评分和第二歌单的第二评分确定目标歌单。
可选地,基于权值打分算法,利用用户第一时段歌曲行为数据,确定第一歌单和每个第一歌单对应的第一评分,包括:
根据用户第一时段歌曲行为数据,确定用户第一时段歌曲行为数据对应的第一歌曲;其中,用户第一时段歌曲行为数据对应的用户第一时段歌曲行为类型包括:用户第一时段歌曲下载、用户第一时段歌曲收藏和用户第一时段歌曲试听;每个第一歌曲对应至少一种用户第一时段歌曲行为;
确定包含第一歌曲的第一歌单;
根据第一歌单中第一歌曲的数量以及每个第一歌曲对应的用户第一时段歌曲行为,确定第一歌单的第一评分。
可选地,基于余弦相似性算法,利用用户第二时段歌曲行为数据,确定第二歌单和第二歌单对应的第二评分,包括:
根据用户第二时段歌曲行为数据,确定用户第二时段歌曲行为数据对应的第二歌曲;
根据预设的歌曲标签信息确定第二歌曲的标签,并对第二歌曲的标签进行去重处理,将去重后的歌曲标签作为用户标签;
分别计算用户标签与各个第二歌曲的歌曲标签之间的余弦相似性,得到余弦相似性数值;
依据各个余弦相似性数值从大到小的顺序,确定数值最大的预设数量个余弦相似性数值对应的第二歌曲;
基于数值最大的预设数量个余弦相似性数值对应的第二歌曲,确定第二歌单和第二评分。
可选地,根据预设的歌曲标签信息确定第二歌曲的标签,并对第二歌曲的标签进行去重处理,将去重后的歌曲标签作为用户标签,包括:
根据每个第二歌曲的歌曲标识号,确定第二歌曲对应的版权信息;
依据预设版权标签映射表,确定每个版权信息对应的歌曲标签;
对第二歌曲的标签进行去重处理,并将去重后的歌曲标签作为用户标签。
可选地,获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,包括:
根据预设数据源表,确定用户第一时段歌曲行为数据和用户第二时段歌曲行为数据。
第二方面,提供了一种歌单推荐装置,包括:
获取模块,用于获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据;其中,用户第一时段歌曲行为数据所属的第一时段在用户第二时段歌曲行为数据所属的第二时段之后;
确定模块,用于利用用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,确定目标歌单;
发送模块,用于向用户终端发送目标歌单。
可选地,确定模块,包括:
第一歌单确定子模块,用于基于权值打分算法,利用用户第一时段歌曲行为数据,确定第一歌单和每个第一歌单对应的第一评分;
第二歌单确定子模块,用于基于余弦相似性算法,利用用户第二时段歌曲行为数据,确定第二歌单和第二歌单对应的第二评分;
目标歌单确定子模块,用于根据第一歌单的第一评分和第二歌单的第二评分确定目标歌单。
可选地,第一歌单确定子模块,包括:
第一歌曲确定单元,用于根据用户第一时段歌曲行为数据,确定用户第一时段歌曲行为数据对应的第一歌曲;其中,用户第一时段歌曲行为数据对应的用户第一时段歌曲行为类型包括:用户第一时段歌曲下载、用户第一时段歌曲收藏和用户第一时段歌曲试听;每个第一歌曲对应至少一种用户第一时段歌曲行为;
第一歌单确定单元,用于确定包含第一歌曲的第一歌单;
第一评分确定单元,用于根据第一歌单中第一歌曲的数量以及每个第一歌曲对应的用户第一时段歌曲行为,确定第一歌单的第一评分。
可选地,第二歌单确定子模块,包括:
第二歌曲确定单元,用于根据用户第二时段歌曲行为数据,确定用户第二时段歌曲行为数据对应的第二歌曲;
用户标签确定单元,用于根据预设的歌曲标签信息确定第二歌曲的标签,并对第二歌曲的标签进行去重处理,将去重后的歌曲标签作为用户标签;
余弦相似性计算单元,用于分别计算用户标签与各个第二歌曲的歌曲标签之间的余弦相似性,得到余弦相似性数值;
第二歌曲确定单元,用于依据各个余弦相似性数值从大到小的顺序,确定数值最大的预设数量个余弦相似性数值对应的第二歌曲;
第二歌单确定单元,用于基于数值最大的预设数量个余弦相似性数值对应的第二歌曲,确定第二歌单和第二评分。
可选地,用户标签确定单元,包括:
版权信息确定子单元,用于根据每个第二歌曲的歌曲标识号,确定第二歌曲对应的版权信息;
歌曲标签确定子单元,用于依据预设版权标签映射表,确定每个版权信息对应的歌曲标签;
用户标签确定子单元,用于对第二歌曲的标签进行去重处理,并将去重后的歌曲标签作为用户标签。
可选地,获取模块,包括:
获取子模块,用于根据预设数据源表,确定用户第一时段歌曲行为数据和用户第二时段歌曲行为数据。
第三方面,提供了一种电子设备,电子设备包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现第一方面或第一方面任一可选的实现方式中的歌单推荐方法。
第四方面,提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面或第一方面任一可选的实现方式中的歌单推荐方法。
本发明实施例的歌单推荐方法、装置、电子设备及计算机存储介质,能够提高歌单推荐的准确性。该歌单推荐方法先是获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,由于用户第一时段歌曲行为数据和用户第二时段歌曲行为数据能够反映用户的歌曲偏爱属性特征,故利用用户第一时段歌曲行为数据和用户第二时段歌曲行为数据确定目标歌单,能够提高歌单推荐的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种歌单推荐方法的流程示意图;
图2是本发明实施例提供的另一种歌单推荐方法的流程示意图;
图3是本发明实施例提供的一种歌单推荐装置的结构示意图;
图4是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
目前,移动终端除了具有通信功能之外,音乐播放功能已经成为一项必不可少的附加功能。然而,面对如今海量的歌曲资源库,用户面临着新的问题:如何快速地找到适合自己的歌曲。对此,传统的在线音乐推送方法将歌曲进行大致分类,诸如民谣、摇滚、爵士等,然后提供给用户以进行选择,如果用户选择其中的一种或多种分类,则推送选择的分类下的相应歌曲。通过分类而进行的传统在线音乐推送方法虽然可以免去用户自己搜索、选择和播放的过程,但是用户仍然很难听到自己想听的歌曲,这是由于:第一,歌曲的分类过于简单和笼统,因为随着歌曲创作的多样化,很难用某一单词完全描述其类型和风格;第二,仅提供歌曲的简单分类供用户选择,很难满足用户的多元化需求。
为了解决现有技术问题,本发明实施例提供了一种歌单推荐方法、装置、电子设备及计算机存储介质。下面首先对本发明实施例所提供的歌单推荐方法进行介绍。
图1是本发明实施例提供的一种歌单推荐方法的流程示意图。如图1所示,该歌单推荐方法包括:
S101、获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据;其中,用户第一时段歌曲行为数据所属的第一时段在用户第二时段歌曲行为数据所属的第二时段之后。
第一时段和第二时段的时长可以相同,也可以不相同,均不作具体限定。在一个实施例中,用户第一时段歌曲行为数据即为用户近期歌曲行为数据,用户第二时段歌曲行为数据即为用户远期歌曲行为数据。
为了获取更加准确的用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,在一个实施例中,获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,通常可以包括:根据预设数据源表,确定用户第一时段歌曲行为数据和用户第二时段歌曲行为数据。
在一个实施例中,为了使推荐的歌单即符合用户近期的行为,又同时符合用户的长期偏好,分别获取用户近期歌曲行为数据和用户长期歌曲行为数据。用户近期歌曲行为数据即为用户近期下载的歌曲、用户收藏的歌曲、用户视听的歌曲,并寻找包含上述歌曲的歌单;用户长期歌曲行为数据包括从日志中获取的用户标签及歌曲标签;数据源表如表1所示,表头包括数据源名称和HIVE(数据仓库工具)表。
表1
根据数据源表,获取用户近期歌曲行为数据以确定歌单。其中,歌单筛选规则包括:
(1)筛选歌单播放列表,筛选条件:
a)某日期以后创建的歌单,该日期距离当前日期不超过15天。
b)歌单名字设定。
c)歌单内的有效歌曲数量不能低于5首。
(2)在每日收藏的歌单中,识别出编辑的歌单。
S102、利用用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,确定目标歌单。
S103、向用户终端发送目标歌单。
为了给用户推荐更加准确的歌单,在一个实施例中,利用用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,确定目标歌单,通常包括:基于权值打分算法,利用用户第一时段歌曲行为数据,确定第一歌单和每个第一歌单对应的第一评分;基于余弦相似性算法,利用用户第二时段歌曲行为数据,确定第二歌单和第二歌单对应的第二评分;根据第一歌单的第一评分和第二歌单的第二评分确定目标歌单。
为了确定更加准确的第一歌单和第一评分,在一个实施例中,基于权值打分算法,利用用户第一时段歌曲行为数据,确定第一歌单和每个第一歌单对应的第一评分,通常包括:根据用户第一时段歌曲行为数据,确定用户第一时段歌曲行为数据对应的第一歌曲;其中,用户第一时段歌曲行为数据对应的用户第一时段歌曲行为类型包括:用户第一时段歌曲下载、用户第一时段歌曲收藏和用户第一时段歌曲试听;每个第一歌曲对应至少一种用户第一时段歌曲行为;确定包含第一歌曲的第一歌单;根据第一歌单中第一歌曲的数量以及每个第一歌曲对应的用户第一时段歌曲行为,确定第一歌单的第一评分。
在一个实施例中,对用户近期歌曲行为数据使用权值打分的方法处理,利用数据源表及权值评分表确定所有第一歌单和每个第一歌单的第一评分,权值评分表如表2所示。
表2权值评分表
在一个实施例中,依据权值评分表确定每个第一歌单的第一评分,具体包括依据以下行为确定歌单的评分:
(1)针对用户下载行为:
在推荐周期内,根据用户下载的歌曲,寻找包含该歌曲的歌单,每有1首歌在其中,则该歌单得4分,按不同歌曲累计求和。
(2)用户收藏行为:
在推荐周期内,根据用户收藏的歌曲,寻找包含该歌曲的歌单,每有1首歌在其中,则该歌单得3分,按不同歌曲累计求和。
(3)针对用户试听行为:
在推荐周期内,根据用户试听(试听时间大于180s)的歌曲,寻找包含该歌曲的歌单,每有1首歌在其中,则该歌单得1分,按不同歌曲累计求和。
为了确定更加准确的第二歌单和第二评分,在一个实施例中,基于余弦相似性算法,利用用户第二时段歌曲行为数据,确定第二歌单和第二歌单对应的第二评分,通常可以包括:根据用户第二时段歌曲行为数据,确定用户第二时段歌曲行为数据对应的第二歌曲;根据预设的歌曲标签信息确定第二歌曲的标签,并对第二歌曲的标签进行去重处理,将去重后的歌曲标签作为用户标签;分别计算用户标签与各个第二歌曲的歌曲标签之间的余弦相似性,得到余弦相似性数值;依据各个余弦相似性数值从大到小的顺序,确定数值最大的预设数量个余弦相似性数值对应的第二歌曲;基于数值最大的预设数量个余弦相似性数值对应的第二歌曲,确定第二歌单和第二评分。
为了确定更加准确的用户标签,在一个实施例中,根据预设的歌曲标签信息确定第二歌曲的标签,并对第二歌曲的标签进行去重处理,将去重后的歌曲标签作为用户标签,通常可以包括:根据每个第二歌曲的歌曲标识号,确定第二歌曲对应的版权信息;依据预设版权标签映射表,确定每个版权信息对应的歌曲标签;对第二歌曲的标签进行去重处理,并将去重后的歌曲标签作为用户标签。
在一个实施例中,对用户远期歌曲行为数据使用余弦相似性算法处理,具体包括:
用户标签与歌单标签的相似性计算,采用余弦相似性的计算方法,余弦相似性计算公式如下:
对于二维空间,根据向量点积公式,显然可以得知:
其中,公式(1)中a、b表示两个向量,θ为来两者之间的夹角。
假设向量a,b的坐标表示分别为(x1,y1)、(x2,y2)。则:
推广到多维,设向量A=(A1,A2,…An),B=(B1,B2,…Bn),则有:
其中,n表示向量A的维度,Ai表示第i个A向量,Bi表示第i个B向量。
一个计算示例如下:
用户标签集合为{0,1,0,…,1},歌曲标签集合为{1,1,0,…,1},将向量带入公式可计算相似性分值。其中,标签的总维度,每日根据数据预处理的情况动态生成,取值为用户标签和歌单标签的并集。
用户长期歌曲行为数据的处理逻辑,根据版权-标签(copyright_tag)关系表找出歌曲的标签,然后将歌曲标签去重后作为用户标签。最后利用用户标签与歌曲标签计算余弦相似性,取出TOP50的歌曲作为一个歌单,并将该歌单的评分记为8分。
结合两种方法(权值打分算法和余弦相似性算法)汇总评分进行歌单推荐,具体包括:
(1)按用户及不同的评分来源,汇总计算出歌单的最终评分,按分值降序排列。
(2)5天推荐的歌单不重复,生成歌单推荐历史表。
(3)将每日歌单评分TOP1的歌曲同时***历史表和推荐表。
下面以一个具体实施例对上述内容进行说明,如图2所示,先是进行用户歌曲数据收集,获取用户近期歌曲行为数据和用户长期歌曲行为数据。然后,一方面针对用户近期歌曲行为数据,根据用户的下载、收藏、试听行为进行筛选加权求和,确定至少一个第一歌单和每个第一歌单对应的第一评分;另一方面针对用户近期歌曲行为数据,利用用户标签和歌曲标签进行标签余弦相似性的计算并进行筛选操作,确定一个第二歌单及对应的第二评分。最后,基于每个第一歌单对应的第一评分和第二歌单的第二评分,进行汇总评分推荐操作,确定目标歌单。该实施例具有如下有益效果:
1、对用户近期行为数据使用权值打分的方法处理,对用户长期行为数据使用余弦相似性算法处理,两种算法相结合的方式进行数据处理,对比单一权重打分的处理方法,数据处理更为准确完善。
2、余弦相似性算法处理用户长期行为数据时,根据每日数据情况动态生成标签的总维度,取值为用户标签和歌曲标签的并集,数据匹配更为准确。
3、使用的用户行为数据包括用户近期歌曲行为数据和用户长期的歌曲行为数据,数据收集更精准、更全面。
下面对本发明实施例提供的一种歌单推荐装置、电子设备及计算机存储介质进行介绍,下文描述的歌单推荐装置、电子设备及计算机存储介质与上文描述的歌单推荐方法可相互对应参照。
图3是本发明实施例提供的一种歌单推荐装置的结构示意图,如图3所示,该歌单推荐装置可以包括:
获取模块301,用于获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据;其中,用户第一时段歌曲行为数据所属的第一时段在用户第二时段歌曲行为数据所属的第二时段之后;
确定模块302,用于利用用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,确定目标歌单;
发送模块303,用于向用户终端发送目标歌单。
可选地,在一个实施例中,确定模块302,包括:
第一歌单确定子模块,用于基于权值打分算法,利用用户第一时段歌曲行为数据,确定第一歌单和每个第一歌单对应的第一评分;
第二歌单确定子模块,用于基于余弦相似性算法,利用用户第二时段歌曲行为数据,确定第二歌单和第二歌单对应的第二评分;
目标歌单确定子模块,用于根据第一歌单的第一评分和第二歌单的第二评分确定目标歌单。
可选地,在一个实施例中,第一歌单确定子模块,包括:
第一歌曲确定单元,用于根据用户第一时段歌曲行为数据,确定用户第一时段歌曲行为数据对应的第一歌曲;其中,用户第一时段歌曲行为数据对应的用户第一时段歌曲行为类型包括:用户第一时段歌曲下载、用户第一时段歌曲收藏和用户第一时段歌曲试听;每个第一歌曲对应至少一种用户第一时段歌曲行为;
第一歌单确定单元,用于确定包含第一歌曲的第一歌单;
第一评分确定单元,用于根据第一歌单中第一歌曲的数量以及每个第一歌曲对应的用户第一时段歌曲行为,确定第一歌单的第一评分。
可选地,在一个实施例中,第二歌单确定子模块,包括:
第二歌曲确定单元,用于根据用户第二时段歌曲行为数据,确定用户第二时段歌曲行为数据对应的第二歌曲;
用户标签确定单元,用于根据预设的歌曲标签信息确定第二歌曲的标签,并对第二歌曲的标签进行去重处理,将去重后的歌曲标签作为用户标签;
余弦相似性计算单元,用于分别计算用户标签与各个第二歌曲的歌曲标签之间的余弦相似性,得到余弦相似性数值;
第二歌曲确定单元,用于依据各个余弦相似性数值从大到小的顺序,确定数值最大的预设数量个余弦相似性数值对应的第二歌曲;
第二歌单确定单元,用于基于数值最大的预设数量个余弦相似性数值对应的第二歌曲,确定第二歌单和第二评分。
可选地,在一个实施例中,用户标签确定单元,包括:
版权信息确定子单元,用于根据每个第二歌曲的歌曲标识号,确定第二歌曲对应的版权信息;
歌曲标签确定子单元,用于依据预设版权标签映射表,确定每个版权信息对应的歌曲标签;
用户标签确定子单元,用于对第二歌曲的标签进行去重处理,并将去重后的歌曲标签作为用户标签。
可选地,在一个实施例中,获取模块,包括:
获取子模块,用于根据预设数据源表,确定用户第一时段歌曲行为数据和用户第二时段歌曲行为数据。
图3提供的歌单推荐装置中的各个模块具有实现图1所示实例中各个步骤的功能,并达到与图1所示歌单推荐方法相同的技术效果,为简洁描述,在此不再赘述。
图4是本发明一个实施例提供的一种电子设备的结构示意图。
电子设备可以包括处理器401以及存储有计算机程序指令的存储器402。
具体地,上述处理器401可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器402可在综合网关容灾设备的内部或外部。在特定实施例中,存储器402是非易失性固态存储器。在特定实施例中,存储器402包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现上述实施例中的任意一种歌单推荐方法。
在一个示例中,电子设备还可包括通信接口403和总线410。其中,如图4所示,处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。
通信接口403,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线410包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、***组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线410可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
另外,结合上述实施例中的歌单推荐方法,本发明实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现图1所示实施例中的歌单推荐方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或***。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的***、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (9)
1.一种歌单推荐方法,其特征在于,包括:
获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据;其中,所述用户第一时段歌曲行为数据所属的第一时段在所述用户第二时段歌曲行为数据所属的第二时段之后;
利用所述用户第一时段歌曲行为数据和所述用户第二时段歌曲行为数据,确定目标歌单;
向用户终端发送所述目标歌单;
所述利用所述用户第一时段歌曲行为数据和所述用户第二时段歌曲行为数据,确定目标歌单,包括:
基于权值打分算法,利用所述用户第一时段歌曲行为数据,确定第一歌单和每个所述第一歌单对应的第一评分;
基于余弦相似性算法,利用所述用户第二时段歌曲行为数据,确定第二歌单和所述第二歌单对应的第二评分;
根据所述第一歌单的所述第一评分和所述第二歌单的所述第二评分确定所述目标歌单;
所述基于权值打分算法,利用所述用户第一时段歌曲行为数据,确定第一歌单和每个所述第一歌单对应的第一评分,包括:
根据所述用户第一时段歌曲行为数据,确定所述用户第一时段歌曲行为数据对应的第一歌曲;其中,所述用户第一时段歌曲行为数据对应的用户第一时段歌曲行为类型包括:用户第一时段歌曲下载、用户第一时段歌曲收藏和用户第一时段歌曲试听;每个所述第一歌曲对应至少一种用户第一时段歌曲行为;
确定包含所述第一歌曲的所述第一歌单;
根据所述第一歌单中所述第一歌曲的数量以及每个所述第一歌曲对应的用户第一时段歌曲行为,确定所述第一歌单的所述第一评分。
2.根据权利要求1所述的歌单推荐方法,其特征在于,所述基于余弦相似性算法,利用所述用户第二时段歌曲行为数据,确定第二歌单和所述第二歌单对应的第二评分,包括:
根据所述用户第二时段歌曲行为数据,确定所述用户第二时段歌曲行为数据对应的第二歌曲;
根据预设的歌曲标签信息确定所述第二歌曲的标签,并对所述第二歌曲的标签进行去重处理,将去重后的歌曲标签作为用户标签;
分别计算所述用户标签与各个所述第二歌曲的所述歌曲标签之间的余弦相似性,得到余弦相似性数值;
依据各个所述余弦相似性数值从大到小的顺序,确定数值最大的预设数量个余弦相似性数值对应的第二歌曲;
基于所述数值最大的预设数量个余弦相似性数值对应的第二歌曲,确定所述第二歌单和所述第二评分。
3.根据权利要求2所述的歌单推荐方法,其特征在于,所述根据预设的歌曲标签信息确定所述第二歌曲的标签,并对所述第二歌曲的标签进行去重处理,将去重后的歌曲标签作为用户标签,包括:
根据每个所述第二歌曲的歌曲标识号,确定所述第二歌曲对应的版权信息;
依据预设版权标签映射表,确定每个所述版权信息对应的歌曲标签;
对所述第二歌曲的标签进行去重处理,并将去重后的歌曲标签作为所述用户标签。
4.根据权利要求1至3任一项所述的歌单推荐方法,其特征在于,所述获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据,包括:
根据预设数据源表,确定所述用户第一时段歌曲行为数据和所述用户第二时段歌曲行为数据。
5.一种歌单推荐装置,其特征在于,包括:
获取模块,用于获取用户第一时段歌曲行为数据和用户第二时段歌曲行为数据;其中,所述用户第一时段歌曲行为数据所属的第一时段在所述用户第二时段歌曲行为数据所属的第二时段之后;
确定模块,用于利用所述用户第一时段歌曲行为数据和所述用户第二时段歌曲行为数据,确定目标歌单;
发送模块,用于向用户终端发送所述目标歌单;
所述确定模块,包括:
第一歌单确定子模块,用于基于权值打分算法,利用所述用户第一时段歌曲行为数据,确定第一歌单和每个所述第一歌单对应的第一评分;
第二歌单确定子模块,用于基于余弦相似性算法,利用所述用户第二时段歌曲行为数据,确定第二歌单和所述第二歌单对应的第二评分;
目标歌单确定子模块,用于根据所述第一歌单的所述第一评分和所述第二歌单的所述第二评分确定所述目标歌单;
所述第一歌单确定子模块,包括:
第一歌曲确定单元,用于根据所述用户第一时段歌曲行为数据,确定所述用户第一时段歌曲行为数据对应的第一歌曲;其中,所述用户第一时段歌曲行为数据对应的用户第一时段歌曲行为类型包括:用户第一时段歌曲下载、用户第一时段歌曲收藏和用户第一时段歌曲试听;每个所述第一歌曲对应至少一种用户第一时段歌曲行为;
第一歌单确定单元,用于确定包含所述第一歌曲的所述第一歌单;
第一评分确定单元,用于根据所述第一歌单中所述第一歌曲的数量以及每个所述第一歌曲对应的用户第一时段歌曲行为,确定所述第一歌单的所述第一评分。
6.根据权利要求5所述的歌单推荐装置,其特征在于,所述第二歌单确定子模块,包括:
第二歌曲确定单元,用于根据所述用户第二时段歌曲行为数据,确定所述用户第二时段歌曲行为数据对应的第二歌曲;
用户标签确定单元,用于根据预设的歌曲标签信息确定所述第二歌曲的标签,并对所述第二歌曲的标签进行去重处理,将去重后的歌曲标签作为用户标签;
余弦相似性计算单元,用于分别计算所述用户标签与各个所述第二歌曲的所述歌曲标签之间的余弦相似性,得到余弦相似性数值;
第二歌曲确定单元,用于依据各个所述余弦相似性数值从大到小的顺序,确定数值最大的预设数量个余弦相似性数值对应的第二歌曲;
第二歌单确定单元,用于基于所述数值最大的预设数量个余弦相似性数值对应的第二歌曲,确定所述第二歌单和所述第二评分。
7.根据权利要求6所述的歌单推荐装置,其特征在于,所述用户标签确定单元,包括:
版权信息确定子单元,用于根据每个所述第二歌曲的歌曲标识号,确定所述第二歌曲对应的版权信息;
歌曲标签确定子单元,用于依据预设版权标签映射表,确定每个所述版权信息对应的歌曲标签;
用户标签确定子单元,用于对所述第二歌曲的标签进行去重处理,并将去重后的歌曲标签作为所述用户标签。
8.一种电子设备,其特征在于,所述电子设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-4任意一项所述的歌单推荐方法。
9.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-4任意一项所述的歌单推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911407361.7A CN113127674B (zh) | 2019-12-31 | 2019-12-31 | 歌单推荐方法、装置、电子设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911407361.7A CN113127674B (zh) | 2019-12-31 | 2019-12-31 | 歌单推荐方法、装置、电子设备及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113127674A CN113127674A (zh) | 2021-07-16 |
CN113127674B true CN113127674B (zh) | 2023-07-21 |
Family
ID=76769398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911407361.7A Active CN113127674B (zh) | 2019-12-31 | 2019-12-31 | 歌单推荐方法、装置、电子设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113127674B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012118572A (ja) * | 2010-11-29 | 2012-06-21 | Nec Corp | コンテンツ推薦システム、コンテンツ推薦装置、推薦方式制御方法、及び推薦方式制御プログラム |
CN104021162A (zh) * | 2014-05-28 | 2014-09-03 | 小米科技有限责任公司 | 一种为多媒体资源打分的方法及装置 |
CN104166696A (zh) * | 2014-08-01 | 2014-11-26 | 小米科技有限责任公司 | 应用程序推送方法及装置 |
CN105718510A (zh) * | 2016-01-12 | 2016-06-29 | 海信集团有限公司 | 一种多媒体数据推荐方法及装置 |
CN109189951A (zh) * | 2018-07-03 | 2019-01-11 | 上海掌门科技有限公司 | 一种多媒体资源推荐方法、设备及存储介质 |
CN109408665A (zh) * | 2018-12-29 | 2019-03-01 | 咪咕音乐有限公司 | 一种信息推荐方法及装置、存储介质 |
CN109543111A (zh) * | 2018-11-28 | 2019-03-29 | 广州虎牙信息科技有限公司 | 推荐信息筛选方法、装置、存储介质及服务器 |
CN109857935A (zh) * | 2019-01-24 | 2019-06-07 | 腾讯科技(深圳)有限公司 | 一种信息推荐方法及装置 |
CN109885719A (zh) * | 2019-01-24 | 2019-06-14 | 广州小鹏汽车科技有限公司 | 一种歌曲推荐方法、***、终端及存储介质 |
CN110413837A (zh) * | 2019-05-30 | 2019-11-05 | 腾讯科技(深圳)有限公司 | 视频推荐方法和装置 |
CN110532479A (zh) * | 2019-09-05 | 2019-12-03 | 北京思维造物信息科技股份有限公司 | 一种信息推荐方法、装置及设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090138457A1 (en) * | 2007-11-26 | 2009-05-28 | Concert Technology Corporation | Grouping and weighting media categories with time periods |
US20180357548A1 (en) * | 2015-04-30 | 2018-12-13 | Google Inc. | Recommending Media Containing Song Lyrics |
-
2019
- 2019-12-31 CN CN201911407361.7A patent/CN113127674B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012118572A (ja) * | 2010-11-29 | 2012-06-21 | Nec Corp | コンテンツ推薦システム、コンテンツ推薦装置、推薦方式制御方法、及び推薦方式制御プログラム |
CN104021162A (zh) * | 2014-05-28 | 2014-09-03 | 小米科技有限责任公司 | 一种为多媒体资源打分的方法及装置 |
CN104166696A (zh) * | 2014-08-01 | 2014-11-26 | 小米科技有限责任公司 | 应用程序推送方法及装置 |
CN105718510A (zh) * | 2016-01-12 | 2016-06-29 | 海信集团有限公司 | 一种多媒体数据推荐方法及装置 |
CN109189951A (zh) * | 2018-07-03 | 2019-01-11 | 上海掌门科技有限公司 | 一种多媒体资源推荐方法、设备及存储介质 |
CN109543111A (zh) * | 2018-11-28 | 2019-03-29 | 广州虎牙信息科技有限公司 | 推荐信息筛选方法、装置、存储介质及服务器 |
CN109408665A (zh) * | 2018-12-29 | 2019-03-01 | 咪咕音乐有限公司 | 一种信息推荐方法及装置、存储介质 |
CN109857935A (zh) * | 2019-01-24 | 2019-06-07 | 腾讯科技(深圳)有限公司 | 一种信息推荐方法及装置 |
CN109885719A (zh) * | 2019-01-24 | 2019-06-14 | 广州小鹏汽车科技有限公司 | 一种歌曲推荐方法、***、终端及存储介质 |
CN110413837A (zh) * | 2019-05-30 | 2019-11-05 | 腾讯科技(深圳)有限公司 | 视频推荐方法和装置 |
CN110532479A (zh) * | 2019-09-05 | 2019-12-03 | 北京思维造物信息科技股份有限公司 | 一种信息推荐方法、装置及设备 |
Non-Patent Citations (4)
Title |
---|
Incorporating time dynamics and implicit feedback into music recommender systems;Sánchez-Moreno D 等;《2018 IEEE/WIC/ACM International Conference on Web Intelligence (WI)》;20190113;580-585 * |
基于特征值嵌入的音乐播放列表推荐模型;何丽 等;《计算机技术与发展》;20190627;第29卷(第11期);144-148 * |
基于用户行为分析和混合推荐策略的个性化推荐方法研究;赵伟明;《中国优秀硕士学位论文全文数据库信息科技辑》;20150315(第3期);I138-2800 * |
基于用户行为时间特征的音乐推荐算法设计与实现;李梦娴;《中国优秀硕士学位论文全文数据库信息科技辑》;20180715(第7期);I138-1979 * |
Also Published As
Publication number | Publication date |
---|---|
CN113127674A (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109408665B (zh) | 一种信息推荐方法及装置、存储介质 | |
JP5575902B2 (ja) | クエリのセマンティックパターンに基づく情報検索 | |
CN102799591B (zh) | 一种提供推荐词的方法及装置 | |
CN106778862B (zh) | 一种信息分类方法及装置 | |
CN106951571B (zh) | 一种给应用标注标签的方法和装置 | |
WO2011037603A1 (en) | Searching for information based on generic attributes of the query | |
CN114707074B (zh) | 一种内容推荐方法、设备和*** | |
CN107832444B (zh) | 基于搜索日志的事件发现方法及装置 | |
CN111242318B (zh) | 基于异构特征库的业务模型训练方法及装置 | |
CN111612499B (zh) | 信息的推送方法及装置、存储介质、终端 | |
CN112685642A (zh) | 一种标签推荐方法、装置、电子设备及存储介质 | |
CN112102031A (zh) | 一种推荐方法、推荐装置及终端设备 | |
CN112329954B (zh) | 物品召回方法、装置、终端设备及存储介质 | |
CN111737608A (zh) | 企业信息检索结果排序方法及装置 | |
CN112733006B (zh) | 用户画像的生成方法、装置、设备及存储介质 | |
CN114040012A (zh) | 一种信息查询推送方法、装置及计算机设备 | |
CN113127674B (zh) | 歌单推荐方法、装置、电子设备及计算机存储介质 | |
CN111429200B (zh) | 一种内容关联方法及装置、存储介质、计算机设备 | |
CN111160975A (zh) | 一种目标用户确定方法、装置、设备及计算机存储介质 | |
CN115687756B (zh) | 一种搜索推荐方法及装置 | |
CN114676336B (zh) | 一种智能分类便于进行检索查找的网络搜索*** | |
CN104463627A (zh) | 数据处理方法和装置 | |
CN113627509B (zh) | 数据分类方法、装置、计算机设备及计算机可读存储介质 | |
CN112541357B (zh) | 实体识别方法、装置及智能设备 | |
CN111625619A (zh) | 查询省略方法、装置、计算机可读介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |