CN113407763A - 热点音乐挖掘方法及电子设备和计算机可读存储介质 - Google Patents

热点音乐挖掘方法及电子设备和计算机可读存储介质 Download PDF

Info

Publication number
CN113407763A
CN113407763A CN202110707822.3A CN202110707822A CN113407763A CN 113407763 A CN113407763 A CN 113407763A CN 202110707822 A CN202110707822 A CN 202110707822A CN 113407763 A CN113407763 A CN 113407763A
Authority
CN
China
Prior art keywords
music
seed
user
operation behavior
mined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110707822.3A
Other languages
English (en)
Inventor
夏兵朝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Music Entertainment Technology Shenzhen Co Ltd
Original Assignee
Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Music Entertainment Technology Shenzhen Co Ltd filed Critical Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority to CN202110707822.3A priority Critical patent/CN113407763A/zh
Publication of CN113407763A publication Critical patent/CN113407763A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种热点音乐挖掘方法、装置及一种电子设备和计算机可读存储介质,该方法包括:在音乐平台的所有用户中确定种子用户,并基于种子用户的操作行为数据构建第一特征向量;基于种子用户的操作行为数据确定待挖掘音乐,并基于待挖掘音乐的基本信息构建第二特征向量;对第一特征向量和第二特征向量进行拼接得到待挖掘音乐的目标特征向量;将目标特征向量输入训练完成的神经网络模型中,得到潜力热点音乐的预测结果。本申请提供的热点音乐挖掘方法,提高了热点音乐挖掘的准确性。

Description

热点音乐挖掘方法及电子设备和计算机可读存储介质
技术领域
本申请涉及热点挖掘技术领域,更具体地说,涉及热点音乐挖掘方法及电子设备和计算机可读存储介质。
背景技术
在相关技术中,热点挖掘技术主要应用于视频、文本等领域,基于内容本身进行统计和监控,而且只能被动监控相关词的热度变化,没有办法迁移到音乐作品这种内容的挖掘,也不能挖掘当前冷门但未来会成为热门的内容。
因此,如何提高挖掘热点音乐的准确性是本领域技术人员需要解决的技术问题。
发明内容
本申请的目的在于提供一种热点音乐挖掘方法及一种电子设备和一种计算机可读存储介质,提高了热点音乐挖掘的准确性。
为实现上述目的,本申请第一方面提供了一种热点音乐挖掘方法,包括:
在音乐平台的所有用户中确定种子用户,并基于所述种子用户的操作行为数据构建第一特征向量;
基于所述种子用户的操作行为数据确定待挖掘音乐,并基于所述待挖掘音乐的基本信息构建第二特征向量;
对所述第一特征向量和所述第二特征向量进行拼接得到所述待挖掘音乐的目标特征向量;
将所述目标特征向量输入训练完成的神经网络模型中,得到潜力热点音乐的预测结果。
为实现上述目的,本申请第二方面提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述热点音乐挖掘方法的步骤。
为实现上述目的,本申请第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述热点音乐挖掘方法的步骤。
通过以上方案可知,本申请提供的一种热点音乐挖掘方法,包括:在音乐平台的所有用户中确定种子用户,并基于所述种子用户的操作行为数据构建第一特征向量;基于所述种子用户的操作行为数据确定待挖掘音乐,并基于所述待挖掘音乐的基本信息构建第二特征向量;对所述第一特征向量和所述第二特征向量进行拼接得到所述待挖掘音乐的目标特征向量;将所述目标特征向量输入训练完成的神经网络模型中,得到潜力热点音乐的预测结果。本申请提供的热点音乐挖掘方法,首先在音乐平台中筛选种子用户,由于种子用户对音乐的鉴赏能力较强或影响力较大,因此基于种的操作行为数据确定的待挖掘音乐成为潜力热点音乐的机会较大。其次,基于种子用户对待挖掘音乐的操作行为数据和待挖掘音乐的基本信息构建目标特征向量,将其输入神经网络模型中得到潜力热点音乐。基于种子用户的操作行为数据构建目标特征向量保障了音乐具有一定的传播度和引爆点,基于待挖掘音乐的基本信息构建目标特征向量保障了音乐的制作质量足够高,两者的结合可以提高挖掘热点音乐的准确性。本申请还公开了一种电子设备和一种计算机可读存储介质,同样能实现上述技术效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1为本申请实施例提供的一种热点音乐挖掘***的架构图;
图2为本申请实施例提供的一种热点音乐挖掘方法的流程图;
图3为本申请实施例提供的另一种热点音乐挖掘方法的流程图;
图4为本申请实施例提供的又一种热点音乐挖掘方法的流程图;
图5为本申请实施例提供的一种热点音乐挖掘装置的结构图;
图6为本申请实施例提供的一种电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解本申请提供的热点音乐挖掘方法,下面对其使用的***进行介绍。参见图1,其示出了本申请实施例提供的一种热点音乐挖掘***的架构图,如图1所示,包括服务器10。
在本申请中,服务器10用于执行热点音乐挖掘方法的步骤,包括:在音乐平台的所有用户中确定种子用户;基于所述种子用户的操作行为数据确定待挖掘音乐,并基于所述操作行为数据和所述待挖掘音乐的基本信息构建所述待挖掘音乐的目标特征向量;将所述目标特征向量输入训练完成的神经网络模型中,得到潜力热点音乐的预测结果。
可以理解的是,服务器10中还可以设置有神经网络模型,用于预测潜力热点音乐,该神经网络模型的输入为基于种子用户对待挖掘音乐的操作行为数据和待挖掘音乐的基本信息构建的目标特征向量,该神经网络模型的输出可以为每个待挖掘音乐对应的潜力值,潜力值大于预设潜力值的待挖掘音乐为潜力热点音乐。
进一步的,上述热点音乐挖掘***还可以包括与服务器10建立通信连接的若干数量的客户端20,客户端20可以包括PC(中文全称:个人计算机,英文全称:PersonalComputer)等固定终端和手机等移动终端,用于显示潜力热点音乐。
本申请实施例公开了一种热点音乐挖掘方法,提高了热点音乐挖掘的准确性。
参见图2,本申请实施例提供的一种热点音乐挖掘方法的流程图,如图2所示,包括:
S101:在音乐平台的所有用户中确定种子用户,并基于所述种子用户的操作行为数据构建第一特征向量;
本实施例的执行主体为上述服务器,目的为在音乐平台中筛选潜力热点音乐。在本步骤中,首先在音乐平台中的所有用户中确定种子用户,由于种子用户对音乐的鉴赏能力较强或影响力较大,因此与种子用户相关的音乐成为潜力热点音乐的机会较大。
作为一种可行的实施方式,所述在音乐平台的所有用户中确定种子用户,包括:确定音乐平台中的当前热门音乐和所述当前热门音乐对应的冷门时间段,将在所述冷门时间段对所述当前热门音乐存在操作行为的用户确定为种子用户。在本实施方式中,将具有前瞻性的操作行为的用户即成功预测当前热门音乐的用户视为具有超前发现眼光的高品位用户,将高品位用户作为种子用户。当前热门音乐的标准可以为当前点击率大于预设点击率的音乐,上述前瞻性的操作行为包括在当前热门音乐的冷门时间段对其进行完播、普通播放、评论、收藏或分享等,在冷门时间段内当前热门音乐的点击率小于预设点击率。在具体实施中,在音乐平台内对当前热门音乐进行分析,在时间上往前回溯确定其对应的冷门时间段,在冷门时间段对当前热门音乐存在操作行为的用户为上述高品位用户。作为一种优选实施方式,可以对上述前瞻性操作行为的次数和持续时间进行分析,将前瞻性操作行为的次数大于预设次数,或持续时间大于预设时间,或两者结合的用户确定为种子用户。
作为另一种可行的实施方式,所述在音乐平台的所有用户中确定种子用户,包括:确定音乐平台中的优质音乐内容,将对所述优质音乐内容存在操作行为的用户确定为种子用户。在本实施方式中,对音乐平台中普通用户生产的内容(User Generated Content,UGC)进行分析,筛选优质音乐内容。此处的优质音乐内容可以包括用户生产的优质评论数、发布的优质歌单视频或播客的数量等,将上述优质音乐内容的生产用户或对上述音乐内容进行评论、收藏或分析的用户视为高创造力用户,将高创造力用户作为种子用户。
作为又一种可行的实施方式,所述在音乐平台的所有用户中确定种子用户,包括:将音乐平台中影响力大于预设影响力的用户确定为种子用户;其中,所述影响力包括在所述音乐平台中的影响力和/或在其他平台中的影响力。在本实施方式中,对音乐平台中所有用户的影响力进行分析,将影响力较大的用户作为种子用户。在具体实施中,可以以用户的关注量、作品数量或互动数据表示该用户的影响力,此处的影响力可以包括在音乐平台中的影响力,也可以包括在其他平台的影响力,也即在本实施方式中,可以对用户在音乐平台的影响力进行分析,还可以对用户在其他平台的影响力进行分析。
进一步的,本实施例还可以对用户的听歌爱好广泛度、新鲜度、冷门度等进行分析,据此筛选出有机会预测热门音乐的种子用户,本实施例不进行具体限定。
在本步骤的基础上,作为一种优选实施方式,所述在音乐平台的所有用户中确定种子用户之后,还包括:基于所述种子用户的用户信息和音乐偏好画像构建所述种子用户的用户特征;在非种子用户中选取非种子训练用户,并基于所述非种子训练用户的用户信息和音乐偏好画像构建所述非种子训练用户的用户特征;利用所述种子用户的用户特征和所述非种子训练用户的用户特征训练分类模型;将除所述非种子训练用户之外的非种子用户的用户信息和音乐偏好画像输入训练完成的分类模型中,以预测扩展种子用户;将所述扩展种子用户加入所述种子用户中。
在具体实施中,基于用户的用户信息和音乐偏好画像构建用户特征,用户信息可以包括年龄、性别、地域、学历等,音乐偏好画像用于描述用户偏好的音乐,可以包括用户的偏好音乐风格、偏好歌手类型等,在此不进行具体限定。将种子用户的用户特征作为正样本,将部分非种子用户的用户特征作为负样本,进行分类模型的训练,此处的分类模型可以包括逻辑回归模型等,在此不进行具体限定。训练完成的分类模型用于对剩余的非种子用户进行预测,筛选出品味、创造力、影响力虽然都不高但具有综合能力的扩展种子用户加入种子用户中。进一步的,还可以对种子用户的关注关系网络、分享传播网络进行分析,在种子用户的关注关系网络、分享传播网络中扩展种子用户。
其次,基于种子用户的操作行为数据构建第一特征向量,每条操作行为数据包括操作行为、执行所述操作行为的种子用户和***作的音乐。作为一种可行的实施方式,所述基于所述种子用户的操作行为数据构建第一特征向量,包括:基于所述种子用户的操作行为数据构建网络拓扑;其中,所述网络拓扑中的节点表示执行所述操作行为的种子用户或***作的音乐,节点与节点之间边表示所述操作行为;按照预设规则遍历所述网络拓扑得到待挖掘音乐序列,对所述待挖掘音乐序列进行特征表示得到第一特征向量。在具体实施中,基于种子用户对音乐的操作行为数据构建网络拓扑,网络拓扑的节点为种子用户与被该种子用户操作的音乐即待挖掘音乐,节点与节点之间边表示种子用户对待挖掘音乐的操作行为,因此可以通过deepwalk或node2vec等算法遍历网络拓扑确定待挖掘音乐序列,其中包括多个待挖掘音乐的标识。进一步的,对待挖掘音乐序列使用word2vec算法进行特征表示得到第二特征向量。
S102:基于所述种子用户的操作行为数据确定待挖掘音乐,并基于所述待挖掘音乐的基本信息构建第二特征向量;
在本步骤中,基于种子用户的操作行为数据确定待挖掘音乐,即将与种子用户相关的音乐确定为待挖掘音乐,可以基于上一步骤中遍历网络拓扑后得到的待挖掘音乐序列确定待挖掘音乐。可以使用卷积神经网络(CNN,ConvolutionalNeuralNetworks)、基于变换器的双向编码器表示技术(BERT,Bidirectional Encoder Representations fromTransformers)、图神经网络(GNN,convolutional Neural Networks)等分别对待挖掘音乐的基本信息进行特征表示,以构建第二特征向量,此处待挖掘音乐的基本信息可以包括内容知识图谱、音频、歌词文本等,内容知识图谱可以包括音乐作品的作词人、作曲人、演唱者、语种、流派标签等,在此不进行具体限定。
S103:对所述第一特征向量和所述第二特征向量进行拼接得到所述待挖掘音乐的目标特征向量;
需要说明的是,基于种子用户的操作行为数据构建第一特征向量保障了音乐具有一定的传播度和引爆点,基于待挖掘音乐的基本信息构建第二特征向量保障了音乐的制作质量足够高,两者拼接得到的目标特征向量可以用于评价音乐是否为潜力热点音乐。
S104:将所述目标特征向量输入训练完成的神经网络模型中,得到潜力热点音乐的预测结果。
在具体实施中,神经网络模型用于预测潜力热点音乐。在本步骤中,将基于种子用户的操作行为数据和待挖掘音乐的基本信息构建的目标特征向量输入训练完成的神经网络模型中,得到潜力热点音乐的预测结果。
作为一种可行的实施方式,本步骤可以包括:将所述目标特征向量输入的预测结果神经网络模型中得到每个所述待挖掘音乐对应的潜力值;将所述潜力值大于预设潜力值的待挖掘音乐确定为潜力热点音乐。在具体实施中,目标特征向量中的每一行对应一个待挖掘音乐,神经网络模型用于预测待挖掘音乐的潜力值,也即将目标特征向量输入神经网络模型中可以得到每个待挖掘音乐对应的潜力值,将潜力值大于预设潜力值的待挖掘音乐确定为潜力热点音乐。
本申请实施例提供的热点音乐挖掘方法,首先在音乐平台中筛选种子用户,由于种子用户对音乐的鉴赏能力较强或影响力较大,因此基于种的操作行为数据确定的待挖掘音乐成为潜力热点音乐的机会较大。其次,基于种子用户对待挖掘音乐的操作行为数据和待挖掘音乐的基本信息构建目标特征向量,将其输入神经网络模型中得到潜力热点音乐。基于种子用户的操作行为数据构建目标特征向量保障了音乐具有一定的传播度和引爆点,基于待挖掘音乐的基本信息构建目标特征向量保障了音乐的制作质量足够高,两者的结合可以提高挖掘热点音乐的准确性。
本申请实施例公开了一种热点音乐挖掘方法,相对于前几个实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
参见图3,本申请实施例提供的另一种热点音乐挖掘方法的流程图,如图3所示,包括:
S201:在音乐平台的所有用户中确定种子用户;
S202:为每个类型的操作行为数据分配对应的权重,并基于所述种子用户的操作行为数据和每个类型的操作行为数据对应的权重构建网络拓扑;
在本实施例中,可以为每个类型的操作行为数据分配对应的权重,例如完播的权重大于普通播放的权重,分享的权重大于评论的权重,具体的权重分配标准本领域技术人员可以根据实际情况灵活设置。基于种子用户的操作行为数据和每个类型的操作行为数据对应的权重构建网络拓扑,也即网络拓扑中的每条边都具有对应的权重。
S203:根据每个类型的操作行为数据对应的权重遍历所述网络拓扑得到待挖掘音乐序列,并对所述待挖掘音乐序列进行特征表示得到第一特征向量;
在本步骤中,基于网络拓扑中的每条边的权重进行遍历得到待挖掘音乐序列,对待挖掘音乐序列进行特征表示,以构建第一特征向量。
S204:基于所述待挖掘音乐序列确定待挖掘音乐,并基于所述待挖掘音乐的基本信息构建第二特征向量;
S205:对所述第一特征向量和所述第二特征向量进行拼接得到所述待挖掘音乐的目标特征向量;
S206:将所述目标特征向量输入训练完成的神经网络模型中,得到潜力热点音乐的预测结果。
由此可见,本实施例为不同类型的操作行为数据分配不同的权重,带权重的网络拓扑可以更加准确的表示种子用户的操作行为,通过遍历带权重的网络拓扑可以得到更加准确目标特征向量,据此预测得到的潜力热点音乐准确度较高。
本实施例介绍神经网络模型的训练过程,具体的:
参见图4,本申请实施例提供的一种神经网络模型的训练方法的流程图,如图4所示,包括:
S301:在音乐平台的所有用户中确定种子用户,并确定所述音乐平台中的当前热门音乐、当前冷门音乐和所述当前热门音乐对应的冷门时间段;
在本实施例中,将音乐平台中的当前热门音乐作为正样本,在音乐平台中的当前冷门音乐随机抽取一定比例作为负样本训练神经网络模型,训练完成的神经网络模型用于预测潜力热门音乐。
S302:基于所述种子用户在所述冷门时间段对所述当前热门音乐的操作行为数据和所述当前热门音乐的基本信息构建所述当前热门音乐对应的训练特征向量;
S303:基于所述种子用户对所述当前冷门音乐的操作行为数据和所述当前冷门音乐的基本信息构建所述当前冷门音乐对应的训练特征向量;
S304:将所述当前热门音乐对应的训练特征向量作为正样本、所述当前冷门音乐对应的训练特征向量作为负样本训练神经网络模型,训练完成的神经网络模型用于基于待挖掘音乐的目标特征向量预测潜力热点音乐。
在具体实施中,基于种子用户在冷门时间段对当前热门音乐的操作行为数据和当前热门音乐的基本信息构建当前热门音乐对应的训练特征向量,即正样本的训练特征向量。基于种子用户对当前冷门音乐的操作行为数据和当前冷门音乐的基本信息构建当前冷门音乐对应的训练特征向量,即负样本的训练特征向量。利用正样本和负样本分别对应的训练特征向量训练神经网络模型,使得训练完成的神经网络模型可以预测输入的目标特征向量对应的待挖掘音乐是否为潜力热点音乐。
下面对本申请实施例提供的一种热点音乐挖掘装置进行介绍,下文描述的一种热点音乐挖掘装置与上文描述的一种热点音乐挖掘方法可以相互参照。
参见图5,本申请实施例提供的一种热点音乐挖掘装置的结构图,如图5所示,包括:
第一构建模块100,用于在音乐平台的所有用户中确定种子用户,并基于所述种子用户的操作行为数据构建第一特征向量;
第二构建模块200,用于基于所述种子用户的操作行为数据确定待挖掘音乐,并基于所述待挖掘音乐的基本信息构建第二特征向量;
拼接模块300,用于对所述第一特征向量和所述第二特征向量进行拼接得到所述待挖掘音乐的目标特征向量;
输入模块400,用于将所述目标特征向量输入训练完成的神经网络模型中,得到潜力热点音乐的预测结果。
本申请实施例提供的热点音乐挖掘装置,首先在音乐平台中筛选种子用户,由于种子用户对音乐的鉴赏能力较强或影响力较大,因此基于种的操作行为数据确定的待挖掘音乐成为潜力热点音乐的机会较大。其次,基于种子用户对待挖掘音乐的操作行为数据和待挖掘音乐的基本信息构建目标特征向量,将其输入神经网络模型中得到潜力热点音乐。基于种子用户的操作行为数据构建目标特征向量保障了音乐具有一定的传播度和引爆点,基于待挖掘音乐的基本信息构建目标特征向量保障了音乐的制作质量足够高,两者的结合可以提高挖掘热点音乐的准确性。
在上述实施例的基础上,作为一种优选实施方式,所述第一构建模块100具体为确定音乐平台中的当前热门音乐和所述当前热门音乐对应的冷门时间段,将在所述冷门时间段对所述当前热门音乐存在操作行为的用户确定为种子用户,并基于所述种子用户的操作行为数据构建第一特征向量的模块;
在上述实施例的基础上,作为一种优选实施方式,所述第一构建模块100具体为确定音乐平台中的优质音乐内容,将对所述优质音乐内容存在操作行为的用户确定为种子用户,并基于所述种子用户的操作行为数据构建第一特征向量的模块;
在上述实施例的基础上,作为一种优选实施方式,所述第一构建模块100具体为将音乐平台中影响力大于预设影响力的用户确定为种子用户,并基于所述种子用户的操作行为数据构建第一特征向量的模块;其中,所述影响力包括在所述音乐平台中的影响力和/或在其他平台中的影响力。
在上述实施例的基础上,作为一种优选实施方式,还包括:
第三构建模块,用于基于所述种子用户的用户信息和音乐偏好画像构建所述种子用户的用户特征;
第四构建模块,用于在非种子用户中选取非种子训练用户,并基于所述非种子训练用户的用户信息和音乐偏好画像构建所述非种子训练用户的用户特征;
第一训练模块,用于利用所述种子用户的用户特征和所述非种子训练用户的用户特征训练分类模型;
预测模块,用于将除所述非种子训练用户之外的非种子用户的用户信息和音乐偏好画像输入训练完成的分类模型中,以预测扩展种子用户;
加入模块,用于将所述扩展种子用户加入所述种子用户中。
在上述实施例的基础上,作为一种优选实施方式,所述第一构建模块100包括:
确定单元,用于在音乐平台的所有用户中确定种子用户;
构建单元,用于基于所述种子用户的操作行为数据构建网络拓扑;其中,每条所述操作行为数据包括操作行为、执行所述操作行为的种子用户和***作的音乐,所述网络拓扑中的节点表示执行所述操作行为的种子用户或***作的音乐,节点与节点之间边表示所述操作行为;
遍历单元,用于按照预设规则遍历所述网络拓扑得到待挖掘音乐序列,对所述待挖掘音乐序列进行特征表示得到第一特征向量。
在上述实施例的基础上,作为一种优选实施方式,所述第二构建模块200具体为基于所述待挖掘音乐序列确定待挖掘音乐,并基于所述待挖掘音乐的基本信息构建第二特征向量的模块。
在上述实施例的基础上,作为一种优选实施方式,所述构建单元具体为为每个类型的操作行为数据分配对应的权重,并基于所述种子用户的操作行为数据和每个类型的操作行为数据对应的权重构建网络拓扑,根据所述网络拓扑确定待挖掘音乐的单元;
相应的,所述遍历单元具体为根据每个类型的操作行为数据对应的权重遍历所述网络拓扑得到待挖掘音乐序列,对所述待挖掘音乐序列进行特征表示得到第一特征向量的单元。
在上述实施例的基础上,作为一种优选实施方式,所述输入模块400具体为将所述目标特征向量输入训练完成的神经网络模型中得到每个所述待挖掘音乐对应的潜力值,将所述潜力值大于预设潜力值的待挖掘音乐确定为潜力热点音乐的模块。
在上述实施例的基础上,作为一种优选实施方式,还包括:
确定模块,用于在音乐平台的所有用户中确定种子用户,并确定所述音乐平台中的当前热门音乐、当前冷门音乐和所述当前热门音乐对应的冷门时间段;
第五构建模块,用于基于所述种子用户在所述冷门时间段对所述当前热门音乐的操作行为数据和所述当前热门音乐的基本信息构建所述当前热门音乐对应的训练特征向量;
第六构建模块,用于基于所述种子用户对所述当前冷门音乐的操作行为数据和所述当前冷门音乐的基本信息构建所述当前冷门音乐对应的训练特征向量;
第二训练模块,用于将所述当前热门音乐对应的训练特征向量作为正样本、所述当前冷门音乐对应的训练特征向量作为负样本训练神经网络模型,训练完成的神经网络模型用于基于待挖掘音乐的目标特征向量预测潜力热点音乐。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本申请还提供了一种电子设备,参见图6,本申请实施例提供的一种电子设备60的结构图,如图6所示,可以包括处理器61和存储器62。
其中,处理器61可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器61可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器61也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器61可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器61还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器62可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器62还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器62至少用于存储以下计算机程序621,其中,该计算机程序被处理器61加载并执行之后,能够实现前述任一实施例公开的由服务器侧执行的热点音乐挖掘方法中的相关步骤。另外,存储器62所存储的资源还可以包括操作***622和数据623等,存储方式可以是短暂存储或者永久存储。其中,操作***622可以包括Windows、Unix、Linux等。
在一些实施例中,电子设备60还可包括有显示屏63、输入输出接口64、通信接口65、传感器66、电源67以及通信总线68。
当然,图6所示的电子设备的结构并不构成对本申请实施例中电子设备的限定,在实际应用中电子设备可以包括比图6所示的更多或更少的部件,或者组合某些部件。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述任一实施例电子设备所执行的热点音乐挖掘方法的步骤。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种热点音乐挖掘方法,其特征在于,包括:
在音乐平台的所有用户中确定种子用户,并基于所述种子用户的操作行为数据构建第一特征向量;
基于所述种子用户的操作行为数据确定待挖掘音乐,并基于所述待挖掘音乐的基本信息构建第二特征向量;
对所述第一特征向量和所述第二特征向量进行拼接得到所述待挖掘音乐的目标特征向量;
将所述目标特征向量输入训练完成的神经网络模型中,得到潜力热点音乐的预测结果。
2.根据权利要求1所述热点音乐挖掘方法,其特征在于,所述在音乐平台的所有用户中确定种子用户之后,还包括:
基于所述种子用户的用户信息和音乐偏好画像构建所述种子用户的用户特征;
在非种子用户中选取非种子训练用户,并基于所述非种子训练用户的用户信息和音乐偏好画像构建所述非种子训练用户的用户特征;
利用所述种子用户的用户特征和所述非种子训练用户的用户特征训练分类模型;
将除所述非种子训练用户之外的非种子用户的用户信息和音乐偏好画像输入训练完成的分类模型中,以预测扩展种子用户;
将所述扩展种子用户加入所述种子用户中。
3.根据权利要求1所述热点音乐挖掘方法,其特征在于,所述在音乐平台的所有用户中确定种子用户,包括:
确定音乐平台中的当前热门音乐和所述当前热门音乐对应的冷门时间段,将在所述冷门时间段对所述当前热门音乐存在操作行为的用户确定为种子用户;
和/或,确定音乐平台中的优质音乐内容,将对所述优质音乐内容存在操作行为的用户确定为种子用户;
和/或,将音乐平台中影响力大于预设影响力的用户确定为种子用户;其中,所述影响力包括在所述音乐平台中的影响力和/或在其他平台中的影响力。
4.根据权利要求1所述热点音乐挖掘方法,其特征在于,所述基于所述种子用户的操作行为数据构建第一特征向量,包括:
基于所述种子用户的操作行为数据构建网络拓扑;其中,每条所述操作行为数据包括操作行为、执行所述操作行为的种子用户和***作的音乐,所述网络拓扑中的节点表示执行所述操作行为的种子用户或***作的音乐,节点与节点之间边表示所述操作行为;
按照预设规则遍历所述网络拓扑得到待挖掘音乐序列,对所述待挖掘音乐序列进行特征表示得到第一特征向量。
5.根据权利要求4所述热点音乐挖掘方法,其特征在于,所述基于所述种子用户的操作行为数据确定待挖掘音乐,包括:
基于所述待挖掘音乐序列确定待挖掘音乐。
6.根据权利要求4所述热点音乐挖掘方法,其特征在于,所述基于所述种子用户的操作行为数据构建网络拓扑,包括:
为每个类型的操作行为数据分配对应的权重,并基于所述种子用户的操作行为数据和每个类型的操作行为数据对应的权重构建网络拓扑;
相应的,所述按照预设规则遍历所述网络拓扑得到待挖掘音乐序列,包括:
根据每个类型的操作行为数据对应的权重遍历所述网络拓扑得到待挖掘音乐序列。
7.根据权利要求1所述热点音乐挖掘方法,其特征在于,将所述目标特征向量输入训练完成的神经网络模型中,得到潜力热点音乐的预测结果,包括:
将所述目标特征向量输入训练完成的神经网络模型中,得到每个所述待挖掘音乐对应的潜力值;
将所述潜力值大于预设潜力值的待挖掘音乐确定为潜力热点音乐。
8.一种神经网络模型的训练方法,其特征在于,包括:
在音乐平台的所有用户中确定种子用户,并确定所述音乐平台中的当前热门音乐、当前冷门音乐和所述当前热门音乐对应的冷门时间段;
基于所述种子用户在所述冷门时间段对所述当前热门音乐的操作行为数据和所述当前热门音乐的基本信息构建所述当前热门音乐对应的训练特征向量;
基于所述种子用户对所述当前冷门音乐的操作行为数据和所述当前冷门音乐的基本信息构建所述当前冷门音乐对应的训练特征向量;
将所述当前热门音乐对应的训练特征向量作为正样本、所述当前冷门音乐对应的训练特征向量作为负样本训练神经网络模型,训练完成的神经网络模型用于基于待挖掘音乐的目标特征向量预测潜力热点音乐。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述热点音乐挖掘方法或如权利要求8所述神经网络模型的训练方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述热点音乐挖掘方法或如权利要求8所述神经网络模型的训练方法的步骤。
CN202110707822.3A 2021-06-24 2021-06-24 热点音乐挖掘方法及电子设备和计算机可读存储介质 Pending CN113407763A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110707822.3A CN113407763A (zh) 2021-06-24 2021-06-24 热点音乐挖掘方法及电子设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110707822.3A CN113407763A (zh) 2021-06-24 2021-06-24 热点音乐挖掘方法及电子设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN113407763A true CN113407763A (zh) 2021-09-17

Family

ID=77683153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110707822.3A Pending CN113407763A (zh) 2021-06-24 2021-06-24 热点音乐挖掘方法及电子设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113407763A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766449A (zh) * 2017-09-26 2018-03-06 杭州云赢网络科技有限公司 热点挖掘方法、装置、电子设备及存储介质
CN109903086A (zh) * 2019-02-14 2019-06-18 北京奇艺世纪科技有限公司 一种相似人群扩展方法、装置及电子设备
CN110457387A (zh) * 2019-08-19 2019-11-15 腾讯科技(深圳)有限公司 一种应用于网络中用户标签确定的方法及相关装置
CN111144936A (zh) * 2019-12-19 2020-05-12 有米科技股份有限公司 基于用户标签的相似人群扩展方法及装置
CN111444379A (zh) * 2020-03-30 2020-07-24 腾讯科技(深圳)有限公司 音频的特征向量生成方法及音频片段表示模型的训练方法
CN112231511A (zh) * 2020-10-20 2021-01-15 腾讯音乐娱乐科技(深圳)有限公司 一种神经网络模型训练方法及歌曲挖掘方法、装置
CN112667714A (zh) * 2021-03-17 2021-04-16 腾讯科技(深圳)有限公司 基于深度学习的用户画像优化方法、装置及存储介质
US20210127140A1 (en) * 2018-04-09 2021-04-29 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
CN112925973A (zh) * 2019-12-06 2021-06-08 北京沃东天骏信息技术有限公司 数据处理方法和装置
CN112950276A (zh) * 2021-03-12 2021-06-11 华扬联众数字技术(深圳)有限公司 一种基于多阶特征组合的种子人群拓展方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766449A (zh) * 2017-09-26 2018-03-06 杭州云赢网络科技有限公司 热点挖掘方法、装置、电子设备及存储介质
US20210127140A1 (en) * 2018-04-09 2021-04-29 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
CN109903086A (zh) * 2019-02-14 2019-06-18 北京奇艺世纪科技有限公司 一种相似人群扩展方法、装置及电子设备
CN110457387A (zh) * 2019-08-19 2019-11-15 腾讯科技(深圳)有限公司 一种应用于网络中用户标签确定的方法及相关装置
CN112925973A (zh) * 2019-12-06 2021-06-08 北京沃东天骏信息技术有限公司 数据处理方法和装置
CN111144936A (zh) * 2019-12-19 2020-05-12 有米科技股份有限公司 基于用户标签的相似人群扩展方法及装置
CN111444379A (zh) * 2020-03-30 2020-07-24 腾讯科技(深圳)有限公司 音频的特征向量生成方法及音频片段表示模型的训练方法
CN112231511A (zh) * 2020-10-20 2021-01-15 腾讯音乐娱乐科技(深圳)有限公司 一种神经网络模型训练方法及歌曲挖掘方法、装置
CN112950276A (zh) * 2021-03-12 2021-06-11 华扬联众数字技术(深圳)有限公司 一种基于多阶特征组合的种子人群拓展方法
CN112667714A (zh) * 2021-03-17 2021-04-16 腾讯科技(深圳)有限公司 基于深度学习的用户画像优化方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王娜等: "一种基于用户播放行为序列的个性化视频推荐策略", 计算机学报, vol. 43, no. 01, 31 January 2020 (2020-01-31), pages 123 - 135 *

Similar Documents

Publication Publication Date Title
KR102302609B1 (ko) 신경망 아키텍처 최적화
Wauters et al. A nearest neighbour extension to project duration forecasting with artificial intelligence
WO2019114423A1 (zh) 对模型预测值进行融合的方法、装置和设备
CN111090756B (zh) 基于人工智能的多目标推荐模型的训练方法及装置
US20200410392A1 (en) Task-aware command recommendation and proactive help
CN111046286A (zh) 一种对象推荐方法、装置、以及计算机存储介质
US10565401B2 (en) Sorting and displaying documents according to sentiment level in an online community
US11830496B2 (en) Generating and providing inclusivity data insights for evaluating participants in a communication
CN105144227A (zh) 社交媒体影响力评估
CN114172820B (zh) 跨域sfc动态部署方法、装置、计算机设备及存储介质
WO2021115311A1 (zh) 乐曲生成方法、装置、电子设备及存储介质
JP2019502144A (ja) オーディオ情報処理方法およびデバイス
CN111104599B (zh) 用于输出信息的方法和装置
JP7488871B2 (ja) 対話推薦方法、装置、電子機器、記憶媒体ならびにコンピュータプログラム
CN110727868A (zh) 对象推荐方法、装置和计算机可读存储介质
WO2019000472A1 (zh) 导航方法、装置、存储介质以及服务器
US11205418B2 (en) Monotone speech detection
CN112035549A (zh) 数据挖掘方法、装置、计算机设备及存储介质
CN112182281B (zh) 一种音频推荐方法、装置及存储介质
CN115801980A (zh) 视频生成方法和装置
CN113077815B (zh) 一种音频评估方法及组件
Lu et al. Detecting and understanding branching frequency changes in process models
Caschera et al. MONDE: a method for predicting social network dynamics and evolution
CN112765398A (zh) 一种信息推荐方法、装置及存储介质
CN117194687A (zh) 多媒体推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination