CN109710797B - 音频文件的推送方法、装置、电子装置和存储介质 - Google Patents

音频文件的推送方法、装置、电子装置和存储介质 Download PDF

Info

Publication number
CN109710797B
CN109710797B CN201811354706.2A CN201811354706A CN109710797B CN 109710797 B CN109710797 B CN 109710797B CN 201811354706 A CN201811354706 A CN 201811354706A CN 109710797 B CN109710797 B CN 109710797B
Authority
CN
China
Prior art keywords
range
audio file
target
note
notes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811354706.2A
Other languages
English (en)
Other versions
CN109710797A (zh
Inventor
沈文浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201811354706.2A priority Critical patent/CN109710797B/zh
Publication of CN109710797A publication Critical patent/CN109710797A/zh
Application granted granted Critical
Publication of CN109710797B publication Critical patent/CN109710797B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本发明公开了一种音频文件的推送方法、装置、电子装置和存储介质。其中,该方法包括:接收目标帐号发出的播放指令,其中,播放指令用于指示播放具有第一标识的音频文件;根据目标帐号的历史演唱数据获取目标帐号的音域范围;响应于播放指令,根据音域范围查找具有第一标识的目标音频文件,其中,目标音频文件的音域与音域范围相匹配;向目标帐号推送目标音频文件。本发明解决了推送音频文件不准确的技术问题。

Description

音频文件的推送方法、装置、电子装置和存储介质
技术领域
本发明涉及多媒体领域,具体而言,涉及一种音频文件的推送方法、装置、电子装置和存储介质。
背景技术
目前唱歌软件的伴奏推荐方案基本都是基于用户画像的推荐。而基于用户画像的推荐,最核心的算法就是基于用户点唱历史行为分析的个性化推荐算法。用户点唱历史中,会带有伴奏类型(情歌,励志歌曲等)、伴奏歌曲原唱、伴奏等标签属性,根据标签属性找到满足用户点唱历史中的标签属性的数据,返回给用户,完成伴奏推荐。
目前唱歌伴奏的推荐技术最主要的缺陷是:利用用户点唱历史的标签属性数据以及伴奏库中的标签属性来进行匹配推荐,但是由于属性分类不全面,推荐的内容不够精准,无法匹配到适合用户演唱的伴奏。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种音频文件的推送方法、装置、电子装置和存储介质,以至少解决推送音频文件不准确的技术问题。
根据本发明实施例的一个方面,提供了一种音频文件的推送方法,包括:接收目标帐号发出的播放指令,其中,播放指令用于指示播放具有第一标识的音频文件;根据目标帐号的历史演唱数据获取目标帐号的音域范围;响应于播放指令,根据音域范围查找具有第一标识的目标音频文件,其中,目标音频文件的音域与音域范围相匹配;向目标帐号推送目标音频文件。
根据本发明实施例的另一方面,还提供了一种音频文件的推送装置,包括:接收单元,用于接收目标帐号发出的播放指令,其中,播放指令用于指示播放具有第一标识的音频文件;获取单元,用于根据目标帐号的历史演唱数据获取目标帐号的音域范围;查找单元,用于响应于播放指令,根据音域范围查找具有第一标识的目标音频文件,其中,目标音频文件的音域与音域范围相匹配;第一推送单元,用于向目标帐号推送目标音频文件。
根据本发明实施例的一方面,还提供了一种存储介质,存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的方法。
根据本发明实施例的一方面,还提供了一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为通过计算机程序执行上述的方法。
本实施例向用户推荐伴奏文件时,根据用户的历史演唱数据所表现出的音域范围来匹配目标音频文件,使得推送的音频文件更适合用户演唱,演唱的音调与伴奏的音调相似度更高,达到提高推送音频文件的准确性的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的硬件环境的示意图;
图2是根据本发明实施例的音频文件的推送方法的流程图;
图3是根据本发明实施例的一种搜索界面的示意图;
图4是根据本发明实施例的另一种搜索界面的示意图;
图5是根据本发明实施例的音符得分的示意图;
图6是根据本发明实施例的搜索前推荐界面的示意图;
图7是本发明实施例的音频文件的推送方法的***架构图;
图8是根据本发明实施例的音频文件的推送装置的示意图;
图9是根据本发明实施例的一种电子装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
名词解释:
MIDI,全称为Musical Instrument Digital Interface(即乐器数字接口),是一种广泛使用的音乐标准格式。
根据本发明实施例的一个方面,提供了一种音频文件的推送方法。在本实施例中,上述音频文件的推送方法可以应用于如图1所示的服务器101所构成的硬件环境中,可选地,该硬件环境还可包括登录有目标帐号的用户终端102。如图1所示,用户终端102通过网络与服务器101进行连接,上述网络包括但不限于:广域网、城域网或局域网,用户终端102包括但不局限于手机、平板电脑等移动终端,个人计算机PC等计算机终端。
图2是根据本发明实施例的音频文件的推送方法的流程图。该音频文件的推送方法可以但不局限于通过服务器101来执行,如图2所示,以通过服务器101来执行为例,该音频文件的推送方法包括如下步骤:
S202,服务器接收目标帐号发出的播放指令,播放指令用于指示播放具有第一标识的音频文件。
播放指令可以通过搜索第一标识来发送,第一标识可以是歌曲名称、歌手名称以及歌曲关联的影视剧的名称等。例如,用户通过搜索框输入歌曲名称来指示播放该歌曲名称相关的伴奏音频文件。该歌曲名称所对应歌曲的伴奏音频文件即具有第一标识的音频文件。
上述音频文件可在用户终端上播放,该用户终端上登录有目标帐号,如安装在用户终端的音频客户端上登录有该目标帐号。
S204,服务器根据目标帐号的历史演唱数据获取目标帐号的音域范围。
音域范围是适合目标帐号演唱的音符的范围。音符可以表示音调,高音的音调和低音的音调都是不容易演唱的,可以根据目标帐号的历史演唱数据来获取该目标帐号所擅长的音符的范围,即,确定目标帐号的音域范围。
S206,响应于播放指令,服务器根据音域范围查找具有第一标识的目标音频文件,目标音频文件的音域与音域范围相匹配。
在音频数据库中查找目标音频文件,目标音频文件是具有第一标识的文件,也就是,目标帐号搜索的音频文件中与第一标识相同的伴奏音频文件。例如,目标帐号搜索了《XXXXX》,查找的目标音频文件是《XXXXX》的伴奏音频文件。目标音频文件的音域与音域范围相匹配,例如,目标帐号为男声,原唱为女声,在伴奏有男声版时,查找到的目标音频文件为男生版的伴奏,即男声伴奏的音域与目标帐号的音域范围相匹配。
S208,服务器向目标帐号推送目标音频文件。
如图3和图4所示。目标帐号通过图3所示的搜索框中输入第一标识,如“XXXXX”,展示查找到的伴奏文件。排在第一位的是目标音频文件,是与目标帐号的音域范围最匹配的伴奏音频文件。图3显示的是伴奏标签下推荐的音频文件,图4显示的是总和标签下推荐的音频文件,包括伴奏音频文件和其他音频文件。
本实施例向用户推荐伴奏文件时,根据用户的历史演唱数据所表现出的音域范围来匹配目标音频文件,使得推送的音频文件更适合用户演唱,使得演唱的音调与伴奏的音调的相似度更高,解决现有技术推送音频文件不准确的技术问题,达到提高推送音频文件的准确性的技术效果。
可选地,服务器根据目标帐号的历史演唱数据获取目标帐号的音域范围可包括:获取历史演唱数据中目标音符的音调参数,其中,音调参数用于表示演唱的音调与音符本身音调的相似度;获取目标音符的音调参数平均值;根据音调参数平均值和每个音符的音调参数确定音域范围。
音调参数可以是每个音符的得分,该得分可以利用唱歌应用程序本身的评分***进行评分。当用户演唱的音符与音符本身的音调的相似度越高,该音符的得分就越高,当目标帐号对应的用户演唱的歌曲中,得分高的音符越多,完成演唱的这首歌曲的整体得分越高。本实施例要对用户的音频数据进行分析,而单纯的音频数据不好分析,需要转化为MIDI文件,并且结合唱歌应用程序本身的评分***,分析得出演唱得分-音高的对应关系和得分模型,最终和伴奏库中伴奏的音域范围进行匹配推荐。
目标音符可以是历史演唱数据中是所有音符,也可以是历史演唱数据中有用户演唱部分的音符,也可以是一首音乐的高潮部分或者有演唱难度的部分的音符,即,目标音符可以是历史演唱数据中的全部音符或者部分音符,以下以目标音符为历史演唱数据中的全部音符为例进行说明。
首先,基于MIDI文件分析的音符-得分关系建模。
本实施例主要利用MIDI文件得到用户录音数据中的每个音符,并且利用唱歌应用的演唱得分***,得到每个音符的得分数据。MIDI文件里有MIDI events和meta-event,而音符信息就是在meta-event中,所有的meta-event都以0xFF开头,其中音符信息就是0x7F开头,所以通过识别0xFF和0x7F就能得到用户录音音频的每个音符,并且在得分***中查询到每个音符的得分,建立演唱得分-音符的对应关系,然后经过用户多个录音音频算出每个音符的平均得分,再根据每个音符的平均得分确定所有音符的平均分,所有音符的平均分即音符参数平均值,进而得出用户得分较高的音域范围(比如得分高于所有音高的平均得分的部分)。
其中,每个音符的平均分可以根据用户的多个录音音频得到,将多个录音音频中相同音符的得分求加权平均值,将求得的加权平均值作为该音符的平均得分。
可选地,服务器根据音调参数平均值和每个音符的音调参数确定音域范围可包括:按照音符所表示的音调从低音到高音的顺序,将第一个高于音调参数平均值的第一音符作为音域范围的下限;按照音符所表示的音调从高音到低音的顺序,将第一个高于音调参数平均值的第二音符作为音域范围的上限;将下限到上限之间的连续音符所表示的音调作为音域范围。
如图5所示,音符包括C、#C、D、#D、E、F、#F、G、#G、A、#A、B,这些音符的在用户所有录音音频中的平均得分依次为60、70、80、70、80、60、90、70、80、70、60、20。图5中所有音符的平均得分是:67.5分,则可以从低音调算起,第一个高于平均分的音调作为下限(#C),从高音向低音算起,第一个高于平均分的作为上限(A),而一般用户演唱都是高音上不去或者低音下不来,上面取到的两个上下限可以简单认为是用户上不去和下不来的界限,在这两个边界中间的音符可以粗略认为用户是可以表现好的,所以这里取到的用户最适合的音域范围是:#C至A之间的连续音符,然后再从伴奏库中找到满足这个音域范围的伴奏推荐给用户。
在服务器确定与音域范围匹配的目标音频文件时,可以采用以下两种方案,包括:选取所有音符都在音域范围内的音频文件作为目标音频文件,以及,选取一定比例的音符在音域范围以外的音频文件作为目标音频文件。
可选地,服务器根据音域范围查找具有第一标识的目标音频文件可包括:获取音域范围的音调最高值和音调最低值;查找音符的音调处于音调最高值和音调最低值之间的音频文件;将查找到的音频文件作为目标音频文件。
在图5所示的例子中,音域范围是#C至A之间的连续音符,那么,查找音调的最高值不高于A,和音调的最低值不低于#C的音频文件,得到目标音频文件。按照这种方法查找到的目标音频文件中所有音符的都处于#C至A这个范围内。这样目标音频文件的所有音符都有适合用户演唱的音高,因此,推荐给用户的目标音频文件是适合用户演唱的,也就是说,用户演唱目标音频文件时,唱出了的每个音符与音符本身的相似度比较高。
由于音乐本身的音符变化的特性,导致有些音乐不能保证所有音符都在音域范围内,但是,超出音域范围内的音符比较少,也是适合用户演唱的音频文件,这些音频文件也可以推荐给用户。即,根据音域范围查找具有第一标识的目标音频文件包括:获取音域范围的音调最高值和音调最低值;查找音调处于音调最高值和音调最低值以外的第一音符的占比小于预设值的音频文件;将查找到的音频文件作为目标音频文件,其中,查找到的音频文件的占比为第一音符的个数与查找到的音频文件的所有音符的个数之间的比例。
例如,一个音频文件中所有音符的个数有200个,其中,不在音域范围内的第一音符个数为9个,那么,这个占比为1/20,在预设值为1/30的情况下,该具有1/20占比的音频文件就可以作为目标音频文件。需要说明的是,预设值是可以调整的,例如,针对不同类型的音乐可以调整预设值。
可选地,服务器在向目标帐号推送目标音频文件之后,方法还包括:获取目标帐号的目标录音数据,其中,目标录音数据为与目标音频文件关联的演唱数据;提取目标录音数据中每个音符的音调参数,得到提取结果;根据提取结果调整音域范围,得到调整后的音域范围;根据调整后的音域范围为目标帐号推送第一音频文件,其中,第一音频文件具有第一标识或者不具有第一标识。
本实施例可以根据用户的录音数据实时调整音域范围,在用户演唱完成一首歌曲后,利用评分***可以得到当前演唱完成的目标音频文件中每个音符的得分情况,根据得分情况调整用户的音域范围。例如,扩大或者缩小音域范围,向高音移动音域范围或者向低音移动音域范围等。并且,根据调整后的音域范围再次为用户对应的目标帐号推送音频文件,该推送的音频文件为第一音频文件。推送的第一音频文件可以是与目标音频文件具有相同或者不相同的第一标识的音频文件。例如,目标音频文件是男声版伴奏的《XXXXX》,再次推荐的可以是女声版伴奏的《XXXXX》,还可以是其他歌曲的伴奏。但是,无论是哪种情况,推荐的音频文件都是与目标帐号的音域范围向匹配的。
可选地,服务器在接收目标帐号发出的播放指令之前,方法还包括:根据目标帐号的音域范围查找与音域范围相匹配的至少一个音频文件;向目标帐号推送至少一个音频文件。
应用程序打开后,在接收到播放指令之前,可以向目标帐号推荐至少一个音频文件,如图6所示,在页面上可以显示多个标签,如:猜你喜欢、点唱榜、飙升榜和新歌榜等。在猜你喜欢的标签下面,可以显示多个音频文件,这些音频文件的音域都是与目标帐号的音域范围相匹配的,可以在目标帐号没有演唱目标时快速从猜你喜欢的标签下面选择喜欢的音乐,并且适合用户演唱,提高了应用的便捷性和用户体验。
图7是本发明实施例的音频文件的推送方法的***架构图。以下结合图7对本发明实施例进行说明。
步骤S701,用户通过手机等用户终端发起点唱行为;
步骤S702,用户终端向推荐后台发起推荐请求;
步骤S703,推荐后台向服务器(服务器存储了用户音频MIDI文件和最佳音域范围)查询用户最佳音域范围匹配的伴奏;
步骤S704,接收服务器返回的与用户最佳音域范围匹配的伴奏,即符合条件的伴奏;
步骤S705,推荐后台向伴奏音频MIDI文件服务器中查询和用户最佳音域范围匹配的伴奏;
步骤S706,推荐后台接收伴奏音频MIDI文件服务器返回的符合条件的伴奏;
步骤S707,推荐后台向用户终端返回推荐结果,如返回给用户终端的“全民K歌”音频软件,并通过用户终端显示给用户;
步骤S708,用户终端收集的用户演唱音频数据,即产生用户原始音域数据,并发送给用户原始音频数据服务器进行存储;
步骤S709,智能MIDI文件转换服务器定期扫描用户原始音频数据(即用户原始音域数据)这一服务器存储的用户数据;
步骤S710,智能MIDI文件转换服务器结合评分后台得出的每个音高的得分,返回用户得分较高的音域范围,以确定出用户得分较高的音域范围;
步骤S711,智能MIDI文件转换服务器将MIDI文件和用户最佳音域范围发送给用户音频MIDI文件和最佳音域范围服务器进行存储。
本申请实施例对用户的录音音频进行分析,一方面更加贴近用户,使推荐会更加精准,另一方面也对这部分存储数据加以利用,提升了这部分存储数据的价值。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种用于实施上述音频文件的推送方法的音频文件的推送装置,如图8所示,该装置包括:
接收单元802,用于接收目标帐号发出的播放指令,其中,播放指令用于指示播放具有第一标识的音频文件;
播放指令可以通过搜索第一标识来发送,第一标识可以是歌曲名称、歌手名称以及歌曲关联的影视剧的名称等。例如,用户通过搜索框输入歌曲名称来指示播放该歌曲名称相关的伴奏音频文件。该歌曲名称所对应歌曲的伴奏音频文件即具有第一标识的音频文件。
获取单元804,用于根据目标帐号的历史演唱数据获取目标帐号的音域范围;
音域范围是适合目标帐号演唱的音符的范围。音符可以表示音调,高音的音调和低音的音调都是不容易演唱的,可以根据目标帐号的历史演唱数据来获取该目标帐号所擅长的音符的范围,即,确定目标帐号的音域范围。
查找单元806,用于响应于播放指令,根据音域范围查找具有第一标识的目标音频文件,其中,目标音频文件的音域与音域范围相匹配;
在音频数据库中查找目标音频文件,目标音频文件是具有第一标识的文件,也就是,目标帐号搜索的音频文件中与第一标识相同的伴奏音频文件。例如,目标帐号搜索了《XXXXX》,查找的目标音频文件是《XXXXX》的伴奏音频文件。目标音频文件的音域与音域范围相匹配,例如,目标帐号为男声,原唱为女声,在伴奏有男声版时,查找到的目标音频文件为男生版的伴奏,即男声伴奏的音域与目标帐号的音域范围相匹配。
第一推送单元808,用于向目标帐号推送目标音频文件。
如图3和图4所示。目标帐号通过图3所示的搜索框中输入第一标识,展示查找到的伴奏文件。排在第一位的是目标音频文件,是与目标帐号的音域范围最匹配的伴奏音频文件。图3显示的是伴奏标签下推荐的音频文件,图4显示的是总和标签下推荐的音频文件,包括伴奏音频文件和其他音频文件。
本实施例向用户推荐伴奏文件时,根据用户的历史演唱数据所表现出的音域范围来匹配目标音频文件,使得推送的音频文件更适合用户演唱,使得演唱的音调与伴奏的音调的相似度更高,解决现有技术推送音频文件不准确的技术问题,达到提高推送音频文件的准确性的技术效果。
在确定与音域范围匹配的目标音频文件时,可以采用以下两种方案,包括:选取所有音符都在音域范围内的音频文件作为目标音频文件,以及,选取一定比例的音符在音域范围以外的音频文件作为目标音频文件。
可选地,查找单元包括:第一获取模块,用于获取音域范围的音调最高值和音调最低值;第一查找模块,用于查找音符的音调处于音调最高值和音调最低值之间的音频文件;第一确定模块,用于将查找到的音频文件作为目标音频文件。
可选地,查找单元包括:第二获取模块,用于获取音域范围的音调最高值和音调最低值;第二查找模块,用于查找音调处于音调最高值和音调最低值以外的第一音符的占比小于预设值的音频文件;第二确定模块,用于将查找到的音频文件作为目标音频文件,其中,查找到的音频文件的占比为第一音符的个数与查找到的音频文件的所有音符的个数之间的比例。
在图5所示的例子中,音域范围是#C至A之间的连续音符,那么,查找音调的最高值不高于A,和音调的最低值不低于#C的音频文件,得到目标音频文件。按照这种方法查找到的目标音频文件中所有音符的都处于#C至A这个范围内。这样目标音频文件的所有音符都有适合用户演唱的音高,因此,推荐给用户的目标音频文件是适合用户演唱的,也就是说,用户演唱目标音频文件时,唱出了的每个音符与音符本身的相似度比较高。
由于音乐本身的音符变化的特性,导致有些音乐不能保证所有音符都在音域范围内,但是,超出音域范围内的音符比较少,也是适合用户演唱的音频文件,这些音频文件也可以推荐给用户。即,根据音域范围查找具有第一标识的目标音频文件包括:获取音域范围的音调最高值和音调最低值;查找音调处于音调最高值和音调最低值以外的第一音符的占比小于预设值的音频文件;将查找到的音频文件作为目标音频文件,其中,查找到的音频文件的占比为第一音符的个数与查找到的音频文件的所有音符的个数之间的比例。
例如,一个音频文件中所有音符的个数有200个,其中,不在音域范围内的第一音符个数为9个,那么,这个占比为1/20,在预设值为1/30的情况下,该具有1/20占比的音频文件就可以作为目标音频文件。需要说明的是,预设值是可以调整的,例如,针对不同类型的音乐可以调整预设值。
可选地,获取单元包括:第三获取模块,用于获取历史演唱数据中目标音符的音调参数,其中,音调参数用于表示演唱的音调与音符本身音调的相似度;第四获取模块,用于获取目标音符的音调参数平均值;音域确定模块,用于根据音调参数平均值和每个音符的音调参数确定音域范围。
音调参数可以是每个音符的得分,该得分可以利用唱歌应用程序本身的评分***进行评分。当用户演唱的音符与音符本身的音调的相似度越高,该音符的得分就越高,当目标帐号对应的用户演唱的歌曲中,得分高的音符越多,完成演唱的这首歌曲的整体得分越高。本实施例要对用户的音频数据进行分析,而单纯的音频数据不好分析,需要转化为MIDI文件,并且结合唱歌应用程序本身的评分***,分析得出演唱得分-音高的对应关系和得分模型,最终和伴奏库中伴奏的音域范围进行匹配推荐。
首先,基于MIDI文件分析的音符-得分关系建模。
本实施例主要利用MIDI文件得到用户录音数据中的每个音符,并且利用唱歌应用的演唱得分***,得到每个音符的得分数据。MIDI文件里有MIDI events和meta-event,而音符信息就是在meta-event中,所有的meta-event都以0xFF开头,其中音符信息就是0x7F开头,所以通过识别0xFF和0x7F就能得到用户录音音频的每个音符,并且在得分***中查询到每个音符的得分,建立演唱得分-音符的对应关系,然后经过用户多个录音音频算出每个音符的平均得分,再根据每个音符的平均得分确定所有音符的平均分,所有音符的平均分即音符参数平均值,进而得出用户得分较高的音域范围(比如得分高于所有音高的平均得分的部分)。
其中,每个音符的平均分可以根据用户的多个录音音频得到,将多个录音音频中相同音符的得分求加权平均值,将求得的加权平均值作为该音符的平均得分。
可选地,音域确定模块包括:第一音域子模块,用于按照音符所表示的音调从低音到高音的顺序,将第一个高于音调参数平均值的第一音符作为音域范围的下限;第二音域子模块,用于按照音符所表示的音调从高音到低音的顺序,将第一个高于音调参数平均值的第二音符作为音域范围的上限;音域确定子模块,用于将下限到上限之间的连续音符所表示的音调作为音域范围。
如图5所示,音符包括C、#C、D、#D、E、F、#F、G、#G、A、#A、B,这些音符的在用户所有录音音频中的平均得分依次为60、70、80、70、80、60、90、70、80、70、60、20。图5中所有音符的平均得分是:67.5分,则可以从低音调算起,第一个高于平均分的音调作为下限(#C),从高音向低音算起,第一个高于平均分的作为上限(A),而一般用户演唱都是高音上不去或者低音下不来,上面取到的两个上下限可以简单认为是用户上不去和下不来的界限,在这两个边界中间的音符可以粗略认为用户是可以表现好的,所以这里取到的用户最适合的音域范围是:#C至A之间的连续音符,然后再从伴奏库中找到满足这个音域范围的伴奏推荐给用户。
可选地,装置还包括:录音数据单元,用于在向目标帐号推送目标音频文件之后,获取目标帐号的目标录音数据,其中,目标录音数据为与目标音频文件关联的演唱数据;提取单元,用于提取目标录音数据中每个音符的音调参数,得到提取结果;调整单元,用于根据提取结果调整音域范围,得到调整后的音域范围;第二推送单元,用于根据调整后的音域范围为目标帐号推送第一音频文件,其中,第一音频文件具有第一标识或者不具有第一标识。
本实施例可以根据用户的录音数据实时调整音域范围,在用户演唱完成一首歌曲后,利用评分***可以得到当前演唱完成的目标音频文件中每个音符的得分情况,根据得分情况调整用户的音域范围。例如,扩大或者缩小音域范围,向高音移动音域范围或者向低音移动音域范围等。并且,根据调整后的音域范围再次为用户对应的目标帐号推送音频文件,该推送的音频文件为第一音频文件。推送的第一音频文件可以是与目标音频文件具有相同或者不相同的第一标识的音频文件。例如,目标音频文件是男声版伴奏的《XXXXX》,再次推荐的可以是女声版伴奏的《XXXXX》,还可以是其他歌曲的伴奏。但是,无论是哪种情况,推荐的音频文件都是与目标帐号的音域范围向匹配的。
可选地,装置还包括:匹配单元,用于在接收目标帐号发出的播放指令之前,根据目标帐号的音域范围查找与音域范围相匹配的至少一个音频文件;第三推送单元,用于向目标帐号推送至少一个音频文件。
应用程序打开后,在接收到播放指令之前,可以向目标帐号推荐至少一个音频文件,如图6所示,在页面上可以显示多个标签,如:猜你喜欢、点唱榜、飙升榜和新歌榜等。在猜你喜欢的标签下面,可以显示多个音频文件,这些音频文件的音域都是与目标帐号的音域范围相匹配的,可以在目标帐号没有演唱目标时快速从猜你喜欢的标签下面选择喜欢的音乐,并且适合用户演唱,提高了应用的便捷性和用户体验。
根据本发明实施例的又一个方面,还提供了一种用于实施上述音频文件的推送方法的电子装置(例如但不局限于为图1中示出的服务器),如图9所示,该电子装置包括,包括存储器905和处理器901,该存储器905中存储有计算机程序,该处理器901被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,图9是根据本发明实施例的一种电子装置的结构框图。如图9所示,该电子装置可以包括:一个或多个(图中仅示出一个)处理器901、至少一个通信总线902、用户接口903、至少一个传输装置904和存储器905。其中,通信总线902用于实现这些组件之间的连接通信。其中,用户接口903可以包括显示器906和键盘907。传输装置904可选的可以包括标准的有线接口和无线接口。
可选地,在本实施例中,上述服务器可以为位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,接收目标帐号发出的播放指令,其中,播放指令用于指示播放具有第一标识的音频文件;
S2,根据目标帐号的历史演唱数据获取目标帐号的音域范围;
S3,响应于播放指令,根据音域范围查找具有第一标识的目标音频文件,其中,目标音频文件的音域与音域范围相匹配;
S4,向目标帐号推送目标音频文件。
可选地,本领域普通技术人员可以理解,图9所示的结构仅为示意,电子装置可以但不局限于为图1中所示的服务器。图9其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图9中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图9所示不同的配置。
其中,存储器905可用于存储软件程序以及模块,如本发明实施例中的音频文件的推送方法和装置对应的程序指令/模块,处理器901通过运行存储在存储器905内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的音频文件的推送方法。存储器905可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器905可进一步包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置904用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置904包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置904为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器905用于存储预设动作条件和预设权限用户的信息、以及应用程序。
采用本发明实施例,提供了一种音频文件的推送方法的方案。通过向用户推荐伴奏文件时,根据用户的历史演唱数据所表现出的音域范围来匹配目标音频文件,使得推送的音频文件更适合用户演唱,使得演唱的音调与伴奏的音调的相似度更高,解决现有技术推送音频文件不准确的技术问题,达到提高推送音频文件的准确性的技术效果。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,接收目标帐号发出的播放指令,其中,播放指令用于指示播放具有第一标识的音频文件;
S2,根据目标帐号的历史演唱数据获取目标帐号的音域范围;
S3,响应于播放指令,根据音域范围查找具有第一标识的目标音频文件,其中,目标音频文件的音域与音域范围相匹配;
S4,向目标帐号推送目标音频文件。
可选地,存储介质还被设置为存储用于执行上述实施例中的方法中所包括的步骤的计算机程序,本实施例中对此不再赘述。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种音频文件的推送方法,其特征在于,包括:
接收目标帐号发出的播放指令,其中,所述播放指令用于指示播放具有第一标识的音频文件;
根据所述目标帐号的历史演唱数据获取所述目标帐号的音域范围,具体包括根据目标账号的用户演唱的音符的音调与所述音符本身的音调的相似度确定所述音符的得分,根据多个录音音频确定出所述音符的平均得分,根据所述音符的平均得分确定出所有音符的平均分将所有音符的平均分确定为音符参数平均值,按照音符所表示的音调从低音到高音的顺序,将第一个高于所述音符参数平均值的第一音符作为所述音域范围的下限,按照音符所表示的音调从高音到低音的顺序,将第一个高于所述音符参数平均值的第二音符作为所述音域范围的上限,将所述下限到所述上限之间的连续音符所表示的音调作为所述音域范围;
响应于所述播放指令,获取所述音域范围的音调最高值和音调最低值;查找音调处于所述音调最高值和所述音调最低值以外的第一音符的占比小于预设值的具有所述第一标识的音频文件;将查找到的音频文件作为目标音频文件,其中,所述第一音符的占比为所述第一音符的个数与所述查找到的音频文件的所有音符的个数之间的比例;
向所述目标帐号推送所述目标音频文件。
2.根据权利要求1所述的方法,其特征在于,在向所述目标帐号推送所述目标音频文件之后,所述方法还包括:
获取所述目标帐号的目标录音数据,其中,所述目标录音数据为与所述目标音频文件关联的演唱数据;
提取所述目标录音数据中每个音符的音调参数,得到提取结果;
根据提取结果调整所述音域范围,得到调整后的音域范围;
根据所述调整后的音域范围为所述目标帐号推送第一音频文件。
3.根据权利要求1所述的方法,其特征在于,在接收目标帐号发出的播放指令之前,所述方法还包括:
根据所述目标帐号的所述音域范围查找与所述音域范围相匹配的至少一个音频文件;
向所述目标帐号推送所述至少一个音频文件。
4.一种音频文件的推送装置,其特征在于,包括:
接收单元,用于接收目标帐号发出的播放指令,其中,所述播放指令用于指示播放具有第一标识的音频文件;
获取单元,用于根据所述目标帐号的历史演唱数据获取所述目标帐号的音域范围,具体包括:根据目标账号的用户演唱的音符的音调与所述音符本身的音调的相似度确定所述音符的得分,根据多个录音音频确定出所述音符的平均得分,根据所述音符的平均得分确定出所有音符的平均分将所有音符的平均分确定为音符参数平均值,按照音符所表示的音调从低音到高音的顺序,将第一个高于所述音符参数平均值的第一音符作为所述音域范围的下限,按照音符所表示的音调从高音到低音的顺序,将第一个高于所述音符参数平均值的第二音符作为所述音域范围的上限,将所述下限到所述上限之间的连续音符所表示的音调作为所述音域范围;
查找单元,包括第二获取模块,用于获取所述音域范围的音调最高值和音调最低值;第二查找模块,用于查找音调处于所述音调最高值和所述音调最低值以外的第一音符的占比小于预设值的具有所述第一标识的音频文件;第二确定模块,用于将查找到的音频文件作为目标音频文件,其中,所述第一音符的占比为所述第一音符的个数与所述查找到的音频文件的所有音符的个数之间的比例;
第一推送单元,用于向所述目标帐号推送所述目标音频文件。
5.根据权利要求4所述的装置,其特征在于,所述装置还包括:
录音数据单元,用于在向所述目标帐号推送所述目标音频文件之后,获取所述目标帐号的目标录音数据,其中,所述目标录音数据为与所述目标音频文件关联的演唱数据;
提取单元,用于提取所述目标录音数据中每个音符的音调参数,得到提取结果;
调整单元,用于根据提取结果调整所述音域范围,得到调整后的音域范围;
第二推送单元,用于根据所述调整后的音域范围为所述目标帐号推送第一音频文件。
6.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至3任一项中所述的方法。
7.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至3任一项中所述的方法。
CN201811354706.2A 2018-11-14 2018-11-14 音频文件的推送方法、装置、电子装置和存储介质 Active CN109710797B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811354706.2A CN109710797B (zh) 2018-11-14 2018-11-14 音频文件的推送方法、装置、电子装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811354706.2A CN109710797B (zh) 2018-11-14 2018-11-14 音频文件的推送方法、装置、电子装置和存储介质

Publications (2)

Publication Number Publication Date
CN109710797A CN109710797A (zh) 2019-05-03
CN109710797B true CN109710797B (zh) 2021-03-26

Family

ID=66254835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811354706.2A Active CN109710797B (zh) 2018-11-14 2018-11-14 音频文件的推送方法、装置、电子装置和存储介质

Country Status (1)

Country Link
CN (1) CN109710797B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235300B (zh) * 2023-11-13 2024-03-15 深圳市致尚信息技术有限公司 一种智能k歌***的歌曲推荐方法、***及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667422A (zh) * 2009-09-22 2010-03-10 北京中星微电子有限公司 一种调节歌曲伴奏的调式的方法及装置
US8050419B2 (en) * 2008-03-31 2011-11-01 General Motors Llc Adaptive initial volume settings for a vehicle audio system
CN106611603A (zh) * 2015-10-26 2017-05-03 腾讯科技(深圳)有限公司 一种音频处理方法及装置
CN106991163A (zh) * 2017-03-31 2017-07-28 福州大学 一种基于演唱者声音特质的歌曲推荐方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9497583B2 (en) * 2007-12-12 2016-11-15 Iii Holdings 2, Llc System and method for generating a recommendation on a mobile device
CN103955490A (zh) * 2014-04-16 2014-07-30 华为技术有限公司 一种播放音频的方法和设备
CN105550316B (zh) * 2015-12-14 2019-07-02 广州酷狗计算机科技有限公司 音频列表的推送方法及装置
CN106919583B (zh) * 2015-12-25 2020-11-10 广州酷狗计算机科技有限公司 音频文件的推送方法及装置
CN105825868B (zh) * 2016-05-30 2019-11-12 福州大学 一种演唱者有效音域的提取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8050419B2 (en) * 2008-03-31 2011-11-01 General Motors Llc Adaptive initial volume settings for a vehicle audio system
CN101667422A (zh) * 2009-09-22 2010-03-10 北京中星微电子有限公司 一种调节歌曲伴奏的调式的方法及装置
CN106611603A (zh) * 2015-10-26 2017-05-03 腾讯科技(深圳)有限公司 一种音频处理方法及装置
CN106991163A (zh) * 2017-03-31 2017-07-28 福州大学 一种基于演唱者声音特质的歌曲推荐方法

Also Published As

Publication number Publication date
CN109710797A (zh) 2019-05-03

Similar Documents

Publication Publication Date Title
US20100125539A1 (en) Hybrid audio-visual categorization system and method
EP1975813A1 (en) Method for content recommendation
JP5066963B2 (ja) データベース構築装置
KR100615522B1 (ko) 음악 컨텐츠 분류 방법 그리고 이를 이용한 음악 컨텐츠 제공 시스템 및 그 방법
JP2009508156A (ja) 音楽分析
CN102024058A (zh) 音乐推荐方法及***
CN111090771B (zh) 歌曲搜索方法、装置及计算机存储介质
CN108766451B (zh) 一种音频文件处理方法、装置和存储介质
CN110010159B (zh) 声音相似度确定方法及装置
Rocamora et al. Query by humming: Automatically building the database from music recordings
Allik et al. Musiclynx: Exploring music through artist similarity graphs
CN113268630B (zh) 一种音频检索方法、设备及介质
CN109710797B (zh) 音频文件的推送方法、装置、电子装置和存储介质
KR20200070732A (ko) 음악 콘텐츠 추천 장치
Sánchez-Moreno et al. Recommendation of songs in music streaming services: dealing with sparsity and gray sheep problems
CN106775567B (zh) 一种音效匹配方法及***
CN105575400A (zh) 一种获取歌曲信息的方法、终端、服务器和***
Armentano et al. Genre classification of symbolic pieces of music
JP2002055695A (ja) 音楽検索システム
JP2005346347A (ja) 情報検索装置、情報検索方法、情報検索プログラムおよび記録媒体
Liu Effective results ranking for mobile query by singing/humming using a hybrid recommendation mechanism
CN110019921B (zh) 音频与属性的关联方法及装置、音频搜索方法及装置
CN107133344B (zh) 一种数据处理方法及装置
JP5085577B2 (ja) プレイリスト作成装置、楽曲再生装置、プレイリスト作成方法およびプレイリスト作成プログラム
JP4597714B2 (ja) 情報検索装置および方法ならびにコンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant