CN113076444A - 歌曲识别方法、装置、电子设备和存储介质 - Google Patents
歌曲识别方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113076444A CN113076444A CN202110351517.5A CN202110351517A CN113076444A CN 113076444 A CN113076444 A CN 113076444A CN 202110351517 A CN202110351517 A CN 202110351517A CN 113076444 A CN113076444 A CN 113076444A
- Authority
- CN
- China
- Prior art keywords
- song
- input
- songs
- library
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000004044 response Effects 0.000 claims abstract description 17
- 230000003321 amplification Effects 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000001960 triggered effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000003416 augmentation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种歌曲识别方法、装置、电子设备和存储介质,属于电子技术领域。所述方法包括:在电子设备处于目标状态的情况下,接收第一输入,所述第一输入的内容是第一音频;响应于所述第一输入,基于电子设备的语音助手确定的所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息;所述目标状态包括息屏状态和使用状态中的至少一项。
Description
技术领域
本申请属于电子技术领域,具体涉及一种歌曲识别方法、装置、电子设备和存储介质。
背景技术
当人们在街上、广场或者其他场景时,听到一首好听却不认识的歌,就会拿出电子设备比如手机使用听歌识曲的功能去识别。
但是有时候还没来得及拿出电子设备比如手机开始识别,歌曲就已经放完了,导致不能及时识别用户需要识别的歌曲。
发明内容
本申请实施例提供一种歌曲识别方法、装置、电子设备和存储介质,能够实现及时自动识别电子设备所处环境中播放的歌曲。
第一方面,本申请实施例提供了一种歌曲识别方法,该方法包括:
在电子设备处于目标状态的情况下,接收第一输入,所述第一输入的内容是第一音频;
响应于所述第一输入,基于电子设备的语音助手确定的所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息;
所述目标状态包括息屏状态和使用状态中的至少一项。
第二方面,本申请实施例提供了一种歌曲识别装置,该装置包括:
第一接收模块,用于在电子设备处于目标状态的情况下,接收第一输入,所述第一输入的内容是第一音频;
第一输出模块,用于响应于所述第一输入,基于电子设备的语音助手确定的所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息;
所述目标状态包括息屏状态和使用状态中的至少一项。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
在本申请实施例中,通过在电子设备的息屏状态或使用状态接收当前环境中的音频,并通过语音助手对音频进行识别,确定当前环境播放的歌曲信息并显示,实现语音助手智能听歌识曲,及时自动识别电子设备所处环境中播放的歌曲,避免用户错过。
附图说明
图1是本申请实施例提供的歌曲识别方法的流程示意图;
图2是本申请实施例提供的歌曲识别装置的结构示意图;
图3为本申请实施例提供的电子设备的硬件结构示意图之一;
图4为本申请实施例提供的电子设备的硬件结构示意图之二。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过一些实施例及其应用场景对本申请实施例提供的歌曲识别方法及装置进行详细地说明。
图1是本申请实施例提供的歌曲识别方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤100,在电子设备处于目标状态的情况下,接收第一输入,所述第一输入的内容是第一音频;
步骤110,响应于所述第一输入,基于电子设备的语音助手确定的所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息;
所述目标状态包括息屏状态和使用状态中的至少一项。
歌曲在人们生活还有工作中都扮演着重要角色,可以缓解压力,可以愉悦自己,是旅途出行时候的陪伴,也是情绪的抒发中介。每个人也都会有属于自己歌单,歌单也会慢慢丰富,比如听到自己想听的歌曲时,会拿出电子设备使用听歌识曲的功能来认识这首歌。
当人们在街上、广场或者其他户外场景,听到一首好听但不认识的歌,就会拿出电子设备使用听歌识曲的功能去识别。但是有的时候可能陶醉于歌声之中,还没来得及拿出电子设备歌曲已经放完了,自己的歌单可能就因此无缘添加一首好歌。
可选地,电子设备可以包括但不限于:
手机,平板电脑、笔记本电脑、多媒体播放器、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
因此,本申请可以将一些可能的歌曲的高潮部分的歌词录入为电子设备的智能语音助手的唤醒词,当第一音频对应的第一文本(即当前场景中正在播放的歌曲的歌词)完全匹配到唤醒词时,语音助手可以识别出歌曲,并且输出给用户。
可选地,在将目标歌曲信息输出给用户时,可以在智慧场景开启下主动给用户推送刚才识别到的歌,或者用户唤醒语音助手主动问到刚才播放的是什么歌时回答用户,这种方式可以有效避免了用户错失识别好听的歌曲。
可选地,在电子设备息屏状态和使用状态下,只要所处环境有音乐播放,都可以对歌曲进行识别,并输出目标歌曲信息,避免用户来不及启动电子设备去识别歌曲就已经结束的情况。
可选地,电子设备的息屏状态可以包括但不限于电子设备的休眠状态,锁屏状态,以及电子设备的屏幕熄灭但运行中的状态。
可选地,第一输入可以为电子设备周围环境中正在播放的歌曲。
可选地,当电子设备识别到周围环境有歌曲播放,既可以认为接收到了第一输入。
在本申请实施例中,通过在电子设备的息屏状态或使用状态接收当前环境中的音频,并通过语音助手对音频进行识别,确定当前环境播放的歌曲信息并显示,实现语音助手智能听歌识曲,及时自动识别电子设备所处环境中播放的歌曲,避免用户错过。
可选地,所述基于所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息,包括:
将与所述第一文本相匹配的第一歌词所属的第一歌曲,作为目标歌曲,其中,所述第一歌曲是参考曲库中的其中一首歌曲;
显示所述目标歌曲信息。
可选地,可以建立参考曲库,并保存参考曲库中的歌曲的全部歌词或者高潮部分的歌词作为唤醒词录入到语音助手,作为目标歌曲识别的唤醒词。
可选地,如果语音助手基于第一音频获得的第一文本即用户所处环境播放的歌曲的歌词,和参考曲库中某一首歌录入的歌词完全匹配时,则可以认为语音助手捕获到高潮部分的歌词,智能听歌识曲功能触发(由语音助手触发),这首歌的信息则可以输出给用户;比如在负一屏显示给用户或者在用户询问时告知用户,同时还可以增加进入听歌识曲的曲库,作为听歌识曲的曲库中的第一首歌。
可选地,听歌识曲的曲库中的歌可以均是语音助手听歌识曲获得的歌曲的信息,其中歌曲可以按照识别的时间逆序排列,越早识别出的歌曲的信息排列在越后面,最新识别出的歌曲的信息可以排列在听歌识曲的曲库中的第一位。需要说明的是,此种排列方式仅作为一种举例,本申请各实施例对曲库中歌曲的排列顺序均不作限制。
可选地,可以限定听歌识曲的曲库中有固定数量首歌曲,当曲库中歌曲数量达到固定数量的情况下,若有新识别出的歌曲要增加,则可以删掉其中最早识别出的歌曲,然后新增最新识别出的歌曲的信息。
可选地,目标歌曲信息包括但不限于歌曲名称,以及以下至少一项:
演唱者;
编曲人;
作词人;
版权人;
原唱者;
所属专辑;
发行时间。
可选地,不论是否接收到询问所述目标歌曲信息的输入,用户的电子设备的目标屏幕比如负一屏可以生成听歌识曲推荐曲库卡片,其中可以显示听歌识曲的曲库,并可以接收用户在卡片上选择收藏、点赞、播放、下载、评论、踩等的输入并执行相应的操作。
可选地,不论是否接收到询问所述目标歌曲信息的输入,电子设备的负一屏可以生成听歌识曲推荐曲库卡片,一次最多显示5张卡片,每张卡片显示一首听歌识曲的歌曲信息,可以按照时间先后顺序排列,最新识别的歌曲排在第一位,也可以滑动来展示其他卡片。
可选地,所述显示所述目标歌曲信息,包括:
接收用户的第二输入,所述第二输入是用户询问所述目标歌曲信息的操作;
响应于所述第二输入,在当前显示界面或语音助手的显示界面显示所述目标歌曲信息。
可选地,如果用户通过第二输入主动问到刚才听到什么歌时,可以把听歌识曲结果呈现给用户;比如智能语音助手可以在智能语音界面通过显示听歌识曲的曲库或者显示最近识别出的目标歌曲信息,或者在用户当前显示界面通过弹窗或文本框或卡片等形式将听歌识曲的曲库或者最近识别出的目标歌曲信息进行显示。
可选地,还可以接收用户对显示的歌曲进行选择收藏、点赞、播放、下载、评论等的输入,并基于这些输入执行对应的操作。
可选地,第二输入可以是用户对语音助手的语音输入;可以是特殊手势输入;也可以是对屏幕或者机身的特殊点击或滑动输入,本实施例对此不做限制。
可选地,第一输入可以是用户主动唱某句歌词来搜歌的操作,也可能是后台接收到的接收到周边环境中音乐的输入;
可选地,可以存储电子设备的机主的声音特征;
可选地,在第一输入是用户主动唱某句歌词来搜歌的操作的情况下,可以获取到的歌唱语音对应的声音特征并与机主的声音特征进行匹配,若匹配确定第一输入对应的是机主本人,则可以通过语音助手直接显示搜索结果;若匹配确定第一输入对应的不是机主本人,则可以不直接显示搜索结果,而是在接收机主本人通过语音助手的语音输入的情况下,直接显示搜索结果。
可选地,所述显示所述目标歌曲信息,包括:
显示歌曲识别曲库;
其中,所述歌曲识别曲库包括所述第一音频的目标歌曲信息。
可选地,如果语音助手基于第一音频获得的第一文本即用户所处环境播放的歌曲的歌词,和参考曲库中某一首歌录入的歌词完全匹配时,则可以认为语音助手捕获到高潮部分的歌词,智能听歌识曲功能触发(由语音助手触发),这首歌的信息则可以输出给用户;比如在负一屏显示给用户或者在用户询问时告知用户,同时还可以增加进入听歌识曲的曲库,作为听歌识曲的曲库中的第一首歌,并显示听歌识曲的曲库(即歌曲识别曲库)。
可选地,歌曲识别曲库中的歌可以均是语音助手听歌识曲获得的歌曲的信息,其中歌曲可以按照识别的时间逆序排列,越早识别出的歌曲的信息排列在越后面,最新识别出的歌曲的信息可以排列在听歌识曲的曲库中的第一位。需要说明的是,此种排列方式仅作为一种举例,本申请各实施例对歌曲识别曲库中歌曲的排列顺序均不作限制。
可选地,可以限定歌曲识别曲库中有固定数量首歌曲,当曲库中歌曲数量达到固定数量的情况下,若有新识别出的歌曲要增加,则可以删掉其中最早识别出的歌曲,然后新增最新识别出的歌曲的信息。
可选地,如果用户通过第二输入主动问到刚才听到什么歌时,可以把听歌识曲结果呈现给用户;比如智能语音助手可以在智能语音界面通过显示歌曲识别曲库,或者在用户当前显示界面通过弹窗或文本框或卡片等形式将歌曲识别曲库进行显示。
可选地,还可以接收用户对显示的歌曲进行选择收藏、点赞、播放、下载、评论等的输入,并基于这些输入执行对应的操作。
可选地,听歌识曲的曲库的最大量级可以为100首,可以按照先进先出的时间顺序淘汰历史歌曲。
可选地,用户主动问到的歌也可以在听歌识曲的曲库中剔除。
可选地,所述方法还包括:
确定所述参考曲库;
其中,所述参考曲库包括:
热门歌曲曲库和/或推荐歌曲曲库。
可选地,在进行歌曲识别时可以从参考曲库中确定目标歌曲,因此可以首先确定参考曲库。
可选地,参考曲库可以包括热门歌曲曲库和/或推荐歌曲曲库。
可选地,可以定期更新参考曲库中的歌曲,保证参考曲库的时效性;保证能尽可能准确地识别出用户所处环境的歌曲。
可选地,所述参考曲库包括:
热门歌曲曲库;
所述热门歌曲曲库包括至少一首热门歌曲;
其中,所述确定所述参考曲库包括:
基于每一首第一待选歌曲的热门得分,从大到小依次确定所述至少一首热门歌曲;
其中,所述第一待选歌曲的热门得分基于所述待选歌曲的历史播放量以及所述待选歌曲发布以后的播放增幅确定,所述至少一首热门歌曲的数量是预先设置的。
可选地,可以计算每一首第一待选歌曲的热门得分,从大到小依次确定所述至少一首热门歌曲。
可选地,第一待选歌曲可以是音乐软件中所有歌曲或者所以有唯一标识的歌曲或者预先设置的歌曲。
比如,可以计算每一首第一待选歌曲的热门得分,按照得分逆序排列,取得分最高的100首歌组成热门歌曲曲库。
可选地,计算每一首第一待选歌曲的热门得分时,可以基于所述待选歌曲的历史播放量以及所述待选歌曲发布以后的播放增幅确定。
可选地,歌曲得分=0.5*历史播放量得分+0.5*播放增幅得分;
可选地,历史播放得分=历史播放量*0.99发布时间;可选地,发布时间可以成为发布年限,比如发布了150天的歌曲,其发布年限为(150/365)年;发布了10年整的歌曲,其发布年限为10年。
其中,参数可以下表1(参数表1);
表1参数表1
play_time | 历史播放量,eg:1000 |
pushlish_time | 发布时间,eg:20 |
play_times_scroe | 1000*0.99<sup>20</sup> |
可选地,歌曲得分和历史播放得分的计算公式对历史播放量做了时间衰减,避免老歌得分过高;
可选地,播放增幅得分=0.5*绝对增幅+0.5*相对增幅=0.5*relaincrease+0.5*absincrease2;其中,参数可以下表2(参数表2);
表2参数表2
可选地,所述参考曲库包括:
推荐歌曲曲库;
所述推荐歌曲曲库包括第一推荐歌曲;
其中,所述确定所述参考曲库包括:
对于用户歌单中每一首用户歌曲,基于所述用户歌曲的播放量,第二待选歌曲的播放量,以及所述用户歌曲和所述第二待选歌曲的共同播放量,确定所述每一首用户歌曲的第一相似歌单;
确定所述第一相似歌单中的歌曲为第一推荐歌曲。
可选地,在确定推荐歌曲曲库时,可以确定与用户喜好相似的歌曲。
可选地,对于用户已有的歌单中的用户歌曲,可以针对每一首用户歌曲,建立一个候选相似歌单;比如对于用户已有的歌单中的用户歌曲A,即与该用户歌曲A的相似度超过预先设置的阈值的所有歌曲中的前N名,N可以为3或10或100,即N为正整数,本实施例对此不做限制。
可选地,与该用户歌曲A的相似度超过预先设置的阈值的所有歌曲中的前N名可以是从第二候选歌曲中确定的;
可选地,第二候选歌曲可以是音乐软件中所有歌曲或者所以有唯一标识的歌曲或者预先设置的歌曲。
可选地,针对每一首用户歌曲,建立一个候选相似歌单后,可以将所有候选相似歌单中的歌曲去掉重复的,最后组成第一相似歌单,第一相似歌单中的歌曲为第一推荐歌曲。
可选地,相似度计算方式为:
其中,参数见下表3(参数表3);其中,歌曲a播放量为播放了歌曲a的用户数量,歌曲b播放量为播放了歌曲b的用户数量;歌曲ab共同播放量为既播放了a也播放了b的用户的数量。
表3参数表3
可选地,所述推荐歌曲曲库包括第二推荐歌曲;
其中,所述确定所述参考曲库包括:
确定至少一个同类用户的所有歌单中重复的歌曲为第二推荐歌曲;其中,所述同类用户的歌单中的歌曲与用户的歌单中的用户歌曲重叠程度高于第一门限值。
可选地,确定推荐歌曲曲库时,还可以包括多数用户喜欢的歌曲。
可选地,可以聚类包括该用户在内多个用户的歌单,其中歌单交集大于第一门限值比如90%,则可以视为一类用户,那么可以把与该用户同类的至少一个其他用户或与该用户同类的所有用户的歌单的交集加入到该用户的推荐歌曲曲库。
可选地,推荐歌曲曲库可以过滤用户现有歌单的歌,以及在参考曲库中已有的歌,还可以过滤接收过用户针对性踩的输入的歌。
可选地,所述方法还包括以下至少一项:
在预设时长内接收第一输入的次数超过第二阈值的情况下,不响应所述第一输入;
在预设环境接收第一输入的情况下,不响应所述第一输入。
可选地,可以获取用户此时的位置,如果用户是在家里,用户可能会用其他的播放设备比如电脑进行播放歌曲,如果频繁触发,那么这种场景下用户可能并不需要听歌识曲,则可以设置智能听歌识曲不会触发,避免电子设备耗能且做无用功。
可选地,可以在预设时长内接收第一输入的次数超过第二阈值;不响应所述第一输入进行歌曲识别。
可选地,可以在预设环境比如家或者公司接收第一输入(即电子设备识别到周围有歌曲播放),不响应所述第一输入进行歌曲识别。
可选地,可以在满足预设时长内接收第一输入的次数超过第二阈值或在预设时长内接收第一输入的次数超过第二阈值中任一项条件的情况下,不响应所述第一输入进行歌曲识别。
可选地,可以在满足预设时长内接收第一输入的次数超过第二阈值且在预设时长内接收第一输入的次数超过第二阈值中任一项条件的情况下,不响应所述第一输入进行歌曲识别。
在本申请实施例中,通过在电子设备的息屏状态或使用状态接收当前环境中的音频,并通过语音助手对音频进行识别,确定当前环境播放的歌曲信息并显示,实现语音助手智能听歌识曲,及时自动识别电子设备所处环境中播放的歌曲,避免用户错过。
需要说明的是,本申请实施例提供的歌曲识别方法,执行主体可以为歌曲识别装置,或者,或者该歌曲识别装置中的用于执行加载歌曲识别方法的控制模块。本申请实施例中以歌曲识别装置执行加载歌曲识别方法为例,说明本申请实施例提供的歌曲识别装置。
图2是本申请实施例提供的歌曲识别装置的结构示意图,如图2所示,该装置包括:第一接收模块210,和第一输出模块220;其中:
第一接收模块210用于在电子设备处于目标状态的情况下,接收第一输入,所述第一输入的内容是第一音频;
第一输出模块220用于响应于所述第一输入,基于电子设备的语音助手确定的所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息;
所述目标状态包括息屏状态和使用状态中的至少一项。
具体地,歌曲识别装置通过第一接收模块210在电子设备处于目标状态的情况下,接收第一输入,所述第一输入的内容是第一音频;然后通过第一输出模块220响应于所述第一输入,基于电子设备的语音助手确定的所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息;所述目标状态包括息屏状态和使用状态中的至少一项。
在本申请实施例中,通过在电子设备的息屏状态或使用状态接收当前环境中的音频,并通过语音助手对音频进行识别,确定当前环境播放的歌曲信息并显示,实现语音助手智能听歌识曲,及时自动识别电子设备所处环境中播放的歌曲,避免用户错过。
可选地,所述第一输出模块用于:
将与所述第一文本相匹配的第一歌词所属的第一歌曲,作为目标歌曲,其中,所述第一歌曲是参考曲库中的其中一首歌曲;
显示所述目标歌曲信息。
可选地,所述第一输出模块用于:
接收用户的第二输入,所述第二输入是用户询问所述目标歌曲信息的操作;
响应于所述第二输入,在当前显示界面或语音助手的显示界面显示所述目标歌曲信息。
可选地,所述第一输出模块用于:
显示歌曲识别曲库;
其中,所述歌曲识别曲库包括所述第一音频的目标歌曲信息。
可选地,所述参考曲库包括:
热门歌曲曲库;
所述热门歌曲曲库包括至少一首热门歌曲;
其中,所述第一确定模块用于:
基于每一首第一待选歌曲的热门得分,从大到小依次确定所述至少一首热门歌曲;
其中,所述第一待选歌曲的热门得分基于所述待选歌曲的历史播放量以及所述待选歌曲发布以后的播放增幅确定,所述至少一首热门歌曲的数量是预先设置的。
可选地,所述参考曲库包括:
推荐歌曲曲库;
所述推荐歌曲曲库包括第一推荐歌曲;
其中,所述第一确定模块用于:
对于用户歌单中每一首用户歌曲,基于所述用户歌曲的播放量,第二待选歌曲的播放量,以及所述用户歌曲和所述第二待选歌曲的共同播放量,确定所述每一首用户歌曲的第一相似歌单;
确定所述第一相似歌单中的歌曲为第一推荐歌曲。
可选地,所述推荐歌曲曲库包括第二推荐歌曲;
其中,所述第一确定模块用于:
确定至少一个同类用户的所有歌单中重复的歌曲为第二推荐歌曲;其中,所述同类用户的歌单中的歌曲与用户的歌单中的用户歌曲重叠程度高于第一门限值。
可选地,所述装置还包括:
第二接收模块,用于在预设时长内接收第一输入的次数超过第二阈值的情况下,不响应所述第一输入;
第三接收模块,用于在预设环境接收第一输入的情况下,不响应所述第一输入。
本申请实施例中的歌曲识别装置可以是具有操作***的装置或电子设备,也可以是终端中的部件、集成电路、或芯片。该电子设备可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为电子设备、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personalcomputer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例提供的歌曲识别装置能够实现图1方法实施例中歌曲识别装置实现的各个过程,为避免重复,这里不再赘述。
在本申请实施例中,通过在电子设备的息屏状态或使用状态接收当前环境中的音频,并通过语音助手对音频进行识别,确定当前环境播放的歌曲信息并显示,实现语音助手智能听歌识曲,及时自动识别电子设备所处环境中播放的歌曲,避免用户错过。
可选的,本申请实施例还提供一种电子设备,图3为本申请实施例提供的电子设备的硬件结构示意图之一。如图3所示,该电子设备包括处理器302,存储器301,存储在存储器301上并可在所述处理器302上运行的程序或指令,该程序或指令被处理器302执行时实现上述歌曲识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图4为本申请实施例提供的电子设备的硬件结构示意图之二。
该电子设备400包括但不限于:射频单元401、网络模块402、音频输出单元403、输入单元404、传感器405、显示单元406、用户输入单元407、接口单元408、存储器409、以及处理器410等中的至少部分部件。
本领域技术人员可以理解,电子设备400还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理***与处理器410逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。图4中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
应理解的是,本申请实施例中,输入单元404可以包括图形处理器(GraphicsProcessing Unit,GPU)441和麦克风442,图形处理器441对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元406可包括显示面板461,可以采用液晶显示器、有机发光二极管等形式来配置显示面板461。用户输入单元407包括触控面板471以及其他输入设备472。触控面板471,也称为触摸屏。触控面板471可包括触摸检测装置和触摸控制器两个部分。其他输入设备4072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
本申请实施例中,射频单元401获取信息后给处理器410处理。通常,射频单元401包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。
存储器409可用于存储软件程序或指令以及各种数据。存储器409可主要包括存储程序或指令区和存储数据区,其中,存储程序或指令区可存储操作***、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器409可以包括高速随机存取存储器,还可以包括非易失性存储器,其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。
处理器410可包括一个或多个处理单元;可选的,处理器410可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序或指令等,调制解调处理器主要处理无线通信,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器410中。
其中,输入单元404用于在电子设备处于目标状态的情况下,接收第一输入,所述第一输入的内容是第一音频;
处理器410用于响应于所述第一输入,基于电子设备的语音助手确定的所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息;
所述目标状态包括息屏状态和使用状态中的至少一项。
在本申请实施例中,通过在电子设备的息屏状态或使用状态接收当前环境中的音频,并通过语音助手对音频进行识别,确定当前环境播放的歌曲信息并显示,实现语音助手智能听歌识曲,及时自动识别电子设备所处环境中播放的歌曲,避免用户错过。
可选地,处理器410用于:
将与所述第一文本相匹配的第一歌词所属的第一歌曲,作为目标歌曲,其中,所述第一歌曲是参考曲库中的其中一首歌曲;
显示所述目标歌曲信息。
可选地,处理器410用于:
接收用户的第二输入,所述第二输入是用户询问所述目标歌曲信息的操作;
响应于所述第二输入,在当前显示界面或语音助手的显示界面显示所述目标歌曲信息。
可选地,处理器410用于:
显示歌曲识别曲库;
其中,所述歌曲识别曲库包括所述第一音频的目标歌曲信息。
可选地,所述参考曲库包括:
热门歌曲曲库;
所述热门歌曲曲库包括至少一首热门歌曲;
其中,处理器410用于:
基于每一首第一待选歌曲的热门得分,从大到小依次确定所述至少一首热门歌曲;
其中,所述第一待选歌曲的热门得分基于所述待选歌曲的历史播放量以及所述待选歌曲发布以后的播放增幅确定,所述至少一首热门歌曲的数量是预先设置的。
可选地,所述参考曲库包括:
推荐歌曲曲库;
所述推荐歌曲曲库包括第一推荐歌曲;
其中,处理器410用于:
对于用户歌单中每一首用户歌曲,基于所述用户歌曲的播放量,第二待选歌曲的播放量,以及所述用户歌曲和所述第二待选歌曲的共同播放量,确定所述每一首用户歌曲的第一相似歌单;
确定所述第一相似歌单中的歌曲为第一推荐歌曲。
可选地,所述推荐歌曲曲库包括第二推荐歌曲;
其中,处理器410用于:
确定至少一个同类用户的所有歌单中重复的歌曲为第二推荐歌曲;其中,所述同类用户的歌单中的歌曲与用户的歌单中的用户歌曲重叠程度高于第一门限值。
可选地,处理器410用于:
在预设时长内接收第一输入的次数超过第二阈值的情况下,不响应所述第一输入;
在预设环境接收第一输入的情况下,不响应所述第一输入。
在本申请实施例中,通过在电子设备的息屏状态或使用状态接收当前环境中的音频,并通过语音助手对音频进行识别,确定当前环境播放的歌曲信息并显示,实现语音助手智能听歌识曲,及时自动识别电子设备所处环境中播放的歌曲,避免用户错过。
本申请实施例中的电子设备实施例是与上述方法实施例对应的产品实施例,上述方法实施例中的所有实现方式均适用于该电子设备实施例,亦可达到相同或相似的技术效果,故在此不再赘述。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述歌曲识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述歌曲识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为***级芯片、***芯片、芯片***或片上***芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是电子设备,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (15)
1.一种歌曲识别方法,其特征在于,包括:
在电子设备处于目标状态的情况下,接收第一输入,所述第一输入的内容是第一音频;
响应于所述第一输入,基于电子设备的语音助手确定的所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息;
所述目标状态包括息屏状态和使用状态中的至少一项。
2.根据权利要求1所述的歌曲识别方法,其特征在于,所述基于所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息,包括:
将与所述第一文本相匹配的第一歌词所属的第一歌曲,作为目标歌曲,其中,所述第一歌曲是参考曲库中的其中一首歌曲;
显示所述目标歌曲信息。
3.根据权利要求2所述的歌曲识别方法,其特征在于,所述显示所述目标歌曲信息,包括:
接收用户的第二输入,所述第二输入是用户询问所述目标歌曲信息的操作;
响应于所述第二输入,在当前显示界面或语音助手的显示界面显示所述目标歌曲信息。
4.根据权利要求2或3所述的歌曲识别方法,其特征在于,所述显示所述目标歌曲信息,包括:
显示歌曲识别曲库;
其中,所述歌曲识别曲库包括所述第一音频的目标歌曲信息。
5.根据权利要求4所述的歌曲识别方法,其特征在于,所述参考曲库包括:
热门歌曲曲库;
所述热门歌曲曲库包括至少一首热门歌曲;
其中,所述确定所述参考曲库包括:
基于每一首第一待选歌曲的热门得分,从大到小依次确定所述至少一首热门歌曲;
其中,所述第一待选歌曲的热门得分基于所述待选歌曲的历史播放量以及所述待选歌曲发布以后的播放增幅确定,所述至少一首热门歌曲的数量是预先设置的。
6.根据权利要求4所述的歌曲识别方法,其特征在于,所述参考曲库包括:
推荐歌曲曲库;
所述推荐歌曲曲库包括第一推荐歌曲;
其中,所述确定所述参考曲库包括:
对于用户歌单中每一首用户歌曲,基于所述用户歌曲的播放量,第二待选歌曲的播放量,以及所述用户歌曲和所述第二待选歌曲的共同播放量,确定所述每一首用户歌曲的第一相似歌单;
确定所述第一相似歌单中的歌曲为第一推荐歌曲。
7.根据权利要求5或6所述的歌曲识别方法,其特征在于,所述推荐歌曲曲库包括第二推荐歌曲;
其中,所述确定所述参考曲库包括:
确定至少一个同类用户的所有歌单中重复的歌曲为第二推荐歌曲;其中,所述同类用户的歌单中的歌曲与用户的歌单中的用户歌曲重叠程度高于第一门限值。
8.根据权利要求1所述的歌曲识别方法,其特征在于,所述方法还包括以下至少一项:
在预设时长内接收第一输入的次数超过第二阈值的情况下,不响应所述第一输入;
在预设环境接收第一输入的情况下,不响应所述第一输入。
9.一种歌曲识别装置,其特征在于,包括:
第一接收模块,用于在电子设备处于目标状态的情况下,接收第一输入,所述第一输入的内容是第一音频;
第一输出模块,用于响应于所述第一输入,基于电子设备的语音助手确定的所述第一音频对应的第一文本,输出所述第一音频的目标歌曲信息;
所述目标状态包括息屏状态和使用状态中的至少一项。
10.根据权利要求9所述的歌曲识别装置,其特征在于,所述第一输出模块用于:
将与所述第一文本相匹配的第一歌词所属的第一歌曲,作为目标歌曲,其中,所述第一歌曲是参考曲库中的其中一首歌曲;
显示所述目标歌曲信息。
11.根据权利要求10所述的歌曲识别装置,其特征在于,所述第一输出模块用于:
接收用户的第二输入,所述第二输入是用户询问所述目标歌曲信息的操作;
响应于所述第二输入,在当前显示界面或语音助手的显示界面显示所述目标歌曲信息。
12.根据权利要求10或11所述的歌曲识别装置,其特征在于,所述第一输出模块用于:
显示歌曲识别曲库;
其中,所述歌曲识别曲库包括所述第一音频的目标歌曲信息。
13.根据权利要求9所述的歌曲识别装置,其特征在于,所述装置还包括:
第二接收模块,用于在预设时长内接收第一输入的次数超过第二阈值的情况下,不响应所述第一输入;
第三接收模块,用于在预设环境接收第一输入的情况下,不响应所述第一输入。
14.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-8任一项所述的歌曲识别方法的步骤。
15.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-8任一项所述的歌曲识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110351517.5A CN113076444A (zh) | 2021-03-31 | 2021-03-31 | 歌曲识别方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110351517.5A CN113076444A (zh) | 2021-03-31 | 2021-03-31 | 歌曲识别方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113076444A true CN113076444A (zh) | 2021-07-06 |
Family
ID=76614274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110351517.5A Pending CN113076444A (zh) | 2021-03-31 | 2021-03-31 | 歌曲识别方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113076444A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115602154A (zh) * | 2022-12-15 | 2023-01-13 | 杭州网易云音乐科技有限公司(Cn) | 音频识别方法、装置、存储介质和计算设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140172423A1 (en) * | 2012-12-14 | 2014-06-19 | Lenovo (Beijing) Co., Ltd. | Speech recognition method, device and electronic apparatus |
CN112015943A (zh) * | 2019-05-31 | 2020-12-01 | 华为技术有限公司 | 一种哼唱识别方法及相关设备 |
-
2021
- 2021-03-31 CN CN202110351517.5A patent/CN113076444A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140172423A1 (en) * | 2012-12-14 | 2014-06-19 | Lenovo (Beijing) Co., Ltd. | Speech recognition method, device and electronic apparatus |
CN112015943A (zh) * | 2019-05-31 | 2020-12-01 | 华为技术有限公司 | 一种哼唱识别方法及相关设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115602154A (zh) * | 2022-12-15 | 2023-01-13 | 杭州网易云音乐科技有限公司(Cn) | 音频识别方法、装置、存储介质和计算设备 |
CN115602154B (zh) * | 2022-12-15 | 2023-08-11 | 杭州网易云音乐科技有限公司 | 音频识别方法、装置、存储介质和计算设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109522419B (zh) | 会话信息补全方法及装置 | |
CN109918669B (zh) | 实体确定方法、装置及存储介质 | |
CN105488112A (zh) | 信息推送方法及装置 | |
WO2016165325A1 (zh) | 音频信息识别方法及装置 | |
CN103605656A (zh) | 一种推荐音乐的方法、装置及一种移动终端 | |
CN104378441A (zh) | 日程创建方法和装置 | |
CN110147467A (zh) | 一种文本描述的生成方法、装置、移动终端及存储介质 | |
CN104035995A (zh) | 群标签生成方法及装置 | |
CN110391966B (zh) | 一种消息处理方法、装置和用于消息处理的装置 | |
CN105068976A (zh) | 票务信息展示方法及装置 | |
CN111491123A (zh) | 视频背景处理方法、装置及电子设备 | |
CN112287162A (zh) | 消息搜索方法、装置和电子设备 | |
CN112328136A (zh) | 评论信息的显示方法、装置、设备及存储介质 | |
WO2021135561A1 (zh) | 技能语音唤醒方法及装置 | |
CN111708943A (zh) | 一种搜索结果展示方法、装置和用于搜索结果展示的装置 | |
CN103366010A (zh) | 一种录音文件的检索方法和装置 | |
CN108234758B (zh) | 应用的显示方法、装置、存储介质及电子设备 | |
CN113076444A (zh) | 歌曲识别方法、装置、电子设备和存储介质 | |
CN111739535A (zh) | 一种语音识别方法、装置和电子设备 | |
CN106407359A (zh) | 一种图片播放方法及移动终端 | |
CN112286421A (zh) | 播放列表处理方法、装置及电子设备 | |
CN105843865B (zh) | 媒体文件播放方法及装置 | |
CN107729439A (zh) | 获取多媒体数据的方法、装置和*** | |
CN112712825A (zh) | 音频处理方法、装置及电子设备 | |
CN112287141A (zh) | 相册处理方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |