CN106302987A - 一种音频推荐方法及设备 - Google Patents

一种音频推荐方法及设备 Download PDF

Info

Publication number
CN106302987A
CN106302987A CN201610608834.XA CN201610608834A CN106302987A CN 106302987 A CN106302987 A CN 106302987A CN 201610608834 A CN201610608834 A CN 201610608834A CN 106302987 A CN106302987 A CN 106302987A
Authority
CN
China
Prior art keywords
user
audio frequency
emotion
voice
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610608834.XA
Other languages
English (en)
Inventor
李冉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Holding Beijing Co Ltd
LeTV Mobile Intelligent Information Technology Beijing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Mobile Intelligent Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Mobile Intelligent Information Technology Beijing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201610608834.XA priority Critical patent/CN106302987A/zh
Publication of CN106302987A publication Critical patent/CN106302987A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Child & Adolescent Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • Psychiatry (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种音频推荐方法及设备,包括:获取用户语音;根据所述语音确定用户情绪所属分类;根据用户情绪所属的分类确定与所述分类对应的音频;向用户推荐所述分类对应的音频。采用本发明实施例提供的方案,推荐的音频能够准确的吻合用户当前的情绪,推荐的音频总能满足当下用户的需求。

Description

一种音频推荐方法及设备
技术领域
本发明实施例涉及音频处理技术领域,尤其涉及一种音频推荐方法及设备。
背景技术
音乐播放功能是智能手机的基本功能之一,音乐库的大小,音乐品质的好坏,以及一个优秀的推荐***,构成了好的***级音乐播放器的几个要素。音乐库包含了种类丰富的音乐,如何在特定的情境下向用户推荐合适的音乐,成为了一个越来越重要的需求。
现有的音乐推荐,一般是通过用户的播放记录,发掘出用户对某种类型歌曲或某些歌星的喜好后,完成歌曲的推荐。
现有技术的不足在于:根据历史记录推荐的歌曲,忽略了用户在不同情况的状态,因而其推荐的准确度并不总能满足当下用户的需求。
发明内容
本发明实施例提供一种音频推荐方法及设备,用以解决现有技术中不能根据用户的现实需求准确推荐音频的问题。
本发明实施例提供了一种音频推荐方法,包括:
获取用户语音;
根据所述语音确定用户情绪所属分类;
根据用户情绪所属的分类确定与所述分类对应的音频;
向用户推荐所述分类对应的音频。
本发明实施例还提供了一种音频推荐设备,包括:
获取模块,用于获取用户语音;
分类模块,用于根据所述语音确定用户情绪所属分类;
音频模块,用于根据用户情绪所属的分类确定与所述分类对应的音频;
推荐模块,用于向用户推荐所述分类对应的音频。
本发明实施例提供的一种音频推荐方法及设备,在获取用户语音后,即根据语音确定用户情绪所属分类,然后根据用户情绪所属的分类向用户推荐所述分类对应的音频。由于音频是根据用户当前的语音识别的情绪进行推荐的,因此推荐的音频能够准确的吻合用户当前的情绪,由于方案中考虑到了用户在不同情况的状态,因而其推荐的准确度总能满足当下用户的需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中音频推荐方法实施流程示意图;
图2为本发明实施例中在手机中使用音频推荐流程示意图;
图3为本发明实施例中音频推荐设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
发明人在发明过程中注意到:
人们对音乐的需求在不同的情境下是有区别的,比如在兴奋时喜欢快节奏的音乐,失落时需要平淡一些的音乐。现有技术中根据历史记录进行推荐的方案不能反应用户当时的需求,容易知晓,在历史记录不变的情况下,其推荐的结果也必然是一样的,而用户的情绪在不同的环境中、时间下却是不同的,因此,该推荐也必然不能准确的反映出用户的当前需求。
而音乐播放功能的推荐***是好的***级音乐播放器的重要要素,因此,如何在特定的情境下向用户推荐合适的音乐,成为了一个越来越重要的需求,本发明实施例将提供一种音频推荐方案,在方案中,将借助语音识别中的情绪识别技术,做到准确识别用户的情绪,从而精确推荐用户喜欢的具有相应气氛的、类似情绪的音乐,让手机和用户产生更加亲近的感觉。下面进行说明。
图1为音频推荐方法实施流程示意图,如图所示,可以包括:
步骤101、获取用户语音;
步骤102、根据所述语音确定用户情绪所属分类;
步骤103、根据用户情绪所属的分类确定与所述分类对应的音频;
步骤104、向用户推荐所述分类对应的音频。
实施中,所述用户语音可以是从语音通信软件和/或从语音助手输入的语音资料获取的。
实施中,所述用户语音可以是在用户需要音频推荐前获取的。
实施中,所述分类对应的音频可以是在根据用户的音频使用记录确定的音频中进行分类的,或,所述分类对应的音频是在对音频进行分类后根据用户的音频使用记录确定的。
实施中,根据所述语音确定用户情绪所属分类,可以包括:
建立用户的语音库,所述语音库中包括:在获取用户的语音并识别各用户的语音对应的用户的情绪,并对用户的情绪进行分类后,各用户的语音与各用户的情绪分类之间的对应关系;
在获取用户语音后,根据所述语音库中的对应关系确定所述用户语音所属分类。
在实施步骤102根据所述语音确定用户情绪所属分类时,一个市场上可买到的可在其上实现本发明实施例的语音识别情绪技术至少包括来自以色列公司Beyond Verbal、英国企业EI Technologies的技术,然而注意,尽管本发明实施例的描述都涉及语音识别情绪,但具有创造性的概念在于整个方案,即:对音频的推荐,因此对语音识别情绪技术的引用仅作为示例而不起限制的作用。
现有的这些通过语音识别情绪的技术可以通过分析用户的语调解析用户瞬间的情绪,态度以及实时的情感决策特征。也可以通过音质分析、人声的音调来识别情绪。
目前现有技术至少已经可识别5种基本情绪:兴奋、平静、愤怒、害怕、沮丧。根据科技发展,毫无疑问还可以识别出反感、厌倦等更为复杂的情绪。识别的准确率约为70-80%左右,这个数字要高于人类60%的平均水平。而受过训练的心理学家的判断准确率约为70%。
在建立语音库的实施中,可以先找出“关键声学特征”,然后将其与一个分类***进行对照检录,从而匹配出5种情绪中的一种。该过程中还可以根据需要运用机器学习和数学处理。
下面结合实例进行说明。
本实施例中,将说明如何在手机中实施并使用本发明实施例提供的方案。
图2为在手机中使用音频推荐流程示意图,如图所示,主要包括以下步骤:
步骤201:获取用户通过语音通信或者语音助手输入的语音资料;
具体的,当用户打完电话或者向手机助手发送语音指令后,手机***会存有用户当时的语音记录,实施中可以使用这些即时的语音作为判断用户情绪的依据。
步骤202:启动手机内置的语音识别程序,分析用户语音中的情绪因素;
具体的,算法对语音中与说话者情感关联紧密的声学参数进行提取,结合情感空间描述模型和语料库,对声音中的情绪反应进行预测。
具体实施中,可以如下:
启动手机内置的语音识别程序,分析用户语音中的情绪因素;
(1)把语音表示成时域-振幅形式的数字信号;
(2)对语音数字信号中与情感相关的部分进行声学特征提取;
(3)将特征和语料库和情感空间模型进行比对,语料库和情感空间建模需要在前期完成;
(4)情绪判别功能部分输出情绪识别结果。
步骤203:将情绪因素分成兴奋、平静、愤怒、害怕、沮丧中的一种;
具体的,在人的情绪分类中,和音乐关系比较大的有兴奋、平静、愤怒、害怕、沮丧这几种,将上一步识别的情绪定位到这几种具体情绪中,方便推荐***进行合适的音乐推荐。
步骤204:根据情绪识别结果,从用户喜欢的歌星的歌曲中选择相应气氛的音乐,推荐给用户。
具体的,从用户听歌的历史记录中发掘用户喜欢的歌星信息,因为用户对喜欢歌曲的歌具有较高的认可程度,再结合以上声音情绪识别的结果,从用户喜欢的歌星的歌曲中选择相应特点的歌曲推荐给用户,情绪和歌曲特点的对应关系可以如表1所示。
表1、情绪和歌曲特点的对应关系表
用户情绪 推荐歌曲特点
兴奋 快节奏、摇滚等
平静 舒缓、叙事风格、民谣
愤怒 摇滚、愤世嫉俗风格
害怕 勇气、正能量
沮丧 悲伤、舒缓
从上述实施例可见,采用本发明实施例的方案后,可以根据采集用户当时的语音资料,推测用户情绪,从而即时推荐相应内容的音乐给用户,让手机的音乐推荐和播放更懂用户的心。
基于同一发明构思,本发明实施例中还提供了一种音频推荐设备,由于该设备解决问题的原理与一种音频推荐方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
图3为音频推荐设备结构示意图,如图所示,可以包括:
获取模块301,用于获取用户语音;
分类模块302,用于根据所述语音确定用户情绪所属分类;
音频模块303,用于根据用户情绪所属的分类确定与所述分类对应的音频;
推荐模块304,用于向用户推荐所述分类对应的音频。
实施中,获取模块进一步用于从语音通信软件和/或从语音助手输入的语音资料获取所述用户语音。
实施中,获取模块进一步用于在用户需要音频推荐前获取所述用户语音。
实施中,音频模块进一步用于在根据用户的音频使用记录确定的音频中进行分类,或,在对音频进行分类后根据用户的音频使用记录确定所述分类对应的音频。
实施中,分类模块包括:
建库单元,用于建立用户的语音库,所述语音库中包括:在获取用户的语音并识别各用户的语音对应的用户的情绪,并对用户的情绪进行分类后,各用户的语音与各用户的情绪分类之间的对应关系;
分类单元,用于在获取用户语音后,根据所述语音库中的对应关系确定所述用户语音所属分类。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种音频推荐方法,其特征在于,包括:
获取用户语音;
根据所述语音确定用户情绪所属分类;
根据用户情绪所属的分类确定与所述分类对应的音频;
向用户推荐所述分类对应的音频。
2.根据权利要求1所述的方法,其特征在于,所述用户语音是从语音通信软件和/或从语音助手输入的语音资料获取的。
3.根据权利要求1所述的方法,其特征在于,所述用户语音是在用户需要音频推荐前获取的。
4.根据权利要求1所述的方法,其特征在于,所述分类对应的音频是在根据用户的音频使用记录确定的音频中进行分类的,或,所述分类对应的音频是在对音频进行分类后根据用户的音频使用记录确定的。
5.根据权利要求1至4任一所述的方法,其特征在于,根据所述语音确定用户情绪所属分类,包括:
建立用户的语音库,所述语音库中包括:在获取用户的语音并识别各用户的语音对应的用户的情绪,并对用户的情绪进行分类后,各用户的语音与各用户的情绪分类之间的对应关系;
在获取用户语音后,根据所述语音库中的对应关系确定所述用户语音所属分类。
6.一种音频推荐设备,其特征在于,包括:
获取模块,用于获取用户语音;
分类模块,用于根据所述语音确定用户情绪所属分类;
音频模块,用于根据用户情绪所属的分类确定与所述分类对应的音频;
推荐模块,用于向用户推荐所述分类对应的音频。
7.根据权利要求6所述的设备,其特征在于,获取模块进一步用于从语音通信软件和/或从语音助手输入的语音资料获取所述用户语音。
8.根据权利要求6所述的设备,其特征在于,获取模块进一步用于在用户需要音频推荐前获取所述用户语音。
9.根据权利要求6所述的设备,其特征在于,音频模块进一步用于在根据用户的音频使用记录确定的音频中进行分类,或,在对音频进行分类后根据用户的音频使用记录确定所述分类对应的音频。
10.根据权利要求6至9任一所述的设备,其特征在于,分类模块包括:
建库单元,用于建立用户的语音库,所述语音库中包括:在获取用户的语音并识别各用户的语音对应的用户的情绪,并对用户的情绪进行分类后,各用户的语音与各用户的情绪分类之间的对应关系;
分类单元,用于在获取用户语音后,根据所述语音库中的对应关系确定所述用户语音所属分类。
CN201610608834.XA 2016-07-28 2016-07-28 一种音频推荐方法及设备 Pending CN106302987A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610608834.XA CN106302987A (zh) 2016-07-28 2016-07-28 一种音频推荐方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610608834.XA CN106302987A (zh) 2016-07-28 2016-07-28 一种音频推荐方法及设备

Publications (1)

Publication Number Publication Date
CN106302987A true CN106302987A (zh) 2017-01-04

Family

ID=57663150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610608834.XA Pending CN106302987A (zh) 2016-07-28 2016-07-28 一种音频推荐方法及设备

Country Status (1)

Country Link
CN (1) CN106302987A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562850A (zh) * 2017-08-28 2018-01-09 百度在线网络技术(北京)有限公司 音乐推荐方法、装置、设备及存储介质
CN108109622A (zh) * 2017-12-28 2018-06-01 武汉蛋玩科技有限公司 一种早教机器人语音互动教育***及方法
CN108648768A (zh) * 2018-04-16 2018-10-12 广州市菲玛尔咨询服务有限公司 一种咨询推荐方法及其管理***
CN109299318A (zh) * 2018-11-13 2019-02-01 百度在线网络技术(北京)有限公司 音乐推荐的方法、装置、存储介质和终端设备
CN110019924A (zh) * 2017-08-14 2019-07-16 中兴通讯股份有限公司 一种歌曲推荐的方法、装置、计算机设备及存储介质
CN110473546A (zh) * 2019-07-08 2019-11-19 华为技术有限公司 一种媒体文件推荐方法及装置
CN110555128A (zh) * 2018-05-31 2019-12-10 蔚来汽车有限公司 一种音乐推荐播放方法以及车载资讯娱乐***
CN110889008A (zh) * 2018-09-10 2020-03-17 珠海格力电器股份有限公司 一种音乐推荐方法、装置、计算装置和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070150916A1 (en) * 2005-12-28 2007-06-28 James Begole Using sensors to provide feedback on the access of digital content
CN103941853A (zh) * 2013-01-22 2014-07-23 三星电子株式会社 确定用户情绪的电子设备和确定用户情绪的方法
CN105426404A (zh) * 2015-10-28 2016-03-23 广东欧珀移动通信有限公司 一种音乐信息推荐方法、装置和终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070150916A1 (en) * 2005-12-28 2007-06-28 James Begole Using sensors to provide feedback on the access of digital content
CN103941853A (zh) * 2013-01-22 2014-07-23 三星电子株式会社 确定用户情绪的电子设备和确定用户情绪的方法
CN105426404A (zh) * 2015-10-28 2016-03-23 广东欧珀移动通信有限公司 一种音乐信息推荐方法、装置和终端

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110019924A (zh) * 2017-08-14 2019-07-16 中兴通讯股份有限公司 一种歌曲推荐的方法、装置、计算机设备及存储介质
CN107562850A (zh) * 2017-08-28 2018-01-09 百度在线网络技术(北京)有限公司 音乐推荐方法、装置、设备及存储介质
CN108109622A (zh) * 2017-12-28 2018-06-01 武汉蛋玩科技有限公司 一种早教机器人语音互动教育***及方法
CN108648768A (zh) * 2018-04-16 2018-10-12 广州市菲玛尔咨询服务有限公司 一种咨询推荐方法及其管理***
CN110555128A (zh) * 2018-05-31 2019-12-10 蔚来汽车有限公司 一种音乐推荐播放方法以及车载资讯娱乐***
CN110889008A (zh) * 2018-09-10 2020-03-17 珠海格力电器股份有限公司 一种音乐推荐方法、装置、计算装置和存储介质
WO2020052135A1 (zh) * 2018-09-10 2020-03-19 珠海格力电器股份有限公司 音乐推荐的方法、装置、计算装置和存储介质
CN109299318A (zh) * 2018-11-13 2019-02-01 百度在线网络技术(北京)有限公司 音乐推荐的方法、装置、存储介质和终端设备
CN110473546A (zh) * 2019-07-08 2019-11-19 华为技术有限公司 一种媒体文件推荐方法及装置
CN110473546B (zh) * 2019-07-08 2022-05-31 华为技术有限公司 一种媒体文件推荐方法及装置

Similar Documents

Publication Publication Date Title
CN106302987A (zh) 一种音频推荐方法及设备
CN109147804A (zh) 一种基于深度学习的音质特性处理方法及***
CN103035247B (zh) 基于声纹信息对音频/视频文件进行操作的方法及装置
CN107464555A (zh) 向包含语音的音频数据添加背景声音
CN110136749A (zh) 说话人相关的端到端语音端点检测方法和装置
CN111081280B (zh) 与文本无关的语音情感识别方法及装置、用于识别情感的算法模型的生成方法
CN105788592A (zh) 一种音频分类方法及装置
US20220076674A1 (en) Cross-device voiceprint recognition
CN102486920A (zh) 音频事件检测方法和装置
Zhang Music style classification algorithm based on music feature extraction and deep neural network
CN109979485B (zh) 音频评价方法和装置
WO2015114216A2 (en) Audio signal analysis
CN105679324A (zh) 一种声纹识别相似度评分的方法和装置
CN108766451B (zh) 一种音频文件处理方法、装置和存储介质
CN108764114B (zh) 一种信号识别方法及其设备、存储介质、终端
CN107293308A (zh) 一种音频处理方法及装置
CN108549697A (zh) 基于语义关联的信息推送方法、装置、设备以及存储介质
WO2019137392A1 (zh) 文件分类处理方法、装置及终端、服务器、存储介质
CN113813609B (zh) 游戏音乐风格分类方法、装置、可读介质及电子设备
CN101867742A (zh) 一种基于声控控制下的电视***
CN108829739A (zh) 一种信息推送方法及装置
KR102018286B1 (ko) 음원 내 음성 성분 제거방법 및 장치
Mounika et al. Music genre classification using deep learning
Murthy et al. Singer identification from smaller snippets of audio clips using acoustic features and DNNs
CN105895079A (zh) 语音数据的处理方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170104