CN103347070B - 推送语音数据的方法、终端、服务器及*** - Google Patents

推送语音数据的方法、终端、服务器及*** Download PDF

Info

Publication number
CN103347070B
CN103347070B CN201310268905.2A CN201310268905A CN103347070B CN 103347070 B CN103347070 B CN 103347070B CN 201310268905 A CN201310268905 A CN 201310268905A CN 103347070 B CN103347070 B CN 103347070B
Authority
CN
China
Prior art keywords
background noise
characteristic vector
noise data
environmental form
speech data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310268905.2A
Other languages
English (en)
Other versions
CN103347070A (zh
Inventor
郭涛
蔡经伟
刘伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201310268905.2A priority Critical patent/CN103347070B/zh
Publication of CN103347070A publication Critical patent/CN103347070A/zh
Application granted granted Critical
Publication of CN103347070B publication Critical patent/CN103347070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种推送语音数据的方法、终端、服务器及***,属于多媒体技术领域。方法包括:每隔预设时间获取一次背景噪音数据,并提取背景噪音数据的特征向量;将背景噪音数据的特征向量上传至服务器,由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据;接收服务器推送的语音数据。本发明通过获取背景噪音数据,并提取背景噪音数据的特征向量,进而将背景噪音数据的特征向量上传至服务器,由服务器确定特征向量对应的环境类型,并向终端推送与其相对应的语音数据,因此,可实现根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。

Description

推送语音数据的方法、终端、服务器及***
技术领域
本发明涉及多媒体技术领域,特别涉及一种推送语音数据的方法、终端、服务器及***。
背景技术
随着科学技术的飞速发展,越来越多具有语音数据播放功能的终端进入大众的视野。例如,MP3(Moving Picture Experts Group Audio Layer III,运动图像专家组音频层3)播放器、手机及平板电脑等等。用户通过点击终端的物理按键或显示在终端屏幕上的虚拟按键可自由进行语音数据的手动选择。然而,当用户处在相对拥挤的环境或面对无屏幕显示的终端,其不愿或难以进行语音数据的手动选择时,为了提升用户体验及满足用户的聆听需求,如何自动进行语音数据推送,成为了本领域技术人员较为关注的一个问题。
发明内容
本发明实施例提供了一种推送语音数据的方法、终端、服务器及***。所述技术方案如下:
第一方面,提供了一种推送语音数据的方法,所述方法包括:
每隔预设时间获取一次背景噪音数据,并提取所述背景噪音数据的特征向量;
将所述背景噪音数据的特征向量上传至服务器,由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型,并向终端推送与所述环境类型相对应的语音数据;
接收所述服务器推送的语音数据。
较佳地,所述每隔预设时间获取一次背景噪音数据,包括:
首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;
非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;
其中,所述第一预设时间长度小于所述第二预设时间长度。
较佳地,所述提取所述背景噪音数据的特征向量,包括:
对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号;
提取所述声音信号的频谱特征,得到所述声音信号的特征向量。
较佳地,所述得到所述背景噪音数据的声音信号之后,所述方法还包括:
对得到的所述背景噪声数据的声音信号进行频域变换;
所述提取所述声音信号的频谱特征,包括:
提取进行频域变换后的所述声音信号的频谱特征。
第二方面,提供了一种终端,所述终端包括:
获取模块,用于每隔预设时间获取一次背景噪音数据;
提取模块,用于提取所述获取模块获取到的背景噪音数据的特征向量;
上传模块,用于将所述提取模块提取到的背景噪音数据的特征向量上传至服务器,由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型,并向终端推送与所述环境类型相对应的语音数据;
接收模块,用于接收所述服务器推送的语音数据。
较佳地,所述获取模块,包括:
第一获取单元,用于在首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;
第二获取单元,用于在非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;
其中,所述第一预设时间长度小于所述第二预设时间长度。
较佳地,所述提取模块用于对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号;提取所述声音信号的频谱特征,得到所述声音信号的特征向量。
较佳地,所述终端还包括:
变换模块,用于对得到的所述背景噪声数据的声音信号进行频域变换;
所述提取模块用于提取进行频域变换后的所述声音信号的频谱特征。
第三方面,还提供了一种推送语音数据的方法,所述方法包括:
接收终端上传的背景噪音数据的特征向量;
根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型;
向所述终端推送与所述环境类型相对应的语音数据。
较佳地,所述根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型之前,所述方法还包括:
设置特征向量与环境类型的对应关系表,并将所述特征向量与环境类型的对应关系表进行存储;
根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型,包括:
根据所述背景噪音数据的特征向量查找所述特征向量与环境类型的对应关系表,获取所述背景噪音数据的特征向量对应的环境类型。
较佳地,所述向所述终端推送与所述环境类型相对应的语音数据之前,所述方法还包括:
设置环境类型与语音数据类型的对应关系;
根据所述环境类型与语音数据类型的对应关系确定所述环境类型对应的语音数据类型;
所述向所述终端推送与所述环境类型相对应的语音数据,包括:
向所述终端推送与所述语音数据类型对应的语音数据。
第四方面,提供了一种服务器,所述服务器包括:
接收模块,用于接收终端上传的背景噪音数据的特征向量;
第一确定模块,用于根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型;
推送模块,用于向所述终端推送与所述环境类型相对应的语音数据。
较佳地,所述服务器还包括:
第一设置模块,用于设置特征向量与环境类型的对应关系表;
存储模块,用于将所述第一设置模块设置的特征向量与环境类型的对应关系表进行存储;
所述第一确定模块,包括:
查找单元,用于根据所述背景噪音数据的特征向量查找所述特征向量与环境类型的对应关系表;
获取单元,用于获取所述背景噪音数据的特征向量对应的环境类型。
较佳地,所述服务器还包括:
第二设置模块,用于设置环境类型与语音数据类型的对应关系;
第二确定模块,用于根据所述第二设置模块设置的环境类型与语音数据类型的对应关系确定所述环境类型对应的语音数据类型;
所述推送模块,用于向所述终端推送与所述语音数据类型对应的语音数据。
第五方面,提供了一种推送语音数据的***,所述***包括:终端及服务器;
其中,终端如上面所述的终端;
所述服务器如上面所述的服务器。
本发明技术方案带来的有益效果是:
终端通过每隔预设时间获取一次背景噪音数据,并提取背景噪音数据的特征向量,进而将背景噪音数据的特征向量上传至服务器,由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据。因此,可实现自动根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种推送语音数据的方法流程图;
图2是本发明实施例一提供的另一种推送语音数据的方法流程图;
图3是本发明实施例二提供的一种推送语音数据的方法流程图;
图4是本发明实施例三提供的一种终端的结构示意图;
图5是本发明实施例三提供的一种获取模块的内部结构示意图;
图6是本发明实施例三提供的另一种终端的结构示意图;
图7是本发明实施例四提供的一种服务器的结构示意图;
图8是本发明实施例四提供的另一种服务器的结构示意图;
图9是本发明实施例四提供的一种第一确定模块的内部结构示意图;
图10是本发明实施例四提供的又一种服务器的结构示意图;
图11是本发明实施例五提供的一种推送语音数据的***结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作较佳地详细描述。
实施例一
本发明实施例提供了一种推送语音数据的方法,以终端执行该方法的角度为例,参见图1,对本发明实施例提供的方法流程包括:
101:每隔预设时间获取一次背景噪音数据,并提取背景噪音数据的特征向量;
较佳地,每隔预设时间获取一次背景噪音数据,包括但不限于:
首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;
非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;
其中,第一预设时间长度小于第二预设时间长度。
较佳地,提取背景噪音数据的特征向量,包括但不限于:
对背景噪音数据进行解码,得到背景噪音数据的声音信号;
提取声音信号的频谱特征,得到声音信号的特征向量。
较佳地,得到背景噪音数据的声音信号之后,该方法还包括:
对得到的背景噪声数据的声音信号进行频域变换;
提取声音信号的频谱特征,包括但不限于:
提取进行频域变换后的声音信号的频谱特征。
102:将背景噪音数据的特征向量上传至服务器,由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据;
103:接收服务器推送的语音数据。
以服务器执行该方法的角度为例,参见图2,本实施例提供的方法流程包括:
201:接收终端上传的背景噪音数据的特征向量;
202:根据预先存储的特征向量与环境类型的对应关系确定背景噪音数据的特征向量对应的环境类型;
较佳地,根据预先存储的特征向量与环境类型的对应关系确定背景噪音数据的特征向量对应的环境类型之前,该方法还包括:
设置特征向量与环境类型的对应关系表,并将特征向量与环境类型的对应关系表进行存储;
根据预先存储的特征向量与环境类型的对应关系确定背景噪音数据的特征向量对应的环境类型,包括但不限于:
根据背景噪音数据的特征向量查找特征向量与环境类型的对应关系表,获取背景噪音数据的特征向量对应的环境类型。
203:向终端推送与环境类型相对应的语音数据。
较佳地,向终端推送与环境类型相对应的语音数据之前,该方法还包括:
设置环境类型与语音数据类型的对应关系;
根据环境类型与语音数据类型的对应关系确定环境类型对应的语音数据类型;
向终端推送与环境类型相对应的语音数据,包括但不限于:
向终端推送与语音数据类型对应的语音数据。
本实施例提供的方法,终端通过每隔预设时间获取一次背景噪音数据,并提取背景噪音数据的特征向量,进而将背景噪音数据的特征向量上传至服务器,由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据。因此,可实现自动根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。
实施例二
本发明实施例提供了一种推送语音数据的方法,现结合上述实施例一的内容,对本发明实施例提供的推送语音数据的方式进行详细地解释说明。参见图3,本实施例提供的方法流程包括:
301:终端每隔预设时间获取一次背景噪音数据,并提取背景噪音数据的特征向量;
其中,预设时间的大小具体可为10分钟,当然,预设时间的大小除上述数值外,还可以为5分钟或6分钟等等,本实施例对预设时间的大小不进行具体限定。
此外,每隔预设时间获取一次背景噪音数据,包括但不限于:
首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;
非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;
其中,第一预设时间长度小于第二预设时间长度。
下面以一个具体的例子对上述过程进行详细说明。
以首次获取背景噪音数据的时间为10:00:00,预设时间为10分钟,第一预设时间长度为8秒,第二预设时间长度为10秒为例,则终端从10:00:00开始录制背景噪音数据,当时间显示为10:00:08时,停止背景噪音数据的录制;而当时间显示为10:10:00时,开始第二次背景噪音数据的录制,此次的录制长度为10秒,即在10:10:10时停止第二次的录制;在后续录制的过程中,处理流程同上述处理方式一致,也即,每隔10分钟录制一次时长为10秒的背景噪音数据,且在得到录制的背景噪音数据后,应将其存储在终端的存储介质中,例如,内存或内存卡中,也可将背景噪音数据存储在其他类型的存储介质中,本实施例对存储介质的类型不进行具体限定。
此外,提取背景噪音数据的特征向量,包括但不限于:
对背景噪音数据进行解码,得到背景噪音数据的声音信号;
提取声音信号的频谱特征,得到声音信号的特征向量。
较佳地,得到背景噪音数据的声音信号之后,该方法还包括:
对得到的背景噪声数据的声音信号进行频域变换;
提取声音信号的频谱特征,包括但不限于:
提取进行频域变换后的声音信号的频谱特征。
其中,在提取声音信号的频谱特征时,具体可采用MFCC(Mel Frequency CepstrumCoefficien,Mel频率倒频系数)、CWT(Continuous Wavelet Transform,连续小波变换)、STHT(Short Time Fourier Transform,短时傅里叶变换)等技术,具体采用何种技术提取声音信号的频谱特征,可视情况而定,本实施例对此不作具体限定。
302:终端将背景噪音数据的特征向量上传至服务器;
针对该步骤,终端在得到背景噪音数据的特征向量后,可直接将背景噪音数据的特征向量上传至服务器,也可出于减小网络传输负担的目的,将背景噪音数据的特征向量压缩打包后再上传至服务器,具体采用何种上传方式,本实施例对此不作具体限定。
303:服务器接收终端上传的背景噪音数据的特征向量;
其中,若服务器接收到背景噪音数据的特征向量,则可直接将其进行缓存;若服务器接收到打包压缩的背景噪音数据的特征向量,则在将其解压缩得到背景噪音数据的特征向量后,将其缓存至存储介质中。而存储介质具体可为内存或硬盘,当然,存储介质的类型除上述类型外,还可为其他类型的存储介质,例如,闪存或光盘等等,本实施例对存储介质的类型不进行具体限定。
304:服务器根据预先存储的特征向量与环境类型的对应关系确定背景噪音数据的特征向量对应的环境类型;
针对该步骤,根据预先存储的特征向量与环境类型的对应关系确定背景噪音数据的特征向量对应的环境类型之前,该方法还包括:
设置特征向量与环境类型的对应关系表,并将特征向量与环境类型的对应关系表进行存储;
根据预先存储的特征向量与环境类型的对应关系确定背景噪音数据的特征向量对应的环境类型,包括但不限于:
根据背景噪音数据的特征向量查找特征向量与环境类型的对应关系表,获取背景噪音数据的特征向量对应的环境类型。
其中,设置特征向量与环境类型的对应关系的具体实现方式通常采取如下两种方式:
第一种方式,人为设置特征向量与环境类型的对应关系;
例如,当特征向量小于预设阈值时,将环境类型设置为安静环境;当特征向量来回无规则跳动时,将环境类型设置为室外无规律嘈杂环境;当特征向量有规律跳动时,将环境类型设置为室外有规律嘈杂环境;其中,预设阈值的大小可按需进行设置,本实施例对预设阈值的大小不进行具体限定。
第二种方式,利用支持向量机等机器学习的方法设置特征向量与环境类型的对应关系;
服务器预先收集一个样本集,即小规模数量的背景噪音数据,然后对这个样本集中的各个样本进行分类,确定其中哪些背景噪音数据对应于安静环境,哪些背景噪音数据对应于室外无规律嘈杂环境,哪些背景噪音数据对应于室外有规律嘈杂环境;之后,服务器利用分类模型算法计算样本集中每个样本的特征向量,并根据每个样本的特征向量计算得到一个分类模型;当后续存在新样本时,只要计算该新样本的特征向量然后将其套入到分类模型中,就可以自动得到其对应的环境类型。
需要说明的是,第一种方式由于是人为设置特征向量与环境类型的对应关系,因此,设置精度相较于第二种方式较差,但是这种设置方法较为简洁;而第二种方式由于采用了机器自学习的方式,因此适应性较强,且随着样本集的逐渐扩大,设置精度也会越来越高。而在执行本实施例提供的方法时具体采用哪种设置方式,可视情况而定,本实施例对此不作具体限定。
此外,当预先设置特征向量与环境类型的对应关系,并将对应关系记录在对应关系表中之后,后续再执行该方法时可直接使用该对应关系表,即在每次执行本实施例提供的方法时无需每次均执行该步骤,仅在对应关系有更新时,将对应关系表进行更新即可。
305:服务器向终端推送与环境类型相对应的语音数据;
针对该步骤,服务器向终端推送与环境类型相对应的语音数据之前,该方法还包括:
设置环境类型与语音数据类型的对应关系;
根据环境类型与语音数据类型的对应关系确定环境类型对应的语音数据类型;
向终端推送与环境类型相对应的语音数据,包括但不限于:
向终端推送与语音数据类型对应的语音数据。
其中,在设置环境类型与语音类型的对应关系时,可设置如下表1所示的对应表:
表1
环境类型 语音数据类型
安静环境 轻音乐
室外无规律嘈杂环境 摇滚、流行音乐
室外有规律嘈杂环境 乡村、民族音乐
例如,当根据上述步骤304确定某一特征向量对应的环境类型为室外无规律嘈杂环境,则可较佳地根据表1确定推送的语音数据的类型为摇滚音乐或流行音乐。
较佳地,服务器向终端推送语音数据时,在根据外部环境情况进行推送的同时,本实施例提供的方法还包括根据用户的喜好来进一步推送相关语音数据的步骤。例如,在安静的环境下,服务器所推送的轻音乐也不是随机选取的,而是根据用户的喜好推送的,其是用户可能喜欢的轻音乐,而不是随便一首轻音乐。本实施例提供的方法支持对用户收听过的历史语音数据进行统计,从而分析出用户喜爱的轻音乐的类型。具体实现方式可依据现有的分析统计方式实现,此处不再赘述。
306:终端接收服务器推送的语音数据。
其中,当终端收到服务器所推送的语音数据后,将该语音数据存储在自身的存储介质中,以待后续进行播放。而存储介质具体可为内存或内存卡,当然,存储介质的类型除上述类型外,还可为其他类型的存储介质,例如,闪存或光盘等等,本实施例对存储介质的类型不进行具体限定。
本发明实施例提供的方法,通过每隔预设时间获取一次背景噪音数据,并提取背景噪音数据的特征向量,进而将背景噪音数据的特征向量上传至服务器,由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据。因此,可实现自动根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。
实施例三
本发明实施例提供了一种终端,参见图4,该终端包括:
获取模块41,用于每隔预设时间获取一次背景噪音数据;
提取模块42,用于提取获取模块41获取到的背景噪音数据的特征向量;
上传模块43,用于将提取模块42提取到的背景噪音数据的特征向量上传至服务器,由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据;
接收模块44,用于接收服务器推送的语音数据。
较佳地,参见图5,获取模块41,包括:
第一获取单元411,用于在首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;
第二获取单元412,用于在非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;
其中,第一预设时间长度小于第二预设时间长度。
较佳地,提取模块用于对背景噪音数据进行解码,得到背景噪音数据的声音信号;提取声音信号的频谱特征,得到声音信号的特征向量。
较佳地,参见图6,终端还包括:
变换模块45,用于对得到的背景噪声数据的声音信号进行频域变换;
提取模块42用于提取进行频域变换后的声音信号的频谱特征。
本发明实施例提供的终端,通过每隔预设时间获取一次背景噪音数据,并提取背景噪音数据的特征向量,进而将背景噪音数据的特征向量上传至服务器,由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据。因此,可实现自动根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。
实施例四
本发明实施例提供了一种服务器,参见图7,该服务器包括:
接收模块71,用于接收终端上传的背景噪音数据的特征向量;
第一确定模块72,用于根据预先存储的特征向量与环境类型的对应关系确定背景噪音数据的特征向量对应的环境类型;
推送模块73,用于向终端推送与环境类型相对应的语音数据。
较佳地,参见图8,该服务器还包括:
第一设置模块74,用于设置特征向量与环境类型的对应关系表;
存储模块75,用于将第一设置模块74设置的特征向量与环境类型的对应关系表进行存储;
参见图9,第一确定模块72,包括:
查找单元721,用于根据背景噪音数据的特征向量查找特征向量与环境类型的对应关系表;
获取单元722,用于获取背景噪音数据的特征向量对应的环境类型。
较佳地,参见图10,该服务器还包括:
第二设置模块76,用于设置环境类型与语音数据类型的对应关系;
第二确定模块77,用于根据第二设置模块76设置的环境类型与语音数据类型的对应关系确定环境类型对应的语音数据类型;
推送模块73,用于向终端推送与语音数据类型对应的语音数据。
本发明实施例提供的服务器,通过根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据。因此,可实现自动根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。
实施例五
本发明实施例提供了一种推送语音数据的***,参见图11,该***包括:终端1101及服务器1102;
其中,终端1101如实施例三的终端;
服务器1102如实施例四的服务器。
本发明实施例提供的***,通过根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据。因此,可实现自动根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。
实施例六
本发明实施例提供了一种推送语音数据的设备,且本发明实施例中的推送语音数据的设备可以包括一个或多个如下组成部分:用于执行计算机程序指令以完成各种流程和方法的处理器,用于信息和存储程序指令随机接入存储器(RAM)和只读存储器(ROM),用于存储数据和信息的存储器,用于存储表格、目录或其他数据结构的数据库,I/O设备,界面,天线等。
本发明实施例中,计算机程序指令以一个或多个模块的形式存储于存储器中、并被配置成由处理器执行,上述一个或多个模块具有如下功能:
每隔预设时间获取一次背景噪音数据,并提取所述背景噪音数据的特征向量;
将所述背景噪音数据的特征向量上传至服务器,由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型,并向终端推送与所述环境类型相对应的语音数据;
接收所述服务器推送的语音数据。
上述功能的实施方式举例在方法实施例中已经详述,这里不再赘述。
综上所述,本发明实施例提供的设备,通过每隔预设时间获取一次背景噪音数据,并提取背景噪音数据的特征向量,进而将背景噪音数据的特征向量上传至服务器,由服务器根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据。因此,可实现自动根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。
实施例七
本发明实施例还提供了一种推送语音数据的设备,且本发明实施例中的推送语音数据的设备可以包括一个或多个如下组成部分:用于执行计算机程序指令以完成各种流程和方法的处理器,用于信息和存储程序指令随机接入存储器(RAM)和只读存储器(ROM),用于存储数据和信息的存储器,用于存储表格、目录或其他数据结构的数据库,I/O设备,界面,天线等。
本发明实施例中,计算机程序指令以一个或多个模块的形式存储于存储器中、并被配置成由处理器执行,上述一个或多个模块具有如下功能:
接收终端上传的背景噪音数据的特征向量;
根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型;
向所述终端推送与所述环境类型相对应的语音数据。
上述功能的实施方式举例在方法实施例中已经详述,这里不再赘述。
综上所述,本发明实施例提供的设备,通过根据预先存储的特征向量与环境类型的对应关系确定特征向量对应的环境类型,并向终端推送与环境类型相对应的语音数据。因此,可实现自动根据外部环境为用户推送语音数据,从而满足用户不同时间及地点的聆听需求,提高了用户体验。
需要说明的是:上述实施例提供的终端、服务器及推送语音数据的***在推荐语音数据时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将终端、服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的终端、服务器及推送语音数据的***与推送语音数据的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种推送语音数据的方法,其特征在于,所述方法包括:
每隔预设时间获取一次背景噪音数据,并对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号,提取所述声音信号的频谱特征,得到所述声音信号的特征向量;
将所述背景噪音数据的特征向量上传至服务器,由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所述特征向量对应的环境类型,并向终端推送与所述环境类型和用户的喜好语音数据类型相对应的语音数据,所述喜好语音数据类型由所述服务器根据所述用户收听过的历史语音数据统计得到,所述对应关系是利用支持向量机机器学习方法进行机器学习后得到的;
接收所述服务器推送的语音数据;
其中,所述每隔预设时间获取一次背景噪音数据,包括:
首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;
非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;
其中,所述第一预设时间长度小于所述第二预设时间长度。
2.根据权利要求1所述的方法,其特征在于,所述得到所述背景噪音数据的声音信号之后,所述方法还包括:
对得到的所述背景噪音数据的声音信号进行频域变换;
所述提取所述声音信号的频谱特征,包括:
提取进行频域变换后的所述声音信号的频谱特征。
3.一种推送语音数据的终端,其特征在于,所述终端包括:
获取模块,用于每隔预设时间获取一次背景噪音数据;
提取模块,用于提取所述获取模块获取到的背景噪音数据的特征向量;
上传模块,用于将所述提取模块提取到的背景噪音数据的特征向量上传至服务器,由所述服务器根据预先存储的特征向量与环境类型的对应关系确定所 述特征向量对应的环境类型,并向终端推送与所述环境类型和用户的喜好语音数据类型相对应的语音数据,所述喜好语音数据类型由所述服务器根据所述用户收听过的历史语音数据统计得到,所述对应关系是利用支持向量机机器学习方法进行机器学习后得到的;
其中,所述获取模块,包括:
第一获取单元,用于在首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据;
第二获取单元,用于在非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据;
其中,所述第一预设时间长度小于所述第二预设时间长度;
所述提取模块用于对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号;提取所述声音信号的频谱特征,得到所述声音信号的特征向量。
4.根据权利要求3所述的终端,其特征在于,所述终端还包括:
变换模块,用于对得到的所述背景噪音数据的声音信号进行频域变换;
所述提取模块用于提取进行频域变换后的所述声音信号的频谱特征。
5.一种推送语音数据的方法,其特征在于,所述方法包括:
接收终端上传的背景噪音数据的特征向量,所述终端在首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据,在非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据,所述第一预设时间长度小于所述第二预设时间长度,所述特征向量是由所述终端在对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号后,再提取所述声音信号的频谱特征得到的;
根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型,所述对应关系是利用支持向量机机器学习方法进行机器学习后得到的;
向所述终端推送与所述环境类型和用户的喜好语音数据类型相对应的语音数据,所述喜好语音数据类型根据所述用户收听过的历史语音数据统计得到。
6.根据权利要求5所述的方法,其特征在于,所述根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型之前,所述方法还包括:
设置特征向量与环境类型的对应关系表,并将所述特征向量与环境类型的对应关系表进行存储;
根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型,包括:
根据所述背景噪音数据的特征向量查找所述特征向量与环境类型的对应关系表,获取所述背景噪音数据的特征向量对应的环境类型。
7.根据权利要求5所述的方法,其特征在于,所述向所述终端推送与所述环境类型相对应的语音数据之前,所述方法还包括:
设置环境类型与语音数据类型的对应关系;
根据所述环境类型与语音数据类型的对应关系确定所述环境类型对应的语音数据类型;
所述向所述终端推送与所述环境类型相对应的语音数据,包括:
向所述终端推送与所述语音数据类型对应的语音数据。
8.一种服务器,其特征在于,所述服务器包括:
接收模块,用于接收终端上传的背景噪音数据的特征向量,所述终端在首次获取背景噪音数据时,获取一段时长为第一预设时间长度的背景噪音数据,在非首次获取背景噪音数据时,每隔预设时间获取一段时长为第二预设时间长度的背景噪音数据,所述第一预设时间长度小于所述第二预设时间长度,所述特征向量是由所述终端在对所述背景噪音数据进行解码,得到所述背景噪音数据的声音信号后,再提取所述声音信号的频谱特征得到的;
第一确定模块,用于根据预先存储的特征向量与环境类型的对应关系确定所述背景噪音数据的特征向量对应的环境类型,所述对应关系是利用支持向量机机器学习方法进行机器学习后得到的;
推送模块,用于向所述终端推送与所述环境类型和用户的喜好语音数据类型相对应的语音数据,所述喜好语音数据类型根据所述用户收听过的历史语音 数据统计得到。
9.根据权利要求8所述的服务器,其特征在于,所述服务器还包括:
第一设置模块,用于设置特征向量与环境类型的对应关系表;
存储模块,用于将所述第一设置模块设置的特征向量与环境类型的对应关系表进行存储;
所述第一确定模块,包括:
查找单元,用于根据所述背景噪音数据的特征向量查找所述特征向量与环境类型的对应关系表;
获取单元,用于获取所述背景噪音数据的特征向量对应的环境类型。
10.根据权利要求8所述的服务器,其特征在于,所述服务器还包括:
第二设置模块,用于设置环境类型与语音数据类型的对应关系;
第二确定模块,用于根据所述第二设置模块设置的环境类型与语音数据类型的对应关系确定所述环境类型对应的语音数据类型;
所述推送模块,用于向所述终端推送与所述语音数据类型对应的语音数据。
11.一种推送语音数据的***,其特征在于,所述***包括:终端及服务器;
其中,所述终端如所述权利要求3至4中任一权利要求所述的终端;
所述服务器如所述权利要求8至10中任一权利要求所述的服务器。
CN201310268905.2A 2013-06-28 2013-06-28 推送语音数据的方法、终端、服务器及*** Active CN103347070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310268905.2A CN103347070B (zh) 2013-06-28 2013-06-28 推送语音数据的方法、终端、服务器及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310268905.2A CN103347070B (zh) 2013-06-28 2013-06-28 推送语音数据的方法、终端、服务器及***

Publications (2)

Publication Number Publication Date
CN103347070A CN103347070A (zh) 2013-10-09
CN103347070B true CN103347070B (zh) 2017-08-01

Family

ID=49281844

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310268905.2A Active CN103347070B (zh) 2013-06-28 2013-06-28 推送语音数据的方法、终端、服务器及***

Country Status (1)

Country Link
CN (1) CN103347070B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104318925B (zh) * 2014-09-25 2017-09-01 小米科技有限责任公司 音频数据处理方法及装置
CN104618446A (zh) * 2014-12-31 2015-05-13 百度在线网络技术(北京)有限公司 一种实现多媒体推送的方法和装置
CN105227656B (zh) * 2015-09-28 2018-09-07 百度在线网络技术(北京)有限公司 基于语音识别的信息推送方法和装置
CN111656445B (zh) * 2017-10-27 2023-10-27 弗劳恩霍夫应用研究促进协会 解码器处的噪声衰减
CN109067883B (zh) * 2018-08-10 2021-06-29 珠海格力电器股份有限公司 信息推送方法及装置
CN109347986A (zh) * 2018-12-04 2019-02-15 北京羽扇智信息科技有限公司 一种语音信息推送方法、装置、电子设备及存储介质
CN109819375A (zh) * 2019-01-11 2019-05-28 平安科技(深圳)有限公司 调节音量的方法与装置、存储介质、电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101448340A (zh) * 2007-11-26 2009-06-03 联想(北京)有限公司 一种检测移动终端状态的方法、***及该移动终端
CN102024058A (zh) * 2010-12-31 2011-04-20 万音达有限公司 音乐推荐方法及***
CN102082799A (zh) * 2011-01-26 2011-06-01 惠州市德赛西威汽车电子有限公司 车载多媒体服务***访问方法及其***
CN102654860A (zh) * 2011-03-01 2012-09-05 北京彩云在线技术开发有限公司 一种个性化音乐推荐方法及***
CN102700482A (zh) * 2012-06-01 2012-10-03 浙江吉利汽车研究院有限公司杭州分公司 通过外部环境改变车内氛围的***
CN103024213A (zh) * 2012-12-17 2013-04-03 江苏乐买到网络科技有限公司 一种为用户提供个性化信息和服务的方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4122947B2 (ja) * 2002-11-28 2008-07-23 ヤマハ株式会社 楽曲情報配信装置
CN1301387C (zh) * 2004-06-04 2007-02-21 广东科龙电器股份有限公司 基于神经网络的空调器噪声源识别方法
US8161039B2 (en) * 2005-02-15 2012-04-17 Koninklijke Philips Electronics N.V. Automatic personal play list generation based on external factors such as weather, financial market, media sales or calendar data
CN102543119A (zh) * 2011-12-31 2012-07-04 北京百纳威尔科技有限公司 基于场景的音乐播放处理方法和音乐播放设备
CN103067863B (zh) * 2012-12-24 2016-12-28 宁波源丰消防设备有限公司 车载多媒体播放方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101448340A (zh) * 2007-11-26 2009-06-03 联想(北京)有限公司 一种检测移动终端状态的方法、***及该移动终端
CN102024058A (zh) * 2010-12-31 2011-04-20 万音达有限公司 音乐推荐方法及***
CN102082799A (zh) * 2011-01-26 2011-06-01 惠州市德赛西威汽车电子有限公司 车载多媒体服务***访问方法及其***
CN102654860A (zh) * 2011-03-01 2012-09-05 北京彩云在线技术开发有限公司 一种个性化音乐推荐方法及***
CN102700482A (zh) * 2012-06-01 2012-10-03 浙江吉利汽车研究院有限公司杭州分公司 通过外部环境改变车内氛围的***
CN103024213A (zh) * 2012-12-17 2013-04-03 江苏乐买到网络科技有限公司 一种为用户提供个性化信息和服务的方法和装置

Also Published As

Publication number Publication date
CN103347070A (zh) 2013-10-09

Similar Documents

Publication Publication Date Title
CN103347070B (zh) 推送语音数据的方法、终端、服务器及***
CN103886857B (zh) 一种噪声控制方法及设备
KR101954550B1 (ko) 음량조절 방법, 시스템, 디바이스 및 컴퓨터 저장매체
CN110956957B (zh) 语音增强模型的训练方法及***
CN104683294B (zh) 一种数据处理方法和***
CN104980337B (zh) 一种音频处理的性能提升方法及装置
CN109951743A (zh) 弹幕信息处理方法、***及计算机设备
CN103886731B (zh) 一种噪声控制方法及设备
US20180115641A1 (en) Method And Apparatus For Classifying Telephone Dialing Test Audio Based On Artificial Intelligence
CN104766608A (zh) 一种语音控制方法及装置
CN103491488A (zh) 一种麦克风回音消除方法及装置
CN109658935B (zh) 多通道带噪语音的生成方法及***
WO2011035626A1 (zh) 音频播放方法及音频播放装置
CN104335591A (zh) 用于基于上下文的媒体的自适应递送的***
CN111640411B (zh) 音频合成方法、装置及计算机可读存储介质
CN109242555B (zh) 基于语音的广告播放方法及相关产品
CN104091596A (zh) 一种乐曲识别方法、***和装置
CN102917119A (zh) 一种移动终端基于语音识别处理音乐的方法及***
CN111048093A (zh) 会议音箱及会议记录方法、设备、***和计算机存储介质
CN107301030A (zh) 一种音量控制方法、装置以及一种终端
CN105812581A (zh) 音量自动调节方法及装置
CN107733876A (zh) 一种流媒体字幕显示方法、移动终端及存储装置
CN113611324A (zh) 一种直播中环境噪声抑制的方法、装置、电子设备及存储介质
CN103281425A (zh) 一种通过通话声音分析联系人的方法及装置
CN110047497A (zh) 背景音频信号滤除方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent for invention or patent application
CB02 Change of applicant information

Address after: 100102 Beijing Wangjing West Road, a volume of stone world building, A, block, floor 12

Applicant after: Xiaomi Technology Co., Ltd.

Address before: 100102 Beijing Wangjing West Road, a volume of stone world building, A, block, floor 12

Applicant before: Beijing Xiaomi Technology Co., Ltd.

C53 Correction of patent for invention or patent application
CB02 Change of applicant information

Address after: 100085 Beijing city Haidian District Qinghe Street No. 68 Huarun colorful city shopping center two floor 13

Applicant after: Xiaomi Technology Co., Ltd.

Address before: 100102 Beijing Wangjing West Road, a volume of stone world building, A, block, floor 12

Applicant before: Xiaomi Technology Co., Ltd.

COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100102 CHAOYANG, BEIJING TO: 100085 HAIDIAN, BEIJING

GR01 Patent grant
GR01 Patent grant