CN105912296A

CN105912296A - 语音控制方法及***

Info

Publication number: CN105912296A
Application number: CN201610217523.0A
Authority: CN
Inventors: 吴庆龙
Original assignee: Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Current assignee: Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority date: 2016-04-08
Filing date: 2016-04-08
Publication date: 2016-08-31

Abstract

一种语音控制方法及***，该方法包括：识别电子设备的当前用户；获取当前用户的个性化语音参数；检测待播放音频的原始语音参数；根据当前用户的个性化语音参数及待播放音频的原始语音参数控制待播放音频的输出语音参数。通过本发明能让用户享受一致并习惯的语音，以及免受瞬间强音量对耳朵的伤害，提高了用户体验。

Description

语音控制方法及***

技术领域

本发明涉及声音处理技术领域，尤其涉及一种语音控制方法及***。

背景技术

目前电子设备都不能根据音频信号自动控制语音参数的改变，例如，调整音量的大小。用户通常只能设置一个默认的最高音量。在用户使用电子设备时(如看电影或者打电话时)，当突然收听到一个响度比较高的声音进入用户的耳朵时，瞬间的高音可能对用户的耳朵造成伤害。此外，当前的电子设备不允许用户根据自己的日常习惯设置音量值，降低了用户体验。

发明内容

鉴于以上内容，有必要提供一种语音控制方法及***，能让用户享受一致并习惯的语音，以及免受瞬间高音对耳朵的伤害，提高了用户体验。

一种语音控制方法，应用于电子设备，所述方法包括：

识别电子设备的当前用户；

获取所述当前用户的个性化语音参数；

检测待播放音频的原始语音参数；及

根据所述当前用户的个性化语音参数及所述待播放音频的原始语音参数控制所述待播放音频的输出语音参数。

根据本发明一优选实施例，所述当前用户的个性化语音参数通过以下方式中的至少一种获取：

读取预先存储于所述电子设备中与所述当前用户对应的个性化语音参数；或

提示所述当前用户通过所述电子设备的语音调节功能设置语音参数，将所设置的语音参数确认为所述当前用户的个性化语音参数；或

通过播放示例音频来获取所述当前用户的个性化语音参数。

根据本发明一优选实施例，所述方法还包括：

获取所述当前用户在预设时间段内播放音频时设置的语音参数；及

根据所述设置的语音参数更新所述当前用户的个性化语音参数。

根据本发明一优选实施例，所述原始语音参数包括原始音量，所述个性化语音参数包括个性化音量，所述输出语音参数包括输出音量，所述控制所述待播放音频的输出语音参数包括：

当所述待播放音频的原始音量大于所述当前用户的个性化音量时，根据所述当前用户的个性化音量，降低所述待播放音频的原始音量，将降低后的音量确定为所述待播放音频的输出音量；

当所述待播放音频的原始音量不大于所述当前用户的个性化音量时，根据预先设置的下限音量及所述当前用户的个性化音量确定所述待播放音频的输出音量。根据本发明一优选实施例，所述原始语音参数包括原始音量，所述个性化语音参数包括个性化音量，所述控制所述待播放音频的输出语音参数包括：

当所述待播放音频的原始音量大于预先设置的上限音量时，根据所述当前用户的个性化音量确定所述待播放音频的输出音量；

当所述待播放音频的原始音量不大于上限音量，根据预先设置的下限音量及所述当前用户的个性化音量确定所述待播放音频的输出音量。

一种语音控制***，所述***包括：

识别模块，用于识别电子设备的当前用户；

获取模块，用于获取所述当前用户的个性化语音参数；

检测模块，用于检测待播放音频的原始语音参数；及

控制模块，用于根据所述当前用户的个性化语音参数及所述待播放音频的原始语音参数控制所述待播放音频的输出语音参数。

通过播放示例音频来获取所述当前用户的个性化语音参数。根据本发明一优选实施例，所述***还包括：

当所述待播放音频的原始音量不大于所述当前用户的个性化音量时，根据预先设置的下限音量及所述当前用户的个性化音量确定所述待播放音频的输出音量。

根据本发明一优选实施例，所述原始语音参数包括原始音量，所述个性化语音参数包括个性化音量，所述控制所述待播放音频的输出语音参数包括：

由以上技术方案可以看出，本发明通过设置个性化语音参数，让用户享受一致并习惯的语音，以及免受瞬间强音量对耳朵的伤害。此外，本发明还能够根据用户收听音频的音量来自动更新个性化语音参数，提高了用户体验。

附图说明

图1是本发明一种语音控制***的结构示意图。

图2是本发明一种语音控制方法的较佳实施例的流程图。

图3是本发明一种语音控制***又一结构示意图。

主要元件符号说明

电子设备	1000
		语音控制***	10
存储器	20
		处理器	30
输出器	40
		识别模块	100
获取模块	101
		检测模块	102
控制模块	103
		输出模块	104

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。如图1所示，是本发明语音控制***的结构示意图。如该图所示，一个电子设备1000包括语音控制***10。该电子设备1000还包括存储器20、处理器30及输出器40。

优选地，所述语音控制***10包含于播放控制插件中。所述播放控制插件可被加载至各类操作***、软件、应用(APP)等可独立运行的程序中，以使被加载程序能够控制待播放音频执行如本发明所述的相应处理。

更优选地，可通过将现有的插件与该语音控制***10相结合来构成所述播放控制插件，例如，在现有的微信插件中包含该语音控制***10，以获得该播放控制插件等。

优选地，本发明的方法通过包含于电子设备1000中的语音控制***10来实现。所述电子设备1000包括一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的电子设备，其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述电子设备1000还可包括网络设备和/或用户设备。其中，所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。所述用户设备包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理PDA、游戏机或交互式网络电视IPTV等。其中，所述用户设备及网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络VPN等。

所述语音控制***10用于通过设置用户的个性化语音参数，对收听的音频的语音参数进行处理，让用户享受一致并习惯的语音，以及免受瞬间强音量对耳朵的伤害，提高了用户的体验。

所述存储器20用于存储所述音量控制***10中各个程序段的程序代码。该存储器20可以为智能媒体卡(smart media card)、安全数字卡(secure digitalcard)、快闪存储器卡(flash card)等储存设备。所述存储器10中存储着至少一个用户的用户信息及该用户的个性化语音参数。所述用户信息包括但不限于，用户登录电子设备的账号及密码，用户的指纹信息，用户的声音信息，用户的图像信息，用户的其他生物特征信息(如人脸特征等)、电子设备1000的信息(如设备型号等)。所述个性化语音参数包括但不限于，个性化音量、个性化音色等参数。其中，个性化音量可以是用户感觉舒服的音量值，也可以是用户习惯的音量值。

所述处理器30可以是由一个或者多个微处理器、数字处理器(DSP)组成。所述输出器40可以是扬声器、麦克风、耳机等。

如图2所示，是本发明语音控制方法的较佳实施例的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。

S10，识别电子设备的当前用户。

在本实施例中，根据存储于存储器20中的用户信息确认当前用户的身份。在确认当前用户的身份时，可以获取该当前用户的指纹，利用指纹识别技术，将获取的指纹特征与所存储的指纹信息进行比对以确认当前用户。对当前用户的身份的确认也可以通过获取用户的声音，利用声音识别技术，将获取的声音特征与所存储的声音信息进行比对来实现。进一步地，对当前用户的身份的确认还可以通过获取用户的图像，利用图像识别技术，将获取的图像与所存储的图像信息进行比对来实现。当所述电子设备1000设置有密码登录时，对当前用户的身份的确认也可以根据用户登录所述电子设备1000的账号密码来实现。在其他实施例中，确认当前用户身份的方法可以是上述方法中的一种或者多种方法的组合。

若经过上述比对，确认该当前用户的用户信息并未存储于所述存储器20时，确认该当前用户为新用户，并将该新用户的用户信息存储至所述存储器20中。

S11，获取当前用户的个性化语音参数。

所述电子设备1000可以有一个或者多个用户，例如，在一个家庭中，一个平板电脑可以有多个家庭成员使用，每个家庭成员在收听音频时的个性化音量也会根据各个人的习惯而有所不同。

所述个性化语音参数包括但不限于，个性化音量，个性化音色等。

在本实施例中，获取当前用户的个性化语音参数的方法包括以下方式中的至少一种：

(1)读取预先存储于所述存储器20中的与当前用户对应的个性化语音参数。在收听音频时，用户可以将自己感觉比较舒适的语音信息保存为个性化语音参数。

(2)当存储器20中没有当前用户的个性化语音参数时，提示当前用户通过电子设备1000的音量调节功能设置语音参数，将所设置的语音参数确认为当前用户的个性化语音参数。

后续用户会利用电子设备1000收听各类音频，每个音频播放时可能会有不同的语音参数。通过获取当前用户在预设时间段内(如：一周)播放音频时选择的多个语音参数可以对当前用户的个性化语音参数进行更新。具体为：获取预设时间段内当前用户播放音频的多个语音参数，根据获取的多个语音参数生成新的语音参数，例如计算所获取的多个音量值的平均值，将该平均值确认为新的音量值。若当前用户确认该新的语音参数可以作为其个性化语音参数时，根据该新的语音参数更新该当前用户的个性化语音参数。若当前用户确认该新的语音参数不能作为其个性化语音参数时，在预设区间范围内自动调节该新的语音参数，直至当前用户确认所生成的新的语音参数可以作为其更新的个性化语音参数。

由于当前用户可能在某一段时间内对自己所习惯的语音参数会有所改变，例如可能有一段时间喜欢听轻音乐，可能有一段时间喜欢听摇滚，这样当前用户的个性化语音参数就会改变。因此，当存储器20中存储有当前用户的个性化语音参数时，也需要通过监测当前用户在预设时间内播放音频时选择的语音参数来更新当前用户的个性化语音参数。

(3)通过播放示例音频来获取当前用户的个性化语音参数，其中，所述示例音频属于示例音频集，预先存储于所述存储器20中。所述音频集中包含多个分别属于不同语音参数区段(如音量区段)的示例音频；获取当前用户对所述示例音频的调节指令(例如，选择与所播放的示例音频相邻音量区段的音频作为新的示例音频)；并根据所述当前用户对所述示例音频的调节指令，选择新的示例音频。重复上述步骤，直至当前用户确认所播放的示例音频的语音参数区段为用户所习惯的语音参数区段；获取当前用户选择的所习惯的语音参数区段中的语音参数作为所述当前用户的个性化语音参数。

S12，检测待播放音频的原始语音参数。

在本实施例中，所述待播放音频包括电子设备1000中需要被播放的音频数据。优选地，所述待播放音频包括但不限于以下任一种：

(1)呼叫通话时的语音音频，例如，手机通话时的对方的音频，又例如，呼叫中心所接收到的呼入电话的音频等；

(2)经由网络传输的各类音频，如微信中的语音音频，在线影院中的视频等；

(3)存储于电子设备1000中的各类音频，如mp3等。

优选地，所述待播放音频的原始语音参数为所述待播放音频流入输出器40前的语音参数。利用音频处理技术对待播放音频进行解码处理获取所述待播放音频的原始语音参数，后续对所述待播放音频的原始语音参数进行处理。所述原始语音参数包括但不限于，原始音量，原始音色等。

S13，根据当前用户的个性化语音参数及待播放音频的原始语音参数控制待播放音频的输出语音参数。

所述输出语音参数包括但不限于，输出音量，输出音色等。

在本实施例中，以对音量的调节为例进行说明，待播放音频的输出音量可通过以下方式中的至少一种来控制：

(1)当待播放音频的原始音量大于当前用户的个性化音量时，根据当前用户的个性化音量，降低所述待播放音频的原始音量，将降低后的音量确定为待播放音频的输出音量。

具体地，可以设置一个个性化音量对应的第一预设浮动区间，只需要将所述待播放音频的原始音量降低到个性化音量对应的第一预设浮动区间即可。所述第一预设浮动区间可由用户设置，也可以是默认值。例如个性化音量为30分贝，浮动区间为[25,30]，则调节后的所述待播放音频的原始音量只需要在25分贝在30分贝之间就可满足要求。

当待播放音频的原始音量不大于当前用户的个性化音量时，根据当前用户的个性化音量及预先设置的下限音量，调整所述待播放音频的原始音量。所述下限音量可由用户设定，也可以是一个默认值。

优选地，判断所述待播放音频的原始音量是否小于下限音量。当所述待播放音频的原始音量小于一个下限音量时，根据当前用户的个性化音量，将所述待播放音频的原始音量进行增益，将增益后的音量确定为待播放音频的输出音量。具体地，只需要将所述待播放音频的原始音量增益到个性化音量对应的第一预设浮动区间即可。

当待播放音频的原始音量不大于当前用户的个性化音量，且所述待播放音频的原始音量大于下限音量时，所述待播放音频的原始音量确认为待播放音频的输出音量。

在其他实施例中，当待播放音频的原始音量不大于当前用户的个性化音量时，根据当前用户的个性化音量调整所述待播放音频的原始音量。具体地，根据当前用户的个性化音量，将所述待播放音频的原始音量进行增益，将增益后的音量确定为待播放音频的输出音量。具体地，只需要将所述待播放音频的原始音量增益到个性化音量对应的第一预设浮动区间即可。

(2)设置一个上限音量，所述上限音量可由用户设定，也可以是一个默认值。当待播放音频的原始音量大于上限音量时，根据当前用户的个性化音量，降低所述待播放音频的原始音量，将降低后的音量确定为待播放音频的输出音量。

具体地，可以根据上限音量及个性化音量设置一个个性化音量对应的第二预设浮动区间，只需要将所述待播放音频的原始音量降低到个性化音量对应的第二预设浮动区间即可。所述第二预设浮动区间可由用户设置，也可以是默认值。例如个性化音量为30分贝，上限音量为45分贝，浮动区间为[25,40]，则调节后的所述待播放音频的原始音量只需要在25分贝在40分贝之间就可满足要求。

当待播放音频的原始音量不大于上限音量时，判断所述待播放音频的原始音量是否小于下限音量，当所述待播放音频的原始音量小于下限音量时，根据当前用户的个性化音量，将所述待播放音频的原始音量进行增益，将增益后的音量确定为待播放音频的输出音量。具体地，只需要将所述待播放音频的原始音量增益到个性化音量对应的第二预设浮动区间即可。

当待播放音频的原始音量不大于上限音量，且所述待播放音频的原始音量大于下限音量时，所述待播放音频的原始音量确认为待播放音频的输出音量。

优选地，本发明还包括将待播放音频的输出语音参数通过输出器40输出给用户。

本发明通过设置个性化语音参数，让用户享受一致并习惯的语音，以及免受瞬间高音对耳朵的伤害。本发明还能够根据用户收听音频的语音参数来自动更新个性化语音参数，提高了用户的体验。

例如用户通过手机听歌曲或者看电影，能让用户享受自己习惯的音量。或者在打电话时，突然有超高响度的音量时，会将超高响度的音量进行降低，并将降低后的音量输出给用户。

如图3所示，所述语音控制***10包括识别模块100、获取模块101、检测模块102、控制模块103及输出模块104。本发明所称的模块是指一种能够被处理器30所执行并且能够完成固定功能的一系列计算机程序段，其存储在存储器20中。在本实施例中，关于各模块的功能将在后续的实施例中详述。

识别模块100用于识别电子设备1000的当前用户。

获取模块101用于获取当前用户的个性化语音参数。

在本实施例中，所述获取模块101获取当前用户的个性化语音参数包括以下方式中的至少一种：

检测模块102用于检测待播放音频的原始语音参数。

(3)存储于电子设备1000中的各类音频，如mp3等。

控制模块103用于根据当前用户的个性化语音参数及待播放音频的原始语音参数控制待播放音频的输出语音参数。

所述输出语音参数包括但不限于，输出音量，输出音色等。

在本实施例中，以对音量的调节为例进行说明，所述控制模块103通过以下方式中的至少一种控制待播放音频的输出音量：

优选地，本发明还包括输出模块104用于将待播放音频的输出语音参数通过输出器40输出给用户。

在本发明所提供的几个实施例中，应该理解到，所揭露的***，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种语音控制方法，应用于电子设备，其特征在于，所述方法包括：

识别电子设备的当前用户；

获取所述当前用户的个性化语音参数；

检测待播放音频的原始语音参数；及

2.如权利要求1所述的语音控制方法，其特征在于，所述当前用户的个性化语音参数通过以下方式中的至少一种获取：

通过播放示例音频来获取所述当前用户的个性化语音参数。

3.如权利要求1所述的语音控制方法，其特征在于，所述方法还包括：

4.如权利要求1所述的语音控制方法，其特征在于，所述原始语音参数包括原始音量，所述个性化语音参数包括个性化音量，所述输出语音参数包括输出音量，所述控制所述待播放音频的输出语音参数包括：

5.如权利要求1所述的语音控制方法，其特征在于，所述原始语音参数包括原始音量，所述个性化语音参数包括个性化音量，所述控制所述待播放音频的输出语音参数包括：

6.一种语音控制***，其特征在于，所述***包括：

识别模块，用于识别电子设备的当前用户；

获取模块，用于获取所述当前用户的个性化语音参数；

检测模块，用于检测待播放音频的原始语音参数；及

7.如权利要求6所述的语音控制***，其特征在于，所述当前用户的个性化语音参数通过以下方式中的至少一种获取：

通过播放示例音频来获取所述当前用户的个性化语音参数。

8.如权利要求6所述的语音控制***，其特征在于，所述***还包括：

9.如权利要求6所述的语音控制***，其特征在于，所述原始语音参数包括原始音量，所述个性化语音参数包括个性化音量，所述输出语音参数包括输出音量，所述控制所述待播放音频的输出语音参数包括：

10.如权利要求6所述的语音控制***，其特征在于，所述原始语音参数包括原始音量，所述个性化语音参数包括个性化音量，所述控制所述待播放音频的输出语音参数包括：