CN111796790A - 一种音效调节方法、装置、可读存储介质及终端设备 - Google Patents
一种音效调节方法、装置、可读存储介质及终端设备 Download PDFInfo
- Publication number
- CN111796790A CN111796790A CN201910281281.5A CN201910281281A CN111796790A CN 111796790 A CN111796790 A CN 111796790A CN 201910281281 A CN201910281281 A CN 201910281281A CN 111796790 A CN111796790 A CN 111796790A
- Authority
- CN
- China
- Prior art keywords
- noise
- sound effect
- training
- determining
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本发明涉及音效调节技术领域,尤其涉及一种音效调节方法、装置、计算机可读存储介质及终端设备。本发明提供的音效调节方法包括:获取终端设备所在环境的噪声信号,并确定所述噪声信号的噪声功率;获取所述噪声信号的频谱特性,并根据所述频谱特性确定所述噪声信号的噪声类型;根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,并根据所述目标音效调节所述终端设备的当前音效,以根据外部环境噪声的噪声功率和频谱特性来自动调节终端设备的播放音效,提高了终端设备的便捷性和智能性,从而极大地提高了用户的使用体验。
Description
技术领域
本发明涉及音效调节技术领域,尤其涉及一种音效调节方法、装置、计算机可读存储介质及终端设备。
背景技术
目前,智能音箱等终端设备已逐渐成为人工智能领域的重要分支,并且在消费电子市场也占据着重要地位。现在的智能音箱等终端设备,在播放声音的情况下,往往提供了多种音效供用户选择或者调整等,但现有的智能音箱等终端设备中,音效的选择或者调整等往往需要用户人为手动去执行,降低了智能音箱等终端设备的便捷性和智能性,极大地影响了用户的使用体验。
发明内容
本发明实施例提供了一种音效调节方法、装置、计算机可读存储介质及终端设备,能够实现终端设备中音效的自动调节,提高终端设备的便捷性和智能性,以提高用户的使用体验。
本发明实施例的第一方面,提供了一种音效调节方法,包括:
获取终端设备所在环境的噪声信号,并确定所述噪声信号的噪声功率;
获取所述噪声信号的频谱特性,并根据所述频谱特性确定所述噪声信号的噪声类型;
根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,并根据所述目标音效调节所述终端设备的当前音效。
进一步地,所述获取终端设备所在环境的噪声信号,包括:
获取所述终端设备所在环境的第一语音信号;
确定所述第一语音信号中位于预设频谱范围内的第二语音信号;
从所述第一语音信号中删除所述第二语音信号,并将删除所述第二语音信号的第一语音信号确定为所述噪声信号。
优选地,所述确定所述噪声信号的噪声功率,包括:
对所述噪声信号进行分帧处理,并获取每一帧中的噪声信号所对应的振动幅度;
对各所述振动幅度进行求和累加,并将求和累加的结果确定所述噪声信号的噪声功率。
可选地,所述获取所述噪声信号的频谱特性,包括:
对所述噪声信号进行预处理,并通过快速傅里叶变化获取预处理后的噪声信号的噪声频谱;
利用梅尔Mel滤波器将所述噪声频谱转换为对应的Mel频谱;
对所述Mel频谱进行滤波和离散余弦变换,得到所述噪声信号的频谱特性。
进一步地,所述根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,包括:
将所述噪声类型和所述噪声功率输入至训练后的音效匹配模型中,得到所述音效匹配模型输出的匹配结果,并将所述匹配结果确定为与所述环境相匹配的目标音效。
优选地,所述音效匹配模型的训练过程包括:
获取训练用的训练噪声类型和训练噪声功率,并标记各所述训练噪声类型与对应的训练噪声功率的标准匹配结果;
分别将各所述训练噪声类型和对应的训练噪声功率输入至初始的音效匹配模型中,得到所述初始的音效匹配模型输出的训练匹配结果;
根据所述训练匹配结果和所述标准匹配结果确定当次训练的训练误差;
若所述训练误差满足预设条件,则确定所述音效匹配模型训练完成;
若所述训练误差不满足所述预设条件,则调整所述音效匹配模型的模型参数,并将模型参数调整后的音效匹配模型确定为初始的音效匹配模型,返回执行分别将各所述训练噪声类型和对应的训练噪声功率输入至初始的音效匹配模型中,得到所述初始的音效匹配模型输出的训练匹配结果的步骤以及后续步骤。
本发明实施例的第二方面,提供了一种音效调节装置,包括:
噪声功率确定模块,用于获取终端设备所在环境的噪声信号,并确定所述噪声信号的噪声功率;
噪声类型确定模块,用于获取所述噪声信号的频谱特性,并根据所述频谱特性确定所述噪声信号的噪声类型;
音效调节模块,用于根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,并根据所述目标音效调节所述终端设备的当前音效。
本发明实施例的第三方面,提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前述第一方面所述音效调节方法的步骤。
本发明实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如前述第一方面所述音效调节方法的步骤。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,可首先获取终端设备所在环境的噪声信号,并确定所述噪声信号的噪声功率;其次,可获取所述噪声信号的频谱特性,并根据所述频谱特性确定所述噪声信号的噪声类型;最后,可根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,并根据所述目标音效调节所述终端设备的当前音效。即本发明实施例中,可根据外部环境噪声的噪声功率和频谱特性来自动调节终端设备的播放音效,提高了终端设备的便捷性和智能性,从而极大地提高了用户的使用体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种音效调节方法的一个实施例流程图;
图2为本发明实施例中一种音效调节方法在一个应用场景下获取噪声信号的流程示意图;
图3为本发明实施例中一种音效调节方法在一个应用场景下获取频谱特性的流程示意图;
图4为本发明实施例中一种音效调节方法在一个应用场景下训练音效匹配模型的流程示意图;
图5为本发明实施例中一种音效调节装置的一个实施例结构图;
图6为本发明一实施例提供的一种终端设备的示意图。
具体实施方式
本发明实施例提供了一种音效调节方法、装置、计算机可读存储介质及终端设备,用于实现终端设备中音效的自动调节,提高终端设备的便捷性和智能性,以提高用户的使用体验。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例提供了一种音效调节方法,所述音效调节方法包括:
步骤S101、获取终端设备所在环境的噪声信号,并确定所述噪声信号的噪声功率;
本发明实施例的执行主体为终端设备,例如可以为智能音箱,智能音箱等终端设备中设置有麦克风阵列,所述麦克风阵列可以从各角度采集智能音箱等终端设备当前所在环境中的语音信号,并可将所采集的语音信号发送至智能音箱等终端设备中的处理装置,所述处理装置则可从所述语音信号中提取出噪声信号,并确定出所述噪声信号对应的噪声功率。
具体地,如图2所示,本发明实施例中,所述获取终端设备所在环境的噪声信号,可以包括:
步骤S201、获取所述终端设备所在环境的第一语音信号;
可以理解的是,在智能音箱等终端设备播放或者开始播放音乐时,智能音箱等终端设备中的麦克风阵列可采集智能音箱等终端设备当前所在环境中的第一语音信号,其中,所采集的第一语音信号可以包括外部环境中的噪声信号和智能音箱等终端设备中播放音乐所产生的第二语音信号。
步骤S202、确定所述第一语音信号中位于预设频谱范围内的第二语音信号;
步骤S203、从所述第一语音信号中删除所述第二语音信号,并将删除所述第二语音信号的第一语音信号确定为所述噪声信号。
对于上述步骤S202和步骤S203,本发明实施例中的音效调节主要是根据智能音箱等终端设备当前所在环境中的外部环境噪声来调节智能音箱等终端设备的音乐播放效果,因此,当麦克风阵列采集到的第一语音信号包含智能音箱等终端设备中播放音乐所产生的第二语音信号时,则可将所述第二语音信号过滤掉,即可将所述第二语音信号从所述第一语音信号中进行删除,如可通过特定滤波器将所述第二语音信号所对应的频谱分量进行过滤删除,并可将过滤删除第二语音信号后的第一语音信号确定为智能音箱等终端设备当前所在环境的外部噪声信号。
在此,所述第二语音信号为智能音箱等终端设备所播放的正常音乐信号,其中,正常音乐信号的频谱位于预设频谱范围内,所述预设频谱范围的确定过程具体可以为:将智能音箱等终端设备放置于无外部噪声的实验环境中进行音乐播放,采集播放所产生的语音信号,并通过分析播放所产生的语音信号来确定出所述预设频谱范围。
进一步地,本发明实施例中,所述确定所述噪声信号的噪声功率,可以包括:
步骤a、对所述噪声信号进行分帧处理,并获取每一帧中的噪声信号所对应的振动幅度;
步骤b、对各所述振动幅度进行求和累加,并将求和累加的结果确定所述噪声信号的噪声功率。
对于上述步骤a和步骤b,可以理解的是,在确定了外部环境对应的噪声信号后,可进一步获取所述噪声信号所对应的振动幅度,从而可根据所述振动幅度来确定所述噪声信号的噪声功率,如可以首先对所述噪声信号进行分帧处理,然后可以通过傅里叶变化获取每一帧中的噪声信号所对应的振动幅度,最后可将各帧中所对应的振动幅度进行求和累加,并将求和累加所得到的结果确定为所述噪声信号的噪声功率,其中,所获取到的噪声功率可用于表征噪声的音量大小。
步骤S102、获取所述噪声信号的频谱特性,并根据所述频谱特性确定所述噪声信号的噪声类型;
本发明实施例中,在获取到智能音箱等终端设备当前所在环境的噪声信号之后,可以进一步获取所述噪声信号的频谱特性,例如,可以通过梅尔频率倒谱系数法来获取所述噪声信号的频谱特性,从而可根据所述频谱特性来确定所述噪声信号的噪声类型,以确定出智能音箱等终端设备当前所在环境的环境类型。
进一步地,如图3所示,本发明实施例中,所述获取所述噪声信号的频谱特性,可以包括:
步骤S301、对所述噪声信号进行预处理,并通过快速傅里叶变化获取预处理后的噪声信号的噪声频谱;
步骤S302、利用梅尔Mel滤波器将所述噪声频谱转换为对应的Mel频谱;
步骤S303、对所述Mel频谱进行滤波和离散余弦变换,得到所述噪声信号的频谱特性。
对于上述步骤S301至步骤S303,可以理解的是,在获取所述噪声信号的频谱特性时,可首先对所述噪声信号进行加窗、分帧等预处理,其次,对每一个分析窗,可通过快速傅里叶变化来获取该分析窗内的噪声频谱,而在获取到各分析窗内的噪声频谱后,则可利用梅尔Mel滤波器组将各所述噪声频谱转换为所对应的Mel频谱,最后,可通过对各Mel频谱进行滤波和离散余弦变换DCT,来得到各Mel频谱所对应的Mel频率倒谱系数,从而得到所述噪声信号对应的频谱特性。
在此,在确定出所述噪声信号的频谱特性后,则可根据所述频谱特性确定所述噪声信号的噪声类型,如确定所述噪声信号的噪声类型是自然白噪声,还是语音机械噪声等。
需要说明的是,所述频谱特性可以包括频率覆盖范围和频谱特性随时间的变化程度等,其中,根据频谱覆盖范围可将噪声信号分为全频带噪声和窄频带噪声,而根据频谱特性随时间的变化程度则可将噪声信号分为周期噪声、脉冲噪声、平稳噪声和缓变噪声。本发明实施例中,根据所述频谱特性确定所述噪声信号的噪声类型主要是根据频谱覆盖范围和频谱特性随时间的变化程度来确定,例如,当确定所述噪声信号为全频带噪声和平稳噪声时,则可确定所述噪声信号的噪声类型为自然白噪声,即可确定智能音箱等终端设备当前所在的环境为自然白噪声环境;而当确定所述噪声信号为窄频带噪声和周期噪声时,则可确定所述噪声信号的噪声类型为语音机械噪声,即可确定智能音箱等终端设备当前所在的环境为语音机械噪声环境。
步骤S103、根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,并根据所述目标音效调节所述终端设备的当前音效。
本发明实施例中,在确定出所述噪声信号的噪声类型和获取到所述噪声信号的噪声功率后,则可根据所述噪声类型和所述噪声功率来确定出与所述环境相匹配的目标音效,从而可根据所述目标音效来调节智能音箱等终端设备的当前音效,以提高智能音箱等终端设备的播放效果。
需要说明的是,音效可以包括音量、重低音效果以及在不同环境下最适合人耳接收的音乐均衡效果等,其中,目标音效中的音量与噪声功率相关,而重低音效果和音乐均衡效果则与噪声类型相关,例如,自然白噪声环境所需的重低音效果较强,语音机械噪声环境时中频部分的声音波段最适合人耳接收。
具体地,目标音效中的音量可根据噪声功率和智能音箱等终端设备当前播放的声音功率进行确定,当噪声功率超过或者接近智能音箱等终端设备当前播放的声音功率时,如当所述噪声功率达到所述声音功率的70%及以上时,可认为所述噪声功率接近所述声音功率,即表明需要调整智能音箱等终端设备当前播放的播放音量,此时所确定的目标音效中的音量则可大于智能音箱等终端设备当前播放的播放音量。
在此,当确定出所述噪声类型为自然白噪声时,则可知所确定的目标音效的重低音效果较强,此时即可根据该目标音效加强智能音箱等终端设备当前播放中的重低音效果,同时还可根据所述噪声功率和智能音箱等终端设备当前播放的声音功率确定出该目标音效中的音量,从而可根据所确定的音量来调节智能音箱等终端设备的当前播放音量,如当所述噪声功率超过或者接近所述声音功率时,可提高当前播放音量,使得当前播放音量的声音功率超过所述噪声功率;当确定所述噪声类型为语音机械噪声时,则可知所确定的目标音效的中频部分声音波段需较高,此时即可根据该目标音效自动提升智能音箱等终端设备当前播放音乐中的中频部分的声音波段,并可适当降低高频和低频部分的声音波段,同时也可根据噪声功率和智能音箱等终端设备当前播放的声音功率确定出该目标音效的音量,以根据所确定的音量来调节智能音箱等终端设备的当前播放音量。
可以理解的是,在一个应用场景中,可预先设置目标音效与噪声类型及对应的噪声功率之间的对应关系,并将所设置的对应关系存储于智能音箱等终端设备的存储装置中,因此,当确定出所述噪声类型和所述噪声功率后,则可根据该对应关系找到相对应的目标音效,从而根据所找到的目标音效来调节智能音箱等终端设备的当前音效。在另一个应用场景中,则可通过构建音效匹配模型来匹配出所对应的目标音效,其中,该音效匹配模型的入参为噪声类型和噪声功率,输出结果则为具体的音效类型。
具体地,本发明实施例中,所述根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,可以包括:
将所述噪声类型和所述噪声功率输入至训练后的音效匹配模型中,得到所述音效匹配模型输出的匹配结果,并将所述匹配结果确定为与所述环境相匹配的目标音效。
进一步地,如图4所示,本发明实施例中,所述音效匹配模型的训练过程可以包括:
步骤S401、获取训练用的训练噪声类型和训练噪声功率,并标记各所述训练噪声类型与对应的训练噪声功率的标准匹配结果;
步骤S402、将所述训练噪声类型和对应的训练噪声功率输入至初始的音效匹配模型中,得到所述初始的音效匹配模型输出的训练匹配结果;
步骤S403、根据所述训练匹配结果和所述标准匹配结果确定当次训练的训练误差;
步骤S404、判断所述训练误差是否满足预设条件;
步骤S405、若所述训练误差满足所述预设条件,则确定所述音效匹配模型训练完成;
步骤S406、若所述训练误差不满足所述预设条件,则调整所述音效匹配模型的模型参数,并将模型参数调整后的音效匹配模型确定为初始的音效匹配模型,返回执行分别将各所述训练噪声类型和对应的训练噪声功率输入至初始的音效匹配模型中,得到所述初始的音效匹配模型输出的训练匹配结果的步骤以及后续步骤。
对于上述步骤S401,可以理解的是,在训练所述音效匹配模型之前,需要预先获取训练用的训练噪声类型和训练噪声功率,并可根据多次试验结果来标记各所述训练噪声类型与对应的训练噪声功率的标准匹配结果,例如,可在各训练噪声类型和各训练噪声功率所对应的噪声环境中进行音乐播放,并根据相关人员对音乐播放效果的反馈来进行音效调整,以将相关人员反馈的最佳播放效果所对应的音效确定为该训练噪声类型与对应的训练噪声功率所对应的标准匹配结果。
对于上述步骤S402,在标记完各训练噪声类型与对应的训练噪声功率的标准匹配结果之后,可以分别将各训练噪声类型与对应的训练噪声功率输入至初始的音效匹配模型中,以得到所述初始的音效匹配模型输出的各训练噪声类型与对应的训练噪声功率的训练匹配结果,由于初始时所述音效匹配模型尚未训练完成,因此,此时其输出的训练匹配结果与标准匹配结果之间会存在一定的误差、偏差。
对于上述步骤S403和步骤S404,在得到各训练匹配结果后,可根据所述训练匹配结果和所述标准匹配结果计算当次训练的训练误差,并判断该训练误差是否满足预设条件,如判断该训练误差是否小于5%。所述预设条件可以在训练具体的音效匹配模型时确定,例如可设定所述预设条件为训练误差小于特定阈值。
对于上述步骤S405和步骤S406,可以理解的是,当该训练误差满足所述预设条件时,例如,当该训练误差小于5%时,则可确定所述音效匹配模型训练完成。而当该训练误差不满足所述预设条件时,例如,当该训练误差为8%时,则可调整所述音效匹配模型的模型参数,并可将模型参数调整后的音效匹配模型作为初始的音效匹配模型,然后重新进行训练,以通过反复调整音效匹配模型的模型参数,并进行多次训练,来使得后续训练的训练误差最小化,直到训练误差满足所述预设条件。
本场景中,构建与训练音效匹配模型后,可通过音效匹配模型快速确定出与智能音箱等终端设备当前所在环境相匹配的目标音效,使得可准确、快速地进行音效的调节,提高了音效调节的准确性和效率,实现智能音箱等终端设备的便捷性和智能性,从而提高用户的使用体验。
本发明实施例中,可首先获取终端设备所在环境的噪声信号,并确定所述噪声信号的噪声功率;其次,可获取所述噪声信号的频谱特性,并根据所述频谱特性确定所述噪声信号的噪声类型;最后,可根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,并根据所述目标音效调节所述终端设备的当前音效。即本发明实施例中,可根据外部环境噪声的噪声功率和频谱特性来自动调节终端设备的播放音效,提高了终端设备的便捷性和智能性,从而极大地提高了用户的使用体验。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
上面主要描述了一种音效调节方法,下面将对一种音效调节装置进行详细描述。
图5示出了本发明实施例中一种音效调节装置的一个实施例结构图。如图5所示,所述音效调节装置,包括:
噪声功率确定模块501,用于获取终端设备所在环境的噪声信号,并确定所述噪声信号的噪声功率;
噪声类型确定模块502,用于获取所述噪声信号的频谱特性,并根据所述频谱特性确定所述噪声信号的噪声类型;
音效调节模块503,用于根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,并根据所述目标音效调节所述终端设备的当前音效。
进一步地,所述噪声功率确定模块501,可以包括:
第一语音信号获取单元,用于获取所述终端设备所在环境的第一语音信号;
第二语音信号确定单元,用于确定所述第一语音信号中位于预设频谱范围内的第二语音信号;
噪声信号确定单元,用于从所述第一语音信号中删除所述第二语音信号,并将删除所述第二语音信号的第一语音信号确定为所述噪声信号。
优选地,所述噪声功率确定模块501,还可以包括:
振动幅度获取单元,用于对所述噪声信号进行分帧处理,并获取每一帧中的噪声信号对应的振动幅度;
噪声功率确定单元,用于对各所述振动幅度进行求和累加,并将求和累加的结果确定所述噪声信号的噪声功率。
可选地,所述噪声类型确定模块502,可以包括:
噪声频谱获取单元,用于对所述噪声信号进行预处理,并通过快速傅里叶变化获取预处理后的噪声信号的噪声频谱;
噪声频谱转换单元,用于利用梅尔Mel滤波器将所述噪声频谱转换为对应的Mel频谱;
频谱特性获取单元,用于对所述Mel频谱进行滤波和离散余弦变换,得到所述噪声信号的频谱特性。
进一步地,所述音效调节模块503,可以包括:
目标音效确定单元,用于将所述噪声类型和所述噪声功率输入至训练后的音效匹配模型中,得到所述音效匹配模型输出的匹配结果,并将所述匹配结果确定为与所述环境相匹配的目标音效。
优选地,所述音效调节模块503,还可以包括:
训练噪声获取单元,用于获取训练用的训练噪声类型和训练噪声功率,并标记各所述训练噪声类型与对应的训练噪声功率的标准匹配结果;
训练单元,用于分别将所述训练噪声类型和对应的训练噪声功率输入至初始的音效匹配模型中,得到所述初始的音效匹配模型输出的训练匹配结果;
训练误差确定单元,用于根据所述训练匹配结果和所述标准匹配结果确定当次训练的训练误差;
训练完成确定单元,用于若所述训练误差满足预设条件,则确定所述音效匹配模型训练完成;
模型参数调整单元,用于若所述训练误差不满足所述预设条件,则调整所述音效匹配模型的模型参数,并将模型参数调整后的音效匹配模型确定为初始的音效匹配模型,返回执行分别将各所述训练噪声类型和对应的训练噪声功率输入至初始的音效匹配模型中,得到所述初始的音效匹配模型输出的训练匹配结果的步骤以及后续步骤。
图6是本发明一实施例提供的终端设备的示意图。如图6所示,该实施例的终端设备6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62,例如音效调节程序。所述处理器60执行所述计算机程序62时实现上述各个音效调节方法实施例中的步骤,例如图1所示的步骤S101至步骤S103。或者,所述处理器60执行所述计算机程序62时实现上述各装置实施例中各模块/单元的功能,例如图5所示的模块501至模块503的功能。
示例性的,所述计算机程序62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述终端设备6中的执行过程。例如,所述计算机程序62可以被分割成噪声功率确定模块、噪声类型确定模块、音效调节模块,各模块具体功能如下:
噪声功率确定模块,用于获取终端设备所在环境的噪声信号,并确定所述噪声信号的噪声功率;
噪声类型确定模块,用于获取所述噪声信号的频谱特性,并根据所述频谱特性确定所述噪声信号的噪声类型;
音效调节模块,用于根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,并根据所述目标音效调节所述终端设备的当前音效。
所述终端设备6可以是桌上型计算机、笔记本、掌上电脑、智能音箱、机器人等可进行声音输出的设备。所述终端设备可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是终端设备6的示例,并不构成对终端设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所述处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述终端设备6的内部存储单元,例如终端设备6的硬盘或内存。所述存储器61也可以是所述终端设备6的外部存储设备,例如所述终端设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各实施例的模块、单元和/或方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种音效调节方法,其特征在于,包括:
获取终端设备所在环境的噪声信号,并确定所述噪声信号的噪声功率;
获取所述噪声信号的频谱特性,并根据所述频谱特性确定所述噪声信号的噪声类型;
根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,并根据所述目标音效调节所述终端设备的当前音效。
2.根据权利要求1所述的音效调节方法,其特征在于,所述获取终端设备所在环境的噪声信号,包括:
获取所述终端设备所在环境的第一语音信号;
确定所述第一语音信号中位于预设频谱范围内的第二语音信号;
从所述第一语音信号中删除所述第二语音信号,并将删除所述第二语音信号的第一语音信号确定为所述噪声信号。
3.根据权利要求1所述的音效调节方法,其特征在于,所述确定所述噪声信号的噪声功率,包括:
对所述噪声信号进行分帧处理,并获取每一帧中的噪声信号所对应的振动幅度;
对各所述振动幅度进行求和累加,并将求和累加的结果确定所述噪声信号的噪声功率。
4.根据权利要求1所述的音效调节方法,其特征在于,所述获取所述噪声信号的频谱特性,包括:
对所述噪声信号进行预处理,并通过快速傅里叶变化获取预处理后的噪声信号的噪声频谱;
利用梅尔Mel滤波器将所述噪声频谱转换为对应的Mel频谱;
对所述Mel频谱进行滤波和离散余弦变换,得到所述噪声信号的频谱特性。
5.根据权利要求1至4中任一项所述的音效调节方法,其特征在于,所述根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,包括:
将所述噪声类型和所述噪声功率输入至训练后的音效匹配模型中,得到所述音效匹配模型输出的匹配结果,并将所述匹配结果确定为与所述环境相匹配的目标音效。
6.根据权利要求5所述的音效调节方法,其特征在于,所述音效匹配模型的训练过程包括:
获取训练用的训练噪声类型和训练噪声功率,并标记各所述训练噪声类型与对应的训练噪声功率的标准匹配结果;
分别将各所述训练噪声类型和对应的训练噪声功率输入至初始的音效匹配模型中,得到所述初始的音效匹配模型输出的训练匹配结果;
根据所述训练匹配结果和所述标准匹配结果确定当次训练的训练误差;
若所述训练误差满足预设条件,则确定所述音效匹配模型训练完成;
若所述训练误差不满足所述预设条件,则调整所述音效匹配模型的模型参数,并将模型参数调整后的音效匹配模型确定为初始的音效匹配模型,返回执行分别将各所述训练噪声类型和对应的训练噪声功率输入至初始的音效匹配模型中,得到所述初始的音效匹配模型输出的训练匹配结果的步骤以及后续步骤。
7.一种音效调节装置,其特征在于,包括:
噪声功率确定模块,用于获取终端设备所在环境的噪声信号,并确定所述噪声信号的噪声功率;
噪声类型确定模块,用于获取所述噪声信号的频谱特性,并根据所述频谱特性确定所述噪声信号的噪声类型;
音效调节模块,用于根据所述噪声类型和所述噪声功率确定与所述环境相匹配的目标音效,并根据所述目标音效调节所述终端设备的当前音效。
8.根据权利要求7所述的音效调节装置,其特征在于,所述噪声功率确定模块,包括:
第一语音信号获取单元,用于获取所述终端设备所在环境的第一语音信号;
第二语音信号确定单元,用于确定所述第一语音信号中位于预设频谱范围内的第二语音信号;
噪声信号确定单元,用于从所述第一语音信号中删除所述第二语音信号,并将删除所述第二语音信号的第一语音信号确定为所述噪声信号。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述音效调节方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述音效调节方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910281281.5A CN111796790B (zh) | 2019-04-09 | 2019-04-09 | 一种音效调节方法、装置、可读存储介质及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910281281.5A CN111796790B (zh) | 2019-04-09 | 2019-04-09 | 一种音效调节方法、装置、可读存储介质及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111796790A true CN111796790A (zh) | 2020-10-20 |
CN111796790B CN111796790B (zh) | 2023-09-08 |
Family
ID=72805158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910281281.5A Active CN111796790B (zh) | 2019-04-09 | 2019-04-09 | 一种音效调节方法、装置、可读存储介质及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111796790B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112506341A (zh) * | 2020-12-01 | 2021-03-16 | 瑞声新能源发展(常州)有限公司科教城分公司 | 一种振动效果的生成方法、装置、终端设备及存储介质 |
CN113793623A (zh) * | 2021-08-17 | 2021-12-14 | 咪咕音乐有限公司 | 音效设置方法、装置、设备以及计算机可读存储介质 |
CN114449339A (zh) * | 2022-02-16 | 2022-05-06 | 深圳万兴软件有限公司 | 背景音效的转换方法、装置、计算机设备及存储介质 |
CN114666706A (zh) * | 2021-11-30 | 2022-06-24 | 北京达佳互联信息技术有限公司 | 音效增强方法、装置及*** |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060018492A1 (en) * | 2004-07-23 | 2006-01-26 | Inventec Corporation | Sound control system and method |
CN104064196A (zh) * | 2014-06-20 | 2014-09-24 | 哈尔滨工业大学深圳研究生院 | 一种基于语音前端噪声消除的提高语音识别准确率的方法 |
CN104104800A (zh) * | 2014-07-25 | 2014-10-15 | Tcl通讯(宁波)有限公司 | 一种根据环境音调节移动终端音量输出的方法及移动终端 |
CN105448289A (zh) * | 2015-11-16 | 2016-03-30 | 努比亚技术有限公司 | 一种语音合成、删除方法、装置及语音删除合成方法 |
CN105827853A (zh) * | 2016-04-29 | 2016-08-03 | 维沃移动通信有限公司 | 一种终端外放音量的输出控制方法及移动终端 |
CN107371102A (zh) * | 2017-08-18 | 2017-11-21 | 广东欧珀移动通信有限公司 | 音频播放音量的控制方法、装置及存储介质和移动终端 |
CN107766030A (zh) * | 2017-11-13 | 2018-03-06 | 百度在线网络技术(北京)有限公司 | 音量调节方法、装置、设备及计算机可读介质 |
CN107786709A (zh) * | 2017-11-09 | 2018-03-09 | 广东欧珀移动通信有限公司 | 通话降噪方法、装置、终端设备及计算机可读存储介质 |
CN107910013A (zh) * | 2017-11-10 | 2018-04-13 | 广东欧珀移动通信有限公司 | 一种语音信号的输出处理方法及装置 |
CN108012035A (zh) * | 2017-12-26 | 2018-05-08 | 奇酷互联网络科技(深圳)有限公司 | 铃声调节方法、装置、可读存储介质及智能终端 |
CN108766454A (zh) * | 2018-06-28 | 2018-11-06 | 浙江飞歌电子科技有限公司 | 一种语音噪声抑制方法及装置 |
CN109327752A (zh) * | 2018-11-01 | 2019-02-12 | 深圳市智驾实业有限公司 | 蓝牙拾音器、车载设备以及汽车 |
CN109559755A (zh) * | 2018-12-25 | 2019-04-02 | 沈阳品尚科技有限公司 | 一种基于dnn噪声分类的语音增强方法 |
-
2019
- 2019-04-09 CN CN201910281281.5A patent/CN111796790B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060018492A1 (en) * | 2004-07-23 | 2006-01-26 | Inventec Corporation | Sound control system and method |
CN104064196A (zh) * | 2014-06-20 | 2014-09-24 | 哈尔滨工业大学深圳研究生院 | 一种基于语音前端噪声消除的提高语音识别准确率的方法 |
CN104104800A (zh) * | 2014-07-25 | 2014-10-15 | Tcl通讯(宁波)有限公司 | 一种根据环境音调节移动终端音量输出的方法及移动终端 |
CN105448289A (zh) * | 2015-11-16 | 2016-03-30 | 努比亚技术有限公司 | 一种语音合成、删除方法、装置及语音删除合成方法 |
CN105827853A (zh) * | 2016-04-29 | 2016-08-03 | 维沃移动通信有限公司 | 一种终端外放音量的输出控制方法及移动终端 |
CN107371102A (zh) * | 2017-08-18 | 2017-11-21 | 广东欧珀移动通信有限公司 | 音频播放音量的控制方法、装置及存储介质和移动终端 |
CN107786709A (zh) * | 2017-11-09 | 2018-03-09 | 广东欧珀移动通信有限公司 | 通话降噪方法、装置、终端设备及计算机可读存储介质 |
CN107910013A (zh) * | 2017-11-10 | 2018-04-13 | 广东欧珀移动通信有限公司 | 一种语音信号的输出处理方法及装置 |
CN107766030A (zh) * | 2017-11-13 | 2018-03-06 | 百度在线网络技术(北京)有限公司 | 音量调节方法、装置、设备及计算机可读介质 |
CN108012035A (zh) * | 2017-12-26 | 2018-05-08 | 奇酷互联网络科技(深圳)有限公司 | 铃声调节方法、装置、可读存储介质及智能终端 |
CN108766454A (zh) * | 2018-06-28 | 2018-11-06 | 浙江飞歌电子科技有限公司 | 一种语音噪声抑制方法及装置 |
CN109327752A (zh) * | 2018-11-01 | 2019-02-12 | 深圳市智驾实业有限公司 | 蓝牙拾音器、车载设备以及汽车 |
CN109559755A (zh) * | 2018-12-25 | 2019-04-02 | 沈阳品尚科技有限公司 | 一种基于dnn噪声分类的语音增强方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112506341A (zh) * | 2020-12-01 | 2021-03-16 | 瑞声新能源发展(常州)有限公司科教城分公司 | 一种振动效果的生成方法、装置、终端设备及存储介质 |
CN112506341B (zh) * | 2020-12-01 | 2022-05-03 | 瑞声新能源发展(常州)有限公司科教城分公司 | 一种振动效果的生成方法、装置、终端设备及存储介质 |
CN113793623A (zh) * | 2021-08-17 | 2021-12-14 | 咪咕音乐有限公司 | 音效设置方法、装置、设备以及计算机可读存储介质 |
CN113793623B (zh) * | 2021-08-17 | 2023-08-18 | 咪咕音乐有限公司 | 音效设置方法、装置、设备以及计算机可读存储介质 |
CN114666706A (zh) * | 2021-11-30 | 2022-06-24 | 北京达佳互联信息技术有限公司 | 音效增强方法、装置及*** |
CN114666706B (zh) * | 2021-11-30 | 2024-05-14 | 北京达佳互联信息技术有限公司 | 音效增强方法、装置及*** |
CN114449339A (zh) * | 2022-02-16 | 2022-05-06 | 深圳万兴软件有限公司 | 背景音效的转换方法、装置、计算机设备及存储介质 |
CN114449339B (zh) * | 2022-02-16 | 2024-04-12 | 深圳万兴软件有限公司 | 背景音效的转换方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111796790B (zh) | 2023-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111796790B (zh) | 一种音效调节方法、装置、可读存储介质及终端设备 | |
Välimäki et al. | All about audio equalization: Solutions and frontiers | |
CN104966522B (zh) | 音效调节方法、云端服务器、音响设备及*** | |
CN111128214B (zh) | 音频降噪方法、装置、电子设备及介质 | |
US8755545B2 (en) | Stability and speech audibility improvements in hearing devices | |
CN112820315B (zh) | 音频信号处理方法、装置、计算机设备及存储介质 | |
CN110024419B (zh) | 增益相位均衡(gpeq)滤波器和调谐方法 | |
CN110111769B (zh) | 一种电子耳蜗控制方法、装置、可读存储介质及电子耳蜗 | |
CN112565981B (zh) | 啸叫抑制方法、装置、助听器及存储介质 | |
CN111640411B (zh) | 音频合成方法、装置及计算机可读存储介质 | |
CN110428835B (zh) | 一种语音设备的调节方法、装置、存储介质及语音设备 | |
Chabot-Leclerc et al. | The role of auditory spectro-temporal modulation filtering and the decision metric for speech intelligibility prediction | |
CN116405823A (zh) | 一种骨传导耳机音频智能去噪增强方法 | |
CN116884429B (zh) | 一种基于信号增强的音频处理方法 | |
JP2014508973A (ja) | オーディオ信号において卓越周波数を減衰させるための方法および装置 | |
Agcaer et al. | Optimization of amplitude modulation features for low-resource acoustic scene classification | |
CN110390954A (zh) | 语音产品质量的评价方法和装置 | |
CN115243183A (zh) | 一种音频检测方法、设备及存储介质 | |
US8756265B1 (en) | Audio filter bank design | |
CN111045633A (zh) | 用于检测音频信号的响度的方法和装置 | |
CN110992969B (zh) | 一种电子耳蜗的滤波器组配置方法及装置 | |
US11445324B2 (en) | Audio rendering method and apparatus | |
CN107197403A (zh) | 一种终端音频参数管理方法、装置及*** | |
CN113657026A (zh) | 滤波器的仿真设计方法、装置、设备及存储介质 | |
CN115376501B (zh) | 语音增强方法及装置、存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |