CN110634462B - 一种声音调整***及调整方法 - Google Patents

一种声音调整***及调整方法 Download PDF

Info

Publication number
CN110634462B
CN110634462B CN201910942540.4A CN201910942540A CN110634462B CN 110634462 B CN110634462 B CN 110634462B CN 201910942540 A CN201910942540 A CN 201910942540A CN 110634462 B CN110634462 B CN 110634462B
Authority
CN
China
Prior art keywords
sound
module
original
adjustment
sound data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910942540.4A
Other languages
English (en)
Other versions
CN110634462A (zh
Inventor
孙任飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Weipu Medical Technology Co ltd
Original Assignee
Shenzhen Tongshihai Precision Machinery Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tongshihai Precision Machinery Co ltd filed Critical Shenzhen Tongshihai Precision Machinery Co ltd
Priority to CN201910942540.4A priority Critical patent/CN110634462B/zh
Publication of CN110634462A publication Critical patent/CN110634462A/zh
Application granted granted Critical
Publication of CN110634462B publication Critical patent/CN110634462B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0091Means for obtaining special acoustic effects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/46Volume control

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种声音调整***及调整方法,包括声音信号输入模块,所述声音信号输入模块用于感知和采集声音信号,并将所述声音信号转换为原始声音数据;信号处理模块,所述信号处理模块用于接收由所述声音信号采集模块传送的所述原始声音数据,通过声音调整模块对所述原始声音数据调整为调整声音数据;声音信号输出模块,所述声音信号输出模块用于接收所述调整声音数据并将其转化为声音信号播放。本发明的有益效果:能够对唱歌容易跑掉的人根据需求进行声音调整,将跑调的声音进行修正后播放。

Description

一种声音调整***及调整方法
技术领域
本发明涉及音频处理的技术领域,尤其涉及一种声音调整***及调整方法。
背景技术
随着人们生活水平的提高,人们对文化娱乐生活的追求也随之提高,并且得益于通信及信息技术的高速发展,音乐功能已经成为计算机或手机等终端中的项必备应用。具有KTV功能的音乐类产品越来越多的出现在用户的终端中,大都是按照用户选择的音乐播放伴奏并跟随音乐伴奏显示字幕,用户则按照显示字幕上的字体颜色提示或其他标记提示对应歌词的演唱时间,直至完成整首歌曲。近年来K歌逐渐成为人们消遣的方式,但由于不同的人对乐感和旋律的感知能力参差不齐,跑调或是节奏跟不上的情况时有发生,严重影响唱歌的心情。现在解决跑调或是跟不上节奏的方法,只能是找到专业录音棚进行后期修音处理,以修正跑调。虽然录音棚修音的专业性较高,但是在制作周期较长、制作费用不菲等条件的限制下,普通民众大都很难接受,导致人们K歌的兴趣度下降。
同时直播软件的美颜功能深受大众喜爱,但是仅有美颜功能而并没有“美音”的功能来服务大众,直播中很多主播唱歌时歌声有缺陷是很大的痛点,往往都是通过第三方软件的接入来进行同步的“美音”解决这个问题,因此需要用户安装和注册两款不同的软件并调试,其过程较复杂繁琐。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明解决的一个技术问题是:提出一种声音调整***,对人们在唱歌时的声音进行调整,解决经常容易跑调的问题。
为解决上述技术问题,本发明提供如下技术方案:一种声音调整***,包括声音信号输入模块,所述声音信号输入模块用于感知和采集声音信号,并将所述声音信号转换为原始声音数据;信号处理模块,所述信号处理模块用于接收由所述声音信号采集模块传送的所述原始声音数据,通过声音调整模块对所述原始声音数据调整为调整声音数据;声音信号输出模块,所述声音信号输出模块用于接收所述调整声音数据并将其转化为声音信号播放。
作为本发明所述的声音调整***的一种优选方案,其中:所述信号处理模块还包括输入模块和输出模块;所述输入模块用于同时接收由所述声音信号采集模块生成的一个或多个所述原始声音数据进行预调整;所述输出模块用于接收所述声音调整模块输出的所述调整声音数据处理为所述声音信号输出模块。
作为本发明所述的声音调整***的一种优选方案,其中:所述声音信号输入模块获取的所述原始声音数据还包括输入声音的原始响度、原始音调、原始音色和与所述原始响度、所述原始音调、所述原始音色相对应的原始时间参数。
作为本发明所述的声音调整***的一种优选方案,其中:所述信号处理模块还包括调整参考标准模块,所述调整参考标准模块用于参考指定的标准声音数据,所述标准声音数据包括标准响度、标准音调、标准音色和与所述标准响度、所述标准音调、所述标准音色相对应的标准时间参数。
作为本发明所述的声音调整***的一种优选方案,其中:所述声音调整模块用于将所述原始声音数据中所述原始响度、所述原始音调、所述原始音色中的一个或多个调整为与之对应的所述标准响度、标准音调、标准音色,且所述声音调整模块根据所述原始时间参数和所述标准时间参数的一一对应进行定位。
作为本发明所述的声音调整***的一种优选方案,其中:所述信号处理模块还包括智能语音匹配模块,所述智能语音匹配模块用于分析所述原始声音数据和所述标准声音数据中的语音内容并进行智能匹配,并根据匹配结果对所述原始声音数据中所述原始响度、所述原始音调、所述原始音色的调整进行定位。
作为本发明所述的声音调整***的一种优选方案,其中:所述信号处理模块还包括储存模块,所述储存模块还包括用于储存所述标准声音数据等待参考调用,还包括用于接收所述调整声音数据并储存为新的声音数据,所述新的声音数据作为所述原始声音数据馈送至所述输入模块。
本发明解决的另一个技术问题是:提出一种声音调整方法,能够依托于上述***实现。
为解决上述技术问题,本发明提供如下技术方案:一种声音调整方法,包括以下步骤,声音信号输入模块获取原始声音数据;输入模块接收所述原始声音数据进行预调整;声音调整模块结合调整参考标准模块和智能语音匹配模块对预调整后的声音数据定位匹配调整为调整声音数据;输出模块接收所述调整声音数据进行整合处理为输出信号;声音信号输出模块接收输出模块的输出信号转化为语音信号进行播放。
作为本发明所述的声音调整方法的一种优选方案,其中:还包括如下步骤,所述输出模块接收所述调整声音数据进行整合处理为输出信号;储存模块接收所述输出信号进行储存并输入至所述输入模块作为所述原始声音数据,执行下一个循环调整。
作为本发明所述的声音调整方法的一种优选方案,其中:所述声音调整模块对所述原始声音数据的调整包括自定义调整量范围,还包括所述原始响度进行调整时,在所述标准响度的基础上自定义响度的大小;所述原始音调进行调整时,在所述标准音调的基础上自定义音调的高低;所述原始音色进行调整时,同时参考指定的多个不同的所述标准音色,进行混合调整。
本发明的有益效果:能够对唱歌容易跑掉的人根据需求进行声音调整,将跑调的声音进行修正后播放。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一种实施例所述声音调整***的整体原理结构示意图;
图2为本发明第一种实施例所述声音调整***的各模块结构示意图;
图3为本发明第二种实施例所述声音调整方法的整体流程示意图;
图4为本发明第二种实施例所述原始声音信号优化输出的流程示意图;
图5为本发明第二种实施例所述原始声音信号经过采样和量化的图像示意;
图6为本发明第三种实施例所述传声器阻抗匹配电路示意图;
图7为本发明第三种实施例所述自适应音量调整方法的整体流程示意图;
图8为本发明第三种实施例所述实际测试结果对比示意图;
图9为本发明第三种实施例所述实际测试结果误差对比示意图。
实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例
参照图1~2的示意,示意为本实施例提出的一种声音调整***,K歌是人们消遣的方式,但由于不同的人对乐感和旋律的感知能力参差不齐,跑调或是节奏跟不上的情况时有发生,严重影响唱歌和听者的心情。因此本实施例提出声音调整***调整跑调的声音,该***包括声音信号输入模块、信号处理模块200和声音信号输出模块300,声音信号输入模块的输出与信号处理模块200的输入连接,信号处理模块200的输出与声音信号输出模块300输入连接。具体的,声音信号输入模块采集未经过任何后期处理和加工的原始人声的声音信号,因此本实施例中声音信号输入模块采用麦克风或者是具有录音功能的移动设备(如手机或者电脑等),并将声音信号转换为原始声音数据,本实施例中的原始声音数据为数字信号,即电信号,其具体形式例如为mp3转换的信号。进一步的,其中麦克风学名为传声器,是将声音信号转换为电信号的能量转换器件,也称话筒、微音器。二十世纪,麦克风由最初通过电阻转换声电发展为电感、电容式转换,大量新的麦克风技术逐渐发展起来,这其中包括铝带、动圈等麦克风,以及当前广泛使用的电容麦克风和驻极体麦克风,麦克风是由声音的振动传到麦克风的振膜上,推动里边的磁铁形成变化的电流,这样变化的电流送到后面的声音处理电路进行放大处理,获得所需的声音数据。信号处理模块200接收原始声音数据并参考标准的声音进行调整后输出为调整声音数据。声音信号输出模块300接收调整声音数据并播放,本实施例中声音信号输出模块300采用音响或者带有扬声器的设备等。
进一步更加具体的,声音信号输入模块,声音信号输入模块用于感知和采集声音信号,并将声音信号转换为原始声音数据;信号处理模块200,信号处理模块200用于接收由声音信号采集模块传送的原始声音数据,通过声音调整模块201对原始声音数据调整为调整声音数据;声音信号输出模块300,声音信号输出模块300用于接收调整声音数据并将其转化为声音信号播放。
其中信号处理模块200还包括输入模块202和输出模块203;输入模块202用于同时接收由声音信号采集模块生成的一个或多个原始声音数据进行预调整;输出模块203用于接收声音调整模块201输出的调整声音数据处理为声音信号输出模块300。声音信号输入模块获取的原始声音数据还包括输入声音的原始响度、原始音调、原始音色和与原始响度、原始音调、原始音色相对应的原始时间参数。信号处理模块200还包括调整参考标准模块204,调整参考标准模块204用于参考指定的标准声音数据,标准声音数据包括标准响度、标准音调、标准音色和与标准响度、标准音调、标准音色相对应的标准时间参数。
声音调整模块201用于将原始声音数据中原始响度、原始音调、原始音色中的一个或多个调整为与之对应的标准响度、标准音调、标准音色,且声音调整模块201根据原始时间参数和标准时间参数的一一对应进行定位。
信号处理模块200还包括智能语音匹配模块205,智能语音匹配模块205用于分析原始声音数据和标准声音数据中的语音内容并进行智能匹配,并根据匹配结果对原始声音数据中原始响度、原始音调、原始音色的调整进行定位。信号处理模块200还包括储存模块206,储存模块206还包括用于储存标准声音数据等待参考调用,还包括用于接收调整声音数据并储存为新的声音数据,新的声音数据作为原始声音数据馈送至输入模块202。
还需要说明的是,该信号处理模块200是内嵌算法程序的集成电路板设备,通过电路集成的方式,其中声音调整模块201、输入模块202、输出模块203、调整参考标准模块204和储存模块206均为集成电路板上集成的电路模块,通过现有中程序烧录的方式将算法程序写入电路板集成,集成电路有很多种,例如集成电路中的微控制器和微处理器也俗称单片机。其内涉及的算法程序为调整声音数据的算法,该算法程序的写入例如将下载器接入电脑中,再将下载器的写入口对准电路板的写入口,接通电路板供电,完成连接后在电脑中打开下载器软件,并打开程序菜单中程序信息设置,选择对应的芯片型号以及程序文件,最后核对芯片型号填入输入的信息,点击写入程序。得到带有声音调整算法程序的电路板设备,即本实施例提出信号处理模块200的硬件设备。
实施例
参照图3~5的示意,本实施例中提出一种声音调整方法,应用于上述***中,对跑调的声音进行修正,包括以下步骤,
S1:声音信号输入模块获取原始声音数据,本步骤中由歌手提供原始数据或者将硬盘中歌手制作的音频“批量”进行调整,则对批量音频调整的情况中由储存器提供原始数据,本步骤还包括对原始声音数据进行数据拆分为原始响度、原始音调和原始音色的数字信号。
具体的,声音信号的数字处理包括采样、量化和编码,采样指将时间连续的模拟信号转换成数字信号的过程,转换后的数字信号幅度与时间均是离散的。采样过程包括采样周期与采样频率两个重要物理量,其中采样周期为每次采样时间间隔,其倒数即为采样频率。而采样频率越高表明在单位时间内获得的数据越多,能够达到较好的保真效果,并且为保证声音采样质量,避免失真,采样频率至少应达到声音信号最高频率的两倍。声音信号量化指将采样的每个样本使用离散值进行表示,这一过程又被成为模数转换,样本量化后以二进制数方式呈现,其中二进制数位数为量化精度。显然量化具有越高的精度,声音具有越高的质量,但所需存储空间反而越大。本实施例中原始声音信号经过采样、量化的图像可以参照图5的示意。
进一步的,声音信号经量化后已经表现为数字形式,但为了方便传输、处理以及存储,需按照一定的规则对其进行编码、压缩。声音信号经过编码处理后便可获得数字音频。声音信息量不断增加,用于存储的空间也不断增加,假设模拟声音经数字化处理后,以字节为单位且未进行压缩,那么其存储量可用以下公式计算:
存储量=采样频率×量化位数/8×声道数×时间。
例如采样频率为44.1KHz,采用16位量化位数,进行1s立体声的录制,产生波形所需的存储空间=44100×16/8×2×1=176400字节。因此对声音处理时还考虑了储存空间的问题,保证声音处理信息储存的完整性。
其中音调主要与波形的频率有关,其声波的频率高,则音调也高;而响度和波形振动的幅度有关,振动幅度越大则响度也越大;音色是人们区别具有同样响度、同样音调的两个声音之所以不同的特性,音色与声波的振动波形的形状有关,或者说与声音的频谱结构有关。因此由声音产生的波形信号可以编码解读出原始声音的原始响度、原始音调和原始音色的信号,最后获得数字音频的数字信号。
S2:输入模块202接收原始声音数据进行预调整,该预调整包括运用数字信号处理算法,能够让声音更柔和、更有磁性和没有杂音等,数字信号处理技术是将模拟信息(如本实施例的声音)转换为数字信息的技术。通常指的是执行这些功能的芯片或处理器,或者它们可能也用于处理此信息然后将它作为模拟电信号输出,显然本实施例中是为数字信号的预调整。因此本步骤中包括对声音信号进行降噪处理的过程。
S3:声音调整模块201结合调整参考标准模块204和智能语音匹配模块205对预调整后的声音数据定位匹配调整为调整声音数据。本步骤中,声音调整模块201将原始声音数据中原始响度、原始音调、原始音色中的一个或多个调整为与之对应的标准响度、标准音调、标准音色,且声音调整模块201根据原始时间参数和标准时间参数的一一对应进行定位。例如在一首歌中,针对原始声音数据和标准声音数据的相同的时间参数,原始响度对应于标准响度、原始音调对应于标准音调、原始音色对应于标准音色。调整参考标准模块204预先内部储存有标准声音数据,在需要时调用。
智能语音匹配模块205分析原始声音数据和标准声音数据中的语音内容并进行智能匹配,并根据匹配结果对原始声音数据中原始响度、原始音调、原始音色的调整进行定位。智能语音匹配模块205与声音调整模块201的定位为两种独立的定位方式,可供用户自行选择,即可以根据时间参数来进行匹配定位或者根据歌词来进行匹配定位。
本实施例中时间定位例如在歌曲的2分06秒(定位),原唱的声音是so(参考标准数据),而歌手唱出来的声音是mi(原始数据),***就定位在2分06秒的时间节点上把歌手唱的mi调整成so。
智能语音匹配模块205则为根据原始声音数据的语音内容进行识别的过程,并与标准声音数据内的语音内容进行匹配,例如对歌唱者唱出的歌词内容与原始歌词进行匹配。且本实施例中声音调整模块201对原始声音数据的调整包括自定义调整量范围,还包括,
原始响度进行调整时,在标准响度的基础上自定义响度的大小;
原始音调进行调整时,在标准音调的基础上自定义音调的高低;
原始音色进行调整时,同时参考指定的多个不同的标准音色,进行混合调整。
本实施例中例如用户唱歌的时候是我自己的音色,原唱是歌手刘某的音色,可以通过此处的自定义让歌手刘某或者其他的参考标准音色完全覆盖用户的原始音色,唱出来的歌曲就是个“新的歌手刘某演唱版本”;同时,用户也可以选择让30%的歌手刘某的音色融入到原始音色中,让用户的声音听起来有30%歌手刘某的感觉。该过程用户都可以通过操作界面进行主动选择需要调整的方案,例如在ktv中,唱歌的人可以在唱歌之前手动在***中选择要听什么样的效果,又或者可以直接在手机软件中使用。
S4:输出模块203接收调整声音数据进行整合处理为输出信号,具体是将调整后的声音整合为数字信号(电信号)输出,该整合处理包括对数字信号的批量打包整理,并对其打包的声音信号进行歌曲名或者歌手的标注,方便用户对其保存的歌唱声音的二次或更多次的调整处理操作;
S5:声音信号输出模块300接收输出模块203的输出电信号转化为语音内容进行播放,本步骤中获得被“美化”的声音信号后,可以传递给音响,也可以直接储存到储存模块206中,通过储存模块206再次将存储的数字信号(电信号)输入声音调整模块201中进行再次调整后输出,若用户不满足本次的调整,可执行由输出模块203至储存模块206后再到声音调整模块201的循环调整,直到用户对声音数据满意为止。
本实施例中基于储存模块206还包括如下步骤,
输出模块203接收调整声音数据进行整合处理为输出信号;
所述原始声音数据、所述调整声音数据和所述输出信号传输至储存模块206内进行储存;
选择将储存的原始声音数据由所述储存模块206调出批量处理,或者选择将所述输出信号输入至所述输入模块202作为下次调整的所述原始声音数据,并执行下一个循环调整。
本实施例中储存模块206相对于调整参考标准模块204预先内部储存有标准声音数据的存储相比较,储存模块206另外还存有更多原始声音数据(例如我之前唱歌的录音,可以储存在其中,随时进行自己想要的调整),此外,储存模块还可以将调整后的声音数据储存在其中(例如,使用这个***,不但可以唱歌的时候美化自己的声音,还可以“批量”处理自己之前的唱歌录音并储存起来)。
该方法可以同时处理多个调整任务,且所标准声音数据也能够直接作为原始声音数据和调整声音数据进行使用。
在实际使用过程中人们在唱歌时经常容易跑调,因此本实施例的方法主要用于K歌、直播等。通过分析歌曲原曲,根据原唱音调调整歌者音调(音准);根据原曲时间轴(伴奏)或者智能语音(歌词)匹配定位音乐位置,进行音调调整。美化歌者的声音,不同程度地将原唱音色融入歌者声音当中;且适合独唱、齐唱或重唱,单人也可以有重唱效果,例如:
歌手(KTV、直播)唱歌时音准不够,音色不好,可以通过***进行美化;一个人唱歌时,***获取原唱的音准修改歌手音准,可选地,***可以获取原唱的音色,一定程度地修改歌手音色;一个人唱歌时,可选地,可以选择跟原唱“合唱(齐唱)”,原唱是重唱时,也可以选择自己唱一个声部,原唱唱其他声部,进行“重唱”;一个人唱歌时,可选地,原唱为重唱、齐唱时,自己的声音可以被调整输出为多个声部,模拟成重唱、齐唱;多个人唱歌时,多个声音可以混合在一起进行优化,作为独唱的声音被调整优化;多个人唱歌时,可以任意选择重唱、齐唱的组合。
实施例
由于在实际声音录制或者演唱的过程中,麦克风与声源的远近会影响输入声音信号输入模块的录制性能,当用户在客户端输入固定的音量值时,随着麦克风的远近位置不同,实际输出的音量大小并未稳定输出在固定音量值上,而是不断的变化,后续跟踪输出声音的音量大小会出现时小时大的问题,十分影响声音调整的效果。而现有中针对上述问题,存在通过在声音实际输出后根据反馈的音量来调节后续输出音量的大小,此方式由于需要经过反馈,具有一定的延时缺陷,无法保证同时刻输出音量大小的同步。
参照图7的示意,因此本实施例还考虑了声源与麦克风的位置距离对实际输出音量无法稳定的问题,提出基于声音调整模块201的自适应音量调整方法,与现有技术不同的是,本方法在声音输入设备的前端就提前进行检测,其调整发生在前端,避免了调整时的不同步问题,具有较高的稳定精度和实时性。且相对于距离检测,由于距离本身就为导致音量差异的根本原因,不同的距离需要计算并匹配相对应的音量,当识别出实际距离后输出对应音量大小,且在相同距离下不同用户发出的声音肯定不同,因此根本无法保证该距离下声源发出音量的大小,影响调整精度,而本方法直接检测声源大小相对于检测距离明显具有较高的调节精度。
进一步的,本实施例中声音调整模块201具体还包括以下调节步骤:
声音检测模块201a检测声源的实际音量值;
用户通过提供的交互界面将预设音量阈值输入反馈处理模块201b;
实际音量值输入反馈处理模块201b与内置的预设音量阈值进行差值计算;
根据计算出的差值输入至补偿抑制模块201c中进行差值补偿后输出补偿音量值;
实际音量值与补偿音量值同步叠加作为共同输出值;
共同输出值作为声音调整模块201的最终音量控制值,控制调整原始声音输出后的实际音量大小。
本实施例需要说明的是,音量又称响度和音强,是指人耳对所听到的声音大小强弱的主观感受,其客观评价尺度是声音的振幅大小,这种感受源自物体振动时所产生的压力,即声压。物体振动通过不同的介质,将其振动能量传导开去。人们为了对声音的感受量化成可以监测的指标,就把声压分成“级”——声压级,以便能客观的表示声音的强弱,其单位称为“分贝”(dB)。
进一步的,声音检测模块201a设置于麦克风的话筒电路前端,其输出与话筒的输入连接,其中声音检测模块201a包括传声器、放大器、衰减器、计权网络、检波器和指示表,通过前置放大器变换阻抗与传声器的输出阻抗匹配,实现将环境声音转换成电信号,最后输入至有效值检波器中输出声级数值。更加具体的,本实施例采用可变电阻作为负载进行阻抗匹配,负载大小与传声器输出电压最大峰值、饱和电流的关系为:
RL=umax/IDSS,式中umax是传声器输出电压最大峰值,IDSS为饱和电流,典型值是480μA,要确定负载的大小,需先算出传声器输出电压最大峰值。
定义传声器输出电压U与输入声压P的比值:S=U/P;
根据声压P与声压级L的关系式:L=20lg(P/p0),式中P为方均根声压,p0为基准声压(2×10-5Pa),可知传声器输出电压的有效值为:U=S×p0×10L/20,所以传声器输出电压的最大峰值:
Umax=K1×S×p0×10Lmax/20,式中K1是传声器输出电压信号的峰值因子,Lmax是传声器输入的最大声压级。
参照图6的传声器阻抗匹配电路示意,根据上述最后确定符合要求的传感器的阻抗匹配电路,确定负载大小为19.8kΩ,该传声器的输出特性为:电压范围:-9.5V~+9.5V,电压变化最小值为0.366μV。
声音经由传声器转换成电信号,传声器输出信号通过放大器(运放LM386构成,对微量交流电压信号进行放大,同时对交流信号全波整流),使输出幅频特性符合测量要求的电压信号,传声器是将声波信号转换为电信号的能量转换器件,首先是放大器将输出信号加到计权网络,对信号进行外接滤波器,然后经衰减器及放大器将信号放大到一定的幅值,送到有效值检波器进行检波,最后在指示表头上给出驱动LED数码管显示。
本实施例中因为由检波器将交流信号转变为直流信号,送到指示器显示出测量结果,转变出的直流信号可以和交流信号的平均值、峰值或有效值(RMS)相对应,因此有平均值、峰值或有效值检波器,而本实施例采用为数字有效值检波器检波,数字式有效值检波器由A/D转换器、数字信号处理器二大部分组成。包括A/D转换、平方、时间计权、对数转换和显示或输出的步骤,其中时间计权为是对瞬时声压的平方规定时间常数的指数平均,数字信号处理器将声压信号转换成相应的分贝值并输出,转换关系:XdB=10lg(P/p0),其中XdB为实际显示的分贝值。
进一步的,本实施例定义预设音量阈值SdB为用户通过软件界面所设定的目标音量值,由于声源的远近导致实际输出的音量与目标音量偏差,因此本实施例将由上述声音检测模块201a输出的分贝值(实际音量值)输入反馈处理模块201b中进行差值计算:ddB=SdB-XdB。根据所得的差值输入补偿抑制模块201c内转为输出电压U进行补偿或者抑制,其为逆推导的过程,根据ddB=10lg(P/p0),计算得出实际声压P,由上述定义的输出电压U与输入声压P的比值S,即S=U/P,转换为U=S·P,可知实际补偿或抑制的输出电压U值。根据计算出的输出电压U值,把需要补偿的电压值转化成驱动电源要补偿相应的所需的输人电压,利用D/A转换接口输出此电压至声音检测模块201a进行输出,再次将补偿或抑制的分贝值输入反馈处理模块201b进行二次差值计算,当ddB小于0.1时输入声音调整模块201进行声音的调整,最终由声音信号输出模块300输出。不难理解的是,对于电压的抑制相对于设置驱动电源的是设置抑制电容,例如采用同步电压抑制器和电压补偿器均可实现本实施例的电压补偿和抑制。当计算出的差值为正数时,打开电压器进行放电,当差值为负数时,则打开电压器进行充电,最终实现补偿和抑制,不做详述。
本实施例为验证本方法的调节精度,在不同距离下检测实际输出的音量值相对于预设值的误差,给定声源位置,且分别距离声源位置10mm、20mm、40mm、60mm和90mm处放置传统未装有本方法的麦克风1号、传统距离检测的麦克风2号和应用本方法基于声源检测的麦克风3号,该测试中声源选择为具有音量阶段性起伏的音频,在上述5个检测位置时,对应声源的音量大小为10dB、20dB、30dB、40dB和50dB,预设麦克风输出音量大小为30dB,经过上述不同距离下的发声位置,应用声音分贝检测仪实时检测三个麦克风输出的音量大小,实际测试结果如图8~9的示意,由图8可知,麦克风1号由于未有补偿和抑制的作用,实际输出的音量大小为与声源的音量发出大小为10dB、20dB、30dB、40dB和50dB相对应,且随着距离的增加,实际输出的音量减小。而麦克风2号具有调节作用,在位置较远且声音较大时,实际输出的效果明显低于麦克风3号,即本实施例提出的自适应调节方法。由图8的误差示意,本方法误差随着距离的增加能够稳定在0~0.2之间,而麦克风2号利用距离检测随着距离的增加,其输出误差高至2,其输出精度明显低于本方法,因此本实施例提出的调节方法相对于传统检测距离调节方式具有明显优势。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机***通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机***的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“***”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地***、分布式***中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它***进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (2)

1.一种声音调整***,其特征在于:包括,
声音信号输入模块,所述声音信号输入模块用于感知和采集声音信号,并将所述声音信号转换为原始声音数据;
信号处理模块(200),所述信号处理模块(200)用于接收由所述声音信号采集模块传送的所述原始声音数据,通过声音调整模块(201)对所述原始声音数据调整为调整声音数据;
声音信号输出模块(300),所述声音信号输出模块(300)用于接收所述调整声音数据并将其转化为声音信号播放;
所述信号处理模块(200)还包括输入模块(202)和输出模块(203);
所述输入模块(202)用于同时接收由所述声音信号采集模块生成的一个或多个所述原始声音数据进行预调整;
所述输出模块(203)用于接收所述声音调整模块(201)输出的所述调整声音数据处理为所述声音信号输出模块(300)的输入信号;
所述声音信号输入模块获取的所述原始声音数据还包括输入声音的原始响度、原始音调、原始音色和与所述原始响度、所述原始音调、所述原始音色相对应的原始时间参数;
所述信号处理模块(200)还包括调整参考标准模块(204),所述调整参考标准模块(204)用于参考指定的标准声音数据,所述标准声音数据包括标准响度、标准音调、标准音色和与所述标准响度、所述标准音调、所述标准音色相对应的标准时间参数;
所述声音调整模块(201)用于将所述原始声音数据中所述原始响度、所述原始音调、所述原始音色中的一个或多个调整为与之对应的所述标准响度、标准音调、标准音色,且所述声音调整模块(201)根据所述原始时间参数和所述标准时间参数的一一对应进行定位;
将由声音检测模块(201a)输出的分贝值输入反馈处理模块(201b)中进行差值计算:ddB=SdB-XdB;根据所得的差值输入补偿抑制模块(201c)内转为输出电压U进行补偿或者抑制,其为逆推导的过程,根据ddB=10lg(P/p0),计算得出实际声压P,由上述定义的输出电压U与输入声压P的比值S,即S=U/P,转换为U=S·P,可知实际补偿或抑制的输出电压U值;根据计算出的输出电压U值,把需要补偿的电压值转化成驱动电源要补偿相应的所需的输入电压,利用D/A转换接口输出此电压至声音检测模块(201a)进行输出,再次将补偿或抑制的分贝值输入反馈处理模块(201b)进行二次差值计算,当ddB小于0.1时输入声音调整模块(201)进行声音的调整,最终由声音信号输出模块(300)输出;
所述信号处理模块(200)还包括智能语音匹配模块(205),所述智能语音匹配模块(205)用于分析所述原始声音数据和所述标准声音数据中的语音内容并进行智能匹配,并根据匹配结果对所述原始声音数据中所述原始响度、所述原始音调、所述原始音色的调整进行定位;
所述信号处理模块(200)还包括储存模块(206),所述储存模块(206)还包括用于储存所述标准声音数据等待参考调用,还包括用于接收所述调整声音数据并储存为新的声音数据,所述新的声音数据作为所述原始声音数据馈送至所述输入模块(202);
所述声音调整模块(201)还包括,根据不同的距离计算并匹配相对应的音量,直接检测声源大小,当识别出实际距离后输出对应音量大小;
根据声压P与声压级L的关系式:L=20lg(P/p0)
式中,P为方均根声压,p0为基准声压2×10-5Pa,可知传声器输出电压的有效值为:
U=S×p0×10L/20
传声器输出电压的最大峰值:
Umax=K1×S×p0×10Lmax/20
式中K1是传声器输出电压信号的峰值因子,Lmax是传声器输入的最大声压级。
2.使用如权利要求1的***的声音调整方法,其特征在于:包括以下步骤,
声音信号输入模块获取原始声音数据;
输入模块(202)接收所述原始声音数据进行预调整;
声音调整模块(201)结合调整参考标准模块(204)和智能语音匹配模块(205)对预调整后的声音数据定位、匹配,并调整为调整声音数据;
输出模块(203)接收所述调整声音数据进行整合处理为输出信号;
声音信号输出模块(300)接收输出模块(203)的输出信号转化为语音信号进行播放;
所述输出模块(203)接收所述调整声音数据进行整合处理为输出信号;
所述原始声音数据、所述调整声音数据和所述输出信号传输至储存模块(206)内进行储存;
选择将储存的原始声音数据由所述储存模块(206)调出批量处理,或者选择将所述输出信号输入至所述输入模块(202)作为下次调整的所述原始声音数据,并执行下一个循环调整;
所述声音调整模块(201)对所述原始声音数据的调整包括自定义调整量范围,还包括,
原始响度进行调整时,在标准响度的基础上自定义响度的大小;
原始音调进行调整时,在标准音调的基础上自定义音调的高低;
原始音色进行调整时,同时参考指定的多个不同的标准音色,进行混合调整。
CN201910942540.4A 2019-09-30 2019-09-30 一种声音调整***及调整方法 Active CN110634462B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910942540.4A CN110634462B (zh) 2019-09-30 2019-09-30 一种声音调整***及调整方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910942540.4A CN110634462B (zh) 2019-09-30 2019-09-30 一种声音调整***及调整方法

Publications (2)

Publication Number Publication Date
CN110634462A CN110634462A (zh) 2019-12-31
CN110634462B true CN110634462B (zh) 2024-01-09

Family

ID=68975545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910942540.4A Active CN110634462B (zh) 2019-09-30 2019-09-30 一种声音调整***及调整方法

Country Status (1)

Country Link
CN (1) CN110634462B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108801443A (zh) * 2018-06-20 2018-11-13 核工业理化工程研究院 高转速伺服电机的噪声高精度测量装置及测量方法
CN115394306A (zh) * 2021-05-25 2022-11-25 江苏中协智能科技有限公司 一种自主匹配修正音色的广播控制***
CN113641858A (zh) * 2021-08-27 2021-11-12 傅静芬 基于视频声音获取大数据的管理分析***
CN113873387A (zh) * 2021-10-25 2021-12-31 深圳千岸科技股份有限公司 一种基于耳机终端的音量调节方法及***
CN116092458A (zh) * 2023-02-10 2023-05-09 牡丹江师范学院 基于大数据的声乐调节***及其方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5641927A (en) * 1995-04-18 1997-06-24 Texas Instruments Incorporated Autokeying for musical accompaniment playing apparatus
CN1684509A (zh) * 2004-04-13 2005-10-19 乐金电子(沈阳)有限公司 数码电视机的音频处理装置及方法
CN1885871A (zh) * 2005-06-24 2006-12-27 乐金电子(中国)研究开发中心有限公司 移动通信终端的声音音量调节装置及其方法
CN101277412A (zh) * 2008-03-31 2008-10-01 深圳创维数字技术股份有限公司 一种平衡机顶盒输出音量的方法及***
CN101783656A (zh) * 2010-03-17 2010-07-21 北京爱德发科技有限公司 一种音响响度控制方法、模块和装置
CN101860774A (zh) * 2010-05-31 2010-10-13 中山大学 一种能够自动修复声音的语音设备及方法
CN104282316A (zh) * 2013-07-01 2015-01-14 亿览在线网络技术(北京)有限公司 一种基于语音匹配的k歌计分方法和装置
CN104538011A (zh) * 2014-10-30 2015-04-22 华为技术有限公司 一种音调调节方法、装置及终端设备
CN105592394A (zh) * 2016-03-04 2016-05-18 南京迈宸科技有限公司 一种高灵敏拾音及定向扩音装置及其方法
CN107103915A (zh) * 2016-02-18 2017-08-29 广州酷狗计算机科技有限公司 一种音频数据处理方法以及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070195963A1 (en) * 2006-02-21 2007-08-23 Nokia Corporation Measuring ear biometrics for sound optimization
CN108074557B (zh) * 2017-12-11 2021-11-23 深圳Tcl新技术有限公司 音调调整方法、装置及存储介质
CN108307273A (zh) * 2018-02-05 2018-07-20 广东小天才科技有限公司 一种麦克风
CN108683975A (zh) * 2018-05-14 2018-10-19 维沃移动通信有限公司 一种音频设备
CN109448735B (zh) * 2018-12-21 2022-05-20 深圳创维-Rgb电子有限公司 基于声纹识别的视频参数调整方法、装置及读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5641927A (en) * 1995-04-18 1997-06-24 Texas Instruments Incorporated Autokeying for musical accompaniment playing apparatus
CN1684509A (zh) * 2004-04-13 2005-10-19 乐金电子(沈阳)有限公司 数码电视机的音频处理装置及方法
CN1885871A (zh) * 2005-06-24 2006-12-27 乐金电子(中国)研究开发中心有限公司 移动通信终端的声音音量调节装置及其方法
CN101277412A (zh) * 2008-03-31 2008-10-01 深圳创维数字技术股份有限公司 一种平衡机顶盒输出音量的方法及***
CN101783656A (zh) * 2010-03-17 2010-07-21 北京爱德发科技有限公司 一种音响响度控制方法、模块和装置
CN101860774A (zh) * 2010-05-31 2010-10-13 中山大学 一种能够自动修复声音的语音设备及方法
CN104282316A (zh) * 2013-07-01 2015-01-14 亿览在线网络技术(北京)有限公司 一种基于语音匹配的k歌计分方法和装置
CN104538011A (zh) * 2014-10-30 2015-04-22 华为技术有限公司 一种音调调节方法、装置及终端设备
CN107103915A (zh) * 2016-02-18 2017-08-29 广州酷狗计算机科技有限公司 一种音频数据处理方法以及装置
CN105592394A (zh) * 2016-03-04 2016-05-18 南京迈宸科技有限公司 一种高灵敏拾音及定向扩音装置及其方法

Also Published As

Publication number Publication date
CN110634462A (zh) 2019-12-31

Similar Documents

Publication Publication Date Title
CN110634462B (zh) 一种声音调整***及调整方法
CN101366177B (zh) 音频供给量控制
CN102893633B (zh) 用于便携式媒体回放装置的音频***均衡化
CN109478400A (zh) 现场音乐表演的多媒体内容的基于网络的处理及分布
JP2014071138A (ja) カラオケ装置
CN112216294B (zh) 音频处理方法、装置、电子设备及存储介质
US20210375303A1 (en) Natural Ear
CN101667422A (zh) 一种调节歌曲伴奏的调式的方法及装置
WO2018017878A1 (en) Network-based processing and distribution of multimedia content of a live musical performance
EP3121808A3 (en) System and method of modeling characteristics of a musical instrument
JP2002215195A (ja) 音楽信号処理装置
US6673995B2 (en) Musical signal processing apparatus
Luizard et al. Singing in different rooms: Common or individual adaptation patterns to the acoustic conditions?
CN117544262A (zh) 定向广播的动态控制方法、装置、设备及存储介质
RU2411593C2 (ru) Устройство для преобразования частотного спектра в частоты природной гармоники
JP3576109B2 (ja) Midiデータ変換方法、midiデータ変換装置、midiデータ変換プログラム
JP5960635B2 (ja) 楽器音出力装置
US11531519B2 (en) Color slider
Wilmering et al. Audio effect classification based on auditory perceptual attributes
WO2021248964A1 (zh) 家电及其控制方法和计算机可读存储介质
CN1627865A (zh) 调整听力装置的方法以及实现该方法的设备
CN112509592A (zh) 电器设备、噪音处理方法和可读存储介质
JP2010032599A (ja) 音声処理装置およびプログラム
JP5382361B2 (ja) 楽曲演奏装置
CN110505554B (zh) 一种基于具有dsp增强功能音响的方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240122

Address after: 518000, 3rd Floor, No. 5 Yifenghua Innovation Industrial Park, Xinshi Community, Dalang Street, Longhua District, Shenzhen, Guangdong Province

Patentee after: Shenzhen Weipu Medical Technology Co.,Ltd.

Country or region after: China

Address before: 518048, 1604G, Huarong Building, No. 178 Mintian Road, Fu'an Community, Futian Street, Futian District, Shenzhen City, Guangdong Province

Patentee before: Shenzhen tongshihai Precision Machinery Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right