CN112992167A - 音频信号的处理方法、装置及电子设备 - Google Patents

音频信号的处理方法、装置及电子设备 Download PDF

Info

Publication number
CN112992167A
CN112992167A CN202110171783.XA CN202110171783A CN112992167A CN 112992167 A CN112992167 A CN 112992167A CN 202110171783 A CN202110171783 A CN 202110171783A CN 112992167 A CN112992167 A CN 112992167A
Authority
CN
China
Prior art keywords
audio signal
path
target
processed
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110171783.XA
Other languages
English (en)
Inventor
张利红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Techology Co Ltd
Original Assignee
Goertek Techology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Techology Co Ltd filed Critical Goertek Techology Co Ltd
Priority to CN202110171783.XA priority Critical patent/CN112992167A/zh
Publication of CN112992167A publication Critical patent/CN112992167A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本公开实施例公开了音频信号的处理方法、装置及电子设备,该音频信号的处理方法包括:获取待处理的音频信号;将所述待处理的音频信号分为两路,得到第一路音频信号和第二路音频信号;获取低频处理模式,其中,所述低频处理模式包括目标低频类型和目标处理方式;确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号,如是,根据所述目标处理方式对所述第二路音频信号进行处理,得到处理后的第二路音频信号;将所述第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到目标音频信号。

Description

音频信号的处理方法、装置及电子设备
技术领域
本公开实施例涉及信号处理技术领域,更具体地,本公开实施例涉及一种音频信号的处理方法、装置及电子设备。
背景技术
当前人们对智能音频类产品的性能的要求越来越高,一方面要求智能音频类产品小巧便携,另一方面要求智能音频类产品具有较佳的音质。
而智能音频类产品的尺寸越小,低音谐振频率不能达到足够低,无法实现较佳的低频声音效果。在相关技术中,通常采用均衡器拉升低频信号的输出功率,但是,这种方式低频拉升有限,存在使音频信号产生严重畸变的问题,不能达到较佳的低频声音效果。此外,该方式同时还会对扬声器造成损坏。
因此,有必要提供一种新的音频信号的处理方法,以获得较佳的低频声音效果。
发明内容
本公开实施例的目的在于提供一种音频信号的处理的技术方案,以获得较佳的低频声音效果。
根据本公开实施例的第一方面,提供了一种音频信号的处理方法,所述方法包括:
获取待处理的音频信号;
将所述待处理的音频信号分为两路,得到第一路音频信号和第二路音频信号;
获取低频处理模式,其中,所述低频处理模式包括目标低频类型和目标处理方式;
确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号;
如是,根据所述目标处理方式对所述第二路音频信号进行处理,得到处理后的第二路音频信号;
将所述第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到目标音频信号。
可选地,所述确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号,包括:
提取所述第二路音频信号的特征信息;
根据所述特征信息,确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号。
可选地,所述根据所述特征信息,确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号,包括:
基于预设的识别函数和对应于所述目标低频类型的特征库,对所述特征信息进行识别,得到所述第二路音频信号包含对应于所述目标低频类型的音频信号的概率值;
在所述概率值大于设定阈值的情况下,确定所述第二路音频信号中包含对应于所述目标低频类型的音频信号;
在所述概率值小于或等于设定阈值的情况下,确定所述第二路音频信号中不包含对应于所述目标低频类型的音频信号。
可选地,所述根据所述特征信息,确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号,包括:
基于预设的识别模型对所述特性信息进行识别,确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号。
可选地,所述特征信息包括梅尔倒谱系数特征和辅助特征。
可选地,所述方法在提取所述第二路音频信号的特征信息之前,还包括:
对所述第二路音频信号进行滤波处理。
可选地,所述根据所述目标处理方式对所述第二路音频信号进行处理,得到处理后的第二路音频信号,包括:
对所述第二路音频信号中对应于目标低频类型的音频信号进行增强或者减弱处理。
可选地,所述将所述第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到目标音频信号,包括:
从所述处理后的第二路音频信号中选取参考信号;
根据所述参考信号在所述处理后的第二路音频信号中的位置和所述参考信号在所述第一路音频信号中的位置,确定所述第一路音频信号与所述处理后的第二路音频信号的时间差;
根据所述时间差,对所述第一路音频信号进行延迟处理,得到延迟后的第一路音频信号;
将所述延迟后的第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到所述目标音频信号。
根据本公开实施例的第二方面,提供了一种音频信号的处理装置,所述装置包括:
获取模块,用于获取待处理的音频信号;
音频信号拆分模块,用于将所述待处理的音频信号分为两路,得到第一路音频信号和第二路音频信号;
低频处理模式输入模块,用于获取低频处理模式,其中,所述低频处理模式包括目标低频类型和目标处理方式;
确定模块,用于确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号;
处理模块,用于如是,根据所述目标处理方式对所述第二路音频信号进行处理,得到处理后的第二路音频信号;
叠加模块,用于将所述第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到目标音频信号。
根据本公开实施例的第三方面,提供了一种电子设备,包括处理器和存储器,所述存储器存储有计算机指令,所述计算机指令被所述处理器运行时,执行本公开实施例的第一方面提供的方法。
根据本公开实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器运行时执行本公开实施例的第一方面提供的方法。
根据本公开实施例,将待处理的音频信号分为第一路音频信号和第二路音频信号,并且根据获取的低频处理模式对第二路音频信号中对应于低频处理模式的音频信号进行处理,可以避免对音频信号整体拉升而造成的声音畸变。进一步地,将第一路音频信号与处理后第二路音频信号进行叠加处理,可以在保证原有音频信号中的高频部分的声音效果的同时,可以获得较佳的低频声音效果。此外,本申请可以为用户提供多种低频处理模式,以针对用户选取的低频处理模式对音频信号进行处理,能够满足不同用户对不同低频声音效果的需求,用户体验更好。
通过以下参照附图对本公开实施例的示例性实施例的详细描述,本公开实施例的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是可用于实现一个实施例的电子设备的硬件配置示意图;
图2是根据一个实施例的音频信号的处理方法的流程示意图;
图3是根据一个实施例的选择低频处理模式的界面示意图;
图4是根据一个例子的音频信号的处理方法的流程示意图;
图5是根据一个实施例的音频信号的处理装置的结构方框图;
图6是根据一个实施例的电子设备的结构方框图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开实施例的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1是可用于实现一个实施例的音频信号的处理方法的电子设备的硬件配置示意图。
在一个实施例中,电子设备1000可以如图1所示,包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、麦克风1700和扬声器1800。处理器1100可以包括但不限于中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括各种总线接口,例如串行总线接口(包括USB接口)、并行总线接口等。通信装置1400例如能够进行有线或无线通信。显示装置1500例如是液晶显示屏、LED显示屏、触摸显示屏等。输入装置1600例如包括触摸屏、键盘等。麦克风1700可以用于输入语音信息。扬声器1800可以用于输出语音信息。
在一个实施例中,电子设备1000可以是具有通信功能、业务处理能力的电子设备。该电子设备1000例如可以是移动终端、便携式电脑、平板电脑、掌上电脑、可穿戴设备、耳机、智能音箱等。
本实施例中,电子设备1000的存储器1200用于存储指令,该指令用于控制处理器1100进行操作以实施或者支持实施根据任意实施例的音频信号的处理方法。技术人员可以根据本说明书所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
本领域技术人员应当理解,尽管在图1中示出了电子设备1000的多个装置,但是,本说明书实施例的电子设备1000可以仅涉及其中的部分装置,例如,只涉及处理器1100和存储器1200等。
图1所示的电子设备1000仅是解释性的,并且决不是为了要限制本说明书、其应用或用途。
下面,参照附图描述根据本公开的各个实施例和例子。
<方法实施例>
图2示出了本公开的一个实施例的音频信号的处理方法,该音频信号的处理方法例如可以由如图1所示的电子设备1000实施。
该实施例提供的音频信号的处理方法可以包括以下步骤S2100~S2500。
步骤S2100,获取待处理的音频信号。
步骤S2200,将待处理的音频信号分为两路,得到第一路音频信号和第二路音频信号。
待处理的音频信号为用户输入的音频信号。在该步骤中,将用户输入的待处理的音频信号分为两路,其中一路为第一路音频信号,另一路为第二路音频信号。将第一路音频信号作为原始音频信号并存储,对第二路音频信号进行处理,之后将第一路音频信号与处理后的第二路音频信号叠加,能够得到低频声音效果更好的目标音频信号。
步骤S2300,获取低频处理模式,其中,低频处理模式包括目标低频类型和目标处理方式。
目标低频类型用于区分低频声音信号的种类。低频声音信号可以是频率小于1kHz的声音信号。低频声音信号的频率可以实际情况进行设定,例如,低频声音信号的频率范围为50Hz~300Hz。目标低频类型可以包括一种低频声音信号,也可以包括多种不同的低频声音信号。目标低频类型例如至少可以包括鼓声、***声、地震声、射箭声。
目标处理方式可以包括增强和减弱两种方式。
低频处理模式例如可以是鼓声增强、***声增强、地震声增强、鼓声和地震声增强、鼓声减弱等。
在本公开的一个实施例中,获取低频处理模式的步骤可以进一步包括:步骤S3100~S3200。
步骤S3100,提供交互接口。
交互接口例如可以是能够连接输入设备的接口。该输入设备例如包括触摸屏、键盘、鼠标等能够供用户输入信息的设备。
步骤S3200,获取通过交互接口输入的低频处理模式。
在具体实施时,如图3所示,电子设备上可以呈现低频处理模式的选择界面,响应于用户的输入可以确定低频处理模式。
在该实施例中,用户也可以通过终端设备选取低频处理模式,并将用户输入的低频处理模式传输至电子设备,以供电子设备根据该低频处理模式对音频信号进行处理。
步骤S2400,确定第二路音频信号中是否包含对应于目标低频类型的音频信号。
在本公开的一个实施例中,确定第二路音频信号中是否包含对应于目标低频类型的音频信号的步骤可以进一步包括:步骤S4100~S4200。
步骤S4100,提取第二路音频信号的特征信息。
在提取第二路音频信号的特征信息之前,该音频信号的处理方法还可以包括:对第二路音频信号进行滤波处理。
在具体实施时,针对选定的目标低频类型设置带通滤波器,例如,鼓声一般为50~1000Hz,可以设置带通滤波器的滤波带宽为50~1000Hz。本实施例在提取第二路音频信号的特征信息之前,对第二路音频信号进行滤波处理,实现对音频信号的约简,能够降低冗余度,从而使特征识别的过程简化,提升识别速度。
不同低频类型的音频信号具有各自的特征。特征信息可以包括梅尔倒谱系数特征和辅助特征。示例性的,辅助特征可以包括普质心特征、谱偏态特征、谱峰态特征、普滚降特征、时域质心特征、重音特征、能量特征中的至少一项。
下面以鼓声为例说明梅尔倒谱系数特征的提取过程。
步骤一,将滤波处理后的第二路音频信号分隔成若干段音频信号,每一段音频信号为一帧,每一帧音频信号的采用序列的点数为1024点。
步骤二,对每一帧音频信号进行预加重处理,预加重处理后的每一帧音频信号经离散的傅里叶(fast Fourier transform FFT)变换,得到离散功率谱(Sn)。
步骤三,通过M个三角形窗函数计算各个频率的功率值,得到M个参数功率Pm。
步骤四,计算M个参数功率Pm的自然对数,再进一步做离散余弦变换,并去掉直流成分,得到梅尔倒谱系数特征。
在该例子中,将梅尔倒谱系数特征、梅尔倒谱系数的一阶差分信号和梅尔倒谱系数的二阶差分信号作为特征信息,用于识别第二路音频信号中是否包含对应于目标低频类型的音频信号。
在该实施例中,可以提取第二路音频信号的梅尔倒谱系数特征和辅助特征,共同判断该第二路音频信号中是否包含对应于目标低频类型的音频信号。例如,针对鼓声,可以选取谱质心特征、谱偏态特征、重音信号特征和谱滚降特征作为辅助特征。根据本公开实施例,选取一种或者多种辅助特征与梅尔倒谱系数特征一起用于识别第二路音频信号中是否包含对应于目标低频类型的音频信号,可以提高识别的准确率。
步骤S4200,根据特征信息,确定第二路音频信号中是否包含对应于目标低频类型的音频信号。
在该实施例中,可以基于预设的识别函数确定音频信号中是否包含对应于低频类型的音频信号,也可以基于预设的识别模型确定音频信号中是否包含对应于低频类型的音频信号。下面分别对这两种方式进行说明。
在一个更具体的例子中,根据特征信息,确定第二路音频信号中是否包含对应于目标低频类型的音频信号的步骤可以进一步包括:步骤S5100~S5300。
步骤S5100,基于预设的识别函数和对应于目标低频类型的特征库,对特征信息进行识别,得到第二路音频信号包含对应于目标低频类型的音频信号的概率值。
对应于目标低频类型的特征库用于存储该目标低频类型的特征信息。在具体实施时,可以利用已经提取的该目标低频类型的特征信息建立特征库。例如,针对鼓声,采集鼓声的梅尔倒谱系数特征、谱质心特征、谱偏态特征、重音信号特征和谱滚降特征,并基于这些特征建立鼓声的特征库。
预设的识别函数例如可以是似然函数。
示例性的,第二路音频信号包含对应于目标低频类型的音频信号的概率值a可以通过如下公式获得:
P(Wi/O)=[P(O/Wi)*P(Wi)]/P(O)
a=argmax{P(Wi/O)}
其中,P(Wi/O)为提取到的特征信息与特征库比对的先验概率,[P(O/Wi)*P(Wi)]为提取到的特征信息与特征库比对的后验概率,a为第二路音频信号包含对应于目标低频类型的音频信号的概率值。
步骤S5200,在概率值大于设定阈值的情况下,确定第二路音频信号中包含对应于目标低频类型的音频信号。
步骤S5300,在概率值小于或等于设定阈值的情况下,确定第二路音频信号中不包含对应于目标低频类型的音频信号。
该设定阈值可以用于第二路音频信号中不包含对应于目标低频类型的音频信号。在一些实施例中,该设定阈值可以根据试验仿真结果预先设定。
以识别鼓声为例,将提取到的特征信息与鼓声的特征库比对,得到对应的鼓声的音频信号的概率值,将该概率值与设定阈值进行比较,如果概率值大于设定阈值,说明第二路音频信号中包含鼓声,如果概率值小于或等于设定阈值,说明第二路音频信号中不包含鼓声。
在本公开的另一个实施例中,根据特征信息,确定第二路音频信号中是否包含对应于目标低频类型的音频信号的步骤可以进一步包括:步骤S6100。
步骤S6100,基于预设的识别模型对特性信息进行识别,确定第二路音频信号中是否包含对应于目标低频类型的音频信号。
识别模型例如可以是预先训练的神经网络模型。根据本公开实施,基于预设的识别模型对特性信息进行识别,确定第二路音频信号中是否包含对应于目标低频类型的音频信号,可以提高识别的准确性,以及提升识别速度。
在确定第二路音频信号中包含对应于目标低频类型的音频信号之后,可以针对第二路音频信号中对应目标低频类型的特征部分进行处理,可以避免对音频信号整体拉升造成的声音畸变,从而获得较佳的低频声音效果。
步骤S2500,如是,根据目标处理方式对第二路音频信号进行处理,得到处理后的第二路音频信号。
在该实施例中,在获取第二路音频信号和确定低频处理模式之后,确定第二路音频信号中是否包含对应于目标低频类型的音频信号,在确定第二路音频信号中包含对应于目标低频类型的音频信号的情况下,根据目标处理方式对第二路音频信号进行处理。
在本公开的一个实施例中,根据目标处理方式对第二路音频信号进行处理,得到处理后的第二路音频信号的步骤可以进一步包括:对所述第二路音频信号中对应于目标低频类型的音频信号进行增强或者减弱处理。
在一个更具体的例子中,根据目标处理方式对第二路音频信号进行处理,得到处理后的第二路音频信号的步骤可以进一步包括:步骤S7100~S7200。
步骤S7100,在目标处理方式为第一方式的情况下,对第二路音频信号中对应于目标低频类型的音频信号进行增强处理。
第一方式例如可以是增强。增强处理例如可以是利用谐波增强方式,提升低频声音效果。在具体实施时,可以对提取的全部特征信息进行谐波增强处理,也可以选取部分特征信息进行谐波增强处理。
示例性的,以通过谐波增强方式处理鼓声为例,在提取鼓声的12维特征信息之后,按照频率从低到高的顺序,选取前5个频点进行谐波增强处理。这5个频点分别为f1、f2、f3、f4、f5,谐波增强处理后的第二路音频信号可以通过如下公式获得:
Sx=[a1*P(f1)+b1*P(2*f1)+c1*P(3*f1)]
+[a2*P(f2)+b2*P(2*f2)+c2*P(3*f2)]
+[a3*P(f3)+b3*P(2*f3)+c3*P(3*f3)]
+[a4*P(f4)+b4*P(2*f4)+c4*P(3*f4)]
+[a5*P(f5)+b5*P(2*f5)+c5*P(3*f5)]
其中,f1对应的二阶和三阶谐波增强频率分别为2*f1、3*f1,f1对应的谐波频点对应的原始信号功率为分别为P(f1)、P(2*f1)、P(3*f1);f2对应的二阶和三阶谐波增强频率分别为2*f2、3*f2,f2对应的谐波频点对应的原始信号功率为分别为P(f2)、P(2*f2)、P(3*f2);f3对应的二阶和三阶谐波增强频率分别为2*f3、3*f3,f3对应的谐波频点对应的原始信号功率为分别为P(f3)、P(2*f3)、P(3*f3);f4对应的二阶和三阶谐波增强频率分别为2*f4、3*f4,f4对应的谐波频点对应的原始信号功率为分别为P(f4)、P(2*f4)、P(3*f4);f5对应的二阶和三阶谐波增强频率分别为2*f5、3*f5,f5对应的谐波频点对应的原始信号功率为分别为P(f5)、P(2*f5)、P(3*f5)。
步骤S7200,在目标处理方式为第二方式的情况下,对第二路音频信号中对应于目标低频类型的音频信号进行减弱处理。
第二方式例如可以是减弱。减弱处理例如可以是利用谐波减弱方式。例如,在夜间使用电子设备时,可以选择鼓声减弱模式,避免干扰周围人。
步骤S2600,将第一路音频信号与处理后的第二路音频信号进行叠加处理,得到目标音频信号。
在本实施例中,在得到处理后的第二路音频信号之后,将第一路音频信号和处理后的第二路音频信号叠加,也就是将预先存储的没有处理的原始音频信号和处理后的音频信号进行叠加,以获得目标音频信号。
在本公开的一个实施例中,将第一路音频信号与处理后的第二路音频信号进行叠加处理,得到目标音频信号的步骤可以进一步包括:步骤S8100-S8400。
步骤S8100,从处理后的第二路音频信号中选取参考信号。
步骤S8200,根据参考信号在处理后的第二路音频信号中的位置和参考信号在第一路音频信号中的位置,确定第一路音频信号与处理后的第二路音频信号的时间差。
步骤S8300,根据时间差,对第一路音频信号进行延迟处理,得到延迟后的第一路音频信号。
步骤S8400,将延迟后的第一路音频信号与处理后的第二路音频信号进行叠加处理,得到目标音频信号。
示例性的,可以确定f1对应的信号在处理后的第二路音频信号中的位置,即最低频率对应的信号在处理后的第二路音频信号中的位置,之后,在第一路音频信号中通过相关度计算和周期性信号检索,确定f1对应信号在第一路音频信号中的位置,即f1对应信号在原始音频信号中的位置,计算第一路音频信号与处理后的第二路音频信号的时间差,再将第一路音频信号进行延迟,将延迟后的第一路音频信号与处理后的第二路音频信号叠加,得到目标音频信号。
示例性的,还可以分别截取第一路音频信号和处理后的第二路音频信号的相应频段,然后对截取的频段进行傅里叶变换,在频域上进行叠加,得到目标音频信号。
根据本公开实施例,将待处理的音频信号分为第一路音频信号和第二路音频信号,并且根据获取的低频处理模式对第二路音频信号中对应于低频处理模式的音频信号进行处理,可以避免对音频信号整体拉升而造成的声音畸变。进一步地,将第一路音频信号与处理后第二路音频信号进行叠加处理,可以在保证原有音频信号中的高频部分的声音效果的同时,可以获得较佳的低频声音效果。此外,本申请可以为用户提供多种低频处理模式,以针对用户选取的低频处理模式对音频信号进行处理,能够满足不同用户对不同低频声音效果的需求,用户体验更好。
在本公开的一个实施例中,在获取待处理的音频信号和用户输入的低频处理模式之后,该音频信号的处理方法还包括:将待处理的音频信号和用户输入的低频处理模式输出至云服务器,以供云服务器对识别第二路音频信号中是否包含对应于目标低频类型的音频信号,以及在第二路音频信号中包含对应于所述目标低频类型的音频信号的情况下,根据目标处理方式对第二路音频信号中的选定部分进行处理,得到处理后的第二路音频信号,以及将第一路音频信号与处理后的第二路音频信号进行叠加处理,得到目标音频信号。
根据本公开实施例,可以采集云服务器执行信号处理的过程,可以降低电子设备的功耗,提高处理速度。
下面以一个具体的例子说明音频信号的处理方法。参见图4,该音频信号的处理方法包括如下步骤。
步骤S401,获取待处理的音频信号,将待处理的音频信号分为两路,得到第一路音频信号和第二路音频信号。
步骤S402,对第二路音频信号进行滤波处理。
步骤S403,提取第二路音频信号的特征信息。
步骤S404,根据特征信息,确定第二路音频信号中是否包含对应于选定的低频处理模式的音频信号,如果是,执行步骤S405,否则,结束流程。
步骤S405,根据选定的低频处理模式,对第二路音频信号中包含的选定部分进行处理,得到处理后的第二路音频信号。
步骤S406,将第一路音频信号与处理后的第二路音频信号,得到目标音频信号。
步骤S407,输出目标音频信号。
根据本具体例子,将待处理的音频信号分为第一路音频信号和第二路音频信号,并且根据获取的低频处理模式对第二路音频信号中对应于低频处理模式的音频信号进行处理,可以避免对音频信号整体拉升而造成的声音畸变。进一步地,将第一路音频信号与处理后第二路音频信号进行叠加处理,可以在保证原有音频信号中的高频部分的声音效果的同时,可以获得较佳的低频声音效果。此外,本申请可以为用户提供多种低频处理模式,以针对用户选取的低频处理模式对音频信号进行处理,能够满足不同用户对不同低频声音效果的需求,用户体验更好。
<装置实施例>
参见图5所示,本公开实施例提供了音频信号的处理装置500,该音频信号的处理装置500包括获取模块510、音频信号拆分模块520、低频处理模式输入模块530、确定模块540、处理模块550和叠加模块560。
该获取模块510用于获取待处理的音频信号。
该音频信号拆分模块520用于将所述待处理的音频信号分为两路,得到第一路音频信号和第二路音频信号。
该低频处理模式输入模块530用于获取用户输入的低频处理模式,其中,所述低频处理模式包括目标低频类型和目标处理方式。
该确定模块540用于确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号。
在本公开的一个实施例中,该确定模块540可以进一步包括特征提取单元和确定单元。
该特征提取单元用于提取所述第二路音频信号的特征信息。
该确定单元用于根据所述特征信息,确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号。
在一个更具体的例子中,该确定单元具体用于基于预设的识别函数和对应于所述目标低频类型的特征库,对所述特征信息进行识别,得到所述第二路音频信号包含对应于所述目标低频类型的音频信号的概率值。
该确定单元具体还用于在所述概率值大于设定阈值的情况下,确定所述第二路音频信号中包含对应于所述目标低频类型的音频信号。
该确定单元具体还用于在所述概率值小于或等于设定阈值的情况下,确定所述第二路音频信号中不包含对应于所述目标低频类型的音频信号。
在一个更具体的例子中,该确定单元具体还用于基于预设的识别模型对所述特性信息进行识别,确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号。
其中,所述特征信息包括梅尔倒谱系数特征和辅助特征。辅助特征例如可以包括普质心特征、谱偏态特征、谱峰态特征、普滚降特征、时域质心特征、重音特征中的至少一项。
在本公开的一个实施例中,该确定模块540可以进一步包括滤波单元。
该滤波单元用于在提取所述第二路音频信号的特征信息之前,对所述第二路音频信号进行滤波处理。
该处理模块550用于如是,根据所述目标处理方式对所述第二路音频信号进行处理,得到处理后的第二路音频信号。
在本公开的一个实施例中,该处理模块550具体用于对所述第二路音频信号中对应于目标低频类型的音频信号进行增强或者减弱处理。
该叠加模块560用于将所述第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到目标音频信号。
在本公开的一个实施例中,该叠加模块560包括选取单元、时间差确定单元、延迟处理单元、叠加处理单元。
该选取单元用于从所述处理后的第二路音频信号中选取参考信号。
该时间差确定单元用于根据所述参考信号在所述处理后的第二路音频信号中的位置和所述参考信号在所述第一路音频信号中的位置,确定所述第一路音频信号与所述处理后的第二路音频信号的时间差。
该延迟处理单元用于根据所述时间差,对所述第一路音频信号进行延迟处理,得到延迟后的第一路音频信号。
该叠加处理单元用于将所述延迟后的第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到所述目标音频信号。
根据本公开实施例,将待处理的音频信号分为第一路音频信号和第二路音频信号,并且根据获取的低频处理模式对第二路音频信号中对应于低频处理模式的音频信号进行处理,可以避免对音频信号整体拉升而造成的声音畸变。进一步地,将第一路音频信号与处理后第二路音频信号进行叠加处理,可以在保证原有音频信号中的高频部分的声音效果的同时,可以获得较佳的低频声音效果。此外,本申请可以为用户提供多种低频处理模式,以针对用户选取的低频处理模式对音频信号进行处理,能够满足不同用户对不同低频声音效果的需求,用户体验更好。
<设备实施例>
参见图6所示,本公开实施例还提供了一种电子设备600。该电子设备600例如可以是如图1所示的电子设备1000。
该电子设备600包括处理器610和存储器620。
该存储器620用于存储可执行的计算机程序。
该处理器610用于根据所述可执行的计算机程序的控制,执行根据前述方法实施例中任一项所述的音频信号的处理方法。
在一个实施例中,电子设备1000可以是具有通信功能、业务处理能力的电子设备。该电子设备1000例如可以是移动终端、便携式电脑、平板电脑、掌上电脑、可穿戴设备、耳机、智能音箱等。
根据本公开实施例提供的电子设备,将待处理的音频信号分为第一路音频信号和第二路音频信号,并且根据获取的低频处理模式对第二路音频信号中对应于低频处理模式的音频信号进行处理,可以避免对音频信号整体拉升而造成的声音畸变。进一步地,将第一路音频信号与处理后第二路音频信号进行叠加处理,可以在保证原有音频信号中的高频部分的声音效果的同时,可以获得较佳的低频声音效果。此外,本申请可以为用户提供多种低频处理模式,以针对用户选取的低频处理模式对音频信号进行处理,能够满足不同用户对不同低频声音效果的需求,用户体验更好。
<计算机可读存储介质>
本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器运行时执行本公开实施例提供的音频信号的处理方法。
本公开实施例可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开实施例的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是——但不限于——电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开实施例操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言-诸如Smalltalk、C++等,以及常规的过程式编程语言-诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络-包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开实施例的各个方面。
这里参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开实施例的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人物来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人物来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人物能理解本文披露的各实施例。本公开实施例的范围由所附权利要求来限定。

Claims (11)

1.一种音频信号的处理方法,其特征在于,所述方法包括:
获取待处理的音频信号;
将所述待处理的音频信号分为两路,得到第一路音频信号和第二路音频信号;
获取低频处理模式,其中,所述低频处理模式包括目标低频类型和目标处理方式;
确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号;
如是,根据所述目标处理方式对所述第二路音频信号进行处理,得到处理后的第二路音频信号;
将所述第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到目标音频信号。
2.根据权利要求1所述的方法,其特征在于,所述确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号,包括:
提取所述第二路音频信号的特征信息;
根据所述特征信息,确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号。
3.根据权利要求2所述的方法,其特征在于,所述根据所述特征信息,确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号,包括:
基于预设的识别函数和对应于所述目标低频类型的特征库,对所述特征信息进行识别,得到所述第二路音频信号包含对应于所述目标低频类型的音频信号的概率值;
在所述概率值大于设定阈值的情况下,确定所述第二路音频信号中包含对应于所述目标低频类型的音频信号;
在所述概率值小于或等于设定阈值的情况下,确定所述第二路音频信号中不包含对应于所述目标低频类型的音频信号。
4.根据权利要求2所述的方法,其特征在于,所述根据所述特征信息,确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号,包括:
基于预设的识别模型对所述特性信息进行识别,确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号。
5.根据权利要求2所述的方法,其特征在于,所述特征信息包括梅尔倒谱系数特征和辅助特征。
6.根据权利要求2所述的方法,其特征在于,所述方法在提取所述第二路音频信号的特征信息之前,还包括:
对所述第二路音频信号进行滤波处理。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标处理方式对所述第二路音频信号进行处理,得到处理后的第二路音频信号,包括:
对所述第二路音频信号中对应于目标低频类型的音频信号进行增强或者减弱处理。
8.根据权利要求1所述的方法,其特征在于,所述将所述第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到目标音频信号,包括:
从所述处理后的第二路音频信号中选取参考信号;
根据所述参考信号在所述处理后的第二路音频信号中的位置和所述参考信号在所述第一路音频信号中的位置,确定所述第一路音频信号与所述处理后的第二路音频信号的时间差;
根据所述时间差,对所述第一路音频信号进行延迟处理,得到延迟后的第一路音频信号;
将所述延迟后的第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到所述目标音频信号。
9.一种音频信号的处理装置,其特征在于,所述装置包括:
获取模块,用于获取待处理的音频信号;
音频信号拆分模块,用于将所述待处理的音频信号分为两路,得到第一路音频信号和第二路音频信号;
低频处理模式输入模块,用于获取低频处理模式,其中,所述低频处理模式包括目标低频类型和目标处理方式;
确定模块,用于确定所述第二路音频信号中是否包含对应于所述目标低频类型的音频信号;
处理模块,用于如是,根据所述目标处理方式对所述第二路音频信号进行处理,得到处理后的第二路音频信号;
叠加模块,用于将所述第一路音频信号与所述处理后的第二路音频信号进行叠加处理,得到目标音频信号。
10.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有计算机指令,所述计算机指令被所述处理器运行时,执行权利要求1-8任一项所述的方法。
11.一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器运行时执行权利要求1-8任一项所述的方法。
CN202110171783.XA 2021-02-08 2021-02-08 音频信号的处理方法、装置及电子设备 Pending CN112992167A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110171783.XA CN112992167A (zh) 2021-02-08 2021-02-08 音频信号的处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110171783.XA CN112992167A (zh) 2021-02-08 2021-02-08 音频信号的处理方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN112992167A true CN112992167A (zh) 2021-06-18

Family

ID=76347493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110171783.XA Pending CN112992167A (zh) 2021-02-08 2021-02-08 音频信号的处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112992167A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114040317A (zh) * 2021-09-22 2022-02-11 北京车和家信息技术有限公司 音响的声道补偿方法及装置、电子设备和存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188877A (zh) * 2006-11-22 2008-05-28 三星电子株式会社 由计算音频信号基频增强音频信号低频分量的方法和装置
WO2012163144A1 (zh) * 2011-10-08 2012-12-06 华为技术有限公司 音频信号编码方法和装置
US20130163784A1 (en) * 2011-12-27 2013-06-27 Dts Llc Bass enhancement system
CN105405448A (zh) * 2014-09-16 2016-03-16 科大讯飞股份有限公司 一种音效处理方法及装置
CN105516860A (zh) * 2016-01-19 2016-04-20 青岛海信电器股份有限公司 虚拟低音生成方法、装置和终端
CN205610868U (zh) * 2016-03-23 2016-09-28 中名(东莞)电子有限公司 主动移动式平板低音增强耳机
WO2016150085A1 (zh) * 2015-03-23 2016-09-29 深圳市冠旭电子有限公司 一种基于等响曲线的动态低频加强方法及***
CN106504760A (zh) * 2016-10-26 2017-03-15 成都启英泰伦科技有限公司 宽频带背景噪声与语音分离检测***及方法
CN108235184A (zh) * 2018-01-17 2018-06-29 潍坊歌尔电子有限公司 一种低音增强电路和音频播放设备
CN109243485A (zh) * 2018-09-13 2019-01-18 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
US20200084567A1 (en) * 2018-03-21 2020-03-12 Sonos, Inc. Systems and Methods of Adjusting Bass Levels of Multi-Channel Audio Signals
EP3696814A1 (en) * 2019-02-15 2020-08-19 Shenzhen Goodix Technology Co., Ltd. Speech enhancement method and apparatus, device and storage medium
CN112005300A (zh) * 2018-05-11 2020-11-27 华为技术有限公司 语音信号的处理方法和移动设备

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188877A (zh) * 2006-11-22 2008-05-28 三星电子株式会社 由计算音频信号基频增强音频信号低频分量的方法和装置
WO2012163144A1 (zh) * 2011-10-08 2012-12-06 华为技术有限公司 音频信号编码方法和装置
US20130163784A1 (en) * 2011-12-27 2013-06-27 Dts Llc Bass enhancement system
CN105405448A (zh) * 2014-09-16 2016-03-16 科大讯飞股份有限公司 一种音效处理方法及装置
WO2016150085A1 (zh) * 2015-03-23 2016-09-29 深圳市冠旭电子有限公司 一种基于等响曲线的动态低频加强方法及***
CN105516860A (zh) * 2016-01-19 2016-04-20 青岛海信电器股份有限公司 虚拟低音生成方法、装置和终端
CN205610868U (zh) * 2016-03-23 2016-09-28 中名(东莞)电子有限公司 主动移动式平板低音增强耳机
CN106504760A (zh) * 2016-10-26 2017-03-15 成都启英泰伦科技有限公司 宽频带背景噪声与语音分离检测***及方法
CN108235184A (zh) * 2018-01-17 2018-06-29 潍坊歌尔电子有限公司 一种低音增强电路和音频播放设备
US20200084567A1 (en) * 2018-03-21 2020-03-12 Sonos, Inc. Systems and Methods of Adjusting Bass Levels of Multi-Channel Audio Signals
CN112005300A (zh) * 2018-05-11 2020-11-27 华为技术有限公司 语音信号的处理方法和移动设备
CN109243485A (zh) * 2018-09-13 2019-01-18 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
EP3696814A1 (en) * 2019-02-15 2020-08-19 Shenzhen Goodix Technology Co., Ltd. Speech enhancement method and apparatus, device and storage medium

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
岳宏等: "光学小波变换在视觉***的应用研究", 《光子学报》 *
边世勇: "带低频增强的听觉激励器原理及应用", 《广播与电视技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114040317A (zh) * 2021-09-22 2022-02-11 北京车和家信息技术有限公司 音响的声道补偿方法及装置、电子设备和存储介质
CN114040317B (zh) * 2021-09-22 2024-04-12 北京车和家信息技术有限公司 音响的声道补偿方法及装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US10679612B2 (en) Speech recognizing method and apparatus
CN106658284B (zh) 频域中的虚拟低音的相加
US9536540B2 (en) Speech signal separation and synthesis based on auditory scene analysis and speech modeling
WO2020034779A1 (zh) 音频处理方法、存储介质及电子设备
CN110688518A (zh) 节奏点的确定方法、装置、设备及存储介质
CN113327586B (zh) 一种语音识别方法、装置、电子设备以及存储介质
CN110853606A (zh) 一种音效配置方法、装置及计算机可读存储介质
CN108234793A (zh) 一种通讯方法、装置、电子设备和存储介质
JP2022185114A (ja) エコー検出
CN106653049A (zh) 时域中的虚拟低音的相加
CN116472579A (zh) 用于麦克风风格转移的机器学习
CN110890098B (zh) 盲信号分离方法、装置和电子设备
CN112992167A (zh) 音频信号的处理方法、装置及电子设备
CN112466328B (zh) 呼吸音检测方法、装置和电子设备
WO2019119593A1 (zh) 语音增强方法及装置
CN106910494B (zh) 一种音频识别方法和装置
Srinivas et al. A classification-based non-local means adaptive filtering for speech enhancement and its FPGA prototype
US10540990B2 (en) Processing of speech signals
Close et al. Non intrusive intelligibility predictor for hearing impaired individuals using self supervised speech representations
CN114220430A (zh) 多音区语音交互方法、装置、设备以及存储介质
CN114360572A (zh) 语音去噪方法、装置、电子设备及存储介质
US20230081543A1 (en) Method for synthetizing speech and electronic device
CN112634921B (zh) 一种语音处理方法、装置和存储介质
Singh pyAudioProcessing: Audio Processing, Feature Extraction, and Machine Learning Modeling.
CN113470686B (zh) 语音增强方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210618

RJ01 Rejection of invention patent application after publication