CN115188388B - 一种音频后置滤波方法、装置、存储介质及设备 - Google Patents

一种音频后置滤波方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN115188388B
CN115188388B CN202210819985.5A CN202210819985A CN115188388B CN 115188388 B CN115188388 B CN 115188388B CN 202210819985 A CN202210819985 A CN 202210819985A CN 115188388 B CN115188388 B CN 115188388B
Authority
CN
China
Prior art keywords
filtering
sub
audio data
post
current audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210819985.5A
Other languages
English (en)
Other versions
CN115188388A (zh
Inventor
***
王尧
叶东翔
朱勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Barrot Wireless Co Ltd
Original Assignee
Barrot Wireless Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Barrot Wireless Co Ltd filed Critical Barrot Wireless Co Ltd
Priority to CN202210819985.5A priority Critical patent/CN115188388B/zh
Publication of CN115188388A publication Critical patent/CN115188388A/zh
Application granted granted Critical
Publication of CN115188388B publication Critical patent/CN115188388B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本申请公开了一种音频后置滤波方法、装置、存储介质及设备,属于音频编解码技术领域。该方法主要包括:在蓝牙解码过程中,根据变换域噪声整形模块对当前音频数据对应码流进行解码获取的谱系数,计算谱系数对应的伪谱,获取伪谱的谱熵;对当前音频数据进行基音判决,将小于预设门限值的谱熵对应当前音频数据,判定其具有较强基音成分;对当前音频数据进行数据种类判决,其中,当当前音频数据为语音数据时,对其进行短期后置滤波与长期后置滤波;当当前音频数据为音乐数据时,对其进行长期后置滤波。本申请通过对不同种类的音频数据使用不同的滤波方式,使得在降低运量的同时实现对音频数据的滤波,提高音质,提升用户体验。

Description

一种音频后置滤波方法、装置、存储介质及设备
技术领域
本申请涉及音频编解码技术领域,特别涉及一种音频后置滤波方法、装置、存储介质及设备。
背景技术
在现有技术中,为了增强音频数据的音质,LC3引入了基于时域信号处理的长期后置滤波(LTPF)模块,通过衰减谱谷中的量化噪声来锐化信号的谐波结构,其具体操作步骤为:在编码端:判断是否需要激活LTPF,同时提取相关的基音参数,编码端主要包括重采样、高通滤波、下采样、基音检测、基音延迟估计和激活判断;在解码端,根据编码端提取的参数,当LTPF激活时,使用IIR滤波器来实施滤波。
然而,在上述的滤波步骤中,编码端的重采样、基音检测(基于自相关)和基音延迟(基于自相关)的运算量很大,使得LTPF成为LC3中运算复杂度最高的模块之一,影响了其在低功耗蓝牙设备上的应用;在解码端,仅通过对量化噪声实施LTPF以实现滤波,但是由于随着码率的降低,量化噪声增加,从而降低音质,反之,则量化噪声减小,主观音质增加,基于此,当码率越高时,后置滤波强度应该越低。而LC3中并未考虑码率变化时需对滤波强度进行调整的状况,使得LC3的滤波效果降低;并且在上述的滤波步骤中,仅进行单一的长期后置滤波,并未做短期后置滤波,使得LC3的滤波效果降低。
发明内容
针对现有技术存在的滤波过程运算量大、未考虑码率变化时需对滤波强度进行调整的状况,使得LC3的滤波效果降低的问题,本申请主要提供一种音频后置滤波方法、装置、存储介质及设备。
为了实现上述目的,本申请采用的一个技术方案是:提供一种音频后置滤波方法,其包括:在蓝牙解码过程中,根据变换域噪声整形模块对当前音频数据对应码流进行解码获取的谱系数,计算谱系数对应的伪谱,获取伪谱的谱熵;对当前音频数据进行基音判决,将小于预设门限值的谱熵对应当前音频数据,判定其具有较强基音成分;对当前音频数据进行数据种类判决,其中,当当前音频数据为语音数据时,对其进行短期后置滤波与长期后置滤波,当当前音频数据为音乐数据时,对其进行长期后置滤波。
本申请采用的另一个技术方案是:提供一种音频后置滤波装置,其包括:谱熵计算模块,其用于在蓝牙解码过程中,根据变换域噪声整形模块对当前音频数据对应码流进行解码获取的谱系数,计算谱系数对应的伪谱,获取伪谱的谱熵;基音判决模块,其用于对当前音频数据进行基音判决,将小于预设门限值的谱熵对应当前音频数据,判定其具有较强基音成分;滤波类型判决模块,其用于对当前音频数据进行数据种类判决,其中,当当前音频数据为语音数据时,对其进行短期后置滤波与长期后置滤波;当当前音频数据为音乐数据时,对其进行长期后置滤波。
本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令***作以执行方案一中的音频后置滤波方法。
本申请采用的另一个技术方案是:提供一种计算机设备,其包括:至少一个处理器;以及与至少一个处理器进行通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的计算机指令,至少一个处理器操作计算机指令以执行方案一中的音频后置滤波方法。
本申请的技术方案可以达到的有益效果是:在蓝牙的编码过程中删除标准蓝牙编码步骤中的重采样与长期后置滤波模块;在蓝牙的解码过程中删除标准蓝牙解码步骤中的长期后置滤波解码模块,并通过判断谱系数对应伪谱的谱熵,确定该谱系数对应音频数据是否存在较强的基音成分,对于存在较强的基音成分的音频数据进行音频类型的判断,其中对于音乐数据实施长期后置滤波,对于语音数据实施短期后置滤波与长期后置滤波,本方案通过对不同种类的音频数据使用不同的滤波方式,使得在降低运量的同时实现对音频数据的滤波,提高音质,提升用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作以简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了标准蓝牙音频编解码中后置滤波的一个可选实施例的示意图;
图2示出了本方案在蓝牙编解码过程中后置滤波的一个可选实施例的示意图;
图3示出了本申请一种音频后置滤波方法的一个可选实施方式;
图4示出了本申请一种音频后置滤波方法的语音数据的语谱与谱熵的一个可选实例的示意图;
图5示出了全局后置滤波强度音质与码率的关系示意图;
图6示出了语音数据的时域波形与对应的共振峰的关系的示意图;
图7示出了图6中共振峰频率数据的统计;
图8示出了本申请一种音频后置滤波装置的可选实施方式。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在现有技术中,为了增强音频数据的音质,LC3引入了基于时域信号处理的长期后置滤波(LTPF)模块,通过衰减谱谷中的量化噪声来锐化信号的谐波结构,其具体操作步骤为:在编码端:判断是否需要激活LTPF,同时提取相关的基音参数,编码端主要包括重采样、高通滤波、下采样、基音检测、基音延迟估计和激活判断;在解码端,根据编码端提取的参数,当LTPF激活时,使用IIR滤波器来实施滤波。
然而,在上述的滤波步骤中,编码端的重采样、基音检测(基于自相关)和基音延迟(基于自相关)的运算量很大,使得LTPF成为LC3中运算复杂度最高的模块之一,影响了其在低功耗蓝牙设备上的应用;在解码端,仅通过对量化噪声实施LTPF以实现滤波,但是由于随着码率的降低,量化噪声增加,从而降低音质,反之,则量化噪声减小,主观音质增加,基于此,当码率越高时,后置滤波强度应该越低。而LC3中并未考虑码率变化时需对滤波强度进行调整的状况,使得LC3的滤波效果降低;并且在上述的滤波步骤中,仅进行单一的长期后置滤波,并未做短期后置滤波,使得LC3的滤波效果降低。
针对现有技术存在的问题,本申请主要提供一种音频后置滤波方法、装置、存储介质及设备。该音频后置滤波方法包括:在蓝牙解码过程中,根据变换域噪声整形模块对当前音频数据对应码流进行解码获取的谱系数,计算谱系数对应的伪谱,获取伪谱的谱熵;对当前音频数据进行基音判决,将小于预设门限值的谱熵对应当前音频数据,判定其具有较强基音成分;对当前音频数据进行数据种类判决,其中,当当前音频数据为语音数据时,对其进行短期后置滤波与长期后置滤波;当当前音频数据为音乐数据时,对其进行长期后置滤波。
在根据如图1所示的左图中标准的蓝牙音频编码步骤对当前音频数据编码时,不执行灰色的重采样与长期后置滤波器模块,获取当前音频数据对应的码流,在根据如图1所示的右图中标准的蓝牙音频解码步骤对当前音频数据对应的码流进行解码时,不执行灰色的长期后置滤波解码模块,而改用本方案的后置滤波模块代替,以获取滤波后的目标音频;在本方案中当前音频数据的编解码过程的具体实施步骤如图2所示,其中图2中的左图为对当前音频数据的编码过程,图2中的右图为对当前音频数据对应码流的解码过程。在本方案的后置滤波模块中通过判断谱系数对应伪谱的谱熵,确定该谱系数对应音频数据是否存在较强的基音成分,对于存在较强的基音成分的音频数据进行音频类型的判断,其中对于音乐数据实施长期后置滤波,对于语音数据实施短期后置滤波与长期后置滤波,本方案通过对不同种类的音频数据使用不同的滤波方式,使得在降低运量的同时实现对音频数据的滤波,提高音质,提升用户体验。
下面,以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面述及的具体的实施例可以相互结合形成新的实施例。对于在一个实施例中描述过的相同或相似的思想或过程,可能在其他某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图3示出了本申请一种音频后置滤波方法的一个可选实施方式。
在图3所示的可选实施方式中,音频后置滤波方法主要包括步骤S301,在蓝牙解码过程中,根据变换域噪声整形解码模块对当前音频数据对应码流进行解码获取的谱系数,计算谱系数对应的伪谱,获取伪谱的谱熵。
在该可选实施方式中,在蓝牙解码过程中,当对当前音频数据对应码流解码至时域噪声整形解码模块后,执行本方案的后置滤波模块,在后置滤波模块中首先对执行完时域噪声整形解码模块后获取的谱系数对应的伪谱进行计算,进而获取伪谱的谱熵。由于现有的相关技术中,通常利用傅里叶变换获取谱系数进而获取谱熵,而在蓝牙音频的编解码过程中还需要进行低延迟改进型离散余弦变换,即相当于对当前音频数据进行了两次时频变换才完成后置滤波,而本方案直接在蓝牙解码过程中,对低延迟改进型离散余弦逆变换之前的谱系数进行后置滤波,只进行一次时频变换即可完成后置滤波,极大地减少了算力,提高滤波效率。
然而利用低延迟改进型离散余弦变换获取的谱系数进行滤波的方式与利用傅里叶变换获取的谱系数进行滤波的方式不同,直接利用低延迟改进型离散余弦变换获取的谱系数计算得到的谱熵对于基音和非基音而言区分度并不是很高,使得在后续进行基音判决时容易造成误判。以正弦波为例,利用离散傅里叶变换得到的谱系数,其谱系数与正弦波的频率有较为准确的对应关系,计算得到的谱熵能较好的区分基音帧和非基音帧;而利用低延迟改进型离散余弦变换得到的谱系数,其谱系数与正弦波的频率有偏差,所以计算得到的谱熵不能很好的区分基音和非基音,所以本方案加入伪谱计算的过程,进而计算伪谱的谱熵,使得实现较好的区分基音帧和非基音帧的效果。
在本申请的一个可选实例中,将作为对当前音频数据对应的码流解码至变换域噪声整形解码模块获取的谱系数,该谱系数为:
而计算该谱系数的伪谱时,则利用公式:
其中,当k=-1或NF
其中,上式中的即为该谱系数的伪谱。
在本申请的一个可选实施例中,计算所述谱系数对应的伪谱,获取伪谱的谱熵,进一步包括:根据谱系数计算伪谱,获取伪谱对应的伪谱系数;对伪谱系数进行子带划分,获取多个子带分别对应的子带伪谱系数;根据子带伪谱系数计算谱熵。
在该可选实施例中,计算该谱系数的伪谱,获取谱系数对应的伪谱系数;对伪谱系数进行子带划分,获取子带伪谱系数,其中在对伪谱系数进行子带划分时,可进行均匀划分或根据预设间隔不均匀划分,本方案中对子带的划分方式不做具体限制,只需划分后的子带计算出的谱熵易于区分基音信号的基音信号和非基音信号即可;再利用子带伪谱系数计算谱熵,以使得计算获取的谱熵达到较好的区分基音帧和非基音帧的目的。
在本申请的一个可选实例中,当采样率为16kHz、帧长为10ms时,经变换域噪声整形解码模块输出160个谱系数,计算其对应伪谱获取伪谱系数: 此时选用平均划分子带的方式,将160个谱系数平均划分为16个子带,其中每个子带分别对应10个伪谱系数,因此得到的第一个子带的子带伪谱系数为:/>第二个子带的子带伪谱系数为:…第十六个子带的子带伪谱系数为:再根据上述的子带伪谱系数计算谱熵。
在本申请的一个可选实施例中,根据子带伪谱系数计算谱熵,进一步包括:根据子带伪谱系数分别计算每一子带的子带能量与子带总能量;根据子带能量计算子带的总能量;根据子带能量与子带总能量计算每一子带分别对应的能量概率;利用能量概率计算获取谱熵。
在本申请的一个可选实例中,根据前述获取的16个子带,分别计算每一子带的能量,其计算公式如下:
其中,上式中的SUBBAND_ENERYG(sb)为子带的能量,为该子带中的子带伪谱系数,SUBBAND_WIDTH为子带的带宽,SUBBAND_NUM为子带的数量。
再根据上述计算获取的每一子带分别对应的能量计算子带的总能量,其计算公式如下:
其中,上式中的SUBBAND_ENERGY_TOTAL为子带的总能量,SUBBAND_NUM为子带的数量,SUBBAND_ENERGY(k)为每一子带分别对应的能量。
在根据上述获取的子带的总能量计算获取每一子带分别对应的能量概率,其计算公式如下:
SUBBAND_ENERGY_PROB(k)=SUBBAND_ENERGY(k)/SUBBAND_ENERGY_TOTAL For k=1toSUBBAND_NUM
其中,上式中的SUBBAND_ENERGY_PROB(k)为每一子带分别对应的能量概
率,SUBBAND_ENERGY(k)为每一子带分别对应的能量,
SUBBAND_ENERGY_TOTAL为子带的总能量。
最后根据上述获取的子带的总能量计算获取谱熵,其计算公式如下:
其中,上式中的PSEUDO_SPEC_ENTROPY为谱熵,SUBBAND_NUM为子带的数量,SUBBAND_ENERGY_PROB(k)为每一子带分别对应的能量概率。
在图3所示的可选实施方式中,音频后置滤波方法,还包括步骤S302,对当前音频数据进行基音判决,将小于预设门限值的谱熵对应当前音频数据,判定其具有较强基音成分。
在该可选实施方式中,根据对音频的分析获知音频数据对应伪谱的谱熵在预设门限值内,此时音频数据存在较强的基音成分,表示该音频数据为语音数据或音乐数据;后置滤波的对象即为存在较强的基音成分的音频数据,而现有相关技术中的后置滤波的对象为对输入编解码器的全部音频数据,造成了数据的浪费,减缓了***的运行效率;因此本方案首先进行基音判决区别出输出入编解码器中的全部音频数据中存在较强基音成分的音频数据与不存在较强基音成分的音频数据;以便后续仅对存在较强基音成分的音频数据进行后置滤波,节省数据,加快***的运行效率。
图4示出了语音数据的语谱与谱熵的一个可选实例的示意图;
在图4中的上图为语音数据的语谱图,其中语谱图的横轴表示为时间,其单位为秒,纵轴为频率,其单位为KHZ;图4中的下图为语音数据的谱熵图,由谱熵图可知,当预设门限值为0.2时,语音数据便可区分出较强的基音成分。
在图3所示的可选实施方式中,音频后置滤波方法,还包括步骤S303,对当前音频数据进行数据种类判决,其中,当当前音频数据为语音数据时,对其进行短期后置滤波与长期后置滤波;当当前音频数据为音乐数据时,对其进行长期后置滤波。
在该可选实施方式中,由于在音频编解码器中,随着码率的降低,量化噪声会增加,从而降低音质,反之,则量化噪声会减小,主观音质增加,基于此,码率越高,后置滤波强度越低,设置与码率相关的全局后置滤波强度因子globalfac,如图5所示,当码率为最低码率时,强度最大,当码率等于或超过最高码率时,音质较好,此时强度最小;例如,配置为采样率16kHz、帧长10ms,最低码率是16kbps,最高码率为48kbps,其中最低码率由LC3规范规定,最高码率可以根据每一种配置下码率与音质的关系测定,当码率超过最高码率时,继续增加对音质无明显提升,反而造成了浪费。
而当进行语音通话时,如图6所示,图6中的上图为语音数据的时域波形图,下图为波形图对应的共振峰与基音,其中共振峰为下图中的点状物,基音为下图中的线条,由图6可知,前几个共振峰对音质贡献最大,特别是前三个,如图7的统计所示,前4个共振峰在5KHz以下,基于此,设置短期后置滤波强度因子shortfac,主要增强5kHz以下共振峰。
基于上述的分析可知,对应不同的音频数据应该采取不同的后置滤波方式,以使得后置滤波的效果得到充分的实现。
在本申请的一个可选实施例中,对当前音频数据进行短期后置滤波,进一步包括:对谱系数进行子带划分,获取多个子带分别对应的子带谱系数;根据子带谱系数计算子带的平均能量幅度;根据平均能量幅度计算子带的短期增益;根据短期增益对当前音频数据进行后置滤波。
在该可选实施例中,将根据前述获取的每帧L个MDCT谱系数分为M个子带,每个子带N个谱系数,并计算每个子带的平均能量幅度;其计算公式如下:
其中上式中的Ampave(j)为每个子带的平均能量幅度,Ampmax为平均幅度最大值。
再根据上述计算获取的平均能量幅度与平均幅度最大值计算每一子带的短期增益,其计算公式如下:
其中,上式中的gainshort(j)为子带的短期增益,Ampave(j)为每个子带的平均能量幅度,Ampmax为平均幅度最大值,shortfac为短期后置滤波强度因子。
最后根据上述获取的短期增益进行后置滤波。
在本申请的一个可选实施例中,对当前音频数据进行长期后置滤波,进一步包括:对谱系数进行子带划分,获取多个子带分别对应的子带谱系数;计算子带的长期增益;根据长期增益对当前音频数据进行后置滤波。
在该可选实施例中,根据前述获取的每帧L个MDCT谱系数分为M个子带,每个子带N个谱系数,计算每一子带的长期增益用以抑制谱峰之间的噪声,其计算公式如下:
其中,
其中,上式中的gainlong(j,k)为每一子带的长期增益,longfac为长期后置滤波强度因子。再根据上述获取的长期增益进行后置滤波。
在本申请的一个可选实施例中,对当前音频数据进行短期后置滤波与长期后置滤波,进一步包括:对谱系数进行子带划分,获取多个子带分别对应的子带谱系数;根据子带谱系数计算子带的平均能量幅度;根据平均能量幅度计算子带的短期增益,并计算子带的长期增益;根据短期增益与长期增益,对当前音频数据进行后置滤波。
在该可选实施例中,根据前述获取的每帧L个MDCT谱系数分为M个子带,每个子带N个谱系数;根据前述的计算方式分别计算子带的短期增益与长期增益;再将短期增益与长期增益合并,使得对该音频数据的滤波效果更加高效,获取滤波后的谱系数,以完成后续的编解码步骤;其中短期增益与长期增益合并执行的公式为:
其中,上式中的globalfac(j,k)为长期后置滤波强度因子,gainshaort(j)为每一子带的短期增益,gainlong(j,k)为每一子带的长期增益,为滤波后的谱系数。
在本申请的一个可选实施例中,音频后置滤波方法还包括:根据预设能量调节因子,对经后置滤波的当前音频数据对应能量进行调节。
在该可选实施例中,为确保滤波前后的能量基本一致,在滤波完成之后对滤波后的谱系数进行能量调节,其计算公式为:
其中,gainadj是能量调节因子,计算方法为:
图8示出了本申请一种音频后置滤波装置的可选实施方式。
在图8所示的可选实施方式中,音频后置滤波装置主要包括:谱熵计算模块801,其用于在蓝牙解码过程中,根据变换域噪声整形模块对当前音频数据对应码流进行解码获取的谱系数,计算谱系数对应的伪谱,获取伪谱的谱熵;基音判决模块802,其用于对当前音频数据进行基音判决,将小于预设门限值的谱熵对应当前音频数据,判定其具有较强基音成分;滤波类型判决模块803,其用于对当前音频数据进行数据种类判决,其中,当当前音频数据为语音数据时,对其进行短期后置滤波与长期后置滤波,当当前音频数据为音乐数据时,对其进行长期后置滤波。
在本申请的一个可选实施例中,本申请一种音频后置滤波装置中各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
本申请提供的音频后置滤波装置,可用于执行上述任一实施例描述的音频后置滤波方法,其实现原理和技术效果类似,在此不再赘述。
在本申请的另一个可选实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令***作以执行上述实施例中描述的音频后置滤波方法。
在本申请的一个可选实施方式中,一种计算机设备,其包括:至少一个处理器;以及与至少一个处理器进行通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的计算机指令,至少一个处理器操作计算机指令以执行上述实施例中描述的音频后置滤波方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种音频后置滤波方法,其特征在于,包括:
在蓝牙解码过程中,根据变换域噪声整形模块对当前音频数据对应码流进行解码获取的谱系数,计算所述谱系数对应的伪谱,获取所述伪谱的谱熵;
对所述当前音频数据进行基音判决,将小于预设门限值的所述谱熵对应的所述当前音频数据,判定为具有较强基音成分;
对具有较强基音成分的所述当前音频数据进行数据种类判决,其中,
当具有较强基音成分的所述当前音频数据为语音数据时,对其进行短期后置滤波与长期后置滤波,
当具有较强基音成分的所述当前音频数据为音乐数据时,对其进行长期后置滤波。
2.根据权利要求1所述的音频后置滤波方法,其特征在于,所述计算所述谱系数对应的伪谱,获取所述伪谱的谱熵,进一步包括:
根据所述谱系数计算所述伪谱,获取所述伪谱对应的伪谱系数;
对所述伪谱系数进行子带划分,获取多个所述子带分别对应的子带伪谱系数;
根据所述子带伪谱系数计算所述谱熵。
3.根据权利要求2所述的音频后置滤波方法,其特征在于,所述根据所述子带伪谱系数计算所述谱熵,进一步包括:
根据所述子带伪谱系数分别计算每一所述子带的子带能量与子带总能量;
根据所述子带能量计算所述子带的总能量;
根据所述子带能量与所述子带总能量计算每一所述子带分别对应的能量概率;
利用所述能量概率计算获取所述谱熵。
4.根据权利要求1所述的音频后置滤波方法,其特征在于,对具有较强基音成分的所述当前音频数据进行短期后置滤波,进一步包括:
对所述谱系数进行子带划分,获取多个所述子带分别对应的子带谱系数;
根据所述子带谱系数计算所述子带的平均能量幅度;
根据所述平均能量幅度计算所述子带的短期增益;
根据所述短期增益对具有较强基音成分的所述当前音频数据进行后置滤波。
5.根据权利要求1所述的音频后置滤波方法,其特征在于,对具有较强基音成分的所述当前音频数据进行长期后置滤波,进一步包括:
对所述谱系数进行子带划分,获取多个所述子带分别对应的子带谱系数;
计算所述子带的长期增益;
根据所述长期增益对具有较强基音成分的所述当前音频数据进行后置滤波。
6.根据权利要求1所述的音频后置滤波方法,其特征在于,对具有较强基音成分的所述当前音频数据进行短期后置滤波与长期后置滤波,进一步包括:
对所述谱系数进行子带划分,获取多个所述子带分别对应的子带谱系数;
根据所述子带谱系数计算所述子带的平均能量幅度;
根据所述平均能量幅度计算所述子带的短期增益,并计算所述子带的长期增益;
根据所述短期增益与所述长期增益,对具有较强基音成分的所述当前音频数据进行后置滤波。
7.根据权利要求4-6任一项所述的音频后置滤波方法,其特征在于,还包括:
根据预设能量调节因子,对经后置滤波的具有较强基音成分的所述当前音频数据对应能量进行调节。
8.一种音频后置滤波装置,其特征在于,包括:
谱熵计算模块,其用于在蓝牙解码过程中,根据变换域噪声整形模块对当前音频数据对应码流进行解码获取的谱系数,计算所述谱系数对应的伪谱,获取所述伪谱的谱熵;
基音判决模块,其用于对所述当前音频数据进行基音判决,将小于预设门限值的所述谱熵对应的所述当前音频数据,判定为具有较强基音成分;
滤波类型判决模块,其用于对具有较强基音成分的所述当前音频数据进行数据种类判决,其中,
当具有较强基音成分的所述当前音频数据为语音数据时,对其进行短期后置滤波与长期后置滤波,
当具有较强基音成分的所述当前音频数据为音乐数据时,对其进行长期后置滤波。
9.一种计算机可读存储介质,其存储有计算机指令,其特征在于,所述计算机指令***作以执行权利要求1-7中任一项所述的音频后置滤波方法。
10.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器进行通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机指令,所述至少一个处理器操作所述计算机指令以执行如权利要求1-7任一项所述的音频后置滤波方法。
CN202210819985.5A 2022-07-11 2022-07-11 一种音频后置滤波方法、装置、存储介质及设备 Active CN115188388B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210819985.5A CN115188388B (zh) 2022-07-11 2022-07-11 一种音频后置滤波方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210819985.5A CN115188388B (zh) 2022-07-11 2022-07-11 一种音频后置滤波方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN115188388A CN115188388A (zh) 2022-10-14
CN115188388B true CN115188388B (zh) 2024-05-17

Family

ID=83519983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210819985.5A Active CN115188388B (zh) 2022-07-11 2022-07-11 一种音频后置滤波方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN115188388B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0950298A (ja) * 1995-08-07 1997-02-18 Mitsubishi Electric Corp 音声符号化装置及び音声復号化装置
JP2004302257A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 長期ポストフィルタ
JP2004355020A (ja) * 2004-08-16 2004-12-16 Fujitsu Ltd 音声符号化装置及びその方法
CN101622668A (zh) * 2007-03-02 2010-01-06 艾利森电话股份有限公司 电信网络中的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0950298A (ja) * 1995-08-07 1997-02-18 Mitsubishi Electric Corp 音声符号化装置及び音声復号化装置
JP2004302257A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 長期ポストフィルタ
JP2004355020A (ja) * 2004-08-16 2004-12-16 Fujitsu Ltd 音声符号化装置及びその方法
CN101622668A (zh) * 2007-03-02 2010-01-06 艾利森电话股份有限公司 电信网络中的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于G.729协议的算法优化及仿真实现研究;孙宏斌;杨艺山;;计算机仿真;20060328(第03期);全文 *

Also Published As

Publication number Publication date
CN115188388A (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
Shrawankar et al. Techniques for feature extraction in speech recognition system: A comparative study
RU2734781C1 (ru) Устройство для постобработки звукового сигнала с использованием выявления места всплеска
US8244526B2 (en) Systems, methods, and apparatus for highband burst suppression
KR101266894B1 (ko) 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법
CN103477386B (zh) 音频编解码器中的噪声产生
CN106910509B (zh) 用于修正通用音频合成的设备及其方法
CN103854662A (zh) 基于多域联合估计的自适应语音检测方法
WO2014177084A1 (zh) 激活音检测方法和装置
Chen et al. Improved voice activity detection algorithm using wavelet and support vector machine
EP2888734A1 (en) Audio classification based on perceptual quality for low or medium bit rates
US11562756B2 (en) Apparatus and method for post-processing an audio signal using prediction based shaping
CN112309422B (zh) 对音频信号中的噪声进行估计的方法和装置以及传输音频信号的装置和***
CN112599140B (zh) 一种优化语音编码速率和运算量的方法、装置及存储介质
JP5291004B2 (ja) 通信ネットワークにおける方法及び装置
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy
CN115188388B (zh) 一种音频后置滤波方法、装置、存储介质及设备
CN112951251A (zh) 一种lc3音频混合方法、装置及存储介质
CN115966218A (zh) 一种骨导辅助的气导语音处理方法、装置、介质及设备
CN114566174B (zh) 一种优化语音编码的方法、装置、***、介质及设备
CN116978391A (zh) 音频编码方法、***、编码器、介质及设备
CN116504256A (zh) 一种语音编码方法、装置、介质、设备和程序产品
CN116884423A (zh) 混响检测与抑制方法、***、介质及设备
CN115035908A (zh) 基于深度学习的语音频带扩展方法、装置及编码方法
Laska et al. Subband autoregressive modelling for speech enhancement
Jung et al. Speech enhancement by overweighting gain with nonlinear structure in wavelet packet transform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: A1009, floor 9, block a, No. 9, Shangdi Third Street, Haidian District, Beijing 100085

Applicant after: Beijing Bairui Internet Technology Co.,Ltd.

Address before: A1009, floor 9, block a, No. 9, Shangdi Third Street, Haidian District, Beijing 100085

Applicant before: BARROT WIRELESS Co.,Ltd.

Country or region before: China

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant