CN109147795A - 声纹数据传输、识别方法、识别装置和存储介质 - Google Patents

声纹数据传输、识别方法、识别装置和存储介质 Download PDF

Info

Publication number
CN109147795A
CN109147795A CN201810886676.3A CN201810886676A CN109147795A CN 109147795 A CN109147795 A CN 109147795A CN 201810886676 A CN201810886676 A CN 201810886676A CN 109147795 A CN109147795 A CN 109147795A
Authority
CN
China
Prior art keywords
frequency domain
data
segmentation
voice print
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810886676.3A
Other languages
English (en)
Other versions
CN109147795B (zh
Inventor
程衎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Allwinner Technology Co Ltd
Original Assignee
Allwinner Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Allwinner Technology Co Ltd filed Critical Allwinner Technology Co Ltd
Priority to CN201810886676.3A priority Critical patent/CN109147795B/zh
Publication of CN109147795A publication Critical patent/CN109147795A/zh
Application granted granted Critical
Publication of CN109147795B publication Critical patent/CN109147795B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Facsimiles In General (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种声纹数据传输、识别方法、识别装置和存储介质,传输方法包括:将声纹数据在时域上分成多个分段时域数据;提取各个分段时域数据在目标频域上的分段频域数据;将每个分段频域数据分别在不同传输频域上进行传输。由于声纹数据的频点信息主要集中在目标频域上,故只需要对目标频域的数据进行传输即可,而非目标频域的数据则不传送,并且利用非目标频域的频域进行其他分段频域数据的传输,首先将声纹数据在时域上分成多个分段时域数据,再将每个分段时域数据提取目标频域的分段频域数据,最后将分段频域数据分别在不同传输频域上进行传输,复用各个频段中,从而将字符串分割成多段在全频域并行输出,达到减少数据传输时间的目的。

Description

声纹数据传输、识别方法、识别装置和存储介质
技术领域
本发明涉及声纹识别领域,尤其涉及一种声纹数据传输方法、声纹数据识别方法、声纹数据识别装置和可读存储介质。
背景技术
人耳能识别的声音的频率范围大致为20Hz至20000Hz。低频部分为20Hz至200Hz,中频部分为500Hz至2kHz,高频部分为2kHz至20kHz。
噪音是指现实生活中,物体自发地,或者互动地,发生碰撞、压缩等等相互作用,而导致的连续的不规则的声音。噪音在每个频段都有出现,其中大致分为低频和高频噪音,由于波长原因,低频噪音波长长,在现实中获中大幅存在,并且穿透性很强,轻易刻录下来的数据中在低频部分会有大量不规则的能量存在。相反,高频噪音由于其波长很短,穿透性差,一般每隔10米就会下降6db,在录音中一般很少存在高频的噪音。
对于声纹识别技术,一段明文密码,通常用一组字符串表达,字符串的元素为8bit字符,有256种可能。每一种可能我们可以在一个频段中用256个单频tone之一表示,如此达到一一对应进行无损还原。
但是在实践中,本技术综合考虑计算精度和运算效能的限制,基于256=16x 16,一个字符我们分两次进行解码,这样每次解码的1/2个字符可以从16个点中还原,从而在同样的频域分辨率的情况下,可容许的误差被更多的释放出来,由于精度问题导致的误码率大大降低。
对于RS编码,RS码又称里所码,即Reed-solomon codes,是一种前向纠错的信道编码,对由校正过采样数据所产生的多项式有效。当接收器正确的收到足够的点后,它就可以恢复原来的多项式,即使接收到的多项式上有很多点被噪声干扰失真。
为保证编码出来的频点能量饱和且易识别,一般编码的音频帧长度大概在60-80ms。一个字符包含两个音频帧。以长度为20的字符串为例,其编码的pcm数据传输时间大约在2.5-3s之间,时间略长。加上RS编码的存在,实际输出字符串长度可能有一定溢出,则传输耗时更久。
发明内容
本发明的第一目的是提供一种减少数据传输时间的声纹数据传输方法。
本发明的第二目的是提供一种减少数据传输时间的声纹数据识别方法。
本发明的第三目的是提供一种减少数据传输时间的声纹数据识别装置。
本发明的第四目的是提供一种减少数据传输时间的可读存储介质。
为了实现本发明的第一目的,本发明提供一种多频复用声纹传输方法,包括:
将声纹数据在时域上分成多个分段时域数据;
提取各个分段时域数据在目标频域上的分段频域数据;
将每个分段频域数据分别在不同传输频域上进行传输。
由上述方案可见,由于声纹数据的频点信息主要集中在目标频域上,故只需要对目标频域的数据进行传输即可,而非目标频域的数据则不传送,并且利用非目标频域的频域进行其他分段频域数据的传输,具体地,首先将声纹数据在时域上分成多个分段时域数据,再将每个分段时域数据提取目标频域的分段频域数据,最后将分段频域数据分别在不同传输频域上进行传输,复用各个频段中,从而将字符串分割成多段在全频域并行输出,达到减少数据传输时间的目的。
更进一步的方案是,将每个分段频域数据分别在不同传输频域上进行传输的步骤包括:
第一分段频域数据在第一传输频域进行传输,第一传输频域与目标频域相同。
由上可见,第一传输频域与目标频域相同时,则数据不需要进行频谱搬移,提取目标频域的数据后便可直接在目标频域进行数据传输。
更进一步的方案是,将每个分段频域数据分别在不同传输频域上进行传输的步骤还包括:
第二分段频域数据依次进行多倍下采样、多倍插值上采样、位于第二分段频域上的带通滤波;
将第二分段频域数据在第二传输频域上进行传输,第一传输频域不同于第二传输频域。
更进一步的方案是,将每个分段频域数据分别在不同传输频域上进行传输的步骤还包括:
第三分段频域数据依次进行多倍下采样、多倍插值上采样、位于第三分段频域上的带通滤波;
将第三分段频域数据在第三传输频域上进行传输,第一传输频域、第二传输频域和第三传输频域均相互不相同。
由上可见,对于第二分段频域数据和第三分段频域数据进行频谱搬移,通过多倍下采样、多倍插值上采样、相应带通滤波后,分别在第二传输频域和第三传输频域传输,使得声纹数据在全频域并行输出,达到减少数据传输时间的目的。
更进一步的方案是,目标频域为0Khz至7.5Khz之间。
更进一步的方案是,传输频域分成W1频域、W2频域和W3频域;
W1频域为0Khz至7.5Khz之间;
W2频域为7.5Khz至15Khz之间
W3频域为15Khz至22Khz之间。
由上可见,声纹数据的频点信息主要集中在0Khz至7.5Khz中,故主要对目标频域的数据进行传输即可,而可将声纹数据在时域上分割成三份,继而提取目标频域上的数据,最后在三个传输频域进行传输,从而实现提高传输速度。
为了实现本发明的第二目的,本发明提供一种多频复用声纹数据识别方法,包括声纹数据传输步骤和解码识别步骤;
声纹数据传输步骤采用上述方案中的声纹传输方法的步骤;
对多个分段频域数据进行解码和声纹识别。
为了实现本发明的第三目的,本发明提供一种多频复用声纹数据识别装置,声纹识别装置包括处理器,处理器用于执行存储器中存储的计算机程序时实现上述声纹识别方法的步骤。
为了实现本发明的第四目的,本发明提供一种可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述声纹识别方法的步骤。
由上可见,利用上述高效的声纹数据传输方法,在解码后便可实现快速、稳定的声纹识别。
附图说明
图1是本发明多频复用声纹数据传输方法实施例的流程图。
图2是频-半符号索引映射表。
图3是本发明多频复用声纹数据传输方法实施例中数据频谱搬移的流程图。
图4是本发明多频复用声纹数据传输方法实施例中第二分段时域数据的频谱图。
图5是本发明多频复用声纹数据传输方法实施例中提取W1频域的数据示意图。
图6是本发明多频复用声纹数据传输方法实施例中进行三倍下采样的示意图。
图7是本发明多频复用声纹数据传输方法实施例中进行三倍插值上采样的示意图。
图8是本发明多频复用声纹数据传输方法实施例中通过第二传输频域的带通滤波器的示意图。
以下结合附图及实施例对本发明作进一步说明。
具体实施方式
参照图1,首先执行步骤S1,接收声纹数据(PCM数据),PCM数据切割,在时域上分成N等分成{PCMi}|1≤i≤N,在本实施例中数据分成三份,即将声纹数据在时域上分成多个分段时域数据并得出第一分段时域数据PCM1、第二分段时域数据PCM2和第二分段时域数据PCM3。
随后执行步骤S2,将W频域范围也N等分成{Wi}|1≤i≤N,在本实施例中,频域范围分三份,以频响W=(0,22Khz),N=3为例。
W被分割为W1=(0Khz,7.5Khz),W2=(7.5khz,15khz),W3=(15khz,22khz)。
从图2中的频-半符号索引映射表可知,Pcmi的频点信息Ii集中在中W1。故本案主要传输W1频域的声纹数据。分别提取PCM1、PCM2和PCM3数据在W1频域上的数据,提取数据的方式是分别通过W1、W2、W3的带通滤波器,继而得出第一分段频域数据PCM1-W1、第二分段频域数据PCM2-W1、第三分段频域数据PCM3-W1。
随后执行步骤S31,将第一分段频域数据PCM1-W1在第一传输频域W1进行传输。
执行步骤S32,对第二分段频域数据PCM2-W1进行频谱搬移,参照图3和图4,图4表示第二分段时域数据PCM2的频谱图,而阴影部分是W1频域的频域数据,这部分是需要进行传输,参照图5,将PCM2数据通过滤波器Filter1,滤波器Filter1是位于W1频域的带通滤波器,通过滤波器的滤波得出第一分段频域数据PCM1-W1为Pcm2-Filter1。
随后执行步骤S321并参照图6,将Pcm2-Filter1三倍下采样,得Pcm2-Filter1-d3samp。
然后执行步骤S322,并照图7,将Pcm2-Filter1-d3samp三倍插值上采样,得Pcm2-Filter1-d3samp-u3samp。
随后执行步骤S323,并照图8,Pcm2-Filter1-d3samp-u3samp过带通滤波器Filter2,带通滤波器Filter2为位于W2频域的带通滤波器,得Pcm2-Filter1-d3samp-u3samp-Filter2。如此,Pcm2通过上述处理,W1频段被搬移到了W2(以共轭倒相的形式存在),输出了Pcm2-Filter1-d3samp-u3samp-Filter2,执行步骤S324,使得第二分段频域数据PCM2-W1在第一传输频域W2进行传输。
执行步骤S33,对于Pcm3,同种方法生成Pcm3-Filter1-d3samp-u3samp-Filter3,即第三分段频域数据依次进行多倍下采样、多倍插值上采样、位于第三分段频域上的带通滤波,继而将所述第三分段频域数据在第三传输频域上进行传输。
最后执行步骤S4,Mix合成最终输出信号,
本方法可将声纹识别传输时间减少至原有时间的N分之一。
在本实施例外,声纹数据可以分成多分进行传输,即每个Pcmi生成Pcmi-Filter1-d3samp-u3samp-Filteri,Pcmi-W1被分别搬移到Wn上进行传输。
声纹识别模块接收到上述传输的数据后,可对多个分段频域数据进行解码和声纹识别。
一种多频复用声纹数据识别装置,声纹识别装置包括处理器,处理器用于执行存储器中存储的计算机程序时实现如上述声纹识别方法的步骤。
一种可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述声纹识别方法的步骤。
由上可见,由于声纹数据的频点信息主要集中在目标频域上,故只需要对目标频域的数据进行传输即可,而非目标频域的数据则不传送,并且利用非目标频域的频域进行其他分段频域数据的传输,具体地,首先将声纹数据在时域上分成多个分段时域数据,再将每个分段时域数据提取目标频域的分段频域数据,最后将分段频域数据分别在不同传输频域上进行传输,复用各个频段中,从而将字符串分割成多段在全频域并行输出,达到减少数据传输时间的目的。

Claims (9)

1.一种多频复用声纹传输方法,其特征在于,包括:
将声纹数据在时域上分成多个分段时域数据;
提取各个所述分段时域数据在目标频域上的分段频域数据;
将每个所述分段频域数据分别在不同传输频域上进行传输。
2.根据权利要求1所述的声纹传输方法,其特征在于:
将每个所述分段频域数据分别在不同传输频域上进行传输的步骤包括:
第一分段频域数据在第一传输频域进行传输,所述第一传输频域与所述目标频域相同。
3.根据权利要求2所述的声纹传输方法,其特征在于:
将每个所述分段频域数据分别在不同传输频域上进行传输的步骤还包括:
第二分段频域数据依次进行多倍下采样、多倍插值上采样、位于第二分段频域上的带通滤波;
将所述第二分段频域数据在第二传输频域上进行传输,所述第一传输频域不同于所述第二传输频域。
4.根据权利要求3所述的声纹传输方法,其特征在于:
将每个所述分段频域数据分别在不同传输频域上进行传输的步骤还包括:
第三分段频域数据依次进行多倍下采样、多倍插值上采样、位于第三分段频域上的带通滤波;
将所述第三分段频域数据在第三传输频域上进行传输,所述第一传输频域、所述第二传输频域和所述第三传输频域均相互不相同。
5.根据权利要求1至4任一项所述的声纹传输方法,其特征在于:
所述目标频域为0Khz至7.5Khz之间。
6.根据权利要求5所述的声纹传输方法,其特征在于:
所述传输频域分成W1频域、W2频域和W3频域;
所述W1频域为0Khz至7.5Khz之间;
所述W2频域为7.5Khz至15Khz之间
所述W3频域为15Khz至22Khz之间。
7.一种多频复用声纹数据识别方法,其特征在于,包括声纹数据传输步骤和解码识别步骤;
所述声纹数据传输步骤采用上述权利要求1至6任一项所述的声纹传输方法的步骤;
对多个所述分段频域数据进行解码和声纹识别。
8.一种多频复用声纹数据识别装置,其特征在于,所述声纹识别装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求7中所述声纹识别方法的步骤。
9.可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求7中所述声纹识别方法的步骤。
CN201810886676.3A 2018-08-06 2018-08-06 声纹数据传输、识别方法、识别装置和存储介质 Active CN109147795B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810886676.3A CN109147795B (zh) 2018-08-06 2018-08-06 声纹数据传输、识别方法、识别装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810886676.3A CN109147795B (zh) 2018-08-06 2018-08-06 声纹数据传输、识别方法、识别装置和存储介质

Publications (2)

Publication Number Publication Date
CN109147795A true CN109147795A (zh) 2019-01-04
CN109147795B CN109147795B (zh) 2021-05-14

Family

ID=64791916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810886676.3A Active CN109147795B (zh) 2018-08-06 2018-08-06 声纹数据传输、识别方法、识别装置和存储介质

Country Status (1)

Country Link
CN (1) CN109147795B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114023329A (zh) * 2021-10-13 2022-02-08 南京龙垣信息科技有限公司 跨信道声纹比对方法、***、计算机设备及存储介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1983914A (zh) * 2005-12-16 2007-06-20 株式会社Ntt都科摩 一种混合自动请求重传方法及***
CN101425858A (zh) * 1994-03-31 2009-05-06 塞里迪安公司阿比特龙分公司 用来把码包括到音频信号中并且解码的设备和方法
CN102150207A (zh) * 2008-07-24 2011-08-10 Dts(英属维尔京群岛)有限公司 通过二维变换压缩音频比例因子
CN102356427A (zh) * 2009-04-02 2012-02-15 三菱电机株式会社 噪声抑制装置
CN103646649A (zh) * 2013-12-30 2014-03-19 中国科学院自动化研究所 一种高效的语音检测方法
CN103730131A (zh) * 2012-10-12 2014-04-16 华为技术有限公司 语音质量评估的方法和装置
CN104242871A (zh) * 2013-06-14 2014-12-24 中国科学院声学研究所 一种基于嵌套阵的多倍频程恒等束宽波束形成方法及***
CN105162569A (zh) * 2015-08-21 2015-12-16 广州丰谱信息技术有限公司 一种异步双工零射频无线通信***
CN105790889A (zh) * 2016-02-23 2016-07-20 北京杰睿中恒科技有限公司 基于正交频分复用的数据传输方法和装置、抄表***
CN106059706A (zh) * 2016-05-24 2016-10-26 广东电网有限责任公司信息中心 一种混合声波录音屏蔽器
CN106160937A (zh) * 2015-04-15 2016-11-23 中兴通讯股份有限公司 一种实现码块分割的方法及装置
CN106788734A (zh) * 2016-12-09 2017-05-31 上海交通大学 一种采用无数据辅助频偏估计算法的光ofdm***
CN107994921A (zh) * 2017-11-27 2018-05-04 上海航天测控通信研究所 高动态低信噪比环境下的信号捕获方法
CN108063661A (zh) * 2017-12-20 2018-05-22 珠海全志科技股份有限公司 基于曼彻斯特编码的采样电路和接收电路
CN108303717A (zh) * 2018-01-08 2018-07-20 中国科学院光电研究院 一种复合载波导航信号高动态精捕获方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101425858A (zh) * 1994-03-31 2009-05-06 塞里迪安公司阿比特龙分公司 用来把码包括到音频信号中并且解码的设备和方法
CN1983914A (zh) * 2005-12-16 2007-06-20 株式会社Ntt都科摩 一种混合自动请求重传方法及***
CN102150207A (zh) * 2008-07-24 2011-08-10 Dts(英属维尔京群岛)有限公司 通过二维变换压缩音频比例因子
CN102356427A (zh) * 2009-04-02 2012-02-15 三菱电机株式会社 噪声抑制装置
CN103730131A (zh) * 2012-10-12 2014-04-16 华为技术有限公司 语音质量评估的方法和装置
CN104242871A (zh) * 2013-06-14 2014-12-24 中国科学院声学研究所 一种基于嵌套阵的多倍频程恒等束宽波束形成方法及***
CN103646649A (zh) * 2013-12-30 2014-03-19 中国科学院自动化研究所 一种高效的语音检测方法
CN106160937A (zh) * 2015-04-15 2016-11-23 中兴通讯股份有限公司 一种实现码块分割的方法及装置
CN105162569A (zh) * 2015-08-21 2015-12-16 广州丰谱信息技术有限公司 一种异步双工零射频无线通信***
CN105790889A (zh) * 2016-02-23 2016-07-20 北京杰睿中恒科技有限公司 基于正交频分复用的数据传输方法和装置、抄表***
CN106059706A (zh) * 2016-05-24 2016-10-26 广东电网有限责任公司信息中心 一种混合声波录音屏蔽器
CN106788734A (zh) * 2016-12-09 2017-05-31 上海交通大学 一种采用无数据辅助频偏估计算法的光ofdm***
CN107994921A (zh) * 2017-11-27 2018-05-04 上海航天测控通信研究所 高动态低信噪比环境下的信号捕获方法
CN108063661A (zh) * 2017-12-20 2018-05-22 珠海全志科技股份有限公司 基于曼彻斯特编码的采样电路和接收电路
CN108303717A (zh) * 2018-01-08 2018-07-20 中国科学院光电研究院 一种复合载波导航信号高动态精捕获方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHAO, HA等: "A Cyber Voice Recognition with Low SNR", 《 14TH IEEE INTL CONF ON DEPENDABLE, AUTONOMIC AND SECURE COMP》 *
曾锦华等: "数字录音真实性司法鉴定研究现状", 《中国司法鉴定》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114023329A (zh) * 2021-10-13 2022-02-08 南京龙垣信息科技有限公司 跨信道声纹比对方法、***、计算机设备及存储介质

Also Published As

Publication number Publication date
CN109147795B (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
AU2022204314B2 (en) Method and apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
US11227612B2 (en) Audio frame loss and recovery with redundant frames
IL271502A (en) Adaptive processing with multiple media processor nodes
JP6364518B2 (ja) オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置
KR101764926B1 (ko) 음향 통신을 위한 장치 및 방법
JP5162588B2 (ja) 音声符号化システム
CN105009209A (zh) 用于降低时域解码器中的量化噪声的装置和方法
HUE026649T2 (en) Procedure, computer program and apparatus for detecting a signal with a water signal and decoding speech or audio signal
EP2439737A1 (en) Compression coding and decoding method, coder, decoder and coding device
KR102038077B1 (ko) 음성 복호 장치, 음성 부호화 장치, 음성 복호 방법, 음성 부호화 방법, 음성 복호 프로그램, 및 음성 부호화 프로그램
JP2018200488A (ja) 符号化方法、復号化方法、符号化装置及び復号化装置
RU2702265C1 (ru) Способ и устройство обработки сигналов
JP4033840B2 (ja) 音声ミキシング方法、音声ミキシング装置、音声ミキシングプログラム及びこれを記録した記録媒体
CN105264596A (zh) 用于码激励线性预测类编码器的无边信息的噪声填充
EP4394765A1 (en) Audio encoding and decoding method and apparatus, electronic device, computer readable storage medium, and computer program product
JP4512016B2 (ja) ステレオ信号符号化装置、ステレオ信号符号化方法、プログラム及び記録媒体
CN101127213A (zh) 音频编码***
CN106233112A (zh) 信号编码方法和设备以及信号解码方法和设备
CN101290774B (zh) 音频编码和解码***
US9640185B2 (en) Method and apparatus for enhancing the modulation index of speech sounds passed through a digital vocoder
CN109147795A (zh) 声纹数据传输、识别方法、识别装置和存储介质
WO2015196835A1 (zh) 编解码方法、装置及***
KR20110018108A (ko) 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
Joseph et al. Wavelet energy based voice activity detection and adaptive thresholding for efficient speech coding
EP2447943A1 (en) Coding method, decoding method, and device and program using the methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant