CN104078049B - 信号处理设备和信号处理方法 - Google Patents

信号处理设备和信号处理方法 Download PDF

Info

Publication number
CN104078049B
CN104078049B CN201410042005.0A CN201410042005A CN104078049B CN 104078049 B CN104078049 B CN 104078049B CN 201410042005 A CN201410042005 A CN 201410042005A CN 104078049 B CN104078049 B CN 104078049B
Authority
CN
China
Prior art keywords
signal
frame
word speed
domain
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410042005.0A
Other languages
English (en)
Other versions
CN104078049A (zh
Inventor
远藤香绪里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN104078049A publication Critical patent/CN104078049A/zh
Application granted granted Critical
Publication of CN104078049B publication Critical patent/CN104078049B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本发明涉及信号处理设备和信号处理方法。一种将接收语音信号的频域信号的帧馈送给声学回声消除器的信号处理设备包括:第一接收部,其接收进行语速改变处理之前的频域中的接收语音信号的帧;第二接收部,其接收以帧为单位进行了所述语速改变处理后的时域中的信号的帧;以及频域帧合成部,其基于所述信号处理设备当前正在处理的帧处的进行了所述语速改变处理后的时域信号以及与进行了所述语速改变处理后的时域信号对应的频域中的所述接收语音信号的帧,合成所述接收语音信号的频域信号帧。

Description

信号处理设备和信号处理方法
技术领域
本文的公开总体涉及一种信号处理设备和信号处理方法。
背景技术
用于电话呼叫的全双工收发器(例如,电话)包括麦克风和扬声器。在这种情况下,如果麦克风拾取从扬声器输出的声音并且经由网络从扬声器输出该声音,则可能产生回声。这种类型的回声称为“声学回声(sound echo)”。避免声学回声的处理称为“声学回声消除”。用于管理声学回声消除处理的处理部称为“声学回声消除器”。
如果用通常的固定电话或蜂窝电话使用免提功能,则从扬声器到麦克风的声反馈更大。因此,为了实现清晰的电话呼叫,非常重要的是执行声学回声消除。在电话会议***等中同样如此。通常的固定电话或蜂窝电话的平常使用也会发生从扬声器到麦克风的声反馈。因此,执行声学回声消除是重要的。
声学回声消除的方法包括在时域中处理语音信号的方法、通过将语音信号变换成频域中的信号来处理语音信号的方法等。对于如今的电话而言很普遍的是通过AD转换器将麦克风所检测的语音信号变换成数字信号以进行数字信号处理。在这种情况下,声学回声消除器通常使用通过将时域中的数字信号变换到频域而获得的信号。
另外,存在安装有语速(rate-of-speech)改变功能的电话,该语速改变功能在保持音调的同时将电话呼叫伙伴的语音的再现速度改变得更慢或更快。当用于电话呼叫时,语速改变功能主要用于使语音的速度变慢以使得更容易听见电话呼叫伙伴的语音。
从以上可以看出,电话需要时域以及频域中的多个处理。在许多情况下,以帧为单位进行数字信号处理,其中帧包括数字信号的多个采样值。广泛使用的基于帧的数字信号处理包括将时域中的信号的帧变换为频域中的信号的帧的时频变换以及将频域中的信号的帧变换为时域中的信号的帧的频时变换。
图1示出电话的功能框图的示例。接收语音信号100是接收语音信号的频域中的信号,可对其进行包括AGC处理、降噪处理、语音着重处理等等(未示出)的处理。
频时变换部110将频域中的接收语音信号100变换成时域中的信号111,并将其馈送给语速改变部112。语速改变部112对时域中的信号111进行语速改变处理,将时域中的语速改变之后的信号113输出给扬声器114和时频变换部108。
时频变换部108将时域中的语速改变之后的信号113变换为频域中的信号109A,并将其馈送给声学回声消除器106。
从扬声器114输出的模拟声音信号120通过空气和电话的壳体到达麦克风102。麦克风102将来自扬声器114的模拟声音信号120的一部分变换成时域中的数字发送语音信号103。这里,为了简单起见,AD转换器、DA转换器、放大器等未示出。
时频变换部104将时域中的发送语音信号103变换为频域中的发送语音信号105,并将其馈送给声学回声消除器106。
这里,存在从语速改变部112开始经由扬声器114、麦克风102和时频变换部104到声学回声消除器106的信号传输路径所特定的传输特性。频域中的发送语音信号105的来源是与受所述传输特性影响的信号混合的时域中的语速改变之后的信号113。所述混合信号是声学回声的原因。
声学回声消除器106例如处理频域中的发送语音信号105,以基于所述传输特性利用频域中的信号109A和频域中的自适应滤波器(未示出)消除混合信号。该处理抑制声学回声的产生。声学回声消除器106输出抑制了声学回声的频域中的发送语音信号130。
这里,存在这样一种技术,其提供用于改变经由电话通信信道发送的电话呼叫伙伴的语音信号的时间轴的语速改变部以及用于删除侧音信号(回声)的回声消除器部,其中通过设置在语速改变部的前一级处的回声消除器部来移除侧音,以使得侧音不会到达语速改变部,以防止进行了语速改变的侧音妨碍电话呼叫伙伴的讲话(参见例如专利文献1)。
另外,存在这样一种技术,其中用于将自适应语速改变应用于输入信号的语速改变装置包括:物理索引计算部,其用于计算通过以时间为单位将输入信号划分而获得的输入信号的各个片段的物理索引;以及语速改变因子确定部,其用于根据物理索引计算部所计算的物理索引来确定输入信号的各个片段执行语速改变所指定的语速改变放大因子。通过该技术,可将语速改变稳定地应用于混合有背景声音和语音的输入信号(参见例如专利文献2)。
[相关技术文献]
[专利文献]
[专利文献1]日本特开2001-16319号公报
[专利文献2]日本特开2011-33789号公报
如上所述,如果采用需要频域中的信号的声学回声消除方法,则需要将语速改变之后的时域中的信号变换为频域中的信号。如果在语速改变之前频域中的信号可用,则需要将频域中的信号变换为时域中的信号以便于语速改变。
因此,为了向声学回声消除器提供语速改变之后的频域中的信号,需要通过时频变换将语速改变之后的信号再次变换到频域。这意味着需要可观的资源来进行信号变换。
发明内容
本发明的一个实施方式的目的在于减少用于上述信号处理的资源量。
根据本发明的至少一个实施方式,一种将接收语音信号的频域信号的帧馈送给声学回声消除器的信号处理设备包括:第一接收部,其接收进行语速改变处理之前的频域中的所述接收语音信号的帧;第二接收部,其接收以帧为单位进行了所述语速改变处理后的时域中的信号的帧;以及频域帧合成部,其基于所述信号处理设备当前正在处理的帧处的进行了所述语速改变处理后的时域信号以及与进行了所述语速改变处理后的时域信号对应的频域中的所述接收语音信号的帧,合成所述接收语音信号的频域信号的帧。
根据本发明的至少一个实施方式,可减少用于信号处理的资源量。
附图说明
图1是示出语速改变处理和实施方式之间的关系的示意图;
图2是示出与语速改变处理相关的信号处理和本发明的实施方式之间的关系的示意图;
图3是实施方式的功能框图;
图4是实施方式的详细功能框图;
图5是实施方式的硬件配置图;
图6是实施方式的便携式终端的配置图;
图7是总结实施方式的方法的流程图;以及
图8是示出实施方式的频域信号估计方法的流程图。
具体实施方式
下面将参照附图描述本发明的实施方式。贯穿附图相同的元件将指派相同的标号。
图2示出与语速改变处理相关的信号处理和本发明的实施方式之间的关系。
本实施方式中的数字信号处理可将预定数量的数字值作为单个帧处理。例如,可按照8kHz的采样频率对声音信号的数据进行采样,并且可将160个样本作为一个帧处理。在这种情况下,一个帧为20ms长。可以帧为单位执行各种数据处理。另外,如果将时频变换应用于具有256个样本的数据,则根据采样定理将其变换为频域中的具有128个频率窗口(频谱)的信号。另外,例如,傅里叶变换(FFT)和傅里叶逆变换(IFFT)可用作下述的时频变换和频时变换。这里,所述变换不限于傅里叶变换和傅立叶逆变换。
另外,在以下描述中,以帧为单位依次执行各种信号处理。这里,为了避免信号的处理延迟,理想的是将所有信号处理设计得足够短,以使得用于处理的时间短于一个帧的时间。这里,在图2中,为了说明,具有相同帧号的帧垂直排列,尽管用于处理一个帧的时间取决于处理。
这里,在本说明书中,通过对时域中的信号进行时频变换而获得的信号称为“频域中的信号”。另外,包含预定条数的采样数据的帧称为“时域中的信号的帧”。另外,通过对时域中的信号的帧进行时频变换而获得的信号的帧称为“频域中的信号的帧”。
在图2中,最上面的帧号210表示分别指派给帧的编号。语音确定220例如可由语速改变部112执行。如果经由通信信道接收的接收语音信号被确定为语音,则将其指定为“S”,或者如果其被确定非语音(例如噪声),则将其指定为“N”。
如上所述确定接收语音信号是不是语音,以便于语速改变部112扩展接收语音信号的与语音对应的部分并且切去(或压缩)与非语音对应的部分。这样,语速改变部112压缩字之间的非语音部分以消减扩展的语音部分的时间。可用本领域技术人员已知的语音检测技术来实现语音确定220。
接收语音信号的被确定为语音的部分通过与预定的扩展放大因子当中的放大因子相乘而被扩展。作为语速改变技术,已提出各种技术,例如PICOLA方法、STRAIGHT方法等。在本实施方式中,可使用本领域技术人员已知的语速改变技术。因此,在本说明书中省略对语速改变技术的描述。
图2中的接收语音信号100是频域中的信号。从通信信道接收的信号被变换为频域中的信号,以在频域中进行各种信号处理,例如AGC处理、着重处理和降噪处理(未示出)。根据需要,接收语音信号100可进行这些信号处理中的各种信号处理。
在频时变换部110处按照顺序以帧为单位将频域中的接收语音信号100的帧(帧100-1至100-5)变换为时域中的语速改变之前的信号111的帧(帧111-1至111-5)。变换为时域中的信号是理想的,因为语速改变处理使用时域中的信号。
利用图2中所示的扩展比240,语速改变部112扩展或压缩各个帧。在本实施方式中,语音部分的扩展比大于一,以便扩展该部分。非语音部分帧的长度被压缩或设置为零,以补偿语音部分的扩展长度。这里,扩展比不采用恒定值,以使得根据各个帧的语音图案实现自然的扩展。
图2还示出时域中的语速改变之后的信号113的示例。即,帧111-1被扩展至1.2倍,以获得信号113a。帧111-2被扩展至2.0倍,以获得信号113b。帧111-3被切去(减小至零倍),因为它是要删除的非语音部分。尽管帧111-4也是非语音部分,但它被减小至0.8倍以获得信号113c,以填充帧号(4)。帧111-5被扩展至1.1倍,以获得信号113d。这里,假设直到帧号(5)的帧是到当前时间为止已处理的帧,当前时间恰好超过帧号(5)。因此,未示出帧号(5)之后的帧。
在电话中,实时地执行语音处理。因此,理想的是获得恰好在当前时间之前的帧作为将进行声学回声消除等处理的帧。然而,无法确保实时处理的完整性,因为以帧为单位执行AD/DA变换、时频变换、频时变换等(类似于其它数字信号处理)。
例如,利用图1所示的时频变换部108,获得图2中的频域中的语速改变之后的信号109A(帧109-1至109-5)。
首先,如下详细分析帧号(1)。即,对于帧号(1),语速改变之前的信号的帧111-1被扩展至1.2倍以获得时域中的语速改变之后的信号113a。这里,语速改变在维持语音的音调的同时扩展了语音的时长。因此,对于帧号(1),接收语音信号的帧100-1可具有与语速改变之后的帧109-1相同(或者严格意义上讲,基本上相同)的频率成分。
假设在保持语音的音调的同时进行语速改变,而不改变频率成分,基于该假设,语速改变处理被设计为使得仅语音的长度改变。通过实际实现的语速改变处理,没有观察到频率成分的影响。
因此,通常,在通过将语速改变之前的对应帧扩展而获得的语速改变之后的帧与语速改变之前的对应帧之间,频率成分保持不变。因此,以下各对帧具有相同(或者严格意义上讲,基本上相同)的频率成分:帧100-1和帧109-1;帧100-2和帧109-3;以及帧100-5和帧109-5。
接下来,下面作为示例分析图2中的帧号(2)。
即,在时域中的语速改变之后的信号的帧113-2中,与帧111-1对应的信号(或信号113a)占据约20%,与帧111-2对应的信号(或信号113b)占据约80%。因此,根据遍历假设,频域中的语速改变之后的信号的帧109-2包括帧100-1的频率成分的20%以及帧100-2的频率成分的80%。
在图2中由标号260指定的行中,针对各个帧以简化形式示出频率成分的比率,其中将语速改变之后的信号中所包括的语速改变之前的帧的相应频率成分的比率表示为公式中的各个因子项。
从以上可以看出,可以帧为单位根据频域中的语速改变之前的信号以及有关时域中的语速改变之后的信号的扩展比的信息估计频域中的语速改变之后的信号。
这可表示为如下的通式:
其中,P(n0,f)是频域中的语速改变之后的信号的帧n0的频率成分f的振幅;
F(n-k,f)是频域中的语速改变之前的信号的帧n-k的频率成分f的振幅;并且
α-k是从时域中的语速改变之前的信号的帧n-k获得的语速改变之后的信号在n0帧中的比率。
这里,下标表示时间顺序,其中n0表示当前正在被处理的帧号。帧n-1在时间上比帧n0领先一个帧单位(在过去)。因此,帧n-m在时间上比帧n0领先m个帧单位(在过去)。m的值可被设置为在用于先前处理阶段的、频域中的语速改变之前的信号的帧当中指定最靠近当前时间的帧。
例如,对于图2中的帧号(1),m=0和α0=1用于上式。对于帧号(2),m=1,α0=0.8,α-1=0.2。对于帧号(3),m=1,α0=0,α-1=1。对于帧号(4),m=2,α0=0.8,α-1=0,α-1=0.2。对于帧号(5),m=0,α0=1。
图3示出本实施方式的功能框图。在图3中,用根据本实施方式的用于语速改变之后的信号的频域信号估计部308代替图1中的时频变换部108。图3中的其它元件可与图1相同。
图3中的用于语速改变之后的信号的频域信号估计部308将频域中的语速改变之后的信号109B馈送给声学回声消除器106,该信号109B是利用式(1)由图2中的变换到频域的信号109A估计出的。为了估计,用于语速改变之后的信号的频域信号估计部308接收并利用时域中的语速改变之后的信号113和频域中的接收语音信号100。
图3中的声学回声消除器106可用本领域技术人员已知的各种方法之一实现。例如,声学回声消除器106可简单地从频域中的发送语音信号105减去估计的频域中的信号109B,从而获得可在时域中的语速改变之后的信号113中消除将经由扬声器114、麦克风102和时频变换部104进入声学回声消除器106中的混合信号的信号。
另选地,如早前提及的,存在从语速改变部112开始经由扬声器114、麦克风102和时频变换部104到声学回声消除器106的信号传输路径所特定的传输特性。频域中的发送语音信号105的来源是与受所述传输特性影响的信号混合的时域中的语速改变之后的信号113。所述混合信号是声学回声的原因。声学回声消除器106处理频域中的发送语音信号105,以例如基于所述传输特性利用频域中的信号109B和频域中的自适应滤波器(未示出)消除混合信号。
另外,可与时域中的信号处理结合地执行声学回声消除。
本实施方式中的用于语速改变之后的信号的频域信号估计部308可使用处理频域中的信号的任何类型的声学回声消除器106。用于语速改变之后的信号的频域信号估计部308是信号处理设备的示例。
图4是本实施方式的详细功能框图。用于语速改变之后的信号的频域信号估计部308可包括第一接收部410、第二接收部420和频域帧合成部430。
另外,频域帧合成部430可包括帧比率识别部432和加权加法部434。
第一接收部410接收频域中的接收语音信号100。另外,第一接收部410可将接收的频域中的接收语音信号100馈送到加权加法部434。
第二接收部420接收时域中的语速改变之后的信号113。另外,第二接收部420可将接收的时域中的语速改变之后的信号113馈送到帧比率识别部432。
帧比率识别部432如图2所示检查当前正在处理的帧中所包括的时域中的语速改变之后的信号113的内容。例如,如果图2中的帧号(2)是当前正在处理的帧,则信号113a和信号113b被识别为包括在时域中的语速改变之后的信号113的帧113-2中,并且还识别帧113-2中的信号113a和信号113b的比率(即,分别为0.2和0.8)。帧比率识别部432将识别的信息馈送到加权加法部434。
这里,“当前正在处理的帧”优选为相对于当前时间而言最近被采样的帧。这是因为如果应用本实施方式,则对于诸如电话的通信装置而言重要的是以尽可能短的时间延迟执行语音处理等。
接下来,加权加法部434从接收的信号113a识别例如频域中的接收语音信号100的帧100-1,并且还从信号113b识别频域中的接收语音信号100的帧100-2。
基于该信息,加权加法部434执行下面所指定的计算,以获得估计语速改变之后的信号的频域中的信号109B(P(2,f))。
P(2,f)=0.2×F(1,f)+0.8×F(2,f)
用于获得估计语速改变之后的信号的频域中的信号109B的公式已经参照式(1)进行了描述。
这里,理想的是第一接收部和第二接收部按照顺序将接收的信息存储到存储器中。还理想的是第一接收部和第二接收部存储频域帧合成部430使用了接收的信息的哪一部分。通过存储该信息,用于语速改变之后的信号的频域信号估计部308可容易地识别下一帧将要处理的信息。
图5示出用于实现例如图3至图4所示的实施方式的硬件配置。
本实施方式的硬件可包括动态存储器502、静态存储器504、外部存储器接口506、处理器508、显示控制单元510、通信控制单元512和输入/输出接口514。这些单元经由总线520彼此连接。
显示单元511与显示控制单元510连接。发送器、接收器、网络等513与通信控制单元512连接。键盘、触摸面板等515与输入/输出接口514连接。另外,麦克风、扬声器等517经由AD/DA转换器516与输入/输出接口514连接。
另外,外部存储器接口506可对便携式记录介质507进行读/写访问。
动态存储器502、静态存储器504或便携式记录介质507可存储实现本实施方式的程序的一部分或全部以及诸如程序源、源版本等的管理信息。实现本实施方式的程序的一部分或全部可由处理器508执行。
图3至图4所示的本实施方式的一部分或全部可用图5所示的硬件实现。
另外,本实施方式的一部分或全部可通过DSP(数字信号处理器,未示出)实现。
程序可存储到便携式记录介质507中。便携式记录介质507是具有结构的一个或更多个非瞬时性存储介质。例如,便携式记录介质507可以是磁存储介质、光盘、光磁存储介质、非易失性存储器等。磁存储介质可以是HDD、柔性盘(FD)、磁带(MT)等。光盘可以是DVD(数字多功能盘)、DVD-RAM、CD-ROM(紧凑盘-只读存储器)、CD-R(可记录)/RW(可重写)等。另外,光磁存储介质可以是MO(磁光盘)等。非易失性存储器可以是SD存储器、USB存储器等。通过加载存储在便携式记录介质507中的程序以使处理器执行该程序,可执行本实施方式的全部或一部分。
图6示出根据本实施方式的便携式终端600的配置。便携式终端600可包括用于输入发送语音的麦克风610、用于放大发送语音的放大器620、用于将发送语音变换为数字信号的AD转换器630以及用于处理发送语音的语音处理部640。便携式终端600还可包括用于对发送语音进行编码的语音编码部650以及用于对发送语音的数字信号进行基带处理的基带信号处理部660。便携式终端600还可包括用于将基带信号变换为模拟信号的DA转换器670、用于发送和接收无线信号的RF收发器680以及用于将无线信号发射到空中并接收无线信号的天线690。便携式终端600还可包括用于将接收语音信号变换为数字信号的AD转换器671以及用于对接收语音信号的数字信号进行基带处理的基带信号处理部661。便携式终端600还可包括用于对接收语音信号进行解码的语音解码部651以及用于处理接收语音信号的语音处理部641。便携式终端600还可包括用于将接收语音信号变换为模拟信号的DA转换器631、用于放大接收语音信号的放大器621、用于输出接收语音信号的扬声器611以及用于语速改变之后的信号的频域信号估计部308。
已参照图3至图4描述了用于语速改变之后的信号的频域信号估计部308。
图7是示出总结本实施方式的方法的流程图。
在步骤702,第一接收部410接收频域中的接收语音信号100。
在步骤704,频时变换部110将频域中的接收语音信号100变换为时域中的信号111。
在步骤706,语速改变部112对时域中的信号111进行语速改变处理。
在步骤708,第二接收部420接收语速改变之后的信号113。
在步骤710,频域帧合成部430根据频域中的接收语音信号100和语速改变之后的信号113合成(估计)频域中的语速改变之后的信号。
在步骤712,声学回声消除器106消除声学回声。
通过以上过程,可用更少的资源消除声学回声。
图8是示出根据本实施方式的频域信号估计方法的流程图。
在步骤802,帧比率识别部432识别当前处理的帧的时间范围内所包括的语速改变之后的帧的时长的比率。
在步骤804,加权加法部434利用帧的各个比率对与所述时间范围内所存在的时域中的信号对应的频域中的帧的频率成分执行加权加法。加权加法部434将通过以上步骤获得的估计的频域中的语速改变之后的信号109B馈送给声学回声消除器106。
通过以上过程,声学回声消除器106可执行声学回声的消除。
如上所述,已利用附图详细描述了本发明的实施方式。这里,需要注意的是,提供以上描述是为了理解本发明的实施方式,而不是为了限制本发明的实施方式的范围。另外,以上描述中的多个实施方式不是互斥的。因此,需要注意的是,除非出现任何矛盾,否则可实现不同实施方式的任何组合。另外,除非出现任何矛盾,否则权利要求中所描述的任一方法或者与程序有关的任一实施方式的步骤可按照不同顺序的步骤或者跳过任何步骤来执行。另选地,多个步骤可同时执行。另外,明显的是,这些实施方式包括在权利要求的技术范围内。
另外,通过使计算机读取并执行程序代码,可实现上述实施方式的功能。另外,如果存在在计算机上运行的软件(例如OS、虚拟机监视器(VMM)、固件或BIOS)在程序代码的控制下执行一部分或全部处理以实现这些实施方式的功能的情况,则明显的是这些情况包括在权利要求的技术范围内。
另外,各种实施方式中的各个元件可通过物理上分离的多个硬件单元实现。另外,各种实施方式中的各个元件可在一个或更多个服务器上操作。另外,多个CPU可执行与这些实施方式相关的程序,并且各个CPU可包括多个内核。
明显的是,以上实施方式不仅可应用于电话,而且可应用于执行全双工通信的各种各样的电话呼叫***,例如TV会议***、对讲机等。

Claims (6)

1.一种将接收语音信号的频域信号的帧馈送给声学回声消除器的信号处理设备,该设备包括:
第一接收部,其接收进行语速改变处理之前的频域中的所述接收语音信号的多个帧,所述语速改变处理是改变所述接收语音信号的语速;
第二接收部,其接收以帧为单位进行了所述语速改变处理后的时域中的信号的多个帧;以及
频域帧合成部,其基于所述信号处理设备当前正在处理的帧处的进行了所述语速改变处理后的时域信号以及与进行了所述语速改变处理后的时域信号对应的频域中的所述接收语音信号的帧,合成将馈送给所述声学回声消除器的所述接收语音信号的频域信号的帧。
2.根据权利要求1所述的信号处理设备,其中,所述频域帧合成部包括帧比率识别部,该帧比率识别部针对进行了所述语速改变处理后的时域信号,识别当前正在处理的帧中所包括的进行了所述语速改变处理后的时域信号部分的长度与当前正在处理的帧的长度的比率,
其中,所述比率用于合成所述接收语音信号的频域信号的帧。
3.根据权利要求2所述的信号处理设备,其中,所述频域帧合成部包括加权加法部,该加权加法部根据所述比率,对与进行了所述语速改变处理后的时域信号对应的频域中的所述接收语音信号的帧中包含的频率成分的值执行加权加法,以计算合成的所述接收语音信号的频域信号的帧。
4.一种将接收语音信号的频域信号的帧馈送给声学回声消除器的信号处理方法,该方法包括以下步骤:
首先接收进行语速改变处理之前的频域中的所述接收语音信号的多个帧,所述语速改变处理是改变所述接收语音信号的语速;
其次接收以帧为单位进行了所述语速改变处理后的时域信号的多个帧;以及
基于信号处理设备当前正在处理的帧处的进行了所述语速改变处理后的时域信号以及与进行了所述语速改变处理后的时域信号对应的频域中的所述接收语音信号的帧,合成将馈送给所述声学回声消除器的所述接收语音信号的频域信号的帧。
5.根据权利要求4所述的信号处理方法,其中,所述合成步骤包括针对进行了所述语速改变处理后的时域信号,识别当前正在处理的帧中所包括的进行了所述语速改变处理后的时域信号部分的长度与当前正在处理的帧的长度的比率,
其中,所述比率用于合成所述接收语音信号的频域信号的帧。
6.根据权利要求5所述的信号处理方法,其中,所述合成步骤包括根据所述比率,对与进行了所述语速改变处理后的时域信号对应的频域中的所述接收语音信号的帧中包含的频率成分的值执行加权加法,以计算合成的所述接收语音信号的频域信号的帧。
CN201410042005.0A 2013-03-28 2014-01-28 信号处理设备和信号处理方法 Expired - Fee Related CN104078049B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013-070337 2013-03-28
JP2013070337A JP6111795B2 (ja) 2013-03-28 2013-03-28 信号処理装置、及び信号処理方法

Publications (2)

Publication Number Publication Date
CN104078049A CN104078049A (zh) 2014-10-01
CN104078049B true CN104078049B (zh) 2017-02-22

Family

ID=50064383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410042005.0A Expired - Fee Related CN104078049B (zh) 2013-03-28 2014-01-28 信号处理设备和信号处理方法

Country Status (4)

Country Link
US (1) US9129594B2 (zh)
EP (1) EP2784778B1 (zh)
JP (1) JP6111795B2 (zh)
CN (1) CN104078049B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274848A (zh) * 2018-11-21 2019-01-25 深圳市云威物联科技有限公司 全双工对讲装置及猫眼装置
CN111161749B (zh) * 2019-12-26 2023-05-23 佳禾智能科技股份有限公司 可变帧长的拾音方法、电子设备、计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6674865B1 (en) * 2000-10-19 2004-01-06 Lear Corporation Automatic volume control for communication system
CN102413384A (zh) * 2011-11-16 2012-04-11 杭州艾力特音频技术有限公司 一种回声消除双向语音对讲设备
CN202197344U (zh) * 2011-07-08 2012-04-18 歌尔声学股份有限公司 送话器阵列回声消除***

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
US5606550A (en) * 1995-05-22 1997-02-25 Hughes Electronics Echo canceller and method for a voice network using low rate coding and digital speech interpolation transmission
JP3420705B2 (ja) * 1998-03-16 2003-06-30 日本電信電話株式会社 エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
JP3069547B2 (ja) * 1998-05-07 2000-07-24 日本放送協会 話速変換ハンズフリーユニットおよび通話システム
JP2001016319A (ja) * 1999-06-30 2001-01-19 Sanyo Electric Co Ltd 話速変換装置を備えた通話装置
US20040179676A1 (en) * 1999-06-30 2004-09-16 Kozo Okuda Speech communication apparatus
US7596384B2 (en) * 2002-12-09 2009-09-29 Intel Corporation Audio over subsystem interface
JP5086769B2 (ja) * 2007-10-23 2012-11-28 パナソニック株式会社 拡声通話装置
JP2009290825A (ja) * 2008-06-02 2009-12-10 Yamaha Corp 音響エコーキャンセラ
JP5412204B2 (ja) 2009-07-31 2014-02-12 日本放送協会 適応的な話速変換装置及びプログラム
MX351750B (es) * 2010-10-25 2017-09-29 Voiceage Corp Codificación de señales de audio genéricas a baja tasa de bits y a retardo bajo.

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6674865B1 (en) * 2000-10-19 2004-01-06 Lear Corporation Automatic volume control for communication system
CN202197344U (zh) * 2011-07-08 2012-04-18 歌尔声学股份有限公司 送话器阵列回声消除***
CN102413384A (zh) * 2011-11-16 2012-04-11 杭州艾力特音频技术有限公司 一种回声消除双向语音对讲设备

Also Published As

Publication number Publication date
JP6111795B2 (ja) 2017-04-12
CN104078049A (zh) 2014-10-01
EP2784778B1 (en) 2016-11-16
EP2784778A1 (en) 2014-10-01
US20140297270A1 (en) 2014-10-02
US9129594B2 (en) 2015-09-08
JP2014194457A (ja) 2014-10-09

Similar Documents

Publication Publication Date Title
US20150281853A1 (en) Systems and methods for enhancing targeted audibility
CN104067341A (zh) 在存在背景噪声的情况下的语音活动检测
JP2020016875A (ja) 音声インタラクション方法、装置、設備、コンピュータ記憶媒体及びコンピュータプログラム
JP2018528479A (ja) スーパー広帯域音楽のための適応雑音抑圧
US20180349086A1 (en) Auto-mute redundant devices in a conference room
JP6058824B2 (ja) パーソナライズされた帯域幅拡張
US9832299B2 (en) Background noise reduction in voice communication
KR101233271B1 (ko) 신호 분리 방법, 상기 신호 분리 방법을 이용한 통신 시스템 및 음성인식시스템
US20140365212A1 (en) Receiver Intelligibility Enhancement System
US8620670B2 (en) Automatic realtime speech impairment correction
CN106791244B (zh) 回声消除方法、装置以及通话设备
CN111883182B (zh) 人声检测方法、装置、设备及存储介质
US20150325252A1 (en) Method and device for eliminating noise, and mobile terminal
US8868417B2 (en) Handset intelligibility enhancement system using adaptive filters and signal buffers
US9934791B1 (en) Noise supressor
US8868418B2 (en) Receiver intelligibility enhancement system
CN104078049B (zh) 信号处理设备和信号处理方法
US20130178963A1 (en) Audio system with adaptable equalization
US20200320979A1 (en) Synthetic Narrowband Data Generation for Narrowband Automatic Speech Recognition Systems
GB2516208B (en) Noise reduction in voice communications
CN106293607B (zh) 自动切换音频输出模式的方法及***
US11924368B2 (en) Data correction apparatus, data correction method, and program
CN109378012B (zh) 用于单通道语音设备录制音频的降噪方法及***
CN111147655B (zh) 模型生成方法和装置
CN113517000A (zh) 回声消除的测试方法、终端以及存储装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170222

Termination date: 20210128