CN101208740A - 背景噪声信息的非连续传输和准确再现的方法 - Google Patents

背景噪声信息的非连续传输和准确再现的方法 Download PDF

Info

Publication number
CN101208740A
CN101208740A CNA2006800091837A CN200680009183A CN101208740A CN 101208740 A CN101208740 A CN 101208740A CN A2006800091837 A CNA2006800091837 A CN A2006800091837A CN 200680009183 A CN200680009183 A CN 200680009183A CN 101208740 A CN101208740 A CN 101208740A
Authority
CN
China
Prior art keywords
frame
silent
state
ground unrest
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800091837A
Other languages
English (en)
Other versions
CN101208740B (zh
Inventor
塞拉芬·迪亚兹·斯平多拉
彼得·J·布莱克
罗希特·卡普尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN101208740A publication Critical patent/CN101208740A/zh
Application granted granted Critical
Publication of CN101208740B publication Critical patent/CN101208740B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)

Abstract

本发明包括一种传送背景噪声的方法,其包括以下步骤:传输背景噪声;消隐用于传送所述背景噪声的后续背景噪声数据速率帧;接收所述背景噪声;以及更新所述背景噪声。

Description

背景噪声信息的非连续传输和准确再现的方法
主张35 U.S.C.§119下的优先权
本申请案主张2005年2月1日申请的题为“Method for Discontinuous Transmission andAccurate Reproduction of Background Noise Information”的第60/649,192号美国临时申请案的权利,该申请案的全部揭示内容被认为是本申请案的揭示内容的一部分并以引用的方式并入本文中。
技术领域
本发明大体上涉及网络通信。更明确地说,本发明涉及一种用于在无线通信***中改进声音质量、降低成本并增加效率同时减少带宽要求的新颖且改进的方法和设备。
背景技术
CDMA声码器以已知速率使用1/8帧的连续传输来传送背景噪声信息。需要丢弃或“消隐”这些1/8帧中的大部分以改进***能力,同时保持语音质量不受影响。因此,此项技术中需要一种适当选择和丢弃具有已知速率的帧以减少传送背景噪声所需的额外开销的方法。
发明内容
鉴于以上内容,所描述的本发明的特征大体上涉及用于传送背景噪声的一种或一种以上改进的***、方法和/或设备。
在一个实施例中,本发明包括一种传送背景噪声的方法,其包括以下步骤:传输背景噪声;消隐用于传送所述背景噪声的后续背景噪声数据速率帧;接收所述背景噪声;以及更新所述背景噪声。
在另一实施例中,所述传送背景噪声的方法进一步包括以下步骤:当背景噪声改变时通过传输新原型速率帧来触发背景噪声的更新。
在另一实施例中,所述传送背景噪声的方法进一步包括以下步骤:通过对背景噪声数据速率帧进行滤波、将所述背景噪声数据速率帧的能量与背景噪声数据速率帧的平均能量进行比较,并在差值超过阈值时传输更新背景噪声数据速率帧来进行触发。
在另一实施例中,所述传送背景噪声的方法进一步包括以下步骤:通过对背景噪声数据速率帧进行滤波、将所述背景噪声数据速率帧的频谱与背景噪声数据速率帧的平均频谱进行比较,并在差值超过阈值时传输更新背景噪声数据速率帧来进行触发。
在另一实施例中,本发明包括一种用于传送背景噪声的设备,所述设备包括:声码器,其具有至少一个输入和至少一个输出,其中所述声码器包括具有至少一个输入和至少一个输出的解码器以及具有至少一个输入和至少一个输出的编码器;至少一个智能消隐设备,其具有存储器以及至少一个输入和至少一个输出,其中所述至少一个输入的第一者可操作地连接到所述声码器的至少一个输出,且所述至少一个输出可操作地连接到所述声码器的至少一个输入;去抖动缓冲器,其具有至少一个输入和至少一个输出,其中所述至少一个输出可操作地连接到所述智能消隐器的至少一个输入的第二者;以及网络堆栈,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述去抖动缓冲器的至少一个输入,且所述至少一个输入可操作地连接到所述智能消隐设备的至少一个输出。
在另一实施例中,所述智能消隐设备适于执行存储在存储器中的指令,所述指令包括传输背景噪声;消隐用于传送所述背景噪声的后续背景噪声数据速率帧;接收所述背景噪声;以及更新所述背景噪声。
从以下具体实施方式、所附权利要求书和图式中将了解本发明的进一步的适用范围。然而,应了解,具体实施方式和特定实例虽然指示本发明的优选实施例,但仅以说明的方式提供,因为所属领域的技术人员将了解本发明精神和范围内的各种变化和修改。
附图说明
从下文提供的具体实施方式、所附权利要求书和附图中将更充分理解本发明,附图中:
图1是背景噪声产生器的方框图;
图2是使用1/8速率帧来播放噪声的解码器的最高级视图;
图3说明编码器的一个实施例;
图4说明包含三个密码本条目FGIDX、LSPIDX1和LSPIDX2的1/8帧;
图5a是使用智能消隐的***的逻辑方框图;
图5b是使用智能消隐的***的逻辑方框图,其中智能消隐设备集成到声码器中;
图5c是使用智能消隐的***的逻辑方框图,其中智能消隐设备包括执行本发明的发送和接收步骤两者的一个块或设备;
图5d是使用时间弯曲压缩的语音片段的实例;
图5e是使用时间弯曲扩展的语音片段的实例;
图5f是使用智能消隐和时间弯曲的***的逻辑方框图;
图6是计算机机架上无声开始时相对于平均能量的帧能量与帧数的曲线图;
图7是有风环境中无声开始时相对于平均能量的帧能量与帧数的曲线图;
图8是说明由发射器执行的本发明的智能消隐方法和设备的步骤的流程图;
图9是说明由接收器执行的本发明的智能消隐方法和设备的步骤的流程图;
图10说明传输更新速率帧和播放擦除;
图11是能量值与时间的曲线图,其中先前1/8速率帧更新与新的或后续1/8速率帧更新混合;
图12说明将先前1/8速率帧更新与使用密码本条目的新的或后续1/8速率帧更新混合;
图13是说明当基于帧能量的差异而触发1/8速率帧更新时执行的步骤的流程图;
图14是说明当基于频率能量的差异而触发1/8速率帧更新时执行的步骤的流程图;
图15是展示“低频”LSP和“高频”LSP的频谱密码本条目的变化的LSP频谱差异的曲线图;
图16是说明当发送保活包(keep alive packet)时执行的步骤的流程图;以及
图17是说明当初始化位于声码器中的编码器和解码器时执行的步骤的流程图。
具体实施方式
本文使用词汇“说明性”来表示“作为实例、例子或说明”。本文描述为“说明性”的任何实施例不一定解释为与其它实施例相比是优选或有利的。
在全双工对话期间,存在至少一方“无声”的许多例子。在这些“无声”时间间隔期间,信道传送背景噪声信息。背景噪声信息的适当传送是影响涉及对话的各方所感知的声音质量的一个因素。在基于IP的通信中,当一方变得无声时,可使用包将指示说话者已变得无声且应再现或重放背景噪声的消息发送到接收器。可在每个无声时间间隔开始时发送所述包。CDMA声码器以已知速率使用1/8速率帧的连续传输来传送背景噪声信息。
陆上线路或有线线路***发送大多数语音数据,因为不存在与其它***一样多的对带宽的约束。因此,可通过连续发送全速率帧来传送数据。然而,在无线通信***中,需要保留带宽。无线***中一种保留带宽的方式是减小所传输的帧的大小。举例来说,许多CDMA***连续发送1/8速率帧来传送背景噪声。1/8速率帧充当无声指示帧。通过发送与全帧或半帧相比较小的帧,节省了带宽。
本发明包括一种保留带宽的设备和方法,其包括丢弃或“消隐”“无声”帧。丢弃或“消隐”这些1/8速率帧中的大多数帧会改进***能力,同时将语音质量维持在可接受的水平。本发明的设备和方法不限于1/8速率帧,而是可用于选择和丢弃用于传送背景噪声的具有已知速率的帧,以减少传送背景噪声所需的额外开销。用于传送背景噪声的任何速率帧均可称为背景噪声速率帧,且可用于本发明。因此,本发明可与任何大小的帧一起使用,只要所述帧用于传送背景噪声。此外,如果背景噪声在无声时间间隔过程中变化,那么本发明智能消隐设备更新通信***以反映背景噪声的变化,而不会显著影响语音质量。
在CDMA通信中,当说话者变得无声时,可使用已知速率的帧对背景噪声进行编码。在替代实施例中,通过高数据速率(HDR)将1/8速率帧用于因特网语音协议(VoIP)***中。HDR由电信工业协会(TIA)标准IS-856描述,且也称为CDMA2000lxEV-DO。在此实施例中,在无声周期期间每隔20毫秒发送连续系列的1/8速率帧。这不同于可用于传输声音数据的全速率(速率1)、半速率(速率1/2)或四分之一速率(速率1/4)帧。尽管1/8速率包与全速率帧相比相对较小(即,具有较少的位),但通信***中的包额外开销可能仍然相当大。因为调度器可能不在声音包速率之间进行区分,所以情况尤其如此。调度器将***资源分配到移动台以提供对资源的有效利用。举例来说,最大通过量调度器通过调度处于最佳无线电条件的移动台而使单元通过量最大化。循环调度器(roundrobin scheduler)将相同数目的调度时间段(scheduling slot)一次一个地分配到***移动台。比例公平调度器(proportional fair scheduler)以比例(用户无线电条件)公平方式将传输时间指定到移动台。本发明方法和设备可与许多类型的调度器一起使用,且不限于一个特定的调度器。由于说话者在对话的约60%期间通常无声,所以丢弃无声周期期间用于传输背景噪声的这些1/8速率帧中的大多数帧会通过减少在这些无声周期期间传输的数据位的总量来提供***能力增益。
语音质量大致不受影响的原因来自以下事实:以当需要时更新背景噪声信息的方式执行智能消隐。除了增强能力外,使用1/8速率帧智能消隐还因为减少了带宽要求而降低了传输的总成本。所有这些改进均是在使对所感知的声音质量的影响最小化的同时完成的。
本发明的智能消隐设备可与任何传递包的***一起使用,例如许多声音通信***。其包含(但不限于)与其它有线线路***通信的有线线路***、与其它无线***通信的无线***,和与无线***通信的有线线路***。
背景噪声的产生
在本文描述的说明性实施例中,背景噪声产生存在两个分量。这些分量包含噪声的能量级或音量以及噪声的频谱频率特性或“颜色”。图1说明产生背景噪声35的设备,背景噪声产生器10。信号能量15输入到噪声产生器20。噪声产生器20是小处理器。其执行软件,所述软件导致其输出平均值为零的随机数字序列形式的白噪声25。此白噪声输入到线性预测系数(LPC)滤波器或线性预测编码滤波器30。LPC系数72也输入到LPC滤波器30。这些系数72可来自密码本条目71。LPC滤波器30使背景噪声35的频率特性定形。背景噪声产生器10是对于所有传输背景噪声35的***的概括,只要所述***使用音量和频率来表示背景噪声35。在优选实施例中,背景噪声产生器10位于松弛码激励线性预测(RCELP)解码器40中,所述RCELP解码器40位于声码器60的解码器50中。参看图2,其为使用1/8速率帧70来播放噪声35的解码器40的最高级视图。
图2中,包帧41和包类型信号42输入到帧误差检测设备43。包帧41也输入到RCELP解码器40。帧误差检测设备43将速率决定信号44和帧擦除旗标信号45输出到RCELP解码器40。RCELP解码器40将原始合成语音向量46输出到后置滤波器47。后置滤波器47输出经后滤波的合成语音向量信号48。
此产生背景噪声的方法不限于CDMA声码器。例如增强全速率(EFR)、适应性多速率(EFR)、增强可变速率CODEC(EVRC)、G.727、G.728和G.722的多种其它语音声码器可适用于此传送背景噪声的方法。
尽管对于无声时间间隔期间的背景噪声89以及对于对话期间的声音来说存在无限数目的能量级和频谱频率特性,但通常可通过有限(相对较小)数目的值来描述无声时间间隔期间的背景噪声89。为了减小用于传送背景噪声信息的所需带宽,特定***的频谱和能量噪声信息可量化并编码到存储在一个或一个以上密码本65中的密码本条目71、73中。因此,无声时间间隔期间出现的背景噪声35通常可通过这些密码本65中的有限数目的条目71、73来描述。举例来说,增强可变速率编解码器(EVRC)***中使用的密码本条目73可包含功率的256个不同的1/8速率常数。通常,EVRC***内传输的任何噪声均将具有对应于这256个值中的一者的功率电平。此外,每一数字解码为3个功率电平,EVRC帧内部的每一子帧一个。类似地,EVRC***将包含对应于与经编码的背景噪声35相关联的频谱的有限量的条目71。
在一个实施例中,位于声码器60中的编码器80可产生密码本条目71、73。图3中对此进行说明。密码本条目71、73最终可解码为原始值的接近近似值。所属领域的一般技术人员还将了解,使用密码本65中的能量音量15和频率“颜色”系数72进行噪声编码和再现可扩展到若干类型的声码器60,因为许多声码器60使用等效模式来传输噪声信息。
图3说明可用于本发明的编码器80的一个实施例。图3中,两个信号输入到编码器80,语音信号85和外部速率命令107。语音信号或脉冲编码调制(PCM)语音样本(或数字帧)85输入到声码器60中的信号处理器90,其将对信号85进行高通滤波和适应性噪声抑制滤波。经处理或滤波的脉冲编码调制(PCM)语音样本95输入到模式参数估计器100,其确定是否检测到声音样本。模式参数估计器100将模型参数105输出到第一切换器110。可将语音定义为声音与无声的组合。如果检测到声音(活动语音)样本,那么第一切换器110将模型参数105逐出到全速率或1/2速率编码器115,且声码器60在格式化包125中输出全速率或半速率帧117中的样本。
如果具有来自模型参数估计器100的输入的速率确定器122决定编码无声帧,那么第一切换器110将模型参数105逐出到1/8速率编码器120,且声码器60输出1/8速率帧参数119。包格式化模块124包含将那些参数119放置到格式化包125中的设备。如果如所说明产生1/8速率帧70,那么声码器60可输出包含对应于声音或无声样本85的能量(FGIDX)73或频谱能量值(LSPIDX1或LSPIDX2)71的密码本条目的包125。
速率确定器122应用于声音活动检测(VAD)方法和速率选择逻辑来确定产生什么类型的包。模型参数105和外部速率命令信号107输入到速率确定器122。速率确定器122输出速率决定信号109。
1/8速率帧
图4中,160PCM样本表示语音片段89,其在此情况下通过对背景噪声取样20毫秒而产生。160PCM样本划分为三个块86、87和88。块86和87为53PCM样本长,而块88为54PCM样本长。160PCM样本以及因此背景噪声89的20毫秒可通过1/8速率帧70来表示。在说明性实施例中,1/8速率帧70可包含至多达16位信息。然而,位的数目可依据***的特定用途和要求而变化。示范性实施例中使用EVRC声码器60将16位分配到三个密码本65中。图4中对此进行说明。前8位LSPIDX1(4位)和LSPIDX2(4位)表示经编码噪声35的频率内容,即再现背景噪声35所需的频谱信息。第二组8位FGIDX(8位)表示噪声35的音量内容,即再现背景噪声35所需的能量。由于密码本中将仅包含有限数目的潜在能量音量,所以这些音量的每一者可由密码本中8位长的条目73表示。类似地,频谱频率信息可由来自两个不同密码本的大小为4位长的两个条目71表示。因此,16位的信息是用于表示噪声35的音量和频率特性的密码本条目71、73。
在图4所示的说明性实施例中,FGIDX密码本条目73包含用于表示无声样本中的能量的能量值。LSPIDX1密码本条目71包含用于表示无声样本中的频谱的“低频”频谱信息,且LSPIDX2密码本条目71包含用于表示无声样本中的频谱的“高频”频谱信息。在另一优选实施例中,密码本存储在位于声码器60中的存储器130中。存储器130也可位于声码器60外部。在另一优选实施例中,包含密码本的存储器130可位于智能消隐设备或智能消隐器140中。图5a中对此进行说明。由于密码本中的值不会改变,所以存储器130可以是ROM存储器,但可使用许多不同类型的存储器中的任一者,例如RAM、CD、DVD、磁芯等。
消隐1/8速率帧
在示范性实施例中,消隐1/8速率帧70的方法的步骤可在发射装置150与接收装置160之间进行划分。图5a中对此进行展示。在此实施例中,发射器150选择背景噪声的最佳表示并将此信息发射到接收器160。发射器150跟踪所取样的输入背景噪声89的变化并使用触发175(或其它形式的通知)来确定何时更新噪声信号70且将这些变化传送到接收器160。接收器160跟踪对话的状态(通话、无声)并用由发射器150提供的信息来产生“正确的”背景噪声35。所述消隐1/8速率帧70的方法可以多种方式,使用逻辑电路、模拟和数字电子元件、计算机执行的指令、软件、固件等实施。
图5a还说明解码器50和编码器80可以可操作地连接在单个设备中的实施例。已将点线置于解码器50和编码器80周围以表示两个装置均建置在声码器60内。编码器50和解码器80也可位于单独设备中。解码器80是用于将数字表示的信号转译为合成的语音信号的装置。在优选实施例中,其将声音的数字表示转译为合成的语音信号或等效PCM表示。编码器80将取样的语音信号转译为通常经压缩且打包的数字表示。在优选实施例中,其将取样的语音或其等效PCM表示转换为声码器包125。一个此类经编码表示可以是数字表示。另外,在EVRC***中,许多声码器60具有位于编码器50中的高带通滤波器,其截止频率约为120 Hz。截止频率可因不同的声码器60而不同。
此外,图5a中,智能消隐设备140位于声码器60外部。然而,在另一实施例中,智能消隐设备140可建置在声码器60内部。参看图5b。因此,消隐设备140可与声码器60集成以成为声码器设备60的一部分或定位成单独的设备。如图5a所示,智能消隐设备140从去抖动缓冲器180接收声音和无声包。去抖动缓冲器180执行许多功能,其中之一是以语音包被接收的次序放置语音包。网络堆栈185可操作地连接接收器160的去抖动缓冲器180与从发射器150连接到编码器80的智能消隐设备逻辑块140。其用于将传入的帧逐出到其所属的装置的解码器50,或将帧逐出到另一装置的切换电路。在优选实施例中,堆栈185是IP堆栈。IP堆栈可实施在不同的通信信道上,在优选实施例中为无线通信信道。
由于图5a所示的两个手机均可发射语音或接收语音,所以智能消隐设备针对每一电话而***为两个块。如下文所论述,语音的发射器150和接收器160两者均执行本发明的智能消隐方法的步骤。因此,可操作地连接到解码器50的智能消隐设备140执行针对接收器160的本发明方法的步骤,而可操作地连接到编码器的智能消隐设备140执行针对发射器150的本发明方法的步骤。
应指出,每一手机用户均发射语音(说话)和接收语音(收听)。因此,智能消隐设备140也可以是每一手机处的执行发射和接收步骤的一个块或设备。图5c中对此进行说明。在优选实施例中,智能消隐设备140是微处理器,或可用于处理信息、执行指令等的模拟和数字的许多设备中的任一者。
最后,时间弯曲器(time warper)190可与智能消隐设备140一起使用。语音时间弯曲是在不显著降级语音片段的质量的情况下扩展或压缩语音片段的持续时间的动作。图5d和5e中说明时间弯曲,所述图分别展示经压缩192和扩展的语音片段194的实例。图5f展示具有时间弯曲器190的本发明的实施例。
图5d中,195是发现最大相关偏移的位置。为了压缩语音样本,将一些片段进行添加重叠196,而剩余的样本如来自原始片段197被复制。图5e中,200是发现最大相关(偏移)的位置。89a是来自先前帧的语音片段(160 PCM样本),而89b是来自当前帧的语音片段(160PCM样本)。为了扩展语音片段,将片段进行添加重叠202。经扩展的语音片段194是160-偏移样本+160)。
对1/8速率帧进行分类
1.暂时1/8速率帧
在说明性实施例中,可根据话音突发之后帧的定位对帧进行分类。紧随话音突发之后的帧可称为“暂时的”。其除了背景噪声89外还可包含某一残余声音能量,或其可能由于声码器会聚操作(编码器仍估计背景噪声)的缘故而不准确。因此,这些帧内所含的信息不同于“噪声”的当前平均音量级。这些暂时帧205可能不是无声周期期间“真正背景噪声”的良好实例。另一方面,稳定帧210包含平均音量级中反映的最少量声音残余。
图6和7展示对于两个不同语音环境的无声周期的开始。图6包含来自计算机的机架的噪声的19个曲线图,其中展示若干无声周期的开始。每一曲线图表示试验的结果。y轴表示相对于平均能量212的帧能量Δ。x轴表示帧数214。图7包含来自在有风天气行走时的噪声的9个曲线图,其中展示若干无声周期的开始。y轴表示相对于平均能量212的帧能量Δ。x轴表示帧数214。
图6展示一语音样本,其中在第二帧之后可认为1/8速率帧70的能量是“稳定的”。图7展示在多个曲线图中,样本取4个以上帧以用于将帧的能量会聚为表示无声时间间隔的值。当人停止说话时,其声音不会突然停止,而是逐渐降低为无声。因此,噪声信号需用几个帧而安定在恒定值。因此,最初几个帧因为其包含某一声音残余或因为声码器设计的缘故而为暂时的。
2.稳定噪声帧
无声时间间隔期间跟随在“暂时”噪声帧205之后的那些帧可称为“稳定”噪声帧210。如上文所述,这些帧显示来自上一话音突发的最小影响,且因此提供对所取样的输入背景噪声89的良好表示。所属领域的技术人员将了解,稳定背景噪声35是相对术语,因为背景噪声35可能显著变化。
将暂时帧与稳定帧区分
存在将暂时1/8速率帧205与稳定1/8速率帧210区分的若干方法。下文描述那些方法中的两种。
固定计时器辨别
在一个实施例中,可认为已知速率的最初N个帧是暂时的。举例来说,对多个语音片段89的分析展示,在第五帧之后存在可认为1/8速率帧70是稳定的较高概率。参看图6和7。
差异辨别
在另一实施例中,发射器150可存储稳定1/8速率帧210的经滤波的能量值并将其用作参考。话音突发之后,认为经编码1/8速率帧70是暂时的,直到其能量落在经滤波的△值内为止。通常不比较频谱,因为一般来说如果帧70的能量已会聚,那么其频谱信息也已会聚的概率较高。
然而,存在背景噪声35特性可从一个无声周期充分变化到另一无声周期的概率,从而导致稳定1/8速率帧210的经滤波能量值不同于当前由发射器150存储的能量值。因此,经编码1/8速率帧的能量可能不落在经滤波的Δ值内。为了解决此问题,也可使用会聚超时来使差异辨别方法较为稳固。因此,可认为差异方法是对固定计时器方法的改进。
智能消隐方法
在一个实施例中,可使用采用暂时帧值205消隐1/8数据速率帧或1/8速率帧的方法。在另一实施例中,可使用稳定帧值210。在第三实施例中,消隐方法可采用“原型1/8速率帧”215的用途。在此第三实施例中,原型1/8数据速率帧215用于在接收器侧160再现背景噪声35。作为说明,在初始化程序期间,可认为最初传输或接收的1/8速率帧70是“原型”215。原型帧215表示正由发射器150消隐的其它1/8速率帧70。只要所取样的输入背景噪声89变化,发射器150就将具有已知值的新的原型帧215发送到接收器160。因为每一用户将由于发送较少的帧而需要较少带宽,所以可增加整体能力。
发射器侧智能消隐方法
在说明性实施例中,发射器侧150至少传输话音突发之后最初N个暂时1/8速率帧205。其接着在无声时间间隔中消隐剩余的1/8速率帧70。测试结果指示,仅发送一个帧会产生良好结果,且发送一个以上帧并不显著改进质量。在另一实施例中,除了最初一个或两个帧外,还可传输后续的暂时帧205。
对于不可靠信道(高PER)中的操作,发射器150可在发送上一暂时1/8速率帧205之后发送原型1/8速率帧215。在优选实施例中,在上一暂时1/8速率帧205之后(40到100)ms发送原型帧215。在另一优选实施例中,在上一暂时1/8速率帧205之后80ms发送所述原型帧215。此延迟的传输的目标是改进接收器160检测无声周期的开始并转变为无声状态的可靠性。
在说明性实施例中,在无声时间间隔的剩余部分期间,如果已触发背景噪声35的更新且如果新的原型1/8速率帧215不同于所发送的上一帧,那么发射器150发送新的原型1/8速率帧215。因此,不同于现有技术中所揭示的其中每隔20毫秒传输1/8帧70的***,本发明在所取样的输入背景噪声89已改变而足以对所感知的对话质量产生影响并触发传输1/8帧70以在接收器160处使用来更新背景噪声35时,传输1/8帧70。因此,在需要时传输1/8速率帧70,从而形成带宽的巨大节省。
图8是说明由发射器执行的本发明的智能消隐方法和设备的步骤的流程图。图8中说明的步骤存储为位于软件或固件220中的指令,所述软件或固件220位于存储器130中。存储器130可位于智能消隐设备140中或单独定位。
图8中,发射器接收帧300。接着,接收器确定所述帧是否为无声帧305。如果未检测到传送或包含无声的帧,即其为声音帧,那么***转变为活动状态310且将帧传输到接收器315。
如果所述帧是无声帧,那么***检查所述***是否处于无声状态320。如果***不处于无声状态,即无声状态=错误,那么其将转变为无声状态325并将无声帧发送到接收器330。如果***处于无声状态,无声状态=正确,那么其将检查所述帧是否稳定335。
如果所述帧是稳定帧210,那么***将更新统计资料340并检查以了解是否触发了345更新212。如果触发了更新212,那么***将建立原型350并将新的原型帧215发送到接收器160(355)。如果未触发更新212,那么发射器150将不会将帧发送到接收器160,且将返回以接收帧300。
如果帧不稳定,那么***将传输暂时1/8速率帧205(360)。然而,此特征是可选的。
接收器侧智能消隐
在说明性实施例中,在接收器侧160,智能消隐设备140保持对对话的状态的跟踪。接收器160可在其接收到帧时将所接收的帧提供到解码器50。当接收到1/8速率帧70时,接收器160转变为无声状态。在另一实施例中,接收器160向无声状态的转变可基于超时。在又一实施例中,接收器160向无声状态的转变可基于1/8速率70的接收并且基于超时。接收器160可在接收到不同于1/8速率的速率时转变为活动状态。举例来说,接收器160可在接收到全速率帧或半速率帧时转变为活动状态。
在说明性实施例中,当接收器160处于无声状态时,其可重放原型1/8速率帧215。如果在无声状态期间接收到1/8速率帧,那么接收器160可用所接收的帧来更新原型帧215。在另一实施例中,当接收器160处于无声状态时,如果无1/8速率帧70可供使用,那么接收器160可播放上一接收的1/8速率帧70。
图9是说明由接收器160执行的智能消隐方法和设备的步骤的流程图。图9中说明的步骤可存储为位于软件或固件220中的指令230,所述软件或固件220位于存储器130中。存储器130可位于智能消隐设备140中或单独定位。此外,智能消隐方法的步骤中的许多步骤可存储为位于软件或固件中的指令,所述软件或固件位于存储器130中。
接收器160接收帧400。首先,其确定所述帧是否为声音帧405。如果是,那么其设定其无声状态=错误410,接着接收器播放声音帧415。如果所接收的帧不是声音帧,那么接收器160检查其是否为无声帧420。如果答案为是,那么接收器160检查状态是否为无声425。如果接收器160检测到无声帧,但无声状态为错误,即接收器160处于声音状态,那么接收器160转变为无声状态430并播放所接收的帧435。如果接收器160检测到无声帧,且无声状态为正确,那么接收器更新原型215(440)并播放原型215(445)。
如上所述,如果所接收的帧不是声音帧,那么接收器160检查其是否为无声帧。如果答案为否,那么没有接收到帧(即,其为擦除指示)且接收器160检查状态是否为无声450。如果状态为无声,即无声状态=正确,那么播放455原型帧215。如果状态不是无声,即无声状态=错误,那么接收器160检查是否已发生N个连续擦除240(460)。(在智能消隐过程中,擦除240本质上为旗标。擦除240可在预期但未接收到帧时由接收器代替)。如果答案为否,那么未发生N个连续擦除240,且连接到接收器160中的解码器50的智能消隐设备140向解码器50播放擦除240(465)(针对包损失隐藏)。如果答案为是,那么已发生N个连续擦除240,且接收器160转变为无声状态470并播放原型帧215(475)。
在一个实施例中,其中使用智能消隐设备140和方法的***是IP语音***,其中接收器160具有灵活的计时器且发射器150使用每隔20毫秒发送帧的固定计时器。这不同于其中接收器160和发射器150均使用固定计时器的基于电路的***。因此,由于使用了灵活的计时器,所以智能消隐设备140可不每隔20毫秒就对帧进行检查。事实上,智能消隐设备140将在被要求这样做时对帧进行检查。
如之前所述,当使用时间弯曲时,可扩展或压缩语音片段89。解码器50可在说话者235即将用完重放的信息时运行。如果解码器50需要运行,那么其将试图从去抖动缓冲器180获得新的帧。接着执行智能消隐方法。
图10展示发射器150中编码器80将1/8速率帧70连续发送到智能消隐设备140。同样,可操作地连接到接收器160中的解码器50的智能消隐设备140连续发送1/8速率帧70。然而,在接收器160与发射器150之间不发送连续系列的帧。事实上,需要时发送更新212。智能消隐设备140可在其未从发射器150接收到帧时播放擦除240并播放原型215。麦克风250附接到发射器150中的编码器80,且扬声器235附接到接收器160中的解码器50。
背景噪声的平直性
在说明性实施例中,当解码器50检测到1/8速率帧70时,接收器160可仅使用一个1/8速率帧70在整个无声时间间隔期间再现背景噪声35。换句话说,重复背景噪声35。如果存在更新212,那么每隔20毫秒发送所述相同的经更新1/8速率帧212以产生背景噪声35。这可导致重新构造的背景噪声35表观上缺乏变化或为“平直”的,因为所述相同的1/8速率帧可用于延长的时段并对收听者来说可能令人厌烦。
在一个实施例中,为了避免“平直”,可将擦除240而不是原型1/8速率帧215馈入接收器160处的解码器50中。图10中对此进行说明。擦除向背景噪声35引入随机性,因为解码器50试图在擦除向其所具有的内容添加某一随机性212藉此改变重新构造的背景噪声35之前再现其所具有的内容。在所述时间的0与50%之间播放擦除212将在背景噪声35中产生所需的随机性。
在另一实施例中,可将随机背景噪声35“混合”在一起。这涉及将先前1/8速率帧更新212a与新的或后续1/8速率帧更新212b混合,从而将背景噪声35从先前1/8帧更新值212a逐渐改变为新的1/8帧更新值212b。因此,向背景噪声35添加了随机性或变化。如图所示,背景噪声能量级可逐渐增加(箭头从先前1/8帧更新值212a向上指向新的1/8帧更新值212b)或减小(箭头从先前1/8帧更新值212a向下指向新的1/8帧更新值212b),这取决于新的更新速率帧212b中的能量值大于还是小于先前速率更新帧212a中的能量值。图11中对此进行说明。
也可使用密码本条目70a、70b来实现背景噪声35中的这种逐渐变化,其中所发送的帧呈现处于先前1/8帧更新值212a与新的1/8帧更新值212b之间的密码本条目值,从而从表示先前1/8更新帧212a的密码本条目70a逐渐移动到表示新的更新帧212b的密码本条目70b。选择每一中间密码本条目70aa、70ab来模仿从先前212a到新的更新帧212b的增量变化Δ。举例来说,图12中,先前1/8数据速率更新帧212a由密码本条目70a表示。下一帧由70aa表示,所述70aa表示从先前密码本条目70a发生的增量变化Δ。具有第一增量变化的帧之后的帧由70ab表示,所述70ab表示从先前密码本条目70a发生的增量变化2Δ。图12展示具有从先前更新212a发生的增量变化的密码本条目70aa、70ab不从发射器150发送,而是从可操作地连接到接收器160中的解码器50的智能消隐设备140传输。如果其由发射器150发送,那么发射器150发送的更新212中将不会存在缩减。不传输增量变化。其在接收器中在两个连续更新之间自动产生,以使从一个背景噪声35向另一背景噪声的转变平滑。
触发1/8速率原型更新
在说明性实施例中,如果已触发背景噪声35的更新且如果新的1/8速率帧70包含不同于上一个所发送的帧的噪声值,那么发射器150在无声周期期间将更新212发送到接收器160。以此方式,在需要时更新背景信息35。触发可取决于若干因素。在一个实施例中,触发可基于帧能量的差异。
图13说明触发可基于帧能量的差异的实施例。在此实施例中,发射器150保存由编码器80产生的每个稳定1/8速率帧210的平均能量的经滤波值(500)。接着,将上次发送的原型215中所含的能量与每个稳定1/8数据速率帧的当前经滤波平均能量进行比较510。接着,确定上次发送的原型215中所含的能量与当前经滤波平均值之间的差值或Δ是否大于阈值245(520)。如果答案为是,那么触发更新212且传输包含新的噪声值的新的1/8速率帧70(530)。使用背景噪声35的运行平均值来计算所述差值,以避免由于触发更新帧212的传输而产生的峰值。所使用的差值基于质量或通过量可以是固定的或适应性的。
在另一实施例中,触发可基于频谱差异。在此实施例中,发射器150保存由编码器80产生的稳定1/8速率帧210中所含的密码本条目71、73之间的频谱差异的每密码本65的经滤波值(600)。接着,将此经滤波的频谱差异与阈值进行比较(610)。接着,确定上次传输的原型215的频谱与稳定1/8速率帧210中所含的密码本条目71、73之间的经滤波的频谱差异之间的差值或Δ是否大于其阈值(SDT1和SDT2)235(620)。如果是,那么触发更新212(630)。图14中对此进行说明。
如上所述,背景噪声35音量或能量的变化以及背景噪声35频谱的变化均可用作触发175。在智能消隐方法和设备的先前运行的试验中,音量的2db变化已触发更新帧212。并且,40%的频谱变化已用于触发频率变化212。
计算频谱差异
如之前所述,使用线性预测系数(LPC)滤波器(或线性预测编码滤波器)来提取背景噪声35的频率特性。线性预测编码是一种通过同一序列的先前样本的线性组合来预测序列的将来样本的方法。通常以由两个不同密码本65产生的系数72的线性差与密码本65的频谱差成比例的方式来编码频谱信息。图3所示的模型参数估计器100执行LPC分析以产生一组线性预测系数(LPC)72和最佳音调延迟(τ)。其将LPC 72转换为线性频谱对(LSP)。线性频谱对(LSP)是伪频域中的数字滤波器系数72的表示。此表示具有良好的量化和内插特性。
在实施ECRV声码器60的说明性实施例中,可使用以下两个等式来计算频谱差异。
Figure S2006800091837D00141
在以上等式中,LSPIDX1是包含“低频”频谱信息的密码本65,且LSPIDX2是包含“高频”频谱信息的密码本65。n和m是两个不同的密码本条目71。qrate是量化的LSP参数。其具有3个指数k、i、j。k是针对LSPIDX1和LSPIDX2变化的表号,其中k=1、2。i是一个量化的元素,其属于同一密码本条目71,其中i=1、2、3、4、5。 j是密码本条目71,即实际上在通信信道上传输的编号,j对应于m和n。m和n用于以上等式中而代替j,因为由于计算两个密码本之间的差值而需要两个变量。图4中,密码本LSPIDX1和LSPIDX2由密码本条目71表示,且密码本FGIDX由密码本条目73表示。
每一密码本条目71解码为5个数字。为了将来自不同帧的两个密码本条目71进行比较,取5个数字的每一者的绝对差的总和。结果是这两个密码本条目71之间的频率/频谱“距离”。
图15中描绘针对“低频”LSP和“高频”LSP的频谱密码本条目71的变化。x轴表示密码本条目71之间的差异。y轴表示具有x轴上所表示的差异的密码本条目71的百分比。
建立新的原型1/8速率帧
当需要更新时,可基于密码本65中所含的信息来建立新的原型1/8速率帧70。图4说明包含来自之前所述的三个密码本65FGIDX、LSPIDX1和LSPIDX2的条目的1/8帧70。当建立新的原型215时,所选择的密码本65可表示当前背景噪声35。
在一个实施例中,发射器150将由编码器80产生的每个稳定1/8速率帧210的平均能量的经滤波值保存在存储在存储器130中的“能量密码本”65(例如,FGIDX密码本65)中。当需要更新时,使用原型1/8速率帧215将最接近经滤波值的FGIDX密码本65中的平均能量值传输到接收器160。
在另一实施例中,发射器150保存由编码器80产生的包含频谱信息的密码本65的经滤波柱状图。所述频谱信息可以是“低频”或“高频”信息,例如存储在存储器130中的LSPIDX1(低频)或LSPIDX2(高频)密码本65。对于1/8速率帧更新212,使用“最普及”密码本65来通过选择柱状图最接近经滤波值的频谱信息密码本65中的平均能量值而产生用于背景噪声35的更新值。
通过保存最近N个密码本条目71的柱状图,本发明方法和设备避免必须计算表示1/8速率帧的最新平均值的密码本条目71。这表示操作时间减少。
触发阈值
可以若干方式设置原型更新触发阈值245。这些方法包含(但不限于)使用“固定”和“适应性”阈值245。在实施固定阈值的实施例中,将固定值指定到不同的阈值245。此固定值可以额外开销与背景噪声35质量之间的所需折衷为目标。在实施适应性阈值的实施例中,可针对阈值245的每一者使用控制回路。所述控制回路以由阈值245的每一者触发的更新212的特定百分比为目标。
用作目标的百分比可用不超过目标全局额外开销的目的来界定。此额外开销界定为在由编码器80产生的总数目的稳定1/8速率帧210上传输的更新212的百分比。控制回路将保持对每阈值245的经滤波额外开销的跟踪。如果额外开销在目标以上,那么其将使阈值245增加Δ,否则其使阈值245减小Δ。
保活包触发
如果不发送包的时段超过阈值时间,那么正发生通信的网络或实施声音通信的应用程序可能变得混乱并认为双方之间的通信已终止。其接着将使双方断开连接。为了避免发生这种情况,在阈值时间已期满之前发送保活包以更新原型。图16中说明所述步骤。测量自发送上一更新212之后过去的时间700。过去的时间是否大于阈值245?(710)。如果是,那么触发更新212(720)。
初始化
图17是说明当初始化位于声码器60中的编码器80和解码器50时执行的步骤的流程图。将编码器80初始化为非无声或声音状态,即无声_状态=错误800。以两个参数对解码器50进行初始化:i)状态=无声,即无声_状态=正确810,和ii)将原型设定为安静(低音量)帧(例如,1/8帧)820。因此,解码器50初始输出背景噪声。原因是,当启始呼叫时,发射器直到连接完成才发送信息,但接收器方需要在连接完成之前播放某内容(背景噪声)。
智能消隐方法的额外应用
本文件中定义的算法可容易地扩展而与RFC3389结合使用并涵盖本申请案中未列举的其它声码器。这些包含(但不限于)G711、G727、G.728、G.722等。
所属领域的技术人员将了解,可使用多种不同技术和方法中的任一者来表示信息和信号。举例来说,以上全部描述内容中可参考的数据、指令、命令、信息、信号、位、符号和码片可由电压、电流、电磁波、磁场或粒子、光场或粒子,或其任何组合表示。
技术人员将进一步了解,结合本文揭示的实施例描述的各种说明性逻辑块、模块、电路和算法步骤可实施为电子硬件、计算机软件,或两者的组合。为了清楚地说明硬件与软件的这种可交换性,上文已大体上根据各种说明性组件、块、模块、电路和步骤的功能描述了所述各种说明性组件、块、模块、电路和步骤。此功能实施为硬件还是软件取决于特定应用和施加于整个***的设计约束。熟练的技术人员可针对每一特定应用以不同方式实施所述功能,但这些实施决策不应被解释为导致偏离本发明的范围。
结合本文所揭示的实施例而描述的各种说明性逻辑块、模块和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、场可编程门阵列(FPGA)或其它可编程逻辑装置、分立门或晶体管逻辑、分立硬件组件或经设计以执行本文所描述的功能的其任何组合来实施或执行。通用处理器可以是微处理器,但在替代实施例中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器也可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心结合的一个或一个以上微处理器,或任何其它此类配置。
结合本文所揭示的实施例而描述的方法或算法的步骤可直接用硬件、由处理器执行的软件模块或所述两者的组合来实施。软件模块可驻存在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或此项技术中已知的任何其它形式的存储媒体中。说明性存储媒体耦合到处理器,使得处理器可从存储媒体读取信息以及向存储媒体写入信息。在代替实施例中,存储媒体可与处理器成一体。处理器和存储媒体可驻存在ASIC中。ASIC可驻存在用户终端中。在代替实施例中,处理器和存储媒体可作为分立组件而驻存在用户终端中。
提供所揭示的实施例的先前描述以使所属领域的技术人员能够制造或使用本发明。所属领域的技术人员将易于了解对这些实施例的各种修改,且本文定义的一般原理可在不偏离本发明精神或范围的情况下应用于其它实施例。因此,不希望本发明限于本文展示的实施例,而是本发明应符合与本文揭示的原理和新颖特征一致的最广泛范围。

Claims (87)

1.一种传送背景噪声的方法,其包括以下步骤:
传输所述背景噪声;
消隐用于传送所述背景噪声的后续背景噪声数据速率帧;
接收所述背景噪声;以及
更新所述背景噪声。
2.根据权利要求1所述的传送背景噪声的方法,其进一步包括触发的步骤。
3.根据权利要求1所述的传送背景噪声的方法,其进一步包括播放背景噪声的步骤,其中所述播放背景噪声的步骤包括:
输出随机数字序列形式的白噪声,以及
提取所述白噪声的频率特性。
4.根据权利要求1所述的方法,其进一步包括以下步骤:在发送更新背景噪声数据速率帧之前等待直到所述背景噪声数据速率帧中的至少一者已被发送为止,藉此传输稳定的背景噪声速率帧。
5.根据权利要求1所述的方法,其进一步包括以下步骤:在发送更新背景噪声帧之前等待直到上一暂时背景噪声数据速率帧已被发送之后40到100ms为止,藉此传输稳定的背景噪声速率帧。
6.根据权利要求1所述的传送背景噪声的方法,其进一步包括在阈值时间已期满之前传输保活包的步骤。
7.根据权利要求1所述的传送背景噪声的方法,其进一步包括初始化编码器和解码器的步骤,其中所述初始化编码器和解码器的步骤包括:
将所述编码器的状态设定为声音状态;
将所述解码器的状态设定为无声状态;以及
将原型设定为1/8数据速率帧。
8.根据权利要求1所述的传送背景噪声的方法,其进一步包括混合所述背景噪声的步骤。
9.根据权利要求1所述的传送背景噪声的方法,其进一步包括当未接收到所述背景噪声数据速率帧时播放擦除的步骤。
10.根据权利要求1所述的传送背景噪声的方法,其中所述更新所述背景噪声的步骤包括:传输具有至少一个密码本条目的更新背景噪声数据速率帧。
11.根据权利要求1所述的传送背景噪声的方法,其中所述传输所述背景噪声的步骤包括:
接收帧;
确定所述帧是否为无声帧;
当所述帧不是所述无声帧时,转变为活动状态并传输所述帧;
当所述帧是所述无声帧时,确定状态是否为无声状态;
当所述帧是所述无声帧且所述状态不处于所述无声状态时,转变为所述无声状态并将所述无声帧发送到接收器;
当所述帧是所述无声帧且所述状态处于所述无声状态时,确定所述帧是否稳定;
当所述帧稳定时,更新统计资料并确定是否触发了更新;以及
当触发了所述更新时,建立并发送原型帧。
12.根据权利要求11所述的传送背景噪声的方法,其中所述传输所述背景噪声的步骤进一步包括当所述帧不稳定时传输暂时背景噪声数据速率帧的步骤。
13.根据权利要求1所述的传送背景噪声的方法,其中所述接收所述背景噪声的步骤包括以下步骤:
接收帧;
确定所述帧是否为声音帧;
当所述帧是所述声音帧时,确定状态是否为声音状态;
当所述状态是所述声音状态且所述帧是所述声音帧时,播放所述帧;
当所述帧不是所述声音帧时,检查所述帧是否为无声帧;
当所述帧是所述无声帧时,检查所述状态是否为无声状态;
当所述帧是所述无声帧且所述状态不是所述无声状态时,转变为所述无声状态并播放所述帧;
当所述帧是所述无声帧且所述状态是所述无声状态时,产生更新并播放所述更新;
当所述帧不是所述声音帧或所述无声帧时,检查所述状态是否为所述无声状态;
当所述状态是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放原型帧;
当所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,检查是否已发送N个连续擦除;
当尚未发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放擦除;以及
当已发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,转变为所述无声状态并播放所述原型帧。
14.根据权利要求2所述的传送背景噪声的方法,其中所述触发的步骤包括:
对所述背景噪声数据速率帧进行滤波;
将所述背景噪声数据速率帧的能量与所述背景噪声数据速率帧的平均能量进行比较;以及
当差值超过阈值时,传输更新背景噪声数据速率帧。
15.根据权利要求2所述的传送背景噪声的方法,其中所述触发的步骤包括:
对所述背景噪声数据速率帧进行滤波;
将所述背景噪声数据速率帧的频谱与所述背景噪声数据速率帧的平均频谱进行比较;以及
当差值超过阈值时,传输更新背景噪声数据速率帧。
16.根据权利要求2所述的传送背景噪声的方法,其进一步包括当未接收到帧时播放擦除的步骤。
17.根据权利要求8所述的传送背景噪声的方法,其中所述混合的步骤包括将所述背景噪声从先前更新值逐渐改变为新的更新值。
18.根据权利要求9所述的传送背景噪声的方法,其中所述擦除被播放小于或等于所述时间的50%。
19.根据权利要求14所述的传送背景噪声的方法,其中所述阈值等于或大于1db。
20.根据权利要求14所述的传送背景噪声的方法,其中所述传输更新背景噪声数据速率帧的步骤包括传输至少一个密码本条目。
21.根据权利要求15所述的传送背景噪声的方法,其中所述将所述背景噪声数据速率帧的频谱与所述背景噪声数据速率帧的平均频谱进行比较的步骤包括针对所述背景噪声数据速率帧取密码本条目的元素的绝对差的总和。
22.根据权利要求15所述的传送背景噪声的方法,其中所述阈值等于或大于40%。
23.根据权利要求15所述的传送背景噪声的方法,其中所述传输更新背景噪声数据速率帧的步骤包括传输至少一个密码本条目。
24.根据权利要求16所述的传送背景噪声的方法,其中所述擦除被播放小于或等于所述时间的50%。
25.根据权利要求20所述的传送背景噪声的方法,其中所述至少一个密码本条目包括至少一个能量密码本条目和至少一个频谱密码本条目。
26.根据权利要求25所述的传送背景噪声的方法,其中所述更新包括最频繁使用的密码本条目。
27.一种传送背景噪声的方法,其包括以下步骤:
传输背景噪声,包括以下步骤
接收帧,
确定所述帧是否为无声帧,
当所述帧不是无声帧时,转变为活动状态并传输所述帧,
当所述帧是所述无声帧时,确定状态是否为无声状态,
当所述帧是所述无声帧且所述状态不处于所述无声状态时,转变为所述无声状态并将所述无声帧发送到接收器,
当所述帧是所述无声帧且所述状态处于所述无声状态时,确定所述帧是否稳定,
当所述帧稳定时,更新统计资料并确定是否触发了更新,以及
当触发了所述更新时,建立并发送原型帧;以及
接收背景噪声,包括以下步骤
接收所述帧,
确定所述帧是否为声音帧,
当所述帧是所述声音帧时,确定所述状态是否为声音状态,
当所述状态是所述声音状态且所述帧是所述声音帧时,播放所述帧,
当所述帧不是所述声音帧时,检查所述帧是否为所述无声帧,
当所述帧是所述无声帧时,检查所述状态是否为所述无声状态,
当所述帧是所述无声帧且所述状态不是所述无声状态时,转变为所述无声状态并播放所述帧,
当所述帧是所述无声帧且所述状态是所述无声状态时,产生更新并播放所述更新,
当所述帧不是所述声音帧或所述无声帧时,检查状态是否为所述无声状态,
当所述状态是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放所述原型帧,
当所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,检查是否已发送N个连续擦除,
当尚未发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放擦除,以及
当已发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,转变为所述无声状态并播放所述原型帧。
28.一种用于传送背景噪声的设备,其包括:
至少一个声码器,其具有至少一个输入和至少一个输出,其包括
解码器,其具有至少一个输入和至少一个输出,以及
编码器,其具有至少一个输入和至少一个输出;
至少一个智能消隐设备,其具有存储器以及至少一个输入和至少一个输出,其中所述至少一个输入的第一者可操作地连接到所述声码器的所述至少一个输出,且所述至少一个输出可操作地连接到所述声码器的所述至少一个输入;
去抖动缓冲器,其具有至少一个输入和至少一个输出,其中所述至少一个输出可操作地连接到所述智能消隐器的所述至少一个输入的第二者;以及
网络堆栈,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述去抖动缓冲器的所述至少一个输入,且所述至少一个输入可操作地连接到所述智能消隐设备的所述至少一个输出。
29.根据权利要求28所述的传送背景噪声的设备,其中所述解码器包括:
松弛码激励线性预测解码器,其具有多个输入和至少一个输出,其中所述松弛码激励线性预测解码器包括背景噪声产生器;
帧误差检测设备,其具有多个输入和至少一个输出,其中所述帧误差检测设备的所述多个输入的第一者可操作地连接到所述松弛码激励线性预测解码器的多个输入的第一者,所述帧误差检测设备的所述多个输入的第二者可操作地连接到所述松弛码激励线性预测解码器的多个输入的第二者;以及
后置滤波器,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述松弛码激励线性预测解码器的所述至少一个输出。
30.根据权利要求28所述的传送背景噪声的设备,其中所述编码器包括:
信号处理器,其具有至少一个输入和至少一个输出;
模型估计器,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述信号处理器的所述至少一个输出;
速率确定器,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述模型参数估计器的所述至少一个输出的第一者;
1/8速率编码器,其具有至少一个输入和至少一个输出;
全速率编码器,其具有至少一个输入和至少一个输出;
第一切换器,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述模型参数估计器的所述至少一个输出,所述至少一个输出的第一者可操作地连接到所述1/8速率编码器的所述至少一个输入,且所述至少一个输出的第二者可操作地连接到所述全速率编码器的所述至少一个输入;
第二切换器,其具有至少一个输入和至少一个输出,其中所述至少一个输入的第一者可操作地连接到所述1/8速率编码器的所述至少一个输出,且所述至少一个输入的第二者可操作地连接到所述全速率编码器的所述至少一个输出;以及包格式化器,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述第二切换器的所述至少一个输出。
31.根据权利要求28所述的传送背景噪声的设备,其中所述编码器包括:
信号处理器,其具有至少一个输入和至少一个输出;
模型估计器,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述信号处理器的所述至少一个输出;
速率确定器,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述模型参数估计器的所述至少一个输出的第一者;
1/8速率编码器,其具有至少一个输入和至少一个输出;
1/2速率编码器,其具有至少一个输入和至少一个输出;
第一切换器,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述模型参数估计器的所述至少一个输出,所述至少一个输出的第一者可操作地连接到所述1/8速率编码器的所述至少一个输入,且所述至少一个输出的第二者可操作地连接到所述1/2速率编码器的所述至少一个输入;
第二切换器,其具有至少一个输入和至少一个输出,其中所述至少一个输入的第一者可操作地连接到所述1/8速率编码器的所述至少一个输出,且所述至少一个输入的第二者可操作地连接到所述1/2速率编码器的所述至少一个输出;以及包格式化器,其具有至少一个输入和至少一个输出,其中所述至少一个输入可操作地连接到所述第二切换器的所述至少一个输出。
32.根据权利要求28所述的传送背景噪声的设备,其中所述存储器进一步包括:
密码本,其包括密码本条目,所述密码本条目具有背景能量密码本条目和背景频谱密码本条目。
33.根据权利要求28所述的传送背景噪声的设备,其中所述智能消隐设备适于执行存储在所述存储器中的指令,包括:
传输所述背景噪声;
消隐用于传送所述背景噪声的后续背景噪声数据速率帧;
接收所述背景噪声;以及
更新所述背景噪声。
34.根据权利要求28所述的传送背景噪声的设备,其中所述智能消隐设备适于执行存储在所述存储器中的指令,包括:
传输背景噪声,包括以下步骤
接收帧,
确定所述帧是否为无声帧,
当所述帧不是所述无声帧时,转变为活动状态并传输所述帧,
当所述帧是所述无声帧时,确定所述状态是否为无声状态,
当所述帧是所述无声帧且所述状态不处于所述无声状态时,转变为所述无声状态并将所述无声帧发送到接收器,
当所述帧是所述无声帧且所述状态处于所述无声状态时,确定所述帧是否稳定,
当所述帧稳定时,更新统计资料并确定是否触发了更新,以及
当触发了所述更新时,建立并发送原型帧;以及
接收所述背景噪声,包括以下步骤
接收所述帧,
确定所述帧是否为声音帧,
当所述帧是所述声音帧时,确定所述状态是否为声音状态,
当所述状态是所述声音状态且所述帧是所述声音帧时,播放所述帧,
当所述帧不是所述声音帧时,检查所述帧是否为所述无声帧,
当所述帧是所述无声帧时,检查所述状态是否为所述无声状态,
当所述帧是所述无声帧且所述状态不是所述无声状态时,转变为所述无声状态并播放所述帧,
当所述帧是所述无声帧且所述状态是所述无声状态时,产生更新并播放所述更新,
当所述帧不是所述声音帧或所述无声帧时,检查所述状态是否为所述无声状态,
当所述状态是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放所述原型帧,
当所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,检查是否已发送N个连续擦除,
当尚未发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放擦除,以及
当已发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,转变为所述无声状态并播放所述原型帧。
35.根据权利要求29所述的传送背景噪声的设备,其中所述背景噪声产生器包括:
噪声产生器,其具有至少一个输入和至少一个输出;以及
LPC滤波器,其具有至少一个输入和至少一个输出,其中所述LPC滤波器的所述至少一个输入可操作地连接到所述噪声产生器的所述至少一个输出。
36.根据权利要求32所述的传送背景噪声的设备,其中所述智能消隐设备适于执行存储在所述存储器中的指令,包括:
传输所述背景噪声;
消隐用于传送所述背景噪声的后续背景噪声数据速率帧;
接收所述背景噪声;以及
通过传输具有所述密码本条目中的至少一者的更新背景噪声数据速率帧来更新所述背景噪声。
37.根据权利要求33所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的触发指令。
38.根据权利要求33所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的播放背景噪声指令,其中所述播放背景噪声指令包括:
输出随机数字序列形式的白噪声,以及
提取所述白噪声的频率特性。
39.根据权利要求33所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,包括:
在发送更新背景噪声数据速率帧之前等待直到所述背景噪声数据速率帧中的至少一者为止,藉此传输稳定的背景噪声数据速率帧。
40.根据权利要求33所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,包括:
在发送更新背景噪声数据速率帧之前等待直到上一暂时背景噪声数据速率帧已被发送之后40到100ms为止,藉此传输稳定的背景噪声数据速率帧。
41.根据权利要求33所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,包括:
在阈值时间已期满之前传输保活包。
42.根据权利要求33所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,所述指令包括初始化编码器和解码器,其中所述初始化编码器和解码器指令包括:
将所述编码器的状态设定为声音;
将所述解码器的状态设定为无声;以及
将原型设定为1/8数据速率帧。
43.根据权利要求33所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,所述指令包括混合所述背景噪声。
44.根据权利要求33所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,所述指令包括当未接收到所述背景噪声数据速率帧时播放擦除。
45.根据权利要求33所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的指令,所述指令包括传输所述背景噪声,其中所述指令进一步包括:
接收帧;
确定所述帧是否为无声帧;
当所述帧不是所述无声帧时,转变为活动状态并传输所述帧;
当所述帧是无声帧时,确定状态是否为无声状态;
当所述帧是所述无声帧且所述状态不处于所述无声状态时,转变为所述无声状态并将所述无声帧发送到接收器;
当所述帧是所述无声帧且所述状态处于所述无声状态时,确定所述帧是否稳定;
当所述帧稳定时,更新统计资料并确定是否触发了更新;以及
当触发了所述更新时,建立并发送原型帧。
46.根据权利要求33所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的指令,所述指令包括接收所述背景噪声,其中所述指令进一步包括:
接收帧;
确定所述帧是否为声音帧;
当所述帧是所述声音帧时,确定状态是否为声音状态;
当所述状态是所述声音状态且所述帧是所述声音帧时,播放所述帧;
当所述帧不是声音帧时,检查所述帧是否为无声帧;
当所述帧是所述无声帧时,检查所述状态是否为无声状态;
当所述帧是所述无声帧且所述状态不是所述无声状态时,转变为无声状态并播放所述帧;
当所述帧是所述无声帧且所述状态是所述无声状态时,产生更新并播放所述更新;
当所述帧不是所述声音帧或所述无声帧时,检查所述状态是否为所述无声状态;
当所述状态是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放原型帧;
当所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,检查是否已发送N个连续擦除;
当尚未发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放擦除;以及
当已发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,转变为所述无声状态并播放所述原型帧。
47.根据权利要求36所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的触发指令,其中所述触发指令包括:
对背景噪声速率帧进行滤波;
将所述背景噪声数据速率帧的能量与所述背景噪声数据速率帧的平均能量进行比较;以及
当差值超过阈值时,传输更新背景噪声数据速率帧,其中所述更新背景噪声数据速率帧包括所述密码本条目中的至少一者。
48.根据权利要求36所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的触发指令,其中所述触发指令包括:
对背景噪声数据速率帧进行滤波;
将所述背景噪声数据速率帧的频谱与所述背景噪声数据速率帧的平均频谱进行比较;以及
当差值超过阈值时,传输更新背景噪声数据速率帧,其中所述更新背景噪声数据速率帧包括所述密码本条目中的至少一者。
49.根据权利要求37所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的所述触发指令,其中所述触发指令包括:
对所述背景噪声数据速率帧进行滤波;
将所述背景噪声数据速率帧的能量与所述背景噪声数据速率帧的平均能量进行比较;以及
当差值超过阈值时,传输更新背景噪声数据速率帧。
50.根据权利要求37所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的所述触发指令,其中所述触发指令包括:
对背景噪声速率帧进行滤波;
将所述背景噪声数据帧的频谱与所述背景噪声数据速率帧的平均频谱进行比较;
以及
当差值超过阈值时,传输更新背景噪声数据速率帧。
51.根据权利要求37所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,所述指令包括当未接收到帧时播放擦除。
52.根据权利要求43所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的混合指令,其中所述混合指令进一步包括将背景从先前更新值逐渐改变为新的更新值。
53.根据权利要求44所述的传送背景噪声的设备,其中所述擦除被播放小于或等于所述时间的50%。
54.根据权利要求45所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的指令,所述指令包括传输所述背景噪声,其中所述指令进一步包括:
当所述帧不稳定时传输暂时背景噪声数据速率帧。
55.根据权利要求47所述的传送背景噪声的设备,其中所述密码本条目中的至少一者包括至少一个能量密码本条目和至少一个频谱密码本条目。
56.根据权利要求49所述的传送背景噪声的设备,其中所述阈值等于或大于1db。
57.根据权利要求50所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述通过针对所述背景噪声数据速率帧取密码本条目的元素的绝对差的总和而将所述背景噪声数据速率帧的频谱与所述背景噪声数据速率帧的平均频谱进行比较的指令。
58.根据权利要求50所述的传送背景噪声的设备,其中所述阈值等于或大于40%。
59.根据权利要求55所述的传送背景噪声的设备,其中所述擦除被播放小于或等于所述时间的50%。
60.根据权利要求57所述的传送背景噪声的设备,其中所述更新背景噪声数据速率帧包括最频繁使用的密码本条目。
61.一种智能消隐设备,其包括:
存储器;
软件,其包括存储在所述存储器中的指令;以及
至少一个输入和至少一个输出,其中所述智能消隐设备适于执行存储在所述存储器中的指令,包括:
传输背景噪声,
消隐用于传送所述背景噪声的后续背景噪声数据速率帧,
接收所述背景噪声,以及
更新所述背景噪声。
62.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的指令,所述指令包括传输所述背景噪声,其中所述指令进一步包括:
接收帧,
确定所述帧是否为无声帧,
当所述帧不是所述无声帧时,转变为活动状态并传输所述帧,
当所述帧是所述无声帧时,确定所述状态是否为无声状态,
当所述帧是所述无声帧且所述状态不处于所述无声状态时,转变为所述无声状态并将所述无声帧发送到接收器,
当所述帧是所述无声帧且所述状态处于所述无声状态时,确定所述帧是否稳定,
当所述帧稳定时,更新统计资料并确定是否触发了更新,以及
当触发了所述更新时,建立并发送原型帧;以及
其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的指令,所述指令包括接收所述背景噪声,其中所述指令进一步包括:
接收所述帧,
确定所述帧是否为声音帧,
当所述帧是所述声音帧时,确定所述状态是否为声音状态,
当所述状态是所述声音状态且所述帧是所述声音帧时,播放所述帧,
当所述帧不是所述声音帧时,检查所述帧是否为所述无声帧,
当所述帧是所述无声帧时,检查所述状态是否为所述无声状态,
当所述帧是所述无声帧且所述状态不是所述无声状态时,转变为所述无声状态并播放所述帧,
当所述帧是所述无声帧且所述状态是所述无声状态时,产生更新并播放所述更新,
当所述帧不是所述声音帧或所述无声帧时,检查所述状态是否为所述无声状态,
当所述状态是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放所述原型帧,
当所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,检查是否已发送N个连续擦除,
当尚未发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放擦除,以及
当已发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,转变为所述无声状态并播放所述原型帧。
63.根据权利要求61所述的传送背景噪声的设备,其中所述存储器进一步包括:
密码本,其包括密码本条目,所述密码本条目具有背景能量密码本条目和背景频谱密码本条目;以及
其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的指令,所述指令包括更新所述背景噪声,其中所述指令进一步包括传输具有至少一个密码本条目的更新背景噪声数据速率帧。
64.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的触发指令。
65.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的播放背景噪声指令,其中所述播放背景噪声指令包括:
输出随机数字序列形式的白噪声,以及
提取所述白噪声的频率特性。
66.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,包括:
在发送更新背景噪声数据速率帧之前等待直到所述背景噪声数据速率帧中的至少一者为止,藉此传输稳定的背景噪声数据速率帧。
67.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,包括:
在发送更新背景噪声数据速率帧之前等待直到上一暂时背景噪声数据速率帧已被发送之后40到100ms为止,藉此传输稳定的背景噪声数据速率帧。
68.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,包括:
在阈值时间已期满之前传输保活包。
69.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,所述指令包括初始化编码器和解码器,其中所述初始化编码器和解码器指令包括:
将所述编码器的状态设定为声音;
将所述解码器的状态设定为无声;以及
将原型设定为1/8数据速率帧。
70.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,所述指令包括混合所述背景噪声。
71.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,所述指令包括当未接收到所述背景噪声数据速率帧时播放擦除。
72.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的指令,所述指令包括传输所述背景噪声,其中所述指令进一步包括:
接收帧;
确定所述帧是否为无声帧;
当所述帧不是所述无声帧时,转变为活动状态并传输所述帧;
当所述帧是无声帧时,确定状态是否为无声状态;
当所述帧是所述无声帧且所述状态不处于所述无声状态时,转变为所述无声状态并将所述无声帧发送到接收器;
当所述帧是所述无声帧且所述状态处于所述无声状态时,确定所述帧是否稳定;
当所述帧稳定时,更新统计资料并确定是否触发了更新;以及
当触发了所述更新时,建立并发送原型帧。
73.根据权利要求61所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的指令,所述指令所述包括接收所述背景噪声,其中
所述指令进一步包括:
接收帧;
确定所述帧是否为声音帧;
当所述帧是所述声音帧时,确定状态是否为声音状态;
当所述状态是所述声音状态且所述帧是所述声音帧时,播放所述帧;
当所述帧不是声音帧时,检查所述帧是否为无声帧;
当所述帧是所述无声帧时,检查所述状态是否为无声状态;
当所述帧是所述无声帧且所述状态不是所述无声状态时,转变为无声状态并播放所述帧;
当所述帧是所述无声帧且所述状态是所述无声状态时,产生更新并播放所述更新;
当所述帧不是所述声音帧或所述无声帧时,检查所述状态是否为所述无声状态;
当所述状态是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放原型帧;
当所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,检查是否已发送N个连续擦除;
当尚未发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,播放擦除;以及
当已发送N个连续擦除,所述状态不是所述无声状态且所述帧不是所述声音帧或所述无声帧时,转变为所述无声状态并播放所述原型帧。
74.根据权利要求63所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的触发指令,其中所述触发指令包括:
对背景噪声速率帧进行滤波;
将所述背景噪声数据速率帧的能量与所述背景噪声数据速率帧的平均能量进行比较;以及
当差值超过阈值时,传输更新背景噪声数据速率帧,其中所述更新背景噪声数据速率帧包括所述密码本条目中的至少一者。
75.根据权利要求63所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的触发指令,其中所述触发指令包括:
对背景噪声数据速率帧进行滤波;
将所述背景噪声数据速率帧的频谱与所述背景噪声数据速率帧的平均频谱进行比较;以及
当差值超过阈值时,传输更新背景噪声数据速率帧,其中所述更新背景噪声数据速率帧包括所述密码本条目中的至少一者。
76.根据权利要求64所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的所述触发指令,其中所述触发指令包括:
对所述背景噪声数据速率帧进行滤波;
将所述背景噪声数据速率帧的能量与所述背景噪声数据速率帧的平均能量进行比较;以及
当差值超过阈值时,传输更新背景噪声数据速率帧。
77.根据权利要求64所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的触发指令,其中所述触发指令包括:
对背景噪声速率帧进行滤波;
将所述背景噪声数据帧的频谱与所述背景噪声数据速率帧的平均频谱进行比较;
以及
当差值超过阈值时,传输更新背景噪声数据速率帧。
78.根据权利要求64所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行存储在所述存储器中的指令,所述指令包括当未接收到帧时播放擦除。
79.根据权利要求70所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的混合指令,其中所述混合指令进一步包括将背景从先前更新值逐渐改变为新的更新值。
80.根据权利要求71所述的传送背景噪声的设备,其中所述擦除被播放小于或等于所述时间的50%。
81.根据权利要求72所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述存储在所述存储器中的指令,所述指令包括传输所述背景噪声,其中所述指令进一步包括:
当所述帧不稳定时传输暂时背景噪声数据速率帧。
82.根据权利要求47所述的传送背景噪声的设备,其中所述密码本条目中的至少一者包括至少一个能量密码本条目和至少一个频谱密码本条目。
83.根据权利要求76所述的传送背景噪声的设备,其中所述阈值等于或大于1db。
84.根据权利要求77所述的传送背景噪声的设备,其中所述智能消隐设备进一步适于执行所述通过针对所述背景噪声数据速率帧取密码本条目的元素的绝对差的总和而将所述背景噪声数据速率帧的频谱与所述背景噪声数据速率帧的平均频谱进行比较的指令。
85.根据权利要求77所述的传送背景噪声的设备,其中所述阈值等于或大于40%。
86.根据权利要求82所述的传送背景噪声的设备,其中所述擦除被播放小于或等于所述时间的50%。
87.根据权利要求84所述的传送背景噪声的设备,其中所述更新背景噪声数据速率帧包括最频繁使用的密码本条目。
CN200680009183.7A 2005-02-01 2006-02-01 背景噪声信息的非连续传输和准确再现的方法 Active CN101208740B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US64919205P 2005-02-01 2005-02-01
US60/649,192 2005-02-01
US11/123,478 2005-05-05
US11/123,478 US8102872B2 (en) 2005-02-01 2005-05-05 Method for discontinuous transmission and accurate reproduction of background noise information
PCT/US2006/003640 WO2006084003A2 (en) 2005-02-01 2006-02-01 Method for discontinuous transmission and accurate reproduction of background noise information

Publications (2)

Publication Number Publication Date
CN101208740A true CN101208740A (zh) 2008-06-25
CN101208740B CN101208740B (zh) 2015-11-25

Family

ID=36553037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680009183.7A Active CN101208740B (zh) 2005-02-01 2006-02-01 背景噪声信息的非连续传输和准确再现的方法

Country Status (7)

Country Link
US (1) US8102872B2 (zh)
EP (1) EP1849158B1 (zh)
JP (3) JP2008530591A (zh)
KR (1) KR100974110B1 (zh)
CN (1) CN101208740B (zh)
TW (1) TWI390505B (zh)
WO (1) WO2006084003A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103918322A (zh) * 2011-11-02 2014-07-09 高通股份有限公司 用于在无线通信***中自适应地启用不连续发送(dtx)的装置和方法
CN107786317A (zh) * 2016-08-31 2018-03-09 乐视汽车(北京)有限公司 一种降噪数据传输方法和设备
CN113571072A (zh) * 2021-09-26 2021-10-29 腾讯科技(深圳)有限公司 一种语音编码方法、装置、设备、存储介质及产品

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100964436B1 (ko) * 2004-08-30 2010-06-16 퀄컴 인코포레이티드 V o I P 용 적응성 디-지터 버퍼
US8085678B2 (en) * 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
KR20080003537A (ko) * 2006-07-03 2008-01-08 엘지전자 주식회사 이동 단말기의 통화 중 노이즈 제거 방법 및 이를 위한이동 단말기
US10084627B2 (en) * 2006-07-10 2018-09-25 Qualcomm Incorporated Frequency hopping in an SC-FDMA environment
US8208516B2 (en) * 2006-07-14 2012-06-26 Qualcomm Incorporated Encoder initialization and communications
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8848618B2 (en) * 2006-08-22 2014-09-30 Qualcomm Incorporated Semi-persistent scheduling for traffic spurts in wireless communication
US9064161B1 (en) * 2007-06-08 2015-06-23 Datalogic ADC, Inc. System and method for detecting generic items in image sequence
US8514754B2 (en) * 2007-10-31 2013-08-20 Research In Motion Limited Methods and apparatus for use in controlling discontinuous transmission (DTX) for voice communications in a network
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
US8554551B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US9202456B2 (en) * 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
WO2011103924A1 (en) * 2010-02-25 2011-09-01 Telefonaktiebolaget L M Ericsson (Publ) Switching off dtx for music
US9020550B2 (en) * 2010-03-29 2015-04-28 Telefonaktiebolaget L M Ericsson (Publ) Methods and apparatuses for radio resource allocation and identification
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US9686815B2 (en) 2011-11-02 2017-06-20 Qualcomm Incorporated Devices and methods for managing discontinuous transmission at a wireless access terminal
JP2014167525A (ja) * 2013-02-28 2014-09-11 Mitsubishi Electric Corp 音声復号装置
CN104378474A (zh) * 2014-11-20 2015-02-25 惠州Tcl移动通信有限公司 一种降低通话输入噪音的移动终端及其方法
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
US9924451B2 (en) * 2015-12-02 2018-03-20 Motorola Solutions, Inc. Systems and methods for communicating half-rate encoded voice frames
US10659112B1 (en) 2018-11-05 2020-05-19 XCOM Labs, Inc. User equipment assisted multiple-input multiple-output downlink configuration
US10812216B2 (en) 2018-11-05 2020-10-20 XCOM Labs, Inc. Cooperative multiple-input multiple-output downlink scheduling
US10756860B2 (en) 2018-11-05 2020-08-25 XCOM Labs, Inc. Distributed multiple-input multiple-output downlink configuration
US10432272B1 (en) 2018-11-05 2019-10-01 XCOM Labs, Inc. Variable multiple-input multiple-output downlink user equipment
US11290172B2 (en) 2018-11-27 2022-03-29 XCOM Labs, Inc. Non-coherent cooperative multiple-input multiple-output communications
US11063645B2 (en) 2018-12-18 2021-07-13 XCOM Labs, Inc. Methods of wirelessly communicating with a group of devices
US10756795B2 (en) 2018-12-18 2020-08-25 XCOM Labs, Inc. User equipment with cellular link and peer-to-peer link
US11330649B2 (en) 2019-01-25 2022-05-10 XCOM Labs, Inc. Methods and systems of multi-link peer-to-peer communications
US10756767B1 (en) 2019-02-05 2020-08-25 XCOM Labs, Inc. User equipment for wirelessly communicating cellular signal with another user equipment
US10735057B1 (en) 2019-04-29 2020-08-04 XCOM Labs, Inc. Uplink user equipment selection
US10686502B1 (en) 2019-04-29 2020-06-16 XCOM Labs, Inc. Downlink user equipment selection
US11411778B2 (en) 2019-07-12 2022-08-09 XCOM Labs, Inc. Time-division duplex multiple input multiple output calibration
TWI721522B (zh) 2019-08-12 2021-03-11 驊訊電子企業股份有限公司 音訊處理系統及方法
JP7191792B2 (ja) * 2019-08-23 2022-12-19 株式会社東芝 情報処理装置、情報処理方法およびプログラム
US11411779B2 (en) 2020-03-31 2022-08-09 XCOM Labs, Inc. Reference signal channel estimation

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR9206143A (pt) * 1991-06-11 1995-01-03 Qualcomm Inc Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置
TW271524B (zh) * 1994-08-05 1996-03-01 Qualcomm Inc
FI103700B1 (fi) * 1994-09-20 1999-08-13 Nokia Mobile Phones Ltd Samanaikainen puheen ja datan siirto matkaviestinjärjestelmässä
JPH08254997A (ja) * 1995-03-16 1996-10-01 Fujitsu Ltd 音声符号化・復号化方法
JPH08298523A (ja) * 1995-04-26 1996-11-12 Nec Corp ルータ
JP3157116B2 (ja) * 1996-03-29 2001-04-16 三菱電機株式会社 音声符号化伝送システム
GB2326308B (en) * 1997-06-06 2002-06-26 Nokia Mobile Phones Ltd Method and apparatus for controlling time diversity in telephony
JP3487158B2 (ja) * 1998-02-26 2004-01-13 三菱電機株式会社 音声符号化伝送システム
US6138040A (en) * 1998-07-31 2000-10-24 Motorola, Inc. Method for suppressing speaker activation in a portable communication device operated in a speakerphone mode
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
JP4438127B2 (ja) * 1999-06-18 2010-03-24 ソニー株式会社 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
DE69931783T2 (de) * 1999-10-18 2007-06-14 Lucent Technologies Inc. Verbesserung bei digitaler Kommunikationseinrichtung
AU1359601A (en) 1999-11-03 2001-05-14 Tellabs Operations, Inc. Integrated voice processing system for packet networks
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
JP4221537B2 (ja) 2000-06-02 2009-02-12 日本電気株式会社 音声検出方法及び装置とその記録媒体
US6907030B1 (en) * 2000-10-02 2005-06-14 Telefonaktiebolaget Lm Ericsson (Publ) System and method for decoding multiplexed, packet-based signals in a telecommunications network
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US7103025B1 (en) * 2001-04-19 2006-09-05 Cisco Technology, Inc. Method and system for efficient utilization of transmission resources in a wireless network
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
JP2003050598A (ja) * 2001-08-06 2003-02-21 Mitsubishi Electric Corp 音声復号装置
US6832195B2 (en) * 2002-07-03 2004-12-14 Sony Ericsson Mobile Communications Ab System and method for robustly detecting voice and DTX modes
CN100435485C (zh) * 2002-08-21 2008-11-19 广州广晟数码技术有限公司 用于从音频数据码流中解码重建多声道音频信号的解码器
JP4292767B2 (ja) 2002-09-03 2009-07-08 ソニー株式会社 データレート変換方法及びデータレート変換装置
WO2004034379A2 (en) 2002-10-11 2004-04-22 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US20060149536A1 (en) * 2004-12-30 2006-07-06 Dunling Li SID frame update using SID prediction error

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103918322A (zh) * 2011-11-02 2014-07-09 高通股份有限公司 用于在无线通信***中自适应地启用不连续发送(dtx)的装置和方法
CN103918322B (zh) * 2011-11-02 2015-11-25 高通股份有限公司 用于在无线通信***中自适应地启用不连续发送(dtx)的装置和方法
CN107786317A (zh) * 2016-08-31 2018-03-09 乐视汽车(北京)有限公司 一种降噪数据传输方法和设备
CN113571072A (zh) * 2021-09-26 2021-10-29 腾讯科技(深圳)有限公司 一种语音编码方法、装置、设备、存储介质及产品

Also Published As

Publication number Publication date
US20060171419A1 (en) 2006-08-03
WO2006084003A3 (en) 2006-12-07
EP1849158A2 (en) 2007-10-31
EP1849158B1 (en) 2012-06-13
TW200632869A (en) 2006-09-16
JP5730682B2 (ja) 2015-06-10
JP2011250430A (ja) 2011-12-08
CN101208740B (zh) 2015-11-25
KR100974110B1 (ko) 2010-08-04
KR20070100412A (ko) 2007-10-10
US8102872B2 (en) 2012-01-24
JP2013117729A (ja) 2013-06-13
WO2006084003A2 (en) 2006-08-10
TWI390505B (zh) 2013-03-21
JP5567154B2 (ja) 2014-08-06
JP2008530591A (ja) 2008-08-07

Similar Documents

Publication Publication Date Title
CN101208740B (zh) 背景噪声信息的非连续传输和准确再现的方法
US9047863B2 (en) Systems, methods, apparatus, and computer-readable media for criticality threshold control
JP2008530591A5 (zh)
JP5351206B2 (ja) 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法
KR101353847B1 (ko) 반향 검출 방법 및 장치
EP1204967B1 (en) Method and system for speech coding under frame erasure conditions
CN101789853B (zh) 处理重传请求方法、终端和对重传请求进行管理的方法
KR20120115961A (ko) 멀티 레이트 스피치와 오디오 코덱을 위한 프레임 손실 은닉 방법 및 장치
CN104917671A (zh) 基于移动终端的音频处理方法和装置
EP1312230A2 (en) Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
MXPA04007668A (es) Comunicacion de voz de inter-sistemas de tandem libre.
CN101636990A (zh) 在通信***中传输数据的方法
EP1212749A1 (en) Method and apparatus for interleaving line spectral information quantization methods in a speech coder
CN111681664A (zh) 一种降低音频编码码率的方法、***、存储介质及设备
CN1551516A (zh) 控制移动通信终端中噪声的装置和方法
CN1748244B (zh) 用于分布式语音识别的音高量化
US7542897B2 (en) Condensed voice buffering, transmission and playback
CN1780326A (zh) 通话音量自适应调节方法
US20050101301A1 (en) Apparatus and method for storing/reproducing voice in a wireless terminal
CN117894327A (zh) 一种语音的编码方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1113849

Country of ref document: HK

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1113849

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant