CN1151487C - 解码方法、语音编码处理设备和网络单元 - Google Patents

解码方法、语音编码处理设备和网络单元

Info

Publication number
CN1151487C
CN1151487C CNB998028290A CN99802829A CN1151487C CN 1151487 C CN1151487 C CN 1151487C CN B998028290 A CNB998028290 A CN B998028290A CN 99802829 A CN99802829 A CN 99802829A CN 1151487 C CN1151487 C CN 1151487C
Authority
CN
China
Prior art keywords
parameter
speech
stateless
block
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB998028290A
Other languages
English (en)
Other versions
CN1290389A (zh
Inventor
�����Ƥ��
皮卡·卡潘恩
ά˼��ŷ��
杰恩·维尼欧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Nokia Technologies Oy
Original Assignee
Nokia Networks Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Networks Oy filed Critical Nokia Networks Oy
Publication of CN1290389A publication Critical patent/CN1290389A/zh
Application granted granted Critical
Publication of CN1151487C publication Critical patent/CN1151487C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/18Service support devices; Network management devices
    • H04W88/181Transcoding devices; Rate adaptation devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

本发明涉及解码方法、语音编码处理设备和网络单元。本发明的基本构思在于,在BFH以及CNI处理期间,重编码块根据该BFH/CNI处理后的语音参数,产生编码后的语音参数的模式。这些编码后的语音参数模式接着被传送到接收端。本发明提供了对于TFO操作中的预测的、更一般非无状态编码器产生的问题的技术解决方案。

Description

解码方法、语音编码处理设备和网络单元
技术领域
本发明涉及移动蜂窝***中的自由汇接工作方式(TFO)。
背景技术
为方便起见,本说明书所使用的各个缩略语提供如下:
TFO           自由汇接工作方式
CNI           舒适噪声***
CN            舒适噪声
BFH           坏帧处理
UMS           上行链路移动台
DMS           下行链路移动台
UBS           上行链路基站
UTR           上行链路码型变换器
DTR           下行链路码型变换器
DBS           下行链路基站
AI            空中接口
PCM           脉冲编码调制
PSTN          公众交换电话网
UAI           上行链路空中接口
DAI           下行链路空中接口
DTX           非连续发射
VAD           话音激活检测
由移动网络从一个移动通信装置接收的语音帧可粗略地分为三种类别:a)未出错的,即好的语音帧;b)出错的语音帧;和c)非连续发射(DTX)模式下产生的帧,这些帧一般包括寂静描述(SID)帧和发送暂停期间接收的无用帧。
在正常的操作模式下,移动设备编码要发送的语音,编码的语音通过空中接口发送后被解码。当移动设备要接收一个呼叫,语音在空中接口的网络方编码,并被接收的移动设备解码。因此,在没有发生特别安排的正常操作模式下,语音在移动用户到移动用户的呼叫过程中要被编码和解码两次,这将导致可感觉语音质量的降低。自由汇接工作方式(TFO)是一种介于两个移动设备之间的工作模式,在此语音只编码一次,而且语音以编码形式通过网络传送到要接收的移动设备。
鉴于通过移动网络发送包含在错误帧的错误指示信息以及包含在DTX帧的边界信息到接收端是不可行的,现已发现在GSM***中TFO操作时通过A-接口将所有帧作为好帧发送是可行的。A-接口是介于发送移动网和接收移动网之间的接口。在传统的非TFO操作中,语音通过A-接口以PCM编码采样的数字实时波形发送。
所谓的坏帧处理过程用于将从移动通信装置接收的错误帧转换为好帧,以通过A-接口发送。为通过A-接口发送包含在DTX帧中的舒适噪声信息,该舒适噪声信息不得不转换成好的语音帧以通过A-接口发送。
在下面的段落中将首先更为详细地讨论舒适噪声***,接着讨论坏帧处理。
舒适噪声***
在非连续发射(DTX)情况下,语音激活检测(VAD)在发送方检测用户是否正在说话。当用户在说话时,语音编码器为每帧产生描述输入语音的语音参数,并将其传送到接收端。然而,当用户停止说话,就会产生描述占优势的背景噪声的参数,而不是语音参数并被传送到接收方。这之后,传输断开。当用户再开始说话时,传输以正常传送率继续,或者当用户不说话时以低速更新描述背景噪声的参数,目的是适应传送暂停时占优势的背景噪声产生的变化。在整个这篇文章中,描述占优势的背景噪声的这些参数称为舒适噪声参数或CN参数。
在接收端,每当好的语音参数帧被接收时,语音会被合成。然而,当舒适噪声参数已被接收,之后传输被断开,语音解码器会用接收到的舒适噪声参数来本地合成类似于发送方背景噪声特性的噪声。这个合成噪声通常称为舒适噪声(CN),而且在接收方本地产生CN的过程通常称为舒适噪声***(CNI)。
更新的舒适噪声参数或者在接收时或者立刻被应用到CNI过程,或者通过从以前接收的舒适噪声参数值到更新的参数值一帧一帧地逐步内插而应用到CNI过程。前一个方法确保舒适噪声参数总是尽可能最新。然而,这种方法可导致感觉的舒适噪声特性上的阶式效应,因此后一个内插法常用于减轻这种不便。后者的缺陷在于内插接收的舒适噪声会在占优势的背景噪声的特性描述上引入一些时延,由此在实际的背景噪声和舒适噪声之间引入一些差别。
舒适噪声***在ETSI规范ETS 300 580-4“欧洲数字蜂窝电信***(阶段2);全速率语音业务信道的舒适噪声特征(GSM 06.12)”(1994年9月)(在此后的文中称为GSM 06.12规范)有详细描述。
坏帧处理
坏帧处理(BFH)是指对包含错误的帧的替换过程。帧替换的目的是隐藏出错帧的不良效应,因为对出错帧或丢失帧的正常解码将导致极不如意的噪声效应。为改进接收语音的主观质量,丢失的第一个语音帧或者用一重发帧替代,或者用外插一个之前的好语音帧来替代。出错的语音帧不传送到接收方。如果连续丢失许多帧,语音解码器的输出就会逐渐静音,以便指示用户连接出现故障。这种帧替换过程在ETSI规范草案pr ETS 300 580-3,“数字蜂窝电信***;全速率语音;第三部分:全速率语音信道丢失帧的替换和静音(GSM 06.11版本4.0.5)”(1997年11月)(在此后的文中称为GSM 06.11规范)论及。
移动用户到移动用户的呼叫
下面要讨论的是正常的、非TFO连接时的语音数据流。TFO操作的情况在其后讨论。
移动用户到移动用户的呼叫的基本方框图在图1示意。在上行链路移动台(UMS)100,即发送端的移动台,时域波形首先分成固定长度的帧并且在语音编码块101被语音编码(即变换成语音编码参数),接着通过***用于纠错目的的冗余信息将该参数在信道编码块102信道编码。这些受保护的语音帧接着通过空中接口(AI)传送。
在上行链路基站(UBS)110,信道解码块111执行信道解码,即信道错误被纠正,而且冗余信息被从语音编码参数中去掉。语音编码参数通过一串行上行链路Abis接口传送到上行链路码型变换器(UTR)120,在此语音编码参数在语音解码块122变换成数字时域语音波形。在正常的非TFO模式下,开关121如图1所示打开,而且语音波形通过TFO组包块123后基本上保持不变。UTR的输出通过A-接口传送到公众交换电话网(PSTN)或其它移动电话网。
在下行链路码型变换器(DTR)130,时域波形从A-接口被接收。在非TFO操作中,开关133连接语音编码块132的输出到DTR的输出,而且TFO提取块131通过未变化的时域波形。该波形在语音编码块132中被变换成语音编码参数。该语音编码参数被传送到下行链路Abis接口。
在下行链路基站(DBS)140,从下行链路Abis接口接收的语音参数在信道编码块141信道编码。该信道编码参数传送到下行链路移动台(DMS)150,即接收移动台。在DMS,信道编码在信道解码块151被去掉,而且语音编码参数在语音解码块152被变换回时域波形,即解码的语音。
上述常规模式中存在的问题为接连两次编码会对要传送的语音信号的质量产生负面效果。既然在下行链路码型变换器(DTR)130的语音编码块132对波形的编码是对原始输入信号的第二次接连压缩,那么DTR 130的语音编码器132的输出参数代表的时域波形就不是原始语音波形的精确再现,因为两次压缩要产生差错。自由汇接工作方式(TFO)就是设计用来至少在某些情况下减轻这个问题的。
自由汇接工作方式
在使用自由汇接工作模式的移动台到移动台的电话呼叫中(此后的文中称为TFO),通过发送代表时域语音波形的参数将语音从上行链路移动台语音编码器直接传送到下行链路移动台语音解码器,而不用在上行链路码型变换器和下行链路码型变换器之间将参数转换成时域语音波形。
这大大改进了语音质量,因为如果没有TFO,原始的语音信号要编码两次,每一次应用压缩时,有损耗的语音压缩算法会降低语音质量。当语音编解码器的比特率很低时,一次编码和汇接编码之间的差别就变得更为重要了。老的高比特率语音编码标准,以G.711标准的64K比特/秒的PCM编码为例,对连续编码机制健全。然而,目前工作于4K比特/秒~16K比特/秒的语音编码器对一次以上的连续编码相当敏感。
下面参考图1讨论根据现有技术的自由汇接工作方式。在自由汇接工作方式下,由上行链路码型变换器120的语音解码块122接收的语音参数嵌入到在TFO组包块123的解码语音波形的最低有效位,这在图1中通过开关121的闭合位置指示。嵌有语音参数的语音波形接着传送到A-接口。
为启动TFO模式,呼叫的下行链路端自然必须处在与上行链路端使用同一语音编码标准的移动电话网络中。然而,呼叫可从A-接口通过几个数字传输链路传送到下行链路移动电话网。
在接收端,嵌有语音参数的语音波形由下行链路码型变换器130从A-接口接收。TFO提取块131从该语音波形中提取嵌入的语音参数。在TFO操作时,开关133连接TFO提取块的输出到下行链路码型变换器的输出。提取的原始参数接着传送到下行链路Abis接口,并进一步经过下行链路基站140通过空中接口传送到下行链路移动台,其语音解码块152接着解码由上行链路移动台100的语音编码块编码的原始语音参数。
有时在空中接口有检测到的和未检测到的错误。这些错误和BFH操作能引起发送移动台的语音编码器101和接收移动台的语音解码器152的参数之间失配。通常这些失配在接收了连续好几个帧的正确参数后会减小。
在自由汇接工作方式下的BFH和CNI处理
通常发送端的坏帧处理和舒适噪声***功能位于上行链路码型变换器120的语音解码块122。这些功能在图1没有示意。当有语音帧出错或丢失,或DTX传送发生暂停,语音解码器块122产生对应于前述这些情况的语音编码参数。
从图1可见,UMS 100,UBS 110,DBS 140和DMS 150不涉及关于BFH和CNI的TFO操作,而显然工作于非TFO情况下。DTR的语音编码器132也通常工作于TFO操作时,除了其输出不传送到下行链路Abis接口,而由从A-接口束提取的语音编码参数取代。关于BFH和CNI的操作发生在UTR 120的语音解码器122中。
图2示出了实现BFH和CNI功能的现有语音解码器122更为详细的方框图。编码的语音参数,即参数量化指数在参数提取块122a被从接收的信息流中提取出来。在逆量化块122c的指数逆量化(解码)之前,BFH/CNI块122b对这些参数量化指数执行BFH和CNI操作。逆量化后,这些参数在语音合成块122d用于语音合成,以产生解码输出信号。BFH和CNI标志为上行链路基站110产生的信号,这些信号通知解码器122关于出错帧和DTX帧情况。BFH/CNI块122b由BFH和CNI标志控制。
图3示出了现有技术的TFO功能的类似方框图,它不仅示出了TFO组包块123,而且示出了UTR 120的语音解码器122的框图。从图3可见,在语音解码器122中对参数量化指数执行BFH和CNI操作。因此在UTR 120的自由汇接工作方式只简单地受从解码器122将已存在的参数组包(嵌入)到时域波形信号中的影响。
自由汇接工作时的BFH操作是直进的,而且可受到与非TFO模式相同方式的影响。GSM 06.11规范包含BFH功能的现有技术解决方案的一个例子,该方法也可用于自由汇接工作方式。CNI操作很简单,因为该量化是无记忆的,这意味着舒适噪声产生时或有效语音和舒适噪声之间转换上的所有信息包含在目前发送的参数中。比如,发送路径上不同部分的复位是不存在问题的。现有技术的CNI解决方案在GSM 06.12规范有描述。
在自由汇接工作方式下,既然下行链路移动台不知道上行链路端的CNI操作,那么组包到要发送到A-接口的信号中的参数信息必须包括产生好的语音帧所需的所有信息。由于有这个要求,在舒适噪声参数上要执行简单的转换以将它们转换成语音参数帧。这涉及存储最近的舒适噪声参数,周而复始地将它们传送到A-接口束,直到更新的舒适噪声参数被接收和存储,或直到有效的语音参数被接收。如果舒适噪声参数内插为前述讨论所希望的那样,这个内插就能在传送参数到A-接口串之前执行。既然舒适噪声参数不包含出现在好的语音参数帧中的所有参数,因此这些丢失的语音参数需要在转换处理时以某种方式产生。
现有技术解决办法中固有的问题
图3示出了使用常规的非预测量化器的解码器。当解码器的量化器与图3一样为非预测,那么参数的BFH和CNI处理就不会产生任何问题。然而,它是预测用于目前技术条件下的低速编码器和解码器。
在应用预测量化器的目前技术条件下的语音编解码器,舒适噪声***和坏帧处理操作不得不利用逆量化(解码)参数在语音解码器执行,即在逆量化块122c之后又不在图3所示的逆量化块之前。这样的原因在于,对于预测量化和逆量化,量化实体(在本例中为语音参数)不是独立的。当估算(解码)预测量化实体时,每个估算实体的估算结果不仅依赖于估算进行时的量化实体,而且依赖于以前的实体。因此,简单地替换出错的编码参数为合适的CN或BFH参数是不可能的。这种替换将不得不根据以前接收的好参数来调整替换的CN或BFH参数,但既然在发送暂停或扰乱时无法了解信号的进展,接收的下一个好参数将依赖于另一个历史数据而不是解码器产生的数据,这将导致在暂停后期产生另人烦恼的人为噪音。因此,CNI和BFH操作在预测逆量化后受解码的语音参数的影响,而且对应CNI或BFH块的编码语音参数是不存在的。既然描述CNI或BFH块的编码参数不存在,它们就不能与其余编码参数一起嵌入到时域语音波形。由于这个问题的存在,当上行链路移动台使用带有预测量化器的语音编解码器时,CNI和BFH操作在现有技术的自由汇接工作方式下是不可能的。
美国专利US5483618公开了一种用于编辑音频信号的方法和装置,该方法也包括解码步骤、处理步骤遗迹重编码步骤。
发明内容
本发明的目的是实现一种方法,能在带有预测量化语音参数的自由汇接工作方式中实现CNI和BFH操作。本发明进一步的目的是在自由汇接工作方式中,随同预测量化语音数据的解码实现一种能进行CNI和BFH操作的语音解码器。
通过从量化的BFH/CNI处理语音参数中产生重编码的语音参数,以及在BFH和CNI过程中发送这些重编码的参数到接收端来达到本发明目的。
根据本发明的一个方面,提供了一种处理由非无状态编码器编码的语音信号参数的方法,该方法包括步骤:
使用一个非无状态的解码器解码编码的语音参数,
处理解码的语音参数,
使用第二个非无状态的编码器重编码处理过的解码语音参数,
其特征在于,该方法还包括步骤:
至少用第二个非无状态编码器的部分状态更新非无状态解码器的状态,和
用一个重编码的语音参数取代至少一个编码语音参数,以产生处理的编码语音数据。
根据本发明的另一个方面,提供了一种语音编码处理设备,用于解码编码的语音参数以及产生一解码的时域语音信号和代表该信号的编码语音参数,该设备包括:
一个用于解码编码的语音参数的非无状态解码块,
一个用于处理解码的语音参数的语音参数处理块,以及
一个用于编码处理过的语音参数以产生代表该信号的编码语音参数的非无状态编码块,
其特征在于,该设备还包括:
而且该设备被用来至少利用非无状态编码块的状态部分来更新非无状态解码块的状态。
根据本发明的再一个方面,提供了一种通信网络单元,用于接收编码的语音参数并发送嵌有编码语音参数的一个时域语音信号,该网络单元包括的一个语音编码处理设备具有:
一个用于解码编码的语音参数的非无状态解码块,
一个用于处理解码的语音参数的语音参数处理块,和
一个用于编码处理过的语音参数以产生嵌入的编码语音参数的非无状态编码块,
其特征在于,
而且所述的设备被用来至少利用非无状态编码块的状态部分来更新非无状态解码块的状态。
本发明通过使用一特殊的反馈环路实现自由汇接操作,该反馈环路可获得解码参数,执行舒适噪声***和坏帧处理操作,产生对应于这些操作的输出的参数量化指数,以及在从上行链路移动台到下行链路移动台的传送路径上,来同步语音编码器和语音解码器。该功能通过以特定方式部分解码和重编码参数以及同步和复位量化器预测存储器实现。本发明提供了一种针对TFO操作中由预测的、更一般的非无状态(non-stateless)编码器产生的问题的解决办法。
下面参考附图对本发明作更详细的描述,其中,
图1示意了根据现有技术的从移动用户到移动用户的呼叫的数据流;
图2示出了现有技术的语音解码器的方框图;
图3示出了具有TFO和CNI/BFH功能的现有技术的语音解码器的方框图;
图4示出了根据本发明一个优选实施例的网络单元的方框图;
图5示出了根据本发明一个优选实施例的语音编码处理设备的语音编码处理块的方框图;和
图6示出了本发明一个优选实施例的方法的流程图。
同一个标号用于图中同一个实体。
根据本发明一个优选实施例的网络单元220(如上行链路码型变换器或语音编码处理设备)的方框图在图4提供,根据本发明一个优选实施例的语音编码处理块201的方框图在图5提供。从图4可见,该网络单元包含语音解码器200和TFO组包块123。该网络单元从在发送路径上位置居于其前的其他单元接收编码语音参数和信号,如指示信号流中各个中断的BFI标志和CNI标志,并产生包含时域语音信号和可选的嵌入的编码语音参数的输出信号。另外,在本实施例中,现有技术解码器的功能块122a、122b、122c根据本发明在语音编码处理块201实现。这种语音编码处理块201在图5示意。在这个示范性的实施例中,输出、输入和语音合成块122d与前述的现有技术解码器122的类似,在此不再详细描述。语音编码处理块201包含参数提取块202、预测逆量化器块203、BFH/CNI处理块204以及预测量化器块205。逆量化器和量化器块还有存储器203a、205a。
下面根据图5讨论单个语音编码处理块201的操作。首先描述正常的TFO操作,即在上行链路空中接口没有帧出错时DTX暂停之间的操作,接着描述TFO操作时的坏帧处理,最后描述TFO操作时的舒适噪声***。
正常的TFO操作
在正常的TFO操作中,参数提取块202从到达帧的编码语音参数中提取所希望的参数。提取的编码参数被传送到预测逆量化器块203,该逆量化器块利用存储在逆量化器块203的存储器203a中的以前的逆量化参数信息,来逆量化编码参数。逆量化的参数被传送到BFH/CNI处理块204,在正常的TFO操作中该处理块将参数不变地传送到语音合成。从参数提取块202提取的参数被传送到TFO组包,这由开关206的位置A表示。在本发明中,解码处理的另一个目的是为重编码量化器块205的存储器提供正确的初始值用于坏帧处理和非连续发射操作。
TFO时的BFH操作
在从正常的语音参数传送到BFH的转换中,语音参数逆量化块的存储器203a的内容被拷贝到量化器存储器205a,用于重编码的正确初始化。这由从存储器203a到存储器205a的箭头表示。
在BFH操作中,BFH处理在由预测逆量化器块203产生的解码语音参数上执行。处理的参数从BFH/CNI处理块204传送到语音合成以及预测量化器块205。预测量化器块205重编码逆量化的和处理过的参数,以产生新参数量化指数和量化参数。新产生的重量化参数传送到TFO组包以发送到下行链路端,这由开关206的位置B表示。之后量化存储器205a的内容拷贝到逆量化器块203的存储器203a。该拷贝操作在图5中由从存储器205a到存储器203a的虚线箭头表示。这个拷贝操作导致预测逆量化器块203的相同状态,如果由量化块205产生的编码参数实际上已从上行链路移动台接收,这就会产生。既然由量化块205产生的编码参数经过TFO组包操作传送到下行链路移动台,那么UTR的语音解码器200和DMS的语音解码器152就会保持同步。
TFO操作时的CNI操作
在从正常的语音参数传送到DTX的转换中,语音参数逆量化器块的存储器203a的内容被拷贝到量化器的存储器205a,用于重编码的正确初始化。这由从存储器203a到存储器205a的箭头表示。
在非连续发射(DTX)模式的操作中,预测量化不能以通常方式通过更新每帧中的量化器存储值来执行。因此,必须通过特殊设置来确保量化器存储器在UMS的编码器和UTR的解码器之间同步,以允许量化舒适噪声参数。现有技术的GSM***中所使用的解决方案可提供作为合适的同步方法的一个例子。根据DTX模式下GSM规范的增强型全速率(EFR)编码,通过在编码器和解码器将存储器冻结为同一个值,使量化器存储器在移动设备和码型变换器之间保持同步,以对舒适噪声参数进行量化。这个同步过程在ETSI规范EN 301 247V4.0.1(1997年11月)“数字蜂窝电信***(阶段2);增强型全速率(EFR)语音业务信道的舒适噪声特征”(也称为GSM规范06.62版本4.0.1)中有进一步详细的描述。然而,本发明并不限于GSM***的这个例子。在UMS的编码器和UTR的解码器之间同步量化器存储器的任何其他机理也可用于本发明的各个实施例。
在DTX操作中,舒适噪声参数从UMS的编码器传送到UTR的解码器,并利用前面段落所描述的特殊设置来解码。在DTX期间的每帧中,执行下述步骤。舒适噪声参数或被重发或被内插,如同前述的有关现有技术的CNI操作那样。解码操作后,如同BFH情况一样使用预测量化器块205重编码参数,而且预测量化器块205的存储器205a被更新。新产生的重量化参数被传送到TFO组包以发送到下行链路端。在这种方式下,既然由量化块205产生的编码参数经过TFO组包操作被传送到下行链路移动台,那么UTR的语音解码器200和DMS的语音解码器152就能保持同步。
在一段时间的非连续发射之后恢复正常的语音帧传输时,上行链路移动台的语音编码器的预测量化器存储器从复位状态开始工作。为将这个操作映射到TFO连接的其他单元,执行下述步骤。在预测逆量化块203的逆量化操作也从复位状态开始。在正常语音的第一个帧期间对解码的语音参数执行重编码,以使UTR的重编码量化器块205的存储器205a和DMS的语音解码器的逆量化块的存储器保持同步,目的是防止由失步引起的任何可感觉烦扰效应。
为重编码这第一个语音帧,量化器205使用最近一个重编码的舒适噪声帧留下的存储器内容。重编码后,量化器块205的存储器205a的内容被拷贝到逆量化器203的存储器203a以用于下一帧。在第二和接下来的任何好的语音帧中,提取块202中提取的参数被传送到TFO组包,而且在解码块203对语音参数的解码如同正常的TFO操作情况一样继续进行。
图6示意了根据本发明的另一优选实施例的方法的一个例子。该图示意了在BFH/CNI处理情况下自由汇接工作时处理一系列参数的一个周期。首先在步骤310,接收参数,之后在步骤320解码参数。解码的参数在步骤330被处理。在这个处理步骤中,BFH/CNI处理的执行情况如本说明书其他地方所述。处理的参数在步骤340被重编码。通过在步骤350更新解码块存储器,编码器的状态至少部分转移到解码器。为进一步传送接收参数,在步骤360至少其中部分参数由处理的和重编码的参数取代,之后在步骤370参数在传输路径上进一步传送。
本发明的一大益处是,当在发送移动台使用预测或更通用的非无状态量化器时,它使在自由汇接工作时正确地处理CNI和BFH成为可能。在现有技术的解决办法中,预测量化器和BFH/CNI组合而不产生可感觉的烦扰的人为噪声,这在自由汇接工作方式中是不可能的。
实现根据本发明的方法的功能块可位于多种不同的网络单元。该功能块最好位于所谓的码型变换器装置(TRCU)。码型变换器装置可为独立的装置,或可集成到,如基站(BS)、基站控制器(BSC)或移动交换中心(MSC)。然而,本发明并不仅限于在码型变换器装置内实现。
本发明并不限于所有语音参数均由预测编码器编码的这种***。在移动通信***中,只有一部分语音参数由预测编码器编码,而一些语音参数由无状态编码器编码,根据本发明的一个优选实施例的语音解码器可以,比如以现有技术中的已知方式处理由无状态编码器编码的语音参数,以及以前述的创造性的方式处理预测的编码参数。
本发明并不仅限于GSM***。GSM***在本说明书中仅提供作为一个例子。本发明可用于任何数字蜂窝移动通信***,如所谓的第三代蜂窝***(本发明申请时它正在发展之中)。
在本说明书和所附的权利要求书中,术语“非无状态”指的是具有功能性状态的解码器或编码器,即除了最近或目前的输入,至少在某种程度上对至少以前的一些输入有依赖关系。术语“语音编码处理设备”指的是一个功能实体,它可解码编码的语音参数和/或将编码语音参数的编码从第一个编码方法转换到第二个编码方法。
回顾前面的描述,很显然本领域的技术人员可在本发明范围之内进行各种改进。虽然已详细描述了本发明的一个优选实施例,但很显然的是,对本发明可以进行多种更新和改进,但所有这些更新和改进都在本发明的保护范围之内。

Claims (16)

1.一种处理由非无状态编码器编码的语音信号参数的方法,该方法包括步骤:
使用一个非无状态的解码器解码编码的语音参数,
处理解码的语音参数,
使用第二个非无状态的编码器重编码处理过的解码语音参数,
其特征在于,该方法还包括步骤:
至少用第二个非无状态编码器的部分状态更新非无状态解码器的状态,和
用一个重编码的语音参数取代至少一个编码语音参数,以产生处理的编码语音数据。
2.根据权利要求1的方法,其特征在于,在所述的重编码步骤之前,所述第二个非无状态编码器的状态用非无状态解码器的状态更新。
3.根据权利要求1的方法,其特征在于,在所述的语音参数处理步骤,舒适噪声信息被转换成解码的语音参数。
4.根据权利要求1的方法,其特征在于,在所述的语音参数处理步骤,坏帧处理信息被转换成解码的语音参数。
5.一种语音编码处理设备,用于解码编码的语音参数以及产生一解码的时域语音信号和代表该信号的编码语音参数,该设备包括:
一个用于解码编码的语音参数的非无状态解码块,
一个用于处理解码的语音参数的语音参数处理块,以及
一个用于编码处理过的语音参数以产生代表该信号的编码语音参数的非无状态编码块,
其特征在于,该设备还包括:
而且该设备被用来至少利用非无状态编码块的状态部分来更新非无状态解码块的状态。
6.根据权利要求5的语音编码处理设备,其特征在于,所述的非无状态解码块为一个预测逆量化器,以及所述的非无状态编码块为一个预测量化器。
7.根据权利要求5的语音编码处理设备,其特征在于,所述的语音参数处理块为一个舒适噪声处理块。
8.根据权利要求5的语音编码处理设备,其特征在于,所述的语音参数处理块为一个坏帧处理块。
9.根据权利要求5的语音编码处理设备,其特征在于,该设备为一码型变换器设备。
10.根据权利要求5的语音编码处理设备,其特征在于,该设备为一上行链路码型变换器设备。
11.一种通信网络单元,用于接收编码的语音参数并发送嵌有编码语音参数的一个时域语音信号,该网络单元包括的一个语音编码处理设备具有:
一个用于解码编码的语音参数的非无状态解码块,
一个用于处理解码的语音参数的语音参数处理块,和
一个用于编码处理过的语音参数以产生嵌入的编码语音参数的非无状态编码块,
其特征在于,
而且所述的设备被用来至少利用非无状态编码块的状态部分来更新非无状态解码块的状态。
12.根据权利要求11的通信网络单元,其特征在于,所述的非无状态解码块为一个预测逆量化器,以及所述的非无状态编码块为一个预测量化器。
13.根据权利要求11的通信网络单元,其特征在于,所述的语音参数处理块为一个舒适噪声处理块。
14.根据权利要求11的通信网络单元,其特征在于,所述的语音参数处理块为一个坏帧处理块。
15.根据权利要求11的通信网络单元,其特征在于,所述的设备为一个码型变换器设备。
16.根据权利要求11的通信网络单元,其特征在于,所述的设备为一个上行链路码型变换器设备。
CNB998028290A 1998-02-09 1999-02-09 解码方法、语音编码处理设备和网络单元 Expired - Fee Related CN1151487C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI980298 1998-02-09
FI980298A FI116642B (fi) 1998-02-09 1998-02-09 Puheparametrien käsittelymenetelmä, puhekoodauksen käsittely-yksikkö ja verkkoelementti

Publications (2)

Publication Number Publication Date
CN1290389A CN1290389A (zh) 2001-04-04
CN1151487C true CN1151487C (zh) 2004-05-26

Family

ID=8550783

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB998028290A Expired - Fee Related CN1151487C (zh) 1998-02-09 1999-02-09 解码方法、语音编码处理设备和网络单元

Country Status (10)

Country Link
US (1) US6850883B1 (zh)
EP (1) EP1055225B1 (zh)
JP (1) JP4309576B2 (zh)
CN (1) CN1151487C (zh)
AU (1) AU2282899A (zh)
CA (1) CA2320465C (zh)
DE (1) DE69904440T2 (zh)
ES (1) ES2189382T3 (zh)
FI (1) FI116642B (zh)
WO (1) WO1999040569A2 (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
FI991605A (fi) * 1999-07-14 2001-01-15 Nokia Networks Oy Menetelmä puhekodaukseen ja puhekoodaukseen tarvittavan laskentakapasi teetin vähentämiseksi ja verkkoelementti
FI19992002A (fi) 1999-09-20 2001-03-20 Nokia Networks Oy Solukkoradioverkossa piirikytkentäisen palvelun laadun mittaus
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
US20040143675A1 (en) * 2003-01-16 2004-07-22 Aust Andreas Matthias Resynchronizing drifted data streams with a minimum of noticeable artifacts
WO2004075582A1 (en) * 2003-02-21 2004-09-02 Nortel Networks Limited Data communication apparatus and method for establishing a codec-bypass connection
JP4370802B2 (ja) * 2003-04-22 2009-11-25 富士通株式会社 データ処理方法およびデータ処理装置
US7613607B2 (en) 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
CN100369108C (zh) * 2003-12-18 2008-02-13 诺基亚公司 编码域中的音频增强的方法和设备
EP1544848B1 (en) * 2003-12-18 2010-01-20 Nokia Corporation Audio enhancement in coded domain
WO2005089055A2 (en) * 2004-03-19 2005-09-29 Nortel Networks Limited Communicating processing capabilites along a communications path
US8027265B2 (en) * 2004-03-19 2011-09-27 Genband Us Llc Providing a capability list of a predefined format in a communications network
US7729346B2 (en) 2004-09-18 2010-06-01 Genband Inc. UMTS call handling methods and apparatus
US7830864B2 (en) * 2004-09-18 2010-11-09 Genband Us Llc Apparatus and methods for per-session switching for multiple wireline and wireless data types
US8483173B2 (en) 2005-05-31 2013-07-09 Genband Us Llc Methods and systems for unlicensed mobile access realization in a media gateway
US7792150B2 (en) * 2005-08-19 2010-09-07 Genband Us Llc Methods, systems, and computer program products for supporting transcoder-free operation in media gateway
CN100466739C (zh) * 2005-10-12 2009-03-04 华为技术有限公司 Cabac解码***及方法
US7835346B2 (en) * 2006-01-17 2010-11-16 Genband Us Llc Methods, systems, and computer program products for providing transcoder free operation (TrFO) and interworking between unlicensed mobile access (UMA) and universal mobile telecommunications system (UMTS) call legs using a media gateway
BRPI0711271A2 (pt) 2006-05-09 2011-11-08 Colgate Palmolive Co método de limpeza de uma superfìcie oral, de manutenção da saúde oral e/ou de aumento da saúde oral
US20080274065A1 (en) * 2006-05-09 2008-11-06 Richard Scott Robinson Oral Care Regimen
US8346239B2 (en) 2006-12-28 2013-01-01 Genband Us Llc Methods, systems, and computer program products for silence insertion descriptor (SID) conversion
MX2010005211A (es) * 2008-02-08 2010-09-30 Colgate Palmolive Co Metodos y sistemas para el cuidado oral.
JP5787522B2 (ja) 2008-02-08 2015-09-30 コルゲート・パーモリブ・カンパニーColgate−Palmolive Company 口腔ケア製品ならびにその使用および製造の方法
US20090202452A1 (en) * 2008-02-08 2009-08-13 Colgate-Palmolive Company Oral care regimen
US8908541B2 (en) * 2009-08-04 2014-12-09 Genband Us Llc Methods, systems, and computer readable media for intelligent optimization of digital signal processor (DSP) resource utilization in a media gateway
BR112012030037B1 (pt) 2010-06-23 2017-06-27 Colgate-Palmolive Company Oral hygiene composition, use and article
JP6042900B2 (ja) * 2011-10-24 2016-12-14 エルジー エレクトロニクス インコーポレイティド 音声信号の帯域選択的量子化方法及び装置
CN103871415B (zh) * 2012-12-14 2017-08-25 中国电信股份有限公司 实现异***间语音互通的方法、***与tfo转换装置
CN111063362B (zh) * 2019-12-11 2022-03-22 中国电子科技集团公司第三十研究所 一种数字语音通信噪音消除和语音恢复方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01177227A (ja) * 1988-01-05 1989-07-13 Toshiba Corp 音声コーデック
JPH02309820A (ja) * 1989-05-25 1990-12-25 Sony Corp デイジタル信号処理装置
US5113400A (en) * 1990-11-21 1992-05-12 Motorola, Inc. Error detection system
US5258995A (en) * 1991-11-08 1993-11-02 Teknekron Communications Systems, Inc. Wireless communication system
GB9205932D0 (en) 1992-03-18 1992-04-29 Philips Electronics Uk Ltd Method and apparatus for editing an audio signal
US5487087A (en) 1994-05-17 1996-01-23 Texas Instruments Incorporated Signal quantizer with reduced output fluctuation
JP3557662B2 (ja) * 1994-08-30 2004-08-25 ソニー株式会社 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
FI98972C (fi) * 1994-11-21 1997-09-10 Nokia Telecommunications Oy Digitaalinen matkaviestinjärjestelmä
FI101439B (fi) 1995-04-13 1998-06-15 Nokia Telecommunications Oy Transkooderi, jossa on tandem-koodauksen esto
US5771440A (en) * 1996-05-31 1998-06-23 Motorola, Inc. Communication device with dynamic echo suppression and background noise estimation
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission

Also Published As

Publication number Publication date
CA2320465C (en) 2006-06-06
AU2282899A (en) 1999-08-23
WO1999040569A2 (en) 1999-08-12
US6850883B1 (en) 2005-02-01
JP2002503045A (ja) 2002-01-29
FI116642B (fi) 2006-01-13
FI980298A0 (fi) 1998-02-09
DE69904440D1 (de) 2003-01-23
EP1055225B1 (en) 2002-12-11
JP4309576B2 (ja) 2009-08-05
FI980298A (fi) 1999-08-10
WO1999040569A3 (en) 1999-09-30
ES2189382T3 (es) 2003-07-01
DE69904440T2 (de) 2003-08-28
CN1290389A (zh) 2001-04-04
CA2320465A1 (en) 1999-08-12
EP1055225A2 (en) 2000-11-29

Similar Documents

Publication Publication Date Title
CN1151487C (zh) 解码方法、语音编码处理设备和网络单元
CN1179324C (zh) 改善串联声码器话音质量的方法与设备
CN101512639B (zh) 用于语音/音频发送器和接收器的方法和设备
CN1244904C (zh) 声频信号编码方法和设备
CN1244906C (zh) 改变语音信号带宽的方法以及语音编码装置和解码装置
TW293214B (zh)
AU2018260836B2 (en) Encoder, decoder, system and methods for encoding and decoding
CN1235190C (zh) 改善音频信号编码效率的方法
EP2309754A3 (en) Image encoding method and image decoding method
CN102461040A (zh) 用于防止语音帧内的信息流失的***与方法
CN1529882A (zh) 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法
CN1942928A (zh) 音频信号编码
EP1946517A1 (en) Audio data packet format and decoding method thereof and method for correcting mobile communication terminal codec setup error and mobile communication terminal performing same
CN1575492A (zh) 利用减少的带宽在传输通道上传输宽带音频信号的方法
US11526734B2 (en) Method and apparatus for recurrent auto-encoding
CN1246828C (zh) 数据处理方法和装置以及数据传输***
KR101243568B1 (ko) 무선 전화기 네트워크의 음성 채널을 통한 데이터 전송을 위한 시스템, 방법 및 장치
WO2001003316A1 (en) Coded domain echo control
AU6533799A (en) Method for transmitting data in wireless speech channels
EP1387351B1 (en) Speech encoding device and method having TFO (Tandem Free Operation) function
CN1381041A (zh) 用于发送在窄带中已编码信号的发送机、用于在接收端扩展已编码信号的频带的接收机、相应的发送和接收方法及***
KR101350599B1 (ko) 음성패킷 송수신 방법 및 장치
JP2009193015A (ja) 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム
KR100597487B1 (ko) 음성 레벨 변경 장치 및 방법
CN1598926A (zh) 具有噪声抑制的音频编码方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20170117

Address after: Espoo, Finland

Patentee after: NOKIA TECHNOLOGIES OY

Address before: Espoo, Finland

Patentee before: Nokia Corp.

Effective date of registration: 20170117

Address after: Espoo, Finland

Patentee after: NOKIA Corp.

Address before: Finland NOKIA group

Patentee before: Nokia Networks OY

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040526

Termination date: 20170209

CF01 Termination of patent right due to non-payment of annual fee