CN100568345C - 用于人工扩展语音信号的带宽的方法和装置 - Google Patents

用于人工扩展语音信号的带宽的方法和装置 Download PDF

Info

Publication number
CN100568345C
CN100568345C CNB2006800007998A CN200680000799A CN100568345C CN 100568345 C CN100568345 C CN 100568345C CN B2006800007998 A CNB2006800007998 A CN B2006800007998A CN 200680000799 A CN200680000799 A CN 200680000799A CN 100568345 C CN100568345 C CN 100568345C
Authority
CN
China
Prior art keywords
signal
bandwidth
envelope
component
demoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006800007998A
Other languages
English (en)
Other versions
CN101061535A (zh
Inventor
B·盖瑟
P·贾克斯
S·尚德尔
H·塔德伊
A·特勒
P·瓦里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN101061535A publication Critical patent/CN101061535A/zh
Application granted granted Critical
Publication of CN100568345C publication Critical patent/CN100568345C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Machine Translation (AREA)

Abstract

一种用于人工扩展语音信号的带宽的方法,其具有以下步骤:a)提供宽带的输入语音信号(si wb(k));b)从宽带输入语音信号(si wb(k))的扩展频带中确定扩展带宽所需要的宽带输入语音信号(si wb(k))的信号分量(seb(k));c)确定用于扩展带宽的信号分量(seb(k))的时间包络;d)确定用于扩展带宽的信号分量(seb(k))的频谱包络;e)对时间包络和频谱包络的信息进行编码,并提供经过编码的信息来用于扩展带宽;f)对经过编码的信息进行解码,并从经过编码的信息中产生时间包络和频谱包络以用于产生扩展了带宽的输出语音信号(so wb(k))。本发明还涉及用于人工扩展语音信号的带宽的装置。

Description

用于人工扩展语音信号的带宽的方法和装置
技术领域
本发明涉及用于人工扩展语音信号的带宽的方法以及装置。
背景技术
语音信号覆盖很宽的频率范围,该频率范围大约从与说话者有关而位于80至160Hz范围内的语音基频到超过10kHz的频率。但是在通过特定传输介质如电话而进行的语音通信中,由于带宽有效性的原因只能传输有限片段,其中保证大约98%的单句清晰度。
对应于特定于电话***的最低带宽300Hz至3.4kHz,语音信号基本上可以分为3个频率范围。每个频率范围在此都表征特定的语音特征以及主观感受。从而大约在300Hz 以下的更低的频率基本上出现在有声的语音段期间,例如对于元音而言。在这种情况下,该频率范围包含音调分量,尤其是语音基频以及与音高有关的可能若干谐波。
这些低音频率对于主观感受语音信号的音量和动态性很重要。相应地,人类收听者基于虚拟音调高度的心理声学特性即使在缺乏低音频率时也能从更高频率范围内的谐波结构中感受到语音基频。从而在语音活动中从大约300Hz到大约3.4kHz范围内的平均频率基本上存在于语音信号中。该平均频率通过多个共振峰的随时间变化的频谱音调色彩以及时间和频率的微观结构表征说出的各个声音或音素。通过这种方式,平均频率传达了对理解语言很重要的信息的主要部分。
另一方面,在无声的音素中,尤其是对于尖锐的音素如“s”或“f”更是特别强烈地出现位于约3.4kHz以上的高频分量。所谓的***音如“k”或“t”具有含有强高频分量的宽频谱。因此该信号在该上频率范围中更多为噪声特性而不是音调特性。在该范围中存在的共振峰的结构相对而言不随时间变化,但是对不同的说话者有所不同。高频率分量对语音信号的清晰度、精确度以及自然程度而言具有重要意义,因为没有高频分量语音就显得很沉闷。此外通过这种高频分量可以更好地区分摩擦音和辅音,该高频分量由此也保证增强对该语音的理解。
在通过具有有限带宽的传输信道的语音通信***来传输语音信号时,原则上希望而且也一直以此作为目标:能够以最可能的高质量从发送者向接收者传送待传输的语音信号。但是在此该语音质量是具有多个部分的主观参数,其中语音信号的理解度对这种语音通信***最重要。
在现代数字传输***中已经可以达到比较高的语音理解度。其中公知通过为电话带宽增加高频(大于3.4kHz)以及低频(小于300Hz)可以改善对该语音信号的主观判断。因此在主观质量改善的意义下力求在用于语音通信的***中实现比常见电话带宽更大的带宽。在此可能的措施在于,修正该传输并借助编码方法促使传输带宽加宽或者可替换地执行人工带宽扩展。通过这种带宽扩展在接收端将频率带宽加宽到50Hz至7kHz的范围。借助合适的信号处理算法从窄带语音信号的短片段中利用模式识别的方法确定宽带模型的参数,接着将该参数用于估计该语音所缺乏的信号分量。在这种方法中从窄带语音信号中产生频率分量在50Hz至7kHz范围内的宽带对应物,并引起对主观感受的语音质量的改善。
在当前的语音信号和音频信号编码算法中更多地采用人工带宽扩展的技术。例如在带宽范围(声学带宽50Hz至7kHz)内采用诸如AMR-WB(适应性多比率宽带)编码解码算法的语音编码标准。在这种AMR-WB标准中从低频分量外推出上面的子频带(大约6.4至7kHz的频率范围)。在这种编码解码方法中通常通过比较小数量的辅助信息进行带宽扩展。该辅助信息例如可以是滤波器系数或放大系数,其中滤波器系数例如可以通过LPC(线性预测滤波器)方法产生。该辅助信息以编码的位流传送给接收器。基于扩展带宽技术的其它标准目前可以在标准AMR-WB+和扩展的aac+语音/音频编码解码方法中找到。用于对信息进行编码和解码的方法称为Codec(编解码器),既包括编码器又包括解码器。每个数字电话,不管是为固网建立的还是为移动通信网络建立的,都包含这种将模拟信号转换为数字信号并将数字信号转换为模拟信号的Codec。这种Codec可以用硬件或软件来实现。
在语音/音频信号编码算法的当前实现中采用了带宽扩展的技术,其中借助已经提到的LPC编码技术对扩展频带如6.4至7kHz的频率范围中的分量进行编码和解码。在此在编码器中对输入信号的扩展频带进行LPC分析,并对剩余信号的子帧的LPC系数以及放大系数进行编码。在解码器中产生扩展频带的剩余信号,将传送的放大系数和LPC合成滤波器用于产生输出信号。上述过程可以直接应用于宽带的输入信号,也可以应用于在极限范围或临界范围中的具有扩展频带的下采样子带信号。
在经过扩展的aac+语音/音频编码解码标准中采用SBR(频谱带复制)技术。其中借助64信道QMF滤波器组将宽带音频信号划分为频率子带。对于高频滤波器带信道来说,对信号分量的子带采用经过推敲和技术上高度发展的参数编码,为此需要采用大量的检测器和估计器来检查位流内容。虽然在公知的标准和编码解码方法中已经可以改善语音信号的语音质量,但还是力求进一步提高语音质量。此外上述标准和编码解码方法耗费很大并且具有非常复杂的结构。
发明内容
因此本发明要解决的技术问题是提供一种用于人工扩展语音信号的带宽的方法和装置,利用它们可以改善语音质量和提高语音理解度。此外该方法和装置还可以比较简单和花费少的方式实现。
该技术问题是通过具有下述特征的方法以及装置来解决的。
在本发明的用于人工扩展语音信号的带宽的方法中执行以下步骤:
a)提供宽带的输入语音信号;
b)从宽带输入语音信号的扩展频带中确定扩展带宽所需要的宽带输入语音信号的信号分量;
c)确定用于扩展带宽的信号分量的时间包络;
d)确定用于扩展带宽的信号分量的频谱包络;
e)对时间包络和频谱包络的信息进行编码,并提供经过编码的信息来用于扩展带宽;以及
f)对经过编码的信息进行解码,并从经过编码的信息中产生时间包络和频谱包络以用于产生扩展了带宽的输出语音信号。
通过本发明的方法可以改善语言理解度和提高语音信号传输过程中的语音质量,其中语音信号也理解为声频信号。此外本发明的方法还对传输过程中的干扰具有很强的抵抗性。
优选的,扩展带宽所需要的信号分量通过滤波、尤其是带通滤波从宽带输入语音信号的扩展频带中确定,由此可以对需要的信号分量进行简单和不太费事的选择。
在步骤c)中对时间包络的确定优选与在步骤d)中对频谱包络的确定无关地进行。由此精确地确定包络,由此可以避免相互影响。
优选的,在步骤e)中对时间包络和频谱包络编码之前对时间包络和频谱包络进行量化。优选的,在用于确定频谱包络的步骤d)中确定用于扩展带宽的信号分量的频谱子带的信号功率。由此可以非常精确地确定用于表征时间包络和频谱包络的参数。
为了确定频谱子带的信号功率,优选产生用于扩展带宽的信号分量的信号段,其中对该信号段进行特殊的变换,尤其是FF(快速傅立叶)变换。此外,优选在用于确定时间包络的步骤c)中确定用于扩展带宽的信号分量的时间信号段的信号功率。由此以不费事的方式确定所需要的参数。
优选的,在步骤f)中对已编码的信息进行解码以重构地形成时间包络和频谱包络。
激励信号优选在解码器中从传送给该解码器的信号中产生,其中所传送的信号在对应于宽带输入语音信号的扩展频带频率范围的频率范围内具有这样的信号功率,即该信号功率使得可以产生激励信号。优选向解码器传送经过调制的窄带信号以产生激励信号,该窄带信号具有频率低于宽带输入语音信号的扩展频带的频带范围的频率的频带范围。该激励信号优选具有传送给该解码器的信号的基频的谐波。
优选的,从经过解码的时间包络和激励信号的信息中确定第一校正系数。此外从第一校正系数和激励信号中重构地形成时间包络,尤其是通过将第一校正系数与激励信号相乘。此外,优选对时间包络的重构形式进行滤波,并在滤波器中产生脉冲响应。从该脉冲响应和时间包络的重构形式中重构地形成频谱包络。此外从频谱包络的重构形式中重构出宽带输入语音信号的扩展频带的信号分量。由此非常可靠和非常精确地执行时间包络和频谱包络的重构。
在优选实施方式中向解码器传送窄带信号,其具有频率低于宽带输入语音信号的扩展频带的频率的频带范围。
优选的,从传送给解码器的窄带信号和频谱包络的重构形式中、尤其是从这两个信号的和中确定扩展了带宽的输出语音信号,并作为解码器的输出信号提供出去。由此可以产生和提供保证高语音理解度和高语音质量的输出信号。
优选的,步骤a)至e)在编码器中执行,该编码器优选设置在发射器中。优选的,在步骤e)中产生的已编码的信息作为数字信号传送给解码器。优选的,至少步骤f)在接收器中执行,其中解码器设置在该接收器中。还可以将本发明方法的所有步骤a)至f)都在接收器中执行。在这种情况下将接收器中的步骤a)至e)都替换成(不同实现的)估计方法。步骤a)至e)还可以分离地在发射器中执行。
宽带输入语音信号优选包括在大约50Hz至大约7kHz之间的带宽。宽带输入语音信号的扩展频带优选包括从大约3.4kHz到大约7kHz的频率范围。此外,窄带信号包括宽带输入语音信号从大约50Hz到大约3.4kHz的信号范围。
本发明的用于人工扩展可被施加宽带输入语音信号的语音信号的带宽的装置至少包括以下部件:
a)用于从宽带输入语音信号的扩展频带中确定扩展带宽所需要的宽带输入语音信号的信号分量的装置;
b)用于确定用于扩展带宽的信号分量的时间包络的装置;
c)用于确定用于扩展带宽的信号分量的频谱包络的装置;
d)用于对时间包络和频谱包络进行编码并提供经过编码的信息来用于扩展带宽的编码器;
e)用于对经过编码的信息进行解码并从经过编码的信息中产生时间包络和频谱包络以产生扩展了带宽的输出语音信号的解码器。
本发明的装置使得可以在通信设备中改善在语音信号传输过程中的语音质量和提高语言理解力,该通信设备例如是移动通信设备或ISDN设备。
a)至d)中的装置优选实施为编码器。该编码器可以设置在发射器或接收器中,其中解码器设置在接收器中。
本发明方法的优选实施方式只要可以转换就也作为本发明装置的优选实施方式。
附图说明
下面借助示意性的附图详细解释本发明的实施例。
图1示出本发明装置的编码器;以及
图2示出本发明装置的解码器。
在下面详细解释的发明中,语音信号的概念也包括音频信号。在图1和图2中相同或功能相同的元件具有相同的附图标记。
具体实施方式
在图1中示出用于人工扩展语音信号的带宽的本发明装置的编码器1的示意电路连接图。编码器1既可以实现为硬件又可以作为算法实现为软件。编码器1在该实施例中包括用于对宽带输入语音信号si wb(k)进行带通滤波的块11。此外,编码器1包括与块11连接的块12和块13。在此块12用于确定用于扩展带宽的信号分量的时间包络,这些信号分量是从宽带输入语音信号的扩展频带中确定出来的。按照相应的方式,块13用于确定用于扩展带宽的信号分量的频谱包络,这些信号分量是从宽带输入语音信号的扩展频带中确定出来的。
此外从图1中可以看出块12和块13与块14连接,其中块14用于量化通过块12和13产生的时间包络和频谱包络。
在图1中还示出实施为带通滤波器的块2,在块2上施加宽带的输入语音信号si wb(k)。块2还与另一个块3连接,其中块3实施为另一个编码器。
在该实施例中编码器1以及块2和块3都设置在第一电话设备中。宽带输入语音信号在本实施例中具有从大约50Hz至大约7kHz的带宽。按照本发明,该宽带输入语音信号si wb(k)施加在编码器1的带通滤波器或块11上。借助块11从在本实施例中包括从大约3.4kHz至大约7kHz的带宽的扩展频带中确定出扩展带宽所需要的信号分量。扩展带宽所需要的信号分量通过信号seb(k)来表征并作为块11的输出信号传送给两个块12和13。在此在块12中,从信号seb(k)中确定出时间包络。按照相应的方式在块13中确定通过信号seb(k)表征的信号分量的频谱包络。
下面详细解释如何确定时间包络和频谱包络。在此,首先对表征扩展带宽所需要的信号分量的信号seb(k)进行分段,并对该窗口化的信号段进行变换。信号seb(k)的分段在各k扫描值的长度的帧内进行。全部面向帧地执行下面的所有步骤和子算法。每个语音帧(例如具有10ms或20ms或30ms的持续时间)可以有利地分为多个子帧(持续时间例如为2.5或5ms)
然后对窗口化的信号段进行变换。在该实施例中借助FFT(快速傅立叶变换)变换到频域中。经过FFT变换的信号段在此按照以下公式1)确定:
S wf ( i ) = Σ κ = 0 N f - 1 s eb ( μ · M f + κ ) · w f ( κ ) · e - jiκ 2 π N f
在该公式1)中,Nf表示FFT长度或帧长度,μ表示帧下标,Mf表示窗口化的信号段的帧的重叠。此外wf(k)表示窗口函数。下面接着在频域中计算扩展频带的频率范围的子带中的信号功率。信号强度或信号功率的计算按照以下公式2)进行:
P f ( μ , λ ) = Σ i ∈ EB λ w λ ( i ) · | S wf ( i ) | 2
在该公式2)中λ表示相应子带的下标,其中EBλ表征在第λ个频域窗口wλ(i)中包含所有具有非零系数的FFT间隔区域i的集合。按照公式2)的子带的信号功率Pf(μ,λ)表征传送给解码器的频谱包络的信息。
按照类似于确定频谱包络的方式在时域中确定时间包络,并以经过带通滤波的宽带输入信号si wb(k)的短暂的窗口化片段为基础。由此在确定时间包络的时候也考虑信号的信号段seb(k)。对于每个窗口化段按照以下公式3)计算信号功率:
P t ( v ) = Σ κ = 0 N t - 1 ( s eb ( v · M t + κ ) · w t ( κ ) ) 2
在公式3)中,Nt表示帧长度,v表示帧下标,Mt表示信号段的帧的重叠。要注意一般用于提取时间包络的帧长度Nt和帧的重叠Mt远小于用于确定频谱包络的对应参数Nf和Mf
从信号seb(k)中提取时间包络的参数的替换方式在于,对该信号seb(k)执行希尔伯特变换(90°相移滤波)。经过滤波的部分和原始部分的短片段信号功率的和给出了短暂的时间包络,对该时间包络下采样以确定信号功率Pt(v)。这些信号段的信号功率Pt(v)就表征时间包络的信息。
表征时间包络和频谱包络的信号spt(v)和spf(μ,λ),在块14中量化和编码,这些信号分别表征按照公式2)和公式3)提取的信号功率的参数。块14的输出信号是数字信号BWE,其表征按照编码方式包含时间包络和频谱包络的信息的位流。
将该数字信号BWE传送给解码器,下面将对该解码器详细解释。要注意在根据公式2)和3)提取的信号强度的参数之间存在冗余时可以执行同一种或关联的编码,该编码例如可以通过向量量化来实现。
此外从图1可以看出,宽带输入语音信号还传送给块2。借助实施为带通滤波器的块2对该宽带输入语音信号si wb(k)的窄带范围的信号分量进行滤波。在本实施例中,该窄带范围位于50Hz与3.4kHz之间。块2的输出信号是窄带信号snb(k)并传送给在本实施例中实施为另一个编码器的块3。在块3中对窄带信号snb(k)进行编码,并作为数字信号BWN的位流传送给下面解释的解码器。
在图2中示出用于人工扩展语音信号带宽的本发明装置的这种解码器5的示意电路连接图。从图2可以看出,数字信号BWN首先传送给另一个解码器4,该解码器4对包含在数字信号BWN中的信息解码并从中又产生窄带信号snb(k)。此外解码器4产生另一个包含辅助信息的信号ssi(k)。该辅助信息例如可以是放大系数或滤波器系数。该信号ssi(k)传送给解码器5的块51。块51在该实施例中用于产生处于扩展频带的频率范围中的激励信号,为此考虑信号ssi(k)的信息。
此外在本实施例中设置在接收器中的解码器5具有块52,该块52用于对通过编码器1和解码器2之间的传输段传输的信号BWE进行解码。要注意数字信号BWN也通过编码器1和解码器2之间的传输段传输。从图2可以看出,块51和块52都与解码器区域53至55连接。下面详细解释解码器5和在解码器5中执行的本发明方法的分步骤的功能原理。
如上所述,包含在编码后的数字信号BWE中的信息在块52中解码,并重构出根据公式2)和3)计算并表征时间包络和频谱包络的信号功率。从图2中可以看出,在块51中产生的激励信号sexc(k)是用于重构地形成时间包络和频谱包络的输入信号。该激励信号sexc(k)在此基本上是任意信号,其中作为该信号的重要前提是,该信号必须具有在宽带输入频谱信号si wb(k)的扩展频带的频率范围中足够的信号功率。例如,作为激励信号sexc(k)采用经过调制的窄带信号snb(k)或任意的噪声。如上所述,该激励信号负责精确建立在宽带输出语音信号so wb(k)的扩展频带的信号分量中的频谱包络和时间包络。因此有利的是,按照这样的方式产生该激励信号sexc(k),使得其具有窄带信号snb(k)的基频的谐波。
在分级式语音编码的情况下,实现这一点的一种可能性在于,使用其它解码器4的参数。如果例如Δk为基频的分数或实数值的偏差,b为CELP窄带解码器内的自适应码本的LTB放大因子,那么例如可以利用谐波频率在当前基频的整数倍时通过带通滤波器对任意信号neb(k)的LTP合成滤波(扩展频带的频率范围)来进行激励。
这里根据下式(4)来产生激励信号:
sexc(k)=neb(k)+f(b)·sexc(k-Δk)
这里LTP放大因子可以通过函数f(b)来降低或限制,以便能够防止所产生的扩展频带的信号分量胜出。需要指出,可以实现多个其它的替代方案,以便借助于窄带编解码器的参数执行合成的宽带激励。
产生激励信号的另一种可能性在于,用固定频率的正弦函数来调制窄带信号snb(k),或通过直接采用任意的信号neb(k),这在上面已经被定义过。需要强调,用于产生激励信号sexc(k)的方法完全取决于数字信号BWE的生成以及该数字信号BWE的格式以及该数字信号BWE的解码。因此就此进行独立的调整。
下面详细解释时间包络的重构式成型。数字信号BWE如上所述在块52中解码,并根据信号spt(v)和spf(μ,λ)提供根据公式2)和3)计算的信号功率表征时间包络和频谱包络的参数。为此从图2中看出,在本实施例中首先重构地形成时间包络。这在解码区域53中执行。为此将激励信号sexc(k)以及信号spt(v)传送给解码区域53。如图2所示,激励信号sexc(k)既传送给块531又传送给乘法器532。还将信号spt(v)传送给块531。从传送给块531的信号中产生比例校正系数g1(k)。该比例校正系数g1(k)由块531传送给乘法器532。然后在乘法器532中将激励信号sexc(k)与该比例校正系数g1(k)相乘,从而产生输出信号s’exc(k),该输出信号表征对时间包络的重构式成型。输出信号s’exc(k)具有接近正确的时间包络,但是就正确的频率而言还不是很精确,由此在下面的步骤中需要重构地形成频谱包络,从而能够将不精确的频率与需要的频率相匹配。
在图2中可以看出,输出信号s’exc(k)传送给解码器5的第二解码区域54,信号spf(μ,λ)也传送给第二解码区域54。第二解码区域54具有块541和块542,其中块541用于对输出信号s’exc(k)进行滤波。从输出信号s’exc(k)和信号spf(μ,λ)中产生脉冲响应h(k),该脉冲响应从块541传送给块542。然后在块542中由输出信号s’exc(k)和脉冲响应h(k)来重构形成频谱包络。然后通过块542的输出信号s”exc(k)表征重构的频谱包络。
在按照图2示出的实施例中,在产生第二解码区域54的输出信号s”exc(k)之后在解码器5的第三解码区域55中再次重构地形成时间包络。时间包络的重构形成按照类似于在第一解码区域53的方式进行。在此在第三解码区域5中从输出信号s”exc(k)和信号spt(v)中通过块551产生第二比例校正系数g2(k),将该系数传送给乘法器552。然后提供表征扩展带宽所需要的信号分量的信号seb(k)作为解码器5的第三解码区域55的输出信号。将该信号seb(k)传送给求和器56,窄带信号seb(k)也传送给求和器56。通过窄带信号seb(k)和信号seb(k)的求和,产生扩展了带宽的输出信号so wb(k),并作为解码器5的输出信号提供。
要注意图2所示的实施例只是示例性的,对于本发明来说像在第一解码区域53中进行的那样重构地形成时间包络一次以及像在第二解码区域54中进行的那样重构地形成频谱包络一次就足够了。同样要注意还可以在于第一解码区域53中重构地形成时间包络之前在第二解码区域54中重构地形成频谱包络。这意味着在该实施例中第二解码区域54设置在在第一解码器区域53之前。还可以再次继续交替地执行时间包络的重构形成和频谱包络的重构形成,并且例如在图2所示的实施例中在第三解码区域55之后接着设置另一个解码区域,在该另一个解码区域中重新重构地形成频谱包络。
如上所述,本发明在该实施例中以有利方式用于具有大约50Hz至7kHz频率范围的宽带输入语音信号。同样,在该实施例中本发明可用于人工扩展语音信号的带宽,其中在此扩展频带通过大约3.4kHz至大约7kHz的频率范围来预定。还可以将本发明用于设置在低频频率范围中的扩展频带。例如,该扩展频带在此可以包括大约50Hz或更低的频率至大约3,4kHz的频率范围。要着重说明,本发明的方法可以按照以下方式用于人工扩展语音信号的带宽,即使扩展频带包括至少部分在大约7kHz频率以上并例如达到8kHz、尤其是10kHz或更高频率的频率范围。
如上所述,时间包络的重构形成在按照图2的第一解码区域53中通过将第一比例校正系数g1(k)和激励信号sexc(k)相乘来产生。在此要注意,在时域中的乘法对应于频域中的卷积运算,由此给出以下公式(5):
s′exc(k)=g(k)·sexc(k);
S′exc(z)=G(z)*Sexc(z)
只要频谱包络在原理上没有被第一解码区域53改变,则第一比例校正系数或放大系数g1(k)就应当具有严格的低通频率特性。
为了计算放大系数或第一校正系数g1(k),通过在上面已经用于分段和分析对时间包络的提取或在编码器1中借助块12从信号seb(k)中产生信号spt(v)的方式来分段和分析激励信号sexc(k)。通过公式3)计算的经过解码的信号功率和经过分析的信号强度的结果Pexc t(v)之间的比例产生了第v个信号段的期望放大系数γ(v)。第v个信号段的该放大系数根据以下公式6)计算:
γ ( v ) = P t ( v ) P t exc ( v )
从该放大系数γ(v)中通过内插和低通滤波计算放大系数或第一校正系数g1(k)。为了限制该放大系数或第一校正系数g1(k)对频谱包络的影响,低通滤波在此具有很重要的意义。
扩展频带所需要的信号分量的频谱包络的重构形式通过对表征时间包络的重构形式的输出信号s’exc(k)进行滤波来确定。在此该滤波操作在时域或在频率中进行。为了能避免脉冲响应h(k)具有较大的时间散射或时间扩展幅度,分析第一解码区域53的输出信号s’exc(k),以便能构找到信号功率Pexc f(μ,λ)。扩展频带的频率范围的对应子带的期望放大系数Φ(μ,λ)根据以下公式7)计算:
Φ ( μ , λ ) = P f ( μ , λ ) P f exc ( μ , λ )
频谱包络的形状滤波器的频率特性H(μ,i)可以通过对放大系数Φ(μ,λ)进行内插并在考虑频率的情况下进行平滑来计算。如果频谱包络的形状滤波器应当用在时域中,例如通过线性相位FIR滤波器,则滤波器系数可以通过对频率特性H(μ,i)和后面的窗口化的反FFT变换来计算。
如通过上面的实施例解释和展示的,时间包络的重构形成影响频谱包络的重构形成,反之亦然。因此有利的是,如在该实施例中解释和在图2中示出的那样,在迭代过程中交替地执行时间包络的重构形成和频谱包络的重构形成。由此可以明显改善扩展频带的信号分量的时间包络和频谱包络的一致性,该时间包络和频谱包络在解码器中重构,并且能达到在编码器中相应产生的时间包络和频谱包络。
在按照图2的上述实施例中,执行一个半迭代(重构时间包络、重构频谱包络和再次重构时间包络)。通过本发明实现的带宽扩展使得很容易产生具有处于正确频率下的谐波的激励信号,该正确频率例如是瞬时音素的基频的整数倍。要注意,本发明还可以用于宽带输入信号的被下采样的子带信号分量。这在要求极少的计算成本时是很有利的。
优选的,编码器1以及块2和块3都设置在发射器中,其中按逻辑在块2和块3以及编码器1中执行的方法步骤也在该发射器中执行。块4以及解码器5优选可以设置在接收器中,由此也很清楚在解码器5和块4中执行的前面的步骤要在接收器中处理。要注意,本发明还可以这样实现,即在编码器1中执行的方法步骤在解码器5中执行,由此只在接收器中执行。在此可以在解码器5中估计按照公式2)和3)计算的信号功率。尤其是块52用于估计信号功率的参数。该实施例使得可以消除在数字信号BWE中传送的辅助信息的潜在传送错误。通过预先估计包络例如由于数据丢失而失去的参数,可以防止麻烦地转换信号带宽。
与用于人工扩展语音信号的带宽的公知方法不同,在本发明中不向解码器传送已经采用的放大系数和滤波器系数作为辅助信息,而只是传送期望的时间包络和频谱包络作为辅助信息。在设置在接收器内的解码器中才计算放大系数和滤波器系数。由此可以成本低的方式在接收器中分析带宽的人工扩展,并在必要时进行校正。此外按照本发明的方法和装置可以非常稳定地抵抗激励信号的干扰,例如所接收的窄带信号的这种干扰可能通过传输错误而引起。
通过分开执行对时间包络和频谱包络的分析、传送和重构成形,可以在时域和频域中都达到非常好的分辨率或分隔。这导致对静止音素和音调以及临时或短时信号的非常好的再现性。对于语音信号,尤其是停止辅音和***音的再现得到了明显改善的时间分辨率。
与传统的带宽扩展不同,通过本发明可以通过线性相位FIR滤波器而不是LPC合成滤波器来进行频率成型。由此还可以降低典型的伪影(滤波器环)。此外本发明还可以非常灵活和模块化的结构实现,此外该结构还使得可以简单方式更换或调节在接收器和解码器5中各个块。优选的,这种更换或调节不需要改变发射器和编码器1或传输信号的格式-经过编码的信息就以该格式传送给解码器5或接收器。此外利用本发明的方法可以运行不同的解码器,由此可以根据可提供的计算功率以不同的精度再次产生宽带输入信号。
要注意所接收的表征频谱包络和时间包络的参数不仅可用于扩展带宽,还可用于支持后面的信号处理块如后滤波,或者附加的编码组件如变换编码器。
所产生的窄带语音信号snb(k),如向用于扩展带宽的算法提供的,例如可以在减小扫描频率一半之后以8kHz的扫描速率给出。
利用本发明和带宽扩展所基于的原理可以产生G.729+标准信息的宽带激励。在数字信号BWE中传送的辅助信息的数据率大约是2kbit/s。此外在本发明中需要小于3WMOPS的不太复杂的计算***或不太复杂的计算花费。此外,本发明的方法和装置能非常稳定地抵抗G.729+标准的基带干扰。本发明还可以优选用于在通过IP的语音中的使用。此外本发明的方法以及装置与TDAC包络兼容。另外本发明还具有极度模块化和灵活的结构以及模块化和灵活的概念。

Claims (28)

1.一种用于人工扩展语音信号的带宽的方法,其特征在于以下步骤:
a)提供宽带的输入语音信号;
b)从宽带输入语音信号的扩展频带中确定扩展带宽所需要的宽带输入语音信号的信号分量;
c)确定用于扩展带宽的信号分量的时间包络;
d)确定用于扩展带宽的信号分量的频谱包络;
e)对时间包络和频谱包络的信息进行编码,并提供经过编码的信息来用于扩展带宽;
f)对经过编码的信息进行解码,并从经过编码的信息中产生时间
包络和频谱包络以用于产生扩展了带宽的输出语音信号。
2.根据权利要求1所述的方法,其特征在于,所述扩展带宽所需要的信号分量通过滤波从宽带输入语音信号的扩展频带中确定。
3.根据权利要求2所述的方法,其特征在于,所述滤波是带通滤波。
4.根据权利要求1-3之一所述的方法,其特征在于,在步骤c)
中对时间包络的确定与在步骤d)中对频谱包络的确定无关地进行。
5.根据上述权利要求1-3之一所述的方法,其特征在于,在步骤e)中对时间包络和频谱包络编码之前对时间包络和频谱包络进行量化。
6.根据上述权利要求1-3之一所述的方法,其特征在于,在用于确定频谱包络的步骤d)中确定用于扩展带宽的信号分量的频谱子带的信号功率。
7.根据权利要求6所述的方法,其特征在于,对用于扩展带宽的信号分量进行分段,通过对窗口化的信号段进行变换,以确定所述频谱子带的信号功率。
8.根据权利要求7所述的方法,其特征在于,对所述的信号段进行快速傅立叶变换。
9.根据上述权利要求1-3之一所述的方法,其特征在于,在用于确定时间包络的步骤c)中确定用于扩展带宽的信号分量的时间信号段的信号功率。
10.根据上述权利要求1-3之一所述的方法,其特征在于,在步骤f)中对已编码的信息进行解码以重构地形成时间包络和频谱包络。
11.根据上述权利要求1-3之一所述的方法,其特征在于,激励信号在解码器(5)中从传送给该解码器(5)的信号中产生,其中所传送的信号在宽带输入语音信号的扩展频带的频率范围内具有使得能产生激励信号的信号功率。
12.根据权利要求11所述的方法,其特征在于,向所述解码器(5)传送经过调制的窄带信号以产生激励信号,该窄带信号具有频率低于宽带输入语音信号的扩展频带的频带范围的频率的频带范围。
13.根据权利要求11所述的方法,其特征在于,所述激励信号具有传送给所述解码器(5)的信号的基频的谐波。
14.根据权利要求13所述的方法,其特征在于,从经过解码的时间包络和激励信号的信息中确定第一校正系数。
15.根据权利要求14所述的方法,其特征在于,从第一校正系数和激励信号中重构地形成时间包络。
16.根据权利要求15所述的方法,其特征在于,重构地形成时间包络通过将第一校正系数与激励信号相乘来进行。
17.根据权利要求16所述的方法,其特征在于,对时间包络的重构形式进行滤波,并在滤波器中产生脉冲响应。
18.根据权利要求17所述的方法,其特征在于,从所述脉冲响应和时间包络的重构形式中重构地形成频谱包络。
19.根据权利要求18所述的方法,其特征在于,从频谱包络的重构形式中重构出宽带输入语音信号的扩展频带的信号分量。
20.根据上述权利要求1-3之一所述的方法,其特征在于,向解码器(5)传送窄带信号,其具有频率低于宽带输入语音信号的扩展频带的频带范围的频率的频带范围。
21.根据权利要求19所述的方法,其特征在于,从频谱包络的重构形式中重构出宽带输入语音信号的扩展频带的信号分量,从传送给解码器(5)的窄带信号和重构出的宽带输入语音信号的扩展频带的信号分量中确定扩展了带宽的输出语音信号,并作为解码器(5)的输出信号提供出去。
22.根据权利要求21所述的方法,其特征在于,通过传送给解码器(5)的窄带信号和重构出的宽带输入语音信号的扩展频带的信号分量的求和,确定扩展了带宽的输出语音信号。
23.根据上述权利要求1-3之一所述的方法,其特征在于,步骤a)至e)在编码器(1)中执行,在步骤e)中产生的已编码的信息作为数字信号传送给解码器。
24.根据上述权利要求1-3之一所述的方法,其特征在于,所述宽带输入语音信号包括在50Hz至7kHz之间的带宽。
25.根据上述权利要求1-3之一所述的方法,其特征在于,所述宽带输入语音信号的扩展频带包括从3.4kHz到7kHz的频率范围。
26.根据权利要求20所述的方法,其特征在于,所述窄带信号包括宽带输入语音信号从50Hz到3.4kHz的信号范围。
27.一种用于人工扩展语音信号的带宽的装置,其特征在于,
a)用于从宽带输入语音信号的扩展频带中确定扩展带宽所需要的宽带输入语音信号的信号分量的装置;
b)用于确定用于扩展带宽的信号分量的时间包络的装置;
c)用于确定用于扩展带宽的信号分量的频谱包络的装置;
d)用于对时间包络和频谱包络进行编码并提供经过编码的信息来用于扩展带宽的编码器(1);以及
e)用于对经过编码的信息进行解码并从经过编码的信息中产生时间包络和频谱包络以产生扩展了带宽的输出语音信号的解码器(5)。
28.根据权利要求27所述的装置,其特征在于,a)至c)中的装置实施为编码器(1)。
CNB2006800007998A 2005-07-13 2006-06-30 用于人工扩展语音信号的带宽的方法和装置 Expired - Fee Related CN100568345C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102005032724A DE102005032724B4 (de) 2005-07-13 2005-07-13 Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE102005032724.9 2005-07-13

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN200910208032XA Division CN101676993B (zh) 2005-07-13 2006-06-30 用于人工扩展语音信号的带宽的方法和装置

Publications (2)

Publication Number Publication Date
CN101061535A CN101061535A (zh) 2007-10-24
CN100568345C true CN100568345C (zh) 2009-12-09

Family

ID=36994160

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB2006800007998A Expired - Fee Related CN100568345C (zh) 2005-07-13 2006-06-30 用于人工扩展语音信号的带宽的方法和装置
CN200910208032XA Expired - Fee Related CN101676993B (zh) 2005-07-13 2006-06-30 用于人工扩展语音信号的带宽的方法和装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN200910208032XA Expired - Fee Related CN101676993B (zh) 2005-07-13 2006-06-30 用于人工扩展语音信号的带宽的方法和装置

Country Status (12)

Country Link
US (1) US8265940B2 (zh)
EP (1) EP1825461B1 (zh)
JP (1) JP4740260B2 (zh)
KR (1) KR100915733B1 (zh)
CN (2) CN100568345C (zh)
AT (1) ATE407424T1 (zh)
CA (1) CA2580622C (zh)
DE (2) DE102005032724B4 (zh)
DK (1) DK1825461T3 (zh)
ES (1) ES2309969T3 (zh)
PL (1) PL1825461T3 (zh)
WO (1) WO2007073949A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104246876A (zh) * 2012-04-27 2014-12-24 株式会社Ntt都科摩 声音解码装置、声音编码装置、声音解码方法、声音编码方法、声音解码程序及声音编码程序

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101290622B1 (ko) * 2007-11-02 2013-07-29 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 복호화 방법 및 장치
KR20100086000A (ko) * 2007-12-18 2010-07-29 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
KR101261677B1 (ko) 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
CN101751926B (zh) 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码***
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
JP5423684B2 (ja) * 2008-12-19 2014-02-19 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8781844B2 (en) * 2009-09-25 2014-07-15 Nokia Corporation Audio coding
KR101613684B1 (ko) * 2009-12-09 2016-04-19 삼성전자주식회사 음향 신호 보강 처리 장치 및 방법
JP5652658B2 (ja) * 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN102473417B (zh) * 2010-06-09 2015-04-08 松下电器(美国)知识产权公司 频带扩展方法、频带扩展装置、集成电路及音频解码装置
US20130108073A1 (en) * 2010-07-09 2013-05-02 Bang & Olufsen A/S Method and apparatus for providing audio from one or more speakers
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
KR20120046627A (ko) * 2010-11-02 2012-05-10 삼성전자주식회사 화자 적응 방법 및 장치
CN102610231B (zh) * 2011-01-24 2013-10-09 华为技术有限公司 一种带宽扩展方法及装置
CN103827965B (zh) * 2011-07-29 2016-05-25 Dts有限责任公司 自适应语音可理解性处理器
JP6200034B2 (ja) * 2012-04-27 2017-09-20 株式会社Nttドコモ 音声復号装置
US9258428B2 (en) 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
KR101798126B1 (ko) * 2013-01-29 2017-11-16 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법
CN105190748B (zh) * 2013-01-29 2019-11-01 弗劳恩霍夫应用研究促进协会 音频编码器、音频解码器、***、方法及存储介质
EP2784775B1 (en) * 2013-03-27 2016-09-14 Binauric SE Speech signal encoding/decoding method and apparatus
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
EP3199956B1 (en) * 2016-01-28 2020-09-09 General Electric Technology GmbH Apparatus for determination of the frequency of an electrical signal and associated method

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3946821B2 (ja) * 1996-12-13 2007-07-18 東北リコー株式会社 排版装置
DE19706516C1 (de) * 1997-02-19 1998-01-15 Fraunhofer Ges Forschung Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
DE10041512B4 (de) * 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US20020031129A1 (en) * 2000-09-13 2002-03-14 Dawn Finn Method of managing voice buffers in dynamic bandwidth circuit emulation services
DE10102173A1 (de) * 2001-01-18 2002-07-25 Siemens Ag Verfahren und Anordnung zum Umsetzen von parametrisch codier-ten Sprachsignalen verschiedener Bandbreite in Sprachsignale
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
ATE315308T1 (de) * 2002-09-12 2006-02-15 Siemens Ag Kommunikationsendgerät mit bandbreitenerweiterung und echokompensation
DE10252070B4 (de) * 2002-11-08 2010-07-15 Palm, Inc. (n.d.Ges. d. Staates Delaware), Sunnyvale Kommunikationsendgerät mit parametrierter Bandbreitenerweiterung und Verfahren zur Bandbreitenerweiterung dafür
US20040138876A1 (en) * 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
WO2006107836A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for split-band encoding of speech signals

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
An upper bound on the quality of artificial bandwidthextensionof narrowband speech signals. JAX,P,ET,AL.2002 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH AND SIGNAL PROCESSING.PROCEEDINGS,第4卷. 2002
An upper bound on the quality of artificial bandwidthextensionof narrowband speech signals. JAX,P,ET,AL.2002 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH AND SIGNAL PROCESSING.PROCEEDINGS,第4卷. 2002 *
Bandwidth extension of narrowband speech for lowbit-ratewideband coding. VALIN J ET AL.SPEECH CODING 2000.PROCEEDINGS.2000. 2000
Bandwidth extension of narrowband speech for lowbit-ratewideband coding. VALIN J ET AL.SPEECH CODING 2000.PROCEEDINGS.2000. 2000 *
Wideband extension of telephone speech using a hiddenmarkov model. JAX P ET AL.SPEECH CODING 2000.PROCEEDINGS.2000. 2000
Wideband extension of telephone speech using a hiddenmarkov model. JAX P ET AL.SPEECH CODING 2000.PROCEEDINGS.2000. 2000 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104246876A (zh) * 2012-04-27 2014-12-24 株式会社Ntt都科摩 声音解码装置、声音编码装置、声音解码方法、声音编码方法、声音解码程序及声音编码程序

Also Published As

Publication number Publication date
DE102005032724A1 (de) 2007-02-01
CN101061535A (zh) 2007-10-24
JP2008513848A (ja) 2008-05-01
CA2580622A1 (en) 2007-01-13
CN101676993A (zh) 2010-03-24
CA2580622C (en) 2011-05-10
DE102005032724B4 (de) 2009-10-08
PL1825461T3 (pl) 2009-02-27
DK1825461T3 (da) 2009-01-26
EP1825461B1 (de) 2008-09-03
ATE407424T1 (de) 2008-09-15
US20080126081A1 (en) 2008-05-29
DE502006001491D1 (de) 2008-10-16
KR100915733B1 (ko) 2009-09-04
ES2309969T3 (es) 2008-12-16
WO2007073949A1 (de) 2007-07-05
US8265940B2 (en) 2012-09-11
JP4740260B2 (ja) 2011-08-03
KR20070090143A (ko) 2007-09-05
EP1825461A1 (de) 2007-08-29
CN101676993B (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
CN100568345C (zh) 用于人工扩展语音信号的带宽的方法和装置
KR100388388B1 (ko) 재생위상정보를사용하는음성합성방법및장치
US8942988B2 (en) Efficient temporal envelope coding approach by prediction between low band signal and high band signal
EP3039676B1 (en) Adaptive bandwidth extension and apparatus for the same
Kleijn Encoding speech using prototype waveforms
CA2556797C (en) Methods and devices for low-frequency emphasis during audio compression based on acelp/tcx
CN109545236B (zh) 改进时域编码与频域编码之间的分类
US6708145B1 (en) Enhancing perceptual performance of sbr and related hfr coding methods by adaptive noise-floor addition and noise substitution limiting
US8630864B2 (en) Method for switching rate and bandwidth scalable audio decoding rate
US8718804B2 (en) System and method for correcting for lost data in a digital audio signal
US20070147518A1 (en) Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
KR20110040820A (ko) 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법
CN103155034A (zh) 基于celp的语音编码器中的音频信号带宽扩展
Bhatt Simulation and overall comparative evaluation of performance between different techniques for high band feature extraction based on artificial bandwidth extension of speech over proposed global system for mobile full rate narrow band coder
Ramprashad Embedded coding using a mixed speech and audio coding paradigm
Motlicek et al. Wide-band audio coding based on frequency-domain linear prediction
Nizampatnam et al. Bandwidth extension of telephone speech using magnitude spectrum data hiding
Mermelstein et al. INR
Wreikat et al. Design Enhancement of High Quality, Low Bit Rate Speech Coder Based on Linear Predictive Model
Gao et al. A new approach to generating Pitch Cycle Waveform (PCW) for Waveform Interpolation codec
Viswanathan et al. Development of a Good-Quality Speech Coder for Transmission Over Noisy Channels at 2.4 kb/s.
Dimolitsas Speech Coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091209

Termination date: 20150630

EXPY Termination of patent right or utility model