CN1185620C - 声音合成装置和方法以及电话装置 - Google Patents

声音合成装置和方法以及电话装置 Download PDF

Info

Publication number
CN1185620C
CN1185620C CNB001188240A CN00118824A CN1185620C CN 1185620 C CN1185620 C CN 1185620C CN B001188240 A CNB001188240 A CN B001188240A CN 00118824 A CN00118824 A CN 00118824A CN 1185620 C CN1185620 C CN 1185620C
Authority
CN
China
Prior art keywords
signal
broadband
linear prediction
noise
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB001188240A
Other languages
English (en)
Other versions
CN1274146A (zh
Inventor
大森士郎
西口正之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1274146A publication Critical patent/CN1274146A/zh
Application granted granted Critical
Publication of CN1185620C publication Critical patent/CN1185620C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02BHYDRAULIC ENGINEERING
    • E02B11/00Drainage of soil, e.g. for agricultural purposes
    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21DSHAFTS; TUNNELS; GALLERIES; LARGE UNDERGROUND CHAMBERS
    • E21D20/00Setting anchoring-bolts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Mining & Mineral Resources (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Structural Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Geochemistry & Mineralogy (AREA)
  • Civil Engineering (AREA)
  • Mechanical Engineering (AREA)
  • Agronomy & Crop Science (AREA)
  • Geology (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

在声音合成器中,噪音添加器产生具有300至4,600Hz的频带的噪音信号,调整该噪音信号的增益,和将该增益调整后的噪音信号添加到通过零填充器填充零后的激发源excW中,从而提供一个相当均匀的宽带激发源excW’。通过确定一个窄带激发源或一个填充零之后的宽带激发源的功率和使得增益适合于该窄带激发源或该功率来调整该信号增益。

Description

声音合成装置和方法以及电话装置
技术领域
本发明涉及一种声音合成装置和方法,例如,用来在接收侧由输入窄带声音信号合成宽带信号或通过通讯***或广播***传送其参数。本发明还涉及一种采用该声音合成装置和方法的电话装置,和一种将声音合成方法用作程序的程序服务媒介。
背景技术
传统的有线电话和无线电话的音质不能令电话用户满意。事实上如此低音质的一个原因在于当前电话的频带局限于300到3,400Hz。
由于在通话中使用的传送途径受到有关的规则和标准的限制,难以加宽频带。为得到通话领域中的高音质,已提出多种方法用于在接收侧预测所接收声音频带外的组分和产生一个宽带信号。
典型地,在用于线性预测编码(LPC)分析和合成的公知方法的基础上已经提出一种方法,用于声音信号的处理,将从窄带声音信号中获取的线性预测因子α和线性预测残数或通过使剩余量化获得的激发源都加宽频带,并且通过LPC由变宽频带的线性预测因子α和激发源合成宽带声音。
但是,由于这样获取的宽带声音是失真的,原始声音的频率组分从所合成的宽带声音中滤波出来并且将其加到原始声音中。
考虑到激发源几乎是白噪声这样一个事实,还已经提出加宽激发源频带的方法,将零***到两个连续的样本之间以产生一个混淆的组分并且这个组分将用来作为宽带激发源。
例如当一个零***到两个连续样本之间时,频谱相对于所采用的Nyquist频率表现出线性对称。因此,这种方法对于从最初几乎是白噪声的窄带激发源中获取宽带激发源是有一定效果的。
假设窄带信号的采样频率是8kHz,宽带信号的是16kHz并且窄带激发源限制在300到3,400Hz,例如,通过上述方法所获得的宽带激发源是具有3,400Hz到4,600Hz间隙的300到3,400Hz和4,600Hz到7,700Hz。因此,即使通过宽带LPC合成也不能产生对应于这个间隙的频带,但是将会产生不包含对应该间隙的频带的宽带声音。因此,宽带声音不是自然的声音。
如上所述,由于从LPC合成中所产生的激发源包含加宽的频带等等是低质的,因此所合成的信号也将是低质的。
发明内容
本发明的一个目的是,通过提供一种由改进激发源的质量能够合成优质宽带信号的声音合成装置和方法,来克服已有技术的上述缺点。
本发明的另一个目的是提供一种具有接收装置的电话装置,该接收装置能通过采用上面的声音合成装置和方法提供优质的宽带信号。
本发明的再一个目的是提供一种程序服务媒介,其以程序形式使用声音合成方法和因此能便宜地提供优质宽带信号。
根据本发明,提供一种声音合成装置,该声音合成装置用于从由滤波合成所获得的部分输出信号合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余量或激发源;该声音合成装置包含用于向线性预测剩余或激发源添加噪音信号的装置。
根据本发明,还提供一种声音合成装置,该声音合成装置用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源;该声音合成装置包含用于从线性预测剩余或激发源形成宽带激发源的装置和用于向宽带激发源添加噪音信号的装置。
根据本发明,还提供一种声音合成装置,该声音合成装置用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源;该声音合成装置包含用于向线性预测剩余或激发源添加噪音信号的装置和用于从已经由噪音添加装置添加噪音信号的线性预测剩余或激发源形成宽带激发源。
根据本发明,还提供一种声音合成装置,该声音合成装置用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源;该声音合成装置包含用于分析窄带信号来提供线性预测剩余信号的装置;用于从通过分析装置所获得的线性预测剩余产生宽带剩余信号的装置;和用于向宽带剩余信号添加具有某一信号组分的噪音信号的装置,该信号组分的频率没有包含在由宽带剩余信号产生装置所产生的宽带剩余信号的频带中。
根据本发明,还提供一种声音合成装置,该声音合成装置用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源;该声音合成装置包含用于分析窄带信号来提供线性预测剩余信号的装置;用于向宽带剩余信号添加具有某一信号组分的噪音信号的装置,该信号组分的频率没有包含在由分析装置所产生线性预测剩余信号的频带中;和用于从已由噪音添加装置添加了噪音信号的线性预测信号中产生宽带剩余信号的装置。
根据本发明,还提供一种声音合成方法,该声音合成方法用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源;该声音合成方法包括给线性预测剩余或激发源添加噪音信号的步骤。
根据本发明,还提供一种声音合成方法,该声音合成方法用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源;该声音合成方法包括从线性预测剩余或激发源中形成宽带激发源和为宽带激发源添加噪音信号的步骤。
根据本发明,还提供一种声音合成方法,该声音合成方法用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源;该声音合成方法包括声音合成器包含的装置向线性预测剩余或激发源添加噪音信号的步骤,和从已在噪音添加步骤中添加了噪音信号的线性预测剩余或激发源中形成宽带激发源的步骤。
根据本发明,还提供一种声音合成方法,该声音合成方法用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余量或激发源。该声音合成方法包括:分析窄带信号来提供线性预测信号的步骤;从在分析步骤中所获得的线性预测剩余量中产生宽带剩余信号的步骤;和向宽带剩余信号添加具有某一信号组分的噪音信号的步骤,该信号组分的频率没有包含在由宽带剩余信号产生装置所产生的宽带剩余信号的频带中。
根据本发明,还提供一种声音合成方法,该声音合成方法用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源。该声音合成方法包括:分析窄带信号来提供线性预测剩余信号的步骤;给线性预测剩余信号添加具有某一信号组分的噪音信号的步骤,该信号组分的频率没有包含在分析步骤中所获得的线性预测剩余信号的频带中;和从已在噪音添加步骤添加了噪音信号的线性预测信号中产生宽带剩余信号的步骤。
使用根据本发明的声音合成装置和方法,可以改进激发源的质量并因此提供优质的宽带信号。
根据本发明,还提供一种电话装置,该电话装置包括一种传输装置,用来传输用PSI-CELP或VSELP方法编码窄带信号的参数作为传输信号;和一种接收装置,用来向包含在该参数中的线性预测剩余量或激发源添加噪音信号和从由滤波合成所获得的部分输出信号中合成宽带信号。
根据本发明,还提供一种电话装置,该电话装置包括一种传输装置,用来传输由PSI-CELP或VSELP方法编码的窄带信号的参数作为传输信号;和一种接收装置,用来从包含在该参数中的线性预测剩余量或激发源中形成宽带激发源,向宽带激发源添加噪声信号然后从由滤波合成所获得的部分输出信号中合成宽带信号。
根据本发明,还提供一种电话装置,该电话装置包含一种传输装置,用来传输由PSI-CELP或VSELP方法编码的窄带信号的参数作为传输信号;和一种接收装置,用来向包含在该参数中的线性预测剩余量或激发源添加噪声信号,从已添加了噪声信号的线性预测剩余量或激发源中形成宽带激发源,和从使用宽带激发源的滤波合成所获得的部分输出信号中合成宽带信号。
在根据本发明的电话装置中,接收装置能够提供优质的宽带信号。
根据本发明,提供一种程序服务媒介,用来提供一种用于从滤波合成所获得的部分输出信号中合成宽带信号的声音合成程序,该滤波合成的输入参数是窄带信号的线性预测剩余量或激发源。该程序包括从线性预测剩余量或激发源中形成宽带激发源和向宽带激发源添加噪音信号的程序。
根据本发明,提供一种程序服务媒介,用来提供一种用于从滤波合成所获得的部分输出信号中合成宽带信号的声音合成程序,该滤波合成的输入参数是窄带信号的线性预测剩余量或激发源。该程序包括向线性预测剩余或激发源添加噪音信号的程序,和从已在噪音添加程序中添加了噪音信号的线性预测剩余或激发源中形成宽带激发源的程序。
根据本发明,提供一种程序服务媒介,用来提供一种用于从滤波合成所获得的部分输出信号中合成宽带信号的声音合成程序,该滤波合成的输入参数是窄带信号的线性预测剩余量或激发源。该程序包括:分析窄带信号来提供线性预测剩余信号的程序,从在分析程序中所获得的线性预测剩余信号中产生宽带剩余信号的程序,和向宽带剩余信号添加具有某一信号组分的噪声信号的程序,该信号组分的频率没有包含在宽带剩余信号产生程序中所产生的宽带剩余信号的频带中。
根据本发明,提供一种程序服务媒介,用来提供一种用于从滤波合成所获得的部分输出信号中合成宽带信号的声音合成程序,该滤波合成的输入参数是窄带信号的线性预测剩余量或激发源。该程序包括:分析窄带信号来提供线性预测剩余信号的程序;为剩余信号添加具有某一信号组分的噪音信号的程序,该信号组分的频率不包含于在分析程序中所获得的线性预测剩余信号的频带中;和从已在噪音添加程序中添加了噪音信号的线性预测剩余信号中产生宽带剩余信号的程序。
根据本发明的程序服务媒介能够通过以程序的形式提供声音合成方法来提供优质的宽带信号。
也就是说,故意将噪音信号添加给最初是激发源的信号中,目的是改进合成信号的音质。
更明确地,单独产生一个噪音信号,其增益已用窄带激发源的功率进行调整了并且它的频率范围从3,400到4,600Hz,并将该噪声信号添加给通过零填充所获得的宽带激发源。将最终得到的信号作为宽带激发源。可以代替的是,3,400到4,600Hz的噪音信号单独产生,并添加给窄带激发源,然后用零填充。将最终得到的信号作为是宽带激发源。因此,将消除位于3,400到4,600Hz频率之间的间隙。
在前面所述的声音合成装置和方法中,给出线性预测因子α和激发源或预测剩余exc,并且将单独产生的噪音信号添加给预测剩余exc。将最终得到的信号在下文中称做“exc”。将它提供给以线性预测因子α作为其滤波因子的合成滤波器,对其滤波来提供输出信号。
用于窄带信号合成的滤波因子αN具有通过任何预测装置加宽的频带来提供宽带滤波因子αW。激发源或预测剩余excN通过零填充产生一个混淆信号。将单独产生的噪音信号添加给激发源或预测剩余量。将最终得到的信号在下文中称做“excW’”。此后,信号excW提供给具有宽带滤波因子αW的合成滤波器,在此对其进行滤波来提供输出信号。
另外,用于窄带信号合成的滤波因子αN的频带通过任何预测方法加宽来提供宽带滤波因子αW。激发源或预测剩余excN已单独产生添加其中的噪音信号,并且进一步通过零填充产生一个混淆信号。将最终得到的信号在下文中称做“excW”。此后,信号excW提供给具有宽带滤波因子αW的合成滤波器,该信号在此进行滤波来提供输出信号。
另外,对输入的窄带信号进行线性预测分析或类似分析来提供窄带因子αN。将这个窄带因子αN反相滤波来提供预测剩余信号excN,并且通过一些预测装置将它的频带加宽来提供宽带滤波因子αW。激发源或预测剩余excN通过零填充产生一个混淆信号并具有单独产生添加其中的噪音信号。将最终得到的信号在下文中称做“excW”。此后,将信号excW提供给将宽带滤波因子αW作为其滤波因子的合成滤波器,并在此将该信号滤波来提供输出信号。
另外,对输入的窄带信号进行线性预测分析或类似分析来提供窄带因子αN。将这个窄带因子αN反相滤波来提供预测剩余信号excN,并且通过一些预测装置将它的频带加宽来提供宽带滤波因子αW。激发源或预测剩余excN具有单独产生的添加其中的噪音信号和通过零填充产生一个混淆信号。将最终得到的信号在下文中称做“excW”。此后,将信号excW提供给将宽带滤波因子αW作为其滤波因子的合成滤波器,并在此将该信号滤波来提供输出信号。
附图说明
参照下面的附图,通过下述对本发明的优选实施例的详细说明,本发明的这些目的和其它目的、特征和优点将变得更清楚。
图1是根据本发明的声音合成器的第一个实施例的方框图;
图2是传统声音合成器的方框图,在这里用来说明和清楚描述与已有技术图1中的声音合成器的区别;
图3是据本发明的声音合成器的第二个实施例的方框图;
图4是据本发明的声音合成器的第三个实施例的方框图;
图5是据本发明的声音合成器的第四个实施例的方框图;
图6是据本发明的声音合成器的第五个实施例的方框图;
图7是所实施操作的流程图,该实施的操作是为创建用于图6中声音合成器的第五个实施例的代码表产生数据;
图8是所实施操作的流程图,所实施操作是创建用于图6中声音合成器的代码表;
图9是所实施操作的流程图,所实施操作是以别的方式创建用于图6中声音合成器的代码表;
图10是图6中声音合成器操作的流程图;
图11是图6中声音合成器的一种变型的方框图,其中使用了减少数量的代码表;
图12是图11中声音合成器一种变型的操作的流程图;
图13是图6中另外一种变型的声音合成器的方框图,其中使用了减少数量的代码表;
图14是具有接收器的数字手提电话的方框图,该接收器利用了根据本发明的声音合成方法和装置;
图15是具有声音解码器的声音合成器的方框图,在该声音解码器中采用PSI-CELP方法;
图16是图15中声音合成器操作的流程图;
图17是多种具有声音解码器的声音合成器的方框图,在该声音解码器中采用PSI-CELP方法;
图18是具有声音解码器的声音合成器的方框图,在该声音解码器中采用VSELP方法;
图19是图18中声音合成器操作的流程图;
图20是多种具有声音解码器的声音合成器的方框图,在该声音解码器中采用VSELP方法;和
图21是根据本发明的使个人计算机适合从程序服务媒介ROM中读出声音合成程序的方框图。
具体实施方式
本发明将进一步描述下述涉及声音合成器的一些实施例,该声音合成器通过向窄带信号添加噪声信号,实施从由使用窄带声音信号参数的滤波器所合成的部分宽带声音信号中合成宽带信号的声音合成方法。
参照图1,以方框图的形式示意说明根据本发明的声音合成器的第一个实施例。如图所示,在其输入端57,51和53为声音合成器分别提供有频带从300到3,400Hz并且采样频率是8kHz的窄带声音信号sndN、用于合成窄带声音信号sndN的线性预测因子αN和激发源excN。
线性预测因子αN和激发源excN是关于窄带声音信号sndN的参数。注意无论怎样所有的参数和输入信号不是独立的但是线性预测因子αN和激发源excN可通过窄带声音信号sndN的线性预测分析而获得。确切地说,激发源excN在这种情况下是线性预测剩余量。另一方面,窄带声音信号sndN可通过滤波合成从线性预测因子αN和激发源excN中获得。更进一步的是,该线性预测因子αN和激发源excN可通过预处理窄带声音信号并对所预处理的窄带声音信号进行线性预测分析而获得。另外,使所预处理的窄带声音信号量化来提供线性预测因子αN和激发源excN。同样地,窄带声音信号sndN可通过从线性预测因子(线性预测剩余)αN和激发源excN的滤波合成而获得,并且随后通过后续处理该合成后的信号来提供窄带声音信号sndN。
如图所示,声音合成器包括:一个线性预测因子(αN)频带加宽器52,用于加宽由输入端51所提供的线性预测因子αN的频带;一个零填充电路61,用于加宽由输入端53所提供的激发源excN的频带;一个噪音添加器62,用于为来自零填充电路61的频带加宽后的激发源αW添加噪声信号;一个宽带LPC合成器55,其提供有含有由噪音添加器62在该处添加的噪音信号的宽带激发源excW’,用于实现将由线性预测因子频带加宽器52所提供的宽带线性预测因子αW作为滤波器因子的宽带声音信号的LPC合成;一个频带抑制器56,用于抑制由宽带LPC合成器55提供的合成后的输出声音信号中窄带声音信号的频带;一个改写采样电路58,用于为宽带声音信号excW将输入端57所提供的窄带声音信号sndN的采样频率改变为16kHz;一个加法器59,用于将来自改写采样电路58的窄带声音信号sndN’和来自频带抑制器56的输出信号加到一起;和一个输出端60,输送出宽带声音信号sndW。
线性预测因子(α)频带加宽器52从作为参数表示窄带频谱包迹的线性预测因子αN中获得一个表示宽带频谱包迹的参数的宽带线性预测因子αW。更具体地,将窄带线性预测因子αN转换为自相关γN,利用窄带声音的代码表将该自相关γN量化,利用宽带声音代码表将所量化的数据解量化来提供宽带自相关γW,并将宽带自相关γW转换为宽带线性预测因子αW。
设置零填充电路61,在宽带声音的采样频率比窄带声音的高n倍时,在两样本之间***n-1的零值。因此,调整采样频率并产生一个混淆的组分。由于激发源的频率特性最初是接近均匀的,所以该混淆信号也是接近均匀的并可用来作为宽带激发源excW。
但是,当窄带激发源excN在0Hz和Nyquist频率之间是不均匀时,该混淆信号在相对应的频带范围内也不均匀。例如,如果窄带激发源限制在从300到3,400Hz的范围内并且在每隔一个采样处***零来使采样频率加倍,宽带激发源excW的频带从300到3,400Hz和从4,600到7,700Hz。也就是,在3,400到4,600Hz的频率之间有一个间隙。在这个频率间隙中,可以确信没有优质的声音。
为避免上述问题,图1中声音合成器中的噪音添加器62产生具有3,400到4,600Hz频带的噪声信号,调整噪声信号的增益,并将调整了增益的噪声添加给由零填充电路61填充零之后的激发源excW。因此所获得的宽带激发源excW’更加均匀。通过确定一个窄带激发源或填充零之后的宽带激发源的功率,和通过使该增益适合于窄带激发源或功率来调整信号增益。另一方面,当使用一个编解码器(编码器/解码器)时,通过增益可增加噪声代码表并将其作为一个参数预先给出,即使有,或对应于该参数的值可不通过激发源的任何功率的获取而得到。
宽带LPC合成器55将通过线性预测因子频带加宽器52所获得的宽带线性预测因子αW当作滤波器因子并且从噪音添加器62中接收宽带激发源excW’,以通过滤波合成来合成宽带声音信号。
设置频带抑制器56来抑制作为输入给声音合成器的原始输入信号的窄带声音信号的频带。事实上由于宽带LPC合成器55所提供的信号会引起失真,倾向于使用原始窄带声音信号的频带。
改写采样电路58使采样频率适合宽带声音信号的频率。
设置加法器59将来自频带抑制器56的信号和来自改写采样电路58的信号加到一起。由于这些信号在频带上是彼此不同的,将它们加到一起来提供宽带声音信号输出sndW。
声音合成器的第一个实施例,其结构已在上述描述过,其运行将描述如下:
当向该声音合成器提供来自输入端51的线性预测因子αN、来自输入端53的窄带激发源excN和来自输入端57的窄带声音信号sndN时,首先是线性预测因子(α)频带加宽器52加宽窄带线性预测因子αW的频带来提供宽带线性预测因子αW。另一方面,通过零填充电路61首先向激发源excN填充零,和然后向填充了零的激发源excN添加由噪声添加器62产生的噪声信号来加宽窄带激发源excN频带,以提供优质的宽带激发源excW。在宽带LPC合成器55中使用这些信号来提供第一个宽带声音信号。
下一步,由频带抑制器56对第一个宽带声音信号中窄带声音的频带抑制来提供第二个宽带声音信号。另一方面,由改写采样电路58对该窄带声音信号sndN改写采样成为宽带声音信号的采样频率,并且由加法器59在该处添加第二个宽带声音信号以在输出端60提供最终的宽带声音信号sndW。
因此,在该第一个实施例中,改善激发源的质量来提供优质的宽带信号。
注意频带抑制器56不是一个严格地仅抑制窄带声音的频带,而且例如可以是高通滤波器将抑制所有低频带。还应注意将会通过增益或滤波改变的频率特性来增加第一或第二个宽带声音信号。
参照图2,所显示的是打算用于和本发明进行比较的传统声音合成器。除窄带激发源excN的处理***外,传统的声音合成器和图1中所示的声音合成器是同样的。在图2中所示的传统声音合成器中,提供一个激发源频带加宽器(exc频带加宽器)54用来加宽窄带激发源excN的频带。
当这些声音信号的采样频率彼此不同时,采用激发源(exc)频带加宽器54来使窄带声音信号的采样频率适合宽带声音信号的采样频率,然后提供具有比窄带激发源excN更宽频带的宽带激发源excW。
图2所示的传统声音合成器的运行将描述如下:
当向传统声音合成器提供来自输入端51的线性预测因子αN、来自输入端53的窄带激发源excN和来自输入端57的窄带声音信号sndN时,首先是线性预测因子频带加宽器52加宽窄带线性预测因子αN的频带来提供宽带线性预测因子αW。另一方面,由exc频带加宽器54来加宽窄带激发源excN的频带。在宽带LPC合成器55中使用这些信号来提供第一个宽带声音信号。
下一步,由频带抑制器56对第一个宽带声音信号中窄带声音的频带进行抑制来提供第二个宽带声音信号。另一方面,由改写采样电路58对窄带声音信号sndN改写采样成为宽带声音信号的采样频率,并且由加法器59在该处添加第二个宽带声音信号以在输出端60提供最终的宽带声音信号sndW。
但是,例如,假定窄带信号的采样频率是8kHz,宽带信号的是16kHz并且窄带激发源限制在300到3,400Hz,通过激发源(exc)频带加宽器54所获得的宽带激发源excW将是从300到3,400Hz和4,600到7,700Hz并有一个位于3,400和4,600Hz之间的频率间隙。因此,即使通过宽带LPC合成器55的宽带LPC分析也将不会产生对应这个间隙的频带,但是将产生没有包含对应这个间隙频带的宽带声音。宽带声音不是自然的声音。
为避免上述问题在图1的声音合成器的第一个实施例中,有意向最初是激发源的信号中添加噪音信号,来改进所合成信号的音质。
更具体地,在对窄带声音激发源excN填充零和加宽其频带后,将噪音信号添加给频带加宽后的窄带声音激发源excN来提供一个合成的宽带声音信号。特别地,其增益已经用窄带激发源的功率调整并且其频率范围从3,400到4,600Hz变化的噪音信号是独立地产生,并将其添加给由零填充所获得的宽带激发源。将最终得到的信号当作是宽带激发源。
参照图3,以示意性的方框图形式说明根据本发明的声音合成器的第二个实施例。图3中的声音合成器也是在输入端57,51和53分别提供有频带从300到3,400Hz并且采样频率是8kHz的窄带声音信号sndN、用于合成窄带声音信号sndN的线性预测因子αN和激发源excN。
除窄带激发源excN的处理***外,第二个实施例和图1中的第一个实施例是相同的。因此第二个实施例中和图1中第一个实施例相同或类似的元件用相同或类似的附图标记表示并且将不做进一步描述。
更具体地,由噪音添加器71独立地产生3,400到4,600Hz的噪音信号并且将其添加给窄带激发源excN,然后由零填充电路72对添加了噪音的激发源excN填充零来提供宽带激发源excW。也就是说,将噪音信号添加给窄带激发源excN,然后获得一个宽带激发源excW来提供宽带声音信号。
窄带激发源excN的频率特性是接近均匀的。但是,当窄带激发源excN在0Hz和Nyquist频率之间是不均匀时,通过零填充电路72加宽频带的激发源excW是不均匀的。例如,如果窄带激发源限制在从300到3,400Hz的范围并在每隔一个采样处***零来使采样频率加倍,宽带激发源excW的频带在从300到3,400Hz并也从4,600到7,700Hz的频带中变化。也就是,在3,400到4,600Hz的频率之间有一个间隙。从对应这个频率间隙的宽带激发源中不能获得优质的声音。
为避免上述问题,图3中声音合成器中的噪音添加器71产生具有3,400到4,000Hz频带的噪音信号,调整该噪音信号的增益,并将增益调整后的噪音添加给激发源excN。通过确定窄带激发源的功率和使该增益适合窄带激发源来调整该信号增益。另一方面,当使用一个编解码器时,将与噪音代码表相乘的增益作为一个参数预先给出,有的话,事实上可以使用或对应该参数的值可以不通过激发源任何功率的获取而得到。
设置零填充电路72,在宽带声音的采样频率比窄带声音的高n倍时,在两样本之间***n-1个零值。因此,调整采样频率并产生一个混淆组分。由于添加了噪音的激发源的频率特性最初是接***缓的,该混淆信号还比原始信号更平。所以,一个混淆信号也是接***缓的并且可以用来作为优质的宽带激发源excW。
声音合成器的第二个实施例的结构已在上文中所描述,其运行将描述如下:
当向声音合成器提供来自输入端51的线性预测因子αN、来自输入端53的窄带激发源excN和来自输入端57的窄带声音信号sndN时,首先加宽窄带线性预测因子αN的频带来提供宽带线性预测因子αW。另一方面,通过首先向频带加宽后的窄带激发源excN添加由噪音添加器71所产生的噪音信号,然后通过零填充电路72为已添加了噪音的信号填充零,来加宽窄带激发源excN的频带来提供优质的宽带激发源excW。在宽带LPC合成器55中利用这些信号来提供第一个宽带声音信号。然后,抑制第一个宽带声音信号中窄带声音的频带来提供第二个宽带声音信号。另一方面,由改写采样电路58对窄带声音信号sndN改写采样成为宽带声音信号的采样频率,并且由加法器59在该处添加第二个宽带声音信号以在输出端60提供最终的宽带声音信号sndW。
同样地在第二个实施例中,改善激发源的质量来提供优质宽带声音信号。
参照图4,以方框图的形式来对本发明声音合成器的第三个实施例进行概要说明。图4中的声音合成器也在输入端57提供有其频率在300到3,400Hz频带并且其采样频率是8kHz的窄带声音信号sndN。
假定提供一个LPC分析器81来获得线性预测因子αN和窄带激发源excN,第三个实施例与图1中的第一个实施例是相同的。因此第三个实施例中和图1中第一个实施例相同或类似的元件用相同或类似的附图标记表示并且将不做进一步描述。
提供LPC分析器81对来自输入端57的窄带声音sndN进行线性预测分析以提供一个线性预测因子αN和一个利用线性预测因子αN反相过滤而最终得到的线性预测剩余excN。
更具体地,由LPC分析器81所提供的线性预测因子αN和线性预测剩余excN将直接或以某些方式进行后续处理之后成形,并且将其用来作为图1中第一个实施例的线性预测因子αN和激发源excN来加宽声音频带的频率。
声音合成器的第三个实施例的结构已在上文中描述,其运行描述如下:
当声音合成器提供有来自输入端57的窄带声音信号sndN时,LPC分析器81将对声音信号sndN进行线性预测分析来提供窄带线性预测因子αN和窄带线性预测剩余excN。由窄带线性预测因子(α)频带加宽器52加宽窄带线性预测因子αN的频带来提供宽带线性预测因子αW。另一方面,通过首先零填充电路61向激发源excN填充零,和随后向填充了零的窄带激发源excN添加由噪音添加器62产生的噪音信号来加宽窄带激发源excN频带来提供优质的宽带激发源excW’。在宽带LPC合成器55中利用这些信号来提供第一个宽带声音信号。然后,抑制第一个宽带声音信号中窄带声音的频带来提供第二个宽带声音信号。另一方面,由改写采样电路58对窄带声音信号sndN改写采样成为宽带声音信号的采样频率,并且由加法器59在该处添加第二个宽带声音信号以在输出端60提供最终的宽带声音信号sndW。
同样地在第三个实施例中,改善激发源的质量来提供优质宽带声音信号。
现在参照图5,以方框图的形式来对本发明声音合成器的第四个实施例进行概要说明。也从输入端57向图5中的声音合成器提供其频率在300到3,400Hz频带并且其采样频率是8kHz的窄带声音信号sndN。
除对由LPC分析器81获得的窄带激发源excN的处理***外,第四个实施例和图4中的第三个实施例是相同的。因此第四个实施例中和图4中第三个实施例相同或类似的元件用相同或类似的附图标记表示并且将不做进一步描述。
更具体地,由噪音添加器71独立地产生3,400到4,000Hz的噪音信号并且将其添加给线性预测剩余excN,并且然后由零填充电路72向添加了噪音的线性预测剩余excN填充零来提供宽带激发源excW。也就是说,将噪音信号添加给窄带线性预测剩余excN来提供宽带激发源excW,从而合成一个宽带声音信号。
声音合成器的第四个实施例的结构已在上文中描述,其运行描述如下:
当从输入端57向声音合成器提供窄带声音信号sndN时,LPC分析器81对声音信号sndN进行线性预测分析来提供窄带线性预测因子αN和窄带线性预测剩余excN。由窄带线性预测因子频带加宽器(α频带加宽器)52加宽该窄带线性预测因子αN的频带来提供宽带线性预测因子αW。另一方面,通过首先向窄带激发源excN添加由噪音添加器71所产生的噪音信号和然后通过零填充电路72向已添加了噪音的窄带激发源excN填充零,来加宽窄带激发源excN的频带来提供一个优质的宽带激发源excW’。在宽带LPC合成器55中利用这些信号来提供第一个宽带声音信号。然后,抑制第一个宽带声音信号中窄带声音的频带来提供第二个宽带声音信号。另一方面,由改写采样电路58对窄带声音信号sndN改写采样成为宽带声音信号的采样频率,并且具有由加法器59向其添加的第二个宽带声音信号以在输出端60提供最终的宽带声音信号sndW。
同样地在第四个实施例中,改善激发源的质量来提供优质宽带声音信号。
现在参照图6,以方框图的形式来对本发明声音合成器的第五个实施例进行概要说明。也从输入端1向图6中的声音合成器提供其频率在300到3,400Hz频带并且其采样频率是8kHz的窄带声音信号sndN。
声音合成器的第五个实施例包括一个宽带发声声音代码表12和宽带不发声声音代码表14,将它们分别预先在发声和不发声的声音参数的基础上创建,并分别从宽带发声和不发声声音中析取它们;和一个窄带发声声音代码表7和窄带不发声声音代码表10,它们分别预先在发声和不发声的声音参数的基础上创建,并且从通过限制宽带声音的频带和具有300到3,400Hz的频率的得到的窄带发声声音信号中析取它们。
声音合成器的第五个实施例还包括:一个成帧电路2,用于将在输入端1所接收的窄带声音信号以每160个样品的速度成帧(由于采样频率是8kHz,因此一幅帧持续20msec);一个零填充电路16,用于在由成帧电路2所成帧的窄带声音信号的基础上形成激发源;一个噪音添加器91,用于向来自零填充电路16的激发源添加噪音信号;一个V/UV判断电路5,用于确定输入的窄带声音信号是否是每幅帧为20msec速度的发声声音(V)或不发声声音(UV);一个LPC分析器(线性预测编码)3,用于在来自V/UV判断电路5的V/UV判断结果的基础上为窄带发声或不发声声音提供线性预测因子α;一个线性预测因子/自相关(α→γ)转换器4,用于将来自LPC分析器3的线性预测因子α转换为是一种参数的自相关γ;一个窄带表达声音量化器7,利用窄带发声声音代码表8量化来自α→γ转换器4的窄带发声声音自相关;一个窄带不发声声音量化器9,利用窄带不发声声音代码表10量化来自α→γ转换器4的窄带不表达自相关;一个宽带表达声音解量化器11,利用宽带表达声音代码表12解量化来自窄带表达声音量化器7的窄带表达声音的量化数据;一个宽带不表达声音解量化器13,利用宽带不表达声音代码表14解量化来自窄带不表达声音量化器9的窄带不表达声音的量化数据;一个自相关/线性预测因子(γ→α)转换器15,将是来自宽带表达声音解量化器11的解量化数据的宽带表达声音自相关转换为宽带表达声音线性预测因子,同时将是来自宽带不表达声音解量化器13的解量化数据的宽带不表达声音自相关转换为宽带不表达声音线性预测因子;和一个LPC合成器17,用于在来自转换器15的宽带表达和不表达声音线性预测因子的基础上将宽带声音和由噪音添加器91添加了噪音信号的激发源进行合成。
该声音合成器还包括:一个改写采样电路19,用来将成帧电路2所成帧的窄带声音的采样频率从8kHz改写采样到16kHz;一个频带抑制滤波器(BSF)18,用来从LPC合成器17的合成输出中移走输入窄带声音信号中的300到3,400Hz的信号组分;一个加法器20,用来将BSF18的输出与来自改写采样电路19所提供的、其采样频率是16kHz、频带从300到3,400Hz的原始窄带声音信号相加。该声音合成器在其输出端21产生频带从300到7,000Hz并且采样频率是16kHz的数字声音信号。
如何创建宽带表达声音代码表12和宽带不表达声音代码表14,以及窄带表达声音代码表8和窄带不表达声音代码表10将在下面描述:
利用从具有300到7,000Hz频带的宽带声音信号(例如,如成帧电路2成帧一样每隔20msec所成帧的)中的宽带表达和不表达声音(V和UV)中析取的表达和不表达声音参数分别创建宽带表达声音代码表12和宽带不表达声音代码表14。
利用频带在300到3,400Hz范围内,例如通过限制上述宽带声音的频带而得到的窄带声音信号中所析取的表达和不表达声音参数来创建窄带表达声音代码表8和窄带不表达声音代码表10。
现在参照图7,显示的是产生记忆数据来创建上述四个代码表所实施操作的流程图。如图所示,产生宽带记忆声音信号,并且在步骤S1中每隔20msec将其成帧。在步骤S2中限制该宽带记忆声音信号的频带来提供窄带声音信号。在步骤S3中,也将如步骤S1中成帧一样以同样时限对该窄带声音信号成帧。然后在步骤S4中在窄带声音信号的每幅帧中检查帧能值、零交扰等来判定该窄带声音信号是表达的(V)还是不表达的(UV)声音。
对于优质代码表,当声音由V向UV转变的过程中,将只采用确认为V和确认为UV的那些声音,反之亦然,并将那些不能容易确认V和UV的声音排除在外。因此,获得窄带记忆V帧列和窄带记忆UV帧列。
同样地将宽带声音信号分为V列和UV列。如上所述,窄带声音信号如宽带声音信号一样以同样的时限成帧。将和窄带V帧一样同时获得的宽带帧认作是宽带V帧,同样将和窄带UV帧一样同时获得的宽带帧认作是宽带UV帧。从而,产生记忆数据。当然,对应于不能分为V帧和UV帧的窄带帧的宽带帧将被排除。
此外,可反向地进行上述步骤得到记忆数据(没有显示)。也就是说,首先将宽带帧分为V帧和UV帧,然后将窄带帧分为V帧和UV帧。
接下来,就如表示创建用于图8中声音合成器第五个实施例代码表的实施操作的流程图8中所显示那样利用记忆数据来创建代码表。如图所示,首先使用宽带V(或UV)帧列来记忆和产生宽带V(或UV)代码表。
首先在步骤S6中,从每幅宽带帧中析取达到dn量级的自相关参数。每个自相关参数由下面的公式(1)计算出:
Φ(xi)=                        (1)
其中x是输入信号,Φ(xi)是第i量级的自相关和N是帧长度。
在步骤S7中,通过GLA(General Lloyd Algorithm)从每幅帧中的dw量级自相关产生一个dw量级的、按sw大小顺序排列的宽带V(UV)代码表。
接下来,在对编码结果检查的基础上,将每个宽带V(UV)帧的自相关参数产生的代码表的代码向量量化。对于每个代码向量,可计算出其重心,例如将从与宽带V(UV)帧同时对应成帧的窄带V(UV)帧中获得的dn量级自相关参数量化成代码向量。在步骤S8中将重心当作是窄带代码向量。由于对所有代码向量实施这个过程,将产生窄带代码表。
注意上述过程和图9中所显示的用其它方式创建用于图6中声音合成器代码表所实施操作的流程图是互逆的。也就是说,首先在步骤9和10中利用窄带帧参数记忆并产生窄带代码表,然后在步骤S11中确定对应于该窄带帧参数的宽带帧参数的重心。
因此,产生包含两个窄带V和UV代码表以及两个宽带V和UV代码表的代码表。
现在参照图10,所给出的是利用根据本发明的声音合成方法的声音合成器的操作流程图。如图所示,实际上,当窄带声音输入给声音合成器时,利用上述代码表来提供宽带声音信号。
首先,在步骤S21中通过成帧电路2每隔160个样本(20msec)对来自输入端1的窄带声音信号成帧。在步骤S23中通过LPC分析器3对这样形成的每幅帧进行LPC分析,并且从而将其分为线性预测因子(α)参数和LPC剩余。在步骤S24中通过α→γ转换器4将该α参数转换为自相关γ。
在步骤S22中通过V/UV判断电路5判断所成帧的信号是被确定为V还是UV。当确定其是V时,将用来选择来自α→γ转换器4的输出的目的地的转换开关6与窄带表达声音量化器7相连。当确定其是UV时,转换开关6与窄带不表达声音量化器9相连。
注意这个V/UV判断不同于那些在产生代码表中使用的,后者中总是将帧信号判定为要么是V要么是UV。不存在既不是V又不是UV的帧信号。当其有较高频带的频率时,该UV信号有较大能量。因此,当预测较高的频带时,将产生较大能量,当难以进行V/UV判断的信号被错误的判断为UV时将导致奇异声音的产生。为避免这个问题,实际上将在代码表产生期间不能判断为是V或UV的帧信号确定为V。
当V/UV判断电路5将一个成帧的信号判断为V时,来自转换开关6的表达声音自相关γ提供给窄带V量化器7并在步骤S25中利用窄带V代码表8将其量化。另一方面,当V/UV判断电路5将一个成帧的信号判断为UV时,来自转换开关6的不表达声音自相关γ提供给窄带UV量化器9并在步骤S25中利用窄带UV代码表10对其量化。
然后在步骤S26中,通过宽带V解量化器11或宽带UV解量化器13利用宽带V代码表12或宽带UV代码表14对已量化的成帧信号解量化来提供宽带自相关。
在步骤S27中通过γ→α转换器15将宽带自相关转换为宽带线性预测因子α。
另一方面,在步骤S28中,通过零填充电路16在来自LPC分析器3的LPC剩余的采样之间填充零并从而向上采样,并通过混淆加宽频带。在步骤S28-1中,通过噪音添加器91向宽带激发源添加噪音信号,然后将其提供给LPC合成器17。
在步骤S29中,在LPC合成器17中对宽带线性预测因子α和添加了噪音的频带加宽的激发源进行LPC合成来提供一个宽带声音信号。
然而,该宽带声音信号自身仅是通过预测获得的宽带信号,并包含预测导致的误差。尤其只要涉及该输入窄带声音的频率范围,照原来的样子使用该输入声音。
因此,在步骤S30中通过BSF18滤波出该输入窄带声音的频率范围。在步骤S31中由改写采样电路19对该窄带声音改写采样。在步骤S32中将该输入窄带声音和已改写采样的窄带声音加到一起来提供频带加宽的声音信号。注意对于上述加和,可以通过调整增益和稍微抑制高频频带来改进声音的听度。
第五个实施例的特征在于噪音添加器91,产生具有3,400到4,600Hz频带的噪音信号,调整其增益并将噪音信号添加给由零填充电路16填充了零的激发源excW。因此所提供的宽带激发源excW更平缓。通过获得窄带激发源的功率或填充零的激发源,和使增益适合该功率来调整该增益。另一方面,当使用一个编解码器(编码器/解码器)时,通过增益可增加噪音代码表并将其作为一个参数预先给出,即使有,可以照原来的样子使用或可通过没有获取激发源的任何功率而得到一个对应于该参数的值。
如上所述,图6中的声音合成器能通过改进激发源的质量来提供优质宽带声音信号。
这个声音合成器使用四个代码表总和中的自相关参数,但是本发明不限制使用自相关参数。例如,可以有效地利用LPC频谱。对于频谱包迹的预测,可将频谱包迹当作参数。
此外,上述提到的声音合成器使用窄带V代码表8和窄带UV代码表10。但是,可以不使用这些代码表8和10。在这种情况下,将为代码表减少RAM的容量。
图11显示的是上述结构的声音合成器的变形实施例。如图所示,这个声音合成器通过使用代替窄带V和UV代码表8和10的算法电路25和26算出宽带代码表中的每个代码向量来获得窄带V和UV参数。在其它方面,该声音合成器类似于图6中的声音合成器。
当用于代码表中的参数是自相关参数,宽带和窄带自相关之间存在的关系由下面的公式(2)给出:
(2)
其中Φ是自相关参数,xn是窄带信号,xw是宽带信号并且 h是频带抑制滤波器(BSF)的脉冲响应。
因此,可从宽带自相关Φ(xw)中计算出窄带自相关Φ(xn)。从而,只有宽和窄带向量中的任一个是需要的。
也就是说,通过宽带自相关和BSF脉冲响应自相关的卷积能够获得窄带自相关。
因此,这个声音合成器能如图12而不是如图10那样操作。具体地,在步骤41中首先通过成帧电路2对来自输入端1所提供的窄带声音信号每隔160个采样(20msec)成帧。在步骤S43中通过LPC分析器3对由此形成的每幅帧进行LPC分析并从而将其分为线性预测因子(α)参数和LPC剩余。在步骤S44中通过α→γ转换器4将α参数转换为自相关γ。
在步骤S42中通过V/UV判断电路5判断成帧的信号是被确定为V还是UV。当确定其是V时,将用于选择来自α→γ转换器4的输出目的地的转换开关6与窄带表达声音量化器7相连。当确定其是UV时,转换开关6将与窄带不表达声音量化器9相连。
注意这个V/UV判断不同于那些在产生代码表中起作用的,在后者中总是将成帧的信号判定为要么是V要么是UV。
当V/UV判断电路5将成帧的信号判断为V时,在步骤S46将来自转换开关6的表达声音自相关γ提供给窄带V量化器7并在此将其量化。然而,对于这个量化,利用的不是窄带代码表而是在步骤45中通过算法电路25获得的窄带V参数。
另一方面,当V/UV判断电路5将成帧的信号判断为UV时,在步骤S46中将来自转换开关6的不表达声音自相关γ提供给窄带UV量化器9并进行量化。这时用于量化的也不是窄带UV代码表而通过算法电路26获得的窄带UV参数。
然后在步骤47中,通过宽带V解量化器11或宽带UV解量化器13利用宽带V代码表12或宽带UV代码表14分别对已量化的成帧信号解量化,来提供一个宽带自相关。
在步骤S48中,通过宽带自相关γ→α转换器15将该宽带自相关转换为宽带线性预测因子α。
另一方面,在步骤S49中,通过零填充电路16对来自LPC分析器3的LPC剩余在连续的两个采样之间填充零并从而向上采样,并通过混淆加宽频带。在步骤S49-1中,通过噪音添加器91向宽带激发源添加一个噪音信号,然后将其提供给LPC合成器17。
在步骤S50中,在LPC合成器17中对宽带线性预测因子α和添加了噪音的频带加宽的激发源进行LPC合成,来提供一个宽带声音信号。
然而,该宽带声音信号自身仅是通过预测获得的宽带信号,并包含预测导致的误差。尤其是只要涉及到该输入窄带声音的该频率范围,应该照其原样使用该输入声音。
因此,在步骤S51中通过BSF18滤出输入窄带声音的频率范围。在步骤S52中通过改写采样电路19对窄带声音改写采样。在步骤S53中将该输入窄带声音和已改写采样的窄带声音加到一起。
在图11所示的声音合成器中,所进行的量化不是对照窄带代码表的代码向量而是对照利用宽带代码表计算而得到的代码向量。因此,该宽带代码表既可用于分析又可用于合成,于是用于保留窄带代码表的储存器就变得不是必须的了。当然,这个声音合成器同样可通过改进激发源的质量来提供优质宽带声音信号。
但是在上述声音合成器的变形实施例中,增加计算的数量是不利的因素,它将抵消削减储存器容量带来的好处。为解决这个问题,本发明还提出另外一个变形的声音合成器。该变形实施例如图13所示。在该声音合成器中,使用根据本发明的声音合成方法,其中仅利用宽带代码表并且计算数量保持不增加。如图所示,该声音合成器用局部析取电路28和29替代图11中的算法电路25和26,通过局部析取宽带代码表中的每个代码向量来提供窄带参数。在其它方面,该变形实施例类似于图6或图11中所示的声音合成器。
如下面的公式(3)所给出的那样,前面所显示的BSF(频带抑制滤波器)的脉冲响应自相关在该频率域中的BSF的功率频谱特征为:
(3)
将考虑到另外一个滤波器,其具有和上面BSF的功率特征一样的频率特征。当该频率特征假定为H’时,公式(3)可由下面的公式(4)表示:
(4)
由公式(4)所给出的新滤波器和前面提到的BSF具有相同的通过频带和禁止频带,并且它的衰减特征是上述BSF的平方。因此,这个新滤波器也可当作是频带抑制滤波器。
考虑到以上所述,可如下面公式(5)所给出的那样通过回旋宽带自相关和BSF的脉冲响应,也就是,通过限制宽带自相关的频带来简化该窄带自相关。
(5)
当代码表中使用的参数是自相关时,实际表达声音中的第二量级自相关比第一量级的小,并且第三量级自相关还比第二量级的更小……,也就是说,这些自相关将描绘一条单调递减的曲线。
另一方面,由于窄带信号由通过宽带信号的低频带获得,因此窄带自相关可从理论上由通过窄带自相关的低频带获得确定。
但是由于宽带自相关自身沿平缓的斜率变化,即使当其低频带通过时也只有很小的变化。忽略低频带的通过将对宽带自相关不会带来影响。因此,可将宽带自相关当作窄带自相关自身使用。但是,由于宽带信号的采样频率比窄带信号的高两倍,实际上每隔宽带自相关的一个量级从宽带自相关中获得窄带自相关。
每隔一个量级获得的宽带自相关代码向量可以当作是窄带自相关代码向量,并且可在宽带代码表的基础上量化该输入窄带声音自相关。因此,窄带代码表不是必须的。
如前面所描述,不表达声音(UV)在其高频带中有巨大能量,于是如果可能没有正确的预测,将产生很大影响。因此,通常将该输入声音确定为V而不是UV,并且当输入声音只有UV的可能性时才将其确定为UV。因此,UV代码表的的大小比V代码表的小,并且在UV代码表中只记录与V向量明确不同的UV向量。尽管UV自相关描绘的曲线没有V自相关的平缓,当通时宽带自相关代码向量的低频段时,即,当窄带代码表存在时,将从每隔一个量级得到的宽带自相关代码向量与输入窄带信号自相关相比,结果是它们的自相关相等。也就是说,窄带V或UV代码表都不是必须的。
如上所述,当将在该代码表中使用的参数当作自相关时,通过将输入窄带声音的自相关与每隔一个量级得到的宽带代码向量相比较将它们量化。在图12中的步骤45中可通过进行局部析取电路28和29在每隔一个量级处获得该宽带代码向量来实施该量化。
通过连接在代码表中使用的参数来描绘的频谱包迹将在下面描述。由于在这种情况下窄带频谱明显是宽带频谱的一部分,窄带频谱代码表不是必需的。当然通过将输入窄带声音的频谱包迹与宽带频谱包迹代码向量的部分相比较来进行量化是可能的。
根据本发明声音合成方法和装置的应用将在下面结合附图描述。如图14中所示,该应用是一个数字手提电话装置,在该装置的接收器侧的声音合成器利用多种输入编码参数来进行合成。
该数字手提电话装置的结构将如下所述。在图14中,分别提供发射机和接收器部分,但实际上将它们安装在一个手提电话装置中。
在发射机部分中,从麦克风31中提供的声音信号由A/D转换器32转换为数字信号,由声音编码器33对其编码,由发射机34将其加工为用于从天线35发射的输出比特。
此时,声音编码器33提供给发射机34包含与激发源相关的参数、线性预测因子α等等考虑到沿发射轨迹变窄的编码参数。
在接收器部分中,通过接收器37接收由天线36捕获的无线电波,上述编码参数通过声音解码器38解码,通过声音合成器39利用上面的解码参数对声音进行合成,由D/A转换器40将该合成声音信号译成模拟声音信号,并且在扬声器41处释放该模拟声音信号。
在数字电话装置中使用的声音合成器的实施例将参见图15进行描述。使用图15中所示的声音合成器来利用从数字手提电话装置的发射机部分中声音编码器33发送的编码参数来合成声音。对于该声音合成,已编码的参数由声音解码器38进行解码,该解码过程与声音编码器33中进行的编码过程相反。
当声音编码器33采用PSI(Pitch Synchronous Innovation)-CELP方法进行参数编码时,声音解码器38也采用PSI-CELP方法。
解码器38将来自作为第一个已编码参数的激发源相关参数中的窄带激发源解码,并将其提供给零填充电路16。将作为第二个已编码参数的线性预测因子α提供给线性预测因子/自相关(α→γ)转换器4。此外,将作为第三个已编码参数的表达/不表达(V/UV)声音判断标记提供给V/UV判断电路5。
该声音合成器包括声音解码器38、零填充电路16、噪音添加器91、α→γ转换器4和V/UV判断电路5,此外还包括利用从宽带表达和不表达声音中析取的表达和不表达声音参数已经产生的宽带表达和不表达声音代码表12和14。
此外,该声音合成器包括:局部析取电路28和29,用于通过局部析取宽带表达和不表达声音代码表12和14中的每个代码向量来提供窄带参数;窄带表达声音量化器7,利用来自局部析取电路28的窄带参数量化来自α→γ转换器4的窄带表达声音自相关;窄带不表达声音量化器9,利用来自局部析取电路29的窄带不表达参数量化来自α→γ转换器4的窄带不表达自相关;宽带表达声音解量化器11,利用宽带表达声音代码表12对来自窄带表达声音量化器7的窄带表达声音已量化的数据进行解量化;宽带不表达声音解量化器13,利用宽带不表达声音代码表14对来自窄带不表达声音量化器9的窄带不表达声音已量化的数据进行解量化;自相关/线性预测因子(γ→α)转换器15,将当作是来自宽带表达声音解量化器11中的已解码数据的宽带表达自相关转换为宽带表达声音线性预测因子,同时将当作是来自宽带不表达声音解量化器13中的已解码数据的宽带不表达自相关转换为宽带不表达声音线性预测因子;和LPC合成器17,在来自转换器15的宽带表达和不表达声音线性预测因子和已经通过噪音添加器91添加了噪音信号的激发源的基础上合成一个宽带声音。
此外,该声音合成器包括:改写采样电路19,用来将由声音解码器38所解码的窄带声音的采样频率从8kHz改写采样为16kHz;频带抑制滤波器(BSF)18,用来从LPC合成器17的合成输出中去除输入窄带声音信号中的300到3,400Hz的信号组分;和加法器20,用来将来自改写采样电路19所提供、采样频率是16kHz、频带从300到3,400Hz的原始窄带声音信号加给来自BSF18的输出。
可由图7到图9所示的过程产生宽带表达和不表达声音代码表12和14。对于一个高质代码表,当声音从V向UV或从UV向V转换时,只将那些肯定是V和确定是UV的声音当作是记忆数据,那些不能容易确定是V或UV的声音将被排除。因此,可获得窄带记忆V帧列和窄带记忆UV帧列。
然后使用宽带表达和不表达声音代码表12和14以及实际上从发射机部分传送的已编码参数来合成声音,将参照图16描述如下。
首先,在步骤S61中,通过α→γ转换器4将声音解码器38所解码的线性预测因子α转换成自相关γ。
在步骤S62中,通过V/UV判断电路5对声音解码器38所解码的涉及表达/不表达声音判断标记的参数进行解码以确定该声音是表达(V)还是不表达(UV)声音。
当其确定是V时,将用于选择来自α→γ转换器4的输出目的地的转换开关6与窄带表达声音量化器7相连。当确定其是UV时,转换开关6与窄带不表达声音量化器9相连。
注意这个V/UV判断不同于那些在产生代码表中起作用的V/UV判断,并且该成帧信号总是判定为要么是V要么就是UV。
当V/UV判断电路5将声音信号判断为V时,在步骤S64中,将来自转换开关6的该表达声音自相关γ提供给窄带V量化器7并在此将其量化。但是,在该量化中利用的不是窄带代码表而是在步骤S63中通过局部析取电路28获得的窄带参数。
另一方面,当V/UV判断电路5将帧信号判断为UV时,在步骤S63中将来自转换开关6的该不表达声音自相关γ提供给窄带UV量化器9并在此对其量化。同样在这个量化中,不是用窄带UV代码表而是用通过局部析取电路29获得的窄带参数来量化该声音信号。
然后在步骤S65中,通过宽带V解量化器11或宽带UV解量化器13利用宽带V代码表12或宽带UV代码表14对已量化的数据解量化来提供一个宽带自相关。
在步骤S66中,通过γ→α转换器15将宽带自相关转换为宽带线性预测因子α。
另一方面,在步骤S67中,通过零填充电路16对来自声音解码器38的与激发源相关的参数在采样之间***零并向上采样,并且通过混淆加宽频带。在步骤S67-1中,通过噪音添加器91对宽带激发源添加噪音信号然后将其提供给LPC合成器17。
在步骤S68中,在LPC合成器17中对宽带线性预测因子α和宽带激发源进行LPC合成来提供宽带声音信号。
但是,宽带声音信号自身仅是通过预测获得的宽带信号,并包含预测导致的误差。尤其是只要涉及输入窄带声音的频率范围,应该照原样使用该输入声音。
因此,在步骤S69中,通过BSF18滤出该输入窄带声音的频率范围。然后在步骤S71中将该得到的数据与在步骤S70中来自改写采样电路19的已改写采样的编码数据加到一起。
如上所述,在图15所示的声音合成器中,该量化不是对照窄带代码向量而是对照从宽带代码表中局部析取获得的代码向量。
也就是说,在解码过程中可获得参数α。将其转换为一个窄带自相关,与每隔一个量级得到的宽带代码表代码向量相比较并且使其量化。在这个声音合成器中,通过利用所有相同的代码向量进行解量化来提供一个宽带自相关。将该宽带自相关转换为宽带线性预测因子α。同时,也进行如已描述过的为改善声音质量而采取的增益调整和部分宽带抑制。
因此,宽带代码表既可用于分析又可用于合成,于是不需要用来保留窄带代码表的储存器。
同样在该声音合成器中,由噪音添加器91产生具有3,400到4,600Hz频带的噪音信号,调整其增益,并将其添加给已经在零填充电路16中填充了零的激发源excW。这样获得的宽带激发源更均匀用于提供优质的宽带声音信号。
图17中所示的是一个利用来自声音解码器38的已解码的参数并采用PSL-CELP来合成声音的声音合成器。如图所示,该声音合成器用算法电路25和26来替代局部析取电路28和29通过计算宽带代码表中的每个代码向量来提供窄带V(UV)参数。该声音合成器在其它方面与图15中显示的相同。
在数字手提电话装置中使用的声音合成器的第二个实施例如图18所示。由于利用从该数字手提电话装置的发射机部分的声音编码器33传送的编码参数采用该声音合成器的这个实施例来合成声音,声音解码器46反相地作用已经由声音编码器33作用的末端。
当声音编码器33在VSELP(Vector Sum Excited Linear Prediction)的基础上进行编码时,声音解码器46同样在VSELP的基础上进行解编码。
声音解码器46将与作为第一个已编码参数的激发源相关的参数提供给激发源选择器47,将作为第二个已编码参数的线性预测因子α提供给线性预测因子/自相关(α→γ)转换器4,和将作为第三个已编码参数的表达/不表达(V/UV)声音判断标记提供给V/UV判断电路5。
该声音合成器与图15和图17中显示的相同,并且在激发源选择器47提供零填充电路16的上流的情况下采用PSI-CELP。
在该PSI-CELP型声音合成器中,编解码处理其他中的表达声音使得该表达声音是平滑可听的。然而,VSELP型声音合成器不具有该特征,使得当带宽提高时,该表达声音变得可听好象其包括稍许噪音似的。为避免这一点,当产生宽带激发源时,激发源选择器47象下面,参照图19说明的那样工作:
VSELP型合成器中的激发源产生为:beta*bL[i]+gammal*cl[i],其中beta是长期预测因子,bL[i]是增益并且cl[i]是激发代码向量。beta*bL[i]是音调成分,gammal*cl[i]是噪音成分。在步骤S87中,当确定对于一个固定长度的时间该beta*bL[i]的能量大于gammal*cl[i]的时,认为该输入声音是具有强音调的表达声音。因此,操作进行到在S88的YES(是)。该激发源是一系列脉冲。当该输入声音不具有音调成分时,操作进行到NO(否),并且将该输入声音抑制为零。该输入声音在步骤S89填充零。在该VSELP型声音合成器中,没有加入噪音。如果在步骤S87中,确定beta*bL[i]的能量不大于gammal*cl[i]的,从样本值为1和样本值为2中合成一个声音。在步骤S94中向该合成声音填充零之后,在步骤S95中向其添加噪音。至此以后,在步骤S90进行LPV合成。因而,该由VSELP型声音合成器合成的表达声音可以听起来更好。
注意利用来自声音解码器46的编码参数来合成声音的VSELP型声音合成器可以是图20中所显示的。图20中所示的声音合成器使用算法电路25和26来替代局部析取电路28和29来计算来自宽带代码表中的代码向量的窄带表达和不表达参数。该声音合成器在其它方面与图18中显示的相同。
同样地在该声音合成器中,利用从图6所示的宽带表达和不表达声音析取的表达和不表达参数预先产生的宽带表达声音代码表12和宽带不表达代码表14,和利用从具有300到3,400Hz的频率和通过限制宽带声音的频带得到的窄带声音信号中析取的表达和不表达参数预先产生的窄带表达和不表达声音代码表7和10能够合成一个声音。
注意本发明不限于用来从低频中预测高频频带的声音合成器。用来预测宽带频谱的装置也可以在声音以外的其他信号中使用。
进而,本发明不仅可以使用该线性预测分析还可以使用PARCOR分析。
通过在ROM等记录媒介上将根据本发明的声音合成方法记录成为程序,通过个人计算机可以实现一个声音合成器。
图21显示一个这样的个人计算机的实施例。该个人计算机包括一个ROM(只读存储器)101,该声音合成方法具体以声音合成程序的方式存储在其中;和一个CPU(中央处理单元)102,从ROM101中读取该声音合成程序并执行。
该个人计算机还包括一个RAM(随机存取存储器)103,CPU102工作所需要的程序和数据都存储在其中;和一个输入装置104,例如包括麦克风、外部界面等;和一个输出装置105,例如包括显示装置、扬声器等等来输出需要的信息。

Claims (23)

1、一种声音合成装置,用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源,该装置包括:
用于向线性预测剩余或激发源添加噪声信号的装置。
2、根据权利要求1所述的声音合成装置,其中该噪音信号具有某一信号组分,该信号组分的频率不包含在线性预测剩余或激发源的频带中。
3、根据权利要求1所述的声音合成装置,该声音合成装置还包括:
用于从已经由噪音添加装置添加噪音信号的线性预测剩余或激发源形成宽带激发源。
4、根据权利要求3所述的声音合成装置,其中该噪音信号具有某一信号组分,该信号组分的频率不包含在窄带激发源的频带中。
5、一种声音合成装置,用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源,该装置包括:
用于从线性预测剩余或激发源形成宽带激发源的装置;和
用于向宽带激发源添加噪音信号的装置。
6、根据权利要求5所述的声音合成装置,其中该噪音信号具有某一信号组分,该信号组分的频率不包含在宽带激发源的频带中。
7、一种声音合成装置,用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源,该装置包括:
用于分析窄带信号来提供线性预测剩余信号的装置;
用于从通过分析装置所获得的线性预测剩余产生宽带剩余信号的装置;和
用于向宽带剩余信号添加具有某一信号组分的噪音信号的装置,该信号组分的频率没有包含在由宽带剩余信号产生装置所产生的宽带剩余信号的频带中。
8、根据权利要求7所述的声音合成装置,其中该噪音信号具有某一信号组分,该信号组分的频率不包含在宽带剩余信号的频带中。
9、一种声音合成装置,用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源,该装置包括:
用于分析窄带信号来提供线性预测剩余信号的装置;
用于向线性预测剩余信号添加具有某一信号组分的噪音信号的装置,该信号组分的频率没有包含在由分析装置所产生线性预测剩余信号的频带中;和
用于从已由噪音添加装置添加了噪音信号的线性预测信号中产生宽带剩余信号的装置。
10、根据权利要求9所述的声音合成装置,其中该噪音信号具有某一信号组分,该信号组分的频率不包含在窄带激发源的频带中。
11、一种声音合成方法,用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源,该方法包括步骤:
向线性预测剩余或激发源添加噪音信号。
12、根据权利要求11所述的声音合成方法,其中该噪音信号具有某一信号组分,该信号组分的频率不包含在线性预测剩余或激发源的频带中。
13、根据权利要求11所述的声音合成方法,该方法还包括步骤:
从已在噪音添加步骤中添加了噪音信号的线性预测剩余或激发源中形成宽带激发源。
14、根据权利要求13所述的声音合成方法,其中该噪音信号具有某一信号组分,该信号组分的频率不包含在窄带激发源的频带中。
15、一种声音合成方法,用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源,该方法包括步骤:
从线性预测剩余或激发源中形成宽带激发源;和
向宽带激发源添加噪音信号。
16、根据权利要求15所述的声音合成方法,其中该噪音信号具有某一信号组分,该信号组分的频率不包含在宽带激发源的频带中。
17、一种声音合成方法,用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源,该方法包括:
分析窄带信号来提供线性预测信号;
从在分析步骤中所获得的线性预测剩余中产生宽带剩余信号;和
向宽带剩余信号添加具有某一信号组分的噪音信号,该信号组分的频率没有包含在由宽带剩余信号产生装置所产生的宽带剩余信号的频带中。
18、根据权利要求17所述的声音合成方法,其中该噪音信号具有某一信号组分,该信号组分的频率不包含在宽带激发源的频带中。
19、一种声音合成方法,用于从由滤波合成所获得的部分输出信号中合成宽带信号,该滤波合成的输入参数是窄带信号的线性预测剩余或激发源,该方法包括:
分析窄带信号来提供线性预测剩余信号;
向剩余信号添加具有某一信号组分的噪音信号,该信号组分的频率没有包含在分析步骤中所获得的线性预测剩余信号的频带中;和
从已在噪音添加步骤添加了噪音信号的线性预测剩余信号中产生宽带剩余信号。
20、根据权利要求19所述的声音合成方法,其中该噪音信号具有某一信号组分,该信号组分的频率不包含在窄带激发源的频带中。
21、一种电话装置,包括:
一种传输装置,用来传输由PSI-CELP或VSELP方法编码窄带信号的参数作为传输信号;和
一种接收装置,用来向包含在该参数中的线性预测剩余或激发源添加噪音信号和从由滤波合成所获得的部分输出信号中合成宽带信号。
22、一种电话装置,包括:
一种传输装置,用来传输由PSI-CELP或VSELP方法编码窄带信号的参数作为传输信号;和
一种接收装置,用来从包含在该参数中的线性预测剩余或激发源中形成宽带激发源,向宽带激发源添加噪音信号,然后从由滤波合成所获得的部分输出信号中合成宽带信号。
23、一种电话装置,包括:
一种传输装置,用来传输由PSI-CELP或VSELP方法编码窄带信号的参数作为传输信号;和
一种接收装置,用来向包含在该参数中的线性预测剩余或激发源添加噪音信号,从已添加了噪音信号的线性预测剩余或激发源中形成宽带激发源,和从滤波合成所获得的部分输出信号中合成宽带信号。
CNB001188240A 1999-04-22 2000-04-22 声音合成装置和方法以及电话装置 Expired - Fee Related CN1185620C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP115415/1999 1999-04-22
JP11115415A JP2000305599A (ja) 1999-04-22 1999-04-22 音声合成装置及び方法、電話装置並びにプログラム提供媒体

Publications (2)

Publication Number Publication Date
CN1274146A CN1274146A (zh) 2000-11-22
CN1185620C true CN1185620C (zh) 2005-01-19

Family

ID=14662017

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001188240A Expired - Fee Related CN1185620C (zh) 1999-04-22 2000-04-22 声音合成装置和方法以及电话装置

Country Status (6)

Country Link
US (1) US6732075B1 (zh)
EP (1) EP1047045A3 (zh)
JP (1) JP2000305599A (zh)
KR (1) KR20000077057A (zh)
CN (1) CN1185620C (zh)
TW (1) TW469421B (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
WO2003044777A1 (en) * 2001-11-23 2003-05-30 Koninklijke Philips Electronics N.V. Audio signal bandwidth extension
CN1266673C (zh) * 2002-03-12 2006-07-26 诺基亚有限公司 可伸缩音频编码的有效改进
WO2003100997A1 (en) * 2002-05-27 2003-12-04 Telefonaktiebolaget Lm Ericsson (Publ) Colored interference identification
JP3879922B2 (ja) 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
JP4041385B2 (ja) * 2002-11-29 2008-01-30 株式会社ケンウッド 信号補間装置、信号補間方法及びプログラム
EP1431958B1 (en) 2002-12-16 2018-07-18 Sony Mobile Communications Inc. Apparatus connectable to or incorporating a device for generating speech, and computer program product therefor
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
JP4580622B2 (ja) * 2003-04-04 2010-11-17 株式会社東芝 広帯域音声符号化方法及び広帯域音声符号化装置
EP1482482A1 (de) * 2003-05-27 2004-12-01 Siemens Aktiengesellschaft Frequenzerweiterung für Synthesizer
JP5046654B2 (ja) * 2005-01-14 2012-10-10 パナソニック株式会社 スケーラブル復号装置及びスケーラブル復号方法
BRPI0611430A2 (pt) 2005-05-11 2010-11-23 Matsushita Electric Ind Co Ltd codificador, decodificador e seus métodos
KR100724736B1 (ko) * 2006-01-26 2007-06-04 삼성전자주식회사 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치
WO2008001318A2 (en) * 2006-06-29 2008-01-03 Nxp B.V. Noise synthesis
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
JP5326311B2 (ja) * 2008-03-19 2013-10-30 沖電気工業株式会社 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP5002642B2 (ja) * 2009-11-09 2012-08-15 株式会社東芝 広帯域音声符号化方法及び広帯域音声符号化装置
CN102063905A (zh) * 2009-11-13 2011-05-18 数维科技(北京)有限公司 一种用于音频解码的盲噪声填充方法及其装置
JP5443547B2 (ja) * 2012-06-27 2014-03-19 株式会社東芝 信号処理装置
CN104301064B (zh) 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
CN106683681B (zh) 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW224191B (zh) * 1992-01-28 1994-05-21 Qualcomm Inc
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
US5502713A (en) * 1993-12-07 1996-03-26 Telefonaktiebolaget Lm Ericsson Soft error concealment in a TDMA radio system
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JP3335841B2 (ja) * 1996-05-27 2002-10-21 日本電気株式会社 信号符号化装置
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置

Also Published As

Publication number Publication date
KR20000077057A (ko) 2000-12-26
EP1047045A3 (en) 2001-03-21
JP2000305599A (ja) 2000-11-02
US6732075B1 (en) 2004-05-04
TW469421B (en) 2001-12-21
CN1274146A (zh) 2000-11-22
EP1047045A2 (en) 2000-10-25

Similar Documents

Publication Publication Date Title
CN1185620C (zh) 声音合成装置和方法以及电话装置
CN1127055C (zh) 用于对宽带声音信号进行有效的编码的感觉加权设备与方法以及使用该设备的蜂窝通信***
CN1252681C (zh) 一种码激励线性预测语音编码器的增益量化
CN100338648C (zh) 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件
CN1288622C (zh) 编码设备和解码设备
CN1220178C (zh) 在码本中进行搜索以对声音信号编码的方法和设备
CN1229775C (zh) 宽带语音和音频信号解码器中的增益平滑
CN1104710C (zh) 在语音数字传输***中产生悦耳噪声的方法与装置
CN1871501A (zh) 频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法
CN1957399A (zh) 语音/音频解码装置以及语音/音频解码方法
CN1873778A (zh) 解码语音信号的方法
CN101048814A (zh) 编码装置、解码装置、编码方法及解码方法
CN1689069A (zh) 声音编码设备和声音编码方法
CN1618093A (zh) 有效编码语音信号的信号修改方法
CN1297222A (zh) 信息处理设备、方法和记录媒体
CN1154013A (zh) 信号编码方法和装置
CN1702974A (zh) 用于对数字信号编码/解码的方法和设备
CN101048649A (zh) 可扩展解码装置及可扩展编码装置
CN1669074A (zh) 话音增强装置
CN1922660A (zh) 通信装置和信号编码/解码方法
CN1703737A (zh) 在自适应多速率宽带(amr-wb)和多模式可变比特率宽带(vmr-wb)编解码器之间互操作的方法
CN101057275A (zh) 矢量变换装置以及矢量变换方法
CN1849647A (zh) 采样速率转换装置、编码装置、解码装置及它们的方法
CN1151491C (zh) 音频编码装置和音频编码译码装置
CN1291375C (zh) 声信号编码方法和设备、解码方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee