CN103119650B - 编码装置和编码方法 - Google Patents

编码装置和编码方法 Download PDF

Info

Publication number
CN103119650B
CN103119650B CN201180046260.7A CN201180046260A CN103119650B CN 103119650 B CN103119650 B CN 103119650B CN 201180046260 A CN201180046260 A CN 201180046260A CN 103119650 B CN103119650 B CN 103119650B
Authority
CN
China
Prior art keywords
signal
subframe
unit
importance degree
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201180046260.7A
Other languages
English (en)
Other versions
CN103119650A (zh
Inventor
山梨智史
押切正浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of CN103119650A publication Critical patent/CN103119650A/zh
Application granted granted Critical
Publication of CN103119650B publication Critical patent/CN103119650B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明的编码装置,其在对于输入信号进行相关运算时,通过对每个处理自适应地调节在相关运算中利用的样本,从而能够抑制输出信号的质量劣化,并且能够大幅度地削减处理运算量。该编码装置(101)通过求使用输入信号生成的第一信号与通过预定的方法生成的第二信号之间的相关,从而对输入信号进行编码,重要度判定单元(202)对划分输入信号的帧所得的多个处理单位的每一个单位设定重要度,CELP编码单元(203)进行稀疏处理,所述稀疏处理根据所设定的各处理单位的重要度,将所述各处理单位内的构成第一信号和第二信号的至少一方的信号的多个样本中预定数的样本的振幅值设为0,并且该CELP编码单元(203)计算对任一方经过稀疏处理后的第一信号和第二信号之间的相关。

Description

编码装置和编码方法
技术领域
本发明涉及用于将信号编码后传输的通信***的编码装置和编码方法。
背景技术
在以互联网通信为代表的分组通信***、或者移动通信***等中传输语音信号/音乐信号时,为了提高语音信号/音乐信号的传输效率,经常使用压缩技术/编码技术。另外,一方面对于只以低比特率编码语音信号/音乐信号的技术的需求正在高涨,另一方面对于对更宽频带的语音信号/音乐信号进行编码的技术、以及对于以低处理运算量进行编解码而不使音质恶化的技术的需求也正在高涨。
对于这些需求开发了削减处理运算量而不使解码信号的质量恶化的各种技术。例如在专利文献1所公开的技术中,在CELP(Code Excited LinearPrediction:码激励线性预测)型的编码装置中,削减了基音周期搜索(自适应码本搜索)的处理运算量。具体而言,编码装置使自适应码本的更新稀疏化。作为稀疏化的处理方法采用如下的方法:在样本的振幅不超过一定的阈值的情况下,将样本值置换为零(0)。由此,在搜索基音周期时,省略对样本的值为0的部分的处理(具体而言为乘法运算处理),从而削减运算量。另外,除了公开有使上述阈值对各处理自适应地可变的结构之外,还公开了如下的结构,即:按各样本的绝对值从大到小的顺序加以排序,将从该排序中除了排在前面的所希望的样本数之外的样本的值置换为零(0)。
现有技术文献
专利文献
【专利文献1】日本特开平5-61499号公报
发明内容
发明要解决的问题
在专利文献1中公开了编码装置对各处理(子帧处理)自适应地切换如下阈值的结构等,其中该阈值是用于选择在基音周期搜索时进行稀疏化的样本(将值取为零(0)值的样本)的阈值。但是,在上述方法中,确实有可能会削减帧整体的平均处理运算量,但能够削减运算量的子帧和无法削减运算量的子帧混在一起,作为每一帧的处理未必能够削减处理运算量。换言之,在上述方法中,无法保证削减最坏情况的处理运算量(处理运算量变为最大的帧中的处理运算量)。因此,不使解码信号的质量劣化,而在每一子帧的处理中,也需要大幅度削减处理运算量。
本发明的目的在于,提供编码装置和编码方法,其能够在输入信号的编码时进行基音周期搜索这样的相关运算的情况下,不使解码信号的质量劣化而必然削减每一子帧的处理运算量(削减最坏情况(worst case)的处理运算量)。
用于解决问题的方案
本发明的一个方面的CELP型编码装置,其对输入信号进行编码而生成编码信息,包括:第一信号生成单元,使用所述输入信号生成第一信号;第二信号生成单元,通过预定的方法生成第二信号;设定单元,对划分所述输入信号的帧所得的多个子帧的每一个子帧设定重要度;以及相关计算单元,根据所设定的所述每一个子帧的所述重要度,将所述每一个子帧内的构成第一信号和第二信号的至少一方的信号的多个样本中,选择从振幅值的绝对值大开始数事先预定个数的样本,并将没有被选择样本的振幅值设为0,计算将所述没有被选择的样本的振幅值设为0的一方信号与另一方信号之间的相关。
本发明的一个方式的CELP型编码方法,其对输入信号进行编码而生成编码信息,包括以下步骤:第一信号生成步骤,使用所述输入信号生成第一信号;第二信号生成步骤,通过预定的方法生成第二信号;设定步骤,对划分所述输入信号的帧所得的多个子帧的每一个子帧设定重要度;以及相关计算步骤,根据所设定的所述每一个子帧的所述重要度,将所述每一个子帧内的构成第一信号和第二信号的至少一方的信号的多个样本中,选择从振幅值的绝对值大开始数事先预定个数的样本,并将没有被选择样本的振幅值设为0,计算将所述没有被选择的样本的振幅值设为0的一方信号与另一方信号之间的相关。
发明的效果
根据本发明,通过在对输入信号进行相关运算时,将用于相关运算的样本对每个处理自适应地进行调节,从而能够抑制输出信号的质量劣化,并能大幅度地削减处理运算量。此外,通过预先在帧整体中判定各子帧的重要度,根据各子帧的重要度,对各子帧确定用于相关运算的样本数,从而能够保证削减最坏情况(worst case)的处理运算量。
附图说明
图1是表示本发明一个实施方式的具有编码装置和解码装置的通信***的结构的框图。
图2是本发明一个实施方式的图1所示的编码装置内部的主要结构的框图。
图3是表示本发明一个实施方式的图2所示的CELP编码单元内部的主要结构的框图。
图4是表示本发明一个实施方式的图1所示的解码装置内部的主要结构的框图。
标号说明
101 编码装置
102 传输路径
103 解码装置
201 子帧能量计算单元
202 重要度判定单元
203CELP 编码单元
301 预处理单元
302 听觉加权单元
303 稀疏处理单元
304LPC 分析单元
305LPC 量化单元
306,403 自适应激励码本
307,404 量化增益生成单元
308,405 固定激励码本
309,310,406,407 乘法单元
311,313,408 加法单元
312 听觉加权合成滤波器
314 参数确定单元
315 复用单元
401 分离单元
402LPC 解码单元
409 合成滤波器
410 后处理单元
具体实施方式
以下,参照附图详细说明本发明的实施方式。此外,作为本发明的编码装置和解码装置,以语音编码装置和语音解码装置为例进行说明。
图1是表示本发明实施方式的具有编码装置和解码装置的通信***的结构的框图。在图1中,通信***具有编码装置101和解码装置103,各自处于经由传输路径102可进行通信的状态。此外,编码装置101和解码装置103通常都装载于基站装置或通信终端装置等而被使用。
编码装置101将输入信号每N样本进行划分(N为自然数),将N采本作为1帧而对每帧进行编码。这里,将成为编码对象的输入信号表示为xn(n=0、…、N-1)。n表示在每N采本划分出的输入信号中的第n+1信号元素。编码装置101将编码后的输入信息(编码信息)经由传输路径102发送到解码装置103。
解码装置103经由传输路径102接收从编码装置101发送的编码信息,将该编码信息进行解码而得到输出信号。
图2是表示图1所示的编码装置101的内部结构的框图。编码装置101主要包括:子帧能量计算单元201、重要度判定单元202以及CELP编码单元203。此外,子帧能量计算单元201和重要度判定单元202以帧单位进行处理,CELP编码单元203以子帧单位进行处理。以下说明各处理的细节。
输入信号被输入到子帧能量计算单元201中。子帧能量计算单元201将输入的输入信号首先划分成子帧。以下,说明例如将输入信号Xn(n=0、…、N-1。即N个采本)划分成Ns个子帧(子帧索引k=0~Ns-1)的结构。
然后,子帧能量计算单元201对划分出的每个子帧,根据式(1)计算子帧能量Ek(k=0、…、Ns-1)。然后,子帧能量计算单元201将计算出的子帧能量Ek输出到重要度判定单元202。在此,式(1)中的startk和endk分别表示子帧索引k的子帧中开头的样本索引和最末尾的样本索引。
E k = Σ i = start k end k ( X i ) 2 ( k = 0 , . . . , N s - 1 ) . . . ( 1 )
子帧能量Ek(k=0、…、Ns-1)从子帧能量计算单元201输入到重要度判定单元202。重要度判定单元202基于子帧能量设定各子帧的重要度。具体而言,重要度判定单元202对于子帧能量越大的子帧则将其重要度设定得越高。以下,将对于各子帧设定的重要度称为重要度信息。以下,将重要度信息表示为Ik(k=0、…、Ns-1),设定为Ik的值越小则重要度越高。例如,重要度判定单元202将对输入的各子帧的子帧能量Ek以降序进行排序,从与排序后的开头的子帧能量对应的子帧(子帧能量最大的子帧)开始依次设定从高到低的重要度(即,值从小到大的重要度信息Ik)。
例如,在子帧能量Ek处于式(2)的关系时,重要度判定单元202如式(3)那样设定各子帧(CELP编码的处理单位)的重要度(重要度信息Ik)。
E0≥E2≥E1≥E3                    ···(2)
I0=1
I1=3                              ···(3)
I2=2
I3=4
即,子帧能量Ek越大,重要度判定单元202将该子帧的重要度设定得越高(将重要度信息Ik设定得越小)。这里,在式(3)中,1帧内的各子帧的重要度信息Ik互不相同。即,重要度判定单元202设定重要度以使1帧内的各子帧的重要度信息Ik之间始终存在差别。
然后,重要度判定单元202将设定的重要度信息Ik(k=0、…、Ns-1)输出到CELP编码单元203。此外,在式(2)和式(3)中,举出子帧数为4的例子进行了说明,但本发明并不限定子帧数,也能够同样适用于作为一个例子说明的子帧数为4这种情况以外的子帧数。另外,式(3)只不过示出设定重要度信息Ik的一个例子,本发明同样能够适用于使用了式(3)以外的值的设定。
输入信号和来自重要度判定单元202的重要度信息Ik(k=0、…、Ns-1)被输入到CELP编码单元203。CELP编码单元203使用输入的重要度信息,进行输入信号的编码。以下,说明CELP编码单元203中的编码处理的细节。
图3是表示CELP编码单元203的内部结构的框图。CELP编码单元203主要包括:预处理单元301、听觉加权单元302、稀疏处理单元303、LPC(LinearPrediction Coefficient:线性预测系数)分析单元304、LPC量化单元305、自适应激励码本306、量化增益生成单元307、固定激励码本308、乘法单元309、310、加法单元311、313、听觉加权合成滤波器312、参数确定单元314以及复用单元315。以下,说明各处理单元的细节。
预处理单元301对输入信号Xn进行去除DC分量的高通滤波器处理、谋求后续的编码处理的性能改善的整波处理或预加重处理,然后将实施了这些处理的输入信号Xn(n=0、…、N-1)输出到听觉加权单元302和LPC分析单元304。
听觉加权单元302使用从LPC量化单元305输出的量化LPC,对于从预处理单元301输出的输入信号Xn进行听觉上的加权,从而生成听觉加权输入信号WXn(n=0、…、N-1)。然后,听觉加权单元302将听觉加权输入信号WXn输出到稀疏处理单元303。
稀疏处理单元303使用从重要度判定单元202(图2)输入的重要度信息Ik(k=0、…、Ns-1),对于从听觉加权单元302输入的听觉加权输入信号WXn进行稀疏处理。即,稀疏处理单元303进行如下的稀疏处理:使各子帧k中的构成输入信号WX的多个样本(样本索引startk~endk)内预定数的样本的振幅值变为0。以下说明稀疏处理的细节。
稀疏处理单元303基于输入的重要度信息Ik(k=0、…、Ns-1),对于输入的听觉加权输入信号WXn进行稀疏处理。这里,作为稀疏处理的一例说明如下的处理,即:对于听觉加权输入信号WXn,从振幅绝对值最大的顺序起选择预定的数的样本(sample),对除此之外的样本使其值为0。此外,这里,基于重要度信息Ik(k=0、…、Ns-1)适当地确定上述预定的数。在以下的式(4)中示出重要度信息Ik(k=0、…、Ns-1)为式(3)情况下的上述预定的数的设定例。这里,将预定的数表示为Tk(k=0、…、Ns-1),在式(4)中示出子帧数Ns为4的情况的例子。
T0=12
T1=6                           ···(4)
T2=10
T3=8
在式(4)的情况下,稀疏处理单元303在第一子帧(子帧索引k=0)中,对于听觉加权输入信号WXn(n=start0~end0)从振幅绝对值大的一方选择预定的数T0=15个的样本,将选择出的样本以外的样本的值设定为0。同样地,稀疏处理单元303在第二子帧(子帧索引k=1)中,对于听觉加权输入信号WXn(n=start1~end1)从振幅绝对值最大的样本起选择预定的数T1=10个的样本,将选择出的样本以外的样本的值设定为0。对于第三子帧、第四子帧(子帧索引k=2,3)也是同样的处理。
即,稀疏处理单元303设定为对于重要度信息Ik的值越小的子帧(重要度越高的子帧),预定的数Tk变得越大。换言之,作为稀疏处理单元303,对于重要度信息Ik的值越小的子帧(重要度越高的子帧)越减少振幅值为0的样本数。另外,稀疏处理单元303使在各子帧中构成输入信号的多个样本中、振幅值更小的预定数的样本(即,(1子帧内的样本数-Tk)个的样本)的振幅值为0。
然后,稀疏处理单元303将经过稀疏处理后的输入信号(稀疏化听觉加权输入信号SWXn)输出到加法单元313。
LPC分析单元304使用从预处理单元301输出的输入信号Xn,进行线性预测分析,将分析结果(线性预测系数:LPC)输出到LPC量化单元305。
LPC量化单元305进行从LPC分析单元304输出的线性预测系数(LPC)的量化处理,将得到的量化LPC输出到听觉加权单元302和听觉加权合成滤波器312。另外,LPC量化单元305将表示量化LPC的代码(L)输出到复用单元315。
自适应激励码本306将先前由加法单元311输出的激励源存储在缓存器中,从利用后述的参数确定单元314输出的信号确定的先前的激励源中截取1帧的样本作为自适应激励矢量,并将其输出到乘法单元309。
量化增益生成单元307将由参数确定单元314输出的信号所确定的量化自适应激励增益和量化固定激励增益分别输出到乘法单元309和乘法单元310。
固定激励码本308将具有由参数确定单元314输出的信号所确定的形状的脉冲激励矢量作为固定激励矢量输出到乘法单元310。此外,也可以是,固定激励码本308将脉冲激励矢量和扩散矢量相乘所得的矢量作为固定激励矢量而输出到乘法单元310。
乘法单元309将从量化增益生成单元307输出的量化自适应激励增益乘以从自适应激励码本306输出的自适应激励矢量,从而将乘以增益后的自适应激励矢量输出到加法单元311。另外,乘法单元310将从量化增益生成单元307输出的量化固定激励增益乘以从固定激励码本308输出的固定激励矢量,将乘以增益后的固定激励矢量输出到加法单元311。
加法单元311将从乘法单元309输出的乘以增益后的自适应激励矢量与从乘法单元310输出的乘以增益后的固定激励矢量进行矢量加法运算,将加法结果、即激励源输出到听觉加权合成滤波器312和自适应激励码本306。此外,输出到自适应激励码本306的激励源存储在自适应激励码本306的缓存器中。
听觉加权合成滤波器312使用基于从LPC量化单元305输出的量化LPC的滤波器系数,对于从加法单元311输出的激励源进行滤波器合成而生成合成信号HPn(n=0、…、N-1),将合成信号HPn输出到加法单元313。
加法单元313通过使从听觉加权合成滤波器312所输出的合成信号HPn的极性反转,将极性反转后的合成信号与从稀疏处理单元303输出的稀疏化听觉加权输入信号SWXn相加,从而计算误差信号,并将误差信号输出到参数确定单元314。
参数确定单元314分别从自适应激励码本306、固定激励码本308以及量化增益生成单元307选择使从加法单元313输出的误差信号的编码失真最小的自适应激励矢量、固定激励矢量以及量化增益,将表示选择结果的自适应激励矢量代码(A)、固定激励矢量代码(F)以及量化增益代码(G)输出到复用单元315。
这里,说明加法单元313和参数确定单元314中的处理的细节。编码装置101通过求被实施了特定的处理(预处理、听觉加权处理等)的输入信号和下述合成信号之间的相关,对输入信号进行编码,该合成信号是使用码本(自适应激励码本306、固定激励码本308)以及基于量化LPC的滤波器系数而生成的合成信号。具体而言,参数确定单元314搜索与稀疏化听觉加权输入信号SWXn之间的误差(编码失真)最小的合成信号HPn(即、各种索引(代码(A)、(F)、(G)))。通过下述那样进行此时的误差计算。
通常,能够如式(5)那样计算这两个信号(合成信号HPn和稀疏化听觉加权输入信号SWXn)的误差Dk
D k = Σ i = start k end k ( SWX i ) 2 - Σ i = start k end k ( ( SWX i ) ( HP i ) ) 2 Σ i = start k end k ( HP i ) 2 ( k = 0 , . . . , N s - 1 ) . . . ( 5 )
在式(5)中,第一项为稀疏化听觉加权输入信号SWXn的能量,是固定的。因此,为了使式(5)的误差Dk最小,则使第二项成为最大即可。这里,在本发明中,在稀疏处理单元303中,使用从重要度判定单元202(图2)输出的重要度信息Ik(k=0、…、Ns-1),限定作为式(5)中的第二项的计算对象的样本,从而削减第二项计算时的处理运算量。
具体而言,稀疏处理单元303对与各子帧k,按照振幅的绝对值从大到小的顺序(振幅的绝对值从高到低的顺序)选择样本,样本数为根据重要度信息Ik所设定的预定的数Tk。由此,仅对选择出的样本计算式(5)所示的第二项。即,加法单元313计算各子帧中的输入信号与合成信号之间的相关,其中该输入信号为构成的多个样本中预定数的样本的振幅值变为0的输入信号。
例如,在重要度信息Ik为式(3)所示的值时,如式(4)所示那样,稀疏处理单元303对于第一子帧(子帧索引k=0)选择振幅的绝对值大的“12”个(T0=12)样本(振幅的绝对值在前12位的样本)。同样地,稀疏处理单元303对于第二子帧(子帧索引k=1)选择振幅的绝对值大的“6”个(T1=6)样本(振幅的绝对值在前6位的样本)。对于第三、第四子帧(子帧索引k=2,3)也是同样的。
这样,稀疏处理单元303在帧内的子帧之间自适应地调整成为计算式(5)所示的第二项的对象的样本数。此时,将未被选择的样本的值设为零(0),因此参数确定单元314能够省略式(5)所示的第二项的乘法处理,其结果是,能够大幅度削减式(5)的处理运算量。另外,在1帧内的全体子帧中,对要选择的样本数进行调整,因此能够在所有子帧中削减处理运算量,其结果是能够保证削减最坏情况(worst case)的处理运算量。
复用单元315对表示从LPC量化单元305输出的量化LPC的代码(L)、从参数确定单元314输出的自适应激励矢量代码(A)、固定激励矢量代码(F)以及量化增益代码(G)进行复用,将结果作为编码信息输出到传输路径102。
以上为图2所示的CELP编码单元203中的处理的说明。
以上为图1所示的编码装置101中的处理的说明。
接着,使用图4说明图1所示的解码装置103的内部结构。这里,说明解码装置103进行CELP型的语音解码的情况。
分离单元401将经由传输路径102输入的编码信息分离成各代码((L)、(A)、(G)、(F))。分离出的LPC代码(L)输出到LPC解码单元402,分离出的自适应激励矢量代码(A)输出到自适应激励码本403,分离出的量化增益代码(G)输出到量化增益生成单元404,分离出的固定激励矢量代码(F)输出到固定激励码本405。
LPC解码单元402从分离单元401输出的代码(L)解码出量化LPC,将解码出的量化LPC输出到合成滤波器409。
自适应激励码本403从由分离单元401输出的自适应激励矢量代码(A)所指定的先前的激励源中取出1帧的样本,将其作为自适应激励矢量而输出到乘法单元406。
量化增益生成单元404解码出由分离单元401输出的量化增益符号(G)所指定的量化自适应激励增益和量化固定激励增益,将量化自适应激励增益输出到乘法单元406,将量化固定激励增益输出到乘法单元407。
固定激励码本405生成由分离单元401输出的固定激励矢量符号(F)所指定的固定激励矢量,并将其输出到乘法单元407。
乘法单元406将从自适应激励码本403输出的自适应激励矢量乘以从量化增益生成单元404输出的量化自适应激励增益,并将乘以增益后的自适应激励矢量输出到加法单元408。另外,乘法单元407将从固定激励码本405输出的固定激励矢量乘以从量化增益生成单元404输出的量化固定激励增益,将乘以增益后的固定激励矢量输出到加法单元408。
加法单元408将从乘法单元406输出的乘以增益后的自适应激励矢量与从乘法单元407输出的乘以增益后的固定激励矢量相加而生成激励源,将激励源输出到合成滤波器409和自适应激励码本403。
合成滤波器409使用基于由LPC解码单元402解码后的量化LPC的滤波器系数,进行从加法单元408输出的激励源的滤波器合成,将合成后的信号输出到后处理单元410。
后处理单元410对于从合成滤波器409输出的信号,实施例如共振峰增强和基音增强这样的改善语音的主观性质量的处理、以及改善平稳噪声的主观性质量的处理等,从而将处理后的信号作为输出信号输出。
以上是图1所示的解码装置103中的处理的说明。
这样,根据本实施方式,作为采用CELP型的编码方法的编码装置,首先对于帧整体,对每个子帧计算子帧能量。接着,编码装置根据计算出的子帧能量设定每个子帧的重要度。然后,编码装置在搜索各子帧中的基音周期时,选择相当于与重要度相应的预定的数的、振幅的绝对值大的样本,仅对选择出的样本进行误差计算,从而计算出最合适的基音周期。通过这样的结构,能够保证大幅度削减对于1帧整体的处理运算量。
另外,在编码装置中,并不是对于所有子帧一律确定搜索基音周期时成为相关计算(距离计算)的对象的样本数,而是能够根据子帧的重要度自适应地切换该样本数。具体而言,对于子帧能量大、在听觉上重要的子帧(重要度高的子帧),能够高精度地进行基音周期搜索。另一方面,对于子帧能量小、给听觉带来的影响小的子帧(重要度低的子帧),能够降低基音周期搜索的精度,大幅度地削减处理运算量。由此,能够抑制解码信号的品质大幅度恶化。
此外,在本实施方式中,举例说明了在重要度判定单元202(图2)中,基于由子帧能量计算单元201计算出的子帧能量,确定重要度信息的结构。但是,本发明不限于此,也能够同样地适用于基于子帧能量以外的信息确定重要度的结构。例如举出如下的例子:计算各子帧的信号的离散的程度(例如SFM(Spectral Flatness Measure:频谱平坦度测量)),SFM值越大则使重要度越高。当然,也可以基于SFM值以外的信息确定重要度。
另外,在本实施方式中,在稀疏处理单元303(图3)中基于由重要度判定单元202(图2)确定的重要度信息,固定地确定出成为相关计算(误差计算)的对象的预定的样本数(例如式(4))。但是,本发明不限于此,也同样能够适用于以式(4)所示的确定方法以外的方法确定成为相关计算(误差计算)的对象的样本数的结构。例如,也可以是,在子帧能量的大小处于高位的子帧之间子帧能量为非常接近的数值时,重要度判定单元202并不是简单地以(1、2、3、4)这样的整数值设定重要度信息,而是如设定为(1.0、2.5、2.5、4.0)这样还允许用进一步包含小数值的数值来设定重要度信息。即,也可以根据子帧间的子帧能量的差以更小的精度设定重要度信息。另外,举例出在稀疏处理单元303中基于上述重要度信息如设定为(12、8、8、6)这样设定预定的数(预定样本数)的结构。这样,根据多个子帧中的子帧能量的分布,使用更灵活的权重(重要度),由稀疏处理单元303确定预定样本数,从而与上述实施方式相比,能够更有效率地削减处理运算量。此外,通过预先准备多组(set)预定样本数的模式(pattern),从而能够进行预定样本数的确定。另外,也可以是基于重要度信息而动态地确定预定样本数的结构。但是,这两个结构的前提在于,确定预定样本数的模式或者动态地确定样本数,以能够在1帧整体中使处理运算量降低一定值以上。
另外,在本实施方式中,说明了对于输入信号(在此为稀疏化听觉加权输入信号SWXn)进行稀疏处理的情况。但是,在本发明中,不限于对于输入信号进行稀疏处理,对于进行与输入信号的相关计算的合成信号(在此为合成信号HPn)进行稀疏处理也能够得到与上述实施方式相同的效果。即,在编码装置中,根据设定在各子帧中的重要度,将构成各子帧中的输入信号和合成信号的至少一方的信号的多个样本中预定数的样本的振幅值设为0,计算输入信号和合成信号之间的相关即可。另外,本发明也同样能够应用于如下的结构,即:对于各子帧中的输入信号和合成信号双方,将构成信号的多个样本中预定数的样本的振幅值设为0,计算输入信号与合成信号之间的相关。
另外,在本实施方式中,说明了对于稀疏化听觉加权输入信号SWXn进行稀疏处理的情况。但是,本发明也同样能够应用于不对输入信号进行预处理单元301中的预处理、以及听觉加权单元302中的听觉加权处理的情况。此时,在稀疏处理单元303中对于输入信号Xn进行稀疏处理。
另外,在本实施方式中,列举在CELP编码单元203中采用CELP型的编码方式的结构作为例子进行了说明,但本发明不限于此,也同样能够应用于除CELP型之外的编码方式。例如列举如下的例子:在不进行LPC分析而使用在先前帧中进行了编码的信号来计算当前帧中的编码参数时,在帧间的信号的相关运算中应用本发明的结构等。
另外,本发明的编码装置和编码方法不限于上述实施方式,能够进行各种变更而加以实施。
另外,说明了上述实施方式中的解码装置使用从上述实施方式中的编码装置传输的编码信息进行处理,但本发明不限于此,只要是包含所需参数和数据的编码信息,即使并不是来自上述实施方式中的编码装置的编码信息也能够进行处理。
另外,在将信号处理程序记录、写入到存储器、磁盘、磁带、CD、DVD等机械可读取的记录介质中来进行工作的情况下,也能够应用本发明,得到与本实施方式同样的作用和效果。
在上述各实施方式中,以由硬件构成本发明的情况为例进行了说明,但本发明在硬件的协同下,也可以由软件实现。
另外,用于上述实施方式的说明中的各功能块通常被作为集成电路的LSI来实现。这些功能块既可以被单独地集成为单芯片,也可以包含一部分或全部地被集成为单芯片。虽然这里称为LSI,但根据集成程度,可以被称为IC、***LSI、超大LSI(SuperLSI)、或特大LSI(Ultra LSI)。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器来实现。也可以使用可在LSI制造后编程的FPGA(Field ProgrammableGate Array:现场可编程门阵列),或者可重构LSI内部的电路单元的连接和设定的可重构处理器。
再者,随着半导体的技术进步或随之派生的其它技术的出现,如果出现能够替代LSI的集成电路化的新技术,当然可利用该新技术进行功能块的集成化。还存在着适用生物技术等的可能性。
2010年10月20日提交的日本专利申请第2010-235279号所包含的说明书、附图以及说明书摘要的公开内容全部被引用于本申请中。
工业实用性
本发明能够在对输入信号进行相关运算时高效率地削减运算量,例如能够被应用于分组通信***、移动通信***等。

Claims (9)

1.CELP型编码装置,其对输入信号进行编码而生成编码信息,包括:
第一信号生成单元,使用所述输入信号生成第一信号;
第二信号生成单元,通过预定的方法生成第二信号;
设定单元,对划分所述输入信号的帧所得的多个子帧的每一个子帧设定重要度;以及
相关计算单元,根据所设定的所述每一个子帧的所述重要度,将所述每一个子帧内的构成第一信号和第二信号的至少一方的信号的多个样本中,选择从振幅值的绝对值大开始数事先预定个数的样本,并将没有被选择样本的振幅值设为0,计算将所述没有被选择的样本的振幅值设为0的一方信号与另一方信号之间的相关。
2.如权利要求1所述的CELP型编码装置,
所述相关计算单元对所述重要度越高的所述子帧,越减少振幅值为0的样本数。
3.如权利要求1所述的CELP型编码装置,
所述设定单元基于所述每一个子帧的能量设定所述重要度。
4.如权利要求3所述的CELP型编码装置,
所述设定单元对所述能量越大的所述子帧,设定越高的所述重要度。
5.如权利要求1所述的CELP型编码装置,
所述相关计算单元计算基音周期搜索时的所述相关。
6.如权利要求1所述的CELP型编码装置,
所述设定单元设定所述重要度,以使所述帧内的所述每一个子帧的所述重要度之间始终有差别。
7.通信终端装置,其具有权利要求1所述的CELP型编码装置。
8.基站装置,其具有权利要求1所述的编码装置。
9.CELP型编码方法,其对输入信号进行编码而生成编码信息,包括以下步骤:
第一信号生成步骤,使用所述输入信号生成第一信号;
第二信号生成步骤,通过预定的方法生成第二信号;
设定步骤,对划分所述输入信号的帧所得的多个子帧的每一个子帧设定重要度;以及
相关计算步骤,根据所设定的所述每一个子帧的所述重要度,将所述每一个子帧内的构成第一信号和第二信号的至少一方的信号的多个样本中,选择从振幅值的绝对值大开始数事先预定个数的样本,并将没有被选择样本的振幅值设为0,计算将所述没有被选择的样本的振幅值设为0的一方信号与另一方信号之间的相关。
CN201180046260.7A 2010-10-20 2011-09-07 编码装置和编码方法 Expired - Fee Related CN103119650B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010235279 2010-10-20
JP2010-235279 2010-10-20
PCT/JP2011/005014 WO2012053146A1 (ja) 2010-10-20 2011-09-07 符号化装置及び符号化方法

Publications (2)

Publication Number Publication Date
CN103119650A CN103119650A (zh) 2013-05-22
CN103119650B true CN103119650B (zh) 2014-11-12

Family

ID=45974877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180046260.7A Expired - Fee Related CN103119650B (zh) 2010-10-20 2011-09-07 编码装置和编码方法

Country Status (4)

Country Link
US (1) US8760323B2 (zh)
JP (1) JP6001451B2 (zh)
CN (1) CN103119650B (zh)
WO (1) WO2012053146A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2770506A4 (en) * 2011-10-19 2015-02-25 Panasonic Ip Corp America CODING DEVICE AND CODING METHOD

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1708907A (zh) * 2002-10-25 2005-12-14 达丽星网络有限公司 用于快速celp参数映射的方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2539351B2 (ja) * 1984-01-18 1996-10-02 株式会社日立製作所 音声合成方法
JPS62194296A (ja) 1986-02-21 1987-08-26 株式会社日立製作所 音声符号化方式
CA2051304C (en) 1990-09-18 1996-03-05 Tomohiko Taniguchi Speech coding and decoding system
JP3100082B2 (ja) * 1990-09-18 2000-10-16 富士通株式会社 音声符号化・復号化方式
JP3338074B2 (ja) * 1991-12-06 2002-10-28 富士通株式会社 音声伝送方式
JP3490325B2 (ja) * 1999-02-17 2004-01-26 日本電信電話株式会社 音声信号符号化方法、復号方法およびその符号化器、復号器
US6829579B2 (en) 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
KR100710667B1 (ko) * 2005-12-30 2007-04-23 포스데이타 주식회사 무선 통신 시스템에서 프레임의 경계 검출 장치 및 방법
EP2146522A1 (en) * 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
US8576961B1 (en) * 2009-06-15 2013-11-05 Olympus Corporation System and method for adaptive overlap and add length estimation
JP5002642B2 (ja) * 2009-11-09 2012-08-15 株式会社東芝 広帯域音声符号化方法及び広帯域音声符号化装置
RU2012155222A (ru) 2010-06-21 2014-07-27 Панасоник Корпорэйшн Устройство декодирования, устройство кодирования и соответствующие способы
US8605830B2 (en) * 2010-07-30 2013-12-10 National Instruments Corporation Blind carrier/timing recovery and detection of modulation scheme
US8913835B2 (en) * 2012-08-03 2014-12-16 Kodak Alaris Inc. Identifying key frames using group sparsity analysis

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1708907A (zh) * 2002-10-25 2005-12-14 达丽星网络有限公司 用于快速celp参数映射的方法和装置

Also Published As

Publication number Publication date
US20130176150A1 (en) 2013-07-11
WO2012053146A1 (ja) 2012-04-26
CN103119650A (zh) 2013-05-22
US8760323B2 (en) 2014-06-24
JPWO2012053146A1 (ja) 2014-02-24
JP6001451B2 (ja) 2016-10-05

Similar Documents

Publication Publication Date Title
CN101903945B (zh) 编码装置、解码装置以及编码方法
CN101622665B (zh) 编码装置以及编码方法
CN101925953B (zh) 编码装置、解码装置以及其方法
CN1121683C (zh) 语音编码
CN1977311B (zh) 语音编码装置、语音解码装置及其方法
CN102194462B (zh) 固定码本搜索装置
EP2750134A1 (en) Encoding device and method, decoding device and method, and program
CN101622664A (zh) 自适应激励矢量量化装置和自适应激励矢量量化方法
CN101622663B (zh) 编码装置以及编码方法
EP1852850A1 (en) Scalable encoding device and scalable encoding method
CN101027718A (zh) 可扩展性编码装置以及可扩展性编码方法
CN102714040A (zh) 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
CN101185123A (zh) 可扩展编码装置及可扩展编码方法
KR20070090217A (ko) 스케일러블 부호화 장치 및 스케일러블 부호화 방법
CN101981616A (zh) 立体声信号变换装置、立体声信号逆变换装置及其方法
CN103119650B (zh) 编码装置和编码方法
US7580834B2 (en) Fixed sound source vector generation method and fixed sound source codebook
JP3147807B2 (ja) 信号符号化装置
JP2004348120A (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP3099876B2 (ja) 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置
CN105122358A (zh) 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法
CN1875401A (zh) 数字语音编码器中的谐波噪声加权
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3229784B2 (ja) 音声符号化復号化装置及び音声復号化装置
JP2005062410A (ja) 音声信号の符号化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140721

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140721

Address after: California, USA

Applicant after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Applicant before: Matsushita Electric Industrial Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170523

Address after: Delaware

Patentee after: III Holdings 12 LLC

Address before: California, USA

Patentee before: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20141112

Termination date: 20180907