CN1293534C - 参数编码器和参数编码方法及参数译码器和参数译码方法 - Google Patents

参数编码器和参数编码方法及参数译码器和参数译码方法 Download PDF

Info

Publication number
CN1293534C
CN1293534C CNB018094295A CN01809429A CN1293534C CN 1293534 C CN1293534 C CN 1293534C CN B018094295 A CNB018094295 A CN B018094295A CN 01809429 A CN01809429 A CN 01809429A CN 1293534 C CN1293534 C CN 1293534C
Authority
CN
China
Prior art keywords
theta
component
code data
amplitude
expansion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB018094295A
Other languages
English (en)
Other versions
CN1429384A (zh
Inventor
A·C·登布林克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IPG Electronics 503 Ltd
Pendragon Wireless LLC
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1429384A publication Critical patent/CN1429384A/zh
Application granted granted Critical
Publication of CN1293534C publication Critical patent/CN1293534C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一个已知的编码器100,包含一个分段单元110,用于将一个音频或语音信号s划分为至少一个段x(n),并包含一个计算单元120,该单元由段x(n)计算正弦代码数据,该正弦代码数据的形式是一个给定扩展(n)的相位和幅度数据,对于一个给定的规则来说,扩展(n)尽可能好地近似段x(n)。本发明的一个目的是改进该译码器,以便能以简单廉价的方式执行所述正弦代码数据的计算。按本发明,这一目的是通过按以下扩展,为段x(n)计算正弦代码数据来达到的。

Description

参数编码器和参数编码方法及 参数译码器和参数译码方法
技术领域
本发明有关一种用于将一个声频或语音信号编码为正弦代码数据的参数编码器和编码方法。
本发明还有关一种用于由所述正弦代码数据重构一个所述声频或语音信号的近似的参数译码器和译码方法。
背景技术
声频或语音信号在经一个信道发射之前,或被存储在一个存储介质上之前,最好被编码以压缩所述信号的数据。声频或语音信号主要由正弦代码数据代表,因此,在本技术中已知有特定的编码器专用于编码这些信号。例如,这样一个参数编码器见于“A new speech codingmodel based on a least-squares sinusoidal representation”(声学,语音和信号处理IEEE国际会议论文集(ICASSP87),第1641-1644页,达拉斯TX,1987年4月6-9日。IEEE,Picataway,NJ。作者:E.B.George和M.J.T.Smith)。在图5中举例说明了该参数编码器。按照图5,该参数编码器500包含一个分段单元510,用于将一个所接收的声频或语音信号划分为至少一个有限段x(n)。
所述段x(n)被输入一个计算单元520。所述计算单元520由该段x(n)计算正弦代码数据,该数据的形式是一个给定扩展
Figure C0180942900081
的相位和幅值,对于一个给定规则(例如加权平方误差最小)来说,该扩展 尽可能好地近似x(n)。对于所述参数编码器,该扩展由下式给出:
x ^ ( n ) = Σ i = 1 L A i ( n ) cos ( Φ i ( n ) ) - - - ( 1 )
其中
A i ( n ) = Σ j = 0 J - 1 a i j n j - - - ( 2 )
Φ i ( n ) = Σ k = 0 K - 1 φ k i n k - - - ( 3 )
这里,aj i和φk i分别是幅值参数Ai和相位参数φi的多项式系数。计算单元520包含一个频率估算单元522,该单元通过在所接收段x(n)的频谱中挑选频率,由该段x(n)计算相位系数φk i,例如,计算k=1时的系数,即φl i。这些代表所述正弦代码数据相位部分的相位系数φk i一方面被输出给一个多路复用器530,另一方面被输入一个模式生成单元524。所述模式生成单元根据公式(3)计算相位参数Φi(n)。
模式生成单元524还根据下面公式生成扩展
Figure C0180942900091
的J×L分量Pij:
Pij=njcos(Φi(n))其中,i=1~L,j=0~(J-1)
该J×L分量Pij被输入一个幅值估算单元526,该单元根据所述接收分量以及分段单元510输出的接收段x(n)确定最理想的幅值数据aj i
相位系数φk i和幅值系数aj i构成代表扩展
Figure C0180942900092
的正弦代码数据,该扩展 是段x(n)的一个近似。这些正弦代码数据被多路复用器530多路复用以形成一个数据流,该数据流可被存入一个记录介质或经一个信道发射。
如公式(1)中所描述的,并从所述参数编码器500知道的扩展
Figure C0180942900094
能为声频或语音信号的一个单独的段x(n)提供合适的近似。不过,该正弦代码数据的计算过于复杂。
发明内容
本发明的一个目的是改进一个用于将一个声频或语音信号编码为正弦代码数据的已知参数编码器和方法,并且,本发明的目的还有改进一种已知的参数译码器和方法,该译码器和方法用于在所述正弦代码数据的发射或恢复之后,由所述正弦代码数据重构所述声频或语音信号的一个近似,因此,可以用一种简单廉价的方式执行所述正弦代码数据的计算。
这一目的是通过提出一种参数编码器解决的。更具体的,这一目的是通过使计算单元为扩展 计算正弦代码数据θk i,dj i和ej i来达到的。
按照本发明,提出了一种参数编码器,用于将一个音频或语音信号s编码为正弦代码数据,该编码器包括:
-一个分段单元,用于将所述信号s分为至少一个段x(n);
-一个计算单元,用于由段x(n)计算所述正弦代码数据(该数据的形式为一个给定扩展 的相位和幅值数据),以使得对于一个给定的规则来说,扩展
Figure C0180942900097
尽可能好地近似段x(n);
该编码器的特点在于:
计算单元为以下的扩展 计算正弦代码数据θk i,dj i和ej i
x ^ = Σ i = 1 L C i = Σ i = 1 L Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
并且:
Θ i ( n ) = Σ k = 1 K θ k i n k
其中:
i,j,k:代表参数;
n:代表一个离散时间参数;
Ci:代表扩展 的第i个分量;
L:代表正弦分量的总数;
θk i:代表作为所述正弦代码数据之一的相位系数值;
J:代表幅值的个数;
fj:代表J个线性无关函数组中的第j个实例;
Θi:是一个相位;
K:代表相位系数的个数;
dj i,ej i:代表描述所述正弦代码数据一些部分的分量的线性关联幅值。
在试图定义一个正弦数据,以使所声明的扩展
Figure C0180942900105
准确描述一个指定段x(n)时所出现的最佳化问题很容易解决。这一计算的简单性是由于,所声明的扩展 中,除了相位系数θk i之外,幅值数据dj i和ej i是线性关联的。应指出,在Θi中不会出现零阶的相位系数,而在Φi中会出现这种分量,其形式为φ0 i
另外,所声明扩展
Figure C0180942900107
能为定义正弦代码数据提供更多的自由度,这是因为,与该技术中已知的扩展相比,所声明的扩展更广,并且能为一个单独的段x(n)提供更准确的近似。
按本发明的一个第一实例,线性无关函数fj(n)被设为fj(n)=nj。以这种方式,提出的扩展
Figure C0180942900108
被限定为一个多项式扩展。
根据参数编码器的有利实例,特别是根据计算单元,是相关编码器发明的主题。
以上指出的目的还通过提出一种用于编码一个音频或语音信号的方法解决。所述方法的优点和实例对应于以上所解释的参数编码器的优点和实例。
按照本发明,提出了一种参数编码方法,用于将一个音频或语音信号s编码为正弦代码数据,该方法包括以下步骤:
-将所述信号s分为至少一个段x(n);
-由段x(n)计算所述正弦代码数据(该数据的形式为一个给定扩展
Figure C0180942900111
的相位和幅度数据),以使得对于一个给定的规则来说,扩展
Figure C0180942900112
尽可能好地近似段x(n);其特点在于
-扩展
Figure C0180942900113
被定义为:
x ^ = Σ i = 1 L C i = Σ i = 1 L Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
并且:
Θ i ( n ) = Σ k = 1 K θ k i n k
其中:
i:代表扩展 的一个分量Ci
j,k:代表参数;
n:代表一个离散时间参数;
Ci:代表扩展 的第i个分量;
L:代表正弦分量的总数;
J:代表幅值的个数;
fj:代表J个线性无关函数组中的第j个实例;
θk i:代表作为所述正弦代码数据之一的相位系数值;
Θi:是一个相位;
K:代表相位系数的个数;
dj i,ej i:表示代表所述正弦代码数据幅值部分的分量的线性关联幅值。
在一个实例中,通过取扩展 频域内的峰值频率来定义频率θk i
以上所指出的目的还通过提出一种参数译码器实现,该译码器用于由所发射或恢复的代码数据重构一个音频或语音信号的近似
Figure C0180942900119
更具体的,达到该目的的方法是,采用一个已知的综合器,由所述正弦代码数据φk i:,dj i和ej i重构所述段
Figure C01809429001110
按照本发明,提出了一种参数译码器,用于由发射或恢复的代码数据重构一个音频或语音信号s的近似值
Figure C01809429001111
包括:
-包含一个选择单元,用于从所述发射或恢复的代码数据中挑选正弦代码数据,这些正弦代码数据代表近似值 的段
-一个综合器,用于由所述接收的正弦代码数据重构所述段
-一个连结单元,用于连接连续的段
Figure C0180942900124
以形成所述音频或语音信号s的近似
这里,该正弦代码数据是所述段
Figure C0180942900126
的至少一个分量的一组频率和幅度值;其特点在于
-其综合器用于按下面公式,由所述正弦代码数据重构所述段
x ^ = Σ i = 1 L C i = Σ i = 1 L Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
Θ i ( n ) = Σ k = 1 K θ k i n k
其中:
i:代表扩展 的一个分量Ci
j,k:代表参数;
n:代表一个离散时间参数;
Ci:代表扩展 的第i个分量;
L:代表正弦分量的总数;
J:代表幅值的个数;
fj:代表J个线性无关函数组中的第j个实例;
θk i:代表作为所述正弦代码数据之一的相位系数值;
Θi:是一个相位;
K:代表相位系数的个数;
dj i,ej i:表示代表所述正弦代码数据幅值部分的分量的线性关联幅值。
提出的扩展 的计算比该技术中已知扩展的计算简单。这是由于所述扩展中幅值数据dj i和ej i的线性关联性及零阶相位系数的省略。
由于扩展 的计算简单,因此,对原始音频或语音信号s(形式为其近似 的重构实现起来更快而且费用更低。
上述目的还通过提出一种译码方法达到。所述方法的优点对应于以上参照参数译码器提到的优点。
按照本发明,提供了一种用于由发射或恢复的代码数据重构一个音频或语音信号s的近似值
Figure C0180942900131
的译码方法,包括从所接收的发射或恢复代码数据中挑选代表近似值
Figure C0180942900132
的段 的正弦代码数据的步骤:
-由所述正弦代码数据重构所述段
-将连续的段
Figure C0180942900135
连接在一起,以生成该音频或语音信号s的近似值
-其中,该正弦代码数据是所述扩展
Figure C0180942900137
的至少一个分量的一组频率和幅度值;其特点在于
-在所述重构步骤中,按下面公式,由所述正弦代码数据重构所述段
Figure C0180942900138
x ^ = Σ i = 1 L C i = Σ i = 1 L Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
Θ i ( n ) = Σ k = 1 K θ k i n k
其中:
i:代表扩展 的一个分量Ci
j,k:代表参数;
n:代表一个离散时间参数;
Ci:代表扩展 的第i个分量;
L:代表正弦分量的总数;
J:代表幅值的个数;
fj:代表J个线性无关函数组中的第j个实例;
θk i:代表作为所述正弦代码数据之一的相位系数值;
Θi:是一个相位;
K:代表相位系数的个数;
dj i,ej i:表示代表所述正弦代码数据幅值部分的分量的线性关联幅值。
附图说明
在以下描述中,结合了五个附图,其中:
图1显示了按本发明的参数编码器的第一实例;
图2显示了按本发明的参数编码器的第二实例;
图3是一个流程图,举例说明了按本发明的参数编码器的第二实例的操作;
图4显示了按本发明一个实例的参数译码器;
图5显示了该技术中已知的一个参数编码器。
具体实施方式
在描述本发明的推荐实例之前,先给出有关本发明主题的一些基本解释。
本发明提出一个扩展 用于近似一个正弦音频或语音信号s的一个段x(n)。所述扩展 由相位和幅度数据代表,以下也将其称为正弦代码数据。定义该正弦代码数据的原则是,对于一个给定的规则(例如,平方加权误差最小),扩展 能尽可能好地近似该正弦音频或语音信号s的一个段x(n)。换句话说,必须通过解一个最佳化问题来定义该正弦代码数据。在定义了能最好地近似一个特定段x(n)的正弦代码数据之后,该数据被存储在一个存储介质上或经一个信道发射,该数据作为代表所述段x(n)的代码数据,因此,该数据还代表所述音频或语音信号s。该正弦代码数据在存储或发射之前,最好先进行编码和/或净化,以从中消除不相关或冗余数据。
以下,将参照图1解释按本发明第一实例,所述正弦代码数据的生成。
图1显示了一个参数编码器100的一个第一推荐实例,该编码器100用于生成代表一个输入音频或语音信号s的所述正弦代码数据。所接收的信号s被输入一个分段单元110,该单元将所述信号s划分为至少一个段x(n)。所述段x(n)被输入一个计算单元120,用于生成所述正弦代码数据,扩展
Figure C0180942900144
的定义为:
x ^ ( n ) = Σ i = 1 L Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ] - - - ( 4 )
并且:
Θ i ( n ) = Σ k = 1 K θ k i n k - - - ( 5 )
其中:
i,j,k:代表参数;
n:代表一个离散时间参数;
Ci:代表扩展
Figure C0180942900147
的第i个分量;
L:代表正弦分量的总数;
θk i:代表作为所述正弦代码数据之一的相位系数值;
J:代表幅值的个数;
fj:代表J个线性无关函数组中的第j个实例;
Θi:是一个相位;
K:代表相位系数的个数;
dj i,ej i代表描述所述正弦代码数据一些部分的分量的线性关联幅值。对于一个给定的规则(例如,加权平方误差最小)来说,该正弦数据尽可能好地近似输入所述计算单元120的段x(n)。要由所述计算单元120确定的正弦代码数据是相位θk i和幅值数据dj i和ej i
在公式(4)中定义Ci为:
C i = Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ] - - - ( 6 )
以下,将其称为扩展
Figure C0180942900152
的第i个分量,i=1~L。
计算单元120包含一个频率估算单元122,用于按公式(5)为扩展 的所有Ci(i=1~L)确定一组L×K个相位系数θk i(k=1~K),该扩展 代表逐个接收的段x(n)。所述L×K频率θk i被输入一个模式生成单元124,用于按照公式(5)计算一组频率参数Θi(n)(共L个,i=1~L)。所述模式生成单元124还用于按下面公式为分量Ci(i=1~L)生成一组模式对Pij 1,Pij 2(J×L):
P ij 1 = f j ( n ) cos ( Θ i ( n ) ) ;
P ij 2 = f j ( n ) sin ( Θ i ( n ) )
i=1~L并且j=0~(J-1)。
所述模式对组Pij 1,Pij 2与段x(n)一起输入一个幅值估算单元126,幅值估算单元126为扩展
Figure C0180942900157
的所有分量Ci的所有接收模式Pij 1确定多元J×L幅值dj i,为模式Pij 2确定多元J×L幅值ej i
采用计算单元120和(特别是)频率估算单元122和幅值估算单元126,确定并优化正弦数据(该数据包含相位数据θk i和幅值数据dj i,ej i),该数据(近似)满足规则“段x(n)与扩展 间的加权平方误差E最小”。
参数译码器100还包含一个多路复用器130,用于将所述频率估算单元122输出的L×K相位系数θk i和所述幅值估算单元126输出的J×L幅值数据dj i和ej i转换为一个数据流,存储在一个存储介质上或经一个信道发射。
图2显示了参数编码器100’的一个第二实例。和参数编码器100类似,参数编码器100’也用于由输入音频或语音信号s生成所述正弦代码数据。其分段单元110’的操作与分段单元110的操作相一致,因此,分段单元110’在其输出端生成所接收信号s的段x(n)。所述段x(n)被输入一个计算单元120’。与第一实例的计算单元120不同的是,计算单元120’并非同时为一个段
Figure C0180942900161
的所有部分计算多元正弦代码数据,而是顺序地为扩展 的每个分量Ci(i=1~L)生成该正弦代码数据。这种计算方式在本技术中一般被称为综合分析或匹配追踪算法。不过,在以前的技术中,所述方法的应用只见于与公式(4)中提出的扩展
Figure C0180942900163
不同的扩展。
以下,将参照图2和图3解释所述第二实例的计算单元120’的操作。更具体的,描述怎样按照公式(4)计算扩展 的正弦代码数据,以使得分段单元110’输出的一个段与按照公式(4)计算出的该段的扩展
Figure C0180942900165
之间的加权平方误差(近似)最小。
在第一个循环i=1时,计算扩展 的第一个分量Cj(i=1)的正弦代码数据(图3中的步骤a))。
为完成这一步骤,分段单元110’的输出x(n)被设为:εi-1=x(n)(见步骤b))。
在所述第一循环中,分段单元110’的所述输出被输入一个频率估算单元122’,用于由输入值εi-1确定K个相位系数θk i(见步骤c)),其中,k=1~K。所述相位系数θk i代表所搜索正弦代码数据的相位,因此,由计算单元输出。另外,所述相位系数θk i被输入一个模式生成单元124’,用于根据公式(5)计算第一个分量C1的相位Θi,其中i=1(见步骤d))。所述模式生成单元124’还按下式为分量Ci生成2×J个模式(j=0~(J-1)):
P ij 1 = f j ( n ) cos ( Θ i ( n ) ) ;
P ij 2 = f j ( n ) sin ( Θ i ( n ) )
此时,i=1(见步骤e))。所生成的这些模式Pij 1,Pij 2与参数εi-1一起输入一个幅值估算单元126’。所述幅值估算单元126’根据输入数据,为所述分量Ci(i=1)确定所述模式Pij 1的J个幅值dj i和所述模式Pij 2的J个幅值ej i(见步骤f))。所计算出的幅值dj i和ej i构成描述段x(n)的扩展
Figure C0180942900169
的正弦数据的幅值部分,从计算单元120’输出,以便与所述相位数据θk i一起合并成一个代表所述第一分量Ci(i=1)的数据流。另外,所述幅值数据dj i和ej i与它们各自的模式Pij 1和Pij 2一起输入一个综合器128’,用于按下面公式计算分量Ci(i=1)(见步骤g)):
C i = Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
所述分量Ci被输入一个减法单元129’,以便从输入所述估算单元122’的值εi-1中减去所述分量。所述减法单元129’输出端得到的差值被记为εi(i=1)(见步骤h))。
现在,用于为扩展
Figure C0180942900172
计算第一分量C1及其正弦代码数据θk i,dj i和ej i的第一循环已经结束。随后,将参数i与扩展
Figure C0180942900173
的分量Ci的总数L比较(见步骤I))。若i<L,则重复步骤c)到i),此时i=i+1。在这些情况下,i≥1时分段单元110’的输出与频率估算单元122’的输入断开;所述频率估算单元122’的输入与所述减法单元129’的输出相连,用于接收差值εi。不过,若i≥L,则扩展
Figure C0180942900174
的所有L个分量的正弦代码数据都已计算完毕。因此,对一个特定的段
Figure C0180942900175
计算单元120’执行的计算过程完成。随后,为输入音频或语音信号的下一个段重复整个过程。
图4显示了一个参数译码器400,用于由所接收的输入数据恢复一个音频或语音信号s的近似
Figure C0180942900176
这些所接收的输入信号相应于被发射之后或从存储介质中恢复之后的一个数据流的数据。
参数译码器400包含一个选择单元420,用于从所述接收的输入数据中挑选代表音频或语音信号s的近似值
Figure C0180942900177
的段 的正弦代码数据θk i,dj i和ej i。参数译码器400还包含一个综合器440,用于由所述接收的正弦代码数据恢复所述段
Figure C0180942900179
和一个连结单元460,用于将重构的段
Figure C01809429001710
连结起来,重构近似值
Figure C01809429001711
应指出,上面提到的实例仅仅起举例说明的作用,并不限定本发明,本技术专业人员可以不脱离附加权利要求的范围,设计出许多不同的实例。在权利要求中,括号中的任何参考符号并不限定权利要求。“包含”一词并不排除出现与权利要求中所列出的元件和步骤不同的元件和步骤的可能性。本发明可由包含若干分立元件的硬件实现,也可通过适当编程的计算机实现。在一个列举了若干装置的设备权利要求中,这些装置中的若干个装置可由同一硬件实现。一些措施是在互不相同的独立权利要求中指出的,则并不表明不能将这些措施组合起来。

Claims (12)

1.一种参数编码器(100,100’),用于将一个音频或语音信号s编码为正弦代码数据,该编码器包括:
-一个分段单元(110,110’),用于将所述信号s分为至少一个段x(n);
-一个计算单元(120,120’),用于由段x(n)计算所述正弦代码数据,该数据的形式为一个给定扩展 的相位和幅值数据,以使得对于一个给定的规则来说,扩展
Figure C018094290002C2
尽可能好地近似段x(n);
该编码器的特点在于:
计算单元(120,120’)为以下的扩展
Figure C018094290002C3
计算正弦代码数据θk i,dj i和ej i
x ^ = Σ i = 1 L C i = Σ i = 1 L Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
并且:
Θ i ( n ) = Σ k = 1 K θ k i n k
其中:
i,j,k:代表参数;
n:代表一个离散时间参数;
Ci:代表扩展 的第i个分量;
L:代表正弦分量的总数;
θk i:代表作为所述正弦代码数据之一的相位系数值;
J:代表幅值的个数;
fj:代表J个线性无关函数组中的第j个实例;
Θi:是一个相位;
K:代表相位系数的个数;
dj i,ej i:代表描述所述正弦代码数据一些部分的分量的线性关联幅值。
2.权利要求1中的参数编码器,其特点在于fj(n)=nj
3.权利要求1中的参数编码器,其特点在于,计算单元(120)包含:
-一个频率估算单元(122),用于为扩展 的所有分量Ci确定多元L×K相位系数θk i,其中扩展
Figure C018094290002C8
代表所接收段x(n),i=1~L,k=1~K;
-一个模式生成单元(124),按照下式,由相位系数θk i计算L个相位Θi(n),其中i=1~L:
Θ i ( n ) = Σ k = 1 K θ k i n k
并按照下面公式为分量Ci计算多元的J×L模式对Pij 1,Pij 2
P ij 1 = f j ( n ) cos ( Θ i ( n ) ) P ij 2 = f j ( n ) sin ( Θ i ( n ) ) ,
其中i=1~L且j=0~(J-1);
-一个幅值估算单元(126),为扩展 的所有分量Ci的模式Pij 1确定多元J×L幅值dj i,并为模式Pij 21确定多元J×L幅值ej i
-这里,对于段x及其扩展 之间的加权平方和最小这一规则来说,正弦数据θk i,dj i和ej i是最优的。
4.权利要求1中的参数编码器,其特点在于,一个多路复用器(130)用于将所述正弦代码数据合并为一个数据流。
5.权利要求1中的参数编码器,其特点在于,计算单元(120’)包含:
-一个频率估算单元(122’),用于由一个输入值εi-1为分量Ci确定多元K个相位系数θk i,k=1~K;其中,对于i=1时的第一个分量C1,输入值被设为ε0=x(n);
-一个模式生成单元(124’),按照下式,由所述多元相位系数θk i为分量Ci计算相位Θi
Θ i ( n ) = Σ k = 1 K θ k i n k
并按照下面公式为分量Ci生成多元的2×J模式Pij 1,Pij 2,其中,j=1~L:
P ij 1 = j ( n ) cos ( Θ i ( n ) ) P ij 2 = f j ( n ) sin ( Θ i ( n ) )
-一个幅值估算单元(126’),由所接收的段x(n)和所接收的多元模式Pij 1,Pij 2,为分量Ci的所述模式确定J个幅值dj i和J个幅值ej i
-一个综合器(128’),按照以下公式,由所述多元2×J模式Pij 1,Pij 2和多元幅值dj i和ej i重构分量Ci
C i = Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
-一个减法单元(129’),从输入值εi-1中减去所述分量Ci,以便将所得到的差值εi前馈到频率估算单元(122’)的输入端,作为一个新的输入值,用来计算代表分量Ci+1的正弦代码数据;
这里,对于段x及其扩展 之间的加权平方和最小这一规则来说,正弦数据θk i,dj i和ej i是最优的。
6.一种参数编码方法,用于将一个音频或语音信号s编码为正弦代码数据,该方法包括以下步骤:
-将所述信号s分为至少一个段x(n);
-由段x(n)计算所述正弦代码数据,该数据的形式为一个给定扩展
Figure C018094290004C2
的相位和幅度数据,以使得对于一个给定的规则来说,扩展
Figure C018094290004C3
尽可能好地近似段x(n);其特点在于
-扩展 被定义为:
x ^ = Σ i = 1 L C i = Σ i = 1 L Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
并且:
Θ i ( n ) = Σ k = 1 K θ k i n k
其中:
i:代表扩展
Figure C018094290004C7
的一个分量Ci
j,k:代表参数;
n:代表一个离散时间参数;
Ci:代表扩展
Figure C018094290004C8
的第i个分量;
L:代表正弦分量的总数;
J:代表幅值的个数;
fj:代表J个线性无关函数组中的第j个实例;
θk i:代表作为所述正弦代码数据之一的相位系数值;
Θi:是一个相位;
K:代表相位系数的个数;
dj i,ej i:表示代表所述正弦代码数据幅值部分的分量的线性关联幅值。
7.权利要求6中的方法,其特点在于fj(n)=nj
8.权利要求6中的方法,其特点在于,通过取扩展
Figure C018094290004C9
频域内的峰值频率来定义频率θk i
9.权利要求6中的方法,其特点在于,为满足段x及其扩展 之间的加权平方和最小这一规则,定义最佳幅值dj i和ej i的步骤包含以下步骤:
-为所接收段x(n)的所有分量Ci确定多元L×K相位系数θk i,其中i=1~L,k=1~K;
-按照下式,由相位系数θk i计算多元L个相位Θi(n):
Θ i ( n ) = Σ k = 1 K θ k i n k
-并按照下面公式,为分量Ci生成多元的J×L模式对Pij 1,Pij 2,其中i=1~L:
P ij 1 = f j ( n ) cos ( Θ i ( n ) ) P ij 2 = f j ( n ) sin ( Θ i ( n ) )
-为扩展
Figure C018094290005C4
的所有分量Ci的所有模式对Pij 1,Pij 2确定多元J×L幅值dj i和多元J×L幅值ej i
10.权利要求6中的方法,其特点在于,为满足段x及其扩展 之间的加权平方和最小这一规则,定义幅值dj i和ej i的步骤包含以下步骤:
a)令i=1;
b)εi-1=ε0=x(n);
c)由一个输入值εi-1,为分量Ci确定一组K个相位系数θk i,其中k=1~K;
d)按照下式,由所述多元相位系数θk i,为分量Ci计算相位Θi
Θ i ( n ) = Σ k = 1 K θ k i n k
e)按照下面公式,为分量Ci生成一组2×J模式Pij 1,Pij 2,其中j=0~(J-1):
P ij 1 = f j ( n ) cos ( Θ i ( n ) ) P ij 2 = f j ( n ) sin ( Θ i ( n ) )
f)由所接收的段x(n)和所接收的多元模式Pij 1,Pij 2,为分量Ci的所述模式确定J个幅值dj i和J个幅值ej i
g)按照以下公式,由所述多元J对模式Pij和多元幅值dj i和ej i重构分量Ci
C i = Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
h)从输入值εi-1中减去所述分量Ci,计算一个差值εi
i)检查是否i≥L;
j)若i<L,使i=i+1,从步骤c)开始,重复以上方法步骤;
k)若i≥L,则扩展
Figure C018094290006C1
的所有L个分量的正弦代码数据都已计算完毕,因此,过程结束。
11.一种参数译码器(400),用于由发射或恢复的代码数据重构一个音频或语音信号s的近似值,包括:
-包含一个选择单元(420),用于从所述发射或恢复的代码数据中挑选正弦代码数据,这些正弦代码数据代表近似值的段
Figure C018094290006C2
-一个综合器(440),用于由所述接收的正弦代码数据重构所述段
-一个连结单元(460),用于连接连续的段
Figure C018094290006C4
以形成所述音频或语音信号s的近似;
这里,该正弦代码数据是所述段
Figure C018094290006C5
的至少一个分量的一组频率和幅度值;其特点在于
-其综合器用于按下面公式,由所述正弦代码数据重构所述段
x ^ = Σ i = 1 L C i = Σ i = 1 L Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
Θ i ( n ) = Σ k = 1 K θ k i n k
其中:
i:代表扩展 的一个分量Ci
j,k:代表参数;
n:代表一个离散时间参数;
Ci:代表扩展
Figure C018094290006C10
的第i个分量;
L:代表正弦分量的总数;
J:代表幅值的个数;
fj:代表J个线性无关函数组中的第j个实例;
θk i:代表作为所述正弦代码数据之一的相位系数值;
Θi:是一个相位;
K:代表相位系数的个数;
dj i,ej i:表示代表所述正弦代码数据幅值部分的分量的线性关联幅值。
12.一种用于由发射或恢复的代码数据重构一个音频或语音信号s的近似值的译码方法,包括从所接收的发射或恢复代码数据中挑选代表近似值的段 的正弦代码数据的步骤:
-由所述正弦代码数据重构所述段
-将连续的段
Figure C018094290007C3
连接在一起,以生成该音频或语音信号s的近似值;
-其中,该正弦代码数据是所述扩展
Figure C018094290007C4
的至少一个分量的一组频率和幅度值;其特点在于
-在所述重构步骤中,按下面公式,由所述正弦代码数据重构所述段
x ^ = Σ i = 1 L C i = Σ i = 1 L Σ j = 0 J - 1 [ d j i f j ( n ) cos ( Θ i ( n ) ) + e j i f j ( n ) sin ( Θ i ( n ) ) ]
Θ i ( n ) = Σ k = 1 K θ k i n k
其中:
i:代表扩展
Figure C018094290007C8
的一个分量Ci
j,k:代表参数;
n:代表一个离散时间参数;
Ci:代表扩展
Figure C018094290007C9
的第i个分量;
L:代表正弦分量的总数;
J:代表幅值的个数;
fj:代表J个线性无关函数组中的第j个实例;
θk i:代表作为所述正弦代码数据之一的相位系数值;
Θi:是一个相位;
K:代表相位系数的个数;
dj i,ej i:表示代表所述正弦代码数据幅值部分的分量的线性关联幅值。
CNB018094295A 2001-01-16 2001-12-20 参数编码器和参数编码方法及参数译码器和参数译码方法 Expired - Fee Related CN1293534C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP01200142.6 2001-01-16
EP01200142 2001-01-16
EP01202612 2001-07-06
EP01202612.6 2001-07-06

Publications (2)

Publication Number Publication Date
CN1429384A CN1429384A (zh) 2003-07-09
CN1293534C true CN1293534C (zh) 2007-01-03

Family

ID=26076810

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018094295A Expired - Fee Related CN1293534C (zh) 2001-01-16 2001-12-20 参数编码器和参数编码方法及参数译码器和参数译码方法

Country Status (6)

Country Link
US (1) US7050970B2 (zh)
JP (1) JP2004518163A (zh)
KR (1) KR100849375B1 (zh)
CN (1) CN1293534C (zh)
BR (1) BR0109237A (zh)
WO (1) WO2002056299A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7640156B2 (en) * 2003-07-18 2009-12-29 Koninklijke Philips Electronics N.V. Low bit-rate audio encoding
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
KR101435411B1 (ko) * 2007-09-28 2014-08-28 삼성전자주식회사 심리 음향 모델의 마스킹 효과에 따라 적응적으로 양자화간격을 결정하는 방법과 이를 이용한 오디오 신호의부호화/복호화 방법 및 그 장치
US9472199B2 (en) 2011-09-28 2016-10-18 Lg Electronics Inc. Voice signal encoding method, voice signal decoding method, and apparatus using same
CN106851482A (zh) * 2017-03-24 2017-06-13 北京时代拓灵科技有限公司 一种全景声扬声器体感实时交互***及交互方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1193159A (zh) * 1996-11-19 1998-09-16 索尼公司 语音编码译码方法和装置、电话装置、音调变换方法和介质
WO2000079519A1 (en) * 1999-06-18 2000-12-28 Koninklijke Philips Electronics N.V. Audio transmission system having an improved encoder

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4937873A (en) * 1985-03-18 1990-06-26 Massachusetts Institute Of Technology Computationally efficient sine wave synthesis for acoustic waveform processing
US6029126A (en) 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1193159A (zh) * 1996-11-19 1998-09-16 索尼公司 语音编码译码方法和装置、电话装置、音调变换方法和介质
WO2000079519A1 (en) * 1999-06-18 2000-12-28 Koninklijke Philips Electronics N.V. Audio transmission system having an improved encoder

Also Published As

Publication number Publication date
WO2002056299A1 (en) 2002-07-18
US20020156621A1 (en) 2002-10-24
BR0109237A (pt) 2002-12-03
KR20020084206A (ko) 2002-11-04
JP2004518163A (ja) 2004-06-17
CN1429384A (zh) 2003-07-09
KR100849375B1 (ko) 2008-07-31
US7050970B2 (en) 2006-05-23

Similar Documents

Publication Publication Date Title
CN1199151C (zh) 语音编码器
CN1201288C (zh) 解码方法和设备
CN101031960A (zh) 可扩展性编码装置和可扩展性解码装置及其方法
CN1126869A (zh) 语音编码和解码设备及其方法
CN1950883A (zh) 可伸缩性解码装置及增强层丢失的隐藏方法
CN1291375C (zh) 声信号编码方法和设备、解码方法和设备
CN1750124A (zh) 带限音频信号的带宽扩展
CN1750123A (zh) 多传感器语音增强的方法和装置
CN101044554A (zh) 可扩展性编码装置、可扩展性解码装置以及可扩展性编码方法
CN101034891A (zh) 基于cabac的编码方法和设备及解码方法和设备
CN101048814A (zh) 编码装置、解码装置、编码方法及解码方法
CN1816848A (zh) 通过增加噪声改善解码音频的质量
CN1977311A (zh) 语音编码装置、语音解码装置及其方法
CN1297222A (zh) 信息处理设备、方法和记录媒体
CN1684450A (zh) 接收机、发送机和无线通信***及信道估计方法
CN101044552A (zh) 语音编码装置和语音编码方法
CN1174457A (zh) 语音信号传输方法及语音编码和解码***
CN1293534C (zh) 参数编码器和参数编码方法及参数译码器和参数译码方法
CN1161750C (zh) 语音编码译码方法和装置、电话装置、音调变换方法和介质
CN1112672C (zh) 多脉冲分析语言处理***及其方法
CN1684519A (zh) 运动图像编码装置及方法、运动图像译码装置及方法
CN1145925C (zh) 具有改进语音编码器和解码器的发射机
CN1276407C (zh) 立体声音频编码方法及装置,音频流解码方法及装置
CN1489417A (zh) 麦克风-扬声器设备
CN1967594A (zh) 一种自适应的扩展变换抖动调制水印方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: PENDRAGON WIRELESS CO., LTD.

Free format text: FORMER OWNER: IPG ELECTRONICS 503 LTD.

Effective date: 20130114

Owner name: IPG ELECTRONICS 503 LTD.

Free format text: FORMER OWNER: KONINKLIJKE PHILIPS ELECTRONICS N.V.

Effective date: 20130114

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130114

Address after: Washington State

Patentee after: Pendragon wireless LLC

Address before: British Channel Islands

Patentee before: IPG Electronics 503 Co.,Ltd.

Effective date of registration: 20130114

Address after: British Channel Islands

Patentee after: IPG Electronics 503 Co.,Ltd.

Address before: Holland Ian Deho Finn

Patentee before: KONINKLIJKE PHILIPS ELECTRONICS N.V.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070103

Termination date: 20141220

EXPY Termination of patent right or utility model