CN108701466B - 使用预测器模型的信号编码器、解码器和方法 - Google Patents
使用预测器模型的信号编码器、解码器和方法 Download PDFInfo
- Publication number
- CN108701466B CN108701466B CN201680081725.5A CN201680081725A CN108701466B CN 108701466 B CN108701466 B CN 108701466B CN 201680081725 A CN201680081725 A CN 201680081725A CN 108701466 B CN108701466 B CN 108701466B
- Authority
- CN
- China
- Prior art keywords
- segment
- sample
- signal
- reconstructed
- prediction error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 31
- 238000009825 accumulation Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 101100412093 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rec16 gene Proteins 0.000 description 1
- 101100421134 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sle1 gene Proteins 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3059—Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
- H03M7/3064—Segmenting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种信号编码器,将信号分成片段并使用预测模型来对每个片段的样本进行近似。各自适用于一个片段的每个局部预测模型在片段内应用于其自己的平移轴***中,并且偏移量由先前片段的最后一个预测值给出。当信号合理地连续时,这减少了对每个局部预测器模型的偏移量进行参数化的需要,因为每个局部预测器模型可以建立在先前片段的最后一个预测的样本值上。因此,即使不发送偏移量,而是代替地使用先前片段的最后一个样本的最后一个预测值,编码器也不会遭受误差累积。为近似样本获得预测误差并将该预测误差与预测器模型参数和种子值一起发送到解码器,以允许解码器准确地重建信号。
Description
技术领域
本发明涉及一种信号编码器,包括用于接收包括帧的信号的输入端,每个帧包括顺序样本;以及用于提供编码信号的输出端;信号编码器还包括分段器,该分段器包括用于接收信号并且被布置用于将帧的顺序样本分段成包括n个顺序样本的片段的输入端;近似器,包括用于接收来自分段器的片段和种子值的输入端以及用于向编码器的输出端提供编码信号的输出端,该编码信号针对每个片段包括预测器模型参数集合,近似器被布置为从具有第一种子值的第一种子样本开始对第一片段进行近似并通过使用第一预测器模型对第一片段的n个顺序样本进行近似来确定第一预测器模型参数集合,随后从具有第二种子值的第二种子样本开始对在第一片段之后的第二片段进行近似并通过使用第二预测器模型对第二片段的n个顺序样本进行近似来确定第二预测器模型参数集合。
背景技术
这种信号编码器可从Yinghua Yang等的“An application of the piecewiseautoregressive model in lossless audio coding”,Norsig 2006,http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.330.2413&re p=rep1&type=pdf中获知。
这种编码器的缺点在于,对于每个片段,必须获得种子值,并且这通过使用来自先前帧的样本来预测当前帧的第一个样本来实现。然而这导致了预测误差的累积。
发明内容
为了克服这个缺点,编码器的特征在于第二种子值等于第一片段的最后一个样本n的近似值。每个线性预测模型应用于其自己的平移轴***中,并且偏移量由先前片段的最后一个样本的最后一个预测值给出。如果像通常那样使用先前片段的最后一个样本的值,则引入了不连续性,因为先前片段的最后一个样本的最后一个预测值与先前片段的最后一个样本的值略有不同,即,在片段的每个开始处,以不连续的形式引入误差,从而导致在编码过程中可能累积不期望的偏移量。使用先前片段的最后一个样本的最后一个预测值代替先前片段的最后一个样本的值保持该预测误差的累积处于控制之下。
在实施例中,信号编码器还包括预测器模型参数聚类器(clusterer),该预测器模型参数聚类器被布置为将预测器模型参数聚类成围绕预测模型参数聚类中心的预测器模型参数聚类,并且其中要针对每个片段提供给信号编码器的输出端的预测模型参数是预测模型参数与该片段对应地被聚类到的预测模型参数聚类中心。
预测模型参数聚类有效地在预测器模型参数的有限集合内量化预测器模型参数,因此随着预测器模型参数的可压缩性大大增强而减少数据。例如,代替发送每个预测器模型参数,仅必须发送预测器模型参数聚类中心的索引。这导致更少数据被发送、分别被存储。
信号编码器的实施例包括误差近似器,该误差近似器被布置为确定要被校正的每个样本的预测误差,预测误差是样本的样本值与所述样本的近似样本值之间的差,并且其中误差近似器还包括输出端,用于将要校正的每个样本的预测误差提供给信号编码器的输出端。
预测器模型的使用和预测器模型参数的聚类都在重建时在近似样本值中引入误差。由于这种预测误差在编码器侧是已知的,因为它由编码器引入,因此预测误差可以被包括在编码信号中,因此解码器可以在重建信号时校正预测误差。虽然需要附加的带宽用于发送预测误差,但是重建信号的质量大大提高。可替代地,预测误差可以用于允许使用不太准确的预测器模型,同时通过校正不太准确的预测来维持重建信号的质量。
在实施例中,信号编码器包括误差聚类器,该误差聚类器被布置为将由误差近似器确定的预测误差聚类成围绕误差聚类中心的预测误差聚类,并且其中针对要校正的每个样本要为信号编码器的输出端提供的预测误差是与要校正的每个样本的预测误差对应的误差聚类中心。
就像预测器模型参数,可以通过将预测误差聚类成预测误差聚类来压缩预测误差,每个聚类具有聚类中心。这有效地以较低的分辨率量化预测误差,从而减少带宽,因为需要发送较少的数据。
在进一步实施例中,信号编码器包括误差聚类器,该误差聚类器被布置为将由误差近似器确定的预测误差聚类成围绕误差聚类中心的预测误差聚类,并且其中针对要校正的每个样本要为信号编码器的输出端提供的预测误差与要校正的每个样本的预测误差对应的误差聚类中心的索引。
使用索引允许数据速率的进一步降低,从而降低所需的带宽。仅需要发送一次聚类中心集合,之后指向聚类中心集合中的中心的索引足以使解码器选择适当的预测误差。
在进一步实施例中,信号编码器是多信道信号编码器,并且其中误差聚类器被布置为将来自多个信道的预测误差聚类成单个误差聚类中心集合。
这允许对所有信道使用共同的预测误差聚类中心集合,从而提高效率。令人惊讶地发现,使用共同的预测误差聚类中心集合不会引入显著更大的误差,因此仍然允许以足够的质量重建信号。
根据本发明的信号解码器包括用于接收包括种子值的编码信号和表示信号的片段的预测器模型参数集合的输入端,以及用于提供解码信号的输出端,该信号解码器还包括重建器,该重建器包括用于从解码器输入端接收种子值和预测器模型参数的输入端,以及用于提供包括重建样本的重建片段的重建器输出端,每个重建样本具有重建样本值,重建器被布置为通过使用第一种子值和第一预测器模型参数集合来计算第一片段的每个重建样本的重建样本值(recon(1)…recon(n))来重建第一片段,并且通过使用第二种子值和第二预测器模型参数集合来计算在第一片段之后的第二片段的每个重建样本的重建样本值(recon(n+1)…recon(n+n))来重建第二片段;定序器,具有用于接收来自重建器的第一片段和第二片段的定序器输入端,定序器被布置用于通过将第二重建片段的重建样本附加到第一重建片段的重建样本来构建解码信号并将所得的解码信号提供给信号解码器的输出端,其中第二种子值等于第一片段的最后一个重建样本值。
这种信号解码器使用先前片段的最后一个重建样本值来使用接收到的预测模型参数开始重建。每个线性预测模型应用于其自己的平移轴***中,并且偏移量是根据先前片段的最后一个样本的最后一个重建值确定的。以这种方式,不必接收每个预测器模型的偏移,从而节省带宽/存储要求。
信号解码器的实施例包括误差补偿器,该误差补偿器被布置为对于每个重建的样本将对应的预测误差添加到重建样本的重建样本值。
对于要重建的要校正的每个样本,接收预测误差并将其添加到使用由接收到的预测模型参数确定的预测模型来重建的样本的值。这增加了重建信号的保真度,因为通过使用预测模型的近似而引入的误差减小了。
在信号解码器的实施例中,要添加的预测误差是误差聚类中心。
通过将预测误差聚类成预测误差聚类来压缩预测误差,在编码器侧具有聚类中心的每个聚类可以用于校正重建样本。这有效地以较低分辨率量化预测误差,从而减少带宽,因为需要发送较少的数据,但仍然供应重建信号保真度的良好改善,即,重建信号与原始信号更紧密匹配。
在信号解码器的实施例中,误差补偿器被布置为对于每个重建样本,从信号解码器的输入端接收与误差聚类中心集合对应的索引,并且其中误差补偿器还被布置为选择要被添加到由接收到的对应索引指示的误差聚类中心集合的重建样本的重建样本值的误差聚类中心。
使用索引来允许数据速率的进一步降低,从而降低所需带宽。仅需要发送一次聚类中心集合,之后到聚类中心集合中的中心的索引足以使解码器选择适当的预测误差。
在信号解码器的实施例中,信号解码器是多信道信号解码器,并且误差补偿器被布置为使用一个误差聚类中心集合用于多个信道。
仅需要接收单个聚类中心集合,从而减少了要发送的数据量,从而允许使用更少的带宽或降低的数据速率。
根据本发明的记录设备具有与其包括的编码器相同的益处。
根据本发明的回放设备具有与其包括的解码器相同的益处。
根据本发明的计算机可读存储介质更高效地使用可用存储空间,因为可以存储更长持续时间的信号,或者可以将更多信道存储在相同存储介质上。存储介质可以是基于光学、磁性或固态的。
分片预测模型描述给定尺寸(整数或浮点)的采样实值时间依赖信号。可以在单次通过中从输入信号高效地学***衡,这使其适于例如音频压缩。由于信号被划分成片段并逐段处理,因此预测误差不随时间降级并且,取决于局部预测器模型类的选择,可以利用熵编码方法(例如,Golomb-Rice或Huffman)高效地对预测模型参数进行编码。分片预测模型对于每个分段对局部预测模型参数中的误差敏感;这些都需要无损编码。
该模型将这个范围[0,N-1]细分为尺寸为n的片段,从第二个采样值(t=1)开始。对于每个片段i,分片预测模型包含局部预测模型lpmi
给定先前片段的最后一个值,应用该模型生成对应片段的n个样本:
ppm(0)=signal(0)
ppm(t)=ppm(st(t))+lpmst(t)/n(t-st(t)),t>0.
st(t)=0,t∈[1,3],n=3
st(t)=3,t∈[4,6],n=3
st(t)=6,t∈[7,9],n=3
…
各自适用于一个片段的每个局部预测模型在其自己的平移轴***中应用于t∈[1,n]和由先前片段的最后一个预测值给出的偏移量。假设信号是合理连续的,则不需要对用于每个局部预测器模型的偏移量进行参数化,因为每个局部预测器模型可以建立在先前片段的这个最后预测的ppm(st(t))上。
二次局部预测器模型看起来像qpm(t)=at+bt2,但优选的是将其参数化为qpm(t)=at+bt(tζ1)/2。后者具有清晰的过滤器解释,其中下一个值被预测为用某个增量d递增的先前值。最初地,这个增量d被设置为a,但增量值本身在每次预测后用b调整:
qpm(0):=ppm(st),d:=a
qpm(1)=qpm(1-1)+d,d=d+b
qpm(2)=qpm(2-1)+d,d=d+b
…
qpm(i)=qpm(i-1)+d,d=d+b
…
这导致
这是t中的二阶多项式。
为了了解后续预测模型的参数,重要的是要考虑重建。训练每个局部预测器模型以近似本地时间t∈[1,n]与变换后的信号样本signal(t)-ppm(st(t))之间的映射。信号用signal(t)-ppm(st(t))(先前片段的预测的最后一个值)进行变换,而不是用对应的原始信号值变换,以保持预测误差累积处于控制之下。
为了研究更多细节(参见附图):帧的第一个样本称为种子,并且用于变换接下来的n个样本(t∈[1,n]),这些样本用于学习第一局部预测模型lpm0。第二预测模型lpm1在接下来的n个样本(t∈[n+1,2n])上进行训练,但这次用lpm0(n)进行变换。我们为后续的预测模型继续这个过程,并在需要时为最后一个模型应用适当的填充(padding)。
要注意的是,预测器模型的示例是多项式函数,并且在该情况下预测器模型参数是多项式函数参数。
每当本描述提到数据的传输时,都应当将此理解为还包括诸如预测器模型参数和种子值的存储数据。当要发送/存储的数据量减少时,传输和数据存储同样受益于本发明。
有时所有样本需要校正在预测处理期间由近似引入的预测误差,但是取决于在近似处理中做出的选择,仅一些样本需要校正,因为模型可以以例如最后一个样本具有可忽略的预测误差的方式被使用。以该种方式,不需要为该最后一个样本提供预测误差或者指向预测误差聚类中心的索引。当选择模型以准确反映原始样本时,对于片段的第一个样本,这同样有效。当使用预测模型使得片段的第一个和最后一个样本被准确近似而没有显著误差时,仅需要确定和发送针对该片段的剩余样本的预测误差。对于具有4个样本的片段,实现了要发送的预测误差减少50%。
附图说明
现在将基于附图描述本发明。
图1示出了应用于信号的分段预测模型。
图2示出了编码器。
图3示出了解码器。
图4示出了编码方法。
图5示出了解码方法。
具体实施方式
图1示出了应用于信号的分片预测模型
虽然n可以具有任何值,但是在图1中使用值n=3。
帧的第一个样本1被称为种子,并且用于对接下来的n个样本(t∈[1,n])进行变换,这些样本用于学习第一局部预测模型lpm0。第二预测模型lpm1在接下来的n个样本(t∈[n+1,2n])上进行训练,但这次使用lpm0(n)作为种子。为后续的预测模型lpm2继续这个过程。如果需要,则为最后一个模型应用适当的填充。
对于线性和二次模型类,训练由最小化组合的二次预测误差组成,组合的二次预测误差与用二次成本函数拟合回归模型对应。分片预测模型被用作音频信号的第一近似,并且稍后可以通过添加预测误差的校正来改善其质量。在图2中,对于第一样本1不存在预测误差,因为原始样本1与近似样本1a之间不存在差异。对于第二样本和第三样本,存在预测误差,如图所示,因为在原始样本2、3与近似样本2a、3a之间的值存在差异。对于n=3,将需要每个片段3个纠错增量。
由于先前片段的最后一个样本的近似值被用作下一个片段的种子,因此在片段之间将不存在偏移量形式的不连续性。可以通过发送用于每个片段的偏移量校正来对抗这种偏移量,但这将是不期望的,因为它将被添加到需要被存储或发送的数据量。
为了进一步降低比特速率,使用向量量化技术来近似这些纠错增量:纠错增量(预测误差)被聚类,并且仅聚类中心被发送。此外,有可能仅发送对聚类中心的索引而非聚类中心本身。可选地,仅保留和发送每个片段的待使用聚类。三维聚类在音质方面给出次优结果,这就是在二次模型训练期间使用额外限制的原因:二次模型需要确切地对片段的最后一个样本的最后一个值进行近似:
S3:=signal(3)-seed
=qpm(3)
=3a+3b
这给出
a=S3/3-b
这在图1中被示出:第一片段seg0的最后近似的样本4a以及第二片段seg1的最后近似的样本7a等于它们分别对应的原始最后样本4、7。
这种确切的近似具有附加的益处,即,不需要针对这最后一个样本发送预测误差,从而降低了带宽要求,因为三个样本中仅有2个需要预测误差传输。
以下将从公式中省略种子偏移量。则二次误差变为:
error=(qpm(1)-S1)2+(qpm(2)-S2)2+(qpm(3)-S3)2
=(a-S1)2+(2a+b-S2)2+(0)2
=(S3/3-b-S1)2+(2S3/3-2b+b-S2)2+(0)2
=(b+S1-S3/3)2+(b+S2-2S3/3)2
并且当关于b的导数变为0时,找到二处误差的最小值:
0=2(b+S1-S3/3)+2(b+S2-2S3/3)
0=b+S1-S3/3+b+S2-2S3/3
0=2b+S1+S2-S3
这给出了
a=S3/3ζb
和
b=(-S1-S2+S3)/2 or
最后一个公式表示b系数作为差异的差异,这与其二次解释对应。
该模型由用于预测模型的种子值和模型参数完整地描述。为了进一步限制比特速率,多项式模型的参数(常常也被称为多项式模型的系数)可以用取自集合的值来近似,其中缩放器s控制近似的量化精度。照此,缩放器s需要和与不同模型参数对应的不同k值一起被描述一次(因为它被认为在帧上是恒定的)。要注意的是,预测值将与上述学习过程中的这些近似系数sk结合使用,以确保重建不会遭受误差累积。
图2示出了编码器
信号编码器20包括用于接收包括帧的信号的输入端20a,每个帧包括顺序样本,以及用于提供编码信号的输出端20b,信号编码器20还包括分段器23,分段器23包括用于接收信号并被布置用于将帧的顺序样本分段成包括n个顺序样本的片段的输入端23a以及近似器24,近似器24包括用于从分段器23接收片段和种子值的输入端24a以及用于向编码器20的输出端20b提供编码信号的输出端24b,该编码信号包括针对每个片段的预测器模型参数集合,近似器24被布置为从具有第一种子值的第一种子样本开始对第一片段进行近似并通过使用第一预测器模型对第一片段的n个顺序样本进行近似来确定第一预测器模型参数集合,并且随后从具有第二种子值的第二种子样本开始对在第一片段之后的第二片段进行近似并通过使用第二预测器模型对第二片段的n个顺序样本进行近似来确定第二预测器模型参数集合,其中第二种子值等于第一片段的最后一个样本n的近似值。
应当注意的是,在图2中示出了可选组合器26。在不向编码器20的输出端20b提供预测误差的情况下,近似器24的输出端24b可以直接耦合到编码器20的输出端20b,从而省略组合器26。
但是,如果要使用预测误差来使解码器能够在信号的重建期间减少预测误差,则编码器包括误差近似器25,该误差近似器25被布置为针对要校正的每个样本确定预测误差,该预测误差是经由第一误差近似器输入端25a从分段器23接收的样本的样本值与经由第二误差近似器输入端25b从近似器24接收的所述样本的近似样本值之间的差异,并且其中误差近似器还包括用于将要校正的每个样本的预测误差提供给信号编码器的输出端或组合器26的输出端25c,组合器26随后将从近似器24接收的预测模型参数与从误差近似器25接收的预测误差进行组合。
在信号编码器被布置为通过压缩预测误差来进一步减少要发送的数据量的情况下,信号编码器包括误差聚类器28,该误差聚类器28被布置为将由误差近似器25确定的预测误差聚类成围绕误差聚类中心的预测误差聚类,并且其中,针对要校正的每个样本要提供给信号编码器的输出端20b或组合器26的预测误差是与要校正的每个样本的预测误差对应的误差聚类中心。
误差聚类器28可以可选地被布置为将由误差近似器确定的预测误差聚类成围绕误差聚类中心的预测误差聚类,并且针对要校正的每个样本向信号编码器的输出端提供对与要校正的每个样本的预测误差对应的误差聚类中心的索引。
在信号编码器是多信道信号编码器并且可以在多个编码器(针对每个信道的编码器)之间共享误差聚类器28的情况下,或者单个编码器可以并行地对多个信道进行编码。通过共享误差聚类器28,不仅只需要单个误差聚类器,而且来自多个信道的预测误差可以被聚类到单个误差聚类中心集合中,并且与所有信道的近似样本对应的索引指的是单个误差聚类中心集合,因此也降低了解码器侧的复杂性。
可替代地或并行地,信号编码器可以包括预测器模型参数聚类器29,该预测器模型参数聚类器29被布置为将从近似器24接收的预测器模型参数聚类成围绕预测模型参数聚类中心的预测器模型参数聚类,并且针对每个片段将与该片段对应的、预测模型参数被聚类到的预测模型参数聚类中心提供给信号编码器20的输出端20b或组合器26。在该情况下,预测模型参数不被提供给输出端20b或组合器26,并且仅虚线元件将近似器24连接到输出端20b或组合器26。
图3示出了解码器。
信号解码器30包括用于接收包括种子值的编码信号和表示信号的片段的预测器模型参数集合的输入端30a,以及用于提供解码信号的输出端30b。信号解码器30还包括重建器34,该重建器34包括用于从解码器输入端30a接收种子值和预测器模型参数的输入端34a,以及用于提供包括重建样本的重建片段的重建器输出端34b,每个重建样本具有重建样本值,重建器被布置为通过使用第一种子值和第一预测器模型参数集合来计算第一片段的每个重建样本的重建样本值(recon(1)…recon(n))来重建第一片段,并且通过使用第二种子值和第二预测器模型参数集合来计算在第一片段之后的第二片段的每个重建样本的重建样本值(recon(n+1)…recon(n+n))来重建第二片段;以及定序器36,具有用于从重建器34接收第一片段和第二片段的定序器输入端,定序器36被布置用于通过将第二重建片段的重建样本附加到第一重建片段的重建样本来构建解码信号并将所得的解码信号提供给信号解码器30的输出端30b,其中第二种子值等于第一片段的最后一个重建样本值。
为了提高信号保真度,信号解码器可以包括误差补偿器35,该误差补偿器35被布置为针对要校正的每个重建样本,将从信号解码器30的输入端30a接收的对应预测误差添加到重建样本的重建样本值。为此,误差补偿器35经由第一输入端35a从信号解码器30的输入端30a接收预测误差,并且经由第二输入端35b从重建器34接收片段中的对应重建样本。在将对应的预测误差合计(sum)到重建样本之后,误差补偿器25将片段中的误差补偿样本提供给定序器36。要注意的是,图3示出了定序器既从重建器34接收重建样本又从误差补偿器35接收误差补偿样本,但实际上仅提供一个,因为它们是不同的实施例,误差补偿器是可选的。
如果从误差补偿器35接收到误差补偿样本,则不需要重建样本,因为它们具有较低的信号保真度。
可选地,要添加的预测误差是误差聚类中心。为此,误差补偿器耦合到保持误差聚类中心的存储器38。当误差补偿器接收并索引参考存储器38中的误差聚类中心时,它从存储器中的误差聚类中心集合中检索与该索引对应的聚类中心值,并将其添加到索引与其对应的要校正的重建样本。
在信号解码器是多信道信号解码器的情况下,误差补偿器35和可选的存储器38可以在多个编码器之间共享,每个编码器处理不同的信道,或者单个解码器并行处理多个信道。这减少了对多个误差补偿器的需求,从而降低了解码器30的成本和复杂性。
图4示出了编码方法。
编码方法对包括帧的信号进行编码,每个帧包括到编码信号中的顺序样本。
在第一步骤40中,帧的顺序样本被分段成包括n个顺序样本的片段。
随后在第二步骤41中,从具有第一种子值的第一种子样本开始,使用预测模型来对第一片段的样本进行近似。这种近似的结果是通过使用第一预测器模型找出最佳预测第一片段的n个顺序样本的预测模型参数而获得的第一预测器模型参数集合。
随后在第三步骤42中,预测第二片段的样本,但是在这种情况下,从具有第二种子值的第二种子样本开始,该第二种子样本值等于在第二步骤41中获得的第一片段的最后一个样本的预测值。以这种方式,第二预测器模型参数集合是通过使用第二预测器模型找出导致对第二片段的n个顺序样本的最佳预测的那些预测器模型参数来获得的。
要注意的是,预测值将在上面的步骤42中与这些近似模型参数sk结合使用以确保重建不会遭受误差累积。
在第四步骤43中,根据包括种子值的预定义格式构建编码信号,并且预测模型参数被提供给编码器的输出端用以发送或存储。
在第三步骤42和第四步骤43之间,可以引入将预测器模型参数聚类成围绕预测模型参数聚类中心的预测器模型参数聚类的可选步骤,并且其中将被包括在每个片段的编码信号中的预测模型参数是与该片段对应的、预测模型参数被聚类到的预测模型参数聚类中心。由于在第二步骤41和第三步骤42中获得的预测器模型参数在这个时候是可用的,因此它们可以围绕聚类中心被聚类,并且这些聚类中心可以用于表示预测误差,从而允许数据量的压缩。
在第三步骤42和第四步骤43之间,可以引入另一个可选步骤来确定要校正的每个样本的预测误差,预测误差是样本的样本值与所述样本的预测样本值之间的差异,并且为要校正的每个样本提供预测误差用于被包括在编码信号中。
因为在这个时候在处理中原始样本和预测/近似样本都可用,所以它们之间的差异(预测误差)可以被确定并被提供给第四步骤43,其中编码信号是根据预定义格式构建的,包括种子值、预测器模型参数和预测误差。
通过将预测误差聚类成围绕误差聚类中心的预测误差聚类,并且为要校正的每个样本提供预测误差聚类中心或者指向与要校正的每个样本的预测误差对应的预测误差聚类中心的索引以被包括在编码信号中,还可以改进确定要校正的每个样本的预测误差的附加步骤。
图5示出了解码方法。
解码方法对包括种子值的编码信号和表示编码信号的片段的预测器模型参数集合进行解码。
在第一步骤50中,通过使用第一种子值和第一预测器模型参数集合来计算第一片段的每个重建样本的重建样本值(recon(1)…recon(n))来重建该第一片段。
在第二步骤51中,通过使用等于在第一步骤50中获得的第一片段的最后一个重建样本值的第二种子值和第二预测器模型参数集合计算第二片段的每个重建样本的重建样本值(recon(+1)…recon(n+n)),在第一片段之后重建第二片段。
在第三步骤52中,通过将第二重建片段的重建样本附加到第一重建片段的重建样本来构建解码信号。
通过在第三步骤52之后附加添加步骤,可以进一步改进解码方法,在添加步骤中,对于每个重建样本,将对应的预测误差添加到重建样本的重建样本值。预测误差可以是聚类预测误差,在这种情况下,仅需要预测误差聚类中心或指向该预测误差聚类中心的索引。
在第一步骤50和第二步骤51中,重建用于学习分片预测模型的原始信号归结为针对t∈[0,N-1]评估这个分片预测模型。分片预测模型等式
ppm(0)=signal(0)
ppm(t)=ppm(st(t))+lpmst(t)/n(t-st(t)),t>0
可以直接用于执行这种重建,从而产生重建信号。
这示出重建从种子值开始,并依次应用每个局部预测模型以生成重建的接下来的n个值:
recon(0)=seed
recon(1)=recon(0)+lpm0(1)
…
recon(n)=recon(0)+lpm0(n)
recon(n+1)=recon(n)+lpm1(1)
…
recon(n+n)=recon(n)+lpm1(n)
…
Claims (20)
1.一种信号编码器,包括:
-用于接收包括帧的信号的输入端,每个帧包括顺序样本,以及
-用于提供编码信号的输出端,
所述信号编码器还包括:
-分段器,包括用于接收所述信号并被布置用于将帧的所述顺序样本分段成包括n个顺序样本的片段的的输入端,
-近似器,包括用于接收来自分段器的片段和种子值的输入端,以及用于向所述信号编码器的所述输出端提供针对每个片段包括预测器模型参数集合的编码信号的输出端,
近似器被布置为从具有第一种子值的第一种子样本开始预测第一片段的样本,并且通过使用第一预测器模型对所述第一片段的所述n个顺序样本进行近似来确定第一预测器模型参数集合,并且随后从具有第二种子值的第二种子样本开始预测在所述第一片段之后的第二片段的样本,并且通过使用第二预测器模型预测所述第二片段的所述n个顺序样本来确定第二预测器模型参数集合,
其特征在于,所述第二种子值等于所述第一片段的最后一个样本n的预测值。
2.如权利要求1所述的信号编码器,其中所述信号编码器还包括
-预测器模型参数聚类器,被布置为将预测器模型参数聚类成围绕预测模型参数聚类中心的预测器模型参数聚类,并且其中针对每个片段要提供给所述信号编码器的所述输出端的所述预测模型参数是与该片段对应的、预测模型参数要被聚类到的预测模型参数聚类中心。
3.如权利要求1所述的信号编码器,还包括
-预测误差近似器,被布置为针对要校正的每个样本确定预测误差,所述预测误差是样本的样本值与所述样本的预测样本值之间的差异,并且其中所述预测误差近似器还包括输出端,用于将要校正的每个样本的预测误差提供给所述信号编码器的所述输出端。
4.如权利要求3所述的信号编码器,
其中所述信号编码器包括
-误差聚类器,被布置为将由所述预测误差近似器确定的所述预测误差聚类成围绕误差聚类中心的预测误差聚类,并且其中针对要校正的每个样本将被提供给所述信号编码器的所述输出端的所述预测误差是与要校正的每个样本的预测误差对应的误差聚类中心。
5.如权利要求3所述的信号编码器,
其中所述信号编码器包括
-误差聚类器,被布置为将由所述预测误差近似器确定的所述预测误差聚类成围绕误差聚类中心的预测误差聚类,并且其中针对要校正的每个样本将被提供给所述信号编码器的所述输出端的所述预测误差是指向与要校正的每个样本的预测误差对应的预测误差聚类中心的索引。
6.如权利要求4所述的信号编码器,
其中所述信号编码器是多信道信号编码器,并且其中所述误差聚类器被布置为将来自多个信道的预测误差聚类成单个误差聚类中心集合。
7.一种信号解码器,包括:
-用于接收包括种子值的编码信号和表示所述编码信号的片段的预测器模型参数集合的输入端,
-用于提供解码信号的输出端,
所述信号解码器还包括:
-重建器,包括用于从信号解码器的输入端接收种子值和预测器模型参数的输入端,以及用于提供包括重建样本的重建片段的重建器输出端,每个重建样本具有重建样本值,
所述重建器被布置为通过使用第一种子值和第一预测器模型参数集合计算第一片段的每个重建样本的重建样本值来重建所述第一片段,并且通过使用第二种子值和第二预测器模型参数集合计算在所述第一片段之后的第二片段的每个重建样本的重建样本值来重建所述第二片段,
-定序器,具有用于接收来自所述重建器的所述第一片段和所述第二片段的定序器输入端,所述定序器被布置用于通过将第二重建片段的重建样本附加到第一重建片段的重建样本来构建所述解码信号并将所得的解码信号提供给所述信号解码器的所述输出端,
其特征在于,所述第二种子值等于所述第一片段的最后一个重建样本值。
8.如权利要求7所述的信号解码器,包括
-预测误差补偿器,被布置为针对要校正的每个重建样本,将对应的预测误差添加到所述重建样本的所述重建样本值。
9.如权利要求8所述的信号解码器,
其中要添加的预测误差是误差聚类中心。
10.如权利要求8所述的信号解码器,
其中所述预测误差补偿器被布置为,针对要校正的每个重建样本,从所述信号解码器的所述输入端接收指向预测误差聚类中心集合的对应索引,并且其中所述预测误差补偿器还被布置为选择将被添加到根据由接收到的对应索引指示的所述预测误差聚类中心集合中要校正的重建样本的重建样本值的预测误差聚类中心。
11.如权利要求8所述的信号解码器,
其中所述信号解码器是多信道信号解码器,并且其中所述预测误差补偿器被布置为使用一个预测误差聚类中心集合用于多个信道。
12.一种记录设备,包括如权利要求1所述的信号编码器。
13.一种回放设备,包括如权利要求7所述的信号解码器。
14.一种用于对包括帧的信号进行编码的编码方法,
每个帧包括到编码信号中的顺序样本,
所述编码方法包括以下步骤:
-将帧的所述顺序样本分段成包括n个顺序样本的片段,
-从具有第一种子值的第一种子样本开始预测从分段器接收的第一片段的样本,并通过使用第一预测器模型预测所述第一片段的所述n个顺序样本来确定第一预测器模型参数集合,并且随后从具有第二种子值的第二种子样本开始预测在所述第一片段之后的从所述分段器接收的第二片段的样本,并通过使用第二预测器模型预测所述第二片段的所述n个顺序样本来确定第二预测器模型参数集合,
-将包括种子值和预测模型参数的编码信号输出到信号编码器的输出端,
其特征在于,所述第二种子值等于所述第一片段的最后一个样本的预测值。
15.如权利要求14所述的编码方法,其中所述编码方法还包括以下步骤:
-将预测器模型参数聚类成围绕预测模型参数聚类中心的预测器模型参数聚类,并且其中针对每个片段要被包括在所述编码信号中的所述预测模型参数是与该片段对应的、所述预测模型参数要被聚类到的预测模型参数聚类中心。
16.如权利要求14所述的编码方法,其中所述编码方法还包括以下步骤:
-针对要校正的每个样本确定预测误差,所述预测误差是样本的样本值与所述样本的预测样本值之间的差异,并且将要校正的每个样本的预测误差提供用于被包括在所述编码信号中。
17.如权利要求16所述的编码方法,
其中所述编码方法还包括以下步骤:
-将预测误差聚类成围绕误差聚类中心的预测误差聚类,并且针对要校正的每个样本提供与要校正的每个样本的预测误差对应的预测误差聚类中心用于被包括在所述编码信号中。
18.一种计算机可读存储介质,包括使用如权利要求14所述的编码方法获得的信号。
19.一种解码方法,用于对包括种子值和表示编码信号的片段的预测器模型参数集合的编码信号进行解码,
所述解码方法包括以下步骤:
-通过使用第一种子值和第一预测器模型参数集合计算第一片段的每个重建样本的重建样本值来重建所述第一片段,并且通过使用第二种子值和第二预测器模型参数集合计算在所述第一片段之后的第二片段的每个重建样本的重建样本值来重建所述第二片段,以及
-通过将第二重建片段的重建样本附加到第一重建片段的重建样本来构建解码信号,
其特征在于,所述第二种子值等于所述第一片段的最后一个重建样本值。
20.如权利要求19所述的解码方法,
所述解码方法还包括步骤:针对每个重建样本,将对应的预测误差添加到重建样本的重建样本值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15003698.6 | 2016-01-03 | ||
EP15003698 | 2016-01-03 | ||
PCT/EP2016/066981 WO2017118495A1 (en) | 2016-01-03 | 2016-07-15 | A signal encoder, decoder and methods using predictor models |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108701466A CN108701466A (zh) | 2018-10-23 |
CN108701466B true CN108701466B (zh) | 2023-05-02 |
Family
ID=55077324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680081725.5A Active CN108701466B (zh) | 2016-01-03 | 2016-07-15 | 使用预测器模型的信号编码器、解码器和方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US10530388B2 (zh) |
EP (1) | EP3398191B1 (zh) |
JP (1) | JP7082056B2 (zh) |
KR (1) | KR102595478B1 (zh) |
CN (1) | CN108701466B (zh) |
AU (1) | AU2016384679B2 (zh) |
BR (1) | BR112018013668A2 (zh) |
CA (1) | CA3045515A1 (zh) |
EA (1) | EA035903B1 (zh) |
IL (1) | IL260387A (zh) |
WO (1) | WO2017118495A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10911353B2 (en) | 2015-06-17 | 2021-02-02 | Extreme Networks, Inc. | Architecture for a network visibility system |
US20190385055A1 (en) * | 2018-06-14 | 2019-12-19 | Electronics And Telecommunications Research Institute | Method and apparatus for artificial neural network learning for data prediction |
KR102048661B1 (ko) * | 2019-08-21 | 2019-11-28 | 브이에스아이 주식회사 | 공유 버스를 통해 전송되는 데이터 신호에 대한 샘플링의 타이밍 오차를 신속하게 보상하는 방법과 그 방법을 위한 기기 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
CN1739142A (zh) * | 2002-12-24 | 2006-02-22 | 诺基亚有限公司 | 用于可变比特率语音编码中的线性预测参数的稳健预测向量量化的方法和设备 |
US8605588B2 (en) * | 2007-05-08 | 2013-12-10 | Cisco Technology, Inc. | Packet drop analysis for flows of data |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69233502T2 (de) | 1991-06-11 | 2006-02-23 | Qualcomm, Inc., San Diego | Vocoder mit veränderlicher Bitrate |
US6690307B2 (en) | 2002-01-22 | 2004-02-10 | Nokia Corporation | Adaptive variable length coding of digital video |
JP3807342B2 (ja) * | 2002-04-25 | 2006-08-09 | 三菱電機株式会社 | デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法 |
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
CN104978970B (zh) | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码*** |
-
2016
- 2016-07-15 AU AU2016384679A patent/AU2016384679B2/en not_active Expired - Fee Related
- 2016-07-15 CN CN201680081725.5A patent/CN108701466B/zh active Active
- 2016-07-15 KR KR1020187022444A patent/KR102595478B1/ko active IP Right Grant
- 2016-07-15 BR BR112018013668A patent/BR112018013668A2/pt not_active Application Discontinuation
- 2016-07-15 CA CA3045515A patent/CA3045515A1/en not_active Abandoned
- 2016-07-15 EP EP16744682.2A patent/EP3398191B1/en active Active
- 2016-07-15 EA EA201891568A patent/EA035903B1/ru unknown
- 2016-07-15 WO PCT/EP2016/066981 patent/WO2017118495A1/en active Application Filing
- 2016-07-15 JP JP2018534975A patent/JP7082056B2/ja active Active
- 2016-07-15 US US16/068,016 patent/US10530388B2/en active Active
-
2018
- 2018-07-03 IL IL260387A patent/IL260387A/en unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1739142A (zh) * | 2002-12-24 | 2006-02-22 | 诺基亚有限公司 | 用于可变比特率语音编码中的线性预测参数的稳健预测向量量化的方法和设备 |
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US8605588B2 (en) * | 2007-05-08 | 2013-12-10 | Cisco Technology, Inc. | Packet drop analysis for flows of data |
Non-Patent Citations (1)
Title |
---|
《An Application of the Piecewise Autoregressive Model in Lossless Audio Coding》;Yinghua Yang et al.;《NORSIG 2006》;20060609;第326-329页 * |
Also Published As
Publication number | Publication date |
---|---|
CA3045515A1 (en) | 2017-07-13 |
KR20180108643A (ko) | 2018-10-04 |
KR102595478B1 (ko) | 2023-10-27 |
EP3398191A1 (en) | 2018-11-07 |
US10530388B2 (en) | 2020-01-07 |
EA201891568A1 (ru) | 2019-01-31 |
AU2016384679A1 (en) | 2018-08-23 |
US20190028114A1 (en) | 2019-01-24 |
BR112018013668A2 (pt) | 2019-01-22 |
AU2016384679B2 (en) | 2022-03-10 |
WO2017118495A1 (en) | 2017-07-13 |
EP3398191B1 (en) | 2021-04-28 |
JP2019505840A (ja) | 2019-02-28 |
IL260387A (en) | 2018-10-31 |
JP7082056B2 (ja) | 2022-06-07 |
EA035903B1 (ru) | 2020-08-28 |
CN108701466A (zh) | 2018-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7260509B2 (ja) | スペクトルエンベロープのサンプル値のコンテキストベースエントロピー符号化 | |
KR100469002B1 (ko) | 오디오 코딩 방법 및 장치 | |
US8311815B2 (en) | Method, apparatus, and program for encoding digital signal, and method, apparatus, and program for decoding digital signal | |
US7885819B2 (en) | Bitstream syntax for multi-process audio decoding | |
KR101726205B1 (ko) | 감소된 복잡성 변환기 snr 계산 | |
US20100054279A1 (en) | Adaptive, scalable packet loss recovery | |
US8457958B2 (en) | Audio transcoder using encoder-generated side information to transcode to target bit-rate | |
CN108701466B (zh) | 使用预测器模型的信号编码器、解码器和方法 | |
CN114270854A (zh) | 用于视频译码技术的经修改上取样 | |
GB2600618A (en) | Quantization of residuals in video coding | |
US8525706B2 (en) | Method and apparatus for encoding and decoding data | |
EP1310943B1 (en) | Speech coding apparatus, speech decoding apparatus and speech coding/decoding method | |
EP3056002A2 (en) | Method for encoding and decoding a media signal and apparatus using the same | |
KR20220044857A (ko) | 스테레오 신호 인코딩 방법 및 인코딩 장치 | |
KR102353050B1 (ko) | 스테레오 신호 인코딩에서의 신호 재구성 방법 및 디바이스 | |
US20190373262A1 (en) | Quantization device, quantization method, and recording medium | |
US8577485B2 (en) | Method and an apparatus for processing an audio signal | |
JP3130673B2 (ja) | 音声符号化装置 | |
KR100449706B1 (ko) | 개선된 프랙탈 영상 압축 및/또는 복원 방법 및 그 장치 | |
JP2008268792A (ja) | オーディオ信号符号化装置およびそのビットレート変換装置 | |
JPH01206400A (ja) | 音声予測符号器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230629 Address after: Hoik, Belgium Patentee after: Newaro LLC Address before: Belgian Mohr Patentee before: AURO TECHNOLOGIES |
|
TR01 | Transfer of patent right |