CN1514997A - 音频信号的编辑 - Google Patents

音频信号的编辑 Download PDF

Info

Publication number
CN1514997A
CN1514997A CNA028114485A CN02811448A CN1514997A CN 1514997 A CN1514997 A CN 1514997A CN A028114485 A CNA028114485 A CN A028114485A CN 02811448 A CN02811448 A CN 02811448A CN 1514997 A CN1514997 A CN 1514997A
Authority
CN
China
Prior art keywords
parameter
signal
expression
edit
sound signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA028114485A
Other languages
English (en)
Other versions
CN1237507C (zh
Inventor
A��W��J������
A·W·J·奥门
¿ƿ�
L·M·范德科克霍夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pendragon Wireless LLC
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1514997A publication Critical patent/CN1514997A/zh
Application granted granted Critical
Publication of CN1237507C publication Critical patent/CN1237507C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

公开了一种以高子帧精度编辑(4)相对长的帧以便于在正弦编码的情况下进行编辑的方法。为了提供这种用于高精度编辑的方法,所谓的瞬变位置可被应用于先前所编码的信号(AS)中需要编辑点(EEP、SEP)的地方。通过例如音频编辑应用,作为某种后处理而进行添加。使用瞬变位置作为编辑点的优点是信号可由此在原则上以采样分辨率精度在瞬变位置处突然结束或开始,而在现有技术***中,人们被局限于帧边界,其例如每100ms出现一次。

Description

音频信号的编辑
本发明涉及编辑音频信号。
通常,在变换编码器中,输入音频信号被编码为包括一个或多个帧的位流,每个帧包括头部以及一个或多个段。编码器将信号分成以给定采样频率采集的采样块,并且这些被变换成频域以识别给定段的信号的谱特征。所得的系数(resulting coeeficient)不被传输至全精度,而相反被量化以代之以较小的精度,实现了字长的节省并因此实现了压缩。解码器执行逆变换以产生具有较高、成形、噪声底层的原始版本。
通常理想的是通过例如拼接原始信号以包括另一信号或简单地去除原始信号的部分来编辑音频信号。在以压缩格式表示音频信号的情况下,不理想的是首先将原始音频信号压缩成时域以使其在对所编辑的信号进行有损再压缩之前可与另一时域信号拼接。这通常将导致音频信号原始部分的较低质量。这样,位流被压缩的数据的编辑一般是在帧基础上进行的,这与压缩格式关联,同时使编辑点位于帧边界。这使得原始信号质量不受***新信号的影响。
因此编辑的精度与帧的大小有关—其典型地具有近似100ms的分辨率。即使具有较高位速率要求的单段的帧被使用(由于帧头部开销),精度可以在最佳段大小处—近似10ms的分辨率。
因此,为了允许精细网格编辑,帧需要为适当短。短帧的缺点是过多的帧开销,其涉及例如帧头部,以及以下事实:连续的帧之间的冗余不能被利用到最完全的程度,从而导致较高的位速率。
因此,为了有效的编码,大帧是理想的,而就编辑能力而言,短帧是理想的。不幸的是,这些方面是冲突的。
在提交于2000年3月15日的欧洲专利申请No.00200939.7(代理Ref:PH-NL000120)中所述类型的正弦编码器中,有可能限定所谓的瞬变位置,它是动态范围突然变化的位置。典型地,在瞬变位置处,动态范围的突然变化被观察并且被合成为瞬变波形。
如果使用自适应成帧,则从瞬变波形的位置,用于信号剩余正弦和噪声分量的合成的分段(segmentation)被计算。
依照本发明,提供了一种编辑由被编码的音频位流表示的原始音频信号的方法,所述被编码的音频位流包括多个帧,每个所述帧包括头部以及一个或多个段,每个段都包括表示所述原始音频信号的参数,该方法包括步骤:确定对应于所述原始音频信号中时间上某一瞬间的编辑点;对含有时间上的所述瞬间的时间阶段在表示所述原始音频信号的目标帧中***表示时间上所述瞬间的瞬变的参数和所述参数表示编辑点的指示符;以及产生表示经编辑的音频信号并包括所述目标帧的经编码的音频信号。
在优选实施例中,提供了一种以高子帧精度来编辑相对长的帧以便于在正弦编码的情况下进行编辑的方法。为了提供这种用于高精度编辑的方法,所谓的瞬变位置可被应用于先前所编码的信号中需要编辑点的地方。通过例如音频编辑应用,作为某种后处理而进行添加。使用瞬变位置作为编辑点的优点是信号可由此在原则上以采样分辨率精度在瞬变位置处突然结束或开始,而在现有技术***中,人们被局限于帧边界,其例如每100ms出现一次。
事实上,本发明“滥用”瞬变位置来限定编辑点。这些编辑瞬变位置事实上是一种伪瞬变,因为在这些位置处没有瞬变波形被产生。
本发明与现有技术自适应成帧的不同之处在于,在自适应成帧中,成帧依赖于瞬变位置而被确定(因此,帧的细分在两个随后的瞬变位置之间被进行)。本发明的不同之处在于,给定成帧是所需的(在编辑位置上)并且瞬变位置被限定给予所述所需的成帧。事实上,本发明可与自适应成帧一起或无需它而工作。
现在将参照附图来描述本发明的实施例:
图1示出提交于2000年3月15日的欧洲专利申请No.00200939.7(代理人Ref:PH-NL000120)中所述类型的音频编码器的实施例;
图2示出被安排以播放依照本发明产生的音频信号的音频播放器的实施例;
图3示出依照本发明包括音频编码器、图2的音频播放器和编辑器的***;以及
图4示出依照本发明来处理的位流的一部分。
在本发明的优选实施例、图1中,待编辑的音频信号最初是由提交于2000年3月15日的欧洲专利申请No.00200939.7(代理Ref:PH-NL000120)中所述类型的正弦编码器所产生的。在该较早的案例中,音频编码器1以特定采样频率来采样输入音频信号,从而产生音频信号的数字表示x(t)。这改变(render)了依赖于采样速率的时间尺度t。编码器1然后将所采样的输入信号分为三个分量:瞬变信号分量、持续确定性分量和持续随机分量。音频编码器1包括瞬变编码器11、正弦编码器13和噪声编码器14。音频编码器任选地包括增益压缩机构(GC)12。
在本案例中,在持续编码之前进行瞬变编码。这是有利的,因为在本实施例中,实验表明瞬变信号分量在持续编码器中被较低效地编码。如果持续编码器被用于编码瞬变信号分量,需要大量的编码劳动强度;例如,人们可以想象仅以持续正弦波来编码瞬变信号分量是困难的。因此,在持续编码之前从待编码的音频信号去除瞬变信号分量是有利的。亦将看到,在瞬变编码器中得到的瞬变开始位置可被用于持续编码器以便进行自适应分段(自适应成帧)。
尽管如此,本发明不局限于特别使用欧洲专利申请No.00200939.7中所公开的瞬变编码,而这被提供仅仅是为了举例。
瞬变编码器11包括瞬变检测器(TD)110、瞬变分析器(TA)111和瞬变合成器(TS)112。首先,信号x(t)进入瞬变检测器110。该检测器110估算是否有瞬变信号分量及其位置。该信息被馈给瞬变分析器111并亦可被用于正弦编码器13和噪声编码器14以获得信号诱发的自适应分段。如果瞬变信号分量的位置被确定,则瞬变分析器111尝试提取瞬变信号分量(的主要部分)。它将形状函数匹配于优选在所估算的开始位置处开始的信号段,并且通过采用例如一个(小)量的正弦分量来确定形状函数之下的内容。该信息被包含在瞬变编码CT中,而有关产生瞬变编码CT的较详细信息被提供在欧洲专利申请No.00200939.7中。在任何情况下将看到,例如,在瞬变分析器采用Meixner如形状函数的地方,则瞬变编码CT将包括:瞬变开始的开始位置;基本上表示初始侵袭率(attackrate)的参数;和基本上表示衰减率的参数;以及该瞬变正弦分量的频率、振幅和相位数据。
如果由编码器1产生的位流待由解码器独立于用于产生位流的采样频率而合成,则开始位置应作为时间值而不是例如帧内的采样数被传输;并且正弦波频率应作为绝对值或使用表示绝对值的标识符而不是作为仅可从变换采样频率得出或与其成比例的值被发送。在其它现有技术***中,一般选择后者的选项,这是因为作为离散值,它们从直观上较容易编码和压缩。然而,这需要能重新产生采样频率的解码器以重新产生音频信号。
在欧洲专利申请No.00200939.7中公开了在瞬变信号分量是振幅包络中的阶梯形变化的情况下,瞬变形状函数亦可包括阶梯指示。同样,尽管本发明不局限于任何一个实施,阶梯形变化的位置可被编码为时间值,而不是采样数,其可能与采样频率相关。
瞬变编码CT被提供给瞬变合成器112。所合成的瞬变信号分量在减法器16中从输入信号x(t)被减去,从而产生信号x1。在GC12被省略的情况下,x1=x2。信号x2被提供给正弦编码器13,在这里它在正弦分析器(SA)130中被分析,该分析器确定(确定性的)正弦分量。结果信息被包含在正弦编码CS中。说明示例正弦编码的产生的较详细实例被提供于PCT专利申请No.WO00/79579-A1(代理Ref:PHN017502)中。可替换的是,基本实施被公开于“Speechanalysis/synthesis based on sinusoidal representation”,R.McAulay和T.Quartieri,IEEE Trans.Acoust.,Speech,SignalProcess.,43:744-754,1986或“Technical description of theMPEG-4 audio-coding proposal from the University of Hannoverand Deutsche Bundespost Telekom AG(revised)”,B.Edler,H.Purnhagen和C.Ferekidis,Technical note MPEG95/0414r,Int.Organisation for Standardisation ISO/IEC JTC1/SC29/WG11,1996。
然而,简而言之,优选实施例的正弦编码器将输入信号x2编码为从一个帧段被链接到下一个帧段的正弦分量的轨迹。对于在给定段内开始(诞生)的正弦波,所述轨迹最初是由开始频率、开始振幅和开始相位表示的。之后,该轨迹在随后的段中由频率差、振幅差并且可能还有相位差(延续)来表示,直到轨迹结束(死亡)的段。在实际中,可以确定在编码相位差的过程中几乎没有增益。这样,相位信息可被编码为绝对值。可替换的是,根本不需要编码相位信息为延续的,并且相位信息可使用连续相位重构来重新产生。
同样,如果要使位流独立于采样频率,则开始频率在正弦编码CS中被编码为绝对值或表示绝对频率的标识符以确保经编码的信号独立于采样频率。
从正弦编码CS,正弦信号分量由正弦合成器(SS)131来重构。从输入信号x2到正弦编码器13,该信号在减法器17中被减,从而产生剩余信号x3,其没有(大的)瞬变信号分量和(主要的)确定性正弦分量。
假定剩余信号x3主要包括噪声,而优选实施例的噪声分析器14产生表示该噪声的噪声编码CN。如在例如被提交于2000年5月17日的PCT专利申请No.PCT/EP00/04599(代理Ref:PH NL000287)中,在常规上,噪声谱是依照等效矩形带宽(ERB)尺度借助组合的AR(自动回归)MA(移动平均)滤波参数(pi,qi)由噪声编码器来模拟的。在图2的解码器中,滤波参数被馈给噪声合成器NS33,其主要是滤波器,具有近似噪声谱的频率响应。通过用ARMA滤波参数(pi,qi)来过滤白噪声信号并且随后将其加给所合成的瞬变yT和正弦波yS信号,NS33产生经重构的(合成的)噪声yN。
然而,ARMA滤波参数(pi,qi)同样依赖于噪声分析器的采样频率,并且如果经编码的位流要独立于采样频率,则这些参数在被编码之前被变换为线谱频率(LSF),其亦已知为线谱对(LSP)。这些LSF参数可在绝对频率网格或与ERB尺度或Bark尺度相关的网格上被表示。有关LSP的更多信息见“Line Spectrum Pair(LSP)and speechdata compression”,F.K.Soong and B.H.Juang,ICASSP,pp.1.10.1,1984。在任何情况下,如在解码器中所需要的从依赖于编码器采样频率的一个类型的线性预测滤波类型系数,在此情况下为(pi,qi),到独立于采样频率的LSF以及反过来的这种变换是众所周知的,并且在此不作进一步的讨论。然而,将看到,在解码器中将LSF转换为滤波系数(p’i,q’i)可参照噪声合成器33产生白噪声采样的频率来进行,从而使解码器能产生噪声信号yN,而独立于其被原始采样的方式。
将看到,类似于正弦编码器13中的情况,噪声分析器14亦可使用瞬变信号分量的开始位置作为用于开始新分析块的位置。然而,正弦分析器130和噪声分析器14的段大小没有必要相等。
最后,在复用器15中,音频流AS被构成,其包括编码CT、CS和CN。音频流AS被提供给例如数据总线、天线***、存储介质等。
参考图3,本发明的编辑器4适合于处理由例如优选实施例的编码器1产生的一个或多个音频流。在本发明的一个实施例中,编辑器4包括新型应用软件,其使用户能选择一个或多个所存原始音频信号中的时间上的相应瞬间或点,在这里相应的编辑点待被***以产生经编辑的信号。同样,编辑器4又可包括在欧洲专利申请No.00200939.7中所述类型的解码器2,从而允许用户收听原始音频信号,并且可能甚至包括图形部件,从而在用户拾取编辑点之前允许图形解码的信号被察看。然而,尽管本发明的优选实施例是根据交互式编辑器而被描述的,但本发明并不局限于对所存音频信号的用户交互驱动的编辑。这样,例如编辑器可以是在网络设备上运行的一件守护程序软件,音频信号通过所述网络设备流动。这种编辑器可适合于在进一步传递经编辑的信号之前在预定的点上自动切割或拼接一个或多个原始音频信号。
在任何情况下,在知道编辑点的时间上的点的情况下,编辑器确定原始信号中的目标帧,其表示在编辑点之前开始和在编辑点之后结束的时间阶段。
对于在一个或多个原始位流中确定的每个编辑点,编辑器被安排成将阶梯瞬变编码***到经编辑的信号位流的相应目标帧中,所述阶梯瞬变编码有一个位置,表示对应于编辑点的时间上的点。
参考图4,其说明了在经编辑的位流的帧i中所得的结束编辑点(EEP)和帧j中所得的开始编辑点(SEP)。这样,例如在帧j及以下中被编码的信号正在原始信号中被***,该原始信号已在帧i内的一个段中出现的时间被拼接。作为结果,因此理想的是,仅在帧i中的瞬变位置之前和在帧j中的瞬变位置之后的内容被合成。没有输出会从帧中的中间采样产生,因此在第一实施例中,如果帧i和帧j被联结,则结果信号包括短的静音。
编辑器为每个帧在头部(H)放置一个指示符(被散列示出)以在瞬变位置处标记轨迹,从而使当如以下所说明的被解码时,它们将在用于结束编辑点的瞬变位置附近渐弱或将在用于开始编辑点的该瞬变位置附近渐强。瞬变参数本身或与阶梯瞬变关联的附加参数可任选地被用于描述优选的渐强渐弱类型,即它是静音、cos函数或其它。由解码器来确定如何处理这样的参数,即这是否应当为渐变,如何应用给定类型的渐强/渐弱,以及这种渐变应如何发生。解码器可进一步支持用于该特点的不同选项。这样,由于瞬变位置能以采样精度分辨率来限定,因此能以采样精度来编辑音频信号。因此将看到,表示开始和结束编辑点的瞬变限定其各自帧内的帧边界,而表示结束编辑点之前的音频信号的轨迹独立于表示开始编辑点之后的音频信号的轨迹。
图2示出依照本发明用于解码信号的音频播放器3。例如由依照图1的编码器产生并可能由编辑器4后处理的音频流AS’从数据总线、天线***、存储介质等获得。如在欧洲专利申请No.00200939.7中所公开的,音频流AS在去复用器30中被去复用以获得编码CT、CS和CN。这些编码被分别提供给瞬变合成器31、正弦合成器32和噪声合成器33。从瞬变编码CT,瞬变信号分量在瞬变合成器31中被计算。在瞬变编码表示形状函数的情况下,基于所接收的参数来计算形状。此外,基于正弦分量的频率和振幅来计算形状内容。总的瞬变信号yT是所有瞬变的和。
如果使用了自适应成帧,则从瞬变位置,用于正弦合成SS32和噪声合成NS33的分段被计算。正弦编码CS被用于产生信号yS,其被描述为给定段上的正弦波的和。噪声编码CN被用于产生噪声信号yN。为此,用于帧段的线谱频率首先被变换为ARMA滤波参数(p’i,q’i),其专用于噪声合成器产生白噪声的采样频率,并且这些被与白噪声值组合以产生音频信号的噪声分量。在任何情况下,通过例如重叠添加方法来添加最后的帧段。
总信号y(t)包括瞬变信号yT和任何振幅解压缩(g)的乘积的和,以及这些信号yS和噪声信号yN的和。音频播放器包括两个加法器36和37以对相应的信号进行求和。总信号被提供给输出单元35,其例如是扬声器。
如在相关申请中所公开的,如果瞬变编码CT表示阶梯(step),则没有瞬变被计算。然而,优选实施例的音频播放器包括帧头部解码器38。解码器38被安排成在帧头部中检测帧段之一是否包括开始编辑点或结束编辑点之一。如果如在图4的帧i中头部指示结束编辑点(EEP),则解码器向瞬变、正弦和噪声合成器31、32和33的每个发送信号通知,它们的输出在对应于阶梯瞬变的位置时间或采样数之后应被设置为零,可任选地采用渐弱间隔。
如果如在图4的帧j中头部(H)指示开始编辑点(SEP),则解码器向瞬变、正弦和噪声合成器31、32和33的每个发送信号通知,它们的输出在对应于阶梯瞬变的位置时间或采样数之前应被设置为零,可任选地采用渐弱间隔。这在正弦合成器的情况下是特别有利的,这是因为从轨迹的诞生经过其延续,它可连续从帧的开始将轨迹合成为正常、规划的频率、振幅和相位信息而不是简单地将其输出设置为零,直到阶梯瞬变的位置。此时,它然后开始输出其计算值,其一些可以是在阶梯瞬变之前开始的原始信号的延续。这样,当包含诸如图4中所示的帧的音频信号被解码时,其导致从结束编辑点到开始编辑点的时间运行的短静音。
如果感觉这是个问题,则播放器3可被用于以在任何音频信号中的总的可能静音长度的最大值来高速缓存所进入的音频流。如果需要,这将允许播放器在解码音频流时在前读取,从而使如果检测到结束编辑点,则它可跳过一直到帧结束,通过下一帧计算轨迹值直到开始编辑点,并且紧接着在开始编辑点的信号之后开始输出被联结的经合成的信号,任选地应用适当的跨接渐变(cross-over fade)。
在另一个可替换的解决方案中,可能不能理想地看到需要计算正弦轨迹值直到包括诸如帧j的帧的开始编辑点的段。在此情况下,对于与开始编辑点相同的段中的延续轨迹,编辑器可被安排成计算用于这种轨迹的绝对频率、振幅和相位,由此将位流中的延续轨迹编码替换成诞生轨迹编码。然后,用于帧的先前段中的轨迹的任何延续或诞生编码可被去除或归零,从而在位速率要求和音频播放器处理上略为节省。
在任何情况下将看到,原则上任何编码方案的语法可被扩展以提供上述的采样精度编辑的灵活性。
此外,依照实施本发明的过程中的环境,上述优选实施例的许多变化是可能的。因此,例如,如果要广泛地编辑信号,将看到对所存信号的重复更新以包括编辑点瞬变信息可能需要在处理位流中所包含的大量数据方面的相当资源。在优选的编辑器中,每次编辑点被确定时位流不被修改,相反,与正被编辑的位流关联的编辑器维持一列编辑点。一旦用户已完成对信号的编辑,依照所述列的编辑点来***瞬变并且经编辑的位流被一次写给存储。
在另一个变化中,通过限定单个或成对的编辑点瞬变,可避免使用限定瞬变的单独参数和指示该瞬变是编辑点的指示符,所述编辑点瞬变在整体上既包括限定在时间上的瞬间处的瞬变的参数,也指示该参数是编辑点或具体而言是开始或结束编辑点。在使用单一类型的这种编辑点瞬变的情况下,这些瞬变可被配对以使当解码器检测到第一所述瞬变时,其在该点之后产生零位信号,并且一旦检测到所述对中的第二所述瞬变,才开始输出信号。
在这两种情况下并且在优选实施例中,将理解所述解码器可被编程以假定在结束编辑点或第一编辑点之后的帧应包括开始编辑点。这样,如果信号被破坏,或检测器未在结束编辑点之后的帧中检测到开始编辑点,则其可从下一帧的开始处开始输出信号,从而使破坏导致的损坏最小。
图3示出依照本发明的音频***,包括如图1中所示的音频编码器1、如图2中所示的音频播放器3和如以上所述的编辑器。这样的***提供了编辑、播放和记录特征。音频流AS在通信通道2上从音频编码器被提供给音频播放器或编辑器,所述通信通道可以是无线连接、数据总线或存储介质。在通信通道2是存储介质的情况下,存储介质可被固定于***中或亦可以是可移动盘、固态存储设备,如来自SonyCorporation等的Memory StickTM等。通信通道2可以是音频***的一部分,但常常将在音频***外。
可以看出,本发明可被实施于专用的硬件中,在DSP(数字信号处理器)上或通用计算机上运行的软件中。本发明可被实施于诸如CD-ROM或DVD-ROM的有形介质中,其承载用于执行依照本发明的编码方法的计算机程序。本发明亦可被实施为在诸如互联网的数据网络上发送的信号或通过广播服务发送的信号。
本发明在诸如固态音频、互联网音频发行或任何压缩音乐发行的领域中找到应用。亦将看到,本发明的操作亦可兼容于在提交于2001年4月18日的欧洲专利申请No.01201405.6(代理人Ref:PHNL010251)中描述的可兼容加扰(scrambling)方案。
应指出,上述实施例说明了而不是局限了本发明,并且本领域的技术人员将能在所附权利要求的范围内设计许多可替换的实施例。在权利要求中,被置于括弧之间的任何参考符号不应被理解为限制本发明。单词“包括”不排除除了权利要求中所列的以外的元件或步骤的存在。本发明可借助包括几个独特元件的硬件并借助适当编程的计算机来实施。在列举几个装置的设备权利要求中,这些装置的几个可由硬件的一个或相同项来实施。在相互不同的独立权利要求中细述特定措施的仅有事实不表示这些措施的组合不能被用于优点。
总之,在正弦编码被公开的情况下,本发明的优选实施例提供了一种以用于编辑的高子帧精度来编辑相对长的帧的方法。为提供用于高精度编辑的这种方法,所谓的瞬变位置可被应用于在先前编码的信号(AS)中需要编辑点(EEP、SEP)的地方。通过例如音频编辑应用,作为某种后处理而进行添加。使用瞬变位置作为编辑点的优点是信号然后能以原则上采样分辨率精度被突然结束或开始于瞬变位置,而在现有技术***中,人们被局限于帧边界,其例如每100ms出现一次。

Claims (26)

1.一种编辑(4)由经编码的音频流(AS)表示的原始音频信号(x)的方法,所述经编码的音频流包括多个帧,每个所述帧都包括头部(H)和一个或多个段(S),每个段都包括表示所述原始音频信号(x)的参数(CT、CS、CN),该方法包括步骤:
确定所述原始音频信号(x)中对应于时间上的瞬间的编辑点;
在表示含有所述时间上的瞬间的时间阶段的所述原始音频信号(x)的目标帧(i,j)中***表示所述时间上的瞬间处的瞬变(EEP、SEP)的参数和所述参数表示编辑点的指示符;以及
产生表示经编辑的音频信号并包括所述目标帧的经编码的音频流(AS)。
2.权利要求1的方法,其中所述指示符包括开始编辑点或结束编辑点之一。
3.权利要求1的方法,其中所述***步骤包括在所述目标帧的段中***所述参数并在所述目标帧的头部中***所述指示符。
4.权利要求1的方法,其中表示所述瞬变的所述参数指示所述经编辑的音频信号中的振幅的阶梯形变化。
5.权利要求1的方法,其中表示所述原始音频信号(x)的所述参数包括用于滤波器的滤波参数(CN),该滤波器具有与表示音频信号的噪声分量的噪声分量的目标谱近似的频率响应。
6.权利要求1的方法,其中表示所述原始音频信号(x)的所述参数包括参数(CN),其独立于被用于产生所述经编码的音频流的第一采样频率,所述参数从用于滤波器的滤波参数(pi,qi)得出,该滤波器具有近似于表示音频信号的噪声分量的噪声分量的目标谱的频率响应。
7.权利要求6的方法,其中所述滤波参数是自动回归(pi)和移动平均(qi)参数,并且所述独立的参数表示线谱频率。
8.权利要求7的方法,其中所述独立的参数以ERB尺度或Bark尺度或绝对频率之一来表示。
9.权利要求1的方法,其中表示所述原始音频信号(x)的所述参数包括参数(CT),其表示音频信号中瞬变信号分量的相应位置;所述参数限定具有形状参数和位置参数的形状函数。
10.权利要求9的方法,其中所述位置参数表示所述原始音频信号(x)中所述瞬变信号分量的绝对时间位置。
11.权利要求1的方法,其中表示所述原始音频信号(x)的所述参数包括参数(CS),其表示音频信号中的持续的信号分量,所述参数包括表示在随后的信号段中存在的被链接的信号分量的轨迹以及在先前被链接的信号分量的基础上延伸轨迹。
12.权利要求11的方法,其中用于轨迹中第一信号分量的参数包括表示所述信号分量的绝对频率的参数。
13.权利要求1的方法,其中所述经编辑的位流包括待由解码器使用的推荐最小带宽。
14.解码(3)音频流的方法,该方法包括步骤:
读取表示经编辑的音频信号(x)的经编码的音频流(AS’),所述流包括多个帧,每个所述帧都包括头部(H)和一个或多个段(S),每个段都包括表示所述经编辑的音频信号(x)的参数(CT、CS、CN);以及
响应于表示给定时间阶段的所述经编辑的音频信号(x)的、包括表示所述时间阶段内时间上的瞬间处的瞬变的参数和所述参数表示编辑点的指示符的帧,对所述时间阶段的一部分产生零输出,并采用(31、32、33)所述参数表示从而对所述时间阶段的剩余部分合成所述音频信号,所述部分在时间上的瞬间被划分。
15.权利要求14的方法,其中所述产生步骤响应于表示所述编辑点是结束编辑点的所述指示符,对所述时间上的瞬间之后的所述时间阶段的部分产生零输出,并且采用(31、32、33)所述参数表示从而对所述时间上的瞬间之前的所述时间阶段的部分合成所述音频信号。
16.权利要求15的方法,其中所述产生步骤是响应于所述结束编辑点,在时间上的所述瞬间附近使所述信号渐弱。
17.权利要求14的方法,其中所述产生步骤响应于表示所述编辑点是开始编辑点的所述指示符,对时间上的所述瞬间之前的所述时间阶段的部分产生零输出,并且采用(31、32、33)所述参数表示从而对时间上的所述瞬间之后的所述时间阶段的部分合成所述音频信号。
18.权利要求17的方法,其中所述产生步骤响应于所述开始编辑点,在时间上的所述瞬间附近使所述信号渐强。
19.权利要求14的方法,其中所述产生步骤包括产生所述零输出作为静音信号。
20.权利要求14的方法,其中所述产生步骤包括联结在一对编辑点的第一编辑点处结束的音频信号与在所述对的编辑点的第二编辑点处开始的音频信号。
21.权利要求20的方法,其中所述联结步骤包括在所述第一编辑点处结束的音频信号与在第二编辑点处开始的音频信号的跨接渐变。
22.用于编辑(4)由经编码的音频流(AS)表示的原始音频信号(x)的音频编辑器,所述经编码的音频流包括多个帧,每个所述帧都包括头部(H)和一个或多个段(S),每个段都包括表示所述原始音频信号(x)的参数(CT、CS、CN),所述编辑器包括:
装置,用于确定所述原始音频信号(x)中对应于时间上的瞬间的编辑点;
装置,用于在表示含有所述时间上的瞬间的时间阶段的所述原始音频信号(x)的目标帧(i,j)中***表示所述时间上的瞬间处的瞬变(EEP、SEP)的参数和所述参数表示编辑点的指示符;以及
装置,用于产生表示经编辑的音频信号并包括所述目标帧的经编码的音频流(AS)。
23.音频播放器(3),包括:
装置,用于读取表示经编辑的音频信号(x)的经编码的音频流(AS’)的子帧,所述流包括多个帧,每个所述帧都包括头部(H)和一个或多个段(S),每个段都包括表示所述经编辑的音频信号(x)的参数(CT、CS、CN);以及
装置,响应于表示给定时间阶段的所述经编辑的音频信号(x)的、包括表示所述时间阶段内时间上的瞬间处的瞬变的参数和所述参数表示编辑点的指示符的帧,用于对所述时间阶段的一部分产生零输出,并采用(31、32、33)所述参数表示从而对所述时间阶段的剩余部分合成所述音频信号,所述部分在时间上的瞬间被划分。
24.音频***,包括权利要求22的音频编辑器(4)和权利要求23的音频播放器(3)。
25.表示经编辑的的音频信号(x)的音频流(AS),包括多个帧,每个所述帧都包括头部(H)和一个或多个段(S),每个段都包括表示所述经编辑的音频信号(x)的参数(CT、CS、CN);并且
一个或多个所述帧包括表示所述时间阶段内时间上的瞬间处的瞬变的相应参数和所述参数表示编辑点的指示符。
26.存储介质,其上已存储了权利要求25的音频流(AS)。
CNB028114485A 2001-06-08 2002-06-05 音频信号的编辑 Expired - Fee Related CN1237507C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01202195 2001-06-08
EP01202195.2 2001-06-08

Publications (2)

Publication Number Publication Date
CN1514997A true CN1514997A (zh) 2004-07-21
CN1237507C CN1237507C (zh) 2006-01-18

Family

ID=8180437

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028114485A Expired - Fee Related CN1237507C (zh) 2001-06-08 2002-06-05 音频信号的编辑

Country Status (10)

Country Link
US (1) US20040162721A1 (zh)
EP (1) EP1399917B1 (zh)
JP (1) JP4359499B2 (zh)
KR (1) KR100852613B1 (zh)
CN (1) CN1237507C (zh)
AT (1) ATE305164T1 (zh)
BR (1) BR0205527A (zh)
DE (1) DE60206269T2 (zh)
ES (1) ES2248549T3 (zh)
WO (1) WO2002101725A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009010009A1 (en) * 2007-07-17 2009-01-22 Huawei Technologies Co, .Ltd. Prompting message forming method and device for mobile terminal
CN101388213B (zh) * 2008-07-03 2012-02-22 天津大学 一种预回声控制方法
CN101529503B (zh) * 2006-10-18 2012-05-09 弗劳恩霍夫应用研究促进协会 信息信号的编码装置及方法
CN105161094A (zh) * 2015-06-26 2015-12-16 徐信 一种语音音频切分手动调整切分点的***及方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60214027T2 (de) 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
AU2003281128A1 (en) * 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
BRPI0412717A (pt) * 2003-07-18 2006-09-26 Koninkl Philips Electronics Nv métodos para codificar um sinal e para decodificar um fluxo de áudio, codoficador de áudio, reprodutor de áudio, sistema de áudio, fluxo de áudio, e, meio de armazenagem
JP2005210199A (ja) * 2004-01-20 2005-08-04 Alps Electric Co Ltd 無線ネットワークにおける端末相互間の接続方法
JP2008503766A (ja) * 2004-06-21 2008-02-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオエンコードの方法
JP4649901B2 (ja) * 2004-07-15 2011-03-16 ヤマハ株式会社 曲の符号化伝送のための方法および装置
KR101080421B1 (ko) * 2007-03-16 2011-11-04 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치
KR20090008611A (ko) * 2007-07-18 2009-01-22 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
US10492014B2 (en) * 2014-01-09 2019-11-26 Dolby Laboratories Licensing Corporation Spatial error metrics of audio content
EP2996269A1 (en) 2014-09-09 2016-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio splicing concept
WO2017064264A1 (en) * 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5832442A (en) * 1995-06-23 1998-11-03 Electronics Research & Service Organization High-effeciency algorithms using minimum mean absolute error splicing for pitch and rate modification of audio signals
JPH09135419A (ja) * 1995-11-08 1997-05-20 Nippon Telegr & Teleph Corp <Ntt> 映像・音声符号化情報の編集方法
US5995471A (en) * 1996-10-07 1999-11-30 Sony Corporation Editing device and editing method
US6782365B1 (en) * 1996-12-20 2004-08-24 Qwest Communications International Inc. Graphic interface system and product for editing encoded audio data
US5864820A (en) * 1996-12-20 1999-01-26 U S West, Inc. Method, system and product for mixing of encoded audio signals
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US5899969A (en) * 1997-10-17 1999-05-04 Dolby Laboratories Licensing Corporation Frame-based audio coding with gain-control words
JP3539615B2 (ja) * 1998-03-09 2004-07-07 ソニー株式会社 符号化装置、編集装置及び符号化多重化装置並びにそれらの方法
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
WO2001069593A1 (en) * 2000-03-15 2001-09-20 Koninklijke Philips Electronics N.V. Laguerre fonction for audio coding
JP3859432B2 (ja) * 2000-06-23 2006-12-20 シャープ株式会社 マルチメディアデータ編集装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101529503B (zh) * 2006-10-18 2012-05-09 弗劳恩霍夫应用研究促进协会 信息信号的编码装置及方法
WO2009010009A1 (en) * 2007-07-17 2009-01-22 Huawei Technologies Co, .Ltd. Prompting message forming method and device for mobile terminal
CN101388213B (zh) * 2008-07-03 2012-02-22 天津大学 一种预回声控制方法
CN105161094A (zh) * 2015-06-26 2015-12-16 徐信 一种语音音频切分手动调整切分点的***及方法

Also Published As

Publication number Publication date
ATE305164T1 (de) 2005-10-15
CN1237507C (zh) 2006-01-18
KR20030029813A (ko) 2003-04-16
BR0205527A (pt) 2003-07-08
EP1399917A1 (en) 2004-03-24
JP4359499B2 (ja) 2009-11-04
DE60206269T2 (de) 2006-06-29
KR100852613B1 (ko) 2008-08-18
DE60206269D1 (de) 2006-02-02
JP2004538502A (ja) 2004-12-24
EP1399917B1 (en) 2005-09-21
US20040162721A1 (en) 2004-08-19
WO2002101725A1 (en) 2002-12-19
ES2248549T3 (es) 2006-03-16

Similar Documents

Publication Publication Date Title
CN1237507C (zh) 音频信号的编辑
CN101903944B (zh) 用于处理音频信号的方法和装置
US8391373B2 (en) Concealment of transmission error in a digital audio signal in a hierarchical decoding structure
EP1756807B1 (en) Audio encoding
KR20020052191A (ko) 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법
CN1463547A (zh) 部分加密的声频编码
CA2717584A1 (en) Method and apparatus for processing an audio signal
EP0731348B1 (en) Voice storage and retrieval system
JP3680374B2 (ja) 音声合成方法
CN1717718A (zh) 正弦波音频编码
CN1240048C (zh) 音频编码
CN107958670A (zh) 用于确定编码模式的设备以及音频编码设备
JP2002544551A (ja) 遷移音声フレームのマルチパルス補間的符号化
CA2317435A1 (en) Apparatus and method for hybrid excited linear prediction speech encoding
KR20230129581A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
EP1692688A1 (en) Audio coding
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JPH05232996A (ja) 音声符号化装置
KR100255297B1 (ko) 음성 데이터 부호화/복호화장치 및 그 방법
KR100310930B1 (ko) 음성합성장치및그방법
KR19980035868A (ko) 음성데이터 부호화/복호화장치 및 그 방법
JPS58128000A (ja) 音声パラメ−タ符号化方式

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: IPG ELECTRONICS 503 CO., LTD.

Free format text: FORMER OWNER: ROYAL PHILIPS ELECTRONICS CO., LTD.

Effective date: 20090821

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090821

Address after: British Channel Islands

Patentee after: Koninkl Philips Electronics NV

Address before: Holland Ian Deho Finn

Patentee before: Koninklike Philips Electronics N. V.

ASS Succession or assignment of patent right

Owner name: PENDRAGON WIRELESS CO., LTD.

Free format text: FORMER OWNER: IPG ELECTRONICS 503 LTD.

Effective date: 20130118

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130118

Address after: Washington State

Patentee after: Pendragon wireless limited liability company

Address before: British Channel Islands

Patentee before: Koninkl Philips Electronics NV

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060118

Termination date: 20140605