CN101203907A - 音频编码装置、音频解码装置以及音频编码信息传输装置 - Google Patents

音频编码装置、音频解码装置以及音频编码信息传输装置 Download PDF

Info

Publication number
CN101203907A
CN101203907A CNA2006800224379A CN200680022437A CN101203907A CN 101203907 A CN101203907 A CN 101203907A CN A2006800224379 A CNA2006800224379 A CN A2006800224379A CN 200680022437 A CN200680022437 A CN 200680022437A CN 101203907 A CN101203907 A CN 101203907A
Authority
CN
China
Prior art keywords
waveform
pitch period
frame
sound signal
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800224379A
Other languages
English (en)
Other versions
CN101203907B (zh
Inventor
田中直也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101203907A publication Critical patent/CN101203907A/zh
Application granted granted Critical
Publication of CN101203907B publication Critical patent/CN101203907B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/097Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明的编码装置减少传输信息量,并且减少解码装置的处理量。编码装置(10)是一种装置具有:MDCT部(104),按每个预定的时间频率转换帧长度,将所输入的音频信号转换为频率参数;以及MDCT系数编码部(105),对该频率参数进行编码,所述编码装置(10)包括:基音检测部(102),检测音频信号的基音周期;成帧部(101),根据检测出的基音周期,对输入音频信号进行成帧;波形变形部(103),按照时间频率转换帧长度,对根据基音周期成帧后的音频信号进行波形变形,将波形变形后的音频信号输出到MDCT部(104);以及比特流多路复用部(106),对MDCT系数编码部(105)编码后的频率参数和基音周期进行多路复用,而作为比特流输出。

Description

音频编码装置、音频解码装置以及音频编码信息传输装置
技术领域
本发明涉及音频编码装置、音频解码装置以及音频编码信息传输装置,尤其涉及一种技术,在对应视听时的可变速度再生的同时,以少量信息对音频信号高效率地进行编码,并且对编码后的信息进行解码。
背景技术
音频编码的目的在于,以尽可能高的效率来对数字化后的音频信号进行压缩编码并传输,由解码器进行解码处理,从而再生质量尽可能高的音频信号。
对于音频编码方式,根据成为对象的信号的种类、比特率或需要的音质等条件提出了各种方式。例如,在作为ISO/IEC的标准规格的MPEG-4Audio(非专利文献1)中公开了AAC(Advanced Audio Coding:高级音频编码)、CELP(Code Excited Linier Prediction:码激励线性预测编码)、HVXC(Harmonic Vector eXcitation Coding:谐波矢量激励编码)等编码方式。尤其AAC方式是一个非常好的音频编码方式,其能够以高质量(例如,以与光盘音频相等的质量)对包含音乐的普通音频信号进行编码,AAC方式的特点是使用称为MDCT(Modified Discrete CosineTransform:修正的离散余弦变换)的时间频率转换。这些编码方式在通信、广播以及存储型的音频设备中被广泛使用。
另一方面,对于播放并存储后的音频、或音频视频复合信息的视听,对视听时的可变速度再生的需求越来越高。随着信息存储装置的大容量化以及获得信息的方法的多样化,个人可视听的信息量飞跃增加。因此,用于在有限的时间内视听更多信息的高速再生功能越来越重要。
音频信号的可变速度再生方法有:第一种方法,根据时间音频信号的基音(pitch)周期删除或***基音波形(专利文献1);以及第二方法,将音频信号参数化后,使该参数的更新周期变化(专利文献2),不过,一般而言,作为高质量的输入信号的处理方法,使用前者所述的根据基音周期的时间信号处理。其理由是,第二种方法,只用于低质量的语音信号,而对高质量的输入信号的处理方法不合适。
在图1中示出音频编码装置的结构的一个例子,该音频编码装置,用于实现以MDCT的音频编码方式来编码后的音频信号的可变速度再生。
如图1所示,解码装置9000包括:比特流分离部9901、MDCT系数解码部9902、逆MDCT部9903、基音分析部9904、再生速度控制部9905、波形变形部9906、以及波形连接部9907。
在比特流分离部9901,输入比特流9908被分离为各个代码要素。对MDCT系数的解码需要的代码要素,即MDCT代码9909,被输入到MDCT系数解码部9902,并被解码为MDCT系数9910。逆MDCT部9903,对MDCT系数9910进行逆转换处理,来生成时间音频信号9911。基音分析部9904,分析时间音频信号9911的基音周期。再生速度控制部9905,接受再生速度转换的指示9913,根据分析后的基音周期9912决定再生速度转换的开始位置9914。波形变形部9906,在处理的开始位置9914进行基于基音周期9912的波形变形(删除或***基音波形),并且,波形连接部9907,使变形后的波形9915连接,从而生成输出音频频信号9916。
并且,也可以如下构成,如(专利文献3)所示,取代由基音分析部9904分析的基音周期9912,而使用在输入比特流中包含的基音周期信息。
(专利文献1)专利第3147562号公报
(专利文献2)特开平9-6397号公报
(专利文献3)国际公开第98/21710号手册
(非专利文献1)ISO/IEC 14496-3:2001
(非特许文献2)IEEE Trans.ASSP-34No.5 Oct.1986,John P.Princenand Alan Bernard Bradley,“Analysis/Synthesis Filter Bank Design Basedon Time Domain Aliasing Cancellation”
然而,对于以音频编码方式压缩后的音频信号的可变速度再生处理,以往使用了如下结构,即,对解码后的音频信号进行在时间区域内的、基于基音周期的波形***处理或删除处理。
因此,在以往的如上结构中存在下列课题,该课题大致可分为两项。
为了明确该课题,首先需要对以往的技术加以说明。
图2是使用以往的解码装置的***整体的结构图。
该***包括:编码器9100,对被输入的声音信号(PCM)进行压缩编码;存储介质9200,记录压缩编码后的声音信号;解码器9300,对压缩编码后的声音信号进行解码;以及速度转换器9400,用于进行可变速度再生。
解码器9300包括,图1所示的解码装置9000的比特流分离部9901、MDCT系数解码部9902以及逆MDCT部9903。并且,速度转换器9400包括,解码装置9000的基音分析部9904、再生速度控制部9905、波形变形部9906以及波形连接部9907。
例如,在以2倍速进行可变速度再生的情况下,编码后的声音信号,直接或通过天线9500、9600从存储介质9200被传输到解码器9300,在此,需要普通再生的两倍传输速度。并且,在解码器9300以及速度转换器9400也需要普通再生的两倍处理量。
据此,在以往的技术中,必然出现下述(1)关于处理量的课题以及(2)关于传输信息量的课题。
(1)处理量
为了进行在时间区域的、基音波形的***、删除处理,需要成为处理对象的区间的时间信号波形。这表示,在成为对象的音频信号被编码的情况下,需要对该区间的所有信号进行解码。
例如,在实现2倍速再生的情况下,对实际再生时间的两倍长度的时间波形进行解码后,使时间波形为一半。
据此,对解码需要的处理量是普通再生时的两倍。
而且,在加上了基音波形的抽取处理、波形***处理以及波形删除处理的情况下,处理量更会增加。
(2)传输信息量
在成为对象的音频信号被编码的情况下,为了获得对象区间的时间信号波形,需要接收对应该区间的比特流。
例如,在实现2倍速再生的情况下,为了对实际再生时间的两倍长度的时间波形进行解码,应当接收两倍比特流。
此时,由于再生时间是固定的实际时间,因此需要以两倍速度接收比特流。
这意味着,作为通信信道需要更宽的频带,并且意味着,在通信信道是固定比特率的情况下(除了由缓冲的部分性可变速度再生)不能进行可变速度再生。
发明内容
于是,为了解决上述技术上的课题,本发明的目的在于提供一种音频编码装置、音频解码装置以及音频编码信息传输装置,其可以减少传输信息量,并且可以减少解码装置的处理量。
为了实现上述目的,本发明涉及的编码装置,具有:时间频率转换单元,按每个预定的时间频率转换帧长度,将所输入的音频信号转换为频率参数;以及编码单元,对该频率参数进行编码,所述编码装置的特点是,包括:基音周期检测单元,检测所述音频信号的基音周期;成帧单元,根据检测出的基音周期,对输入音频信号进行成帧;第一波形变形单元,按照所述时间频率转换帧长度,对根据所述基音周期成帧后的音频信号进行波形变形,将波形变形后的音频信号输出到所述时间频率转换单元;以及多路复用单元,对由所述编码单元编码后的频率参数和所述基音周期进行多路复用,而作为比特流输出。
据此,可以将在可变速度再生时的向解码装置的信息传输量减少到与等速再生时相等的程度,并且可以将在解码装置的处理量减少到与等速再生时的解码处理相等的程度。
并且,本发明涉及的音频解码装置,具有:解码单元,对在输入后的比特流中包含的编码帧的频率参数进行解码;以及逆时间频率转换单元,按每个预定的时间频率转换帧长度,对所述频率参数进行逆时间频率转换,以成为音频信号,并且,在所述比特流中包含基音周期信息,该基音周期信息表示音频信号的基音周期,并且,所述逆时间频率转换后的音频信号是,按照所述时间频率转换帧长度,对预先根据所述基音周期成帧后的音频信号进行波形变形而成的,所述音频解码装置的特点是,包括:比特流分离单元,分离在所述输入比特流中包含的基音周期信息;第二波形变形单元,根据所述基音周期信息,将所述时间频率转换帧长度的音频信号变形为所述基音周期长度的音频信号;以及波形连接单元,使变形后的基音周期长度的音频信号连接。
据此,可以将由解码装置接收的信息传输量减少到与普通的比特率相等的程度,并且可以将解码处理量减少到与普通的的解码处理相等的程度。
具体而言,对于本发明涉及的音频解码装置,所述音频解码装置的特点是,还包括:第一再生速度转换单元,跳跃对所述频率参数进行解码的解码处理,而使音频信号的再生速度转换。
据此,由于通过操作比特流可以进行可变速度再生,因此减少对解码需要的处理量。并且,由于减少对解码处理需要的比特流量,因此减少可变速度再生时需要的传输频带。
并且,本发明涉及的音频编码信息传输装置,具有:发送装置,用于发送编码后的音频信号的比特流;以及接收装置,包括:解码单元,接收编码后的音频信号的比特流,对在输入后的比特流中包含的编码帧的频率参数进行解码;以及逆时间频率转换单元,按每个预定的时间频率转换帧长度,对所述频率参数进行逆时间频率转换,来转换为音频信号,所述音频编码信息传输装置的特点是,所述发送装置,包括:信息记忆单元,保存编码后的音频信号的比特流;开关单元,使所述比特流的发送导通或中断;以及第四再生速度转换单元,根据再生速度转换的指示和在所述比特流中包含的帧标识符,控制所述开关,并且,在所述比特流中包含基音周期信息,该基音周期信息表示音频信号的基音周期,并且,所述逆时间频率转换后的音频信号是,按照所述时间频率转换帧长度,对预先根据所述基音周期成帧后的音频信号进行波形变形而成的,所述接收装置,包括:比特流分离单元,分离在所述输入比特流中包含的基音周期信息;第二波形变形单元,根据所述基音周期信息,将所述时间频率转换帧长度的音频信号变形为所述基音周期长度的音频信号;以及波形连接单元,使变形后的基音周期长度的音频信号连接。
据此,可以将由接收装置接收的信息传输量减少到与普通的比特率相等的度,并且可以将在接收装置的解码处理量减少到与普通的解码处理相等的程度。
并且,本发明不仅可以实现为这些音频编码装置、音频解码装置以及音频编码信息传输装置,也可以实现为将由这些音频编码装置、音频解码装置以及音频编码信息传输装置具有的特征性单元作为步骤的音频编码方法、音频解码方法等,或可以实现为使计算机执行这些步骤的程序。而且,当然,这些程序可以通过CD-ROM等存储介质或互联网等传输介质来分发。
根据上述说明可见,根据本发明涉及的音频编码装置、音频解码装置以及音频编码信息传输装置可以实现如下效果,即,可以将信息传输量减少到与普通的比特率相等的程度,并且可以将解码处理量减少到与普通的解码处理相等的程度。
因此,由于根据本发明提高与以往的装置的兼容性,因此在随着信息存储装置的大容量化以及信息获得的方法的多样化而使得个人可视听的信息量飞跃增加的、且对音频的高速再生的需求越来越高的今天,本发明的实用性价值非常高。
附图说明
图1是以往的音频解码装置的结构图。
图2是使用以往的解码装置的***整体的结构图。
图3是本发明的音频编码装置的结构图。
图4是本发明的音频解码装置的结构图。
图5是MDCT的原理图。
图6是示出使用基音周期的再生速度转换的图。
图7是示出使用MDCT窗的再生速度转换的图。
图8是示出编码处理中的波形变形处理的图。
图9是示出解码处理中的波形变形处理的图。
图10是帧相加处理中的编码帧之间的关系图。
图11是本发明的音频编码装置的结构图。
图12是本发明的音频编码装置的结构图。
图13是示出编码处理中的波形变形处理的图。
图14示出帧相加处理中的编码帧之间的关系图。
图15是本发明的音频编码装置的结构图。
图16是比特流的结构图。
图17是比特流的结构图。
图18是本发明的音频解码装置的结构图。
图19是本发明的音频解码装置的结构图。
图20是本发明的音频编码信息传输装置的结构图。
符号说明
10、11、12、13编码装置
20、21、22解码装置
30音频编码信息传输装置
101成帧(Framing)部
102基音检测部
103、604、1001、1301波形变形部
104MDCT部
105MDCT系数编码部
106比特流多路复用部
601、1602比特流分离部
602MDCT系数解码部
603逆MDCT部
605波形连接点
901基音修正部
1302帧标识符生成部
1601、1801信息记忆部
1603再生速度控制部
1604、1803开关
1701缓冲部
1802再生速度控制部
1804发送装置
1805接收装置
具体实施方式
以下,对于本发明的实施方式,用附图进行详细说明。
(实施例1)
图3是示出本发明的实施例1涉及的编码装置的结构的功能方框图。而且,在以下说明中示出作为时间频率转换使用MDCT的例子。但是,MDCT是基于TDAC(Time Domain Aliasing Cancellation:时域混迭取消)非专利文献2技术的转换算法的一个例子,所以也可以取代MDCT而使用基于TDAC技术的任何时间频率转换。而且,图2的***中,取代编码器9100而使用编码装置10。
编码装置10是一种装置,在将PCM等数字化后的音频信号变形的同时进行压缩编码,以使该音频信号可以对应可变速度再生,如图1所示包括:成帧部101、基音检测部102、波形变形部103、MDCT部104、MDCT系数解码部105以及比特流多路复用部106。
而且,波形变形部103包括:切断部103a,按照音频信号的基音周期切断成帧后的音频信号;复制部103b,通过将相邻编码帧的信号波形的一部分复制到当前的编码帧,从而生成时间频率转换帧长度的波形信号;以及窗部103c,进行窗处理,以使在由复制部103b生成后的时间频率转换帧长度的波形信号不产生不连续点。
输入音频信号107,被输入到成帧部101以及基音检测部102。
基音检测部102,分析输入音频信号107,并输出基音周期108。
成帧部101,参照基音周期108,将输入音频信号107分割为基音周期长度的编码帧信号109。
波形变形部103,将编码帧信号109变形,以使可以进行MDCT转换。而且,对于波形变形部103的工作,在后面进行详细说明。
变形后的MDCT帧信号110,在MDCT部104被转换为MDCT系数111。
MDCT系数编码部105,对MDCT系数111进行编码,输出MDCT编码信息112。
比特流多路复用部106,将MDCT编码信息112与基音周期108进行多路复用,来构成输出比特流113。
在此,对于MDCT系数编码部105,可以使用矢量量化以及熵编码等公知的任何编码方法,但是,由于不是本发明的要点,因此省略详细说明。
根据所使用的MDCT系数编码部105的结构不同,MDCT编码信息112的内容也不同,MDCT编码信息112除了包含直接表示MDCT系数的代码以外,还可以包含用于对MDCT系数高效率地进行编码的补助信息。例如,在作为MDCT系数编码部105使用MPEG AAC方式的情况下,作为补助信息包含比例因子(scale factor)信息、混合立体声(joint stereo)信息以及预测系数信息等。
图4是示出本发明的解码装置的结构的功能方框图。而且,解码装置20可以取代图2的***中的解码器9300以及速度转换器9400而使用解码装置20。
如图4所示,解码装置20包括:比特流分离部601、MDCT系数解码部602、逆MDCT部603、波形变形部604以及波形连接部605。
而且,波形变形部604包括:用于进行与波形变形部103相反的工作的切断部604a、窗部604b以及连接部604c。
比特流分离部601,将输入比特流606分离为MDCT系数607以及基音周期610。
MDCT系数解码部602,对MDCT系数607进行解码,从而获得MDCT系数608。在此,作为MDCT系数解码部602可以使用公知的任何方法,但是,由于不是本发明的要点,因此省略详细说明。根据所使用的MDCT系数解码部602的结构不同,被输入到MDCT系数解码部602的MDCT系数607的内容也不同,除了包含直接表示MDCT系数的代码以外,还可以包含用于对MDCT系数高效率地进行编码的补助信息。例如,在作为MDCT系数解码部602使用MPEG AAC方式的情况下,作为补助信息包含比例因子信息、混合立体声信息以及预测系数信息等。
逆MDCT部603,对MDCT系数618进行逆转换,从而获得帧解码信号609。
波形变形部604,参照基音周期610将帧解码信号609变形,输出变形后的帧解码信号611。对于波形变形部604的工作,在后面进行详细说明。
波形连接部605,使变形后的帧解码信号611连接,来生成输出音频信号612。
下面,将对编码装置10的波形变形部103的工作进行详细说明,于是,首先对作为处理的前提的MDCT转换(逆MDCT转换)以及其特性进行说明。
图5是MDCT的解码原理图。
MDCT,基于称为TDAC的技术,通过在相邻的编码帧间的时间信号中进行重叠处理,从而在时间信号上进行混叠取消。
在图5中,201示出在第n-1帧的MDCT帧的波形信号,202示出在第n帧的MDCT帧的波形信号。
在编码帧长度是N采样的情况下,MDCT帧长度是2N采样。并且,在相邻MDCT帧之间存在相当于MDCT帧长度的一半的N采样的重叠203,该重叠部分成为解码后的帧波形信号。在波形信号201中相当于重叠部分的区间(MDCT帧后半)包括实际信号成分204以及混叠成分205。同样,在波形信号202中相当于重叠部分的区间(MDCT帧前半)包括实际信号成分206以及混叠成分207。在此,实际信号成分204与实际信号成分206是相位相同的信号,反而,混叠成分205与混叠成分207是相位相反的信号。实际信号成分204以及混叠成分205乘以第一窗函数208,并且,实际信号成分206以及混叠成分207乘以第二窗函数209,然后使所有信号相加。
在此,在第一窗函数是f(t)、第二窗函数是g(t)的情况下,第一窗函数208以及第二窗函数209应当满足公式(1)。
公式1
f2(t)+g2(t)=1(0≤t<N)
……(1)
通过相加处理,由于混叠成分205与混叠成分207是相位相反的信号,因此相互抵消后变为0,实际信号成分204与实际信号成分206的相加部分成为解码后的帧波形信号211。
根据该说明可见,在逆MDCT转换中,对于第n的MDCT帧波形信号的2N采样被输入,相当于输入MDCT帧的前半部分的N采样被输出。
其次,示出使用基音周期的再生速度转换的原理、以及与MDCT转换的共通性。
图6是使用基音周期的再生速度转换的原理图。
在图6中,301是第n-1帧的波形信号,302是第n帧的波形信号,303是第n+1帧的波形信号。并且,各个帧的长度是基音周期即L采样。
波形信号302乘以第三窗函数304,并且,波形信号303乘以第四窗函数305,然后使它们相加,从而获得相加后的帧波形信号306。
在此,在第三窗函数是p(t)、第四窗函数是q(t)的情况下,以公式(2)表示第三窗函数304与第四窗函数305的关系。
公式2
p(t)+q(t)=1(0≤t<L)
……(2)
与公式(1)比较,没有各个窗函数的二乘项,其理由是;在MDCT中,在转换时和逆转换时分别乘以窗,即,共计乘二次,对此,在该例子中,只在速度转换处理时乘一次。
在将波形信号301作为输出方的第k-1帧的波形信号307、将相加后的帧波形信号306作为第k帧的波形信号308的情况下,再生速度转换处理会结束。
如此可见,基于MDCT以及基音波形的再生速度转换处理,都使用使用窗函数的重叠相加处理。
如上所述,使用MDCT窗来可以进行再生速度转换处理。
图7是使用MDCT窗的再生速度转换的原理图。
在普通的逆MDCT转换中,重叠并相加第n-1的MDCT帧401的后半部分和第n的MDCT帧402的前半部分,不过,在此,重叠并相加第n-1的MDCT帧401的后半部分和第n+1的MDCT帧403的前半部分。与如上所述的普通的MDCT的例子相同,通过使混叠成分405和混叠成分407相加,混叠成分405和混叠成分407被取消,通过使实际信号成分404和实际信号成分406相加,实际信号成分404和实际信号成分406被解码为帧波形信号410。在将对第n-1的MDCT帧的解码帧波形信号作为输出方的第k-1帧的波形信号411、将帧波形信号410作为输出方的第k帧的波形信号412的情况下,再生速度转换处理会结束。
在该处理中,由于完全不使用第n的MDCT帧的波形信号402,因此不需要第n的MDCT帧的波形信号402的传输以及解码处理,并且在进行再生速度转换时的处理量等于在不进行再生速度转换时的处理量。即,不增加处理量也可以进行再生速度转换。
在此,如用图6说明,为了使用基音周期进行再生速度转换,应当编码帧长度N等于基音周期L。
然而,由于按照输入音频信号的状态不同,基音周期L也不同,因此应当将编码帧长度N作为与基音周期L同步的可变长度。
然而,一般而言,编码帧长度N是二乘方(例如512,1024等),且固定的。其理由是,通过使用FFT(快速傅里叶变换)的高速转换,可以容易地实现二乘方采样的MDCT。并且,对于除二乘方以外的帧长度,也可以实现高速转换,不过,需要按每个帧长度变更转换算法,因此将除二乘方以外的帧长度作为基音周期L同步的可变长度是不符合现实的。
因此,需要将基音周期L采样的波形信号转换为预定长度的波形信号,优选的是,转换为以二乘方表示的采样数N的波形信号。
波形变形部103具备的功能是,将基音周期L采样的波形信号转换为编码帧长度N采样的波形信号。
图8是示出波形变形部103的工作的一个例子的图。
与第n-1、第n、第n+1的基音周期帧分别相对应的波形信号501、502、503具有等于基音周期L的长度。在该例子中假设,L≤N的关系。
以基音周期长度L采样分割后的波形信号,重新被布置到基于编码帧N采样的帧。在图8中,波形信号501被布置到编码帧506的区域,波形信号502被布置到编码帧507的区域。
此时,若L<N,则在编码帧506内产生不存在波形信号的区间508,因此,向该部分,从下一个帧的开头部分复制采样数与区间508相同的波形信号509。
此时,由于在帧边界510产生不连续点,因此复制后的区间508乘以在帧边界510成为0的减少窗511。同时,区间509也乘以在帧边界510成为0的增加窗512。
在减少窗511是r(t)、增加窗512是s(t),且任何窗的开始位置为t=0的情况下,减少窗511和增加窗512满足公式(3)的关系。
公式3
r2(t)+s2(t)=1(0≤t<N-L)
……(3)
通过在所有编码帧边界进行基音周期长度L采样的波形信号的切断、上述波形信号的复制以及乘窗,从而获得变形后的波形信号513。
如此获得的波形信号513,变成以编码帧长度N为基音周期的时间波形,并且可以满足下列条件,即,为了实现使用MDCT窗的再生速度转换的条件、基音周期等于编码帧长度的条件。
变形后的波形信号513,作为在图3中变形后的MDCT帧信号110被输出,在MDCT部104,与普通的MDCT转换相同,使用2N采样长度的MDCT窗505被转换。
下面,说明解码装置20的波形变形部604的工作。
图9是波形变形部604的工作的说明图。
在图9中,701是第n帧的帧解码信号,702是第n+1帧的帧解码信号,703是从第n-1帧的最后起N-L采样的帧解码信号。在此,N是编码帧的采样数,L是以基音周期610表示的基音周期的采样数。
在第n帧的帧解码信号702被输入了的情况下,从此开头起N-L采样乘以增加窗705。前帧的解码信号703乘以减少窗704。
在减少窗704是r(t)、增加窗705是s(t)的情况下,减少窗704和增加窗705满足公式(4)的关系。
公式4
r2(t)+s2(t)=1(0≤t<N-L)
……(4)
并且,减少窗704和增加窗705分别等于在编码处理中所用的减少窗511和增加窗512。乘窗后的各个信号被相加,从而生成区间706的波形信号。
对于区间707的波形信号,直接使用输入后的第n帧的帧编码信号702。
区间708的波形信号被保存,以使用于第n+1帧的解码处理。
使区间706的波形信号与区间707的波形信号连接而成的信号709,成为从波形变形部604输出的变形后的帧解码信号611。
通过该处理,N采样的帧解码信号,被变形为等于基音周期的采样数的、L采样的解码信号。变形后的L采样的解码信号,等于在编码处理中分割后的、L采样的基音波形信号。
对于上述结构,在解码装置中等速再生时的处理和可变速度再生时的处理是完全相同。
并且,可以将从编码装置10到解码装置20的信息传输量减少到与等速再生时相等的程度,并且可以将在解码装置20中的处理量减少到与等速再生时的解码处理相等的程度的处理量。
而且,在进行可变速度再生的情况下,例如以2倍速进行再生的情况下,跳跃对频率参数进行解码的解码处理,来转换音频信号的再生速度即可。
据此,由于通过操作比特流可以进行可变速度再生,因此减少对解码需要的处理量。并且,由于减少对解码处理需要的比特流量,因此减少可变速度再生时需要的传输频带。
然而,在上述说明中假设,基音周期L是一定的固定值,不过,实际上按照输入音频信号的状态不同基音周期也不同。
据此,在下面说明,为了对可变的基音周期L准确地进行编码处理以及解码处理的条件。
图10是示出在MDCT转换中的帧相加处理的图。
在图10中,801是第n-1的MDCT帧的前半区间的信号波形,802是第n-1的MDCT帧的后半区间的波形信号,803是第n的MDCT帧的前半区间的信号波形,804是第n的MDCT帧的后半区间的波形信号,805是第n+1的MDCT帧的前半区间的信号波形,806是第n+1的MDCT帧的后半区间的波形信号。
在不进行再生速度转换的情况下,区间802和区间803被相加,区间804和区间805被相加。对此,在进行再生速度转换、且跳跃第n的MDCT帧的情况下,区间802和区间805被相加。
由于在解码处理中被相加的两个区间的基音周期应当相同,因此在区间802和区间805设定的基音周期应当相同。同时,这意味着,在第n的帧中在区间803和区间804设定的基音周期应当相同。
反而,在区间803和区间804的基音周期不同的情况下,必然在区间802和区间805的基音周期也不同,则在两者之间不能进行相加处理。通过在区间803和区间804设定相同基音周期,从而对与第n的编码帧和第n+1的编码帧分别对应的比特流,表示相同基音周期的信息被多路复用。
而且,对于不允许帧跳跃的MDCT帧,可以前半区间和后半区间的基音周期不同。例如,可以区间801和区间802(等于区间803)的基音周期不同,在此情况下,对与第n-1的编码帧和第n的编码帧分别对应的比特流,表示分别不同的基音周期的信息被多路复用。
为了通过MDCT帧的跳跃实现任意的再生速度转换,需要以由请求条件所定的频度存在可以跳跃的MDCT帧。如上所述,为了生成可以跳跃的MDCT帧,在该前半区间和后半区间设定相同基音周期即可,不过,在很多情况下,从输入音频信号中检测出的基音周期是在每个区间不同的。
为了解决该问题,修正从输入音频信号中检测出的基音周期,将一个MDCT帧的前半部区间和后半区间的基音周期作为相同基音周期来处理即可。
图11是示出编码装置11的结构的功能方框图。
该编码装置11的结构是;对图3所示的本发明的编码装置10追加基音修正部901,向成帧部101以及比特流分离部106输出修正后的基音周期902而取代基音周期108。
基音修正部901参照被输入的基音周期108,以预定的频度,对相邻的两个编码帧设定相同基音周期,从而作为修正后的基音周期902输出。
基音周期的修正方法有以下方法等;求出相邻的两个编码帧的各个基音周期的平均值,将求出后的平均基音周期作为所述相邻的两个编码帧的共通基音周期。
修正后的基音周期902被输入到成帧部101后的处理,与用图3说明的处理相同。根据这些结构,可以设定以预定的、任意的频度可以进行跳跃处理的MDCT帧,结果可以实现任意的再生速度转换。
而且,在上述说明的例子中,在一个编码帧内布置有一个周期的基音波形信号,不过,当然可以,将两个或更多周期的基音波形信号作为新的一个周期的基音波形信号来使用。
在该结构中,在一个2N采样的MDCT帧内包含偶数个基音波形信号。
(实施例2)
在本发明的编码装置以及解码装置中,编码帧长度N和基音周期L的关系很重要。
例如,在成立L>N的关系的情况下,不能适用实施例1的技术,并且,在L比N非常小的情况下,相对而言增加重叠区间,导致编码效率的降低。
为了解决该课题,在实施例2中示出结构,该结构也可以适用于如下情况,即,在L>N、或2N采样的MDCT帧内存在奇数个基音周期。
图12是示出实施例2涉及的编码装置12的结构的功能方框图。
编码装置12的结构是:针对图3所示的编码装置10的结构包括第二波形变形部1001而取代波形变形部103,将基音周期108也输入到第二波形变形部1001,将在波形变形部1001生成的新的第二基音周期1002输入到比特流多路复用部106。
图13是示出实施例2的波形变形部1001的工作的图。
基音波形信号1101被分割为波形信号1102以及波形信号1103,分别L1≤N、L2≤N。L1和L2的采样数是任意的,可以相同也可以不同。
区间1105的波形信号被复制到N-L1采样的区间1104。同样,区间1107的波形信号被复制到N-L2采样的区间1106。此时,编码帧边界1108以及编码帧边界1109成为不连续点。
为了解除这些不连续点,例如,复制后的区间1104乘以在帧边界成为0的减少窗1110。并且,作为复制源的区间1105乘以在帧边界成为0的增加窗1111。对不连续点1109的前后的区间1106以及区间1107也进行同样的处理。
通过所述变形处理,L采样的基音波形信号1101被变形为与2N采样的MDCT帧相对应的波形信号1112。波形信号1112,作为变形后的MDCT帧信号110被输出,并且,进行MDCT转换后被编码。并且,L1、L2,作为第二基音周期1002被输出,即,作为与各自的编码帧相对应的基音周期被输出。编码后的MDCT系数和第二基音周期信息,在比特流多路复用部106被多路复用。
对于上述变形后的、编码后的波形信号1112,在不进行再生速度转换的情况下,可以通过与实施例1所述的解码装置相同的处理解码。即,对实施例1以及实施例2的编码装置可以使用同一解码装置。并且,在进行再生速度转换的情况下,由于只MDCT帧的跳跃方法不同,因此也可以使用同一解码装置。
图14是在由实施例2的编码装置编码的比特流中的、以MDCT帧的跳跃的再生速度转换的说明图。
在实施例1中,MDCT帧内的波形信号是,以编码帧长度N采样为周期的信号。对此,在实施例2中MDCT帧内的波形信号是,以编码帧长度2N采样为周期的信号。在该情况下,以编码帧为单位看波形信号时,以一个帧的间隔出现同一模式。即,在图14中,在普通的转换时,对区间1202进行相加的区间是区间1203,在第n+2的MDCT帧中的区间1207出现与区间1203同一的模式。因此,为了实现以MDCT帧的跳跃的再生速度转换,跳跃第n和第n+1的两个MDCT帧,以使区间1203和区间1207相加即可。
而且,对于该结构,虽然不能对应于成为L>2N的基音周期,不过在将N设定为较大的值的情况下,不会导致实用性问题。例如,在N=1024采样的情况下,不可对应的最小基音周期为2049采样。该例子相当于在48kHz采样的信号中的23.4Hz左右,不过,普通的音乐或语音信号很少具有如此很长的基音周期。
而且,与实施例1的例子相同,在本实施例2的例子中也可以如下构成,即,设置基音修正部901,并使用修正后的基音周期来进行成帧处理以及波形变形处理。
根据这些结构,可以以预定的、任意的频度设定可以进行跳跃处理的MDCT帧,结果可以实现任意的再生速度转换。
而且,可以将实施例1的编码装置和实施例2的编码装置共通化。即,设置具有波形变形部103和第二波形变形部1001两者的功能的第三波形变形单元,根据存在于MDCT帧内的基音波形信号的数量,在该数量是偶数的情况下和奇数的情况下,切换波形变形部103和第二波形变形部1001的功能即可。
在此,用于波形变形部103的基音周期和用于第二波形变形部1001的第二基音周期1002,都是表示从0到N采样的长度的信息,因此可以作为完全同一的编码信息来处理。因此,在选择了波形变形部103的功能的情况下,将输入后的基音周期108或修正后的基音周期902作为第二基音周期1002直接输出即可。根据该结构,即使输入信号具有任何基音周期,也可以进行适当的编码处理,从而可以提高编码效率。
而且,在上述所有的波形变形部的说明中,虽然分割后的基音波形信号,在MCDT帧中从各个编码帧边界的开头被布置,不过该分割后的基音波形信号的布置是任意的。即,对于被布置在各个编码帧的任意位置的基音波形信号,向在该前后发生的无信号区间分别从被布置在前后的帧的基音波形信号复制本来是连续的区间的波形信号,从而生成编码帧长度的信号即可。与基音波形信号的布置无关,在编码帧的长度是N、基音周期是L的情况下,在编码帧边界中用于乘窗处理的减少窗以及增加窗的长度是N-L。在编码装置中的、分割后的基音波形信号的布置的这些相异,只作为编码后的音频信号的相位的差异出现,而对解码装置的结构以及处理没有任何影响。
(实施例3)
图15是实施例3中的本发明的编码装置的结构图。
如图15所示,该编码装置13与图11的编码装置11不同的结构是:包括第三波形变形部1301而取代波形变形部103,并将修正后的基音周期902输入到第三波形变形部1301;以及设置帧标识符生成部1302,根据由第三波形变形部1301输出的帧跳跃信息1304生成帧标识符1305,并且,将由第三波形变形部1301输出的第二基音周期1303和帧标识符1305输入到比特流多路复用部106。
下面,说明本结构的追加功能,即,帧跳跃信息1304和帧标识符1305、以及第三波形变形部1301和帧标识符生成部1302的工作。
第三波形变形部1301,根据输入后的基音信息,以在一个MDCT帧中包含的基音波形信号的数量以及在两个或更多的相邻帧间的基音周期的同一性为基准,检测可以跳跃的编码帧。
如上所述,在一个MDCT帧中包含的基音波形信号的数量是偶数的情况下,可以以单独跳跃一个编码帧,并且,在一个MDCT帧中包含的基音波形信号的数量是奇数的情况下,需要以连续的两个编码帧为一组来跳跃。
因此,在帧跳跃信息1304中包括两个信息,即,(A)表示当前的编码帧是否可以跳跃的帧的信息,以及(B)表示在MDCT帧中包含的基音波形信号的数量是偶数还是奇数的信息。
帧标识符生成部1302,根据帧跳跃信息1304生成给予当前的编码帧的帧标识符1305。
对于将生成的帧标识符,若可以区别如下三种,则可以是任何值,该三种是:(1)不可跳跃的编码帧;(2)可以跳跃,并且在MDCT帧中包含的基音波形信号的数量是偶数;以及(3)可以跳跃,并且在MDCT帧中包含的基音波形信号的数量是奇数,作为一个例子,可以将对(1)的条件设定的值“0”、对(2)的条件设定的值“1”、对(2)的条件设定的值“2”作为帧标识符。
图16是对帧标识符1305进行多路复用后的比特流的一个例子,作为帧标识符给予“0”和“1”。
在第n编码帧的比特流中,布置有帧标识符域1401和编码信息域1402。在帧标识符域1401写入帧标识符1305,在编码信息域写入MDCT编码信息112以及基音周期1303。由于帧标识符“1”表示可以以单独跳跃编码帧,因此,如图16所示,可以互相存在编码帧“0”和“1”
并且,图17是对帧标识符1305进行多路复用后的比特流的一个例子,作为帧标识符给予“0”和“2”。
由于帧标识符“2”表示可以以连续的两个编码帧为一组来跳跃,因此帧标识符“2”被写入到连续的两个编码帧的帧标识符域1503和帧标识符域1504。
而且,可以进一步将对应(3)的条件的标识符细分化。即,也可以是,在连续的两个编码帧中,向前面的编码帧分配帧标识符“2”,向后面的编码帧分配帧标识符“3”。通过给予这些帧标识符获得如下优点,即,在从比特流的中途再生的情况下等,也可以立刻判断是否可以跳跃帧。
并且,也可以限制所用的帧标识符的种类。例如,若在满足(3)的条件时不允许跳跃帧,则只需要与(1)和(2)的条件相对应的标识符,因此可以减少对描述帧标识符需要的信息量。
而且,在图16以及图17中,虽然帧标识符域按每个编码帧被布置在比特流的开头,不过该位置是任意的。
(实施例4)
图18是本发明的实施例4涉及的解码装置21的结构的功能方框图。
在解码装置21的信息记忆部1601记忆,例如由本发明的实施例3的编码装置编码后的比特流。作为信息记忆部1601可以使用光学盘、磁盘以及半导体存储器等。由信息记忆部1601读出后的比特流1605,在比特流分离部1602被分离为MDCT代码607、基音周期610以及帧标识符1607。
再生速度控制部1603,根据由外部提供的再生速度转换的指示1606,算出为了实现所指示的再生速度需要的帧跳跃处理的频度。例如,以公式(5)表示为了获得k倍速再生速度需要的帧跳跃处理的频度f。
公式5
k=总帧数/解码帧数
f=跳跃帧数/总帧数
 =(总帧数-解码帧数)/总帧数
 =1.0-1.0/k
……(5)
例如,为了实现2倍速,由于将k=2.0代入来得到f=0.5,因此跳跃总帧数的50%。
再生速度控制部1603,参照帧标识符1607,根据算出后的帧跳跃处理的频度f,来跳跃可以进行跳跃帧的编码帧。具体而言,对于判断为进行帧跳跃处理的编码帧,控制开关1604来遮断发送MDCT代码607以及基音周期610。
从MDCT系数解码部602到波形连接部605的处理是,与在上面用图4说明的本发明的解码装置的处理相同。波形连接部605输出再生速度转换后的输出音频信号612。
而且,在上述说明中,可以使再生速度控制部1603具备如下功能,即,参照基音周期610来调整帧跳跃处理的频度f。在本发明的解码装置中,由波形变形部604输出的、以编码帧为单位的帧解码信号611的时间长度,依赖于设定在该编码帧的基音周期610。一般而言,由于基音周期的变化很顺利,因此相邻编码帧间的基音周期的变化小,在此条件下会成立公式5的关系。然而,在基音周期的变化大的区间,在由公式5算出的帧跳跃处理的频度f与实际帧跳跃处理的频度f之间会产生差距。为了校正该差距,在再生速度控制部1603,参照基音周期610来求出在各个编码帧中的准确的解码信号的时间长度,并且根据该结果来调整帧跳跃处理的频度f即可。
而且,如图19所示,也可以如下构成,即,将输出后的波形连接605临时保存到缓冲部1701后,作为固定帧长度的解码音频信号输出。
如上所述,在本发明的解码装置中,由波形变形部604输出的、以编码帧为单位的帧解码信号611的时间长度,依赖于设定在该编码帧的基音周期610。因此,输出音频信号612的时间采样数也会变动。于是,将输出解码音频信号临时存储到缓冲部1701,以预定的一定的间隔作为固定采样长度的音频信号来提取,从而可以获得固定帧长度的输出音频信号1702。通过将输出音频信号为固定帧长度,从而产生优点,即,可以容易处理输出音频信号。
(实施例5)
图20是本发明的实施例5涉及的编码信息传输装置的结构图。
在本结构中,通过传输路1807使发送装置1804与接收装置1805相连接,所述发送装置1804包括:信息记忆部1801、再生速度控制部1802以及开关1803,所述接收装置1805包括:比特流分离部601、MDCT系数解码部602、逆MDCT部603、波形变形部604以及波形连接部605。
接收装置1805的结构以及工作,与用图4所示的本发明的解码装置相同。
在信息记忆部1801记忆例如由本发明的实施例3的编码信息传输装置编码后的比特流。
再生速度转换的指示1808通过传输路1807被传送到发送装置1804。
再生速度控制部1802,根据再生速度转换的指示1808,参照从信息记忆部1801读出的比特流1806中包含的帧标识符信息,或参照帧标识符信息和基音周期信息,来控制开关1803。再生速度控制部1802的详细工作,与本发明的实施例4说明的再生速度控制部1603的工作相同。
开关1803,以编码帧为单位,使比特流1806的发送导通或中断。通过开关1803后的比特流,通过传输路1807,作为输入比特流1809被输入到接收装置1805。
对于本结构的解码装置,在发送装置1804中会结束关于再生速度转换的所有处理。据此,在接收装置中,不需要关于再生速度转换的一切处理,并且,不会产生因进行再生速度转换而引起的接收装置的处理量的增加。
并且,由于通过开关1803只发送相当于再生速度转换后的输出音频信号的编码帧的比特流,因此通过传输路1807被传输的比特流的每个时间的信息量会与不进行再生速度转换的情况下大致相同。即,既不增加每个时间的传输信息量,也可以进行再生速度转换。
而且,对于传输路1807,若可以进行再生速度转换的指示1808以及比特流1809的传输,则与有线、无线无关,并且,可以使用任何传输协议。
(其它变形例)
而且,虽然根据上述实施例说明了本发明,但是当然本发明不仅限于上述实施例。本发明也包括以下情况。
(1)具体而言,上述各个装置是计算机***,该计算机***包括微型处理器、ROM、RAM、硬盘组合、显示器组合、键盘以及鼠标等。所述RAM或硬盘组合记忆计算机程序。通过根据所述计算机程序使所述微型处理器工作,从而各个装置实现其功能。在此,使多个指令码组合来构成计算机程序,以使实现预定的功能,该指令码示出对计算机的指令。
(2)也可以是,构成上述各个装置的结构要素的一部分或全部包括一个***LSI(Large Scale Integration:大规模集成电路)。***LSI是,在制造上将多个结构部集成在一个芯片上的超多功能LSI,具体而言,该***LSI是包括微型处理器、ROM以及RAM等的计算机***。所述RAM记忆计算机程序。因此,通过根据所述计算机程序使所述微型处理器工作,从而***LSI实现其功能。
(3)也可以是,构成上述各个装置的结构要素的一部分或全部包括对各个装置可装卸的IC卡或单体模块。所述IC卡或所述模块是包括微型处理器、ROM、RAM等的计算机***。也可以是,所述IC卡或所述模块包括上述超多功能LSI。通过根据计算机程序使微型处理器工作,从而所述IC卡或所述模块实现其功能。也可以是,该IC卡或该模块具有抗窜改性。
(4)本发明也可以是示出上述内容的方法。并且,本发明也可以是计算机程序,该计算机程序使计算机实现这些方法,本发明还可以是由所述计算机程序而成的数字信号。
并且,本发明也可以是,记录所述计算机程序或所述数字信号的计算机可读的存储介质,例如,软盘、硬盘、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray Disc)以及半导体存储器等。并且,也可以是,记录在这些存储介质的所述数字信号。
并且,也可以是,本发明,将所述计算机程序或所述数字信号经由以电气通信电路、无线或有线通信电路、互联网为代表的网络、数据广播等来传输。
并且,也可以是,本发明是具有微型处理器和存储器的计算机***,所述存储器记忆所述计算机程序,根据所述计算机程序使所述微型处理器工作。
并且,也可以是,通过将所述计算机程序或所述数字信号记录到所述存储介质来转送,或者,通过将所述计算机程序或所述数字信号经由所述网络等来转送,从而由独立的其它计算机***实施本发明。
(5)也可以是,将上述实施例以及上述变形例分别组合。
本发明可以适用于一种装置,该装置是将压缩编码后的声音或音频信号从存储介质直接地、或通过传输路读出,对原声音或音频信号进行再生速度转换并解码的装置,本发明可以普遍适用于例如移动电话、音乐播放器等机器。具体而言,可以适用于将光学盘、磁盘、半导体存储器等作为存储介质的声音、音乐播放器,以及声音、音乐、视频等的点播分发等。
权利要求书(按照条约第19条的修改)
1. (修改后)一种音频编码装置,具有:时间频率转换单元,按每个预定的时间频率转换帧长度,将所输入的音频信号转换为频率参数;以及编码单元,对该频率参数进行编码,
所述音频编码装置,其特征在于,包括:
基音周期检测单元,检测所述音频信号的基音周期;
成帧单元,根据检测出的基音周期,对输入音频信号进行成帧;
第一波形变形单元,按照所述时间频率转换帧长度,对根据所述基音周期成帧后的音频信号进行波形变形,将波形变形后的音频信号输出到所述时间频率转换单元;以及
多路复用单元,对由所述编码单元编码后的频率参数和所述基音周期进行多路复用,而作为比特流输出,
所述第一波形变形单元,具有:
第一切断单元,按照所述基音周期,切断所述成帧后的音频信号;以及
第一复制单元,通过将相邻编码帧中的基音周期的波形信号的一部分复制到当前的编码帧中的基音周期的波形信号与所述相邻编码帧中的基音周期的波形信号之间,从而生成所述时间频率转换帧长度的波形变形后的音频信号。
2. (修改后)如权利要求1所述的音频编码装置,其特征在于,
所述第一波形变形单元,还具有:
第一窗处理单元,进行窗处理,以使由所述第一复制单元生成的、所述时间频率转换帧长度的波形信号不产生不连续点,
所述第一窗处理单元,在成为不连续点的编码帧边界的前后,在编码帧长度是N采样、布置在编码帧的基音波形信号的长度是L采样的情况下,生成(N-L)采样长度的减少窗和增加窗,时间上在前的编码帧的后端部分乘以所述减少窗,后续的编码帧的开头部分乘以增加窗。
3. (修改后)如权利要求1所述的音频编码装置,其特征在于,
在由所述时间频率转换单元转换的波形信号中包含偶数个基音波形信号。
4. (修改后)如权利要求1所述的音频编码装置,其特征在于,
在由所述时间频率转换单元转换的波形信号中包含奇数个基音波形信号。
5. (修改后)如权利要求1所述的音频编码装置,其特征在于,
所述时间频率转换单元是MDCT单元,
所述频率参数是MDCT系数。
6. (修改后)如权利要求1所述的音频编码装置,其特征在于,
所述音频编码装置,还包括:
帧标识符生成单元,按照所述基音周期以及在所述时间频率转换帧长度的波形信号中包含的基音波形信号的数量,判断是否可以进行编码帧的跳跃处理,并且,根据判断结果生成帧标识符,
所述多路复用单元,将生成后的帧标识符多路复用到所述比特流中。
7. (修改后)一种音频解码装置,具有:解码单元,对在输入后的比特流中包含的编码帧的频率参数进行解码;以及逆时间频率转换单元,按每个预定的时间频率转换帧长度,对所述频率参数进行逆时间频率转换,以成为音频信号,
在所述比特流中包含基音周期信息,该基音周期信息表示音频信号的基音周期,
所述逆时间频率转换后的音频信号是,按照所述时间频率转换帧长度,对预先根据所述基音周期成帧后的音频信号进行波形变形,并且,将相邻编码帧中的基音周期的波形信号的一部分复制到当前的编码帧中的基音周期的波形信号与所述相邻编码帧中的基音周期的波形信号之间,从而波形变形为所述时间频率转换帧长度的音频信号,
所述音频解码装置,其特征在于,包括:
比特流分离单元,分离在所述输入比特流中包含的基音周期信息;
第二波形变形单元,根据所述基音周期信息,将所述时间频率转换帧长度的音频信号变形为所述基音周期长度的音频信号;以及
波形连接单元,使变形后的基音周期长度的音频信号连接,
所述第二波形变形单元,具有:
删除单元,删除被复制到所述当前的编码帧中的基音周期的波形信号与所述相邻编码帧中的基音周期的波形信号之间的、相邻编码帧中的基音周期的波形信号的一部分,
所述波形连接单元,使删除所述相邻编码帧中的基音周期的波形信号的一部分后剩下的相邻编码帧中的基音周期的波形信号与当前的编码帧中的基音周期的波形信号连接。
8. (修改后)如权利要求7所述的音频解码装置,其特征在于,
所述时间频率转换帧长度的波形信号被实施窗处理,即,在成为不连续点的编码帧边界的前后,在编码帧长度是N采样、布置在编码帧的基音波形信号的长度是L采样的情况下,生成(N-L)采样长度的减少窗和增加窗,时间上在前的编码帧的后端部分乘以所述减少窗,后续的编码帧的开头部分乘以增加窗,
所述第二波形变形单元,还具有:第二窗处理单元,在所述成为不连续点的编码帧边界的前后,生成(N-L)采样长度的减少窗和增加窗,在所述删除单元进行删除之前,时间上在前的编码帧的后端部分乘以所述减少窗,后续的编码帧的开头部分乘以增加窗。
9. (修改后)如权利要求7所述的音频解码装置,其特征在于,
所述音频解码装置,还包括:
第一再生速度转换单元,跳跃对所述频率参数进行解码的解码处理,而使音频信号的再生速度转换。
10. (修改后)如权利要求7所述的音频解码装置,其特征在于,包括:
开关单元,使所述频率参数以及基音周期的传输导通或中断;以及
第二再生速度转换单元,根据再生速度转换的指示和在输入比特流中包含的帧标识符,控制所述开关单元,
所述第二再生速度转换单元,通过使所述频率参数以及基音周期的传输中断,从而使再生速度转换。
11. (修改后)如权利要求7所述的音频解码装置,其特征在于,包括:
开关单元,使频率参数以及基音周期的传输导通或中断;以及
第三再生速度转换单元,根据再生速度转换的指示和在输入比特流中包含的基音周期以及帧标识符,控制所述开关单元,
所述第三再生速度转换单元,通过使所述频率参数以及基音周期的传输中断,从而使再生速度转换。
12. (修改后)如权利要求7所述的音频解码装置,其特征在于,
所述逆时间频率转换单元是逆MDCT单元,
所述频率参数是MDCT系数。
13. (修改后)一种音频编码信息传输装置,具有:发送装置,用于发送编码后的音频信号的比特流;以及接收装置,包括:解码单元,接收编码后的音频信号的比特流,对在输入后的比特流中包含的编码帧的频率参数进行解码;以及逆时间频率转换单元,按每个预定的时间频率转换帧长度,对所述频率参数进行逆时间频率转换,以成为音频信号,
所述音频编码信息传输装置,其特征在于,
所述发送装置,包括:
信息记忆单元,保存编码后的音频信号的比特流;
开关单元,使所述比特流的发送导通或中断;以及
第四再生速度转换单元,根据再生速度转换的指示和在所述比特流中包含的帧标识符,控制所述开关,
在所述比特流中包含基音周期信息,该基音周期信息表示音频信号的基音周期,
所述逆时间频率转换后的音频信号是,按照所述时间频率转换帧长度,对预先根据所述基音周期成帧后的音频信号进行波形变形,并且,将相邻编码帧中的基音周期的波形信号的一部分复制到当前的编码帧中的基音周期的波形信号与所述相邻编码帧中的基音周期的波形信号之间,波形变形为所述时间频率转换帧长度的音频信号,
所述接收装置,包括:
比特流分离单元,分离在所述输入比特流中包含的基音周期信息;
第二波形变形单元,根据所述基音周期信息,将所述时间频率转换帧长度的音频信号变形为所述基音周期长度的音频信号;以及
波形连接单元,使变形后的基音周期长度的音频信号连接,
所述第二波形变形单元,具有删除单元,删除被复制到所述当前的编码帧中的基音周期的波形信号与所述相邻编码帧中的基音周期的波形信号之间的、相邻编码帧中的基音周期的波形信号的一部分,
所述波形连接单元,使删除所述相邻编码帧中的基音周期的波形信号的一部分后剩下的相邻编码帧中的基音周期的波形信号与当前的编码帧中的基音周期的波形信号连接。
14. (修改后)如权利要求13所述的音频编码信息传输装置,其特征在于,
所述时间频率转换帧长度的波形信号被实施窗处理,即,在成为不连续点的编码帧边界的前后,在编码帧长度是N采样、布置在编码帧的基音波形信号的长度是L采样的情况下,生成(N-L)采样长度的减少窗和增加窗,时间上在前的编码帧的后端部分乘以所述减少窗,后续的编码帧的开头部分乘以增加窗,
所述第二波形变形单元,还具有:第二窗处理单元,在所述成为不连续点的编码帧边界的前后,生成(N-L)采样长度的减少窗和增加窗,在所述删除单元进行删除之前,时间上在前的编码帧的后端部分乘以所述减少窗,后续的编码帧的开头部分乘以增加窗。
15. (修改后)如权利要求13所述的音频编码信息传输装置,其特征在于,
所述第四再生速度转换单元,除了参照所述帧标识符以外,还参照所述基音周期信息来控制所述开关。
16. (修改后)一种音频编码方法,具有:转换步骤,按每个预定的时间频率转换帧长度,将所输入的音频信号转换为频率参数;以及编码步骤,对该频率参数进行编码,
所述音频编码方法,其特征在于,包括:
基音周期检测步骤,检测所述音频信号的基音周期;
成帧步骤,根据检测出的基音周期,对输入音频信号进行成帧;
第一波形变形步骤,按照所述时间频率转换帧长度,对根据所述基音周期成帧后的音频信号进行波形变形;以及
多路复用步骤,对由所述编码步骤编码后的频率参数和所述基音周期进行多路复用,而作为比特流输出,
所述第一波形变形步骤,具有:
第一切断步骤,按照所述基音周期,切断所述成帧后的音频信号;以及
第一复制步骤,通过将相邻编码帧中的基音周期的波形信号的一部分复制到当前的编码帧中的基音周期的波形信号与所述相邻编码帧中的基音周期的波形信号之间,从而生成所述时间频率转换帧长度的波形变形后的音频信号。
17. (修改后)一种程序,用于使计算机执行在权利要求16所述的编码方法中包含的步骤。
18. (修改后)一种音频解码方法,具有:解码步骤,对在输入后的比特流中包含的编码帧的频率参数进行解码;以及逆时间频率转换步骤,按每个预定的时间频率转换帧长度,对所述频率参数进行逆时间频率转换,以成为音频信号,
在所述比特流中包含基音周期信息,该基音周期信息表示音频信号的基音周期,
所述逆时间频率转换后的音频信号是,按照所述时间频率转换帧长度,对预先根据所述基音周期成帧后的音频信号进行波形变形,并且,将相邻编码帧中的基音周期的波形信号的一部分复制到当前的编码帧中的基音周期的波形信号与所述相邻编码帧中的基音周期的波形信号之间,从而波形变形为所述时间频率转换帧长度的音频信号,
所述音频解码方法,其特征在于,包括:
比特流分离步骤,分离在所述输入比特流中包含的基音周期信息;
第二波形变形步骤,根据所述基音周期信息,将所述时间频率转换帧长度的音频信号变形为所述基音周期长度的音频信号;以及
波形连接步骤,使变形后的基音周期长度的音频信号连接,
所述第二波形变形步骤,具有:
删除步骤,删除被复制到所述当前的编码帧中的基音周期的波形信号与所述相邻编码帧中的基音周期的波形信号之间的、相邻编码帧中的基音周期的波形信号的一部分,
在所述波形连接步骤中,使删除所述相邻编码帧中的基音周期的波形信号的一部分后剩下的相邻编码帧中的基音周期的波形信号与当前的编码帧中的基音周期的波形信号连接。
19. (追加)一种程序,用于使计算机执行在权利要求18所述的解码方法中包含的步骤。

Claims (18)

1.一种音频编码装置,具有:时间频率转换单元,按每个预定的时间频率转换帧长度,将所输入的音频信号转换为频率参数;以及编码单元,对该频率参数进行编码,
所述音频编码装置,其特征在于,包括:
基音周期检测单元,检测所述音频信号的基音周期;
成帧单元,根据检测出的基音周期,对输入音频信号进行成帧;
第一波形变形单元,按照所述时间频率转换帧长度,对根据所述基音周期成帧后的音频信号进行波形变形,将波形变形后的音频信号输出到所述时间频率转换单元;以及
多路复用单元,对由所述编码单元编码后的频率参数和所述基音周期进行多路复用,而作为比特流输出。
2.如权利要求1所述的音频编码装置,其特征在于,
所述第一波形变形单元,具有:
切断单元,按照所述基音周期,切断所述成帧后的音频信号;以及
复制单元,通过将相邻编码帧的信号波形的一部分复制到当前的编码帧,从而生成所述时间频率转换帧长度的波形信号。
3.如权利要求2所述的音频编码装置,其特征在于,
所述第一波形变形单元,还具有:
窗处理单元,进行窗处理,以使在由所述复制单元生成的、所述时间频率转换帧长度的波形信号不产生不连续点。
4.如权利要求1所述的音频编码装置,其特征在于,
在由所述时间频率转换单元转换的波形信号中包含偶数个基音波形信号。
5.如权利要求1所述的音频编码装置,其特征在于,
在由所述时间频率转换单元转换的波形信号中包含奇数个基音波形信号。
6.如权利要求1所述的音频编码装置,其特征在于,
所述时间频率转换单元是MDCT单元,
所述频率参数是MDCT系数。
7.如权利要求1所述的音频编码装置,其特征在于,
所述音频编码装置,还包括:
帧标识符生成单元,按照所述基音周期以及在所述时间频率转换帧长度的波形信号中包含的基音波形信号的数量,判断是否可以进行编码帧的跳跃处理,并且,根据判断结果生成帧标识符,
所述多路复用单元,将生成后的帧标识符多路复用到所述比特流中。
8.一种音频解码装置,具有:解码单元,对在输入后的比特流中包含的编码帧的频率参数进行解码;以及逆时间频率转换单元,按每个预定的时间频率转换帧长度,对所述频率参数进行逆时间频率转换,以成为音频信号,
在所述比特流中包含基音周期信息,该基音周期信息表示音频信号的基音周期,
所述逆时间频率转换后的音频信号是,按照所述时间频率转换帧长度,对预先根据所述基音周期成帧后的音频信号进行波形变形而成的,
所述音频解码装置,其特征在于,包括:
比特流分离单元,分离在所述输入比特流中包含的基音周期信息;
第二波形变形单元,根据所述基音周期信息,将所述时间频率转换帧长度的音频信号变形为所述基音周期长度的音频信号;以及
波形连接单元,使变形后的基音周期长度的音频信号连接。
9.如权利要求8所述的音频解码装置,其特征在于,
所述音频解码装置,还包括:
第一再生速度转换单元,跳跃对所述频率参数进行解码的解码处理,而使音频信号的再生速度转换。
10.如权利要求8所述的音频解码装置,其特征在于,包括:
开关单元,使所述频率参数以及基音周期的传输导通或中断;以及
第二再生速度转换单元,根据再生速度转换的指示和在输入比特流中包含的帧标识符,控制所述开关单元,
所述第二再生速度转换单元,通过使所述频率参数以及基音周期的传输中断,从而使再生速度转换。
11.如权利要求8所述的音频解码装置,其特征在于,包括:
开关单元,使频率参数以及基音周期的传输导通或中断;以及
第三再生速度转换单元,根据再生速度转换的指示和在输入比特流中包含的基音周期以及帧标识符,控制所述开关单元,
所述第三再生速度转换单元,通过使所述频率参数以及基音周期的传输中断,从而使再生速度转换。
12.如权利要求8所述的音频解码装置,其特征在于,
所述逆时间频率转换单元是逆MDCT单元,
所述频率参数是MDCT系数。
13.一种音频编码信息传输装置,具有:发送装置,用于发送编码后的音频信号的比特流;以及接收装置,包括:解码单元,接收编码后的音频信号的比特流,对在输入后的比特流中包含的编码帧的频率参数进行解码;以及逆时间频率转换单元,按每个预定的时间频率转换帧长度,对所述频率参数进行逆时间频率转换,以成为音频信号,
所述音频编码信息传输装置,其特征在于,
所述发送装置,包括:
信息记忆单元,保存编码后的音频信号的比特流;
开关单元,使所述比特流的发送导通或中断;
第四再生速度转换单元,根据再生速度转换的指示和在所述比特流中包含的帧标识符,控制所述开关,
在所述比特流中包含基音周期信息,该基音周期信息表示音频信号的基音周期,
所述逆时间频率转换后的音频信号是,按照所述时间频率转换帧长度,对预先根据所述基音周期成帧后的音频信号进行波形变形而成的,
所述接收装置,包括;
比特流分离单元,分离在所述输入比特流中包含的基音周期信息;
第二波形变形单元,根据所述基音周期信息,将所述时间频率转换帧长度的音频信号变形为所述基音周期长度的音频信号;以及
波形连接单元,使变形后的基音周期长度的音频信号连接。
14.如权利要求13所述的音频编码信息传输装置,其特征在于,
所述第四再生速度转换单元,除了参照所述帧标识符以外,还参照所述基音周期信息来控制所述开关。
15.一种音频编码方法,具有:转换步骤,按每个预定的时间频率转换帧长度,将所输入的音频信号转换为频率参数;以及编码步骤,对该频率参数进行编码,
所述音频编码方法,其特征在于,包括:
基音周期检测步骤,检测所述音频信号的基音周期;
成帧步骤,根据检测出的基音周期,对输入音频信号进行成帧;
第一波形变形步骤,按照所述时间频率转换帧长度,对根据所述基音周期成帧后的音频信号进行波形变形;以及
多路复用步骤,对由所述编码步骤编码后的频率参数和所述基音周期进行多路复用,而作为比特流输出。
16.一种程序,用于使计算机执行在权利要求15所述的编码方法中包含的步骤。
17.一种音频解码方法,具有:解码步骤,对在输入后的比特流中包含的编码帧的频率参数进行解码;以及逆时间频率转换步骤,按每个预定的时间频率转换帧长度,对所述频率参数进行逆时间频率转换,以成为音频信号,
在所述比特流中包含基音周期信息,该基音周期信息表示音频信号的基音周期,
所述逆时间频率转换后的音频信号是,按照所述时间频率转换帧长度,对预先根据所述基音周期成帧后的音频信号进行波形变形而成的,所述音频解码方法,其特征在于,包括:
比特流分离步骤,分离在所述输入比特流中包含的基音周期信息;
第二波形变形步骤,根据所述基音周期信息,将所述时间频率转换帧长度的音频信号变形为所述基音周期长度的音频信号;以及
波形连接步骤,使变形后的基音周期长度的音频信号连接。
18.一种程序,用于使计算机执行在权利要求17所述的解码方法中包含的步骤。
CN2006800224379A 2005-06-23 2006-06-21 音频编码装置、音频解码装置以及音频编码信息传输装置 Expired - Fee Related CN101203907B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005184086 2005-06-23
JP184086/2005 2005-06-23
PCT/JP2006/312390 WO2006137425A1 (ja) 2005-06-23 2006-06-21 オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置

Publications (2)

Publication Number Publication Date
CN101203907A true CN101203907A (zh) 2008-06-18
CN101203907B CN101203907B (zh) 2011-09-28

Family

ID=37570452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800224379A Expired - Fee Related CN101203907B (zh) 2005-06-23 2006-06-21 音频编码装置、音频解码装置以及音频编码信息传输装置

Country Status (5)

Country Link
US (1) US7974837B2 (zh)
EP (1) EP1895511B1 (zh)
JP (1) JP5032314B2 (zh)
CN (1) CN101203907B (zh)
WO (1) WO2006137425A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102257564A (zh) * 2009-10-21 2011-11-23 松下电器产业株式会社 音频编码装置、解码装置、方法、电路及程序
CN103258552A (zh) * 2012-02-20 2013-08-21 扬智科技股份有限公司 调整播放速度的方法
CN106030704A (zh) * 2013-12-16 2016-10-12 三星电子株式会社 用于对音频信号进行编码/解码的方法和设备
CN108074579A (zh) * 2012-11-13 2018-05-25 三星电子株式会社 用于确定编码模式的方法以及音频编码方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4284370B2 (ja) * 2007-03-09 2009-06-24 株式会社東芝 ビデオサーバ及びビデオ編集システム
WO2008132811A1 (ja) * 2007-04-17 2008-11-06 Panasonic Corporation 通信システム
JP5140730B2 (ja) * 2007-08-27 2013-02-13 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
CN101588341B (zh) 2008-05-22 2012-07-04 华为技术有限公司 一种丢帧隐藏的方法及装置
EP2392005B1 (en) 2009-01-28 2013-10-16 Dolby International AB Improved harmonic transposition
CA3162808C (en) 2009-01-28 2023-10-10 Dolby International Ab Improved harmonic transposition
JP5433022B2 (ja) 2009-09-18 2014-03-05 ドルビー インターナショナル アーベー 高調波転換
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
WO2012110481A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio codec using noise synthesis during inactive phases
JP5712288B2 (ja) * 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
TWI476760B (zh) 2011-02-14 2015-03-11 Fraunhofer Ges Forschung 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法
CA2831176C (en) 2012-01-20 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for audio encoding and decoding employing sinusoidal substitution
ES2693559T3 (es) * 2013-08-23 2018-12-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para procesar una señal de audio mediante una señal de error de aliasing
JP6303340B2 (ja) 2013-08-30 2018-04-04 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
US10523383B2 (en) 2014-08-15 2019-12-31 Huawei Technologies Co., Ltd. System and method for generating waveforms and utilization thereof
KR20180081504A (ko) * 2015-11-09 2018-07-16 소니 주식회사 디코드 장치, 디코드 방법, 및 프로그램
WO2018201113A1 (en) 2017-04-28 2018-11-01 Dts, Inc. Audio coder window and transform implementations
CN114679676B (zh) * 2022-04-12 2023-05-26 重庆紫光华山智安科技有限公司 音频设备测试方法、***、电子设备及可读存储介质

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4091242A (en) * 1977-07-11 1978-05-23 International Business Machines Corporation High speed voice replay via digital delta modulation
JP2744618B2 (ja) 1988-06-27 1998-04-28 富士通株式会社 音声符号化伝送装置、並びに音声符号化装置及び音声復号化装置
FR2636163B1 (fr) * 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
JP2828696B2 (ja) 1989-11-01 1998-11-25 三洋電機株式会社 ディスクプレーヤ
JP3213388B2 (ja) * 1992-07-24 2001-10-02 三洋電機株式会社 時間軸圧縮伸長方法
JP3147562B2 (ja) 1993-01-25 2001-03-19 松下電器産業株式会社 音声速度変換方法
US5630013A (en) * 1993-01-25 1997-05-13 Matsushita Electric Industrial Co., Ltd. Method of and apparatus for performing time-scale modification of speech signals
US5731767A (en) * 1994-02-04 1998-03-24 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
JPH08287612A (ja) * 1995-04-14 1996-11-01 Sony Corp オーディオデータの可変速再生方法
JP3747492B2 (ja) 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP3594409B2 (ja) * 1995-06-30 2004-12-02 三洋電機株式会社 Mpegオーディオ再生装置およびmpeg再生装置
US5809454A (en) * 1995-06-30 1998-09-15 Sanyo Electric Co., Ltd. Audio reproducing apparatus having voice speed converting function
TW321810B (zh) * 1995-10-26 1997-12-01 Sony Co Ltd
US6115687A (en) * 1996-11-11 2000-09-05 Matsushita Electric Industrial Co., Ltd. Sound reproducing speed converter
JP3765171B2 (ja) * 1997-10-07 2006-04-12 ヤマハ株式会社 音声符号化復号方式
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
JP2001255894A (ja) * 2000-03-13 2001-09-21 Sony Corp 再生速度変換装置及び方法
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
JP2002312000A (ja) * 2001-04-16 2002-10-25 Sakai Yasue 圧縮方法及び装置、伸長方法及び装置、圧縮伸長システム、ピーク検出方法、プログラム、記録媒体
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
JP2004088634A (ja) 2002-08-28 2004-03-18 Matsushita Electric Ind Co Ltd デジタル記録再生装置
JP4256189B2 (ja) 2003-03-28 2009-04-22 株式会社ケンウッド 音声信号圧縮装置、音声信号圧縮方法及びプログラム
US7189913B2 (en) * 2003-04-04 2007-03-13 Apple Computer, Inc. Method and apparatus for time compression and expansion of audio data with dynamic tempo change during playback
JP3871657B2 (ja) * 2003-05-27 2007-01-24 株式会社東芝 話速変換装置、方法、及びそのプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102257564A (zh) * 2009-10-21 2011-11-23 松下电器产业株式会社 音频编码装置、解码装置、方法、电路及程序
US8886548B2 (en) 2009-10-21 2014-11-11 Panasonic Corporation Audio encoding device, decoding device, method, circuit, and program
CN103258552A (zh) * 2012-02-20 2013-08-21 扬智科技股份有限公司 调整播放速度的方法
CN103258552B (zh) * 2012-02-20 2015-12-16 扬智科技股份有限公司 调整播放速度的方法
CN108074579A (zh) * 2012-11-13 2018-05-25 三星电子株式会社 用于确定编码模式的方法以及音频编码方法
CN106030704A (zh) * 2013-12-16 2016-10-12 三星电子株式会社 用于对音频信号进行编码/解码的方法和设备

Also Published As

Publication number Publication date
EP1895511B1 (en) 2011-09-07
US20100100390A1 (en) 2010-04-22
US7974837B2 (en) 2011-07-05
JPWO2006137425A1 (ja) 2009-01-22
JP5032314B2 (ja) 2012-09-26
EP1895511A4 (en) 2011-01-12
CN101203907B (zh) 2011-09-28
WO2006137425A1 (ja) 2006-12-28
EP1895511A1 (en) 2008-03-05

Similar Documents

Publication Publication Date Title
CN101203907B (zh) 音频编码装置、音频解码装置以及音频编码信息传输装置
CN1961351B (zh) 可缩放的无损音频编解码器和创作工具
CN101189661B (zh) 用于产生数据流和产生多通道表示的设备和方法
CN101518083B (zh) 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法和***
CN101218628B (zh) 编码和解码音频信号的装置和方法
US7974840B2 (en) Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information
JPWO2005081229A1 (ja) オーディオエンコーダ及びオーディオデコーダ
TW200529548A (en) Adaptive hybrid transform for signal analysis and synthesis
CN101432610A (zh) 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备
CN102171754A (zh) 编码装置以及解码装置
JP2007279761A (ja) スケーラブル無損失オーディオ符号化/復号化装置及びその方法
CN102047336B (zh) 用于产生或截除或改变包括至少一个报头部分在内的基于帧的比特流格式文件的方法和设备以及相应数据结构
KR101826375B1 (ko) 재생에 선행하여 베이스 층 및 적어도 하나의 강화 층을 포함하는 층화된 계층적 비트 스트림을 검색하기 위한 방법 및 장치
JP2016539357A (ja) 音声デコーダ、符号化音声出力データを生成するための装置、及びデコーダの初期化を可能にする方法
CN101484937A (zh) 使用缓冲器调节对已预测编码的数据进行解码
KR20100089772A (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
CN101490745B (zh) 用于编码和解码基于对象的音频信号的方法和装置
CN107112024A (zh) 音频信号的编码和解码
JP4359499B2 (ja) オーディオ信号の編集
JP4990375B2 (ja) 記録再生装置
JP2001527735A (ja) 符号化された形式と符号化されない形式のディジタル情報信号を交互に伝送する伝送装置
JP2904427B2 (ja) 欠落音声補間装置
CN101740075B (zh) 音频信号播放装置、音频信号播放方法和程序
JP4139704B2 (ja) 時系列信号の符号化装置および復号装置
JP4862136B2 (ja) 音声信号処理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110928

Termination date: 20200621