CN103177730B - 解码装置、通信终端装置、基站装置以及解码方法 - Google Patents
解码装置、通信终端装置、基站装置以及解码方法 Download PDFInfo
- Publication number
- CN103177730B CN103177730B CN201310064311.XA CN201310064311A CN103177730B CN 103177730 B CN103177730 B CN 103177730B CN 201310064311 A CN201310064311 A CN 201310064311A CN 103177730 B CN103177730 B CN 103177730B
- Authority
- CN
- China
- Prior art keywords
- signal
- frequency
- frequency band
- spectrum
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 80
- 238000004891 communication Methods 0.000 title claims description 26
- 238000001228 spectrum Methods 0.000 claims abstract description 237
- 238000005070 sampling Methods 0.000 claims abstract description 108
- 230000008569 process Effects 0.000 claims description 66
- 238000006243 chemical reaction Methods 0.000 claims description 51
- 230000003595 spectral effect Effects 0.000 claims description 33
- 230000005236 sound signal Effects 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 10
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 abstract description 25
- 230000000694 effects Effects 0.000 description 11
- 230000009471 action Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 101150079262 ERMP1 gene Proteins 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
本发明提供一种既可以减小电路规模,又可以削减编码处理运算量的编码装置。在该装置中,频域转换单元(103),将通过采样速率Fx采样的信号用分析长2·Na进行频率分析,算出第1频谱S1(k)(0≤k<Na)。频带扩展单元(104),将第1频谱S1(k)的有效频域扩展为0≤k<Nb,以便能够在第1频谱S1(k)的频率k=Na以后提供新的频谱。扩展频谱附加单元(105),将从外部输入的扩展频谱S1’(k)(Na≤k<Nb)提供给扩展的频带。频谱信息确定单元(106),将扩展频谱附加单元(105)提供的频谱当中用来确定扩展频谱S1’(k)所需的信息作为编码符号输出。
Description
技术领域
本发明涉及采样速率转换装置、编码装置、解码装置以及它们的方法。
背景技术
今天,像激光盘使用的44.1KHz,DAT(DigitalAudioTape,数字录音带),数字VTR,或者***用的32KHz和48KHz,或者DVD音频信号用的48KHz和96KHz那样,存在许多不同的采样速率。因此,再现装置或者记录装置的解码器的内部采样速率与今后要解码的数据的采样速率不同时,必须转换采样速率。作为进行该采样速率转换的以往的装置,譬如由专利文献1所示的装置。
另外,近年来由于有线系列的ADSL(AsymmetricDigitalSubscriberLine,非对称数字用户环路)和光纤的普及,或者无线系列的W-CDMA(Wideband-CodeDivisionMultipleAccess,宽带码分多址)和无线LAN的实用化等,使网络中的传输线路容量大大改善,伴随而来的是在声音通信上,产生了通过扩大信号频带而得到高临场感及高品质化的要求。
目前,作为编码窄带信号的代表性的方式,有使用ITU(InternationalTelecommunicationUnion,国际电信联盟)标准化的G.726,G.729等。另外,作为编码宽带信号的技术,有ITU-T(InternationalTelecommunicationUnionTelecommunicationStandardizationSector,国际电信联盟电信标准化部门)的G722,G722.1和3GPP(The3rdGenerationPartnershipProject,第三代生产合作项目)的AMR-WB等。
最近,以要求可以在IP(InternetProtocol,因特网协议)网络等各种各样网络环境下使用为目的,要求在声音编码方式实现可分级的功能。所谓可分级功能,就是表示即使从编码符号的某一部分开始,也能够表示出将声音信号解码的功能。通过具有该可分级功能,在条件良好的通信线路中可以使用所有的编码符号来解码高品质的声音信号,在条件差的通信线路中,只传输编码符号这一部分就可以抑制发生分组丢失的频度。另外,还可以得到在多地点间的通信时,提高网络资源的效率等效果。
为了实现具有该可分级功能的高品质的编码方式,必须利用各种各样的采样速率的信号进行编码。譬如,将采样速率为8KHz的信号使用ITU-T规格的G.726,G.729等方式进行编码,在采样速率为16KHz的领域,再编码其误差信号,便可实现通过扩展信号带而改善质量及可分级性。
图1是表示进行可分级编码的编码装置的代表性结构的方框图。在该例中,设定层数N=3,将用n层处理的信号的采样速率用FS(n)表示,FS(1)=16[KHz],FS(2)=24[KHz],FS(3)=32[KHz]。
通过输入端子11输入到下采样单元12的音响信号(声音信号,音频信号等),进行采样频率从32KHz到16KHz的下采样处理后,输出到第1层编码单元13。第1层编码单元13决定第1编码符号,以便使输入的音响信号与编码后生成的解码信号之间的听觉上的失真最小。该第1编码符号输出到复用单元26,同时输出到第1层解码单元14。第1层解码单元14使用第1编码符号生成第1层解码信号。上采样单元15进行使第1层解码信号的采样频率从16KHz到24KHz的上采样处理,并将该信号提供给减法器18及加法器21。
另外,通过输入端子11输入到下采样单元16的音响信号,进行采样频率从32KHz到24KHz的下采样处理,并提供给延迟单元17。延迟单元17使经下采样处理后的信号只延迟规定的时间。减法器18求出延迟单元17的输出信号与上采样单元15的输出信号的差,生成第2层残留信号,并提供给第2层编码单元19。第2层编码单元19进行编码,以便使第2层残留信号在听觉上改善质量,并决定第2编码符号,然后将该第2编码符号提供给复用单元26及第2层解码单元20。第2层解码单元20使用第2编码符号进行解码处理,生成第2层解码残留信号。加法器21取所述的第1层解码信号和第2层解码残留信号的和,生成第2层解码信号。上采样单元22将第2层解码信号的采样频率从24KHz到32KHz进行上采样处理,并将该信号提供给减法器24。
另外,通过输入端子11输入的延迟单元23的音响信号,延迟规定的时间,提供给减法器24。减法器24取延迟单元23的输出信号与上采样单元22的输出信号的差,生成第3层残留信号。该第3层残留信号提供给第3层编码单元25。第3层编码单元25进行编码,以便使第3层残留信号在听觉上改善质量,并决定第3编码符号,然后将该编码符号提供给复用单元26。复用单元26将从第1层编码单元13,第2层编码单元19及第3层编码单元25得到的编码符号进行复用处理,并通过输出端子27输出。
【专利文献1】日本专利申请2000—68948号公开公报
发明内容
但是像所述那样,基于类似G.726和G.729,或者AMR-WB的时域的编码方式来实现可分级功能的编码装置,需要转换各种信号的采样速率(所述例中,需要下采样单元12,上采样单元15,下采样单元16,及上采样单元22)。会导致编码装置的结构复杂,编码处理运算量也增大等问题的出现。另外,将该编码装置编码的信号进行解码的解码装置的电路结构也随之变得复杂,解码的处理运算量也随之增大。
本发明旨在提供能够缩小电路规模,也能够减少编码的处理运算量的采样速率转换装置及编码装置,并能将由该编码装置编码的信号进行解码的解码装置以及它们的方法。
本发明,对于输入信号,通过在频域扩大频谱的有效频域,得到与在时域信号进行上采样处理等价的信号,以代替在时域进行采样转换(特别是上采样)。
本发明的采样速率转换装置包括:对输入的时域信号进行频域转换,而得到第1频谱的转换单元;扩展得到的第1频谱频带的扩展单元;将第2频谱***扩展后的第1频谱的扩展频带的***单元。
根据该结构,可以通过将输入的时域的信号转换成频域的信号,并扩展得到的频谱的频带,从而得到与在时域进行上采样处理等价的信号。另外,能够缩小编码装置的电路规模,也能减少编码的处理运算量。
本发明的编码装置包括:将输入的采样频率为Fx的信号用分析长2··Na进行频率分析,从而得到Na点的第1频谱的转换单元;将得到的第1频谱的频带扩展到Nb点的扩展单元;将***扩展后的第1频谱的扩展频带的第2频谱确定,并将表示该第2频谱的编码符号输出的编码单元。
根据该结构可以得到FS=Fx·Nb/Na的频谱而不进行时域的脉冲调制转换。
本发明的编码装置采用在所述结构中,所述第2频谱按照所述第1频谱来生成的结构。
根据该结构能够基于由解码器得到的信息而生成扩展频谱,因此可以实现低比特率。
本发明的编码装置采用在所述的结构中,使前述第2频谱被确定为与在将采样频率Fy的输入信号用2·Nb点通过频率分析求出来的频谱内,包括在Na≤k<Nb的频带里的频谱相类似的结构。
根据该结构,能够以原来信号的频谱为基准决定扩展频谱,因此能够求出更高精度的扩展频谱。
本发明的编码装置采用在所述的结构中,前述编码单元将Na≤k<Nb的频带分割成2个以上的子带,并将表示所述第2频谱的编码符号输出到各个子带的结构。
根据该结构,可以得到能够生成具有可分级功能的编码符号的效果。
本发明的编码装置采用在所述的结构中,前述采样频率为Fx的信号是在分级编码的下位层进行解码的信号的结构。
根据该结构,由多层的编码单元构成的可分级编码能够适用于本发明,从而可以只用最小限度的采样转换来实现分级编码。
本发明的解码装置包括:将采样频率为Fx的信号用分析长2·Na进行频率分析,取得0≤k<Na的频带的第1频谱的取得单元;接收编码符号,解码Na≤k<Nb的频带的第2频谱的解码单元;结合所述第1及第2频谱,生成0≤k<Nb的频带频谱的生成单元;将包括在Na≤k<Nb的频带里的频谱转换成时域的信号转换单元。
根据该结构,可以解码通过所述任意一个的编码装置生成的编码符号。
本发明的解码装置采用,在所述结构中,所述第2频谱按照0≤k<Na的频带的频谱而生成的结构。
根据该结构,能够解码基于由解码器得到的信息来生成扩展频谱的编码方法所产生的编码符号,因此可以实现低比特率。
本发明的解码装置,还采用以下的结构:在所述的结构中,具有在前述结合后的频谱的高频部***规定值,或者废弃前述结合后的频谱高频部的单元,以使通过前述生成单元得到的结合后的频谱频带宽,与预定的带宽相一致。
根据该结构,即使网络状况等因素使接收的频谱的带宽发生变动时,也施加使频谱的带宽保持一定的处理后而生成解码信号,因此能够稳定地生成期望的采样速率的解码信号。
本发明的解码装置采用在所述结构中,前述采样频率为Fx的信号,是在分级编码中的下位层进行解码的信号。
根据该结构,能够解码通过由多层的编码单元构成的分级编码所求出的编码符号。
此外,本发明的解码装置包括:接收单元,其接收发送信息,所述发送信息是由编码装置将声音信号或音频信号编码而生成的、包括关于所述声音信号或所述音频信号的比规定的频率低的频带的第一频带的第一编码信息,和关于所述声音信号或所述音频信号的比规定的频率高的频带的第二频带的第二编码信息的信息;第一解码单元,其对所述第一编码信息进行解码而生成相当于声音信号或音频信号的第一频带的第一采样速率的信号;以及第二解码单元,其对所述第二编码信息进行解码而生成所述第二频带的解码频谱,用所述第二频带的解码频谱对大于所述第一采样速率的规定的第二采样速率进行采样速率转换,生成第三采样速率的解码信号,所述第二解码单元包括:第一转换单元,其根据通过所述第一解码单元得到的第一采样速率的信号得到第一频带的解码频谱;频谱结合单元,将所述第二频带的解码频谱与所述第一频带的解码频谱的扩展频带结合而生成扩展解码频谱;校正单元,其在位于与所述扩展解码频谱的最大频率指数相邻的区域的所述扩展解码频谱的第一高频部分***零,得到规定的频带的频谱;以及时域信号生成单元,基于所述规定的频带的频谱,通过时域转换而生成所述第三采样速率的时域信号作为所述解码信号。
本发明的通信终端装置,具备上述解码装置。
本发明的基站装置,具备上述解码装置。
本发明的解码方法,包括以下步骤:接收步骤,其接收发送信息,所述发送信息是将声音信号或音频信号编码而生成的、包括关于所述声音信号或所述音频信号的比规定的频率低的频带的第一频带的第一编码信息,和关于所述声音信号或所述音频信号的比规定的频率高的频带的第二频带的第二编码信息的信息;第一解码步骤,其对所述第一编码信息进行解码而生成相当于声音信号或音频信号的第一频带的第一采样速率的信号;以及第二解码步骤,其对所述第二编码信息进行解码而生成所述第二频带的解码频谱,用所述第二频带的解码频谱对大于所述第一采样速率的规定的第二采样速率进行采样速率转换,生成第三采样速率的解码信号,所述第二解码步骤包括:第一转换步骤,其根据通过所述第一解码步骤得到的第一采样速率的信号得到第一频带的解码频谱;频谱结合步骤,将所述第二频带的解码频谱与所述第一频带的解码频谱的扩展频带结合而生成扩展解码频谱;校正步骤,其在位于与所述扩展解码频谱的最大频率指数相邻的区域的所述扩展解码频谱的第一高频部分***零,得到规定的频带的频谱;以及时域信号生成步骤,基于所述规定的频带的频谱,通过时域转换而生成所述第三采样速率的时域信号作为所述解码信号。
根据本发明,可以缩小编码装置的电路规模,还能够减少编码的处理运算量。另外,还能够提供解码由编码装置编码的信号的解码装置。
附图说明
图1是表示进行可分级编码的编码装置的具有代表性结构的方框图;
图2是表示实施方式1涉及的频谱编码装置的主要结构的方框图;
图3A是表示第1频谱的图,图3B是表示扩展有效频域后的频率图;
图4A是为了从原理上说明扩展频谱的有效频域的处理效果的图;
图4B是为了从原理上说明扩展频谱的有效频域的处理效果的图;
图5是表示实施方式1涉及的无线接收装置的主要结构的方框图;
图6是表示实施方式1涉及的编码装置的内部结构的方框图;
图7是表示实施方式1涉及的频谱编码单元的内部结构的方框图;
图8是表示实施方式1涉及的频谱编码单元的变化的方框图;
图9是表示实施方式1涉及的无线接收装置的主要结构的方框图;
图10是表示实施方式1涉及的解码装置的内部结构的方框图;
图11是表示实施方式1涉及的频谱解码单元的内部结构的方框图;
图12、图12A及图12B是关于实施方式1涉及的频带扩展单元进行的处理的说明的图;
图13是表示频谱经过在实施方式1涉及的结合单元及时域转换单元的处理后如何生成解码信号的图;
图14A是表示实施方式1涉及的编码装置适用于有线通信***时的发送端的主要结构的方框图;
图14B是表示实施方式1涉及的解码装置适用于有线通信***时的接收端的主要结构的方框图;
图15是表示实施方式2涉及的解码装置的主要结构的方框图;
图16是表示实施方式2涉及的频谱解码单元的内部结构的方框图;
图17是用于更详细说明实施方式2涉及的校正单元的处理的图;
图18是用于更详细说明实施方式2涉及的校正单元的处理的图;
图19是用于进一步说明实施方式2涉及的频谱解码单元的动作的图;
图20A是用于进一步说明实施方式2涉及的频谱解码单元的动作的图;
图20B是用于进一步说明实施方式2涉及的频谱解码单元的动作的图;
图21是表示实施方式3涉及的通信***的主要结构的图;
图22是表示实施方式4涉及的通信***的主要结构的图。
具体实施方式
下面,参照附图详细说明本发明的实施方式。
(实施方式1)
图2是表示本发明的实施方式1涉及的频谱编码装置100的主要结构的方框图。
本实施方式涉及的频谱编码装置100具有:采样速率转换单元101,输入端子102,频谱信息确定单元106及输出端子107。另外,采样速率转换单元101具有频域转换单元103,频带扩展单元104,及扩展频谱附加单元105。
频谱编码装置100,将由输入端子102,输入利用采样速率Fx采样的信号。
频域转换单元103,将该信号用分析长2·Na进行频率分析,由此将时域信号转换成频域信号(频域转换),计算出第1频谱S1(k)(0≤k<Na)。然后,将求出的第1频谱S1(k)提供给频带扩展单元104。在此,频率分析使用MDCT(ModifiedDiscreteCosineTransform,校正离散余弦变换)。MDCT具有以下的特点:将前后相邻的帧与分析帧各重叠一半进行分析,使用分析帧的前半部为奇函数,后半部为偶函数的正交基底来消除帧间的失真。另外,作为频率分析的技术,也可以使用DFT(DiscreteFourierTransform,离散傅里叶变换),DCT(DiscreteCosineTransform,离散余弦变换)等。
频带扩展单元104,确保新的领域(频域),以使在输入的第1频谱S1(k)的频率k=Na之后,还能提供新的频谱,并将第1频谱S1(k)的有效频域扩展到0≦k<Nb。关于扩展该有效频域的处理,后面还要详述。
扩展频谱附加单元105,将从外部输入的扩展频谱S1’(k)(Na≦k<Nb)提供给通过频带扩展单元104扩展的频带,并输出到频谱信息确定单元106。
频谱信息确定单元106,在扩展频谱附加单元105提供的频谱当中,将用来确定扩展频谱S1’(k)所必须的信息作为编码符号,经由输出端子107输出。该编码符号为表示扩展频谱S1’(k)的子带能量的信息或表示有效频域的信息等。后面还要详述。
接下来,用图3A及图3B详细说明所述频带扩展单元104扩展第1频谱S1(K)的有效频域的处理。
图3A表示由频域转换单元103提供的第1频谱S1(k),图3B表示频带扩展单元104的扩展有效频域后的频谱S1(k)。频带扩展单元104,确保在第1频谱S1(k)的频率k在Na≤k<Nb的范围内所表示的频带里能够存储新的频谱信息的领域。该新领域的大小用Nb-Na表示。
在此,Nb由以下的关系来决定:经由输入端子102从外部提供的信号的采样速率Fx,与频带转换单元103的分析长2·Na,与通过解码单元(图中未表示)解码的信号的采样速率Fy。具体地说,Nb通过下式设定。
[算式1]
另外,Nb决定了时,通过解码单元解码信号的采样速率Fy由下式决定。
[算式2]
譬如,Na=128,Fx=16KHz的条件下,有必要设计编码单元,在解码单元生成Fy=32KHz的解码信号时,使Nb=128·32/16=256。因此,此时确保128≤K<256的领域。另外,作为其它的例子,在Na=128,Nb=384,Fx=8KHz的条件下,设计编码单元时,通过解码单元生成的解码信号的采样速率为,Fy=8·384/128=24KHz。
图4A及图4B是为了从原理上说明在频带扩展单元104进行的频谱有效频域扩展的处理效果的图。图4A表示将采样速率Fx的信号用分析长2·Na进行频率分析时所得到的频谱Sa(K)。横轴表示频率,纵轴表示频谱强度。
信号的有效频域,根据乃奎斯特定理为0-Fx/2。此时,分析长为2·Na,因此频率指数k的范围为0≤k<Na,频谱Sa(k)的频率分辨率为Fx/(2·Na),另外,将同一信号进行上采样处理到采样速率Fy后,用分析长2·Nb频率分析得到的频谱Sb(k)表示在图4B时,信号的有效频域扩展到0-Fy/2,频率指数k的范围为0≤k<Nb。在此,Nb满足(式1)时,频谱Sb(k)的频率分析率Fy/(2·Nb)与Fx/(2·Na)相等。相反地看,这意味着将频谱Sa(k)(0≤k<Na)的频带扩展到Nb时的频谱Sb(k),与将采样Fx的信号进行上采样处理到采样Fy后,用分析长2·Nb进行频率分析得到的频谱一致。通过利用该原理可以得到在时域不进行上采样处理而与经上采样处理的信号等价的频谱。
由此,可以通过采样速率转换单元101,将输入的时域信号转换成频域信号,并扩展得到的频谱的有效频域,从而得到与在时域将经上采样处理的信号进行频率转换求出的频谱等价的频谱。
另外,由于从采样速率转换单元101输出的信号是频域信号,需要时域信号时,则设置时域转换单元,进行再转换到时域的处理就可以。在所述例子中,采样速率转换单元101是设置在频谱编码装置100内,所以无需复原成时域信号,直接将频域信号输入到频谱信息确定单元106,生成编码符号即可。
在此,通过调整输入到扩展频谱附加单元105的扩展频谱的选择和频谱信息确定单元106中的频谱信息的确定方法,可以改变从频谱信息确定单元106输出的编码符号的编码率。也就是说,采样速率转换单元101内的部分处理,对编码也有很大的影响。这意味着频谱编码装置100同时实现输入信号的采样速率的转换和编码。
另外,在此为了简化说明,以在扩展频谱附加单元105的扩展频谱被提供为原来的频谱的情形为例。但是在频谱信息确定单元106进行的处理,是为确定扩展频谱而将所需的信息作为编码符号输出,只要应该提供的扩展频谱已经确定就足够了,因此不一定要实际上提供扩展频谱。
另外,在此,作为采样速率转换的一例,说明了进行上采样处理,但是所述原理也可适用于下采样处理。
图5是表示本实施方式涉及的编码装置120设置在无线通信***的发送端时的无线发送装置130的主要结构的方框图。
该无线发送装置130具有编码装置120、输入装置131、A/D转换装置132、RF转换装置133及天线134。
输入装置131,将人耳可以听到的声波W11转换成电信号的模拟信号,输出到A/D转换装置132。A/D转换装置132,将该模拟信号转换成数字信号,并输出到编码装置120(信号S1)。编码装置120,将输入的数字信号S1进行编码而生成编码信号,并输出到RF转换装置133(信号S2)。RF转换装置133,调制编码信号S2而生成调制编码信号,并输出到天线134。天线134,将调制编码信号作为电波W12发送。
图6是表示所述编码装置120的内部结构的方框图。在此,以进行分级编码(可分级编码)处理为例来说明。
编码装置120具有输入端子121,下采样单元122,第1层编码单元123,第1层解码单元124,延迟单元126,频谱编码单元100a,复用单元127及输出端子128。
输入端子121,输入采样速率Fy的音响信号S1。下采样单元122对通过输入端子121输入的信号S1实施下采样处理而生成采样速率Fx的信号并输出。第1层编码单元123对该经下采样处理后的信号进行编码,并将得到的编码符号输出到复用单元(多路转换器)127,同时也输出到第1层解码单元124。第1层解码单元124,基于该编码符号来生成第1层解码信号。
另一方面,延迟单元126对通过输入端子121输入的信号S1,提供规定长的延迟。该延迟的长短,设定为与信号经由下采样单元122,第1层编码单元123及第1层解码单元124时发生的时间延迟同值。频谱编码单元100a,使用从第1层解码单元124输出的采样速率Fx的信号S3和从延迟单元126输出的采样速率Fy的信号S4,进行频谱编码,并将生成的编码符号S5输出到复用单元127。复用单元127复用由第1层编码单元123求出的编码符号和由频谱编码单元100a求出的编码符号S5,作为输出符号S2经由输出端子128输出。该输出符号S2提供给RF调制装置133。
图7是表示所述的频谱编码单元100a的内部结构的方框图。另外,该频谱编码单元100a具有与图2所示的频谱编码装置100同样的基本结构,故给相同的结构要素标上相同的号码,并省略对其说明。
频谱编码单元100a的特征是,利用采样速率Fy的输入信号S3的频谱来提供扩展频谱S1’(k)(Na≤k<Nb)。由此,提供确定扩展频谱S1’(k)的目标信号,从而提高扩展频谱S1’(k)的精度,结果获得了提高质量的效果。
频域转换单元112,将通过输入端子111输入的采样速率Fy的信号S4用分析长2·Nb进行频率分析,求出第2频谱S2(k)(0≤k<Nb)。在此,设采样频率Fx、Fy及分析长Na、Nb之间存在用(式1)表示的关系。
频谱信息确定单元106,决定表示扩展频谱Si(k)的编码符号。在此,利用由频域转换单元112求出的第2频谱S2(k)来决定扩展频谱S1’(k)。频谱信息确定单元106经过决定扩展频谱S1’(k)的形状的步骤和决定扩展频谱S1’(k)的增益的步骤的2个步骤来决定编码符号。
首先,在以下说明决定扩展频谱S1’(k)的形状的步骤。
在该步骤中,利用第1频谱S1(k)的频带0≤K<Na来决定扩展频谱S1’(k)。作为其具体的方法,如下式所示,将在频率轴上的只离开固定值C的第1频谱S1(k)复制到扩展频谱S1’(k)上。
[算式3]
S1′(k)=S1(k-C)(Na≤k<Nb)(3)
在此,C为预先决定的固定值,需要满足C≤Na的条件。该方法中,用来表示扩展频谱S1’(k)的形状的信息不作为编码符号输出。
另外作为另一个方法,不是如所述那样使用固定值C,而是使用取某一规定的范围TMIN~TMAX的值的变数T,将使扩展频谱S1’(k)和第2频谱S2(k)的形状最类似时的变数T的值T’作为编码符号的一部分输出也可以。此时,扩展频谱S1’(k)用下式表示。
[算式4]
S1′(k)=S1(k-T′)(Na≤k<Nb)(4)
接下来,说明决定在频谱信息确定单元106进行的扩展频谱S1’(k)的增益的步骤。
扩展频谱S1’(K)的增益决定为与第2频谱S2(k)的频带NA≤k<Nb的功率一致。具体的是,按照下式算出功率偏差V,将该值量化而得到的指数作为编码符号,经由输出端子107输出。
[算式5]
另外,将扩展频谱S1’(k)分割为多个子带,各个子带分别独立地决定编码符号的方式也可以。相关的情况,在决定扩展频谱S1’(k)的形状的步骤,对每个子带分别决定(式4)所表示的T’,并作为编码符号输出也可以,或者只决定一个共同的T’作为编码符号输出也可以。然后,在决定扩展频谱S1’(K)的增益的步骤,对每个子带算出功率的偏差V(j),并将该值量化而得到的指数作为编码符号,经由输出端子107输出。每个子带的功率变动量,用下式表示。
[算式6]
在此,j表示子带的号码,BL(j)表示相当于第j个子带的最小频率的频率指数,BH(j)表示相当于子带的最大频率的频率指数。如此使每个子带都输出编码符号的结构,可以实现可分级功能。
另外,不同于如图7所示的算出第2频谱S2(k)的方式,如图8所示的将采样速率Fy的信号进行LPC(LlnearPredictionCoding,线性预测编码)分析处理的方式(频谱编码单元100b)也可以。也就是说,通过分析采样速率Fy的信号,求出LPC系数,并使用该LPC系数来决定扩展频谱S1’(k)也可以。该结构中,可以将LPC系数进行DFT转换成频谱信息,使用该频谱来决定扩展频谱S1’(k)。
如此,根据本实施方式的编码装置,可以缩小编码装置的电路规模,还可以减少编码的处理运算量。
另外,所述效果以外,将本实施方式的编码装置适用于可分级编码时,还可以得到下述的效果。
如以往技术,在时域进行采样速率转换时,为了避免发生混淆现象(aliasing),需要将输入信号通过低通滤波器(以下称为LPF)。一般来说,在时域进行滤波处理时,相对于输入信号,输出信号会发生时间滞后(延迟)。将FIR(FiniteImpulseResponse,有限脉冲响应)型滤波器适用于LPF时,为了使截止特性为陡坡,需要增加滤波次数而使运算量大幅增加,同时产生相当于滤波次数一半的采样值的时间滞后。
例如,对于采样频率FS=24KHz的信号,适用256次的滤波器时,只转换采样速率就会产生5ms以上的延迟。发生类似的延迟,当适用于双向声音通话时,会导致感觉到通话对方的反应变慢的问题。
另外,将IIR型滤波器用于LPF时,即使减少次数,也可以使截止特性呈现陡坡状,而且不像FIR滤波器那样延迟那么长。但是,IIR型滤波器如同FIR型滤波器,也不能设计出使由所有频率产生的延迟量都一定的滤波器。它会发生这样的问题:可分级编码从输入信号减去采样速率转换后的信号时,必须对照采样速率转换后信号的时间滞后,提供给输入信号一定的延迟量,但是使用IIR型的LPF时,对频率的延迟量不是一定的,所以其减算处理不能确实地进行。
本实施方式的编码装置,能够消除在可分级编码上发生的这些问题。
图9是表示接收从无线发送装置130发送的信号的无线接收装置180的主要结构的方框图。
该无线接收装置180具有,天线181,RF解调装置182,解码装置170,D/A转换装置183及输出装置184。
天线181接收作为电波W12的数字编码音响信号,生成电信号的数字接收编码音响信号,并提供给RF解调装置182。RF解调装置182解调来自天线181的接收编码音响信号,生成解调编码音响信号S11,并提供给解码装置170。
解码装置170接收来自RF解调装置182的数字解调编码音响信号S11,进行解码处理生成数字解码信号S12,并提供给D/A转换装置183。D/A转换装置183,转换来自解码装置170的数字解码音响信号S12,生成模拟解码声音信号,并提供给输出装置184。输出装置184,将电信号的模拟解码声音信号转换成空气的振动,并作为声波13输出以使人的耳朵能够听见。
图10是表示所述的解码装置170的内部结构的方框图,在此也取将可分级编码的信号解码为例来说明。
该解码装置170具有输入端子171,分离单元172,第1层解码单元173,频谱解码单元150及输出端子176。
输入端子171输入来自RF解调装置182的分级编码的符号S11。分离单元172分离经由输入端子171输入的解调编码音响信号S11,生成第1层解码单元173用的编码符号和频谱解码单元152用的编码符号。第1层解码单元173使用由分离单元172得到的编码符号解码采样速率Fx的解码信号,并将该解码信号S13提供给频谱解码单元150。频谱解码单元150对由分离单元172分离的编码符号S14和由第1层解码单元173生成的采样速率Fx的信号S13,进行后述的频谱解码处理,生成采样速率Fy的解码信号S12,并经由输出端子176将它输出。
图11是表示所述的频谱解码单元150的内部结构的方框图。
该频谱解码单元150,具有输入端子152、153,频域转换单元154,频带扩展单元155,解码单元156,结合单元157,时域转换单元158及输出端子159。
用采样速率Fx采样的信号S13输入到输入端子152。另外,关于扩展频谱S1’(k)的编码符号S14输入到输入端子153。
频域转换单元154对从输入端子152输入的时域信号S13,用分析长2·Na进行频率分析,算出第1频谱S1(k)。频率分析法使用校正离散余弦转换(MDCT)。MDCT具有以下的特点:将前后相邻的帧与分析帧各重叠一半进行分析,使用分析帧的前半部为奇函数,后半部为偶函数的正交基底来消除帧间的失真。这样求出的第1频谱S1(k)提供给频带扩展单元155。另外,作为频率分析法,也可使用离散傅里叶转换(DFT),离散余弦转换(DCT)等。
频带扩展单元155,确保在输入的第1频谱S1(k)的频率k=Na以后,能够重新提供频谱的领域,并使第1频谱S1(K)的频带为0≤K<Nb。频带扩展的第1频谱S1(k)输出到结合单元157。
另一方面,解码单元156解码关于经由输入端子153输入的扩展频谱S1’(k)的编码符号S14,得到扩展频谱S1’(k),并输出到结合单元157。
结合单元157结合由频带扩展单元155提供的第1频谱S1(k)和扩展频谱S1’(k)。该结合通过将扩展频谱S1’(k)***第1频谱S1(k)的频带Na≤k<Nb来实现。通过该处理得到的第1频谱S1(k),输出到时域转换单元158。
时域转换单元158实施相当于通过频谱编码单元100a实施的频域转换的反转换的时域转换处理,经过适当的窗函数的乘算及叠加加算,生成时域信号S12。如此生成的时域信号S12,作为解码信号经由输出端子159输出。
接下来,用图12A及图12B来说明关于在频带扩展单元155进行的处理。
图12A表示由频域转换单元154提供的第1频谱S1(k)。图12B表示频带扩展单元155的处理结果所得到的频谱,确保频率在Na≤k<Nb的范围所表示的频带能够存储新的频谱信息的领域。该新领域的大小用Nb-Na表示。Nb从属于输入端子152提供的信号的采样速率Fx和频域转换单元154的分析长2·Na和由频谱解码单元150解码的信号的采样速率Fy间的关系,可以按照下式来设定Nb。
[算式7]
另外,Nb确定下来时,由频谱解码单元150解码的信号的采样速率Fy,通过下式决定。
[算式8]
例如,当输入信号的采样速率Fx=16KHz,频域转换单元154分析长Na=128的条件下,通过频谱解码单元150生成采样速率Fy=32KHz的解码信号时,需要在频带扩展单元155设定Nb=128·32/16=256。因此,此时通过频带扩展单元155确保128≤k<256的领域。另外作为另一个例子,输入信号的采样速率Fx=8KHz,频域转换单元154的分析长Na=128,频带扩展单元155的扩展量Nb=384时,则由频谱解码单元150生成的解码信号的采样速率为Fy=8·384/128=24KHz。
图13是表示频谱经过结合单元157及时域转换单元158的处理后,如何生成解码信号的图。
结合单元157,将扩展频谱S1’(k)(Na≤k<Nb)***到频带扩展的第1频谱S1(k)的Na≤k<Nb的频带,将由此得到的结合后的第1频谱S1(k)(0≤k<Nb)输送到时域转换单元158。时域转换单元158,生成时域的解码信号,并由此可以得到采样速率FS(=Fx·Na/Nb)的解码信号。
如此根据本实施方式的解码装置,可以将由本实施方式涉及的编码装置编码的信号解码。
另外,虽然在此以本实施方式涉及的编码装置或解码装置适用于无线通信***为例来说明,但是本实施方式涉及的编码装置或解码装置也可以如下所述适用于有线通信***。
图14A是表示本实施方式涉及的编码装置适用于有线通信***时的发送端的主要结构的方框图。另外,在与图5所示的相同的结构要素上加注相同的符号,并省略对其说明。
有线发送装置140具有编码装置120、输入装置131及A/D转换装置132,输出连接到网络N1上。
A/D转换装置132的输入端子连接到输入装置131的输出端子上。编码装置120的输入端子连接到A/D转换装置132的输出端子上。编码装置120的输出端子连接到网络N1上。
输入装置131,将人耳听得见的声波W11转换成电信号的模拟信号提供给A/D转换装置132。A/D转换装置132将模拟信号转换成数字信号提供给编码装置120。编码装置120编码将输入来的数字信号生成符号,并输出到网络N1。
图14B是表示本实施方式涉及的解码装置适用于有线通信***时的接收端的主要结构的方框图。另外,在与图9所示的相同的结构要素上加注相同的符号,并省略对其说明。
有线接收装置190具有连接到网络N1上的接收装置191,解码装置170,D/A转换装置183及输出装置184。
接收装置191的输入端子连接在网络N1上。解码装置170的输入端子连接在接收装置191的输出端子上。D/A转换装置183的输入端子连接在解码装置170的输出端子上。输出装置184的输入端子连接在D/A转换装置183的输出端子上。
接收装置191接收来自网络N1的数字编码音响信号,生成数字接收音响信号,并提供给解码装置170。解码装置170接收来自接收装置191的接收音响信号,对该接收音响信号进行解码处理,生成数字解码音响信号,并提供给D/A转换装置183。D/A转换装置183转换来自解码装置170的数字解码声音信号,生成模拟的解码声音信号,并提供给输出装置184。输出装置184将电信号的模拟解码音响信号转换成空气的振动,作为声波13输出以使人耳能听得到。
如此根据所述结构,能够提供具有与所述的无线收发装置同样作用效果的有线收发装置。
(实施方式2)
图15是表示本发明的实施方式2涉及的解码装置270的主要结构的方框图。在此,该解码装置270具有与如图10所示的解码装置相同的基本结构,故在相同的结构要素上加注相同的符号,并省略对其说明。
本实施方式的特征是将结合后的第1频谱S1(k)(0≤k<Nb)的最大频率指数Nb修正为期望的值Nc,并用期望的采样速率来生成解码信号。
频谱解码单元250,使用由分离单元172分离的编码符号S14和由第1层解码单元173生成的采样速率Fx的信号S13及经由输入端子271输入的系数Nc(信号S21),进行频谱解码。然后,经由输出端子176输出已取得的采样速率Fy的解码信号。频谱解码单元250的频域转换的分析长为2·Na时,解码信号的采样速率Fy用Fy=Fx·Nc/Na表示。
图16,是表示所述的频谱解码单元250的内部结构的方框图。
经由输入端子271输入的系数Nc提供给校正单元251及时域转换单元158a。
校正单元251,根据经由输入端子271提供的系数Nc(信号S21)将由结合单元157提供的第1频谱S1(k)(0≤k<Nb)的有效频域校正为0≤k<Nc。然后,将频带校正后的第1频谱S1(k)(0≤k<Nc)提供给时域转换单元158a。
时域转换单元158a,根据经由输入端子271提供的系数Nc,在分析长为2·Nc的条件下,对由校正单元251提供的第1频谱S1(k)(0≤k<Nc)进行转换处理,进行适当的窗函数的乘算及叠加加算,生成时域信号,经由输出端子159输出。该解码信号的采样速率为FS=Fx·Nc/Na。
图17及图18,是用来更详细地说明校正单元251的处理的图。
图17,表示在Nc<Nb时的校正单元251的处理。由结合单元157提供的第1频谱S1(k)(信号S21)的频带,为0≤k<Nb。于是校正单元251删除Nc≤k<Nb的范围的频谱,以使该第1频谱S1(k)的频带为0≤k<Nc。将该结果取得的第1节频谱S1(k)(0≤k<Nc)(信号S22)提供给时域转换单元158a,生成时域的解码信号S23。该解码信号S23的采样速率为FS=Fx·Nc/Na。
图18,同样是校正单元251的处理,但是表示Nc>Nb时的处理。由结合单元251提供的第1频谱S1(k)(信号S25)的频带,和图17同样为0≤k<Nb。校正单元251,扩张Nb≤k<Nc的频带,以使该第1频谱S1(k)的频带为0≤k<Nc,并提供给其区域以确定的值(例如,0值)。将该结果取得的第1频谱S1(k)(0≤k<Nc)(信号S26)提供给时域转换单元158a,并生成时域的解码信号S27。该解码信号S27的采样速率则为Fs=Fx·Nc/Na。
使用图19,图20A及图20B进一步说明频谱解码单元250的动作。
首先,假想经由输入端子153输入的编码符号每个帧都在变动。也就是说,在从结合单元157输出的第1频谱S1(k)的频带中,存在如图19所示的0≤k<Na(频带R1)、0≤k<Nb1(频带R2)、0≤k<Nb2(频带R3)的3种频带(其中,Na<Nb1<Nb2),每帧都选择这些频带之内的一个。
图20A,是用来说明系数Nc等于Nb2时的频谱解码单元250的动作的图。图20B,是用来说明系数Nc等于Nb1时的频谱解码单元250的动作的图。
这些图表示用第1帧取得的频谱的频带是R1,R2,R3的其中任意一个。另外,处理1表示在Nb1≤k<Nb2的频带中***0值的处理,处理2表示在Na≤k<Nb2的频带中***0值的处理,处理3表示删除Nb1≤k<Nb2的频带的处理,处理4表示在Na≤k<Nb1的频带中***0值的处理。
首先说明图20A的情形。
在该图中,因为第0帧~第1帧及第7帧~第8帧频谱的频带为R3,也就是说第1频谱S1(k)的频带为0≤k<Nb2,所以校正单元251,什么处理也不进行,只将第1频谱S1(k)(0≤k<Nb2)输出到时域转换单元158a。
另外,因为第2帧~第4帧及第9帧频谱的频带是R2,也就是说第1频谱S1(k)的频带是0≤k<Nb1,所以校正单元251将第1频谱S1(k)的频带扩展到Nb2,而且,在Nb1≤k<Nb2的频带中***了0值后,将第1频谱S1(k)(0≤k<Nb2)输出到时域转换单元158a。
另一方面,因为第5帧~第6帧频谱的频带是R1,也就是说,第1频谱S1(k)的频带是0≤k<Na,所以校正单元251将第1频谱S1(k)的频带扩展到Nb2,而且,在Na≤k<Nb2的范围内***0值后,将第1频谱S1(k)(0≤k<Nb2)输出到时域转换单元158a。
下面说明图20B的情形。
在该图中,因为第2帧~第4帧及第9帧频谱的频带是R2,也就是说第1频谱S1(k)的频带是0≤k<Nb1,所以校正单元251什么处理也不进行,只将第1频谱S1(k)(0≤k<Nb1)输出到时域转换单元158a。
另外,因为第0帧~第1帧及第7帧~第8帧频谱的频带是R3,也就是说第1频谱S1(k)的频带是0≤k<Nb2,所以校正单元251在删除Nb1≤k<Nb2的频带后,将第1频带S1(k)(0≤k<Nb1)输出到时域转换单元158a。
另一方面,因为第5帧~第6帧频谱的频带是R1,也就是第1频谱S1(k)的频带是0≤k<Na,所以校正单元251将第1频谱S1(k)的频带扩展到Nb1,而且,在Na≤K<Nb1的频带上***0值后,将第1频谱S1(K)(0≤K<Nb1)输出到时域转换单元158a。
综上所述,根据本实施方式,即使接收的第1频谱S1(k)的有效频域在时间上变动时,通过提供适当的系数Nc也能稳定地取得期望的采样速率的解码信号。
(实施方式3)
图21是表示本发明的实施方式3涉及的通信***的主要结构的图。
本实施方式的特征为适当地进行处理由于通信网络的状况(通信环境)由接收端接收的第1频谱S1(k)的有效频域在时间上发生的变动。
分级编码单元301,对采样速率Fy的输入信号,实施如实施方式1所示的分级编码处理,生成可分级编码符号。在此,生成的编码符号由以下信息构成:关于频带0≤k<Ne的信息(R31),关于频带Ne≤k<Nf的信息(R32)以及关于频带Nf≤k<Ng的信息(R33)。分级编码单元301将该编码符号提供给网络控制单元302。
网络控制单元302,将由分级编码单元301提供的编码符号转发到分级解码单元303。在此,网络控制单元302,对应网络的状况,将转发到分级解码单元303的编码符号的一部分废弃。因此,输入到分级解码单元303的编码符号为以下的其中任意一个:当完全没有被弃废的编码符号时,是由信息R31~R33构成的编码符号;当信息R33的编码符号被废弃时,则是由信息R31及R32构成的编码符号;而当信息R32及R33的编码符号被废弃时,则是由信息R31构成的编码符号。
分级解码单元303,对提供的编码符号,适用如实施方式1或实施方式2所示的分级解码方法来生成解码信号。另外,将实施方式1适用于分级解码单元303时,输出的解码信号的采样速率Fz为Fy(因为Fz=Fy·Ng/Ng)。另外,将实施方式2适用于分级解码单元303时,能够根据期望的系数Nc设定解码信号的采样速率,该解码信号的采样速率Fz为Fy·Nc/Ng。
如上所述根据本实施方式,即使由于通信网络的状况由接收端接收的第1频谱S1(k)的有效频域在时间上发生变动,接收端也能够稳定地求出期望的采样速率的解码信号。
(实施方式4)
图22是本发明的实施方式4涉及的通信***的主要结构的图。
本实施方式的特征是:对于各自能够解码的采样速率不同的(解码能力不同的)多个分级解码单元,即使同时发送由1个分级编码单元生成的1个编码符号,与它对应的接收端,也能取得各自不同的采样速率的解码信号。
分级编码单元401,对于采样速率Fy的输入信号进行如实施方式1所示的编码处理,生成可分级编码符号。在此生成的编码符号由以下信息构成:由关于频带0≤k<Nh的信息(R41),关于频带Nh≤k<Ni的信息(R42),关于频带Ni≤k<Nj的信息(R43)。可分级编码单元401,将该编码符号分别提供给第1分级解码单元402-1、第2分级解码单元402-2、第3分级解码单元402-3。
第1分级解码单元402-1、第2分级解码单元402-2、第3分级解码单元402-3,对提供的编码符号,适用如实施方式1或实施方式2所示的分级解码方法来生成解码信号。第1分级解码单元402-1,进行设定系数Nc=Nj时的解码处理;第2分级解码单元402-2,进行设定系数Nc=Ni时的解码处理;第3分级解码单元402-3,进行设定系数Nc=Nh时的解码处理。
第1分级解码单元402-1,进行设定系数Nc=Nj时的解码处理,生成解码信号。该解码信号的采样速率F1为Fy(因为F1=Fy·Nj/Nj)。
第2分级解码单元402-2,进行设定系数Nc=Ni时的解码处理,生成解码信号。该解码信号的采样速率F2为Fy·Nj。
第3分级解码单元402-3,进行设定系数Nc=Nh时的解码处理,生成解码信号。该解码信号的采样速率F3为Fy·Nh/Nj。
如上所述根据本实施方法,发送侧端可以不考虑接收端的解码能力而发送编码符号,因此可以抑制通信网络的负载。另外,这些多种的采样速率的解码信号,能够以简易的结构而且较少的运算量来生成。
本发明涉及的编码装置或解码装置,也能装载在移动通信***的通信终端装置及基站装置上,由此可以提供具有与所述同样的作用效果的通信终端装置及基站装置。
另外,在此虽然以硬件构成的情形为例说明了本发明,但是通过软件也可以实现。
本说明书是根据2003年9月30日申请的日本专利第2003-341717号。其内容全部包括在此作为参考。
工业实用性
本发明涉及的编码装置及解码装置,具有以简易的结构及少量的运算量来实现可分级编码的效果,可以适用于IP网络等通信***。
Claims (5)
1.一种解码装置,其特征在于,包括:
接收单元,其接收发送信息,所述发送信息是由编码装置将声音信号或音频信号编码而生成的、包括关于所述声音信号或所述音频信号的比规定的频率低的频带的第一频带的第一编码信息,和关于所述声音信号或所述音频信号的比规定的频率高的频带的第二频带的第二编码信息的信息;
第一解码单元,其对所述第一编码信息进行解码而生成相当于声音信号或音频信号的第一频带的第一采样速率的信号;以及
第二解码单元,其对所述第二编码信息进行解码而生成所述第二频带的解码频谱,用所述第二频带的解码频谱对大于所述第一采样速率的规定的第二采样速率进行采样速率转换,生成第三采样速率的解码信号,
所述第二解码单元包括:
第一转换单元,其根据通过所述第一解码单元得到的第一采样速率的信号得到第一频带的解码频谱;
频谱结合单元,将所述第二频带的解码频谱与所述第一频带的解码频谱的扩展频带结合而生成扩展解码频谱;
校正单元,其在位于与所述扩展解码频谱的最大频率指数相邻的区域的所述扩展解码频谱的第一高频部分***零,得到规定的频带的频谱;以及
时域信号生成单元,基于所述规定的频带的频谱,通过时域转换而生成所述第三采样速率的时域信号作为所述解码信号。
2.如权利要求1所述的解码装置,其特征在于:
所述发送信息包含,将所述第二频带分割为2个以上的子带,并针对各个子带的每一个进行编码而得的所述第二编码信息。
3.一种通信终端装置,其特征在于:
具备权利要求1所述的解码装置。
4.一种基站装置,其特征在于:
具备权利要求1所述的解码装置。
5.一种解码方法,其特征在于,包括以下步骤:
接收步骤,其接收发送信息,所述发送信息是将声音信号或音频信号编码而生成的、包括关于所述声音信号或所述音频信号的比规定的频率低的频带的第一频带的第一编码信息,和关于所述声音信号或所述音频信号的比规定的频率高的频带的第二频带的第二编码信息的信息;
第一解码步骤,其对所述第一编码信息进行解码而生成相当于声音信号或音频信号的第一频带的第一采样速率的信号;以及
第二解码步骤,其对所述第二编码信息进行解码而生成所述第二频带的解码频谱,用所述第二频带的解码频谱对大于所述第一采样速率的规定的第二采样速率进行采样速率转换,生成第三采样速率的解码信号,
所述第二解码步骤包括:
第一转换步骤,其根据通过所述第一解码步骤得到的第一采样速率的信号得到第一频带的解码频谱;
频谱结合步骤,将所述第二频带的解码频谱与所述第一频带的解码频谱的扩展频带结合而生成扩展解码频谱;
校正步骤,其在位于与所述扩展解码频谱的最大频率指数相邻的区域的所述扩展解码频谱的第一高频部分***零,得到规定的频带的频谱;以及
时域信号生成步骤,基于所述规定的频带的频谱,通过时域转换而生成所述第三采样速率的时域信号作为所述解码信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003-341717 | 2003-09-30 | ||
JP2003341717A JP4679049B2 (ja) | 2003-09-30 | 2003-09-30 | スケーラブル復号化装置 |
CN2004800256756A CN1849647B (zh) | 2003-09-30 | 2004-09-29 | 采样速率转换装置、编码装置、解码装置及它们的方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2004800256756A Division CN1849647B (zh) | 2003-09-30 | 2004-09-29 | 采样速率转换装置、编码装置、解码装置及它们的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103177730A CN103177730A (zh) | 2013-06-26 |
CN103177730B true CN103177730B (zh) | 2015-12-09 |
Family
ID=34386230
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2004800256756A Active CN1849647B (zh) | 2003-09-30 | 2004-09-29 | 采样速率转换装置、编码装置、解码装置及它们的方法 |
CN201310064311.XA Active CN103177730B (zh) | 2003-09-30 | 2004-09-29 | 解码装置、通信终端装置、基站装置以及解码方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2004800256756A Active CN1849647B (zh) | 2003-09-30 | 2004-09-29 | 采样速率转换装置、编码装置、解码装置及它们的方法 |
Country Status (5)
Country | Link |
---|---|
US (3) | US7756711B2 (zh) |
EP (2) | EP2172931A1 (zh) |
JP (1) | JP4679049B2 (zh) |
CN (2) | CN1849647B (zh) |
WO (1) | WO2005031705A1 (zh) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006049204A1 (ja) | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、符号化方法及び復号化方法 |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
US8295507B2 (en) | 2006-11-09 | 2012-10-23 | Sony Corporation | Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium |
JPWO2008084688A1 (ja) * | 2006-12-27 | 2010-04-30 | パナソニック株式会社 | 符号化装置、復号装置及びこれらの方法 |
JP4708446B2 (ja) * | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP5294713B2 (ja) * | 2007-03-02 | 2013-09-18 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
US9327193B2 (en) | 2008-06-27 | 2016-05-03 | Microsoft Technology Licensing, Llc | Dynamic selection of voice quality over a wireless system |
KR101381513B1 (ko) | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
CA2765523A1 (en) * | 2009-06-23 | 2010-12-29 | Kimitaka Tsutsumi | Coding method, decoding method, and device and recording medium using the methods |
BE1019445A3 (fr) * | 2010-08-11 | 2012-07-03 | Reza Yves | Procede d'extraction d'information audio. |
JP5665987B2 (ja) * | 2010-08-12 | 2015-02-04 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | Qmfベースのオーディオコーデックの出力信号のリサンプリング |
CN102610231B (zh) * | 2011-01-24 | 2013-10-09 | 华为技术有限公司 | 一种带宽扩展方法及装置 |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
US20140214431A1 (en) * | 2011-07-01 | 2014-07-31 | Dolby Laboratories Licensing Corporation | Sample rate scalable lossless audio coding |
US8711943B2 (en) * | 2011-07-21 | 2014-04-29 | Luca Rossato | Signal processing and tiered signal encoding |
JP6155274B2 (ja) | 2011-11-11 | 2017-06-28 | ドルビー・インターナショナル・アーベー | 過剰サンプリングされたsbrを使ったアップサンプリング |
US9905236B2 (en) | 2012-03-23 | 2018-02-27 | Dolby Laboratories Licensing Corporation | Enabling sampling rate diversity in a voice communication system |
GB201210373D0 (en) * | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
CN103971691B (zh) * | 2013-01-29 | 2017-09-29 | 鸿富锦精密工业(深圳)有限公司 | 语音信号处理***及方法 |
WO2015157843A1 (en) | 2014-04-17 | 2015-10-22 | Voiceage Corporation | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
TWI566241B (zh) * | 2015-01-23 | 2017-01-11 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
US20170054510A1 (en) * | 2015-08-17 | 2017-02-23 | Multiphy Ltd. | Electro-optical finite impulse response transmit filter |
EP3382704A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal |
CN107886966A (zh) * | 2017-10-30 | 2018-04-06 | 捷开通讯(深圳)有限公司 | 终端及其优化语音命令的方法、存储装置 |
US10824917B2 (en) | 2018-12-03 | 2020-11-03 | Bank Of America Corporation | Transformation of electronic documents by low-resolution intelligent up-sampling |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4343366C2 (de) * | 1993-12-18 | 1996-02-29 | Grundig Emv | Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen |
US5610942A (en) * | 1995-03-07 | 1997-03-11 | Chen; Keping | Digital signal transcoder and method of transcoding a digital signal |
JP3139602B2 (ja) * | 1995-03-24 | 2001-03-05 | 日本電信電話株式会社 | 音響信号符号化方法及び復号化方法 |
JP3283413B2 (ja) | 1995-11-30 | 2002-05-20 | 株式会社日立製作所 | 符号化復号方法、符号化装置および復号装置 |
DE19706516C1 (de) * | 1997-02-19 | 1998-01-15 | Fraunhofer Ges Forschung | Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP4132154B2 (ja) * | 1997-10-23 | 2008-08-13 | ソニー株式会社 | 音声合成方法及び装置、並びに帯域幅拡張方法及び装置 |
EP0957579A1 (en) | 1998-05-15 | 1999-11-17 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for sampling-rate conversion of audio signals |
JP2000068943A (ja) | 1998-08-17 | 2000-03-03 | Hitachi Ltd | 光伝送装置 |
KR20000047944A (ko) * | 1998-12-11 | 2000-07-25 | 이데이 노부유끼 | 수신장치 및 방법과 통신장치 및 방법 |
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
DE19947019A1 (de) * | 1999-09-30 | 2001-06-07 | Infineon Technologies Ag | Verfahren und Vorrichtung zum Erzeugen von spreizcodierten Signalen |
AU2001262748A1 (en) * | 2000-06-14 | 2001-12-24 | Kabushiki Kaisha Kenwood | Frequency interpolating device and frequency interpolating method |
JP3538122B2 (ja) * | 2000-06-14 | 2004-06-14 | 株式会社ケンウッド | 周波数補間装置、周波数補間方法及び記録媒体 |
US7623496B2 (en) * | 2001-04-24 | 2009-11-24 | Intel Corporation | Managing bandwidth in network supporting variable bit rate |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
JP3926726B2 (ja) * | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
CN100395817C (zh) * | 2001-11-14 | 2008-06-18 | 松下电器产业株式会社 | 编码设备、解码设备和解码方法 |
JP2003216199A (ja) * | 2001-11-15 | 2003-07-30 | Matsushita Electric Ind Co Ltd | 復号装置、復号方法及びプログラム供給媒体 |
US20030108108A1 (en) | 2001-11-15 | 2003-06-12 | Takashi Katayama | Decoder, decoding method, and program distribution medium therefor |
JP2003241799A (ja) * | 2002-02-15 | 2003-08-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム |
FI116498B (fi) * | 2002-09-23 | 2005-11-30 | Nokia Corp | Kaistanleveyden mukauttaminen |
KR100499047B1 (ko) * | 2002-11-25 | 2005-07-04 | 한국전자통신연구원 | 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법 |
US20040138876A1 (en) * | 2003-01-10 | 2004-07-15 | Nokia Corporation | Method and apparatus for artificial bandwidth expansion in speech processing |
KR100917464B1 (ko) * | 2003-03-07 | 2009-09-14 | 삼성전자주식회사 | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
US7272567B2 (en) * | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
DE602006012637D1 (de) * | 2005-04-01 | 2010-04-15 | Qualcomm Inc | Vorrichtung und Verfahren für die Teilband-Sprachkodierung |
-
2003
- 2003-09-30 JP JP2003341717A patent/JP4679049B2/ja not_active Expired - Lifetime
-
2004
- 2004-09-29 EP EP10151098A patent/EP2172931A1/en not_active Withdrawn
- 2004-09-29 WO PCT/JP2004/014215 patent/WO2005031705A1/ja active Application Filing
- 2004-09-29 CN CN2004800256756A patent/CN1849647B/zh active Active
- 2004-09-29 CN CN201310064311.XA patent/CN103177730B/zh active Active
- 2004-09-29 EP EP04788282A patent/EP1669981A4/en not_active Withdrawn
- 2004-09-29 US US10/573,812 patent/US7756711B2/en active Active
-
2010
- 2010-02-18 US US12/708,290 patent/US8195471B2/en active Active
-
2012
- 2012-05-03 US US13/463,653 patent/US8374884B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20120221342A1 (en) | 2012-08-30 |
US8195471B2 (en) | 2012-06-05 |
US8374884B2 (en) | 2013-02-12 |
EP2172931A1 (en) | 2010-04-07 |
CN103177730A (zh) | 2013-06-26 |
CN1849647A (zh) | 2006-10-18 |
US7756711B2 (en) | 2010-07-13 |
EP1669981A1 (en) | 2006-06-14 |
JP4679049B2 (ja) | 2011-04-27 |
JP2005107255A (ja) | 2005-04-21 |
CN1849647B (zh) | 2013-04-10 |
WO2005031705A1 (ja) | 2005-04-07 |
US20060280271A1 (en) | 2006-12-14 |
US20100161321A1 (en) | 2010-06-24 |
EP1669981A4 (en) | 2008-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103177730B (zh) | 解码装置、通信终端装置、基站装置以及解码方法 | |
CN1942928B (zh) | 用于处理音频信号的模块和方法 | |
CN102280109B (zh) | 编码装置、解码装置及它们的方法 | |
JP3936139B2 (ja) | オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置 | |
JP4142292B2 (ja) | オーディオ信号の符号化効率を向上させる方法 | |
JP3277682B2 (ja) | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 | |
CN102592598B (zh) | 用于恢复多通道音频信号的设备和方法 | |
JPS6161305B2 (zh) | ||
JPH08237132A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 | |
WO2002058052A1 (en) | Wideband signal transmission system | |
KR100519260B1 (ko) | 고속 최적화된 무선마이크 장치 및 그 제어방법 | |
JP2006521577A (ja) | マルチチャネル信号を表す主信号と副信号の符号化 | |
KR100389487B1 (ko) | 정보부호화방법및장치,정보복호화방법및장치,및정보전송방법 | |
JP2007504503A (ja) | 低ビットレートオーディオ符号化 | |
CA1269135A (en) | Sub-band coders, decoders and filters | |
JP3557674B2 (ja) | 高能率符号化方法及び装置 | |
JP5031006B2 (ja) | スケーラブル復号化装置及びスケーラブル復号化方法 | |
US20040039568A1 (en) | Coding method, apparatus, decoding method and apparatus | |
CA2206652A1 (en) | Baud-rate-independent asvd transmission built around g.729 speech-coding standard | |
JP3685823B2 (ja) | 信号符号化方法及び装置、並びに信号復号化方法及び装置 | |
JPH09101799A (ja) | 信号符号化方法及び装置 | |
JPS6096041A (ja) | サブバンド符号化方法および装置 | |
JP2005114814A (ja) | 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体 | |
Bhatt | Implementation and overall performance evaluation of CELP based GSM AMR NB coder over ABE | |
JP3413691B2 (ja) | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報送信方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
ASS | Succession or assignment of patent right |
Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD. Effective date: 20140710 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20140710 Address after: California, USA Applicant after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA Address before: Osaka Japan Applicant before: Matsushita Electric Industrial Co.,Ltd. |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |