CN103314407A - 信号处理装置、方法以及程序 - Google Patents

信号处理装置、方法以及程序 Download PDF

Info

Publication number
CN103314407A
CN103314407A CN201280004776XA CN201280004776A CN103314407A CN 103314407 A CN103314407 A CN 103314407A CN 201280004776X A CN201280004776X A CN 201280004776XA CN 201280004776 A CN201280004776 A CN 201280004776A CN 103314407 A CN103314407 A CN 103314407A
Authority
CN
China
Prior art keywords
information
signal
sinusoidal wave
envelope
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280004776XA
Other languages
English (en)
Other versions
CN103314407B (zh
Inventor
畠中光行
知念彻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN103314407A publication Critical patent/CN103314407A/zh
Application granted granted Critical
Publication of CN103314407B publication Critical patent/CN103314407B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)

Abstract

本技术涉及能够在对声音信号进行解码时获得具有较高音质的声音的信号处理装置、方法以及程序。包络信息生成单元(24)生成表示待编码的声音信号的高频分量的包络形状的包络信息。正弦波信息生成单元(26)从声音信号的高频分量中检测正弦波信号,并且生成表示正弦波信号的出现开始位置的正弦波信息。编码流生成单元(27)对包络信息、正弦波信息以及经编码的声音信号的低频分量进行复用,并且输出由此获得的编码流。由此,编码流的接收侧能够根据包络信息和正弦波信息、以较高的精度来估计包括正弦波信号的高频分量。本发明可以应用于信号处理装置。

Description

信号处理装置、方法以及程序
技术领域
本发明涉及信号处理装置、方法以及程序,并且特别地涉及能够在对经编码的音频信号进行解码的情况下获得具有较高音质的音频的信号处理装置、程序以及方法。
背景技术
通常,音频信号编码方法例如HE-AAC(高效MPEG(运动图像专家组)4AAC(高级音频编码))(国际标准ISO/IEC14496-3)是已知的。借助于这样的编码方法,使用高频特征编码技术例如SBR(频带复制)(例如,参考PTL1)。
根据SBR,当对音频信号进行编码时,输出SBR信息以用于生成音频信号的高频分量(以下被称为高频信号)和经编码的音频信号的低频分量(以下被称为低频信号)。在解码装置处,当对经编码的低频信号进行解码时,通过使用SBR信息以及由解码获得的低频信号来生成高频信号,从而获得由低频信号和高频信号组成的音频信号。
这种SBR信息包括主要表示用于高频分量的包络形状的包络信息,并且包括表示用于获得在解码装置处生成高频分量期间所添加的噪声信号的噪声包络信息。
在此,噪声包络信息包括表示用于将包括在高频分量中的噪声信号的每个SBR帧划分为两个区域的边界位置(以下被称为噪声边界位置)的信息以及表示在每个区域中的噪声信号的增益的信息。因此,在解码装置处,基于噪声包络信息对预定噪声信号的通过噪声边界位置所划分的每个区域执行增益调整,以建立最终的噪声信号。另外,借助于SBR还可以设置用于整个SBR帧的增益而不需要将噪声信号的SBR帧划分为两个区域。
当对音频信号进行解码时,解码装置通过将根据低频信号和包络信息获得的伪高频信号与根据噪声包络信息获得的噪声信号进行合成来生成高频分量,并且根据所获得的高频分量和低频信号来生成音频信号。
此外,借助于SBR,对具有高音调特性的音频信号执行使用正弦波合成的编码。也就是说,当在解码侧生成高频分量时,除噪声信号之外,特定频率的正弦波信号被添加至伪高频信号。在这种情况下,根据对伪高频信号、噪声信号以及正弦波信号进行合成所获得的信号被设置为根据预测获得的高频信号。
当使用正弦波信号预测高频分量时,在SBR信息中包括表示在SBR帧中是否存在正弦波信号的正弦波信息。具体地,解码期间使用的正弦波信号的合成开始位置是SBR帧的开始位置或噪声边界位置,并且正弦波信息由如下二进制信息组成:该二进制信息表示在通过噪声边界位置所划分的SBR帧的每个区域中是否存在正弦波信号合成。
以这种方式,添加至伪高频信号的噪声信号和正弦波信号是难以在源音频信号的高频分量范围内根据包络信息进行再现的分量。因此,通过在伪高频信号的合适位置处将噪声信号和正弦波信号进行合成,能够以较高的精度预测高频分量,并且能够通过使用由预测获得的高频分量执行频带扩展来再现具有较高音质的音频。
引用列表
专利文献
PTL1:日本未经审查的专利申请公布(PCT申请的译文)No.2001-521648。
发明内容
技术问题
然而,当使用正弦波信号预测高频分量时,正弦波信号的合成开始位置被设置为SBR帧的开始位置或噪声边界位置,这可能在某些情况下引起原始音频信号中的正弦波分量的出现开始位置的变化。因此,不能够以高精度再现高频分量,并且可能引起通过解码获得的音频信号的听感的劣化。
特别地借助于SBR,帧长度是固定的并且不依赖于待编码的音频信号的采样频率,因此当采样频率为低时,针对一帧的绝对时间长度变得较长。鉴于该原因,在源音频信号的正弦波分量的出现开始位置与在解码期间待合成的正弦波信号的合成开始位置之间的绝对时间的变化量(差)增加,并且在这些变化区域处的量化噪声变得显著。
本技术已经考虑了这种情况以使得能够在对音频信号进行解码时获得具有较高音质的音频。
问题的解决方案
本发明的第一方面的信号处理装置设置有:提取单元,其被配置成提取音频信号的低频分量、表示音频信号的高频分量的包络的包络信息以及用于标识包括在高频分量中的正弦波分量的频率和出现位置的正弦波信息;伪高频生成单元,其被配置成基于包络信息和作为低频分量的低频信号来生成构成高频分量的伪高频信号;正弦波生成单元,其被配置成生成在由正弦波信息表示的频率下、并且该正弦波信号将根据正弦波信息标识的出现位置指定为开始位置的正弦波信号;以及合成单元,其被配置成将低频信号、伪高频信号以及正弦波信号进行合成以生成音频信号。
正弦波信息可以包括表示从高频分量的帧的开始位置到正弦波分量的出现开始位置的距离的信息来作为用于标识出现位置的信息。
信号处理装置还设置有:噪声生成单元,其被配置成基于表示由噪声包络信息所表示的预定信号的每个区域的增益的信息、通过调整每个区域的增益来生成构成高频分量的噪声信号,其中所述区域是通过由噪声包络信息表示的噪声边界位置来划分的;其中,提取单元还提取噪声包络信息,正弦波信息包括表示从噪声边界位置到正弦波分量的出现开始位置的距离的信息来作为用于标识出现位置的信息,并且合成单元可以将低频信号、伪高频信号、正弦波信号以及噪声信号进行合成以生成音频信号。
正弦波信息可以包括表示从高频分量包络的峰值位置到正弦波分量的出现开始位置的距离的信息来作为用于标识出现位置的信息。
可以针对每帧来提取正弦波信息,并且正弦波生成单元可以针对每帧的高频分量来生成正弦波信号。
可以针对构成高频分量的每个频带来提取正弦波信息,并且正弦波生成单元可以针对每个频带来生成正弦波信号。
本发明的第一方面的信号处理方法或程序包括以下步骤:提取音频信号的低频分量、表示音频信号的高频分量的包络的包络信息、以及用于标识包括在高频分量中的正弦波分量的频率和出现开始位置的正弦波信息;基于包量的络信息和作为低频分低频信号来生成构成高频分量的伪高频信号;在由根据正弦波信息的出现开始位置所标识的开始位置处生成在由正弦波信息表示的频率下的正弦波信号;以及将低频信号、伪高频信号以及正弦波信号进行合成以生成音频信号。
关于本发明的第一方面,提取音频信号的低频分量、表示音频信号的高频分量的包络的包络信息以及用于标识包括在高频分量中的正弦波分量的频率和出现位置的正弦波信息,基于包络信息和作为低频分量的低频信号来生成构成高频分量的伪高频信号,生成在由正弦波信息表示的频率下、并且将根据正弦波标识的出现位置指定为开始位置的正弦波信号,以及将低频信号、伪高频信号以及正弦波信号合成以生成音频信号。
本发明的第二方面的信号处理装置设置有:包络信息生成单元,其被配置成生成表示高频信号的包络的包络信息,所述高频信号是音频信号的高频分量;正弦波信息生成单元,其被配置成检测包括在高频信号中的正弦波信号,并且生成用于标识正弦波信号的频率和出现位置的正弦波信息;以及输出单元,其被配置成生成并输出由低频信号、包络信息以及正弦波信息组成的数据,该低频信号是音频信号的低频分量。
正弦波信息可以包括表示从高频分量的帧的开始位置到正弦波信号的出现开始位置的距离的信息来作为用于标识出现位置的信息。
信号处理装置还设置有:噪声包络信息生成单元,其被配置成检测包括在高频信号中的噪声信号,并且生成如下噪声包络信息:该噪声包络信息由表示将噪声信号划分为多个区域的噪声边界位置的信息以及表示区域中的噪声信号的增益的信息组成,其中,正弦波信息包括表示从噪声边界位置到正弦波分量的出现开始位置的距离的信息来作为用于标识出现位置的信息;以及输出单元,其能够生成并输出由低频信号、包络信息、正弦波信息以及噪声包络信息组成的数据。
正弦波信息可以包括表示从高频分量包络的峰值位置到正弦波分量的出现开始位置的距离的信息来作为用于标识出现位置的信息。
正弦波信息可以针对每帧来生成。
正弦波信息可以针对构成高频分量的每个频带来生成。
本发明的第二方面的信号处理方法或程序包括以下步骤:生成表示高频信号的包络的包络信息,所述高频信号是音频信号的高频分量;检测包括在高频信号中的正弦波信号;生成用于标识正弦波信号的频率和出现位置的正弦波信息;以及生成并输出由低频信号、包络信息以及正弦波信息组成的数据,该低频信号是音频信号的低频分量。
关于本发明的第二方面,生成表示高频信号的包络的包络信息,所述高频信号是音频信号的高频分量;检测包括在高频信号中的正弦波信号;生成用于标识正弦波信号的频率和出现位置的正弦波信息;以及生成并输出由低频信号、包络信息以及正弦波信息组成的数据,该低频信号是音频信号的低频分量。
发明的有益效果
根据本技术的第一方面和第二方面,能够在对音频信号进行解码时获得具有较高音质的音频。
附图说明
图1是示出了编码装置的第一实施方式的配置示例的图。
图2是描述编码处理的流程图。
图3是示出了正弦波信号的合成开始位置的图。
图4是示出了正弦波信号的合成开始位置的图。
图5是示出了解码装置的第一实施方式的配置示例的图。
图6是描述解码处理的流程图。
图7是描述生成正弦波信号的处理的流程图。
图8是示出了另一编码装置的配置示例的图。
图9是描述编码处理的流程图。
图10是描述正弦波信号的合成开始位置的图。
图11是示出了另一解码装置的配置示例的图。
图12是描述解码处理的流程图。
图13是描述生成正弦波信号的处理的流程图。
图14是示出了另一编码装置的配置示例的图。
图15是描述编码处理的流程图。
图16是描述正弦波信号的合成开始位置的图。
图17是描述另一解码装置的配置示例的图。
图18是描述解码处理的流程图。
图19是描述生成正弦波信号的处理的流程图。
图20是示出了又一编码装置的配置示例的图。
图21是描述编码处理的流程图。
图22是示出了又一解码装置的配置示例的图。
图23是描述解码处理的流程图。
图24是描述生成正弦波信号的处理的流程图。
图25是示出了计算机的配置示例的图。
具体实施方式
以下,将参照附图来描述应用本技术的实施方式。
<第一实施方式>
[编码装置的配置示例]
图1是示出了应用本技术的编码装置的第一实施方式的配置示例的图。
编码装置11配置有欠采样器(downsampler)21、低频编码单元22、频带划分滤波器23、包络信息生成单元24、噪声包络信息生成单元25、正弦波信息生成单元26以及编码流生成单元27。编码单元11对输入的音频信号进行编码并输出,输入至编码装置11中的音频信号被提供给欠采样器21和频带划分滤波器23。
欠采样器21通过对输入的音频信号进行欠采样来提取作为音频信号的低频分量的低频信号,并将该低频信号提供给低频编码单元22和噪声包络信息生成单元25。另外,在下文中,等于或低于音频信号的某一频率的频带分量被称为低频分量,高于音频信号的低频分量的频带分量被称为高频分量。
低频编码单元22对从欠采样器21提供的低频信号进行编码,并将该低频信号提供给编码流生成单元27。
频带划分滤波器23对输入的音频信号进行滤波处理,并且对音频信号执行频带划分。由于该频带划分,音频信号被划分为具有多个频带分量的信号。另外,在下文中,通过频带划分所获得的每个频带信号中的构成高频分量的每个频带信号被称为高频信号。频带划分滤波器23向包络信息生成单元24、噪声包络信息生成单元25以及正弦波信息生成单元26提供来自通过频带划分所获得的每个频带的高频侧的高频信号。
包络信息生成单元24基于从频带划分滤波器23提供的高频信号、针对高频侧的每个频带生成表示用于频带的高频信号的包络形状(包络)的包络信息,并且然后将该包络信息提供给噪声包络信息生成单元25。此外,包络信息生成单元24设置有编码单元41,该编码单元41对由包络信息生成单元24生成的包络信息进行编码并将经编码的包络信息提供给编码流生成单元27。
噪声包络信息生成单元25基于来自频带划分滤波器23的高频信号和来自包络信息生成单元24的包络信息来生成噪声包络信息,并且当必要时接收来自正弦波信息生成单元26的信息。
在此,噪声包络信息是如下信息:该信息由表示用于划分包括在音频信号的高频分量中的噪声信号的边界位置(噪声边界位置)的信息,以及表示针对以噪声边界位置所划分的每个区域的噪声信号增益的信息组成。
此外,噪声包络信息生成单元25设置有信号生成单元51、边界计算单元52以及编码单元53。当生成噪声包络信息时,信号生成单元51基于来自欠采样器21的低频信号和来自包络信息生成单元24的包络信息来针对每个频带分量预测音频信号的高频侧。
边界计算单元52基于根据高频信号和伪高频信号所获得的噪声信号包络来确定用于将噪声信号划分为多个区域的噪声边界位置,所述伪高频信号是在生成噪声包络信息期间所预测的每个频带分量的高频侧的结果。编码单元53对通过噪声包络信息生成单元25生成的噪声包络信息进行编码,并且将经编码的噪声包络信息提供给编码流生成单元27。
正弦波信息生成单元26基于从频带划分滤波器23提供的高频信号、针对高频侧的每个频带生成用于获得包括在频带中的正弦波信号的正弦波信息,并且当必要时接收来自噪声包络信息生成单元25的信息。
在此,正弦波信息是如下信息:该信息由表示是否存在包括在音频信号的高频分量中的正弦波信号的信息,以及用于标识正弦波信号的出现开始位置的信息组成。也就是说,正弦波信息可以是如下信息:该信息由表示是否存在在对音频信号进行解码期间待与伪高频分量进行合成的正弦波信号的信息,以及表示正弦波信号的合成开始位置的信息组成。
此外,正弦波信息生成单元26设置有正弦波检测单元61、位置检测单元62以及编码单元63。正弦波检测单元61检测在生成正弦波信息期间是否存在来自高频信号的正弦波分量。
当生成正弦波信息时,位置检测单元62基于来自频带划分滤波器23的高频信号来检测表示正弦波信号的合成应当开始的合成开始位置,即正弦波信号的出现开始位置。编码单元63对由正弦波信息生成单元26生成的正弦波信息进行编码,并且将经编码的正弦波信息提供给编码流生成单元27。
编码流生成单元27对来自低频编码单元22的低频信号、来自包络信号生成单元24的包络信息、来自噪声包络信息生成单元25的噪声包络信息以及来自正弦波信息生成单元26的正弦波信息进行编码,并且输出通过该编码获得的编码流。也就是说,低频信号、包络信息、噪声包络信息以及正弦波信息被复用到编码流中。
[编码处理的描述]
接下来,将描述编码装置11的操作。
当音频信号被输入至编码装置11中且编码装置11被指示对音频信号进行编码时,编码装置11执行编码处理以执行对音频信号的编码,并且输出由此获得的编码流。以下,将参照图2中的流程图来描述编码装置11的编码处理。
在步骤S11中,欠采样器21对输入的音频信号进行欠采样以生成低频信号,并且将该低频信号提供给噪声包络信息生成单元25和低频编码单元22。
在步骤S12中,低频编码单元22对从欠采样器21提供的低频信号进行编码,并且将该低频信号提供给编码流生成单元27。例如,通过编码方法(例如MPEG4AAC、MPEG2AAC、CELP(码激励线性预测编码)、TCX(变换编码激励)或AMR(自适应多速率)等)对低频信号进行编码。
在步骤S13中,频带划分滤波器23将输入的音频信号划分为频带,并且由此获得的高频分量被提供给包络信息生成单元24至正弦波信息生成单元26。例如,可以从64个不同的频带获得作为高频分量的高频信号。
在步骤S14中,包络信息生成单元24基于针对从频带划分滤波器23提供的每个频带的高频信号来生成针对每个频带的包络信息。例如,包络信息生成单元24可以指定由高频信号的32个样本组成的区域为一帧,并且生成针对每帧每个频带的包络信息。
具体地,包络信息生成单元24获得在一帧中在时间轴上相邻的两个高频信号样本的平均样本值,并且该平均值变成新的高频信号样本值。结果,针对一帧的高频信号被从32个样本的信号转换为16个样本的信号。
接下来,包络信息生成单元24对现在为16个样本的高频信号执行差分编码,由此获得的信息变成包络信息。例如,通过差分编码获得在时间轴上相邻的待处理的两个高频信号样本的样本值之间的差,并且该差变成包络信息。此外,包络信息可以由如下差组成:待处理的频带的高频信号的样本的样本值与和所述频带相邻的频带中的样本的样本值(例如在与高频信号带相同的位置上)之间的差。
以这种方式获得的包络信息为表示针对高频信号的一帧的包络形状的信息。编码单元41对所生成的包络信息执行可变长度编码例如哈夫曼编码,并且将经编码的包络信息提供给编码流生成单元27。此外,包络信息生成单元24将包络信息提供给噪声包络信息生成单元25。
另外,在下文中,高频信号将继续被描述为以配置有32个样本的一帧为单位进行处理。此外,在下文中,根据高频信号(音频信号)的两个样本所构成的区域被称为一个时隙。
在步骤S15中,噪声包络信息生成单元25中的信号生成单元51基于从包络信息生成单元24提供的包络信息和从欠采样器21提供的低频信号,针对高频侧的每个频带生成伪高频信号。
例如,信号生成单元51提取针对低频信号的预定频带的一帧的区域,并且将提取的低频信号处理为通过包络信息表示的包络形状。也就是说,低频信号的样本的样本值被增大或减小,使得对应于样本的位置增益适合由包络信息表示的包络,由此获得的信号变成伪高频信号。
以这种方式获得的伪高频信号具有与由包络信息表示的实际高频信号的包络几乎相同的包络形状。也就是说,根据低频信号和包络信息来生成伪高频信号。
在步骤S16中,噪声包络信息生成单元25针对在高频侧的每个频带提取在高频信号与伪高频信号之间的差,并且获得噪声信号的包络(以下被称为噪声包络)。
另外,更加具体地,在步骤S16中获得的噪声包络是虚拟噪声包络。从编码装置11输出的编码流的接收侧在对音频信号进行解码期间预测音频信号的高频分量,但是该预测是通过对伪高频信号、噪声信号以及正弦波信号进行合成而执行的。
也就是说,实际音频信号的高频分量被假设为包括伪高频信号、噪声信号以及正弦波信号。在此,在步骤S16中,获得高频信号与伪高频信号之间的差,并且该差应当是噪声信号与正弦波信号的合成。因此,以这种方式获得的差被认为是包括正弦波信号的噪声信号的包络。
噪声包络信息生成单元25向正弦波信息生成单元26提供如之前的描述所获得的针对高频侧的每个频带的虚拟噪声包络。
在步骤S17中,正弦信息生成单元26中的正弦波检测单元61基于从噪声包络信息生成单元25提供的虚拟噪声包络来针对每个频带检测来自高频信号的正弦波分量。
例如,正弦波检测单元61对虚拟噪声包络进行频率转换,并且将噪声包络转换为频率分量。然后,当在所获得的频率分量中存在具有高功率的频率尖峰时,正弦波检测单元61将这些频率分量识别为正弦波分量。具体地,当在观察中的频率的功率与其他周围频率的功率之间的差等于或大于预定阈值时,该在观察中的频率被识别为正弦波分量。以这种方式检测的针对频率的正弦波信号被确定为包括在实际高频分量中的正弦波信号。
在步骤S18中,正弦波信息生成单元26中的位置检测单元62基于从频带划分滤波器23提供的高频信号来针对每个频带检测应当合成正弦波信号(其是被检测到的正弦波分量)的合成开始位置。
例如,位置检测单元62获得包括在高频信号的一个时隙(以时隙为单位)中的样本的平均样本值与包括在检测到的正弦波信号的一个时隙中的样本的平均样本值之间的差。然后,位置检测单元62将从一帧的区域的开始寻找的合成开始位置确定为最终位置(时隙的开始位置或样本的最终位置),在该最终位置处获得的差的值等于或大于预定阈值。该合成开始位置是包括在实际高频信号中的正弦波信号的出现开始位置,从合成开始位置之后的时刻起,高频信号和正弦波信号的平均样本值的差应当减小。
此外,针对在高频侧的每个频带,正弦波信息生成单元26向噪声包络信息生成单元25提供如下信息:表示是否从频带检测到正弦波的信息;表示检测到的正弦波信号的频率和功率的信息;以及合成开始位置。
在步骤S19中,正弦波信息生成单元26针对在高频侧的每个频带来生成正弦波信息,并且将该正弦波信息提供给编码流生成单元27。
例如,正弦波信息生成单元26指定如下信息作为正弦波信息:该信息由表示是否从高频频带检测到正弦波信号的信息以及合成开始位置组成。此外,在生成正弦波信息期间,正弦波信息生成单元26中的编码单元63对表示合成开始位置的信息执行可变长度编码。
在此,表示是否检测到正弦波信号的信息更加具体地为表示在高频频带中的哪个频率是正弦波分量的信息。例如,当从高频频带检测到多个正弦波信号时,用于标识这些正弦波信号的频率的信息被指定为表示是否检测到正弦波信号的信息。此外,当从高频频带检测到多个正弦波信号时,针对每个正弦波信号来生成表示合成开始位置的信息。
此外,当未从高频频带检测到正弦波分量时,将仅由表示是否检测到正弦波信号的信息组成的正弦波信息发送至解码侧。也就是说,发送不包括表示合成开始位置的信息的正弦波信息。
另外,编码装置11可以选择是否每帧向解码侧发送正弦波信息。以这种方式,通过使正弦波信息的发送为可选择的,编码流的传输效率提高,同时可以执行正弦波分量的时间信息的重置。结果,当从在编码流的解码侧的流中的任意帧开始解码处理时,可以开始来自包括表示合成开始位置的信息的帧的正弦波合成。
另外,如图3所示,例如在解码侧的合成开始位置常规地为帧的开始位置或噪声边界位置。另外,图中的横轴表示时间轴。此外,图3中的箭头FS1和箭头FE1分别表示帧的开始位置和结束位置。
根据图3中的示例,由箭头N1表示的位置是噪声边界位置,并且正弦波信号的合成开始位置也位于与噪声边界位置相同的位置。因此,正弦波信号在从由箭头N1表示的位置到帧的结束位置的区域中被组合。
然而,当包括在实际高频分量中的正弦波信号到达的位置位于由箭头N1表示的噪声边界位置之后时,例如,在解码侧非必要的正弦波分量被添加至从噪声边界位置到实际正弦波信号的出现开始位置的空间中。在这种情况下,在通过解码获得的音频信号中存在令人不愉快的听感,从而不能获得具有高音质的音频。
关于这一点,如图4所示,根据编码装置11,输出至解码侧的合成开始位置并不限制于与噪声边界位置相同。另外,图中的横轴表示时间轴。此外,图4中的箭头FS2和箭头FE2分别表示帧的开始位置和结束位置。
根据图4中的示例,由箭头N2所表示的位置表示噪声边界位置。此外,正弦波信号的合成开始位置是由箭头G1表示的位置,并且该合成开始位置在噪声边界位置之前。根据本示例,正弦波信号在从由箭头G1表示的合成开始位置到帧的结束位置的区域中被组合。
此外,在这种情况下,表示从由箭头FS2所表示的帧的开始位置到由箭头G1所表示的合成开始位置的时间长度(时间距离)的信息被指定为表示合成开始位置的信息。在此,从帧的开始到合成开始位置的时间是时隙长度的整数倍。
以这种方式,通过独立于噪声边界位置来规定合成开始位置,防止了在对音频信号进行解码期间的非必要信号的合成,从而可以获得具有较高音质的音频。
另外,正弦波信息之前被描述为所生成的表示每个频带的高频侧的合成开始位置的信息,但是正弦波信息可以使用构成高频的每个频带所共用的这些频带的合成开始位置的代表值。在这种情况下,例如,以下信息变成正弦波信息:该信息表示在构成高频的多个频带中的具有最高功率的正弦波信号的频带的合成开始位置的信息。
此外,表示合成开始位置的信息已在上面被描述为对其执行了可变长度编码的正弦波信息,但是可以不对表示合成开始位置的信息进行编码。
返回在图2的流程图中的描述,在步骤S19中,生成正弦波信息,之后处理进行到步骤S20。
在步骤S20中,噪声包络信息生成单元25中的边界计算单元52针对在高频侧的每个频带检测噪声边界位置。
例如,边界计算单元52基于表示是否检测到正弦波信号的信息、表示正弦波信号的频率和功率的信息以及合成开始位置,生成包括在构成高频的频带的帧中的正弦波信息。例如,当检测到正弦波信号时,从帧的开始到合成开始位置的区域被指定为无音区(silent zone),从这一点起的区域由检测到的频率的预定振幅的正弦波分量组成。此时,根据表示从正弦波信息生成单元26提供的正弦波信号的功率的信息来确定正弦波信号的振幅。此外,当未检测到正弦波信号时,正弦波信号的振幅被设置为0。
接下来,边界计算单元52从在步骤S16获得的虚拟噪声包络中减去以这种方式获得的正弦波信号以获得最终的噪声包络。然后,边界计算单元52根据最终的噪声包络增益的分布来确定噪声边界位置。
也就是说,边界计算单元52基于最终噪声包络的增益的分布,根据需要将帧划分为两个区域。具体地,当针对被处理的频带的整个帧,噪声包络增益几乎为相同值时,不执行帧的划分。也就是说,不存在噪声边界位置。
此外,当在帧中的预定位置处的噪声包络的增益分布对于在所述位置之前的区域和对于在所述位置之后的区域存在较大差时,所述位置变成噪声边界位置。另外,将噪声边界位置指定为时隙边界位置。
在步骤S21中,噪声包络信息生成单元25针对在高频侧的每个频带生成噪声包络信息,并且将该噪声包络信息提供给编码流生成单元27。
例如,噪声包络信息生成单元25指定噪声包络信息为如下信息:该信息由噪声边界位置以及在通过该噪声边界位置所划分的帧中的每个区域的噪声信号增益组成。此时,编码单元53对表示噪声边界位置的信息执行编码,并且对表示每个划分区域的增益的信息执行可变长度编码。
在此,每个划分区域的增益是例如这些区域中的噪声包络的平均增益值。也就是说,通过噪声边界位置将被处理的帧划分为两个区域。在这种情况下,从帧的开始到噪声边界位置的区域的增益是在该区域中的最终噪声包络的每个位置的平均增益值。
在步骤S22中,编码流生成单元27对来自低频编码单元22的低频信号、来自包络信息生成单元24的包络信息、来自噪声包络信息生成单元25的噪声包络信息以及来自正弦波信息生成单元26的正弦波信息进行编码,并且生成编码流。然后,编码流生成单元27向解码装置等发送根据编码获得的编码流,然后编码处理结束。
以这种方式,编码装置11生成并输出如下编码流:该编码流由低频信号、包络信息、噪声包络信息以及正弦波信息组成。此时,通过检测到的正弦波信号的更加精确的合成开始位置并且生成包括该合成开始位置的正弦波信息,可以在音频信号的解码侧执行更加精确的正弦波信号合成,这会导致获得具有较高音质的音频。
另外,由欠采样器21生成的低频信号已在上面被描述为提供给噪声包络信息生成单元25,但是提供给噪声包络信息生成单元25的低频信号可以是通过由频带划分滤波器23划分频带而获得的低频信号。此外,通过解码获得由低频编码单元22编码的低频信号,但是该低频信号还可以被提供给噪声包络信息生成单元25。
[解码装置的配置示例]
接下来,将描述接收从图1中的编码装置11输出的编码流并且从编码流获得音频信号的解码装置。这种解码装置例如如图5所示的那样进行配置。
图5中的解码装置91配置有编码流解码单元101、低频解码单元102、包络信息解码单元103、噪声包络信息解码单元104、正弦波信息解码单元105以及频带合成滤波器106。
编码流解码单元101对从编码装置11发送的编码流进行接收和解码。也就是说,编码流解码单元101反向复用该编码流,并且将由此获得的低频信号、包络信息、噪声包络信息以及正弦波信息分别提供给低频解码单元102、包络信息解码单元103、噪声包络信息解码单元104以及正弦波信息解码单元105。
低频解码单元102对从编码流解码单元101提供的低频信号进行解码,并将该解码后的低频信号提供给包络信息解码单元103和频带合成滤波器106。
包络信息解码单元103对从编码流解码单元101提供的包络信息进行解码,并且还将解码的包络信息提供给正弦波信息解码单元105。此外,包络信息解码单元103设置有生成单元121,该生成单元121基于来自低频解码单元102的低频信号来生成包络信息和伪高频信号,并且将该包络信息和伪高频信号提供给频带合成滤波器106。
噪声包络信息解码单元104对从编码流解码单元101提供的噪声包络信息进行解码。此外,噪声包络信息解码单元104设置有生成单元131,该生成单元131基于噪声包络信息来生成噪声信号,并且将该噪声信号提供给频带合成滤波器106。
正弦波信息解码单元105对从编码流解码单元101提供的正弦波信息进行解码。此外,正弦波信息解码单元105设置有生成单元141,该生成单元141基于正弦波信息和来自包络信息解码单元103的包络信息来生成正弦波信号,并且将该正弦波信号提供给频带合成滤波器106。
频带合成滤波器106将如下频带进行合成以生成音频信号:来自低频解码单元102的低频信号的频带、来自包络信息解码单元103的伪高频信号的频带、来自噪声包络信息解码单元104的噪声信号的频带以及来自正弦波信息解码单元105的正弦波信号的频带。频带合成滤波器106向下游播放器单元或相似元件输出通过将频带合成为解码的音频信号而获得的信号。
[解码处理的描述]
当来自编码装置11的编码流被发送至如图5所示的解码装置91时,解码装置91以帧为单位执行解码处理以对音频信号进行解码。以下,将参照图6来描述由解码装置91执行的解码处理。
在步骤S51中,编码流解码单元101对从编码装置11接收的编码流进行解码,并且将由此获得的低频信号、包络信息、噪声包络信息以及正弦波信息提供给低频解码单元102至正弦波信息解码单元105。
在步骤S52中,低频解码单元102对来自编码流解码单元101的低频信号进行解码,并且将经解码的低频信号提供给包络信息解码单元103和频带合成滤波器106。
在步骤S53中,包络信息解码单元103对来自编码流解码单元101的包络信息进行解码。此外,包络信息解码单元103向正弦波信息解码单元105提供经解码的包络信息。
在步骤S54中,包络信息解码单元103中的生成单元121基于来自低频解码单元102的低频信号来针对高频侧的每个频带生成伪高频信号,并且将该伪高频信号提供给频带合成滤波器106。例如,生成单元121通过如下方式来生成伪高频信号:提取关于低频信号的预定频带的一帧的区域;并且增强或减弱低频信号使得所提取的低频信号样本的样本值与由对应于该样本的包络信息表示的包络中的位置的增益相匹配。
在步骤S55中,噪声包络信息解码单元104对来自编码流解码单元101的噪声包络信息进行解码。
在步骤S56中,在噪声包络信息解码单元104中的生成单元131基于噪声包络信息来针对在高频侧的每个频带生成噪声信号,并且将该噪声信号提供给频带合成滤波器106。也就是说,生成单元131通过调整预定信号(其已经通过由噪声包络信息表示的噪声边界位置而划分为区域)的每个区域的增益,使得该信号的增益与由噪声包络信息表示的增益相匹配,来生成噪声信号。
在步骤S57中,正弦波信息解码单元105对来自编码流解码单元101的正弦波信息进行解码。例如,当必要时对表示包括在正弦波信息中的合成开始位置的信息进行解码。
在步骤S58中,正弦波信息解码单元105针对高频侧的每个频带执行正弦波信号生成处理以生成正弦波信号,并且将该正弦波信号提供给频带合成滤波器106。另外,随后将描述正弦波信号生成处理的细节。
在步骤S59中,频带合成滤波器106将如下频带进行组合:来自低频解码单元102的低频信号的频带、来自包络信息解码单元103的伪高频信号的频带、来自噪声包络信息解码单元104的噪声信号的频带以及来自正弦波信息解码单元105的正弦波信号的频带。
也就是说,音频信号是通过执行如下频带合成来生成的:该频带合成通过对每次来自从低频解码单元102至正弦波信息解码单元105所输入的低频信号、每个频带的伪高频信号、每个频带的噪声信号以及每个频带的正弦波信号的样本进行添加而实现。在此,由伪高频信号、噪声信号以及正弦波信号组成的信号是通过预测获得的高频分量。
当已经通过频带合成获得音频信号时,频带合成滤波器106向下游播放器单元或相似元件输出该音频信号,然后解码处理结束。每帧均执行该解码处理,并且当输入编码流的下一帧时,解码装置91对编码流的该下一帧执行解码处理。
以这种方式,解码装置91基于低频信号、包络信息、噪声包络信息以及正弦波信息来预测高频分量,并且通过根据经解码的低频信号和由预测获得的高频信号对频带进行扩展来生成音频信号。此时,通过使用表示正弦波信号的更加精确的合成开始位置的正弦波信息,可以执行更加精确的正弦波信号合成,从而可以获得具有较高音质的音频。
[正弦波信号生成处理的描述]
接下来,将参照图7中的流程图来描述与图6中的处理的步骤S58对应的正弦波信号生成处理。
在步骤S81中,正弦波信息解码单元105中的生成单元141基于合成开始位置和包括在正弦波信息中的表示是否检测到正弦波信号的信息,确定正弦波信号合成处理的开始时刻是否已经过去。
例如,生成单元141通过指定帧的开始为出现开始位置以及帧的末尾为出现结束位置来生成作为构成高频分量的正弦波分量的正弦波信号。
在此,通过包括在正弦波信息中的表示是否检测到正弦波信号的信息来识别被指定为构成高频分量的正弦波分量的正弦波信号的频率。此外,根据从包络信息解码单元103提供至正弦波信息解码单元105的包络信息来识别由正弦波信息所标识的正弦波信号频率的振幅。例如,生成单元141将包络信息转换为频率,并且基于来自由此获得的所有频率的功率中的正弦波信号频率的功率来获得正弦波信号的振幅。
接下来,生成单元141选择正弦波信号的一帧的时隙的开始位置中的样本作为待从帧的开始起按顺序处理的样本(时隙)。然后,生成单元141确定所选择的样本位置是否为由合成开始位置表示的样本位置,也就是说是否处于应当开始正弦波信号的合成的时刻。例如,当包括在正弦波信息中的信息表示未检测到正弦波信号时,将继续确定正弦波合成处理的开始时刻尚未过去。
当已在步骤S81中确定开始时刻尚未过去时,在步骤S82中,生成单元141将所生成的正弦波信号在时间轴上向后平移一个时隙。结果,正弦波信号的出现开始位置在时间轴上向后平移。当执行正弦波信号的平移时,在待处理的时隙区域中尚未出现正弦波,从而未将正弦波信号从正弦波信息解码单元105输出至频带合成滤波器106。
在步骤S83中,生成单元141确定是否已到达一帧的末尾。例如,当正在处理构成帧的最终时隙的区域时,也就是说当已经处理了帧中的所有时隙时,确定已经到达了帧的末尾。
当已在步骤S83中确定尚未到达帧的末尾时,下一时隙被选择为待处理的时隙,处理返回至步骤S81,并且重复之前描述的处理。在这种情况下,对已经生成的正弦波信号执行平移处理等。
相反,当在步骤S83中确定已经到达帧的末尾时,正弦波信号生成处理结束,随后处理进行到图6中的步骤S59。在这种情况下,结果为未执行正弦波信号合成。
此外,当在步骤S81确定正弦波合成处理的开始位置已经过去时,在步骤S84中,生成单元141执行正弦波合成处理。也就是说,生成单元141向频带合成滤波器106输出已被适当地平移处理过的正弦波信号的构成正在被处理的时隙的样本值。结果,输出的正弦波信号样本的样本值与低频信号被合成为构成高频分量的正弦波分量。
在步骤S85中,生成单元141确定是否已到达一帧的末尾。例如,当处理构成帧的最终时隙的区域时,也就是说,当已经处理过帧的所有时隙时,确定已经到达帧的末尾。
当在步骤S85中确定尚未到达帧的末尾时,下一个时隙被选择为待处理的时隙,处理返回至步骤S84,并且重复之前描述的处理。相反,当在步骤S85中确定已经到达帧的末尾时,正弦波信号生成处理结束,随后处理进行到图6中的步骤S59。
以这种方式,正弦波信息解码单元105基于正弦波信息将正弦波信号的出现开始位置平移至合成开始位置,并且输出平移后的正弦波信号。结果,在一帧中的更加精确的位置处开始正弦波的合成,从而可以获得具有较高音质的音频。
<第二实施方式>
[编码装置的配置示例]
尽管以上描述了正弦波信息包括表示从帧的开始位置到应当开始正弦波信号的合成的位置的时间(样本数量)的合成开始位置,但是还可以包括合成开始位置与噪声边界位置之间的差的信息。
在这种情况下,如图8所示的那样配置编码装置。另外,在图8中的与图1中的部件对应的部件具有相同的附图标记,因此将适当地省略其描述。图8中的编码装置171与编码装置11的不同之处在于:在编码装置171的正弦波信息生成单元26中新设置了差计算单元181,关于其他部件是相同的。
正弦波信息生成单元26中的差计算单元181计算由位置检测单元62检测到的正弦波信号的合成开始位置与噪声边界位置之间的差。正弦波信息生成单元26向编码流生成单元27提供如下信息作为正弦波信息:该信息由通过差计算单元181所计算的表示与噪声边界位置的差的差信息以及表示是否已检测到正弦波信号的信息组成。
[编码处理的描述]
接下来,将参照图9的流程图来描述由编码装置171执行的编码处理。另外,步骤S111至步骤S118的处理与图2中的步骤S11至步骤S18的处理相同,因此省略其描述。
在步骤S119中,噪声包络信息生成单元25中的边界计算单元52针对在高频侧的每个频带检测噪声边界位置。然后,在步骤S120中,噪声包络信息生成单元25针对在高频侧的每个频带生成噪声包络信息,并且将该噪声包络信息提供给编码流生成单元27。另外,在步骤S119和步骤S120中,执行与图2中的步骤S20和步骤S21相同的处理。
在步骤S121中,正弦波信息生成单元26中的差计算单元181计算噪声边界位置与由位置检测单元62检测到的正弦波信号的合成开始位置之间的差。
例如,如图10所示,计算从正弦波合成的开始位置到噪声边界位置的时间(样本数量)作为差。另外,图中的横轴表示时间轴。此外,图10中的箭头FS11和箭头FE11分别表示帧的开始位置与帧的结束位置。
根据图10中的示例,帧中由箭头N11表示的位置表示噪声边界位置。此外,正弦波信号的合成开始位置是由箭头G11表示的位置,并且合成开始位置位于噪声边界位置之前。因此,正弦波信号在从由箭头G11表示的合成开始位置到帧的结束位置的区域中被组合。
根据本示例,从由箭头G11表示的合成开始位置到由箭头N11表示的噪声边界位置的时间长度(时间距离)被指定为与噪声边界位置的差信息。在此,从合成开始位置到噪声边界位置的时间是时隙长度的整数倍。
通过使用以这种方式获得的表示从合成开始位置到噪声边界位置的时间的差信息,还可以在音频信号的解码侧识别更加精确的合成开始位置,从而可以获得具有较高音质的音频。
返回图9中的流程图的描述,在步骤S121中获得与噪声边界位置的差信息之后,处理进行到步骤S122。
在步骤S122中,正弦波信息生成单元26针对高频侧的每个频带生成正弦波信息,并且将该正弦波信息提供给编码流生成单元27。
例如,正弦波信息生成单元26指定如下信息作为正弦波信息:该信息由表示是否已经从高频频带检测到正弦波的信息以及在合成开始位置与噪声边界位置之间的差信息组成。此时,正弦波信息生成单元26中的编码单元63对与噪声边界位置的差信息执行可变长度编码。正弦波信息生成单元26向编码流生成单元27提供如下正弦波信息:该正弦波信息由通过可变长度编码处理的差信息以及表示是否已检测到正弦波信号的信息组成。
在生成正弦波信息之后,执行步骤S123中的处理,然后编码处理结束,因为步骤S123中的处理与图2中的步骤S22的处理相同,所以省略其描述。
如前所述,编码装置171生成并输出如下编码流:该编码流由低频信号、包络信息、噪声包络信息以及正弦波信息组成。此时,通过检测正弦波信号的更加精确的合成开始位置并且生成包括用于标识该合成开始位置的差信息的正弦波信息,可以在解码期间执行正弦波信号的更加精确的合成,从而可以由此获得具有较高音质的音频。
[解码装置的配置示例]
此外,接收从编码装置171发送的编码流并且从编码流获得音频信号的解码装置如图11所示的那样进行配置。另外,在图11中的与图5中的部件对应的部件具有相同的附图标记,因此将适当地省略其描述。图11中的解码装置211与解码装置91的不同之处在于:在解码装置211的正弦波信息解码单元105中新设置了位置计算单元221,关于其他部件是相同的。
解码装置211中的位置计算单元221根据从正弦波信息获得的差信息以及从噪声包络信息解码单元104提供的噪声边界位置来计算正弦波信号的合成开始位置。
[解码处理的描述]
接下来,将参照图12中的流程图来描述由解码装置211执行的解码处理。应当注意,从步骤S151到步骤S157的处理与图6中的从步骤S51到步骤S57中的处理相同,因此省略其描述。然而,在步骤S155中,噪声包络信息解码单元104向正弦波信息解码单元105提供如下信息:该信息表示包括在根据解码所获得的噪声包络信息中的噪声边界位置。
在步骤S158中,正弦波信息解码单元105针对高频侧的每个频带执行正弦波信号生成处理并生成正弦波信号,并且将该正弦波信号提供给频带合成滤波器106。另外,随后将描述正弦波信号生成处理的细节。
在已经执行正弦波信号生成处理之后,执行在步骤S159中的处理,然后解码处理结束,因为在步骤S159中的处理与图6中的步骤S59的处理相同,所以将省略其描述。
[正弦波信号生成处理的描述]
此外,在图12的步骤S158中,正弦波信息解码单元105执行图13所示的正弦波信号生成处理。以下,将参照图13中的流程图来描述与步骤S158中的处理对应的正弦波信号生成处理。
在步骤S181中,在正弦波信息解码单元105中的位置计算单元221根据从噪声包络信息解码单元104提供的噪声边界位置以及从正弦波信息获得的差信息来计算正弦波信号的合成开始位置。也就是说,从从被处理帧的开始位置到噪声边界位置的时间中减去合成开始位置与噪声边界位置之间的时间差,获得从帧的开始位置到正弦波信号的合成开始位置的时间,从而识别合成开始位置的时刻(样本)。
在计算合成开始位置之后,执行步骤S182至步骤S186的处理,然后正弦波信号生成处理结束,由于该处理与图7中的步骤S81至步骤S85的处理相同,所以省略其描述。以这种方式结束正弦波信号生成处理之后,处理进行到图12中的步骤S159。
以这种方式,正弦波信息解码单元105根据包括在正弦波信息中的差信息以及噪声边界位置来计算正弦波信号的更加精确的合成开始位置。结果,在一帧中的更加精确的位置处开始正弦波信号的合成,从而可以获得具有较高音质的音频。
<第三实施方式>
[编码装置的配置示例]
尽管上面已经借助于其中正弦波信息包括合成开始位置与噪声边界位置之间的差信息的示例描述了第二实施方式,但是可以包括合成开始位置与高频信号包络的峰值位置之间的差的信息。
在这种情况下,如图14所示的那样配置编码装置。另外,在图14中的与图1中的部件对应的部件具有相同的附图标记,因此将适当地省略其描述。图14中的编码装置251与编码装置11的不同之处在于:在编码装置251的正弦波信息生成单元26中新设置了峰值检测单元261和差计算单元262,关于其他部件是相同的。
根据编码装置251,从包络信息生成单元24提供给噪声包络信息生成单元25的包络信息还被从噪声包络信息生成单元25提供给正弦波信息生成单元26。峰值检测单元261基于从噪声包络信息生成单元25提供的包络信息来检测高频信号包络的峰值位置。
差计算单元262计算由位置检测单元62检测到的正弦波信号的合成开始位置与高频信号包络的峰值位置之间的差。正弦波信息生成单元26向编码流生成单元27提供如下信息作为正弦波信息:该信息由表示通过差计算单元262计算出的与峰值位置的差的差信息以及表示是否已检测到正弦波信号的信息组成。
[编码处理的描述]
接下来,将参照图15中的流程图来描述由编码装置251执行的编码处理。另外,步骤S211至步骤S218的处理与图2中的步骤S11至步骤S18的处理相同,因此省略其描述。然而,在步骤S214中,所生成的包络信息还被从包络信息生成单元24通过噪声包络信息生成单元25提供给正弦波信息生成单元26。
在步骤S219中,正弦波信息生成单元26中的峰值检测单元261基于从噪声包络信息生成单元25提供的包络信息来检测高频信号包络的峰值位置。例如,由包络信息所表示的高频信号包络的增益为最大的位置被检测作为高频信号包络的峰值位置。
在步骤S220中,差计算单元262针对在高频侧的每个频带来计算由位置检测单元62检测到的正弦波信号的合成开始位置与由峰值检测单元261检测到的包络的峰值位置之间的差。
例如,如图16所示,从正弦波合成的开始位置到峰值位置的时间(样本数量)被计算为差。另外,图中的横轴表示时间轴。此外,图16中的箭头FS21和箭头FE21分别表示帧的开始位置和帧的结束位置。
根据图16中的示例,由虚线表示高频信号的包络,在帧中由箭头P1表示的位置表示该包络的峰值位置。此外,正弦波信号的合成开始位置是由箭头G21表示的位置,并且合成开始位置位于包络的峰值位置之前。在解码期间,正弦波信号在从由箭头G21表示的合成开始位置到帧的结束位置的区域中被组合。
根据该示例,从由箭头G21表示的合成开始位置到由箭头P1表示的高频信号包络的峰值位置的时间长度(时间距离)被指定为与峰值位置的差。在此,从合成开始位置到峰值位置的时间是时隙长度的整数倍。
通过使用以这种方式获得的表示从合成开始位置到峰值位置的时间的差信息,可以在对音频信号进行解码期间识别更加精确的合成开始位置,从而可以获得具有较高音质的音频。
返回至图15中的流程图中的描述,在步骤S220中获得与峰值位置的差信息之后,处理进行到步骤S221。
在步骤S221中,正弦波信息生成单元26针对在高频侧的每个频带生成正弦波信息,并且将该正弦波信息提供给编码流生成单元27。
例如,正弦波信息生成单元26指定如下信息作为正弦波信息:该信息由表示是否已经从高频频带检测到正弦波的信息以及在合成开始位置与峰值位置之间的差信息组成。此时,在正弦波信息生成单元26中的编码单元63对与峰值位置的差信息执行可变长度编码。正弦波信息生成单元26向编码流生成单元27提供如下正弦波信息:该正弦波信息由通过可变长度编码处理后的差信息以及表示是否已经检测到正弦波信号的信息组成。
在生成正弦波信息之后,执行步骤S222至步骤S224的处理,然后编码处理结束,因为该处理与图2中的步骤S20至步骤S22的处理相同,所以省略其描述。
如前所述,编码装置251生成并输出如下编码流:该编码流由低频信号、包络信息、噪声包络信息以及正弦波信息组成。此时,通过检测正弦波信号的更加精确的合成开始位置并且生成包括用于标识该合成开始位置的差信息的正弦波信息,可以在解码期间执行正弦波信号的更加精确的合成,从而可以由此获得具有较高音质的音频。
[解码装置的配置示例]
此外,接收从编码装置251发送的编码流并且从编码流获得音频信号的解码装置如图17所示的那样进行配置。另外,在图17中的与图5中的部件对应的部件具有相同的附图标记,因此将适当地省略其描述。图17中的解码装置301与解码装置91的不同之处在于:在解码装置301的正弦波信息解码单元105中新设置了位置计算单元311,关于其他部件是相同的。
在解码装置301中的位置计算单元311根据从正弦波信息获得的差信息以及从包络信息解码单元103提供的包络信息来计算正弦波信号的合成开始位置。
[解码处理的描述]
接下来,将参照图18中的流程图来描述由解码装置301执行的解码处理。另外,步骤S251至步骤S257的处理与图6中的步骤S51至S57的处理相同,因此省略其描述。
在步骤S258中,正弦波信息解码单元105针对高频侧的每个频带执行正弦波信号生成处理并生成正弦波信号,并且将该正弦波信号提供给频带合成滤波器106。另外,随后将描述正弦波信号生成处理的细节。
在已经执行正弦波信号生成处理之后,执行在步骤S259中的处理,然后解码处理结束,因为步骤S259中的处理与图6中的步骤S59的处理相同,所以省略其描述。
[正弦波信号生成处理的描述]
此外,在图18的步骤S258中,正弦波信息解码单元105执行图19中所示的正弦波信号生成处理。以下,将参照图19的流程图来描述与步骤S258中的处理对应的正弦波信号生成处理。
在步骤S281中,正弦波信息解码单元105中的位置计算单元311根据从包络信息解码单元103提供的包络信息以及从正弦波信息获得的差信息来计算正弦波信号的合成开始位置。
也就是说,通过位置计算单元311将包络信息中所表示的高频信号包络的增益为最大的位置计算为高频信号包络的峰值位置。然后,位置计算单元311从从被处理的帧的开始位置到峰值位置的时间中减去合成开始位置与峰值位置之间的时间差,获得从帧的开始位置到正弦波信号的合成开始位置的时间,从而识别合成开始位置的时刻(样本)。
在计算合成开始位置之后,执行步骤S282至步骤S286的处理,然后正弦波信号生成处理结束,因为该处理与图7中的步骤S81至步骤S85的处理相同,所以省略其描述。在以这种方式结束正弦波信号生成处理之后,处理进行到图18中的步骤S259。
以这种方式,正弦波信息解码单元105根据包括在正弦波信息中的差信息以及高频信号包络的峰值位置来计算正弦波信号的更加精确的合成开始位置。结果,在一帧中的更加精确的位置处开始正弦波信号合成,从而可以获得具有较高音质的音频。
另外,尽管上面已经描述了其中在解码装置301侧执行包络的峰值位置的检测的示例,但是可以在正弦波信息中包括表示峰值位置的信息。在这种情况下,编码装置251中的正弦波信息生成单元26生成包括表示峰值位置的信息的正弦波信息,解码装置301中的位置计算单元311根据差信息以及包括在正弦波信息中的表示峰值位置的信息来计算合成开始位置。
<第四实施方式>
[编码装置的配置示例]
尽管上面已经描述了正弦波信息包括来自合成开始位置、与噪声边界位置的差信息、或者与峰值位置的差信息中的一种预先确定的信息的示例,但是可以选择在正弦波信息中包括上述信息中的具有最小编码量的信息。
在这种情况下,编码装置例如如图20中所示的那样进行配置。另外,在图20中的与图1或图14中的部件对应的部件具有相同的附图标记,因此将适当地省略其描述。图20中的编码装置341与图1中的编码装置11的不同之处在于:在编码装置341的正弦波信息生成单元26中新设置了峰值检测单元261、差计算单元351以及选择单元352,关于其他部件是相同的。
根据编码装置341,从包络信息生成单元24提供给噪声包络信息生成单元25的包络信息还被从噪声包络信息生成单元25提供给正弦波信息生成单元26,峰值检测单元261基于包络信息来检测高频信号包络的峰值位置。
差计算单元351计算由位置检测单元62检测到的正弦波信号的合成开始位置与高频信号包络的峰值位置之间的差。差计算单元351还计算合成开始位置与噪声边界位置之间的差。
选择单元352从合成开始位置、与峰值位置的差信息、或者与噪声边界位置的差信息中选择将在可变长度编码之后产生最小编码量的信息。正弦波信息生成单元26向编码流生成单元27提供如下信息作为正弦波信息:该信息由表示选择单元352的选择的结果的信息、由选择单元352选择的信息以及表示是否已检测到正弦波信号的信息组成。
[编码处理的描述]
接下来,将参照图21中的流程图来描述由编码装置341执行的编码处理。另外,步骤S311至步骤S321的处理与图9中的步骤S111至步骤S121的处理相同,因此省略其描述。
然而,在步骤S321中,正弦波信息生成单元26中的差计算单元351针对高频侧的每个频带计算在由位置检测单元62检测到的正弦波信号的合成开始位置与噪声边界位置的之间的差。此外,在步骤S314中,所生成的包络信息还被从包络信息生成单元24通过噪声包络信息生成单元25提供给正弦波信息生成单元26。
在步骤S322中,正弦波信息生成单元26中的峰值检测单元261基于从噪声包络信息生成单元25提供的包络信息、针对在高频侧的每个频带来检测高频信号包络的峰值位置。
在步骤S323中,差计算单元351针对在高频侧的每个频带来计算由位置检测单元62检测到的正弦波信号的合成开始位置与由峰值检测单元261检测到的包络的峰值位置之间的差。
另外,在步骤S322与步骤S323中执行与图15中的步骤S219和步骤S220相同的处理。
在步骤S324中,选择单元352针对在高频侧的每个频带,从合成开始位置、合成开始位置与峰值位置之间的差信息、或者合成开始位置与噪声边界位置之间的差信息中选择将在可变长度编码之后产生最小编码量的信息。然后,选择单元352生成表示该选择的结果的选择信息。此时,可以仅计算并比较合成开始位置或相似信息的编码量,或者可以通过可变长度编码来处理实际合成开始位置或相似信息,从而可以比较该编码量。
在步骤S325中,正弦波信息生成单元26针对高频侧的每个频带生成正弦波信息,并且将该正弦波信息提供给编码流生成单元27。
具体地,正弦波信息生成单元26指定如下信息作为正弦波信息:该信息由表示是否已经从高频频带检测到正弦波信号的信息、选择信息以及表示选择信息的信息组成。此时,正弦波信息生成单元26中的编码单元63对选择信息以及表示选择信息的信息执行可变长度编码。正弦波信息生成单元26向编码流生成单元27提供如下正弦波信息:该正弦波信息由通过可变长度编码处理后的选择信息和表示选择信息的信息以及表示是否已检测到正弦波信号的信息组成。
例如,当表示选择信息的信息为合成开始位置与峰值位置之间的差信息时,指定如下信息作为正弦波信息:该信息由选择信息、与峰值位置的差信息以及表示是否已检测到正弦波信号的信息组成。以这种方式,通过生成如下正弦波信息可以进一步减小编码流的编码量:该正弦波信息包括标识正弦波信号的合成开始位置的、具有最小编码量的信息。
在生成正弦波信息之后,执行在步骤S326中的处理,然后编码处理结束,因为该处理与在图15中的步骤S224中的处理相同,所以省略其描述。
如前所述,编码装置341生成并输出如下编码流:该编码流由低频信号、包络信息、噪声包络信息以及正弦波信息组成。此时,通过生成如下正弦波信息可以减小待传输的编码流的数据量:该正弦波信息包括来自标识正弦波信号的合成开始位置的信息中的、具有最小编码量的信息,并且同时,可以在音频信号的解码侧的解码期间执行正弦波信号的更加精确的合成。结果,能够获得具有较高音质的音频。
[解码装置的配置示例]
此时,接收从编码装置341发送的编码流并且从编码流获得音频信号的解码装置例如如图22所示的那样进行配置。此外,在图22中的与图5中的部件对应的部件具有相同的附图标记,因此将适当地省略其描述。图22中的解码装置381与解码装置91的不同之处在于:在解码装置381的正弦波信息解码单元105中新设置了位置计算单元391,关于其他部件是相同的。
在解码装置381中的位置计算单元391根据从正弦波信息所获得的与峰值位置的差信息或与噪声边界位置的差信息(取决于包括在正弦波信息中的选择信息)来计算正弦波信号的合成开始位置。
[解码处理的描述]
接下来,将参照图23的流程图来描述由解码装置381执行的解码处理。另外,步骤S351至步骤S356的处理与图6中的步骤S51至步骤S56的处理相同,因此省略其描述。
然而,在步骤355中,噪声包络信息解码单元104向正弦波信息解码单元105提供如下信息:该信息表示包括在通过解码所获得的噪声包络信息中的噪声边界位置。
在步骤S357中,正弦波信息解码单元105对来自编码流解码单元101的正弦波信息进行解码。例如,对包括在正弦波信息中的选择信息、以及由选择信息标识的用于获得合成开始位置的信息进行解码。
在步骤S358中,正弦波信息解码单元105针对高频侧的每个频带执行正弦波信号生成处理并生成正弦波信号,并且将该正弦波信号提供给频带合成滤波器106。另外,随后将描述正弦波信号生成处理的细节。
在已经执行正弦波信号生成处理之后,执行在步骤S359中的处理,然后解码处理结束,因为在步骤S359的处理与图6中步骤S59的处理相同,所以省略其描述。
[正弦波信号生成处理的描述]
此外,在图23的步骤S358中,正弦波信息解码单元105执行图24中所示的正弦波信号生成处理。以下,将参照图24的流程图来描述与在步骤S358中的处理对应的正弦波信号生成处理。
在步骤S381中,位置计算单元391确定由选择信息表示的用于获得正弦波信号的合成开始位置的信息是否为实际表示合成开始位置的信息。也就是说,确定合成开始位置是否被包括在正弦波信息中。
如果在步骤S381中做出由选择信息表示的信息是表示正弦波信号的合成开始位置的信息的确定,则处理进行到步骤S385。
相反,如果在步骤S381中做出由选择信息表示的信息不是表示正弦波信号的合成开始位置的信息的确定,则处理进行到步骤S382。
在步骤S382中,位置计算单元391确定由选择信息表示的用于获得正弦波信号的合成开始位置的信息是否为合成开始位置与噪声边界位置之间的差信息。也就是说,确定与噪声边界位置的差信息是否被包括在正弦波信息中。
当确定由选择信息表示的信息是与噪声边界位置的差信息时,处理进行到步骤S383。
在步骤S383中,正弦波信息解码单元105中的位置计算单元391根据从噪声包络信息解码单元104提供的噪声边界位置和从正弦波信息所获得的与噪声边界位置的差信息,计算正弦波信号的合成开始位置。在计算出合成开始位置之后,处理进行到步骤S385。
此外,当在步骤S382中确定由选择信息表示的信息不是与噪声边界位置的差信息时,也就是说,当由选择信息表示的信息是合成开始位置与峰值位置之间的差信息时,处理进行到步骤S384。
在步骤S384中,正弦波信息解码单元105中的位置计算单元391根据从包络信息解码单元103提供的包络信息和从正弦波信息所获得的与高频信号包络的峰值位置的差信息,计算正弦波信号的合成开始位置。
也就是说,位置检测单元391检测由包络信息表示的高频信号包络中增益为最大的位置作为高频信号包络的峰值位置。然后,位置计算单元391从从待处理的帧的开始位置到峰值位置的时间中减去合成开始位置与峰值位置之间的时间差,获得从帧的开始位置到正弦波信号的合成开始位置的时间,从而识别合成开始位置的时刻(样本)。在计算出合成开始位置之后,处理进行到步骤S385。
在步骤S381中确定由选择信息表示的信息为表示合成开始位置的信息之后,或者在步骤S383中计算出合成开始位置之后,或者在步骤S384中计算出合成开始位置之后,处理进行到步骤S385。然后,执行步骤S385至步骤S389的处理,然后正弦波信号生成处理结束,因为该处理与图7中的步骤S81至步骤S85的处理相同,所以省略其描述。在以这种方式结束正弦波信号生成处理之后,处理进行到图23中的步骤S359。
以这种方式,正弦波信息解码单元105根据选择信息来识别包括在正弦波信息中的信息,并且根据该指定的结果来适当地计算正弦波信号的更加精确的合成开始位置。结果,在一帧中的更加精确的位置处开始正弦波信号的合成,从而可以获得具有较高音质的音频。
之前描述的处理序列可以通过硬件来执行,或者可以通过软件来执行。当通过软件来执行处理序列时,例如可以将构成所述软件的程序安装至构建有专用硬件的计算机中,或者将来自程序记录介质的各种程序安装至例如可以执行各种功能的通用个人计算机中。
图25是示出了用于将之前描述的处理序列作为程序来执行的计算机硬件的配置示例的框图。
CPU501、ROM(只读存储器)502以及RAM(随机存取存储器)503在计算机中通过总线504连接在一起。
此外,输入/输出接口505连接至总线504。连接至输入/输出接口505的装置包括:由键盘、鼠标、麦克风等组成的输入单元506;由显示器、扬声器等组成的输出单元507;由硬盘、非易失性存储器等组成的记录单元508;由网络接口等组成的通信单元509;以及用于驱动磁盘、光盘、磁光盘的驱动器510,或者可移动介质511例如半导体存储器。
根据以这种方式配置的计算机,CPU501例如通过输入/输出接口505以及总线504将安装在记录单元508中的程序装载至RAM503中并执行该程序,以执行之前描述的处理序列。
通过计算机(CPU501)执行的程序可以被记录在可移动介质511中,该可移动介质511为配置有如下元件的封装介质形式,所述元件为例如磁盘(包括软盘)、光盘(例如CD-ROM(光盘只读存储器))或DVD(数字多功能光盘)、磁光盘或半导体存储器等,或者,通过计算机(CPU501)执行的程序可以通过有线或无线传输介质(例如局域网、因特网或数字卫星广播)来提供。
此外,可以通过将可移动介质511安装至驱动器510、经由输入/输出接口505将程序安装至记录单元508。此外,可以在通信单元509通过有线或无线传输介质接收到程序之后,将程序安装至记录单元508。此外,程序可以被预先安装在ROM502或记录单元508中。
另外,由计算机执行的程序可以如本说明书中描述的按照时序顺序来执行处理,可以按照并行方式来执行处理,或者可以在必要时例如在执行调用时执行处理。
另外,本技术的实施方式并不限于之前描述的实施方式,可以出现各种修改,只要所述修改落在本技术的保护范围内即可。
附图标记列表
11 编码装置
22 低频编码单元
24 包络信息生成单元
25 噪声包络信息生成单元
26 正弦波信息生成单元
52 边界计算单元
61 正弦波检测单元
62 位置检测单元
91 解码装置
102 低频解码单元
103 包络信息解码单元
104 噪声包络信息解码单元
105 正弦波信息解码单元
141 生成单元
181 差计算单元
221 位置计算单元
261 峰值检测单元
262 差计算单元
311 位置检测单元
351 差计算单元
352 选择单元
391 位置计算单元

Claims (16)

1.一种信号处理装置,包括:
提取单元,所述提取单元被配置成提取:音频信号的低频分量;表示所述音频信号的高频分量的包络的包络信息;以及用于标识包括在所述高频分量中的正弦波分量的频率和出现位置的正弦波信息;
伪高频生成单元,所述伪高频生成单元被配置成基于所述包络信息和作为所述低频分量的低频信号,生成构成所述高频分量的伪高频信号;
正弦波生成单元,所述正弦波生成单元被配置成生成在由所述正弦波信息表示的频率下、并且将根据所述正弦波信息标识的所述出现位置指定为开始位置的正弦波信号;以及
合成单元,所述合成单元被配置成将所述低频信号、所述伪高频信号以及所述正弦波信号进行合成以生成音频信号。
2.根据权利要求1所述的信号处理装置,其中,所述正弦波信息包括表示从所述高频分量的帧的开始位置到所述正弦波分量的出现开始位置的距离的信息,来作为用于标识所述出现位置的信息。
3.根据权利要求1所述的信号处理装置,还包括:
噪声生成单元,所述噪声生成单元被配置成基于表示由噪声包络信息所表示的预定信号的每个区域的增益的信息、通过调整所述每个区域的增益来生成构成所述高频分量的噪声信号,其中,所述区域是通过由所述噪声包络信息表示的噪声边界位置来划分的;
其中,所述提取单元还提取所述噪声包络信息;以及
其中,所述正弦波信息包括表示从所述噪声边界位置到所述正弦波分量的出现开始位置的距离的信息,来作为用于标识所述出现位置的信息;以及
其中,所述合成单元将所述低频信号、所述伪高频信号、所述正弦波信号以及所述噪声信号进行合成以生成所述音频信号。
4.根据权利要求1所述的信号处理装置,其中,所述正弦波信息包括表示从所述高频分量包络的峰值位置到所述正弦波分量的出现开始位置的距离的信息,来作为用于标识所述出现位置的信息。
5.根据权利要求1所述的信号处理装置,其中,所述正弦波信息是针对每帧进行提取的,并且所述正弦波生成单元针对每帧的所述高频分量生成所述正弦波信号。
6.根据权利要求1所述的信号处理装置,其中,所述正弦波信息是针对构成所述高频分量的每个频带进行提取的,并且所述正弦波生成单元针对每个频带生成所述正弦波信号。
7.一种控制信号处理装置的信号处理方法,所述信号处理装置包括:
提取单元,所述提取单元被配置成提取:音频信号的低频分量;表示所述音频信号的高频分量的包络的包络信息;以及用于标识包括在所述高频分量中的正弦波分量的频率和出现位置的正弦波信息;
伪高频生成单元,所述伪高频生成单元被配置成基于所述包络信息和作为所述低频分量的低频信号,生成构成所述高频分量的伪高频信号;
正弦波生成单元,所述正弦波生成单元被配置成生成在由所述正弦波信息表示的频率下、并且将根据所述正弦波信息标识的所述出现位置指定为开始位置的正弦波信号;以及
合成单元,所述合成单元被配置成将所述低频信号、所述伪高频信号以及所述正弦波信号进行合成以生成音频信号;
所述方法包括以下步骤:
所述提取单元提取所述低频分量、所述包络信息以及所述正弦波信息;
所述伪高频生成单元生成所述伪高频信号;
所述正弦波生成单元生成所述正弦波信号;以及
所述合成单元将所述低频信号、所述伪高频信号以及所述正弦波信号进行合成以生成所述音频信号。
8.一种在计算机上执行处理的程序,所述处理包括以下步骤:
提取以下内容:音频信号的低频分量;表示所述音频信号的高频分量的包络的包络信息;以及用于标识包括在所述高频分量中的正弦波分量的频率和出现位置的正弦波信息;
基于所述包络信息和作为所述低频分量的低频信号来生成构成所述高频分量的伪高频信号;
生成在由所述正弦波信息表示的频率下、并且将根据所述正弦波信息标识的所述出现位置指定为开始位置的正弦波信号;以及
对所述低频信号、所述伪高频信号以及所述正弦波信息进行合成以生成音频信号。
9.一种信号处理装置,包括:
包络信息生成单元,所述包络信息生成单元被配置成生成表示高频信号的包络的包络信息,所述高频信号是音频信号的高频分量;
正弦波信息生成单元,所述正弦波信息生成单元被配置成检测包括在所述高频信号中的正弦波信号,并且生成用于标识所述正弦波信号的频率和出现位置的正弦波信息;以及
输出单元,所述输出单元被配置成生成并输出由低频信号、所述包络信息以及所述正弦波信息组成的数据,所述低频信号是所述音频信号的低频分量。
10.根据权利要求9所述的信号处理装置,其中,所述正弦波信息包括表示从所述高频分量的帧的开始位置到所述正弦波信号的出现开始位置的距离的信息,来作为用于标识所述出现位置的信息。
11.根据权利要求9所述的信号处理装置,还包括:
噪声包络信息生成单元,所述噪声包络信息生成单元被配置成检测包括在所述高频信号中的噪声信号,并且生成如下噪声包络信息:所述噪声包络信息由表示将所述噪声信号划分为多个区域的噪声边界位置的信息以及表示在所述区域中的所述噪声信号的增益的信息组成;
其中,所述正弦波信息包括表示从所述噪声边界位置到所述正弦波分量的出现开始位置的距离的信息,来作为用于标识所述出现位置的信息;以及
其中,所述输出单元生成并输出由所述低频信号、所述包络信息、所述正弦波信息以及所述噪声包络信息组成的数据。
12.根据权利要求9所述的信号处理装置,其中,所述正弦波信息包括表示从所述高频分量包络的峰值位置到所述正弦波分量的出现开始位置的距离的信息,来作为用于标识所述出现位置的信息。
13.根据权利要求9所述的信号处理装置,其中,所述正弦波信息是针对每帧来生成的。
14.根据权利要求9所述的信号处理装置,其中,所述正弦波信息是针对构成所述高频分量的每个频带来生成的。
15.一种控制信号处理装置的信号处理方法,所述信号处理装置包括:
包络信息生成单元,所述包络信息生成单元被配置成生成表示高频信号的包络的包络信息,所述高频信号是音频信号的高频分量;
正弦波信息生成单元,所述正弦波信息生成单元被配置成检测包括在所述高频信号中的正弦波信号,并且生成用于标识所述正弦波信号的频率和出现位置的正弦波信息;以及
输出单元,所述输出单元被配置成生成并输出由低频信号、所述包络信息以及所述正弦波信息组成的数据,所述低频信号是所述音频信号的低频分量;
所述方法包括以下步骤:
所述包络信息生成单元生成所述包络信息;
所述正弦波信息生成单元生成所述正弦波信息;以及
所述输出单元生成并输出由所述低频信号、所述包络信息以及所述正弦波信息组成的数据。
16.一种在计算机上执行处理的程序,所述处理包括以下步骤:
生成表示高频信号的包络的包络信息,所述高频信号是音频信号的高频分量;
检测包括在所述高频信号中的正弦波信号,并且生成用于标识所述正弦波信号的频率和出现位置的正弦波信息;以及
生成并输出由低频信号、所述包络信息以及所述正弦波信息组成的数据,所述低频信号是所述音频信号的低频分量。
CN201280004776.XA 2011-01-14 2012-01-06 信号处理装置和方法 Active CN103314407B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011006233A JP5743137B2 (ja) 2011-01-14 2011-01-14 信号処理装置および方法、並びにプログラム
JP2011-006233 2011-01-14
PCT/JP2012/050173 WO2012096230A1 (ja) 2011-01-14 2012-01-06 信号処理装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
CN103314407A true CN103314407A (zh) 2013-09-18
CN103314407B CN103314407B (zh) 2016-06-15

Family

ID=46507130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280004776.XA Active CN103314407B (zh) 2011-01-14 2012-01-06 信号处理装置和方法

Country Status (12)

Country Link
US (3) US20130275142A1 (zh)
EP (2) EP2665061B1 (zh)
JP (1) JP5743137B2 (zh)
KR (3) KR101975066B1 (zh)
CN (1) CN103314407B (zh)
AU (1) AU2012206122B2 (zh)
BR (1) BR112013017427B1 (zh)
CA (1) CA2820195C (zh)
MX (1) MX345045B (zh)
RU (1) RU2604338C2 (zh)
TW (1) TWI498885B (zh)
WO (1) WO2012096230A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108172239A (zh) * 2013-09-26 2018-06-15 华为技术有限公司 频带扩展的方法及装置
CN112233685A (zh) * 2020-09-08 2021-01-15 厦门亿联网络技术股份有限公司 基于深度学习注意力机制的频带扩展方法及装置

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
WO2014007096A1 (ja) 2012-07-02 2014-01-09 ソニー株式会社 復号装置および方法、符号化装置および方法、並びにプログラム
KR20150032650A (ko) 2012-07-02 2015-03-27 소니 주식회사 복호 장치 및 방법, 부호화 장치 및 방법, 및 프로그램
CN103748628B (zh) 2012-07-02 2017-12-22 索尼公司 解码装置和方法以及编码装置和方法
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
JP6284298B2 (ja) * 2012-11-30 2018-02-28 Kddi株式会社 音声合成装置、音声合成方法および音声合成プログラム
JP6262668B2 (ja) 2013-01-22 2018-01-17 パナソニック株式会社 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法
EP3067890B1 (en) 2013-01-29 2018-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
EP3333848B1 (en) * 2013-02-05 2019-08-21 Telefonaktiebolaget LM Ericsson (publ) Audio frame loss concealment
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
JP6345780B2 (ja) * 2013-11-22 2018-06-20 クゥアルコム・インコーポレイテッドQualcomm Incorporated ハイバンドコーディングにおける選択的位相補償
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序
WO2017140600A1 (en) * 2016-02-17 2017-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
US10887395B2 (en) * 2016-11-21 2021-01-05 Ecosteer Srl Processing signals from a sensor group
JP6769299B2 (ja) * 2016-12-27 2020-10-14 富士通株式会社 オーディオ符号化装置およびオーディオ符号化方法
EP3435376B1 (en) * 2017-07-28 2020-01-22 Fujitsu Limited Audio encoding apparatus and audio encoding method
CN113948094A (zh) * 2020-07-16 2022-01-18 华为技术有限公司 音频编解码方法和相关装置及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004053940A (ja) * 2002-07-19 2004-02-19 Matsushita Electric Ind Co Ltd オーディオ復号化装置およびオーディオ復号化方法
CN1571993A (zh) * 2001-11-29 2005-01-26 编码技术股份公司 用于改善高频重建的方法
CN1932970A (zh) * 2005-09-13 2007-03-21 乐金电子(中国)研究开发中心有限公司 一种泛音生成方法、装置,及声音增强方法及装置
JP2007187905A (ja) * 2006-01-13 2007-07-26 Sony Corp 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
CN101297356A (zh) * 2005-11-04 2008-10-29 诺基亚公司 音频压缩

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2049456C1 (ru) * 1993-06-22 1995-12-10 Вячеслав Алексеевич Сапрыкин Способ передачи речевых сигналов
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
WO2001041124A2 (en) * 1999-12-01 2001-06-07 Koninklijke Philips Electronics N.V. Method of and system for coding and decoding sound signals
CA2439730A1 (en) * 2000-12-27 2002-07-11 Nobuyuki Kawakatsu Benzofuran derivatives and pharmaceutical compositions containing the same
WO2003090209A1 (en) * 2002-04-22 2003-10-30 Nokia Corporation Method and device for obtaining parameters for parametric speech coding of frames
CA2464408C (en) * 2002-08-01 2012-02-21 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing suppression
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7069212B2 (en) * 2002-09-19 2006-06-27 Matsushita Elecric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing adjustment
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
CN1934619B (zh) * 2004-03-17 2010-05-26 皇家飞利浦电子股份有限公司 音频编码
WO2006075563A1 (ja) * 2005-01-11 2006-07-20 Nec Corporation オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
AU2006232364B2 (en) * 2005-04-01 2010-11-25 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US7775528B2 (en) * 2006-02-13 2010-08-17 Freudenberg-Nok General Partnership Bi-directional pattern for dynamic seals
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
KR101149449B1 (ko) * 2007-03-20 2012-05-25 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
KR101238239B1 (ko) * 2007-11-06 2013-03-04 노키아 코포레이션 인코더
EP2104096B1 (en) * 2008-03-20 2020-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
US8725502B2 (en) * 2008-06-05 2014-05-13 Qualcomm Incorporated System and method of an in-band modem for data communications over digital wireless communication networks
EP2304723B1 (en) * 2008-07-11 2012-10-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for decoding an encoded audio signal
BRPI0910517B1 (pt) * 2008-07-11 2022-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Um aparelho e um método para calcular um número de envelopes espectrais a serem obtidos por um codificador de replicação de banda espectral (sbr)
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US8380498B2 (en) * 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
AU2010209673B2 (en) * 2009-01-28 2013-05-16 Dolby International Ab Improved harmonic transposition
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
JPWO2013154027A1 (ja) 2012-04-13 2015-12-17 ソニー株式会社 復号装置および方法、オーディオ信号処理装置および方法、並びにプログラム
KR20150032650A (ko) 2012-07-02 2015-03-27 소니 주식회사 복호 장치 및 방법, 부호화 장치 및 방법, 및 프로그램
WO2014007096A1 (ja) 2012-07-02 2014-01-09 ソニー株式会社 復号装置および方法、符号化装置および方法、並びにプログラム
CN103748628B (zh) 2012-07-02 2017-12-22 索尼公司 解码装置和方法以及编码装置和方法
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
JP2014123011A (ja) 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1571993A (zh) * 2001-11-29 2005-01-26 编码技术股份公司 用于改善高频重建的方法
JP2004053940A (ja) * 2002-07-19 2004-02-19 Matsushita Electric Ind Co Ltd オーディオ復号化装置およびオーディオ復号化方法
CN1932970A (zh) * 2005-09-13 2007-03-21 乐金电子(中国)研究开发中心有限公司 一种泛音生成方法、装置,及声音增强方法及装置
CN101297356A (zh) * 2005-11-04 2008-10-29 诺基亚公司 音频压缩
JP2007187905A (ja) * 2006-01-13 2007-07-26 Sony Corp 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108172239A (zh) * 2013-09-26 2018-06-15 华为技术有限公司 频带扩展的方法及装置
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
CN112233685A (zh) * 2020-09-08 2021-01-15 厦门亿联网络技术股份有限公司 基于深度学习注意力机制的频带扩展方法及装置
CN112233685B (zh) * 2020-09-08 2024-04-19 厦门亿联网络技术股份有限公司 基于深度学习注意力机制的频带扩展方法及装置

Also Published As

Publication number Publication date
KR20190047114A (ko) 2019-05-07
BR112013017427A2 (pt) 2016-09-27
EP3849087A1 (en) 2021-07-14
US10643630B2 (en) 2020-05-05
US10431229B2 (en) 2019-10-01
TW201230012A (en) 2012-07-16
US20170148452A1 (en) 2017-05-25
CA2820195C (en) 2021-05-25
TWI498885B (zh) 2015-09-01
BR112013017427B1 (pt) 2021-06-15
JP5743137B2 (ja) 2015-07-01
CN103314407B (zh) 2016-06-15
KR20190095530A (ko) 2019-08-14
US20130275142A1 (en) 2013-10-17
EP2665061B1 (en) 2021-03-03
AU2012206122B2 (en) 2017-04-20
JP2012145895A (ja) 2012-08-02
EP2665061A1 (en) 2013-11-20
KR20130141634A (ko) 2013-12-26
RU2013130742A (ru) 2015-01-10
KR101975066B1 (ko) 2019-05-03
RU2604338C2 (ru) 2016-12-10
KR102048672B1 (ko) 2019-11-25
CA2820195A1 (en) 2012-07-19
WO2012096230A1 (ja) 2012-07-19
EP2665061A4 (en) 2016-12-14
MX345045B (es) 2017-01-16
MX2013007895A (es) 2013-08-27
AU2012206122A1 (en) 2013-07-04
US20190355368A1 (en) 2019-11-21
KR102010220B1 (ko) 2019-08-12

Similar Documents

Publication Publication Date Title
CN103314407A (zh) 信号处理装置、方法以及程序
CN103765510B (zh) 编码装置和方法、解码装置和方法
CN103477386B (zh) 音频编解码器中的噪声产生
CN101518083B (zh) 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法和***
RU2449387C2 (ru) Способ и устройство для обработки сигнала
JP5108960B2 (ja) オーディオ信号処理方法及び装置
TWI480857B (zh) 在不活動階段期間利用雜訊合成之音訊編解碼器
CN102089817A (zh) 用于计算频谱包络数目的装置与方法
JP2004004530A (ja) 符号化装置、復号化装置およびその方法
US7197454B2 (en) Audio coding
JP2004538502A (ja) オーディオ信号の編集
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
Parvaix et al. Hybrid coding/indexing strategy for informed source separation of linear instantaneous under-determined audio mixtures
US20090063161A1 (en) Method and apparatus for encoding and decoding continuation sinusoidal signal of audio signal

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant