CN102486923B - 编码设备、编码方法、解码设备、解码方法 - Google Patents
编码设备、编码方法、解码设备、解码方法 Download PDFInfo
- Publication number
- CN102486923B CN102486923B CN201110380792.6A CN201110380792A CN102486923B CN 102486923 B CN102486923 B CN 102486923B CN 201110380792 A CN201110380792 A CN 201110380792A CN 102486923 B CN102486923 B CN 102486923B
- Authority
- CN
- China
- Prior art keywords
- scale factor
- coding
- hiding
- data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 230000005236 sound signal Effects 0.000 claims abstract description 161
- 238000001228 spectrum Methods 0.000 claims abstract description 116
- 238000010606 normalization Methods 0.000 claims abstract description 91
- 230000003595 spectral effect Effects 0.000 claims abstract description 42
- 230000008859 change Effects 0.000 claims abstract description 28
- 230000009466 transformation Effects 0.000 claims abstract description 26
- 238000006243 chemical reaction Methods 0.000 claims abstract description 17
- 238000004364 calculation method Methods 0.000 claims abstract description 5
- 230000008569 process Effects 0.000 claims description 55
- 239000000284 extract Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 2
- 238000013139 quantization Methods 0.000 description 32
- 238000010586 diagram Methods 0.000 description 19
- 238000001514 detection method Methods 0.000 description 15
- 238000011002 quantification Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012071 hearing screening Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本公开内容提供了一种编码设备、编码方法、解码设备、解码方法。其中,编码设备包括:时间-频率变换单元,其对音频信号执行时间-频率变换;归一化单元,其对通过时间-频率变换获得的频谱系数进行归一化,以便生成音频信号的编码数据;水平计算单元,其计算音频信号的谱水平;比例因子改变单元,其基于音频信号的谱水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,该隐藏比例因子是与用于归一化的系数有关的比例因子;以及输出单元,其输出由归一化单元生成的音频信号的编码数据、或者输出改变了其隐藏比例因子的编码的隐藏数据作为音频信号的编码数据。
Description
技术领域
本公开内容涉及一种编码设备、编码方法、解码设备、解码方法以及程序,并且更具体地,涉及一种能够生成具有更自然声音的、用于隐藏的音频信号的编码设备、编码方法、解码设备、解码方法以及程序。
背景技术
近年来,音频信号通常被数字化,并且得到的数字信号被压缩和编码,然后被传送或保存。音频信号的编码通常分类为波形编码和分析/合成编码。波形编码包括频带划分编码和变换编码,在频带划分编码中,使用频带划分滤波器将音频信号划分成多个频率分量并编码,在变换编码中,数字音频信号逐块地经受时间-频率变换并且得到的谱被编码。在波形编码中,已使用频带划分滤波器或时间-频率变换划分成频率分量的音频信号逐块地被量化,并且利用所谓的听觉遮蔽效果等经受高效编码。
图1是示出执行变换编码的编码设备的配置示例的框图。
图1中示出的编码设备10包括时间-频率变换单元11、谱归一化单元12、谱量化单元13、熵编码单元14、比例因子编码单元15以及复用器16。
编码设备10的时间-频率变换单元11接收作为时间信号的音频信号。时间-频率变换单元11逐帧地对输入音频信号执行时间-频率变换(诸如修正的离散余弦变换(MDCT))。时间-频率变换单元11将得到的每帧的频谱系数(MDCT系数)提供给谱归一化单元12。
谱归一化单元12以针对特定带宽的量化(量化单位)为基础对从时间-频率变换单元11提供的帧的频谱系数分组。谱归一化单元12使用以下表达式(1)和特定步长的系数2-λ×SF[n],逐帧地对分组的量化单位的频谱系数进行归一化。
XNorm(k)=X(k)×2-λ×SF[n]…(1)
在表达式(1)中,X(k)表示第n个量化单位的第k个频谱系数,并且XNorm(k)表示归一化的频谱系数。另外,λ是用于确定步长的值。例如,如果λ=0.5,则步长为3dB。这里,假设阶段幅度λ为常数而与帧无关。另外,这里,作为关于系数2-λ×SF[n]的信息的指数SF[n](整数)被称为“比例因子”。
谱归一化单元12将如上所述归一化的、每帧的频谱系数提供给谱量化单元13,并且将用于归一化的、每帧的比例因子提供给比例因子编码单元15。
谱量化单元13使用特定数量的比特对从谱归一化单元12提供的归一化的每帧的频谱系数进行量化,并将量化的每帧的频谱系数提供给熵编码单元14。另外,谱量化单元13将表示归一化的每帧的频谱系数的每个量化单位的量化期间的比特数的量化信息提供给复用器16。
熵编码单元14通过哈夫曼编码、算术编码等,对从谱量化单元13提供的量化的每帧的频谱系数执行可逆压缩,并且将得到的频谱系数提供给复用器16作为编码的谱数据。
比例因子编码单元15对从谱归一化单元12提供的每帧的比例因子进行编码。比例因子编码单元15将编码的每帧的比例因子提供给复用器16作为编码的比例因子。
复用器16对来自熵编码单元14的编码的谱数据、来自比例因子编码单元15的编码的比例因子、以及来自谱量化单元13的量化信息进行复用,以便生成每帧的编码数据。复用器16输出编码的数据。
在上述编码设备10中,由于诸如帧的比特数小于编码所需的比特数或者编码花费比在其期间可以执行实时处理的时段更长时间的原因,可能出现编码错误。在这种情况下,由于难以再次执行编码,因此需要准备错误隐藏装置,其输出用于隐藏的编码数据以替代不规则数据,使得不输出不规则数据作为编码数据。
作为错误隐藏装置,例如,提出了如下技术:如果编码没有在时间限制之前结束,则输出位于要编码的帧之前的帧的编码数据作为用于隐藏的编码数据,以替代要编码的帧的编码数据(例如,参照日本专利第3463592号)。
另外,作为错误隐藏装置,提出了如下另一技术:通过对无声信号等进行编码来预先准备用于隐藏的编码数据,并且输出该编码数据以替代出现了编码错误的帧的编码数据(例如,参照日本未审查专利申请公布第2003-5798号)。
另一方面,提出了如下音频压缩传输设备:如果在解码期间检测到编码数据的同步异常,则输出预先存储的无声编码数据替代编码数据作为用于隐藏的编码数据(例如,参照日本专利第2731514号)。
另外,提出了如下设备:其根据来自外部的弱音(mute)指示,利用预先创建的无声编码数据替换编码数据,并且输出该无声编码数据(例如,参照日本未审查专利申请公布第9-294077号)。
发明内容
然而,在日本专利第3463592号中描述的错误隐藏装置的情况下,如果要编码的音频信号的水平随时间的改变较大,则用于隐藏的编码数据的信号水平与出现了编码错误的帧的原始编码数据的信号水平显著不同。结果,作为对用于隐藏的编码数据进行解码的结果,会生成具有不自然声音的音频信号。
另外,在日本未审查专利申请公布第2003-5798号中描述的错误隐藏装置的情况下,用于隐藏的编码数据的信号水平和出现了编码错误的帧的原始编码数据的信号水平彼此显著不同。结果,作为对用于隐藏的编码数据进行解码的结果,会生成具有异常声音或不连续的不自然声音的音频信号。
期望生成具有更自然声音的用于隐藏的音频信号。
根据本公开内容的第一实施例的编码设备包括:时间-频率变换单元,其对音频信号执行时间-频率变换;归一化单元,其对通过时间-频率变换获得的频谱系数进行归一化,以便生成音频信号的编码数据;水平计算单元,其计算音频信号的水平;比例因子改变单元,其基于音频信号的水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,该隐藏比例因子是与用于归一化的系数有关的比例因子;以及输出单元,如果在音频信号的编码期间未出现错误,则输出单元输出由归一化单元生成的音频信号的编码数据,并且如果在音频信号的编码期间出现了错误,则输出单元输出改变了其隐藏比例因子的编码的隐藏数据作为音频信号的编码数据。
根据本公开内容的第一实施例的编码方法和程序与根据本公开内容的第一实施例的编码设备对应。
根据本公开内容的第一实施例,音频信号经受时间-频率变换;对通过时间-频率变换获得的频谱系数进行归一化,以便生成音频信号的编码数据;计算音频信号的水平;基于音频信号的水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,该隐藏比例因子是与用于归一化的系数有关的比例因子;以及如果在音频信号的编码期间未出现错误,则输出通过归一化单元生成的音频信号的编码数据,并且如果在音频信号的编码期间出现了错误,则输出改变了其隐藏比例因子的编码的隐藏数据作为音频信号的编码数据。
根据本公开内容的第二实施例的解码设备包括:逆归一化单元,其使用包括在从编码设备提供的编码数据中的编码数据的比例因子,对编码数据执行逆归一化,其中,如果在音频信号的编码期间未出现错误,则编码设备输出通过对音频信号执行时间-频率变换和归一化而生成的编码数据,并且如果在音频信号的编码期间出现了错误,则编码设备基于音频信号的水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,并且然后输出编码的隐藏数据作为音频信号的编码数据,隐藏比例因子是与用于归一化的系数有关的比例因子;以及频率-时间变换单元,其对作为由逆归一化单元执行的逆归一化的结果获得的频谱执行频率-时间变换。
根据本公开内容的第二实施例的解码方法和程序与根据本公开内容的第二实施例的解码设备对应。
根据本公开内容的第二实施例,使用包括在从编码设备提供的编码数据中的编码数据的比例因子,对编码数据执行逆归一化,其中,如果在音频信号的编码期间未出现错误,则编码设备输出通过对音频信号执行时间-频率变换和归一化而生成的编码数据,并且如果在音频信号的编码期间出现了错误,则编码设备基于音频信号的水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,并且输出编码的隐藏数据作为音频信号的编码数据,该隐藏比例因子是与用于归一化的系数有关的比例因子;以及对作为逆归一化的结果获得的频谱执行频率-时间变换。
根据本公开内容的第一实施例,可以生成具有更自然声音的、用于隐藏的音频信号的编码数据。
根据本公开内容的第二实施例,可以生成具有更自然声音的、用于隐藏的音频信号。
附图说明
图1是示出现有技术中的编码设备的配置示例的框图;
图2是示出根据本公开内容的实施例的编码设备的配置示例的框图;
图3是示出编码的隐藏数据的帧结构的示例的图;
图4是示出编码的比例因子的改变的图;
图5是示出由图2中示出的编码设备执行的编码处理的流程图;
图6是示出解码设备的配置示例的框图;
图7是示出由图6中示出的解码设备执行的解码处理的流程图;
图8是示出解码设备的配置的另一示例的框图;
图9是示出编码数据的比较的图;
图10是示出由图8中示出的解码设备执行的解码处理的流程图;以及
图11是示出根据实施例的计算机的配置示例的框图。
具体实施方式
根据本公开内容的实施例,公开了一种编码设备包括:时间-频率变换单元,其对音频信号执行时间-频率变换;归一化单元,其对通过时间-频率变换获得的频谱系数进行归一化,以便生成音频信号的编码数据;水平计算单元,其计算音频信号的水平;比例因子改变单元,其基于音频信号的水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,该隐藏比例因子是与用于归一化的系数有关的比例因子;以及输出单元,如果在音频信号的编码期间未出现错误,则输出单元输出由归一化单元生成的音频信号的编码数据,并且如果在音频信号的编码期间出现了错误,则输出单元输出改变了其隐藏比例因子的编码的隐藏数据作为音频信号的编码数据。
根据本公开内容的另一实施例,公开了一种编码方法,包括:使得编码设备:对音频信号执行时间-频率变换;对通过时间-频率变换获得的频谱系数进行归一化,以便生成音频信号的编码数据;计算音频信号的水平;基于音频信号的水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,隐藏比例因子是与用于归一化的系数有关的比例因子;以及如果在音频信号的编码期间未出现错误,则输出通过归一化生成的音频信号的编码数据,并且如果在音频信号的编码期间出现了错误,则输出改变了其隐藏比例因子的编码的隐藏数据作为音频信号的编码数据。
根据本公开内容的又一实施例,公开了一种解码设备,包括:逆归一化单元,其使用包括在从编码设备提供的编码数据中的编码数据的比例因子,对编码数据执行逆归一化,其中,如果在音频信号的编码期间未出现错误,则编码设备输出通过对音频信号执行时间-频率变换和归一化而生成的编码数据,并且如果在音频信号的编码期间出现了错误,则编码设备基于音频信号的水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,并且然后输出编码的隐藏数据作为音频信号的编码数据,隐藏比例因子是与用于归一化的系数有关的比例因子;以及频率-时间变换单元,其对作为由逆归一化单元执行的逆归一化的结果获得的频谱执行频率-时间变换。
根据本公开内容的再一实施例,公开了一种解码方法,包括:使得解码设备:使用包括在从编码设备提供的编码数据中的编码数据的比例因子,对编码数据执行逆归一化,其中,如果在音频信号的编码期间未出现错误,则编码设备输出通过对音频信号执行时间-频率变换和归一化而生成的编码数据,并且如果在音频信号的编码期间出现了错误,则编码设备基于音频信号的水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,并且然后输出编码的隐藏数据作为音频信号的编码数据,隐藏比例因子是与用于归一化的系数有关的比例因子;以及对作为逆归一化的结果获得的频谱执行频率-时间变换。
实施例
根据实施例的编码设备的配置示例
图2是示出根据本公开内容的实施例的编码设备的配置示例的框图。
在图2中示出的配置中,对与图1中示出的部件相同的部件给予与图1中相同的附图标记。如需要,省略冗余描述。
图2中示出的编码设备30的配置与图1中示出的配置不同在于,新提供了错误检测单元31、信号水平计算单元32、编码的比例因子替换单元33、以及替选编码数据输出单元34,并且提供比例因子编码单元35和复用器36分别替代比例因子编码单元15和复用器16。如果出现编码错误,则编码设备30基于音频信号的水平,针对每帧生成用于隐藏的音频信号的编码数据(在下文中称为“编码的隐藏数据”)。
更具体地,编码设备30的错误检测单元31逐帧地判断在编码期间是否出现了错误,并且判断从编码开始是否经过了特定时段(例如,在其期间可以执行实时处理的时段)。错误检测单元31基于判断结果而检测编码错误,并且然后将检测的结果提供给信号水平计算单元32和复用器36。
信号水平计算单元32根据从错误检测单元31提供的检测结果,计算由谱归一化单元12获得的帧的比例因子的平均值、最大值或最小值等,作为要编码的音频信号的帧的谱水平。信号水平计算单元32将所算出的谱水平提供给编码的比例因子替换单元33。
编码的比例因子替换单元33接收预先存储在编码设备30的存储器(未示出)中的编码的隐藏数据。作为编码的隐藏数据,例如,可使用具有可以由编码设备30处理的最小帧长度(比特数)的数据,通过以对于要输入到编码设备30的音频信号相同的方式、对作为用于隐藏的音频信号的微小噪声信号进行编码而得到该数据。
编码的比例因子替换单元33用作比例因子改变装置,并且基于从信号水平计算单元32提供的谱水平而改变包括在编码的隐藏数据中的编码的比例因子。编码的比例因子替换单元33将改变了其编码的比例因子的编码的隐藏数据提供给替选编码数据输出单元34。另外,编码的比例因子替换单元33将与改变后的编码的比例因子对应的比例因子提供给比例因子编码单元35,并使比例因子编码单元35保持该比例因子。
替选编码数据输出单元34对从编码的比例因子替换单元33提供的编码的隐藏数据执行填充,使得编码的隐藏数据的比特数对应于输出比特率。
由于编码的隐藏数据是具有可以由编码设备30处理的最小帧长度的数据,因此替选编码数据输出单元34可以通过执行填充,生成具有与任意输出比特率对应的帧长度的编码的隐藏数据。因此,不需要编码设备30为每个帧长度保持编码的隐藏数据,由此减少了要存储在用于保持编码的隐藏数据的存储器(未示出)中的数据量。
替选编码数据输出单元34将经受了填充的编码的隐藏数据提供给复用器36。
比例因子编码单元35使用由其保持的过去帧的比例因子,对从谱归一化单元12提供的每帧的比例因子执行帧间预测编码。因此,由于比例因子编码单元35对比例因子执行帧间预测编码,因此可以改进编码效率。
比例因子编码单元35将经受了帧间预测编码的每帧的比例因子提供给复用器36作为编码的比例因子。另外,比例因子编码单元35将从谱归一化单元12提供的每帧的比例因子或从编码的比例因子替换单元33提供的比例因子保持作为过去帧的比例因子。
复用器36根据从错误检测单元31提供的检测的结果,对来自熵编码单元14的编码的谱数据、来自比例因子编码单元35的编码的比例因子、以及来自谱量化单元13的量化信息进行复用,以便生成每帧的编码数据。复用器36用作输出装置,并且根据来自错误检测单元31的检测结果,输出所生成的每帧的编码数据,或输出经受了填充并从替选编码数据输出单元34提供的编码的隐藏数据作为出现了编码错误的帧的编码数据。从复用器36输出的编码数据或编码的隐藏数据例如暂时由输出缓冲器(未示出)保持,并且然后被传送到另一设备。
如果编码错误的原因是帧的比特数小于编码所需的比特数、或者从编码开始经过了特定时段,则在执行复杂比特分配的量化期间很可能出现编码错误。因此,当检测到编码错误时,很可能算出了每帧的比例因子。为此,在该实施例中,信号水平计算单元32使用每帧的比例因子来计算谱水平。
然而,如果当检测到编码错误时没有算出每帧的比例因子,则使用在检测到编码错误之前获得的每帧的频谱系数或音频信号本身来计算谱水平。例如,如果在检测到编码错误之前已算出每帧的频谱系数,则计算频谱系数的平均值或最大值作为谱水平。如果在检测到编码错误之前仅检测到每帧的音频信号,则根据由时间-频率变换单元11执行的时间-频率变换来对音频信号的时间样本的最大值、平均值或能量等执行适当的缩放,并获得谱水平。
编码的隐藏数据的帧结构的示例
图3是示出编码的隐藏数据的帧结构的示例的图。
如图3所示,在编码的隐藏数据中,针对每帧对比例因子的编码模式、编码的比例因子、量化信息、以及用于隐藏的音频信号的编码谱等进行复用。
比例因子的编码模式可以是例如执行编码成偏移值和与该偏移值的差的偏移模式、执行量化单位间预测编码的量化单位间预测模式、执行帧间预测编码的帧间预测模式、执行通道间预测编码的通道间预测模式等。
在该实施例中,以偏移模式对用于隐藏的音频信号的比例因子进行编码。因此,如图3所示,编码的隐藏数据的编码的比例因子由偏移值sf_offset(整数)、由以下表达式(2)定义的差信息ΔSF[n]的比特数N、以及差信息ΔSF[n]构成。
ΔSF[n]=SFec[n]-sf_offset…(2)
在表达式(2)中,SFec[n]表示第n个量化单位的用于隐藏的音频信号的比例因子。另外,由于用于隐藏的音频信号是微小噪声信号,因此差ΔSF[n]足够小,即约N=2。
另外,虽然未示出,但是原始音频信号的编码数据的帧结构以与图3中示出的编码的隐藏数据的帧结构相同的方式构成。然而,编码模式是帧间预测模式,并且将与过去帧的每个量化单位的比例因子有关的差信息等布置为编码的比例因子。
编码的隐藏数据的比例因子的改变的描述
图4是示出由编码的比例因子替换单元33进行的、编码的隐藏数据的编码的比例因子的改变的图。要注意的是,在图4中,水平轴表示分配给量化单位的数目n,而垂直轴表示比例因子的水平。
如图4所示,如果假设要输入到编码设备30的音频信号的每帧的比例因子为SFsig[n],并且假设由信号水平计算单元32算出的谱水平为SigLev,则编码的比例因子替换单元33将编码的比例因子的偏移值sf_offset改变成由以下表达式(3)表示的偏移值sf_offset':
sf_offset'=SigLev-A…(3)
在表达式(3)中,“A”是用于调整用于隐藏的音频信号的水平的整数。如图4所示,期望设置整数A使得用于隐藏的音频信号的校正之后的比例因子SF'ec[n]变得略小于(若干dB)谱水平SigLev。
当偏移值sf_offset改变成偏移值sf_offset'时,改变之后的用于隐藏的音频信号的比例因子SF'ec[n]由以下表达式(4)表示:
SF'ec[n]=ΔSF[n]+sf_offset'…(4)
如上所述,在编码的隐藏数据的编码的比例因子的情况下,每帧的用于隐藏的音频信号的每个量化单位的比例因子SFec[n]由与偏移值sf_offset的差ΔSF[n]表示。因此,编码的比例因子替换单元33可以仅通过改变偏移值sf_offset,容易地改变每帧的用于隐藏的音频信号的所有量化单位的比例因子。另外,由于编码的比例因子替换单元33仅改变偏移值sf_offset,因此差信息ΔSF[n]的比特数N和差信息ΔSF[n]不改变。
由编码设备执行的处理的描述
图5是示出由图2中示出的编码设备30执行的编码处理的流程图。针对每帧执行编码处理,同时顺序将每帧的音频信号设置为编码目标。
在图5中示出的步骤S11中,编码设备30开始对编码目标进行编码。更具体地,开始由时间-频率变换单元11、谱归一化单元12、谱量化单元13、熵编码单元14、以及比例因子编码单元35执行的处理。当编码目标是第一帧的音频信号时,对编码设备30进行初始化,并然后执行编码。
在步骤S12中,错误检测单元31判断是否检测到编码错误。更具体地,错误检测单元31判断在编码期间是否出现错误,并且判断从编码开始是否经过特定时段(例如,在其期间可以执行实时处理的时段)。如果在编码期间出现错误或者如果从编码开始经过了特定时段,则在步骤S12中判断出检测到了编码错误。错误检测单元31将指示检测到编码错误的检测结果提供给信号水平计算单元32和复用器36。
在步骤S13中,编码设备30停止编码目标的编码,并且在以下的步骤S14至S19中执行错误隐藏处理。
更具体地,在步骤S14中,信号水平计算单元32根据来自错误检测单元31的检测结果,计算由谱归一化单元12获得的帧的比例因子的平均值、最大值或最小值等作为谱水平。信号水平计算单元32将所算出的谱水平提供给编码的比例因子替换单元33。
在步骤S15中,编码的比例因子替换单元33基于从信号水平计算单元32提供的谱水平,使用上述表达式(3)来计算偏移值sf_offset'。
在步骤S16中,编码的比例因子替换单元33基于偏移值sf_offset',改变包括在编码的隐藏数据中的编码的比例因子的偏移值。编码的比例因子替换单元33将改变了其偏移值的编码的隐藏数据提供给替选编码数据输出单元34。
在步骤S17中,替选编码数据输出单元34对编码的隐藏数据执行填充,使得从编码的比例因子替换单元33提供的编码的隐藏数据的比特数与输出比特率对应。然后,替选编码数据输出单元34将经受了填充的编码的隐藏数据提供给复用器36。
在步骤S18中,复用器36根据从错误检测单元31提供的检测结果,将经受了填充的并且从替选编码数据输出单元34提供的编码的隐藏数据输出为目标编码数据。
在步骤S19中,编码的比例因子替换单元33将与在步骤S16中执行的处理中改变了其偏移值的编码的比例因子对应的、并由上述表达式(4)表示的比例因子SF'ec[n]提供给比例因子编码单元35,并且使得比例因子编码单元35保持该比例因子SF'ec[n]。
结果,由以下表达式(5)表示由比例因子编码单元35保持的比例因子SFsig[n]:
SFsig[n]=SF'ec[n]=ΔSF[n]+sf_offset'…(5)
因此,即使出现了编码错误,由于比例因子编码单元35保持作为目标编码数据的编码的隐藏数据的比例因子,因此当对下一帧进行编码时,比例因子编码单元35也可以使用由其保持的比例因子来正确地执行帧间预测编码。
另一方面,如果没发生错误并且从编码开始没有经过特定时段,则在步骤S12中判断出没有检测到编码错误。错误检测单元31将指示没有检测到编码错误的检测结果提供给信号水平计算单元32和复用器36。
在步骤S20中,编码设备30判断编码目标的编码是否已结束。如果判断出编码目标的编码没有结束,则处理返回到步骤S12。然后重复步骤S12到S20的处理,直到编码目标的编码结束为止。
如果在步骤S20中判断出编码目标的编码已结束,则复用器36根据从错误检测单元31提供的检测结果来输出通过编码生成的目标编码数据,并且终止处理。
如上所述,由于编码设备30基于要编码的音频信号的水平而改变编码的隐藏数据的比例因子,因此可以生成具有更自然声音的编码的隐藏数据。
解码设备的配置示例
图6是示出对从图2中示出的编码设备30输出的编码数据进行解码的解码设备的配置示例的框图。
图6中示出的解码设备50包括逆复用器51、熵解码单元52、谱逆量化单元53、比例因子解码单元54、谱逆归一化单元55以及频率-时间变换单元56。解码设备50对从编码设备30输出的每帧的编码数据进行解码,并且输出得到的音频信号。
更具体地,逆复用器51用作提取装置,并且如果从编码设备30提供的每帧的编码数据经受了填充,则逆复用器51从编码数据中提取填充之前的编码数据。逆复用器51对所提取的填充之前的编码数据、或没有经受填充的并从编码设备30提供的每帧的编码数据执行逆复用,以便提取编码的谱数据、编码的缩放因子、以及量化信息。逆复用器51将编码的谱数据提供给熵解码单元52,并且将量化信息提供给谱逆量化单元53。另外,逆复用器51将编码的比例因子提供给比例因子解码单元54。
熵解码单元52对从逆复用器51提供的编码的谱数据执行与诸如哈夫曼编码或算术编码的可逆压缩对应的可逆解码,并将得到的量化的每帧的频谱系数提供给谱逆量化单元53。
谱逆量化单元53基于从逆复用器51提供的量化信息,对从熵解码单元52提供的量化的每帧的频谱系数执行逆量化,以便获得归一化的每帧的频谱系数。谱逆量化单元53将归一化的每帧的频谱系数提供给谱逆归一化单元55。
比例因子解码单元54对从逆复用器51提供的编码的比例因子进行解码,以便获得每帧的比例因子。更具体地,如果编码模式是偏移模式,则比例因子解码单元54使用包括在编码的比例因子中的偏移值sf_offset'和差信息ΔSF[n]以及上述表达式(4),计算比例因子SF'ec[n]。
另一方面,如果编码模式是帧间预测模式,则比例因子解码单元54使用由其保持的过去帧的比例因子,对编码的比例因子执行帧间预测解码。更具体地,比例因子解码单元54通过将包括在编码的比例因子中的差信息与由其保持的过去帧的比例因子相加,计算当前帧的比例因子。比例因子解码单元54保持所获得的每帧的比例因子,并且将该比例因子提供给谱逆归一化单元55。
谱逆归一化单元55基于从比例因子解码单元54提供的每帧的比例因子,针对每个量化单位,对从谱逆量化单元53提供的每帧的归一化频谱系数执行逆归一化。谱逆归一化单元55将作为逆归一化结果获得的每帧的频谱系数提供给频率-时间变换单元56。
频率-时间变换单元56对从谱逆归一化单元55提供的每帧的频谱系数执行诸如逆修正的离散余弦变换(IMDCT)的频率-时间变换。频率-时间变换单元56输出作为得到的每帧的时间信号的音频信号。
如果对每帧的频谱系数执行IMDCT,则每帧的音频信号是通过对与相应帧的频谱系数对应的音频信号和与先前帧的频谱系数对应的音频信号进行叠加获得的音频信号。
这里,如上所述,编码的隐藏数据的比例因子是基于在出现编码错误的时刻处的音频信号的谱水平而设置的。因此,用于隐藏的音频信号的谱水平与原始音频信号的谱水平没有显著地不同。结果,通过使用频率-时间变换单元56对与先前和下一帧的频谱系数对应的音频信号进行相加,用于隐藏的音频信号可以平滑地连接到先前和下一帧的音频信号。
解码处理的描述
图7是示出由图6中示出的解码设备50执行的解码处理的流程图。当将例如将从图2中示出的编码设备30输出的每帧的编码数据输入到解码设备50时,解码处理开始。当对第一帧的编码数据执行解码处理时,在解码处理之前对解码设备50进行初始化。
在图7中示出的步骤S31中,逆复用器51对从编码设备30提供的每帧的编码数据执行逆复用,以便提取编码的谱数据、编码的比例因子以及量化信息。如果从编码设备30提供的每帧的编码数据经受了填充,则逆复用器51提取填充之前的编码数据,并且然后执行逆复用。逆复用器51将编码的谱数据提供给熵解码单元52,并且将量化信息提供给谱逆量化单元53。另外,逆复用器51将编码的比例因子提供给比例因子解码单元54。
在步骤S32中,熵解码单元52对从逆复用器51提供的编码的谱数据执行与诸如哈夫曼编码或算术编码的可逆压缩对应的可逆解码。熵解码单元52然后将得到的量化的每帧的频谱系数提供给谱逆量化单元53。
在步骤S33中,谱逆量化单元53基于从逆复用器51提供的量化信息,对从熵解码单元52提供的量化的每帧的频谱系数执行逆量化。谱逆量化单元53将得到的归一化的每帧的频谱系数提供给谱逆归一化单元55。
在步骤S34中,比例因子解码单元54根据包括在编码的比例因子中的编码模式,对从逆复用器51提供的编码的比例因子进行解码,以便获得比例因子。
在步骤S35中,比例因子解码单元54保持所获得的比例因子。如果位于要解码的当前帧之后的帧的编码的比例因子的编码模式是帧间预测模式,则该比例因子用来对编码的比例因子进行解码。比例因子解码单元54将所获得的比例因子提供给谱逆归一化单元55。
在步骤S36中,谱逆归一化单元55基于从比例因子解码单元54提供的每帧的比例因子,针对每个量化单位,对从谱逆量化单元53提供的归一化的每帧的频谱系数执行逆归一化。谱逆归一化单元55将作为逆归一化结果获得的每帧的频谱系数提供给频率-时间变换单元56。
在步骤S37中,频率-时间变换单元56对从谱逆归一化单元55提供的每帧的频谱系数执行诸如IMDCT的频率-时间变换。
在步骤S38中,频率-时间变换单元56输出音频信号,并且然后终止处理,其中,该音频信号是作为频率-时间变换的结果获得的每帧的时间信号。
如上所述,解码设备50基于包括在编码的隐藏数据中并基于原始音频信号的谱水平改变的编码的比例因子,对编码的隐藏数据的归一化的频谱系数执行逆归一化。结果,解码设备50可以生成用于隐藏的音频信号作为解码的结果,该用于隐藏的音频信号的谱水平与原始音频信号的谱水平对应并且具有自然的声音。
解码设备的另一配置示例
图8是示出对从编码设备30输出的编码数据进行解码的解码设备的另一配置示例的框图。
在图8中示出的配置中,对与图6中示出的部件相同的部件给予与图6中相同的附图标记。如需要,省略冗余描述。
图8中示出的解码设备70的配置与图6中示出的配置的不同之处在于,新提供了隐藏数据检测单元71和隐藏谱生成单元72,并且提供谱逆归一化单元73以替代谱逆归一化单元55。如果从编码设备30提供的每帧的编码数据是编码的隐藏数据,则解码设备70不对编码的隐藏数据进行解码,而是新生成用于隐藏的音频信号。
更具体地,解码设备70的隐藏数据检测单元71用作判断装置,并且对由存储器(未示出)保持的并且与由编码设备30保持的编码的隐藏数据相同的编码的隐藏数据和从编码设备30提供的每帧的编码数据进行比较。隐藏数据检测单元71基于比较结果,判断从编码设备30提供的每帧的编码数据是否是编码的隐藏数据,并且将判断结果提供给隐藏谱生成单元72。
隐藏谱生成单元72根据从隐藏数据检测单元71提供的判断结果,基于由谱逆量化单元53获得的归一化的每帧的频谱系数,生成用于隐藏的系数。用于隐藏的系数是由解码设备70生成的用于隐藏的音频信号的归一化频谱系数。隐藏谱生成单元72将所生成的用于隐藏的系数提供给谱逆归一化单元73。
谱逆归一化单元73基于来自比例因子编码单元54的比例因子,对来自谱逆量化单元53的归一化频谱系数或来自隐藏谱生成单元72的用于隐藏的系数执行逆归一化。谱逆归一化单元73将作为逆归一化的结果获得的频谱系数提供给频率-时间变换单元56。结果,生成与来自谱逆量化单元53的归一化频谱系数对应的音频信号作为原始信号,并且生成与用于隐藏的系数对应的音频信号作为新的用于隐藏的音频信号。
编码数据的比较的描述
图9是示出由图8中示出的隐藏数据检测单元71执行的编码数据的比较的图。
如图9所示,在由存储器(未示出)保持的编码的隐藏数据和从编码设备30提供的每帧的编码数据的每帧中布置编码模式、编码的比例因子、量化信息以及编码谱。
隐藏数据检测单元71对编码的隐藏数据和除编码的比例因子之外的每帧的编码数据进行比较。要注意的是,隐藏数据检测单元71可一次共同地对除编码的比例因子之外的数据进行比较,或可通过划分数据逐步地对数据进行比较。
如果隐藏数据检测单元71逐步地对除编码的比例因子之外的数据进行比较,则首先,从编码的隐藏数据和每帧的编码数据中提取在编码谱中最具特色的图9中示出的若干字节的数据(1)。数据(1)可以是例如其形式出现频率较低的若干字节的数据。
接下来,隐藏数据检测单元71对编码的隐藏数据和每帧的编码数据的数据(1)进行比较。由于数据(1)是若干字节的数据,因此可以以高速率执行比较。如果作为比较的结果发现编码的隐藏数据和每帧的编码数据的数据(1)不匹配,则隐藏数据检测单元71判断出每帧的编码数据不是编码的隐藏数据。
另一方面,如果编码的隐藏数据和每帧的编码数据的数据(1)匹配,则隐藏数据检测单元71提取编码的隐藏数据和每帧的编码数据中的、例如作为编码谱中除数据(1)之外的数据的数据(2),并且对数据(2)进行比较。如果作为比较的结果发现编码的隐藏数据和每帧的编码数据的数据(2)不匹配,则隐藏数据检测单元71判断出每帧的编码数据不是编码的隐藏数据。
以如上相同的方式,隐藏数据检测单元71从编码的隐藏数据和每帧的编码数据中提取量化信息(3),并且对量化信息(3)进行比较。如果量化信息(3)匹配,则隐藏数据检测单元71从编码的隐藏数据和每帧的编码数据中提取数据(4)并且对数据(4)进行比较,其中数据(4)是除编码的比例因子、数据(1)、数据(2)以及量化信息(3)之外的数据。如果编码的隐藏数据和每帧的编码数据的数据(1)、数据(2)、量化信息(3)以及数据(4)全部匹配,则隐藏数据检测单元71判断出每帧的编码数据是编码的隐藏数据。另一方面,如果编码的隐藏数据和每帧的编码数据的量化信息(3)或数据(4)不匹配,则隐藏数据检测单元71判断出每帧的编码数据不是编码的隐藏数据。
如上所述,当逐步地对除编码的比例因子之外的数据进行比较时,在编码的隐藏数据和每帧的编码数据的数据(1)、数据(2)、量化信息(3)以及数据(4)中任一不匹配时,隐藏数据检测单元71可以判断出每帧的编码数据不是编码的隐藏数据。因此,隐藏数据检测单元71可以有效地判断每帧的编码数据是否是编码的隐藏数据。
另外,当除了编码的比例因子之外的所有数据匹配时,隐藏数据检测单元71判断出每帧的编码数据是编码的隐藏数据,可以准确地检测编码的隐藏数据。
要理解的是,对数据(2)、量化信息(3)以及数据(4)的比较的顺序不限于上述情况。
另一解码处理的描述
图10是示出由图8中示出的解码设备70执行的解码处理的流程图。当例如将从图2中示出的编码设备30输出的每帧的编码数据输入到解码设备70时,解码处理开始。当对第一帧的编码数据执行解码处理时,在解码处理之前对解码设备70进行初始化。
在图10中示出的步骤S51至S55中执行的处理与在图7中示出的步骤S31至S35中执行的处理相同,并且因此省略其描述。
在步骤S55中执行的处理之后,如图9所示,在步骤S56中,隐藏数据检测单元71对要解码的每帧的编码数据和编码的隐藏数据中的、除编码的比例因子之外的数据进行比较。
在步骤S57中,隐藏数据检测单元71基于比较结果,判断要解码的每帧的编码数据是否是编码的隐藏数据,并且将判断结果提供给隐藏谱生成单元72。
如果在步骤S57中判断出要解码的每帧的编码数据不是编码的隐藏数据,则处理进行到步骤S58。在步骤S58中,谱逆归一化单元73基于来自比例因子解码单元54的比例因子,对来自谱逆量化单元53的归一化频谱系数执行逆归一化。谱逆归一化单元73将作为逆归一化的结果获得的频谱系数提供给频率-时间变换单元56。然后,处理进行到步骤S61。
另一方面,如果在步骤S57中判断出要解码的每帧的编码数据是编码的隐藏数据,则处理进行到步骤S59。
在步骤S59中,隐藏谱生成单元72基于由谱逆量化单元53获得的归一化频谱系数,生成用于隐藏的系数。更具体地,隐藏谱生成单元72生成位于要解码的帧之前的帧的归一化频谱系数的平均值、或位于紧挨在要解码的帧之前和之后的帧的归一化频谱系数的平均值,作为用于隐藏的系数。
然而,如果位于要解码的帧之后的帧的归一化频谱系数用来生成用于隐藏的系数,则产生延迟。要理解的是,用于生成用于隐藏的系数的方法不限于上述方法。隐藏谱生成单元72将所生成的用于隐藏的系数提供给谱逆归一化单元73。
在步骤S60中,谱逆归一化单元73基于来自比例因子解码单元54的比例因子,对从隐藏谱生成单元72提供的用于隐藏的系数执行逆归一化。谱逆归一化单元73将作为逆归一化结果获得的频谱系数提供给频率-时间变换单元56。然后,处理进行到步骤S61。
在步骤S61和S62中执行的处理与图7中示出的步骤S37和S38中执行的处理相同,因此省略其描述。
如果通过在步骤S59至S61中执行的上述处理判断出要解码的编码数据是编码的隐藏数据,则使用包括在编码的隐藏数据中的编码的比例因子和位于编码的隐藏数据之前或之后的编码数据,生成新的用于隐藏的音频信号。因此,在这种情况下,隐藏谱生成单元72、谱逆归一化单元73以及频率-时间变换单元56用作用于生成新的用于隐藏的音频信号的生成装置。
要注意的是,虽然在图10中示出的解码处理中假设执行步骤S52和S53中的处理,而不管解码目标是编码的隐藏数据还是原始音频信号的编码数据,但是当解码目标是编码的隐藏数据时,不一定执行步骤S52和S53中的处理。
如上所述,解码设备70通过对要解码的每帧的编码数据和编码的隐藏数据进行比较,判断要解码的每帧的编码数据是否是编码的隐藏数据。因此,编码设备30不需要向解码设备70传送表示编码数据是否是编码的隐藏数据的标志,由此减少要传送的比特数。相反,当需要向解码设备传送表示编码数据是否是编码的隐藏数据的标志时,即,例如当已经确定编码数据的格式时,需要向编码数据添加标志作为新头,或确定新格式。
另外,如果要解码的每帧的编码数据是编码的隐藏数据,则解码设备70生成用于隐藏的系数,并且基于包括在编码的隐藏数据中的编码的比例因子,对该用于隐藏的系数执行逆归一化。因此,解码设备70可以仅通过生成用于隐藏的系数容易地生成如下用于隐藏的音频信号:其频谱与原始音频信号的谱水平对应并且具有自然声音。相反,在不使用基于发生了编码错误的帧的原始音频信号的谱水平的比例因子来生成用于隐藏的音频信号的解码设备的情况下,需要诸如计算单元和存储器的多个资源,并且难以生成具有自然声音的用于隐藏的音频信号。
此外,由于解码设备70基于至少位于要解码的帧之前或之后的帧的归一化频谱系数而生成用于隐藏的系数,因此可以生成具有更自然声音的用于隐藏的音频信号。
虽然在该实施例中用于隐藏的音频信号的比例因子的编码模式是偏移模式,但是编码模式不限于此。例如,可以确定左通道的用于隐藏的音频信号的比例因子的编码模式为量化单位间预测模式,而右通道的用于隐藏的音频信号的比例因子的编码模式为通道间预测模式。
然而,不期望将帧间预测模式设置为用于隐藏的音频信号的比例因子的编码模式。当不设置帧间预测模式时,可以减少错误隐藏处理的处理量,并且因此可以减少要存储在编码设备30的存储区域中的数据量。
另外,可以针对每帧设置比例因子的编码模式。
此外,虽然上述编码数据包括编码的比例因子,但是包括在编码数据中的关于归一化的信息不一定是编码的比例因子,而可以是用于归一化的系数或比例因子本身。
应用本公开内容的计算机的描述
现在,可通过硬件或软件执行上述系列处理。如果通过软件执行系列处理,则包括在软件中的程序安装在通用计算机等上。
图11示出了在其上安装了执行上述系列处理的程序的、根据实施例的计算机的配置示例。
程序可预先记录在作为并入计算机的记录介质的、存储单元208或只读存储器(ROM)202上。
替选地,程序可存储(记录)在可移动介质211中。这样的可移动介质可设置为所谓的封装软件。这里,可移动介质211可以是例如软盘、光盘只读存储器(CD-ROM)、磁-光(MO)盘、数字多功能盘(DVD)、磁盘、半导体存储器等。
程序不仅可以通过驱动器210从上述可移动介质211安装在计算机上,而且可以通过经由通信网络或广播网络将程序下载到计算机而安装在并入计算机的存储单元208上。即,程序可以例如通过用于数字卫星广播的人造卫星从下载站点无线传递到计算机,或者通过诸如局域网(LAN)或因特网的缆线网络传递到计算机。
计算机包括中央处理单元(CPU)201。输入/输出接口205通过总线204连接到CPU 201。
当例如操作输入单元206的用户通过输入/输出接口205将命令输入到CPU 201时,CPU 201执行存储在ROM 202中的程序。替选地,CPU201将存储在存储单元208中的程序装载到随机存取存储器(RAM)203中,并执行该程序。
因此,CPU 201执行根据上述流程图的处理、或根据在上述框图中示出的配置的处理。然后,CPU 201例如当需要时通过输入/输出接口205,从输出单元207输出处理的结果,从通信单元209传送处理的结果,或者将处理的结果记录在存储单元208上。
输入单元206由键盘、鼠标、麦克风等构成。输出单元207由液晶显示器(LCD)、扬声器等构成。
不一定按这里的流程图中描述的顺序、按时间序列来执行由计算机根据程序所执行的处理。即,由计算机根据程序所执行的处理包括彼此并行或单独执行的处理(例如,并行处理或使用对象执行的处理)。
另外,程序可由单台计算机(处理器)处理、或者可经受由多台计算机执行的分布式处理。此外,程序可被传递到远程计算机并被执行。
本公开内容的实施例不限于上述实施例,并且可以以不偏离本公开内容的范围的各种方式进行修改。
本公开内容包含与2010年12月3日向日本专利局提交的日本优先权专利申请JP 2010-270544中公开的主题内容相关的主题内容,在此通过引用将其全文合并于此。
本领域的技术人员应该理解,在所附权利要求或其等同方案的范围内,根据设计需要和其它因素,可进行各种修改、组合、子组合以及变更。
Claims (14)
1.一种编码设备,包括:
时间-频率变换单元,其对音频信号执行时间-频率变换;
归一化单元,其对通过所述时间-频率变换获得的频谱系数进行归一化,以便生成所述音频信号的编码数据;
水平计算单元,其计算所述音频信号的谱水平;
比例因子改变单元,其基于所述音频信号的谱水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,所述隐藏比例因子是与用于归一化的系数有关的比例因子;以及
输出单元,如果在所述音频信号的编码期间未出现错误,则所述输出单元输出由所述归一化单元生成的所述音频信号的编码数据,并且如果在所述音频信号的编码期间出现了错误,则所述输出单元输出改变了其隐藏比例因子的所述编码的隐藏数据作为所述音频信号的编码数据。
2.根据权利要求1所述的编码设备,
其中,所述水平计算单元计算原始比例因子的平均值、最大值或最小值作为所述音频信号的谱水平,所述原始比例因子是与用于由所述归一化单元对所述音频信号执行的归一化的系数有关的比例因子。
3.根据权利要求1所述的编码设备,
其中,所述隐藏比例因子被编码成特定偏移值和所述特定偏移值与所述隐藏比例因子之间的差,并且
其中,所述比例因子改变单元通过改变所述特定偏移值来改变所述隐藏比例因子。
4.根据权利要求1所述的编码设备,还包括:
比例因子编码单元,其对原始比例因子执行帧间预测编码并保持所述原始比例因子,所述原始比例因子是与用于由所述归一化单元对所述音频信号执行的归一化的系数有关的比例因子,
其中,如果在所述音频信号的编码期间出现了错误,则所述比例因子改变单元使得所述归一化单元保持经受了由所述比例因子改变单元进行的改变的所述隐藏比例因子作为所述音频信号的原始比例因子,并且
其中,所述比例因子编码单元使用由所述比例因子编码单元保持的所述原始比例因子,对所述原始比例因子执行帧间预测编码。
5.根据权利要求1所述的编码设备,
其中,所述编码的隐藏数据的比特数是能够由所述编码设备处理的最小比特数,并且
其中,所述输出单元对所述编码的隐藏数据执行填充,使得所述编码的隐藏数据的比特数对应于输出比特率,并且输出所述编码的隐藏数据。
6.一种编码方法,包括:
使得编码设备:
对音频信号执行时间-频率变换;
对通过所述时间-频率变换获得的频谱系数进行归一化,以便生成所述音频信号的编码数据;
计算所述音频信号的谱水平;
基于所述音频信号的谱水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,所述隐藏比例因子是与用于归一化的系数有关的比例因子;以及
如果在所述音频信号的编码期间未出现错误,则输出通过归一化生成的所述音频信号的编码数据,并且如果在所述音频信号的编码期间出现了错误,则输出改变了其隐藏比例因子的所述编码的隐藏数据作为所述音频信号的编码数据。
7.一种解码设备,包括:
逆归一化单元,其使用包括在从编码设备提供的编码数据中的所述编码数据的比例因子,对所述编码数据执行逆归一化,其中,如果在音频信号的编码期间未出现错误,则所述编码设备输出通过对所述音频信号执行时间-频率变换和归一化而生成的编码数据,并且如果在所述音频信号的编码期间出现了错误,则所述编码设备基于所述音频信号的谱水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,并且然后输出所述编码的隐藏数据作为所述音频信号的编码数据,所述隐藏比例因子是与用于归一化的系数有关的比例因子;以及
频率-时间变换单元,其对作为由所述逆归一化单元执行的逆归一化的结果而获得的频谱执行频率-时间变换。
8.根据权利要求7所述的解码设备,还包括:
判断单元,其通过对所述编码数据与用于比较的编码的隐藏数据进行比较,判断所述编码数据是否是所述编码的隐藏数据,所述用于比较的编码的隐藏数据是改变所述隐藏比例因子之前的所述编码的隐藏数据。
9.根据权利要求8所述的解码设备,
其中,所述判断单元对作为包括在所述编码数据中的、除所述比例因子之外的数据的第一数据与作为包括在所述用于比较的编码的隐藏数据中的、除了所述隐藏比例因子之外的数据的第二数据进行比较,并且如果所述第一数据与所述第二数据匹配,则判断出所述编码数据是所述编码的隐藏数据。
10.根据权利要求8所述的解码设备,还包括:
生成单元,如果所述判断单元判断出所述编码数据是所述编码的隐藏数据,则使用包括在所述编码的隐藏数据中的所述隐藏比例因子和所述编码的隐藏数据前面的编码数据来生成用于隐藏的音频信号,
其中,如果所述判断单元判断出所述编码数据不是所述编码的隐藏数据,则所述逆归一化单元对所述编码数据执行逆归一化。
11.根据权利要求7所述的解码设备,
其中,所述隐藏比例因子被编码成特定偏移值和所述特定偏移值与所述隐藏比例因子之间的差。
12.根据权利要求7所述的解码设备,还包括:
比例因子解码单元,其对不是所述编码的隐藏数据的所述编码数据的所述比例因子执行帧间预测解码,并且保持作为解码的结果获得的比例因子,
其中,所述比例因子解码单元将所述隐藏比例因子保持为作为解码的结果获得的所述比例因子,并且使用由所述比例因子解码单元保持的所述比例因子来执行帧间预测解码。
13.根据权利要求7所述的解码设备,还包括:
提取单元,其从经受了填充并从所述编码设备提供的编码的隐藏数据提取所述编码的隐藏数据。
14.一种解码方法,包括:
使得解码设备:
使用包括在从编码设备提供的编码数据中的所述编码数据的比例因子,对所述编码数据执行逆归一化,其中,如果在音频信号的编码期间未出现错误,则所述编码设备输出通过对所述音频信号执行时间-频率变换和归一化而生成的编码数据,并且如果在所述音频信号的编码期间出现了错误,则所述编码设备基于所述音频信号的谱水平,改变包括在通过对微小噪声信号执行时间-频率变换和归一化而获得的编码的隐藏数据中的隐藏比例因子,并且然后输出所述编码的隐藏数据作为所述音频信号的编码数据,所述隐藏比例因子是与用于归一化的系数有关的比例因子;以及
对作为所述逆归一化的结果获得的频谱执行频率-时间变换。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010270544A JP5724338B2 (ja) | 2010-12-03 | 2010-12-03 | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム |
JP2010-270544 | 2010-12-03 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102486923A CN102486923A (zh) | 2012-06-06 |
CN102486923B true CN102486923B (zh) | 2015-10-21 |
Family
ID=46152406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110380792.6A Expired - Fee Related CN102486923B (zh) | 2010-12-03 | 2011-11-25 | 编码设备、编码方法、解码设备、解码方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8626501B2 (zh) |
JP (1) | JP5724338B2 (zh) |
CN (1) | CN102486923B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6179087B2 (ja) * | 2012-10-24 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07183854A (ja) * | 1993-12-24 | 1995-07-21 | Matsushita Electric Ind Co Ltd | 音声圧縮データ編集装置 |
WO1999004505A1 (de) * | 1997-07-14 | 1999-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals |
JPH11202899A (ja) * | 1998-01-13 | 1999-07-30 | Matsushita Electric Ind Co Ltd | 再生装置 |
JP2000252835A (ja) * | 1999-03-01 | 2000-09-14 | Matsushita Electric Ind Co Ltd | 符号化回路 |
CN1460249A (zh) * | 2001-04-05 | 2003-12-03 | 皇家菲利浦电子有限公司 | 采用针对确定信号类型的技术进行信号时标修改 |
CN101346760A (zh) * | 2005-10-26 | 2009-01-14 | 高通股份有限公司 | 用于音频编码的编码器辅助的帧丢失隐藏技术 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2731514B2 (ja) | 1994-11-18 | 1998-03-25 | 株式会社日立製作所 | 音声圧縮伝送装置 |
JPH08328599A (ja) * | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
JPH09294077A (ja) | 1996-04-26 | 1997-11-11 | Hitachi Ltd | 圧縮音声データ処理方法及びデータストリーム再生方法とそれらの装置 |
JPH11355145A (ja) * | 1998-06-10 | 1999-12-24 | Mitsubishi Electric Corp | 音響符号器および音響復号器 |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
KR100898879B1 (ko) * | 2000-08-16 | 2009-05-25 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 부수 정보에 응답하여 하나 또는 그 이상의 파라메터를변조하는 오디오 또는 비디오 지각 코딩 시스템 |
US6862567B1 (en) * | 2000-08-30 | 2005-03-01 | Mindspeed Technologies, Inc. | Noise suppression in the frequency domain by adjusting gain according to voicing parameters |
US7031926B2 (en) * | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
JP2003005798A (ja) | 2001-06-21 | 2003-01-08 | Sony Corp | 記録装置および再生装置 |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
JP2005292702A (ja) * | 2004-04-05 | 2005-10-20 | Kddi Corp | オーディオフレームに対するフェードイン/フェードアウト処理装置及びプログラム |
JP4639073B2 (ja) * | 2004-11-18 | 2011-02-23 | キヤノン株式会社 | オーディオ信号符号化装置および方法 |
WO2007000988A1 (ja) * | 2005-06-29 | 2007-01-04 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号装置および消失データ補間方法 |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
-
2010
- 2010-12-03 JP JP2010270544A patent/JP5724338B2/ja not_active Expired - Fee Related
-
2011
- 2011-11-23 US US13/303,443 patent/US8626501B2/en not_active Expired - Fee Related
- 2011-11-25 CN CN201110380792.6A patent/CN102486923B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07183854A (ja) * | 1993-12-24 | 1995-07-21 | Matsushita Electric Ind Co Ltd | 音声圧縮データ編集装置 |
WO1999004505A1 (de) * | 1997-07-14 | 1999-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals |
JPH11202899A (ja) * | 1998-01-13 | 1999-07-30 | Matsushita Electric Ind Co Ltd | 再生装置 |
JP2000252835A (ja) * | 1999-03-01 | 2000-09-14 | Matsushita Electric Ind Co Ltd | 符号化回路 |
CN1460249A (zh) * | 2001-04-05 | 2003-12-03 | 皇家菲利浦电子有限公司 | 采用针对确定信号类型的技术进行信号时标修改 |
CN101346760A (zh) * | 2005-10-26 | 2009-01-14 | 高通股份有限公司 | 用于音频编码的编码器辅助的帧丢失隐藏技术 |
Also Published As
Publication number | Publication date |
---|---|
US20120143614A1 (en) | 2012-06-07 |
JP2012118462A (ja) | 2012-06-21 |
JP5724338B2 (ja) | 2015-05-27 |
CN102486923A (zh) | 2012-06-06 |
US8626501B2 (en) | 2014-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100955361B1 (ko) | 적응 잔류 오디오 코딩 | |
US8311815B2 (en) | Method, apparatus, and program for encoding digital signal, and method, apparatus, and program for decoding digital signal | |
CN103380455B (zh) | 对音频信号的高效编码/解码 | |
US20060031075A1 (en) | Method and apparatus to recover a high frequency component of audio data | |
JP4925671B2 (ja) | デジタル信号の符号化/復号化方法及びその装置並びに記録媒体 | |
CN102171751B (zh) | 支持后降混信号的多对象音频编解码设备 | |
US20070078646A1 (en) | Method and apparatus to encode/decode audio signal | |
JP2006518873A5 (zh) | ||
SA516380280B1 (ar) | طريقة لفك تشفير تيار بتات | |
RU2654141C1 (ru) | Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования | |
CN104303229A (zh) | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的*** | |
US20140188488A1 (en) | Reduced Complexity Converter SNR Calculation | |
US9646615B2 (en) | Audio signal encoding employing interchannel and temporal redundancy reduction | |
CN102483923B (zh) | 音频编码中基于频带信号能量的频带比例因子确定 | |
US20160111100A1 (en) | Audio signal encoder | |
CN102486923B (zh) | 编码设备、编码方法、解码设备、解码方法 | |
US8000975B2 (en) | User adjustment of signal parameters of coded transient, sinusoidal and noise components of parametrically-coded audio before decoding | |
CN102394656B (zh) | 编码装置、编码方法、解码装置、解码方法 | |
JP2003110429A (ja) | 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体 | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
US20220335961A1 (en) | Audio signal encoding method and apparatus, and audio signal decoding method and apparatus | |
US20120123788A1 (en) | Coding method, decoding method, and device and program using the methods | |
CN102855876A (zh) | 音频编码器、音频编码方法和程序 | |
JP4603429B2 (ja) | クライアント・サーバ音声認識方法、サーバ計算機での音声認識方法、音声特徴量抽出・送信方法、これらの方法を用いたシステム、装置、プログラムおよび記録媒体 | |
JPH0451100A (ja) | 音声情報圧縮装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151021 Termination date: 20211125 |