CN1831940B - 基于音频解码器的音调和节奏调节方法 - Google Patents

基于音频解码器的音调和节奏调节方法 Download PDF

Info

Publication number
CN1831940B
CN1831940B CN2006100348829A CN200610034882A CN1831940B CN 1831940 B CN1831940 B CN 1831940B CN 2006100348829 A CN2006100348829 A CN 2006100348829A CN 200610034882 A CN200610034882 A CN 200610034882A CN 1831940 B CN1831940 B CN 1831940B
Authority
CN
China
Prior art keywords
tone
rhythm
pitch
expression
tempo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006100348829A
Other languages
English (en)
Other versions
CN1831940A (zh
Inventor
黄立新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Ankai Microelectronics Co.,Ltd.
Original Assignee
Anyka Guangzhou Microelectronics Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anyka Guangzhou Microelectronics Technology Co Ltd filed Critical Anyka Guangzhou Microelectronics Technology Co Ltd
Priority to CN2006100348829A priority Critical patent/CN1831940B/zh
Publication of CN1831940A publication Critical patent/CN1831940A/zh
Application granted granted Critical
Publication of CN1831940B publication Critical patent/CN1831940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种基于音频解码器的音调和节奏快速调节方法,音频信号先依次经音频解码器解码、反量化、频域处理,接着对频域处理后的信号进行音调调节,再接着依次经音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;最后时域处理后信号进行节奏调节输出。本发明利用音频解码器中已有的前处理模块,在转换前的频域信号进行音调调节,再利用了音频解码中的频域到时域的转换,通过改变输出速率,达到节奏的调节,这样既继承了采用频域调节实现音调改变效果好的优点,同时大大减少了原有音调和节奏调节方法中需要的大量运算,也避免了使用大量的内存缓冲样点数据,同时对音频解码器增加的运算量也很小。

Description

基于音频解码器的音调和节奏调节方法
技术领域
本发明涉及一种音调和节奏快速调节方法,尤其是涉及一种基于音频解码器的音调和节奏快速调节方法
背景技术
随着技术的发展和成本的下降,多媒体设备逐渐得到普及,在多媒体设备上播放音乐和语音就越来越流行。随着不同应用的普及,例如便携式学习机,音调和节奏调节就越来越成为多媒体设备中不可缺少的一项功能。其中音调的调节是在不改变总的播放时间的情况下,改变基音及其谐音的频率来实现;节奏的调节是在不改变音调的情况下,延长或者缩短总的播放时间来实现,音调和节奏的调节可以同时进行。
现有技术中,节奏调节采用时域相关的方法,该方法以帧为单位来改变时域的输出样点的数量。有选择的重复或者丢弃一些样点,在相邻帧之间的过渡部分采取寻找相关最大的一段和上一帧结束的一段做混叠。例如输入N个样点为一帧,如果是节奏变快一倍,经过这个算法的处理,则输出N/2个样点。节奏变慢的方法类似。该方法处理过程中需要占用大量的内存做缓冲,同时由于寻找相关系数最大的样点需要做大量的累乘加操作,运算量较大。
对音调的改变采用频域调节的方法如图1所示,该方法的核心是把时域信号转换成频域信号,对频域信号进行音调搬移(Pitch Shifting)之后,再转换成时域信号。这种通过频域调节的方法,处理过程中需要做一次离散傅立叶变换和一次离散傅立叶反变换,需要的运算量很大。因此,如果用在用在多媒体的音频解码器中,目前常用的这些方法要对输出的音频信号进行音调和节奏的调节时,都要做为一个独立的后处理模块来进行处理,则没有充分利用音频解码器中现有的模块,多媒体中常有的音频解码器的信号处理流程如图2所示,其中有时域到频域的转换处理过程。
发明内容
本发明的目的在于提供一种具有运算量小,占用内存少的音调和节奏的快速调节方法。
上述发明目的可通过以下的技术措施来实现:一种基于音频解码器的音调和节奏快速调节方法,音频信号先依次经音频解码器解码、反量化、频域处理,接着对频域处理后的信号进行音调调节,再接着依次经音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;最后时域处理后信号进行节奏调节输出;所述的音调调节的具体过程为:
(1)对频域处理后的信号先进行频谱分析,根据编码时采用的时频转换方法,得到加窗的类型信息,然后把频谱反加窗处理,使得到的频谱系数更接近真实的频谱;
(2)再进行音调搬移,音调搬移是指在原来的基础上主音偏移的大小;音调搬移过程中音调搬移的大小和方向由用户事先设置所需要的音调和节奏两个参数来决定,节奏是指播放的快慢,最终音调搬移的幅度按下式得出:
Pitch_New=Pitch_fs×(1-Tempo)+Pitch
其中Pitch表示设定音调需要调节的幅度,大于0表示音调增高,小于0表示音调降低;Pitch_fs表示输入样点中最高的音调值;Tempo表示设定的节奏,大于1表示变快,小于1表示变慢;Pitch_New表示最终音调搬移的幅度;
根据得出的Pitch_New,进行音调搬移,如果大于0,则表示提高频谱,如果小于0则表示降低频谱;
(3)进行频谱综合,根据频域到时域转换的方法,把搬移后的频谱做调整,进行加窗处理。
本发明所述的节奏调节的具体过程为:根据设定的节奏来改变数模转换(DA)的输出速率。数模转换的输出速率同节奏快慢成正比,节奏变快,数模转换输出速率加大;节奏变慢,数模转换输出速率减小。调节后的输出速率按下式得出:
SR_New=SR×Tempo;
其中SR是原来的DA输出速率,Tempo表示设定节奏,大于1表示变快,小于1表示变慢,SR_New表示调整后的输出速率。
本发明利用音频解码器中已有的前处理模块,在转换前的频域信号进行音调调节,再利用了音频解码中的频域到时域的转换,通过改变输出速率,达到节奏的调节,这样既继承了采用频域调节实现音调改变效果好的优点,同时大大减少了原有音调和节奏调节方法中需要的大量运算,也避免了使用大量的内存缓冲样点数据,同时对音频解码器增加的运算量也很小。
附图说明
图1为现有技术采用频域调节实现音调改变的流程图;
图2为现有的音频解码器的信号处理流程图;
图3为本发明的信号处理流程图。
具体实施方式
如图3所示,本发明具体实施步骤如下:
(1)音频信号先依次经音频解码器解码、反量化、频域处理,例如MP3解码流程中,首先进行Huffman(霍夫曼)解码,得到量化后的频谱系数,然后把量化后的频谱系数进行反量化处理,最后做一些频域处理,例如联合立体声的处理。
(2)对频域处理后的信号先进行频谱分析,根据编码时采用的时频转换方法,得到加窗的类型等信息,然后把频谱反加窗处理,使得到的频谱系数更接近真实的频谱。
(3)再进行音调搬移,音调搬移是指在原来的基础上主音偏移的大小。音调搬移过程中音调搬移的大小和方向由用户事先设置所需要的音调和节奏两个参数来决定,节奏是指播放的快慢,最终音调搬移的幅度按下式得出:
Pitch_New=Pitch_fs×(1-Tempo)+Pitch
其中Pitch表示设定音调需要调节的幅度,大于0表示音调增高,小于0表示音调降低;Pitch_fs表示输入样点中最高的音调值;Tempo表示设定的节奏,大于1表示变快,小于1表示变慢;Pitch_New表示最终音调搬移的幅度。
根据得出的Pitch_New,进行音调搬移,如果大于0,则表示提高频谱,如果小于0则表示降低频谱。
(4)进行频谱综合,根据频域到时域转换的方法,把搬移后的频谱做调整,进行加窗处理。
(5)频谱综合后利用音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;例如在MP3解码器中,做MDCT(离散余弦变换)和滤波器组综合。
(6)时域处理后信号进行节奏调节输出。节奏调节的具体过程为:根据用户事先设置的节奏来改变数模转换(DA)的输出速率。DA的输出速率同节奏快慢成正比,节奏变快,DA输出速率加大;节奏变慢,DA输出速率减小。调节后的输出速率按下式得出:
SR_New=SR×Tempo;
其中SR是原来的DA输出速率,Tempo表示节奏,大于1表示变快,小于1表示变慢,SR_New表示调整后的输出速率。

Claims (2)

1.一种基于音频解码器的音调和节奏调节方法,其特征在于:音频信号先依次经音频解码器解码、反量化、频域处理,接着对频域处理后的信号进行音调调节,再接着依次经音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;最后时域处理后信号进行节奏调节输出;所述的音调调节的具体过程为:
(a)对频域处理后的信号先进行频谱分析,根据编码时采用的时频转换方法,得到加窗的类型信息,然后把频谱反加窗处理,使得到的频谱系数更接近真实的频谱;
(b)再进行音调搬移,音调搬移是指在原来的基础上主音偏移的大小;音调搬移过程中音调搬移的大小和方向由用户事先设置所需要的音调和节奏两个参数来决定,节奏是指播放的快慢,最终音调搬移的幅度按下式得出:
Pitch_New=Pitch_fs×(1-Tempo)+Pitch
其中Pitch表示设定音调需要调节的幅度,大于0表示音调增高,小于0表示音调降低;Pitch_fs表示输入样点中最高的音调值;Tempo表示设定的节奏,大于1表示变快,小于1表示变慢;Pitch_New表示最终音调搬移的幅度;
根据得出的Pitch_New,进行音调搬移,如果大于0,则表示提高频谱,如果小于0则表示降低频谱;
(c)进行频谱综合,根据频域到时域转换的方法,把搬移后的频谱做调整,进行加窗处理。
2.根据权利要求1所述的音调和节奏调节方法,其特征在于:所述的节奏调节的具体过程为:根据设定的节奏来改变数模转换的输出速率;数模转换的输出速率同节奏快慢成正比,节奏变快,数模转换输出速率加大;节奏变慢,数模转换输出速率减小;调节后的输出速率按下式得出:
SR_New=SR×Tempo;
其中SR是原来的数模转换输出速率,Tempo表示设定节奏,大于1表示变快,小于1表示变慢,SR_New表示调整后的输出速率。
CN2006100348829A 2006-04-07 2006-04-07 基于音频解码器的音调和节奏调节方法 Active CN1831940B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006100348829A CN1831940B (zh) 2006-04-07 2006-04-07 基于音频解码器的音调和节奏调节方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100348829A CN1831940B (zh) 2006-04-07 2006-04-07 基于音频解码器的音调和节奏调节方法

Publications (2)

Publication Number Publication Date
CN1831940A CN1831940A (zh) 2006-09-13
CN1831940B true CN1831940B (zh) 2010-06-23

Family

ID=36994198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100348829A Active CN1831940B (zh) 2006-04-07 2006-04-07 基于音频解码器的音调和节奏调节方法

Country Status (1)

Country Link
CN (1) CN1831940B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108269579A (zh) * 2018-01-18 2018-07-10 厦门美图之家科技有限公司 语音数据处理方法、装置、电子设备及可读存储介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101165772B (zh) * 2006-10-18 2011-06-08 安凯(广州)微电子技术有限公司 一种扩展合成器音色的方法
CN102208901B (zh) * 2010-03-31 2014-04-23 安凯(广州)微电子技术有限公司 一种mp3解码过程中实现均衡器的方法
CN103354091B (zh) * 2013-06-19 2015-09-30 北京百度网讯科技有限公司 基于频域变换的音频特征提取方法及装置
CN104510492A (zh) * 2013-10-06 2015-04-15 吴伟 不可听信号的听诊方法及装置
CN103714824B (zh) * 2013-12-12 2017-06-16 小米科技有限责任公司 一种音频处理方法、装置及终端设备
CN113192523A (zh) * 2020-01-13 2021-07-30 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN113808596A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3895555A (en) * 1973-10-03 1975-07-22 Richard H Peterson Teaching instrument for keyboard music instruction
JP3153669B2 (ja) * 1993-03-25 2001-04-09 富士写真フイルム株式会社 画像再生システム
CN1440144A (zh) * 1993-06-30 2003-09-03 索尼公司 数字信号的编码装置、解码装置及编码方法和解码方法
CN1496556A (zh) * 2001-03-07 2004-05-12 日本电气株式会社 声音编码设备和方法以及声音解码设备和方法
CN1524348A (zh) * 2002-05-07 2004-08-25 ������������ʽ���� 编码方法和装置以及解码方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3895555A (en) * 1973-10-03 1975-07-22 Richard H Peterson Teaching instrument for keyboard music instruction
JP3153669B2 (ja) * 1993-03-25 2001-04-09 富士写真フイルム株式会社 画像再生システム
CN1440144A (zh) * 1993-06-30 2003-09-03 索尼公司 数字信号的编码装置、解码装置及编码方法和解码方法
CN1496556A (zh) * 2001-03-07 2004-05-12 日本电气株式会社 声音编码设备和方法以及声音解码设备和方法
CN1524348A (zh) * 2002-05-07 2004-08-25 ������������ʽ���� 编码方法和装置以及解码方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张银华.数字音频宽带和宽动态范围的录音和重放.电声技术 2.1996,(2),16-24.
张银华.数字音频宽带和宽动态范围的录音和重放.电声技术 2.1996,(2),16-24. *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108269579A (zh) * 2018-01-18 2018-07-10 厦门美图之家科技有限公司 语音数据处理方法、装置、电子设备及可读存储介质
CN108269579B (zh) * 2018-01-18 2020-11-10 厦门美图之家科技有限公司 语音数据处理方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN1831940A (zh) 2006-09-13

Similar Documents

Publication Publication Date Title
CN1831940B (zh) 基于音频解码器的音调和节奏调节方法
CN102881294B (zh) 操纵具有瞬变事件的音频信号的方法和设备
KR102125410B1 (ko) 타깃 시간 도메인 포락선을 사용하여 처리된 오디오 신호를 얻도록 오디오 신호를 처리하기 위한 장치 및 방법
Verma et al. Extending spectral modeling synthesis with transient modeling synthesis
CN102089812B (zh) 用以使用混叠切换方案将音频信号编码/解码的装置与方法
RU2641224C2 (ru) Адаптивное расширение полосы пропускания и устройство для этого
CN101903945B (zh) 编码装置、解码装置以及编码方法
JP5283757B2 (ja) オーディオ信号のスペクトルの複数の局部重心周波数を決定するための装置及び方法
CN104378075B (zh) 频域中的音频信号响度确定和修改
CN105706166B (zh) 对比特流进行解码的音频解码器设备和方法
WO2017143095A1 (en) Real-time adaptive audio source separation
US20050065784A1 (en) Modification of acoustic signals using sinusoidal analysis and synthesis
Schwarz et al. Spectral envelope estimation, representation, and morphing for sound analysis, transformation, and synthesis.
CN102915739A (zh) 用于对高频信号进行编码和解码的方法和设备
CN101894559B (zh) 音频处理方法及其装置
CN104718572A (zh) 音频编码方法和装置、音频解码方法和装置及采用该方法和装置的多媒体装置
EP1422693A1 (en) PITCH WAVEFORM SIGNAL GENERATION APPARATUS, PITCH WAVEFORM SIGNAL GENERATION METHOD, AND PROGRAM
JP6821970B2 (ja) 音声合成装置および音声合成方法
CN102598123A (zh) 编码装置、解码装置及其方法
CN108806721A (zh) 信号处理器
WO2012006942A1 (zh) 一种音频数据的编码方法及装置
US20060271374A1 (en) Method for compression and expansion of digital audio data
CN112908351A (zh) 一种音频变调方法、装置、设备及存储介质
JP4822816B2 (ja) オーディオ信号符号化装置および方法
Nercessian et al. Real-time singing voice conversion plug-in

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 510663 301-303, 401-402, zone C1, 182 science Avenue, Science City, Guangzhou high tech Industrial Development Zone, Guangdong Province

Patentee after: Guangzhou Ankai Microelectronics Co.,Ltd.

Address before: 510663 301-303, 401-402, zone C1, 182 science Avenue, Science City, Guangzhou high tech Industrial Development Zone, Guangdong Province

Patentee before: ANYKA (GUANGZHOU) MICROELECTRONICS TECHNOLOGY Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP02 Change in the address of a patent holder

Address after: 510555 No. 107 Bowen Road, Huangpu District, Guangzhou, Guangdong

Patentee after: Guangzhou Ankai Microelectronics Co.,Ltd.

Address before: 510663 301-303, 401-402, zone C1, 182 science Avenue, Science City, Guangzhou high tech Industrial Development Zone, Guangdong Province

Patentee before: Guangzhou Ankai Microelectronics Co.,Ltd.

CP02 Change in the address of a patent holder