CN1271594C - 基于频谱分析的音调确定方法和装置 - Google Patents

基于频谱分析的音调确定方法和装置 Download PDF

Info

Publication number
CN1271594C
CN1271594C CNB028154789A CN02815478A CN1271594C CN 1271594 C CN1271594 C CN 1271594C CN B028154789 A CNB028154789 A CN B028154789A CN 02815478 A CN02815478 A CN 02815478A CN 1271594 C CN1271594 C CN 1271594C
Authority
CN
China
Prior art keywords
tone
frequency
peak
candidate
peak value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB028154789A
Other languages
English (en)
Other versions
CN1539136A (zh
Inventor
郑道日
徐宪瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amusetec Co Ltd
Original Assignee
Amusetec Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amusetec Co Ltd filed Critical Amusetec Co Ltd
Publication of CN1539136A publication Critical patent/CN1539136A/zh
Application granted granted Critical
Publication of CN1271594C publication Critical patent/CN1271594C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

一种采用频率分析来检测音调的方法和装置。以预定时间间隔将外部输入的数字信号分析为频率成分值,并根据频率成分值检测数字信号的峰值的位置。确定峰值位置中最大峰值位置的频率是音调还是该音调的n阶谐波频率以便检测音调。然后,根据检测的音调的谐波频率的范围确定音调的范围。因此,减小了采用频率分析检测音调的误差范围,从而当采用频率分析检测音调时更准确地检测音调。

Description

基于频谱分析的音调确定方法和装置
技术领域
本发明涉及一种音调确定方法和装置,尤其涉及一种用于采用通过频率分析获得的最大峰值频率来检测音调和根据该音调的谐波频率之一的范围来确定音调的频率范围的音调检测方法和装置。
背景技术
为了根据乐器的演奏声音或人的声音抽取演奏信息数据或者为了在音乐会上现场演奏,已经研发出了检测现场演奏的声音的音调(音调频率)或者人的声音的音调(音调频率)的技术。
通常用来检测音调的方法包括分析演奏声音或人的声音的数字信号的频率的频率分析方法、计算波形的峰值或零交叉周期以便计算波的周期并分析计算结果的周期计算方法、和分析波形的自相关的自相关方法。
在这些音调检测方法中,在频率分析方法中,在预定的时间间隔分析数字信号。以取决于预定时间间隔的预定误差范围来确定音调。
例如,在用于频率分析方法的FFT(快速傅里叶变换)的情况下,将在每一个预定时间间隔(以下称作指数(index))期间所输入的数字信号转换成频率。当采样速率和FFT窗尺寸固定时,频率的误差范围由指数的范围确定。将参考下述公式来描述该运算。
当FFT的采样速率是22050Hz和FFT窗尺寸是1024时,通过FFT检测的频率以公式(1)来表示。
这里,实际频率范围FR根据公式(2)来确定。
因此,作为在钢琴上调音时对音符C3执行FFT分析的结果,当对于基频的峰值指数是7时,如果将指数7和上述条件(采样速率和FFT窗尺寸)应用到公式(1)和(2),分别通过公式(3)和(4)计算对于指数7,即第7阶频率,的频率转换结果和实际频率范围。
公式(3)用于频率转换结果的计算,公式(4)用于频率转换结果的误差范围的计算。
FFT ( F ) = 22050 1024 × 7 + ( 7 - 1 ) 2
= 22050 1024 × 6.5
= 139.96 ( Hz ) - - - ( 3 )
FR FFT = 22050 1024 × ( 7 - 1 ) ~ 22050 1024 × 7
= 129.19 ~ 150.73 - - - ( 4 )
也就是说,在上述条件下通过在钢琴的音符C3上执行FFT时检测到的频率是139.96Hz,并且该频率的实际频率范围是(129.19~150.73)Hz。因此,检测到的频率有大约21.53Hz(150.73-129.19=21.53)的误差范围。
因此,当采用FFT来检测乐器的声音的音调时,在音符间的频率间隔等于或大于21.53Hz的高频段音调检测误差小,但是在音符间的频率间隔小于21.53Hz的低频段音调检测误差大。
发明内容
为了解决上述问题,本发明的第一目的是提供一种检测音调的方法和装置,用于确定采用频率分析得到的最大峰值频率是音调还是该音调的n阶谐波频率,并根据确定结果检测音调,从而减小音调检测误差。
本发明的第二目的是提供一种用于根据在音调的谐波频率中对音调保持有预定间隔的谐波频率的范围确定音调的频率范围的音调检测方法和装置。
为了达到本发明的第一目的,提供了一种采用频率分析检测音调的方法。该方法包括:第一步骤,以预定时间间隔将外部输入的数字信号分析为频率成分值,并根据频率成分值检测数字信号的峰值的位置;和第二步骤,从检测到的峰值位置中选择最大峰值位置、确定最大峰值位置的频率是音调还是该音调的n阶谐波频率,并根据确定的结果检测音调。最好,第二步骤还包括:(2-1)将在检测到的峰值位置中的最大峰值位置的频率确定为音调候选者;(2-2)将频率分析起始点和音调候选者的位置之间的音调候选者距离“d”除以“n”以便计算峰值检测间隔d/n,并确定在频率分析起始点和音调候选者的位置之间的频谱中在峰值检测间隔d/n处是否存在峰值,其中,“n”是用于确定音调候选者是否是n阶谐波频率的音调候选者性质确定系数,并且将在预定范围内的质数或自然数按顺序应用于“n”;(2-3)如果确定在峰值检测间隔d/n处峰值存在,将音调候选者确定为由音调候选者距离“d”除以“n”得到的位置P处的峰值P_Peak的n阶谐波频率;(2-4)将位置P处的峰值P_Peak设置为新的音调候选者并重复步骤(2-2)和(2-3);和(2-5)如果确定在峰值检测间隔d/n处峰值不存在,将音调候选者确定为音调。
也提供了一种采用频率分析来检测音调的装置。该装置包括:频率分析器,以预定时间间隔将外部输入的数字信号分析为频率成分值,并根据频率成分值检测数字信号的峰值的位置;音调确定器,选择由频率分析器检测到的峰值位置中的最大峰值位置作为音调候选者,确定音调候选者是音调还是该音调的n阶谐波频率,并且当将最大峰值位置的频率确定为n阶谐波频率时,将由频率分析起始位置和最大峰值位置之间的距离除以n而得到的位置处的频率确定为音调;和结果输出单元,输出由音调确定器确定的音调。
为了达到本发明的第二目的,提供了一种采用频率来分析检测音调的方法。该方法包括:第一步骤,以预定时间间隔将外部输入的数字信号分析为频率成分值,并根据该频率成分值确定音调,和第二步骤,检测确定的音调的谐波频率的位置,并根据谐波频率的范围确定音调的范围。最好,第二步骤包括:计算在第一步骤确定的音调的频率范围F1;通过将在对于音调能检测到的谐波频率中定位在音调的第h个位置的谐波频率的范围除以“h”来计算值F2;和将频率范围F1和值F2的交集确定为音调的范围;其中音调确定器:执行过程步骤1:将频率分析起始点和音调候选者的位置之间的音调候选者距离“d”除以“n”以便计算峰值检测间隔d/n,并确定在频率分析起始点和音调候选者的位置之间的频谱中在峰值检测间隔d/n处是否存在峰值,以及如果确定在峰值检测间隔d/n处峰值存在,将由距离“d”除以“n”得到的位置P处的峰值P_Peak确定为新的音调候选者,其中,“n”是用于确定音调候选者是否是n阶谐波频率的音调候选者性质确定系数,并且将在预定范围内的质数或自然数按顺序应用于“n”;当从频率分析起始点到音调候选者在峰值检测间隔d/n处存在峰值时重复过程步骤1;以及如果确定在峰值检测间隔d/n处峰值不存在,将音调候选者确定为音调。
也提供了一种采用频率分析来检测音调的装置。该装置包括:频率分析器,以预定时间间隔将外部输入的数字信号分析为频率成分值,并根据频率成分值检测数字信号的峰值的位置;音调确定器,选择由频率分析器检测到的峰值位置中的最大峰值位置,确定最大峰值位置的频率是音调还是该音调的n阶谐波频率,并且根据确定的结果检测音调;音调范围确定器,检测由音调确定器确定的音调的谐波频率的位置,并根据谐波频率的范围确定音调的范围;和结果输出单元,输出由音调确定器确定的音调。
附图说明
图1是根据本发明的实施例的音调检测装置的示意方框图。
图2是根据本发明的实施例的音调检测方法的流程图。
图2A是根据本发明的实施例的确定音调的方法的流程图。
图2B是根据本发明的实施例的确定音调范围的方法的流程图。
图3是根据本发明表示计算音调范围的结果的图表,以便解释用于确定音调范围的步骤。
图4A到4C是根据本发明的实施例用来解释检测音调的步骤的示例性波形和频谱图。
具体实施方式
以下将参考附图详细描述根据本发明音调检测方法和装置的实施例。
图1是根据本发明的实施例的音调检测装置的示意方框图。参考图1,根据本发明的实施例的音调检测装置包括音乐信息输入单元100、音调存在/不存在确定器200、频率分析器300、音调确定器400、音调范围确定器500和结果输出单元600。
音乐信息输入单元100通过话筒将模拟信号输入转换为数字信号或接收通过转换产生的数字信号。
音调存在/不存在确定器200感知通过音乐信息输入单元100接收的信号的声压电平(sound pressure level)以便确定音调是否存在。换句话说,当通过音乐信息输入单元100接收的信号的声压电平高于考虑到周围环境而预先确定的噪音的声压电平时,认为输入了音乐声音信号。
频率分析器300将通过音调存在/不存在确定器200输入的声音的数字信号分析为在预定时间间隔的频率成分值,并采用频率成分值检测频谱的峰值位置。峰值位置表示峰值频率的位置。同时,为了将声音的数字信号分析为频率成分,通常采用快速傅里叶变换(FFT),但是也可以采用例如小波变换等其它方法。
音调确定器400从通过频率分析器300检测的峰值位置中选择最大峰值位置作为音调候选者。最大峰值位置表示最大峰值频率的位置。此外,音调确定器400确定音调候选者的频率是音调还是音调的第n阶谐波频率。当将最大峰值位置的频率确定为n阶谐波频率时,音调确定器400将在通过频率分析起始点和最大峰值位置之间的距离除以“n”而得到的位置的频率确定为音调。
为了确定音调候选者是否是第n阶谐波频率,音调确定器400将频率分析起始点和音调候选者的位置之间的距离除以“n”来计算峰值检测音调d/n。其后,音调确定器400检查频谱以便找出在频率分析起始点和音调候选者的位置之间的频谱中在峰值检测间隔d/n处峰值是否存在。如果在峰值检测间隔d/n峰值存在,那么音调确定器400执行步骤1:把在由距离“d”除以“n”而得到的位置P处的峰值P Peak设置为新的音调候选者。
音调确定器400重复步骤1直到在频率分析起始点和音调候选者的位置之间的频谱中在峰值检测间隔d/n处不存在峰值。当在频率分析起始点和音调候选者的位置之间的频谱中在峰值检测间隔d/n处不存在峰值时,将当前的音调候选者确定为音调。这里,“n”是用于确定音调候选者是否是n阶谐波频率的“音调候选者性质确定系数”。最好,将预定范围内的质数(2,3,5,7,11,13,...)顺次应用于“n”。显然,“n”不局限于预定范围内的质数,也可以将等于或大于2的自然数应用于“n”。
音调范围确定器500检测由音调确定器400确定的音调的谐波频率的位置,并根据谐波频率的范围确定音调的范围。换句话说,音调范围确定器500计算由音调确定器400确定的音调的频率范围F1;通过将在对于音调能检测到的谐波频率中定位在音调的第h个位置的谐波频率的范围除以“h”来计算值F2;和确定频率范围F1和值F2之间的交集作为音调范围。这里“h”是用于选择确定音调范围的谐波频率的“谐波频率检测系数”。“h”是等于或大于2的自然数。
结果输出单元600输出最终确定的音调。
图2是根据本发明的实施例的音调检测方法的流程图。参考图2,当数字信号在步骤S100从外部输入时,在步骤S200执行频率分析以便检测数字信号的峰值位置。图4A表示从外部输入的数字信号的波形,图4B和4C表示对数字信号执行频率分析的结果。图4B表示峰值和其频率位置,和图4C表示峰值和其FFT指数位置。因此,采用该波形图能检测峰值的位置。
在步骤S300中参考峰值所示的频谱来确定音调。换句话说,检测最大峰值位置,然后根据确定最大峰值频率是音调还音调的第n阶谐波频率的结果来确定音调。
如果音调确定了,那么在步骤S400确定音调的频率范围。使用音调的谐波频率通过减小音调的频率范围来确定音调的频率范围。最终确定的音调在步骤S500中显示。
图2A是确定音调的步骤S300的流程图。参考图2A,在步骤S310中将在步骤S100检测的峰值位置中的最大峰值位置的频率确定为音调候选者。
接下来,将频率分析起始点和音调候选者的位置之间的距离“d”除以“n”以便计算峰值检测间隔d/n。其后,检查频谱以找出在频率分析起始点和音调候选者的位置之间的频谱中在峰值检测间隔d/n处是否存在峰值。如果在峰值检测间隔d/n处峰值存在,也就是说,如果在由音调候选者距离“d”除以“n”而得到的位置P处存在峰值P_Peak时,将当前音调候选者确定为峰值P_Peak的n阶谐波频率。这里,“n”是用于确定音调候选者是否是n阶谐波频率的“音调候选者性质确定系数”。最好,将预定范围内的质数或自然数顺次应用于“n”。
以下假设将在预定范围内的素数应用于“n”。
首先,在步骤S320将音调候选者性质确定系数(以下称作“n”)设定为2。将在频率分析起始点和音调候选者的位置之间的音调候选者距离“d”除以2以便计算峰值检测间隔d/2。然后,在步骤S330检查在频率分析起始点和音调候选者的位置之间的频谱中在峰值检测间隔d/2处是否存在峰值。换句话说,检查在音调候选者距离“d”的1/2的位置P处是否存在峰值。
如果在位置P峰值存在,那么在步骤S340将音调候选者确定为位置P处的峰值P_Peak的二阶谐波频率,并将位置P处的峰值P_Peak设定为新的音调候选者。其后,重复步骤S320和S330。
如果在由音调候选者距离“d”除以2而的得到的位置P处不存在峰值,那么在步骤S360将“n”从2改变成下一个质数3。然后,重复步骤S330和S340。更具体的讲,将频率分析起始点和音调候选者的位置之间的音调候选者距离“d”除以3以便计算峰值检测间隔d/3,然后在步骤S330检查在频率分析起始点和音调候选者的位置之间的频谱中在峰值检测间隔d/3是否存在峰值。换句话说,检查在音调候选者距离“d”的1/3的位置P1处是否存在峰值和在音调候选者距离“d”的2/3的位置P2处是否存在峰值。
重复步骤S330和S340直到将在预定范围内的所有的质数应用于“n”。例如,将“n”设置在{2,3,5}范围内,在“n”从2改变到3和到5时重复步骤S330和S340。
如果在步骤S350对于在预定范围内的所有的质数确定在频率分析起始点和音调候选者的位置之间的频谱在峰值检测间隔d/n处不存在峰值,那么在步骤S370将音调候选者确定为音调。
作为选择,可以将预定范围内的自然数应用于“n”。例如,可以在“n”从2改变到3、到4、和到5时重复步骤S330和S340。
图2B是确定音调范围的步骤S400的流程图。为了根据本发明的实施例确定音调范围,计算音调的频率范围F1,然后将当前音调的频率范围F1和值F2之间的交集确定为音调范围。值F2是通过在当前音调的能检测到的谐波频率中定位在当前音调的第h个位置的谐波频率的范围除以“h”而获得的;
参考图2B,在步骤S410将当前确定的音调的频率范围设定为音调的频率范围F1。在步骤S420将用于选择确定音调范围的谐波频率的谐波频率检测系数(以下称作“h”)设置为2。
当在步骤S430确定存在当前音调的二阶谐波频率时,在步骤S440将二阶谐波频率范围除以2而得到的值确定为音调范围候选者F2。接下来,在步骤S450和S460将在音调范围候选者F2和预先确定的音调范围F1的交集设置为新的音调候选者F1
在步骤S470“h”增加1后,重复步骤S430到S460。
更具体地讲,在步骤S470把“h”设置为3后,如果在步骤S430确定当前音调的三阶谐波频率存在,那么在步骤S440将由3阶谐波频率的范围除以3而得到的值确定为新的音调范围候选者F2。然后,在步骤S450和S460将新的音调范围候选者F2和预先确定的音调范围F1之间的交集设定为新的音调候选者F1
这里,如果在音调范围候选者F2和预先确定的音调范围F1之间没有交集,那么在步骤S480将预先确定的音调范围F1确定并输出为音调的频率范围。
同时,如果在步骤S430未检测到当前音调的第h阶谐波频率或者第h阶谐波频率的幅度小于预定值,那么在步骤S480将当前音调范围F1确定并输出为音调的频率范围。
为了更具体的解释上述步骤,将在假设FFT窗尺寸是2048、采样速率是22050Hz和如图4C所示的FFT的结果的基础上描述音调检测方法。
参考图4C,作为FFT的结果,出现多个峰值和位置,也就是,从图的左侧开始峰值的FFT指数(以下称作峰值FFT指数)是13、25、37、49、62、74、86、98、110、123、135、147、160、173、……。
具有最大峰值的最大峰处于FFT指数是37的位置。
同时,公式(5)算术上表示了一种采用FFT指数确定频率范围的方法。如果将FFT指数37应用到公式(5),那么由公式(6)计算频率范围。
Figure C0281547800121
Figure C0281547800122
也就是说,当FFT指数是37时,音调候选者的频率范围是(387.59~398.36)Hz。
在如上所述确定音调候选者之后,通过检查在由音调候选者除以“n”而得到的位置是否存在峰值来确定音调候选者是否是n阶谐波频率。这里,最好按顺序将2,3,5,…应用于“n”。换句话说,最好按顺序将预定范围内的质数应用于“n”。但是,“n”不局限于预定范围内的指数。显然也可以将预定范围内的自然数应用于“n”。
根据公式(7)采用“n”计算FFT指数。当“n”是2时,根据公式(8)计算FFT指数。
Figure C0281547800124
当“n”是2时,代入公式(8),当音调候选者除以“n”时,FFT指数是18~18.5。代入峰值FFT指数13、25、37、49、62、74、86、98、110、123、135、147、160、173、…,能推出在根据公式(8)计算的位置不存在峰值。
当“n”是3时,根据公式(9)计算FFT指数。
Figure C0281547800131
当“n”是3时,代入公式(9),得到两个FFT指数12~12.33和24~24.66。如果12.33向上舍入到第一十进制位,变为13,如果24.66向上舍入到第一十进制位,变为25。因此,代入峰值FFT指数13、25、37、49、62、74、86、98、110、123、135、147、160、173、…,能推出当n=3时,在位置13即在频率分析起始点到音调候选者之间的距离37的1/3处和位置25即在频率分析起始点到音调候选者之间的距离37的2/3处存在峰值。
因此,可以推出在FFT指数37处的频率是在FFT指数13处的频率的三阶谐波频率。根据本发明,在图4C所示的结果中,通过把使用公式(9)而得到的FFT指数12~12.33应用于公式(5)而获得的音调是129.19~132.78Hz。音调通过公式(10)和(11)计算。
这里,音调的误差范围大约是3.59Hz。
采用本发明的音调范围确定方法可以减少误差范围。能从当前确定的音调检测到的谐波频率信息(即,在FFT指数13的频率)可以从峰值FFT指数13、25、37、49、62、74、86、98、110、123、135、147、160、173、…获得。当谐波频率检测系数“h”是12时,第12阶谐波频率是当FFT指数是147时的频率。
因此,根据公式(5)计算FFT指数频率范围的结果由公式(11)表示。
Figure C0281547800141
即,音调的第12阶谐波频率的范围是1571.9238~1582.6904Hz。因此,通过由谐波频率除以12而得到的音调的频率范围如公式(12)所示。
由公式(12)所获得的频率范围是在由公式(10)得到的初始音调范围129.19~132.78内,并具有显然小于由公式(10)得到的初始音调范围的大约为3.5Hz的误差范围的0.8972Hz的误差范围。因此,根据本发明当检测音调时能更准确地检测频率范围。
如果由公式(12)得到的频率范围是130.9937~133.0Hz,那么最终的音调范围是130.9937~132.78Hz,即,在频率范围130.9937~133.0Hz和初始音调范围129.19~132.78Hz之间的交集。
图3示出了根据本发明计算频率范围的结果的图表,以便解释用于确定音调范围的步骤。图3表示峰值FFT指数31、根据峰值FFT指数的频率范围32、由频率范围32的第h阶谐波频率范围除以“h”计算出的频率范围33和当前频率范围33和前一个最终频率范围34之间的交集的最终音调范围34。图3所示的值与图4C所示的峰值有关。这里,当谐波率检测系数“h”是2时由当谐波频率检测系数“h”是1时得到的最终音调范围129.1992~139.9658和当谐波频率检测系数“h”是2时采用二阶谐波频率范围得到的频率范围129.1992~134.5825的交集来确定最终音调范围129.1992~134.5825(图3的阴影部分)。对于三阶和下一阶谐波频率的最终音调范围是以与确定二阶谐波频率的最终音调范围相同的方式来确定。但是,当谐波频率检测系数“h”是“13”时,当谐波频率检测系数“h”是12时得到的最终音调范围131.3525~131.5918和采用13阶谐波频率范围而得到的频率范围131.6838~132.5120之间没有交集。因此,当谐波频率检测系数“h”是13或更大时不能计算出最终音调范围。因此,将当谐波频率检测系数“h”是12时得到的最终音调范围131.3525~131.5918输出作为检测音调的结果。
以上仅仅描述了本发明的实施例。本发明不局限于上述实施例,可以在所附权利要求所定义的范围内作各种改变。例如,可以改变实施例中指定的每一元件的形状和结构。尽管在上述实施例中将音调候选者性质确定系数设置为质数,本领域技术人员能够得知也可以将音调候选者性质确定系数设置为自然数。
工业实用性
根据本发明的音调检测方法和装置,可以确定通过频率分析得到的最大峰值频率是音调还是音调的n阶谐波频率,然后根据确定的结果检测音调,以便当无条件检测到最大峰值频率作为音调时出现的音调检测误差最小。
此外,在本发明中,根据在检测到的谐波频率中对音调候选者保持预定的间隔的谐波频率的范围来确定音调的频率范围,以便减小音调的误差范围。因此,提高了音调检测的可靠性。

Claims (4)

1.一种采用频率分析来检测音调的方法,包括:
第一步骤,以预定时间间隔将外部输入的数字信号分析为频率成分值,并根据频率成分值检测数字信号的峰值的位置;以及
第二步骤,选择检测到的峰值位置中的最大峰值位置,确定最大峰值位置的频率是音调还是该音调的n阶谐波频率,并根据确定的结果检测音调;
其中第二步骤包括以下步骤:
(2-1)将在检测到的峰值位置中的最大峰值位置的频率确定为音调候选者;
(2-2)将频率分析起始点和音调候选者的位置之间的音调候选者距离“d”除以“n”以便计算峰值检测间隔d/n,并确定在频率分析起始点和音调候选者的位置之间的频谱中在峰值检测间隔d/n处是否存在峰值,其中,“n”是用于确定音调候选者是否是n阶谐波频率的音调候选者性质确定系数,并且将在预定范围内的质数或自然数按顺序应用于“n”;
(2-3)如果确定在峰值检测间隔d/n处峰值存在,将音调候选者确定为由音调候选者距离“d”除以“n”得到的位置P处的峰值P_Peak的n阶谐波频率;
(2-4)将位置P处的峰值P_Peak设置为新的音调候选者并重复步骤(2-2)和(2-3);以及
(2-5)如果确定在峰值检测间隔d/n处峰值不存在,将音调候选者确定为音调。
2.根据权利要求1所述的方法,还包括:
计算在第二步骤确定的音调的频率范围F1
通过将在对于该音调能检测到的谐波频率中定位在从该音调算起的第h个位置处的谐波频率的范围除以“h”来计算音调范围候选者F2,其中“h”是用于选择确定音调范围的谐波频率的谐波频率检测系数,并且“h”是等于或大于2的自然数;以及
将频率范围F1和音调范围候选者F2的交集确定为音调的范围。
3.一种用于采用频率分析来检测音调的装置,包括:
频率分析器,以预定时间间隔将外部输入的数字信号分析为频率成分,并根据频率成分值检测数字信号的峰值的位置;
音调确定器,选择通过频率分析器检测到的峰值位置中的最大峰值位置作为音调候选者,确定音调候选者是音调还是该音调的n阶谐波频率,并且当将最大峰值位置的频率确定为n阶谐波频率时,将由频率分析起始位置和最大峰值位置之间的距离除以n而得到的位置处的频率确定为音调;以及
结果输出单元,输出由音调确定器确定的音调;
其中音调确定器:
执行过程步骤1:将频率分析起始点和音调候选者的位置之间的音调候选者距离“d”除以“n”以便计算峰值检测间隔d/n,并确定在频率分析起始点和音调候选者的位置之间的频谱中在峰值检测间隔d/n处是否存在峰值,以及如果确定在峰值检测间隔d/n处峰值存在,将由距离“d”除以“n”得到的位置P处的峰值P_Peak确定为新的音调候选者,其中,“n”是用于确定音调候选者是否是n阶谐波频率的音调候选者性质确定系数,并且将在预定范围内的质数或自然数按顺序应用于“n”;
当从频率分析起始点到音调候选者在峰值检测间隔d/n处存在峰值时重复过程步骤1;以及
如果确定在峰值检测间隔d/n处峰值不存在,将音调候选者确定为音调。
4.根据权利要求3所述的装置,还包括音调范围确定器,所述音调范围确定器:
计算由音调确定器确定的音调的频率范围F1
通过将在对于该音调能检测到的谐波频率中定位在从该音调算起的第h个位置处的谐波频率的范围除以“h”来计算音调范围候选者F2,其中,“h”是用于选择确定音调范围的谐波频率的谐波频率检测系数,并且“h”是等于或大于2的自然数;以及
将频率范围F1和音调范围候选者F2的交集确定为音调的范围。
CNB028154789A 2001-08-08 2002-08-08 基于频谱分析的音调确定方法和装置 Expired - Fee Related CN1271594C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020010047777A KR100347188B1 (en) 2001-08-08 2001-08-08 Method and apparatus for judging pitch according to frequency analysis
KR20010047777 2001-08-08

Publications (2)

Publication Number Publication Date
CN1539136A CN1539136A (zh) 2004-10-20
CN1271594C true CN1271594C (zh) 2006-08-23

Family

ID=19712998

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028154789A Expired - Fee Related CN1271594C (zh) 2001-08-08 2002-08-08 基于频谱分析的音调确定方法和装置

Country Status (8)

Country Link
US (1) US7493254B2 (zh)
EP (1) EP1425735B1 (zh)
JP (1) JP2004538525A (zh)
KR (1) KR100347188B1 (zh)
CN (1) CN1271594C (zh)
AT (1) ATE377821T1 (zh)
DE (1) DE60223391T2 (zh)
WO (1) WO2003015077A1 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100463417B1 (ko) * 2002-10-10 2004-12-23 한국전자통신연구원 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치
KR100735343B1 (ko) * 2006-04-11 2007-07-04 삼성전자주식회사 음성신호의 피치 정보 추출장치 및 방법
KR100827153B1 (ko) 2006-04-17 2008-05-02 삼성전자주식회사 음성 신호의 유성음화 비율 검출 장치 및 방법
JP4882899B2 (ja) * 2007-07-25 2012-02-22 ソニー株式会社 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
WO2011076284A1 (en) * 2009-12-23 2011-06-30 Nokia Corporation An apparatus
KR101093725B1 (ko) 2010-01-06 2011-12-19 한국과학기술원 여러 음을 가진 오디오 신호에서 하모닉 구조 모델을 이용한 멜로디 피치 후보 추출 방법
KR101106185B1 (ko) * 2010-01-19 2012-01-20 한국과학기술원 여러 음을 가진 오디오 신호에서 하모닉 구조 모델과 유동적인 길이를 갖는 분석 창을 이용한 멜로디 추출 방법 및 시스템
WO2011090843A2 (en) * 2010-01-22 2011-07-28 Si X Semiconductor Inc. Drum and drum-set tuner
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US11062615B1 (en) 2011-03-01 2021-07-13 Intelligibility Training LLC Methods and systems for remote language learning in a pandemic-aware world
US10019995B1 (en) 2011-03-01 2018-07-10 Alice J. Stiebel Methods and systems for language learning based on a series of pitch patterns
WO2012176199A1 (en) * 2011-06-22 2012-12-27 Vocalzoom Systems Ltd Method and system for identification of speech segments
EP2786369A4 (en) 2011-11-30 2016-12-07 Overtone Labs Inc BATTERY AND BATTERY DRUM TUNER
US8949118B2 (en) * 2012-03-19 2015-02-03 Vocalzoom Systems Ltd. System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise
US9153221B2 (en) 2012-09-11 2015-10-06 Overtone Labs, Inc. Timpani tuning and pitch control system
KR102088622B1 (ko) * 2013-11-13 2020-03-13 현대모비스 주식회사 Adc의 주파수 오차 저장 장치 및 adc의 주파수 오차 보정 장치
CN105845149B (zh) * 2016-03-18 2019-07-09 云知声(上海)智能科技有限公司 声音信号中主音高的获取方法及***
US10403307B2 (en) 2016-03-31 2019-09-03 OmniSpeech LLC Pitch detection algorithm based on multiband PWVT of Teager energy operator
IL253472B (en) * 2017-07-13 2021-07-29 Melotec Ltd Method and system for performing melody recognition
WO2020024003A1 (en) * 2018-07-30 2020-02-06 Juxtapus Pty Ltd Apparatus and computer implemented methods for detecting, transcribing and augmenting the percussive and/or musical content of recorded audio.
JP7516743B2 (ja) * 2019-11-08 2024-07-17 Toppanホールディングス株式会社 基音抽出装置、基音抽出方法、およびプログラム
CN113808596A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL177950C (nl) * 1978-12-14 1986-07-16 Philips Nv Spraakanalysesysteem voor het bepalen van de toonhoogte in menselijke spraak.
NL8400552A (nl) * 1984-02-22 1985-09-16 Philips Nv Systeem voor het analyseren van menselijke spraak.
US5226108A (en) * 1990-09-20 1993-07-06 Digital Voice Systems, Inc. Processing a speech signal with estimated pitch
US5189701A (en) * 1991-10-25 1993-02-23 Micom Communications Corp. Voice coder/decoder and methods of coding/decoding
US5751905A (en) * 1995-03-15 1998-05-12 International Business Machines Corporation Statistical acoustic processing method and apparatus for speech recognition using a toned phoneme system
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US5696873A (en) * 1996-03-18 1997-12-09 Advanced Micro Devices, Inc. Vocoder system and method for performing pitch estimation using an adaptive correlation sample window
US5774836A (en) * 1996-04-01 1998-06-30 Advanced Micro Devices, Inc. System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator
JPH10105195A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
JP4121578B2 (ja) * 1996-10-18 2008-07-23 ソニー株式会社 音声分析方法、音声符号化方法および装置
KR19980032825U (ko) * 1996-12-05 1998-09-05 김종진 회전전단기의 단차측정장치
US5973252A (en) * 1997-10-27 1999-10-26 Auburn Audio Technologies, Inc. Pitch detection and intonation correction apparatus and method
GB9811019D0 (en) * 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6124544A (en) * 1999-07-30 2000-09-26 Lyrrus Inc. Electronic music system for detecting pitch
US6912496B1 (en) * 1999-10-26 2005-06-28 Silicon Automation Systems Preprocessing modules for quality enhancement of MBE coders and decoders for signals having transmission path characteristics
US6627806B1 (en) * 2000-04-12 2003-09-30 David J. Carpenter Note detection system and methods of using same
US6587816B1 (en) * 2000-07-14 2003-07-01 International Business Machines Corporation Fast frequency-domain pitch estimation
GB2375028B (en) * 2001-04-24 2003-05-28 Motorola Inc Processing speech signals

Also Published As

Publication number Publication date
EP1425735B1 (en) 2007-11-07
DE60223391D1 (de) 2007-12-20
KR100347188B1 (en) 2002-08-03
JP2004538525A (ja) 2004-12-24
US20040225493A1 (en) 2004-11-11
WO2003015077A1 (en) 2003-02-20
US7493254B2 (en) 2009-02-17
EP1425735A1 (en) 2004-06-09
DE60223391T2 (de) 2008-08-28
CN1539136A (zh) 2004-10-20
ATE377821T1 (de) 2007-11-15
EP1425735A4 (en) 2005-11-09

Similar Documents

Publication Publication Date Title
CN1271594C (zh) 基于频谱分析的音调确定方法和装置
CN1248190C (zh) 快速频域音调估计方法和装置
CN1605096A (zh) 利用乐器的声音分析音乐的设备
CN1265351C (zh) 用于估计语音信号的音调频率的方法和装置
CN1146862C (zh) 音调提取方法和装置
CN1909060A (zh) 提取浊音/清音分类信息的方法和设备
US20050217463A1 (en) Signal processing apparatus and signal processing method, program, and recording medium
CN1892811A (zh) 乐器的调音设备和其中使用的计算机程序
CN1441906A (zh) 波形检测装置和使用该装置的状态监视***
CN1808113A (zh) 一种利用超声波检测轧辊内部缺陷的方法
CN1266671C (zh) 估算声音编码器的谐波的装置和方法
CN1216362C (zh) 2阶段音调检测方法和装置
US9342482B2 (en) On-chip spectral analysis using enhanced recursive discrete Fourier transforms
CN1173690A (zh) 识别浊音/清音的方法和装置及其语音编码方法
CN1601605A (zh) 声道谐振跟踪方法和装置
CN1271542C (zh) 用于确定非相干抽样数据的功率频谱的低泄露技术
CN1771533A (zh) 音频编码
CN1214362C (zh) 用于确定信号间相关系数和信号音高的设备和方法
CN1932974A (zh) 说话者识别设备、说话者识别程序、和说话者识别方法
CN1624765A (zh) 使用分段线性逼近的连续值声道共振跟踪方法和装置
CN1343967A (zh) 语音识别***
CN1757022A (zh) 特征识别方法及特征识别***
CN1246825C (zh) 预估语音信号的语调估测值的方法和装置
CN1484116A (zh) 节拍数检测装置
CN115372901A (zh) 一种基于可听声基波的位置检测***及检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060823

Termination date: 20120808