CN105551501B - 谐波信号基频估计算法及装置 - Google Patents

谐波信号基频估计算法及装置 Download PDF

Info

Publication number
CN105551501B
CN105551501B CN201610044926.XA CN201610044926A CN105551501B CN 105551501 B CN105551501 B CN 105551501B CN 201610044926 A CN201610044926 A CN 201610044926A CN 105551501 B CN105551501 B CN 105551501B
Authority
CN
China
Prior art keywords
fundamental frequency
spectrum
normal
signal
harmonic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610044926.XA
Other languages
English (en)
Other versions
CN105551501A (zh
Inventor
张维维
李敏
许爽
董玉华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Sailing Technology Co Ltd
Original Assignee
Dalian Nationalities University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Nationalities University filed Critical Dalian Nationalities University
Priority to CN201811494657.2A priority Critical patent/CN109493880A/zh
Priority to CN201811494641.1A priority patent/CN109410980A/zh
Priority to CN201811495768.5A priority patent/CN109524023A/zh
Priority to CN201610044926.XA priority patent/CN105551501B/zh
Publication of CN105551501A publication Critical patent/CN105551501A/zh
Application granted granted Critical
Publication of CN105551501B publication Critical patent/CN105551501B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Auxiliary Devices For Music (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种谐波信号基频估计算法及装置,属于信号处理领域,为了解决快速、准确提取基频,并减少频谱泄露对高频谱峰的影响的问题,技术要点包括:S1.对音频信号作常Q变换,得常Q变换谱;S2.使用常Q变换谱计算得折叠谐波求和谱;S3.由折叠谐波求和谱的谱峰初步筛选基频;S4.建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波信号基频。效果是:用常Q变换实现多分辨率谱估计,基于常Q变换谱定义折叠谐波求和谱,并将其用于初步基频筛选。通过最大后验概率法实现基频估计,其中先验概率由折叠谐波求和谱求出,似然函数由谐波谱峰与观测频谱的匹配度确定。

Description

谐波信号基频估计算法及装置
技术领域
本发明属于信号处理领域,涉及一种谐波信号基频估计算法。
背景技术
目前常用的基频估计算法包括自相关法、倒谱法、小波变换法、谐波求和法等。自相关法具有原理简单、易于实现的优点,但其计算量随着每帧信号长度成平方倍增。倒谱法在语音切换时,由于信噪比减小常导致倒谱峰严重偏离基频。小波变换法通过检测声门闭合时信号特征突变推算出基因周期,但小波变换中的多个阈值难以准确选择。谐波求和方法仅考虑到各次谐波幅度加权求和,而没有考虑到各次谐波频率可能会稍微偏离谐波整数倍,频谱泄露现象导致高频范围内信号的伪峰数量增加,及部分高频分量会被低频分量的旁瓣掩埋。
公开号为CN1342968A的中国发明专利申请公开了一种用于语音识别的高精度高分辨率基频提取方法,并具体记载了基频提取方法中具有信号分割、加窗、确定基频候选、过滤具有过低的Hper值或Rper值的步骤,最后用DP算法求基频路径。其目的是可以在时域上,对候选基频进行相关系数评测。然而,该种做法提取基频候选时,虽然可以减少DP的运算量,但是,该发明属于自相关法,仍具有计算量大,提取速度慢的缺点。
发明内容
为了解决快速、准确提取基频,并减少频谱泄露对高频谱峰的影响的问题,本发明提出了一种谐波信号基频估计算法,以提高基频提取的速度和准确性。
为了实现上述目的,本发明采用的技术方案是:一种谐波信号基频估计算法,包括:S1.对音频谐波信号作常Q变换,得常Q变换谱;S2.使用常Q变换谱计算得折叠谐波求和谱;S3.由折叠谐波求和谱的谱峰初步筛选基频;S4.建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波信号基频。
有益效果:本发明所述音频谐波信号基频估计算法,用常Q变换实现多分辨率谱估计,基于常Q变换谱定义折叠谐波求和谱,并将其用于初步基频筛选。通过最大后验概率法实现基频估计,其中先验概率由折叠谐波求和谱求出,似然函数由谐波谱峰与观测频谱的匹配度确定。
音频谐波信号基频估计是信号处理领域的一项关键技术,在语音识别、音乐信号处理、水声信号处理等方面具有重要作用,本发明提出的基频估计算法可应用到各类具有谐波结构的信号的基频估计中,提出的方法能够实现频谱多分辨率分析,提出折叠谐波求和谱作为基频的初步筛选,采用最大后验概率法估计基频。该方法充分利用频谱提供的能量、谐波性、谱匹配性等信息,实现基频估计,具有运算速度快,参数少,鲁棒性强的特点。
附图说明
图1是实施例10中的一帧音乐信号图示;
图2是实施例10中的音乐信号的常Q变换谱;
图3是实施例10中的折叠谐波求和谱;
图4是实施例10中的基频后验概率密度谱;
图5是实施例11中的时域信号图示;
图6是实施例11中的常Q变换谱;
图7是实施例11中的折叠谐波求和谱;
图8是实施例11中的基频后验概率密度谱;
图9是本发明所述方法的软件流程图。
具体实施方式
实施例1:一种谐波信号基频估计算法,包括步骤:
S1.对音频谐波信号作常Q变换,得常Q变换谱;
S2.使用常Q变换谱计算得折叠谐波求和谱;
S3.由折叠谐波求和谱的谱峰初步筛选基频;
S4.建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波信号基频。
本发明所述音频谐波信号基频估计算法,用常Q变换实现多分辨率谱估计,基于谐波求和能量定义折叠谐波求和谱,并将其用于初步基频筛选。通过最大后验概率法实现基频估计,其中先验概率由折叠谐波求和谱求出,似然函数由谐波谱峰与频谱的匹配度确定。
音频谐波信号基频估计是信号处理领域的一项关键技术,在语音识别、音乐信号处理、水声信号处理等方面具有重要作用,本发明提出的基频估计算法可应用到各类具有谐波结构的信号的基频估计中,提出的方法能够实现频谱多分辨率分析,提出折叠谐波求和谱作为基频的初步筛选,采用最大后验概率法估计基频。该方法充分利用频谱提供的能量、谐波性、谱匹配性等信息,实现基频估计,具有运算速度快,参数少,鲁棒性强的特点。
实施例2:具有与实施例1相同的技术方案,更为具体的,常Q变换前,可以先对音频谐波信号进行分频,加窗处理。
在所述步骤S1中,先对输入的非平稳音频谐波信号作分帧处理,然后给短时分帧信号加汉宁窗抑制旁瓣幅度,窗口长度与常Q变换的时间窗宽度一致。
实施例3:具有与实施例1或2相同的技术方案,更为具体的,所述步骤S3中,筛选规则为选取折叠谐波求和谱中的至少前3个极大值对应的频率作为候选基频,本实施例选择前3个极大值作为候选基频,实验中,候选基频数量增加,可以提高准确度,而选取3个,其准确度已经非常高。
实施例4:具有与实施例1或2或3相同的技术方案,更为具体的,步骤S1中,是根据人耳听觉特性,计算对数频率域常Q变换谱,该常Q变换谱为:
(1)式中,Q是品质因子,其为常数,N[k]为常Q变换在第k个频点对应的时间窗宽度,(1)式中,x(l,m)表示第l帧信号中的序号为m的采样点;设x1(n),n=0,1,....M-1表示长度为M,采样率为Fs的音频信号,把该音频信号截断为每段长度为N[k]的帧,若帧移为L,则第l帧信号可以表示为:
x(l,m)=x1(m+lL),m=0,1,...N[k]-1 (2)
(1)式中,wN[k](m)表示长度为N[k]的汉宁窗,即:
实施例5:具有与实施例1或2或3或4相同的技术方案,更为具体的,折叠谐波求和谱定义为:
其中:h为谐波次数,H为最高次谐波,0<α<1,XQ(k,l)为常Q变换谱,round(·)运算结果等于最近的整数,假设每倍频程取Oct个点,常Q变换分析的最低频率分量为fmin,最高频率分量为fmax,则其中ceil(·)运算结果等于正无穷方向最近的整数,常Q变换的第k个频率点对应的频率为:
实施例6:具有与实施例1或2或3或4或5相同的技术方案,更为具体的,基频后验概率密度定义为:
其中:Fi,l为第l帧的第i个基频候选,上式中p(Fi,l)为第l帧第i个基频Fi,l的先验概率,定义p(Fi,l)=Xc(Fi,l,l);上式中p(Xc(fk,l)|Fi,l)量测给定基频Fi,l得到观测常Q频谱的概率。
实施例7:具有与实施例1或2或3或4或5相同的技术方案,更为具体的,定义:
其中:
(8)式中β=0.03,若常Q谱中基频候选Fi,l的第h次谐波是谱峰则γl(h,Fi,l)为1,否则为0,故表征第l帧常Q谱中所包含的前H次谐波分量的数量。类似地,若XQ(k,l)是谱峰则λl(k)为1,否则为0,故表征第l帧常Q谱中Fi,l的前H次谐波频率范围内的所有谱峰数。
折叠谐波求和谱是基频及各次谐波分量的归一化加权和,设基频为F0,则折叠谐波求和谱在F0位置处的函数值为常Q变换在F0,2F0,3F0,...,HF0等处幅度的归一化加权和;折叠谐波求和谱在2F0位置处的函数值为常Q变换在2F0,4F0,6F0,...,2HF0等处幅度的归一化加权和。日常语音、音乐等信号主要能量集中在低频段,故即使常Q变换基频幅度小于二次谐波幅度,其折叠谐波求和谱也能在基频位置处得到较大输出。由折叠谐波求和谱中的前几个峰值得到基频候选,能够实现基频的初步筛选。
最大后验概率密度函数中的第一项定义为p(Fi,l)=Xc(Fi,l,l),即折叠谐波求和谱在Fi,l处的幅度,p(Fi,l)取折叠谐波求和谱而非常Q变换谱是因为有时候某些谐波分量的幅度会超过基频的幅度,而即使谐波幅度高于基频幅度的时候,折叠谐波求和谱在基频位置处的值仍大于高次谐波处的值,进而提高基频估计的准确率,降低误判率。
实施例8:具有与实施例1或2或3或4或5或6或7相同的技术方案,更为具体的,基频估计公式为:
实施例9:一种谐波信号基频估计算法,包括如下步骤:
1.对音频谐波信号作常Q变换,得常Q变换谱,该常Q变换谱为:
(1)式中,Q是品质因子,其为常数,N[k]为常Q变换在第k个频点对应的时间窗宽度,(1)式中,x(l,m)表示第l帧信号中的序号为m的采样点;设x1(n),n=0,1,....M-1表示长度为M,采样率为Fs的音频信号,把该音频信号截断为每段长度为N[k]的帧,若帧移为L,则第l帧信号可以表示为:
x(l,m)=x1(m+lL),m=0,1,...N[k]-1 (2)
(1)式中,wN[k](m)表示长度为N[k]的汉宁窗,即:
2.由常Q变换谱求折叠谐波求和谱,即:
其中:h为谐波次数,H为最高次谐波,0<α<1,XQ(k,l)为常Q变换谱,round(·)运算结果等于最近的整数,假设每倍频程取Oct个点,常Q变换分析的最低频率分量为fmin,最高频率分量为fmax,则其中ceil(·)运算结果等于正无穷方向最近的整数,常Q变换的第k个频率点对应的频率为:
3.从折叠谐波求和谱中得到3个最大峰值对应的频率作为基频候选,然后求各基频候选的后验概率密度,即:
其中:Fi,l为第l帧的第i个基频候选,p(Fi,l)为第l帧第i个基频Fi,l的先验概率,定义为p(Fi,l)=Xc(Fi,l,l),即折叠谐波求和谱在Fi,l处的幅度。p(Xc(fk,l)|Fi,l)量测给定基频Fi,l得到观测常Q频谱的似然函数,该似然函数定义为:
其中:
(8)式中β=0.03,若常Q谱中基频候选Fi,l的第h次谐波是谱峰则γl(h,Fi,l)为1,否则为0,故表征第l帧常Q谱中所包含的前H次谐波分量的数量。类似地,若XQ(k,l)是谱峰则λl(k)为1,否则为0,故表征第l帧常Q谱中Fi,l的前H次谐波频率范围内的所有谱峰数。
实施例10:本实施例对上述各实施例中的对基频估计的方法,进行实验验证:
本实施例实验是使用了上述实施例基频估计方法,对一帧音乐信号进行了基频估计,并仿真得到图1-图4,本实施例验证的情形是:信号中基频分量的幅度大于二次谐波幅度。
附图1是一帧音乐信号。
附图2是上述音乐信号的常Q变换谱:通过常Q变换谱可见有丰富的谐波分量。各次谐波分量可以清楚的看出来,常Q谱仅在各频率分量处有很窄的谱线,频谱泄露不明显。
附图3是折叠谐波求和谱:折叠谐波求和谱能增加基频和各次谐波分量的差异。从中选出具有最大折叠谐波幅度的三个频率作为候选基频,本图中被选出来的候选基频分别对应原时域信号的基频、二次谐波和三次谐波分量,然后求这三个候选基频的后验概率密度。
附图4是基频后验概率密度谱:把具有最大后验概率密度的候选基频,即181.45Hz频率被选为最终的基频,与事实吻合。
从附图1-附图4可见常Q变换能有效抑制频谱泄露,突出信号中的各个频率分量。本发明步骤(2)-(4)都基于常Q谱,且折叠谐波求和谱中仅取少量(3个)具有较大折叠谐波求和能量的基频候选参与最大后验概率密度计算,具有较少的运算量,计算复杂度低,可快速实现。实验结果表明,由于谐波信号具有良好的谐波性,构建的最大后验概率函数能准确映射出候选基频的各次谐波与观测频谱的匹配关系,能准确筛选出谐波信号的基频。
实施例11:本实施例适用的实验情形是:一帧音乐信号中基频分量的幅度小于二次谐波幅度。
该帧音乐信号时域信号如图5所示;
常Q变换谱如图6所示;
折叠谐波求和谱如图7所示,虽然实际基频分量的幅度小于二次谐波分量的幅度,但折叠谐波求和谱中基频对应的幅度已经被大幅度放大,并超过二次谐波的幅度;
基频后验概率密度谱如图8所示;由上述实验附图可见,在基频幅度小于谐波幅度的情况下,本方法仍能够准确估计出基频。
实施例12:一种谐波信号基频估计装置,包括:常Q变换模块,对音频谐波信号作常Q变换,得常Q变换谱;折叠谐波求和谱计算模块,使用常Q变换谱计算得折叠谐波求和谱;初步筛选基频模块,由折叠谐波求和谱的谱峰初步筛选基频;
谐波信号基频输出模块,建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波信号基频。本实施例所述的装置,用以执行实施例1-9所述的方法,实施例1-9中的技术方案适用于本实施例。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种谐波信号基频估计方法,其特征在于,包括步骤:
S1.对音频谐波信号作常Q变换,得常Q变换谱;
S2.使用常Q变换谱计算得折叠谐波求和谱;
S3.由折叠谐波求和谱的谱峰初步筛选基频;
S4.建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波信号基频。
2.如权利要求1所述的谐波信号基频估计方法,其特征在于,所述步骤S1中,对输入的非平稳音频谐波信号作分帧处理,然后给短时分帧信号加汉宁窗抑制旁瓣幅度,窗口长度与常Q变换的时间窗宽度一致。
3.如权利要求1所述的谐波信号基频估计方法,其特征在于,所述步骤S3中,筛选规则为选取折叠谐波求和谱中的至少前3个极大值对应的频率作为候选基频。
4.如权利要求1所述的谐波信号基频估计方法,其特征在于,步骤S1中,常Q变换谱为:
(1)式中,Q是品质因子,其为常数,N[k]为常Q变换在第k个频点对应的时间窗宽度,(1)式中,x(l,m)表示第l帧信号中的序号为m的采样点;设x1(n),n=0,1,....M-1,其表示长度为M,采样率为Fs的音频信号,把该音频信号截断为每段长度为N[k]的帧,若帧移为L,则第l帧信号可以表示为:
x(l,m)=x1(m+lL),m=0,1,...N[k]-1
(1)式中,wN[k](m)表示长度为N[k]的汉宁窗,即:
5.如权利要求1所述的谐波信号基频估计方法,其特征在于,折叠谐波求和谱定义为:
其中:h为谐波次数,H为最高次谐波,0<α<1,XQ(k,l)为常Q变换谱,round(·)运算结果等于最近的整数,假设每倍频程取Oct个点,常Q变换分析的最低频率分量为fmin,最高频率分量为fmax,则其中ceil(·)运算结果等于正无穷方向最近的整数,常Q变换的第k个频率点对应的频率为:
6.如权利要求5所述的谐波信号基频估计方法,其特征在于,基频后验概率密度定义为:
其中:Fi,l为第l帧的第i个基频候选,上式中p(Fi,l)为第l帧第i个基频Fi,l的先验概率,定义为p(Fi,l)=Xc(Fi,l,l);上式中p(Xc(fk,l)|Fi,l)量测给定基频Fi,l得到观测常Q频谱的概率。
7.如权利要求6所述的谐波信号基频估计方法,其特征在于,定义:
其中:
β=0.03,表示第l帧常Q谱前H次谐波谱峰数量,表征第l帧前H次谐波频率范围内的总谱峰数量。
8.如权利要求7所述的谐波信号基频估计方法,其特征在于,基频估计公式为:
9.一种谐波信号基频估计装置,其特征在于,包括:
常Q变换模块,对音频谐波信号作常Q变换,得常Q变换谱;
折叠谐波求和谱计算模块,使用常Q变换谱计算得折叠谐波求和谱;
初步筛选基频模块,由折叠谐波求和谱的谱峰初步筛选基频;
谐波信号基频输出模块,建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波信号基频。
CN201610044926.XA 2016-01-22 2016-01-22 谐波信号基频估计算法及装置 Active CN105551501B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201811494657.2A CN109493880A (zh) 2016-01-22 2016-01-22 一种谐波信号基频初步筛选的方法
CN201811494641.1A CN109410980A (zh) 2016-01-22 2016-01-22 一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用
CN201811495768.5A CN109524023A (zh) 2016-01-22 2016-01-22 一种对基频估计实验验证的方法
CN201610044926.XA CN105551501B (zh) 2016-01-22 2016-01-22 谐波信号基频估计算法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610044926.XA CN105551501B (zh) 2016-01-22 2016-01-22 谐波信号基频估计算法及装置

Related Child Applications (3)

Application Number Title Priority Date Filing Date
CN201811494657.2A Division CN109493880A (zh) 2016-01-22 2016-01-22 一种谐波信号基频初步筛选的方法
CN201811495768.5A Division CN109524023A (zh) 2016-01-22 2016-01-22 一种对基频估计实验验证的方法
CN201811494641.1A Division CN109410980A (zh) 2016-01-22 2016-01-22 一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用

Publications (2)

Publication Number Publication Date
CN105551501A CN105551501A (zh) 2016-05-04
CN105551501B true CN105551501B (zh) 2019-03-15

Family

ID=55830649

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201811494641.1A Pending CN109410980A (zh) 2016-01-22 2016-01-22 一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用
CN201610044926.XA Active CN105551501B (zh) 2016-01-22 2016-01-22 谐波信号基频估计算法及装置
CN201811495768.5A Pending CN109524023A (zh) 2016-01-22 2016-01-22 一种对基频估计实验验证的方法
CN201811494657.2A Pending CN109493880A (zh) 2016-01-22 2016-01-22 一种谐波信号基频初步筛选的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201811494641.1A Pending CN109410980A (zh) 2016-01-22 2016-01-22 一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201811495768.5A Pending CN109524023A (zh) 2016-01-22 2016-01-22 一种对基频估计实验验证的方法
CN201811494657.2A Pending CN109493880A (zh) 2016-01-22 2016-01-22 一种谐波信号基频初步筛选的方法

Country Status (1)

Country Link
CN (4) CN109410980A (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108333B (zh) * 2017-05-02 2021-10-19 大连民族大学 一种伪双谱分离具有相同谐波频率成分信号的方法
CN107833581B (zh) * 2017-10-20 2021-04-13 广州酷狗计算机科技有限公司 一种提取声音的基音频率的方法、装置及可读存储介质
CN108363109B (zh) * 2018-01-12 2019-06-21 吉林大学 地面核磁共振数据的谐波干扰基频快速搜索方法
CN113933590A (zh) * 2020-07-14 2022-01-14 森兰信息科技(上海)有限公司 波的频谱的计算方法、***、介质及装置
CN111855192B (zh) * 2020-07-31 2021-04-23 北京航空航天大学 一种用于编码器信号去噪的奇异值分解方法
CN112307931A (zh) * 2020-10-26 2021-02-02 西安电子科技大学 一种基于模板匹配技术的电磁信息泄漏快速检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102054480A (zh) * 2009-10-29 2011-05-11 北京理工大学 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
CN104036785A (zh) * 2013-03-07 2014-09-10 索尼公司 语音信号的处理方法和装置、以及语音信号的分析***
CN104538024A (zh) * 2014-12-01 2015-04-22 百度在线网络技术(北京)有限公司 语音合成方法、装置及设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN177084B (zh) * 1991-05-27 1996-11-02 Satake Eng Co Ltd
JP3091343B2 (ja) * 1993-03-01 2000-09-25 株式会社河合楽器製作所 電子楽器
CN1151490C (zh) * 2000-09-13 2004-05-26 中国科学院自动化研究所 用于语音识别的高精度高分辨率基频提取方法
FR2853125A1 (fr) * 2003-03-27 2004-10-01 France Telecom Procede d'analyse d'informations de frequence fondamentale et procede et systeme de conversion de voix mettant en oeuvre un tel procede d'analyse.
DE102006008260B3 (de) * 2006-02-22 2007-07-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Analyse eines Audiodatums
JP4630980B2 (ja) * 2006-09-04 2011-02-09 独立行政法人産業技術総合研究所 音高推定装置、音高推定方法およびプログラム
JP4322283B2 (ja) * 2007-02-26 2009-08-26 独立行政法人産業技術総合研究所 演奏判定装置およびプログラム
US7925502B2 (en) * 2007-03-01 2011-04-12 Microsoft Corporation Pitch model for noise estimation
US8248886B2 (en) * 2007-04-10 2012-08-21 Exxonmobil Upstream Research Company Separation and noise removal for multiple vibratory source seismic data
CN101159136A (zh) * 2007-11-13 2008-04-09 中国传媒大学 一种低比特率音乐信号编码方法
JP2011065041A (ja) * 2009-09-18 2011-03-31 Brother Industries Ltd 基本周波数推定装置、採譜装置、及びプログラム
US8716586B2 (en) * 2010-04-05 2014-05-06 Etienne Edmond Jacques Thuillier Process and device for synthesis of an audio signal according to the playing of an instrumentalist that is carried out on a vibrating body
RU2587652C2 (ru) * 2010-11-10 2016-06-20 Конинклейке Филипс Электроникс Н.В. Способ и устройство для оценки структуры в сигнале
EP2685448B1 (en) * 2012-07-12 2018-09-05 Harman Becker Automotive Systems GmbH Engine sound synthesis
JP2014219607A (ja) * 2013-05-09 2014-11-20 ソニー株式会社 音楽信号処理装置および方法、並びに、プログラム
GB201310861D0 (en) * 2013-06-18 2013-07-31 Nokia Corp Audio signal analysis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102054480A (zh) * 2009-10-29 2011-05-11 北京理工大学 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
CN104036785A (zh) * 2013-03-07 2014-09-10 索尼公司 语音信号的处理方法和装置、以及语音信号的分析***
CN104538024A (zh) * 2014-12-01 2015-04-22 百度在线网络技术(北京)有限公司 语音合成方法、装置及设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《基于常量Q变换的音符起始点检测》;桂文明 刘睿凡 邵曦 白光一;《计算机工程》;20131031;第39卷(第10期);全文
CQ变换的快速算法及在音调频率估计中的误差分析;丁志中;《信息与电子工程》;20051231;第3卷(第4期);全文
基于改进CQT语谱图的单旋律识别法;孔秋强 等;《信息***工程》;20120531;全文

Also Published As

Publication number Publication date
CN109493880A (zh) 2019-03-19
CN109524023A (zh) 2019-03-26
CN109410980A (zh) 2019-03-01
CN105551501A (zh) 2016-05-04

Similar Documents

Publication Publication Date Title
CN105551501B (zh) 谐波信号基频估计算法及装置
CN106486131B (zh) 一种语音去噪的方法及装置
CN111128213B (zh) 一种分频段进行处理的噪声抑制方法及其***
CN102054480B (zh) 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
CN103594094B (zh) 自适应谱减法实时语音增强
CN109256127B (zh) 一种基于非线性幂变换Gammachirp滤波器的鲁棒语音特征提取方法
CN109767782A (zh) 一种提高dnn模型泛化性能的语音增强方法
CN106971740A (zh) 基于语音存在概率和相位估计的语音增强方法
CN103559888A (zh) 基于非负低秩和稀疏矩阵分解原理的语音增强方法
CN102982801A (zh) 一种用于鲁棒语音识别的语音特征提取方法
TW201108201A (en) Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
CN103021405A (zh) 基于music和调制谱滤波的语音信号动态特征提取方法
CN106373559A (zh) 一种基于对数谱信噪比加权的鲁棒特征提取方法
CN111899750B (zh) 联合耳蜗语音特征和跳变深层神经网络的语音增强算法
CN115146687B (zh) 基于二阶变尺度参数自匹配随机共振的故障特征提取方法
CN112183225B (zh) 一种基于概率潜在语义分析的水下目标信号特征提取方法
CN103971697A (zh) 基于非局部均值滤波的语音增强方法
Hansson-Sandsten et al. Optimal cepstrum estimation using multiple windows
CN104036781A (zh) 语音信号带宽扩展装置及方法
CN112652321B (zh) 一种基于深度学习相位更加友好的语音降噪***及方法
CN210347836U (zh) 一种电缆振荡波局放检测***用波速计算装置
Nasr et al. Efficient implementation of adaptive wiener filter for pitch detection from noisy speech signals
Wang et al. Research on speech enhancement based on deep neural network
CN112820318A (zh) 一种基于gmm-ubm的冲击声模型建立、冲击声检测方法及***
CN106971733A (zh) 基于语音降噪的声纹识别的方法及***以及智能终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190611

Address after: Room 507, 5th floor, No. 3 Gaoxin Street, Dalian Hi-tech Industrial Park, Liaoning Province

Patentee after: Dalian Sailing Technology Co., Ltd.

Address before: 116600 No. 18 Liaohe West Road, Jinzhou New District, Dalian City, Liaoning Province

Patentee before: Dalian ethnic university

TR01 Transfer of patent right