CN115061087B - 信号处理方法、doa估计方法及电子设备 - Google Patents

信号处理方法、doa估计方法及电子设备 Download PDF

Info

Publication number
CN115061087B
CN115061087B CN202210588392.2A CN202210588392A CN115061087B CN 115061087 B CN115061087 B CN 115061087B CN 202210588392 A CN202210588392 A CN 202210588392A CN 115061087 B CN115061087 B CN 115061087B
Authority
CN
China
Prior art keywords
sub
band
domain data
bands
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210588392.2A
Other languages
English (en)
Other versions
CN115061087A (zh
Inventor
袁晓兵
李宝清
刘华巍
裴俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Scifine Iot Technology Co ltd
Original Assignee
Shanghai Scifine Iot Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Scifine Iot Technology Co ltd filed Critical Shanghai Scifine Iot Technology Co ltd
Priority to CN202210588392.2A priority Critical patent/CN115061087B/zh
Publication of CN115061087A publication Critical patent/CN115061087A/zh
Application granted granted Critical
Publication of CN115061087B publication Critical patent/CN115061087B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例提供了一种信号处理方法、DOA估计方法及电子设备,涉及信号处理技术领域。信号处理方法包括:获取由声音采集装置采集的声音信号;从由所述声音信号对应的频域数据划分得到J个子带中,选取满足空间相关条件的所述子带组成的第一子带集合,J为大于1的整数;从由所述声音信号对应的时域数据划分得到J个子带中,选取满足信噪比条件的所述子带组成的第二子带集合;基于所述第一子带集合与所述第二子带集合,选取所述声音信号中包含的目标子带。本发明中,将声音信号划分为J个子带,并实时估计声音信号各个子带的信噪比和空间相关,获取声音信号的频域特征和空间特征,由此能够选取出信噪比高且空间相关较高的子带作为目标子带。

Description

信号处理方法、DOA估计方法及电子设备
技术领域
本发明涉及信号处理技术领域,具体涉及一种信号处理方法、DOA估计方法及电子设备。
背景技术
在无线传感网监测***中,通过声阵列设备对运动车辆进行DOA(Direction OfArrival)波达方向定位估计至关重要。对声源目标进行DOA估计,通常应用基于宽带处理的空间谱方法,主要分为非相干信号子空间算法(Incoherent Signal Subspace Method,ISM)和相干信号子空间算法(Coherent Signal Subspace Method,CSM)两类。ISM算法的主要思想是将宽带信号分解到不重叠频带上的窄带数据,然后对每个频带进行窄带信号子空间处理,从而获得声源波达角度的估计,再通过对这些初始估计的组合得到最终结果。CSM算法的基本思想是把频带内不重叠的频率点上信号空间聚焦到参考频率点,聚焦后得到单一频率点的数据协方差,再应用窄带信号处理的方法进行DOA估计。
上述的两类算法能够在干扰源少和高信噪比情况下,得到比较好的估计效果,但是无法使用在干扰源多、信噪比较高等复杂度较高的环境中,例如在野外环境中,上述两类算法的DOA估计性能会严重恶化。基于上述问题,申请人提出了本申请的解决方案。
发明内容
本发明的目的是提供了一种信号处理方法、DOA估计方法及电子设备,将声音信号划分为J个子带,并实时估计声音信号各个子带的信噪比和空间相关,获取声音信号的频域特征和空间特征,由此能够选取出信噪比高且空间相关较高的子带作为目标子带,以在利用声音信号的目标子带进行DOA估计等计算时,抑制变干扰源干扰和时变背景噪声对DOA估计所带来的不利影响,提升了野外复杂环境下的DOA估计的稳定性,由此能够取得更好的DOA估计效果,并且具有较强的可靠性和环境普适性。
为实现上述目的,本发明提供了一种信号处理方法,包括:获取由声音采集装置采集的声音信号;从由所述声音信号对应的频域数据划分得到J个子带中,选取满足空间相关条件的所述子带组成的第一子带集合,J为大于1的整数;从由所述声音信号对应的时域数据划分得到J个子带中,选取满足信噪比条件的所述子带组成的第二子带集合;基于所述第一子带集合与所述第二子带集合,选取所述声音信号中包含的目标子带。
本发明还提供了一种DOA估计方法,包括:接收声音采集装置采集的目标声源的声音信号;获取所述声音信号中包含的目标子带,所述声音信号中包含的目标子带基于上述的信号处理方法得到;基于预设的宽带信号处理算法与所述声音信号中包含的目标子带,对所述目标声源进行DOA估计。
本发明还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述的信号处理方法和/或上述的DOA估计方法。
本发明实施例提供了一种信号处理方法,在获取了由由声音采集装置采集的声音信号后,从由声音信号对应的频域数据划分得到J个子带中,选取满足空间相关条件的子带组成的第一子带集合,再从由声音信号对应的时域数据划分得到J个子带中,选取满足信噪比条件的子带组成的第二子带集合,随后基于第一子带集合与第二子带集合,选取声音信号中包含的目标子带;相当于将声音信号划分为J个子带,并实时估计声音信号各个子带的信噪比和空间相关,获取声音信号的频域特征和空间特征,由此能够选取出信噪比高且空间相关较高的子带作为目标子带,以在利用声音信号的目标子带进行DOA估计等计算时,抑制变干扰源干扰和时变背景噪声对DOA估计所带来的不利影响,提升了野外复杂环境下的DOA估计的稳定性,由此能够取得更好的DOA估计效果,并且具有较强的可靠性和环境普适性。
在一个实施例中,所述从由所述声音信号对应的频域数据划分得到J个子带中,选取满足空间相关条件的所述子带组成的第一子带集合,包括:将所述声音信号转换为频域数据,并将所述频域数据划分为J个子带;基于J个所述子带对应的频域数据,得到J个所述子带的空间相关系数;基于J个所述子带的空间相关系数,按照空间相关系数从大到小从J个所述子带中选取K个所述子带组成第一子带集合,1≤K≤J,K为整数。
在一个实施例中,所述将所述声音信号转换为频域数据,包括:对所述声音信号进行傅里叶变换得到参考频域数据,选取所述参考频域数据的前一半作为所述声音信号对应的频域数据。
在一个实施例中,所述声音采集装置中包括多个阵元;所述基于J个所述子带对应的频域数据,得到J个所述子带的空间相关系数,包括:对于每个所述子带,从所述频域数据中获取两个所述阵元在所述子带上的目标频域数据,并基于两个所述阵元对应的目标频域数据,得到所述子带的空间相关系数。
在一个实施例中,从所述频域数据中获取两个所述阵元在所述子带上的目标频域数据,包括:从所述频域数据中获取相距最远的两个所述阵元在所述子带上的目标频域数据。
在一个实施例中,所述子带的空间相关系数的计算公式为:
其中,表示J个子带中的第j个所述子带的空间相关系数,X1(j)表示两个所述阵元中的其中一个所述阵元在第j个所述子带上的目标频域数据,X2(j)表示两个所述阵元中的另一个所述阵元在第j个所述子带上的目标频域数据,/>表示X1(j)的共轭转置,/>表示X2(j)的共轭转置。
在一个实施例中,所述从由所述声音信号对应的时域数据划分得到J个子带中,选取满足信噪比条件的所述子带组成的第二子带集合,包括:获取所述声音信号中包含的信源数量,并利用J个带通滤波器将所述声音信号滤波得到J个子带对应的时域数据;根据所述信源数量与J个所述子带对应的时域数据,得到J个所述子带的信噪比;根据J个所述子带的信噪比,按照信噪比从大到小从J个所述子带中选取K个所述子带组成第二子带集合,1≤K≤J,K为整数。
在一个实施例中,所述根据所述信源数量与J个所述子带对应的时域数据,得到J个所述子带的信噪比,包括:根据所述信源数量与J个所述子带对应的时域数据,分别计算各所述子带对应的时域数据的信号功率与噪声功率;对于每个所述子带,基于所述子带对应的时域数据的信号功率与噪声功率,得到所述子带的信噪比。
在一个实施例中,所述根据所述信源数量与J个所述子带对应的时域数据,分别计算各所述子带对应的时域数据的信号功率与噪声功率,包括:分别计算各所述子带对应的时域数据的协方差矩阵的特征值;对于每个所述子带,根据所述子带对应的时域数据的协方差矩阵的特征值与所述信源数量,得到所述子带对应的时域数据的信号功率与噪声功率。
在一个实施例中,所述子带对应的时域数据的信号功率的计算公式为:
所述子带对应的时域数据的噪声功率的计算公式为:
其中,表示J个子带中的第j个所述子带对应的时域数据的信号功率,/>表示J个子带中的第j个所述子带对应的时域数据的噪声功率,M表示所述子带对应的时域数据的协方差矩阵的特征值的数量,λi表示M个特征值中的第i个特征值,P表示信源数量;
所述子带的信噪比的计算公式为:
其中,Lj表示J个子带中的第j个所述子带的信噪比,表示J个子带中的第j个所述子带对应的时域数据的信号功率,/>表示J个子带中的第j个所述子带对应的时域数据的噪声功率。
在一个实施例中,所述带通滤波器的上限截止频率为:
所述带通滤波器的下限截止频率为:
其中,fHj表示J个子带中的第j个所述子带对应的带通滤波器的上限截止频率,fLj表示J个子带中的第j个所述子带对应的带通滤波器的下限截止频率,Fs表示声音信号的采样频率。
在一个实施例中,方法还包括:若连续多帧所述声音信号中包含的目标子带的数量均小于第一预设阈值,增大K的值;若连续多帧所述声音信号中包含的目标子带的数量均大于第二预设阈值,减小K的值。
附图说明
图1是根据本发明第一实施例中的信号处理方法的具体流程图;
图2是图1中信号处理方法的步骤102的具体流程图;
图3是图1中信号处理方法的步骤103的具体流程图;
图4A是根据本发明第一实施例中的声音信号的时域波形图;
图4B是根据本发明第一实施例中的声音信号的频域能量谱图;
图4C是根据本发明第一实施例中的声音信号的空间域能量谱图;
图5是根据本发明第二实施例中的DOA估计方法的具体流程图。
具体实施方式
以下将结合附图对本发明的各实施例进行详细说明,以便更清楚理解本发明的目的、特点和优点。应理解的是,附图所示的实施例并不是对本发明范围的限制,而只是为了说明本发明技术方案的实质精神。
在下文的描述中,出于说明各种公开的实施例的目的阐述了某些具体细节以提供对各种公开实施例的透彻理解。但是,相关领域技术人员将认识到可在无这些具体细节中的一个或多个细节的情况来实践实施例。在其它情形下,与本申请相关联的熟知的装置、结构和技术可能并未详细地示出或描述从而避免不必要地混淆实施例的描述。
除非语境有其它需要,在整个说明书和权利要求中,词语“包括”和其变型,诸如“包含”和“具有”应被理解为开放的、包含的含义,即应解释为“包括,但不限于”。
在整个说明书中对“一个实施例”或“一实施例”的提及表示结合实施例所描述的特定特点、结构或特征包括于至少一个实施例中。因此,在整个说明书的各个位置“在一个实施例中”或“在一实施例”中的出现无需全都指相同实施例。另外,特定特点、结构或特征可在一个或多个实施例中以任何方式组合。
如该说明书和所附权利要求中所用的单数形式“一”和“”包括复数指代物,除非文中清楚地另外规定。应当指出的是术语“或”通常以其包括“或/和”的含义使用,除非文中清楚地另外规定。
在以下描述中,为了清楚展示本发明的结构及工作方式,将借助诸多方向性词语进行描述,但是应当将“前”、“后”、“左”、“右”、“外”、“内”、“向外”、“向内”、“上”、“下”等词语理解为方便用语,而不应当理解为限定性词语。
本发明第一实施方式涉及一种信号处理方法,应用于电子设备,电子设备例如为手机、平板电脑、台式主机、定位设备等,电子设备可以采用本实施例的信号处理方法对声音采集装置采集的声音信号进行处理,得到声音信号中的目标子带,目标子带后续则可以用来进行DOA估计等方面。其中,声音采集装置可以为包括多个阵元的麦克风阵列,多个阵元可以按照设定的排列方式进行排列,例如线性、矩形、圆形等排列方式,电子设备与声音采集装置通信连接,声音采集装置也可以直接集成在电子设备中。
本实施方式的信号处理方法的具体流程如图1所示。
步骤101,获取由声音采集装置采集的声音信号。
具体而言,声音采集装置可以按照设定的采样频率Fs采集来源于目标声源(例如为轮式车辆等移动目标声源)的声音信号,采集的声音信号为时域数据,假设声音采集装置包括M个阵元(M>1),声音采集装置采集的一帧声音信号X中的数据维度为M×N,N表示帧长,N与采样频率Fs相关,例如采样频率Fs为1024Hz,则N=1024;即一帧声音信号中包括M行的时域数据,每个阵元对应于一行的时域数据。
步骤102,从由声音信号对应的频域数据划分得到J个子带中,选取满足空间相关条件的子带组成的第一子带集合,J为大于1的整数。
在一个例子中,请参考图2,步骤102包括以下子步骤:
子步骤1021,将声音信号转换为频域数据,并将频域数据划分为J个子带。
具体而言,对声音信号进行傅里叶变换得到参考频域数据,即对声音信号X中各行的时域数据分别进行傅里叶变换,便能够得到声音信号X对应参考频域数据,参考频域数据的数据维度为M×N,每个阵元对应于参考频域数据中一行的频域数据,参考频域数据中前N/2列的频域数据与后N/2列的数据是共轭的,因此仅选取参考频域数据的前一半作为声音信号对应的频域数据,即选取参考频域数据中前N/2列作为声音信号对应的频域数据,便能够包含声音信号X中所有的频域信息,并且能够满足频率从低频到高频的排列顺序。
将声音信号X对应的频域数据划分为J个子带,例如将声音信号X包含的频率段平均划分为J个子带,得到每个子带对应的频率数据;或者,从声音信号X中选取关注的频率段平均划分为J个子带,得到每个子带对应的频率数据。
子步骤1022,基于J个子带对应的频域数据,得到J个子带的空间相关系数。
具体而言,在声音信号X对应的频域数据被划分为J个子带,得到各子带对应的频域数据后,针对每个子带,可以根据该子带所对应的频域数据,得到该子带的空间相关系数,由此能够得到各子带的空间相关***。
在一个例子中,对于每个子带,从频域数据中获取两个阵元在子带上的目标频域数据,并基于两个阵元对应的目标频域数据,得到子带的空间相关系数。具体的,从声音采集装置包含的M个阵元中先选取两个目标阵元,然后将这两个目标阵元对应行的频域数据在该子带上的频域数据作为目标频域数据。本实施例中,由于相邻的两个阵元接收到声音信号是相似的,可以从频域数据中获取相距最远的两个阵元在子带上的目标频域数据,例如,对于直线型的麦克风阵列,则选取直线两端的阵元在子带上的频域数据作为目标频域数据,可以尽可能减小选取的两个阵元之间的相互影响,以计算得到更加准确的空间相关系数。
对于J个子带中的第j子带,在获取了两个阵元在第j子带上的两个目标频域数据后,可以根据以下公式计算第j子带的空间相关系数j=1、2、…、J,空间相关系数的计算公式具体为:
其中,表示J个子带中的第j个子带的空间相关系数,X1(j)表示两个阵元中的其中一个阵元在第j个子带上的目标频域数据,X2(j)表示两个阵元中的另一个阵元在第j个子带上的目标频域数据,/>表示X1(j)的共轭转置,/>表示X2(j)的共轭转置。X1(j)、X2(j)均的数据维度均为N/2J×1。
子步骤1023,基于J个子带的空间相关系数,按照空间相关系数从大到小从J个子带中选取K个子带组成第一子带集合,1≤K≤J,K为整数。
具体而言,在计算得到J个子带的空间相关系数后,将J个子带按照空间相关系数从大到小进行排列,从中选取前K个子带组成第一子带集合idxSC,第一子带集合idxSC中包含的K个子带即为满足空间相关条件的子带。例如,J=16,则可以预设K的初始值为8,由此可以从16个子带中选取8个空间相关系数大的子带组成第一子带集合idxSC
步骤103,从由声音信号对应的时域数据划分得到J个子带中,选取满足信噪比条件的子带组成的第二子带集合。
在一个例子中,请参考图3,步骤103包括以下子步骤:
子步骤1031,获取声音信号中包含的信源数量,并利用J个带通滤波器将声音信号滤波得到J个子带对应的时域数据。
具体而言,利用信息论方法可以获取声音信号X中所包含的信源数量,例如可以利用AIC准则获取声音信号X中所包含的信源数量P,先估计声音信号X协方差矩阵对协方差矩阵/>进行特征值分解,得到M个特征值,分别为λ1、λ2、…、λM,且λ1≥λ2≥…≥λM。声音信号X中所包含的信源数量P的计算公式为:
其中,P表示声音信号X中所包含的信源数量,M表示声音信号X的行数,N表示声音信号X的帧长,Λ(n)为似然函数。
在需要将声音信号X划分为J个子带时,针对每个子带设置对应的带通滤波器,带通滤波器的上限截止频率为:
带通滤波器的下限截止频率为:
其中,fHj表示J个子带中的第j个子带对应的带通滤波器的上限截止频率,fLj表示J个子带中的第j个子带对应的带通滤波器的下限截止频率,Fs表示声音信号的采样频率。
随后,将声音信号X分别输入到各子带对应的带通滤波器中,能够得到J个子带对应的J个时域数据,分别记为X1,X2,…,XJ,各子带对应的时域数据的数据维度为M×N。
子步骤1032,根据信源数量与J个子带对应的时域数据,得到J个子带的信噪比。
具体而言,先根据信源数量与J个子带对应的时域数据,分别计算各子带对应的时域数据的信号功率与噪声功率,由此能够得到J个子带对应的时域数据的信号功率与噪声功率。
本实施例中,在计算J个子带对应的时域数据的信号功率与噪声功率时,先分别计算各子带对应的时域数据的协方差矩阵的特征值;随后,对于每个子带,根据子带对应的时域数据的协方差矩阵的特征值与信源数量,得到子带对应的时域数据的信号功率与噪声功率。
以第j个子带对应的时域数据Xj为例,先获取时域数据Xj的协方差矩阵对协方差矩阵/>进行特征值分解,得到M个特征值,分别记为λ1、λ2、…、λM
第j个子带对应的时域数据Xj的信号功率的计算公式为:
第j个子带对应的时域数据Xj的噪声功率的计算公式为:
其中,表示J个子带中的第j个子带对应的时域数据的信号功率,/>表示J个子带中的第j个子带对应的时域数据的噪声功率,M表示子带对应的时域数据的协方差矩阵的特征值的数量,λi表示M个特征值中的第i个特征值,P表示信源数量。
在得到J个子带对应的时域数据的信号功率与噪声功率后,对于每个子带,基于子带对应的时域数据的信号功率与噪声功率,得到子带的信噪比。具体的,以第j个子带为例,在计算得到第j个子带对应的时域数据的信号功率与第j个子带对应的时域数据的噪声功率/>后,基于下面的计算公式为计算第j个子带的信噪比Lj
其中,Lj表示J个子带中的第j个子带的信噪比,表示J个子带中的第j个子带对应的时域数据的信号功率,/>表示J个子带中的第j个子带对应的时域数据的噪声功率。
子步骤1033,根据J个子带的信噪比,按照信噪比从大到小从J个子带中选取K个子带组成第二子带集合,1≤K≤J,K为整数。
具体而言,在计算得到J个子带的信噪比后,将J个子带按照信噪比从大到小进行排列,从中选取前K个子带组成第二子带集合idxSNR,第二子带集合idxSNR中包含的K个子带即为满足空间相关条件的子带。例如,J=16,则可以预设K的初始值为8,由此可以从16个子带中选取8个信噪比大的子带组成第二子带集合idxSNR
需要说明的是,在步骤102由声音信号对应的频域数据划分得到J个子带和步骤103由声音信号对应的时域数据划分得到J个子带,是按照相同的频率划分方式进行划分的,即步骤102划分得到的J个子带与步骤103划分得到的J个子带相比,对应的子带具有相同的频率段。
步骤104,基于第一子带集合与第二子带集合,选取声音信号中包含的目标子带。
具体而言,对第一子带集合idxSC与第二子带集合idxSNR求交集得到集合A,集合A中包括第一子带集合idxSC与第二子带集合idxSNR之间重合的子带,集合A中的子带即为声音信号中包含的目标子带。
在一个例子中,步骤104之后,还包括:
步骤105,若连续多帧声音信号中包含的目标子带的数量均小于第一预设阈值,增大K的值。
步骤106,若连续多帧声音信号中包含的目标子带的数量均大于第二预设阈值,减小K的值。
具体而言,在获取每帧声音信号中包含的目标子带的数量后,以该帧声音信号为起点,获取连续的Y(Y>1,且为整数)帧声音信号包含的目标子带的数量,若连续Y帧图像所包含的目标子带的数量均小于第一预设阈值,增大K的值,例如控制K按照预设步长进行增大,预设步长例如为1,则调整K=min(K+1,J),则后续获取的第一子带集合与第二子带集合中包含的子带数量均增多;若连续Y帧图像所包含的目标子带的数量均大于第二预设阈值,减小K的值,例如控制K按照预设步长进行减小,预设步长例如为1,则调整K=max(K-1,1);由此实现了第一子带集合与第二子带集合中选取的子带数量K值的自适应调整,由于野外等复杂环境存在复杂性和时变性,无法预先估计所选取出的目标子带的数量,因此在连续多帧声音信号中选取的目标子带的数量过少时,增加第一子带集合中以信噪比为准则标记的子带数目和第二子带集合中以空间相关为准则标记的子带数目;并在连续多帧声音信号中选取的目标子带的数量过多时,减少第一子带集合中以信噪比为准则标记的子带数目和第二子带集合中以空间相关为准则标记的子带数目,避免选取信噪比和空间相关性较差的一个或多个子带,提升了选取子带的质量,避免影响后续利用子带进行DOA估计的质量,减少对DOA估计结果的干扰。
本实施例的信号处理方法适用于存在变干扰源干扰和时变背景噪声的复杂环境的声音信号的处理,以野外复杂环境为例,存在以风噪声为主的变干扰源干扰,风噪声的频谱特性随时间和环境变化剧烈;同时,还存在野外环境噪声等时变的背景噪声。
以目标声源为轮式车辆、声音采集装置为麦克风阵列为例,在轮式车辆先接近后远离麦克风阵列时,麦克风阵列所采集的声音信号X的时域波形如图4A所示,图4B为声音信号X的频域能量谱图,可见随着轮式车辆接近麦克风阵列,部分子带的信号功率呈递增状态,即这些子带与声音信号密切相关、信噪比高,适用于对轮式车辆进行DOA估计,而本实施例中,挑选的组成第二子带集合的子带均为满足信噪比条件的子带,即为信噪比较高的子带,有助于进行DOA估计的有效性和稳定性。
图4C为声音信号X的空间域能量谱图,在空间相关反映了不同信号频域的相似性,在野外复杂环境中,目标声源产生的目标声场可以看做自由场,而由风的湍流引起的噪声可以看做是麦克风阵列的噪声场。若来源于目标声源的信号被麦克风阵列接收时,其中两个阵元的两路信号具有高度的空间相关性,即空间相关系数的值接近于1,而风噪声湍流部分的方向不确定性,属于噪声场,其空间相关系数的值接近于0;图图4C所示,在40s至50s之间的片段反映了部分子带具有较低的空间相关,说明其中含有的风噪声能量较高,不适用于DOA估计。
采用本实施例中的信号处理方法,能够标记处声音信号中空间相关较高的子带组成第一子带集合、标记信噪比较高的子带组成第二子带集合,随后便可以基于第一子带集合与第二子带集合求交,挑选出受风噪声和背景噪声影响均比较小的目标子带,提升了在野外环境下进行DOA估计的稳定性。
本实施例提供了一种信号处理方法,在获取了由由声音采集装置采集的声音信号后,从由声音信号对应的频域数据划分得到J个子带中,选取满足空间相关条件的子带组成的第一子带集合,再从由声音信号对应的时域数据划分得到J个子带中,选取满足信噪比条件的子带组成的第二子带集合,随后基于第一子带集合与第二子带集合,选取声音信号中包含的目标子带;相当于将声音信号划分为J个子带,并实时估计声音信号各个子带的信噪比和空间相关,获取声音信号的频域特征和空间特征,由此能够选取出信噪比高且空间相关较高的子带作为目标子带,以在利用声音信号的目标子带进行DOA估计等计算时,抑制变干扰源干扰和时变背景噪声对DOA估计所带来的不利影响,提升了野外复杂环境下的DOA估计的稳定性,由此能够取得更好的DOA估计效果,并且具有较强的可靠性和环境普适性。
本发明的第二实施例涉及一种DOA估计方法,应用于电子设备,电子设备例如为手机、平板电脑、台式主机、定位设备等,电子设备可以采用本实施例中的DOA估计方法对目标声源进行DOA估计。
本实施方式的DOA估计方法的具体流程如图5所示。
步骤201,接收声音采集装置采集的目标声源的声音信号。
具体而言,声音采集装置可以按照设定的采样频率Fs采集来源于目标声源(例如为轮式车辆等移动目标声源)的声音信号,并将采集的声音信号发送到电子设备中,采集的声音信号为时域数据,假设声音采集装置包括M个阵元(M>1),声音采集装置采集的一帧声音信号X中的数据维度为M×N,N表示帧长,N与采样频率Fs相关,例如采样频率Fs为1024Hz,则N=1024;即一帧声音信号中包括M行的时域数据,每个阵元对应于一行的时域数据。
步骤202,获取声音信号中包含的目标子带,声音信号中包含的目标子带基于第一实施例中的信号处理方法得到。
具体而言,电子设备基于第一实施例中的信号处理方法,获取声音信号中信噪比高且空间相关较高的子带作为目标子带,具体请参见第一实施例,在此不再赘述。
步骤203,基于预设的宽带信号处理算法与声音信号中包含的目标子带,对目标声源进行DOA估计。
具体而言,宽带信号处理算法可以为ISM算法或CSM算法,下面CSM算法中的双边相关变换算法为例对目标声源进行DOA估计,具体如下:
假设声音信号中包含W(1≤W≤K)个目标子带,选择参考频率f0,参考频率f0的计算公式如下:
Pj=Rjj 2I;
其中,P0是频率点f0的去噪后的协方差矩阵,I是酉矩阵,R0是频率点f0的协方差矩阵,是频率点f0的协方差矩阵的最小特征值,σ(P0)表示协方差矩阵的P0的奇异值,Pj是频率点fj的去噪后的协方差矩阵,Rj是频率点fj的协方差矩阵,σj 2是频率点fj的协方差矩阵的最小特征值,Q表示去噪后的协方差矩阵P0的列数。
在选定参考频率f0后,基于声音信号中包含W(1≤W≤K)个目标子带,得到在参考频率点和其他频率点上的去躁数据协方差矩阵,随后对去躁数据协方差矩阵进行特征分解,构造各频率点的聚焦矩阵,各频率点的聚焦矩阵的构造公式为:
其中,Tβ(fj)是频率点f的聚焦矩阵,和/>是各列相互正交的M×M的矩阵,它们的前Q列分别是span{P(f0)}和span{P(fj)}的正交基,即/>和/>分别是P0和Pj的特征矢量。
随后由聚焦变换得到单一频率点的数据协方差矩阵,在利用空间谱估计方法(例如多重信号分类算法)便可以估计来源于目标声源的声音信号的入射方向。
本发明的第三实施例涉及一种电子设备,电子设备例如为台式主机、平板电脑、笔记本电脑、定位设备等。电子设备包括至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一实施例中的信息处理方法和/或第二实施例中的DOA估计方法。
其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,***接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
本发明第四实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
以上已详细描述了本发明的较佳实施例,但应理解到,若需要,能修改实施例的方面来采用各种专利、申请和出版物的方面、特征和构思来提供另外的实施例。
考虑到上文的详细描述,能对实施例做出这些和其它变化。一般而言,在权利要求中,所用的术语不应被认为限制在说明书和权利要求中公开的具体实施例,而是应被理解为包括所有可能的实施例连同这些权利要求所享有的全部等同范围。

Claims (12)

1.一种信号处理方法,其特征在于,包括:
获取由声音采集装置采集的声音信号;
从由所述声音信号对应的频域数据划分得到J个子带中,选取满足空间相关条件的所述子带组成的第一子带集合,包括:将所述声音信号转换为频域数据,并将所述频域数据划分为J个子带;基于J个所述子带对应的频域数据,得到J个所述子带的空间相关系数;基于J个所述子带的空间相关系数,按照空间相关系数从大到小从J个所述子带中选取K个所述子带组成第一子带集合,1≤K≤J,K为整数;J为大于1的整数;
从由所述声音信号对应的时域数据划分得到J个子带中,选取满足信噪比条件的所述子带组成的第二子带集合,包括:获取所述声音信号中包含的信源数量,并利用J个带通滤波器将所述声音信号滤波得到J个子带对应的时域数据;根据所述信源数量与J个所述子带对应的时域数据,得到J个所述子带的信噪比;根据J个所述子带的信噪比,按照信噪比从大到小从J个所述子带中选取K个所述子带组成第二子带集合,1≤K≤J,K为整数;
基于所述第一子带集合与所述第二子带集合,选取所述声音信号中包含的目标子带。
2.根据权利要求1所述的信号处理方法,其特征在于,所述将所述声音信号转换为频域数据,包括:对所述声音信号进行傅里叶变换得到参考频域数据,选取所述参考频域数据的前一半作为所述声音信号对应的频域数据。
3.根据权利要求1所述的信号处理方法,其特征在于,所述声音采集装置中包括多个阵元;所述基于J个所述子带对应的频域数据,得到J个所述子带的空间相关系数,包括:
对于每个所述子带,从所述频域数据中获取两个所述阵元在所述子带上的目标频域数据,并基于两个所述阵元对应的目标频域数据,得到所述子带的空间相关系数。
4.根据权利要求3所述的信号处理方法,其特征在于,从所述频域数据中获取两个所述阵元在所述子带上的目标频域数据,包括:
从所述频域数据中获取相距最远的两个所述阵元在所述子带上的目标频域数据。
5.根据权利要求3所述的信号处理方法,其特征在于,所述子带的空间相关系数的计算公式为:
其中,表示J个子带中的第j个所述子带的空间相关系数,X1(j)表示两个所述阵元中的其中一个所述阵元在第j个所述子带上的目标频域数据,X2(j)表示两个所述阵元中的另一个所述阵元在第j个所述子带上的目标频域数据,/>表示X1(j)的共轭转置,表示X2(j)的共轭转置。
6.根据权利要求5所述的信号处理方法,其特征在于,所述根据所述信源数量与J个所述子带对应的时域数据,得到J个所述子带的信噪比,包括:
根据所述信源数量与J个所述子带对应的时域数据,分别计算各所述子带对应的时域数据的信号功率与噪声功率;
对于每个所述子带,基于所述子带对应的时域数据的信号功率与噪声功率,得到所述子带的信噪比。
7.根据权利要求6所述的信号处理方法,其特征在于,所述根据所述信源数量与J个所述子带对应的时域数据,分别计算各所述子带对应的时域数据的信号功率与噪声功率,包括:
分别计算各所述子带对应的时域数据的协方差矩阵的特征值;
对于每个所述子带,根据所述子带对应的时域数据的协方差矩阵的特征值与所述信源数量,得到所述子带对应的时域数据的信号功率与噪声功率。
8.根据权利要求7所述的信号处理方法,其特征在于,所述子带对应的时域数据的信号功率的计算公式为:
所述子带对应的时域数据的噪声功率的计算公式为:
其中,表示J个子带中的第j个所述子带对应的时域数据的信号功率,/>表示J个子带中的第j个所述子带对应的时域数据的噪声功率,M表示所述子带对应的时域数据的协方差矩阵的特征值的数量,λi表示M个特征值中的第i个特征值,P表示信源数量;
所述子带的信噪比的计算公式为:
其中,Lj表示J个子带中的第j个所述子带的信噪比,表示J个子带中的第j个所述子带对应的时域数据的信号功率,/>表示J个子带中的第j个所述子带对应的时域数据的噪声功率。
9.根据权利要求1所述的信号处理方法,其特征在于,
所述带通滤波器的上限截止频率为:
所述带通滤波器的下限截止频率为:
其中,fHj表示J个子带中的第j个所述子带对应的带通滤波器的上限截止频率,fLj表示J个子带中的第j个所述子带对应的带通滤波器的下限截止频率,Fs表示声音信号的采样频率。
10.根据权利要求1所述的信号处理方法,其特征在于,所述方法还包括:若连续多帧所述声音信号中包含的目标子带的数量均小于第一预设阈值,增大K的值;
若连续多帧所述声音信号中包含的目标子带的数量均大于第二预设阈值,减小K的值。
11.一种DOA估计方法,其特征在于,包括:
接收声音采集装置采集的目标声源的声音信号;
获取所述声音信号中包含的目标子带,所述声音信号中包含的目标子带基于权利要求1至10中任一项的信号处理方法得到;
基于预设的宽带信号处理算法与所述声音信号中包含的目标子带,对所述目标声源进行DOA估计。
12.一种电子设备,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至10中任一项所述的信号处理方法和/或权利要求11所述的DOA估计方法。
CN202210588392.2A 2022-05-27 2022-05-27 信号处理方法、doa估计方法及电子设备 Active CN115061087B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210588392.2A CN115061087B (zh) 2022-05-27 2022-05-27 信号处理方法、doa估计方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210588392.2A CN115061087B (zh) 2022-05-27 2022-05-27 信号处理方法、doa估计方法及电子设备

Publications (2)

Publication Number Publication Date
CN115061087A CN115061087A (zh) 2022-09-16
CN115061087B true CN115061087B (zh) 2024-05-14

Family

ID=83198620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210588392.2A Active CN115061087B (zh) 2022-05-27 2022-05-27 信号处理方法、doa估计方法及电子设备

Country Status (1)

Country Link
CN (1) CN115061087B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115792795B (zh) * 2023-02-13 2023-05-26 北京理工大学 基于稀疏贝叶斯学习和频带聚类的宽带信号doa估计方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106772227A (zh) * 2017-01-12 2017-05-31 浙江大学 一种基于声纹多谐波识别的无人机方向估计方法
CN112034418A (zh) * 2020-09-15 2020-12-04 北京中电慧声科技有限公司 基于频域Bark子带的波束扫描方法及声源定向装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8861756B2 (en) * 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
US20140270219A1 (en) * 2013-03-15 2014-09-18 CSR Technology, Inc. Method, apparatus, and manufacture for beamforming with fixed weights and adaptive selection or resynthesis
WO2018133056A1 (zh) * 2017-01-22 2018-07-26 北京时代拓灵科技有限公司 一种声源定位的方法和装置
US10334357B2 (en) * 2017-09-29 2019-06-25 Apple Inc. Machine learning based sound field analysis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106772227A (zh) * 2017-01-12 2017-05-31 浙江大学 一种基于声纹多谐波识别的无人机方向估计方法
CN112034418A (zh) * 2020-09-15 2020-12-04 北京中电慧声科技有限公司 基于频域Bark子带的波束扫描方法及声源定向装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"A Nested Microphone Array for Broadband Audio Signal Processing";Iman Moazzen et al;《2013 IEEE Pacific Rim Conference on Communications, Computers and Signal Processing (PACRIM)》;20131010;第377-382页 *
"基于MEMS声传感器阵列的车辆鸣笛声抓拍***设计与实现";张瑞等;《传感技术学报》;20200415;第33卷(第4期);第612-620页 *

Also Published As

Publication number Publication date
CN115061087A (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
Pedersen et al. Convolutive blind source separation methods
EP3526979B1 (en) Method and apparatus for output signal equalization between microphones
Salvati et al. Incoherent frequency fusion for broadband steered response power algorithms in noisy environments
Koldovsky et al. Time-domain blind separation of audio sources on the basis of a complete ICA decomposition of an observation space
Hassani et al. Cooperative integrated noise reduction and node-specific direction-of-arrival estimation in a fully connected wireless acoustic sensor network
CN110517701B (zh) 一种麦克风阵列语音增强方法及实现装置
Boashash et al. Robust multisensor time–frequency signal processing: A tutorial review with illustrations of performance enhancement in selected application areas
US10818302B2 (en) Audio source separation
US20160295322A1 (en) Adaptive Mixing of Sub-Band Signals
CN110444220B (zh) 一种多模态远程语音感知方法及装置
CN110709929B (zh) 处理声音数据以分离多声道信号中的声源
CN115061087B (zh) 信号处理方法、doa估计方法及电子设备
WO2023108864A1 (zh) 小型麦克风阵列设备的区域拾音方法及***
Neo et al. Polynomial eigenvalue decomposition for multichannel broadband signal processing: a mathematical technique offering new insights and solutions
EP3929920B1 (en) Method and device for processing audio signal, and storage medium
CN110890099B (zh) 声音信号处理方法、装置以及存储介质
CN112802490B (zh) 一种基于传声器阵列的波束形成方法和装置
Albataineh et al. A RobustICA-based algorithmic system for blind separation of convolutive mixtures
Liu et al. A time domain algorithm for blind separation of convolutive sound mixtures and L1 constrainted minimization of cross correlations
US11823698B2 (en) Audio cropping
CN113345465B (zh) 语音分离方法、装置、设备及计算机可读存储介质
CN112311999A (zh) 智能视频音箱设备及其摄像头视角调整方法
CN115249485A (zh) 语音增强方法、装置、电子设备及存储介质
CN113012711A (zh) 一种语音处理方法、装置及设备
CN114242096B (zh) 一种基于时频域的降噪***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant