CN104503963A - 头相关脉冲响应数据集处理方法 - Google Patents

头相关脉冲响应数据集处理方法 Download PDF

Info

Publication number
CN104503963A
CN104503963A CN201410512710.2A CN201410512710A CN104503963A CN 104503963 A CN104503963 A CN 104503963A CN 201410512710 A CN201410512710 A CN 201410512710A CN 104503963 A CN104503963 A CN 104503963A
Authority
CN
China
Prior art keywords
hrir
point
dimensional
sample point
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410512710.2A
Other languages
English (en)
Other versions
CN104503963B (zh
Inventor
陈喆
殷福亮
周文颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201410512710.2A priority Critical patent/CN104503963B/zh
Publication of CN104503963A publication Critical patent/CN104503963A/zh
Application granted granted Critical
Publication of CN104503963B publication Critical patent/CN104503963B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明实施例提供一种头相关脉冲响应数据集处理方法。本发明方法,包括:处理器将头相关脉冲响应HRIR数据集按照仰角和/或水平角进行分组;所述处理器通过局部线性嵌入算法LLE在分组后HRIR中选取重构误差最小值的HRIR作为高维HRIR样本点;所述处理器将所述HRIR样本点降维至低维空间,得到低维HRIR;所述处理器采用分段直线拟合在所述低维HRIR样本点中选取特征HRIR样本点;所述处理器按照仰角顺序和/或水平角顺序将所述特征HRIR样本点组合为三维矩阵。本发明实施例解决了特征HRIR选取方法误差过大的问题。

Description

头相关脉冲响应数据集处理方法
技术领域
本发明实施例涉及计算机科学领域,尤其涉及一种头相关脉冲响应数据集处理方法。
背景技术
人类听觉不仅能感觉声音的音调、音强、音色,还能分辨声源方向与距离。为了使不在现场的听众也能获得逼真的“临场感”,人们发明了三维音频技术。三维音频技术可以真实地再现原始声场的声音信息,使听者产生“身临其境”的聆听体验。三维音频可通过“双耳声”技术来实现,即采用头相关传递函数(Head Related Transfer function,以下简称:HRTF)对单通道声源信号进行滤波,将得到的具有方向感的声音,而后用耳机或一对扬声器进行重放。HRTF时域表示称为头相关脉冲响应(Head Related Impulse Responses,以下简称:HRIR)。双耳声学技术已广泛应用于盲人听觉导航、飞行训练、虚拟现实中。HRTF描述了声音从声源传播到耳内的过程中,人的躯干、头部、耳部等对声音信号有衍射、反射、遮挡等效应,可以等效为滤波作用。实际中通常采用经过精确实验测量得到的HRTF数据库。如图1所示,这种数据库是一个三维矩阵,存储了上千个声源空间位置的HRTF,每个HRTF的冲击响应持续时间较长,等效FIR滤波器阶数很高,并且每个人的HRTF都不尽相同。因此,要存储多位测量者的HRTF数据,需要消耗巨大的存储空间。当采用嵌入式芯片合成三维虚拟声时,其存储空间更显匮乏,成为三维音频技术应用的瓶颈。此时,若能以难以察觉的听觉定位性能损失为代价,来换取HRTF数据库的非常大的存储空间减少量,就可较好解决HRTF数据库耗费存储量大的问题,减少实际应用中所使用的芯片的功耗与成本。
现有技术中,采用流形学***角的所有HRIR分为一组,对每组HRIR,通过降维模块,将高维HRIR样本点降维至低维空间,得到低维的HRIR样本点,该降维模块使用的是LLE算法;然后,通过特征点选取模块,对每组低维样本点进行聚类,得到聚类中心所对应的低维样本点,该低维样本点所对应的高维HRIR即为该组所选出的特征HRIR,特征点选取模块采用的是K-均值聚类算法。根据特征HRIR重构所有HRIR时,采用两步插值:第一、采用线性插值,根据该组的特征HRIR,重构该组所有非特征HRIR;第二、根据中LLE模块中所得到的邻域矩阵neighbor与权值矩阵W,对非特征HRIR再次进行插值,得到该组所有重构后的HRIR。
由于在特征HRIR提取过程中,采用K-均值聚类模块所提取得到的特征HRIR进行加权重构,重构误差偏大。并且在根据特征HRIR重构所有HRIR过程中,加权重构模块中所采用的两步插值得到的重构误差偏大,这是由于进行第二步插值时,非特征HRIR是经过线性插值而来,本身已带有误差,若使用这些HRIR对其他方位HRIR进行重构则会导致误差累计。
发明内容
本发明实施例提供一种头相关脉冲响应数据集处理方法,以克服现有技术中对于HRIR的重构误差大的技术问题。
本发明实施例提供了一种头相关脉冲响应数据集处理方法,包括:
处理器将头相关脉冲响应HRIR数据集按照仰角和/或水平角进行分组;
所述处理器通过局部线性嵌入算法LLE在分组后HRIR中选取重构误差最小值的HRIR作为高维HRIR样本点;
所述处理器将所述HRIR样本点降维至低维空间,得到低维HRIR;
所述处理器采用分段直线拟合在所述低维HRIR样本点中选取特征HRIR样本点;
所述处理器按照仰角顺序和/或水平角顺序将所述特征HRIR样本点组合为三维矩阵。
进一步地,所述处理器通过局部线性嵌入算法LLE在分组后HRIR中选取重构误差最小值的HRIR作为HRIR样本点,包括:
处理器在分组后HRIR中选取一个HRIR样本点,计算所述HRIR样本点与其他HRIR样本点之间的欧式距离,并根据所述欧式距离选取所述HRIR样本点的临近点;
构造所述HRIR样本点的局部协方差矩阵,确定重构误差的条件值
Σ j = 1 K w j i = 1 - - - ( 1 )
其中,所述K为与HRIR样本点xi的邻近点个数,所述j为第j个邻近点的下标,所述为使用第j个邻近点xj重构xi的权值;
通过所述局部协方差矩阵Qi以及所述条件值,采用公式
w j i = Σ k = 1 K ( Q i ) jk - 1 Σ j = 1 K Σ k = 1 K ( Q i ) jk - 1 - - - ( 2 )
计算所述HRIR样本点的权值重建矩阵wij,其中,所述K为局部协方差矩阵Qi的维数,所述i为第i个样本点的下标,所述k为局部协方差矩阵Qi的第k维,所述j为第j个邻近点的下标;
将所述wij代入重构误差函数公式
min ϵ ( W ) = Σ i = 1 I | x i - Σ j = 1 K w j i x j | 2 - - - ( 3 )
确定重构误差最小值所对应的HRIR样本点为可进行降维处理的高维HRIR样本点,其中,所述I为样本总点数,所述i为第i个样本的下标,所述K为设定与所述HRIR样本点xi欧式距离最小的样本点的个数,所述xi为所述选取的HRIR样本点,所述xj为所述xi的第j个邻近点,所述minε(W)为最小重构误差值;
所述处理器将所述HRIR样本点降维至低维空间,得到低维HRIR,包括:
将满足公式
Σ i = 1 N y i = 0 , 1 N Σ i = 1 N y i y i T = I - - - ( 4 )
的所述HRIR样本点代入公式
min ϵ ( Y ) = Σ i = 1 I | y i - Σ j = 1 K w j i y j | 2 - - - ( 5 )
得到损失函数
min ϵ ( Y ) = Σ j = 1 N Σ j = 1 N m ij y i T y j - - - ( 6 )
选取公式
M=(I-W)T(I-W)   (7)
中M的最小d个非零特征值代入到所述损失函数,得到与Y的特征向量作为映射至低维空间的对应的样本点,其中,所述yi为所述xi的低维映射向量,所述yj为所述yi的第j个邻近点,所述minε(Y)为损失函数,所述i为第i个样本的下标,所述j为第j个邻近点的下标,所述I为样本总点数,所述k为与yi邻近的点数。
进一步地,所述处理器采用分段直线拟合在所述低维的HRIR样本点中选取特征HRIR样本点,包括:
对于低维HRIR组的一维流形的任意两个起始点采用公式
y 1 d y 2 d · · · y Nd = y 11 y 12 · · · y 1 , d - 1 y 21 y 22 · · · y 2 , d - 1 · · · · · · · · · y N 1 y N 2 · · · y N , d - 1 a 0 a 1 · · · a d - 1 - - - ( 8 )
计算直线系数(a0,a1,…,ad-1),其中,所述y为低维HRIR组的一维流形的点,所述d为空间维数,所述a为直线系数;
按照一维流形的延伸方向,加入N点,采用公式
e N = Σ i = 1 N [ | | y id - y ^ id | | 2 ] 2 - - - ( 9 )
计算N点拟合误差eN,其中,所述N为所述任意两个起始点所构成直线的点数,所述i为第i段直线点数,所述y为低维HRIR组的一维流形的点,所述d为空间维数,所述为低维HRIR组的一维流形的实际点;
若N点的所述拟合误差eN小于最大误差eMAX,则将N点加入到两个起始点之间的点列中;若N点的所述拟合误差eN大于最大误差eMAX则将N-1点作为该段直线的端点,则所述端点所对应的高维HRIR即为特征HRIR。
进一步地,所述eMAX=ENER×ratio,其中,所述ratio为拟合误差比值,所述ENER为低维嵌入流形的归一化能量。
本发明实施例,处理器将HRIR数据集按照仰角和/或水平角进行分组,所述处理器通过局部线性嵌入算法LLE在分组后HRIR中选取重构误差最小值的HRIR作为高维HRIR样本点,所述处理器将所述HRIR样本点降维至低维空间,得到低维HRIR,采用分段直线拟合在所述低维HRIR样本点中选取特征HRIR样本点,按照仰角顺序和/或水平角顺序将所述特征HRIR样本点组合为三维矩阵,解决了现有技术中特种HRIR选取方法误差过大的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中HRTF三维数据库示意图;
图2为本发明HRIR数据集处理方法流程图;
图3为本发明HRIR三维数据集处理方法流程图;
图4为本发明局部线性嵌入算法LLE示意图;
图5为本发明2维特征HRIR位置示意图;
图6为本发明头相关坐标系示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图2为本发明头相关脉冲响应数据集处理方法流程图,如图2所示,本实施例的方法可以包括:
步骤101、处理器将头相关脉冲响应HRIR数据集按照仰角和/或水平角进行分组;
步骤102、所述处理器通过局部线性嵌入算法LLE在分组后HRIR中选取重构误差最小值的HRIR作为高维HRIR样本点;
步骤103、所述处理器将所述HRIR样本点降维至低维空间,得到低维HRIR;
步骤104、所述处理器采用分段直线拟合在所述低维HRIR样本点中选取特征HRIR样本点;
步骤105、所述处理器按照仰角顺序和/或水平角顺序将所述特征HRIR样本点组合为三维矩阵。
具体来说,在HRIR数据库中,对于一个平面的HRIR的各个方位应该是均匀分布的。举例说明,CIPIC的HRIR数据库中,水平角上的测量方位分别为-80°、-65°,-55°,-45°~45°,55°,65°,80°。其中,在[-45°,45°]间以5°间隔进行均匀采样。因此,应将每个水平角平面的[-45°,45°]间的HRIR编为一组。而两端的-80°、-65°,-55°,-45°~45°,55°,65°,80°方位的HRIR将直接纳入特征HRIR集中。图3a为分组后的HRIR三维数据各个仰角平面,图3b为分组后的HRIR三维数据各个水平角平面。对于分组后的HRIR通过局部线性嵌入算法(Locally Linear Embedding,以下简称:LLE)计算重构误差,并选取重构误差最小值的HRIR作为高维HRIR样本点,将该高维HRIR样本点降维至低维空间,在低维空间中得到对应的低维HRIR,采用分段直线拟合从低维HRIR样本点中选取特征HRIR样本点,最后按照仰角和/或水平角顺序将所述特征HRIR样本点组合为三维矩阵。
本发明实施例,处理器将HRIR数据集按照仰角和/或水平角进行分组,所述处理器通过局部线性嵌入算法LLE在分组后HRIR中选取重构误差最小值的HRIR作为高维HRIR样本点,所述处理器将所述HRIR样本点降维至低维空间,得到低维HRIR,采用分段直线拟合在所述低维HRIR样本点中选取特征HRIR样本点,按照仰角顺序和/或水平角顺序将所述特征HRIR样本点组合为三维矩阵,解决了现有技术中特种HRIR选取方法误差过大的问题。
图4为本发明局部线性嵌入算法LLE示意图,如图4所示,本实施例的方法可以包括:
步骤201、处理器在分组后HRIR中选取一个HRIR样本点,计算所述HRIR样本点与其他HRIR样本点之间的欧式距离,并根据所述欧式距离选取所述HRIR样本点的临近点;
步骤202、构造所述HRIR样本点的局部协方差矩阵、确定重构误差的条件值
Σ j = 1 K w j i = 1 - - - ( 1 )
其中,所述K为与HRIR样本点xi的邻近点个数,所述j为第j个邻近点的下标,所述为使用第j个邻近点xj重构xi的权值;
步骤203、通过所述局部协方差矩阵Qi以及所述条件值,采用公式
w j i = Σ k = 1 K ( Q i ) jk - 1 Σ j = 1 K Σ k = 1 K ( Q i ) jk - 1 - - - ( 2 )
计算所述HRIR样本点的权值重建矩阵wij,其中,所述K为局部协方差矩阵Qi的维数,所述i为第i个样本点的下标,所述k为局部协方差矩阵Qi的第k维,所述,j为第j个邻近点的下标;
步骤204、将所述wij代入重构误差函数公式
min ϵ ( W ) = Σ i = 1 I | x i - Σ j = 1 K w j i x j | 2 - - - ( 3 )
确定重构误差最小值所对应的HRIR样本点为可进行降维处理的高维HRIR样本点,其中,所述I为样本总点数,所述i为第i个样本的下标,所述K为设定与所述HRIR样本点xi欧式距离最小的样本点的个数,所述xi为所述选取的HRIR样本点,所述xj为所述xi的第j个邻近点,所述minε(W)为最小重构误差值;
具体来说,在LLE算法中每一个HRIR都可以认为是高维空间中的一个样本点,记为xi,i=1,2,…,I。通过计算每个样本点xi与其余样本点之间欧式距离,并把距离最小的K个样本点作为xi的近邻点。K值可以预先设定,本实施例中取为12。接下来计算通过式(1)计算重建权值矩阵W。
min ϵ ( W ) = Σ i = 1 I | x i - Σ j = 1 K w j i x j | 2 - - - ( 4 )
其中,xj为xi的第j个近邻点;为使用xj重构xi的权值,需满足条件构造该样本点的局部协方差矩阵Qi,其元素通过公示(2)计算,
q i jk = ( x i - x j ) T ( x i - x k ) - - - ( 5 )
其中,所述T为矩阵转置运算;
将式(5)与结合,使用式(6)计算wij
w j i = Σ k = 1 K ( Q i ) jk - 1 Σ j = 1 K Σ k = 1 K ( Q i ) jk - 1 - - - ( 6 )
其中,Qi∈RK×K。为防止由于Qi是奇异矩阵而无法计算,须对Qi进行正则化,
Qi=Qi+rI   (7)
其中,r为正则化系数;I∈RK×K为单位矩阵。
所述处理器将高维HRIR样本点降维至低维空间的具体步骤,包括:
高维HRIR样本点需满足
min ϵ ( Y ) = Σ i = 1 I | y i - Σ j = 1 K w j i y j | 2 - - - ( 8 )
其中,ε(Y)为损失函数,yi是xi的低维映射向量,yj是yj的第j个近邻点,yi需满足下列条件,
Σ i = 1 I y i = 0 , 1 N Σ i = 1 I y i y i T = I - - - ( 9 )
使用稀疏矩阵W∈RI×I存储当xj属于xi近邻点时,W中的元素否则,wij=0。将损失函数写为
min ϵ ( Y ) = Σ i = 1 I Σ j = 1 I m ij y i T y j - - - ( 10 )
其中,mij是矩阵M的元素。对称矩阵M∈RI×I按式(11)计算,
M=(I-W)T(I-W)   (11)
为使式(10)中误差最小,则选取M的最小d个非零特征值所对应的特征向量作为输出Y。由于最小的特征值接近于零,一般取前2~d+1个最小的特征值对应的特征向量作为Y。其中,d为嵌入空间维数,本实施例中将其设置为3。
本实施例中,可采用其他流形学习方法将高维HRIR样本点降维至低维空间如等距映射算法(Isomap)、局部保留投影(Locality PreservingProjection,以下简称LPP)等。
分段直线拟合的具体过程为:
取一维流形的起始两个点,使用公式
y 1 d y 2 d · · · y Nd = y 11 y 12 · · · y 1 , d - 1 y 21 y 22 · · · y 2 , d - 1 · · · · · · · · · y N 1 y N 2 · · · y N , d - 1 a 0 a 1 · · · a d - 1 - - - ( 12 )
利用最小二乘法拟合求出直线系数(a0,a1,…,ad-1);
按照一维流形的延伸方向,每加入一点,使用公式(12)和公式
e N = Σ i = 1 N [ | | y id - y ^ id | | 2 ] 2 - - - ( 13 )
计算(a0,a1,…,ad-1)与eN,将eN与预先给定的最大误差eMAX比较,若eN<eMAX,则将这一点加入到前面的点列中,直到eN≥eMAX,将第N-1点作为该段直线的端点。对于分段直线拟合中的拟合误差阈值eMAX,采用公式
eMAX=ENER×ratio   (14)
进行计算,其中ENER为低维嵌入流形的归一化能量,如式(15)所示;ratio为拟合误差比值,需人工设定,本实施例中将其设置为5×10-10。其中,
ENER = &Sigma; i = 1 I [ | | h i | | 2 ] 2 / max | h i | - - - ( 15 )
将第N点与第N+1点作为下一段拟合直线的起始两点,转至步骤①,直到全部样本点拟合完毕。
得到所有分段直线的端点后,将这些分割点所对应的高维HRIR作为特征HRIR。
本方案特征HRIR集选取结果如图5所示。本实施例中,特征样本点选取模块可采用其他分段曲线拟合,如二次、三次线性拟合。
为了验证本发明的有效性,进行了计算机仿真实验。实验时采用的数据库为CIPIC实验室的HRIR数据库中测量个体subject_003的左耳HRIR数据,三维HRIR矩阵尺寸为D1×D2×L,数值为50×25×200。
采用主观听音测试:
测试HRIR集:选取两组分别为CIPIC的subject_003的HRIR集数据,及其压缩重构数据集。
测试主体:4名听觉正常的测试者:2名女性、2名男性;
测试角度(φ,θ):对7个方位进行测试,分别为(0°,-35°)、(0°,0°)、(0°,35°)、(-22.5°,0°)、(33.8°,0°)、(61.9°,0°)、(90°,0°)。由于使用通用HRIR存在前后混淆这种可能性,因此选取的这7个方位均位于前半平面,头相关坐标系如图6所示。
测试音频:将采样率为44.1kHz的0.4秒白噪声与方位相同的两组HRIR分别卷积(原始HRIR、压缩后重建HRIR),得到0.4秒的双耳声。将其重复10次,以0.1秒的静音做间隔,得到该方位两组5秒测试音频。感知角度距离选择表如表1所示,
表1
差异角度 描述 相似分数
完全相同 5
0°~5° 刚好可察觉的差异 3
5°~15° 显著的差异 2
15°~30° 非常不同 1
>30° 完全不同 0
将每个方位两组测试音频分别播放给4名测试者,进行听音比较选择两组间角度差异。然后根据表2中差异角度查找对应得分。将7个方位的得分做平均,得到表3所示的听音测试结果。从表2可知听音测试结果,三种方案经过压缩、重构后的HRIR在听音方面与原始HRIR区别。
表2
方案名称 YXH LZL SJW LD
本方案 5.00 4.71 5.00 5.00
计算量:当合成双耳声时,所需方位的HRIR分为三种情况:
第一种情况,当所需HRIR属于特征HRIR集时,可直接使用,计算量为0;
第二种情况,当所需HRIR的两侧为特征HRIR时,如图5中水平角索引为1、仰角索引为2时,在仰角平面上该位置两侧的HRIR属于特征HRIR集,使用其两侧的HRIR进行线性插值,重构该方位需要200实数乘法,200次实数加法。
第三种情况,当所需HRIR的两侧不存在特征HRIR时,如图5中水平角索引为5,仰角索引为2时,该位置的HRIR需要由其周围的4个特征HRIR线性插值,此时重构该方位HRIR需要200次实数乘法,600次实数加法。
综合三种情况,该方法的平均计算量为133.4次实数乘法,202.6次实数加法。
本实施例,处理器将头相关脉冲响应HRIR数据集按照仰角和/或水平角进行分组,通过局部线性嵌入算法LLE在分组后HRIR中选取重构误差最小值的HRIR作为高维HRIR样本点,将所述HRIR样本点降维至低维空间到低维HRIR,采用分段直线拟合在所述低维HRIR样本点中选取特征HRIR样本点,按照仰角顺序和/或水平角顺序将所述特征HRIR样本点组合为三维矩阵。解决了在HRIR选取特征HRIR过程中重构误差小的技术问题。按照仰角和/或水平角进行分组所得到的特征HRIR数量更少,从而使得特征HRIR更具有代表性,采用分段直线拟合在所述低维HRIR样本点中选取特征HRIR样本点,所选取的特征HRIR更准确。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (4)

1.一种头相关脉冲响应数据集处理方法,其特征在于,包括:
处理器将头相关脉冲响应HRIR数据集按照仰角和/或水平角进行分组;
所述处理器通过局部线性嵌入算法LLE在分组后HRIR中选取重构误差最小值的HRIR作为高维HRIR样本点;
所述处理器将所述HRIR样本点降维至低维空间,得到低维HRIR;
所述处理器采用分段直线拟合在所述低维HRIR样本点中选取特征HRIR样本点;
所述处理器按照仰角顺序和/或水平角顺序将所述特征HRIR样本点组合为三维矩阵。
2.根据权利要求1所述的方法,其特征在于,所述处理器通过局部线性嵌入算法LLE在分组后HRIR中选取重构误差最小值的HRIR作为HRIR样本点,包括:
处理器在分组后HRIR中选取一个HRIR样本点,计算所述HRIR样本点与其他HRIR样本点之间的欧式距离,并根据所述欧式距离选取所述HRIR样本点的临近点;
构造所述HRIR样本点的局部协方差矩阵,确定重构误差的条件值
其中,所述K为与HRIR样本点xi的邻近点个数,所述j为第j个邻近点的下标,所述为使用第j个邻近点xj重构xi的权值;
通过所述局部协方差矩阵Qi以及所述条件值,采用公式
计算所述HRIR样本点的权值重建矩阵wij,其中,所述K为局部协方差矩阵Qi的维数,所述i为第i个样本点的下标,所述k为局部协方差矩阵Qi的第k维,所述j为第j个邻近点的下标;
将所述wij代入重构误差函数公式
确定重构误差最小值所对应的HRIR样本点为可进行降维处理的高维HRIR样本点,其中,所述I为样本总点数,所述i为第i个样本的下标,所述K为设定与所述HRIR样本点xi欧式距离最小的样本点的个数,所述xi为所述选取的HRIR样本点,所述xj为所述xi的第j个邻近点,所述minε(W)为最小重构误差值;
所述处理器将所述HRIR样本点降维至低维空间,得到低维HRIR,包括:
将满足公式
的所述HRIR样本点代入公式
得到损失函数
选取公式
M=(I-W)T(I-W)   (7) 
中M的最小d个非零特征值代入到所述损失函数,得到与Y的特征向量作为映射至低维空间的对应的样本点,其中,所述yi为所述xi的低维映射向量,所述yj为所述yi的第j个邻近点,所述minε(Y)为损失函数,所述i为第i个样本的下标,所述j为第j个邻近点的下标,所述I为样本总点数,所述k为与yi邻近的点数。
3.根据权利要求1或2所述的方法,其特征在于,所述处理器采用分段直线拟合在所述低维的HRIR样本点中选取特征HRIR样本点,包括:
对于低维HRIR组的一维流形的任意两个起始点采用公式
计算直线系数(a0,a1,…,ad-1),其中,所述y为低维HRIR组的一维流形的点,所述d为空间维数,所述a为直线系数;
按照一维流形的延伸方向加入N点,采用公式
计算N点拟合误差eN,其中,所述N为所述任意两个起始点所构成直线的点数,所述i为第i段直线点数,所述y为低维HRIR组的一维流形的点,所述d为空间维数,所述为低维HRIR组的一维流形的实际点;
若N点的所述拟合误差eN小于最大误差eMAX,则将N点加入到两个起始点之间的点列中;若N点的所述拟合误差eN大于最大误差eMAX则将N-1点作为该段直线的端点,则所述端点所对应的高维HRIR即为特征HRIR。
4.根据权利要求3所述的方法,其特征在于,所述eMAX=ENER×ratio,其中,所述ratio为拟合误差比值,所述ENER为低维嵌入流形的归一化能量。
CN201410512710.2A 2014-09-26 2014-09-26 头相关脉冲响应数据集处理方法 Active CN104503963B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410512710.2A CN104503963B (zh) 2014-09-26 2014-09-26 头相关脉冲响应数据集处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410512710.2A CN104503963B (zh) 2014-09-26 2014-09-26 头相关脉冲响应数据集处理方法

Publications (2)

Publication Number Publication Date
CN104503963A true CN104503963A (zh) 2015-04-08
CN104503963B CN104503963B (zh) 2018-01-09

Family

ID=52945361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410512710.2A Active CN104503963B (zh) 2014-09-26 2014-09-26 头相关脉冲响应数据集处理方法

Country Status (1)

Country Link
CN (1) CN104503963B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105959877A (zh) * 2016-07-08 2016-09-21 北京时代拓灵科技有限公司 一种虚拟现实设备中声场的处理方法及装置
CN106780141A (zh) * 2016-12-15 2017-05-31 贵州电网有限责任公司电力科学研究院 一种基于流形学习的输电线路检修计划优化方法及***
CN108805104A (zh) * 2018-06-29 2018-11-13 中国航空无线电电子研究所 个性化hrtf获取***
CN108885690A (zh) * 2016-03-15 2018-11-23 自环绕公司 用于产生头相关传递函数滤波器的布置
US11562471B2 (en) 2018-03-29 2023-01-24 Apple Inc. Arrangement for generating head related transfer function filters

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101938686A (zh) * 2010-06-24 2011-01-05 中国科学院声学研究所 一种普通环境中头相关传递函数的测量***及测量方法
US20130041648A1 (en) * 2008-10-27 2013-02-14 Sony Computer Entertainment Inc. Sound localization for user in motion
CN103209381A (zh) * 2013-04-15 2013-07-17 清华大学 多通道电声传递函数的测量方法
CN103731796A (zh) * 2013-10-10 2014-04-16 华南理工大学 用于远场和近场头相关传输函数的多声源自动测量***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130041648A1 (en) * 2008-10-27 2013-02-14 Sony Computer Entertainment Inc. Sound localization for user in motion
CN101938686A (zh) * 2010-06-24 2011-01-05 中国科学院声学研究所 一种普通环境中头相关传递函数的测量***及测量方法
CN103209381A (zh) * 2013-04-15 2013-07-17 清华大学 多通道电声传递函数的测量方法
CN103731796A (zh) * 2013-10-10 2014-04-16 华南理工大学 用于远场和近场头相关传输函数的多声源自动测量***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
汤永清: ""一种局部线性嵌入的空间听觉重建方法"", 《上海大学学报(自然科学版)》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108885690A (zh) * 2016-03-15 2018-11-23 自环绕公司 用于产生头相关传递函数滤波器的布置
US11557055B2 (en) 2016-03-15 2023-01-17 Apple Inc. Arrangement for producing head related transfer function filters
US11823472B2 (en) 2016-03-15 2023-11-21 Apple Inc. Arrangement for producing head related transfer function filters
CN105959877A (zh) * 2016-07-08 2016-09-21 北京时代拓灵科技有限公司 一种虚拟现实设备中声场的处理方法及装置
CN105959877B (zh) * 2016-07-08 2020-09-01 北京时代拓灵科技有限公司 一种虚拟现实设备中声场的处理方法及装置
CN106780141A (zh) * 2016-12-15 2017-05-31 贵州电网有限责任公司电力科学研究院 一种基于流形学习的输电线路检修计划优化方法及***
US11562471B2 (en) 2018-03-29 2023-01-24 Apple Inc. Arrangement for generating head related transfer function filters
CN108805104A (zh) * 2018-06-29 2018-11-13 中国航空无线电电子研究所 个性化hrtf获取***
CN108805104B (zh) * 2018-06-29 2022-03-08 中国航空无线电电子研究所 个性化hrtf获取***

Also Published As

Publication number Publication date
CN104503963B (zh) 2018-01-09

Similar Documents

Publication Publication Date Title
US9369818B2 (en) Filtering with binaural room impulse responses with content analysis and weighting
US8489371B2 (en) Method and device for determining transfer functions of the HRTF type
CN104503963A (zh) 头相关脉冲响应数据集处理方法
CN105917407A (zh) 识别码簿以在对声场的空间分量译码时使用
CN107820158B (zh) 一种基于头相关脉冲响应的三维音频生成装置
CN104408040A (zh) 头相关函数三维数据压缩方法与***
Li et al. HRTF personalization modeling based on RBF neural network
Geronazzo et al. Do we need individual head-related transfer functions for vertical localization? The case study of a spectral notch distance metric
CN106412793A (zh) 基于球谐函数的头相关传输函数的稀疏建模方法和***
CN110619887A (zh) 一种基于卷积神经网络的多说话人语音分离方法
Miccini et al. A hybrid approach to structural modeling of individualized HRTFs
Barumerli et al. Round Robin Comparison of Inter-Laboratory HRTF Measurements–Assessment with an auditory model for elevation
Lu et al. Personalization of head-related transfer function based on sparse principle component analysis and sparse representation of 3D anthropometric parameters
Zhu et al. HRTF personalization based on weighted sparse representation of anthropometric features
Spagnol Auditory model based subsetting of head-related transfer function datasets
Lu et al. Head-related transfer function reconstruction with anthropometric parameters and the direction of the sound source: Deep learning-based head-related transfer function personalization
Barumerli et al. Localization in elevation with non-individual head-related transfer functions: comparing predictions of two auditory models
Warnecke et al. HRTF personalization based on ear morphology
Chen et al. HRTF Representation with Convolutional Auto-encoder
CN105340008A (zh) 声场的经分解表示的压缩
CN110489470B (zh) 基于稀疏表示分类的hrtf个人化方法
Guillon et al. Head-related transfer functions reconstruction from sparse measurements considering a priori knowledge from database analysis: A pattern recognition approach
Jackson et al. QESTRAL (Part 3): System and metrics for spatial quality prediction
O'Dwyer et al. A machine learning approach to detecting sound-source elevation in adverse environments
Chen et al. Interpolation method of head-related transfer functions based on common-pole/zero modeling

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant