CN111669697A - 一种多通道信号的相干声与环境声提取方法及*** - Google Patents

一种多通道信号的相干声与环境声提取方法及*** Download PDF

Info

Publication number
CN111669697A
CN111669697A CN202010447863.9A CN202010447863A CN111669697A CN 111669697 A CN111669697 A CN 111669697A CN 202010447863 A CN202010447863 A CN 202010447863A CN 111669697 A CN111669697 A CN 111669697A
Authority
CN
China
Prior art keywords
sound
channel
coherent
calculating
ambient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010447863.9A
Other languages
English (en)
Other versions
CN111669697B (zh
Inventor
吴彦琴
桑晋秋
郑成诗
张芳杰
李晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN202010447863.9A priority Critical patent/CN111669697B/zh
Publication of CN111669697A publication Critical patent/CN111669697A/zh
Application granted granted Critical
Publication of CN111669697B publication Critical patent/CN111669697B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种多通道信号的相干声与环境声提取方法及***,所述方法包括:计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;其中,每个通道的环境声能量相同;根据各个通道的相干声计算各个通道的环境声;将N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。本发明的方法探究出在各通道环境声能量相同条件下的,针对任意通道数信号估计相干声的权重表达式,利用各个通道的信号能量以及通道间相关值,求出权重表达式中的各个未知参数,实现多通道信号的相干声与环境声提取,提取精度高。

Description

一种多通道信号的相干声与环境声提取方法及***
技术领域
本发明涉及空间声重放领域,特别涉及一种多通道信号的相干声与环境声提取方法及***。
背景技术
空间声重放技术在娱乐媒体中得到了广泛应用,比如电影院、家庭影院以及便携式电子设备在播放影片时,通过耳机或扬声器重放出具有一定声像宽度和沉浸感良好的空间声,可以为消费者带来更好的视听体验。近年来,空间声重放在尖端的科学研究和实用工程领域也逐渐显露出重要的应用前景,比如虚拟现实、航空、航天等领域。
空间声主要包含两种性质不同的成分,其一是具有方向性的声成分,称为相干声;其二是具有扩散性、无法辨别方向的声成分,称为环境声。为了实现更好的声重放效果,需要对空间声进行相干声与环境声提取(Primary-Ambient Extraction,PAE)并进行不同的处理。比如,音频编解码***中,将PAE作为音频编码或解码的前端,可以实现有效且沉浸感较好的空间声重放。
针对两通道信号的PAE方法发展较为成熟,应用较为广泛的是主成分分析法和最小二乘法。针对多通道信号,可以使用成对相关法进行PAE。但是成对相关法提取成分准确度不高。因此将适用于立体声的PAE方法拓展至多通道信号具有重要意义。主成分分析法在相干声占主要能量的前提下,通过计算输入信号的协方差矩阵的特征值,对立体声信号进行PAE。该方法也可对多通道信号进行成分提取,但是当通道数较多时,计算复杂度增大,而且主成分分析法仅在相干声占主要能量时提取效果较好。最小二乘法在各个通道环境声能量相等的前提下,通过计算估计相干声的权重,实现对立体声信号的PAE。但是,直接将最小二乘法应用于多通道信号时,估计权重不易求解。环境声成分在空间声中主要起烘托气氛的作用,为了达到更好的环绕感,环境声在各个通道能量分布差异较小。因此,在各个通道环境声能量相等的前提下,对多通道信号进行相干声与环境声提取有着重要意义。
发明内容
本发明的目的在于克服上述技术缺陷,在环境声在各个通道能量相等的前提下,通过计算通道数较少时使用最小二乘法估计相干声的权重,根据权重随通道数变化的规律性,得出针对任意通道数的多通道信号进行相干声估计时的权重表达式。
为实现上述目的,本发明提出了一种多通道信号的相干声与环境声提取方法,所述方法包括:
计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;其中,每个通道的环境声能量相同;
根据各个通道的相干声计算各个通道的环境声;
将N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。
作为上述方法的一种改进,所述计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;其中,每个通道的环境声能量相同;具体包括:
将时域多通道信号进行傅里叶变换,第n个通道输入信号Xn表示为:
Xn=βnS+An
其中,S表示相干声的频谱,βn表示第n个通道的相干声与第一个通道的相干声存在的幅度差异因子,1≤n≤N,β1=1,An表示第n个通道的环境声的频谱;
计算第n个通道输入信号Xn的短时能量
Figure BDA0002506583330000021
Figure BDA0002506583330000022
计算第一个通道和第二个通道的相关值Φ12
Figure BDA0002506583330000023
根据第一个通道的短时能量
Figure BDA0002506583330000024
第二个通道的短时能量
Figure BDA0002506583330000025
以及两个通道间相关值Φ12,计算中间参数C和D:
Figure BDA0002506583330000026
Figure BDA0002506583330000027
由此计算相干声的短时能量PS、环境声的短时能量PA以及β2
Figure BDA0002506583330000031
Figure BDA0002506583330000032
Figure BDA0002506583330000033
计算βn
Figure BDA0002506583330000034
第n个通道的权重值为:
Figure BDA0002506583330000035
则相干声的估计值
Figure BDA0002506583330000036
为:
Figure BDA0002506583330000037
则第n个通道相干声Sn
Figure BDA0002506583330000038
作为上述方法的一种改进,所述根据各个通道的相干声计算各个通道的环境声;具体为:
第n个通道的环境声An为:
An=Xn-Sn
本发明的实施例2提出了一种多通道信号的相干声与环境声提取***,所述***包括:
相干声提取模块,用于计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;其中,每个通道的环境声能量相同;
环境声提取模块,用于根据各个通道的相干声计算各个通道的环境声;
频域转时域模块,用于将N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。
作为上述***的一种改进,所述相干声提取模块的具体实现过程包括:
将时域多通道信号进行傅里叶变换,第n个通道输入信号Xn表示为:
Xn=βnS+An
其中,S表示相干声的频谱,βn表示第n个通道的相干声与第一个通道的相干声存在的幅度差异因子,1≤n≤N,β1=1,An表示第n个通道的环境声的频谱;
计算第n个通道输入信号Xn的短时能量
Figure BDA0002506583330000041
Figure BDA0002506583330000042
计算第一个通道和第二个通道的相关值Φ12
Figure BDA0002506583330000043
根据第一个通道的短时能量
Figure BDA0002506583330000044
第二个通道的短时能量
Figure BDA0002506583330000045
以及两个通道间相关值Φ12,计算中间参数C和D:
Figure BDA0002506583330000046
Figure BDA0002506583330000047
由此计算相干声的短时能量PS、环境声的短时能量PA以及β2
Figure BDA0002506583330000048
Figure BDA0002506583330000049
Figure BDA00025065833300000410
计算βn
Figure BDA00025065833300000411
第n个通道的权重值为:
Figure BDA00025065833300000412
则相干声的估计值
Figure BDA00025065833300000413
为:
Figure BDA0002506583330000051
则第n个通道相干声Sn
Figure BDA0002506583330000052
作为上述***的一种改进,所述环境声计算模块的具体实现过程包括:
第n个通道的环境声An为:
An=Xn-Sn
本发明的优势在于:
本发明的方法探究出在各通道环境声能量相同条件下的,针对任意通道数信号估计相干声的权重表达式,利用各个通道的信号能量以及通道间相关值,求出权重表达式中的各个未知参数,实现多通道信号的相干声与环境声提取,提取精度高。
附图说明
图1是本发明的多通道信号的相干声与环境声提取方法的流程图;
图2(a)是使用本发明的方法和成对相关法对混合五通道信号1进行相干声成分提取的误差图;
图2(b)是使用本发明的方法和成对相关法对混合五通道信号1进行环境声成分提取的误差图;
图3(a)是使用本发明的方法和成对相关法对混合五通道信号2进行相干声成分提取的误差图;
图3(b)是使用本发明的方法和成对相关法对混合五通道信号2进行环境声成分提取的误差图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案进行详细说明。
实施例1
如图1所示,本发明的实施例1提出了一种用于多通道信号各个通道环境声能量相等时的相干声与环境声提取方法,包括以下步骤:
步骤1)将多通道信号分帧后进行傅里叶变换得到频谱,根据多通道信号模型表示出各个通道的短时能量以及任意两个通道间相关值,具体包括:
多通道信号模型中,输入信号表示为相干声与环境声的叠加。由于相干声和环境声自身的特性不同,假设各个通道的相干声之间是完全相关的,即存在线性关系;假设相干声与每个通道的环境声以及通道间的环境声均是不相关的。
步骤1-1)将时域多通道信号进行傅里叶变换,得到频谱:
Xn=βnS+An,n=1,2,…,N
其中,N为通道数,S表示相干声的频谱,βn表示第n个通道相干声与第一个通道的相干声存在的幅度差异因子,且β1=1,An表示第n个通道的环境声的频谱;
步骤1-2)各个通道的信号能量可以表示为:
Figure BDA0002506583330000061
其中,E{}表示短时平均。
步骤1-3)各个通道间的相关值可以表示为:
Figure BDA0002506583330000062
其中,
Figure BDA0002506583330000063
为第n1个通道和第n2个通道间的相关值,n1=1,2,…,N,n2=1,2,…,N,n1≠n2
步骤2)计算出通道数较少时使用最小二乘法估计相干声的权重值,并探究其规律性,具体包括:
步骤2-1)针对两通道信号,计算出输入信号X1和X2估计相干声S的权重值:
步骤2-1-1)估计相干声S:
Figure BDA0002506583330000064
其中,w1和w2表示待求的估计权重。
步骤2-1-2)S的估计误差σS表示为:
Figure BDA0002506583330000065
步骤2-1-3)使用最小二乘算法进行求解,即当估计误差与输入立体声信号完全不相关时,得到的权重为最优估计:
E{σSX1}=0
E{σSX2}=0.
此时,最优估计的权重表示为:
Figure BDA0002506583330000071
Figure BDA0002506583330000072
其中,PS表示相干声的短时能量,PA表示环境声的短时能量。
步骤2-2)针对三通道信号,计算出输入信号X1、X2以及X3估计相干声S的权重值:
步骤2-2-1)估计相干声S:
Figure BDA0002506583330000073
其中,w1、w2和w3表示待求的估计权重。
步骤2-2-2)与步骤2-1)类似的处理方法可以求得三通道信号估计相干声的权重值:
Figure BDA0002506583330000074
Figure BDA0002506583330000075
Figure BDA0002506583330000076
步骤2-3)通过更多计算通道数更多时的相干声的估计权重,发现权重值可统一表达。针对通道数为N的多通道信号,估计的相干声表示为:
Figure BDA0002506583330000077
其中,权重值可以表示为:
Figure BDA0002506583330000081
步骤3)计算估计相干声的权重中各个未知参数,完成多通道信号的相干声与环境声提取,具体包括:
步骤3-1)已知β1=1,因此可根据步骤1)中前两个通道的信号能量和通道间相关值求出未知参数PS、PA以及β2
Figure BDA0002506583330000082
Figure BDA0002506583330000083
Figure BDA0002506583330000084
其中,
Figure BDA0002506583330000085
Figure BDA0002506583330000086
步骤3-2)根据除第一通道和第二通道外的其他通道的能量值,可求出当3≤n≤N时的βn
Figure BDA0002506583330000087
步骤3-3)针对通道数为N的多通道信号,将步骤3-1)和步骤3-2)中计算得到的参数PS、PA以及βn(n=1,2,…,N)带入步骤2-3)计算得到的估计相干声的权重值wn(1,2,…,N)即可完成从多通道信号中提取相干声的操作。
步骤4)对对任意通道数的多通道信号进行PAE,具体包括:
步骤4-1)计算各个通道的相干声,具体包括:
由于步骤2)计算出对任意通道数的多通道信号进行PAE时估计相干声的权重表达式,步骤3)计算出权重表达式中的各个未知参数,因此当确定了多通道信号的通道数,可直接根据权重表达式估计相干声S。此相干声直接为第一个通道的相干声,其他通道的相干声由S线性处理得到,即为βnS(n=2,…,N)。
步骤4-2)计算各个通道的环境声,具体包括:
将各个通道剩余成分认定为环境声,即An=XnnS。
步骤4-3)将所得的N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。
下面结合仿真实例,对本发明所提出的方法性能进行说明:
将完全相关的相干声与完全不相关的环境声按照一定比例合成混合五通道信号,使用本发明提出的多通道PAE方法和成对相关法进行成分提取。合成了两组混合多通道信号,即纯净语音作为相干声、海浪声作为环境声的混合五通道信号1以及纯净音乐声作为相干声、森林背景声作为环境声的混合五通道信号2。混合时,为了控制各个通道间相干声能量的分布,设定各个通道间相干声幅度差异因子βn与其参考值β0之间呈一定的比例关系;设定各个通道的环境声能量相等为PA0;为了控制混合信号中相干声成分所占比例,设定不同的相干声能量占比γ。参考值β0和PA0由γ决定。
本实验设定各个通道相干声的幅度存在β1=β2=β0,β3=2β0,β4=β5=0.5β0的比例关系。相干声能量占比γ取值为0.05至0.95(间隔为0.1)。相干声的提取误差εP分别表示为:
Figure BDA0002506583330000091
环境声的提取误差εa分别表示为:
Figure BDA0002506583330000092
图2(a)和图2(b)代表了本发明所提出的算法和成对相关法分别对混合五通道信号1进行PAE时相干声和环境声的提取误差;图3(a)和图3(b)代表了本发明所提出的算法和成对相关法分别对混合五通道信号2进行PAE时相干声和环境声的提取误差。可以看出,在相干声能量占比γ取值为0.05至0.95(间隔为0.1)的整个区间内,本发明提出的方法的提取误差均小于成对相关法。
本发明的实施例2提出了一种多通道信号的相干声与环境声提取***,所述***包括:
相干声提取模块,用于计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;其中,每个通道的环境声能量相同;
环境声提取模块,用于根据各个通道的相干声计算各个通道的环境声;
频域转时域模块,用于将N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种多通道信号的相干声与环境声提取方法,所述方法包括:
计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;其中,每个通道的环境声能量相同;
根据各个通道的相干声计算各个通道的环境声;
将N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。
2.根据权利要求1所述的多通道信号的相干声与环境声提取方法,其特征在于,所述计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;其中,每个通道的环境声能量相同;具体包括:
将时域多通道信号进行傅里叶变换,第n个通道输入信号Xn表示为:
Xn=βnS+An
其中,S表示相干声的频谱,βn表示第n个通道的相干声与第一个通道的相干声存在的幅度差异因子,1≤n≤N,β1=1,An表示第n个通道的环境声的频谱;
计算第n个通道输入信号Xn的短时能量
Figure FDA0002506583320000011
Figure FDA0002506583320000012
计算第一个通道和第二个通道的相关值Φ12
Figure FDA0002506583320000013
根据第一个通道的短时能量
Figure FDA0002506583320000014
第二个通道的短时能量
Figure FDA0002506583320000015
以及两个通道间相关值Φ12,计算中间参数C和D:
Figure FDA0002506583320000016
Figure FDA0002506583320000017
由此计算相干声的短时能量PS、环境声的短时能量PA以及β2
Figure FDA0002506583320000021
Figure FDA0002506583320000022
Figure FDA0002506583320000023
计算βn
Figure FDA0002506583320000024
第n个通道的权重值为:
Figure FDA0002506583320000025
则相干声的估计值
Figure FDA0002506583320000026
为:
Figure FDA0002506583320000027
则第n个通道相干声Sn
Figure FDA0002506583320000028
3.根据权利要求2所述的多通道信号的相干声与环境声提取方法,其特征在于,所述根据各个通道的相干声计算各个通道的环境声;具体为:
第n个通道的环境声An为:
An=Xn-Sn
4.一种多通道信号的相干声与环境声提取***,其特征在于,所述***包括:
相干声提取模块,用于计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;其中,每个通道的环境声能量相同;
环境声提取模块,用于根据各个通道的相干声计算各个通道的环境声;
频域转时域模块,用于将N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。
5.根据权利要求4所述的多通道信号的相干声与环境声提取***,其特征在于,所述相干声提取模块的具体实现过程包括:
将时域多通道信号进行傅里叶变换,第n个通道输入信号Xn表示为:
Xn=βnS+An
其中,S表示相干声的频谱,βn表示第n个通道的相干声与第一个通道的相干声存在的幅度差异因子,1≤n≤N,β1=1,An表示第n个通道的环境声的频谱;
计算第n个通道输入信号Xn的短时能量
Figure FDA0002506583320000031
Figure FDA0002506583320000032
计算第一个通道和第二个通道的相关值Φ12
Figure FDA0002506583320000033
根据第一个通道的短时能量
Figure FDA0002506583320000034
第二个通道的短时能量
Figure FDA0002506583320000035
以及两个通道间相关值Φ12,计算中间参数C和D:
Figure FDA0002506583320000036
Figure FDA0002506583320000037
由此计算相干声的短时能量PS、环境声的短时能量PA以及β2
Figure FDA0002506583320000038
Figure FDA0002506583320000039
Figure FDA00025065833200000310
计算βn
Figure FDA00025065833200000311
第n个通道的权重值为:
Figure FDA00025065833200000312
则相干声的估计值
Figure FDA00025065833200000313
为:
Figure FDA0002506583320000041
则第n个通道相干声Sn
Figure FDA0002506583320000042
6.根据权利要求5所述的多通道信号的相干声与环境声提取***,其特征在于,所述环境声提取模块的具体实现过程包括:
第n个通道的环境声An为:
An=Xn-Sn
CN202010447863.9A 2020-05-25 2020-05-25 一种多通道信号的相干声与环境声提取方法及*** Active CN111669697B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010447863.9A CN111669697B (zh) 2020-05-25 2020-05-25 一种多通道信号的相干声与环境声提取方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010447863.9A CN111669697B (zh) 2020-05-25 2020-05-25 一种多通道信号的相干声与环境声提取方法及***

Publications (2)

Publication Number Publication Date
CN111669697A true CN111669697A (zh) 2020-09-15
CN111669697B CN111669697B (zh) 2021-05-18

Family

ID=72384501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010447863.9A Active CN111669697B (zh) 2020-05-25 2020-05-25 一种多通道信号的相干声与环境声提取方法及***

Country Status (1)

Country Link
CN (1) CN111669697B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101401151A (zh) * 2006-03-15 2009-04-01 法国电信公司 根据主分量分析的多通道音频信号的可分级编码的设备和方法
CN101816191A (zh) * 2007-09-26 2010-08-25 弗劳恩霍夫应用研究促进协会 用于获得提取环境信号的加权系数的装置和方法中的用于提取环境信号的装置和方法以及计算机程序
EP2523473A1 (en) * 2011-05-11 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an output signal employing a decomposer
CN103902822A (zh) * 2014-03-28 2014-07-02 西安交通大学苏州研究院 非相干和相干信号混合情况下的信号个数检测方法
CN109036455A (zh) * 2018-09-17 2018-12-18 中科上声(苏州)电子有限公司 直达声与背景声提取方法、扬声器***及其声重放方法
CN110531310A (zh) * 2019-07-25 2019-12-03 西安交通大学 基于子空间和内插变换的远场相干信号波达方向估计方法
CN110534129A (zh) * 2018-05-23 2019-12-03 哈曼贝克自动***股份有限公司 干声和环境声音的分离

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101401151A (zh) * 2006-03-15 2009-04-01 法国电信公司 根据主分量分析的多通道音频信号的可分级编码的设备和方法
CN101816191A (zh) * 2007-09-26 2010-08-25 弗劳恩霍夫应用研究促进协会 用于获得提取环境信号的加权系数的装置和方法中的用于提取环境信号的装置和方法以及计算机程序
EP2523473A1 (en) * 2011-05-11 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an output signal employing a decomposer
CN103902822A (zh) * 2014-03-28 2014-07-02 西安交通大学苏州研究院 非相干和相干信号混合情况下的信号个数检测方法
CN110534129A (zh) * 2018-05-23 2019-12-03 哈曼贝克自动***股份有限公司 干声和环境声音的分离
CN109036455A (zh) * 2018-09-17 2018-12-18 中科上声(苏州)电子有限公司 直达声与背景声提取方法、扬声器***及其声重放方法
CN110531310A (zh) * 2019-07-25 2019-12-03 西安交通大学 基于子空间和内插变换的远场相干信号波达方向估计方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHRISTOF FALLER: "《Parametric Time‐Frequency Domain Spatial Audio》", 13 October 2017, JOHN WILEY & SONS,LTD *
JEROEN BREEBAART等: "《Spatial Audio Processing: MPEG Surround and Other Applications》", 26 October 2007, JOHN WILEY & SONS,LTD *
JIANJUN HE: "Primary-Ambient Extraction Using Ambient Phase", 《IEEE SIGNAL PROCESSING LETTERS》 *
吴彦琴等: "相干声与环境声提取方法的客观性能评估", 《声学技术》 *

Also Published As

Publication number Publication date
CN111669697B (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN110089134B (zh) 用于再现空间分布声音的方法、***及计算机可读介质
CN104285390B (zh) 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置
CN106658343B (zh) 用于渲染音频声场表示以供音频回放的方法和设备
US11832080B2 (en) Spatial audio parameters and associated spatial audio playback
Avendano et al. A frequency-domain approach to multichannel upmix
EP2285139B1 (en) Device and method for converting spatial audio signal
RU2361185C2 (ru) Устройство и способ для формирования многоканального выходного сигнала
US10362431B2 (en) Headtracking for parametric binaural output system and method
US20230100071A1 (en) Rendering reverberation
CN103650537A (zh) 采用分解器产生输出信号的装置和方法
Farina et al. Ambiophonic principles for the recording and reproduction of surround sound for music
TW202022853A (zh) 以保真立體音響格式所編碼聲訊訊號為l個揚聲器在已知位置之解碼方法和裝置以及電腦可讀式儲存媒體
Su et al. Inras: Implicit neural representation for audio scenes
CN111669697B (zh) 一种多通道信号的相干声与环境声提取方法及***
Chun et al. Real-time conversion of stereo audio to 5.1 channel audio for providing realistic sounds
He et al. Primary-ambient extraction using ambient spectrum estimation for immersive spatial audio reproduction
WO2020080099A1 (ja) 信号処理装置および方法、並びにプログラム
CN104424971B (zh) 一种音频文件播放方法及装置
WO2020057050A1 (zh) 直达声与背景声提取方法、扬声器***及其声重放方法
Kim et al. A robust framework for sound event localization and detection on real recordings
CN111711918B (zh) 一种多通道信号的相干声与环境声提取方法及***
CN109036456B (zh) 用于立体声的源分量环境分量提取方法
Bunting et al. Time frequency source separation and direction of arrival estimation in a 3D soundscape environment
CN113449255B (zh) 一种改进的稀疏约束下环境分量相位角估计方法、设备及存储介质
CN113518299B (zh) 一种改进的源分量及环境分量提取方法、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant