CN115777203A - 信息处理装置、输出控制方法和程序 - Google Patents

信息处理装置、输出控制方法和程序 Download PDF

Info

Publication number
CN115777203A
CN115777203A CN202180045499.6A CN202180045499A CN115777203A CN 115777203 A CN115777203 A CN 115777203A CN 202180045499 A CN202180045499 A CN 202180045499A CN 115777203 A CN115777203 A CN 115777203A
Authority
CN
China
Prior art keywords
sound
output
sound source
hrtf
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180045499.6A
Other languages
English (en)
Inventor
冲本越
中川亨
藤原真志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Group Corp filed Critical Sony Group Corp
Publication of CN115777203A publication Critical patent/CN115777203A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/105Earpiece supports, e.g. ear hooks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

本技术涉及能够适当地再现关于声源的距离感的信息处理装置、输出控制方法和程序。信息处理装置使设置在收听空间中的扬声器输出构成内容的音频的指定声源的声音,并且使每个收听者的输出装置输出不同于指定声源的虚拟声源的声音,其中声音是通过使用与声源位置对应的传递函数进行处理而生成的。本技术可应用于电影院中的声学处理***。

Description

信息处理装置、输出控制方法和程序
技术领域
本发明具体涉及能够适当地再现关于声源的距离感的信息处理装置、输出控制方法以及程序。
背景技术
存在用于使用头部相关传递函数(HRTF)三维地再现耳机中的声音图像的技术,该头部相关传递函数数学地表达声音如何从声源传播至耳朵。
例如,PTL1公开了用于使用利用虚拟头部测量的HRTF再现立体声的技术。
[引用列表]
[专利文献]
[PTL1]
JP2009-260574A。
发明内容
[技术问题]
虽然可使用HRTF来三维地再现声音图像,但是不能再现具有改变距离的声音图像,例如,接近收听者的声音或远离收听者移动的声音。
鉴于前述内容,做出了本特征,并且允许适当地再现关于声源的距离感。
[问题的解决方案]
根据本特征的方面的信息处理装置包括:输出控制单元,被配置为使设置在收听空间中的扬声器输出构成内容的音频的指定声源的声音,并且使每个收听者的输出装置输出不同于所述指定声源的虚拟声源的声音,其中所述虚拟声源的声音是通过使用与声源位置对应的传递函数进行处理而生成的。
在本特征的一个方面中,使设置在收听空间中的扬声器输出构成内容的音频的指定声源的声音,并且使每个收听者的输出装置输出不同于指定声源的虚拟声源的声音,其中虚拟声源的声音是通过使用与声源位置对应的传递函数进行处理而生成的。
附图说明
图1示出根据本特征的实施方式的声学处理***的示例性配置。
图2是示出声音图像定位处理的原理的示图。
图3是耳机的外部视图。
图4是示例性输出装置的示图。
图5示出了HRTF数据库中存储的示例性HRTF。
图6示出了HRTF数据库中存储的示例性HRTF。
图7是示出如何再现声音的实例的示图。
图8是电影院中的真实扬声器的示例性布局的平面图。
图9是示出电影院中的声源的概念的示图。
图10是电影院中的听众的实例的示图。
图11是声学处理装置的示例性配置的示图。
图12是示出由具有图11中所示的配置的声学处理装置进行的再现处理的流程图。
图13是示例性动态对象的示图。
图14是声学处理装置的示例性配置的示图。
图15是示出通过具有图14中所示的配置的声学处理装置进行的再现处理的流程图。
图16是示例性动态对象的示图。
图17是声学处理装置的示例性配置的示图。
图18示出了增益调节的实例。
图19是示例性声源的示图。
图20是声学处理装置的示例性配置的示图。
图21是声学处理装置的示例性配置的示图。
图22是示出通过具有图21中所示的配置的声学处理装置进行的再现处理的流程图。
图23是混合型声学***的示例性配置的示图。
图24是板载扬声器的示例性安装位置的示图。
图25是示例性虚拟声源的示图。
图26是示例性屏幕的示图。
图27是计算机的示例性配置的框图。
具体实施方式
在下文中,将描述执行本特征的模式。将按照以下顺序进行描述。
1.声音图像定位处理
2.多层HRTF
3.声学处理***的示例性应用
4.变形例
5.其他实例
<声音图像定位处理>
图1示出根据本特征的实施方式的声学处理***的示例性配置。
图1中所示的声学处理***包括声学处理装置1和由作为音频收听者的用户U佩戴的耳机(内耳式耳机)2。形成耳机2的左单元2L佩戴在用户U的左耳上,并且右单元2R佩戴在右耳上。
声学处理装置1和耳机2通过电缆有线连接或通过指定的通信标准(诸如无线LAN或蓝牙(注册商标))无线地连接。声学处理装置1与耳机2之间的通信可经由便携式终端(诸如,由用户U携带的智能电话)执行。通过再现内容获得的音频信号被输入到声学处理装置1。
例如,通过再现电影内容获得的音频信号被输入到声学处理装置1。电影音频信号包括各种声音信号,诸如语音、背景音乐和环境声音。音频信号包括作为用于左耳的信号的音频信号L和作为用于右耳的信号的音频信号R。
要在声学处理***中处理的音频信号的种类不限于电影音频信号。作为通过播放音乐内容而获得的声音、通过播放游戏内容而获得的声音、语音消息、以及电子声音(诸如铃声、蜂鸣声)等各种声音信号作为处理对象。在以下描述中,用户U听到的声音是音频声音,而用户U听到除了音频声音之外的其他类型的声音。上述的各种声音,例如电影中的声音、通过玩游戏内容获得的声音在这里被描述为音频声音。
声学处理装置1处理输入音频信号,就好像从图1的右部分中的虚线指示的左虚拟扬声器VSL和右虚拟扬声器VSR的位置发出正在听到的电影声音。换言之,声学处理装置1定位从耳机2输出的声音的声音图像,使得声音图像被感知为来自左虚拟扬声器VSL和右虚拟扬声器VSR的声音。
当左虚拟扬声器VSL和右虚拟扬声器VSR未被区分时,它们被统称为虚拟扬声器VS。在图1的实例中,虚拟扬声器VS的位置在用户U的前面,并且虚拟扬声器的数量被设置为两个,但是,随着电影的进行,对应于虚拟扬声器VS的虚拟声源的位置和数量可以适当地改变。
声学处理装置1的卷积处理单元11对音频信号进行声音图像定位处理以输出这种音频声音,并且将音频信号L和R分别输出到左单元2L和右单元2R。
图2是示出声音图像定位处理的原理的示图。
在指定的参考环境中,将虚拟头部DH的位置设置为收听者的位置。麦克风安装在虚拟头部DH的左耳部分和右耳部分中。左真实扬声器SPL和右真实扬声器SPR被设置在声音图像将被定位的左虚拟扬声器和右虚拟扬声器的位置处。真实扬声器是指实际提供的扬声器。
在虚拟头部DH的耳部收集从左真实扬声器SPL和右真实扬声器SPR输出的声音,并且预先测量表示从左真实扬声器SPL和右真实扬声器SPR输出的声音与到达虚拟头部DH的耳部的声音之间的声音的特性的变化的传递函数(HRTF:头部相关传递函数)。传递函数可通过使人实际上坐着且将麦克风放置在人的耳朵附近而非使用虚拟头部DH来测量。
如图2所示,假设从左真实扬声器SPL至虚拟头部DH的左耳的声音传递函数是M11并且从左真实扬声器SPL至虚拟头部DH的右耳的声音传递函数是M12。此外,假设从右真实扬声器SPR到虚拟头部DH的左耳的声音传递函数是M21,并且从右真实扬声器SPR到虚拟头部DH的右耳的声音传递函数是M22。
图1中的HRTF数据库12将关于HRTF的信息(关于表示HRTF的系数的信息)存储为以这种方式预先测量的传递函数。HRTF数据库12用作存储HRTF信息的存储单元。
卷积处理单元11在输出电影声音时根据左虚拟扬声器VSL和右虚拟扬声器VSR的位置从HRTF数据库12读取并获得HRTF的系数对,并将滤波器系数设置给滤波器21至24。
滤波器21执行滤波处理以将传递函数M11应用于音频信号L并且将经滤波的音频信号L输出至加法单元25。滤波器22执行滤波处理以将传递函数M12应用于音频信号L并且将滤波后的音频信号L输出至加法单元26。
滤波器23执行滤波处理以将传递函数M21应用于音频信号R并且将滤波后的音频信号R输出至加法单元25。滤波器24执行滤波处理以将传递函数M22应用于音频信号R并且将经滤波的音频信号R输出至加法单元26。
加法单元25作为左声道的加法单元,将由滤波器21滤波的音频信号L和由滤波器23滤波的音频信号R相加,并输出相加之后的音频信号。将相加之后的音频信号传输至耳机2,并且从耳机2的左单元2L中输出与音频信号对应的声音。
加法单元26作为右声道的加法单元,将由滤波器22滤波的音频信号L和由滤波器24滤波的音频信号R相加,并输出相加之后的音频信号。将添加之后的音频信号传输至耳机2,并且从耳机2的右单元2R输出与音频信号对应的声音。
以这种方式,声学处理装置1根据定位声音图像的位置使用HRTF对音频信号进行卷积处理,并且定位来自耳机2的声音的声音图像,使得用户U感知到声音图像已经从虚拟扬声器VS发出。
图3是耳机2的外部视图。
如图3的气囊放大所示,右单元2R包括经由U形声音导管32接合在一起的驱动器单元31和环形安装部33。通过将安装部33按压在外耳孔周围来安装右单元2R,使得右耳被夹在安装部33和驱动器单元31之间。
左单元2L具有与右单元2R相同的结构。左单元2L和右单元2R有线或无线连接。
右单元2R的驱动器单元31接收从声学处理装置1传输的音频信号并且根据音频信号生成声音并且使得对应于音频信号的声音从声音导管32的顶端输出,如箭头#1所示。孔形成在声音导管32与安装部33的接合处以朝向外耳孔输出声音。
安装部33具有环形形状。与从声音导管32的尖端输出的内容的声音一起,环境声音也到达外耳孔,如箭头#2所示。
这样,耳机2为不遮挡耳孔的所谓的开耳式(open-ear)耳机。除了耳机2之外的装置可以用作用于收听内容的声音的输出装置。
图4是示例性输出装置的示图。
作为用于收听内容的声音的输出装置,使用如在图4中的A处所示的密封式耳机(外耳式耳机)。例如,在图4中的A处所示的耳机是具有捕获外部声音的功能的耳机。
如图4的B处所示的肩部安装的颈带扬声器用作用于收听内容的声音的输出装置。颈带扬声器的左单元和右单元设置有扬声器,并且声音向着用户的耳朵输出。
能够捕获外部声音的任何输出装置(诸如,耳机2、图4中的A处的耳机和图4中的B处的颈带扬声器)可用于收听内容的声音。
<多层HRTF>
图5和图6示出了存储在HRTF数据库12中的示例性HRTF。
HRTF数据库12存储关于以参考虚拟头部DH的位置为中心的全球面形状布置的每个声源的HRTF信息。
如在图6中A和B处单独示出的,多个声源被放置在距作为全球形的中心位置的虚拟头部DH距离a的位置O,同时多个声源被放置在距全球形的中心距离b(a>b)的位置。这样,设置与作为中心的位置O相隔距离b的声源层和与中心相隔距离a的声源层。例如,同一层中的声源等距间隔。
测量以这种方式布置的每个声源的HRTF,从而形成作为全球形的HRTF层的HRTF层B和HRTF层A。HRTF层A是外HRTF层,HRTF层B是内HRTF层。
在图5和图6中,例如,纬度和经度的交点均表示声源位置。通过测量来自虚拟头部DH的耳朵的位置处的位置的脉冲响应并且在频率轴上表示结果,来获得特定声源位置的HRTF。
可以使用以下方法来获得HRTF。
1.真实扬声器放置在每个声源位置处并且通过单次测量获取HRTF。
2.真实扬声器放置在不同距离处并且通过多次测量获取HRTF。
3.进行声学模拟以获得HRTF。
4.针对一个HRTF层使用真实扬声器执行测量,并且针对另一HRTF层执行估计。
5.使用通过机器学习预先准备的推断模型来执行来自耳朵图像的估计。
当准备多个HRTF层时,声学处理装置1可在HRTF层A和HRTF层B中的HRTF之间切换用于声音图像定位处理(卷积处理)的HRTF。可以通过在HRTF之间切换来再现接近或远离用户U的声音。
图7是示出如何再现声音的实例的示图。
箭头#11表示用户U上方的对象落下的声音,并且箭头#12表示接近用户U前方的对象的声音。通过将用于声音图像定位处理的HRTF从HRTF层A中的HRTF切换至HRTF层B中的HRTF来再现这些类型的声音。
箭头#13表示落在用户的脚上的用户U附近的对象的声音,并且箭头#14表示远离用户移动的用户的脚上的用户U后面的对象的声音。通过将用于声音图像定位处理的HRTF从HRTF层B的HRTF切换至HRTF层A的HRTF来再现这些声音。
以这种方式,通过将用于声音图像定位处理的HRTF从一个HRTF层切换到另一HRTF层,声学处理装置1可再现沿深度方向行进的各种类型的声音,所述各种类型的声音不能由例如传统的VAD(虚拟听觉显示)***再现。
此外,由于针对布置成全球形的声源位置准备HRTF,因此不仅可以再现在用户U上方行进的声音,而且可以再现在用户U下方行进的声音。
在上文中,HRTF层的形状是全球形(球形),但是该形状可以是半球形或除了球形之外的不同形状。例如,声源可被布置为椭圆形或立方体形状以围绕参考位置,从而可形成多个HRTF层。换言之,代替将形成一个HRTF层的所有HRTF声源布置在距中心相同的距离处,声源可布置在不同的距离处。
虽然外HRTF层和内HRTF层被假设为具有相同的形状,但是层可具有不同的形状。
多层HRTF层可包括两个层,但是可设置三个以上HRTF层。HRTF层之间的间隔可相同或不同。
虽然HRTF层的中心位置被假设为用户U的位置,但是可将中心位置设置为从用户U的位置水平和垂直移位的位置。
当仅收听使用多个HRTF层再现的声音时,可使用不具有外部声音捕获功能的诸如耳机的输出装置。
换言之,输出装置的以下组合是可行的。
1.密封式耳机用作用于使用HRTF层A中的HRTF再现的声音和使用HRTF层B中的HRTF再现的声音两者的输出装置。
2.开放式耳机(耳机2)用作用于使用HRTF层A中的HRTF再现的声音和使用HRTF层B中的HRTF再现的声音两者的输出装置。
3.真实扬声器用作用于使用HRTF层A中的HRTF再现的声音的输出装置,开放式耳机用作用于使用HRTF层B中的HRTF再现的声音的输出装置。
<声学处理***的示例性应用>
·电影院声学***
图1所示的声学处理***应用于例如电影院声学***。为了输出电影的声音,不仅使用由作为观众坐在座位上的每个用户佩戴的耳机2,而且使用在电影院的指定位置中提供的真实扬声器。
图8是电影院中的真实扬声器的示例性布局的平面图。
如图8所示,真实扬声器SP1至SP5设置在设置在电影院的前面的屏幕S的后面。诸如亚低音扬声器的真实扬声器也设置在屏幕S的后面。
如虚线#21、#22、以及#23所示,在电影院的左壁和右壁以及后壁上也分别设置真实扬声器。在图8中,沿着表示壁面的直线示出的小的规则的正方形矩形表示真实扬声器。
如上所述,耳机2可捕获外部声音。每个用户收听从真实扬声器输出的声音以及从耳机2输出的声音。
根据声源的类型控制声音的输出目的地,使得例如从耳机2输出来自某个声源的声音,并且从真实扬声器输出来自另一声源的声音。
例如,从耳机2输出包括在视频图像中的人物的语音声音,并且从真实扬声器输出环境声音。
图9是示出电影院中的声源的概念的示图。
如图9所示,将由多个HRTF层再现的虚拟声源连同设置在屏幕S后面和壁面上的真实扬声器设置为用户周围的声源。在图9中由沿着指示HRTF层A和B的圆的虚线表示的扬声器,表示根据HRTF再现的虚拟声源。图9示出了以坐在电影院的坐标系的原点位置处的用户为中心的虚拟声源,但是使用多个HRTF层以相同的方式围绕坐在其他位置的每个用户再现虚拟声源。
以这种方式,如图10所示,因此佩戴耳机2时观看电影的每个用户可听到基于HRTF再现的虚拟声源的声音以及从包括真实扬声器SP1和SP5的真实扬声器输出的环境声音和其他声音。
在图10中,佩戴耳机2的用户周围的包括彩色圈C1至C4的各种大小的圈,表示基于HRTF再现的虚拟声源。
以这种方式,图1中示出的声学处理***实现了混合型声学***,其中,使用在电影院中提供的真实扬声器和由每个用户佩戴的耳机2输出声音。
由于开放式耳机2与真实扬声器相结合,可以控制为每个听众成员优化的声音和所有听众成员听到的共同声音。耳机2用于输出针对每个听众成员优化的声音,真实扬声器用于输出所有听众成员听到的共同声音。
在下文中,从实际提供的扬声器输出声音的意义上讲,从真实扬声器输出的声音将视情况称为真实声源的声音。耳机2输出的声音是虚拟声源的声音,因为该声音是基于HRTF虚拟设置的声源的声音。
·声学处理装置1的基本配置和操作
图11是作为实现混合型声学***的信息处理单元的声学处理装置1的示例性配置的示图。
在图11中所示的元件中,与上面参照图1描述的那些元件相同的元件将由相同的参考标号表示。将适当地省略冗余描述。
声学处理装置1包括卷积处理单元11、HRTF数据库12、扬声器选择单元13和输出控制单元14。声源信息,作为关于每个声源的信息被输入到声学处理装置1。声源信息包括声音数据和位置信息。
将声音数据作为声波数据提供给卷积处理单元11和扬声器选择单元13。位置信息表示声源位置在三维空间中的坐标。位置信息被提供给HRTF数据库12和扬声器选择单元13。以这种方式,例如,作为关于包括一组声音数据和位置信息的每个声源的信息的基于对象的音频数据被输入到声学处理装置1。
卷积处理单元11包括HRTF应用单元11L和HRTF应用单元11R。对于HRTF应用单元11L和HRTF应用单元11R,设置与从HRTF数据库12读出的声源位置对应的一对HRTF系数(L系数和R系数)。为每个声源准备卷积处理单元11。
HRTF应用单元11L执行滤波处理以将HRTF应用于音频信号L,并将滤波的音频信号L输出到输出控制单元14。HRTF应用单元11R执行滤波处理以将HRTF应用于音频信号R,并将滤波的音频信号R输出到输出控制单元14。
HRTF应用单元11L包括在图1中的滤波器21、滤波器22以及加法单元25,并且HRTF应用单元11R包括在图1中的滤波器23、滤波器24以及加法单元26。卷积处理单元11用作声音图像定位处理单元,通过将HRTF应用于待处理的音频信号来执行声音图像定位处理。
HRTF数据库12基于位置信息将与声源位置对应的一对HRTF系数输出至卷积处理单元11。通过位置信息识别形成HRTF层A或HRTF层B的HRTF。
扬声器选择单元13基于位置信息选择用于输出声音的真实扬声器。扬声器选择单元13生成要从所选择的真实扬声器输出的音频信号,并且将该信号输出到输出控制单元14。
输出控制单元14包括真实扬声器输出控制单元14-1和耳机输出控制单元14-2。
真实扬声器输出控制单元14-1将从扬声器选择单元13提供的音频信号输出到所选择的真实扬声器,并且将音频信号输出到所选择的真实扬声器作为真实声源的声音。
耳机输出控制单元14-2将从卷积处理单元11提供的音频信号L和音频信号R输出至每个用户佩戴的耳机2并且使耳机输出虚拟声源的声音。例如,在电影院的指定位置处设置实施具有这种配置的声学处理装置1的计算机。
参照图12中的流程图,将描述通过具有图11中所示的配置的声学处理装置1的再现处理。
在步骤S1中,HRTF数据库12和扬声器选择单元13获得关于声源的位置信息。
在步骤S2中,扬声器选择单元13获得与声源位置对应的扬声器信息。获取关于真实扬声器的特性的信息。
在步骤S3中,卷积处理单元11根据声源的位置获取从HRTF数据库12读取的HRTF系数对。
在步骤S4中,扬声器选择单元13将音频信号分配给真实扬声器。音频信号的分配基于声源位置和安装的真实扬声器的位置。
在步骤S5中,真实扬声器输出控制单元14-1根据扬声器选择单元13的分配将音频信号分配给真实扬声器,并且使与每个音频信号相应的声音从真实扬声器输出。
在步骤S6中,卷积处理单元11基于HRTF对音频信号执行卷积处理并且将卷积处理之后的音频信号输出至输出控制单元14。
在步骤S7中,耳机输出控制单元14-2将卷积处理之后的音频信号发送至耳机2以输出虚拟声源的声音。
针对来自构成电影的音频的每个声源的每个样本重复上述处理。在每个采样的处理中,根据关于声源的位置信息适当地更新一对HRTF系数。电影内容包括视频数据以及声音数据。在另一处理单元中处理视频数据。
通过该处理,声学处理装置1可以控制针对每个听众成员优化的声音和所有听众成员之间共同的声音,并且适当地再现关于声源的距离感。
例如,如果假设对象参照电影院中的绝对坐标移动,如图13中的箭头#31所示,那么从耳机2输出物体的声音,使得甚至对于相同的内容,可以根据座位位置改变用户体验。
在图13中的实例中,对象被设置为从屏幕S上的位置P1移动至电影院后面的位置P2。将在每个时刻的绝对坐标中的对象的位置转换成位置参考每个用户的座位位置,并且与转换的位置对应的HRTF(HRTF层A中的HRTF或HRTF层B中的HRTF)用于执行从每个用户的耳机2输出的声音的声音图像定位处理。
坐在电影院的右前侧的位置P11处的用户A收听从耳机2输出的声音,这使用户感知仿佛对象在对角线上向左和向后移动。坐在电影院左后侧的位置P12处的用户B收听从耳机2输出的声音,并且感觉好像对象从前对角线向右向后移动。
使用多个HRTF层或者使用开放式耳机和真实扬声器作为音频输出装置,声学处理装置1可如下执行输出控制。
1.控制使耳机2输出视频图像中的人物的声音,并且使真实扬声器输出环境声音。
在这种情况下,声学处理装置1使耳机2输出具有距屏幕S上的人物的位置的指定范围内的声源位置的声音。
2.使耳机2输出存在于电影院的中空部中的声音并且使真实扬声器输出包括在床声道中的环境声音的控制。
在这种情况下,声学处理装置1使真实扬声器输出声源位置在距真实扬声器的位置的指定范围内的声源的声音,耳机2输出声源位置远离该范围之外的真实扬声器的虚拟声源的声音。
3.控制使耳机2输出具有移动声源位置的动态对象的声音,并且使真实扬声器输出具有固定声源位置的静态对象的声音。
4.控制使真实扬声器向所有听众成员输出公共声音(诸如环境声音和背景音乐),以及使耳机2输出针对每个用户优化的声音(诸如不同语言的声音和具有根据座位位置而改变的声源方向的声音)。
5.控制使真实扬声器输出存在于包括设置真实扬声器的位置的水平面中的声音,并且使耳机2输出存在于从上述水平面垂直移位的位置中的声音。
在这种情况下,声学处理装置1使真实扬声器输出位于与真实扬声器的高度相同的高度处的声源的声音,耳机2输出具有与真实扬声器的高度不同的高度处的声源位置的虚拟声源的声音。例如,基于真实扬声器的高度的指定高度范围被设置为与真实扬声器相同的高度。
6.控制使真实扬声器输出存在于电影院中的对象的声音并且使耳机2输出存在于电影院的墙壁外部或者天花板外部和上方的位置处的对象的声音。
以这种方式,声学处理装置1可执行各种控制,使得真实扬声器输出构成电影的音频的指定声源的声音,耳机2输出不同声源的声音作为虚拟声源的声音。
·输出控制的实例1
当电影的音频包括床声道声音和对象声音时,真实扬声器可用于输出床声道声音,耳机2可用于输出对象声音。换言之,真实扬声器用于输出基于声道的声源,耳机2用于输出基于对象的虚拟声源。
图14是声学处理装置1的示例性配置的示图。
在图14中所示的元件之中,与上面参照图11所描述的那些元件相同的元件将由相同的参考标号来表示。将不重复相同的描述。这同样适用于下面描述的图17。
在图14中示出的配置与在图11中示出的配置的不同之处在于设置控制单元51并且设置床声道处理单元52代替扬声器选择单元13。床声道信息被提供给床声道处理单元52,其指示声源的声音将从哪个真实扬声器输出作为声源的位置信息。
控制单元51控制声学处理装置1的各个部分的操作。例如,基于输入到声学处理装置1的声源信息的属性信息,控制单元51控制是从真实扬声器还是从耳机2输出输入声源的声音。
床声道处理单元52基于床声道信息选择用于声音输出的真实扬声器。从真实扬声器(左、中、右、左环绕、右环绕、…)中识别用于输出声音的真实扬声器。
参照图15中的流程图,将描述通过具有图14中所示的配置的声学处理装置1的再现处理。
在步骤S11中,控制单元51获取关于要处理的声源的属性信息。
在步骤S12中,控制单元51确定要处理的声源是否是基于对象的声源。
如果在步骤S12中确定要处理的声源是基于对象的声源,则进行与参考图12所描述的用于从耳机2输出虚拟声源的声音的处理相同的处理。
换言之,在步骤S13中,HRTF数据库12获得声源的位置信息。
在步骤S14中,卷积处理单元11根据声源的位置获取从HRTF数据库12读取的HRTF系数对。
在步骤S15中,卷积处理单元11对来自基于对象的声源的音频信号进行卷积处理,并且将卷积处理之后的音频信号输出到输出控制单元14。
在步骤S16中,耳机输出控制单元14-2将卷积处理之后的音频信号发送至耳机2以输出虚拟声源的声音。
同时,如果在步骤S12中确定要处理的声源不是基于对象的声源而是基于声道的声源,则床声道处理单元52在步骤S17中获得床声道信息,并且床声道处理单元52基于床声道信息识别用于声音输出的真实扬声器。
在步骤S18中,真实扬声器输出控制单元14-1将由床声道处理单元52提供的床声道音频信号输出至真实扬声器,并且使信号作为真实声源的声音输出。
在步骤S16或步骤S18中输出声音的一个样本之后,重复步骤S11中和步骤S11之后的处理。
真实扬声器可用于不仅输出基于声道的声源的声音,而且输出基于对象的声源的声音。在这种情况下,图11的扬声器选择单元13与床声道处理单元52一起设置在声学处理装置1中。
·输出控制的实例2
图16是示例性动态对象的示图。
假设动态对象从屏幕S附近的位置P1朝向坐在原点位置处的用户移动,如箭头#41所示。在时间t1开始移动的动态对象的轨迹在时间t2在位置P2和HRTF层A相交。在时间t3在位置P3,动态对象的轨迹和HRTF层B相交。
当声源位置位于P1位置附近时,要输出的动态对象的声音,从位于P1位置附近的真实扬声器听到声音,当声源位置位于P2或P3位置附近时,主要从耳机2听到声音。
当声源位置存在于位置P2附近时,对于要输出的动态对象的声音,主要从耳机2听到通过使用与位置P2相应的HRTF层A中的HRTF的声音图像定位处理产生的声音。类似地,当声源位置在位置P3附近时,对于要输出的动态对象的声音,主要通过耳机2听到通过使用与位置P3相应的HRTF层B中的HRTF的声音图像定位处理产生的声音。
以这种方式,当再现动态对象的声音时,用于输出声音的装置根据动态对象的位置从任何真实扬声器切换至耳机2。此外,将用于从耳机2输出的声音的声音图像定位处理的HRTF从一个HRTF层中的HRTF切换到另一HRTF层中的HRTF。
交叉衰减处理被应用于每个声音,以便在执行这种切换之前和之后连接声音。
图17是声学处理装置1的示例性配置的示图。
图17中所示的配置与图11中的配置的不同之处在于,在卷积处理单元11之前的级中设置增益调整单元61和增益调整单元62。音频信号和声源位置信息被提供给增益调整单元61和增益调整单元62。
增益调整单元61和增益调整单元62各自根据声源的位置调整音频信号的增益。增益由增益调整单元61调整的音频信号L被提供给HRTF应用单元11L-A,音频信号R被提供给HRTF应用单元11R-A。增益由增益调整单元62调整的音频信号L被提供给HRTF应用单元11L-B,音频信号R被提供给HRTF应用单元11R-B。
卷积处理单元11包括在HRTF层A中使用HRTF执行卷积处理的HRTF应用单元11L-A和11R-A以及在HRTF层B中使用HRTF执行卷积处理的HRTF应用单元11L-B和11R-B。从HRTF数据库12为HRTF应用单元11L-A和11R-A提供与声源位置对应的HRTF层A中的HRTF的系数。类似地,从HRTF数据库12为HRTF应用单元11L-B和11R-B提供与声源位置对应的HRTF层B中的HRTF的系数。
HRTF应用单元11L-A执行滤波处理以将HRTF层A中的HRTF应用于从增益调整单元61提供的音频信号L,并输出滤波后的音频信号L。
HRTF应用单元11R-A执行滤波处理以将从HRTF层A中的HRTF应用于增益调整单元61提供的音频信号R并输出滤波的音频信号R。
HRTF应用单元11L-B执行滤波处理以将从HRTF层B中的HRTF应用于从增益调整单元62提供的音频信号L,并输出滤波的音频信号L。
HRTF应用单元11R-B执行滤波处理,以将HRTF层B中的HRTF应用于从增益调整单元62提供的音频信号R,并输出滤波后的音频信号R。
从HRTF应用单元11L-A输出的音频信号L和从HRTF应用单元11L-B输出的音频信号L被相加,然后被提供到耳机输出控制单元14-2并且被输出到耳机2。从HRTF应用单元11R-A输出的音频信号R和从HRTF应用单元11R-B输出的音频信号R相加,然后被提供至耳机输出控制单元14-2并且被输出至耳机2。
扬声器选择单元13根据声源的位置调整音频信号的增益和从真实扬声器输出的声音的音量。
图18示出了增益调节的实例。
图18的A示出了通过扬声器选择单元13进行的增益调节的实例。通过扬声器选择单元13执行增益调节,使得当对象在位置P1附近时,增益达到100%,并且随着目标远离位置P1移动,增益逐渐减小。
图18的B示出了由增益调整单元61进行的增益调整的实例。进行增益调整单元61的增益调整,以使得随着对象接近位置P2而增大增益,并且当对象位于位置P2附近时增益达到100%。因此,随着对象的位置从位置P1接近位置P2,真实扬声器的音量减弱并且耳机2的音量减弱。
增益调整单元61进行增益调整,使得增益随着距位置P2的距离而逐渐减小。
图18的C示出了由增益调整单元62进行的增益调整的实例。增益调整单元62的增益调整以随着对象接近位置P3而增大增益、并且在对象位于位置P3附近时增益达到100%的方式进行。以这种方式,当对象的位置从位置P2接近位置P3时,在HRTF层A中使用HRTF处理并且从耳机2输出的声音的音量减弱,并且在HRTF层B中使用HRTF处理的声音的音量减弱。
通过以此方式交叉衰减动态对象的声音,在切换输出装置时或者在用于声音图像定位处理的HRTF之间切换时,切换前和切换后的声音可以自然方式连续。
·输出控制的实例3
除了声音数据和位置信息之外,指示声源的尺寸的尺寸信息可以包括在声源信息中。通过使用多个声源的HRTF的声音图像定位处理,可以再现具有大尺寸的声源的声音。例如,通过使用多个声源的HRTF的声音图像定位处理可以再现大尺寸声源的声音。
图19是示例性声源的示图。
如图19中的颜色所示,假设声源VS设置在包括位置P1和P2的范围内。在这种情况下,在HRTF层A中的HRTF之中,通过使用在位置P1设置的声源A1的HRTF和在位置P2设置的声源A2的HRTF的声音图像定位处理来再现声源VS。
图20是声学处理装置1的示例性配置的示图。
如图20所示,声源的尺寸信息与位置信息一起被输入到HRTF数据库12和扬声器选择单元13。声源VS的音频信号L被提供给HRTF应用单元11L-A1和HRTF应用单元11L-A2,并且音频信号R被提供给HRTF应用单元11R-A1和HRTF应用单元11R-A2。
卷积处理单元11包括使用声源A1的HRTF执行卷积处理的HRTF应用单元11L-A1和HRTF应用单元11R-A1,以及使用声源A2的HRTF执行卷积处理的声源HRTF应用单元11L-A2和11R-A2。声源A1的HRTF的系数从HRTF数据库12提供给HRTF应用单元11L-A1和11R-A1。用于声源A2的HRTF的系数从HRTF数据库12提供给HRTF应用单元11L-A2和11R-A2。
HRTF应用单元11L-A1执行滤波处理以将声源A1的HRTF应用于音频信号L并输出滤波的音频信号L。
HRTF应用单元11R-A1执行滤波处理以将声源A1的HRTF应用于音频信号R并输出滤波的音频信号R。
HRTF应用单元11L-A2执行滤波处理以将声源A2的HRTF应用于音频信号L,并输出滤波的音频信号L。
HRTF应用单元11R-A2执行滤波处理以将声源A2的HRTF应用于音频信号R,并输出滤波的音频信号R。
从HRTF应用单元11L-A1输出的音频信号L和从HRTF应用单元11L-A2输出的音频信号L相加,然后被提供到耳机输出控制单元14-2并且被输出到耳机2。从HRTF应用单元11R-A1输出的音频信号R和从HRTF应用单元11R-A2输出的音频信号R相加,然后被提供至耳机输出控制单元14-2并且输出至耳机2。
如上所述,通过使用多个声源的HRTF的声音图像定位处理来再现大声源的声音。
三个以上声源的HRTF可以用于声音图像定位处理。动态对象可用于再现大声源的移动。当使用动态对象时,可以适当地执行如上所述的交叉衰减处理。
代替在相同的HRTF层中使用多个HRTF,可通过在不同的HRTF层中使用多个HRTF(诸如,HRTF层A中的HRTF和HRTF层B中的HRTF)的声音图像定位处理来再现大声源。
·输出控制的实例4
根据电影声音,可从耳机2输出高频声音,并且可从真实扬声器输出低频声音。
从耳机2输出具有预定阈值频率或高于该预定阈值频率的声音作为高频声音,并且从真实扬声器输出具有低于该频率的频率的声音作为低频声音。例如,设置为真实扬声器的亚低音扬声器用于输出低频声音。
图21是声学处理装置1的示例性配置的示图。
图21中示出的声学处理装置1的配置与图11中的配置的不同之处在于装置包括在卷积处理单元11之前的级中的HPF(高通滤波器)71和在扬声器选择单元13之前的级中的LPF(低通滤波器)72。将音频信号提供给HPF 71和LPF 72。
HPF 71从音频信号中提取高频声音信号,并且将该信号输出至卷积处理单元11。
LPF 72从音频信号中提取低频声音信号并且将该信号输出至扬声器选择单元13。
卷积处理单元11在HRTF应用单元11L和11R处执行从HPF 71提供的信号的滤波处理,并输出滤波后的音频信号。
扬声器选择单元13将从LPF 72提供的信号分配给低音扬声器,并且输出该信号。
参考图22中的流程图,将描述通过具有图21中示出的配置的声学处理装置1的再现处理。
在步骤S31,HRTF数据库12获得声源的位置信息。
在步骤S32中,卷积处理单元11根据声源的位置获取从HRTF数据库12读取的HRTF系数对。
在步骤S33中,HPF 71从音频信号中提取高频成分信号。另外,LPF72从音频信号中提取低频成分信号。
在步骤S34中,扬声器选择单元13将通过LPF 72提取的信号输出至真实扬声器输出控制单元14-1,并且使低频声音从低音扬声器输出。
在步骤S35中,卷积处理单元11对由HPF 71提取的高频成分信号进行卷积处理。
在步骤S36中,耳机输出控制单元14-2将通过卷积处理单元11进行的卷积处理之后的音频信号发送至耳机2并且使得输出高频声音。
针对来自构成电影的音频的每个声源的每个样本重复上述处理。在每个样本的处理中,根据关于声源的位置信息适当地更新HRTF系数对。
<变形例>
·示例性输出装置
虽然假设使用安装在电影院中的真实扬声器和开放型耳机2,但是混合型声学***可以与任何其他输出装置组合来实现。
图23是混合型声学***的示例性配置的示图。
如图23所示,颈带扬声器101和TV102的内置扬声器103L和103R可被组合以形成混合型声学***。颈带扬声器101是参见图4在B处描述的肩部安装的输出装置。
在这种情况下,从颈带扬声器101输出通过基于HRTF的声音图像定位处理获得的虚拟声源的声音。虽然在图23中仅示出一个HRTF层,但是在用户周围设置多个HRTF层。
基于对象的声源和基于声道的声源的声音作为真实声源的声音从扬声器103L和103R输出。
以这种方式,为每个用户准备的并且能够输出要由用户听到的声音的各种输出装置,可用作用于输出通过基于HRTF的声音图像定位处理获得的虚拟声源的声音的输出装置。
不同于安装在电影院中的真实扬声器的各种输出装置,可用作用于输出真实声源的声音的输出装置。消费者影院扬声器、智能电话和平板电脑的扬声器可用于输出真实声源。
通过组合多种类型的输出装置而实施的声学***还可为混合型声学***,其允许用户听到使用HRTF针对每一用户定制的声音和在相同空间中的所有用户的共同声音。
如图23所示,只有一个用户可以在空间中,而不是多个用户。
可使用车载扬声器实现混合型声学***。
图24示出了车载扬声器的安装位置的实例。
图24示出了汽车的驾驶员座位和乘客座位周围的配置。由有色圆圈表示的扬声器SP11至SP16安装在汽车中的各种位置中,例如,围绕驾驶员座位和前乘客座位前面的仪表板、汽车车门内部、以及汽车天花板内部。
汽车还在驾驶员座位的靠背上方设置有扬声器SP21L和SP21R,并且在乘客座位的靠背上方设置有扬声器SP22L和扬声器SP22R,如具有阴影的圆圈所示。
在汽车内部的后部的各个位置,同样设置有扬声器。
安装在每个座位处的扬声器用于输出虚拟声源的声音作为用于坐在座位中的用户的输出装置。例如,扬声器SP21L和SP21R用于输出由坐在驾驶员座位上的用户U听到的声音,如图25中的箭头#51所示。箭头#51表示从扬声器SP21L和SP21R输出的虚拟声源的声音向着坐在驾驶员座位上的用户U输出。围绕用户U的圆圈表示HRTF层。仅示出一个HRTF层,但是在用户周围设置多个HRTF层。
类似地,扬声器SP22L和SP22R用于输出将由坐在乘客座位中的用户听到的声音。
混合型声学***可以通过使用安装在每个座位处的扬声器用于从虚拟声源输出的声音并且使用其他扬声器用于从真实声源输出的声音来实现。
用于从虚拟声源声音输出的输出装置,不仅可以是由每个用户佩戴的输出装置,而且可以是安装在用户周围的输出装置。
这样,在各种收听空间中,诸如汽车中的空间或房屋中的房间以及电影院中,混合型声学***可以听到声音。
<其他实例>
图26是示例性屏幕的示图。
如图26中A处所示,允许真实扬声器安装在后侧上的声学透射屏幕可安装为电影院中的屏幕S,或者可安装不传输声音的直视显示器,如图26中B处所示。
当不传输声音的显示器被安装为屏幕S时,耳机2用于输出来自声源的声音,诸如,存在于屏幕S上的位置处的人物的语音。
用于输出虚拟声源的声音的输出装置(诸如,耳机2)可具有检测用户脸部的方向的头部跟踪功能。在这种情况下,进行声音图像定位处理,使得即使用户面部的方向改变,声音图像的位置也不改变。
针对每个收听者优化的HRTF层和公共HRTF(标准HRTF)层可被设置为HRTF层。通过使用相机拍摄收听者的耳朵的照片并基于捕捉的图像的分析结果调整标准HRTF来执行HRTF优化。
当执行HRTF优化时,可仅优化给定方向(诸如向前)上的HRTF。这使得能够减少使用HRTF的处理所需的存储器。
HRTF的后混响可与电影院的混响匹配以使声音适应。作为HRTF的后混响,在剧院中具有听众的混响和在剧院中没有观众的混响。
上述特征可以应用于诸如电影、音乐和游戏的各种内容的生产点。
·示例性计算机配置
上述一系列处理步骤可由硬件或软件执行。当通过软件执行一系列处理步骤时,将构成软件的程序从程序记录介质安装在内置于专用硬件中的计算机或者通用个人计算机上。上述一系列处理可以由硬件或软件执行。
图27是使用程序执行上述一系列处理步骤的计算机硬件的示例性配置的框图。
声学处理装置1通过具有图27中所示的配置的计算机实现。声学处理装置1的功能部分可通过多个计算机来实现。例如,控制声音输出到真实扬声器的功能部和控制声音输出到耳机2的功能部可在不同的计算机上实现。
CPU(中央处理单元)301、只读存储器(ROM)302和随机存取存储器(RAM)303通过总线304彼此连接。
输入/输出接口305进一步连接至总线304。包括键盘和鼠标的输入单元306以及包括显示器和扬声器的输出单元307连接至输入/输出接口305。此外,包括硬盘或非易失性存储器的存储单元308、包括网络接口的通信单元309、驱动可移动介质311的驱动器310连接至输入/输出接口305。
在具有上述配置的计算机中,例如,CPU 301经由输入/输出接口305和总线304将存储在存储单元308中的程序加载到RAM 303中,并且执行该程序以执行上述一系列处理步骤。
例如,由CPU 301执行的程序被记录在可移动介质311上或者经由诸如局域网、互联网或者数字广播等有线或无线传输介质提供以安装在存储单元308中。
由计算机执行的程序可以是按照本说明书中描述的顺序按时间序列执行多个处理步骤的程序,或者可以是并行或在必要定时(诸如当进行呼叫时)执行多个处理步骤的程序。
在本说明书中,***是多个组成元件(装置、模块(部件)等)的集合,并且所有组成元件可位于同一壳体中或不位于同一壳体中。因此,存储在单独的壳体中并且经由网络连接的多个装置和多个模块存储在一个壳体中的单个装置都是***。
本说明书中描述的效果仅是实例并且不旨在限制,并且可以获得其他效果。
另外,本特征的实施方式不限于上述实施方式,能够在不脱离本特征的主旨的范围内进行各种变更。
例如,本技术可以被配置为云计算,其中,多个装置经由网络共享和协作处理一个功能。
另外,上述流程图中描述的每个步骤可以由一个装置执行或者由多个装置以共享方式执行。
此外,在一个步骤包括多个处理的情况下,包括在一个步骤中的多个处理可以由一个装置执行或者由多个装置以共享方式执行。
·组件的组合实例
可以如下配置本特征。
(1)一种信息处理装置,包括:输出控制单元,被配置为使设置在收听空间中的扬声器输出构成内容的音频的指定声源的声音,并且使每个收听者的输出装置,输出与指定声源不同的虚拟声源的声音,其中虚拟声源的声音是通过使用与声源位置对应的传递函数进行处理而生成的。
(2)根据(1)的信息处理装置,其中输出控制单元使作为由每个收听者佩戴的所述输出装置的耳机输出虚拟声源的声音,其中耳机可以捕获外部声音。
(3)根据(2)的信息处理装置,其中内容包括视频图像数据和声音数据,以及
输出控制单元使耳机输出虚拟声源的声音,虚拟声源的的声音的声源位置位于从视频图像中包括的人物的位置起的预定范围内。
(4)根据(2)的信息处理装置,其中输出控制单元使扬声器输出基于声道的声音,并且使耳机输出基于对象的虚拟声源的声音。
(5)根据(2)的信息处理装置,其中输出控制单元使扬声器输出静态对象的声音,并且使耳机输出动态对象的虚拟声源的声音。
(6)根据(2)的信息处理装置,其中输出控制单元使扬声器输出将被多个收听者听到的共同的声音,并且耳机输出根据收听者的位置改变声源的方向的将被每个收听者听到的声音。
(7)根据(2)的信息处理装置,其中输出控制单元使扬声器输出具有等于扬声器的高度的高度的声源位置的声音,并且耳机输出具有不同于扬声器的高度的高度的声源位置的虚拟声源的声音。
(8)根据(2)的信息处理装置,其中输出控制单元使耳机输出具有远离扬声器的声源位置的虚拟声源的声音。
(9)根据(1)至(8)中任一项的信息处理装置,其中多个虚拟声源被设置为位于距作为中心的参考位置相同距离的虚拟声源的层多个层,
信息处理装置进一步包括存储单元,存储单元存储关于与虚拟声源中的每个中的参考位置对应的传递函数的信息。
(10)根据(9)的信息处理装置,其中通过将多个虚拟声源布置成全球形来提供虚拟声源的各个层。
(11)根据(9)或(10)的信息处理装置,其中同一层中的虚拟声源等距间隔。
(12)根据(9)至(11)中任一项的信息处理装置,其中多层虚拟声源包括各自具有针对每个收听者调整的传递函数的一层虚拟声源。
(13)根据(9)至(12)中任一项的信息处理装置,进一步包括:声音图像定位处理单元,将传递函数应用于作为处理目标的音频信号并且生成虚拟声源的声音。
(14)根据(13)的信息处理装置,其中声音图像定位处理单元从指定层中的虚拟声源的声音切换到另一层中的虚拟声源的声音,以从输出装置输出的声音。
(15)根据(14)的信息处理装置,其中输出控制单元使输出装置输出根据具有调整的增益的音频信号生成的指定层中的虚拟声源的声音和另一层中的虚拟声源的声音。
(16)一种输出控制方法,使信息处理装置:
使设置在收听空间中的扬声器输出构成内容的音频的指定声源的声音;以及
使每个收听者的输出装置输出与指定声源不同的虚拟声源的声音,其中虚拟声源的声音是通过使用与声源位置对应的传递函数进行处理而生成的。
(17)一种程序,使计算机执行以下处理:
使设置在收听空间中的扬声器输出构成内容的音频的指定声源的声音;以及
使每个收听者的输出装置输出与指定声源不同的虚拟声源的声音,其中虚拟声源的声音是通过使用与声源位置对应的传递函数进行处理而生成的。
[参考标号列表]
1声学处理装置
2耳机
11卷积处理单元
12HRTF数据库
13扬声器选择单元
14输出控制单元
51控制单元
52床声道处理单元
61,62增益调整单元
71HPF
72LPF。

Claims (17)

1.一种信息处理装置,包括:输出控制单元,被配置为使设置在收听空间中的扬声器输出构成内容的音频的指定声源的声音,并且使每个收听者的输出装置输出与所述指定声源不同的虚拟声源的声音,其中,所述虚拟声源的声音是通过使用与声源位置对应的传递函数进行处理而生成的。
2.根据权利要求1所述的信息处理装置,其中,所述输出控制单元使作为由每个收听者佩戴的所述输出装置的耳机输出所述虚拟声源的声音,其中,所述耳机能够捕获外部声音。
3.根据权利要求2所述的信息处理装置,其中,所述内容包括视频图像数据和声音数据,以及
所述输出控制单元使所述耳机输出所述虚拟声源的声音,所述虚拟声源的声音的所述声源位置位于从所述视频图像中包括的人物的位置起的预定范围内。
4.根据权利要求2所述的信息处理装置,其中,所述输出控制单元使所述扬声器输出基于声道的声音,并且使所述耳机输出基于对象的所述虚拟声源的声音。
5.根据权利要求2所述的信息处理装置,其中,所述输出控制单元使所述扬声器输出静态对象的声音,并且使所述耳机输出动态对象的所述虚拟声源的声音。
6.根据权利要求2所述的信息处理装置,其中,所述输出控制单元使所述扬声器输出将被多个所述收听者听到的共同的声音,并且使所述耳机输出根据所述收听者的位置改变声源的方向而被每个收听者听到的声音。
7.根据权利要求2所述的信息处理装置,其中,所述输出控制单元使所述扬声器输出具有高度等于所述扬声器的高度的所述声源位置的声音,并且使所述耳机输出具有高度不同于所述扬声器的高度的所述声源位置的所述虚拟声源的声音。
8.根据权利要求2所述的信息处理装置,其中,所述输出控制单元使所述耳机输出具有远离所述扬声器的所述声源位置的所述虚拟声源的声音。
9.根据权利要求1所述的信息处理装置,其中,多个所述虚拟声源被设置为使得位于距作为中心的参考位置相同距离的所述虚拟声源的层为多个层,
所述信息处理装置进一步包括存储单元,所述存储单元存储关于与所述虚拟声源中的每个虚拟声源中的所述参考位置对应的所述传递函数的信息。
10.根据权利要求9所述的信息处理装置,其中,通过将多个所述虚拟声源布置成全球形来提供所述虚拟声源的各个层。
11.根据权利要求9所述的信息处理装置,其中,同一层中的所述虚拟声源等距间隔。
12.根据权利要求9所述的信息处理装置,其中,多层的虚拟声源包括均具有针对每个所述收听者调整的所述传递函数的所述虚拟声源的层。
13.根据权利要求9所述的信息处理装置,进一步包括:声音图像定位处理单元,将所述传递函数应用于作为处理目标的音频信号并且生成所述虚拟声源的声音。
14.根据权利要求13所述的信息处理装置,其中,所述声音图像定位处理单元将从所述输出装置输出的声音从指定层中的所述虚拟声源的声音切换到另一层中的所述虚拟声源的声音。
15.根据权利要求14所述的信息处理装置,其中,所述输出控制单元使所述输出装置输出根据具有调整的增益的所述音频信号生成的所述指定层中的所述虚拟声源的声音和所述另一层中的所述虚拟声源的声音。
16.一种输出控制方法,使得信息处理装置:
使设置在收听空间中的扬声器输出构成内容的音频的指定声源的声音;以及
使每个收听者的输出装置输出与所述指定声源不同的虚拟声源的声音,其中所述虚拟声源的声音是通过使用与声源位置对应的传递函数进行处理而生成的。
17.一种程序,使计算机执行以下处理:
使设置在收听空间中的扬声器输出构成内容的音频的指定声源的声音;以及
使每个收听者的输出装置输出与所述指定声源不同的虚拟声源的声音,其中所述虚拟声源的声音是通过使用与声源位置对应的传递函数进行处理而生成的。
CN202180045499.6A 2020-07-02 2021-06-18 信息处理装置、输出控制方法和程序 Pending CN115777203A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020115136 2020-07-02
JP2020-115136 2020-07-02
PCT/JP2021/023152 WO2022004421A1 (ja) 2020-07-02 2021-06-18 情報処理装置、出力制御方法、およびプログラム

Publications (1)

Publication Number Publication Date
CN115777203A true CN115777203A (zh) 2023-03-10

Family

ID=79316104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180045499.6A Pending CN115777203A (zh) 2020-07-02 2021-06-18 信息处理装置、输出控制方法和程序

Country Status (5)

Country Link
US (1) US20230247384A1 (zh)
JP (1) JPWO2022004421A1 (zh)
CN (1) CN115777203A (zh)
DE (1) DE112021003592T5 (zh)
WO (1) WO2022004421A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116744216A (zh) * 2023-08-16 2023-09-12 苏州灵境影音技术有限公司 基于双耳效应的汽车空间虚拟环绕声音频***及设计方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024004130A1 (ja) * 2022-06-30 2024-01-04 日本電信電話株式会社 利用者装置、共通装置、それらによる方法、およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009260574A (ja) 2008-04-15 2009-11-05 Sony Ericsson Mobilecommunications Japan Inc 音声信号処理装置、音声信号処理方法及び音声信号処理装置を備えた携帯端末
EP2806658B1 (en) * 2013-05-24 2017-09-27 Barco N.V. Arrangement and method for reproducing audio data of an acoustic scene
JPWO2017061218A1 (ja) * 2015-10-09 2018-07-26 ソニー株式会社 音響出力装置、音響生成方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116744216A (zh) * 2023-08-16 2023-09-12 苏州灵境影音技术有限公司 基于双耳效应的汽车空间虚拟环绕声音频***及设计方法
CN116744216B (zh) * 2023-08-16 2023-11-03 苏州灵境影音技术有限公司 基于双耳效应的汽车空间虚拟环绕声音频***及设计方法

Also Published As

Publication number Publication date
JPWO2022004421A1 (zh) 2022-01-06
WO2022004421A1 (ja) 2022-01-06
US20230247384A1 (en) 2023-08-03
DE112021003592T5 (de) 2023-04-13

Similar Documents

Publication Publication Date Title
CN108141696B (zh) 用于空间音频调节的***和方法
US8587631B2 (en) Facilitating communications using a portable communication device and directed sound output
KR102062260B1 (ko) 귀 개방형 헤드폰을 이용한 다채널 사운드 구현 장치 및 그 방법
US11877135B2 (en) Audio apparatus and method of audio processing for rendering audio elements of an audio scene
US11902772B1 (en) Own voice reinforcement using extra-aural speakers
CN111294724B (zh) 多个音频流的空间重新定位
US9769585B1 (en) Positioning surround sound for virtual acoustic presence
US9788134B2 (en) Method for processing of sound signals
US11221820B2 (en) System and method for processing audio between multiple audio spaces
US20230247384A1 (en) Information processing device, output control method, and program
CN111492342A (zh) 音频场景处理
US11102604B2 (en) Apparatus, method, computer program or system for use in rendering audio
US20190246230A1 (en) Virtual localization of sound
CN111756929A (zh) 多屏终端音频播放方法、装置、终端设备以及存储介质
CN109923877A (zh) 对立体声音频信号进行加权的装置和方法
KR100566131B1 (ko) 음상 정위 기능을 가진 입체 음향을 생성하는 장치 및 방법
TW519849B (en) System and method for providing rear channel speaker of quasi-head wearing type earphone
US20230011591A1 (en) System and method for virtual sound effect with invisible loudspeaker(s)
WO2022124084A1 (ja) 再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム
WO2022185725A1 (ja) 情報処理装置、情報処理方法、およびプログラム
KR20230059283A (ko) 공연과 영상에 몰입감 향상을 위한 실감음향 처리 시스템
Sousa The development of a'Virtual Studio'for monitoring Ambisonic based multichannel loudspeaker arrays through headphones

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination