CN115938376A - 处理装置和处理方法 - Google Patents

处理装置和处理方法 Download PDF

Info

Publication number
CN115938376A
CN115938376A CN202210788216.3A CN202210788216A CN115938376A CN 115938376 A CN115938376 A CN 115938376A CN 202210788216 A CN202210788216 A CN 202210788216A CN 115938376 A CN115938376 A CN 115938376A
Authority
CN
China
Prior art keywords
frequency
data
unit
spectrum data
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210788216.3A
Other languages
English (en)
Inventor
藤井优美
村田寿子
下条敬洋
高地邦明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2021130085A external-priority patent/JP2023024038A/ja
Priority claimed from JP2021130087A external-priority patent/JP2023024040A/ja
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Publication of CN115938376A publication Critical patent/CN115938376A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)

Abstract

本发明提供一种能够生成均衡良好的滤波器的处理装置和处理方法。本实施方式所涉及的处理装置具备:频率特性获取部(214),获取拾音信号的频率特性;平滑化处理部(215),实施平滑化处理,以生成比基于频率特性的第一频谱数据平滑的第二频谱数据;第一压缩部(217),计算出与第一频带中的第二频谱数据和第一频谱数据的差对应的第一差值,并基于第一差值对所述第二频谱数据进行压缩;以及滤波器生成部(221),基于第二频谱数据来生成滤波器。

Description

处理装置和处理方法
技术领域
本公开涉及处理装置和处理方法。
背景技术
作为声像定位技术,存在使用头戴式耳机使声像定位在收听者的头部的外侧的头外定位技术。在头外定位技术中,消除从头戴式耳机到耳朵的特性(头戴式耳机特性),赋予从一个扬声器(单声道扬声器)到耳朵的两个特性(空间音响传递特性),由此使声像定位在头外。
在立体声扬声器的头外定位再现中,利用设置于收听者(listener)本人的耳朵的麦克风对从两个声道(以下记载为ch)的扬声器发出的测量信号(脉冲音等)进行录音。并且,处理装置基于对测量信号进行拾音而得到的拾音信号来生成滤波器。通过将生成的滤波器与2ch的音频信号卷积,能够实现头外定位再现。
并且,为了生成消除从头戴式耳机到耳朵的特性的滤波器(也称为逆滤波器),利用设置于收听者本人的耳朵的麦克风来测量从头戴式耳机到耳边至鼓膜为止的特性(也称为外耳道传递函数ECTF、外耳道传递特性)。
在专利文献1中公开了进行头外定位处理的装置。并且,在专利文献1中头外定位处理对再现信号进行了DRC(Dynamic Range Compression,动态范围压缩)处理,但在该DRC处理的前一阶段,处理装置使频率特性平滑化。并且,处理装置基于平滑化的特性进行频带分割。
现有技术文献
专利文献
专利文献1:日本特开2019-62430号公报。
发明内容
发明所要解决的问题
头外定位处理使用根据扬声器的个数的空间音响传递特性得到的空间音响滤波器和根据头戴式耳机的ECTF计算出的逆滤波器。为了最大限度地获取头外定位效果,理想的是尽量使用测量得到的空间音响滤波器和准确的逆滤波器。
但是,在通过使用了麦克风的测量而得到的频率振幅特性中会产生陡峭的峰值(水平非常高的窄频带部分)、波谷(dip)(水平非常低的窄频带部分)。因此,信号处理后的信号经常会被限幅。
峰值和波谷的水平和频率根据各种因素而变化。例如,根据测量位置处的扬声器的特性、房间的音响特性、头戴式耳机的特性等,水平、频率会发生变化。另外,根据个人的头部、耳朵的形状,水平、频率会改变。因此,必须通过测量时的使用器材每次确认特性,一边试听确认与该器材相应的调整一边进行测量。
因此,若压缩处理中的校正量(压缩量)过大,则个人所具有的个人特性的均衡会破坏。因此,可能会破坏定位的均衡,损害头外定位的效果。
并且,为了准确地测量低频带的个人特性,需要延长麦克风的拾音时间来进行测量。如果在耳朵上佩戴了麦克风的被测量者在测量中移动,则个人特性会发生变化。因此,难以生成均衡良好的滤波器。
本公开是鉴于上述问题而完成的,其目的在于提供能够生成均衡良好的滤波器的处理装置和处理方法。
用于解决问题的手段
本实施方式涉及的处理装置具备:频率特性获取部,获取输入信号的频率特性;平滑化处理部,实施平滑化处理,以生成比基于所述频率特性的第一频谱数据平滑的第二频谱数据;第一压缩部,计算出与第一频带中的所述第二频谱数据与所述第一频谱数据的差对应的第一差值,并基于所述第一差值对所述第二频谱数据进行压缩;以及滤波器生成部,基于所述第二频谱数据来生成滤波器。
本实施方式涉及的处理方法包括以下步骤:获取输入信号的频率特性;实施平滑化处理,以生成比基于所述频率特性的第一频谱数据平滑的第二频谱数据;计算出与第一频带中的所述第二频谱数据和所述第一频谱数据的差对应的第一差值,并基于所述第一差值对所述第二频谱数据进行压缩;以及基于所述第二频谱数据来生成滤波器。
本实施方式涉及的处理装置具备:频率特性获取部,获取拾音信号的频率特性;平滑化处理部,通过对基于所述频率特性的频谱数据进行平滑化来生成平滑化频谱数据;调整水平计算部,基于第一频带中的所述平滑化频谱数据来计算出调整水平;压缩部,使用所述调整水平对第二频带中的所述平滑化频谱数据进行压缩,由此生成压缩频谱数据;以及滤波器生成部,基于所述压缩频谱数据来生成滤波器。
本实施方式涉及的处理方法包括以下步骤:获取拾音信号的频率特性;通过对基于所述频率特性的频谱数据进行平滑化来生成平滑化频谱数据;基于第一频带中的所述平滑化频谱数据来计算出调整水平;使用所述调整水平对第二频带中的所述平滑化频谱数据进行压缩,由此生成压缩频谱数据;以及基于所述压缩频谱数据来生成滤波器。
发明效果
根据本公开,能够提供处理装置和处理方法,可生成均衡良好的滤波器。
附图说明
图1是示出本实施方式涉及的头外定位处理装置的框图。
图2是示意性地示出测量装置的结构的图。
图3是示出处理装置的结构的框图。
图4是用于说明第一压缩处理的曲线图。
图5是示出通过第一压缩处理得到的频谱的曲线图。
图6是用于说明第二压缩处理的曲线图。
图7是示出通过第二压缩处理得到的频谱的曲线图。
图8说明实施方式涉及的处理方法的流程图。
图9是示出在第一压缩处理中被压缩的频谱数据的曲线图。
图10是示出在第一压缩处理中被压缩的频谱数据的曲线图。
图11是示出在第一压缩处理中被压缩的频谱数据的曲线图。
图12是示出在第一压缩处理中被压缩的频谱数据的曲线图。
图13是示出其他处理装置的结构的框图。
图14是示出根据频率振幅特性得到的频谱数据的一例的曲线图。
图15是用于说明对平滑化频谱数据进行压缩的处理的图。
图16是用于说明对第三频带和第四频带进行校正的处理的图。
图17是说明实施方式涉及的处理方法的流程图。
具体实施方式
对本实施方式涉及的声像定位处理的概要进行说明。本实施方式涉及的头外定位处理使用空间音响传递特性和外耳道传递特性进行头外定位处理。空间音响传递特性是从扬声器等声源到外耳道的传递特性。外耳道传递特性是从头戴式耳机或入耳式耳机的扬声器单元到鼓膜的传递特性。在本实施方式中,测量在未佩戴头戴式耳机或入耳式耳机的状态下的空间音响传递特性,并且测量佩戴了头戴式耳机或入耳式耳机的状态下的外耳道传递特性,使用这些测量数据来实现头外定位处理。本实施方式的特征在于,具备用于测量空间音响传递特性或外耳道传递特性的麦克风***。
本实施方式涉及的头外定位处理由个人计算机、智能手机、平板PC等用户终端执行。用户终端是具有处理器等处理单元、存储器、硬盘等存储单元、液晶监视器等显示单元、触摸面板、按钮、键盘、鼠标等输入单元的信息处理装置。用户终端也可以具有收发数据的通信功能。此外,在用户终端上连接有具有头戴式耳机或入耳式耳机的输出单元。用户终端与输出单元的连接可以是有线连接,也可以是无线连接。
实施方式1.
(头外定位处理装置)
图1表示作为本实施方式涉及的声场再现装置的一例的、头外定位处理装置100的框图。头外定位处理装置100对佩戴头戴式耳机43的用户U再现声场。因此,头外定位处理装置100对Lch和Rch的立体声输入信号XL、XR进行声像定位处理。Lch和Rch的立体声输入信号XL、XR是从CD(Compact Disc,光盘)播放器等输出的模拟音频再现信号、或者mp3(MPEGAudio Layer-3)等数字音频数据。另外,音频再现信号或数字音频数据被统称为再现信号。即,Lch和Rch的立体声输入信号XL和XR成为再现信号。
此外,头外定位处理装置100并不限定于物理上单一的装置,也可以利用不同的装置进行一部分处理。例如,也可以通过智能手机等进行一部分处理,通过内置于头戴式耳机43的DSP(Digital Signal Processor,数字信号处理器)等进行剩余的处理。
头外定位处理装置100具备头外定位处理部10、保存逆滤波器Linv的滤波器部41、保存逆滤波器Rinv的滤波器部42、以及头戴式耳机43。头外定位处理部10、滤波器部41以及滤波器部42具体能够通过处理器等来实现。
头外定位处理部10具备保存空间音响传递特性Hls、Hlo、Hro、Hrs的卷积运算部11~12、21~22、以及加法器24、25。卷积运算部11~12、21~22进行使用了空间音响传递特性的卷积处理。向头外定位处理部10输入来自CD播放器等立体声输入信号XL、XR。对头外定位处理部10设定有空间音响传递特性。头外定位处理部10对各ch的立体声输入信号XL、XR卷积空间音响传递特性的滤波器(以下,也称为空间音响滤波器)。空间音响传递特性既可以是通过被测量者的头部或耳廓测量的头部传递函数HRTF,也可以是仿真头或第三者的头部传递函数。
将四个空间音响传递特性Hls、Hlo、Hro、Hrs设为一组的特性作为空间音响传递函数。在卷积运算部11、12、21、22中用于卷积的数据成为空间音响滤波器。通过以预定的滤波器长度切出空间音响传递特性Hls、Hlo、Hro、Hrs,从而生成空间音响滤波器。
空间音响传递特性Hls、Hlo、Hro、Hrs分别通过脉冲响应测量等预先获取。例如,用户U在左右的耳朵上分别佩戴麦克风。配置于用户U的前方的左右扬声器分别输出用于进行脉冲响应测量的脉冲音。并且,利用麦克风对从扬声器输出的脉冲音等测量信号进行拾音。基于由麦克风拾音的信号来获取空间音响传递特性Hls、Hlo、Hro、Hrs。测量左扬声器与左麦克风之间的空间音响传递特性Hls、左扬声器与右麦克风之间的空间音响传递特性Hlo、右扬声器与左麦克风之间的空间音响传递特性Hro、右扬声器与右麦克风之间的空间音响传递特性Hrs。
然后,卷积运算部11对Lch的立体声输入信号XL卷积与空间音响传递特性Hls对应的空间音响滤波器。卷积运算部11将卷积运算数据输出到加法器24。卷积运算部21对Rch的立体声输入信号XR卷积与空间音响传递特性Hro对应的空间音响滤波器。卷积运算部21将卷积运算数据输出到加法器24。加法器24将两个卷积运算数据相加,输出到滤波器部41。
卷积运算部12对Lch的立体声输入信号XL卷积与空间音响传递特性Hlo对应的空间音响滤波器。卷积运算部12将卷积运算数据输出到加法器25。卷积运算部22对Rch的立体声输入信号XR卷积与空间音响传递特性Hrs对应的空间音响滤波器。卷积运算部22将卷积运算数据输出到加法器25。加法器25将2个卷积运算数据相加,输出到滤波器部42。
在滤波器部41、42中设定有消除头戴式耳机特性(头戴式耳机的再现单元和麦克风之间的特性)的逆滤波器Linv、Rinv。然后,对实施了头外定位处理部10中的处理的再现信号(卷积运算信号)卷积逆滤波器Linv、Rinv。由滤波器部41对来自加法器24的Lch信号卷积Lch侧的头戴式耳机特性的逆滤波器Linv。同样地,滤波器部42对来自加法器25的Rch信号卷积Rch侧的头戴式耳机特性的逆滤波器Rinv。在佩戴了头戴式耳机43的情况下,逆滤波器Linv、Rinv消除从头戴式耳机单元到麦克风的特性。麦克风可以布置在从外耳道入口到鼓膜之间的任意位置处。
滤波器部41将处理后的Lch信号YL输出给头戴式耳机43的左单元43L。滤波器单元42将处理后的Rch信号YR输出到头戴式耳机43的右单元43R。用户U佩戴有头戴式耳机43。头戴式耳机43向用户U输出Lch信号YL和Rch信号YR(以下,也将Lch信号YL和Rch信号YR统称为立体声信号)。由此,能够再现被定位在用户U的头外的声像。
这样,头外定位处理装置100使用与空间音响传递特性Hls、Hlo、Hro、Hrs对应的空间音响滤波器和头戴式耳机特性的逆滤波器Linv、Rinv进行头外定位处理。在以下的说明中,将与空间音响传递特性Hls、Hlo、Hro、Hrs对应的空间音响滤波器和头戴式耳机特性的逆滤波器Linv、Rinv汇总作为头外定位处理滤波器。在2ch的立体声再现信号的情况下,头外定位滤波器由四个空间音响滤波器和两个逆滤波器构成。然后,头外定位处理装置100通过使用合计六个头外定位滤波器对立体声再现信号进行卷积运算处理,执行头外定位处理。头外定位滤波器优选基于用户U个人的测量。例如,基于佩戴于用户U的耳朵的麦克风拾取到的拾音信号来设定头外定位滤波器。
这样,空间音响滤波器和头戴式耳机特性的逆滤波器Linv、Rinv是音频信号用的滤波器。通过将这些滤波器与再现信号(立体声输入信号XL、XR)卷积,头外定位处理装置100执行头外定位处理。在本实施方式中,生成空间音响滤波器的处理成为技术特征之一。具体而言,在生成空间音响滤波器的处理中,实施了对频率特性中的频谱数据的增益水平进行范围压缩的水平范围控制处理(Level Range Control,以后称为LRC处理)。这里,将频率特性的频谱数据的最小增益的水平与最大增益的水平的水平宽度称为水平范围。
(空间音响传递特性的测量装置)
使用图2对测量空间音响传递特性Hls、Hlo、Hro、Hrs的测量装置200进行说明。图2是示意性地示出用于对被测量者1进行测量的测量结构的图。另外,这里,被测量者1成为与图1的用户U相同的人物,但也可以是不同的人物。
如图2所示,测量装置200具有立体声扬声器5和麦克风单元2。立体声扬声器5设置在测量环境中。测量环境也可以是用户U的自家的房间、音频***的销售商店、商品陈列室等。测量环境优选为扬声器、音响齐备的试听室。
在本实施方式中,测量装置200的处理装置201进行用于适当地生成空间音响滤波器的运算处理。例如,处理装置201包括CD播放器等音乐播放器等。处理装置201也可以是个人计算机(PC)、平板终端、智能手机等。另外,处理装置201也可以是服务器装置自身。
立体声扬声器5具备左扬声器5L和右扬声器5R。例如,在被测量者1的前方设置有左扬声器5L和右扬声器5R。左扬声器5L和右扬声器5R输出用于进行脉冲响应测量的脉冲音等。以下,在本实施方式中,将成为声源的扬声器的数量设为2(立体声扬声器)进行说明,但测量中使用的声源的数量不限于2,只要是1个以上即可。即,在1ch的单声道或5.1ch、7.1ch等所谓的多声道环境中,也同样能够应用本实施方式。
麦克风单元2是具有左麦克风2L和右麦克风2R的立体声麦克风。左麦克风2L设置于被测量者1的左耳9L,右麦克风2R设置于被测量者1的右耳9R。具体而言,优选在左耳9L、右耳9R的从外耳道入口至鼓膜的位置设置麦克风2L、2R。麦克风2L、2R对从立体声扬声器5输出的测量信号进行拾音,获取拾音信号。麦克风2L、2R将拾音信号输出到处理装置201。被测量者1既可以是人,也可以是仿真头。即,在本实施方式中,被测量者1不仅是人,而且是包含仿真头的概念。
如上所述,通过用麦克风2L、2R测量由左扬声器5L、右扬声器5R输出的脉冲音来测量脉冲响应。处理装置201将通过脉冲响应测量而获取的拾音信号存储在存储器等中。由此,测量左扬声器5L与左麦克风2L之间的空间音响传递特性Hls、左扬声器5L与右麦克风2R之间的空间音响传递特性Hlo、右扬声器5R与左麦克风2L之间的空间音响传递特性Hro、右扬声器5R与右麦克风2R之间的空间音响传递特性Hrs。即,左麦克风2L对从左扬声器5L输出的测量信号进行拾音,从而获取空间音响传递特性Hls。右麦克风2R对从左扬声器5L输出的测量信号进行拾音,从而获取空间音响传递特性Hlo。左麦克风2L对从右扬声器5R输出的测量信号进行拾音,从而获取空间音响传递特性Hro。右麦克风2R对从右扬声器5R输出的测量信号进行拾音,从而获取空间音响传递特性Hrs。
另外,测量装置200也可以基于拾音信号生成与从左右的扬声器5L、5R到左右的麦克风2L、2R的空间音响传递特性Hls、Hlo、Hro、Hrs对应的空间音响滤波器。例如,处理装置201以规定的滤波器长度截取空间音响传递特性Hls、Hlo、Hro、Hrs。处理装置201也可以对测量出的空间音响传递特性Hls、Hlo、Hro、Hrs进行校正。
由此,处理装置201生成用于头外定位处理装置100的卷积运算的空间音响滤波器。如图1所示,头外定位处理装置100使用与左右的扬声器5L、5R和左右的麦克风2L、2R之间的空间音响传递特性Hls、Hlo、Hro、Hrs对应的空间音响滤波器进行头外定位处理。即,通过将空间音响滤波器与音频再现信号卷积来进行头外定位处理。
处理装置201对与空间音响传递特性Hls、Hlo、Hro、Hrs分别对应的拾音信号实施同样的处理。即,对与空间音响传递特性Hls、Hlo、Hro、Hrs对应的四个拾音信号分别实施同样的处理。由此,能够分别生成与空间音响传递特性Hls、Hlo、Hro、Hrs对应的空间音响滤波器。
以下,对测量装置200的处理装置201及其处理进行详细说明。图3是示出处理装置201的控制框图。处理装置201具备测量信号生成部211、拾音信号获取部212、频率特性获取部214、平滑化处理部215、轴变换部216、第一压缩部217、第二压缩部218、轴变换部220以及滤波器生成部221。
测量信号生成部211具备D/A变换器、放大器等,生成用于测量外耳道传递特性的测量信号。测量信号例如是脉冲信号或TSP(Time Stretched Pulse,脉冲时间扩展)信号等。这里,测量装置200使用脉冲音作为测量信号,实施脉冲响应测量。
麦克风单元2的左麦克风2L、右麦克风2R分别对测量信号进行拾音,并将拾音信号输出至处理装置201。由左麦克风2L、右麦克风2R拾取的拾音信号作为输入信号被输入到处理装置201。拾音信号获取部212获取由左麦克风2L、右麦克风2R拾取的拾音信号。此外,拾音信号获取部212也可以具备对来自麦克风2L、2R的拾音信号进行A/D变换的A/D变换器。拾音信号获取部212也可以对通过多次测量而得到的信号进行同步加法运算。
频率特性获取部214获取拾音信号的频率特性。频率特性获取部214通过离散傅里叶变换或离散余弦变换来计算出拾音信号的频率特性。频率特性获取部214例如通过对时域的拾音信号进行FFT(快速傅里叶变换)来计算出频率特性。频率特性包括振幅谱和相位谱。此外,频率特性获取部214也可以生成功率谱来代替振幅谱。
平滑化处理部215实施平滑化处理,以生成比基于频率特性的第一频谱数据平滑的第二频谱数据。即,平滑化处理部215对基于频率特性的频谱数据进行平滑化处理。平滑化处理部215使用移动平均或Savitzky-Golay滤波器、平滑化样条、倒谱变换、倒谱包络线等方法,对频谱数据进行平滑化。
在通过倒谱解析进行平滑化的情况下,平滑化处理部215赋予升降器的次数作为平滑化的次数。在该情况下,平滑化处理部215通过对平滑化的次数赋予不同的值,能够改变平滑化的程度。在次数大的情况下,平滑化的程度变低,在次数小的情况下,平滑化的程度变高。因此,通过小的次数的平滑化处理得到的频谱数据比通过大的次数的平滑化处理得到的频谱数据平滑化。通过小的次数的平滑化处理得到的频谱数据比通过大的次数的平滑化处理得到的频谱数据平滑。
在本实施方式中,平滑化处理部215通过对频率振幅特性进行不同次数的平滑化处理,生成第一频谱数据及第二频谱数据。平滑化处理部215对频率振幅特性(振幅谱)进行相对大的次数的平滑化处理,由此计算出第一频谱数据。平滑化处理部215对频率振幅特性的频谱数据进行相对小的次数的平滑化处理,由此计算出第二频谱数据(也称为平滑化频谱数据)。平滑化处理部215生成第一频谱数据和比第一频谱数据平滑的第二频谱数据。
另外,在以下的实施方式中,将以大的次数进行了平滑化处理的频谱数据作为第一频谱数据。另外,也可以将未对频率振幅特性实施平滑化处理的频谱数据作为第一频谱数据。即,能够将通过FFT而得到的频率振幅特性作为第一频谱数据。
或者,平滑化处理部215通过进行多次平滑化处理,生成第一频谱数据及第二频谱数据。即,平滑化处理部215通过对频率振幅特性进行第一次平滑化处理,生成第一频谱数据。平滑化处理部215通过对实施了平滑化处理的第一频谱数据实施第二次平滑化处理,生成第二频谱数据。在该情况下,平滑化处理部215可以在第一次平滑化处理和第二次平滑化处理中使用相同的平滑化处理,也可以使用不同的平滑化处理。
图4是示出第一频谱数据A和第二频谱数据Asm的曲线图。在图4中,横轴为频率[Hz],纵轴为振幅值(增益)[dB]。第二频谱数据Asm比第一频谱数据A平滑。即,第二频谱数据Asm具有比第一频谱数据A平滑的增益数据。
轴变换部216通过数据插值变换第一频谱数据A以及第二频谱数据Asm的频率轴。轴变换部216在对数轴上以离散的频谱数据成为等间隔的方式改变频率振幅特性的数据的尺度。在频率特性获取部214中,第一频谱数据以及第二频谱数据(以下,统称为增益数据)在频率上成为等间隔。即,增益数据在频率线性轴成为等间隔,因此在频率对数轴成为非等间隔。因此,轴变换部216对增益数据进行插值处理,使得增益数据在频率对数轴上成为等间隔。
在增益数据中,在对数轴上,越是低频域,相邻的数据间隔越粗,越是高频域,则相邻的数据间隔越密。因此,轴变换部216对数据间隔粗的低频带的数据进行插值。具体而言,轴变换部216通过进行三维样条插值等插值处理,求出在对数轴上等间隔地配置的离散的增益数据。将进行了轴变换的增益数据作为轴变换数据。轴变换数据是频率与振幅值(增益值)建立了对应的频谱。轴变换数据是进行了轴变换的平滑化频谱数据。
对将频率轴变换为对数尺度的理由进行说明。一般认为人的感觉量被变换为对数。因此,听到的声音的频率也以对数轴考虑是重要的。通过进行尺度变换,在上述的感觉量中数据成为等间隔,因此能够在全部的频带中等价地处理数据。其结果是,数学运算、频带的分割、加权变得容易,能够得到稳定的结果。此外,轴变换部216不限于对数尺度,只要向接近人的听觉的尺度(称为听觉尺度)变换包络线数据即可。作为听觉尺度,也可以通过对数尺度(Log标度)、梅尔(mel)尺度、巴克(Bark)尺度、ERB(Equivalent RectangularBandwidth等效矩形带宽)尺度等进行轴变换。
轴变换部216通过数据插值以听觉尺度对增益数据进行尺度变换。例如,轴变换部216通过在听觉尺度中对数据间隔粗的低频带的数据进行插值,从而使低频带的数据变密。在听觉尺度下等间隔的数据在线性尺度(线性标度)下成为低频带密、高频带粗的数据。通过设为如此,轴变换部216能够以听觉尺度生成等间隔的轴变换数据。当然,轴变换数据也可以不是在听觉尺度下完全等间隔的数据。
第一压缩部217对第一频带B1中的第二频谱数据实施第一压缩处理。第一压缩部217计算出与第一频带B1中的第二频谱数据和第一频谱数据的差对应的第一差值。第一压缩部217基于第一差值对第二频谱数据进行压缩。例如,第一压缩部217计算从第二频谱数据Asm减去第一频谱数据A而得到的值(Asm-A)作为第一差值。对每个频率计算第一差值。
第一压缩部217在第一差值(Asm-A)为正值的情况下,通过对第一差值(Asm-A)乘以第一压缩系数lrcRate1来计算出第一压缩值。通过对第二频谱数据Asm加上第一压缩值lrcRate1*(Asm-A),进行压缩处理。第一压缩部217在第一差值为负值的情况下不进行压缩。即,直接使用第二频谱数据的增益。
第一压缩部217中的第一压缩处理由以下的式(1)、式(2)表示。当A小于Asm时,
Alrc1=lrcRate1*(Asm-A)+Asm……(1),
当A为Asm以上时,
Alrc1=Asm……(2)
第一压缩部217在各频率下计算上述的Alrc1。第一压缩部217在第一频谱数据的增益超过第二频谱数据的增益的频率下,不对第二频谱数据加上第一压缩值。在第一频谱数据的增益低于第二频谱数据的增益的频率下,对第二频谱数据加上第一压缩值。在第一频谱数据的增益低于第二频谱数据的增益的频率下,以第二频谱数据的增益接近第一频谱数据的增益的方式对范围进行压缩。第一压缩部217通过对第一频带B1中的第二频谱数据实施第一压缩处理来生成第三频谱数据。即,由第一压缩部217压缩后的第二频谱数据成为第三频谱数据。
例如,将某频率下的第二频谱数据Asm设为5dB,将第一频谱数据A设为3dB。第一差值(Asm-A)为2dB。另外,第一压缩系数lrcRate1=0.5。第一压缩值为0.5*(5-3)=1[dB],第三频谱数据Alrc1=5-1=4[dB]。
这样,第一压缩部217基于第一差值来判定是否进行压缩。即,第一压缩部217根据第一差值的符号(正负)来决定进行压缩的频率和不进行压缩的频率。在进行压缩的频率下,压缩后的增益成为第一频谱数据与第二频谱数据之间的值。
在图5中示出通过第一压缩部217中的第一压缩处理得到的第三频谱数据Alrc1。图5是示出第三频谱数据Alrc1的曲线图。在第一频带B1以外的频带中,第二频谱数据的增益与第三频谱数据的增益一致。将第一频带B1的下限频率设为f1S,将上限频率设为f1E
例如,第一频带B1可以是20Hz至1kHz。第一频带B1的下限频率f1S为20Hz,上限频率f1E为1kHz。当然,第一频带B1并不限定于该范围。
第二压缩部218对第二频带中的第三频谱数据实施第二压缩处理。第二压缩部218在第二频带中计算出与基准值和第三频谱数据的差对应的第二差值。第二压缩部218基于第二差值对第三频谱数据进行压缩。基准值Aref是频谱数据的增益中的规定的值,这里为0[dB]的固定值。另外,基准值在第二频带中成为恒定的水平,但也可以根据频率而不同。
第二压缩部218计算从基准值Aref减去第三频谱数据Alrc1而得到的值(Aref-Alrc1)作为第二差值。针对每个频率计算第二差值。第二压缩部218在第二差值为负值的情况下,通过对第二差值乘以第二压缩系数lrcRate2来计算出第二压缩值。通过对第三频谱数据Alrc1加上第二压缩值lrcRate2*(Aref-Alrc1),来进行压缩处理。第二压缩部218在第二差值为正值的情况下,不进行压缩。即,直接使用第三频谱数据Alrc1的增益。
第二压缩部218中的第二压缩处理由以下的式(3)、式(4)表示。当Alrc1小于Aref时,
Alrc2=lrcRate2*(Aref-Alrc1)+Alrc1……(3)
当Alrc1为Aref以上时,
Alrc2=Alrc1……(4)
图6是示出第三频谱数据与基准值的第二差值的曲线图。第二压缩部218在各频率下计算上述的Alrc2。第二压缩部218在第三频谱数据的增益超过基准值的频率下,不对第三频谱数据加上第二压缩值。在第三频谱数据的增益低于基准值的频率下,对第三频谱数据加上第二压缩值。在第三频谱数据的增益低于基准值的频率下,以第三频谱数据的增益接近基准值的方式对范围进行压缩。第二压缩部218通过对第二频带B2中的第三频谱数据实施第二压缩处理,来生成第四频谱数据。即,由第二压缩部218压缩后的第三频谱数据成为第四频谱数据。在图7中示出通过第二压缩部218中的第二压缩处理得到的第四频谱数据Alrc2
例如,第三频谱数据Alrc1为-2dB,基准值Aref为0dB。差值(Aref-Alrc1)为2dB。另外,第二压缩系数lrcRate2=0.5。第二压缩值为0.5*2=1[dB],第四频谱数据Alrc2=1-2=-1[dB]。
这样,第二压缩部218基于第二差值来判定是否进行压缩。即,第二压缩部218根据第二差值的符号(正负)来决定进行压缩的频率和不进行压缩的频率。在进行压缩的频率下,压缩后的增益成为第三频谱数据与基准值之间的值。
在第二频带B2以外的频带中,第三频谱数据的增益与第四频谱数据的增益一致。将第二频带B2的下限频率设为f2S,将上限频率设为f2E
第二频带B2的下限频率f2S为与第一频带B1的下限频率f1S相同的值。例如,下限频率f2S和下限频率f1S为20Hz。第二频带B2的上限频率f2E为与第一频带B1的上限频率f1E相同的值。例如,上限频率f2E和上限频率f1E为1kHz。
第一频带B1和第二频带B2为20Hz以上且1kHz以下的低频带。当然,下限频率f2S和下限频率f1S不限定于20Hz。上限频率f2E和上限频率f1E不限定于1kHz。
轴变换部220进行轴变换,以通过数据插值等变换第四频谱数据的频率轴。轴变换部220中的处理是与轴变换部216中的处理相反的处理。轴变换部220通过进行轴变换,以使第四频谱数据的频率轴返回到轴变换部216中的轴变换前的频率轴。例如,进行用于通过轴变换部216使成为对数尺度的频率轴返回到线性尺度的处理。将第四频谱数据在频率线性轴中成为等间隔的数据。由此,能够得到与由频率特性获取部214获取的频率相位特性相同的频率轴的频率振幅特性。即,频率相位特性与频率振幅特性的频谱数据的频率轴(数据间隔)一致。
滤波器生成部221使用由轴变换部220进行了轴变换而得的第四频谱数据来生成滤波器。滤波器生成部221基于第四频谱数据来生成应用于再现信号的滤波器。例如,滤波器生成部221通过离散傅里叶逆变换或者离散余弦逆变换并根据振幅特性和相位特性来计算出时域的信号。滤波器生成部221通过对振幅特性和相位特性进行IFFT(快速傅里叶逆变换)来生成时间信号。滤波器生成部221以规定的滤波器长度切出所生成的时间信号,由此计算出空间音响滤波器。滤波器生成部221也可以进行窗口化,生成空间音响滤波器。
滤波器生成部221通过对由左麦克风2L拾取来自左扬声器5L的测量信号而得到的拾音信号实施上述处理,从而生成与空间音响传递特性Hls对应的空间音响滤波器。滤波器生成部221通过对由右麦克风2L拾取来自左扬声器5L的测量信号而得到的拾音信号实施上述处理,从而生成与空间音响传递特性Hlo对应的空间音响滤波器。
滤波器生成部221通过对由左麦克风2L拾取来自右扬声器5R的测量信号而得到的拾音信号实施上述处理,从而生成与空间音响传递特性Hro对应的空间音响滤波器。滤波器生成部221通过对由右麦克风2R拾取来自右扬声器5R的测量信号而得到的拾音信号实施上述处理,从而生成与空间音响传递特性Hrs对应的空间音响滤波器。
由此,能够均衡良好地压缩频率特性。因此,能够生成适合于声像的定位的滤波器。能够抑制声像定位的均衡被破坏。能够定位取得了均衡的声像。能够生成调整为取得了均衡的音质的滤波器。在听觉上,能够确保自然的音质。
特别是,由于能够均衡地压缩上限频率以下的低频带,因此能够在低频带中实现优异的音质。即使在图2的测量装置200的拾音时间短的情况下,也能够生成均衡良好的滤波器。
第二频带B2的下限频率f2S也可以是与第一频带B1的下限频率f1S不同的值。例如,第二频带B2的下限频率f2S只要在比第一频带B1的下限频率f1S大且比第二频带B2的上限频率f2E小的范围即可。
第二频带B2的上限频率f2E也可以是与第一频带B1的上限频率f1E不同的值。例如,第二频带B2的上限频率f2E只要在比第一频带B1的上限频率f1E小、且比第二频带B2的下限频率f2S大的范围即可。
第一压缩系数lrcRate1和第二压缩系数lrcRate2可以是相同的值,也可以是不同的值。这里,第一压缩系数lrcRate1和第二压缩系数lrcRate2为0.5。当然,第一压缩系数lrcRate1和第二压缩系数lrcRate2的值并不限定于0.5。
如图2所示,利用左右的麦克风2L、2R对来自一个扬声器的测量信号进行拾音。因此,通过一次测量,获取两个拾音信号(也称为左右的拾音信号)。第一压缩系数lrcRate1可以在针对左右的麦克风2L、2R的拾音信号的处理中成为不同的值。同样地,第二压缩系数lrcRate2可以在左右的麦克风2L、2R中成为不同的值。
另外,如图2所示,由于使用了左右的扬声器5L、5R和左右的麦克风2L、2R,因此获取了四个拾音信号。即,分别获取表示空间音响传递特性Hls、Hlo、Hro、Hrs的拾音信号。在该情况下,能够对四个拾音信号的全部进行第一压缩处理和第二压缩处理。或者,对于四个拾音信号中的一部分,也可以不进行第一压缩处理或者第二压缩处理。换言之,也可以仅对特定方向的拾音信号进行第一压缩处理和第二压缩处理,对于剩余的方向,省略第一压缩处理和第二压缩处理中的至少一者。
并且,第一差值也可以是左右的拾音信号的平均值。例如,将根据左麦克风2L的拾音信号生成的第一频谱数据以及第二频谱数据设为AL、AsmL。将根据右麦克风2R的拾音信号生成的第一频谱数据以及第二频谱数据设为AR、AsmR。在该情况下,第一差值可以是根据左拾音信号得到的差值和根据右拾音信号得到的差值的平均值。第一差值D1由以下的式(5)表示。
D1={(AsmL-AL)+(AsmR-AR)}/2    (5)
对于左右的拾音信号,第一差值D1是共同的。第一压缩部217将式(1)的(AsmL-AL)置换为式(5)的D1,计算出左右的第三频谱数据Alrc1。然后,第一压缩部217相对于左右的频谱数据使用共同的第一差值D进行第一压缩处理。由此,能够均衡地压缩左右的频率特性。
并且,在第一压缩处理和第二压缩处理中,能够通过以沿着响度曲线的方式调整听觉上的均衡来决定压缩系数、进行处理的频带。
也可以交替地进行第一压缩处理和第二压缩处理。即,也可以在第二压缩处理之后,进一步进行第一压缩处理。进行多次的第一压缩处理和多次的第二压缩处理。在各个压缩处理中,频带、压缩系数可以相同,也可以不同。例如,压缩系数、频带可以在第一次的第一压缩处理和第二次的压缩处理中不同,也可以相同。
图8是示出本实施方式涉及的处理方法的流程图。首先,频率特性获取部214获取由拾音信号获取部212获取到的拾音信号的频率特性(S801)。例如,通过FFT等将时域的拾音信号变换为频域。接着,平滑化处理部215对频谱数据进行平滑化处理(S802)。由此,得到第二频谱数据。另外,平滑化处理部215改变平滑化处理的次数,由此得到第一频谱数据。
轴变换部216对第二频谱数据进行轴变换(S803)。由此,得到将拾音信号的频率轴变换为对数轴的频谱数据。此外,能够省略由轴变换部216进行的轴变换处理。在该情况下,也不需要后述的轴变换部220的轴变换处理。
接着,第一压缩部217计算出第一差值(S804)。即,第一压缩部217计算出与第二频谱数据和第一频谱数据的差对应的第一差值。第一压缩部217使用第一差值对第二频谱数据进行压缩(S805)。由此,计算出第三频谱数据。
第二压缩部218计算出第二差值(S806)。即,第二压缩部218计算出与基准值和第三频谱数据的差对应的第二差值。第二压缩部218使用第二差值对第三频谱数据进行压缩(S807)。由此,计算出第四频谱数据。
轴变换部220进行第四频谱数据的轴变换(S808)。滤波器生成部221基于轴变换后的第四频谱数据来生成滤波器(S809)。生成与空间音响传递特性Hls、Hlo对应的空间音响滤波器或与空间音响传递特性Hro、Hrs对应的空间音响滤波器。由此,能够生成取得了均衡的滤波器。
另外,在本实施方式涉及的处理装置和处理方法中,也可以省略第二压缩处理。即,处理装置201也可以仅实施第一压缩处理。
此外,虽然轴变换部220对第四频谱数据进行了轴变换处理,但轴变换部220也可以对其他频谱数据进行轴变换处理。即,如果是第一压缩部217进行的第一压缩处理后的频谱数据,则轴变换部220能够进行轴变换。在该情况下,在进行滤波器生成部221中的滤波器生成时,相位测量和振幅特性的频率轴一致即可。
图9至图12是示出在本实施方式的处理中得到的频谱数据的曲线图。图9示出了对表示空间音响传递特性Hls的拾音信号的频谱数据进行了第一压缩处理的结果。图10示出了对表示空间音响传递特性Hrs的拾音信号的频谱数据进行了第一压缩处理的结果。在图9、图10中,将进行了第一压缩处理的频谱数据表示为Ardc1
图11示出了对表示空间音响传递特性Hls的拾音信号的频谱数据进行了第一压缩处理以及第二压缩处理的结果。图12示出了对表示空间音响传递特性Hrs的拾音信号的频谱数据进行了第一压缩处理以及第二压缩处理的结果。在图11、图12中,将进行了第一压缩处理以及第二压缩处理的频谱数据表示为Ardc1。在图9至图12中,为了进行比较,示出了压缩前的频谱数据。具体而言,图9至图12示出了平滑化前的频谱数据。
实施方式2
在实施方式2中,处理装置中的构成和处理与第一实施例不同。处理装置以外的构成与第一实施方式相同,其说明根据需要而被省略。例如,头外定位处理装置100和测量装置200具有与图1和图2所示的相同的装置构成。参照图13,对第三实施方式的处理装置进行说明。图13是示出处理装置201的构成的框图。
以下,对测量装置200的处理装置201和其处理进行详细说明。图13是示出其他处理装置201的控制框图。处理装置201具备测量信号生成部211、拾音信号获取部212、频率特性获取部214、平滑化处理部215、轴变换部216、调整水平计算部317、压缩部318、校正处理部219、轴变换部220以及滤波器生成部221。
测量信号生成部211具备D/A变换器、放大器等,生成用于测量外耳道传递特性的测量信号。测量信号例如是脉冲信号或TSP(Time Stretched Pulse脉冲时间扩展)信号等。这里,测量装置200使用脉冲音作为测量信号,实施脉冲响应测量。
麦克风单元2的左麦克风2L、右麦克风2R分别对测量信号进行拾音,并将拾音信号输出至处理装置201。拾音信号获取部212获取由左麦克风2L、右麦克风2R拾取的拾音信号。此外,拾音信号获取部212也可以具备对来自麦克风2L、2R的拾音信号进行A/D变换的A/D变换器。拾音信号获取部212也可以对通过多次测量而得到的信号进行同步加法运算。
频率特性获取部214获取拾音信号的频率特性。频率特性获取部214通过离散傅里叶变换或离散余弦变换来计算拾音信号的频率特性。频率特性获取部214例如通过对时域的拾音信号进行FFT(快速傅里叶变换)来计算频率特性。频率特性包括振幅谱和相位谱。此外,频率特性获取部214也可以生成功率谱来代替振幅谱。
平滑化处理部215对基于频率特性的频谱数据进行平滑化处理。平滑化处理部215使用移动平均或Savitzky-Golay滤波器、平滑化样条、倒谱变换、倒谱包络线等方法,对频谱数据进行平滑化。将由平滑化处理部215平滑化后的频谱数据作为平滑化频谱数据。平滑化处理部215对基于频率特性的频谱数据进行平滑化,由此生成平滑化频谱数据。
轴变换部216通过数据插值变换平滑化频谱数据的频率轴。轴变换部216在对数轴上以离散的频谱数据成为等间隔的方式改变频率振幅特性的数据的尺度。由频率特性获取部214求出的频率振幅特性的频谱数据以及平滑化频谱数据(以下,也称为增益数据)在频率上成为等间隔。即,增益数据在频率线性轴上成为等间隔,因此在频率对数轴上成为非等间隔。因此,轴变换部216对增益数据进行插值处理,使得增益数据在频率对数轴上成为等间隔。
在增益数据中,在对数轴上,越是低频域,相邻的数据间隔越粗,越是高频域,则相邻的数据间隔越密。因此,轴变换部216对数据间隔粗的低频带的数据进行插值。具体而言,轴变换部216通过进行三维样条插值等插值处理,求出在对数轴上等间隔地配置的离散的增益数据。将进行了轴变换的增益数据作为轴变换数据。轴变换数据是频率与振幅值(增益值)建立了对应的频谱。轴变换数据是进行了轴变换的平滑化频谱数据。
对将频率轴变换为对数尺度的理由进行说明。一般认为人的感觉量被变换为对数。因此,听到的声音的频率也以对数轴考虑是重要的。通过进行尺度变换,在上述的感觉量中数据成为等间隔,因此能够在全部的频带中等价地处理数据。其结果是,数学运算、频带的分割、加权变得容易,能够得到稳定的结果。此外,轴变换部216不限于对数尺度,只要向接近人的听觉的尺度(称为听觉尺度)变换包络线数据即可。作为听觉尺度,也可以通过对数尺度(Log标度)、梅尔(mel)尺度、巴克(Bark)尺度、ERB(Equivalent RectangularBandwidth等效矩形带宽)尺度等进行轴变换。
轴变换部216通过数据插值以听觉尺度对增益数据进行尺度变换。例如,轴变换部216通过在听觉尺度中对数据间隔粗的低频带的数据进行插值,从而使低频带的数据变密。在听觉尺度下等间隔的数据在线性尺度(线性标度)下成为低频带密、高频带粗的数据。通过设为如此,轴变换部216能够以听觉尺度生成等间隔的轴变换数据。当然,轴变换数据也可以不是在听觉尺度下完全等间隔的数据。
调整水平计算部317基于第一频带B1中的平滑化频谱数据来计算出调整水平。例如,调整水平可以是第一频带B1中的平滑化频谱数据的平均水平。即,调整水平计算部317计算出第一频带B1中包含的平滑化频谱数据的增益的总和。调整水平计算部317通过将总和除以第一频带B1中包含的数据数量来计算出调整水平。
图14示出调整水平的计算例。图14是示意性地示出平滑化频谱数据Asm和调整水平Aave的曲线图。在图14中,横轴为频率[Hz],纵轴为振幅值(增益)[dB]。这里,作为平滑化频谱数据Asm,使用了由轴变换部216进行了轴变换的轴变换数据,但也可以省略轴变换处理。即,进行了轴变换的平滑化频谱数据Asm的平均水平成为调整水平Aave。例如,调整水平Aave=3dB。即,在第一频带B1中,平滑化频谱数据Asm的增益的平均值为3dB。
第一频带B1例如能够设为5kHz至10kHz。即,第一频带B1的下限频率f1S为5kHz,上限频率f1E为10kHz。另外,如后所述,平均水平也可以是基于由左右的麦克风2L、2R拾取到的拾音信号的平滑化频谱数据的平均值。
压缩部318使用调整水平Aave压缩第二频带B2中的平滑化频谱数据。另外,将由压缩部318压缩后的平滑化频谱数据作为压缩频谱数据。例如,压缩部318计算出从平滑化频谱数据的增益减去调整水平Aave而得到的差值。然后,对差值乘以规定的压缩系数,计算出压缩值。压缩部318对第二频带B2中的平滑化频谱数据的增益减去压缩值。由此,生成压缩频谱数据。
图15是用于说明压缩部318中的LRC处理的曲线图。将压缩频谱数据设为Alrc,将平滑化频谱数据设为Asm[dB],将调整水平设为Aave[dB],将压缩系数设为lrcRate。压缩部318中的LRC处理由以下的式(6)表示。
Alrc=Asm-lrcRate*(Asm-Aave)……(6)
压缩部318基于式(1)对第二频带B2中包含的平滑化频谱数据的增益进行压缩。由于平滑化频谱数据Asm针对每个频率而增益值不同,因此压缩频谱数据Alrc也针对每个频率成为不同的增益值。压缩值(lrcRate*(Asm-Aave))针对每个频率成为不同的值。压缩部318对于各个频率计算出压缩频谱数据Alrc的增益值。即,压缩部318以针对每个频率而不同的压缩值来压缩平滑化频谱数据。
压缩系数lrcRate可以是恒定值。例如,压缩系数lrcRate可以为大于0且1以下的值。这里,压缩系数lrcRate=0.5。调整水平Aave=3[dB]。当Asm=5[dB]时,压缩值为0.5*(5-3)=1[dB],压缩频谱数据Alrc=5-1=4[dB]。
这样,压缩部318校正第二频带B2中的平滑化频谱数据,以使其接近调整水平Aave。即,压缩部318通过压缩平滑化频谱数据以使其接近调整水平。即,压缩频谱数据成为平滑化频谱数据与调整水平之间的值。
在平滑化频谱数据大于调整水平的频率下,压缩频谱数据成为比平滑化频谱数据小的值。在平滑化频谱数据小于调整水平的频率下,压缩频谱数据成为比平滑化频谱数据大的值。由此,能够在维持个人特性的状态下压缩平滑化频谱数据。在第二频带B2中,由于压缩系数lrcRate是恒定的,所以与调整水平的差值越大,压缩越大。
第二频带B2例如能够设为1kHz~20kHz。即,第二频带B2的下限频率f2S为1kHz,上限频率f2E为20kHz。此外,第一频带B1和第二频带B2并不限定于上述的范围。例如,第一频带B1能够设为在第二频带B2中尤其是个人的频率特性的增益变动较多出现的频带。由此,能够在不损害个人所具有的个人特性的均衡的情况下压缩频谱数据的范围。
第二频带B2可以是与第一频带B1一致的频带,也可以是不同的频带。第一频带B1和第二频带B2也可以是一部分重复的频带。第一频带B1可以是包含在第二频带B2中的频带。第一频带B1的下限频率f1S能够设为第二频带B2的下限频率f2S以上且上限频率f2E以下。第一频带B1的上限频率f1E可以设为第二频带B2的下限频率f2S以上且上限频率f2E以下。
校正处理部219对压缩频谱数据进行校正,以使得在压缩部318压缩后的第二频带B2的周边增益不急剧变化。具体而言,校正处理部219对第三频带B3和第四频带B4中的压缩频谱数据(平滑化频谱数据)的增益进行校正。
如图16所示,第三频带B3是第二频带B2的低频侧的偏移频带。第三频带B3是与第二频带B2相邻的频带。第四频带B4是第二频带B2的高频侧的偏移频带。第四频带B4是与第二频带B2相邻的频带。
例如,第三频带B3为900Hz至1kHz,第四频带B4为20kHz至21kHz。第三频带B3的下限频率f3S为900Hz,上限频率f3E=1kHz。第三频带B3的上限频率f3E与第二频带B2的下限频率f2S一致。第四频带B4的下限频率f4S=20kHz,上限频率f4E=21kHz。第四频带B4的下限频率f4S与第二频带B2的上限频率f2E一致。
校正处理部219校正第三频带B3的平滑化频谱数据。具体而言,校正处理部219对第三频带B3的增益进行校正,以使得在第二频带B2的下限频率f2S的周边增益不急剧地变化。
例如,校正处理部219校正增益,以在下限频率f3S与上限频率f3E之间平滑地连接频谱数据。校正处理部219通过正弦曲线等曲线对下限频率f3S与上限频率f3E之间进行插值。具体而言,校正处理部219对第三频带B3的增益进行插值,以使得下限频率f3S的增益和上限频率f3E处的增益以正弦函数或多项式曲线等曲线连接。或者,校正处理部219也可以进行线性插值,以使得下限频率f3S的增益和上限频率f3E下的增益以直线连接。由此,以随着从下限频率f3S朝向上限频率f3E而增益逐渐增加的方式或者逐渐减少的方式校正增益。
或者,也可以以使式(1)中的压缩系数lrcRate逐渐变化的方式压缩第三频带B3。在该情况下,校正处理部219使用从下限频率f3S朝向上限频率f3E逐渐增大的压缩系数lrcRate压缩平滑化频谱数据。例如,下限频率f3S下的压缩系数设为0,上限频率f3E下的压缩系数设为0.5。在该情况下,从下限频率f3S朝向上限频率f3E,设定从0逐渐增加到0.5的压缩系数lrcRate。
校正处理部219对增益进行校正,以使得从下限频率f3S朝向上限频率f3E逐渐被压缩。换言之,校正处理部219对增益进行校正,使得从上限频率f3E朝向下限频率f3S逐渐不施加压缩。
同样地,校正处理部219校正第四频带B4的平滑化频谱数据。具体而言,校正处理部219校正第四频带B4的增益,以使得在第二频带B2的上限频率f2E的周边增益不急剧地变化。
例如,校正处理部219校正增益,以在下限频率f4S与上限频率f4E之间平滑地连接频谱数据。校正处理部219以直线或曲线对下限频率f4S与上限频率f4E之间进行插值。由此,以随着从下限频率f4S朝向上限频率f4E而增益逐渐增加的方式或者逐渐减少的方式校正增益。
或者,也可以以使式(1)中的压缩系数lrcRate逐渐变化的方式压缩第三频带B3。在该情况下,校正处理部219使用从下限频率f4S朝向上限频率f4E逐渐变小的压缩系数对平滑化频谱数据进行压缩。这样,校正处理部219对增益进行调整,以使得从上限频率f4E朝向下限频率f4S逐渐被压缩。换言之,校正处理部219对增益进行校正,以使得从下限频率f4S朝向上限频率f4E逐渐不施加压缩。
将校正处理部219实施校正后的频谱数据作为校正频谱数据。第三频带B3和第四频带B4的校正频谱数据成为对平滑化频谱数据实施了校正处理部219中的校正的数据。第二频带B2的校正频谱数据成为与压缩频谱数据相同的数据。即,第二频带B2的校正频谱数据成为通过压缩部318的压缩处理而生成的增益值。在比第三频带B3的下限频率f3S更靠近低频侧的频带中,校正频谱数据成为与平滑化频谱数据相同的数据。在比第四频带B4的上限频率f4E更靠近高频侧的频带中,校正频谱数据成为与平滑化频谱数据相同的数据。
轴变换部220进行轴变换,以通过数据插值等变换校正频谱数据的频率轴。轴变换部220中的处理是与轴变换部216中的处理相反的处理。轴变换部220通过进行轴变换,使校正频谱数据的频率轴返回到轴变换部216中的轴变换前的频率轴。例如,进行用于通过轴变换部216使成为对数尺度的频率轴返回到线性尺度的处理。将校正频谱数据在频率线性轴中成为等间隔的数据。由此,能够得到与由频率特性获取部214获取的频率相位特性相同的频率轴的频率振幅特性。即,频率相位特性与频率振幅特性的频谱数据的频率轴(数据间隔)一致。
滤波器生成部221使用由轴变换部220进行了轴变换而得的校正频谱数据来生成滤波器。滤波器生成部221基于校正频谱数据来生成应用于再现信号的滤波器。例如,滤波器生成部221通过离散傅里叶逆变换或者离散余弦逆变换并根据振幅特性和相位特性来计算出时域的信号。滤波器生成部221通过对振幅特性和相位特性进行IFFT(快速傅里叶逆变换)来生成时间信号。滤波器生成部221以规定的滤波器长度切出所生成的时间信号,由此计算出空间音响滤波器。滤波器生成部221也可以进行窗口化,生成空间音响滤波器。
滤波器生成部221通过对由左麦克风2L拾取来自左扬声器5L的测量信号而得到的拾音信号实施上述处理,从而生成与空间音响传递特性Hls对应的空间音响滤波器。滤波器生成部221通过对由右麦克风2L拾取来自左扬声器5L的测量信号而得到的拾音信号实施上述处理,从而生成与空间音响传递特性Hlo对应的空间音响滤波器。
滤波器生成部221通过对由左麦克风2L拾取来自右扬声器5R的测量信号而得到的拾音信号实施上述处理,从而生成与空间音响传递特性Hro对应的空间音响滤波器。滤波器生成部221通过对由右麦克风2R拾取来自右扬声器5R的测量信号而得到的拾音信号实施上述处理,从而生成与空间音响传递特性Hrs对应的空间音响滤波器。
由此,能够均衡良好地压缩频率特性。因此,能够生成适合于声像的定位的滤波器。即,能够在维持个人特性的情况下对用户的频率特性进行压缩。能够抑制声像定位的均衡被破坏。能够定位取得了均衡的声像。能够生成调整为取得了均衡的音质的滤波器。在听觉上,能够确保自然的音质。
此外,调整水平计算部317也可以根据基于由左麦克风2L和右麦克风2R拾取到的拾音信号的频率特性的频谱数据来计算出调整水平。如图2所示,左麦克风2L和右麦克风2R测量拾音信号。因此,拾音信号获取部212通过一次测量获取两个拾音信号。例如,在从左扬声器5L输出测量信号的情况下,拾音信号获取部212获取与空间音响传递特性Hls对应的拾音信号和与空间音响传递特性Hlo对应的拾音信号。然后,调整水平计算部317根据两个拾音信号的平滑化频谱数据计算左右共同的调整水平。
频率特性获取部214分别计算两个拾音信号的频率特性。将由左麦克风2L拾取到的拾音信号的平滑化频谱数据设为AsmL,将由右麦克风2R拾取到的拾音信号的平滑化频谱数据设为AsmR。将根据平滑化频谱数据AsmL得到的调整水平设为AaveL,将根据平滑化频谱数据AsmR得到的调整水平设为AaveR。这里,调整水平AaveL设为第一频带B1中的平滑化频谱数据AsmL的平均值。调整水平AaveR设为第一频带B1中的平滑化频谱数据AsmR的平均值。另外,调整水平只要能够计算与个人特性的频率均衡无关地能够稳定地获取的水平即可,并不限定于平均值。例如,调整水平也可以是中央值等代表值、统计值。调整水平也可以是平均值和加上标准偏差而得到的值等统计值的组合。
调整水平计算部317根据左右的调整水平AaveL、AaveR计算出整体的调整水平Aave。例如,左右共同的调整水平Aave由以下的式(7)表示。
Aave=(AaveL+AaveR)/2……(7)
针对基于左扬声器5L的拾音信号的频谱数据的调整水平与针对基于右扬声器5R的拾音信号的频谱数据的调整水平相同。由此,能够更适当地压缩第二频带B2。
如果将基于左麦克风2L的拾音信号的压缩频谱数据设为AlrcL,将根据右麦克风2R的拾音信号得到的压缩频谱数据设为AlrcR,则压缩部318中的LRC处理由以下的式(8)、式(9)表示。
AlrcL=AsmL-lrcRate*(AsmL-Aave)……(8)
AlrcR=AsmR-lrcRate*(AsmR-Aave)……(9)
滤波器生成部221基于压缩频谱数据AlrcL生成与空间音响传递特性Hls对应的滤波器。滤波器生成部221基于压缩频谱数据AlrcR生成与空间音响传递特性Hlo对应的滤波器。
对于使用右扬声器5R的测量也同样地,调整水平计算部317计算出左右共同的调整水平。滤波器生成部221基于压缩频谱数据AlrcL生成与空间音响传递特性Hro对应的滤波器。滤波器生成部221基于压缩频谱数据AlrcR生成与空间音响传递特性Hrs对应的滤波器。这样,调整水平计算部317根据由左麦克风2L和右麦克风2R拾取到的拾音信号的平滑化频谱数据来计算出调整水平。因此,能够使用更适当的调整水平来压缩频谱数据。因此,能够生成取得了均衡的滤波器。
图17是示出本实施方式涉及的处理方法的流程图。首先,频率特性获取部214获取由拾音信号获取部212获取到的拾音信号的频率特性(S701)。例如,通过FFT等将时域的拾音信号变换为频域。接着,平滑化处理部215对频谱数据进行平滑化处理(S702)。由此,得到平滑化频谱数据。
轴变换部216对平滑化频谱数据进行轴变换(S703)。由此,得到将拾音信号的频率轴变换为对数轴的频谱数据。此外,能够省略由轴变换部216进行的轴变换处理。在该情况下,也不需要后述的轴变换部220的轴变换处理。
接着,调整水平计算部317在左右的平滑化频谱数据中分别计算出第一频带B1的平均水平(S704)。由此,分别得到左右的调整水平AaveL、AaveR。接着,调整水平计算部317计算出左右的平均水平作为调整水平Aave(S705)。由此,得到左右共同的调整水平Aave。此外,在使用左右不同的调整水平的情况下,能够省略步骤S705的处理。
接着,压缩部318使用调整水平对第二频带B2的平滑化频谱数据进行压缩(S706)。具体而言,压缩部318基于上述的式(3)、式(4)生成压缩频谱数据。
校正处理部219校正偏移频带(S707)。即,校正处理部219校正第三频带B3和第四频带B4的压缩频谱数据。由此,得到校正频谱数据。轴变换部220进行校正频谱数据的轴变换(S708)。滤波器生成部221基于轴变换后的校正频谱数据来生成滤波器(S709)。生成与空间音响传递特性Hls、Hlo对应的空间音响滤波器或与空间音响传递特性Hro、Hrs对应的空间音响滤波器。由此,能够生成取得了均衡的滤波器。
并且,在实施方式1、2中,处理装置201对表示空间音响传递特性Hls、Hlo、Hro、Hrs的拾音信号的频谱数据进行了处理,但也可以对表示外耳道传递特性的拾音信号的频谱数据进行处理。并且,处理装置201生成头外低位处理滤波器,但也可以生成其他滤波器。通过使用由本实施方式涉及的处理方法生成的滤波器,能够定位取得了均衡的声像。
头外定位处理装置100不限于物理上单一的装置,也可以分散在经由网络等连接的多个装置中。换言之,本实施方式涉及的头外定位处理方法也可以分散多个装置而实施。
上述处理中的一部分或全部可以通过计算机程序来执行。上述的程序包含在读入到计算机中的情况下用于使计算机进行在实施方式中说明的1个或其以上的功能的命令组(或软件代码)。程序可以保存在非暂时性计算机可读介质或具有实体的存储介质中。作为示例,具有计算机可读介质或实体的存储介质包括随机存取存储器(RAM)、只读存储器(ROM)、闪存、固态驱动器(SSD)或其他存储器技术、CD-ROM、数字通用光盘(DVD)、蓝光(注册商标)盘或其他光盘存储器、磁盘、磁带、磁盘存储器或其他磁存储设备,但是不限于此。程序可以在临时的计算机可读介质或通信介质上发送。作为示例,临时的计算机可读介质或通信介质包括电、光学、音响或其他格式的传播信号。
以上,基于实施方式具体地说明了由本发明人完成的发明,但本发明并不限定于上述实施方式,当然能够在不脱离其主旨的范围内进行各种变更。
符号说明
U 用户
1 被测量者
2 麦克风单元
2L 左麦克风
2R 右麦克风
5 立体声扬声器
5L 左扬声器
5R 右扬声器
10 头外定位处理部
11 卷积运算部
12 卷积运算部
21 卷积运算部
22 卷积运算部
24 加法器
25 加法器
41 滤波器部
42 滤波器部
43 头戴式耳机
200 测量装置
201 处理装置
211 测量信号生成部
212 拾音信号获取部
214 频率特性获取部
215 平滑化处理部
216 轴变换部
217 第一压缩部
218 第二压缩部
317 调整水平计算部
318 压缩部
219 校正处理部
220 轴变换部
221 滤波器生成部
B1 第一频带
B2 第二频带
B3 第三频带
B4 第四频带

Claims (12)

1.一种处理装置,具备:
频率特性获取部,获取拾音信号的频率特性;
平滑化处理部,通过对基于所述频率特性的频谱数据进行平滑化来生成平滑化频谱数据;
压缩部,通过使用预定值来压缩所述平滑化频谱数据,来生成压缩频谱数据;以及
滤波器生成部,基于所述压缩频谱数据来生成滤波器。
2.根据权利要求1所述的处理装置,其中,
所述平滑化处理部实施平滑化处理,以生成比基于所述频率特性的第一频谱数据平滑的第二频谱数据,
所述压缩部具有第一压缩部,所述第一压缩部计算与第一频带中的所述第二频谱数据和所述第一频谱数据的差对应的第一差值,并基于所述第一差值对所述第二频谱数据进行压缩,
所述滤波器生成部基于所述压缩后的第二频谱数据来生成滤波器。
3.根据权利要求2所述的处理装置,具备:
第二压缩部,计算与通过所述第一压缩部中的第一压缩处理生成的第三频谱数据和频谱数据的增益中的预定基准值的差对应的第二差值,并基于所述第二差值对所述第三频谱数据进行压缩。
4.根据权利要求3所述的处理装置,其中,
交替地进行所述第一压缩部的第一压缩处理和所述第二压缩部的第二压缩处理。
5.根据权利要求2所述的处理装置,还具备:
第一轴变换部,通过数据插值对所述第一频谱数据的频率轴进行变换;以及
第二轴变换部,通过数据插值对由所述第一压缩部压缩后的频谱数据的频率轴进行变换,
所述滤波器生成部基于由所述第二轴变换部进行轴变换后的频谱数据来生成所述滤波器。
6.根据权利要求1所述的处理装置,还具备:
调整水平计算部,基于第一频带中的所述平滑化频谱数据来计算出调整水平,
所述压缩部通过使用所述调整水平压缩第二频带中的所述平滑化频谱数据,来生成压缩频谱数据,
所述滤波器生成部基于所述压缩频谱数据来生成滤波器。
7.根据权利要求6所述的处理装置,还具备:
第一轴变换部,通过数据插值对所述平滑化频谱数据的频率轴进行变换;以及
第二轴变换部,通过数据插值对所述压缩频谱数据的频率轴进行变换,
所述滤波器生成部基于由所述第二轴变换部进行轴变换后的压缩频谱数据来生成所述滤波器。
8.根据权利要求6所述的处理装置,还具备:
校正处理部,在避免增益在所述第二频带的高频侧和低频侧急剧变化而分别设置的偏移频带中,校正所述压缩频谱数据。
9.根据权利要求6所述的处理装置,其中,
所述拾音信号是使用分别佩戴在被测者的左右耳朵上的麦克风拾取的,
所述调整水平计算部根据由左右的所述麦克风拾取到的所述拾音信号的所述平滑化频谱数据来计算所述调整水平。
10.一种处理方法,包括:
频率特性获取步骤,获取拾音信号的频率特性;
平滑化处理步骤,通过对基于所述频率特性的频谱数据进行平滑化来生成平滑化频谱数据;
压缩步骤,通过使用预定值压缩所述平滑化频谱数据,来生成压缩频谱数据;以及
滤波器生成步骤,基于所述压缩频谱数据来生成滤波器。
11.根据权利要求10所述的处理方法,其中,
在所述平滑化处理步骤中,实施平滑化处理,以生成比基于所述频率特性的第一频谱数据平滑的第二频谱数据,
所述压缩步骤包括第一压缩步骤,通过所述第一压缩步骤计算与第一频带中的所述第二频谱数据和所述第一频谱数据的差对应的第一差值,并基于所述第一差值对所述第二频谱数据进行压缩,
在所述滤波器生成步骤中,基于所述压缩后的第二频谱数据来生成滤波器。
12.根据权利要求10所述的处理方法,其中,
还包括调整水平计算步骤,通过调整水平计算步骤基于第一频带中的所述平滑化频谱数据来计算出调整水平,
在所述压缩步骤中,通过使用所述调整水平压缩第二频带中的所述平滑化频谱数据,来生成压缩频谱数据,
在所述滤波器生成步骤中,基于所述压缩频谱数据来生成滤波器。
CN202210788216.3A 2021-08-06 2022-07-06 处理装置和处理方法 Pending CN115938376A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2021-130085 2021-08-06
JP2021130085A JP2023024038A (ja) 2021-08-06 2021-08-06 処理装置、及び処理方法
JP2021130087A JP2023024040A (ja) 2021-08-06 2021-08-06 処理装置、及び処理方法
JP2021-130087 2021-08-06

Publications (1)

Publication Number Publication Date
CN115938376A true CN115938376A (zh) 2023-04-07

Family

ID=85153557

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210788216.3A Pending CN115938376A (zh) 2021-08-06 2022-07-06 处理装置和处理方法

Country Status (2)

Country Link
US (1) US20230040821A1 (zh)
CN (1) CN115938376A (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5654955B2 (ja) * 2011-07-01 2015-01-14 クラリオン株式会社 直接音抽出装置および残響音抽出装置
EP3213532B1 (en) * 2014-10-30 2018-09-26 Dolby Laboratories Licensing Corporation Impedance matching filters and equalization for headphone surround rendering
US20230199419A1 (en) * 2020-05-20 2023-06-22 Harman International Industries, Incorporated System, apparatus, and method for multi-dimensional adaptive microphone-loudspeaker array sets for room correction and equalization
EP3945729A1 (de) * 2020-07-31 2022-02-02 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. System und verfahren zur kopfhörerentzerrung und raumanpassung zur binauralen wiedergabe bei augmented reality

Also Published As

Publication number Publication date
US20230040821A1 (en) 2023-02-09

Similar Documents

Publication Publication Date Title
CN110612727B (zh) 头外定位滤波器决定***、头外定位滤波器决定装置、头外定位决定方法以及记录介质
US11115743B2 (en) Signal processing device, signal processing method, and program
CN110313188B (zh) 头外定位处理装置、头外定位处理方法以及存储介质
JP6753329B2 (ja) フィルタ生成装置、及びフィルタ生成方法
CN110301142A (zh) 滤波器生成装置、滤波器生成方法以及程序
CN115938376A (zh) 处理装置和处理方法
JP6805879B2 (ja) フィルタ生成装置、フィルタ生成方法、及びプログラム
US20230114777A1 (en) Filter generation device and filter generation method
JP6950405B2 (ja) 処理装置、処理方法、及びプログラム
JP2023024040A (ja) 処理装置、及び処理方法
CN113412630B (zh) 处理装置、处理方法、再现方法和程序
JP2023024038A (ja) 処理装置、及び処理方法
JP2023047707A (ja) フィルタ生成装置、及びフィルタ生成方法
JP2023047706A (ja) フィルタ生成装置、及びフィルタ生成方法
US20230045207A1 (en) Processing device and processing method
US11228837B2 (en) Processing device, processing method, reproduction method, and program
JP7435334B2 (ja) 頭外定位フィルタ決定システム、頭外定位フィルタ決定方法、及びプログラム
WO2021059984A1 (ja) 頭外定位フィルタ決定システム、頭外定位処理装置、頭外定位フィルタ決定装置、頭外定位フィルタ決定方法、及びプログラム
JP2024036908A (ja) 頭外定位処理装置、頭外定位処理方法、及びプログラム
JP2024097517A (ja) フィルタ生成装置、フィルタ生成方法、及び頭外定位処理装置
JP2024097516A (ja) フィルタ生成装置、フィルタ生成方法、及び頭外定位処理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination