CN102428716B - 助听器装置 - Google Patents
助听器装置 Download PDFInfo
- Publication number
- CN102428716B CN102428716B CN201080021517.9A CN201080021517A CN102428716B CN 102428716 B CN102428716 B CN 102428716B CN 201080021517 A CN201080021517 A CN 201080021517A CN 102428716 B CN102428716 B CN 102428716B
- Authority
- CN
- China
- Prior art keywords
- session
- voice
- sound
- except
- directed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims abstract description 102
- 230000005236 sound signal Effects 0.000 claims abstract description 90
- 238000012937 correction Methods 0.000 claims description 114
- 238000003860 storage Methods 0.000 claims description 35
- 230000015572 biosynthetic process Effects 0.000 claims description 28
- 230000001915 proofreading effect Effects 0.000 claims description 19
- 238000003786 synthesis reaction Methods 0.000 claims 12
- 238000006243 chemical reaction Methods 0.000 claims 2
- 238000000034 method Methods 0.000 description 101
- 150000001875 compounds Chemical class 0.000 description 99
- 230000008569 process Effects 0.000 description 66
- 238000010586 diagram Methods 0.000 description 52
- 238000001514 detection method Methods 0.000 description 44
- 210000005069 ears Anatomy 0.000 description 34
- 240000006409 Acacia auriculiformis Species 0.000 description 30
- 230000008859 change Effects 0.000 description 18
- 230000002787 reinforcement Effects 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000013016 learning Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000005728 strengthening Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/407—Circuits for combining signals of a plurality of transducers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
- G01S3/803—Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/43—Signal processing in hearing aids to enhance the speech intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/55—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
- H04R25/552—Binaural
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/55—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
- H04R25/554—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired using a wireless connection, e.g. between microphone and amplifier or using Tcoils
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Neurosurgery (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
没有在语音识别精度上的降低,通过使用从多个麦克风输入的声音信号检测由除了会话对方之外的某人的呼叫和其他各种声音。助听器装置基于除了会话对方之外的某人的呼叫语音到来的方向,校正除了会话对方之外的某人的呼叫语音的频率特性,基于通过多个麦克风转换的声音信号来估计该方向。然后,基于通过使用具有一个特性的麦克风记录的其他语音数据,助听器装置将其频率特性已经被频率特性调整处理单元校正的、除了会话对方之外的某人的呼叫语音与用于表示音素和音节特征的呼叫词标准模式作比较。通过这个比较,该助听器装置确定除了会话对方之外的某人的呼叫语音是否是呼叫词。然后,基于呼叫词确定部件的确定结果,助听器装置相对于除了会话对方的语音到来的方向之外的方向形成定向。另外,该助听器装置校正除了会话对方之外的某人的呼叫语音的频率特性,使得该频率特性可以与在准备声音标准模式时的麦克风的特性相同。
Description
技术领域
本发明涉及一种助听器装置,其能够基于来自多个麦克风的输入来检测呼叫或各种声音。
背景技术
助听器的用户已经提高了助听器的期望,每一个助听器具有“会话加强功能”,使得用户能够听到会话对方的加强的语音。作为用于在加强会话对方的语音时确定是否从会话对方发出语音的一种方法,专利文件1公开了一种用于根据发音时间的一致性,在与佩戴助听器的人的会话中检测语音的方法。需要助听器加强会话对方的语音,并且使得佩戴助听器的人能够响应于来环境的呼叫,并且识别从环境事件发出的声音。
在与诸如助听器的物体紧密接触地佩戴的装置中,出现下述现象:由于麦克风位置或相邻物形状的影响,输入语音的频率特性根据声音的到来方向(角度)而改变。例如,当助听器检测到呼叫时,助听器根据声音的到来方向(角度)来识别呼叫语音,该语音的输入在频率特性上不同。因为这个原因,要识别的声音的频率特性与在学习用于进行核对的音频标准模式(离线)时的语音数据的频率特性偏离,由此使得助听器的识别精度变差。
作为用于校正用于验证的音频标准模式的频率特性的方法,非专利文件1公开了倒频谱(cepstral)均值标准化CMS(倒频谱均值相减CMS)。倒频谱均值标准化CMS方法(以下称为“CMS方法”)是下述方法:通过输入语音的倒频谱的平均值来估计输入语音的频率特性的差别,并且将该差别应用到用于校正的输入语音。在CMS方法中,需要获得在完成发声后的输入语音的倒频谱平均值,并且禁止实时处理。
作为通过CMS方法实现实时处理的方法,非专利文件2已经提出了一种MAP-CMS方法,其中,通过MAP估计从下述部分估计输入语音的倒频谱平均值以标准化输入语音:输入语音的开始到输入语音的当前帧的倒频谱平均值;以及,在学***均值。
现有技术文件
专利文件
专利文件1:JP-A-2004-133403
非专利文件
非专利文件1:S.Furui,“Cepstral Analysis Technique for Automatic SpeakerVerification(用于自动演讲人验证的倒频谱分析技术)”,IEEE Trans.ASSP,vol.ASSP-29,No.2pp.254-272,1981
非专利文件2:Kosaka et al.,“Study on Instantaneous or IncrementalEnvironment Adaptation(对于瞬时或增加环境适应的研究)”,AcousticalSociety of Japan,discussion paper,3-6-25,pp.137-138,March in 1997
非专利文件3:Jens Blauert,Masayuki Morimoto,Toshiyuki Goto,“SpatialHearing(空间听力)”,Kajima Institute Publishing Co.,Ltd.
发明内容
本发明要解决的问题
然而,要求上述CMS方法获得在已经完成发声后的倒频谱的平均值,并且进行语音识别处理或声音检测处理。因此,不能将CMS方法应用到实时地进行助听处理的助听器。而且,上述的MAP-CMS方法能够进行与时间同步地进行语音识别处理或声音检测处理的实时处理。然而,MAP-CMS方法不在输入开始后的帧的语音数据中校正语音的处理,导致语音识别的精度变差。
本发明的目的是提供一种助听器装置,其可以根据来自多个麦克风的输入音频信号检测来自除了会话对方之外的人的呼叫或各种声音,而不使识别精度变差。
用于解决问题的手段
本发明提供了一种助听器装置,包括:多个麦克风,其被配置为将包括会话对方的语音、除了所述会话对方语音之外的呼叫语音和各种声音的声音转换为音频信号;声音到来方向估计部件,用于基于由相应的麦克风转换的所述音频信号,来估计除了会话对方语音之外的呼叫语音的到来方向;频率特性校正处理单元,其被配置为基于由所述相应的麦克风转换的音频信号和由所述声音到来方向估计部件估计的除了所述会话对方语音之外的呼叫语音的到来方向,来校正除了所述会话对方语音之外的呼叫语音的频率特性;音频标准模式存储单元,其被配置为存储用于基于由具有一个特性的麦克风采集的其他语音数据来表示音素和音节声音的特征的呼叫词标准模式;呼叫词确定部件,用于相对于所述呼叫词标准模式,检查除了其频率特性被所述频率特性校正处理单元校正的所述会话对方语音之外的呼叫语音,并且用于确定所述呼叫语音是否是呼叫词;除了会话对方方向之外的方向定向合成部件,用于基于所述呼叫词确定部件的所述确定结果,在除了所述会话对方的语音的到来方向之外的方向上形成定向;以及,语音输出部件,用于基于由所述除了会话对方方向之外的方向定向合成部件形成的所述定向,来输出除了所述会话对方语音之外的呼叫语音,其中,所述频率特性校正处理单元校正除了会话对方语音之外的呼叫语音的频率特性,以便提供与在建立在所述呼叫词确定部件中使用的所述音频标准模式时的所述麦克风的特性相同的特性。
所述助听器装置进一步包括:会话对方方向定向合成部件,用于基于所述呼叫词确定部件的所述确定结果,在所述会话对方的所述语音的到来方向上形成定向。所述呼叫词确定部件相对于所述呼叫词标准模式,检查其频率特性被所述频率特性校正处理单元校正的所述会话对方的语音数据,并且如果所述呼叫词确定部件确定所述语音数据是呼叫词,则所述会话对方方向定向合成部件在所述会话对方的所述语音的到来方向上形成定向,并且,所述除了会话对方方向之外的方向定向合成部件在除了所述会话对方的所述语音的到来方向之外的方向上形成定向,并且,所述语音输出部件除了由所述除了会话对方方向之外的方向定向合成部件形成的定向之外,进一步基于由所述会话对方方向定向合成部件形成的定向,输出所述会话对方的语音和除了所述会话对方语音之外的呼叫语音。
在所述助听器装置中,所述呼叫词确定部件相对于所述呼叫词标准模式,检查其频率特性被所述频率特性校正处理单元校正的所述会话对方的所述语音数据,并且如果所述呼叫词确定部件确定所述语音数据不是呼叫词,则所述会话对方方向定向合成部件在所述会话对方的所述语音的到来方向上形成定向,并且,所述除了会话对方方向之外的方向定向合成部件不在所述会话对方的所述语音的到来方向之外的方向上形成定向,并且所述语音输出部件基于由所述除了会话对方方向之外的方向定向合成部件形成的定向,来输出所述会话对方的语音和除了所述会话对方语音之外的呼叫语音。
本发明的优点
根据本发明的助听器装置,可以根据来自多个麦克风的输入音频信号检测来自除了会话对方的人的呼叫或各种声音,而不使识别精度变差。
附图说明
图1是图示根据本发明的第一实施例的助听器的***结构图。
图2是图示根据本发明的第一实施例的助听器的处理过程的流程图。
图3是图示用于在图2中的呼叫检测的子处理的流程图。
图4是当在头部右侧面佩戴麦克风时基于方向(角度)的频率特性的图。
图5是图示根据本发明的第一实施例的、用于相对于在建立音频标准模式时的麦克风的频率特性校正输入语音的校正因子的图。
图6是图示根据本发明第一实施例助听器的非定向声音采集状态的图。
图7是图示根据本发明的第一实施例的、在助听器的会话对方的方向上形成定向的状态的图。
图8是图示根据本发明的第一实施例的下述状态的图:在助听器的会话对方的方向上形成定向,并且也在除了会话对方的方向之外的方向上形成定向。
图9是图示根据本发明的第一实施例的、用于相对于在建立音频标准模式时的麦克风的频率特性校正输入语音的校正因子的图。
图10是图示根据本发明的第二实施例的助听器的***结构图。
图11是图示根据本发明的第二实施例的助听器的处理过程的流程图。
图12是图示用于在图11中的呼叫检测的子处理的流程图。
图13是图示根据本发明第三实施例的音频信号处理装置的***结构图。
图14是图示根据本发明第三实施例的音频信号处理装置的处理过程的流程图。
图15是图示用于在图14中的除了会话对方的语音之外的声音的检测的子处理的流程图。
图16是图示根据本发明第四实施例的音频信号处理装置的***结构图。
图17是图示根据本发明的第四实施例的音频信号处理装置的处理过程的流程图。
图18是图示用于在图17中的除了会话对方的语音之外的声音的检测的子处理的流程图。
附图标记的说明
101a、101b、201a、201b、211a、211b:麦克风
301a、301b、401a、401b、411a、411b:麦克风
102、202、212、302、402、412:会话对方方向搜索部件
103、203、213、303、403、413:会话对方方向定向合成部件
104、204、214、304、404、414:除了会话对方方向之外的方向定向合成部件
105、205、215、305:频率特性校正处理单元
106、206、216:呼叫方向搜索部件
306:除了会话对方语音之外的声音方向搜索部件
405、415:频率特性校正部件
406、416:声音到来方向搜索部件
107、207、217:呼叫词确定部件
307、407、417:除了会话对方语音之外的声音确定部件
108、208、218:定向/非定向确定部件
109、209、219、309、409、419:扬声器
110、221A、221B、310、421A、421B:校正因子存储单元
112、223A、223B:呼叫词字符串存储单元
具体实施方式
以下,将参考附图描述本发明的实施例。
(第一实施例)
图1是图示根据本发明的第一实施例的助听器装置100的结构的框图。如图1中所示,根据第一实施例的助听器装置100包括两个麦克风101a、101b、会话对方方向搜索部件102、会话对方方向定向合成部件103、除了会话对方方向之外的方向定向合成部件104、频率特性校正处理单元105、呼叫方向搜索部件106、呼叫词确定部件107、定向/非定向确定部件108、扬声器109、校正因子存储单元110、音频标准模式存储单元111和呼叫词字符串存储单元112。
<助听器装置100的结构>
麦克风101a和101b每一个采集诸如会话对方的语音的到来声音,并且将所采集的声音转换为音频信号。然后,该音频信号被输出到会话对方方向搜索部件102。
以下,为了说明,假定由麦克风的每一个采集的声音除了会话对方的语音之外进一步包括以下这种语音(以下称为“呼叫语音”):除了当前会话对方之外的人使用该语音,从与会话对方存在的方向不同的方向呼叫助听器装置100的佩带者。
当会话对方的语音未被麦克风101a和101b采集时,如图6中所示,在其右耳上佩戴助听器装置100的人A的***形成定向图案601,该定向图案601表示可以通过不分配定向的信号处理来听到所有方向上的语音的状态。
会话对方方向搜索部件102基于从麦克风101a和101b输入的音频信号检测会话对方的语音数据,并且搜索所采集的会话对方的语音的到来方向。然后,向定向/非定向确定部件108输出所搜索的会话对方的语音从其到来的方向。
呼叫方向搜索部件106根据由麦克风101a和101b采集的呼叫语音来搜索到来方向。是否存在呼叫语音的确定例如基于输入语音的功率是否超过给定阈值。
在该情况下,作为归因于头部和耳廓的张力的头部相关传递函数在人的方向感觉上担当重要的角色(例如,非专利文件3)。因此,在该实施例中,作为用于估计声音的到来方向(角度)的方法,将用于每个角度的头部相关传递函数的波谷频率和峰值频率的特征与在耳道的入口位置处观察到的输入语音的频率特性作比较,以估计声音的到来方向(角度)。
然后,呼叫方向搜索部件106向频率特性校正处理单元105输出关于基于搜索到的呼叫语音被估计为呼叫语音的到来方向的方向的信息。
校正因子存储单元110在其中存储在输入语音的频率的定向特性中的每个角度的校正因子。该校正因子考虑当在头部佩戴助听器时头部形状的影响。
呼叫词字符串存储单元112在其中存储作为字符串记录的呼叫词字符串。在呼叫词字符串存储单元112中存储的呼叫词字符串在预先装配助听器装置100时被存储在呼叫词字符串存储单元112中。
音频标准模式存储单元111在其中存储与字符(例如,50个日语假名字符或字母表)对应的音频标准模式。在音频标准模式存储单元111中存储的音频标准模式是预先基于借助于具有一个特性的麦克风而采集的大量语音数据而被建立为用于表示每个音素或音节声音的特征的模型的语音数据。
频率特性校正处理单元105校正从除了会话对方方向之外的方向定向合成部件104输出的呼叫语音数据,以便基于被估计为从呼叫方向搜索部件106输入的呼叫语音的到来方向的方向信息,使用在校正因子存储单元110中存储的校正因子中在匹配呼叫语音的方向的方向上的校正因子,在任何时间提供与在建立音频标准模式时的麦克风的特性相同的特性。然后,校正的呼叫语音数据被输出到呼叫词确定部件107。
呼叫词确定部件107根据在呼叫词字符串存储单元112中存储的“呼叫词字符串”和在音频标准模式存储单元111中存储的“音频标准模式”,建立呼叫词标准模式。然后,呼叫词确定部件107相对于从频率特性校正处理单元105输出的呼叫语音来检查所建立的呼叫词标准模式,以确定呼叫词标准模式是否是呼叫词。
当呼叫词确定部件107确定呼叫语音是呼叫词时,呼叫词确定部件107向定向/非定向确定部件108输出非定向信息。另一方面,当呼叫词确定部件107确定除了会话对方之外的人的呼叫语音不是呼叫词时,呼叫词确定部件107向定向/非定向确定部件108输出定向信息。
定向/非定向确定部件108基于从会话对方方向搜索部件102输入的会话对方的语音的到来方向和呼叫词确定部件107的确定结果,确定是否通过会话对方方向定向合成部件103和除了会话对方方向之外的方向定向合成部件104的每一个形成定向。
即,当除了会话对方的语音之外,进一步在语音数据中包括来自除了会话对方之外的人的呼叫语音时,定向/非定向确定部件108基于从会话对方方向搜索部件102输入的会话对方的语音的到来方向和从呼叫词确定部件107输出的非定向信息,向会话对方方向定向合成部件103输出在会话对方方向形成定向的确定结果。而且,定向/非定向确定部件108向除了会话对方方向之外的方向定向合成部件104输出在除了会话对方的方向之外的方向上形成定向的确定结果。
另一方面,当除了会话对方的语音之外,未在语音数据中包括来自除了会话对方之外的人的呼叫语音时,定向/非定向确定部件108基于从会话对方方向搜索部件102输入的会话对方的语音的到来方向和从呼叫词确定部件107输出的定向信息,输出在会话对方方向上形成定向的确定结果。而且,定向/非定向确定部件108向除了会话对方方向之外的方向定向合成部件104输出未形成定向的确定结果。
除了会话对方方向之外的方向定向合成部件104基于定向/非定向确定部件108的确定结果来形成定向。当定向/非定向确定部件108确定形成定向时,除了会话对方方向之外的方向定向合成部件104在除了会话对方的方向之外的方向上形成定向。例如,如图8中的定向图案802所示,也在用于呼叫检测的除了会话对方方向的方向上形成定向,由此可以从麦克风检测到从除了会话对方之外的方向到来的声音。另一方面,当定向/非定向确定部件108确定未形成定向时,除了会话对方方向之外的方向定向合成部件104在除了会话对方的方向之外的方向上不形成定向。
会话对方方向定向合成部件103基于定向/非定向确定部件108的确定结果不形成定向。即,当定向/非定向确定部件108确定形成定向时,会话对方方向定向合成部件103基于关于所采集的会话对方的语音数据和会话对方的语音到来的方向的信息,在会话对方的方向上形成定向。
例如,会话对方方向定向合成部件103将定向改变为由图7的定向图案701和在图8中图示的定向图案801指示的会话对方的方向。另一方面,当定向/非定向确定部件108确定不形成定向时,会话对方方向定向合成部件103不形成定向。然后,向扬声器109输出其中合成定向的会话对方的语音数据。
扬声器109是语音输出部件,并且输出通过由会话对方方向定向合成部件103形成的定向所加强的会话对方的声音。结果,助听器装置100的佩带者可以收听加强的会话对方的声音。
而且,当除了会话对方方向之外的方向定向合成部件104在用于呼叫检测的除了会话对方的方向之外的方向上形成定向时,扬声器109可以在输出会话对方的声音的同时,输出已经由麦克风101a和101b采集的从除了会话对方之外的方向到来的呼叫声音。结果,助听器装置100的佩带者可以除了加强的会话对方的声音之外,进一步收听从除了会话对方之外的方向到来的呼叫声音。
<助听器装置100的操作>
图2是图示根据第一实施例的助听器装置100的处理过程的流程图。图3是图示用于呼叫检测的子处理的流程图。下面参考图2和图3的流程图来说明助听器装置100的处理过程。首先,没有会话开始,并且在其右耳佩戴助听器装置100的人A可以通过由图6的定向图案601所示的不分配定向的信号处理来听到来自所有方向的语音。
在步骤ST201中,产生用于呼叫检测的子处理。
在步骤ST202中,会话对方方向搜索部件102搜索会话对方的语音的到来方向。
在步骤ST203中,会话对方方向搜索部件102基于在步骤ST202中的结果来检测是否存在会话对方。如果检测到会话对方的语音,则处理分支到步骤ST204,并且如果未检测到会话对方的语音,则处理分支到步骤ST202。
在步骤ST204中,会话对方方向搜索部件102将会话对方的语音到来方向检测为角度。
在步骤ST205中,向在图3中所示的用于呼叫检测的子处理的步骤ST301发送作为角度的、在步骤ST204中已经检测的会话对方的方向。
在步骤ST206中,接收关于已经从在图3中所示的用于呼叫检测的子处理发送的向非定向的改变的信息。
在步骤ST207中,当定向/非定向确定部件108确定在会话对方的方向上合成定向时,处理分支到步骤ST208。而且,在步骤ST207中,当定向/非定向确定部件108确定未形成定向时,即,当定向改变为非定向时,处理分支到步骤ST210。
在步骤ST208中,根据所采集的会话对方的语音数据和关于由图7的定向图案701所示的会话对方方向的方向信息,将定向合成为会话对方B的方向。
在步骤ST209中,从扬声器109输出其中如图7中所示合成定向的会话对方B的语音数据,并且,助听器装置100的佩带者A收听会话对方的加强的声音。
在步骤ST210中,如在图6中图示的定向图案601所示,定向被改变为非定向,并且处理返回到步骤ST201。
<用于呼叫检测的子处理>
随后,将描述在图3中所示的用于呼叫检测的子处理。
在步骤ST301中,接收已经在图2中所示的步骤ST205中发送的、用于指示会话对方的声音到来方向的角度。
在步骤ST302中,如果接收到用于指示会话对方的声音到来方向的角度,则处理分支到步骤ST303,并且如果未接收到用于指示会话对方的声音到来方向的角度,则处理分支到步骤ST302。
在步骤ST303,在会话对方方向上形成定向,以允许助听器装置100的佩带者A强调地收听由在图8中所示的定向图案801所示的会话对方B的语音。也在由在图8中所示的定向图案802指示的用于呼叫检测的除了会话对方方向之外的方向中形成定向。
在步骤ST304中,确定是否存在呼叫。如果确定存在呼叫,则处理分支到步骤ST305,并且如果确定没有呼叫,则处理分支到步骤ST304。在这个示例中,作为用于确定是否存在呼叫的一种可设想的方法,例如,确定输入声音的功率是否超过给定阈值。
在步骤ST305中,呼叫方向搜索部件106确定呼叫声音的方向。
在步骤ST306中,从关于呼叫语音的角度的信息调用用于校正作为呼叫词确定部件的输入的语音数据的频率特性的校正因子,并且根据需要来应用它。下面描述如何确定频率特性的校正因子。
在步骤ST307中,呼叫词确定部件107确定所校正的输入语音数据是否是呼叫词。
在步骤ST308中,如果在步骤ST307中确定输入语音数据是呼叫词,则处理分支到ST309,并且如果确定输入语音数据不是呼叫词,则处理分支到ST304。
在步骤ST309中,定向/非定向确定部件108向会话对方方向定向合成部件103和除了会话对方方向之外的方向定向合成部件104发送关于向非定向的改变的信息,并且处理返回到步骤ST302。
通过上述步骤ST210至步骤ST210和步骤ST301至步骤ST309,根据这个实施例的助听器装置100加强会话对方的语音,并且当被呼叫时将定向改变为非定向。因为那个原因,助听器的用户可以收听该呼叫语音,并且也可以与呼叫者进行会话。
<如何确定频率特性的校正因子>
随后,将描述在步骤ST306中用于调用频率特性的校正因子的方法的具体示例。例如,将参考图4和图5描述当佩带者A在他的头部右侧佩戴助听器装置100时的频率特性的校正因子。图4是当在他的头部右侧佩戴麦克风时依赖于方向(角度)的频率特性的图。图5是图示根据本发明的第一实施例的、用于相对于在建立音频标准模式时的麦克风的频率特性校正输入语音的校正因子的图。
如图4中所示,当佩带者A在他的头部右侧佩戴助听器装置100时,用于指示在相对于右面的90°角的声音到来的频率特性的曲线401大体是平坦的,而不依赖于低频侧的频率,并且在高频侧略微降低。另一方面,用于指示相对于左面的90°角的声音到来的频率特性的曲线402向越高频区域越多地降低。在该情况下,确定校正因子,使得由图4指示的声音的频率特性改变为由在图5中的虚线501表示的、在建立音频标准模式时的麦克风的频率特性。在呼叫词确定处理单元中使用在建立音频标准模式时的麦克风的频率特性。
在图4中所示的在相对于右面的90°角的声音到来的频率特性(曲线401)的情况下,不必校正低频部分,但是需要在高频部分改变由箭头指示的频率特性的校正。同样,在图4中所示的在相对于左面的90°角的声音到来的频率特性(曲线402)的情况下,校正因子在中频和高频中向更高的频率更大的增加,由此使得能够将输入语音校正为由在图5中的虚线501所示的在建立音频标准模式时的麦克风的频率特性。
如上所述,在根据这个实施例的助听器装置100中,输入语音的频率特性接近于使用校正因子在呼叫词确定处理单元中学习用于检查语音识别的音频标准模式(离线)时的语音数据的频率特性。结果,可以实现实时处理,而不使得语音识别精度变差。
校正因子可以是已经在一般的头部形状中测量的值。
为了更增强语音识别的精度,在装配助听器装置100时,如图9中所示,再现用于从声源901至908获取校正因子的声音(白噪声),该声源901至908围绕在他的右耳佩戴助听器装置100的人A的头部周围。然后,通过助听器装置100的麦克风来采集所再现的白噪声,并且,根据所采集的声音的特性和优选的、在建立音频标准模式时的麦克风的特性,来获取校正因子。
呼叫词不仅适用于当人呼叫时使用的词,而且适用于被再现以引起人的注意的通知铃声、在火车站台上的警告声、汽车、卡车或公共汽车的喇叭、与方向指示器联锁的可听见的警报和由家中的家用电器产生的用于通知进展状态的提醒声音。
(第二实施例)
在第一实施例中,在任何一只耳朵(右耳)上佩戴的类型的助听器被描述为一个示例。在第二实施例中,在双耳上佩戴的类型的助听器被描述为另一个示例。
图10是图示根据本发明的第二实施例的助听器装置200的结构的框图。如图10中所示,根据第二实施例的助听器装置200包括右耳佩戴助听器200A和左耳佩戴助听器200B。参见图10,下面描述相应的助听器的结构。
如图10中所示,构成第二实施例的助听器装置200的右耳佩戴助听器200A包括两个麦克风201a和201b、会话对方方向搜索部件202、会话对方方向定向合成部件203、除了会话对方方向之外的方向定向合成部件204、频率特性校正处理单元205、呼叫方向搜索部件206、呼叫词确定部件207、定向/非定向确定部件208、扬声器209、校正因子存储单元221A、呼叫词字符串存储单元223A和音频标准模式存储单元224A。
同样,构成第二实施例的助听器装置200的左耳佩戴助听器200B包括两个麦克风211a和211b、会话对方方向搜索部件212、会话对方方向定向合成部件213、除了会话对方方向之外的方向定向合成部件214、频率特性校正处理单元215、呼叫方向搜索部件216、呼叫词确定部件217、定向/非定向确定部件218、扬声器219、校正因子存储单元221B、呼叫词字符串存储单元223B和音频标准模式存储单元224B。
以下,将详细描述右耳佩戴助听器200A的结构。在左耳佩戴助听器200B中,与在右耳佩戴助听器200A中的那些相同名称的所有结构在操作上与右耳佩戴助听器200A的结构相同,因此将省略其详细描述。
<右耳佩戴助听器200A的结构>
麦克风201a和201b每一个采集诸如会话对方的语音的到来声音,并且将所采集的声音转换为音频信号。然后,该音频信号被输出到会话对方方向搜索部件202。
以下,为了说明,假定由麦克风的每一个采集的声音除了会话对方的语音之外,进一步包括下面这种语音(以下称为“呼叫语音”):除了当前会话对方之外的人使用该语音,从与会话对方存在的方向不同的方向呼叫助听器装置200的佩带者。也假定从助听器装置200的佩带者的右侧进行呼叫。
当会话对方的语音未被麦克风101a和101b采集时,假定像在第一实施例中那样形成在图6中所示的定向图案601。
会话对方方向搜索部件202基于从麦克风201a和201b输入的音频信号来检测会话对方的语音数据,并且搜索所采集的会话对方的语音的到来方向。然后,向定向/非定向确定部件208输出所搜索的会话对方的语音到来的方向。
呼叫方向搜索部件206根据由麦克风201a和201b采集的呼叫语音来搜索到来方向。是否存在呼叫语音的确定例如基于输入语音的功率是否超过给定阈值。
呼叫方向搜索部件206首先通过诸如蓝牙(日本商标注册号码4477936)的无线电通信手段向左耳佩戴助听器200B的呼叫方向搜索部件216发送右耳的最大声压。同样,呼叫方向搜索部件206通过诸如蓝牙(日本商标注册号码4477936)的无线电通信手段从左耳佩戴助听器200B的呼叫方向搜索部件216接收左耳的最大声压。
然后,呼叫方向搜索部件206将两耳的最大声压彼此作比较,并且估计在右侧和左侧的哪一侧发出了呼叫。例如,作为搜索呼叫方向的方法,如果确定在右侧发出呼叫,则呼叫方向搜索部件206通过下述方式来搜索呼叫方向:实现由于延迟的和阵列导致的定向波束,并且估计由于定向波束的扫描导致的声源方向。呼叫方向搜索部件206向频率特性校正处理单元205输出基于所搜索的呼叫语音被估计为呼叫语音到来的方向的方向信息。
校正因子存储单元221A在其中存储在输入语音的频率的定向特性中的每一个角度的校正因子。该校正因子考虑当在头部佩戴助听器时头部形状的影响。
呼叫词字符串存储单元223A在其中存储作为字符串记录的呼叫词字符串。在呼叫词字符串存储单元223A中存储的呼叫词字符串在装配助听器装置200时被预先存储在呼叫词字符串存储单元223A中。
音频标准模式存储单元224A在其中存储与字符(例如,50个日语假名字符或字母表)对应的音频标准模式。在音频标准模式存储单元224A中存储的音频标准模式是预先基于借助于具有一个特性的麦克风而采集的大量语音数据而被建立为用于表示每个音素或音节声音的特征的模型的语音数据。
频率特性校正处理单元205校正从除了会话对方方向之外的方向定向合成部件204输出的会话对方的语音数据,以便基于被估计为从呼叫方向搜索部件206输入的呼叫语音的到来方向的方向信息,使用在校正因子存储单元221A中存储的校正因子中在匹配呼叫语音的方向的方向上的校正因子,在任何时间提供与在建立音频标准模式时的麦克风的特性相同的特性。然后,校正的呼叫语音数据被输出到呼叫词确定部件207。
呼叫词确定部件207根据在呼叫词字符串存储单元223A中存储的“呼叫词字符串”和在音频标准模式存储单元224A中存储的“音频标准模式”来建立呼叫词标准模式。然后,呼叫词确定部件207相对于从频率特性校正处理单元205输出的呼叫语音的数据,检查所建立的呼叫词标准模式,以确定呼叫词标准模式是否是呼叫词。
当呼叫词确定部件207确定除了会话对方之外的人的呼叫语音是呼叫词时,呼叫词确定部件207向定向/非定向确定部件208输出非定向信息。另一方面,当呼叫词确定部件207确定除了会话对方之外的人的呼叫语音不是呼叫词时,呼叫词确定部件207向定向/非定向确定部件208输出定向信息。
定向/非定向确定部件208基于从会话对方方向搜索部件202输入的会话对方的语音的到来方向和呼叫词确定部件207的确定结果,确定是否通过会话对方方向定向合成部件203和除了会话对方方向之外的方向定向合成部件204的每一个形成定向。
即,当除了会话对方的语音之外,进一步在语音数据中包括来自除了会话对方之外的人的呼叫语音时,定向/非定向确定部件208基于从会话对方方向搜索部件202输入的会话对方的语音的到来方向和从呼叫词确定部件207输出的非定向信息,向会话对方方向定向合成部件203输出在会话对方方向上形成定向的确定结果。
而且,定向/非定向确定部件208向除了会话对方方向之外的方向定向合成部件204输出在除了会话对方的方向之外的方向上形成定向的确定结果。另一方面,当除了会话对方的语音之外,未在语音数据中包括来自除了会话对方之外的人的呼叫语音时,定向/非定向确定部件208基于从会话对方方向搜索部件202输入的会话对方的语音的到来方向和从呼叫词确定部件207输出的定向信息,输出在会话对方方向上形成定向的确定结果。
而且,定向/非定向确定部件208向除了会话对方方向之外的方向定向合成部件204输出未形成定向的确定结果。
除了会话对方方向之外的方向定向合成部件204基于定向/非定向确定部件208来形成定向,如下所述。当定向/非定向确定部件208确定形成定向时,除了会话对方方向之外的方向定向合成部件204在除了会话对方的方向之外的方向上形成定向。
例如,像在第一实施例中那样,如图8中的定向图案802所示,也在用于呼叫检测的除了会话对方之外的方向上形成定向,由此可以从麦克风检测到从除了会话对方的方向之外的方向到来的声音。另一方面,当定向/非定向确定部件208确定未形成定向时,除了会话对方方向之外的方向定向合成部件204在除了会话对方的方向之外的方向上不形成定向。
会话对方方向定向合成部件203基于定向/非定向确定部件208的确定结果不形成定向。即,当定向/非定向确定部件208确定形成定向时,会话对方方向定向合成部件203基于关于所采集的会话对方的语音数据和会话对方的语音到来的方向的信息,在会话对方的方向上合成定向。
例如,会话对方方向定向合成部件203将定向改变为由图7的定向图案701和在图8中图示的定向图案801指示的会话对方的方向。另一方面,当定向/非定向确定部件208确定不形成定向时,会话对方方向定向合成部件203不形成定向。
然后,向扬声器209输出其中合成定向的会话对方的语音数据。
扬声器209是语音输出部件,并且输出通过由会话对方方向定向合成部件203形成的定向加强的会话对方的声音。结果,助听器装置200的佩带者可以收听会话对方的加强的声音。
而且,当除了会话对方方向之外的方向定向合成部件204在用于呼叫检测的除了会话对方的方向之外的方向上形成定向时,扬声器209可以在输出会话对方的声音的同时,输出已经由麦克风201a和201b采集的从除了会话对方之外的方向到来的呼叫声音。结果,助听器装置200的佩带者可以除了加强的会话对方的声音之外,进一步收听从除了会话对方之外的方向到来的呼叫声音。
<助听器装置200的操作>
图11是图示根据第二实施例的助听器装置200的处理过程的流程图。图12是图示用于呼叫检测的子处理的流程图。下面参考图11和12的流程图来说明助听器装置200的处理过程。首先,没有会话开始,并且佩带者可以如图6的定向图案601所示听到来自所有方向的语音。
在步骤ST501中,产生用于呼叫检测的子处理。
在步骤ST502中,会话对方方向搜索部件202搜索会话对方的语音的到来方向。
在步骤ST503中,会话对方方向搜索部件202基于在步骤ST502中的结果来检测是否存在会话对方。如果检测到会话对方的语音,则处理分支到步骤ST504,并且如果未检测到会话对方的语音,则处理分支到步骤ST502。
在步骤ST504中,会话对方方向搜索部件202将会话对方的语音到来方向检测为角度。
在步骤ST505中,向在图12中所示的用于呼叫检测的子处理的步骤ST601发送作为角度的、在步骤ST504中已经检测的会话对方的方向。
在步骤ST506中,接收关于已经从在图12中所示的用于呼叫检测的子处理发送的向非定向的改变的信息。
在步骤ST507中,当定向/非定向确定部件208确定在会话对方的方向上合成定向时,处理分支到步骤ST508。而且,在步骤ST507中,当定向/非定向确定部件208确定未形成定向时,即,当定向改变为非定向时,处理分支到步骤ST510。
在步骤ST508中,根据所采集的会话对方的语音数据和关于由图7的定向图案701所示的会话对方方向的方向信息,将定向合成为会话对方B的方向。
在步骤ST509中,从扬声器109输出其中如图7中所示合成定向的会话对方B的语音数据,并且,助听器装置200的佩带者A收听会话对方的加强的声音。
在步骤ST510中,如在图6中图示的定向图案601所示,定向被改变为非定向,并且处理返回到步骤ST501。
<用于呼叫检测的子处理>
随后,将描述在图12中所示的用于呼叫检测的子处理。
在步骤ST601中,接收已经在图2中所示的步骤ST505中发送的、用于指示会话对方的声音的到来方向的角度。
在步骤ST602中,如果接收到用于指示会话对方的声音的到来方向的角度,则处理分支到步骤ST603,并且如果未接收到用于指示会话对方的声音的到来方向的角度,则处理分支到步骤ST602。
在步骤ST603,像在第一实施例中那样,在会话对方方向上形成定向,以允许助听器装置200的佩带者A强调地收听由在图8中所示的定向图案801所示的会话对方B的语音。也在由在图8中所示的定向图案802指示的用于呼叫检测的除了会话对方方向之外的方向中形成定向。
在步骤ST604中,右和左助听器向彼此发送最大声压,并且通过呼叫方向搜索部件206来确定从右和左助听器的哪个发出呼叫。
在步骤ST605中,基于在ST604中的确定结果,如果从右侧发出呼叫,则处理分支到步骤ST606,并且如果从左侧发出呼叫,则处理分支到步骤ST610。
在步骤ST606中,右耳佩戴助听器200A中的呼叫方向搜索部件206确定呼叫声音的方向。
在步骤ST607中,根据关于呼叫语音的角度的信息调用用于校正作为呼叫词确定部件207的输入的语音数据的频率特性的校正因子,并且根据需要来应用它。如何确定频率特性的校正因子与在第一实施例中相同,因此将省略其详细描述。
在步骤ST608中,由右耳佩戴助听器200A中的呼叫词确定部件207确定所校正的输入语音数据是否是呼叫词。
在步骤ST609中,如果在步骤ST608中确定输入语音数据是呼叫词,则处理分支到ST614,并且如果确定输入语音数据不是呼叫词,则处理分支到ST604。
在步骤ST610中,由左耳佩戴助听器200B中的呼叫方向搜索部件216确定呼叫声音的方向。
在步骤ST611中,根据关于呼叫语音的角度的信息调用用于校正作为呼叫词确定部件207的输入的语音数据的频率特性的校正因子,并且根据需要来应用它。如何确定频率特性的校正因子与在第一实施例中相同,因此将省略其详细描述。
在步骤ST612中,由左耳佩戴助听器200B中的呼叫词确定部件217确定所校正的输入语音数据是否是呼叫词。
在步骤ST613中,如果在步骤ST612中确定输入语音数据是呼叫词,则处理分支到ST614,并且如果确定输入语音数据不是呼叫词,则处理分支到ST604。
在步骤ST614中,如果从右侧发出呼叫,则右耳佩戴助听器200A的定向/非定向确定部件208向在右耳佩戴助听器200A中的会话对方方向定向合成部件203和除了会话对方方向之外的方向定向合成部件204发送关于向非定向的改变的信息,并且处理返回到步骤ST602。
同样,如果从左侧发出呼叫,则左耳佩戴助听器200B的定向/非定向确定部件218向在左耳佩戴助听器200B中的会话对方方向定向合成部件213和除了会话对方方向之外的方向定向合成部件214发送关于向非定向的改变的信息,并且处理返回到步骤ST602。
通过上述步骤ST501至步骤ST510和步骤ST601至步骤ST614,根据这个实施例的助听器装置200加强会话对方的语音,并且当被呼叫时将定向改变为非定向。因为这个原因,助听器的用户可以收听该呼叫语音,并且也可以与呼叫者进行会话。
(第三实施例)
图13是图示根据本发明的第三实施例的音频信号处理装置300的结构的框图。如图13中所示,根据第三实施例的音频信号处理装置300包括两个麦克风301a、301b、会话对方方向搜索部件302、会话对方方向定向合成部件303、除了会话对方方向之外的方向定向合成部件304、频率特性校正处理单元305、除了会话对方语音之外的声音方向搜索部件306、除了会话对方语音之外的声音确定部件307、定向/非定向确定部件308、扬声器309、校正因子存储单元310和音频标准模式存储单元311。
<音频信号处理装置300的结构>
麦克风301a和301b每一个采集诸如会话对方的语音的到来声音,并且将所采集的声音转换为音频信号。然后,该音频信号被输出到会话对方方向搜索部件302。
以下,为了说明,假定由麦克风的每一个采集的声音除了会话对方的语音之外,进一步包括除了会话对方语音之外的以下的声音或语音(以下称为“除了会话对方语音之外的声音”):除了当前会话对方之外的人,从与会话对方存在的方向不同的方向,在音频信号处理装置300的佩带者处获得的的声音或语音。
当会话对方的语音未被麦克风301a和301b采集时,如图6中所示,在其右耳上佩戴音频信号处理装置300的人A的***形成(建立)定向图案601,该定向图案601用于指示其中可以通过不分配定向的信号处理来听到在所有方向上的语音的状态。
会话对方方向搜索部件302基于从麦克风301a和301b输入的音频信号来检测会话对方的语音数据,并且搜索所采集的会话对方的语音的到来方向。然后,向定向/非定向确定部件308输出所搜索的会话对方的语音到来的方向。
除了会话对方语音之外的声音方向搜索部件306根据由麦克风301a和301b采集的除了会话对方语音之外的声音来搜索到来方向。是否存在除了会话对方语音之外的声音的确定例如基于输入语音的功率是否超过给定阈值。
在该情况下,作为归因于头部和耳廓的张力的头部相关传递函数在人的方向感觉上担当重要的角色(例如,非专利文件3)。因此,在此实施例中,作为用于估计声音的到来方向(角度)的方法,将用于每一个角度的头部相关传递函数的波谷频率和峰值频率的特征与在耳道的入口位置处观测到的输入语音的频率特性作比较,以估计声音的到来方向(角度)。然后,除了会话对方语音之外的声音方向搜索部件306向频率特性校正处理单元305输出关于基于搜索的除了会话对方语音之外的声音呼叫语音被估计为除了会话对方语音之外的声音的到来方向的方向信息。
校正因子存储单元310在其中存储在输入语音的频率的定向特性中的每一个角度的校正因子。该校正因子考虑当在头部佩戴助听器时头部形状的影响。在音频标准模式存储单元311中存储的音频标准模式是预先从已经使用具有一个特性的麦克风采集的、除了会话对方语音之外的声音的大量数据建立的模式。
频率特性校正处理单元305校正已经从除了会话对方方向之外的方向定向合成部件304输出的除了会话对方语音之外的声音数据,以便基于被估计为从除了会话对方语音之外的声音方向搜索部件306已经输入的、除了会话对方语音之外的声音的到来方向的方向(角度)信息,使用在校正因子存储单元310中存储的校正因子中在匹配除了会话对方语音之外的声音的方向的方向(角度)上的校正因子,在任何时间提供与在建立音频标准模式时的麦克风的特性相同的特性。然后,校正的除了会话对方语音之外的声音数据被输出到除了会话对方语音之外的声音确定部件307。
除了会话对方语音之外的声音确定部件307相对于从频率特性校正处理单元305已经输出的除了会话对方语音之外的声音,检查在音频标准模式存储单元311中存储的音频标准模式,以确定音频标准模式是否是除了会话对方语音之外的声音。
当除了会话对方语音之外的声音确定部件307确定音频标准模式是除了会话对方语音之外的声音时,除了会话对方语音之外的声音确定部件307向定向/非定向确定部件308输出用于指示除了会话对方语音之外的声音的标记。另一方面,当除了会话对方语音之外的声音确定部件307确定音频标准模式不是除了会话对方语音之外的声音时,除了会话对方语音之外的声音确定部件307不向定向/非定向确定部件308输出用于指示除了会话对方语音之外的声音的标记。
定向/非定向确定部件308基于从会话对方方向搜索部件302输入的会话对方的语音的到来方向和除了会话对方语音之外的声音确定部件307的确定结果,确定是否通过会话对方方向定向合成部件303和除了会话对方方向之外的方向定向合成部件304的每一个形成定向。
即,当除了会话对方的语音之外,进一步在语音数据中包括来自除了会话对方之外的人的除了会话对方语音之外的声音时,如果输出已经从会话对方方向搜索部件302输入的会话对方的语音到来的方向(角度),并且从除了会话对方语音之外的声音确定部件307输出用于指示除了会话对方语音之外的声音的标记,则定向/非定向确定部件308向会话对方方向定向合成部件303输出在会话对方方向上形成定向的确定结果。而且,定向/非定向确定部件308向除了会话对方方向之外的方向定向合成部件304输出在除了会话对方的方向之外的方向上形成定向的确定结果。
另一方面,当未在语音数据中包括除了会话对方语音之外的声音,并且未从除了会话对方语音之外的声音确定部件307输出用于指示除了会话对方语音之外的声音的标记时,定向/非定向确定部件308向会话对方方向定向合成部件303输出在会话对方方向上形成定向的确定结果。而且,定向/非定向确定部件308基于已经从会话对方方向搜索部件302输入的会话对方的语音到来的方向(角度)、和从除了会话对方语音之外的声音确定部件307输出的定向信息,向其输出在除了会话对方的方向之外的方向上形成定向的确定结果。而且,定向/非定向确定部件308向除了会话对方方向之外的方向定向合成部件304输出未形成定向的确定结果。
除了会话对方方向之外的方向定向合成部件304基于定向/非定向确定部件308的确定结果来进行用于形成定向的信号处理。在从定向/非定向确定部件308接收到形成定向的确定结果时,除了会话对方方向之外的方向定向合成部件304在除了会话对方的方向之外的方向上形成定向。例如,如图8中所示的定向图案802所示,除了会话对方方向之外的方向定向合成部件304在用于除了会话对方语音之外的声音的检测的、除了会话对方方向之外的方向上形成定向,由此使得能够从麦克风检测到从除了会话对方方向之外的方向到来的声音。另一方面,在从定向/非定向确定部件308接收到未形成定向的确定结果时,除了会话对方方向之外的方向定向合成部件304在除了会话对方的方向之外的方向上不进行用于形成定向的信号处理。
会话对方方向定向合成部件303基于定向/非定向确定部件308的确定结果来进行用于形成定向的信号处理。即,当定向/非定向确定部件308确定形成定向时,会话对方方向定向合成部件303基于所采集的会话对方的语音数据和关于会话对方的语音到来的方向的信息,进行用于在会话对方的方向上形成定向的信号处理。
例如,会话对方方向定向合成部件303将定向改变为由图7的定向图案701和在图8中图示的定向图案801指示的会话对方的方向。另一方面,当定向/非定向确定部件308确定不形成定向时,会话对方方向定向合成部件303不进行用于形成定向的信号处理。然后,向扬声器309输出其中合成定向的会话对方的语音数据。
扬声器309是语音输出部件,并且输出通过由会话对方方向定向合成部件303形成的定向加强的会话对方的声音。结果,音频信号处理装置300的佩带者可以收听会话对方的加强的声音。
而且,当除了会话对方方向之外的方向定向合成部件304也在用于呼叫检测的除了会话对方的方向之外的方向上形成定向时,扬声器309可以在输出会话对方的声音的同时,输出已经由麦克风301a和301b采集的从除了会话对方之外的方向到来的、除了会话对方语音之外的声音。结果,音频信号处理装置300的佩带者也可以除了加强的会话对方的声音之外,进一步收听从除了会话对方的方向之外的方向到来的、除了会话对方语音之外的声音。
<音频信号处理装置300的操作>
图14是图示根据第三实施例的音频信号处理装置300的处理过程的流程图。图15是图示用于除了会话对方语音之外的声音的检测的子处理的流程图。下面参考图14和图15的流程图来说明音频信号处理装置300的处理过程。首先,没有会话开始,并且在其右耳佩戴音频信号处理装置300的人A可以通过由图6的定向图案601所示的不分配定向的信号处理听到来自所有方向的语音。在第一实施例的情况下描述了在图6中所示的声音采集状态。然而,其也可以被应用到这个实施例的情况。
在步骤ST401中,产生用于检测除了会话对方语音之外的声音的子处理。在步骤ST402中,会话对方方向搜索部件302搜索会话对方的语音的到来方向。
在步骤ST403中,会话对方方向搜索部件302基于在步骤ST402中的结果来检测是否存在会话对方。如果检测到会话对方的语音,则处理分支到步骤ST404,并且如果未检测到会话对方的语音,则处理分支到步骤ST402。
在步骤ST404中,会话对方方向搜索部件302将会话对方的语音到来方向检测为角度。
在步骤ST405中,向在图15中所示的用于检测除了会话对方语音之外的声音的子处理的步骤ST701发送作为角度的、在步骤ST404中已经检测的会话对方的方向。
在步骤ST406中,接收关于已经从在图15中所示的用于检测除了会话对方之外的声音的检测的子处理发送的向非定向的改变的信息。
在步骤ST407中,当定向/非定向确定部件308确定在会话对方的方向上合成定向时,处理分支到步骤ST408。而且,在步骤ST407中,当定向/非定向确定部件308确定未形成定向时,即,当定向改变为非定向时,处理分支到步骤ST410。
在步骤ST408中,根据所采集的会话对方的语音数据和关于由图7的定向图案701所示的会话对方方向的方向信息,将定向合成为会话对方B的方向。
在步骤ST409中,从扬声器309输出其中如图7中所示合成定向的会话对方B的语音数据,并且,音频信号处理装置300的佩带者A收听加强的会话对方的声音。在第一实施例的情况下描述了在图7中所示的定向,但是该定向可以同样被应用到这个实施例的情况。
在步骤ST410中,如在图6中图示的定向图案601所示,定向被改变为非定向,并且处理返回到步骤ST401。
<用于检测除了会话对方语音之外的声音的子处理>
随后,下面描述在图15中所示的用于检测除了会话对方之外的声音的子处理。在步骤ST701中,接收已经在图14中所示的步骤ST405中发送的、用于指示会话对方的声音的到来方向的角度。
在步骤ST702中,如果接收到用于指示会话对方的声音的到来方向的角度,则处理分支到步骤ST703,并且如果未接收到用于指示会话对方的声音的到来方向的角度,则处理分支到步骤ST702。
在步骤ST703,在会话对方方向上形成定向,以允许音频信号处理装置300的佩带者A强调地收听由在图8中所示的定向图案801所示的会话对方B的语音。也在由图8中所示的定向图案802指示的用于检测除了会话对方语音之外的声音的、除了会话对方方向之外的方向中形成定向。在第一实施例中的情况下描述了在图8中图示的定向,并且该定向可以同样被应用到这个实施例的情况。
在步骤ST704中,确定是否存在除了会话对方语音之外的声音。如果确定存在除了会话对方语音之外的声音,则处理分支到步骤ST705,并且如果确定没有除了会话对方语音之外的声音,则处理分支到步骤ST704。在这个示例中,作为用于确定是否存在除了会话对方语音之外的声音的一种可设想的方法,例如,确定输入声音的功率是否超过给定阈值。
在步骤ST705中,除了会话对方语音之外的声音方向搜索部件306确定除了会话对方语音之外的声音的方向。
在步骤ST706中,根据关于除了会话对方语音之外的声音的角度的信息,调用用于校正作为除了会话对方语音之外的声音确定部件的输入的语音数据的频率特性的校正因子,并且根据需要来应用它。下面描述如何确定频率特性的校正因子。
在步骤ST707中,除了会话对方语音之外的声音确定部件307确定所校正的输入语音数据是否是除了会话对方语音之外的声音。
在步骤ST708中,如果在步骤ST707中确定输入语音数据是除了会话对方语音之外的声音,则处理分支到ST709,并且如果确定输入语音数据不是除了会话对方语音之外的声音,则处理分支到ST704。
在步骤ST709中,定向/非定向确定部件308向会话对方方向定向合成部件303和除了会话对方方向之外的方向定向合成部件304发送关于向非定向的改变的信息,并且处理返回到步骤ST702。
通过上述步骤ST401至步骤ST410和步骤ST701至步骤ST709,根据这个实施例的音频信号处理装置300加强会话对方的语音,并且当检测到除了会话对方语音之外的声音时,将定向改变为非定向。因为这个原因,助听器的用户可以收听除了会话对方语音之外的声音,并且也可以与发出除了会话对方语音之外的声音的人进行会话。
<如何确定频率特性的校正因子>
随后,将描述在步骤ST706中用于调用频率特性的校正因子的方法的具体示例。例如,将参考图4和图5描述当佩带者A在他的头部右侧佩戴音频信号处理装置300时的频率特性的校正因子。图4是当在他的头部右侧佩戴麦克风时依赖于方向(角度)的频率特性的图。图5是图示根据本发明的第一实施例的、用于将输入语音校正校正为在建立音频标准模式时的麦克风的频率特性的校正因子的图。在第一实施例的情况中描述了图4中所示的频率特性和图5中所示的校正因子,但是它们也同样适用于这个实施例的情况。
如图4中所示,当佩带者A在他的头部右侧佩戴音频信号处理装置300时,用于指示在相对于右面90°角的声音到来的频率特性的曲线401大体是平坦的,而不依赖于在低频侧的频率,并且在高频侧略微降低。另一方面,用于指示相对于左面90°角的声音到来的频率特性的曲线402向越高频区域越多地降低。在该情况下,确定校正因子,使得由图4指示的声音的频率特性改变为由图5中的虚线501表示的、在建立音频标准模式时的麦克风的频率特性。在除了会话对方语音之外的声音确定处理单元中使用在建立音频标准模式时的麦克风的频率特性。
在图4中所示的在相对于右面的90°角的声音到来的频率特性(曲线401)的情况下,不必校正低频部分,但是需要在高频部分改变由箭头指示的频率特性的校正。同样,在图4中所示的在相对于左面的90°角的声音到来的频率特性(曲线402)的情况下,校正因子在中频和高频中向更高的频率就更大的增加,由此使得能够将输入语音校正为由图5中的虚线501所示的、在建立音频标准模式时的麦克风的频率特性。
如上所述,在根据这个实施例的音频信号处理装置300中,输入语音的频率特性接近于使用校正因子在除了会话对方语音之外的声音确定部件307中学习用于检查语音识别的音频标准模式(离线)时的语音数据的频率特性。结果,可以实现实时处理,而不使语音识别精度变差。
校正因子可以是已经在一般的头部形状中测量的值。
为了更增强语音识别的精度,在装配音频信号处理装置300时,如图9中所示,再现用于从声源901至908获取校正因子的声音(白噪声),该声源901至908围绕在他的右耳佩戴音频信号处理装置300的人A的头部周围。然后,通过音频信号处理装置300的麦克风来采集所再现的白噪声,并且,根据所采集的声音的特性和优选的、在建立音频标准模式时的麦克风的特性,来获取校正因子。在第一实施例的情况下描述了在图9中图示的校正因子,但是该校正因子同样可以被应用到这个实施例的情况。
呼叫词不仅被应用到当人呼叫时使用的词,而且被应用到被再现以引起人的注意的通知铃声、在火车站台上警告声、汽车、卡车或公共汽车的喇叭、与方向指示器联锁的可听见的警报和由家中的家用电器产生的用于通知进展状态的提醒声音。
(第四实施例)
在第三实施例中,作为一个实施例描述了在任何一只耳朵(右耳)上佩戴的类型的音频信号处理装置。在第四实施例中,作为另一个示例描述了在双耳上佩戴的类型的音频信号处理装置。
图16是图示根据本发明的第四实施例的音频信号处理装置400的结构的框图。如图16中所示,根据第四实施例的音频信号处理装置400包括右耳佩戴音频信号处理装置400A和左耳佩戴音频信号处理装置400B。参见图16,下面描述相应的音频信号处理装置的结构。
如图16中所示,构成第四实施例的音频信号处理装置400的右耳佩戴音频信号处理装置400A包括两个麦克风401a和401b、会话对方方向搜索部件402、会话对方方向定向合成部件403、除了会话对方方向之外的方向定向合成部件404、频率特性校正部件405、声音到来方向搜索部件406、除了会话对方语音之外的声音确定部件407、定向/非定向确定部件408、扬声器409、校正因子存储单元421A和音频标准模式存储单元424A。
同样,构成第四实施例的音频信号处理装置400的左耳佩戴音频信号处理装置400B包括两个麦克风411B和411b、会话对方方向搜索部件412、会话对方方向定向合成部件413、除了会话对方方向之外的方向定向合成部件414、频率特性校正部件415、声音到来方向搜索部件416、除了会话对方语音之外的声音确定部件417、定向/非定向确定部件418、扬声器419、校正因子存储单元421B和音频标准模式存储单元424B。
以下,将详细描述右耳佩戴音频信号处理装置400A的结构。在左耳佩戴音频信号处理装置400B中,与在右耳佩戴音频信号处理装置400A中的那些相同名称的所有结构在操作上与右耳佩戴音频信号处理装置400A的结构相同,因此将省略其详细描述。
<右耳佩戴音频信号处理装置400A的结构>
麦克风401a和401b每一个采集诸如会话对方的语音的到来声音,并且将所采集的声音转换为音频信号。然后,该音频信号被输出到会话对方方向搜索部件402。
以下,为了说明,假定由麦克风的每一个采集的声音除了会话对方的语音之外进一步包括以下的语音(以下称为“除了会话对方语音之外的声音”):除了当前会话对方之外的人使用该语音,从与会话对方存在的方向不同的方向呼叫音频信号处理装置400的佩带者。也假定从音频信号处理装置400的佩带者的右侧发出除了会话对方语音之外的声音。
当会话对方的语音未被麦克风401a和401b采集时,假定像在第三实施例中那样形成(建立)在图6中所示的定向图案601。在第一实施例的情况下描述了在图6中图示的声音采集状态,但是该状态也同样可以被应用到这个实施例的情况。
会话对方方向搜索部件402基于从麦克风401a和401b输入的音频信号来检测会话对方的语音数据,并且搜索所采集的会话对方的语音的到来方向。然后,向定向/非定向确定部件408输出所搜索的会话对方的语音到来的方向。
声音到来方向搜索部件406根据由麦克风401a和401b采集的除了会话对方语音之外的声音来搜索到来方向。是否存在除了会话对方语音之外的声音的确定例如基于输入语音的功率是否超过给定阈值。
声音到来方向搜索部件406首先通过诸如蓝牙(日本商标注册号4477936)的无线电通信手段向左耳佩戴音频信号处理装置400B的声音到来方向搜索部件416发送右耳的最大声压。同样,声音到来方向搜索部件406通过诸如蓝牙(日本商标注册号4477936)的无线电通信手段从左耳佩戴音频信号处理装置400B的声音到来方向搜索部件416接收左耳的最大声压。
然后,声音到来方向搜索部件406将两耳的最大声压彼此作比较,并且估计除了会话对方语音之外的声音在右侧和左侧的哪一侧被发出。例如,作为搜索除了会话对方语音之外的声音的方向的方法,如果确定在右侧发出除了会话对方语音之外的声音,则声音到来方向搜索部件406通过下述方式来搜索除了会话对方语音之外的声音的方向:实现由于延迟的和阵列导致的定向波束,并且估计由于定向波束的扫描导致的声源方向。声音到来方向搜索部件406向频率特性校正部件405输出基于所搜索的除了会话对方语音之外的声音、被估计为除了会话对方语音之外的声音到来的方向的方向信息。
校正因子存储单元421A在其中存储在输入语音的频率的定向特性中的每一个角度的校正因子。该校正因子考虑当在头部佩戴音频信号处理装置时头部形状的影响。
在音频标准模式存储单元424A中存储的音频标准模式是预先根据已经使用具有一个特性的麦克风而采集的、除了会话对方语音之外的声音的大量数据而建立的模式。
频率特性校正部件405校正从除了会话对方方向之外的方向定向合成部件404已经输出的、除了会话对方语音之外的声音的数据,以便基于被估计为从声音到来方向搜索部件406输入的除了会话对方语音之外的声音的到来方向的方向(角度)信息,使用在校正因子存储单元421A中存储的校正因子中在匹配呼叫语音的方向的方向上的校正因子,在任何时间提供与在建立音频标准模式时的麦克风的特性相同的特性。然后,校正的除了会话对方语音之外的声音的数据被输出到除了会话对方语音之外的声音确定部件407。
除了会话对方语音之外的声音确定部件407针对从频率特性校正部件405已经输出的、除了会话对方语音之外的声音的数据,来检查在音频标准模式存储单元424A中存储的音频标准模式,以确定该音频标准模式是否是除了会话对方语音之外的声音。
当除了会话对方语音之外的声音确定部件407确定该音频标准模式是除了会话对方语音之外的声音时,除了会话对方语音之外的声音确定部件407向定向/非定向确定部件408和左耳佩戴音频信号处理装置400B的定向/非定向确定部件418输出用于指示除了会话对方语音之外的声音的标记。另一方面,当除了会话对方语音之外的声音确定部件407确定该音频标准模式不是除了会话对方语音之外的声音时,除了会话对方语音之外的声音确定部件407不向定向/非定向确定部件408和左耳佩戴音频信号处理装置400B的定向/非定向确定部件418输出用于指示除了会话对方语音之外的声音的标记。
定向/非定向确定部件408基于从会话对方方向搜索部件402输入的会话对方的语音的到来方向和除了会话对方语音之外的声音确定部件407的确定结果,确定是否通过会话对方方向定向合成部件403和除了会话对方方向之外的方向定向合成部件404的每一个形成定向。
即,当除了会话对方的语音之外,进一步在语音数据中包括来自除了会话对方之外的人的除了会话对方语音之外的声音时,如果输出已经从会话对方方向搜索部件402输入的会话对方的语音到来的方向(角度),并且从除了会话对方语音之外的声音确定部件407输出用于指示除了会话对方语音之外的声音的标记,则定向/非定向确定部件408向会话对方方向定向合成部件403输出在会话对方方向中形成定向的确定结果。而且,定向/非定向确定部件408向除了会话对方方向之外的方向定向合成部件404输出在除了会话对方的方向之外的方向上形成定向的确定结果。
另一方面,当未在语音数据中包括除了会话对方语音之外的声音,并且未从除了会话对方语音之外的声音确定部件407输出用于指示除了会话对方语音之外的声音的标记时,定向/非定向确定部件408基于已经从会话对方方向搜索部件402输入的会话对方的语音到来的方向(角度)、和从除了会话对方语音之外的声音确定部件407输出的定向信息,来输出在会话对方方向上形成定向的确定结果。而且,定向/非定向确定部件408向除了会话对方方向之外的方向定向合成部件404输出未形成定向的确定结果。
除了会话对方方向之外的方向定向合成部件404基于定向/非定向确定部件408的确定结果来进行用于形成定向的信号处理。在从定向/非定向确定部件408接收到形成定向的确定结果时,除了会话对方方向之外的方向定向合成部件404在除了会话对方的方向之外的方向上形成定向。例如,如图8中图示的定向图案802所示,也在用于检测除了会话对方语音之外的声音的、除了会话对方方向之外的方向上形成定向,由此可以从麦克风检测到从除了会话对方方向之外的方向到来的声音。另一方面,在从定向/非定向确定部件408接收到未形成定向的确定结果时,除了会话对方方向之外的方向定向合成部件404不进行用于在除了会话对方的方向之外的方向上形成定向的信号处理。在第一实施例的情况中描述了图8所示的定向,但是该定向也同样可以应用于本实施例的情况。
会话对方方向定向合成部件403基于定向/非定向确定部件408的确定结果来进行用于形成定向的信号处理。即,当定向/非定向确定部件408确定形成定向时,会话对方方向定向合成部件403基于所采集的会话对方的语音数据和会话对方的语音到来的方向的信息,来进行用于在会话对方的方向上形成定向的信号处理。
例如,像在第三实施例中那样,会话对方方向定向合成部件403将定向改变为由图7的定向图案701和在图8中图示的定向图案801指示的会话对方的方向。另一方面,当定向/非定向确定部件408确定不形成定向时,会话对方方向定向合成部件403不进行用于形成定向的信号处理。在第一实施例的情况下描述了在图7中的定向,但是该定向可以同样被应用到这个实施例的情况。
向扬声器409输出用定向合成的会话对方的语音数据。
扬声器409是语音输出部件,并且输出通过由会话对方方向定向合成部件403形成的定向加强的会话对方的声音。结果,音频信号处理装置400的佩带者可以收听会话对方的加强的声音。
而且,当除了会话对方方向之外的方向定向合成部件404在用于检测除了会话对方语音之外的声音的、除了会话对方方向之外的方向上形成定向时,扬声器409可以在输出会话对方的声音的同时,输出已经由麦克风401a和401b采集的、从除了会话对方方向之外的方向到来的除了会话对方语音之外的声音。结果,除了会话对方的加强的声音之外,音频信号处理装置400的佩带者也可以进一步收听从除了会话对方方向之外的方向到来的除了会话对方语音之外的声音。
<音频信号处理装置400的操作>
图17是图示根据第四实施例的音频信号处理装置400的处理过程的流程图。图18是图示用于检测除了会话对方语音之外的声音的子处理的流程图。下面参考图17和图18的流程图来说明音频信号处理装置400的处理过程。首先,没有会话开始,并且人可以如图6的定向图案601所示听到来自所有方向的语音。
在步骤ST801中,产生用于检测除了会话对方语音之外的声音的子处理。在步骤ST802中,会话对方方向搜索部件402搜索会话对方的语音的到来方向。
在步骤ST803中,会话对方方向搜索部件402基于在步骤ST802中的结果来检测是否存在会话对方。如果检测到会话对方的语音,则处理分支到步骤ST804,并且如果未检测到会话对方的语音,则处理分支到步骤ST802。
在步骤ST804中,会话对方方向搜索部件402作为角度检测会话对方的语音到来方向。
在步骤ST805中,向在图18中所示的用于检测除了会话对方语音之外的声音的子处理的步骤ST901发送作为角度的、在步骤ST804中已经检测的会话对方的方向。
在步骤ST806中,接收关于已经从图18中所示的用于检测除了会话对方之外的声音的子处理发送的向非定向的改变的信息。
在步骤ST807中,当定向/非定向确定部件408确定在会话对方的方向上合成定向时,处理分支到步骤ST808。而且,在步骤ST807中,当定向/非定向确定部件408确定未形成定向时,即,当定向改变为非定向时,处理分支到步骤ST810。
在步骤ST808中,像在第三实施例中那样,会话对方方向定向合成部件403根据所采集的会话对方的语音数据和关于由图7的定向图案701所示的会话对方方向的方向信息,将定向合成为会话对方B的方向。
在步骤ST809中,从扬声器409输出其中如图7中所示的合成定向的会话对方B的语音数据,并且,音频信号处理装置400的佩带者A收听会话对方的加强的声音。
在步骤ST810中,如在图6中图示的定向图案601所示,定向被改变为非定向,并且处理返回到步骤ST801。
<用于检测除了会话对方之外的声音的子处理>
随后,将描述在图18中所示的用于检测除了会话对方之外的声音的子处理。在步骤ST901中,接收已经在图17中所示的步骤ST805中发送的、用于指示会话对方的声音的到来方向的角度。
在步骤ST902中,如果接收到用于指示会话对方的声音的到来方向的角度,则处理分支到步骤ST903,并且如果未接收到用于指示会话对方的声音的到来方向的角度,则处理分支到步骤ST902。
在步骤ST903,像在第三实施例中那样,在会话对方方向上形成定向,以允许音频信号处理装置400的佩带者A强调地收听由在图8中所示的定向图案801所示的会话对方B的语音。也在步骤ST903中,也在由图8中所示的定向图案802指示的用于呼叫检测的除了会话对方方向之外的方向中形成定向。
在步骤ST904中,右侧和左侧音频信号处理装置向彼此发送最大声压,并且通过声音到来方向搜索部件406来确定从右侧和左侧的哪个发出除了会话对方语音之外的声音。
在步骤ST905中,基于在ST904中的确定结果,如果在右侧发出除了会话对方语音之外的声音,则处理分支到步骤ST906,并且如果在左侧发出除了会话对方语音之外的声音,则处理分支到步骤ST910。
在步骤ST906中,右耳佩戴音频信号处理装置400A中的声音到来方向搜索部件406确定除了会话对方语音之外的声音的方向。
在步骤ST907中,根据关于除了会话对方语音之外的声音的角度的信息,调用用于校正作为除了会话对方语音之外的声音确定部件的输入的语音数据的频率特性的校正因子,并且根据需要来应用它。如何确定频率特性的校正因子与在第三实施例中相同,因此将省略其详细描述。
在步骤ST908中,右耳佩戴的音频信号处理装置400A中的除了会话对方语音之外的声音确定部件407确定所校正的输入语音数据是否是除了会话对方语音之外的声音。
在步骤ST909中,如果在步骤ST908中确定校正的输入语音数据是除了会话对方语音之外的声音,则处理分支到ST914,并且如果确定校正的输入语音数据不是除了会话对方语音之外的声音,则处理分支到ST904。
在步骤ST910中,左耳佩戴的音频信号处理装置400B中的声音到来方向搜索部件416确定除了会话对方语音之外的声音的方向。
在步骤ST911中,根据关于除了会话对方语音之外的声音的角度的信息,调用用于校正作为除了会话对方语音之外的声音确定部件的输入的语音数据的频率特性的校正因子,并且根据需要来应用它。如何确定频率特性的校正因子与在第三实施例中相同,因此将省略其详细描述。
在步骤ST912中,左耳佩戴的音频信号处理装置400B中的除了会话对方语音之外的声音确定部件417确定所校正的输入语音数据是否是除了会话对方语音之外的声音。
在步骤ST913中,如果在步骤ST912中确定输入语音数据是除了会话对方语音之外的声音,则处理分支到ST914,并且如果确定输入语音数据不是除了会话对方语音之外的声音,则处理分支到ST904。
在步骤ST914中,如果在右侧发出除了会话对方语音之外的声音,则右耳佩戴的音频信号处理装置400A的定向/非定向确定部件408向右耳佩戴的音频信号处理装置400A的会话对方方向定向合成部件403和除了会话对方方向之外的方向定向合成部件404发送关于向非定向的改变的信息,并且处理返回到步骤ST902。
同样,如果在左侧发出除了会话对方语音之外的声音,则左耳佩戴的音频信号处理装置400B的定向/非定向确定部件418向左耳佩戴的音频信号处理装置400B的会话对方方向定向合成部件413和除了会话对方方向之外的方向定向合成部件414发送关于向非定向的改变的信息,并且处理返回到步骤ST902。
通过上述步骤ST801至步骤ST810和步骤ST901至步骤ST914,根据这个实施例的音频信号处理装置400加强会话对方的语音,并且当被呼叫时将定向改变为非定向。因为这个原因,音频信号处理装置的用户可以收听该呼叫语音,并且也可以与呼叫者进行会话。
而且,用于描述上面的相应实施例的相应功能块通常被实现为作为集成电路的LSI。那些部件可以每一个单独地被集成到一个芯片内,或它们的部分或全部可以被集成到一个芯片内。在这个示例中,相应的功能块由LSI形成。然而,LSI可以根据在集成度上的差别被称为IC、***LSI、超LSI或超大LSI。
而且,用于集成电路的技术不限于LSI,而是可以被专用电路或通用处理器实现。可以使用在LSI的制造后可编程的FPGA(现场可编程门阵列)或可以重新配置在LSI内的电路单元的连接或设置的可重构处理器。
而且,如果由于半导体技术或从其衍生的另一种技术的发展出现用于替换LSI的集成电路的技术,则不必说,可以通过使用那种技术来集成所述功能块。可以向其应用生物技术。
已经详细地参考特定实施例描述了本发明。然而,对于本领域内的普通技术人员显然,在不偏离本发明的精神和范围的情况下可以不同地改变或修改本发明。
本发明基于2009年6月17日提交的日本专利申请No.2009-144271,并且其容纳通过引用被包含在此。
工业上的适用性
根据本发明的助听器装置可以通过使用来自两个或更多麦克风的输入信号来检测来自诸如除了会话对方之外的人的呼叫的各种声音,并且有益于用作助听器。
Claims (4)
1.一种助听器装置,包括:
多个麦克风,其被配置为将会话对方的语音和由除了所述会话对方之外的声源产生的声音转换为音频信号;
声音到来方向估计单元,其被配置为基于由所述多个麦克风转换的多个音频信号,估计由所述除了所述会话对方之外的声源产生的所述声音的到来方向;
频率特性校正处理单元,其被配置为基于所述多个音频信号和由所述除了所述会话对方之外的声源产生的所述声音的所估计的到来方向,校正由所述除了所述会话对方之外的声源产生的所述声音的频率特性;
音频标准模式存储单元,其被配置为存储基于由具有预定特性的麦克风采集的语音数据的、由所述除了所述会话对方之外的声源产生的所述声音的标准模式;
除了会话对方语音之外的声音确定单元,其被配置为相对于所述标准模式,检查由具有所述校正的频率特性的所述除了所述会话对方之外的声源产生的所述声音,并且被配置为确定由所述除了所述会话对方之外的声源产生的所述声音是否是除了会话对方之外的声音;
除了会话对方方向之外的方向定向合成单元,其被配置为基于所述除了会话对方语音之外的声音确定单元的确定结果,在除了所述会话对方的所述语音的到来方向之外的方向上形成定向;以及
语音输出单元,被配置为基于由所述除了会话对方方向之外的方向定向合成单元形成的所述定向,输出由所述除了所述会话对方之外的声源产生的所述声音,
其中,所述频率特性校正处理单元校正由所述除了所述会话对方之外的声源产生的所述声音的频率特性,以便提供与在建立所述除了会话对方语音之外的声音确定单元中用于检查的所述标准模式时使用的所述麦克风的预定特性相同的特性。
2.一种助听器装置,包括:
多个麦克风,被配置为将会话对方的语音、和包括除了所述会话对方语音之外的呼叫语音的声音转换为音频信号;
声音到来方向估计单元,被配置为基于由所述多个麦克风转换的多个音频信号,估计除了会话对方语音之外的呼叫语音的到来方向;
频率特性校正处理单元,被配置为基于所述多个音频信号、和所述估计的除了所述会话对方语音之外的呼叫语音的到来方向,校正除了所述会话对方语音之外的呼叫语音的频率特性;
音频标准模式存储单元,被配置为存储用于基于由具有预定特性的麦克风采集的语音数据来表示音素和音节声音的特征的呼叫词标准模式;
呼叫词确定单元,被配置为相对于所述呼叫词标准模式,检查具有校正的频率特性的所述除了所述会话对方语音之外的呼叫语音,并且用于确定所述呼叫语音是否是呼叫词;
除了会话对方方向之外的方向定向合成单元,被配置为基于所述呼叫词确定单元的所述确定结果,在除了所述会话对方的语音的到来方向之外的方向上形成定向;以及
语音输出单元,被配置为基于由所述除了会话对方方向之外的方向定向合成单元形成的所述定向,输出除了所述会话对方语音之外的呼叫语音,
其中,所述频率特性校正处理单元校正除了会话对方语音之外的呼叫语音的频率特性,以便提供与在建立所述呼叫词确定单元中用于检查的所述呼叫词标准模式时使用的所述麦克风的预定特性相同的特性。
3.根据权利要求2所述的助听器装置,进一步包括:会话对方方向定向合成单元,被配置为基于所述呼叫词确定单元的所述确定结果,在所述会话对方的所述语音的到来方向上形成定向,
其中,所述呼叫词确定单元相对于所述呼叫词标准模式,检查其频率特性被所述频率特性校正处理单元校正的所述会话对方的语音数据,并且如果所述呼叫词确定单元确定所述语音数据是呼叫词,
则所述会话对方方向定向合成单元在所述会话对方的所述语音的到来方向上形成定向,并且,所述除了会话对方方向之外的方向定向合成单元在除了所述会话对方的所述语音的到来方向之外的方向上形成定向,并且,
所述语音输出单元除了由所述除了会话对方方向之外的方向定向合成单元形成的定向之外,进一步基于由所述会话对方方向定向合成单元形成的定向,输出所述会话对方的语音和除了所述会话对方语音之外的呼叫语音。
4.根据权利要求3所述的助听器装置,
其中,所述呼叫词确定单元相对于所述呼叫词标准模式,检查其频率特性被所述频率特性校正处理单元校正的所述会话对方的所述语音数据,并且如果所述呼叫词确定单元确定所述语音数据不是呼叫词,
则所述会话对方方向定向合成单元在所述会话对方的所述语音的到来方向上形成定向,并且,所述除了会话对方方向之外的方向定向合成单元不在所述会话对方的所述语音的到来方向之外的方向上形成定向,并且
所述语音输出单元基于由所述除了会话对方方向之外的方向定向合成单元形成的定向,输出所述会话对方的语音和除了所述会话对方语音之外的呼叫语音。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009-144271 | 2009-06-17 | ||
JP2009144271 | 2009-06-17 | ||
PCT/JP2010/004019 WO2010146857A1 (ja) | 2009-06-17 | 2010-06-16 | 補聴装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102428716A CN102428716A (zh) | 2012-04-25 |
CN102428716B true CN102428716B (zh) | 2014-07-30 |
Family
ID=43356188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080021517.9A Active CN102428716B (zh) | 2009-06-17 | 2010-06-16 | 助听器装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8654998B2 (zh) |
EP (1) | EP2445230A4 (zh) |
JP (1) | JP5409786B2 (zh) |
CN (1) | CN102428716B (zh) |
WO (1) | WO2010146857A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012205147A (ja) * | 2011-03-25 | 2012-10-22 | Kyocera Corp | 携帯電子機器および音声制御システム |
US8183997B1 (en) * | 2011-11-14 | 2012-05-22 | Google Inc. | Displaying sound indications on a wearable computing system |
US9679568B1 (en) | 2012-06-01 | 2017-06-13 | Google Inc. | Training a dialog system using user feedback |
US9123338B1 (en) | 2012-06-01 | 2015-09-01 | Google Inc. | Background audio identification for speech disambiguation |
US9264803B1 (en) | 2013-06-05 | 2016-02-16 | Google Inc. | Using sounds for determining a worn state of a wearable computing device |
US9426589B2 (en) | 2013-07-04 | 2016-08-23 | Gn Resound A/S | Determination of individual HRTFs |
JP6296646B2 (ja) * | 2014-01-22 | 2018-03-20 | 日東電工株式会社 | 聴覚補完システム、聴覚補完装置及び聴覚補完方法 |
DE102016225207A1 (de) * | 2016-12-15 | 2018-06-21 | Sivantos Pte. Ltd. | Verfahren zum Betrieb eines Hörgerätes |
DE102016225204B4 (de) | 2016-12-15 | 2021-10-21 | Sivantos Pte. Ltd. | Verfahren zum Betrieb eines Hörgerätes |
US10911877B2 (en) * | 2016-12-23 | 2021-02-02 | Gn Hearing A/S | Hearing device with adaptive binaural auditory steering and related method |
US11468884B2 (en) * | 2017-05-08 | 2022-10-11 | Sony Corporation | Method, apparatus and computer program for detecting voice uttered from a particular position |
DK3468228T3 (da) * | 2017-10-05 | 2021-10-18 | Gn Hearing As | Binauralt høresystem med lokalisering af lydkilder |
DK180177B1 (en) * | 2018-04-30 | 2020-07-16 | Widex As | Method of operating a hearing aid system and a hearing aid system |
US10791404B1 (en) * | 2018-08-13 | 2020-09-29 | Michael B. Lasky | Assisted hearing aid with synthetic substitution |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1426667A (zh) * | 2000-03-20 | 2003-06-25 | 奥迪亚科技股份责任有限公司 | 多麦克风***的定向处理 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK1017253T3 (da) * | 1998-12-30 | 2013-02-11 | Siemens Audiologische Technik | Blind kildeadskillelse til høreapparater |
US20010028718A1 (en) | 2000-02-17 | 2001-10-11 | Audia Technology, Inc. | Null adaptation in multi-microphone directional system |
US20010038699A1 (en) | 2000-03-20 | 2001-11-08 | Audia Technology, Inc. | Automatic directional processing control for multi-microphone system |
WO2000033634A2 (de) * | 2000-03-31 | 2000-06-15 | Phonak Ag | Verfahren zur vorgabe der übertragungscharakteristik einer mikrophonanordnung und mikrophonanordnung |
US6865275B1 (en) | 2000-03-31 | 2005-03-08 | Phonak Ag | Method to determine the transfer characteristic of a microphone system, and microphone system |
JP4410378B2 (ja) * | 2000-04-14 | 2010-02-03 | 三菱電機株式会社 | 音声認識方法および装置 |
JP3955265B2 (ja) | 2001-04-18 | 2007-08-08 | ヴェーデクス・アクティーセルスカプ | 指向性コントローラおよび補聴器を制御する方法 |
US7457426B2 (en) * | 2002-06-14 | 2008-11-25 | Phonak Ag | Method to operate a hearing device and arrangement with a hearing device |
JP3910898B2 (ja) * | 2002-09-17 | 2007-04-25 | 株式会社東芝 | 指向性設定装置、指向性設定方法及び指向性設定プログラム |
JP2004133403A (ja) * | 2002-09-20 | 2004-04-30 | Kobe Steel Ltd | 音声信号処理装置 |
DE10322912A1 (de) | 2003-05-21 | 2004-12-16 | Bayer Technology Services Gmbh | Verfahren zum Nachweis von Nukleinsäuren |
US7319769B2 (en) * | 2004-12-09 | 2008-01-15 | Phonak Ag | Method to adjust parameters of a transfer function of a hearing device as well as hearing device |
JP5249207B2 (ja) * | 2006-06-23 | 2013-07-31 | ジーエヌ リザウンド エー/エス | 適応性のある方向性信号処理を備えた補聴装置 |
JP5130298B2 (ja) * | 2006-10-10 | 2013-01-30 | シーメンス アウディオローギッシェ テヒニク ゲゼルシャフト ミット ベシュレンクテル ハフツング | 補聴器の動作方法、および補聴器 |
DE102006047982A1 (de) * | 2006-10-10 | 2008-04-24 | Siemens Audiologische Technik Gmbh | Verfahren zum Betreiben einer Hörfilfe, sowie Hörhilfe |
DE102007008739A1 (de) * | 2007-02-22 | 2008-08-28 | Siemens Audiologische Technik Gmbh | Hörvorrichtung mit Störsignaltrennung und entsprechendes Verfahren |
-
2010
- 2010-06-16 US US13/320,613 patent/US8654998B2/en active Active
- 2010-06-16 EP EP10789236.6A patent/EP2445230A4/en not_active Ceased
- 2010-06-16 WO PCT/JP2010/004019 patent/WO2010146857A1/ja active Application Filing
- 2010-06-16 CN CN201080021517.9A patent/CN102428716B/zh active Active
- 2010-06-16 JP JP2011519568A patent/JP5409786B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1426667A (zh) * | 2000-03-20 | 2003-06-25 | 奥迪亚科技股份责任有限公司 | 多麦克风***的定向处理 |
Non-Patent Citations (3)
Title |
---|
JP特开2004-133403A 2004.04.30 |
JP特表2003-516646A 2003.05.13 |
JP特表2004-527177A 2004.09.02 |
Also Published As
Publication number | Publication date |
---|---|
CN102428716A (zh) | 2012-04-25 |
JPWO2010146857A1 (ja) | 2012-11-29 |
EP2445230A4 (en) | 2016-05-18 |
WO2010146857A1 (ja) | 2010-12-23 |
US8654998B2 (en) | 2014-02-18 |
JP5409786B2 (ja) | 2014-02-05 |
EP2445230A1 (en) | 2012-04-25 |
US20120063620A1 (en) | 2012-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102428716B (zh) | 助听器装置 | |
US11315555B2 (en) | Terminal holder and far-field voice interaction system | |
US9864745B2 (en) | Universal language translator | |
CN104185868B (zh) | 话音认证和语音识别***及方法 | |
CN105940407B (zh) | 用于评估音频口令的强度的***和方法 | |
CN102117614B (zh) | 个性化文本语音合成和个性化语音特征提取 | |
KR101615421B1 (ko) | 유사한 사운드 환경 내의 모바일 디바이스들을 식별하는 방법 및 장치 | |
US20020082839A1 (en) | Voice communication concerning a local entity | |
CN107705785A (zh) | 智能音箱的声源定位方法、智能音箱及计算机可读介质 | |
US20080086311A1 (en) | Speech Recognition, and Related Systems | |
CN105719659A (zh) | 基于声纹识别的录音文件分离方法及装置 | |
CN104795066A (zh) | 语音识别方法和装置 | |
US9648154B1 (en) | Method and apparatus for improving call quality of hands-free call device, and hands-free call device | |
US11521621B2 (en) | Gathering user's speech samples | |
US20110046953A1 (en) | Method of recognizing speech | |
CN108235208A (zh) | 用于运行助听器设备的方法 | |
CN103281425A (zh) | 一种通过通话声音分析联系人的方法及装置 | |
CN110913073A (zh) | 一种语音处理方法及相关设备 | |
US20220180886A1 (en) | Methods for clear call under noisy conditions | |
CN109102816A (zh) | 编码控制方法、装置以及电子设备 | |
WO2019169686A1 (zh) | 语音翻译方法、装置和计算机设备 | |
CN107957860A (zh) | 可自动调整声音输出的方法及电子装置 | |
CN103889048B (zh) | 一种设备定位方法与装置 | |
CN105227741A (zh) | 一种智能设备进行音量提醒的方法以及装置 | |
Shirvanian et al. | Stethoscope: Crypto phones with transparent & robust fingerprint comparisons using inter text-speech transformations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD. Effective date: 20140716 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20140716 Address after: California, USA Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA Address before: Osaka Japan Patentee before: Matsushita Electric Industrial Co.,Ltd. |