CN1065370A - 有线广播清晰度*** - Google Patents
有线广播清晰度*** Download PDFInfo
- Publication number
- CN1065370A CN1065370A CN91111903A CN91111903A CN1065370A CN 1065370 A CN1065370 A CN 1065370A CN 91111903 A CN91111903 A CN 91111903A CN 91111903 A CN91111903 A CN 91111903A CN 1065370 A CN1065370 A CN 1065370A
- Authority
- CN
- China
- Prior art keywords
- signal
- formant
- frequency
- sound
- composition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000203 mixture Substances 0.000 claims abstract description 37
- 238000001228 spectrum Methods 0.000 claims abstract description 26
- 230000001965 increasing effect Effects 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 33
- 230000003321 amplification Effects 0.000 claims description 30
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 30
- 230000005236 sound signal Effects 0.000 claims description 24
- 210000001260 vocal cord Anatomy 0.000 claims description 15
- 230000002708 enhancing effect Effects 0.000 claims description 10
- 230000010363 phase shift Effects 0.000 claims description 4
- 230000006872 improvement Effects 0.000 claims description 3
- 230000001755 vocal effect Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 238000009434 installation Methods 0.000 claims 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims 2
- 230000011664 signaling Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 9
- 239000003990 capacitor Substances 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 210000004072 lung Anatomy 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 244000287680 Garcinia dulcis Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000003800 pharynx Anatomy 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000005182 tip of the tongue Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Interconnected Communication Systems, Intercoms, And Interphones (AREA)
Abstract
扬声器在高噪声环境下传播人音可通过放大声
音的共振峰而提高清晰度。该清晰度主要是从声音
共振峰的频率分布方式得到的,故有选择地增强共振
峰即可使高背景噪声中的语言只极小增加幅度即易
于听懂。共振峰由频谱分析器分别选择和放大。在
处理的共振峰和未处理的基带声成分再结合之前,有
选择地加权它们,以显著改善输出信号的清晰度。
Description
本发明涉及口语传播,更具体地说,涉及到在较高环境噪声下人的声音的清晰度。
有线广播***通常用于在大区域内发布通告或者与处于同一总位置的一大群人进行口头交流。听者所处的区域往往要遭受很大的背景噪声,这种噪声的程度常会达到使期望的从有线广播扬声器***发出的讲话信息的清晰度大大降低。有许多这种环境,那里由于较高的环境噪声掩盖或干扰了本应由听者听到的播讲者的声音,所以传递的信息被漏掉了或至少部分地漏掉了。这些环境包括机场,地铁,公共汽车及火车站,飞机,火车、***,着陆中的航空器直升飞机,码头设施及其它噪声场合。在想要了解有关飞机或火车到达及出发的公告的人中没有任何一个对难于从这种背景噪声的存在中分辨出有用的信号而满意。
为了在较高的背景噪声情况下将清晰度损失减至最小的尝试涉及到使用均衡器,限辐电路,或简单地增大有线广播的音量。而均衡器或限辐电路本身也可能增加背景噪声,因此不能解决所述问题。增加有线广播***的声音或音量的总体水平并不能显著改善清晰度,并经常会引起其它问题,如回授及听者的不适。
尽管这个问题长久以来广为人知,但并未得到解决。实际上,目前没有一种已知的方法能显著地改善被较高的环境噪声所掩盖的声源公共广播(例如有线广播之类)的清晰度。
因此,本发明的目的在于提供改善的不会被背景噪声降低的声音传播的清晰度。
按照一个最佳实施例关施本发明的原则,声音的主要频率部分被有选择地放大并结合以提供一个改善了清晰度的声音信号,有选择地增强浊音(Voiced Sounds)及清音(Unvoiced Sounds)的主要频率部分(共振峰频率Formants),同时对增强的频率部分加权及结合而产生一个结合的输出信号,从而提高了一种即存在很强的背景噪声也能显著增加清晰度的声音信号。
附图的主要说如下:
图1表示典型扬声器***或录音***中声音处理器连接的简化框图;
图2表未人的讲话中一定的典型共振峰曲线;
图3为一个用于增强语音清晰度的处理***的框图;
图4是用于增强语音清晰度的处理***的改进形式的框图;
图5为利用图4***的一个频谱分析器的框图;以及
图6说明用于图4处理***中的一个典型的压控放大器。
图1以一种非常简单的形式示出了一种具有声音清晰度处理的有线广播的基本组成部分。声源10,它可以是一个直播的麦克风或一台放音机,如磁带,唱盘或类似物,提供一个记录的声音通告,将一个声音电信号送到放大***12,该***在线路14上提供出输出信号,并直送入16处所指的扬声器***。扬声器***16通常包括多个沿着一定区域的不同位置放置的喇叭,通过它们即可听到有线广播的通告。如前所述,这种区域通常具有较强的背景噪声而显著地降低了有线广播***通告的清晰度。听者需极为注意和非常小心方可理解在机场,火车站或类似的强背景噪声环境中有线广播通告中的所有的话。即便如此,也难能确定通告的所有内容,并在有些情况下,通告几乎完全不能分辨出来。
按照本发明,在***放大器12与扬声器***16之间***一个声音处理***18,即使在较强的背景噪声下也会使扬声器***16发出的声音的清晰度被显著地提高,而无须显著提高扬声器16产生的声音的音量,图1中的***,可用一个记录装置替代如扬声器***16所表示的装置,可以用来增强记录的清晰度,即可以在噪杂的环境中播放,也可在噪声环境中初始记录讲话声音。下面更具体地描述该***。
声音处理器18是一种灵敏的自适应***,它采用了这种方式的优点即使人的话音能被各个人的耳和大脑所产生、听到及处理。简单地说,处理器***18识别声音中元音、辅音、摩擦者及***音的主率部分,对它们有选择地放大并加权,再结合提供一个显著增加清晰度的声音信号。
简要地描述一下话音的发出及理解的机制将有助于理解本发明工作原理。人的话音是通过在声道中产生声音,并使这些声音在不同频率下发生共振而形成。元音是由肺中排出的气流使人的声褶(通常称为声带)振动而产生的。声带振动产生的声音是由基本频率或基带及相继的较高频率的许多谐音部分或谐波组成,这些谐音的幅度随着频率以每八度音大约12分贝的速率增加而下降。基带或基本频率及其谐波经过声道,声道在咽喉、头及口腔内具有各种腔穴,从而形成若干单独的共振。声道具有多种特征方式的共振,在某种程度上,它的作用好比多个工作于基带或基本频率及其谐波上的共振器。因为声道的有选择地共振作用,声带的基本频率的几个部分的幅度并未随着增加频率而以平滑的曲线降低,而是在对应于声道的特定共振频率处显示出尖峰。这些峰或共振称为共振峰(formants)。
图2表示了浊音(如元音)的曲线,标绘了对应于多个谐波频率的幅度。在曲线的左侧,在最低频率处,是由声带振动产生的基本频率或基带,对于一个典型成年男声来说,这个基带频率在大约60和250HZ之间。基本频率的许多谐波由各个成分22a,22b,22c等指示。可以看出,整个声信号是由基带及分布在整个带上的许多各自的谐波组成的。在声信号中感兴趣的频带通常在60至大约7500HZ之间。图2说了各个谐波的情况,它们的幅度随着频率的上升而自然下降,其幅度的下降并不是以平缓的曲线,而显示出一定的峰,如26、28和30所示。这些峰代表声带的各个共振,并且因展示的目的只示出了三个,尽管在一般人的声道中可具有4个,5个或更多。这些峰,或声道共振,即为话音中的共振峰。对于成年男声的前四个(较低频率)共振峰分别接近于大约500,1500,2500和3500HZ。运动各种发音器官(包括颌,舌体,舌尖)可在很宽的范围内改变几个共振峰的频率。对于各个发音器官的形状或位置来说,不同的共振具有不同的灵敏度。讲话者可有选择地使这些器官运动,发出所需的元音的声音。相反,当听话时,每个元音通过其唯一的一组共振峰即可被识别。
上述关于浊音及图2中的共振峰的讨论同样适用于清音,因其也具有由声道的共振腔引起的共振峰,浊音是由声带在由肺产生的气流中振动引起的并构成人讲话中词语的元音。清音是在声带不振动的情况下由声带产生的。清音包括辅音、***音和摩擦音。这些音由舌牙齿及口的作用而产生,这些器官控制由肺释放的空气,但声带并不振动。这包括各种辅音的声音。清音包括讲话中涉及字母M、N、L、Z、G(如在frigid中),DG(如在judge中),等。尽管这些***音,摩擦音及辅助音不涉及声带振动,但具有特征频率,通常比声带振动的基本频率要高,其范围通常为2000至3000HZ。然而,不管在声道内产生的声音是因声带振动而产生(浊音),或是声带不振动而产生(辅音、***音、摩擦音),声道共振即产生共振峰,即在产生的基本频率的各不同谐波内的共振峰。
已经发现在人的话音中的这些共振峰对听者听到的语言清晰度起主要贡献。也就是说,听者是依靠特定的元音或辅音,***音或摩擦音的共振峰的具体形式,即几个共振峰的相关频率的形式来识别它们。共振峰形式可以较高或较低音调的基本频率为基础,如女人或儿童的较高音调的声音,男人的较低音调的声音。但无管怎样,对听者来说,由共振峰形式或即共振峰的相关频率即可识别讲话声的性质。关于人的声音的声学论述可见题为《演唱声学》的文章(《The Acoustics of the Singing Voice》)作者J.Sunberg该篇文章收编于《Readings from Scientific American,The Physics of Music》由Hutchins作序,由W.H.Freeman and Company于1948年出版。
对人耳而言的声音的清晰度的描述在声学工程师手册-最新声学百科学书中有部分描述,该书作者为Glen Ballou由Howard W- Sams ard Company于1987出版,该手册第162页描述了这样的发现即讲话声音中所包含的不同频率对讲话中词语的清晰度的贡献大小亦不同。因此,中频带,大约在1.5-3.5KHZ的量级,对清晰度的贡献占的百分比较大,例如,在250HZ-5KHZ及以上的频率分成多个八度音(octave),中心在250HZ的八度音对听者所听到的话音的清晰度的贡献为7.2%,中心在500HZ的八度音贡献14.4%,中心在1KHZ的贡献为22.2%。对中心在2KHZ的八度音的贡献最大为32.8%,而中心在4KHZ的八度音贡献为23.4%。
本发明利用语言产生的方式及各种浊音及清音形成的方式的原理,并且利用对有选择地放大语音共振峰唯一地加权提供一个整体的语音信号,即使有很高的背景噪声存在,其清晰度也得到显著加强。根据这里披露的实施例,从根本来讲,就是通过对语音共振峰有选择地放大并将增强的共振峰结合到一起从而使声音的清晰度得到提高。
图3示出了本发明的一个实施例的框图。一个在线40上的输入电信号,该信号可从麦克风、记录重放媒介或类似声源中引出,该信号送到频谱分析器42中,将输入信号分成若干个,例如30个,不同的频率成分,并由分开的输出线或如44和46所指示的频率通道输出。应当理解,线44和46代表从频谱分析器输出中来的30个不同的输出线,每个都处于很窄的频带。在每个独自的频道内信号的处理与这些布置中的每个其它信号的处理相同,因此,对频谱分析器的通道44内的信号处理的描述即足以说明在每个其它频道内信号的处理。通道44内的信号被送到电压控制放大器(VCA)50的信号输入端,该放大器在线52上具有一个信号输入端,在线54上具有一个增益控制输入端。线54上的增益控制输入是通过可调电阻56从输入线52得到的。30个通道44至46和它们的压控放大器50至58在线60和62(代表30个独自的线)上得到输出,这些输出在加法网络64内被结合到一起。通道44至46负责处理浊音或元音。
在频谱分析器相同的30个通道的输出信号也被送至辅音及摩擦音通道70至72,还应理解,可以有30或更多个这样的频道,其间相隔1/3个八度音的增量,每个之间除频率外互相等同。但是,在辅音及摩擦音通道的情况中,较少通道个数,如5或10个通道可能即足够了。辅音及摩擦音通道70至72与元音(浊音)通道44至46相似,并且每个都包含有一个压控放大器,例如用于通道70的放大器74,通道70内的信号为其输入,并通过可调电阻78从其输入取得压控输入76。所以,同样,通道72也可包含一个压控放大器80,其也具有一个通过可调电阻82从其信号输入中得到的压控输入。如同浊音通道,辅音和摩擦音通道的输出在结合电路84内结合。
输入信号40也被送到一个浊音/清音开关90,它可在输出线92,94上提供选择信号指示是否有浊音信号存在。浊音/清音信号选择开关可以简单地由一个低通滤器组成,它可使300HZ或以下频率的信号通过,换句话说,这个开关有选择地使一个元音的基本频率通过。一般来说,讲话中元音(浊音)的基本频率在60和250HZ之间,因此,如果该低通频带的信号存在的话,即可知道有浊音信号存在,相反,如果低通滤波器没有输出,则说明输入信号中只含有清音信号。在有浊音信号存在的情况下,线92提供一个控制信号,该信号使浊音通道的压控放大器50和58导通工作,在另方面,在有浊音信号的情况下,线94上的信号关闭清音通道的压控放大器74,80。另外,在没有浊音成分的情况下(例如没有元音),线92上的信号关闭浊音通道放大器50至58,而线94上的信号接通清音通道放大器74至80。
将经过处理后的浊音及清音与初始未经处理的声音,特别是声音的基带或基本频率结合起来是所希望的。但是,由于频谱分析器及具有几个滤波器在其输出信号中引入了某种程度的相移,而要与经处理的浊音及清音信号结合的未经处理的声音信号从频谱分析器的输出中取得,以致,结合的信号遭受到同样的相移。从所有频谱分析器的输出线,包括通道44至46来的这种最终信号经线100和102被送到加法或结合网络104,在其输出线106上提供一个重新构成的结合的声音信号,该信号具有由频谱分析器产生的所有相移,然后该信号在混合器108中通过电平调整电位器110,112,及114可恰当地与结合器64中的结合的浊音信号以及结合器84中的结合的清音信号结合。混合器108在线116上的输出提供增加了清晰度的声音信号。
为了根据对清晰度的分别贡献大小,适当地对几个通道44至46及70至72中信号的几个成分加权,于是用在各压控放大器的控制输入端的可调电阻器56,57,58及82来对频谱分析器的输出的几个成分进行加权放大。
下面的表1指示出对人的声音信号中的不同频率成分的清晰度的贡献百分比,信号被分割成1/3个八度音频带或整个八度音频带。压控可调电阻器56、57、78、82等即根据该表调节。根据表1,这些对清晰度贡献较大的频带内的共振峰被成比例地放大到较大程度。例如,对频谱分析器的一个八度音频带,其通道中心在2KHZ,其增益控制电阻被调节到提供一个相对值为32.8的增益控制信号,而通道中心在500HZ的增益控制电阻器被调节至提供一个相对值为14.4的增益控制信号,等等。
图3显示的***自动有效地根据每个各自的声音的共振峰的幅度对其共振峰进行选择,图2所示,由于声道的共振峰的缘故,共振峰的幅度已经增加,因此,在每个通道中的几个压控放大器将选择每个频带中的最高幅度的频率成分,并通过所示的平方律放大(用放大器的输入控制其增益)增加其幅度,如果输入到每个压控放大器的幅度低于预定的电压,该信号电平即通过放大器降低而不是放大。因此,对于频谱分析器的输出中的包括相对幅度较高的共振峰的那些频带,该共振峰由各自的压控放大器放大,放大器的增益由其输入信号控制,通过调整加权电位器56或57来控制。对于通道70至72中的辅音及摩擦音进行同样的操作,基本上,所述***有选择地识别语音中的共振峰,对这些共振峰进行平方律类型的放大,然后,经过对放大(或增益)的共振峰有选择地加权,之后将共振峰与原始信号结合提供一个清晰度增强的输出。
图4中显示的是图3中的处理器的一个改进及简化的形式。该处理器,当与标准的有线广播或记录***结合时,如同图3中的一样将限定在图1中的处理器18。
在图4所示的***中,信号没有被分离成浊音及清音成分,每个由其输入控制的压控放大器也是如此。因此,布置得到极大地简化,却得到相同的或改进的效能。在图4的***中,没有对各自的共振峰放大信号预定或予计算及统一加权。而是随后利用一个简单的校正程序,从而有效地将每个共振峰的电平提高到基带信号的电平程度。
图4中线120上的一个输入声信号经过一个缓冲放大器122被送到一个频谱分析器124,它可具有所需要的个数的通道。频谱分析器分成八度音或1/3八度音或类似的划分。在典型的***中,如同下面将详细描述的,该频谱分析器设置了30个分离的频道以提供30个不同的频率相继增高的输出频带,每个相接于相邻的频带。频谱分析器的最低输出频带提供于线130上,并且包括较低频带约300HZ以下的所有那些信号成分。这即为声带的基带或基本频率范围。多个附加的频带(实际个数可为29)被表示为132,134,136和1388,这段当中的每一个都送入到其各自的压控放大器140,144,及146。频谱分析器输出的所有这些信号全被送到混合或结合网络150作为输入,在线154上输出一个结合信号,该信号通过一个加法电阻器156送至运算放大器158的反相输入端,该放大器的非反相输入端接地,并用该放大器作为加法放大器。
结合网络150的输出也被送到放大器160,然后,通过一个可调电位器162送至一个缓冲放大器164。缓冲放大器164的输出在线166上向处理器的几个通道的每个压控放大器140至146等提供一个公共的增益控制输入。缓冲放大器164在线166上的控制信号在每个压控放大器处进行各自幅度上的调整(下面将被描述)以提供上面所述的加权。因此,每个压控放大器140至146包括一个可调电位器(图4中未示出)用来对每个通道提供适当的加权。这种加权是根据实验而取得的,即通过最初断开频谱分析器的所有通道的连接。但除基带及要调整的一个通道以外,然后基带信号幅度与压控放大器(例如VCA140)输出的相比较。然后用改变提供给该VCA的控制信号大小的电位器进行调整,以调整放大器的增益控制,以便将被调整的该VCA的输出幅度提升到基带通道中的信号幅度的水平。调整一个通道后,该通道即断开,再唯一地接通下一个通道。然后其压控放大器的输出与基带的幅度比较并调整成与其相等。随后对频谱分析器每一个通道各自按顺序进行此步骤,直到所有的分析器通道都被各自地调整完,使每个VCA的输出幅度中都各自地被提升到基带通道的信号的幅度。于是利用任一合适形式的声信号或模拟声信号在输入端120上作为校正信号进行调整,测试信号可包括一个代表具有所有谐波但不含共振峰的基带信号。
放大器160可具有约为+5的增益,它可通过调整电位器162而被有效地衰减。缓冲放大器164具有单位1的增益。加法网络可在运算放大器158的反相输入端把所有的通道的输入加起来。该加法网络包括加法电阻器170,172,174,176,178和156,使放大器输入端的所有输入相等地加到一起。于是运算放大器158的反馈电阻器180与加法电阻器170至178和156相等,每个加法电阻器都相互相等。
从图4中的实施例中将可以看到,所有的共振峰,不管是否是从浊音或清音中派生出来的,都以同样方式处理并且类似地按实验确定加权,由于每个压控放大器只根据频谱分析器输出处的各自频带内的最高幅度分量工作,所以只有信号输出在一预定的阀值以上,每个共振峰才能被各自地选出并增强。若干个VCA有效地去除那些低于阀值的信号,并有选择地放大那些幅度较高的信号。这些压控放大器也有效地被基带信号本身所控制。尽管基带信号是与其它及效高频率(基带的谐波)结合在一起的,但后者比其谐波具有明显较大的幅度,并且其幅度也大于辅音,摩擦音,及***音,于是在线166上提供最大成分的控制信号,并送至每个压控放大器的控制输入端。因此,在图4的布置中,若干个共振峰在基带信号控制下被有效地放大,相反,在图3的布置中,各自的共振峰是在其本身的控制下被有效地放大。
图5表示的是以若干松下半导体计数器或除法器芯片(Model 120TPQ)相互联接为基础的一个示例性频谱分析器。困此,10个不同的芯片200、202、204、206、208、210、212、214、216及218中的每一个按图5所示相互联结,芯片200在线220上的输出被接于下一个芯片202的输入线222上,按此顺序进行等等。除了顺序中的另一个芯片200,加有一个1MHZ晶体224形成的基准频率,并通过电容器226,227接地以外,所有的芯片都按同样的方式连接。除了一个开关容性滤波器芯片230以外,每个芯片的输出为序列中的下一个芯片提供输入频率基准,该芯片230在线232上有来自芯片200输出的时钟输入,它可将较高的信号频率从时钟频率中分离出来,滤波器230在233上的时钟输出通过线236被送至芯片210至212的输入,及送至第二开关容性滤波器234的输入。滤波器234的输出被连接到去控制芯片214、216和218的输入。滤波器230控制芯片210和212及芯片206和208的输入。从图4中线120来的输入信号被直接加于芯片200,202和204以及开关客性滤波器芯片230,该频谱分析器的30个不同的频率输出出现在30个标有C1-C30的线上,其中,C30为最高频率通道,C1的频率最低。例如,输出C1、C2、C3可分别具有大约20,32及40HZ的频率,而通道C30的最高频率可具有大约20KHZ的输出频率.该***只利用60和8000HZ之间的1/3八度音的频率。芯片200具有一个内置的振荡器,其频率由晶体224及电容器226控制。如前所述,通过若干个芯片,频率被分割成30个不同的频率.开关滤波器230,234可以是“松下”出的半导体芯片“LMF,60-100”。
图6表示的是与图4中处理器的所有通道相一致的各压控放大器(VCA)中的一个示例。每个压控放大器芯片300主要采用Signetics NE/SA572“编程模拟压缩扩展器”,这是一种双通,高性能增益控制电路,具有改进的输入及输出电路,如图66所示。VCA芯片300具有一个在线302上的输入,它是经电容器304来自频谱分析器124(图4)的线306(对应于线132、134、136、138)的。用于这个放大器的电压控制输入(可以从缓冲器164的输出线166(图4)上得到)经过一个校正及加权电位器308(对应于图3中的电容器56,57,78,82)然后从电位器滑动臂经过电容器310及输入电阻312送至增益控制放大器芯片300的控制输入端。压控放大器向加法网络172,174,176,178,156(图4)提供的输出可从输出端320得到,并经过一个固定电阻322和一个电压调整电位器324从一个固定的电压源得到偏置,压控放大器输出被送至运算放大器326的反相输入端,其非反相输入端接地在线328上向图4中的加法网络170至178和156提供输出。由电位器308控制单个压控放大器的各自加权,就是通过该电阻,一个通道接一个通道的调整把每个通道各自的幅度都提升到基带信号的幅度。当然,一旦确定了电位器308的合适电阻值,后者即可成为一个固定电阻,可进行很小数量的微调。
如上所述,图1表示了本发明的实时应用于语言传播***时,使用的声音处理方法和装置。将很容易理解,同样的声音处理也可应用于制造任何适当的录音,它可重复地用来作为传统的有线广播***的声音输入。在制作这样的录音时,利用这里描述的声音处理和清晰度增强技术,得到的录音即由处理电路指供了固有的增强的清晰度。因此,当该录音在传统的有线广播或其它扬声器***中播放时即无须进一步的清晰度增强处理。
为了制作这样的录音,可利用与图1中所示的大体相同的***。唯一的区别在于,用一个录音装置替代扬声器16,例如用磁带录音机或类似装置,使得记录在磁带或其它记录介质上的声音象前面所述那样含有由电路8处理、增强的及结合的共振峰。
在图1的布置中,原来的扬声器16在这里实际为一个录音装置,而不是扬声器***,使得可通过这个录音装置制作清晰度增强的录音,声源10的输入信号可以是一个清晰的纯声音信号,例如,在录音棚或其它无背景噪声的环境中的讲话信号。但是,如果输入的声音为在嘈杂的背景环境中产生的话,上述的处理将仍能提供清晰度增强的录音。这种条件存在于许多场合,例如飞机座仓的声音记录仪(CVR),这是一种设置在商业飞机座仓中的录音装置,用于记录情况及飞机座仓内人员的谈话,座仓的环境是极为嘈杂的,过去由于座仓声音记录仪产生录音清晰度很低,所以很难理解。本发明即可用于这种飞机座仓声音记录仪,当在传统的重放设备中播放时增强了录音的清晰度。本发明的清晰度增强了飞机座仓声音记录仪大体上与图1所示的***相同,其中声源10包括一个麦克风(话筒)用来在已知的声音记录装置(替代图1中的扬声器16)录音时采集声音。话筒10的输出(声源)被送至合适的放大器,如放大器12。放大器的输出被送到如前所述的声音清晰增强处理电路14,即使声音信号最初伴有相对较高的背景噪声,电路14也能有选择地识别并放大声音信号的共振峰。因此,即使录音中含有记录下的噪声,如前所述的共振峰处理也将会产生清晰度增强的录音。
Claims (45)
1、一种用于增强声音清晰度的方法,所述声音是从扬声器发出并传播到一种有环境噪声的区域,所述扬声器接收的输入信号是从具有共振峰的声音电信号中得到的,所述的方法包含的步骤是:
有选择地放大所述共振峰的至少一些中的每一个,以及
组合所述已放大的共振峰提供一种增强的声音信号。
2、如权利要求1所述的方法,其中所述的声音信号包括一个基带成分,所述方法包括将所述放大的共振峰与所述的基带成分结合的步骤。
3、如权利要求2的方法,在所述的结合步骤之前还包括对所述的共振峰及基带成分移相的步骤。
4、如权利要求3的方法,其中所述的声音信号包括元音,辅音和摩擦音,并且其中所述的选择放大步骤包括对所述的元音,辅音及摩擦音的共振峰增强并将增强的共振峰与所述的基带成分结合的步骤。
5、如权利要求1的方法,其中所述的声信号包括具有一定幅度的基带信号,其中所述的选择放大各个所述共振峰的步骤,包括将所述共振峰的幅度提升到所述基带成分的幅度步骤。
6、如权利要求1的方法,包括根据所选择的共振峰对清晰度的贡献对所述的共振峰有选择地加权放大的步骤。
7、如权利要求1的方法,包括对所选择的所述共振峰的每一个相对地加权放大的步骤,以便在大约1KHZ和4KHZ的频率之间提供较大的加权,而对低于大约1KHZ,高于大约4KHZ的频率提供较少的加权。
8、如权利要求7的方法,其中所述的加权步骤,包括对大约2-3KHZ的范围的频率提供较大的加权。
9、如权利要求1的方法,包括通过将由每个所述共振峰组的幅度增加到预定的水平而对所述放大的共振峰加权的步骤。
10、如权利要求1的方法,其中选择放大共振峰的步骤,包括根据其本身的幅度控制每个共振峰的水平的步骤。
11、如权利要求1的方法,其中所述的选择放大各个所述共振峰的步骤,包括提供一个代表所述声信号的控制信号,并且根据所述控制信号的幅度各个地放大所述的选择的共振峰。
12、如权利要求1的方法,其中所述的选择放大各个所述的共振峰的步骤,包括利用一个频谱分析器来选择预定频带的共振峰,放大各个所述频带内的各个共振峰,根据所述声信号的幅度控制所述共振峰的放大量。
13、如权利要求12的方法,其中所述的控制放大量的步骤,包括结合所述各频带内的各共振峰以提供一个放大控制信号,并根据所述控制信号的各自的加权幅度来放大各自的共振峰。
14、如权利要求13的方法,包括将所述的共振峰与所述的控制信号结合,以提供增强的输出信号的步骤。
15、一种用于增强扬声器输出的清晰度的方法,扬声器将声音传送到环境噪声的区域,其中所述的扬声器加有一个从声音电信号中分离出的输入信号,所述声音电信号代表含有基带成分和多个共振峰成分的声音,所述的方法包括的步骤为:
将所述的声音电信号分离成多个不同频率的频率成分,包括一个基带频率,和多个较高的频率,
选择放大至少一些所述的频率成分,
从所述各频率成分的至少一个中产生一个放大控制信号,以及
利用所述的控制信号去控制至少所述的一个频率成分的放大量。
16、如权利要求15的方法,其中所述的选择放大频率成分并利用所述的控制信号的步骤,包括放大所述各频率成分至少一个的步骤,其放大量取决于其自身的幅度。
17、如权利要求15的方法,包含结合所述频率成分的一组,以提供一个结合的信号,并且,将所述选择的各放大频率成分与上面最后所述的结合信号结合的步骤。
18、如权利要求15的方法,其中所述的产生放大控制信号的步骤,包括结合多个所述的频率成分的步骤。
19、如权利要求15的方法,包括有选择地加权放大所述的各频率成分的步骤。
20、用于增强声音电信号清晰度的声音清晰度增强装置,包括:
响应所述声音电信号的频率选择装置,用于在覆盖一选定频率范围的多个不同的频道中提供频带信号,所述的频带信号的每一个包括一个基带信号,
在每个所述通道组中的放大器装置,用于放大所述组中每个通道中的信号,所述的放大器装置具有一个放大控制输入,
响应至少一个所述频带信号的装置,用以提供一个放大控制信号,
用于将所述放大控制信号提供给至少一些所述的放大控制输入装置,以及
用于将所述的放大的频带信号与所述的基带信号结合的装置,用以根据一个增强的信号输出。
21、如权利要求20的***,包括将所述的放大控制信号与所述基带通道中的信号结合并放大所述频道中的信号的装置,以提所述的增强的输出信号。
22、如权利要求20的***,包括用于调整控制信号的幅度的装置,所述控制信号被送至各自的所述放大信号输入端,以使各自放大装置的输出具有大致与所述基带信号相同的电平。
23、如权利要求20的方法,其中所述的基带信号具有一个基带信号幅度,其中所述的各不同通道的每个组中的所述信号具有代表所述声音电信号共振峰的幅度,所述共振峰幅度随增加频率而下降,并包括所述放大器装置中用于控制每个代表共振峰的所述信号的放大装置,以使其放大至大致等于所述基带信号的幅度。
24、一种声音清晰度增强***,包括:
一个频谱分析器,适于接收声音电信号,其清晰度被增强并具有在相互不同的频带的多个各自频带输出通道内的各自的基频带信号,
多个压控放大器,分别对应于各自的所述的通道,每个具有一个来自一个信号通道的输入和具有一个增益控制输入,
控制产生装置,它响应于至少一个所述通道内的信号,用于向至少一个所述的放大器的增益控制输入端提供增益控制信号,
一个结合电路,具有来自多个各自的所述频带通道的输入,并提供结合的输入,以及
用于结合所述放大器的输出和所述的结合的输出的装置,用以提供一个增强声音信号输出。
25、如权利要求24的***,其中所述的控制产生装置包括响应于所述通道之一的信号的装置,用于将增益控制信号送至所述一个通道内的放大器增益控制输入。
26、如权利要求24的***,其中所述的控制产生装置包括响应于所述结合的输出的装置,用于将增益控制信号送至多个所述的放大器的增益控制输入。
27、如权利要求24的***,其中用于结合所述结合的输出和所述放大器的所述输出的所述装置,包括这样的装置即,用于将从所述频谱分析器中提供的在所述通道中频率最低的一个中的信号与所述放大器的所述输出以及所述结合的信号相结合,以提供所述增强的输出。
28、如权利要求27的***,包括控制电平调整装置,用于调整由每个所述压控放大器提供的放大量,以改变放大器的输出电平,使之大体与所述最低频道的信号电平相等。
29、如权利要求24的***,其中所述的频带通道中的一个为基带通道,用于通过大体等于但不大于人声带的自然频率的低频带。
30、如权利要求24的***,其中所述通道中的一个通过不大于约300HZ的频带。
31、用于改进由声音电信号代表的讲话清晰度的装置,包括:
用于选择所述含有共振峰的所述声音电信号的成分的装置,
用于放大所述选择的成分的装置,以及
用于结合所述放大成分的装置,
32、如权利要求31的装置,包括在结合所述选择的成分之前用于对它们进行有选择地加权的装置。
33、如权利要求32的装置,包括在放大之前用于结合所述的选择的成分的装置,以及用于将所述的放大的成分与所述已结合的放大成分结合的装置。
34、一种用于制作声音电信声的增强清晰度的记录方法,包括步骤:
选择含有共振峰的所述声音电信号的成分,
放大所述选择的成分,
结合所述的放大成分以提供一个增强的信号,以及
记录所述的结合的放大成分。
35、如权利要求34的方法,包括在结合所述的成分之前包括对它们有选择地加权的步骤。
36、如权利要求35的方法,包括在放大之前结合所述选择的成分并将所述的放大成分与所述结合的选择成分结合的步骤。
37、利用权利要求34的方法制作的记录。
38、利用权利要求36的方法制作的记录。
39、一种用于在重放***中使用的声音记录,该***接有扬声器,使扬声器在有背景噪声情况下产生输出清晰度增强声音信号,所述的声音记录包括:
一种具有信号产生装置的记录介质,适于作用于一种记录介质播放机的声音记录响应装置上以使所述的声音记录响应装置产生一个输出声音信号,该信号是一种具有基带信号和多个共振峰的声音信号的增强的改进,所述的输出声信号包括结合:
(a)所述的基带信号,以及,
(b)多个放大的共振峰成分,
所述的放大的共振峰成分是与所述的基带信号结合的,从声音记录响应装置中提供所述的输出声信号。
40、如权利要求39的声音记录,其中所述的放大的共振峰成分是各自被加权的,以使其幅度增加至相当于所述基带信号的幅度。
41、一种声音记录适于在记录重放机中产生信号响应,所述记录重放机结合有扬声器并使扬声器在嘈杂背景中产生增强清晰度的声音信号,所述的声音记录包括:
一种具有信号产生装置的记录介质,适于作用于记录重放机的声音记录响应装置,使声音记录响应装置产生一个声音输出信号,该声音输出信号是输入的声音电信号的改进,所述的声音输出信号包括下述成分的结合。
代表人声带自然频率的基带信号结合,
多个代表所述基带成分的共振峰的共振峰成分,所述的共振峰被有选择地放大并与所述基带成分结合。
42、如权利要求41的声音记录,其中所述的共振峰成分被放大,由此使其幅度达到所述基带信号的幅度。
43、一种飞机座仓声音记录仪包括:
用于接收机仓内产生的声音的输入装置,该声音包括讲话声及背景噪声,并产生一个声音电信号,
用于有选择地放大所述共振峰的装置,
用于结合所述的放大的共振峰以提供结合信号的装置,以及
用于记录所述结合信号的装置。
44、如权利要求43的机仓声音记录仪,其中所述的声音电信号包括基带信号,并且其中所述的用于结合的装置包括将所述的基带信号与所述放大的共振峰结合。
45、如权利要求43的机仓声音记录仪,包括选择加权放大所述共振峰装置,以便对不同的所述共振峰提供不同程度的放大。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67603791A | 1991-03-27 | 1991-03-27 | |
US676,037 | 1991-03-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1065370A true CN1065370A (zh) | 1992-10-14 |
CN1041266C CN1041266C (zh) | 1998-12-16 |
Family
ID=24712968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN91111903A Expired - Lifetime CN1041266C (zh) | 1991-03-27 | 1991-12-27 | 有线广播清晰度*** |
Country Status (11)
Country | Link |
---|---|
US (1) | US5459813A (zh) |
EP (1) | EP0505645B1 (zh) |
JP (1) | JP3151459B2 (zh) |
KR (1) | KR950013557B1 (zh) |
CN (1) | CN1041266C (zh) |
CA (1) | CA2056110C (zh) |
DE (1) | DE69131095T2 (zh) |
ES (1) | ES2133281T3 (zh) |
HK (1) | HK1003305A1 (zh) |
IL (1) | IL100174A (zh) |
MX (1) | MX9102610A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8050926B2 (en) | 2007-08-28 | 2011-11-01 | Micro-Star Int'l Co., Ltd | Apparatus and method for adjusting prompt voice depending on environment |
CN104575515A (zh) * | 2013-10-23 | 2015-04-29 | 中兴通讯股份有限公司 | 一种提高语音质量的方法及装置 |
CN109658952A (zh) * | 2018-12-13 | 2019-04-19 | 歌尔科技有限公司 | 一种音频信号处理方法、设备及存储介质 |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5710862A (en) * | 1993-06-30 | 1998-01-20 | Motorola, Inc. | Method and apparatus for reducing an undesirable characteristic of a spectral estimate of a noise signal between occurrences of voice signals |
JPH07104788A (ja) * | 1993-10-06 | 1995-04-21 | Technol Res Assoc Of Medical & Welfare Apparatus | 音声強調処理装置 |
US5467393A (en) * | 1993-11-24 | 1995-11-14 | Ericsson Inc. | Method and apparatus for volume and intelligibility control for a loudspeaker |
JP3321971B2 (ja) * | 1994-03-10 | 2002-09-09 | ソニー株式会社 | 音声信号処理方法 |
DE69629986T2 (de) * | 1995-07-27 | 2004-07-15 | Victor Company of Japan, Ltd., Yokohama | Verfahren und Gerät zum Kodieren digitaler akustischer Signale |
GB2306088A (en) * | 1995-10-09 | 1997-04-23 | London Regional Transport | Public address system speech training |
US5966438A (en) * | 1996-03-05 | 1999-10-12 | Ericsson Inc. | Method and apparatus for adaptive volume control for a radiotelephone |
US5790671A (en) * | 1996-04-04 | 1998-08-04 | Ericsson Inc. | Method for automatically adjusting audio response for improved intelligibility |
GB9714001D0 (en) * | 1997-07-02 | 1997-09-10 | Simoco Europ Limited | Method and apparatus for speech enhancement in a speech communication system |
US6353671B1 (en) * | 1998-02-05 | 2002-03-05 | Bioinstco Corp. | Signal processing circuit and method for increasing speech intelligibility |
US6285767B1 (en) | 1998-09-04 | 2001-09-04 | Srs Labs, Inc. | Low-frequency audio enhancement system |
US6590983B1 (en) | 1998-10-13 | 2003-07-08 | Srs Labs, Inc. | Apparatus and method for synthesizing pseudo-stereophonic outputs from a monophonic input |
US6993480B1 (en) | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
US7031474B1 (en) | 1999-10-04 | 2006-04-18 | Srs Labs, Inc. | Acoustic correction apparatus |
US7277767B2 (en) | 1999-12-10 | 2007-10-02 | Srs Labs, Inc. | System and method for enhanced streaming audio |
DE10124699C1 (de) * | 2001-05-18 | 2002-12-19 | Micronas Gmbh | Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen |
US20030220801A1 (en) * | 2002-05-22 | 2003-11-27 | Spurrier Thomas E. | Audio compression method and apparatus |
KR20050049103A (ko) * | 2003-11-21 | 2005-05-25 | 삼성전자주식회사 | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 |
US7522733B2 (en) * | 2003-12-12 | 2009-04-21 | Srs Labs, Inc. | Systems and methods of spatial image enhancement of a sound source |
DE102004013952A1 (de) * | 2004-03-22 | 2005-10-20 | Infineon Technologies Ag | Schaltkreis-Anordnung und Signalverarbeitungs-Vorrichtung |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US7949520B2 (en) * | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US7676362B2 (en) * | 2004-12-31 | 2010-03-09 | Motorola, Inc. | Method and apparatus for enhancing loudness of a speech signal |
TW200627999A (en) | 2005-01-05 | 2006-08-01 | Srs Labs Inc | Phase compensation techniques to adjust for speaker deficiencies |
KR100657948B1 (ko) | 2005-02-03 | 2006-12-14 | 삼성전자주식회사 | 음성향상장치 및 방법 |
US8280730B2 (en) | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
US8050434B1 (en) | 2006-12-21 | 2011-11-01 | Srs Labs, Inc. | Multi-channel audio enhancement system |
US20100189283A1 (en) * | 2007-07-03 | 2010-07-29 | Pioneer Corporation | Tone emphasizing device, tone emphasizing method, tone emphasizing program, and recording medium |
US8850154B2 (en) * | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
JP4968147B2 (ja) | 2008-03-31 | 2012-07-04 | 富士通株式会社 | 通信端末、通信端末の音声出力調整方法 |
JP5551254B2 (ja) | 2009-09-14 | 2014-07-16 | ディーティーエス・エルエルシー | 適応音声了解度処理のためのシステム |
US9324337B2 (en) * | 2009-11-17 | 2016-04-26 | Dolby Laboratories Licensing Corporation | Method and system for dialog enhancement |
KR101690252B1 (ko) | 2009-12-23 | 2016-12-27 | 삼성전자주식회사 | 신호 처리 방법 및 장치 |
KR101827032B1 (ko) | 2010-10-20 | 2018-02-07 | 디티에스 엘엘씨 | 스테레오 영상 확대 시스템 |
ES2732373T3 (es) * | 2011-05-11 | 2019-11-22 | Bosch Gmbh Robert | Sistema y método para emitir y controlar especialmente una señal de audio en un entorno usando una medida de inteligibilidad objetivo |
WO2013019562A2 (en) | 2011-07-29 | 2013-02-07 | Dts Llc. | Adaptive voice intelligibility processor |
WO2013032822A2 (en) | 2011-08-26 | 2013-03-07 | Dts Llc | Audio adjustment system |
EP2798737B1 (en) | 2011-12-27 | 2018-10-10 | Dts Llc | Bass enhancement system |
JP5590021B2 (ja) * | 2011-12-28 | 2014-09-17 | ヤマハ株式会社 | 音声明瞭化装置 |
US9026439B2 (en) * | 2012-03-28 | 2015-05-05 | Tyco Fire & Security Gmbh | Verbal intelligibility analyzer for audio announcement systems |
WO2014035845A2 (en) | 2012-09-02 | 2014-03-06 | QoSound, Inc. | Adaptive audio signal shaping for improved playback in a noisy environment |
DE112012006876B4 (de) * | 2012-09-04 | 2021-06-10 | Cerence Operating Company | Verfahren und Sprachsignal-Verarbeitungssystem zur formantabhängigen Sprachsignalverstärkung |
CN104078050A (zh) | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
WO2014190140A1 (en) | 2013-05-23 | 2014-11-27 | Alan Kraemer | Headphone audio enhancement system |
US9531333B2 (en) * | 2014-03-10 | 2016-12-27 | Lenovo (Singapore) Pte. Ltd. | Formant amplifier |
EP3107097B1 (en) * | 2015-06-17 | 2017-11-15 | Nxp B.V. | Improved speech intelligilibility |
US9847093B2 (en) * | 2015-06-19 | 2017-12-19 | Samsung Electronics Co., Ltd. | Method and apparatus for processing speech signal |
WO2017025107A2 (en) * | 2015-11-22 | 2017-02-16 | Al-Shalash Taha Kais Taha | Talker language, gender and age specific hearing device |
US10997983B2 (en) * | 2016-12-08 | 2021-05-04 | Mitsubishi Electric Corporation | Speech enhancement device, speech enhancement method, and non-transitory computer-readable medium |
TWI662545B (zh) * | 2018-06-22 | 2019-06-11 | 塞席爾商元鼎音訊股份有限公司 | 調整語音頻率之方法及其聲音播放裝置 |
CN109671422B (zh) * | 2019-01-09 | 2022-06-17 | 浙江工业大学 | 一种获取纯净语音的录音方法 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3180936A (en) * | 1960-12-01 | 1965-04-27 | Bell Telephone Labor Inc | Apparatus for suppressing noise and distortion in communication signals |
US3368039A (en) * | 1965-01-22 | 1968-02-06 | Ibm | Speech analyzer for speech recognition system |
DE2555263B1 (de) * | 1975-12-09 | 1977-02-10 | Westfaelische Metall Industrie Kg, Hueck & Co, 4780 Lippstadt | Verkehrsdurchsagesystem |
DE2618973B2 (de) * | 1976-04-29 | 1981-05-07 | CMB Colonia Management- und Beratungsgesellschaft mbH & Co KG, 5000 Köln | Verfahren zum Auffrischen älterer Tonaufzeichnungen |
US4166926A (en) * | 1978-06-07 | 1979-09-04 | Seiler George J | Portable lectern and voice amplifier |
WO1980002767A1 (en) * | 1979-05-28 | 1980-12-11 | Univ Melbourne | Speech processor |
US4287391A (en) * | 1979-06-21 | 1981-09-01 | Rhr Industries, Ltd. | Microphone assembly for speech recording using noise-adaptive output level control |
US4506379A (en) * | 1980-04-21 | 1985-03-19 | Bodysonic Kabushiki Kaisha | Method and system for discriminating human voice signal |
FI66268C (fi) * | 1980-12-16 | 1984-09-10 | Euroka Oy | Moenster och filterkoppling foer aotergivning av akustisk ljudvaeg anvaendningar av moenstret och moenstret tillaempandetalsyntetisator |
JPS5842096A (ja) * | 1981-09-04 | 1983-03-11 | 富士通テン株式会社 | 音声信号の雑音抑圧方式 |
US4661981A (en) * | 1983-01-03 | 1987-04-28 | Henrickson Larry K | Method and means for processing speech |
US4641343A (en) * | 1983-02-22 | 1987-02-03 | Iowa State University Research Foundation, Inc. | Real time speech formant analyzer and display |
US4707858A (en) * | 1983-05-02 | 1987-11-17 | Motorola, Inc. | Utilizing word-to-digital conversion |
US4703505A (en) * | 1983-08-24 | 1987-10-27 | Harris Corporation | Speech data encoding scheme |
US4696040A (en) * | 1983-10-13 | 1987-09-22 | Texas Instruments Incorporated | Speech analysis/synthesis system with energy normalization and silence suppression |
US4686693A (en) * | 1985-05-17 | 1987-08-11 | Sound Mist, Inc. | Remotely controlled sound mask |
US4689821A (en) * | 1985-09-23 | 1987-08-25 | Lockheed Corporation | Active noise control system |
NL8600405A (nl) * | 1986-02-18 | 1987-09-16 | Philips Nv | Versterker met automatische regeling van de versterking. |
JPS62235996A (ja) * | 1986-04-07 | 1987-10-16 | 東洋通信機株式会社 | 合成音質変化方法 |
US4882758A (en) * | 1986-10-23 | 1989-11-21 | Matsushita Electric Industrial Co., Ltd. | Method for extracting formant frequencies |
US4802228A (en) * | 1986-10-24 | 1989-01-31 | Bernard Silverstein | Amplifier filter system for speech therapy |
US5175793A (en) * | 1989-02-01 | 1992-12-29 | Sharp Kabushiki Kaisha | Recognition apparatus using articulation positions for recognizing a voice |
US4979216A (en) * | 1989-02-17 | 1990-12-18 | Malsheen Bathsheba J | Text to speech synthesis system and method using context dependent vowel allophones |
JP2705201B2 (ja) * | 1989-03-29 | 1998-01-28 | 富士通株式会社 | 適応後置フイルタ制御方法 |
JP2573352B2 (ja) * | 1989-04-10 | 1997-01-22 | 富士通株式会社 | 音声検出装置 |
US5280543A (en) * | 1989-12-26 | 1994-01-18 | Yamaha Corporation | Acoustic apparatus and driving apparatus constituting the same |
EP0438662A2 (en) * | 1990-01-23 | 1991-07-31 | International Business Machines Corporation | Apparatus and method of grouping utterances of a phoneme into context-de-pendent categories based on sound-similarity for automatic speech recognition |
DK0477591T3 (da) * | 1990-09-27 | 1995-08-28 | Studer Professional Audio Ag | Forstærkerenhed |
JPH04250710A (ja) * | 1991-01-09 | 1992-09-07 | Sony Corp | オーディオ回路 |
-
1991
- 1991-11-25 CA CA002056110A patent/CA2056110C/en not_active Expired - Fee Related
- 1991-11-27 IL IL10017491A patent/IL100174A/xx not_active IP Right Cessation
- 1991-12-10 JP JP32597191A patent/JP3151459B2/ja not_active Expired - Lifetime
- 1991-12-12 DE DE69131095T patent/DE69131095T2/de not_active Expired - Lifetime
- 1991-12-12 EP EP91311590A patent/EP0505645B1/en not_active Expired - Lifetime
- 1991-12-12 ES ES91311590T patent/ES2133281T3/es not_active Expired - Lifetime
- 1991-12-17 MX MX9102610A patent/MX9102610A/es unknown
- 1991-12-27 CN CN91111903A patent/CN1041266C/zh not_active Expired - Lifetime
- 1991-12-30 KR KR1019910025540A patent/KR950013557B1/ko not_active IP Right Cessation
-
1993
- 1993-06-23 US US08/082,128 patent/US5459813A/en not_active Expired - Lifetime
-
1998
- 1998-03-23 HK HK98102431A patent/HK1003305A1/xx not_active IP Right Cessation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8050926B2 (en) | 2007-08-28 | 2011-11-01 | Micro-Star Int'l Co., Ltd | Apparatus and method for adjusting prompt voice depending on environment |
CN104575515A (zh) * | 2013-10-23 | 2015-04-29 | 中兴通讯股份有限公司 | 一种提高语音质量的方法及装置 |
CN109658952A (zh) * | 2018-12-13 | 2019-04-19 | 歌尔科技有限公司 | 一种音频信号处理方法、设备及存储介质 |
CN109658952B (zh) * | 2018-12-13 | 2020-10-09 | 歌尔科技有限公司 | 一种音频信号处理方法、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US5459813A (en) | 1995-10-17 |
DE69131095T2 (de) | 1999-09-23 |
MX9102610A (es) | 1994-06-30 |
KR920018650A (ko) | 1992-10-22 |
DE69131095D1 (de) | 1999-05-12 |
JP3151459B2 (ja) | 2001-04-03 |
ES2133281T3 (es) | 1999-09-16 |
EP0505645A1 (en) | 1992-09-30 |
CN1041266C (zh) | 1998-12-16 |
JPH04328798A (ja) | 1992-11-17 |
IL100174A0 (en) | 1992-08-18 |
CA2056110C (en) | 1997-02-04 |
IL100174A (en) | 1997-09-30 |
KR950013557B1 (ko) | 1995-11-08 |
HK1003305A1 (en) | 1998-10-23 |
EP0505645B1 (en) | 1999-04-07 |
CA2056110A1 (en) | 1992-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1041266C (zh) | 有线广播清晰度*** | |
CN101366177B (zh) | 音频供给量控制 | |
US6993480B1 (en) | Voice intelligibility enhancement system | |
EP0796489B1 (en) | Method for transforming a speech signal using a pitch manipulator | |
US8406442B2 (en) | Hearing aid apparatus | |
JP4817658B2 (ja) | 音響仮想現実エンジンおよび配信された音声改善のための新技術 | |
CN1151077A (zh) | 音频信号再现方法及其装置 | |
US6148086A (en) | Method and apparatus for replacing a voice with an original lead singer's voice on a karaoke machine | |
EP2650872A1 (en) | Masking sound generation device, masking sound output device, and masking sound generation program | |
JPH05508760A (ja) | ダイナミックレンジ圧縮 | |
JPH08190400A (ja) | 音響変速再生装置 | |
JPH1020873A (ja) | 音声信号処理装置 | |
KR20000029950A (ko) | 전자오디오신호의고조파개선장치및방법 | |
JPH06289898A (ja) | 音声信号処理装置 | |
JP4185984B2 (ja) | 音信号の加工装置および加工方法 | |
CN1630427A (zh) | 一种低音增效处理的方法 | |
JPH0580796A (ja) | 話速制御型補聴方法および装置 | |
EP0795860A2 (en) | Apparatus for reproducing audio signals | |
JP3185363B2 (ja) | 補聴器 | |
JPH06250695A (ja) | ピッチ制御方法及び装置 | |
KR100372576B1 (ko) | 오디오신호 가공방법 | |
Cha et al. | Can a natural singing voice be enhanced through digital processing? Implications of voice training and vocology in singers | |
JPS62262600A (ja) | 補聴装置 | |
CN118413767A (zh) | 一种多通道的听湿录干***及音箱设备 | |
JP2000242287A (ja) | 発声補助装置およびプログラム記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C53 | Correction of patent of invention or patent application | ||
COR | Change of bibliographic data |
Free format text: CORRECT: APPLICANT; FROM: HUGHES AIRCRAFT CO. TO: SRS LABS CO. |
|
CP01 | Change in the name or title of a patent holder |
Address after: American California Applicant after: SRs Labs. Inc. Address before: American California Applicant before: Hughes Aircraft Co. |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C15 | Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993) | ||
OR01 | Other related matters | ||
C17 | Cessation of patent right | ||
CX01 | Expiry of patent term |
Expiration termination date: 20111227 Granted publication date: 19981216 |