CN101221767B

CN101221767B - 人声语音加强装置与应用于其上的方法

Info

Publication number: CN101221767B
Application number: CN2008100085184A
Authority: CN
Inventors: 张荣贵; 郭道宁; 黄上已; 林煌翔; 陈绍喜
Original assignee: MStar Semiconductor Inc Taiwan
Current assignee: MediaTek Inc
Priority date: 2008-01-23
Filing date: 2008-01-23
Publication date: 2012-05-30
Anticipated expiration: 2028-01-23
Also published as: CN101221767A

Abstract

本发明为一种人声语音加强装置与应用于其上的方法，其中该装置包含：一降频器、一语音加强运算器、一升频器，该方法包含步骤：对多媒体播放的一左、右声道声音信号进行一第一信号混合处理，进而形成一声音信号并进行半频段滤波的一降频处理而形成一降频声音信号；对该降频声音信号进行一人声语音加强运算而形成一语音加强声音信号；对该语音加强声音信号进行一升频处理而形成一升频声音信号；以及对该升频声音信号与该左声道声音信号进行一第二信号混合处理和与该右声道声音信号进行一第三信号混合处理后，进行信号输出。本发明能对声音信号中的人声语音频段作出明显而清晰的加强效果，并有效地改善运算处理上的耗能和存储器资源耗用的问题。

Description

人声语音加强装置与应用于其上的方法

技术领域

本发明涉及一种人声语音加强装置与应用于其上的方法，尤其涉及一种利用语音强化技术和相关信号处理技术，而能对声音信号中的人声语音作出加强效果的装置与方法。

背景技术

在一般的声音输出接口或输出效果的声音处理应用上，例如电影、电视、计算机、音响的扩音器的声音输出，或是手机、电话、麦克风收音等的扩音器声音输出，其输出的声音包含了有各种频率波段的声音波形，并包括了有主要内容的对话人声、背景声、杂声或其它声音等，而对于某些声音的输出为了要能改变其听觉上的效果，或是要特别加强出某些声音的重要性，便需要对其声音信号进行进一步的音效处理。

详细来说，也就是要在所要输出的声音效果上加强我们所特别需要强调人声语音的内容，例如：加强电影中的主角人物的对话频段，或是加强在电话声音输出中的人声频段，以相对于某一环境或信号中其它重要性较为次之的背景声或是杂声，能够有较为明显的对比和强调性的输出表现，以达到清晰呈现和清楚地听力识别的目的，这是声音处理技术上很重要的一项技术和议题。

承上所述，此一人声语音加强或是语音强化(Speech Enhancement)的技术，目前已有各方面惯用技术的使用和应用，如图1所示，为一惯用技术加强特定频段的波形示意图，其中在该图上方的波形图为原始的声音输出波形，其横轴表示为频率的大小，而纵轴则表示为波形输出的强弱，而在该图下方的波形图则为经过处理的波形。由于一般人声的声音显示频率约在500赫兹(Hz)到6K或7K赫兹(即6000到7000Hz)之间，所以若超过此范围的声音频率则已非一般人声语音的频率范围，由此图所示，一般加强人声语音的技术为直接在其声音输出的频段中撷取出其中的1K到3K赫兹(Hz)的频段信号直接进行加强输出，或是可为经由一时域(Time Domain)的滤波器对信号的某一特定频段进行带通的滤波处理而加强其输出，如此虽然能达到将所需的人声语音频段部分进行强化的目的，但其中所存在的一些背景声或噪声等非主要内容的声音则也会被一并加强，从而导致对比上的效果并不会特别明显而清楚。部分的数字及模拟电视会采用此种方式或类似的处理方式来强化其语音输出。

另外，如图2所示，为另一惯用技术进行人声语音加强的***运行示意图，其中在处理上此技术是在频域(Frequency Domain)下对一单声道输入的声音信号进行处理，并需要对信号所转换的频率取样比(Frequency Sample rate，简称为FS rate)或所谓的取样频率进行数字处理，而一般常用的声音信号频率取样比或取样频率包含有：44.1K、48K、32K赫兹等，运算上便是将信号以“快速傅立叶转换”(Fast Fourier Transform，简称为FFT)的方式撷取出整体的频谱，再经由图中所示的语音加强运算10进行处理后而能对在频率领域下特定分辨率的各取样值进行各种算法，以消减非主要的背景声频率、杂声频率，或是加强所需要的人声语音频率等处理过程，而经由此处理过程所能得到的结果可有占极大比例的人声语音频段输出，并再经由“反快速傅立叶转换”(Inverse FFT，简称为IFFT)后转回时间域以进行声音输出。

而上述的技术，包括该语音加强运算10等，已普遍运用在电话或手机的声音输出上，且特别以GSM格式的手机为主要的功能应用对象；目前此技术已知的处理模式或处理方法包含有：频谱消减(Spectral Subtraction)逼近、信号子空间(Signal Subspace)逼近、能量抑制信号子空间(Energy Constrained Signal Subspace)逼近、改进的频谱消减(Modified Spectral Subtraction)逼近、线性预测留数方法(Linear Prediction Residual Method)等处理模式或方法；而在诸如一般的立体声的声音输出上，大部分采用左右两声道分开处理的方式来完成其语音强化的功能。

以上述图1的方式，虽可不需进行费时的转换处理运算便可完成其语音强化，但缺点在于所作的处理并不是非常明显与突出，无法有效地将人声与其它声音作明显的区别强化或滤除。而其图2所使用的技术，则虽然能有效地利用傅立叶转换的运算，从而能针对在频率领域下特定分辨率的各取样值来撷取出人声频率或背景声频率，并进行对应所需的强化或滤除，然而，当此技术分别运用在左右两声道上的处理时，对于***在运算的处理过程上会较为耗用其***存储器(例如：DRAM或SRAM)的资源，并且在从FFT以在频率领域下提供该语音加强运算10作处理后，需再作IFFT后才能在时间域下输出其处理结果，且此种由FFT再作IFFT的运算过程也会非常耗用***存储器的资源，并会占用处理器大量运算资源及效能。

发明内容

因此，如何解决此一惯用技术的问题，便成为本发明的主要目的。

本发明的目的在于提供一种人声语音加强装置与应用于其上的方法，能够利用惯用的语音强化技术和相关的信号混合、低通滤波、降频与升频的处理技术，而能对声音信号中的人声语音频段作出明显而清晰的加强效果，并能有效地改善运算处理上的耗能和存储器资源耗用的问题。

本发明为一种人声语音加强方法，应用于一人声语音加强装置上，该方法包含下列步骤：接收多媒体播放的一左声道声音信号和一右声道声音信号，并将该左声道声音信号和该右声道声音信号进行一第一信号混合处理，进而形成一声音信号，该声音信号的取样频率为一第一频率；对该声音信号进行半频段滤波的一降频处理，进而形成一降频声音信号，该降频声音信号的取样频率为一第二频率，该第二频率低于该第一频率；对该降频声音信号进行一人声语音加强运算，进而形成一语音加强声音信号；对该语音加强声音信号进行一升频处理，进而形成一升频声音信号，该升频声音信号的取样频率为该第一频率；以及将该升频声音信号与该左声道声音信号进行一第二信号混合处理和与该右声道声音信号进行一第三信号混合处理后，进行信号输出。

本发明另一方面为一种人声语音加强装置，该装置包含有：一降频器，用以对取样频率为一第一频率的多媒体播放的一声音信号进行半频段滤波的一降频处理，进而形成一降频声音信号，该降频声音信号的取样频率为一第二频率，该第二频率低于该第一频率；一语音加强运算器，连接于该降频器，用以对该降频器所形成的该降频声音信号进行一人声语音加强运算，进而形成一语音加强声音信号；一升频器，连接于该语音加强运算器，用以对该语音加强运算器所形成的该语音加强声音信号进行一升频处理，进而形成一升频声音信号，该升频声音信号的取样频率为该第一频率；一第一混合器，用以将一左声道声音信号和一右声道声音信号进行一第一信号混合处理，进而形成该声音信号；以及一第二混合器和一第三混合器，用以将该升频声音信号与该左声道声音信号进行一第二信号混合处理和与该右声道声音信号进行一第三信号混合处理后，进行信号输出。

本发明另一方面为一种人声语音加强装置，该装置包含有：一第一混合器，用以将一左声道声音信号和一右声道声音信号进行一第一信号混合处理，进而形成一声音信号；一语音加强运算器，用以对该声音信号进行一人声语音加强运算，进而形成一语音加强声音信号；以及一第二混合器和一第三混合器，用以将该语音加强声音信号与该左声道声音信号进行一第二信号混合处理和与该右声道声音信号进行一第三信号混合处理后，进行信号输出。

附图说明

图1为一惯用技术加强特定频段的示意图。

图2为另一惯用技术进行人声语音加强的***运行示意图。

图3为可运行出各种音效处理功能的多媒体播放装置的示意图。

图4为本发明的人声语音加强装置30的示意图。

图5为本发明第一优选实施例的流程图。

图6为FIR形式的一半频段滤波器的示意图。

图7(a)至图7(c)为升频处理的补进取样值与滤除高频部分的运行示意图。

图8为本发明第二优选实施例的流程图。

图9为一IIR形式的串叠双二阶滤波器的示意图。

其中，附图标记说明如下：

10语音加强运算 20音效数字信号处理器

201～204声音数字处理音效频道一～四

211～215信号输入 200多任务器

23***存储器 30人声语音加强装置

301第一混合器 302第二混合器

303第三混合器 311第一延迟器

312第二延迟器 32第一低通滤波器

320～3222延迟器 3200加法器

33降频器 34语音加强运算器

35升频器 36第二低通滤波器

37增益器 V1声音信号

V2滤除高频声音信号 V3降频声音信号

V4语音加强声音信号 V5升频声音信号

V6语音加强与滤除高频声音信号

f1、f2、f3曲线

S0～S5、S0’～S4’、S0”～S4”取样值

具体实施方式

本发明通过下列附图及说明，以获得一更深入的了解：

如现有技术所述，在惯用技术中已有针对人声语音的频段进行强化的技术，并已应用在具有声音播放功能的相关装置或设备上，例如电视、计算机、手机等，而本发明的目的在于改善惯用技术中对于语音强化功能的运算过程所会造成的耗能处理与***存储器耗用的问题，另外本发明仍继续利用惯用的语音强化(Speech Enhancement)技术中既有的人声语音加强运算功能，也就是经由使用一语音加强运算模块或语音加强运算器，利用傅立叶转换的运算而能在频道领域下对特定的频段进行加强或消减的功能，其目的除了在于能将人声语音进行强化而能和其它背景声、杂声有明显而清晰的对比外，还能有效地改善惯用技术的大量耗用处理器资源及效能与***存储器资源耗用等问题。

请参阅图3，为一可运行出各种音效处理功能的多媒体播放装置的示意图，该多媒体播放装置可为一数字电视机，使用者能够经由相关的使用者接口或于一屏幕显示(On Screen Display(简称OSD))设定菜单上进行和声音显示效果有关的设定控制或偏好调整。此装置主要是利用一音效数字信号处理器20，来对多种声音信号进行数字处理，其声音信号输入可视该处理器20所能处理的类型或格式而有不同数量的信号输入，如图标的声音信号输入211～215可包含有：由声音解码器(Audio Decoder)的信号输入、新力/飞利浦数字接口(SONY/PHILIPS Digital Interface，简称SPDIF)格式的信号输入、高分辨率多媒体接口(High Definition Multimedia Interface，简称HDMI)格式的信号输入、芯片间声音(Inter-IC Sound，简称I2S)格式的信号输入、模拟数字转换(Analog Digital Change)格式的信号输入等。而一***存储器23则能提供运算处理上的存储器资源。

这些信号可为数字格式信号，或由模拟转换为数字格式后输入，并由一多任务器200输至其中的多种声音数字处理音效频道一～四201～204内进行处理与输出。其中各音效频道依处理功能的不同可包含有：音量控制(Volume Control)、低音调整(Bass Adjustment)、高音调整(Treble Adjustment)、环绕(Surround)、语音清晰(Superior Voice)等，而使用者控制或调整该设定菜单后便能启动对应的音效处理功能，同理，该音效频道的数目为根据该处理器20所能处理的功能而定。

本发明的人声语音加强方法便可应用在上述的多媒体播放装置上，进一步来说，本发明的方法与应用是将上述多种声音数字处理音效频道中和该语音清晰(Superior Voice)功能有关的频道，也就是能进行其语音强化功能处理的频道，加以改善其中的运算处理方式，从而能够使得使用者在将本发明所设计的人声语音加强方法所对应的音效频道启动之后，便能得到人声明显而清晰的输出效果。

请参阅图4，为本发明的一人声语音加强装置30的优选实施例示意图。承上所述，该人声语音加强装置30可应用于这些音效频道中和语音加强功能有关的其中的一个频道与对应的输入构造中，且经本发明的该人声语音加强装置30处理后的声音信号也可由该图3所示的构造加以输出。如图4所示，该人声语音加强装置30主要设置了有：三个混合器301～303、两个延迟器311～312、两个低通滤波器(Low Pass Filter)32和36、一降频器33、一语音加强运算器34、以及一升频器35，而在此图中也显示了各单元彼此间的信号连接关系。

而首先，我们将所输入至该人声语音加强装置30中的一左声道声音信号和一右声道声音信号(可为这些信号输入211～215中同时以左右二声道传送的一信号输入)利用该第一混合器301进行一第一信号混合处理而形成一声音信号V1，而该声音信号V1便为本发明所要进行语音加强的运算处理对象。

于此，相较于现有技术的将单声道输入的声音信号分别应用在左右两声道上的处理，本发明能将运算过程上所可能耗用该***存储器23(可为DRAM或SRAM)的资源减少了一半，这是因为若对该左声道和右声道声音信号个别进行运算处理时，该***存储器23便需要分别对这两信号各提供一部分的记忆空间以进行运算，且该处理器20于运算所需的运算效能也包括了对左声道和右声道声音信号的处理过程，但本发明只需对单一的该声音信号V1进行运算处理即可，且该第一信号混合处理可为直接将该左声道和右声道声音信号相加后再除以2而成为该声音信号V1，因此其混合后仍具有完整的信号内容。所以除了运算过程上的记忆资源的耗用或该处理器20运算所需的运算效能等，便都仅为惯用技术的一半而已，因而能够有效解决惯用技术的问题。

另外，我们将所要作语音强化处理的信号降频，详细来说在不影响其声音输出效果的条件下来减少待处理信号的取样频率，上述方法不但在降频后于频段上仍包含人声语音的大部分能量，不会影响人声语音的品质，还能够进一步地减少其运算量，而能大幅改善存储器及处理器运算效能耗用的问题，其具体实施方式说明如下。

同时参阅图5，为本发明第一优选实施例的流程图，其中的步骤S11便为上述的该第一信号混合处理的过程。而该左声道和右声道声音信号在进行输入时，其频率取样比(FS rate)或所谓的取样频率为一第一频率，如现有技术所述，针对语音强化的频率取样比可为44.1K、48K、32K赫兹(Hz)等，而所产生的该声音信号V1也具有相同的该第一频率；而在此实施例中，我们设计该左、右声道声音信号以及该声音信号V1具有的该第一频率，为在一单位时间内具有n个取样值的取样频率。

然而，步骤S12为本发明的降频处理流程，我们先对该声音信号V1进行低通滤波处理，再作降频的处理。在此例中，我们利用该第一低通滤波器32来对该声音信号V1进行一第一低通滤波处理，而形成一滤除高频声音信号V2，且仅将该声音信号V1的高频部分滤除而未改变其取样频率，因此，该滤除高频声音信号V2在单位时间内仍具有n个取样值。

然后，由该降频器33将该滤除高频声音信号V2进行降频处理，将原单位时间内的n个取样值，降低为n/2个取样值，而形成一降频声音信号V3；举例来说，在此第一优选实施例中，我们设计将所要处理的取样频率降为原取样频率的一半，而该第一低通滤波器32便可选用一半频段滤波器(Half-Band Filter)，而能针对该降频器33进行取样频率降一半的处理过程，用以防止高频信号影响(alias)降频处理。在图6中显示出了该第一低通滤波器32为一半频段滤波器的示意图，如图所示，该滤波器包含有23个延迟器320～3222和一加法器3200，由于这些延迟器有一半的计算系数为0(即相隔一个的系数，仅中央的系数不为0而已)，所以能够有效减少运算量，而23个延迟器与其系数的乘积并相加的结果便为其低通滤波的结果。

承上的流程图，在步骤S12中我们便是使用可将取样频率降一半的该降频器33来对该滤除高频声音信号V2进行一降频处理而形成该降频声音信号V3，该降频声音信号V3的取样频率为一第二频率，我们设计降频后的该第二频率为原来的该第一频率的m分之一，而在此实施例中是将m取为2，也就是降了一半，从而使得所形成的该降频声音信号V3于该单位时间内具有n/2个取样值。

在此实施例中，我们使用的该第一频率为48K赫兹，所以降频后的第二频率便为24K赫兹，同时该降频处理也将原本n个取样值中每m个取样值中消减(m-1)个取样值，举例来说，我们将m取为2，便是在每2个取样值中消减1个取样值，若假设原本的n为1024，则新的取样值在该单位时间内有m分之n个取样值便缩减成为512个取样值。因此，在作语音强化的傅立叶转换运算时所取的取样值个数和其取样频率一样也作了减半的处置，所以其频域的分辨率(Frequency Resolution)(即为对应的频率除以其取样值个数)仍是相同的；是故，经由降频与取样值个数缩减的处理仍旧能保有和原本信号相同频域分辨率的表现。

接着，在步骤S13中便是利用该语音加强运算器34来对该降频声音信号V3进行一人声语音加强运算而形成一语音加强声音信号V4。而在此实施例中，该语音加强运算器34所进行的该人声语音加强运算为目前惯用的技术，例如：将该人声语音加强运算采用一种数字信号处理的频谱消减(Spectral Subtraction)逼近的人声语音加强运算，来对所输入的该降频声音信号V3作处理；由于前一步骤的降频处理，我们可以有效的将该语音加强运算器34所要进行的运算量和对于该***存储器23所要使用到的资源空间等，都可以达到降为原先一半的情形，从而能够改善存储器及处理器运算效能耗用等问题。

另外，该人声语音加强运算的处理并未改变该降频声音信号V3的频率，所以所输出的该语音加强声音信号V4和该降频声音信号V3具有相同的该第二频率。而为了将所处理好的该语音加强声音信号V4进一步加入原本包含人声与背景声的左右声道声音信号中以正确地输出，而接着在步骤S14中将该语音加强声音信号V4作对应的升频和低通滤波等处理过程。因此接着便先利用该升频器35对该语音加强声音信号V4进行一升频处理而形成一升频声音信号V5，而在此实施例中由于之前我们先作了频率减半的处理，因此相对的此时的该升频处理便为将其信号的频率升为两倍，使得该升频声音信号V5的取样频率成为原来的该第一频率，同时使该升频声音信号V5于该单位时间内能具有原来的n个取样值。

在此实施例中，我们将该语音加强声音信号V4的第二频率(24K赫兹)升两倍(因m取为2)而成为该升频声音信号V5的第一频率(48K赫兹)，同时该升频处理也将每两个取样值之间补进(m-1)个数值为零的取样值而成为原来的n个取样值，即在此例中将缩减后的512个取样值在每两个取样值之间补进1个取样值而成为原来的1024个取样值，而利用此一补进取样值个数的作法便能完成其升频过程。

接着，便是再利用该第二低通滤波器36来对该升频声音信号V5进行一第二低通滤波处理而形成一语音加强与滤除高频声音信号V6，其中在此例中的该第二低通滤波器36可和该第一低通滤波器32一样采用相同的该半频段滤波器(Half-Band Filter)，而所形成的该语音加强与滤除高频声音信号V6便具有原来的n个取样值，即此实施例中的1024个取样值，如步骤S14。

而在图7(a)至(c)的示意图中表示了上述利用补进取样值个数与滤除高频的作法来完成该升频处理与该第二低通滤波处理，其中的一曲线f1可表为一低频的频率，而一曲线f2为一高频的频率，在该曲线f1上有6个取样值S0～S5，当我们要将低频的频率升至高频的频率时，可对该曲线f1的每两个取样值之间补进其值为0的取样值S0’～S4’，而形成该曲线f2，如图7(a)所示，接着便可经由该第二低通滤波器36运算而获得增补取样值个数S0”～S4”，如图7(b)，最后，结合这些取样值S0～S5与该增补取样值S0”～S4”，即可回复至原始取样频率(即第一频率)的一曲线f3，如图7(c)。

而在此实施例的步骤S15中我们还设计有一增益器37，用以将该语音加强与滤除高频声音信号V6进行一信号增益控制的处理，而能将该语音加强与滤除高频声音信号V6加以调整。举例而言，我们可利用该增益器37再对其信号进行调整放大或调整缩小，而其中该增益器37所能产生的信号加强放大为一种正的信号增益值(gain)，也就是能将我们所要加回去的人声语音部分所表现出的音量再加以控制其放大的比率，而能使得人声语音加强的效果更加明显。

而最后将处理完的信号加回原信号的步骤，由于在上述的滤波及人声语音加强运算过程中会造成相位延迟(Group Delay)，因此我们可使用该第一延迟器311和第二延迟器312来分别将原来的该左声道和右声道声音信号进行一第一信号延迟处理和一第二信号延迟处理，且在此实施例中，这些信号延迟处理为延迟一相同的时间后再将该左声道和右声道声音信号进行输出，并使用该第二混合器302和该第三混合器303将信号调整后的该语音加强与滤除高频声音信号V6分别与延迟后的该左声道声音信号和该右声道声音信号进行一第二信号混合处理和一第三信号混合处理后，也就是直接将上述进行完人声语音强化的频段分别加回该左声道和右声道声音信号之中后，便能将所需的音效结果进行信号输出而达成所述目的，如步骤S15。

综上所述，我们除了可以先将左右两声道进行混合并只对单一的声音信号进行处理以减少其处理器大量运算资源以提高效能与减少其存储器资源需求外，还可再进一步作降频处理而能再减少运算量，因而能更加强上述的效能，同时，这样的处理方式并不会影响最后人声语音强化后的背景声音，而能够正常的在原本的声音输出上有效地加强人声语音的能量，从而能成功解决与改善现有技术所提及的问题。

另外，在本发明的第一优选实施例中是以频率减半的降频处理与对应的频率增两倍的升频处理作举例说明，然而，我们还可以更进一步地以频率减为三分之一(后续对应的升频处理便为增三倍)或频率减为四分之一(后续对应的升频处理便为增四倍)的处理，来减少更多的处理器运算量与存储器资源耗用，也就是说我们可将本发明中的该m值取为大于1的正整数(在本发明概念中m和n都为正整数)，例如：2、3、4等，来进行不同程度的运算处理，然而需注意的是若该m值取的越大时，则所需滤除的高频频段也就越大，而可能会影响人声语音频段；因此，将m值最多取为4的设计为较可能的实际运算条件。

而在本发明的第二优选实施例中，我们便采用将所要作信号处理的频率降为原来的三分之一，且对应的升频处理则增三倍作举例说明，其流程图如图8所示；在此第二优选实施例中的步骤S21、S23、S25和第一优选实施例的步骤S11、S13、S15相同，第二优选实施例和第一优选实施例的差别仅在于步骤S22中将降频处理以减为三分之一的方式进行，并对应地于步骤S24中将升频处理以增三倍的方式进行。

另外，所使用的低通滤波器也需加以调整；在此第二优选实施例中使用一种由IIR形式的串叠双二阶滤波器(IIR Cascade Bi-Quad Filter)为主所构成的一抽样滤波器(Decimation Filter)或一插值滤波器(Interpolation Filter)而能表现出较佳的效果；图9所示为此种滤波器的示意图，而如图中虚线所示的部分便为主要的IIR形式的串叠双二阶滤波器的构造(其中系数a0～a2、b1～b2为运算时所使用的系数)；我们将此种滤波器使用在上述图4中的这些低通滤波器32、36，如此便能将此第二优选实施例中所指定的降频与升频的处置有效地达成。

因此，综上所述，利用惯用技术的语音加强运算可对相关声音输出接口的声音信号中的人声语音部分进行强化，且通过本发明的信号混合、滤波与降频所组成的信号处理构造和处理方式，能够更进一步地降低处理器的运算量及***存储器的耗用，有效地增加整体***的效能，而能改善与解决惯用技术的问题，因而能成功地达到本发明的主要目的。

任何熟悉本技术领域的技术人员，可在运用与本发明相同目的的前提下，使用本发明所揭示的概念和实施例变化来作为设计和改进其它一些方法的基础。这些变化、替代和改进不能背离权利要求所限定的本发明的保护范围。因此，本发明由本领域普通技术人员任施匠思而为诸般修饰，然而都不脱离随附的权利要求所欲保护的范围。

Claims

1.一种人声语音加强方法，应用于一人声语音加强装置上，该方法包含下列步骤：

接收多媒体播放的一左声道声音信号和一右声道声音信号，并将该左声道声音信号和该右声道声音信号进行一第一信号混合处理，进而形成一声音信号，该声音信号的取样频率为一第一频率；

对该声音信号进行半频段滤波的一降频处理，进而形成一降频声音信号，该降频声音信号的取样频率为一第二频率，该第二频率低于该第一频率；

对该降频声音信号进行一人声语音加强运算，进而形成一语音加强声音信号；

对该语音加强声音信号进行一升频处理，进而形成一升频声音信号，该升频声音信号的取样频率为该第一频率；以及

将该升频声音信号与该左声道声音信号进行一第二信号混合处理和与该右声道声音信号进行一第三信号混合处理后，进行信号输出。

2.如权利要求1所述的人声语音加强方法，其特征是该方法还包含下列步骤：在将该升频声音信号与该左声道声音信号进行该第二信号混合处理和与该右声道声音信号进行该第三信号混合处理以进行信号输出的步骤中，将该左声道声音信号先进行一第一信号延迟处理，并且将该右声道声音信号先进行一第二信号延迟处理。

3.如权利要求1所述的人声语音加强方法，其特征是该方法还包含下列步骤：在将该升频声音信号与该左声道声音信号进行该第二信号混合处理和与该右声道声音信号进行该第三信号混合处理以进行信号输出的步骤中，将该升频声音信号先进行一信号增益控制。

4.如权利要求1所述的人声语音加强方法，其特征是该方法还包含下列步骤：

在该降频处理之前，对该声音信号进行一第一低通滤波处理，进而形成一滤除高频声音信号；以及

在该升频处理之后，对该升频声音信号进行一第二低通滤波处理，进而形成一语音加强与滤除高频声音信号。

5.一种人声语音加强装置，该装置包含有：

一降频器，用以对取样频率为一第一频率的多媒体播放的一声音信号进行半频段滤波的一降频处理，进而形成一降频声音信号，该降频声音信号的取样频率为一第二频率，该第二频率低于该第一频率；

一语音加强运算器，连接于该降频器，用以对该降频器所形成的该降频声音信号进行一人声语音加强运算，进而形成一语音加强声音信号；

一升频器，连接于该语音加强运算器，用以对该语音加强运算器所形成的该语音加强声音信号进行一升频处理，进而形成一升频声音信号，该升频声音信号的取样频率为该第一频率；

一第一混合器，用以将一左声道声音信号和一右声道声音信号进行一第一信号混合处理，进而形成该声音信号；以及

一第二混合器和一第三混合器，用以将该升频声音信号与该左声道声音信号进行一第二信号混合处理和与该右声道声音信号进行一第三信号混合处理后，进行信号输出。

6.如权利要求5所述的人声语音加强装置，其特征是该装置还包含有一第一延迟器和一第二延迟器，用以将该左声道声音信号先进行一第一信号延迟处理，并且将该右声道声音信号先进行一第二信号延迟处理后，输入至该第二混合器和该第三混合器。

7.如权利要求5所述的人声语音加强装置，其特征是该装置还包含有一增益器，用以将该升频声音信号进行一信号增益控制，进而输入至该第二混合器和该第三混合器。

8.如权利要求5所述的人声语音加强装置，其特征是该装置还包含：

一第一低通滤波器，用以在该降频处理之前，对该声音信号进行一第一低通滤波处理，进而形成一滤除高频声音信号；以及

一第二低通滤波器，用以在该升频处理之后，对该升频声音信号进行一第二低通滤波处理，进而形成一语音加强与滤除高频声音信号。

9.一种人声语音加强装置，该装置包含有：

一第一混合器，用以将一左声道声音信号和一右声道声音信号进行一第一信号混合处理，进而形成一声音信号，该声音信号的取样频率为一第一频率；

一语音加强运算器，用以对该声音信号进行一人声语音加强运算，进而形成一语音加强声音信号；以及

一第二混合器和一第三混合器，用以将该语音加强声音信号与该左声道声音信号进行一第二信号混合处理和与该右声道声音信号进行一第三信号混合处理后，进行信号输出，其中，该第一混合器输出的该声音信号进行一降频处理，进而形成一降频声音信号，该降频声音信号的取样频率为一第二频率，该第二频率低于该第一频率，该语音加强运算器输出的该语音加强声音信号进行一升频处理，进而形成一升频声音信号后进行该第二信号混合处理与该第三信号混合处理，该升频声音信号的取样频率为该第一频率。