CN111757240A - 音频处理方法与音频处理*** - Google Patents

音频处理方法与音频处理*** Download PDF

Info

Publication number
CN111757240A
CN111757240A CN201910232367.9A CN201910232367A CN111757240A CN 111757240 A CN111757240 A CN 111757240A CN 201910232367 A CN201910232367 A CN 201910232367A CN 111757240 A CN111757240 A CN 111757240A
Authority
CN
China
Prior art keywords
curve
signal
right channel
left channel
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910232367.9A
Other languages
English (en)
Other versions
CN111757240B (zh
Inventor
虞登翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Realtek Semiconductor Corp
Original Assignee
Realtek Semiconductor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Realtek Semiconductor Corp filed Critical Realtek Semiconductor Corp
Priority to CN201910232367.9A priority Critical patent/CN111757240B/zh
Publication of CN111757240A publication Critical patent/CN111757240A/zh
Application granted granted Critical
Publication of CN111757240B publication Critical patent/CN111757240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

本发明涉及一种音频处理方法与音频处理***。该音频处理方法,包含:提供输入音频;进行转换步骤,以将输入音频转换至频域;对输入音频所对应之振幅频谱进行平移步骤,以取得平移振幅信号;对输入音频所对应之相位频谱进行第一宽广化步骤与第二宽广化步骤,以分别取得左声道分离相位信号与右声道分离相位信号;对平移振幅信号与左声道分离相位信号进行第一逆转换步骤且对平移振幅信号与右声道分离相位信号进行第二逆转换步骤,以分别取得对应至时域之已优化左声道输出音频与已优化右声道输出音频。

Description

音频处理方法与音频处理***
技术领域
本公开实施例是有关于一种音频处理方法与音频处理***,且特别是有关于一种让声音听起来更宽广且更立体之音频处理方法与音频处理***。
背景技术
当人听到由一音源产生的声音信号时,此声音信号通常会在两个不同的时间到达人的左耳与右耳,且具有不同的音量大小。人的大脑解读这些时间和音量大小的差异,而产生一听觉场景(auditory scene)。立体声(stereo)是一种听觉场景的产生方法,其通过多个独立音效信道来提供声音信号至多个扬声器,这些扬声器以对称的方式来排列,如此扬声器可产生听觉场景。一般而言,立体声通过双声道来实现。
发明内容
本公开之目的在于提供一种音频处理方法与音频处理***,以优化输入音频的听觉场景。
根据本公开之上述目的,提出一种音频处理方法,包含:提供输入音频,其中输入音频为单声道声音信号;对输入音频进行转换步骤,以将输入音频由时域转换至频域,从而取得输入音频所对应之振幅频谱与相位频谱;提供处理函数组,其中处理函数组包含平移角度曲线(panning angle curve)、左声道分离曲线(separation curve)与右声道分离曲线;对振幅频谱进行平移(panning)步骤,以根据平移角度曲线来取得平移振幅信号;对相位频谱进行第一宽广化(broader)步骤,以根据左声道分离曲线来取得左声道分离相位信号;对相位频谱进行第二宽广化步骤,以根据右声道分离曲线来取得右声道分离相位信号;对平移振幅信号与左声道分离相位信号进行第一逆转换步骤,以取得对应至时域之已优化左声道输出音频;以及对平移振幅信号与右声道分离相位信号进行第二逆转换步骤,以取得对应至时域之已优化右声道输出音频。
在一些实施例中,上述平移角度曲线为横轴为时间、纵轴为平移角度(panningangle)的曲线函数;上述左声道分离曲线与右声道分离曲线皆为横轴为正频谱频率、纵轴为分离相位角(phase angle)的曲线函数。
在一些实施例中,上述平移步骤乃是先根据平移角度曲线来计算出平移曲线(panning curve),再将振幅频谱与平移曲线相乘,以取得平移振幅信号;上述第一宽广化步骤乃是将相位频谱与左声道分离曲线相加,以取得左声道分离相位信号;上述第二宽广化步骤乃是将相位频谱与右声道分离曲线相加,以取得右声道分离相位信号。
在一些实施例中,上述平移步骤乃是经由平移角度曲线来控制输入音频的每个音帧(frame)的平移角度;上述第一宽广化步骤与第二宽广化步骤乃是分别经由左声道分离曲线与右声道分离曲线来控制输入音频的每个音帧内相位频谱中不同频谱的相位角。
根据本公开之上述目的,另提出一种音频处理方法,包含:提供输入音频,其中输入音频包含左声道声音信号与右声道声音信号;对左声道声音信号进行第一转换步骤,以将左声道声音信号由时域转换至频域,从而取得左声道声音信号所对应之左声道振幅频谱与左声道相位频谱;对右声道声音信号进行第二转换步骤,以将右声道声音信号由时域转换至频域,从而取得右声道声音信号所对应之右声道振幅频谱与右声道相位频谱;提供处理函数组,其中处理函数组包含平移角度曲线、左声道分离曲线与右声道分离曲线;对左声道振幅频谱进行第一平移步骤,以根据平移角度曲线来取得左声道平移振幅信号;对右声道振幅频谱进行第二平移步骤,以根据平移角度曲线来取得右声道平移振幅信号;对左声道相位频谱进行第一宽广化步骤,以根据左声道分离曲线来取得左声道分离相位信号;对右声道相位频谱进行第二宽广化步骤,以根据右声道分离曲线来取得右声道分离相位信号;对左声道平移振幅信号与左声道分离相位信号进行第一逆转换步骤,以取得对应至时域之已优化左声道输出音频;以及对右声道平移振幅信号与右声道分离相位信号进行第二逆转换步骤,以取得对应至时域之已优化右声道输出音频。
在一些实施例中,上述平移角度曲线为横轴为时间、纵轴为平移角度的曲线函数;上述左声道分离曲线与右声道分离曲线皆为横轴为正频谱频率、纵轴为分离相位角的曲线函数。
在一些实施例中,上述第一平移步骤乃是先根据平移角度曲线来计算出平移曲线,再将左声道振幅频谱与平移曲线相乘,以取得左声道平移振幅信号;上述第二平移步骤乃是先根据平移角度曲线来计算出平移曲线,再将右声道振幅频谱与平移曲线相乘,以取得右声道平移振幅信号;上述第一宽广化步骤乃是将左声道相位频谱与左声道分离曲线相加,以取得左声道分离相位信号;上述第二宽广化步骤乃是将右声道相位频谱与右声道分离曲线相加,以取得右声道分离相位信号。
在一些实施例中,上述第一平移步骤乃是经由平移曲线来控制左声道声音信号的每个音帧的平移角度;上述第二平移步骤乃是经由平移曲线来控制右声道声音信号的每个音帧的平移角度;上述第一宽广化步骤乃是经由左声道分离曲线来控制左声道声音信号的每个音帧内相位频谱中不同频谱的相位角;上述第二宽广化步骤乃是经由右声道分离曲线来控制右声道声音信号的每个音帧内相位频谱中不同频谱的相位角。
根据本公开之上述目的,另提出一种音频处理***用以处理输入音频,其中输入音频为单声道声音信号,音频处理***包含:转换模块、处理函数模块、平移模块、宽广化模块、逆转换模块以及音频输出模块。转换模块用以对输入音频进行转换步骤,以将输入音频由时域转换至频域,从而取得输入音频所对应之振幅频谱与相位频谱。处理函数模块用以提供处理函数组,其中处理函数组包含平移角度曲线、左声道分离曲线与右声道分离曲线。平移模块用以:对振幅频谱进行平移步骤,以根据平移角度曲线来取得平移振幅信号。宽广化模块用以:对相位频谱进行第一宽广化步骤,以根据左声道分离曲线来取得左声道分离相位信号;以及对相位频谱进行第二宽广化步骤,以根据右声道分离曲线来取得右声道分离相位信号。逆转换模块用以:对平移振幅信号与左声道分离相位信号进行第一逆转换步骤,以取得对应至时域之已优化左声道输出音频;以及对平移振幅信号与右声道分离相位信号进行第二逆转换步骤,以取得对应至时域之已优化右声道输出音频。音频输出模块用以输出已优化左声道输出音频和已优化右声道输出音频。
根据本公开之上述目的,另提出一种音频处理***用以处理输入音频,其中输入音频包含左声道声音信号与右声道声音信号,音频处理***包含:转换模块、处理函数模块、平移模块、宽广化模块、逆转换模块以及音频输出模块。转换模块用以:对左声道声音信号进行第一转换步骤,以将左声道声音信号由时域转换至频域,从而取得左声道声音信号所对应之左声道振幅频谱与左声道相位频谱;以及对右声道声音信号进行第二转换步骤,以将右声道声音信号由时域转换至频域,从而取得右声道声音信号所对应之右声道振幅频谱与右声道相位频谱。处理函数模块用以提供处理函数组,其中处理函数组包含平移角度曲线、左声道分离曲线与右声道分离曲线。平移模块用以:对左声道振幅频谱进行第一平移步骤,以根据平移角度曲线来取得左声道平移振幅信号;以及对右声道振幅频谱进行第二平移步骤,以根据平移角度曲线来取得右声道平移振幅信号。宽广化模块用以:对左声道相位频谱进行第一宽广化步骤,以根据左声道分离曲线来取得左声道分离相位信号;以及对右声道相位频谱进行第二宽广化步骤,以根据右声道分离曲线来取得右声道分离相位信号。逆转换模块用以:对左声道平移振幅信号与左声道分离相位信号进行第一逆转换步骤,以取得对应至时域之已优化左声道输出音频;以及对右声道平移振幅信号与右声道分离相位信号进行第二逆转换步骤,以取得对应至时域之已优化右声道输出音频。音频输出模块用以输出已优化左声道输出音频和已优化右声道输出音频。
附图说明
通过阅读实施例的以下详细描述,且参考如下所附图示,可以更完整地理解本公开。
图1是绘示根据本公开的第一实施例之音频处理***的功能方框示意图。
图2a是绘示根据本公开的实施例之其中一种例示性的平移角度曲线。
图2b是绘示根据本公开的实施例之其中一种例示性的左声道分离曲线与右声道分离曲线。
图3是绘示根据本公开的第二实施例之音频处理***的功能方框示意图。
图4是根据本公开的第一实施例之音频处理***所对应之音频处理方法的流程示意图。
图5是根据本公开的第二实施例之音频处理***所对应之音频处理方法的流程示意图。
具体实施方式
下文是举实施例配合所附图式作详细说明,但所提供之实施例并非用以限制本发明所涵盖的范围,而结构运作之描述非用以限制其执行之顺序,任何由组件重新组合之结构,所产生具有均等功效的装置,皆为本发明所涵盖的范围。关于本文中所使用之『第一』、『第二』、…等,并非特别指次序或顺位的意思,其仅为了区别以相同技术用语描述的组件或操作。
请参照图1,其是绘示根据本公开的第一实施例之音频处理***100的功能方框示意图。音频处理***100用以处理外部输入之输入音频,以优化其音效。此输入音频为单声道声音信号。音频处理***100包含转换模块110、处理函数模块120、平移模块130、宽广化模块140、逆转换模块150与音频输出模块160。
音频处理***100的转换模块110系用以对输入音频(即:单声道声音信号)进行转换步骤,以将单声道声音信号由时域(time domain)转换至频域(frequency domain),从而取得单声道声音信号所对应之振幅频谱与相位频谱。在本公开的第一实施例中,转换模块110系利用傅立叶变换(Fourier Transform)来将单声道声音信号由时域转换至频域,但本公开的实施例并不受限于此。
音频处理***100的处理函数模块120用以提供处理函数组,其中处理函数组包含平移角度曲线(panning angle curve)、左声道分离曲线(separation curve)与右声道分离曲线。图2a是绘示根据本公开的实施例之其中一种例示性的平移角度曲线。在本公开的实施例中,如图2a所示,平移角度曲线为横轴为时间、纵轴为平移角度(panning angle)的曲线函数。在图2a中,平移角度系代表声音信号在左右方向上的角度,以指出声音信号的方向性。图2a所例示的平移角度曲线为正弦函数,且图2a所例示的平移角度曲线可用下式表示:
θ=0.01×sin70t (1)
其中θ代表平移角度,单位为弧度(radians),t代表时间,单位为秒。图2b系绘示根据本公开的实施例之其中一种例示性的左声道分离曲线与右声道分离曲线。在本公开的实施例中,如图2b所示,左声道分离曲线与右声道分离曲线皆为横轴为正频谱频率、纵轴为分离相位角(phase angle)的曲线函数。在图2b中,分离相位角度代表声音信号中在不同频率所对应之相位角之间的相位角度差值。图2b所例示的左声道分离曲线可用下式表示:
Figure BDA0002007121590000071
且图2b所例示的右声道分离曲线可用下式表示:
Figure BDA0002007121590000072
其中
Figure BDA0002007121590000073
代表分离相位角度,单位为弧度,s代表正频谱频率,单位为赫兹,
Figure BDA0002007121590000074
代表最大分离相位角度,f1与f2为默认之频率值,例如f1=700Hz,f2=0.5Hz,f1与f2可根据使用者需求来进行调整。由上方之左声道分离曲线和右声道分离曲线的表示式可知,本公开的实施例之左声道分离曲线和右声道分离曲线彼此反相,但本公开不限于此。应注意的是,在本公开的实施例中,图2a所例示的平移角度曲线以及图2b所例示左声道分离曲线与右声道分离曲线仅为例示,在实际施作上,用户可例如依据输入音频的形式和/或类别来选择相对应的平移角度曲线、左声道分离曲线与右声道分离曲线。
请回到图1,音频处理***100的平移模块130系用以:对单声道声音信号所对应之振幅频谱进行平移(panning)步骤,以根据平移角度曲线来取得平移振幅信号。在本公开的第一实施例中,平移步骤乃是先根据平移角度曲线来计算出平移曲线(panning curve),再将单声道声音信号所对应之振幅频谱与平移曲线相乘,以取得平移振幅信号。在本公开的实施例中,其中一种例示性的平移曲线可用下式表示:
Figure BDA0002007121590000081
其中θ为前述之平移角度。
在本公开的第一实施例中,平移步骤乃是经由平移角度曲线来控制单声道声音信号的每个音帧(frame)的平移角度(panning angle)。换言之,音频处理***100的平移模块130所进行之平移步骤可使得输出音频的发声位置听起来有变化,从而使得输出音频变得有位置感。值得一提的是,由于本公开的第一实施例能够通过平移角度曲线来控制输入音频的每个音帧(frame)的平移角度(panning angle),因此当平移角度曲线为连续曲线函数,则可让左右声道的输出音频能够平滑地切换。
音频处理***100的宽广化模块140包含左声道宽广化模块与右声道宽广化模块,左声道宽广化模块系用以:对单声道声音信号所对应之相位频谱进行第一宽广化步骤,以根据左声道分离曲线来取得左声道分离相位信号;右声道宽广化模块系用以:对单声道声音信号所对应之相位频谱进行第二宽广化步骤,以根据右声道分离曲线来取得右声道分离相位信号。在本公开的第一实施例中,第一宽广化步骤乃是将单声道声音信号所对应之相位频谱与左声道分离曲线相加,以取得左声道分离相位信号;第二宽广化步骤乃是将单声道声音信号所对应之相位频谱与右声道分离曲线相加,以取得右声道分离相位信号。
在本公开的第一实施例中,第一宽广化步骤与第二宽广化步骤乃是分别经由左声道分离曲线与右声道分离曲线来控制单声道声音信号的每个音帧(frame)内相位频谱中不同频谱的相位角(phase angle)。换言之,音频处理***100的宽广化模块140所进行之第一宽广化步骤与第二宽广化步骤可使得输出音频的声音听起来有立体感,从而使得输出音频变得有空间感。
音频处理***100的逆转换模块150系用以:对平移振幅信号与左声道分离相位信号进行第一逆转换步骤,以取得对应至时域之已优化左声道输出音频;以及对平移振幅信号与右声道分离相位信号进行第二逆转换步骤,以取得对应至时域之已优化右声道输出音频。在本公开的第一实施例中,上述第一逆转换步骤与第二逆转换步骤皆为逆傅立叶变换(Inverse Fourier Transform),但本公开之实施例并不受限于此。
音频处理***100的音频输出模块160系用以输出已优化左声道输出音频与已优化右声道输出音频。在本公开的第一实施例中,音频输出模块160为声卡(sound card),但本公开之实施例并不受限于此。
由上述之本公开的第一实施例可知,音频处理***100系对单声道声音信号进行处理,使单声道声音信号转变成立体声音信号。进一步而言,音频处理***100通过平移角度曲线来造出左右声道的音量变化,使得输出音频的声音位置听起来有变化,从而使得输出音频变得有位置感;音频处理***100通过左声道分离曲线与右声道分离曲线来造出左右声道的相位延迟(phase delay),使得输出音频的声音听起来有立体感,从而使得输出音频变得有空间感。具体而言,音频处理***100可使得单声道声音信号转变成立体声音信号,且使得所述立体声音信号的立体声音效果和宽广效果更为明显。
请参照图3,其是绘示根据本公开的第二实施例之音频处理***200的功能方框示意图。音频处理***100用以处理外部输入之输入音频,以优化其音效。此输入音频包含左声道声音信号与右声道声音信号。音频处理***200包含转换模块210、处理函数模块220、平移模块230、宽广化模块240、逆转换模块250与音频输出模块260。
音频处理***200的转换模块210用以:对左声道声音信号进行第一转换步骤,以将左声道声音信号由时域转换至频域,从而取得左声道声音信号所对应之左声道振幅频谱与左声道相位频谱;对右声道声音信号进行第二转换步骤,以将右声道声音信号由时域转换至频域,从而取得右声道声音信号所对应之右声道振幅频谱与右声道相位频谱。在本公开的第二实施例中,上述第一转换步骤与第二转换步骤皆为傅立叶变换,但本公开的实施例并不受限于此。
音频处理***200的处理函数模块220用以提供处理函数组,其中处理函数组包含平移角度曲线(例如如图2a所例示者)、左声道分离曲线与右声道分离曲线(例如如图2b所例示者)。
音频处理***200的平移模块230包含左声道平移模块与右声道平移模块,左声道平移模块用以:对左声道声音信号所对应之左声道振幅频谱进行第一平移步骤,以根据平移角度曲线来取得左声道平移振幅信号;右声道平移模块系用以:对右声道声音信号所对应之右声道振幅频谱进行第二平移步骤,以根据平移角度曲线来取得右声道平移振幅信号。在本公开的第二实施例中,第一平移步骤乃是先根据平移角度曲线来计算出平移曲线,再将左声道声音信号所对应之左声道振幅频谱与平移曲线相乘,以取得左声道平移振幅信号;第二平移步骤乃是先根据平移角度曲线来计算出平移曲线,再将右声道声音信号所对应之右声道振幅频谱与平移曲线相乘,以取得右声道平移振幅信号。
在本公开的第二实施例中,第一平移步骤与第二平移步骤乃是经由平移角度曲线来控制左声道声音信号的每个音帧(frame)的平移角度(panning angle)且经由平移角度曲线来控制右声道声音信号的每个音帧的平移角度。换言之,音频处理***200的平移模块230所进行之第一平移步骤与第二平移步骤可使得输出音频的发声位置听起来有变化,从而使得输出音频变得有位置感。值得一提的是,由于本公开的第二实施例能够通过平移角度曲线来控制输入音频的每个音帧(frame)的平移角度(panning angle),因此当平移角度曲线为连续曲线函数,则可让左右声道的输出音频能够平滑地切换。
音频处理***200的宽广化模块240包含左声道宽广化模块与右声道宽广化模块,左声道宽广化模块用以:对左声道声音信号所对应之左声道相位频谱进行第一宽广化步骤,以根据左声道分离曲线来取得左声道分离相位信号;右声道宽广化模块用以:对右声道声音信号所对应之右声道相位频谱进行第二宽广化步骤,以根据右声道分离曲线来取得右声道分离相位信号。在本公开的第二实施例中,第一宽广化步骤乃是将左声道声音信号所对应之左声道相位频谱与左声道分离曲线相加,以取得左声道分离相位信号;第二宽广化步骤乃是将右声道声音信号所对应之右声道相位频谱与右声道分离曲线相加,以取得右声道分离相位信号。
在本公开的第二实施例中,第一宽广化步骤与第二宽广化步骤乃是经由左声道分离曲线来控制左声道声音信号的每个音帧(frame)的相位角(phase angle)且经由右声道分离曲线来控制右声道声音信号的每个音帧内相位频谱中不同频谱的相位角。换言之,音频处理***200的宽广化模块240所进行之第一宽广化步骤与第二宽广化步骤可使得输出音频的声音听起来有立体感,从而使得输出音频变得有空间感。
音频处理***200的逆转换模块250用以:对左声道平移振幅信号与左声道分离相位信号进行第一逆转换步骤,以取得对应至时域之已优化左声道输出音频;以及对右声道平移振幅信号与右声道分离相位信号进行第二逆转换步骤,以取得对应至时域之已优化右声道输出音频。在本公开的第二实施例中,上述第一逆转换步骤与第二逆转换步骤皆为逆傅立叶变换(Inverse Fourier Transform),但本公开之实施例并不受限于此。
音频处理***200的音频输出模块260用以输出已优化左声道输出音频与已优化右声道输出音频。在本公开的第二实施例中,音频输出模块260为声卡(sound card),但本公开之实施例并不受限于此。
由上述之本公开的第二实施例可知,音频处理***200对立体声音信号进行处理。进一步而言,音频处理***200通过平移角度曲线来控制左右声道的音量变化,使得输出音频的声音位置听起来有变化,从而使得输出音频变得有位置感;音频处理***200通过左声道分离曲线与右声道分离曲线来控制左右声道的相位延迟(phase delay),使得输出音频的声音听起来有立体感,从而使得输出音频变得有空间感。具体而言,音频处理***200可使得所述立体声音信号的立体声音效果和宽广效果更为明显。
请参照图4,其是绘示根据本公开的第一实施例之音频处理***100所对应之音频处理方法300的流程示意图。在音频处理方法300中,首先进行步骤310,以提供输入音频。接着,进行步骤320,利用转换模块110来进行前述之本公开的第一实施例之转换步骤,以将单声道输入信号由时域转换至频域。接着,分别进行步骤330、步骤340、步骤350与步骤360,于步骤330,利用平移模块130来进行前述之本公开的第一实施例之平移步骤,以根据平移角度曲线来取得平移振幅信号;于步骤340,利用宽广化模块140来进行前述之本公开的第一实施例之第一宽广化步骤,以根据左声道分离曲线来取得左声道分离相位信号;于步骤350,利用宽广化模块140来进行前述之本公开的第一实施例之第二宽广化步骤,以根据右声道分离曲线来取得右声道分离相位信号。接着,进行步骤360,利用逆转换模块150来进行前述之本公开的第一实施例之第一逆转换步骤与第二逆转换步骤,以取得对应至时域之已优化左声道输出音频与已优化右声道输出音频。然后,进行步骤370,利用音频输出模块160来输出已优化左声道输出音频和已优化右声道输出音频。
请参照图5,其是绘示根据本公开的第二实施例之音频处理***200所对应之音频处理方法400的流程示意图。在音频处理方法400中,首先进行步骤410,以提供输入音频。接着,进行步骤420,利用转换模块210来进行前述之本公开的第二实施例之第一转换步骤,以将左声道输入信号由时域转换至频域;利用转换模块210来进行前述之本公开的第二实施例之第二转换步骤,以将右声道输入信号由时域转换至频域。接着,分别进行步骤430、步骤440、步骤450与步骤460,于步骤430,利用平移模块230来进行前述之本公开的第二实施例之第一平移步骤,以根据平移角度曲线来取得左声道平移振幅信号;于步骤440,利用平移模块230来进行前述之本公开的第二实施例之第二平移步骤,以根据平移角度曲线来取得右声道平移振幅信号;于步骤450,利用宽广化模块240来进行前述之本公开的第二实施例之第一宽广化步骤,以根据左声道分离曲线来取得左声道分离相位信号;于步骤460,利用宽广化模块240来进行前述之本公开的第二实施例之第二宽广化步骤,以根据右声道分离曲线来取得右声道分离相位信号。接着,进行步骤470,利用逆转换模块250来进行前述之本公开的第二实施例之第一逆转换步骤与第二逆转换步骤,以取得对应至时域之已优化左声道输出音频与已优化右声道输出音频。然后,进行步骤480,利用音频输出模块260来输出已优化左声道输出音频和已优化右声道输出音频。
以上概述了数个实施例的特征,因此本领域技术人员可以更加了解本公开的实施方式。本领域技术人员应了解到,其可轻易地把本公开当作基础来设计或修改其他的工艺与结构,藉此实现和在此所介绍的这些实施例相同的目标及/或达到相同的优点。本领域技术人员也应可明白,这些等效的建构并未脱离本公开的精神与范围,并且他们可以在不脱离本公开精神与范围的前提下做各种的改变、替换与变动。
【符号说明】
100、200:音频处理***
110、210:转换模块
120、220:处理函数模块
130、230:平移模块
140、240:宽广化模块
150、250:逆转换模块
160、260:音频输出模块
300、400:音频处理方法
310~370、410~480:步骤。

Claims (10)

1.一种音频处理方法,包含:
提供一输入音频,其中该输入音频为单声道声音信号;
对该输入音频进行一转换步骤,以将该输入音频由时域转换至频域,从而取得该输入音频所对应之一振幅频谱与一相位频谱;
提供一处理函数组,其中该处理函数组包含一平移角度曲线、一左声道分离曲线与一右声道分离曲线;
对该振幅频谱进行一平移步骤,以根据该平移角度曲线来取得一平移振幅信号;
对该相位频谱进行一第一宽广化步骤,以根据该左声道分离曲线来取得一左声道分离相位信号;
对该相位频谱进行一第二宽广化步骤,以根据该右声道分离曲线来取得一右声道分离相位信号;
对该平移振幅信号与该左声道分离相位信号进行一第一逆转换步骤,以取得对应至时域之一已优化左声道输出音频;以及
对该平移振幅信号与该右声道分离相位信号进行一第二逆转换步骤,以取得对应至时域之一已优化右声道输出音频。
2.如权利要求1所述的音频处理方法,
其中该平移角度曲线为横轴为时间、纵轴为平移角度的曲线函数;
其中该左声道分离曲线与该右声道分离曲线皆为横轴为正频谱频率、纵轴为分离相位角的曲线函数。
3.如权利要求1所述的音频处理方法,
其中该平移步骤乃是先根据该平移角度曲线来计算出一平移曲线,再将该振幅频谱与该平移曲线相乘,以取得该平移振幅信号;
其中该第一宽广化步骤乃是将该相位频谱与该左声道分离曲线相加,以取得该左声道分离相位信号;
其中该第二宽广化步骤乃是将该相位频谱与该右声道分离曲线相加,以取得该右声道分离相位信号。
4.如权利要求1所述的音频处理方法,
其中该平移步骤乃是经由该平移角度曲线来控制该输入音频的每个音帧的平移角度;
其中该第一宽广化步骤与该第二宽广化步骤乃是分别经由该左声道分离曲线与该右声道分离曲线来控制该输入音频的每个音帧内相位频谱中不同频谱的相位角。
5.一种音频处理方法,包含:
提供一输入音频,其中该输入音频包含一左声道声音信号与一右声道声音信号;
对该左声道声音信号进行一第一转换步骤,以将该左声道声音信号由时域转换至频域,从而取得该左声道声音信号所对应之一左声道振幅频谱与一左声道相位频谱;
对该右声道声音信号进行一第二转换步骤,以将该右声道声音信号由时域转换至频域,从而取得该右声道声音信号所对应之一右声道振幅频谱与一右声道相位频谱;
提供一处理函数组,其中该处理函数组包含一平移角度曲线、一左声道分离曲线与一右声道分离曲线;
对该左声道振幅频谱进行一第一平移步骤,以根据该平移角度曲线来取得一左声道平移振幅信号;
对该右声道振幅频谱进行一第二平移步骤,以根据该平移角度曲线来取得一右声道平移振幅信号;
对该左声道相位频谱进行一第一宽广化步骤,以根据该左声道分离曲线来取得一左声道分离相位信号;
对该右声道相位频谱进行一第二宽广化步骤,以根据该右声道分离曲线来取得一右声道分离相位信号;
对该左声道平移振幅信号与该左声道分离相位信号进行一第一逆转换步骤,以取得对应至时域之一已优化左声道输出音频;以及
对该右声道平移振幅信号与该右声道分离相位信号进行一第二逆转换步骤,以取得对应至时域之一已优化右声道输出音频。
6.如权利要求5所述的音频处理方法,
其中该平移角度曲线为横轴为时间、纵轴为平移角度的曲线函数;
其中该左声道分离曲线与该右声道分离曲线皆为横轴为正频谱频率、纵轴为分离相位角的曲线函数。
7.如权利要求5所述的音频处理方法,
其中该第一平移步骤乃是先根据该平移角度曲线来计算出一平移曲线,再将该左声道振幅频谱与该平移曲线相乘,以取得该左声道平移振幅信号;
其中该第二平移步骤乃是先根据该平移角度曲线来计算出该平移曲线,再将该右声道振幅频谱与该平移曲线相乘,以取得该右声道平移振幅信号;
其中该第一宽广化步骤乃是将该左声道相位频谱与该左声道分离曲线相加,以取得该左声道分离相位信号;
其中该第二宽广化步骤乃是将该右声道相位频谱与该右声道分离曲线相加,以取得该右声道分离相位信号。
8.如权利要求5所述的音频处理方法,
其中该第一平移步骤乃是经由该平移角度曲线来控制该左声道声音信号的每个音帧的平移角度;
其中该第二平移步骤乃是经由该平移角度曲线来控制该右声道声音信号的每个音帧的平移角度;
其中该第一宽广化步骤乃是经由该左声道分离曲线来控制该左声道声音信号的每个音帧内相位频谱中不同频谱的相位角;
其中该第二宽广化步骤乃是经由该右声道分离曲线来控制该右声道声音信号的每个音帧内相位频谱中不同频谱的相位角。
9.一种音频处理***,用以处理一输入音频,其中该输入音频为单声道声音信号,该音频处理***包含:
一转换模块,用以对该输入音频进行一转换步骤,以将该输入音频由时域转换至频域,从而取得该输入音频所对应之一振幅频谱与一相位频谱;
一处理函数模块,用以提供一处理函数组,其中该处理函数组包含一平移角度曲线、一左声道分离曲线与一右声道分离曲线;
一平移模块,用以:
对该振幅频谱进行一平移步骤,以根据该平移角度曲线来取得一平移振幅信号;以及
一宽广化模块,用以:
对该相位频谱进行一第一宽广化步骤,以根据该左声道分离曲线来取得一左声道分离相位信号;以及
对该相位频谱进行一第二宽广化步骤,以根据该右声道分离曲线来取得一右声道分离相位信号;
一逆转换模块,用以:
对该平移振幅信号与该左声道分离相位信号进行一第一逆转换步骤,以取得对应至时域之一已优化左声道输出音频;以及
对该平移振幅信号与该右声道分离相位信号进行一第二逆转换步骤,以取得对应至时域之一已优化右声道输出音频;以及
一音频输出模块,用以输出该已优化左声道输出音频和该已优化右声道输出音频。
10.一种音频处理***,用以处理一输入音频,其中该输入音频包含一左声道声音信号与一右声道声音信号,该音频处理***包含:
一转换模块,用以:
对该左声道声音信号进行一第一转换步骤,以将该左声道声音信号由时域转换至频域,从而取得该左声道声音信号所对应之一左声道振幅频谱与一左声道相位频谱;以及
对该右声道声音信号进行一第二转换步骤,以将该右声道声音信号由时域转换至频域,从而取得该右声道声音信号所对应之一右声道振幅频谱与一右声道相位频谱;
一处理函数模块,用以提供一处理函数组,其中该处理函数组包含一平移角度曲线、一左声道分离曲线与一右声道分离曲线;
一平移模块,用以:
对该左声道振幅频谱进行一第一平移步骤,以根据该平移角度曲线来取得一左声道平移振幅信号;以及
对该右声道振幅频谱进行一第二平移步骤,以根据该平移角度曲线来取得一右声道平移振幅信号;
一宽广化模块,用以:
对该左声道相位频谱进行一第一宽广化步骤,以根据该左声道分离曲线来取得一左声道分离相位信号;以及
对该右声道相位频谱进行一第二宽广化步骤,以根据该右声道分离曲线来取得一右声道分离相位信号;
一逆转换模块,用以:
对该左声道平移振幅信号与该左声道分离相位信号进行一第一逆转换步骤,以取得对应至时域之一已优化左声道输出音频;以及
对该右声道平移振幅信号与该右声道分离相位信号进行一第二逆转换步骤,以取得对应至时域之一已优化右声道输出音频;以及
一音频输出模块,用以输出该已优化左声道输出音频和该已优化右声道输出音频。
CN201910232367.9A 2019-03-26 2019-03-26 音频处理方法与音频处理*** Active CN111757240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910232367.9A CN111757240B (zh) 2019-03-26 2019-03-26 音频处理方法与音频处理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910232367.9A CN111757240B (zh) 2019-03-26 2019-03-26 音频处理方法与音频处理***

Publications (2)

Publication Number Publication Date
CN111757240A true CN111757240A (zh) 2020-10-09
CN111757240B CN111757240B (zh) 2021-08-20

Family

ID=72671408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910232367.9A Active CN111757240B (zh) 2019-03-26 2019-03-26 音频处理方法与音频处理***

Country Status (1)

Country Link
CN (1) CN111757240B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080205659A1 (en) * 2007-02-22 2008-08-28 Siemens Audiologische Technik Gmbh Method for improving spatial perception and corresponding hearing apparatus
US20090046864A1 (en) * 2007-03-01 2009-02-19 Genaudio, Inc. Audio spatialization and environment simulation
CN101884065A (zh) * 2007-10-03 2010-11-10 创新科技有限公司 用于双耳再现和格式转换的空间音频分析和合成
US20140362998A1 (en) * 2013-06-11 2014-12-11 Harman Becker Automotive Systems Gmbh Directional coding conversion
CN104429102A (zh) * 2012-07-16 2015-03-18 高通股份有限公司 使用3d音频分层译码的扩音器位置补偿
CN104995681A (zh) * 2013-02-15 2015-10-21 高通股份有限公司 多声道音频数据的视频分析辅助产生

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080205659A1 (en) * 2007-02-22 2008-08-28 Siemens Audiologische Technik Gmbh Method for improving spatial perception and corresponding hearing apparatus
US20090046864A1 (en) * 2007-03-01 2009-02-19 Genaudio, Inc. Audio spatialization and environment simulation
CN101884065A (zh) * 2007-10-03 2010-11-10 创新科技有限公司 用于双耳再现和格式转换的空间音频分析和合成
CN104429102A (zh) * 2012-07-16 2015-03-18 高通股份有限公司 使用3d音频分层译码的扩音器位置补偿
CN104995681A (zh) * 2013-02-15 2015-10-21 高通股份有限公司 多声道音频数据的视频分析辅助产生
US20140362998A1 (en) * 2013-06-11 2014-12-11 Harman Becker Automotive Systems Gmbh Directional coding conversion

Also Published As

Publication number Publication date
CN111757240B (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
JP4921470B2 (ja) 頭部伝達関数を表すパラメータを生成及び処理する方法及び装置
EP2984852B1 (en) Method and apparatus for recording spatial audio
CA2835463C (en) Apparatus and method for generating an output signal employing a decomposer
CN114401481B (zh) 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
RU2018145527A (ru) Аудиоустройство и способ предоставления аудиоустройством аудио
JP2011517547A (ja) マイクロホン配列からのサラウンド・サウンド生成
US8229143B2 (en) Stereo expansion with binaural modeling
CN105874820A8 (zh) 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
KR20140138773A (ko) 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치
TW201514455A (zh) 產生多重頻道聲音訊號之方法,該訊號用於揚聲器頻道的l1頻道至不同的l2頻道,及產生多重頻道聲音訊號之裝置,該訊號用於揚聲器頻道的l1頻道至不同的l2頻道
CN112567765B (zh) 空间音频捕获、传输和再现
US20150319549A1 (en) Sound field adjustment filter, sound field adjustment apparatus and sound field adjustment method
CN109089203B (zh) 汽车音响***的多声道信号转换方法及汽车音响***
JP5931182B2 (ja) 付加的な出力チャンネルを提供するためのステレオ出力信号を生成する装置、方法およびコンピュータプログラム
KR20200143516A (ko) 회의를 위한 서브밴드 공간 처리 및 크로스토크 제거 시스템
EP3216234B1 (en) An audio signal processing apparatus and method for modifying a stereo image of a stereo signal
CN111757240B (zh) 音频处理方法与音频处理***
CN109036455B (zh) 直达声与背景声提取方法、扬声器***及其声重放方法
Fink et al. Downmixcompatibe conversion from mono to stereo in time-and frequency-domain
US11956615B2 (en) Spatial audio representation and rendering
TWI719429B (zh) 音訊處理方法與音訊處理系統
TWI692719B (zh) 音訊處理方法與音訊處理系統
CN111757239B (zh) 音频处理方法与音频处理***
JP2015076857A (ja) アップミックス装置、音響再生装置、音響増幅装置、及びプログラム
Faller Upmixing and beamforming in professional audio

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant