JP2009134260A - Voice musical sound false broadband forming device, voice speech musical sound false broadband forming method, and its program and its record medium - Google Patents
Voice musical sound false broadband forming device, voice speech musical sound false broadband forming method, and its program and its record medium Download PDFInfo
- Publication number
- JP2009134260A JP2009134260A JP2008230455A JP2008230455A JP2009134260A JP 2009134260 A JP2009134260 A JP 2009134260A JP 2008230455 A JP2008230455 A JP 2008230455A JP 2008230455 A JP2008230455 A JP 2008230455A JP 2009134260 A JP2009134260 A JP 2009134260A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency
- gain
- pseudo
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Abstract
Description
この発明は、狭帯域音声楽音信号を広帯域音声信号に広帯域化する音声楽音擬似広帯域化方法と、その装置と、そのプログラムと記録媒体に関する。 The present invention relates to a voice musical sound pseudo-wideband method for widening a narrowband voice musical sound signal into a wideband voice signal, an apparatus thereof, a program thereof, and a recording medium.
従来からの電話システムで伝送できる音声信号の周波数帯域は、約300Hzから3.4kHzである。従来の電話システムの音声符号化技術の目的は、伝送パラメータ量を最小化することにあり、符号化した音声信号の周波数帯域を超える音声を得ることは不可能である。ところで、最近の音響技術の発展及びディジタル信号処理技術の開発により、日常生活で使われる機器の音声の品質が向上して来ている。このような状況において、例えば電話の音質にも高音質を求める声がある。かかる要求に応える目的で音声擬似広帯域化装置や、その方法が用いられる。 The frequency band of voice signals that can be transmitted by a conventional telephone system is about 300 Hz to 3.4 kHz. The purpose of the speech coding technology of the conventional telephone system is to minimize the amount of transmission parameters, and it is impossible to obtain speech exceeding the frequency band of the coded speech signal. By the way, with recent development of acoustic technology and development of digital signal processing technology, the quality of voice of equipment used in daily life has been improved. In such a situation, for example, there is a voice that demands high sound quality for telephone sound quality. For the purpose of responding to such demands, a speech pseudo-wideband apparatus and its method are used.
従来の音声擬似広帯域化方法の手順を、図13に示してその方法を簡単に説明する。従来の音声擬似広帯域化方法は、アップサンプリング処理101、全波整流処理102、STFT分析(短時間フーリエ)処理103,105、バンドパスフィルタリング処理104、低域の周波数帯域の周波数スペクトルを高域に複写するコピー処理106、乗算処理107,108、STFT合成処理109、加算処理110、から成る。アップサンプリング処理101は、例えば8kHzでサンプリングされた狭帯域音声信号を、16kHzサンプリングの音声信号にアップサンプリングする。STFT分析処理105は、一定時間(フレーム)毎にアップサンプリングされた音声信号を周波数分析し、周波数スペクトルを生成する。コピー処理106は、低域の周波数スペクトルを高域の周波数帯域の周波数スペクトルとしてコピーする。乗算処理108は、高域の周波数スペクトルに一定の倍率を乗じてゲイン調整を行う。全波整流処理102から乗算処理107の過程は、狭帯域音声信号に含まれない低域の周波数スペクトルを生成するものである。全波整流処理102で生成された低域の周波数スペクトルは、高域の周波数スペクトルと同じように乗算部107において、一定倍率が乗算されてゲイン調整される。ゲイン調整された高域の周波数スペクトルと低域の周波数スペクトルは、STFT合成処理109で合成される。加算処理110は、狭帯域音声信号を周波数分析した周波数スペクトルに、ゲイン調整された低域と高域の周波数スペクトルを加算して擬似広帯域音声信号を生成する。
従来の音声擬似広帯域化方法は、狭帯域音声信号の周波数スペクトルに広帯域化した周波数範囲のスペクトルを加える際に、加算する周波数スペクトルに一定の倍率を乗じてゲインを調整する方法である。この方法では、雑音を発生させ、または音声を不明瞭にしてしまう課題があった。図14と図15に音声信号の周波数スペクトルの例を示す。横軸は周波数、縦軸は振幅である。図14(a)に、周波数の増加に伴って信号の振幅が減衰する例えば音声の有声部のような場合の周波数スペクトルを示す。コピー処理106が、この図14(a)の信号に一定倍率を乗じて高域の周波数スペクトルを生成すると、図14(b)に示すように4kHz付近で非常に小さくなる振幅が、4kHz以上で再び急激に立ち上がるスペクトル構造になる。このように低域信号と高域信号の境界で信号が極端に不連続になると雑音の原因になる。また、図15(a)に示す低域から高域に向かって振幅が増加する例えば音声の無声部のような周波数スペクトルの場合は、ある一定倍率を乗じて高域の信号を生成すると、図15(b)に示すように高域の振幅が小さくなることがある。この場合は、擬似広帯域音声の無声部が不明瞭となり音声が聞き取り難くなる。
The conventional speech pseudo-broadband method is a method of adjusting a gain by multiplying a frequency spectrum to be added by a fixed magnification when a spectrum in a frequency range that has been widened is added to the frequency spectrum of a narrowband speech signal. In this method, there is a problem that noise is generated or voice is obscured. 14 and 15 show examples of the frequency spectrum of the audio signal. The horizontal axis is frequency and the vertical axis is amplitude. FIG. 14A shows a frequency spectrum in the case of, for example, a voiced portion where the amplitude of the signal is attenuated as the frequency increases. When the
この発明は、このような点に鑑みてなされたものであり、雑音の原因を発生させず、また音声を不明瞭にしない音声楽音擬似広帯域化装置と、その方法と、プログラムと記録媒体を提供することを目的とする。 The present invention has been made in view of the above points, and provides a voice musical tone pseudo-wideband apparatus that does not cause noise and does not obscure voice, a method thereof, a program, and a recording medium The purpose is to do.
この発明による音声楽音擬似広帯域化装置は、周波数変換部と、高域信号生成部と、ゲイン決定部と、ゲイン乗算部と、結合部と、周波数逆変換部とを具備する。周波数変換部は、離散値化された狭帯域音声楽音信号を周波数領域の信号に変換して低域領域の信号を生成する。高域信号生成部は、低域領域の信号の一部または全部を複写して高域領域の信号を生成する。ゲイン決定部は、低域領域内の異なる範囲の信号のパワー比または振幅の絶対値和の比に基づいて、異なる範囲の低域側の信号のパワーまたは振幅の絶対値和が大きい場合には高域領域の信号に乗ずるゲイン係数を小さくし、高域側の信号のパワーまたは振幅の絶対値和が大きい場合にはゲイン係数を大きくするようにゲイン係数を決定する。ゲイン乗算部は、高域領域の信号にゲイン係数を乗じて強調高域信号を生成する。結合部は、低域領域の信号と強調高域信号を合わせて擬似広帯域周波数信号を生成する。周波数逆変換部は、擬似広帯域周波数信号を時間領域の擬似広帯域音声信号に変換して出力する。 The voice musical tone pseudo-wideband apparatus according to the present invention includes a frequency conversion unit, a high frequency signal generation unit, a gain determination unit, a gain multiplication unit, a coupling unit, and a frequency inverse conversion unit. The frequency converting unit converts the narrow band voice musical sound signal that has been converted into a discrete value into a frequency domain signal, and generates a low band signal. The high-frequency signal generator copies a part or all of the low-frequency signal to generate a high-frequency signal. Based on the ratio of the power ratio or the absolute value sum of the amplitudes of the signals in different ranges in the low frequency range, the gain determination unit determines whether the absolute value sum of the power or amplitude of the low frequency signals in the different ranges is large. The gain coefficient to be multiplied by the signal in the high frequency region is reduced, and when the sum of the absolute values of the power or amplitude of the high frequency signal is large, the gain factor is determined so as to increase the gain factor. The gain multiplication unit multiplies the high frequency region signal by a gain coefficient to generate an enhanced high frequency signal. The combining unit generates a pseudo wideband frequency signal by combining the low-frequency region signal and the enhanced high-frequency signal. The frequency inverse conversion unit converts the pseudo wideband frequency signal into a pseudo wideband audio signal in the time domain and outputs the converted signal.
この発明の音声楽音擬似広帯域化装置は、ゲイン決定部が低域領域内の異なる範囲の信号のパワー比または振幅の絶対値和の比に基づいてゲイン係数を決定する。図14(a)に示したような低域から高域に向かって信号の振幅が減衰する特性を示す音声信号の場合は、ゲイン係数を小さくする。このようにすると、擬似広帯域周波数信号のスペクトル構造を、高域になるほど振幅が低下する構造にすることができ、不連続点が強調され難くなる。この結果、雑音の発生を抑えることができる。また、図15(a)に示したような低域から高域に向かって振幅が増加する特性を示す音声信号の場合は、ゲイン係数を大きくする。すると、擬似広帯域周波数信号のスペクトル構造全体として、高域になるほど振幅が増加する連続性のある構造とすることができ、例えば無声音の明瞭度を向上させることができる。つまり、低域領域内の信号の特徴に応じてゲイン係数を可変することで、雑音の発生を防止すると共に無声部を聞き取り易くできるので、擬似広帯域音声の明瞭度を向上させることができる。 In the voice musical tone pseudo-broadband apparatus according to the present invention, the gain determination unit determines the gain coefficient based on the power ratio or the ratio of the absolute value sum of the amplitudes of signals in different ranges within the low frequency range. In the case of an audio signal having a characteristic in which the amplitude of the signal attenuates from the low range to the high range as shown in FIG. 14A, the gain coefficient is reduced. In this way, the spectrum structure of the pseudo wideband frequency signal can be changed to a structure in which the amplitude decreases as the frequency becomes higher, and the discontinuous points are hardly emphasized. As a result, generation of noise can be suppressed. Further, in the case of an audio signal having a characteristic in which the amplitude increases from the low range to the high range as shown in FIG. 15A, the gain coefficient is increased. Then, the whole spectrum structure of the pseudo wideband frequency signal can be a continuous structure in which the amplitude increases as the frequency becomes higher, and for example, the intelligibility of unvoiced sound can be improved. That is, by changing the gain coefficient according to the characteristics of the signal in the low frequency region, it is possible to prevent noise generation and make it easy to hear the unvoiced part, so that the intelligibility of the pseudo wideband speech can be improved.
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。 Embodiments of the present invention will be described below with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated.
図1にこの発明の音声楽音擬似広帯域化装置の実施例1の機能構成例を、図2に動作フローを示す。音声楽音擬似広帯域化装置は、周波数変換部11と、周波数拡張部12と、高域信号生成部13と、ゲイン決定部14と、ゲイン乗算部15と、結合部16と、周波数逆変換部17とで構成される。周波数変換部11に入力される狭帯域音声楽音信号In(t)は、時間領域の信号であり、所定のサンプリング周波数で離散値化されサンプル数(D個)毎に入力端子10に入力される。ここでサンプル数Dは、予め決まっている値でも良いし、フレーム毎に可変な値でも良い。入力の狭帯域音声楽音信号を、In(t)(t=0,1,…,D−1)と表わす。例えば、フレーム長は20ms、サンプリング周波数は8kHzといった値である。
FIG. 1 shows an example of a functional configuration of the first embodiment of the voice musical tone pseudo-broadbanding apparatus of the present invention, and FIG. 2 shows an operation flow. The sound musical tone pseudo-bandwidth expansion apparatus includes a
周波数変換部11は、時間領域の狭帯域音声楽音信号In(t)を周波数領域の信号である低域領域の信号に変換する(ステップS11)。周波数変換部11は、MDCTの場合、バッファ等に蓄積された直前のフレームのIn(t−d)と、入力In(t)(t=0,1,…,D−1)とを用いて、周波数領域の信号InFreq(k)(k=0,1,…,D−1)を生成する。この例では、周波数変換方法としてMDCT(Modified Discrete Cosine Transform:修正離散コサイン変換)を用いる例を示すが、DCTやFFTなど他の周波数変換方法を用いても良い。以下の説明では、周波数領域の信号を周波数インデックスkを用いて表記する。kの値が小さいほど低い周波数の信号を表わしている。
The
周波数拡張部12は、低域領域の信号を2以上の整数であるNの倍数に拡張した拡張信号InFreqExp(k)を生成する。低域領域の信号InFreq(k)(k=0,1,…,D−1)に対して、例えばD個の信号を追加し、InFreqExp(k)(k=0,1,…,2D−1)のN=2倍の周波数インデックスの範囲に周波数範囲を拡張する(ステップS12)。上記したフレーム長=20msで、サンプリング周波数が8kHzの場合、D=160である。拡張信号InFreqExp(k)(k=0,1,…,2D−1)は、例えば式(1)に示すような信号である。
InFreqExp(k)=InFreq(k) (0≦k≦D−1) (1)
InFreqExp(k)=MIN (D≦k≦2D−1)
ここでMINの値は0でも良いし、非常に小さな値でも良い。つまり拡張信号は、低域領域の信号はそのままで、周波数インデックスの範囲が例えば2倍に拡張された信号である。
The
InFreqExp (k) = InFreq (k) (0 ≦ k ≦ D−1) (1)
InFreqExp (k) = MIN (D ≦ k ≦ 2D−1)
Here, the value of MIN may be 0 or a very small value. That is, the extended signal is a signal in which the range of the frequency index is extended by, for example, twice while the signal in the low frequency region is left as it is.
高域信号生成部13は高域領域の信号を、拡張した高域領域の周波数範囲に低域領域の信号を複写して生成する(ステップS13)。ステップS13の高域信号生成処理の具体的な動作フローを図3に示してその動作を説明する。図3は複写するコピー元の低域領域の周波数範囲が固定の場合である。低域領域のコピーを開始する先頭の周波数インデックスをDL、コピーする範囲をDW、コピー先の高域領域の信号の先頭の周波数インデックスをDHとして説明する。まず始めにDL、DW、DHの値を設定する(ステップS131)。周波数インデックスkを、高域領域の信号の最下限であるk=0に設定する(ステップS132)。周波数インデックスk=Dからk=DH−1までの高域信号FreqHigh(k)には、MINが書き込まれる(ステップS133〜S135)。周波数インデックスkが、k=DHになると高域信号FreqHigh(k)には、低域領域のコピー元の先頭の周波数インデックスk=DLの信号の振幅がコピーされる(ステップS136)。つまり、(k−DH−DL=DH−DH+DL=DL)である。したがって、コピー元のk=DL〜(DL+DW)の範囲の信号の振幅が、高域領域のk=DH〜(DH+DW)の範囲にコピーされる(ステップS138のNoのループ)。周波数インデックスk=(DH+DW)〜(2D−1)までの範囲の高域信号FreqHigh(k)には、MINが書き込まれる(ステップS139〜S141)。この結果、高域信号FreqHigh(k)は、式(2)に示すようになる。
FreqHigh(k)=MIN (0≦k≦DH−1)
FreqHigh(k)=InFreqExp(k−DH+DL) (DH≦k≦DH+DW−1) (2)
FreqHigh(k)=MIN (DH+DW≦k≦2D−1)
The high-
FreqHigh (k) = MIN (0 ≦ k ≦ DH− 1)
FreqHigh (k) = InFreqExp (k -D H + D L) (D H ≦ k ≦ D H + D W -1) (2)
FreqHigh (k) = MIN (D H + D W ≦ k ≦ 2D-1)
この低域領域の信号を、拡張した周波数範囲に複写して高域領域の信号を生成する様子を模式的に図4に示す。横軸は周波数インデックス、縦軸は振幅である。周波数インデックスが0〜D−1の範囲の低域領域のDL〜(DL+DW−1)の範囲の振幅が、高域領域のDH〜(DH+DW−1)の範囲にコピーされている様子が分かる。
FIG. 4 schematically shows how a signal in the high frequency region is generated by copying the signal in the low frequency region into the expanded frequency range. The horizontal axis is the frequency index, and the vertical axis is the amplitude. The amplitude of the low frequency region D L to (D L + D W −1) in the frequency index range of 0 to
なお、この例では、連続する低域領域の拡張信号の一部を高域信号にコピーする場合について説明したが、拡張信号の全部を高域信号にコピーしても良いし、複数部分を分割してコピーしても良い。 In this example, the case where a part of the extended signal in the continuous low frequency region is copied to the high frequency signal has been described. However, the entire extended signal may be copied to the high frequency signal, or a plurality of portions may be divided. And copy it.
また、上記した例では、周波数拡張部12で周波数インデックスの範囲を例えば2倍に拡張した後に、高域信号生成部13が低域領域の信号の一部または全部を拡張した高域領域にコピーしたが、この発明はこの例に限定されない。高域信号生成部13は、低域周波数領域信号InFreq(k)の一部または全部の信号を高域領域の信号としてコピーするだけとしても良い。つまり、式(3)に示すように、単純に低域周波数領域信号InFreq(k)の一部または全部の信号を切り出すだけの処理を行う。
FreqHigh(k)=MIN (0≦k≦DH−1)
FreqHigh(k)=InFreqExp(k−DH+DL) (DH≦k≦DH+DW−1) (3)
FreqHigh(k)=MIN (DH+DW≦k≦D−1)
そして、結合部16は、高域領域の信号が後述するゲイン乗算部15でゲイン調整された強調高域信号を高域側に配置し、低域周波数領域信号InFreq(k)を低域側に配置することにより合成する。このように、結合部16において、周波数範囲を拡張するようにしても良い。
In the above example, after the frequency index range is expanded by, for example, twice by the
FreqHigh (k) = MIN (0 ≦ k ≦ DH− 1)
FreqHigh (k) = InFreqExp (k -D H + D L) (D H ≦ k ≦ D H + D W -1) (3)
FreqHigh (k) = MIN (D H + D W ≦ k ≦ D−1)
Then, the combining
以上の動作を模式的に図5に示す。横軸は周波数インデックス、縦軸は振幅である。図5(a)は低域周波数領域信号InFreq(k)である。図5(b)が高域信号生成部13でコピーした高域領域の信号である。図5(b)の周波数インデックスの上限がD−1である点に注意、単純に図5(a)の一部を切り出した信号である。図5(c)が結合部16で合成された擬似広帯域周波数信号である。以上のように動作する場合は、周波数拡張部12が無くて良い。
The above operation is schematically shown in FIG. The horizontal axis is the frequency index, and the vertical axis is the amplitude. FIG. 5A shows a low frequency domain signal InFreq (k). FIG. 5B shows a high frequency region signal copied by the high
ゲイン決定部14は、低域領域内の異なる範囲の信号のパワー比に基づいて高域領域の信号に乗ずるゲイン係数を決定する(ステップS14)。ステップS14のゲイン決定処理の具体的な動作フローを図6に示してその動作を説明する。図6はパワー比を求める周波数範囲が固定の場合である。低域領域の異なる範囲の、一方のパワーの計算を開始する先頭の周波数インデックスをk0、その範囲をd0、その異なる範囲の他方のパワーを計算する先頭の周波数インデックスと範囲をk1,d1として説明する。まず始めにk0、d0、k1、d1の値を設定する(ステップS142)。上記したD=160の場合、例えばk0=40、d0=40、k1=80、d1=40といった値に設定される。そして各変数を初期化する(ステップS143)。一方の範囲である周波数インデックスがk0〜(k0+d0−1)の範囲の累積パワーp0を計算する(ステップS144〜S146)。次に、他方の範囲であるk1〜(k1+d0−1)の範囲の累積パワーp1を計算する(ステップS147〜S150)。p0とp1が求まった後に、ステップS151でパワー比r=p1/p0を計算する。つまり信号パワー比rは、式(4)で表わせる。
ゲイン決定部14は、信号パワー比rの値を例えば複数の閾値で評価して、ゲイン係数kHGを決定する。例えば閾値を表1のように設定し、r以上となる閾値の数によって表2に示す様にゲイン係数kHGを決定する(ステップS152)。
また、ゲイン決定部14は、低域領域内の異なる範囲の信号の信号振幅の絶対値和の比に基づいて高域領域の信号に乗ずるゲイン係数を決定しても良い(図7、ステップS142′)。この場合のゲイン決定処理の動作フローを図7に示す。図7は、図6のステップS142がステップS142′に、ステップS144がステップS144′に、ステップS148がステップS148′に変わる点のみが異なる。ステップS144′は、一方の範囲である周波数インデックスがk0〜(k0+d0−1)の範囲の信号振幅の絶対値の和をp0として計算する。ステップS148′は、他方の範囲であるk1〜(k1+d0−1)の範囲の信号振幅の絶対値の和をp1として計算する。
Further, the
ゲイン決定部14は、それぞれの範囲の信号振幅の絶対値和p0とp1が求まった後に、ステップS151において式(5)に示す信号振幅の絶対値和の比r′を計算する。
ゲイン乗算部15は、入力された高域信号FreqHigh(k)(k=0,1,…,2D−1)とゲイン係数kHGから、式(6)の強調高域信号FreqHighGain(k)を計算して出力する(図2、ステップS15)。
FreqHighGain(k)=FreqHigh(k)・kHG (6)
The
FreqHighGain (k) = FreqHigh (k ) · k HG (6)
結合部16は、周波数拡張部12が出力する拡張信号と、ゲイン乗算部15が出力する強調高域信号とを加算し、式(7)に示す擬似広帯域周波数信号PsFreq(k)を生成する(ステップS16)。
PsFreq(k)=InFreqExp(k)+FreqHighGain(k) (7)
The combining
PsFreq (k) = InFreqExp (k) + FreqHighGain (k) (7)
周波数逆変換部17は、擬似広帯域周波数信号PsFreq(k)を時間領域の擬似広帯域音声信号out(k)(k=0,1,…,2D−1)に変換して出力する(ステップS17)。
The frequency
以上説明した音声楽音擬似広帯域化装置によれば、低域領域内の異なる範囲の信号のパワー比rまたは振幅の絶対値和の比r′が、1以下になる図8(a)に示すような音声信号の場合は、ゲイン係数kHG が1以下になり高域領域にコピーされる強調高域信号の振幅が減衰する。この結果、擬似広帯域周波数信号のスペクトル構造全体として、高域になるほど振幅が低下する構造にすることができ、不連続点が強調され難くなる。また、パワー比rまたは振幅の絶対値和の比r′が1以上になる図9(a)に示す音声信号の場合は、ゲイン係数kHGの値が1以上になるので強調高域信号の振幅が増加する。したがって、擬似広帯域周波数信号のスペクトル構造を、高域になるほど振幅が増加する連続性のある構造とすることができる。この結果、擬似広帯域音声の無声部が聞き取り易くなり、音声の明瞭度を向上させることができる。 As shown in FIG. 8A, according to the above-described voice musical tone pseudo-wideband apparatus, the power ratio r of the signals in different ranges in the low frequency region or the ratio r ′ of the absolute value sum of the amplitudes is 1 or less. In the case of a simple audio signal, the gain coefficient k HG becomes 1 or less, and the amplitude of the emphasized high frequency signal copied to the high frequency region is attenuated. As a result, the entire spectrum structure of the pseudo wideband frequency signal can be made to have a structure in which the amplitude decreases as the frequency becomes higher, and discontinuities are hardly emphasized. In the case of the audio signal shown in FIG. 9A in which the power ratio r or the ratio r ′ of the absolute value sum of amplitudes is 1 or more, the gain coefficient k HG is 1 or more, so Amplitude increases. Therefore, the spectrum structure of the pseudo broadband frequency signal can be a continuous structure in which the amplitude increases as the frequency becomes higher. As a result, the voiceless part of the pseudo wideband voice can be easily heard, and the clarity of the voice can be improved.
なお、実施例1では、低域領域の信号をN倍に拡張した拡張信号を生成する周波数拡張部のNが2の場合で説明を行ったが、N=3でもN=4でも構わない。また、低域領域内の異なる範囲の信号のパワー比を求める周波数インデックスの範囲を固定にした例で説明を行ったが、その範囲を可変にしても良い。次にパワー比を求める周波数インデックスの範囲を可変にした実施例2を説明する。以降ではパワー比を求める例のみを示して実施例を説明する。しかし、以下の実施例は、上記したように信号振幅の絶対値和の比を求める場合にも適用が可能である。
In the first embodiment, the description has been given of the case where N of the frequency extension unit that generates the extension signal obtained by extending the low-frequency signal by N times is 2. However, N = 3 or N = 4 may be used. Further, although an example has been described in which the range of the frequency index for obtaining the power ratio of signals in different ranges in the low frequency region is fixed, the range may be variable. Next,
実施例2の音声楽音擬似広帯域化装置は、ゲイン決定部14内に累積パワー移動計算部14aも備えた点が、実施例1と異なる。図1にその構成を破線で示す。他の構成は実施例1と同じである。累積パワー移動計算部14aの一部の動作フローを図10に示して動作を説明する。
The voice musical tone pseudo-wideband apparatus according to the second embodiment is different from the first embodiment in that the
累積パワー移動計算部14aは、低域領域の低周波数側であるk=0〜(D/2−d0−1)の範囲と、高周波数側のk=D/2〜(D−d0−1)の範囲内のそれぞれの最大累積パワーが得られる周波数インデックスの範囲を動的に求めるものである。まず始めに累積パワーp0を初期化すると共に、累積パワーを求める途中のある範囲d0の累積パワーを格納する変数ptempを初期化する(ステップS80)。範囲d0毎に求める累積パワーp0を初期化する(ステップS81)。そして最初にk=0からk=(d0−1)の範囲の累積パワーp0を計算する(ステップS82〜S84)。次に変数ptempと今回求めた累積パワーp0を比較する(ステップS85)。最初は変数ptempが0のために、必ずptemp<p0となるので、途中の最大パワーとして求めたp0を変数ptempに代入するptemp=p0(ステップS86)。そして低域領域の異なる範囲の一方のパワーの計算を開始する先頭の周波数インデックスk0を、k0=iとする。したがって、最初はk0=0である。この動作をステップS89でiを1ずつ加算しながらi=(D/2−d0−1)になるまで、繰り返す(ステップS88)。つまり、累積パワーp0を求める累積範囲d0の先頭の周波数インデックスk0を求める。例えば2回目の累積パワーp0が1回目の変数ptempより大きければ、ステップS87でk0=1となる。このように、最大の累積パワーp0になる先頭の周波数インデックスk0を求めることができる。
The cumulative power
同様に高周波数側のk=D/2〜(D−d0−1)の範囲内のパワーを計算する先頭の周波数インデックスk1も求めることができる(ステップS91〜)。動作フローは、上記した動作と同じなので省略する。このようにしてk0とk1を求めた後は、図6で説明済みのステップS143以降の処理を行なって、累積パワーp0とp1とを求める。このようにすれば、低域領域の低周波数側と高周波数側のそれぞれの範囲の最大パワー同士から求めたパワー比rを得ることができる。この方法は比較的に演算量を必要とする。より少ない演算量でパワー比を求める周波数インデックスの範囲を可変にした実施例3を次に説明する。 Similarly, the head frequency index k 1 for calculating the power within the range of k = D / 2 to (D−d 0 −1) on the high frequency side can be obtained (step S91). Since the operation flow is the same as the above-described operation, it is omitted. After obtaining k 0 and k 1 in this way, the processing after step S143 described with reference to FIG. 6 is performed to obtain the accumulated powers p 0 and p 1 . In this way, it is possible to obtain the power ratio r obtained from the maximum powers in the respective ranges on the low frequency side and the high frequency side of the low frequency region. This method requires a relatively large amount of computation. A third embodiment in which the frequency index range for obtaining the power ratio with a smaller calculation amount is made variable will be described below.
実施例3の音声楽音擬似広帯域化装置は、実施例2の累積パワー移動計算部14aに代えてピーク検出部14bを備える。図1にそのピーク検出部14bを破線で示す。他の構成は実施例1又は2と同じである。ピーク検出部14bの動作フローを図11に示して動作を説明する。
The voice musical tone pseudo-broadband apparatus according to the third embodiment includes a peak detection unit 14b instead of the cumulative power
ピーク検出部14bは、低域領域の低周波数側であるk=0〜(D/2−d0−1)の範囲と、高周波数側のk=D/2〜(D−d0−1)の範囲内のそれぞれの最大パワーを示す周波数インデックスk0Pとk1Pを動的に求めるものである。まず始めにステップS93で変数を初期化する。ppeakは、範囲d0内の最大パワーの値を格納する変数である。周波数インデックスkを増やしながらパワーを計算(ステップS94)して、変数ppeakと比較する(ステップS95)。計算したpkの方が変数ppeakよりも大きい場合、ステップS96で変数ppeakにpkを代入してパワーの大きい方の周波数インデックスkをk0Pとして記録する(ステップS97)。この処理をkを1ずつ加算(ステップS98)しながらk=(D/2−d0−1)になるまで繰り返す(ステップS99)。そのように動作すると、k0Pにはk=0〜(D/2−d0−1)の範囲で最大パワーを示す周波数インデックスが記録される。 The peak detector 14b includes a range of k = 0 to (D / 2−d 0 −1) on the low frequency side in the low frequency region, and k = D / 2 to (D−d 0 −1) on the high frequency side. The frequency indexes k 0P and k 1P indicating the respective maximum powers within the range of First, in step S93, variables are initialized. p peak is a variable that stores the value of the maximum power within the range d 0 . The power is calculated while increasing the frequency index k (step S94) and compared with the variable p peak (step S95). If towards the calculated p k is greater than the variable p peak, by substituting p k to record the frequency index k larger power as k 0P variable p peak in step S96 (step S97). This process is repeated while adding k by 1 (step S98) until k = (D / 2−d 0 −1) (step S99). When operating in this manner, a frequency index indicating the maximum power in the range of k = 0 to (D / 2−d 0 −1) is recorded in k 0P .
同様に高周波数側のk=D/2〜(D−d0−1)の範囲内の最大パワーを示す周波数インデックスk1Pも求めることができる。動作フローは、上記した動作と同じなので省略する。このようにk0Pとk1Pを求めた後は、k0Pとk1Pをそれぞれ中心として例えばd0の範囲の累積パワーp0とp1を計算してパワー比rを求める。または、k0P, k1Pを先頭の周波数インデックスk0,k1として実施例2と同じように累積パワーを求めても良い。実施例3は、実施例2に対して演算量を1/d0に削減することができる。 Similarly, a frequency index k 1P indicating the maximum power in the range of k = D / 2 to (D−d 0 −1) on the high frequency side can also be obtained. Since the operation flow is the same as the above-described operation, the description is omitted. After obtaining k 0P and k 1P in this way, the power ratio r is obtained by calculating, for example, cumulative powers p 0 and p 1 in the range of d 0 centering on k 0P and k 1P , respectively. Alternatively , the accumulated power may be obtained in the same manner as in the second embodiment using k 0P and k 1P as the head frequency index k 0 and k 1 . In the third embodiment, the amount of calculation can be reduced to 1 / d 0 compared to the second embodiment.
また、最大パワーの代わりに信号振幅の最大値から周波数インデックスk0Pとk1Pを動的に求め、それぞれを中心とした信号振幅の絶対値和の比r′を計算するようにしても良い。 Alternatively, the frequency indices k 0P and k 1P may be dynamically obtained from the maximum value of the signal amplitude instead of the maximum power, and the ratio r ′ of the sum of the absolute values of the signal amplitudes centered on each of them may be calculated.
実施例1ではゲイン係数kHGを、複数の閾値とパワー比rとを比較して表2に示したテーブルを用いて決定する例を示した。他の方法として、式(8)に示すように累積パワー比rに正の実数αを乗じた値を、ゲイン係数kHGとするようにしても良い。正の実数αを図1のゲイン決定部14内に破線で示す。
kHG=α・r (8)
In the first embodiment, an example is shown in which the gain coefficient k HG is determined using a table shown in Table 2 by comparing a plurality of threshold values with the power ratio r. As another method, a value obtained by multiplying the cumulative power ratio r by a positive real number α as shown in Expression (8) may be used as the gain coefficient k HG . The positive real number α is indicated by a broken line in the
k HG = α · r (8)
例えば、α=0.5のように1以下の値にすれば、ゲイン係数kHGを細かく設定することができる。また、正の実数αをパラメータとすることで、ゲイン係数kHGを容易に変更することが可能になるのでゲイン係数kHGの設定と調整を容易にする効果を奏する。なお、正の実数αを乗じた値をゲイン係数とするのは、信号振幅の絶対値和の比r′の場合にも適用が可能である。 For example, if the value is 1 or less, such as α = 0.5, the gain coefficient k HG can be set finely. Further, by using the positive real number α as a parameter, the gain coefficient k HG can be easily changed, so that the gain coefficient k HG can be easily set and adjusted. Note that the gain coefficient obtained by multiplying the positive real number α can also be applied to the ratio r ′ of the absolute value sum of signal amplitudes.
〔シミュレーション結果〕
この発明で提案した音声楽音擬似広帯域化装置で擬似広帯域化処理を施した場合と、その処理を行なわない場合の音声の音質を、5段階MOS主観評価で評価した結果を図12に示す。横軸は処理の有無を示し、縦軸はMOS主観評価値である。数値が大きいほど良い評価結果を示す。
〔simulation result〕
FIG. 12 shows the results of evaluating the sound quality of the voice when the pseudo-bandwidth processing is performed by the voice musical tone pseudo-bandwidth proposing device proposed in the present invention and when the processing is not performed by the five-step MOS subjective evaluation. The horizontal axis indicates the presence or absence of processing, and the vertical axis is the MOS subjective evaluation value. The larger the value, the better the evaluation result.
シミュレーション条件:男性音源4名分、女性音源4名分について、この発明の擬似広帯域化処理を行なった場合と行わない場合とについて、一般人24名に評価してもらった。擬似広帯域化処理を行なわない場合のMOS値=3.19に対して、この発明の擬似広帯域化処理を行なった場合、0.36ポイント向上したMOS値=3.55の結果を得ることができた。このようにこの発明による音声楽音擬似広帯域化装置及び方法によれば、擬似広帯域音声の音声品質を向上させることができる。 Simulation conditions: For the male sound source for four and the female sound source for four, the case of performing the pseudo-broadband processing of the present invention and the case of not performing it were evaluated by 24 ordinary people. When the pseudo-bandwidth processing of the present invention is performed on the MOS value = 3.19 when the pseudo-bandwidth processing is not performed, a result of MOS value = 3.55 improved by 0.36 points can be obtained. It was. As described above, according to the voice musical tone pseudo-wideband apparatus and method according to the present invention, the voice quality of the pseudo-wideband voice can be improved.
なお、上記した実施例の説明では、例えばサンプリング周波数8kHz、フレーム時間長を20msといった電話システムを前提にしたような例を示したが、この発明はこの例に限定されるものではない。この発明は、音声楽音信号を広帯域化する技術として広く利用することが可能である。 In the above description of the embodiment, an example has been shown on the premise of a telephone system such as a sampling frequency of 8 kHz and a frame time length of 20 ms, but the present invention is not limited to this example. The present invention can be widely used as a technique for widening a voice tone signal.
また、この発明である装置及び方法は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記装置及び方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。 Moreover, the apparatus and method which are this invention are not limited to the above-mentioned embodiment, It can change suitably in the range which does not deviate from the meaning of this invention. Further, the processes described in the above apparatus and method are not only executed in time series according to the order of description, but also may be executed in parallel or individually as required by the processing capability of the apparatus that executes the process. Good.
また、上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。 Further, when the processing means in the above apparatus is realized by a computer, the processing contents of functions that each apparatus should have are described by a program. Then, by executing this program on the computer, the processing means in each apparatus is realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a recording device of a server computer and transferring the program from the server computer to another computer via a network.
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 Each means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.
Claims (10)
上記低域領域の信号の一部または全部を複写して高域領域の信号を生成する高域信号生成部と、
上記低域領域内の異なる範囲の信号のパワー比または振幅の絶対値和の比に基づいて上記高域領域の信号に乗ずるゲイン係数を決定するゲイン決定部と、
上記高域領域の信号に上記ゲイン係数を乗じて強調高域信号を生成するゲイン乗算部と、
上記低域領域の信号と上記強調高域信号を合わせて擬似広帯域周波数信号を生成する結合部と、
上記擬似広帯域周波数信号を時間領域の擬似広帯域音声信号に変換して出力する周波数逆変換部と、を具備し、
上記ゲイン決定部は、上記異なる範囲の低域側の信号のパワーまたは振幅の絶対値和が大きい場合には上記ゲイン係数を小さくし、高域側の信号のパワーまたは振幅の絶対値和が大きい場合には上記ゲイン係数を大きくすることを特徴とする音声楽音擬似広帯域化装置。 A frequency conversion unit that converts a discrete narrow band voice musical sound signal into a frequency domain signal and generates a low frequency signal;
A high-frequency signal generation unit that generates a high-frequency signal by copying a part or all of the low-frequency signal;
A gain determining unit that determines a gain coefficient to be multiplied by the signal in the high frequency region based on the power ratio of the signals in different ranges in the low frequency region or the ratio of the absolute value sum of the amplitudes;
A gain multiplier that multiplies the high-frequency signal by the gain coefficient to generate an enhanced high-frequency signal;
A combining unit that generates a pseudo wideband frequency signal by combining the low-frequency region signal and the enhanced high-frequency signal;
A frequency inverse transform unit that converts the pseudo wideband frequency signal into a pseudo wideband audio signal in the time domain and outputs the signal, and
The gain determining unit reduces the gain coefficient when the sum of absolute values of the power or amplitude of the low-frequency signal in the different range is large, and increases the absolute value sum of the power or amplitude of the high-frequency signal. In some cases, the voice musical tone pseudo-broadband apparatus is characterized in that the gain coefficient is increased.
上記ゲイン決定部は、上記低域領域の異なる範囲の信号の累積パワー比または振幅の絶対値和の比を計算する累積パワー移動計算部も備え、上記累積パワー移動計算部で求めた累積パワーの比または振幅の絶対値和の比に基づいて上記ゲイン係数を決定することを特徴とする音声楽音擬似広帯域化装置。 In the voice musical tone pseudo-broadband apparatus according to claim 1,
The gain determination unit also includes a cumulative power shift calculation unit that calculates a cumulative power ratio of signals in different ranges of the low frequency region or a ratio of absolute value sums of amplitudes, and the cumulative power shift calculated by the cumulative power shift calculation unit. A sound musical tone pseudo-broadband apparatus characterized by determining the gain coefficient based on a ratio or a ratio of absolute value sums of amplitudes.
上記ゲイン決定部は、上記低域領域内の異なる範囲の最大信号パワーまたは最大振幅の周波数を検出するピーク検出部も備え、上記最大信号パワーまたは最大振幅の周波数を中心として低域側と高域側のそれぞれについて所定範囲の信号の累積パワー比または振幅の絶対値和の比に基づいてゲイン係数を決定することを特徴とする音声楽音擬似広帯域化装置。 In the voice musical tone pseudo-broadband apparatus according to claim 1,
The gain determination unit also includes a peak detection unit that detects a maximum signal power or a maximum amplitude frequency in a different range within the low frequency region, and the low frequency side and the high frequency center around the maximum signal power or the maximum amplitude frequency. A sound musical tone pseudo-broadband apparatus characterized in that a gain coefficient is determined based on a cumulative power ratio of signals within a predetermined range or a ratio of absolute value sums of amplitudes for each side.
上記ゲイン決定部は、上記累積パワー比または振幅の絶対値和の比に正の実数αを乗じた値を上記ゲイン係数とすることを特徴とする音声楽音擬似広帯域化装置。 In the voice musical tone pseudo-wideband device according to any one of claims 1 to 3,
The apparatus according to claim 1, wherein the gain determination unit uses a value obtained by multiplying the cumulative power ratio or the ratio of absolute value sums of amplitudes by a positive real number α as the gain coefficient.
周波数拡張部が、上記低域領域の信号をN倍(ただし、Nは2以上の整数)に拡張した拡張信号を生成する周波数拡張過程と、
高域信号生成部が、上記低域領域の信号を複写して高域領域の信号を生成する高域信号生成過程と、
ゲイン決定部が、上記低域領域の異なる範囲の信号のパワー比または振幅の絶対値和の比に基づいて、低域側の信号のパワーの方が大きい場合には上記高域領域の信号に乗ずるゲイン係数を小さくし、高域側の信号のパワーの方が大きい場合には上記ゲイン係数を大きくするゲイン決定過程と、
ゲイン乗算部が、上記高域領域の信号に上記ゲイン係数を乗じて強調高域信号を生成するゲイン乗算過程と、
結合部が、上記拡張信号と上記強調高域信号を合わせて擬似広帯域周波数信号を生成する結合過程と、
周波数逆変換部が、上記擬似広帯域周波数信号を時間領域の擬似広帯域音声信号に変換して出力する周波数逆変換過程と、
を含むことを特徴とする音声楽音擬似広帯域化方法。 A frequency conversion process in which the frequency conversion unit converts the discrete-valued narrow-band audio musical sound signal into a frequency-domain signal and generates a low-frequency signal;
A frequency extension process in which a frequency extension unit generates an extension signal obtained by extending the low-frequency region signal N times (where N is an integer of 2 or more);
A high-frequency signal generation unit that generates a high-frequency signal by copying the low-frequency signal;
Based on the power ratio of the signals in different ranges of the low-frequency region or the ratio of the absolute value sum of the amplitudes, the gain determination unit determines that the signal in the high-frequency region is higher when the power of the low-frequency signal is higher. A gain determination process in which the gain coefficient to be multiplied is reduced, and the gain coefficient is increased when the power of the high frequency side signal is larger,
A gain multiplication process in which a gain multiplication unit multiplies the signal in the high frequency region by the gain coefficient to generate an enhanced high frequency signal;
A combining unit that generates a pseudo wideband frequency signal by combining the extended signal and the enhanced high-frequency signal;
A frequency inverse transform unit converts the pseudo wideband frequency signal into a pseudo wideband audio signal in the time domain and outputs it, and a frequency reverse transform process,
A method for increasing the frequency of a musical tone pseudo-band.
上記ゲイン決定過程は、累積パワー移動計算部が上記低域領域の異なる範囲の信号の累積パワー比または振幅の絶対値和の比を計算する累積パワー移動計算過程も含み、上記累積パワー移動計算過程で求めた累積パワーの比または振幅の絶対値和の比に基づいて上記ゲイン係数を決定する過程であることを特徴とする音声楽音擬似広帯域化方法。 In the method for realizing a voice musical tone pseudo-band according to claim 5,
The gain determination process includes a cumulative power transfer calculation process in which the cumulative power transfer calculation unit calculates a cumulative power ratio or a ratio of absolute value sums of amplitudes of signals in different ranges in the low frequency region, and the cumulative power transfer calculation process A method for increasing the frequency of a voice tone pseudo-band, which is the process of determining the gain coefficient based on the ratio of accumulated power or the ratio of absolute value sums of amplitudes obtained in (1).
上記ゲイン決定過程は、ピーク検出部が上記低域領域中の最大信号パワーまたは最大振幅の周波数を検出するピーク検出過程も含み、上記最大信号パワーまたは最大振幅の周波数を中心として低域側と高域側のそれぞれについて所定範囲の信号の累積パワー比または振幅の絶対値和の比を求める過程も含むことを特徴とする音声楽音擬似広帯域化方法。 In the method for realizing a voice musical tone pseudo-band according to claim 5,
The gain determination process also includes a peak detection process in which the peak detection unit detects the frequency of the maximum signal power or maximum amplitude in the low frequency region. A method of realizing a voice tone pseudo-wideband, comprising a step of obtaining a cumulative power ratio of signals within a predetermined range or a ratio of absolute value sums of amplitudes for each band side.
上記ゲイン決定過程は、上記累積パワー比または振幅の絶対値和の比に正の実数αを乗じて上記ゲイン係数を求める過程も含むことを特徴とする音声楽音擬似広帯域化方法。 In the method for realizing a voice tone pseudo-wideband according to any one of claims 5 to 7,
The above-mentioned gain determination step includes a step of obtaining the gain coefficient by multiplying the cumulative power ratio or the ratio of absolute value sums of amplitudes by a positive real number α, and a method for realizing a voice musical tone pseudo-band.
A computer-readable recording medium on which any one of the programs according to claim 9 is recorded.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008230455A JP4733727B2 (en) | 2007-10-30 | 2008-09-09 | Voice musical tone pseudo-wideband device, voice musical tone pseudo-bandwidth method, program thereof, and recording medium thereof |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007281450 | 2007-10-30 | ||
JP2007281450 | 2007-10-30 | ||
JP2008230455A JP4733727B2 (en) | 2007-10-30 | 2008-09-09 | Voice musical tone pseudo-wideband device, voice musical tone pseudo-bandwidth method, program thereof, and recording medium thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009134260A true JP2009134260A (en) | 2009-06-18 |
JP4733727B2 JP4733727B2 (en) | 2011-07-27 |
Family
ID=40866137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008230455A Active JP4733727B2 (en) | 2007-10-30 | 2008-09-09 | Voice musical tone pseudo-wideband device, voice musical tone pseudo-bandwidth method, program thereof, and recording medium thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4733727B2 (en) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009116245A (en) * | 2007-11-09 | 2009-05-28 | Yamaha Corp | Speech enhancement device |
JP2012242468A (en) * | 2011-05-17 | 2012-12-10 | Nippon Telegr & Teleph Corp <Ntt> | Pseudo wide band voice signal generation device, pseudo wide band voice signal generation method, and program thereof |
JP2014063004A (en) * | 2012-09-21 | 2014-04-10 | Oki Electric Ind Co Ltd | Band extension device and method |
US9070372B2 (en) | 2010-07-15 | 2015-06-30 | Fujitsu Limited | Apparatus and method for voice processing and telephone apparatus |
JP2015215528A (en) * | 2014-05-13 | 2015-12-03 | 日本電信電話株式会社 | Voice enhancement device, voice enhancement method and program |
JP2016006540A (en) * | 2009-10-07 | 2016-01-14 | ソニー株式会社 | Encoding device, method, and program |
US9583112B2 (en) | 2010-04-13 | 2017-02-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9659573B2 (en) | 2010-04-13 | 2017-05-23 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9679580B2 (en) | 2010-04-13 | 2017-06-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9691396B2 (en) | 2012-03-01 | 2017-06-27 | Huawei Technologies Co., Ltd. | Speech/audio signal processing method and apparatus |
US9691410B2 (en) | 2009-10-07 | 2017-06-27 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
US9767824B2 (en) | 2010-10-15 | 2017-09-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
JPWO2017037830A1 (en) * | 2015-08-31 | 2017-11-24 | 三菱電機株式会社 | Speech recognition apparatus and speech recognition processing method |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US10692511B2 (en) | 2013-12-27 | 2020-06-23 | Sony Corporation | Decoding apparatus and method, and program |
US11763828B2 (en) | 2019-01-31 | 2023-09-19 | Mitsubishi Electric Corporation | Frequency band expansion device, frequency band expansion method, and storage medium storing frequency band expansion program |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002015522A (en) * | 2000-06-30 | 2002-01-18 | Matsushita Electric Ind Co Ltd | Audio band extending device and audio band extension method |
JP2002175092A (en) * | 2000-12-07 | 2002-06-21 | Kenwood Corp | Signal interpolation apparatus, signal interpolation method and recording medium |
JP2006293400A (en) * | 2001-11-14 | 2006-10-26 | Matsushita Electric Ind Co Ltd | Encoding device and decoding device |
JP2007171339A (en) * | 2005-12-20 | 2007-07-05 | Kenwood Corp | Audio signal processing unit |
JP2007310296A (en) * | 2006-05-22 | 2007-11-29 | Oki Electric Ind Co Ltd | Band spreading apparatus and method |
JP2008058470A (en) * | 2006-08-30 | 2008-03-13 | Hitachi Maxell Ltd | Audio signal processor and audio signal reproduction system |
-
2008
- 2008-09-09 JP JP2008230455A patent/JP4733727B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002015522A (en) * | 2000-06-30 | 2002-01-18 | Matsushita Electric Ind Co Ltd | Audio band extending device and audio band extension method |
JP2002175092A (en) * | 2000-12-07 | 2002-06-21 | Kenwood Corp | Signal interpolation apparatus, signal interpolation method and recording medium |
JP2006293400A (en) * | 2001-11-14 | 2006-10-26 | Matsushita Electric Ind Co Ltd | Encoding device and decoding device |
JP2007171339A (en) * | 2005-12-20 | 2007-07-05 | Kenwood Corp | Audio signal processing unit |
JP2007310296A (en) * | 2006-05-22 | 2007-11-29 | Oki Electric Ind Co Ltd | Band spreading apparatus and method |
JP2008058470A (en) * | 2006-08-30 | 2008-03-13 | Hitachi Maxell Ltd | Audio signal processor and audio signal reproduction system |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009116245A (en) * | 2007-11-09 | 2009-05-28 | Yamaha Corp | Speech enhancement device |
JP2016006540A (en) * | 2009-10-07 | 2016-01-14 | ソニー株式会社 | Encoding device, method, and program |
JP2017203999A (en) * | 2009-10-07 | 2017-11-16 | ソニー株式会社 | Encoding device, method, and program |
US9691410B2 (en) | 2009-10-07 | 2017-06-27 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
US9583112B2 (en) | 2010-04-13 | 2017-02-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10224054B2 (en) | 2010-04-13 | 2019-03-05 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9659573B2 (en) | 2010-04-13 | 2017-05-23 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9679580B2 (en) | 2010-04-13 | 2017-06-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10546594B2 (en) | 2010-04-13 | 2020-01-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10381018B2 (en) | 2010-04-13 | 2019-08-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10297270B2 (en) | 2010-04-13 | 2019-05-21 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9070372B2 (en) | 2010-07-15 | 2015-06-30 | Fujitsu Limited | Apparatus and method for voice processing and telephone apparatus |
US9767824B2 (en) | 2010-10-15 | 2017-09-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US10236015B2 (en) | 2010-10-15 | 2019-03-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
JP2012242468A (en) * | 2011-05-17 | 2012-12-10 | Nippon Telegr & Teleph Corp <Ntt> | Pseudo wide band voice signal generation device, pseudo wide band voice signal generation method, and program thereof |
US10013987B2 (en) | 2012-03-01 | 2018-07-03 | Huawei Technologies Co., Ltd. | Speech/audio signal processing method and apparatus |
US10360917B2 (en) | 2012-03-01 | 2019-07-23 | Huawei Technologies Co., Ltd. | Speech/audio signal processing method and apparatus |
US9691396B2 (en) | 2012-03-01 | 2017-06-27 | Huawei Technologies Co., Ltd. | Speech/audio signal processing method and apparatus |
US10559313B2 (en) | 2012-03-01 | 2020-02-11 | Huawei Technologies Co., Ltd. | Speech/audio signal processing method and apparatus |
JP2014063004A (en) * | 2012-09-21 | 2014-04-10 | Oki Electric Ind Co Ltd | Band extension device and method |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US10692511B2 (en) | 2013-12-27 | 2020-06-23 | Sony Corporation | Decoding apparatus and method, and program |
US11705140B2 (en) | 2013-12-27 | 2023-07-18 | Sony Corporation | Decoding apparatus and method, and program |
JP2015215528A (en) * | 2014-05-13 | 2015-12-03 | 日本電信電話株式会社 | Voice enhancement device, voice enhancement method and program |
JPWO2017037830A1 (en) * | 2015-08-31 | 2017-11-24 | 三菱電機株式会社 | Speech recognition apparatus and speech recognition processing method |
US11763828B2 (en) | 2019-01-31 | 2023-09-19 | Mitsubishi Electric Corporation | Frequency band expansion device, frequency band expansion method, and storage medium storing frequency band expansion program |
Also Published As
Publication number | Publication date |
---|---|
JP4733727B2 (en) | 2011-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4733727B2 (en) | Voice musical tone pseudo-wideband device, voice musical tone pseudo-bandwidth method, program thereof, and recording medium thereof | |
RU2487426C2 (en) | Apparatus and method for converting audio signal into parametric representation, apparatus and method for modifying parametric representation, apparatus and method for synthensising parametrick representation of audio signal | |
KR101492702B1 (en) | Apparatus and method for modifying an audio signal using harmonic locking | |
JP4818335B2 (en) | Signal band expander | |
JP3646939B1 (en) | Audio decoding apparatus and audio decoding method | |
JP6262668B2 (en) | Bandwidth extension parameter generation device, encoding device, decoding device, bandwidth extension parameter generation method, encoding method, and decoding method | |
JP4740609B2 (en) | Voiced and unvoiced sound detection apparatus and method | |
US10430154B2 (en) | Tonal/transient structural separation for audio effects | |
CN101183527A (en) | Method and apparatus for encoding and decoding high frequency signal | |
RU2719543C1 (en) | Apparatus and method for determining a predetermined characteristic relating to processing of artificial audio signal frequency band limitation | |
RU2608447C1 (en) | Device and method for generating extended by frequency signal using subranges time smoothing | |
JP2010210758A (en) | Method and device for processing signal containing voice | |
JP4783412B2 (en) | Signal broadening device, signal broadening method, program thereof, and recording medium thereof | |
JP2006505818A (en) | Method and apparatus for generating audio components | |
JP6065488B2 (en) | Bandwidth expansion apparatus and method | |
JP5163606B2 (en) | Speech analysis / synthesis apparatus and program | |
Dziubinski et al. | Octave error immune and instantaneous pitch detection algorithm | |
JP4513556B2 (en) | Speech analysis / synthesis apparatus and program | |
JP2004151423A (en) | Band extending device and method | |
Huang et al. | Single channel speech enhancement based on prominent pitch estimation | |
Nikolay et al. | Audio Bandwidth Extension Using Cluster Weighted Modeling of Spectral Envelopes | |
Balaji et al. | A Novel DWT Based Speech Enhancement System through Advanced Filtering Approach with Improved Pitch Synchronous Analysis | |
JP2011180417A (en) | Device and method for estimating pitch of music acoustic signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110412 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110422 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140428 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4733727 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |