JP6220610B2 - Signal processing apparatus, signal processing method, program, and recording medium - Google Patents

Signal processing apparatus, signal processing method, program, and recording medium Download PDF

Info

Publication number
JP6220610B2
JP6220610B2 JP2013189155A JP2013189155A JP6220610B2 JP 6220610 B2 JP6220610 B2 JP 6220610B2 JP 2013189155 A JP2013189155 A JP 2013189155A JP 2013189155 A JP2013189155 A JP 2013189155A JP 6220610 B2 JP6220610 B2 JP 6220610B2
Authority
JP
Japan
Prior art keywords
frequency
pitch
signal
frequency information
pitch period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013189155A
Other languages
Japanese (ja)
Other versions
JP2015055765A (en
Inventor
優 鎌本
優 鎌本
守谷 健弘
健弘 守谷
登 原田
登 原田
大将 千葉
大将 千葉
滋樹 宮部
滋樹 宮部
武志 山田
武志 山田
牧野 昭二
昭二 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013189155A priority Critical patent/JP6220610B2/en
Publication of JP2015055765A publication Critical patent/JP2015055765A/en
Application granted granted Critical
Publication of JP6220610B2 publication Critical patent/JP6220610B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明はディジタル時系列信号のポストフィルタ処理を実行する信号処理装置、信号処理方法、プログラム、記録媒体に関する。   The present invention relates to a signal processing apparatus, a signal processing method, a program, and a recording medium that perform post filter processing of a digital time series signal.

音声や音響信号の符号化では、デコードした音響信号に対してポストフィルタ処理を行い聴感上の音質を向上させる手法が広く用いられている(非特許文献1、2)。以下、図1、図2を参照して非特許文献1の信号処理装置について説明する。図1は非特許文献1の信号処理装置9の構成を示すブロック図である。図2は非特許文献1の信号処理装置9の動作を示すフローチャートである。図1に示すように非特許文献1の信号処理装置9は、ピッチ改善部91と、減算部92と、ローパスフィルタ部93と、合成部94を含む。信号処理装置9は、これらの構成によりポストフィルタ処理を実行する。ポストフィルタへの入力信号がNサンプルのフレーム毎に処理されるとし、あるフレームの入力信号をX(n)(n=0,1,…,N−1)とする。   In coding audio and acoustic signals, methods for improving postural processing on decoded acoustic signals to improve sound quality on hearing are widely used (Non-Patent Documents 1 and 2). Hereinafter, the signal processing apparatus of Non-Patent Document 1 will be described with reference to FIGS. 1 and 2. FIG. 1 is a block diagram showing a configuration of a signal processing device 9 of Non-Patent Document 1. FIG. 2 is a flowchart showing the operation of the signal processing device 9 of Non-Patent Document 1. As shown in FIG. 1, the signal processing device 9 of Non-Patent Document 1 includes a pitch improving unit 91, a subtracting unit 92, a low-pass filter unit 93, and a combining unit 94. The signal processing device 9 performs post-filter processing with these configurations. Assume that the input signal to the post filter is processed every N sample frames, and the input signal of a certain frame is X (n) (n = 0, 1,..., N−1).

ピッチ改善部91は入力信号X(n)とX(n)のピッチ周期τを用いてピッチ強調信号P(n)を求める。具体的には、まずピッチ改善部91は下記式により、ピッチの強調された中間信号Q(n)を求める。   The pitch improving unit 91 obtains the pitch emphasis signal P (n) using the pitch period τ of the input signals X (n) and X (n). Specifically, first, the pitch improving unit 91 obtains an intermediate signal Q (n) with an emphasized pitch according to the following equation.

Figure 0006220610
Figure 0006220610

ピッチ改善部91はピッチの強調された中間信号Q(n)を用いて、下記式によりピッチ強調信号P(n)を得る(S91)。 The pitch improving unit 91 uses the intermediate signal Q (n) with enhanced pitch to obtain a pitch enhanced signal P (n) by the following equation (S91).

Figure 0006220610
Figure 0006220610

ここで、aは高調波の減衰を制御するパラメタであり、予め定められた定数である。 Here, a is a parameter for controlling the attenuation of harmonics, and is a predetermined constant.

別の表現では、ピッチ改善部91は現在の時間区間の入力信号X(n)に、現在よりもピッチ周期τだけ過去の入力信号x(n−τ)、および現在よりもピッチ周期τだけ未来の入力信号x(n+τ)を合成した信号であるピッチ強調信号P(n)を生成する(S91)。   In another expression, the pitch improving unit 91 uses the input signal X (n) in the current time interval as the past input signal x (n−τ) by the pitch period τ from the current time and the future by the pitch period τ from the current time. The pitch emphasis signal P (n), which is a signal obtained by synthesizing the input signal x (n + τ), is generated (S91).

次に、減算部92は、ピッチ強調信号P(n)から現在の時間区間の入力信号X(n)を減算した残差信号R(n)=P(n)−X(n)を出力する(S92)。ローパスフィルタ部93は、固定値のカットオフ周波数Fc=500Hzのローパスフィルタリングを実行して、残差信号R(n)からカットオフ周波数Fc=500Hz以下の周波数成分のみを抽出した残差信号r(n)を出力する(S93)。合成部94は、現在の時間区間の入力信号X(n)と、ローパスフィルタ部93から出力された低域のみの残差信号r(n)とを合成した信号Y(n)=X(n)+r(n)を生成し、信号Y(n)を出力する(S94)。   Next, the subtraction unit 92 outputs a residual signal R (n) = P (n) −X (n) obtained by subtracting the input signal X (n) of the current time interval from the pitch emphasis signal P (n). (S92). The low-pass filter unit 93 performs low-pass filtering with a fixed cutoff frequency Fc = 500 Hz, and extracts a residual signal r () that extracts only frequency components with a cutoff frequency Fc = 500 Hz or less from the residual signal R (n). n) is output (S93). The synthesizing unit 94 synthesizes the input signal X (n) of the current time interval and the low-frequency residual signal r (n) output from the low-pass filter unit 93, and a signal Y (n) = X (n ) + R (n) is generated and the signal Y (n) is output (S94).

このようにして、非特許文献1の信号処理装置9では、低域(500Hz以下の周波数成分)のピッチ構造を強調することにより聴感上の品質を向上させていた。また、非特許文献2では、上述のローパスフィルタリングの代わりに、全周波数帯域についてピッチ強調を行う方法が用いられている。   In this way, in the signal processing device 9 of Non-Patent Document 1, the audible quality is improved by emphasizing the pitch structure of the low band (frequency component of 500 Hz or less). In Non-Patent Document 2, a method of performing pitch emphasis on the entire frequency band is used instead of the above-described low-pass filtering.

ITU-T Rec. G.718, ITU, 2008.(7.14.1.1節)ITU-T Rec. G.718, ITU, 2008. (Section 7.14.1.1) Chen Juin-Hwey and A. Gersho, “Adaptive postfiltering for quality enhancement of coded speech,” IEEE Transactions on Speech and Audio Processing, Volume: 3, Issue: 1, Pages: 59 - 71, 1995.Chen Juin-Hwey and A. Gersho, “Adaptive postfiltering for quality enhancement of coded speech,” IEEE Transactions on Speech and Audio Processing, Volume: 3, Issue: 1, Pages: 59-71, 1995.

従来の方法では、入力信号に関係なく、固定の周波数成分(500Hz以下)のピッチを強調したピッチ強調信号と入力信号を合成していた。よって、入力信号のピッチによる調波構造が十分に再現できず、必ずしも出力信号の品質が十分に向上しないという課題があった。そこで、本発明では出力信号の品質を向上できる信号処理装置を提供することを目的とする。   In the conventional method, the pitch-enhanced signal in which the pitch of a fixed frequency component (500 Hz or less) is emphasized and the input signal are synthesized regardless of the input signal. Therefore, there is a problem that the harmonic structure based on the pitch of the input signal cannot be sufficiently reproduced, and the quality of the output signal is not necessarily improved sufficiently. Accordingly, an object of the present invention is to provide a signal processing apparatus that can improve the quality of an output signal.

本発明の信号処理装置は、周波数情報取得部と、ピッチ強調信号生成部を含む。   The signal processing device of the present invention includes a frequency information acquisition unit and a pitch enhancement signal generation unit.

周波数情報取得部は、入力信号のピッチ周期に対応する情報に依存して定まる周波数情報を取得する。ピッチ強調信号生成部は、入力信号から、周波数情報により特定される周波数以下の成分のピッチを強調した信号であるピッチ強調信号を生成する。   The frequency information acquisition unit acquires frequency information determined depending on information corresponding to the pitch period of the input signal. The pitch emphasizing signal generation unit generates a pitch emphasizing signal that is a signal in which the pitch of a component equal to or lower than the frequency specified by the frequency information is emphasized from the input signal.

周波数情報取得部により取得される周波数情報は、入力信号のピッチ周期が短いほど高い周波数に対応する情報である、または、入力信号のピッチ周波数が高いほど高い周波数に対応する情報である。   The frequency information acquired by the frequency information acquisition unit is information corresponding to a higher frequency as the pitch period of the input signal is shorter, or information corresponding to a higher frequency as the pitch frequency of the input signal is higher.

本発明の信号処理装置によれば、出力信号の品質を向上できる。   According to the signal processing apparatus of the present invention, the quality of the output signal can be improved.

非特許文献1の信号処理装置の構成を示すブロック図。The block diagram which shows the structure of the signal processing apparatus of a nonpatent literature 1. FIG. 非特許文献1の信号処理装置の動作を示すフローチャート。10 is a flowchart showing the operation of the signal processing device of Non-Patent Document 1. 本発明の実施例1の信号処理装置の構成を示すブロック図。1 is a block diagram illustrating a configuration of a signal processing device according to a first embodiment of the present invention. 本発明の実施例1の信号処理装置の動作を示すフローチャート。The flowchart which shows operation | movement of the signal processing apparatus of Example 1 of this invention. 本発明の変形例1の信号処理装置の構成を示すブロック図。The block diagram which shows the structure of the signal processing apparatus of the modification 1 of this invention. 本発明の変形例1の信号処理装置の動作を示すフローチャート。The flowchart which shows operation | movement of the signal processing apparatus of the modification 1 of this invention. 本発明の実施例2の信号処理装置の構成を示すブロック図。The block diagram which shows the structure of the signal processing apparatus of Example 2 of this invention. 本発明の実施例2の信号処理装置の動作を示すフローチャート。The flowchart which shows operation | movement of the signal processing apparatus of Example 2 of this invention. 本発明の変形例2の信号処理装置の構成を示すブロック図。The block diagram which shows the structure of the signal processing apparatus of the modification 2 of this invention. 本発明の変形例2の信号処理装置の動作を示すフローチャート。The flowchart which shows operation | movement of the signal processing apparatus of the modification 2 of this invention. 本発明の変形例3の信号処理装置の構成を示すブロック図。The block diagram which shows the structure of the signal processing apparatus of the modification 3 of this invention. 本発明の変形例3の信号処理装置の動作を示すフローチャート。The flowchart which shows operation | movement of the signal processing apparatus of the modification 3 of this invention. 本発明の変形例4の信号処理装置の構成を示すブロック図。The block diagram which shows the structure of the signal processing apparatus of the modification 4 of this invention. 本発明の変形例4の信号処理装置の動作を示すフローチャート。The flowchart which shows operation | movement of the signal processing apparatus of the modification 4 of this invention. 音質の客観評価値PESQに基づいて従来技術と本発明を比較して示す図。The figure which compares and shows a prior art and this invention based on the objective evaluation value PESQ of sound quality.

以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。   Hereinafter, embodiments of the present invention will be described in detail. In addition, the same number is attached | subjected to the structure part which has the same function, and duplication description is abbreviate | omitted.

本発明では入力信号のピッチ周波数(基本周波数)またはピッチ周期に依存して、ピッチ強調する周波数帯域を変える。ピッチ強調では低い周波数帯域のピッチを強調するが、ピッチ周波数が高いとき(ピッチ周期が短いとき)は、ピッチ周波数が低いとき(ピッチ周期が長いとき)よりも高い周波数成分までピッチ強調を行う。これにより、ピッチ周期による調波構造の倍音構造を適切に表現することができるので、音質をさらに向上させることができる。   In the present invention, the frequency band for pitch emphasis is changed depending on the pitch frequency (basic frequency) or pitch period of the input signal. In pitch emphasis, the pitch of a low frequency band is emphasized. When the pitch frequency is high (when the pitch period is short), pitch emphasis is performed up to a higher frequency component than when the pitch frequency is low (when the pitch period is long). Thereby, the harmonic structure of the harmonic structure based on the pitch period can be appropriately expressed, so that the sound quality can be further improved.

<信号処理装置への入力>
本発明の信号処理装置には、入力信号X(n)とピッチ周期情報Tとが入力される。入力信号X(n)は、フレーム毎の入力信号であり、あるフレームn番目のサンプルの入力信号をX(n)と表記する(n=1,2,…,N−1,Nはフレーム内のサンプル数)。入力信号X(n)は、入力符号を復号して得た復号音響信号、もしくは、音源からの音をマイクなどにより収音した信号に対して音源分離や残響除去等の処理が行われた後の復元音響信号である。なお、復号音響信号は、周知の音響信号のロッシーな符号化・復号化方法における復号方法により得られた信号であれば何でも良い。例えば、非特許文献1のデコーダにより復号された音響信号や、AMR,G.729などの他の音声・音響信号の圧縮符号化・復号化方法に基づいて、復号された音響信号である。つまり、信号処理装置の入力信号は、原信号に何らかの信号処理を施すことにより得た、原信号に歪みが加わった信号(ロッシーな信号)である。
<Input to signal processor>
An input signal X (n) and pitch period information T are input to the signal processing device of the present invention. An input signal X (n) is an input signal for each frame, and an input signal of an n-th sample in a frame is expressed as X (n) (n = 1, 2,..., N−1, N are in-frame) Number of samples). The input signal X (n) is a decoded sound signal obtained by decoding an input code or a signal obtained by collecting sound from a sound source by a microphone or the like after processing such as sound source separation or dereverberation is performed. This is a restored acoustic signal. The decoded acoustic signal may be any signal obtained by a decoding method in a well-known acoustic signal lossy encoding / decoding method. For example, an acoustic signal decoded by a decoder of Non-Patent Document 1, AMR, G. 729 is a sound signal decoded based on a compression encoding / decoding method of other voice / acoustic signals such as 729. That is, the input signal of the signal processing device is a signal (lossy signal) obtained by applying some kind of signal processing to the original signal and distorting the original signal.

ピッチ周期情報Tは、現在または現在に近接するフレームの入力信号のピッチ周期に対応する情報であれば何でも良い。「ピッチ周期に対応する情報」は、例えば、ピッチ周期そのものであってもよいし、ピッチ周期を量子化した値であってもよいし、ピッチ周期またはその量子化値に対応するインデックス符号であってもよい。また、ピッチ周期はピッチ周波数の逆数であるので、ピッチ周波数や、ピッチ周波数を量子化した値、ピッチ周波数またはその量子化値に対応するインデックス符号、を「ピッチ周期情報T」としてもよい。ピッチ周期情報Tは、例えば、圧縮された音響信号から復号音響信号を得る過程で得られる、入力信号(復号音響信号)X(n)に対応するピッチ周期τである。「X(n)に対応するピッチ周期τ」は、X(n)を含むフレームX=(X(1),X(2),…,X(N−1))のピッチ周期でも良いし、X(n)を含むフレームの近傍のフレームのピッチ周期でも良いし、X(n)を含むフレームの近傍のフレームのピッチ周期の平均値や重み付き平均値や最大値/最小値/中央値のような統計値でもよい。また、X(n)に対応するピッチ周期τの量子化値τ´=Round(τ)をピッチ周期τとしてもよい。ここでRound関数は実数値を整数値に変換する関数であり、一番近い整数値に変換する四捨五入でもよいし、床関数(切り捨て)でもよいし、天井関数(切り上げ)でもよい。   The pitch period information T may be any information as long as it corresponds to the pitch period of the input signal of the current frame or a frame close to the present. The “information corresponding to the pitch period” may be, for example, the pitch period itself, a value obtained by quantizing the pitch period, or an index code corresponding to the pitch period or its quantized value. May be. Since the pitch period is the reciprocal of the pitch frequency, the pitch frequency, a value obtained by quantizing the pitch frequency, or an index code corresponding to the pitch frequency or the quantized value may be used as the “pitch period information T”. The pitch period information T is, for example, a pitch period τ corresponding to an input signal (decoded acoustic signal) X (n) obtained in the process of obtaining a decoded acoustic signal from a compressed acoustic signal. “Pitch period τ corresponding to X (n)” may be a pitch period of a frame X = (X (1), X (2),..., X (N−1)) including X (n). It may be the pitch period of the frame near the frame including X (n), the average value of the pitch period of the frame near the frame including X (n), the weighted average value, or the maximum value / minimum value / median value. Such statistics may be used. Alternatively, the quantized value τ ′ = Round (τ) of the pitch period τ corresponding to X (n) may be set as the pitch period τ. Here, the Round function is a function that converts a real value into an integer value, and may be rounded off to the nearest integer value, a floor function (rounded down), or a ceiling function (rounded up).

以下、図3、図4を参照して実施例1の信号処理装置について説明する。図3は、本実施例の信号処理装置1の構成を示すブロック図である。図4は、本実施例の信号処理装置1の動作を示すフローチャートである。図3に示すように、本実施例の信号処理装置1は、周波数情報取得部11と、ピッチ強調信号生成部12を含む。   Hereinafter, the signal processing apparatus according to the first embodiment will be described with reference to FIGS. 3 and 4. FIG. 3 is a block diagram showing the configuration of the signal processing apparatus 1 of the present embodiment. FIG. 4 is a flowchart showing the operation of the signal processing apparatus 1 of the present embodiment. As shown in FIG. 3, the signal processing device 1 of the present embodiment includes a frequency information acquisition unit 11 and a pitch enhancement signal generation unit 12.

〔周波数情報取得部11〕
周波数情報取得部11は、入力されたピッチ周期情報Tに基づいて、周波数を特定する情報Fc(以下、「周波数情報Fc」と呼ぶ)を取得する。別の表現では、周波数情報取得部11は、入力信号のピッチ周期に対応する情報(ピッチ周期情報T)に依存して定まる周波数情報Fcを取得する(S11)。周波数情報Fcは、後述のピッチ強調信号生成部12でピッチを強調する周波数成分を特定するために用いられる情報であり、例えば、ピッチを強調する周波数の上限値である。
[Frequency information acquisition unit 11]
The frequency information acquisition unit 11 acquires information Fc for specifying a frequency (hereinafter referred to as “frequency information Fc”) based on the input pitch period information T. In another expression, the frequency information acquisition unit 11 acquires frequency information Fc determined depending on information (pitch period information T) corresponding to the pitch period of the input signal (S11). The frequency information Fc is information used for specifying a frequency component for emphasizing the pitch by the pitch emphasis signal generator 12 described later, and is, for example, an upper limit value of the frequency for emphasizing the pitch.

具体的には、周波数情報取得部11は、ピッチ周期が短いほど周波数情報Fcにより特定される周波数が高くなるように、周波数情報Fcを決定する。例えば、ピッチ周期Tに対応するピッチ周期をτとし、τについての単調非増加関数をg(τ)としたとき、周波数情報取得部11は、
Fc=g(τ)
により周波数情報Fcを決定する。単調非増加関数g(τ)の一例は、
g(τ)=M×fs/τ
である。ここで、Mは正の数であり、fsはサンプリング周波数である。
Specifically, the frequency information acquisition unit 11 determines the frequency information Fc so that the frequency specified by the frequency information Fc becomes higher as the pitch period is shorter. For example, when the pitch period corresponding to the pitch period T is τ and the monotonous non-increasing function for τ is g (τ), the frequency information acquisition unit 11
Fc = g (τ)
To determine the frequency information Fc. An example of a monotonic non-increasing function g (τ) is
g (τ) = M × fs / τ
It is. Here, M is a positive number and fs is a sampling frequency.

言い換えれば、周波数情報取得部11により取得される周波数情報Fcは、入力信号のピッチ周期が短いほど高い周波数に対応する情報であるか、または、入力信号のピッチ周波数が高いほど高い周波数に対応する情報である。   In other words, the frequency information Fc acquired by the frequency information acquisition unit 11 is information corresponding to a higher frequency as the pitch period of the input signal is shorter, or corresponds to a higher frequency as the pitch frequency of the input signal is higher. Information.

言い換えれば、入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値の場合に対応する情報であるときに、周波数情報取得部11で取得される周波数情報により特定される周波数を第1周波数とする。さらに、入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値よりも大きい第2値の場合に対応する情報であるときに、周波数情報取得部11で取得される周波数情報により特定される周波数を第2周波数とする。この場合、第1周波数が第2周波数よりも高くなる。   In other words, when the information corresponding to the pitch period of the input signal is information corresponding to the case where the pitch period is the first value, the frequency specified by the frequency information acquired by the frequency information acquisition unit 11 is the first. The frequency. Furthermore, when the information corresponding to the pitch period of the input signal is information corresponding to the case where the pitch period is a second value larger than the first value, the information is specified by the frequency information acquired by the frequency information acquisition unit 11. This frequency is the second frequency. In this case, the first frequency is higher than the second frequency.

〔ピッチ強調信号生成部12〕
ピッチ強調信号生成部12は、周波数情報取得部11で取得した周波数情報Fcと入力信号X(n)を入力として、入力信号X(n)のうち周波数情報Fcにより特定される周波数成分のピッチを強調したピッチ強調信号PL(n)を生成する。すなわち、入力信号X(n)のうち周波数情報Fc以下の周波数成分のピッチのみを強調したピッチ強調信号PL(n)を出力信号Y(n)として出力する。別の表現では、ピッチ強調信号生成部12は、入力信号X(n)から、周波数情報Fcにより特定される周波数以下の成分のピッチを強調した信号であるピッチ強調信号PL(n)を生成する(S12)。
[Pitch emphasis signal generator 12]
The pitch emphasis signal generation unit 12 receives the frequency information Fc acquired by the frequency information acquisition unit 11 and the input signal X (n) and inputs the pitch of the frequency component specified by the frequency information Fc in the input signal X (n). An enhanced pitch emphasis signal PL (n) is generated. That is, a pitch emphasis signal PL (n) that emphasizes only the pitch of frequency components equal to or lower than the frequency information Fc in the input signal X (n) is output as the output signal Y (n). In another expression, the pitch emphasis signal generation unit 12 generates a pitch emphasis signal PL (n) that is a signal in which the pitch of the component equal to or lower than the frequency specified by the frequency information Fc is emphasized from the input signal X (n). (S12).

<変形例1>
以下、図5、図6を参照して、本実施例の周波数情報取得部11に改変を加えた変形例1の信号処理装置について説明する。図5は、本変形例の信号処理装置1aの構成を示すブロック図である。図6は本変形例の信号処理装置1aの動作を示すフローチャートである。図5に示すように、本変形例の信号処理装置1aは、周波数情報取得部11aと、ピッチ強調信号生成部12を含む。
<Modification 1>
Hereinafter, with reference to FIG. 5 and FIG. 6, a signal processing apparatus of Modification 1 in which the frequency information acquisition unit 11 of the present embodiment is modified will be described. FIG. 5 is a block diagram showing the configuration of the signal processing device 1a of the present modification. FIG. 6 is a flowchart showing the operation of the signal processing device 1a of the present modification. As illustrated in FIG. 5, the signal processing device 1 a according to the present modification includes a frequency information acquisition unit 11 a and a pitch enhancement signal generation unit 12.

周波数情報取得部11aは、ピッチ周波数が高いほど周波数情報Fcにより特定される周波数が高くなるように、周波数情報Fcを決定する(S11a)。例えば、ピッチ周期Tに対応するピッチ周波数をFpとし、Fpについての単調非減少関数をh(Fp)としたとき、周波数情報取得部11aは、
Fc=h(Fp)
により周波数情報Fcを求める。単調非減少関数h(Fp)の一例は、
h(Fp)=M×Fp
である。ここで、Mは正の数である。なお、Mを正の整数とすると(つまり、周波数情報Fcをピッチ周波数Fpの整数倍とすると)、ピッチ周期による調波構造の倍音構造をより適切に表現でき、かつ余計な成分を強調せずに済むので復号の品質を向上させることができる。
The frequency information acquisition unit 11a determines the frequency information Fc so that the higher the pitch frequency, the higher the frequency specified by the frequency information Fc (S11a). For example, when the pitch frequency corresponding to the pitch period T is Fp and the monotonous non-decreasing function for Fp is h (Fp), the frequency information acquisition unit 11a
Fc = h (Fp)
To obtain frequency information Fc. An example of a monotonic non-decreasing function h (Fp) is
h (Fp) = M × Fp
It is. Here, M is a positive number. If M is a positive integer (that is, frequency information Fc is an integer multiple of pitch frequency Fp), the harmonic structure of the harmonic structure based on the pitch period can be expressed more appropriately, and unnecessary components are not emphasized. Therefore, the decoding quality can be improved.

以下、図7、図8を参照して実施例2の信号処理装置について説明する。図7は、本実施例の信号処理装置2の構成を示すブロック図である。図8は、本実施例の信号処理装置2の動作を示すフローチャートである。図7に示すように、本実施例の信号処理装置2は、周波数情報取得部21と、ピッチ強調信号生成部22と、合成部24を含む。ピッチ強調信号生成部22は、ピッチ改善部221と、減算部222と、ローパスフィルタ部223を含む。図1に示した従来法と信号処理装置2とは、ローパスフィルタ部のカットオフ周波数が固定値ではなく、ピッチ周期情報Tに依存して変化している点で異なる。   The signal processing apparatus according to the second embodiment will be described below with reference to FIGS. FIG. 7 is a block diagram illustrating a configuration of the signal processing device 2 according to the present embodiment. FIG. 8 is a flowchart showing the operation of the signal processing apparatus 2 of the present embodiment. As illustrated in FIG. 7, the signal processing device 2 according to the present exemplary embodiment includes a frequency information acquisition unit 21, a pitch enhancement signal generation unit 22, and a synthesis unit 24. The pitch enhancement signal generation unit 22 includes a pitch improvement unit 221, a subtraction unit 222, and a low-pass filter unit 223. The conventional method shown in FIG. 1 differs from the signal processing apparatus 2 in that the cutoff frequency of the low-pass filter section is not a fixed value but changes depending on the pitch period information T.

〔周波数情報取得部21〕
周波数情報取得部21は、実施例1と同様の処理を行うことで、ピッチ周期情報Tから周波数情報Fcを取得する。詳細には、周波数情報取得部21は、現在または過去の時間区間の入力信号X(n)のピッチ周期に対応する情報(ピッチ周期情報T)に依存して定まる周波数情報Fcを取得する(S21)。
[Frequency information acquisition unit 21]
The frequency information acquisition unit 21 acquires the frequency information Fc from the pitch period information T by performing the same processing as in the first embodiment. Specifically, the frequency information acquisition unit 21 acquires frequency information Fc determined depending on information (pitch period information T) corresponding to the pitch period of the input signal X (n) in the current or past time interval (S21). ).

なお前述同様に、現在または過去の時間区間の入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値である場合に対応する情報であるときに、周波数情報取得部21で取得される周波数情報により特定される周波数を第1周波数とする。さらに、現在または過去の時間区間の入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値よりも大きい第2値である場合に対応する情報であるときに、周波数情報取得部21で取得される周波数情報により特定される周波数を第2周波数とする。この場合に、第1周波数が第2周波数よりも高くなる。   As described above, when the information corresponding to the pitch period of the input signal in the current or past time interval is information corresponding to the case where the pitch period is the first value, the frequency information acquisition unit 21 acquires the information. The frequency specified by the frequency information is set as the first frequency. Further, when the information corresponding to the pitch period of the input signal in the current or past time interval is information corresponding to the case where the pitch period is a second value larger than the first value, the frequency information acquisition unit 21 The frequency specified by the acquired frequency information is set as the second frequency. In this case, the first frequency is higher than the second frequency.

〔ピッチ改善部221〕
ピッチ改善部221は、入力信号X(n)とピッチ周期情報Tを用いてピッチ強調信号P(n)を求める。ピッチ改善部221は、例えば、非特許文献1と同様の方法で、ピッチ周期情報Tにより特定されるピッチ周期τを用いてピッチの強調された中間信号Q(n)を求める。別の表現では、ピッチ改善部221は、現在の時間区間の入力信号に、現在よりもピッチ周期だけ過去、および/または、現在よりもピッチ周期だけ未来の入力信号を合成した信号であるピッチ強調信号を生成する(S221)。
[Pitch improvement unit 221]
The pitch improving unit 221 obtains the pitch emphasis signal P (n) using the input signal X (n) and the pitch period information T. For example, the pitch improving unit 221 obtains the intermediate signal Q (n) with the enhanced pitch by using the pitch period τ specified by the pitch period information T in the same manner as in Non-Patent Document 1. In another expression, the pitch improving unit 221 is a pitch emphasis that is a signal obtained by synthesizing an input signal in the current time interval with an input signal that is past in the pitch period from the present and / or a future input signal in the pitch period from the present. A signal is generated (S221).

なおピッチ改善部221は、b,cを正の数として、   The pitch improving unit 221 uses b and c as positive numbers.

Figure 0006220610
Figure 0006220610

によりQ(n)を求めても良い。非特許文献1の場合はb,cは固定値(0.5)だが、他の正の値であっても良い。そして、ピッチ改善部221は中間信号Q(n)と入力信号X(n)から、 Q (n) may be obtained by In the case of Non-Patent Document 1, b and c are fixed values (0.5), but may be other positive values. And the pitch improvement part 221 is obtained from the intermediate signal Q (n) and the input signal X (n).

Figure 0006220610
Figure 0006220610

であるピッチ強調信号P(n)を求める。 A pitch emphasis signal P (n) is obtained.

ここで、ピッチ周期情報Tに対応するピッチ周期τは、例えば、復号装置においてピッチ周期情報Tを得る処理と逆の処理を行うことで得られる。ピッチ周期情報Tが、ピッチ周期とピッチ周期情報とを対応付けて記憶したテーブルを参照することで得たものである場合は、同じテーブルを参照することでピッチ周期情報Tからピッチ周期τを得ることができる。また、ピッチ周期情報Tが、ピッチ周期に対する何らかの関数値により求められたものである場合は、その逆関数にピッチ周期情報Tを入力すれば、ピッチ周期τが得られる。ピッチ周期情報Tが、ピッチ周波数Fpの場合は、τ=fs/Fp(fsはサンプリング周波数)により、ピッチ周期τが得られる。   Here, the pitch period τ corresponding to the pitch period information T is obtained, for example, by performing a process reverse to the process of obtaining the pitch period information T in the decoding device. When the pitch period information T is obtained by referring to a table in which the pitch period and the pitch period information are stored in association with each other, the pitch period τ is obtained from the pitch period information T by referring to the same table. be able to. When the pitch period information T is obtained from some function value with respect to the pitch period, the pitch period τ can be obtained by inputting the pitch period information T to the inverse function. When the pitch period information T is the pitch frequency Fp, the pitch period τ is obtained by τ = fs / Fp (fs is the sampling frequency).

〔減算部222〕
減算部222は、ピッチ改善部221で求めたピッチ強調信号P(n)から現在の時間区間の入力信号X(n)を減算した残差信号R(n)=P(n)−X(n)を出力する(S222)。
[Subtraction unit 222]
The subtraction unit 222 subtracts the input signal X (n) of the current time interval from the pitch emphasis signal P (n) obtained by the pitch improvement unit 221 to obtain a residual signal R (n) = P (n) −X (n ) Is output (S222).

〔ローパスフィルタ部223〕
ローパスフィルタ部223には、減算部222から出力された残差信号R(n)と周波数情報取得部21が取得した周波数情報Fcが入力される。ローパスフィルタ部223は、入力された残差信号R(n)から周波数情報Fcにより特定される周波数以下の低周波数成分だけを取り出した残差信号r(n)を抽出する。別の表現では、ローパスフィルタ部223は、残差信号R(n)から周波数情報取得部21で取得した周波数情報Fcにより特定される周波数成分以下の信号のみを抽出する(S223)。
[Low-pass filter unit 223]
The low-pass filter unit 223 receives the residual signal R (n) output from the subtraction unit 222 and the frequency information Fc acquired by the frequency information acquisition unit 21. The low-pass filter unit 223 extracts a residual signal r (n) obtained by extracting only a low frequency component equal to or lower than the frequency specified by the frequency information Fc from the input residual signal R (n). In other words, the low-pass filter unit 223 extracts only signals having a frequency component equal to or lower than the frequency information Fc acquired by the frequency information acquisition unit 21 from the residual signal R (n) (S223).

すなわち、ここでの「周波数情報Fc」は、ローパスフィルタ部223のカットオフ周波数である。また、残差信号r(n)は入力信号のうちのカットオフ周波数Fc以下の周波数成分のピッチを強調したピッチ強調信号である。   That is, the “frequency information Fc” here is a cutoff frequency of the low-pass filter unit 223. The residual signal r (n) is a pitch emphasizing signal that emphasizes the pitch of the frequency component of the input signal below the cutoff frequency Fc.

〔合成部24〕
合成部24は、現在の時間区間の入力信号X(n)とローパスフィルタ部223から出力された残差信号r(n)とを合成した出力信号Y(n)を生成する(S24)。
[Synthesis unit 24]
The synthesizer 24 generates an output signal Y (n) obtained by synthesizing the input signal X (n) in the current time interval and the residual signal r (n) output from the low-pass filter 223 (S24).

なお、実施例1においてピッチ強調する度合いを調整すれば、実施例1のピッチ強調信号生成部12から出力されるピッチ強調信号PL(n)を、実施例2の合成部24から出力されるr(n)とX(n)を合成した信号Y(n)と等価な信号とすることができる。   If the degree of pitch emphasis in the first embodiment is adjusted, the pitch emphasis signal PL (n) output from the pitch emphasis signal generation unit 12 in the first embodiment is output from the synthesis unit 24 in the second embodiment. A signal equivalent to the signal Y (n) obtained by combining (n) and X (n) can be obtained.

<変形例2>
以下、図9、図10を参照して、本実施例の周波数情報取得部21に改変を加えた変形例2の信号処理装置について説明する。図9は、本変形例の信号処理装置2bの構成を示すブロック図である。図10は本変形例の信号処理装置2bの動作を示すフローチャートである。図9に示すように、本変形例の信号処理装置2bは、周波数情報取得部21bと、ピッチ強調信号生成部22と、合成部24を含む。
<Modification 2>
Hereinafter, with reference to FIG. 9 and FIG. 10, a signal processing apparatus of Modification 2 in which the frequency information acquisition unit 21 of the present embodiment is modified will be described. FIG. 9 is a block diagram showing a configuration of a signal processing device 2b according to this modification. FIG. 10 is a flowchart showing the operation of the signal processing device 2b of the present modification. As illustrated in FIG. 9, the signal processing device 2 b according to the present modification includes a frequency information acquisition unit 21 b, a pitch enhancement signal generation unit 22, and a synthesis unit 24.

〔周波数情報取得部21b〕
周波数情報取得部21bには、予め複数の周波数情報Fcの候補Fc1<Fc2<…<Fct(tは周波数情報の候補値の総数)が記憶されており、周波数情報取得部21bは、入力されたピッチ周期情報Tに依存していずれかの周波数情報を選択し、選択した周波数情報を出力する(S21b)。
[Frequency information acquisition unit 21b]
The frequency information acquisition unit 21b stores a plurality of frequency information Fc candidates Fc1 <Fc2 <... <Fct (t is the total number of frequency information candidate values) in advance, and the frequency information acquisition unit 21b receives the frequency information acquisition unit 21b. Depending on the pitch period information T, any frequency information is selected and the selected frequency information is output (S21b).

例えば、周波数情報取得部21bに2種類の周波数情報の候補Fc1,Fc2(Fc1<Fc2)が記憶されている場合、入力されたピッチ周期情報Tに対応するピッチ周期τが所定の閾値TH以下である場合(τ≦THの場合)には、周波数情報取得部21bは大きい方の周波数情報Fc2を周波数情報Fcとして選択し、そうでない場合(τ>THの場合)には、周波数情報取得部21bは小さい方の周波数情報Fc1を周波数情報Fcとして選択する。   For example, when two types of frequency information candidates Fc1 and Fc2 (Fc1 <Fc2) are stored in the frequency information acquisition unit 21b, the pitch period τ corresponding to the input pitch period information T is equal to or less than a predetermined threshold TH. In some cases (when τ ≦ TH), the frequency information acquisition unit 21b selects the larger frequency information Fc2 as the frequency information Fc. Otherwise (when τ> TH), the frequency information acquisition unit 21b. Selects the smaller frequency information Fc1 as the frequency information Fc.

周波数情報取得部21bに3種類の周波数情報の候補Fc1,Fc2,Fc3(Fc1<Fc2<Fc3)が記憶されている場合、入力されたピッチ周期情報Tに対応するピッチ周期τが所定の第1の閾値TH1以下である場合(τ≦TH1の場合)には、周波数情報取得部21bは最も大きい周波数情報Fc3を周波数情報Fcとして選択し、ピッチ周期τが所定の第1の閾値TH1より大きく、かつ、所定の第2の閾値TH2以下である場合(TH1<τ≦TH2の場合)には、周波数情報取得部21bは2番目に大きい周波数情報Fc2を周波数情報Fcとして選択し、ピッチ周期τが所定の第2の閾値TH2より大きい場合(τ>TH2の場合)には、周波数情報取得部21bは最も小さい周波数情報Fc1を周波数情報Fcとして選択する。ここで、0<TH1<TH2である。   When three types of frequency information candidates Fc1, Fc2, and Fc3 (Fc1 <Fc2 <Fc3) are stored in the frequency information acquisition unit 21b, the pitch period τ corresponding to the input pitch period information T is a predetermined first value. Frequency information acquisition unit 21b selects the largest frequency information Fc3 as the frequency information Fc, and the pitch period τ is greater than the predetermined first threshold TH1, When the frequency is less than or equal to the predetermined second threshold TH2 (when TH1 <τ ≦ TH2), the frequency information acquisition unit 21b selects the second largest frequency information Fc2 as the frequency information Fc, and the pitch period τ is When larger than the predetermined second threshold TH2 (when τ> TH2), the frequency information acquisition unit 21b selects the smallest frequency information Fc1 as the frequency information Fc. That. Here, 0 <TH1 <TH2.

周波数情報取得部21bに4種類以上の周波数情報の候補Fc1,Fc2,…,Fct(Fc1<Fc2<…<Fct)が記憶されている場合も同様に、周波数情報取得部21bは複数の閾値を用いて、ピッチ周期情報Tに対応するいずれか1つの周波数情報Fcj(j=1,2,…,t)を周波数情報Fcとして決定すれば良い。   Similarly, when the frequency information acquisition unit 21b stores four or more types of frequency information candidates Fc1, Fc2, ..., Fct (Fc1 <Fc2 <... <Fct), the frequency information acquisition unit 21b sets a plurality of threshold values. The frequency information Fcj (j = 1, 2,..., T) corresponding to the pitch period information T may be determined as the frequency information Fc.

なお、「ピッチ周期情報Tに対応するピッチ周期τ」の代わりに、「ピッチ周期情報Tに対応するピッチ周波数Fp」と閾値を比較することで判定を行っても良い。この場合は、上述の説明とは大小関係が逆になる。つまり、周波数情報取得部21bに2種類の周波数情報Fc1,Fc2(Fc1<Fc2)が記憶されている場合、入力されたピッチ周期情報Tに対応するピッチ周波数Fpが所定の閾値TH´以下である場合(Fp≦TH´の場合)には、周波数情報取得部21bは小さい方の周波数情報Fc1を周波数情報Fcとして選択し、そうでない場合(Fp>TH´の場合)には、周波数情報取得部21bは大きい方の周波数情報Fc2を周波数情報Fcとして選択する。   In addition, instead of “pitch period τ corresponding to pitch period information T”, the threshold may be compared with “pitch frequency Fp corresponding to pitch period information T”. In this case, the magnitude relationship is reversed from the above description. That is, when two types of frequency information Fc1, Fc2 (Fc1 <Fc2) are stored in the frequency information acquisition unit 21b, the pitch frequency Fp corresponding to the input pitch period information T is equal to or less than a predetermined threshold value TH ′. In the case (Fp ≦ TH ′), the frequency information acquisition unit 21b selects the smaller frequency information Fc1 as the frequency information Fc. Otherwise (in the case of Fp> TH ′), the frequency information acquisition unit. 21b selects the larger frequency information Fc2 as the frequency information Fc.

周波数情報取得部21bに3種類の周波数情報Fc1,Fc2,Fc3(Fc1<Fc2<Fc3)が記憶されている場合、入力されたピッチ周期情報Tに対応するピッチ周波数Fpが所定の第1の閾値TH1´以下である場合(Fp≦TH1´の場合)には、周波数情報取得部21bは最も小さい周波数情報Fc1を周波数情報Fcとして選択し、ピッチ周波数Fpが所定の第1の閾値TH1´より大きく、かつ、所定の第2の閾値TH2´以下である場合(TH1´<Fp≦TH2´の場合)には、周波数情報取得部21bは2番目に小さい周波数情報Fc2を周波数情報Fcとして選択し、ピッチ周波数Fpが所定の第2の閾値TH2´より大きい場合(Fp>TH2´の場合)には、周波数情報取得部21bは最も大きい周波数情報Fc3を周波数情報Fcとして選択する。ここで、0<TH1´<TH2´である。   When three types of frequency information Fc1, Fc2, Fc3 (Fc1 <Fc2 <Fc3) are stored in the frequency information acquisition unit 21b, the pitch frequency Fp corresponding to the input pitch period information T is a predetermined first threshold value. When it is equal to or lower than TH1 ′ (when Fp ≦ TH1 ′), the frequency information acquisition unit 21b selects the smallest frequency information Fc1 as the frequency information Fc, and the pitch frequency Fp is larger than a predetermined first threshold TH1 ′. And when it is below the predetermined second threshold TH2 ′ (when TH1 ′ <Fp ≦ TH2 ′), the frequency information acquisition unit 21b selects the second smallest frequency information Fc2 as the frequency information Fc, When the pitch frequency Fp is larger than the predetermined second threshold TH2 ′ (when Fp> TH2 ′), the frequency information acquisition unit 21b has the largest frequency information Fc3. Is selected as frequency information Fc. Here, 0 <TH1 ′ <TH2 ′.

<変形例3、変形例4>
以下、図11、12、13、14を参照して、実施例1または実施例2の構成に、さらに対応表記憶部を含む構成とした変形例3、4の信号処理装置について説明する。図11は、変形例3の信号処理装置1cの構成を示すブロック図である。図12は変形例3の信号処理装置1cの動作を示すフローチャートである。図13は、変形例4の信号処理装置2cの構成を示すブロック図である。図14は変形例4の信号処理装置2cの動作を示すフローチャートである。
<Modification 3 and Modification 4>
Hereinafter, with reference to FIGS. 11, 12, 13, and 14, signal processing apparatuses according to modifications 3 and 4 in which the configuration of the first or second embodiment further includes a correspondence table storage unit will be described. FIG. 11 is a block diagram illustrating a configuration of a signal processing device 1c according to the third modification. FIG. 12 is a flowchart showing the operation of the signal processing device 1c of the third modification. FIG. 13 is a block diagram illustrating a configuration of a signal processing device 2c according to the fourth modification. FIG. 14 is a flowchart showing the operation of the signal processing device 2c of the fourth modification.

図11に示すように変形例3の信号処理装置1cは、周波数情報取得部11cと、ピッチ強調信号生成部12と、対応表記憶部cを含む。図13に示すように変形例4の信号処理装置2cは、周波数情報取得部21cと、ピッチ強調信号生成部22と、合成部24と、対応表記憶部cを含む。   As illustrated in FIG. 11, the signal processing device 1 c according to the third modification includes a frequency information acquisition unit 11 c, a pitch enhancement signal generation unit 12, and a correspondence table storage unit c. As illustrated in FIG. 13, the signal processing device 2c according to the fourth modification includes a frequency information acquisition unit 21c, a pitch emphasis signal generation unit 22, a synthesis unit 24, and a correspondence table storage unit c.

〔対応表記憶部c〕
対応表記憶部cには、ピッチ周期に対応する情報と周波数情報の候補値に対応する情報とを対応付けた対応表が予め記憶されている。ピッチ周期情報Tに対応する情報とは、ピッチ周期情報Tそのもの、ピッチ周期τ、ピッチ周波数Fp、あるいは、ピッチ周期τの量子化値、ピッチ周波数Fpの量子化値、ピッチ周期情報Tの量子化値、等である。ピッチ周期情報Tの量子化値とは、例えば、ピッチ周期情報Tを右にビットシフトして粗く量子化した値である。
[Correspondence table storage unit c]
The correspondence table storage unit c stores in advance a correspondence table in which information corresponding to the pitch period and information corresponding to the candidate value of the frequency information are associated with each other. The information corresponding to the pitch period information T is the pitch period information T itself, the pitch period τ, the pitch frequency Fp, or the quantized value of the pitch period τ, the quantized value of the pitch frequency Fp, and the quantized pitch period information T. Value, etc. The quantized value of the pitch period information T is, for example, a value obtained by coarsely quantizing the pitch period information T by bit shifting to the right.

対応表は、ピッチ周期情報に対応する情報ごとに、対応する周波数情報の候補値が対応付けて記憶されていてもよいし、ピッチ周期情報に対応する情報の取りうる範囲毎に、対応する周波数情報の候補値が対応付けて記憶されていてもよい。いずれにしても、対応表に記憶されたある2つのピッチ周期に対応する情報と周波数情報の候補値に対応する情報との組のうち、ピッチ周期が短い方に対応する組により特定される周波数情報の候補値が、ピッチ周期が長い方に対応する組により特定される周波数情報の候補値よりも周波数が高い。言い換えれば、対応表における、ある2つのピッチ周期情報Tに対応する値と周波数情報の候補値との組を見たときに、ピッチ周期情報Tに対応するピッチ周期が大きい方の組の周波数情報の候補値Fc1が、ピッチ周期情報Tに対応するピッチ周期が小さい方の組の周波数情報の候補値Fc2よりも小さい。さらに言い換えれば、対応表における異なるピッチ周期情報Tに対応する値と周波数情報の候補値との組を見たときに、ピッチ周期情報Tに対応するピッチ周波数が高い方の組の周波数情報の候補値Fc2が、ピッチ周期情報に対応するピッチ周波数が低い方の組の周波数情報の候補値Fc1よりも大きい。   In the correspondence table, for each piece of information corresponding to the pitch period information, a corresponding frequency information candidate value may be stored in association with each other, or for each possible range of information corresponding to the pitch period information, the corresponding frequency Information candidate values may be stored in association with each other. In any case, the frequency specified by the pair corresponding to the shorter pitch period out of the pair corresponding to the two pitch periods stored in the correspondence table and the information corresponding to the frequency information candidate value. The information candidate value has a higher frequency than the frequency information candidate value specified by the pair corresponding to the longer pitch period. In other words, when looking at a pair of a value corresponding to two pitch period information T and a candidate value of frequency information in the correspondence table, the frequency information of the group having the larger pitch period corresponding to the pitch period information T The candidate value Fc1 is smaller than the candidate value Fc2 of the frequency information of the group having the smaller pitch period corresponding to the pitch period information T. In other words, when a set of values corresponding to different pitch period information T and frequency information candidate values in the correspondence table is viewed, a candidate of frequency information of a set having a higher pitch frequency corresponding to the pitch period information T The value Fc2 is larger than the candidate value Fc1 of the frequency information of the group having the lower pitch frequency corresponding to the pitch period information.

なお、上記の説明では、対応表には周波数情報の候補値が対応付けられているものとして説明したが、周波数情報の候補値の代わりに、周波数情報に1対1対応するインデックス値が対応付けて記憶されていても良い。   In the above description, it is assumed that the frequency information candidate values are associated with the correspondence table, but instead of the frequency information candidate values, one-to-one index values are associated with the frequency information. May be remembered.

〔周波数情報取得部11c、21c〕
周波数情報取得部11c、21cは、対応表を参照して、現在または過去の時間区間の入力信号のピッチ周期に対応する周波数情報の候補値を周波数情報Fcとして取得する(S11c、S21c)例えば、周波数情報取得部11c、21cは、入力されたピッチ周期情報Tに対応する周波数情報の候補値を周波数情報Fcとして取得し、取得した周波数情報Fcを出力する。
[Frequency information acquisition unit 11c, 21c]
The frequency information acquisition units 11c and 21c refer to the correspondence table, and acquire frequency information candidate values corresponding to the pitch period of the input signal in the current or past time interval as frequency information Fc (S11c, S21c). The frequency information acquisition units 11c and 21c acquire frequency information candidate values corresponding to the input pitch period information T as frequency information Fc, and output the acquired frequency information Fc.

<変形例5>
実施例1や実施例2および変形例1、変形例2、変形例3、変形例4の構成において、ピッチ周波数(またはピッチ周期)だけでなく、ピッチ周期情報Tにより特定される周期性または定常性を表す指標に応じて周波数情報Fcを決定しても良い。すなわち、ピッチ周期情報Tにより特定される周期性または定常性を表す指標が定常性が高いことに対応する場合の方が、ピッチ周期情報Tにより特定される周期性または定常性を表す指標が定常性が低いことに対応する場合よりも周波数情報Fcが大きくなるように、周波数情報Fcを決定しても良い。
<Modification 5>
In the configurations of the first embodiment, the second embodiment, the first modification, the second modification, the third modification, and the fourth modification, not only the pitch frequency (or pitch period) but also the periodicity or steady state specified by the pitch period information T The frequency information Fc may be determined according to the index indicating the sex. That is, the index indicating the periodicity or stationarity specified by the pitch period information T is more steady when the index indicating the periodicity or stationarity specified by the pitch period information T corresponds to the higher stationarity. The frequency information Fc may be determined so that the frequency information Fc is larger than that corresponding to the low performance.

周期性または定常性が高い場合には調波構造の影響が高いため、周波数情報Fcの値を大きくしてより多くの調波構造を表現することで、より出力信号の品質を向上させることができる。   Since the influence of the harmonic structure is high when the periodicity or the stationarity is high, the quality of the output signal can be further improved by increasing the value of the frequency information Fc to express more harmonic structures. it can.

例えば、実施例1および変形例1において、周波数情報Fcを求めるときに正の数Mを用いているが、周期性または定常性が高いほどMの値を大きくする。Mの値の決定は、周期性または定常性を表す指標が定常性が高いほど大きな値を取る指標である場合は、この指標値に関する単調増加関数により決定すればよい。あるいは、周期性または定常性を表す指標が定常性が低いほど大きな値を取る指標である場合は、この指標値に関する単調減少関数により決定すればよい。   For example, in Example 1 and Modification 1, the positive number M is used when obtaining the frequency information Fc, but the value of M is increased as the periodicity or stationarity increases. The value of M may be determined by a monotonically increasing function related to this index value when the index indicating periodicity or stationarity is an index that takes a larger value as stationarity increases. Alternatively, when the index representing periodicity or stationarity is an index that takes a larger value as the stationarity is lower, the index may be determined by a monotonically decreasing function relating to this index value.

あるいは、複数のMの値の候補値を用意しておき、周期性または定常性が高いほど大きな値の候補値を選択するようにしても良い。例えば、2種類のMの値の候補値M1とM2(0<M1<M2)を用意しておき、ピッチ周波数の周期性または定常性を表す指標が周期性または定常性が高いことに対応する場合には、M2をMの値として選択する。ピッチ周波数の周期性または定常性を表す指標が周期性または定常性が低いことに対応する場合には、M1をMの値として選択する。ここで、指標がピッチ周波数の周期性または定常性が高いほど大きな値とるよう定められたものであれば、その指標値が所定の閾値以上の場合が「ピッチ周波数の周期性または定常性を表す指標が定常性が高いことを表す場合」に相当し、そうでない場合が「ピッチ周波数の定常性を示す指標が定常性が低いことを表す場合」に相当する。   Alternatively, a plurality of candidate values for the value of M may be prepared, and a larger candidate value may be selected as the periodicity or the stationarity is higher. For example, two types of M value candidate values M1 and M2 (0 <M1 <M2) are prepared, and the index representing the periodicity or stationarity of the pitch frequency corresponds to a high periodicity or stationarity. In this case, M2 is selected as the value of M. If the index representing the periodicity or stationarity of the pitch frequency corresponds to the low periodicity or stationarity, M1 is selected as the value of M. Here, if the index is determined to have a larger value as the periodicity or stationarity of the pitch frequency is higher, the case where the index value is equal to or greater than a predetermined threshold indicates “the periodicity or stationarity of the pitch frequency. This corresponds to “when the index indicates that the stationarity is high”, and the other case corresponds to “when the index indicating the stationarity of the pitch frequency indicates that the stationarity is low”.

実施例2および変形例2においても同様に、ピッチ周波数(またはピッチ周期)だけでなく、ピッチ周期情報Tにより特定される周期性または定常性を表す指標に応じて周波数情報Fcを決定しても良い。例えば、4種類の周波数情報の候補Fc1,Fc2,Fc3,Fc4(Fc1<Fc2<Fc3<Fc4)を記憶しておき、
(1)入力されたピッチ周期情報Tに対応するピッチ周期τが所定の閾値TH以下(τ≦TH)であり、かつ、入力されたピッチ周期情報Tにより特定される周期性または定常性を表す指標が「周期性または定常性が高いこと」に対応する場合に、周波数情報取得部21bは最も大きい周波数情報Fc4を周波数情報Fcとして選択する。
(2)入力されたピッチ周期情報Tに対応するピッチ周期τが所定の閾値TH以下(τ≦TH)であり、かつ、入力されたピッチ周期情報Tにより特定される周期性または定常性を表す指標が「周期性または定常性が低いこと」に対応する場合に、周波数情報取得部21bは周波数情報Fc3を周波数情報Fcとして選択する。
(3)入力されたピッチ周期情報Tに対応するピッチ周期τが所定の閾値THより大きく(τ>TH)、かつ、入力されたピッチ周期情報Tにより特定される周期性または定常性を表す指標が「周期性または定常性が高いこと」に対応する場合に、周波数情報取得部21bは周波数情報Fc2を周波数情報Fcとして選択する。
(4)入力されたピッチ周期情報Tに対応するピッチ周期τが所定の閾値THより大きく(τ>TH)、かつ、入力されたピッチ周期情報Tにより特定される周期性または定常性を表す指標が「周期性または定常性が低いこと」に対応する場合に、周波数情報取得部21bは周波数情報Fc1を周波数情報Fcとして選択する。
Similarly, in the second embodiment and the second modification, the frequency information Fc is determined not only according to the pitch frequency (or pitch period) but also according to an index representing periodicity or stationarity specified by the pitch period information T. good. For example, four types of frequency information candidates Fc1, Fc2, Fc3, Fc4 (Fc1 <Fc2 <Fc3 <Fc4) are stored.
(1) The pitch period τ corresponding to the input pitch period information T is equal to or less than a predetermined threshold TH (τ ≦ TH), and represents the periodicity or continuity specified by the input pitch period information T. When the index corresponds to “high periodicity or steadyness”, the frequency information acquisition unit 21b selects the largest frequency information Fc4 as the frequency information Fc.
(2) The pitch period τ corresponding to the input pitch period information T is equal to or less than a predetermined threshold TH (τ ≦ TH), and represents the periodicity or continuity specified by the input pitch period information T. When the index corresponds to “low periodicity or steadyness”, the frequency information acquisition unit 21b selects the frequency information Fc3 as the frequency information Fc.
(3) The pitch period τ corresponding to the input pitch period information T is larger than a predetermined threshold TH (τ> TH), and an index representing the periodicity or continuity specified by the input pitch period information T Corresponds to “high periodicity or steadyness”, the frequency information acquisition unit 21b selects the frequency information Fc2 as the frequency information Fc.
(4) The pitch period τ corresponding to the input pitch period information T is larger than a predetermined threshold TH (τ> TH), and an index representing the periodicity or continuity specified by the input pitch period information T Corresponds to “low periodicity or low stationarity”, the frequency information acquisition unit 21b selects the frequency information Fc1 as the frequency information Fc.

なお、上記(2)と(3)の条件と選択される周波数情報の関係は逆であっても良い。つまり、上記(3)の条件を満たすときに周波数情報Fc2を選択し、上記(2)の条件を満たすときに周波数情報Fc3が選択されても良い。少なくとも、ピッチ周期情報Tにより特定されるピッチ周期が短く、かつ、周期性または定常性が高いときに選択される周波数情報により特定される周波数の方が、ピッチ周期情報Tにより特定されるピッチ周期が長く、かつ、周期性または定常性が低いときに選択される周波数情報により特定される周波数よりも周波数が高くなるように、周波数情報Fcを決定する。   The relationship between the conditions (2) and (3) and the selected frequency information may be reversed. That is, the frequency information Fc2 may be selected when the condition (3) is satisfied, and the frequency information Fc3 may be selected when the condition (2) is satisfied. At least the frequency specified by the frequency information selected when the pitch period specified by the pitch period information T is short and the periodicity or the stationarity is high is the pitch period specified by the pitch period information T. Is long and the frequency information Fc is determined so that the frequency is higher than the frequency specified by the frequency information selected when the periodicity or the stationarity is low.

変形例3や変形例4で用いる対応表にも、同様の性質を反映させても良い。つまり、対応表には、ピッチ周期とピッチ周期(またはピッチ周波数)の周期性または定常性の高さの組と、周波数情報の候補値と、が対応付けて記憶されている。例えば、
(1)ピッチ周期が所定の閾値以下、かつ、ピッチ周期(またはピッチ周波数)の周期性または定常性が高い場合
(2)ピッチ周期が所定の閾値以下、かつ、ピッチ周期(またはピッチ周波数)の周期性または定常性が低い場合
(3)ピッチ周期が所定の閾値より大きく、かつ、ピッチ周期(またはピッチ周波数)の周期性または定常性が高い場合
(4)ピッチ周期が所定の閾値より大きく、かつ、ピッチ周期(またはピッチ周波数)の周期性または定常性が低い場合
の4通りの組合せのそれぞれに、周波数情報の候補値が対応付けて記憶されている。この場合、(1)に対応する周波数情報の候補値が最も周波数が高く、(4)に対応する周波数情報の候補値が最も周波数が低い。
Similar properties may be reflected in the correspondence table used in the third and fourth modification examples. That is, in the correspondence table, a set of periodicity or highness of pitch period and pitch period (or pitch frequency) and a candidate value of frequency information are stored in association with each other. For example,
(1) When the pitch period is equal to or less than a predetermined threshold and the periodicity or continuity of the pitch period (or pitch frequency) is high (2) When the pitch period is equal to or less than the predetermined threshold and the pitch period (or pitch frequency) When the periodicity or the stationarity is low (3) When the pitch period is larger than a predetermined threshold and the period or the stationarity of the pitch period (or pitch frequency) is high (4) The pitch period is larger than a predetermined threshold, And the candidate value of frequency information is matched and memorize | stored in each of four combinations when the periodicity or stationary nature of a pitch period (or pitch frequency) is low. In this case, the candidate value of frequency information corresponding to (1) has the highest frequency, and the candidate value of frequency information corresponding to (4) has the lowest frequency.

なお、ピッチ周期が所定の閾値以下の場合のみ、ピッチ周期の周期性または定常性の場合分け(上記(1)(2))をし、ピッチ周期が所定の閾値より大きい場合には、ピッチ周期の周期性または定常性に関係なく、上記(1)(2)よりも小さい周波数情報の候補値を対応づけた対応表を用いても良い。   Only when the pitch period is equal to or less than a predetermined threshold value, the case of the periodicity or regularity of the pitch period is classified (above (1) and (2)), and when the pitch period is larger than the predetermined threshold value, the pitch period Regardless of the periodicity or stationarity, a correspondence table in which candidate values of frequency information smaller than (1) and (2) are associated may be used.

あるいは、ピッチ周期の周期性または定常性が高い場合のみ、ピッチ周期が所定の閾値以下であるかそうでないかの場合分けを行い、ピッチ周期の周期性または定常性が低い場合にはピッチ周期の大きさに関係なく、上記(1)(2)よりも小さい周波数情報の候補値を対応づけた対応表を用いても良い。   Or, only when the periodicity or continuity of the pitch period is high, it is divided whether the pitch period is below a predetermined threshold or not, and when the periodicity or continuity of the pitch period is low, the pitch period Regardless of the size, a correspondence table in which candidate values of frequency information smaller than the above (1) and (2) are associated may be used.

[周期性または定常性を表す指標について]
ピッチ周期情報Tにより特定される周期性または定常性を表す指標の例としては、例えば、現在および過去の数フレーム(例えば3フレーム)でピッチ周波数の各フレームでの変化量がある閾値以内(例えば10 Hz以内)の場合に定常性が高いことを示し、そうでない場合に定常性が低いことを示すような指標を用いても良い。
あるいは、本発明の信号処理方法を、音響信号をロッシーな符号化方法で符号化して得られた符号を復号する復号装置により得られた復号音響信号の品質を向上させるための後処理として用いる場合には、外部の復号装置で復号するときに得られる情報から、指標を得ることも可能である。
[Index indicating periodicity or stationarity]
As an example of an index representing periodicity or stationarity specified by the pitch period information T, for example, the change amount of the pitch frequency in each frame in the current and past several frames (for example, 3 frames) is within a certain threshold (for example, It is also possible to use an index that indicates that the stationarity is high in the case of (within 10 Hz) and that the stationarity is low in other cases.
Alternatively, when the signal processing method of the present invention is used as post-processing for improving the quality of a decoded acoustic signal obtained by a decoding device that decodes a code obtained by encoding the acoustic signal with a lossy encoding method It is also possible to obtain an index from information obtained when decoding with an external decoding device.

[例1]
復号装置において復号音響信号の周期性または定常性に応じて符号化モードを切り替える処理が使われる場合がある。このような場合には、どの符号化モードが用いられたかを示す情報を指標として用いればよい。例えば、標準規格G.718における復号方法では、復号音響信号の定常性が高い場合はVCモードが用いられ、そうでない場合にはGCモードが用いられる。したがって、VCモードとGCモードのどちらを用いたかを示す情報を指標とすることで、定常性が高い場合に対応するか、定常性が低い場合に対応するかを判断することができる。
[Example 1]
In the decoding apparatus, there is a case where a process of switching the encoding mode is used according to the periodicity or stationary nature of the decoded acoustic signal. In such a case, information indicating which encoding mode is used may be used as an index. For example, the standard G.I. In the decoding method in 718, the VC mode is used when the steadiness of the decoded acoustic signal is high, and the GC mode is used otherwise. Therefore, by using information indicating whether the VC mode or the GC mode is used as an index, it is possible to determine whether to correspond to a case where the stationarity is high or to correspond to a case where the stationarity is low.

[例2]
復号装置において、入力された符号から、時系列信号(復号音響信号)を線形予測分析して得られる予測残差の大きさの情報が得られる場合には、予測残差の大きさに対する当該時系列信号の大きさの比を指標として用いることができる。この場合、指標が大きいほど定常性が高いことに相当する。あるいは、予測残差の大きさに対する当該時系列信号の大きさの比が所定の閾値より大きい場合が定常性が高いことに対応し、そうでない場合が定常性が低いことに対応するとしてもよい。
この指標は、定常的なフレームでは効果の高い線形予測が可能であるため予測残差が小さくなり、予測残差の大きさに対する時系列信号の大きさの比が大きくなることに基づく。
[Example 2]
In the decoding device, when information on the magnitude of the prediction residual obtained by linear prediction analysis of the time-series signal (decoded acoustic signal) is obtained from the input code, the time corresponding to the magnitude of the prediction residual A ratio of the magnitudes of the sequence signals can be used as an index. In this case, the larger the index, the higher the stationarity. Alternatively, the case where the ratio of the magnitude of the time series signal to the magnitude of the prediction residual is larger than a predetermined threshold may correspond to high continuity, and the other may correspond to low continuity. .
This index is based on the fact that the prediction residual is small because a highly effective linear prediction is possible in a stationary frame, and the ratio of the magnitude of the time series signal to the magnitude of the prediction residual is large.

[例3]
復号装置において、入力された符号を復号して得られる「量子化されたピッチ利得(復号ピッチ利得)」を指標として用いても良い。この場合、復号ピッチ利得が大きいほど定常性が高いことに相当する。
この指標は、定常的なフレームではピッチ周期の周期性が高く、ピッチ利得が大きいことに基づく。
[Example 3]
In the decoding device, “quantized pitch gain (decoded pitch gain)” obtained by decoding the input code may be used as an index. In this case, the larger the decoding pitch gain, the higher the stationarity.
This index is based on the fact that the periodicity of the pitch period is high and the pitch gain is large in a stationary frame.

[例4]
復号装置において、入力された符号を復号して得られる「量子化されたピッチ利得(復号ピッチ利得)またはそれに対応する値」と「量子化された固定符号帳利得(復号固定符号帳利得)またはそれに対応する値」との比を指標として用いても良い。この場合、復号固定符号帳利得に対応する値に対する、復号ピッチ利得の比が大きいほど、定常性が高いことに相当する。なお、量子化された固定符号帳利得に対応する値の例は、量子化された固定符号帳利得そのもの、量子化された補正係数(correction factor)などである。補正係数の例は、参考文献1「ITU-T Recommendation G.729, "Coding of Speech at 8kbit/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction(CS-ACELP)"」の「3.9 Quantization of the gains」の欄に記載されたγである。
この指標は、定常的なフレームではピッチ周期の周期性が高く、固定符号帳利得に対応する値に対するピッチ利得に対応する値の比が大きいことに基づく。
[Example 4]
In the decoding apparatus, a “quantized pitch gain (decoded pitch gain) or a value corresponding thereto” obtained by decoding an input code and a quantized fixed codebook gain (decoded fixed codebook gain) or A ratio to “a value corresponding to it” may be used as an index. In this case, the larger the ratio of the decoding pitch gain to the value corresponding to the decoding fixed codebook gain, the higher the stationarity. Note that examples of values corresponding to the quantized fixed codebook gain are the quantized fixed codebook gain itself, the quantized correction factor, and the like. Examples of correction coefficients are given in “3.9 Quantization of ITU-T Recommendation G.729,“ Coding of Speech at 8 kbit / s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP) ”. γ described in the “the gains” column.
This index is based on the fact that the periodicity of the pitch period is high in a stationary frame, and the ratio of the value corresponding to the pitch gain to the value corresponding to the fixed codebook gain is large.

[例5]
復号装置において、入力された符号を復号して得られる「量子化されたピッチ利得(復号ピッチ利得)またはそれに対応する値」と「量子化された固定符号帳利得(復号固定符号帳利得)またはそれに対応する値」の大きさを指標として用いても良い。例えば、復号ピッチ利得に対応する値が第1規定値より小さく、かつ、復号固定符号帳利得に対応する値が第2規定値より小さい場合に、定常性が低い(定常的でない)ことを示し、そうでない場合に定常性が高い(定常的である)ことを示す指標とする。
[Example 5]
In the decoding apparatus, a “quantized pitch gain (decoded pitch gain) or a value corresponding thereto” obtained by decoding an input code and a quantized fixed codebook gain (decoded fixed codebook gain) or You may use the magnitude | size of "the value corresponding to it" as a parameter | index. For example, when the value corresponding to the decoding pitch gain is smaller than the first specified value and the value corresponding to the decoded fixed codebook gain is smaller than the second specified value, the stationarity is low (not steady). Otherwise, it is used as an index indicating that the stationarity is high (stationary).

あるいは、復号ピッチ利得に対応する値が第1規定値より小さく、かつ、復号固定符号帳利得に対応する値が第2規定値より大きい場合に、定常性が高い(定常的である)ことを示し、そうでない場合に定常性が低い(非定常的である)ことを示す指標とする。   Alternatively, when the value corresponding to the decoding pitch gain is smaller than the first specified value and the value corresponding to the decoded fixed codebook gain is larger than the second specified value, the stationarity is high (stationary). If not, it is an index indicating that the stationarity is low (unsteady).

<本発明の効果>
従来は、ピッチ周波数に関係なく固定の周波数帯域のピッチを強調した信号を出力していた。本発明ではピッチ周波数またはピッチ周期に応じてピッチ強調を行う周波数帯域を変える。ピッチ周波数が高い時にはピッチ強調を行う周波数帯域を広くし、逆に、ピッチ周波数が低い時にはピッチ強調を行う周波数帯域を狭くする。つまり、ピッチ周波数が高い時はピッチ周波数が低い時よりもローパスフィルタ部のカットオフ周波数を高くし、高い周波数までのピッチを強調する。これにより、ピッチ周期による調波構造の倍音構造を適切に表現することができるので、音質をさらに向上させることができる。図15を参照して、音質の客観評価値PESQ(perceptual evaluation of speech quality)に基づいて従来技術と本発明を比較した実験結果を説明する。なお、PESQスコアが高いほど音質が良い傾向がある。図15は、音質の客観評価値PESQに基づいて従来技術と本発明を比較して示す図である。図15は縦軸をPESQのスコアとし、左側に従来法の、右側に本発明による方法の実験結果をそれぞれ表示した棒グラフである。図15Aは、クリーン音声による実験結果、図15Bは、雑音重畳音声による実験結果である。図15A、Bに示すように、本発明による信号処理は、従来法と比較して音質の客観評価値であるPESQスコアが向上していることが確認できる。
<Effect of the present invention>
Conventionally, a signal in which the pitch of a fixed frequency band is emphasized is output regardless of the pitch frequency. In the present invention, the frequency band for performing pitch emphasis is changed according to the pitch frequency or pitch period. When the pitch frequency is high, the frequency band for performing pitch emphasis is widened. Conversely, when the pitch frequency is low, the frequency band for performing pitch emphasis is narrowed. That is, when the pitch frequency is high, the cutoff frequency of the low-pass filter unit is set higher than when the pitch frequency is low, and the pitch up to the high frequency is emphasized. Thereby, the harmonic structure of the harmonic structure based on the pitch period can be appropriately expressed, so that the sound quality can be further improved. With reference to FIG. 15, an experimental result comparing the prior art and the present invention based on an objective evaluation value PESQ (perceptual evaluation of speech quality) of sound quality will be described. Note that the higher the PESQ score, the better the sound quality. FIG. 15 is a diagram showing a comparison between the prior art and the present invention based on an objective evaluation value PESQ of sound quality. FIG. 15 is a bar graph in which the vertical axis represents the PESQ score, and the experimental results of the conventional method are displayed on the left and the method according to the present invention on the right. FIG. 15A shows the experimental results using clean speech, and FIG. 15B shows the experimental results using noise superimposed speech. As shown in FIGS. 15A and 15B, it can be confirmed that the signal processing according to the present invention improves the PESQ score, which is an objective evaluation value of sound quality, as compared with the conventional method.

<本発明の要点>
本発明の要点は、ピッチ(または周期)に依存してカットオフ周波数(周波数情報Fc)を変更したことにある。
<Key points of the present invention>
The main point of the present invention is that the cut-off frequency (frequency information Fc) is changed depending on the pitch (or period).

上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。   When the above configuration is realized by a computer, the processing contents of the functions that each device should have are described by a program. The processing functions are realized on the computer by executing the program on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good.

なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer). In this embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.

Claims (10)

入力信号のピッチ周期に対応する情報に依存して定まる周波数情報を取得する周波数情報取得部と、
入力信号から、前記周波数情報により特定される周波数以下の成分のピッチを強調した信号であるピッチ強調信号を生成するピッチ強調信号生成部と、
を含み、
前記周波数情報取得部により取得される周波数情報は、
前記入力信号のピッチ周期が短いほど高い周波数に対応する情報である、
または、
前記入力信号のピッチ周波数が高いほど高い周波数に対応する情報である、
信号処理装置。
A frequency information acquisition unit that acquires frequency information determined depending on information corresponding to the pitch period of the input signal;
A pitch-enhanced signal generation unit that generates a pitch-enhanced signal that is a signal that emphasizes the pitch of a component equal to or lower than the frequency specified by the frequency information from the input signal;
Including
The frequency information acquired by the frequency information acquisition unit is
The shorter the pitch period of the input signal is the information corresponding to the higher frequency,
Or
The higher the pitch frequency of the input signal is the information corresponding to the higher frequency,
Signal processing device.
入力信号のピッチ周期に対応する情報に依存して定まる周波数情報を取得する周波数情報取得部と、
入力信号から、前記周波数情報により特定される周波数以下の成分のピッチを強調した信号であるピッチ強調信号を生成するピッチ強調信号生成部と、
を含み、
前記入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値の場合に対応する情報であるときに、前記周波数情報取得部で取得される前記周波数情報により特定される周波数を第1周波数とし、
前記入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値よりも大きい第2値の場合に対応する情報であるときに、前記周波数情報取得部で取得される前記周波数情報により特定される周波数を第2周波数としたとき、
第1周波数が第2周波数よりも高い
信号処理装置。
A frequency information acquisition unit that acquires frequency information determined depending on information corresponding to the pitch period of the input signal;
A pitch-enhanced signal generation unit that generates a pitch-enhanced signal that is a signal that emphasizes the pitch of a component equal to or lower than the frequency specified by the frequency information from the input signal;
Including
When the information corresponding to the pitch period of the input signal is information corresponding to the case where the pitch period is a first value, the frequency specified by the frequency information acquired by the frequency information acquisition unit is a first frequency. age,
When the information corresponding to the pitch period of the input signal is information corresponding to the case where the pitch period is a second value larger than the first value, the information is specified by the frequency information acquired by the frequency information acquisition unit. When the second frequency is the second frequency
A signal processing device in which the first frequency is higher than the second frequency.
現在または過去の時間区間の入力信号のピッチ周期に対応する情報に依存して定まる周波数情報を取得する周波数情報取得部と、
現在の時間区間の入力信号に、現在よりも前記ピッチ周期だけ過去、および/または、現在よりも前記ピッチ周期だけ未来の入力信号を合成した信号であるピッチ強調信号を生成するピッチ改善部と、
前記ピッチ強調信号から前記現在の時間区間の入力信号を減算した残差信号を出力する減算部と、
前記残差信号から前記周波数情報取得部で取得した周波数情報により特定される周波数成分以下の信号のみを抽出するローパスフィルタ部と、
前記現在の時間区間の入力信号と前記ローパスフィルタ部から出力された信号とを合成した信号を生成する合成部と、
を含み、
現在または過去の時間区間の入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値である場合に対応する情報であるときに、前記周波数情報取得部で取得される前記周波数情報により特定される周波数を第1周波数とし、
現在または過去の時間区間の入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値よりも大きい第2値である場合に対応する情報であるときに、前記周波数情報取得部で取得される前記周波数情報により特定される周波数を第2周波数としたとき、
第1周波数が第2周波数よりも高い
信号処理装置。
A frequency information acquisition unit that acquires frequency information determined depending on information corresponding to a pitch period of an input signal in a current or past time interval;
A pitch improvement unit that generates a pitch emphasis signal that is a signal obtained by synthesizing an input signal of the current time interval past the pitch period from the present and / or the future input signal by the pitch period from the present;
A subtraction unit that outputs a residual signal obtained by subtracting the input signal of the current time interval from the pitch enhancement signal;
A low-pass filter unit that extracts only a signal having a frequency component equal to or lower than that specified by the frequency information acquired by the frequency information acquisition unit from the residual signal;
A combining unit that generates a signal by combining the input signal of the current time interval and the signal output from the low-pass filter unit;
Including
Identified by the frequency information acquired by the frequency information acquisition unit when the information corresponding to the pitch period of the input signal of the current or past time interval is information corresponding to the case where the pitch period is the first value The frequency to be used is the first frequency,
When the information corresponding to the pitch period of the input signal in the current or past time interval is information corresponding to the case where the pitch period is a second value larger than the first value, the frequency information acquisition unit acquires the information. When the frequency specified by the frequency information is the second frequency,
A signal processing device in which the first frequency is higher than the second frequency.
ピッチ周期に対応する情報と周波数情報の候補値に対応する情報とを対応付けて記憶した対応表記憶部と、
前記対応表を参照し、現在または過去の時間区間の入力信号のピッチ周期に対応する周波数情報の候補値を周波数情報として取得する周波数情報取得部と、
現在の時間区間の入力信号に、現在よりも前記ピッチ周期だけ過去、および/または、現在よりも前記ピッチ周期だけ未来の入力信号を合成した信号であるピッチ強調信号を生成するピッチ改善部と、
前記ピッチ強調信号から前記現在の時間区間の入力信号を減算した残差信号を出力する減算部と、
前記残差信号から前記周波数情報取得部で取得した周波数情報により特定される周波数成分以下の信号のみを抽出するローパスフィルタ部と、
前記ローパスフィルタ部から出力された信号と前記現在の時間区間の入力信号とを合成した信号を生成する合成部と、
を含み、
前記対応表に記憶されたある2つのピッチ周期に対応する情報と周波数情報との候補値に対応する情報との組のうち、ピッチ周期が短い方に対応する組により特定される周波数情報の候補値が、ピッチ周期が長い方に対応する組により特定される周波数情報の候補値よりも周波数が高い
信号処理装置。
A correspondence table storage unit that stores information corresponding to pitch periods and information corresponding to frequency information candidate values in association with each other;
With reference to the correspondence table, a frequency information acquisition unit that acquires, as frequency information, a candidate value of frequency information corresponding to the pitch period of the input signal in the current or past time interval;
A pitch improvement unit that generates a pitch emphasis signal that is a signal obtained by synthesizing an input signal of the current time interval past the pitch period from the present and / or the future input signal by the pitch period from the present;
A subtraction unit that outputs a residual signal obtained by subtracting the input signal of the current time interval from the pitch enhancement signal;
A low-pass filter unit that extracts only a signal having a frequency component equal to or lower than that specified by the frequency information acquired by the frequency information acquisition unit from the residual signal;
A synthesis unit that generates a signal obtained by synthesizing the signal output from the low-pass filter unit and the input signal of the current time interval;
Including
Candidate frequency information specified by a pair corresponding to a shorter pitch period out of a pair of information corresponding to two pitch periods stored in the correspondence table and information corresponding to candidate values of frequency information A signal processing device whose value is higher than a candidate value of frequency information specified by a pair corresponding to a longer pitch period.
入力信号のピッチ周期に対応する情報に依存して定まる周波数情報を取得する周波数情報取得ステップと、
入力信号から、前記周波数情報により特定される周波数以下の成分のピッチを強調した信号であるピッチ強調信号を生成するピッチ強調信号生成ステップと、
を含み、
前記周波数情報取得ステップにより取得される周波数情報は、
前記入力信号のピッチ周期が短いほど高い周波数に対応する情報である、
または、
前記入力信号のピッチ周波数が高いほど高い周波数に対応する情報である、
信号処理方法。
A frequency information acquisition step of acquiring frequency information determined depending on information corresponding to the pitch period of the input signal;
A pitch-enhanced signal generation step for generating a pitch-enhanced signal, which is a signal obtained by emphasizing the pitch of components below the frequency specified by the frequency information, from the input signal;
Including
The frequency information acquired by the frequency information acquisition step is:
The shorter the pitch period of the input signal is the information corresponding to the higher frequency,
Or
The higher the pitch frequency of the input signal is the information corresponding to the higher frequency,
Signal processing method.
入力信号のピッチ周期に対応する情報に依存して定まる周波数情報を取得する周波数情報取得ステップと、
入力信号から、前記周波数情報により特定される周波数以下の成分のピッチを強調した信号であるピッチ強調信号を生成するピッチ強調信号生成ステップと、
を含み、
前記入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値の場合に対応する情報であるときに、前記周波数情報取得ステップで取得される前記周波数情報により特定される周波数を第1周波数とし、
前記入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値よりも大きい第2値の場合に対応する情報であるときに、前記周波数情報取得ステップで取得される前記周波数情報により特定される周波数を第2周波数としたとき、
第1周波数が第2周波数よりも高い
信号処理方法。
A frequency information acquisition step of acquiring frequency information determined depending on information corresponding to the pitch period of the input signal;
A pitch-enhanced signal generation step for generating a pitch-enhanced signal, which is a signal obtained by emphasizing the pitch of components below the frequency specified by the frequency information, from the input signal;
Including
When the information corresponding to the pitch period of the input signal is information corresponding to the case where the pitch period is a first value, the frequency specified by the frequency information acquired in the frequency information acquisition step is a first frequency. age,
When the information corresponding to the pitch period of the input signal is information corresponding to the case where the pitch period is a second value larger than the first value, the information is specified by the frequency information acquired in the frequency information acquisition step. When the second frequency is the second frequency
A signal processing method in which the first frequency is higher than the second frequency.
現在または過去の時間区間の入力信号のピッチ周期に対応する情報に依存して定まる周波数情報を取得する周波数情報取得ステップと、
現在の時間区間の入力信号に、現在よりも前記ピッチ周期だけ過去、および/または、現在よりも前記ピッチ周期だけ未来の入力信号を合成した信号であるピッチ強調信号を生成するピッチ改善ステップと、
前記ピッチ強調信号から前記現在の時間区間の入力信号を減算した残差信号を出力する減算ステップと、
前記残差信号から前記周波数情報取得ステップで取得した周波数情報により特定される周波数成分以下の信号のみを抽出するローパスフィルタステップと、
前記現在の時間区間の入力信号と前記ローパスフィルタステップにおいて出力された信号とを合成した信号を生成する合成ステップと、
を含み、
現在または過去の時間区間の入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値である場合に対応する情報であるときに、前記周波数情報取得ステップで取得される前記周波数情報により特定される周波数を第1周波数とし、
現在または過去の時間区間の入力信号のピッチ周期に対応する情報が、ピッチ周期が第1値よりも大きい第2値である場合に対応する情報であるときに、前記周波数情報取得ステップで取得される前記周波数情報により特定される周波数を第2周波数としたとき、
第1周波数が第2周波数よりも高い
信号処理方法。
A frequency information acquisition step for acquiring frequency information determined depending on information corresponding to a pitch period of an input signal in a current or past time interval;
A pitch improvement step for generating a pitch emphasis signal, which is a signal obtained by synthesizing an input signal in the current time interval with the past of the pitch period from the present and / or the future input signal with the pitch period from the present;
A subtraction step of outputting a residual signal obtained by subtracting the input signal of the current time interval from the pitch enhancement signal;
A low-pass filter step for extracting only a signal having a frequency component equal to or lower than that specified by the frequency information acquired in the frequency information acquisition step from the residual signal;
A synthesis step of generating a signal obtained by synthesizing the input signal of the current time interval and the signal output in the low-pass filter step;
Including
Identified by the frequency information acquired in the frequency information acquisition step when the information corresponding to the pitch period of the input signal of the current or past time interval is information corresponding to the case where the pitch period is the first value The frequency to be used is the first frequency,
When the information corresponding to the pitch period of the input signal in the current or past time interval is information corresponding to the case where the pitch period is a second value larger than the first value, the frequency information acquisition step acquires the information. When the frequency specified by the frequency information is the second frequency,
A signal processing method in which the first frequency is higher than the second frequency.
ピッチ周期に対応する情報と周波数情報の候補値に対応する情報とを対応付けて記憶した対応表を参照し、現在または過去の時間区間の入力信号のピッチ周期に対応する周波数情報の候補値を周波数情報として取得する周波数情報取得ステップと、
現在の時間区間の入力信号に、現在よりも前記ピッチ周期だけ過去、および/または、現在よりも前記ピッチ周期だけ未来の入力信号を合成した信号であるピッチ強調信号を生成するピッチ改善ステップと、
前記ピッチ強調信号から前記現在の時間区間の入力信号を減算した残差信号を出力する減算ステップと、
前記残差信号から前記周波数情報取得ステップで取得した周波数情報により特定される周波数成分以下の信号のみを抽出するローパスフィルタステップと、
前記ローパスフィルタステップにおいて出力された信号と前記現在の時間区間の入力信号とを合成した信号を生成する合成ステップと、
を含み、
前記対応表に記憶されたある2つのピッチ周期に対応する情報と周波数情報との候補値に対応する情報との組のうち、ピッチ周期が短い方に対応する組により特定される周波数情報の候補値が、ピッチ周期が長い方に対応する組により特定される周波数情報の候補値よりも周波数が高い
信号処理方法。
Refer to the correspondence table in which the information corresponding to the pitch period and the information corresponding to the candidate value of the frequency information are associated and stored, and the candidate value of the frequency information corresponding to the pitch period of the input signal in the current or past time interval A frequency information acquisition step to acquire as frequency information;
A pitch improvement step for generating a pitch emphasis signal, which is a signal obtained by synthesizing an input signal in the current time interval with the past of the pitch period from the present and / or the future input signal with the pitch period from the present;
A subtraction step of outputting a residual signal obtained by subtracting the input signal of the current time interval from the pitch enhancement signal;
A low-pass filter step for extracting only a signal having a frequency component equal to or lower than that specified by the frequency information acquired in the frequency information acquisition step from the residual signal;
A synthesis step of generating a signal obtained by synthesizing the signal output in the low-pass filter step and the input signal of the current time interval;
Including
Candidate frequency information specified by a pair corresponding to a shorter pitch period out of a pair of information corresponding to two pitch periods stored in the correspondence table and information corresponding to candidate values of frequency information A signal processing method in which a value is higher than a candidate value of frequency information specified by a pair corresponding to a longer pitch period.
請求項5から8のいずれかに記載の信号処理方法を実行すべき指令をコンピュータに対してするプログラム。   The program which gives the instruction | command which should perform the signal processing method in any one of Claim 5 to 8 with respect to a computer. 請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。   A computer-readable recording medium on which the program according to claim 9 is recorded.
JP2013189155A 2013-09-12 2013-09-12 Signal processing apparatus, signal processing method, program, and recording medium Active JP6220610B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013189155A JP6220610B2 (en) 2013-09-12 2013-09-12 Signal processing apparatus, signal processing method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013189155A JP6220610B2 (en) 2013-09-12 2013-09-12 Signal processing apparatus, signal processing method, program, and recording medium

Publications (2)

Publication Number Publication Date
JP2015055765A JP2015055765A (en) 2015-03-23
JP6220610B2 true JP6220610B2 (en) 2017-10-25

Family

ID=52820192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013189155A Active JP6220610B2 (en) 2013-09-12 2013-09-12 Signal processing apparatus, signal processing method, program, and recording medium

Country Status (1)

Country Link
JP (1) JP6220610B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07146700A (en) * 1993-11-24 1995-06-06 Hitachi Ltd Pitch emphasizing method and device and hearing acuity compensating device
JP3468862B2 (en) * 1994-09-02 2003-11-17 株式会社東芝 Audio coding device
JP3483998B2 (en) * 1995-09-14 2004-01-06 株式会社東芝 Pitch enhancement method and apparatus
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed

Also Published As

Publication number Publication date
JP2015055765A (en) 2015-03-23

Similar Documents

Publication Publication Date Title
JP6692948B2 (en) Method, encoder and decoder for linear predictive coding and decoding of speech signals with transitions between frames having different sampling rates
RU2636685C2 (en) Decision on presence/absence of vocalization for speech processing
KR102493482B1 (en) Time-domain stereo coding and decoding method, and related product
KR101350285B1 (en) Signal coding, decoding method and device, system thereof
JP3478209B2 (en) Audio signal decoding method and apparatus, audio signal encoding and decoding method and apparatus, and recording medium
CN104584123B (en) Coding/decoding method and decoding apparatus
RU2661787C2 (en) Method of audio encoding and related device
JP5663461B2 (en) Encoding method, encoding apparatus, program, and recording medium
JP6261381B2 (en) Signal processing apparatus, signal processing method, and program
JP6220610B2 (en) Signal processing apparatus, signal processing method, program, and recording medium
JP6962269B2 (en) Pitch enhancer, its method, and program
JP4848049B2 (en) Encoding method, decoding method, apparatus thereof, program, and recording medium
JP5320508B2 (en) Encoding device, decoding device, these methods, program, and recording medium
Hang et al. A scalable variable bit rate audio codec based on audio attention analysis
JPWO2019107041A1 (en) Pitch enhancer, its method, and program
JP2019531505A (en) System and method for long-term prediction in an audio codec
RU2773421C9 (en) Method and corresponding product for determination of audio encoding/decoding mode
RU2773421C2 (en) Method and corresponding product for determination of audio encoding/decoding mode
RU2772405C2 (en) Method for stereo encoding and decoding in time domain and corresponding product
JP2000132195A (en) Signal encoding device and method therefor
KR20110113123A (en) A method and an apparatus for processing an audio signal
JP2011170259A (en) Voice encoding device, method and program, and code book data classification device, method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160901

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160901

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160901

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170815

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171002

R150 Certificate of patent or registration of utility model

Ref document number: 6220610

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150