WO2001097212A1 - Dispositif et procédé d'interpolation de fréquence - Google Patents

Dispositif et procédé d'interpolation de fréquence Download PDF

Info

Publication number
WO2001097212A1
WO2001097212A1 PCT/JP2001/004955 JP0104955W WO0197212A1 WO 2001097212 A1 WO2001097212 A1 WO 2001097212A1 JP 0104955 W JP0104955 W JP 0104955W WO 0197212 A1 WO0197212 A1 WO 0197212A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
frequency
band
suppressed
interpolation
Prior art date
Application number
PCT/JP2001/004955
Other languages
English (en)
French (fr)
Inventor
Yasushi Sato
Original Assignee
Kabushiki Kaisha Kenwood
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2000178569A external-priority patent/JP3538122B2/ja
Priority claimed from JP2000259745A external-priority patent/JP3576942B2/ja
Application filed by Kabushiki Kaisha Kenwood filed Critical Kabushiki Kaisha Kenwood
Priority to US10/296,167 priority Critical patent/US6836739B2/en
Priority to DE60110796T priority patent/DE60110796T2/de
Priority to DE1298643T priority patent/DE1298643T1/de
Priority to AU2001262748A priority patent/AU2001262748A1/en
Priority to EP01936970A priority patent/EP1298643B1/en
Publication of WO2001097212A1 publication Critical patent/WO2001097212A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/662Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a time/frequency relationship, e.g. time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation

Definitions

  • the present invention relates to a frequency interpolation device and a frequency interpolation method.
  • the present invention relates to a frequency interpolation device and a frequency interpolation method for improving a spectrum distribution of a band-limited signal.
  • Japanese Patent Application Laid-Open No. 7-93900 discloses a method of multiplying an output audio signal obtained by passing a PCM digital audio signal through a single-pass filter by a signal including an absolute value component of the output signal. In this way, distortion is caused by performing
  • the audio signal reproducing device disclosed in Japanese Patent Application Laid-Open No. 7-93900 merely generates a harmonic by distorting the waveform of the output audio signal using a limiter circuit or the like. It is not known whether can be approximated to what was originally contained in the original audio signal.
  • a first object is to provide a frequency interpolation device and a frequency interpolation method for restoring one-dio signal with high sound quality.
  • the audio signal representing music or the like is compressed in the MP3 format or the like, so that the bandwidth of the audio signal is uniform. It is common to be restricted.
  • the conventional device includes the original sound, etc. This will add erroneous high-frequency components that have not been added. For this reason, the sound quality of the output audio signal is degraded in comparison with a signal that simply passes through a mouth-pass filter and does not perform any processing.
  • the present invention further provides a signal in which a signal representing a signal in which a spectral component in a partial band of the original signal is suppressed and a signal representing an original signal which does not originally include a spectral component in the band are mixed. Therefore, it is a second object to provide a frequency interpolation device and a frequency interpolation method for restoring a signal close to the original signal.
  • the frequency interpolation device of the present invention approximates the suppressed frequency component from an input signal whose frequency component is suppressed in a specific frequency band of an original signal, and In a frequency interpolation device for reproducing a signal close to the original signal, a short-time spectrum in a frequency band in which a frequency component remains without being suppressed is obtained, and based on a repeatability of a spectrum pattern at a predetermined frequency interval.
  • the short-time spectrum of the suppressed frequency component in the frequency band is estimated, and a signal including the suppressed frequency component is synthesized based on the estimation and added to the input signal. Have been.
  • the repeatability of the short-time spectrum pattern includes a first frequency band having a predetermined bandwidth in a frequency band in which a frequency component remains, It is determined based on the degree of correlation between the short-time spectrum patterns in the second frequency band having the same bandwidth adjacent to the short-time spectrum pattern.
  • the short-time spectrum pattern of the first frequency band is changed to the second frequency band.
  • replicas of the spectrum pattern having the correlation are combined to compensate for the frequency components in the suppressed frequency band.
  • a portion of the spectrum of a signal to be interpolated (interpolated signal) having a high correlation in the spectrum distribution is interpolated along the envelope. It is added to the high frequency side of the signal to extend the bandwidth. Since the added spectrum can be considered as a harmonic component of a part of the original spectrum, if the interpolated signal is a band-limited signal, the interpolated signal after the band is expanded is Is close to the original signal before the restriction. Therefore, if the interpolated signal represents an audio signal, the audio signal is restored with high sound quality by restoring the audio signal using the interpolated signal whose band has been expanded.
  • the specific frequency band is a high frequency band
  • an upper limit frequency of the first or second frequency band is a lower limit frequency of the suppressed high frequency band. It is said.
  • the interpolation band itself including the highest frequency of the spectrum of the interpolated signal becomes the original. There is a high possibility that it can be regarded as a part of higher harmonic components of the spectrum. Therefore, the signal to be interpolated after the band is extended is closer to the original signal before the band is limited.
  • the spectral envelope extracting means, and the spectral pattern extracting means and the spectral envelope extracting means Responsively, means for synthesizing a frequency spectrum signal for interpolating the suppressed frequency band, and means for adding the synthesized spectrum signal to the suppressed frequency band. It can also be understood as an interpolation device.
  • the synthesized spectrum signal has a frequency component in a suppressed frequency band, has the extracted spectrum pattern, and
  • the input signal has a level determined in the vector envelope information.
  • the input signal is a PCM signal obtained by sampling and quantizing an analog audio signal.
  • the present invention can be grasped in another aspect and as a method invention.
  • the method of the present invention reproduces a signal close to the original signal by approximately restoring the suppressed frequency component from the input signal in which the frequency component in the specific frequency band of the original signal is suppressed.
  • a frequency spectrum interpolation method for performing a short-time spectrum pattern of the frequency component in the suppressed frequency band based on the repeatability of the short-time spectrum pattern in the frequency band where the frequency component remains without being suppressed It can be said that this is a method of estimating and synthesizing this and adding it to the input signal.
  • the frequency interpolating device of the present invention and a signal in which a frequency component in a specific frequency band of an original signal is suppressed, approximate the suppressed frequency component.
  • a frequency interpolation system for reproducing a signal close to the original signal it is determined whether or not the specific frequency band of the original signal contains a frequency component higher than a predetermined level, and the presence or absence is determined.
  • Transmitting means receiving the transmitted signal, determining the identification data included in the received signal, and determining the presence or absence of a frequency component in the specific band; When it is determined that there is no frequency component in the specific band, the received signal is directly taken out as an output, and when it is determined that the frequency component is present in the specific frequency band, the signal processing of the next stage is performed.
  • Branch control means operable to input a received signal to the means; and in response to the received signal from the branch control means, the inverse conversion processing and suppression of the predetermined signal means.
  • Signal processing means for performing an interpolation process of approximately combining and adding the frequency components of the obtained band.
  • the predetermined signal conversion processing is more specifically data compression processing
  • the inverse conversion processing in the signal processing means is data expansion processing.
  • the interpolation processing in the signal processing means includes: (i) short-time spectrum analysis processing; (ii) processing of extracting short-time spectrum patterns mutually correlated between adjacent frequency bands; and (iii) A process for extracting spectral envelope information can be used.
  • identification data indicating whether the spectrum of the original signal is distributed in the suppression band is generated. Then, when the identification data indicates the presence of a spectrum in the suppression band, a portion of the spectrum of the interpolated signal having a high correlation of the spectrum distribution is subjected to the envelope along the envelope. It is added to the high frequency side of the interpolation signal, and the band is extended. Since the added spectrum can be considered as a harmonic component of a part of the original spectrum, if the interpolated signal is a band-limited signal, the interpolated signal after the band is expanded has a band It is close to the original signal before being restricted. On the other hand, when the identification data indicates the absence of a spectrum in the interpolated band, the interpolated signal is output without receiving any additional spectrum.
  • the received signal is a signal in which the signal to be interpolated suppresses the spectral component in a part of the band of the original signal
  • the received signal represents the original signal which does not inherently include the spectral component in the band. Also, a signal close to the original signal is restored. If the signal represents an audio signal, the audio signal is restored with high sound quality.
  • the transmitting side (including the encoder) of the signal and the receiving side (including the decoder) of the signal are understood as being integrated with each other.
  • the present invention can be replaced with a configuration of only the receiving side (decoder side).
  • the device of the present invention starts with the signal in which the frequency component in the specific frequency band of the original signal is suppressed.
  • Signal processing means for executing interpolation processing for approximately combining and adding frequency components. Further, as in the case of the frequency interpolating device for achieving the first object, when grasped as a method invention, the method of the present invention provides a method in which a frequency component equal to or higher than a predetermined level is included in the specific frequency band of the original signal.
  • Determining whether the signal is included generating identification data indicating the presence or absence of the signal, suppressing the frequency component of the specific frequency band of the original signal, and performing a predetermined signal conversion process; Transmitting the identification data superimposed on the received signal; receiving the transmitted signal; determining the identification data included in the received signal; A step of determining the presence or absence of a component; and if the determination step determines that no frequency component is present in the specific band, the received signal is taken out as it is as an output, and A branching step for inputting a received signal to a subsequent signal processing step when it is determined that a frequency component is present in the frequency band, and the predetermined signal in response to the received signal from the branching step.
  • a signal processing step for performing an inverse conversion process of the conversion and an interpolation process of approximately combining and adding the frequency components of the suppressed band.
  • FIG. 1 is a diagram showing a configuration of a frequency interpolation device according to a first embodiment of the present invention.
  • FIG. 2 is a diagram showing a configuration of the analyzer.
  • FIG. 3 (a) shows the spectrum of the original audio signal.
  • (b) is a diagram showing a spectrum of an audio signal from which frequency components of a certain value or more have been removed.
  • FIG. 4 is a diagram showing examples of the spectral distribution after interpolation.
  • FIG. 5 is a diagram showing a configuration of a synthesizer.
  • FIG. 6 is a diagram showing a configuration of a frequency interpolation device according to a second embodiment of the present invention.
  • FIG. 7 is a diagram showing a configuration of the frequency interpolation unit of FIG.
  • FIG. 8 is a diagram showing a configuration of a frequency interpolation device according to a third embodiment of the present invention.
  • FIG. 1 is a diagram showing a configuration of a frequency interpolation device according to a first embodiment of the present invention.
  • the frequency interpolating apparatus includes an analyzer 1, a frequency interpolating unit 2, an interpolation band adding unit 3, and a synthesizer 4.
  • the analyzer 1 has n delay units 1 1—0 to 11 _ (n—1), (n + 1) samplers 12—0 to 12—n, and a filter. It is composed of bank 13. (However, n is any integer of 1 or more.)
  • the delay units 11-0 to 11- (n_l) output the signals supplied thereto with a delay of one sample period of this signal.
  • the signal output from the delay unit 11-k (k is any integer from 0 to (n-1)) is supplied to the sampler 12-k. Further, the signal output from the delay unit 11-1 (j + 1) is supplied to the delay unit 11-1 j (j is an integer of 0 or more and (n-2) or less).
  • the delay section 111-1 (n-1) is supplied with a PCM (Pulse Code Mudulation) signal to be subjected to frequency interpolation by the frequency interpolator. Accordingly, the delay unit 111k outputs a signal obtained by transmitting the PCM signal supplied to the delay unit 111- (n-1) for (n-k) sample periods of the PCM signal.
  • PCM Pulse Code Mudulation
  • PCM signal is a signal obtained by performing so-called PCM modulation by sampling and quantizing the analog audio signal such as voice.
  • the spectrum distribution of the audio signal represented by this PCM signal is shown in, for example, Fig. 3.
  • the samplers 12—0 to 12—n sample the signals supplied to themselves at a frequency that is (n + 1) th the sampling frequency of the PCM signal to be subjected to frequency interpolation.
  • the representative signal is supplied to the filter bank 13.
  • the signal output from the delay unit 11-k is supplied to the sampler 12_k.
  • the PCM signal to be subjected to frequency interpolation by the frequency interpolator is supplied to the sampler 12-n substantially simultaneously with the supply of the PCM signal to the delay unit 11_ (n-1).
  • the filter bank 13 is composed of a DSP (DigitalSiggnalProcessor), a CPU (CentrarPlorsocsEngS), and the like.
  • the filter bank 13 is supplied with signals output from the samplers 12-1 to 12-n as described above.
  • the filter bank 13 includes a polyphase filter, a discrete cosine transform, (DCT: Discrete Cosine Tran sfo rm), LOT (Lapped Orthogonal Tran sfo rm), and MLT (Modulated L aped Tr an sfo rm), QMF (Quadrature
  • (n + 1) th which represent the short-range S-vector distribution of this signal supplied to itself, using techniques such as M irror F i 1 ter) or ELT (Extended Lapped Tr an sfo rm).
  • Generate (n + 1) signals That is, the time series signal is converted into a frequency spectrum signal.
  • the generated (n + 1) signals are supplied to the frequency interpolation processing unit 2 and the interpolation band addition unit 3.
  • the p-th (p is an integer from 1 to (n + 1)) signal generated by the filter bank 13 is obtained by converting the short-term spectral distribution of the signal output by the sampler 12—0 to 12—n to (n + 1) It is assumed that the signal represents a spectrum distribution in a band having a p-th lowest frequency among bands obtained by equal division and having equal bandwidths.
  • the frequency interpolation processing unit 2 includes a DSP, a CPU, and the like.
  • the frequency interpolation processing unit 2 is supplied from the filter bank 13 with (n + 1) signals representing the spectrum distribution in each of the (n + 1) bands, for example, the following (1) to (5)
  • a reference band to be used as an interpolation band described later is determined.
  • the frequency interpolation processing unit 2 first determines the number q of the bands represented by the signal supplied from the filter bank 13 from the highest frequency.
  • (q is an integer of 1 or more and n or less) specifies the band (reference band) formed by connecting the continuous bands.
  • the root mean square value X of the spectral components in the reference band is obtained.
  • the band equal to or higher than the highest frequency of the reference band is specified as a band that does not substantially include the spectrum of the audio signal represented by the PCM signal supplied to the analyzer 1.
  • the frequency interpolation processing unit 2 is a band that can be formed by connecting Q continuous bands of the bands represented by the signal supplied from the filter bank 13 excluding the band with the highest frequency. (One band to be compared). Then, the root mean square value Y of the spectrum component in the band to be compared is obtained.
  • the values of the spectral components of the comparison target band are normalized using the root mean square of the spectral components in the reference band and the comparison target band. That is, for example, the value of the ratio of the root mean square value of the spectrum component in the comparison target band to the root mean square value of the spectrum in the reference band, that is, Y / X, is obtained, and The product obtained by multiplying the value of each spectral component by the value of this ratio is determined. The set of obtained products represents the spectrum distribution in the band to be compared after being normalized.
  • the correlation coefficient between the spectral distribution in the reference band and the spectral distribution in the band to be compared after the standardization is obtained using a method such as the least squares method.
  • the frequency interpolation processing unit 2 treats the frequency of each spectrum in the comparison target band as a frequency obtained by adding the difference between the lowest frequency of the reference band and the lowest frequency of the comparison target band to its original value. The number of relations shall be determined.
  • the frequency interpolation processing unit 2 performs the above-described processes (1) to (4) for all possible values of q and all possible combinations of the reference band and the comparison target band. When the number of relations is obtained, the combination with the highest correlation coefficient among these combinations is specified. Then, information for specifying the reference band included in the combination is supplied to the interpolation band adding unit 3.
  • the interpolation band adder 3 is composed of DSP, CPU, and the like.
  • the interpolation band adding unit 3 receives the signals in the respective bands. Identify the functions that make up the envelope of the vector distribution. Then, by performing regression calculation based on the specified function, etc., the band for each of these bands is a band on the higher frequency side than the band having the highest frequency (although the band was suppressed by the band limiting process). The estimated value of the mean square value of the spectrum component that should be originally included in the data is obtained.
  • the number of interpolation bands may be one or more, and the bandwidth of each interpolation band is equal to the bandwidth of the reference band specified by the information supplied by the frequency interpolation processing unit 2.
  • each interpolation band is continuous so as not to overlap with each other, and the interpolation band addition unit 3 calculates an estimated value of a root mean square value of a spectrum component for each interpolation band. Shall be sought.
  • the interpolation band adding unit 3 scales the specified reference band to thereby calculate the spectrum distribution of the interpolation band. Ask.
  • the interpolation band addition unit 3 first obtains the mean square value of the spectral components in the specified reference band. And the square of the spectrum component in the determined reference band The value of the ratio of the estimated value of the root mean square value of the spectrum component in the interpolation band to the average value is obtained, and the product obtained by multiplying the value of each spectrum component in the reference band by the value of this ratio is obtained. Ask for. The resulting set of products represents the spectral distribution in the reference band after scaling.
  • the interpolation band addition unit 3 generates a signal representing the spectrum distribution in the interpolation band by treating the spectrum distribution in the scaled reference band as representing the spectrum distribution in the interpolation band, The generated signal is supplied to the synthesizer 4 together with the signal supplied from the filter punk 13.
  • the interpolation band addition unit 3 when the spectrum distribution in the scaled reference band is treated as the spectrum distribution in the r-th interpolation band from the lower frequency, the interpolation band addition unit 3 generates the spectrum distribution in the scaled reference band.
  • the spectrum frequency shall be treated as the value obtained by adding the original value, the highest frequency of the reference band, and the value of (r-1) times the bandwidth of the interpolation band.
  • FIGS. 4 (a) and 4 (b) are diagrams showing examples of the spectral distribution after interpolation.
  • FIG. 4 (a) shows a case where the correlation coefficient is high even when the combination of band 7 and band 6 among the seven bands (band 1 to band 7) of the audio signal represented by the original PCM signal is present. In other words, this is the case where the spectrum pattern has repeatability in one band cycle.
  • the spectrum having substantially the same distribution as the spectrum distribution of the band 7 as the reference band in this case is included in the four interpolation bands A1 to A4. Has been added.
  • Fig. 4 (b) shows that among the seven bands of the audio signal represented by the original PCM signal, the combination of the band consisting of bands 6 and 7 and the band consisting of bands 4 and 5 has the highest correlation coefficient. It was when it was high. In other words, this is the case where the repetition of the spectrum pattern in a cycle of two bands is recognized.
  • a spectrum having substantially the same distribution as the spectrum distribution of the reference band of the case that is, the band composed of bands 6 and 7) is added to the two interpolation bands B1 to B2. I have.
  • the synthesizer 4 includes a filter bank 41, (n + 1) samplers 42—0 to 42—n, and n delay units 43—0 to 43— (n—1). And adders 44-0 to 44- (n-1).
  • the filter bank 41 includes a DSP, a CPU, and the like, and is supplied with a signal representing the spectrum distribution after interpolation, which is output from the interpolation band addition unit 3, as described above. Then, the filter bank 41 uses a polyphase filter, DCT, L ⁇ T, MLT, or ELT, or the like, and converts the signal having the spectral distribution represented by the signal supplied to itself at (n + 1) points. Generate (n + 1) signals representing equally sampled values (that is, convert spectral signals in the frequency band back to time-domain signals). Then, the p-th (p is an integer from 1 to (n + 1)) signal of the generated (n + 1) signals is supplied to the sampler 42— (p ⁇ 1).
  • sampling interval of the value represented by this signal generated by the filter bank 41 is substantially equal to the sampling interval of the samplers 12-1 to 12-n of the analyzer 1.
  • the p-th signal generated by the filter bank 41 is a sampling value of values obtained by sampling a signal having a spectral distribution represented by the signal supplied to the filter bank 41 at (n + 1) points at equal intervals. Let the time represent the p-th earliest value.
  • Each of the samplers 42_1 to 42-n converts a signal supplied thereto into a signal having a frequency (n + 1) times that of the signal, and outputs a PCM signal representing a result of the conversion.
  • the p-th signal output from the filter bank 41 is supplied to the sampler 42— (p ⁇ 1) as described above. Then, the sampler 42— (s ⁇ 1) supplies the signal output by itself to the adder 44 ⁇ 1 (p ⁇ 1) (s is an integer from 1 to n). The sampler 42-n supplies the signal output by itself to the delay unit 43_ (n-1). You.
  • the delay units 43-0 to 43- (n-1) output the signals supplied to them by delaying them by one period of this signal.
  • the signal output from the delay unit 43-k (k is any integer from 0 to (n-1)) is supplied to the adder 44-k. Further, the delay unit 43-j (j is any integer from 0 to (n-2)) is supplied with a signal output from the adder 44-1 (j + 1). As described above, the signal output from the sampler 42_n is supplied to the delay units 43-(n-1). The adders 44-0 to 44-1 (n-1) receive the two signals supplied to themselves. Outputs a signal representing the sum of the signals.
  • the signal is supplied to the adder 44-1k from the sampler 42-k and the delay unit 43-k.
  • the signal output from the adder 44-1m (m is an integer of 1 or more and n-1 or less) is supplied to the delay unit 43- (m-1).
  • the signal output by the adder 44-0 forms the output signal of this frequency interpolator.
  • the output signal output from the adder 44-0 is the signal output from the sampler 42-0, 42-1, 1,..., 42— (n-1), and 42_n.
  • This is a PCM signal corresponding to a signal sequentially output at substantially the same cycle as the cycle of the CM signal, and the spectrum distribution corresponding to the spectrum distribution after interpolation.
  • the portion of the interpolated band added by the interpolated band adder 3 in the interpolated spectrum distribution is the spectrum of the reference band having the highest correlation of the spectrum distribution and the reference band included in the combination of the comparison target band. It has a spectrum distribution corresponding to the vector distribution. Therefore, the portion of the interpolation band can be regarded as a harmonic component of the reference band or the comparison target band, and the output signal output from the adder 44-10 is an audio signal close to the audio signal before the band was limited. It becomes a PCM signal obtained by performing PCM modulation on the signal. Therefore, by restoring the audio signal using this output signal, the audio signal is restored with high sound quality.
  • This frequency interpolator is not limited to the above.
  • delay units 1 1 1 0 to 1 1— (n-1) and 43-0 to 43— (n-1) may perform the functions of the samplers 12-0 to 12-n and 42-0 to 42 n, and the adders 44-0 to 44-1 (n-1).
  • the frequency interpolation processing unit 2 obtains an arbitrary numerical value indicating the correlation between the reference band and the comparison target band based on the spectrum distribution of the reference band and the comparison target band, instead of the correlation coefficient, and It may be used for band determination.
  • the frequency interpolation processing unit 2 may supply the information specifying the comparison target band included in the specified combination to the interpolation band addition unit 3.
  • the interpolation band addition unit 3 may obtain the spectrum distribution of the interpolation band by scaling the specified comparison target band.
  • the frequency interpolation processing unit 2 may standardize the band to be compared in the above-described process (3).
  • the highest frequency of the reference band includes the highest frequency of the spectrum of the original PCM signal.
  • the reference band itself can be regarded as a harmonic component of the band to be compared. Therefore, if the spectrum distribution of the interpolation band is determined based on the spectrum distribution of the reference band, the output signal output by the adder 440 will be compared with the spectrum distribution of the interpolation band. This represents an audio signal that is closer to the audio signal before the band is limited, as compared to the case where it is obtained based on the spectrum distribution of the band.
  • the signal to be interpolated by the frequency interpolator does not need to be a PCM signal, nor does it need to be a modulated wave obtained by modulating an audio signal.
  • the frequency interpolating apparatus can be realized using an ordinary computer system without using a dedicated system.
  • a medium CD-R ⁇ M, MO, floppy disk
  • a frequency interpolator that executes the above-described processing can be configured.
  • the program may be posted on a bulletin board (BBS) of a communication line and distributed via the communication line.
  • BBS bulletin board
  • a carrier wave is modulated by a signal representing the program, and the obtained modulation is obtained.
  • a device that transmits a wave and receives the modulated wave may demodulate the modulated wave and restore the program.
  • the program excluding the part is recorded on the recording medium. It may be stored. Also in this case, in the present invention, it is assumed that the recording medium stores a program for executing each function or step executed by the combination.
  • the above-described first object of the present invention is effectively achieved by the frequency interpolation device (or method) according to the first embodiment of the present invention described above.
  • FIG. 6 is a diagram showing a configuration of an embodiment for achieving the second object of the present invention, that is, a frequency interpolation apparatus according to a second embodiment of the present invention.
  • the frequency interpolation device includes a high-frequency detection unit 1, a voice compression unit 2, a voice expansion unit 3, and a frequency interpolation unit 4.
  • the high-frequency detector 1 includes an HPF (high-pass filter) 11 and a detector 12.
  • the HP F 11 When a PCM (Pu1 se Code Mud u1 ation) signal to be subjected to decompression is supplied to itself, the HP F 11 receives the PCM signal at a predetermined frequency or lower. This component is cut off, and another component (high-frequency component) is supplied to the detector 12.
  • the PCM signal to be subjected to data compression which is supplied to the HPF 11, is also supplied to the audio compression unit 2 in parallel.
  • the PCM signal to be subjected to data compression represents an audio signal that represents voice or the like as a change in voltage or current.
  • the pass frequency described above may be any frequency that is higher than the upper limit of the occupied band of the compressed data obtained as a result of data compression of the PCM signal by the audio compression unit 2 as described later. For example, when the upper limit of the occupied band of the compressed data is about 14 kilohertz, the above-mentioned pass frequency may be about 16 kilohertz, for example.
  • the detection unit 12 detects the high-frequency component and generates a detection signal.
  • the detection signal is, for example, a PCM to be subjected to decompression.
  • the signal is supplied to the audio compressor 2 at the same time as the timing at which the signal is supplied to the audio compressor 2.
  • the audio compression unit 2 includes, for example, a DSP (Digital Signal Processor), a CPU (Central Processing Unit), a multiplexer, and the like, and a recording medium (for example, a CD-R).
  • a recording medium driver is provided for recording data into the recording medium and reading data from the recording medium.
  • the audio compression unit 2 adds MP3 AAC (Advance d Audio Aoio) to the data represented by the PCM signal.
  • MP3 AAC Advanced d Audio Aoio
  • Cod i n Perform data compression by any other method.
  • the upper limit frequency of the occupied band of the data obtained by the data compression (that is, the above-described compression data) is equal to or less than a predetermined value.
  • the audio compression unit 2 generates external data indicating whether or not the high frequency component is included in the PCM signal according to whether or not the detection signal is supplied from the detection unit 12.
  • the audio compression unit 2 determines that a high-frequency component exists in the PCM signal supplied thereto in synchronization with the detection signal. Generate the external data shown.
  • the audio compression unit 2 determines that a high-frequency component exists in the PCM signal supplied thereto in synchronization with the detection signal. Generate the external data shown.
  • a PCM signal to be subjected to data compression is supplied, and when a detection signal synchronized with the PCM signal is not supplied, external data indicating that no high-frequency component exists in the PCM signal.
  • the upper limit frequency of the occupied band of the compressed data is about 14 kilohertz.
  • the detection unit 12 When the PCM signal does not substantially include the component), the detection unit 12 generates external data indicating that the high frequency component does not exist in the PCM signal.
  • the audio compression unit 2 associates the compressed data obtained by data compression of the PCM signal with the above-described external data indicating whether or not a high-frequency component exists in the PCM signal, Recording is performed on an external recording medium set in the recording medium driver.
  • the audio compression unit 2 may include a communication control device including a modem, a terminal adapter, and the like connected to an external communication line, instead of or together with the recording medium driver.
  • the audio compression unit 2 attaches the above-mentioned external data indicating the presence or absence of a high-frequency component of the PCM signal to the compressed data obtained by data compression of the PCM signal supplied thereto, and performs communication. It may be transmitted to the outside via a line.
  • the audio compression section 2 performs data compression in the MP3 format on the PCM signal, the external data may be included in the ansierra code.
  • the audio decompression unit 3 includes, for example, a DSP, a CPU, and the like, and also includes a recording medium driver.
  • the audio decompression unit 3 stores the above-described compressed data representing the data obtained by compressing the PCM signal using a method such as MP3 or AAC, and the above-mentioned external data associated with the compressed data on a recording medium. Read from an external recording medium set in the driver. Then, the read compressed data is expanded by a method such as MP3 or AAC, a PCM signal representing the data obtained by the expansion is generated, and the generated PCM signal and the external data read from the recording medium are output.
  • the frequency interpolating unit 4 More specifically, to the interpolation necessity determining unit 41 described later
  • the audio decompression unit 3 may include a communication control device instead of or together with the recording medium driver.
  • the audio decompressing unit 3 receives the external data and the compressed data and receives the compressed data. Decompresses and sends the PCM signal representing the data obtained by decompression and the received external data to the frequency interpolation unit 4. May be supplied.
  • the frequency interpolation unit 4 includes an interpolation necessity determination unit 41, an analyzer 42, an interpolation processing unit 43, an interpolation band addition unit 44, and a synthesizer 45. ing.
  • the interpolation necessity determining unit 41 is composed of, for example, a demultiplexer. When the PCM signal and the external data associated with each other are supplied from the audio decompression unit 3, the interpolation necessity determining unit 41 determines whether the external data indicates the presence or absence of the high frequency component. Is determined. If it is determined that the high frequency component is present, the PCM signal supplied from the audio decompression unit 3 is supplied to the analyzer 42.
  • the interpolation necessity determination unit 41 converts the PCM signal supplied from the audio decompression unit 3 into Output as an output signal of the frequency interpolation unit 4.
  • the analyzer in the configuration of the frequency interpolation unit 4 in FIG. 6 has substantially the same configuration as the configuration of the analyzer shown in FIG. 2, and performs substantially the same processing as the analyzer in FIG.
  • the analyzer of the frequency interpolation unit 4 in FIG. 8 has equal bandwidths (n + 1) obtained by equally dividing the spectral distribution of the compressed data supplied thereto to (n + 1).
  • (N + 1) signals representing the spectral distribution in each of the bands are generated and supplied to the interpolation processing unit of the frequency interpolation unit 4.
  • the synthesizer in the configuration of the frequency interpolation section 4 in FIG. 6 has substantially the same configuration as the configuration of the synthesizer shown in FIG.
  • the synthesizer of the frequency interpolation unit 4 in FIG. 8 performs substantially the same operation as the synthesizer in FIG. 5 to convert a PCM signal having a spectrum distribution corresponding to the spectrum distribution after interpolation into
  • the PCM signals are sequentially output at substantially the same cycle as the cycle of the PCM signal supplied to the analyzer of the frequency interpolation unit 4.
  • the components in the interpolated band added by the interpolation band addition unit of the frequency interpolation unit 4 are included in the combination of the reference band having the highest correlation of the spectrum distribution and the band to be compared.
  • Spectrum corresponding to the spectrum distribution in the reference band It has a vector distribution.
  • FIG. 8 is a diagram showing a configuration of a frequency interpolation device according to a third embodiment of the present invention.
  • this frequency interpolation device has an envelope detection unit 5 instead of the high-frequency detection unit 1 and a frequency interpolation unit 4 that does not include the interpolation necessity determination unit 41, except that It has substantially the same configuration as the frequency interpolation device of the second embodiment shown in FIG.
  • the frequency interpolation unit 4 in the configuration of FIG. 8 includes an analyzer, an interpolation processing unit, an interpolation band addition unit, and a synthesizer, like the frequency interpolation unit 4 in the configuration of FIG. However, the operation of each unit of the audio signal processing device is different from the operation of each unit of the audio signal processing device in FIG.
  • the envelope detection unit 5 includes, for example, an analyzer having substantially the same configuration as the analyzer 41 of the frequency interpolation unit 4, a parallel-serial converter, and an LPF (low-pass filter).
  • the analyzer of the envelope detection unit 5 When a PCM (Pulse Code Mduation) signal to be subjected to decompression is supplied to itself, the analyzer of the envelope detection unit 5 generates a certain number of signals representing the spectrum distribution of the PCM signal. A signal is generated, and the generated signal is supplied to the parallel-to-serial converter of the envelope detector 5. The PCM signal to be subjected to data compression is also supplied to the audio compression unit 2 in parallel.
  • PCM Packe Code Mduation
  • the parallel-to-serial converter of the envelope detector 5 receives each signal representing the spectrum distribution of the PCM signal to be subjected to data compression from the analyzer of the envelope detector 5, These signals are sequentially supplied to the LPF of the envelope detector 5 in the order of representing the lower frequency band (or in the order of representing the higher frequency band).
  • the LPF of the envelope detector 5 receives the signal representing the spectrum distribution of the PCM signal to be subjected to data compression sequentially from the parallel-to-serial converter of the envelope detector 5, and receives the signal. Among these supplied signals, components whose frequency is higher than a certain cutoff frequency are cut off, and other components (low-frequency components) are supplied to the audio compression unit 2. LPF of envelope detector 5 is audio pressure The low-frequency component supplied to the compression unit 2 forms a signal representing the envelope of the spectrum distribution of the PCM signal to be subjected to data compression.
  • the audio compression unit 2 in the configuration of FIG. 8 represents a low-frequency component supplied from the envelope detection unit 5 instead of generating external data according to whether or not a detection signal is supplied from the detection unit 12.
  • Signals (signals representing the envelope of the spectrum distribution of the PCM signal to be subjected to data compression) are treated as external data.
  • the audio compression unit 2 associates the compressed data with the external data representing the envelope of the spectrum distribution of the original PCM signal used to generate the compressed data, and sets the compressed data in the recording medium driver. Recorded on an external recording medium.
  • the external data is attached to the compressed data and transmitted to the outside via a communication line.
  • the audio decompression unit 3 in FIG. 8 converts the above-described compressed data representing the data obtained by compressing the PCM signal using a method such as MP3 or AAC, and the above-mentioned external data associated with the compressed data. Acquire it from an external recording medium or acquire compressed data with external data supplied to itself from outside via a communication line.
  • the obtained compressed data is expanded by a method such as MP3 or AAC in the same manner as the audio expansion unit 3 in FIG. 6, and the PCM signal representing the data obtained by expansion is analyzed by the analyzer of the frequency interpolation unit 4. To supply. Further, the obtained external data is supplied to the interpolation band adding section of the frequency interpolation section 4.
  • the analyzer in the configuration of the frequency interpolation unit 4 in FIG. 8 has substantially the same configuration as the configuration of the analyzer shown in FIG. 2, and performs substantially the same processing as the analyzer in FIG. As a result, the analyzer of the frequency interpolator 4 in FIG. 8 obtains (n + 1) equal bandwidths by dividing the spectral distribution of the compressed data supplied thereto into (n + 1) equal parts. Then, (n + 1) signals representing the spectrum distribution in each band are generated and supplied to the interpolation processing unit of the frequency interpolation unit 4.
  • the interpolation processing section in the configuration of the frequency interpolation section 4 in FIG. 8 has substantially the same configuration as the interpolation processing section 43 in the configuration in FIG. 7, and the interpolation processing section 43 in FIG.
  • the reference band is determined by performing substantially the same operation as the above, and the determined reference band is specified. This information is supplied to the interpolation band adder of the frequency interpolator 4.
  • the interpolation band addition unit in the configuration of the frequency interpolation unit 4 in FIG. 8 is composed of DSP, CPU, and the like, like the interpolation band addition unit 44 in the configuration of the frequency interpolation unit 4 in FIG.
  • the interpolation band addition unit of the frequency interpolation unit 4 shown in FIG. 8 supplies (n + 1) signals representing the spectrum distribution in each of the (n + 1) bands from the analyzer of the frequency interpolation unit 4
  • the signal representing the spectrum distribution after interpolation is performed by performing substantially the same processing as the interpolation band addition unit 44 in FIG. Is supplied to the synthesizer of the frequency interpolation unit 4.
  • the interpolation band adder of the frequency interpolator 4 in FIG. 8 specifies the function that forms the envelope of the spectrum distribution in each band based on the signal supplied from the analyzer of the frequency interpolator 4. Instead of performing the regression calculation, the estimated value of the root mean square value of the spectral component that should be originally included in the band to be interpolated is obtained based on the function forming the envelope indicated by the external data supplied by itself.
  • the synthesizer in the configuration of the frequency interpolation unit 4 in FIG. 8 has substantially the same configuration as the configuration of the synthesizer shown in FIG.
  • the synthesizer of the frequency interpolation unit 4 in FIG. 8 performs substantially the same operation as the synthesizer in FIG. 5 to convert a PCM signal having a spectrum distribution corresponding to the spectrum distribution after interpolation into
  • the PCM signals are sequentially output at substantially the same cycle as the cycle of the PCM signal supplied to the analyzer of the frequency interpolation unit 4.
  • the components in the interpolated band added by the interpolation band addition unit of the frequency interpolation unit 4 are included in the combination of the reference band having the highest correlation of the spectrum distribution and the band to be compared. It has a spectrum distribution corresponding to the spectrum distribution in the reference band.
  • the configuration of the audio signal processing device is not limited to the above.
  • the analyzer of the envelope detector 5 has a known configuration. It may be constituted by an FFT (Fast Fourier Transformer) having a composition.
  • the envelope detection unit 5 instead of generating a signal representing an envelope of a spectrum distribution of a PCM signal to be subjected to data compression, the envelope detection unit 5 generates a signal indicating an occupied band of the PCM signal to be subjected to data compression. You may do so.
  • the audio compression unit 2 may treat, as external data, data representing the occupied band of the spectrum distribution of the original PCM signal used for generating the compressed data.
  • the data indicating the occupied band only needs to be composed of, for example, data indicating the lowest frequency of the spectrum component of the PCM signal and the occupied bandwidth of the PCM signal. If the frequency is a predetermined value (for example, 0 Hertz), it is sufficient to include data indicating the occupied bandwidth of the PCM signal.
  • the interpolation band addition unit of the frequency interpolation unit 4 is the first embodiment. Similar to the interpolation band addition unit 44 in the above, by specifying a function forming an envelope of the spectrum distribution in each band based on the signal supplied from the analyzer of the frequency interpolation unit 4 and performing a regression calculation, It is assumed that the estimated value of the root mean square value of the spectral component that should be originally included in the interpolated band is obtained.
  • an audio signal having a high sound quality for restoring a signal close to the original signal from a modulated wave obtained by using a signal in which the band of the original signal is limited can be restored.
  • a frequency interpolation device and a frequency interpolation method for restoration are realized.
  • a signal representing a signal in which a spectral component in a partial band of the original signal is suppressed and a signal representing an original signal which does not originally include a spectrum component in the band are included.
  • a frequency interpolation apparatus and a frequency interpolation method for appropriately restoring a signal close to the original signal from either one of the signals or a signal in which these signals are mixed are realized.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

明細書
周波数補間装置および周波数補間方法 技術分野
この発明は、'帯域制限された信号のスぺクトル分布を改善する周波数補間装置及 び周波数補間方法に関する。
^背:景技術
MP 3 (MPEG 1 aud i o l ay e r 3) 形式のデータの配信、 及び、 FM (F r e qu e n c y Modu l a t i on) 放送やテレビジョン音声多重 放送等の手法による音楽などの供給が近年盛んになつている。 これらの手法では、 帯域が過度に広くなることによるデータ量の増大や占有帯域幅の広がりを避けるた め、 一般に、 供給する対象の音楽等のうち約 15 kHz以上の周波数成分が除去さ れている。
このように、 一定値以上の周波数成分が除去された音楽等は通常、 音質が悪い。 そこで、 除去された周波数成分に代わる信号を加算することが考えられる。 このた めの手法としては、 特開平 7— 93900号公報に開示されている手法がある。
特開平 7— 93900号公報に開示されている手法は、 P CMディジタルオーデ ィォ信号を口一パスフィルタに通して得られる出力オーディオ信号を、 当該出力信 号の絶対値成分を含む信号を乗算することにより歪みを生じさせる、 という手法で ある。
しかし、 特開平 7— 93900号公報のオーディオ信号再生装置は、 出力オーデ ィォ信号の波形をリミッタ回路等を用いて歪ませることにより高調波を発生させる に過ぎないものであって、 この高調波は元のオーディオ信号に本来的に含まれてい たものに近似し得るものであるかは分からない。
この発明は、 上記従来技術の欠点に鑑みてなされたものであり、 原信号の帯域を 制限した信号を用いて得られる所定の変換信号から原信号に近い信号を復元できる ようにするための周波数補間装置及び周波数補間方法を提供すること、 とりわけォ 一ディォ信号を高音質で復元するための周波数補間装置及び周波数補間方法を提供 することを第 1の目的とする。
さらに、 従来技術においては、 一定値以上の周波数成分を除去する必要がない場 合であっても、 音楽等を表すオーディオ信号を M P 3形式等でデータ圧縮する結果、 オーディォ信号の帯域は一律に制限されてしまうのが一般的である。
しかし、 P C Mディジタルオーディオ信号が表す元の音声等が、 本来的にローパ スフィルタの通過帯域幅を超える高域成分を有していないものである場合、 従来の 装置では、 元の音声等に含まれていない誤った高域成分を追加することになる。 こ のため、 出力オーディオ信号の音質は、 単に口一パスフィルタを通しただけで何も 処理を行なわないものに比べ、 かえつて劣化してしまうこととなる。
そこで、 上記実状に鑑み本発明は、 さらに原信号の一部帯域内のスペクトル成分 を抑圧したものを表す信号と、 当該帯域のスぺクトル成分を本来含まない原信号を 表わす信号が混在する信号からも、 原信号に近い信号を復元できるようにするため の周波数補間装置及び周波数補間方法を提供することを第 2の目的とする。
発明の開示
本発明の周波数補間装置は、 上記第 1の目的を達成するために、 原信号の特定周 波数帯域において周波数成分が抑圧された入力信号から、 該抑圧された周波数成分 を近似的に復元して原信号に近い信号を再生するための周波数補間装置において、 周波数成分が抑圧されないで残存する周波数帯域における短時間スぺクトルを求め、 所定の周波数間隔でのスぺクトルパターンの繰り返し性に基づいて、 該抑圧されて、 周波数帯域における周波数成分の短時間スぺクトルを推定し、 およびこの推定に基 づいて該抑圧された周波数成分を含む信号を合成して入力信号に付加するように構 成されている。 より具体的には、 本発明の周波数補間装置においては、 該短時間ス ぺクトルパターンの繰り返し性は、 周波成分が残存する周波数帯域における所定の 帯域幅を有する第 1の周波数蒂域と、 これに隣接する同一の帯域幅の第 2の周波数 帯域とにおける短時間スぺクトルパターン相互の相関度に基づいて判断される。
そして、 該第 1の周波数帯域の短時間スぺクトルパターンが第 2の周波数帯域に おける短時間スぺクトルパターンと強い相関度を有する場合に、 この相関を有する スぺクトルパターンのレプリカを結合して抑圧された周波数帯域の周波数成分を補 間するようにしている。
このような周波数補間装置によれば、 補間の対象とする信号 (被補間信号) のス ぺクトルのうちスぺク卜ル分布の相関が高い部分が、 包絡線に沿うようにして被補 間信号の高周波側に追加され、 帯域が拡張される。 追加されたスペクトルは、 元の スぺクトルの一部の高調波成分とみなし得るので、 被補間信号が帯域を制限された 信号である場合、 帯域が拡張された後の被補間信号は、 帯域が制限される前の原信 号に近いものとなる。 従って、 被補間信号がオーディオ信号を表すものであれば、 帯域が拡張された後の被補間信号を用いてオーディォ信号を復元することにより、 オーディォ信号が高音質で復元される。
さらに、 本発明の周波数補間装置においては、 該残存する周波数帯域のスぺク卜 ル包絡から推定される、 抑圧された周波数帯域のスぺクトル包絡に基づいて該補間 されるべき周波数成分の強度を決定するようにし、 また好ましくは、 該特定の周波 数帯域が、 高域周波数帯域とされ、 該第 1もしくは第 2の周波数帯域の上限周波数 が、 該抑圧された高域周波数帯域の下限周波数とされる。
このため、 前記被補間信号のスぺクトルのうち周波数が最高であるものを含んで いる場合、 被補間信号のスぺクトルのうち周波数が最高であるものを含む補間用帯 域自体が、 元のスペクトルの一部の高調波成分とみなし得る可能性が高い。 従って、 帯域が拡張された後の被補間信号は、 帯域が制限される前の原信号により近いもの となる。
本発明の第 1の目的を達成するための周波数補間装置は、 別の観点にたてば、 該 入力信号の短時間スぺクトルを生成するスぺクトル生成手段と、 互いに隣接する同 じ帯域幅を有する周波数帯域における短時間スぺクトルパターンが互いに相関関係 を有するような短時間スぺクトルパターンを抽出するスぺクトルパターン抽出手段 と、 該抑圧されない周波数帯域におけるスぺクトル包絡情報を抽出するスぺク卜ル 包絡抽出手段と、 該スぺクトルパターン抽出手段およびスぺクトル包絡抽出手段に 応動して、 該抑圧された周波数帯域を補間するための周波数スぺクトル信号を合成 する手段と、 該合成されたスぺクトル信号を該抑圧された周波数帯域に付加する手 段とを備える周波数補間装置として把握することもできる、 そして、 この装置にお いて、 該合成スペクトル信号は、 抑圧された周波数帯域における周波数成分を有し、 該抽出されたスぺクトルパターンを有し、 及び該スぺクトル包絡情報において定ま るレベルを有しており、 典型的には、 該入力信号が、 アナログオーディオ信号をサ ンプルし、 かつ量子化することにより得られた P C M信号から成るものである。
本発明は別の局面にかつ方法発明として把握することもできる。 この場合は、 本 発明の方法は、 原信号の特定周波数帯域に、 おける周波数成分が抑圧された入力信 号から、 該抑圧された周波数成分を近似的に復元して原信号に近い信号を再生する ための周波数補間方法であって、 周波数成分が抑圧されないで残存する周波数帯域 における短時間スぺクトルパターンの繰り返し性に基づいて、 該抑圧された周波数 帯域における周波数成分の短時間スぺクトルパターンを推定し、 およびこれを合成 して入力信号に付加するようにした方法であるということができる。
次に、 本発明の第 2の目的を達成するために、 本発明の周波数補間装置と、 原信 号の特定周波数帯域における周波数成分が抑圧された信号から、 該抑圧された周波 数成分を近似的に復元して、 原信号に近い信号を再生するための周波数補間システ ムにおいて、 原信号の該特定周波数帯域に所定のレベル以上の周波数成分が含まれ ているかどうかを判別して、 その有無を示す識別データを生成する手段と、 該原信 号の該特定周波数帯域の周波数成分を抑圧し、 及び所定の信号変換処理を施す信号 変換手段と、 該変換された信号に該識別データを重畳して送信する手段と、 該送信 された信号を受信して、 該受信された信号に含まれる該識別データを判別して、 該 特定帯域の周波数成分の有無を判定する手段と、 該判定手段により、 該特定帯域に 周波数成分がなかったと判定された場合に、 該受信信号をそのまま外部に出力とし てとり出し、 また該特定周波数帯域に周波数成分があつたと判定された場合に、 次 段の信号処理手段に受信信号を入力させるよう動作する分岐制御手段と、 該分岐制 御手段からの該受信信号に応動して、 該所定の信号手段の逆変換処理および抑圧さ れた帯域の周波数成分を近似的に合成し付加する補間処理を実行するための信号処 理手段とを含む。 ここで、 該所定の信号変換処理とは、 より具体的にはデータ圧縮 処理であり、 該信号処理手段における該逆変換処理はデータ伸張処理である。 また、 該信号処理手段における補間処理は、 ( i ) 短時間スぺクトル分析処理、 ( i i ) 隣接する周波数帯域間で互いに相関を有する短時間スぺクトルパターンを抽出する 処理、 および (i i i ) スペクトル包絡情報を抽出する処理を使える。
このような周波数補間システムによれば、 原信号のスぺクトルが抑圧帯域に分布 しているかを示す識別データが生成される。 そして、 識別データが、 抑圧帯域内の スぺクトルの存在を示しているとき、 被補間信号のスぺクトルのうちスぺクトル分 布の相関が高い部分が、 包絡線に沿うようにして被補間信号の高周波側に追加され、 帯域が拡張される。 追加されたスペクトルは、 元のスペクトルの一部の高調波成分 とみなし得るので、 被補間信号が帯域を制限された信号である場合、 帯域が拡張さ れた後の被補間信号は、 帯域が制限される前の原信号に近いものとなる。 一方、 識 別データが、 被補間帯域内のスペクトルの不存在を示しているとき、 被補間信号は スぺクトル追加を受けずに出力される。
従って、 受信信号が、 被補間信号が原信号の一部帯域内のスペクトル成分を抑圧 したものであっても、 当該帯域のスぺクトル成分を本来的に含まない原信号を表す ものであっても、 原信号に近い信号が復元される。 そして、 信号がオーディオ信号 を表すものであれば、 このオーディォ信号が高音質で復元される。
本発明に係る上述の周波数補間システムは、 信号の (エンコーダを含む) 送信側 と、 (デコーダを含む) 受信側を双方を一体化したものとして把握したものである。 一方、 受信側 (デコーダ側) のみの構成として本発明を換えることもでき、 その場 合、 本発明の装置は、 原信号の特定周波数帯域における周波数成分が抑圧された信 号から、 該抑圧された周波数成分を近似的に復元して、 原信号に近い信号を再生す るための周波数補間装置であって、 原信号の該特定周波数帯域に所定の特定の周波 数帯域の信号成分が抑圧された原信号に所定の信号変換を施して得られる信号と、 これに重畳される該特定の周波数帯域に本来的に所定のレベル以上の周波数成分が 含まれていたかどうかを表わす識別データとから成る信号を受信する手段と、 該受 信された信号に含まれる該識別データを判別して、 該特定帯域の周波数成分の有無 を判定する手段と、 該判定手段により、 該特定帯域に周波数成分がなかったと判定 された場合に、 該受信信号をそのまま各部に出力としてとり出し、 また該特定周波 数帯域に周波数成分があつたと判定された場合に、 次段の信号処理手段に受信信号 を入力させるよう動作する分岐制御手段と、 該分岐制御手段からの該受信信号に応 動して、 該所定の信号変換の逆変換処理および抑圧された帯域の周波数成分を近似 的に合成し付加する補間処理を実行するための信号処理手段とから構成される。 さらに、 第 1の目的を達成するための周波数補間装置の場合と同様に、 方法発明 として把えた場合、 本発明の方法は、 原信号の該特定周波数帯域に所定のレベル以 上の周波数成分が含まれているかどうかを判別し、 その有無を示す識別データを生 成するステップと、 該原信号の該特定周波数帯域の周波数成分を抑圧し、 及び所定 の信号変換処理を施すステップと、 該変換された信号に該識別デ一夕を重畳して送 信するステップと、 該送信された信号を受信して、 該受信された信号に含まれる該 識別データを判別して、 該特定帯域の周波数成分の有無を判定するステップと、 該 判定ステップにより、 該特定帯域に周波数成分がなかったと判定された場合に、 該 受信信号をそのまま外部に出力としてとり出し、 また該特定周波数帯域に周波数成 分があつたと判定された場合に、 後の信号処理ステップに受信信号を入力させるよ う操作する分岐ステップと、 該分岐ステップからの該受信信号に応動して、 該所定 の信号変換の逆変換処理および抑圧された帯域の周波数成分を近似的に合成し付加 する補間処理を実行するための信号処理ステップとを含む信号処理方法であるとい うことができる。
図面の簡単な説明
第 1図は、 この発明の第 1の実施形態に係る周波数補間装置の構成を示す図であ る。
第 2図は、 アナライザの構成を示す図である。
第 3図の (a ) は、 元のオーディオ信号のスペクトルを表す図であり、 また (b) は、 オーディオ信号のうち一定値以上の周波数成分が除去されたもののスぺ クトルを表す図である。
第 4図の (a) 及び (b) は、 補間後のスペクトル分布の例を示す図である。 第 5図は、 シンセサイザの構成を示す図である。
第 6図は、 この発明の第 2の実施形態に係る周波数補間装置の構成を示す図であ る。
第 7図は、 第 6図の周波数補間部の構成を示す図である。
第 8図は、 この発明の第 3の実施形態に係る周波数補間装置の構成を示す図であ る。
発明の実施の形態
以下、 図面を参照して、 この発明の実施の形態をいくつかの実施例をあげながら 詳細に説明する。
(第 1の実施形態)
第 1図は、 この発明の第 1の実施形態に係る周波数補間装置の構成を示す図であ る。
図示するように、 この周波数補間装置は、 アナライザ 1と、 周波数補間処理部 2 と、 補間バンド加算部 3と、 シンセサイザ 4とより構成されている。
アナライザ 1は、 第 2図に示すように、 n個の遅延部 1 1— 0〜1 1 _ (n— 1) と、 (n+ 1) 個のサンプラ一 12— 0〜12— nと、 フィルタバンク 13と より構成されている。 (ただし、 nは 1以上の任意の整数とする。 )
遅延部 11— 0〜11— (n_ l) は、 各自に供給された信号を、 この信号のサ ンプル周期 1周期分遅らせて出力する。
遅延部 11一 k (kは 0以上 (n— 1) 以下の任意の整数) が出力する信号はサ ンプラ一 12— kに供給される。 また、 遅延部 11一 j (jは 0以上 (n— 2) 以 下の任意の整数) は、 遅延部 11一 (j + 1) が出力する信号を供給される。 遅延 部 11一 (n— 1) には、 この周波数補間装置により周波数の補間を施す対象とな る P CM (Pu l s e Code Mu d u 1 a t i o n) 信号が供給される。 従って、 遅延部 1 1一 kは、 遅延部 1 1— (n— 1) に供給された PCM信号を、 この P CM信号の (n— k) サンプル周期分送らせた信号を出力する。
なお、 上述の P CM信号は、 音声等のアナログオーディオ信号を用いてこれをサ ンプルし、 かつ量子化する、 いわゆる P CM変調を行うことにより得られる信号で ある。 この P CM信号が表すオーディオ信号のスペクトル分布は、 例えば第 3図
(b) に示すように、 第 3図 (a) に示す元のオーディオ信号のスペクトルのうち 一定値以上 (第 3図 (b) に示す場合においては、 14kHz以上) の周波数成分 が除去されたものに相当するものとする。
サンプラー 12— 0〜12— nは、 各自に供給された信号を、 周波数の補間を受 ける対象の P CM信号のサンプリング周波数の (n+ 1) 分の 1の周波数でサンプ リングし、 サンプリング結果を表す信号を、 フィルタバンク 13へと供給する。
サンプラー 12_kには、 上述の通り、 遅延部 11—kが出力する信号が供給さ れる。 サンプラー 12— nには、 この周波数補間器により周波数の補間を受ける対 象の PCM信号が、 遅延部 11_ (n— 1) に供給されるのと実質的に同時に供給 される。
フィルタバンク 13は、 DSP (D i g i t a l S i gn a l P r o c e s s o r) や CPU (Ce n t r a l P r o c e s s i ng Un i t) 等より構 成されている。
フィルタバンク 13は、 上述の通りサンプラー 12— 1〜12— nが出力する信 号を供給される。
そして、 フィルタバンク 13は、 ポリフェーズフィルタ、 離散コサイン変換、 (DCT : D i s c r e t e Co s i n e T r an s f o rm) 、 LOT (L a p p e d O r t h o gon a l T r an s f o rm) , MLT (Modu l a t e d L a p e d Tr an s f o rm) 、 QMF (Qu a d r a t u r e
M i r r o r F i 1 t e r ) あるいは E L T (E x t e n d e d L a p p e d Tr an s f o rm) 等の手法を用い、 自己に供給されたこの信号の短区間ス ベクトル分布を表す 1番目〜 (n+ 1) 番目までの (n+ 1) 個の信号を生成する。 つまり、 時系列信号を周波数スペクトル信号に変換する。 そして、 生成したこれら (n+ 1) 個の信号を、 周波数補間処理部 2及び補間バンド加算部 3へと供給する。 フィルタバンク 13が生成する p番目 (pは 1から (n+ 1) までの整数) の信 号は、 サンプラー 1 2— 0〜 12— nが出力する信号の短区間スぺクトル分布を (n + 1) 等分して得られる互いに帯域幅が等しい帯域のうち、 周波数が p番目に 低い帯域内のスぺクトル分布を表す信号であるものとする。
周波数補間処理部 2は、 DSPや CPU等より構成されている。 周波数補間処理 部 2は、 上述の (n+ 1) 個の各帯域内のスペクトル分布を表す (n+ 1) 個の信 号をフィルタバンク 13より供給されると、 例えば以下 (1) 〜 (5) として述べ る処理を行うことにより、 後述の補間用バンドとして用いる基準バンドを決定する。
(1) 補間用バンドを決定するため、 周波数補間処理部 2はまず、 フィル夕バ ンク 13から供給された信号が表す各帯域のうちもっとも周波数が高い方から q個
(qは 1以上 n以下の整数) の連続した帯域を連結して形成されるバンド (基準バ ンド) を特定する。 また、 基準バンド内のスペクトル成分の二乗平均値 Xを求める。 なお、 基準バンドの最高周波数以上の帯域は、 アナライザ 1に供給された P CM信 号が表すオーディオ信号のスぺクトルが実質的に含まれていない帯域であるものと 特定される。
(2) 一方、 周波数補間処理部 2は、 フィルタバンク 13から供給された信号 が表す各帯域のうちもつとも周波数が高い帯域を除いたうちの Q個の連続した帯域 を連結して形成され得るバンド (比較対象バンド) を 1個特定する。 そして、 比較 対象バンド内のスぺクトル成分の二乗平均値 Yを求める。
(3) 基準バンド内及び比較対象バンド内の各スぺクトル成分の二乗平均値を 用いて、 比較対象バンドのスペクトル成分の値の正規化を行う。 すなわち、 例えば、 基準バンド内のスぺクトルの二乗平均値に対する、 比較対象バンド内のスぺク卜ル 成分の二乗平均値の比の値、 即ち、 Y/Xを求め、 比較対象バンド内の各スぺクト ル成分の値にこの比の値を各々乗じて得られる積を求める。 得られた積の集合が、 規格化された後の比較対象バンド内のスぺクトル分布を表す。 ( 4 ) 基準バンド内のスペクトル分布と、 規格化された後の比較対象バンド内 のスぺクトル分布との相関係数を、 最小二乗法等の手法を用いて求める。
ただし、 周波数補間処理部 2は、 比較対象バンド内の各スペクトルの周波数を、 その元来の値に、 基準バンド及び比較対象バンドの各最低周波数の差を加算 した 周波数であるものとして扱い、 相関係数を求めるものとする。
( 5 ) 周波数補間処理部 2は、 とり得るすべての qの値、 及び、 とり得るすべ ての基準バンド及び比較対象バンドの組み合わせについて上述 (1 ) 〜 (4 ) の処 理を行うことにより相関係数を求めると、 これらの各組み合わせのうちでもっとも 高い相関係数が得られた組み合わせを特定する。 そして、 その組み合わせに含まれ る基準バンドを特定する情報を、 補間バンド加算部 3へと供給する。
補間バンド加算部 3は、 D S Pや C P U等より構成されている。 補間バンド加算 部 3は、 上述の (n + 1 ) 個の各帯域内のスペクトル分布を表す (n + 1 ) 個の信 号をフィルタバンク 1 3より供給されると、 各帯域内のスぺクトル分布の包絡線を なす関数を特定する。 そして、 特定した関数に基づき回帰計算を行う等することに より、 これら各帯域のうちもつとも周波数が高い帯域より更に高周波側の帯域であ る (帯域制限処理により抑圧はされたが) 補間用バンドに本来含まれているべきス ぺクトル成分の二乗平均値の推定値を求める。
なお、 補間用バンドの数は 1個でも複数でもよく、 各々の補間用バンドの帯域幅 は、 周波数補間処理部 2が供給する情報により特定される基準バンドの帯域幅に等 しいものとする。 補間用バンドが複数個ある場合、 各補間用バンドは互いに重複の ないように連続しており、 補間バンド加算部 3は、 各々の補間用バンドについて、 スぺクトル成分の二乗平均値の推定値を求めるものとする。
そして、 補間バンド加算部 3は、 周波数補間処理部 2より、 基準バンドを特定す る情報を供給されると、 特定された基準バンドをスケ一リングすることにより補間 用バンドのスぺクトル分布を求める。
すなわち、 補間バンド加算部 3は、 まず、 特定された基準バンド内のスペクトル 成分の二乗平均値を求める。 そして、 求めた基準バンド内のスペクトル成分の二乗 平均値に対する、 補間用バンド内のスぺクトル成分の二乗平均値の推定値の比の値 を求め、 基準バンド内の各スぺクトル成分の値にこの比の値を各々乗じて得られる 積を求める。 得られた積の集合が、 スケーリングされた後の基準バンド内のスぺク トル分布を表す。
そして、 補間バンド加算部 3は、 スケーリングされた基準バンド内のスペクトル 分布を、 補間用バンド内のスぺクトル分布を表すものとして扱うことにより補間用 バンド内のスペクトル分布を表す信号を生成し、 生成した信号を、 フィルタパンク 1 3から供給される信号と共にシンセサイザ 4へと供給する。
従って、 補間バンド加算部 3からシンセサイザ 4へは、 元の P C M信号のスぺク トルに補間バンドのスぺクトル成分が加算されて得られるスぺクトルの分布 (補間 後のスぺクトル分布) を表す信号が供給される。
ただし、 補間バンド加算部 3は、 スケーリングされた基準バンド内のスペクトル 分布を、 周波数が低い方から r個目の補間バンド内のスぺクトル分布として扱う場 合、 スケーリングされた基準バンド内の各スペクトルの周波数が、 その元来の値に、 基準バンドの最高周波数と、 補間バンドの帯域幅の (r一 1 ) 倍の値と、 を加算し た値であるものとして扱うものとする。
なお、 第 4図 (a ) 及び (b ) は、 補間後のスペクトル分布の例を示す図である。 第 4図 (a ) は、 元の P C M信号が表すオーディオ信号の 7個の帯域 (帯域 1〜 帯域 7 ) のうち帯域 7及び帯域 6の組み合わせがもつとも相関係数が高かった場合 である。 つまり、 スペクトルパターンが 1帯域の周期での繰り返し性をもっている 場合である。 この場合においては、 図示するように、 この場合の基準バンドである 帯域 7のスぺクトル分布と実質的に同一の分布を有するスぺクトルが、 4個の補間 用バンド A 1〜A 4に追加されている。
第 4図 (b ) は、 元の P C M信号が表すオーディオ信号の 7個の帯域のうち、 帯 域 6及び 7からなる帯域と、 帯域 4及び 5からなる帯域との組み合わせがもっとも 相関係数が高かった場合である。 つまり、 スペクトルパターンが 2帯域の周期での 繰り返し性が認められる場合である。 この場合においては、 図示するように、 この 場合の基準バンド (つまり、 帯域 6及び 7とからなる帯域) のスペクトル分布と実 質的に同一の分布を有するスぺクトルが、 2個の補間用バンド B 1〜B 2に追加さ れている。
シンセサイザ 4は、 第 5図に示すように、 フィルタバンク 41と、 (n+ 1) 個 のサンプラー 42— 0〜42— nと、 n個の遅延部 43— 0 ~ 43— (n— 1) と、 加算器 44—0〜44— (n- 1) とより構成されている。
フィルタバンク 41は、 DS Pや CPU等より構成されており、 上述の通り、 補 間バンド加算部 3が出力する、 補間後のスぺクトル分布を表す信号を供給される。 そして、 フィルタバンク 41は、 ポリフエ一ズフィルタ、 DCT、 L〇T、 ML Tあるいは EL T等の手法を用い、 自己に供給された信号が表すスぺクトル分布を 有する信号を (n+ 1) 点で等間隔にサンプリングした値を表す (n+ 1) 個の信 号を生成する (つまり、 周波数帯域のスペクトル信号を時間領域の信号にもどす) 。 そして、 生成したこれら (n+ 1) 個の信号のうち p番目 (pは 1から (n+ 1) までの整数) の信号を、 サンプラー 42— (p— 1) へと供給する。
なお、 フィルタバンク 41が生成するこの信号が表す値のサンプリング間隔は、 アナライザ 1のサンプラー 12— 1〜12— nのサンプリング間隔に実質的に等し いものとする。
また、 フィルタバンク 41が生成する p番目の信号は、 フィル夕バンク 41に供 給された信号が表すスペクトル分布を有する信号を (n+ 1) 点で等間隔にサンプ リングした値のうち、 サンプリングの時刻が p番目に早い値を表すものとする。
サンプラー 42_ 1〜42— nは、 各自に供給された信号を、 当該信号の (n + 1) 倍の周波数の信号へと変換し、 変換結果を表す P CM信号を出力するものであ る。
サンプラー 42— (p— 1) には、 上述の通り、 フィルタバンク 41が出力する p番目の信号が供給される。 そして、 サンプラー 42— (s— 1) は、 自己が出力 する信号を、 加算器 44一 (p— 1) へと供給する (sは 1から nまでの整数) 。 サンプラー 42— nは、 自己が出力する信号を遅延部 43 _ (n— 1) へと供給す る。
遅延部 43— 0〜43— (n- 1) は、 各自に供給された信号を、 この信号の周 期 1周期分遅らせて出力する。
遅延部 43— k (kは 0以上 (n— 1) 以下の任意の整数) が出力する信号は加 算器 44— kに供給される。 また、 遅延部 43— j (jは 0以上 (n— 2) 以下の 任意の整数) は、 加算器 44一 ( j + 1 ) が出力する信号を供給される。 遅延部 4 3— (n— 1) には、 上述の通りサンプラー 42 _nが出力する信号が供給される 加算器 44— 0〜44一 (n— 1) は、 各自に供給された 2個の信号の和を表す 信号を出力する。
加算器 44一 kには、 サンブラ一 42— kと、 遅延部 43— kとから信号が供給 される。 そして、 加算器 44一 m (mは 1以上 n— 1以下の整数) が出力する信号 は遅延部 43— (m— 1) に供給される。 加算器 44—0が出力する信号は、 この 周波数補間器の出力信号をなす。
加算器 44— 0が出力するこの出力信号は、 サンプラー 42— 0、 42 - 1、 · · ·、 42— (n- 1) 及び 42 _nが出力した信号を、 アナライザ 1に供 給された P CM信号の周期と実質的に同一の周期で順次出力したものに相当し、 そ のスぺクトル分布が補間後のスぺクトル分布に相当する P CM信号である。
補間後のスぺクトル分布のうち補間バンド加算部 3により加算された補間バンド の部分は、 最もスぺクトル分布の相関が高い基準バンド及び比較対象バンドの組み 合わせに含まれる基準バンドのスぺクトル分布に相当するスぺクトル分布を有する。 従って、 補間バンドの部分は、 この基準バンド又は比較対象バンドの高調波成分と みなし得るので、 加算器 44一 0が出力する出力信号は、 帯域が制限される前のォ 一ディォ信号に近いオーディオ信号を P CM変調して得られる P CM信号となる。 従って、 この出力信号を用いてオーディオ信号を復元することにより、 オーディオ 信号が高音質で復元される。
なお、 この周波数補間器の構成は上述のものに限られない。
例えば、 遅延部 1 1一 0〜1 1— (n - 1) 及び 43 - 0〜43— (n— 1) や、 サンプラー 1 2— 0〜 1 2— n及び 4 2— 0〜4 2 _ nや、 加算器 4 4—0〜4 4 一 (n— 1 ) の機能を、 D S Pや C P Uが行ってもよい。
また、 周波数補間処理部 2は、 相関係数に代えて、 基準バンドと比較対象バンド との相関を表す任意の数値を、 基準バンド及び比較対象バンドのスぺクトル分布に 基づいて求め、 補間用バンドの決定に用いてよい。
また、 周波数補間処理部 2は、 基準バンド及び比較対象バンドの組み合わせを特 定した後、 特定された組み合わせに含まれる比較対象バンドを特定する情報を補間 バンド加算部 3に供給してもよい。 この場合、 補間バンド加算部 3は、 特定された 比較対象バンドをスケーリングすることにより補間用バンドのスぺクトル分布を求 めればよい。
また、 周波数補間処理部 2は、 上述の (3 ) の処理で、 比較対象バンドの方を規 格化してもよい。
ただし、 補間用バンドのスぺクトル分布を基準バンドのスぺクトル分布に基づい て求めるようにすれば、 基準バンドの最高周波数は元の P C M信号のスぺクトルの 最高周波数を含んでいるので、 基準バンド自体が、 比較対象バンドの高調波成分と みなし得る可能性が高い。 従って、 補間用バンドのスペクトル分布を基準バンドの スぺクトル分布に基づいて求めるようにすれば、 加算器 4 4一 0が出力する出力信 号は、 補間用バンドのスぺクトル分布を比較対象バンドのスぺクトル分布に基づい て求めた場合に比べ、 帯域が制限される前のオーディオ信号により近いオーディオ 信号を表すものとなる。
また、 この周波数補間器が補間を行う対象の信号は P C M信号である必要はなく、 オーディォ信号を変調して得られる変調波である必要もない。
以上、 この発明の実施の形態を説明したが、 この発明にかかる周波数補間装置は、 専用のシステムによらず、 通常のコンピュータシステムを用いて実現可能である。 例えば、 パーソナルコンピュータやマイクロコンピュータに上述のアナライザ 1、 周波数補間処理部 2、 補間バンド加算部 3及びシンセサイザ 4の動作を実行するた めのプログラムを格納した媒体 (C D— R〇M、 MO、 フロッピーディスク等) か ら該プログラムをィンストールすることにより、 上述の処理を実行する周波数補間 器を構成することができる。
また、 例えば、 通信回線の掲示板 (BBS) に該プログラムを掲示し、 これを通 信回線を介して配信してもよく、 また、 該プログラムを表す信号により搬送波を変 調し、 得られた変調波を伝送し、 この変調波を受信した装置が変調波を復調して該 プログラムを復元するようにしてもよい。
そして、 このプログラムを起動し、 OSの制御下に、 他のアプリケーションプロ グラムと同様に実行することにより、 上述の処理を実行することができる。
なお、 OSが処理の一部を分担する場合、 あるいは、 OSが本願発 の 1つの構 成要素の一部を構成するような場合には、 記録媒体には、 その部分をのぞいたプロ グラムを格納してもよい。 この場合も、 この発明では、 その記録媒体には、 コンビ ユー夕が実行する各機能又はステップを実行するためのプログラムが格納されてい るものとする。
以上説明した、 本発明の第 1の実施形態に係る周波数補間装置 (又は方法) によ り、 上述した本発明の第 1の目的が効果的に達成される。
(第 2の実施形態)
第 6図は、 この発明の第 2の目的を達成するための一実施態様即ち本発明の第 2 の実施形態に係る周波数補間装置の構成を示す図である。
図示するように、 この周波数補間装置は、 高域検出部 1と、 音声圧縮部 2と、 音 声伸張部 3と、 周波数補間部 4とより構成されている。
高域検出部 1は、 第 6図に示すように、 HPF (ハイパスフィル夕) 1 1と、 検 波部 12とより構成されている。
HP F 1 1は、 デ一夕圧縮を施す対象の P CM (P u 1 s e Cod e Mud u 1 a t i on) 信号が自己に供給されると、 この P CM信号のうち所定の通過周 波数以下の成分を遮断し、 他の成分 (高域成分) を検波部 12へと供給する。 なお、 HPF 1 1に供給される、 データ圧縮を施す対象の P CM信号は、 音声圧縮部 2に も並行して供給される。 なお、 データ圧縮を施す対象の PCM信号は、 音声等を電圧あるいは電流の変化 として表すオーディオ信号を表すものである。 そして、 上述の通過周波数は、 音声 圧縮部 2が後述のように P CM信号をデータ圧縮する結果得られる圧縮データの占 有帯域の上限より高い周波数であればよい。 例えば、 圧縮データの占有帯域の上限 が 14キロへルツ程度である場合、 上述の通過周波数は、 例えば約 16キロへルツ であればよい。
検波部 12は、 HPF 11より PCM信号の高域成分が供給されると、 この高域 成分を検波して検波信号を生成し、 この検波信号を、 例えばデ一夕圧縮を施す対象 の P CM信号が音声圧縮部 2に供給されるタイミングに同期した夕イミングで、 音 声圧縮部 2へと供給する。
音声圧縮部 2は、 例えば、 DSP (D i g i t a l S i gn a l P r o c e s s o r) や、 CPU (Ce n t r a l P r o c e s s i ng Un i t ) や、 マルチプレクサ等を備え、 また、 記録媒体 (例えば、 CD— R等) へのデータの記 録及び記録媒体からのデータの読み出しを行う記録媒体ドライバを備えている。
音声圧縮部 2は、 データ圧縮を施す対象である上述の P CM信号を供給されると、 この P CM信号が表すデータに、 MP 3 AAC (Adv anc e d Aud i o
Cod i n ) その他任意の手法によるデータ圧縮を施す。 なお、 データ圧縮に より得られるデータ (すなわち、 上述の圧縮デ一夕) の占有帯域の上限の周波数は 所定の値以下となる。
また、 音声圧縮部 2は、 この P CM信号に高域成分が含まれているか否かを示す 外部デ一タを、 検波部 12から検波信号が供給されたか否かに応じて生成する。
具体的には、 音声圧縮部 2は、 例えば、 検波部 12から検波信号が供給されたと き、 この検波信号に同期して自己に供給された P CM信号に高域成分が存在するこ とを示す外部データを生成する。 一方、 データ圧縮を施す対象の P CM信号が供給 されたとき、 この P CM信号に同期した検波信号が供給されなかったときは、 この P C M信号に高域成分が存在しないことを示す外部デー夕を生成する。
従って、 例えば、 圧縮データの占有帯域の上限の周波数が約 14キロへルツであ つて、 一方、 HPF 1 1 (及び音声圧縮部 2) に供給された P CM信号のスぺクト ル分布が第 2図に示すようなものである場合 (すなわち、 もとより 14キロへルツ 以上のスペクトル成分を実質的に含んでいない場合) 、 検波部 12は、 この PCM 信号に高域成分が存在しないことを示す外部データを生成する。
そして、 音声圧縮部 2は、 P CM信号のデータ圧縮により得られた圧縮データと、 この P CM信号に高域成分が存在するか否かを示す上述の外部データとを、 互いに 対応付けて、 記録媒体ドライバにセッ卜された外部の記録媒体に記録する。
なお、 音声圧縮部 2は、 記録媒体ドライバに代えて、 あるいは記録媒体ドライバ と共に、 外部の通信回線に接続されたモデムやターミナルアダプタ等より構成され る通信制御装置を備えていてもよい。 この場合、 音声圧縮部 2は、 自己に供給され た P C M信号をデ一タ圧縮して得られた圧縮デー夕にこの P C M信号の高域成分の 有無を示す上述の外部データを付し、 通信回線を介して外部へと伝送してもよい。 また、 音声圧縮部 2が、 P CM信号に MP 3形式のデータ圧縮を施すものである 場合、 外部データはアンシエラリコードに含まれるものとすればよい。
音声伸長部 3は、 例えば、 DSPや CPU等を備え、 また、 記録媒体ドライバを 備えている。 音声伸長部 3は、 P CM信号を MP 3や A AC等の手法によりデータ 圧縮したものを表す上述の圧縮データと、 この圧縮デ一夕に対応付けられた上述の 外部データとを、 記録媒体ドライバにセットされた外部の記録媒体より読み出す。 そして、 読み出した圧縮データを MP 3や AAC等の手法により伸長し、 伸長によ り得られたデータを表す P CM信号を生成して、 生成した P CM信号と、 記録媒体 から読み出した外部データとを、 互いに対応付けて周波数補間部 4へと (より具体 的には、 後述の補間要否判別部 41へと) 供給する。
なお、 音声伸長部 3は、 記録媒体ドライバに代えて、 あるいは記録媒体ドライバ と共に、 通信制御装置を備えていてもよい。 この場合、 音声伸長部 3は、 外部デー 夕が付された圧縮データが通信回線を介して外部より自己へと供給されたとき、 こ の外部データ及び圧縮データを受信して受信した圧縮データを伸長し、 伸長により 得られたデ一夕を表す P CM信号と、 受信した外部データとを、 周波数補間部 4へ と供給するようにしてもよい。
周波数補間部 4は、 第 7図に示すように、 補間要否判別部 4 1と、 アナライザ 4 2と、 補間処理部 4 3と、 補間バンド加算部 4 4と、 シンセサイザ 4 5とより構成 されている。
補間要否判別部 4 1は、 例えば、 デマルチプレクサ等より構成されている。 補間 要否判別部 4 1は、 互いに対応付けられた P C M信号及び外部データを音声伸長部 3より供給されると、 この外部データが、 高域成分の存在又は不存在のいずれを示 しているかを判別する。 そして、 高域成分が存在していることを示すと判別すると、 音声伸長部 3より供給されたこの P C M信号を、 アナライザ 4 2へと供給する。
一方、 補間要否判別部 4 1は、 音声伸長部 3より取得した外部データが、 高域成 分の不存在を示すと判別した場合は、 音声伸長部 3より供給されたこの P C M信号 を、 周波数補間部 4の出力信号として出力する。
第 6図の周波数補間部 4の構成におけるアナライザは、 第 2図に示すアナライザ の構成と実質的に同一の構成を有しており、 第 2図のアナライザと実質的に同一の 処理を行う。 この結果、 第 8図の周波数補間部 4のアナライザは、 自己に供給され た圧縮デ一夕のスペクトル分布を (n + 1 ) 等分して得られる互いに帯域幅が等し い (n + 1 ) 個の各帯域内のスペクトル分布を表す (n + 1 ) 個の信号を生成し、 周波数補間部 4の補間処理部へと供給する。
第 6図の周波数補間部 4の構成におけるシンセサイザは、 第 5図に示すシンセサ ィザの構成と実質的に同一の構成を有している。 第 8図の周波数補間部 4のシンセ サイザは、 第 5図のシンセサイザと実質的に同一の動作を行うことにより、 補間後 のスぺクトル分布に相当するスぺクトル分布を有する P C M信号を、 周波数補間部 4のアナライザに供給された P C M信号の周期と実質的に同一の周期で順次出力す る。
補間後のスぺクトルのうち、 周波数補間部 4の補間バンド加算部により加算され た被補間バンド内の成分は、 最もスぺクトル分布の相関が高い基準バンド及び比較 対象バンドの組み合わせに含まれる基準バンド内のスぺクトル分布に相当するスぺ クトル分布を有するものである。
(第 3の実施形態)
第 8図は、 この発明の第 3の実施形態に係る周波数補間装置の構成を示す図であ る。 ' 図示するように、 この周波数補間装置は、 高域検出部 1に代えて包絡線検出部 5 を備える点と、 周波数補間部 4が補間要否判別部 41を備えていない点とを除き、 第 6図に示す第 2の実施形態の周波数補間装置と実質的に同一の構成を有している。 第 8図の構成における周波数補間部 4は、 第 6図の構成における周波数補間部 4と 同様、 アナライザ、 補間処理部、 補間バンド加算部及びシンセサイザを備えている。 ただし、 この音声信号処理装置の各部の動作は、 後述する点で、 第 6図の音声信号 処理装置の各部の動作と異なっている。
包絡線検出部 5は、 例えば、 周波数補間部 4のアナライザ 41と実質的に同一の 構成を有するアナライザと、 並列一直列変換器と、 LPF (ローパスフィルタ) と から構成されている。
包絡線検出部 5のアナライザは、 デ一夕圧縮を施す対象の P CM (Pu l s e Cod e Mu d u 1 a t i o n) 信号が自己に供給されると、 この PCM信号の スペクトル分布を表す一定の個数の信号を生成し、 生成したこれらの信号を、 包絡 線検出部 5の並列一直列変換器へと供給する。 なお、 データ圧縮を施す対象の PC M信号は、 音声圧縮部 2にも並行して供給される。
包絡線検出部 5の並列一直列変換器は、 包絡線検出部 5のアナライザより、 デ一 タ圧縮を施す対象の P CM信号のスぺクトル分布を表す各信号を供給されると、 こ れらの信号を、 周波数が低い帯域を表すもの順 (又は、 周波数が高い帯域を表すも の順) に、 順次、 包絡線検出部 5の LP Fへと供給する。
包絡線検出部 5の LP Fは、 包絡線検出部 5の並列一直列変換器より、 データ圧 縮を施す対象の P CM信号のスぺクトル分布を表す信号を順次供給されると、 自己 に供給されるこれら信号のうち周波数が一定の遮断周波数以上の成分を遮断し、 他 の成分 (低域成分) を音声圧縮部 2に供給する。 包絡線検出部 5の LP Fが音声圧 縮部 2に供給する低域成分は、 データ圧縮を施す対象の P C M信号のスぺクトル分 布の包絡線を表す信号をなす。
第 8図の構成における音声圧縮部 2は、 検波部 1 2から検波信号が供給されたか 否かに応じて外部データを生成する代わりに、 包絡線検出部 5から供給される低域 成分を表す信号 (データ圧縮を施す対象の P C M信号のスぺクトル分布の包絡線を 表す信号) を外部データとして扱う。
すなわち、 音声圧縮部 2は、 圧縮データと、 この圧縮デ一夕の生成に用いた元の P C M信号のスぺクトル分布の包絡線を表す外部データとを互いに対応付け、 記録 媒体ドライバにセットされた外部の記録媒体に記録する。 あるいは、 圧縮データに この外部データを付し、 通信回線を介して外部へと伝送する。
第 8図の音声伸長部 3は、 P C M信号を M P 3や AA C等の手法によりデータ圧 縮したものを表す上述の圧縮データと、 この圧縮データに対応付けられた上述の外 部データとを外部の記録媒体より取得し、 あるいは、 通信回線を介して外部より自 己へと供給された外部データ付きの圧縮デ一夕を取得する。 そして、 取得した圧縮 デ一タを、 第 6図の音声伸長部 3と同様に M P 3や AA C等の手法により伸長し、 伸長により得られたデータを表す P C M信号を周波数補間部 4のアナライザへと供. 給する。 また、 取得した外部データを、 周波数補間部 4の補間バンド加算部へと供 給する。
第 8図の周波数補間部 4の構成におけるアナライザは、 第 2図に示すアナライザ の構成と実質的に同一の構成を有しており、 第 2図のアナライザと実質的に同一の 処理を行う。 この結果、 第 8図の周波数補間部 4のアナライザは、 自己に供給され た圧縮データのスペクトル分布を (n + 1 ) 等分して得られる互いに帯域幅が等し い (n + 1 ) 個の各帯域内のスペクトル分布を表す (n + 1 ) 個の信号を生成し、 周波数補間部 4の補間処理部へと供給する。
第 8図の周波数補間部 4の構成における補間処理部は、 第 7図の構成における補 間処理部 4 3と実質的に同一の構成を有しており、 第 7図の補間処理部 4 3と実質 的に同一の動作を行うことにより基準バンドを決定し、 決定した基準バンドを特定 する情報を、 周波数補間部 4の補間パンド加算部へと供給する。
第 8図の周波数補間部 4の構成における補間バンド加算部は、 第 7図の周波数補 間部 4の構成における補間バンド加算部 4 4と同様、 D S Pや C P U等より構成さ れている。 第 8図の周波数補間部 4の補間バンド加算部は、 上述の (n + 1 ) 個の 各帯域内のスペクトル分布を表す (n + 1 ) 個の信号を周波数補間部 4のアナライ ザより供給され、 外部デ一夕を音声伸長部 3より供給されると、 第 7図の補間バン ド加算部 4 4と実質的に同一の処理を行うことにより、 補間後のスぺクトル分布を 表す信号を、 周波数補間部 4のシンセサイザへと供給する。
ただし、 第 8図の周波数補間部 4の補間バンド加算部は、 周波数補間部 4のアナ ライザより供給される信号に基づいて各帯域内のスぺクトル分布の包絡線をなす関 数を特定して回帰計算を行う代わりに、 自己の供給された外部データが示す包絡線 をなす関数に基づき、 被補間バンドに本来含まれているべきスぺクトル成分の二乗 平均値の推定値を求める。
第 8図の周波数補間部 4の構成におけるシンセサイザは、 第 5図に示すシンセサ ィザの構成と実質的に同一の構成を有している。 第 8図の周波数補間部 4のシンセ サイザは、 第 5図のシンセサイザと実質的に同一の動作を行うことにより、 補間後 のスぺクトル分布に相当するスぺクトル分布を有する P C M信号を、 周波数補間部 4のアナライザに供給された P C M信号の周期と実質的に同一の周期で順次出力す る。
補間後のスぺクトルのうち、 周波数補間部 4の補間バンド加算部により加算され た被補間バンド内の成分は、 最もスぺクトル分布の相関が高い基準バンド及び比較 対象バンドの組み合わせに含まれる基準バンド内のスぺクトル分布に相当するスぺ クトル分布を有するものである。
なお、 この音声信号処理装置の構成も上述のものに限られない。
例えば、 包絡線検出部 5のアナライザ、 並列一直列変換器及び L P Fのうち少な くとも一部の機能を D S Pや C P Uが行ってもよいし、 包絡線検出部 5の全体の機 能を、 D S Pや C P Uが行ってもよい。 包絡線検出部 5のアナライザは、 公知の構 成を有する F F T (高速フーリエ変換器) より構成されていてもよい。
また、 包絡線検出部 5は、 データ圧縮を施す対象の P C M信号のスペクトル分布 の包絡線を表す信号を生成する代わりに、 データ圧縮を施す対象の P C M信号の占 有帯域を示す信号を生成するようにしてもよい。 この場合、 音声圧縮部 2は、 圧縮 データの生成に用いた元の P C M信号のスぺクトル分布の占有帯域を表すデータを 外部データとして扱ってもよい。 なお、 占有帯域を示すデータは、 例えば、 P C M 信号のスぺクトル成分の最低周波数と当該 P C M信号の占有帯域幅とを示すデータ から構成されていればよく、 また、 P C M信号のスペクトル成分の最低周波数が既 定値 (例えば、 0ヘルツ) である場合は、 当該 P C M信号の占有帯域幅を示すデー 夕を含んでいれば十分である。
外部デ一夕が、 圧縮データの生成に用いた元の P C M信号のスぺクトル分布の占 有帯域を表すものである場合、 周波数補間部 4の補間バンド加算部は、 第 1の実施 の形態における補間バンド加算部 4 4と同様、 周波数補間部 4のアナライザより供 給される信号に基づいて各帯域内のスぺクトル分布の包絡線をなす関数を特定して 回帰計算を行うことにより、 被補間バンドに本来含まれているべきスぺクトル成分 の二乗平均値の推定値を求めるものとする。 ただし、 被補間バンドのうち、 外部デ 一夕が示す占有帯域を超える帯域内のスぺクトル成分は実質的に存在しないものと して、 被補間バンドに本来含まれているべきスぺクトル成分の二乗平均値の推定値 を求めるものとする。
以上説明した、 本発明の第 2および第 3の実施形態に係る周波数補間装置により、 上述した本発明の第 2の目的が効果的に達成される。
産業上の利用可能性
以上の説明のように、 この発明によれば、 原信号の帯域を制限した信号を用いて 得られる変調波から原信号に近い信号を復元できるようにするための特にオーディ ォ信号を高音質で復元するための周波数補間装置及び周波数補間方法が実現される。 さらに、 この発明によれば、 原信号の一部帯域内のスペクトル成分を抑圧したも のを表す信号と、 当該帯域のスぺクトル成分を本来含まない原信号を表わす信号の いずれか一方の信号又はこれら信号が混在するような信号からも、 原信号に近い信 号を適切に復元できるようにするための周波数補間装置及び周波数補間方法が実現 される。

Claims

請求の範囲
1 . 原信号の特定周波数帯域における周波数成分が抑圧された入力信号から、 該抑圧された周波数成分を近似的に復元して原信号に近い信号を再生するための周 波数補間装置であって、
周波数成分が抑圧されないで残存する周波数帯域における短時間スぺクトルを求 め、 所定の周波数間隔でのスぺクトルパターンの繰り返し性に着目して該抑圧され た周波数帯域における短時間スぺクトルを推定し、 及びこの推定に基づいて該抑圧 された周波数帯域の周波数成分を含む信号を合成して該入力信号に付加するように したことを特徴とする周波数補間装置。
2 . 請求項 1に記載の周波数補間装置において、
該スペクトルパターンの繰り返し性は、 該抑圧された周波数帯域の近傍で、 かつ 周波成分が残存する帯域における一定の帯域幅を有する第 1の周波数帯域と、 これ に隣接する、 同一の帯域幅を有する第 2の周波数帯域とにおけるスぺクトルパ夕一 ンの相互の相関度を計算することにより判定され、 及び繰り返されるスぺク卜ルパ ターンを単位として結合することにより抑圧された周波数成分を合成するようにし た周波数補間装置。
3 . 請求項 2に記載の周波数補間装置において、
該第 1の周波数帯域のスぺクトルパターンが第 2の周波数帯域のスぺクトルパタ ーンと強い相関関係を有する場合に、 このスペクトルパターンを、 抑圧された帯域 まで延長させるようにして該抑圧された帯域の周波数成分を合成するようにした周
4 . 請求項 3に記載の周波数補間装置において、
該残存する周波数帯域のスぺクトル包絡から推定される、 抑圧された周波数帯域 のスぺクトル包絡に基づいて、 該合成されるべき周波数成分の強度を決定するよう にした周波数補間装置。
5 . 請求項 1に記載の周波数補間装置において、 該特定の周波数帯域が、 高域周波数帯域である周波数補間装置。
6 . 請求項 5に記載の周波数補間装置において、
該第 1もしくは第 2の周波数帯域の上限周波数が、 該抑圧された高域周波数帯域 の下限周波数である周波数補間装置。
7 . 特定の周波数帯域の周波数成分が抑圧された入力信号を処理して、 抑圧さ れた周波数帯域成分が近似的に復元された信号を再生する周波数補間装置であって、 該入力信号の短時間スぺクトルを生成するスぺクトル生成手段と、
互いに隣接する同じ帯域幅を有する周波数帯域における短時間スぺクトルパター ンが互いに相関関係を有するような相関スぺクトルパターンを抽出するスぺクトル パターン抽出手段と、
該周波数成分が抑圧されないで残存する帯域におけるスぺクトル包絡情報を抽出 するスぺクトル包絡抽出手段と、
該スぺクトルパターン抽出手段およびスぺクトル包絡抽出手段の双方に応動して、 該抑圧された周波数帯域の周波数成分を有する信号を合成する手段と、
該合成され抑圧された周波数成分を有する信号を該入力信号に付加する手段とを 含む周波数補間装置。
8 . 請求項 7に記載の周波数補間装置において、
抑圧された帯域における周波数成分を有する該合成信号が、 該抽出された相関ス ぺクトルパターンを有するとともに、 該スぺクトル包絡情報により定まる強度を有 している周波数補間装置。
9 . 請求項 1ないし 8のいずれかに記載の周波数補間装置において、
該入力信号が、 アナログオーディオ信号をサンプルし、 かつ量子化することによ り得られた P C M信号から成るものである周波数補間装置。
1 0 . 原信号の特定周波数帯域における周波数成分が抑圧された入力信号から、 該抑圧された周波数成分を近似的に復元して原信号に近い信号を再生するための周 波数補間方法であって、
周波数成分が抑圧されないで残存する周波数帯域における短時間スぺクトルを求 め、 所定の周波数間隔でのスぺクトルパターンの繰り返し性に着目して該抑圧され た周波数帯域における短時間スぺクトルを推定し、 及びこの推定に基づいて該抑圧. された帯域の周波数成分を含む信号を合成して該入力信号に付加するようにしたこ とを特徴とする周波数補間方法。
1 1 . 請求項 1 0に記載の周波数補間方法において、
該短時間スぺクトルパターンの繰り返し性は、 該抑圧された周波数帯域の近傍で、 かつ周波成分が残存する周波数帯域における一定の帯域幅を有する第 1の周波数帯 域と、 これに隣接する同一の帯域幅の第 2の周波数帯域とにおけるスぺクトルパタ ーンの相互相関度に基づいて判定されるものである周波数補間方法。
1 2 . 特定の周波数帯域の周波数成分が抑圧された入力信号を処理して、 抑圧 された周波数帯域成分が近似的に復元された信号を生成するための周波数補間方法 であって、
該入力信号の短時間スぺクトルを生成するステップと、
互いに隣接する同じ帯域幅を有する周波数帯域における短時間スぺク卜ルパ夕一 ンが互いに相関関係を有するような相関スぺクトルパターンを抽出するステップと、 該抑圧されない周波数帯域におけるスぺクトル包絡情報を抽出するステップと、 該スぺクトルパターン抽出ステップおよびスぺクトル包絡抽出ステップの双方に 応動して、 該抑圧された周波数帯域の周波数成分を有する信号を合成するステップ と、
該合成され抑圧された周波数成分を有する信号を該入力信号に付加するステップ とを含む周波数補間方法。
1 3 . 原信号の特定周波数帯域における周波数成分が抑圧された信号から、 該 抑圧された周波数成分を近似的に復元して、 原信号に近い信号を再生するための周 波数補間システムであって、
原信号の該特定周波数帯域に所定のレベル以上の周波数成分が含まれているかど うかを判別して、 その有無を示す識別データを生成する手段と、
該原信号の該特定周波数帯域の周波数成分を抑圧し、 及び所定の信号変換処理を 施す信号変換手段と、
該変換された信号に該識別データを重畳して送信する手段と、
該送信された信号を受信して、 該受信された信号に含まれる該識別データを判別 して、 該特定帯域の周波数成分の有無を判定する手段と、
該判定手段により、 該特定帯域に周波数成分があつたと判定された場合のみに、 次段の信号処理手段に受信信号を入力させるよう動作する制御手段と、
該制御手段からの該受信信号に応動して、 該所定の信号変換の逆変換処理および 抑圧された帯域の周波数成分を近似的に合成し付加する補間処理を実行するための 信号処理手段とを含む周波数補間システム。
1 4. 請求項 1 3に記載の周波数補間システムにおいて、
該所定の信号変換処理がデー夕圧縮処理であり、 該信号処理手段における該逆変 換処理がデ一タ伸張処理である補間システム。
1 5 . 請求項 1 3に記載の補間システムにおいて、
該信号処理手段における補間処理が、 ( i ) 短時間スぺク卜ル分析処理、 ( i i ) 隣接する周波数帯域間で互いに相関を有する短時間スぺクトルパターンを抽出 する処理、 および (i i i ) スペクトル包絡情報を抽出する処理を含むものである 周波数補間システム。
1 6 . 原信号の特定周波数帯域における周波数成分が抑圧された信号から、 該 抑圧された周波数成分を近似的に復元して、 原信号に近い信号を再生するための周 波数補間装置であって、
該特定周波数帯域の信号成分が抑圧された原信号に所定の信号変換を施して得ら れる信号と、 これに重畳される、 該原信号の特定周波数帯域に本来的に所定のレべ ル以上の周波数成分が含まれていたかどうかを表わす識別データとから成る信号を 受信する手段と、
該受信された信号に含まれる該識別データを判別して、 該特定帯域の周波数成分 の有無を判定する手段と、
該判定手段により、 該特定帯域に周波数成分があつたと判定された場合のみに、 次段の信号処理手段に受信信号を入力させるよう動作する制御手段と、 該制御手段からの該受信信号に応動して、 該所定の信号手段の逆変換処理および 抑圧された帯域の周波数成分を近似的に合成し付加する補間処理を実行するための 信号処理手段とを含む周波数補間装置。
1 7 . 請求項 1 6に記載の周波数補間装置において、
該所定の信号変換処理がデータ圧縮処理であり、 該信号処理手段における該逆変 換処理がデ一夕伸張処理である補間装置。
1 8 . 請求項 1 6に記載の補間装置において、
該信号処理手段における補間処理が、 ( i ) 短時間スぺクトル分析処理、 ( i i ) 隣接する周波数帯域間で互いに相関を有する短時間スぺクトルパターンを抽出 する処理、 および ( i i i ) スペクトル包絡情報を抽出する処理を含むものである
1 9 . 原信号の特定周波数帯域における周波数成分が抑圧された信号から、 該 抑圧された周波数成分を近似的に復元して、 原信号に近い信号を再生するための周 波数補間方法であって、
原信号の該特定周波数帯域に所定のレベル以上の周波数成分が含まれているかど うかを判別して、 その有無を示す識別データを生成するステップと、
該原信号の該特定周波数帯域の周波数成分を抑圧し、 及び所定の信号変換処理を 施すステップと、
該変換された信号に該識別データを重畳して送信するステップと、
該送信された信号を受信して、 該受信された信号に含まれる該識別データを判別 して、 該特定帯域の周波数成分の有無を判定するステップと、
該判定ステップにより、 該特定周波数帯域に周波数成分があつたと判定された場 合のみに、 後の信号処理ステップに受信信号を引き渡すステップと、
該引き渡ステップからの該受信信号に応動して、 該所定の信号変換の逆変換処理 および抑圧された帯域の周波数成分を近似的に合成し付加する補間処理を実行する ための信号処理ステップとを含む周波数補間方法。
2 0 . 原信号の特定周波数帯域における周波数成分が抑圧された信号から、 該 抑圧された周波数成分を近似的に復元して、 原信号に近い信号を再生するための周 波数補間方法であって、
原信号の該特定周波数帯域に所定の特定の周波数帯域の信号成分が抑圧された原 信号に所定の信号変換を施して得られる信号と、 これに重畳される、 該原信号の特 定の周波数帯域に本来的に所定のレベル以上の周波数成分が含まれていたかどうか を表わす識別データとから成る信号を受信するステップと、
該受信された信号に含まれる該識別データを判別して、 該特定帯域の周波数成分 の有無を判定するステップと、
該判定ステップにより、 該特定周波数帯域に周波数成分があつたと判定された場 合のみに、 次段の信号処理手段に受信信号を引き渡すステップと、
該引き渡ステップからの該受信信号に応動して、 該所定の信号変換の逆変換処理 および抑圧された帯域の周波数成分を近似的に合成し付加する補間処理を実行する ための信号処理ステツプとを含む方法。
PCT/JP2001/004955 2000-06-14 2001-06-12 Dispositif et procédé d'interpolation de fréquence WO2001097212A1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
US10/296,167 US6836739B2 (en) 2000-06-14 2001-06-12 Frequency interpolating device and frequency interpolating method
DE60110796T DE60110796T2 (de) 2000-06-14 2001-06-12 Frequenzinterpolationseinrichtung und frequenzinterpolationsverfahren
DE1298643T DE1298643T1 (de) 2000-06-14 2001-06-12 Frequenzinterpolationseinrichtung und frequenzinterpolationsverfahren
AU2001262748A AU2001262748A1 (en) 2000-06-14 2001-06-12 Frequency interpolating device and frequency interpolating method
EP01936970A EP1298643B1 (en) 2000-06-14 2001-06-12 Frequency interpolating device and frequency interpolating method

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2000-178569 2000-06-14
JP2000178569A JP3538122B2 (ja) 2000-06-14 2000-06-14 周波数補間装置、周波数補間方法及び記録媒体
JP2000259745A JP3576942B2 (ja) 2000-08-29 2000-08-29 周波数補間システム、周波数補間装置、周波数補間方法及び記録媒体
JP2000-259745 2000-08-29

Publications (1)

Publication Number Publication Date
WO2001097212A1 true WO2001097212A1 (fr) 2001-12-20

Family

ID=26593931

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2001/004955 WO2001097212A1 (fr) 2000-06-14 2001-06-12 Dispositif et procédé d'interpolation de fréquence

Country Status (5)

Country Link
US (1) US6836739B2 (ja)
EP (2) EP1503371B1 (ja)
AU (1) AU2001262748A1 (ja)
DE (4) DE04017341T1 (ja)
WO (1) WO2001097212A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003079721A1 (en) * 2002-03-13 2003-09-25 Harman International Industries, Incorporated Audio feedback processing system
EP1351218A3 (en) * 2002-03-06 2004-04-07 Kabushiki Kaisha Toshiba Audio signal reproducing method and an apparatus for reproducing the same
US7318034B2 (en) 2002-06-07 2008-01-08 Kabushiki Kaisha Kenwood Speech signal interpolation device, speech signal interpolation method, and program
US7428489B2 (en) 2002-05-07 2008-09-23 Sony Corporation Encoding method and apparatus, and decoding method and apparatus
US7613529B1 (en) 2000-09-09 2009-11-03 Harman International Industries, Limited System for eliminating acoustic feedback
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US8255229B2 (en) 2007-06-29 2012-08-28 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8554569B2 (en) 2001-12-14 2013-10-08 Microsoft Corporation Quality improvement techniques in an audio encoder
US8645127B2 (en) 2004-01-23 2014-02-04 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100550131C (zh) 2003-05-20 2009-10-14 松下电器产业株式会社 用于扩展音频信号的频带的方法及其装置
US7339988B1 (en) * 2003-07-03 2008-03-04 Scintera Networks, Inc. Channel monitoring and identification and performance monitoring in a flexible high speed signal processor engine
JP4679049B2 (ja) 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
EP2221808B1 (en) * 2003-10-23 2012-07-11 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
DE602006009927D1 (de) 2006-08-22 2009-12-03 Harman Becker Automotive Sys Verfahren und System zur Bereitstellung eines Tonsignals mit erweiterter Bandbreite
JP4972742B2 (ja) * 2006-10-17 2012-07-11 国立大学法人九州工業大学 高域信号補間方法及び高域信号補間装置
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US20090259405A1 (en) * 2008-04-15 2009-10-15 Battelle Energy Alliance, Llc Methods, systems, and computer-readable media for generating seismic event time histories
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
EP2413115A1 (en) * 2010-07-30 2012-02-01 Technische Universiteit Eindhoven Generating a control signal based on acoustic data
JP5665987B2 (ja) 2010-08-12 2015-02-04 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Qmfベースのオーディオコーデックの出力信号のリサンプリング
CN103323667B (zh) * 2013-05-27 2016-08-17 重庆邮电大学 贝塞尔函数与虚拟阵列相结合的sfm信号的参数估计方法
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
CN103412188B (zh) * 2013-08-27 2016-03-23 重庆邮电大学 基于贝塞尔函数与Toeplitz算法的SFM信号参数估计方法
CN106443178B (zh) * 2016-09-08 2019-02-01 东南大学 一种基于IQuinn-Rife综合的正弦信号频率估计方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06110455A (ja) * 1992-09-25 1994-04-22 Mitsubishi Electric Corp オーディオ信号の符号化/復号化方法およびこの方法を用いたオーディオ再生装置
JPH06301383A (ja) * 1993-04-16 1994-10-28 Casio Comput Co Ltd デジタル音響波形の作成装置、デジタル音響波形の作成方法、楽音波形生成装置におけるデジタル音響波形均一化方法、及び楽音波形生成装置
JPH09244694A (ja) * 1996-03-05 1997-09-19 Nippon Telegr & Teleph Corp <Ntt> 声質変換方法
JPH09258787A (ja) * 1996-03-21 1997-10-03 Kokusai Electric Co Ltd 狭帯域音声信号の周波数帯域拡張回路
JPH1097287A (ja) * 1996-07-30 1998-04-14 Atr Ningen Joho Tsushin Kenkyusho:Kk 周期信号変換方法、音変換方法および信号分析方法
JP2000330599A (ja) * 1999-05-21 2000-11-30 Sony Corp 信号処理方法及び装置、並びに情報提供媒体

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4343366C2 (de) * 1993-12-18 1996-02-29 Grundig Emv Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
US6049535A (en) * 1996-06-27 2000-04-11 Interdigital Technology Corporation Code division multiple access (CDMA) communication system
US6697350B2 (en) * 1995-06-30 2004-02-24 Interdigital Technology Corporation Adaptive vector correlator for spread-spectrum communications
US6381559B1 (en) * 1996-08-12 2002-04-30 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Empirical mode decomposition apparatus, method and article of manufacture for analyzing biological signals and performing curve fitting
JP4132154B2 (ja) * 1997-10-23 2008-08-13 ソニー株式会社 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
US6862558B2 (en) * 2001-02-14 2005-03-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Empirical mode decomposition for analyzing acoustical signals

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06110455A (ja) * 1992-09-25 1994-04-22 Mitsubishi Electric Corp オーディオ信号の符号化/復号化方法およびこの方法を用いたオーディオ再生装置
JPH06301383A (ja) * 1993-04-16 1994-10-28 Casio Comput Co Ltd デジタル音響波形の作成装置、デジタル音響波形の作成方法、楽音波形生成装置におけるデジタル音響波形均一化方法、及び楽音波形生成装置
JPH09244694A (ja) * 1996-03-05 1997-09-19 Nippon Telegr & Teleph Corp <Ntt> 声質変換方法
JPH09258787A (ja) * 1996-03-21 1997-10-03 Kokusai Electric Co Ltd 狭帯域音声信号の周波数帯域拡張回路
JPH1097287A (ja) * 1996-07-30 1998-04-14 Atr Ningen Joho Tsushin Kenkyusho:Kk 周期信号変換方法、音変換方法および信号分析方法
JP2000330599A (ja) * 1999-05-21 2000-11-30 Sony Corp 信号処理方法及び装置、並びに情報提供媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1298643A4 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7613529B1 (en) 2000-09-09 2009-11-03 Harman International Industries, Limited System for eliminating acoustic feedback
US8634575B2 (en) 2000-09-09 2014-01-21 Harman International Industries Limited System for elimination of acoustic feedback
US8666527B2 (en) 2000-09-09 2014-03-04 Harman International Industries Limited System for elimination of acoustic feedback
US9443525B2 (en) 2001-12-14 2016-09-13 Microsoft Technology Licensing, Llc Quality improvement techniques in an audio encoder
US8805696B2 (en) 2001-12-14 2014-08-12 Microsoft Corporation Quality improvement techniques in an audio encoder
US8554569B2 (en) 2001-12-14 2013-10-08 Microsoft Corporation Quality improvement techniques in an audio encoder
EP1351218A3 (en) * 2002-03-06 2004-04-07 Kabushiki Kaisha Toshiba Audio signal reproducing method and an apparatus for reproducing the same
WO2003079721A1 (en) * 2002-03-13 2003-09-25 Harman International Industries, Incorporated Audio feedback processing system
US7203324B2 (en) 2002-03-13 2007-04-10 Harman International Industries, Incorporated Audio feedback processing system
US7428489B2 (en) 2002-05-07 2008-09-23 Sony Corporation Encoding method and apparatus, and decoding method and apparatus
US7318034B2 (en) 2002-06-07 2008-01-08 Kabushiki Kaisha Kenwood Speech signal interpolation device, speech signal interpolation method, and program
US7676361B2 (en) 2002-06-07 2010-03-09 Kabushiki Kaisha Kenwood Apparatus, method and program for voice signal interpolation
US8645127B2 (en) 2004-01-23 2014-02-04 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US8645146B2 (en) 2007-06-29 2014-02-04 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8255229B2 (en) 2007-06-29 2012-08-28 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US9026452B2 (en) 2007-06-29 2015-05-05 Microsoft Technology Licensing, Llc Bitstream syntax for multi-process audio decoding
US9349376B2 (en) 2007-06-29 2016-05-24 Microsoft Technology Licensing, Llc Bitstream syntax for multi-process audio decoding
US9741354B2 (en) 2007-06-29 2017-08-22 Microsoft Technology Licensing, Llc Bitstream syntax for multi-process audio decoding

Also Published As

Publication number Publication date
DE1298643T1 (de) 2003-11-27
US6836739B2 (en) 2004-12-28
EP1503371B1 (en) 2006-08-16
DE60122397D1 (de) 2006-09-28
DE04017341T1 (de) 2005-07-14
DE60122397T2 (de) 2006-12-07
EP1298643B1 (en) 2005-05-11
US20030125889A1 (en) 2003-07-03
EP1298643A4 (en) 2003-12-10
DE60110796D1 (de) 2005-06-16
EP1298643A1 (en) 2003-04-02
DE60110796T2 (de) 2006-02-23
EP1503371A1 (en) 2005-02-02
AU2001262748A1 (en) 2001-12-24

Similar Documents

Publication Publication Date Title
WO2001097212A1 (fr) Dispositif et procédé d&#39;interpolation de fréquence
US7574313B2 (en) Information signal processing by modification in the spectral/modulation spectral range representation
US4817141A (en) Confidential communication system
US7676361B2 (en) Apparatus, method and program for voice signal interpolation
JP3538122B2 (ja) 周波数補間装置、周波数補間方法及び記録媒体
JP3576936B2 (ja) 周波数補間装置、周波数補間方法及び記録媒体
WO1998057436A2 (en) Source coding enhancement using spectral-band replication
EP0619041A1 (en) Speech information extractor
JPH07160299A (ja) 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式
WO2002050814A1 (fr) Systeme et procede d&#39;interpolation de signaux
JP3576942B2 (ja) 周波数補間システム、周波数補間装置、周波数補間方法及び記録媒体
RU2256293C2 (ru) Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
EP1074968B1 (en) Synthesized sound generating apparatus and method
WO2002017300A1 (fr) Procede de reduction de bande de frequence pour reduire des modules de frequence d&#39;un signal et appareil de reduction de bande de frequence
JP3955967B2 (ja) 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
US7184961B2 (en) Frequency thinning device and method for compressing information by thinning out frequency components of signal
JP2581696B2 (ja) 音声分析合成器
EP1125282A1 (en) Audio coding
JPH08163056A (ja) 音声信号帯域圧縮伝送方式
JP2007110451A (ja) 音声信号調整装置、音声信号調整方法及びプログラム
JP2003216171A (ja) 音声信号加工装置、信号復元装置、音声信号加工方法、信号復元方法及びプログラム
JPS6229234A (ja) 秘話装置
JPH0923195A (ja) 音声信号帯域圧縮伸長装置並びに音声信号の帯域圧縮伝送方式及び再生方式
JPS5918718B2 (ja) 音声分析・合成システム
JPH06209297A (ja) 音響信号の伝送方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AU CA CN IN KR SG US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 10296167

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2001936970

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2001936970

Country of ref document: EP

WWG Wipo information: grant in national office

Ref document number: 2001936970

Country of ref document: EP