WO2006030865A1 - スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置 - Google Patents

スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置 Download PDF

Info

Publication number
WO2006030865A1
WO2006030865A1 PCT/JP2005/017054 JP2005017054W WO2006030865A1 WO 2006030865 A1 WO2006030865 A1 WO 2006030865A1 JP 2005017054 W JP2005017054 W JP 2005017054W WO 2006030865 A1 WO2006030865 A1 WO 2006030865A1
Authority
WO
WIPO (PCT)
Prior art keywords
lsp parameter
scalable
wideband
lsp
codebook
Prior art date
Application number
PCT/JP2005/017054
Other languages
English (en)
French (fr)
Inventor
Hiroyuki Ehara
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to US11/575,257 priority Critical patent/US7848925B2/en
Priority to JP2006535201A priority patent/JP4963963B2/ja
Priority to EP05783539A priority patent/EP1791116B1/en
Priority to CN2005800315316A priority patent/CN101023471B/zh
Priority to BRPI0515453-7A priority patent/BRPI0515453A/pt
Priority to AT05783539T priority patent/ATE534990T1/de
Publication of WO2006030865A1 publication Critical patent/WO2006030865A1/ja
Priority to US12/913,799 priority patent/US8712767B2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Definitions

  • Scalable encoding device Scalable encoding device, scalable decoding device, scalable encoding method, scalable decoding method, communication terminal device, and base station device
  • the present invention relates to a communication terminal device and a base station device used when performing voice communication in a mobile communication system, a packet communication system using the Internet protocol, and the like, and a scalable code mounted on these devices.
  • the present invention relates to a device, a scalable decoding device, a scalable code method, and a scalable decoding method.
  • VoIP Voice over IP
  • an encoding method with frame loss resistance is desired for encoding voice data.
  • packets may be discarded on the transmission path due to congestion or the like.
  • Patent Document 1 discloses a method for transmitting core layer code information and enhancement layer code information in separate packets using scalable code information. Further, as an application of packet communication, multicast communication (one-to-many communication) using a network in which a thick line (broadband line) and a thin line (line having a low transmission rate) are mixed can be cited. Even when multipoint communication is performed over such a non-uniform network, if the code information is layered corresponding to each network, it is necessary to send different code information for each network. Therefore, scalable code is effective.
  • the band scalable LSP code key method is realized.
  • Fw (i) is the i-th order LSP parameter in the wideband signal
  • fn (i) is the i-th order LSP parameter in the narrowband signal
  • P is the LSP analysis order of the narrowband signal
  • P is the wideband signal.
  • LSP Line Spectral F requency
  • Patent Document 1 Japanese Patent Laid-Open No. 2003-241799
  • Patent Document 2 Japanese Patent Laid-Open No. 11-30997
  • An object of the present invention is to provide a scalable code encoder and a scalable decoder capable of realizing a highly efficient band scalable LSP code with high quantization efficiency. .
  • a scalable coding apparatus is a scalable coding apparatus that performs predictive quantization of a wideband LSP parameter using a narrowband quantized LSP parameter.
  • the scalable decoding apparatus is a scalable decoding apparatus that decodes a wideband LSP parameter using a narrowband quantized LSP parameter, and is a decoded quantized narrowband LSP. It has pre-emphasis means for performing pre-emphasis on a parameter, and employs a configuration in which the pre-emphasized quantized narrowband LSP parameter is used for decoding the wideband LSP parameter.
  • the scalable coding method according to the present invention is a scalable coding method that performs predictive quantization of a wideband LSP parameter using a narrowband quantized LSP parameter, the quantized narrowband LSP parameter.
  • the scalable decoding method is a scalable decoding method for decoding a wideband LSP parameter using a narrowband quantized LSP parameter, the decoded quantized narrowband LSP parameter.
  • preemphasis processing on a narrowband LSP by performing pre-emphasis processing on a narrowband LSP, preemphasis is not used when analyzing a narrowband signal, and preemphasis is used when analyzing a wideband signal. Even in the scalable codec device, the wideband LSP prediction quantization using the narrowband LSP can be performed with high performance.
  • the wideband LSP parameter in the sign of the wideband LSP parameter, the wideband LSP parameter is first classified into classes, and the sub codebook associated with the class classified in the next is selected, and Multi-stage external quantization using selected subcodebook Therefore, the characteristics of the original signal can be accurately reflected in the code data, and the memory amount of the multistage vector quantization codebook having these subcodebooks can be suppressed.
  • FIG. 1 A graph plotting examples of wideband and narrowband LSP parameters for each frame number
  • FIG. 2 is a block diagram showing the main configuration of the scalable coding apparatus according to Embodiment 1
  • FIG. 3 is a block diagram showing the main configuration of the classifier in Embodiment 1.
  • FIG. 4 is a block diagram showing the main configuration of the scalable decoding device according to Embodiment 1
  • FIG. 5 is a block diagram showing the main configuration of the classifier in Embodiment 2.
  • FIG. 6 is a block diagram showing the main configuration of a scalable speech coding apparatus according to Embodiment 3.
  • FIG. 7 is a block diagram showing the main configuration of a scalable speech decoding apparatus according to Embodiment 3.
  • FIG. 8 is a block diagram showing the main configuration of the LPC quantization unit (WB) in Embodiment 3.
  • FIG. 9 is a block diagram showing the main configuration of the LPC decoding unit (WB) in Embodiment 3.
  • FIG. 10 is a flowchart showing an example of the processing procedure of the pre-emphasis unit in the third embodiment.
  • FIG. 11 is a block diagram showing the main configuration of the scalable coding apparatus according to the fourth embodiment.
  • FIG. 4 is a block diagram showing the main configuration of a scalable decoding device according to FIG. 4. BEST MODE FOR CARRYING OUT THE INVENTION
  • Figure 1 shows 16th-order wideband LSP (16th-order LSP obtained from wideband signal: left figure in Fig. 1) and 8th-order narrowband LSP (8th-order LSP obtained from narrowband signal)
  • This is a graph in which the frame number is plotted on the horizontal axis of the data converted by Equation (1) (right figure in Fig. 1).
  • the horizontal axis is time (analysis frame number)
  • Narrowband LSP almost expresses the characteristics of the lower half of wideband LSP.
  • narrowband LSP There is some correlation between wideband LSP and narrowband LSP. It can be considered that the potential candidates for broadband LSP can be narrowed down to some extent by dividing power. In particular, when a narrow-band LSP is determined when considering something like an audio signal, a wide-band LSP that includes such features is narrowed down to some extent (for example, the narrow-band LSP ”T ⁇ If there is a voice signal feature, the broadband LSP is also likely to have ⁇ ⁇ t ⁇ ⁇ voice signal feature. The vector space where the LSP parameter pattern with such a feature exists is limited to some extent. ).
  • FIG. 2 is a block diagram showing the main configuration of the scalable coding apparatus according to Embodiment 1 of the present invention.
  • the scalable coding apparatus includes a narrowband-wideband conversion unit 200, an amplifier 201, an amplifier 202, a delay unit 203, a divider 204, an amplifier 205, an amplifier 206, a classifier 207, A multistage vector quantization codebook 208, an amplifier 209, a prediction coefficient table 210, an adder 211, a delay unit 212, a subtractor 213, and an error minimizing unit 214 are provided.
  • the multi-stage beta quantization codebook 208 includes a first-stage codebook 250, a switching switch 251, a second-stage codebook (CBb) 252, a third-stage codebook (CBc) 253, and adders 254 and 255.
  • the narrowband-to-wideband conversion unit 200 converts the input quantized narrowband LSP (the LSP parameter of the narrowband signal previously quantized by a not-shown narrowband LSP quantizer) using Equation (1) and the like. And converted into a wideband LSP parameter and output to the amplifier 201, the delay unit 203, the amplifier 206 and the classifier 207.
  • the relationship between the sampling frequency and LSP order of the wideband signal and the narrowband signal are both doubled (for the wideband signal).
  • the sampling frequency is twice the sampling frequency of the narrowband signal and the analysis order of the wideband LSP is also not twice the analysis order of the narrowband LSP
  • the obtained wideband LSP parameters and the actual input wideband LSP If the relationship between the two is not doubled, the broadband LSP parameter is once converted to an autocorrelation coefficient, the autocorrelation coefficient is upsampled, and the upsampled autocorrelation coefficient is converted to the broadband LSP parameter. It is good to convert it again.
  • a quantized narrowband LSP parameter converted into a wideband form by the narrowband-wideband conversion unit 200 may be referred to as a converted wideband LSP parameter.
  • Amplifier 201 multiplies the converted wideband LSP parameter input from narrowband to wideband conversion section 200 by the amplification coefficient input from divider 204 and outputs the result to amplifier 202.
  • the amplifier 202 receives the prediction coefficient
  • the delay unit 203 delays the converted wideband LSP parameter input from the narrowband-wideband conversion unit 200 by one frame and outputs it to the divider 204.
  • the divider 204 is a quantized broadband LS one frame before input from the delay unit 212.
  • the P parameter is converted to the quantized transform broadband one frame before input from the delay unit 203.
  • the amplifier 205 is a quantized broadband LS one frame before input from the delay unit 212.
  • Amplifier 206 multiplies the converted wideband LSP parameter input from narrowband to wideband conversion section 200 by the prediction coefficient
  • Classifier 207 performs class classification using the converted wideband LSP parameter input from narrowband-wideband conversion section 200, and class information indicating the classified class is multi-stage vector quantum. Output to the switch 251 in the codebook 208.
  • the classifier 207 includes a code book that stores as many code vectors as the number of types of classes to be classified.
  • the class information corresponding to the code vector that minimizes the square error between the input converted wideband LSP parameter and the stored code vector may be output.
  • the square error may be weighted in consideration of auditory characteristics.
  • a specific configuration example of the classifier 207 will be described later.
  • Switching switch 251 selects one of subcodebooks (CBal to CBan) associated with class information input from classifier 207 from first-stage codebook 250, and selects the output terminal of the subcodebook. Connect to adder 254.
  • the number of classes classified by the classifier 207 is n
  • there are n types of sub codebooks and the switch 251 is connected to the output terminal of the subcodebook of the class specified from the n types. Shall be.
  • First-stage codebook 250 outputs the instructed code beta to adder 254 via switching switch 251 in accordance with an instruction from error minimizing section 214.
  • Second stage codebook 252 outputs the instructed code title to adder 254 in response to an instruction from error minimizing section 214.
  • Adder 254 adds the code vector of first-stage codebook 250 input from switching switch 251 and the code vector input from second-stage codebook 252, and outputs the result to adder 255.
  • Third-stage codebook 253 outputs the instructed code beta to adder 255 in response to an instruction from error minimizing section 214.
  • Adder 255 adds the vector input from adder 254 and the code vector input from third-stage codebook 253, and outputs the result to amplifier 209.
  • the amplifier 209 multiplies the vector input from the adder 255 by the prediction coefficient ⁇ (having a value for each vector element) input from the prediction coefficient table 210 and outputs the result to the adder 211.
  • the prediction coefficient table 210 selects one set instructed from the stored prediction coefficient sets in response to an instruction from the error minimizing unit 214, and the amplifier 202 is selected from the selected prediction coefficient sets.
  • 205, 206, and 209 are output to amplifiers 202, 205, 206, and 209, respectively.
  • this prediction coefficient set also includes coefficient forces prepared for each order of the LSP for each of the amplifiers 202, 205, 206, and 209.
  • the calorie calculator 211 performs calorie calculation on the vector power that is manually input from the amplifiers 202, 205, 206, and 209, and outputs the result to the subtractor 213.
  • the output of the adder 211 is output as a quantized broadband LSP parameter to the outside of the scalable code generator of FIG.
  • the quantized broadband LSP meter output to the outside of the scalable encoder shown in FIG. 2 is used for processing in other blocks (not shown) that encode audio signals.
  • the error minimizing unit 214 determines the parameters that minimize the error (the code vector and the prediction coefficient set output from each codebook)
  • the outer layer becomes the quantized broadband LSP parameter.
  • the quantized wideband LSP parameters are output by 212 delay units. Note that the output signal of the adder 211 is expressed by the following equation (2).
  • the LSP parameter output as a wideband quantized LSP parameter is stable (the nth-order LSP is larger than any of the 0th to (n-1) th-order LSPs, that is, the LSP is If the values do not satisfy (the value increases in the order of the order), the adder 211 performs an operation so as to satisfy the LSP stability condition. Note that the adder 211 operates so as to be equal to or greater than the predetermined interval even when the interval between the adjacent quantization LSPs is narrower than the predetermined interval.
  • the subtractor 213 is input from the outside (obtained by analyzing a wideband signal), and a wideband LSP parameter serving as a quantization target, and a quantized LSP parameter input from the adder 211
  • the error of the candidate (quantized broadband LSP) is calculated, and the obtained error is output to the error minimizing section 214.
  • This error calculation can be a square error between the input LSP vectors.
  • weighting is performed according to the characteristics of the input LSP vector, the quality of hearing can be further improved. For example, in ITU-T Recommendation G.729, error minimization is performed using the weighted square error (weighted Euclidean distance) of Equation (21) in Chapter 3.2.4 (Quantization of the LSP coefficients).
  • the error minimizing unit 214 sets the code vector and the prediction coefficient set of each codebook that minimizes the error output from the subtractor 213 to the multistage vector quantization codebook 208 and the prediction coefficient table 210, respectively. Choose from.
  • the selected parameter information is encoded and output as encoded data.
  • FIG. 3 is a block diagram showing the main configuration of the classifier 207.
  • the classifier 207 includes a classification codebook 410 having n code vector (CV) storage units 411 and a switch 412, an error calculation unit 421, and an error minimization unit 422.
  • CV code vector
  • the CV storage units 411 are provided in the same number as the number of classes classified by the classifier 207, that is, n.
  • Each of CV411-1 to 411-n stores a code vector corresponding to each class to be classified, and when connected to the error calculation unit 421 by the switch 412, the code vector to be stored is switched to the switch This is input to the error calculation unit 421 via 412.
  • the switch 412 sequentially switches the CV storage unit 411 connected to the error calculation unit 421 in accordance with an instruction from the error minimization unit 422, and inputs all of CVl to CVn to the error calculation unit 421.
  • Error minimizing section 422 receives CVk + 1 from classification codebook 410 to error calculating section 421 each time square error between the converted wideband LSP parameter and CVk is input from error calculating section 421.
  • the switch 412 is instructed to store the square error for CVl to CVn, and class information indicating the minimum square error is generated and input to the switch 251.
  • FIG. 4 is a block diagram showing the main configuration of a scalable decoding device that decodes code data encoded by the scalable coding device. Except for the portion related to the decoding of the encoded data in this scalable decoding device, the operation is the same as that of the scalable encoding device of FIG. Note that the same reference numerals are assigned to the same components that perform the same operations as those of the scalable code generator of FIG. 2, and description thereof is omitted.
  • This scalable decoding apparatus includes a narrowband-wideband converter 200, an amplifier 201, an amplifier 202, a delay unit 203, a divider 204, an amplifier 205, an amplifier 206, a classifier 207, and a multistage vector quantization code.
  • a book 308, an amplifier 209, a prediction coefficient table 310, an adder 211, a delay unit 212, and a parameter decoding unit 314 are provided.
  • the multistage vector quantization codebook 308 includes a first stage codebook 350, a switching switch 251, a second stage codebook (CBb) 352, a third stage codebook (CBc) 353, and adders 254 and 255.
  • the nomometer decoding unit 314 receives code data encoded by the scalable code generator according to the present embodiment, and each stage code of the multistage vector quantization (VQ) codebook 308 is received. For each of the books 350, 352, and 353 and the prediction coefficient table 310, each code book, the code vector to be output by the table, and information on the prediction coefficient set are output.
  • VQ vector quantization
  • First-stage codebook 350 takes out the code beta indicated by the information input from parameter decoding section 314 from the subcodebook (CBal to CBan) selected by switching switch 251 and passes through switching switch 251. Output to adder 254.
  • the second-stage codebook 352 is a code vector indicated by information input from the meter decoding unit 314. And output to adder 254.
  • Third-stage codebook 353 extracts the code vector indicated by the information input from parameter decoding section 314 and outputs the code vector to adder 255.
  • the prediction coefficient table 310 takes out a prediction coefficient set indicated by the information input from the parameter decoding unit 314 and outputs prediction coefficients corresponding to the amplifiers 202, 205, 206, and 209.
  • the code vector and the prediction coefficient set stored in the multistage VQ codebook 308 and the prediction coefficient table 310 are the multistage VQ codebook 208 and the prediction coefficient table 210 in the scalable code generator of FIG. Is the same. The operation is also the same.
  • the only part that sends instructions to the multistage VQ codebook and the prediction coefficient table is the error minimizing unit 2 14 force parameter decoding unit 314.
  • the output of adder 211 is output as a quantized wideband LSP parameter to the outside of the scalable decoding device of FIG.
  • the quantized broadband LSP parameter output to the outside of the scalable decoding device in Fig. 4 is used for processing in a block or the like that decodes a speech signal.
  • encoding of the wideband LSP parameter in the current frame is adaptively performed using the narrowband quantized LSP parameter decoded in the current frame.
  • classification of quantized broadband LSP parameters is performed, a dedicated sub codebook (CBal to CBan) is prepared for each classified class, and the sub codebook is switched and used according to the classification result.
  • Perform vector quantization of wideband LSP parameters By adopting this configuration, according to the present embodiment, it is possible to perform code coding suitable for quantization of wideband LSP parameters based on already quantized narrowband LSP information. The quantization performance of wideband LSP parameters can be improved.
  • the class classification is performed using the quantized narrowband LSP parameter that has already been encoded (decoded).
  • the sign side force does not need to acquire the classification information separately. That is, according to the present embodiment, the sign of the wideband LSP parameter is not increased without increasing the communication transmission rate. Can improve performance.
  • first stage codebooks 250 and 350 in multistage vector quantization codebooks 208 and 308 including sub codebooks represent basic features to be encoded.
  • the average component and the bias component are all in the first stage codebooks 250 and 350 so that the second and subsequent stages become noisy error component codes. Reflect it.
  • the main components of the vectors generated by the multistage vector quantization codebooks 208 and 308 are used as the first stage code. It becomes possible to express it with books 250 and 350.
  • the first codebook 250, 350 is used as the codebook for switching the sub codebook according to the class classification in classifier 207, that is, the average energy of the stored code vector Only the first-stage codebook having the largest value has a sub codebook. In this way, it is possible to reduce the amount of memory required for storing the code vector, compared with the case where all the code books of the multistage vector quantization code books 208 and 308 are switched for each class. Further, if this is done, it is possible to obtain a large switching effect simply by switching the first stage codebooks 250 and 350, and the quantization performance of the wideband LSP parameter can be effectively improved.
  • error calculation section 421 calculates the square error between the wideband LSP parameter and the code vector from classification codebook 410, and error minimization section 422 calculates the square error.
  • the case of selecting the one that accumulates and minimizes the error has been described. However, if the processing is equivalent to this, that is, the one that results in the smallest error between the wideband LSP parameter and the code vector is selected, it is not always necessary. It is not necessary to calculate the square error strictly. Further, in order to reduce the amount of calculation, a part of the calculation of the square error may be omitted, for example, to select a vector having a quasi-minimum error.
  • FIG. 5 is a block diagram showing a main configuration of classifier 507 provided in the scalable coding apparatus or the scalable decoding apparatus according to Embodiment 2 of the present invention.
  • the scalable coding apparatus or scalable decoding apparatus according to the present embodiment is the same as the embodiment.
  • a classifier 507 is provided instead of the classifier 207 in the scalable coding apparatus or the scalable decoding apparatus according to the first aspect. Therefore, most of the components included in the scalable codec device or scalable decoding device according to the present embodiment are the same as the components in the scalable codec device or scalable decoding device according to Embodiment 1.
  • components that perform the same operation are denoted by the same reference numerals as those in the first embodiment, and description thereof is omitted to avoid duplication.
  • the classifier 507 includes a codebook 510 for classification having m CV storage units 411, an error calculation unit 521, a similarity calculation unit 522, and a classification determination unit 523.
  • Classification codebook 510 inputs m types of CVs stored in CV storage units 411-1 to 411-m to error calculation unit 521 at the same time.
  • the m square errors calculated are all input to the similarity calculation unit 522.
  • the error calculation unit 521 may calculate the square error based on the vector Euclidean distance, or may calculate the square error based on the pre-weighted vector Euclidean distance.
  • similarity calculation unit 522 is input from transformed wideband LSP parameter input to error calculation unit 521 and classification codebook 510.
  • the degree of similarity between CVl to CVm is calculated, and the calculated degree of similarity is input to the classification determination unit 523.
  • the similarity calculation unit 522 calculates, for example, the difference from “0” having the lowest similarity to “K ⁇ 1” having the highest similarity.
  • the classification determining unit 523 performs class classification using, for example, the following equation (3). [0072] [Equation 2]
  • the similarity calculation unit 522 calculates the scalar quantization result power of m square errors of similarity, so that the amount of calculation required for the calculation is reduced. Can be suppressed.
  • m degree of square error is converted into similarity represented by K ranks in similarity calculation section 522, so an intermediate between CV1 and CVm Therefore, the number of classes classified by the classifier 507 can be increased even if the number of types m of the CV storage unit 411 is small.
  • FIG. 6 is a block diagram showing the main configuration of the scalable speech coding apparatus according to Embodiment 3 of the present invention.
  • a scalable speech coding apparatus includes a downsample processing unit 601, an LP analysis unit (NB) 602, an LPC quantization unit (NB) 603, a sound source coding unit (NB) 604, An NF filter 605, an LP analysis unit (WB) 606, an LPC quantization unit (WB) 607, a sound source coding unit (WB) 608, and a multiplexing unit 609.
  • the downsample processing unit 601 performs general downsampling processing combining decimation and LPF (low pass filter) processing on the input wideband signal! Unit (NB) 602 and excitation code key unit (NB) 604, respectively.
  • decimation and LPF low pass filter
  • LP analysis unit (NB) 602 performs linear prediction analysis of the narrowband signal input from downsample processing unit 601 and outputs linear prediction coefficients to LPC quantization unit (NB) 603.
  • the LPC quantization unit (NB) 603 quantizes the linear prediction coefficient input from the LP analysis unit (NB) 602, outputs the code information to the multiplexing unit 609, and is quantized.
  • the linear prediction parameters are sent to the LPC quantization unit (WB) 607 and the excitation code base unit (NB) 604, respectively. Output.
  • the LPC quantization unit (NB) 603 converts the linear prediction coefficient into a spectrum parameter such as LSP (LSF) and performs force quantization processing.
  • the quantized linear prediction parameter output from the LPC quantization unit (NB) 603 may be a spectral parameter or a linear prediction coefficient.
  • the excitation coding unit (NB) 604 converts the linear prediction parameters input from the LPC quantization unit (NB) 603 into linear prediction coefficients, and converts the linear prediction filter based on the obtained linear prediction coefficients. To construct.
  • the excitation signal of the linear prediction filter is encoded so that the error between the signal synthesized by the constructed linear prediction filter and the narrowband signal input from the downsample processing unit 601 is minimized. Is output to the multiplexing unit 609, and the decoded excitation signal (quantized excitation signal) is output to the excitation code base unit (WB) 608.
  • the pre-emphasis filter 605 performs high-frequency emphasis processing on the input wideband signal (transfer function is ⁇ : filter coefficient, ⁇ _1 : complex variable in ⁇ transformation, called delay operator), and LP analysis Section (WB) 606 and excitation code key section (WB) 608.
  • transfer function is ⁇ : filter coefficient
  • ⁇ _1 complex variable in ⁇ transformation, called delay operator
  • WB LP analysis Section
  • WB excitation code key section
  • LP analysis unit (WB) 606 performs linear prediction analysis of the wideband signal after pre-emphasis input from pre-emphasis filter 605, and outputs linear prediction coefficients to LPC quantization unit (WB) 607. .
  • the LPC quantization unit (WB) 607 converts the linear prediction coefficient input from the LP analysis unit (WB) 606 into a spectral parameter such as LSP (LSF), and the obtained spectral parameter and LPC quantization.
  • a spectral parameter such as LSP (LSF)
  • LSP LSP
  • the linear prediction parameter (broadband) is quantized using, for example, a scalable coding device described later, and the code ⁇ information is output to multiplexing section 609, and quantized linear prediction parameters are output to excitation code section (WB) 608.
  • the excitation coding unit (WB) 608 converts the quantized linear prediction parameters input from the LPC quantization unit (WB) 607 into linear prediction coefficients, and performs a linear prediction filter based on the obtained linear prediction coefficients. To construct.
  • the driving excitation signal of the linear prediction filter is encoded so as to minimize the error between the signal synthesized by the constructed linear prediction filter and the wideband signal input from the pre-synthesis filter 605, and the excitation encoding information is obtained.
  • For the excitation code key of a wideband signal input from the excitation code key part (NB) 604.
  • Multiplexing section 609 includes various inputs from LPC quantization section (NB) 603, excitation coding section (NB) 604, LPC quantization section (WB) 607 and excitation coding section (WB) 608. Code information is multiplexed and the multiplexed signal is sent to the transmission line.
  • FIG. 7 is a block diagram showing the main configuration of the scalable speech decoding apparatus according to Embodiment 3 of the present invention.
  • the scalable speech decoding apparatus includes a demultiplexing unit 700, an LPC decoding unit (NB) 701, an excitation decoding unit (NB) 702, an LP synthesis unit (NB) 703, and an LPC.
  • a decoding unit (WB) 704, a sound source decoding unit (WB) 705, an LP synthesis unit (WB) 706, and a de-emphasis filter 707 are provided.
  • Demultiplexing section 700 receives the multiplexed signal sent from the scalable speech coding apparatus according to the present embodiment, separates it into various pieces of code information, and then produces a quantized narrowband linear prediction coefficient
  • the code key information is sent to the LPC decoding unit (NB) 701, the narrowband excitation coding information is sent to the source decoding unit (NB) 702, and the quantized broadband linear prediction coefficient code key information is sent to the LPC decoding unit ( Wideband excitation coding information is output to WB) 704 and excitation decoding section (WB) 705, respectively.
  • the LPC decoding unit (NB) 701 performs a decoding process on the quantized narrowband linear prediction encoding information input from the demultiplexing unit 700, decodes the quantized narrowband linear prediction coefficient, and performs LP synthesis. Section (NB) 703 and LPC decoding section (WB) 704. However, as described above in the scalable speech encoder, quantization is performed by converting linear prediction coefficients into LSP (or LSF). It is an LSP parameter that is not a thing. The decoded LSP parameter is output to the LP synthesis unit (NB) 703 and the LPC decoding unit (WB) 704.
  • Excitation excitation section (NB) 702 performs decoding processing of narrowband excitation code information input from demultiplexing section 700! LP synthesis section (NB) 703 and excitation decoding section (WB) Output to 705.
  • the LP synthesis unit (NB) 703 receives the decoding LSP parameter input from the LPC decoding unit (NB) 701. Data is converted into linear prediction coefficients, a linear prediction filter is constructed using this, and the decoded narrowband excitation signal input from the excitation decoding section (NB) 702 is used as a driving excitation signal for the linear prediction filter. Generate a signal.
  • the LPC decoding unit (WB) 704 includes the quantized broadband linear prediction coefficient code input information input from the demultiplexing unit 700 and the narrowband decoding LS input from the LPC decoding unit (NB) 701.
  • NB LPC decoding unit
  • a wideband LSP parameter is decoded using a scalable decoding device described later, and output to the LP synthesis unit (WB) 706.
  • the excitation decoding section (WB) 705 uses the wideband excitation code information input from the demultiplexing section 700 and the decoded narrowband excitation signal input from the excitation decoding section (NB) 702.
  • the wideband sound source signal is decoded and output to the LP synthesis unit (WB) 706.
  • the LP synthesis unit (WB) 706 converts the decoded broadband LSP parameter input from the LPC decoding unit (WB) 704 into a linear prediction coefficient, constructs a linear prediction filter using this, and generates a sound source.
  • a wideband signal is generated using the decoded broadband excitation signal input from the decoding unit (WB) 705 as a driving excitation signal of the linear prediction filter, and is output to the de-emphasis filter 707.
  • the de-emphasis filter 707 is a filter having a characteristic opposite to that of the pre-emphasis filter 605 of the scalable speech coding apparatus.
  • the de-emphasized signal is output as a decoded wideband signal.
  • the low-band part can also decode the wide-band signal by using a signal obtained by up-sampling the narrow-band signal generated by the LP synthesis unit (NB) 703.
  • the wideband signal output from the de-emphasis filter 707 may be applied to a high-pass filter having appropriate frequency characteristics and added to the upsampled narrowband signal. It is even better to post-filter narrowband signals to improve auditory quality.
  • FIG. 8 is a block diagram showing the main configuration of LPC quantization section (WB) 607.
  • the LPC quantization unit (WB) 607 includes a narrowband-wideband conversion unit 200, an LSP-LPC conversion unit 800, a clean-up unit 801, an LPC-LSP conversion unit 802, and a prediction quantization unit 803.
  • the predictive quantization unit 803 includes an amplifier 201, an amplifier 202, a delay unit 203, a divider 204, an amplifier 205, an amplifier 206, a classifier 207, a multistage vector quantization codebook 208, an amplifier 209, a prediction coefficient test unit, and the like.
  • the multistage vector quantization codebook 208 includes a first stage codebook 250, a switching switch 251, a second stage codebook (CBb) 252, a third stage codebook (CBc) 253, and adders 254 and 255.
  • the scalable coding apparatus (LPC quantization unit (WB) 607) shown in FIG. 8 includes an LSP-LPC conversion unit 800, a pre-emphasis unit 801, and an LPC-LSP conversion unit 802. It has been newly added to the dredging device. Therefore, most of the components included in the scalable coding apparatus according to the present embodiment perform the same operations as the components in the scalable coding apparatus according to the first embodiment. In order to avoid duplication, the same reference numerals as those in Embodiment 1 are attached to the constituent elements that perform the above operation, and the description thereof is omitted.
  • the quantized linear prediction parameters (here, quantized narrowband LSP) input from the LPC quantizer (NB) 603 are converted into wideband LSP parameters by the narrowband-wideband converter 200, and converted wideband LSP parameters. (Quantized narrowband LSP parameter converted into a wideband form) is output to LSP—LPC converter 800.
  • the LSP-LPC converter 800 converts the converted wideband LSP parameter (quantized linear prediction parameter) input from the narrowband-wideband converter 200 into a linear prediction coefficient (quantized narrowband LPC), Output to pre-emphasis unit 801.
  • the pre-emphasis unit 801 calculates a pre-emphasized linear prediction coefficient from the linear prediction coefficient input from the LSP-LPC conversion unit 800 using a method as described later, and performs the LPC-LSP conversion unit 802. Output to.
  • LPC—LSP converter 802 converts the pre-emphasized linear prediction coefficient input from pre-emphasis unit 801 into a pre-emphasized quantized narrowband LSP and outputs the result to prediction quantizer 803. .
  • Predictive quantization section 803 converts the pre-emphasized quantized narrowband LSP input from LPC-LSP transform section 802 into a quantized wideband LSP, and outputs the quantized wideband LSP to the outside of predictive quantizer 803.
  • the predictive quantization unit 803 may have any configuration as long as it outputs a quantized broadband LSP, but in this embodiment, as shown in FIG. ⁇ 212 are constituent elements.
  • FIG. 9 is a block diagram showing the main configuration of LPC decoding section (WB) 704.
  • the LPC decoding unit (WB) 704 includes a narrowband-wideband conversion unit 200, an LSP-LPC conversion unit 800, a clean-up unit 801, an LPC-LSP conversion unit 802, and an LSP decoding unit 903.
  • the LSP decoding unit 903 includes an amplifier 201, an amplifier 202, a delay unit 203, a divider 204, an amplifier 205, an amplifier 206, a classifier 207, a multistage vector quantization codebook 308, an amplifier 209, a prediction coefficient table 310, and an adder. 211, a delay unit 212, and a parameter decoding unit 314.
  • the multistage beta quantization codebook 308 includes a first stage codebook 350, a switching switch 251, a second stage codebook (CB b) 352, a third stage codebook (CBc) 353, and adders 254 and 255.
  • the scalable decoding apparatus (LPC decoding unit (WB) 704) shown in FIG. 9 includes the LSP-LPC conversion unit 800, the pre-emphasis unit 801, and the LPC-LSP conversion unit 802 shown in FIG.
  • LPC decoding unit (WB) 704 shown in FIG. 9 includes the LSP-LPC conversion unit 800, the pre-emphasis unit 801, and the LPC-LSP conversion unit 802 shown in FIG.
  • This is a new addition to 4 scalable decoding devices. Therefore, most of the components included in the scalable speech decoding apparatus according to the present embodiment perform the same operations as the components in the scalable decoding apparatus according to Embodiment 1, and thus the same
  • the same reference numerals as those in the first embodiment are given to the constituent elements that perform the above operation, and the description thereof is omitted.
  • the quantized narrowband LSP input from the LPC decoding unit (NB) 701 is converted into a wideband LSP parameter by the narrowband-wideband conversion unit 200, and converted into a converted wideband LSP parameter (converted into a wideband form). Quantized narrowband LSP parameters) are output to the LSP-LPC converter 800.
  • LSP—LPC converter 800 converts the converted wideband LSP parameters (quantized narrowband LSP after conversion) input from narrowband-wideband converter 200 into linear prediction coefficients (quantized narrowband LP).
  • the pre-emphasis unit 801 calculates a pre-emphasized linear prediction coefficient from the linear prediction coefficient input from the LSP-LPC conversion unit 800 using a method as described later,
  • LPC—LSP converter 802 converts the pre-emphasized linear prediction coefficient input from pre-emphasis unit 801 into a pre-emphasized quantized narrowband LSP, and performs LSP recovery. Output to No. 903.
  • the LSP decoder 903 converts the pre-emphasized decoded (quantized) narrowband LSP input from the LPC-LSP converter 802 into a quantized broadband LSP and outputs the result to the outside of the LSP decoder 903.
  • the LSP decoding unit 903 outputs a quantized wideband LSP, and may have any configuration as long as it outputs the same quantized wideband LSP as the prediction quantizer 803. As an example, the components 201 to 207, 308, 209, 310, 211, and 212 shown in FIG.
  • FIG. 10 is a flowchart showing an example of a processing procedure in the pre-emphasis unit 801.
  • step (hereinafter abbreviated as “ST”) 1001 calculates the impulse response of the LP synthesis filter composed of the input quantized narrowband LPC, and ST1002 calculates the impulse response calculated in ST 1001. Then, the impulse response of the pre-emphasis filter 605 is convoluted to calculate the “pre-emphasized LP synthesis filter impulse response”.
  • the autocorrelation coefficient of the "pre-emphasized LP synthesis filter impulse response" calculated in ST1002 is calculated.
  • the autocorrelation coefficient is converted to LPC and pre-emphasis is performed. Output quantized narrowband LPC.
  • pre-emphasis refers to processing for preliminarily smoothing the slope of a vector in order to avoid the influence of the slope of the spectrum. Therefore, the processing in the pre-emphasis unit 801 is described in FIG. Pre-emphasis may be implemented with other processing methods that are not limited to specific processing methods!
  • FIG. 11 is a block diagram showing the main configuration of the scalable coding apparatus according to Embodiment 4 of the present invention.
  • the scalable code generator shown in Fig. 11 has the LPC amount shown in Fig. 6. It can be applied to the child unit (WB) 607. Since the operation of each block is the same as that shown in FIG. 8, the same number is assigned and the description is omitted. However, although the pre-emphasis unit 801 and the LPC-LSP conversion unit 802 operate in the same way, the input / output parameters are different in the stage before the narrowband-to-broadband conversion.
  • FIG. 8 of the third embodiment shows pre-emphasis in the narrow-band signal (low-speed sampling rate) region
  • Figure 8 shows pre-emphasis in the wide-band signal (high-speed sampling rate) region.
  • the configuration shown in FIG. 11 has the advantage that the increase in the amount of computation is small because the sampling rate is low.
  • the pre-emphasis coefficient used in FIG. 8 is preferably adjusted in advance to an appropriate value (a value that can be different from ⁇ of the pre-emphasis filter 605 in FIG. 6).
  • FIG. 12 is a block diagram showing the main configuration of the scalable decoding device according to Embodiment 4 of the present invention.
  • the scalable decoding apparatus shown in FIG. 12 can be applied to the LPC decoding unit (WB) 704 shown in FIG. Since the operation of each block is the same as that shown in FIG. 9, the same number is assigned and the description is omitted.
  • WB LPC decoding unit
  • FIG. 9 of the third embodiment and FIG. 12 of the present embodiment is the difference between FIG. 8 and FIG.
  • the scalable coding apparatus may be configured to perform only band-limiting filtering processing without down-sampling in the down-sample processing unit 601. Yes. In this case, the scalable coding of the narrowband signal and the wideband signal having the same sampling frequency but different only in the signal bandwidth is performed, and the processing of the narrowband one wideband conversion unit 200 becomes unnecessary.
  • the scalable speech coding apparatus is not limited to Embodiments 3 and 4 above, and can be implemented with various modifications.
  • the transfer function of the pre-facility filter 605 used is a force of 1 z- 1 and a configuration using a filter having other appropriate characteristics is also possible.
  • the scalable coding apparatus and the scalable decoding apparatus according to the present invention are not limited to the above-described Embodiments 1 to 4, and can be implemented with various modifications.
  • a configuration in which all or part of the constituent elements 201 to 205 and 212 are removed can be implemented.
  • the scalable coding apparatus and the scalable decoding apparatus according to the present invention can be mounted in a communication terminal apparatus and a base station apparatus in a mobile communication system.
  • a communication terminal device and a base station device can be provided.
  • the present invention can also be applied to the force I SP (immittance Spectrum Pairs) parameter described for the case where the LSP parameter is subjected to code decoding and Z decoding.
  • the narrowband signal indicates an acoustic signal with a sampling frequency of 8 kHz (generally, an acoustic signal with a 3.4 kHz band), and the wideband signal is wider than the narrowband signal.
  • Narrowband signals and wideband signals are not necessarily limited to these.
  • the power and class classification may be performed by converting the quantized LSP parameter to a lower order. In this way, it is possible to suppress the increase in the amount of computation and the amount of memory due to the introduction of class classification.
  • the multistage vector quantization codebook configuration is three stages here, any number of stages may be used as long as it is two stages or more. Also, some stages may be divided vector quantization or scalar quantization. It can also be applied to the case where it is not a multi-stage configuration but a split configuration.
  • a multi-stage vector quantization codebook has a different codebook for each set of prediction coefficient tables, and different prediction coefficient tables are configured to use different multistage vector quantization codebooks in combination. Further, the quantization performance is improved.
  • the prediction coefficient tables 210 and 310 prepare a prediction coefficient table corresponding to the class information output from the classifier 207 in advance, and switch and output them. Also good. That is, in the prediction coefficient tables 210 and 310, the switching switch 251 selects one of the intermediate codes of the first codebook 250 as the subcodebook (CBa1 to CBan) according to the class information input from the classifier 207. Alternatively, the prediction coefficient table may be switched and output.
  • both of the first-stage codebook 250 and the prediction coefficient tables of the prediction coefficient tables 210 and 310 may be switched simultaneously.
  • the present invention can also be realized by software.
  • class classification is performed using a narrowband quantized LSP parameter converted to a wideband quantized LSP parameter, but class classification is performed using the narrowband LSP parameter before conversion. It is also possible to perform.
  • each functional block used in the description of the above embodiments is typically realized as an LSI which is an integrated circuit. These may be individually made into one chip, or may be made into one chip so as to include a part or all of them. [0137] Here, it is sometimes called IC, system LSI, super LSI, or non-linear LSI due to the difference in power integration as LSI.
  • the method of circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general purpose processors is also possible. It is also possible to use a field programmable gate array (FPGA) that can be programmed after LSI manufacture and a reconfigurable processor that can reconfigure the connection and settings of circuit cells inside the LSI.
  • FPGA field programmable gate array
  • a scalable coding apparatus, a scalable decoding apparatus, a scalable coding method, and a scalable decoding method according to the present invention are a communication apparatus in a mobile communication system, a packet communication system using an Internet protocol, or the like. It can be used for applications such as

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 量子化効率の高い高性能な帯域スケーラブルLSP符号化を実現することができるスケーラブル符号化装置およびスケーラブル復号化装置等を開示する。これらの装置では、狭帯域-広帯域変換部(200)は、量子化狭帯域LSPを入力して広帯域に変換し、変換後の量子化狭帯域LSP(変換広帯域LSPパラメータ)をLSP-LPC変換部(800)へ出力する。LSP-LPC変換部(800)は、変換後の量子化狭帯域LSPを線形予測係数に変換し、プリエンファシス部(801)へ出力する。プリエンファシス部(801)は、プリエンファシスされた線形予測係数を算出し、LPC-LSP変換部(802)に出力する。LPC-LSP変換部(802)は、プリエンファシスされた線形予測係数を、プリエンファシスされた広帯域変換後量子化狭帯域LSPに変換し、予測量子化部(803)へ出力する。  

Description

明 細 書
スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号 化方法、スケーラブル復号化方法、通信端末装置および基地局装置
技術分野
[0001] 本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信シ ステム等において、音声通信を行う際に用いられる通信端末装置および基地局装置 、ならびにこれらの装置に搭載されるスケーラブル符号ィ匕装置、スケーラブル復号ィ匕 装置、スケーラブル符号ィ匕方法およびスケーラブル復号ィ匕方法に関する。
背景技術
[0002] VoIP (Voice over IP)等のようにパケットを用いた音声通信にぉ 、ては、音声デー タの符号化にフレーム消失耐性のある符号化方式が望まれて 、る。インターネット通 信に代表されるパケット通信においては、輻輳等により伝送路上でパケットが破棄さ れることがあるカゝらである。
[0003] フレーム消失耐性を高める方法の一つとして、伝送情報の一部が消失しても他の 一部から復号処理を行うようにすることでフレーム消失の影響をできるだけ少なくする アプローチがある(例えば、特許文献 1参照)。特許文献 1には、スケーラブル符号ィ匕 を用いてコアレイヤ符号ィ匕情報と拡張レイヤの符号ィ匕情報とを別々のパケットに詰め て伝送する方法が開示されている。また、パケット通信のアプリケーションとして、太い 回線(ブロードバンド回線)と細い回線(伝送レートの低い回線)とが混在するネットヮ ークを用いたマルチキャスト通信(一対多の通信)が挙げられる。このような不均一な ネットワーク上で多地点間通信を行う場合にも、それぞれのネットワークに対応して符 号ィ匕情報が階層化されていれば、ネットワークごとに異なる符号ィ匕情報を送る必要が ないため、スケーラブル符号ィ匕が有効である。
[0004] 例えば、音声信号の高能率な符号化を可能とする CELP (Code Excited Linear Pre diction)方式をベースとして、信号帯域幅に (周波数軸方向に)スケーラビリティを有 する帯域スケーラブル符号ィ匕技術として、特許文献 2に開示されている技術がある。 特許文献 2では、音声信号のスペクトル包絡情報を LSP (Line Spectrum Pair:線スぺ タトル対)パラメータで表現する CELP方式の例が示されている。ここでは、狭帯域音 声用の符号化部 (コアレイヤ)で得られた量子化 LSPパラメータ (狭帯域符号化 LSP )を以下の式(1)
fw(i) = 0. 5 X fn(i) [ただし、 i=0, · ··, P—1]
=0. 0 [ただし、 i=P , · ··, Ρ - 1] · ' · (1)を用いて広帯域音声
n w
符号ィ匕用の LSPパラメータに変換し、変換した LSPパラメータを広帯域音声用の符 号ィ匕部 (拡張レイヤ)で用いることにより、帯域スケーラブルな LSP符号ィ匕方法を実現 している。なお、 fw(i)は広帯域信号における i次の LSPパラメータ、 fn(i)は狭帯域信 号における i次の LSPパラメータ、 Pは狭帯域信号の LSP分析次数、 Pは広帯域信
n w
号の LSP分析次数をそれぞれ示している。ちなみに、 LSPは、 LSF (Line Spectral F requency)とも呼ばれる。
特許文献 1:特開 2003 - 241799号公報
特許文献 2:特開平 11― 30997号公報
発明の開示
発明が解決しょうとする課題
[0005] し力しながら、特許文献 2においては、狭帯域音声符号化で得られた量子化 LSP ノ メータ (狭帯域 LSP)を単純に定数倍して、広帯域信号に対する LSPパラメータ( 広帯域 LSP)の予測に用いているだけなので、狭帯域 LSPの情報を最大限活用して いるとは言えず、式(1)に基づいて設計された広帯域 LSP符号化器は、量子化効率 等の符号ィヒ性能が不十分である。
[0006] 本発明の目的は、量子化効率の高!ヽ高性能な帯域スケーラブル LSP符号ィ匕を実 現することができるスケーラブル符号ィ匕装置およびスケーラブル復号ィ匕装置等を提 供することである。
課題を解決するための手段
[0007] 上記課題を解決するために本発明に係るスケーラブル符号ィ匕装置は、狭帯域の量 子化 LSPパラメータを用いて広帯域の LSPパラメータの予測量子化を行うスケーラ ブル符号ィ匕装置であって、量子化狭帯域 LSPパラメータに対してプリエンファシスを 行うプリエンファシス手段を有し、前記プリエンファシスされた量子化狭帯域 LSPパラ メータを前記予測量子化に用いる構成を採る。
[0008] また、本発明に係るスケーラブル復号ィ匕装置は、狭帯域の量子化 LSPパラメータを 用いて広帯域の LSPパラメータを復号するスケーラブル復号ィ匕装置であって、復号 された量子化狭帯域 LSPパラメータに対してプリエンファシスを行うプリエンファシス 手段を有し、前記プリエンファシスされた量子化狭帯域 LSPパラメータを前記広帯域 の LSPパラメータの復号に用いる構成を採る。
[0009] また、本発明に係るスケーラブル符号化方法は、狭帯域の量子化 LSPパラメータを 用いて広帯域の LSPパラメータの予測量子化を行うスケーラブル符号ィ匕方法であつ て、量子化狭帯域 LSPパラメータに対してプリエンファシスを行うプリエンファシスス テツプと、前記プリエンファシスされた量子化狭帯域 LSPパラメータを用いて前記予 測量子化を行う量子化ステップと、を有するようにした。
[0010] また、本発明に係るスケーラブル復号化方法は、狭帯域の量子化 LSPパラメータを 用いて広帯域の LSPパラメータを復号するスケーラブル復号ィ匕方法であって、復号 された量子化狭帯域 LSPパラメータに対してプリエンファシスを行うプリエンファシス ステップと、前記プリエンファシスされた量子化狭帯域 LSPパラメータを用いて前記 広帯域の LSPパラメータの復号を行う LSPパラメータ復号ステップと、を有するように した。
発明の効果
[0011] 本発明によれば、狭帯域 LSPに対してプリエンファシス処理を施すことにより、狭帯 域信号の分析時はプリエンファシスを使用せず、広帯域信号の分析時はプリェンフ アシスを使用する構成となっているスケーラブル符号ィ匕装置においても、狭帯域 LSP を用いた広帯域 LSPの予測量子化を高性能に行うことができる。
[0012] また、本発明によれば、狭帯域 LSPの情報を用いて広帯域 LSPパラメータを適応 符号ィ匕することにより、量子化効率の高い高性能な帯域スケーラブル LSP符号ィ匕を 実現することができる。
[0013] さらに、本発明によれば、広帯域 LSPパラメータの符号ィ匕において、先ず広帯域 L SPパラメータがクラス分類され、次 ヽで分類されたクラスに対応付けされたサブ符号 帳が選択され、さらに選択されたサブ符号帳を用いて多段階べ外ル量子化が行わ れるため、符号ィ匕データに原信号の特徴を精度良く反映させることができるとともに、 これらのサブ符号帳を有する多段階ベクトル量子化符号帳のメモリ量を抑えることが できる。
図面の簡単な説明
[0014] [図 1]広帯域と狭帯域の LSPパラメータの例をフレーム番号毎にプロットしたグラフを 示す図
[図 2]実施の形態 1に係るスケーラブル符号ィ匕装置の主要な構成を示すブロック図
[図 3]実施の形態 1における分類器の主要な構成を示すブロック図
[図 4]実施の形態 1に係るスケーラブル復号ィ匕装置の主要な構成を示すブロック図
[図 5]実施の形態 2における分類器の主要な構成を示すブロック図
[図 6]実施の形態 3に係るスケーラブル音声符号ィ匕装置の主要な構成を示すブロック 図
[図 7]実施の形態 3に係るスケーラブル音声復号ィ匕装置の主要な構成を示すブロック 図
[図 8]実施の形態 3における LPC量子化部 (WB)の主要な構成を示すブロック図 [図 9]実施の形態 3における LPC復号ィ匕部 (WB)の主要な構成を示すブロック図 [図 10]実施の形態 3におけるプリエンファシス部の処理手順の一例を示すフロー図 [図 11]実施の形態 4に係るスケーラブル符号ィ匕装置の主要な構成を示すブロック図 [図 12]実施の形態 4に係るスケーラブル復号ィ匕装置の主要な構成を示すブロック図 発明を実施するための最良の形態
[0015] 図 1は、 16次の広帯域 LSP (広帯域信号から 16次の LSPを求めたもの:図 1の左 図)と 8次の狭帯域 LSP (狭帯域信号から 8次の LSPを求めて式(1)によって変換さ れたもの:図 1の右図)を横軸にフレーム番号をとつてプロットしたグラフである。これら のグラフにおいて、横軸は時間(分析フレーム番号)、縦軸は正規化周波数(1. 0 = ナイキスト周波数 (この例では 8kHz) )である。
[0016] これらのグラフ力 次のようなことが示唆される。第一に、式(1)によって得られる LS Pは、必ずしも高い精度で近似できているわけではないが、広帯域 LSPの低域側 8 次を近似するものとして妥当なものとなっている。第二に、狭帯域信号は 3.4kHz付 近で信号成分がなくなる (減衰する)ため、広帯域 LSPが正規ィ匕周波数 0.5近くにあ る場合、対応する狭帯域 LSPは 3.4kHz付近にクリッピングされたようになり、式(1) によって得られる近似値の誤差が大きくなる。逆に言うと、狭帯域 LSPの 8番目の要 素力 3.4kHz付近にある場合、広帯域 LSPの 8番目の要素は 3.4kHz以上の周波 数に存在する可能性が高くなる、というように狭帯域 LSPから広帯域 LSPの特徴をあ る程度予 することがでさる。
[0017] つまり、(1)狭帯域 LSPは広帯域 LSPの低次半分の特徴をほぼ表現している、 (2) 広帯域 LSPと狭帯域 LSPとの間にはある程度相関があり、狭帯域 LSPが分力ると、 広帯域 LSPとしてあり得る候補をある程度絞り込むことができる、と考えられる。特に 音声信号のようなものを考えた場合、狭帯域 LSPが決まると、そのような特徴を包含 するような広帯域 LSPは、一意に決まらないながらも、ある程度絞り込まれる(例えば 狭帯域 LSPが「あ」 t ヽぅ音声信号の特徴をもつ場合、広帯域 LSPも「あ」 t ヽぅ音声 信号の特徴をもつ可能性が高ぐそのような特徴を有する LSPパラメータのパターン が存在するベクトル空間はある程度限定される)。
[0018] このような狭帯域信号力 得られる LSPと広帯域信号力 得られる LSPとの相互関 係を積極的に利用することにより、広帯域信号力 得られる LSPの量子化効率を上 げることが可能である。
[0019] 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
[0020] (実施の形態 1)
図 2は、本発明の実施の形態 1に係るスケーラブル符号ィ匕装置の主要な構成を示 すブロック図である。
[0021] 本実施の形態に係るスケーラブル符号ィ匕装置は、狭帯域-広帯域変換部 200、増 幅器 201、増幅器 202、遅延器 203、除算器 204、増幅器 205、増幅器 206、分類 器 207、多段階ベクトル量子化符号帳 208、増幅器 209、予測係数テーブル 210、 加算器 211、遅延器 212、減算器 213および誤差最小化部 214を備える。多段階べ タトル量子化符号帳 208は、初段符号帳 250、切り換えスィッチ 251、 2段目符号帳( CBb) 252、 3段目符号帳(CBc) 253および加算器 254、 255を備える。
[0022] 本実施の形態に係るスケーラブル符号ィ匕装置の各部は以下の動作を行う。 [0023] 狭帯域-広帯域変換部 200は、入力された量子化狭帯域 LSP (図示しない狭帯 域 LSP量子化器によって予め量子化された狭帯域信号の LSPパラメータ)を式(1) などを用いて広帯域 LSPパラメータに変換し、増幅器 201、遅延器 203、増幅器 20 6および分類器 207に出力する。なお、狭帯域 LSPパラメータを広帯域 LSPパラメ一 タに変換する方法について、式(1)を用いる場合に、広帯域信号と狭帯域信号との サンプリング周波数および LSP次数の関係がともに 2倍 (広帯域信号のサンプリング 周波数は狭帯域信号のサンプリング周波数の 2倍で、広帯域 LSPの分析次数も狭帯 域 LSPの分析次数の 2倍)の関係になければ、得られる広帯域 LSPパラメータと実際 の入力広帯域 LSPとの対応がとれなくなるので、両者が 2倍の関係にないときには、 広帯域 LSPパラメータを一旦自己相関係数に変換し、この自己相関係数をアップサ ンプルし、アップサンプルした自己相関係数を広帯域 LSPパラメータに再度変換す ると良い。
[0024] 以下においては、狭帯域-広帯域変換部 200で広帯域形態に変換された量子化 狭帯域 LSPパラメータのことを、変換広帯域 LSPパラメータと記載することもある。
[0025] 増幅器 201は、狭帯域—広帯域変換部 200から入力された変換広帯域 LSPパラメ ータに対して除算器 204から入力された増幅係数を乗じて、増幅器 202へ出力する
[0026] 増幅器 202は、予測係数テーブル 210から入力された予測係数 |8 (ベクトル要素
3
ごとに値をもつ)を、増幅器 201から入力された変換広帯域 LSPパラメータに乗じて、 加算器 211へ出力する。
[0027] 遅延器 203は、狭帯域—広帯域変換部 200から入力された変換広帯域 LSPパラメ ータを 1フレームの時間遅延させて除算器 204へ出力する。
[0028] 除算器 204は、遅延器 212から入力された 1フレーム前における量子化広帯域 LS
Pパラメータを、遅延器 203から入力された 1フレーム前における量子化変換広帯域
LSPパラメータで除算し、結果を増幅器 201へ出力する。
[0029] 増幅器 205は、遅延器 212から入力された 1フレーム前における量子化広帯域 LS
Pパラメータに、予測係数テーブル 210から入力される予測係数 |8 (ベクトル要素ご
2
とに値を持つ)を乗じて加算器 211へ出力する。 [0030] 増幅器 206は、狭帯域-広帯域変換部 200から入力される変換広帯域 LSPパラメ ータに、予測係数テーブル 210から入力される予測係数 |8ェ(ベクトル要素ごとに値を もつ)を乗じて、加算器 211へ出力する。
[0031] 分類器 207は、狭帯域-広帯域変換部 200から入力される変換広帯域 LSPパラメ ータを用いてクラス分類を行 ヽ、その分類されたクラスを示すクラス情報を多段階べク トル量子化符号帳 208内の切り換えスィッチ 251へ出力する。ここで、クラス分類には 、どのような方法を用いても良いが、例えば、分類器 207が、分類されるクラスの種類 の数と同じだけコードベクトルを格納した符号帳を具備して 、て、入力された変換広 帯域 LSPパラメータと前記格納されているコードベクトルとの 2乗誤差が最小となるコ ードベクトルに対応するクラス情報を出力するようにしても良い。また、この 2乗誤差に は聴覚特性を考慮した重み付けを行っても良い。なお、分類器 207の具体的な構成 例については、後述する。
[0032] 切り換えスィッチ 251は、分類器 207から入力されたクラス情報に対応付けされた サブ符号帳 (CBal〜CBan)を初段符号帳 250の中から一つ選び、そのサブ符号帳 の出力端子を加算器 254に接続する。本実施の形態では、分類器 207によって分類 されるクラス数を nとし、サブ符号帳が n種類あり、 n種類の中から指定されたクラスの サブ符号帳の出力端子に切り換えスィッチ 251が接続されるものとする。
[0033] 初段符号帳 250は、誤差最小化部 214からの指示により、指示されたコードべタト ルを切り換えスィッチ 251を介して加算器 254へ出力する。
[0034] 2段目符号帳 252は、誤差最小化部 214からの指示により、指示されたコードべタト ルを加算器 254へ出力する。
[0035] 加算器 254は、切り換えスィッチ 251から入力された初段符号帳 250のコードべタト ルと、 2段目符号帳 252から入力されたコードベクトルとを加算し、加算器 255へ出力 する。
[0036] 3段目符号帳 253は、誤差最小化部 214からの指示により、指示されたコードべタト ルを加算器 255へ出力する。
[0037] 加算器 255は、加算器 254から入力されるベクトルと、 3段目符号帳 253から入力さ れるコードベクトルとを加算し、増幅器 209へ出力する。 [0038] 増幅器 209は、加算器 255から入力されるベクトルに、予測係数テーブル 210から 入力される予測係数 α (ベクトル要素ごとに値をもつ)を乗じて、加算器 211へ出力 する。
[0039] 予測係数テーブル 210は、誤差最小化部 214からの指示により、格納している予 測係数セットの中から指示された 1セットを選び、選択した予測係数セットの中から増 幅器 202、 205、 206、 209用の係数を増幅器 202、 205、 206、 209のそれぞれに 出力する。なお、この予測係数セットは、増幅器 202、 205、 206、 209のそれぞれに 対して LSPの次数毎に用意された係数力もなる。
[0040] カロ算器 211は、増幅器 202、 205、 206、 209力らそれぞれ人力されるべク卜ノレをカロ 算し、減算器 213へ出力する。加算器 211の出力は、量子化広帯域 LSPパラメータ として図 2のスケーラブル符号ィ匕装置の外部へ出力されるとともに、遅延器 212にも 出力される。図 2のスケーラブル符号ィ匕装置の外部へ出力された量子化広帯域 LSP ノ メータは、音声信号を符号ィ匕する図示しない他のブロック等での処理に用いられ る。なお、後述する誤差最小化部 214によって、誤差を最小にするパラメータ (各符 号帳から出力されるコードベクトルおよび予測係数セット)が決定されると、そのとき加 算器 211から出力されるべ外ルが量子化広帯域 LSPパラメータとなる。量子化広帯 域 LSPパラメータは遅延器 212〖こ出力される。なお、加算器 211の出力信号を式で 表すと次式(2)のようになる。
[0041] [数 1]
Figure imgf000010_0001
ここで、
: 第 nフレームにおける量子化広帯域 L S Pの i次要素 a(i) L S Pの i次要素に対する了測係数 α
Figure imgf000010_0002
第 πフレームにおける多段階ベク トル
量子化符号帳出力べクトルの i次要素
A( : L s pの i次要素に対する予測係数 A
β2 (ί) : L S Ρの i次要素に対する予測係数/? 2
β3 (ί) : L S Ρの ί次要素に対する予測係数
"'( : 第 nフレームにおける量子化狭帯域 L S Pの i次要素 [0042] また、広帯域の量子化 LSPパラメータとして出力される LSPパラメータが安定条件( 第 n次の LSPは第 0次〜第(n— 1)次のいずれの LSPよりも大きい、すなわち、 LSP は次数の順番に値が大きくなる)を満たしていない場合は、加算器 211は、 LSPの安 定条件を満たすように操作を加える。なお、加算器 211は、隣接する量子化 LSPの 間隔が所定の間隔より狭い場合も、所定の間隔以上になるように操作する。
[0043] 減算器 213は、外部から入力される (広帯域信号を分析して得られた)、量子化タ 一ゲットとなる広帯域 LSPパラメータと、加算器 211から入力される量子化 LSPパラメ ータ候補 (量子化広帯域 LSP)と、の誤差を計算し、求まった誤差を誤差最小化部 2 14へ出力する。なお、この誤差計算は、入力された LSPベクトル間の二乗誤差で良 い。また、入力された LSPベクトルの特徴に応じて重み付けを行うようにすれば、さら に聴感上の品質を良くすることができる。例えば、 ITU— T勧告 G. 729では、 3. 2. 4章(Quantization of the LSP coefficients)の (21)式の重み付け二乗誤差(重み付け ユークリッド距離)を用いて誤差最小化を行う。
[0044] 誤差最小化部 214は、減算器 213から出力される誤差が最小となる各符号帳のコ ードベクトルおよび予測係数セットを、多段階ベクトル量子化符号帳 208および予測 係数テーブル 210のそれぞれの中から選択する。選択したパラメータ情報は符号ィ匕 され、符号化データとして出力される。
[0045] 図 3は、分類器 207の主要な構成を示すブロック図である。分類器 207は、 n個のコ ードベクトル (CV)格納部 411および切替器 412を有する分類用符号帳 410と、誤差 算出部 421と、誤差最小化部 422とを具備する。
[0046] CV格納部 411は、分類器 207において分類されるクラス数と同数すなわち n個設 けられる。 CV411— 1〜411— nはそれぞれ、分類される各クラスに対応するコード ベクトルを格納しており、切替器 412によって誤差算出部 421と接続されたときに、そ の格納するコードベクトルを切替器 412を介して誤差算出部 421に入力する。
[0047] 切替器 412は、誤差最小化部 422からの指示に応じて誤差算出部 421に接続する CV格納部 411を順次切り替えて、 CVl〜CVnを全て誤差算出部 421に入力する。
[0048] 誤差算出部 421は、狭帯域-広帯域変換部 200から入力される変換広帯域 LSP ノ ラメータと、分類用符号帳 410から入力される CVk(k= l〜n)と、の 2乗誤差を逐 次算出して誤差最小化部 422に入力する。なお、誤差算出部 421は、ベクトルのュ ークリツド距離に基づいてこの 2乗誤差を算出しても良いし、予め重み付けされたべク トルのユークリッド距離に基づいて 2乗誤差を算出しても良い。
[0049] 誤差最小化部 422は、誤差算出部 421から変換広帯域 LSPパラメータと CVkとの 2乗誤差が入力されるごとに、分類用符号帳 410から誤差算出部 421に CVk+ 1が 入力されるように切替器 412に対して指示するとともに、 CVl〜CVnについての 2乗 誤差を蓄積し、蓄積した中で最小の 2乗誤差を示すクラス情報を生成して切り換えス イッチ 251に入力する。
[0050] 以上、本実施の形態に係るスケーラブル符号ィ匕装置について詳細に説明した。
[0051] 図 4は、上記のスケーラブル符号ィ匕装置で符号化された符号ィ匕データを復号ィ匕す るスケーラブル復号ィ匕装置の主要な構成を示すブロック図である。このスケーラブル 復号化装置における符号化データの復号に関連する部分以外は、図 2のスケーラブ ル符号ィ匕装置と同じ動作をする。なお、図 2のスケーラブル符号ィ匕装置と同じ動作を する同一の構成要素には、同一の参照符号を付して、その説明を省略する。
[0052] このスケーラブル復号ィ匕装置は、狭帯域-広帯域変換部 200、増幅器 201、増幅 器 202、遅延器 203、除算器 204、増幅器 205、増幅器 206、分類器 207、多段階 ベクトル量子化符号帳 308、増幅器 209、予測係数テーブル 310、加算器 211、遅 延器 212およびパラメータ復号部 314を備える。多段階ベクトル量子化符号帳 308 は、初段符号帳 350、切り換えスィッチ 251、 2段目符号帳 (CBb) 352、 3段目符号 帳(CBc) 353および加算器 254、 255を備える。
[0053] ノ メータ復号部 314は、本実施の形態に係るスケーラブル符号ィ匕装置で符号ィ匕 された符号ィ匕データを受け取り、多段階ベクトル量子化 (VQ)符号帳 308の各段符 号帳 350、 352、 353と予測係数テーブル 310に対して、各符号帳、テーブルが出 力するべきコードベクトル、予測係数セットの情報を出力する。
[0054] 初段符号帳 350は、パラメータ復号部 314から入力された情報が示すコードべタト ルを切り換えスィッチ 251が選択したサブ符号帳(CBal〜CBan)の中から取り出し 、切り換えスィッチ 251を介して加算器 254へ出力する。
[0055] 2段目符号帳 352は、ノ メータ復号部 314から入力された情報が示すコードべク トルを取り出し、加算器 254へ出力する。
[0056] 3段目符号帳 353は、パラメータ復号部 314から入力された情報が示すコードべク トルを取り出し、加算器 255へ出力する。
[0057] 予測係数テーブル 310は、パラメータ復号部 314から入力された情報が示す予測 係数セットを取り出し、増幅器 202、 205、 206、 209へ対応する予測係数を出力す る。
[0058] ここで、多段階 VQ符号帳 308および予測係数テーブル 310に格納されているコー ドベクトルおよび予測係数セットは、図 2のスケーラブル符号ィ匕装置における多段階 VQ符号帳 208および予測係数テーブル 210と同一である。また、動作も同じである 。多段階 VQ符号帳および予測係数テーブルへ指示を送る部分が、誤差最小化部 2 14力パラメータ復号部 314かの違いだけである。
[0059] 加算器 211の出力は、量子化広帯域 LSPパラメータとして図 4のスケーラブル復号 化装置の外部へ出力されるとともに、遅延器 212へ出力される。図 4のスケーラブル 復号化装置の外部へ出力した量子化広帯域 LSPパラメータは、音声信号を復号す るブロック等での処理に用いられる。
[0060] 以上、本実施の形態に係るスケーラブル復号化装置について詳細に説明した。
[0061] このように、本実施の形態では、現在のフレームにお 、て復号ィ匕された狭帯域の量 子化 LSPパラメータを用いて、現在のフレームにおける広帯域 LSPパラメータの符号 化を適応的に行う。具体的には、量子化広帯域 LSPパラメータのクラス分類を行い、 分類されたクラスそれぞれに専用のサブ符号帳 (CBal〜CBan)を用意し、分類結 果によって前記サブ符号帳を切り換えて使用し、広帯域 LSPパラメータのベクトル量 子化を行う。この構成を採ることにより、本実施の形態によれば、既に量子化されてい る狭帯域 LSPの情報をもとに、広帯域 LSPパラメータの量子化に適した符号ィヒを行 うことができ、広帯域 LSPパラメータの量子化性能を高めることができる。
[0062] また、本実施の形態によれば、上記クラス分類は、既に符号化 (復号化)が終了して いる量子化狭帯域 LSPパラメータを用いて行なわれるので、例えば、復号化側にお いて符号ィ匕側力もクラス分類情報を別途取得する必要がない。すなわち、本実施の 形態によれば、通信の伝送レートを増加させることなしに広帯域 LSPパラメータの符 号ィ匕性能を改善することができる。
[0063] また、本実施の形態では、サブ符号帳 (CBal〜CBan)を含む多段階ベクトル量子 化符号帳 208、 308における初段符号帳 250、 350が符号化対象の基本的な特徴 を表現するように予め設計される。例えば、多段階ベクトル量子化符号帳 208、 308 において、 2段目以降は雑音的な誤差成分の符号ィ匕になるよう、平均的な成分ゃバ ィァス成分などは全て初段符号帳 250、 350に反映させるなどする。このようにすれ ば、初段符号帳 250、 350のコードベクトルの平均エネルギは 2段目以降よりも大きく なるため、多段階ベクトル量子化符号帳 208、 308で生成されるベクトルの主要成分 を初段符号帳 250、 350で表現できるようになる。
[0064] また、本実施の形態では、分類器 207でのクラス分類に応じてサブ符号帳を切り換 える符号帳は初段符号帳 250、 350のみとする、すなわち格納されたコードベクトル の平均エネルギが最大となる初段符号帳のみがサブ符号帳を有するようにする。こ のようにすれば、多段階ベクトル量子化符号帳 208、 308の有する全ての符号帳をク ラス毎に切り換える場合に比べて、コードベクトルの格納に必要なメモリ量を抑制する ことができる。さらに、このようにすれば、初段符号帳 250、 350を切り換えるだけでも 大きな切り換え効果を得ることが可能となり、広帯域 LSPパラメータの量子化性能を 効果的に改善することができる。
[0065] なお、本実施の形態では、誤差算出部 421が広帯域 LSPパラメータと分類用符号 帳 410からのコードベクトルとの 2乗誤差を算出し、誤差最小化部 422がその 2乗誤 差を蓄積して最小の誤差となるものを選択する場合について説明したが、これと等価 すなわち結果として広帯域 LSPパラメータとコードベクトルとの誤差が最小となるもの が選択されるような処理であれば、必ずしも厳密に前記 2乗誤差を算出しなくても良 い。また、演算量削減のために前記 2乗誤差の計算の一部を省略するなどして、誤 差が準最小となるベクトルを選択する処理としても良い。
[0066] (実施の形態 2)
図 5は、本発明の実施の形態 2に係るスケーラブル符号ィ匕装置またはスケーラブル 復号ィ匕装置に具備される分類器 507の主要な構成を示すブロック図である。本実施 の形態に係るスケーラブル符号ィ匕装置またはスケーラブル復号ィ匕装置は、実施の形 態 1に係るスケーラブル符号ィ匕装置またはスケーラブル復号ィ匕装置における分類器 207の代わりに分類器 507を具備するものである。したがって、本実施の形態に係る スケーラブル符号ィ匕装置またはスケーラブル復号ィ匕装置の具備する構成要素の殆 どは、実施の形態 1に係るスケーラブル符号ィ匕装置またはスケーラブル復号ィ匕装置 における構成要素と同一の動作を行うため、このような同一の動作を行う構成要素に ついては、重複を避けるため、実施の形態 1における参照符号と同一の参照符号を 付して、その説明を省略する。
[0067] 分類器 507は、 m個の CV格納部 411を有する分類用符号帳 510、誤差算出部 52 1、類似度算出部 522および分類決定部 523を具備する。
[0068] 分類用符号帳 510は、 C V格納部 411—1〜411— mそれぞれが格納する m種類 の CVを誤差算出部 521に同時に入力する。
[0069] 誤差算出部 521は、狭帯域-広帯域変換部 200から入力される変換広帯域 LSP ノ ラメータと、分類用符号帳 510から入力される CVk(k= l〜m)と、の 2乗誤差を算 出し、算出した m個の 2乗誤差を全て類似度算出部 522に入力する。なお、誤差算 出部 521は、ベクトルのユークリッド距離に基づいてこの 2乗誤差を算出しても良いし 、予め重み付けされたベクトルのユークリッド距離に基づいて 2乗誤差を算出しても良 い。
[0070] 類似度算出部 522は、誤差算出部 521から入力される m個の 2乗誤差に基づいて 、誤差算出部 521に入力される変換広帯域 LSPパラメータと、分類用符号帳 510か ら入力される CVl〜CVmと、の類似度を算出し、算出した類似度を分類決定部 523 に入力する。具体的には、類似度算出部 522は、誤差算出部 521から入力される m 個の 2乗誤差それぞれについて、例えば類似度が最低の「0」から最高の「K— 1」ま での Κ個のランクにスカラ量子化することにより、その m個の 2乗誤差を類似度 k (i) , i = 0〜K—1に変換する。
[0071] 分類決定部 523は、類似度算出部 522から入力される類似度 k(i) , i=0〜K— 1 を用いてクラス分類を行 ヽ、分類されたクラスを示すクラス情報を生成して切り換えス イッチ 251に入力する。ここで、分類決定部 523は、例えば次式(3)を用いてクラス分 類を行う。 [0072] [数 2]
Figure imgf000016_0001
[0073] このように、本実施の形態によれば、類似度算出部 522において、類似度が m個の 2乗誤差のスカラ量子化結果力 算出されるため、その算出に要する演算量を少なく 抑えることができる。また、本実施の形態によれば、類似度算出部 522において、 m 個の 2乗誤差が K個のランクで表される類似度に変換されるため、 CV1から CVmま での間の中間的な CVを生成できることから、 CV格納部 411の種類数 mが少なくても 、分類器 507によって分類されるクラスの数を増やすことができる。換言すれば、本実 施の形態によれば、分類器 507から切り換えスィッチ 251に入力されるクラス情報の 品質を低下させることなぐ分類用符号帳 510におけるコードベクトルの格納用メモリ 量を削減することができる。
[0074] (実施の形態 3)
図 6は、本発明の実施の形態 3に係るスケーラブル音声符号ィ匕装置の主要な構成 を示すブロック図である。
[0075] 本実施の形態に係るスケーラブル音声符号ィ匕装置は、ダウンサンプル処理部 601 、 LP分析部 (NB) 602、 LPC量子化部 (NB) 603、音源符号化部 (NB) 604、プリエ ンフアシスフィルタ 605、 LP分析部(WB) 606、 LPC量子化部(WB) 607、音源符号 化部 (WB) 608、多重化部 609を備える。
[0076] ダウンサンプル処理部 601は、入力された広帯域信号に対して、デシメーシヨンと L PF (低域通過フィルタ)処理を組み合わせた一般的なダウンサンプリング処理を行!ヽ 、狭帯域信号を LP分析部 (NB) 602および音源符号ィ匕部 (NB) 604にそれぞれ出 力する。
[0077] LP分析部 (NB) 602は、ダウンサンプル処理部 601から入力された狭帯域信号の 線形予測分析を行い、線形予測係数を LPC量子化部 (NB) 603に出力する。
[0078] LPC量子化部(NB) 603は、 LP分析部(NB) 602から入力された線形予測係数の 量子化を行い、符号ィ匕情報を多重化部 609へ出力するとともに、量子化された線形 予測パラメータを LPC量子化部 (WB) 607および音源符号ィ匕部 (NB) 604にそれぞ れ出力する。ここで、 LPC量子化部 (NB) 603は、線形予測係数を LSP (LSF)等の スペクトルパラメータに変換して力 量子化処理を行う。 LPC量子化部(NB) 603か ら出力される量子化線形予測パラメータは、スペクトルパラメータでも線形予測係数 でもよい。
[0079] 音源符号化部 (NB) 604は、 LPC量子化部 (NB) 603から入力された線形予測パ ラメータを線形予測係数に変換し、得られた線形予測係数に基づく線形予測フィル タを構築する。構築した線形予測フィルタによって合成される信号とダウンサンプル 処理部 601から入力される狭帯域信号との誤差を最小とするように線形予測フィルタ の駆動音源信号の符号化を行い、音源符号ィ匕情報を多重化部 609へ出力し、復号 音源信号 (量子化音源信号)を音源符号ィ匕部 (WB) 608へ出力する。
[0080] プリエンファシスフィルタ 605は、入力された広帯域信号の高域強調処理 (伝達関 数は μ:フィルタ係数、 ζ_1 : ζ変換における複素変数で遅延演算子と呼ば れる)を行い、 LP分析部 (WB) 606および音源符号ィ匕部 (WB) 608に出力する。
[0081] LP分析部(WB) 606は、プリエンファシスフィルタ 605から入力されたプリエンファ シス後の広帯域信号の線形予測分析を行 1ヽ、線形予測係数を LPC量子化部 (WB) 607へ出力する。
[0082] LPC量子化部 (WB) 607は、 LP分析部 (WB) 606から入力された線形予測係数 を LSP (LSF)等のスペクトルパラメータに変換し、得られたスペクトルパラメータと LP C量子化部 (NB) 603から入力された量子化線形予測パラメータ (狭帯域)とを用い て、例えば後述するスケーラブル符号ィ匕装置を用いて、線形予測パラメータ (広帯域 )の量子化処理を行い、符号ィ匕情報を多重化部 609へ出力するとともに、量子化され た線形予測パラメータを音源符号ィ匕部 (WB) 608へ出力する。
[0083] 音源符号化部 (WB) 608は、 LPC量子化部 (WB) 607から入力された量子化線形 予測パラメータを線形予測係数に変換し、得られた線形予測係数に基づく線形予測 フィルタを構築する。構築した線形予測フィルタによって合成される信号とプリェンフ アシスフィルタ 605から入力される広帯域信号との誤差を最小とするように前記線形 予測フィルタの駆動音源信号の符号化を行 ヽ、音源符号化情報を多重化部 609へ 出力する。広帯域信号の音源符号ィ匕においては、音源符号ィ匕部 (NB) 604から入 力される狭帯域信号の復号音源信号 (量子化音源信号)を利用すると効率的な符号 化を行うことができる。
[0084] 多重化部 609は、 LPC量子化部(NB) 603、音源符号化部(NB) 604、 LPC量子 化部 (WB) 607および音源符号ィ匕部 (WB) 608から入力された各種符号ィ匕情報の 多重化を行い、多重化信号を伝送路へ送出する。
[0085] 図 7は、本発明の実施の形態 3に係るスケーラブル音声復号ィ匕装置の主要な構成 を示すブロック図である。
[0086] 本実施の形態に係るスケーラブル音声復号ィ匕装置は、多重分離部 700、 LPC復 号化部 (NB) 701、音源復号化部 (NB) 702、 LP合成部 (NB) 703、 LPC復号化部 (WB) 704、音源復号化部(WB) 705、 LP合成部(WB) 706、デエンファシスフィル タ 707を備える。
[0087] 多重分離部 700は、本実施の形態に係るスケーラブル音声符号化装置からから送 出された多重化信号を受信し、各種符号ィ匕情報に分離した後、量子化狭帯域線形 予測係数符号ィ匕情報を LPC復号ィ匕部 (NB) 701へ、狭帯域音源符号化情報を音源 復号化部 (NB) 702へ、量子化広帯域線形予測係数符号ィ匕情報は LPC復号ィ匕部( WB) 704へ、広帯域音源符号化情報は音源復号化部 (WB) 705へそれぞれ出力 する。
[0088] LPC復号化部 (NB) 701は、多重分離部 700から入力された量子化狭帯域線形 予測符号化情報の復号処理を行い、量子化狭帯域線形予測係数を復号し、 LP合 成部 (NB) 703および LPC復号ィ匕部 (WB) 704へ出力する。ただし、スケーラブル 音声符号化装置にお!、て述べたように、量子化は線形予測係数を LSP (または LSF )に変換して行われているので、この復号によって得られる情報は線形予測係数その ものではなぐ LSPパラメータである。復号 LSPパラメータは、 LP合成部(NB) 703 および LPC復号ィ匕部 (WB) 704へ出力される。
[0089] 音源復号化部 (NB) 702は、多重分離部 700から入力された狭帯域音源符号ィ匕情 報の復号処理を行!ヽ、 LP合成部 (NB) 703および音源復号ィ匕部 (WB) 705へ出力 する。
[0090] LP合成部(NB) 703は、 LPC復号化部(NB) 701から入力された復号 LSPパラメ ータを線形予測係数に変換し、これを用いて線形予測フィルタを構築し、音源復号 化部 (NB) 702から入力された復号狭帯域音源信号を線形予測フィルタの駆動音源 信号として、狭帯域信号を生成する。
[0091] LPC復号化部 (WB) 704は、多重分離部 700から入力された量子化広帯域線形 予測係数符号ィ匕情報と、 LPC復号化部 (NB) 701から入力された狭帯域の復号 LS Pパラメータとを用いて、例えば後述するスケーラブル復号ィ匕装置を用いて広帯域の LSPパラメータを復号し、 LP合成部 (WB) 706へ出力する。
[0092] 音源復号化部 (WB) 705は、多重分離部 700から入力された広帯域音源符号ィ匕 情報と、音源復号ィ匕部 (NB) 702から入力された復号狭帯域音源信号とを用いて、 広帯域音源信号を復号し、 LP合成部 (WB) 706へ出力する。
[0093] LP合成部 (WB) 706は、 LPC復号化部 (WB) 704から入力された復号広帯域 LS Pパラメータを線形予測係数に変換し、これを用いて線形予測フィルタを構築し、音 源復号化部 (WB) 705から入力した復号広帯域音源信号を線形予測フィルタの駆 動音源信号として、広帯域信号を生成し、デエンファシスフィルタ 707へ出力する。
[0094] デエンファシスフィルタ 707は、スケーラブル音声符号化装置のプリエンファシスフ ィルタ 605と逆特性のフィルタである。デエンファシスされた信号は復号された広帯域 信号として出力される。
[0095] なお、低域部は LP合成部 (NB) 703によって生成された狭帯域信号をアップサン プルして得られるものを用いるようにして広帯域信号を復号することも可能である。こ の場合、デエンファシスフィルタ 707から出力された広帯域信号を適切な周波数特 性を有する高域通過フィルタにかけ、前記アップサンプルした狭帯域信号と加算する ようにすれば良い。狭帯域信号にはポストフィルタをかけて聴覚的な品質を改善する となお良い。
[0096] 図 8は、 LPC量子化部(WB) 607の主要な構成を示すブロック図である。 LPC量子 化部 (WB) 607は、狭帯域-広帯域変換部 200、 LSP— LPC変換部 800、プリェン フアシス部 801、 LPC—LSP変換部 802、予測量子化部 803を備える。予測量子化 部 803は、増幅器 201、増幅器 202、遅延器 203、除算器 204、増幅器 205、増幅 器 206、分類器 207、多段階ベクトル量子化符号帳 208、増幅器 209、予測係数テ 一ブル 210、加算器 211、遅延器 212、減算器 213および誤差最小化部 214を備え る。多段階ベクトル量子化符号帳 208は、初段符号帳 250、切り換えスィッチ 251、 2 段目符号帳 (CBb) 252、 3段目符号帳 (CBc) 253および加算器 254、 255を備える
[0097] 図 8に示したスケーラブル符号化装置(LPC量子化部(WB) 607)は、 LSP— LPC 変換部 800、プリエンファシス部 801および LPC—LSP変換部 802が図 2のスケーラ ブル符号ィ匕装置に新たに追加されたものである。したがって、本実施の形態に係るス ケーラブル符号ィ匕装置の具備する構成要素の殆どは、実施の形態 1に係るスケーラ ブル符号ィ匕装置における構成要素と同一の動作を行うため、このような同一の動作 を行う構成要素については、重複を避けるため、実施の形態 1における参照符号と同 一の参照符号を付して、その説明を省略する。
[0098] LPC量子化部 (NB) 603から入力された量子化線形予測パラメータ (ここでは量子 化狭帯域 LSP)は、狭帯域-広帯域変換部 200において広帯域 LSPパラメータに 変換され、変換広帯域 LSPパラメータ (広帯域形態に変換された量子化狭帯域 LSP パラメータ)が LSP— LPC変換部 800へ出力される。
[0099] LSP—LPC変換部 800は、狭帯域-広帯域変換部 200から入力された変換広帯 域 LSPパラメータ(量子化線形予測パラメータ)を線形予測係数 (量子化狭帯域 LPC )に変換し、プリエンファシス部 801へ出力する。
[0100] プリエンファシス部 801は、 LSP— LPC変換部 800から入力された線形予測係数 から、後述するような方法を用いて、プリエンファシスされた線形予測係数を算出し、 LPC— LSP変換部 802へ出力する。
[0101] LPC— LSP変換部 802は、プリエンファシス部 801から入力されたプリエンファシス された線形予測係数を、プリエンファシスされた量子化狭帯域 LSPに変換し、予測量 子化部 803へ出力する。
[0102] 予測量子化部 803は、 LPC—LSP変換部 802から入力されたプリエンファシスされ た量子化狭帯域 LSPを量子化広帯域 LSPに変換し、予測量子化部 803の外部へ 出力する。予測量子化部 803は、量子化広帯域 LSPを出力するものであればどのよ うな構成でも良いが、本実施の形態では、例として実施の形態 1の図 2に示した 201 〜212を構成要素としている。
[0103] 図 9は、 LPC復号化部(WB) 704の主要な構成を示すブロック図である。 LPC復号 化部 (WB) 704は、狭帯域—広帯域変換部 200、 LSP— LPC変換部 800、プリェン フアシス部 801、 LPC— LSP変換部 802、 LSP復号部 903を備える。 LSP復号部 90 3は、増幅器 201、増幅器 202、遅延器 203、除算器 204、増幅器 205、増幅器 206 、分類器 207、多段階ベクトル量子化符号帳 308、増幅器 209、予測係数テーブル 310、加算器 211、遅延器 212およびパラメータ復号部 314を備える。多段階べタト ル量子化符号帳 308は、初段符号帳 350、切り換えスィッチ 251、 2段目符号帳 (CB b) 352、 3段目符号帳(CBc) 353および加算器 254、 255を備える。
[0104] 図 9に示したスケーラブル復号ィ匕装置 (LPC復号化部 (WB) 704)は、図 8に示した LSP— LPC変換部 800、プリエンファシス部 801および LPC—LSP変換部 802が 図 4のスケーラブル復号ィ匕装置に新たに追加されたものである。したがって、本実施 の形態に係るスケーラブル音声復号ィ匕装置の具備する構成要素の殆どは、実施の 形態 1に係るスケーラブル復号ィ匕装置における構成要素と同一の動作を行うため、こ のような同一の動作を行う構成要素については、重複を避けるため、実施の形態 1に おける参照符号と同一の参照符号を付して、その説明を省略する。
[0105] LPC復号化部 (NB) 701から入力された量子化狭帯域 LSPは、狭帯域-広帯域 変換部 200にお ヽて広帯域 LSPパラメータに変換され、変換広帯域 LSPパラメータ (広帯域形態に変換された量子化狭帯域 LSPパラメータ)が LSP— LPC変換部 800 へ出力される。
[0106] LSP—LPC変換部 800は、狭帯域-広帯域変換部 200から入力された変換広帯 域 LSPパラメータ (変換後の量子化狭帯域 LSP)を線形予測係数 (量子化狭帯域 LP
C)に変換し、プリエンファシス部 801へ出力する。
[0107] プリエンファシス部 801は、 LSP— LPC変換部 800から入力された線形予測係数 から、後述するような方法を用いて、プリエンファシスされた線形予測係数を算出し、
LPC— LSP変換部 802へ出力する。
[0108] LPC— LSP変換部 802は、プリエンファシス部 801から入力されたプリエンファシス された線形予測係数を、プリエンファシスされた量子化狭帯域 LSPに変換し、 LSP復 号部 903へ出力する。
[0109] LSP復号部 903は、 LPC—LSP変換部 802から入力されたプリエンファシスされた 復号 (量子化)狭帯域 LSPを量子化広帯域 LSPに変換し、 LSP復号部 903の外部 へ出力する。 LSP復号部 903は、量子化広帯域 LSPを出力するものであり、予測量 子化部 803と同一の量子化広帯域 LSPを出力するものであればどのような構成でも 良いが、本実施の形態では、例として実施の形態 1の図 4に示した 201〜207, 308 , 209, 310, 211, 212を構成要素として! /、る。
[0110] 図 10は、プリエンファシス部 801における処理手順の一例を示すフロー図である。
図 10において、ステップ (以下、「ST」と省略する) 1001では、入力した量子化狭帯 域 LPCで構成される LP合成フィルタのインパルス応答を算出し、 ST1002では、 ST 1001において算出したインパルス応答にプリエンファシスフィルタ 605のインパルス 応答を畳み込んで「プリエンファシスされた、 LP合成フィルタのインパルス応答」を算 出する。
[0111] ST1003では、 ST1002において算出された「プリエンファシスされた、 LP合成フィ ルタのインパルス応答」の自己相関係数を算出し、 ST1004では、自己相関係数を L PCに変換し、プリエンファシスされた量子化狭帯域 LPCを出力する。
[0112] なお、プリエンファシスするとは、スペクトルの傾きの影響を回避するために予めス ベクトルの傾きを平坦ィ匕する処理のことであるため、プリエンファシス部 801における 処理は、図 10に記載された具体的な処理方法に限定されるものではなぐ他の処理 方法でプリエンファシスを実施してもよ!/、。
[0113] このように本実施の形態では、プリエンファシス処理を行うことにより、狭帯域 LSFか ら広帯域 LSFを予測する際の予測性能が向上し、量子化性能が改善される。特に、 このようなプリエンファシス処理を図 6に示した構成を有するスケーラブル音声符号ィ匕 装置に導入することにより、人間の聴覚特性に適した音声符号ィ匕を行うことが可能と なり、符号化音声の主観的な品質が改善される。
[0114] (実施の形態 4)
図 11は、本発明の実施の形態 4に係るスケーラブル符号ィ匕装置の主要な構成を示 すブロック図である。図 11に示したスケーラブル符号ィ匕装置は、図 6に示した LPC量 子化部 (WB) 607に適用することができる。各ブロックの動作は図 8で示したものと同 一であるので、同じ番号を付して、説明を省略する。ただし、プリエンファシス部 801 と LPC—LSP変換部 802については、動作は同じであるが、入出力のパラメータは 狭帯域一広帯域変換される前の段階で行われる点が異なる。
[0115] 実施の形態 3の図 8と本実施の形態の図 11との違いは、以下に述べるとおりである 。狭帯域信号 (低速サンプリングレート)の領域でプリエンファシスを行うのが図 11で あり、広帯域信号 (高速サンプリングレート)の領域でプリエンファシスを行うのが図 8 である。図 11に示した構成では、サンプリングレートが低いので演算量の増加が少な くて済むという利点がある。なお、図 8で用いるプリエンファシスの係数 は、あらかじ め適正な値(図 6のプリエンファシスフィルタ 605の μと異なり得る値)に調整しておく ことが好ましい。
[0116] また、図 11では、量子化狭帯域 LPC (線形予測係数)が入力されるので、図 6の LP C量子化部 (NB) 603から出力される量子化線形予測パラメータは LSPではなぐ線 形予測係数である。
[0117] 図 12は、本発明の実施の形態 4に係るスケーラブル復号ィ匕装置の主要な構成を示 すブロック図である。図 12に示したスケーラブル復号ィ匕装置は、図 7に示した LPC復 号化部 (WB) 704に適用することができる。各ブロックの動作は図 9で示したものと同 一であるので、同じ番号を付して、説明を省略する。
[0118] また、プリエンファシス部 801と LPC—LSP変換部 802の動作については、図 11に ついて説明したものと同一であるので、説明を省略する。
[0119] また、図 12では、量子化狭帯域 LPC (線形予測係数)が入力されるので、図 7の LP C復号化部 (NB) 701から出力される量子化線形予測パラメータは LSPではなぐ線 形予測係数である。
[0120] 実施の形態 3の図 9と本実施の形態の図 12との違いは、上記で説明した、図 8と図
12との違いと同様である。
[0121] 以上、本発明の実施の形態について説明した。
[0122] なお、本発明に係るスケーラブル符号ィ匕装置は、ダウンサンプル処理部 601にお いてダウンサンプルを行わずに帯域制限フィルタリング処理のみを行う構成としてもよ い。この場合、サンプリング周波数は同じで信号の帯域幅のみが異なる狭帯域信号 と広帯域信号とのスケーラブルな符号ィ匕が行われることとなり、狭帯域一広帯域変換 部 200の処理が不要となる。
[0123] なお、本発明に係るスケーラブル音声符号ィ匕装置は、上記の実施の形態 3, 4に限 定されず、種々変更して実施することが可能である。例えば用いられるプリェンファシ スフィルタ 605の伝達関数は 1 z— 1とした力 他の適切な特性を有するフィルタを 用いた構成も可能である。
[0124] なお、本発明に係るスケーラブル符号ィ匕装置およびスケーラブル復号ィ匕装置は、 上記の実施の形態 1〜4に限定されず、種々変更して実施することが可能である。例 えば、構成要素 201〜205、 212の全てまたは一部を取り除いた構成でも実施する ことが可能である。
[0125] 本発明に係るスケーラブル符号ィ匕装置およびスケーラブル復号ィ匕装置は、移動体 通信システムにおける通信端末装置および基地局装置に搭載することも可能であり 、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供 することができる。
[0126] なお、ここでは、 LSPパラメータを符号ィ匕 Z復号ィ匕する場合について説明した力 I SP (immittanceSpectrum Pairs)パラメータについても本発明は適用可能である。
[0127] また、上記各実施の形態において、狭帯域信号はサンプリング周波数 8kHzの音 響信号 (一般的には、 3.4kHz帯域の音響信号)のことを指すとともに、広帯域信号は 狭帯域信号より広い帯域幅を有する音響信号 (例えば、サンプリング周波数 16kHz での帯域幅 7kHzの音響信号)のことを指し、それぞれ代表的には狭帯域音声信号 及び広帯域音声信号のことを指して!/ヽるが、狭帯域信号及び広帯域信号は必ずしも これらに限定されるものではない。
[0128] また、ここでは、現フレームの狭帯域の量子化 LSPパラメータを用いたクラス分類方 法としてベクトル量子化手法を用いる例を示したが、反射係数や対数断面積比など のパラメータに変換してクラス分類に用いても良 、。
[0129] また、上記クラス分類をベクトル量子化の手法に用いる場合においても、量子化 LS Pパラメータの全次数を用いずに低次側の限定された次数のみでおこなうようにして も良い。あるいは、量子化 LSPパラメータの次数を下げたものに変換して力もクラス分 類を行っても良い。このようにすることで、クラス分類導入による演算量とメモリ量の増 加を抑えることが可能となる。
[0130] また、ここでは、多段階ベクトル量子化の符号帳構成は 3段階としたが、 2段階以上 であれば何段階であっても良い。また、一部の段階が分割ベクトル量子化になってい たり、スカラ量子化になっていたりしても良い。また、多段階構成となっておらず、分 割構成となっている場合にも適用できる。
[0131] また、多段階ベクトル量子化符号帳は、予測係数テーブルのセットごとに異なる符 号帳を具備し、異なる予測係数テーブルには異なる多段階ベクトル量子化符号帳を 組み合わせて使う構成とすると、さらに量子化性能が上がる。
[0132] また、上記各実施の形態において、予測係数テーブル 210、 310は、分類器 207 の出力するクラス情報に対応する予測係数テーブルを予め用意しておき、それらを 切り換えて出力するようにしても良い。つまり、予測係数テーブル 210、 310は、切り 換えスィッチ 251が分類器 207から入力されたクラス情報に応じてサブ符号帳 (CBa l〜CBan)を初段符号帳 250の中力も一つ選択するように、予測係数テーブルを切 り換えて出力するようにしても良い。
[0133] さらに、上記各実施の形態において、初段符号帳 250を切り換えないで、予測係数 テーブル 210、 310の有する予測係数テーブルだけを切り換えるようにしても良いし
、初段符号帳 250と予測係数テーブル 210、 310の有する予測係数テーブルとの双 方を同時に切り換えるようにしても良い。
[0134] また、ここでは、本発明をノヽードウエアで構成する場合を例にとって説明した力 本 発明はソフトウェアで実現することも可能である。
[0135] また、ここでは、狭帯域量子化 LSPパラメータを広帯域量子化 LSPパラメータに変 換したものを用いてクラス分類を行う例を示したが、変換前の狭帯域 LSPパラメータ を用いてクラス分類を行うことも可能である。
[0136] なお、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路 である LSIとして実現される。これらは個別に 1チップ化されても良いし、一部又は全 てを含むように 1チップィ匕されても良い。 [0137] ここでは、 LSIとした力 集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥ ノレ卜ラ LSIと呼称されることちある。
[0138] また、集積回路化の手法は LSIに限るものではなぐ専用回路又は汎用プロセッサ で実現しても良い。 LSI製造後に、プログラムすることが可能な FPGA (Field Program mable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィ ギュラブノレ ·プロセッサーを利用しても良 、。
[0139] さらには、半導体技術の進歩又は派生する別技術により LSIに置き換わる集積回 路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行って も良い。バイオ技術の適応等が可能性としてありえる。
[0140] 本明細書は、 2004年 9月 17日出願の特願 2004— 272481、 2004年 11月 12日 出願の特願 2004— 329094及び 2005年 9月 2日出願の特願 2005— 255242に 基づくものである。この内容は全てここに含めておく。
産業上の利用可能性
[0141] 本発明に係るスケーラブル符号ィ匕装置、スケーラブル復号ィ匕装置、スケーラブル符 号化方法、およびスケーラブル復号ィ匕方法は、移動体通信システムやインターネット プロトコルを用いたパケット通信システム等における通信装置等の用途に適用できる

Claims

請求の範囲
[1] 狭帯域の量子化 LSPパラメータを用いて広帯域の LSPパラメータの予測量子化を 行うスケーラブル符号ィ匕装置であって、
量子化狭帯域 LSPパラメータに対してプリエンファシスを行うプリエンファシス手段 を有し、
前記プリエンファシスされた量子化狭帯域 LSPパラメータを前記予測量子化に用
V、るスケーラブル符号ィ匕装置。
[2] 前記プリエンファシスされた量子化狭帯域 LSPパラメータを、広帯域形態である第
1の広帯域 LSPパラメータに変換して、前記予測量子化に用いる力、あるいは、 広帯域形態に変換された状態の前記量子化狭帯域 LSPパラメータを前記プリェン フアシス手段に用いて生成された第 2の広帯域 LSPパラメータを、前記プリェンファシ スされた量子化狭帯域 LSPパラメータとして、前記予測量子化に用いる、請求項 1記 載のスケーラブル符号ィ匕装置。
[3] 前記第 1または第 2の広帯域 LSPパラメータを用いてクラス分類を行いクラス情報を 生成するクラス分類手段と、
複数の符号帳を有し、前記複数の符号帳のうち少なくとも 1つの符号帳は複数のサ ブ符号帳を有し、前記複数のサブ符号帳のうち前記クラス情報に応じたサブ符号帳 を選択的に用いて多段階ベクトル量子化を行う多段階ベクトル量子化符号帳と、を 更に具備する請求項 2記載のスケーラブル符号ィ匕装置。
[4] 前記多段階ベクトル量子化符号帳は、複数の符号帳を有し、前記複数の符号帳の うち、格納されたコードベクトルの平均エネルギが最大となる符号帳に複数のサブ符 号帳を有し、前記複数のサブ符号帳のうち前記クラス情報に応じたサブ符号帳を選 択的に用いて多段階ベクトル量子化を行う、請求項 3記載のスケーラブル符号ィ匕装 置。
[5] 前記多段階ベクトル量子化符号帳は、複数の符号帳を有し、前記複数の符号帳の うち、多段階ベクトル量子化の初段に用いる符号帳に複数のサブ符号帳を有し、前 記複数のサブ符号帳のうち前記クラス情報に応じたサブ符号帳を選択的に用いて多 段階ベクトル量子化を行う、請求項 3記載のスケーラブル符号化装置。
[6] 前記多段階ベクトル量子化符号帳は、
前記クラス情報に応じて前記複数のサブ符号帳力 選択するサブ符号帳を切り換 える切り換え手段を更に有する、請求項 3記載のスケーラブル符号化装置。
[7] 前記クラス分類手段は、複数のコードベクトルを格納しており、前記広帯域 LSPパ ラメータとの誤差が最小の前記コードベクトルを特定することによってクラス分類を行
V、クラス情報を生成する、請求項 3記載のスケーラブル符号化装置。
[8] 前記クラス分類手段は、複数のコードベクトルを格納しており、前記広帯域 LSPパ ラメータと前記複数のコードベクトルとの誤差をそれぞれ量子化し、量子化された複 数の前記誤差に基づ 、てクラス分類を行 、クラス情報を生成する、請求項 3記載のス ケーラブル符号化装置。
[9] 請求項 1記載のスケーラブル符号ィ匕装置を具備する通信端末装置。
[10] 請求項 1記載のスケーラブル符号化装置を具備する基地局装置。
[11] 狭帯域の量子化 LSPパラメータを用いて広帯域の LSPパラメータを復号するスケ 一ラブル復号ィ匕装置であって、
復号された量子化狭帯域 LSPパラメータに対してプリエンファシスを行うプリェンフ アシス手段を有し、
前記プリエンファシスされた量子化狭帯域 LSPパラメータを前記広帯域の LSPパラ メータの復号に用いるスケーラブル復号ィ匕装置。
[12] 前記プリエンファシスされた量子化狭帯域 LSPパラメータを、広帯域形態である第 1の広帯域 LSPパラメータに変換して、前記広帯域の LSPパラメータの復号に用いる 力 あるいは、
広帯域形態に変換された状態の前記復号された量子化狭帯域 LSPパラメータを前 記プリエンファシス手段に用いて生成された第 2の広帯域 LSPパラメータを、前記プ リエンファシスされた量子化狭帯域 LSPパラメータとして、前記広帯域の LSPパラメ 一タの復号に用いる、請求項 11記載のスケーラブル復号ィ匕装置。
[13] 前記第 1または第 2の広帯域 LSPパラメータを用いてクラス分類を行いクラス情報を 生成するクラス分類手段と、
複数の符号帳を有し、前記複数の符号帳のうち少なくとも 1つの符号帳は複数のサ ブ符号帳を有し、前記複数のサブ符号帳のうち前記クラス情報に応じたサブ符号帳 を選択的に用いて多段階ベクトル量子化を行う多段階ベクトル量子化符号帳と、を 更に具備する請求項 12記載のスケーラブル復号ィ匕装置。
[14] 前記多段階ベクトル量子化符号帳は、複数の符号帳を有し、前記複数の符号帳の うち、格納されたコードベクトルの平均エネルギが最大となる符号帳に複数のサブ符 号帳を有し、前記複数のサブ符号帳のうち前記クラス情報に応じたサブ符号帳を選 択的に用 、て多段階ベクトル量子化を行う、請求項 13記載のスケーラブル復号ィ匕装 置。
[15] 前記多段階ベクトル量子化符号帳は、複数の符号帳を有し、前記複数の符号帳の うち、多段階ベクトル量子化の初段に用いる符号帳に複数のサブ符号帳を有し、前 記複数のサブ符号帳のうち前記クラス情報に応じたサブ符号帳を選択的に用いて多 段階ベクトル量子化を行う、請求項 13記載のスケーラブル復号ィ匕装置。
[16] 前記多段階ベクトル量子化符号帳は、
前記クラス情報に応じて前記複数のサブ符号帳力 選択するサブ符号帳を切り換 える切り換え手段を更に有する、請求項 13記載のスケーラブル復号ィ匕装置。
[17] 前記クラス分類手段は、複数のコードベクトルを格納しており、前記広帯域 LSPパ ラメータとの誤差が最小の前記コードベクトルを特定することによってクラス分類を行 いクラス情報を生成する、請求項 13記載のスケーラブル復号ィ匕装置。
[18] 前記クラス分類手段は、複数のコードベクトルを格納しており、前記広帯域 LSPパ ラメータと前記複数のコードベクトルとの誤差をそれぞれ量子化し、量子化された複 数の前記誤差に基づいてクラス分類を行いクラス情報を生成する、請求項 13記載の スケーラブル復号ィ匕装置。
[19] 請求項 11記載のスケーラブル復号化装置を具備する通信端末装置。
[20] 請求項 11記載のスケーラブル復号化装置を具備する基地局装置。
[21] 狭帯域の量子化 LSPパラメータを用いて広帯域の LSPパラメータの予測量子化を 行うスケーラブル符号ィ匕方法であって、
量子化狭帯域 LSPパラメータに対してプリエンファシスを行うプリエンファシスステツ プと、 前記プリエンファシスされた量子化狭帯域 LSPパラメータを用いて前記予測量子化 を行う量子化ステップと、
を有するスケーラブル符号化方法。
[22] 前記プリエンファシスされた量子化狭帯域 LSPパラメータを、広帯域形態である第 1の広帯域 LSPパラメータに変換して、前記予測量子化に用いる力、あるいは、 広帯域形態に変換された状態の前記量子化狭帯域 LSPパラメータを前記プリェン フアシスステップに用いて生成された第 2の広帯域 LSPパラメータを、前記プリェンフ アシスされた量子化狭帯域 LSPパラメータとして、前記予測量子化に用いる、請求項 21記載のスケーラブル符号ィ匕方法。
[23] 前記第 1または第 2の広帯域 LSPパラメータを用いてクラス分類を行いクラス情報を 生成するクラス分類ステップと、
前記クラス情報に応じて、一つの符号帳に格納された複数のサブ符号帳力 選択 するサブ符号帳を切り換えるサブ符号帳切り換えステップと、を更に有する請求項 22 記載のスケーラブル符号ィ匕方法。
[24] 狭帯域の量子化 LSPパラメータを用いて広帯域の LSPパラメータを復号するスケ 一ラブル復号ィ匕方法であって、
復号された量子化狭帯域 LSPパラメータに対してプリエンファシスを行うプリェンフ アシスステップと、
前記プリエンファシスされた量子化狭帯域 LSPパラメータを用いて前記広帯域の L SPパラメータの復号を行う LSPパラメータ復号ステップと、を有するスケーラブル復 号化方法。
[25] 前記プリエンファシスされた量子化狭帯域 LSPパラメータを、広帯域形態である第 1の広帯域 LSPパラメータに変換して、前記広帯域の LSPパラメータの復号に用いる 力 あるいは、
広帯域形態に変換された状態の前記復号された量子化狭帯域 LSPパラメータを前 記プリエンファシスステップに用いて生成された第 2の広帯域 LSPパラメータを、前記 プリエンファシスされた量子化狭帯域 LSPパラメータとして、前記広帯域の LSPパラ メータの復号に用いる、請求項 24記載のスケーラブル復号ィ匕方法。 前記第 1または第 2の広帯域 LSPパラメータを用いてクラス分類を行 、クラス情報を 生成するクラス分類ステップと、
前記クラス情報に応じて、一つの符号帳に格納された複数のサブ符号帳から選択 するサブ符号帳を切り換えるサブ符号帳切り換えステップと、を更に有する請求項 25 記載のスケーラブル復号ィ匕方法。
PCT/JP2005/017054 2004-09-17 2005-09-15 スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置 WO2006030865A1 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
US11/575,257 US7848925B2 (en) 2004-09-17 2005-09-15 Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus
JP2006535201A JP4963963B2 (ja) 2004-09-17 2005-09-15 スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法
EP05783539A EP1791116B1 (en) 2004-09-17 2005-09-15 Scalable voice encoding apparatus, scalable voice decoding apparatus, scalable voice encoding method, scalable voice decoding method, communication terminal apparatus, and base station apparatus
CN2005800315316A CN101023471B (zh) 2004-09-17 2005-09-15 可伸缩性编码装置、可伸缩性解码装置、可伸缩性编码方法、可伸缩性解码方法、通信终端装置以及基站装置
BRPI0515453-7A BRPI0515453A (pt) 2004-09-17 2005-09-15 aparelho de codificação escalável, aparelho de decodificação escalável, método de codificação escalável método de decodificação escalável, aparelho de terminal de comunicação, e aparelho de estação de base
AT05783539T ATE534990T1 (de) 2004-09-17 2005-09-15 Skalierbare sprachcodierungsvorrichtung, skalierbare sprachdecodierungsvorrichtung, skalierbares sprachcodierungsverfahren, skalierbares sprachdecodierungsverfahren, kommunikationsendgerät und basisstationsgerät
US12/913,799 US8712767B2 (en) 2004-09-17 2010-10-28 Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2004272481 2004-09-17
JP2004-272481 2004-09-17
JP2004-329094 2004-11-12
JP2004329094 2004-11-12
JP2005255242 2005-09-02
JP2005-255242 2005-09-02

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US11/575,257 A-371-Of-International US7848925B2 (en) 2004-09-17 2005-09-15 Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus
US12/913,799 Continuation US8712767B2 (en) 2004-09-17 2010-10-28 Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus

Publications (1)

Publication Number Publication Date
WO2006030865A1 true WO2006030865A1 (ja) 2006-03-23

Family

ID=36060115

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/017054 WO2006030865A1 (ja) 2004-09-17 2005-09-15 スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置

Country Status (8)

Country Link
US (2) US7848925B2 (ja)
EP (2) EP2273494A3 (ja)
JP (2) JP4963963B2 (ja)
KR (1) KR20070051910A (ja)
CN (2) CN102103860B (ja)
AT (1) ATE534990T1 (ja)
BR (1) BRPI0515453A (ja)
WO (1) WO2006030865A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009047911A1 (ja) * 2007-10-12 2009-04-16 Panasonic Corporation ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
WO2010092827A1 (ja) 2009-02-13 2010-08-19 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
US8306007B2 (en) 2008-01-16 2012-11-06 Panasonic Corporation Vector quantizer, vector inverse quantizer, and methods therefor

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0515453A (pt) * 2004-09-17 2008-07-22 Matsushita Electric Ind Co Ltd aparelho de codificação escalável, aparelho de decodificação escalável, método de codificação escalável método de decodificação escalável, aparelho de terminal de comunicação, e aparelho de estação de base
US8069035B2 (en) * 2005-10-14 2011-11-29 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, and methods of them
EP1959431B1 (en) * 2005-11-30 2010-06-23 Panasonic Corporation Scalable coding apparatus and scalable coding method
US8370138B2 (en) * 2006-03-17 2013-02-05 Panasonic Corporation Scalable encoding device and scalable encoding method including quality improvement of a decoded signal
CN101802908A (zh) * 2007-09-21 2010-08-11 松下电器产业株式会社 通信终端装置、通信***和通信方法
CN101335004B (zh) * 2007-11-02 2010-04-21 华为技术有限公司 一种多级量化的方法及装置
US20100274556A1 (en) * 2008-01-16 2010-10-28 Panasonic Corporation Vector quantizer, vector inverse quantizer, and methods therefor
DE102008009718A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
US20130024191A1 (en) * 2010-04-12 2013-01-24 Freescale Semiconductor, Inc. Audio communication device, method for outputting an audio signal, and communication system
US8964966B2 (en) * 2010-09-15 2015-02-24 Avaya Inc. Multi-microphone system to support bandpass filtering for analog-to-digital conversions at different data rates
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
JP5210368B2 (ja) 2010-10-29 2013-06-12 株式会社エヌ・ティ・ティ・ドコモ 無線基地局及び方法
US8818797B2 (en) 2010-12-23 2014-08-26 Microsoft Corporation Dual-band speech encoding
CN102783034B (zh) * 2011-02-01 2014-12-17 华为技术有限公司 用于提供信号处理系数的方法和设备
FR2984580A1 (fr) * 2011-12-20 2013-06-21 France Telecom Procede de detection d'une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d'ordinateur correspondant
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
JP6096896B2 (ja) 2012-07-12 2017-03-15 ノキア テクノロジーズ オーユー ベクトル量子化
MX346927B (es) 2013-01-29 2017-04-05 Fraunhofer Ges Forschung Énfasis de bajas frecuencias para codificación basada en lpc (codificación de predicción lineal) en el dominio de frecuencia.
US9842598B2 (en) 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
CN107316647B (zh) * 2013-07-04 2021-02-09 超清编解码有限公司 频域包络的矢量量化方法和装置
EP3399522B1 (en) * 2013-07-18 2019-09-11 Nippon Telegraph and Telephone Corporation Linear prediction analysis device, method, program, and storage medium
KR102271852B1 (ko) * 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
EP3155774B1 (en) 2014-06-10 2018-08-08 Telefonaktiebolaget LM Ericsson (publ) Systems and methods for adaptively restricting csi reporting in multi antenna wireless communications systems utilizing unused bit resources
KR102298767B1 (ko) * 2014-11-17 2021-09-06 삼성전자주식회사 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법
TWI583140B (zh) * 2016-01-29 2017-05-11 晨星半導體股份有限公司 具對數計算功能的解碼模組
EP3382704A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
KR20240033374A (ko) * 2022-09-05 2024-03-12 서울대학교산학협력단 비터비 빔 서치를 이용한 레지듀얼 벡터 양자화 장치, 방법 및 컴퓨터 판독 가능 매체

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123495A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 広帯域音声復元装置
JPH08263096A (ja) * 1995-03-24 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
JPH08293932A (ja) * 1994-12-21 1996-11-05 At & T Corp 線形予測フィルター係数量子化器とフィルターセット
JPH09127985A (ja) * 1995-10-26 1997-05-16 Sony Corp 信号符号化方法及び装置
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
JP2001509616A (ja) * 1997-07-10 2001-07-24 グルンデイッヒ・アクチエンゲゼルシヤフト 長期間予測と多重パルス励起信号を用いて音声信号を符号化および/または復号化する方法
JP2001337700A (ja) * 2000-05-22 2001-12-07 Texas Instr Inc <Ti> 広帯域音声符号化システムおよびその方法
JP2002140098A (ja) * 2000-10-31 2002-05-17 Nec Corp 音声復号装置および音声復号プログラムを記録した記録媒体
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP2004101720A (ja) * 2002-09-06 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
JPH05265496A (ja) * 1992-03-18 1993-10-15 Hitachi Ltd 複数のコードブックを有する音声符号化方法
JP2746039B2 (ja) * 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
JP2956548B2 (ja) * 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6148283A (en) * 1998-09-23 2000-11-14 Qualcomm Inc. Method and apparatus using multi-path multi-stage vector quantizer
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
JP3784583B2 (ja) * 1999-08-13 2006-06-14 沖電気工業株式会社 音声蓄積装置
EP1431962B1 (en) 2000-05-22 2006-04-05 Texas Instruments Incorporated Wideband speech coding system and method
US20030195745A1 (en) * 2001-04-02 2003-10-16 Zinser, Richard L. LPC-to-MELP transcoder
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US20030004803A1 (en) * 2001-05-09 2003-01-02 Glover H. Eiland Method for providing securities rewards to customers
FI112424B (fi) * 2001-10-30 2003-11-28 Oplayo Oy Koodausmenetelmä ja -järjestely
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
CN1282156C (zh) * 2001-11-23 2006-10-25 皇家飞利浦电子股份有限公司 音频信号带宽扩展
JP2003241799A (ja) 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
KR100446630B1 (ko) * 2002-05-08 2004-09-04 삼성전자주식회사 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법
EP1785984A4 (en) * 2004-08-31 2008-08-06 Matsushita Electric Ind Co Ltd AUDIOCODING DEVICE, AUDIO DECODING DEVICE, COMMUNICATION DEVICE AND AUDIOCODING METHOD
CN101023472B (zh) * 2004-09-06 2010-06-23 松下电器产业株式会社 可扩展编码装置和可扩展编码方法
BRPI0515453A (pt) * 2004-09-17 2008-07-22 Matsushita Electric Ind Co Ltd aparelho de codificação escalável, aparelho de decodificação escalável, método de codificação escalável método de decodificação escalável, aparelho de terminal de comunicação, e aparelho de estação de base
KR20070061847A (ko) * 2004-09-30 2007-06-14 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호 장치 및 이들의방법
CN101729874B (zh) 2008-10-20 2013-06-19 清华大学 一种可分级视频传输处理方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123495A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 広帯域音声復元装置
JPH08293932A (ja) * 1994-12-21 1996-11-05 At & T Corp 線形予測フィルター係数量子化器とフィルターセット
JPH08263096A (ja) * 1995-03-24 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
JPH09127985A (ja) * 1995-10-26 1997-05-16 Sony Corp 信号符号化方法及び装置
JP2001509616A (ja) * 1997-07-10 2001-07-24 グルンデイッヒ・アクチエンゲゼルシヤフト 長期間予測と多重パルス励起信号を用いて音声信号を符号化および/または復号化する方法
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
JP2001337700A (ja) * 2000-05-22 2001-12-07 Texas Instr Inc <Ti> 広帯域音声符号化システムおよびその方法
JP2002140098A (ja) * 2000-10-31 2002-05-17 Nec Corp 音声復号装置および音声復号プログラムを記録した記録媒体
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP2004101720A (ja) * 2002-09-06 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009047911A1 (ja) * 2007-10-12 2009-04-16 Panasonic Corporation ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
RU2469421C2 (ru) * 2007-10-12 2012-12-10 Панасоник Корпорэйшн Векторный квантователь, инверсный векторный квантователь и способы
US8438020B2 (en) 2007-10-12 2013-05-07 Panasonic Corporation Vector quantization apparatus, vector dequantization apparatus, and the methods
JP5300733B2 (ja) * 2007-10-12 2013-09-25 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
KR101390051B1 (ko) 2007-10-12 2014-04-29 파나소닉 주식회사 벡터 양자화 장치, 벡터 역양자화 장치, 및 이러한 방법
US8306007B2 (en) 2008-01-16 2012-11-06 Panasonic Corporation Vector quantizer, vector inverse quantizer, and methods therefor
WO2010092827A1 (ja) 2009-02-13 2010-08-19 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
US8493244B2 (en) 2009-02-13 2013-07-23 Panasonic Corporation Vector quantization device, vector inverse-quantization device, and methods of same
JP5335004B2 (ja) * 2009-02-13 2013-11-06 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法

Also Published As

Publication number Publication date
EP1791116A4 (en) 2007-11-14
CN102103860A (zh) 2011-06-22
EP1791116A1 (en) 2007-05-30
EP2273494A3 (en) 2012-11-14
JP5143193B2 (ja) 2013-02-13
US20080059166A1 (en) 2008-03-06
US20110040558A1 (en) 2011-02-17
EP2273494A2 (en) 2011-01-12
CN102103860B (zh) 2013-05-08
BRPI0515453A (pt) 2008-07-22
JP4963963B2 (ja) 2012-06-27
US7848925B2 (en) 2010-12-07
JP2010244078A (ja) 2010-10-28
CN101023471A (zh) 2007-08-22
CN101023471B (zh) 2011-05-25
US8712767B2 (en) 2014-04-29
JPWO2006030865A1 (ja) 2008-05-15
ATE534990T1 (de) 2011-12-15
EP1791116B1 (en) 2011-11-23
KR20070051910A (ko) 2007-05-18

Similar Documents

Publication Publication Date Title
JP5143193B2 (ja) スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法
JP4977472B2 (ja) スケーラブル復号化装置
JP4394578B2 (ja) 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置
JP4903053B2 (ja) 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
EP1755109B1 (en) Scalable encoding and decoding apparatuses and methods
JP4989971B2 (ja) スケーラブル復号化装置および信号消失補償方法
WO2008072670A1 (ja) 符号化装置、復号装置、およびこれらの方法
WO2007105586A1 (ja) 符号化装置および符号化方法
WO2005112006A1 (en) Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications
KR20080005325A (ko) 적응적 부호화/복호화 방법 및 장치
US20080140393A1 (en) Speech coding apparatus and method
WO2006046587A1 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
RU2469421C2 (ru) Векторный квантователь, инверсный векторный квантователь и способы
JPWO2007132750A1 (ja) Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
JPWO2007114290A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
WO2008053970A1 (fr) Dispositif de codage de la voix, dispositif de décodage de la voix et leurs procédés
JPH1097295A (ja) 音響信号符号化方法及び復号化方法
JP2008139447A (ja) 音声符号化装置及び音声復号装置
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP2007072264A (ja) 音声量子化方法、音声量子化装置、プログラム
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法
JPH08254999A (ja) ゲイン量子化装置および音声符号化/復号化装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV LY MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2006535201

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2005783539

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 11575257

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2007109803

Country of ref document: RU

Ref document number: 1020077006154

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 200580031531.6

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE

WWP Wipo information: published in national office

Ref document number: 2005783539

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 11575257

Country of ref document: US

ENP Entry into the national phase

Ref document number: PI0515453

Country of ref document: BR