JP3930596B2 - Audio signal encoding method - Google Patents

Audio signal encoding method Download PDF

Info

Publication number
JP3930596B2
JP3930596B2 JP02869697A JP2869697A JP3930596B2 JP 3930596 B2 JP3930596 B2 JP 3930596B2 JP 02869697 A JP02869697 A JP 02869697A JP 2869697 A JP2869697 A JP 2869697A JP 3930596 B2 JP3930596 B2 JP 3930596B2
Authority
JP
Japan
Prior art keywords
spectrum
level
selection process
audio signal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP02869697A
Other languages
Japanese (ja)
Other versions
JPH10228298A (en
Inventor
直樹 村山
Original Assignee
株式会社タイトー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社タイトー filed Critical 株式会社タイトー
Priority to JP02869697A priority Critical patent/JP3930596B2/en
Publication of JPH10228298A publication Critical patent/JPH10228298A/en
Application granted granted Critical
Publication of JP3930596B2 publication Critical patent/JP3930596B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号を高度に圧縮して符号化を行う音声信号符号化方法に関する。
【0002】
【従来の技術】
音声信号を符号化するため、従来においては特開昭63−148716号公報に示すようなADPCM方式が広く用いられている。
この方式は、入力信号の値から次の入力信号の値を予測して、その予測値と実際の入力信号との差をとり、この差の振幅の大きさに応じたステップサイズで量子化して符号化するものであり、量子化のステップアップサイズを可変することができることを特徴としている。
【0003】
【発明が解決しようとする課題】
しかしながら、上記した従来のADPCM方式においては、音声信号を符号化する場合に、符号化した音声信号を復号化/再生する場合に音質を確保する上で重要度の高いスペクトルも重要度の低いスペクトルも一律に符号化されるので、符号化圧縮率を高くすることができず、例えば通信カラオケ等に使用した場合等は、通信データの中に占める音声信号の占有率が大きく、他の必要なデータを入れることができなかったり、或いは、この方式で録音/再生を行うためには大容量のメモリを必要とし、また、それを録音する記憶媒体の大きさが限られるので、必要な情報の量を記憶できなくなるという問題があった。
【0004】
本発明は、上記した従来の問題点を解決すべく創案されたもので、音声信号を高度に圧縮して符号化し、しかも音声信号を復号して再生した場合の音質低下を抑えることのできる音声信号符号化方法を提供するものである。
【0005】
【課題を解決するための手段】
上記課題を解決するため、本発明は、
フレーム化直交変換部と、レベル計算部と、スペクトル選択部と、スペクトル符号化部と、を備える計算機が音声信号を符号化する音声信号符号化方法において、
前記フレーム化直交変換部が、デジタル変換された音声信号データを所定の大きさのフレームでフレーム化した後に直交変換してスペクトル化し、
前記レベル計算部が、前記スペクトル化した全ての音声信号データのスペクトルの信号レベルの総和を第1レベルとして求め、
前記スペクトル選択部が、第1スペクトル選択処理、第2スペクトル選択処理、レベル計算処理、および、レベル判断処理を順に実行することで、前記スペクトル化した音声信号データのスペクトル選択し
前記スペクトル符号化部が、前記スペクトル選択部により選択されたスペクトルを可逆符号化し、
前記第1スペクトル選択処理は、スペクトルの全体について、任意のスペクトルから一定の距離内にそのスペクトルの大きさ以上の大きさを持つ別のスペクトルが存在するかどうかを調べ、そのようなスペクトルが存在しなければ、そのスペクトルを第1スペクトルの一つとして選択し、
前記第2スペクトル選択処理は、前記第1スペクトル選択処理で選択された各々の第1スペクトルから、第1スペクトル間距離とは異なる一定距離内で最大の大きさを有するスペクトルを第2スペクトルの一つとして選択し、
前記レベル計算処理は、前記第1スペクトル選択処理および前記第2スペクトル選択処理で選択された全てのスペクトルの信号レベルの総和を第2レベルとして計算し、
前記レベル判断処理は、前記第1レベルに対して前記第2レベルが所定の比率以下なら、前記一定の距離を前記第1スペクトル間距離より少し短縮して設定し、前記第1スペクトル選択処理に処理を戻す
構成としたものである。
【0007】
【発明の実施の形態】
以下、本発明の実施の形態を図1乃至図4に基づいて説明する。
図1は、本発明の音声信号符号化方法を行うための符号化装置のブロック図、図2は、図1の符号化装置で行われる音声信号符号化方法の構成図、図3は、図2のスペクトル選択部の処理手順を示すフローチャート、図4は、図2のスペクトル選択部で行われるピークの選択を示す説明図である。
【0008】
本発明の音声信号符号化方法は、図1に示すような符号化装置1で音声信号が符号化されるものである。
この符号化装置1は、外部のマイクロホン2等で音声をアナログ信号に変換した入力信号を受け、アナログ信号をデジタル信号に変換するA/Dコンバータ3と、このデジタル変換した信号を圧縮符号化する符号処理部4、とにより構成されている。
また、符号処理部4は、公知のマイクロコンピュータにより構成されており、内部はI/O装置4a、CPU4b、ROM4c、RAM4d等からなり、予めROM4c内に格納されているプログラムに従って効率よく符号化されるものである。
【0009】
この符号処理部4の機能構成を図2に示す。図2において、符号処理部4は、フレーム化直交変換部5、レベル計算部6、スペクトル選択部7、レベル補償部8、およびスペクトル符号化部9の各機能ブロックから構成されている。
この、符号処理部4の動作機能を図2に基づいて説明する。
まず、図2において、前記A/Dコンバータ3(図1参照)によりPCM変換によりデジタル信号に変換されて符号処理部4に入力された音声信号データは、フレーム化直交変換部5で、例えば、1フレームのデータ数が1024個というように、適切な個数にまとめてフレーム化され、このフレームの全てに対して直交変換を行って音声信号のデータがスペクトル化される。
【0010】
次いで、レベル計算部6では、スペクトル化した音声信号のデータの全てについて、大きさ(絶対値)の総和を計算し、その値をスペクトルの全体レベルとする。また、これらのスペクトルを、例えば256個ずつといった周波数のサブバンドに分割し、この分割したサブバンドの各々ついて、スペクトルの大きさの絶対値の総和を計算してスペクトルの部分レベルとする。
次いで、スペクトル選択部7において、スペクトル全体の中から再生時の音質を保つ上で重要度の高いスペクトルの選択を行う。但し、この選択の際には、選択後のスペクトルの総和である選択後の全体レベルが、前記レベル計算部6にて計算しておいた選択前の全体レベルに対して例えば50%以上となるようにスペクトルの選択を行う。
【0011】
このスペクトル選択部7におけるスペクトルの選択手順を、図3乃至図4に基づいて説明する。
まず、図3におけるステップS1で、第1ピーク選択処理を行う。この第1ピーク選択処理はスペクトルの全体について、図4(a)に示すように、任意のスペクトルから一定の距離内にそのスペクトルの大きさ(絶対値)以上の大きさを持つ別のスペクトルが存在するかどうかを調べ、そのようなスペクトルが存在しなければ、そのスペクトルを第1ピークの一つとして選択する。
この第1ピーク選択処理の結果として、図4(b)に示すような、ピーク間の一定距離(以下第1ピーク間距離という)以上の間隔をおいた飛び飛びのスペクトルだけが選択される。
【0012】
次いで、ステップS2において第n(nは整数)ピーク選択処理を行う。この第nピーク選択処理は、図4(b)に示すように、ステップS1で選択された各々の第1ピークから、第1ピーク間距離とは異なる一定距離内で最大の大きさ(絶対値)を選択すると、図4(c)に示すような2番目の大きさのスペクトル、即ち第2ピークとして選択される。
さらに、第2ピークの選択が終了すれば、同様にして、3番目に大きい第3ピークの選択を行い、以下順次第4ピーク、・・・第nピークの選択を行う。
次いで、ステップS3で選択後のレベル計算を行う。この選択後のレベル計算は、ステップS1、ステップS2で選択された全てのスペクトル、即ち第1ピーク、第2ピーク、第3ピーク、・・・第nピークの大きさの総和を計算し、選択後の全体レベルとする。
【0013】
次いで、ステップS4にて、ステップS3で計算された選択後の全体レベルが、予め計算されていた選択前の全体レベルに対して50%以上であるか、どうかを判断する。このステップS4の判断結果、50%以上であれば処理完了となり、次のステップであるレベル補償部8(図2参照)へ進む。
もし50%以下であれば、ステップS5に進む。このステップS5ではステップS1に戻って再度第1ピーク選択処理からやり直す場合に、前記第1ピーク間距離より少し短縮して選択処理を行うようにするため、ピーク間距離の縮小を行うものである。その結果、選択されるスペクトルの数は増え、ある段階で50%以上の条件を満足するようになるので、その段階で処理が終了し、次のステップであるレベル補償部8(図2参照)へ進み、スペクトル選択を完了する。
【0014】
スペクトル選択が完了すると、レベル補償部8(図2参照)では、選択後のスペクトルから各サブバンドの部分レベルを計算し、サブバンド内の前スペクトルに対して、次式で計算された補償値αをかけてやり、選択後の部分レベルが選択前の部分レベルと等しくなるように調整を行うものである。
但し、αは、
α=(選択前の部分レベル)/(選択後の部分レベル)
の式で与えられるものである。
レベル補償部8で大きさを調整されたスペクトルは、スペクトル符号化部9において、カラオケ等の通信用データに組み込んだり、記録用データに組み込みをするため可逆的に符号化され、復号化器に向けて出力される。
【0015】
上述した実施の形態によれば、スペクトル選択部7において、直交変換で得られたスペクトルの中で、再生時の音質を保ために重要度の高いスペクトルのみ選択して符号化するため、少ない情報量で音声信号の符号化が可能となる。
また、本発明の実施の形態においては、フレーム化直交変換部5において1フレームの大きさをデータ数1024個にしたが、この数に限定されないことは勿論である。
さらに、スペクトル選択部7における選択前と選択後の全体レベルの割合を50%以上としたが、本発明はこれに限定されるものではなく、圧縮度を上げる場合にはこの割合を下げ、再生した時の忠実度を上げる場合にはこの割合を上げることで調整ができるので、適切な選択度を選ぶことができる。
【0016】
【発明の効果】
以上に述べたごとく本発明は、
フレーム化直交変換部と、レベル計算部と、スペクトル選択部と、スペクトル符号化部と、を備える計算機が音声信号を符号化する音声信号符号化方法において、
前記フレーム化直交変換部が、デジタル変換された音声信号データを所定の大きさのフレームでフレーム化した後に直交変換してスペクトル化し、
前記レベル計算部が、前記スペクトル化した全ての音声信号データのスペクトルの信号レベルの総和を第1レベルとして求め、
前記スペクトル選択部が、第1スペクトル選択処理、第2スペクトル選択処理、レベル計算処理、および、レベル判断処理を順に実行することで、前記スペクトル化した音声信号データのスペクトル選択し
前記スペクトル符号化部が、前記スペクトル選択部により選択されたスペクトルを可逆符号化し、
前記第1スペクトル選択処理は、スペクトルの全体について、任意のスペクトルから一定の距離内にそのスペクトルの大きさ以上の大きさを持つ別のスペクトルが存在するかどうかを調べ、そのようなスペクトルが存在しなければ、そのスペクトルを第1スペクトルの一つとして選択し、
前記第2スペクトル選択処理は、前記第1スペクトル選択処理で選択された各々の第1スペクトルから、第1スペクトル間距離とは異なる一定距離内で最大の大きさを有するスペクトルを第2スペクトルの一つとして選択し、
前記レベル計算処理は、前記第1スペクトル選択処理および前記第2スペクトル選択処理で選択された全てのスペクトルの信号レベルの総和を第2レベルとして計算し、
前記レベル判断処理は、前記第1レベルに対して前記第2レベルが所定の比率以下なら、前記一定の距離を前記第1スペクトル間距離より少し短縮して設定し、前記第1スペクトル選択処理に処理を戻す
ことにより、音声信号を高度に圧縮して符号化することができるので、少ない情報量で音声信号を符号化することが可能になり、音声の情報を蓄積する場合には蓄積スペースが少なくてすみ、また、音声の情報を通信する場合には通信時間を短縮できるという効果を奏する。また、音声信号を復号して再生した場合の音質低下を抑えることのできるという効果を奏するものである。
【図面の簡単な説明】
【図1】本発明の音声信号符号化方法を行うための符号化装置のブロック図である。
【図2】図1の符号化装置で行われる音声信号符号化方法の構成図である。
【図3】図2のスペクトル選択部の処理手順を示すフローチャートである。
【図4】図2のスペクトル選択部で行われるピーク選択を示す説明図である。
【符号の説明】
1 符号化装置
2 マイクロホン
3 A/Dコンバータ
4 符号処理部
4a I/O装置
4b CPU
4c ROM
4d RAM
5 フレーム化直交変換部
6 レベル計算部
7 スペクトル選択部
8 レベル補償部
9 スペクトル符号化部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an audio signal encoding method that performs encoding by highly compressing an audio signal.
[0002]
[Prior art]
In order to encode an audio signal, an ADPCM system as disclosed in Japanese Patent Laid-Open No. 63-148716 has been widely used.
This method predicts the value of the next input signal from the value of the input signal, takes the difference between the predicted value and the actual input signal, and quantizes it with a step size corresponding to the amplitude of this difference. The encoding is performed, and the step-up size of the quantization can be varied.
[0003]
[Problems to be solved by the invention]
However, in the above-described conventional ADPCM system, when a speech signal is encoded, a spectrum having a high importance in securing a sound quality when decoding / reproducing the encoded speech signal is also a spectrum having a low importance. Are uniformly encoded, so the encoding compression rate cannot be increased. For example, when used for communication karaoke, etc., the occupancy rate of the audio signal in the communication data is large. In order to record data or to record / playback with this method, a large amount of memory is required and the size of the storage medium for recording it is limited. There was a problem that the amount could not be memorized.
[0004]
The present invention was devised to solve the above-mentioned conventional problems, and is capable of suppressing deterioration in sound quality when an audio signal is highly compressed and encoded, and the audio signal is decoded and reproduced. A signal encoding method is provided.
[0005]
[Means for Solving the Problems]
In order to solve the above problems, the present invention provides:
In a speech signal encoding method in which a computer including a framing orthogonal transform unit, a level calculation unit, a spectrum selection unit, and a spectrum encoding unit encodes a speech signal,
The framed orthogonal transform unit framing the digitally converted audio signal data into frames of a predetermined size, and then orthogonally transforming into spectrum,
The level calculation section calculates the total sum of the signal levels of the spectra of all of the audio signal data said spectral as the first level,
The spectrum selection unit sequentially executes a first spectrum selection process, a second spectrum selection process, a level calculation process, and a level determination process, thereby selecting a spectrum of the spectralized audio signal data ,
The spectrum coding section, and lossless encoding the spectrum selected by the spectrum selection portion,
The first spectrum selection process checks whether there is another spectrum having a magnitude greater than or equal to the spectrum within a certain distance from an arbitrary spectrum. Otherwise, select that spectrum as one of the first spectra,
In the second spectrum selection process, a spectrum having a maximum size within a certain distance different from the first inter-spectrum distance is selected from each first spectrum selected in the first spectrum selection process. Select as one
The level calculation process calculates a sum of signal levels of all the spectra selected in the first spectrum selection process and the second spectrum selection process as a second level,
In the level determination process, if the second level is less than or equal to a predetermined ratio with respect to the first level, the fixed distance is set slightly shorter than the distance between the first spectra, and the first spectrum selection process is performed. Return processing
It is a configuration.
[0007]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to FIGS.
FIG. 1 is a block diagram of an encoding apparatus for performing the speech signal encoding method of the present invention, FIG. 2 is a configuration diagram of the speech signal encoding method performed by the encoding apparatus of FIG. 1, and FIG. FIG. 4 is an explanatory diagram illustrating peak selection performed by the spectrum selection unit in FIG. 2.
[0008]
In the audio signal encoding method of the present invention, an audio signal is encoded by an encoding apparatus 1 as shown in FIG.
The encoding device 1 receives an input signal obtained by converting sound into an analog signal by an external microphone 2 or the like, and compresses and encodes the digitally converted signal and an A / D converter 3 that converts the analog signal into a digital signal. And a code processing unit 4.
The code processing unit 4 is composed of a known microcomputer, and includes an I / O device 4a, CPU 4b, ROM 4c, RAM 4d, etc., and is efficiently encoded according to a program stored in the ROM 4c in advance. Is.
[0009]
A functional configuration of the code processing unit 4 is shown in FIG. In FIG. 2, the code processing unit 4 includes functional blocks of a framed orthogonal transform unit 5, a level calculation unit 6, a spectrum selection unit 7, a level compensation unit 8, and a spectrum coding unit 9.
The operation function of the code processing unit 4 will be described with reference to FIG.
First, in FIG. 2, the audio signal data converted into a digital signal by PCM conversion by the A / D converter 3 (see FIG. 1) and inputted to the code processing unit 4 is converted into, for example, a framed orthogonal conversion unit 5. The number of data of one frame is made into a suitable number such as 1024 frames, and orthogonal transformation is performed on all of the frames, and the audio signal data is spectrumized.
[0010]
Next, the level calculation unit 6 calculates the sum of the magnitudes (absolute values) of all of the spectralized audio signal data, and sets that value as the overall level of the spectrum. Further, these spectra are divided into subbands of frequencies such as 256, and the sum of absolute values of spectrum sizes is calculated for each of the divided subbands to obtain a partial level of the spectrum.
Next, the spectrum selection unit 7 selects a spectrum having high importance in maintaining sound quality during reproduction from the entire spectrum. However, in this selection, the total level after selection, which is the total sum of the spectrum after selection, is, for example, 50% or more with respect to the total level before selection calculated by the level calculation unit 6. The spectrum is selected as follows.
[0011]
The spectrum selection procedure in the spectrum selector 7 will be described with reference to FIGS.
First, in step S1 in FIG. 3, a first peak selection process is performed. In the first peak selection process, as shown in FIG. 4A, another spectrum having a magnitude equal to or larger than the magnitude (absolute value) of the spectrum within a certain distance from an arbitrary spectrum is obtained. It is checked whether it exists, and if such a spectrum does not exist, that spectrum is selected as one of the first peaks.
As a result of the first peak selection process, only a spectrum with a distance greater than or equal to a certain distance between peaks (hereinafter referred to as a first peak-to-peak distance) as shown in FIG. 4B is selected.
[0012]
Next, in step S2, an nth (n is an integer) peak selection process is performed. As shown in FIG. 4B, the n-th peak selection process has a maximum magnitude (absolute value) within a certain distance different from the distance between the first peaks from each first peak selected in step S1. ) Is selected as the second magnitude spectrum as shown in FIG. 4C, that is, the second peak.
When the selection of the second peak is completed, the third largest third peak is selected in the same manner, and the fourth peak,.
Subsequently, the level calculation after selection is performed at step S3. The level calculation after this selection is performed by calculating the sum of the sizes of all the spectra selected in step S1 and step S2, that is, the first peak, the second peak, the third peak,... The whole level will be later.
[0013]
Next, in step S4, it is determined whether or not the overall level after selection calculated in step S3 is 50% or more with respect to the overall level before selection calculated in advance. If the determination result in step S4 is 50% or more, the processing is completed, and the process proceeds to the next step, the level compensation unit 8 (see FIG. 2).
If it is 50% or less, the process proceeds to step S5. In step S5, when returning to step S1 and starting again from the first peak selection process, the distance between the peaks is reduced in order to perform the selection process with a slightly shorter distance than the first peak distance. . As a result, the number of spectra to be selected increases, and the condition of 50% or more is satisfied at a certain stage. Therefore, the processing is terminated at that stage, and the level compensation unit 8 (see FIG. 2) as the next step. To complete the spectrum selection.
[0014]
When spectrum selection is completed, the level compensator 8 (see FIG. 2) calculates the partial level of each subband from the selected spectrum, and the compensation value calculated by the following equation for the previous spectrum in the subband. The adjustment is performed by multiplying α so that the partial level after selection becomes equal to the partial level before selection.
Where α is
α = (partial level before selection) / (partial level after selection)
It is given by the following formula.
The spectrum whose size has been adjusted by the level compensator 8 is reversibly encoded by the spectrum encoder 9 so as to be incorporated into communication data such as karaoke or to be incorporated into recording data. Is output.
[0015]
According to the above-described embodiment, the spectrum selection unit 7 selects and encodes only a high importance spectrum from the spectrum obtained by the orthogonal transform to maintain the sound quality at the time of reproduction. The audio signal can be encoded by the amount.
In the embodiment of the present invention, the framed orthogonal transform unit 5 sets the size of one frame to 1024 data. However, it is needless to say that the number is not limited to this number.
Further, the ratio of the total level before and after selection in the spectrum selection unit 7 is set to 50% or more. However, the present invention is not limited to this. When the fidelity is increased, adjustment can be made by increasing this ratio, so that an appropriate selectivity can be selected.
[0016]
【The invention's effect】
As described above, the present invention
In a speech signal encoding method in which a computer including a framing orthogonal transform unit, a level calculation unit, a spectrum selection unit, and a spectrum encoding unit encodes a speech signal,
The framed orthogonal transform unit framing the digitally converted audio signal data into frames of a predetermined size, and then orthogonally transforming into spectrum,
The level calculation section calculates the total sum of the signal levels of the spectra of all of the audio signal data said spectral as the first level,
The spectrum selection unit sequentially executes a first spectrum selection process, a second spectrum selection process, a level calculation process, and a level determination process, thereby selecting a spectrum of the spectralized audio signal data ,
The spectrum coding section, and lossless encoding the spectrum selected by the spectrum selection portion,
The first spectrum selection process checks whether there is another spectrum having a magnitude greater than or equal to the spectrum within a certain distance from an arbitrary spectrum. Otherwise, select that spectrum as one of the first spectra,
In the second spectrum selection process, a spectrum having a maximum size within a certain distance different from the first inter-spectrum distance is selected from each first spectrum selected in the first spectrum selection process. Select as one
The level calculation process calculates a sum of signal levels of all the spectra selected in the first spectrum selection process and the second spectrum selection process as a second level,
In the level determination process, if the second level is less than or equal to a predetermined ratio with respect to the first level, the fixed distance is set slightly shorter than the distance between the first spectra, and the first spectrum selection process is performed. Return processing
As a result, since the audio signal can be highly compressed and encoded, it is possible to encode the audio signal with a small amount of information, and the storage space can be reduced when storing audio information. In addition, when voice information is communicated, the communication time can be shortened. In addition, there is an effect that it is possible to suppress deterioration in sound quality when an audio signal is decoded and reproduced.
[Brief description of the drawings]
FIG. 1 is a block diagram of an encoding apparatus for performing a speech signal encoding method of the present invention.
FIG. 2 is a configuration diagram of a speech signal encoding method performed by the encoding device of FIG. 1;
FIG. 3 is a flowchart showing a processing procedure of a spectrum selection unit in FIG. 2;
4 is an explanatory diagram showing peak selection performed by a spectrum selection unit in FIG. 2; FIG.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 Encoding apparatus 2 Microphone 3 A / D converter 4 Code processing part 4a I / O apparatus 4b CPU
4c ROM
4d RAM
5 Frame Orthogonal Transformer 6 Level Calculator 7 Spectrum Selector 8 Level Compensator 9 Spectrum Encoder

Claims (1)

フレーム化直交変換部と、レベル計算部と、スペクトル選択部と、スペクトル符号化部と、を備える計算機が音声信号を符号化する音声信号符号化方法において、
前記フレーム化直交変換部が、デジタル変換された音声信号データを所定の大きさのフレームでフレーム化した後に直交変換してスペクトル化し、
前記レベル計算部が、前記スペクトル化した全ての音声信号データのスペクトルの信号レベルの総和を第1レベルとして求め、
前記スペクトル選択部が、第1スペクトル選択処理、第2スペクトル選択処理、レベル計算処理、および、レベル判断処理を順に実行することで、前記スペクトル化した音声信号データのスペクトル選択し
前記スペクトル符号化部が、前記スペクトル選択部により選択されたスペクトルを可逆符号化し、
前記第1スペクトル選択処理は、スペクトルの全体について、任意のスペクトルから一定の距離内にそのスペクトルの大きさ以上の大きさを持つ別のスペクトルが存在するかどうかを調べ、そのようなスペクトルが存在しなければ、そのスペクトルを第1スペクトルの一つとして選択し、
前記第2スペクトル選択処理は、前記第1スペクトル選択処理で選択された各々の第1スペクトルから、第1スペクトル間距離とは異なる一定距離内で最大の大きさを有するスペクトルを第2スペクトルの一つとして選択し、
前記レベル計算処理は、前記第1スペクトル選択処理および前記第2スペクトル選択処理で選択された全てのスペクトルの信号レベルの総和を第2レベルとして計算し、
前記レベル判断処理は、前記第1レベルに対して前記第2レベルが所定の比率以下なら、前記一定の距離を前記第1スペクトル間距離より少し短縮して設定し、前記第1スペクトル選択処理に処理を戻すことを特徴とする
音声信号符号化方法。
In a speech signal encoding method in which a computer including a framing orthogonal transform unit, a level calculation unit, a spectrum selection unit, and a spectrum encoding unit encodes a speech signal,
The framed orthogonal transform unit framing the digitally converted audio signal data into frames of a predetermined size, and then orthogonally transforming into spectrum,
The level calculation section calculates the total sum of the signal levels of the spectra of all of the audio signal data said spectral as the first level,
The spectrum selection unit sequentially executes a first spectrum selection process, a second spectrum selection process, a level calculation process, and a level determination process, thereby selecting a spectrum of the spectralized audio signal data ,
The spectrum coding section, and lossless encoding the spectrum selected by the spectrum selection portion,
The first spectrum selection process checks whether there is another spectrum having a magnitude greater than or equal to the spectrum within a certain distance from an arbitrary spectrum. Otherwise, select that spectrum as one of the first spectra,
In the second spectrum selection process, a spectrum having a maximum size within a certain distance different from the first inter-spectrum distance is selected from each first spectrum selected in the first spectrum selection process. Select as one
The level calculation process calculates a sum of signal levels of all the spectra selected in the first spectrum selection process and the second spectrum selection process as a second level,
In the level determination process, if the second level is less than or equal to a predetermined ratio with respect to the first level, the fixed distance is set slightly shorter than the distance between the first spectra, and the first spectrum selection process is performed. Characterized by returning processing
Audio signal encoding method.
JP02869697A 1997-02-13 1997-02-13 Audio signal encoding method Expired - Lifetime JP3930596B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02869697A JP3930596B2 (en) 1997-02-13 1997-02-13 Audio signal encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02869697A JP3930596B2 (en) 1997-02-13 1997-02-13 Audio signal encoding method

Publications (2)

Publication Number Publication Date
JPH10228298A JPH10228298A (en) 1998-08-25
JP3930596B2 true JP3930596B2 (en) 2007-06-13

Family

ID=12255650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02869697A Expired - Lifetime JP3930596B2 (en) 1997-02-13 1997-02-13 Audio signal encoding method

Country Status (1)

Country Link
JP (1) JP3930596B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2007088853A1 (en) * 2006-01-31 2009-06-25 パナソニック株式会社 Speech coding apparatus, speech decoding apparatus, speech coding system, speech coding method, and speech decoding method

Also Published As

Publication number Publication date
JPH10228298A (en) 1998-08-25

Similar Documents

Publication Publication Date Title
JP5048697B2 (en) Encoding device, decoding device, encoding method, decoding method, program, and recording medium
JP3926726B2 (en) Encoding device and decoding device
JP3446216B2 (en) Audio signal processing method
KR100840439B1 (en) Audio coding apparatus and audio decoding apparatus
US6011824A (en) Signal-reproduction method and apparatus
JP3283200B2 (en) Method and apparatus for converting coding rate of coded audio data
JPH10282999A (en) Method and device for coding audio signal, and method and device decoding for coded audio signal
KR101143792B1 (en) Signal encoding device and method, and signal decoding device and method
JP2002372996A (en) Method and device for encoding acoustic signal, and method and device for decoding acoustic signal, and recording medium
US20020169601A1 (en) Encoding device, decoding device, and broadcast system
JP3344944B2 (en) Audio signal encoding device, audio signal decoding device, audio signal encoding method, and audio signal decoding method
US20020173969A1 (en) Method for decompressing a compressed audio signal
JP4308229B2 (en) Encoding device and decoding device
JP3930596B2 (en) Audio signal encoding method
US6678653B1 (en) Apparatus and method for coding audio data at high speed using precision information
JP4191503B2 (en) Speech musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program
JP3336619B2 (en) Signal processing device
JP3454394B2 (en) Quasi-lossless audio encoding device
JP2552102B2 (en) Digital data for-matching / defo-matching circuit
JPH06268606A (en) System and device for voice coding communication
JP3496618B2 (en) Apparatus and method for speech encoding / decoding including speechless encoding operating at multiple rates
JPH05303399A (en) Audio time axis companding device
JP2001148632A (en) Encoding device, encoding method and recording medium
JP3146121B2 (en) Encoding / decoding device
JP3389849B2 (en) Quantizer

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051101

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20060610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070309

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100316

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100316

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110316

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120316

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120316

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120316

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140316

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140316

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140316

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term