JP2013195646A - Coding device, coding method, and program - Google Patents

Coding device, coding method, and program Download PDF

Info

Publication number
JP2013195646A
JP2013195646A JP2012061881A JP2012061881A JP2013195646A JP 2013195646 A JP2013195646 A JP 2013195646A JP 2012061881 A JP2012061881 A JP 2012061881A JP 2012061881 A JP2012061881 A JP 2012061881A JP 2013195646 A JP2013195646 A JP 2013195646A
Authority
JP
Japan
Prior art keywords
data
bit length
effective bit
residual
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012061881A
Other languages
Japanese (ja)
Inventor
Goro Sakata
吾朗 坂田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2012061881A priority Critical patent/JP2013195646A/en
Priority to US13/727,370 priority patent/US9165563B2/en
Priority to CN201310051631.1A priority patent/CN103325376B/en
Publication of JP2013195646A publication Critical patent/JP2013195646A/en
Pending legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

PROBLEM TO BE SOLVED: To allow coding which allows higher tone quality to be maintained even in the case of sudden changes in waveform of sound, with a reduced processing load on hardware.SOLUTION: An effective bit length data generation unit 112 calculates an effective bit length for each piece of sampling residual data of residual waveform data to generate effective bit length data. A common effective bit length search unit 113 takes respective effective bit lengths of a prescribed number of pieces of sampling residual data as processing objects with respect to the effective bit length data to search for a maximum effective bit length from the processing objects as a common effective bit length and generates results obtained by eliminating parts except the common effective bit length from the prescribed number of pieces of sampling residual data, as a prescribed number of pieces of common effective actual data. A configuration format arrangement unit 114 generates data in which the prescribed number of pieced of common effective actual data and information indicative of the common effective bit length are at least arranged in a prescribed configuration format, as coded data.

Description

本発明は、電子楽器で再生される音のデータを符号化可能な、符号化装置、符号化方法、及びプログラムに関する。   The present invention relates to an encoding device, an encoding method, and a program capable of encoding sound data reproduced by an electronic musical instrument.

従来、電子楽器は、実際に演奏された楽器の音をPCM(Pulse Code Modulation)形式で録音した波形データ(以下、「PCM波形データ」と呼ぶ)をメモリに予め保持しておき、演奏操作がなされると、当該PCM波形データを音源として発音する。
このような電子楽器は、複数のチャンネルで同時発音する場合があるため、PCM波形データ用のメモリとして、高速でアクセス可能な半導体メモリが搭載されている。このような半導体メモリではその容量が増大するに従いコストが増大するために、当該容量を抑制してコストを抑制すべく、PCM波形データは、半導体メモリにそのままの状態で記録されるのではなく、符号化されてデータ量が圧縮された状態で記録されている。
2. Description of the Related Art Conventionally, an electronic musical instrument has previously stored waveform data (hereinafter referred to as “PCM waveform data”) in which a sound of an actually played musical instrument is recorded in a PCM (Pulse Code Modulation) format in advance so that a performance operation can be performed. When done, the PCM waveform data is sounded as a sound source.
Since such an electronic musical instrument may sound simultaneously in a plurality of channels, a semiconductor memory that can be accessed at high speed is mounted as a memory for PCM waveform data. In such a semiconductor memory, the cost increases as the capacity thereof increases. Therefore, in order to suppress the capacity and suppress the cost, the PCM waveform data is not recorded in the semiconductor memory as it is. Encoded and recorded in a compressed state.

また、電子楽器が複数のチャンネルを同時発音することは、ハードウェアの処理負荷の増大にもつながる。このため、符号化方式としては、ハードウェアへの処理負荷を少なくする必要があるが、音質劣化が生ずるような形式では不適である。即ち、符号化方式としては、ハードウェアの処理不可の軽減と、音質劣化の減少とが共に実現可能な方式が求められている
また、符号化の目的は、上述のメモリの容量の抑制以外に、電子楽器における同時発音のチャンネル数を増やすことにある。メモリには必ず最大転送データレートがあり、この最大転送データレートが、同時発音のチャンネル数を決定する。このため、PCM波形データの符号化は、1チャンネルあたりのデータ転送量を減少させることができれば、同時に、より多くのチャンネルを発音することができることになる。
In addition, if the electronic musical instrument sounds a plurality of channels at the same time, it also leads to an increase in hardware processing load. For this reason, as an encoding method, it is necessary to reduce the processing load on hardware, but it is not suitable for a format in which sound quality deterioration occurs. In other words, as an encoding method, there is a need for a method that can realize both the reduction of hardware inability to process and the reduction of sound quality degradation. Also, the purpose of encoding is other than the above-described suppression of memory capacity. The purpose is to increase the number of simultaneous sound channels in electronic musical instruments. There is always a maximum transfer data rate in the memory, and this maximum transfer data rate determines the number of simultaneous sounding channels. For this reason, encoding of PCM waveform data can simultaneously generate more channels if the amount of data transfer per channel can be reduced.

そこで、特許文献1には、波形の振幅値又はその差分値を仮数部と指数部とからなる浮動小数点データで表現し、連続する所定数の仮数部に対応する指数部を1つの指数部の値により共通化し、そのようにして得た圧縮指数部又はその差分値である差分圧縮指数部を、仮数部のビットデータの一部として埋め込み、符号化データとして出力する波形データ符号化装置が提案されている。   Therefore, in Patent Document 1, an amplitude value of a waveform or a difference value thereof is expressed by floating point data composed of a mantissa part and an exponent part, and an exponent part corresponding to a predetermined number of mantissa parts in succession is represented by one exponent part. A waveform data encoding device is proposed that embeds the compressed exponent part obtained as described above or the differential compressed exponent part that is the difference value as part of the bit data of the mantissa part and outputs it as encoded data Has been.

また、特許文献2には、波形の振幅値又はその差分値を仮数部と指数部とからなる浮動小数点データで表現し、必要に応じて、連続する所定数の仮数部に対応する指数部を1つの指数部の値によって共通化し、更に、圧縮指数部又は指数部の差分値である差分圧縮指数部又は差分指数部を、仮数部と共に符号化されたデータとして出力する波形データ符号化装置が提案されている。   Further, in Patent Document 2, the amplitude value of a waveform or a difference value thereof is expressed by floating point data including a mantissa part and an exponent part, and an exponent part corresponding to a predetermined number of consecutive mantissa parts is included as necessary. A waveform data encoding device that is shared by the value of one exponent part and further outputs a differential compression exponent part or a difference exponent part that is a difference value of the compression exponent part or the exponent part as data encoded together with the mantissa part. Proposed.

特許文献1及び2の波形データ符号化装置は、浮動小数点データの指数部を差分で記録し、連続する所定数の仮数部に対応する指数部を1つの指数部の値により共通化する。これらの波形データ符号化装置の符号化は、ハードウェアへの処理負荷が少なく、かつ、音質の劣化が少ない。   The waveform data encoding devices of Patent Documents 1 and 2 record an exponent part of floating point data as a difference, and share an exponent part corresponding to a predetermined number of consecutive mantissa parts by the value of one exponent part. The encoding of these waveform data encoding apparatuses has a small processing load on hardware and a little deterioration in sound quality.

特開平07−160267号公報JP 07-160267 A 特開平07−199996号公報Japanese Patent Laid-Open No. 07-199996

ところで、最近では、電子楽器の高音質化が求められている。このため、ビットレートが常に一定である固定ビットレートによる符号化では、ピアノ音等のアタック部分において急激に音の波形が変化した場合、所定の音質を維持するためのビットレートが足りなくなるおそれがある。そこで、急激に音の波形が変化した場合でも、高音質を維持できる符号化の実現が要求されているが、特許文献1及び2の波形データ符号化装置では当該要求に充分に応えることができない状況である。   Recently, there has been a demand for higher sound quality of electronic musical instruments. For this reason, in the case of encoding at a fixed bit rate where the bit rate is always constant, if the sound waveform changes suddenly in an attack portion such as a piano sound, the bit rate for maintaining a predetermined sound quality may be insufficient. is there. Therefore, even if the waveform of the sound suddenly changes, it is required to realize encoding capable of maintaining high sound quality. However, the waveform data encoding devices of Patent Documents 1 and 2 cannot sufficiently meet the request. Is the situation.

本発明は、このような状況に鑑みてなされたものであり、ハードウェアへの処理負荷を軽減しつつ、急激に音の波形が変化した場合でも、高音質を維持できる符号化を可能とすることを目的とする。   The present invention has been made in view of such a situation, and enables encoding that can maintain high sound quality even when the waveform of a sound suddenly changes while reducing the processing load on the hardware. For the purpose.

上記目的を達成するため、本発明の一態様の符号化装置は、
符号化対象の音の波形データのサンプリングデータ毎に、予測残差値をサンプリング残差データとして算出し、当該サンプリング残差データの時系列の集合体を残差波形データとして生成する予測処理手段と、
前記予測処理手段により生成された前記残差波形データの各サンプリング残差データ毎に有効ビット長を算出し、前記残差波形データの各サンプリング残差データの前記有効ビット長を示す有効ビット長データを生成する有効ビット長データ生成手段と、
前記有効ビット長データ生成手段により生成された前記有効ビット長データについて、所定数のサンプリング残差データの各有効ビット長を処理対象として、処理対象の中で最大の有効ビット長を共通有効ビット長として検索し、前記所定数のサンプリング残差データの各々から、前記共通有効ビット長以外の部分を削除したものを、前記所定数の共通有効実データとして生成する共通有効ビット長検索手段と、
前記共通有効ビット長検索手段により生成された前記所定数の共通有効実データ、及び前記共通有効ビット長を示す情報を、所定の構成フォーマットに少なくとも配置したデータを、符号化データとして生成する構成フォーマット配置手段と、
を備えることを特徴とする。
In order to achieve the above object, an encoding apparatus according to an aspect of the present invention includes:
A prediction processing unit that calculates a prediction residual value as sampling residual data for each sampling data of waveform data of sound to be encoded, and generates a time series aggregate of the sampling residual data as residual waveform data; ,
Effective bit length data for calculating the effective bit length for each sampling residual data of the residual waveform data generated by the prediction processing means and indicating the effective bit length of each sampling residual data of the residual waveform data Valid bit length data generating means for generating
For the effective bit length data generated by the effective bit length data generation means, each effective bit length of a predetermined number of sampling residual data is processed, and the maximum effective bit length among the processing targets is a common effective bit length. A common effective bit length search means for generating, as the predetermined number of common effective real data, a portion obtained by deleting a portion other than the common effective bit length from each of the predetermined number of sampling residual data,
A configuration format for generating, as encoded data, the predetermined number of common effective real data generated by the common effective bit length search means and data in which information indicating the common effective bit length is arranged at least in a predetermined configuration format Positioning means;
It is characterized by providing.

本発明によれば、ハードウェアへの処理負荷を軽減しつつ、急激に音の波形が変化した場合でも、より高い音質を維持できる符号化が可能となる。   ADVANTAGE OF THE INVENTION According to this invention, the encoding which can maintain a higher sound quality is attained even if the waveform of a sound changes suddenly, reducing the processing load to hardware.

ピアノ音のPCM波形データとスペクトラム分析結果の一例を示す図である。It is a figure which shows an example of PCM waveform data and spectrum analysis result of a piano sound. 本発明の一実施形態に係る符号化装置の機能的構成のうち、PCM波形データを符号化する処理を実行するための機能的構成を示す機能ブロック図である。It is a functional block diagram which shows the functional structure for performing the process which encodes PCM waveform data among the functional structures of the encoding apparatus which concerns on one Embodiment of this invention. 図2の符号化装置のハードウェアの構成を示すブロック図である。FIG. 3 is a block diagram illustrating a hardware configuration of the encoding device in FIG. 2. 図3の符号化装置が実行する符号化処理の流れを説明するフローチャートである。It is a flowchart explaining the flow of the encoding process which the encoding apparatus of FIG. 3 performs. 図2の符号化装置の機能的構成のうち、線形予測処理部の機能的構成を示す機能ブロック図である。It is a functional block diagram which shows the functional structure of a linear prediction process part among the functional structures of the encoding apparatus of FIG. 図2の符号化装置の圧縮モードテーブルを説明する図である。FIG. 3 is a diagram illustrating a compression mode table of the encoding device in FIG. 2. 所定の圧縮モードにおける、PCM波形データ、残差波形データ及び線形予測波形データの波形の一例を示す図である。It is a figure which shows an example of the waveform of PCM waveform data, residual waveform data, and linear prediction waveform data in a predetermined compression mode. 図7とは異なる所定の圧縮モードにおける、PCM波形データ、残差波形データ及び線形予測波形データの波形の一例を示す図である。It is a figure which shows an example of the waveform of PCM waveform data, residual waveform data, and linear prediction waveform data in the predetermined compression mode different from FIG. オリジナルとなるピアノ音のPCM波形データ、残差波形データ、及び有効ビット長データの各々の一例を示す図である。It is a figure which shows an example of each of the PCM waveform data of an original piano sound, residual waveform data, and effective bit length data. 図2の符号化装置の共通有効ビット長検索部が参照する共通化波形数テーブルを説明する図である。It is a figure explaining the common waveform number table which the common effective bit length search part of the encoding apparatus of FIG. 2 refers. 図2の符号化装置の共通有効ビット長検索部による処理結果の一例を示す図である。It is a figure which shows an example of the process result by the common effective bit length search part of the encoding apparatus of FIG. 図2の符号化装置により構成フォーマットに配置された、共通有効ビット長が6ビットの符号化データを説明する図である。FIG. 3 is a diagram illustrating encoded data having a common effective bit length of 6 bits arranged in a configuration format by the encoding device of FIG. 2. 図2の符号化装置により構成フォーマットに配置された、共通有効ビット長が13ビットの符号化データを説明する図である。FIG. 3 is a diagram for describing encoded data having a common effective bit length of 13 bits arranged in a configuration format by the encoding device of FIG. 2.

以下、図面に基づいて、本発明の実施形態に係る符号化装置を説明する。
先ず、本実施形態の理解を容易にするため、本実施形態に係る符号化装置の概要を説明する。
本実施形態に係る符号化装置は、例えば、電子ピアノ等の電子楽器の発音の際に音源となるPCM波形データを、音の種類毎に、予め符号化する装置である。ここで、本実施形態において、「音の種類」とは、楽器の種類によって異なる音色の種類や、同種類の楽器における音階の種類を含む。
Hereinafter, an encoding apparatus according to an embodiment of the present invention will be described based on the drawings.
First, in order to facilitate understanding of the present embodiment, an outline of the encoding apparatus according to the present embodiment will be described.
The encoding apparatus according to the present embodiment is an apparatus that pre-encodes, for each type of sound, PCM waveform data that becomes a sound source when an electronic musical instrument such as an electronic piano is pronounced. Here, in this embodiment, the “sound type” includes a timbre type that differs depending on the type of musical instrument, and a musical scale type in the same type of musical instrument.

先ず、図1を参照して、ピアノの1つの鍵盤が押下されたときに発生した音(以降、ピアノ音とも言う)のPCM波形データの特性について説明する。
図1(a)は、ピアノ音のPCM波形データを示しており、図1(b)は、そのスペクトラム分析結果を示している。
図1に示すように、PCM波形データは、波高値が時間経過に伴い減少していく。即ち、PCM波形データが必要とするビット長も、発音直後をピークとして時間経過に伴い減少していく。
また、スペクトラム分析結果は、時間経過に伴い、高周波部分(図1(b)における上方部分)が減少していることを示している。これは、ピアノ音における高周波の倍音成分が、時間経過に伴い減少しているからである。このことは、線形予測処理における予測精度が向上することを意味している。
First, the characteristics of PCM waveform data of a sound (hereinafter also referred to as a piano sound) generated when one piano key is pressed will be described with reference to FIG.
FIG. 1A shows PCM waveform data of a piano sound, and FIG. 1B shows the spectrum analysis result.
As shown in FIG. 1, in the PCM waveform data, the peak value decreases with time. That is, the bit length required for the PCM waveform data also decreases with time, with the peak immediately after sounding.
Moreover, the spectrum analysis result shows that the high frequency portion (the upper portion in FIG. 1B) decreases with time. This is because the harmonic overtone component of the piano sound decreases with time. This means that the prediction accuracy in the linear prediction process is improved.

図2は、本発明の一実施形態に係る符号化装置の機能的構成のうち、PCM波形データを符号化する処理(以下、「符号化処理」と呼ぶ)を実行するための機能的構成を示す機能ブロック図である。
符号化装置1は、線形予測処理部111と、有効ビット長データ生成部112と、共通有効ビット長検索部113と、構成フォーマット配置部114と、を備える。
FIG. 2 shows a functional configuration for executing a process of encoding PCM waveform data (hereinafter referred to as “encoding process”) among the functional configurations of the encoding apparatus according to an embodiment of the present invention. It is a functional block diagram shown.
The encoding device 1 includes a linear prediction processing unit 111, an effective bit length data generation unit 112, a common effective bit length search unit 113, and a configuration format arrangement unit 114.

線形予測処理部111には、入力PCM波形データが入力される。ここで、本実施形態において、入力PCM波形データは、ある楽器から発音された所定音階の音が、所定のサンプリング周期で数値化された結果得られるサンプリングデータの時系列の集合体である。例えば、楽器がピアノであれば、1つの鍵盤が押下されたときに発する音から、入力PCM波形データは生成される。
具体的には、線形予測処理部111には、PCM波形データを構成する各サンプリングデータが順次入力される。そこで、以下、入力された1つのサンプリングデータを、「入力データ」と呼ぶ。
The input PCM waveform data is input to the linear prediction processing unit 111. Here, in the present embodiment, the input PCM waveform data is a time-series collection of sampling data obtained as a result of digitizing a sound of a predetermined scale generated from a certain musical instrument at a predetermined sampling period. For example, if the instrument is a piano, the input PCM waveform data is generated from the sound that is emitted when one key is pressed.
Specifically, the sampling data constituting the PCM waveform data is sequentially input to the linear prediction processing unit 111. Therefore, hereinafter, one input sampling data is referred to as “input data”.

線形予測処理部111は、入力データから、過去の幾つかの入力データに対して所定の線形予測係数が乗算されたデータを減算することによって、線形予測残差値を示すデータ(以下、「サンプリング残差データ」と呼ぶ)を生成する。線形予測処理部111は、入力データが入力される毎に上記処理を繰り返し実行することで、所定のサンプリング周期毎のサンプリング残差データの時系列の集合体(以下、「残差波形データ」と呼ぶ)を生成する。   The linear prediction processing unit 111 subtracts, from the input data, data obtained by multiplying some past input data by a predetermined linear prediction coefficient, thereby indicating data indicating a linear prediction residual value (hereinafter, “sampling”). Called "residual data"). The linear prediction processing unit 111 repeatedly executes the above process every time input data is input, so that a collection of time series of sampling residual data for each predetermined sampling period (hereinafter referred to as “residual waveform data”). Call).

ここで、本実施形態において、「線形予測係数」は、予め複数種類用意されている。また、複数種類の線形予測係数のそれぞれは、複数種類の圧縮モードのそれぞれに対応付けられている。即ち、圧縮モードは、複数種類の線形予測係数のうちの何れかを判別する情報である。   Here, in this embodiment, multiple types of “linear prediction coefficients” are prepared in advance. Each of the plurality of types of linear prediction coefficients is associated with each of a plurality of types of compression modes. That is, the compression mode is information for determining any one of a plurality of types of linear prediction coefficients.

そこで、線形予測処理部111は、入力PCM波形データ1つにつき、複数種類の線形予測係数のそれぞれを用いて複数種類の残差波形データを生成し、そのうち最適な1つを出力データとして選択して出力する。   Therefore, the linear prediction processing unit 111 generates a plurality of types of residual waveform data using each of a plurality of types of linear prediction coefficients for each piece of input PCM waveform data, and selects the most suitable one as output data. Output.

有効ビット長データ生成部112は、線形予測処理部111により生成された残差波形データについて、各サンプリング残差データ毎に有効ビット長を算出し、各サンプリング残差データの有効ビット長の各々を示す時系列のデータ(以下、「有効ビット長データ」と呼ぶ)を生成する。
ここで、本実施形態において「有効ビット長」とは、符号化及び復号の過程において、所定の音質を維持するために必要なデータのビット長である。
The effective bit length data generation unit 112 calculates an effective bit length for each sampling residual data for the residual waveform data generated by the linear prediction processing unit 111, and calculates each effective bit length of each sampling residual data. The time-series data shown (hereinafter referred to as “effective bit length data”) is generated.
Here, in this embodiment, the “effective bit length” is a bit length of data necessary for maintaining a predetermined sound quality in the process of encoding and decoding.

例えば、ピアノの鍵盤が押下されたときに発生する音は、押下直後をピークとして徐々に減衰する。この様な音の残差波形も、押下直後をピークとして徐々に減衰する。このため、この様な残差波形データの有効ビット長は、押下した直後が最大であり、時間経過に伴い減少する。   For example, a sound generated when a piano keyboard is pressed is gradually attenuated with a peak immediately after pressing. Such a residual waveform of sound also attenuates gradually with a peak immediately after pressing. For this reason, the effective bit length of such residual waveform data is maximum immediately after being pressed and decreases with time.

共通有効ビット長検索部113は、有効ビット長データ生成部112により生成された有効ビット長データについて、後述の共通化波形数テーブルを参照して、連続する所定数のサンプリング残差データの各有効ビット長のうち、最大の有効ビット長を共通有効ビット長として検索する。また、共通有効ビット長検索部113は、当該有効ビット長データについて、連続する所定数の各サンプリング残差データのうち、共通有効ビット長分のデータ(以下、「共通有効実データ」と呼ぶ)を残し、それ以外のデータを削除する。なお、以下、それ以外の削除された部分を、「共通削除部分」と呼ぶ。   The common effective bit length search unit 113 refers to the common waveform number table to be described later for the effective bit length data generated by the effective bit length data generation unit 112, and sets each effective number of consecutive sampling residual data. Of the bit lengths, the maximum effective bit length is searched as the common effective bit length. Further, the common effective bit length search unit 113, for the effective bit length data, out of a predetermined number of consecutive sampling residual data, data corresponding to the common effective bit length (hereinafter referred to as “common effective actual data”). And delete other data. Hereinafter, the other deleted parts are referred to as “commonly deleted parts”.

ここで、PCM波形データは、音の種類によって異なるし、同一のPCM波形データ内においても時間位置によってサンプリングデータは異なる。このため、連続する所定数のサンプリング残差データ毎に、最大の有効ビット長、即ち、共通有効ビット長も異なる。そこで、符号化装置1は、固定ビット長のデータを残すのではなく、音の種類によって或いは時間位置によって変化する、音質維持に必要な共通有効ビット長のデータを共通有効実データとして残す符号化を実行する。これにより、符号化装置1は、音質を劣化させることなく、ビットレートを下げることができる。   Here, the PCM waveform data varies depending on the type of sound, and the sampling data varies depending on the time position even within the same PCM waveform data. For this reason, the maximum effective bit length, that is, the common effective bit length is different for each predetermined number of consecutive sampling residual data. Therefore, the encoding device 1 does not leave data of a fixed bit length, but encodes data having a common effective bit length necessary for maintaining sound quality, which changes depending on the type of sound or time position, as common effective actual data. Execute. Thereby, the encoding apparatus 1 can reduce the bit rate without deteriorating the sound quality.

更に、本実施形態において、連続する所定数のサンプリング残差データにおける「所定数」とは、固定値ではなく可変値である。即ち、予め設定された記憶容量のブロック(例えば、1024バイト)の記憶領域に、記憶可能なサンプリング残差データの共通有効ビットの個数が、「所定値」になる。従って、「所定数」は、共通有効ビット長が大きくなれば小さい値となり、共通有効ビット長が小さくなれば大きい値となる。   Furthermore, in the present embodiment, the “predetermined number” in a predetermined number of consecutive sampling residual data is not a fixed value but a variable value. That is, the number of common effective bits of sampling residual data that can be stored in a storage area of a block having a predetermined storage capacity (for example, 1024 bytes) becomes a “predetermined value”. Therefore, the “predetermined number” is a small value when the common effective bit length is large, and a large value when the common effective bit length is small.

構成フォーマット配置部114は、共通有効ビット長検索部113により残された、連続する所定数の共通有効実データ、及び前記共通有効ビット長を示す情報を、所定の構成フォーマットに少なくとも配置したデータを、符号化データとして生成する。
ここで、本実施形態において、「構成フォーマット」は、電子楽器において、読込可能なフォーマットであり、例えば、ヘッダ部分とデータ部分とで構成される。ヘッダ部分に共通有効ビット長を示すデータや、線形予測処理部111が残差波形データの生成に使用した線形予測係数を判別するための圧縮モード等が配置される。データ部分に、連続する所定数の共通有効ビットが配置される。
The configuration format placement unit 114 stores at least a predetermined number of common valid real data and the information indicating the common valid bit length, which are left by the common valid bit length search unit 113, in a predetermined configuration format. And generated as encoded data.
Here, in the present embodiment, the “configuration format” is a format that can be read by the electronic musical instrument, and includes, for example, a header portion and a data portion. Data indicating the common effective bit length in the header portion, a compression mode for determining a linear prediction coefficient used by the linear prediction processing unit 111 for generating residual waveform data, and the like are arranged. A predetermined number of common effective bits are arranged in the data portion.

例えば、このような符号化データは、図示せぬ電子楽器に音源として予め記録され、当該電子楽器において、所定の演奏操作がなされると、読み出されて、符号化装置1と逆のフローによる処理が実行されることで、PCMデータが復号される。そして、当該電子楽器において、当該PCMデータに基づいて発音される。   For example, such encoded data is recorded in advance as a sound source in an electronic musical instrument (not shown), and is read out when a predetermined performance operation is performed on the electronic musical instrument. By executing the process, the PCM data is decoded. Then, the electronic musical instrument produces a sound based on the PCM data.

図3は、このような図2の機能的構成を有する符号化装置1のハードウェアの構成を示すブロック図である。
図3において、符号化装置1は、CPU11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、入力部16と、出力部17と、記憶部18と、ドライブ20と、を備えている。
FIG. 3 is a block diagram showing a hardware configuration of the encoding apparatus 1 having the functional configuration shown in FIG.
In FIG. 3, the encoding device 1 includes a CPU 11, a ROM (Read Only Memory) 12, a RAM (Random Access Memory) 13, a bus 14, an input / output interface 15, an input unit 16, and an output unit 17. , A storage unit 18 and a drive 20.

CPU11は、ROM12に記録されているプログラム、又は、記憶部18からRAM13にロードされたプログラムに従って各種の処理を実行する。
具体的には例えば、CPU11が符号化処理を実行する場合、図2に示す、線形予測処理部111と、有効ビット長データ生成部112と、共通有効ビット長検索部113と、構成フォーマット配置部114と、が機能する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等が適宜記憶される。
The CPU 11 executes various processes according to a program recorded in the ROM 12 or a program loaded from the storage unit 18 to the RAM 13.
Specifically, for example, when the CPU 11 executes the encoding process, the linear prediction processing unit 111, the effective bit length data generation unit 112, the common effective bit length search unit 113, and the configuration format arrangement unit illustrated in FIG. 114 function.
The RAM 13 appropriately stores data necessary for the CPU 11 to execute various processes.

CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、入力部16、出力部17、記憶部18及びドライブ20が接続されている。   The CPU 11, ROM 12, and RAM 13 are connected to each other via a bus 14. An input / output interface 15 is also connected to the bus 14. An input unit 16, an output unit 17, a storage unit 18, and a drive 20 are connected to the input / output interface 15.

入力部16には、マウス等のポインティングデバイスや、文字入力のためのキーボードが含まれ、これらによる入力信号をCPU11に出力する。
出力部17は、ディスプレイや、スピーカ及びD/A変換回路等を有しており、画像や音声を出力する。
記憶部18は、ハードディスク或いはDRAM(Dynamic Random Access Memory)等で構成され、符号化装置1の制御のための各種プログラムや、後述する構成フォーマット、圧縮モードテーブル及び共通化波形数テーブルを記憶する。
The input unit 16 includes a pointing device such as a mouse and a keyboard for inputting characters, and outputs input signals from these to the CPU 11.
The output unit 17 includes a display, a speaker, a D / A conversion circuit, and the like, and outputs images and sounds.
The storage unit 18 is configured by a hard disk, a DRAM (Dynamic Random Access Memory), or the like, and stores various programs for controlling the encoding device 1, a configuration format, a compression mode table, and a common waveform number table to be described later.

ドライブ20には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア31が適宜装着される。ドライブ20によってリムーバブルメディア31から読み出されたプログラムは、必要に応じて記憶部18にインストールされる。また、リムーバブルメディア31は、記憶部18に記憶されている各種データも、記憶部18と同様に記憶することができる。   A removable medium 31 made of a magnetic disk, an optical disk, a magneto-optical disk, a semiconductor memory, or the like is appropriately attached to the drive 20. The program read from the removable medium 31 by the drive 20 is installed in the storage unit 18 as necessary. The removable medium 31 can also store various data stored in the storage unit 18 in the same manner as the storage unit 18.

次に、図4を参照して、本実施形態に係る符号化装置1が実行する符号化処理について説明する。
図4は、本実施形態に係る符号化装置1が実行する符号化処理の流れを説明するフローチャートである。
Next, an encoding process executed by the encoding apparatus 1 according to the present embodiment will be described with reference to FIG.
FIG. 4 is a flowchart for explaining the flow of the encoding process executed by the encoding apparatus 1 according to this embodiment.

ステップS1において、CPU11の線形予測処理部111(図2)は、入力PCM波形データから、残差波形データを生成する。
ここで、図5乃至図8を参照して、ステップS1の処理の詳細について説明する。
In step S1, the linear prediction processing unit 111 (FIG. 2) of the CPU 11 generates residual waveform data from the input PCM waveform data.
Here, with reference to FIG. 5 thru | or FIG. 8, the detail of the process of step S1 is demonstrated.

図5は、図2の線形予測処理部111の詳細な機能的構成の一例を示す機能ブロック図である。
線形予測処理部111は、遅延回路111a、111b及び111dと、乗算器111c及び111eと、を備える。
FIG. 5 is a functional block diagram illustrating an example of a detailed functional configuration of the linear prediction processing unit 111 in FIG.
The linear prediction processing unit 111 includes delay circuits 111a, 111b, and 111d, and multipliers 111c and 111e.

図6は、本実施形態に係る符号化装置の圧縮モードテーブルを説明する図である。
圧縮モードテーブルは、記憶部18に記憶され、複数の圧縮モードの種類をそれぞれ示す値に、それぞれ異なる線形予測係数a1,a2の組が対応付けられて記憶されている。本実施形態において、線形予測係数a2は、負の値である。
FIG. 6 is a diagram for explaining a compression mode table of the encoding apparatus according to the present embodiment.
The compression mode table is stored in the storage unit 18 and stores different sets of linear prediction coefficients a1 and a2 in association with values indicating the types of the plurality of compression modes. In the present embodiment, the linear prediction coefficient a2 is a negative value.

ステップS1において、線形予測処理部111は、入力PCM波形データの入力データから、乗算器111c及び111eの各出力データを減算することで、サンプリング残差データを生成し、遅延回路111aで1サンプリング周期遅延させて出力する。
当該サンプリング残差データは、乗算器111c及び111eの各出力データが加算されて、遅延回路111bに入力されて、当該遅延回路111bで1サンプリング周期遅延された後、乗算器111c及び遅延回路111dにそれぞれ入力される。
乗算器111cでは、遅延回路111bから入力されたデータが、設定された圧縮モードの線形予測係数a1だけ乗算されて、出力される。
一方、当該遅延回路111dでは、遅延回路111bから入力されたデータが更に1サンプリング周期遅延されて、乗算器111eに出力される。
乗算器111eでは、遅延回路111dから入力されたデータが、設定された圧縮モードの線形予測係数a2だけ乗算されて、出力される。
In step S1, the linear prediction processing unit 111 generates sampling residual data by subtracting the output data of the multipliers 111c and 111e from the input data of the input PCM waveform data, and the delay circuit 111a performs one sampling period. Output with delay.
The sampling residual data is added to the output data of the multipliers 111c and 111e, input to the delay circuit 111b, delayed by one sampling period by the delay circuit 111b, and then to the multiplier 111c and the delay circuit 111d. Each is entered.
The multiplier 111c multiplies the data input from the delay circuit 111b by the set linear prediction coefficient a1 of the compression mode and outputs the result.
On the other hand, in the delay circuit 111d, the data input from the delay circuit 111b is further delayed by one sampling period and output to the multiplier 111e.
The multiplier 111e multiplies the data input from the delay circuit 111d by the set linear prediction coefficient a2 of the compression mode and outputs the result.

前段落の一連の処理が、図6に示す圧縮モード毎に、即ち、線形予測係数a1,a2の各組毎に実行され、複数種類の残差波形データが生成され、そのうちの最適な1種類の残差波形データが出力データとして、線形予測処理部111から出力される。   The series of processes in the previous paragraph is executed for each compression mode shown in FIG. 6, that is, for each set of linear prediction coefficients a1 and a2, and a plurality of types of residual waveform data are generated. Are output from the linear prediction processing unit 111 as output data.

図6は、線形予測係数a1,a2の組と、圧縮モードとを対応付けたテーブルである。
圧縮モード0で、PCM波形データが圧縮されて残差波形データが生成され、当該残差波形データが復調されると、元のPCM波形データが再生される。
圧縮モード1で、PCM波形データが圧縮されて残差波形データが生成され、当該残差波形データが復調されると、DPCM(differential pulse code modulation)波形データが再生される。
FIG. 6 is a table in which a set of linear prediction coefficients a1 and a2 is associated with a compression mode.
In the compression mode 0, the PCM waveform data is compressed to generate residual waveform data. When the residual waveform data is demodulated, the original PCM waveform data is reproduced.
In compression mode 1, PCM waveform data is compressed to generate residual waveform data, and when the residual waveform data is demodulated, DPCM (differential pulse code modulation) waveform data is reproduced.

また、圧縮モード2乃至7の何れかで、PCM波形データが圧縮されて残差波形データが生成され、当該残差波形データが復調されると、線形予測波形データが再生される。
具体的には、圧縮モード2では、線形予測係数a1,a2の各々により得られる2つの波形データから、波高値0側に近付く曲線で予測され、線形予測波形データが再生される。
圧縮モード7では、線形予測係数a1,a2の各々により得られる2つの波形データの直線延長上が予測値となるように、線形予測波形データが再生される。
なお、本実施形態において、圧縮モード0、1及び7であれば、線形予測処理部111を簡素化して乗算器111c,111eを省略しても残差波形データを生成できる。
In any of the compression modes 2 to 7, the PCM waveform data is compressed to generate residual waveform data, and when the residual waveform data is demodulated, linear prediction waveform data is reproduced.
Specifically, in the compression mode 2, prediction is performed with a curve approaching the peak value 0 side from two waveform data obtained by each of the linear prediction coefficients a1 and a2, and linear prediction waveform data is reproduced.
In the compression mode 7, linear prediction waveform data is reproduced so that the linear extension of the two waveform data obtained by each of the linear prediction coefficients a1 and a2 becomes a prediction value.
In this embodiment, if the compression modes are 0, 1, and 7, residual waveform data can be generated even if the linear prediction processing unit 111 is simplified and the multipliers 111c and 111e are omitted.

図7は、圧縮モード3における、PCM波形データ、残差波形データ及び線形予測波形データの波形の一例を示す図である。
図8は、圧縮モード6における、PCM波形データ、残差波形データ及び線形予測波形データの波形を示す図である。
FIG. 7 is a diagram illustrating an example of waveforms of PCM waveform data, residual waveform data, and linear prediction waveform data in the compression mode 3.
FIG. 8 is a diagram showing waveforms of PCM waveform data, residual waveform data, and linear prediction waveform data in the compression mode 6.

図7と図8を比較するに、PCM波形データの周波数が比較的高い場合、圧縮モード2乃至7のうち、圧縮モード2や3側で生成された線形予測波形データは、圧縮モード6や7側で生成された線形予測波形データよりも、PCM波形データに良く追従する。
これに対して、PCM波形データの周波数が比較的低い場合、圧縮モード2乃至7のうち、圧縮モード6や7側で生成された線形予測波形データは、圧縮モード2や3側で生成された線形予測波形データよりも、PCM波形データに良く追従する。
7 and 8, when the frequency of the PCM waveform data is relatively high, the linear prediction waveform data generated on the compression mode 2 or 3 side among the compression modes 2 to 7 is compressed in the compression modes 6 and 7. It follows the PCM waveform data better than the linear prediction waveform data generated on the side.
On the other hand, when the frequency of the PCM waveform data is relatively low, the linear prediction waveform data generated on the compression mode 6 or 7 side among the compression modes 2 to 7 is generated on the compression mode 2 or 3 side. It follows PCM waveform data better than linear prediction waveform data.

図4に戻って、ステップS2において、CPU11の有効ビット長データ生成部112(図2)は、ステップS1の処理で線形予測処理部111により生成された残差波形データから、各サンプリング残差データの有効ビット長を計算することで、有効ビット長データを生成する。   Returning to FIG. 4, in step S <b> 2, the effective bit length data generation unit 112 (FIG. 2) of the CPU 11 extracts each sampling residual data from the residual waveform data generated by the linear prediction processing unit 111 in the process of step S <b> 1. The effective bit length data is generated by calculating the effective bit length.

図9は、本実施形態に係る符号化装置が生成する有効ビット長データの一例を説明する図である。
具体的には、図9(a)は、オリジナルとなるピアノ音のPCM波形データの一例を示す図である。図9(b)は、図9(a)のPCM波形データから生成された残差波形データの一例を示す図である。図9(c)は、図9(b)の残差波形データから生成された有効ビット長データの一例を示す図である。
図9に示すように、ピアノ音のPCM波形データ及び残差波形データの振幅は、時間経過にともない徐々に減衰する。このため、残差波形データを構成する各サンプリング残差データの有効ビット長も時間経過に伴い徐々に減少する。即ち、この図9の例のピアノ音においては、有効ビット長は、全体的(長期的)には徐々に下がるが、隣接するサンプリング残差データの前後(短期的)において比較的均一であるという特徴がある。このような特徴は、時間経過に伴い変化する有効ビット長をグループ化できることを示している。なお、このピアノ音の例の特徴は、他の楽器音にも共通する。
FIG. 9 is a diagram for explaining an example of effective bit length data generated by the encoding apparatus according to the present embodiment.
Specifically, FIG. 9A shows an example of PCM waveform data of an original piano sound. FIG. 9B is a diagram illustrating an example of residual waveform data generated from the PCM waveform data of FIG. FIG. 9C is a diagram illustrating an example of effective bit length data generated from the residual waveform data of FIG. 9B.
As shown in FIG. 9, the amplitudes of the PCM waveform data and residual waveform data of the piano sound are gradually attenuated with the passage of time. For this reason, the effective bit length of each sampling residual data constituting the residual waveform data also gradually decreases with time. That is, in the piano sound of the example of FIG. 9, the effective bit length gradually decreases overall (long-term), but is relatively uniform before and after (short-term) adjacent sampling residual data. There are features. Such a feature indicates that effective bit lengths that change with time can be grouped. Note that the characteristics of this piano sound example are common to other musical instrument sounds.

例えば、図9の例によれば、発音開始から時間経過に伴い、有効ビット長は、12ビットから、11ビット、10ビット、9ビット、8ビット、7ビット、6ビット、5ビットと、徐々に減少する。
ここで、線形予測処理部111は、残差波形データを構成する各サンプリング残差データを、所定の有効ビット長のデータとして生成する。この所定の有効ビット長としては、符号化及び復号の過程において、例えば、ピアノの発音から消音までの全時間帯に対して所定の音質を維持するために必要なビット長が設定されている。ところが、この所定の音質を維持するために必要なビット長は、音高によっても異なるし、1つの音高の音であっても異なる(図9の例では、時間経過にともない徐々に減少する)。
For example, according to the example of FIG. 9, the effective bit length gradually increases from 12 bits to 11 bits, 10 bits, 9 bits, 8 bits, 7 bits, 6 bits, and 5 bits as time elapses from the start of sound generation. To decrease.
Here, the linear prediction processing unit 111 generates each sampling residual data constituting the residual waveform data as data having a predetermined effective bit length. As the predetermined effective bit length, for example, a bit length necessary for maintaining a predetermined sound quality for the entire time period from the pronunciation of the piano to the mute is set in the process of encoding and decoding. However, the bit length necessary to maintain the predetermined sound quality varies depending on the pitch, and even on a single pitch (in the example of FIG. 9, it gradually decreases with time). ).

図4に戻って、ステップS3において、CPU11の共通有効ビット長検索部113(図2)は、ステップS2の処理で有効ビット長データ生成部112により生成された有効ビット長データについて、記憶部18に記憶された共通化波形数テーブルを参照して、連続する所定数のサンプリング残差データの有効ビット長のうち、最大の有効ビット長を、共通有効ビット長として検索する。   Returning to FIG. 4, in step S <b> 3, the common effective bit length search unit 113 (FIG. 2) of the CPU 11 stores the effective bit length data generated by the effective bit length data generation unit 112 in the process of step S <b> 2. The maximum effective bit length is searched as the common effective bit length among the effective bit lengths of the predetermined number of consecutive sampling residual data.

また、共通有効ビット長検索部113は、有効ビット長データにおいて、連続する所定数のサンプリング残差データの全ビット長のうち、共通有効ビット長以外のビット長分のビットを、共通削除部分として削除する。   Also, the common effective bit length search unit 113 uses, as the common deletion part, bits corresponding to a bit length other than the common effective bit length among all the bit lengths of a predetermined number of consecutive sampling residual data in the effective bit length data. delete.

図10は、共通有効ビット長検索部113により参照される共通化波形数テーブルを説明する図である。
共通化波形数テーブルは、複数種類の共通有効ビット長毎に、残差波形数と、ブロック時間msと、ビットレートbpsと、が対応付けられて格納されることによって、構成されている。
なお、残差波形数とは、予め設定された記憶容量のブロック(例えば、1024バイト)に記憶可能なサンプリング残差データの個数を示している。ブロック時間とは、当該ブロックが復号されて音が再生される場合の再生時間を示している。
FIG. 10 is a diagram for explaining a common waveform number table referred to by the common effective bit length search unit 113.
The common waveform number table is configured by storing the number of residual waveforms, the block time ms, and the bit rate bps in association with each other for each of a plurality of types of common effective bit lengths.
Note that the number of residual waveforms indicates the number of sampling residual data that can be stored in a block having a preset storage capacity (for example, 1024 bytes). The block time indicates the reproduction time when the block is decoded and sound is reproduced.

更に以下、図11を参照して、図4のステップS3における共通有効ビット長検索部113が実行する処理の具体例について説明する。
図11は、図4のステップS3における共通有効ビット長検索部113が実行する処理の結果の一例を示す図である。
図11に示すブロックの所定行には、所定の1つのサンプリング残差データが格納されているものとする。
図11の例では1行に格納されるサンプリング残差データのビット長は、17ビットとされている。即ち、図11の例では1行は、17個の小ブロックから構成され、この小ブロックに所定のビットが格納される。この小ブロックに格納されるブロックとしては、“S”で示される符号ビットと、“M”で示される実データのビットとが存在する。
1つのサンプリング残差データの有効ビット長は、右方の0ビット目から順に、“M”が付された実データビット長と、1つの“S”(各行の最も右側の“S”)が付されたビット長となる。図11の例では、各行のうち、斜線以外の白い部分が、サンプリング残差データの有効ビット長の部分を示している。
この有効ビット長は、図11のブロック全体に含まれる各サンプリング残差データ(各行)に応じて異なっている。そこで、図11のブロック全体に含まれる各サンプリング残差データ(各行)の有効ビット長のうち、最大の有効ビット長、図11の例では、上から5行目の11ビットが、共通有効ビットになる。そして、それ以外の冗長なビットが共通削除部分として削除される。
Further, with reference to FIG. 11, a specific example of the process executed by the common effective bit length search unit 113 in step S3 of FIG. 4 will be described below.
FIG. 11 is a diagram illustrating an example of a result of processing executed by the common effective bit length search unit 113 in step S3 of FIG.
It is assumed that one predetermined sampling residual data is stored in a predetermined row of the block shown in FIG.
In the example of FIG. 11, the bit length of the sampling residual data stored in one row is 17 bits. That is, in the example of FIG. 11, one row is composed of 17 small blocks, and predetermined bits are stored in the small blocks. As a block stored in this small block, there are a sign bit indicated by “S” and a bit of actual data indicated by “M”.
The effective bit length of one sampling residual data is, in order from the 0th bit on the right, the actual data bit length with “M” added and one “S” (the rightmost “S” in each row). It becomes the appended bit length. In the example of FIG. 11, the white portion other than the diagonal line in each row indicates the effective bit length portion of the sampling residual data.
This effective bit length differs depending on each sampling residual data (each row) included in the entire block of FIG. Therefore, among the effective bit lengths of the sampling residual data (each row) included in the entire block of FIG. 11, the maximum effective bit length, in the example of FIG. 11, 11 bits in the fifth row from the top are the common effective bits. become. The other redundant bits are deleted as a common deletion part.

具体的には例えば、共通有効ビット長検索部113は、まず、2ビット(共通化する最低のビット長)が、最大の有効ビット長であるか否かを判定する。詳細には、共通有効ビット長検索部113は、共通化波形数テーブル(図10)を参照して、共通有効ビット長が2ビットの場合の残差波形数(4080個)を取得する。そして、共通有効ビット長検索部113は、4080個のサンプリング残差データを処理対象にして、2ビット(共通化する最低のビット長)が、最大の有効ビット長であるか否かを判定する。
共通有効ビット長検索部113は、2ビットが最大の有効ビット長であると判定した場合には、共通有効ビット長を2ビットとして設定する。
これに対して、共通有効ビット長検索部113は、2ビットが最大の有効ビット長でないと判定した場合には、3ビットが、最大の有効ビット長であるか否かを判定する。判定手法は、2ビットの場合と同様なのでここでは省略する。
共通有効ビット長検索部113は、以上の一連の処理を、最大の有効ビット長を検索できるまで、判定対象のビット長を1つずつ増加させながら繰り返し実行する。
Specifically, for example, the common effective bit length search unit 113 first determines whether or not 2 bits (the lowest bit length to be shared) is the maximum effective bit length. Specifically, the common effective bit length search unit 113 refers to the common waveform number table (FIG. 10) and acquires the number of residual waveforms (4080) when the common effective bit length is 2 bits. Then, the common effective bit length search unit 113 determines whether or not 2 bits (minimum bit length to be shared) is the maximum effective bit length by processing 4080 pieces of sampling residual data. .
When the common effective bit length search unit 113 determines that 2 bits are the maximum effective bit length, the common effective bit length search unit 113 sets the common effective bit length as 2 bits.
On the other hand, if the common effective bit length search unit 113 determines that 2 bits are not the maximum effective bit length, the common effective bit length search unit 113 determines whether 3 bits are the maximum effective bit length. Since the determination method is the same as in the case of 2 bits, it is omitted here.
The common effective bit length search unit 113 repeatedly executes the above series of processes while increasing the bit length to be determined one by one until the maximum effective bit length can be searched.

図11の例では、共通有効ビット長検索部113は、上述したように、上から5行目の11ビットを、共通有効ビットとして検索する。この場合、共通有効ビット長検索部113は、共通化波形数テーブル(図10参照)において11ビットに対応づけられた波形数(741個)のサンプリング残差データを、1つの圧縮対象(ブロックに格納させる対象)として決定し、これら圧縮対象のうち、共通有効ビット長(例えば、11ビット)以外の冗長な部分を、共通削除部分として削除することで、連続する741個の共通有効実データを生成する。   In the example of FIG. 11, the common effective bit length search unit 113 searches for 11 bits in the fifth row from the top as a common effective bit as described above. In this case, the common effective bit length search unit 113 converts the sampling residual data of the number of waveforms (741) associated with 11 bits in the common waveform number table (see FIG. 10) into one compression target (block). The object to be stored) is determined, and among these compression objects, redundant portions other than the common effective bit length (for example, 11 bits) are deleted as a common deletion portion, so that 741 pieces of common effective actual data can be obtained. Generate.

図4に戻って、ステップS4において、CPU11の構成フォーマット配置部114(図2)は、連続する所定数(図11の例では741個)の共通有効実データ等を、所定の構成フォーマットで配置することで、符号化データを生成する。   Returning to FIG. 4, in step S4, the configuration format arrangement unit 114 (FIG. 2) of the CPU 11 arranges a predetermined number (741 in the example of FIG. 11) of common effective real data in a predetermined configuration format. Thus, encoded data is generated.

図12は、共通有効ビット長が6ビットの構成フォーマットのブロックを示している。
図13は、共通有効ビット長が13ビットの構成フォーマットの符号化データを示している。
この構成フォーマットのブロックは、記憶容量が1024バイトのブロックであり、4バイトのヘッダ部と、1020バイトのデータ部と、を含むように構成される。
ヘッダ部には、当該ブロックに格納されるサンプリング残差データの生成の際に用いられた「圧縮モード」、共通有効ビット長を示す「ビット長」、及び、音量補正のパラメータを示す「音量補正パラメータ」が配置される。また、ヘッダ部には、将来任意なものを配置可能なように「reserved」が設けられている。
データ部には、連続する所定数のサンプリング残差データが詰めて配置される。
FIG. 12 shows a block of a configuration format having a common effective bit length of 6 bits.
FIG. 13 shows encoded data having a configuration format in which the common effective bit length is 13 bits.
The block of this configuration format is a block having a storage capacity of 1024 bytes, and is configured to include a 4-byte header portion and a 1020-byte data portion.
The header section includes “compression mode” used when generating the sampling residual data stored in the block, “bit length” indicating the common effective bit length, and “volume correction” indicating the volume correction parameter. Parameter "is arranged. Further, the header portion is provided with “reserved” so that an arbitrary one can be arranged in the future.
In the data portion, a predetermined number of consecutive sampling residual data are arranged and arranged.

以上説明したように、本実施形態の符号化装置1は、線形予測処理部111、有効ビット長データ生成部112、共通有効ビット長検索部113及び構成フォーマット配置部114を備える。
線形予測処理部111は、符号化対象の音の波形データ(本実施形態ではPCM波形データ)のサンプリングデータ毎に、予測残差値をサンプリング残差データとして算出し、当該サンプリング残差データの時系列の集合体を残差波形データとして生成する。
有効ビット長データ生成部112は、残差波形データの各サンプリング残差データ毎に有効ビット長を算出し、残差波形データの各サンプリング残差データの有効ビット長を示す有効ビット長データを生成する。
共通有効ビット長検索部113は、有効ビット長データについて、所定数のサンプリング残差データの各有効ビット長を処理対象として、処理対象の中で最大の有効ビット長を共通有効ビット長として検索し、所定数のサンプリング残差データの各々から、共通有効ビット長以外の部分を削除したものを、所定数の共通有効実データとして生成する。
構成フォーマット配置部114は、所定数の共通有効実データ、及び共通有効ビット長を示す情報を、所定の構成フォーマットに少なくとも配置したデータを、符号化データとして生成する。
As described above, the encoding apparatus 1 of the present embodiment includes the linear prediction processing unit 111, the effective bit length data generation unit 112, the common effective bit length search unit 113, and the configuration format arrangement unit 114.
The linear prediction processing unit 111 calculates a prediction residual value as sampling residual data for each sampling data of the waveform data of the sound to be encoded (PCM waveform data in the present embodiment). A group of series is generated as residual waveform data.
The effective bit length data generation unit 112 calculates the effective bit length for each sampling residual data of the residual waveform data, and generates the effective bit length data indicating the effective bit length of each sampling residual data of the residual waveform data To do.
The common effective bit length search unit 113 searches the effective bit length data for each effective bit length of a predetermined number of sampling residual data as a processing target and the maximum effective bit length among the processing targets as a common effective bit length. Then, a predetermined number of pieces of common residual data is generated as a predetermined number of pieces of common effective actual data, except for a portion other than the common effective bit length.
The configuration format arrangement unit 114 generates, as encoded data, data in which a predetermined number of common effective real data and information indicating the common effective bit length are arranged in a predetermined configuration format.

これにより、符号化データのデータ量を抑え、ハードウェアへの処理負荷を軽減できる。また、共通有効ビット長以外の部分は、音質に影響がない符号ビットに使用されているので、削除しても音質が劣化することがない。
更に、連続する所定数のサンプリング残差データの共通有効ビット長は、残差波形データによって異なる。即ち、符号化データに配置されている、連続する所定数の残サンプリング残差データの共通有効ビット長は、残差波形データの特性によって変化する。よって、符号化装置1によれば、可変ビットレートによる可逆圧縮が可能となるので、急激に音の波形が変化した場合でも、より高い音質を維持できる符号化が可能となる。
As a result, the amount of encoded data can be reduced, and the processing load on the hardware can be reduced. In addition, since portions other than the common effective bit length are used for code bits that do not affect the sound quality, the sound quality does not deteriorate even if they are deleted.
Furthermore, the common effective bit length of a predetermined number of consecutive sampling residual data differs depending on the residual waveform data. That is, the common effective bit length of a predetermined number of residual sampling residual data arranged in the encoded data varies depending on the characteristics of the residual waveform data. Therefore, according to the encoding device 1, lossless compression at a variable bit rate is possible, and thus encoding that can maintain higher sound quality is possible even when the waveform of a sound suddenly changes.

このような符号化装置1により生成された符号化データを電子楽器で用いることで、復号する場合でもハードウェアへの処理負荷を軽減しつつ、スタジオ等でサンプリングしたPCM波形データに近似した高音質な音を再生できる。また、音質を劣化させることなく、ビットレートを下げることができるので、同時に多くの音を再生する場合でも高音質な音を再生できる。   By using the encoded data generated by such an encoding apparatus 1 with an electronic musical instrument, even when decoding, high sound quality approximating PCM waveform data sampled in a studio or the like while reducing the processing load on hardware. Sound can be played. Further, since the bit rate can be lowered without deteriorating the sound quality, a high-quality sound can be reproduced even when many sounds are reproduced simultaneously.

また、記憶部18は、複数種類の共通有効ビット長毎に、構成フォーマットのブロックに記憶可能な共通有効実データの個数を示す残差波形数が対応付けられている共通化波形数テーブルを記憶する。
共通有効ビット長検索部113は、記憶部18に記憶された共通化波形数テーブルを参照して、共通有効ビット長に基づき、ブロックに含める共通有効実データの所定数を選択する。
In addition, the storage unit 18 stores a common waveform number table in which a residual waveform number indicating the number of common effective real data that can be stored in a block of the configuration format is associated with each of a plurality of types of common effective bit lengths. To do.
The common effective bit length search unit 113 refers to the common waveform number table stored in the storage unit 18 and selects a predetermined number of common effective actual data to be included in the block based on the common effective bit length.

このような共通化波形数テーブルが、復号の処理を実行するハードウェア側でも設けられていれば、復号の処理を実行するハードウェアの処理負担も更に軽減できる。   If such a common waveform number table is also provided on the hardware side that executes the decoding process, the processing load on the hardware that executes the decoding process can be further reduced.

また、構成フォーマットは、構成フォーマットのブロックは、所定数の共通有効実データを配置するデータ部と、共通有効ビットを示す情報を少なくとも配置するヘッダ部と、からなる。   The configuration format block includes a data portion in which a predetermined number of common effective actual data is arranged and a header portion in which at least information indicating the common effective bit is arranged.

これにより、構成フォーマットのデータ部において、連続する所定数の共通有効実データを詰めて配置することで、符号化データのデータ量を抑制し、ハードウェアへの処理負荷を軽減できる。また、共通有効実データが詰めて配置されていても、復号するハードウェアは、ヘッダ部に配置された共通有効ビット長等を参照することで、容易に共通有効実データにアクセスして復号処理を容易に実行できる。   As a result, in the data portion of the configuration format, the predetermined amount of common effective real data is arranged and arranged, thereby suppressing the data amount of the encoded data and reducing the processing load on the hardware. Even if common valid real data is packed and arranged, the decoding hardware can easily access the common valid real data by referring to the common valid bit length etc. arranged in the header part and perform the decoding process. Can be executed easily.

また、記憶部18は、複数の圧縮モードの種類をそれぞれ示す値に、それぞれ異なる線形予測係数a1,a2の組が対応付けられた圧縮モードテーブルを記憶する。
線形予測処理部111は、複数の種類の圧縮モードの各々を用いて、複数の残差波形データを生成し、当該複数の残差波形データのうち適切な1つを選択して出力する。
有効ビット長データ生成部112及び共通有効ビット長検索部113は、線形予測処理部111により選択された1つの残差波形データを処理対象にして処理を実行し、
構成フォーマット配置部114は、更に、処理対象に用いられた圧縮モードを示す情報を、所定の構成フォーマットに配置して、符号化データを生成する。
In addition, the storage unit 18 stores a compression mode table in which different sets of linear prediction coefficients a1 and a2 are associated with values indicating the types of a plurality of compression modes.
The linear prediction processing unit 111 generates a plurality of residual waveform data using each of a plurality of types of compression modes, and selects and outputs an appropriate one of the plurality of residual waveform data.
The effective bit length data generation unit 112 and the common effective bit length search unit 113 execute the processing on one residual waveform data selected by the linear prediction processing unit 111 as a processing target,
The configuration format arrangement unit 114 further arranges information indicating the compression mode used for the processing target in a predetermined configuration format, and generates encoded data.

これにより、圧縮対象の音の性質に応じた適切な圧縮モードで符号化が可能になるので、符号化効率が向上し、その結果、符号化データのデータ量を抑制すると共に、ハードウェアへの処理負荷を軽減することができる。   As a result, encoding can be performed in an appropriate compression mode according to the nature of the sound to be compressed, so that the encoding efficiency is improved. As a result, the amount of encoded data is suppressed, and the hardware Processing load can be reduced.

なお、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。   In addition, this invention is not limited to the above-mentioned embodiment, The deformation | transformation in the range which can achieve the objective of this invention, improvement, etc. are included in this invention.

例えば、上述の実施形態では、予め設定された1ブロックの記憶容量を1024バイトとしているが、これに限らず、5122048バイト等の他の2のべき乗数のバイト数としてもよい。
また、上述の実施形態では、符号化装置1は、ステップS1からステップS4の処理を一連の処理として実行しているが、これに限らず、圧縮モードテーブル(図6参照)に規定された圧縮モードを変えて、ステップS1からステップS3を繰り返し、最小の共通有効ビット長を検索してから、ステップS4に処理を移してもよい。
For example, in the above-described embodiment, the storage capacity of one block set in advance is 1024 bytes. However, the present invention is not limited to this, and the number of bytes may be another power of 2 such as 51222048 bytes.
In the above-described embodiment, the encoding device 1 executes the processing from step S1 to step S4 as a series of processing. However, the present invention is not limited to this, and compression specified in the compression mode table (see FIG. 6). The mode may be changed, and steps S1 to S3 may be repeated to search for the minimum common effective bit length, and then the process may be shifted to step S4.

また、上述の実施形態では、符号化装置1として、情報処理機能を有する電子機器一般を採用することができる。具体的には、例えば、符号化装置1は、ノート型のパーソナルコンピュータ、デスクトップ型のパーソナルコンピュータ、携帯情報端末、携帯電話機、ポータブルゲーム機等によって実現することができる。   In the above-described embodiment, the electronic apparatus in general having an information processing function can be employed as the encoding device 1. Specifically, for example, the encoding device 1 can be realized by a notebook personal computer, a desktop personal computer, a portable information terminal, a mobile phone, a portable game machine, or the like.

上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、図2の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が符号化装置1に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図2の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
The series of processes described above can be executed by hardware or can be executed by software.
In other words, the functional configuration of FIG. 2 is merely an example and is not particularly limited. That is, it is sufficient that the encoding apparatus 1 has a function capable of executing the above-described series of processing as a whole, and what functional blocks are used to realize this function is not particularly limited to the example of FIG. .
In addition, one functional block may be constituted by hardware alone, software alone, or a combination thereof.

一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
When a series of processing is executed by software, a program constituting the software is installed on a computer or the like from a network or a recording medium.
The computer may be a computer incorporated in dedicated hardware. The computer may be a computer capable of executing various functions by installing various programs, for example, a general-purpose personal computer.

このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図3のリムーバブルメディア31により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディア31は、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk−Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini−Disk)等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図3のROM12や、記憶部18に含まれるハードディスク等で構成される。   The recording medium including such a program is not only configured by the removable medium 31 of FIG. 3 distributed separately from the apparatus main body in order to provide the program to the user, but also in a state of being incorporated in the apparatus main body in advance. The recording medium etc. provided in The removable medium 31 is composed of, for example, a magnetic disk (including a floppy disk), an optical disk, a magneto-optical disk, or the like. The optical disk is composed of, for example, a CD-ROM (Compact Disk-Read Only Memory), a DVD (Digital Versatile Disk), or the like. The magneto-optical disk is configured by an MD (Mini-Disk) or the like. In addition, the recording medium provided to the user in a state of being preliminarily incorporated in the apparatus main body includes, for example, the ROM 12 in FIG. 3 in which the program is recorded, the hard disk included in the storage unit 18, and the like.

なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。
In the present specification, the step of describing the program recorded in the recording medium is not limited to the processing performed in time series along the order, but is not necessarily performed in time series, either in parallel or individually. The process to be executed is also included.
Further, in the present specification, the term “system” means an overall apparatus configured by a plurality of devices, a plurality of means, and the like.

以上、本発明の実施形態について説明したが、この実施形態は、例示に過ぎず、本発明の技術的範囲を限定するものではない。本発明はその他の様々な実施形態を取ることが可能であり、更に、本発明の要旨を逸脱しない範囲で、省略や置換等種々の変更を行うことができる。これら実施形態やその変形は、本明細書等に記載された発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   As mentioned above, although embodiment of this invention was described, this embodiment is only an illustration and does not limit the technical scope of this invention. The present invention can take other various embodiments, and various modifications such as omission and replacement can be made without departing from the gist of the present invention. These embodiments and modifications thereof are included in the scope and gist of the invention described in this specification and the like, and are included in the invention described in the claims and the equivalents thereof.

以下に、本願の出願当初の特許請求の範囲に記載された発明を付記する。
[付記1]
符号化対象の音の波形データのサンプリングデータ毎に、予測残差値をサンプリング残差データとして算出し、当該サンプリング残差データの時系列の集合体を残差波形データとして生成する予測処理手段と、
前記予測処理手段により生成された前記残差波形データの各サンプリング残差データ毎に有効ビット長を算出し、前記残差波形データの各サンプリング残差データの前記有効ビット長を示す有効ビット長データを生成する有効ビット長データ生成手段と、
前記有効ビット長データ生成手段により生成された前記有効ビット長データについて、所定数のサンプリング残差データの各有効ビット長を処理対象として、処理対象の中で最大の有効ビット長を共通有効ビット長として検索し、前記所定数のサンプリング残差データの各々から、前記共通有効ビット長以外の部分を削除したものを、前記所定数の共通有効実データとして生成する共通有効ビット長検索手段と、
前記共通有効ビット長検索手段により生成された前記所定数の共通有効実データ、及び前記共通有効ビット長を示す情報を、所定の構成フォーマットに少なくとも配置したデータを、符号化データとして生成する構成フォーマット配置手段と、
を備える符号化装置。
[付記2]
複数種類の前記共通有効ビット長毎に、前記構成フォーマットのブロックに記憶可能な前記共通有効実データの個数を示す残差波形数が対応付けられている共通化波形数テーブルが記憶された記憶手段を、
更に備え、
前記共通有効ビット長検索手段は、前記記憶手段に記憶された前記共通化波形数テーブルを参照して、前記共通有効ビット長に基づき、前記ブロックに含める前記共通有効実データの前記所定数を選択する、
付記1に記載の符号化装置。
[付記3]
前記構成フォーマットの前記ブロックは、前記所定数の前記共通有効実データを配置するデータ部と、前記共通有効ビットを示す情報を少なくとも配置するヘッダ部と、
からなる付記2に記載の符号化装置。
[付記4]
前記記憶手段には更に、圧縮モードの複数の種類を特定可能な圧縮モードテーブルが記憶され、
前記予測処理手段は、前記複数の種類の圧縮モードの各々を用いて、複数の残差波形データを生成し、当該複数の残差波形データのうち所定の1つを選択し、
前記共通有効ビット長検索手段及び前記構成フォーマット配置手段は、前記予測処理手段により選択された1つの前記残差波形データを処理対象にして処理を実行し、
前記構成フォーマット配置手段は、更に、処理対象に用いられた前記圧縮モードを示す情報を、前記所定の構成フォーマットに配置して、前記符号化データを生成する、
付記2又は3に記載の符号化装置。
[付記5]
音のデータを符号化する符号化装置が実行する符号化処理方法において、
符号化対象の音の波形データのサンプリングデータ毎に、予測残差値をサンプリング残差データとして算出し、当該サンプリング残差データの時系列の集合体を残差波形データとして生成する予測処理ステップと、
前記予測処理ステップの処理により生成された前記残差波形データの各サンプリング残差データ毎に有効ビット長を算出し、前記残差波形データの各サンプリング残差データの前記有効ビット長を示す有効ビット長データを生成する有効ビット長データ生成ステップと、
前記有効ビット長データ生成ステップの処理により生成された前記有効ビット長データについて、所定数のサンプリング残差データの各有効ビット長を処理対象として、処理対象の中で最大の有効ビット長を共通有効ビット長として検索し、前記所定数のサンプリング残差データの各々から、前記共通有効ビット長以外の部分を削除したものを、前記所定数の共通有効実データとして生成する共通有効ビット長検索ステップと、
前記共通有効ビット長検索ステップの処理により生成された前記所定数の共通有効実データ、及び前記共通有効ビット長を示す情報を、所定の構成フォーマットに少なくとも配置したデータを、符号化データとして生成する構成フォーマット配置ステップと、
を含む符号化方法。
[付記6]
音のデータを符号化する符号化装置を制御するコンピュータに、
符号化対象の音の波形データのサンプリングデータ毎に、予測残差値をサンプリング残差データとして算出し、サンプリング残差データの時系列の集合体を残差波形データとして生成する予測処理手段、
前記予測処理手段により生成された前記残差波形データの各サンプリング残差データ毎に有効ビット長を算出し、前記残差波形データの各サンプリング残差データの前記有効ビット長を示す有効ビット長データを生成する有効ビット長データ生成手段、
前記有効ビット長データ生成手段により生成された前記有効ビット長データについて、所定数のサンプリング残差データの各有効ビット長を処理対象として、処理対象の中で最大の有効ビット長を共通有効ビット長として検索し、前記所定数のサンプリング残差データの各々から、前記共通有効ビット長以外の部分を削除したものを、前記所定数の共通有効実データとして生成する共通有効ビット長検索手段、
前記共通有効ビット長検索手段により生成された前記所定数の共通有効実データ、及び前記共通有効ビット長を示す情報を、所定の構成フォーマットに少なくとも配置したデータを、符号化データとして生成する構成フォーマット配置手段、
として機能させるプログラム。
The invention described in the scope of claims at the beginning of the filing of the present application will be appended.
[Appendix 1]
A prediction processing unit that calculates a prediction residual value as sampling residual data for each sampling data of waveform data of sound to be encoded, and generates a time series aggregate of the sampling residual data as residual waveform data; ,
Effective bit length data for calculating the effective bit length for each sampling residual data of the residual waveform data generated by the prediction processing means and indicating the effective bit length of each sampling residual data of the residual waveform data Valid bit length data generating means for generating
For the effective bit length data generated by the effective bit length data generation means, each effective bit length of a predetermined number of sampling residual data is processed, and the maximum effective bit length among the processing targets is a common effective bit length. A common effective bit length search means for generating, as the predetermined number of common effective real data, a portion obtained by deleting a portion other than the common effective bit length from each of the predetermined number of sampling residual data,
A configuration format for generating, as encoded data, the predetermined number of common effective real data generated by the common effective bit length search means and data in which information indicating the common effective bit length is arranged at least in a predetermined configuration format Positioning means;
An encoding device comprising:
[Appendix 2]
Storage means storing a common waveform number table in which the number of residual waveforms indicating the number of common effective real data that can be stored in the block of the configuration format is associated with each of the plurality of types of common effective bit lengths The
In addition,
The common effective bit length search means refers to the common waveform number table stored in the storage means and selects the predetermined number of the common effective real data included in the block based on the common effective bit length To
The encoding device according to attachment 1.
[Appendix 3]
The block of the configuration format includes a data part for arranging the predetermined number of the common effective real data, a header part for arranging at least information indicating the common effective bit,
The encoding apparatus according to appendix 2, comprising:
[Appendix 4]
The storage means further stores a compression mode table capable of specifying a plurality of types of compression modes,
The prediction processing means generates a plurality of residual waveform data using each of the plurality of types of compression modes, selects a predetermined one of the plurality of residual waveform data,
The common effective bit length search means and the configuration format arrangement means execute processing with respect to one residual waveform data selected by the prediction processing means,
The configuration format arrangement unit further arranges information indicating the compression mode used for a processing target in the predetermined configuration format, and generates the encoded data.
The encoding device according to appendix 2 or 3.
[Appendix 5]
In an encoding processing method executed by an encoding device that encodes sound data,
A prediction processing step for calculating a prediction residual value as sampling residual data for each sampling data of waveform data of sound to be encoded, and generating a time series aggregate of the sampling residual data as residual waveform data; ,
An effective bit length is calculated for each sampling residual data of the residual waveform data generated by the processing of the prediction processing step, and indicates the effective bit length of each sampling residual data of the residual waveform data An effective bit length data generation step for generating length data;
For the effective bit length data generated by the processing of the effective bit length data generation step, each effective bit length of a predetermined number of sampling residual data is set as a processing target, and the maximum effective bit length among the processing targets is set as a common effective A common effective bit length search step for searching as a bit length and generating, as the predetermined number of common effective actual data, a portion obtained by deleting a portion other than the common effective bit length from each of the predetermined number of sampling residual data; ,
Generating, as encoded data, data in which the predetermined number of common effective actual data generated by the processing of the common effective bit length search step and information indicating the common effective bit length are arranged at least in a predetermined configuration format Configuration format placement step;
An encoding method including:
[Appendix 6]
In a computer that controls an encoding device that encodes sound data,
For each sampling data of the waveform data of the sound to be encoded, a prediction processing unit that calculates a prediction residual value as sampling residual data and generates a time series aggregate of sampling residual data as residual waveform data,
Effective bit length data for calculating the effective bit length for each sampling residual data of the residual waveform data generated by the prediction processing means and indicating the effective bit length of each sampling residual data of the residual waveform data Effective bit length data generating means for generating
For the effective bit length data generated by the effective bit length data generation means, each effective bit length of a predetermined number of sampling residual data is processed, and the maximum effective bit length among the processing targets is a common effective bit length. A common effective bit length search means for generating, as the predetermined number of common effective actual data, a portion obtained by deleting a part other than the common effective bit length from each of the predetermined number of sampling residual data,
A configuration format for generating, as encoded data, the predetermined number of common effective real data generated by the common effective bit length search means and data in which information indicating the common effective bit length is arranged at least in a predetermined configuration format Arrangement means,
Program to function as.

1・・・符号化装置、11・・・CPU、111・・・線形予測処理部、112・・・有効ビット長データ生成部、113・・・共通有効ビット長検索部、114・・・構成フォーマット配置部、12・・・ROM、13・・・RAM、14・・・バス、15・・・入出力インターフェース、16・・・入力部、17・・・出力部、18・・・記憶部、20・・・ドライブ、31・・・リムーバブルメディア

DESCRIPTION OF SYMBOLS 1 ... Coding apparatus, 11 ... CPU, 111 ... Linear prediction process part, 112 ... Effective bit length data generation part, 113 ... Common effective bit length search part, 114 ... Configuration Format arrangement unit, 12 ... ROM, 13 ... RAM, 14 ... bus, 15 ... input / output interface, 16 ... input unit, 17 ... output unit, 18 ... storage unit , 20 ... drive, 31 ... removable media

Claims (6)

符号化対象の音の波形データのサンプリングデータ毎に、予測残差値をサンプリング残差データとして算出し、当該サンプリング残差データの時系列の集合体を残差波形データとして生成する予測処理手段と、
前記予測処理手段により生成された前記残差波形データの各サンプリング残差データ毎に有効ビット長を算出し、前記残差波形データの各サンプリング残差データの前記有効ビット長を示す有効ビット長データを生成する有効ビット長データ生成手段と、
前記有効ビット長データ生成手段により生成された前記有効ビット長データについて、所定数のサンプリング残差データの各有効ビット長を処理対象として、処理対象の中で最大の有効ビット長を共通有効ビット長として検索し、前記所定数のサンプリング残差データの各々から、前記共通有効ビット長以外の部分を削除したものを、前記所定数の共通有効実データとして生成する共通有効ビット長検索手段と、
前記共通有効ビット長検索手段により生成された前記所定数の共通有効実データ、及び前記共通有効ビット長を示す情報を、所定の構成フォーマットに少なくとも配置したデータを、符号化データとして生成する構成フォーマット配置手段と、
を備える符号化装置。
A prediction processing unit that calculates a prediction residual value as sampling residual data for each sampling data of waveform data of sound to be encoded, and generates a time series aggregate of the sampling residual data as residual waveform data; ,
Effective bit length data for calculating the effective bit length for each sampling residual data of the residual waveform data generated by the prediction processing means and indicating the effective bit length of each sampling residual data of the residual waveform data Valid bit length data generating means for generating
For the effective bit length data generated by the effective bit length data generation means, each effective bit length of a predetermined number of sampling residual data is processed, and the maximum effective bit length among the processing targets is a common effective bit length. A common effective bit length search means for generating, as the predetermined number of common effective real data, a portion obtained by deleting a portion other than the common effective bit length from each of the predetermined number of sampling residual data,
A configuration format for generating, as encoded data, the predetermined number of common effective real data generated by the common effective bit length search means and data in which information indicating the common effective bit length is arranged at least in a predetermined configuration format Positioning means;
An encoding device comprising:
複数種類の前記共通有効ビット長毎に、前記構成フォーマットのブロックに記憶可能な前記共通有効実データの個数を示す残差波形数が対応付けられている共通化波形数テーブルが記憶された記憶手段を、
更に備え、
前記共通有効ビット長検索手段は、前記記憶手段に記憶された前記共通化波形数テーブルを参照して、前記共通有効ビット長に基づき、前記ブロックに含める前記共通有効実データの前記所定数を選択する、
請求項1に記載の符号化装置。
Storage means storing a common waveform number table in which the number of residual waveforms indicating the number of common effective real data that can be stored in the block of the configuration format is associated with each of the plurality of types of common effective bit lengths The
In addition,
The common effective bit length search means refers to the common waveform number table stored in the storage means and selects the predetermined number of the common effective real data included in the block based on the common effective bit length To
The encoding device according to claim 1.
前記構成フォーマットの前記ブロックは、前記所定数の前記共通有効実データを配置するデータ部と、前記共通有効ビットを示す情報を少なくとも配置するヘッダ部と、
からなる請求項2に記載の符号化装置。
The block of the configuration format includes a data part for arranging the predetermined number of the common effective real data, a header part for arranging at least information indicating the common effective bit,
The encoding device according to claim 2, comprising:
前記記憶手段には更に、圧縮モードの複数の種類を特定可能な圧縮モードテーブルが記憶され、
前記予測処理手段は、前記複数の種類の圧縮モードの各々を用いて、複数の残差波形データを生成し、当該複数の残差波形データのうち所定の1つを選択し、
前記有効ビット長データ生成手段及び前記共通有効ビット長検索手段は、前記予測処理手段により選択された1つの前記残差波形データを処理対象にして処理を実行し、
前記構成フォーマット配置手段は、更に、処理対象に用いられた前記圧縮モードを示す情報を、前記所定の構成フォーマットに配置して、前記符号化データを生成する、
請求項2又は3に記載の符号化装置。
The storage means further stores a compression mode table capable of specifying a plurality of types of compression modes,
The prediction processing means generates a plurality of residual waveform data using each of the plurality of types of compression modes, selects a predetermined one of the plurality of residual waveform data,
The effective bit length data generation means and the common effective bit length search means execute processing with respect to one residual waveform data selected by the prediction processing means,
The configuration format arrangement unit further arranges information indicating the compression mode used for a processing target in the predetermined configuration format, and generates the encoded data.
The encoding device according to claim 2 or 3.
音のデータを符号化する符号化装置が実行する符号化処理方法において、
符号化対象の音の波形データのサンプリングデータ毎に、予測残差値をサンプリング残差データとして算出し、当該サンプリング残差データの時系列の集合体を残差波形データとして生成する予測処理ステップと、
前記予測処理ステップの処理により生成された前記残差波形データの各サンプリング残差データ毎に有効ビット長を算出し、前記残差波形データの各サンプリング残差データの前記有効ビット長を示す有効ビット長データを生成する有効ビット長データ生成ステップと、
前記有効ビット長データ生成ステップの処理により生成された前記有効ビット長データについて、所定数のサンプリング残差データの各有効ビット長を処理対象として、処理対象の中で最大の有効ビット長を共通有効ビット長として検索し、前記所定数のサンプリング残差データの各々から、前記共通有効ビット長以外の部分を削除したものを、前記所定数の共通有効実データとして生成する共通有効ビット長検索ステップと、
前記共通有効ビット長検索ステップの処理により生成された前記所定数の共通有効実データ、及び前記共通有効ビット長を示す情報を、所定の構成フォーマットに少なくとも配置したデータを、符号化データとして生成する構成フォーマット配置ステップと、
を含む符号化方法。
In an encoding processing method executed by an encoding device that encodes sound data,
A prediction processing step for calculating a prediction residual value as sampling residual data for each sampling data of waveform data of sound to be encoded, and generating a time series aggregate of the sampling residual data as residual waveform data; ,
An effective bit length is calculated for each sampling residual data of the residual waveform data generated by the processing of the prediction processing step, and indicates the effective bit length of each sampling residual data of the residual waveform data An effective bit length data generation step for generating length data;
For the effective bit length data generated by the processing of the effective bit length data generation step, each effective bit length of a predetermined number of sampling residual data is set as a processing target, and the maximum effective bit length among the processing targets is set as a common effective A common effective bit length search step for searching as a bit length and generating, as the predetermined number of common effective actual data, a portion obtained by deleting a portion other than the common effective bit length from each of the predetermined number of sampling residual data; ,
Generating, as encoded data, data in which the predetermined number of common effective actual data generated by the processing of the common effective bit length search step and information indicating the common effective bit length are arranged at least in a predetermined configuration format Configuration format placement step;
An encoding method including:
音のデータを符号化する符号化装置を制御するコンピュータに、
符号化対象の音の波形データのサンプリングデータ毎に、予測残差値をサンプリング残差データとして算出し、サンプリング残差データの時系列の集合体を残差波形データとして生成する予測処理手段、
前記予測処理手段により生成された前記残差波形データの各サンプリング残差データ毎に有効ビット長を算出し、前記残差波形データの各サンプリング残差データの前記有効ビット長を示す有効ビット長データを生成する有効ビット長データ生成手段、
前記有効ビット長データ生成手段により生成された前記有効ビット長データについて、所定数のサンプリング残差データの各有効ビット長を処理対象として、処理対象の中で最大の有効ビット長を共通有効ビット長として検索し、前記所定数のサンプリング残差データの各々から、前記共通有効ビット長以外の部分を削除したものを、前記所定数の共通有効実データとして生成する共通有効ビット長検索手段、
前記共通有効ビット長検索手段により生成された前記所定数の共通有効実データ、及び前記共通有効ビット長を示す情報を、所定の構成フォーマットに少なくとも配置したデータを、符号化データとして生成する構成フォーマット配置手段、
として機能させるプログラム。
In a computer that controls an encoding device that encodes sound data,
For each sampling data of the waveform data of the sound to be encoded, a prediction processing unit that calculates a prediction residual value as sampling residual data and generates a time series aggregate of sampling residual data as residual waveform data,
Effective bit length data for calculating the effective bit length for each sampling residual data of the residual waveform data generated by the prediction processing means and indicating the effective bit length of each sampling residual data of the residual waveform data Effective bit length data generating means for generating
For the effective bit length data generated by the effective bit length data generation means, each effective bit length of a predetermined number of sampling residual data is processed, and the maximum effective bit length among the processing targets is a common effective bit length. A common effective bit length search means for generating, as the predetermined number of common effective actual data, a portion obtained by deleting a part other than the common effective bit length from each of the predetermined number of sampling residual data,
A configuration format for generating, as encoded data, the predetermined number of common effective real data generated by the common effective bit length search means and data in which information indicating the common effective bit length is arranged at least in a predetermined configuration format Arrangement means,
Program to function as.
JP2012061881A 2012-03-19 2012-03-19 Coding device, coding method, and program Pending JP2013195646A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012061881A JP2013195646A (en) 2012-03-19 2012-03-19 Coding device, coding method, and program
US13/727,370 US9165563B2 (en) 2012-03-19 2012-12-26 Coding device, coding method, decoding device, decoding method, and storage medium
CN201310051631.1A CN103325376B (en) 2012-03-19 2013-02-17 Code device, coding method, decoding device and coding/decoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012061881A JP2013195646A (en) 2012-03-19 2012-03-19 Coding device, coding method, and program

Publications (1)

Publication Number Publication Date
JP2013195646A true JP2013195646A (en) 2013-09-30

Family

ID=49394674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012061881A Pending JP2013195646A (en) 2012-03-19 2012-03-19 Coding device, coding method, and program

Country Status (1)

Country Link
JP (1) JP2013195646A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04361296A (en) * 1991-06-09 1992-12-14 Yamaha Corp Method and device for compressing waveform data and reproducing device
JPH05303383A (en) * 1992-04-24 1993-11-16 Yamaha Corp Waveform data compressing method and waveform data reproducing device
JP2004126127A (en) * 2002-10-01 2004-04-22 Yamaha Corp Compression data structure, waveform generating device, and waveform storage device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04361296A (en) * 1991-06-09 1992-12-14 Yamaha Corp Method and device for compressing waveform data and reproducing device
JPH05303383A (en) * 1992-04-24 1993-11-16 Yamaha Corp Waveform data compressing method and waveform data reproducing device
JP2004126127A (en) * 2002-10-01 2004-04-22 Yamaha Corp Compression data structure, waveform generating device, and waveform storage device

Similar Documents

Publication Publication Date Title
EP1028411B1 (en) Coding apparatus
CN101116136B (en) Sound synthesis
US8606567B2 (en) Signal encoding apparatus, signal decoding apparatus, signal processing system, signal encoding process method, signal decoding process method, and program
US7276655B2 (en) Music synthesis system
CN105719640A (en) SOUND SYNTHESIS DEVICE and SOUND SYNTHESIS METHOD
US20100329470A1 (en) Audio information processing apparatus and method
US9165563B2 (en) Coding device, coding method, decoding device, decoding method, and storage medium
KR20100024727A (en) Apparatus and method for playing audio sources for portable terminal
JPH07199996A (en) Device and method for waveform data encoding, decoding device for waveform data, and encoding and decoding device for waveform data
JP2008170488A (en) Waveform compressing apparatus, waveform decompressing apparatus, program and method for producing compressed data
US20030108108A1 (en) Decoder, decoding method, and program distribution medium therefor
JP2005512134A (en) Digital audio with parameters for real-time time scaling
JP4787316B2 (en) Digital signal processing apparatus and overtone generation method
JP2003511776A (en) Method and apparatus for interpolating digital signals
JP2013195646A (en) Coding device, coding method, and program
JP2014021162A (en) Decoding device, decoding method, and program
JP4888048B2 (en) Audio signal encoding / decoding method, apparatus and program for implementing the method
JP2004163681A (en) Device and computer program for speech signal processing
KR100468971B1 (en) Device for music reproduction based on melody
JP2012108254A (en) Audio format conversion apparatus and audio format conversion method
KR100598209B1 (en) MIDI playback equipment and method
JP5552794B2 (en) Method and apparatus for encoding acoustic signal
US7151215B2 (en) Waveform adjusting system for music file
WO2017164216A1 (en) Acoustic processing method and acoustic processing device
JPH0573098A (en) Speech processor

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140501

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141224