JP2003241800A - Method and device for time-base companding of digital signal - Google Patents

Method and device for time-base companding of digital signal

Info

Publication number
JP2003241800A
JP2003241800A JP2003032679A JP2003032679A JP2003241800A JP 2003241800 A JP2003241800 A JP 2003241800A JP 2003032679 A JP2003032679 A JP 2003032679A JP 2003032679 A JP2003032679 A JP 2003032679A JP 2003241800 A JP2003241800 A JP 2003241800A
Authority
JP
Japan
Prior art keywords
waveform
companding
time
digital signal
waveforms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003032679A
Other languages
Japanese (ja)
Inventor
Shinji Hizuka
真二 肥塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2003032679A priority Critical patent/JP2003241800A/en
Publication of JP2003241800A publication Critical patent/JP2003241800A/en
Pending legal-status Critical Current

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To prevent sound quality from deteriorating at a join part of waveforms. <P>SOLUTION: In a waveform memory 1, the waveform of a source digital signal to be processed by time-base companding is stored. Both ends of a waveform read out of the waveform memory 1 are joined through the cross- fading of a cross-fading part 4. A readout position control part 2, a similarity arithmetic part 3, and a control part 6 controls at least the cutting position and length of a waveform so that the time-base companding of the source digital signal is performed with a specified companding rate. A control part 6 calculates companding parameters including a search start position and a search end position for searching for a cutting position of a waveform to be cut next and determines the cutting start position of the waveform to be cut at a position where waveforms to be cross-faded are the most similar between the search start position and search end position while cutting the waveforms so that the total companding rate reaches the specified companding rate. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】この発明は、原ディジタル信
号のピッチを変えずに原ディジタル信号を所望とする圧
伸率で時間軸圧伸するディジタル信号の時間軸圧伸装置
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a time axis companding apparatus for a digital signal which compands the time axis at a desired companding ratio of the original digital signal without changing the pitch of the original digital signal.

【0002】[0002]

【従来の技術】ディジタル・オーディオ信号のピッチを
変えずにその時間軸を圧縮又は伸長する時間軸圧伸技術
は、例えば、収録されたディジタルオーディオ信号の全
体的な収録時間を所定の時間に合わせ込む、いわゆる
「尺合わせ」や、カラオケ装置等のテンポ変換等に利用
される。この種の時間軸圧伸技術としては、従来より、
図9に示すようなカット・アンド・スプライス法が知ら
れている。この手法は、原オーディオ信号Sから所定の
長さの波形を順次切り出して、切り出した波形をつなぎ
合わせていくもので、切り出し波形同士のつなぎの部分
では、波形の不連続が生じるので、クロスフェード処理
を行って、フレームのつなぎ部分を滑らかにする。切り
出す長さをLs、切り出された波形の後ろの端部から次
の切り出し位置までのオフセット長さをLoffとする
と、圧伸率Rは下記数1のように表される。
2. Description of the Related Art A time axis companding technique for compressing or expanding the time axis of a digital audio signal without changing the pitch thereof is, for example, to adjust the entire recording time of a recorded digital audio signal to a predetermined time. It is used for the so-called "measurement", the tempo conversion of a karaoke device, etc. For this type of time axis companding technology,
A cut and splice method as shown in FIG. 9 is known. In this method, a waveform of a predetermined length is sequentially cut out from the original audio signal S, and the cut-out waveforms are connected together. Since discontinuity of the waveform occurs at the connection portion between the cut-out waveforms, crossfading occurs. Perform processing to smooth the joints in the frame. When the cut length is Ls and the offset length from the rear end of the cut waveform to the next cut position is Loff, the companding ratio R is expressed by the following formula 1.

【0003】[0003]

【数1】R=Ls/(Ls+Loff)[Formula 1] R = Ls / (Ls + Loff)

【0004】同図(a)のように、時間軸伸長の場合に
は、オフセットLoffは負の値となり、圧伸率R>1と
なる。また、同図(b)のように、時間軸圧縮の場合に
は、オフセットLoffは正の値となり、圧伸率R<1と
なる。従って、圧伸率Rが与えられ、切り出す長さLs
が与えられたら、オフセットLoffが、数2のように一
義的に求められる。
As shown in FIG. 1A, in the case of time axis expansion, the offset Loff has a negative value and the companding ratio R> 1. Further, as shown in FIG. 6B, in the case of time axis compression, the offset Loff has a positive value and the companding ratio R <1. Therefore, the draw ratio R is given, and the cut length Ls
Is given, the offset Loff is uniquely obtained as shown in Equation 2.

【0005】[0005]

【数2】Loff=[(1−R)/R]・Ls[Formula 2] Loff = [(1-R) / R] · Ls

【0006】[0006]

【発明が解決しようとする課題】しかしながら、従来の
時間軸圧伸方式では、波形の状態に拘わりなく圧伸率か
ら決定された一定のオフセットLoffの位置で波形をつ
なぎ合わせるようにしていたので、クロスフェード処理
を行うにしても、波形のつなぎ部分ではどうしても位相
ずれが発生し、これが音質劣化を招く原因となってい
た。
However, in the conventional time-axis companding method, the waveforms are connected at the position of a constant offset Loff determined from the companding ratio regardless of the state of the waveform. Even if the cross-fade process is performed, a phase shift inevitably occurs at the connecting portion of the waveform, which causes deterioration of sound quality.

【0007】この発明は、このような問題点に鑑みなさ
れたもので、波形のつなぎ部分で音質劣化が生じること
がなく、所望の圧伸率で圧伸された出力信号を得ること
ができるディジタル信号の時間軸圧伸方法及び装置を提
供することを目的とする。
The present invention has been made in view of the above problems, and a digital signal capable of obtaining a companded output signal at a desired companding ratio without causing deterioration of sound quality at a connecting portion of a waveform. An object is to provide a time axis companding method and apparatus for signals.

【0008】[0008]

【課題を解決するための手段】この発明に係るディジタ
ル信号の時間軸圧伸方法は、時間軸圧伸すべき原ディジ
タル信号から所定長さの波形を順次切り出して、各切り
出された波形の両端をクロスフェードさせながら結合す
ることにより、指定された圧伸率で時間軸圧伸された出
力信号を生成するディジタル信号の時間軸圧伸方法にお
いて、次に切り出す波形の切り出し開始位置を、所定の
探索開始位置から探索終了位置までの間の、クロスフェ
ードされる波形同士が最も類似する位置に決定し、前記
決定された波形の切り出し開始位置に応じて全体的な圧
伸率が前記指定された圧伸率となるような長さで次の波
形を切り出すようにしたことを特徴とする。
According to a method of companding a time axis of a digital signal according to the present invention, a waveform of a predetermined length is sequentially cut out from an original digital signal to be subjected to time axis companding, and both ends of each cut out waveform. In the time axis companding method for a digital signal that generates an output signal that is time axis companded at a specified companding rate by coupling while crossfading, the cutout starting position of the next waveform to be cut is set to a predetermined value. Between the search start position and the search end position, the waveforms to be cross-faded are determined to be positions most similar to each other, and the overall companding ratio is specified according to the cut-out start position of the determined waveforms. It is characterized in that the following waveform is cut out with a length that provides a draw ratio.

【0009】また、この発明に係るディジタル信号の時
間軸圧伸装置は、時間軸圧伸すべき原ディジタル信号の
波形を記憶する波形記憶手段と、この波形記憶手段から
切り出された波形の両端をクロスフェードさせながら結
合するクロスフェード手段と、前記原ディジタル信号が
指定された圧伸率で時間軸圧伸されるように、少なくと
も前記波形の切り出し位置及び長さを制御する制御手段
とを備えたディジタル信号の時間軸圧伸装置において、
前記制御手段は、前記指定された圧伸率に基づいて、次
に切り出す波形の切り出し開始位置を探索するための探
索開始位置及び探索終了位置を含む圧伸パラメータを算
出すると共に、前記切り出す波形の切り出し開始位置
を、前記探索開始位置から探索終了位置までの間のクロ
スフェードされる波形同士が最も類似する位置に決定
し、前記決定された波形の切り出し開始位置に応じて全
体的な圧伸率が前記指定された圧伸率となるような長さ
で次の波形を切り出すものであることを特徴とする。
Further, the time-base companding device for a digital signal according to the present invention has a waveform storing means for storing the waveform of the original digital signal to be time-compressed and both ends of the waveform cut out from the waveform storing means. Crossfading means for coupling while crossfading is provided, and control means for controlling at least the cut-out position and length of the waveform so that the original digital signal is time-axis companded at a designated companding ratio. In the time axis companding device for digital signals,
Based on the designated companding ratio, the control means calculates a companding parameter including a search start position and a search end position for searching a cutout starting position of a waveform to be cut out next, and the waveform to be cut out. The cutout start position is determined at a position where the crossfaded waveforms between the search start position and the search end position are most similar to each other, and the overall companding ratio is determined according to the cutout start position of the determined waveform. Is to cut out the next waveform with a length such that the specified draw ratio is obtained.

【0010】この発明によれば、切り出した波形同士を
クロスフェードして結合するに際し、次に切り出す波形
の切り出し開始位置として、クロスフェードされる波形
同士が最も類似する位置が選択されので、最適なクロス
フェードポイントが選択され、つなぎ部分で位相ずれ等
が生じることなく、滑らかな結合が可能になる。このた
め、音質劣化を招くことなしに時間軸圧伸出力を得るこ
とができる。
According to the present invention, when the cut-out waveforms are cross-faded and combined, the position where the cross-faded waveforms are most similar to each other is selected as the cut-out start position of the next cut-out waveform. A crossfade point is selected, and smooth coupling is possible without causing a phase shift or the like at the connecting portion. Therefore, the time axis companding output can be obtained without deteriorating the sound quality.

【0011】なお、圧伸率が1から離れれば離れるほど
(圧縮率や伸長率が高くなればなるほど)、原ディジタ
ル信号との近似性がなくなってくるので、波形のつなぎ
部分がより不自然になりやすい。このため、切り出され
た波形同士をつなぐクロスフェードの時間を圧伸率が1
から離れるに従って長くなるように適応的に変化させる
ことが望ましい。
It should be noted that the further the companding ratio is from 1 (the higher the compressing ratio and the expanding ratio are), the closer the approximation to the original digital signal is, so that the connecting portion of the waveform becomes more unnatural. Prone. Therefore, the companding rate is 1 when the crossfade time for connecting the cut out waveforms is
It is desirable to adaptively change the length so that it becomes longer as it gets away from.

【0012】また、クロスフェード時間が長い場合、類
似度計算に時間がかかるので、クロスフェードされる波
形同士の類似度を計算するための原ディジタル信号のサ
ンプリング間隔を、クロスフェードの時間が長い場合に
は粗く、短い場合には細かくなるように設定することが
望ましい。
Further, if the crossfade time is long, it takes a long time to calculate the similarity. Therefore, if the crossfading time is long, the sampling interval of the original digital signal for calculating the similarity between the crossfaded waveforms is long. It is desirable to set it so that it is coarse and fine when it is short.

【0013】[0013]

【発明の実施の形態】以下、図面を参照して、この発明
の好ましい実施の形態について説明する。図1は、この
発明の一実施例に係るディジタル信号の時間軸圧伸装置
の構成を示すブロック図である。時間軸圧伸すべき原デ
ィジタル・オーディオ信号は、波形メモリ1に順次格納
される。波形メモリ1は、少なくとも波形の切り出し開
始位置の探索に必要な量が格納されるリングバッファで
ある。波形メモリ1に格納されたオーディオ信号は、読
出位置制御部2の制御に基づき種々の切り出し開始位置
から所定のデータ長で順次読み出される。類似度演算部
3は、予め決定された探索開始位置から探索終了位置ま
でクロスフェードされる波形同士の類似度を計算し、類
似度が最も大きくなる(誤差が最も小さくなる)切り出
し開始位置を求める。読出位置制御部2は、類似度演算
部3で求められた類似度が最も高くなる読出位置の情報
に基づいて波形メモリ1からの2つのデータの読出位置
を制御する。波形メモリ1から読み出されたデータD
1,D2は、クロスフェード部4に供給され、ここでク
ロスフェード処理される。クロスフェード処理されたデ
ータは、出力カウント部5を介して圧伸された出力信号
として出力される。出力カウント部5は、出力信号のデ
ータ数をカウントする。制御部6は、外部から指定され
た圧伸率Rに基づいて、クロスフェード時間や探索範囲
等を決定したり、類似度演算部3で求められた切り出し
開始位置に基づいて切り出しデータ長等を決定する。ま
た、制御部6は、決定された切り出しデータ長を出力カ
ウント部5にセットし、出力カウント部5が制御部6に
よってセットされた切り出しデータ長をカウントした
ら、次の切り出し位置の探索を実行するように各部を制
御する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of a time signal companding device for digital signals according to an embodiment of the present invention. The original digital audio signal to be time-compressed is sequentially stored in the waveform memory 1. The waveform memory 1 is a ring buffer that stores at least an amount required for searching for a waveform cutting start position. The audio signal stored in the waveform memory 1 is sequentially read out from various cutting start positions with a predetermined data length under the control of the reading position control unit 2. The similarity calculation unit 3 calculates the similarity between the waveforms that are cross-faded from the predetermined search start position to the search end position, and obtains the cutout start position with the highest similarity (the smallest error). . The read position control unit 2 controls the read positions of the two data from the waveform memory 1 based on the read position information having the highest similarity obtained by the similarity calculation unit 3. Data D read from waveform memory 1
1, 1 and 2 are supplied to the crossfade section 4, where they are subjected to crossfade processing. The data that has been subjected to the crossfade processing is output as an expanded output signal via the output counting unit 5. The output counting unit 5 counts the number of data of output signals. The control unit 6 determines the crossfade time, the search range, and the like based on the companding ratio R designated from the outside, and determines the cutout data length and the like based on the cutout start position obtained by the similarity calculation unit 3. decide. In addition, the control unit 6 sets the determined cutout data length in the output counting unit 5, and when the output count unit 5 counts the cutout data length set by the control unit 6, executes the search for the next cutout position. To control each part.

【0014】次にこのように構成された時間軸圧伸装置
の動作を説明する。図2は、圧伸率Rを説明するための
図である。同図(a)に示すように原ディジタル信号の
長さをL1、出力ディジタル信号の長さをL2(但しL
2<L1)としたとき、圧伸率Rは、R=L2/L1で
求められる。この場合R<1.0であるから、出力ディ
ジタル信号は、時間軸圧縮された圧縮ディジタルデータ
となる。また同図(c)に示すように、出力ディジタル
信号の長さをL3(但しL3>L1)としたとき、圧伸
率R=L3/L1>1.0となり、出力ディジタル信号
は時間軸伸長された伸長ディジタルデータとなる。尺合
わせ等の用途では、出力ディジタル信号の収録時間に合
わせるように原ディジタル信号の時間軸を圧縮又は伸長
するので、予め収録されている原ディジタル信号の収録
時間と目標とする収録時間とから圧伸率Rが決められ
る。
Next, the operation of the time axis companding device thus constructed will be described. FIG. 2 is a diagram for explaining the companding ratio R. As shown in FIG. 3A, the length of the original digital signal is L1, and the length of the output digital signal is L2 (however, L
When 2 <L1), the companding ratio R is calculated by R = L2 / L1. In this case, since R <1.0, the output digital signal is compressed digital data which is time-axis compressed. Further, as shown in FIG. 7C, when the length of the output digital signal is L3 (where L3> L1), the companding ratio R = L3 / L1> 1.0, and the output digital signal is expanded on the time axis. It becomes decompressed digital data. In applications such as scaling, the time axis of the original digital signal is compressed or expanded so as to match the recording time of the output digital signal.Therefore, the recording time of the original digital signal previously recorded and the target recording time are used for compression. The elongation R is determined.

【0015】圧伸率Rはまた、前述したように波形の切
り出し長さLsと、切り出された波形の後端位置から次
の切り出し波形の先頭位置までのオフセットの長さLof
fによって表すこともできるので、オフセットの長さLo
ffが変わっても、これに合わせて切り出し波形の長さL
sを変えることによって一定の圧伸率Rに合わせ込むこ
とができる。そこで、この実施例では、時間軸圧縮の場
合は図3に示すように、また時間軸伸長の場合には図4
に示すように、次に切り出す波形の先頭位置を、所定の
探索開始位置tsから探索終了位置teまで移動させた
ときに、現在の終端部と次に切り出す波形の先端部のク
ロスフェード期間tcfの波形が最も類似する位置txを
求め、その位置から次の波形を切り出すようにしてい
る。txを切り出し先頭位置とした場合のクロスフェー
ド波形の類似度S(x)は、下記数3のように誤差の二
乗和の形で求められる。勿論、これは一例であり、類似
度S(x)を誤差の絶対値和で求めるようにしても良
い。
As described above, the companding ratio R is also the cut-out length Ls of the waveform and the length Lof of the offset from the rear end position of the cut-out waveform to the start position of the next cut-out waveform.
It can be represented by f, so the offset length Lo
Even if ff changes, the length L of the cut-out waveform is adjusted to match this
By changing s, a constant companding ratio R can be adjusted. Therefore, in this embodiment, as shown in FIG. 3 in the case of time axis compression, and as shown in FIG.
As shown in, when the head position of the waveform to be cut out next is moved from the predetermined search start position ts to the search end position te, the cross-fade period tcf of the current end portion and the tip end portion of the waveform to be cut out next is set. The position tx having the most similar waveform is obtained, and the next waveform is cut out from that position. The similarity S (x) of the crossfade waveform when tx is the cutout start position is obtained in the form of the sum of squared errors as shown in the following Expression 3. Of course, this is an example, and the similarity S (x) may be obtained by the sum of absolute values of errors.

【0016】[0016]

【数3】 [Equation 3]

【0017】切り出し先頭位置txが決定されると、次
に切り出す波形の長さが決まる。即ち、i-1番目に決定
されたオフセットの長さをLoffi-1とすると、次に切り
出す波形の長さLsiは、
When the cutting start position tx is determined, the length of the waveform to be cut out next is determined. That is, assuming that the length of the i-1th determined offset is Loffi-1, the length Lsi of the waveform to be cut out next is

【0018】[0018]

【数4】Lsi=R/(1−R)・Loffi-1 (ただし、R≠1、Loffi-1>0のとき圧縮 Loff-1<0のとき伸長)[Formula 4] Lsi = R / (1-R) · Loffi-1 (However, if R ≠ 1, Loffi-1> 0, compress Expanded when Loff-1 <0)

【0019】で求めることができる。なお、切り出す波
形の長さLsiは、上式に拘わらず、最低切り出し長さL
sminを設定し、この最低切り出し長さLsminよりも短く
ならないように設定することが望ましい。この最低切り
出し長さLsminとしては、例えば最低周波数を50Hz
として20msecとする。また、これに対応して探索範囲
ts−teも、20msec程度に設定する。具体的な探索
開始位置tsと探索終了位置teは、例えば、ts=5
msec,te=25msecのように決定すればよい。
It can be obtained by The length Lsi of the cutout waveform is the minimum cutout length L regardless of the above formula.
It is desirable to set smin so that it is not shorter than this minimum cutout length Lsmin. As the minimum cutout length Lsmin, for example, the minimum frequency is 50 Hz
As 20 msec. Correspondingly, the search range ts-te is also set to about 20 msec. The specific search start position ts and search end position te are, for example, ts = 5.
It may be determined as msec, te = 25 msec.

【0020】なお、圧伸率が1から離れれば離れるほど
(圧縮率や伸長率が高くなればなるほど)、原ディジタ
ル信号との近似性がなくなってくるので、波形のつなぎ
部分がより不自然になりやすい。このため、最適なクロ
スフェード期間の長さtcfを、圧伸率が1から離れるに
つれて長くするように適応的に変化させることが望まし
い。より具体的には、例えば圧縮率50%又は伸長率2
00%の場合、切り出し波形の長さLsiの50%程度を
クロスフェード期間の長さtcfとして設定し、圧伸率が
100%に近づくにつれて切り出し波形の長さLsiに対
するクロスフェード期間tcfの割合を0%に近づけるよ
うにする。
It should be noted that the further the companding ratio is from 1 (the higher the compressing ratio and the expanding ratio are), the closer the approximation to the original digital signal is, so that the connecting portion of the waveform becomes more unnatural. Prone. For this reason, it is desirable to adaptively change the optimum crossfade period length tcf so that it becomes longer as the companding ratio deviates from 1. More specifically, for example, a compression rate of 50% or an expansion rate of 2
In the case of 00%, about 50% of the length Lsi of the cutout waveform is set as the length tcf of the crossfade period, and the ratio of the crossfade period tcf to the length Lsi of the cutout waveform is set as the companding ratio approaches 100%. Try to get close to 0%.

【0021】また、クロスフェード期間の長さtcfが長
い場合、前述した類似度の計算に時間がかかるので、類
似度計算のステップ幅を、クロスフェード期間の長さt
cfに応じて変化させるようにしても良い。例えば圧縮率
50%又は伸長率200%では、3〜5サンプルおきに
データを比較して類似度を計算し、圧伸率が100%に
近づくにつれて1サンプルずつのデータ比較に近づけ
る。クロスフェード波形の類似度を探すような用途で
は、振幅レベルの大きな変動を伴うピッチ波形での相関
がとれればよいので、小さな変動部分はあまり考慮する
必要はなく、このような処理を行っても結果に大きな差
がでることはない。
If the length tcf of the crossfade period is long, it takes time to calculate the degree of similarity described above. Therefore, the step width of the degree of similarity calculation is set to the length t of the crossfade period.
You may make it change according to cf. For example, when the compression ratio is 50% or the expansion ratio is 200%, the data is compared every 3 to 5 samples to calculate the degree of similarity, and as the companding ratio approaches 100%, the data comparison is made closer to each sample. In applications such as searching for cross-fade waveform similarity, it suffices to obtain correlation in pitch waveforms that involve large fluctuations in amplitude level, so it is not necessary to consider small fluctuations much, and even if such processing is performed, There is no big difference in the results.

【0022】図5は、この装置による原ディジタル信号
の時間軸圧伸手順を示すフローチャートである。まず、
制御部6は与えられた圧伸率Rに基づいて圧伸パラメー
タを求める(S1)。圧伸パラメータには、クロスフェ
ード時間tcf、類似度計算のステップ幅Δt、探索開始
時間ts、探索終了時間teが含まれる。次に、波形メ
モリ1に、少なくとも切り出し位置探索に必要な量の原
ディジタル信号波形のデータがバッファリングされる
(S2)。
FIG. 5 is a flow chart showing the time axis companding procedure of the original digital signal by this apparatus. First,
The control unit 6 obtains a companding parameter based on the given companding ratio R (S1). The companding parameters include a crossfade time tcf, a step width Δt for similarity calculation, a search start time ts, and a search end time te. Next, at least the amount of data of the original digital signal waveform necessary for searching the cutout position is buffered in the waveform memory 1 (S2).

【0023】続いて、ステップS1で求められた圧伸パ
ラメータに基づいて類似度演算部3がクロスフェード部
分の類似度を計算し、類似度の最も高い(Sが最も小さ
い)位置txを制御部6及び読出位置制御部2に送る
(S3)。
Then, the similarity calculator 3 calculates the similarity of the crossfade portion based on the companding parameter obtained in step S1, and the position tx having the highest similarity (S is the smallest) is determined by the controller. 6 and the read position controller 2 (S3).

【0024】図6は、類似度計算の手順を示したフロー
チャートである。まず、探索のためのパラメータiを0
にリセットし、類似度Sとして初期値Smaxを与え、現
在位置Tを探索開始位置tsにセットする(S11)。
次に、切り出し位置txとして、ts+iをセットし
(S12)、jを0からtcfまで変化させながら、下記
数5の計算を行う(S14〜S17)。
FIG. 6 is a flow chart showing the procedure of similarity calculation. First, the parameter i for searching is set to 0
, The initial value Smax is given as the similarity S, and the current position T is set to the search start position ts (S11).
Next, ts + i is set as the cut-out position tx (S12), and the following equation 5 is calculated while changing j from 0 to tcf (S14 to S17).

【0025】[0025]

【数5】d=d+{(t0+j)−(tx+j)}2 ## EQU5 ## d = d + {(t0 + j)-(tx + j)} 2

【0026】求められたdがSよりも小さければ、類似
度Sをdに、最小類似度位置Tをtxにそれぞれ更新す
る(S18,S19)。そして、iを更新して、次の切
り出し位置txについて同様の処理を繰り返す(S2
0,S12)。txが探索終了位置teに達したら処理
を終了する(S13)。これによってTには、最終的に
最小類似度が得られた切り出し開始位置が格納されるこ
とになる。
If the obtained d is smaller than S, the similarity S is updated to d and the minimum similarity position T is updated to tx (S18, S19). Then, i is updated, and the same processing is repeated for the next cutout position tx (S2).
0, S12). When tx reaches the search end position te, the process ends (S13). As a result, in T, the clipping start position where the minimum similarity is finally obtained is stored.

【0027】このようにして切り出し位置txの値が求
められたら、制御部6は、切り出し位置txから切り出
し波形の長さLsを求め、これを出力カウントの最大値
Nmaxとして記憶する。同時に、クロスフェード部4に
クロスフェード処理の動作切換を指示する(図5のステ
ップS4)。
When the value of the cutout position tx is obtained in this way, the control unit 6 obtains the length Ls of the cutout waveform from the cutout position tx and stores it as the maximum value Nmax of the output count. At the same time, the crossfade section 4 is instructed to switch the operation of the crossfade processing (step S4 in FIG. 5).

【0028】次に、与えられた切り出し位置txに基づ
いて、読出位置制御部2で、波形メモリ1の他方のポイ
ンタ位置をセットする(S5)。即ち、時間軸圧縮の場
合には、図7(a)に示すように、波形メモリ1のポイ
ンタDP1,DP2でそれぞれ示されるオフセットLof
fi-1を保ってそれぞれデータが読み出されているとき
に、先行する一方のポインタDP2が切り出し波形の後
端位置(後端のクロスフェード開始位置)に達したと
き、次の切り出し位置txが求められる。このとき、追
従していた他方のポインタDP1がDP1′の位置まで
ジャンプして、新たなオフセットLoffiを保ったまま、
2つのポインタDP1′,DP2が同時に移動してい
く。また、時間軸伸長の場合には、図7(b)に示すよ
うに、ポインタのジャンプする方向が上述した前方向で
はなく、後ろ方向になる。波形メモリ1のこれら2つの
ポインタが示す位置からデータD1,D2がそれぞれ読
み出される。読み出されたデータD1,D2は、クロス
フェード部4に送られる(S6)。
Next, the reading position control section 2 sets the other pointer position of the waveform memory 1 based on the given cut-out position tx (S5). That is, in the case of the time axis compression, as shown in FIG. 7A, the offset Lof indicated by the pointers DP1 and DP2 of the waveform memory 1 respectively.
When each of the preceding pointers DP2 reaches the trailing end position of the cutout waveform (the crossfade start position of the trailing end) while data is being read while maintaining fi-1, the next cutout position tx is Desired. At this time, the other pointer DP1 that was being followed jumps to the position of DP1 'and maintains a new offset Loffi,
The two pointers DP1 'and DP2 move simultaneously. Further, in the case of time axis expansion, as shown in FIG. 7B, the direction in which the pointer jumps is not the forward direction described above but the backward direction. The data D1 and D2 are read from the positions indicated by these two pointers in the waveform memory 1, respectively. The read data D1 and D2 are sent to the crossfade unit 4 (S6).

【0029】クロスフェード部4では、制御部6によっ
て求められたクロスフェード時間tcfに基づいて、クロ
スフェード合成処理を実行する。即ち、図8に示すよう
に、データD1にはクロスフェード係数W1を乗算し、
データD2にはクロスフェード係数W2を乗算し、両者
を加算することにより合成データを生成する(S7)。
但し、W1+W2=1.0である。同図(a)は圧伸率
Rが1に近い場合のクロスフェード係数W1,W2を、
同図(b)は圧伸率Rが1から離れている場合(例えば
R=0.5,R=2.0)のクロスフェード係数W1,
W2をそれぞれ示している。得られた合成データは出力
カウント部5に送られる(S7)。
The crossfade unit 4 executes the crossfade combining process based on the crossfade time tcf obtained by the control unit 6. That is, as shown in FIG. 8, the data D1 is multiplied by the crossfade coefficient W1,
The data D2 is multiplied by the crossfade coefficient W2, and both are added to generate combined data (S7).
However, W1 + W2 = 1.0. In the figure, (a) shows the crossfade coefficients W1 and W2 when the companding ratio R is close to 1,
FIG. 7B shows the crossfade coefficient W1, when the companding ratio R is far from 1 (for example, R = 0.5, R = 2.0).
W2 is shown respectively. The obtained combined data is sent to the output counting section 5 (S7).

【0030】出力カウント部5では、合成データの出力
カウント値Nをカウントし、その値Nを制御部6に送る
(S8)。制御部6では、出力カウント値Nが出力カウ
ント最大値Nmaxに達したかどうかを判定し(S9)、
最大値Nmaxに達していなかったらポインタDP1,D
P2をそれぞれ更新して(S10)、次のデータD1,
D2を読み出して(S6)、クロスフェード処理を繰り
返す(S7〜S9)。出力カウント値Nが最大値Nmax
に達したら(S9)、次の切り出し位置探索のために必
要な原ディジタル信号を波形メモリ1にバッファリング
して、同様の処理を繰り返す(S2〜S10)。
The output count section 5 counts the output count value N of the combined data and sends the value N to the control section 6 (S8). The control unit 6 determines whether the output count value N has reached the maximum output count value Nmax (S9),
If the maximum value Nmax is not reached, pointers DP1 and D1
P2 is updated (S10), and the next data D1,
D2 is read (S6), and the crossfade process is repeated (S7 to S9). The output count value N is the maximum value Nmax
(S9), the original digital signal required for the next cutout position search is buffered in the waveform memory 1 and the same processing is repeated (S2 to S10).

【0031】このように、この装置によれば、クロスフ
ェードされる波形同士が類似している部分を探索して切
り出し開始位置として決定し、且つ指定された圧伸率を
維持するように波形を切り出すようにしているので、波
形のつなぎがスムーズで、違和感のない時間軸圧伸処理
を実現することができる。また、この装置では、圧伸率
に応じてクロスフェードする時間tcfを変えているの
で、圧縮率や伸長率が高い場合でも、自然なつなぎが可
能になる。
As described above, according to this apparatus, a portion where the waveforms to be cross-faded are similar to each other is searched for and determined as the cut-out start position, and the waveform is changed so as to maintain the designated companding ratio. Since it is cut out, it is possible to realize a time axis companding process in which the waveforms are smoothly connected and no discomfort occurs. Further, in this device, since the time tcf for crossfading is changed according to the companding ratio, natural joining is possible even when the compressing ratio and the expanding ratio are high.

【0032】なお、この発明は、上述した実施例に限定
されるものではない。上記実施例では、クロスフェード
処理のための窓関数として台形窓を用いたが、ガウシア
ン窓、ハミング窓等、他の窓関数を用いた場合でも、同
様の効果が得られる。
The present invention is not limited to the above embodiment. In the above embodiment, the trapezoidal window is used as the window function for the crossfade processing, but the same effect can be obtained by using other window functions such as Gaussian window, Hamming window and the like.

【0033】[0033]

【発明の効果】以上述べたように、この発明によれば、
クロスフェードする波形の類似度から動的に最適なクロ
スフェードポイントを探索し、その位置で波形を接続す
るようにしているので、つなぎ部分での音質劣化が少な
い時間軸圧伸処理を行うことができるという効果を奏す
る。
As described above, according to the present invention,
Since the optimum crossfade point is dynamically searched from the similarity of the waveforms to be crossfaded and the waveforms are connected at that position, it is possible to perform time axis companding processing with less sound quality deterioration at the connecting part. It has the effect of being able to.

【図面の簡単な説明】[Brief description of drawings]

【図1】 この発明の一実施例に係るディジタル信号の
時間軸圧伸装置のブロック図である。
FIG. 1 is a block diagram of a time axis companding device for digital signals according to an embodiment of the present invention.

【図2】 ディジタル信号の圧伸率を説明するための図
である。
FIG. 2 is a diagram for explaining a companding ratio of a digital signal.

【図3】 同装置を使用した時間軸圧縮処理を説明する
ための図である。
FIG. 3 is a diagram for explaining a time axis compression process using the same apparatus.

【図4】 同装置を使用した時間軸伸長処理を説明する
ための図である。
FIG. 4 is a diagram for explaining a time axis expansion process using the apparatus.

【図5】 同装置の時間軸圧伸処理を示すフローチャー
トである。
FIG. 5 is a flowchart showing a time axis companding process of the apparatus.

【図6】 同処理における類似度計算処理を示すフロー
チャートである。
FIG. 6 is a flowchart showing a similarity calculation process in the same process.

【図7】 同装置における波形メモリと読出位置の制御
を説明するための図である。
FIG. 7 is a diagram for explaining control of a waveform memory and a read position in the same device.

【図8】 同装置におけるクロスフェード処理を説明す
るための図である。
FIG. 8 is a diagram for explaining a crossfade process in the same device.

【図9】 従来の時間軸圧伸処理を説明するための図で
ある。
FIG. 9 is a diagram for explaining a conventional time axis companding process.

【符号の説明】[Explanation of symbols]

1…波形メモリ、2…読出位置制御部、3…類似度演算
部、4…クロスフェード部、5…出力カウント部、6…
制御部
1 ... Waveform memory, 2 ... Read position control unit, 3 ... Similarity calculation unit, 4 ... Crossfade unit, 5 ... Output counting unit, 6 ...
Control unit

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 時間軸圧伸すべき原ディジタル信号から
所定長さの波形を順次切り出して、各切り出された波形
の両端をクロスフェードさせながら結合することによ
り、指定された圧伸率で時間軸圧伸された出力信号を生
成するディジタル信号の時間軸圧伸方法において、 次に切り出す波形の切り出し開始位置を、所定の探索開
始位置から探索終了位置までの間の、クロスフェードさ
れる波形同士が最も類似する位置に決定し、前記決定さ
れた波形の切り出し開始位置に応じて全体的な圧伸率が
前記指定された圧伸率となるような長さで次の波形を切
り出すようにしたことを特徴とするディジタル信号の時
間軸圧伸方法。
1. A time-based companding rate is specified at a specified companding rate by sequentially cutting out a waveform of a predetermined length from an original digital signal to be time-compressed and connecting the cut-out waveforms while crossfading both ends. In the time axis companding method for a digital signal that generates an axially companded output signal, the waveforms to be cross-faded between the predetermined search start position and the search end position are the cutting start positions of the waveforms to be cut next. Is determined to be the most similar position, and the next waveform is cut out at a length such that the overall companding ratio becomes the specified companding ratio according to the cutout start position of the determined waveform. A time axis companding method for digital signals, characterized in that
【請求項2】 時間軸圧伸すべき原ディジタル信号の
波形を記憶する波形記憶手段と、 この波形記憶手段から切り出された波形の両端をクロス
フェードさせながら結合するクロスフェード手段と、 前記原ディジタル信号が指定された圧伸率で時間軸圧伸
されるように、少なくとも前記波形の切り出し位置及び
長さを制御する制御手段とを備えたディジタル信号の時
間軸圧伸装置において、 前記制御手段は、前記指定された圧伸率に基づいて、次
に切り出す波形の切り出し開始位置を探索するための探
索開始位置及び探索終了位置を含む圧伸パラメータを算
出すると共に、前記切り出す波形の切り出し開始位置
を、前記探索開始位置から探索終了位置までの間のクロ
スフェードされる波形同士が最も類似する位置に決定
し、前記決定された波形の切り出し開始位置に応じて全
体的な圧伸率が前記指定された圧伸率となるような長さ
で次の波形を切り出すものであることを特徴とするディ
ジタル信号の時間軸圧伸装置。
2. A waveform storage means for storing a waveform of an original digital signal to be time-compressed, a crossfade means for connecting both ends of a waveform cut out from the waveform storage means while crossfading the original digital signal, and the original digital signal. In a time-axis companding device for digital signals, which comprises at least a control means for controlling the cutting position and length of the waveform so that the signal is time-axis companded at a designated companding ratio, the control means is , Based on the designated companding ratio, calculating companding parameters including a search start position and a search end position for searching the cutout starting position of the waveform to be cut out next, and the cutout starting position of the waveform to be cut out. , The crossfaded waveforms from the search start position to the search end position are determined to be positions most similar to each other, and the determined waveforms are determined. A time-axis companding device for digital signals, characterized in that the following waveform is cut out in a length such that the overall companding ratio becomes the designated companding ratio according to the cutout starting position.
JP2003032679A 2003-02-10 2003-02-10 Method and device for time-base companding of digital signal Pending JP2003241800A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003032679A JP2003241800A (en) 2003-02-10 2003-02-10 Method and device for time-base companding of digital signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003032679A JP2003241800A (en) 2003-02-10 2003-02-10 Method and device for time-base companding of digital signal

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP12634399A Division JP3430968B2 (en) 1999-05-06 1999-05-06 Method and apparatus for time axis companding of digital signal

Publications (1)

Publication Number Publication Date
JP2003241800A true JP2003241800A (en) 2003-08-29

Family

ID=27785787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003032679A Pending JP2003241800A (en) 2003-02-10 2003-02-10 Method and device for time-base companding of digital signal

Country Status (1)

Country Link
JP (1) JP2003241800A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009510658A (en) * 2005-09-30 2009-03-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Method and apparatus for processing audio for playback
JP2009521008A (en) * 2005-12-22 2009-05-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Electronic device and method for avoiding sound collision when mixing content items
US8165888B2 (en) 2007-03-16 2012-04-24 The University Of Electro-Communications Reproducing apparatus
CN114582376A (en) * 2022-01-18 2022-06-03 杭州联汇科技股份有限公司 High-quality optimized splicing method for digital audio clips

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009510658A (en) * 2005-09-30 2009-03-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Method and apparatus for processing audio for playback
JP2009521008A (en) * 2005-12-22 2009-05-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Electronic device and method for avoiding sound collision when mixing content items
US8165888B2 (en) 2007-03-16 2012-04-24 The University Of Electro-Communications Reproducing apparatus
CN114582376A (en) * 2022-01-18 2022-06-03 杭州联汇科技股份有限公司 High-quality optimized splicing method for digital audio clips
CN114582376B (en) * 2022-01-18 2024-02-23 杭州联汇科技股份有限公司 High-quality optimized splicing method for digital audio clips

Similar Documents

Publication Publication Date Title
JP3430968B2 (en) Method and apparatus for time axis companding of digital signal
JP3546755B2 (en) Method and apparatus for companding time axis of rhythm sound source signal
US5842172A (en) Method and apparatus for modifying the play time of digital audio tracks
EP0848383B1 (en) Information recording and reproduction
JP3451900B2 (en) Pitch / tempo conversion method and device
CA2271463C (en) Sound processing method, sound processor, and recording/reproduction device
JP3399297B2 (en) Electronic musical instrument
JP3465628B2 (en) Method and apparatus for time axis companding of audio signal
JP3430974B2 (en) Method and apparatus for time axis companding of stereo signal
JPH10257596A (en) Speech speed conversion method and its device
KR100372208B1 (en) Time compression / extension method of audio signal
JP4300641B2 (en) Time axis companding method and apparatus for multitrack sound source signal
JP2005049364A (en) Method and device for removing known acoustic signal
JP2003241800A (en) Method and device for time-base companding of digital signal
JP2001255876A (en) Method for expanding and compressing musical sound waveform signal in time base direction
JP3422716B2 (en) Speech rate conversion method and apparatus, and recording medium storing speech rate conversion program
JP3162945B2 (en) Video tape recorder
JP3156020B2 (en) Audio speed conversion method
JP2009282536A (en) Method and device for removing known acoustic signal
JP3147562B2 (en) Audio speed conversion method
JP4063048B2 (en) Apparatus and method for synchronous reproduction of audio data and performance data
JP4049465B2 (en) Pitch control device for waveform reproduction device
JP3095018B2 (en) Music generator
JPH0411300A (en) Time companding method for voice signal
JPH10307581A (en) Waveform data compressing device and method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050415

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060207