JP2011203482A - 音声処理装置 - Google Patents

音声処理装置 Download PDF

Info

Publication number
JP2011203482A
JP2011203482A JP2010070615A JP2010070615A JP2011203482A JP 2011203482 A JP2011203482 A JP 2011203482A JP 2010070615 A JP2010070615 A JP 2010070615A JP 2010070615 A JP2010070615 A JP 2010070615A JP 2011203482 A JP2011203482 A JP 2011203482A
Authority
JP
Japan
Prior art keywords
reading
audio data
periodicity
crossfade
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010070615A
Other languages
English (en)
Inventor
Yukinari Yasuma
幸成 安間
Takayasu Kondo
高康 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010070615A priority Critical patent/JP2011203482A/ja
Publication of JP2011203482A publication Critical patent/JP2011203482A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

【課題】音声信号のピッチを変更する技術において、出力される音声信号のレベルの変動を軽減することのできる技術を提供する。
【解決手段】音声処理装置のDSP19は、波形メモリ18からの2系統の出力信号を交互にクロスフェードして出力する。相関度計測部23は、入力される音声データの自己相関値を算出する。周期性判定部24は、算出された自己相関値を予め定められた閾値と比較し、両者の差分に応じて音声データが周期性を有するか否かを判定する。制御部22は、周期性判定部24の判定結果に応じてクロスフェードの態様を切り替えるようにクロスフェードゲイン計算部26を制御する。
【選択図】図4

Description

本発明は、音声信号のピッチを変換する技術に関する。
カラオケ装置においては、自分の音域に合わないなどの理由により、歌唱者自身が歌いやすいキー(調)で歌唱することを可能にすべく伴奏音のキーをシフトさせる、いわゆるキーコントロールと呼ばれる機能を備えたものがある。特許文献1には、音声波形を表す音声データのリングバッファへの書込速度と読出速度とを異ならせることにより、音声信号のピッチを変換する技術が開示されている。
特許文献1に記載の技術においては、音声データの読出速度を変更することにより発生する時間の伸縮を回避するため、標準の(ピッチシフトがない)速度で読み出したときの波形位置(以下「基準波形位置」)からのずれが大きくなったときに、読出位置を基準波形位置に戻す(読出アドレスをジャンプさせる)処理が行われている。このとき、音声データの読出アドレスをジャンプさせることによって波形の不連続性が発生するが、特許文献1に記載の技術では、音声データの読出処理系統を2系統設け、その2系統の出力を交互にクロスフェードすることにより、波形の不連続によるノイズの発生を防ぐ構成となっている。
特開2007−264280号公報
しかし、特許文献1に記載の技術では、2系統の出力を交互にクロスフェードさせる構成となっているため、入力される音声データによっては、出力される音声の音量レベルが小刻みに変動してしまい、その結果、トレモロのように不自然に聞こえてしまう場合があった。
本発明は上述した背景の下になされたものであり、音声信号のピッチを変換する技術において、出力される音声信号のレベルの変動を軽減することのできる技術を提供することを目的とする。
上述した課題を解決するため、本発明は、音声波形を表す音声データが予め定められた書込速度で順次書き込まれるバッファと、前記バッファに書き込まれた音声データを、前記書込速度と異なる読出速度で、複数の異なる読出位置から並行して読み出す読出手段と、前記書込速度と等しい速度で読み出しを行う場合の読出位置を基準位置として、前記読出手段が予め定められた時間だけ前記音声データの読み出しを行う毎に、前記読出手段の読出位置を当該基準位置の方向に移動させる読出制御手段と、前記音声データの自己相関値を予め定められたアルゴリズムに従って計算する計算手段と、前記計算手段によって計算された自己相関値を予め定められた閾値と比較し、両者の差分に応じて前記音声データが周期性を有するか否かを判定する判定手段と、前記読出手段によって読み出された複数の音声データをクロスフェードさせて合成する合成手段であって、前記判定手段の判定結果に基づいて当該クロスフェードの態様を切り替える合成手段とを具備することを特徴とする音声処理装置を提供する。
本発明の好適な態様において、前記合成手段は、前記判定手段によって前記音声データが周期性を有すると判定された場合には、音量和が略一定となるように前記複数の音声データのゲインを変化させてクロスフェードを行う一方、それ以外の場合には、エネルギー和が略一定となるように前記複数の音声データのゲインを変化させてクロスフェードを行う
本発明の更に好適な態様において、前記合成手段は、前記判定手段によって前記音声データが周期性を有すると判定された場合には、前記複数の音声データのゲインを直線的にフェードイン又はフェードアウトさせることによってクロスフェードを行う一方、それ以外の場合には、前記複数の音声データのゲインを三角関数曲線に従ってフェードイン又はフェードアウトさせることによってクロスフェードを行ってもよい。
また、本発明の更に好ましい態様において、前記合成手段は、前記音声データの振幅がゼロになるタイミングで前記クロスフェードの態様を切り替えてもよい。
また、本発明の更に好ましい態様において、前記判定手段は、前記自己相関値が前記閾値を予め定められた時間以上継続して下回っているか否かを判定してもよい。
また、本発明の別の好ましい態様において、前記判定手段は、予め定められた単位時間毎に前記判定処理を行うようにしてもよい。
また、本発明の別の好ましい態様において、前記判定手段は、前記音声データの音量が予め定められた閾値以上変化した場合に前記判定処理を行うようにしてもよい。
また、本発明は、音声波形を表す音声データの自己相関値に基づいて判定されたデータであって当該音声データが周期性を有するか否かを示すデータが付与された音声データが、予め定められた書込速度で順次書き込まれるバッファと、前記バッファに書き込まれた音声データを、前記書込速度とは異なる読出速度で、複数の異なる読出位置から並行して読み出す読出手段と、前記書込速度と等しい速度で読み出しを行う場合の読出位置を基準位置として、前記読出手段が予め定められた時間だけ前記音声データの読み出しを行う毎に、前記読出手段の読出位置を当該基準位置の方向に移動させる読出制御手段と、前記読出手段によって読み出された複数の音声データをクロスフェードさせて合成する合成手段であって、当該音声データに付与されたデータに基づいて当該クロスフェードの態様を切り替える合成手段とを具備することを特徴とする音声処理装置を提供する。
本発明によれば、音声信号のピッチを変換する技術において、出力される音声信号のレベルの変動を軽減することができる。
音声処理装置のハードウェア構成の一例を示すブロック図である。 ピッチ変換処理の内容を説明するための概念図である。 2系統のバッファ出力信号の読出アドレスとゲインの時間的変化を示す図である。 DSPの機能的構成の一例を示す図である。 クロスフェード処理の概念を表す図である。 クロスフェード処理の概念を表す図である。 2系統のバッファ出力信号の読出アドレスとゲインの時間的変化を示す図である。
<音声処理装置の構成>
図1は、この発明の一実施形態である音声処理装置1のハードウェア構成を例示したブロック図である。音声処理装置1は、例えば、カラオケ伴奏を再生するカラオケ装置や、パーソナルコンピュータ等の汎用コンピュータである。図において、CPU(Central Processing Unit)11は、ROM(Read Only Memory)12に記憶されているコンピュータプログラムを読み出してRAM(Random Access Memory)13にロードし、これを実行することにより、音声処理装置1の各部を制御する。外部記憶装置14は、ハードディスクや光ディスク等の大容量の記憶手段である。通信I/F15は、通信回線で結ばれた他の装置(例えば、カラオケ装置の管理室のサーバ等)との間でデータの授受を行うインターフェースである。
表示回路16は、液晶ディスプレイ等の表示装置に画像を表示するための回路である。具体的には、例えば、音声処理装置1がカラオケ装置である場合には、動画像や設定画面を表示装置に表示するための回路が表示回路16に相当し、音声処理装置1が汎用コンピュータである場合には、ビデオカードが表示回路16に相当する。入力装置17は、操作された内容に応じた操作信号を出力する操作入力装置である。具体的には、例えば、音声処理装置1がカラオケ装置である場合には、リモコンや装置本体付属の操作子が入力装置17に相当し、音声処理装置1が汎用コンピュータである場合には、キーボードやマウスが入力装置17に相当する。
波形メモリ18は、DSP(Digital Signal Processor)19の処理対象となるデータを一時的に記憶するバッファである。この実施形態では、波形メモリ18は、リング状に書き込み/読み出しを行うリングバッファである。波形メモリ18には、通信I/F15を介して取得される楽曲データや、マイクロホン(図示略)で収音された音声を表す音声信号がA(Analog)/D(Digital)変換されたデータ、外部記憶装置14に記憶された楽曲データ等の、音声波形を表すデータ(以下「音声データ」と称する)が一時的に蓄積される。波形メモリ18としては、音声データのビットデータをサンプリングタイムで入出力する速度に対応できるものが必要である。
DSP19は、波形メモリ18に記憶された音声データに対してピッチ変換処理等の各種デジタル信号処理を行う。D/A変換器20は、DSP19から出力されるデジタル信号をアナログ信号に変換し、アナログの出力信号を取り出す。この出力信号は、増幅器(図示略)を介してスピーカ(図示略)へ出力される。
<ピッチ変換処理の概要>
次に、DSP19が行うピッチ変換処理の概要について図面を参照しつつ説明する。DSP19は、波形メモリ18からの音声データの読出速度を変更することによってピッチの変更を行う。具体的には、DSP19は、ピッチを高くする場合には音声データの読出速度を速くし、ピッチを低くする場合には音声データの読出速度を遅くする。
図2は、DSP19が行うピッチ変換処理の内容を説明するための概念図である。図2において、横軸は経過時間を示し、縦軸は波形メモリ18内のアドレスを示す。すなわち、図2は、時間の経過に伴う音声データの読出位置の変化を概略的に示す図である。図2において、直線S1は、書込速度と等しい速度で読出を行った場合の読出位置(以下「基準位置」)の遷移を示すものである。
波形メモリ18への書き込み及び波形メモリ18からの読み出しは、同一の方向に沿ってリング状に行われる。波形メモリ18へは、予め定められた書込速度(基準のサンプリング周波数)で順次書き込みが行われる。一方、読出を行う場合は、DSP19は、ピッチの変更量に応じて読出速度を変更する。具体的には、ピッチを上げる場合には、DSP19は、書込速度よりも速い速度(図2の直線S2参照)で音声データを読み出す。また、ピッチを下げる場合には、音声処理装置1は、書込速度よりも遅い速度(図2の直線S3参照)で音声データを読み出す。
ここで、読出速度を変更することにより発生する問題点とその対応について図面を参照しつつ説明する。図2に示すように、ピッチアップしたときの波形読出アドレスの遷移(図2の直線S2参照)は、ピッチシフトしない場合(図2の直線S1参照)よりも速くアドレスが進む。すなわち、読出速度を速くした場合には音声データの再生時間が短くなってしまう。一方、ピッチダウンしたときの波形読出アドレスの遷移(図2の直線S3参照)は、ピッチシフトしない場合よりも遅くなる。すなわち、読出速度を遅くした場合には音声データの再生時間が長くなってしまう。このように、波形の読出速度を変更すると時間の伸縮が発生してしまい、音声のテンポが変化してしまう。更に、読出位置がアドレスの書込位置を追い抜いてしまい、リングバッファの1周期前のデータを読み出してしまう可能性がある。
そこで、この実施形態では、DSP19は、書込速度と等しい速度で読み出した場合の読出位置(基準位置)からのずれが大きくなったときに、読出位置を基準位置に戻すことにより時間的な伸縮の発生を回避する。すなわち、DSP19は、予め定められた時間だけ音声データの読出を行う毎に、読出位置(アドレス)を基準位置に移動させる(ジャンプさせる)処理を行う。具体的には、図2に示す例においてピッチを上げる場合には、DSP19は、時刻t1,t2,t3,t4,t5において波形アドレスの読出位置を基準位置にジャンプさせる(図2のS4参照)。ピッチを下げる場合も同様であり、DSP19は、時刻t1,t2,t3,t4,t5において波形アドレスの読出位置を基準位置にジャンプさせる(図2のS5参照)。
次いで、アドレス(読出位置)をジャンプさせることにより発生する問題点とその対応について図面を参照しつつ説明する。読出アドレスを所定間隔毎にジャンプさせる処理を行うことによって、アドレスをジャンプさせるタイミングにおいて波形の不連続が発生する。この波形の不連続によって出力音声にノイズが発生してしまう。そこで、この実施形態では、ノイズの発生を軽減するために、波形の読出処理を2系統設け、その2系統の出力を交互にクロスフェードすることにより、波形不連続によるノイズの発生を軽減させる。クロスフェードとは、2つの信号のうち一方をフェードアウトし、他方をフェードインして継ぎ目なく信号を接続する技術である。
図3は、2系統のバッファ出力信号(以下、「バッファ出力信号18A、18B」という)のそれぞれの読出アドレス(以下「読出アドレス24A、24B」という)とゲインの時間的変化を示す図である。図3の(A)は、バッファ出力信号18Aのゲインの時間変化を表す図であり、横軸は経過時間を示し、縦軸はゲインを示す。(B)は、基準位置に対するバッファ出力信号18Aの読出位置の差分の変化を表す図であり、横軸は経過時間を示し、縦軸は基準位置に対するバッファ出力信号18Aの読出位置のアドレス差を示す。(C)は、バッファ出力信号18Bのゲインの時間変化を表す図であり、横軸は経過時間を示し、縦軸はゲインを示す。(D)は、基準位置に対するバッファ出力信号18Bの差分の変化を表す図であり、横軸は経過時間を示し、縦軸は基準位置に対するバッファ出力信号18Bの読出位置のアドレス差を示す。
上述した図2に示す例においては、DSP19は、基準位置からのずれが大きくなったときに、読出アドレスを基準位置にジャンプさせるようにしたが、図3の(B),(D)に示す例においては、DSP19は、基準位置からのずれが大きくなったときに、読出アドレスを基準位置の方向に予め定められた量だけ移動させる処理を行う。要は、DSP19は、予め定められた時間だけ音声データの読出を行う毎に、読出位置を基準位置の方向に移動させる(ジャンプさせる)処理を行う。
DSP19は、バッファ出力信号の読出アドレスをジャンプさせるタイミングで、ジャンプする側のバッファ出力信号のゲインを0%にする一方、他方の出力を100%にする。これにより、アドレスのジャンプによるノイズが軽減される。具体的には、図3において、バッファ出力信号18Aの読出アドレス24Aをジャンプさせるタイミング(図3(B)の時刻t12,t14,t16,t18,t20参照)で、バッファ出力信号18Aのゲインが常にゼロとなるように制御する(図3(A)の時刻t12,t14,t16,t18,t20参照)。これにより、バッファ出力信号18Aの波形不連続によるノイズの発生が軽減される。バッファ出力信号18Bについても同様であり、バッファ出力信号18Bの読出アドレス24Bをジャンプさせるタイミング(図3(D)の時刻t11,t13,t15,t17,t19参照)で、バッファ出力信号18Bのゲインが常にゼロとなるように制御する(図3(D)の時刻t11,t13,t15,t17,t19参照)。これにより、バッファ出力信号18Bの波形不連続によるノイズの発生が軽減される。
また、図示のように、読出アドレス24A、24Bのジャンプを発生させる時刻を異ならせている。これにより、アドレスジャンプの発生時刻が重ならないから、アドレスジャンプに起因したノイズが軽減される。
ピッチを下げる場合には、図3において読出アドレス24A、24Bのグラフは基準位置S1に対して反転した形状となる。
以上がこの実施形態においてDSP19が行うピッチ変換処理の概要である。
<DSPの構成>
次に、図4を参照しつつ、上述したピッチ変換処理に係るDSP19の機能的構成について詳述する。同図において、波形解析部21は、音声データの波形を解析するものである。波形解析部21は、LPF211と基本周期検出部212とアタック検出部213とを備えている。LPF211は音声データから低周波成分のみを取り出すためのフィルタである。音声データをLPF211に通すことによって高周波成分がカットされ、基本周期の検出が容易になる。基本周期検出部212は、LPF211を通した音声データから基本周期を検出し、検出結果を制御部22へ送る。基本周期検出部212の基本周期の検出方法としては、例えばFFT変換により信号の周波数成分を検出することにより行う。アタック検出部213は、音声データからアタックを検出する。ここで、アタックとは、平均的な音声の波高レベルよりも極端に高い部分又は振幅上昇が急激な信号の区間である。アタック検出部213は、所定の時間間隔毎に切り出した音声データのエネルギー和をそれぞれ計算し、平均的な音声の波高レベルより極端に高い区間、又はエネルギーの増加が急激な区間を、アタックとして検出する。アタック検出部213は、アタックの検出結果を示す信号を制御部22に出力する。
相関度計測部23は、波形メモリ18から一定長の音声データを読み出し、読み出した音声データの自己相関値を予め定められたアルゴリズムに従って計算する。周期性判定部24は、相関度計測部23が計算した自己相関値をもとに音声データの周期性の有無を判定する。周期性の有無の判定としては、ここでは、周期性がある場合には基本周期の整数倍の時刻の自己相関値に大きなピークが存在するという性質に従って判定を行う。すなわち、周期性判定部24は、自己相関値を予め定められた閾値と比較し、両者の差分に応じて音声データが周期性を有するか否かを判定する。より具体的には、周期性判定部24は、音声データの基本周期の範囲で、判定閾値以上の自己相関値が存在すれば周期性ありと判定する一方、判定閾値以上の自己相関値が存在しない場合は周期性なしと判定する。
制御部22は、波形解析部21の解析結果及び周期性判定部24の判定結果に基づいて、読出アドレス制御部25やクロスフェードゲイン計算部26に指示を送る。具体的には、例えば、制御部22は、基本周期検出部212の検出した周期に基づいてクロスフェード時に合成するバッファ出力信号18A、18Bの基本周期の位相が合うように、クロスフェード開始時、終了時を調整する指示を送る。また、急峻に音量が上下するアタックの場合には、アタックの部分は急激な音量変化を伴うため、波形の接続により2度打ちが生じやすいことから、クロスフェード合成部27の動作を中止し、バッファ出力信号18A、18Bのいずれかの出力をそのまま出すように、クロスフェードゲイン計算部26に指示を送る。また、制御部22は、周期性判定部24の判定結果に応じて、クロスフェード合成部27のクロスフェードの態様を切り替えるように、クロスフェードゲイン計算部26に指示を送る。
読出アドレス制御部25は、制御部22からの指示に基づいて、波形メモリ18における音声データの読出位置を算出して、読出アドレスを指示する。上述したように、読出アドレス制御部25は、ピッチを上げる場合には読出速度を速くする一方、ピッチを下げる場合には読出速度を遅くする。バッファ出力信号18A、18Bは、読出アドレス制御部25の指示に従って波形メモリ18から読み出され、クロスフェード合成部27に送られる。
なお、読出速度を速めたり遅くしたりしてバッファ出力信号の時間軸圧伸を行う場合には、指定されたピッチ変換率に正確に対応する圧伸を行おうとすると読出アドレスは小数点以下を含むことになる。そこで、波形メモリ18の出力を合成する加算部(図示略)を設け、小数点部分については、小数点をはさんで整数値の両側のアドレスに書き込まれたデータについて比例配分を行い、データを加算してもよい。
クロスフェードゲイン計算部26は、クロスフェード合成部27におけるクロスフェードのゲインカーブを計算し、クロスフェード合成部27にゲインの指示を行う。クロスフェード合成部27は、クロスフェードゲイン計算部26の指示に基づいて、バッファ出力信号18A、18Bのゲインをそれぞれ調整し、ゲインが調整されたバッファ出力信号18A、18Bを加算し、D/A変換器20に出力する。すなわち、クロスフェード合成部27は、バッファ出力信号18A、18Bをクロスフェードさせて合成する。
このとき、クロスフェードゲイン計算部26は、ゲイン一定の区間がなく連続的に小刻みにクロスフェードを行うようゲイン調整しているので、ジャンプするアドレス量が小さくなり、音色のずれを小さくすることができる。このように連続的にクロスフェードさせる場合には、いずれのクロスフェード時間においてもクロスフェードする信号の基本周期の位相をそろえた方が滑らかにクロスフェードさせることができる。そこで、クロスフェード時の基本周期の位相をそろえるため、図4で説明した基本周期検出部212は、基本周期を求めている。制御部22は、この基本周期をクロスフェードゲイン計算部26に指示する。クロスフェードゲイン計算部26は、この基本周期の位相をそろえるため、バッファ出力信号18Aのゲインをフェードアウトさせるとき、フェードアウト区間長をこの基本周期の整数倍とする。また、クロスフェードゲイン計算部26は、これに合わせてバッファ出力信号18Bのゲインをフェードインさせるとき、フェードイン区間長をこの基本周期の整数倍とする。バッファ出力信号18Aのゲインをフェードインさせるときも同様である。
次に、クロスフェードゲイン計算部26のクロスフェード方法について、図5および図6を用いて具体的に説明する。図5および図6は、クロスフェード処理の概念を表す図である。この実施形態では、クロスフェードゲイン計算部26は、周期性判定部24の判定結果に基づいてクロスフェードの態様を切り替える。より具体的には、この実施形態では、クロスフェードゲイン計算部26は、周期性判定部24によって音声データが周期性を有すると判定された場合には、複数の音声データのゲインを直線的にフェードイン又はフェードアウトさせることによってクロスフェードを行う(図5参照)。一方、それ以外の場合(すなわち音声データに周期性がない場合)には、クロスフェードゲイン計算部26は、複数の音声データのゲインを三角関数曲線に従ってフェードイン又はフェードアウトさせることによってクロスフェードを行う(図6参照)。
図5は、ゲインレベル一定で合成する場合を示しており、図6はエネルギー和(波高値の2乗の時間積分で計算される)が一定である場合を示している。いずれも、横軸が時刻[m秒]、縦軸がゲイン比率[%]である。図5に示す例では、クロスフェードゲイン計算部26は、ゲイン比率を0%から100%まで直線的に変化させる。すなわち、クロスフェードゲイン計算部26は、クロスフェード合成部27で合成される音声データの音量和が略一定となるように、ゲイン値を調整する。このように、クロスフェードゲイン計算部26は、複数の音声データのゲインを直線的にフェードイン又はフェードアウトさせることによってクロスフェードを行う。より具体的には、図5(A)で示すように、クロスフェードゲイン計算部26は、フェードアウトする信号のゲインを、時間と共に直線的に減衰させ、図5(B)で示すように、フェードインする信号のゲインを、時間と共に直線的に増大させる。このようにして、フェードアウトする信号とフェードインする信号を加えると、音量和のレベルが一定となるようにすることができる。この合成方法は、入力信号に周期性がある場合に滑らかに接続できる。一方、入力信号に周期性がない場合に、レベルが変動する場合がある。
図5に示すクロスフェード合成処理において、複数の信号を滑らかに接続するためには、フェードアウトする信号とフェードインする信号の位相を合わせる必要がある。連続的にクロスフェードをする場合には、いずれのクロスフェード時間についても、周期的信号の位相を合わせる必要があるから、クロスフェード時間長を各々基本周期の整数倍にする。なお、図5では、図示の便宜上、基本周期を8つ含むとしているが、実際にはこれよりも多い周期数の期間にわたりクロスフェードを実行するのが通常である。
一方、図6は、エネルギー和(波高値の2乗の時間積分で計算される)が一定である場合を示している。このようにクロスフェードのゲインを設定する場合には、フェードアウトする信号のエンベロープレベルの時間変化は図6(A)で示すような余弦関数の曲線になり、フェードインする信号のエンベロープレベルの時間変化は図6(B)で示すような正弦関数の曲線になる。すなわち、クロスフェードゲイン計算部26は、複数の音声データのゲインを三角関数曲線に従ってフェードイン又はフェードアウトさせることによってクロスフェードを行う。なお、ゲインの2乗和が一定となる関数であれば、他の関数でも良い。この合成方法は、入力信号に周期性がない場合に滑らかに接続できる。一方、入力信号に周期性がある場合にはレベルが小刻みに変動してしまう場合がある。
図6に示した方法においても、クロスフェード合成部27で滑らかに接続するためには、フェードアウトする信号とフェードインする信号の位相を合わせる。連続的にクロスフェードをする場合には、位相を合わせるためクロスフェード時間を基本周期の整数倍にすることが望ましい。図6では、説明の容易等のため、基本周期を8つ含むとしている。
<クロスフェード切替処理の動作例>
次いで、DSP19が行うクロスフェードの切替処理の具体的な動作の一例について、図7を参照しつつ説明する。図7は、2系統のバッファ出力信号の読出アドレスとゲインの時間的な変化を示す図であり、前述した図3に対応するものである。図7の(A)は、バッファ出力信号18Aのゲインの時間変化を表す図であり、横軸は経過時間を示し、縦軸はゲインを示す。(B)は、基準位置に対するバッファ出力信号18Aの読出位置の差分の変化を表す図であり、横軸は経過時間を示し、縦軸は基準位置に対するバッファ出力信号18Aの読出位置のアドレス差を示す。(C)は、バッファ出力信号18Bのゲインの時間変化を表す図であり、横軸は経過時間を示し、縦軸はゲインを示す。(D)は、基準位置に対するバッファ出力信号18Bの差分の変化を表す図であり、横軸は経過時間を示し、縦軸は基準位置に対するバッファ出力信号18Bの読出位置のアドレス差を示す。
DSP19の周期性判定部24は、相関度計測部23から通知される自己相関値に基づいて、入力される音声データに周期性があるか否かを判定する。この判定は、予め定められた単位時間毎に行うようにしてもよい。制御部22は、周期性判定部24の判定結果に応じてクロスフェードの態様を切り替えるようにクロスフェードゲイン計算部26を制御する。具体的には、例えば、図7に示す例において、周期性がないと判定されている期間(図7の時刻t21までの期間)においてはバッファ出力信号18Aおよび18Bのゲインを三角関数曲線に従って変化させることによってクロスフェードを行わせる(図7の(A)、(C)参照)。ここで、時刻t21において音声データに周期性があると判定された場合には、クロスフェードゲイン計算部26は、音声データのゲインを直線的に変化させるようにクロスフェードの態様を変更する(図7(A)、(C)の時刻t21から時刻t22参照)。更に、時刻t22において音声データに周期性がないと判定された場合には、クロスフェードゲイン計算部26は、音声データのゲインが三角関数曲線に従って変化するようにクロスフェードの態様を再度変更する。
このように、この実施形態では、入力信号の周期性を判定し、入力信号の周期性に応じて好適なクロスフェード波形を自動的に切り替えることにより、入力信号が周期的であっても非周期的であっても滑らかに接続することができる。具体的には、例えば、カラオケ伴奏などの、複数の音源(楽音トラック)からなる信号についてはほぼ周期性がないと考えられるので、クロスフェード波形を正弦/余弦曲線とするのが好ましい。ただしカラオケ伴奏においても単独楽器での独奏部分などでは周期性があるので、クロスフェード波形を直線とすることが好ましい。
以上説明したように本実施形態によれば、音声データの自己相関値を計測し、計測した相関度に応じて音声データの周期性の有無を判定し、判定結果に応じて動的にクロスフェードの態様を切り替えるから、これにより、音声データのレベルの小刻みな変動を軽減することができ、トレモロのような不自然な音量の揺れの発生を軽減することができる。
<変形例>
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその一例を示す。なお、以下の各態様を適宜に組み合わせてもよい。
(1)上述の実施形態では、DSP19は、2系統のバッファ出力信号18A、18Bを合成して出力したが、合成する音声データの数は2に限らず、3以上の出力タップを設け、3以上の音声データを合成するようにしてもよい。
(2)上述の実施形態では、音声データに周期性がない場合に、音声データのゲインを三角関数曲線に従ってフェードイン又はフェードアウトさせることによってクロスフェードを行うようにしたが、周期性がない場合のクロスフェードの態様はこれに限らず、ゲインの2乗和が一定となる関数であれば、他の関数を用いてクロスフェードを行うようにしてもよい。
(3)上述の実施形態において、周期性判定部24が、音声データの自己相関値が予め定められた閾値を予め定められた時間以上継続して下回っているか否かを判定するようにしてもよい。より具体的には、周期性判定部24は、音声データの自己相関値が予め定められた閾値を予め定められた時間以上継続して下回っている場合(すなわち自己相関値に大きなピークが存在しない場合)には周期性なしと判定する一方、それ以外の場合(すなわち自己相関に大きなピークが存在する場合)には周期性ありと判定する。
(4)上述の実施形態において、周期性判定部24は、予め定められた単位時間毎に周期性の有無の判定を行うようにしてもよく、また、例えば、予め定められたタイミングで周期性の有無の判定を行うようにしてもよい。周期性の判定を行うタイミングとしては、例えば、DSP19が音声データのレベルをモニタリングしておき、レベルが予め定められた閾値以上変化した場合(すなわちレベルが急激に変化した場合)に、周期性の有無の判定を行うようにしてもよい。例えば、カラオケ楽曲の伴奏音において、複数の楽器の合奏から単独楽器の独奏にかわる場合には、そのタイミングにおいて音量レベルが変化する場合がある。そのため、そのような周期性の有無が変化する可能性のあるタイミングで周期性の有無の判定を行うようにしてもよい。
(5)上述の実施形態において、DSP19は、音声データの振幅がゼロになるタイミングでクロスフェードの態様を切り替えるようにしてもよい。このようにすることによって、波形の不連続によるノイズの発生をより軽減することができる。
(6)上述の実施形態では、音声処理装置1が、入力される音声データの相関度に基づいて周期性の有無を判定し、その判定の結果に応じてクロスフェード波形を切り替えた。これに代えて、周期性の有無を示すパラメータ(データ)を音声データに予め付与しておくデータ構成としてもよい。この場合は、音声処理装置1は、入力された音声データに付与されたデータを判定し、判定結果に応じてクロスフェードの態様を切り替えればよい。この場合、周期性の有無を示すパラメータは、音声データの予め定められた単位区間毎に付与するようにしてもよく、また、例えば、周期性の有無が変化する位置に付与するようにしてもよく、要は、音声データの周期性の有無を示すデータが音声データに付与されていればよい。
この態様によれば、ピッチ変換処理を行う際にその都度周期性の有無の判定を行う必要がないため、ピッチ変換処理を行う際のDSP19の処理負荷を軽減することができる。
(7)上述の実施形態において、周期性の有無の判定に用いる閾値を、音声処理装置1の利用者が入力装置17を用いて設定できるようにしてもよい。また、例えば、楽曲データに閾値を付加しておく構成とし、周期性判定部24が、楽曲データのピッチ変換処理を行う際に、その楽曲データに付与された閾値を用いて周期性の有無の判定を行うようにしてもよい。
(8)上述の実施形態における音声処理装置1のCPU11、DSP19によって実行されるプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどの、コンピュータが読取可能な記録媒体に記録した状態で提供し得る。また、インターネットのようなネットワーク経由で音声処理装置1にダウンロードさせることも可能である。
1…音声処理装置、11…CPU、12…ROM、13…RAM、14…外部記憶装置、15…通信I/F、16…表示回路、17…入力装置、18…波形メモリ、19…DSP、20…D/A変換器、21…波形解析部、22…制御部、23…相関度計測部、24…周期性判定部、25…読出アドレス制御部、26…クロスフェードゲイン計算部、27…クロスフェード合成部、211…LPF、212…基本周期検出部、213…アタック検出部。

Claims (3)

  1. 音声波形を表す音声データが予め定められた書込速度で順次書き込まれるバッファと、
    前記バッファに書き込まれた音声データを、前記書込速度と異なる読出速度で、複数の異なる読出位置から並行して読み出す読出手段と、
    前記書込速度と等しい速度で読み出しを行う場合の読出位置を基準位置として、前記読出手段が予め定められた時間だけ前記音声データの読み出しを行う毎に、前記読出手段の読出位置を当該基準位置の方向に移動させる読出制御手段と、
    前記音声データの自己相関値を予め定められたアルゴリズムに従って計算する計算手段と、
    前記計算手段によって計算された自己相関値を予め定められた閾値と比較し、両者の差分に応じて前記音声データが周期性を有するか否かを判定する判定手段と、
    前記読出手段によって読み出された複数の音声データをクロスフェードさせて合成する合成手段であって、前記判定手段の判定結果に基づいて当該クロスフェードの態様を切り替える合成手段と
    を具備することを特徴とする音声処理装置。
  2. 前記合成手段は、前記判定手段によって前記音声データが周期性を有すると判定された場合には、音量和が略一定となるように前記複数の音声データのゲインを変化させてクロスフェードを行う一方、それ以外の場合には、エネルギー和が略一定となるように前記複数の音声データのゲインを変化させてクロスフェードを行う
    ことを特徴とする請求項1に記載の音声処理装置。
  3. 音声波形を表す音声データの自己相関値に基づいて判定されたデータであって当該音声データが周期性を有するか否かを示すデータが付与された音声データが、予め定められた書込速度で順次書き込まれるバッファと、
    前記バッファに書き込まれた音声データを、前記書込速度とは異なる読出速度で、複数の異なる読出位置から並行して読み出す読出手段と、
    前記書込速度と等しい速度で読み出しを行う場合の読出位置を基準位置として、前記読出手段が予め定められた時間だけ前記音声データの読み出しを行う毎に、前記読出手段の読出位置を当該基準位置の方向に移動させる読出制御手段と、
    前記読出手段によって読み出された複数の音声データをクロスフェードさせて合成する合成手段であって、当該音声データに付与されたデータに基づいて当該クロスフェードの態様を切り替える合成手段と
    を具備することを特徴とする音声処理装置。
JP2010070615A 2010-03-25 2010-03-25 音声処理装置 Pending JP2011203482A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010070615A JP2011203482A (ja) 2010-03-25 2010-03-25 音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010070615A JP2011203482A (ja) 2010-03-25 2010-03-25 音声処理装置

Publications (1)

Publication Number Publication Date
JP2011203482A true JP2011203482A (ja) 2011-10-13

Family

ID=44880180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010070615A Pending JP2011203482A (ja) 2010-03-25 2010-03-25 音声処理装置

Country Status (1)

Country Link
JP (1) JP2011203482A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5284517B1 (ja) * 2012-06-07 2013-09-11 株式会社東芝 測定装置およびプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07261778A (ja) * 1994-03-22 1995-10-13 Canon Inc 音声情報処理方法及び装置
JPH0962298A (ja) * 1995-08-29 1997-03-07 Sanyo Electric Co Ltd 音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置
JP2000322100A (ja) * 1999-05-06 2000-11-24 Yamaha Corp ディジタル信号の時間軸圧伸方法及び装置
JP2002287758A (ja) * 2001-03-26 2002-10-04 Yamaha Corp 波形編集方法および波形編集装置
JP2005123774A (ja) * 2003-10-15 2005-05-12 Victor Co Of Japan Ltd 音声通信方法及び音声通信装置
JP2007102031A (ja) * 2005-10-06 2007-04-19 Yamaha Corp 音声信号の圧伸方法および音声信号圧伸装置
JP2007264280A (ja) * 2006-03-28 2007-10-11 Yamaha Corp 信号処理装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07261778A (ja) * 1994-03-22 1995-10-13 Canon Inc 音声情報処理方法及び装置
JPH0962298A (ja) * 1995-08-29 1997-03-07 Sanyo Electric Co Ltd 音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置
JP2000322100A (ja) * 1999-05-06 2000-11-24 Yamaha Corp ディジタル信号の時間軸圧伸方法及び装置
JP2002287758A (ja) * 2001-03-26 2002-10-04 Yamaha Corp 波形編集方法および波形編集装置
JP2005123774A (ja) * 2003-10-15 2005-05-12 Victor Co Of Japan Ltd 音声通信方法及び音声通信装置
JP2007102031A (ja) * 2005-10-06 2007-04-19 Yamaha Corp 音声信号の圧伸方法および音声信号圧伸装置
JP2007264280A (ja) * 2006-03-28 2007-10-11 Yamaha Corp 信号処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5284517B1 (ja) * 2012-06-07 2013-09-11 株式会社東芝 測定装置およびプログラム

Similar Documents

Publication Publication Date Title
JP4923939B2 (ja) オーディオ再生装置
US8874245B2 (en) Effects transitions in a music and audio playback system
JP4701684B2 (ja) 音声処理装置およびプログラム
AU2011240621A1 (en) Continuous score-coded pitch correction and harmony generation techniques for geographically distributed glee club
KR100319481B1 (ko) 악음발생방법,파형데이터압축방법,이러한방법을실행하기위한제어명령어를포함하는기계판독가능한기록매체및사운드장치
JP6547522B2 (ja) 楽音信号発生装置
KR20080036518A (ko) 오디오 신호 신장 압축 장치 및 방법
JP4622908B2 (ja) 信号処理装置
JP2015034923A (ja) 音高補正装置
JP2013141167A (ja) 演奏装置
JP5533892B2 (ja) 演奏装置
US9087503B2 (en) Sampling device and sampling method
WO2020105195A1 (ja) 映像制御装置、及び映像制御方法
JP3008922B2 (ja) 楽音発生装置および楽音発生方法
JP2011203482A (ja) 音声処理装置
US20230377591A1 (en) Method and system for real-time and low latency synthesis of audio using neural networks and differentiable digital signal processors
JP2001100756A (ja) 波形編集方法
JP2011203483A (ja) 音声処理装置
Dobrian Strategies for continuous pitch and amplitude tracking in realtime interactive improvisation software
JP4968120B2 (ja) 電子音楽装置、プログラム
JP2011215292A (ja) 歌唱判定装置およびカラオケ装置
US20190019525A1 (en) Audio processing method and audio processing device
KR100990200B1 (ko) 최소한의 메모리를 사용하여 크로스-페이드 효과를 내는오디오 재생방법
JP5807419B2 (ja) 信号処理装置
JP3214936B2 (ja) 信号処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131111

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140212