JP3265962B2 - 音程変換装置 - Google Patents

音程変換装置

Info

Publication number
JP3265962B2
JP3265962B2 JP35350895A JP35350895A JP3265962B2 JP 3265962 B2 JP3265962 B2 JP 3265962B2 JP 35350895 A JP35350895 A JP 35350895A JP 35350895 A JP35350895 A JP 35350895A JP 3265962 B2 JP3265962 B2 JP 3265962B2
Authority
JP
Japan
Prior art keywords
frequency
pitch
audio signal
signal
shifted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP35350895A
Other languages
English (en)
Other versions
JPH09185392A (ja
Inventor
寿子 新原
光雄 松本
琢磨 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP35350895A priority Critical patent/JP3265962B2/ja
Priority to TW085115885A priority patent/TW418384B/zh
Priority to US08/773,192 priority patent/US5862232A/en
Priority to KR1019960082425A priority patent/KR100256718B1/ko
Priority to CNB961239727A priority patent/CN1135531C/zh
Publication of JPH09185392A publication Critical patent/JPH09185392A/ja
Application granted granted Critical
Publication of JP3265962B2 publication Critical patent/JP3265962B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/18Selecting circuits
    • G10H1/20Selecting circuits for transposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • G10H1/366Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems with means for modifying or correcting the external signal, e.g. pitch correction, reverberation, changing a singer's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/215Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
    • G10H2250/235Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/261Window, i.e. apodization function or tapering function amounting to the selection and appropriate weighting of a group of samples in a digital signal within some chosen time interval, outside of which it is zero valued

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Auxiliary Devices For Music (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、カラオケ装置や音
響映像編集装置等に使用され、音声の音程(ピッチ周波
数,基本周波数)を変換する音程変換装置に係り、特
に、音質の劣化がなく、かつ個人の声の特徴を残したま
まで音声の音程を容易に変換することのできる音程変換
装置に関するものである。
【0002】
【従来の技術】従来より、カラオケ装置等では、歌う人
の音域に合わせるために、演奏される伴奏の音程を自由
に変化させて設定することができるキーコントロールと
呼ばれる機能が付いていた。これは、伴奏として再生さ
れるアナログ音声信号の再生速度を変化させることによ
り、音程を変化させていた。また、近年では、センタに
曲のデータを蓄積しておき、このセンタに複数接続され
ている遠隔地の端末装置に必要に応じて曲のデータを送
信して、端末装置で曲を再生する通信カラオケが開発さ
れている。
【0003】この通信カラオケのセンタから端末装置に
送信される曲のデータは、曲に合わせて歌詞を表示する
と共にその表示色を変更するための文字データと、曲の
伴奏を再生するために端末装置のシンセサイザを動作さ
せるMIDI信号と、男性または女性の声による肉声バ
ックコーラスを端末装置で再生するための圧縮された音
声信号とで構成されている。そして、この通信カラオケ
の端末装置において、演奏される伴奏の音程を変える場
合、MIDI信号で再生されるシンセサイザの音程を、
全体的に上げる(下げる)様に設定することにより、再
生速度を変えることなく音程を自由に変えて再生するこ
とができる。
【0004】ところが、肉声バックコーラスは、MID
I信号でないため、音程に関連するデータを備えておら
ず、再生速度を変えない状態で、音質の劣化がなく、し
かも個人の声の特徴を残したままで音声の音程を変換す
ることは困難であった。また、近年の音響映像編集装置
は、デジタル信号の状態で編集作業を行うものも開発さ
れてきているが、高品質を維持したままで音声の音程を
変換させるのは困難であった。
【0005】これまでの音声の再生速度を一定に保った
ままで音声の音程を変換する方法としては、主として二
通りの方法が考えられている。一つは、音声波形を時間
領域で操作する方法であり、例えばピッチ周波数を2倍
に上げる場合、音声信号を所定時間毎に切り出して、こ
の切り出し区間毎に2倍の速度でデータを読み出すよう
にしている。そしてこの場合、切り出した区間のデータ
からピッチ周波数(ピーク周波数のうち最も低い周波
数)を求め、2倍のピッチ周波数である波形を付け加え
ることで時間を変えずにピッチ周波数のみ2倍に上げる
ことができる。さらに、この様な処理をした切り出し区
間をスムーズに繋げることによって音程変換を実現する
ことができるが、現実には、繋げ方によって音質を損ね
たり、個人の声の特徴が維持されず不自然な音声となっ
てしまうので、現在も各種改善方法が提案されている状
態である。
【0006】もう一つは、フーリエ変換を用いて周波数
領域で操作する方法である。音声信号を所定時間毎に切
り出し、フーリエ変換によって周波数の振幅成分と周波
数の位相成分とを抽出する。次に、全周波数帯域を所望
のシフト量分だけ周波数シフト及び位相シフトし、逆フ
ーリエ変換した後、切り出し区間を繋げていく方法であ
る。しかし、この方法によっても不自然な音声となって
しまい、うまく音程変換ができなかった。なお、フーリ
エ変換後、ピークスペクトル(ピッチ周波数)を検出
し、このピークスペクトル付近の周波数信号のみをシフ
トする方法が当社より出願され、特開昭59−2040
96号公報に公開されている。
【0007】
【発明が解決しようとする課題】特開昭59−2040
96号公報に記載されている、ピークスペクトルを示す
周波数成分のみシフトを行なう方法は、ピークスペクト
ルの倍音成分がそのまま残っているため、聴覚において
元の音程が容易に想像されてしまい、倍音成分による元
の音程とシフトした後の音程との2重の音程が聴こえて
しまうという課題があった。
【0008】また、VTRやテープレコーダ等におい
て、解説やナレーション等の音声を高速再生する際に、
高くなってしまうピッチ周波数を元にもどして、聞き取
りやすくするなど、カラオケのキーコントロール以外で
も、音声のピッチ周波数を自由に変換したいという要求
があった。そこで本発明は、従来に比べ簡単な回路構成
で処理時間も比較的短く、しかも音質の劣化がなくて個
人の声の特徴を維持したままの自然な音声音程変換を可
能とする高品質な音程変換装置を提供することを目的と
する。
【0009】
【課題を解決するための手段】本発明は、上記目的を達
成するための手段として、ディジタル入力された音声信
号を所定時間の時間窓で切り出す分割手段と、この分割
手段から出力される音声信号の基本周波数を抽出するピ
ッチ周波数抽出手段と、前記分割手段から出力される音
声信号を時間領域の信号から周波数領域の信号へ変換す
るフーリエ変換手段と、このフーリエ変換手段より出力
される音声信号の全周波数帯域を高域側または低域側に
シフトする周波数シフト手段と、前記ピッチ周波数抽出
手段により抽出されたピッチ周波数が供給され、前記周
波数シフト手段により全周波数帯域をシフトされた音声
信号の倍音の構造を操作する倍音構造操作手段と、この
倍音構造操作手段より出力される音声信号を時間領域の
信号に変換する逆フーリエ変換手段とを有することを特
徴とする音程変換装置を提供しようとするものである。
【0010】
【発明の実施の形態】以下、添付図面を参照して本発明
の音程変換装置の一実施例を説明する。図1は本発明の
音程変換装置の一実施例を示すブロック図であり、図2
はその動作を示すフローチャート図である。そして、サ
ンプリング周波数44.1kHzのデジタル音声信号が
入力され、この音声信号を3半音高い方へピッチシフト
する(音程を上げる)場合を例にして、以下に説明す
る。
【0011】まず、フレーム(処理区間)の番号(i)
を初期化しておく(ステップ11)。そして、ディジタ
ル入力される音声信号がこのフレームよりも大きければ
(ステップ12→Yes )、フィルタ(分割手段)1によ
り4096サンプル毎のフレームに区切られて読み出さ
れ(ステップ13)、そのうち第0番〜第999番のサ
ンプル(最初の部分)は正弦波の窓関数で切り出され、
第3096番〜第4095番のサンプル(最後の部分)
は余弦波の窓関数で切り出され、その他のサンプルは1
の窓関数で切り出されて出力される(ステップ14)。
なお、この正弦波及び余弦波の窓関数による時間窓での
切り出しは、後述する切り出し区間の重ね合わせの際に
重ね合わせ部分の電力を一定にして各フレームをスムー
ズに繋げるために行うものである(図3参照)。
【0012】そして、このフィルタ1における正弦波お
よび余弦波による時間窓での切り出しは、200〜20
00サンプル幅の任意サンプル幅の区間で種々実験した
ところ、音源によって多少の変化はあるが、ほとんどの
音源で500〜1500サンプル(約10〜35mse
c)幅の間が最適な区間になることが判ったので、この
実施例では1000サンプル(約23msec)幅で正
弦波および余弦波による時間窓での切り出しを行ってい
る。なお、この切り出し区間のサンプル数(500〜1
500サンプル)は、フレームサンプル数の半分以下の
範囲で変更可能である。このフィルタ1により切り出さ
れた音声信号は、ピッチ周波数抽出手段2に供給され
て、自己相関関数やケプストラム法等によりピッチ周波
数(ピーク周波数のうち最も低い周波数(基本周波数)
を示すサンプル)が抽出される(ステップ15)。ま
た、フィルタ1より出力された音声信号は、FFT回路
(フーリエ変換手段)3にも供給されてフーリエ変換を
施され、時間領域の信号から周波数領域の信号へ変換さ
れる(ステップ16)。
【0013】このとき、時間領域に対応していた各サン
プルは、各周波数に対応し、サンプル番号と周波数とが
対応することになる。即ち、サンプリング周波数fsの
音声信号データをN個のサンプル毎に切り出して処理す
る場合、FFT回路3から出力される信号の周波数pH
zを示すサンプル番号は第(p×N/fs)番目とな
る。本実施例の場合、サンプリング周波数44.1kH
zの音声信号データに対して4096サンプル毎に切り
出しているので周波数pHzを示すサンプル番号は第
(p×4096/44100)番目となる(小数点以下
四捨五入)。
【0014】そして、周波数シフト手段4により、実部
と虚部とをピッチシフト量(3半音分)だけ移動させる
(ステップ17)。ここで、1オクターブ(12半音)
高い方へ移動させるということは、周波数を2倍にする
ことと同意であるので、h半音上げるには全体の周波数
を2h/12倍に上げれば良いことになる。ここでは、3半
音高い方へずらすので、全体の周波数を23/12倍(約
1.19倍)にすれば良い。その結果、第n番目のサン
プルの値は第(1.19×n)番目のサンプルに移動さ
れることになる。このとき、ピッチ周波数をp1 Hzと
すると、h半音シフトした後のピッチ周波数を示すサン
プル番号は第(p1 ×2h/12×N/fs)番目となる。
【0015】ここで、同じ人物が音程を変えて発音した
声を分析したところ、音程が高くなるにつれピッチ周波
数の倍音成分のレベルが比較的小さく、音程が低くなる
と倍音成分のレベルが大きくなり、豊富に出現すること
を発見した。そして、このピッチ周波数の倍音成分のレ
ベルが再生される音声品質に影響を与えることが判った
ので、周波数全体の移動後にこの倍音成分のレベルを操
作して、高品質の音声にする。
【0016】ピッチ周波数抽出手段2において、抽出さ
れたピッチ周波数が0である(ピッチ周波数が抽出され
ない)場合は(ステップ18→Yes )、倍音構造操作手
段5に供給される音声信号は、何も操作せずにIFFT
回路(逆フーリエ変換手段)6に出力される(ステップ
22)。
【0017】ピッチ周波数抽出手段2において、抽出さ
れたピッチ周波数が0でない(ピッチ周波数が存在す
る)場合は(ステップ18→No)、倍音構造操作手段5
に供給される音声信号は、ピッチ周波数の倍音成分(ピ
ッチ周波数の整数倍の周波数を示すサンプル)のレベル
を操作する。即ち、周波数全体を高い方へシフト(シフ
ト量≧1)した場合には(ステップ19→Yes )、ピッ
チシフトした後の信号の倍音成分のレベルを減少させ
(ステップ20)、周波数全体を低い方へシフト(シフ
ト量<1)した場合には(ステップ19→No)、ピッチ
シフトした後の信号の倍音成分のレベルを増加させる
(ステップ21)。本実施例では、共に10dBだけレ
ベルを変化させることにしている。
【0018】例えば抽出されたピッチ周波数が200H
zであるとき、周波数全体を高い方へ3半音シフトした
(ピッチシフト量が1倍以上)場合には、シフトした後
のピッチ周波数は200×1.19Hzとなるので、シ
フトした後の音声信号の倍音成分は、200×1.19
×m(mは2以上の整数)Hzとなる。そして、この周
波数を示すサンプル番号の実部及び虚部を各々10-0.5
乗算して、約−10dBのレベル操作を行う。これを一
般化すると、ピッチ周波数p1 Hzのときのh半音シフ
トした後のm倍音成分を示すサンプル番号は、第(m×
1 ×2h/12×N/fs)番目となるので、このサンプ
ル番号のデータの実部及び虚部を各々10-0.5または1
0.5 を乗算することにより、±10dBのレベル操作
が可能となる。
【0019】この後、IFFT回路6に供給されて、逆
フーリエ変換され、周波数領域から時間領域へ変換され
る(ステップ22)。IFFT回路6により時間領域の
信号に変換された音声信号は、フィルタ7に供給されて
再び第0番〜第999番のサンプルは正弦波の窓関数で
時間窓で切り出され、第3096番〜第4095番のサ
ンプルは余弦波の窓関数で時間窓で切り出され、その他
のサンプルは1の窓関数でフィルタをかけられて出力さ
れる(ステップ23)。そして、最初の音声信号の第3
096番〜第4095番のサンプルデータを図示せぬメ
モリ等に格納しておき、第0番〜第3095番のサンプ
ルデータをD/A変換器(図示せぬ)などへ出力する。
【0020】次に入力される音声信号のデータは、最初
の音声信号の第3096番のサンプルから4096サン
プル分を読み出して、上記と同様の処理を行う。そし
て、図3に示すように、フィルタ7から出力される音声
信号に対して先に格納していた最初の音声信号の第30
96番〜第4095番のサンプルデータを加算する(ス
テップ24)と共に、このサンプルデータの最後の部分
1000サンプルのデータを図示せぬメモリ等に格納す
る(ステップ25)。この様に、正弦波または余弦波の
窓関数で時間窓で切り出される前後1000サンプル分
のデータが重なるように切り出して、重なる部分のデー
タを加算しながら出力していく(ステップ26)。そし
て、フレーム番号iに1を加算し(ステップ27)、入
力される音声信号がなくなるまで、これらの処理を繰り
返す。
【0021】なお、上記実施例での処理区間は4096
サンプルとしているが、これ以外のサンプル数でも良い
のは勿論である。しかしながら、種々の実験を行った結
果、1サンプル当たり10Hz〜25Hz程度となるよ
うに処理区間を設定するのが音質上最も良いことが判っ
た。そして、フーリエ変換等のデジタル処理を行うこと
を考慮すると、処理区間は2のn乗サンプルにするのが
良い。したがって、上記実施例のようにサンプリング周
波数44.1kHzの音声データの場合は、2048サ
ンプル(21.5Hz/1サンプル)または4096サ
ンプル(10.8Hz/1サンプル)とするのが良く、
MPEG2オーデオ等で使用されるサンプリング周波数
22.05kHzの音声データの場合は、1024サン
プル(21.5Hz/1サンプル)または2048サン
プル(10.8Hz/1サンプル)とするのが良い。
【0022】実際に、サンプリング周波数44.1kH
zの音声データについて、処理区間を512、102
4、2048、4096、8192の各サンプルで実験
したところ、512サンプルでは音程が一つに定まら
ず、1024サンプルでは音質が非常に悪かった。そし
て、8192サンプルでは所望の音程にはなったもの
の、ディレイがかかったような2重の音声となってしま
い、処理区間は2048または4096サンプルのとき
が最も高音質の結果を得ることができた。
【0023】
【発明の効果】本発明の音程変換装置は、音声信号のピ
ッチ周波数を抽出して、フーリエ変換した後に全周波数
帯域を高域側または低域側にシフトした音声信号のピッ
チ周波数の倍音の構造を操作してから逆フーリエ変換す
ることにより、周波数領域で倍音成分の特徴を維持した
まま全周波数帯域をシフトしているので、従来に比べ簡
単な回路構成で処理時間も比較的短く、しかも音質の劣
化がなくて個人の声の特徴を維持したままの自然で高品
質な音声音程変換が可能となるという効果がある。
【図面の簡単な説明】
【図1】本発明の音程変換装置の一実施例を示すブロッ
ク図である。
【図2】本発明の音程変換装置の一実施例を示すフロー
チャート図である。
【図3】本発明の音程変換装置の一実施例の時間窓での
切り出しと重ね合わせを説明するための図である。
【符号の説明】
1 フィルタ(分割手段) 2 ピッチ周波数抽出手段 3 FFT回路(フーリエ変換手段) 4 周波数シフト手段 5 倍音構造操作手段 6 IFFT回路(逆フーリエ変換手段) 7 フィルタ
フロントページの続き (56)参考文献 特開 平6−149288(JP,A) 特開 昭59−204095(JP,A) 特開 平9−127994(JP,A) 特開 平9−127985(JP,A) 特開 平8−223677(JP,A) 特開 平8−167247(JP,A) 特開 平5−313693(JP,A) 特開 昭59−204096(JP,A) 特開 平3−164799(JP,A) 特開 平6−175692(JP,A) 特開 平4−163498(JP,A) 特開 昭50−11706(JP,A) 特開 平9−44184(JP,A) 特公 昭59−2916(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 21/04

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】ディジタル入力された音声信号を所定時間
    の時間窓で切り出す分割手段と、 この分割手段から出力される音声信号の基本周波数を抽
    出するピッチ周波数抽出手段と、 前記分割手段から出力される音声信号を時間領域の信号
    から周波数領域の信号へ変換するフーリエ変換手段と、 このフーリエ変換手段より出力される音声信号の全周波
    数帯域を高域側または低域側にシフトする周波数シフト
    手段と、 前記ピッチ周波数抽出手段により抽出されたピッチ周波
    数が供給され、前記周波数シフト手段により全周波数帯
    域をシフトされた音声信号の倍音の構造を操作する倍音
    構造操作手段と、 この倍音構造操作手段より出力される音声信号を時間領
    域の信号に変換する逆フーリエ変換手段とを有すること
    を特徴とする音程変換装置。
  2. 【請求項2】前記分割手段は、ディジタル入力された音
    声信号を所定時間のフレームに切り出すと共に、このフ
    レームの最初の0〜35msec(上限は10〜35m
    secの間で変更可能)のデータを正弦波の1/4周期
    分の時間窓で切り出し、このフレームの最後の0〜35
    msec(上限は10〜35msecの間で変更可能)
    のデータを余弦波の1/4周期分の時間窓で切り出すこ
    とを特徴とする請求項1記載の音程変換装置。
  3. 【請求項3】前記倍音構造操作手段は、前記全帯域シフ
    ト手段により高域側へシフトされた際には音声信号の倍
    音成分のレベルを減少させ、低域側へシフトされた際に
    は音声信号の倍音成分のレベルを増加させることを特徴
    とする請求項1または請求項2記載の音程変換装置。
JP35350895A 1995-12-28 1995-12-28 音程変換装置 Expired - Fee Related JP3265962B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP35350895A JP3265962B2 (ja) 1995-12-28 1995-12-28 音程変換装置
TW085115885A TW418384B (en) 1995-12-28 1996-12-23 Voice pitch conversion device
US08/773,192 US5862232A (en) 1995-12-28 1996-12-27 Sound pitch converting apparatus
KR1019960082425A KR100256718B1 (ko) 1995-12-28 1996-12-28 음피치 변환 장치
CNB961239727A CN1135531C (zh) 1995-12-28 1996-12-28 音调转换装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35350895A JP3265962B2 (ja) 1995-12-28 1995-12-28 音程変換装置

Publications (2)

Publication Number Publication Date
JPH09185392A JPH09185392A (ja) 1997-07-15
JP3265962B2 true JP3265962B2 (ja) 2002-03-18

Family

ID=18431324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35350895A Expired - Fee Related JP3265962B2 (ja) 1995-12-28 1995-12-28 音程変換装置

Country Status (5)

Country Link
US (1) US5862232A (ja)
JP (1) JP3265962B2 (ja)
KR (1) KR100256718B1 (ja)
CN (1) CN1135531C (ja)
TW (1) TW418384B (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3502247B2 (ja) 1997-10-28 2004-03-02 ヤマハ株式会社 音声変換装置
ID29029A (id) * 1998-10-29 2001-07-26 Smith Paul Reed Guitars Ltd Metode untuk menemukan fundamental dengan cepat
IL140082A0 (en) * 2000-12-04 2002-02-10 Sisbit Trade And Dev Ltd Improved speech transformation system and apparatus
EP1382143B1 (en) * 2001-04-24 2007-02-07 Nokia Corporation Methods for changing the size of a jitter buffer and for time alignment, communications system, receiving end, and transcoder
JP4649888B2 (ja) * 2004-06-24 2011-03-16 ヤマハ株式会社 音声効果付与装置及び音声効果付与プログラム
CN1763844B (zh) * 2004-10-18 2010-05-05 中国科学院声学研究所 基于滑动窗口的端点检测方法、装置和语音识别***
JP4734961B2 (ja) * 2005-02-28 2011-07-27 カシオ計算機株式会社 音響効果付与装置、及びプログラム
JP5083884B2 (ja) * 2007-11-15 2012-11-28 独立行政法人産業技術総合研究所 周波数変換装置
US9159325B2 (en) * 2007-12-31 2015-10-13 Adobe Systems Incorporated Pitch shifting frequencies
JP5251381B2 (ja) * 2008-09-12 2013-07-31 ヤマハ株式会社 音処理装置およびプログラム
CN104205213B (zh) * 2012-03-23 2018-01-05 西门子公司 语音信号处理方法及装置以及使用其的助听器
KR101333162B1 (ko) * 2012-10-04 2013-11-27 부산대학교 산학협력단 Imdct 입력신호를 이용한 오디오 신호의 음정 및 속도 가변 장치 및 방법
CN105448289A (zh) * 2015-11-16 2016-03-30 努比亚技术有限公司 一种语音合成、删除方法、装置及语音删除合成方法
CN105812902B (zh) * 2016-03-17 2018-09-04 联发科技(新加坡)私人有限公司 数据播放的方法、设备及***
CN108269579B (zh) * 2018-01-18 2020-11-10 厦门美图之家科技有限公司 语音数据处理方法、装置、电子设备及可读存储介质
CN108281130B (zh) * 2018-01-19 2021-02-09 北京小唱科技有限公司 音频修正方法及装置
CN111383646B (zh) * 2018-12-28 2020-12-08 广州市百果园信息技术有限公司 一种语音信号变换方法、装置、设备和存储介质
JP7475988B2 (ja) * 2020-06-26 2024-04-30 ローランド株式会社 効果装置および効果処理プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59204096A (ja) * 1983-05-04 1984-11-19 日本ビクター株式会社 楽音ピツチ可変装置
JPS60129797A (ja) * 1983-12-16 1985-07-11 ソニー株式会社 ピツチコントロ−ル装置
JP2612869B2 (ja) * 1987-10-06 1997-05-21 日本放送協会 声質変換方法
US5103431A (en) * 1990-12-31 1992-04-07 Gte Government Systems Corporation Apparatus for detecting sonar signals embedded in noise
DE4212339A1 (de) * 1991-08-12 1993-02-18 Standard Elektrik Lorenz Ag Codierverfahren fuer audiosignale mit 32 kbit/s
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
WO1993018505A1 (en) * 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
US5248845A (en) * 1992-03-20 1993-09-28 E-Mu Systems, Inc. Digital sampling instrument
JP3270869B2 (ja) * 1993-04-30 2002-04-02 ソニー株式会社 音程変換装置

Also Published As

Publication number Publication date
TW418384B (en) 2001-01-11
CN1164084A (zh) 1997-11-05
US5862232A (en) 1999-01-19
JPH09185392A (ja) 1997-07-15
KR970050862A (ko) 1997-07-29
CN1135531C (zh) 2004-01-21
KR100256718B1 (ko) 2000-05-15

Similar Documents

Publication Publication Date Title
JP3265962B2 (ja) 音程変換装置
US10008193B1 (en) Method and system for speech-to-singing voice conversion
JP4207902B2 (ja) 音声合成装置およびプログラム
Duxbury et al. Improved time-scaling of musical audio using phase locking at transients
JPH11513821A (ja) 逆変換狭帯域/広帯域音声合成
JP4170458B2 (ja) 波形信号の時間軸圧縮伸長装置
Dutilleux et al. Time‐segment Processing
JP3540159B2 (ja) 音声変換装置及び音声変換方法
JPH11338500A (ja) フォルマント・シフト補償音響シンセサイザおよびその操作方法
JP3502268B2 (ja) 音声信号処理装置及び音声信号処理方法
JPH11133996A (ja) 音程変換装置
JP3508981B2 (ja) 音楽演奏に含まれる旋律の分離方法、分離抽出方法および分離除去方法
JP4170459B2 (ja) 波形信号の時間軸圧縮伸長装置
JPH05119782A (ja) 音源装置
JP3538908B2 (ja) 電子楽器
JP3977654B2 (ja) 波形生成装置
JP3520931B2 (ja) 電子楽器
JP2990897B2 (ja) 音源装置
JP3949828B2 (ja) 音声変換装置及び音声変換方法
JP3540609B2 (ja) 音声変換装置及び音声変換方法
JP3083830B2 (ja) 音声の発声時間長制御方法および装置
JP2002189472A (ja) 音色制御装置
JP2000305600A (ja) 音声信号処理装置及び方法、情報媒体
JP3540160B2 (ja) 音声変換装置及び音声変換方法
JP2000099059A (ja) 信号処理方法、信号処理装置および歌唱再生装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090111

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090111

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100111

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120111

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120111

Year of fee payment: 10

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees