JP5085700B2 - 音声合成装置、音声合成方法およびプログラム - Google Patents
音声合成装置、音声合成方法およびプログラム Download PDFInfo
- Publication number
- JP5085700B2 JP5085700B2 JP2010192656A JP2010192656A JP5085700B2 JP 5085700 B2 JP5085700 B2 JP 5085700B2 JP 2010192656 A JP2010192656 A JP 2010192656A JP 2010192656 A JP2010192656 A JP 2010192656A JP 5085700 B2 JP5085700 B2 JP 5085700B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- spectrum
- speech
- unit
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001308 synthesis method Methods 0.000 title claims description 5
- 230000015572 biosynthetic process Effects 0.000 title description 27
- 238000003786 synthesis reaction Methods 0.000 title description 27
- 238000001228 spectrum Methods 0.000 claims abstract description 223
- 238000003860 storage Methods 0.000 claims abstract description 67
- 230000001755 vocal effect Effects 0.000 claims abstract description 40
- 238000000605 extraction Methods 0.000 claims abstract description 28
- 239000000284 extract Substances 0.000 claims abstract description 13
- 238000004458 analytical method Methods 0.000 claims description 54
- 238000004364 calculation method Methods 0.000 claims description 51
- 238000009826 distribution Methods 0.000 claims description 24
- 230000003595 spectral effect Effects 0.000 claims description 24
- 238000010183 spectrum analysis Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 claims description 8
- 238000005520 cutting process Methods 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 claims 1
- 239000011295 pitch Substances 0.000 description 123
- 238000000034 method Methods 0.000 description 50
- 238000012545 processing Methods 0.000 description 45
- 238000010586 diagram Methods 0.000 description 41
- 230000008569 process Effects 0.000 description 26
- 238000003066 decision tree Methods 0.000 description 21
- 238000012805 post-processing Methods 0.000 description 16
- 230000000737 periodic effect Effects 0.000 description 12
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 8
- 125000004122 cyclic group Chemical group 0.000 description 8
- 238000001914 filtration Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 230000002194 synthesizing effect Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- ZPUCINDJVBIVPJ-LJISPDSOSA-N ***e Chemical compound O([C@H]1C[C@@H]2CC[C@@H](N2C)[C@H]1C(=O)OC)C(=O)C1=CC=CC=C1 ZPUCINDJVBIVPJ-LJISPDSOSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
第1の実施形態にかかる音声合成装置は、予め帯域通過フィルタを適用したパルス信号(帯域パルス信号)および雑音信号(帯域雑音信号)を記憶し、帯域雑音信号から巡回シフトまたは往復シフトさせながら切り出した帯域雑音信号を用いてソースフィルタモデルの音源信号を生成することにより、高速に音声波形を生成する。
第2の実施形態にかかる音声合成装置200は、ピッチマークと音声波形を入力し、ピッチ同期分析したスペクトルを固定フレームレートに補間することにより得られたスペクトルにより音声を分析して音声パラメータを生成する。これにより精密な音声分析が可能になり、このようにして生成された音声パラメータから音声を合成することで、高品質な合成音声を作成することが可能になる。
音声パラメータを入力して音声波形の生成を行う音声合成装置のみでなく、入力したテキストデータ(以下、単にテキストという)から音声を合成する装置も広く音声合成装置と呼ばれる。このような音声合成装置の1つとして隠れマルコフモデル(HMM)に基づく音声合成が提案されている。HMMに基づく音声合成は、様々なコンテキスト情報(文内の位置、呼気段落内の位置、単語内の位置、および、前後の音素環境など)を考慮した音素単位のHMMを、最尤推定および、決定木に基づく状態クラスタリングによって構築する。音声を合成する際には、入力テキストから変換して得られるコンテキスト情報によって決定木を辿ることにより分布列を作成し、得られた分布列から音声パラメータ列を生成する。音声パラメータ列から、例えばメルケプストラムによるソースフィルタ型の音声合成装置などを利用することにより音声波形生成を行う。HMMの出力分布に、動的特徴量を加え、この動的特徴量を考慮したパラメータ生成アルゴリズムを用いて音声パラメータ列を生成することにより、滑らかに接続された音声が合成される。
11 第1パラメータ入力部
12 音源信号生成部
13 声道フィルタ部
14 波形出力部
201 第2パラメータ入力部
202 判断部
203 ピッチマーク作成部
204 混合音源作成部
205 重畳部
206 雑音音源作成部
207 接続部
221 第1記憶部
222 第2記憶部
223 第3記憶部
301 切出部
302 振幅制御部
303 生成部
Claims (12)
- n個(nは2以上の整数)の通過帯域に対応するn個の帯域通過フィルタそれぞれを雑音信号に適用して得られるn個の帯域雑音信号を記憶する第1記憶部と、
n個の前記帯域通過フィルタそれぞれをパルス信号に適用して得られるn個の帯域パルス信号を記憶する第2記憶部と、
合成する音声の基本周波数系列と、n個の前記通過帯域それぞれの雑音の強度を表すn個の帯域雑音強度系列と、スペクトルパラメータ系列とを入力するパラメータ入力部と、
前記基本周波数系列から作成した前記合成する音声のピッチマークごとに、前記第1記憶部に記憶されたn個の前記帯域雑音信号をシフトしながら切り出す切出部と、
n個の前記通過帯域ごとに、切り出した前記帯域雑音信号の振幅と、前記帯域パルス信号の振幅とを、前記通過帯域の前記帯域雑音強度系列に応じて変更する振幅制御部と、
振幅を変更したn個の前記帯域雑音信号と、振幅を変更したn個の前記帯域パルス信号とを加算した前記ピッチマークごとの混合音源信号を生成する生成部と、
前記ピッチマークごとの前記混合音源信号を重畳する重畳部と、
重畳された前記混合音源信号に前記スペクトルパラメータ系列を用いた声道フィルタを適用して音声波形を生成する声道フィルタ部と、
を備えることを特徴とする音声合成装置。 - 音声信号と前記ピッチマークとを入力する音声入力部と、
前記ピッチマークを中心として前記音声信号に窓関数を適用することにより音声波形を抽出する波形抽出部と、
前記音声波形をスペクトル分析して前記音声波形のスペクトルを表す音声スペクトルを算出するスペクトル分析部と、
予め定められたフレームレートの各フレーム時刻に隣接する複数の前記ピッチマークの前記音声スペクトルを補間することにより、前記フレームレートの各フレーム時刻の音声スペクトルを算出する補間部と、
前記補間部により得られた音声スペクトルに基づいて前記スペクトルパラメータ系列を算出するパラメータ算出部と、をさらに備え、
前記パラメータ入力部は、前記基本周波数系列と、前記帯域雑音強度系列と、算出された前記スペクトルパラメータ系列とを入力すること、
を特徴とする請求項1に記載の音声合成装置。 - 音声信号と前記音声信号の雑音成分と前記ピッチマークとを入力する音声入力部と、
前記ピッチマークを中心として前記音声信号に窓関数を適用することにより音声波形を抽出し、前記ピッチマークを中心として前記雑音成分に窓関数を適用することにより雑音成分波形を抽出する波形抽出部と、
前記音声波形および前記雑音成分波形をスペクトル分析して前記音声波形のスペクトルを表す音声スペクトルおよび前記雑音成分のスペクトルを表す雑音成分スペクトルを算出するスペクトル分析部と、
予め定められたフレームレートの各フレーム時刻に隣接する複数の前記ピッチマークの前記音声スペクトルおよび前記雑音成分スペクトルを補間することにより、前記フレームレートの各フレーム時刻の音声スペクトルおよび雑音成分スペクトルを算出し、算出した音声スペクトルに対する雑音成分スペクトルの割合を表す雑音成分指標を算出する、または、前記フレームレートの各フレーム時刻に隣接する複数の前記ピッチマークの前記音声スペクトルに対する前記雑音成分スペクトルの割合を補間することにより、前記フレームレートの各フレーム時刻の音声スペクトルに対する雑音成分スペクトルの割合を表す雑音成分指標を算出する補間部と、
算出された雑音成分指標に基づいて、前記帯域雑音強度系列を算出するパラメータ算出部と、をさらに備え、
前記パラメータ入力部は、前記基本周波数系列と、算出された前記帯域雑音強度系列と、前記スペクトルパラメータ系列とを入力すること、
を特徴とする請求項1に記載の音声合成装置。 - 前記音声入力部は、前記音声信号と、前記音声信号のスペクトルの基本周波数の整数倍以外の成分を表す前記雑音成分と、前記ピッチマークとを入力すること、
を特徴とする請求項3に記載の音声合成装置。 - 予め定められた閾値を超える最大の周波数である境界周波数を、有声音のスペクトルから抽出する境界周波数抽出部と、
前記境界周波数より低い周波数帯域は音源信号がパルス信号となるように前記雑音成分指標を補正する補正部と、をさらに備えること、
を特徴とする請求項3に記載の音声合成装置。 - 予め定められた初期周波数から単調増加または単調減少する範囲で予め定められた閾値を超える最大の周波数である境界周波数を、有声摩擦音のスペクトルから抽出する境界周波数抽出部と、
前記境界周波数より低い周波数帯域は音源信号がパルス信号となるように前記雑音成分指標を補正する補正部と、をさらに備えること、
を特徴とする請求項3に記載の音声合成装置。 - 予め定められた音声単位に対する基本周波数系列、帯域雑音強度系列、およびスペクトルパラメータ系列の出力確率分布パラメータを含む隠れマルコフモデルパラメータを記憶する隠れマルコフモデル記憶部と、
入力されたテキストデータに含まれる前記音声単位を解析する言語解析部と、
解析された前記音声単位および前記隠れマルコフモデルパラメータに基づいて、入力されたテキストデータに対する前記基本周波数系列、前記帯域雑音強度系列および前記スペクトルパラメータ系列を生成する音声パラメータ生成部と、をさらに備え、
前記パラメータ入力部は、生成された前記基本周波数系列、前記帯域雑音強度系列、および、前記スペクトルパラメータ系列を入力すること、
を特徴とする請求項1に記載の音声合成装置。 - 前記第1記憶部に記憶された前記帯域雑音信号は、音質劣化しない最小の長さとして予め定められた規定長以上の長さであること、
を特徴とする請求項1に記載の音声合成装置。 - 前記規定長は5ミリ秒であること、
を特徴とする請求項8に記載の音声合成装置。 - 前記第1記憶部に記憶された前記帯域雑音信号は、対応する前記通過帯域が大きい前記帯域雑音信号が、対応する前記通過帯域が小さい前記帯域雑音信号より長く、対応する前記通過帯域が小さい前記帯域雑音信号が、音質劣化しない最小の長さとして予め定められた規定長以上の長さであること、
を特徴とする請求項1に記載の音声合成装置。 - n個(nは2以上の整数)の通過帯域に対応するn個の帯域通過フィルタそれぞれを雑音信号に適用して得られるn個の帯域雑音信号を記憶する第1記憶部と、n個の前記帯域通過フィルタそれぞれをパルス信号に適用して得られるn個の帯域パルス信号を記憶する第2記憶部と、を備える音声合成装置で実行される音声合成方法であって、
合成する音声の基本周波数系列と、n個の前記通過帯域それぞれの雑音の強度を表すn個の帯域雑音強度系列と、スペクトルパラメータ系列とを入力するパラメータ入力ステップと、
前記基本周波数系列から作成した合成する音声のピッチマークごとに、前記第1記憶部に記憶されたn個の前記帯域雑音信号をシフトしながら切り出す切出ステップと、
n個の前記通過帯域ごとに、切り出した前記帯域雑音信号の振幅と、前記帯域パルス信号の振幅とを、前記通過帯域の前記帯域雑音強度系列に応じて変更する振幅制御ステップと、
振幅を変更したn個の前記帯域雑音信号と、振幅を変更したn個の前記帯域パルス信号とを加算した前記ピッチマークごとの混合音源信号を生成する生成ステップと、
前記ピッチマークごとの前記混合音源信号を重畳する重畳ステップと、
重畳された前記混合音源信号に前記スペクトルパラメータ系列を用いた声道フィルタを適用して音声波形を生成する声道フィルタステップと、
を含むことを特徴とする音声合成方法。 - コンピュータを、
n個(nは2以上の整数)の通過帯域に対応するn個の帯域通過フィルタそれぞれを雑音信号に適用して得られるn個の帯域雑音信号を記憶する第1記憶部と、
n個の前記帯域通過フィルタそれぞれをパルス信号に適用して得られるn個の帯域パルス信号を記憶する第2記憶部と、
合成する音声の基本周波数系列と、n個の前記通過帯域それぞれの雑音の強度を表すn個の帯域雑音強度系列と、スペクトルパラメータ系列とを入力するパラメータ入力部と、
前記基本周波数系列から作成した前記合成する音声のピッチマークごとに、前記第1記憶部に記憶されたn個の前記帯域雑音信号をシフトしながら切り出す切出部と、
n個の前記通過帯域ごとに、切り出した前記帯域雑音信号の振幅と、前記帯域パルス信号の振幅とを、前記通過帯域の前記帯域雑音強度系列に応じて変更する振幅制御部と、
振幅を変更したn個の前記帯域雑音信号と、振幅を変更したn個の前記帯域パルス信号とを加算した前記ピッチマークごとの混合音源信号を生成する生成部と、
前記ピッチマークごとの前記混合音源信号を重畳する重畳部と、
重畳された前記混合音源信号に前記スペクトルパラメータ系列を用いた声道フィルタを適用して音声波形を生成する声道フィルタ部、
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010192656A JP5085700B2 (ja) | 2010-08-30 | 2010-08-30 | 音声合成装置、音声合成方法およびプログラム |
US13/051,541 US9058807B2 (en) | 2010-08-30 | 2011-03-18 | Speech synthesizer, speech synthesis method and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010192656A JP5085700B2 (ja) | 2010-08-30 | 2010-08-30 | 音声合成装置、音声合成方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012048154A JP2012048154A (ja) | 2012-03-08 |
JP5085700B2 true JP5085700B2 (ja) | 2012-11-28 |
Family
ID=45698345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010192656A Active JP5085700B2 (ja) | 2010-08-30 | 2010-08-30 | 音声合成装置、音声合成方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9058807B2 (ja) |
JP (1) | JP5085700B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9870779B2 (en) | 2013-01-18 | 2018-01-16 | Kabushiki Kaisha Toshiba | Speech synthesizer, audio watermarking information detection apparatus, speech synthesizing method, audio watermarking information detection method, and computer program product |
US10529314B2 (en) | 2014-09-19 | 2020-01-07 | Kabushiki Kaisha Toshiba | Speech synthesizer, and speech synthesis method and computer program product utilizing multiple-acoustic feature parameters selection |
US10650800B2 (en) | 2015-09-16 | 2020-05-12 | Kabushiki Kaisha Toshiba | Speech processing device, speech processing method, and computer program product |
US10878801B2 (en) | 2015-09-16 | 2020-12-29 | Kabushiki Kaisha Toshiba | Statistical speech synthesis device, method, and computer program product using pitch-cycle counts based on state durations |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013003470A (ja) * | 2011-06-20 | 2013-01-07 | Toshiba Corp | 音声処理装置、音声処理方法および音声処理方法により作成されたフィルタ |
US8620646B2 (en) * | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
KR101402805B1 (ko) | 2012-03-27 | 2014-06-03 | 광주과학기술원 | 음성분석장치, 음성합성장치, 및 음성분석합성시스템 |
JP5631915B2 (ja) | 2012-03-29 | 2014-11-26 | 株式会社東芝 | 音声合成装置、音声合成方法、音声合成プログラムならびに学習装置 |
KR102148407B1 (ko) * | 2013-02-27 | 2020-08-27 | 한국전자통신연구원 | 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법 |
CA3178027A1 (en) * | 2014-05-28 | 2015-12-03 | Interactive Intelligence, Inc. | Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system |
US9607610B2 (en) * | 2014-07-03 | 2017-03-28 | Google Inc. | Devices and methods for noise modulation in a universal vocoder synthesizer |
CN105989836B (zh) * | 2015-03-06 | 2020-12-01 | 腾讯科技(深圳)有限公司 | 一种语音采集方法、装置及终端设备 |
CN104916282B (zh) * | 2015-03-27 | 2018-11-06 | 北京捷通华声科技股份有限公司 | 一种语音合成的方法和装置 |
TWI569263B (zh) * | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
JP6637082B2 (ja) * | 2015-12-10 | 2020-01-29 | ▲華▼侃如 | 調波モデルと音源−声道特徴分解に基づく音声分析合成方法 |
GB2548356B (en) * | 2016-03-14 | 2020-01-15 | Toshiba Res Europe Limited | Multi-stream spectral representation for statistical parametric speech synthesis |
CN107871494B (zh) * | 2016-09-23 | 2020-12-11 | 北京搜狗科技发展有限公司 | 一种语音合成的方法、装置及电子设备 |
AU2017373523B2 (en) * | 2016-12-06 | 2020-09-24 | Nippon Telegraph And Telephone Corporation | Signal feature extraction apparatus, signal feature extraction method, and program |
KR102136464B1 (ko) * | 2018-07-31 | 2020-07-21 | 전자부품연구원 | 어텐션 메커니즘 기반의 오디오 분할 방법 |
US11468879B2 (en) * | 2019-04-29 | 2022-10-11 | Tencent America LLC | Duration informed attention network for text-to-speech analysis |
KR102321798B1 (ko) * | 2019-08-15 | 2021-11-05 | 엘지전자 주식회사 | 인공 신경망 기반의 음성 인식 모델을 학습시키는 방법 및 음성 인식 디바이스 |
JP7334942B2 (ja) * | 2019-08-19 | 2023-08-29 | 国立大学法人 東京大学 | 音声変換装置、音声変換方法及び音声変換プログラム |
US11151979B2 (en) | 2019-08-23 | 2021-10-19 | Tencent America LLC | Duration informed attention network (DURIAN) for audio-visual synthesis |
WO2021127978A1 (zh) * | 2019-12-24 | 2021-07-01 | 深圳市优必选科技股份有限公司 | 语音合成方法、装置、计算机设备和存储介质 |
CN113409756B (zh) * | 2020-03-16 | 2022-05-03 | 阿里巴巴集团控股有限公司 | 语音合成方法、***、设备及存储介质 |
CN113689837B (zh) * | 2021-08-24 | 2023-08-29 | 北京百度网讯科技有限公司 | 音频数据处理方法、装置、设备以及存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2711737B2 (ja) * | 1989-10-06 | 1998-02-10 | 国際電気株式会社 | 線形予測分析・合成方式の復号器 |
JP2841797B2 (ja) * | 1990-09-07 | 1998-12-24 | 三菱電機株式会社 | 音声分析・合成装置 |
JP3092436B2 (ja) * | 1994-03-02 | 2000-09-25 | 日本電気株式会社 | 音声符号化装置 |
JPH08254993A (ja) * | 1995-03-16 | 1996-10-01 | Toshiba Corp | 音声合成装置 |
JP3335841B2 (ja) * | 1996-05-27 | 2002-10-21 | 日本電気株式会社 | 信号符号化装置 |
JP3576794B2 (ja) * | 1998-03-23 | 2004-10-13 | 株式会社東芝 | 音声符号化/復号化方法 |
JP3292711B2 (ja) * | 1999-08-06 | 2002-06-17 | 株式会社ワイ・アール・ピー高機能移動体通信研究所 | 音声符号化復号方法および装置 |
JP2000356995A (ja) * | 1999-04-16 | 2000-12-26 | Matsushita Electric Ind Co Ltd | 音声通信システム |
JP2002268660A (ja) * | 2001-03-13 | 2002-09-20 | Japan Science & Technology Corp | テキスト音声合成方法および装置 |
JP4380669B2 (ja) * | 2006-08-07 | 2009-12-09 | カシオ計算機株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
JP5159279B2 (ja) * | 2007-12-03 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそれを用いた音声合成装置。 |
JP5159325B2 (ja) | 2008-01-09 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそのプログラム |
JP4999757B2 (ja) * | 2008-03-31 | 2012-08-15 | 日本電信電話株式会社 | 音声分析合成装置、音声分析合成方法、コンピュータプログラム、および記録媒体 |
JP5038995B2 (ja) * | 2008-08-25 | 2012-10-03 | 株式会社東芝 | 声質変換装置及び方法、音声合成装置及び方法 |
-
2010
- 2010-08-30 JP JP2010192656A patent/JP5085700B2/ja active Active
-
2011
- 2011-03-18 US US13/051,541 patent/US9058807B2/en active Active
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9870779B2 (en) | 2013-01-18 | 2018-01-16 | Kabushiki Kaisha Toshiba | Speech synthesizer, audio watermarking information detection apparatus, speech synthesizing method, audio watermarking information detection method, and computer program product |
US10109286B2 (en) | 2013-01-18 | 2018-10-23 | Kabushiki Kaisha Toshiba | Speech synthesizer, audio watermarking information detection apparatus, speech synthesizing method, audio watermarking information detection method, and computer program product |
US10529314B2 (en) | 2014-09-19 | 2020-01-07 | Kabushiki Kaisha Toshiba | Speech synthesizer, and speech synthesis method and computer program product utilizing multiple-acoustic feature parameters selection |
US10650800B2 (en) | 2015-09-16 | 2020-05-12 | Kabushiki Kaisha Toshiba | Speech processing device, speech processing method, and computer program product |
US10878801B2 (en) | 2015-09-16 | 2020-12-29 | Kabushiki Kaisha Toshiba | Statistical speech synthesis device, method, and computer program product using pitch-cycle counts based on state durations |
US11170756B2 (en) | 2015-09-16 | 2021-11-09 | Kabushiki Kaisha Toshiba | Speech processing device, speech processing method, and computer program product |
US11348569B2 (en) | 2015-09-16 | 2022-05-31 | Kabushiki Kaisha Toshiba | Speech processing device, speech processing method, and computer program product using compensation parameters |
US11423874B2 (en) | 2015-09-16 | 2022-08-23 | Kabushiki Kaisha Toshiba | Speech synthesis statistical model training device, speech synthesis statistical model training method, and computer program product |
Also Published As
Publication number | Publication date |
---|---|
US20120053933A1 (en) | 2012-03-01 |
JP2012048154A (ja) | 2012-03-08 |
US9058807B2 (en) | 2015-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5085700B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
US11170756B2 (en) | Speech processing device, speech processing method, and computer program product | |
US11423874B2 (en) | Speech synthesis statistical model training device, speech synthesis statistical model training method, and computer program product | |
US8255222B2 (en) | Speech separating apparatus, speech synthesizing apparatus, and voice quality conversion apparatus | |
JP5038995B2 (ja) | 声質変換装置及び方法、音声合成装置及び方法 | |
US8195464B2 (en) | Speech processing apparatus and program | |
US10529314B2 (en) | Speech synthesizer, and speech synthesis method and computer program product utilizing multiple-acoustic feature parameters selection | |
US8301451B2 (en) | Speech synthesis with dynamic constraints | |
US8370153B2 (en) | Speech analyzer and speech analysis method | |
US20100217584A1 (en) | Speech analysis device, speech analysis and synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program | |
JP2015161774A (ja) | 音合成方法及び音合成装置 | |
WO2015025788A1 (ja) | 定量的f0パターン生成装置及び方法、並びにf0パターン生成のためのモデル学習装置及び方法 | |
US10446133B2 (en) | Multi-stream spectral representation for statistical parametric speech synthesis | |
Jung et al. | Waveform interpolation-based speech analysis/synthesis for HMM-based TTS systems | |
JP5983604B2 (ja) | 素片情報生成装置、音声合成装置、音声合成方法および音声合成プログラム | |
JP5075865B2 (ja) | 音声処理装置、方法、及びプログラム | |
JPH0247700A (ja) | 音声合成方法および装置 | |
JP2018004997A (ja) | 音声合成装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120905 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5085700 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |