JP5925082B2 - 音声合成装置、方法及びプログラム - Google Patents

音声合成装置、方法及びプログラム Download PDF

Info

Publication number
JP5925082B2
JP5925082B2 JP2012176759A JP2012176759A JP5925082B2 JP 5925082 B2 JP5925082 B2 JP 5925082B2 JP 2012176759 A JP2012176759 A JP 2012176759A JP 2012176759 A JP2012176759 A JP 2012176759A JP 5925082 B2 JP5925082 B2 JP 5925082B2
Authority
JP
Japan
Prior art keywords
lsp parameter
phoneme
phoneme hmm
lsp
differential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012176759A
Other languages
English (en)
Other versions
JP2014035460A (ja
Inventor
定男 廣谷
定男 廣谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012176759A priority Critical patent/JP5925082B2/ja
Publication of JP2014035460A publication Critical patent/JP2014035460A/ja
Application granted granted Critical
Publication of JP5925082B2 publication Critical patent/JP5925082B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

この発明は、HMM(Hidden Markov Model)を用いた音声合成技術に関する。
従来のHMM音声合成装置の構成を図3に示す。従来のHMM音声合成装置は、音素HMM系列生成部1と、声道スペクトルパラメータ計算部2と、音声合成部3と、音素HMM記憶部4とを備える。
音素HMM系列生成部1は、入力された合成したいテキストの音素列にしたがって、学習用の音声データベースから予め学習しておいた音素HMM(Hidden Markov Model: 隠れマルコフモデル)を接続することにより音素HMMの状態の系列を生成する。生成された音素HMMの状態の系列は、声道スペクトルパラメータ計算部2に送信される。
ここで、音素HMMの状態の系列は、声道スペクトルパラメータの平均値と声道スペクトルパラメータの速度の平均値とから成るベクトル、及び、声道スペクトルパラメータの分散と声道スペクトルパラメータの速度の分散とから成る行列で表現される。なお、声道スペクトルパラメータの平均値、声道スペクトルパラメータの速度の平均値、声道スペクトルパラメータの分散及び声道スペクトルパラメータの速度の分散のそれぞれは、音素HMMの状態の系列を構成する音素HMMの各状態ごとに計算される。
声道スペクトルパラメータ計算部2は、出力確率が最大となる声道スペクトルパラメータを計算する。
最後に、音声合成部3が、計算された声道スペクトルパラメータに基づいて、入力された音源信号(有声音であれば基本周期に応じたパルス列、無声音であれば白色雑音からなる音源信号)を畳み込むことにより音声を合成する(例えば、非特許文献1参照。)。
声道スペクトルパラメータとしては、音声の声道スペクトルの全極フィルタ表現であるLSPパラメータωi(i=1,2,…,p)が広く用いられている。フィルタが安定であるためのLSPパラメータの必要条件は、LSPパラメータωiが昇順特性、つまり、0<ω12<…<ωpを満たすことである。昇順特性を満たさないLSPパラメータから音声を合成した場合、合成された音声信号が発散する可能性がある。
さて、時刻tにおけるLSPパラメータをωi(t)とし、LSPパラメータの速度を
Figure 0005925082
とした場合、LSPパラメータωi(t)のみから成るベクトルωstatic
Figure 0005925082
からLSPパラメータωi(t)とその速度Δωi(t)から成るベクトルωdynamic
Figure 0005925082
への変換行列Rは、
Figure 0005925082
で定義できる。aは、例えば0.5である。この明細書において、行列・Tの上付きのTは、転置を意味する。行列・Tの上付きのT以外のTは、所定の時刻Tを意味することに注意する。0a×bは、全ての要素が0であるa×bの行列を意味し、Ia×aは、対角要素が1、それ以外の要素が0であるa×aの正方行列を意味する。
LSPパラメータの平均値ω- i(t)とLSPパラメータの速度の平均値Δω- i(t)とから成るベクトルω-、及び、LSPパラメータの分散σωi(t)とLSPパラメータの速度の分散σΔωi(t)とから成る行列σは、以下のように表すことができる。diagは、対角行列を意味する。
Figure 0005925082
ここで、声道スペクトルパラメータ計算部2において計算により推定されるLSPパラメータベクトルω^を以下のように定義する。
Figure 0005925082
すると、声道スペクトルパラメータ計算部2において出力確率を最大にするLSPパラメータを求めるには、以下を最小化すれば良い。
Figure 0005925082
つまり、
Figure 0005925082
を解けばよい(例えば、非特許文献2参照。)。
しかし、上述の計算により求まるLSPパラメータの値はHMMの平均値付近に存在するため、人間が発声したオリジナルのLSPパラメータの値と比較すると、LSPパラメータのダイナミックレンジが狭く、こもった音声に聞こえるという問題がある。そこで、Global Variance (GV)というパラメータを定義し、LSPパラメータのダイナミックレンジを評価することを考える(例えば、非特許文献3参照。)。
ある1つの文章nについてのGVであるνi,nは、その文章nの発声についてのLSPパラメータを用いて、以下のように定義される。Tnは文章nの発話の時間長である。
Figure 0005925082
また、学習データのN個の文章n(n=1, ・・・,N) の発声についてのLSPパラメータを用いて、μ及びUを以下のように定義する。μはνi,n(n=1,・・・,N )の平均であり、Uはνi,n(n=1,・・・,N)の分散である。なお、Nを所定の正の数とする。音素HMM記憶部4には、μ及びUが記憶されているとする。
Figure 0005925082
推定されるGVであるν(ω)を以下のように定義する。
Figure 0005925082
GVの出力確率を最大にするLSPパラメータを求めるには、以下を最小化すればよい。
Figure 0005925082
最終的には、非特許文献2では、声道スペクトルパラメータ計算部2において、式(1)の代わりに、式(1)と式(2)を合わせた評価式である式(3)を最小化するようなLSPパラメータω^を最急降下法などのアルゴリズムを用いて求める。
Figure 0005925082
ここで、1/(2T)は、式(1)と式(2)の値のオーダーを揃えるための重みである。
HMM音声合成では比較的高い次数のLSPパラメータ(例えば、p=40)を用いる必要があることや、GVを導入することにより、上述の方法では、LSPパラメータの昇順特性が必ずしも満たされないという問題がある。そこで、ペナルティ関数を導入する方法が提案されている。つまり、
Figure 0005925082
というペナルティ関数による制約を導入する方法である(例えば、非特許文献4参照。)。ここで、αはあまり大きくない正の値、Mは偶数、ωp+1=πである。ωi-1iの場合にペナルティ関数の値が大きくなることが分かるが、このペナルティ関数では昇順特性を満たすことが保証されず、ペナルティ関数の影響により出力確率の最大化が保証されないという問題がある。
L.R. Rabiner, R.W. Schafer, "Digital processing of speech signals", Prentice Hall, 1978. 徳田, 益子, 小林, 今井, "動的特徴を用いたHMMからの音声パラメータ生成アルゴリズム", 日本音響学会誌, Vol.53, No.3, 192-200, 1997. T. Toda, K. Tokuda, "A speech parameter generation algorithms considering global variance for HMM-based speech synthesis", IEICE Trans. Inf. & Syst., 816-824, 2007. M. Lei, Z.-H. Ling, L.-R. Dai, "Preserve ordering property of generated LSPs for minimum generation error training in HMM-based speech synthesis", Proc. ICASSP, 4712-4715, 2011.
このように、従来の手法では、LSPパラメータの昇順特性を保持することができなかった。
この発明は、LSPパラメータの昇順特性を保持することができる音声合成装置、方法及びプログラムを提供することを目的とする。
この発明の一態様による音声合成装置は、複数の音素の音素HMMを記憶する音素HMM記憶部と、入力されたテキストの各音素に対応する音素HMMを音素HMM記憶部から読み込み、読み込んだ音素HMMを接続することにより、音素HMMの状態の系列を生成する音素HMM状態系列生成部と、pをLSPパラメータの次数とし、ω^i(t)(i=1,2,・・・.p)をLSPパラメータとして、差分LSPパラメータdi(t)をd1(t)=ω^1(t)>0かつdj(t)=ω^j(t)-ω^j-1(t)>0(2≦j≦p)として、音素HMMの状態の系列を構成するLSPパラメータを用いて、差分LSPパラメータd i (t)を乗算型更新式により繰り返し更新することにより計算する差分LSPパラメータ計算部と、計算された差分LSPパラメータd i (t)を用いて、以下の式により定義されるLSPパラメータω^i(t)を計算するLSPパラメータ計算部と、計算されたLSPパラメータω^i(t)に基づいて、入力されたテキストに対応する音声を生成する音声合成部とを、備える。
Figure 0005925082
LSPパラメータの昇順特性を保持することができる。
音声合成装置の例を説明するための図。 音声合成方法の例を説明するための図。 従来の音声合成装置の例を説明するための図。
以下、図面を参照して、音声合成装置及び方法の実施形態を説明する。
音声合成装置は、図1に示すように、音素HMM系列生成部1と、差分LSPパラメータ計算部5と、LSPパラメータ計算部6と、音声合成部3と、音素HMM記憶部4とを備える。この発明の実施形態では、背景技術で説明した声道スペクトルパラメータ計算部2に代わり、差分LSPパラメータ計算部5及びLSPパラメータ計算部6がLSPパラメータを計算する。他の部分は、背景技術と同様である。
音素HMM記憶部4には、複数の音素の音素HMMが記憶されている。また、Nを所定の正の数として、音素HMM記憶部4には、N個の文章n(n=1,・・・,N)の発話についてのLSPパラメータから求められたGV(μ及びU)が記憶されているとする。
音素HMMの各状態は、LSPパラメータの平均値ω- i(t)、LSPパラメータの速度の平均値Δω- i(t)、LSPパラメータの分散σωi(t)及びLSPパラメータの速度の分散σΔωi(t)で表現される。LSPパラメータの平均値ω- i(t)、LSPパラメータの速度の平均値Δω- i(t)、LSPパラメータの分散σωi(t)及びLSPパラメータの速度の分散σΔωi(t)は、事前に計算され、音素HMM記憶部4に記憶されている。
音素HMM系列生成部1は、背景技術で説明した音素HMM系列生成部1と同様の処理を行う。すなわち、音素HMM系列生成部1は、入力されたテキストの各音素に対応する音素HMMを音素HMM記憶部4から読み込み、読み込んだ音素HMMを接続することにより、音素HMMの状態の系列を生成する(ステップS1)。生成された音素HMMの状態の系列は、差分LSPパラメータ計算部5に送信される。
音素HMMの各状態は、LSPパラメータの平均値ω- i(t)、LSPパラメータの速度の平均値Δω- i(t)、LSPパラメータの分散σωi(t)及びLSPパラメータの速度の分散σΔωi(t)で表現されるため、音素HMMの状態の系列も、LSPパラメータの平均値ω- i(t)とLSPパラメータの速度の平均値Δω- i(t)とから成るベクトルω-、及び、LSPパラメータの分散σωi(t)とLSPパラメータの速度の分散σΔωi(t)とから成る行列σで表現される。
差分LSPパラメータ計算部5は、音素HMMの状態の系列を構成するLSPパラメータを用いて、差分LSPパラメータdjを乗算型更新式により繰り返し更新することにより計算する(ステップS2)。計算された差分LSPパラメータdjは、LSPパラメータ計算部6に送信される。
差分LSPパラメータ計算部5は、具体的にはω- i(t),Δω- i(t),σωi(t)Δωi(t),μ,U等のパラメータを用いて、差分LSPパラメータdjを計算する。ここで、ω- i(t),Δω- i(t),σωi(t)Δωi(t),μ,U等のパラメータは、音素HMMの状態の系列を構成するLSPパラメータωi(t)から計算されるパラメータである。したがって、差分LSPパラメータ計算部5は、音素HMMの状態の系列を構成するLSPパラメータを用いて、差分LSPパラメータdjを計算していると言える。
pをLSPパラメータの次数として、差分LSPパラメータdi(t)により定まるLSPパラメータをω^i(t)として、di(t)及びω^i(t)は以下の関係を有する。
Figure 0005925082
差分LSPパラメータ計算部5は、背景技術の欄で説明した式(3)を最小化するdj(t)を計算する。
例えば、式(3)に
Figure 0005925082
を代入した評価式をF(di(t))と定義し、F(di(t))をdi(t)で偏微分した多項式▽F(di(t))の正の項から成る多項式を▽F+(di(t))とし、上記多項式▽F(di(t))の負の項から成る多項式を▽F-(di(t))とする。このとき、djを以下の乗算型更新式により繰り返し更新することにより、djを計算することができる(例えば、参考文献1参照。)。
Figure 0005925082
〔参考文献1〕Virtanen, IEEE Trans. Audio Speech Lang. Process., 15(3), 1066-1074, 2007.
また、背景技術で説明した式(0)のようにLSPパラメータの速度を定義した場合には、式(4)の乗算型更新式は具体的には以下のようになる。
Figure 0005925082
また、背景技術で説明した式(0)の定数aを0.5にした場合には、式(4)の乗算型更新式は、具体的には以下のようになる。
Figure 0005925082
また、LSPパラメータの速度を以下のように定義した場合には、
Figure 0005925082
式(4)の乗算型更新式は具体的には以下のようになる。
Figure 0005925082
また、LSPパラメータの速度を以下のように定義した場合には、
Figure 0005925082
式(4)の乗算型更新式は具体的には以下のようになる。
Figure 0005925082
なお、上述の乗算型更新式では、GVを利用する場合について説明を行ったが、GVを利用しない実施形態に本発明を利用することも可能である。例えば、LSPパラメータの速度を以下のように定義し、
Figure 0005925082
乗算型更新式を具体的には以下のようにする。なお、GVを用いない乗算型更新式を使用する場合には、μやUを予め音素HMM記憶部4に記憶しておかなくてもよい。
Figure 0005925082
上述の乗算型更新式の中のTは、音素HMMの状態の系列の時間長の総和であり、音素HMM状態系列生成部1により計算される。
なお、上述の乗算型更新式において、t≦0又はt>Tの場合にdi(t),Δω- j(t)は定義されないため、t≦0又はt>Tの場合のdi(t),Δω- j(t)を含む項の値を0とする。例えば、最初に具体例として挙げた乗算型更新式の式(5)のAの右辺の第2項においてdl(0)の場合にはこの場合の第2項の値を0とする。また、式(5)のAの右辺の第3項においてdl(T)の場合にはこの場合の第3項の値を0とする。
di(t)の初期値は、例えば非負の乱数とする。di(t)の更新の回数は求める精度、仕様に応じて適宜定められる。一般に、di(t)の更新の回数が多いほど、di(t)の精度が高くなる。例えば、K-1回目の更新後の式(3)の値と、K回目の更新後の式(3)の値との差が所定の閾値(例えば10−7)以下になるまで更新する。
di(t)は非負値に収束することから、0<ω1(t)=di(t)<ω2(t)=di(t)+d2(t)<…<ωp(t)=di(t)+…+dp(t)となる。このように、ωi(t)の代わりにdi(t)を計算し、di(t)からωi(t)を求めることにより、求まったωi(t)は昇順特性を必ず満たし、かつ式(3)の誤差を最小化する。
LSPパラメータ計算部6は、差分LSPパラメータ計算部5が求めたd(t)を用いて、下記式によりLSPパラメータω^i(t)を計算する(ステップS3)。計算されたLSPパラメータω^i(t)は、音声合成部3に送信される。
Figure 0005925082
音声合成部3は、背景技術で説明した音声合成部3と同様の処理を行う。すなわち、音声合成部3は、計算されたLSPパラメータω^i(t)に基づいて、入力されたテキストに対応する音声を生成する(ステップS4)。
具体的には、音声合成部3は、以下の式のように、計算された声道スペクトルパラメータに基づいて、入力された音源信号u(t)(有声音であれば基本周期に応じたパルス列、無声音であれば白色雑音からなる音源信号)を畳み込むことにより音声信号s~(t)を生成する。
Figure 0005925082
なお、以下のパラメータを音素HMM記憶部4に記憶された音素HMMに追加することにより、di(t)<πであることが補償される。これにより、合成された音声信号が発散する可能性が更に低くなる。
Figure 0005925082
なお、音素HMM記憶部4に、LSPパラメータの平均値ω- i(t)、LSPパラメータの速度の平均値Δω- i(t)、LSPパラメータの分散σωi(t)及びLSPパラメータの速度の分散σΔωi(t)ではなく、LSPパラメータωi(t)で表現された音素HMMが記憶されていてもよい。この場合、音素HMM系列生成部1は、音素HMM記憶部4から読み込んだLSPパラメータωi(t)を用いて、LSPパラメータの平均値ω- i(t)、LSPパラメータの速度の平均値Δω- i(t)、LSPパラメータの分散σωi(t)及びLSPパラメータの速度の分散σΔωi(t)を計算して差分LSPパラメータ計算部5に送信する。
なお、μ及びUが音素HMM記憶部4に記憶されていなくてもよい。この場合であって、GVを用いる乗算型更新式を用いる場合には、音素HMM系列生成部1は、N個の文章n(n=1,・・・,N)の発話についてのLSPパラメータからμ及びUを計算して差分LSPパラメータ計算部5に送信する。
上記装置及び方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、上記装置における処理手段をコンピュータによって実現する場合、上記装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、各処理手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
1 音素HMM系列生成部
2 声道スペクトルパラメータ計算部
3 音声合成部
4 音素HMM記憶部
5 差分LSPパラメータ計算部
6 LSPパラメータ計算部

Claims (4)

  1. 複数の音素の音素HMMを記憶する音素HMM記憶部と、
    入力されたテキストの各音素に対応する音素HMMを上記音素HMM記憶部から読み込み、読み込んだ音素HMMを接続することにより、音素HMMの状態の系列を生成する音素HMM状態系列生成部と、
    pをLSPパラメータの次数とし、ω^i(t)(i=1,2,・・・.p)をLSPパラメータとして、差分LSPパラメータdi(t)をd1(t)=ω^1(t)>0かつdj(t)=ω^j(t)-ω^j-1(t)>0(2≦j≦p)として、上記音素HMMの状態の系列を構成するLSPパラメータを用いて、上記差分LSPパラメータd i (t)を乗算型更新式により繰り返し更新することにより計算する差分LSPパラメータ計算部と、
    上記計算された差分LSPパラメータd i (t)を用いて、以下の式により定義されるLSPパラメータω^i(t)を計算するLSPパラメータ計算部と、
    Figure 0005925082

    上記計算されたLSPパラメータω^i(t)に基づいて、上記入力されたテキストに対応する音声を生成する音声合成部と、
    を含む音声合成装置。
  2. 請求項1に記載の音声合成装置において、
    出力確率を最大にするLSPパラメータω^i(t)を求めるための評価式F(di(t))をdi(t)で偏微分した多項式▽F(di(t))の正の項から成る多項式を▽F+(di(t))とし、上記多項式▽F(di(t))の負の項から成る多項式を▽F-(di(t))として、
    上記乗算型更新式は、以下の式である、
    Figure 0005925082

    音声合成装置。
  3. 音素HMM状態系列生成部が、入力されたテキストの各音素に対応する音素HMMを、複数の音素の音素HMMを記憶する音素HMM記憶部から読み込み、読み込んだ音素HMMを接続することにより、音素HMMの状態の系列を生成する音素HMM状態系列生成ステップと、
    差分LSPパラメータ計算部が、pをLSPパラメータの次数とし、ω^i(t)(i=1,2,・・・.p)をLSPパラメータとして、差分LSPパラメータdi(t)をd1(t)=ω^1(t)>0かつdj(t)=ω^j(t)-ω^j-1(t)>0(2≦j≦p)として、上記音素HMMの状態の系列を構成するLSPパラメータを用いて、上記差分LSPパラメータd i (t)を乗算型更新式により繰り返し更新することにより計算する差分LSPパラメータ計算ステップと、
    LSPパラメータ計算部が、上記計算された差分LSPパラメータd i (t)を用いて、以下の式により定義されるLSPパラメータω^i(t)を計算するLSPパラメータ計算ステップと、
    Figure 0005925082

    音声合成部が、上記計算されたLSPパラメータω^i(t)に基づいて、上記入力されたテキストに対応する音声を生成する音声合成ステップと、
    を含む音声合成方法。
  4. 請求項1又は2の音声合成装置の各部としてコンピュータを機能させるためのプログラム。
JP2012176759A 2012-08-09 2012-08-09 音声合成装置、方法及びプログラム Active JP5925082B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012176759A JP5925082B2 (ja) 2012-08-09 2012-08-09 音声合成装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012176759A JP5925082B2 (ja) 2012-08-09 2012-08-09 音声合成装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014035460A JP2014035460A (ja) 2014-02-24
JP5925082B2 true JP5925082B2 (ja) 2016-05-25

Family

ID=50284475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012176759A Active JP5925082B2 (ja) 2012-08-09 2012-08-09 音声合成装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5925082B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106713145A (zh) * 2015-07-28 2017-05-24 中兴通讯股份有限公司 一种实现链路状态报文刷新的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4816201B2 (ja) * 2006-03-30 2011-11-16 カシオ計算機株式会社 音声処理装置及び方法、テキスト音声合成装置、プログラム

Also Published As

Publication number Publication date
JP2014035460A (ja) 2014-02-24

Similar Documents

Publication Publication Date Title
Ko et al. Audio augmentation for speech recognition.
JP4274962B2 (ja) 音声認識システム
Fazel et al. Synthasr: Unlocking synthetic data for speech recognition
JP6614639B2 (ja) 音声認識装置及びコンピュータプログラム
US20080208577A1 (en) Multi-stage speech recognition apparatus and method
JP6392012B2 (ja) 音声合成辞書作成装置、音声合成装置、音声合成辞書作成方法及び音声合成辞書作成プログラム
JP2011180596A (ja) 音声プロセッサ、音声処理方法および音声プロセッサの学習方法
JPH06110493A (ja) 音声モデルの構成方法及び音声認識装置
WO2016042659A1 (ja) 音声合成装置、音声合成方法およびプログラム
US20090171657A1 (en) Hybrid Approach in Voice Conversion
Sak et al. On-the-fly lattice rescoring for real-time automatic speech recognition.
Afify et al. Stereo-based stochastic mapping for robust speech recognition
JP6631883B2 (ja) クロスリンガル音声合成用モデル学習装置、クロスリンガル音声合成用モデル学習方法、プログラム
WO2020136948A1 (ja) 発話リズム変換装置、モデル学習装置、それらの方法、およびプログラム
Kathania et al. Explicit pitch mapping for improved children’s speech recognition
JP5925082B2 (ja) 音声合成装置、方法及びプログラム
JP2017167526A (ja) 統計的パラメトリック音声合成のためのマルチストリームスペクトル表現
Bawa et al. Developing sequentially trained robust Punjabi speech recognition system under matched and mismatched conditions
JP6542823B2 (ja) 音響モデル学習装置、音声合成装置、それらの方法、及びプログラム
JP2013182261A (ja) 適応化装置、音声認識装置、およびそのプログラム
JP2016206442A (ja) 閾値推定装置、音声合成装置、その方法及びプログラム
JP7339151B2 (ja) 音声合成装置、音声合成プログラム及び音声合成方法
JP2008026721A (ja) 音声認識装置、音声認識方法、および音声認識用プログラム
JP2005283646A (ja) 音声認識率推定装置
Miguel et al. Capturing local variability for speaker normalization in speech recognition

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140924

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160419

R150 Certificate of patent or registration of utility model

Ref document number: 5925082

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150