JP5802807B2 - 韻律編集装置、方法およびプログラム - Google Patents
韻律編集装置、方法およびプログラム Download PDFInfo
- Publication number
- JP5802807B2 JP5802807B2 JP2014150385A JP2014150385A JP5802807B2 JP 5802807 B2 JP5802807 B2 JP 5802807B2 JP 2014150385 A JP2014150385 A JP 2014150385A JP 2014150385 A JP2014150385 A JP 2014150385A JP 5802807 B2 JP5802807 B2 JP 5802807B2
- Authority
- JP
- Japan
- Prior art keywords
- prosodic
- prosody
- phrase
- pattern
- prosodic pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Description
(第1の実施形態)
第1の実施形態に係る韻律編集装置について図1のブロック図を参照して説明する。
第1の実施形態に係る韻律編集装置100は、音声合成部101、フレーズ選択部102、韻律パターンデータベース103(以下、韻律パターンDB103という)、韻律パターン検索部104、韻律モデルデータベース105(以下、韻律モデルDB105という)、韻律パターン生成部106、韻律パターン正規化部107、韻律パターンマッピング部108、座標選択部109、韻律パターン復元部110、韻律パターン置換部111および表示部112を含む。
音声合成部101は、外部からテキストを受け取り、テキストを音声合成して合成音声を生成し、外部へ出力する。音声合成の方式には、音素の断片を接続する素片接続型音声合成、または隠れマルコフモデルを用いて韻律や声質をモデル化するHMM音声合成などが一般的に知られている。ここでは、合成音声の韻律パターンが取得できればどのような音声合成方式を用いてもよい。韻律パターンとは、フレーズの韻律の型式を示し、フレーズの韻律を表す基本周波数、継続時間長、パワーなどのパラメータの時系列変化を意味する。また、韻律パターンを表すパラメータは、フレーズの音素数以上の要素数を有する。
韻律パターン検索部104は、フレーズ選択部102から選択フレーズおよび属性情報を受け取る。韻律パターン検索部104は、選択フレーズの属性情報と属性情報が一致するフレーズを韻律パターンDB103から検索し、一致したフレーズに対応する1以上の韻律パターンを、韻律パターン集合として得る。
韻律パターン生成部106は、韻律パターン検索部104から選択フレーズおよび韻律パターン集合を受け取る。韻律パターン生成部106は、韻律モデルDB105を用いて選択フレーズに関する韻律パターンを生成し、生成した韻律パターンを韻律パターン集合に追加する。
座標選択部109は、ユーザからの指示に応じて座標を選択し、選択座標を得る。
韻律パターン復元部110は、韻律パターンマッピング部108からマッピング座標を、座標選択部109から選択座標をそれぞれ受け取る。韻律パターン復元部110は、マッピング座標と選択座標とを比較して、選択座標に対応する座標の韻律パターンを復元し、復元韻律パターンを得る。
表示部112は、音声合成部101から韻律パターンを受け取って表示し、韻律パターンマッピング部108からマッピング座標を受け取って表示する。
図2に示すように、韻律パターンDB103には、識別子201(以下、ID201という)、表層表現202、音素列203、モーラ数およびアクセント型204がそれぞれ対応づけられてフレーズの属性情報205として格納され、さらにフレーズに応じた韻律パターンのパターン数206が属性情報205に対応づけられて格納される。
なお、言語が英語の場合は、ID201、表層表現202および音素列203がそれぞれ属性情報205として対応づけられ、韻律パターンのパターン数206が属性情報205に対応づけられる。具体的には、図2の例では、ID201「14」、表層表現202「Please」、音素列203「/p/l/ii/z/」およびパターン数206「7」がそれぞれ対応づけられる。英語の場合は、日本語に特有のモーラ数・アクセント型が存在しないためここでは省略する。
図2に示す1つのID201に対して、対応する韻律パターンごとに、ID201と、PID301、基本周波数302および継続時間長303がパラメータとしてそれぞれ対応づけられて格納される。PID301は、1つのID201に対応する各パターンを識別する識別子を示す。基本周波数302は、音素の音の高さである。ここでは1フレームごとの周波数が要素として格納される。継続時間長303は、音素の発声が継続する時間の長さである。ここでは1つの音素が何フレームにわたり継続するかを示し、音素ごとのフレーム数が要素として格納される。
上述したパターンは、できるだけ多様なパターンを用意することが望ましい。例えば、様々なパラ言語情報、感情、スタイル、話者による韻律パターンを用意できれば、ユーザは多様な韻律パターンから所望のパターンを選択できる。なお、図3の例では、パラメータとして基本周波数および継続時間長を示すが、パラメータとしてさらに、音素が発音されるときの音量を示すパワーも対応づけて格納してもよい。
図4は、フレーズ「いかがですか」の韻律パターンのパラメータである基本周波数、継続時間長およびパワーに基づいて生成されたグラフである。横軸は時間(単位はフレーム)を示し、縦軸は左側が周波数(単位はHz)を、右側がパワー(単位はdB)をそれぞれ示す。なお、時間の単位として秒、周波数の単位としてオクターブなど他の単位を用いてもよい。
基本周波数は、この座標空間の中で各フレームに対して1つの周波数値が対応し、周波数値をつないだ1本の軌跡402として表せる。ここではフレームごとに周波数値を持つと想定するが、音素ごと、母音ごとなど、どのような単位でもよい。これらの周波数値を時系列に沿って順番に並べたデータが図3に示す基本周波数302に格納される要素である。
パワーは、基本周波数の軌跡402と同様に、フレームごとのパワーの値をつないだ1本の軌跡403として表せる。
ステップS501では、韻律パターン検索部104が、ユーザから選択された選択フレーズを受け取る。
ステップS502では、韻律パターン検索部104が、選択フレーズの属性情報と属性情報が一致するフレーズを韻律パターンDB103から検索し、属性情報が一致するフレーズに対応する韻律パターンを韻律パターン集合として得る。検索方法としては、フレーズの属性情報として表層表現を用いて、選択フレーズの表層表現と一致する表層表現を有するフレーズがあるかどうかを検索すればよい。また、属性情報として音素列を用いて、選択フレーズの音素列と一致する音素列を有するフレーズがあるかどうかを検索してもよい。さらに、属性情報としてモーラ数およびアクセント型を用いて、選択フレーズのモーラ数およびアクセント型と一致するモーラ数およびアクセント型を有するフレーズがあるかどうかを検索してもよい。
なお、韻律パターン生成部106が、韻律モデルDB105に格納される統計モデルを用いて選択フレーズの韻律パターンを生成してもよい。韻律モデルDB105に格納される統計モデルを用いることで、選択フレーズが韻律パターンDB103に格納される韻律パターンと属性が一致しないフレーズである場合でも、韻律パターンを生成できる。
ステップS504では、韻律パターンマッピング部108が、正規化された韻律パターン集合の各韻律パターンを、低次元空間にマッピングする。低次元空間へのマッピング処理は、例えば、主成分分析を用いればよい。具体的なマッピング処理については図7および図8を参照して後述する。
ステップS505では、表示部112が、マッピングされた韻律パターン集合のマッピング座標を表示する。
ステップS507では、韻律パターン復元部110が、選択された韻律パターンを復元し、復元韻律パターンを生成する。具体的な復元処理については後述する。
ステップS508では、韻律パターン置換部111が、選択フレーズの韻律パターンを復元韻律パターンで置換する。ここで、単純に置換処理する場合は、フレーズの前後と韻律が滑らかにつながらないため、合成音声が不自然となる可能性がある。その場合は、基本周波数の軌跡を補間するなどの一般的な手法を用いればよい。
ステップS510では、復元韻律パターンがユーザの所望する韻律パターンの合成音声であるかどうかが判定され、ユーザが所望する韻律パターンの合成音声であると判定されれば、処理を終了する。ユーザが所望する合成音声であるという判定は、例えば表示部112に表示される決定ボタンがユーザにより選択されることで判定すればよい。一方、ユーザが所望する韻律パターンの合成音声でないと判定されれば、ステップS506の処理に戻り、表示部112に表示されるマッピング座標からさらに韻律パターンの選択を行なう。以上で、本実施形態に係る韻律編集装置100の動作を終了する。
図6は、図3に示すフレーズ「いかがですか」の4つの韻律パターン(PID=1,2,3,4)を正規化した例を示す。縦軸は基本周波数の平均値をゼロとした場合の正規化値を示し、横軸はフレーム数を示す。ここでは、韻律パターンのフレーム数を200フレームに揃えている、すなわち各韻律パターンの要素数は200個(200次元のデータ)である。
ここでは、主成分分析を用いて韻律パターン集合を低次元空間にマッピングする一例を示す。なお、低次元空間としては、三次元以下の座標空間にマッピングすることが望ましく、本実施形態では二次元座標平面にマッピングする例を示すが、二次元座標平面に限らず、韻律パターンを、パラメータの要素数よりも少ない座標で表示できる座標平面であればよい。
図7に示すように、マッピング処理を行なうに際し、最初に正規化した韻律パターン集合の基本周波数の要素701と継続時間長の要素702とを結合した行列X703を生成する。Xの各行が各韻律パターンの基本周波数と継続時間長とを結合した要素に該当する。このように行列を生成することにより、基本周波数と継続時間長とを同時に編集することができる。
韻律パターン集合の行列X801は、図8に簡略化して示すようにn行p列となる。このn行p列の行列X801に対して、式(1)を用いて行列X801の分散・共分散行列V802を算出する。
図9は、韻律パターンが2次元座標平面にマッピングされた表示例であり、ここでは、韻律パターンのマッピング座標901、902、903がそれぞれ星印で表現される。なお、2次元座標平面の表示範囲は、第1座標軸(−15から25)、第2座標軸(−15から15)として韻律パターンが存在する範囲にクリッピングする。このようにクリッピングすることで、ユーザが二次元座標平面上の任意の点を選択する場合でも、韻律パターンDB103に登録されている韻律パターンと大きく異なる不適切な韻律が生成されない。
韻律パターン復元部110は、ユーザにより図9に示すような二次元座標平面から、座標zが選択されたとすると、式(3)を用いて選択座標zを復元韻律パターンxに復元する。
図10は韻律編集画面を示し、図10(a)は韻律パターンのパラメータグラフ1001を示し、図10(b)は二次元座標平面1002を示す。使用例としては、ユーザが「いかがですか」というフレーズの韻律を編集するため、文字列「いかがですか」を選択すると、韻律編集装置が上述した処理を行ない、パラメータグラフ1001と二次元座標平面1002とを表示部112に表示するといった方法が挙げられる。
パラメータグラフには、フレーズ「いかがですか」の韻律パターンの軌跡1003、1004および1005が示される。韻律パターンの軌跡1003は、二次元座標平面1002上において、カーソルが座標1006の位置にあるときの韻律パターンである。他の韻律パターンの軌跡1004および軌跡1005についても同様に、カーソルが座標1007および座標1008の位置にそれぞれあるときの韻律パターンである。
また、上述したマッピング処理により、二次元座標平面上で類似する韻律パターンは互いに近い距離に存在し、類似していない韻律パターンは離れた距離に存在するようにマッピングされるので、異なる韻律パターンが視覚的に把握しやすくなり、異なる韻律パターンを容易に試すことができる。
本実施形態では、正規化した基本周波数と継続時間長とを結合して1つの行列を生成し、主成分分析を用いて二次元座標平面にマッピングしたが、第1の変形例では、基本周波数と継続時間長とのそれぞれの行列を二次元座標平面にマッピングする点が異なる。
図11(a)は正規化した基本周波数の行列1101および対応する二次元座標平面1102を示し、図11(b)は正規化した継続時間長の行列1103および対応する二次元座標平面1104を示す。
図12に示すように、表示部112には、韻律編集画面1201、基本周波数の二次元座標平面1202、継続時間長の二次元座標平面1203がそれぞれ示される。
本実施形態では、二次元座標平面上に各韻律パターンを点で表示しているが、韻律パターンの数が多くなるほど点の数が増加し、ユーザが視認しにくくなる。そこで第2の変形例では、いくつかの点をクラスタリングして代表となる点を表示させる。これにより、韻律パターンのグループを容易に区別することができる。
韻律パターンマッピング部108が、韻律パターンをクラスタリングすることにより、1以上の韻律パターンをまとめたクラスタを生成する。クラスタリングは、一般的な手法を用いればよいためここでの説明は省略する。代表点はクラスタの中心点(図13では円の中心点)とすればよいが、クラスタの特徴を表す代表点であればどのような設定方法でもよい。なお、ここでは韻律パターンの点とクラスタの代表点とを同時に表示させているが、クラスタの代表点のみ表示させてもよい。
第3の変形例では、韻律パターンDB103に格納される、基本周波数302および継続時間長303に加え、韻律パターンの韻律の特徴を表すラベルを対応づけて格納してもよい。
図14に示すように、韻律パターンDB103は、ID201、PID301、基本周波数302、継続時間長303およびラベル1401をそれぞれ対応づけて格納する。ラベル1401は、例えば、標準、語尾上げ調、怒りなどの分類が挙げられる。
第3の変形例に係るクラスタリング処理後の二次元座標平面における表示例について図15を参照して説明する。
韻律パターンDB103にラベルが格納される場合、韻律パターンマッピング部108は、韻律パターンをクラスタリング処理した後、クラスタ内の韻律パターンに対応づけられたラベルの分類を集計し、最も多い分類をクラスタのラベル1501、1502および1503として表示する。こうすることで、ユーザは実際に合成音声を聞かなくともどのような韻律であるかを認識することができる。
第1の実施形態では、ユーザが選択した座標を式(3)を用いて韻律パターン復元部が韻律パターンを復元する。ただし、主成分分析によって韻律パターンを二次元座標平面にマッピングする処理は非可逆処理であることが多く、二次元座標平面上の座標から韻律パターンDBに格納される韻律パターンを完全に復元できるとは限らない。
第2の実施形態に係る韻律編集装置1600は、音声合成部101、フレーズ選択部102、韻律パターンDB103、韻律パターン検索部104、韻律モデルDB105、韻律パターン生成部106、韻律パターン正規化部107、韻律パターンマッピング部108、座標選択部109、韻律パターン復元部1601、韻律パターン置換部111、表示部112を含む。韻律パターン復元部1601以外は、第1の実施形態に係る韻律編集装置100と同様であるので説明を省略する。
図17は、表示部112に表示される二次元座標平面である。ここで、ユーザが韻律パターンの点が存在しない座標1701を選択したと想定する。
韻律パターン復元部1601は、座標1701から距離が閾値以内の範囲にマッピング座標があるかどうかを判定する。この判定方法は、例えば、座標1701から距離が一定の円1702の内に韻律パターンの点があるかどうかを検索すればよい。図17では、円1702内に韻律パターンの点1703が存在するので、点1703に対応する元の韻律パターンを韻律パターンDB103から取得する。取得した元の韻律パターンを復元韻律パターンとして後段の置換処理に利用する。
本実施形態に係る韻律編集装置のハードウェア構成を示すブロック図を図18に示す。韻律編集装置は、韻律編集処理を実行する韻律編集プログラムなどが格納されているメモリ1801と、メモリ1801内のプログラムに従って韻律編集装置の各部を制御するCPU1802と、韻律編集装置の制御に必要な種々のデータを記憶する外部記憶装置1803と、ユーザからの入力を受け付ける入力装置1804と、韻律編集処理の結果などのユーザインタフェースを表示する表示装置1805と、合成音声などを出力するスピーカと、各部を接続するバス1807を含む。なお、外部記憶装置1803とは有線または無線によるLAN(Local Area Network)などで各部に接続されてもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (16)
- フレーズに関する属性を示す属性情報と、該フレーズの韻律パターンとを対応づけて格納した格納部と、
所定のフレーズと属性情報が一致する前記韻律パターンを前記格納部から検索し、韻律パターン集合として得る検索部と、
前記韻律パターン集合に含まれる韻律パターンを、低次元空間にマッピングし、マッピング座標を生成するマッピング部と、
前記マッピング座標から選択された座標を選択座標として得る選択部と、
前記選択座標に対応する韻律パターンを復元し復元韻律パターンを得る復元部と、
前記所定のフレーズに基づいて生成される合成音声の韻律を前記復元韻律パターンに置換する置換部と、を具備することを特徴とする韻律編集装置。 - 統計モデルを用いて前記所定のフレーズに関する韻律パターンを生成し、生成した韻律パターンを前記韻律パターン集合に追加する生成部をさらに具備する請求項1に記載の韻律編集装置。
- 前記復元韻律パターンに基づいてテキストを音声合成し、合成音声を生成する音声合成部をさらに具備することを特徴とする請求項1または請求項2に記載の韻律編集装置。
- 前記属性情報は、前記フレーズの文字列を示す表層表現を含み、
前記検索部は、前記所定のフレーズの表層表現と前記フレーズの表層表現とが一致するかどうかを検索することを特徴とする請求項1から請求項3のいずれか1項に記載の韻律編集装置。 - 前記属性情報は、前記フレーズの音素の文字列を示す音素列を含み、
前記検索部は、前記所定のフレーズの音素列と前記フレーズの音素列とが一致するかどうかを検索することを特徴とする請求項1から請求項3のいずれか1項に記載の韻律編集装置。 - 前記属性情報は、前記フレーズのモーラ数およびアクセント型を含み、
前記検索部は、前記所定のフレーズのモーラ数およびアクセント型と、前記フレーズのモーラ数およびアクセント型とが一致するかどうかを検索することを特徴とする請求項1から請求項3のいずれか1項に記載の韻律編集装置。 - 前記韻律パターンのパラメータは、音素の基本周波数、音素の継続時間長および音素のパワーを含み、
前記マッピング部は、前記基本周波数、前記継続時間長、および前記パワーのうちの1以上のパラメータについて、独立してマッピングすることを特徴とする請求項1から請求項6のいずれか1項に記載の韻律編集装置。 - 前記韻律パターンは、音素の基本周波数、音素の継続時間長および音素のパワーで表現され、
前記マッピング部は、前記基本周波数、前記継続時間長、および前記パワーのうちの1以上のパラメータを結合してマッピングすることを特徴とする請求項1から請求項6のいずれか1項に記載の韻律編集装置。 - 前記マッピング座標を表示する表示部をさらに具備することを特徴とする請求項1から請求項8のいずれか1項に記載の韻律編集装置。
- 前記マッピング部は、前記マッピング座標間の距離に基づいて該マッピング座標をクラスタリングして、クラスタリングされた複数のマッピング座標の中から代表点を決定し、
前記表示部は、前記代表点を表示すること特徴とする請求項9に記載の韻律編集装置。 - 前記復元部は、前記選択座標とマッピング座標との距離が閾値以内である場合、該マッピング座標をマッピングする前の韻律パターンを復元韻律パターンとして得ることを特徴とする請求項1から請求項10のいずれか1項に記載の韻律編集装置。
- 前記フレーズをテキストから選択するフレーズ選択部をさらに具備することを特徴とする請求項1から請求項11のいずれか1項に記載の韻律編集装置。
- 前記韻律パターン集合に含まれる韻律パターンをそれぞれ正規化する正規化部をさらに具備することを特徴とする請求項1から請求項12のいずれか1項に記載の韻律編集装置。
- 前記低次元空間は、前記韻律パターンが含むフレーズの音素数以上の要素数よりも、少ない数の座標で表現されることを特徴とする請求項1から請求項13のいずれか1項に記載の韻律編集装置。
- フレーズに関する属性を示す属性情報と該フレーズの韻律パターンとの対応づけから、所定のフレーズと属性情報が一致する前記韻律パターンを検索して韻律パターン集合として得、
前記韻律パターン集合に含まれる韻律パターンを、低次元空間にマッピングしてマッピング座標を生成し、
前記マッピング座標から選択された座標を選択座標として得、
前記選択座標に対応する韻律パターンを復元し復元韻律パターンを得、
前記所定のフレーズに基づいて生成される合成音声の韻律を前記復元韻律パターンに置換することを特徴とする韻律編集方法。 - コンピュータを、
フレーズに関する属性を示す属性情報と、該フレーズの韻律パターンとを対応づけて格納した格納手段と、
所定のフレーズと属性情報が一致する前記韻律パターンを前記格納手段から検索し、韻律パターン集合として得る検索手段と、
前記韻律パターン集合に含まれる韻律パターンを、低次元空間にマッピングし、マッピング座標を生成するマッピング手段と、
前記マッピング座標から選択された座標を選択座標として得る選択手段と、
前記選択座標に対応する韻律パターンを復元し復元韻律パターンを得る復元手段と、
前記所定のフレーズに基づいて生成される合成音声の韻律を前記復元韻律パターンに置換する置換手段として機能させるための韻律編集プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014150385A JP5802807B2 (ja) | 2014-07-24 | 2014-07-24 | 韻律編集装置、方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014150385A JP5802807B2 (ja) | 2014-07-24 | 2014-07-24 | 韻律編集装置、方法およびプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012181616A Division JP2014038282A (ja) | 2012-08-20 | 2012-08-20 | 韻律編集装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014219695A JP2014219695A (ja) | 2014-11-20 |
JP5802807B2 true JP5802807B2 (ja) | 2015-11-04 |
Family
ID=51938119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014150385A Active JP5802807B2 (ja) | 2014-07-24 | 2014-07-24 | 韻律編集装置、方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5802807B2 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3616250B2 (ja) * | 1997-05-21 | 2005-02-02 | 日本電信電話株式会社 | 合成音声メッセージ作成方法、その装置及びその方法を記録した記録媒体 |
JP3513071B2 (ja) * | 2000-02-29 | 2004-03-31 | 株式会社東芝 | 音声合成方法及び音声合成装置 |
US20040054534A1 (en) * | 2002-09-13 | 2004-03-18 | Junqua Jean-Claude | Client-server voice customization |
JP2008268477A (ja) * | 2007-04-19 | 2008-11-06 | Hitachi Business Solution Kk | 韻律調整可能な音声合成装置 |
WO2008149547A1 (ja) * | 2007-06-06 | 2008-12-11 | Panasonic Corporation | 声質編集装置および声質編集方法 |
-
2014
- 2014-07-24 JP JP2014150385A patent/JP5802807B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014219695A (ja) | 2014-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2014038282A (ja) | 韻律編集装置、方法およびプログラム | |
US7603278B2 (en) | Segment set creating method and apparatus | |
US10535335B2 (en) | Voice synthesizing device, voice synthesizing method, and computer program product | |
US10217454B2 (en) | Voice synthesizer, voice synthesis method, and computer program product | |
JP6523893B2 (ja) | 学習装置、音声合成装置、学習方法、音声合成方法、学習プログラム及び音声合成プログラム | |
US8046225B2 (en) | Prosody-pattern generating apparatus, speech synthesizing apparatus, and computer program product and method thereof | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
US20140210830A1 (en) | Computer generated head | |
JP6639285B2 (ja) | 声質嗜好学習装置、声質嗜好学習方法及びプログラム | |
JP2015152630A (ja) | 音声合成辞書生成装置、音声合成辞書生成方法およびプログラム | |
JP6669081B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
US10157608B2 (en) | Device for predicting voice conversion model, method of predicting voice conversion model, and computer program product | |
JP6631883B2 (ja) | クロスリンガル音声合成用モデル学習装置、クロスリンガル音声合成用モデル学習方法、プログラム | |
JP2016151736A (ja) | 音声加工装置、及びプログラム | |
JP5726822B2 (ja) | 音声合成装置、方法及びプログラム | |
US10978076B2 (en) | Speaker retrieval device, speaker retrieval method, and computer program product | |
JP6436806B2 (ja) | 音声合成用データ作成方法、及び音声合成用データ作成装置 | |
JP5802807B2 (ja) | 韻律編集装置、方法およびプログラム | |
KR102051235B1 (ko) | 스피치 합성에서 푸어 얼라인먼트를 제거하기 위한 아웃라이어 식별 시스템 및 방법 | |
WO2012032748A1 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP2004117662A (ja) | 音声合成システム | |
JP2004279436A (ja) | 音声合成装置及びコンピュータプログラム | |
JP4034751B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP4282609B2 (ja) | 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム | |
JP2011191634A (ja) | 音声合成装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150210 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150408 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150831 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5802807 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |