JP5360489B2 - 音素符号変換装置および音声合成装置 - Google Patents
音素符号変換装置および音声合成装置 Download PDFInfo
- Publication number
- JP5360489B2 JP5360489B2 JP2009244698A JP2009244698A JP5360489B2 JP 5360489 B2 JP5360489 B2 JP 5360489B2 JP 2009244698 A JP2009244698 A JP 2009244698A JP 2009244698 A JP2009244698 A JP 2009244698A JP 5360489 B2 JP5360489 B2 JP 5360489B2
- Authority
- JP
- Japan
- Prior art keywords
- code
- phoneme
- syllable
- time
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
以下、本発明の好適な実施形態について図面を参照して詳細に説明する。最初に、本発明における音節と音素の基本概念について説明する。日本語の母音は、2つの特徴的な音声フォルマント成分を含む4つ以上の重音による和音で近似できることが知られている。子音は母音成分に加えて、摩擦音など雑音を表現する和音と母音への経過音を表現する和音の3種の連結された和音が理論上必要であるが、経過音は人間の聴覚上の補間現象(音脈分凝)に委ねれば、最初の雑音と母音の2つの和音に近似できる。そこで、出願人は、日本語の母音は単一の4和音、子音は2連の4和音を基本にして全音素を表現し、これらを時間軸上につなぎ合わせれば音声合成を実現できると考えた。
次に、従来技術を利用した前準備について説明する。前準備として、人間の声を音節単位でデジタル化する。これは、各音節を人間が実際に発声し、これを録音したものをPCM等の手法により行う。このとき、話者はネイティブの日本人男性または女性とし、同一人が71の音節に対してできる限り、ピッチ(音高)と発声区間を揃えて、発声することが望まれる。一般人の話者ではこのように発声を揃えるのは困難であるため、専門のボイストレーニングを受けたアナウンサー・声楽家などに発声してもらうことが望ましい。更に、男性または女性を含む複数の話者により複数のセットの71音節の録音信号を収集することが望ましい。前準備により、日本語71音節の録音信号が得られる。この日本語71音節とは、いわゆる五十音に加え、撥音、濁音、半濁音を含む計71音である。
次に、音節ごとの録音信号から音素符号への変換について説明する。図3は、本発明に係る音素符号変換装置の一実施形態を示す構成図である。記憶手段10は、音節録音データ記憶部11、音節符号記憶部12、音素符号記憶部13を有しており、コンピュータに接続されたハードディスク等の外部記憶装置により実現される。音節符号記憶部11には、上述の前処理により作成された録音信号が音節を特定する音節識別情報と対応付けて記憶されている。音節録音データ記憶部11には、音節と音素の対応関係を示した変換テーブルが記憶されており、符号化された音節符号が音節識別情報と対応付けて記憶される。音節符号記憶部12には、音節と音素の対応関係を示した変換テーブルが記憶されており、符号化された音節符号が音節識別情報と対応付けて記憶される。音素符号記憶部13には、符号化された音素符号が音素符号識別情報と対応付けて記憶される。
x´(j・Q+k)=(1−w)・x(j)+w・x(j+1)
A(n,m)=(1/T(n))・Σi=0,T(n)-1x(i) sin(2πf(n,m)i/fs)
B(n,m)=(1/T(n))・Σi=0,T(n)-1x(i) cos (2πf(n,m)i/fs)
{E(n,m)}2={A(n,m)}2+{B(n,m)}2
x(i)←x(i)−A(nmax,mmax)・sin(2πf(nmax,mmax)i/fs)−B(nmax,mmax)・cos (2πf(nmax,mmax)i/fs)
E(nmax)←E(nmax)+E(nmax,mmax)
S(nmax)←mmax
次に、得られた音素符号を利用した音声の合成について説明する。図15は、本発明に係る音声合成装置の一実施形態を示す構成図である。図15において、音素符号データベース13aは、得られた音素符号を、音素符号識別情報と対応付けて記録したものである。音素符号データベース13aに格納されている音素符号は、上述の音素符号変換装置により変換され、音素符号記憶部13に格納されたものと同じである。したがって、上述の音素符号変換装置は、この音素符号データベース13aを作成するためのものであるとも言える。また、音素符号データベース13aには、各音素符号識別情報と、音節を特定する音節識別情報との対応関係を示した変換テーブルが記録されている。この変換テーブルは、図6に示したものと同じである。合成音声データ記憶手段14は、音素編集処理手段50により合成された合成音声データを記憶するものであり、ハードディスク等の記憶装置により実現される。
11・・・音節録音データ記憶部
12・・・音節符号記憶部
13・・・音素符号記憶部
13a・・・音素符号データベース
14・・・合成音声データ記憶手段
20・・・処理制御手段
21・・・音節波形拡大手段
22・・・符号コード群作成手段
23・・・音節符号作成手段
24・・・音高別エネルギー算出手段
25・・・音高別エネルギー統合手段
26・・・符号変換手段
30・・・符号表示手段
50・・・音素編集処理手段
60・・・音声出力手段
70・・・印刷手段
Claims (15)
- 発声された1つの音節を所定のサンプリング周波数でサンプル数Jの音節波形信号として取得する音節波形取得手段と、
前記音節波形信号を当該サンプリング周波数を維持しながら時間軸上でQ(Qは2以上の整数)倍拡大し、J×Qサンプルの拡大波形信号に変換する音節波形拡大手段と、
前記拡大波形信号に対して所定の周波数解析を行い、発音開始時刻、発音終了時刻、音高、強さのデータを備える複数の符号コードで表現した符号コード群を作成する符号コード群作成手段と、
前記符号コード群を構成する全ての符号コードの音高をQ倍に補正し、全ての符号コードの発音開始時刻と発音終了時刻を1/Q倍に補正し、補正された符号コード群で構成される音節符号を作成する音節符号作成手段と、
前記音節符号を構成する各符号コードについて、各音高ごとに発音開始時刻と発音終了時刻との時間差と符号コードの強さとの積で与えられるエネルギー値の総和であるエネルギー総和値を算出する音高別エネルギー算出手段と、
複数の音節符号間で、各音高ごとに全てのエネルギー総和値を乗算して統合エネルギー値を算出する音高別エネルギー統合手段と、
前記統合エネルギー値が高い上位の音高を所定の個数だけ抽出し、抽出された各音高に対応する符号コードに、所定の強さ、所定の発音開始時刻、所定の発音終了時刻のパラメータを設定し、複数の符号コードで構成される音素符号に変換する符号変換手段と、
を有することを特徴とする音素符号変換装置。 - 請求項1において、
前記音高別エネルギー統合手段は、日本語カナ文字の「ア」に対応する複数個の「カ」「サ」「タ」「ナ」「ハ」「マ」などの複数の子音音節に対応する音節符号間で対応するエネルギー総和値を音高別に乗算して統合エネルギー値を算出し、
前記符号変換手段は、「A」などの共通する母音音素の音素符号に変換することを特徴とする音素符号変換装置。 - 請求項1において、
前記音高別エネルギー統合手段は、日本語カナ文字の「ア」「イ」「ウ」「エ」「オ」からなる5種の母音音節に対応する「カ」「キ」「ク」「ケ」「コ」などの複数の子音音節に対応する音節符号間で対応するエネルギー総和値を音高別に乗算して統合エネルギー値を算出し、
前記符号変換手段は、「K」などの共通する子音音素の音素符号に変換することを特徴とする音素符号変換装置。 - 請求項3において、
前記音高別エネルギー統合手段は、日本語カナ文字の「ア」「イ」「ウ」「エ」「オ」からなる5種の母音音節に対応する「カ」「キ」「ク」「ケ」「コ」などの複数の子音音節に対応する音節符号間で対応するエネルギー総和値を音高別に乗算する際、
あらかじめ、「ア」「イ」「ウ」「エ」「オ」からなる5種の母音音節に対応する音素符号を決定しておき、
各子音音節のエネルギー総和値の中で、各々対応する母音の前記決定された音素符号を構成する全ての音高に対応するエネルギー総和値に所定の1未満の実数値を乗算することにより縮小するようにしていることを特徴とする音素符号変換装置。 - 請求項1から請求項4のいずれかに記載の音素符号変換装置により作成され、日本語カナ文字の各音節を構成する音素に対応して、所定の種類以下の音高を同時にもち、音の強さおよび音の長さが均一の複数の符号コードで成される音素符号を、音素符号を識別する音素符号識別情報と対応付けて記録した音素符号データベースと、
与えられた合成指示データに記載されている音節識別情報をもとに音素符号識別情報に変換し、対応する音素符号を前記音素符号データベースから抽出し、前記音節識別情報に従って、発音の開始および終了を特定する時刻を設定し、母音音素に対応する音素の発音の終了を特定する時刻より所定の無音区間を加えた時刻を後続する音節の発音の開始を特定する時刻として設定することにより合成音声データを生成する音素編集処理手段と、
を有することを特徴とする音声合成装置。 - 請求項5において、
前記音素編集処理手段により生成された合成音声データを音声として出力する音声出力手段をさらに有することを特徴とする音声合成装置。 - 請求項5または請求項6において、
前記音素編集処理手段により生成された合成音声データを五線譜に変換し、印刷する印刷手段をさらに有することを特徴とする音声合成装置。 - 請求項5から請求項7のいずれかにおいて、
前記音素編集処理手段は、前記合成指示データに記載されている音節識別情報が母音音節で、日本語カナ文字の長音であるとき、その音節全体の発音時間を、所定の値だけ増加させることを特徴とする音声合成装置。 - 請求項5から請求項7のいずれかにおいて、
前記音素編集処理手段は、前記合成指示データに記載されている音節識別情報が、日本語カナ文字の促音であるとき、当該促音の直後に配置される音節に対応する第1の音素と同一の音素を、当該第1の音素の直前に配置して、各音素の発音の開始を特定する時刻、発音の終了を特定する時刻を設定することを特徴とする音声合成装置。 - 請求項5から請求項7のいずれかにおいて、
前記音素編集処理手段は、前記合成指示データに記載されている音節識別情報が、日本語カナ文字の「ヤ」「ユ」「ヨ」の拗音であるとき、前記拗音の直前の音節については、第1の音素のみを設定し、当該第1の音素の直後に、前記拗音に対応する「ヤ」「ユ」「ヨ」いずれかの音節に対応する2つの音素を配置して、各音素の発音の開始を特定する時刻、発音の終了を特定する時刻を設定することを特徴とする音声合成装置。 - 請求項5から請求項10のいずれかにおいて、
前記音素編集処理手段が、前記音節識別情報より変換された音素符号識別情報に対応する音素符号を前記音素符号データベースから抽出し、前記音節識別情報に従って、発音の開始および終了を特定する時刻を設定する際、前記無音区間に対して、設定された時間伸縮率を乗算し、前記発音の開始および終了を特定する時刻に対して所定の改変を施すようにしていることを特徴とする音声合成装置。 - 請求項5から請求項11のいずれかにおいて、
前記音素編集処理手段が、前記音節識別情報より変換された音素符号識別情報に対応する音素符号を前記音素符号データベースから抽出し、前記音節識別情報に従って、発音の開始および終了を特定する時刻を設定する際、設定された音高オフセットパラメータに基づいて、前記音素符号データベースに記録されている前記音素符号が母音の場合、当該音素符号を構成する各符号コードの音高に対して、前記音高オフセットパラメータを加算し、前記合成音声データを構成する全ての母音音素に対応する符号コードの音高に対して所定の改変を施すようにしていることを特徴とする音声合成装置。 - 請求項12において、
前記合成指示データには各音節ごとに音節識別情報とともに前記音高オフセットパラメータが定義されており、前記音素編集処理手段が、与えられた音節識別情報より変換された音素符号識別情報に対応する音素符号を前記音素符号データベースから抽出し、前記音節情報に従って、発音の開始および終了を特定する時刻を設定する際、前記各音節ごとに定義された音高オフセットパラメータに基づいて、前記音素符号データベースに記録されている前記音素符号が母音の場合、当該音素符号を構成する各符号コードの音高に対して、前記音高オフセットパラメータを加算し、前記合成音声データを構成する全ての母音音素に対応する符号コードの音高に対して、改変を施すようにしていることを特徴とする音声合成装置。 - 請求項1から請求項4のいずれかに記載の音素符号変換装置としてコンピュータを機能させるためのプログラム。
- 請求項5から請求項13のいずれかに記載の音声合成装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009244698A JP5360489B2 (ja) | 2009-10-23 | 2009-10-23 | 音素符号変換装置および音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009244698A JP5360489B2 (ja) | 2009-10-23 | 2009-10-23 | 音素符号変換装置および音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011090218A JP2011090218A (ja) | 2011-05-06 |
JP5360489B2 true JP5360489B2 (ja) | 2013-12-04 |
Family
ID=44108512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009244698A Expired - Fee Related JP5360489B2 (ja) | 2009-10-23 | 2009-10-23 | 音素符号変換装置および音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5360489B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5983604B2 (ja) * | 2011-05-25 | 2016-08-31 | 日本電気株式会社 | 素片情報生成装置、音声合成装置、音声合成方法および音声合成プログラム |
US9595256B2 (en) | 2012-12-04 | 2017-03-14 | National Institute Of Advanced Industrial Science And Technology | System and method for singing synthesis |
CN111081265B (zh) * | 2019-12-26 | 2023-01-03 | 广州酷狗计算机科技有限公司 | 音高处理方法、装置、设备及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3234589B2 (ja) * | 1990-06-08 | 2001-12-04 | ヤマハ株式会社 | 音声処理装置 |
JP3011997B2 (ja) * | 1990-11-15 | 2000-02-21 | 株式会社リコー | 参照ベクトル更新方法 |
JP2800465B2 (ja) * | 1991-05-27 | 1998-09-21 | ヤマハ株式会社 | 電子楽器 |
JP3776196B2 (ja) * | 1997-03-05 | 2006-05-17 | 大日本印刷株式会社 | 音声信号の符号化方法および音声の記録再生装置 |
JP2002117017A (ja) * | 2000-08-02 | 2002-04-19 | Victor Co Of Japan Ltd | 再帰型離散フーリエ変換装置 |
JP2004294816A (ja) * | 2003-03-27 | 2004-10-21 | Yamaha Corp | 携帯端末装置 |
JP2006139158A (ja) * | 2004-11-15 | 2006-06-01 | Dainippon Printing Co Ltd | 音響信号の合成装置および合成再生装置 |
JP4179268B2 (ja) * | 2004-11-25 | 2008-11-12 | カシオ計算機株式会社 | データ合成装置およびデータ合成処理のプログラム |
-
2009
- 2009-10-23 JP JP2009244698A patent/JP5360489B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011090218A (ja) | 2011-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4207902B2 (ja) | 音声合成装置およびプログラム | |
JPH07146695A (ja) | 歌声合成装置 | |
JP6784022B2 (ja) | 音声合成方法、音声合成制御方法、音声合成装置、音声合成制御装置およびプログラム | |
JP6733644B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
CN111418006B (zh) | 声音合成方法、声音合成装置及记录介质 | |
JP5360489B2 (ja) | 音素符号変換装置および音声合成装置 | |
JP6167503B2 (ja) | 音声合成装置 | |
JP5560769B2 (ja) | 音素符号変換装置および音声合成装置 | |
JP6044284B2 (ja) | 音声合成装置 | |
WO2020217801A1 (ja) | オーディオ情報再生方法および装置、オーディオ情報生成方法および装置、並びにプログラム | |
JP6578544B1 (ja) | 音声処理装置、および音声処理方法 | |
JP2006030609A (ja) | 音声合成データ生成装置、音声合成装置、音声合成データ生成プログラム及び音声合成プログラム | |
JP4349316B2 (ja) | 音声分析及び合成装置、方法、プログラム | |
JP5560888B2 (ja) | 符号化音声データの音高変換装置 | |
JP5471138B2 (ja) | 音素符号変換装置および音声合成装置 | |
JP2022065554A (ja) | 音声合成方法およびプログラム | |
JP4353174B2 (ja) | 音声合成装置 | |
JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
JP3233036B2 (ja) | 歌唱音合成装置 | |
JPH0895588A (ja) | 音声合成装置 | |
JP5481958B2 (ja) | 音素符号変換装置および音声合成装置 | |
JP5481957B2 (ja) | 音声合成装置 | |
JPH1195798A (ja) | 音声合成方法および音声合成装置 | |
JPS5880699A (ja) | 音声合成方式 | |
JP7183556B2 (ja) | 合成音生成装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120808 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130722 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130821 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5360489 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |