JP4630038B2 - 音声波形データベース構築方法、この方法を実施する装置およびプログラム - Google Patents
音声波形データベース構築方法、この方法を実施する装置およびプログラム Download PDFInfo
- Publication number
- JP4630038B2 JP4630038B2 JP2004315614A JP2004315614A JP4630038B2 JP 4630038 B2 JP4630038 B2 JP 4630038B2 JP 2004315614 A JP2004315614 A JP 2004315614A JP 2004315614 A JP2004315614 A JP 2004315614A JP 4630038 B2 JP4630038 B2 JP 4630038B2
- Authority
- JP
- Japan
- Prior art keywords
- waveform
- voice
- speech
- information
- speech waveform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
この発明は、上述の問題に鑑みてなされたものであり、波形接続型テキスト音声合成において、肉声音声波形に音声パラメータを変更した変更済音声波形をも加えて音声波形データベースを構成することにより、音声合成に要する実行時間、計算量が小さく、かつ高品質な合成音声を生成することができる、先の問題を解消した音声波形データベース構築方法、この方法を実施する装置およびプログラムを提供するものである。
音声波形データベースを構築する肉声音声波形と、肉声音声波形に発声内容とその位置を示す音素ラベル情報、或いはパワー情報、或いは音高情報、或いはピッチマーク情報、その他の音声情報が用意されている段階で、
音声波形データベース中の肉声音声波形全てに対して、音声波形変更部により指定された変更量パラメータに基づいて、音高、或いは長さその他の音声パラメータを信号処理により変更して韻律変更済の音声波形を新たに生成し、
音声波形データベース中の肉声発声に付与されている、発声内容とその位置を示すための音素ラベル情報、或いはパワー情報、或いは音高情報その他の音声情報を、音声情報変更部により、音声波形変更部においてなされた変更量に対応して変更することにより新たな音声情報を生成し、
上述した肉声音声波形およびその音声情報と、韻律変更済の音声波形およびその音声情報を用いて、音声波形データベース生成部により音声波形データベースを構築する構成を採用している。これにより、予め信号処理により多様な韻律バリエーションを持つ音声波形が音声波形データベースに含まれることになり、音声波形データベース中に、合成したいテキストに対応した適切な音高或いは長さ或いはパワーその他の音声パラメータの音声波形が存在する可能性が高くなり、自然なイントネーションを持つ高品質な音声合成をすることができる。
また、音声波形に対する信号処理をデータベース構築の段階で行うので、音質劣化は少ないが計算量を要する信号処理手法を用いることができるところから、合成音声生成処理に要する時間を増大させずに、音質劣化のない自然なイントネーションを持つ高品質な音声合成をすることができる。
1は音声波形データベース構築装置であり、音声波形変更部4と、音声情報変更部5と、変更済音声波形データ6と、変更済音声情報7と、音声波形データベース生成部8とから構成されている。
音声波形データベース構築装置1は、肉声音声波形データ2と、その音素ラベル情報、或いはパワー情報、或いは音高情報、或いはピッチマーク情報その他の肉声音声情報3を入力として、音声波形データベース9を構築する音声波形データベース構築装置である。音声波形データベース構築装置1は、また、周知のハードウエアから構成されるコンピュータ装置とそのCPUを駆動するソフトウエアであるコンピュータプログラムとからなり、音声波形変更部4と、音声情報変更部5と、音声波形データベース生成部8のそれぞれはハードウエアとソフトウエアの内の何れか一方或いは双方によって構成されている。
肉声音声情報3は、肉声音声波形データ2に対応して、発声内容とその時間情報を示す音素ラベル情報、パワー情報、音高情報、ピッチマーク情報、スペクトル情報その他の音声情報を付与したデータであり、これらをハードディスクの如き記憶媒体の記憶領域に格納したものである。
音声情報変更部5は、音声波形変更部4で変更された音声波形データの音高、長さに対応して、肉声音声情報3の情報を変更して、変更済音声情報7を生成する。例えば、音声波形データの音高が変わると、それに対応して、その音高情報、ピッチマーク情報、スペクトル情報を変更する。また、音声波形データの長さが変わると、それに対応して音素ラベルの時間情報、ピッチマーク情報を変更する。変更済音声情報7は、ハードディスクの如き記憶媒体の記憶領域に格納される。
音声波形データ9は、肉声音声波形データ2或いは変更済音声波形データ6の内容である音声波形を格納したもので、ハードディスクの如き記憶媒体の記憶領域に格納したものである。
音声情報インデックス10は、肉声音声情報3或いは変更済音声情報7の内容をインデックスとして保持し、所望の音素情報、音高情報を検索キーとして、音声波形データ9から音声合成に必要な音声波形データを読み出せる構成としたものである。
先ず、(S1)は、音声波形変更部4において、音声波形データベース構築装置1に与えられた変更量パラメータに基づいて、肉声音声波形データ2に格納される全ての肉声音声波形データに対して信号処理を施して音高、長さを変更する。この変更量は、音質劣化が生じない範囲である必要がある。この許容量は信号処理方法にも依存するので、一種類に規定しておくことはできず、信号処理方法に応じて実験値より決定すべきであるが、この実施例は、変更量パラメータは、音高を一律10%上昇するように与えられたものとする。この場合、肉声音声波形データ2に格納された全ての肉声音声波形データに対して、その音高を一律に10%上昇させた音声波形を信号処理により生成する。ここで用いられる信号処理方法としては、例えば、PSOLAに代表される方法がある。PSOLAのような信号処理時にピッチマーク情報が必要となる方式の場合は、肉声音声情報3に格納されたピッチマーク情報を読み出して利用する。変更された音声波形データは変更済音声波形データ6として、一時的に格納される。
そして、音声波形変更部で行う肉声音声波形に対する信号処理において、韻律の変更は音質劣化が生じない範囲内で行われているので、肉声音声波形に対して信号処理を施した音声波形を用いているにも関わらず、音質劣化のない高品質な音声合成をすることができる。
なお、上述した実施例は、以下の如き態様で実施することができる。
例えば、変更量パラメータにおいて指定される変更量は1種類である必要はなく、例えば、音高変更量を5%上昇、10%上昇、5%下降、10%下降、の4種類指定し、変更済音声波形データ6および変更済音声情報7をそれぞれ変更量パラメータに応じて4種類生成し、これらを元にした音声波形データベース11を構築してもよい。また、音高の変更、長さの変更を組み合わせて指定してもよい。これらの場合、或る音素列に対してより多くの音高バリエーション、音長バリエーションが存在するので、音声素片間の音高の繋がりがより滑らかになり、また、音素の継続時間の自然性が向上する可能性が高まるので、合成音声の品質はより向上する。また、この発明は、先のPSOLA以外の他の信号処理方法を使用しても実施することができる。
3 肉声音声情報 4 音声波形変更部
5 音声情報変更部 6 変更済音声波形データ
7 変更済音声情報 8 音声波形データベース生成部
9 音声波形データ 10 音声情報インデックス
11 音声波形データベース
Claims (3)
- 波形接続型テキスト音声合成装置において用いられる音声波形データベースを構築する音声波形データベース構築方法において、
予め用意された肉声音声波形に対して、音声波形の音質劣化が生じない範囲内で指定された変更量パラメータに基づいて、音高、或いは長さ、或いはパワー、その他の音声パラメータを信号処理により変更して、新たに韻律変更済音声波形を生成するステップを実行し、
肉声音声波形に付与されている、発声内容とその位置を示す音素ラベル情報、或いはパワー情報、或いは音高情報、或いはピッチマーク情報、その他の音声情報を、韻律変更済音声波形を生成するステップにおいてなされた変更量に対応して変更することにより新たな音声情報を生成するステップを実行し、
肉声音声波形およびその音声情報に加え、当該肉声音声波形から派生させた1つあるいは複数種類の韻律変更済の音声波形およびその音声情報とを用いて音声波形データベースを生成するステップを実行する、
ことを特徴とする音声波形データベース構築方法。 - 波形接続型テキスト音声合成装置において用いられる音声波形データベースを構築する音声波形データベース構築装置において、
予め用意された肉声音声波形に対して、音声波形の音質劣化が生じない範囲内で指定された変更量パラメータに基づいて、音高、或いは長さ、或いはパワー、その他の音声パラメータを信号処理により変更して、新たに韻律変更済音声波形を生成する音声波形変更部と、
肉声音声波形に付与されている、発声内容とその位置を示す音素ラベル情報、或いはパワー情報、或いは音高情報、或いはピッチマーク情報、を、韻律変更済音声波形の生成においてなされた変更量に対応して変更することにより新たな音声情報を生成する音声情報変更部と、
肉声音声波形およびその音声情報に加え、当該肉声音声波形から派生させた1つあるいは複数種類の韻律変更済の音声波形およびその音声情報とを用いて音声波形データベースを生成する音声波形データベース生成部と、
を有することを特徴とする音声波形データベース構築装置。 - 請求項1に記載されるステップをこの順に実行する指令をコンピュータに対してすることを特徴とする音声波形データベース構築プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004315614A JP4630038B2 (ja) | 2004-10-29 | 2004-10-29 | 音声波形データベース構築方法、この方法を実施する装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004315614A JP4630038B2 (ja) | 2004-10-29 | 2004-10-29 | 音声波形データベース構築方法、この方法を実施する装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006126556A JP2006126556A (ja) | 2006-05-18 |
JP4630038B2 true JP4630038B2 (ja) | 2011-02-09 |
Family
ID=36721368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004315614A Expired - Fee Related JP4630038B2 (ja) | 2004-10-29 | 2004-10-29 | 音声波形データベース構築方法、この方法を実施する装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4630038B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63147200A (ja) * | 1986-12-11 | 1988-06-20 | 富士通株式会社 | 音声パラメ−タ修正方式 |
JPH10301599A (ja) * | 1997-04-30 | 1998-11-13 | Nec Corp | 音声合成装置 |
-
2004
- 2004-10-29 JP JP2004315614A patent/JP4630038B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63147200A (ja) * | 1986-12-11 | 1988-06-20 | 富士通株式会社 | 音声パラメ−タ修正方式 |
JPH10301599A (ja) * | 1997-04-30 | 1998-11-13 | Nec Corp | 音声合成装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006126556A (ja) | 2006-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5293460B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP5471858B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP4130190B2 (ja) | 音声合成システム | |
JP4241762B2 (ja) | 音声合成装置、その方法、及びプログラム | |
JP4516863B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
JP2003295882A (ja) | 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム | |
US8626510B2 (en) | Speech synthesizing device, computer program product, and method | |
JPS62160495A (ja) | 音声合成装置 | |
JP4406440B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP5320363B2 (ja) | 音声編集方法、装置及び音声合成方法 | |
JP6669081B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
US20090281808A1 (en) | Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device | |
JP4639932B2 (ja) | 音声合成装置 | |
JP4287785B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP5268731B2 (ja) | 音声合成装置、方法およびプログラム | |
JP4630038B2 (ja) | 音声波形データベース構築方法、この方法を実施する装置およびプログラム | |
JP5157922B2 (ja) | 音声合成装置、およびプログラム | |
JP5387410B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2005025173A (ja) | 音声データ選択装置、音声データ選択方法及びプログラム | |
JP2005018036A (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP4209811B2 (ja) | 音声選択装置、音声選択方法及びプログラム | |
WO2023182291A1 (ja) | 音声合成装置、音声合成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061219 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101112 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131119 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |