JP5782751B2 - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JP5782751B2 JP5782751B2 JP2011048778A JP2011048778A JP5782751B2 JP 5782751 B2 JP5782751 B2 JP 5782751B2 JP 2011048778 A JP2011048778 A JP 2011048778A JP 2011048778 A JP2011048778 A JP 2011048778A JP 5782751 B2 JP5782751 B2 JP 5782751B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- segment
- value
- range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Stereophonic System (AREA)
- Telephone Function (AREA)
Description
図1は、本発明の第1実施形態に係る音声合成装置100のブロック図である。音声合成装置100は、歌唱音や発話音等の合成対象音を素片接続型の音声合成で生成する音響処理装置であり、図1に示すように、演算処理装置10と記憶装置12と入力装置14と表示装置16と放音装置18とを具備するコンピュータシステムで実現される。
本発明の第2実施形態を以下に説明する。なお、以下に例示する各態様において作用や機能が第1実施形態と同等である要素については、以上の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
本発明の第3実施形態を以下に説明する。第3実施形態の記憶装置12には、相異なる音量で発音された音声素片の波形を示す複数の素片データWが音声素片毎に記憶装置12に格納される。例えば音声素片[#-b]については、音量が相違するN個の素片データW[#-b]_1〜W[#-b]_Nが記憶装置12に記憶される。
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
音声素片の特徴量は以上の例示(継続長D,音高P,制御変数X(音量))に限定されない。例えば、音響の明瞭度が制御変数Xとして指定される構成では、音声素片[#-bh]に指定された明瞭度が高い場合に自身の素片データW[#-bh]_nを選択し、明瞭度が低い場合に他の音声素片[#-b]の素片データW[#-b]_bを選択することが可能である。すなわち、以上の各形態における合成情報Zは、合成対象音の各音声素片Sについて特徴量(例えば継続長D,音高P,制御変数X)を指定する情報として包括される。
以上の各形態では、合成情報Zを基礎情報GBから生成したが、編集画面40に対する利用者からの指示に応じて情報生成部24が合成情報Zを直接に(すなわち基礎情報GBを経ずに)生成する構成も採用され得る。また、合成情報Zが他装置(例えば通信端末や可搬型の記録媒体)から提供される構成や、合成情報Zが記憶装置12に事前に記憶された構成も採用され得る。以上の例示から理解されるように、前述の各形態における情報生成部24は、合成情報Zを取得する手段(取得手段)の例示であり、合成情報Zを取得する方法の如何(基礎情報GBから生成するか直接に合成情報Zを生成するか,音声合成装置100内で生成するか他装置で生成された合成情報Zを取得するか)は本発明において不問である。
前述の各形態では、音声素片の時間軸上の波形を示す素片データWを例示したが、素片データWの形態は任意である。例えば、素片データWが音声素片の周波数スペクトルを示す構成も採用され得る。素片データWの調整等を周波数領域で実行することも可能である。
前述の各形態では、音声素片[#-bh]について自身の素片データW[#-bh]_nと他の音声素片[#-b]の素片データW[#-b]_nとの何れを選択するかを素片選択テーブルTBL(TBLa,TBLb,TBLc)にて指定したが、他の音声素片の素片データWを流用するか否かを、合成情報Zが指定する特徴量(例えば継続長D,音高P,制御変数X)に応じて素片選択部26が判定する構成も採用され得る。例えば図8に示すように、素片選択部26は、音声素片[#-bh]について合成情報Zが指定する特徴量が範囲QA内の数値(第1値)であるか否かを判定し(S1)、判定の結果が肯定であれば、自身の素片データW[#-bh]_nを特徴量に応じて選択する一方(S2)、判定の結果が否定であれば、他の音声素片の素片データW[#-b]_nを特徴量に応じて選択する(S3)。
聴感的に音声素片を弁別可能な特徴量(例えば継続長D,音高P,制御変数X)の範囲QAは音声素片毎に相違する。したがって、自身について用意された素片データWを選択する(すなわち他の音声素片の素片データWを流用しない)特徴量の範囲QAと他の音声素片の素片データWを流用する特徴量の範囲QB(QB1,QB2)とを音声素片毎に相違させた構成も好適である。例えば、聴感的に容易に弁別可能な音声素片については、範囲QAが広い範囲に設定されるとともに範囲QBが狭い範囲に設定される。すなわち、特徴量の広い範囲にわたって自身の素片データWが選択され、素片データWの流用に起因した聴感的な不自然さが低減される。他方、聴感的な弁別が比較的に困難な音声素片については、範囲QAが狭い範囲に設定されるとともに範囲QBが広い範囲に設定される。すなわち、特徴量の広い範囲にわたって他の音声素片の素片データWが流用され、素片データWの個数が削減される。
Claims (6)
- 合成対象音の各音声素片について特徴量を指定する合成情報を取得する取得手段と、
音声素片の波形を示す素片データを複数の音声素片の各々について特徴量の数値毎に含む素片群から、前記合成情報による音声素片の指定毎に素片データを選択する手段であって、前記合成対象音の第1音声素片について、前記合成情報にて前記第1音声素片に指定される特徴量が第1値である場合には、前記第1音声素片の前記第1値に対応する素片データを選択し、前記合成情報にて前記第1音声素片に指定される特徴量が第2値である場合には、前記第1音声素片とは相違する第2音声素片の前記第2値に対応する素片データを選択する素片選択手段と、
前記素片選択手段が選択した素片データを利用して音声信号を合成する音声合成手段と
を具備する音声合成装置。 - 前記素片選択手段は、前記合成情報にて前記第1音声素片に指定される特徴量が、前記第1値を含む第1範囲内にある場合には、前記第1音声素片の素片データを選択し、前記第1音声素片の特徴量が、前記第2値を含み前記第1範囲とは相違する第2範囲内にある場合には前記第2音声素片の素片データを選択する
請求項1の音声合成装置。 - 前記特徴量は、音声素片の継続長であり、
前記第1値が示す継続長は、前記第2値が示す継続長よりも長い
請求項1または請求項2の音声合成装置。 - 前記特徴量は合成対象音の音高を含み、
前記第2値が示す音高は、前記第1値を含む範囲の高域側および低域側の音高である
請求項1または請求項2の音声合成装置。 - 前記特徴量は、音声素片の強度であり、
前記第1値が示す強度は、前記第2値が示す強度よりも大きい
請求項1または請求項2の音声合成装置。 - 前記特徴量は、音声の明瞭度であり、
前記第1値が示す明瞭度は、前記第2値が示す明瞭度よりも高い
請求項1または請求項2の音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011048778A JP5782751B2 (ja) | 2011-03-07 | 2011-03-07 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011048778A JP5782751B2 (ja) | 2011-03-07 | 2011-03-07 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012185356A JP2012185356A (ja) | 2012-09-27 |
JP5782751B2 true JP5782751B2 (ja) | 2015-09-24 |
Family
ID=47015488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011048778A Expired - Fee Related JP5782751B2 (ja) | 2011-03-07 | 2011-03-07 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5782751B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0642158B2 (ja) * | 1983-11-01 | 1994-06-01 | 日本電気株式会社 | 音声合成装置 |
JP2001022375A (ja) * | 1999-07-06 | 2001-01-26 | Matsushita Electric Ind Co Ltd | 音声認識合成装置 |
JP2003066983A (ja) * | 2001-08-30 | 2003-03-05 | Sharp Corp | 音声合成装置および音声合成方法、並びに、プログラム記録媒体 |
JP4586386B2 (ja) * | 2004-03-16 | 2010-11-24 | 株式会社国際電気通信基礎技術研究所 | 素片接続型音声合成装置及び方法 |
JP4762553B2 (ja) * | 2005-01-05 | 2011-08-31 | 三菱電機株式会社 | テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
TWI260582B (en) * | 2005-01-20 | 2006-08-21 | Sunplus Technology Co Ltd | Speech synthesizer with mixed parameter mode and method thereof |
-
2011
- 2011-03-07 JP JP2011048778A patent/JP5782751B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012185356A (ja) | 2012-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6171711B2 (ja) | 音声解析装置および音声解析方法 | |
JP6236765B2 (ja) | 音楽データ編集装置および音楽データ編集方法 | |
JP6024191B2 (ja) | 音声合成装置および音声合成方法 | |
JP6561499B2 (ja) | 音声合成装置および音声合成方法 | |
US9711123B2 (en) | Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program recorded thereon | |
JP2006215204A (ja) | 音声合成装置およびプログラム | |
WO2016152715A1 (ja) | 音制御装置、音制御方法、および音制御プログラム | |
JP2017041213A (ja) | 合成音声編集装置 | |
JP2018077283A (ja) | 音声合成方法 | |
JP5782751B2 (ja) | 音声合成装置 | |
JP5092905B2 (ja) | 歌唱合成装置およびプログラム | |
JP5935545B2 (ja) | 音声合成装置 | |
JP6413220B2 (ja) | 合成情報管理装置 | |
EP2634769B1 (en) | Sound synthesizing apparatus and sound synthesizing method | |
JP6011039B2 (ja) | 音声合成装置および音声合成方法 | |
JP5251381B2 (ja) | 音処理装置およびプログラム | |
JP5552797B2 (ja) | 音声合成装置および音声合成方法 | |
JP6372066B2 (ja) | 合成情報管理装置および音声合成装置 | |
JP2018151548A (ja) | 発音装置及びループ区間設定方法 | |
JP2018077281A (ja) | 音声合成方法 | |
JP2018077280A (ja) | 音声合成方法 | |
JP5782799B2 (ja) | 音声合成装置 | |
JP6497065B2 (ja) | 音声合成用ライブラリ生成装置および音声合成装置 | |
JP6331470B2 (ja) | ブレス音設定装置およびブレス音設定方法 | |
JP5915264B2 (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150115 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150623 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150706 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5782751 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |