JPH04190398A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH04190398A
JPH04190398A JP2322170A JP32217090A JPH04190398A JP H04190398 A JPH04190398 A JP H04190398A JP 2322170 A JP2322170 A JP 2322170A JP 32217090 A JP32217090 A JP 32217090A JP H04190398 A JPH04190398 A JP H04190398A
Authority
JP
Japan
Prior art keywords
pitch
pattern
phoneme
time length
analyzing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2322170A
Other languages
English (en)
Inventor
Yoshimasa Sawada
沢田 喜正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP2322170A priority Critical patent/JPH04190398A/ja
Publication of JPH04190398A publication Critical patent/JPH04190398A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 この発明は漢字かな混じりのテキストから音声を合成す
る方法に係わり、特に音声のピッチパターンのデータベ
ースを生成する方法に関する。
B 発明の概要 この発明は音声のピッチパターンのデータベースを生成
する方法において、 発声単語のピッチを分析したピッチパターンと、音韻環
境別の音韻時間長データとから、音韻境界を決定してピ
ッチパターンデータベースを生成するようにしたことに
より、 録音合成に近い音質をもつ規則合成方法を得ることがで
きるようにしたものである。
C従来の技術 規則音声合成は、任意の単語1文章等を漢字かな混じり
のテキストより音声として合成する手法である。
第3図は、−船釣な音声合成装置の概要を示す説明図で
ある。
まず、漢字かな混じりのテキスト入力部1に入力された
テキストを、日本語処理部2により音素記号列に変換す
る。
次に、この音素記号列から、韻律パターン(時間長パタ
ーン・ピッチパターン・エネルギパターン)を生成する
すなわち、時間長パターン生成部3により、時間長パタ
ーンデータヘース4を参照し、音声の継続時間を示す時
間長パターンを生成する。
同様に、ピッチパターン生成部5により、ピッチパター
ンデータベース6を参照し、音声の高さを示すピッチパ
ターンを生成する。
また同様に、工不ルキパターン生成部7により、エネル
ギパターンデータベース8を参照し、音声の強さを示す
エネルギパターンを生成する。
このようにして得られた各音韻パターンに基づいて、音
声合成部9により、音声データベースIOを参照し、音
声波形を合成する。なお11は、合成音声を出力する音
声出力部である。
上記のように構成された音声合成装置において、ピッチ
パターンデータベース6を参照してピッチパターン生成
部5で生成される例えば「あおい」という文におけるピ
ッチパターンは第4図に示すように、Iモーラにつき4
点のピッチ目標値を与えて合成していた。このため、従
来の音声合成装置では抑揚の単調さや不自然さかあった
D 発明が解決しようとする課題 上述した従来の音声合成装置で上記した不具合があるけ
れども、近年装置の音質は進歩し、明瞭性の点では問題
がない程度まで到達しつつある。
しかし、音質では原音をある程度圧縮した、いわゆる録
音合成装置と比較するとやや音質評価か落ちる。
しかし、録音合成は任意の文章を発声させることができ
ないので、多数の文章を発声させるためには、膨大なメ
モリを必要とし、高価になる欠点がある。この欠点の他
に以下のような問題もある。
(イ)ある文章のある単語を別の単語に変更する場合に
その都度録音しなければならず非常に煩雑かつ高価とな
る、。
(ロ)すてに録音しである同し発声者から必ずしも録音
できない。
(ハ)同じ発声者から録音できても抑揚がすでに録音し
である単語や文章と異なる場合がある。
(ニ)上記(ロ)、(ハ)から文章全体の抑揚か不自然
になり、合成音の自然性や明瞭性を低下させる。
この発明は上記の事情に鑑みてなされたもので、録音合
成に近い音質を持つ音声合成方法を提供することを目的
とする。
E 課題を解決するための手段 この発明は漢字かな混じり文のテキスト入力を日本語処
理部で解析して音韻列に変換し、この音韻列に基づいて
時間長パターン、ピッチパターン及びエネルキパターン
を各データ格納部を参照して生成し、生成されたこれら
のパターンに基ついて合成音声を生成する方法において
、 発声単語のピッチを分析し、このピッチ分析パターンと
前記時間長パターンデータヘースに格納されている音韻
環境別の音韻時間長データとから音韻境界を決定してピ
ッチパターン生成の際参照されるピッチパターンデータ
ベースを生成するようにしたことを特徴とするものであ
る。
F 作用 発声すべき単語や文章を発声者に発声してもらってその
ピッチを分析する。分析した結果、得られたピッチパタ
ーンと、予め、実音声を分析することにより得られた音
韻環境別の音韻時間長データとを用いて発声単語の音韻
環境から音韻境界を決定する。そして、各音韻を分割し
た時点のピッチを合成時の抑揚パターンとして記憶して
おいて、このパターンを使って合成音を得る。
G 実施例 以下この発明の実施例を図面に基づいて説明する。
第1図において、21は発声すべき単語あるいは文章の
格納部で、この格納部21の単語あるいは文章を発声者
に発声してもらい、そのピッチをピッチ分析部22で分
析する。23は音韻環境別の音韻時間長データ格納部で
、この格納部23の音韻時間長データは第3図に示す時
間長パターンデータベース4に予め膨大な実音声を分析
するこ、とにより得たものである。格納部23のデータ
とピッチ分析部22で分析された結果による第2図に示
すピッチパターンとを時間長正規化部24に入力して、
ここで発声単語の音韻環境力lら音韻境界を決定する。
そして、各音韻を4分割した時点のピッチを合成時のピ
ッチパターンとしてピッチパターンデータベース6に格
納しておき、これを使って合成音を得る。
上記のようにして得たピッチパターンデータベースを使
用すれば、第2図に示す「あ」、「お≦。
:い=・等の音韻境界が正しく認識できるとともにピッ
チ目標値の位置も適確になる。従って、合成音は自然な
抑揚となって、録音合成に近い音質になる。
H発明の効果 以上述べたように、この発明によれば、実音声を分析し
て得られた音韻環境別の音韻時間長データと、実音声の
ピッチパターンを分析して得られたピンチパターンとか
ら発声噴語の音韻環境から音韻境界を決定してピッチパ
ターンと合成したことにより、録音合成音に近い音質を
得ることかできる規則音声合成方法が得られる。
【図面の簡単な説明】
第1図はこの発明の一実施例を示す概略構成図、第2図
はこの発明の実施例によるピッチ分析で得られたピッチ
パターン説明図、第3図は従来の規則音声合成装置の概
略構成図、第4図は従来の規則音声合成装置で使用され
るピッチパターン説明図である。 21・・発声すべき単語あるいは文章の格納部、22・
・ピッチ分析部、23−音韻時間長データ格納部、24
・・時間長正規化部。 第1図 6 ピッチパターンデータ/\−ス 21 発生ずへき単語あるいは文章の格納部22 ピッ
チ分析部 23 音韻時iIl長ナータ格納部 24 時間長正規化部 第3図 4 時間長パター/データベ−7, 6ピッチバター7データベース 8 エネルギパターノデータベース 10 音声データベース 11 音声出力部

Claims (1)

    【特許請求の範囲】
  1. (1)漢字かな混じり文のテキスト入力を日本語処理部
    で解析して音韻列に変換し、この音韻列に基づいて時間
    長パターン、ピッチパターン及びエネルギパターンを各
    データベースを参照して生成し、生成されたこれらのパ
    ターンに基づいて合成音声を生成する方法において、 発声単語のピッチを分析し、このピッチ分析パターンと
    前記時間長パターンデータベースに格納されている音韻
    環境別の音韻時間長データとから音韻境界を決定してピ
    ッチパターン生成の際参照されるピッチパターンデータ
    ベースを生成するようにしたことを特徴とする音声合成
    方法。
JP2322170A 1990-11-26 1990-11-26 音声合成方法 Pending JPH04190398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2322170A JPH04190398A (ja) 1990-11-26 1990-11-26 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2322170A JPH04190398A (ja) 1990-11-26 1990-11-26 音声合成方法

Publications (1)

Publication Number Publication Date
JPH04190398A true JPH04190398A (ja) 1992-07-08

Family

ID=18140721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2322170A Pending JPH04190398A (ja) 1990-11-26 1990-11-26 音声合成方法

Country Status (1)

Country Link
JP (1) JPH04190398A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728491A (ja) * 1993-07-12 1995-01-31 Atr Jido Honyaku Denwa Kenkyusho:Kk 韻律境界の自動的ラベリング法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728491A (ja) * 1993-07-12 1995-01-31 Atr Jido Honyaku Denwa Kenkyusho:Kk 韻律境界の自動的ラベリング法

Similar Documents

Publication Publication Date Title
Isewon et al. Design and implementation of text to speech conversion for visually impaired people
US8219398B2 (en) Computerized speech synthesizer for synthesizing speech from text
JP4302788B2 (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
US8886538B2 (en) Systems and methods for text-to-speech synthesis using spoken example
US6173262B1 (en) Text-to-speech system with automatically trained phrasing rules
US8775185B2 (en) Speech samples library for text-to-speech and methods and apparatus for generating and using same
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
JP3085631B2 (ja) 音声合成方法及びシステム
RU61924U1 (ru) Статистическая модель речи
JP3576848B2 (ja) 音声合成法方法、装置、および音声合成プログラムを記録した記録媒体
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JPH0887297A (ja) 音声合成システム
JPH08335096A (ja) テキスト音声合成装置
JP3060276B2 (ja) 音声合成装置
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JPH04190398A (ja) 音声合成方法
Houidhek et al. Evaluation of speech unit modelling for HMM-based speech synthesis for Arabic
Hinterleitner et al. Speech synthesis
Datta et al. Epoch Synchronous Overlap Add (ESOLA)
JP2703253B2 (ja) 音声合成装置
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JPH06138894A (ja) 音声合成装置及び音声合成方法
JPH09198073A (ja) 音声合成装置
JPH01321496A (ja) 音声合成装置
JPH08160990A (ja) 音声合成装置