JPH04190398A

JPH04190398A - 音声合成方法

Info

Publication number: JPH04190398A
Application number: JP2322170A
Authority: JP
Inventors: Yoshimasa Sawada; 沢田　喜正
Original assignee: Meidensha Corp; Meidensha Electric Manufacturing Co Ltd
Current assignee: Meidensha Corp; Meidensha Electric Manufacturing Co Ltd
Priority date: 1990-11-26
Filing date: 1990-11-26
Publication date: 1992-07-08

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】Ａ、産業上の利用分野この発明は漢字かな混じりのテキストから音声を合成す
る方法に係わり、特に音声のピッチパターンのデータベ
ースを生成する方法に関する。

Ｂ　発明の概要この発明は音声のピッチパターンのデータベースを生成
する方法において、発声単語のピッチを分析したピッチパターンと、音韻環
境別の音韻時間長データとから、音韻境界を決定してピ
ッチパターンデータベースを生成するようにしたことに
より、録音合成に近い音質をもつ規則合成方法を得ることがで
きるようにしたものである。

Ｃ従来の技術規則音声合成は、任意の単語１文章等を漢字かな混じり
のテキストより音声として合成する手法である。

第３図は、−船釣な音声合成装置の概要を示す説明図で
ある。

まず、漢字かな混じりのテキスト入力部１に入力された
テキストを、日本語処理部２により音素記号列に変換す
る。

次に、この音素記号列から、韻律パターン（時間長パタ
ーン・ピッチパターン・エネルギパターン）を生成する
。

すなわち、時間長パターン生成部３により、時間長パタ
ーンデータヘース４を参照し、音声の継続時間を示す時
間長パターンを生成する。

同様に、ピッチパターン生成部５により、ピッチパター
ンデータベース６を参照し、音声の高さを示すピッチパ
ターンを生成する。

また同様に、工不ルキパターン生成部７により、エネル
ギパターンデータベース８を参照し、音声の強さを示す
エネルギパターンを生成する。

このようにして得られた各音韻パターンに基づいて、音
声合成部９により、音声データベースＩＯを参照し、音
声波形を合成する。なお１１は、合成音声を出力する音
声出力部である。

上記のように構成された音声合成装置において、ピッチ
パターンデータベース６を参照してピッチパターン生成
部５で生成される例えば「あおい」という文におけるピ
ッチパターンは第４図に示すように、Ｉモーラにつき４
点のピッチ目標値を与えて合成していた。このため、従
来の音声合成装置では抑揚の単調さや不自然さかあった
。

Ｄ　発明が解決しようとする課題上述した従来の音声合成装置で上記した不具合があるけ
れども、近年装置の音質は進歩し、明瞭性の点では問題
がない程度まで到達しつつある。

しかし、音質では原音をある程度圧縮した、いわゆる録
音合成装置と比較するとやや音質評価か落ちる。

しかし、録音合成は任意の文章を発声させることができ
ないので、多数の文章を発声させるためには、膨大なメ
モリを必要とし、高価になる欠点がある。この欠点の他
に以下のような問題もある。

（イ）ある文章のある単語を別の単語に変更する場合に
その都度録音しなければならず非常に煩雑かつ高価とな
る、。

（ロ）すてに録音しである同し発声者から必ずしも録音
できない。

（ハ）同じ発声者から録音できても抑揚がすでに録音し
である単語や文章と異なる場合がある。

（ニ）上記（ロ）、（ハ）から文章全体の抑揚か不自然
になり、合成音の自然性や明瞭性を低下させる。

この発明は上記の事情に鑑みてなされたもので、録音合
成に近い音質を持つ音声合成方法を提供することを目的
とする。

Ｅ　課題を解決するための手段この発明は漢字かな混じり文のテキスト入力を日本語処
理部で解析して音韻列に変換し、この音韻列に基づいて
時間長パターン、ピッチパターン及びエネルキパターン
を各データ格納部を参照して生成し、生成されたこれら
のパターンに基ついて合成音声を生成する方法において
、発声単語のピッチを分析し、このピッチ分析パターンと
前記時間長パターンデータヘースに格納されている音韻
環境別の音韻時間長データとから音韻境界を決定してピ
ッチパターン生成の際参照されるピッチパターンデータ
ベースを生成するようにしたことを特徴とするものであ
る。

Ｆ　作用発声すべき単語や文章を発声者に発声してもらってその
ピッチを分析する。分析した結果、得られたピッチパタ
ーンと、予め、実音声を分析することにより得られた音
韻環境別の音韻時間長データとを用いて発声単語の音韻
環境から音韻境界を決定する。そして、各音韻を分割し
た時点のピッチを合成時の抑揚パターンとして記憶して
おいて、このパターンを使って合成音を得る。

Ｇ　実施例以下この発明の実施例を図面に基づいて説明する。

第１図において、２１は発声すべき単語あるいは文章の
格納部で、この格納部２１の単語あるいは文章を発声者
に発声してもらい、そのピッチをピッチ分析部２２で分
析する。２３は音韻環境別の音韻時間長データ格納部で
、この格納部２３の音韻時間長データは第３図に示す時
間長パターンデータベース４に予め膨大な実音声を分析
するこ、とにより得たものである。格納部２３のデータ
とピッチ分析部２２で分析された結果による第２図に示
すピッチパターンとを時間長正規化部２４に入力して、
ここで発声単語の音韻環境力ｌら音韻境界を決定する。

そして、各音韻を４分割した時点のピッチを合成時のピ
ッチパターンとしてピッチパターンデータベース６に格
納しておき、これを使って合成音を得る。

上記のようにして得たピッチパターンデータベースを使
用すれば、第２図に示す「あ」、「お≦。

：い＝・等の音韻境界が正しく認識できるとともにピッ
チ目標値の位置も適確になる。従って、合成音は自然な
抑揚となって、録音合成に近い音質になる。

Ｈ発明の効果以上述べたように、この発明によれば、実音声を分析し
て得られた音韻環境別の音韻時間長データと、実音声の
ピッチパターンを分析して得られたピンチパターンとか
ら発声噴語の音韻環境から音韻境界を決定してピッチパ
ターンと合成したことにより、録音合成音に近い音質を
得ることかできる規則音声合成方法が得られる。

【図面の簡単な説明】

第１図はこの発明の一実施例を示す概略構成図、第２図
はこの発明の実施例によるピッチ分析で得られたピッチ
パターン説明図、第３図は従来の規則音声合成装置の概
略構成図、第４図は従来の規則音声合成装置で使用され
るピッチパターン説明図である。２１・・発声すべき単語あるいは文章の格納部、２２・
・ピッチ分析部、２３−音韻時間長データ格納部、２４
・・時間長正規化部。第１図６　ピッチパターンデータ／＼−ス２１　発生ずへき単語あるいは文章の格納部２２　ピッ
チ分析部２３　音韻時ｉＩｌ長ナータ格納部２４　時間長正規化部第３図４　時間長パター／データベ−７，６ピッチバター７データベース８　エネルギパターノデータベース１０　音声データベース１１　音声出力部

Claims

【特許請求の範囲】

（１）漢字かな混じり文のテキスト入力を日本語処理部
で解析して音韻列に変換し、この音韻列に基づいて時間
長パターン、ピッチパターン及びエネルギパターンを各
データベースを参照して生成し、生成されたこれらのパ
ターンに基づいて合成音声を生成する方法において、発声単語のピッチを分析し、このピッチ分析パターンと
前記時間長パターンデータベースに格納されている音韻
環境別の音韻時間長データとから音韻境界を決定してピ
ッチパターン生成の際参照されるピッチパターンデータ
ベースを生成するようにしたことを特徴とする音声合成
方法。