JP2000075883A - 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 - Google Patents

基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体

Info

Publication number
JP2000075883A
JP2000075883A JP10333212A JP33321298A JP2000075883A JP 2000075883 A JP2000075883 A JP 2000075883A JP 10333212 A JP10333212 A JP 10333212A JP 33321298 A JP33321298 A JP 33321298A JP 2000075883 A JP2000075883 A JP 2000075883A
Authority
JP
Japan
Prior art keywords
fundamental frequency
phoneme
accent
accent phrase
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10333212A
Other languages
English (en)
Other versions
JP3576840B2 (ja
Inventor
Yumiko Kato
弓子 加藤
Takahiro Kamai
孝浩 釜井
Kiyo Hara
紀代 原
Kenji Matsui
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP33321298A priority Critical patent/JP3576840B2/ja
Priority to CNB981269877A priority patent/CN1220173C/zh
Priority to US09/201,298 priority patent/US6424937B1/en
Publication of JP2000075883A publication Critical patent/JP2000075883A/ja
Application granted granted Critical
Publication of JP3576840B2 publication Critical patent/JP3576840B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Auxiliary Devices For Music (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】基本周波数パタンを生成する際に、モーラ内で
の基本周波数の変動を精密に決定できない、あるいはモ
ーラ毎の時間長の違いによる実時間軸上での歪みを生じ
るため、アクセントに代表される韻律が不自然になる。 【解決手段】音素の時間長あるいは母音および母音相当
部の時間長により標準化したアクセント句ごとの基本周
波数パタンのモーラ時間長標準化基本周波数データベー
ス50より基本周波数パタンを設定し、対応する基本周
波数パタンがデータベース50内にない場合は、基本周
波数パタン生成部60が、基本周波数パタンの基準とな
る点の間を補間することにより基本周波数パタンを生成
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声合成に用いる
基本周波数パタン生成方法、基本周波数パタン生成装
置、及びプログラム記録媒体に関するものである。
【0002】
【従来の技術】従来の音声基本周波数パタン生成方法と
しては、特開平5−173590号公報のようにアクセ
ントの型に着目して当該モーラの開始点あるいは当該モ
ーラの母音開始点を基準とし、対数周波数軸上の臨界制
動2次線形系で基本周波数パタンを決定するものがあ
る。一方、特開平5−88690号公報のようにアクセ
ントの型、音韻の種類、語あるいは句のモーラ位置に着
目して各モーラ毎の基本周波数を決定するものもある。
【0003】
【発明が解決しようとする課題】しかし、これらの従来
の手法では、モーラ内での基本周波数の変動を精密に決
定できない、あるいはモーラ毎の時間長の違いによる実
時間軸上での歪みを生じ、アクセントに代表される韻律
が不自然になるという課題を有していた。
【0004】本発明は、上述した従来の音声基本周波数
パタン生成方法の課題を考慮し、従来に比べてより一層
自然性の高い基本周波数パタンを生成出来る基本周波数
パタン生成方法、基本周波数パタン生成装置及びプログ
ラム記録媒体を提供することを目的とする。
【0005】
【課題を解決するための手段】第1の本発明(請求項1
記載の発明に対応)は、アクセント句の基本周波数を生
成する基本周波数パタン生成方法であって、前記アクセ
ント句の第1音韻、前記基本周波数が最大値を示す音
韻、アクセント核の音韻とそのアクセント核の次の音
韻、および末尾の1音韻の内、(1)少なくとも何れか
一つの音韻の基本周波数パタンを前記音韻の時間長によ
って標準化した基本周波数パタンを記憶した、又は、
(2)少なくとも何れか一つの音韻に含まれる音素の基
本周波数パタンを前記音素の時間長によって標準化した
基本周波数パタンを記憶した基本周波数データベースを
参照し、前記基本周波数を生成しようとするアクセント
句の第1音韻、前記アクセント句内において基本周波数
が最大値を示す音韻、前記アクセント句内のアクセント
核の音韻とそのアクセント核の次の音韻、および前記ア
クセント句の末尾の各音韻の内、(3)全部若しくは一
部の音韻毎の基本周波数パタンを、又は(4)前記音韻
に含まれる音素毎の基本周波数パタンを設定し、前記基
本周波数パタンの前記設定の段階において未設定の、前
記音韻間又は前記音素間の基本周波数パタンを、実時間
軸上の関数により補間する基本周波数パタン生成方法で
ある。
【0006】又、第6の本発明(請求項6記載の発明に
対応)は、アクセント句の基本周波数を生成する基本周
波数パタン生成方法であって、前記基本周波数を生成し
ようとするアクセント句の立ち上がり基準点、アクセン
トを生成する立ち下がり基準点、前記アクセント句の末
尾の1音韻の何れかを含む複数音韻の基本周波数パタン
を決定するアクセント句末基準点、および語尾の基本周
波数パタンを生成する語尾基準点の内、全部又は一部の
基準点を、それぞれの音韻に含まれる音素の時間長で標
準化された時間軸上に設定し、前記音韻に含まれる音素
の基本周波数パタンを、その各音素の時間長によって標
準化した基本周波数パタンより抽出した基本周波数のう
ち、アクセント句の立ち上がり基準点、立ち下がり基準
点、アクセント句末基準点、及び語尾基準点の少なくと
も何れか一つの基準点の基本周波数パタンを記憶した基
本周波数データベースを参照し、前記設定された基準点
における基本周波数を、前記基本周波数データベースを
参照することにより設定し、前記基本周波数の設定の段
階において未設定の、前記基準点の間の基本周波数を、
実時間軸上の関数あるいは実時間軸上で表現された基本
周波数パタンにより補間する基本周波数パタン生成方法
である。
【0007】又、第16の本発明(請求項16記載の発
明に対応)は、アクセント句の基本周波数を生成する基
本周波数パタン生成方法であって、前記アクセント句の
第1音韻、前記基本周波数が最大値を示す音韻、アクセ
ント核の音韻とそのアクセント核の次の音韻、および、
末尾の1音韻あるいは末尾から4音韻以下の複数音韻の
内、少なくとも何れか一つの音韻に含まれる母音部に相
当する基本周波数パタンを、その音韻に含まれる母音の
時間長によって標準化した基本周波数パタンを記憶した
基本周波数データベースを参照し、前記基本周波数を生
成しようとするアクセント句の第1音韻、前記アクセン
ト句内において基本周波数が最大値を示す音韻、前記ア
クセント句内のアクセント核の音韻とそのアクセント核
の次の音韻、および前記アクセント句の末尾の各音韻の
内、全部又は一部の音韻において、その音韻に含まれる
母音ごとの基本周波数パタンを設定し、前記基本周波数
パタンの前記設定が行われない、前記音韻間の基本周波
数を、実時間軸上の関数により補間する基本周波数パタ
ン生成方法である。
【0008】又、第24の本発明(請求項24記載の発
明に対応)は、アクセント句の基本周波数を生成する基
本周波数パタン生成方法であって、前記基本周波数を生
成しようとするアクセント句の立ち上がり基準点、アク
セントを生成する立ち下がり基準点、前記アクセント句
の末尾の基本周波数パタンを決定するアクセント句末基
準点、および語尾の基本周波数パタンを生成する語尾基
準点の内、全部又は一部の基準点を、それぞれの音韻に
含まれる音素の時間長で標準化された時間軸上に設定
し、前記音韻に含まれる母音の基本周波数パタンを、そ
の各母音の時間長によって標準化した基本周波数パタン
より抽出した基本周波数のうち、アクセント句の立ち上
がり基準点、立ち下がり基準点、アクセント句末基準
点、及び語尾基準点の少なくとも何れか一つの基準点の
基本周波数パタンを記憶した基本周波数データベースを
参照し、前記設定された基準点における基本周波数を、
前記基本周波数データベースを参照することにより設定
し、前記基本周波数の前記設定が行われない、前記基準
点の間の基本周波数を、実時間軸上の関数あるいは実時
間軸上で表現された基本周波数パタンにより補間する基
本周波数パタン生成方法である。
【0009】又、第41の本発明(請求項41記載の発
明に対応)は、アクセント句の基本周波数を生成する基
本周波数パタン生成方法であって、音韻数、アクセント
位置のいずれか一方または両方によって分類された音韻
に含まれる各音素の時間長によって標準化した基本周波
数パタンを記憶した基本周波数データベースを参照する
ことにより各アクセント句の基本周波数パタンを設定
し、音素の時間長によって標準化された音韻あるいは音
素列ごとの基本周波数と上記基本周波数パタンとの差を
音韻あるいは音素列によって分類して記憶したマイクロ
プロソディデータベースから、基本周波数を生成しよう
とする音素あるいは音韻列に対応する値を得て、その対
応する値を前記設定された基本周波数に加算する、又
は、前記の設定された基本周波数より減算することによ
って前記アクセント句の基本周波数を生成する基本周波
数パタン生成方法である。
【0010】又、第46の本発明(請求項46記載の発
明に対応)は、音韻数とアクセント位置によって分類さ
れた基本周波数パタンを記憶した基本周波数データベー
スを用いてアクセント句の基本周波数パタンを生成する
基本周波数パタン生成方法であって、前記基本周波数パ
タンを生成しようとするアクセント句の音韻数およびア
クセント型に該当する基本周波数パタンが、前記基本周
波数データベース内に記憶されていない場合であって、
しかも、前記の基本周波数を生成しようとするアクセン
ト句のアクセント位置が、前記基本周波数データベース
に記憶されている基本周波数のピークを含む音韻位置の
次の音韻位置と同一またはそれ以前の場合には、(1)
前記の基本周波数を生成しようとするアクセント句のア
クセント位置と同一のアクセント位置を有する、前記基
本周波数データベースに記憶された基本周波数パタンで
あり、且つ前記の基本周波数を生成しようとするアクセ
ント句の音韻数に最も近い音韻数に対応する、前記基本
周波数データベースに記憶された基本周波数パタンを用
い、(2)第1音韻からアクセント核の次の音韻までの
基本周波数パタンを、前記基本周波数データベースに記
憶された基本周波数パタンの第1音韻からアクセント核
の次の音韻までの基本周波数を適用して生成し、(3)
前記アクセント核から2音韻目より予め定められた4以
下の音韻数であるアクセント句末尾の直前の音韻までの
基本周波数を、前記基本周波数データベースに記憶され
た基本周波数パタンの、(a)前記アクセント核から2
音韻目とアクセント句末尾との基本周波数、または
(b)前記アクセント核の次の音韻とアクセント句末尾
との基本周波数、または(c)前記アクセント核から2
音韻目とアクセント句末尾の直前の音韻との基本周波
数、または(d)前記アクセント核の次の音韻とアクセ
ント句末尾の直前の音韻との基本周波数、により補間し
て生成し、(4)前記の基本周波数を生成しようとする
アクセント句の前記アクセント句末尾の基本周波数パタ
ンを前記基本周波数データベースに記憶された基本周波
数パタンのアクセント句末尾の音韻の基本周波数を適用
することで生成する基本周波数パタン生成方法である。
【0011】又、第47の本発明(請求項47記載の発
明に対応)は、音韻数とアクセント位置によって分類さ
れた基本周波数パタンを記憶した基本周波数データベー
スを用いてアクセント句の基本周波数パタンを生成する
基本周波数パタン生成方法であって、前記基本周波数パ
タンを生成しようとするアクセント句の音韻数およびア
クセント型に該当する基本周波数パタンが前記の基本周
波数データベース内に記憶されていない場合であり、し
かも、前記の基本周波数を生成しようとするアクセント
句のアクセント位置が、前記基本周波数データベースに
記憶されている基本周波数のピークを含む音韻位置の次
の音韻位置より後方でかつ前記のあらかじめ定められた
アクセント句末尾以前に位置する場合には、(1)前記
基本周波数データベースに記憶されている基本周波数の
ピークから2音韻目以降で且つアクセント句末尾より前
にアクセント核をもつ基本周波数パタンであり、しかも
前記の基本周波数を生成しようとするアクセント句の音
韻数に最も近い音韻数に対応する、前記基本周波数デー
タベースに記憶された基本周波数パタンを用い、(2)
前記の基本周波数を生成しようとするアクセント句の第
1音韻から前記基本周波数のピークを含む音韻までの基
本周波数パタンを、前記基本周波数データベースに記憶
された基本周波数パタンの第1音韻から前記基本周波数
のピークを含む音韻までの基本周波数を適用して生成
し、(3)前記基本周波数のピークを含む音韻の次の音
韻からアクセント核の直前の音韻までの基本周波数を、
前記基本周波数データベースに記憶された基本周波数パ
タンの、(a)前記基本周波数のピークを含む音韻と、
アクセント核を含む音韻との基本周波数、又は、(b)
前記基本周波数のピークを含む音韻と、アクセント核を
含む音韻の直前の音韻との基本周波数、又は、(c)前
記基本周波数のピークを含む音韻の次の音韻と、アクセ
ント核を含む音韻との基本周波数、又は、(d)前記基
本周波数のピークを含む音韻の次の音韻と、アクセント
核を含む音韻の直前の音韻との基本周波数、により補間
して生成し、(4)前記の基本周波数を生成しようとす
るアクセント句のアクセント核を含む音韻とその直後の
音韻との基本周波数を、前記基本周波数データベースに
記憶された基本周波数パタンのアクセント核を含む音韻
とその直後の音韻との基本周波数を適用して生成し、
(5)前記アクセント核から2音韻目より予め定められ
た4以下の音韻数であるアクセント句末尾の直前の音韻
までの基本周波数を、前記基本周波数データベースに記
憶された基本周波数パタンの、(a)前記アクセント核
から2音韻目と、アクセント句末尾との基本周波数、又
は(b)前記アクセント核の次の音韻とアクセント句末
尾との基本周波数、又は(c)前記アクセント核から2
音韻目と、アクセント句末尾の直前の音韻との基本周波
数、又は(d)前記アクセント核の次の音韻とアクセン
ト句末尾の直前の音韻との基本周波数、により補間して
生成し、(6)前記の基本周波数を生成しようとするア
クセント句の前記アクセント句末尾の基本周波数パタン
を、前記基本周波数データベースに記憶された基本周波
数パタンのアクセント句末尾の音韻の基本周波数を適用
することで生成する基本周波数パタン生成方法である。
【0012】又、第48の本発明(請求項48記載の発
明に対応)は、音韻数とアクセント位置によって分類さ
れた基本周波数パタンを記憶した基本周波数データベー
スを用いてアクセント句の基本周波数パタンを生成する
基本周波数パタン生成方法であって、前記基本周波数パ
タンを生成しようとするアクセント句の音韻数およびア
クセント型に該当する基本周波数パタンが前記の基本周
波数データベース内に記憶されていない場合であり、し
かも前記の基本周波数を生成しようとするアクセント句
のアクセント位置が、前記アクセント句末尾の音韻に含
まれる場合には、(1)前記の基本周波数を生成しよう
とするアクセント句の前記アクセント句末尾内でのアク
セント位置と前記アクセント句末尾内でのアクセント位
置とが、同一の、前記基本周波数データベースに記憶さ
れている基本周波数パタンであり、かつ前記の基本周波
数を生成しようとするアクセント句の音韻数に最も近い
音韻数に対応する、前記基本周波数データベースに記憶
された基本周波数パタンを用い、(2)前記の基本周波
数を生成しようとするアクセント句の第1音韻から前記
基本周波数のピークを含む音韻までの基本周波数パタン
を、前記基本周波数データベースに記憶された基本周波
数パタンの第1音韻から前記基本周波数のピークを含む
音韻までの基本周波数を適用して生成し、(3)前記基
本周波数のピークを含む音韻の次の音韻からアクセント
核の直前の音韻までの基本周波数を、前記基本周波数デ
ータベースに記憶された基本周波数パタンの、(a)前
記基本周波数のピークを含む音韻と、アクセント核を含
む音韻との基本周波数、又は、(b)前記基本周波数の
ピークを含む音韻と、アクセント核を含む音韻の直前の
音韻との基本周波数、又は、(c)前記基本周波数のピ
ークを含む音韻の次の音韻と、アクセント核を含む音韻
との基本周波数、又は、(d)前記基本周波数のピーク
を含む音韻の次の音韻と、アクセント核を含む音韻の直
前の音韻との基本周波数、により補間して生成し、
(4)前記の基本周波数を生成しようとするアクセント
句のアクセント核を含む音韻からアクセント句の最終音
韻までの基本周波数を、前記基本周波数データベースに
記憶された基本周波数パタンのアクセント核を含む音韻
からアクセント句の最終音韻までの基本周波数を適用し
て生成する基本周波数パタン生成方法である。
【0013】又、第49の本発明(請求項49記載の発
明に対応)は、音韻数とアクセント位置によって分類さ
れた基本周波数パタンを記憶した基本周波数データベー
スを用いてアクセント句の基本周波数パタンを生成する
基本周波数パタン生成方法であって、前記基本周波数パ
タンを生成しようとするアクセント句の音韻数およびア
クセント型に該当する基本周波数パタンが前記の基本周
波数データベース内に記憶されていない場合であり、し
かも、前記の基本周波数を生成しようとするアクセント
句のアクセント型が平板型である場合には、(1)前記
平板型アクセントでかつ前記の基本周波数を生成しよう
とするアクセント句の音韻数に最も近い音韻数に対応す
る、前記基本周波数データベースに記憶された基本周波
数パタンを用い、(2)第1音韻から基本周波数のピー
クを含む音韻までの基本周波数パタンを、前記基本周波
数データベースに記憶された基本周波数パタンの第1音
韻から前記基本周波数のピークを含む音韻までの基本周
波数を適用して生成し、(3)前記基本周波数のピーク
を含む音韻の次の音韻から前記のアクセント句末尾また
は最終音韻の直前までの基本周波数を、前記の基本周波
数データベースに記憶された基本周波数パタンの、
(a)基本周波数のピークを含む音韻と、アクセント句
末尾との又は最終音韻との基本周波数、又は(b)基本
周波数のピークを含む音韻と、アクセント句末尾の又は
最終音韻の直前の音韻との基本周波数、又は(c)基本
周波数のピークを含む音韻の次の音韻と、アクセント句
末尾との又は最終音韻との基本周波数、又は(d)基本
周波数のピークを含む音韻の次の音韻と、アクセント句
末尾の又は最終音韻の直前の音韻との基本周波数、によ
り補間して生成し、(4)前記の基本周波数を生成しよ
うとするアクセント句の前記アクセント句末尾または最
終音韻の基本周波数パタンを、前記基本周波数データベ
ースに記憶された基本周波数パタンのアクセント句末尾
の音韻または最終音韻の基本周波数を適用することで生
成する基本周波数パタン生成方法である。
【0014】又、第53の本発明(請求項53記載の発
明に対応)は、アクセント句の基本周波数パタンを、フ
レーズ中における前記アクセント句の位置、および、そ
のアクセント句の位置が文末であるか否かによって分類
して記憶した基本周波数データベースを用いる基本周波
数パタン生成方法である。
【0015】又、第57の本発明(請求項57記載の発
明に対応)は、アクセント句の基本周波数パタンを記憶
した基本周波数データベースを用い、基本周波数パタン
を生成しようとするアクセント句のフレーズ内の位置に
よって前記基本周波数データベースに記憶された基本周
波数パタンの開始点、ピーク、最小値、アクセント核、
アクセントの立ち下がり、アクセント句末尾、終了点、
およびダイナミックレンジのうち1種類あるいは複数種
類の特性を変更するための基本周波数パタンの変形量を
記憶した変形データベースを利用する基本周波数パタン
生成方法である。
【0016】又、第63の本発明(請求項63記載の発
明に対応)は、複数のアクセント句が接続されて構成さ
れるフレーズの基本周波数パタンを生成する場合、前記
アクセント句の基本周波数パタンを記憶した基本周波数
データベースから得られた前記記憶された前記基本周波
数パタンの、開始点、ピーク、アクセント核、アクセン
トの立ち下がり、アクセント句末尾、および終了点の
内、1種類又は複数種類の特性を、前記アクセント句の
前記フレーズ内での位置に基づく所定のルールを用いて
変更する基本周波数パタン生成方法である。
【0017】又、第69の本発明(請求項69記載の発
明に対応)は、複数のアクセント句が接続されて構成さ
れるフレーズの基本周波数パタンを生成する場合、前記
アクセント句の基本周波数パタンを記憶した基本周波数
データベースから得られた前記基本周波数パタンの、開
始点、ピーク、アクセント核、アクセントの立ち下が
り、アクセント句末尾、および終了点の内、1種類又は
複数種類の特性を、前記フレーズの所定位置から、基本
周波数を生成しようとする前記特性を含む音韻の直前ま
での音韻数に基づく所定のルールを用いて変更する基本
周波数パタン生成方法である。
【0018】又、第75の本発明(請求項75記載の発
明に対応)は、アクセント句ごとに基本周波数パタンを
生成する基本周波数パタン生成方法であって、基本周波
数パタンを生成しようとするアクセント句のアクセント
の立ち下がり、アクセント句末尾、および終了点のう
ち、1種類あるいは複数種類の特性を変更することによ
り、前記アクセント句のアクセント句末尾、および終了
点の基本周波数と、前記アクセント句の次のアクセント
句の開始点の基本周波数との差をあらかじめ定められた
閾値以下にする基本周波数パタン生成方法である。
【0019】又、第80の本発明(請求項80記載の発
明に対応)は、上記音韻は、モーラ又は音節である上記
第1,6,16,24,41,46,47,48,49,
53,57,63,69又は第75の本発明の基本周波
数パタン生成方法である。
【0020】又、第81の本発明(請求項81記載の発
明に対応)は、アクセント句の基本周波数を生成する基
本周波数パタン生成装置であって、前記アクセント句の
第1音韻、前記基本周波数が最大値を示す音韻、アクセ
ント核の音韻とそのアクセント核の次の音韻、および末
尾の1音韻の内、(1)少なくとも何れか一つの音韻の
基本周波数パタンを前記音韻の時間長によって標準化し
た基本周波数パタンを記憶した、又は、(2)少なくと
も何れか一つの音韻に含まれる音素の基本周波数パタン
を前記音素の時間長によって標準化した基本周波数パタ
ンを記憶した基本周波数データベースと、前記基本周波
数を生成しようとするアクセント句の第1音韻、前記ア
クセント句内において基本周波数が最大値を示す音韻、
前記アクセント句内のアクセント核の音韻とそのアクセ
ント核の次の音韻、および前記アクセント句の末尾の各
音韻の内、(3)全部若しくは一部の音韻毎の基本周波
数パタンを、又は(4)前記音韻に含まれる音素毎の基
本周波数パタンを、前記基本周波数データベースを参照
して設定し、更に、前記基本周波数パタンの前記設定の
段階において未設定の、前記音韻間又は前記音素間の基
本周波数パタンを、実時間軸上の関数により補間する基
本周波数パタン生成部とを備えた基本周波数パタン生成
装置である。
【0021】又、第82の本発明(請求項82記載の発
明に対応)は、アクセント句の基本周波数を生成する基
本周波数パタン生成装置であって、音韻数、アクセント
位置のいずれか一方または両方によって分類された音韻
に含まれる各音素の時間長によって標準化した基本周波
数パタンを記憶した基本周波数データベースと、音素の
時間長によって標準化された音韻あるいは音素列ごとの
基本周波数と上記基本周波数パタンとの差を音韻あるい
は音素列によって分類して記憶したマイクロプロソディ
データベースと、前記基本周波数データベースを参照す
ることにより各アクセント句の基本周波数パタンを設定
し、前記マイクロプロソディデータベースから、基本周
波数を生成しようとする音素あるいは音韻列に対応する
値を得て、その対応する値を前記設定された基本周波数
に加算する、又は、前記の設定された基本周波数より減
算することによって前記アクセント句の基本周波数を生
成する基本周波数パタン生成部とを備えた基本周波数パ
タン生成装置である。
【0022】又、第83の本発明(請求項83記載の発
明に対応)は、アクセント句の基本周波数パタンを、複
数のアクセント句が接続されて構成されるフレーズ中に
おける前記アクセント句の位置、および、そのアクセン
ト句の位置が文末であるか否かによって分類し、記憶さ
れているアクセント句位置基本周波数データベースと、
フレーズを構成するアクセント句の基本周波数パタン
を、前記アクセント句位置基本周波数データベースを参
照して設定する基本周波数パタン生成部とを備えた基本
周波数パタン生成装置である。
【0023】又、第85の本発明(請求項85記載の発
明に対応)は、上記本発明の基本周波数パタン生成方法
の各ステップの全部又は一部をコンピュータにより実行
させるためのプログラムを記録したプログラム記録媒体
である。
【0024】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図1から図20を用いて説明する。
【0025】(実施の形態1)図1は、本発明の一実施
の形態を示す基本周波数パタン生成装置の機能ブロック
図であり、同図を参照しながら、本実施の形態の構成を
説明する。
【0026】即ち、図1において、10は音声合成の対
象となる文字列を入力する文字列入力部である。20は
文字列入力部10より入力された文字列を解析し合成さ
れるべき音声の音韻情報とアクセントやポーズ等の韻律
情報を出力する文字列解析部である。30は発話速度、
発話中での音韻の位置等の条件ごとに各音韻の時間長を
記憶する音韻時間長データベースであり、40は文字列
解析部20より出力された音韻情報および韻律情報に基
づいて音韻時間長データベース30を参照して各音韻の
時間長を設定する時間長設定部である。50はアクセン
ト句のモーラ数、アクセント型、音韻列等の韻律の決定
要因の条件について、各モーラの時間長で標準化した基
本周波数パタンをモーラ毎に記憶するモーラ時間長標準
化基本周波数データベースであり、60は文字列解析部
20より出力された韻律情報と時間長設定部40で設定
された音韻の時間長に基づいてモーラ時間長標準化基本
周波数データベース50を参照して基本周波数パタンを
生成する基本周波数パタン生成部である。70は基本周
波数パタン生成部より出力された基本周波数パタンに基
づいて声帯振動を生成する声帯振動生成部であり、合成
音声の音源振動を生成する。図2は本発明による基本周
波数パタンの一例である。
【0027】以上のように構成された基本周波数パタン
生成装置について、以下、その動作を述べる。
【0028】まず、文字列入力部10から音声に変換さ
れるべき文字列(図2に示す、「オンセーゴーセー」の
文字列)が入力される。文字列解析部20では入力され
た文字列を解析し、音素列を示す音韻情報を時間長設定
部40へ出力し、文字列をアクセント句に分け、各アク
セント句のモーラ数とアクセント型を示す韻律情報と音
素列を示す音韻情報とを基本周波数パタン生成部60へ
出力する。時間長設定部40は文字列解析部20より入
力された音韻情報に基づき音韻時間長データベース30
を参照して各音素の時間長を設定し、時間長情報を基本
周波数パタン生成部60に出力する。基本周波数パタン
生成部60は文字列解析部20より入力された韻律情報
と音韻情報、時間長設定部40より入力された時間長情
報に基づき、アクセント句毎に基本周波数パタンを生成
する。
【0029】まず、図2中のa)のようにアクセント句
の先頭モーラの基本周波数パタンをモーラ時間長標準化
基本周波数データベース50より取得する。次にアクセ
ント句のモーラ数とアクセント型より基本周波数が最大
値をとるモーラを特定し、図2中のb)のように特定さ
れたモーラの基本周波数パタンをモーラ時間長標準化基
本周波数データベース50より取得する。図2中のc)
およびd)のようにアクセント核とアクセント核の次の
モーラの基本周波数パタンおよびアクセント句の最終モ
ーラの基本周波数パタンをモーラ時間長標準化基本周波
数データベース50より取得する。図2のb)とc)、
c)とd)のように基準となるモーラの間を実時間軸で
線形補間を用いて、図2のe)、f)およびg)の基本
周波数パタンを決定する。声帯振動生成部70は基本周
波数パタン生成部60より出力された基本周波数パタン
に従って合成音の声帯振動を生成する。
【0030】音声の自然性に大きく影響する、アクセン
ト句の立ち上がりとアクセント核での立ち下がりのタイ
ミングと角度を当該モーラの時間長で標準化した基本周
波数パタンを当てはめることにより、モーラ内での基本
周波数の変動を詳細に再現し、高い自然性を実現すると
ともに、聞こえに大きく影響しない部分については実時
間軸上で補間を行うことにより、モーラ単位で制御する
際の不連続感をなくし、基本周波数パタンデータベース
もより小さくすることができる。
【0031】(実施の形態2)図4は本発明の一実施の
形態を示す装置の機能ブロック図であり、モーラ時間長
標準化基本周波数データベース50がアクセント句のモ
ーラ数、アクセント型、音韻列等の韻律の決定要因の条
件について、各モーラの母音部の時間長を4等分し、各
区間の基本周波数の代表値を区間の中央点の値として記
憶する母音時間長標準化基本周波数データベース150
aに置き換わった以外は図1と同様である。
【0032】図3は本発明による基本周波数パタンの一
例である。以下その動作を述べる。まず、文字列入力部
10から音声に変換されるべき文字列が入力される。文
字列解析部20では入力された文字列を解析し、音素列
を示す音韻情報を時間長設定部40へ出力し、文字列を
アクセント句に分け、各アクセント句のモーラ数とアク
セント型を示す韻律情報と音素列を示す音韻情報とを基
本周波数パタン生成部60へ出力する。時間長設定部4
0は文字列解析部20より入力された音韻情報に基づき
音韻時間長データベース30を参照して各音素の時間長
を設定し、時間長情報を基本周波数パタン生成部60に
出力する。基本周波数パタン生成部60は文字列解析部
20より入力された韻律情報と音韻情報、時間長設定部
40より入力された時間長情報に基づき、アクセント句
毎に基本周波数パタンを生成する。
【0033】まず、アクセント句のモーラ数とアクセン
ト型および音韻列等により、母音時間長標準化基本周波
数データベース150aより基本周波数が最大値をとる
モーラの母音相当部を4等分した3番目の区間中央の
a)立ち上がり基準点、アクセント核に当たるモーラの
母音相当部を4等分した3番目の区間中央のb)立ち下
がり基準点、アクセント核の次のモーラの母音相当部を
4等分した3番目の区間中央のc)立ち下がり基準点、
アクセント句の最終モーラの母音相当部を4等分した2
番目の区間中央のd)アクセント句末基準点、および最
終モーラの母音相当部を4等分した3番目の区間中央の
e)語尾基準点を取得する。
【0034】次に各基準点を対応するモーラの母音時間
長に対する相対位置に設定する。a)立ち上がり基準点
が最大値となるようアクセント句の先頭からa)立ち上
がり基準点までを実時間軸上で対数周波数軸に対する臨
界制動2次線形系を用いて補間する。a)からd)の各
基準点の間を各区間ごとに2点間を実時間軸上で対数周
波数軸に対する臨界制動2次線形系を用いて補間する。
さらにアクセント句の終了が発話の終了である場合に
は、d)アクセント句末基準点とe)語尾基準点との間
を実時間軸上の関数である語尾関数により補間する。声
帯振動生成部70は基本周波数パタン生成部60より出
力された基本周波数パタンに従って合成音の声帯振動を
生成する。
【0035】音声の自然性に大きく影響する、アクセン
ト句の立ち上がりとアクセント核での立ち下がりのタイ
ミングを当該モーラの母音長で標準化した時間軸上で設
定することにより、モーラ内での基本周波数の変動のタ
イミングを詳細に再現し、立ち上がり、立ち下がりの角
度については実時間軸上の関数を用いることによって、
音韻による時間長の差に影響されることなく立ち上が
り、立ち下がりの安定したなめらかな基本周波数のパタ
ンを得ることができ、高い自然性を実現する。さらに聞
こえに大きく影響しない部分については実時間軸上で補
間を行うことにより、モーラ単位で制御する際の不連続
感をなくし、基本周波数パタンデータベースもより小さ
くすることができる。
【0036】(実施の形態3)本発明の一実施の形態を
示す装置の機能ブロック図は、上記実施の形態2のデー
タベース150aが、モーラ時間長標準化基本周波数デ
ータベース50がアクセント句のモーラ数、アクセント
型、音韻列等の韻律の決定要因の条件について、各モー
ラの母音部の時間長で標準化したモーラ毎の母音部の基
本周波数パタンとアクセント句の先頭基本周波数を記憶
する母音時間長標準化基本周波数データベース150b
に置き換わった以外は図4と同様であるので、図示を省
略する。
【0037】図5は本発明による基本周波数パタンの一
例である。
【0038】以上のように構成された基本周波数パタン
生成装置について、以下、その動作を述べる。
【0039】まず、文字列入力部10から音声に変換さ
れるべき文字列(図5に示す、「oNse−go−se
−」の文字列)が入力される。文字列解析部20では入
力された文字列を解析し、音素列を示す音韻情報を時間
長設定部40へ出力し、文字列をアクセント句に分け、
各アクセント句のモーラ数とアクセント型を示す韻律情
報と音素列を示す音韻情報とを基本周波数パタン生成部
60へ出力する。時間長設定部40は文字列解析部20
より入力された音韻情報に基づき音韻時間長データベー
ス30を参照して各モーラの母音時間長または単母音音
節、撥音あるいは長音における母音相当部の時間長を設
定し、時間長情報を基本周波数パタン生成部60に出力
する。基本周波数パタン生成部60は文字列解析部20
より入力された韻律情報と音韻情報、時間長設定部40
より入力された時間長情報に基づき、アクセント句毎に
基本周波数パタンを生成する。
【0040】まず、図5中のAのようにアクセント句の
先頭基本周波数を母音時間長標準化基本周波数データベ
ース150bより取得する。次に図5中のa)のように
アクセント句の先頭モーラの母音部の基本周波数パタン
を母音時間長標準化基本周波数データベース150bよ
り取得する。本例では第1モーラは単母音音節であるの
で図5中のa)のように当該モーラの時間長の後半部に
対して母音時間長標準化基本周波数データベース150
bより取得した基本周波数パタンを適用する。b)、c),
d),e),f),g),h)についても同様に当該モーラの母
音部の基本周波数パタンを母音時間長標準化基本周波数
データベース150bより取得する。撥音であるb)、長
音であるd),f),h)についてもa)と同様に当該モー
ラの時間長の後半部にたいして母音時間長標準化基本周
波数データベース150bより取得した基本周波数パタ
ンを適用する。次に単母音音節、撥音、長音の前半部あ
るいは有声子音のa')、b')、d')、e'),f')、h')の基
本周波数を前後の基本周波数により、実時間軸で線形補
間を用いて生成する。声帯振動生成部70は基本周波数
パタン生成部60より出力された基本周波数パタンに従
って合成音の声帯振動を生成する。
【0041】音声の自然性に大きく影響する、アクセン
ト句の立ち上がりとアクセント核での立ち下がりのタイ
ミングと角度を当該モーラの母音長で標準化した基本周
波数パタンを当てはめることにより、モーラ内での基本
周波数の変動を詳細に再現し、高い自然性を実現すると
ともに、聞こえに大きく影響しない部分については実時
間軸上で補間を行うことにより、モーラ単位で制御する
際の不連続感をなくし、基本周波数パタンデータベース
もより小さくすることができる。
【0042】(実施の形態4)実施の形態4においては
母音時間長標準化基本周波数データベース150aはア
クセント句のモーラ数、アクセント型、音韻列等の韻律
の決定要因の条件について、A)先頭基本周波数、B)
立ち上がり基準点、C)立ち下がり基準点(アクセント
核)、D)立ち下がり基準点(アクセント核の直後)、
E)アクセント句末基準点、およびF)語尾基準点を、
各基準点を含むモーラの母音時間長に対する相対位置で
記憶する母音時間長標準化基本周波数データベースであ
る。これ以外は装置の構成については図4と同様であ
る。図6は本発明による基本周波数パタンの一例であ
る。以下その動作を述べる。まず、文字列入力部10か
ら音声に変換されるべき文字列が入力される。文字列解
析部20では入力された文字列を解析し、音素列を示す
音韻情報を時間長設定部40へ出力し、文字列をアクセ
ント句に分け、各アクセント句のモーラ数とアクセント
型を示す韻律情報と音素列を示す音韻情報とを基本周波
数パタン生成部60へ出力する。時間長設定部40は文
字列解析部20より入力された音韻情報に基づき音韻時
間長データベース30を参照して各音素の時間長を設定
し、時間長情報を基本周波数パタン生成部60に出力す
る。基本周波数パタン生成部60は文字列解析部20よ
り入力された韻律情報と音韻情報、時間長設定部40よ
り入力された時間長情報に基づき、アクセント句毎に基
本周波数パタンを生成する。まず、アクセント句のモー
ラ数とアクセント型および音韻列等により、母音時間長
標準化基本周波数データベース150aよりA)から
F)の基準点を取得する。次に各基準点を対応するモー
ラの母音長に対する相対位置に設定する。A)先頭基本
周波数からB)立ち上がり基準点までの間を実時間軸上
の関数を用いて生成する。さらにB)以降の各基準点の
間の基本周波数パタンを実時間軸上の直線で補間するこ
とにより生成する。
【0043】声帯振動生成部70は基本周波数パタン生
成部60より出力された基本周波数パタンに従って合成
音の声帯振動を生成する。
【0044】音声の自然性に大きく影響する、アクセン
ト句の立ち上がりとアクセント核での立ち下がりのタイ
ミングを当該モーラの母音長で標準化した時間軸上で設
定することにより、モーラ内での基本周波数の変動のタ
イミングを詳細に再現し、立ち上がり、立ち下がりの角
度については実時間軸上の関数を用いることによって、
音韻による時間長の差に影響されることなく立ち上が
り、立ち下がりの安定したなめらかな基本周波数のパタ
ンを得ることができ、高い自然性を実現する。さらに聞
こえに大きく影響しない部分については実時間軸上で補
間を行うことにより、モーラ単位で制御する際の不連続
感をなくし、基本周波数パタンデータベースもより小さ
くすることができる。
【0045】(実施の形態5)図7は本発明の一実施の
形態を示す装置の機能ブロック図であり、母音時間長標
準化基本周波数データベース150aがアクセント句の
モーラ数、アクセント型の条件についてa)立ち上がり
基準点、b)立ち下がり基準点(アクセント核)、c)
立ち下がり基準点(アクセント核の直後)、d)アクセ
ント句末基準点、およびe)語尾基準点を、各基準点を
含むモーラの母音あるいは母音相当部の時間長に対する
相対位置で記憶し、音韻あるいは音素列による基本周波
数の微細な変動を母音時間長標準化基本周波数データベ
ース150aに記憶された各基準点および基準点の間を
補間した値との差を音素の時間長で標準化して記憶する
マイクロプロソディデータベース250がつけ加わった
以外は図4と同様である。
【0046】図8はマイクロプロソディデータベース2
50に記憶されているマイクロプロソディ成分の模式図
であり、図9(A)〜(C)は本発明による基本周波数
パタンの一例である。
【0047】以上のように構成された基本周波数パタン
生成装置について、以下、その動作を述べる。
【0048】まず、文字列入力部10から音声に変換さ
れるべき文字列が入力される。文字列解析部20では入
力された文字列を解析し、音素列を示す音韻情報を時間
長設定部40へ出力し、文字列をアクセント句に分け、
各アクセント句のモーラ数とアクセント型を示す韻律情
報と音素列を示す音韻情報とを基本周波数パタン生成部
60へ出力する。時間長設定部40は文字列解析部20
より入力された音韻情報に基づき音韻時間長データベー
ス30を参照して各モーラの音素ごとの時間長を設定
し、時間長情報を基本周波数パタン生成部60に出力す
る。基本周波数パタン生成部60は文字列解析部20よ
り入力された韻律情報と音韻情報、時間長設定部40よ
り入力された時間長情報に基づき、アクセント句毎に基
本周波数パタンを生成する。まず、アクセント句のモー
ラ数とアクセント型により、母音時間長標準化基本周波
数データベースより、基本周波数が最大値をとるモーラ
の母音相当部を4等分した3番目の区間中央のa)立ち
上がり基準点、アクセント核に当たるモーラの母音相当
部を4等分した3番目の区間中央のb)立ち下がり基準
点、アクセント核の次のモーラの母音相当部を4等分し
た3番目の区間中央のc)立ち下がり基準点、アクセン
ト句の最終モーラの母音相当部を4等分した2番目の区
間中央のd)アクセント句末基準点、および最終モーラ
の母音相当部を4等分した3番目の区間中央のe)語尾
基準点を取得する。
【0049】次に各基準点を対応するモーラの音素時間
長に対する相対位置に設定する。a)立ち上がり基準点
が最大値となるようアクセント句の先頭からa)立ち上
がり基準点までを実時間軸上でかつ対数周波数軸に対す
る臨界制動2次線形系で補間する。a)からe)の各基
準点の間を各区間ごとに2点間を実時間軸上でかつ対数
周波数軸に対する臨界制動2次線形系で補間し、図9
(A)のような基本周波数パタンを生成する。次にマイ
クロプロソディデータベース250より各音素に対応す
る基本周波数の微細な変動を取得し、各音素の時間長に
合わせて伸長圧縮し、図9(B)のように適用する。図
9(A)の基本周波数パタンに、同図(B)の微細な変
動を加え、同図(C)のような基本周波数パタンを生成
する。声帯振動生成部70は基本周波数パタン生成部6
0より出力された基本周波数パタンに従って合成音の声
帯振動を生成する。
【0050】アクセント句の立ち上がりとアクセント核
での立ち下がりのタイミングを当該モーラの音素の時間
長で標準化した軸上で設定することによりモーラ内での
基本周波数の変動のタイミングを詳細に再現し、さらに
音声の自然性と明瞭性に影響する、基本周波数の微細な
変動を加えることにより高い自然性と明瞭性を実現す
る。
【0051】(実施の形態6)図10は本発明の一実施
の形態を示す装置の機能ブロック図であり、モーラ時間
長標準化基本周波数データベース50がアクセント句の
モーラ数、アクセント型の条件について基本周波数パタ
ンのピークである第iモーラのa)立ち上がり基準点、
b)立ち下がり基準点(アクセント核)、c)立ち下が
り基準点(アクセント核の直後)、アクセント句末尾の
kモーラのd)アクセント句末基準点を、各基準点を含
むモーラの音素の時間長に対する相対位置で記憶する音
素時間長標準化基本周波数データベース351に入れか
わり、基本周波数を生成しようとするアクセント句のフ
レーズ内での位置ごとにアクセント句のピークと末尾の
基本周波数の変形量を記憶した基本周波数パタン変形デ
ータベース350がつけ加わった以外は図1と同様であ
る。
【0052】図11、図12、図13および図14は音
素時間長標準化基本周波数データベース351に基本周
波数生成しようとするアクセント句のモーラ数およびア
クセント型に対応する基本周波数パタンのデータがない
場合に生成する基本周波数パタンの模式図である。図1
5は複数のアクセント句の基本周波数パタンを接続して
生成した文の基本周波数パタンの模式図である。以下そ
の動作を述べる。
【0053】まず、文字列入力部10から音声に変換さ
れるべき文字列が入力される。文字列解析部20では入
力された文字列を解析し、音素列を示す音韻情報を時間
長設定部40へ出力し、文字列をアクセント句に分け、
各アクセント句のモーラ数とアクセント型を示す韻律情
報と音素列を示す音韻情報とを基本周波数パタン生成部
60へ出力する。時間長設定部40は文字列解析部20
より入力された音韻情報に基づき音韻時間長データベー
ス30を参照して各音素の時間長を設定し、時間長情報
を基本周波数パタン生成部60に出力する。基本周波数
パタン生成部60は文字列解析部20より入力された韻
律情報と音韻情報、時間長設定部40より入力された時
間長情報に基づき、アクセント句毎に基本周波数パタン
を生成する。
【0054】まず、アクセント句のモーラ数とアクセン
ト型および音韻列等により、音素時間長標準化基本周波
数データベース351よりa)立ち上がり基準点、b)
立ち下がり基準点、c)立ち下がり基準点、d)アクセ
ント句末基準点、あるいは、d’)最終モーラを取得す
る。
【0055】基本周波数を生成しようとするアクセント
句のモーラ数、アクセント型に対応する基本周波数パタ
ンのデータが音素時間長標準化基本周波数データベース
351にない場合は、基本周波数を生成しようとするア
クセント句のモーラ数がnモーラ、アクセント型がm型
とすると、mがi+1以下の場合は図11(A)のよう
に、アクセント型がm型でモーラ数がnに最も近い1モ
ーラm型の基本周波数パタンのa)からd)を音素時間
長標準化基本周波数データベース351より取得し、図
11(B)のように音素時間長標準化基本周波数データ
ベース351から取得したd)を基本周波数を生成しよ
うとするアクセント句の第n−k+1モーラから第nモ
ーラの基準点として設定する。
【0056】mがi+1より大きくn−k以下の場合は
図12(A)のように、アクセント核のモーラ位置jが
i+1より大きくl−k以下で、モーラ数がnに最も近
いlモーラj型の基本周波数パタンのa)からd)を音
素時間長標準化基本周波数データベース351より取得
し、図12(B)のように音素時間長標準化基本周波数
データベース351から取得したb)とc)を基本周波
数を生成しようとするアクセント句の第mモーラと第m
+1モーラの基準点として設定し、音素時間長標準化基
本周波数データベース351から取得したd)を基本周
波数を生成しようとするアクセント句の第n−k+1モ
ーラから第nモーラの基準点として設定する。
【0057】mがn−kより大きい場合は図13(A)
のように、アクセント核のモーラ位置jがl−kより大
きくモーラ数がnに最も近いlモーラj型の基本周波数
パタンのa)からd’)を音素時間長標準化基本周波数
データベース351より取得し、図13(B)のように
音素時間長標準化基本周波数データベース351から取
得したb)とc)を含むd’)を基本周波数を生成しよ
うとするアクセント句の第n−k+1モーラから第nモ
ーラの基準点として設定する。基本周波数を生成しよう
とするアクセント句がnモーラ平板型の場合図14
(A)のように、アクセント型が平板型でモーラ数がn
に最も近いlモーラ平板型の基本周波数パタンのa)と
d)を音素時間長標準化基本周波数データベース351
より取得し、図13(B)のように音素時間長標準化基
本周波数データベース351から取得したd)を基本周
波数を生成しようとするアクセント句の第n−k+1モ
ーラから第nモーラの基準点として設定する。
【0058】次に、音素時間長標準化基本周波数データ
ベース351より取得されたあるいは音素時間長標準化
基本周波数データベース351より取得された基準点よ
り生成されたアクセント句の基本周波数パタンを基本周
波数変形データベース350にアクセント句のフレーズ
内での位置ごとに記憶された変形量に従って、各アクセ
ント句の基本周波数の最大値、a)からd)あるいは
d’)の基準点の基本周波数を変更する。
【0059】まず基本周波数変形データベース350に
記憶された第1アクセント句の変形量により図15中の
A)のように、a)とd)の基本周波数の差が音素時間
長標準化基本周波数データベース351より取得された
基本周波数の差の90%になるようにb)、c)および
d)の基本周波数を変更する。第2アクセント句につい
ては図15中のB)のように、a)の基本周波数を音素
時間長標準化基本周波数データベース351より取得さ
れた基本周波数の75%の値に変更し、a)とd)の基
本周波数の差が音素時間長標準化基本周波数データベー
ス351より取得された基本周波数の差の70%になる
ようにb)、c)およびd)の基本周波数を変更する。
同様に第3アクセント句も図15中のC)のようにa)
の基本周波数を音素時間長標準化基本周波数データベー
ス351より取得された基本周波数の70%の値に変更
し、a)とd)の基本周波数の差が音素時間長標準化基
本周波数データベース351より取得された基本周波数
の差の68%になるようにb)、c)およびd)の基本
周波数を変更する。
【0060】基本周波数変形データベース350に第n
アクセント句に対応する変形量が記憶されていない場
合、アクセント位置の値がnより小さく、最もnに近い
アクセント位置に対応する変形量を適用する。本例では
第4アクセント句の変形量が基本周波数変形データベー
ス350に記憶されていない場合を示す。
【0061】アクセント位置の値が4より小さく、最も
4に近い第3アクセント句の変形量を適用し図15中の
D)のように第3アクセント句と同様の変形を加える。
フレーズ終端である最終アクセント句については、基本
周波数変形データベース350より最終アクセント句に
対応する変形量を取得し、図15中のE)のようにa)
の基本周波数を音素時間長標準化基本周波数データベー
ス351より取得された基本周波数の48%の値に変更
し、a)とd)の基本周波数の差が音素時間長標準化基
本周波数データベース351より取得された基本周波数
の差の60%になるようにb)、c)およびd)の基本
周波数を変更する。
【0062】次に、各アクセント句について、実施の形
態2あるいは実施の形態4のようにアクセント句の先頭
からa)までの基本周波数を実時間軸上の関数を用いて
生成し、さらに各基準点の間を実時間軸上で補間し、ア
クセント句終了点までの基本周波数パタンを生成する。
【0063】声帯振動生成部70は基本周波数パタン生
成部60より出力された基本周波数パタンに従って合成
音の声帯振動を生成する。
【0064】音声の自然性に大きく影響する、アクセン
ト句の立ち上がりとアクセント核での立ち下がりのタイ
ミングを当該モーラの音素時間長で標準化した時間軸上
で設定することにより、音韻による時間長の差に影響さ
れることなく立ち上がり、立ち下がりの安定したなめら
かな基本周波数のパタンを得ることができ、高い自然性
を実現する。さらに基本周波数パタンの拡張を行うこと
によりデータベースの縮小が可能になる。また、フレー
ズ内でのアクセント句位置に基づいて基本周波数パタン
を変形することにより、フレーズとしてのまとまりをつ
くり、自然な文音声を実現することができる。
【0065】(実施の形態7)図17は複数のアクセン
ト句の基本周波数パタンを接続して生成した文の基本周
波数パタンの模式図である。装置の構成については図1
に同じである。以下その動作を述べる。
【0066】まず、文字列入力部10から音声に変換さ
れるべき文字列が入力される。文字列解析部20では入
力された文字列を解析し、音素列を示す音韻情報を時間
長設定部40へ出力し、文字列をアクセント句に分け、
各アクセント句のモーラ数とアクセント型を示す韻律情
報と音素列を示す音韻情報とを基本周波数パタン生成部
60へ出力する。時間長設定部40は文字列解析部20
より入力された音韻情報に基づき音韻時間長データベー
ス30を参照して各音素の時間長を設定し、時間長情報
を基本周波数パタン生成部60に出力する。基本周波数
パタン生成部60は文字列解析部20より入力された韻
律情報と音韻情報、時間長設定部40より入力された時
間長情報に基づき、アクセント句毎に基本周波数パタン
を生成する。
【0067】図17に示す様に、まず、第1アクセント
句1701のモーラ数、アクセント型に対応する基本周
波数パタン1711をモーラ時間長標準化基本周波数デ
ータベース50より取得し、適用する。
【0068】第1アクセント句1701の基本周波数の
最大値aを通り、第nアクセント句の位置を示すiの値
が増加するごとに、第1アクセント句1701の最大値
aが10%低下するような、第nアクセント句に対する
アクセント句の基本周波数最大値を示す式1を求める。
【0069】
【数1】 (−0.1i+1)a …式1 但し、aは、第1アクセント句1701の基本周波数の
最大値である。また、アクセント句数iは、第nアクセ
ント句が、第1アクセント句から数えて、何番目のアク
セント句であるかを示す数であり、n−1となる。
【0070】さらに第1アクセント句1701のアクセ
ント句末の周波数bを通り、第nアクセント句の位置を
示すiの値が増加する毎に、第1アクセント句1701
のアクセント句末の周波数bが5%低下するような、第
nアクセント句に対するアクセント句末の周波数を示す
式2を求める。
【0071】
【数2】 (−0.05i+1)b …式2 但し、bは、第1アクセント句1701のアクセント句
末の周波数である。
【0072】次に、第2アクセント句1702のモーラ
数、アクセント型に対応する基本周波数パタン1712
(図中、点線で表した)をモーラ時間長標準化基本周波
数データべース50より取得する。第2アクセント句の
アクセント句数iは1であるから、これを式1に代入し
て、基本周波数パタン1712の変形後の最大値a2
求める。同様にして、式2より、基本周波数パタン17
12の変形後のアクセント句末の周波数b2を求める。
【0073】この様にして求めた変形後の最大値a
2と、変形後のアクセント句末の周波数b2とに一致する
ように、モーラ時間長標準化基本周波数データべース5
0より取得した基本周波数パタン1712を変形した
後、変形後の基本周波数パタン1713を第2アクセン
ト句1702の基本周波数パタンとして用いる。
【0074】第nアクセント句についても、当該アクセ
ント句が最終アクセント句(文末)でない場合、第nア
クセント句のモーラ数、アクセント型に対応する基本周
波数パタンをモーラ時間長標準化基本周波数データべー
ス50より取得する。そして、その取得した基本周波数
パタンの最大値が、式1より得られた値に一致し、且
つ、その取得した基本周波数パタンのアクセント句末の
周波数が、式2より得られた値に一致する様に、上記デ
ータベース50より取得した基本周波数パタンを変形
し、これを第nアクセント句の基本周波数パタンとして
用いる。
【0075】更に、基本周波数を生成しようとするアク
セント句が文末である場合、モーラ数、アクセント型に
対応する基本周波数パタンをモーラ時間長標準化基本周
波数データべース50より取得し、その最大値が当該ア
クセント句の直前のアクセント句の最大値を15%低下
させた値に一致し、しかも、アクセント句末の周波数が
直前のアクセント句のアクセント句末を10%低下させ
た値に一致するように、上記データベース50より取得
した基本周波数パタンを変形し、これを適用する。
【0076】尚、対応する基本周波数パタンのデータが
モーラ時間長標準化基本周波数データベース50にない
場合は、実施の形態6のようにアクセント句の基本周波
数パタンを生成し、これを変形する。
【0077】声帯振動生成部70は基本周波数パタン生
成部60より出力された基本周波数パタンに従って合成
音の声帯振動を生成する。
【0078】当該モーラのモーラ時間長で標準化した時
間軸上で設定することにより、音韻による時間長の差に
影響されることなく立ち上がり、立ち下がりの安定した
なめらかな基本周波数のパタンを得ることができ、高い
自然性を実現する。また、フレーズ内でのアクセント句
位置に基づいて基本周波数パタンを変形することによ
り、フレーズとしてのまとまりをつくり、自然な文音声
を実現することができる。
【0079】尚、上記実施の形態では、基本周波数を生
成しようとするアクセント句が、文末である場合のみ、
直前のアクセント句の所定位置の周波数を基準として、
その周波数を所定の比率で低下させて用いる場合につい
て述べた。そこで、上記実施の形態の変形例として、文
末以外に存在しているアクセント句についても、上記例
と同様のルールで各周波数値を圧縮しても良い。即ち、
この場合、例えば、図18に示す様に、文末を除く、第
2アクセント句から第nアクセント句については、それ
ぞれ、直前のアクセント句の最大値を10%低下させた
値(図中、例えば、a2)と、直前のアクセント句のア
クセント句末の周波数を5%低下させた値(図中、例え
ば、b2)を求める。
【0080】そして、例えば第2アクセント句について
は、この様にして求めた変形後の最大値a2と、変形後
のアクセント句末の周波数b2とに一致するように、モ
ーラ時間長標準化基本周波数データべース50より取得
した基本周波数パタン1712を変形した後、変形後の
基本周波数パタン1713を第2アクセント句1702
の基本周波数パタンとして用いる。第nアクセント句に
ついても、これと同様である。尚、基本周波数を生成し
ようとするアクセント句が、文末である場合は、図17
と同様の方法を用いる。
【0081】(実施の形態8)図19は複数のアクセン
ト句の基本周波数パタンを接続して生成した文の基本周
波数パタンの模式図である。装置の構成については図1
に同じである。以下その動作を述べる。
【0082】まず、文字列入力部10から音声に変換さ
れるべき文字列が入力される。文字列解析部20では入
力された文字列を解析し、音素列を示す音韻情報を時間
長設定部40へ出力し、文字列をアクセント句に分け、
各アクセント句のモーラ数とアクセント型を示す韻律情
報と音素列を示す音韻情報とを基本周波数パタン生成部
60へ出力する。時間長設定部40は文字列解析部20
より入力された音韻情報に基づき音韻時間長データベー
ス30を参照して各音素の時間長を設定し、時間長情報
を基本周波数パタン生成部60に出力する。基本周波数
パタン生成部60は文字列解析部20より入力された韻
律情報と音韻情報、時間長設定部40より入力された時
間長情報に基づき、アクセント句毎に基本周波数パタン
を生成する。
【0083】図19に示す様に、まず、第1アクセント
句1801のモーラ数、アクセント型に対応する基本周
波数パタン1811をモーラ時間長標準化基本周波数デ
ータベース50より取得し、適用する。
【0084】第1アクセント句1801の基本周波数の
最大値aを通り、第1アクセント句の基本周波数の最大
値aを含むモーラ位置からのモーラ数が増えるごとにア
クセント句1801の最大値aが2%低下するような、
累積モーラ数jに対するアクセント句の基本周波数最大
値を示す式3を求める。
【0085】
【数3】 (−0.02j+1)a …式3 但し、aは、第1アクセント句1801の基本周波数の
最大値であり、累積モーラ数jは、第1アクセント句の
基本周波数の最大値aを含むモーラ位置(図中、横軸の
原点とした)を基準として数えたモーラ数である。
【0086】さらに第1アクセント句1801のアクセ
ント句末の周波数bを通り、第1アクセント句のアクセ
ント句末の周波数bを含むモーラ位置からのモーラ数が
増えるごとに、第1アクセント句1801のアクセント
句末の周波数bが1%低下するような、累積モーラ数j
に対するアクセント句末の周波数を示す式4を求める。
【0087】
【数4】 (−0.01j+1)b …式4 但し、bは、第1アクセント句1801のアクセント句
末の周波数である。
【0088】次に、第2アクセント句1802のモーラ
数、アクセント型に対応する基本周波数パタン1812
(図中、点線で表した)をモーラ時間長標準化基本周波
数データべース50より取得し、その最大値1812a
をとるモーラが、原点のモーラからj2aモーラ目になる
ことを求め、これを式3に累積モーラ数として代入し
て、基本周波数パタン1812の変形後の最大値a2
求める。又、第2アクセント句1802のアクセント句
末1812bが原点のモーラからj2bモーラ目になるこ
とを求め、これを式4に累積モーラ数として代入して、
基本周波数パタン1812の変形後のアクセント句末の
周波数b2を求める。
【0089】この様にして求めた変形後の最大値a
2と、変形後のアクセント句末の周波数b2とに一致する
ように、モーラ時間長標準化基本周波数データべース5
0より取得した基本周波数パタン1812を変形した
後、これを第2アクセント句1802の基本周波数パタ
ンとして用いる。
【0090】第nアクセント句についても、当該アクセ
ント句が最終アクセント句(文末)でない場合、第nア
クセント句のモーラ数、アクセント型に対応する基本周
波数パタンをモーラ時間長標準化基本周波数データべー
ス50より取得し、その最大値をとるモーラが、原点の
モーラから数えて何モーラ目になるかを求め、これを式
3に累積モーラ数として代入して基本周波数パタンの変
形後の最大値を求める。更に、アクセント句末が、原点
のモーラから数えて何モーラ目になるかを求め、これを
式4に累積モーラ数として代入して基本周波数パタンの
変形後のアクセント句末の周波数を求める。
【0091】この様にして求めた変形後の最大値と、変
形後のアクセント句末の周波数とに一致するように、モ
ーラ時間長標準化基本周波数データべース50より取得
した基本周波数パタンを変形して、第nアクセント句の
基本周波数パタンとして用いる。
【0092】又、基本周波数を生成しようとするアクセ
ント句が文末である場合、モーラ数、アクセント型に対
応する基本周波数パタンをモーラ時間長標準化基本周波
数データべース50より取得し、その最大値が当該アク
セント句の直前のアクセント句の最大値を15%低下さ
せた値に一致し、アクセント句末の周波数が直前のアク
セント句のアクセント句末を10%低下させた値に一致
するよう取得した基本周波数パタンを変形して適用す
る。対応する基本周波数パタンのデータがモーラ時間長
標準化基本周波数データベース50にない場合は、実施
の形態6のようにアクセント句の基本周波数パタンを生
成し、変形する。
【0093】声帯振動生成部70は基本周波数パタン生
成部60より出力された基本周波数パタンに従って合成
音の声帯振動を生成する。
【0094】当該モーラのモーラ時間長で標準化した時
間軸上で設定することにより、音韻による時間長の差に
影響されることなく立ち上がり、立ち下がりの安定した
なめらかな基本周波数のパタンを得ることができ、高い
自然性を実現する。また、フレーズ内での累積モーラ位
置に基づいて基本周波数パタンを変形することにより、
フレーズとしてのまとまりをつくり、自然な文音声を実
現することができる。
【0095】(実施の形態9)図16は本発明の一実施
の形態を示す装置の機能ブロック図であり、モーラ時間
長標準化基本周波数データベース50が第1アクセント
句から第3アクセント句についてアクセント句が文末で
あるか否か、およびアクセント句のモーラ数、アクセン
ト型、音韻列等の、韻律を決定する要因によって分類さ
れた、各モーラの母音部の時間長で標準化したモーラ毎
の母音部の基本周波数パタンを記憶するアクセント句位
置基本周波数データベース450に置き換わった以外は
図1と同様である。
【0096】以上のように構成された基本周波数パタン
生成装置について、以下、その動作を述べる。
【0097】まず、文字列入力部10から音声に変換さ
れるべき文字列が入力される。文字列解析部20では入
力された文字列を解析し、音素列を示す音韻情報を時間
長設定部40へ出力し、文字列をアクセント句に分け、
各アクセント句のモーラ数とアクセント型、およびアク
セント句のフレーズ内での位置を示す韻律情報と音素列
を示す音韻情報とを基本周波数パタン生成部60へ出力
する。
【0098】時間長設定部40は文字列解析部20より
入力された音韻情報に基づき音韻時間長データベース3
0を参照して各モーラの母音時間長または単母音音節、
撥音あるいは長音における母音相当部の時間長を設定
し、時間長情報を基本周波数パタン生成部60に出力す
る。基本周波数パタン生成部60は文字列解析部20よ
り入力された韻律情報と音韻情報、時間長設定部40よ
り入力された時間長情報に基づき、アクセント句毎に基
本周波数パタンを生成する。本例では5つのアクセント
句によって構成される文の基本周波数の生成を説明す
る。
【0099】まず、第1アクセント句に対して、アクセ
ント句位置基本周波数データベース450より第1アク
セント句で文末でない、基本周波数を生成しようとする
アクセント句のモーラ数、アクセント型に対応する基本
周波数パタンを取得する。第2アクセント句、第3アク
セント句に対しても同様にアクセント句位置基本周波数
データベース450より基本周波数パタンを取得する。
【0100】第4アクセント句については、アクセント
句位置基本周波数データベース450に第4アクセント
句に対応する基本周波数パタンはないため、第4アクセ
ント句にアクセント句の位置が最も近い第3アクセント
句の、文末でない基本周波数パタンからモーラ数とアク
セント型に対応する基本周波数パタンを取得する。
【0101】最終アクセント句である第5アクセント句
についても、アクセント句位置基本周波数データベース
450に該当する基本周波数パタンはないため、アクセ
ント句の位置が最も近い第3アクセント句の、文末の基
本周波数パタンからモーラ数とアクセント型に対応する
基本周波数パタンを取得する。実施の形態3あるいは実
施の形態4のように基本周波数パタンのない部分を実時
間軸上で補間し、基本周波数パタンを生成する。
【0102】声帯振動生成部70は基本周波数パタン生
成部60より出力された基本周波数パタンに従って合成
音の声帯振動を生成する。
【0103】当該モーラの母音長で標準化した基本周波
数パタンを利用することによりモーラ内での基本周波数
の変動を詳細に再現し、アクセント句の位置、文末か否
かの条件によって当てはめることによりフレーズ単位の
基本周波数の変動を正確に再現できるため、フレーズと
してのまとまりをつくり、自然な文音声を実現すること
ができる。
【0104】(実施の形態10)図20(A)、(B)
はアクセント句の基本周波数パタンを接続して文を生成
する際の基本周波数パタンの接続部の模式図である。本
発明の一実施の形態の基本周波数パタン生成装置の構成
については図1に同じである。以下その動作を述べる。
【0105】まず、文字列入力部10から音声に変換さ
れるべき文字列が入力される。文字列解析部20では入
力された文字列を解析し、音素列を示す音韻情報を時間
長設定部40へ出力し、文字列をアクセント句に分け、
各アクセント句のモーラ数とアクセント型を示す韻律情
報と音素列を示す音韻情報とを基本周波数パタン生成部
60へ出力する。時間長設定部40は文字列解析部20
より入力された音韻情報に基づき音韻時間長データベー
ス30を参照して各音素の時間長を設定し、時間長情報
を基本周波数パタン生成部60に出力する。基本周波数
パタン生成部60は文字列解析部20より入力された韻
律情報と音韻情報、時間長設定部40より入力された時
間長情報に基づき、アクセント句毎に基本周波数パタン
を生成する。
【0106】まず、基本周波数パタンを生成しようとす
る各アクセント句のモーラ数、アクセント型に対応する
基本周波数パタンをモーラ時間長標準化基本周波数デー
タベース50より取得し、適用する。実施の形態6、実
施の形態7、あるいは実施の形態8の方法でアクセント
句ごとにモーラ時間長標準化基本周波数データベース50
より取得した基本周波数パタンを変形する。
【0107】変形された各アクセント句の基本周波数パ
タンのうち、文末でない第nアクセント句につて、図2
0のe)当該アクセント句の最終モーラの母音部の基本
周波数と第n+1アクセント句の先頭モーラの母音部の基
本周波数の差を求める。
【0108】第nアクセント句と第n+1アクセント句の
間にポーズがない場合はe)の当該アクセント句の最終
モーラの母音部の基本周波数と第n+1アクセント句の先
頭モーラの母音部の基本周波数の差が40Hz以上で、
第nアクセント句のアクセント核がアクセント句内の末
尾3モーラの中にない場合は、アクセント句末尾基準点
の先頭モーラあるいはそれより先行するモーラで、第n
+1アクセント句の先頭モーラの母音部の基本周波数から
40を減じた値を超える基本周波数をもつモーラから、
第nアクセント句の最終モーラまでの基本周波数パタン
を周波数軸方向に圧縮し、図20のf)のように第nア
クセント句と第n+1アクセント句の間を滑らかに接続す
る。e)の当該アクセント句の最終モーラの母音部の基
本周波数と第n+1アクセント句の先頭モーラの母音部の
基本周波数の差が40Hz以上で、第nアクセント句の
アクセント核がアクセント句内の末尾3モーラの中にあ
る場合は、アクセント核のモーラあるいは先行するモー
ラで、第n+1アクセント句の先頭モーラの母音部の基本
周波数から40を減じた値を超える基本周波数をもつモ
ーラから、第nアクセント句の最終モーラまでの基本周
波数パタンを周波数軸方向に圧縮し、第nアクセント句
と第n+1アクセント句の間を滑らかに接続する。
【0109】第nアクセント句と第n+1アクセント句の
間に50msec未満のポーズがある場合はe)の当該
アクセント句の最終モーラの母音部の基本周波数と第n
+1アクセント句の先頭モーラの母音部の基本周波数の差
が50Hz以上で、第nアクセント句のアクセント核が
アクセント句内の末尾3モーラの中にない場合は、アク
セント句末尾基準点の先頭モーラあるいはそれより先行
するモーラで、第n+1アクセント句の先頭モーラの母音
部の基本周波数から50を減じた値を超える基本周波数
をもつモーラから、第nアクセント句の最終モーラまで
の基本周波数パタンを周波数軸方向に圧縮する。e)の
当該アクセント句の最終モーラの母音部の基本周波数と
第n+1アクセント句の先頭モーラの母音部の基本周波数
の差が50Hz以上で、第nアクセント句のアクセント
核がアクセント句内の末尾3モーラの中にある場合は、
アクセント核のモーラあるいは先行するモーラで、第n
+1アクセント句の先頭モーラの母音部の基本周波数から
50を減じた値を超える基本周波数をもつモーラから、
第nアクセント句の最終モーラまでの基本周波数パタン
を周波数軸方向に圧縮する。
【0110】第nアクセント句と第n+1アクセント句の
間に50msec以上100msec未満のポーズがあ
る場合はe)の当該アクセント句の最終モーラの母音部
の基本周波数と第n+1アクセント句の先頭モーラの母音
部の基本周波数の差が70Hz以上で、第nアクセント
ト句のアクセント核がアクセント句内の末尾3モーラの
中にない場合は、アクセント句末尾基準点の先頭モーラ
あるいはそれより先行するモーラで、第n+1アクセント
句の先頭モーラの母音部の基本周波数から70を減じた
値を超える基本周波数をもつモーラから、第nアクセン
ト句の最終モーラまでの基本周波数パタンを周波数軸方
向に圧縮する。e)の当該アクセント句の最終モーラの
母音部の基本周波数と第n+1アクセント句の先頭モーラ
の母音部の基本周波数の差が70Hz以上で、第nアク
セント句のアクセント核がアクセント句内の末尾3モー
ラの中にある場合は、アクセント核のモーラあるいは先
行するモーラで、第n+1アクセント句の先頭モーラの母
音部の基本周波数から70を減じた値を超える基本周波
数をもつモーラから、第nアクセント句の最終モーラま
での基本周波数パタンを周波数軸方向に圧縮する。
【0111】第nアクセント句と第n+1アクセント句の
間に100msec以上150msec未満のポーズが
ある場合はe)の当該アクセント句の最終モーラの母音
部の基本周波数と第n+1アクセント句の先頭モーラの母
音部の基本周波数の差が80Hz以上で、第nアクセン
ト句のアクセント核がアクセント句内の末尾3モーラの
中にない場合は、アクセント句末尾基準点の先頭モーラ
あるいはそれより先行するモーラで、第n+1アクセント
句の先頭モーラの母音部の基本周波数から80を減じた
値を超える基本周波数をもつモーラから、第nアクセン
ト句の最終モーラまでの基本周波数パタンを周波数軸方
向に圧縮する。e)の当該アクセント句の最終モーラの
母音部の基本周波数と第n+1アクセント句の先頭モーラ
の母音部の基本周波数の差が80Hz以上で、第nアク
セント句のアクセント核がアクセント句内の末尾3モー
ラの中にある場合は、アクセント核のモーラあるいは先
行するモーラで、第n+1アクセント句の先頭モーラの母
音部の基本周波数から70を減じた値を超える基本周波
数をもつモーラから、第nアクセント句の最終モーラま
での基本周波数パタンを周波数軸方向に圧縮する。
【0112】声帯振動生成部70は基本周波数パタン生
成部60より出力された基本周波数パタンに従って合成
音の声帯振動を生成する。
【0113】アクセント句単位で生成した基本周波数パ
タンの末尾を後続アクセント句との間のポーズ長に基づ
いて変形することによりアクセント句どうしの接続部を
滑らかにし、自然な文音声を実現することができる。
【0114】なお、以上の説明では、実施の形態1、
3、4では補間関数として直線を用い、実施の形態2で
補間関数として対数周波数軸に対する臨界制動2次線形
系を用いた例で説明したが、実施の形態1、3、4に臨
界制動2次線形系を用い、実施の形態2に直線を用いて
もよい、またその他の実時間軸上の関数についても同様
に実施可能である。
【0115】なお、実施の形態2においてアクセント句
の先頭から、立ち上がり基準点までの基本周波数を対数
周波数軸に対する臨界制動2次線形系を用いて補間し、
実施の形態4で実時間軸上で表現された基本周波数パタ
ンを当てはめることにより補間したが、実施の形態2に
実時間軸上で表現された基本周波数パタンを当てはめ、
実施の形態4に対数周波数軸に対する臨界制動2次線形
系を用いてもよい。
【0116】なお、実施の形態2において母音時間長標
準化基本周波数データベース150aは各モーラの母音
部の時間長を4等分し、各区間の基本周波数の代表値を
記憶するものとしたが、基本周波数パタンを各音素の時
間長で標準化したものであればこれ以外のものでもよ
い。
【0117】なお、実施の形態2、5において、アクセ
ント立ち上がり基準点を当該モーラの母音長を4等分し
た3番目の区間の中央を立ち上がり基準点としたが、母
音の後半に当たる相対位置であればこれ以外の値でも良
い。
【0118】なお、実施の形態5において母音時間長標
準化基本周波数データベース150aは各モーラの母音
部の時間長を4等分し、各区間の基本周波数の代表値を
記憶するものとしたが、基本周波数パタンを各母音の時
間長で標準化したものであればこれ以外のものでもよ
い。
【0119】なお、実施の形態2、5において、アクセ
ント立ち上がり基準点を当該モーラの母音長を4等分し
た3番目の区間の中央を立ち上がり基準点としたが、母
音の後半に当たる相対位置であればこれ以外の値でも良
い。
【0120】なお、実施の形態2、5において、アクセ
ント核に当たるモーラの母音長を4等分した3番目の区
間の中央と、アクセント核の次のモーラの母音長を4等
分した3番目の区間の中央の2点を立ち下がり基準点と
したが、母音の後半に当たる相対位置であればこれ以外
の値でも良い。
【0121】なお、実施の形態2、5において、アクセ
ント句の最終モーラの母音長を4等分した2番目の区間
の中央をアクセント句末基準点としたが、母音の前半に
当たる相対位置であればこれ以外の値でも良い。なお、
実施の形態2、5において、発話の最終モーラの母音長
を4等分した3番目の区間の中央を語尾基準点とした
が、母音の後半に当たる相対位置であればこれ以外の値
でも良い。
【0122】なお、実施の形態5において、マイクロプ
ロソディを付加する基礎となる基本週は素パタンを実施
の形態2と同様に生成したが、実施の形態1、3、4と
同様にしても良い。
【0123】なお、実施の形態6において、アクセント
句の基本周波数パタンを実施の形態2と同様に生成した
が、実施の形態1、3、4と同様にしても良い。
【0124】なお、実施の形態6において、基本周波数
パタンの基準点をデータベースより取得された変形量に
従って変更した後に補間を行ったが、補間を行った後に
基本周波数パタンを変形しても良い。
【0125】なお、実施の形態6において、基本周波数
パタンの変形量として、第1アクセント句では最大値と
アクセント句末との差を90%に圧縮したが70%から
100%未満の範囲内の他の値でも良い。
【0126】なお、実施の形態6において、基本周波数
パタンの変形量として、第2アクセント句においては最
大値を75%に圧縮し、第3アクセント句、第nアクセ
ント句においては最大値を70%に圧縮したが50%か
ら90%の範囲内の他の値でも良い。
【0127】なお、実施の形態6において、基本周波数
パタンの変形量として、第2アクセント句においては最
大値とアクセント句末との差を70%に圧縮し、第3ア
クセント句、第nアクセント句においては最大値とアク
セント句末との差を68%に圧縮したが50%から90
%の範囲内の他の値でも良い。
【0128】なお、実施の形態6において、基本周波数
パタンの変形量として、最終アクセント句については最
大値を48%に圧縮したが30%から70%の範囲内の
他の値でも良い。
【0129】なお、実施の形態6において、基本周波数
パタンの変形量として、最終アクセント句については最
大値とアクセント句末との差を60%に圧縮するとした
が40%から80%の範囲内の他の値でも良い。
【0130】なお、実施の形態7において、式1のiの
係数を−0.1としたが−0.05から−0.4の範囲
内の他の値でも良い。
【0131】なお、実施の形態7において、式2のjの
係数を−0.05としたが0を最大として−0.2の範
囲内の他の値でも良い。
【0132】なお、実施の形態7および実施の形態8に
おいて最終アクセント句においては、基本周波数の最大
値を直前のアクセント句の最大値を15%低下させた値
としたが、10%から40%の範囲内の他の値でも良
い。
【0133】アクセント句末を直前のアクセント句のア
クセント句末を10%低下させた値にするとしたが、5
%から40%の範囲内の他の値でも良い。
【0134】なお、実施の形態8において、式3のiの
係数を−0.02としたが、これに限らず、−0.01
から−0.2の範囲内の他の値でも良い。
【0135】なお、実施の形態8において、式4のjの
係数を−0.01としたが、これに限らず、−0.01
から−0.1の範囲内の他の値でも良い。
【0136】なお、実施の形態10において実施の形態
6、7、あるいは8同様にしてモーラ時間長標準化基本
周波数データベース50より取得した基本周波数パタン
を変形するとしたが、実施の形態9と同様にアクセント
句位置基本周波数データベース450よりアクセント句
の位置に基づいて基本周波数パタンを取得するとしても
良い。
【0137】なお、実施の形態10において第nアクセ
ント句と第n+1アクセント句の間にポーズがない場合
に、第nアクセント句の最終モーラの母音部中央と第n
+1アクセント句の先頭モーラの母音部中央の基本周波
数の差が40Hz以下になるように基本周波数パタンを
変形するとしたが、20Hzから60Hzの間の他の値
でも良い。
【0138】なお、実施の形態10においてアクセント
句立ち下がり、アクセント句末、語尾の基本周波数の変
更の基準として、第nアクセント句と第n+1アクセン
ト句の間のポーズの持続時間を50msec未満、50msec
以上100msec未満、100msec以上150msec未満、
150msec以上の4段階に分類したが、1ないし8の他
の数の段階に分類しても良い。
【0139】なお、実施の形態10において第nアクセ
ント句と第n+1アクセント句の間のポーズの持続時間
が150msec以上の場合はアクセント句立ち下がり、ア
クセント句末、語尾の基本周波数の変更を行わないもの
としたが、変更を行うポーズの持続時間の上限は120
msecから200msecの間のほかの値としても良い。
【0140】なお、実施の形態10においてアクセント
句立ち下がり、アクセント句末、語尾の基本周波数の変
更の基準として、第nアクセント句と第n+1アクセン
ト句の間のポーズの持続時間を4段階に分類し、第nア
クセント句の最終モーラの母音部中央と第n+1アクセ
ント句の先頭モーラの母音部中央の基本周波数の差の上
限をポーズの持続時間の段階毎に設定したが、ポーズの
持続時間tに対する一次式(式5)
【0141】
【数5】 at+b(Hz) …式5 ただし 0<a<0.4 20<b<60 によって設定するとしても良い。
【0142】なお、本発明はプログラムによって実現
し、これをフロッピーディスク、光ディスク、ICカー
ド、ROMカセット等のプログラムを記録することので
きる記録媒体に記録して移送することにより、独立した
他のコンピュータシステムで容易に実施することができ
る。
【0143】又、本発明の音韻は、上記実施の形態で
は、主にモーラに該当するものとして説明したが、これ
に限らず例えば、音節であっても良い。即ち、上記の様
に、基本周波数データベースとして、モーラ単位又は音
素単位でデータを格納している場合に限らず例えば、音
節単位又は音節に含まれる音素単位でデータを格納した
基本周波数データベースを用いても勿論良く、この場合
でも、上記と同様の効果を発揮する。即ち、上述した全
ての実施の形態において、「モーラ」を「音節」と読み
替えた構成としても、上記と同様の効果を発揮する。
【0144】又、上記実施の形態では、基本周波数デー
タベースが、末尾から3モーラまでの基本周波数パタン
を保持している場合について述べたが、最大限末尾から
4モーラまでの基本周波数パタンを保持しておけば十分
な効果を発揮する。
【0145】上記の様に、本発明の第1の方法は、アク
セント句のモーラ位置毎に当該モーラの音素の時間長で
標準化した基本周波数パタンを記憶した音素時間長標準
化基本周波数データベースを用い、アクセント句の基本
周波数の最大値を含むモーラ、アクセント核とアクセン
ト核の次のモーラ、およびアクセント句の末尾の1モー
ラあるいは複数のモーラのおのおのについて、前記のデ
ータベースを参照して各モーラ内での基本周波数パタン
を設定し、基本周波数がデータベースより設定されない
区間については、データベースから設定された基本周波
数の間を実時間軸上の関数により補間して基本周波数パ
タンを生成する基本周波数パタン生成方法である。
【0146】又、第2の方法は、アクセント句のモーラ
位置毎に当該モーラの音素の時間長で標準化した基本周
波数パタンを記憶した音素時間長標準化基本周波数デー
タベースを用い、アクセント句の基本周波数の最大値を
与える立ち上がり基準点、アクセントの立ち下がりを与
える立ち下がり基準点、アクセント句の終了時の基本周
波数を与えるアクセント句末基準点および発話終了時の
基本周波数を与える語尾基準点を当該モーラの母音長に
対して一定比である時間点に設定し、おのおのの基準点
について前記のデータベースを参照して基本周波数を設
定し、それらの基準点間の基本周波数については実時間
軸上の関数により補間して基本周波数パタンを生成する
基本周波数パタン生成方法である。
【0147】又、第3の方法は、アクセント句のモーラ
位置毎に当該モーラの母音あるいは母音相当部の時間長
で標準化した基本周波数パタンを記憶した音素時間長標
準化基本周波数データベースを用い、アクセント句の基
本周波数の最大値を含むモーラ、アクセント核とアクセ
ント核の次のモーラ、およびアクセント句末尾の1ない
し複数のモーラのおのおのについて、前記のデータベー
スを参照して各モーラ内での基本周波数パタンを設定
し、基本周波数がデータベースより設定されない区間に
ついては、データベースから設定された基本周波数の間
を実時間軸上の関数により補間して基本周波数パタンを
生成する基本周波数パタン生成方法である。
【0148】又、第4の方法は、アクセント句のモーラ
位置毎に当該モーラの母音あるいは母音相当部の時間長
で標準化した基本周波数パタンを記憶した音素時間長標
準化基本周波数データベースを用い、アクセント句の基
本周波数の最大値を与える立ち上がり基準点、アクセン
トの立ち下がりを与える立ち下がり基準点、アクセント
句の終了時の基本周波数を与えるアクセント句末基準点
および発話終了時の基本周波数を与える語尾基準点を当
該モーラの母音長に対して一定比である時間点に設定
し、おのおのの基準点について前記のデータベースを参
照して基本周波数を設定し、それらの基準点間の基本周
波数については実時間軸上の関数により補間して基本周
波数パタンを生成する基本周波数パタン生成方法であ
る。
【0149】又、第5の方法は、アクセント句のモーラ
位置毎に当該モーラの音素時間長で標準化した基本周波
数パタンを記憶した音素時間長標準化基本周波数データ
ベースと、音素あるいは音韻列ごとの基本周波数を音素
時間長で標準化した値と基本周波数パタンとの差を記憶
したマイクロプロソディデータベースとを用い、音素時
間長標準化基本周波数データベースから取得された基本
周波数パタンにマイクロプロソディデータを加算あるい
は減算することにより基本周波数パタンを生成する基本
周波数パタン生成方法である。
【0150】又、第6の方法は、アクセント句のモーラ
位置毎に当該モーラの音素時間長で標準化した基本周波
数パタンを記憶した音素時間長標準化基本周波数データ
ベースを用い、アクセント句ごとの基本周波数パタンを
生成する基本周波数パタン生成方法において、基本種端
数を生成しようとするアクセント句のモーラ数およびア
クセント型に該当する基本周波数パタンが音素時間長標
準化基本周波数データベース内にない場合、データベー
ス内の基本周波数パタンを利用し、基本周波数を生成し
ようとするアクセント句をnモーラm型、データベース
から取得した基本周波数パタンをlモーラj型、取得し
た基本周波数パタンの最大値を含むモーラの位置をi、
取得した基本周波数パタンのアクセント句末尾のモーラ
数をkとするとき、m≦i+1のとき第1から第m+1
モーラまではデータベースより取得した基本周波数パタ
ンの第1から第j+1モーラまでを適用し、第n−k+
1から第nモーラまではデータベースより取得した基本
周波数パタンの第l―k+1から第lモーラを適用し、
その間のモーラについては実時間軸上で補間することに
より基本周波数パタンを生成する。またi+1<m≦n
−k+1のとき第1から第iモーラまではデータベース
より取得した基本周波数パタンの第1から第iモーラま
でを適用し、第m、第m+1モーラにはデータベースよ
り取得した基本周波数パタンの第j、第j+1モーラを
適用し、第n−k+1から第nモーラまではデータベー
スより取得した基本周波数パタンの第l―k+1から第
lモーラまでを適用し、その間のモーラについては実時
間軸上で補間することにより基本周波数パタンを生成す
る。またm>n−k+1のとき第1から第iモーラまで
はデータベースより取得した基本周波数パタンの第1か
ら第iモーラまでを適用し、第mから第nモーラまでは
データベースより取得した基本周波数パタンの第jモー
ラから第lモーラまでを適用し、その間のモーラについ
ては実時間軸上で補間することにより基本周波数パタン
を生成する基本周波数生成方法である。
【0151】又、第7の方法は、アクセント句の基本周
波数パタンをフレーズのアクセント句の位置および文末
であるか否かによって分類した基本周波数データベース
を用いて基本周波数パタンを生成する基本周波数生成方
法である。
【0152】又、第8の方法は、アクセント句の基本周
波数パタンを記憶した基本周波数データベースと、フレ
ーズのアクセント句の位置および文末であるか否かによ
って、基本周波数パタンの変形量を記憶した変形データ
ベースを用い、基本周波数データより取得した基本周波
数パタンを変形データベースより取得した変形量に従っ
て変形し基本周波数パタンを生成する基本周波数パタン
生成方法である。
【0153】又、第9の方法は、アクセント句の基本周
波数パタンを記憶した基本周波数データベースを用い、
基本周波数データより取得した基本周波数パタンをフレ
ーズ内でのアクセント句の位置iの関数により基本周波
数パタンを変形する基本周波数パタン生成方法である。
【0154】又、第10の方法は、アクセント句の基本
周波数パタンを記憶した基本周波数データベースを用
い、基本周波数データより取得した基本周波数パタンを
基本周波数パタンを決定する基準になるモーラに対して
そのモーラのフレーズ内での位置jの関数により基本周
波数パタンを変形する基本周波数パタン生成方法であ
る。
【0155】又、第11の方法は、アクセント句ごとに
基本周波数パタンを生成し、当該アクセント句のアクセ
ント末尾、および終了点の周波数と次のアクセント句の
開始点の周波数の差があらかじめ定められた値以下にな
るよう当該アクセント句のアクセントの立ち下がり、ア
クセント末尾および終了点の特性を変更する基本周波数
パタン生成方法である。
【0156】以上説明したように、本発明によれば、ア
クセント句の立ち上がりとアクセント核での立ち下がり
のタイミングと角度を当該モーラの母音長で標準化した
基本周波数パタンを当てはめることにより、モーラ内で
の基本周波数の変動を詳細に再現し、高い自然性を実現
するとともに、データベースのパタンを当てはめない実
時間軸上で補間を行うことにより、モーラ単位で制御す
る際の不連続感をなくし、基本周波数パタンデータベー
スもより小さくすることができる。あるいはアクセント
句の立ち上がりとアクセント核での立ち下がりのタイミ
ングを当該モーラの母音長で標準化した時間軸上で設定
することにより、モーラ内での基本周波数の変動のタイ
ミングを詳細に再現し、立ち上がり、立ち下がりの角度
については実時間軸上の関数を用いることによって、音
韻による時間長の差に影響されることなく立ち上がり、
立ち下がりの安定したなめらかな基本周波数のパタンを
得ることができ、モーラ単位で制御する際の不連続感を
なくし、高い自然性を実現する。さらに補間を用いるこ
とにより基本周波数パタンデータベースもより小さくす
ることができ、その実用的効果は大きい。
【0157】
【発明の効果】以上述べたところから明らかな様に本発
明は、従来に比べてより一層自然性の高い基本周波数パ
タンを生成出来るという長所を有する。
【図面の簡単な説明】
【図1】本発明による基本周波数生成装置の機能ブロッ
ク図
【図2】本発明の実施の形態1により生成される基本周
波数パタンの1例を示す図
【図3】本発明の実施の形態2により生成される基本周
波数パタンの1例を示す図
【図4】本発明の一実施の形態を示す装置の機能ブロッ
ク図
【図5】本発明による基本周波数パタンの一例を示す図
【図6】本発明による基本周波数パタンの一例を示す図
【図7】本発明の一実施の形態を示す装置の機能ブロッ
ク図
【図8】マイクロプロソディデータベース250に記憶
されているマイクロプロソディ成分の模式図
【図9】(A):実施の形態5の基本周波数データベー
スより生成される基本周波数パタンを示す図 (B):同実施の形態のマイクロプロソディデータベー
スより取得したマイクロプロソディ成分を示す図 (C):図9(A)のパタンに図9(B)のパタンを加
算して生成した基本周波数パタンを示す図
【図10】本発明の一実施の形態を示す装置の機能ブロ
ック図
【図11】(A)、(B):本発明による基本周波数パ
タンの一例を示す図
【図12】(A)、(B):本発明による基本周波数パ
タンの一例を示す図
【図13】(A)、(B):本発明による基本周波数パ
タンの一例を示す図
【図14】(A)、(B):本発明による基本周波数パ
タンの一例を示す図
【図15】本発明の基本周波数パタンの模式図
【図16】本発明の一実施の形態を示す装置の機能ブロ
ック図
【図17】本発明の一実施の形態の基本周波数パタンの
模式図
【図18】本発明の変形例の基本周波数パタンの模式図
【図19】本発明の基本周波数パタンの模式図
【図20】(A)、(B):本発明の基本周波数パタン
のアクセント句接続部の模式図
【符号の説明】
10 文字列入力部 20 文字列解析部 30 音韻時間長データベース 40 時間長設定部 50 モーラ時間長標準化基本周波数データベース 60 基本周波数パタン生成部で 70 声帯振動生成部 150、150a,150b 母音時間長標準化基本周
波数データベース 250 マイクロプロソディデータベース 350 基本周波数パタン変形データベース 450 アクセント句位置基本周波数データベース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 原 紀代 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 松井 謙二 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5D045 AA09

Claims (85)

    【特許請求の範囲】
  1. 【請求項1】 アクセント句の基本周波数を生成する基
    本周波数パタン生成方法であって、 前記アクセント句の第1音韻、前記基本周波数が最大値
    を示す音韻、アクセント核の音韻とそのアクセント核の
    次の音韻、および末尾の1音韻の内、(1)少なくとも
    何れか一つの音韻の基本周波数パタンを前記音韻の時間
    長によって標準化した基本周波数パタンを記憶した、又
    は、(2)少なくとも何れか一つの音韻に含まれる音素
    の基本周波数パタンを前記音素の時間長によって標準化
    した基本周波数パタンを記憶した基本周波数データベー
    スを参照し、 前記基本周波数を生成しようとするアクセント句の第1
    音韻、前記アクセント句内において基本周波数が最大値
    を示す音韻、前記アクセント句内のアクセント核の音韻
    とそのアクセント核の次の音韻、および前記アクセント
    句の末尾の各音韻の内、(3)全部若しくは一部の音韻
    毎の基本周波数パタンを、又は(4)前記音韻に含まれ
    る音素毎の基本周波数パタンを設定し、 前記基本周波数パタンの前記設定の段階において未設定
    の、前記音韻間又は前記音素間の基本周波数パタンを、
    実時間軸上の関数により補間することを特徴とする基本
    周波数パタン生成方法。
  2. 【請求項2】 前記基本周波数パタンは、自然に発声さ
    れた音声から抽出されたものである請求項1に記載の基
    本周波数パタン生成方法。
  3. 【請求項3】 前記基本周波数データベースに記憶され
    た前記基本周波数パタンは、モーラ数、音節数、アクセ
    ント位置、音韻または音素列のいずれか1つまたは複数
    の基準によって分類されていることを特徴とする請求項
    1に記載の基本周波数パタン生成方法。
  4. 【請求項4】 前記実時間軸上の補間が直線補間である
    請求項1に記載の基本周波数パタン生成方法。
  5. 【請求項5】 前記実時間軸上の補間を行うための補間
    関数が、対数周波数軸上の臨界制動2次線形系である請
    求項1に記載の基本周波数パタン生成方法。
  6. 【請求項6】 アクセント句の基本周波数を生成する基
    本周波数パタン生成方法であって、 前記基本周波数を生成しようとするアクセント句の立ち
    上がり基準点、アクセントを生成する立ち下がり基準
    点、前記アクセント句の末尾の1音韻の何れかを含む複
    数音韻の基本周波数パタンを決定するアクセント句末基
    準点、および語尾の基本周波数パタンを生成する語尾基
    準点の内、全部又は一部の基準点を、それぞれの音韻に
    含まれる音素の時間長で標準化された時間軸上に設定
    し、 前記音韻に含まれる音素の基本周波数パタンを、その各
    音素の時間長によって標準化した基本周波数パタンより
    抽出した基本周波数のうち、アクセント句の立ち上がり
    基準点、立ち下がり基準点、アクセント句末基準点、及
    び語尾基準点の少なくとも何れか一つの基準点の基本周
    波数パタンを記憶した基本周波数データベースを参照
    し、 前記設定された基準点における基本周波数を、前記基本
    周波数データベースを参照することにより設定し、 前記基本周波数の設定の段階において未設定の、前記基
    準点の間の基本周波数を、実時間軸上の関数あるいは実
    時間軸上で表現された基本周波数パタンにより補間する
    ことを特徴とする基本周波数パタン生成方法。
  7. 【請求項7】 前記基本周波数パタンは、自然に発声さ
    れた音声から抽出されたものである請求項6に記載の基
    本周波数パタン生成方法。
  8. 【請求項8】 前記基本周波数データベースに記憶され
    た前記基本周波数パタンはモーラ数、音節数、アクセン
    ト位置、音韻または音素列のいずれか1つまたは複数の
    基準によって分類されていることを特徴とする請求項6
    に記載の基本周波数パタン生成方法。
  9. 【請求項9】 前記実時間軸上の補間が直線補間である
    請求項6に記載の基本周波数パタン生成方法。
  10. 【請求項10】 前記実時間軸上の補間を行うための補
    間関数が、対数周波数軸上の臨界制動2次線形系である
    請求項6に記載の基本周波数パタン生成方法。
  11. 【請求項11】 アクセント句の先頭から前記立ち上が
    り基準点までの基本周波数を、実時間軸上で表現された
    基本周波数パタンにより補間することを特徴とする請求
    項6に記載の基本周波数パタン生成方法。
  12. 【請求項12】 前記アクセント句の立ち上がり基準点
    を、当該音韻の母音長の1/2から1までの一定比の点
    とする請求項6に記載の基本周波数パタン生成方法。
  13. 【請求項13】 前記立ち下がり基準点を、当該音韻の
    母音長の1/2から1までの一定比の点とする請求項6
    に記載の基本周波数パタン生成方法。
  14. 【請求項14】 前記アクセント句末尾の基準点を、当
    該音韻の母音長の1/2を最大値とする一定比の点とす
    る請求項6に記載の基本周波数パタン生成方法。
  15. 【請求項15】 発話最終音韻基準点を、当該音韻の母
    音長の1/2から1までの一定比の点とする請求項6に
    記載の基本周波数パタン生成方法。
  16. 【請求項16】 アクセント句の基本周波数を生成する
    基本周波数パタン生成方法であって、 前記アクセント句の第1音韻、前記基本周波数が最大値
    を示す音韻、アクセント核の音韻とそのアクセント核の
    次の音韻、および、末尾の1音韻あるいは末尾から4音
    韻以下の複数音韻の内、少なくとも何れか一つの音韻に
    含まれる母音部に相当する基本周波数パタンを、その音
    韻に含まれる母音の時間長によって標準化した基本周波
    数パタンを記憶した基本周波数データベースを参照し、 前記基本周波数を生成しようとするアクセント句の第1
    音韻、前記アクセント句内において基本周波数が最大値
    を示す音韻、前記アクセント句内のアクセント核の音韻
    とそのアクセント核の次の音韻、および前記アクセント
    句の末尾の各音韻の内、全部又は一部の音韻において、
    その音韻に含まれる母音ごとの基本周波数パタンを設定
    し、 前記基本周波数パタンの前記設定が行われない、前記音
    韻間の基本周波数を、実時間軸上の関数により補間する
    ことを特徴とする基本周波数パタン生成方法。
  17. 【請求項17】 前記音韻に含まれる母音が単母音音節
    である場合は、前記基本周波数データベースを参照して
    得た基本周波数パタンを、前記単母音音節の後半部に対
    して当てはめることを特徴とする請求項16記載の基本
    周波数パタン生成方法。
  18. 【請求項18】 前記基本周波数を生成しようとするア
    クセント句の第1音韻が単母音音節の場合、前記基本周
    波数データベースに記憶されたアクセント句先頭の基本
    周波数を用いて第1音韻の先頭の基本周波数を設定し、 その設定した第1音韻の先頭の基本周波数と前記音節の
    後半部との間を、実時間軸上の関数により補間すること
    を特徴とする請求項17記載の基本周波数パタン生成方
    法。
  19. 【請求項19】 前記音韻に含まれる撥音および長音に
    ついては、前記単母音音節の場合と同様に取り扱うこと
    を特徴とする請求項17又は請求項18記載の基本周波
    数パタン生成方法。
  20. 【請求項20】 前記基本周波数パタンは自然に発声さ
    れた音声から抽出されたものである請求項16に記載の
    基本周波数パタン生成方法。
  21. 【請求項21】 前記基本周波数データベースに記憶さ
    れた前記基本周波数パタンは、モーラ数、音節数、アク
    セント位置、音韻または音素列のいずれか1つまたは複
    数の基準によって分類されていることを特徴とする請求
    項16記載の基本周波数パタン生成方法。
  22. 【請求項22】 前記実時間軸上の補間が直線補間であ
    る請求項16に記載の基本周波数パタン生成方法。
  23. 【請求項23】 前記実時間軸上の補間を行うための補
    間関数が、対数周波数軸上の臨界制動2次線形系である
    請求項16に記載の基本周波数パタン生成方法。
  24. 【請求項24】 アクセント句の基本周波数を生成する
    基本周波数パタン生成方法であって、 前記基本周波数を生成しようとするアクセント句の立ち
    上がり基準点、アクセントを生成する立ち下がり基準
    点、前記アクセント句の末尾の基本周波数パタンを決定
    するアクセント句末基準点、および語尾の基本周波数パ
    タンを生成する語尾基準点の内、全部又は一部の基準点
    を、それぞれの音韻に含まれる音素の時間長で標準化さ
    れた時間軸上に設定し、 前記音韻に含まれる母音の基本周波数パタンを、その各
    母音の時間長によって標準化した基本周波数パタンより
    抽出した基本周波数のうち、アクセント句の立ち上がり
    基準点、立ち下がり基準点、アクセント句末基準点、及
    び語尾基準点の少なくとも何れか一つの基準点の基本周
    波数パタンを記憶した基本周波数データベースを参照
    し、 前記設定された基準点における基本周波数を、前記基本
    周波数データベースを参照することにより設定し、 前記基本周波数の前記設定が行われない、前記基準点の
    間の基本周波数を、実時間軸上の関数あるいは実時間軸
    上で表現された基本周波数パタンにより補間することを
    特徴とする基本周波数パタン生成方法。
  25. 【請求項25】 前記基本周波数パタンは、自然に発声
    された音声から抽出されたものである請求項24に記載
    の基本周波数パタン生成方法。
  26. 【請求項26】 前記基本周波数パタンは、モーラ数、
    音節数、アクセント位置、音韻または音素列のいずれか
    1つまたは複数の基準によって分類されていることを特
    徴とする請求項24に記載の基本周波数パタン生成方
    法。
  27. 【請求項27】 前記実時間軸上の補間が直線補間であ
    る請求項24に記載の基本周波数パタン生成方法。
  28. 【請求項28】 前記実時間軸上の補間を行うための補
    間関数が、対数周波数軸上の臨界制動2次線形系である
    請求項24に記載の基本周波数パタン生成方法。
  29. 【請求項29】 アクセント句の先頭から前記立ち上が
    り基準点までの基本周波数を、実時間軸上で表現された
    基本周波数パタンにより補間する請求項24記載の基本
    周波数パタン生成方法。
  30. 【請求項30】 前記アクセント句の立ち上がり基準点
    を、当該音韻の母音長の1/2から1までのあらかじめ
    定められた比の時間点とする請求項24記載の基本周波
    数パタン生成方法。
  31. 【請求項31】 前記基本周波数を生成しようとする音
    韻が単母音音節の場合、前記あらかじめ定められた比
    は、当該音韻の時間長の3/4から1までのあらかじめ
    定められた比の時間点とする請求項30に記載の基本周
    波数パタン生成方法。
  32. 【請求項32】 前記基本周波数を生成しようとするア
    クセント句の第1音韻が単母音音節の場合、前記基本周
    波数データベースに記憶されたアクセント句先頭の基本
    周波数を用いて第1音韻の先頭の基本周波数を設定し、
    その第1音韻の先頭の基本周波数と前記あらかじめ定め
    られた比の時間点との間を実時間軸上の関数により補間
    することを特徴とする請求項30記載の基本周波数パタ
    ン生成方法。
  33. 【請求項33】 前記音韻に含まれる撥音および長音に
    ついては、前記単母音音節の場合と同様に取り扱うこと
    を特徴とする請求項31又は32記載の基本周波数パタ
    ン生成方法。
  34. 【請求項34】 前記立ち下がり基準点を、当該音韻の
    母音長の1/2から1までのあらかじめ定められた比の
    時間点とする請求項24記載の基本周波数パタン生成方
    法。
  35. 【請求項35】 前記基本周波数を生成しようとする音
    韻が単母音音節の場合、前記あらかじめ定められた比
    は、当該音韻の時間長の3/4から1までのあらかじめ
    定められた比の時間点とすることを特徴とする請求項3
    4記載の基本周波数パタン生成方法。
  36. 【請求項36】 前記音韻に含まれる撥音および長音に
    ついては、前記単母音音節の場合と同様に取り扱うもの
    とする請求項35記載の基本周波数パタン生成方法。
  37. 【請求項37】 前記アクセント語尾基準点を、当該音
    韻の母音長の1/2を最大値とするあらかじめ定められ
    た比の時間点とする請求項24記載の基本周波数パタン
    生成方法。
  38. 【請求項38】 発話最終音韻基準点を当該音韻の母音
    長の1/2から1までのあらかじめ定められた比の時間
    点とする請求項24記載の基本周波数パタン生成方法。
  39. 【請求項39】 前記基本周波数を生成しようとする音
    韻が単母音音節の場合、前記あらかじめ定められた比
    は、当該音韻の時間長の3/4から1までのあらかじめ
    定められた比の時間点とする請求項38記載の基本周波
    数パタン生成方法。
  40. 【請求項40】 前記音韻に含まれる撥音および長音に
    ついては、前記単母音音節の場合と同様に取り扱うもの
    とする請求項39記載の基本周波数パタン生成方法。
  41. 【請求項41】 アクセント句の基本周波数を生成する
    基本周波数パタン生成方法であって、 音韻数、アクセント位置のいずれか一方または両方によ
    って分類された音韻に含まれる各音素の時間長によって
    標準化した基本周波数パタンを記憶した基本周波数デー
    タベースを参照することにより各アクセント句の基本周
    波数パタンを設定し、 音素の時間長によって標準化された音韻あるいは音素列
    ごとの基本周波数と上記基本周波数パタンとの差を音韻
    あるいは音素列によって分類して記憶したマイクロプロ
    ソディデータベースから、基本周波数を生成しようとす
    る音素あるいは音韻列に対応する値を得て、その対応す
    る値を前記設定された基本周波数に加算する、又は、前
    記の設定された基本周波数より減算することによって前
    記アクセント句の基本周波数を生成する基本周波数パタ
    ン生成方法。
  42. 【請求項42】 前記基本周波数パタンは、自然に発声
    された音声から抽出されたものである請求項41に記載
    の基本周波数パタン生成方法。
  43. 【請求項43】 前記基本周波数データベースの参照に
    よる設定段階では未設定である基本周波数パタンは、実
    時間軸上の関数により補間するものであり、前記実時間
    軸上の補間が直線補間である請求項41に記載の基本周
    波数パタン生成方法。
  44. 【請求項44】 前記基本周波数データベースの参照に
    よる設定段階では未設定である基本周波数パタンは、実
    時間軸上の関数により補間するものであり、 前記実時間軸上の補間関数が対数周波数軸上の臨界制動
    2次線形系である請求項41に記載の基本周波数パタン
    生成方法。
  45. 【請求項45】 前記マイクロプロソディデータベース
    は音声合成に用いる音声素片と対応づけて記憶されるも
    のとする請求項41に記載の基本周波数パタン生成方
    法。
  46. 【請求項46】 音韻数とアクセント位置によって分類
    された基本周波数パタンを記憶した基本周波数データベ
    ースを用いてアクセント句の基本周波数パタンを生成す
    る基本周波数パタン生成方法であって、 前記基本周波数パタンを生成しようとするアクセント句
    の音韻数およびアクセント型に該当する基本周波数パタ
    ンが、前記基本周波数データベース内に記憶されていな
    い場合であって、しかも、前記の基本周波数を生成しよ
    うとするアクセント句のアクセント位置が、前記基本周
    波数データベースに記憶されている基本周波数のピーク
    を含む音韻位置の次の音韻位置と同一またはそれ以前の
    場合には、 (1)前記の基本周波数を生成しようとするアクセント
    句のアクセント位置と同一のアクセント位置を有する、
    前記基本周波数データベースに記憶された基本周波数パ
    タンであり、且つ前記の基本周波数を生成しようとする
    アクセント句の音韻数に最も近い音韻数に対応する、前
    記基本周波数データベースに記憶された基本周波数パタ
    ンを用い、 (2)第1音韻からアクセント核の次の音韻までの基本
    周波数パタンを、前記基本周波数データベースに記憶さ
    れた基本周波数パタンの第1音韻からアクセント核の次
    の音韻までの基本周波数を適用して生成し、 (3)前記アクセント核から2音韻目より予め定められ
    た4以下の音韻数であるアクセント句末尾の直前の音韻
    までの基本周波数を、前記基本周波数データベースに記
    憶された基本周波数パタンの、(a)前記アクセント核
    から2音韻目とアクセント句末尾との基本周波数、また
    は(b)前記アクセント核の次の音韻とアクセント句末
    尾との基本周波数、または(c)前記アクセント核から
    2音韻目とアクセント句末尾の直前の音韻との基本周波
    数、または(d)前記アクセント核の次の音韻とアクセ
    ント句末尾の直前の音韻との基本周波数、により補間し
    て生成し、 (4)前記の基本周波数を生成しようとするアクセント
    句の前記アクセント句末尾の基本周波数パタンを前記基
    本周波数データベースに記憶された基本周波数パタンの
    アクセント句末尾の音韻の基本周波数を適用することで
    生成する基本周波数パタン生成方法。
  47. 【請求項47】 音韻数とアクセント位置によって分類
    された基本周波数パタンを記憶した基本周波数データベ
    ースを用いてアクセント句の基本周波数パタンを生成す
    る基本周波数パタン生成方法であって、 前記基本周波数パタンを生成しようとするアクセント句
    の音韻数およびアクセント型に該当する基本周波数パタ
    ンが前記の基本周波数データベース内に記憶されていな
    い場合であり、しかも、前記の基本周波数を生成しよう
    とするアクセント句のアクセント位置が、前記基本周波
    数データベースに記憶されている基本周波数のピークを
    含む音韻位置の次の音韻位置より後方でかつ前記のあら
    かじめ定められたアクセント句末尾以前に位置する場合
    には、 (1)前記基本周波数データベースに記憶されている基
    本周波数のピークから2音韻目以降で且つアクセント句
    末尾より前にアクセント核をもつ基本周波数パタンであ
    り、しかも前記の基本周波数を生成しようとするアクセ
    ント句の音韻数に最も近い音韻数に対応する、前記基本
    周波数データベースに記憶された基本周波数パタンを用
    い、 (2)前記の基本周波数を生成しようとするアクセント
    句の第1音韻から前記基本周波数のピークを含む音韻ま
    での基本周波数パタンを、前記基本周波数データベース
    に記憶された基本周波数パタンの第1音韻から前記基本
    周波数のピークを含む音韻までの基本周波数を適用して
    生成し、 (3)前記基本周波数のピークを含む音韻の次の音韻か
    らアクセント核の直前の音韻までの基本周波数を、前記
    基本周波数データベースに記憶された基本周波数パタン
    の、(a)前記基本周波数のピークを含む音韻と、アク
    セント核を含む音韻との基本周波数、又は、(b)前記
    基本周波数のピークを含む音韻と、アクセント核を含む
    音韻の直前の音韻との基本周波数、又は、(c)前記基
    本周波数のピークを含む音韻の次の音韻と、アクセント
    核を含む音韻との基本周波数、又は、(d)前記基本周
    波数のピークを含む音韻の次の音韻と、アクセント核を
    含む音韻の直前の音韻との基本周波数、により補間して
    生成し、 (4)前記の基本周波数を生成しようとするアクセント
    句のアクセント核を含む音韻とその直後の音韻との基本
    周波数を、前記基本周波数データベースに記憶された基
    本周波数パタンのアクセント核を含む音韻とその直後の
    音韻との基本周波数を適用して生成し、 (5)前記アクセント核から2音韻目より予め定められ
    た4以下の音韻数であるアクセント句末尾の直前の音韻
    までの基本周波数を、前記基本周波数データベースに記
    憶された基本周波数パタンの、(a)前記アクセント核
    から2音韻目と、アクセント句末尾との基本周波数、又
    は(b)前記アクセント核の次の音韻とアクセント句末
    尾との基本周波数、又は(c)前記アクセント核から2
    音韻目と、アクセント句末尾の直前の音韻との基本周波
    数、又は(d)前記アクセント核の次の音韻とアクセン
    ト句末尾の直前の音韻との基本周波数、により補間して
    生成し、 (6)前記の基本周波数を生成しようとするアクセント
    句の前記アクセント句末尾の基本周波数パタンを、前記
    基本周波数データベースに記憶された基本周波数パタン
    のアクセント句末尾の音韻の基本周波数を適用すること
    で生成する基本周波数パタン生成方法。
  48. 【請求項48】 音韻数とアクセント位置によって分類
    された基本周波数パタンを記憶した基本周波数データベ
    ースを用いてアクセント句の基本周波数パタンを生成す
    る基本周波数パタン生成方法であって、 前記基本周波数パタンを生成しようとするアクセント句
    の音韻数およびアクセント型に該当する基本周波数パタ
    ンが前記の基本周波数データベース内に記憶されていな
    い場合であり、しかも前記の基本周波数を生成しようと
    するアクセント句のアクセント位置が、前記アクセント
    句末尾の音韻に含まれる場合には、 (1)前記の基本周波数を生成しようとするアクセント
    句の前記アクセント句末尾内でのアクセント位置と前記
    アクセント句末尾内でのアクセント位置とが、同一の、
    前記基本周波数データベースに記憶されている基本周波
    数パタンであり、かつ前記の基本周波数を生成しようと
    するアクセント句の音韻数に最も近い音韻数に対応す
    る、前記基本周波数データベースに記憶された基本周波
    数パタンを用い、 (2)前記の基本周波数を生成しようとするアクセント
    句の第1音韻から前記基本周波数のピークを含む音韻ま
    での基本周波数パタンを、前記基本周波数データベース
    に記憶された基本周波数パタンの第1音韻から前記基本
    周波数のピークを含む音韻までの基本周波数を適用して
    生成し、 (3)前記基本周波数のピークを含む音韻の次の音韻か
    らアクセント核の直前の音韻までの基本周波数を、前記
    基本周波数データベースに記憶された基本周波数パタン
    の、(a)前記基本周波数のピークを含む音韻と、アク
    セント核を含む音韻との基本周波数、又は、(b)前記
    基本周波数のピークを含む音韻と、アクセント核を含む
    音韻の直前の音韻との基本周波数、又は、(c)前記基
    本周波数のピークを含む音韻の次の音韻と、アクセント
    核を含む音韻との基本周波数、又は、(d)前記基本周
    波数のピークを含む音韻の次の音韻と、アクセント核を
    含む音韻の直前の音韻との基本周波数、により補間して
    生成し、 (4)前記の基本周波数を生成しようとするアクセント
    句のアクセント核を含む音韻からアクセント句の最終音
    韻までの基本周波数を、前記基本周波数データベースに
    記憶された基本周波数パタンのアクセント核を含む音韻
    からアクセント句の最終音韻までの基本周波数を適用し
    て生成する基本周波数パタン生成方法。
  49. 【請求項49】 音韻数とアクセント位置によって分類
    された基本周波数パタンを記憶した基本周波数データベ
    ースを用いてアクセント句の基本周波数パタンを生成す
    る基本周波数パタン生成方法であって、 前記基本周波数パタンを生成しようとするアクセント句
    の音韻数およびアクセント型に該当する基本周波数パタ
    ンが前記の基本周波数データベース内に記憶されていな
    い場合であり、しかも、前記の基本周波数を生成しよう
    とするアクセント句のアクセント型が平板型である場合
    には、 (1)前記平板型アクセントでかつ前記の基本周波数を
    生成しようとするアクセント句の音韻数に最も近い音韻
    数に対応する、前記基本周波数データベースに記憶され
    た基本周波数パタンを用い、 (2)第1音韻から基本周波数のピークを含む音韻まで
    の基本周波数パタンを、前記基本周波数データベースに
    記憶された基本周波数パタンの第1音韻から前記基本周
    波数のピークを含む音韻までの基本周波数を適用して生
    成し、 (3)前記基本周波数のピークを含む音韻の次の音韻か
    ら前記のアクセント句末尾または最終音韻の直前までの
    基本周波数を、前記の基本周波数データベースに記憶さ
    れた基本周波数パタンの、(a)基本周波数のピークを
    含む音韻と、アクセント句末尾との又は最終音韻との基
    本周波数、又は(b)基本周波数のピークを含む音韻
    と、アクセント句末尾の又は最終音韻の直前の音韻との
    基本周波数、又は(c)基本周波数のピークを含む音韻
    の次の音韻と、アクセント句末尾との又は最終音韻との
    基本周波数、又は(d)基本周波数のピークを含む音韻
    の次の音韻と、アクセント句末尾の又は最終音韻の直前
    の音韻との基本周波数、により補間して生成し、 (4)前記の基本周波数を生成しようとするアクセント
    句の前記アクセント句末尾または最終音韻の基本周波数
    パタンを、前記基本周波数データベースに記憶された基
    本周波数パタンのアクセント句末尾の音韻または最終音
    韻の基本周波数を適用することで生成する基本周波数パ
    タン生成方法。
  50. 【請求項50】 前記基本周波数パタンは自然に発声さ
    れた音声から抽出されたものである請求項46〜49の
    何れか一つに記載の基本周波数パタン生成方法。
  51. 【請求項51】 前記補間が直線補間である請求項46
    〜49の何れか一つに記載の基本周波数パタン生成方
    法。
  52. 【請求項52】 アクセント句の先頭から前記基本周波
    数のピークまでの基本周波数を、実時間軸上で表現され
    た基本周波数パタンで補間する請求項46〜49の何れ
    か一つに記載の基本周波数パタン生成方法。
  53. 【請求項53】 アクセント句の基本周波数パタンを、
    フレーズ中における前記アクセント句の位置、および、
    そのアクセント句の位置が文末であるか否かによって分
    類して記憶した基本周波数データベースを用いる基本周
    波数パタン生成方法。
  54. 【請求項54】 前記基本周波数データベース中に、基
    本周波数パタンを生成しようとするアクセント句の前記
    フレーズ中の位置、および前記文末であるか否かの分類
    に該当する基本周波数パタンが記憶されていない場合で
    あって、 (1)前記周波数パタンを生成しようとするアクセント
    句のフレーズ中の位置が第3番目以降である場合には、
    前記基本周波数データベース内に前記周波数パタンを生
    成しようとするアクセント句のフレーズ中の位置以降
    で、しかも、前記基本周波数を生成しようとするアクセ
    ント句のフレーズ中の位置に最も近い位置に対応し、し
    かも、文末であるか否かの分類が一致する基本周波数パ
    タンを適用し、 (2)前記周波数パタンを生成しようとするアクセント
    句のフレーズ中の位置以降に、対応する基本周波数パタ
    ンが前記基本周波数データベースに記憶されていない場
    合には、前記基本周波数を生成しようとするアクセント
    句のフレーズ中の位置に最も近い位置に対応し、しか
    も、文末であるか否かの分類が一致する基本周波数パタ
    ンを適用して基本周波数パタンを生成することを特徴と
    する請求項53に記載の基本周波数パタン生成方法。
  55. 【請求項55】 前記基本周波数パタンは自然に発声さ
    れた音声から抽出されたものである請求項53に記載の
    基本周波数パタン生成方法。
  56. 【請求項56】 前記基本周波数データベースに記憶さ
    れた基本周波数パタンは、モーラ数、音節数、アクセン
    ト位置、音韻または音素列のいずれか1つまたは複数の
    基準によって分類されているものとする請求項53に記
    載の基本周波数パタン生成方法。
  57. 【請求項57】 アクセント句の基本周波数パタンを記
    憶した基本周波数データベースを用い、基本周波数パタ
    ンを生成しようとするアクセント句のフレーズ内の位置
    によって前記基本周波数データベースに記憶された基本
    周波数パタンの開始点、ピーク、最小値、アクセント
    核、アクセントの立ち下がり、アクセント句末尾、終了
    点、およびダイナミックレンジのうち1種類あるいは複
    数種類の特性を変更するための基本周波数パタンの変形
    量を記憶した変形データベースを利用する基本周波数パ
    タン生成方法。
  58. 【請求項58】 前記基本周波数を生成しようとするア
    クセント句が、フレーズ中の第1アクセント句である場
    合には、前記基本周波数データベースの対応する基本周
    波数パタンを適用して基本周波数パタンを生成し、 前記基本周波数パタンを生成しようとするアクセント句
    が、フレーズ中の第2アクセント句以降であり、しかも
    文末ではない場合には、前記基本周波数データベースの
    対応する基本周波数パタンを周波数軸上で圧縮して、第
    1アクセント句のアクセント核の次の音韻の基本周波数
    と第2アクセント句以降のアクセント句の基本周波数の
    ピークが等しくなるようにし、 前記基本周波数パタンを生成しようとするアクセント句
    が、フレーズ中の第2アクセント句以降であり、しかも
    文末である場合には、前記の基本周波数データベースの
    対応する基本周波数パタンを周波数軸上で圧縮して、基
    本周波数を生成しようとするアクセント句の直前のアク
    セント句のアクセント核の次の音韻の周波数と文末のア
    クセント句のピークの値が等しくなるようにした請求項
    57記載の基本周波数パタン生成方法。
  59. 【請求項59】 前記基本周波数を生成しようとするア
    クセント句が、フレーズ中の第1アクセント句である場
    合には、前記基本周波数データベースの基本周波数パタ
    ンを変更せず、 前記基本周波数パタンを生成しようとするアクセント句
    がフレーズ中の第2アクセント句以降のアクセント句で
    ある場合には、前記基本周波数データベースの対応する
    基本周波数パタンを周波数軸上で圧縮するものとする請
    求項57記載の基本周波数パタン生成方法。
  60. 【請求項60】 前記基本周波数を生成しようとするア
    クセント句がフレーズ中の第2アクセント句以降のアク
    セント句である場合には、前記基本周波数を生成しよう
    とするアクセント句が属するフレーズ中の、第1アクセ
    ント句のアクセント核の次の音韻の周波数と、前記基本
    周波数を生成しようとするアクセント句の基本周波数の
    ピークが等しくなる様に前記基本周波数データベースの
    対応する基本周波数パタンを圧縮することを特徴とする
    請求項59記載の基本周波数パタン生成方法。
  61. 【請求項61】 前記基本周波数パタンの圧縮は、第1
    アクセント句にアクセント核がなかった場合、50%か
    ら90%の何れかの圧縮率とすることとする請求項58
    に記載の基本周波数パタン生成方法。
  62. 【請求項62】 前記基本周波数パタンの圧縮は、文末
    アクセント句の直前のアクセント句にアクセント核がな
    い場合、前記基本周波数データベースの基本周波数パタ
    ンを40%から80%の何れかの圧縮率とすることを特
    徴とする請求項58に記載の基本周波数パタン生成方
    法。
  63. 【請求項63】 複数のアクセント句が接続されて構成
    されるフレーズの基本周波数パタンを生成する場合、前
    記アクセント句の基本周波数パタンを記憶した基本周波
    数データベースから得られた前記記憶された前記基本周
    波数パタンの、開始点、ピーク、アクセント核、アクセ
    ントの立ち下がり、アクセント句末尾、および終了点の
    内、1種類又は複数種類の特性を、前記アクセント句の
    前記フレーズ内での位置に基づく所定のルールを用いて
    変更する基本周波数パタン生成方法。
  64. 【請求項64】 前記基本周波数パタンのピークを変更
    する際に用いる前記ルールは、 第1アクセント句の基本周波数パタンのピークはそのま
    ま維持し、しかも、他のアクセント句の基本周波数パタ
    ンのピークとしては、それぞれのアクセント句の直前の
    アクセント句の基本周波数のピークに比べて、5%〜4
    0%の何れかの比で低下させた値とするというルールで
    あることを特徴とする請求項63に記載の基本周波数パ
    タン生成方法。
  65. 【請求項65】 前記基本周波数を生成しようとするア
    クセント句が文末に位置する場合、そのアクセント句に
    適用する前記ルールは、 そのアクセント句の直前のアクセント句のピークの基本
    周波数に比べて、10%〜40%の何れかの比で低下さ
    せた値を、前記アクセント句のピークの基本周波数とす
    るというルールである請求項63に記載の基本周波数パ
    タン生成方法。
  66. 【請求項66】 前記基本周波数パタンのアクセント句
    末尾を変更する際に用いる前記ルールは、 第1アクセント句の基本周波数パタンのアクセント句末
    尾の基本周波数はそのまま維持し、しかも、他のアクセ
    ント句の基本周波数パタンのアクセント句末尾の基本周
    波数としては、それぞれ直前のアクセント句のアクセン
    ト句末尾の基本周波数に比べて、5〜40%の何れかの
    比で低下させた値とするというルールであることを特徴
    とする請求項63に記載の基本周波数パタン生成方法。
  67. 【請求項67】 前記基本周波数を生成しようとするア
    クセント句が文末に位置する場合、そのアクセント句に
    適用する前記ルールは、 そのアクセント句の直前のアクセント句の末尾の基本周
    波数に比べて、5〜40%の何れかの比で低下させた値
    を、前記アクセント句の末尾の基本周波数とするという
    ルールであることを特徴とする請求項63記載の基本周
    波数パタン生成方法。
  68. 【請求項68】 前記アクセント句末尾を変更するルー
    ルは、前記基本周波数を生成しようとするアクセント句
    のアクセント型が平板型である場合には適用しないこと
    を特徴とする請求項66記載の基本周波数生成方法。
  69. 【請求項69】 複数のアクセント句が接続されて構成
    されるフレーズの基本周波数パタンを生成する場合、前
    記アクセント句の基本周波数パタンを記憶した基本周波
    数データベースから得られた前記基本周波数パタンの、
    開始点、ピーク、アクセント核、アクセントの立ち下が
    り、アクセント句末尾、および終了点の内、1種類又は
    複数種類の特性を、前記フレーズの所定位置から、基本
    周波数を生成しようとする前記特性を含む音韻の直前ま
    での音韻数に基づく所定のルールを用いて変更する基本
    周波数パタン生成方法。
  70. 【請求項70】 前記基本周波数パタンの前記ピークを
    変更する場合に用いる前記ルールは、 (1−a)前記フレーズ中の第1アクセント句に適用す
    る、前記基本周波数データベースからの基本周波数のピ
    ークはそのまま維持し、且つ、(1−b)前記フレーズ
    中の他のアクセント句の基本周波数パタンのピークに
    は、そのピークを含む音韻が、前記第1アクセント句の
    基本周波数のピークを含む音韻から数えて何番目である
    かのパラメータと、1〜20%の何れかの1音韻あたり
    の低下比率とに基づいて、前記第1アクセント句の前記
    ピークを低下させて得られた値を用い、しかも(2)前
    記基本周波数データベースからの基本周波数パタンを前
    記他のアクセント句に適用する際、その基本周波数パタ
    ンのピークの値に対する、前記音韻数から見て対応する
    位置における前記低下させて得られた値の圧縮率に基づ
    いて、前記適用する基本周波数パタンを周波数軸上で圧
    縮又は伸張するものであることを特徴とする請求項69
    に記載の基本周波数パタン生成方法。
  71. 【請求項71】 前記基本周波数を生成しようとするア
    クセント句が文末に位置する場合、そのアクセント句に
    適用する前記ルールは、 そのアクセント句の直前のアクセント句のピークの基本
    周波数に比べて、10%〜50%の何れかの比で低下さ
    せた値を、そのアクセント句のピークの基本周波数とす
    るというルールであることを特徴とする請求項69記載
    の基本周波数パタン生成方法。
  72. 【請求項72】 前記基本周波数パタンのアクセント句
    末尾を変更する際に用いる前記ルールは、 (1−a)前記フレーズ中の第1アクセント句に適用す
    る、基本周波数データベースからの基本周波数パタンの
    アクセント句末尾の基本周波数はそのまま維持し、且
    つ、(1−b)前記フレーズ中の他のアクセント句の基
    本周波数パタンのアクセント句末尾の基本周波数には、
    そのアクセント句末尾を含む音韻が、前記第1アクセン
    ト句の基本周波数のピークを含む音韻から数えて何番目
    であるかのパラメータと、1〜10%の何れかの1音韻
    あたりの低下比率とに基づいて、前記第1アクセント句
    の末尾を低下させて得られた値を用い、しかも、(2)
    前記基本周波数データベースからの基本周波数パタンを
    前記他のアクセント句に適用する際、その基本周波数パ
    タンのアクセント句末尾の基本周波数の値に対する、前
    記音韻数から見て対応する位置における前記低下させて
    得られた値の圧縮率に基づいて、前記適用する基本周波
    数パタンを周波数軸上で圧縮又は伸張するものであるこ
    とを特徴とする請求項69に記載の基本周波数パタン生
    成方法。
  73. 【請求項73】 前記基本周波数を生成しようとするア
    クセント句が文末に位置する場合、そのアクセント句に
    適用する前記ルールは、 そのアクセント句の直前のアクセント句の末尾の基本周
    波数に比べて、5%〜40%の何れかの比で低下させた
    値を、前記アクセント句の末尾の基本周波数とするとい
    うルールであることを特徴とする請求項69記載の基本
    周波数パタン生成方法。
  74. 【請求項74】 前記基本周波数を生成しようとするア
    クセント句のアクセント型が平板型である場合、前記ア
    クセント句末尾を変更する際に用いるルールを適用しな
    いものとすることを特徴とする請求項72記載の基本周
    波数生成方法。
  75. 【請求項75】 アクセント句ごとに基本周波数パタン
    を生成する基本周波数パタン生成方法であって、 基本周波数パタンを生成しようとするアクセント句のア
    クセントの立ち下がり、アクセント句末尾、および終了
    点のうち、1種類あるいは複数種類の特性を変更するこ
    とにより、前記アクセント句のアクセント句末尾、およ
    び終了点の基本周波数と、前記アクセント句の次のアク
    セント句の開始点の基本周波数との差をあらかじめ定め
    られた閾値以下にすることを特徴とする基本周波数パタ
    ン生成方法。
  76. 【請求項76】 前記閾値は、前記アクセント句とその
    アクセント句の次のアクセント句との間のポーズの時間
    長によって決定されることを特徴とする請求項75記載
    の基本周波数パタン生成方法。
  77. 【請求項77】 前記アクセント句のアクセント句末
    尾、および終了点の基本周波数と、そのアクセント句の
    次のアクセント句の開始点の基本周波数との差の最大値
    は、 (1)前記アクセント句とそのアクセント句の次のアク
    セント句との間にポーズがない場合には、20Hzから
    60Hzの間の値とし、(2)前記ポーズが120msec
    から200msecの間のあらかじめ定められた値以上の場
    合には、アクセントの立ち下がり、アクセント句末尾、
    および終了点のうち、1種類あるいは複数種類の特性に
    ついて、前記アクセント句のアクセント句末尾、および
    終了点の基本周波数と、前記アクセント句の次のアクセ
    ント句の開始点の基本周波数との差をあらかじめ定めら
    れた閾値以下にする様な変更を行わないものとし、
    (3)前記ポーズが前記のあらかじめ定められた値以下
    の場合には、0msecから前記あらかじめ定められた値の
    範囲を1ないし8の区間に分割した区間毎に、前記アク
    セント句のアクセント句末尾、および終了点の基本周波
    数と、前記アクセント句の次のアクセント句の開始点の
    基本周波数との差の最大値として20Hzから120H
    zのあらかじめ定められた値を割り当てることを特徴と
    する請求項76記載の基本周波数パタン生成方法。
  78. 【請求項78】 前記アクセント句のアクセント句末
    尾、および終了点の基本周波数とそのアクセント句の次
    のアクセント句の開始点の基本周波数との差の最大値
    は、前記アクセント句と前記アクセント句の次のアクセ
    ント句との間のポーズの持続時間にたいする一次関数で
    あることを特徴とする請求項76記載の基本周波数パタ
    ン生成方法。
  79. 【請求項79】 前記アクセントの立ち下がり、アクセ
    ント句末尾、および終了点のうち、1種類あるいは複数
    種類の特性の変更は、前記アクセント句の基本周波数パ
    タン中で前記アクセント句の開始点の基本周波数を、前
    記閾値を上回る周波数を持つ点からアクセント句終端ま
    での区間で行われることを特徴とする請求項75記載の
    基本周波数パタン生成方法。
  80. 【請求項80】 前記音韻は、モーラ又は音節であるこ
    とを特徴とする請求項1,6,16,24,41,4
    6,47,48,49,53,57,63,69又は75
    記載の基本周波数パタン生成方法。
  81. 【請求項81】 アクセント句の基本周波数を生成する
    基本周波数パタン生成装置であって、 前記アクセント句の第1音韻、前記基本周波数が最大値
    を示す音韻、アクセント核の音韻とそのアクセント核の
    次の音韻、および末尾の1音韻の内、(1)少なくとも
    何れか一つの音韻の基本周波数パタンを前記音韻の時間
    長によって標準化した基本周波数パタンを記憶した、又
    は、(2)少なくとも何れか一つの音韻に含まれる音素
    の基本周波数パタンを前記音素の時間長によって標準化
    した基本周波数パタンを記憶した基本周波数データベー
    スと、 前記基本周波数を生成しようとするアクセント句の第1
    音韻、前記アクセント句内において基本周波数が最大値
    を示す音韻、前記アクセント句内のアクセント核の音韻
    とそのアクセント核の次の音韻、および前記アクセント
    句の末尾の各音韻の内、(3)全部若しくは一部の音韻
    毎の基本周波数パタンを、又は(4)前記音韻に含まれ
    る音素毎の基本周波数パタンを、前記基本周波数データ
    ベースを参照して設定し、更に、前記基本周波数パタン
    の前記設定の段階において未設定の、前記音韻間又は前
    記音素間の基本周波数パタンを、実時間軸上の関数によ
    り補間する基本周波数パタン生成部と、を備えたことを
    特徴とする基本周波数パタン生成装置。
  82. 【請求項82】 アクセント句の基本周波数を生成する
    基本周波数パタン生成装置であって、 音韻数、アクセント位置のいずれか一方または両方によ
    って分類された音韻に含まれる各音素の時間長によって
    標準化した基本周波数パタンを記憶した基本周波数デー
    タベースと、 音素の時間長によって標準化された音韻あるいは音素列
    ごとの基本周波数と上記基本周波数パタンとの差を音韻
    あるいは音素列によって分類して記憶したマイクロプロ
    ソディデータベースと、 前記基本周波数データベースを参照することにより各ア
    クセント句の基本周波数パタンを設定し、前記マイクロ
    プロソディデータベースから、基本周波数を生成しよう
    とする音素あるいは音韻列に対応する値を得て、その対
    応する値を前記設定された基本周波数に加算する、又
    は、前記の設定された基本周波数より減算することによ
    って前記アクセント句の基本周波数を生成する基本周波
    数パタン生成部と、を備えたことを特徴とする基本周波
    数パタン生成装置。
  83. 【請求項83】 アクセント句の基本周波数パタンを、
    複数のアクセント句が接続されて構成されるフレーズ中
    における前記アクセント句の位置、および、そのアクセ
    ント句の位置が文末であるか否かによって分類し、記憶
    されているアクセント句位置基本周波数データベース
    と、 フレーズを構成するアクセント句の基本周波数パタン
    を、前記アクセント句位置基本周波数データベースを参
    照して設定する基本周波数パタン生成部と、を備えたこ
    とを特徴とする基本周波数パタン生成装置。
  84. 【請求項84】 前記音韻は、モーラ又は音節であるこ
    とを特徴とする請求項81〜83の何れか一つに記載の
    基本周波数パタン生成装置。
  85. 【請求項85】 請求項1、6、16、24、41、4
    6、47、48、49、53、57、63、69、及び
    75の何れか一つに記載の基本周波数パタン生成方法の
    各ステップの全部又は一部をコンピュータにより実行さ
    せるためのプログラムを記録したことを特徴とするプロ
    グラム記録媒体。
JP33321298A 1997-11-28 1998-11-24 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 Expired - Fee Related JP3576840B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP33321298A JP3576840B2 (ja) 1997-11-28 1998-11-24 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体
CNB981269877A CN1220173C (zh) 1997-11-28 1998-11-30 基频特性曲线产生方法
US09/201,298 US6424937B1 (en) 1997-11-28 1998-11-30 Fundamental frequency pattern generator, method and program

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP32777797 1997-11-28
JP16962498 1998-06-17
JP10-169624 1998-06-17
JP9-327777 1998-06-17
JP33321298A JP3576840B2 (ja) 1997-11-28 1998-11-24 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体

Related Child Applications (3)

Application Number Title Priority Date Filing Date
JP2004079113A Division JP3771565B2 (ja) 1997-11-28 2004-03-18 基本周波数パタン生成装置、基本周波数パタン生成方法、及びプログラム記録媒体
JP2004079114A Division JP2004206145A (ja) 1997-11-28 2004-03-18 基本周波数パタン生成方法、及びプログラム記録媒体
JP2004079115A Division JP2004220043A (ja) 1997-11-28 2004-03-18 基本周波数パタン生成方法、及びプログラム記録媒体

Publications (2)

Publication Number Publication Date
JP2000075883A true JP2000075883A (ja) 2000-03-14
JP3576840B2 JP3576840B2 (ja) 2004-10-13

Family

ID=27323205

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33321298A Expired - Fee Related JP3576840B2 (ja) 1997-11-28 1998-11-24 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体

Country Status (3)

Country Link
US (1) US6424937B1 (ja)
JP (1) JP3576840B2 (ja)
CN (1) CN1220173C (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002073595A1 (fr) * 2001-03-08 2002-09-19 Matsushita Electric Industrial Co., Ltd. Dispositif generateur de prosodie, procede de generation de prosodie, et programme
JP2004226505A (ja) * 2003-01-20 2004-08-12 Toshiba Corp ピッチパタン生成方法、音声合成方法とシステム及びプログラム
WO2005119650A1 (ja) * 2004-06-04 2005-12-15 Matsushita Electric Industrial Co., Ltd. 音声合成装置
CN112037816A (zh) * 2020-05-06 2020-12-04 珠海市杰理科技股份有限公司 语音信号频域频率的校正、啸叫检测、抑制方法及装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004027753A1 (en) * 2002-09-17 2004-04-01 Koninklijke Philips Electronics N.V. Method of synthesis for a steady sound signal
US8725518B2 (en) * 2006-04-25 2014-05-13 Nice Systems Ltd. Automatic speech analysis
CN101000766B (zh) * 2007-01-09 2011-02-02 黑龙江大学 基于语调模型的汉语语调基频轮廓生成方法
JP2009042509A (ja) * 2007-08-09 2009-02-26 Toshiba Corp アクセント情報抽出装置及びその方法
JP4455633B2 (ja) * 2007-09-10 2010-04-21 株式会社東芝 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム
US20090216535A1 (en) * 2008-02-22 2009-08-27 Avraham Entlis Engine For Speech Recognition
KR101246287B1 (ko) * 2011-03-28 2013-03-21 (주)클루소프트 음가의 강세를 이용한 발음기관 애니메이션 생성 장치 및 방법
US20130030789A1 (en) * 2011-07-29 2013-01-31 Reginald Dalce Universal Language Translator
CN106373580B (zh) * 2016-09-05 2019-10-15 北京百度网讯科技有限公司 基于人工智能的合成歌声的方法和装置
CN111128116B (zh) * 2019-12-20 2021-07-23 珠海格力电器股份有限公司 一种语音处理方法、装置、计算设备及存储介质
CN113851114B (zh) * 2021-11-26 2022-02-15 深圳市倍轻松科技股份有限公司 语音信号的基频确定方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69028072T2 (de) * 1989-11-06 1997-01-09 Canon Kk Verfahren und Einrichtung zur Sprachsynthese
JP3070127B2 (ja) * 1991-05-07 2000-07-24 株式会社明電舎 音声合成装置のアクセント成分制御方式
JP3344487B2 (ja) 1991-09-30 2002-11-11 日本電信電話株式会社 音声基本周波数パターン生成装置
JP3078073B2 (ja) 1991-12-26 2000-08-21 沖電気工業株式会社 基本周波数パタン生成方法
JP3083640B2 (ja) * 1992-05-28 2000-09-04 株式会社東芝 音声合成方法および装置
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
US5903867A (en) * 1993-11-30 1999-05-11 Sony Corporation Information access system and recording system
JP3450411B2 (ja) * 1994-03-22 2003-09-22 キヤノン株式会社 音声情報処理方法及び装置
JPH086591A (ja) * 1994-06-15 1996-01-12 Sony Corp 音声出力装置
JP3403838B2 (ja) * 1994-10-28 2003-05-06 三菱電機株式会社 句境界確率計算装置および句境界確率利用連続音声認識装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002073595A1 (fr) * 2001-03-08 2002-09-19 Matsushita Electric Industrial Co., Ltd. Dispositif generateur de prosodie, procede de generation de prosodie, et programme
US7200558B2 (en) 2001-03-08 2007-04-03 Matsushita Electric Industrial Co., Ltd. Prosody generating device, prosody generating method, and program
US8738381B2 (en) 2001-03-08 2014-05-27 Panasonic Corporation Prosody generating devise, prosody generating method, and program
JP2004226505A (ja) * 2003-01-20 2004-08-12 Toshiba Corp ピッチパタン生成方法、音声合成方法とシステム及びプログラム
WO2005119650A1 (ja) * 2004-06-04 2005-12-15 Matsushita Electric Industrial Co., Ltd. 音声合成装置
US7526430B2 (en) 2004-06-04 2009-04-28 Panasonic Corporation Speech synthesis apparatus
CN112037816A (zh) * 2020-05-06 2020-12-04 珠海市杰理科技股份有限公司 语音信号频域频率的校正、啸叫检测、抑制方法及装置
CN112037816B (zh) * 2020-05-06 2023-11-28 珠海市杰理科技股份有限公司 语音信号频域频率的校正、啸叫检测、抑制方法及装置

Also Published As

Publication number Publication date
CN1229194A (zh) 1999-09-22
US6424937B1 (en) 2002-07-23
JP3576840B2 (ja) 2004-10-13
CN1220173C (zh) 2005-09-21

Similar Documents

Publication Publication Date Title
JP4302788B2 (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
JP4080989B2 (ja) 音声合成方法、音声合成装置および音声合成プログラム
US7010488B2 (en) System and method for compressing concatenative acoustic inventories for speech synthesis
US20050119890A1 (en) Speech synthesis apparatus and speech synthesis method
US20200365137A1 (en) Text-to-speech (tts) processing
JP2001034283A (ja) 音声合成方法、音声合成装置及び音声合成プログラムを記録したコンピュータ読み取り可能な媒体
JP2002023775A (ja) 音声合成における表現力の改善
JP2000075883A (ja) 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体
JP2003108178A (ja) 音声合成装置及び音声合成用素片作成装置
JP2761552B2 (ja) 音声合成方法
JP5874639B2 (ja) 音声合成装置、音声合成方法及び音声合成プログラム
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JP3437064B2 (ja) 音声合成装置
JP3771565B2 (ja) 基本周波数パタン生成装置、基本周波数パタン生成方法、及びプログラム記録媒体
JP5573529B2 (ja) 音声処理装置およびプログラム
JPH0580791A (ja) 音声規則合成装置および方法
EP1589524B1 (en) Method and device for speech synthesis
JPH08248993A (ja) 音韻時間長制御方法
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JPH11249676A (ja) 音声合成装置
JP2004220043A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体
JP6191094B2 (ja) 音声素片切出装置
JP2004206145A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体
JPH11161297A (ja) 音声合成方法及び装置
JP3515268B2 (ja) 音声合成装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040708

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070716

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080716

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100716

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110716

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110716

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120716

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120716

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 9

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees