JPH09185393A - 音声合成方式 - Google Patents

音声合成方式

Info

Publication number
JPH09185393A
JPH09185393A JP7353395A JP35339595A JPH09185393A JP H09185393 A JPH09185393 A JP H09185393A JP 7353395 A JP7353395 A JP 7353395A JP 35339595 A JP35339595 A JP 35339595A JP H09185393 A JPH09185393 A JP H09185393A
Authority
JP
Japan
Prior art keywords
syllable
voice
voice data
syllables
units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7353395A
Other languages
English (en)
Inventor
Yoshiya Kogure
佳也 小暮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7353395A priority Critical patent/JPH09185393A/ja
Publication of JPH09185393A publication Critical patent/JPH09185393A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】1音節単位の音声データと常用漢字単位で発声
した音声データを登録し、適当に選択し組み合わせ合成
することにより自然に近い任意の単語を合成する。 【解決手段】日本語の複数ある音節を各々1音節単位で
発声した音声データと複数の音節の中からn音節を選
び、全ての組み合わせでn音節単位(nは2以上の整
数)で発声した音声データを記憶媒体に登録し、音声合
成の際に、音声データを組み合わせ、任意単語の音声波
形を合成するものであり、1音節単位の音声データは、
1種類の音節に対し、数種類のアクセント(アクセント
は音声ピッチの高低)で発音した複数の音声データを登
録する。n音節単位の音声データは、各n音節に対し、
アクセントを付ける位置を変えて発声した複数の音声デ
ータを登録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、日本語の音声を合
成する方式に関し、特に録音再生型音声合成装置におい
て、登録した音声を組み合わせ任意の単語を合成する音
声合成方式に関する。
【0002】
【従来の技術】従来の録音再生型音声合成装置において
は、通常、文章を、文節または単語毎に区切って記憶媒
体に予め登録しておき、再生(音声合成)時に、これら
の文節又は単語を組み合わせることにより音声波形を合
成している。
【0003】そして、特に、人名や地名等のように、全
てを登録することが困難な単語については、1音節単位
(あ、い、う、…)の音声データを予め登録しておき、
1音節単位の音声データを組み合わせて列ねることによ
り、単語を合成している。
【0004】また、日本語のアクセントはピッチの変化
であることから、組み合わせた単語にアクセントを付け
るために、1音節につき複数のピッチ(低、高等)の音
節データを予め登録しておき、合成する単語に応じて、
適当なピッチの音節データを選択し、これらの1音節単
位の音声データを組み合わせて音声波形を合成してい
る。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
録音再生型音声合成装置において、人名や地名等を1音
節単位の音声データを組み合わせて音声合成した場合、
たとえ、複数のピッチのデータの中から適切なピッチの
音節データを選択して組み合わせても、各音節がそれぞ
れ独立に発声された単位であるために、連続性の無い不
自然な音声波形が合成出力されてしまうという問題点を
有している。
【0006】従って、本発明は、上記従来技術の問題点
に鑑みて為されたものであって、1音節単位の音声デー
タと好ましくは常用漢字単位で発声した音声データを登
録しておき、これらを適宜選択し組み合わせて合成する
ことにより、自然に近い任意の単語を合成することを可
能とする音声合成方式を提供することを目的とする。
【0007】
【課題を解決するための手段】前記目的を達成するた
め、本発明は、録音再生型の音声合成装置において、日
本語の複数の音節を各々1音節単位で発声してなる音声
データと、前記複数の音節のうちのn音節について所定
の組み合わせにてn音節単位(但し、nは2以上の所定
の整数)で発声してなる音声データと、を記憶手段に予
め登録し、音声合成の際に、前記記憶手段に登録された
前記音声データを組み合わせて任意の単語の音声波形を
合成するようにしたことを特徴とする音声合成方式を提
供する。
【0008】また、本発明は、前記1音節単位の音声デ
ータについては、1種類の音節に対し複数種のアクセン
ト(但し、アクセントは音声ピッチの高低)で発声して
なる複数の音声データを登録し、前記n音節単位の音声
データについては、各n音節に対し、アクセントを付け
る位置を変えて発声してなる複数の音声データを登録す
ることを特徴としたものである。
【0009】そして、本発明においては、好ましくは、
前記第1音節及び前記n音節単位の音声データは常用漢
字単位で用いられる音節に基づいて作成されている。具
体的には、例えば、地名や人名等の漢字1文字に対応す
る発声を1データとして登録する。
【0010】
【発明の実施の形態】本発明の実施の形態について図面
を参照して以下に詳細に説明する。
【0011】図1は、本発明の一実施形態の全体の構成
を示す図であり、本発明に係る音声合成方式が適用され
る録音再生型音声合成装置の典型的な構成を示した図で
ある。図2は、本発明の一実施形態に係る音声合成方式
における音声メモリのデータ構造の一例を示した図であ
る。図3は、本発明の一実施形態による音声合成の一例
を模式的に示した図である。
【0012】図1を参照して、音声合成装置は、ホスト
コンピュータ1からデータを入力する入力部2、CPU
3、音声メモリ4、及び音声合成部5からなる。
【0013】音声メモリ4には、1音節単位(あ、い、
う、…)の音声データと、2音節単位(あい、いう、う
え、…)の音声データと、が記憶格納されている。
【0014】そして、音声データ毎に、互いに異なる識
別番号(ID番号;音声データを一義的に識別するため
の番号)が付されている(図2参照)。
【0015】1音節単位の音声データは、ある一つの音
節に対し、アクセントのある音声データと、アクセント
の無い音声データとがある。1組の2音節(例えば、
「あい」)に対しては、前の音節にアクセントのある組
み合わせ、後ろの音節にアクセントのある組み合わせ、
そしてアクセントの無い組み合わせの3種類の音声デー
タを格納する。
【0016】すなわち、図2を参照して、一音節「み」
について、アクセントの有無に応じて識別番号は“012
3”、“0124”とされ、また2音節「たか」について、
前の音節「た」にアクセントがあるものは識別番号“05
00”、後ろの音節「か」にアクセントがあるものとして
識別番号“0501”、アクセントがない組み合わせについ
ては、識別番号“0502”が付与され、対応する音声デー
タと関連させて音声メモリ4に格納されている。本実施
形態においては、1音節、2音節単位の音声データは、
好ましくは、常用漢字単位で用いられる音節に基づいて
作成される。
【0017】ある単語の音声を合成する際には、まずホ
ストコンピュータ1で予め編集された識別番号の列の情
報が入力部2に入力される。
【0018】CPU3は入力された識別番号に対応する
音声データ(ディジタル信号)を音声メモリ4から読み
出して音声合成部5に供給し、音声合成部5はアナログ
音声波形に変換出力して合成音声を出力する。
【0019】次に、音声データを組み合わせる方法につ
いて説明する。
【0020】図3に示すように、人名の「高橋(たかは
し)」を合成する場合、「か」にアクセントのある2音
節「たか」と、アクセントの無い「はし」を組み合わせ
ると、自然である。
【0021】同じく、「三鷹(みたか)」を合成する場
合は、アクセントの無い1音節「み」と、アクセントの
無い2音節「たか」を組み合わせればよい。
【0022】日本語の1音節の種類は「あ、い、う、
…」に加え、「が、だ、ば、…」の濁音、「ぱ、ぴ、
…」の半濁音、「きゃ、びぃ、ぴゃ、…」の拗音などを
含め合計で百数十種類であり、上記実施形態のように、
全て2音節の組み合わせは、これらの組み合わせで約1
万種類である。
【0023】このため、2音節のある1つの組み合わせ
について3種類のアクセントの音声データとすると、合
計約3万種類の音声を音声メモリに格納することによっ
て、録音再生型の音声合成装置でも、任意の音声をより
自然に近い発音で音声波形を合成することが可能とな
る。
【0024】
【発明の効果】以上説明したように、本発明によれば、
録音再生型音声合成装置に1音節単位の音声データと、
前記1音節単位の音声データを組み合わせたn音節単位
の音声データとを登録し、適当なアクセントの音声デー
タを組み合わせて呼び出し、任意単語の音声波形を合成
することによって、任意の単語をより自然に近い音声で
合成することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る録音再生型音声合成
装置の構成を示す図である。
【図2】本発明の一実施形態における音声メモリのデー
タ格納の状態を示す図である。
【図3】本発明の一実施形態による単語の音声合成の様
子を模式的に示す図である。
【符号の説明】
1 ホストコンピュータ 2 入力部 3 CPU 4 音声メモリ 5 音声合成部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】録音再生型の音声合成装置において、 日本語の複数の音節を各々1音節単位で発声してなる音
    声データと、 前記複数の音節のうちのn音節について所定の組み合わ
    せにてn音節単位(但し、nは2以上の所定の整数)で
    発声してなる音声データと、を記憶手段に予め登録し、 音声合成の際に、前記記憶手段に登録された前記音声デ
    ータを組み合わせて任意の単語の音声波形を合成するよ
    うにしたことを特徴とする音声合成方式。
  2. 【請求項2】前記1音節単位の音声データについては、
    1種類の音節に対し複数種のアクセント(但し、アクセ
    ントは音声ピッチの高低)で発声してなる複数の音声デ
    ータを登録し、 前記n音節単位の音声データについては、各n音節に対
    し、アクセントを付ける位置を変えて発声してなる複数
    の音声データを登録することを特徴とする請求項1記載
    の音声合成方式。
  3. 【請求項3】前記1音節及び/又は前記n音節単位の音
    声データが、常用漢字単位で用いられる音節に基づいて
    作成されていることを特徴とする請求項1又は2記載の
    音声合成方式。
  4. 【請求項4】前記1音節単位の音声データについてはア
    クセントの有無に応じて互いに異なる識別コードが付さ
    れ、前記n音節単位の音声データについては、全音節ア
    クセント無し及びアクセントが付される音節の位置に応
    じて、互いに異なる識別コードが付され、前記音声デー
    タが前記識別コードと対応付けされて前記記憶手段に登
    録されることを特徴とする請求項2記載の音声合成方
    式。
  5. 【請求項5】任意の単語を音声合成する際に、前記任意
    の単語を1音節単位及び/又はn音節単位の列に分解
    し、前記1音節については前記単語の発声時の前記1音
    節のアクセントの有無に基づき前記識別コードを選択
    し、前記n音節については前記単語の発声時の前記n音
    節のアクセント無し又はアクセントの位置に応じて前記
    識別コードを選択し、 前記選択された識別コードを編集してなる識別コード列
    情報に基づき前記記憶手段から対応する音声データを読
    み出し前記任意の単語の音声を合成することを特徴とす
    る請求項4記載の音声合成方式。
JP7353395A 1995-12-28 1995-12-28 音声合成方式 Pending JPH09185393A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7353395A JPH09185393A (ja) 1995-12-28 1995-12-28 音声合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7353395A JPH09185393A (ja) 1995-12-28 1995-12-28 音声合成方式

Publications (1)

Publication Number Publication Date
JPH09185393A true JPH09185393A (ja) 1997-07-15

Family

ID=18430555

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7353395A Pending JPH09185393A (ja) 1995-12-28 1995-12-28 音声合成方式

Country Status (1)

Country Link
JP (1) JPH09185393A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6847932B1 (en) 1999-09-30 2005-01-25 Arcadia, Inc. Speech synthesis device handling phoneme units of extended CV

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6847932B1 (en) 1999-09-30 2005-01-25 Arcadia, Inc. Speech synthesis device handling phoneme units of extended CV

Similar Documents

Publication Publication Date Title
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
US5878393A (en) High quality concatenative reading system
US7233901B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
US6094633A (en) Grapheme to phoneme module for synthesizing speech alternately using pairs of four related data bases
US7454345B2 (en) Word or collocation emphasizing voice synthesizer
USRE39336E1 (en) Formant-based speech synthesizer employing demi-syllable concatenation with independent cross fade in the filter parameter and source domains
JPH0510874B2 (ja)
US6148285A (en) Allophonic text-to-speech generator
US6601030B2 (en) Method and system for recorded word concatenation
JP3518898B2 (ja) 音声合成装置
JPH09185393A (ja) 音声合成方式
JPH08335096A (ja) テキスト音声合成装置
JP3109778B2 (ja) 音声規則合成装置
JP3060276B2 (ja) 音声合成装置
JPS6184771A (ja) 音声入力装置
Gakuru et al. Development of a Kiswahili text to speech system.
JP2894447B2 (ja) 複合音声単位を用いた音声合成装置
JP4026512B2 (ja) 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置
JP2580565B2 (ja) 音声情報辞書作成装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JP2612030B2 (ja) 文章読み上げ装置
JPH11231899A (ja) 音声・動画像合成装置及び音声・動画像データベース
JPH113096A (ja) 音声合成方法及び音声合成システム
JPH02251998A (ja) 音声合成装置
JPS58168096A (ja) 複数言語音声合成装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990622