JPH037995A - 歌音声合成データの作成装置 - Google Patents

歌音声合成データの作成装置

Info

Publication number
JPH037995A
JPH037995A JP1142403A JP14240389A JPH037995A JP H037995 A JPH037995 A JP H037995A JP 1142403 A JP1142403 A JP 1142403A JP 14240389 A JP14240389 A JP 14240389A JP H037995 A JPH037995 A JP H037995A
Authority
JP
Japan
Prior art keywords
data
voice
input
information
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1142403A
Other languages
English (en)
Inventor
Kanji Kunisawa
国澤 寛治
Noboru Uechi
上地 登
Akira Yamamura
山村 彰
Junko Omukai
大向 順子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP1142403A priority Critical patent/JPH037995A/ja
Publication of JPH037995A publication Critical patent/JPH037995A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、音韻情報および韻律情報よりなる音声データ
に基づいて歌音声の規則合成を行う音声合成回路に入力
される歌音声合成データの作成装置に関するものである
[従来の技術] 一般に、音声の規則合成方式は、音韻情報を制御する音
韻パラメータと韻律情報を制御する韻律パラメータを入
力とし、音声学的・言語学的規則に基づいて音声を生成
する方式であって、処理する情報量(外部入力情報、内
部蓄積情報)は非常に少ないにも拘らず、大量の単語や
文章の合成音声を出力することができるようにした音声
合成方式である。
一方、テキスト合成方式は、文字列のみから音声合成を
行なうという究極の音声合成方式であり、文字列から音
韻情報と韻律情報を自動的に作成しそれらの情報に基づ
いて規則合成を行なうことにより実現されるものである
。しかしながら、現在盛んに研究されているものの、合
成音声の品質はまだ低い。
ここで、テキスト合成を、文字列から音韻情報と韻律情
報を自動的に作成し、それらを音声デー夕とし記憶媒体
に記憶させたり、伝送路に出力したりする部分と、記憶
媒体や伝送路から音声データを取り出し、規則合成によ
って音声を出力する部分の2つに分けることが考えられ
、このようにすると合成音声を出力する部分はコンパク
トになる、すなわち、小型、軽量化、低コスト化が図れ
る(特願昭62−263298号参照)。
ところで、歌音声を合成する場合について考えると、こ
の場合の究極の形は、楽譜を入力すると歌音声が出力さ
れるものということになるやこれをテキスト合成方式と
比べると、楽譜の場合は文字列(歌詞)だけでなく、そ
の他の情報も含まれているので韻律情報の生成が容易で
あり、テキスト合成方式よりも簡単な構成で品質も高い
ものが得られることになる(特願昭63−177314
号参照)。
この場合についても、テキスト合成のところで考えたの
と同じように、楽譜から音韻情報と韻律情報を自動的に
作成し、それを音声データとし記憶媒体に記憶させたり
、伝送路に出力したりする部分と、記憶媒体や伝送路か
ら音声データを取り出し、規則合成によって音声を出力
する部分の2つに分けることが考えられる。
さて、楽譜を入力すると歌音声が出力されるものは究極
の形であるが、必ずしもそうとは言えない場合がある。
すなわち、プロの歌手は楽譜から少しずらして歌うこと
によって、より人間味のある芸術性の高い歌になる場合
がある。そこで、楽譜からではなく、実際の歌音声を入
力としてそれから音声データを作成することが考えられ
、特願昭60−138517号の「音声コード作成方法
」を応用することが考えられる。
[発明が解決しようとする課題] すなわち、音声を入力として音声データを作成するなめ
には、各音[なは音節に対する高さデータ、強さデータ
、長さデータが必要(第3図参照)であるので、まず入
力音声のセグメンテーションが必要となる。このセグメ
ンテーションについて考えると、文字列(音韻列)も入
力するので音韻既知のセグメンテーションとなり、音声
認識などで行われる音韻未知のセグメンテーションと比
べると容易である。しかしながら、現在の技術レベルで
はそれでも完全なセグメンテーションが行われるわけで
はなく、その結果として品質の低い音声データを作成す
ることになってしまうという問題があった。また、高さ
のデータを求めるためのピッチ抽出のアルゴリズムも1
00%完全なものはなく、真の値の1/2(半ピツチ)
や2倍(倍ピツチ)の値となることがあり、このことに
よっても品質の低い音声データが作成されるという問題
があった。
本発明は上述の点に鑑みて為されたものであり、その目
的とするところは、歌の実音声に対して精度の高いセグ
メンテーションを行い、その結果として、歌音声の規則
合成器に対して、より品質の高い歌音声を出力させるた
めの音声データを作成する歌音声合成データの作成装置
を提供することにある。
[課題を解決するための手段] 本発明の歌音声合成データの作成装置は、音韻情報およ
び韻律情報よりなる音声データに基づいて歌音声の規則
合成を行う音声合成回路に入力される歌音声合成データ
の作成装置において、入力された楽譜から文字列と、規
則により高さ、強さおよび長さデータを作成する参照デ
ータ作成手段と、上記各データを参照データとして入力
された歌音声のセグメンテーションを行って高さ、強さ
および長さデータを抽出する韻律情報抽出手段とを設け
、上記韻律情報抽出手段にて抽出されたデータを音声デ
ータとして出力するようにしたものである。
[作 用] 本発明は上述のように構成されており、音韻情報および
韻律情報よりなる音声データに基づいて歌音声の規則合
成を行う音声合成回路に入力される歌音声合成データの
作成装置において、入力された楽譜から文字列と、規則
により高さ、強さおよび長さデータを作成し、上記各デ
ータを参照データとして入力された歌音声のセグメンテ
ーションを行って高さ、強さおよび長さデータを抽出し
、抽出されたデータを音声データとして出力するように
したものであり、実際の歌音声に基づいて強さデータと
長さデータを抽出しているので、規則合成方式の音声合
成回路に入力される歌音声合成データとして、自然な歌
音声に対する音声データが得られ、しかも、楽譜から作
成した音声データを参照して歌音声のセグメンテーショ
ンを行って音声データを抽出しているので、高品質の歌
音声を合成できる音声データを簡単な回路構成で、安価
に得られるようになっている。
[実施例コ 第1図は本発明一実施例を示すもので、音韻情報および
韻律情報よりなる音声データに基づいて歌音声の規則合
成を行う音声合成回路に入力される歌音声合成データの
作成装置において、入力された楽譜から文字列と、規則
により高さ、強さおよび長さデータを作成する参照デー
タ作成手段と、上記各データを参照データとして入力さ
れた歌音声のセグメンテーションを行って高さ、強さお
よび長さデータを抽出する韻律情報抽出手段とを設け、
上記韻律情報抽出手段にて抽出されたデータを音声デー
タとして出力するようにしたものである。ここに、参照
データ作成手段は、楽譜の文字列データ、高さデータを
入力するキー人力装置あるいは光学的楽譜読み取り装置
よりなる楽譜入力部1と、入力された楽譜のデータから
規則によって韻律情報を作成する韻律情報作成部2とで
構成されている。
また、マイクロフォンのような歌音声入力部3と、入力
された歌音声の特徴を抽出する特徴抽出部4と、特徴抽
出された歌音声を参照データ作成手段にて作成された各
データを参照して音韻毎に分割するセグメンテーション
処理部5と、分割された各音韻の高さ、強さデータおよ
び長さデータを抽出する韻律情報抽出部6とで構成され
ている。
また、文字列データおよび高さ、強さ、長さデータは、
データを符号化する符号化部7を介して音声データとし
て出力されるようになっている。
いま、参照データ作成手段では、楽譜から音声データと
して音韻情報と韻律情報を作成する。なお、本実施例に
あっては、韻律情報について、強さのデータは不要であ
り高さと長さのデータのみ参照音声データとして作成す
る6次に、韻律情報抽出手段のセグメンテーション処理
部5では、参照音声データを参照して入力された歌音声
のセグメンテーションを行う。この処理は、例えば次の
ようにして行われる。
まず、作成された参照音声データの中の長さに関するデ
ータに基づき、各音韻の境界点を算出し、それによって
得られる音声の長さが入力された歌音声の長さと一致す
るように伸縮させ、それに応じて各音韻の境界点を移動
させる。そのようにして求めた各音韻の境界点の近傍を
入力歌音声のそれに対応した境界点が存在する範囲とし
く第2図参照)、その前後の音韻の性質を考慮して境界
点を決定する。なお、第2図(IL)は楽譜から作成し
た音声データによる各音韻の境界点を示すもので、第2
図(b)は入力される歌音声の長さと合わせるために境
界点を線形伸長させた場合を示すものであり、第2図(
c)はエネルギ、第2図(d)はフォルマント周波数を
示している。
次に、このようにして得られたセグメンテーション結果
から入力された歌音声に対応する音声データの内の長さ
のデータ(例えば各母音、子音の長さ)と強さのデータ
(例えば各モーラの代表点のパワー)を求める。
次に、高さデータを求める。例えば、そのデータを各モ
ーラの代表点のピッチとすると、求める点に対するピッ
チを求める際に、ピッチの探索範囲を楽譜から求めた音
声データによる値の近傍とし、その範囲内で求める。こ
のようにして求めると探索範囲が狭いので、精度も高く
(半ピツチや倍ピツチのエラーがなくなる)、演算も速
くなる。
このようにして求めた入力された歌音声からの韻律情報
と楽譜から求めた音韻情報を音声データとし、記憶媒体
に記憶したり、伝送路に出力しなりして音声合成回路X
の音声データとして使用する。
以上のようにして、実際の歌音声に基づいて作成された
音声データを音声合成回路Xに入力することにより、自
然な歌音声が得られることになる。
また、楽譜から作成した音声データを参照して歌音声の
セグメンテーションを行って音声データを抽出している
ので、高品質の歌音声を合成できる音声データを簡単な
回路構成で、安価に得られるようになっている。
[発明の効果コ 本発明は上述のように構成されており、音韻情報および
韻律情報よりなる音声データに基づいて歌音声の規則合
成を行う音声合成回路に入力される歌音声合成データの
作成装置において、入力された楽譜から文字列と、規則
により高さ、強さおよび長さデータを作成し、上記各デ
ータを参照データとして入力された歌音声のセグメンテ
ーションを行って高さ、強さおよび長さデータを抽出し
、抽出されたデータを音声データとして出力するように
したものであり、実際の歌音声に基づいて強さデータと
長さデータを抽出しているので、規則合成方式の音声合
成回路に入力される歌音声合成データとして、自然な歌
音声に対する音声データが得られ、しかも、楽譜から作
成した音声データを参照して歌音声のセグメンテーショ
ンを行って音声データを抽出しているので、高品質の歌
音声を合成できる音声データを簡単な回路構成で、安価
に得られるという効果がある。
【図面の簡単な説明】
第1図は本発明による歌音声の音声データ作成装置の例
、第2図および第3図は同上の動作説明図である。 Xは音声合成回路、Yは歌音声合成データ作成装置、1
は楽譜入力部、2は韻律情報作成部、3は歌音声入力部
、4は特徴抽出部、5はセグメンテーション処理部、6
は韻律情報抽出部、7は符号化部でる。

Claims (1)

    【特許請求の範囲】
  1. (1)音韻情報および韻律情報よりなる音声データに基
    づいて歌音声の規則合成を行う音声合成回路に入力され
    る歌音声合成データの作成装置において、入力された楽
    譜から文字列と、規則により高さ、強さおよび長さデー
    タを作成する参照データ作成手段と、上記各データを参
    照データとして入力された歌音声のセグメンテーション
    を行って高さ、強さおよび長さデータを抽出する韻律情
    報抽出手段とを設け、上記韻律情報抽出手段にて抽出さ
    れたデータを音声データとして出力するようにしたこと
    を特徴とする歌音声合成データの作成装置。
JP1142403A 1989-06-05 1989-06-05 歌音声合成データの作成装置 Pending JPH037995A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1142403A JPH037995A (ja) 1989-06-05 1989-06-05 歌音声合成データの作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1142403A JPH037995A (ja) 1989-06-05 1989-06-05 歌音声合成データの作成装置

Publications (1)

Publication Number Publication Date
JPH037995A true JPH037995A (ja) 1991-01-16

Family

ID=15314533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1142403A Pending JPH037995A (ja) 1989-06-05 1989-06-05 歌音声合成データの作成装置

Country Status (1)

Country Link
JP (1) JPH037995A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528394U (ja) * 1991-09-25 1993-04-16 有限会社中章技研 録音再生玩具
US5250751A (en) * 1991-07-17 1993-10-05 Kitagawa Industries Co., Ltd. Electromagnetic shielding gasket
US6336092B1 (en) * 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
JP2006030610A (ja) * 2004-07-16 2006-02-02 Yamaha Corp 音声合成用スクリプト生成装置、音声合成装置、音声合成用スクリプト生成プログラム及び音声合成プログラム
US8895938B2 (en) 2006-03-13 2014-11-25 Shoe Care Innovations, Inc. Footwear sanitizing and deodorizing system exposing light-activated photocatalytic oxidation coating

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5250751A (en) * 1991-07-17 1993-10-05 Kitagawa Industries Co., Ltd. Electromagnetic shielding gasket
JPH0528394U (ja) * 1991-09-25 1993-04-16 有限会社中章技研 録音再生玩具
US6336092B1 (en) * 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
JP2006030610A (ja) * 2004-07-16 2006-02-02 Yamaha Corp 音声合成用スクリプト生成装置、音声合成装置、音声合成用スクリプト生成プログラム及び音声合成プログラム
JP4622356B2 (ja) * 2004-07-16 2011-02-02 ヤマハ株式会社 音声合成用スクリプト生成装置及び音声合成用スクリプト生成プログラム
US8895938B2 (en) 2006-03-13 2014-11-25 Shoe Care Innovations, Inc. Footwear sanitizing and deodorizing system exposing light-activated photocatalytic oxidation coating
US9162000B2 (en) 2006-03-13 2015-10-20 Shoe Care Innovations, Inc. Footwear sanitizing and deodorizing system
US9302020B2 (en) 2006-03-13 2016-04-05 Shoe Care Innovations, Inc. Footwear sanitizing and deodorizing system

Similar Documents

Publication Publication Date Title
JP4302788B2 (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
Mache et al. Review on text-to-speech synthesizer
JPH0887296A (ja) 音声合成装置
KR102168529B1 (ko) 인공신경망을 이용한 가창음성 합성 방법 및 장치
JPH037995A (ja) 歌音声合成データの作成装置
JPH0887297A (ja) 音声合成システム
KR0146549B1 (ko) 한국어 텍스트/음성 변환 방법
JPH08335096A (ja) テキスト音声合成装置
Chettri et al. Nepali text to speech synthesis system using ESNOLA method of concatenation
Tsirulnik et al. Singing voice database
JPH06318094A (ja) 音声規則合成装置
JPH037994A (ja) 歌音声合成データの作成装置
JP2703253B2 (ja) 音声合成装置
JPH05224688A (ja) テキスト音声合成装置
KR0173340B1 (ko) 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법
Dessai et al. Development of Konkani TTS system using concatenative synthesis
Kothari et al. A phonetic study for constructing a database of Gujarati characters for speech synthesis of Gujarati text
Lai F0 control model for mandarin singing voice synthesis
JP2003308084A (ja) 音声合成方法および音声合成装置
JPH037996A (ja) 歌音声合成データの作成装置
KR20220125005A (ko) 화자 적합성이 향상된 음성합성 모델 생성방법
JP3308875B2 (ja) 音声合成方法および装置
Narvani et al. Study of Text-to-Speech (TTS) Conversion for Indic Languages
KR100269215B1 (ko) 음성 합성을 위한 발화구의 기본 주파수 궤적 생성 방법