JPH02153397A - 音声収録装置 - Google Patents

音声収録装置

Info

Publication number
JPH02153397A
JPH02153397A JP63308137A JP30813788A JPH02153397A JP H02153397 A JPH02153397 A JP H02153397A JP 63308137 A JP63308137 A JP 63308137A JP 30813788 A JP30813788 A JP 30813788A JP H02153397 A JPH02153397 A JP H02153397A
Authority
JP
Japan
Prior art keywords
voice
recording
standard
standard sound
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63308137A
Other languages
English (en)
Other versions
JP2734028B2 (ja
Inventor
Kazuhiko Iwata
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63308137A priority Critical patent/JP2734028B2/ja
Publication of JPH02153397A publication Critical patent/JPH02153397A/ja
Application granted granted Critical
Publication of JP2734028B2 publication Critical patent/JP2734028B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声合成等に用いる音声データを収録するため
の音声収録装置に関する。
〔従来の技術〕
音声合成方式の一つとして、次のようなものが知られて
いる(日本音響学会発行の音声研究会資料記載のrev
、vc波形のピンチ周期的補間による任意語合成方式」
、資料番号582−06 (19B2−4))。
先ず、ピッチ周波数の異なる単音節等を単位音声として
複数種類予め録音しておく。この録音は単位音声を人が
発声することにより行われる。次に、合成する単語や文
書のイントネーションパターンに従って、録音されてい
る単位音声の中から単語等に最も近いピッチ周波数を有
する単位音声を選択し、これらを編集することにより音
声を合成していた。
ここで、予め発声録音されている単位音声のピッチ周波
数を変更せずに最も近いピッチ周波数を有する単位音声
を選択し、これらの単位音声を接続して単語や文章のイ
ントネーションを合成する方式を採っている理由は、予
め発声録音されている単位音声のピッチ周波数を変更す
ると合成音声の音質が著しく劣化するからである。
従って、このような音声合成方式に用いる単位音声とし
ては、必要なピッチ周波数で正確に発声されたものを収
録しておかねばならない。
従来、このような音声合成方式で用いられる単位音声の
収録に4予め定められたピッチ周波数を有する標準音を
発声者に聴取させ、その標準音にできるだけ近いと発声
者が感するピッチ周波数で発声者に発声させ、それを録
音するという装置が用いられていた(特公昭54−52
682号「音声収録装置」)。
〔発明が解決しようとする課題〕 上述した従来の音声収録装置は、発声者に標準音を聴取
させ、発声者の聴覚でピンチ周波数の遠近を判断させる
構造であったため、以下の欠点がある。
(イ)発声者が必要なピッチ周波数を正確に発声するこ
とは困難である。
(ロ)発声者がどの程度標準音に対応して正確に発声し
たかを発声者自身がその場で知ることができないため、
音声収録後、合成時に発声された音声のピッチ周波数を
修正しなくてはならない。この結果、合成音声の品質劣
化は避けることができなかった。また甚だしい場合には
、再度収録を行うといったことが必要であった。
本発明の目的は、上記課題を解決し、音声合成等に用い
る音声データの収録において必要とされる正確なピンチ
周波数を有する音声を収録することを可能にする音声収
録装置を提供することにある。
〔課題を解決するための手段〕
本発明は、予め定められたピンチ周波数を有する標準音
を発声者に聴取させ、この標準音に近いピッチ周波数の
音声を発声させ、この音声を収録する音声収録装置であ
って、 入力されたピッチ周波数を有する前記標準音を生成する
ための標準音生成手段と、 この標準音生成手段で生成された標準音の特徴量を算出
する標準音特徴量算出手段と、前記発声音声の特徴量を
算出する音声時(tajt算出手段と、 この音声特徴量算出手段により算出された音声の特徴量
と前記標準音特徴量算出手段により算出された標準音の
特徴量との間の距離を算出し、この距離が所定の値より
も小さい場合に前記発声音声の収録許可信号を発生する
収録許可信号発生手段と、 前記収録許可信号に基づいて前記音声を収録する録音手
段とを備えていることを特徴とする。
〔作用〕
本発明では、まず必要とされる正確なピッチ周波数を有
する標準音を標準音生成手段により生成して発声者に聴
取させ、同じ高さと思われる音声を発声者に発声させる
。発声された音声を音声時fXkfft算出手段により
分析して音声の持つ特徴量を算出する。算出する特徴量
としては、ピンチ周波数が考えられる。このとき、前記
標準音についても標準音特徴量算出手段を用いて同様の
特徴量を算出する。次に、収録許可信号発生手段により
、前記音声の特徴量と標準音の特徴量とを比較し、2つ
の特徴量の距離を求める。例えば、特徴量としてピンチ
周波数を用いた場合を考えると、音声と標準音の各々の
平均ピッチ周波数を算出し、その差を距離とすることが
できる。このようにして得られた距離を予め定めておい
た闇値と比較し、前記距離が前記闇値よりも小さい場合
にのみ発声された音声を録音手段を用いて収録する。距
離が闇値よりも大きい場合は、距離が闇値よりも小さい
値を取るまで、発声をやり直す。
以上のように、発声された音声の特徴量と標準音の特徴
量との距離を算出し、2つの特徴量の距離が十分に近い
場合にのみ、発声された音声を収録することにより、標
準音を呈示していただけの従来方法に比べ、より正確な
ピッチ周波数を有する音声を確実に収録することが可能
となる。
なお、前記距離を求める際に用いる特@量としてはピッ
チ周波数のほか、パワー(音の強さ)など併せて用いる
ことも可能であり、これらを総合した距離を算出するこ
とは、さらに正確なピッチを有する音声を収録するのに
有効である。
〔実施例〕
本発明の実施例について図面を参照して説明する。
第1図は本発明の一実施例に係る音声収録装置である。
音声収録装置1は、ピッチ周波数入力端子2を有する標
準音生成回路3(標準音生成手段)と、この標準音生成
回路3の出力側に接続された標準音特徴量算出回路4 
(標準音特徴量算出手段)と、マイクロホン5に接続さ
れた音声特@、量算出回路6(音声特徴量算出手段)と
、標準音特@、量算出回路4と音声性微量算出回路の出
力側に接続された収録許可信号発生回路7 (収録許可
信号発生手段)と、スイッチ8を介してマイクロホン5
に接続された録音回路9(録音手段)とを備えている。
標準音声生成回路3は、ピンチ周波数入力端子2から入
力したピンチ周波数aに基づいてこのピッチ周波数aを
有する音声の標準音を生成し、生成した標準音すを標準
音特徴量算出回路4及びレシーバIOに出力する機能を
有する。ここで生成される標準音は、正弦波、矩形波又
は三角波等である。この他にも標準音として合成音声を
用いることも可能である。
標準音特徴量算出回路4は、標準音生成回路3からの標
準音すを入力し、この標準音すのピッチ周波数やパワー
等の特徴量を算出して、標準音すの特徴量を示す情報C
を収録許可信号発生回路7に出力する機能を有する。
音声性微量算出回路6は、マイクロホン5から入力した
音声dのピッチ周波数やパワー等の特徴量を算出して音
声dの特徴量を示す情報eを収録許可信号発生回路7に
出力する機能を有する。
収録許可信号発生回路7は、制御線11を介してスイッ
チ8の開閉制御を行う機能を有する。具体的には、標準
音特徴量算出回路4と音声性微量算出回路6から入力し
た情報cとeに基づいて、情報Cが示す標準音の特徴量
と情fW eが示す音声の特徴量との距離、即ち類似の
度合を算出し、その値が所定の闇値より小さいと判断し
た場合に制御線11を介して制1ffll信号rをスイ
ッチ8に出力してスイッチ8を閉じる機能を有する。
録音回路9は、マイクロホン5から閉状態のスイッチ8
を介して入力した音声dを録音する機能を有する。この
録音回路9としてテープレコーダを用いれば、音声dを
磁気テープに録音することができる。また音声dの信号
をアナログ/ディジタル変換を用いてディジタル信号に
変換し、これをメモリや磁気ディスクに蓄える録音回路
9も可能である。
次に、本実施例に係る音声収録装置の動作について説明
する。
ピンチ周波数入力端子2からピッチ周波数aを入力する
と、標準音生成回路3によってピンチ周波数aを有する
音声の標準音すが生成される。
この標準音すは、標準音特徴量算出回路4に入力され、
標準音特徴量算出回路4は、標準音すの特徴量を示す情
報Cを収録許可信号発生回路7に出力する。また、標準
音すはレシーバ10にも出力されるから、発声者はレシ
ーバ10によってピッチ周波数aの標準音すを聴くこと
ができる。
発声者は、レシーバ10から標準音すを聴取し、そのピ
ッチ周波数aと等しいと思われるピッチ周波数で音声d
を発声する。
発声された音声dはマイクロホン5を介して音声特fa
t算出回路6に入力され、音声特@、量算出回路6は音
声dの特filtを示す情報eを収録許可信号発生回路
7に出力する。
収録許可信号発生回路7に出力した情報Cとeは、その
特徴量を比較される。収録許可信号発生回路7は、これ
らの特徴量の距離が前記闇値よりも大きいと判断した場
合にはスイッチ8を開状態にする制御信号fをスイッチ
8に出力する。従ってこの場合には、音声dは録音回路
9に録音されないため、発声者は再度正確な音声dを発
生する。
一方、特徴量の距離が前記闇値よりも小さいと判断した
場合には、スイッチ8を閉状態にする制御信号fがスイ
ッチ8に出力され、音声dは録音回路9に入力して正確
な音声として録音される。
従って、各種のピンチ周波数の音声を発声者が発声する
ことにより、正確な音声が複数種類にわたって録音回路
9に収録される。
〔発明の効果〕
本発明の音声収録装置は、以上説明したように構成され
ているため、以下の効果がある。
(イ)必要なピッチ周波数を持った音声を、従来方式に
比べより確実に収録することができる。
(ロ)必要なピンチ周波数を持った音声を収録する作業
を、大幅に軽減することができる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る音声収録装置を示すブ
ロック図である。 工・・・・・音声収録装置 3・・・・・標準音生成回路(標準音生成年段) ・・・・・標準音特徴量算出回路(標準音特徴量算出手
段) ・・・・・音声特徴量算出回路(音声特徴量算出手段) ・・・・・収録許可信号発生回路(収録許可信号発生手
段) ・・・・・録音回路(録音手段)

Claims (1)

    【特許請求の範囲】
  1. (1)予め定められたピッチ周波数を有する標準音を発
    声者に聴取させ、この標準音に近いピッチ周波数の音声
    を発声させ、この音声を収録する音声収録装置であって
    、 入力されたピッチ周波数を有する前記標準音を生成する
    ための標準音生成手段と、 この標準音生成手段で生成された標準音の特徴量を算出
    する標準音特徴量算出手段と、 前記発声音声の特徴量を算出する音声特徴量算出手段と
    、 この音声特徴量算出手段により算出された音声の特徴量
    と前記標準音特徴量算出手段により算出された標準音の
    特徴量との間の距離を算出し、この距離が所定の値より
    も小さい場合に前記発声音声の収録許可信号を発生する
    収録許可信号発生手段と、 前記収録許可信号に基づいて前記音声を収録する録音手
    段とを備えていることを特徴とする音声収録装置。
JP63308137A 1988-12-06 1988-12-06 音声収録装置 Expired - Lifetime JP2734028B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63308137A JP2734028B2 (ja) 1988-12-06 1988-12-06 音声収録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63308137A JP2734028B2 (ja) 1988-12-06 1988-12-06 音声収録装置

Publications (2)

Publication Number Publication Date
JPH02153397A true JPH02153397A (ja) 1990-06-13
JP2734028B2 JP2734028B2 (ja) 1998-03-30

Family

ID=17977336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63308137A Expired - Lifetime JP2734028B2 (ja) 1988-12-06 1988-12-06 音声収録装置

Country Status (1)

Country Link
JP (1) JP2734028B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195093A (ja) * 1992-10-01 1994-07-15 Nec Corp 自動音質評価装置
JPH06236198A (ja) * 1993-02-09 1994-08-23 Nec Corp 音質主観評価予測方式
JP2002132287A (ja) * 2000-10-20 2002-05-09 Canon Inc 音声収録方法および音声収録装置および記憶媒体
JP2007256349A (ja) * 2006-03-20 2007-10-04 Oki Electric Ind Co Ltd 音声データ収録システムおよび音声データ収録方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195093A (ja) * 1992-10-01 1994-07-15 Nec Corp 自動音質評価装置
JPH06236198A (ja) * 1993-02-09 1994-08-23 Nec Corp 音質主観評価予測方式
JP2002132287A (ja) * 2000-10-20 2002-05-09 Canon Inc 音声収録方法および音声収録装置および記憶媒体
JP2007256349A (ja) * 2006-03-20 2007-10-04 Oki Electric Ind Co Ltd 音声データ収録システムおよび音声データ収録方法

Also Published As

Publication number Publication date
JP2734028B2 (ja) 1998-03-30

Similar Documents

Publication Publication Date Title
US5704007A (en) Utilization of multiple voice sources in a speech synthesizer
US5828994A (en) Non-uniform time scale modification of recorded audio
US5930755A (en) Utilization of a recorded sound sample as a voice source in a speech synthesizer
HU176776B (en) Method and apparatus for synthetizing speech
JP2005070430A (ja) 音声出力装置および方法
JP2734028B2 (ja) 音声収録装置
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JPH05307395A (ja) 音声合成装置
JPH0549998B2 (ja)
US7130799B1 (en) Speech synthesis method
JP2005523478A (ja) 音声を合成する方法
US20050171777A1 (en) Generation of synthetic speech
JP2001154684A (ja) 話速変換装置
JPH08248993A (ja) 音韻時間長制御方法
JPH0462600B2 (ja)
JPH02293900A (ja) 音声合成装置
JP3022270B2 (ja) フォルマント音源のパラメータ生成装置
JP2840234B2 (ja) 規則による音声合成装置
JPH11161297A (ja) 音声合成方法及び装置
JPH02153398A (ja) 音声収録装置
JP3133347B2 (ja) 韻律制御装置
JPH05173587A (ja) 音声合成装置
KR940011871B1 (ko) Midi와 pcm음원장치를 이용한 음성발생장치
JPH05257494A (ja) 音声規則合成方式
JPS63210898A (ja) 音声合成装置