JPH043558B2 - - Google Patents

Info

Publication number
JPH043558B2
JPH043558B2 JP58004892A JP489283A JPH043558B2 JP H043558 B2 JPH043558 B2 JP H043558B2 JP 58004892 A JP58004892 A JP 58004892A JP 489283 A JP489283 A JP 489283A JP H043558 B2 JPH043558 B2 JP H043558B2
Authority
JP
Japan
Prior art keywords
parameter
data
input
circuit
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58004892A
Other languages
Japanese (ja)
Other versions
JPS59128599A (en
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP58004892A priority Critical patent/JPS59128599A/en
Publication of JPS59128599A publication Critical patent/JPS59128599A/en
Publication of JPH043558B2 publication Critical patent/JPH043558B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔技術分野〕 本発明は合成された音声の音程や音量を微妙に
補正できるようにした音声合成装置に関するもの
であつて、音声目覚時計や音声時報装置、音声警
報装置、マツサージ椅子のような各種の電気製品
に組み込まれて音声メツセージの出力を行なうよ
うな用途に使用されるものである。
[Detailed Description of the Invention] [Technical Field] The present invention relates to a speech synthesis device that is capable of subtly correcting the pitch and volume of synthesized speech, and the present invention relates to a speech synthesis device that is capable of subtly correcting the pitch and volume of synthesized speech, and the present invention relates to a speech synthesis device that is capable of subtly correcting the pitch and volume of synthesized speech. It is used for purposes such as being incorporated into various electrical products such as pine chairs and outputting voice messages.

〔背景技術〕[Background technology]

一般に、音声信号を音声周波数よりも高い周波
数のサンプリングパルスにてサンプリングして音
の大小を表す振巾パラメータ(以下、Aパラメー
タと略称する)と、音の高低すなわち基本周期を
表すピツチパラメータ(以下Pパラメータと略称
する)と、音の音色すなわちスペクトル分布を表
わすスペクトルパラメータ(以下Sパラメータと
略称する)とよりなる特徴パラメータを抽出し、
各特徴パラメータをそれぞれ音質に寄与する度合
に応じたビツト数に圧縮して圧縮パラメータとし
てデータ記憶部に記憶し、データ記憶部から順次
読出される圧縮パラメータにて予め各特徴パラメ
ータを記憶させた再生用ROMをアクセスし、再
生用ROMから読み出された特徴パラメータによ
り音源を駆動して音声を再生するようにした音声
合成装置において、音量(振巾)あるいは音程
(ピツチ)が異なる略同一の音声であつても全く
異なる音声を再生する場合と同様に、各音量ある
いは音程の音声に対応した圧縮パラメータをデー
タ記憶部に記憶させておく必要があつた。したが
つて、周囲の騒音の状態あるいは使用者の好みに
応じた音量あるいは音程で音声を再生し得るよう
にするには、各音量あるいは音程の音声に対応し
てそれぞれ圧縮パラメータをデータ記憶部に記憶
させておく必要があり、データ記憶部の記憶容量
を必要以上に大きくしなければならないという欠
点があつた。
In general, the amplitude parameter (hereinafter referred to as A parameter) that represents the magnitude of the sound by sampling the audio signal with a sampling pulse having a frequency higher than the audio frequency, and the pitch parameter (hereinafter referred to as A parameter) that represents the pitch or fundamental period of the sound. Extract characteristic parameters consisting of P parameters (abbreviated as P parameters) and spectral parameters representing the timbre of the sound, that is, spectral distribution (hereinafter abbreviated as S parameters),
Each characteristic parameter is compressed to the number of bits corresponding to the degree of contribution to sound quality and stored in the data storage unit as a compression parameter, and each characteristic parameter is stored in advance as a compression parameter that is sequentially read from the data storage unit. In a speech synthesis device that accesses the playback ROM and drives the sound source using the characteristic parameters read from the playback ROM to reproduce the sound, it is possible to generate almost identical sounds with different volume (width) or pitch (pitch). Even in the case of reproducing completely different sounds, it is necessary to store compression parameters corresponding to each volume or pitch of sound in the data storage unit. Therefore, in order to be able to reproduce audio at a volume or pitch that corresponds to the ambient noise condition or the user's preference, compression parameters must be stored in the data storage unit for each audio volume or pitch. This has the disadvantage that the storage capacity of the data storage unit must be made larger than necessary.

そこで従来、本発明者は特願昭57−41011号の
特許出願に示すように、再生用ROMから読出さ
れた特徴パラメータのうち、振巾パラメータに適
宜音量補正データを加算あるいは減算する音量補
正回路を設けるとともにピツチパラメータに適宜
音程補正データを加算あるいは減算する音程補正
回路を設け、音量補正回路および音程補正回路か
ら出力される補正振巾パラメータおよび補正ピツ
チパラメータに基いて音声を再生するようにした
音声合成装置を開発したものであるが、一般に上
述のような再生用ROMを用いて特徴パラメータ
を再生するようにした音声合成装置においては、
振巾パラメータ、ピツチパラメータ、およびスペ
クトルパラメータが順次時分割的に再生出力され
るようになつており、各パラメータが同時的に処
理されているわけではない。したがつて振巾パラ
メータを補正するための音量補正回路とピツチパ
ラメータを補正するための音程補正回路とを別々
に設けるのは不合理であり、共用化することが望
ましい。
Therefore, as shown in Japanese Patent Application No. 57-41011, the present inventor has developed a volume correction circuit that appropriately adds or subtracts volume correction data to the amplitude parameter among the characteristic parameters read from the playback ROM. and a pitch correction circuit that adds or subtracts pitch correction data as appropriate to the pitch parameter, and reproduces audio based on the corrected amplitude parameter and the corrected pitch parameter output from the volume correction circuit and the pitch correction circuit. We have developed a speech synthesis device, but in general, speech synthesis devices that use the above-mentioned playback ROM to play back feature parameters,
The amplitude parameter, pitch parameter, and spectrum parameter are sequentially reproduced and output in a time-division manner, and each parameter is not processed simultaneously. Therefore, it is unreasonable to separately provide a volume correction circuit for correcting the amplitude parameter and a pitch correction circuit for correcting the pitch parameter, and it is desirable that they be shared.

〔発明の目的〕[Purpose of the invention]

本発明は上述のような点に鑑みて為されたもの
であり、1つのパラメータ補正回路を時分割的に
使用して音量補正回路と音程補正回路とに共用で
きるようにした音声合成装置を提供することを目
的とするものである。
The present invention has been made in view of the above-mentioned points, and provides a speech synthesis device that uses one parameter correction circuit in a time-sharing manner so that it can be shared by a volume correction circuit and a pitch correction circuit. The purpose is to

〔発明の開示〕[Disclosure of the invention]

(構成) 本発明は、第1図のクレーム対応ブロツク図に
示すように、音声信号を音声周波数よりも高い周
波数のサンプリングパルスにてサンプリングして
振巾パラメータA、ピツチパラメータPおよびス
ペクトルパラメータSを抽出し、各パラメータ
A、P、Sをそれぞれ音質に寄与する度合に応じ
たビツト数に圧縮して圧縮パラメータとしてデー
タ記憶部1に記憶し、データ記憶部1から順次読
出される圧縮パラメータにて予め各パラメータ
A、P、Sを記憶させた再生用ROM2をアクセ
スし、再生用ROM2から順次時分割的に読み出
された振巾パラメータA、ピツチパラメータP、
およびスペクトルパラメータSにより音源3を駆
動して音声を合成するようにした音声合成装置に
おいて、上記再生用ROM2から時分割的に読み
出された振巾パラメターAおよびピツチパラメー
タPにそれぞれ適宜補正データを加算あるいは減
算するパラメータ補正回路4と、振巾パラメータ
AおよびピツチパラメータPの補正データをそれ
ぞれ生成する第1および第2の補正データ生成回
路5,6と、再生用ROM2から振巾パラメータ
AおよびピツチパラメータPが読み出されるタイ
ミングにおいてそれぞれ第1および第2の補正デ
ータ生成回路5,6の出力をパラメータ補正回路
4に切換入力する補正データ切換回路7とを設け
たものであり、このように構成することによつて
音程補正回路と音量補正回路とを1つのパラメー
タ補正回路4により共用できるようにしたもので
あり、また補正データ入力用の複数ビツトよりな
る入力端子に各入力を共通に接続された第1およ
び第2のエンコーダと、1ビツトの切換入力端子
にデータ入力を接続されたフリツプフロツプと、
第1および第2のエンコーダの出力にそれぞれの
入力を接続され、フリツプフロツプの出力に応じ
ていずれか一方が入力データのラツチ動作を行な
う第1および第2のラツチ回路とで上記第1およ
び第2の補正データ生成回路を構成し、補正デー
タ入力用の複数ビツトよりなる入力端子も音量補
正データ入力用と音程補正データ入力用とに共用
できるようにしたものであり、さらにフリツプフ
ロツプのデータ入力タイミングを、第1および第
2のラツチ回路が入力データをラツチ動作するタ
イミングよりも若干早いタイミングとし、かつフ
リツプフロツプのデータ入力につながる1ビツト
の切換入力端子を、補正データ入力用の複数ビツ
トよりなる入力端子のうちのいずれか1つと重複
させて、切換入力端子を補正データ入力用の入力
端子と別個に設ける必要がなく、入力端子の個数
を1個節約することができ、入力端子を共用しな
い場合に比べて補正データ入力用の入力端子のビ
ツト数を1ビツト多く確保することができるよう
にしたものである。
(Structure) As shown in the block diagram for responding to complaints in FIG. The parameters A, P, and S are extracted and compressed to the number of bits corresponding to the degree of contribution to sound quality, and stored in the data storage unit 1 as compression parameters. The reproduction ROM 2 in which parameters A, P, and S are stored in advance is accessed, and the amplitude parameter A, pitch parameter P,
In a speech synthesis device that synthesizes speech by driving the sound source 3 using the spectrum parameter S, appropriate correction data is applied to the amplitude parameter A and the pitch parameter P read out in a time-division manner from the playback ROM 2, respectively. A parameter correction circuit 4 that adds or subtracts, first and second correction data generation circuits 5 and 6 that generate correction data for the amplitude parameter A and pitch parameter P, respectively, and A correction data switching circuit 7 is provided which switches and inputs the outputs of the first and second correction data generation circuits 5 and 6 to the parameter correction circuit 4 at the timing when the parameter P is read out, and is configured in this way. In particular, the pitch correction circuit and the volume correction circuit can be shared by one parameter correction circuit 4, and each input is commonly connected to an input terminal consisting of a plurality of bits for inputting correction data. first and second encoders, and a flip-flop having a data input connected to a 1-bit switching input terminal;
first and second latch circuits whose respective inputs are connected to the outputs of the first and second encoders, and one of which performs a latch operation on input data according to the output of the flip-flop; The correction data generation circuit is configured such that the input terminal consisting of multiple bits for inputting correction data can also be used for inputting volume correction data and pitch correction data, and the data input timing of the flip-flop is , the timing is slightly earlier than the timing at which the first and second latch circuits latch input data, and the 1-bit switching input terminal connected to the data input of the flip-flop is replaced with an input terminal consisting of multiple bits for inputting correction data. It is not necessary to provide a switching input terminal separately from the input terminal for inputting correction data, and the number of input terminals can be saved by one, and when the input terminal is not shared. In comparison, the number of bits for the input terminal for inputting correction data can be secured by one bit more.

(実施例) 第2図は本発明の一実施例に係るPARCOR型
の音声合成装置の概略構成を示すブロツク図であ
り、第3図は同上の要部ブロツク図である。
PARCOR型の音声合成方式は第4図に示すよう
に音声信号Vsをサンプリングパルスにより適当
周期toでサンプリングし、サンプリングされたサ
ンプリング値XtとXt−p間にある(p−1)個
のサンプリング値による相関関係を除外し、Xt
とXt−pとの相関関係のみを抽出したPARCOR
係数(部分自己相関係数:以下Kパラメータと略
称する)をSパラメータとして音声を合成するも
のであり、Kパラメータは音声がほぼ定常状態と
みなせる1フレーム(5〜20msec)において、
適当周期to(約100μsec)毎に音声信号Vsのサン
プリングを行ない、隣り合うサンプリング値間の
相関係数をK1とし、複数間隔離れたサンプリン
グ値間では、その間に挾まれたサンプリング値に
よる影響を最小2乗誤差による線形予測によつて
求め、それらを差引いてできる相関係数をK2
K10としたものである。このKパラメータはK1
K2,K3のようにXtに近い点との部分自己相関関
係を表わす係数にはスペクトル分布に関する情報
が豊富に含まれているが、K8,K9,K10のような
Ktから遠い点との部分自己相関係数にはスペク
トル分布に関する情報があまり含まれていないの
で、低次のKパラメータには多数の量子化ビツト
を割り当て、高次のKパラメータには小数の量子
化ビツトを割り当てることによりビツト数を節減
して冗長度を小さくしているものである。したが
つてPARCOR方式はSパラメータとして自己相
関係数を用いて各係数に同一ビツト数を割り当て
るようにした自己相関係数方式に比べて帯域圧縮
率がすぐれているものである。各A,P,Kパラ
メータは圧縮されて記憶され、Aパラメータに対
して5ビツト、Pパラメータに対して6ビツト、
Kパラメータの各係数K1,K2…K10に対して7、
6、5、4、4、4、3、3、3、3ビツトのよ
うに割り当てられる。
(Embodiment) FIG. 2 is a block diagram showing a schematic configuration of a PARCOR type speech synthesizer according to an embodiment of the present invention, and FIG. 3 is a block diagram of the main parts of the same.
As shown in Figure 4, the PARCOR type voice synthesis method samples the voice signal Vs with a sampling pulse at an appropriate period to, and selects (p-1) sampling values between the sampled sampling value Xt and Xt-p. Excluding the correlation due to Xt
PARCOR extracts only the correlation between
Speech is synthesized using coefficients (partial autocorrelation coefficients: hereinafter abbreviated as K parameters) as S parameters.
The audio signal Vs is sampled at appropriate intervals (approximately 100 μsec), the correlation coefficient between adjacent sampling values is set to K 1 , and between sampling values separated by multiple intervals, the influence of the sampling values in between is The correlation coefficient obtained by subtracting the results is obtained by linear prediction using the least squares error, and is calculated as K 2 ~
K10 . This K parameter is K 1 ,
Coefficients representing partial autocorrelation with points close to Xt, such as K 2 and K 3 , contain a wealth of information regarding the spectral distribution, but
Since the partial autocorrelation coefficients with points far from Kt do not contain much information about the spectral distribution, low-order K parameters are assigned a large number of quantization bits, and high-order K parameters are assigned a small number of quantization bits. By allocating bits, the number of bits is reduced and the degree of redundancy is reduced. Therefore, the PARCOR method has a better band compression rate than the autocorrelation coefficient method, which uses autocorrelation coefficients as S-parameters and allocates the same number of bits to each coefficient. Each A, P, K parameter is compressed and stored, 5 bits for the A parameter, 6 bits for the P parameter,
7 for each coefficient K 1 , K 2 ...K 10 of the K parameter,
The bits are allocated as follows: 6, 5, 4, 4, 4, 3, 3, 3, 3 bits.

第2図に示す音声合成装置はデータ記憶部1を
含む制御用IC(A)と音声合成用IC(点線部A,Bを
除いた部分)との2チツプで構成されており、両
者間でビツトシリアルにデータの受渡しを行なう
ようにしているのである。音声の特徴パラメータ
はすべて再生用ROM2内に10ビツトのデータと
して記憶されており、各特徴パラメータに割り当
てられるデータの個数は、その特徴パラメータが
音質に寄与する度合に応じて最適に配分されてい
る。第6図は再生用ROM2内に記憶されたA,
P,K10〜K1の各特徴パラメータのデータ個数を
示している。例えばAパラメータの場合10ビツト
で表現されるデータが32個記録されている。した
がつてAパラメータ任意のデータをアクセスする
ときに必要とされる相対アドレスのビツト数は5
ビツトである。この相対アスは特徴パラメータを
必要最小限に圧縮して表現したものであるので圧
縮パラメータと呼ばれる。これに対して再生用
ROM2の内に記憶されている実際の特徴パラメ
ータは再生パラメータと呼ばれる。上述した所か
ら明らかなように再生パラメータのビツト数は
A,P,K10〜K1の各特徴パラメータについてす
べて共通に10ビツトであるが、圧縮パラメータの
ビツト数はA,P,K10〜K1の各パラメータにつ
いて異なるものであり、それぞれ5、6、3、
3、3、3、4、4、4、5、6、7ビツト(合
計53ビツト)である。そのほか予備エリアとして
3ビツト分すなわちデータ8個分が再生用ROM
2内に確保されている。圧縮パラメータは音声信
号がほぼ定常状態とみなし得る20msec(1フレー
ム)ごとに1組(=53ビツト)抽出されるのであ
るから、高々2650ビツト/秒で音声信号を記録す
ることができ、無音区間やリピート区間をも考慮
に入れると実際には1600ビツト/秒程度で音声信
号を記録することができるものである。
The speech synthesis device shown in Fig. 2 is composed of two chips: a control IC (A) including a data storage section 1 and a speech synthesis IC (excluding the dotted lines A and B). Data is transferred in bit serial format. All audio feature parameters are stored in the playback ROM 2 as 10-bit data, and the number of data assigned to each feature parameter is optimally distributed according to the degree to which that feature parameter contributes to sound quality. . FIG. 6 shows A,
The number of data for each feature parameter P, K10 to K1 is shown. For example, in the case of the A parameter, 32 pieces of data expressed in 10 bits are recorded. Therefore, the number of relative address bits required when accessing any data in the A parameter is 5.
It's bit. This relative assembler is called a compressed parameter because it is expressed by compressing the feature parameter to the necessary minimum. For playback
The actual feature parameters stored in ROM2 are called playback parameters. As is clear from the above, the number of bits of the reproduction parameter is 10 bits in common for each of the feature parameters A, P, K10 to K1 , but the number of bits of the compression parameter is A, P, K10 to K1. They are different for each parameter of K 1 , 5, 6, 3, and
3, 3, 3, 4, 4, 4, 5, 6, 7 bits (53 bits in total). In addition, 3 bits, or 8 pieces of data, are reserved for playback ROM.
It is secured within 2. One set of compression parameters (=53 bits) is extracted every 20 msec (one frame), which can be considered as a steady state of the audio signal, so it is possible to record the audio signal at a rate of at most 2650 bits/second, and there are no silent periods. Taking into account the data rate and repeat section, it is actually possible to record audio signals at a rate of about 1600 bits/second.

データ記憶部1に記憶されている圧縮パラメー
タ(すなわち再生用ROM2の相対アドレス)は
1フレームごとに切換回路8を介してリングレジ
スタ9にビツトシリアルに入力されるものである
が、このような相対アドレスだけで再生用ROM
2から記憶データを取り出すことはできないの
で、インデツクスROM10の中に第7図に示す
ように記憶されている先頭アドレスをアドレスカ
ウンタ11の制御の下に順次取り出して、この先
頭アドレスと上記相対アドレスとを加算回路12
によつて加算することにより再生用ROM2の絶
対アドレス(9ビツト)を計算し、この絶対アド
レスによつて再生ROM2をアクセスするように
している。
The compression parameters (that is, the relative addresses of the playback ROM 2) stored in the data storage section 1 are input bit-serially into the ring register 9 via the switching circuit 8 for each frame. ROM for playback just by address
Since it is not possible to retrieve the stored data from the index ROM 10, the first addresses stored in the index ROM 10 as shown in FIG. Addition circuit 12
The absolute address (9 bits) of the playback ROM 2 is calculated by adding the above, and the playback ROM 2 is accessed using this absolute address.

以下再生用ROM2に記憶されている再生パラ
メータの読み出し動作を説明する。インデツクス
ROM10には圧縮パラメータのビツト配分数を
3ビツトの2進数で記憶させており、再生用
ROM2の記憶容量削減のための共通化ビツトを
1ビツト設けており、さらに再生用ROM2内の
予備エリアに対応する予備ビツトを設けている。
圧縮パラメータのビツト配分数に関するデータは
再生制御回路13に送られ、再生制御回路13
は、該ビツト配分数だけシフトクロツクをリング
レジスタ9に送出する。したがつてリングレジス
タ9からは、上記ビツト配分数に応じて例えばA
パラメータの場合には5ビツト、Pパラメータの
場合には6ビツト、K10パラメータの場合には3
ビツト…、K1パラメータの場合には7ビツトと
いう具合に圧縮パラメータ(相対アドレス)をそ
れぞれ加算回路12にシリアルに送出するもので
ある。リングレジスタ9はできるだけチツプ面積
をとらないようにダイナミツクシフトレジスタで
構成されている。またインデツクスROM10内
に記憶されている各特徴パラメータの再生用
ROM2内における先頭アドレスは、パラレルシ
リアル変換回路14を介して1ビツトずつ順次加
算回路12に送出されるので、順次1ビツトずつ
加算されて絶対アドレスが計算されるものであ
る。計算された直列データの絶対アドレスはシリ
アルパラレル変換回路15を介して並列データに
変換され、再生用ROM2をアクセスできるよう
になつている。
The operation of reading the playback parameters stored in the playback ROM 2 will be explained below. index
The bit allocation number of compression parameters is stored in ROM 10 as a 3-bit binary number, and is used for playback.
One common bit is provided to reduce the storage capacity of the ROM2, and a spare bit corresponding to a spare area in the reproduction ROM2 is also provided.
Data regarding the bit allocation number of compression parameters is sent to the reproduction control circuit 13.
sends the shift clock to the ring register 9 by the number of allocated bits. Therefore, from the ring register 9, for example, A
5 bits for parameters, 6 bits for P parameters, 3 bits for K10 parameters
Compressed parameters (relative addresses) such as bits..., 7 bits in the case of K1 parameters are each serially sent to the adder circuit 12. The ring register 9 is composed of a dynamic shift register so as to occupy as little chip area as possible. Also, for reproducing each feature parameter stored in the index ROM 10.
The leading address in the ROM 2 is sequentially sent one bit at a time to the addition circuit 12 via the parallel/serial conversion circuit 14, so that the absolute address is calculated by sequentially adding one bit at a time. The calculated absolute address of the serial data is converted into parallel data via the serial-parallel conversion circuit 15, so that the reproduction ROM 2 can be accessed.

再生用ROM2から読み出された再生パラメー
タはパラレルシリアル変換回路16にて直列デー
タに変換され、AP可変制御回路17に入力され
る。AP可変制御回路17は、再生用ROM2か
らAパラメータが出力されるタイミングにおいて
はAパラメータに適当な音量補正データを加算あ
るいは減算して補正Aパラメータを出力し、また
再生用ROM2からPパラメータが出力されるタ
イミングにおいては、Pパラメータに適当な音程
補正データを加算あるいは減算して補正Pパラメ
ータを出力するものであるが、再生用ROM2か
らKパラメータが出力されるタイミングにおいて
は、Kパラメータをそのまま通過させるようにな
つている。かかるAP可変制御回路17の具体的
構成および動作については、第3図ブロツク図の
説明において後述する。
The reproduction parameters read from the reproduction ROM 2 are converted into serial data by the parallel-serial conversion circuit 16 and input to the AP variable control circuit 17. The AP variable control circuit 17 adds or subtracts appropriate volume correction data to the A parameter at the timing when the A parameter is output from the playback ROM 2 and outputs the corrected A parameter, and also outputs the P parameter from the playback ROM 2. At the timing when the K parameter is output from the playback ROM 2, the corrected P parameter is output by adding or subtracting appropriate pitch correction data to the P parameter, but at the timing when the K parameter is output from the playback ROM 2, the K parameter is passed through as is. I'm starting to let them do it. The specific configuration and operation of the AP variable control circuit 17 will be described later in the description of the block diagram in FIG.

ところで、補正Aパラメータ、補正Pパラメー
タ、Kパラメータが入力される補間計算回路18
は、1フレーム毎に更新される特徴パラメータの
フレーム間の接続点における不連続な変化による
音声信号の歪み(明瞭下の低下)を防止するもの
で、データ更新の際に特徴パラメータがスムーズ
に変化し得るように1フレーム内の8点において
近似的な直線的補間を行なうようにしている。こ
の補間計算回路18はタイミング制御回路31に
て制御され、タイミング制御回路31では第5図
に示すように1フレーム(20msec)中に8個の
補間用Dクロツク(2.5msec)を発生し、1個の
Dクロツク中に25個のパラメータ読込用Pクロツ
ク(100μsec)、さらに1個のPクロツク中に22個
のビツト読込用Tクロツク(4.5μsec)が作成さ
れている。8個のDクロツクのうち、最初のD1
においてデータ入力端子19からリングレジスタ
9にデータが読み込まれる。各圧縮パラメータ
A,P,K10…,K1は奇数番目のPクロツクで順
次読み込まれるものであり、例えばAパラメータ
はP1区間のT6〜T10の5個のTクロツクで読み込
まれる。偶数番目のPクロツクあるいは上記以外
のTクロツクは補間計算回路18、音源
ROMBB20、デジタルフイルタ21などのタ
イミングとして使用されるものである。上記補間
計算回路18によつて2.5msecごとに新しい値に
更新された各特徴パラメータは、それぞれPラツ
チ22、AKラツチ23に一時的に蓄えられる。
ただし、補間計算に差し当り必要のないパラメー
タはすべてAKパラメータスタツク24に転送し
てデジタルフイルタ21の音声合成用データとし
て蓄積する。
By the way, the interpolation calculation circuit 18 to which the correction A parameter, correction P parameter, and K parameter are input.
This prevents audio signal distortion (decreased clarity) due to discontinuous changes in the connection points between frames of feature parameters that are updated every frame, and ensures that feature parameters change smoothly when data is updated. Approximate linear interpolation is performed at eight points within one frame to make it possible. This interpolation calculation circuit 18 is controlled by a timing control circuit 31, which generates eight interpolation D clocks (2.5 msec) in one frame (20 msec) as shown in FIG. 25 parameter reading P clocks (100 .mu.sec) are created in each D clock, and 22 bit reading T clocks (4.5 .mu.sec) are created in one P clock. First D 1 of 8 D clocks
Data is read into the ring register 9 from the data input terminal 19. Each compression parameter A , P , K 10 . Even-numbered P clocks or T clocks other than those mentioned above are processed by the interpolation calculation circuit 18 and the sound source.
This is used as timing for the ROMBB 20, digital filter 21, etc. Each feature parameter updated to a new value every 2.5 msec by the interpolation calculation circuit 18 is temporarily stored in the P latch 22 and AK latch 23, respectively.
However, all parameters that are not required for the time being for interpolation calculation are transferred to the AK parameter stack 24 and stored as data for speech synthesis in the digital filter 21.

補間計算回路18における補間計算は、リング
レジスタ9内のデータ繰り返し循環させて送出す
ることによつて容易に行なえるようになつてい
る。このリングレジスタ9の動作について説明す
ると、まず補間区間D1のときには、データ入力
端子19からリングレジスタ9内に直列にデータ
を読み込み、また補間区間D2〜D8のときには、
リングレジスタ9内にてサイクリツクにデータを
循環させ、これによつてアドレス計算用の加算回
路12へは1フレームの全補間区間にわたつて常
に同じデータをA,P,K10,K9…,K2,K1
順に繰り返し送出できるようになつている。ゆえ
に補間計算回路12はD1〜D8の補間区間にわた
つて同じデータを同じ順序で8回受けとることに
なる。このように補間計算回路18が繰り返して
8回受け取るデータをaとし、1フレーム前のデ
ータをbとし、補間された値をC1,C2…,C8
すれば次式によつてほぼ近似的に直線補間を行な
うことができるものである。
The interpolation calculation in the interpolation calculation circuit 18 can be easily performed by repeatedly circulating the data in the ring register 9 and sending it out. To explain the operation of the ring register 9, first, during the interpolation interval D1 , data is serially read into the ring register 9 from the data input terminal 19, and during the interpolation interval D2 to D8 ,
The data is cyclically circulated in the ring register 9, so that the same data is always sent to the adder circuit 12 for address calculation over the entire interpolation period of one frame A, P, K 10 , K 9 . . . It is designed so that it can be sent repeatedly in the order of K 2 and K 1 . Therefore, the interpolation calculation circuit 12 receives the same data eight times in the same order over the interpolation interval from D1 to D8 . If the data that the interpolation calculation circuit 18 repeatedly receives eight times in this way is a, the data from one frame before is b, and the interpolated values are C 1 , C 2 . . . , C 8 , then approximately Approximate linear interpolation can be performed.

D1;C1=b D2;C2=C1+(a−C1)×1/8 D3;C3=C2+(a−C2)×1/8 D4;C4=C3+(a−C3)×1/8 D5;C5=C4+(a−C4)×1/4 D6;C6=C5+(a−C5)×1/4 D7;C7=C6+(a−C6)×1/4 D8;C8=C7+(a−C7)×1/2 以上のように、いかなる場合においても1つ前
の補間区間におけるデータを記憶しておきさえす
れば、繰り返し送出されるデータaと共に常に補
間計算を実行することができる。C1乃至C8は具
体的にはA,P,Kの各パラメータを示してい
る。
D 1 ; C 1 = b D 2 ; C 2 = C 1 + (a-C 1 ) x 1/8 D 3 ; C 3 = C 2 + (a- C 2 ) x 1/8 D 4 ; C 4 = C3 +(a- C3 )×1/8 D5 ; C5 = C4 +(a- C4 )×1/4 D6 ; C6 = C5 +(a- C5 )×1 /4 D 7 ; C 7 = C 6 + (a-C 6 ) x 1/4 D 8 ; C 8 = C 7 + (a-C 7 ) x 1/2 As above, in any case 1 As long as the data in the previous interpolation interval is stored, interpolation calculations can always be performed together with the repeatedly sent data a. Specifically, C 1 to C 8 indicate each parameter of A, P, and K.

今、D2の補間区間を例にとつて補間計算の動
作を説明すると、まずP1においてパラレルシリ
アル変換回路16から次のフレームのAパラメー
タの値aが送出されて来るから、AKラツチ23
から1つ前の補間区間D1におけるAパラメータ
C1の値を取り出して、a及びC1から次の補間区
間D2におけるAパラメータの補間値C2を計算す
る。計算結果C2はAKラツチ23を介してパラメ
ータスタツク24に転送蓄積される。このときパ
ラメータスタツク24からはK10パラメータの1
つ前の補間値C1が取り出されAKラツチ23に転
送蓄積される。これらの一連の動作は、Aパラメ
ータがP1において転送されてから、次のPパラ
メータがP3において転送されるまでの間のブラ
ンク期間P2においてなされるものである。以下
同様にしてP3,P5,P7…,P23において転送され
るP,K10,K9…,K1の補間計算処理はP4,P6
P8,P10…,K24の各ブランク期間においてそれ
ぞれ行なわれるものである。したがつてパラメー
タスタツク24ならびにPラツチ22にはD1
D8の各区間ごとに、言い換えれば2.5msecごとに
新しく補間されたパラメータが更新記憶されるこ
とになる。
Now, to explain the operation of interpolation calculation using the interpolation interval of D2 as an example, first, at P1 , the value a of the A parameter of the next frame is sent from the parallel-to-serial conversion circuit 16, so the AK latch 23
A parameter in the interpolation interval D 1 before
The value of C 1 is taken out, and the interpolated value C 2 of the A parameter in the next interpolation interval D 2 is calculated from a and C 1 . The calculation result C2 is transferred to the parameter stack 24 via the AK latch 23 and stored therein. At this time, from parameter stack 24, 1 of K10 parameters
The previous interpolated value C1 is taken out and transferred to and stored in the AK latch 23. These series of operations are performed during a blank period P2 after the A parameter is transferred at P1 until the next P parameter is transferred at P3 . Similarly, the interpolation calculation process of P, K 10 , K 9 ..., K 1 transferred in P 3 , P 5 , P 7 ..., P 23 is performed in P 4 , P 6 ,
This is performed in each blank period of P 8 , P 10 . . . , K 24 , respectively. Therefore, the parameter stack 24 and the P latch 22 have D 1 to
Newly interpolated parameters are updated and stored in each section of D8 , in other words, every 2.5 msec.

Pラツチ22に蓄えられた音声の基本周期に関
するデータすなわちPパラメータは一致回路25
にてPクロツク(100μsec)をカウントするアド
レスカウンタ26の出力がPパラメータに一致し
たとき一致回路25からアドレスカウンタ26を
リセツトするリセツト信号VRが出力される。し
たがつてアドレスカウンタ26はPパラメータに
基いた周期でリセツトされ、この周期で音源
ROM20から音源制御データが順次読み出され
る。この音源制御データにて音声音源27を駆動
して基本周期を有する音声音を発生させる。例え
ばPパラメータが「25」の場合には基本周期が25
×100μsec(400Hz)の有声音が発生されることに
なる。なお、上記音源制御データは原音を周波数
分析して得られる残差波形を再現して音色を忠実
に再生するためのデータである。一方、音声に基
本周期がない場合には、音源制御回路28にて切
換回路29を駆動し、無声音源30に切り換え
る。無声音源30は基本周期を持たせない、ホワ
イトノイズ(白雑音)を発生するものである。次
にAパラメータおよびKパラメータはVCAを具
備したデジタルフイルタ21に供給され、音源回
路より供給(有声音源27あるいは無声音源30
から出力)された信号に振幅の大小およびスペク
トル分布に関する情報を付け加えることにより音
声を再生するものである。なお、第2図において
32はアンプ、33はスピーカ、34は水晶発振
回路であるが、これらは本発明の要旨は直接的に
は関連しないのでその詳細な説明は省略する。
The data regarding the fundamental period of the voice stored in the P latch 22, that is, the P parameter, is sent to the matching circuit 25.
When the output of the address counter 26, which counts P clocks (100 μsec), matches the P parameter, the matching circuit 25 outputs a reset signal V R for resetting the address counter 26. Therefore, the address counter 26 is reset at a cycle based on the P parameter, and the sound source is reset at this cycle.
The sound source control data is sequentially read from the ROM 20. The audio sound source 27 is driven using this sound source control data to generate audio sound having a fundamental period. For example, if the P parameter is "25", the fundamental period is 25
×100μsec (400Hz) voiced sound will be generated. Note that the sound source control data is data for faithfully reproducing the tone by reproducing the residual waveform obtained by frequency analysis of the original sound. On the other hand, if the voice does not have a fundamental period, the sound source control circuit 28 drives the switching circuit 29 to switch to the unvoiced sound source 30. The unvoiced sound source 30 generates white noise without a fundamental period. Next, the A parameter and the K parameter are supplied to a digital filter 21 equipped with a VCA, and then supplied from a sound source circuit (voiced sound source 27 or unvoiced sound source 30).
The audio is reproduced by adding information about the amplitude and spectrum distribution to the signal output from the oscilloscope. In FIG. 2, 32 is an amplifier, 33 is a speaker, and 34 is a crystal oscillation circuit, but since these are not directly related to the gist of the present invention, detailed explanation thereof will be omitted.

以下、AP可変制御回路17の具体回路構成お
よび動作について説明する。第3図はAP可変制
御回路17の具体回路例を示すものである。まず
パラメータ補正回路4は全加算器35と、桁上が
り記憶用のフリツプフロツプ36とから構成され
ており、全加算器35の桁上がり出力Cnはフリ
ツプフロツプ36によつてTクロツク1個分の時
間だけ遅延されて桁上がり入力Cn−1に入力さ
れるようになつている。全加算器35の一方の入
力Aには、再生用ROM2から出力された再生パ
ラメータがパラレルシリアル変換回路16によつ
てTクロツクに同期した直列データに変換されて
入力されるものである。また全加算器35の他方
の入力Bには、補正データ切換回路7からTクロ
ツクに同期して出力される直列データが入力され
るものである。かかるデータの入力は上述のよう
にT5のタイミングから開始されるものであり、
したがつて桁上がり記憶用のフリツプフロツプ3
6はT4のタイミングにおいてリセツトしておく
ものである。PGT0〜PGT3は補正データ入力
用の入力端子であり、このうちPGT3はフリツ
プフロツプ37を切り換えるための切換入力端子
を兼ねている。PGT0〜PGT3に入力された4
ビツトのデジタルデータはデコーダ38にて解読
され、Aエンコーダ39およびPエンコーダ40
に入力される。Aエンコーダ39はPGT0〜
PGT3の入力に対応した音量補正データを出力
するものであリ、またPエンコーダ40はPGT
0〜PGT3の入力に対応した音程補正データを
出力するものである。41および42はAエンコ
ーダ39およびPエンコーダ40の出力を記憶保
持するラツチ回路である。このラツチ回路41お
よび42は音声合成開始時に出力されるREADY
信号の前縁によつてリセツトされ、NOR回路4
3,44の出力がHレベルになつたときにAエン
コーダ39およびPエンコーダ40の出力をそれ
ぞれ記憶保持するものである。フリツプフロツプ
37はラツチ回路41と42のうちいずれを動作
させるかを選択するためのものであり、各ラツチ
回路41,42がラツチ動作を行なうP2・T22
タイミングよりは若干早いP1・T22のタイミング
においてPGT3のデータをデータ入力として読
み込むものである。
The specific circuit configuration and operation of the AP variable control circuit 17 will be described below. FIG. 3 shows a specific circuit example of the AP variable control circuit 17. First, the parameter correction circuit 4 is composed of a full adder 35 and a flip-flop 36 for storing carry, and the carry output Cn of the full adder 35 is delayed by the flip-flop 36 by the time equivalent to one T clock. and is input to carry input Cn-1. One input A of the full adder 35 receives the reproduction parameters outputted from the reproduction ROM 2, which are converted by the parallel-serial conversion circuit 16 into serial data synchronized with the T clock. The other input B of the full adder 35 receives serial data outputted from the correction data switching circuit 7 in synchronization with the T clock. The input of such data starts from the timing of T5 as described above,
Therefore, flip-flop 3 for carry storage
6 is to be reset at the timing of T4 . PGT0 to PGT3 are input terminals for inputting correction data, and among these, PGT3 also serves as a switching input terminal for switching the flip-flop 37. 4 input to PGT0 to PGT3
The bit digital data is decoded by a decoder 38, and then sent to an A encoder 39 and a P encoder 40.
is input. A encoder 39 is PGT0~
It outputs volume correction data corresponding to the input of PGT3, and P encoder 40 outputs volume correction data corresponding to the input of PGT3.
It outputs pitch correction data corresponding to inputs from 0 to PGT3. 41 and 42 are latch circuits that store and hold the outputs of the A encoder 39 and the P encoder 40. These latch circuits 41 and 42 are connected to the READY signal that is output at the start of speech synthesis.
Reset by the leading edge of the signal, NOR circuit 4
When the outputs of encoders 3 and 44 reach H level, the outputs of encoder A 39 and encoder P 40 are stored and held, respectively. The flip-flop 37 is for selecting which of the latch circuits 41 and 42 is to be operated, and the timing of P 1 and T is slightly earlier than the timing of P 2 and T 22 at which each of the latch circuits 41 and 42 performs a latch operation. The data of PGT3 is read as data input at timing 22 .

まずPGT3が1のときにはフリツプフロツプ
37のQ出力は、P1・T22のタイミングにおいて
1となり、出力は0となる。したがつてこのと
きNOR回路44の出力は常に0となり、このた
めラツチ回路42によるラツチ動作は行なわれな
い。一方NOR回路44の出力はNAND回路45
の出力が0になつたときには1となり、このとき
ラツチ回路41によるラツチ動作が行なわれる。
NAND回路45の一方の入力にはD1クロツクが
入力されており、他方の入力にはP2・T22のクロ
ツクが入力されている。したがつてラツチ回路4
1は、D1クロツクにおけるP2クロツクの最後の
タイミングT22において、Aエンコーダ39から
出力される音量補正データをラツチするものであ
る。次にPGT3が0であるときには、フリツプ
フロツプ37のQ出力は、P1・T22のタイミング
において0となり、出力は1となる。したがつ
てこのときNOR回路43の出力は常に0となり、
ラツチ回路42によるラツチ動作は行われない。
一方NOR回路44の出力はNAND回路46の出
力が0になつたときには1となり、このときにラ
ツチ回路42によるラツチ動作が行なわれる。
NAND回路46の一方の入力にはD2クロツクが
入力されており、他方の入力にはP2・T22のクロ
ツクが入力されている。したがつてラツチ回路4
2は、D2クロツクにおけるP2クロツクの最後の
タイミングT22において、Pエンコーダ39から
出力される音程補正データをラツチするものであ
る。したがつてPGT3が1のときには、振巾パ
ラメータAを補正する音量補正データを端子
PGT0〜PGT2から入力することができ、PGT
3が0のときには、ピツチパラメータPを補正す
る音程補正データを端子PGT0〜PGT2から入
力することができるのであり、これによつて入力
端子PGT0〜PGT2を音量補正データの入力用
と音程補正データの入力用とに兼用することがで
きるものである。
First, when PGT3 is 1, the Q output of the flip-flop 37 becomes 1 at the timing P1 · T22 , and the output becomes 0. Therefore, at this time, the output of the NOR circuit 44 is always 0, and therefore the latch operation by the latch circuit 42 is not performed. On the other hand, the output of the NOR circuit 44 is the NAND circuit 45
When the output becomes 0, it becomes 1, and at this time, the latch circuit 41 performs a latch operation.
The D 1 clock is input to one input of the NAND circuit 45, and the P 2 and T 22 clocks are input to the other input. Therefore, latch circuit 4
1 latches the volume correction data output from the A encoder 39 at the last timing T22 of the P2 clock in the D1 clock. Next, when PGT3 is 0, the Q output of the flip-flop 37 becomes 0 at the timing P1 · T22 , and the output becomes 1. Therefore, at this time, the output of the NOR circuit 43 is always 0,
No latch operation is performed by the latch circuit 42.
On the other hand, the output of the NOR circuit 44 becomes 1 when the output of the NAND circuit 46 becomes 0, and at this time the latch operation by the latch circuit 42 is performed.
The D2 clock is input to one input of the NAND circuit 46, and the P2.T22 clock is input to the other input. Therefore, latch circuit 4
2 latches the pitch correction data output from the P encoder 39 at the last timing T22 of the P2 clock in the D2 clock. Therefore, when PGT3 is 1, the volume correction data for correcting the amplitude parameter A is sent to the terminal.
Can be input from PGT0 to PGT2, PGT
3 is 0, the pitch correction data for correcting the pitch parameter P can be input from the terminals PGT0 to PGT2. This allows the input terminals PGT0 to PGT2 to be used for inputting volume correction data and for pitch correction data. It can be used for both input and input purposes.

こうしてラツチ回路41,42にラツチされた
パラレルデータは、偶数番目のPクロツクPevn
の最初のタイミングT1においてパラレルシリア
ル変換回路47,48に入力されて、Tクロツク
に同期したシフトクロツクによりシリアルデータ
に変換されるものである。各パラレルシリアル変
換回路47,48から出力されるシリアルデータ
はそれぞれ補正データ切換回路7を介してパラメ
ータ補正回路4に切換入力される。補正データ切
換回路7にはP2クロツクおよびP4クロツクが切
換タイミング制御信号として入力されており、A
パラメータの補間計算が行なわれるP2クロツク
のタイミングにおいてはパラレルシリアル変換回
路47から出力されるシリアルデータをパラメー
タ補正回路4に入力し、Pパラメータの補間計算
が行なわれるP4クロツクのタイミングにおいて
はパラレルシリアル変換回路48から出力される
シリアルデータをパラメータ補正回路4に入力す
るものである。
The parallel data latched in the latch circuits 41 and 42 is transmitted to the even-numbered P clock Pevn.
The data is input to the parallel-to-serial conversion circuits 47 and 48 at the first timing T1 , and is converted into serial data by a shift clock synchronized with the T clock. The serial data output from each parallel-serial conversion circuit 47, 48 is switched and inputted to the parameter correction circuit 4 via the correction data switching circuit 7, respectively. The P2 clock and P4 clock are input to the correction data switching circuit 7 as switching timing control signals, and the A
The serial data output from the parallel- to -serial conversion circuit 47 is input to the parameter correction circuit 4 at the timing of the P2 clock when the interpolation calculation of parameters is performed, and the serial data output from the parallel to serial conversion circuit 47 is input to the timing of the P4 clock when the interpolation calculation of the P parameters is performed. Serial data output from the serial conversion circuit 48 is input to the parameter correction circuit 4.

ところで上述のようにマニユアル制御によつて
入力端子PGT3を1か0かに切り換える場合に
は、3個の入力端子PGT0〜PGT2を介して音
量補正データまたは音程補正データのいずれかが
3ビツトの情報として入力されるものであるが、
制御用IC(A)内に含まれている制御用CPUを用い
て入力端子PGT3の状態を切換制御する場合に
は、入力端子PGT0〜PGT3を介して音量補正
データおよび音程補正データの両方を同時に同一
のフレーム内で4ビツトの情報として入力するこ
とが可能になる。このようなCPU制御による1
フレーム毎の音量および音程の補正データの入力
を行なうようすれば、音声メツセージの中に現わ
れる単位音節のイントネーシヨンやピツチを微妙
に制御することが可能になるものである。例えば
音声時報装置として用いる場合において、「11時
35分」と報知するときに、単純に「ジユウ」「イ
チ」「ジ」「ニ」「ジユウ」「ゴ」「フン」と各単位
音節を連結させても不自然な再生音しか得られな
いが、CPU制御による1フレーム毎の音量およ
び音程の補正データの入力を行なうようにすれ
ば、上述の「ジユウ」や「イチ」のような各単位
音節を構成する多数個のフレーム毎に音量および
音程を微妙に補正できるので、各単位音節が滑ら
かに連続するように制御することが可能となるも
のである。
By the way, when the input terminal PGT3 is switched between 1 and 0 by manual control as described above, either the volume correction data or the pitch correction data is converted to 3-bit information via the three input terminals PGT0 to PGT2. is input as,
When controlling the state of the input terminal PGT3 using the control CPU included in the control IC (A), both the volume correction data and the pitch correction data are input simultaneously through the input terminals PGT0 to PGT3. It becomes possible to input 4-bit information within the same frame. 1 by CPU control like this
By inputting volume and pitch correction data for each frame, it becomes possible to finely control the intonation and pitch of the unit syllables appearing in the voice message. For example, when used as an audio time signal device, "11 o'clock"
When announcing ``35 minutes,'' simply connecting the unit syllables ``jiyu'', ``ichi'', ``ji'', ``ni'', ``jiyu'', ``go'', and ``fun'' will only produce an unnatural sound. However, if the volume and pitch correction data is input for each frame under CPU control, the volume and pitch can be adjusted for each of the many frames that make up each unit syllable such as "jiyuu" and "ichi" mentioned above. Since the pitch can be subtly corrected, it is possible to control each unit syllable so that it continues smoothly.

以下かかるCPU制御による1フレーム毎の音
量および音程の補正データの入力について説明す
る。上述のようにフリツプフロツプ37は、
P1・T22クロツクのタイミングにおいてのみPGT
3のデータを読み込むものであるから、ラツチ回
路41,42がデータを読み込むP2・T22のタイ
ミングにおいてPGT3の値が変化してもフリツ
プフロツプ37の状態は変化しない。そこで、ま
ずフレームの最初のDクロツクであるD1クロツ
クにおけるP1・T2クロツクのタイミングにおい
て、PGT3の値を1に設定してフリツプフロツ
プ37のを0とし、このD1クロツクにおける
P2・T22のクロツクのタイミングにおいてPGT0
〜PGT3に音量補正データを入力する。次にD2
クロツクにおけるP1・T22クロツクのタイミング
において、PGT3の値を0に設定してフリツプ
フロツプ37のQを0とし、このD2クロツクに
おけるP2・T22クロツクのタイミングにおいて
PGT0〜PGT3に音程補正データを入力する。
このようにすれば、各フレームにおける最初のA
パラメータの補間計算が行なわれるD2・P2クロ
ツクのタイミングよりも早いD1・P2クロツクの
タイミングにおいてAパラメータのそのフレーム
における補正データをラツチ回路41に入力する
ことができ、また各フレームにおける最初のPパ
ラメータの補間計算が行なわれるD2・P4クロツ
クのタイミングよりも早いD2・P2クロツクのタ
イミングにおいてPパラメータのそのフレームに
おける補正データをラツチ回路41に入力するこ
とができるものである。しかもこのラツチ回路4
1,42のデータは次のD1・D2クロツクおよび
D2・P2クロツクのタイミングまでは更新されな
いから、1フレームの間は同じ音量補正データお
よび音程補正データがラツチ回路41,42にお
いて保持されるものである。
Input of volume and pitch correction data for each frame under such CPU control will be explained below. As mentioned above, the flip-flop 37 is
PGT only at the timing of P 1 and T 22 clocks
3, the state of the flip-flop 37 does not change even if the value of PGT3 changes at the timing P2.T22 when the latch circuits 41 and 42 read data. Therefore, first , at the timing of the P1 and T2 clocks in the D1 clock, which is the first D clock of the frame, the value of PGT3 is set to 1, and the flip-flop 37 is set to 0.
PGT0 at the clock timing of P 2 and T 22
~Input the volume correction data to PGT3. then D 2
At the timing of the P 1 and T 22 clocks in the clock, the value of PGT3 is set to 0 to set the Q of the flip-flop 37 to 0, and at the timing of the P 2 and T 22 clocks in this D 2 clock,
Input pitch correction data to PGT0 to PGT3.
In this way, the first A in each frame
The correction data of the A parameter for that frame can be input to the latch circuit 41 at the timing of the D 1 and P 2 clocks that is earlier than the timing of the D 2 and P 2 clocks at which parameter interpolation calculation is performed. The correction data of the P parameter for that frame can be input to the latch circuit 41 at the timing of the D2.P2 clock earlier than the timing of the D2.P4 clock at which the first P parameter interpolation calculation is performed. be. Moreover, this latch circuit 4
The data of 1 and 42 are the following D 1 and D 2 clocks and
Since the data is not updated until the timing of the D 2 and P 2 clocks, the same volume correction data and pitch correction data are held in the latch circuits 41 and 42 for one frame.

ただし、このように入力端子PGT0〜PGT3
の状態を制御用IC(A)内のCPUによつて制御する
ためには、フリツプフロツプ37のデータ読込タ
イミングD1・P1・T22およびD2・P1・T22や、ラ
ツチ回路41,42のデータラツチタイミング
D1・P2・T22およびD2・P2・T22を制御用IC(A)に
同期信号として与える必要がある。第8図回路は
かかる制御用IC(A)に与える同期信号RSTの生成
回路を示すものであり、第9図は上記回路におけ
る各部の動作波形を示している。かかる同期信号
生成回路はタイミング制御回路31内などに設け
られるものであり、、同期信号RSTは音声合成用
IC(点線A、Bを除いた部分)の出力ピンを介し
て制御用IC(A)のCPUに入力されるものである。
第8図に示す同期信号生成回路は、Dフリツプフ
ロツプ49〜57と、NORゲート58〜62と、
インバータ63,64とから構成されており、
READY信号、FRM信号、TM信号、およびT1
クロツクから同期信号RSTを生成するものであ
る。READY信号は音声合成開始時にHレベルと
なる信号であり、FRM信号は1フレームの区間
を示す信号であり、D1・P1・T1クロツクに同期
している。またTM信号はP1・T1クロツクと
P13・T10クロツクのオア信号である。かかる第
8図に示すような同期信号生成回路を用いること
により、D1クロツクのP1、P2とD2クロツクのP1
P2のタイミングを知らせる同期信号RSTが得ら
れるものであり、この同期信号RSTの前縁にて
制御用IC(A)内のCPUをスタートさせれば、フリ
ツプフロツプ37のデータ読込タイミングD1
P1・T22およびD2・P1・T22やラツチ回路41,
42のデータ読込タイミングD1・P2・T22および
D2・P2・T22において、入力端子PGT0〜PGT
3をCPUの側で予めプログラムされた制御状態
に設定することができるものである。
However, if the input terminals PGT0 to PGT3 are
In order to control the state of the flip-flop 37 by the CPU in the control IC (A), the data read timings D 1 , P 1 , T 22 and D 2 , P 1 , T 22 of the flip-flop 37, the latch circuit 41, 42 data latch timing
It is necessary to give D 1 , P 2 , T 22 and D 2 , P 2 , T 22 to the control IC (A) as a synchronization signal. The circuit in FIG. 8 shows a circuit for generating the synchronization signal RST given to the control IC (A), and FIG. 9 shows the operating waveforms of each part in the above circuit. Such a synchronization signal generation circuit is provided in the timing control circuit 31, etc., and the synchronization signal RST is used for speech synthesis.
It is input to the CPU of the control IC (A) via the output pin of the IC (portion excluding dotted lines A and B).
The synchronous signal generation circuit shown in FIG. 8 includes D flip-flops 49 to 57, NOR gates 58 to 62,
It is composed of inverters 63 and 64,
READY signal, FRM signal, TM signal, and T 1
It generates the synchronization signal RST from the clock. The READY signal is a signal that becomes H level at the start of speech synthesis, and the FRM signal is a signal that indicates a section of one frame, and is synchronized with the D1 , P1, and T1 clocks. In addition, the TM signal is the P 1 and T 1 clock.
This is the OR signal for the P 13 and T 10 clocks. By using such a synchronization signal generation circuit as shown in FIG. 8, P 1 , P 2 of the D 1 clock and P 1 , P 2 of the D 2 clock
A synchronizing signal RST that informs the timing of P2 is obtained. If the CPU in the control IC (A) is started at the leading edge of this synchronizing signal RST, the data reading timing D1 of the flip-flop 37 can be determined.
P 1・T 22 and D 2・P 1・T 22 and latch circuit 41,
42 data reading timing D 1 , P 2 , T 22 and
At D 2 , P 2 , and T 22 , input terminals PGT0 to PGT
3 can be set to a preprogrammed control state on the CPU side.

〔発明の効果〕〔Effect of the invention〕

本発明は叙上のように、再生用ROMから順次
時分割的に読み出された振巾パラメータ、ピツチ
パラメータ、およびスペクトルパラメータにより
音源を駆動して音声を合成するようにした音声合
成装置において、上記再生用ROMから時分割的
に読み出された振巾パラメータおよびピツチパラ
メータにそれぞれ適宜適正データを加算あるいは
減算するパラメータ補正回路と、振巾パラメータ
およびピツチパラメータの補正データをそれぞれ
生成する第1および第2の補正データ生成回路
と、再生用ROMから振巾パラメータおよびピツ
チパラメータが読み出されるタイミングにおいて
それぞれ第1および第2の補正データ生成回路の
出力をパラメータ補正回路に切換入力する補正デ
ータ切換回路とを設けたものであるから、再生用
ROMから再生された再生パラメータの値を微妙
に変化させることができ、音程や音量がデータ記
憶部に記憶された音声とは若干異なる音声を合成
することができ、しかも再生用ROMから順次時
分割的に出力されてくる振巾パラメータおよびピ
ツチパラメータに対して同一のパラメータ補正回
路を用いて再生パラメータの補正を行なうことが
できるので、振巾パラメータを補正するための音
量補正回路とピツチパラメータを補正するための
音程補正回路とを兼用することができまた、第1
および第2の補正データ生成回路を、補正データ
入力用の複数ビツトよりなる入力端子に各入力を
共通に接続された第1および第2のエンコーダ
と、1ビツトの切換入力端子にデータ入力を接続
されたフリツプフロツプと、第1および第2のエ
ンコーダの出力にそれぞれの入力を接続され、フ
リツプフロツプの出力に応じていずれか一方が入
力データのラツチ動作を行なう第1および第2の
ラツチ回路とから構成してあるので、補正データ
入力用の複数ビツトよりなる入力端子を音量補正
データ入力用と音程補正データ入力用とに共用す
ることができる。さらに、上記フリツプフロツプ
のデータ入力タイミングを、第1および第2のラ
ツチ回路が入力データをラツチ動作するタイミン
グよりも若干早いタイミングとし、かつフリツプ
フロツプのデータ入力につながる1ビツトの切換
入力端子を、補正データ入力用の複数ビツトより
なる入力端子のうちいずれか1つと重複させてい
るので、切換入力端子を補正データ入力用の入力
端子と別個に設ける必要がなくなり、入力端子の
個数を1個節約することができるものであり、入
力端子を共通しない場合に比べれば補正データ入
力用の入力端子のビツト数を1ビツト多く確保す
ることができるものである。さらにまた第8図実
施例回路に示すような同期信号生成回路を用い
て、制御用ICのCPUに対して、フリツプフロツ
プのデータ読込タイミングやラツチ回路のデータ
ラツチタイミングを知らせる同期信号を送出する
ようにすれば、音声合成用のパラメータが更新さ
れる各フレーム毎に音量補正データおよび音程補
正データを微妙に変化させることができるので、
データ記憶部に予め記憶された単語や文章をその
まま発声するだけでなく、単語のアクセントや文
章のイントネーシヨンなどを制御して、より自然
な音声を合成することができるものである。
As described above, the present invention provides a speech synthesis device that synthesizes speech by driving a sound source using amplitude parameters, pitch parameters, and spectrum parameters that are sequentially read out from a playback ROM in a time-division manner. A parameter correction circuit that adds or subtracts appropriate data to the amplitude and pitch parameters read out in a time-sharing manner from the playback ROM, and a first and second circuit that generates correction data for the amplitude and pitch parameters, respectively. a second correction data generation circuit; and a correction data switching circuit that switches and inputs the outputs of the first and second correction data generation circuits to the parameter correction circuit at the timing when the amplitude parameter and pitch parameter are read from the playback ROM. Because it is equipped with
It is possible to subtly change the values of the playback parameters played from the ROM, and it is possible to synthesize a voice whose pitch and volume are slightly different from the voice stored in the data storage unit. Since the playback parameters can be corrected using the same parameter correction circuit for the amplitude and pitch parameters that are output, the volume correction circuit and pitch parameter can be corrected. It can also be used as a pitch correction circuit for
A second correction data generation circuit is connected to the first and second encoders whose respective inputs are commonly connected to an input terminal consisting of a plurality of bits for inputting correction data, and whose data input is connected to a 1-bit switching input terminal. The first and second latch circuits each have their inputs connected to the outputs of the first and second encoders, and either one of them performs a latch operation on input data depending on the output of the flip-flop. Therefore, the input terminal consisting of a plurality of bits for inputting correction data can be used in common for inputting volume correction data and pitch correction data. Furthermore, the data input timing of the flip-flop is set to be slightly earlier than the timing at which the first and second latch circuits latch the input data, and the 1-bit switching input terminal connected to the data input of the flip-flop is set to receive the correction data. Since it is overlapped with one of the input terminals consisting of multiple bits for input, there is no need to provide a switching input terminal separately from the input terminal for inputting correction data, and the number of input terminals can be saved by one. Compared to the case where the input terminals are not shared, the number of input terminals for inputting correction data can be increased by one bit. Furthermore, a synchronization signal generation circuit as shown in the embodiment circuit of FIG. 8 is used to send a synchronization signal to the CPU of the control IC to notify the data read timing of the flip-flop and the data latch timing of the latch circuit. Then, the volume correction data and pitch correction data can be subtly changed for each frame in which the voice synthesis parameters are updated.
In addition to uttering the words and sentences stored in advance in the data storage unit as they are, it is also possible to synthesize more natural speech by controlling the accent of words and intonation of sentences.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の特許請求の範囲に記載された
基本構成を示すブロツク図、第2図は本発明の一
実施例に係る音声合成装置の全体構成を示すブロ
ツク図、第3図は同上の要部ブロツク図、第4図
は本実施例において用いるPARCOR型音声合成
方式の原理説明図、第5図は同上の動作説明図、
第6図および第7図はそれぞれ同上の再生用
ROM、インデツクスROMの構成を示す図、第
8図は同上に用いる同期信号生成回路のブロツク
図、第9図は同上の動作説明図である。 1はデータ記憶部、2は再生用ROM、3は音
源、4はパラメータ補正回路、5および6は補正
データ生成回路、7は補正データ切換回路、37
はフリツプフロツプ、39はAエンコーダ、40
はPエンコーダ、41,42はラツチ回路、
PGT0〜PGT3は入力端子である。
FIG. 1 is a block diagram showing the basic configuration described in the claims of the present invention, FIG. 2 is a block diagram showing the overall configuration of a speech synthesis device according to an embodiment of the present invention, and FIG. 3 is the same as above. 4 is a diagram explaining the principle of the PARCOR type speech synthesis method used in this embodiment, and FIG. 5 is a diagram explaining the operation of the same as above.
Figures 6 and 7 are for reproduction of the same as above, respectively.
FIG. 8 is a block diagram of a synchronizing signal generation circuit used in the above, and FIG. 9 is an explanatory diagram of the operation of the same. 1 is a data storage unit, 2 is a playback ROM, 3 is a sound source, 4 is a parameter correction circuit, 5 and 6 are correction data generation circuits, 7 is a correction data switching circuit, 37
is a flip-flop, 39 is an A encoder, 40
is a P encoder, 41 and 42 are latch circuits,
PGT0 to PGT3 are input terminals.

Claims (1)

【特許請求の範囲】[Claims] 1 音声信号を音声周波数よりも高い周波数のサ
ンプリングパルスにてサンプリングして振巾パラ
メータ、ピツチパラメータおよびスペクトルパラ
メータを抽出し、各パラメータをそれぞれ音質に
寄与する度合に応じたビツト数に圧縮して圧縮パ
ラメータとしてデータ記憶部に記憶し、データ記
憶部から順次読出される圧縮パラメータにて予め
各パラメータを記憶させた再生用ROMをアクセ
スし、再生用ROMから順次時分割的に読み出さ
れた振巾パラメータ、ピツチパラメータ、および
スペクトルパラメータにより音源を駆動して音声
を合成するようにした音声合成装置において、上
記再生用ROMから時分割的に読み出された振巾
パラメータおよびピツチパラメータにそれぞれ適
宜補正データを加算あるいは減算するパラメータ
補正回路と、振巾パラメータおよびピツチパラメ
ータの補正データをそれぞれ生成する第1および
第2の補正データ生成回路と、再生用ROMから
振巾パラメータおよびピツチパラメータが読み出
されるタイミングにおいてそれぞれ第1および第
2の補正データ生成回路の出力をパラメータ補正
回路に切換入力する補正データ切換回路とを設
け、補正データ入力用の複数ビツトよりなる入力
端子に各入力を共通に接続された第1および第2
のエンコーダと、1ビツトの切換入力端子にデー
タ入力を接続されたフリツプフロツプと、第1お
よび第2のエンコーダの出力にそれぞれの入力を
接続され、フリツプフロツプの出力に応じていず
れか一方が入力データのラツチ動作を行なう第1
および第2のラツチ回路とで上記第1および第2
の補正データ生成回路を構成し、フリツプフロツ
プのデータ入力タイミングを、第1および第2の
ラツチ回路が入力データをラツチ動作するタイミ
ングよりも若干早いタイミングとし、かつフリツ
プフロツプのデータ入力につながる1ビツトの切
換入力端子を、補正データ入力用の複数ビツトよ
りなる入力端子のうちのいずれか1つと重複させ
て成ることを特徴とする音声合成装置。
1 Sampling the audio signal using a sampling pulse with a frequency higher than the audio frequency, extracting the amplitude parameter, pitch parameter, and spectrum parameter, and compressing each parameter to the number of bits depending on the degree to which it contributes to sound quality. The compression parameters are stored as parameters in the data storage unit and sequentially read out from the data storage unit, and the playback ROM in which each parameter is stored in advance is accessed, and the width is sequentially read out from the playback ROM in a time-sharing manner. In a speech synthesizer that synthesizes speech by driving a sound source using parameters, pitch parameters, and spectral parameters, appropriate correction data is applied to the amplitude parameters and pitch parameters read out in a time-sharing manner from the playback ROM, respectively. a parameter correction circuit that adds or subtracts the amplitude parameter, first and second correction data generation circuits that generate correction data for the amplitude parameter and the pitch parameter, respectively, and at the timing when the amplitude parameter and the pitch parameter are read from the playback ROM. A correction data switching circuit is provided for switching and inputting the outputs of the first and second correction data generating circuits to the parameter correction circuit, respectively, and each input is connected to a common input terminal consisting of a plurality of bits for inputting the correction data. 1st and 2nd
encoder, a flip-flop whose data input is connected to a 1-bit switching input terminal, and whose respective inputs are connected to the outputs of the first and second encoders, and depending on the output of the flip-flop, one of the flip-flops is connected to the input data. The first latch action
and a second latch circuit to
The correction data generation circuit is configured such that the data input timing of the flip-flop is slightly earlier than the timing at which the first and second latch circuits latch the input data, and the one-bit switching that leads to the data input of the flip-flop is configured. A speech synthesis device characterized in that an input terminal is overlapped with any one of input terminals consisting of a plurality of bits for inputting correction data.
JP58004892A 1983-01-14 1983-01-14 Voice synthesizer Granted JPS59128599A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58004892A JPS59128599A (en) 1983-01-14 1983-01-14 Voice synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58004892A JPS59128599A (en) 1983-01-14 1983-01-14 Voice synthesizer

Publications (2)

Publication Number Publication Date
JPS59128599A JPS59128599A (en) 1984-07-24
JPH043558B2 true JPH043558B2 (en) 1992-01-23

Family

ID=11596321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58004892A Granted JPS59128599A (en) 1983-01-14 1983-01-14 Voice synthesizer

Country Status (1)

Country Link
JP (1) JPS59128599A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56150799A (en) * 1980-04-24 1981-11-21 Casio Computer Co Ltd Voice synthesizer
JPS5780000A (en) * 1980-11-07 1982-05-19 Nippon Electric Co Voice synthetizer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56150799A (en) * 1980-04-24 1981-11-21 Casio Computer Co Ltd Voice synthesizer
JPS5780000A (en) * 1980-11-07 1982-05-19 Nippon Electric Co Voice synthetizer

Also Published As

Publication number Publication date
JPS59128599A (en) 1984-07-24

Similar Documents

Publication Publication Date Title
US4700393A (en) Speech synthesizer with variable speed of speech
US5321794A (en) Voice synthesizing apparatus and method and apparatus and method used as part of a voice synthesizing apparatus and method
JP3482685B2 (en) Sound generator for electronic musical instruments
JPH043558B2 (en)
JPH0422275B2 (en)
JPS642960B2 (en)
JPS5975294A (en) Music tone synthesizer
JPH0651778A (en) Waveform generating device
JPH0142000B2 (en)
JPS6040636B2 (en) speech synthesizer
JPS6036600B2 (en) speech synthesizer
JPH0325800B2 (en)
US4984496A (en) Apparatus for deriving and replicating complex musical tones
JPS58186800A (en) Voice synthesizer
EP0311225A1 (en) Method and apparatus for deriving and replicating complex musical tones
JPH0141999B2 (en)
JPS61278900A (en) Voice synthesizer
JPH04349499A (en) Voice synthesis system
JPS6040635B2 (en) speech synthesizer
JPH0325799B2 (en)
JPS58158697A (en) Voice synthesizer
JPS6040637B2 (en) speech synthesizer
JPS62100027A (en) Voice coding system
JPS6036597B2 (en) speech synthesizer
JPH035600B2 (en)