JPS6057898A - 音声登録方式 - Google Patents

音声登録方式

Info

Publication number
JPS6057898A
JPS6057898A JP58167307A JP16730783A JPS6057898A JP S6057898 A JPS6057898 A JP S6057898A JP 58167307 A JP58167307 A JP 58167307A JP 16730783 A JP16730783 A JP 16730783A JP S6057898 A JPS6057898 A JP S6057898A
Authority
JP
Japan
Prior art keywords
syllable
voice
information
uttered
syllables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58167307A
Other languages
English (en)
Other versions
JPH0546557B2 (ja
Inventor
外川 文雄
充宏 斗谷
岩橋 弘幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP58167307A priority Critical patent/JPS6057898A/ja
Publication of JPS6057898A publication Critical patent/JPS6057898A/ja
Publication of JPH0546557B2 publication Critical patent/JPH0546557B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 本発明は入力された音声を音節毎に認識する日本語音声
入力装置の改良に関し、更に詳細には音節等のより細分
化された単位の特徴を抽出して装置に登録するとき、発
声した音声か不良音声であるか否かを検出して、オペレ
ータに報知するようにしだ音声登録方式の改良に関する
ものである。
〈発明の技術的背景とその問題点〉 一般に音節を単位として入力音声を認識する方式の日本
語音声入力装置においては、入力音声を音節単位にセグ
メント化して音節のセグメンテーションを1行ない、次
に各音節から抽出した特徴パターンを予め登録している
音節標準パターンと比較照合(パターンマツチング)し
て最も類似した標準パターンが属する音節を識別結果と
するように成している。
また、このような装置において、従来は孤立で発声した
単音節、母音と単音節を組みにして発声した音声、また
は予め選定された語句を発声した音声から抽出した単音
節から抽出しだ特徴ノ々ターンを標準パターンとして登
録していた。
しかし、このような従来の音声登録方式においては、抽
出した特徴デターンを標準パターンとして登録するだけ
であり、オペレータとしては登録すべき単音節を含む音
声を適切な発声速度等で発声したか否かを判断すること
が出来なかった。
〈発明の目的〉 本発明は上記諸点に鑑みて成されたものであり、連続音
声の認識に適した音節標準パターンを発声者の音声登録
時の負担を少なくして能率よくスムーズに登録すること
が出来る音声登録方式を提供することを目的とし、この
目的を達成するため、本発明の音声登録方式は、語句を
発声することによりこの発声された音節中に含まれる特
定の音節等の細分化された単位の特徴を抽出して装置に
登録するに際し、発声された音声の韻律情報を検出し、
予め設定された規定の韻律情報と比較して規定外の不良
音声を検出して報知せしめるように構成されており、ま
た本発明の実施例によれば発声された音声のモーラ数(
音節数)、テンポ(発声速度)及び音程(基本周波数)
等の韻律情報を検出し、規定外の不良音声である場合、
規定のモーラ数、テンポ及び音程等をブザー音で出力し
てオペレータに警告すると同時に正しい発声方法を示し
、言い直しを指示するように成されている。
〈発明の実施例〉 以下、本発明の一実施例を図面を参照して詳細に説明す
る。
第1図は本発明の音声登録方式を実施した日本語音声入
力装置の構成を示すブロック図である。
第1図において、1はマイク(図示せず)等によシミ気
信号に変換され発声された入力音声情報を増幅するアン
プであり、このアンプ2の出力はアナログ・ディジタル
変換手段2によってA−D変換され、このA−D変換さ
れた信5・は音響処理部3に入力され、この音響処理部
3で入力音声が分析されて音節のセグメンテーションが
行なわれて音節が抽出され、また入力音声のモーラ数、
テンポ及び音程等の韻律情報及び各音節の特徴−々ター
ン;Pi が検出される。
4は中央演算処理装置(CPU)、5は発声すべき語句
群を語句及びその語句に含まれる音節のうち登録する音
節を指示する情報、更には規定の各韻律情報を記憶した
語句集メモリ、6はこの語句集メモリ5から読出された
一つの語句データを記憶する語句バッファ、7は音節標
準パターンメモリ、8は音節特徴バッファ、9は音声信
号波形バッファ、lOは周波数発生器、11はディジタ
ル・アナログ変換手段、12はアンプ、13はディスプ
レイである。
次に上記の如く構成された装置の動作を第2図に示す動
作フロー図を参照して説明する。
第2図は本発明の音声登録方式の処理フローを示す図で
ある。
装置内の語句集メモリ5は上記したように予め語句と、
その語句に含まれる音節のうち登録する音節を指示する
情報と、その語句の規定の各韻律情報を記憶している。
今、装置に音節標準パターンを登録するため、キーボー
ド(図示せず)等の所定のキー等を操作して装置を登録
モードにすると、ステップn1(第2図)においてCP
U4は語句集メモリ5より発声語句を読み出して登録す
る音節を明示してディスプレイ13上に表示して発声す
る語句をオペレータ(発声者)に指示する。
例えば読み出された発声語句Wi が「山脈」で/さ/
、/みゃ/’、/(、/の3音節を登録する場合につい
て説明する。
まずCPU4は語句集メモリ5より発声語句Wi を読
み出して語句バッフ76に記憶する。
語句集メモリ5には第3図(a)に示すように複数の語
句Wi(i=1〜n)が記憶されており、この語句の内
部フォーマットは第3図(b)に示すように音節数M。
の記憶領域、1f−t’J音節音節明示情報記憶領域、
音節番号Bの記憶領域、標準音節区間長情報Soi の
記憶領域及び標準基本周波数情報foi の記憶領域よ
り構成されており、発声語句Wiが「山脈」で/さ/、
/みや/、/ぐ/の3音節を登録する場合にはモーラ数
(音節数)Mが「4」、登録音節は第1.第3.第4音
節であることをピット1て表わしたデータA= <10110000>、語句を音節番り“で表現したデ
ータB=r11,68,83,8,0.・・・」、各音
節の発声速度に関連した標準音節区間長情報(単位10
m秒) (Sot 、 SO2、Sos 、 SO4s
= ) =(30,30,30,30,・・・〕及び各
音節の標準音程である基本周波数情報(単位Hz ) 
(fo+ hfo2−fos、fo4.−)=(120
,110,115゜1051・・・〕が続いて記憶され
ている。
ステップnlにおいて、まず語句バッフ76に記憶され
る発声語句の語句内部コードWi がロードされ、CP
U4は状態カウンタ(J)を1にセットし、次にデータ
Aの第Jビットが1であるか否かを判定し、判定結果が
1であればシンボル記り、例えば括弧(1)をI;(J
加し、次に音節文字変換を実行する。この変換動作は第
4図に示した音節テーブルメモリに記憶された音節番り
と文字コードの対応データにもとすいて音節番号を文字
コードに変換する。次にJの値を+1してJの値が音節
数Aの値を越えたか否かを判定し、J>Aになるまで上
記の動作を繰返す。またデータAの第JビットがOであ
ればシンボル記号の附加動作の処理を飛ばして、即音節
文字変換を実行する。このような一連の動作によって登
録する音節を明示するシンボル記号を附加したかな文字
コード列が作成され、そのかな文字コード列が出力され
て、音節を記号(1)でくくって第5図に示すように明
示してディスプレイ13に表示して発声する語句全オペ
レータに指示する。
なお、上記の例では登録する音節を明示する記りDは括
弧としているが、これに限定されるものではなく、鍵括
弧、アンダーライン等の他の記号、または登録音節をグ
レイ表示゛または異なるカラーで表示する等、登録する
音節を他の音節と区別して明示し得るものであれば良い
次にオペレータ(発声者)はディスプレイ13上の表示
を見て/さんみゃ〈/と発声する(n2)と、この音声
はマイク14によって電気信りに変換され、アンプ1で
増幅された後、アナログ・ディジタル変換手段2でA−
D変換されて音響処理j143に入力される。
音響処理部3はディジタル変換された入力腎−を分析し
て音節を抽出しく 113 )、次に各音節の特徴パタ
ーンを抽出しくn4)、次にモーラ数(音節数)、テン
ポ(発声速度)等を検出して、これらの特徴量を音節特
徴バッファ8に一時記憶する。また検出したモーラ数、
テンポ等について、語句集メモリ5に記憶された規定の
モーラ数、標準音節区間長等と比較して、モーラ数は正
しいか、テンポは規定範囲かを判定して(n 5 r 
n 6 )、もし規定範囲外の音声であれば、その語句
(山脈)の正しい韻律情報(正しいモーラ数、標準のテ
ンポ等)をD/A変換手段11を介してブザー音として
スピーカ15に詐告音(117)を発生する。
これによって、オペレータに轡告すると同時に正しい発
声方法をブザー音によって教えて言い直しを指示するこ
とになる。
mlf」!4青5んのA金山について今少1−緒明する
と、語句を発声した音声から音節のセグメンテーション
によって音節を抽出し、その音節列から音節数(モーラ
数)Mと発声速度(テンポ)Si を検出し、同時に各
音節の基本周波数(音程)fiを検出して次の如き韻律
情報を得る。
(ただし、iは第i音節であることを表わしている) 第6図は語句として「山脈」を発声した場合の音節のセ
グメンテーションと韻律情報の検出の例を示した図であ
り、音節波形の撓形(4)に対して各韻律情報を次のよ
うに検出する。
(I)音節数(モーラ数)二M4 (I])発声速度(テンポ) : Si (0,4,0
,2,0,350,25) 唾基本周波数(音程): fi (110,120゜1
30,100) 一方、発声語句を記憶した語句内部フォーマットには@
3図(b)に示すように韻律情報が記述されており、こ
れらの記憶内容にもとすいて、次の如き予め規定された
韻律情報が読み出される。
(なお、偏差σSoi 及びσfoi はそれぞれ一定
値(例えば±4096.±x096)として装置内に記
憶している。) 第3図(b)に示した発声語句「さんみやく」に対して
は規定の各韻律情報が次のようにCPU4に読み出され
る。
(I)音 節 数二Mo 11ト (If)発声速度 :5oi(第i音節の標準区間長)
σ5oi(第1音節の区間長偏差) S□、0.3’5ectσSot±40%5o20.3
 hσSO2±40 S030.3 、 h (TSo3 ±40SO40,
3p σSO4±40 (至)基本周波数:foi(第i音節の標準音程)σf
oi(第i音節の音程偏差) fot、120Hz、σfO□±10%fo2110 
jσfO□±10 f 03115 jσfos±10 fo4105 、σfo4±10 次にCPU4は上記の規定値と検出値を比較して、もし
次の条件を満たしたならば、規定範囲内の音声であると
判定する。
M=M。
5oi−σSot<Si<5oi−+4Soifoi−
〇foi<fi<foi十σfoi上記した「さんみゃ
く」の例の場合には検出した第3音節の基本周波数f3
=130が規定の基本周波数f03’=11 p規定範
囲(103,5−126,5)外であることが判定され
、警告音を発することになる(第2図、ステップn7)
この警告音は第7図に示すように周波数発生器10によ
って規定の基本周波数fot〜fo、の信号を順次標準
音節区間長S O1S O4間隔で発生し、この出力に
よってスピーカ15を駆動して、第7図(a)に示す如
き音程のブザー音として出力され、これによってオペレ
ータ(発音者)に筈告すると同時に正しい発声方法を教
えて言い直しを指示する。
即ち、予め語句集メモリ5に記憶している語句の正し−
モーラ数、標準のテンポをブザー音で出力し、この時音
程に相当する周波数を周波数発生器10で発生させて、
スピーカ15を駆動してブザー音を発生させることによ
り、発声方法をオペレータにより明瞭に指示することに
なる。
オペレータはこの警告音を聴いて発声語句の言い直しを
行なって再び上記したステップn2〜n6の動作を実行
する。
ステップn6において検出した韻律情報と予め記憶1〜
でいる規定の韻律情報を比較判定j−でその結果が正し
いと判定した場合にはステップn8に移行する。
このステップn8において、データA=<101100
00>に従ってビット1にセットされている音節位置の
登録を指示した音節/さ/。
/みゃ/、/</の音声信号を音声信号波形バッファ9
から読み出してD/A変換手段11によってD/A 変
換して出力する。オペレータはこのエコーバック音を聴
−て音韻情報の良否を判定してする(nlO)。
なお、ステップn9においてオペレータが不良音声であ
ると判定したときには装置のキーボード(図示せず)上
の特定のキー等を操作してステップn2に戻らせ、再び
発声語句を言い直すことになる。
また上記音節特徴パターンの登録(nlo)が終了すれ
ば、ステップn1に戻り、装置は次の発声語句を語句集
メモリ5より読み出してディスプレイ13上に表示し、
以下同様の動作を実行する。
以上の動作を繰返して所望の音節の標準パターンの登録
を終了する。
以上のようにして、入力された音声を音節毎に認識する
日本語音声人力装−において、音節等のより粗分化され
た単位の特徴を装置に登録するとき、特定の語句群を発
声することにより発声された音声中に含まれる特定の音
節等の特徴を抽出して装置に記憶する際、音声の韻律情
報を用いて良質音声と不良音声とを自動判別することが
できるため、例えば登録を指示した音節を音声出力する
(そのエコーパックをオペレータが聴いて音節の音韻情
報を確かめて登録の良否を判定する)前に発声された音
声のモーラ数、テンポ及び音程等の韻律情報を検出して
語句毎に規定した正しいモーラ数、テンポ及び音程の標
準値の許容範囲の標準韻律情報と比較して規定外の不良
音声である場合には規定のモーラ数、テンポ及び音程な
どの正しい韻律情報をブザー音等で出力してオペレータ
に警告すると同時に正しい発声方法を示して言い直しを
指示することが出来る。
〈発明の効果〉 以上の様に本発明によれば、例えば登録音節をエコーバ
ックする前に入力音声語句の韻律情報を検出して、予め
記憶1−ている語句の標準韻律情報と比較して規定範囲
内で正しく発声された音声であるか否かを判定し、もし
規定範囲外の音声であれば、ブザー音等によってその旨
をオペレータに警告して語句の言い直しを指示するよう
に成しているため、外部騒音や誤った発声に対して即応
することが出来、オペレータ(発声者)の音声登録時の
負担を少なくすることが出来、能率良くスムーズに音声
登録を行なうことができる。
【図面の簡単な説明】
第1図は本発明を実施した日本語音声入力装置の構成を
示すブロック図、第2図は本発明の音声登録方式の処理
動作を示す動作フロー図、第3図(a)は語句集メモリ
の記憶状態を示す図、第3図(b)は発声語句Witの
内部フォーマットを示す図、第4図は音節テーブルメモ
リの記憶状態を示す図、第5図は発声語句の表示例を示
す図、第6図は入力音声の概略波形図、第7図は韻律情
報のブザー音による出力例を示す図である。 3・・・音響処理部、 4・・・中央処理装置(CPU
)5・・・語句集メモリ、 6・・・語句バッファ、 
7・・・音節標準パターンメモリ、 8・・・音節特徴
バッファ、 9・・・音声信り波形バック7、10・・
・周波数発生器、 13・・・ディスプレイ、 15・
・・スピル力、 Mo・・・標準モーラ数、 Soi 
・・・標準音節区間長情報、foi ・・・標準基本周
波数情報。

Claims (1)

  1. 【特許請求の範囲】 1、入力された音声を音節毎に認識する日本語音声入力
    装置において、 語句を発声することにより当該発声された音節中に含ま
    れる特定の音節等の訓分化された単位の特徴を抽出して
    装置に登録するに際し、発声された音声の韻律情報を検
    出し、予め設定された規定の韻律情報と比I咬して規定
    外の不良音声を検出して報知せしめるように成したこと
    を特徴とする音声登録方式。 2、韻律情報は少くともモーラ数及びテンポ情報を含ん
    でいることを特徴とする特許請求の範囲第1項記載の音
    声登録方式。 & 規定の韻律情報をブザー音で出力して不良音声を報
    知せしめるように成したことを特徴とする特許請求の範
    囲第1項記載の音声登録方式。
JP58167307A 1983-09-09 1983-09-09 音声登録方式 Granted JPS6057898A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58167307A JPS6057898A (ja) 1983-09-09 1983-09-09 音声登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58167307A JPS6057898A (ja) 1983-09-09 1983-09-09 音声登録方式

Publications (2)

Publication Number Publication Date
JPS6057898A true JPS6057898A (ja) 1985-04-03
JPH0546557B2 JPH0546557B2 (ja) 1993-07-14

Family

ID=15847317

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58167307A Granted JPS6057898A (ja) 1983-09-09 1983-09-09 音声登録方式

Country Status (1)

Country Link
JP (1) JPS6057898A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61249182A (ja) * 1985-04-27 1986-11-06 Toshiba Corp パタ−ン認識学習装置
JPS62294297A (ja) * 1986-06-13 1987-12-21 松下電器産業株式会社 音声入力装置
JPS6317499A (ja) * 1986-07-09 1988-01-25 富士通株式会社 単語音声認識方式
JPS63289685A (ja) * 1987-05-21 1988-11-28 Toshiba Corp パタ−ン認識装置
JPH01285998A (ja) * 1988-05-13 1989-11-16 Sharp Corp 音声認識装置
JPH01290000A (ja) * 1988-05-17 1989-11-21 Sharp Corp 音声認識方式

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58178396A (ja) * 1982-04-12 1983-10-19 株式会社日立製作所 音声認識用標準パタ−ン登録方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58178396A (ja) * 1982-04-12 1983-10-19 株式会社日立製作所 音声認識用標準パタ−ン登録方式

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61249182A (ja) * 1985-04-27 1986-11-06 Toshiba Corp パタ−ン認識学習装置
JPS62294297A (ja) * 1986-06-13 1987-12-21 松下電器産業株式会社 音声入力装置
JPS6317499A (ja) * 1986-07-09 1988-01-25 富士通株式会社 単語音声認識方式
JPS63289685A (ja) * 1987-05-21 1988-11-28 Toshiba Corp パタ−ン認識装置
JPH01285998A (ja) * 1988-05-13 1989-11-16 Sharp Corp 音声認識装置
JPH01290000A (ja) * 1988-05-17 1989-11-21 Sharp Corp 音声認識方式

Also Published As

Publication number Publication date
JPH0546557B2 (ja) 1993-07-14

Similar Documents

Publication Publication Date Title
US7280968B2 (en) Synthetically generated speech responses including prosodic characteristics of speech inputs
JP4085130B2 (ja) 感情認識装置
US7062439B2 (en) Speech synthesis apparatus and method
US7124082B2 (en) Phonetic speech-to-text-to-speech system and method
WO2004063902B1 (en) Speech training method with color instruction
US20070088547A1 (en) Phonetic speech-to-text-to-speech system and method
GB2376394A (en) Speech synthesis apparatus and selection method
WO2001052237A1 (fr) Appareil, methode et support d'apprentissage de langues etrangeres
JP2002040926A (ja) インターネット上での自動発音比較方法を用いた外国語発音学習及び口頭テスト方法
JPH05165486A (ja) テキスト音声変換装置
JPS6057898A (ja) 音声登録方式
JPH0743599B2 (ja) 音声認識用コンピュータ・システム
JP2000250401A (ja) 言語学習方法、言語学習装置およびプログラムを記録した媒体
JP2015102773A (ja) 音声発生装置、音声変形装置及び方法
JPH07200554A (ja) 文章読み上げ装置
JP6517417B1 (ja) 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム
JP2001282098A (ja) 外国語学習装置、外国語学習方法および媒体
JP3034554B2 (ja) 日本語文章読上げ装置及び方法
JPH08110790A (ja) 音声認識装置
Patil et al. Comparison of Speech Emotion Recognition Performance with Different System Features
Zain et al. A review of CALL-based ASR and its potential application for Malay cued Speech learning tool application
Venkatagiri Digital speech technology: An overview
JPH1063287A (ja) 発音訓練装置
JPH1165410A (ja) 発音練習装置
JPH08248990A (ja) 音声合成装置