JPH0546557B2 - - Google Patents

Info

Publication number
JPH0546557B2
JPH0546557B2 JP58167307A JP16730783A JPH0546557B2 JP H0546557 B2 JPH0546557 B2 JP H0546557B2 JP 58167307 A JP58167307 A JP 58167307A JP 16730783 A JP16730783 A JP 16730783A JP H0546557 B2 JPH0546557 B2 JP H0546557B2
Authority
JP
Japan
Prior art keywords
syllable
voice
information
uttered
syllables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58167307A
Other languages
English (en)
Other versions
JPS6057898A (ja
Inventor
Fumio Togawa
Mitsuhiro Toya
Hiroyuki Iwahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP58167307A priority Critical patent/JPS6057898A/ja
Publication of JPS6057898A publication Critical patent/JPS6057898A/ja
Publication of JPH0546557B2 publication Critical patent/JPH0546557B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】
<発明の技術分野> 本発明は入力された音声を音節毎に認識する日
本語音声入力装置の改良に関し、更に詳細には音
節等のより細分化された単位の特徴を抽出して装
置に登録するとき、発声した音声が不良音声であ
るか否かを検出して、オペレータに報知するよう
にした音声登録方法の改良に関するものである。 <発明の技術的背景とその問題点> 一般に音節を単位として入力音声を認識する方
式の日本語音声入力装置においては、入力音声を
音節単位にセグメント化して音節のセグメンテー
シヨンを行ない、次に各音節から抽出した特徴パ
ターンを予め登録している音節標準パターンと比
較照合(パターンマツチング)して最も類似した
標準パターンが属する音節を識別結果とするよう
に成している。 また、このような装置において、従来は弧立で
発声した単音節、母音と単音節を組みにして発声
した音声、または予め選定された語句を発声した
音声から抽出した単音節から抽出した特徴パター
ンを標準パターンとして登録していた。 しかし、このような従来の音声登録方式におい
ては、抽出した特徴パターンを標準パターンとし
て登録するだけであり、オペレータとしては登録
すべき単音節を含む音声を適切な発声速度等で発
声したか否かを判断することが出来なかつた。 <発明の目的> 本発明は上記諸点に鑑みて成されたものであ
り、連続音声の認識に適した音節標準パターンを
発声者の音声登録時の負担を少なくして能率よく
スムーズに登録することが出来る音声登録方法を
提供することを目的とし、この目的を達成するた
め、本発明の音声登録方法は、語句を発声するこ
とにより当該発声された音節中に含まれる特定の
音節等の細分化された単位の特徴を抽出して登録
する音声登録方法において、 上記発声された語句の、各音節の特徴パターン
を抽出すると共に少くともモーラ数及びテンポ情
報を含む韻律情報を検出してこれら特徴パター
ン、韻律情報を一時記憶させるステツプと、前記
音節の特徴パターンの登録動作に先行して、前記
検出した韻律情報を、予め設定された前記語句に
対応する規定の韻律情報と比較して規定外の不良
音声を検出するステツプと、前記規定外の不良音
声検出に基づいて該語句の予め設定された規定の
韻律情報をブザー音で出力させて正しい発声方法
と不良音声であることの警告とを同時に報知する
ステツプとを実行することを特徴とする音声登録
方法にある。 <発明の実施例> 以下、本発明の一実施例を図面を参照して詳細
に説明する。 第1図は本発明の音声登録方法を実施した日本
語音声入力装置の構成を示すブロツク図である。 第1図において、1はマイク(図示せず)等に
より電気信号に変換され発声された入力音声情報
を増幅するアンプであり、このアンプ2の出力は
アナログ・デイジタル変換手段2によつてA−D
変換され、このA−D変換された信号は音響処理
部3に入力され、この音響処理部3で入力音声が
分析されて音節のセグメンテーシヨンが行なわれ
て音節が抽出され、また入力音声のモーラ数、テ
ンポ及び音程等の韻律情報及び各音節の特徴パタ
ーン〓iが検出される。 4は中央演算処理装置(CPU)、5は発声すべ
き語句群を語句及びその語句に含まれる音節のう
ち登録する音節を指示する情報、更には規定の各
韻律情報を記憶した語句集メモリ、6はこの語句
集メモリ5から読出された一つの語句データを記
憶する語句バツフア、7は音節標準パターンメモ
リ、8は音節特徴バツフア、9は音声信号波形バ
ツフア、10は周波数発生器、11はデイジタ
ル・アナログ変換手段、12はアンプ、13はデ
イスプレイである。 次に上記の如く構成された装置の動作を第2図
に示す動作フロー図を参照して説明する。 第2図は本発明の音声登録方法の処理フローを
示す図である。 装置内の語句集メモリ5は上記したように予め
語句と、その語句に含まれる音節のうち登録する
音節を指示する情報と、その語句の規定の各韻律
情報を記憶している。 今、装置に音節標準パターンを登録するため、
キーボード(図示せず)等の所定のキー等を操作
して装置を登録モードにすると、ステツプn1(第
2図)においてCPU4は語句集メモリ5より発
声語句を読み出して登録する音節を明示してデイ
スプレイ13上に表示して発声する語句をオペレ
ータ(発声者)に指示する。 例えば読み出された発声語句Wiが「山脈」
で/さ/、/みや/、/く/の3音節を登録する
場合について説明する。 まずCPU4は語句集メモリ5より発声語句Wi
を読み出して語句バツフア6に記憶する。語句集
メモリ5には第3図aに示すように複数の語句
Wi(i=1〜n)が記憶されており、この語句の
内部フオーマツトは第3図bに示すように音節数
M0の記憶領域、登録音節明示情報Aの記憶領域、
音節番号Bの記憶領域、標準音節区間長情報Soi
の記憶領域及び標準基本周波数情報foiの記憶領
域より構成されており、発声語句Wiが「山脈」
で/さ/、/みや/、/く/の3音節を登録する
場合にはモーラ数(音節数)Mが「4」、登録音
節は第1、第3、第4音節であることをビツト1
で表わしたデータA=<10110000>、語句を音節
番号で表現したデータB=「11,68,83,8,0,
…」、各音節の発声速度に関連した標準音節区間
長情報(単位10m秒)〔S01,S02,S03,S04,…〕
=〔30,30,30,30,…〕及び各音節の標準音程
である基本周波数情報(単位Hz)〔f01,f02,f03
f04,…〕=〔120,110,115,105,…〕が続いて
記憶されている。 ステツプn1において、まず語句バツフア6に
記憶される発声語句の語句内部コードWiがロー
ドされ、CPU4は状態カウンタ(J)を1にセツト
し、次にデータAの第Jビツトが1であるか否か
を判定し、判定結果が1であればシンボル記号、
例えば括弧(,)を附加し、次に音節文字変換を
実行する。この変換動作は第4図に示した音節テ
ーブルメモリに記憶された音節番号と文字コード
の対応データにもとずいて音節番号を文字コード
に変換する。次にJの値を+1してJの値が音節
数Aの値を越えたか否かを判定し、J>Aになる
まで上記の動作を繰返す。またデータAの第Jビ
ツトが0であればシンボル記号の附加動作の処理
を飛ばして、即音節文字変換を実行する。このよ
うな一連の動作によつて登録する音節を明示する
シンボル記号を附加したかな文字コード列が作成
され、そのかな文字コード列が出力されて、デイ
スプレイ13に表示される。このようにして語句
集メモリ5から発声語句を読み出し、登録する音
節を記号(,)でくくつて第5図に示すように明
示してデイスプレイ13に表示して発声する語句
をオペレータに指示する。 なお、上の例では登録する音節を明示する記号
Dは括弧としているが、これに限定されるもので
はなく、鍵括弧、アンダーライン等の他の記号、
または登録音節をグレイ表示または異なるカラー
で表示する等、登録する音節を他の音節と区別し
て明示し得るものであれば良い。 次にオペレータ(発声者)はデイスプレイ13
上の表示を見て/さんみやく/と発声する(n2)
と、この音声はマイク14によつて電気信号に変
換され、アンプ1で増幅された後、アナログ・デ
イジタル変換手段2でA・D変換されて音響処理
部3に入力される。 音響処理部3はデイジタル変換された入力音声
を分析して音節を抽出し(n3)、次に各音節の特
徴パターンを抽出し(n4)、次にモーラ数(音節
数)、テンポ(発声速度)等を検出して、これら
の特徴量を音節特徴バツフア8に一時記憶する。
また検出したモーラ数、テンポ等について、語句
集メモリ5に記憶された規定のモーラ数、標準音
節区間長等と比較して、モーラ数は正しいか、テ
ンポは規定範囲かを判定して(n5,n6)、もし規
定範囲外の音声であれば、その語句(山脈)の正
しい韻律情報(正しいモーラ数、標準のテンポ
等)をD/A変換手段11を介してブザー音とし
てスピーカ15に警告音(n7)を発生する。 これによつて、オペレータに警告すると同時に
正しい発声方法をブザー音によつて教えて言い直
しを指示することになる。 韻律情報の検出について今少し説明すると、語
句を発声した音声から音節のセグメンテーシヨン
によつて音節を抽出し、その音節列から音節数
(モーラ数)Mと発声速度(テンポ)Siを検出し、
同時に各音節の基本周波数(音程)fiを検出して
次のき韻律情報を得る。
【表】 表わしている)
第6図は語句として「山脈」を発声した場合の
音節のセグメンテーシヨンと韻律情報の検出の例
を示した図であり、音節波形の概形(a)に対して各
韻律情報を次のように検出する。 () 音節数(モーラ数):M 4 () 発声速度(テンポ):Si(0.4,0.2,0.35,
0.25) () 基本周波数(音程):fi(110,120,130,
100) 一方、発声語句を記憶した語句内部フオーマツ
トには第3図bに示すように韻律情報が記述され
ており、これらの記憶内容にもとずいて、次の如
き予め規定された韻律情報が読み出される。
【表】 第3図bに示した発声語句「さんみやく」に対
しては規定の各韻律情報が次のようにCPU4に
読み出される。 () 音節数:Mo 4音節 () 発声速度:Soi(第i音節の標準区間長) σSoi(第i音節の区間長偏差) So10.3 sec,σSo1±40% So20.3 ,σSo2±40 So30.3 ,σSo3±40 So40.3 ,σSo4±40 () 基本周波数:foi(第i音節の標準音程) σfoi(第i音節の音程偏差) fo1120Hz,σfo1±10% fo2110 ,σfo2±10 fo3115 ,σfo3±10 fo4105 ,σfo4±10 次にCPU4は上記の規定値と検出値を比較し
て、もし次の条件を満たしたならば、規定範囲内
の音声であると判定する。 M=Mo Soi−σSoi<Si<Soi+σ+Soi foi−σfoi<fi<foi+σfoi 上記した「さんみやく」の例の場合には検出し
た第3音節の基本周波数f3=130が規定の基本周
波数fo3=115の規定範囲(103.5−126.5)外であ
ることが判定され、警告音を発することになる
(第2図、ステツプn7)。 この警告音は第7図に示すように周波数発生器
10によつて規定の基本周波数fo1〜fo4の信号を
順次標準音節区間長So1−So4間隔で発生し、こ
の出力によつてスピーカ15を駆動して、第7図
aに示す如き音程のブザー音として出力され、こ
れによつてオペレータ(発音者)に警告すると同
時に正しい発声方法を教えて言い直しを指示す
る。 即ち、予め語句集メモリ5に記憶している語句
の正しいモーラ数、標準のテンポをブザー音で出
力し、この時音程に相当する周波数を周波数発生
器10で発生させて、スピーカ15を駆動してブ
ザー音を発生させることにより、発声方法をオペ
レータにより明瞭に指示することになる。 オペレータはこの警告音を聴いて発声語句の言
い直しを行なつて再び上記したステツプn2〜n6
の動作を実行する。 ステツプn6において検出した韻律情報と予め
記憶している規定の韻律情報を比較判定してその
結果が正しいと判定した場合にはステツプn8に
移行する。 このステツプn8において、データA=<
10110000>に従つてビツト1にセツトされている
音節位置の登録を指示した音節/さ/、/み
や/、/く/の音声信号を音声信号波形バツフア
9から読み出してD/A変換手段11によつて
D/A変換して出力する。オペレータはこのエコ
ーバツク音を聴いて音韻情報の良否を判定して良
質と判断した場合(n9)には音節特徴バツフア
8に記憶している良質音節の特徴パターン(〓
1,〓3,〓4)を音節標準パターンメモリ7に
登録する(n10)。 なお、ステツプn9においてオペレータが不良
音声であると判定したときには装置のキーボード
(図示せず)上の特定のキー等を操作してステツ
プn2に戻らせ、再び発声語句を言い直すことに
なる。 また上記音節特徴パターンの登録(n10)が終
了すれば、ステツプn1に戻り、装置は次の発声
語句を語句集メモリ5より読み出してデイスプレ
イ13上に表示し、以下同様の動作を実行する。 以上の動作を繰返して所望の音節の標準パター
ンの登録を終了する。 以上のようにして、語句を発声することにより
当該発声された音節中に含まれる特定の音節等の
細分化された単位の特徴を抽出して登録する音声
登録方法において、 上記発声された語句の、各音節の特徴パターン
を抽出すると共に少なくともモーラ数及びテンポ
情報を含む韻律情報を検出してこれら特徴パター
ン、韻律情報を一時記憶させるステツプと、前記
音節の特徴パターンの登録動作に先行して、前記
検出した韻律情報を、予め設定された前記語句に
対応する規定の韻律情報と比較して規定外の不良
音声を検出するステツプと、前記規定外の不良音
声検出に基づいて該語句の予め設定された規定の
韻律情報をブザー音で出力させて正しい発声方法
と不良音声であることの警告とを同時に報知する
ステツプとを実行することを特徴とする音声登録
方法であり、そのため例えば登録を指示した音節
を音声出力する(そのエコーバツクをオペレータ
が聴いて音節の音韻情報を確かめて登録の良否を
判定する)前に発声された音声のモーラ数、テン
ポ及び音程等の韻律情報を検出して語句毎に規定
した正しいモーラ数、テンポ及び音程の標準値の
許容範囲の標準韻律情報と比較して規定外の不良
音声である場合には規定のモーラ数、テンポ及び
音程などの正しい韻律情報をブザー音等で出力し
てオペレータに警告すると同時に正しい発声方法
を示して言い直しを指示することが出来る。 <発明の効果> 以上の様に本発明によれば、例えば登録音節を
エコーバツクする前に入力音声語句の韻律情報を
検出して、予め記憶している語句の標準韻律情報
と比較して規定範囲内で正しく発声された音声で
あるか否かを判定し、もし規定範囲外の音声であ
れば、ブザー音等によつてその旨をオペレータに
警告して語句の言い直しを指示するように成して
いるため、外部騒音や誤つた発声に対して即応す
ることが出来、オペレータ(発声者)の音声登録
時の負担を少なくすることが出来、能率良くスム
ーズに音声登録を行なうことができる。
【図面の簡単な説明】
第1図は本発明を実施した日本語音声入力装置
の構成を示すブロツク図、第2図は本発明の音声
登録方法の処理動作を示す動作フロー図、第3図
aは語句集メモリの記憶状態を示す図、第3図b
は発声語句Wiの内部フオーマツトを示す図、第
4図は音節テーブルメモリの記憶状態を示す図、
第5図は発声語句の表示例を示す図、第6図は入
力音声の概略波形図、第7図は韻律情報のブザー
音による出力例を示す図である。 3……音響処理部、4……中央処理装置
(CPU)、5……語句集メモリ、6……語句バツ
フア、7……音節標準パターンメモリ、8……音
節特徴バツフア、9……音声信号波形バツフア、
10……周波数発生器、13……デイスプレイ、
15……スピーカ、Mo……標準モーラ数、Soi
……標準音節区間長情報、foi……標準基本周波
数情報。

Claims (1)

  1. 【特許請求の範囲】 1 語句を発声することにより当該発声された音
    節中に含まれる特定の音節等の細分化された単位
    の特徴を抽出して登録する音声登録方法におい
    て、 上記発声された語句の、各音節の特徴パターン
    を抽出すると共に少なくともモーラ数及びテンポ
    情報を含む韻律情報を検出してこれら特徴パター
    ン、韻律情報を一時記憶するステツプと、 前記音節の特徴パターンの登録動作に先行し
    て、前記検出した韻律情報を、予め設定された前
    記語句に対応する規定の韻律情報と比較して規定
    外の不良音声を検出するステツプと、前記規定外
    の不良音声検出に基づいて該語句の予め設定され
    た規定の韻律情報をブザー音で出力させて正しい
    発声方法と不良音声であることの警告とを同時に
    報知するステツプとを実行することを特徴とする
    音声登録方法。
JP58167307A 1983-09-09 1983-09-09 音声登録方式 Granted JPS6057898A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58167307A JPS6057898A (ja) 1983-09-09 1983-09-09 音声登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58167307A JPS6057898A (ja) 1983-09-09 1983-09-09 音声登録方式

Publications (2)

Publication Number Publication Date
JPS6057898A JPS6057898A (ja) 1985-04-03
JPH0546557B2 true JPH0546557B2 (ja) 1993-07-14

Family

ID=15847317

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58167307A Granted JPS6057898A (ja) 1983-09-09 1983-09-09 音声登録方式

Country Status (1)

Country Link
JP (1) JPS6057898A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61249182A (ja) * 1985-04-27 1986-11-06 Toshiba Corp パタ−ン認識学習装置
JP2574242B2 (ja) * 1986-06-13 1997-01-22 松下電器産業株式会社 音声入力装置
JPS6317499A (ja) * 1986-07-09 1988-01-25 富士通株式会社 単語音声認識方式
JP2885399B2 (ja) * 1987-05-21 1999-04-19 株式会社東芝 パターン認識装置
JPH01285998A (ja) * 1988-05-13 1989-11-16 Sharp Corp 音声認識装置
JPH01290000A (ja) * 1988-05-17 1989-11-21 Sharp Corp 音声認識方式

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58178396A (ja) * 1982-04-12 1983-10-19 株式会社日立製作所 音声認識用標準パタ−ン登録方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58178396A (ja) * 1982-04-12 1983-10-19 株式会社日立製作所 音声認識用標準パタ−ン登録方式

Also Published As

Publication number Publication date
JPS6057898A (ja) 1985-04-03

Similar Documents

Publication Publication Date Title
US7280968B2 (en) Synthetically generated speech responses including prosodic characteristics of speech inputs
US7062439B2 (en) Speech synthesis apparatus and method
JP4867804B2 (ja) 音声認識装置及び会議システム
US7010489B1 (en) Method for guiding text-to-speech output timing using speech recognition markers
WO2001052237A1 (fr) Appareil, methode et support d'apprentissage de langues etrangeres
GB2376394A (en) Speech synthesis apparatus and selection method
JPH05165486A (ja) テキスト音声変換装置
JPH0546557B2 (ja)
JP2844817B2 (ja) 発声練習用音声合成方式
JPH0743599B2 (ja) 音声認識用コンピュータ・システム
JPH07200554A (ja) 文章読み上げ装置
JP2001282098A (ja) 外国語学習装置、外国語学習方法および媒体
JP2664785B2 (ja) 音声認識装置
JP6517417B1 (ja) 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム
JP2908720B2 (ja) 合成を基本とした会話訓練装置及び方法
JP3522005B2 (ja) 音声合成装置
JPH11282494A (ja) 音声合成装置および記憶媒体
JP2638151B2 (ja) 会話補助装置
JPH0229230B2 (ja)
JPH08160990A (ja) 音声合成装置
JPH1063287A (ja) 発音訓練装置
JPS6027433B2 (ja) 日本語情報入力装置
JPH1165410A (ja) 発音練習装置
JPS63217399A (ja) 音声区間検出装置
Venkatagiri Digital speech technology: An overview