JP2737122B2 - 音声辞書作成装置 - Google Patents

音声辞書作成装置

Info

Publication number
JP2737122B2
JP2737122B2 JP62190654A JP19065487A JP2737122B2 JP 2737122 B2 JP2737122 B2 JP 2737122B2 JP 62190654 A JP62190654 A JP 62190654A JP 19065487 A JP19065487 A JP 19065487A JP 2737122 B2 JP2737122 B2 JP 2737122B2
Authority
JP
Japan
Prior art keywords
pattern
syllable
unit
word
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62190654A
Other languages
English (en)
Other versions
JPS6433600A (en
Inventor
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62190654A priority Critical patent/JP2737122B2/ja
Publication of JPS6433600A publication Critical patent/JPS6433600A/ja
Application granted granted Critical
Publication of JP2737122B2 publication Critical patent/JP2737122B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概 要〕 本発明は、無声化音節をもつ単語の音声パターンを作
成して記憶し、入力音声の単語認識を行う音声辞書作成
装置に関し、 入力音声の特徴量を抽出するパラメータ抽出部と、抽
出された前記特徴量の音節区間を検出する音節区間検出
回路とからなり、入力音声の単語パターンまたは単音節
パターンを出力する入力部と、 前記単音節パターンを記憶する音節テンプレート辞書
部と、 前記音節テンプレート辞書部に記憶されている前記単
音節パターンのうち子音区間を抽出する子音区間抽出部
と、 前記子音区間内の特徴量の平均値を算出する平均値算
出部と、 前記平均算出部からの出力を無声化音節パターンとし
て記憶する無声化音節パターン辞書部と、 単語の発音を予め記憶しておく単語辞書部と、 無声化音節のもつ規則を記憶しておく無声化規則部
と、 前記音節プレート辞書部と、前記無声化音節パターン
辞書部と、前記単語辞書部と、前記無声化規則部との出
力から、無声化音節を含む単語の合成パターンを作成す
る合成パターン作成部と を有するように音声辞書作成装置を構成する。 〔産業上の利用分野〕 本発明は、無声化音節をもつ単語の音声パターンを作
成して記憶し、入力音声の単語認識を行う音声辞書作成
装置に関するものである。 単語音声認識装置はオペレータの発声の単音節をパタ
ーン化して、この単音節パターンから単語の合成パター
ンを生成しておき、オペレータが入力する音声の単語を
認識する装置である。 しかし、単語が実際に発音されたとき、声帯振動を伴
わない音節を含む単語がある。 これらの単語は認識率が低くなるので、この認識率を
向上させる方法が要望されている。 〔従来の技術〕 第4図は従来例の単語音声認識装置の構成を説明する
図、 先ず、音節パターンが登録される手順を説明する。 第4図において、入力部1に入力した音声はパラメー
タ抽出回路11で音声パラメータ(特徴量が抽出される。 即ち、一定時間ごとのクロックに応じて入力音声の周
波数成分、スペクトル強度(パワー)等の成分が特徴量
として抽出される。 次いで、区間検出回路12で入力音声の発声による単音
節区間の長短を弁別して、単音節それぞれの区間を検出
し、単音節に分離する。 分離された単音節は、パターン化された単音節パター
ンとして音節テンプレート辞書部2に登録される。 一方、この認識装置が認識すべき単語を平仮名、片仮
名、アルファベット、あるいは、発音記号等のコードの
記号列で表記して単語辞書部3に記憶させる。 合成パターン作成部4は、音節テンプレート辞書部2
に登録された単音節パターンを結合して、単語辞書部3
に記憶された単語それぞれの合成パターンを作成する。 そして、単語ごとに作成された単語の合成パターンは
合成パターン辞書部5に記憶される。 次いで、入力音声の認識手順を説明する。 被認識音声入力は、入力部1でパターン化され、パタ
ーン照合部6に入力して合成パターン辞書部5が記憶す
る単語パターンと逐一照合され、合致したパターンの単
語が認識結果として出力される。 具体的に説明すると、例えば、第3図の例1のよう
に、単語辞書部3に認識すべき単語として、「にちで
ん」が登録されると、予めオペレータの音声で登録され
た単音節パターンの中から「に」、「ち」、「で」、
「ん」が抽出されて、合成作成部4で単語パターン「に
ちでん」が合成されて合成パターン辞書部5に登録され
る。 被認識音声入力「にちでん」が入力されると、入力部
1でパターン化されて、パターン照合部6で、合成パタ
ーン辞書部5に記憶された単語の合成パターンと照合さ
れ、この例では、「にちでん」とのパターンの照合がと
れて認識結果として出力される。 〔発明が解決しようとする問題点〕 単語の中には発声時に声帯振動を伴なわずに発声され
る音節、即ち、無声化音節をもつ単語がある。 例えば、単語「ひたち」の「ち」のように、通常の発
声では声帯振動なく発声される。 このような単語は、単語の仮名表記に音声パターンを
当てはめて合成しても、実際の発声から得られた単語の
合成パターンと異なり、上記した従来の方式による音声
認識装置では単語認識が不可能な場合、あるいは誤認識
する場合がある。 本発明はこのような点に鑑みて創作されたものであっ
て、無声化音節を有する単語パターンを合成して単語音
声認識の高い単語音声認識装置を提供することを目的と
している。 〔問題点を解決するための手段〕 上記した目的は、入力音声の特徴量を抽出するパラメ
ータ抽出部と、抽出された前記特徴量の音節区間を検出
する音節区間検出回路とからなり、入力音声の単語パタ
ーンまたは単音節パターンを出力する入力部と、 前記単音節パターンを記憶する音節テンプレート辞書
部と、 前記音節テンプレート辞書部に記憶されている前記単
音節パターンのうち子音区間を抽出する子音区間抽出部
と、 前記子音区間内の特徴量の平均値を算出する平均値算
出部と、 前記平均算出部からの出力を無声化音節パターンとし
て記憶する無声化音節パターン辞書部と、 単語の発音を予め記憶しておく単語辞書部と、 無声化音節のもつ規則を記憶しておく無声化規則部
と、 前記音節プレート辞書部と、前記無声化音節パターン
辞書部と、前記単語辞書部と、前記無声化規則部との出
力から、無声化音節を含む単語の合成パターンを作成す
る合成パターン作成部と を有するように構成された音声辞書作成装置によって
解決される。 〔作 用〕 単語辞書部に記憶された単語の中で、無声化規則部に
記憶された規則に適合する単語を抽出して合成パターン
作成部で単語パターンを作成する際に、無声化規則で通
常無声化して発声される音節パターンを無声化した特殊
単音節パターンを用いて作成する。 そのために、音節テンプレート辞書部に登録された所
要の音節パターンの子音区間を子音区間抽出部で抽出
し、平均値算出部でその音節パターンの子音区間の特徴
値の平均値を算出し、子音部の特徴量パターンを抽出
し、その平均値を求め、該平均値を振幅とするパターン
を無声化音節の音節パターンとする。 そして、作成された無声化部を示す音節パターンを無
声化規則に適合した単語を合成する場合の単音節パター
ンとして無声化音節パターン辞書部に記憶しておく。 このようにして無声化規則に則って作成された単語パ
ターンは、他の単語パターンとともに合成パターン記憶
部に記憶される。 従って、合成パターン記憶部には発声単語に近い単語
の合成パターンが記憶されることになり、パターン照合
部で照合して認識する入力単語の認識率が向上すること
になる。 〔実施例〕 以下、図面を参照して本発明の単語音声入力装置の実
施例を説明する。 第1図は本発明の一実施例の構成ブロック図、 第2図は音節の構成を説明する図、 第3図は無声化音節の例を示す図である。 なお、全図を通じて同一符号は同一対象物を示す。 先ず、オペレータの音声登録に際して、オペレータの
音声が入力部1でパターン化され、単音節に分離されて
音節テンプレート辞書部2に音節パターンとして記憶さ
れる。 記憶された音節パターンで、例えば「ち」は第2図の
ように、子音区間抽出部7が高域スペクトルと低域スペ
クトルとの特徴値比によって、子音区間〔t∫〕と母音
区間〔i〕が決められる。 平均値算出部8で子音区間〔t∫〕の特徴値の平均値
が算出され、「ち」の音節区間に〔t∫〕のスペクトル
の特徴値の平均値をもち、所定の継続時間をもつ単音節
パターンに「ち*」が無声化音節パターン辞書部9に記
憶される。 一方、発声される単語の「ち」は前後の音節によって
通常第3図に示すように、3つの場合がある。即ち、 (1)「にちでん」の「ち」のように、有音で発音され
る場合、 (2)「ひたち」の「ち」のように、高い確率で無声化
する場合、 (3)「いち」の「ち」のように、(1)、(2)のい
ずれかの場合、 従って、(1)の場合は音節パターン「ち」を用い
て、(2)の場合は「ち*」を、(3)の場合は「ち」
と「ち*」の両方を用いた単語の合成パターンを合成パ
ターン作成部4で作成し、合成パターン辞書部5に記憶
する。 以上音節パターン「ち」の場合を具体的に述べたが、
一般的な母音の無声化の法則として、 法則1 「キ」「ク」「シ」「ス」「チ」「ツ」「ヒ」
「フ」「ビ」「ブ」「シュ」などの拍が「カ」「サ」
「タ」「ハ」「バ」などの各行の拍の直前にきたとき。 法則2 「キ」「ク」「シ」「ス」「チ」「ツ」「ヒ」
「フ」「ビ」「ブ」「シュ」などの拍が息の切れ目の直
前にきてその拍のアクセントが低いとき。 〔NHK編 日本語発音アクセント辞典参照〕 このような法則を無声化規則部10に記憶し、単語辞書
部3に登録される単語が合成パターン作成部4で単語パ
ターンが作成される時に適用される。 その結果、合成パターン辞書部5には発声音に類似度
の高い単語の合成パターンが用意されることになり、従
って、認識時のパターン照合部6における入力音声との
照合確率が高くなる。 なお、合成パターン辞書部5はすべての合成パターン
を常時保持する必要はなく、一パターン分の領域だけを
有し、照合時に順次パターンを置換するようにしてもよ
い。 こうすることによって、メモリ容量は大幅に削減する
ことができる。 また、無声化音節パターンは子音区間の特徴値の平均
値を用いて作成したが、他の方法として、例えば抽出さ
れた子音パターンを補完又は間引きによって、所定の継
続時間のパターンを合成する方法でも良い。 〔発明の効果〕 以上述べてきたように、本発明によれば、無声化音節
パターンを原単音節パターンの子音区間から作成し、実
際の音声の単語発音に近似した単語の合成パターンが記
憶されるので単語音声認識の認識率が向上し、実用的に
は極めて有用である。
【図面の簡単な説明】 第1図は本発明の一実施例の構成ブロック図、 第2図は音節の構成を説明する図、 第3図は無声化音節の例を説明する図、 第4図は従来例の構成を説明する図である。 図において、 1は入力部、 2は音節テンプレート辞書部、 3は単語辞書部、 4は合成パターン作成部、 5は合成パターン辞書部、 6はパターン照合部、 7は子音区間抽出部、 8は平均値算出部、 9は無声化音節パターン辞書部、 10は無声化規則辞書部、 11は特徴量抽出部、 12は区間検出回路である。

Claims (1)

  1. (57)【特許請求の範囲】 1.入力音声の特徴量を抽出するパラメータ抽出部と、
    抽出された前記特徴量の音節区間を検出する音節区間検
    出回路とからなり、入力音声の単語パターンまたは単音
    節パターンを出力する入力部と、 前記単音節パターンを記憶する音節テンプレート辞書部
    と、 前記音節テンプレート辞書部に記憶されている前記単音
    節パターンのうち子音区間を抽出する子音区間抽出部
    と、 前記子音区間内の特徴量の平均値を算出する平均値算出
    部と、 前記平均算出部からの出力を無声化音節の音節パターン
    として記憶する無声化音節パターン辞書部と、 単語の発音を予め記憶しておく単語辞書部と、 無声化音節のもつ規則を記憶しておく無声化音節パター
    ン選択規則部と、 前記音節プレート辞書部と、前記無声化音節パターン辞
    書部と、前記単語辞書部と、前記無声化音節パターン選
    択規則部との出力から、無声化音節を含む単語の合成パ
    ターンを作成する合成パターン作成部と を有することを特徴とする音声辞書作成装置。
JP62190654A 1987-07-29 1987-07-29 音声辞書作成装置 Expired - Fee Related JP2737122B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62190654A JP2737122B2 (ja) 1987-07-29 1987-07-29 音声辞書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62190654A JP2737122B2 (ja) 1987-07-29 1987-07-29 音声辞書作成装置

Publications (2)

Publication Number Publication Date
JPS6433600A JPS6433600A (en) 1989-02-03
JP2737122B2 true JP2737122B2 (ja) 1998-04-08

Family

ID=16261683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62190654A Expired - Fee Related JP2737122B2 (ja) 1987-07-29 1987-07-29 音声辞書作成装置

Country Status (1)

Country Link
JP (1) JP2737122B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6497651B2 (ja) * 2015-03-19 2019-04-10 株式会社レイトロン 音声認識装置および音声認識プログラム

Also Published As

Publication number Publication date
JPS6433600A (en) 1989-02-03

Similar Documents

Publication Publication Date Title
JP2000163088A (ja) 音声合成方法および装置
JP2737122B2 (ja) 音声辞書作成装置
JPS6050600A (ja) 規則合成方式
JP2615643B2 (ja) 単語音声認識装置
JP2707552B2 (ja) 単語音声認識装置
JP2615649B2 (ja) 単語音声認識装置
JPH037995A (ja) 歌音声合成データの作成装置
JPH04350699A (ja) テキスト音声合成装置
JP3522005B2 (ja) 音声合成装置
JPH1130994A (ja) 音声認識方法および装置ならびに音声認識プログラムを記録した記録媒体
JP2001324995A (ja) 音声認識方法
KR100611894B1 (ko) 음성 인식기의 단어 모델 생성 방법
JP3308875B2 (ja) 音声合成方法および装置
JPS6180298A (ja) 音声認識装置
JPS60182499A (ja) 音声認識装置
JP2995814B2 (ja) 音声合成方法
JP3109807B2 (ja) 音声合成方式及び装置
JP2578771B2 (ja) 音声認識装置
JPH0573039B2 (ja)
JPS6027433B2 (ja) 日本語情報入力装置
JPH0635494A (ja) 音声認識装置
JPH07134596A (ja) 音声合成用音声持続時間処理方法及びその装置
JPS60150098A (ja) 音声認識装置
JPH04127199A (ja) 外国語単語の日本語発音決定方法
JPH0679235B2 (ja) 音声合成装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees