JPH1195789A - 音声認識システムおよび音声認識システムにおける話者適応方法 - Google Patents

音声認識システムおよび音声認識システムにおける話者適応方法

Info

Publication number
JPH1195789A
JPH1195789A JP9259844A JP25984497A JPH1195789A JP H1195789 A JPH1195789 A JP H1195789A JP 9259844 A JP9259844 A JP 9259844A JP 25984497 A JP25984497 A JP 25984497A JP H1195789 A JPH1195789 A JP H1195789A
Authority
JP
Japan
Prior art keywords
speaker
voice
information
speech
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9259844A
Other languages
English (en)
Inventor
Nobuo Hataoka
信夫 畑岡
Yasunari Obuchi
康成 大淵
Toshiyuki Odaka
俊之 小高
Akio Amano
明雄 天野
Masakazu Ejiri
正員 江尻
Shinya Oba
信弥 大場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9259844A priority Critical patent/JPH1195789A/ja
Publication of JPH1195789A publication Critical patent/JPH1195789A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】より確実な話者適応により、使用者の音声の特
徴に依存して起こる認識率の劣化を補償して、誰でもが
音声認識システムを有効に使用できる話者方法及び装置
を提供する。 【解決手段】音声認識システムにおいて、運転者の身
長、体重等の身体的な特徴、及び音声の特徴に基づい
て、音響モデルを制約あるいは変更する。カーナビゲー
ションへの応用例では、シートの下に設置した体重計マ
ットやシート位置検出を用いて、運転者の体重、身長等
の身体的な特徴を自動的に検出し、身体的な特徴との相
関を用いて、音響モデルを選択または変更する。さら
に、これと併用して、運転者の音声の個人的な特徴を検
出することで、運転者に合わせた音響モデルを用いるよ
うにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識システム
に関し、特に、話者に適合して認識率を向上させること
ができる話者適応方法および装置に関する。
【0002】
【従来の技術】図1は、本発明が生まれるに至った、従
来の話者適応の概念を示す図である。従来の話者適応
は、入力音声100を用いて、その話者に合った音響モ
デルを適応する処理300を行い、従来の音声認識処理
500を行い、認識結果999を出力する。音響モデル
適応処理300は、個人性の情報を抽出する処理310
とその結果から既存の音響モデルを適応する処理350
とから構成される。
【0003】
【発明が解決しようとする課題】従来の音声認識システ
ムでは、依然、認識率の話者依存性が大きく、かつ話者
適応を行う場合もどのような特徴をもって話者適応を行
うかが明確でないという問題があった。
【0004】本発明の目的は、より確実な話者適応によ
り、使用者の音声の特徴に依存して起こる認識率の劣化
を補償して、誰でもが音声認識システムを有効に使用で
きる話者方法及び装置を提供することにある。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、本発明による音声認識システムにおける話者適応方
法では、話者の身体的特徴情報を検出し、該身体的特徴
情報に応じて当該話者の音声の特徴を推測し、該推測し
た音声の特徴に適した音声認識システムの音響モデルを
用いて音声認識を行うことを特徴とする。
【0006】身体的特徴情報とは、例えば、話者の体重
情報および身長情報の少なくとも一方である。
【0007】このような身体的特徴は、音声発声器官の
大小、長短の尺度と基本的には比例的な関係があり、こ
れらの情報から、音声発声器官の特徴を推測することが
可能である。
【0008】本発明によって、従来のように単に話者の
音声による話者適応では行えないような、より適切な話
者適応を行うことが可能になり、その結果として、任意
の話者の音声に対する認識率を向上させることができ
る。
【0009】このような方法を実現するシステムとして
の、本発明による音声認識機能を搭載した音声認識シス
テムは、話者の身体的特徴情報を取得する手段と、話者
の身体的特徴情報と音声の特徴とを対応づけた対応テー
ブルと、前記取得された身体的特徴情報を前記対応テー
ブルに照らして前記話者の音声の特徴を抽出する手段
と、音声認識のための複数の音響モデルと、前記抽出さ
れた音声の特徴に適合した音響モデルを前記複数の音響
モデルの中から選択または変換する音響モデル適応手段
と、該音響モデル適応手段により得られた音響モデルを
用いて話者の音声認識処理を行う音声認識処理手段とを
備えたことを特徴とする。
【0010】前記音声認識システムがカーナビゲーショ
ン装置に搭載される場合、前記体重情報を取得する手段
は話者の座席に配置されるマット型体重計を有し、前記
身長情報を取得する手段は話者の座席の位置を検出する
シート位置検出計を有する。
【0011】カーナビゲーションのように身長情報の取
得のためにシート位置検出計を利用できない場合、前記
身長情報を取得する手段としては話者の画像を取得する
ビデオカメラおよび当該画像の処理により身長情報を得
る処理手段により構成することができる。
【0012】身体的特徴に加えて、話者による予め指定
された適応語の発声内容から話者の音声の特徴を識別
し、該音声の特徴と、前記話者の身体的特徴情報に基づ
いて得られた音声の特徴とを組合せて用いてもよい。こ
の場合、前記音響モデル適応手段は、当該組み合わせた
音声の特徴に基づいて前記音響モデルの選択または変換
を行う。
【0013】前記音響モデルは、少なくとも男性用、女
性用の2種類が設けられる。さらには、予め身体的特徴
ごとに別個の音響モデルを設けてもよい。
【0014】話者の音声認識に先立ち前記音響モデルの
話者適応を適用するか否かをユーザが選択する選択手段
を設ければ、必要な場合にだけ話者適応を行うことが可
能となる。
【0015】
【発明の実施の形態】以下、実施の形態を詳細に説明す
る。
【0016】図2は、本発明である話者適応の方式を示
す処理の概念図である。話者適応処理300は、図1で
説明した従来の音声の特徴からの話者適応処理の他に、
音声を特徴付ける話者の身長や体重などの身体的な特徴
情報から、音声の個人的な特徴情報を抽出して、既存の
音響モデルを適応する方式となっている。
【0017】具体的には、音声100、あるいはマット
型体重計160、及び/またはシート位置検出計170
の測定結果を入力情報として、音声100からは音声の
個人性情報抽出部310において、使用者の音声の特徴
が抽出される。また、マット型体重計160、及び/ま
たはシート位置検出計170を入力情報とした場合は、
まず身体的な特徴変換部320において、体重、あるい
は身長の情報へ変換され、音声特徴変換部330にて、
その使用者の音声の特徴へ変換される。以上の手段にて
抽出された音声の個人性情報をもとに、音響モデルの話
者適応部350にて、認識に使用される音響モデルが使
用者に適した音響モデルとなるように話者適応が実行さ
れる。その後、通常の音声認識500が実行され、認識
結果999が出力される。
【0018】図3は、本発明の主点である、話者の身体
的な特徴を検出する手段の一例を示した図である。本実
施の形態では、カーナビゲーション装置への音声認識の
応用を取り上げて説明している。
【0019】まず、カーナビゲーション装置を搭載した
車輌1000において、図に示すように座席シート15
0の下に、マット型体重計160が備え付けられてお
り、座席使用者、すなわち通常は運転者の体重が自動的
に検出される。また、運転者が座席の位置合わせをする
ことにより、備え付けられたシート位置検出計170か
ら運転者のおおよその身長が検出されることになる。こ
れらの体重と身長の尺度は、音声発声器官の大小、長短
の尺度と基本的には比例的な関係があり、体重や身長か
ら、音声発声器官の特徴を推測することが可能である。
【0020】図4は、本発明の構成の一例を詳細に示す
ブロック図である。音声信号100を入力として、音声
入力部200のLPF(Low Pass Filter)2010と
A/Dコンバータ2020にて、音声信号のサンプリン
グが行われ、アナログの音声情報がデジタルの音声波形
情報へと変換される。その後、音声分析部210にて、
音声の特徴パラメータが抽出される。音声パラメータに
関しては、例えば線形予測分析により求まるLPCケプ
ストラムなどがある。詳細は、例えば、文献「音声情報
処理の基礎」(斉藤収三、中田和男共著、オーム社)を
参照されたい。その後、個人性情報抽出部310にて、
音声の個人的な情報(個人性情報)が抽出される。本実
施の形態ではこの個人性情報は、声の高低の情報を規定
している基本周波数(ピッチ)情報である。この音声信
号100に基づいて得られた個人性情報は、後述する身
体的な特徴から求められた個人性情報との併合処理34
0により、組み合わされる。この併合処理340では、
例えば音声から得た個人性情報と身体的特徴から得た個
人性情報とを、ある重み付けで平均化する、等の方法を
採用する。または、ある変換テーブルを用いて2つの情
報を併合する。具体的には、ピッチ情報でみた時は併合
された結果のピッチ情報の値となる。
【0021】身体的な情報からの個人性情報の求め方と
しては、本発明では体重と身長とを取り上げた。すなわ
ち、体重情報110はマット型体重計160にて体重の
尺度として計量され、シート位置信号120は、シート
検出計170にて身長の尺度として計量される。その
後、体重や身長と音声との相関的な関係を利用して、音
声特徴変換部330にて、音声の個人性情報へと変換さ
れる。この個人性情報としては、認識に用いる音響モデ
ルの分布(特徴パラメータの値の分布)や、あるいは単
純には声の高低の情報を規定しているピッチ情報などが
ある。その後、すでに説明したように、音声から求めら
れた個人性情報との併合処理340にて、併合が行わ
れ、音響モデル適応部350にて、音響モデルの適応が
行われる。さらに音声認識処理部500にて、音声認識
処理が実行され、認識結果999が出力される。音響モ
デルの制約(選択)、変換と音声認識の実行の際には、
音響モデル400が読み込まれ、音響モデルの変換では
音響モデルの修正、音声認識では利用が行われる。
【0022】図5は、本発明による音響モデル適応部3
50の一例を示すブロック図である。併合処理340に
て併合が行われ、個人性情報を入力として音声特徴比較
部3510にて、既に格納されている標準的な複数の音
響モデル400と該個人性情報との比較が行われ、次の
適応判定部3520にて、該音響モデルの選択、変換な
どの音響モデル適応実行部3530の具体的な処理の判
定が決定される。本実施の形態では、適応処理として
は、例えば、音響モデル制約部3531あるいは音響モ
デル変換部3532がある。音響モデル制約部3531
では、複数格納されている音響モデルの中から、使用者
の個人性情報から得られた音声の特徴に類似している音
響モデルのセットが選択されて、設定される。音響モデ
ル変換部3532では、使用者の音声の特徴をもとに、
既存の音響モデルが変換されて、新しい音響モデルに設
定される。新しく設定された音響モデルは、音響モデル
格納部400に新たに格納されて、次の音声認識処理部
にて使用される。
【0023】なお、音響モデル制約部3531と音響モ
デル変換部3532の使い分けは例えば次のように行わ
れる。すなわち、複数の音響モデルを記録しておけるメ
モリ規模が十分にある装置では、数多くの使用者に対応
した数多くの音響モデルを記録しておき、音響モデル制
約部により、実際の使用者に合致した音響モデルが決定
される。十分な記録メモリがない装置においては、記録
されている音響モデルを変換処理して、使用者の音声に
合致した音響モデルを算出する。
【0024】図6は、音声認識処理部500の一例を示
すブロック図である。本実施の形態では、音声認識処理
部の例としては、連続型ヒドン・マルコフ・モデル(Hi
ddenMarkov Models)を使用した場合を考える。連続型
ヒドン・マルコフ・モデルに関しては、文献「確率モデ
ルによる音声認識」(中川聖一著、(社)電子情報通信
学会編)に詳細に説明されている。図4にて説明したよ
うに、入力音声信号をサンプリングして得られた音声の
特徴パターンを入力として、本実施の形態により話者に
適応された音響モデル400を用いて、ヒドン・マルコ
フ・モデルによる音響照合が実行される。すなわち、確
率分布計算部510にて入力音声の特徴パターンに対し
て、音響モデルの分布確率が計算される。更に、確率累
積部520にて、単語辞書600に記述された単語の系
列に対応した音響モデルの確率分布が累積されて、単語
辞書の各エントリィの累積確率が求まる。その後、判定
部530にて、確率がもっとも高い単語エントリィが認
識結果999として出力される。本実施の形態では、単
語認識を例にして説明したが、例えば文節認識や文章認
識も、単語辞書を文節や文章の文字系列とすることで、
単語認識と同様にして実現される。
【0025】なお、一旦話者適応された後は、基本的に
は話者が変わらない限り話者適応を行う必要はないの
で、個人性情報の抽出および音響モデル適用の処理の実
行は不要である。
【0026】図7は、本実施の形態による身長・体重等
検出部320及び音声特徴変換部330の一例を示す図
である。体重信号(体重値)110及びシート位置信号
120は、それぞれ、身長・体重等検出部320のマッ
ト型体重計160とシート位置検出計170にて生成さ
れる。シート位置信号120は身長変換部180にて身
長値情報130へ変換される。その後、これら2つの情
報は、音声特徴変換部330にて音声の特徴パターンに
変換される。具体的には、音声特徴比較部3310に
て、音声特徴と体重・身長の値との対応関係を記述した
音声特徴対応データ3320を使って、体重値と身長値
にもっとも対応した音声特徴が男女別に抽出され、これ
に対応して音声特徴変換パラメータ算出部3330にて
音声特徴パラメータが求められることになる。
【0027】音声特徴対応データ3320としては、例
えば、図12に示すように、男女別に、それぞれ体重と
身長の区分ごとに対応する音響特徴としての基本周波数
(ピッチ)範囲を定めたテーブルが予め設けられてい
る。
【0028】音声特徴パラメータとしては、例えば特定
の音節、音韻などの音響モデルに対応する特徴パラメー
タであり、この情報をもとに音響モデル全体の分布を音
声認識使用者の音声に適応した音響モデルへと適応させ
ることになる。なお、この場合、男声と女声用に別々の
音響モデルを用いて音声認識が行われ、結果の良好な方
が選ばれることになる。
【0029】図8は、本実施の形態をカーナビゲーショ
ンへ応用した時の概念を示す図である。カーナビゲーシ
ョン装置5000は、表示部5010、スピーカ502
0、イァフォンジャク5030、セレクタ5040、及
びマイクロホン5050で少なくとも構成されている。
話者適応の概念は、マイクロホン5050から入力され
たカーナビゲーション装置の使用者の音声をもとに既存
の音響モデルを適応することと、車の運転席などに備え
付けられた体重マットやシート位置検出計の入力をもと
に音響モデルが適応されることになる。使用者の音声を
もとに既存の音響モデルを適応する場合は、例えば「お
はよう」とか「今日は」などのような挨拶の音声を入力
として、その話者の音声に近くなるように音響モデルを
適応化することが考えられる。スピーカ5020やイァ
フォンジャク5030は、システムからの応答音声を出
力する装置として働く。さらに、セレクタ5040は話
者の音声認識に先立って話者適応手段を実行するかどう
かの設定を行うために設けられている。
【0030】図9は、音声認識における話者依存を示す
音声認識性能評価結果の一例を示す図である。認識率
は、話者一律に同じ値ではなく、通常は発声の仕方や、
音声の訛りなどのくせにより、話者に依存して異なった
性能値を示す。図9では、認識率は80%以下から10
0%近くまで分布しており、90%近辺でもっとも話者
が多い結果となっていることがわかる。本実施の形態
は、既存の音響モデル等の話者適応を効率良く行い、認
識率の悪い話者に対しても認識理性能の向上を実現する
ことができる。
【0031】図10は、本実施の形態で使用する話者適
応方式の一例を示す概念図である。既存のHMMの音響
モデルの特徴空間6100が図に示したような分布とな
っているとき、本実施の形態による適応化によって、特
定話者の音響モデル空間6200へと変換適応される。
本実施の形態では、音響モデルの音声単位を音韻よりも
短い音素片6000としている。本実施の形態では、こ
のような音素片6000などを表現した音響モデルの話
者適応を行う。
【0032】図11は、話者適応を施した結果として、
認識性能向上の一例を示す概念図である。本例では、予
め決められた単語の発声を条件として音響モデルを話者
適応する例を挙げている。横軸は適応語数を示し、適応
単語が増えるに従って、平均認識率と、最も認識率が悪
い最下位話者に対する認識率も向上することがわかる。
とくに、適応単語数がさらに増加すると、最下位話者の
認識率が平均の認識率へ近づき、話者適応の効果が大き
いことがわかる。本例は、実際の話者適応の結果得られ
た評価結果である。本発明では、これに対してさらに体
重および身長等の個人性情報を考慮した話者適応を行う
ことによりさらに認識率を向上させることができる。
【0033】図4では個人性情報抽出部310でピッチ
情報を抽出する例を説明したが、ピッチ情報に加えて、
またはピッチ情報に代えて、性別を抽出するようにして
もよい。この変形例について図13および図14により
説明する。
【0034】図13(a)(b)は、それぞれ母音/a
/と/i/のフォルマントを模式的に表した周波数分析
結果を示すグラフである。フォルマントとは、周波数軸
上での共振周波数スペクトルの山(ピーク)のことであ
る。図13では、周波数の低い側から第1フォルマント
(F1)、第2フォルマント(F2)、第3フォルマン
ト(F3)としている。このフォルマントおよびスペク
トル全体の形状や傾斜は、性別によって異なり、また個
人個人によっても異なる。
【0035】図14に、第1フォルマントを横軸、第2
フォルマントを縦軸にとったF1−F2平面上での5母
音の分布の模式図を示す。各母音のF1−F2プロット
点は個人個人で異なる。また一般に、各母音についての
プロット点は、概ね図14の長方形の領域で示すような
範囲内に包含される。通常、成人男声は成人女声に比べ
てそのF1,F2はともに、より低い側にあることが知
られている。このことから、図4の個人性情報抽出部3
10で入力音声が男声が女声かを推測することができ
る。したがって、この例では、音響モデル適応部350
で入力音声の判定結果に基づいて男声または女声用の音
響モデルを選択することができる。
【0036】以上は、本発明をカーナビゲーションへ適
用した例を示したが、本発明はこれに限定されるもので
はない。例えば、公共サービス端末に適用することもで
きる。(ここで、「公共サービス」とは私企業によるサ
ービスを排除する意図ではなく、公共的に行われるサー
ビスを意味している。) 図15にこのような公共サービス端末1500の構成例
を示す。この公共サービス端末1500は、ユーザ15
10が表示部1503の画面に対してタッチパネルや操
作ボタン等(図示せず)の操作により特定のサービスを
受けるためのものであり、ユーザの位置する床面にマッ
ト型体重計1505、ユーザ1510の前面上部にビデ
オカメラ1502が配置されている。また、ユーザ15
10の音声を収集するためのマイクロホン1504も設
けられている。これらの各要素は処理装置1501の下
で集中管理され、体重情報、画像情報、音声情報が取り
込まれる。処理装置1501では、画像情報から大凡の
ユーザの身長情報を求める。したがって、求められた体
重情報および身長情報に基づいて、上記の例と同様に話
者適応が行える。
【0037】以上、本発明の好適な実施の形態について
説明したが、本発明の要旨を逸脱することなく種々の変
形・変更を行うことが可能である。例えば、上記のカー
ナビゲーション装置への応用例では、運転者の発声の音
声認識を行う構成としたが、搭乗者席においてもその体
重および座席位置を検出する機能を設け、運転者と搭乗
者のいずれが発声するかに応じてユーザがその切替を行
う手段を設けるようにしてもよい。
【0038】
【発明の効果】本発明によれば、より確実な話者適応を
可能とし、認識率の性能を向上させ、結果として操作性
の良い音声認識応用システムを提供できる効果がある。
【図面の簡単な説明】
【図1】本発明が生まれるに至った、従来の話者適応の
概念を示す図。
【図2】本発明である話者適応の方式を示す処理の概念
図。
【図3】本発明の主点である、話者の身体的な特徴を検
出する手段の一例を示した図。
【図4】本発明の構成の一例を詳細に示すブロック図。
【図5】図4に示した音響モデル適応部の一例を示すブ
ロック図。
【図6】図4に示した音声認識処理部の一例を示すブロ
ック図。
【図7】本発明による身長・体重等検出部、及び音声特
徴変換部の一例を示す図。
【図8】本発明をカーナビゲーションへ応用した場合の
概念を示す図。
【図9】音声認識における話者依存を示す音声認識性能
評価結果の一例を示す図。
【図10】本発明で使用する話者適応方式の一例を示す
概念図。
【図11】認識性能向上の一例を示す概念図。
【図12】本発明における音声特徴対応データの一例を
示す説明図。
【図13】母音/a/と/i/のフォルマント構成の説
明図。
【図14】男性と女性の母音のF1−F2分布を示す説
明図。
【図15】本発明を公共サービス端末へ応用した場合の
構成を示す図。
【符号の説明】
100…音声信号、110…体重信号、120…シート
位置信号、150…座席シート、160…マット型体重
計、170…シート位置検出計、180…身長変換部、
200…音声入力部、210…音声分析部、300…音
響モデル適応処理、310…音声の個人性情報抽出処
理、320…身体的な特徴検出部、330…音声特徴変
換部、3310…音声特徴比較部、3320…音声特徴
対応データ、3330…音声特徴変換パラメータ算出
部、個人性情報融合部…340、350…音響モデル適
応部、3510…音響特徴比較部、3520…適応判定
部、3530…音響モデル適応実行部、3531…音響
モデル制約部、3532…音響モデル変換部、400…
音響モデル、500…音声認識処理、510…確率分布
計算部、520…確率累積部、530…判定部、600
…単語辞書、999…認識結果、2000…話者適応機
能付き音声認識システム、5000…カーナビゲーショ
ン装置、5010…表示部、5020スピーカ、503
0…イァホンジャック、5040…セレクタ、5050
…マイクロホン、6000…音素片、6100…HMM
モデルの特徴空間、6200…特定話者モデルの特徴空
間。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 天野 明雄 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 江尻 正員 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 大場 信弥 東京都小平市上水本町五丁目20番1号 株 式会社日立製作所半導体事業部内

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】音声認識機能を搭載した音声認識システム
    における話者適応方法であって、 話者の身体的特徴情報を検出し、該身体的特徴情報に応
    じて当該話者の音声の特徴を推測し、該推測した音声の
    特徴に適した音声認識システムの音響モデルを用いて音
    声認識を行うことを特徴とする音声認識システムにおけ
    る話者適応方法。
  2. 【請求項2】前記身体的特徴情報は、話者の体重情報お
    よび身長情報の少なくとも一方である請求項1記載の音
    声認識システムにおける話者適応方法。
  3. 【請求項3】話者による予め指定された適応語の発声内
    容から話者の音声の特徴を識別し、該音声の特徴と、前
    記話者の身体的特徴情報に基づいて得られた音声の特徴
    とを組合せた音声の特徴に基づいて前記音響モデルの選
    択または変換を行うことを特徴とする請求項1または2
    記載の音声認識システムにおける話者適応方法。
  4. 【請求項4】音声認識機能を搭載した音声認識システム
    において、 話者の身体的特徴情報を取得する手段と、 話者の身体的特徴情報と音声の特徴とを対応づけた対応
    テーブルと、 前記取得された身体的特徴情報を前記対応テーブルに照
    らして前記話者の音声の特徴を抽出する手段と、 音声認識のための複数の音響モデルと、 前記抽出された音声の特徴に適合した音響モデルを前記
    複数の音響モデルの中から選択または変換する音響モデ
    ル適応手段と、 該音響モデル適応手段により得られた音響モデルを用い
    て話者の音声認識処理を行う音声認識処理手段と、 を備えたことを特徴とする音声認識システム。
  5. 【請求項5】前記身体的特徴情報は、話者の体重情報お
    よび身長情報の少なくとも一方である請求項4記載の音
    声認識システム。
  6. 【請求項6】前記音声認識システムはカーナビゲーショ
    ン装置に搭載され、前記体重情報を取得する手段は話者
    の座席に配置されるマット型体重計を有し、前記身長情
    報を取得する手段は話者の座席の位置を検出するシート
    位置検出計を有することを特徴とする請求項5記載の音
    声認識システム。
  7. 【請求項7】前記体重情報を取得する手段は話者の位置
    する場所に配置されるマット型体重計を有し、前記身長
    情報を取得する手段は話者の画像を取得するビデオカメ
    ラおよび当該画像の処理により身長情報を得る処理手段
    を有することを特徴とする請求項5記載の音声認識シス
    テム。
  8. 【請求項8】話者による予め指定された適応語の発声内
    容から話者の音声の特徴を識別し、該音声の特徴と、前
    記話者の身体的特徴情報に基づいて得られた音声の特徴
    とを組合せ、前記音響モデル適応手段は、当該組み合わ
    せた音声の特徴に基づいて前記音響モデルの選択または
    変換を行うことを特徴とする請求項4記載の音声認識シ
    ステム。
  9. 【請求項9】前記音響モデルは、少なくとも男性用、女
    性用の2種類が設けられることを特徴とした音声認識シ
    ステムにおける請求項4〜8のいずれかに記載の音声認
    識システム。
  10. 【請求項10】話者の音声認識に先立ち前記音響モデル
    の話者適応を適用するか否かをユーザが選択する選択手
    段を有することを特徴とする請求項4〜9のいずれかに
    記載の音声認識システム。
JP9259844A 1997-09-25 1997-09-25 音声認識システムおよび音声認識システムにおける話者適応方法 Pending JPH1195789A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9259844A JPH1195789A (ja) 1997-09-25 1997-09-25 音声認識システムおよび音声認識システムにおける話者適応方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9259844A JPH1195789A (ja) 1997-09-25 1997-09-25 音声認識システムおよび音声認識システムにおける話者適応方法

Publications (1)

Publication Number Publication Date
JPH1195789A true JPH1195789A (ja) 1999-04-09

Family

ID=17339778

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9259844A Pending JPH1195789A (ja) 1997-09-25 1997-09-25 音声認識システムおよび音声認識システムにおける話者適応方法

Country Status (1)

Country Link
JP (1) JPH1195789A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003474A (ja) * 2006-06-26 2008-01-10 Funai Electric Co Ltd 電子機器
WO2011077509A1 (ja) * 2009-12-21 2011-06-30 富士通株式会社 音声制御装置、及び音声制御方法
WO2011111221A1 (ja) * 2010-03-12 2011-09-15 三菱電機株式会社 エレベータの音声呼び登録装置
JP2021033048A (ja) * 2019-08-23 2021-03-01 サウンドハウンド,インコーポレイテッド 車載装置、発声を処理する方法およびプログラム
US11468892B2 (en) 2019-10-10 2022-10-11 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling electronic apparatus

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003474A (ja) * 2006-06-26 2008-01-10 Funai Electric Co Ltd 電子機器
WO2011077509A1 (ja) * 2009-12-21 2011-06-30 富士通株式会社 音声制御装置、及び音声制御方法
WO2011111221A1 (ja) * 2010-03-12 2011-09-15 三菱電機株式会社 エレベータの音声呼び登録装置
CN102762477A (zh) * 2010-03-12 2012-10-31 三菱电机株式会社 电梯的语音呼梯登记装置
JP5252119B2 (ja) * 2010-03-12 2013-07-31 三菱電機株式会社 エレベータの音声呼び登録装置
JP2021033048A (ja) * 2019-08-23 2021-03-01 サウンドハウンド,インコーポレイテッド 車載装置、発声を処理する方法およびプログラム
US11468892B2 (en) 2019-10-10 2022-10-11 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling electronic apparatus

Similar Documents

Publication Publication Date Title
US10410623B2 (en) Method and system for generating advanced feature discrimination vectors for use in speech recognition
JP4568371B2 (ja) 少なくとも2つのイベント・クラス間を区別するためのコンピュータ化された方法及びコンピュータ・プログラム
KR101614756B1 (ko) 음성 인식 장치, 그를 포함하는 차량, 및 그 차량의 제어 방법
JP4355322B2 (ja) フレーム別に重み付けされたキーワードモデルの信頼度に基づく音声認識方法、及びその方法を用いた装置
JP4914295B2 (ja) 力み音声検出装置
US20030069729A1 (en) Method of assessing degree of acoustic confusability, and system therefor
JP6708035B2 (ja) 発話内容認識装置
US20070136060A1 (en) Recognizing entries in lexical lists
JP5007401B2 (ja) 発音評定装置、およびプログラム
JPH11175082A (ja) 音声対話装置及び音声対話用音声合成方法
JP3611223B2 (ja) 音声認識装置及び方法
JP3673507B2 (ja) 音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム
JP5803125B2 (ja) 音声による抑圧状態検出装置およびプログラム
JP2011217018A (ja) 音声応答装置及びプログラム
JP5185841B2 (ja) ユーザ音声診断装置及びユーザ音声診断方法
JP5152588B2 (ja) 声質変化判定装置、声質変化判定方法、声質変化判定プログラム
JPH1195789A (ja) 音声認識システムおよび音声認識システムにおける話者適応方法
JP5402089B2 (ja) 音響信号変換装置、方法、及びプログラム
JP2008275987A (ja) 音声認識装置および会議システム
JP3798530B2 (ja) 音声認識装置及び音声認識方法
KR100989867B1 (ko) 자동 노래 채보방법
JP2002189487A (ja) 音声認識装置および音声認識方法
KR100991464B1 (ko) 자동 노래 채보장치
JP2008216618A (ja) 音声判別装置
JP4798606B2 (ja) 音声認識装置、およびプログラム