JPH06110492A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH06110492A
JPH06110492A JP5131866A JP13186693A JPH06110492A JP H06110492 A JPH06110492 A JP H06110492A JP 5131866 A JP5131866 A JP 5131866A JP 13186693 A JP13186693 A JP 13186693A JP H06110492 A JPH06110492 A JP H06110492A
Authority
JP
Japan
Prior art keywords
voice
data
processing unit
word section
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5131866A
Other languages
English (en)
Inventor
Kenichi Oishi
健一 大石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5131866A priority Critical patent/JPH06110492A/ja
Publication of JPH06110492A publication Critical patent/JPH06110492A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】音声認識装置に関し、使用者が発声する音声以
外のノイズ成分を効果的に排除するための手段を提供す
ることを目的とする。 【構成】ある単語区間のスペクトルデータ中から母音部
分を検出する母音検出処理部4と、この母音検出処理部
より受け取る、ある単語区間のスペクトルデータ中に含
まれる母音部分の有無あるいは割合に関する情報に基づ
いて、その単語区間が使用者による発声音声によるもの
であるか、それとも背景ノイズに起因したものであるか
を判定するノイズ判別処理部5とを設けることにより構
成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声入力装置におい
て、使用者の発声音声と、これとは区別が困難な、突発
的・大音量のノイズとを判別するための方式に関する。
【0002】近年、音声認識装置は徐々に実用化が進
み、補助の入力手段に用いることが可能になってきた。
また、FA化などにより、従来のキーボード等の入力手
段を用いることが不可能な環境へも、コンピュータが導
入されるようになり、従来の入力手段に代わる新しい入
力手段としての音声認識装置を運用することが要求され
ている。よって、高精度、かつ高認識率な入力を可能と
する音声認識装置を実用化することは、重要なことであ
る。
【0003】
【従来の技術】従来の音声認識装置においては、主に入
力音の有無、あるいは入力音量の大小を入力音声の検出
基準としている。よって、従来の音声認識装置は、なん
らかの音を検出した場合や、ある一定のレベル範囲の音
量を検出した場合にのみ動作する。
【0004】ところが、音声認識装置は先に述べたよう
に、FA環境等の高騒音下での運用要求が非常に高いの
で、その背景には衝撃音など、使用者の発声音と同程度
の音量を持つノイズが数多く存在する。そのため、音声
認識装置が、それらのノイズをも認識の対象としてしま
うことがしばしば発生する。
【0005】
【発明が解決しようとする課題】このように、従来の音
声認識装置では、背景ノイズを入力音声として誤認識
し、無意味な処理・実行結果を出力する。そのため、音
声認識装置を擁するシステムの運用を頻繁に妨げるとい
った問題を生じていた。
【0006】本発明は、このような従来の問題点に鑑み
て為されたものであり、使用者が発声する音声以外の入
力ノイズを効果的に排除することにより、音声認識装置
の性能を向上して、音声認識装置を擁したシステムの円
滑な運用を図ることを目的とする。
【0007】
【課題を解決するための手段】本発明によれば、上述の
目的は、前記特許請求の範囲に記載した手段にて達成さ
れる。
【0008】すなわち、請求項1の発明は、入力音声を
単位時間ごとにサンプリングし、音声データを生成する
サンプリング処理部と、音声データより入力データとし
て有効な単語区間を検出する単語区間検出処理部と、音
声データの周波数成分を解析し、スペクトルデータを生
成するスペクトル解析処理部とを持つ装置において、あ
る単語区間のスペクトルデータ中から、母音部分を検出
する母音検出処理部と、この母音検出処理部より受け取
る、ある単語区間のスペクトルデータ中に含まれる母音
部分の有無あるいは割合に関する情報に基づいて、その
単語区間が使用者による発声音声によるものであるか、
それとも背景ノイズに起因したものであるかを判定する
ノイズ判別処理部とを設ける音声認識装置である。
【0009】また、請求項2の発明は、各母音のスペク
トルデータを予め保持する手段を具備すると共に、この
各母音のスペクトルデータと、入力するスペクトルデー
タとの間で、数学的距離尺度と距離閾値とを用い、前記
入力するスペクトルデータ中から母音部分を検出する母
音検出処理部を設ける音声認識装置である。
【0010】また、請求項3の発明は、入力音声を単位
時間毎にサンプリングして音声データを生成するサンプ
リング処理部と、音声データより入力データとして有効
な単語区間を検出する単語区間検出処理部と、単語区間
の冒頭部分における音量変化の大小から、立ち上がりの
急峻性をみて、その単語区間が使用者の発声音声による
ものか、あるいは衝撃性背景ノイズによるものかを判定
するノイズ判別処理部とを具備する音声認識装置であ
る。
【0011】また、請求項4の発明は、入力音声の波形
振幅量からパワー値を生成するパワー算出部と、入力音
声を単位時間毎にサンプリングして音声データを生成す
るサンプリング処理部と、音声データより入力データと
して有効な単語区間を検出する単語区間検出処理部と、
単語区間先頭と直前部分における入力音のパワー値の差
の大小から、立ち上がりの急峻性をみて、その単語区間
が使用者の発声音声によるものか、あるいは衝撃性背景
ノイズによるものかを判定するノイズ判別処理部とを具
備する音声認識装置である。
【0012】また、請求項5の発明は、入力音声の波形
振幅量からパワー値を生成するパワー算出部と、入力音
声を単位時間毎にサンプリングして音声データを生成す
るサンプリング処理部と、音声データより入力データと
して有効な単語区間を検出する単語区間検出処理部と、
単語区間先頭と最初の極大パワー値部分における入力音
のパワー値の差の大小から、立ち上がりの急峻性をみ
て、その単語区間が使用者の発声音声によるものか、あ
るいは衝撃性背景ノイズによるものかを判定するノイズ
判別処理部とを具備する音声認識装置である。
【0013】また、請求項6の発明は、入力音声を単位
時間毎にサンプリングして音声データを生成するサンプ
リング処理部と、音声データより入力データとして有効
な単語区間を検出する単語区間検出処理部と、音声デー
タの周波数成分を、周波数方向に適当な次数をとったベ
クトル値として解析し、スペクトルデータを生成するス
ペクトル解析処理部と、単語区間先頭と直前部分におけ
るスペクトルデータのベクトル長の差の大小から、立ち
上がりの急峻性をみて、その単語区間が使用者の発声音
声によるものか、あるいは衝撃性背景ノイズによるもの
かを判定するノイズ判別処理部とを具備する音声認識装
置である。
【0014】また、請求項7の発明は、入力音声の波形
振幅量からパワー値を生成するパワー算出部と、入力音
声を単位時間毎にサンプリングして音声データを生成す
るサンプリング処理部と、音声データより入力データと
して有効な単語区間を検出する単語区間検出処理部と、
音声データの周波数成分を、周波数方向に適当な次数を
とったベクトル値として解析し、スペクトルデータを生
成するスペクトル解析処理部と、単語区間先頭と最初の
極大パワー値部分におけるスペクトルデータのベクトル
長の差の大小から、立ち上がりの急峻性をみて、その単
語区間が使用者の発声音声によるものか、あるいは衝撃
性背景ノイズによるものかを判定するノイズ判別処理部
とを具備する音声認識装置である。
【0015】また、請求項8の発明は、入力音声を単位
時間毎にサンプリングして音声データを生成するサンプ
リング処理部と、音声データより入力データとして有効
な単語区間を検出する単語区間検出処理部と、音声デー
タの周波数成分を解析し、スペクトルデータを生成する
スペクトル解析処理部と、単語区間の冒頭部分における
スペクトル変化の大小から、立ち上がりの急峻性をみ
て、その単語区間が使用者の発声音声によるものか、あ
るいは衝撃性背景ノイズによるものかを判定するノイズ
判別処理部とを具備する音声認識装置である。
【0016】また、請求項9の発明は、入力音声の波形
振幅量からパワー値を生成するパワー算出部と、入力音
声を単位時間毎にサンプリングして音声データを生成す
るサンプリング処理部と、音声データより入力データと
して有効な単語区間を検出する単語区間検出処理部と、
音声データの周波数成分を解析し、スペクトルデータを
生成するスペクトル解析処理部と、単語区間の先頭と最
初の極大パワー値部分におけるスペクトル変化の大小か
ら、立ち上がりの急峻性をみて、その単語区間が使用者
の発声音声によるものか、あるいは衝撃性背景ノイズに
よるものかを判定するノイズ判別処理部とを具備する音
声認識装置である。
【0017】また、請求項10の発明は、入力音声を単
位時間毎にサンプリングして音声データを生成するサン
プリング処理部と、音声データより入力データとして有
効な単語区間を検出する単語区間検出処理部と、音声デ
ータの周波数成分を、周波数方向に適当な次数をとった
ベクトル値として解析し、スペクトルデータを生成する
スペクトル解析処理部と、単語区間の先頭と直前部分に
おけるスペクトルデータのベクトル間距離の大小から、
立ち上がりの急峻性をみて、その単語区間が使用者の発
声音声によるものか、あるいは衝撃性背景ノイズによる
ものかを判定するノイズ判別処理部とを具備する音声認
識装置である。
【0018】また、請求項11の発明は、入力音声の波
形振幅量からパワー値を生成するパワー算出部と、入力
音声を単位時間毎にサンプリングして音声データを生成
するサンプリング処理部と、音声データより入力データ
として有効な単語区間を検出する単語区間検出処理部
と、音声データの周波数成分を、周波数方向に適当な次
数をとったベクトル値として解析し、スペクトルデータ
を生成するスペクトル解析処理部と、単語区間の先頭と
最初の極大パワー値部分におけるスペクトルデータのベ
クトル間距離の大小から、立ち上がりの急峻性をみて、
その単語区間が使用者の発声音声によるものか、あるい
は衝撃性背景ノイズによるものかを判定するノイズ判別
処理部とを具備する音声認識装置である。
【0019】図1は、本発明の原理説明図である。図
中、サンプリング処理部1は、入力音声のアナログ信号
を単位時間ごとのデジタル信号に変換することで音声デ
ータを生成する。単語区間検出処理部2は、音声データ
の音量情報から、音声データのうち入力データとして有
効な単語区間を検出する。スペクトル解析処理部3は、
音声データの周波数成分を解析し、スペクトルデータを
生成する。
【0020】また、母音検出処理部4は、予め用意した
母音スペクトルデータとの類似度判定により、スペクト
ルデータ中から母音部分を検出する。ノイズ判別処理部
5は、単語区間中に含まれる母音部分の有無により、前
記単語区間検出処理部2が検出した単語区間が、発声者
の入力音声によるものであるか、あるいは背景ノイズに
起因したものであるかの判別を行なう。
【0021】図3も、本発明の原理説明図である。図
中、サンプリング処理部21、単語区間検出処理部2
2、及びスペクトル解析処理部23は、図1に示したも
のと同様のものである。ノイズ判別処理部25は、例え
ば、単語区間の冒頭部分における音量の変化又はスペク
トル変化の大小から、検出された単語区間が発声者の入
力音声か、あるいは衝撃性背景ノイズかの判別を行な
う。
【0022】
【作用】図1に示すように、本発明では、単語区間中の
スペクトルデータを、母音検出処理部4が監視し、母音
らしいと判定できるスペクトルデータには母音部分であ
るという情報を付加する。
【0023】一般に、日本語を含む多くの言語では単語
中において確実に母音音素を伴うことが知られている
が、図1のノイズ判別処理部5では、この性質を利用し
ている。すなわち、単語区間中に母音部分であるという
ことを示す情報が付加されている部分が無いか、あるい
は極端に少ないかを調べ、該当する場合にはこれをノイ
ズと判別するようにする。
【0024】一方、一定以上の母音部分について付加情
報があれば、使用者が発声した音声と判別して動作を開
始する。このように、本発明による音声認識装置は、背
景ノイズが入力された場合には、これを除外し、使用者
の発声音声が入力された場合にのみ、認識結果を出力す
る。
【0025】また、図3に示すように、本発明では、サ
ンプリング処理部21が生成する音声データを元にし
て、単語区間検出処理部22が単語区間を検出し、スペ
クトル解析部23がスペクトルデータを出力する。ノイ
ズ判別処理部25は、これらの音声データ、単語区間、
スペクトルデータを参照し、単語区間の先頭の要素とそ
の直前の要素となる音声データ及びスペクトルデータよ
りパワー変化量及びスペクトル変化量を算出する。
【0026】そして、それぞれの変化量について衝撃性
背景ノイズとの尤度判定を行なう。一般に、衝撃性背景
ノイズは、音声(人声)に対し、比較的急峻なパワー又
はスペクトル変化を示すことが知られている。従って、
この判定において、ノイズとの尤度大と評価できた場合
には、衝撃性背景ノイズの入力があったものとしてその
単語区間を棄却し、尤度小と評価できた場合には、その
単語区間部分の音声データを次段の音声認識処理部26
に出力する。
【0027】このように、本発明による音声認識装置
は、衝撃性ノイズが入力された場合には、これを確実に
排除するため、使用者の発声音声に対してのみの認識結
果の出力が可能になる。
【0028】
【実施例】図2は、本発明の一実施例構成図である。図
中、母音検出処理部14は、予め各種母音について母音
スペクトルデータ17を持ち、入力音声から得られた入
力スペクトルデータ16の1単位部分ごととの類似度計
算を行なう。これにより、入力スペクトルデータ16の
ある単位部分が、母音であるか否かの判定を行ない、母
音部分の検出を行なう。
【0029】その検出結果の表示は、例えば、入力スペ
クトルデータ16のある単位部分が母音部分であるとい
うことを示す母音情報18を、その入力スペクトルデー
タ16に付与することによって行なう。
【0030】ノイズ判別処理部15は、単語区間検出処
理部12が検出した単語区間に含まれる範囲のスペクト
ルデータを参照していき、これを、母音の有無に関する
母音情報18を付与された部分と、付与されなかった部
分とに類別する。そして、例えば、母音情報18を付与
された部分がある一定の閾値を越えていれば、そのデー
タを有意な入力音声とし、閾値以内ならば、背景ノイズ
と判別する。
【0031】上述の実施例では、ノイズ判別処理部15
は、ノイズを判別するための基準として、母音部分を示
す母音情報18が付与された部分の総和を用いることと
したが、その他、例えば単語区間全体に占める比を判別
基準としてもよい。なお、サンプリング処理部11、及
びスペクトル解析処理部13は、図1に示す同名称のも
のと同様に作用するものである。
【0032】図4は、本発明の他の実施例構成図であ
る。図4において、不図示の単語区間検出処理部が検出
した単語区間と、スペクトル解析部が出力するスペクト
ルデータとが、‘単語区間情報付きスペクトルデータ’
としてノイズ判別処理部35に渡されている。
【0033】この‘単語区間情報付きスペクトルデー
タ’は、周波数軸上に適当な次元をとった、各次元にお
ける強さのベクトルで表わされる。このベクトルで次元
を無限大にとった場合、各元の値の総和は元のスペクト
ルデータの積分値と等しくなるので、ベクトルの各元の
総和をベクトル長とし、これを疑似パワーとして用い
る。
【0034】ノイズ判別処理部35は、単語区間先頭と
なるデータとその直前データとを参照し、ベクトル長の
差をパワー変化量として、また、ベクトル間距離をスペ
クトル変化量として、それぞれ算出する。パワー及びス
ペクトルそれぞれについて、音声と衝撃性背景ノイズの
両者の分布を分け隔てることができるように、予めパワ
ー閾値及びスペクトル閾値を定めておく。
【0035】そして、それぞれの閾値と、パワー変化量
及びスペクトル変化量とを比較評価して、例えば、双方
でノイズと評価された場合は衝撃性背景ノイズの入力が
あったものとしてその単語区間を棄却する。棄却されな
ければ、その単語区間のスペクトルデータが‘音声判別
済データ’として、不図示の音声認識処理部に渡され
る。
【0036】上記の実施例では、ノイズ判別処理部35
が算出するパワー変化量としてベクトル長の差を用いた
が、これ以外にも、例えば元の入力音声の音量、すなわ
ち波形振幅量から得られるパワー値の差を利用すること
もできる。パワー値の算出は、パワー算出処理部を設け
て行なえばよい。
【0037】また、スペクトル解析部が求めるスペクト
ルデータとして、周波数軸上に適当な次元をとった各次
元における強さのベクトルを、また、ノイズ判別処理部
が求めるスペクトル変化量として、ベクトル間距離を用
いたが、これらは、他のスペクトル表現パラメータ、例
えばケプストラム等とそのパラメータ間距離を用いても
よい。
【0038】さらに、ノイズ判別処理部35は、変化量
を測る対象として、単語区間の先頭となるデータとその
直前データを参照したが、これは、単語区間の冒頭部分
の最初の極大パワー値データと単語区間直前データとを
参照するようにしてもよい。また、ノイズ判別処理部3
5におけるノイズ判別基準として、パワー及びスペクト
ルの両判定結果の論理積を用いたが、必要に応じ、論理
和を用いてもよい。
【0039】
【発明の効果】以上説明したように、本発明によれば、
入力音声の中に背景ノイズが混入した場合であっても、
背景ノイズのみを除外することができるので、不要な認
識処理を誤って実行することが無い。よって、無意味な
認識結果の出力を回避できるという効果を奏し、音声認
識装置を用いたシステムの運用効率の向上に寄与すると
ころが大きい。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の一実施例構成図である。
【図3】本発明の原理説明図である。
【図4】本発明の他の実施例構成図である。
【符号の説明】
1,11,21 サンプリング処理部 2,12,22 単語区間検出処理部 3,13,23 スペクトル解析処理部 4,14 母音検出処理部 5,15,25,35 ノイズ判別処理部 16 入力スペクトルデータ 17 母音スペクトルデータ 18 母音情報 26 音声認識処理部

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】入力音声を単位時間ごとにサンプリング
    し、音声データを生成するサンプリング処理部(1)
    と、音声データより入力データとして有効な単語区間を
    検出する単語区間検出処理部(2)と、音声データの周
    波数成分を解析し、スペクトルデータを生成するスペク
    トル解析処理部(3)とを持つ装置において、 ある単語区間のスペクトルデータ中から、母音部分を検
    出する母音検出処理部(4)と、 この母音検出処理部(4)より受け取る、ある単語区間
    のスペクトルデータ中に含まれる母音部分の有無あるい
    は割合に関する情報に基づいて、その単語区間が使用者
    による発声音声によるものであるか、それとも背景ノイ
    ズに起因したものであるかを判定するノイズ判別処理部
    (5)とを設けることを特徴とする音声認識装置。
  2. 【請求項2】各母音のスペクトルデータを予め保持する
    手段を具備すると共に、この各母音のスペクトルデータ
    と、入力するスペクトルデータとの間で、数学的距離尺
    度と距離閾値とを用い、前記入力するスペクトルデータ
    中から母音部分を検出する母音検出処理部を設ける請求
    項1記載の音声認識装置。
  3. 【請求項3】入力音声を単位時間毎にサンプリングして
    音声データを生成するサンプリング処理部と、音声デー
    タより入力データとして有効な単語区間を検出する単語
    区間検出処理部と、単語区間の冒頭部分における音量変
    化の大小から、立ち上がりの急峻性をみて、その単語区
    間が使用者の発声音声によるものか、あるいは衝撃性背
    景ノイズによるものかを判定するノイズ判別処理部とを
    具備することを特徴とする音声認識装置。
  4. 【請求項4】入力音声の波形振幅量からパワー値を生成
    するパワー算出部と、入力音声を単位時間毎にサンプリ
    ングして音声データを生成するサンプリング処理部と、
    音声データより入力データとして有効な単語区間を検出
    する単語区間検出処理部と、単語区間先頭と直前部分に
    おける入力音のパワー値の差の大小から、立ち上がりの
    急峻性をみて、その単語区間が使用者の発声音声による
    ものか、あるいは衝撃性背景ノイズによるものかを判定
    するノイズ判別処理部とを具備することを特徴とする音
    声認識装置。
  5. 【請求項5】入力音声の波形振幅量からパワー値を生成
    するパワー算出部と、入力音声を単位時間毎にサンプリ
    ングして音声データを生成するサンプリング処理部と、
    音声データより入力データとして有効な単語区間を検出
    する単語区間検出処理部と、単語区間先頭と最初の極大
    パワー値部分における入力音のパワー値の差の大小か
    ら、立ち上がりの急峻性をみて、その単語区間が使用者
    の発声音声によるものか、あるいは衝撃性背景ノイズに
    よるものかを判定するノイズ判別処理部とを具備するこ
    とを特徴とする音声認識装置。
  6. 【請求項6】入力音声を単位時間毎にサンプリングして
    音声データを生成するサンプリング処理部と、音声デー
    タより入力データとして有効な単語区間を検出する単語
    区間検出処理部と、音声データの周波数成分を、周波数
    方向に適当な次数をとったベクトル値として解析し、ス
    ペクトルデータを生成するスペクトル解析処理部と、単
    語区間先頭と直前部分におけるスペクトルデータのベク
    トル長の差の大小から、立ち上がりの急峻性をみて、そ
    の単語区間が使用者の発声音声によるものか、あるいは
    衝撃性背景ノイズによるものかを判定するノイズ判別処
    理部とを具備することを特徴とする音声認識装置。
  7. 【請求項7】入力音声の波形振幅量からパワー値を生成
    するパワー算出部と、入力音声を単位時間毎にサンプリ
    ングして音声データを生成するサンプリング処理部と、
    音声データより入力データとして有効な単語区間を検出
    する単語区間検出処理部と、音声データの周波数成分
    を、周波数方向に適当な次数をとったベクトル値として
    解析し、スペクトルデータを生成するスペクトル解析処
    理部と、単語区間先頭と最初の極大パワー値部分におけ
    るスペクトルデータのベクトル長の差の大小から、立ち
    上がりの急峻性をみて、その単語区間が使用者の発声音
    声によるものか、あるいは衝撃性背景ノイズによるもの
    かを判定するノイズ判別処理部とを具備することを特徴
    とする音声認識装置。
  8. 【請求項8】入力音声を単位時間毎にサンプリングして
    音声データを生成するサンプリング処理部と、音声デー
    タより入力データとして有効な単語区間を検出する単語
    区間検出処理部と、音声データの周波数成分を解析し、
    スペクトルデータを生成するスペクトル解析処理部と、
    単語区間の冒頭部分におけるスペクトル変化の大小か
    ら、立ち上がりの急峻性をみて、その単語区間が使用者
    の発声音声によるものか、あるいは衝撃性背景ノイズに
    よるものかを判定するノイズ判別処理部とを具備するこ
    とを特徴とする音声認識装置。
  9. 【請求項9】入力音声の波形振幅量からパワー値を生成
    するパワー算出部と、入力音声を単位時間毎にサンプリ
    ングして音声データを生成するサンプリング処理部と、
    音声データより入力データとして有効な単語区間を検出
    する単語区間検出処理部と、音声データの周波数成分を
    解析し、スペクトルデータを生成するスペクトル解析処
    理部と、単語区間の先頭と最初の極大パワー値部分にお
    けるスペクトル変化の大小から、立ち上がりの急峻性を
    みて、その単語区間が使用者の発声音声によるものか、
    あるいは衝撃性背景ノイズによるものかを判定するノイ
    ズ判別処理部とを具備することを特徴とする音声認識装
    置。
  10. 【請求項10】入力音声を単位時間毎にサンプリングし
    て音声データを生成するサンプリング処理部と、音声デ
    ータより入力データとして有効な単語区間を検出する単
    語区間検出処理部と、音声データの周波数成分を、周波
    数方向に適当な次数をとったベクトル値として解析し、
    スペクトルデータを生成するスペクトル解析処理部と、
    単語区間の先頭と直前部分におけるスペクトルデータの
    ベクトル間距離の大小から、立ち上がりの急峻性をみ
    て、その単語区間が使用者の発声音声によるものか、あ
    るいは衝撃性背景ノイズによるものかを判定するノイズ
    判別処理部とを具備することを特徴とする音声認識装
    置。
  11. 【請求項11】入力音声の波形振幅量からパワー値を生
    成するパワー算出部と、入力音声を単位時間毎にサンプ
    リングして音声データを生成するサンプリング処理部
    と、音声データより入力データとして有効な単語区間を
    検出する単語区間検出処理部と、音声データの周波数成
    分を、周波数方向に適当な次数をとったベクトル値とし
    て解析し、スペクトルデータを生成するスペクトル解析
    処理部と、単語区間の先頭と最初の極大パワー値部分に
    おけるスペクトルデータのベクトル間距離の大小から、
    立ち上がりの急峻性をみて、その単語区間が使用者の発
    声音声によるものか、あるいは衝撃性背景ノイズによる
    ものかを判定するノイズ判別処理部とを具備することを
    特徴とする音声認識装置。
JP5131866A 1992-08-13 1993-06-02 音声認識装置 Withdrawn JPH06110492A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5131866A JPH06110492A (ja) 1992-08-13 1993-06-02 音声認識装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4-215998 1992-08-13
JP21599892 1992-08-13
JP5131866A JPH06110492A (ja) 1992-08-13 1993-06-02 音声認識装置

Publications (1)

Publication Number Publication Date
JPH06110492A true JPH06110492A (ja) 1994-04-22

Family

ID=26466592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5131866A Withdrawn JPH06110492A (ja) 1992-08-13 1993-06-02 音声認識装置

Country Status (1)

Country Link
JP (1) JPH06110492A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008111462A1 (ja) * 2007-03-06 2008-09-18 Nec Corporation 雑音抑圧の方法、装置、及びプログラム
JP2009175474A (ja) * 2008-01-25 2009-08-06 Yamaha Corp 音処理装置およびプログラム
JP2013156225A (ja) * 2012-01-31 2013-08-15 Shimadzu Corp 磁気検知システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008111462A1 (ja) * 2007-03-06 2008-09-18 Nec Corporation 雑音抑圧の方法、装置、及びプログラム
US20100014681A1 (en) * 2007-03-06 2010-01-21 Nec Corporation Noise suppression method, device, and program
JPWO2008111462A1 (ja) * 2007-03-06 2010-06-24 日本電気株式会社 雑音抑圧の方法、装置、及びプログラム
US9047874B2 (en) 2007-03-06 2015-06-02 Nec Corporation Noise suppression method, device, and program
JP5791092B2 (ja) * 2007-03-06 2015-10-07 日本電気株式会社 雑音抑圧の方法、装置、及びプログラム
JP2009175474A (ja) * 2008-01-25 2009-08-06 Yamaha Corp 音処理装置およびプログラム
JP2013156225A (ja) * 2012-01-31 2013-08-15 Shimadzu Corp 磁気検知システム

Similar Documents

Publication Publication Date Title
JP4568371B2 (ja) 少なくとも2つのイベント・クラス間を区別するためのコンピュータ化された方法及びコンピュータ・プログラム
Ferrer et al. Is the speaker done yet? Faster and more accurate end-of-utterance detection using prosody
KR950013551B1 (ko) 잡음신호예측장치
JP3162994B2 (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
EP1210711B1 (en) Sound source classification
US20180137880A1 (en) Phonation Style Detection
JP2000132186A (ja) コマンド境界識別装置、方法およびプログラム記憶装置
US6823304B2 (en) Speech recognition apparatus and method performing speech recognition with feature parameter preceding lead voiced sound as feature parameter of lead consonant
JP2996019B2 (ja) 音声認識装置
JP2797861B2 (ja) 音声検出方法および音声検出装置
JPH06110492A (ja) 音声認識装置
KR20210000802A (ko) 인공지능 음성 인식 처리 방법 및 시스템
KR100391123B1 (ko) 피치 단위 데이터 분석을 이용한 음성인식 방법 및 시스템
JP3106543B2 (ja) 音声信号処理装置
JPH07191696A (ja) 音声認識装置
JPH05173592A (ja) 音声/非音声判別方法および判別装置
JP2004191968A (ja) 信号ソースを分離するための方法及び装置
JPH04230796A (ja) 音声信号処理装置
JP2006010739A (ja) 音声認識装置
JP3114757B2 (ja) 音声認識装置
EP1391876A1 (en) Method of determining phonemes in spoken utterances suitable for recognizing emotions using voice quality features
JP3502265B2 (ja) 音声分析装置、音声分析方法、および音声分析プログラムを記録した記録媒体
JP2968976B2 (ja) 音声認識装置
JPH07295588A (ja) 発話速度推定方法
EP3956890B1 (en) A dialog detector

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000905