JP3299574B2 - 認識装置 - Google Patents

認識装置

Info

Publication number
JP3299574B2
JP3299574B2 JP32504792A JP32504792A JP3299574B2 JP 3299574 B2 JP3299574 B2 JP 3299574B2 JP 32504792 A JP32504792 A JP 32504792A JP 32504792 A JP32504792 A JP 32504792A JP 3299574 B2 JP3299574 B2 JP 3299574B2
Authority
JP
Japan
Prior art keywords
value
power
noise
sharpness
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32504792A
Other languages
English (en)
Other versions
JPH06175687A (ja
Inventor
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP32504792A priority Critical patent/JP3299574B2/ja
Publication of JPH06175687A publication Critical patent/JPH06175687A/ja
Application granted granted Critical
Publication of JP3299574B2 publication Critical patent/JP3299574B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声認識装置に係り、特
に登録パタンと照合するに先立ち、入力された音が雑音
かどうかを判別して、雑音であると判別したものについ
ては登録パタンとの照合を行わず、雑音でないと判別さ
れたものについてのみ照合を行うようにして、正確な認
識度を向上させるものである。
【0002】
【従来の技術】従来の音声認識装置では、雑音が音声と
間違われて認識されてしまうケースが多く問題となって
いた。勿論従来の装置では、雑音を音声でないと判定し
てリジェクトする機能は具備されていたが、後述するよ
うにリジェクト能力が十分でなかった。
【0003】従来の音声認識装置を図4により説明す
る。マイクロホン1より入力された音声信号はAD変換
部2によりディジタル信号に変換され、特徴抽出部3に
より特徴抽出される。特徴抽出部3は複数のバンドパス
フィルターを具備しており、複数の周波数f1 、f2
・・fnの特徴を抽出する。特徴抽出部3は、またパワ
ー抽出をも行なう。区間検出部4でパワーの大きな区分
のみの前記特徴を出力する。
【0004】例えば図5に示す如く、周波数f1 の強度
Iが(A)の状態であり、f2 の強度Iが(B)の状態
であり、fnの強度Iが(N)の状態の場合、区分検出
部4はその強度の弱い部分を休止区間としてこれを利用
して区切り、音声出力の大きな区分のみの特徴を照合部
6に出力する。
【0005】照合部6ではこの特徴を、あらかじめ登録
パタン部5に格納されている各単語等のパタンとの距離
を算出し、この算出距離のもっとも小さいものを認識結
果として判定部8に出力する。判定部8ではこれをしき
い値記憶部7に予め保持されている、距離に対するしき
い値と比較し、このしきい値以内の場合が認識結果とし
て出力される。
【0006】しかし、入力された音の前記特徴パタン
と、予め登録されている音声パタン群との照合を照合部
6において行い、個々の距離を求めたとき、その時の最
小距離が前記しきい値以上であった場合に、登録パタン
のどれとも対応しない音、つまり雑音が入力されたもの
としてリジェクトしていた。
【0007】
【発明が解決しようとする課題】このしきい値は、実験
的もしくは経験的に求められるが、入力を意図として発
声された音声と、雑音とを完全にふるい分けるしきい値
を設定することは不可能であり、雑音の一部はリジェク
トされず、入力を意図して発音した音声の一部がリジェ
クトされることがあるというのが現実であった。したが
って本発明の目的は、ノイズと判別可能なものはあらか
じめ別に判別するようにして、認識率の向上した音声認
識装置を提供することである。
【0008】
【課題を解決するための手段】前記目的を達成するた
め、本発明では、図1に示す如く、ノイズ検出部10を
設け、入力音声が雑音の場合、これを照合部6を使用せ
ずに判別するように構成した。図1において、マイクロ
ホン1、AD変換部2、特徴抽出部3、区間検出部4、
登録パタン部5、照合部6、しきい値記憶部7、判定部
8は、前述した従来例の場合と同様である。
【0009】ノイズ検出部10は、入力した音の中に、
急激に大音量に達したときにそれを雑音であるとして検
出する。
【0010】
【作用】本発明によれば、例えば、音が急激に大音量に
なったとき等を、登録パタン等の照合によらずにこれら
を雑音として判別できる。したがって雑音の認識度を向
上することが可能となり相対的に音声認識度を向上でき
る。
【0011】
【実施例】本発明の第一実施例を図2及び図3にもとづ
き説明する。図2は第一実施例の構成図、図3はその動
作説明図である。人間は、急に大きな音量の音を出せな
いという特徴がある。それに対して騒音のある種のもの
は、急激に大音量に達するものがある。例えば扉の閉ま
る音や、ハンマーを叩いたときの音や、マイクロホンを
何かにぶつけた時等の衝撃音はこれに該当する。したが
って、この第一実施例では、音声認識装置に入力した音
の最初の立ち上がりの鋭さを測定して、鋭く立ち上って
いる音は、音声ではなく雑音であると判別して認識結果
を出力しない、もしくはリジェクトするようにしたもの
である。
【0012】図2において、他図と同記号部分は同一部
分を示し、21はパワー抽出部、22は雑音・音声判定
部であり、鋭さ測定部23を有するもの、24はしきい
値記憶部である。
【0013】パワー抽出部21はマイクロホン1より入
力された音声信号のパワーを抽出するものである。雑音
・音声判定部22は入力された音声信号が雑音か音声か
を判定するものであって入力された音声信号の立ち上が
りの鋭さにもとづきこの判定を行うものであり、そのた
め鋭さ測定部23を具備する。
【0014】鋭さ測定部23は、図3(A)に示す如
く、例えば入力された音の始端Tsから一定時間(例え
ば10ms)後のパワー値P(10ms後の場合は
10)を測定し、この値が、しきい値記憶部24に予め
記入されているしきい値以上のとき、これを雑音と判断
する。これにより雑音・音声判定部22は、照合部6に
対しリジェクトを行う。これにより、照合部6は照合結
果を出力しない。
【0015】次に第一実施例の動作を簡単に説明する。
マイクロホン1より入力された音声信号はAD変換部2
でサンプリングされ、ディジタル信号に変換され、特徴
抽出部3及びパワー抽出部21に伝達される。これによ
り特徴抽出部3において特徴抽出が行われ、またパワー
抽出部21においてパワーが算出され鋭さ測定部23に
伝達される。
【0016】ところで、入力された音声信号が、前記の
如く、扉の閉まる音やハンマーを叩いたときのような雑
音の場合には、最初の立ち上がりが鋭いものとなる。こ
れを判別するため、鋭さ測定部23では、区間検出部4
から伝達された音の始端Ts信号を受信したのち、一定
時間例えば10ms後のパワーP10をしきい値記憶部2
4に保持されているしきい値と比較する。そしてこのパ
ワーP10がしきい値以上の場合、この音声信号を雑音と
判別する。これにより雑音・音声判定部22は、照合部
6に対しリジェクトを行う。
【0017】しかし前記パワーP10がしきい値に達しな
いとき、リジェクトは行われないので、照合部6におい
ては、従来と同様に、照合部6において、特徴パタンと
登録パタン部5に保持されている各登録パタンとの照合
が行われ、照合結果が判定部8に出力され、しきい値記
憶部7に記入されているしきい値と比較され、照合結果
の距離がしきい値以内のとき照合部6における認識結果
が出力されることになる。
【0018】なお、前記説明では、立ち上がりの鋭さが
事前に設定してある基準値以上の場合に雑音とみなして
リジェクトするとき、鋭さを測定する手段として入力さ
れた音の始端から一定時間後のパワー値を測定してこれ
を基準値と比較した例について記述したが、本発明は勿
論これのみに限定されるものではない。
【0019】鋭さ測定手段としては、図3(A)に示す
如く、例えば入力された音の始端Tsから一定時間(例
えば10ms)後のパワー値(例えばP10)と、その入
力全体の中の最大パワー値Pmaxとの差もしくは比の
値を求め、事前に設定してある基準値以上の場合に雑音
とみなすように構成してもよい。また、図3(A)に示
す如く、入力された音の始端Tsから一定時間後(例え
ば15ms)のパワー値(例えばP15)と、それより始
端に近い時間(例えば始端から5ms)のパワー値(例
えばP5 )との差もしくは比の値を求め、事前に設定し
てある基準値以上の場合に雑音とみなすように構成して
もよい。
【0020】さらに鋭さ測定手段を、図3(B)に示す
如く、入力された音の始端Tsから最初に現れるパワー
の極大値Plの時間位置Tlと、前記始端Tsとの差T
l−Tsを求め、この差が基準値以下であれば雑音とみ
なすように構成してもよい。また、図3(B)に示す如
く、始端Tsから初めて現れるパワーの極大値Plの時
間位置Tlと、このTlより一定時間ΔT始端よりの位
置のパワー値Ptとの差もしくは比を求め、この差もし
くは比が基準値以上であれば雑音とみなすように構成し
てもよい。
【0021】本発明では、音声を電気信号に変換し、こ
れをある時間間隔で特徴量を抽出し、照合手段により登
録パタンと照合して認識結果を出力する音声認識装置に
おいて、予め規定された状態の入力音声をノイズとして
判別するノイズ検出手段10を設け、前記ノイズ検出手
段に入力された音声中から、パワーピークの鋭さを測定
する鋭さ検出手段を設け、鋭さが事前に設定してある基
準値以上の場合は、雑音とみなしてリジェクトするよう
に構成することができる。
【0022】また本発明では、前記鋭さノイズ検出手段
を入力された音声の最初のパワーピークの時間位置とそ
のピークの両側で、パワーピークのパワー値に一定の値
aをかけた値より小さいパワー値の時間位置を求め、そ
の両側の時間位置の幅が事前に設定してある基準値以下
の場合は、雑音とみなしてリジェクトするように構成す
ることができる。ここで例えば前記値aの値を1/2に
すると半値幅と呼ばれる。
【0023】本発明では、前記鋭さノイズ検出手段を入
力された音声のパワーピークの時間位置とそのピークの
両側で、パワーピークのパワー値に一定の値aをかけた
値より小さいパワー値の時間位置を求め、その両側の時
間位置の幅をパワーピーク毎に求め、その最小値が事前
に設定してある基準値以下の場合は、雑音とみなしてリ
ジェクトするように構成することができる。
【0024】本発明では、前記鋭さノイズ検出手段を入
力された音声の最初のパワーピークの時間位置から一定
時間前のパワー値と一定時間後のパワー値を求め、パワ
ーピーク値から両側のパワー値を引いた値、もしくはパ
ワーピーク値から両側のパワー値の平均値を引いた値、
もしくはパワーピーク値を両側のパワー値の平均値で割
った値を求め、事前に設定してある基準値以上の場合
は、雑音とみなしてリジェクトするように構成すること
ができる。
【0025】さらに本発明では、前記鋭さノイズ検出手
段を入力された音声のパワーピークの時間位置から一定
時間前のパワー値と一定時間後のパワー値を求め、パワ
ーピーク値から両側のパワー値を引いた値、もしくはパ
ワーピーク値から両側のパワー値の平均値を引いた値、
もしくはパワーピーク値を両側のパワー値の平均値で割
った値をパワーピーク毎に求め、その最大値が事前に設
定してある基準値以上の場合は、雑音とみなしてリジェ
クトするように構成することができる。
【0026】なお、本発明において、リジェクトの場合
は、認識装置は何も出力せず次の入力を待ってもよい
し、リジェクトであることを使用者もしくはホストコン
ピュータ等に通知してもよい。勿論、登録パタンと異な
る音声が入力されたと判断されたとき、前記のように、
従来通りリジェクトされるが、この場合は、リジェクト
であることを使用者もしくはホストコンピュータ等に通
知する。
【0027】
【発明の効果】本発明によれば、あらかじめ雑音である
ことが明らかなものについて、照合部を使用せずに雑音
判別を行うので、高速に、効果的にこれを除くことがで
き、雑音リジェクト能力の向上をはかることができる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の第一実施例構成図である。
【図3】本発明の第一実施例の動作説明図である。
【図4】従来例の構成図である。
【図5】従来例の動作説明図である。
【符号の説明】
1 マイクロホン 2 AD変換部 3 特徴抽出部 4 区間検出部 5 登録パタン部 6 照合部 7 しきい値記憶部 8 判定部 10 ノイズ検出部

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】 ある時間間隔で音声の特徴量を抽出し、
    照合手段により登録パタンと照合して認識する認識装置
    において、 あらかじめ規定された状態の入力音声をノイズとして判
    別するノイズ検出手段と、 前記ノイズ検出手段に入力された音声中から、立ち上が
    りの鋭さを測定する鋭さ検出手段を設け、 前記鋭さ測定
    手段を、入力された音の始端から一定時間後のパワー値
    を測定し 、事前に設定してある基準値以上の場合に雑音とみなし
    てリジェクトするように構成したことを特徴とする認識
    装置。
  2. 【請求項2】 ある時間間隔で音声の特徴量を抽出し、
    照合手段により登録パタンと照合して認識する認識装置
    において、 あらかじめ規定された状態の入力音声をノイズとして判
    別するノイズ検出手段と、 前記ノイズ検出手段に入力された音声中から、立ち上が
    りの鋭さを測定する鋭さ検出手段を設け、 前記鋭さ測定手段を、入力された音の始端から一定時間
    後のパワー値とその入力全体の中の最大パワー値の差も
    しくは比の値を求め、事前に設定してある基準値以上の
    場合に雑音とみなしてリジェクトするように構成したこ
    とを特徴とする認識装置。
  3. 【請求項3】 ある時間間隔で音声の特徴量を抽出し、
    照合手段により登録パタンと照合して認識する認識装置
    において、 あらかじめ規定された状態の入力音声をノイズとして判
    別するノイズ検出手段と、 前記ノイズ検出手段に入力された音声中から、立ち上が
    りの鋭さを測定する鋭さ検出手段を設け、 前記鋭さ測定手段を、入力された音の始端から一定時間
    後のパワー値とそれよ り始端に近い時間のパワー値との
    差もしくは比を求め、事前に設定してある基準値以上の
    場合に雑音とみなしてリジェクトするように構成したこ
    とを特徴とする認識装置。
  4. 【請求項4】 ある時間間隔で音声の特徴量を抽出し、
    照合手段により登録パタンと照合して認識する認識装置
    において、 あらかじめ規定された状態の入力音声をノイズとして判
    別するノイズ検出手段と、 前記ノイズ検出手段に入力された音声中から、立ち上が
    りの鋭さを測定する鋭さ検出手段を設け、 前記鋭さ測定手段を、始端から初めて現れるパワーの極
    大値の時間位置と始端の時間位置との差が基準値以下の
    場合に雑音とみなしてリジェクトするように構成したこ
    とを特徴とする認識装置。
  5. 【請求項5】 ある時間間隔で音声の特徴量を抽出し、
    照合手段により登録パタンと照合して認識する認識装置
    において、 あらかじめ規定された状態の入力音声をノイズとして判
    別するノイズ検出手段と、 前記ノイズ検出手段に入力された音声中から、立ち上が
    りの鋭さを測定する鋭さ検出手段を設け、 前記鋭さ測定手段を、始端から初めて現れるパワーの極
    大値と、その時間位置から一定時間始端よりの位置のパ
    ワー値との差もしくは比が基準値以上の場合に雑音とみ
    なしてリジェクトするように構成したことを特徴とする
    認識装置。
  6. 【請求項6】 ある時間間隔で音声の特徴量を抽出し、
    照合手段により登録パタンと照合して認識する認識装置
    において、 あらかじめ規定された状態の入力音声をノイズとして判
    別するノイズ検出手段と、 前記ノイズ検出手段に入力された音声中から、立ち上が
    りの鋭さを測定する鋭さ検出手段を設け、 前記鋭さ測定手段を、入力音声中の始端より一定時間以
    後の任意の時間のパワー値と、その一定時間前のパワー
    値との差もしくは比の最大値を求めるようにし 、その最
    大値が事前に設定してある基準値以上の場合は、雑音と
    みなしてリジェクトするように構成したことを特徴とす
    る認識装置。
  7. 【請求項7】 ある時間間隔で音声の特徴量を抽出し、
    照合手段により登録パタンと照合して認識する認識装置
    において、 あらかじめ規定された状態の入力音声をノイズとして判
    別するノイズ検出手段と、 前記ノイズ検出手段に入力された音声中から、立ち上が
    りの鋭さを測定する鋭さ検出手段を設け、 前記鋭さ測定手段を、入力音声中のパワー極大値と、そ
    の一定時間前のパワー値との差もしくは比を、パワーピ
    ーク毎に求め、その最大値が事前に設定してある基準値
    以上の場合は、雑音とみなしてリジェクトするように構
    成したことを特徴とする認識装置。
  8. 【請求項8】 ある時間間隔で音声の特徴量を抽出し、
    照合手段により登録パタンと照合して認識する認識装置
    において、 予め規定された状態の入力音声をノイズとして判別する
    ノイズ検出手段を設け、 前記ノイズ検出手段に入力された音声中から、パワーピ
    ークの鋭さを測定する鋭さ検出手段を設け、鋭さが事前
    に設定してある基準値以上の場合は、雑音とみなしてリ
    ジェクトするように構成したことを特徴とする認識装
    置。
  9. 【請求項9】 前記鋭さノイズ検出手段を入力された音
    声の最初のパワーピークの時間位置とそのピークの両側
    で、パワーピークのパワー値に一定の値をかけた値より
    小さいパワー値の時間位置を求め、その両側の時間位置
    の幅が事前に設定してある基準値以下の場合は、雑音と
    みなしてリジェクトするように構成したことを特徴とす
    る請求項8記載の認識装置。
  10. 【請求項10】 前記鋭さノイズ検出手段を入力された
    音声のパワーピークの時間位置とそのピークの両側で、
    パワーピークのパワー値に一定の値をかけた値より小さ
    いパワー値の時間位置を求め、その両側の時間位置の幅
    をパワーピーク毎に求め、その最小値が事前に設定して
    ある基準値以下の場合は、雑音とみなしてリジェクトす
    るように構成したことを特徴とする請求項8記載の認識
    装置。
  11. 【請求項11】 前記鋭さノイズ検出手段を入力された
    音声の最初のパワーピークの時間位置から一定時間前の
    パワー値と一定時間後のパワー値を求め、パワーピーク
    値から両側のパワー値を引いた値、もしくはパワーピー
    ク値から両側のパワー値の平均値を引いた値、もしくは
    パワーピーク値を両側のパワー値の平均値で割った値を
    求め、事前に設定してある基準値以上の場合は、雑音と
    みなしてリジェクトするように構成したことを特徴とす
    る請求項8記載の認識装置。
  12. 【請求項12】 前記鋭さノイズ検出手段を入力された
    音声のパワーピークの時間位置から一定時間前のパワー
    値と一定時間後のパワー値を求め、パワーピーク値から
    両側のパワー値を引いた値、もしくはパワーピーク値か
    ら両側のパワー値の平均値を引いた値、もしくはパワー
    ピーク値を両側のパワー値の平均値で割った値をパワー
    ピーク毎に求め、その最大値が事前に設定してある基準
    値以上の場合は、雑音とみなしてリジェクトするように
    構成したことを特徴とする請求項8記載の認識装置。
JP32504792A 1992-12-04 1992-12-04 認識装置 Expired - Fee Related JP3299574B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32504792A JP3299574B2 (ja) 1992-12-04 1992-12-04 認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32504792A JP3299574B2 (ja) 1992-12-04 1992-12-04 認識装置

Publications (2)

Publication Number Publication Date
JPH06175687A JPH06175687A (ja) 1994-06-24
JP3299574B2 true JP3299574B2 (ja) 2002-07-08

Family

ID=18172564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32504792A Expired - Fee Related JP3299574B2 (ja) 1992-12-04 1992-12-04 認識装置

Country Status (1)

Country Link
JP (1) JP3299574B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4987282B2 (ja) 2005-10-25 2012-07-25 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP6636303B2 (ja) * 2015-10-29 2020-01-29 シャープ株式会社 対話装置、対話機器、対話装置の制御方法、制御プログラム、および記録媒体

Also Published As

Publication number Publication date
JPH06175687A (ja) 1994-06-24

Similar Documents

Publication Publication Date Title
US6321197B1 (en) Communication device and method for endpointing speech utterances
KR20050080647A (ko) 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법
JPS5852695A (ja) 車両用音声検出装置
Jelil et al. Exploration of compressed ILPR features for replay attack detection
Alam et al. Spoofing detection employing infinite impulse response—constant Q transform-based feature representations
US4078154A (en) Voice recognition system using locus of centroid of vocal frequency spectra
KR20170073113A (ko) 음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치
Rafi et al. A new approach for robust replay spoof detection in ASV systems
US10366709B2 (en) Sound discriminating device, sound discriminating method, and computer program
JP3299574B2 (ja) 認識装置
KR100714721B1 (ko) 음성 구간 검출 방법 및 장치
JP6616182B2 (ja) 話者認識装置、判別値生成方法及びプログラム
JP4102745B2 (ja) 音声区間検出装置および方法
KR100587260B1 (ko) 음향 기기의 음성인식장치
CN104240705A (zh) 一种保险箱语音识别智能锁***
JP3114757B2 (ja) 音声認識装置
JP3091537B2 (ja) 音声パターン作成方法
KR20000056849A (ko) 음향 기기의 음성인식 방법
JP2666296B2 (ja) 音声認識装置
JP3474949B2 (ja) 音声認識装置
JPH027099A (ja) 過大音声検出装置
JPS63278100A (ja) 音声認識装置
JP2737109B2 (ja) 音声区間検出方式
JPH0651792A (ja) 音声認識装置
KR970060044A (ko) 유색 잡음 환경에서 주파수 영역의 정보를 이용한 끝점 검출 방법

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020402

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080419

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090419

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090419

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100419

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110419

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110419

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees