JP2712708B2 - 音声検出装置 - Google Patents

音声検出装置

Info

Publication number
JP2712708B2
JP2712708B2 JP2034297A JP3429790A JP2712708B2 JP 2712708 B2 JP2712708 B2 JP 2712708B2 JP 2034297 A JP2034297 A JP 2034297A JP 3429790 A JP3429790 A JP 3429790A JP 2712708 B2 JP2712708 B2 JP 2712708B2
Authority
JP
Japan
Prior art keywords
peak
cepstrum
section
output
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2034297A
Other languages
English (en)
Other versions
JPH03237500A (ja
Inventor
明 野原
丈二 加根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2034297A priority Critical patent/JP2712708B2/ja
Priority to US07/637,203 priority patent/US5195138A/en
Priority to AU68688/91A priority patent/AU644124B2/en
Priority to CA002034333A priority patent/CA2034333C/en
Priority to DE69130294T priority patent/DE69130294T2/de
Priority to KR1019910000760A priority patent/KR960005739B1/ko
Priority to FI910293A priority patent/FI115569B/fi
Priority to DE69112855T priority patent/DE69112855T2/de
Priority to NO910221A priority patent/NO306489B1/no
Priority to EP94107070A priority patent/EP0614170B1/en
Priority to DE69132147T priority patent/DE69132147T2/de
Priority to DE69132148T priority patent/DE69132148T2/de
Priority to EP94107069A priority patent/EP0614169B1/en
Priority to EP91100598A priority patent/EP0439073B1/en
Priority to EP94107071A priority patent/EP0614171B1/en
Publication of JPH03237500A publication Critical patent/JPH03237500A/ja
Priority to HK184795A priority patent/HK184795A/xx
Application granted granted Critical
Publication of JP2712708B2 publication Critical patent/JP2712708B2/ja
Priority to HK98110576A priority patent/HK1010007A1/xx
Priority to HK98110577A priority patent/HK1010008A1/xx
Priority to HK98110575A priority patent/HK1010006A1/xx
Priority to NO992258A priority patent/NO308336B1/no
Priority to NO992257A priority patent/NO308337B1/no
Priority to NO992256A priority patent/NO308335B1/no
Priority to FI20030087A priority patent/FI117953B/fi
Priority to FI20030088A priority patent/FI116594B/fi
Priority to FI20030089A priority patent/FI116595B/fi
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声信号処理に用いることができる音声検出
装置に関する。
従来の技術 近年、音声認識,話者認識,音声による機器の操作,
コンピュータへの音声による入力などの用途に音声の有
無を検出する音声検出装置が多用され、検出精度を高め
るため音声スペクトラムの特徴をつかんで雑音の中から
音声の有無を検出する方法が検討されている。
第4図は従来の音声検出装置を示すブロック図であ
る。
図にもとづいてその構成と動作を説明すると、ケプス
トラム検出部15は音声入力よりケプストラムを検出しピ
ーク検出部に供給する。ピーク検出部16はそのケプスト
ラムよりピークを検出して音声判別部17に供給する。音
声判別部17ではそのケプストラムのピークあらかじめ設
定した閾値と比較して、音声の有無を判別し音声検出信
号を出すものである。
発明が解決しようとする課題 しかし従来の音声検出装置によれば、ケプストラム検
出より得られたケプストラムのピークを求めるための処
理時間が非常に長くかかるという問題があった。
課題を解決するための手段 上記問題点を解決するために、第1の発明の音声検出
装置は、音声入力のケプストラムを算出するケプストラ
ム算出手段と、ケプストラム算出手段のケプストラム出
力のピークを検出するピーク検出手段と、ピーク検出手
段のピーク検出出力および動作モード設定信号により分
析区間を設定する分析区間設定手段と、ピーク検出手段
のピーク検出出力が供給される音声判別手段とを備え、
ピーク検出手段のピーク検出区間を分析区間設定手段の
設定出力により制御される構成とした。
また、第2の発明の音声検出装置は前記第1の発明の
前記分析区間設定手段に代えて、ピーク検出出力が供給
される区間データ設定部と前記区間データ設定部の設定
出力が第1のスイッチを介して供給されるメモリ群と、
あらかじめ区間データを設定しておくメモリ群と、上記
複数のメモリ群のメモリ出力を切換える第2のスイッチ
と、第1および第2のスイッチを制御する制御部とを備
える構成とした。
作用 第1の発明は上記構成によりケプストラム算出手段は
音声入力のケプストラムを算出し、ピーク検出手段に供
給する。ピーク検出手段はケプストラム算出手段のケプ
ストラムのピークを分析区間設定手段より指示される分
析区間において求め、音声判別手段に供給する。音声判
別手段にはピーク検出手段のピークをあらかじめ設定し
た閾値と比べ音声検出を行う。分析区間設定手段には動
作モードと、ピーク検出手段のピーク検出出力の一部が
入力される。動作モードの一つにおいては、あらかじめ
設定された分析区間をピーク検出手段に出力すると同時
にピーク検出出力に応じて別の動作モードで出力する分
析区間を設定する。別の動作モードにおいては、前記の
動作モードで設定した分析区間をピーク検出手段に指示
するように作用するので、分析区間が短くなり、処理時
間が短縮される。
また、第2の発明は上記構成により、動作モードに応
じて制御部は、ピーク検出部に指示するケフレンシー分
析区間を第1のメモリから得るか、第2のメモリから得
るか制御するとともに、区間データ設定部からのデータ
の第1のメモリに記憶するか否かを制御する。動作モー
ドの一つにおいては、第2のメモリより、ケフレンシー
分析区間をピーク検出部に指示するとともに、第1のメ
モリには音声入力に応じたケフレンシー分析区間を区間
データ設定部より供給され記憶する。そして、別の動作
モードにおいては、第1のメモリよりケフレンシー分析
区間をピーク検出部に指示するように作用することによ
り処理時間の短縮を図るものである。
実施例 以下第1の発明の一実施例について、図面を参照しな
がら説明する。
第1図に第1の発明の一実施例における音声検出装置
のブロック図を示す。
図によって以下その構成の関連と動作を説明すると、
まずケプストラム算出手段としてのケプストラム算出部
1に音声入力が入力されケプストラムを得る。そのケプ
ストラムはピーク検出手段としてのピーク検出部2に供
給され、分析区間設定部3より指示される分析区間での
ケプストラムピークを得る。音声判別手段である音声判
別部4は前記のケプストラムピークをあらかじめ設定し
た閾値と比較し音声であると判別したとき音声検出信号
を出力する。ここで分析区間設定手段である分析区間設
定部3はピーク検出部に分析区間を指示するが、これは
動作モード設定信号により次のように制御される。まず
第1の動作モードではあらかじめ設定されたケフレンシ
ー分析区間をピーク検出部2に指示するとともに、ピー
ク検出部3から得られるケプストラムピークに応じて第
2の動作モードのときにピーク検出部2に指示するため
のケフレンシー分析区間の設定を行う。つぎに第2の動
作モードでは第1の動作モードで設定された分析区間を
ピーク検出部2に指示する。
この第1のモードから第2のモードへの切換えは手動
によって動作モード設定信号が発せられて切換えられて
も、また一定時間経過後または一定回数の音声検出信号
の出力後、自動的に動作モード設定信号が発せられて切
換えるようにしてもよい。
以上のように本実施例によれば、ケプストラムピーク
の分析区間設定をあらかじめ行うことができるため、ケ
プストラムピークを求める分析区間を絞ることができ処
理スピードの向上が図れる。また検出するケプストラム
ピークの範囲を第1のモードの間に検出して話者によっ
て絞られることで、同一話者において正確な音声検出を
行うことができる。さらに他の音声雑音が一時的に重畳
された場合にも分析するケプストラムピークの範囲を絞
ってあるため正確に音声検出を行えることは言うまでも
ない。
次に、第2の発明の一実施例について図面を参照しな
がら説明する。
第2図は第2の発明の一実施例における音声検出装置
のブロック図である。
図によってその構成と動作を説明すると、まずケプス
トラム算出部5では音声入力よりケプストラムを得てピ
ーク検出部6に供給する。ピーク検出部6は与えられた
ケプストラムより、そのピークを検出するものであり、
区間データ記憶部11より第2のスイッチ12を介して得ら
れるケフレンシー区間データを用いてケプストラム算出
部5より与えられるケプストラムのピーク検出幅が制御
される。音声判別部14はピーク検出部6で得られたケプ
ストラムのピークより、あらかじめ設定したある閾値に
基づいて音声判別を行い、音声であると判別した場合に
音声検出信号を出力する。ここで区間データ設定部8は
ピーク検出部6で得られたケプストラムのピークに基づ
き分析すべきケフレンシー区間を設定する。区間データ
設定部8で設定された区間データは、動作モードに応じ
て制御部7の制御信号で第1のスイッチ13をオンするこ
とによって第1のメモリ群9に書き込まれる。制御部7
は先に述べたように第1のスイッチ13を制御するととも
に第2のスイッチ12も動作モードに応じて制御を行う。
第2のスイッチ12は第1のスイッチ13がオフの場合に第
1のメモリ群9に接続され、第1のスイッチ13がオンの
場合には第2のメモリ群10に接続されるように制御され
る。区間データ記憶部11の第1のメモリ群9、第2のメ
モリ群10の区間データは第2のスイッチ12を介して、動
作モードに応じてそれぞれピーク検出部の分析区間デー
タとして供給される。第2のメモリ群10にはあらかじめ
区間データが設定されている。
次に第3図を用いてピーク検出部6に供給される区間
データをさらに詳しく説明していく。
第3図はケプストラム算出部5で得られるケプストラ
ムを示すもので、実際は離散値であるが、図ではその包
路線で示している。pはケプストラムピークのケフレン
シー、a0−b0はメモリ群10にあからじめ記憶した分析区
間、a1−b1はメモリ群9に記憶された分析区間である。
音声入力の場合第3図のようにケフレンシーpの位置に
ケプストラムのピークが発生する。
まず第1のモードにおいて制御部7によって第2のス
イッチ12が第2のメモリ群10に接続され、第1のスイッ
チ13が第1のメモリ群9に接続された場合を考える。こ
の場合音声入力があると、ピーク検出部6は、第2のス
イッチ12が第2のメモリ群10に接続しているので、その
メモリ内容である区間データa0−b0においてケプストラ
ムピークを求め、ケプストラムピークのケフレンシーp
を得る。区間データ設定部8はピーク検出部6で求めら
れたケプストラムピークであるケフレンシーpにより、
その近傍の値を選んで区間データa1−b1を求め、第1の
スイッチ13を介して第1のメモリ群9に区間データa1
b1を記憶する。次に第2のモードにおいて、制御部7に
よって第2のスイッチ12が第1のメモリ群9に接続さ
れ、第1のスイッチ13がオフになった場合を考える。こ
の場合ピーク検出部6は第2のスイッチ12が第1のメモ
リ群9に接続しているので、そのメモリ内容である区間
データ、a1−b1においてケプストラムピークを検出す
る。モードの切換えについては第1図の説明と同様に考
えればよい。
以上のように本実施例によれば、ケプストラムピーク
分析区間をあらかじめ設定し、メモリに記憶しておくこ
とで、常に最適のケプストラムピーク分析区間を与える
ことができ、またその入力に適応してさらに狭い分析区
間に設定し直せるため、処理時間の短縮と、雑音に対し
て精度の高い音声検出を行うことができる。また一度分
析区間を設定しておけばその分析区間は、常に有効であ
るため優れた操作性で効果的な音声検出処理ができるこ
とは言うまでもない。
なお、メモリ群は2組に限らず、必要によりさらに追
加して、その中から選択使用しても差支えないものであ
る。
発明の効果 以上の説明から明らかなように、第1の発明では音声
入力のケプストラムを算出するケプストラム算出手段
と、上記ケプストラム算出手段のケプストラム出力のピ
ークを検出するピーク検出手段と、上記ピーク検出手段
のピーク検出出力および動作モード設定信号から分析区
間を設定する分析区間設定手段と、上記ピーク検出手段
のピーク検出出力が供給される音声判別手段を備え、上
記ピーク検出手段のピーク検出区間を上記分析区間設定
手段の設定出力により制御されるように構成しているの
で、ケプストラムピークの分析区間の設定をあらかじめ
最適に行うことができ、またモードを変更することによ
って、分析区間を絞ることもでき、それによってケプス
トラムピークを求める処理のスピード向上が可能とな
る。また、さらに話者に合わせて検出するケプストラム
ピークの範囲を絞ることで同一話者において正確な音声
検出を行うことができる。さらに音声に雑音が重畳され
た場合にも分析するケプストラムピークを絞ってあるた
め、精度の高い音声検出が行え、優れた操作性を得るこ
とができる。
また第2の発明では、第1の発明の分析区間設定手段
に代わって、区間データ設定手段と、複数のメモリ群
と、区間データを第1のメモリに接続する第1のスイッ
チと、複数のメモリ群の区間データを選択してピーク検
出部へ供給する第2のスイッチと、前記第1と第2のス
イッチを動作モードに応じて制御する制御部を備えてい
るので、第1の発明と同様にあらかじめ設定した分析区
間と、入力に応じてケプストラム分析区間を絞るので、
第1の発明と同様の効果を得ることができ、メモリ群の
数を増やすことによって分析区間を各種設定することも
できるものである。
【図面の簡単な説明】 第1図は第1の発明の一実施例における音声検出装置の
ブロック図、第2図は第2の発明の一実施例における音
声検出装置のブロック図、第3図はケプストラム特性
図、第4図は従来例の音声検出装置のブロック図であ
る。 1,5……ケプストラム算出部、2,16……ピーク検出部、
3……分析区間設定部、4,14……音声判別部、7……制
御部、8……区間データ設定部、9,10……メモリ群、12
……第2のスイッチ、13……第1のスイッチ。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】音声入力のケプストラム入力を算出するケ
    プストラム算出手段と、 前記ケプストラム算出手段のケプストラム出力のピーク
    を検出するピーク検出手段と、 前記ピーク検出手段のピークを検出出力により分析すべ
    きケフレンシー区間を設定する区間データ設定手段と、 少なくとも前記区間データ設定手段の出力及びあらかじ
    め決められた区間データを保存するメモリと、 前記区間データ設定手段の出力を前記メモリに供給する
    か否かを設定する第1のスイッチと、 前記メモリに蓄えられたデータの内、前記区間データ設
    定手段の出力またはあらかじめ決められた区間データの
    いずれかを前記ピーク検出手段に供給するか否かを設定
    する第2のスイッチと、 前記第1及び第2のスイッチを制御する制御手段と、 前記ピーク検出手段の出力を入力とし、音声を判別する
    音声判別手段とを備え、 前記ピーク検出手段のピーク検出区間は前記第2のスイ
    ッチで選定される前記メモリの出力により制御されるこ
    とを特徴とする音声検出装置。
JP2034297A 1990-01-18 1990-02-14 音声検出装置 Expired - Fee Related JP2712708B2 (ja)

Priority Applications (25)

Application Number Priority Date Filing Date Title
JP2034297A JP2712708B2 (ja) 1990-02-14 1990-02-14 音声検出装置
US07/637,203 US5195138A (en) 1990-01-18 1991-01-03 Voice signal processing device
AU68688/91A AU644124B2 (en) 1990-01-18 1991-01-07 Voice signal processing device
CA002034333A CA2034333C (en) 1990-01-18 1991-01-17 Voice signal processing device
DE69132148T DE69132148T2 (de) 1990-01-18 1991-01-18 Vorrichtung zur Verarbeitung eines Signals
FI910293A FI115569B (fi) 1990-01-18 1991-01-18 Äänisignaalin käsittelylaite
DE69112855T DE69112855T2 (de) 1990-01-18 1991-01-18 Sprachsignalverarbeitungsvorrichtung.
NO910221A NO306489B1 (no) 1990-01-18 1991-01-18 Talesignalbehandlingsanordning
EP94107070A EP0614170B1 (en) 1990-01-18 1991-01-18 Signal control device
DE69132147T DE69132147T2 (de) 1990-01-18 1991-01-18 Signalsteuerungsvorrichtung
KR1019910000760A KR960005739B1 (ko) 1990-01-18 1991-01-18 음성검출장치
EP94107069A EP0614169B1 (en) 1990-01-18 1991-01-18 Voice signal processing device
DE69130294T DE69130294T2 (de) 1990-01-18 1991-01-18 Vorrichtung zur Verarbeitung eines Sprachsignals
EP94107071A EP0614171B1 (en) 1990-01-18 1991-01-18 Signal processing device
EP91100598A EP0439073B1 (en) 1990-01-18 1991-01-18 Voice signal processing device
HK184795A HK184795A (en) 1990-01-18 1995-12-07 Voice signal processing device
HK98110576A HK1010007A1 (en) 1990-01-18 1998-09-10 Signal control device
HK98110575A HK1010006A1 (en) 1990-01-18 1998-09-10 Signal processing device
HK98110577A HK1010008A1 (en) 1990-01-18 1998-09-10 Voice signal processing device
NO992258A NO308336B1 (no) 1990-01-18 1999-05-10 Anordning og fremgangsmÕte for signalbehandling
NO992257A NO308337B1 (no) 1990-01-18 1999-05-10 Signalstyringsanordning
NO992256A NO308335B1 (no) 1990-01-18 1999-05-10 Anordning og fremgangsmÕte for talesignal-deteksjon
FI20030087A FI117953B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030088A FI116594B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030089A FI116595B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2034297A JP2712708B2 (ja) 1990-02-14 1990-02-14 音声検出装置

Publications (2)

Publication Number Publication Date
JPH03237500A JPH03237500A (ja) 1991-10-23
JP2712708B2 true JP2712708B2 (ja) 1998-02-16

Family

ID=12410226

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2034297A Expired - Fee Related JP2712708B2 (ja) 1990-01-18 1990-02-14 音声検出装置

Country Status (1)

Country Link
JP (1) JP2712708B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
古井 「ディジタル音声処理」 東海大学出版会,1985年,P.44〜48,57〜59

Also Published As

Publication number Publication date
JPH03237500A (ja) 1991-10-23

Similar Documents

Publication Publication Date Title
EP0763811B1 (en) Speech signal processing apparatus for detecting a speech signal
JPH0713584A (ja) 音声検出装置
US20010029449A1 (en) Apparatus and method for recognizing voice with reduced sensitivity to ambient noise
JPH0863330A (ja) 音声入力装置
US5195138A (en) Voice signal processing device
JP2712708B2 (ja) 音声検出装置
JP2589468B2 (ja) 音声認識装置
JP2712703B2 (ja) 信号処理装置
JP2712692B2 (ja) 信号制御装置
KR950001069B1 (ko) 음성신호처리장치
JP2712704B2 (ja) 信号処理装置
JP2712691B2 (ja) 信号処理装置
KR0132260Y1 (ko) 레이저 디스크 플레이어의 점수기
JPH0451376B2 (ja)
JPH01244497A (ja) 音声区間検出回路
JPH05197385A (ja) 音声認識装置
KR950001068B1 (ko) 음성신호처리장치
EP1003283A2 (en) Audio signal processing device
KR100336960B1 (ko) 부하를줄이는음성신호인식장치및그방법
KR100207256B1 (ko) 복합제품의 가라오케 점수채점 테스트 방법
JPH02272495A (ja) 音声認識装置
JPH01316799A (ja) 音声認識装置
JPH039400A (ja) 音声認識装置
JPS6136238B2 (ja)
KR970005668B1 (ko) 영상가요반주기기의 점수연산장치

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees