JPS59121099A - 音声区間検出装置 - Google Patents

音声区間検出装置

Info

Publication number
JPS59121099A
JPS59121099A JP57227708A JP22770882A JPS59121099A JP S59121099 A JPS59121099 A JP S59121099A JP 57227708 A JP57227708 A JP 57227708A JP 22770882 A JP22770882 A JP 22770882A JP S59121099 A JPS59121099 A JP S59121099A
Authority
JP
Japan
Prior art keywords
voice
input signal
speech
section
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57227708A
Other languages
English (en)
Other versions
JPH045198B2 (ja
Inventor
浮田 輝彦
恒雄 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP57227708A priority Critical patent/JPS59121099A/ja
Publication of JPS59121099A publication Critical patent/JPS59121099A/ja
Publication of JPH045198B2 publication Critical patent/JPH045198B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は連続発声される入力音声信号の音声区間を所謂
舌うち音や息もれの影響を受けることなしに確実に検出
することのできる音声区間検出装置に関する。
〔発明の技術的背景とその問題点〕
連続的に発声入力される音声を認識するに際して、音声
区間を正確に検出することが非常に重要である。しかし
て従来、この音声区間検出は、大別して次のようにして
行われている。即ち、第1の方式は、入力信号のパワー
に着目して2つの閾値を利用1−1一方の閾値にて確実
に音声が存在する区間を検出1.たのち他方の閾値を用
いて正確な音声区間を求めるものである。
然し乍ら、このような方式によると、パワーの大〜いパ
ルス性の雑音までも音声として誤判定l7てしまうと云
う問題があった。
これに対して第2の方式として、入力信号の零交差回数
やそのスペクトル概形が背景雑音と異ることを利用して
、雑音と区別可能な特徴パラメータを用いて音声区間を
判定゛するものがある。ところが、この方式にあっては
、有声音や無声音を含んで種々変化する音声を決定的に
特徴ずけるパラメータが見出されていない為、前述した
@1の方式に比較して若干の改良が認められるに過ぎな
い。
そこで最近では、入力音声の周波数的特徴パラメータを
利用して音韻分類を行い、入力信号のパワー情報とを併
用して音声区間検出を行うことが検討されている。つま
り、音韻の周波数構造を予め知識として袋首に登録して
おき、雑音の周波数構造が音韻のそれと似ていないこと
を利用するもので、例えば入力信号のパワー情報から求
められる音声候補区間について音韻分類を行い、これに
よって求められた音韻ラベルの時系列に基づいて音声区
間であるか否かを判定するものである。
ところが、この音韻分類は音響分析における成る時刻の
周波数構造を調べるだけのものであるから、例えば音韻
/l f/や/B/と似た周波数構造を持つ所謂舌うち
音や、音韻/h/と同様な周波数構造の息漏れ雑音を誤
判定して、誤った音韻ラベル付けが行われる等の不具合
があった。このようにして音韻ラベル付けにおいて誤り
が混入すると、その後の処理において音韻ラベルの時間
的構造を調べても、雑音を除去することができなくなる
と云う問題が生じた。このように、従来にあっては、連
続的に入力される音声信号の音声区間を正しく判定検出
することが非常に困齢であった。
〔発明の目的〕
本発明はこのような事情を考慮1.でなされたもので、
その目的とするところは、舌うち音や息もれ等の雑音に
左右されることなしに入力信号中の音声区間を正1.<
、しかも安定に検出することのできる音声区間検出装置
を提供することにある。
〔発明の概、要〕
本発明は、音声区間の開始時点および終了時点をそれぞ
れ含む部分区間における特徴パラメータの時間構造を標
準パターンとして予め登録しておき、入力信号を分析し
て求められる特徴パラメータの時系列とL記標準パター
ンとの類似度をそれぞれ計算して、その類似度値に従っ
て入力信号中の音声区間の始端点とをそれぞれ判定検出
するようにしたものである。
〔発明の効果〕
かくして本発明によれば、音声区間の始端点および終端
点の周波数的特徴構造のみならず、その時間的な構造も
特徴パラメータレベルとして標準パターンとして与えら
れるので、音声とは周波数的構造が似ているが、時間的
構造を異にする舌うち音や息もれ等の雑音を高精度に除
外して、その音声区間の始端点および終端点をそれぞれ
正確に、しかも安定に判定1.て入力信号中の音声区間
を検出することが可能となる。
故に、正しく検出された音声区間に従って、その音声認
識を確実に行わしめることが可能となる等の実用り絶大
なる効果が奏せられる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき説明する
第1図は実施例装置の概略構成図であり、Iは音響分析
部である。この音響分析部1は1例えば音声帯域を2〜
8程度に分けた複数の帯域通過フィルターからなる周知
のフィルダーバンクからなり、入力信号をスペクトラム
分析して一時時間毎に周波数に対応した特徴パラメーク
を求めてこれを保持している。この音響分析部1を介1
.て求められた入力信号の特徴パラメータ時系列が類似
度計算部2に与えられ、標準パターン記憶部3に予め登
録された標準パターンとの類似度が計算される。しかし
て、1記記憶部3に予め登録される標準パターンは、標
準音声の音声区間の開始時点および終了時点をそれぞれ
含む部分区間の、特徴パラメータの時系列として与えら
れるものである。尚、この標準パターンを為す特徴パラ
メータの時間的サンプル法は、所定の分析時間に対して
連続的に取出しても良いが、不連続に決定されたもので
あっても良く、要はその端点位置が部分区間の時間方向
の中央に位置付けられるようにすればよい。
しかして、始端点に着目すれば、日本語音声の場合には
約100音節が異なる音声パターンを持つが、前述1.
た帯域分割による周波数的特徴を抽出したとき、前舌母
音内と後舌母音内とを特に区別する必要がなくなる。従
ってこの場合には、約数十種類程度の標準パターンを準
備すれば、日本語入力音声の始端点検出を十分確実に行
うことが可能となる。また、装置が取扱う語棄が予め定
っているような場合には、各晰語に応じた標準パターン
を準備しておくだけで。
その目的が達成される。一方、終端点を含む部分区間に
おける標準パターンについては、音声の終端側はその構
造からして母音であること、また無声化の場合には区別
を要1.ない母音もあることから、数種の標準パターン
のみを準備するだけでよい。
類似度計算部3は、このようにして定められた各標準パ
ターンに対して、成る時刻における入力信号の特徴パラ
メータ時系列との類似度を計算するものである。この類
似度計算は、例えば複合類似度計算法を用いる等して、
パターンマ・ソチング的に行われる。しかして、類似度
計算部3は、この類似度計算を入力信号の分析時間毎に
、複数の標準パクーソに対してそれぞれ行っており、こ
れによって各標準パターンニ対する類似度の時系列が求
められている。判定部4は、このような類似度の時系列
を入力し、各標準パターン毎に予め定められいる閾値を
越え、且つ極大値をとる類似度値が得られる時点を音声
区間の端点、つまり始端点または終端点と17て・判定
検出している。この始端点または終端点は、それぞれ始
端点を含む部分区間の標準パターン、および終端点を含
む部分区間の標準パターンによって相互に独立に求めら
れることは云うまでもない。このようにして音声の始端
点と終端点とが検出され、これらによって入力信号中の
音声区間が示されることになる。尚、始端点および終端
点が複数個存在する場合には、その組合せによって音声
区間が示されることになる。
第2図は、上述した一連の区間検出処理を示己AL す制御フローで、音声信号が行われている期間!順次所
定の分析時間毎に入力信号の特徴パラメータを抽出する
(ステ・ツブ11)。そして成る時間毎に上記特徴パラ
メータの時系列を抽出しくステ・ツブ12)、その時系
列と標準パターンとの類似度を計算する(ステ・ツブ1
3)。その後、この類似度値に従って音声区間の始端点
と終端点をそれぞれ判定すればよい(ステップ14)。
つまり、第3図に示すように入力信号の時系列に対1.
て部分区間毎に、それが始端点であるか終端点であるか
、更にはそれ以外であるかを、標準パターンとのマヅチ
ングによって判定検出すればよい。
尚、本発明は上記実施例に限定されるものではない。例
えば端点が部分区間の時間方向中心からずれた標準パタ
ーンを用いる場合には、溶点検出した部分区間から、上
記ずれの分を補正して端点位置を求めなければならない
ことは勿論である。また入力信号のパワーから、明らか
に無音区間である部分を検出し、この検出無音区間を除
く部分を音声候補区間と[7て取出し、この区間につい
てのみ前述した類似度計算を行うようにすれば、計算l
を少なくすることができる。その他、本発明はその要旨
を逸脱しない範囲で種々変形して実施することかできる
以り説明したように本発明によれば、端点を含む部分区
間の特徴パラメータの時間構造を標準パターンとして備
えて、入力信号の特徴パラメータの時系列とのパターン
マツチングを行い、その類似度から音声区間の始端点と
を検出するので、舌うち音や息漏れ等の雑音に左右され
ることなく、その時間的構造から正しく音声区間を検出
することができ、その検出精度も高くて安定である。こ
れ故、連続発声されて入力される音声の存在区間を正し
く判定して、その認識処理を効果的に行うことが可能と
なり、実用上絶大なる効果が奏せられる。
【図面の簡単な説明】
第1図は本発明の一実施例装置の概略構成図、第2図は
実施例に係る音声区間検出処理の流れを示す図、第3図
は入力信号と部分区間との関係を示す図である。 I・・・音響分析部 2・・・類似度計算部 3・・・特徴パラメータ記憶部 4・・・判定部 1用幀人代理人  弁理士 鈴 江 武 彦1 第1凶 第 3 図 −70(

Claims (3)

    【特許請求の範囲】
  1. (1)入力信号を一定時間毎に分析してその特徴パラメ
    ータを求める音響分析部と、音声区間の開始時点および
    終了時点を含む部分区間における特徴パラメータの時間
    構造を標準パターンとして記憶した記憶部と、この標準
    パターンと前記入力信号の特徴パラメータ時系列との類
    似度をそれぞれ計算する手段と、計算された類似度値か
    ら前記入力信号の音声区間の始端点と終端点とをそれぞ
    れ判定検出する手段とを具備したことを特徴とする音声
    区間検出装置。
  2. (2)類似度計算は入力信号のパワーから判定される音
    声候補区間の特徴パラメータ時系列に対して行われるも
    のである特許請求の範囲第1項記載の音声区間検出装置
  3. (3)特徴パラメータの時間構造は、音声の始端点およ
    び終端点を含む部分区間における音声の周波数・時間構
    造と1.て音声パターンを表わしたものである特許請求
    の範囲第1項記載の音声区間検出装置。
JP57227708A 1982-12-28 1982-12-28 音声区間検出装置 Granted JPS59121099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57227708A JPS59121099A (ja) 1982-12-28 1982-12-28 音声区間検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57227708A JPS59121099A (ja) 1982-12-28 1982-12-28 音声区間検出装置

Publications (2)

Publication Number Publication Date
JPS59121099A true JPS59121099A (ja) 1984-07-12
JPH045198B2 JPH045198B2 (ja) 1992-01-30

Family

ID=16865103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57227708A Granted JPS59121099A (ja) 1982-12-28 1982-12-28 音声区間検出装置

Country Status (1)

Country Link
JP (1) JPS59121099A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60225197A (ja) * 1984-04-20 1985-11-09 三洋電機株式会社 音声認識装置
JPH0297998A (ja) * 1988-10-05 1990-04-10 Sekisui Chem Co Ltd 音声判定方式
JP2007264473A (ja) * 2006-03-29 2007-10-11 Toshiba Corp 音声処理装置、音声処理方法および音声処理プログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8469313B2 (en) 2010-02-16 2013-06-25 The Boeing Company Aerodynamic structure having a ridged solar panel and an associated method
CA2794139C (en) 2011-11-02 2014-08-05 Honda Motor Co., Ltd. Outboard engine unit

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60225197A (ja) * 1984-04-20 1985-11-09 三洋電機株式会社 音声認識装置
JPH0297998A (ja) * 1988-10-05 1990-04-10 Sekisui Chem Co Ltd 音声判定方式
JP2007264473A (ja) * 2006-03-29 2007-10-11 Toshiba Corp 音声処理装置、音声処理方法および音声処理プログラム
US7801726B2 (en) 2006-03-29 2010-09-21 Kabushiki Kaisha Toshiba Apparatus, method and computer program product for speech processing

Also Published As

Publication number Publication date
JPH045198B2 (ja) 1992-01-30

Similar Documents

Publication Publication Date Title
JPH0352640B2 (ja)
US5033089A (en) Methods for forming reference voice patterns, and methods for comparing voice patterns
US20140200889A1 (en) System and Method for Speech Recognition Using Pitch-Synchronous Spectral Parameters
JPS59121099A (ja) 音声区間検出装置
Glass et al. Detection and recognition of nasal consonants in American English
JPH0558553B2 (ja)
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
JPS58108590A (ja) 音声認識装置
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPS63226691A (ja) 標準パターン作成方式
JP2882791B2 (ja) パターン比較方式
JPH0682275B2 (ja) 音声認識装置
JPS6147999A (ja) 音声認識装置
JP2892004B2 (ja) 単語音声認識装置
JPS5885495A (ja) 音声認識装置
JP2844592B2 (ja) 離散単語音声認識装置
KASUYA et al. Automatic Detection of Vowel Centers from Continuous Speech
JP2901976B2 (ja) パターン照合予備選択方式
JPS5936300A (ja) 音声認識装置
JPH06110491A (ja) 音声認識装置
JPS6317499A (ja) 単語音声認識方式
JPH02232698A (ja) 音声認識装置
JPH01170998A (ja) 音韻区間情報形成装置
JPH0458638B2 (ja)
JPS63249198A (ja) 基準データの登録用の検査機構を持った音声制御認識方式