JPH07225593A - 音処理装置 - Google Patents

音処理装置

Info

Publication number
JPH07225593A
JPH07225593A JP6036347A JP3634794A JPH07225593A JP H07225593 A JPH07225593 A JP H07225593A JP 6036347 A JP6036347 A JP 6036347A JP 3634794 A JP3634794 A JP 3634794A JP H07225593 A JPH07225593 A JP H07225593A
Authority
JP
Japan
Prior art keywords
section
sound
data
unit
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6036347A
Other languages
English (en)
Inventor
Kenji Chiba
健司 千葉
Isao Uesawa
功 上澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP6036347A priority Critical patent/JPH07225593A/ja
Priority to US08/382,786 priority patent/US5727121A/en
Publication of JPH07225593A publication Critical patent/JPH07225593A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】 音信号をディジタル音データに変換して処理
する場合に、音信号から所望の意味のあるまとまりの区
間データを効率的にかつ正確に抽出することができる音
処理装置を提供する。 【構成】 音信号を入力する入力手段(102)と、入
力された音信号をディジタル音データとするディジタル
化手段(104)と、音信号が持つ特徴量を抽出する分
析手段(106)と、前記分析手段により抽出された特
徴量により、入力信号の有為区間および無為区間を判定
する判定手段(108)と、前記判定手段による判別結
果を有為区間または無為区間にの長さ応じて補正する補
正手段(110)とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音処理装置に関し、特
に、音信号をディジタル音データに変換して処理する場
合に、音信号から所望のデータ部分を効率的にかつ正確
に抽出することができる音処理装置に関するものであ
る。
【0002】
【従来の技術】電子的に音を扱い、その音信号のデータ
処理を行う技術は、近年、いろいろと発展しており、例
えば、次に示すような文献[1],文献[2],文献
[3]などにおいて紹介され、論じられている。文献
[1]:新居康彦,大崎正巳著「音声処理とDSP」,
啓学出版株式会社,1989年5月31日第1刷発行、
文献[2]:古井貞煕著「ディジタルテクノロジーシリ
ーズ ディジタル音声処理」,東海大学出版会,19
85年9月25日第1刷発行、文献[3]:特開昭63
−30645号公報、
【0003】この文献[3]の特公昭63−30645
号公報に記載されている「情報処理システム」は、音声
成分とテキスト成分との両方を有するドキュメントを処
理する情報処理システムの提案であり、ここでは、表示
装置において、音声成分の表示が、テキスト成分に対す
る音声成分の相対的位関係を指示するので、それらの成
分の表示中にカーソルを置き、編集指令を与えることに
より、音声成分とテキスト成分の両方の編集が可能とな
る。
【0004】次に、具体的に従来における音処理装置に
ついて説明する。まず、構成について説明する。図5は
従来における音処理装置の一例を示すブロック図であ
る。図5において、501は入力音信号を示している。
入力音信号501は、マイクロフォン502によって、
入力アナログ音信号503に変換される。更に、入力ア
ナログ音信号503は、アナログ・ディジタル変換器
(以下、AD変換器と略称する)504によって、入力
ディジタル音データ505に変換される。入力ディジタ
ル音データ505は、分析部506により分析されて、
所定の特徴量507が抽出される。抽出された音信号の
特徴量507は、判定部508に供給され、判定部50
8は、抽出された音信号の特徴量507に基づいて、入
力音声の有為または無為を判定し、判定結果509を出
力する。音データ処理部512は、この判定結果509
に基づいて、入力ディジタル音データの有為区間を処理
し、処理済の出力ディジタル音データ513を出力す
る。
【0005】このような音処理装置において、判定部5
08が音信号の特徴量507から有為区間を判定する場
合、その有為区間の判定手法としては、例えば、音の波
形情報である振幅やパワーを特徴量として用いる手法
が、一般的には利用される。すなわち、この有為区間の
判定手法に関しては、上述の文献[1]において「音声
検出器の方式として、信号のパワー検出、信号のスペク
トル分析と判定がある。さらにこの2つの方式を複合的
に組合せたものや、入力信号に応じて、2つ方式を適応
的に動作させるものもある」と記載されているように、
音声検出により制御を行う場合の音声検出では、音の波
形情報である振幅やパワーが特徴量として用いられる。
【0006】つまり、図5に示した音処理装置の例で説
明すると、分析部506で分析した特徴量507を振幅
値やパワーとする場合、その特徴量507から有為区間
の判定を行うため、判定部508で、その特徴量507
を所定の値と比較して、その有為または無為を判定す
る。すなわち、ここでの所定の値をVthとすると、その
判定式は 「 IF (入力された特徴量の値)> Vth THEN (有為) ELSE (無為)」 となる。ここでの判定部508により判定された判定結
果509が「有為」である場合のみ、音データ処理部5
12において、入力ディジタル音データ505の中から
処理済み出力ディジタル音データが出力される。
【0007】
【発明が解決しようとする課題】ところで、音のデータ
中の音声部分のうち、無声音の子音や促音の部分は、信
号波形上で観測した場合、振幅が著しく小さい。実際、
音信号の波形の振幅のダイナミックレンジが、30dB
を越えることもありうることが知られている。
【0008】従って、従来においては、例えば、音処理
装置が図5に示したように構成されていると、無声音の
子音部分や促音部分のように振幅の小さい信号区間は、
無音区間と判定され、無為の区間であると判定されてし
まうという問題があった。このため、音データ中の音声
部分において、文や文節など本来的には一つの論理的な
まとまりである考えられる音データの区間の中で、切れ
目が生ずる可能性があり、音データ中の音声部分のうち
から、意味のあるまとまりの区間を精度良く、抽出する
ことが困難であるという問題があった。
【0009】本発明は、上記のような問題を解決するた
めになされたものであり、本発明の目的は、音信号をデ
ィジタル音データに変換して処理する場合に、音信号か
ら所望の意味のあるまとまりの区間データを効率的にか
つ正確に抽出することができる音処理装置を提供するこ
とにある。
【0010】
【課題を解決するための手段】上述のような目的を達成
するため、本発明による音処理装置(請求項1)は、音
信号を入力する入力手段(102)と、入力された音信
号をディジタル音データとするディジタル化手段(10
4)と、音信号が持つ特徴量を抽出する分析手段(10
6)と、前記分析手段により抽出された特徴量により、
入力信号の有為区間および無為区間を判定する判定手段
(108)と、前記判定手段による判別結果を有為区間
または無為区間にの長さ応じて補正する補正手段(11
0)とを備えたことを特徴とする。
【0011】また、本発明による音処理装置(請求項
2)は、前記の構成において、前記判定手段(108)
が、有為区間および無為区間の判定と共にその区間の長
さを抽出し、抽出した区間情報を付加する処理手段(2
07)を有することを特徴とする。また、更に本発明に
よる音処理装置(請求項3)は、前記の構成において、
前記補正手段(110)が、有為区間および無為区間の
長さを単一または複数の所定値と比較し、その比較結果
に応じて有為区間および無為区間の判別結果を補正する
処理手段(402)を有することを特徴とする。
【0012】
【作用】このような特徴を有する本発明の音処理装置
(請求項1)においては、入力手段(102)が音信号
を入力すると、ディジタル化手段(104)が、入力さ
れた音信号をディジタル音データとする。分析手段(1
06)は、ディジタル音データから、音信号が持つ特徴
量を抽出する。判定手段(108)が、前記分析手段に
より抽出された特徴量により、入力信号の有為区間およ
び無為区間を判定する。そして、補正手段(110)
が、前記判定手段による判別結果を有為区間または無為
区間の長さに応じて補正する。
【0013】また、本発明の音処理装置(請求項2)に
おいては、判定手段(108)が入力信号の有為区間お
よび無為区間を判定する場合に、その中で、処理手段
(207)が、有為区間および無為区間の判定と共にそ
の区間の長さを抽出し、抽出した区間情報を付加する。
そして、本発明の音処理装置(請求項3)においては、
前記補正手段(110)が判別結果を有為区間または無
為区間の長さに応じて補正する場合に、上述のようにし
て付加された区間情報を用いて、その中で、処理手段
(402)が、有為区間および無為区間の長さを単一ま
たは複数の所定値と比較し、その比較結果に応じて有為
区間および無為区間の判別結果を補正する。
【0014】これにより、音信号をディジタル音データ
に変換して処理する場合、音信号から所望の意味のある
まとまりを1つの区間として、その音データを正確に抽
出することができる。このため、音処理を行う場合に
も、意味のあるまとまりの区間データは、1つのデータ
として処理することができ、全体的にも音信号の処理を
効率よく行うことができる。具体的な数値例で説明する
と、例えば、日本語音声中の子音部の時間長は5〜13
0ms程度であり、子音と母音からなる音節でも最大2
00ms程度である。文あるいは文節は複数の音節から
構成されるので、これに対応する音データ区間は、子音
に対応する音データ区間よりも長い。したがって、文,
文節を取り出したい場合には、130ms以下の区間で
区切られることは無いので、このような判定がなされた
区間データが存在する場合、初期には無為区間と判定さ
れていても、その区間データを有為区間の判定結果に補
正する。
【0015】つまり、本発明による音処理装置において
は、判定部で判定された有為区間あるいは無為区間の継
続長を抽出し、その継続長を所定値と比較して判定結果
の補正を行う。このような継続長の比較による有為区間
あるいは無為区間の区間の補正により、文や文節などに
代表される音データ区間、つまり、本来は一つの論理的
なまとまりであるとされる音データの区間データを、必
要な情報を欠落させることなく、対応する一つの区間と
して、音データの中から抽出することができることにな
る。このため、音情報の編集や利用を効率よく行うこと
が可能となる。
【0016】
【実施例】以下、本発明の実施例を図面を用いて具体的
に説明する。図1は、本発明の一実施例にかかる音処理
装置の全体構成を示すブロック図である。図1におい
て、102はマイクロフォン、104はAD変換器、1
06は分析部、108は判定部、110は補正部、11
2は音データ処理部の各々の処理ブロックである。
【0017】次に、これらの処理ブロックの動作を音信
号処理の流れに沿って説明する。音情報101は、マイ
クロフォン102によって、アナログ音信号103にな
り、更に、アナログ音信号103は、AD変換器104
によりアナログ・ディタル変換の処理が行われ、入力デ
ィジタル音データ105に変換される。入力ディジタル
音データ105は、音データ処理部112に供給され
て、音データ処理が行なわれる。その際、音データ処理
の前処理として、分析部106で分析され、音情報の特
徴量107が抽出される。そして、次に、判定部108
において、この特徴量107から有為区関または無為区
間の判定が行なわれる。この結果、判定部108から判
定結果109が出力される。判定結果109は、補正部
110に入力され、判定結果の補正がなされて、補正済
判定結果111が出力される。補正済判定結果111
は、音データ処理部112に入力され、補正済判定結果
111の内容に基づいて、音データ処理部112が音信
号の処理を効率よく行う。
【0018】次に、判定部について詳細に説明する。図
2は、判定部の要部の構成を示すブロック図である。図
2において、201は閾値処理部、203は比較部、2
05は記憶部、207は制御処理部、209はカウンタ
である。この判定部108において、閾値処理部201
は、前述の分析部106から入力された特徴量107を
所定の値と比較し、閾値処理結果202を出力する。閾
値処理部201から出力された閾値処理結果202は、
比較部203と記憶部205に入力される。記憶部20
5は閾値処理結果202を一時的に記憶し、次回の閾値
処理結果202の入力時に、記憶していた前回の閾値処
理結果を過去の閾値処理結果204として、比較部20
3に供給する。比較部203は、閾値処理部201から
入力された今回の閾値処理結果202と、記憶部205
に記憶されている過去の閾値処理結果204とを比較す
る。そして、比較結果206は、制御処理部207に出
力する。制御処理部207は、比較部203からの比較
結果206により、カウンタ209の制御を行い、比較
結果206が同じである区間長(継続長)を判定して、
判定結果109として出力する。
【0019】更に続いて、判定部の動作を具体例で詳細
に説明する。分析部106で抽出された特徴量107に
対し、閾値処理部201では、閾値処理を行う。すなわ
ち、入力される特徴量をparaとし、閾値処理を行う場合
の所定の閾値をthとし、更に閾値処理の結果をoutとす
ると、 「 IF ( para > th ) THEN ( out = 1 ; 有為を表わす) ELSE ( out = 0 ; 無為を表わす)」 となる。この閾値処理の結果のoutの値“1”または
“0”が、比較部203および記憶部205に入力され
ることになる。
【0020】比較部203では、入力された今回の閾値
処理結果202と過去の閾値処理結果204とを比較
し、相違を判定して、比較結果206として出力する。
この比較結果206に基づき、制御処理部207では、
カウンタ209の制御と判定結果の処理を行う。つま
り、ここでは比較結果206が同じ場合には、その間、
カウンタ209をインクリメントし続ける。今回と過去
の比較結果206が異なる場合を検出すると、その時に
は、カウンタ209の値と、その時の過去の閾値処理結
果204を合わせて、判定結果109として出力する。
【0021】ここでの判定で、有為を“1”として、無
為を“0”として表記すると、判定部108から出力さ
れる判定結果109は(“0”または“1”,区間の長
さ)というデータ形式のデータにより表現され、これが
1つの判定結果のデータとなり、順次に系列データとし
て出力される。例えば、 のように、有為また無為の判定結果の“0”または
“1”と、その判定結果が続く継続長(区間)とのデー
タとなる。
【0022】図3は、判定部における比較部および制御
処理部の一連の動作例を示すフローチャートである。次
に、図3を参照して、比較部203および制御処理部2
07の一連の動作を説明する。処理を開始すると、ま
ず、ステップ31において、カウンタリセットを行い、
次に、ステップ32において、カウンタをインクリメン
トする。次に、ステップ33において、今回に入力され
た特徴量の閾値処理結果は、前回の特徴量の閾値処理結
果と同じである否かを判定する。今回と前回の閾値処理
結果が同じである場合には、ステップ32に戻り、カウ
ンタのインクリメントを継続して行う。また、今回の特
徴量の閾値処理結果が、前回の閾値処理結果と異なる場
合、ステップ34に進み、カウンタの値と、比較部によ
る閾値処理結果を出力する。これにより、前述たような
データ形式の「閾値処理結果とその継続長」の組の区間
データが出力される。そして、次にステップ35におい
て、特徴量の入力が続いているか否かを判定し、次の入
力がある場合には、ステップ31に戻り、ステップ31
からの処理を繰り返す。また、入力がない場合には、処
理を終了する。
【0023】次に、補正部の構成について説明する。図
4は、本発明の要部の補正部の構成の一例を示すブロッ
ク図である。図4において、401は補正記憶部、40
2は補正処理部、403は補正制御部である。補正記憶
部401は、先に説明した判定部108からの判定結果
109を一時的に記憶する。補正処理部402は、この
判定結果109のデータ(「閾値処理結果とその継続
長」の組の区間データ)に対して補正処理を行う。ま
た、補正制御部403は、補正制御信号に従って補正処
理の制御を行う。
【0024】続いて、このような構成の補正部110の
動作を説明する。補正処理部402では、判定部108
から入力された判定結果109のデータ(区間データ)
に対して、その継続長を所定の値と比較する。その比較
の結果、所定の値よりも継続長が大きければ、そのまま
出力するが、そうでない場合、つまり継続長が所定の値
よりも小さい場合は、判定結果の有為または無為の判定
結果を反転して、その継続長を直前のデータの継続長お
よび直後のデータの継続長と合せ、1つの判定結果のデ
ータ(区間データ)に補正して出力する。これが補正済
判定結果111となる。すなわち、短かい継続長の区間
データは、その前後の区間データ(有為または無為の判
定結果が共に同じ)の判定結果に合せて、更に前後の区
間データに含ませて、前後の区間データと共に1つの区
間データとする補正を行い、補正済判定結果111とし
て出力する。
【0025】例えば、判定結果のある時点のデータと、
その直前のデータと、その直後のデータとが、それぞれ
に次のようであったとすると、 (“0”,Lf ) (“1”,Lc ) (“0”,Ll ) このとき、所定の値をVとすると「Lc < V」の場合
に補正がなされ、補正済判定結果のデータは、その前後
のデータの有為または無為の判定の結果に合せるための
反転を行い、更に、3つのデータの継続長を加算して、
補正済判定結果のデータは、 (“0”,Lf +Lc +Ll ) となる。以下、このような補正の処理を入力がなくなる
まで処理を続ける。
【0026】つまり、有為“1”または無為“0”と判
定された各々の区間のデータに対して、その区間(継続
長)の長さが、特に短いような部分の区間のデータに対
しては、その有為または無為の判定の結果を誤判定と見
なし、その前後の判定結果の区間に含めてしまう補正処
理を行う。これにより、ノイズ等の影響を除外して、論
理的にまとまりのある音信号の有為“1”または無為
“0”と判定される区間が得られることになる。
【0027】図6は音声波形のパワー値による判定結果
の一例を示す信号波形図である。図6においては、時間
軸に対して、音号波形と、その音号波形の短時間パワー
値の閾値処理による判定結果と、特徴量として抽出した
音号波形の短時間パワー値の波形とを示している。図6
に示した例は、音信号処理の有為区間または無為区間を
判定するための特徴量として、音号波形の短時間パワー
値を用いる場合の一例である。この場合、音号波形から
順次に短時間パワー値が求められ、この短時間パワー値
が、判定部において閾値処理され、その判定結果が出力
される。
【0028】このように判定結果が出力された場合、そ
の判定結果は、図6に示すように、本来的には有為区間
(有音区間)と判定されるベき区間でありながら、非常
に短時間の区間で無為区間(無音区間)と判定され、補
正が行われるベき区間(補正1,補正2,補正3)が生
じている。したがって、前述のように、この補正が行わ
れるベき区間(補正1,補正2,補正3)は、その継続
長が、通常の場合に無為区間と判定される無音区間に比
ベて、著しく短い区間となっているので、ここでは、補
正部によって、これを判断して有音区間とする補正を行
う。
【0029】また、逆に、本来的には無為区間(無音区
間)と判定されるベき区間でありながら、非常に短時間
の区間で有為区間(有音区間)と判定され、逆の補正が
行われるベき区間(補正4)も生じている。この場合に
も、同様に、その継続長が他に比ベて著しく短い区間と
なっており、補正部によりこれを判定して、この区間
(補正4)に対しては、無音区間とする補正を行う。
【0030】ここでの図6に示した音信号波形の処理の
例では、特徴量として音号波形の短時間パワー値を用い
る場合を示したが、このような特徴量として、音声波形
の零交差数,自己相間係数などの波形パラメータ,LP
C係数,ケプストラム係数,LPCケプストラム係数な
どの周波数パラメータなどが、同様に用いられる。ある
いは、分析部の前段階において、フィルターバンクによ
って、帯域分割処理を行ってから、特徴量の抽出による
有為区間および無為区間の判定を行うようにしても良
い。
【0031】また、ここでの補正部における閾値(区間
の継続長を判定する閾値)は、判定部における閾値(特
徴量による有為または無為を判定する閾値)に対応させ
て、変化させるように構成しても良い。例えば、判定部
での閾値を高くすると、補正部における閾値も高くする
ように構成する。あるいは、単一または複数の最適な閾
値の組合せを記憶しておき、適宜に読み出して使用する
ようにしても良い。これにより、それぞれの特徴量によ
応じて適切に補正処理を行うことができる。
【0032】
【発明の効果】以上に述べたように、本発明の音処理装
置によれば、音データの中から所定のデータ区切りを精
度よく効率的に抽出することができ、音情報の再利用が
容易になる。また、音声認識の前処理として用いれば、
処理の負荷低減や精度の向上が可能となる。
【図面の簡単な説明】
【図1】 図1は本発明の一実施例にかかる音処理装置
の全体構成を示すブロック図、
【図2】 図2は判定部の要部の構成を示すブロック
図、
【図3】 図3は判定部における比較部および制御処理
部の一連の動作例を示すフローチャート、
【図4】 図4は本発明の要部の補正部の一構成例を示
すブロック図、
【図5】 図5は従来の音処理装置の構成を示すブロッ
ク図である。
【図6】 図6は音声波形のパワー値による判定結果の
一例を示す信号波形図である。
【符号の説明】
101…入力音信号、102…マイク、103…入力ア
ナログ音信号、104…アナログ・ディジタル変換器
(AD変換器)、105…入力ディジタル音データ、1
06…分析部、107…特徴量、108…判定部、10
9…判定結果、110…補正部、111…補正済判定結
果、112…音処理部、113…処理済の出力ディジタ
ル音データ、201…閾値処理部、203…比較部、2
05…記憶部、207…制御処理部、209…カウン
タ、401…補正記憶部、402…補正処理部、403
…補正制御部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音信号を入力する入力手段と、 入力された音信号をディジタル音データとするディジタ
    ル化手段と、 音信号が持つ特徴量を抽出する分析手段と、 前記分析手段により抽出された特徴量により、入力信号
    の有為区間および無為区間を判定する判定手段と、 前記判定手段による判別結果を有為区間または無為区間
    の長さに応じて補正する補正手段とを備えたことを特徴
    とする音処理装置。
  2. 【請求項2】 請求項1に記載の音処理装置において、
    前記判定手段は、 有為区間および無為区間の判定と共にその区間の長さを
    抽出し、抽出した区間情報を付加する処理手段を有する
    ことを特徴とする音処理装置。
  3. 【請求項3】 請求項1または請求項2に記載の音処理
    装置において、 前記補正手段は、有為区間および無為区間の長さを単一
    または複数の所定値と比較し、その比較結果に応じて有
    為区間および無為区間の判別結果を補正する処理手段を
    有することを特徴とする音処理装置。
JP6036347A 1994-02-10 1994-02-10 音処理装置 Pending JPH07225593A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6036347A JPH07225593A (ja) 1994-02-10 1994-02-10 音処理装置
US08/382,786 US5727121A (en) 1994-02-10 1995-02-02 Sound processing apparatus capable of correct and efficient extraction of significant section data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6036347A JPH07225593A (ja) 1994-02-10 1994-02-10 音処理装置

Publications (1)

Publication Number Publication Date
JPH07225593A true JPH07225593A (ja) 1995-08-22

Family

ID=12467311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6036347A Pending JPH07225593A (ja) 1994-02-10 1994-02-10 音処理装置

Country Status (2)

Country Link
US (1) US5727121A (ja)
JP (1) JPH07225593A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956685A (en) * 1994-09-12 1999-09-21 Arcadia, Inc. Sound characteristic converter, sound-label association apparatus and method therefor
US20020116186A1 (en) * 2000-09-09 2002-08-22 Adam Strauss Voice activity detector for integrated telecommunications processing
WO2002093552A1 (en) * 2001-05-11 2002-11-21 Koninklijke Philips Electronics N.V. Estimating signal power in compressed audio
US7260439B2 (en) * 2001-11-01 2007-08-21 Fuji Xerox Co., Ltd. Systems and methods for the automatic extraction of audio excerpts
JP3891111B2 (ja) * 2002-12-12 2007-03-14 ソニー株式会社 音響信号処理装置及び方法、信号記録装置及び方法、並びにプログラム
US8457771B2 (en) * 2009-12-10 2013-06-04 At&T Intellectual Property I, L.P. Automated detection and filtering of audio advertisements

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62109099A (ja) * 1985-11-08 1987-05-20 沖電気工業株式会社 音声区間検出方式

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5870292A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 車両用音声認識装置
JPS603700A (ja) * 1983-06-22 1985-01-10 日本電気株式会社 音声検出方式
JPH06105394B2 (ja) * 1986-03-19 1994-12-21 株式会社東芝 音声認識方式
JPS62232691A (ja) * 1986-04-03 1987-10-13 株式会社リコー 音声認識装置
JPS6330645A (ja) * 1986-07-24 1988-02-09 Hitachi Electronics Eng Co Ltd 駆動装置
JP2551050B2 (ja) * 1987-11-13 1996-11-06 ソニー株式会社 有音無音判定回路

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62109099A (ja) * 1985-11-08 1987-05-20 沖電気工業株式会社 音声区間検出方式

Also Published As

Publication number Publication date
US5727121A (en) 1998-03-10

Similar Documents

Publication Publication Date Title
US7089184B2 (en) Speech recognition for recognizing speaker-independent, continuous speech
JP2815579B2 (ja) 音声認識における単語候補削減装置
KR101122591B1 (ko) 핵심어 인식에 의한 음성 인식 장치 및 방법
JPH07225593A (ja) 音処理装置
JP2996019B2 (ja) 音声認識装置
US6823304B2 (en) Speech recognition apparatus and method performing speech recognition with feature parameter preceding lead voiced sound as feature parameter of lead consonant
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JPH0830290A (ja) 音声入力可能な情報処理装置およびそれにおける誤処理検出方法
JP3114757B2 (ja) 音声認識装置
RU2234746C2 (ru) Способ дикторонезависимого распознавания звуков речи
JPH07230293A (ja) 音声認識装置
JP2757356B2 (ja) 単語音声認識方法および装置
US20240144934A1 (en) Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium
JPH1069291A (ja) 音声認識装置
JP2664136B2 (ja) 音声認識装置
JP2594916B2 (ja) 音声認識装置
JPH05224694A (ja) 音声認識装置
Elghonemy et al. Speaker independent isolated Arabic word recognition system
JP3357752B2 (ja) パターンマッチング装置
JPH09212190A (ja) 音声認識装置及び文認識装置
JP2002341891A (ja) 音声認識装置および音声認識方法
JPH08146996A (ja) 音声認識装置
JPH06324696A (ja) 音声認識装置及び方法
JPS63223696A (ja) 音声パタ−ン作成方式
JPH0667695A (ja) 音声認識方法および音声認識装置