JPH0883091A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0883091A
JPH0883091A JP6215958A JP21595894A JPH0883091A JP H0883091 A JPH0883091 A JP H0883091A JP 6215958 A JP6215958 A JP 6215958A JP 21595894 A JP21595894 A JP 21595894A JP H0883091 A JPH0883091 A JP H0883091A
Authority
JP
Japan
Prior art keywords
pattern
recognition
voice
input
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6215958A
Other languages
English (en)
Inventor
Kenji Mizutani
研治 水谷
Makoto Hirai
誠 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6215958A priority Critical patent/JPH0883091A/ja
Publication of JPH0883091A publication Critical patent/JPH0883091A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 認識率の高い音声認識装置を提供すること。 【構成】 音声を入力として電気信号に変換する音声入
力装置と、音声入力装置が出力する電気信号を入力パタ
ーンとして記録する音声信号記録装置を用いる。入力パ
ターンを認識するための音声の標準パターンを生成する
ために、照合パターン生成装置を用いる。音声信号記録
装置が保持する入力パターン上の音声の終端を確定する
ためにワードスポッティング方式を応用した認識区間確
定装置を用いる。そして、前回の認識終了点から認識区
間確定装置が確定した終了点までの入力パターンと標準
パターンとを照合して一致度を計算し、一致度の高い順
に並べて出力する音声信号照合装置を用いる。誤認識を
防ぐために、パターン認識結果の文脈との整合性を検証
して認識候補の順位を入れ換え、次に入力される音声を
予測して照合パターン生成装置が生成する標準パターン
を制御するために文脈管理装置を用いる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は人間の音声を認識する装
置に関するものであり、特に電子機器の入力装置に関す
るものである。
【0002】
【従来の技術】近年、電子機器の操作を迅速かつ容易に
するために音声認識に関する研究開発がなされている。
入力される音声は電気信号に変換され、時間軸に対する
電圧の変化として扱われる。音声の認識は、一般にその
入力パターンとあらかじめ統計的に学習されている音声
の標準パターンとの差異を、時間的伸縮を考慮しながら
比較し、最も差異が小さい標準パターンを選択すること
によって行われる(例えば、特開平4−36269
8)。この方式では認識精度を向上させるために、標準
パターンに無音パターンを接続してから入力パターンと
の比較を行っている。
【0003】
【発明が解決しようとする課題】前述の認識精度向上技
術には2つの問題がある。第1の問題は、入力パターン
と標準パターンの比較をワードスポッティング方式で行
っているために、標準パターンの長さと数に比例して計
算量が爆発的に多くなることである。第2の問題は促音
を含む入力パターンに対しては、促音と無音とを誤認識
して認識率が逆に低下する可能性があることである。
【0004】本発明では、音声が無音を伴って終了する
ときの、文法によって支配される音韻的特徴に着目し、
ワードスポッティング方式と、認識の開始点と終了点を
あらかじめ確定してから認識を行う従来の音声認識方式
を組み合わせることにより、上記の問題を解決する。
【0005】
【課題を解決するための手段】音声を入力として電気信
号に変換する音声入力装置と、音声入力装置が出力する
電気信号を入力パターンとして記録する音声信号記録装
置を用意する。入力パターンを認識するための音声の標
準パターンを生成するために、照合パターン生成装置を
用いる。音声信号記録装置が保持する入力パターン上の
音声の終端を確定するために認識区間確定装置を用い
る。そして、前回の認識終了点から認識区間確定装置が
確定した終了点までの入力パターンと標準パターンとを
照合して一致度を計算し、一致度の高い順に標準パター
ンを並べて出力する音声信号照合装置を用いる。誤認識
を防ぐために、パターン認識結果の文脈との整合性を検
証して認識候補の順位を入れ換え、かつ、次に入力され
る音声を予測して照合パターン生成装置が生成する標準
パターンを制御するために文脈管理装置を用いる。
【0006】音声信号記録装置は、音声入力装置が出力
する音声の電気信号の情報量を圧縮する情報圧縮装置
と、その出力を記録する入力パターン記録装置で構成す
る。
【0007】照合パターン生成装置は、認識する音声を
構成する単語とその発音を音素表記で記述した語彙情報
格納装置と、単語と発音についてその接続規則を記述し
た文法情報格納装置と、音素のモデルを保持する音素モ
デル格納装置と、無音のモデルを格納する無音モデル格
納装置と、それらが出力する情報を参照して文脈管理装
置が指示する標準パターンを生成する標準パターン生成
装置で構成する。
【0008】認識区間確定装置は、標準パターンの終端
近傍のパターンを生成する終端パターン生成装置と、入
力パターンの中に終端近傍のパターンの存在を認識する
ワードスポッティング装置で構成する。
【0009】音声信号照合装置は、ワードスポッティン
グ装置が認識した終端近傍のパターンを含む標準パター
ンだけを選択する照合パターン絞り込み装置と、前回の
認識終了点から今回の認識終了点までの入力パターンを
標準パターンと照合して一致度の高いものから順に並べ
て出力するパターン照合装置で構成する。
【0010】文脈管理装置は、入力された音声の認識を
開始する時点までの認識結果を記録する発話履歴管理装
置と、音声が発せられる世界に関する知識を格納する対
象世界知識格納装置と、それらに整合する認識候補ほど
高い妥当性を与えて、認識結果の並びを変え、発話履歴
管理装置の内容を更新する認識結果修正装置と、認識履
歴格納装置の内容と対象世界情報格納装置の内容を参照
して次発話を予測するための認識候補生成装置で構成す
る。
【0011】
【作用】ワードスポッティング方式による音声認識は、
短い音韻列について行っているので、その数が増加して
も計算量の増加は小さい。また、促音を含む音声につい
ては、短い音韻と無音パターンを接続し、認識範囲を確
定してから単語全体の音声認識を行うので、促音を認識
の終了点として誤認識する率が低下する。
【0012】
【実施例】本発明の一実施例の音声認識装置の全体の構
成を表すブロック図を図1に示す。音声入力装置101
は、音声を収音し電気信号に変換する。音声信号記録装
置102は、電気信号に変換された音声を記録する。照
合パターン生成装置103は入力パターンと照合すべき
音声の標準パターンを出力する。認識区間確定装置10
4は標準パターンと照合すべき入力パターンの範囲を確
定する。音声信号照合装置105は前回の認識終了点か
ら認識区間確定装置104が検出した終了点までの入力
パターンを標準パターンと照合し、認識結果を出力す
る。文脈管理装置106は得られた認識結果の、これま
での認識結果が作ってきた文脈との整合性を検証し、認
識結果の順位を入れ換え、さらに次発話を予測して照合
パターン生成装置105が生成すべき標準パターンに関
する情報を出力する。
【0013】
【表1】
【0014】次に本発明の動作例を、(表1)に示す会
社の社内案内の音声対話システムに応用した例をあげて
説明する。ユーザが「営業部の、八田さんは、どちらで
しょうか。」と発声すると、音声入力装置101はそれ
を電気信号に変換し、音声信号記録装置102はその波
形を有限時間分記録する。図2に音声信号記録装置10
2の内部構成を表すブロック図を示す。音声入力装置1
01によって電気信号に変換された音声は情報圧縮装置
201に入力され、記録容量を削減するために情報量が
圧縮される。情報量の圧縮には入力された音声を人間が
聞いて判別できる程度に復元可能な近似方法を用いる。
圧縮された音声信号は入力パターンとして情報記録装置
202に記録される。
【0015】照合パターン生成装置103は、文脈管理
装置106の指示により、あらかじめ認識すべき候補の
標準パターンを生成している。対話の開始時点ではユー
ザは部署と名前を発声することが予測されるので、部署
については「社長室の」「営業部の」「経理部の」、人
名については「川田さんを」などを生成している。図3
に照合パターン生成装置103の内部構成を表すブロッ
ク図を示す。語彙情報格納装置301は、ユーザが発話
すると想定される語彙とその発音の音素表記を格納す
る。社内案内の場合では、名詞として部署名、姓、名、
役職、性別を、助詞として「が」「の」「を」「は」
「には」を、動詞句として「お願いします」「いらっし
ゃいますか」「どちらでしょうか」などを用意し、それ
ぞれの音素表記を記述する。文法情報格納装置302
は、各単語の接続規則と音素の接続規則を格納する。音
素モデル格納装置303は音素の音韻モデルを格納す
る。音韻のモデルとしては隠れマルコフモデルを用い
る。無音モデル格納装置304は無音の音韻モデルを格
納する。標準パターン生成装置305は文脈管理装置1
06によって指定される認識候補を語彙情報格納装置3
01、文法情報格納装置302、無音モデル格納装置3
03、音素モデル格納装置304を参照して、無音モデ
ルを音韻モデル列の前後に接続した標準パターンを生成
する。
【0016】認識区間確定装置104は、音声信号記録
装置102が保持する入力パターン「(無音)えいぎょ
うぶの(無音)はっ(無音)たさんわ(無音)どちらで
しょうか(無音)」の中から、音声信号照合装置105
が認識すべき区間を確定する。図4に認識区間確定装置
104の内部構成を表すブロック図を示す。照合パター
ン生成装置103によって生成された標準パターンはパ
ターン生成装置401に入力され、その終端近傍のパタ
ーンが生成される。終端近傍のパターンとしては、助詞
の音韻モデルと無音のモデルを接続した部分を選択す
る。ワードスポッティング装置402は、生成された終
端近傍のパターンが入力パターンの各時点に存在する確
率を計算し、音声信号照合装置105が認識すべき音声
の終了点を確定する。この例では、ワードスポッティン
グ装置402は「の」を終端に持つ標準パターンが「え
いぎょうぶの(無音)」の位置で終了することを示す認
識終了点情報を出力する。
【0017】音声信号照合装置105は前回の認識終了
点から認識区間確定装置104が確定した認識終了点ま
でを認識対象として標準パターンとの一致度を計算す
る。図5に音声信号照合装置105の内部構成を表すブ
ロック図を示す。照合パターン絞り込み装置501は、
認識終了点情報を入力として複数の標準パターンの中か
ら実際に一致度を計算すべきものを選択する。この例で
は、「の」を終端に持つ標準パターン、すなわち、「社
長室の」「営業部の」「経理部の」の音韻モデルの、そ
れぞれの前後に無音の音韻モデルを接続した標準パター
ンが選択される。パターン照合装置502は、それらの
標準パターンと認識終了点情報で示される入力パターン
の一部「(無音)えいぎょうぶの(無音)」との一致度
を計算し、一致度の高いものから順に並べて出力する。
【0018】文脈管理装置106は認識結果を文脈を参
照して再順序づけを行い、照合パターン生成装置105
に次の認識で使用するために生成すべき語句を指示す
る。図6に文脈管理装置106の一実施例の構成を表す
ブロック図を示す。音声信号照合装置105によって順
位付けされたパターン認識結果は、認識結果修正装置6
03が認識履歴格納装置601と対象世界情報格納装置
602が保持する内容と比較し、一貫性のある認識候補
ほど順位が高く修正される。この例では、対象世界情報
格納装置602には、(表1)に示す人事に関する知識
と、受付における標準的な対話手順に関する知識が記述
される。認識結果修正装置603は、認識履歴格納装置
601を参照し、例えば、すでに部署が認識されている
ときは、部署の認識候補の順位を下げる。修正された認
識結果は認識履歴格納装置601に記録され、認識候補
生成装置604は、認識履歴格納装置601と対象世界
情報格納装置602を参照して、次に発話される内容を
予測し、認識候補生成情報を出力する。例えば、部署名
として「営業部の」が認識結果として得られた場合は、
名前の候補として「小川さんを」「淵さんを」「八田さ
んを」「田上さんを」「川田さんを」「三沢さんを」
「鶴田さんを」を標準パターンとして生成するように照
合パターン生成装置105に指示を与える。
【0019】なお、本発明は、ワードスポッティングを
行うべき短い音韻列を、音声認識を行う分野に応じて適
当に設定することで、あらゆる分野で高精度の音声認識
を行うことができる。
【0020】
【発明の効果】本装置により、多くの単語を認識しなけ
れならない場合でも、計算量の増加が緩やかで、かつ高
い精度で音声認識が可能になる。また、文法的に意味の
ある認識範囲を確定するので語彙情報と文法情報の正則
性が高く、それらの記述量の増加も緩やかになる。
【図面の簡単な説明】
【図1】本発明の一実施例の音声対話型情報検索装置の
全体の構成を表すブロック図
【図2】同じくその図1の音声信号記録装置102の内
部構成を表すブロック図
【図3】同じくその図1の照合パターン生成装置103
の内部構成を表すブロック図
【図4】同じくその図1の認識区間確定装置104の内
部構成を表すブロック図
【図5】同じくその図1の音声信号照合装置105の内
部構成を表すブロック図
【図6】同じくその図1の文脈管理装置106の内部構
成を表すブロック図
【符号の説明】
101 音声入力装置 102 音声信号記録装置 103 照合パターン生成装置 104 認識区間確定装置 105 音声信号照合装置 106 文脈管理装置 201 情報圧縮装置 202 入力パターン記録装置 301 語彙情報格納装置 302 文法情報格納装置 303 音素モデル格納装置 304 無音モデル格納装置 305 標準パターン生成装置 401 終端パターン生成装置 402 ワードスポッティング装置 501 照合パターン絞り込み装置 502 パターン照合装置 601 認識履歴格納装置 602 対象世界情報格納装置 603 認識結果修正装置 604 認識候補生成装置

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】音声を入力として電気信号を出力する音声
    入力装置と、前記電気信号を入力パターンとして記録す
    る音声信号記録装置と、前記入力パターンと照合するた
    めの前記音声の標準パターンを出力する照合パターン生
    成装置と、前記標準パターンと前記入力パターンとを入
    力として、前記標準パターンと照合すべき前記入力パタ
    ーンの区間を確定する認識区間確定装置と、前記認識区
    間確定装置が指示する範囲の前記入力パターンと前記標
    準パターンとの一致度を計算し、前記一致度の高い順に
    並べた前記標準パターンを出力する音声信号照合装置
    と、前記一致度の高い順に並べられた前記標準パターン
    の順序を対話の文脈との整合性に応じて入れ換えて出力
    し、かつ、次に入力される音声を予測して前記照合パタ
    ーン生成装置が生成する前記標準パターンを制御する文
    脈管理装置を有することを特徴とする音声認識装置。
  2. 【請求項2】音声信号記録装置は、音声入力装置が出力
    する音声の電気信号の情報量を圧縮する情報圧縮装置
    と、前記情報圧縮装置の出力を記録する入力パターン記
    録装置を有することを特徴とする請求項1記載の音声認
    識装置。
  3. 【請求項3】照合パターン生成装置は、認識すべき音声
    を構成する単語と前記単語の音素表記を保持する語彙情
    報格納装置と、前記単語の接続規則と前記音素の接続規
    則とを保持する文法情報格納装置と、前記音素の音韻モ
    デルを保持する音素モデル格納装置と、無音の音韻モデ
    ルを保持する無音モデル格納装置と、前記語彙情報格納
    装置と前記文法情報格納装置と前記音素モデル格納装置
    と前記無音モデル格納装置とが出力する情報を参照して
    文脈管理装置が指示する標準パターンを出力する標準パ
    ターン生成装置を有することを特徴とする請求項1記載
    の音声認識装置。
  4. 【請求項4】標準パターン生成装置は、文脈管理装置が
    生成を指示する語句の音韻モデルの前後に、無音のモデ
    ルを接続して標準パターンとして出力することを特徴と
    する請求項1記載の音声認識装置。
  5. 【請求項5】認識区間確定装置は、標準パターンを入力
    として前記標準パターンの終端近傍のパターンを出力す
    る終端パターン生成装置と、入力パターンの中に前記標
    準パターンの終端近傍のパターンの存在を認識して、前
    記終端近傍のパターンの種類と前記入力パターンにおけ
    る位置とを認識終了点情報として出力するワードスポッ
    ティング装置を有することを特徴とする請求項1記載の
    音声認識装置。
  6. 【請求項6】終端パターン生成装置は、標準パターンの
    終端近傍として、助詞の音韻モデルと無音の音韻モデル
    を接続したパターンを生成することを特徴とする請求項
    1記載の音声認識装置。
  7. 【請求項7】音声信号照合装置は、認識区間確定装置が
    出力する認識終了点情報と、照合パターン生成装置が出
    力する標準パターンとを入力として、前記認識終了点情
    報が示す終端近傍のパターンを持つ前記標準パターンを
    選択して出力する照合パターン絞り込み装置と、前記照
    合パターン絞り込み装置が出力する前記標準パターンと
    音声信号記録装置が出力する入力パターンを入力とし
    て、最も最近の認識終了位置から前記認識終了点情報が
    示す前記終端近傍のパターンの位置までの前記入力パタ
    ーンと、個々の前記標準パターンとの一致度を計算し
    て、前記一致度の高い順に前記標準パターンを並べてパ
    ターン認識結果として出力するパターン照合装置を有す
    ることを特徴とする請求項1記載の音声認識装置。
  8. 【請求項8】文脈管理装置は、入力された音声の認識を
    開始する時点までの認識結果を記録する認識履歴管理装
    置と、前記音声が発せられる世界に関する知識を格納す
    る対象世界知識格納装置と、前記認識履歴管理装置の出
    力と前記対象世界知識格納装置の出力と音声信号照合装
    置が出力するパターン認識結果とを入力として、対話の
    文脈と前記対話が対象とする世界に整合する前記パター
    ン認識結果の認識候補の順位を上げて出力し、かつ、前
    記認識履歴格納装置が保持する内容に、修正した前記パ
    ターン認識結果を追記するパターン認識結果修正装置
    と、前記認識履歴格納装置の出力と前記対象世界情報格
    納装置の出力とを入力として次に入力される音声を予測
    して認識候補生成情報を出力する認識候補生成装置を有
    することを特徴とする請求項1記載の音声認識装置。
JP6215958A 1994-09-09 1994-09-09 音声認識装置 Pending JPH0883091A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6215958A JPH0883091A (ja) 1994-09-09 1994-09-09 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6215958A JPH0883091A (ja) 1994-09-09 1994-09-09 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0883091A true JPH0883091A (ja) 1996-03-26

Family

ID=16681067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6215958A Pending JPH0883091A (ja) 1994-09-09 1994-09-09 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0883091A (ja)

Cited By (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2008001486A1 (ja) * 2006-06-29 2009-11-26 日本電気株式会社 音声処理装置およびプログラム、並びに、音声処理方法
CN110073326A (zh) * 2016-10-19 2019-07-30 搜诺思公司 基于仲裁的语音识别
CN110797014A (zh) * 2018-07-17 2020-02-14 中兴通讯股份有限公司 一种语音识别方法、装置及计算机存储介质
CN110895602A (zh) * 2018-09-13 2020-03-20 中移(杭州)信息技术有限公司 身份验证方法、装置、电子设备及存储介质
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11405430B2 (en) 2016-02-22 2022-08-02 Sonos, Inc. Networked microphone device control
US11482978B2 (en) 2018-08-28 2022-10-25 Sonos, Inc. Audio notifications
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11500611B2 (en) 2017-09-08 2022-11-15 Sonos, Inc. Dynamic computation of system response volume
US11501773B2 (en) 2019-06-12 2022-11-15 Sonos, Inc. Network microphone device with command keyword conditioning
US11514898B2 (en) 2016-02-22 2022-11-29 Sonos, Inc. Voice control of a media playback system
US11531520B2 (en) 2016-08-05 2022-12-20 Sonos, Inc. Playback device supporting concurrent voice assistants
US11538451B2 (en) 2017-09-28 2022-12-27 Sonos, Inc. Multi-channel acoustic echo cancellation
US11540047B2 (en) 2018-12-20 2022-12-27 Sonos, Inc. Optimization of network microphone devices using noise classification
US11538460B2 (en) 2018-12-13 2022-12-27 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US11545169B2 (en) 2016-06-09 2023-01-03 Sonos, Inc. Dynamic player selection for audio signal processing
US11557294B2 (en) 2018-12-07 2023-01-17 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11556306B2 (en) 2016-02-22 2023-01-17 Sonos, Inc. Voice controlled media playback system
US11563842B2 (en) 2018-08-28 2023-01-24 Sonos, Inc. Do not disturb feature for audio notifications
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11641559B2 (en) 2016-09-27 2023-05-02 Sonos, Inc. Audio playback settings for voice interaction
US11646023B2 (en) 2019-02-08 2023-05-09 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11646045B2 (en) 2017-09-27 2023-05-09 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US11694689B2 (en) 2020-05-20 2023-07-04 Sonos, Inc. Input detection windowing
US11696074B2 (en) 2018-06-28 2023-07-04 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11710487B2 (en) 2019-07-31 2023-07-25 Sonos, Inc. Locally distributed keyword detection
US11714600B2 (en) 2019-07-31 2023-08-01 Sonos, Inc. Noise classification for event detection
US11736860B2 (en) 2016-02-22 2023-08-22 Sonos, Inc. Voice control of a media playback system
US11741948B2 (en) 2018-11-15 2023-08-29 Sonos Vox France Sas Dilated convolutions and gating for efficient keyword spotting
US11769505B2 (en) 2017-09-28 2023-09-26 Sonos, Inc. Echo of tone interferance cancellation using two acoustic echo cancellers
US11778259B2 (en) 2018-09-14 2023-10-03 Sonos, Inc. Networked devices, systems and methods for associating playback devices based on sound codes
US11790937B2 (en) 2018-09-21 2023-10-17 Sonos, Inc. Voice detection optimization using sound metadata
US11792590B2 (en) 2018-05-25 2023-10-17 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11790911B2 (en) 2018-09-28 2023-10-17 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11798553B2 (en) 2019-05-03 2023-10-24 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11797263B2 (en) 2018-05-10 2023-10-24 Sonos, Inc. Systems and methods for voice-assisted media content selection
US11854547B2 (en) 2019-06-12 2023-12-26 Sonos, Inc. Network microphone device with command keyword eventing
US11862161B2 (en) 2019-10-22 2024-01-02 Sonos, Inc. VAS toggle based on device orientation
US11869503B2 (en) 2019-12-20 2024-01-09 Sonos, Inc. Offline voice control
US11893308B2 (en) 2017-09-29 2024-02-06 Sonos, Inc. Media playback system with concurrent voice assistance
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11900937B2 (en) 2017-08-07 2024-02-13 Sonos, Inc. Wake-word detection suppression
US11947870B2 (en) 2016-02-22 2024-04-02 Sonos, Inc. Audio response playback
US11961519B2 (en) 2020-02-07 2024-04-16 Sonos, Inc. Localized wakeword verification
US11979960B2 (en) 2016-07-15 2024-05-07 Sonos, Inc. Contextualization of voice inputs
US11983463B2 (en) 2016-02-22 2024-05-14 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range

Cited By (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2008001486A1 (ja) * 2006-06-29 2009-11-26 日本電気株式会社 音声処理装置およびプログラム、並びに、音声処理方法
JP5223673B2 (ja) * 2006-06-29 2013-06-26 日本電気株式会社 音声処理装置およびプログラム、並びに、音声処理方法
US8751226B2 (en) 2006-06-29 2014-06-10 Nec Corporation Learning a verification model for speech recognition based on extracted recognition and language feature information
US11556306B2 (en) 2016-02-22 2023-01-17 Sonos, Inc. Voice controlled media playback system
US11983463B2 (en) 2016-02-22 2024-05-14 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US11947870B2 (en) 2016-02-22 2024-04-02 Sonos, Inc. Audio response playback
US11750969B2 (en) 2016-02-22 2023-09-05 Sonos, Inc. Default playback device designation
US11405430B2 (en) 2016-02-22 2022-08-02 Sonos, Inc. Networked microphone device control
US11736860B2 (en) 2016-02-22 2023-08-22 Sonos, Inc. Voice control of a media playback system
US11832068B2 (en) 2016-02-22 2023-11-28 Sonos, Inc. Music service selection
US11863593B2 (en) 2016-02-22 2024-01-02 Sonos, Inc. Networked microphone device control
US11514898B2 (en) 2016-02-22 2022-11-29 Sonos, Inc. Voice control of a media playback system
US11545169B2 (en) 2016-06-09 2023-01-03 Sonos, Inc. Dynamic player selection for audio signal processing
US11979960B2 (en) 2016-07-15 2024-05-07 Sonos, Inc. Contextualization of voice inputs
US11531520B2 (en) 2016-08-05 2022-12-20 Sonos, Inc. Playback device supporting concurrent voice assistants
US11641559B2 (en) 2016-09-27 2023-05-02 Sonos, Inc. Audio playback settings for voice interaction
US11727933B2 (en) 2016-10-19 2023-08-15 Sonos, Inc. Arbitration-based voice recognition
US11308961B2 (en) 2016-10-19 2022-04-19 Sonos, Inc. Arbitration-based voice recognition
CN110073326A (zh) * 2016-10-19 2019-07-30 搜诺思公司 基于仲裁的语音识别
US11900937B2 (en) 2017-08-07 2024-02-13 Sonos, Inc. Wake-word detection suppression
US11500611B2 (en) 2017-09-08 2022-11-15 Sonos, Inc. Dynamic computation of system response volume
US11646045B2 (en) 2017-09-27 2023-05-09 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US11538451B2 (en) 2017-09-28 2022-12-27 Sonos, Inc. Multi-channel acoustic echo cancellation
US11769505B2 (en) 2017-09-28 2023-09-26 Sonos, Inc. Echo of tone interferance cancellation using two acoustic echo cancellers
US11893308B2 (en) 2017-09-29 2024-02-06 Sonos, Inc. Media playback system with concurrent voice assistance
US11689858B2 (en) 2018-01-31 2023-06-27 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11797263B2 (en) 2018-05-10 2023-10-24 Sonos, Inc. Systems and methods for voice-assisted media content selection
US11792590B2 (en) 2018-05-25 2023-10-17 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11696074B2 (en) 2018-06-28 2023-07-04 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
CN110797014A (zh) * 2018-07-17 2020-02-14 中兴通讯股份有限公司 一种语音识别方法、装置及计算机存储介质
CN110797014B (zh) * 2018-07-17 2024-06-07 中兴通讯股份有限公司 一种语音识别方法、装置及计算机存储介质
US11482978B2 (en) 2018-08-28 2022-10-25 Sonos, Inc. Audio notifications
US11563842B2 (en) 2018-08-28 2023-01-24 Sonos, Inc. Do not disturb feature for audio notifications
CN110895602A (zh) * 2018-09-13 2020-03-20 中移(杭州)信息技术有限公司 身份验证方法、装置、电子设备及存储介质
CN110895602B (zh) * 2018-09-13 2021-12-14 中移(杭州)信息技术有限公司 身份验证方法、装置、电子设备及存储介质
US11778259B2 (en) 2018-09-14 2023-10-03 Sonos, Inc. Networked devices, systems and methods for associating playback devices based on sound codes
US11790937B2 (en) 2018-09-21 2023-10-17 Sonos, Inc. Voice detection optimization using sound metadata
US11790911B2 (en) 2018-09-28 2023-10-17 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11741948B2 (en) 2018-11-15 2023-08-29 Sonos Vox France Sas Dilated convolutions and gating for efficient keyword spotting
US11557294B2 (en) 2018-12-07 2023-01-17 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11538460B2 (en) 2018-12-13 2022-12-27 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US11540047B2 (en) 2018-12-20 2022-12-27 Sonos, Inc. Optimization of network microphone devices using noise classification
US11646023B2 (en) 2019-02-08 2023-05-09 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11798553B2 (en) 2019-05-03 2023-10-24 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11501773B2 (en) 2019-06-12 2022-11-15 Sonos, Inc. Network microphone device with command keyword conditioning
US11854547B2 (en) 2019-06-12 2023-12-26 Sonos, Inc. Network microphone device with command keyword eventing
US11710487B2 (en) 2019-07-31 2023-07-25 Sonos, Inc. Locally distributed keyword detection
US11714600B2 (en) 2019-07-31 2023-08-01 Sonos, Inc. Noise classification for event detection
US11862161B2 (en) 2019-10-22 2024-01-02 Sonos, Inc. VAS toggle based on device orientation
US11869503B2 (en) 2019-12-20 2024-01-09 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11961519B2 (en) 2020-02-07 2024-04-16 Sonos, Inc. Localized wakeword verification
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11694689B2 (en) 2020-05-20 2023-07-04 Sonos, Inc. Input detection windowing
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range

Similar Documents

Publication Publication Date Title
JPH0883091A (ja) 音声認識装置
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
JP4221379B2 (ja) 音声特性に基づく電話発信者の自動識別
US6856956B2 (en) Method and apparatus for generating and displaying N-best alternatives in a speech recognition system
Juang et al. Automatic recognition and understanding of spoken language-a first step toward natural human-machine communication
EP1936606B1 (en) Multi-stage speech recognition
EP2048655B1 (en) Context sensitive multi-stage speech recognition
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
JP2965537B2 (ja) 話者クラスタリング処理装置及び音声認識装置
EP0533491B1 (en) Wordspotting using two hidden Markov models (HMM)
US6192337B1 (en) Apparatus and methods for rejecting confusible words during training associated with a speech recognition system
US20180137109A1 (en) Methodology for automatic multilingual speech recognition
EP1355295B1 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
JPH09500223A (ja) 多言語音声認識システム
JPH0394299A (ja) 音声認識方法と音声認識装置訓練方法
US20070136060A1 (en) Recognizing entries in lexical lists
Boite et al. A new approach towards keyword spotting.
US20040006469A1 (en) Apparatus and method for updating lexicon
Hirschberg et al. Generalizing prosodic prediction of speech recognition errors
Manjunath et al. Automatic phonetic transcription for read, extempore and conversation speech for an Indian language: Bengali
US10854196B1 (en) Functional prerequisites and acknowledgments
JP3285704B2 (ja) 音声対話のための音声認識方法及び装置
JP2921059B2 (ja) 連続音声認識装置
JP3465334B2 (ja) 音声対話装置及び音声対話方法
JP3075250B2 (ja) 話者認識方法及び装置