JP4658022B2 - 音声認識システム - Google Patents
音声認識システム Download PDFInfo
- Publication number
- JP4658022B2 JP4658022B2 JP2006313125A JP2006313125A JP4658022B2 JP 4658022 B2 JP4658022 B2 JP 4658022B2 JP 2006313125 A JP2006313125 A JP 2006313125A JP 2006313125 A JP2006313125 A JP 2006313125A JP 4658022 B2 JP4658022 B2 JP 4658022B2
- Authority
- JP
- Japan
- Prior art keywords
- verification
- recognition
- noise
- communication terminal
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Mobile Radio Communication Systems (AREA)
Description
上記目的を達成するために、請求項1記載の発明は、通信端末と、前記通信端末と通信網を介して接続される記憶手段とを備え、
前記通信端末は、音声および/または周囲の騒音が入力される音声入力手段と、音声入力手段から入力された音声の特徴量を抽出する特徴抽出手段と、前記音声の特徴量を所定の認識モデルパラメータセットと照合することによって音声を認識する音声認識手段と、前記音声入力手段から入力された周囲の騒音を検証する騒音検証手段とを有し、
前記騒音検証手段は、騒音の種類ごとに用意されているn(n≧1)個の検証モデルと、特徴抽出手段によって抽出された周囲の騒音の特徴量と各検証モデルとを比較する比較手段とを備え、
また、前記記憶手段には、騒音検証手段のn個の検証モデルのそれぞれに対応付けられた認識モデルパラメータセットが記憶されており、
前記騒音検証手段の比較手段が周囲の騒音の特徴量とn個の検証モデルとを比較することによって周囲の騒音の特徴量に最も類似する検証モデルの番号を選択すると、前記記憶手段においては、前記騒音検証手段で選択された検証モデルの番号に対応する認識モデルパラメータセットを前記記憶手段に記憶されている複数の認識モデルパラメータセットの中から選択して前記通信端末に返送するダウンロードを行ない、前記通信端末の記憶領域に保存されている現在の認識モデルパラメータセットを、前記記憶手段からダウンロードされた認識モデルパラメータセットに書き換え、この際、前記通信端末の記憶領域に現在保存されている認識モデルパラメータセットの内容が更新されていた場合は、上記ダウンロードが行われる前に、前記通信端末の記憶領域に現在保存されている認識モデルパラメータセットを前記記憶手段にアップロードし、しかる後に、該当する認識モデルパラメータセットを書き換えるようになっており、
前記音声認識手段は、前記選択されダウンロードされた認識モデルパラメータセットを用いて、音声認識を行ない、
前記騒音検証手段の検証モデル、または、前記音声認識手段および/または前記記憶手段の認識モデルパラメータは、更新前のパラメータとmフレーム目の音声特徴量を混合して更新され、更新前のパラメータとmフレーム目の音声特徴量を混合して更新される際に、更新前のパラメータに比べてmフレーム目の音声特徴量の混合比率を10 −3 にして更新されるようになっていることを特徴としている。
前記認識モデルまたは検証モデルには、HMMが用いられることを特徴としている。
検証モデルを追加するとき、追加される検証モデルのパラメータがmフレーム目の音声特徴量となるように検証モデルの更新処理を行うことによって検証モデルの作成がなされることを特徴としている。
特に、請求項3記載の発明によれば、請求項1または請求項2記載の音声認識システムにおいて、
検証モデルを追加するとき、追加される検証モデルのパラメータがmフレーム目の音声特徴量となるように検証モデルの更新処理を行うことによって検証モデルの作成がなされるので、他の騒音環境の成分を含まず、現環境の騒音状態を検証するための検証モデルを作成できる。
2 記憶手段
11 音声入力手段
12,42 特徴抽出手段
13,23 音声認識手段
14,34 騒音検証手段
15 通信端末中央処理装置
16 比較器
51 CPU
52 ROM
53 RAM
54 ハードディスク
55 音声入力部
56 通信インタフェース
200,300,400,500 通信網
Claims (3)
- 通信端末と、前記通信端末と通信網を介して接続される記憶手段とを備え、
前記通信端末は、音声および/または周囲の騒音が入力される音声入力手段と、音声入力手段から入力された音声の特徴量を抽出する特徴抽出手段と、前記音声の特徴量を所定の認識モデルパラメータセットと照合することによって音声を認識する音声認識手段と、前記音声入力手段から入力された周囲の騒音を検証する騒音検証手段とを有し、
前記騒音検証手段は、騒音の種類ごとに用意されているn(n≧1)個の検証モデルと、特徴抽出手段によって抽出された周囲の騒音の特徴量と各検証モデルとを比較する比較手段とを備え、
また、前記記憶手段には、騒音検証手段のn個の検証モデルのそれぞれに対応付けられた認識モデルパラメータセットが記憶されており、
前記騒音検証手段の比較手段が周囲の騒音の特徴量とn個の検証モデルとを比較することによって周囲の騒音の特徴量に最も類似する検証モデルの番号を選択すると、前記記憶手段においては、前記騒音検証手段で選択された検証モデルの番号に対応する認識モデルパラメータセットを前記記憶手段に記憶されている複数の認識モデルパラメータセットの中から選択して前記通信端末に返送するダウンロードを行ない、前記通信端末の記憶領域に保存されている現在の認識モデルパラメータセットを、前記記憶手段からダウンロードされた認識モデルパラメータセットに書き換え、この際、前記通信端末の記憶領域に現在保存されている認識モデルパラメータセットの内容が更新されていた場合は、上記ダウンロードが行われる前に、前記通信端末の記憶領域に現在保存されている認識モデルパラメータセットを前記記憶手段にアップロードし、しかる後に、該当する認識モデルパラメータセットを書き換えるようになっており、
前記音声認識手段は、前記選択されダウンロードされた認識モデルパラメータセットを用いて、音声認識を行ない、
前記騒音検証手段の検証モデル、または、前記音声認識手段および/または前記記憶手段の認識モデルパラメータは、更新前のパラメータとmフレーム目の音声特徴量を混合して更新され、更新前のパラメータとmフレーム目の音声特徴量を混合して更新される際に、更新前のパラメータに比べてmフレーム目の音声特徴量の混合比率を10 −3 にして更新されるようになっていることを特徴とする音声認識システム。 - 請求項1記載の音声認識システムにおいて、
前記認識モデルまたは検証モデルには、HMMが用いられることを特徴とする音声認識システム。 - 請求項1または請求項2記載の音声認識システムにおいて、
検証モデルを追加するとき、追加される検証モデルのパラメータがmフレーム目の音声特徴量となるように検証モデルの更新処理を行うことによって、検証モデルの作成がなされることを特徴とする音声認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006313125A JP4658022B2 (ja) | 2006-11-20 | 2006-11-20 | 音声認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006313125A JP4658022B2 (ja) | 2006-11-20 | 2006-11-20 | 音声認識システム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000057941A Division JP4201455B2 (ja) | 2000-02-29 | 2000-02-29 | 音声認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007072481A JP2007072481A (ja) | 2007-03-22 |
JP4658022B2 true JP4658022B2 (ja) | 2011-03-23 |
Family
ID=37933907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006313125A Expired - Fee Related JP4658022B2 (ja) | 2006-11-20 | 2006-11-20 | 音声認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4658022B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8930185B2 (en) | 2009-08-28 | 2015-01-06 | International Business Machines Corporation | Speech feature extraction apparatus, speech feature extraction method, and speech feature extraction program |
JP5724361B2 (ja) * | 2010-12-17 | 2015-05-27 | 富士通株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6191700A (ja) * | 1984-10-11 | 1986-05-09 | 株式会社日立製作所 | 音声入力装置 |
JPS6242198A (ja) * | 1985-08-20 | 1987-02-24 | 松下電器産業株式会社 | 音声認識装置 |
JPH01260495A (ja) * | 1988-04-12 | 1989-10-17 | Matsushita Electric Ind Co Ltd | 音声認識法 |
JPH03276196A (ja) * | 1990-03-27 | 1991-12-06 | Matsushita Refrig Co Ltd | 音声認識システム |
JPH086589A (ja) * | 1994-06-21 | 1996-01-12 | Nec Corp | 電話回線音声入力システム |
JPH09507105A (ja) * | 1993-12-22 | 1997-07-15 | クゥアルコム・インコーポレーテッド | 分散音声認識システム |
JPH10282990A (ja) * | 1997-04-04 | 1998-10-23 | Sony Corp | テキスト入力方法及び装置 |
JP2000194392A (ja) * | 1998-12-25 | 2000-07-14 | Sharp Corp | 騒音適応型音声認識装置及び騒音適応型音声認識プログラムを記録した記録媒体 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4267081B2 (ja) * | 1997-10-20 | 2009-05-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 分散システムにおけるパターン認識登録 |
-
2006
- 2006-11-20 JP JP2006313125A patent/JP4658022B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6191700A (ja) * | 1984-10-11 | 1986-05-09 | 株式会社日立製作所 | 音声入力装置 |
JPS6242198A (ja) * | 1985-08-20 | 1987-02-24 | 松下電器産業株式会社 | 音声認識装置 |
JPH01260495A (ja) * | 1988-04-12 | 1989-10-17 | Matsushita Electric Ind Co Ltd | 音声認識法 |
JPH03276196A (ja) * | 1990-03-27 | 1991-12-06 | Matsushita Refrig Co Ltd | 音声認識システム |
JPH09507105A (ja) * | 1993-12-22 | 1997-07-15 | クゥアルコム・インコーポレーテッド | 分散音声認識システム |
JPH086589A (ja) * | 1994-06-21 | 1996-01-12 | Nec Corp | 電話回線音声入力システム |
JPH10282990A (ja) * | 1997-04-04 | 1998-10-23 | Sony Corp | テキスト入力方法及び装置 |
JP2000194392A (ja) * | 1998-12-25 | 2000-07-14 | Sharp Corp | 騒音適応型音声認識装置及び騒音適応型音声認識プログラムを記録した記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2007072481A (ja) | 2007-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108520741B (zh) | 一种耳语音恢复方法、装置、设备及可读存储介质 | |
KR100976643B1 (ko) | 자동 음성 인식 시스템용 적응형 콘텍스트 | |
CN106683677B (zh) | 语音识别方法及装置 | |
KR101183344B1 (ko) | 사용자 정정들을 이용한 자동 음성 인식 학습 | |
JP4643911B2 (ja) | 音声認識方法及び装置 | |
JP6464650B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP4245617B2 (ja) | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム | |
JP5229478B2 (ja) | 統計モデル学習装置、統計モデル学習方法、およびプログラム | |
KR20180064504A (ko) | 개인화된 엔티티 발음 학습 | |
US6961702B2 (en) | Method and device for generating an adapted reference for automatic speech recognition | |
CN111326148B (zh) | 置信度校正及其模型训练方法、装置、设备及存储介质 | |
US6931374B2 (en) | Method of speech recognition using variational inference with switching state space models | |
JP2012037619A (ja) | 話者適応化装置、話者適応化方法および話者適応化用プログラム | |
KR20080102373A (ko) | 스피커 인증 방법 및 이 방법을 수행하기 위한 컴퓨터 실행가능 명령어를 갖는 컴퓨터 판독가능 매체 | |
KR20080064351A (ko) | 사용자의 기기 사용 패턴을 이용한 음성 인식 방법 및 장치 | |
JP2017167270A (ja) | 音声処理装置および音声処理方法 | |
JP6468258B2 (ja) | 音声対話装置および音声対話方法 | |
JP5988077B2 (ja) | 発話区間検出装置及び発話区間検出のためのコンピュータプログラム | |
JP4658022B2 (ja) | 音声認識システム | |
JP4201455B2 (ja) | 音声認識システム | |
US20030055642A1 (en) | Voice recognition apparatus and method | |
JP2008241970A (ja) | 話者適応装置、話者適応方法及び話者適応プログラム | |
CN111933146B (zh) | 语音识别***及方法 | |
KR101888059B1 (ko) | 문맥 기반 음성 모델 관리 장치 및 그 방법 | |
CN111048098A (zh) | 语音校正***及语音校正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061219 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101027 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101130 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101222 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140107 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |