JP5103907B2 - 音声認識システム、音声認識方法及び音声認識プログラム - Google Patents
音声認識システム、音声認識方法及び音声認識プログラム Download PDFInfo
- Publication number
- JP5103907B2 JP5103907B2 JP2006552956A JP2006552956A JP5103907B2 JP 5103907 B2 JP5103907 B2 JP 5103907B2 JP 2006552956 A JP2006552956 A JP 2006552956A JP 2006552956 A JP2006552956 A JP 2006552956A JP 5103907 B2 JP5103907 B2 JP 5103907B2
- Authority
- JP
- Japan
- Prior art keywords
- prefetch
- value
- buffer
- distance
- distance value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 25
- 239000000872 buffer Substances 0.000 claims description 269
- 238000004364 calculation method Methods 0.000 claims description 68
- 238000012545 processing Methods 0.000 claims description 56
- 238000013500 data storage Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000007726 management method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- YDLQKLWVKKFPII-UHFFFAOYSA-N timiperone Chemical compound C1=CC(F)=CC=C1C(=O)CCCN1CCC(N2C(NC3=CC=CC=C32)=S)CC1 YDLQKLWVKKFPII-UHFFFAOYSA-N 0.000 description 1
- 229950000809 timiperone Drugs 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
110,120,130,210,310,320,330,340 データ処理装置
140,350 データ記憶装置
141,142,143,144,145 距離値バッファ
151,152,153 先読み値バッファ
111,311 距離計算手段
121,321 先読み手段
131,331 単語列照合手段
211 バッファ長決定手段
341 バッファ管理手段
Claims (6)
- 順次入力した音声特徴量と各音響モデルとの間の距離値を生成する距離計算手段と、
前記距離計算手段で生成される距離値を格納する3以上の距離値バッファと、
前記距離計算手段が前記距離値を生成している時に、前記距離値バッファに格納されている既に生成された前記距離値を用いて先読み値を生成する先読み手段と、
前記先読み手段で生成される先読み値を格納する2以上の先読み値バッファと、
前記距離計算手段が前記距離値を生成している時及び前記先読み手段が前記先読み値を生成している時に、前記距離値バッファに格納されている既に生成された前記距離値及び前記前記先読み値バッファに格納されている既に生成された前記先読み値を用いて単語照合を行って認識結果を生成する単語列照合手段とを備え、
前記距離計算手段は、距離値の書き込みを行っている前記距離値バッファが一杯になった場合、前記距離値バッファを前記先読み手段への引渡し待ちの距離値バッファの末尾に追加し、距離値バッファを新たに確保して処理を継続し、
前記先読み手段は、前記距離値バッファに格納されている距離値から計算した先読み値の書き込みを行っている前記先読み値バッファが一杯になった場合、前記先読み値を生成する前記距離値を格納した前記距離値バッファ及び前記一杯になった前記先読み値バッファを前記単語列照合手段への引渡し待ちの距離値バッファ及び前記先読み値バッファの末尾に追加し、前記世先読み値バッファを新たに確保して処理を継続し、
前記単語列照合手段は、前記引渡し待ちの距離値バッファに格納されている距離値と前記引渡し待ちの先読み値バッファに格納されている先読み値から認識結果を生成し、受け取るバッファがなくなった場合に処理を終了する、
ことを特徴とする音声認識システム。 - 前記単語列照合手段は、前記距離値バッファ及び前記先読み値バッファ内の処理が終了した際に当該距離値バッファ及び当該先読み値バッファを開放することを特徴とする請求項1に記載の音声認識システム。
- 順次入力した音声特徴量と各音響モデルとの間の距離値を生成する距離計算手段と、前記距離計算手段で生成される距離値を格納する3以上の距離値バッファと、前記距離計算手段が前記距離値を生成している時に、前記距離値バッファに格納されている既に生成された前記距離値を用いて先読み値を生成する先読み手段と、前記先読み手段で生成される先読み値を格納する2以上の先読み値バッファと、前記距離計算手段が前記距離値を生成している時及び前記先読み手段が前記先読み値を生成している時に、前記距離値バッファに格納されている既に生成された前記距離値及び前記前記先読み値バッファに格納されている既に生成された前記先読み値を用いて単語照合を行って認識結果を生成する単語列照合手段とを備え、
前記距離計算手段により、距離値の書き込みを行っている前記距離値バッファが一杯になった場合、前記距離値バッファを前記先読み手段への引渡し待ちの距離値バッファの末尾に追加し、距離値バッファを新たに確保して処理を継続し、
前記先読み手段により、前記距離値バッファに格納されている距離値から計算した先読み値の書き込みを行っている前記先読み値バッファが一杯になった場合、前記先読み値を生成する前記距離値を格納した前記距離値バッファ及び前記一杯になった前記先読み値バッファを前記単語列照合手段への引渡し待ちの距離値バッファ及び前記先読み値バッファの末尾に追加し、前記世先読み値バッファを新たに確保して処理を継続し、
前記単語列照合手段により、前記引渡し待ちの距離値バッファに格納されている距離値と前記引渡し待ちの先読み値バッファに格納されている先読み値から認識結果を生成し、受け取るバッファがなくなった場合に処理を終了することを特徴とする音声認識方法。 - 前記単語列照合手段により、前記距離値バッファ及び前記先読み値バッファ内の処理が終了した際に当該距離値バッファ及び当該先読み値バッファを開放することを特徴とする請求項3に記載の音声認識方法。
- 順次入力した音声特徴量と各音響モデルとの間の距離値を格納する3以上の距離値バッファと、前記距離値を用いて生成される先読み値を格納する2以上の先読み値バッファとを有し、
コンピュータに、
順次入力した音声特徴量と各音響モデルとの間の距離値を生成する機能と、
前記距離値を生成している時に、前記距離値バッファに格納されている既に生成された前記距離値を用いて先読み値を生成する機能と、
前記距離値を生成している時及び前記先読み値を生成している時に、前記距離値バッファに格納されている既に生成された前記距離値及び前記先読み値バッファに格納されている既に生成された前記先読み値を用いて単語照合を行って認識結果を生成する機能と、
前記距離値バッファに前記距離値を格納する際、距離値の書き込みを行っている前記距離値バッファが一杯になった場合、前記距離値バッファを前記先読み手段への引渡し待ちの距離値バッファの末尾に追加し、距離値バッファを新たに確保して処理を継続する機能と、
前記先読みバッファに前記先読み値を格納する際、前記距離値バッファに格納されている距離値から計算した先読み値の書き込みを行っている前記先読み値バッファが一杯になった場合、前記距離値バッファ及び前記先読み値バッファを前記単語列照合手段への引渡し待ちの距離値バッファ及び前記先読み値バッファの末尾に追加し、前記先読み値バッファを新たに確保して処理を継続する機能と、
前記距離値バッファに格納されている距離値と前記先読み値バッファに格納されている先読み値から認識結果を生成し、受け取るバッファがなくなった場合に処理を終了する機能とを実行させることを特徴とする音声認識プログラム。 - 前記コンピュータに、前記距離値バッファ及び前記先読み値バッファ内の処理が終了した際に当該距離値バッファ及び当該先読み値バッファを開放する機能を実行させることを特徴とする請求項5記載の音声認識プロフラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006552956A JP5103907B2 (ja) | 2005-01-17 | 2006-01-12 | 音声認識システム、音声認識方法及び音声認識プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005008542 | 2005-01-17 | ||
JP2005008542 | 2005-01-17 | ||
PCT/JP2006/300269 WO2006075648A1 (ja) | 2005-01-17 | 2006-01-12 | 音声認識システム、音声認識方法及び音声認識プログラム |
JP2006552956A JP5103907B2 (ja) | 2005-01-17 | 2006-01-12 | 音声認識システム、音声認識方法及び音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006075648A1 JPWO2006075648A1 (ja) | 2008-08-07 |
JP5103907B2 true JP5103907B2 (ja) | 2012-12-19 |
Family
ID=36677673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006552956A Active JP5103907B2 (ja) | 2005-01-17 | 2006-01-12 | 音声認識システム、音声認識方法及び音声認識プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US7930180B2 (ja) |
EP (1) | EP1852847A4 (ja) |
JP (1) | JP5103907B2 (ja) |
CN (1) | CN101120397B (ja) |
WO (1) | WO2006075648A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4940057B2 (ja) * | 2007-08-17 | 2012-05-30 | 株式会社東芝 | 音声認識装置及びその方法 |
US9785613B2 (en) * | 2011-12-19 | 2017-10-10 | Cypress Semiconductor Corporation | Acoustic processing unit interface for determining senone scores using a greater clock frequency than that corresponding to received audio |
KR20140028174A (ko) * | 2012-07-13 | 2014-03-10 | 삼성전자주식회사 | 음성 인식 방법 및 이를 적용한 전자 장치 |
US9196250B2 (en) * | 2012-11-16 | 2015-11-24 | 2236008 Ontario Inc. | Application services interface to ASR |
CN111783431B (zh) * | 2019-04-02 | 2024-05-24 | 北京地平线机器人技术研发有限公司 | 利用语言模型预测词出现概率及语言模型训练方法和装置 |
CN110335621A (zh) * | 2019-05-28 | 2019-10-15 | 深圳追一科技有限公司 | 音频处理的方法、***及相关设备 |
WO2021033889A1 (en) | 2019-08-20 | 2021-02-25 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device |
CN111933146B (zh) * | 2020-10-13 | 2021-02-02 | 苏州思必驰信息科技有限公司 | 语音识别***及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63208138A (ja) * | 1987-02-25 | 1988-08-29 | Hitachi Ltd | デ−タベ−スのバツフア割当て管理方式 |
JPH06214595A (ja) * | 1993-01-20 | 1994-08-05 | Asahi Chem Ind Co Ltd | 音声認識方法 |
JP3226716B2 (ja) * | 1994-05-31 | 2001-11-05 | 日本電気株式会社 | 音声認識装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2595495B2 (ja) * | 1982-09-03 | 1997-04-02 | 日本電気株式会社 | パタンマッチング装置 |
JPS59223499A (ja) * | 1983-06-02 | 1984-12-15 | 松下電器産業株式会社 | 音素認識装置 |
FR2554623B1 (fr) * | 1983-11-08 | 1986-08-14 | Texas Instruments France | Procede d'analyse de la parole independant du locuteur |
US5241649A (en) * | 1985-02-18 | 1993-08-31 | Matsushita Electric Industrial Co., Ltd. | Voice recognition method |
US4989249A (en) * | 1987-05-29 | 1991-01-29 | Sanyo Electric Co., Ltd. | Method of feature determination and extraction and recognition of voice and apparatus therefore |
JP2554747B2 (ja) | 1989-07-12 | 1996-11-13 | 松下電器産業株式会社 | 空調機器における室外ユニット |
JPH04232998A (ja) | 1990-12-27 | 1992-08-21 | Nec Corp | 音声認識装置 |
JP3011001B2 (ja) | 1993-12-28 | 2000-02-21 | 日本電気株式会社 | バッファ制御システム |
US6249761B1 (en) * | 1997-09-30 | 2001-06-19 | At&T Corp. | Assigning and processing states and arcs of a speech recognition model in parallel processors |
JP2000206984A (ja) | 1999-01-20 | 2000-07-28 | Mitsubishi Electric Corp | 音声認識装置 |
US6442520B1 (en) * | 1999-11-08 | 2002-08-27 | Agere Systems Guardian Corp. | Method and apparatus for continuous speech recognition using a layered, self-adjusting decoded network |
JP3893911B2 (ja) | 2001-07-12 | 2007-03-14 | 日本電気株式会社 | 音声認識システム |
CA2359544A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time speech recognition system using an oversampled filterbank |
GB2391679B (en) * | 2002-02-04 | 2004-03-24 | Zentian Ltd | Speech recognition circuit using parallel processors |
CN1201285C (zh) * | 2002-11-20 | 2005-05-11 | 中国科学院声学研究所 | 一种语音识别中的并行搜索方法 |
KR100814143B1 (ko) * | 2003-10-03 | 2008-03-14 | 아사히 가세이 가부시키가이샤 | 데이터 처리 장치 및 데이터 처리 장치 제어 프로그램 |
-
2006
- 2006-01-12 WO PCT/JP2006/300269 patent/WO2006075648A1/ja active Application Filing
- 2006-01-12 CN CN2006800024298A patent/CN101120397B/zh not_active Expired - Fee Related
- 2006-01-12 US US11/793,806 patent/US7930180B2/en not_active Expired - Fee Related
- 2006-01-12 JP JP2006552956A patent/JP5103907B2/ja active Active
- 2006-01-12 EP EP06711592A patent/EP1852847A4/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63208138A (ja) * | 1987-02-25 | 1988-08-29 | Hitachi Ltd | デ−タベ−スのバツフア割当て管理方式 |
JPH06214595A (ja) * | 1993-01-20 | 1994-08-05 | Asahi Chem Ind Co Ltd | 音声認識方法 |
JP3226716B2 (ja) * | 1994-05-31 | 2001-11-05 | 日本電気株式会社 | 音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2006075648A1 (ja) | 2006-07-20 |
CN101120397A (zh) | 2008-02-06 |
EP1852847A1 (en) | 2007-11-07 |
EP1852847A4 (en) | 2008-05-21 |
CN101120397B (zh) | 2011-08-17 |
JPWO2006075648A1 (ja) | 2008-08-07 |
US7930180B2 (en) | 2011-04-19 |
US20080133237A1 (en) | 2008-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5103907B2 (ja) | 音声認識システム、音声認識方法及び音声認識プログラム | |
JP5459214B2 (ja) | 言語モデル作成装置、言語モデル作成方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
JP6495850B2 (ja) | 情報処理装置、情報処理方法、プログラムおよび認識システム | |
JP3814459B2 (ja) | 音声認識方法及び装置と記憶媒体 | |
JP6315980B2 (ja) | デコーダ、デコード方法およびプログラム | |
US20050159952A1 (en) | Pattern matching for large vocabulary speech recognition with packed distribution and localized trellis access | |
JP5310563B2 (ja) | 音声認識システム、音声認識方法、および音声認識用プログラム | |
JP3459712B2 (ja) | 音声認識方法及び装置及びコンピュータ制御装置 | |
TWI420510B (zh) | 可調整記憶體使用空間之語音辨識系統與方法 | |
US7072835B2 (en) | Method and apparatus for speech recognition | |
JP4940057B2 (ja) | 音声認識装置及びその方法 | |
JPWO2009139230A1 (ja) | 言語モデルスコア先読み値付与装置およびその方法ならびにプログラム記録媒体 | |
JP2006293033A (ja) | 混合分布hmmの状態の出力確率計算方法および装置 | |
JP5961532B2 (ja) | 辞書・言語モデル圧縮方法とその装置とプログラム | |
JP5881157B2 (ja) | 情報処理装置、およびプログラム | |
JP4801108B2 (ja) | 音声認識装置、方法、プログラム及びその記録媒体 | |
JP4801107B2 (ja) | 音声認識装置、方法、プログラム及びその記録媒体 | |
JP3969079B2 (ja) | 音声認識装置および方法、記録媒体、並びにプログラム | |
JP6441177B2 (ja) | ポーズ長決定装置、ポーズ長決定方法、およびプログラム | |
JP3893911B2 (ja) | 音声認識システム | |
JP6323828B2 (ja) | 支援装置、情報処理方法、及び、プログラム | |
JP2005091504A (ja) | 音声認識装置 | |
JP2002268673A (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP5381973B2 (ja) | 音声認識装置、音声認識方法、及び、音声認識プログラムが記録された記録媒体 | |
JP2002341891A (ja) | 音声認識装置および音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A5211 Effective date: 20070629 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5103907 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151012 Year of fee payment: 3 |