JP2009236960A - 音声認識装置、音声認識方法及びプログラム - Google Patents
音声認識装置、音声認識方法及びプログラム Download PDFInfo
- Publication number
- JP2009236960A JP2009236960A JP2008079144A JP2008079144A JP2009236960A JP 2009236960 A JP2009236960 A JP 2009236960A JP 2008079144 A JP2008079144 A JP 2008079144A JP 2008079144 A JP2008079144 A JP 2008079144A JP 2009236960 A JP2009236960 A JP 2009236960A
- Authority
- JP
- Japan
- Prior art keywords
- input
- speech recognition
- grammar
- phrase
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】ユーザの入力を求める箇所を解析し、入力を求める箇所に係る語句を抽出する解析手段と、解析結果に基づく語句が音声によって認識されるように音声認識用文法を作成する文法変換手段と、解析手段における解析結果に基づく語句とその入力箇所を判定するための属性値とを関連付けする属性値付与手段とを有する文法生成手段と、音声を入力する音声入力手段と、入力された音声において、文法生成手段にて作成された音声認識用文法に基づいて、音声の認識処理を行い、音声認識結果単語列を出力する音声認識手段と、音声認識結果単語列における語句を、属性値付与手段の関連付けに基づいて入力箇所を判定し、入力箇所に入力を行う結果判定手段とを備える。
【選択図】図1
Description
図1は、本発明の実施形態における音声認識装置の構成図である。本実施形態においては、文書解析部1と、文法作成部2と、音声入力部3と、音声認識部4と、結果判定部5と、表示部6とを有する。
図10は、本発明の実施形態における別の構成図である。本実施形態においては、実施形態1の構成に加え、入力欄に入力可能な単語リストが登録されている共通辞書201を有する。
図15は、本発明の別の実施形態における構成図である。本実施形態においては、文法作成部2は、文法変換部21において文書解析部1の解析結果から音声入力する単語リストを取得し、音声認識用文法を作成するとともに、属性値付与部22においてそれぞれの単語と入力欄の属性値情報との関連付けを行い、その属性値情報を音声認識用文法に含めることを行う。また、結果判定部5においては、認識結果単語列に対して付与された属性値情報を参照することで入力すべき入力欄を判定する。
図20は、本発明の別の実施形態における構成図である。本実施形態においては、実施形態3の構成に加え、入力欄に入力可能な単語リストが登録されている共通辞書201とから構成される。
2 文法作成部
21 文法変換部
22 属性値付与部
3 音声入力部
4 音声認識部
5 結果判定部
6 表示部
101 HTML文書
201 共通辞書
Claims (21)
- 文書中のユーザの入力を求める箇所を解析し、前記入力を求める箇所に係る語句を抽出する解析手段と、
前記解析手段における解析結果に基づく語句が音声によって認識されるように音声認識用文法を作成する文法変換手段と、前記解析手段における解析結果に基づく語句と前記解析手段における解析結果に基づく語句の入力箇所を判定するための属性値とを関連付けする属性値付与手段とを有する文法生成手段と、
音声を入力する音声入力手段と、
前記音声入力手段により入力された音声において、前記文法生成手段にて作成された音声認識用文法に基づいて、音声の認識処理を行い、音声認識結果単語列を出力する音声認識手段と、
前記音声認識手段にて出力された音声認識結果単語列における語句を、前記属性値付与手段の関連付けに基づいて入力箇所を判定し、前記入力箇所に入力を行う結果判定手段とを備えることを特徴とする音声認識装置。 - 前記解析手段は、前記入力を求める箇所において選択肢として記載された語句を抽出することを特徴とする請求項1に記載の音声認識装置。
- 前記文法生成手段は、前記文書中に記載された入力箇所を判定するためのタグ情報を属性値として関連付けることを特徴とする請求項1又は2に記載の音声認識装置。
- 前記文法生成手段は、前記文書中に記載された入力箇所に隣接するように表示される関連語句と、前記入力箇所に入力可能な語句を含む文が音声認識可能な文法を生成することを特徴とする請求項1から3のいずれか1項に記載の音声認識装置。
- 前記文法生成手段は、前記解析手段における解析結果に基づく語句と、前記文書中に記載された入力箇所に隣接するように表示される関連語句のうち少なくとも1つ以上の語句の前後に付加語モデルを接続して生成することを特徴とする請求項1から4のいずれか1項に記載の音声認識装置。
- 前記文法生成手段は、前記音声認識用文法中の少なくとも1つ以上の語句に、入力欄を一意に決定するための属性値情報を含めることを特徴とする請求項1から5のいずれか1項に記載の音声認識装置。
- さらに、前記文書のタグ情報を関連付けた語句を少なくとも1つ以上格納する記憶手段を有することを特徴とする請求項1から6のいずれか1項に記載の音声認識装置。
- 前記文法生成手段は、前記記憶手段に格納された語句から、タグ情報を参照して、前記入力箇所に入力可能な語句を選択し、音声認識可能な文法を生成することを特徴とする請求項1から7のいずれか1項に記載の音声認識装置。
- 文書中のユーザの入力を求める箇所を解析し、前記入力を求める箇所に係る語句を抽出する解析ステップと、
前記解析ステップにおける解析結果に基づく語句が音声によって認識されるように音声認識用文法を作成する文法変換ステップと、前記解析ステップにおける解析結果に基づく語句と前記解析ステップにおける解析結果に基づく語句の入力箇所を判定するための属性値とを関連付けする属性値付与ステップとを有する文法生成ステップと、
音声を入力する音声入力ステップと、
前記音声入力ステップにより入力された音声において、前記文法生成ステップにて作成された音声認識用文法に基づいて、音声の認識処理を行い、音声認識結果単語列を出力する音声認識ステップと、
前記音声認識ステップにて出力された音声認識結果単語列における語句を、前記属性値付与ステップの関連付けに基づいて入力箇所を判定し、前記入力箇所に入力を行う結果判定ステップとを備えることを特徴とする音声認識方法。 - 前記解析ステップは、前記入力を求める箇所において選択肢として記載された語句を抽出することを特徴とする請求項9に記載の音声認識方法。
- 前記文法生成ステップは、前記文書中に記載された入力箇所を特定するためのタグ情報を属性値として関連付けることを特徴とする請求項9又は10に記載の音声認識方法。
- 前記文法生成ステップは、前記文書中に記載された入力箇所に隣接するように表示される関連語句と、前記入力箇所に入力可能な語句を含む文が音声認識可能な文法を生成することを特徴とする請求項9から11のいずれか1項に記載の音声認識方法。
- 前記文法生成ステップは、前記解析手段における解析結果に基づく語句と、前記文書中に記載された入力箇所に隣接するように表示される関連語句のうち少なくとも1つ以上の語句の前後に付加語モデルを接続して生成することを特徴とする請求項9から12のいずれか1項に記載の音声認識方法。
- 前記文法生成ステップは、前記音声認識用文法中の少なくとも1つ以上の語句に入力欄を一意に決定するための属性値情報を含めることを特徴とする請求項9から13のいずれか1項に記載の音声認識方法。
- さらに、前記文書のタグ情報を関連付けた語句を少なくとも1つ以上格納する記憶ステップを有することを特徴とする請求項9から14のいずれか1項に記載の音声認識方法。
- 前記文法生成ステップは、前記記憶ステップにて格納された語句から、タグ情報を参照して、前記入力箇所に入力可能な語句を選択し、音声認識可能な文法を生成することを特徴とする請求項9から15のいずれか1項に記載の音声認識方法。
- 文書中のユーザの入力を求める箇所を解析し、前記入力を求める箇所に係る語句を抽出する処理と、
前記抽出する処理における解析結果に基づく語句が音声によって認識されるように音声認識用文法を作成する処理と、前記抽出する処理における解析結果に基づく語句と前記抽出する処理における解析結果に基づく語句の入力箇所を判定するための属性値とを関連付けする処理とを有する文法を生成する処理と、
音声を入力する処理と、
前記音声を入力する処理により入力された音声において、前記文法を生成する処理にて作成された音声認識用文法に基づいて、音声の認識処理を行い、音声認識結果単語列を出力する処理と、
前記音声認識結果単語列を出力する処理にて出力された音声認識結果単語列における語句を、前記関連付けする処理の関連付けに基づいて入力箇所を判定し、前記入力箇所に入力を行う処理とをコンピュータに実行させるプログラム。 - 前記抽出する処理であって、前記入力を求める箇所において選択肢として記載された語句を抽出する処理をコンピュータに実行させる請求項17記載のプログラム。
- 前記生成する処理であって、前記文書中に記載された入力箇所を特定するためのタグ情報を属性値として関連付ける処理と、
前記文書中に記載された入力箇所に隣接するように表示される語句と前記入力箇所に入力可能な語句を含む文が音声認識可能な文法を生成する処理と、
前記解析手段における解析結果に基づく語句と、前記文書中に記載された入力箇所に隣接するように表示される関連語句のうち少なくとも1つ以上の語句の前後に付加語モデルを接続して生成する処理と、
前記音声認識用文法中の少なくとも1つ以上の語句に入力欄を一意に決定するための属性値情報を含める処理とをコンピュータに実行させる請求項17又は18記載のプログラム。 - さらに、前記文書のタグ情報を関連付けた語句を少なくとも1つ以上格納する処理をコンピュータに実行させる請求項17から19のいずれか1項に記載のプログラム。
- 前記生成する処理であって、前記格納する処理にて格納された語句から音声認識可能な文法を生成する処理と、
前記格納する処理のタグ情報を参照して、前記入力箇所に入力可能な語句を取得する処理とをコンピュータに実行させる請求項17から20のいずれか1項に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008079144A JP2009236960A (ja) | 2008-03-25 | 2008-03-25 | 音声認識装置、音声認識方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008079144A JP2009236960A (ja) | 2008-03-25 | 2008-03-25 | 音声認識装置、音声認識方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009236960A true JP2009236960A (ja) | 2009-10-15 |
Family
ID=41251033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008079144A Pending JP2009236960A (ja) | 2008-03-25 | 2008-03-25 | 音声認識装置、音声認識方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009236960A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107785021A (zh) * | 2017-08-02 | 2018-03-09 | 上海壹账通金融科技有限公司 | 语音输入方法、装置、计算机设备和介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003157095A (ja) * | 2001-11-22 | 2003-05-30 | Canon Inc | 音声認識装置及びその方法、プログラム |
-
2008
- 2008-03-25 JP JP2008079144A patent/JP2009236960A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003157095A (ja) * | 2001-11-22 | 2003-05-30 | Canon Inc | 音声認識装置及びその方法、プログラム |
Non-Patent Citations (4)
Title |
---|
CSNG199800412012; 甲斐 充彦 Atsuhiko Kai: '音声認識サーバ-SPOJUS-を利用したWWWブラウザの音声操作システム An voice-operating WWW bro' 情報処理学会研究報告 Vol.98 No.12 IPSJ SIG Notes 第98巻, 社団法人情報処理学会 Information Processing Socie * |
CSNG200401145019; 住吉 貴志 Takashi SUMIYOSHI: 'HTMLのフォーム入力のための文法の自動生成とSALTによる実装 Automatic Generation of Speech Gra' 情報処理学会研究報告 Vol.2003 No.14 IPSJ SIG Notes 第2003巻, 社団法人情報処理学会 Information Processing Socie * |
JPN6012000226; 住吉 貴志 Takashi SUMIYOSHI: 'HTMLのフォーム入力のための文法の自動生成とSALTによる実装 Automatic Generation of Speech Gra' 情報処理学会研究報告 Vol.2003 No.14 IPSJ SIG Notes 第2003巻, 社団法人情報処理学会 Information Processing Socie * |
JPN6012000227; 甲斐 充彦 Atsuhiko Kai: '音声認識サーバ-SPOJUS-を利用したWWWブラウザの音声操作システム An voice-operating WWW bro' 情報処理学会研究報告 Vol.98 No.12 IPSJ SIG Notes 第98巻, 社団法人情報処理学会 Information Processing Socie * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107785021A (zh) * | 2017-08-02 | 2018-03-09 | 上海壹账通金融科技有限公司 | 语音输入方法、装置、计算机设备和介质 |
WO2019024692A1 (zh) * | 2017-08-02 | 2019-02-07 | 深圳壹账通智能科技有限公司 | 语音输入方法、装置、计算机设备和存储介质 |
CN107785021B (zh) * | 2017-08-02 | 2020-06-02 | 深圳壹账通智能科技有限公司 | 语音输入方法、装置、计算机设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI437449B (zh) | 多重模式輸入方法及輸入方法編輯器系統 | |
US8073700B2 (en) | Retrieval and presentation of network service results for mobile device using a multimodal browser | |
KR101309042B1 (ko) | 다중 도메인 음성 대화 장치 및 이를 이용한 다중 도메인 음성 대화 방법 | |
KR102445519B1 (ko) | 대화형 지능 서비스 제공 챗봇 제작 시스템 및 방법 | |
US9594744B2 (en) | Speech transcription including written text | |
JP2016061954A (ja) | 対話装置、方法およびプログラム | |
US20090228270A1 (en) | Recognizing multiple semantic items from single utterance | |
JP2004355629A (ja) | 高度対話型インターフェースに対する理解同期意味オブジェクト | |
US20050010422A1 (en) | Speech processing apparatus and method | |
KR102267561B1 (ko) | 음성 언어 이해 장치 및 방법 | |
JP3814566B2 (ja) | 情報処理装置、情報処理方法、制御プログラム | |
US20060290709A1 (en) | Information processing method and apparatus | |
CN112231015B (zh) | 一种基于浏览器的操作指导方法、sdk插件及后台管理*** | |
JP2009140466A (ja) | 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム | |
JP2009042968A (ja) | 情報選別システム、情報選別方法及び情報選別用プログラム | |
House | Spoken-language access to multimedia(SLAM): a multimodal interface to the World-Wide Web | |
Gruenstein et al. | Scalable and portable web-based multimodal dialogue interaction with geographical databases | |
JP3542578B2 (ja) | 音声認識装置及びその方法、プログラム | |
WO2020017151A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2006236037A (ja) | 音声対話コンテンツ作成方法、装置、プログラム、記録媒体 | |
JP2009236960A (ja) | 音声認識装置、音声認識方法及びプログラム | |
Johnston | Extensible multimodal annotation for intelligent interactive systems | |
JP2007164732A (ja) | コンピュータ実行可能なプログラム、および情報処理装置 | |
JP2005322148A (ja) | ブラウザ装置 | |
JP2000330588A (ja) | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110215 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110920 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120309 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121121 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20121130 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20130208 |