JP7168080B2 - 音声認識制御装置、音声認識制御方法、およびプログラム - Google Patents
音声認識制御装置、音声認識制御方法、およびプログラム Download PDFInfo
- Publication number
- JP7168080B2 JP7168080B2 JP2021524541A JP2021524541A JP7168080B2 JP 7168080 B2 JP7168080 B2 JP 7168080B2 JP 2021524541 A JP2021524541 A JP 2021524541A JP 2021524541 A JP2021524541 A JP 2021524541A JP 7168080 B2 JP7168080 B2 JP 7168080B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- speech
- recognition result
- network
- communication state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 29
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000012545 processing Methods 0.000 claims description 45
- 238000004891 communication Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 17
- 230000006870 function Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
- H04L43/0864—Round trip delays
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Description
第一実施形態の音声認識制御装置1は、図1に示すように、例えば、通信状態測定部11、音声認識要求部12、音声認識部13、および認識結果出力部14を備える。音声認識制御装置1は、少なくとも1台の音声認識装置2と通信可能となるようにネットワーク3に接続される。ネットワーク3は、接続される各装置が相互に通信可能なように構成された回線交換方式もしくはパケット交換方式の通信網であり、例えばインターネットやLAN(Local Area Network)、WAN(Wide Area Network)などを用いることができる。図1では、ネットワーク3を介さず利用できる音声認識部13とネットワーク3を介して通信する音声認識装置2との2つの音声認識器を用いる構成としているが、音声認識部13と2台以上の音声認識装置2を含む3つ以上の音声認識器を用いる構成や、音声認識部13を備えず2台以上の音声認識装置2を含む2つ以上の音声認識器を用いる構成としてもよい。すなわち、複数の音声認識器のうち少なくとも1つがネットワーク3を介して利用できれば音声認識器の数や位置は限定されない。この音声認識制御装置1が後述する各ステップの処理を行うことにより第一実施形態の音声認識制御方法が実現される。
第一実施形態の音声認識制御装置は、認識結果を待ち合わせるタイムアウト時間の制御を行ったが、第二実施形態の音声認識制御装置は、それに加えて音声認識の探索処理パラメータの制御も行う。
第一実施形態および第二実施形態の音声認識制御装置は、認識結果が得られるまでの所要時間のタイムアウト処理を対象として制御を行ったが、第三実施形態の音声認識制御装置は、信頼尺度を用いた閾値処理を対象とした制御を行う。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムを図3に示すコンピュータの記憶部1020に読み込ませ、制御部1010、入力部1030、出力部1040などに動作させることにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (5)
- ネットワークを介して通信を行う少なくとも1つの音声認識器を含む複数の音声認識器から認識結果を得る音声認識制御装置であって、
上記ネットワークの通信状態を測定する通信状態測定部と、
上記ネットワークの直前の通信状態に応じて上記音声認識器それぞれの認識結果を待ち合わせるタイムアウト時間を設定して上記音声認識器それぞれへ音声認識処理のリクエストを送信する音声認識要求部と、
少なくとも1つの上記音声認識器から受信した認識結果に基づいて認識結果を出力する認識結果出力部と、
を含み、
上記音声認識要求部は、上記ネットワークの通信状態の通常時には、設定された上記タイムアウト時間を利用して上記音声認識器それぞれの認識結果の待ち合わせを行い、上記ネットワークの通信状態の輻輳時には、上記音声認識器それぞれの認識結果の待ち合わせを行わない制御を行い、
上記認識結果出力部は、上記音声認識要求部が上記待ち合わせを行わない制御を行った場合には、最初に得られた認識結果を音声認識処理の認識結果として出力する、
音声認識制御装置。 - 請求項1に記載の音声認識制御装置であって、
上記音声認識要求部は、上記ネットワークの直前の通信状態に応じて探索パラメータを設定して上記音声認識処理のリクエストを送信するものである、
音声認識制御装置。 - 請求項1または2に記載の音声認識制御装置であって、
上記音声認識要求部は、上記ネットワークの直前の通信状態に応じて信頼尺度の閾値を設定して上記音声認識処理のリクエストを送信するものであり、
上記認識結果出力部は、ある音声認識器から受信した認識結果の信頼尺度が上記閾値を超える場合、他の音声認識器の認識結果を待たずに上記受信した認識結果を出力するものである、
音声認識制御装置。 - ネットワークを介して通信を行う少なくとも1つの音声認識器を含む複数の音声認識器から認識結果を得る音声認識制御方法であって、
通信状態測定部が、上記ネットワークの通信状態を測定し、
音声認識要求部が、上記ネットワークの直前の通信状態に応じて上記音声認識器それぞれの認識結果を待ち合わせるタイムアウト時間を設定して上記音声認識器それぞれへ音声認識処理のリクエストを送信し、
認識結果出力部が、少なくとも1つの上記音声認識器から受信した認識結果に基づいて認識結果を出力し、
上記音声認識要求部は、上記ネットワークの通信状態の通常時には、設定された上記タイムアウト時間を利用して上記音声認識器それぞれの認識結果の待ち合わせを行い、上記ネットワークの通信状態の輻輳時には、上記音声認識器それぞれの認識結果の待ち合わせを行わない制御を行い、
上記認識結果出力部は、上記音声認識要求部が上記待ち合わせを行わない制御を行った場合には、最初に得られた認識結果を音声認識処理の認識結果として出力する、
音声認識制御方法。 - 請求項1から3のいずれかに記載の音声認識制御装置としてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/022163 WO2020245912A1 (ja) | 2019-06-04 | 2019-06-04 | 音声認識制御装置、音声認識制御方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020245912A1 JPWO2020245912A1 (ja) | 2020-12-10 |
JP7168080B2 true JP7168080B2 (ja) | 2022-11-09 |
Family
ID=73652485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021524541A Active JP7168080B2 (ja) | 2019-06-04 | 2019-06-04 | 音声認識制御装置、音声認識制御方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220328047A1 (ja) |
JP (1) | JP7168080B2 (ja) |
WO (1) | WO2020245912A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230123343A (ko) * | 2022-02-16 | 2023-08-23 | 삼성전자주식회사 | 음성 지원 서비스를 제공하는 방법 및 장치 |
CN115188368A (zh) * | 2022-06-30 | 2022-10-14 | 北京百度网讯科技有限公司 | 语音测试方法、装置、电子设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012256001A (ja) | 2011-06-10 | 2012-12-27 | Alpine Electronics Inc | 移動体における音声認識装置および方法 |
JP2013232001A (ja) | 2008-08-29 | 2013-11-14 | Multimodal Technologies Inc | ハイブリッド型音声認識 |
JP2014010456A (ja) | 2012-06-28 | 2014-01-20 | Lg Electronics Inc | 移動端末機及びその音声認識方法 |
JP2016001221A (ja) | 2014-06-11 | 2016-01-07 | 日本電信電話株式会社 | 音声データ送信装置およびその動作方法 |
WO2017154282A1 (ja) | 2016-03-10 | 2017-09-14 | ソニー株式会社 | 音声処理装置および音声処理方法 |
JP2018045202A (ja) | 2016-09-16 | 2018-03-22 | トヨタ自動車株式会社 | 音声対話システムおよび音声対話方法 |
JP2018081185A (ja) | 2016-11-15 | 2018-05-24 | クラリオン株式会社 | 音声認識装置、音声認識システム |
JP2018101905A (ja) | 2016-12-20 | 2018-06-28 | シャープ株式会社 | 情報通信端末、情報通信端末の制御方法、およびプログラム |
JP2018180409A (ja) | 2017-04-19 | 2018-11-15 | 三菱電機株式会社 | 音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法 |
WO2018235236A1 (ja) | 2017-06-22 | 2018-12-27 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9893971B1 (en) * | 2012-12-31 | 2018-02-13 | Juniper Networks, Inc. | Variable timeouts for network device management queries |
-
2019
- 2019-06-04 WO PCT/JP2019/022163 patent/WO2020245912A1/ja active Application Filing
- 2019-06-04 US US17/615,812 patent/US20220328047A1/en active Pending
- 2019-06-04 JP JP2021524541A patent/JP7168080B2/ja active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013232001A (ja) | 2008-08-29 | 2013-11-14 | Multimodal Technologies Inc | ハイブリッド型音声認識 |
JP2012256001A (ja) | 2011-06-10 | 2012-12-27 | Alpine Electronics Inc | 移動体における音声認識装置および方法 |
JP2014010456A (ja) | 2012-06-28 | 2014-01-20 | Lg Electronics Inc | 移動端末機及びその音声認識方法 |
JP2016001221A (ja) | 2014-06-11 | 2016-01-07 | 日本電信電話株式会社 | 音声データ送信装置およびその動作方法 |
WO2017154282A1 (ja) | 2016-03-10 | 2017-09-14 | ソニー株式会社 | 音声処理装置および音声処理方法 |
JP2018045202A (ja) | 2016-09-16 | 2018-03-22 | トヨタ自動車株式会社 | 音声対話システムおよび音声対話方法 |
JP2018081185A (ja) | 2016-11-15 | 2018-05-24 | クラリオン株式会社 | 音声認識装置、音声認識システム |
JP2018101905A (ja) | 2016-12-20 | 2018-06-28 | シャープ株式会社 | 情報通信端末、情報通信端末の制御方法、およびプログラム |
JP2018180409A (ja) | 2017-04-19 | 2018-11-15 | 三菱電機株式会社 | 音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法 |
WO2018235236A1 (ja) | 2017-06-22 | 2018-12-27 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2020245912A1 (ja) | 2020-12-10 |
WO2020245912A1 (ja) | 2020-12-10 |
US20220328047A1 (en) | 2022-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7168080B2 (ja) | 音声認識制御装置、音声認識制御方法、およびプログラム | |
TWI752955B (zh) | 運算設備、運算系統、非暫態電腦可讀媒體、及控制用於多核心處理器之電流的方法 | |
CN111638969B (zh) | 改善主机设备的数据传输命令等待时间 | |
CN101616174B (zh) | 一种存储***io处理路径动态跟踪实现优化***性能的方法 | |
US10114582B1 (en) | Dynamically selecting between sync and async replication modes | |
CN103477331B (zh) | 启动装置、目标装置、通信***、超时检测方法以及超时检测程序 | |
US10176125B2 (en) | Dynamically adjusting read data return sizes based on interconnect bus utilization | |
US10423563B2 (en) | Memory access broker system with application-controlled early write acknowledgment support and identification of failed early write acknowledgment requests to guarantee in-order execution of memory requests of applications | |
US9972376B2 (en) | Memory device for interruptible memory refresh | |
WO2017172051A1 (en) | Method and apparatus to coordinate and authenticate requests for data | |
US20190158566A1 (en) | Asynchronously reading http responses in separate process | |
US20160034191A1 (en) | Grid oriented distributed parallel computing platform | |
JP4646649B2 (ja) | 通信サーバ設定値決定装置,そのプログラム及びその方法 | |
TW201535412A (zh) | 具有繞回性至連續性讀取之記憶體子系統 | |
US9720826B1 (en) | Systems and methods to distributively process a plurality of data sets stored on a plurality of memory modules | |
US8650281B1 (en) | Intelligent arbitration servers for network partition arbitration | |
US10970258B2 (en) | Managing container-image layers | |
US10096353B2 (en) | System and memory controller for interruptible memory refresh | |
WO2017091963A1 (zh) | 一种信息处理方法及装置 | |
CN111552652A (zh) | 基于人工智能芯片的数据处理方法、装置和存储介质 | |
CN114338386B (zh) | 一种网络的配置方法、装置、电子设备及存储介质 | |
US20220188176A1 (en) | Apparatus for monitoring task execution time and method of operating node | |
KR20220113283A (ko) | 저장 장치 리소스 관리를 위한 시스템 및 방법 | |
US10346329B2 (en) | Timer placement optimization | |
KR20220067992A (ko) | 선택적 및 병렬적 에러 정정을 수행하는 메모리 컨트롤러, 이를 포함하는 시스템 및 메모리 장치의 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220905 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220927 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221010 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7168080 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |