JP7133969B2 - 音声入力装置、及び遠隔対話システム - Google Patents
音声入力装置、及び遠隔対話システム Download PDFInfo
- Publication number
- JP7133969B2 JP7133969B2 JP2018087018A JP2018087018A JP7133969B2 JP 7133969 B2 JP7133969 B2 JP 7133969B2 JP 2018087018 A JP2018087018 A JP 2018087018A JP 2018087018 A JP2018087018 A JP 2018087018A JP 7133969 B2 JP7133969 B2 JP 7133969B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- data
- voice
- unit
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004913 activation Effects 0.000 claims description 46
- 230000005540 biological transmission Effects 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 12
- 238000003384 imaging method Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 8
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Description
2a 第1処理ユニット
2b 第2処理ユニット
2c 第3処理ユニット
3 第1サーバ
4 第2サーバ
21a 第1スマートスピーカ
21b 第2スマートスピーカ
21c 第3スマートスピーカ
22a 第1端末
22b 第2端末
22c 第3端末
211 音声入力部
212 音声出力部
214 第1通信部
215 第2通信部
216 記憶部
217 制御部
221 第1通信部
222 第2通信部
Claims (4)
- 第1音声を入力する音声入力部と、
前記第1音声に対応する第1音声データを外部装置へ送信する第1通信部と、
音声送受信装置から第2音声データを受信するとともに、前記音声送受信装置へ前記第1音声データを送信する第2通信部と、
前記第2音声データに対応する第2音声を出力する音声出力部と、
前記第1音声から前記第1音声データを生成し、前記第2音声データから前記第2音声を生成する制御部と
を備え、
前記制御部は、前記第2音声データが起動コマンドを示すか否かを判定し、
前記制御部は、前記第2音声データが前記起動コマンドを示すと判定した場合、所定の期間、前記外部装置への前記第1音声データの送信を禁止する、音声入力装置。 - 前記制御部は、前記第2音声データが前記起動コマンドを示さないと判定した場合、前記第1音声データが前記起動コマンドを示す否かを判定し、
前記制御部は、前記第1音声データが前記起動コマンドを示すと判定した場合、所定の期間、前記外部装置への前記第1音声データの送信を許可する、請求項1に記載の音声入力装置。 - 前記外部装置へ送信された前記第1音声データが、特定の処理の実行を指令する処理コマンドを示す場合、前記第1通信部は、前記特定の処理を実行した結果を示す音声データを受信する、請求項2に記載の音声入力装置。
- 音声入力装置と、音声送受信装置とを備える遠隔対話システムであって、
前記音声入力装置は、
第1音声を入力する音声入力部と、
前記第1音声に対応する第1音声データを外部装置へ送信する第1通信部と、
前記音声送受信装置から第2音声データを受信するとともに、前記音声送受信装置へ前記第1音声データを送信する第2通信部と、
前記第2音声データに対応する第2音声を出力する音声出力部と、
前記第1音声から前記第1音声データを生成し、前記第2音声データから前記第2音声を生成する制御部と
を備え、
前記制御部は、前記第2音声データが起動コマンドを示すか否かを判定し、
前記制御部は、前記第2音声データが前記起動コマンドを示すと判定した場合、所定の期間、前記外部装置への前記第1音声データの送信を禁止し、
前記音声送受信装置は、
他の音声送受信装置から前記第2音声データを受信する受信部と、
前記他の音声送受信装置から受信した前記第2音声データを前記第2通信部へ送信する送信部と
を備える、遠隔対話システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018087018A JP7133969B2 (ja) | 2018-04-27 | 2018-04-27 | 音声入力装置、及び遠隔対話システム |
US16/387,453 US10971150B2 (en) | 2018-04-27 | 2019-04-17 | Speech input device and remote interaction system |
CN201910344992.2A CN110413249B (zh) | 2018-04-27 | 2019-04-26 | 远程交互*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018087018A JP7133969B2 (ja) | 2018-04-27 | 2018-04-27 | 音声入力装置、及び遠隔対話システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019192121A JP2019192121A (ja) | 2019-10-31 |
JP7133969B2 true JP7133969B2 (ja) | 2022-09-09 |
Family
ID=68292826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018087018A Active JP7133969B2 (ja) | 2018-04-27 | 2018-04-27 | 音声入力装置、及び遠隔対話システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10971150B2 (ja) |
JP (1) | JP7133969B2 (ja) |
CN (1) | CN110413249B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112908318A (zh) * | 2019-11-18 | 2021-06-04 | 百度在线网络技术(北京)有限公司 | 智能音箱的唤醒方法、装置、智能音箱及存储介质 |
US11308958B2 (en) * | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11539915B2 (en) * | 2021-03-20 | 2022-12-27 | International Business Machines Corporation | Transmission confirmation in a remote conference |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000310999A (ja) | 1999-04-26 | 2000-11-07 | Asahi Chem Ind Co Ltd | 設備制御システム |
JP2003032388A (ja) | 2001-07-12 | 2003-01-31 | Denso Corp | 通信端末装置及び処理システム |
JP2009296049A (ja) | 2008-06-02 | 2009-12-17 | Funai Electric Co Ltd | テレビ会議システム |
JP2012208218A (ja) | 2011-03-29 | 2012-10-25 | Yamaha Corp | 電子機器 |
JP2014096153A (ja) | 2012-11-09 | 2014-05-22 | Samsung Electronics Co Ltd | ディスプレイ装置、音声取得装置およびその音声認識方法 |
JP2016533690A (ja) | 2013-09-25 | 2016-10-27 | アマゾン テクノロジーズ インコーポレイテッド | 通話中のバーチャルアシスタント |
WO2017163496A1 (ja) | 2016-03-23 | 2017-09-28 | 日本電気株式会社 | 情報処理端末、腕時計型端末、それらの制御方法、それらの制御プログラムおよび情報処理システム |
US20190206395A1 (en) | 2017-12-28 | 2019-07-04 | Paypal, Inc. | Voice Activated Assistant Activation Prevention System |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2602342Y2 (ja) * | 1993-09-30 | 2000-01-11 | 日本コロムビア株式会社 | オーディオ装置 |
JPH0969038A (ja) * | 1995-08-31 | 1997-03-11 | Canon Inc | 音声出力装置 |
US9147054B1 (en) * | 2012-12-19 | 2015-09-29 | Amazon Technolgies, Inc. | Dialogue-driven user security levels |
EP3012833B1 (en) * | 2013-06-19 | 2022-08-10 | Panasonic Intellectual Property Corporation of America | Voice interaction method, and device |
JP2015184563A (ja) * | 2014-03-25 | 2015-10-22 | シャープ株式会社 | 対話型家電システム、サーバ装置、対話型家電機器、家電システムが対話を行なうための方法、当該方法をコンピュータに実現させるためのプログラム |
US9462112B2 (en) * | 2014-06-19 | 2016-10-04 | Microsoft Technology Licensing, Llc | Use of a digital assistant in communications |
JP2016024212A (ja) | 2014-07-16 | 2016-02-08 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
-
2018
- 2018-04-27 JP JP2018087018A patent/JP7133969B2/ja active Active
-
2019
- 2019-04-17 US US16/387,453 patent/US10971150B2/en active Active
- 2019-04-26 CN CN201910344992.2A patent/CN110413249B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000310999A (ja) | 1999-04-26 | 2000-11-07 | Asahi Chem Ind Co Ltd | 設備制御システム |
JP2003032388A (ja) | 2001-07-12 | 2003-01-31 | Denso Corp | 通信端末装置及び処理システム |
JP2009296049A (ja) | 2008-06-02 | 2009-12-17 | Funai Electric Co Ltd | テレビ会議システム |
JP2012208218A (ja) | 2011-03-29 | 2012-10-25 | Yamaha Corp | 電子機器 |
JP2014096153A (ja) | 2012-11-09 | 2014-05-22 | Samsung Electronics Co Ltd | ディスプレイ装置、音声取得装置およびその音声認識方法 |
US20170337937A1 (en) | 2012-11-09 | 2017-11-23 | Samsung Electronics Co., Ltd. | Display apparatus, voice acquiring apparatus and voice recognition method thereof |
JP2016533690A (ja) | 2013-09-25 | 2016-10-27 | アマゾン テクノロジーズ インコーポレイテッド | 通話中のバーチャルアシスタント |
WO2017163496A1 (ja) | 2016-03-23 | 2017-09-28 | 日本電気株式会社 | 情報処理端末、腕時計型端末、それらの制御方法、それらの制御プログラムおよび情報処理システム |
US20190206395A1 (en) | 2017-12-28 | 2019-07-04 | Paypal, Inc. | Voice Activated Assistant Activation Prevention System |
Also Published As
Publication number | Publication date |
---|---|
JP2019192121A (ja) | 2019-10-31 |
US20190333503A1 (en) | 2019-10-31 |
CN110413249B (zh) | 2023-03-28 |
CN110413249A (zh) | 2019-11-05 |
US10971150B2 (en) | 2021-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7133969B2 (ja) | 音声入力装置、及び遠隔対話システム | |
KR102458342B1 (ko) | 오디오 처리 장치 및 오디오 처리 방법 | |
KR20190051368A (ko) | 전자 장치 및 전자 장치 간 음성으로 기능을 실행하는 방법 | |
KR102265931B1 (ko) | 음성 인식을 이용하는 통화 수행 방법 및 사용자 단말 | |
KR102447381B1 (ko) | 통화 중 인공지능 서비스를 제공하기 위한 방법 및 그 전자 장치 | |
CN110875993A (zh) | 带交互代理功能的图像形成***及其控制方法和存储介质 | |
CN110177186B (zh) | 显示控制装置、显示控制***及显示控制方法 | |
JP6973380B2 (ja) | 情報処理装置、および情報処理方法 | |
JP2015126524A (ja) | 遠隔会議プログラム、端末装置および遠隔会議方法 | |
KR20200024068A (ko) | 인텔리전트 서비스를 위해, 복수의 음성 데이터 수신 장치들을 선택적으로 이용하는 방법, 장치, 및 시스템 | |
JP7141226B2 (ja) | 音声入力装置、及び遠隔対話システム | |
WO2020087336A1 (zh) | 一种移动平台的控制方法及控制设备 | |
CN112399638B (zh) | 一种通信连接建立方法、存储介质及设备 | |
KR20080013541A (ko) | 휴대용 단말기의 음성 제어 장치 및 방법 | |
JP7349533B2 (ja) | 情報処理システム、及び情報処理方法 | |
US8965760B2 (en) | Communication device, method, non-transitory computer readable medium, and system of a remote conference | |
JP7303091B2 (ja) | 制御装置、電子機器、制御装置の制御方法および制御プログラム | |
JP6905115B2 (ja) | 通信装置、制御方法、およびプログラム | |
US20120300126A1 (en) | Electronic apparatus and tv phone method | |
TWI468983B (zh) | 服務啟動方法及系統 | |
US12022187B2 (en) | Image capturing apparatus including plurality of sound input units, control method, and recording medium | |
US20220272253A1 (en) | Image capturing apparatus including plurality of sound input units, control method, and recording medium | |
KR102359163B1 (ko) | 전자 장치 및 이의 음성 인식 방법 | |
KR102507745B1 (ko) | 외부 장치와의 연결을 위한 방법 및 그 전자 장치 | |
WO2018207483A1 (ja) | 情報処理装置、電子機器、制御方法、および制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210324 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220830 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7133969 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |