JP2022119530A - 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム - Google Patents
音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム Download PDFInfo
- Publication number
- JP2022119530A JP2022119530A JP2021016731A JP2021016731A JP2022119530A JP 2022119530 A JP2022119530 A JP 2022119530A JP 2021016731 A JP2021016731 A JP 2021016731A JP 2021016731 A JP2021016731 A JP 2021016731A JP 2022119530 A JP2022119530 A JP 2022119530A
- Authority
- JP
- Japan
- Prior art keywords
- word
- information processing
- registered
- unit
- operation command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 93
- 238000004891 communication Methods 0.000 claims abstract description 36
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 description 25
- 238000000034 method Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 230000015654 memory Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005401 electroluminescence Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 206010027175 memory impairment Diseases 0.000 description 1
- 238000001454 recorded image Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
Images
Landscapes
- Selective Calling Equipment (AREA)
Abstract
Description
近年、音声認識エンジンやスマートスピーカーの開発により音声入力により機器の操作を行うことが増えつつある。しかし、施設内に複数配された機器を操作対象とする場合、次のような問題が生じる。
1-1-1.情報処理装置10の構成
図2は、情報処理装置10の主なハードウエア構成を示す。情報処理装置10は、例えばスマートフォンやタブレット端末等、ユーザーが操作可能な携帯端末である。情報処理装置10は、制御部11と、RAM12と、ROM13と、ストレージ14と、マイク15と、表示部16と、操作部17と、スピーカー18と、通信部19とを備える。各部は、バスラインBを介して相互に接続される。
図3に示す機器制御装置30は、制御部31と、RAM32と、ROM33と、ストレージ34と、機器接続部35と、入力部36と、表示部37と、通信部39とを備えるコンピューター装置である。各部は、バスラインBを介して相互に接続される。機器制御装置30は、監視カメラ50の撮像映像を出力したり記録したりするレコーダーとして機能する。
1-2-1.情報処理装置10の動作
図5を参照しながら、本実施の形態に係る情報処理装置10(図2)の動作について説明する。以下の動作においては、ユーザーは、「1階北側駐車場」(登録ワード)として登録された監視カメラ50のライブ映像を見る操作を行う場合を例とする。
図5のステップS107において指定ワードと一致する辞書ワードがない場合、制御部11は、図6に示す辞書ワード更新処理を実行する。以下、上述した指定ワード「北側1階駐車場」が、辞書ワードと一致しない場合を例にして説明する。
図7を参照しながら、本実施の形態に係る機器制御装置30(図3)の動作について説明する。
機器制御装置30による登録ワードの送信(S131)と情報処理装置10による登録ワードの受信(S102)は、両者の通信確立後、登録ワードリストを表示する(S1081)ために種々のタイミング、態様で実行されうる。例えば、情報処理装置10が機器制御装置30に対して登録ワードの要求メッセージを送信し、これに応答して機器制御装置30が情報処理装置10に対して登録ワード34bのリストを含むメッセージを送信(S131)してもよい。また例えば、機器制御装置30は、情報処理装置10からの明示的な要求に依らず、自発的に登録ワード34bのリストを含むメッセージを送信(S131)してもよい。例えば、機器制御装置30と情報処理装置10とが通信を確立したことに応答して登録ワードの送受信(S131、S102)が実行されてもよい。また例えば、音声入力時(S103~S105)に登録ワードの送受信(S131、S102)が実行されてもよい。この場合、情報処理装置10は、マイク15から入力された音声を認識してテキストを抽出する間(S103~S105)に、機器制御装置30に登録ワードの要求メッセージを送信し、機器制御装置30は、この要求メッセージに応答して登録ワード34bのリストを含むメッセージを送信する。
本実施の形態に係る情報処理装置10またはアプリ11aは、機器制御装置30に操作コマンドを送信する前に、予め機器制御装置30から取得される登録ワードを表示部16に表示させる。このため、音声入力の補助を効果的に提供することができ、音声による操作対象機器をより正確に特定することができる。また、本実施の形態に係る情報処理装置10またはアプリ11aは、機器制御装置30を含む機器側において機能の追加や変更を最小限に留めつつ実現できる。
上記実施の形態において、一例として、ユーザーが所望する監視カメラ50のライブ映像の受信や停止を行う操作コマンドを例にしているが、これに限定されない。例えば、所望の監視カメラ50に関して、録画映像の再生、停止、早送り、巻き戻し等の操作を実行することもできる。この場合、操作コマンド(例えば、「1階北側駐車場を再生して」)を受信した機器制御装置30は、同様に操作コマンドを解析し、登録ワードを照合した後(図7のステップS131~S134)、特定された監視カメラ50のストレージ34に記憶された録画映像を情報処理装置10に送信することにより、操作コマンドを実行する。
以上のように、本出願において開示する技術の例示として、実施の形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略等を行った実施の形態にも適用可能である。また、上記実施の形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。例えば、以下の実施の形態が考えられる。
10 :情報処理装置
10a :クライアント端末
10b :サーバー
11 :制御部
11a :アプリ
12 :RAM
13 :ROM
14 :ストレージ
15 :マイク
16 :表示部
17 :操作部
18 :スピーカー
19 :通信部
30 :機器制御装置
31 :制御部
32 :RAM
33 :ROM
34 :ストレージ
35 :機器接続部
39 :通信部
50 :監視カメラ
Claims (10)
- 一つ以上の機器に関する操作を実行する機器制御装置と通信可能な情報処理装置を含むシステムであって、
前記情報処理装置は、音声入力を受け付ける音声入力部を備え、
前記情報処理装置は、前記音声入力部により受け付けられた音声を認識して、認識した音声に基づき一つ以上の機器に関する操作を実行するための操作コマンドを生成する制御部を備え、
前記情報処理装置は、前記操作コマンドを前記機器制御装置に送信する通信部を備え、
前記情報処理装置は、前記制御部による制御に応じて情報を出力する出力部を備え、
前記機器制御装置は、前記一つ以上の機器を個別に識別するための名称の入力を受け付ける入力部を備え、
前記機器制御装置は、前記入力部により入力された名称を登録ワードとして記憶する記憶部を備え、
前記機器制御装置は、前記情報処理装置から送信された前記操作コマンドと前記登録ワードに基づいて前記一つ以上の機器のうち操作すべき機器を特定し、特定した機器を操作する制御部を備え、
前記機器制御装置は、前記情報処理装置が前記操作コマンドを送信する前に、前記登録ワードを前記情報処理装置に送信し、前記情報処理装置は、受信した前記登録ワードを前記出力部に出力させるシステム。 - 一つ以上の機器に関する操作を実行する機器制御装置と通信可能な情報処理装置であって、
音声入力を受け付ける音声入力部と、
前記音声入力部により受け付けられた音声を認識して、認識した音声に基づき一つ以上の機器に関する操作を実行するための操作コマンドを生成する制御部と、
前記操作コマンドを前記機器制御装置に送信する通信部と、
前記制御部による制御に応じて情報を出力する出力部と、
を備え、
前記機器制御装置に前記操作コマンドを送信する前に、前記制御部は、前記機器制御装置から取得される前記一つ以上の機器を特定する登録ワードを、前記出力部に出力させる、
情報処理装置。 - 前記制御部は、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードとが一致しなかった場合に、前記登録ワードを前記出力部に出力させる、
請求項2に記載の情報処理装置。 - 前記登録ワードは、複数の機器をそれぞれ特定する複数の登録ワードを含み、
前記制御部は、前記複数の登録ワードのうち、前記指定ワードと所定レベル以上の類似度を有する登録ワードを判定し、判定された登録ワードを前記出力部に出力させる、
請求項3に記載の情報処理装置。 - 前記制御部は、出力された前記登録ワードの選択入力に応じて前記操作コマンドを生成する、
請求項3または4に記載の情報処理装置。 - 記憶部を備え、
前記制御部は、
前記指定ワードが前記登録ワードと一致しなかった場合、前記指定ワードと前記登録ワードとを対応づけて前記記憶部に記憶し、
次に前記指定ワードを含む音声が認識された場合は、前記指定ワードに対応する前記登録ワードに基づき前記操作コマンドを生成する、
請求項3から5のいずれかに記載の情報処理装置。 - 認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードとが一致した場合は、前記指定ワードに基づき前記操作コマンドを生成し、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードとが一致しなかった場合は、前記登録ワードを選択可能に前記出力部に出力させて、選択された前記登録ワードに基づき前記操作コマンドを生成する、
請求項2に記載の情報処理装置。 - 前記登録ワードと対応付けられた辞書ワードを記憶する記憶部を備え、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードとが一致した場合は、前記指定ワードに基づき前記操作コマンドを生成し、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと前記登録ワードが一致しないが、前記指定ワードと前記辞書ワードとが一致する場合は、前記辞書ワードに対応付けられた登録ワードに基づき前記操作コマンドを生成し、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードおよび辞書ワードのいずれとも一致しない場合は、前記登録ワードを選択可能に前記出力部に出力させて、選択された前記登録ワードに基づき前記操作コマンドを生成するとともに、前記指定ワードと選択された前記登録ワードとを対応付けて前記辞書ワードを記憶する、
請求項2に記載の情報処理装置。 - 一つ以上の機器に関する操作を実行する機器制御装置であって、
前記一つ以上の機器を個別に識別する名称を登録ワードとして記憶する記憶部と、
音声入力部を有する情報処理装置と通信するための通信部と、
前記情報処理装置から、前記音声入力部を介して入力されて認識された音声に基づき生成された操作コマンドと、前記登録ワードとに基づき、前記一つ以上の機器のうち操作すべき機器を特定し、特定した機器を操作する制御部とを備え、
前記登録ワードが前記情報処理装置に出力されるように、前記登録ワードを前記情報処理装置に送信する機器制御装置。 - 一つ以上の機器に関する操作を実行する機器制御装置と通信し、音声により機器を操作するためのコンピュータープログラムであって、
音声入力を受け付け、
受け付けられた音声を認識し、
認識した音声に基づき一つ以上の機器に関する操作を実行するための操作コマンドを生成し、
前記操作コマンドを前記機器制御装置に送信する、
ことを含み、
前記機器制御装置に前記操作コマンドを送信する前に、予め前記機器制御装置から取得される前記一つ以上の機器を特定する登録ワードを出力部により出力させる、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021016731A JP7489928B2 (ja) | 2021-02-04 | 2021-02-04 | 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021016731A JP7489928B2 (ja) | 2021-02-04 | 2021-02-04 | 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022119530A true JP2022119530A (ja) | 2022-08-17 |
JP7489928B2 JP7489928B2 (ja) | 2024-05-24 |
Family
ID=82848321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021016731A Active JP7489928B2 (ja) | 2021-02-04 | 2021-02-04 | 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7489928B2 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002259114A (ja) | 2001-03-05 | 2002-09-13 | Nec Corp | 音声認識コンピュータシステム |
JP3995539B2 (ja) | 2002-06-20 | 2007-10-24 | 株式会社日立国際電気 | Cctv装置及びcctv装置の状態出力方法 |
JP4951422B2 (ja) | 2007-06-22 | 2012-06-13 | 日産自動車株式会社 | 音声認識装置、および音声認識方法 |
JP5263875B2 (ja) | 2008-09-16 | 2013-08-14 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 発話入力の音声認識のためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム |
JP2020101778A (ja) | 2018-12-25 | 2020-07-02 | パナソニックIpマネジメント株式会社 | 音声認識システム、学習済みモデルの生成方法、音声認識システムの制御方法、プログラム、及び移動体 |
-
2021
- 2021-02-04 JP JP2021016731A patent/JP7489928B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP7489928B2 (ja) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220084160A1 (en) | Picture display device, and setting modification method and setting modification program therefor | |
US11551682B2 (en) | Method of performing function of electronic device and electronic device using same | |
US10434412B2 (en) | Control apparatus, control method, program, and information storage medium | |
US12003804B2 (en) | Information processing device, information processing method, and computer program | |
BR102013000553A2 (pt) | Aparelho de exibição de imagem possibilitando o reconhecimento de voz, e método de controlar um aparelho de exibição de imagem incluindo uma unidade de entrada de voz e uma unidade de saída de áudio | |
US10867603B2 (en) | Audio-video reproduction device setup using interview-based voice control | |
US20210105437A1 (en) | Information processing device, information processing method, and storage medium | |
KR20200083289A (ko) | 로컬화된 가상 개인 지원 | |
KR20190068133A (ko) | 오디오 데이터에 포함된 음소 정보를 이용하여 어플리케이션을 실행하기 위한 전자 장치 및 그의 동작 방법 | |
US20120242860A1 (en) | Arrangement and method relating to audio recognition | |
JP6973380B2 (ja) | 情報処理装置、および情報処理方法 | |
US20200090663A1 (en) | Information processing apparatus and electronic device | |
US10976997B2 (en) | Electronic device outputting hints in an offline state for providing service according to user context | |
CN108881766B (zh) | 视频处理方法、装置、终端和存储介质 | |
JP7489928B2 (ja) | 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム | |
WO2020087336A1 (zh) | 一种移动平台的控制方法及控制设备 | |
JP2021105998A (ja) | 映像表示装置 | |
US20210005203A1 (en) | Voice processing apparatus and voice processing method | |
CN115476366B (zh) | 足式机器人的控制方法、装置、控制设备及存储介质 | |
CN115474080B (zh) | 一种有线投屏控制方法及装置 | |
WO2022193735A1 (zh) | 显示设备及语音交互方法 | |
JP7351642B2 (ja) | 音声処理システム、会議システム、音声処理方法、及び音声処理プログラム | |
US20240202231A1 (en) | Display apparatus, display method, and recording medium with display program recorded thereon | |
US20220075592A1 (en) | Voice processing system, voice processing method and recording medium recording voice processing program | |
JP2022056593A (ja) | 会議支援システム、会議支援方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240514 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7489928 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |