JP2003131695A - 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法 - Google Patents

音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法

Info

Publication number
JP2003131695A
JP2003131695A JP2001327622A JP2001327622A JP2003131695A JP 2003131695 A JP2003131695 A JP 2003131695A JP 2001327622 A JP2001327622 A JP 2001327622A JP 2001327622 A JP2001327622 A JP 2001327622A JP 2003131695 A JP2003131695 A JP 2003131695A
Authority
JP
Japan
Prior art keywords
voice
name
voice recognition
pattern
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001327622A
Other languages
English (en)
Inventor
Ritsuko Kanazawa
律子 金澤
Takayuki Yamamoto
貴之 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001327622A priority Critical patent/JP2003131695A/ja
Publication of JP2003131695A publication Critical patent/JP2003131695A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】操作対象の機器だけを個別の音声認識により制
御可能な遠隔操作技術の提供。 【解決手段】任意に付けた愛称等の機器名称や該機器の
操作関連用語を予めデータとして該機器に個別に対応さ
せて登録しておき、マイクロホン等から音声により上記
愛称等の機器名称や操作関連用語が操作指示として入力
されたとき、該音声を対応したデータに変換し、該変換
データを上記登録データと照合して、該変換データが上
記登録データと一致すると判断されるときに、上記機器
を制御対象に特定しかつ各操作モードを決定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声による遠隔制
御で操作される機器に関わる。
【0002】
【従来の技術】通常、テレビやエアコンなどの機器を離
れた所から制御するために、ユーザの操作を赤外線デー
タに変換して機器本体に送る遠隔制御装置である所謂リ
モコンが各機器毎に使用されている。特開2001−1
97379号公報には、リモコンの代わりに音声認識装
置を家電機器の中に組み込み、ユーザの音声から機器を
操作する命令に相当する単語を抽出して認識し、認識し
た単語を辞書により機器操作の命令に変換して稼動する
家電機器が記載されている。また、特開平5−7385
号公報には、テレビやビデオなどの数種類の家電機器を
専用接続した大規模な音声認識家電システムで、従来機
器1つ毎に持っていた機器制御用の辞書を1つに纏める
技術が記載されている。
【0003】
【発明が解決しようとする課題】ところが、一般家庭の
室内には通常複数の家電機器等の機器が存在する。さら
に買い替えや買い足し等で、台数も機能も変化するもの
である。例えば、居間にメーカの異なるテレビが2台に
エアコン、ステレオが散らばり、隣に部屋にもう1台エ
アコンを買い足すことはごく普通の状況である。それら
の機器が皆音声認識により稼動する場合、例えばどちら
のテレビを操作したいのか対象機器の分別が出来なくな
り、居間のエアコンを動かそうとしたら、隣の部屋のエ
アコンも反応してしまうようになった等、ユーザの意思
に反する操作が行われる可能性がある。本発明の目的
は、ユーザの意図する機器が支持通りに動作する音声認
識による遠隔制御可能な機器を提供することにある。
【0004】
【課題を解決するための手段】本発明は、集音用のマイ
クロホンと該マイクロホンを介して入力されてくる音声
を分析し単語に変換する音声認識手段と、ユーザが任意
に付ける機器の名前を装置内に記憶させる機器名称登録
手段と、ユーザが行える該機器の操作各々に対して複数
の単語を対応させて登録した操作語辞書記憶手段と、機
器が実行すべき機能を決定する機能決定手段を備える。
音声認識手段は、通常はマイクロホンが集めた音声信号
を分析し、機器名称登録手段により、その機器の名前と
して登録された音声パターンを検出する作業を行ってい
る。音声認識手段は機器の名前を検知した場合は、その
後に続く音声を分析して単語に変換し、機器制御手段に
送る。機器制御手段は、送られてきた単語を操作辞書記
憶手段の操作語辞書と照らし合わせて、ユーザがどの操
作を指示したのかを検索する。そして検索結果の機能を
機器が実行するよう制御する。すなわち、本音声認識機
器制御装置を搭載した機器は、自分の名前に続く一連の
フレーズを自身への操作命令としてユーザから受け取り
動作することになる。そしてユーザは室内に複数の似通
った、あるいは全く同じ機能を搭載した機器がある場合
でも、機器の名前を呼んで操作指示を行うことにより、
自然で容易な機器の分別が可能になる。また機器の名前
はユーザが呼びやすいよう自由に付けられるため間違い
や混乱も少ない。
【0005】
【発明の実施の形態】図1は本発明の音声認識機器制御
装置の一実施例の構成を表すハードウェア構成図である
(図1(b))。本装置は、通常、家電等の機器に組み
込まれた機能の一部として動作するものである。本実施
例は、音声認識機器制御装置が電子部品を搭載した基板
1の形で、本体を制御するメイン基板2とボタンの並ん
だ操作パネル基板3とを持つエアコンに搭載されている
例である(図1(a))。エアコン本体を制御する本体
メイン基板2と操作パネル基板3及び音声認識機器制御
装置の基板1はシリアルケーブル4で繋がり、音声認識
機器制御装置1、あるいは操作パネル3が受け取ったユ
ーザ指示は該シリアルケーブル4を介して本体メイン基
板2にコマンドデータを送ることにより伝えられる。本
体メイン基板2は受け取ったコマンドデータに対応した
処理を行いユーザの指示した動作が実行される。音声認
識機器制御装置の基板1は、マイクロプロセッサ101
を中心とし、システムプログラムや辞書、機器名称など
を格納するEEPROMやフラッシュメモリなどのRO
M102、プログラムのワークエリアとなるRAM10
3、マイクロホン104と音声処理部105等がシステ
ムバス100により接続され、マイクロプロセッサ10
1には切り替えスイッチ106、LED(ライトエミッ
ティングダイオード)107等が繋がった構成である。
【0006】図2、図3、図4は図1の基板1のROM
102に搭載されマイクロプロセッサ101により実行
される機能決定プログラムのフローチャートと機器名称
登録プログラムのフローチャート、および操作語辞書で
ある。以下、本装置がユーザの音声による指示をエアコ
ン本体が実行すべき機能内容に返還し、メイン基板2に
通知する例を用いて本装置の動作を説明する。エアコン
本体の電源スイッチが入れられ、本基板に本体機器から
電源が供給さると、図2のプログラムがスタートする。
まず、ステップ1001で音声処理部105を名前認識
モードで起動し、マイクロホン104から集音した音声
を分析して単語に変換する音声認識の処理を開始させ
る。音声認識の動作は以下のようになる。まずマイクロ
ホン104から取りこまれたアナログ音声信号は音声処
理部105に入る。音声処理部105は、取りこんだア
ナログ音声信号をA/D変換機でデジタル信号に変換
し、強調や雑音除去等のフィルタ処理を行った後、スペ
クトル分析を行って音声信号をパワースペクトル等のパ
ターンパラメータに変換する。そして単語の標準パター
ンパラメータを登録してある単語辞書との類似計算を行
い、取りこまれた音声のパターンパラメータに最も近い
パラメータを持つ単語を選択的に抽出する事により音声
を単語の羅列として認識する。この音声処理部は上記方
法には拘らず、所謂不特定話者の単語の認識処理の行え
るものなら方式や音声信号のパターンパラメータ形式は
どのようなものでもよい。ステップ1001で名前認識
モードで起動された音声処理部105は、前記取りこま
れた音声のパワースペクトルのパターンと単語辞書の類
似比較の際、単語辞書ではなく登録されている自身の名
前の音声スペクトルパターンとマッチするか否かの判定
処理を行い、登録した名前ではない場合はデータを捨
て、登録した音声スペクトルパターンと一致した場合は
機器コードをRAM103上のバッファエリアに書き込
む。本コントローラ搭載のエアコンの機器コードは「0
001」であるとする。
【0007】マイクロプロセッサ101はステップ10
02でバッファエリアに「0001」のテキストデータ
が書き込まれるのを待ち、テキストが書き込まれるとス
テップ1003に進み音声処理部105を全単語認識の
モード゛に変更する。なお上記機器コードのRAMへの
書き込みはマイクロプロセッサ101に機器制御処理を
開始させる合図を音声処理部105が伝えるためであ
る。従って、機器コードを書き込む処理に限ることは無
く、例えば電気信号を送るなどの手段で伝えてもよい。
音声処理部105は全単語認識モードになると、上記単
語辞書を使って音声を全て認識処理して単語に変換し、
かなのテキストデータの形式でRAM103上のバッフ
ァエリアに書き込む。マイクロプロセッサはステップ1
004でバッファエリアのテキストデータを読み込む動
作を行う。そして、ステップ1005で読み込んだテキ
ストデータを操作語辞書に含まれている単語と比較し、
一致する設定機能を探す。
【0008】図3は、本実施例のエアコンの操作語辞書
の一例である。操作語辞書は、ユーザが操作可能な本エ
アコンの機能を羅列し、その機能の選択を示す単語のか
なテキストデータ候補を対応して並べたものである。従
ってこの機器操作辞書は、本音声認識リモコンを搭載す
る機器毎に個別のものとなる。本実施例のエアコンは、
運転の種別として「冷房」「暖房」「ドライ」「送風」の
4種があり、温度設定が20゜Cから30゜Cまで1゜C
刻みに指定でき、さらに風速を「強」「弱」「自動」の
3種から選択できる。一方、音声処理部は単語の認識結
果をかなテキストデータで出力するため、図3のような
辞書となる。ステップ1005で機能が見つかるとステ
ップ1006に進み、機能に対応するコマンドデータを
作成し、機器本体のメインコントロール部に送る。本実
施例のエアコンの場合は、通常手動で機器を制御する場
合は、ボタン群を設けた操作パネルからボタン押し下げ
のデータがシリアルケーブルを介してエアコン本体のメ
インコントローラに伝えられている。従って本実施例の
場合、ステップ1006はこのボタン押し下げの電子情
報を作成しシリアルケーブルに流す操作を行う。そして
ステップ1004に戻り、書き込まれたテキストを読ん
で操作語辞書とのマッチング処理を繰り返す。エアコン
操作語辞書とマッチする機能が見つからないミスマッチ
の場合はステップ1007に進む。ステップ1007で
は、ミスマッチ回数をカウントする。本実施例の場合、
2回続けてミスマッチが起こるとリモートコントロール
操作は終了したものとみなし、ステップ1008に進
む。このミスマッチカウント回数は本体機器の使用状況
によって任意に定めるものである。ステップ1008で
は、音声処理部105を名前認識モードに戻し、ステッ
プ1002に戻って、ユーザがエアコンの名前を呼ぶの
を待つ。
【0009】図3は、このエアコンを最初に購入した際
に名前を付けたり、また一度付けた名前を変更したりす
る場合の機器名称登録を行うプログラムのフローチャー
トである。図2のステップ1002の状態で切り替えス
イッチ106をONにすると、図3のプログラムの先頭
へ処理が飛び、機器名称の登録が開始される。ステップ
2001でマイクロプロセッサ101は音声処理部10
5を名前登録モードに変更し、ステップ2002で入力
指示用のLED107を点灯させる。これはユーザに機
器につけたい名前をマイクロホンから音声入力してもら
う準備が整ったことを示すためである。ユーザが名前を
入力すると一旦LED107を消灯し、音声処理部10
5は通常の認識処理時と同様にパターンパラメータに変
換しRAMバッファ上に一時保管する。ステップ200
4で上記名前のパターンパラメータ作成を必要に応じて
何回か繰り返し、名前標準パターンパラメータを決定す
る。そしてステップ2005でROM102上の名称登
録エリアをクリアし、ステップ2006で新たに作成し
たパターンパラメータを書き込み、名前登録処理を終了
する。仮に、上記のエアコンが2台有り、各々の名前が
「エアちゃん」「コンちゃん」であったとすると、ユー
ザは「エアちゃん、冷房、24度でスタート」と呼びか
けることにより音声認識結果の単語として「れいぼう」
「にじゅうよんど」「すたーと」が抽出され、図2のプ
ログラムにより「冷房」「24゜C」「運転」の機能が決
定され、片方のエアコンの操作パネルの「冷房」「24
゜C」「運転開始」のボタンを押したと同じ動作をさせ
ることができる。
【0010】上記実施例は、本体機器の部品、すなわち
メイン基板と操作パネルとは別の部品基板として本音声
認識機器制御装置を実装しているが、搭載する形式は勿
論この例に限られるものではなく、例えば本体と全く一
体化していてもよい。また、上記実施例は音声認識処理
にモードを設けて、機器の名前のみを認識する処理と全
ての音声信号を単語に変換する処理を分けているが、こ
れを全て単語として認識し、認識結果のテキストデータ
から機器の名前を検出するようにしてもよい。この場
合、機器名称登録手段には音声のパターンパラメータで
はなくテキストデータが登録されることになる。
【0011】さらに、ホームゲートウェイなど多数の機
器を制御するリモートコントローラに本発明を搭載する
場合は、制御可能な機器に機器コードを例えば通し番号
などで割り振り、機器名称登録手段がコントロールする
機器の台数分の名前を登録し、操作辞書記憶手段がコン
トロールする機器の台数分だけ操作語辞書を記憶し、ス
テップ1001の名前認識モードの音声処理部分で、該
複数の名前のパターンパラメータの中で一致するものが
あるか判定し、どれかの機器の名前が認識されると、該
機器の機器コードをRAM103に書き込むようにす
る。マクロプロセッサは該機器コードの示す機器の操作
語辞書を使用して、続く全単語認識で認識された単語の
機能マッチングを行うことにより、複数機器のコントロ
ールを行うことも可能である。
【0012】
【発明の効果】本発明によればユーザは室内に複数の似
通った、あるいは全く同じ機能を搭載した機器がある場
合でも、機器の名前を呼んで操作指示を言えばよいた
め、自然で容易な音声による機器の遠隔操作が可能にな
る。
【図面の簡単な説明】
【図1】本発明の一実施例である音声認識機器制御装置
の構成図である。
【図2】本発明の一実施例によるコントローラの機器操
作プログラムのフローチャートである。
【図3】本発明の一実施例によるコントローラの機器名
称登録プログラムのフローチャートである。
【図4】本発明の一実施例によるコントローラの操作語
辞書の例である。
【符号の説明】
1…音声認識機器制御装置、 2…エアコンメイン基
板、 3…エアコン操作パネル基板、 100…システ
ムバス、 101…マイクロプロセッサユニット(MP
U)、 102…リードオンリーメモリ(ROM)、
103…ランダムアクセスメモリ(RAM)、 104
…マイクロホン、 105…音声処理部、106…ボタ
ンスイッチ、 107…LED。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 山本 貴之 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所デジタルメディア開発本 部内 Fターム(参考) 5D015 HH13 KK01 LL10 LL12

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】音声を認識して動作する音声認識機器を制
    御するための音声認識機器制御装置であって、入力され
    る音声を電気信号のパターンに変換し、該音声パターン
    信号を、任意に登録した機器名称のパターンデータと照
    合し、該照合の結果により音声認識の動作モードを変更
    する構成を備えることを特徴とする音声認識機器制御装
    置。
  2. 【請求項2】入力される音声を電気信号のパターンに変
    換し、該音声パターン信号を、任意に登録した機器名称
    のパターンデータと照合し、該照合の結果により音声認
    識の動作モードを変更する構成を備える手段と、機器に
    付ける任意の名称を電気信号のパターンとして登録する
    機器名称登録手段と、機器の操作各々に対して複数の単
    語を対応させて登録した操作語辞書記憶手段とを有し、
    入力された音声パターン信号を前記機器名称登録手段に
    より登録した機器名称のパターンデータと照合し、一致
    した場合は、入力された音声パターン信号を前記操作語
    辞書と照合する動作に変更する手段を備えることを特徴
    とする音声認識機器。
  3. 【請求項3】マイクロホン等の集音手段と該集音手段を
    介し入力されてくる音声を分析し単語の羅列に変換する
    音声認識手段と、ユーザが任意に付ける機器の名前を装
    置内に記憶させる機器名称登録手段と、ユーザが行える
    該機器の操作各々に対して複数の単語を対応させて登録
    した操作語辞書記憶手段と、機器に実行させるべき操作
    の内容を決定する機能決定手段を備えた音声認識機器制
    御装置であって、機器名称登録手段は、使用者が任意に
    名付ける機器の名前を装置内に記憶し、音声認識手段
    は、集音手段が集めた音声信号を分析し登録されている
    該機器の名前を検出し、該検出した機器の名前に続いて
    集音手段を介して入力される音声信号を単語のデータへ
    変換し、機能決定手段は、該名前の後に続く1つまたは
    複数の単語データのみを操作辞書記憶手段に記憶されて
    いる機器操作と単語の対応辞書と照らし合わせて操作の
    内容を決定することを特徴とする音声認識機器制御装
    置。
  4. 【請求項4】電子機器を音声により制御する音声認識機
    器制御方法であって、任意につけた機器の名称をデータ
    化して登録するステップと、入力される音声を、前記デ
    ータ化して登録した機器の名称と照合するための名称照
    合用の電気信号パターンに変更するステップと、照合結
    果が一致した場合のみ、入力される音声を分析し単語デ
    ータにまたはその結合に変換するステップと、変換した
    1つまたは複数の単語データを、あらかじめ登録してあ
    る機器操作のための辞書と照合するステップとを経て、
    電子機器を制御することを特徴とする音声認識機器制御
    方法。
JP2001327622A 2001-10-25 2001-10-25 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法 Pending JP2003131695A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001327622A JP2003131695A (ja) 2001-10-25 2001-10-25 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001327622A JP2003131695A (ja) 2001-10-25 2001-10-25 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法

Publications (1)

Publication Number Publication Date
JP2003131695A true JP2003131695A (ja) 2003-05-09

Family

ID=19143823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001327622A Pending JP2003131695A (ja) 2001-10-25 2001-10-25 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法

Country Status (1)

Country Link
JP (1) JP2003131695A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008205896A (ja) * 2007-02-21 2008-09-04 Yamaha Corp 放収音装置
US20150023481A1 (en) * 2013-07-19 2015-01-22 Richplay Information Co., Ltd. Method for personalizing voice assistant
US9087515B2 (en) 2010-10-25 2015-07-21 Denso Corporation Determining navigation destination target in a situation of repeated speech recognition errors
WO2016052164A1 (ja) * 2014-09-30 2016-04-07 シャープ株式会社 対話装置
JP2016099479A (ja) * 2014-11-20 2016-05-30 アイシン・エィ・ダブリュ株式会社 音声制御システム、音声制御方法、及び音声制御プログラム
JP2021144238A (ja) * 2017-10-25 2021-09-24 ヤマハ株式会社 発音システム、制御装置及びこれらの制御方法、プログラム
JP7508836B2 (ja) 2020-03-31 2024-07-02 ブラザー工業株式会社 情報処理装置、情報処理方法、電子機器及び情報処理システム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008205896A (ja) * 2007-02-21 2008-09-04 Yamaha Corp 放収音装置
US9087515B2 (en) 2010-10-25 2015-07-21 Denso Corporation Determining navigation destination target in a situation of repeated speech recognition errors
US20150023481A1 (en) * 2013-07-19 2015-01-22 Richplay Information Co., Ltd. Method for personalizing voice assistant
JP2015022310A (ja) * 2013-07-19 2015-02-02 英奇達資訊股▲ふん▼有限公司 音声アシスタントパーソナライズの方法
US9363372B2 (en) * 2013-07-19 2016-06-07 Richplay Information Co., Ltd. Method for personalizing voice assistant
WO2016052164A1 (ja) * 2014-09-30 2016-04-07 シャープ株式会社 対話装置
JP2016071247A (ja) * 2014-09-30 2016-05-09 シャープ株式会社 対話装置
JP2016099479A (ja) * 2014-11-20 2016-05-30 アイシン・エィ・ダブリュ株式会社 音声制御システム、音声制御方法、及び音声制御プログラム
JP2021144238A (ja) * 2017-10-25 2021-09-24 ヤマハ株式会社 発音システム、制御装置及びこれらの制御方法、プログラム
US11526134B2 (en) 2017-10-25 2022-12-13 Yamaha Corporation Tempo setting device and control method thereof
JP7508836B2 (ja) 2020-03-31 2024-07-02 ブラザー工業株式会社 情報処理装置、情報処理方法、電子機器及び情報処理システム

Similar Documents

Publication Publication Date Title
US9025812B2 (en) Methods, systems, and products for gesture-activation
EP2930715B1 (en) Device control method and device management system
EP0653701B1 (en) Method and system for location dependent verbal command execution in a computer based control system
JP2017146437A (ja) 音声入力処理装置
JP3951705B2 (ja) 電子機器
JP6435068B2 (ja) 複数機器の機器管理システム、機器制御方法及び、プログラム
CN111627443B (zh) 电梯推荐方法、装置、设备及介质
JP2003131695A (ja) 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法
JP2007228520A (ja) リモートコントロール装置及びプログラム
CN114299939A (zh) 一种智能设备、智能家居的语音控制设备及控制方法
KR100423495B1 (ko) 음성인식에 의한 휴대용 기기의 동작제어 장치 및 방법
JPH05249989A (ja) 音声認識制御装置
CN110021296A (zh) 一种晾衣设备智能人机交互方法及***
JP2708566B2 (ja) 音声認識制御装置
JPH06259091A (ja) 音声認識装置
CN117672210A (zh) 语音控制方法、装置、存储介质及电子设备
CN115035889A (zh) 一种基于声音特征的离线语音控制训练方法及***
CN113129889A (zh) 语音控制方法及控制装置
JP2008003266A (ja) 行き先設定装置及び行き先設定方法
CN111028832A (zh) 麦克风静音模式控制方法、装置及存储介质和电子设备
KR20020033962A (ko) 장난감용 무선 음성인식 제어장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060127

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060127

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060214