JP2008014818A - 作動制御装置、プログラム - Google Patents

作動制御装置、プログラム Download PDF

Info

Publication number
JP2008014818A
JP2008014818A JP2006186796A JP2006186796A JP2008014818A JP 2008014818 A JP2008014818 A JP 2008014818A JP 2006186796 A JP2006186796 A JP 2006186796A JP 2006186796 A JP2006186796 A JP 2006186796A JP 2008014818 A JP2008014818 A JP 2008014818A
Authority
JP
Japan
Prior art keywords
unit
function
attribute
voice
shortcut button
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006186796A
Other languages
English (en)
Other versions
JP4736982B2 (ja
Inventor
Makoto Sakai
誠 坂井
Katsushi Asami
克志 浅見
Masahiko Tateishi
雅彦 立石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2006186796A priority Critical patent/JP4736982B2/ja
Publication of JP2008014818A publication Critical patent/JP2008014818A/ja
Application granted granted Critical
Publication of JP4736982B2 publication Critical patent/JP4736982B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Instructional Devices (AREA)
  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Traffic Control Systems (AREA)

Abstract

【課題】音声認識結果を上手く利用することによって、ユーザからの操作受付を簡易なものにする。
【解決手段】音声認識関連ユニット60の音声認識部62が、音声入力部61を介して入力された「話者の発した音声」を分析し、認識辞書66を用いて認識した結果を認識結果として出力する。属性決定部63は、その認識結果に対応する機能属性及び機能修飾属性を、属性情報データベースの対応関係を用いて決定する。操作受付画面決定部64は、その属性決定部63において決定された機能属性及び機能修飾属に対応する操作受付画面を、機器操作情報データベースの対応関係を用いて決定する。そしてショートカットボタン作成部65は、操作受付画面決定部64によって決定された操作受付画面に対応するショートカットボタンを作成する。このショートカットボタンは、制御部59によって表示部56に表示される。
【選択図】 図2

Description

本発明は、音声認識結果に基づく簡易な操作受付機能を有する作動制御装置に関する。
例えばナビゲーション装置における目的地設定を、話者によって入力された音声に基づいて簡易に実現したいという要望がある。
特許文献1に記載のナビゲーション装置においては、車室内で発話された会話を録音しておき、ボタン押下された時点で録音音声を認識し、その認識した会話内容に基づいて地点名称を抽出し、その地点名称を用いて目的地設定を行っている。
この手法によれば、会話の中で自然に出てきた地点名称を使用して目的地設定ができるため、ユーザは意識して音声認識装置へ向かって発話することなく目的地を設定でき、便利ではある。
特開2005−316022号公報
上記従来技術は、音声認識結果から地点名称を抽出する手法である。しかし、会話内容によっては地点名称が登場しないケースもある。そのようなケースにおいては、地点名称自体を抽出できず、結果として目的地設定ができない。
例えば、下記のようなユーザAとユーザBとの会話例を考える。
ユーザA:「おいしいものでも食べに行こうか?」
ユーザB:「そうだね、この前行ったラーメン屋なんてどう?」
ユーザA:「いいね」
この会話においては、地点名称そのものが登場していないため、従来技術の「地点名称を抽出する」という手法では対応できない。
一方、上述のラーメン屋をナビゲーション装置において目的地として設定する場合には、例えば次のように行う。上述の会話中に登場するラーメン屋へ過去に行った際にそのラーメン屋を目的地として設定した履歴が残っていれば、その履歴を元に探す手法がある。つまり、履歴があれば、ナビゲーション装置におけるメニュー選択で「目的地設定」→「履歴」と操作して、履歴一覧の中から該当するラーメン屋を探して目的地として指定することができる。
しかしながら、このような操作は面倒である。せっかく会話中にラーメン屋の話題が登場しているので、それを上手く利用して、もっと簡単に目的地設定ができるようになると便利である。
本発明は、このような問題に鑑みなされたものであり、音声認識結果を上手く利用することによって、ユーザからの操作受付を簡易なものにすることを目的とする。
本発明の作動制御装置によれば、音声認識部が、音声入力部を介して入力された「話者の発した音声」を分析し、音声認識に用いる比較対象パターンを記憶している認識辞書を用いて認識した結果を認識結果として出力する。ショートカットボタン作成部は、この音声認識部における前記認識結果に基づいて、通常複数の操作を行って指示する内容を一度の操作で指示するためのボタンであるショートカットボタンを作成する。表示制御部は、この作成されたショートカットボタンを画面表示する。そして、作動制御部は、受付部を介して前記画面表示されたショートカットボタンに対する操作を含む各種操作を受け付けた場合、受け付けた操作に応じて制御対象機器の作動を制御する。
第1の対応関係記憶手段は、機能属性及び機能修飾属性と単語との対応関係を記憶しており、ここで機能属性とは、単語から想定される制御対象機器の作動すべき機能を示す属性であり、機能修飾属性とは当該作動すべき機能を実現する際に利用される相対的に下位の機能を示す属性である。また、第2の対応関係記憶手段は、機能属性及び機能修飾属性と操作受付画面との対応関係を記憶している。
属性決定部は、音声認識部における前記認識結果に対応する機能属性及び機能修飾属性を、第1の対応関係記憶手段の対応関係を用いて決定する。操作受付画面決定部は、その属性決定部において決定された機能属性及び機能修飾属に対応する操作受付画面を、第2の対応関係記憶手段の対応関係を用いて決定する。そしてショートカットボタン作成部は、操作受付画面決定部によって決定された操作受付画面に対応するショートカットボタンを作成する。
このように音声認識結果を上手く利用してショートカットボタンを作成することによって、ユーザからの操作受付を簡易なものにすることができる。その効果に対する理解を容易にするため具体例を挙げて説明する。
例えば本作動制御装置の制御対象機器がカーナビゲーション装置であったとして、上述の「発明が解決しようとする課題」にて紹介したような会話がなされた場合を想定する。「ラーメン屋」という単語に対応して「検索」機能属性を対応付けておけば、ラーメン屋の探索が可能な操作受付画面(例えば施設検索画面)へ誘導するショートカットボタンを作成することができる。また、「この前」という単語に対して検索機能に際して「履歴」という機能修飾属性を対応付けておけば、「この前」と「ラーメン屋」という認識単語によって「履歴検索」が可能な操作受付画面へ誘導するショートカットボタンを作成することができる。
なお、作動制御装置の制御対象機器は、カーナビゲーション装置に限らず、種々の機器を採用できる。車載機器であってもよいし、そうでなくてもよい。ただし、カーナビゲーション装置を含む車載機器の場合には、運転者と助手席あるいは後部座席の乗員との間での会話を認識し、車載機器の作動に関する操作受付を行うためのショートカットボタンを作成することが非常に有効である。
ところで、上述の会話例からも分かるように、例えば目的地設定というナビゲーション装置の機能を前提にした会話をしているわけではなく、普通の会話中に登場した単語に基づいてショートカットボタンを作成している。つまり、そのような会話を常に音声認識していることで、ユーザにとって便利なショートカットボタンが作成されるのである。しかし、ユーザが常に音声認識されていることを望まない場合もあり得る。したがって、請求項2に示すように、受付部を介して音声認識を実行させる指示がなされている場合に限って、音声入力部から前記音声認識部へ音声が入力されるよう構成してもよい。
また、請求項3に示すように、ショートカットボタン作成部は、ボタンの意匠に機能名称または関連した絵や写真を付与してショートカットボタンを作成するようにしてもよい。このようにすれば、ショートカットボタンが意味する内容が分かりやすくなる。
また、請求項4に示すように、ショートカットボタン作成部は、作成したショートカットボタンを、ボタン作成時からの経過時間に従ってボタンのサイズ・位置・色の少なくとも1つを変更するようにしてもよい。このようにすれば、ユーザはショートカットボタンの作成された時期を直感的に把握し易くなる。
ところで、請求項6に記載のような、請求項1〜5の何れかに記載の作動制御装置における音声認識部、ショートカットボタン作成部、属性決定部及び操作受付画面決定部として機能させるためのプログラムを、作動制御装置が内蔵するコンピュータに実行させるようになっていてもよい。このようになっていれば、例えば、フレキシブルディスク、光磁気ディスク、CD−ROM、ハードディスク、ROM、RAM等のコンピュータが読みとり可能な記録媒体にプログラムを記録し、そのプログラムを必要に応じてコンピュータにロードして起動することにより作動制御装置として機能させることができる。
以下に本発明の実施形態を図面と共に説明する。
[構成の説明]
図1は、実施形態の車載システムの概略構成を示すブロック図である。
この車載システム50は、車両に搭載され、ナビゲーション機能や電話を含む外部との情報入出力機能を実行可能なシステムである。
(1)車載システム50の説明
この車載システム50は、車両の現在位置を検出する位置検出器51と、ユーザからの各種指示を入力するための操作スイッチ群52と、操作スイッチ群52と同様に各種指示を入力可能であって車載システム50とは別体となったリモートコントロール端末(以下、リモコンと称す)53aと、リモコン53aからの信号を入力するリモコンセンサ53bと、通信装置54と、地図データや各種の情報を記録した地図記憶媒体から地図データ等を入力する地図データ入力器55と、地図や各種情報の表示を行うための表示部56と、各種のガイド音声等を出力するための音声出力部57と、音声を入力して音声情報を出力するマイクロフォン58と、音声認識関連の処理を行う音声認識関連ユニット60と、上述した位置検出器51,操作スイッチ群52,リモコンセンサ53b,通信装置54,地図データ入力器55,マイクロフォン58,音声認識関連ユニット60からの入力に応じて各種処理を実行し、通信装置54,表示部56,音声出力部57,音声認識関連ユニット60を制御する制御部59とを備えている。
位置検出器51は、GPS(Global Positioning System)用の人工衛星からの送信電
波をGPSアンテナを介して受信し、車両の位置,方位,速度等を検出するGPS受信機51aと、車両に加えられる回転運動の大きさを検出するジャイロスコープ51bと、車両の前後方向の加速度等から走行した距離を検出するための距離センサ51cとを備えている。そして、これら各センサ等51a〜51cは、各々が性質の異なる誤差を有しているため、互いに補完しながら使用するように構成されている。
操作スイッチ群52は、表示部56の表示面と一体に構成されたタッチパネル及び表示部56の周囲に設けられたメカニカルなキースイッチ等から構成される。尚、タッチパネルと表示部56とは積層一体化されており、タッチパネルには、感圧方式,電磁誘導方式,静電容量方式,あるいはこれらを組み合わせた方式など各種の方式があるが、その何れを用いてもよい。
通信装置54は、設定された連絡先通信情報によって特定される連絡先との通信を行うためのものであり、例えば携帯電話機等の移動体通信機によって構成される。
地図データ入力器55は、図示しない地図データ記憶媒体(例えばハードディスクやDVD−ROM等)に記憶された各種データを入力するための装置である。地図データ記憶媒体には、地図データ(ノードデータ、リンクデータ、コストデータ、背景データ、道路データ、名称データ、マークデータ、交差点データ、施設のデータ等)、案内用の音声データ、音声認識データ等が記憶されている。なお、地図データ記憶媒体からこれらのデータを入力する代わりに、通信ネットワークを介してこれらのデータを入力するようになっていてもよい。
表示部56は、カラー表示装置であり、液晶ディスプレイ,有機ELディスプレイ,CRTなどがあるが、その何れを用いてもよい。表示部56の表示画面には、位置検出器51にて検出した車両の現在位置と地図データ入力器55より入力された地図データとから特定した現在地を示すマーク、目的地までの誘導経路、名称、目印、各種施設のマーク等の付加データとを重ねて表示することができる。また、施設のガイド等も表示できる。
音声出力部57は、地図データ入力器55より入力した施設のガイドや各種案内の音声を出力することができる。
マイクロフォン58は、使用者が音声を入力(発話)するとその入力した音声に基づく電気信号(音声信号)を制御部59に出力するものである。この入力された音声は、音声認識ユニット60にて所定される。
音声認識関連ユニット60に関しては、後述する。
制御部59は、CPU,ROM,RAM,I/O及びこれらの構成を接続するバスラインなどからなる周知のマイクロコンピュータを中心に構成されており、ROM及びRAMに記憶されたプログラムに基づいて各種処理を実行する。例えば、位置検出器51からの各検出信号に基づき座標及び進行方向の組として車両の現在位置を算出し、地図データ入力器55を介して読み込んだ現在位置付近の地図等を表示部56に表示する表示処理や、地図データ入力器55に格納された地点データと、操作スイッチ群52やリモコン53a等の操作に従って設定された目的地とに基づいて、現在位置から目的地までの最適な経路を算出し、その算出した経路を案内する経路案内処理を行う。
また、制御部59は、例えば表示部56に電話番号を受け付ける画面が表示されている状態で操作スイッチ群52等によって電話番号が入力され、その入力された電話番号の相手に電話をかける指示が操作スイッチ群52等によってなされた場合、通信装置54を介して電話をかける制御処理を実行する。
(2)音声認識関連ユニット60の説明
図2に示すように、音声認識関連ユニット60は、音声入力部61と、音声認識部62と、属性決定部63と、操作受付画面決定部64と、ショートカットボタン作成部65と、認識辞書66と、属性情報データベース67と、機器操作情報データベース68とを備えている。
音声入力部61は、話者の発した音声を入力するためのものであり、マイクロフォン58から入力された音声信号をデジタルデータに変換して音声認識部62へ出力する。なお、音声入力部61は、入力した音声の特徴量を分析するため、例えば数10ms程度の区間のフレーム信号を一定間隔で切り出し、その入力信号が音声の含まれている音声区間であるのか音声の含まれていない雑音区間であるのか判定する。マイクロフォンから入力される信号は、認識対象の音声だけでなく雑音も混在したものであるため、音声区間と雑音区間の判定を行なう。この判定方法としては従来から多くの手法が提案されており、例えば入力信号の短時間パワーを一定時間毎に抽出していき、所定の閾値以上の短時間パワーが一定以上継続したか否かによって音声区間であるか雑音区間であるかを判定する手法がよく採用されている。そして、音声区間であると判定された場合には、その入力信号が音声認識部63へ出力されることとなる。
認識辞書66は、音素単位の比較対象パターンを記憶している。音声認識部62は、音声入力部61を介して入力される音声信号に基づき、認識辞書66を用いて認識した結果(文字列)を認識結果として属性決定部63へ出力する。
属性情報データベース67は、機能属性及び機能修飾属性と単語との対応関係を記憶しているデータベースである。また、機器操作情報データベース68は、機能属性及び機能修飾属性と操作受付画面との対応関係を記憶している。これら2種類のデータベースについては、後に図面を参照して説明する。
属性決定部63は、音声認識部62における認識結果に対応する機能属性及び機能修飾属性を、属性情報データベース67の対応関係を用いて決定する。
操作受付画面決定部64は、その属性決定部63において決定された機能属性及び機能修飾属に対応する操作受付画面を、機器操作情報データベース68の対応関係を用いて決定する。
そしてショートカットボタン作成部65は、操作受付画面決定部64によって決定された操作受付画面に対応するショートカットボタンを作成する。このショートカットボタン作成部65によって作成されたショートカットボタンは、制御部59によって表示部56に表示される。例えば図6に示すようなショートカットボタンが表示される。
なお、図2に示すように、制御部59は音声入力部61を制御して、音声入力部61から音声認識部62へ音声信号が入力される状態と、入力されない状態とを切り替えることができるようにされている。この状態の切替は、ユーザが操作スイッチ群52等を介して指示できるようにされている。つまり、操作スイッチ群52等を介してユーザから音声認識を実行する旨の指示がなされた場合には、制御部59は音声入力部61を制御し、音声入力部61から音声認識部62へ音声信号が入力される状態にする。一方、操作スイッチ群52等を介してユーザから音声認識を実行しない旨の指示がなされた場合には、制御部59は音声入力部61を制御し、音声入力部61から音声認識部62へ音声信号が入力されない状態にする。
それではここで、属性情報データベース67及び機器操作情報データベース68の具体例について説明する。
(2a)属性情報データベース67について
属性情報データベース67の一例を図3に示す。ここでは、単語として、ラーメン・ラーメン屋??店・電話・予約・この前・いつもの・近くの・迂回を例示している。なお、「ラーメン屋??店」とは、特定の店舗名を指す。
これらの各単語に機能属性及び機能修飾属性が対応付けられている。
機能属性とは、例えば「検索する」「電話する」「ルート変更」など、単語から想定される制御対象機器の作動すべき機能を示す属性である。車載システム50のナビゲーション機能を前提とした場合には、上述した「検索する」や「ルート変更」などが「作動すべき機能を示す属性」として考えられ、また、電話を含む外部との情報入出力機能を前提とした場合には、「電話する」が「作動すべき機能を示す属性」として考えられる。
また、機能修飾属性とは当該作動すべき機能を実現する際に利用される相対的に下位の機能もしくは情報を示す属性である。例えばラーメンという単語に対して機能属性が「検索する」であった場合、検索機能の下位機能としてジャンル検索が考えられるため、機能修飾属性として「ジャンル=ラーメン」が対応付けられている。
また、特定の店舗名を指す「ラーメン屋○○店」のような単語に対しては、検索だけでなくその店舗に電話をかける機能を使うことも想定されるので、機能属性として「検索する」「電話する」が対応付けられている。そして、検索機能の下位機能としての施設検索や、電話をかける相手の特定のために機能修飾属性「施設=ラーメン屋○○店」が対応付けられている。
また、「この前」「いつもの」「近くの」という単語には、それぞれ機能修飾属性として、「検索情報=履歴(最新)」「検索情報=履歴(最頻出)」「検索情報=周辺」が対応付けられている。また、「迂回」という単語には、機能属性「ルート変更」が対応付けられると共に、機能修飾属性として「変更条件=迂回」が対応付けられている。
(2b)機器操作情報データベース68について
機器操作情報データベース68の一例を図4に示す。機能属性と機能修飾属性の組み合わせに対応して、操作受付画面が設定されている。操作受付画面とは、例えばナビゲーション機能における検索画面であったり、電話機能における電話をかけるための操作を受け付ける画面である。具体的に説明する。
機能属性が「検索する」で機能修飾属性が設定されてない場合には、操作受付画面は「検索画面」となる。検索機能の下位機能としてジャンル検索や周辺検索等が存在するが、ここでいう「検索画面」とは検索のトップ画面を指す。一方、機能属性が「検索する」で機能修飾属性が「ジャンル=○○○」である場合には、操作受付画面は「ジャンル=○○○と指定した検索画面」となる。また、機能属性が「検索する」で機能修飾属性が「検索情報=周辺」である場合には、操作受付画面は「検索情報=周辺と指定した検索画面」となり、同様に、機能属性が「検索する」で機能修飾属性が「検索情報=履歴(最新)」である場合には、操作受付画面は「検索情報=履歴(最新)と指定した検索画面」となる。
また、機能属性が「電話する」で機能修飾属性が設定されてない場合には、操作受付画面は「電話番号の入力を待ち受ける画面」となる。また、機能属性が「電話する」で機能修飾属性が「施設=×××(←これは電話番号)」である場合には、操作受付画面は「電話番号×××を電話のかけ先と指定して、電話をかける指示を待ち受ける画面」となる。
ここまでで車載システムの概略構成を説明したが、車載システムの各部と特許請求の範囲における用語との対応関係を説明する。音声入力部61、音声認識部62、属性決定部63、操作受付画面決定部64、ショートカットボタン作成部65、認識辞書66は、それぞれ同名の音声入力部、音声認識部、属性決定部、操作受付画面決定部、ショートカットボタン作成部、認識辞書に相当する。また、制御部59が表示制御部及び作動制御部に相当し、操作スイッチ群55が受付部に相当する。属性情報データベース67が第1の対応関係記憶手段に相当し、機器操作情報データベース68が第2の対応関係記憶手段に相当する。
[作動の説明]
次に、車載システム50の作動のうち、車両の乗員同士の会話あるいは独り言を音声認識した結果に基づいてショートカットボタンを表示部56へ表示させる制御処理について図5を参照して説明する。この制御処理は、制御部59及び音声認識関連ユニット60が実行する。
なお、この図5の処理が実行される前提について説明しておく。上述したように、ユーザが操作スイッチ群52等を介して指示することで、音声入力部61から音声認識部62へ音声信号が入力される状態と入力されない状態とを切り替えることができるようにされている。したがって、操作スイッチ群52等を介してユーザから音声認識を実行しない旨の指示がなされた場合には、制御部59は音声入力部61を制御し、音声入力部61から音声認識部62へ音声信号が入力されない状態にする。したがって、図5に示す処理は実行されない。一方、操作スイッチ群52等を介してユーザから音声認識を実行する旨の指示がなされた場合には、制御部59は音声入力部61を制御し、音声入力部61から音声認識部62へ音声信号が入力される状態にする。図5に示す処理は、このような状態において実行されるものである。
最初のステップS10では、音声入力部61が、マイクロフォン58より、会話音声(ここでは、乗員同士の会話だけでなく、例えば運転者の独り言も含むものとする。)を入力する。そして、その入力された音声信号をデジタルデータに変換して音声認識部62へ出力する。
S20では、音声認識部62が、入力された音声信号に基づき単語列に分解する。そしてS30では、各単語について属性情報を抽出する。
続くS40では、S30で抽出した属性情報の中に機能属性があるか否か判断する。この判断は、図3に示す属性情報データベース67に基づいて行う。機能属性がなければ(S40:NO)、S10へ戻り、機能属性があれば(S40:YES)、S50へ移行する。
S50では、機能属性が複数あるか否か判断する。機能属性が複数あれば(S50:YES)、S60へ移行して、優先順位1位となる機能属性を決定する。ここで、機能の優先順位の決定は、例えば次のような手法によって行うことが考えられる。(1)多数決、(2)入力語の品詞による順位付け(例えば動詞に付随する機能属性を優先するなど)、(3)予め決められた優先順位表に従う。
S60にて優先順位1位となる機能属性を決定したら、S70へ移行する。なお、S50にて否定判断、つまり機能属性が1つの場合には(S50:NO)、S60を処理することなくS70へ移行する。
S70では、S30で属性情報の決定された単語の中から、機能属性に対応する機能修飾属性の収集を行う。この収集も、図3に示す属性情報データベース67に基づいて行う。
そして、S80では、決定された機能属性と機能修飾属性とから操作受付画面を決定する。この操作受付画面の決定は、図4に示す機器操作情報データベース68に基づいて行う。
操作受付画面が決定されたら、S90へ移行して、ショートカットボタンを作成する。
S10〜S90までは音声認識関連ユニット60において実行される処理である。S90で作成されたショートカットボタンに関するデータは制御部59へ出力され、制御部59では、対応する操作受付画面をショートカットボタンにリンクさせる(S100)。そして、表示部56へショートカットボタンを表示する(S110)。例えば、図6(a)に示すようにショートカットボタンを表示する。
このようにショートカットボタンが表示された後は、ユーザがそのショートカットボタンを押下することで、いわゆるショートカット機能が発揮され、通常複数の操作を行って初めて表示される操作受付画面へ、一度の操作で移行することができる。そして、その操作受付画面において受け付けた操作(当然ながら操作スイッチ群52等を介してユーザから受け付ける)に応じて、検索機能や電話番号の受付などを行う。これらの制御は制御部59が実行する。
[効果等の説明]
本実施形態の車載システム50においては、音声認識関連ユニット60の音声認識部62が、音声入力部61を介して入力された「話者の発した音声」を分析し、認識辞書66を用いて認識した結果を認識結果として出力する。属性決定部63は、その認識結果に対応する機能属性及び機能修飾属性を、属性情報データベース67の対応関係を用いて決定する。操作受付画面決定部64は、その属性決定部63において決定された機能属性及び機能修飾属に対応する操作受付画面を、機器操作情報データベース68の対応関係を用いて決定する。そしてショートカットボタン作成部65は、操作受付画面決定部64によって決定された操作受付画面に対応するショートカットボタンを作成する。このショートカットボタンは、制御部59によって表示部56に表示される。
このように音声認識結果を上手く利用してショートカットボタンを作成することによって、ユーザからの操作受付を簡易なものにすることができる。
この点に関して、図6〜図8を参照してさらに説明する。
例えば、下記のようなユーザAとユーザBとの会話例を考える。
ユーザA:「おいしいものでも食べに行こうか?」
ユーザB:「そうだね、ラーメン屋なんてどう?」
ユーザA:「いいね」
このような会話中には「ラーメン屋」という機能属性を持った単語が含まれている。したがって、図3に示す属性情報データベース67に基づき、「ラーメン屋」に対して「検索する」という機能属性と「ジャンル=ラーメン」という機能修飾属性を決定する。これらの機能属性と機能修飾属性を元に、図4に示す機器操作情報データベース68に基づいて操作受付画面を決定すると、操作受付画面は「ジャンル=ラーメンと指定した検索画面」となる。
例えば図6(a)に示すように、車載システム50において表示部56に地図表示を行っている状態で上記のような会話から操作受付画面を決定した場合には、上記操作受付画面へのショートカットが可能なショートカットボタンを表示部56に表示されている地図上に重ねて表示する。なお、図6(a)の例では、ショートカットボタンに「ラーメン」という「機能を示す名称」を付記してある。この場合は、ジャンル=ラーメンと指定した検索機能を実行可能な操作受付画面へのショートカットボタンなので、「ラーメン」は機能を示す名称として考える。このショートカットボタンをユーザが操作すれば、その一度の操作だけで、検索機能のうちのジャンル指定検索であり、且つジャンル=ラーメンと指定した検索機能を実行可能な操作受付画面へショートカットすることができる。
なお、ショートカットボタンに関しては、図6(a)に示すように、「ラーメン」という文字を付記してもよいし、何らかのお知らせがあることを示す代表ボタン的な意味合いで「お知らせ」という文字を付記してもよいし、ショートカットボタンであることを示す「SC」という文字を付記してもよい。
もちろん、このショートカットボタンの意匠に関しては、上述のような機能名称を付記するのではなく、関連した絵や写真を付与することも可能である。例えば文字を表示する代わりにラーメンを示すデザイン画を表記しても良い。
また、機能修飾属性に関してもユーザが理解できるような表記にしてもよい。その具体例を、図7を参照して説明する。
例えば「デパートへ行こうか?」という基本的な発話に対して、「近くのデパートへ行こうか?」「いつものデパートへ行こうか?」「○○(地名)のデパートへ行こうか?」といった3つの応用形の発話が考えられる。図7は、それら4つの発話に対する属性と、対応する操作受付画面を示している。機能属性は何れも「検索する」であるが、機能修飾属性がそれぞれの場合で異なる。
図7の4段目(最下段)に示す例が、「デパートへ行こうか?」という基本的な発話の場合であり、機能修飾属性は「ジャンル:デパート」であるため、施設検索であり、且つ施設として「デパート」を指定した状態の操作受付画面が対応する。
図7の1段目(最上段)に示す例は、「近くのデパートへ行こうか?」という発話の場合である。図3に示すように「近くの」に対して機能修飾属性「検索情報=周辺」が設定されているので、周辺検索の操作受付画面が対応する。
図7の2段目に示す例が、「いつものデパートへ行こうか?」という発話の場合である。図3に示すように「いつもの」に対して機能修飾属性「検索情報=履歴(最頻出)」が設定されているので、頻出度順に表示した履歴検索の操作受付画面が対応する。
図7の3段目に示す例が、「○○のデパートへ行こうか?」という発話の場合であり、機能修飾属性は「エリア指定=○○」であるため、エリアを○○として指定した施設検索の操作受付画面が対応する。
これらに関しては、図7に示すように、何れの場合も「デパート」という文字を付記したショートカットボタンを表示するようにしてもよいが、機能修飾属性に応じて、例えば「周辺のデパート」とか「履歴のデパート」といった文字を付記するような態様でもよい。このようにすれば、ショートカットボタンが意味する内容が分かりやすくなる。
図8は、図7に示す例の場合に、ショートカットボタンを用いることでどの程度の操作負担が軽減されるかを示すものである。
例えば上述した「○○のデパートへ行こうか?」という場合に対応する「エリアを○○として指定した施設検索の操作受付画面」について説明する。通常操作であれば、「目的地設定」→「施設」→「その他」→「デパート」→「○○(←エリア指定操作)」という5回の操作が必要となる。
また、「近くのデパートへ行こうか?」という場合に対応する「周辺検索の操作受付画面」について説明する。通常操作であれば、「目的地設定」→「周辺施設」→「デパート」→「現在地(←現在地からの距離を基準とする指定)」という4回の操作が必要となる。
また、「いつものデパートへ行こうか?」という場合に対応する「履歴検索の操作受付画面」について説明する。通常操作であれば、「目的地設定」→「履歴施設」という2回の操作が必要となる。
これら何れの場合であっても、本実施形態のようにショートカットボタンを表示すれば、ユーザはそのショートカットボタンを1回操作するだけで同じ操作受付画面へショートカットできる。
[別実施形態]
(1)上記実施形態では、図2に示すように、認識辞書66と属性情報データベース67を別個に構成するように説明したが、図9に示すように、それらを合体させた認識辞書+属性情報データベース66aとして構成してもよい。
その場合には、図2に示す属性決定部63の機能も音声認識部62に含めるようにすればよい。つまり、図9に示す音声認識部62aは、音声認識と共に属性も決定するよう構成されている。
(2)ショートカットボタンに関しては次のような工夫を施しても良い。つまり、ボタン作成時からの経過時間に従ってショートカットボタンのサイズ・位置・色の少なくとも1つを変更するのである。このようにすれば、ユーザはショートカットボタンの作成された時期を直感的に把握し易くなる。例えば経過時間と共にショートカットボタンのサイズが小さくなるようにした場合、ショートカットボタンのサイズが小さくなっていることを認識したユーザが、あえてそのショートカットボタンを操作しないという選択も可能である。つまり、少し前に会話した内容に応じて作成されたショートカットボタンであれば、現在のユーザの考えとして、そのようなショートカットボタンの操作は不要であると考えるかもしれない。したがって、主に、ショートカットボタン操作の要不要をユーザが検討するのに有効である。
(3)上記実施形態ではショートカットボタンは1個だけ表示するようにしたが、複数のショートカットボタンを表示するようにしてもよい。つまり、ショートカットボタンを表示した後の会話に基づいて、新たなショートカットボタンを表示することも考えられる。その際に、古いショートカットボタンを削除して新しいショートカットボタンのみ表示する手法もあるが、例えば最新の所定個(例えば2個とか3個)のショートカットボタンを全て表示する手法も考えられる。
その場合には、上記(2)で説明したような経過時間によってショートカットボタンのサイズ・位置・色の少なくとも1つを変更すれば、区別が付きやすくなる。また、作成順番によってショートカットボタンのサイズ・位置・色の少なくとも1つを変更することも考えられる。このようにすれば、ユーザとしては、どのタイミングでの会話に対応するショートカットボタンであるかが判別し易くなり、便利である。
(4)上記実施形態においては車載システム50への適用を説明した。上述の例ではナビゲーション機能や、電話を含む外部との情報入出力機能を実行可能なシステムの例を挙げたが、他の車載機器を制御対象機器として、その作動制御をする際の操作受付画面を表示するような適用も可能である。例えばカーエアコンやカーオーディオ、その他の車載機器である。
また、適用先は車載システムには限らない。例えば車載ではないナビゲーション装置や電話装置であっても同様に適用可能である。また、室内にあるエアコンやオーディオ装置であっても適用可能である。さらに、例えば街角に設定した各種検索装置などにおいても、同様に適用可能である。例えば、そのような検索装置の前で使用者達が自然と行った会話に基づいてショートカットボタンを表示すれば、ユーザは簡易な操作で所望の操作受付画面を使用することができる。
ただし、車載システムの場合には、マイクロフォンから入力される音声が車両の乗員に(ほぼ)限定されるため、作成・表示したショートカットボタンが、乗員の要望に沿ったものとなる可能性が高く、非常に有効である。
実施形態の車載システムの概略構成を示すブロック図である。 主に、音声認識関連ユニットの構成を機能的に示したブロック図である。 属性情報データベースの一例を示す説明図である。 機器操作情報データベースの一例を示す説明図である。 車両の乗員同士の会話あるいは独り言を音声認識した結果に基づいてショートカットボタンを表示部へ表示させる制御処理を示すフローチャートである。 ショートカットボタンを作成することによって、ユーザからの操作受付を簡易なものにすることができたことを示すための説明図である。 ショートカットボタンを作成することによって、ユーザからの操作受付を簡易なものにすることができたことを示すための説明図である。 ショートカットボタンを作成することによって、ユーザからの操作受付を簡易なものにすることができたことを示すための説明図である。 別実施形態の車載システムの概略構成を示すブロック図である。
符号の説明
50…車載システム、51…位置検出器、51a…GPS受信機、51b…ジャイロスコープ、51c…距離センサ、52…操作スイッチ群、53a…リモコン、53b…リモコンセンサ、54…通信装置、55…操作スイッチ群、55…地図データ入力器、56…表示部、57…音声出力部、58…マイクロフォン、59…制御部、60…音声認識ユニット、60…音声認識関連ユニット、61…音声入力部、62…音声認識部、62a…音声認識部、63…属性決定部、64…操作受付画面決定部、65…ショートカットボタン作成部、66…認識辞書、66a…認識辞書+属性情報データベース、67…属性情報データベース、68…機器操作情報データベース。

Claims (6)

  1. 話者の発した音声を入力する音声入力部と、
    音声認識に用いる比較対象パターンを記憶している認識辞書と、
    前記音声入力部を介して入力された音声を分析し、前記認識辞書を用いて認識した結果を認識結果として出力する音声認識部と、
    前記音声認識部における前記認識結果に基づいて、通常複数の操作を行って指示する内容を一度の操作で指示するためのボタンであるショートカットボタンを作成するショートカットボタン作成部と、
    前記ショートカットボタン作成部によって作成されたショートカットボタンを画面表示する表示制御部と、
    各種操作の入力を受け付ける受付部と、
    その受付部を介して前記画面表示されたショートカットボタンに対する操作を含む各種操作を受け付けた場合、受け付けた操作に応じて制御対象機器の作動を制御する作動制御部と、
    機能属性及び機能修飾属性と単語との対応関係を記憶しておく記憶手段であり、前記機能属性とは、前記単語から想定される前記制御対象機器の作動すべき機能を示す属性であり、前記機能修飾属性とは当該作動すべき機能を実現する際に利用される相対的に下位の機能を示す属性である、第1の対応関係記憶手段と、
    前記機能属性及び機能修飾属性と操作受付画面との対応関係を記憶しておく記憶手段である第2の対応関係記憶手段と、
    前記音声認識部における前記認識結果に対応する機能属性及び機能修飾属性を、前記第1の対応関係記憶手段の対応関係を用いて決定する属性決定部と、
    その属性決定部において決定された機能属性及び機能修飾属に対応する操作受付画面を、前記第2の対応関係記憶手段の対応関係を用いて決定する操作受付画面決定部と、
    を備え、
    前記ショートカットボタン作成部は、前記操作受付画面決定部によって決定された操作受付画面に対応するショートカットボタンを作成することを特徴とする作動制御装置。
  2. 請求項1に記載の作動制御装置において、
    前記受付部は、前記音声認識部における音声認識を実行させるか否かの指示を受付可能であり、
    前記受付部を介して前記音声認識を実行させる指示がなされている場合に限って、前記音声入力部から前記音声認識部へ音声が入力されるよう構成されていること
    を特徴とする作動制御装置。
  3. 請求項1または2に記載の作動制御装置において、
    前記ショートカットボタン作成部は、ボタンの意匠に機能名称または関連した絵や写真を付与してショートカットボタンを作成すること
    を特徴とする作動制御装置。
  4. 請求項1〜3の何れか一項に記載の作動制御装置において、
    前記ショートカットボタン作成部は、作成したショートカットボタンを、ボタン作成時からの経過時間に従ってボタンのサイズ・位置・色の少なくとも1つを変更すること
    を特徴とする作動制御装置。
  5. 請求項1〜4の何れかに記載の作動制御装置であって、
    前記制御対象機器はカーナビゲーション装置を含む車載機器であることを特徴とする作動制御装置。
  6. コンピュータを、請求項1〜5の何れかに記載の作動制御装置における音声認識部、ショートカットボタン作成部、属性決定部、操作受付画面決定部として機能させるためのプログラム。
JP2006186796A 2006-07-06 2006-07-06 作動制御装置、プログラム Expired - Fee Related JP4736982B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006186796A JP4736982B2 (ja) 2006-07-06 2006-07-06 作動制御装置、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006186796A JP4736982B2 (ja) 2006-07-06 2006-07-06 作動制御装置、プログラム

Publications (2)

Publication Number Publication Date
JP2008014818A true JP2008014818A (ja) 2008-01-24
JP4736982B2 JP4736982B2 (ja) 2011-07-27

Family

ID=39071970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006186796A Expired - Fee Related JP4736982B2 (ja) 2006-07-06 2006-07-06 作動制御装置、プログラム

Country Status (1)

Country Link
JP (1) JP4736982B2 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010176423A (ja) * 2009-01-29 2010-08-12 Pioneer Electronic Corp 施設検索装置、施設検索方法、施設検索プログラムおよび記録媒体
JP2010205130A (ja) * 2009-03-05 2010-09-16 Denso Corp 制御装置
JP2011070267A (ja) * 2009-09-24 2011-04-07 Casio Computer Co Ltd 画像表示装置及び方法並びにプログラム
US8478601B2 (en) 2009-02-03 2013-07-02 Denso Corporation Voice recognition apparatus, method for recognizing voice, and navigation apparatus having the same
WO2014188512A1 (ja) * 2013-05-21 2014-11-27 三菱電機株式会社 音声認識装置、認識結果表示装置および表示方法
JP5705312B2 (ja) * 2011-05-20 2015-04-22 三菱電機株式会社 情報機器
US9269351B2 (en) 2012-07-03 2016-02-23 Mitsubishi Electric Corporation Voice recognition device
JP5921722B2 (ja) * 2013-01-09 2016-05-24 三菱電機株式会社 音声認識装置および表示方法
US9864577B2 (en) 2014-02-18 2018-01-09 Mitsubishi Electric Corporation Voice recognition device and display method
WO2019124142A1 (ja) * 2017-12-18 2019-06-27 株式会社Jvcケンウッド ナビゲーション装置およびナビゲーション方法、ならびにコンピュータプログラム
JP2019139701A (ja) * 2018-02-15 2019-08-22 京セラドキュメントソリューションズ株式会社 電子機器
US10446155B2 (en) 2016-02-26 2019-10-15 Mitsubishi Electric Corporation Voice recognition device
US10475448B2 (en) 2014-09-30 2019-11-12 Mitsubishi Electric Corporation Speech recognition system
CN111857636A (zh) * 2019-04-24 2020-10-30 本田技研工业株式会社 声音操作***及装置、声音操作控制方法和记录介质
JP2021076604A (ja) * 2019-11-08 2021-05-20 モビリティー、アジア、スマート、テクノロジー、カンパニー、リミテッドMobility Asia Smart Technology Co. Ltd. ナビゲーションに用いられる方法、装置、デバイス、及びコンピュータが読み取り可能な記憶媒体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09311626A (ja) * 1996-05-21 1997-12-02 Alpine Electron Inc 画像表示方法
JP2001216129A (ja) * 2000-02-02 2001-08-10 Denso Corp コマンド入力装置
JP2002318597A (ja) * 2001-02-15 2002-10-31 Alpine Electronics Inc 音声入力案内方法及び装置
JP2003167600A (ja) * 2001-12-04 2003-06-13 Canon Inc 音声認識装置及び方法、ページ記述言語表示装置及びその制御方法、並びにコンピュータ・プログラム
JP2005316022A (ja) * 2004-04-27 2005-11-10 Aisin Aw Co Ltd ナビゲーション装置及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09311626A (ja) * 1996-05-21 1997-12-02 Alpine Electron Inc 画像表示方法
JP2001216129A (ja) * 2000-02-02 2001-08-10 Denso Corp コマンド入力装置
JP2002318597A (ja) * 2001-02-15 2002-10-31 Alpine Electronics Inc 音声入力案内方法及び装置
JP2003167600A (ja) * 2001-12-04 2003-06-13 Canon Inc 音声認識装置及び方法、ページ記述言語表示装置及びその制御方法、並びにコンピュータ・プログラム
JP2005316022A (ja) * 2004-04-27 2005-11-10 Aisin Aw Co Ltd ナビゲーション装置及びプログラム

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010176423A (ja) * 2009-01-29 2010-08-12 Pioneer Electronic Corp 施設検索装置、施設検索方法、施設検索プログラムおよび記録媒体
US8478601B2 (en) 2009-02-03 2013-07-02 Denso Corporation Voice recognition apparatus, method for recognizing voice, and navigation apparatus having the same
JP2010205130A (ja) * 2009-03-05 2010-09-16 Denso Corp 制御装置
JP2011070267A (ja) * 2009-09-24 2011-04-07 Casio Computer Co Ltd 画像表示装置及び方法並びにプログラム
US8793129B2 (en) 2009-09-24 2014-07-29 Casio Computer Co., Ltd. Image display device for identifying keywords from a voice of a viewer and displaying image and keyword
JP5705312B2 (ja) * 2011-05-20 2015-04-22 三菱電機株式会社 情報機器
US9269351B2 (en) 2012-07-03 2016-02-23 Mitsubishi Electric Corporation Voice recognition device
US9639322B2 (en) 2013-01-09 2017-05-02 Mitsubishi Electric Corporation Voice recognition device and display method
JP5921722B2 (ja) * 2013-01-09 2016-05-24 三菱電機株式会社 音声認識装置および表示方法
WO2014188512A1 (ja) * 2013-05-21 2014-11-27 三菱電機株式会社 音声認識装置、認識結果表示装置および表示方法
CN105246743B (zh) * 2013-05-21 2017-03-29 三菱电机株式会社 语音识别装置、识别结果显示装置及显示方法
JP5762660B2 (ja) * 2013-05-21 2015-08-12 三菱電機株式会社 音声認識装置、認識結果表示装置および表示方法
US9767799B2 (en) 2013-05-21 2017-09-19 Mitsubishi Electric Corporation Voice recognition system and recognition result display apparatus
CN105246743A (zh) * 2013-05-21 2016-01-13 三菱电机株式会社 语音识别装置、识别结果显示装置及显示方法
US9864577B2 (en) 2014-02-18 2018-01-09 Mitsubishi Electric Corporation Voice recognition device and display method
US10475448B2 (en) 2014-09-30 2019-11-12 Mitsubishi Electric Corporation Speech recognition system
US10446155B2 (en) 2016-02-26 2019-10-15 Mitsubishi Electric Corporation Voice recognition device
WO2019124142A1 (ja) * 2017-12-18 2019-06-27 株式会社Jvcケンウッド ナビゲーション装置およびナビゲーション方法、ならびにコンピュータプログラム
JP2019139701A (ja) * 2018-02-15 2019-08-22 京セラドキュメントソリューションズ株式会社 電子機器
JP7069795B2 (ja) 2018-02-15 2022-05-18 京セラドキュメントソリューションズ株式会社 電子機器
CN111857636A (zh) * 2019-04-24 2020-10-30 本田技研工业株式会社 声音操作***及装置、声音操作控制方法和记录介质
JP2021076604A (ja) * 2019-11-08 2021-05-20 モビリティー、アジア、スマート、テクノロジー、カンパニー、リミテッドMobility Asia Smart Technology Co. Ltd. ナビゲーションに用いられる方法、装置、デバイス、及びコンピュータが読み取り可能な記憶媒体
JP7142074B2 (ja) 2019-11-08 2022-09-26 モビリティー、アジア、スマート、テクノロジー、カンパニー、リミテッド ナビゲーションに用いられる方法、装置、デバイス、及びコンピュータが読み取り可能な記憶媒体

Also Published As

Publication number Publication date
JP4736982B2 (ja) 2011-07-27

Similar Documents

Publication Publication Date Title
JP4736982B2 (ja) 作動制御装置、プログラム
JP5463922B2 (ja) 車載機
US8200429B2 (en) Vehicle navigation apparatus
US20130080056A1 (en) Information Terminal, Server Device, Searching System, and Searching Method Thereof
JP2007052397A (ja) 操作装置
JP2007017731A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
JP4466379B2 (ja) 車載音声認識装置
US20100229116A1 (en) Control aparatus
JP5007064B2 (ja) ナビゲーション装置
JP2013101535A (ja) 情報検索装置および情報検索方法
JP4933196B2 (ja) 車載情報端末
JP2010039099A (ja) 音声認識および車載装置
JP4237026B2 (ja) 車載用ナビゲーション装置およびその装置への入力方法
JP2000338993A (ja) 音声認識装置、その装置を用いたナビゲーションシステム
JP2009270960A (ja) ナビゲーション装置
JP3705220B2 (ja) ナビゲーション装置、画像表示方法及び画像表示プログラム
JP2007065206A (ja) 施設検索装置
JP2000122685A (ja) ナビゲーションシステム
US20150192425A1 (en) Facility search apparatus and facility search method
JP4085326B2 (ja) 車両用ナビゲーション装置
JP3679033B2 (ja) ナビゲーション装置
JP3770083B2 (ja) コマンド入力装置
JPH11231889A (ja) 音声認識装置
JP2011080824A (ja) ナビゲーション装置
JP2005128791A (ja) 表示装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110418

R151 Written notification of patent or utility model registration

Ref document number: 4736982

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees