JP2016133378A

JP2016133378A - カーナビゲーション装置

Info

Publication number: JP2016133378A
Application number: JP2015007756A
Authority: JP
Inventors: 鈴木　竜一; Ryuichi Suzuki; 竜一鈴木
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 2015-01-19
Filing date: 2015-01-19
Publication date: 2016-07-25

Abstract

【課題】自動車が盗難されてしまったとしても、カーナビゲーション装置の操作において、所有者の個人情報を特定しうるコマンドが実行されないようにし、これにより個人情報が盗まれないようにする。
【解決手段】本発明に係るカーナビゲーション装置２０は、入力された第１の音声データに対応するコマンドが、所有者の個人情報を特定可能な機能に関係するか否かを判定する第１の判定部１２１と、前記第１の音声データと、予め登録された第２の音声データとを照合して、両者の一致、不一致を判定する第２の判定部１４１と、を有し、前記コマンドが、所有者の個人情報を特定可能な機能に関係する場合であって、第２の判定部１４１における照合の結果、第１の音声データと、第２の音声データが不一致の場合は、前記コマンドを実行しないことを特徴とする。
【選択図】図１

Description

本発明は、個人情報が盗まれないようにすることが可能なカーナビゲーション装置に関する。

近年、自動車の盗難が増えてきており、盗難防止のセキュリティ機能に音声認識が利用されるようになってきている。特許文献１では、車両に設けた警報装置の誤動作を防止する目的に音声認識を利用し、予め所有者が登録した音声データを記憶しておき、その登録音声データとマイクロホンから入力した音声データとを照合して、警報装置を制御するという装置が開示されている。特許文献２では、キーの紛失や盗難によるセキュリティ向上のため、ドアロックなどの解除命令を予め音声データで登録しておき、音声データの入力があった場合は当該音声データが解除命令と一致するかが判断され、一致する場合はドアロックが解除される装置が開示されている。しかし、これらの場合、キーだけでなく自動車ごと盗難されてしまった場合は、音声データ入力の必要性が失われ、セキュリティの有効性に欠けることになる。

特開２００９−２５９８２号公報特開平７−４４１８９号公報

カーナビゲーション装置には、自宅の位置や自宅の電話番号、その他所有者個人を特定するような情報が含まれていることが多い。万が一、自動車が盗難されて、カーナビゲーション装置を操作され、所有者個人を特定する情報を簡単に見ることができてしまうと、自動車の盗難だけでは済まされない事態にまで陥りかねない。

本発明は、上記事情を考慮してなされたものであり、その目的は、万が一、カーナビゲーション装置を備える自動車が盗難されてしまったとしても、カーナビゲーション装置の操作において、所有者の個人情報を特定しうるコマンドが実行されないようにし、これにより個人情報が盗まれないようにすることが可能なカーナビゲーション装置を提供することにある。

本発明は、カーナビゲーション装置の操作により、所有者個人を特定するような情報を見ることができてしまう操作については、話者認識機能により、登録した話者と特定されなければ、カーナビゲーション装置の機能を実行することができないガードを設けることで、被害を最小限に抑えることができる構成となっている。

請求項１に記載する発明に係るカーナビゲーション装置は、入力された第１の音声データに対応するコマンドが、所有者の個人情報を特定可能な機能に関係するか否かを判定する第１の判定部（１２１）と、第１の音声データと、予め登録された第２の音声データとを照合して、両者の一致、不一致を判定する第２の判定部（１４１）と、を有する。コマンドが、所有者の個人情報を特定可能な機能に関係する場合であって、第２の判定部における照合の結果、第１の音声データと、第２の音声データが不一致の場合は、当該コマンドを実行しないことを特徴とする。

この構成によれば、例えば車両の盗難者がカーナビゲーション装置を操作した場合であっても、所有者の個人情報を特定可能な機能に関係するコマンドが実行されないため、所有者の個人情報の漏洩を回避することができる。

請求項２に記載する発明に係るカーナビゲーション装置は、コマンドを手入力により入力可能な第１の入力部（２３、２６）と、音声データを入力可能な第２の入力部（１５）と、前記第１の入力部から入力された前記コマンドが、所有者の個人情報を特定可能な機能に関係するか否かを判定する第１の判定部（１２１）と、入力された音声データと予め登録された第２の音声データを照合して、両者の一致、不一致を判定する第２の判定部（１４１）と、を有する。第１の判定部において、第１の入力部から入力されたコマンドが、所有者の個人情報を特定可能な機能に関係すると判定された場合は、第１の音声データを前記第２の入力部に入力する処理と、第２の判定部において、第１の音声データと、第２の音声データを照合する処理と、を行い、第２の判定部における照合の結果、第１の音声データと、第２の音声データが不一致の場合は、当該コマンドを実行しないことを特徴とする。

この構成によれば、例えば車両の盗難者がカーナビゲーション装置を操作した場合であっても、所有者の個人情報を特定可能な機能に関係するコマンドが実行されないため、所有者の個人情報が漏洩することを回避することができる。

実施形態に係るカーナビゲーション装置の概略構成の一例を示すブロック図である。実施形態に係る音声認識部、音声認識制御部、話者認識部の概略構成の一例を示すブロック図である。実施形態に係る話者認識処理を含む一連の操作を音声操作で実行する場合の一例を示すフローチャートである。実施形態に係る話者認識処理を含む一連の操作を手動操作で実行する場合の一例を示すフローチャートである。実施形態に係る話者認識処理のＯＮ／ＯＦＦ切替処理を実行する場合の一例を示すフローチャートである。実施形態において、音声操作で「自宅に帰る」コマンドを実行する場合の動作例を示す図である。実施形態において、手動操作で「自宅を目的地に設定する」場合の処理動作例を示す図である。実施形態において、話者認識機能のＯＮ／ＯＦＦ切替処理の処理動作例を示す図である。実施形態における話者認識機能適用の処理動作例を示す図である。

以下、本発明を具体化した一実施形態について、図面を参照しながら説明する。図１は実施形態に係る話者認識機能を持たせたカーナビゲーション装置２０の概略構成を示すブロック図である。カーナビゲーション装置２０は、例えば車両に搭載され、目的地までの経路案内に用いられる、いわゆるカーナビゲーションシステムである。カーナビゲーション装置２０は、制御回路２８を備えている。カーナビゲーション装置２０は、さらに、位置検出器２１、データ入力器２２、操作スイッチ群２３、通信装置２４、外部メモリ２５、表示装置２６及びリモコンセンサ２７を有しており、これらは制御回路２８に接続されている。カーナビゲーション装置２０は、さらに、音声認識ユニット１０を有しており、音声認識ユニット１０は制御回路２８に接続されている。カーナビゲーション装置２０は、さらに、スピーカ１４、マイクロホン１５、及びプッシュ・トゥ・トーク(PTT: Push to Talk）スイッチ１６（以下、ＰＴＴスイッチ１６と称する）を有しており、これらは音声認識ユニット１０に接続されている。音声認識ユニット１０、及び制御回路２８は例えば通常のコンピュータとして構成されており、内部には、周知のＣＰＵ、ＲＯＭ、ＲＡＭ、Ｉ／Ｏ及びこれらの構成を接続するバスライン等が備えられている。ナビゲーション装置２０の各構成要素は必ずしも物理的に別体として構成される必要はなく、例えば単一のＣＰＵによって動作する種々のソフトウェアとして構成してもよい。

位置検出器２１は、ジャイロスコープ２１ａ、距離センサ２１ｂ、及びＧＰＳ受信機２１ｃを備えている。ジャイロスコープ２１ａは、物体の角度や角速度を検出することにより自動車の回転方向や向きを計算する計測器であり、機械式、流体式、又は光学式の何れの方式を用いてもよい。距離センサ２１ｂは自動車の移動距離を計測する計測器である。ＧＰＳ受信機２１ｃは、衛星からの電波に基づいて車両の位置を検出する。これらのセンサは各々が性質の異なる誤差を持っているため、複数のセンサにより、相互に補間しながら使用するように構成されている。なお、精度によっては上述した内の一部で構成してもよく、更に、ステアリングの回転センサ、各転動輪の車輪センサ等を追加して用いてもよい。

データ入力器２２は、位置検出の精度向上のためのいわゆるマップマッチング用データ、地図データ及び目印データを含むカーナビゲーション用の各種データに加えて、音声認識ユニット１０において認識処理を行う際に用いる辞書データを入力するための装置である。データ入力器２２がこれらデータを記憶する記憶媒体としては、そのデータ量からハードディスクやＤＶＤを用いるのが一般的であると考えられるが、ＣＤ−ＲＯＭ等の他の媒体を用いても良い。データ記憶媒体としてＤＶＤを用いた場合には、このデータ入力器２２はＤＶＤプレーヤとなる。

表示装置２６は、カラー表示装置であり、表示装置２６の画面には、位置検出器２１から入力された車両現在位置マークと、地図データ入力器２２より入力された地図データと、更に地図上に表示する誘導経路や設定地点の目印等の付加データとを重ねて表示することができる。また、表示装置２６はタッチパネル機能を備えており、複数の選択肢を表示するメニュー画面やその中の選択肢を選んだ場合に、さらに複数の選択肢を表示するコマンド入力画面などを表示することができる。

通信装置２４は、設定された連絡先通信情報によって特定される連絡先との通信を行うためのものであり、例えば携帯電話機等の移動体通信機によって構成される。
また、カーナビゲーション装置２０は、いわゆる経路案内機能も備えている。カーナビゲーション装置２０への入力は、リモートコントロール端末２７ａ（以下、リモコン２７ａと称する。）を介して、リモコンセンサ２７から行われる。操作スイッチ群２３により入力することも可能である。リモコン２７ａ、及び操作スイッチ群２３からの各種コマンドの入力は、手動操作により行われる。目的地の位置が入力されると、現在位置からその目的地までの最適な経路を自動的に選択して誘導経路を形成し表示することができる。このような自動的に最適な経路を設定する手法は、ダイクストラ法等の手法が知られている。操作スイッチ群２３は、例えば、表示装置２６と一体になったタッチスイッチもしくはメカニカルなスイッチ等が用いられ、各種コマンドの入力に利用される。カーナビゲーション装置２０における各機能は、制御回路２８におけるソフトウェア処理により実現されている。

音声認識ユニット１０は、カーナビゲーション装置２０への各種コマンドの入力を、人が発する音声（音声データ）によって入力するための装置である。音声認識ユニット１０は、音声合成部１１、音声認識部１２、音声認識制御部１３（以下、単に制御部１３と称する）、及び話者認識部１７を有している。スピーカ１４は、音声合成部１１に接続されている。マイクロホン１５は、音声認識部１２に接続されている。ＰＴＴスイッチ１６は、制御部１３に接続されている。

音声認識部１２は、制御部１３からの指示により、入力された音声データ（コマンド）の単語認識処理を行い、その認識結果を制御部１３に出力する。音声データはマイクロホン１５から入力される。音声認識部１２は、マイクロホン１５から入力された音声データに対し、記憶している辞書データ（後述する音声認識辞書部１０７）を用いて照合を行う。例えば、辞書データに記憶されている複数の比較対象パターン候補と音声データを比較して、一致度の高い比較対象パターンを制御部１３へ出力する。

入力音声データ中の単語系列の認識は、例えば以下のように行われる。まず、入力された音声データを、各音声データの音響モデルと比較することにより音響分析し、音響的特徴量（例えばケプストラム）を抽出する。この音響分析によって、音響的特徴量時系列データを得る。そして、周知のＨＭＭ（Hidden Markov Model；隠れマルコフモデル）、ＤＰ(Dynamic Programming)マッチング法、あるいはニューラルネットなどによって、この時系列データをいくつかの区間に分け、各区間が辞書データとして格納された単語の中のどの単語に対応しているかを求める。以上により、入力された音声データを単語として認識し、これにより音声データによる操作コマンドを認識することができる。

制御部１３は、音声認識部１２における認識結果に基づき、話者認識部１７に音声データを出力する対象か否かを判定する。音声認識部１２における認識結果により、マイクロホン１５から入力された音声データが、個人情報を特定可能な操作コマンドに該当する場合は、話者認識部１７に音声データを出力する対象であると判定される。例えば、「自宅に帰る」、「自宅に電話する」などの操作コマンドに相当する音声データである場合がこれに該当する。

一方、個人情報を特定可能な操作コマンドに該当しない場合は、話者認識部１７に音声データを出力する対象でない（非対象）と判定される。例えば、「東京駅に行く」、「ここから一番近い時間貸駐車場に行く」などの操作コマンドに相当する音声データである場合がこれに該当する。個人情報を特定可能な操作コマンドに該当しない場合は、そのままカーナビゲーション装置２０の機能を実行する。

話者認識部１７に音声データを出力する対象であると判定された場合は、話者認識部１７において話者認識処理を行い、その認識結果を制御部１３に出力する。話者認識処理においては、入力された音声データが、予め登録された音声データに一致するか否かを判定する。予め登録された音声データとは、例えば、所有者や所有者の家族など（以下、「所有者等」と称する）の音声データである。すなわち、話者認識処理においては、入力された音声データが、所有者等の音声に一致し、話者が特定されたかどうかを判定する。

話者認識部１７における話者認識処理において、話者が特定されなかった場合は、機能実行却下（コマンド機能を実行しない）と判定され、音声合成部１１へのその旨の応答音声の出力指示を行い、処理を終了する。音声合成部１１は、波形データベース内に格納されている音声波形を用い、音声対話制御部１３からの応答音声の出力指示に基づく音声を合成する。この合成音声がスピーカ１４に出力され、スピーカ１４から当該音声が出力される。例えば「現在、その操作はご利用できません」との音声が出力される。ここで、機能実行却下とは、音声データにより入力された操作コマンドの実行を中止すること、当該コマンドに対応するカーナビゲーション装置２０の機能を実行しないことを意味する。カーナビゲーション装置２０の機能実行を却下することにより、所有者等以外の者（盗難者）に、個人情報が漏洩することを回避することができる。

また、機能実行却下の一態様として、例えば、カーナビゲーション装置２０が所有者の個人情報が登録されていない場合と同じ状態で機能実行するような動作とすることもできる。たとえば、「自宅に帰る」というコマンドで自宅を目的地に設定する場合は、まだ自宅が登録されていない状態で機能を実行するような動作とする。この場合は、「現在、その操作はご利用できません」という、単に機能を実行しないという応答ではなく、例えば「自宅が登録されていません。自宅を登録してから実行してください」という応答とする。このように、所有者の個人情報が登録されていない場合と同じ応答とすることで、通常操作と変わらない動きとなるため、例えば盗難者に話者認識機能によるガードを入れていることを悟られない。また、機能実行却下の一態様として、ナビゲーション装置２０を工場出荷状態に戻すようにしても同様の効果が得られる。
これにより、例えば自動車が盗難された場合に、盗難者の気分を逆なでし、さらに自動車の破損に及ばせるなどの二次的な被害にあう確率が減少する。また、当初の目的でもある、自宅の位置に関する情報も見えないようにすることが可能となる。

また、このような処理に続いて、カーナビゲーション装置２０を再起動するような操作をした際に、カーナビゲーション装置２０の起動を停止する（起動させない）ようにしてもよい。このようにすることで、盗難者によるカーナビゲーション装置２０の起動ができなくなるため、個人情報が漏洩することをより確実に回避することができる。なお、このような場合は、所有者により設定されたパスワードの入力により、本人照合を行わなければカーナビゲーション装置２０を再起動できないようにする。

話者認識部１７における話者認識処理において、話者が特定された場合、すなわち、入力された音声データが、所有者等の音声に一致した場合は、カーナビゲーション装置２０の所有者本人の操作であると判断し、通常の動作が実行される。この場合は、音声合成部１１への応答音声の出力指示を行う。また、入力された音声データによるコマンドに従い、カーナビゲーション装置２０の処理を実行する制御回路２８に対して、必要な処理を行う。例えば、ナビゲート処理のために必要な目的地やコマンドを通知し、目的地の設定やコマンドを実行させるよう指示する処理を行う。このような処理の結果として、この音声認識ユニット１０を利用すれば、上記操作スイッチ群２３あるいはリモコン２７ａに対し、ユーザが手動操作をしなくても、音声入力によりカーナビゲーション装置に対する目的地の指示などが可能となる。

制御部１３において、入力された音声データに対応したコマンドが、個人情報を特定可能な操作コマンドではない場合は、話者認識部１７に音声データを出力する対象ではないと判定し、カーナビゲーション装置２０において上述した通常の動作が実行される。

また、本実施形態における音声コマンドの入力操作では、ユーザがＰＴＴスイッチ１６を押しながらマイクロホン１５を介して音声データを入力するという利用方法を想定している。制御部１３は、ＰＴＴスイッチ１６が押されたタイミング、戻されたタイミング、及び押された状態が継続した時間を監視している。ＰＴＴスイッチ１６が押された場合には、音声認識部１２における処理の実行を指示する。一方、ＰＴＴスイッチ１６が押されていない場合には、その処理を実行させないようにしている。従って、ＰＴＴスイッチ１６が押されている間にマイクロホン１５を介して入力された音声データが、音声認識部１２へ出力されることとなる。このような構成とすることによって、カーナビゲーション装置２０では、ユーザがコマンドを入力することによって、経路設定や経路案内、あるいは施設検索や施設表示など各種の処理を実行することができる。

次に、音声認識部１２、制御部１３、及び話者認識部１７の構成についてさらに詳細に説明する。図２に示すように、音声認識部１２は、音声抽出部１０１、音声認識照合部１０３（以下、照合部１０３と称する）、音声認識結果出力部１０５（以下、出力部１０５と称する）、音声認識辞書部１０７（以下、辞書部１０７と称する）を備えている。辞書部１０７は、例えば、コマンド対応辞書２０１、住所対応辞書２０３、楽曲対応辞書２０５、電話帳対応辞書２０７などを備えている。これら辞書には、音声データと照合可能であって、コマンド、住所などと対応付けされたデータが格納されている。

制御部１３は、話者認識対象判定部１２１（以下、判定部１２１と称する）、機能実行処理決定部１２３（以下、決定部１２３と称する）、音声出力内容決定部１２５（以下、決定部１２５と称する）を備える。話者認識部１７は、話者認識照合部１４１（以下、照合部１４１と称する）、及び登録話者データ１４３を備えている。

ユーザは、マイクロホン１５からユーザが希望する操作を行うための音声を入力する。音声認識部１２の音声抽出部１０１は、マイクロホン１５から入力された音声データを例えばデジタル信号に変換し、辞書に格納されたデータと照合可能な音声データを抽出する。照合部１０３は、音声抽出部１０１から入力された音声データと、辞書（２０１〜２０７・・・）に格納されたデータとの照合を行い、入力された音声データがどのような言葉であるかを認識する。例えば、入力された音声データが「自宅に帰る」であった場合、コマンド対応辞書２０１中の、自宅までの経路を案内するコマンドに対応する言葉であると認識する。照合部１０３は、この認識結果を出力部１０５に出力する。出力部１０５は、照合部１０３から入力された認識結果を、制御部１３の判定部１２１に出力する。なお、マイクロホン１５から入力された音声データも、出力部１０５から判定部１２１に出力される。

制御部１３の判定部１２１は、出力部１０５から入力された認識結果に基づいて、入力された音声データが、話者認識部１７に音声データを出力する対象であるか否かの判定を行う。入力された音声データが、個人情報を特定可能なコマンドに関係する場合は、話者認識部１７に音声データを出力する対象であると判定される。この場合は、判定部１２１は音声データを話者認識部１７の照合部１４１に出力する。話者認識部１７では、制御部１３から入力された音声データと登録話者データ１４３を話者照合部１４１で照合し、両者の一致、不一致を判定する。

照合部１４１における照合の結果、話者が特定された場合（一致）、すなわち、音声データが所有者等による入力であると判定した場合は、照合部１４１は照合結果を、制御部１３の決定部１２３に出力する。決定部１２３では、入力された照合結果に基づいて、カーナビゲーション装置２０において実行すべき処理を決定し、その決定結果が制御回路２８に出力される。

照合部１４１における照合の結果、話者が特定されなかった場合（不一致）、すなわち、音声データの入力が所有者等による入力ではなかった場合は、照合部１４１は照合結果を、制御部１３の機能実行却下判定部１２７に出力する。機能実行却下判定部１２７では、照合部１４１における照合結果に基づいて、機能実行却下と判定し、その判定結果を決定部１２５に出力する。決定部１２５において、当該判定結果に基づいて音声出力する内容が決定され、音声合成部１１に当該内容が出力される。

制御部１３の判定部１２１において、入力された音声データが、個人情報を特定可能なコマンドに関係しない場合は、話者認識部１７に音声データを出力する対象でない（非対称）と判定される。この場合は、その判定結果を機構実行処理決定部１２３と決定部１２５に出力する。決定部１２５において、当該判定結果に基づいて音声出力する内容が決定され、音声合成部１１に当該内容が出力される。決定部１２３では、入力された照合結果に基づいて、カーナビゲーション装置２０において実行すべき処理を決定し、その決定結果が制御回路２８に出力される。

次に、話者認識を実行する処理について、図３、図４、図５を参照して説明する。また、適宜、図１及び図２を参照する。図３は、本実施形態に係る音声操作による処理を示すフローチャートである。まず、ステップＳ１０で、マイク１５を介して音声抽出部１０１に音声データが入力されると、ステップＳ２０にて、照合部１０３は、辞書部１０７の辞書（２０１〜２０７）を用いて、認識処理が実行される。ステップＳ３０にて、照合部１０３から出力部１０５に認識結果が出力される。

次に、Ｓ４０にて、判定部１２１で話者認識対象であるか否かが判定される。話者認識対象と判定された場合（ステップＳ４０にて「ＹＥＳ」）は、ステップＳ５０にて、登録話者データ１４３を用いて、照合部１４１での話者認識処理が実行され、ステップＳ６０にて、話者が特定されたか否か、すなわち、一致、不一致が判定される。

ステップＳ４０にて、話者認識対象と判定されなかった場合、すなわち非対称と判定された場合（ステップＳ４０にて「ＮＯ」）は、ステップＳ８０にて、機能実行処理が行われ、音声操作を終了する。

次に、ステップＳ６０にて、照合部１４１で話者が特定されたか否かが判定され、話者が特定された（一致）と判定された場合（ステップＳ６０で「ＹＥＳ」）は、ステップＳ８０にて、決定部１２３で機能実行処理が行われ、決定部１２５で音声操作を終了する決定がされる。

また、ステップＳ６０にて、照合部１４１で話者が特定されなかった（不一致）と判定された場合（ステップＳ６０で「ＮＯ」）は、ステップＳ７０にて、判定部１２７で機能実行を却下するとの判定が行われる。この場合は、その判定結果を決定部１２５に出力し、決定部１２５において音声操作を終了する。

なお、ここで、突然音声操作を終了するメッセージを出力すると、盗難者にも話者認識機能によるガードを入れているということを知らせてしまうことになる。そこで、通常操作と変わらない動きで制御できるようにしておいてもよい。例えば、「自宅に帰る」というコマンドで自宅を目的地に設定する場合は、自宅の位置を特定されないようにナビゲーション機能を実行しないだけでなく、まだ自宅が登録されていない状態で機能実行するような動作とする。この場合は、例えば「現在、その操作はご利用できません」という応答ではなく、「自宅が登録されていません。自宅を登録してから実行してください」という応答とする。このようにすることで、通常操作と変わらない動きとなるため話者認識機能によるガードを入れているということが特定されなくなり、かつ、自宅の位置に関する情報も判明しないようにすることが可能となる。このようにして、話者認識処理を含む一連の音声操作処理が完了する。

図４は、手動操作による処理を示すフローチャートである。最初のステップＳ１１０で手動操作にて画面遷移するとステップＳ１２０にて、話者認識対象であるか否かが判定される。手動操作は、例えば、ユーザにより、操作スイッチ群２３（手入力部）への入力、又は、タッチパネル機能を有する表示装置２６に表示された操作ボタン（手入力部）への入力により行われる。入力されたコマンドが話者認識対象と判定された場合（ステップＳ１２０にて「ＹＥＳ」）は、ステップＳ１３０にて、話者認識処理が実行される。次に、ステップＳ１４０にて、照合部１４１で話者が特定されたか否か（一致、又は不一致）が判定される。ステップＳ１２０の話者認識対象か否かを判定する処理は、ここでは制御回路２８が行う（話者認識対象判定部）。また、ステップＳ１２０にて、話者認識対象と判定されなかった場合（ステップＳ１２０で「ＮＯ」）は、ステップＳ１６０にて、決定部１２３で機能を実行する決定が行われ、手動操作を終了し、ナビゲーション機能の実行は制御回路２８によって遂行される。

次に、Ｓ１４０にて、話者が特定された（一致）と判定された場合（ステップＳ１４０にて「ＹＥＳ」）は、ステップＳ１６０にて、機能実行処理が行われ、手動操作を終了し、ナビゲーション機能の実行は制御回路２８によって遂行される。また、ステップＳ１４０にて、話者が特定されなかった（不一致）と判定された場合（ステップＳ１４０にて「ＮＯ」）は、ステップＳ１５０にて、判定部１２７で機能実行を却下するとの判定が行われ、手動操作を終了する。また、判定部１２７は、決定部１２５に判定結果を出力し、これに基づいて、決定部１２５は、例えば、「現在、その操作はご利用できません」という応答を行う。また、この応答に代えて、まだ自宅が登録されていない状態で機能実行するような動作とし、「自宅が登録されていません。自宅を登録してから実行してください」という応答としてもよい。このようにして、話者認識処理を含む一連の手動操作処理が完了する。なお、ステップＳ１４０における処理で、音声入力による話者認識処理を行ったが、これに代えて、例えばパスワードの入力、及びその照合により話者認識処理を行ってもよい。このようにすることで、例えば、所有者本人による操作である場合に、パスワードの入力によって通常動作に復帰することができるため、利便性が向上する。

図５は話者認識のＯＮ／ＯＦＦ切替処理の操作を示すフローチャートである。最初のステップＳ２１０で話者認識のＯＮ／ＯＦＦ切替処理の設定画面へ遷移すると、ステップＳ２２０にて、判定部１２１で話者認識処理が実行される。処理された内容に基づいて、ステップＳ２３０にて、照合部１４１で話者が特定されたか否かが判定される。ステップＳ２３０にて、話者が特定された（一致）と判定された場合（ステップＳ２３０にて「ＹＥＳ」）は、ステップＳ２５０にて、決定部１２３で機能を実行する決定が行われ、話者認識のＯＮ／ＯＦＦ切替処理を終了する。また、ステップＳ２３０にて、照合部１４１で話者が特定されなかった（不一致）と判定された場合（ステップＳ２３０にて「ＮＯ」）は、Ｓ２４０にて、判定部１２７で機能実行を却下する判定が行われ、話者認識のＯＮ／ＯＦＦ切替処理を終了する。このようにして、話者認識のＯＮ／ＯＦＦ切替処理が完了する。

以上のように、音声操作、手動操作に話者認識機能を取り入れることで、カーナビゲーション装置２０のガード機能のＯＮ／ＯＦＦ切替を、第三者に簡単に操作されてしまうことがないようにする。これにより、万が一、自動車が盗難されてしまったとしても、カーナビゲーション装置２０の中に含まれる重要な情報（例えば、個人情報を特定しうる情報であって、自宅の位置や自宅の電話番号などを含む情報）を盗まれないようにすることが可能となり、被害を最小限に抑えることができる。

また、話者認識のＯＮ／ＯＦＦ切替処理を可能とすることで、カーナビゲーション装置２０のガード機能を必要に応じて停止及び動作させることができ、利便性が向上する。例えば、少しの間、自動車から離れる場合であっても、上記ガード機能が有効となっていると、煩わしい場合がある。そこで、所有者の希望によって、上記ガード機能を停止、動作を可能とすれば、利便性が向上し、使い勝手が良くなる。

次に、図６〜図９を用いて、本発明を適用したカーナビゲーション装置２０における処理動作例を示す。図６（ａ）〜（ｃ）は、音声操作で「自宅に帰る」コマンドを実行する場合の動作例を示す。図６（ａ）は、話者認識機能によるガードがＯＦＦの場合、すなわち通常の音声操作処理を示すものである。この場合は、ユーザからの「自宅に帰る」という音声コマンドに対し、ユーザの指示通り、自宅を目的地に設定するという流れとなっている。従って、自動車が盗難された場合に盗難者によってコマンドが入力された場合であっても、個人情報を特定可能なコマンドが実行されてしまい、盗難者に、例えば所有者の自宅の位置が判明してしまうことになる。

図６（ｂ）は、話者認識機能によるガードがＯＮで、登録話者ユーザ（所有者）が「自宅に帰る」という音声コマンドを発話した場合の処理動作例を示す。この場合は、話者認識照合部１４１での話者認識機能により登録話者と特定され、その後は図６（ａ）に示したもの同じ処理動作例となっている。

図６（ｃ）は、話者認識機能によるガードがＯＮで、登録話者ユーザではないユーザ（盗難者）が「自宅に帰る」という音声コマンドを発話した場合の処理動作例を示す。例えば自動車が盗難にあった場合である。この場合は、話者認識照合部１４１での話者認識機能において、コマンド入力者が登録話者（所有者）と特定されないため（不一致）、「自宅に帰る」という音声コマンドによる機能実行は却下され、音声操作が強制的に終了するという処理動作例となっている。これにより、自動車が盗難にあった場合であっても、個人情報を特定可能なコマンドを実行することができないため、所有者の個人情報が守られる。

図７（ａ）〜（ｃ）に、手動操作で「自宅を目的地に設定する」場合の処理動作例を示す。手動操作は、例えばユーザによる操作スイッチ群２３に対する入力によって行われる。図７（ａ）は、話者認識機能によるガードがＯＦＦの場合、すなわち通常の手動操作処理を示す図である。この場合は、ユーザからの「自宅を目的地に設定する」という手動操作に対し、ユーザの指示通り、自宅を目的地に設定するという流れとなっている。従って、自動車が盗難された場合に盗難者によってコマンドが入力された場合であっても、個人情報を特定可能なコマンドが実行されてしまい、盗難者に、例えば所有者の自宅の位置が判明してしまうことになる。

図７（ｂ）は、話者認識機能によるガードがＯＮで、登録ユーザ（所有者）が「自宅を目的地に設定する」という手動操作を実施した場合の処理動作例を示す図である。この場合は、話者認識機能で、ユーザが登録話者（所有者）と特定され（一致）、その後は図７（ａ）と同じ処理動作例となっている。なお、ここで、音声入力による話者認識処理を行ったが、これに代えて、例えばパスワードの入力、及びその照合により話者認識処理を行ってもよい。

図７（ｃ）は、話者認識機能によるガードがＯＮで、登録話者ユーザではないユーザ（盗難者）が「自宅を目的地に設定する」という手動操作を実施した場合の処理動作例を示す図である。例えば自動車が盗難にあった場合である。この場合は、話者認識機能で登録話者と特定されないため（不一致）、「自宅を目的地に設定する」という手動操作による機能実行は却下され、手動操作が強制的に終了するという流れとなっている。これにより、自動車が盗難にあった場合であっても、個人情報を特定可能なコマンドを実行することができないため、所有者の個人情報が守られる。なお、ここで、音声入力による話者認識処理を行ったが、これに代えて、例えばパスワードの入力、及びその照合により話者認識処理を行ってもよい。

図８（ａ）〜（ｂ）に、話者認識機能のＯＮ／ＯＦＦ切替処理の処理動作例を示す。図８（ａ）は、話者認識機能がＯＮで、登録話者ユーザが「話者認識のＯＮ／ＯＦＦ切替処理」を実施した場合の動作を示す図である。「話者認識のＯＮ／ＯＦＦ切替処理」は、例えば、操作スイッチ群２３（手入力部）による入力、又は、タッチパネル機能を有する表示装置２６（手入力部）に表示された「設定」ボタンへの入力、及び、続いて表示される「話者認識のＯＮ／ＯＦＦ切替」ボタンへの入力により行われる。「話者認識のＯＮ／ＯＦＦ切替」ボタンを押下すると、話者認識処理に移行する。話者認識処理においては、上述したように、ユーザの音声が、スピーカ１４を介して入力され、音声認識部１２、音声認識制御部１３、及び話者認識部１７で処理される。この場合は、話者認識機能で登録話者と特定され、ユーザの指示通り、「話者認識ＯＮ／ＯＦＦ切替」の設定画面に遷移するという流れとなっている。なお、ここで、音声入力による話者認識処理を行ったが、これに代えて、例えばパスワードの入力、及びその照合により話者認識処理を行ってもよい。

図８（ｂ）は、話者認識機能がＯＮで、登録話者ユーザではないユーザが「話者認識のＯＮ／ＯＦＦ切替処理」を実施した場合の処理動作例を示す図である。例えば自動車が盗難にあった場合である。この場合は、話者認識機能で登録話者と特定されないため（不一致）、「話者認識ＯＮ／ＯＦＦ切替」の設定画面への画面遷移は却下され、操作が強制的に終了するという流れとなっている。なお、ここで、音声入力による話者認識処理を行ったが、これに代えて、例えばパスワードの入力、及びその照合により話者認識処理を行ってもよい。

なお、上述の実施形態では、「話者認識のＯＮ／ＯＦＦ切替処理」を、操作スイッチ群２３（手入力部）又は、タッチパネル機能を有する表示装置２６（手入力部）への入力によって行う例を示したが、これに限られない。例えば、スピーカ１４からの音声入力によって「話者認識のＯＮ／ＯＦＦ切替処理」を行うこととしてもよい。

図９（ａ）及び（ｂ）は、話者認識機能によるガードを適用した場合の他の処理動作例を示す図である。図９（ａ）は、音声操作で、話者認識機能がＯＮで、登録話者ユーザではないユーザ（盗難者）が「自宅に帰る」という音声コマンドを発話した場合の処理を示す図である。例えば自動車が盗難にあった場合の処理動作例である。この場合は、話者認識機能で登録話者と特定されない（不一致）。そこで、「自宅に帰る」という音声コマンドによる機能実行を単に却下するのではなく、まだ自宅が登録されていない状態で機能を実行するような動作とする。例えば「自宅が登録されていません。自宅を登録してから実行してください」という応答となる。

図９（ｂ）は、手動操作で、話者認識機能がＯＮで、登録話者ユーザではないユーザが「自宅を目的地に設定する」という手動操作を実施した場合の処理を示す。例えば自動車が盗難にあった場合である。この場合は、話者認識機能で登録話者と特定されない（不一致）。そこで、図９（ａ）と同様に、手動操作による機能実行を単に却下するのではなく、まだ自宅が登録されていない状態で機能を実行するような動作とする。以上に説明したようにすることで、万が一、盗難者が使用した場合にも、話者認識機能を適用したガードを入れていることが判別できないようにすることができる。

本発明は、上述した実施形態に限定されるものではなく、その要旨を逸脱しない範囲で種々の実施形態に適用可能である。例えば、カーナビゲーション装置２０の構成や、図３から図９に示した一連の処理は一例として挙げたものであって、要旨を逸脱しない範囲で適宜変更して実施することができる。

また、話者認識部１７の照合部１４１における登録話者データ１４３と入力された音声データとの照合における一致度（信頼度）に段階を設け、一致度（信頼度）が相当低い場合は、盗難者が発話している（使用している）と判定してもよい。そして、例えば、カーナビゲーション装置２０の設定状態を強制的に工場出荷状態（初期状態）に戻してしまうような制御とすることにしてもよい。この場合は、所有者等の自宅住所が登録されていない状態となるため、カーナビゲーション装置２０の応答としては、例えば「自宅が登録されていません。自宅を登録してから実行してください」という応答となる。このように、所有者の個人情報が登録されていない場合と同じ応答とすることで、通常操作と変わらない動きとなる。従って、盗難者に話者認識機能によるガードを入れているということが悟られないため、被害を最小限に抑えることができる。

また、個人情報を特定可能な処理に関するコマンドとして、「自宅に帰る」コマンドを例示して説明したが、これに限定されない。上述のガードを設ける対象となるコマンドを変更（追加、削除）できるようにしてもよい。例えば、カーナビゲーション装置２０をスマートフォン（携帯機器）と連動させている場合、「自宅に帰る」コマンドだけでなく、「自宅に電話する」コマンドもガードの対象とするように、追加できることとしてもよい。

このようにすることで、様々な個人情報を特定可能な処理に関するコマンドをガード機能の対象とすることができる。従って、車両の盗難者がカーナビゲーション装置を操作した場合であっても、所有者の個人情報を特定可能な機能に関係する様々なコマンドが実行されないため、所有者の個人情報が漏洩することをより十全に回避することができる。

図面中、１０は音声認識ユニット、１１は音声合成部、１２は音声認識部、１３は音声認識制御部、１４はスピーカ（音声出力部）、１５はマイクロホン（音声入力部、第２の入力部）、１６はＰＴＴスイッチ、１７は話者認識部、２０はカーナビゲーション装置、２１は位置検出器、２１ａはジャイロスコープ、２１ｂは距離センサ、２１ｃはＧＰＳ受信機、２２はデータ入力器、２３は操作スイッチ群（手入力部、第１の入力部）、２４は通信装置、２５は外部メモリ、２６は表示装置（手入力部、第１の入力部）、２７はリモコンセンサ、２７ａはリモコン、２８は制御回路（話者認識対象判定部、第１の判定部）、１０１は音声抽出部、１０３は音声認識照合部、１０５は音声認識結果出力部、１０７は音声認識辞書部、１２１は話者認識対象判定部（第１の判定部）、１２３は機構実行処理決定部、１２５は音声出力内容決定部、１２７は機能実行却下判定部、１４１は話者認識照合部（第２の判定部）、１４３は登録話者データ、２０１はコマンド対応辞書、２０３は住所対応辞書、２０５は楽曲対応辞書、２０７は電話帳対応辞書を示す。

Claims

入力された第１の音声データに対応するコマンドが、所有者の個人情報を特定可能な機能に関係するか否かを判定する第１の判定部（１２１）と、
前記第１の音声データと、予め登録された第２の音声データとを照合して、両者の一致、不一致を判定する第２の判定部（１４１）と、を有し、
前記コマンドが、所有者の個人情報を特定可能な機能に関係する場合であって、
前記第２の判定部における照合の結果、前記第１の音声データと、前記第２の音声データが不一致の場合は、前記コマンドを実行しないことを特徴とするカーナビゲーション装置（２０）。
コマンドを手入力により入力可能な第１の入力部（２３、２６）と、
音声データを入力可能な第２の入力部（１５）と、
前記第１の入力部から入力された前記コマンドが、所有者の個人情報を特定可能な機能に関係するか否かを判定する第１の判定部（１２１）と、
入力された音声データと、予め登録された第２の音声データを照合して、両者の一致、不一致を判定する第２の判定部（１４１）と、を有し、
前記第１の判定部において、前記第１の入力部から入力された前記コマンドが、所有者の個人情報を特定可能な機能に関係すると判定された場合は、
第１の音声データを前記第２の入力部に入力する処理と、
前記第２の判定部において、前記第１の音声データと、前記第２の音声データを照合する処理と、を行い、
前記第２の判定部における照合の結果、前記第１の音声データと、前記第２の音声データが不一致の場合は、前記コマンドを実行しないことを特徴とするカーナビゲーション装置。
前記第１の判定部における処理、及び前記第２の判定部における処理のＯＮ／ＯＦＦ切替が可能であることを特徴とする請求項１又は２に記載のカーナビゲーション装置。
前記ＯＮ／ＯＦＦ切替を操作する場合、前記第１の判定部における処理、及び前記第２の判定部における処理を行うことを特徴とする請求項３に記載のカーナビゲーション装置。
前記第１の判定部における処理の対象となるコマンドを変更（追加、及び削除）することができることを特徴とする請求項１から４の何れか一項に記載のカーナビゲーション装置。
前記第１の判定部における処理は、パスワードの照合により行うことを特徴とする請求項１から５の何れか一項に記載のカーナビゲーション装置。
前記第２の判定部における照合の結果、前記第１の音声データと、前記第２の音声データが不一致の場合は、当該カーナビゲーション装置を再起動する際に、起動を停止させることを特徴とする請求項１から６の何れか一項に記載のカーナビゲーション装置。
さらに、パスワードの入力による本人照合を行わなければ再起動することができないことを特徴とする請求項７に記載のカーナビゲーション装置。
前記第２の判定部における照合の結果、前記第１の音声データと、前記第２の音声データが不一致の場合は、前記コマンドを実行しないことに代えて、前記所有者の個人情報が登録されていない場合と同じ応答を行うことを特徴とする請求項１から８の何れか一項に記載のカーナビゲーション装置。
前記第２の判定部（１４１）における第１の音声データと第２の音声データとの照合において、両者の一致度に段階を設け、一致度が低い場合は、当該カーナビゲーション装置の設定状態を強制的に工場出荷状態に戻すことを特徴とする請求項１から９の何れか一項に記載のカーナビゲーション装置。