JP2020085953A - 音声認識支援装置及び音声認識支援プログラム - Google Patents

音声認識支援装置及び音声認識支援プログラム Download PDF

Info

Publication number
JP2020085953A
JP2020085953A JP2018215240A JP2018215240A JP2020085953A JP 2020085953 A JP2020085953 A JP 2020085953A JP 2018215240 A JP2018215240 A JP 2018215240A JP 2018215240 A JP2018215240 A JP 2018215240A JP 2020085953 A JP2020085953 A JP 2020085953A
Authority
JP
Japan
Prior art keywords
voice
state
light emission
unit
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018215240A
Other languages
English (en)
Inventor
鈴木 恵子
Keiko Suzuki
恵子 鈴木
聖 相原
Satoshi Aihara
聖 相原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018215240A priority Critical patent/JP2020085953A/ja
Priority to US16/656,659 priority patent/US20200160854A1/en
Priority to CN201911080965.5A priority patent/CN111199736A/zh
Publication of JP2020085953A publication Critical patent/JP2020085953A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B45/00Circuit arrangements for operating light-emitting diodes [LED]
    • H05B45/20Controlling the colour of the light
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/105Controlling the light source in response to determined parameters
    • H05B47/115Controlling the light source in response to determined parameters by determining the presence or movement of objects or living beings
    • H05B47/12Controlling the light source in response to determined parameters by determining the presence or movement of objects or living beings by detecting audible sound
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Traffic Control Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】音声認識に適した環境であるか否かを発声主体に把握させることができる音声認識支援装置を得ること。【解決手段】音声認識支援装置100−1は、発光部4と、音検出部1と、音検出部1で検出される人の音声のレベルを示す音声レベルと音検出部1で検出される騒音のレベルを示す騒音レベルと音検出部の周囲環境が音声の認識に適した状態であることを判定する閾値とに基づき、音検出部の周囲環境が音声の認識に適した状態であるか否かを判定し、音検出部の周囲環境が音声の認識に適した状態であると判定した場合には、発光部4の発光状態を第1状態にさせ、音検出部の周囲環境が音声の認識に適した状態ではないと判定した場合には、発光部4の発光状態を第1状態とは異なる第2状態に変化させる発光制御部3−1とを備える。【選択図】図1

Description

本発明は、音声認識装置による音声認識機能を支援する音声認識支援装置及び音声認識支援プログラムに関する。
特許文献1には、発話者が外部との会話の望むタイミングでスイッチが押されると、当該スイッチの操作に連動して雑音抑圧の処理が行われると共に発話可能であることを通知するランプを点灯させる技術が開示されている。スイッチは雑音抑圧回路を起動させる起動手段である。
特開2014−178339号公報
しかしながら、特許文献1に開示される技術は、音声レベルよりも騒音レベルが相対的に高いために音声認識に適していない環境であるのか否かを発話者に通知することができないため、音声認識に適してない環境でスイッチが押された場合でも、発話可能な状態であることが発話者に通知されてしまう。そのような環境で発声された場合、正確に音声が認識されない可能性が高いため、繰り返し発声する必要が生じるという課題があった。
本発明は、上記の点に鑑みてなされたものであって、音声認識に適した環境であるか否かを発声主体に把握させることを目的とする。
上記の課題を解決するため、本発明の実施の形態に係る音声認識支援装置は、発光部と、音検出部と、前記音検出部で検出される前記人の音声のレベルを示す音声レベルと、前記音検出部で検出される騒音のレベルを示す騒音レベルと、前記音検出部の周囲環境が前記音声の認識に適した状態であることを判定する閾値とに基づき、前記音検出部の周囲環境が前記音声の認識に適した状態であるか否かを判定し、前記音検出部の周囲環境が前記音声の認識に適した状態であると判定した場合には、前記発光部の発光状態を第1状態にさせ、前記音検出部の周囲環境が前記音声の認識に適した状態ではないと判定した場合には、前記発光部の発光状態を前記第1状態とは異なる第2状態に変化させる発光制御部と、を備える。
本実施の形態によれば、発光部の発光状態により、音声認識に適した環境であるか否かを把握させることができる。また、音声認識に適した環境であるか否かを把握させることができるため、人の認知負荷の増加を抑制できる。
また本実施の形態において、
前記発光制御部は、前記音声レベル及び前記騒音レベルに加えて、前記車両から得られる車両情報に基づき、前記車両内の環境が前記音声の認識に適した状態であるか否かを判定するように構成してもよい。
本実施の形態によれば、騒音レベルが高い場合でも、音声認識の精度を高めて、音声認識装置を有効に利用した快適な運転環境を提供できる。
また本実施の形態において、
前記発光制御部は、前記車両情報に基づき、前記車両が走行中ではないと判定したとき、前記車両内の環境が前記音声の認識に適した状態であると判定するように構成してもよい。
本実施の形態によれば、搭乗者は、発光部の発光状態を意識せずに、音声認識装置を利用することができる。
また本実施の形態において、
前記発光制御部は、前記車両が走行中ではないと判定したとき、前記発光部を消灯させるように構成してもよい。
本実施の形態によれば、発光部の発光に必要な電力の消費を抑制できる。
本発明の他の実施の形態は、音声認識支援プログラムとして実現可能である。
本発明によれば、音声認識に適した環境であるか否かを発声主体に把握させることができるという効果を奏する。
本発明の実施の形態1に係る音声認識支援装置の構成例を示す図である。 本発明の実施の形態1に係る音声認識支援装置の動作を説明するためのシーケンスチャートである。 本発明の実施の形態1に係る音声認識支援装置の動作を説明するためのフローチャートである。 発光状態対応テーブルの第1の例を示す図である。 発光状態対応テーブルの第2の例を示す図である。 本発明の実施の形態1に係る音声認識支援装置を実現するためのハードウェア構成例を示す図である。 本発明の実施の形態2に係る音声認識支援装置の構成例を示す図である。 本発明の実施の形態2に係る音声認識支援装置の動作を説明するためのシーケンスチャートである。 本発明の実施の形態2に係る音声認識支援装置の動作を説明するためのフローチャートである。 本発明の実施の形態2に係る音声認識支援装置を実現するためのハードウェア構成例を示す図である。
以下、図面を参照して発明を実施するための形態について説明する。
実施の形態1.
図1は本発明の実施の形態1に係る音声認識支援装置の構成例を示す図である。「音声」は「人の発する声」(広辞苑第六版)である。音声認識支援装置100−1は、音声認識装置200による音声認識機能を支援する装置である。音声認識装置200は、車両1000内に存在する人が発する音声を認識して特定の動作を行う装置である。特定の動作は、例えばナビゲーション装置の音声操作、電話機への自動発呼などである。音声認識装置200に音声を正しく認識させるためには、騒音レベルに対して音声レベルが高い環境である必要がある。「騒音」は、音声以外の音であり、例えば、走行中の車両1000のタイヤと路面との摩擦に起因して発声するロードノイズ、走行中の車両1000に発声する風切り音、車両1000のフロントガラスなどに雨が当たることで発声する音、車両1000内の音響機器から発せられる音楽などである。騒音レベルは、騒音の大きさを示す指標であり、単位として[dB](デシベル)で表される騒音の音圧レベルである。音声レベルは、音声の大きさを示す指標であり、単位として[dB]で表される音声の音圧レベルである。以下では、説明を簡単化するため「車両1000」を「車両」と略称する場合がある。
音声レベルに対して騒音レベルが高くなればなるほど、音声認識装置200は音声を認識し難くなり、又は音声内容を誤認する可能性が高くなる。音声認識装置200による音声の認識は、騒音レベルに対する音声レベルの比率(S/N比)により、変化する。例えば、車両の速度が低速域(例えば時速30km/h以下)である場合、騒音レベルは、車両内の搭乗者、すなわち運転手、同乗者が耳障りと感じないレベルに抑えられる。従って、このような環境下で、比較的小さな声で発声された場合でも、音声認識装置200が音声認識できる蓋然性が高まる。一方、車両の速度が高速域(例えば時速80km/h以上)である場合、騒音レベルは、搭乗者が耳障りと感じるレベルに達する。従って、このような環境下で、比較的大きな声で発声された場合でも、音声認識装置200が音声認識できる蓋然性が低下する。このように、車両内のS/N比によって音声認識の検出率が変化する。従って、音声認識装置200の音声認識機能を正常に発揮させるためには、搭乗者に対して、騒音の影響を受けることなく音声認識が可能な環境であるか否かを知らせることが有効である。
特許文献1に開示される技術では、スイッチの操作に連動して雑音抑圧の処理が行われると共に発話可能であることを通知するランプを点灯させることができる。しかしながら、特許文献1に開示される技術では、音声認識に適していない環境であるのか否かを発話者に通知することができない。別の文献である特開平11−316598号公報には、騒音の影響を受けることなく音声認識が可能な環境であるか否かを判断させるために騒音値、S/N比(signal-to-noise ratio)などを表示部に表示する技術が開示されている。当該技術によれば、音声の発声主体である人に対して、騒音レベル、S/N比などの数値を視覚化して提供できる。しかしながら表示される数値が音声認識に適した値なのか否かを直感的に把握させることが困難である。また別の文献である特開2006−227499号公報には、発声音量と騒音音量との双方を対比させながらグラフ表示する技術が開示される。当該技術によれば、発声主体の人に対して、どの程度の音量で発声すればよいかを把握させることはできる。しかしながら、表示される騒音音量に対して発声音量が小さい場合、人は発声音量が騒音音量を超えるように発声音量を調整しなければならない。そのため、表示される発声音量などを把握する上での人の認知負荷が増加する傾向がある。ここでの認知負荷とは、表示される発声音量及び騒音音量を認知する際に人にかかる負担である。また、別の文献である特許第5075664号公報には、利用者の音声強度レベルに基づきマイクから利用者までの距離を推定し、推定された推定距離を利用者に提示する技術が開示されている。当該技術によれば、マイクから利用者までの距離が音声認識可能な距離であるか否かを利用者に提供できる。しかしながら、当該技術では、人からマイクまでの実際の距離と推定距離との差が把握できないため、人は、推定距離を常に確認しながらマイクまでの距離を調整する必要がある。従って、推定距離の知得に対する人の認知負荷が増加する傾向がある。
このような問題に鑑み、音声認識支援装置100−1は、人の認知負荷の増加を抑制しながら、音声認識に適した環境であるか否かを把握させることができるように構成されている。以下では、音声認識支援装置100−1の構成例を説明し、その後に音声認識支援装置100−1の動作について順次説明する。
図1に戻り、音声認識支援装置100−1は、音検出部1、音レベル算出部2及び発光制御部3−1を備える。音検出部1は、音声検出部11及び騒音検出部12を備える。音声検出部11は、車両内の搭乗者が発する音声を振動波形として検出し、検出した振動波形を示す信号を音声情報として出力する音声検出用マイクである。騒音検出部12は、車両内の騒音を振動波形として検出し、検出した振動波形を示す信号を騒音情報として出力する騒音検出用マイクである。なお、音声認識支援装置100−1では音声検出部11及び騒音検出部12が利用されているが、音検出部1は1つのマイクで構成してもよい。この場合、音検出部1は、1つのマイクで検出された音の振動波形の周波数成分を、例えば高速フーリエ変換、バンドパスフィルタなどを用いて帯域分割して、音声信号及び騒音信号のそれぞれの情報を出力する。1つのマイクで検出された音を解析する技術は、例えば特開2016−174376号公報、特開2013−169221号公報などに開示されるように公知であるため、その詳細な説明は割愛する。
音レベル算出部2は、音声レベル算出部21及び騒音レベル算出部22を備える。音声レベル算出部21は、音声検出部11から出力される音声情報に基づき、音声の振動波形レベルを算出し、算出した振動波形レベルを音声レベル情報として出力する。振動波形レベルの単位は[dB]である。騒音レベル算出部22は、騒音検出部12から出力される騒音情報に基づき、騒音の振動波形レベルを算出し、算出した振動波形レベルを騒音レベル情報として出力する。音レベルを算出する技術は、例えば、特開2015−114270号公報、特開2010−103853号公報などに開示されるように公知であるため、その詳細な説明は割愛する。
発光制御部3−1は、閾値生成部31、環境判定部32及び発光状態変更部33を備える。閾値生成部31は、音声認識装置200から出力されるS/N比情報201に基づき、車両内の環境が音声の認識に適した状態であることを判定するための閾値を生成する。S/N比は、騒音レベルに対する音声レベルの比率を表す。S/N比情報201は、音声認識装置200が取得した音声レベルが、音声認識可能なレベルであるか否かを判定するための情報である。
環境判定部32は、閾値生成部31で生成された閾値と、騒音レベル算出部22で算出された騒音レベル情報とに基づき、車両内の環境が音声の認識に適した状態であるか否かを判定し、判定結果を示す判定結果情報を出力する。判定結果情報は、車両内の環境が音声の認識に適した状態であることを示す情報、又は車両内の環境が音声の認識に適した状態ではないことを示す情報である。
発光状態変更部33は、音声レベル算出部21から出力される音声レベル情報と環境判定部32から出力される判定結果情報とに基づき、例えば、発光部4の発光状態を変化させるための調光情報を出力する。調光情報は、例えば発光部4の光の強度レベルを指定する情報、発光部4の色温度を指定する情報、発光部4を点灯状態、点滅状態又は消灯状態にさせる指令情報などである。
発光部4は、発光状態変更部から出力される調光情報に基づき、色温度及び照度の少なくとも一方を調節可能な発光ダイオードである。なお、発光部4は、発光ダイオードに限定されず、例えば有機エレクトロルミネッセンス素子、レーザーダイオード素子、小型白熱電球などでもよい。発光部4は、例えば、車両内の搭乗者から見渡せる位置に設けられる。車両内の搭乗者から見渡せる位置は、例えば運転席前の計器盤、ダッシュボード、ドア、ステアリング、シートなどである。なお、発光部4は、車両内の環境が音声の認識に適した状態であるか否かを知らせるため専用に設けられる発光手段に限定されず、発光部4には車両内の既存の照明手段を活用してもよい。既存の照明手段は、例えばイルミネーション用ランプ、ルームランプ、足元灯、ドアランプ、天井部などである。既存の照明手段を活用することにより、専用の照明手段を設ける場合に比べて、車両の設計が容易化され、また発光手段に接続される配線の引き回しが不要になる。そのため、車両の製造コストを低減できる。
次に図2から図5を用いて音声認識支援装置100−1の動作を説明する。図2は本発明の実施の形態1に係る音声認識支援装置の動作を説明するためのシーケンスチャートである。図3は本発明の実施の形態1に係る音声認識支援装置の動作を説明するためのフローチャートである。音声レベル算出部21では音声情報に基づき音声レベル情報が算出され(ステップS1)、騒音レベル算出部22では騒音情報に基づき騒音レベル情報が算出される(ステップS2)。音声レベル情報は発光状態変更部33へ入力され、また騒音レベル情報は環境判定部32へ入力される。
環境判定部32は、騒音レベル情報と閾値情報とに基づき、騒音レベルが閾値を超えているか否かを判定する(ステップS3)。判定の結果、騒音レベルが閾値を超えていない場合(ステップS3,No)、環境判定部32は、車両内の環境が音声の認識に適した状態であることを示す判定結果情報を、発光状態変更部33へ出力する。この判定結果情報を入力した発光状態変更部33は、判定結果情報及び音声レベル情報に基づき、車両内の搭乗者が発声中であるか否かを判定する(ステップS4)。例えば、音声レベルが特定のレベル未満であるため音声が検出されてない状態に等しいときには、発光状態変更部33は、車両内の搭乗者が発声中ではないと判定する(ステップS4,No)。
この場合、発光状態変更部33は、車両内が音声認識に適した環境であり、さらに発声待機中であると判定する(ステップS5)。このように判定した発光状態変更部33は、音声認識が可能なため発声待機中であることを搭乗者に通知するために、例えば発光状態対応テーブルを用いて、調光情報を出力する。ここでの調光情報は、発光部4の状態を「発光状態A」にするように、発光部4の発光状態を制御する情報である(ステップS6)。発光状態対応テーブルの詳細については後述する。
ステップS4に戻り、例えば、音声レベルが特定のレベル以上であるため音声が検出されている状態であるときには、発光状態変更部33は、車両内の搭乗者が発声中であると判定する(ステップS4,Yes)。
この場合、発光状態変更部33は、車両内が音声認識に適した環境下で、音声認識装置200が音声を認識中であると判定する(ステップS7)。このように判定した発光状態変更部33は、音声認識装置200が音声認識中であることを搭乗者に通知するために、前述した発光状態対応テーブルを用いて、調光情報を出力する。ここでの調光情報は、発光部4の状態を「発光状態B」にするように、発光部4の発光状態を制御する情報である(ステップS8)。
ステップS3に戻り、騒音レベルが閾値を超えている場合(ステップS3,Yes)、環境判定部32は、車両内の環境が音声の認識に適した状態ではないことを示す判定結果情報を、発光状態変更部33へ出力する。この判定結果情報を入力した発光状態変更部33は、車両内の環境が音声の認識に適した状態ではないため、搭乗者に対して発声の抑止を促す必要があると判定する(ステップS9)。このように判定した発光状態変更部33は、発声の抑止を促すために、前述した発光状態対応テーブルを用いて、調光情報を出力する。ここでの調光情報は、発光部4の状態を「発光状態C」にするように、発光部4の発光状態を制御する情報である(ステップS10)。
図4は発光状態対応テーブルの第1の例を示す図である。図4に示される発光状態対応テーブル33Aには、発光状態変更部33による判定結果と、発光部4の発光状態とが複数対応付けられている。判定結果が「発声待機中」のとき、これに対応する発光状態は「青色」(発光状態A)である。発光状態対応テーブル33Aの発光状態Aは第1状態である。判定結果が「音声検出中」のとき、これに対応する発光状態は「緑色」(発光状態B)である。判定結果が「発声抑止中」のとき、これに対応する発光状態は「赤色」(発光状態C)である。発光状態対応テーブル33Aの発光状態Cは第2状態である。なお、これらの発光状態に対応する色は、一例であり、車両内の環境が音声の認識に適した状態であるか否かを搭乗者に通知できる色であれば、これらに限定されない。
ここでは発光色を変化させる例について説明したが、少なくと「発声待機中」、「音声検出中」、「発声抑止中」の何れかであることを搭乗者が判別できるような発光状態にできればよいため、図5に示すように、発光部4の点灯状態を変化させるように構成してもよい。図5は発光状態対応テーブルの第2の例を示す図である。図4に示される発光状態対応テーブル33Aとの相違点は、図5に示される発光状態対応テーブル33Bでは、「発声待機中」に対応する発光状態が「点灯」(発光状態A)とされ、「音声検出中」に対応する発光状態が「点滅」(発光状態B)とされ、「発声抑止中」に対応する発光状態が「消灯」(発光状態C)とされていることである。発光状態対応テーブル33Bの発光状態Aは第1状態である。発光状態対応テーブル33Bの発光状態Cは第2状態である。
なお発光状態変更部33は、発光状態対応テーブル33A及び発光状態対応テーブル33B以外にも、例えば車両内の環境が音声の認識に適した状態であるか否かの判定結果に対して、発光状態別に発光色、発光強度などの対応関係を換算する換算式を記憶しておき、判定結果に対応した換算式を使用して、発光状態を変更させてもよい。
図6は本発明の実施の形態1に係る音声認識支援装置を実現するためのハードウェア構成例を示す図である。音声認識支援装置100−1は、CPU(Central Processing Unit)、システムLSI(Large Scale Integration)などのプロセッサ41−1と、RAM(Random Access Memory)、ROM(Read Only Memory)などで構成されるメモリ42−1と、入出力インターフェイス43−1とにより実現することが可能である。なお、プロセッサ41−1は、マイクロコンピュータ、DSP(Digital Signal Processor)といった演算手段であってもよい。プロセッサ41−1、メモリ42−1及び入出力インターフェイス43−1は、バス44−1に接続され、バス44−1を介して、情報の受け渡しを相互に行うことが可能である。入出力インターフェイス43−1は、音声認識支援装置100−1が、音声認識装置200及び発光部4との間で情報の送受信を行う。音声認識支援装置100−1を実現する場合、音声認識支援装置100−1用のプログラムをメモリ42−1に格納しておき、このプログラムをプロセッサ41−1が実行することにより、音レベル算出部2及び発光制御部3−1が実現される。音声認識支援装置100−1用のプログラムは、判定ステップと、発光制御ステップとをコンピュータに実行させる音声認識支援プログラムである。判定ステップは、車両内で検出される人の音声のレベルを示す音声レベルと、車両内で検出され騒音のレベルを示す騒音レベルと、車両内の環境が音声の認識に適した状態であることを判定する閾値とに基づき、車両内の環境が音声の認識に適した状態であるか否かを判定する処理である。発光制御ステップは、判定ステップで車両内の環境が音声の認識に適した状態であると判定された場合には、車両内に設けられる発光部の発光状態を第1状態にさせ、判定ステップで車両内の環境が音声の認識に適した状態ではないと判定された場合には、発光部の発光状態を第1状態とは異なる第2状態に変化させる処理である。
以上に説明したように実施の形態1に係る音声認識支援装置100−1は、車両内の環境が音声の認識に適した状態であると判定した場合には、発光部の発光状態を第1状態にさせ、車両内の環境が音声の認識に適した状態ではないと判定した場合には、発光部の発光状態を第1状態とは異なる第2状態に変化させる発光制御部を備える。この構成により、車両の搭乗者は、発光部の発光状態により、音声認識に適した環境であるか否かを把握することができる。また、音声認識に適した環境であるか否かを把握できるため、前述した従来技術に比べて、人の認知負荷の増加を抑制できる。
実施の形態2.
図7は本発明の実施の形態2に係る音声認識支援装置の構成例を示す図である。実施の形態1に係る音声認識支援装置100−1との相違点は、実施の形態2に係る音声認識支援装置100−2には、発光制御部3−1の代わりに発光制御部3−2が設けられ、発光制御部3−2には、閾値生成部31、環境判定部32及び発光状態変更部33に加えて、運転状態判定部35が設けられていることである。運転状態判定部35は、車両から得られる車両情報1001に基づき、発声を抑止した方が望ましいか否かを判定し、判定の結果を、運転状態を示す運転状態情報として出力する。
次に図8及び図9を用いて音声認識支援装置100−2の動作を説明する。図8は本発明の実施の形態2に係る音声認識支援装置の動作を説明するためのシーケンスチャートである。図9は本発明の実施の形態2に係る音声認識支援装置の動作を説明するためのフローチャートである。図8に示されるシーケンスチャートにおいて、図2に示されるシーケンスチャートとの相違点は、運転状態判定部35が追加されていることと、運転状態判定部35から出力される運転状態情報が環境判定部32に入力されていることである。図9に示されるフローチャートにおいて、図3に示されるフローチャートとの相違点は、ステップS3とステップS4との間にステップS31の処理が追加されていることと、ステップS32及びステップS33の処理が追加されていることである。ステップS31、ステップS32及びステップS33以外の処理は、図3に示される各ステップの処理と同様のため、説明を割愛する。
ステップS3において、騒音レベルが閾値を超えていない場合(ステップS3,No)、ステップS31の処理が実行される。ステップS31において、運転状態判定部35は、車両から得られる車両情報1001に基づき、運転手の運転状態が発声に適した状態であるか否かを判定する。車両情報1001は、例えば、車両の走行速度を示す情報、操舵装置の操舵状態を示す情報、ブレーキ操作状態を示す情報、先進運転支援システム(Advanced driver-assistance systems:ADAS)から取得される情報などである。ADASは、道路交通の利便性を高めるため、運転手の運転操作を支援するシステムである。
例えば、車両情報1001が操舵状態を示す情報である場合、運転状態判定部35は、当該車両情報1001を解析することにより、車両が直線道路を走行中であるか、カーブを走行中であるかを判別することができる。また車両情報1001が走行速度を示す情報である場合、運転状態判定部35は、当該車両情報1001を解析することにより、車両が低速走行中であるか、高速走行中であるかを判別することができる。例えば、高速道路のカーブを車両が時速100km/hで走行しているときの音声操作は、運転手の注意力の低下を招く蓋然性が高い。そのため、運転状態判定部35は、発声を抑止した方が望ましいと判定する。一方、例えば一般道路の直線道路を車両が時速30km/hで走行しているときの音声操作は、運転手の注意力の低下を招く蓋然性が低い。そのため、そのような状況では、運転状態判定部35は、発声を抑止する必要がないと判定する。
このように、運転状態判定部35は、車両情報1001に基づき、発声を抑止した方が望ましいか否かを判定する。発声を抑止した方が望ましい場合(ステップS31,Yes)、運転状態判定部35は、発声の抑止が望ましい運転状態であることを示す運転状態情報を、環境判定部32に出力する。この運転状態情報を入力した環境判定部32は、車両内の環境が音声の認識に適した状態ではないため、搭乗者に対して発声の抑止を促す必要があると判定する(ステップS32)。この判定結果情報を入力した発光状態変更部33は、発声の抑止を促すため、前述した発光状態対応テーブルを用いて、調光情報を出力する。ここでの調光情報は、発光部4の状態を「発光状態C」にするように、発光部4の発光状態を制御する情報である(ステップS33)。
ステップS31に戻り、発声の抑止が望ましくない場合(ステップS31,No)、運転状態判定部35は、発声の抑止が望ましくない運転状態であることを示す運転状態情報を、環境判定部32に出力する。この運転状態情報を入力した環境判定部32は、ステップS4の処理を実行する。
図10は本発明の実施の形態2に係る音声認識支援装置を実現するためのハードウェア構成例を示す図である。音声認識支援装置100−2は、CPU、システムLSIなどのプロセッサ41−2と、RAM、ROMなどで構成されるメモリ42−2と、入出力インターフェイス43−2とにより実現することが可能である。なお、プロセッサ41−2は、マイクロコンピュータ、DSPといった演算手段であってもよい。プロセッサ41−2、メモリ42−2及び入出力インターフェイス43−2は、バス44−2に接続され、バス44−2を介して、情報の受け渡しを相互に行うことが可能である。入出力インターフェイス43−2は、音声認識支援装置100−2が、音声認識装置200及び発光部4との間で情報の送受信を行う。音声認識支援装置100−2を実現する場合、音声認識支援装置100−2用のプログラムをメモリ42−2に格納しておき、このプログラムをプロセッサ41−2が実行することにより、音レベル算出部2及び発光制御部3−2が実現される。
以上に説明したように実施の形態2に係る音声認識支援装置100−2は、音声レベル及び騒音レベルに加えて、車両から得られる車両情報に基づき、車両内の環境が音声の認識に適した状態であるか否かを判定するように構成されている。その構成により、運転手の注意力の低下を招く蓋然性が高い運転状態での発声を抑止しながら、音声認識装置200を有効に利用した快適な運転環境を提供できる。
なお、実施の形態2の発光制御部3−2は、車両情報が例えば車速情報であり、この車速情報に基づき車両が走行中ではないと判定した場合、車両内の環境が音声の認識に適した状態であると判定するように構成してもよい。このように構成することにより、搭乗者は、発光部4の発光状態を意識せずに、音声認識装置200を利用することができる。また、実施の形態2の発光制御部3−2は、車両情報が例えば車速情報であり、この車速情報に基づき車両が走行中ではないと判定した場合、発光部4を消灯させるように構成してもよい。このように構成することにより、発光部4の発光に必要な電力の消費を抑制できる。
また、実施の形態2の発光制御部3−2は、例えば車速、ハンドルの舵角などに応じて、発声待機中の発光部4の発光量を段階的に又は連続的に変化させるように構成してもよい。具体的には第1速度域(時速0km/h〜10km/h)、第2速度域(時速11km/h〜20km/h)、第3速度域(時速21km/h〜30km/h)などの速度区分に応じて、発話待機中の発光量が調整される。例えば第1速度域、第2速度域、第3速度域の順で、発話待機中の発光量が低下される。またハンドルの舵角が、小(10度以下)、中(11度〜90度)、大(91度以上)などの角度区分に応じて、発話待機中の発光量が調整される。具体的には舵角が小、中、大の順で、発話待機中の発光量が低下される。この構成により、発話待機中の発光量が一定の場合に比べて、発話抑止の状態に近づき、運転手の注意力の低下を抑制できる。
また、実施の形態2の発光制御部3−2は、例えば車速、ハンドルの舵角などに応じて、音声認識中の発光部4の点滅周期を連続的に変化させるように構成してもよい。例えば、前述した速度区分に応じて、音声認識中の点滅周期が調整される。具体的には、第1速度域、第2速度域、第3速度域の順で、点滅周期が短くされる。また、ハンドルの舵角が、前述した角度区分に応じて、音声認識中の点滅周期が調整される。具体的には、舵角が小、中、大の順で、点滅周期が短くされる。この構成により、点滅周期に変化を持たせることができるため、運転に意識が向いている状況で、その意識が運転状況に応じて変化する場合でも、音声認識中の点滅周期が一定の場合に比べて、発光部4の点灯状態を見落としにくくなる。従って、音声認識装置200を有効に利用した、より一層快適な運転環境を提供できる。
なお、実施の形態1,2では、音声認識支援装置が車両に設けられる構成例について説明したが、実施の形態1,2のそれぞれの音声認識支援装置は、音声認識を利用したあらゆる装置又は機械(例えば対話型ロボット、鉄道車両、航空機など)にも適用可能である。
1 音検出部
2 音レベル算出部
3−1 発光制御部
3−2 発光制御部
4 発光部
11 音声検出部
12 騒音検出部
21 音声レベル算出部
22 騒音レベル算出部
31 閾値生成部
32 環境判定部
33 発光状態変更部
33A 発光状態対応テーブル
33B 発光状態対応テーブル
34 閾値補正部
35 運転状態判定部
41−1 プロセッサ
41−2 プロセッサ
42−1 メモリ
42−2 メモリ
43−1 入出力インターフェイス
43−2 入出力インターフェイス
44−1 バス
44−2 バス
100−1 音声認識支援装置
100−2 音声認識支援装置
200 音声認識装置
201 S/N比情報
1000 車両
1001 車両情報

Claims (5)

  1. 発光部と、
    音検出部と、
    前記音検出部で検出される人の音声のレベルを示す音声レベルと、前記音検出部で検出される騒音のレベルを示す騒音レベルと、前記音検出部の周囲環境が前記音声の認識に適した状態であることを判定する閾値とに基づき、前記音検出部の周囲環境が前記音声の認識に適した状態であるか否かを判定し、前記音検出部の周囲環境が前記音声の認識に適した状態であると判定した場合には、前記発光部の発光状態を第1状態にさせ、前記音検出部の周囲環境が前記音声の認識に適した状態ではないと判定した場合には、前記発光部の発光状態を前記第1状態とは異なる第2状態に変化させる発光制御部と、
    を備える音声認識支援装置。
  2. 前記発光制御部は、前記音声レベル及び前記騒音レベルに加えて、車両から得られる車両情報に基づき、前記車両内の環境が前記音声の認識に適した状態であるか否かを判定する請求項1に記載の音声認識支援装置。
  3. 前記発光制御部は、前記車両情報に基づき、前記車両が走行中ではないと判定したとき、前記車両内の環境が前記音声の認識に適した状態であると判定する請求項2に記載の音声認識支援装置。
  4. 前記発光制御部は、前記車両が走行中ではないと判定したとき、前記発光部を消灯させる請求項3に記載の音声認識支援装置。
  5. 音検出部で検出される人の音声のレベルを示す音声レベルと、前記音検出部で検出される騒音のレベルを示す騒音レベルと、前記音検出部の周囲環境が前記音声の認識に適した状態であることを判定する閾値とに基づき、前記音検出部の周囲環境が前記音声の認識に適した状態であるか否かを判定する判定ステップと、
    前記判定ステップで前記音検出部の周囲環境が前記音声の認識に適した状態であると判定された場合には、発光部の発光状態を第1状態にさせ、前記判定ステップで前記音検出部の周囲環境が前記音声の認識に適した状態ではないと判定された場合には、前記発光部の発光状態を前記第1状態とは異なる第2状態に変化させる発光制御ステップと、
    をコンピュータに実行させる音声認識支援プログラム。
JP2018215240A 2018-11-16 2018-11-16 音声認識支援装置及び音声認識支援プログラム Pending JP2020085953A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018215240A JP2020085953A (ja) 2018-11-16 2018-11-16 音声認識支援装置及び音声認識支援プログラム
US16/656,659 US20200160854A1 (en) 2018-11-16 2019-10-18 Voice recognition supporting device and voice recognition supporting program
CN201911080965.5A CN111199736A (zh) 2018-11-16 2019-11-07 语音识别辅助装置以及语音识别辅助程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018215240A JP2020085953A (ja) 2018-11-16 2018-11-16 音声認識支援装置及び音声認識支援プログラム

Publications (1)

Publication Number Publication Date
JP2020085953A true JP2020085953A (ja) 2020-06-04

Family

ID=70726700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018215240A Pending JP2020085953A (ja) 2018-11-16 2018-11-16 音声認識支援装置及び音声認識支援プログラム

Country Status (3)

Country Link
US (1) US20200160854A1 (ja)
JP (1) JP2020085953A (ja)
CN (1) CN111199736A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022158824A1 (en) * 2021-01-21 2022-07-28 Samsung Electronics Co., Ltd. Method and device for controlling electronic apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240291A (ja) * 1996-12-26 1998-09-11 Seiko Epson Corp 音声認識装置における音声入力可能状態報知方法及びその装置
JP2005263155A (ja) * 2004-03-22 2005-09-29 Clarion Co Ltd 車載用電子機器、その制御方法、制御プログラム及び記録媒体

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675588A (ja) * 1992-08-27 1994-03-18 Fujitsu Ltd 音声認識装置
WO2012137263A1 (ja) * 2011-04-08 2012-10-11 三菱電機株式会社 音声認識装置およびナビゲーション装置
WO2013175637A1 (ja) * 2012-05-25 2013-11-28 トヨタ自動車株式会社 接近車両検出装置及び運転支援システム
US9305155B1 (en) * 2015-02-12 2016-04-05 United Services Automobile Association (Usaa) Toggling biometric authentication
JP6804909B2 (ja) * 2016-09-15 2020-12-23 東芝テック株式会社 音声認識装置、音声認識方法及び音声認識プログラム
JP6553111B2 (ja) * 2017-03-21 2019-07-31 株式会社東芝 音声認識装置、音声認識方法及び音声認識プログラム
CN108122556B (zh) * 2017-08-08 2021-09-24 大众问问(北京)信息科技有限公司 减少驾驶人语音唤醒指令词误触发的方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240291A (ja) * 1996-12-26 1998-09-11 Seiko Epson Corp 音声認識装置における音声入力可能状態報知方法及びその装置
JP2005263155A (ja) * 2004-03-22 2005-09-29 Clarion Co Ltd 車載用電子機器、その制御方法、制御プログラム及び記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022158824A1 (en) * 2021-01-21 2022-07-28 Samsung Electronics Co., Ltd. Method and device for controlling electronic apparatus

Also Published As

Publication number Publication date
US20200160854A1 (en) 2020-05-21
CN111199736A (zh) 2020-05-26

Similar Documents

Publication Publication Date Title
US9230538B2 (en) Voice recognition device and navigation device
US7881934B2 (en) Method and system for adjusting the voice prompt of an interactive system based upon the user's state
US10685664B1 (en) Analyzing noise levels to determine usability of microphones
JP2017090611A (ja) 音声認識制御システム
JP2017090613A (ja) 音声認識制御システム
US20180170242A1 (en) Bluetooth-enabled vehicle lighting control hub
US9928851B2 (en) Voice verifying system and voice verifying method which can determine if voice signal is valid or not
CN112309380A (zh) 一种语音控制方法、***、设备及汽车
JP2018207169A (ja) 機器制御装置及び機器制御方法
JP2018036902A (ja) 機器操作システム、機器操作方法および機器操作プログラム
JP2022543201A (ja) 発話認識の有効化
JP2020085953A (ja) 音声認識支援装置及び音声認識支援プログラム
TW201515879A (zh) 汽車及其語音控制系統
US20230012342A1 (en) Vehicle avatar devices for interactive virtual assistant
JP7063005B2 (ja) 運転支援方法、車両、及び運転支援システム
WO2019202351A1 (ja) 機器制御装置及び機器を制御する制御方法
JPH10240291A (ja) 音声認識装置における音声入力可能状態報知方法及びその装置
KR20230142243A (ko) 대화 처리 방법, 사용자 단말 및 대화 시스템
JPS59180599A (ja) 車載用音声認識制御装置
KR20160132574A (ko) 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법
JP2017146531A (ja) 音声案内システム
CN114765914A (zh) K歌控制方法及相关设备
US20230290342A1 (en) Dialogue system and control method thereof
JP2024010901A (ja) 報知システム
KR20070024158A (ko) 차량용 음성인식 시스템 및 그 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220404

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220906