JP5252119B2 - エレベータの音声呼び登録装置 - Google Patents

エレベータの音声呼び登録装置 Download PDF

Info

Publication number
JP5252119B2
JP5252119B2 JP2012504246A JP2012504246A JP5252119B2 JP 5252119 B2 JP5252119 B2 JP 5252119B2 JP 2012504246 A JP2012504246 A JP 2012504246A JP 2012504246 A JP2012504246 A JP 2012504246A JP 5252119 B2 JP5252119 B2 JP 5252119B2
Authority
JP
Japan
Prior art keywords
elevator
information
user
acoustic model
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012504246A
Other languages
English (en)
Other versions
JPWO2011111221A1 (ja
Inventor
絢子 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2011111221A1 publication Critical patent/JPWO2011111221A1/ja
Application granted granted Critical
Publication of JP5252119B2 publication Critical patent/JP5252119B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B66HOISTING; LIFTING; HAULING
    • B66BELEVATORS; ESCALATORS OR MOVING WALKWAYS
    • B66B1/00Control systems of elevators in general
    • B66B1/34Details, e.g. call counting devices, data transmission from car to control system, devices giving information to the control system
    • B66B1/46Adaptations of switches or switchgear
    • B66B1/461Adaptations of switches or switchgear characterised by their shape or profile

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Indicating And Signalling Devices For Elevators (AREA)
  • Elevator Control (AREA)

Description

この発明は、エレベータの呼びを音声入力により登録するエレベータの音声呼び登録装置に関するものである。
エレベータの呼びを音声入力により登録する音声呼び登録装置として、異なる認識手法を用いて音声認識を行う複数の音声認識処理部を備えたものが提案されている。この音声呼び登録装置は、複数の音声認識処理部の認識結果を併せて判定することで音声認識の確度を上げ、音声認識の確度により利用者に行う応答を変更する。これにより、利用者に快適な利用環境を与えることができる(例えば、特許文献1参照)。
しかしながら、特許文献1に記載のものを利用した場合、全ての利用者に対して同じ手法で音声認識を行うことになる。このため、音声認識処理部に用意された認識手法のいずれにも合わない音声を認識することができない。このような音声を発する利用者は、いつまでも音声入力による行先呼び等のエレベータの呼びを登録することができない。また、特許文献1に記載のものは、複数の音声認識処理部で同時に認識されないとエレベータの呼びを登録することができない。即ち、特許文献1に記載のものは、全ての利用者に対し、エレベータの呼びの登録を確定する敷居が一律に上がってしまい、使い勝手の悪いものとなっている。
これに対し、予め登録した利用者の音声のみ受付可能とする音声呼び登録装置が提案されている。この音声呼び登録装置によれば、音声の誤認識を低減することができる(例えば、特許文献2参照)。さらに、音声の分析結果を蓄積し、蓄積結果に基づいて、話者属性を認識する装置が提案されている。これらの装置によれば、話者属性の特定精度を向上し、音声の誤認識を更に低減することができる(例えば、特許文献3及び4参照)。
しかしながら、特許文献2乃至4に記載のものを音声呼び登録装置に適用した場合、利用者を特定の話者に限定する必要がある。このため、特許文献2乃至4に記載のものの利用範囲は狭くなってしまう。一方、エレベータの音声呼び登録装置は、不特定多数の利用者の音声を認識する必要がある。このため、特許文献2乃至4に記載のものを音声呼び登録装置に適用することは困難である。
これらに対し、利用用途、環境騒音で表される環境属性や発話者の性別や年齢で表される本人属性に合わせた複数の音声認識辞書(認識単語と音響モデル)を備えた装置が提案されている。この装置によれば、実際の環境属性や実際の本人属性を与えて、適切な音声認識辞書を選択することができ、発話者を限定せずに、発話者の特徴に合った音響モデルを選択することができる(例えば、特許文献5参照)。
しかしながら、特許文献5に記載のものを音声呼び登録装置に適用した場合、利用の都度、実際の環境属性や実際の利用者属性を与えなければならないという煩わしさがある。
これに対し、エレベータに設けられたカメラ装置から入力された情報に基づいて、成人男性、成人女性、子供等の利用者属性や人数を判別することで、利用状況に合った情報表示を行う表示装置が提案されている。この表示装置の判別手法を音響モデルの選択に適用すれば、利用者を限定せずに、利用者に合う可能性のある音響モデルを容易に選択することができる(例えば、特許文献6参照)。
日本特許第3082618号公報 日本特許第2557939号公報 日本特開平10−240287号公報 日本特表2003−524805号公報 日本特開2002−229584号公報 日本特開2007−261722号公報
しかしながら、特許文献6に記載の判別手法が常に正確とは限らない。このため、利用者の特徴に合っていない音響モデルが選択されてしまう場合もあるという問題があった。
この発明は、上述のような課題を解決するためになされたもので、その目的は、利用者を限定せずに、容易な方法で、エレベータの呼びを音声入力により登録する際に利用者の特徴に合った音響モデルを選択する可能性を高めることができるエレベータの音声呼び登録装置を提供することである。
この発明に係るエレベータの音声呼び登録装置は、エレベータのかご又は乗場に設けられた音声入力装置への入力音声を取り込む音声入力部と、音響特性が互いに異なる複数の音響モデルを記憶した音響モデル記憶部と、前記音声入力装置が設けられたかご又は乗場にいる利用者の特徴に関する利用者情報を抽出する利用者情報抽出部と、前記音声入力装置が設けられたかご又は乗場の位置を含む前記エレベータの状態に関するエレベータ情報を抽出するエレベータ情報抽出部と、前記利用者情報と前記エレベータ情報とに基づいて、前記入力音声から前記エレベータの呼びを認識する際に使用する音響モデルを、前記複数の音響モデルの中から選択する音響モデル選択部と、前記利用者情報抽出部が利用者情報を抽出する度に、抽出された利用者情報を前記エレベータ情報に対応付けて利用者の特徴の傾向に関する利用者傾向情報を蓄積する利用者情報記憶部と、を備え、前記音響モデル選択部は、前記利用者傾向情報に基づいて、前記エレベータが前記エレベータ情報に対応した状態のときに前記エレベータの呼びを認識する際に使用する音響モデルを選択するものである。
この発明によれば、利用者を限定せずに、容易な方法で、エレベータの呼びを音声入力により登録する際に利用者の特徴に合った音響モデルを選択する可能性を高めることができる。
この発明の実施の形態1におけるエレベータの音声呼び登録装置とエレベータ制御部の構成図である。 この発明の実施の形態1におけるエレベータの音声呼び登録装置がエレベータの呼びを登録する場合の動作を説明するためのフローチャートである。 この発明の実施の形態1におけるエレベータの音声呼び登録装置が音響モデルを選択する場合の動作を説明するためのフローチャートである。 この発明の実施の形態2におけるエレベータの音声呼び登録装置とエレベータ制御部の構成図である。 この発明の実施の形態3におけるエレベータの音声呼び登録装置とエレベータ制御部の構成図である。
この発明を実施するための形態について添付の図面に従って説明する。なお、各図中、同一又は相当する部分には同一の符号を付しており、その重複説明は適宜に簡略化ないし省略する。
実施の形態1.
一般に、エレベータはビル等の建築物に設けられる。このエレベータのかご内や乗場には、呼び登録装置が設けられる。この呼び登録装置を利用して、利用者はエレベータの呼びを登録する。そして、この呼び登録装置によって登録された呼びに応答して、エレベータのかごが昇降する。
ここで、呼び登録装置の一つとして、エレベータの呼びを音声入力により登録する音声呼び登録装置が提案されている。この音声呼び登録装置は、かご内や乗場で利用者が発した音声を認識して、エレベータの呼びを登録するものである。この音声呼び登録装置を利用すれば、両手の塞がった利用者等であってもエレベータの呼びを容易に登録することができる。
かかる音声呼び登録装置においては、利用者の発した音声が誤認識されると、利用者の希望するエレベータの呼びを登録することができなくなってしまう。そこで、本実施の形態の音声呼び登録装置では、音声の認識精度を向上するようにした。以下、本実施の形態の音声呼び登録装置を具体的に説明する。
図1はこの発明の実施の形態1におけるエレベータの音声呼び登録装置とエレベータ制御部の構成図である。
図1の音声呼び登録装置は、エレベータのかご内又は乗場に設けられる。この音声呼び登録装置は、音声入力部1、A/D変換部2、音声切出し部3、音響分析部4、情報入力部5、利用者情報抽出部6、ビル情報記憶部7、音響モデル選択部8、認識辞書9、複数の音響モデル10、音声認識部11を備える。
音声入力部1は、エレベータのかご内又は乗場に設けられたマイク等の音声入力装置(図示せず)への入力音声を取込む機能を備える。A/D変換部2は、音声入力部1が取り込んだ入力音声をディジタルデータに変換する機能を備える。音声切出し部3は、A/D変換部2から渡されたディジタルデータの無音区間を検出する機能を備える。また、音声切出し部3は、無音区間情報に基づいて、ディジタルデータの無音区間に挟まれた区間を、音声認識の対象となる発話区間として切り出す機能を備える。音響分析部4は、音声切出し部3に切り出された発話区間を、フーリエ変換等の演算処理によって音声認識に使用する特徴量データに変換する機能を備える。
情報入力部5は、センサ装置、秤装置、カメラ装置等、通常のエレベータに設けられている機器に検出された利用者の特徴に関する情報を取得する機能を備える。利用者情報抽出部6は、情報入力部5に入力された情報から利用者の背格好、かごへの乗車速度等、利用者の特徴に関する利用者情報を抽出する機能を備える。ビル情報記憶部7は、ビル情報を記憶する機能を備える。このビル情報は、エレベータが設けられたビル等の建築物の各階に入居しているテナントに関する情報等、当該建築物の各階の特徴に関する建築物情報からなる。即ち、ビル情報記憶部7は、建築物情報を記憶する建築物情報記憶部として機能する。
音響モデル選択部8は、ビル情報に対応付けられた利用者の特徴の傾向に関する利用者傾向情報を抽出する機能を備える。この利用者傾向情報は、音響モデル選択部8に記憶されていてもよいし、ビル情報記憶部7等の他の記憶部に記憶されていてもよい。また、音響モデル選択部8は、利用者情報抽出部6に抽出された利用者情報、ビル情報に対応づけられた利用者傾向情報等に基づいて、利用者属性を推定する機能を備える。
この利用者属性の種類は、センサ装置、秤装置、カメラ装置等の利用者の特徴の検出内容と検出精度とを考慮して、様々なものに設定可能となっている。例えば、利用者属性は、大人と子供とを区別するように設定される場合もある。また、利用者属性は、10代、20代等、各年代を区別するように設定される場合もある。さらに、利用者属性は、男性又は女性等、性別を区別するように設定される場合もある。加えて、利用者属性は、年代、性別等の複合条件で区別するように設定される場合もある。なお、音響モデル選択部8には、利用者属性を推定する際の利用者情報、ビル情報等の各情報の重み付けを適宜設定できるようにもなっている。
認識辞書9は、例えば、「イッカイ」、「メインフロア」等、音声認識させたい単語を記憶する機能を備える。複数の音響モデル10は、各音響モデル記憶装置(図示せず)に記憶される。これらの音響モデル10は、各音素の特徴量データが一通り揃っている音響データからなる。これらの音響データは、年代、性別等、音響モデル選択部8が推定する利用者属性に対応し、音響特性が互いに異なっている。そして、これらの音響モデル10には、どの利用者属性に対応したモデルであるかを示すタグが予め付けられている。
音声認識部11は、音響モデル選択部8が推定した利用者属性に対応したタグを、複数の音響モデル10の中から検出する機能を備える。また、音声認識部11は、検出したタグを有する音響モデル10を、音響モデル選択部8が推定した利用者属性に一番近い特徴を持った音響モデル10として選択する機能を備える。即ち、実質的には、音声認識部11は、音響モデル選択部8が選択した音響モデル10を複数の音響モデル10の中から抽出するようになっている。さらに、音声認識部11は、選択した音響モデル10を使用して、音声入力部1への入力音声から認識辞書9に記述された単語を認識する機能を備える。
また、図1には、エレベータ制御部12も示される。このエレベータ制御部12は、呼び登録部13を備える。呼び登録部13は、認識辞書9の単語とエレベータが設けられたビル等の階床とを対応付けて予め記憶する機能を備える。例えば、認識辞書9の「イッカイ」には、文字通り、「1階」が対応付けて記憶される。認識辞書9の「メインフロア」にも、「1階」が対応付けて記憶される。そして、呼び登録部13は、音声認識部11に認識された単語に対応付けられた階床を認識した場合は、当該階床に対応した行先呼びをエレベータの呼びとして登録する。
また、エレベータ制御部12は、エレベータ情報管理部14も備える。このエレベータ情報管理部14は、様々なエレベータの状態を検出して管理する機能を備える。例えば、エレベータ情報管理部14は、音声入力装置が設けられたかごの又は乗場の位置、かごの走行方向、戸開閉状態等のエレベータ情報を管理する機能を備える。特に、エレベータ情報管理部14は、刻一刻と変化するかごの現在位置(現在階)を確実に検出して管理する。
本実施の形態においては、音響モデル選択部8は、エレベータ情報管理部14からエレベータ情報を抽出するエレベータ情報抽出部としても機能する。そして、音響モデル選択部8は、各エレベータ情報に対応付けられた利用者の特徴の傾向に関する利用者傾向情報を抽出する。この利用者傾向情報は、エレベータの利用者を一定期間調査することで把握される。この利用者傾向情報は、音響モデル選択部8に記憶されていてもよいし、他の記憶部に記憶されていてもよい。
かかる音響モデル選択部8は、ビル情報から抽出した利用者傾向情報を第1利用者傾向情報として認識し、エレベータ情報から抽出した利用者傾向情報を第2利用者傾向情報として認識する。そして、音響モデル選択部8は、利用者情報、第1利用者傾向情報だけでなく、第2利用者傾向情報をも考慮して、利用者属性を推定するようになっている。
次に、図2及び図3を用いて、本実施の形態の音声呼び登録装置がエレベータの呼びを登録する場合の動作を説明する。
図2はこの発明の実施の形態1におけるエレベータの音声呼び登録装置がエレベータの呼びを登録する場合の動作を説明するためのフローチャートである。図3はこの発明の実施の形態1におけるエレベータの音声呼び登録装置が音響モデルを選択する場合の動作を説明するためのフローチャートである。
まず、図2を用いて、エレベータの呼びを登録する手順の概要を説明する。
即ち、ステップS1で、かご内又は乗場の音声入力装置に音声が入力されると、音声入力部1が当該音声を取り込んで、ステップS2に進む。ステップS2では、A/D変換部2が当該音声をディジタルデータに変換し、ステップS3に進む。
ステップS3では、音声切出し部3が当該ディジタルデータの発話区間を切り出して検出し、ステップS4に進む。ステップS4では、音響分析部4が当該発話区間を音声認識に使用する特徴量データに変換して音響分析し、ステップS5に進む。ステップS5では、音響モデル選択部8が実質的に音響モデル10を選択し、ステップS6に進む。
ステップS6では、音声認識部11が、音響分析部4に音響分析された特徴量データを、音響モデル選択部8に選択された音響モデル10の音響データと比較する。これにより、音声入力部1に取り込んだ入力音声が認識され、ステップS7に進む。ステップS7では、音声認識部11が入力音声の認識結果をエレベータ制御部12の呼び登録部13に出力し、ステップS8に進む。
ステップS8では、呼び登録部13が当該認識結果に係る単語に対応付けられた階床を認識できたか否かを判断する。当該認識結果に係る単語に対応付けられた階床が認識されなかった場合は、動作が終了する。即ち、行先呼びは登録されない。これに対し、当該認識結果に係る単語に対応付けられた階床が認識された場合は、ステップS9に進む。ステップS9では、呼び登録部13が当該階床に対応した行先呼びを登録し、動作が終了する。
ここで、図3のステップS5においては、上述したように、利用者情報、第1利用者傾向情報だけでなく、第2利用者傾向情報もが考慮され、入力音声からエレベータの呼びを認識する際に使用する音響モデル10が選択される。以下、図3を用いて、本実施の形態における音響モデル10の選択手順を具体的に説明する。
まず、ステップS11では、音響モデル選択部8が、ビル情報記憶部7のビル情報を参照し、ビル情報に対応付けられた第1利用者傾向情報を抽出する。その後、ステップS12に進み、音響モデル選択部8が、エレベータ情報管理部14のエレベータ情報を参照し、現状のエレベータ情報に対応付けられた第2利用者傾向情報を抽出する。
その後、ステップS13に進み、利用者情報抽出部6が利用者情報を抽出する。その後、音響モデル選択部8が当該利用者情報を参照し、ステップS14に進む。ステップS14では、音響モデル選択部8が、利用者情報、第1利用者傾向情報だけでなく、第2利用者傾向情報をも考慮して、利用者属性を推定し、ステップS15に進む。ステップS15では、音響モデル選択部8が当該利用者属性に合った音響モデル10を実質的に選択し、動作が終了する。
以上で説明した実施の形態1によれば、利用者情報、ビル情報だけでなく、エレベータ情報もが考慮され、エレベータの呼びを認識する際に使用する音響モデル10が選択される。このため、利用者を限定せずに、容易な方法で、エレベータの呼びを音声入力により登録する際に利用者の特徴に合った音響モデル10を選択する可能性を高めることができる。
かかる音響モデル10の選択により、利用者が発した音声に対する認識精度を上げるとともに、利用者と同じ特性を持った発話者以外の無駄話やアナウンス装置からの流れる音声に反応しにくくすることができる。即ち、利用者が発した音声の誤認識と当該誤認識による呼びの誤登録とを防止する可能性を高めることができる。
また、利用者情報抽出部6は、一般にエレベータに設けられるセンサ装置、秤装置、カメラ装置等の機器が検出した利用者の特徴から利用者情報を抽出する。このため、特別な装置を付加することなく、容易な方法で、利用者の特徴に合った音響モデル10を選択する可能性を高めることができる。
なお、実施の形態1においては、選択した音響モデル10を使用し、音声認識を1回のみ行って、エレベータの呼びを登録するようになっていた。しかしながら、認識尤度の閾値を設け、音声認識部11の認識結果として認識した単語と尤度を出力するようにし、エレベータの呼びを登録するか否かを判定してもよい。そして、利用者に特徴の合うものとして選択した音響モデル10での認識尤度が低かった場合に、認識尤度が閾値を超えるまで、音声認識に使用する音響モデル10の変更を繰り返してもよい。
また、実施の形態1においては、利用者情報とビル情報とエレベータ情報とに基づいて選択された音響モデル10を使用した入力音声の認識結果を出力して、エレベータの呼びを登録するようになっていた。しかしながら、全ての音響モデル10を使用した入力音声の認識結果のうち、利用者情報とビル情報とエレベータ情報とに基づいて選択された音響モデル10を使用した入力音声の認識結果を出力して、エレベータの呼びを登録するようにしてもよい。
実施の形態2.
図4はこの発明の実施の形態2におけるエレベータの音声呼び登録装置とエレベータ制御部の構成図である。なお、実施の形態1と同一又は相当部分には同一符号を付して説明を省略する。
実施の形態2の音声呼び登録装置は、実施の形態1の音声呼び登録装置に利用者情報記憶部15を付加したものである。この利用者情報記憶部15は、利用者情報抽出部6が利用者情報を抽出する度に、抽出された利用者情報をエレベータ情報に対応付けて記憶することにより、第2利用者傾向情報を蓄積する機能を備える。
即ち、実施の形態2においては、利用者情報記憶部15がエレベータ情報に連動して第2利用者傾向情報を学習する。そして、その学習結果が音響モデル10の選択に反映される。具体的には、音響モデル選択部8は、利用者情報、第1利用者傾向だけでなく、実際のエレベータの運用中に自動で蓄積された第2利用者傾向情報をも考慮して、エレベータの呼びを認識する際に使用する音響モデル10を選択するように設定される。
そして、本実施の形態の音響モデル選択部8は、第2利用者傾向情報の蓄積量の増加に伴って、第2利用者傾向情報の重み付けを増加させるとともに、第1利用者傾向情報の重み付けを減少させるように設定される。例えば、音響モデル選択部8は、第1利用者傾向情報の重み付けを第2利用者傾向情報の学習量に反比例して減少させるように設定される。
かかる構成の音声呼び登録装置においては、音声認識部11は、エレベータ情報が変化する度に、エレベータの呼びを認識する際に使用する音響モデル10を、音響モデル選択部8が実質的に選択した音響モデル10に切り換える。そして、音声認識部11は、エレベータ情報が変化する度に切り換わった音響モデル10を使用して、音声入力部1が取り込んだ入力音声を認識する。
以上で説明した実施の形態2によれば、実際のエレベータの運用中に蓄積されたエレベータ情報に対応した第2利用者傾向情報もが考慮され、エレベータが各エレベータ情報に対応した状態のときに使用される音響モデル10が選択される。このため、利用者の特徴に合った音響モデル10を選択する可能性をより高めることができる。
ここで、ビルに入居したテナント等の変更に伴って利用者の傾向が変わった場合、ビル情報を更新しないと、テナント等の変更当初は、利用者に合った音響モデル10を選択する可能性が下がる。しかしながら、実施の形態2においては、各エレベータ情報に対応した第2利用者傾向情報の蓄積量の増加に伴って、第2利用者傾向情報の重み付けが増加するとともに、ビル情報に対応した第1利用者傾向情報の重み付けが減少する。このため、エレベータの運用を継続して第2利用者傾向の蓄積量が増加すれば、ビル情報を手動で更新することを忘れていても、利用者に合った音響モデル10を選択する可能性を高くすることができる。
実施の形態3.
図4はこの発明の実施の形態3におけるエレベータの音声呼び登録装置とエレベータ制御部の構成図である。なお、実施の形態1又は2と同一又は相当部分には同一符号を付して説明を省略する。
実施の形態3の音声呼び登録装置には、実施の形態1の情報入力部5、利用者情報抽出部6、ビル情報記憶部7に代わって、音声特徴抽出部16、音声特徴記憶部17、入力音声学習部18が設けられる。
音声特徴抽出部16は、音響分析部4によって変換された特徴量データから音声の特徴を抽出する機能を備える。この音声の特徴は、大人の声、子供の声、女性の声、男性の声等に区別される。即ち、実施の形態3においては、音声特徴抽出部16は、利用者の入力音声の特徴から利用者情報を抽出する利用者情報抽出部として機能する。
音声特徴記憶部17は、音声特徴抽出部16に音声の特徴が抽出される度に、利用者の音声の特徴をエレベータ情報と対応付けて記憶して、第2利用者傾向情報を蓄積する機能を備える。即ち、実施の形態3においては、音声特徴記憶部17が実施の形態2の利用者情報記憶部に相当するものとして機能する。
入力音声学習部18には、エレベータが各エレベータ情報に対応した状態のときに使用される音響モデル10の初期設定として不特定話者モデルが設定されている。そして、入力音声学習部18は、音声特徴記憶部17に蓄積された第2利用者傾向情報に基づいて、各エレベータ状態のときにどのような音声特徴を持った利用者が多いのかを学習する。即ち、入力音声学習部18は、上記学習によって、エレベータが各エレベータ情報に対応した状態のときに使用する音響モデル10の設定を徐々に変化させるようになっている。
そして、実施の形態3の音響モデル選択部8は、入力音声学習部18が学習した各エレベータ情報に対応した第2利用者傾向情報に基づいて、エレベータの呼びを認識する際に使用する音響モデル10を、複数の音響モデル10の中から選択するように設定されている。
かかる構成の音声呼び登録装置においては、音声認識部11は、エレベータ情報が変化する度に、エレベータの呼びを認識する際に使用する音響モデル10を、音響モデル選択部8が実質的に選択した音響モデル10に切り換える。そして、音声認識部11は、エレベータ情報が変化する度に切り換わった音響モデル10を使用して、音声入力部1が取り込んだ入力音声を認識する。
以上で説明した実施の形態3によれば、センサ装置、秤装置、カメラ装置からの利用者情報やビル情報に対応付けられた第1利用者傾向情報が抽出されなくても、利用者の特徴に合った音響モデル10を選択する可能性を高めることができる。
以上のように、この発明に係るエレベータの音声呼び登録装置によれば、利用者を限定せずに、容易な方法で、エレベータの呼びを音声入力により登録する際に利用者の特徴に合った音響モデルを選択する可能性を高めるエレベータに利用できる。
1 音声入力部
2 A/D変換部
3 音声切出し部
4 音響分析部
5 情報入力部
6 利用者情報抽出部
7 ビル情報記憶部
8 音響モデル選択部
9 認識辞書
10 音響モデル
11 音声認識部
12 エレベータ制御部
13 呼び登録部
14 エレベータ情報管理部
15 利用者情報記憶部
16 音声特徴抽出部
17 音声特徴記憶部
18 入力音声学習部

Claims (7)

  1. エレベータのかご又は乗場に設けられた音声入力装置への入力音声を取り込む音声入力部と、
    音響特性が互いに異なる複数の音響モデルを記憶した音響モデル記憶部と、
    前記音声入力装置が設けられたかご又は乗場にいる利用者の特徴に関する利用者情報を抽出する利用者情報抽出部と、
    前記音声入力装置が設けられたかご又は乗場の位置を含む前記エレベータの状態に関するエレベータ情報を抽出するエレベータ情報抽出部と、
    前記利用者情報と前記エレベータ情報とに基づいて、前記入力音声から前記エレベータの呼びを認識する際に使用する音響モデルを、前記複数の音響モデルの中から選択する音響モデル選択部と、
    前記利用者情報抽出部が利用者情報を抽出する度に、抽出された利用者情報を前記エレベータ情報に対応付けて利用者の特徴の傾向に関する利用者傾向情報を蓄積する利用者情報記憶部と、
    を備え
    前記音響モデル選択部は、前記利用者傾向情報に基づいて、前記エレベータが前記エレベータ情報に対応した状態のときに前記エレベータの呼びを認識する際に使用する音響モデルを選択することを特徴とするエレベータの音声呼び登録装置。
  2. 前記音響モデル選択部に選択された音響モデルを使用した前記入力音声の認識結果を出力する音声認識部、
    を備えたことを特徴とする請求項1記載のエレベータの音声呼び登録装置。
  3. 前記複数の音響モデルを使用した前記入力音声の認識結果のうち、前記音響モデル選択部に選択された音響モデルを使用した前記入力音声の認識結果を出力する音声認識部、
    を備えたことを特徴とする請求項1記載のエレベータの音声呼び登録装置。
  4. 前記利用者情報抽出部は、前記エレベータに設けられたセンサ装置、秤装置、カメラ装置のうちの少なくとも一つが検出した利用者の特徴から前記利用者情報を抽出することを特徴とする請求項1〜請求項3のいずれかに記載のエレベータの音声呼び登録装置。
  5. 前記エレベータが設けられた建築物の各階の特徴に関する建築物情報を記憶した建築物情報記憶部、
    を備え、
    前記音響モデル選択部は、前記利用者傾向情報と前記建築物情報とに基づいて、前記エレベータの呼びを認識する際に使用する音響モデルを選択することを特徴とする請求項1〜請求項4のいずれかに記載のエレベータの音声呼び登録装置。
  6. 前記音響モデル選択部は、前記利用者傾向情報の蓄積量の増加に伴って、音響モデルを選択する際に、前記利用者傾向情報の重み付けを増加させるとともに、前記建築物情報の重み付けを減少させることを特徴とする請求項記載のエレベータの音声呼び登録装置。
  7. 前記利用者情報抽出部は、前記入力音声の特徴から前記利用者情報を抽出することを特徴とする請求項〜請求項6のいずれかに記載のエレベータの音声呼び登録装置。
JP2012504246A 2010-03-12 2010-03-12 エレベータの音声呼び登録装置 Active JP5252119B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/054222 WO2011111221A1 (ja) 2010-03-12 2010-03-12 エレベータの音声呼び登録装置

Publications (2)

Publication Number Publication Date
JPWO2011111221A1 JPWO2011111221A1 (ja) 2013-06-27
JP5252119B2 true JP5252119B2 (ja) 2013-07-31

Family

ID=44563063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012504246A Active JP5252119B2 (ja) 2010-03-12 2010-03-12 エレベータの音声呼び登録装置

Country Status (3)

Country Link
JP (1) JP5252119B2 (ja)
CN (1) CN102762477B (ja)
WO (1) WO2011111221A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5903061B2 (ja) * 2013-03-01 2016-04-13 株式会社日立製作所 エレベーターシステム
CN104401822A (zh) * 2014-10-30 2015-03-11 合肥指南针电子科技有限责任公司 一种智能小区的语音识别自动电梯控制方法及***
EP3551563B1 (en) * 2016-12-06 2020-09-23 Inventio AG Elevator installation with predictive call based on noise analysis
JP6633231B2 (ja) * 2017-02-06 2020-01-22 三菱電機株式会社 エレベータの制御装置および制御方法
CN108373081A (zh) * 2018-04-27 2018-08-07 上海贝思特电气有限公司 一种语音播报控制电路
US11257493B2 (en) * 2019-07-11 2022-02-22 Soundhound, Inc. Vision-assisted speech processing
CN110853642B (zh) * 2019-11-14 2022-03-25 广东美的制冷设备有限公司 语音控制方法、装置、家电设备以及存储介质
CN111348499A (zh) * 2020-03-02 2020-06-30 北京声智科技有限公司 电梯控制方法、装置、电子设备及计算机可读存储介质
CN113879923B (zh) * 2021-08-31 2023-08-04 北京声智科技有限公司 电梯控制方法、***、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1195789A (ja) * 1997-09-25 1999-04-09 Hitachi Ltd 音声認識システムおよび音声認識システムにおける話者適応方法
JP2002128404A (ja) * 2000-10-27 2002-05-09 Hitachi Building Systems Co Ltd エレベータの呼び登録装置
JP2002229584A (ja) * 2001-01-31 2002-08-16 Toyota Central Res & Dev Lab Inc 音声認識方法、音声情報検索方法、プログラム、記録媒体、音声認識システム、音声認識用サーバ・コンピュータおよび音声情報検索用サーバ・コンピュータ
JP2005145692A (ja) * 2003-11-19 2005-06-09 Nec Corp 利用施設最適制御システム、エレベータ最適制御システム及びそれらに用いる最適制御方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3680477B2 (ja) * 1997-02-27 2005-08-10 富士通株式会社 話者属性認識装置およびそれを用いた応答装置
JP2002274764A (ja) * 2001-03-05 2002-09-25 Otis Elevator Co 階床呼出音登録方法および点字情報報知装置
CN1394802A (zh) * 2002-07-31 2003-02-05 陈晓阳 语音识别电梯楼层选择***
JP2006327739A (ja) * 2005-05-25 2006-12-07 Mitsubishi Electric Corp エレベーターの乗場呼び登録装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1195789A (ja) * 1997-09-25 1999-04-09 Hitachi Ltd 音声認識システムおよび音声認識システムにおける話者適応方法
JP2002128404A (ja) * 2000-10-27 2002-05-09 Hitachi Building Systems Co Ltd エレベータの呼び登録装置
JP2002229584A (ja) * 2001-01-31 2002-08-16 Toyota Central Res & Dev Lab Inc 音声認識方法、音声情報検索方法、プログラム、記録媒体、音声認識システム、音声認識用サーバ・コンピュータおよび音声情報検索用サーバ・コンピュータ
JP2005145692A (ja) * 2003-11-19 2005-06-09 Nec Corp 利用施設最適制御システム、エレベータ最適制御システム及びそれらに用いる最適制御方法

Also Published As

Publication number Publication date
CN102762477B (zh) 2014-11-05
JPWO2011111221A1 (ja) 2013-06-27
WO2011111221A1 (ja) 2011-09-15
CN102762477A (zh) 2012-10-31

Similar Documents

Publication Publication Date Title
JP5252119B2 (ja) エレベータの音声呼び登録装置
JP5601419B2 (ja) エレベーターの呼び登録装置
JP6857581B2 (ja) 成長型対話装置
CN110660201B (zh) 到站提醒方法、装置、终端及存储介质
US20150262574A1 (en) Expression classification device, expression classification method, dissatisfaction detection device, dissatisfaction detection method, and medium
JP6654611B2 (ja) 成長型対話装置
US9595261B2 (en) Pattern recognition device, pattern recognition method, and computer program product
JP2019020684A (ja) 感情インタラクションモデル学習装置、感情認識装置、感情インタラクションモデル学習方法、感情認識方法、およびプログラム
JP2015107867A (ja) エレベータの音声呼び登録装置
KR20190049260A (ko) 차량의 음성인식 장치 및 방법
US20210183362A1 (en) Information processing device, information processing method, and computer-readable storage medium
JP7024799B2 (ja) 車両用操作支援装置
JP6087542B2 (ja) 話者認識装置、話者認識方法及び話者認識プログラム
JP7140523B2 (ja) 介護行為推定システム
US20200111493A1 (en) Speech recognition device and speech recognition method
KR102037789B1 (ko) 로봇을 이용한 수화통역시스템
JP5668838B2 (ja) エレベータの呼び登録装置
JP6365304B2 (ja) 会話分析装置及び会話分析方法
JP2006230446A (ja) 健康状態推定装置
JP2018087838A (ja) 音声認識装置
US10950227B2 (en) Sound processing apparatus, speech recognition apparatus, sound processing method, speech recognition method, storage medium
JP2020148805A (ja) 音声認識システム、及び、音声認識方法
JP4849630B2 (ja) 発話内容識別装置及び個人識別装置
JP2018055155A (ja) 音声対話装置および音声対話方法
JP2001134285A (ja) 音声認識装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130401

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5252119

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250