JP2007096833A - ドアホン装置 - Google Patents

ドアホン装置 Download PDF

Info

Publication number
JP2007096833A
JP2007096833A JP2005284355A JP2005284355A JP2007096833A JP 2007096833 A JP2007096833 A JP 2007096833A JP 2005284355 A JP2005284355 A JP 2005284355A JP 2005284355 A JP2005284355 A JP 2005284355A JP 2007096833 A JP2007096833 A JP 2007096833A
Authority
JP
Japan
Prior art keywords
information
unit
visitor
voice
door phone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005284355A
Other languages
English (en)
Inventor
Toshihiro Oshima
智弘 大島
Chihiro Morita
智比呂 森田
Takeshi Tanaka
健 田中
Naotake Yamamoto
尚武 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005284355A priority Critical patent/JP2007096833A/ja
Publication of JP2007096833A publication Critical patent/JP2007096833A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Abstract

【課題】本発明は、来訪者があったとき、応答する前にこの来訪者を特定するとともに関連情報を表示でき、この情報の入力に負担がかからず、操作性に優れたドアホン装置を提供することを目的とする。
【解決手段】本発明は、ドアホン親機6には、ドアホン子機のマイクから入手した音声から人物を特定する単語情報を抽出するとともに、抽出した単語情報をテキスト情報に変換する音声文字変換部51が設けられ、音声文字変換部51によって変換された取得済みテキスト情報をこれと関係付けられた来訪者情報と共に格納するデータベース部38と、マイクからの音声から変換されたテキスト情報と取得済みテキスト情報とが一致するか否かを照合する音声認証部50とが設けられ、照合結果が一致した場合に、画像情報と共に来訪者情報が表示部に表示されることを特徴とする。
【選択図】図3

Description

この発明は、来訪者があったとき、応答する前にこの来訪者を特定するとともに関連情報を表示でき、この情報の入力に負担がかからず、操作性に優れたドアホン装置に関する。
従来のドアホン装置101は、図8に示すようにドアホン端末102と宅内に配置された応答端末103との2つの装置から構成されている。図8は従来のドアホン装置の概略構成図である。このドアホン端末102には、来訪者を撮影してその画像を表す画像信号を出力するカメラ121と、来訪者によって操作される呼び出しスイッチ122と、宅内からの音声を来訪者に知らせるためのスピーカ123と、来訪者の声を宅内に伝達するためのマイク124が設けられている。
カメラ121は応答端末103内の画像表示部131に接続され、カメラ121からの画像信号は画像表示部131によって処理され、そのモニタに来訪者の顔が表示される。また、応答端末103には、呼び出しスイッチ122の操作に応答して呼び出し信号を発生する呼び出し音信号発生部132が設けられ、アンプ133によって増幅されてスピーカ134から呼び出し音が出力される。さらに、応答端末103には、呼び出し音に応答して通話を行うために、ドアホン端末102のスピーカ123及びマイク124とアンプ135を介して接続された送受話器136が設けられ、呼び出し音に応答して応対者が送受話器136を取り上げると、ドアホン端末102と応答端末103との間に通話回路が形成されるとともに、カメラ121及び画像表示部131が作動状態になるようになっている。
しかし、この従来のドアホン装置101においては、呼び出しがあったとき、宅内の応対者は送受話器136を取り上げて実際に通話し、カメラ121と画像表示部131を作動させる等の操作を行わない限り、呼び出しスイッチ122を操作したのが誰なのかを確認することができなかった。
そこで、図9に示すように、ドアホン端末102の呼び出しスイッチ122を操作する可能性のある人物に関する画像データを蓄積した人物データベース142と、呼び出しスイッチ122を操作した人物の画像データを取り込んで、これと人物データベース142に蓄積された画像データとを照合する画像認識部を備えた人物認証ドアホン装置が提案された(特許文献1参照)。図9は従来の人物認証ドアホン装置の概略構成図である。
このドアホン装置101によれば、呼び出しスイッチ122が操作された場合、制御部143はカメラ121、画像表示部131、画像認識部141、人物データベース142を作動させ、画像認識部141はカメラ121から送られてきた操作者の画像データと人物データベース142に蓄積されている各データとを照合する。両画像データを照合した結果、人物データベース142にこの人物の画像データが蓄積されていたときには、この人物の対応に適した応対者の特有な呼び出し音を呼び出し音データベース144から読み出し、スピーカ134から出力する。また、このときこの人物の画像データが蓄積されていなかったときには、呼出音の発生の有無に関する設定により、例えば一般呼び出し音を発生したりする。
人物の画像データは人物確認の結果によって登録するか否かが決定される。登録しておく必要があるときには、この画像データを人物データベース142に、また人物に最も適した応対者の呼び出し音のデータを呼び出し音データベース144に登録する。また、人物データベース142の画像の更新処理を行うこともできるものである。
しかし、以上説明した図9の(特許文献1)のドアホン装置101は、呼び出し音データベース144等のメモリ容量などで人物推定できる人数に制約が出てくるし、呼び出し方法を変更するときにはドアホン端末102を設計し直さなければならなかった。このため、応答端末103の人物認証後、人物認証結果情報を別のインターフェースを介して容量のあるメモリを有する外部接続端末装置、例えばコードレス電話親機に送信して、受信した画像で来訪者を特定し、人物認証の報知処理を行い、選択された呼び出し装置、例えばコードレス電話子機に所定の呼び出し音情報を送信する技術が提案された。呼び出し音等の情報は外部接続端末装置のメモリに記憶されるものである(特許文献2参照)。
特許第3250797号公報 特開2000−287196号公報
以上説明したように、(特許文献1)の人物認証ドアホン装置は、呼び出しスイッチ122を操作した人物の画像データを取り込んで、これと人物データベース142に蓄積された画像データとを照合するため、操作者が誰であるか直ちに分り、この操作者に最も適した応対者が応対することができるものであった。
しかし、呼び出しスイッチ122を操作した人物を対応するのに適した者に対して、来訪者があったことを単に報知するに止まり、せっかくの人物認証も十分役に立っているとはいえないものであった。しかも、メモリ容量などで人物推定できる人数に制約があり、実用性の面で問題が残るものであった。
この点、(特許文献2)のドアホン装置は、インターフェースを介して外部接続端末装置に人物認証の報知処理プログラムや呼び出し音情報を格納しておくことができ、実用性の面では上記の従来の技術を向上させたが、まだ人物認証したことが十分役立っているとはいえないものであった。基本的には上記従来の技術と同様、操作者に最も適した応対者に報知するだけのものであった。
しかし、最近、地域社会の人々の絆が薄くなり、従来のように安全は当たり前とはいえず、各家族で自衛が必要になってきている。ドアホン装置が単なる呼び出し装置というに止まらず、トラブルに巻き込まれるのを未然に防止する手段として機能できれば、また、来訪者に実際に面会する前にこの来訪者の情報を予め入手する手段として利用できれば、予め人物認証することが役立つことになる。また、家族全員にとって訪問を拒絶した方が望ましい人物もあり、このような人物であると判断された場合には、家族に対応拒否の警告をすることができる手段も必要である。さらに、認証情報や関連情報は常に変化を伴う場合が多く、情報更新がなされなければ人物認証の精度も低下するし、過去の履歴が面会するか否かの判断の大きな材料になる。
ところで、人物認証に当ってこのような来訪者の情報を予め入手するとしても、このための入力に大きな負担がかかるのではあまり意味がない。人物認証を行うとともに、この来訪者の情報を自動的に入力できるのであれば、このドアホン装置の価値を大きく高めるものとなる。さらに、上述したような絶対に訪問を拒絶したい人物に対して、家族全体で対応拒否の警告をすると同時に、その操作が簡単でなければならない。
そこで本発明は、来訪者があったとき、応答する前にこの来訪者を特定するとともに関連情報を表示でき、この情報の入力に負担がかからず、操作性に優れたドアホン装置を提供することを目的とする。
上記従来の課題を解決するために本発明は、上記の目的を達成するために、スピーカ、マイク及びカメラが設けられたドアホン子機と、ドアホン子機と音声通話しカメラの撮影した画像情報を表示する表示部が設けられたドアホン親機とを備えたドアホン装置であって、ドアホン親機には、ドアホン子機のマイクから入手した音声から人物を特定する単語情報を抽出して該単語情報をテキスト情報に変換する音声文字変換部と、音声文字変換部によって変換された取得済みテキスト情報を該テキスト情報と関係付けられた来訪者の来訪者情報と共に格納する来訪者情報記憶部と、マイクからの音声から変換されたテキスト情報と取得済みテキスト情報とが一致するか否かを照合する照合部とが設けられ、照合部の照合結果が一致した場合に、カメラからの来訪者の画像情報と共に来訪者情報が表示部に表示されることを主要な特徴とする。
本発明によれば、来訪者があったとき、来訪者のカメラによる画像情報によって、あるいはマイクによる音声情報、画像情報及び音声情報によって、応答前にこの来訪者を特定するとともに、併せてこの来訪者に関連情報を表示でき、この情報の入力に負担がかからず、操作性に優れたドアホン装置を提供できる。
上記課題を解決するために本発明の第1の発明は、スピーカ、マイク及びカメラが設けられたドアホン子機と、ドアホン子機と音声通話しカメラの撮影した画像情報を表示する表示部が設けられたドアホン親機とを備えたドアホン装置であって、ドアホン親機には、ドアホン子機のマイクから入手した音声から人物を特定する単語情報を抽出して該単語情報をテキスト情報に変換する音声文字変換部と、音声文字変換部によって変換された取得済みテキスト情報を該テキスト情報と関係付けられた来訪者の来訪者情報と共に格納する来訪者情報記憶部と、マイクからの音声から変換されたテキスト情報と取得済みテキスト情報とが一致するか否かを照合する照合部とが設けられ、照合部の照合結果が一致した場合に、カメラからの来訪者の画像情報と共に来訪者情報が表示部に表示されるドアホン装置であり、来訪者があったとき、来訪者の音声によって、応答前にこの来訪者を特定するとともに、併せてこの来訪者に関連情報を表示できるので、応答者が迅速に対応できる。また、来訪者の音声から人物を特定する単語を抽出して取得済みテキスト情報として自動的に格納するので、来訪者情報の入力がまったく負担にならない。
本発明の第2の発明は、第1の発明の音声文字変換部に代えて、ドアホン子機のマイクから入手した音声から単語情報を抽出してこれから人物を特定する単語情報を選択する音声認識部と、該音声認識部が抽出した単語をテキスト情報に変換するテキスト情報生成部とが設けられたドアホン装置であり、来訪者の音声から人物を特定する単語情報を抽出して取得済みテキスト情報として自動的に格納するので、来訪者情報の入力がまったく負担にならない。
本発明の第3の発明は、スピーカ、マイク及びカメラが設けられたドアホン子機と、ドアホン子機と音声通話しカメラの撮影した画像情報を表示する表示部が設けられたドアホン親機とを備え、ドアホン親機には、来訪者に対する取得済み音声情報と該音声情報を格納する来訪者情報記憶部と、マイクからの音声情報と取得済み音声情報とが一致するか否かを照合する照合部とが設けられ、照合部の照合結果が一致した場合に、カメラからの来訪者の画像情報と共に来訪者情報が表示部に表示されるドアホン装置であって、ドアホン親機には、ドアホン子機のマイクから入手した単語情報を抽出する抽出部と、人物を特定する単語情報を選択する推論選択部と、該推論選択部が抽出した単語情報をテキスト情報に変換するテキスト情報生成部とが設けられるとともに、来訪者情報記憶部には、抽出部によって抽出された単語情報が取得済み音声情報として格納されるとともに、テキスト情報生成部によって変換されたテキスト情報が来訪者の来訪者情報として格納されるドアホン装置であり、照合部によるマイクからの音声情報と取得済み音声情報とが一致するか否かの照合は、それぞれ抽出部によって抽出された単語情報を基に作成された特徴パラメータを使った認証を行い、マイクから入手した音声は来訪者情報を構成するテキスト情報とされるので、人物認証の手段が広がって、認証精度が向上するとともに、来訪者の関連情報を取得済みテキスト情報として自動的に格納するので、来訪者情報の入力がまったく負担にならない。
本発明の第4の発明は、スピーカ、マイク及びカメラが設けられたドアホン子機と、ドアホン子機と音声通話しカメラの撮影した画像情報を表示する表示部が設けられたドアホン親機とを備え、ドアホン親機には、来訪者に対する取得済み画像情報と該画像情報を格納する来訪者情報記憶部と、カメラの撮影した画像情報と取得済み画像情報とが一致するか否かを照合する照合部とが設けられ、照合部の照合結果が一致した場合に、カメラからの来訪者の画像情報と共に来訪者情報が表示部に表示されるドアホン装置であって、ドアホン子機のマイクから入手した音声から単語情報を抽出してこれから人物を特定する単語情報を選択する音声認識部と、音声認識部が抽出した単語をテキスト情報に変換するテキスト情報生成部とが設けられ、来訪者情報記憶部にはテキスト情報生成部によって変換された来訪者の来訪者情報として格納されるドアホン装置であり、照合部によるカメラの撮影した画像情報と取得済み画像情報が一致するか否かの照合は、それぞれ特徴パラメータを使った認証を行い、マイクから入手した音声は来訪者情報を構成するテキスト情報とされるので、人物認証の手段が広がって、認証精度が向上するとともに、来訪者の関連情報を取得済みテキスト情報として自動的に格納するので、来訪者情報の入力がまったく負担にならない。
本発明の第5の発明は、第1〜4のいずれかの発明に従属する発明であって、テキスト情報には、氏名、所属、住所、職業のいずれか1以上のテキスト情報が含まれるドアホン装置であり、氏名、所属、住所、職業のいずれか1以上のテキスト情報は、氏名であれば確実に、またその他のテキスト情報であっても1以上の情報があれば、来訪者の特定が十分行える。
本発明の第6の発明は、第1〜4のいずれかの発明に従属する発明であって、来訪者情報記憶部には、開錠許可又は開錠不可を示す開錠許可情報が格納されているドアホン装置であり、応対を拒絶したい人物に対しては開錠不可を設定できる。
本発明の第7の発明は、第1〜6のいずれかの発明に従属する発明であって、照合部の照合結果が一致したとき、来訪者情報の開錠許可情報が開錠不可であった場合に、表示部に開錠不可を表示するドアホン装置であり、応対を拒絶したい人物について開錠不可が設定されるとともに、表示部に表示されるので、宅内の人間がこの情報を共有できる。
本発明の第8の発明は、第1〜7のいずれかの発明に従属する発明であって、表示部の表示画面にタッチパネルが配置され、表示部の表示画面上にはタッチパネルで入力可能な開錠許可情報の表示がなされるドアホン装置であり、タッチパネルの開錠許可情報の表示から入力するので、操作が容易である。
本発明の第9の発明は、第7または8の発明に従属する発明であって、開錠許可情報の表示が開錠不可の場合に、開錠許可情報の表示を開錠許可に変更させることで開錠されるドアホン装置であり、開錠不可の設定がなされているとき、タッチパネルの開錠許可情報の表示を変更させて開錠表示にするので比較的簡単に開錠の変更が行える。
(実施の形態1)
本発明の実施の形態1におけるドアホン装置は音声のテキスト情報を介して人物認証を行うものである。図1(a)は本発明の実施の形態1におけるドアホン装置のドアホン子機の正面図、図1(b)は本発明の実施の形態1におけるドアホン装置のドアホン親機の正面図、図2は本発明の実施の形態1におけるドアホン装置のドアホン子機のブロック構成図、図3は本発明の実施の形態1におけるドアホン装置のドアホン親機のブロック構成図である。
図1(a)において、1は実施の形態1のドアホン装置のドアホン子機、2はドアホン子機1本体正面に設けられたCCD等のカメラ、3は後述するドアホン親機6から入力された音声を出力するためのドアホン子機1本体に設けられたスピーカ、4はドアホン子機1に音声を入力するためのマイク、5は来訪者がドアホン親機6の呼び出し行う操作ボタンである。12はドアホン子機1前に人物等が接近あるいは側を通過するときその体温等の温度でこれを検出する感知センサである。
図1(b)において、6はドアホン子機1のカメラ2が撮影した来訪者の顔等の映像を受信するとともに、ドアホン子機1のマイク4から入力された音声を受信して、人物認証を行うことができるドアホン親機である。実施の形態1のドアホン親機6は、来訪者の音声から人物認証を行うものである。また、7はドアホン親機6の正面に設けられたLCD等の表示部である。表示部7は透明なタッチパネル(図示しない)で覆われ、表示部7の表示画面上でタッチすると、タッチパネルの座標が検出されて、この座標若しくはこれを含む領域の表示に対応した機能が実現できる。
図1(b)ではドアホン親機6の表示部7に表示された表示画面は幾つかに分割され、7aはドアホン子機1から送信された人物の映像の画面領域、7bは表示部7に表示されたこの人物に関する開錠拒否の設定がなされている旨を警告する警告領域、7cは表示部7に表示された人物の過去の訪問履歴表示領域、7dはこの人物認証で来訪者が特定されたため表示される氏名や企業名、電話番号、アドレス等の関連情報の情報表示領域である。この訪問履歴表示領域7cには、過去の来訪時にどのような対応がなされたのかを示す面会の有無情報7c1も表示されている。警告領域7bに表示された開錠不可の表示7b1は予め設定されることにより表示され、別途タッチパネルに表示されるマニュアル操作の表示に触れることで、開錠許可に一時的に変更できる。
8はスピーカ、9はマイク、10は表示部7の表示を見て応答すると判断したとき押すための応答スイッチ、11は氏名や企業名、電話番号、アドレスを入力するための入力キーボード(実施の形態1の入力部)である。
続いて、図2に基づいて実施の形態1のドアホン子機1の構成について説明する。図2において、2aは撮像部20のズーム等の制御を行う撮像制御部、5aは操作ボタン5が押されたときこれを検出する操作処理部である。操作ボタン5のONによりプルアップ電圧が急激に電圧降下することを利用する。また、12は焦電センサ等の上述の感知センサ、12aは感知センサ12から入力された信号を検出するセンサ検知部である。そして、20はカメラ2を構成するCCD等の撮像部、21は撮像部20から出力された信号を処理して映像信号を出力する撮像処理部、23は撮像処理部21から出力された映像信号の周波数変調を行って8.5MHz〜10MHzのFM信号を出力する映像信号変調部である。
24はドアホン子機制御部であり、25はプログラムやデータを記憶したメモリ部である。ドアホン子機制御部24はハードウェア的には中央演算処理装置(以下、CPU)から構成され、メモリ部25やその他のメモリからプログラムを読み込んでソフトウェア的に機能実現手段として各機能を実行する。26,27はそれぞれスピーカ3とマイク4の出力を増幅するアンプ、28はビデオ信号と音声信号のドアホン親機6に対する第1信号線、29は後述する感知センサ12等からの入力信号をドアホン親機6に伝送する第2信号線である。
なお、実施の形態1の場合第1信号線28は2−ワイヤで構成され、一方に直流+22Vが印加され、他方は接地されている。また、実施の形態1では操作処理部5aや後述するドアホン操作検知部36を使って第1信号線28によって映像信号と音声信号を伝送するが、このほかの方法として、ドアホン子機1とドアホン親機6にそれぞれ通信制御部を設け、ネットワークケーブル等で結んで所定のプロトコルで通信を行う有線LANまたは無線LANを構成するのもよい。詳細な説明は省略する。
さて、マイク4から入力された通常500Hz〜2kHzの人間の音声はアンプ27で増幅され、そのまま映像信号変調部23からの8.5MHz〜10MHzのFM信号と重畳され、さらにこれに直流電圧+22Vが重畳されて第1信号線28を介してドアホン親機6に伝送される。すなわち、待機時にはドアホン親機6からドアホン子機1に+5Vが給電されているが、この状態で操作ボタン5を押すと、操作処理部5aの作用で第1信号線28に急激な電圧降下を起こし、+22Vが給電され、ドアホン親機6において操作ボタン5が押下されたことが検知されてその後+22Vが重畳されたFM信号が伝送され、ドアホン親機6は表示部7に映像を表示する。なお、ドアホン親機6の動作中に操作ボタン5を押した場合はFM信号に影響しないように検知信号が重畳されて伝送される。この後、ドアホン親機6は人物認証を開始し、その結果によって関連情報、例えば警告領域7bに表示開錠不可の表示7b1や、訪問履歴表示領域7cに訪問履歴、情報表示領域7dには氏名や企業名等を表示することになる。
続いて、図3に基づいてドアホン親機6の構成について説明する。28は第1信号線、29は第2信号線である。28aは第1信号線28を介して重畳して伝送された2つの信号、すなわち映像信号変調部23で周波数変調されたFM信号とこれに重畳された音声信号をフィルターで分離する信号分離部である。そして、30はこのFM信号を復調させるためのFM信号復調部、31は復調されたアナログのビデオ信号を画像処理や画像認証を行うためにデジタル信号に変換するA/D変換部である。
また、32はA/D変換部31で変換されたデジタルビデオ信号を画像処理し、所定の画像を生成する画像処理生成部である。実施の形態1においては、図1(b)の表示部7に表示された表示画面は分割され、映像とその他の関連情報が分割されて表示されるので、画像処理生成部32がこの処理を行う。33はこの表示部7に表示される表示画面のテンプレート等のデータを格納した画像メモリ部である。画像処理生成部32は、カメラ2で撮影している映像部分のサイズを調整若しくは切り出してテンプレートの画面領域7aに貼り付け、また、開錠不可の設定を示すテキスト情報及び開錠不可の表示7b1は警告領域7bに、さらに訪問履歴に関するテキスト情報を訪問履歴表示領域7cに、さらに氏名や企業名等を情報表示領域7dに表示して、1画面分のデータとして生成する。
34は画像処理したデジタルのビデオ信号をアナログ信号に変換するD/A変換部である。35はこのビデオ信号を表示部7に表示するための表示制御部であり、カメラ2で撮影した映像はLCD等の表示部7に表示される。36はドアホン子機1の操作ボタン5が押下されたとき、ドアホン親機6側でこれを検知するドアホン操作検知部であり、検出信号は以下説明する主制御部39に入力され、これをトリガとしてドアホン親機6の各動作が開始される。
39はドアホン親機6の主制御部である。主制御部39はハードウェア的にはCPUから構成され、後述する記憶部47やその他のメモリからプログラムを読み込んでソフトウェア的に機能実現手段として各機能を実行する。実施の形態1の機能実現手段の各機能については後述する。
40は第1信号線28と接続された音声処理部、43,44はスピーカ8とマイク9のそれぞれのアンプである。音声処理部40は音声のとぎれ等を検出し、ドアホン親機6とドアホン子機1との間の通話の切り替えなど音声通信の制御を行う。また、41はタッチパネル制御部、42は表示部7の表面を覆う透明なタッチパネルである。表示部7の表示画面上でタッチすると、タッチパネル制御部41によってタッチパネル42の座標が検出されて、この座標若しくはこれを含む所定の領域(表示のシンボル)に対応して入力があったことが主制御部39に入力され、この座標若しくはこれを含む所定の領域に対応した所定の機能が実行されるものである。
次に45は入力キーボード11の操作ボタンを使って入力する入力部、46は応答スイッチ10を押してドアホン子機1との間で通信を開始する応答スイッチ部である。そして、47は主制御部39のためのプログラムやデータを記憶した記憶部であり、48は履歴を残すための時計部である。
ところで、実施の形態1のドアホン親機6は、訪問した人物の顔等の映像を表示部7に表示するとともに、この人物の音声による音声認証(音声による照合)を行うものである。なお、ここで音声認証とは音声を比較して同一人物か否かを推定するという意味であるから、本来、照合というべきであるが、照合後に宅内への侵入を許可するという意味を込めて以下、実施の形態上は認証という。このため次の構成を有している。
図3に示す38は、後述する音声認証部50で行う認証のために蓄積した過去の来訪者や家族等の個人別の取得済み音声データと、その個人情報を蓄積したデータベース部(実施の形態1の来訪者情報記憶部)である。また、49はドアホン子機1のマイク4から入力された音声信号を音声処理部40から受信して符号化し、あるいはマイク9からの音声信号を符号化して後述の音声文字変換部51と音声認証部50に解析のためにデジタルデータとして渡すとともに、その後それを復号化して音声処理部40またはスピーカ8に出力するA/D・D/A変換部である。
50は人物の音声認証を行う音声認証部(実施の形態1の照合部)であり、51は音声認証のための取得済みの音声テキストデータを作成するとともに、認証のための音声テキストデータを作成することができる音声文字変換部である。51aはA/D・D/A変換部49から出力された音声データの中から音声の各特徴を基に単語候補を抽出する抽出手段、51bは抽出した単語候補の中から辞書を参照して個人情報に関する単語候補を選択する推論選択手段、51cはこれをテキストデータに変換するテキスト情報生成手段である。
すなわち、リアルタイムに音声認証のために取り込まれる音声データや、データベース部38に格納されている各個人の取得済み音声データは、マイク4,9から取り込まれ、A/D・D/A変換部49から出力されたデジタル音声信号(音声データ)をケプストラム分析などして、音声の特徴パラメータ、例えば音声に含まれる各周波数の包絡線の特徴を示すLPCケプストラム係数や、音声信号がゼロ電圧線と交差する数を示すゼロクロス数、音声の大きさを示すパワー値などを抽出し、予め登録されている特徴パラメータ、すなわち各単語ごとに収集された音声のLPCケプストラム係数、ゼロクロス数、パワー値などを参照することにより、推論選択手段51bによって所定の単語と推定され、テキスト情報生成手段51cによって単語ごとにテキストデータに変換されて、音声認証の場合は音声認証部50へ送信され、また、同時に更新のためデータベース部38に格納される。なお、来訪者の音声認証とは別に家族等の宅内の人間が、自分たちの音声データを入力することもできる。
ところで、来訪した人物を特定する単語候補としては、氏名や所属する企業名、場所、電話番号、アドレス等の情報がある。音声文字変換部51にはこれらに関係する標準パターンの単語辞書が設けられており、この標準パターンと比較してこれらに属するか否かの属否の推論を行い、各情報にそれぞれ該当すると推定されたときには、氏名や所属する企業名、電話番号等としてそれぞれの格納場所に格納される。そして実際に来訪者があったとき、来訪者の映像を表示するとともに、リアルタイムに発声された言葉からキーとなる単語を抽出し、これらの情報を基に来訪者を特定し、関連情報として情報表示領域7dに表示する。なお、抽出されたが、どの情報に該当するか不明の場合は、そのままその他の単語の集合としてデータベース部38内に画像やその他の個人情報と関係付けて格納しておき、認証判断の材料にする。
このように実施の形態1の音声認証は、来訪者の音声を基に、リアルタイムに単語を抽出してテキストデータ化し、データベース部38内の取得済みのテキストの単語情報から、来訪者の氏名等を推論して、関連情報を表示するものである。きわめて簡単に来訪者の特定が可能になる。
そこで、本発明の実施の形態1の主制御部39に搭載された機能実現手段について説明する。図4(a)は本発明の実施の形態1におけるドアホン装置のドアホン親機のブロック図、図4(b)は本発明の実施の形態1におけるデータベース部の構成図、図5は本発明の実施の形態1におけるデータベース部の個人情報部構成図である。
図4(a)に示すように、主制御部39内には履歴情報を処理するため、次の機能実現手段が設けられている。39aは来訪者があったときに時計部48の時刻とともに自動的に画像認証した人物の関連情報を記録する履歴情報記録手段、39bはこの訪問履歴の各回にドアホン親機6から応答したか否かを記録する応答履歴記録手段である。来訪者の中には、絶対対応を拒否したい人物もあり、39cはこのような場合に開錠不可又は開錠許可を設定するための開錠許可設定手段である。この設定は、タッチパネル42の開錠不可の表示7b1に触るだけで、設定画面に切り替わり、簡単に設定することができる。開錠不可には個人差があり、一時的にこの拒否を解除したいときは、タッチパネルに表示されるマニュアル操作の表示に触れることで、開錠許可に一時的に変更できる。しかし、これらの履歴はすべて応答履歴記録手段39bによって履歴として記録される。開錠不可キーを押下した人物、これを一時的に解除した人物の記録も残され、これらを警告領域7bに表示することもできる。
39eはデータベース部38に格納されている音声データを、最新のデータに更新したいときに実行する音声データ更新手段である。既に述べたように、入力キーボード11の中の更新キーを押下することで更新することができる。また、更新キーを長押しなどすることにより、自動設定機能にすることができ、この場合来訪者があれば自動的に音声データを更新させることができる。さらに、39hはデータ修正手段であって、入力キーボード11のキーを使って誤って入力されている訪問履歴や個人情報をデータ修正手段39hにより修正、変更することができる。
ところで図4(b)には、データベース部38の内部構成が示されている。38dは音声データ部であって、単語単位で実際に過去に発声されて取得した多数のテキストデータの集合が氏名等の個人情報と関係付けられて格納されている。38bはその氏名等の個人情報を記録した個人情報部であって、38b1は訪問履歴を記録した履歴情報部、38b2は開錠不可キーを押下したとき禁止フラグを設定するための開錠禁止部である。また、38cは実際に応答するのでなく、所定のメッセージを利用して応答するために設けられた応答メッセージ部である。応答メッセージ部38c内には、「唯今留守にしております」等の家族で共通のメッセージのほかに、個人別のメッセージ、例えば「学校のクラブで会おう」といったメッセージが格納されている。応答スイッチ部46をおさないで、入力キーボード11の中から自動応答のキーを選んで、希望するメッセージを送出する。
図5はこの個人情報部38bの詳細を示すものである。図5において、38b11は来訪者の氏名である。この氏名38b11は上述の音声データ部38dのテキストデータと関係付けられている。38b12は来訪者の所属する企業名、38b13は連絡先の電話番号、38b14はメールアドレスである。これらは音声文字変換部51によって自動的に生成されるが、誤入力があったときには修正が必要で、このときは入力キーボード11の中の文字入力キーを使って手入力する。
次に、38b15はこの人物の過去に訪問したときの履歴をすべて時系列に記録したもの訪問履歴である。例えば、H16,01,04,14,12,応答というのは平成16年1月4日14時12分に来訪し、応答したことを示している。しかし、H16,01,20,15,32,不応答と記録されているように、平成16年1月20日15時32分に来訪し、応答しなかったことが分る。
これらは応答履歴記録手段39bによって自動的に記録される。また、38b16は禁止フラグであり、開錠許可設定手段39cによって開錠禁止部38b2内に設定される。これらの情報はすべて音声認証した人物の個人情報と関係付けられて、図1(b)に示す表示部7の訪問履歴表示領域7c、開錠不可フラグは警告領域7b、関連情報は情報表示領域7dにテンプレートを使って表示される。
このように本発明の実施の形態1のドアホン装置においては、来訪者があったとき、音声を基にリアルタイムに単語を抽出してテキストデータ化し、取得済みのテキストデータと照合することにより、この来訪者を特定し、表示部に氏名や企業名、電話番号等のほか、訪問履歴情報などの関連情報をドアホン親機に表示するので、この表示を見てトラブルを未然に防いだり、また、来訪者に実際に面会する前にこの来訪者の有力情報を予め入手したりできるので、来訪者の応対が容易で迅速に行える。また、家族全員にとって開錠不可するのが望ましい人物の場合に、予め開錠拒否を容易に設定できるし、これによって家族に警告することができる。音声によるので関連情報の入力に負担がかからず、操作性に優れたドアホン装置を提供できる。
(実施の形態2)
本発明の実施の形態1の人物認証は、音声のテキスト情報を介して人物認証を行うものであった。これに対し、本発明の実施の形態2におけるドアホン装置は音声の特徴により人物認証を行うものである。図6(a)は本発明の実施の形態2におけるデータベース部の構成図、図6(b)は本発明の実施の形態2における音声認識と文字変換の構成図である。
図6(a)に示すように、実施の形態2においては、データベース部38内(実施の形態2の来訪者情報記憶部)に音声データとしてテキストデータが格納されるのではなく、音声の特徴パラメータ、例えば音声に含まれる各周波数の包絡線の特徴を示すLPCケプストラム係数や、音声信号がゼロ電圧線と交差する数を示すゼロクロス数、音声の大きさを示すパワー値などが格納されている。図6(a)において、38d1はこのような音声の特徴パラメータを格納した音声特徴データ部である。それ以外の構成は実施の形態1と同一の構成であるから説明は省略する。
また、図6(b)は実施の形態2の音声認証の要部のブロックを示したものである。図6(b)において、52は単語の抽出と選択を行う音声認識部である。52aはA/D・D/A変換部49から出力された音声データの中から音声の各特徴を基に単語候補を抽出する抽出手段、52bは抽出した単語候補の中から辞書を参照して個人情報に関する単語候補を選択する推論選択手段である。なお、選択された単語候補をテキストデータに変換するテキスト情報生成手段51cは実施の形態1と同一構成であり、実施の形態1の音声文字変換部51との違いは、テキスト情報生成手段51cが行うテキスト化の機能以外の機能を、音声認識部52の抽出手段52aと推論選択手段52bで実行する点である。
すなわち、実施の形態2の音声データの特徴を抽出する機能は抽出手段52aで実行され、音声認証は、音声認証部50(実施の形態2の照合部)によってリアルタイムに入力された音声の特徴パラメータと、データベース部38内に格納された特徴パラメータとを比較することで行われる。そして、テキスト情報生成手段51cは抽出手段52aによって抽出され、推論選択手段52bによって選択された氏名や企業名、住所等の関連情報をテキスト化する。
このように本発明の実施の形態2のドアホン装置においては、実施の形態1と同様に、来訪者があったときこの来訪者を音声認証で特定し、表示部に氏名や企業名、電話番号等のほか、訪問履歴情報などの関連情報をドアホン親機に表示するとともに、この表示を見てトラブルを未然に防いだり、また、来訪者に実際に面会する前にこの来訪者の有力情報を予め入手したりできるので、来訪者の応対が容易で迅速に行える。また、家族全員にとって開錠を拒否するのが望ましい人物もあり、このような場合に開錠拒否を設定できるし、家族に予め警告することができる。また、来訪者の関連情報を自動的に更新することができる。
さらに、実施の形態2のドアホン装置は、イントネーションなども含め音声認証を音声の特徴パラメータ同士で比較するので、テキスト情報間の比較で人物の同一性判断をするより精度の高い判断が行える。
(実施の形態3)
本発明の実施の形態2におけるドアホン装置は音声の特徴で人物認証を行うものであったが、実施の形態3におけるドアホン装置は画像により人物認証を行うものである。図7は本発明の実施の形態2におけるドアホン装置のドアホン親機のブロック構成図である。実施の形態1,2のドアホン装置と実施の形態3のドアホン装置は、基本的に同一の構成であり、同一符号は同一構成を示しているから、重複するため説明は省略する。
図7において、37は、A/D変換部31から出力されたビデオ信号を基に1画面分の画像を取り出して個人別に蓄積されている多数の取得済み画像情報と比較し、人物推定を行う画像認証部である。そして、この画像認証部37(実施の形態3の照合部)で行う認証のために、データベース部38(実施の形態3の来訪者情報記憶部)の画像データ部(図示しない)内には、過去の来訪者や家族等の個人別に蓄積した取得済み画像のデータとそれに関係付けられた関連情報が格納されている。データベース部38に格納されている取得済み画像は、氏名等とともに、撮影したカメラのズーム等のカメラ条件、明るさ等の環境条件、また画像のサイズや付属物、例えば眼鏡の有無等の対象データ情報が、画像と関係付けられて格納されている。
画像認証部37は、これらの条件と現在の画像の条件を比較してマッチングさせ、眼や鼻、口の位置や形状、骨格等の所定の位置の特徴点を抽出して、両者の特徴空間上での距離を測って、所定の範囲内であれば同一人であると推定する。格納してある取得済み画像の特徴点をパラメータとして予めデータ保存しておくのが好適である。この場合、画像認証部37は映像から画像を取り出し、所定の部分を切り出して、保存してある取得済み画像のデータとのマッチングを行い、パラメータを比較するだけで同一人か否かの推定ができる。このため多人数との比較が直ちに行える。なお、後述するように、データベース部38に格納されている取得済み画像は、入力キーボード11の中の更新キーを押下することで、簡単に更新することができるし、自動更新することもできる。また、画像認証の特徴点を比較して認証する方法は、人間の静脈や、眼を利用したりする多くの方法があり、これらを利用するのもよい。
ところで、実施の形態2においては、音声認証部50を設けたが、これは実施の形態3の画像認証部37の併設ができないものでなく、両者を同時に設けて、認証精度を向上させるのも好適である。この場合、例えば画像認証部37による画像認証の後、音声認証部50による音声認証を行って、特徴空間上での距離が所定の閾値内にあるときのみ同一人と推定するなど、することになる。また、この逆もありえる。
このように本発明の実施の形態3のドアホン装置においては、来訪者があったときこの来訪者を画像認証で特定するとともに、氏名や企業名、電話番号等のほか、訪問履歴情報などの関連情報をドアホン親機に表示することができ、画像認証を行うため精度の高い人物認証を行うことができる。
本発明は、来訪者があったとき、応答する前にこの来訪者を特定するとともに関連情報を表示できるドアホン装置に適用できる。
(a)本発明の実施の形態1におけるドアホン装置のドアホン子機の正面図、(b)本発明の実施の形態1におけるドアホン装置のドアホン親機の正面図 本発明の実施の形態1におけるドアホン装置のドアホン子機のブロック構成図 本発明の実施の形態1におけるドアホン装置のドアホン親機のブロック構成図 (a)本発明の実施の形態1におけるドアホン装置のドアホン親機の履歴制御のブロック図、(b)本発明の実施の形態1におけるデータベース部の構成図 本発明の実施の形態1におけるデータベース部の個人情報部構成図 本発明の実施の形態2におけるドアホン装置のドアホン親機のブロック構成図 本発明の実施の形態2におけるドアホン装置のドアホン親機のブロック構成図 従来のドアホン装置の概略構成図 従来の人物認証ドアホン装置の概略構成図
符号の説明
1 ドアホン子機
2 カメラ
2a 撮像制御部
3 スピーカ
4 マイク
5 操作ボタン
5a 操作処理部
6 ドアホン親機
7 表示部
7a 画面領域
7b 警告領域
7b1 開錠不可
7c 訪問履歴表示領域
7c1 面会の有無情報
7d 情報表示領域
8 スピーカ
9 マイク
10 応答スイッチ
11 入力キーボード
12 感知センサ
12 感知センサ
12a センサ検知部
20 撮像部
21 撮像処理部
23 映像信号変調部
24 ドアホン子機制御部
25 メモリ部
26,27,43,44 アンプ
28 第1信号線
28a 信号分離部
29 第2信号線
30 FM信号復調部
31 A/D変換部
32 画像処理生成部
33 画像メモリ部
34 D/A変換部
35 表示制御部
36 ドアホン操作検知部
37 画像認証部
38 データベース部
38a 画像データ部
38b 個人情報部
38b1 履歴情報部
38b2 開錠禁止部
38b11 氏名
38b12 企業名
38b13 電話番号
38b14 メールアドレス
38b15 訪問履歴
38b16 禁止フラグ
38c 応答メッセージ部
38d 音声データ部
39 主制御部
39a 履歴情報記録手段
39b 応答履歴記録手段
39c 開錠許可設定手段
39e 音声データ更新手段
39h データ修正手段
40 音声処理部
41 タッチパネル制御部
42 タッチパネル
45 入力部
46 応答スイッチ部
47 記憶部
48 時計部
49 A/D・D/A変換部
50 音声認証部
51 音声文字変換部
51a,52a 抽出手段
51b,52b 推論選択手段
51c テキスト情報生成手段
52 音声認識部
101 ドアホン装置
102 ドアホン端末
103 応答端末
121 カメラ
122 呼び出しスイッチ
123 スピーカ
124 マイク
131 画像表示部
132 呼び出し音信号発生部
133,135 アンプ
134 スピーカ
136 送受話器
141 画像認識部
142 人物データベース
143 制御部
144 呼び出し音データベース

Claims (9)

  1. スピーカ、マイク及びカメラが設けられたドアホン子機と、前記ドアホン子機と音声通話し前記カメラの撮影した来訪者の画像情報を表示する表示部が設けられたドアホン親機とを備えたドアホン装置であって、
    前記ドアホン親機は、
    前記ドアホン子機のマイクから入手した音声から人物を特定する単語情報を抽出して該単語情報をテキスト情報に変換する音声文字変換部と、
    前記音声文字変換部によって変換されたテキスト情報を上記来訪者の来訪者情報と関連付けて共に格納する来訪者情報記憶部と、
    前記マイクからの音声から変換されたテキスト情報と前記来訪者情報記憶部のテキスト情報とが一致するか否かを照合する照合部と、を備え、
    前記照合部の照合結果が一致した場合に、前記カメラからの前記来訪者の画像情報と共に前記来訪者情報記憶部の来訪者情報が前記表示部に表示されることを特徴とするドアホン装置。
  2. スピーカ、マイク及びカメラが設けられたドアホン子機と、前記ドアホン子機と音声通話し前記カメラの撮影した来訪者の画像情報を表示する表示部が設けられたドアホン親機とを備えたドアホン装置であって、
    前記ドアホン親機は、
    前記ドアホン子機のマイクから入手した音声から単語情報を抽出して人物を特定する単語情報を選択する音声認識部と、
    該音声認識部が抽出した単語をテキスト情報に変換するテキスト情報生成部と、
    前記テキスト情報生成部によって変換されたテキスト情報を前記来訪者の来訪者情報と関連付けて共に格納する来訪者情報記憶部と、
    前記マイクからの音声から変換されたテキスト情報と前記来訪者情報記憶部のテキスト情報とが一致するか否かを照合する照合部とが設けられ、
    前記照合部の照合結果が一致した場合に、前記カメラからの前記来訪者の画像情報と共に前記来訪者情報記憶部の来訪者情報が前記表示部に表示されることを特徴とするドアホン装置。
  3. スピーカ、マイク及びカメラが設けられたドアホン子機と、前記ドアホン子機と音声通話し前記カメラの撮影した来訪者の画像情報を表示する表示部が設けられたドアホン親機とを備え、前記ドアホン親機は、来訪者に対する取得済み音声情報と該音声情報を格納する来訪者情報記憶部と、前記マイクからの音声情報と前記取得済み音声情報とが一致するか否かを照合する照合部とが設けられ、前記照合部の照合結果が一致した場合に、前記カメラからの前記来訪者の画像情報と共に前記来訪者情報が前記表示部に表示されるドアホン装置であって、
    前記ドアホン親機には、
    前記ドアホン子機のマイクから入手した単語情報を抽出する抽出部と、
    人物を特定する単語情報を選択する推論選択部と、
    該推論選択部が抽出した単語情報をテキスト情報に変換するテキスト情報生成部と、が設けられるとともに、
    前記来訪者情報記憶部には、
    前記抽出部によって抽出された単語情報が前記取得済み音声情報として格納されるとともに、前記推論選択部及び前記テキスト情報生成部によって変換されたテキスト情報が前記来訪者の来訪者情報として格納されることを特徴とするドアホン装置。
  4. スピーカ、マイク及びカメラが設けられたドアホン子機と、前記ドアホン子機と音声通話し前記カメラの撮影した来訪者の画像情報を表示する表示部が設けられたドアホン親機とを備え、前記ドアホン親機には、来訪者に対する取得済み画像情報と該画像情報を格納する来訪者情報記憶部と、前記カメラの撮影した画像情報と前記取得済み画像情報とが一致するか否かを照合する照合部とが設けられ、前記照合部の照合結果が一致した場合に、前記カメラからの前記来訪者の画像情報と共に前記来訪者情報が前記表示部に表示されるドアホン装置であって、
    前記ドアホン子機のマイクから入手した音声から単語情報を抽出してこれから人物を特定する単語情報を選択する音声認識部と、前記音声認識部が抽出した単語をテキスト情報に変換するテキスト情報生成部と、が設けられ、
    前記来訪者情報記憶部には前記テキスト情報生成部によって変換されたテキスト情報が前記来訪者の来訪者情報として格納されることを特徴とするドアホン装置。
  5. 前記テキスト情報には、氏名、所属、住所、職業のいずれか1以上のテキスト情報が含まれることを特徴とする請求項1〜4のいずれかに記載のドアホン装置。
  6. 前記来訪者情報記憶部には、開錠許可又は開錠不可を示す開錠許可情報が格納されていることを特徴とする請求項1〜5のいずれかに記載のドアホン装置。
  7. 前記照合部の照合結果が一致したとき、前記来訪者情報の開錠許可情報が開錠不可であった場合に、前記表示部に開錠不可を表示することを特徴とする請求項1〜6のいずれかに記載のドアホン装置。
  8. 前記表示部の表示画面にタッチパネルが配置され、前記表示部の表示画面上には前記タッチパネルで入力可能な前記開錠許可情報の表示がなされることを特徴とする請求項1〜7のいずれかに記載のドアホン装置。
  9. 前記開錠許可情報の表示が開錠不可の場合に、前記開錠許可情報の表示を開錠許可に変更させることで開錠されることを特徴とする請求項7または8記載のドアホン装置。
JP2005284355A 2005-09-29 2005-09-29 ドアホン装置 Pending JP2007096833A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005284355A JP2007096833A (ja) 2005-09-29 2005-09-29 ドアホン装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005284355A JP2007096833A (ja) 2005-09-29 2005-09-29 ドアホン装置

Publications (1)

Publication Number Publication Date
JP2007096833A true JP2007096833A (ja) 2007-04-12

Family

ID=37981974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005284355A Pending JP2007096833A (ja) 2005-09-29 2005-09-29 ドアホン装置

Country Status (1)

Country Link
JP (1) JP2007096833A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7137312B2 (ja) 2018-02-15 2022-09-14 アイホン株式会社 ドアベル
US11510256B2 (en) 2018-02-15 2022-11-22 Aiphone Co., Ltd. Configuration method of Wi-Fi doorbell, doorbell, housing complex communication system, and climate information providing system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7137312B2 (ja) 2018-02-15 2022-09-14 アイホン株式会社 ドアベル
US11510256B2 (en) 2018-02-15 2022-11-22 Aiphone Co., Ltd. Configuration method of Wi-Fi doorbell, doorbell, housing complex communication system, and climate information providing system

Similar Documents

Publication Publication Date Title
US9060074B2 (en) Method and system for communication
JP2006011591A (ja) 個人認証システム
CN104282064B (zh) 门禁应答方法和装置
JP2004013871A (ja) 防犯システム
JP2006287467A (ja) ドアホン装置
CN107733872A (zh) 信息打印方法及装置
JP2007037088A (ja) ドアホン装置
JP4998202B2 (ja) 携帯通信端末
JP2007104382A (ja) インターホン装置
JP4622786B2 (ja) ドアホン装置
WO2010032502A1 (ja) インターホンシステム
JP2007096833A (ja) ドアホン装置
JP2010212787A (ja) ドアホン装置、ドアホン装置における各手段として機能させるためのプログラム、ドアホンシステム及びドアホン装置の情報処理方法
JP2003298753A (ja) インターフォン装置
JP2007150511A (ja) インターホン装置
JP2007096831A (ja) インターホン装置
JP2007150670A (ja) インターホン装置
JP4968663B2 (ja) インターホンシステム
JP2007104384A (ja) インターホン装置
KR101264797B1 (ko) 휴대 단말기에서 얼굴인식을 통한 사진 검색 방법
JP2007104380A (ja) ドアホン装置
JP2007104379A (ja) ドアホン装置
JP2007104381A (ja) インターホン装置
JP3592415B2 (ja) 話者認識システム
JP3506293B2 (ja) 話者識別システム