JP6783492B1

JP6783492B1 - 電話機、報知システム及びコンピュータプログラム

Info

Publication number: JP6783492B1
Application number: JP2020113040A
Authority: JP
Inventors: 鈴木　康介; 康介鈴木
Original assignee: Suzuko Co Ltd
Current assignee: Suzuko Co Ltd
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2020-11-11
Anticipated expiration: 2039-08-16
Also published as: JP2021035045A

Abstract

【課題】通話中の音声が詐欺又は迷惑に係る音声であるか否かを高精度に認識して詐欺又は迷惑の旨を報知することが可能な電話機、報知システム及びコンピュータプログラムを提供する。【解決手段】電話機は、電話回線からの着信に応答して前記電話回線の状態を通話中に移行させる第１通信部と、Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信する第２通信部と、通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する記憶部と前記記憶部に記憶した学習モデルに前記第１通信部を介して取得した通話中の音声を入力して出力された有無情報を取得する第１取得部と、該第１取得部が取得した有無情報に基づいて詐欺又は迷惑の旨を報知する報知部とを備える。【選択図】図１

Description

本発明は、通話中の音声が詐欺又は迷惑に係る音声であるか否かを人工知能で認識した結果に基づいて、詐欺又は迷惑の旨を報知する電話機、報知システム及びコンピュータプログラムに関する。

近年、電話で家族又は知人を装って高齢者を振り込み行為に誘導し、金銭を騙し取る振り込め詐欺等の特殊詐欺が社会問題化している。これに対し、詐欺の手口を啓発する活動が行われる一方で、詐欺被害を防止するための様々な装置が提案されている。

例えば、特許文献１には、予め記憶部に記憶した詐欺被害に関連する会話に含まれる特定語が通話中の音声から抽出された場合に、当該特定語が抽出されたことを示す警告情報を通話中に出力する詐欺被害警告装置が開示されている。

また、特許文献２には、携帯電話の通話内容である音声情報を変換した文字情報と、予め記憶された振り込み詐欺に使われる誘導会話キーワードとを比較判定し、振り込み詐欺の可能性があると判定された場合は、登録した親族や知り合いの携帯電話に通知、確認を依頼する振込詐欺防止システムが開示されている。

特開２０１６−１７８５０７号公報特開２０１８−０８８６６８号公報

しかしながら、特許文献１及び２に開示された技術は、通話中の会話や音声に含まれる語句が、予め記憶した特定語やキーワードと一致するか否かを判定するものであり、例えば音声や会話の速度やトーンの変化を捉えて判定するようなことはできなかった。また、日々変化する詐欺の手口に対応し続けることは困難であった。

本発明は斯かる事情に鑑みてなされたものであり、その目的とするところは、通話中の音声が詐欺又は迷惑に係る音声であるか否かを高精度に認識して詐欺又は迷惑の旨を報知することが可能な電話機、報知システム及びコンピュータプログラムを提供することにある。

本開示の一態様に係る電話機は、電話回線からの着信に応答して前記電話回線の状態を通話中に移行させる第１通信部と、Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信する第２通信部と、前記電話回線の使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続する第２接続部と、通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する記憶部と、前記記憶部に記憶した学習モデルに前記第１通信部を介して取得した通話中の音声を入力して出力された有無情報を取得する第１取得部と、該第１取得部が取得した有無情報に基づいて、前記第２接続部が接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知する報知部とを備え、前記電話回線が設けられた施設の出入口における音声を集音する第１集音部に接続する第３接続部と、対話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する第２の学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する第２の記憶部と、該第２の記憶部に記憶した第２の学習モデルに前記第１集音部から取得した音声を入力して出力された有無情報を取得する第２取得部とを更に備え、前記報知部は、前記第２取得部が取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知するようにしてある。

本態様にあっては、電話回線からの着信による通話中の音声を、サーバから配信された学習モデルに入力して、詐欺又は迷惑に係る音声の検出の有無情報を取得し、取得した有無情報に基づいて詐欺又は迷惑の旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ（Artificial Intelligence ）技術で詐欺又は迷惑に係る通話中の音声を認識して多角的に報知することができる。そして、詐欺又は迷惑に係る音声を検出した場合に、例えば使用者の家族若しくは知人の携帯電話機、又は使用者が利用するセキュリティサービスの事業者の通信装置の少なくとも１つに接続して詐欺又は迷惑の旨を報知する。これにより、使用者が通話中の電話が詐欺電話又は迷惑電話であることが、使用者の家族、知人又はセキュリティサービスの事業者に報知される。更に、施設の出入口で集音した音声を、サーバから配信された学習モデルに入力して、詐欺又は迷惑に係る音声の検出の有無情報を取得し、取得した有無情報に基づいて詐欺又は迷惑の旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ技術で詐欺又は迷惑に係る対話中の音声を認識して多角的に報知することができる。

本開示の一態様に係る電話機は、電話回線からの着信に応答して前記電話回線の状態を通話中に移行させる第１通信部と、Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信する第２通信部と、前記電話回線の使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続する第２接続部と、通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する記憶部と、前記記憶部に記憶した学習モデルに前記第１通信部を介して取得した通話中の音声を入力して出力された有無情報を取得する第１取得部と、該第１取得部が取得した有無情報に基づいて、前記第２接続部が接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知する報知部とを備え、前記電話回線が設けられた施設の出入口の周囲を撮像する第１撮像部に接続する第４接続部と、画像が入力された場合に詐欺又は迷惑に係る画像の検出の有無情報を出力する第３の学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する第３の記憶部と、該第３の記憶部に記憶した第３の学習モデルに前記第１撮像部から取得した画像を入力して出力された有無情報を取得する第３取得部と、を更に備え、前記報知部は、前記第３取得部が取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知するようにしてある。

本態様にあっては、電話回線からの着信による通話中の音声を、サーバから配信された学習モデルに入力して、詐欺又は迷惑に係る音声の検出の有無情報を取得し、取得した有無情報に基づいて詐欺又は迷惑の旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ（Artificial Intelligence ）技術で詐欺又は迷惑に係る通話中の音声を認識して多角的に報知することができる。そして、詐欺又は迷惑に係る音声を検出した場合に、例えば使用者の家族若しくは知人の携帯電話機、又は使用者が利用するセキュリティサービスの事業者の通信装置の少なくとも１つに接続して詐欺又は迷惑の旨を報知する。これにより、使用者が通話中の電話が詐欺電話又は迷惑電話であることが、使用者の家族、知人又はセキュリティサービスの事業者に報知される。更に、施設の出入口の周囲を撮像した画像を、サーバから配信された学習モデルに入力して、詐欺又は迷惑に係る画像の検出の有無情報を取得し、取得した有無情報に基づいて詐欺又は迷惑の旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ技術で詐欺又は迷惑に係る画像を認識して多角的に報知することができる。

本開示の一態様に係る電話機は、電話回線からの着信に応答して前記電話回線の状態を通話中に移行させる第１通信部と、Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信する第２通信部と、前記電話回線の使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続する第２接続部と、通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する記憶部と、前記記憶部に記憶した学習モデルに前記第１通信部を介して取得した通話中の音声を入力して出力された有無情報を取得する第１取得部と、該第１取得部が取得した有無情報に基づいて、前記第２接続部が接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知する報知部と、を備え、前記電話回線が設けられた施設の内部を撮像する第３撮像部に接続する第６接続部と、画像が入力された場合に犯罪者の侵入に係る画像の検出の有無情報を出力する第５の学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する第５の記憶部と、該第５の記憶部に記憶した第５の学習モデルに前記第３撮像部から取得した画像を入力して出力された有無情報を取得する第５取得部と、該第５取得部が取得した有無情報に基づいて侵入の旨を報知する第３の報知部とを更に備える。

本態様にあっては、電話回線からの着信による通話中の音声を、サーバから配信された学習モデルに入力して、詐欺又は迷惑に係る音声の検出の有無情報を取得し、取得した有無情報に基づいて詐欺又は迷惑の旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ（Artificial Intelligence ）技術で詐欺又は迷惑に係る通話中の音声を認識して多角的に報知することができる。そして、詐欺又は迷惑に係る音声を検出した場合に、例えば使用者の家族若しくは知人の携帯電話機、又は使用者が利用するセキュリティサービスの事業者の通信装置の少なくとも１つに接続して詐欺又は迷惑の旨を報知する。これにより、使用者が通話中の電話が詐欺電話又は迷惑電話であることが、使用者の家族、知人又はセキュリティサービスの事業者に報知される。更に、使用者の施設の内部を撮像した画像を、サーバから配信された学習モデルに入力して、犯罪者の侵入に係る画像の検出の有無情報を取得し、取得した有無情報に基づいて侵入の旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ技術で犯罪者の侵入に係る画像を認識して多角的に報知することができる。

本開示の一態様に係る電話機は、前記第３の報知部は、回転式赤色灯、ブザー又は照明器具を用いて報知する。

本態様にあっては、使用者の施設内に犯罪者等の侵入があった場合に、回転式赤色灯、ブザー又は照明器具を用いて報知することができる。

本開示の一態様に係る電話機は、登録された第１携帯端末装置に接続する第１接続部を備え、前記報知部は、前記第１接続部が接続した第１携帯端末装置に詐欺又は迷惑の旨を報知する。

本態様にあっては、詐欺又は迷惑に係る音声を検出した場合に、例えば使用者の携帯電話機に接続して詐欺又は迷惑の旨を報知する。これにより、通話中の電話が詐欺電話又は迷惑電話であることが、使用者に、より的確に報知される。

本開示の一態様に係る電話機は、前記第１通信部は、前記着信があった場合、発信者番号を取得するようにしてあり、前記第１通信部が取得した発信者番号に基づいて、発信元が所在する地域の名称を表示する表示部を備える。

本態様にあっては、電話回線からの着信があった場合に、発信者番号に対応する地域の名称を表示部に表示する。これにより、使用者は、家族や知人が所在する地域から発信されて着信したか否かを確かめることができる。

本開示の一態様に係る電話機は、前記報知部が詐欺又は迷惑の旨を報知した場合、前記第１通信部が取得した発信者番号を記憶する番号記憶部を備え、前記第１通信部は、前記着信があった場合、前記番号記憶部に記憶されている発信者番号を取得したときは、前記電話回線の状態を通話中に移行させない。

本態様にあっては、詐欺又は迷惑に係る通話中の音声を認識して報知した場合、発信者番号を記憶しておき、次回以降の着信時に、記憶した発信者番号と同じ発信者番号が通知されたときは、通話中に移行させない。これにより、同じ発信元から詐欺電話又は迷惑電話があった場合に着信を拒否することができる。

本開示の一態様に係る電話機は、登録されたテレビジョン受信機に接続する第５接続部と、前記報知部が、前記第３取得部が取得した有無情報に基づいて報知する場合、前記第１撮像部が撮像した画像を、前記テレビジョン受信機に接続された録画装置に録画させる第１録画部とを備える。

本態様にあっては、施設の出入口の周囲を撮像した画像に基づいて詐欺又は迷惑の旨を報知した場合、出入口の周囲を撮像した画像を、テレビジョン受信機に接続の録画装置に録画させる。これにより、使用者が詐欺師又は迷惑人間に応対する様子が録画装置に記録される。

本開示の一態様に係る電話機は、登録されたテレビジョン受信機に接続する第５接続部を備え、前記報知部は、前記第５接続部が接続したテレビジョン受信機に詐欺又は迷惑の旨を報知する。

本態様にあっては、詐欺又は迷惑に係る音声を検出した場合に、予め登録されたテレビジョン受信機を起動して詐欺又は迷惑の旨を報知する。これにより、通話中の電話が詐欺電話又は迷惑電話であることが、使用者に、より的確に報知される。

本開示の一態様に係る電話機は、周囲を撮像する第２撮像部と、前記報知部が、前記第１取得部が取得した有無情報に基づいて報知する場合、前記第２撮像部が撮像した画像及び通話中の音声を、前記テレビジョン受信機に接続された録画装置に録画させる第２録画部とを備える。

本態様にあっては、詐欺又は迷惑に係る通話中の音声を認識して報知する場合、使用者を含めて撮像した画像と通話中の音声とを、テレビジョン受信機に接続の録画装置に録画させる。これにより、詐欺電話又は迷惑電話に応対する様子が録画装置に記録される。

本開示の一態様に係る電話機は、前記第５接続部は、ＨＤＭＩ（登録商標）又はＢｌｕｅｔｏｏｔｈ（登録商標）にて前記テレビジョン受信機に接続し、前記無線ＬＡＮを介して外部装置から接続された場合、前記外部装置から取得した画像信号を前記第５接続部を介して前記テレビジョン受信機に送信する。

本態様にあっては、無線ＬＡＮを介して外部装置から接続された場合、外部装置からの画像信号をＨＤＭＩ又はＢｌｕｅｔｏｏｔｈにてテレビジョン受信機に送信する。これにより、テレビジョン受信機に、スマートフォン等の外部装置の画面を拡大して表示させることができる。

本開示の一態様に係る電話機は、音声が入力された場合に介助を求める音声の検出の有無情報を出力する第４の学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する第４の記憶部と、周囲の音声を集音する第２集音部と、前記第４の記憶部に記憶した第４の学習モデルに前記第２集音部が集音した音声を入力して出力された有無情報を取得する第４取得部と、該第４取得部が取得した有無情報に基づいて人の介助を要する旨を報知する第２の報知部とを備える。

本態様にあっては、自装置の周囲の音声を、サーバから配信された学習モデルに入力して、介助を求める音声の検出の有無情報を取得し、取得した有無情報に基づいて人の介助を要する旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ技術で介助を求める使用者の音声を認識して多角的に報知することができる。

本開示の一態様に係る電話機は、周囲の音声を集音する第２集音部と、該第２集音部が集音した音声を認識する音声認識部と、該音声認識部が認識した結果に基づいて、自装置又は前記電話回線が設けられた施設内の機器若しくは設備の動作を制御する音声認識制御部とを備える。

本態様にあっては、周囲の音声を認識した結果に基づいて、自装置又は使用者の施設内の機器若しくは設備を制御する。これにより、ＡＩスピーカのように音声を認識して、電話に応答したり、施設内のＩＯＴ機器を制御したりすることができる。

本開示の一態様に係る電話機は、前記電話回線が設けられた施設内の機器又は設備と無線又は赤外線で通信する第３通信部と、前記無線ＬＡＮを介して外部装置から接続された場合、前記機器又は設備を制御する信号を前記外部装置から取得して無線信号又は赤外線信号に変換する変換部とを備え、該変換部が変換した無線信号又は赤外線信号を、前記第３通信部を介して送信する。

本態様にあっては、無線ＬＡＮを介して外部装置から接続された場合、使用者の施設内の機器又は設備を制御する信号を外部装置から取得し、取得した信号を無線信号又は赤外線信号に変換して上記機器又は設備に送信する。これにより、スマートフォン等の外部装置から、施設内のＢｌｕｅｔｏｏｔｈ接続の機器又は設備を制御したり、赤外線リモコン対応の機器又は設備を制御したりすることができる。

本開示の一態様に係る報知システムは、上述の電話機と、周囲の音声を集音する集音部、音声を出力する音出力部、前記無線ＬＡＮを介して前記サーバと通信する通信部、音声が入力された場合に介助を求める音声の検出の有無情報を出力する第４の学習モデルを前記サーバから前記通信部を介してダウンロードして記憶する学習記憶部、該学習記憶部に記憶した第４の学習モデルに前記集音部が集音した音声を入力して出力された有無情報を取得する取得部及び該取得部が取得した有無情報に基づいて人の介助を要する旨を報知する介助報知部を有するインテリジェントスピーカとを備える。

本態様にあっては、インテリジェントスピーカの周囲の音声を、サーバからインテリジェントスピーカに配信された学習モデルに入力して、介助を求める音声の検出の有無情報を取得し、取得した有無情報に基づいて人の介助を要する旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ技術で介助を求める使用者の音声を認識して多角的に報知することができる。

本開示の一態様に係るコンピュータプログラムは、コンピュータに、電話回線からの着信に応答して前記電話回線の状態を通話中に移行し、Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信し、前記電話回線の使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続し、通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバからダウンロードして記憶し、記憶した学習モデルに通話中に取得した音声を入力して出力された有無情報を取得し、取得した有無情報に基づいて、接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知し、前記電話回線が設けられた施設の出入口における音声を集音する第１集音部に更に接続し、対話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する第２の学習モデルを前記サーバからダウンロードして更に記憶し、記憶した第２の学習モデルに前記第１集音部から取得した音声を入力して出力された有無情報を更に取得し、更に取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知する処理を実行させる。

本態様にあっては、サーバから配信された学習モデルに通話中の音声を入力して、詐欺又は迷惑に係る音声の検出の有無情報を取得し、取得した有無情報に基づいて詐欺又は迷惑の旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ技術で詐欺又は迷惑に係る通話中の音声を認識して多角的に報知することができる。また、詐欺又は迷惑に係る音声を検出した場合に、例えば使用者の家族若しくは知人の携帯電話機、又は使用者が利用するセキュリティサービスの事業者の通信装置の少なくとも１つに接続して詐欺又は迷惑の旨を報知する。これにより、使用者が通話中の電話が詐欺電話又は迷惑電話であることが、使用者の家族、知人又はセキュリティサービスの事業者に報知される。更に、施設の出入口で集音した音声を、サーバから配信された学習モデルに入力して、詐欺又は迷惑に係る音声の検出の有無情報を取得し、取得した有無情報に基づいて詐欺又は迷惑の旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ技術で詐欺又は迷惑に係る対話中の音声を認識して多角的に報知することができる。

本開示の一態様に係るコンピュータプログラムは、コンピュータに、電話回線からの着信に応答して前記電話回線の状態を通話中に移行し、Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信し、前記電話回線の使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続し、通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバからダウンロードして記憶し、記憶した学習モデルに通話中に取得した音声を入力して出力された有無情報を取得し、取得した有無情報に基づいて、接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知し、前記電話回線が設けられた施設の出入口の周囲を撮像する第１撮像部に更に接続し、画像が入力された場合に詐欺又は迷惑に係る画像の検出の有無情報を出力する第３の学習モデルを前記サーバからダウンロードして更に記憶し、記憶した第３の学習モデルに前記第１撮像部から取得した画像を入力して出力された有無情報を更に取得し、更に取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知する処理を実行させる。

本態様にあっては、サーバから配信された学習モデルに通話中の音声を入力して、詐欺又は迷惑に係る音声の検出の有無情報を取得し、取得した有無情報に基づいて詐欺又は迷惑の旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ技術で詐欺又は迷惑に係る通話中の音声を認識して多角的に報知することができる。また、詐欺又は迷惑に係る音声を検出した場合に、例えば使用者の家族若しくは知人の携帯電話機、又は使用者が利用するセキュリティサービスの事業者の通信装置の少なくとも１つに接続して詐欺又は迷惑の旨を報知する。これにより、使用者が通話中の電話が詐欺電話又は迷惑電話であることが、使用者の家族、知人又はセキュリティサービスの事業者に報知される。更に、施設の出入口の周囲を撮像した画像を、サーバから配信された学習モデルに入力して、詐欺又は迷惑に係る画像の検出の有無情報を取得し、取得した有無情報に基づいて詐欺又は迷惑の旨を報知する。これにより、適時更新される最新の学習モデルを用いたＡＩ技術で詐欺又は迷惑に係る画像を認識して多角的に報知することができる。

本開示の一態様に係るコンピュータプログラムは、前記コンピュータに、登録したテレビジョン受信機に接続し、接続したテレビジョン受信機に詐欺又は迷惑の旨を報知する処理を実行させる。

本開示の一態様に係るコンピュータプログラムは、スマートフォンに搭載されたコンピュータに、通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを記憶してあり、記憶してある学習モデルに通話中に取得した音声を入力して出力された有無情報を取得し、前記スマートフォンの使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続し、取得した有無情報に基づいて、接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知し、前記スマートフォンの使用者に係る施設の出入口における音声を集音する第１集音部に更に接続し、対話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する第２の学習モデルを更に記憶してあり、記憶した第２の学習モデルに前記第１集音部から取得した音声を入力して出力された有無情報を更に取得し、更に取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知する処理を実行させる。

本開示の一態様に係るコンピュータプログラムは、スマートフォンに搭載されたコンピュータに、通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを記憶してあり、記憶してある学習モデルに通話中に取得した音声を入力して出力された有無情報を取得し、前記スマートフォンの使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続し、取得した有無情報に基づいて、接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知し、前記スマートフォンの使用者に係る施設の出入口の周囲を撮像する第１撮像部に更に接続し、画像が入力された場合に詐欺又は迷惑に係る画像の検出の有無情報を出力する第３の学習モデルを更に記憶してあり、記憶した第３の学習モデルに前記第１撮像部から取得した画像を入力して出力された有無情報を更に取得し、更に取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知する処理を実行させる。

本発明によれば、通話中の音声が詐欺又は迷惑に係る音声であるか否かを高精度に認識して詐欺又は迷惑の旨を報知することが可能となる。

実施形態１に係る電話機を含む報知システムの構成例を示すブロック図である。実施形態１に係る電話機の構成例を示すブロック図である。着信に応答して電話回線を通信中に移行させる制御部の処理手順を示すフローチャートである。配信サーバから配信された学習モデルを記憶する制御部の処理手順を示すフローチャートである。実施形態１に係る電話機で特殊詐欺に係る音声を検出してその旨を報知する制御部の処理手順を示すフローチャートである。実施形態１に係る学習モデルの内容例を示す模式図である。実施形態１に係る電話機による報知の一例を示す説明図である。実施形態２に係る電話機で発信者番号を取得して表示部に表示する制御部の処理手順を示すフローチャートである。ＬＳＴＭを用いた学習モデルＸ３の内容例を示す模式図である。実施形態３に係る電話機を含む報知システムの構成例を示すブロック図である。実施形態３に係る電話機で特殊詐欺に係る音声を検出してその旨を報知する制御部１０の処理手順を示すフローチャートである。実施形態３に係る電話機による報知の一例を示す説明図である。実施形態４に係る電話機を含む報知システムの構成例を示すブロック図である。実施形態４に係る電話機の構成例を示すブロック図である。実施形態４に係る電話機で訪問詐欺に係る画像を検出してその旨を報知する制御部の処理手順を示すフローチャートである。実施形態４に係る学習モデルの内容例を示す模式図である。変形例に係る学習モデルの内容例を示す模式図である。実施形態５に係る電話機の構成例を示すブロック図である。実施形態５に係る電話機で介助を求める音声を検出してその旨を報知する制御部の処理手順を示すフローチャートである。実施形態５に係る学習モデルの内容例を示す模式図である。実施形態５に係る電話機による報知の一例を示す説明図である。実施形態６に係る電話機を含む報知システムの構成例を示すブロック図である。インテリジェントスピーカの構成例を示すブロック図である。実施形態７に係る携帯電話機を含む報知システムの構成例を示すブロック図である。実施形態７に係る携帯電話機の構成例を示すブロック図である。

以下、本発明をその実施形態を示す図面に基づいて詳述する。
（実施形態１）
図１は、実施形態１に係る電話機１ａを含む報知システム１００ａの構成例を示すブロック図である。特定の使用者２００が使用する電話機１ａは、固定電話網Ｎｆに電話回線で接続されている他、アクセスポイント２１を介してＷｉ−Ｆｉ規格に準拠する無線ＬＡＮ２に接続されている。固定電話網Ｎｆには、特殊詐欺を目論む詐欺師３００が使用する電話機３０１が更に接続されている。アクセスポイント２１には、テレビジョン受信機５のＨＤＭＩ（High-Definition Multimedia Interface ）端子に挿入されたスティック状のパーソナルコンピュータであるスティックＰＣ（Personal Computer ）５１が更に接続されている。

ここで言う特殊詐欺とは、電話その他の通信手段を用いて、対面することなく被害者をだまし、不正に入手した架空または他人名義の預貯金口座への振り込みなどの方法により、被害者に現金などを交付させたりすることをいう。特殊詐欺には、いわゆるオレオレ詐欺が含まれる。本実施形態１で検出される詐欺は、特殊詐欺に限定されず、通話中の音声に基づいて検出される全ての詐欺である。

アクセスポイント２１は、ルータ２２及びＯＮＵ（Optical Network Unit ：光回線終端装置）３１を介して光回線でインターネットＮｉに接続されている。アクセスポイント２１及びルータ２２が一体化された無線ルータを用いてもよい。また、ルータ２２が、ＡＤＳＬ（Asymmetric Digital Subscriber Line ）のモデムを介して固定電話網Ｎｆの電話回線に接続されていてもよい。この場合は、固定電話網Ｎｆの局内にてインターネットＮｉへの乗り入れが行われる。インターネットＮｉには、後述する学習モデルＸ１（図６参照）を配信する配信サーバ４が更に接続されている。

スティックＰＣ５１は、不図示のＡＣアダプタによって常時給電されており、無線ＬＡＮ２に常時接続されている。スティックＰＣ５１の不図示の制御部は、ＨＤＭＩインタフェースのＣＥＣ（Consumer Electronics Control ）信号を用いて、スタンバイ状態にあるテレビジョン受信機５に電源をオンさせることができる。テレビジョン受信機５がＣＥＣ信号による電源オンに対応しない場合は、スティックＰＣ５１に赤外線信号の送信機を備えておき、赤外線信号によってテレビジョン受信機５に電源をオンさせてもよい。なお、テレビジョン受信機５が、スティックＰＣ５１を介さずにＢｌｕｅｔｏｏｔｈ、ＺｉｇＢｅｅ（登録商標）等の近距離無線通信規格に準拠する通信にて電話機１ａに接続されてもよい。

図２は、実施形態１に係る電話機１ａの構成例を示すブロック図である。電話機１ａは、制御部１０、記憶部１１、表示部１２、操作部１３、スピーカ１４及び送受話器１５を備える。電話機１ａは、固定電話網Ｎｆに接続するための有線通信部１６（第１通信部に相当）及びアクセスポイント２１に接続するためのＷｉ−Ｆｉ通信部１７（第２通信部に相当）を更に備える。有線通信部１６には、通話中の音声をデジタル信号に変換して取得するためのＡ／Ｄ変換器（不図示）が内蔵されている。

制御部１０は、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro-Processing Unit）、ＧＰＵ（Graphics Processing Unit）等の１又は複数のプロセッサを含む。制御部１０は、記憶部１１に記憶されている制御プログラムを実行することにより、装置全体を制御する。

記憶部１１は、フラッシュメモリ、ＥＰＲＯＭ（Erasable Programmable Read Only Memory ）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read Only Memory ）（登録商標）等の不揮発性メモリ、及びＤＲＡＭ（Dynamic Random Access Memory ）、ＳＲＡＭ（Static Random Access Memory ）等の書き替え可能なメモリを含む。

不揮発性メモリは、制御部１０が実行する制御プログラム及び各種のデータを予め記憶する。書き替え可能なメモリは、一時的に発生するデータ及び自装置で学習した学習モデルＸ２を記憶すると共に、配信サーバ４から配信された学習モデルＸ１（学習モデルに相当）を記憶領域１１ａ（記憶部に相当）に記憶する。

表示部１２は、液晶ディスプレイ、有機ＥＬディスプレイ等の表示器であり、制御部１０に制御されて各種の情報を表示する。操作部１３は、ユーザによる操作を受け付けるためのインタフェースであり、例えば物理ボタンで構成されている。操作部１３には、送受話器１５のオンフック及びオフフックを検出する不図示のフックスイッチが含まれる。

スピーカ１４は、有線通信部１６による通話中の音声を拡声したり、使用者２００に対するガイダンスの音声を拡声したりする他、外部に対して報知する音声を拡声するのに用いられる。送受話器１５は、有線通信部１６による通話中の音声を受話器から拡声すると共に、送話器からの音声を有線通信部１６に入力する他、使用者２００に対して報知する音声を拡声するのに用いられる。

有線通信部１６は、固定電話網Ｎｆからの着信に応答して電話回線の状態を通信中に移行させる。通信中の音声は、内蔵のＡ／Ｄ変換器に与えられる他、スピーカ１４及び送受話器１５の受話器にも与えられる（図２にて破線で示す）。Ａ／Ｄ変換器で変換された最新の音声は、記憶部１１における不図示のバッファ領域に、少なくとも一定区間（例えば０．０１秒）分だけ記憶される。

Ｗｉ−Ｆｉ通信部１７は、Ｗｉ−Ｆｉ規格に準拠する無線通信によって無線ＬＡＮ２のアクセスポイント２１に接続するためのインタフェースである。

上述のとおり構成された電話機１ａの制御部１０は、固定電話網Ｎｆからの着信があった場合、使用者２００によるオフフックの操作を検知して着信に応答することにより、電話回線の状態を通信中に移行させる。制御部１０は、通信中に使用者２００によるオンフックの操作を検知した場合、又は固定電話網Ｎｆからの切断を検知した場合、通話を終了させる。制御部１０は、また、配信サーバ４から学習モデルＸ１の配信が通知された場合、配信サーバ４から学習モデルＸ１をダウンロードして記憶領域１１ａに記憶する。記憶領域１１ａには、予め一定の学習が行われた学習モデルＸ１が記憶されている。

制御部１０は、記憶部１１を介して通話中の音声を時系列的に取得し、取得した音声の特徴量を抽出し、抽出した特徴量に基づいて監視対象の音声をＡＩで認識する。特殊詐欺に係る音声、例えば金銭の振り込みに誘導する会話に関する音声を検出した場合、制御部１０は、その旨を自装置から報知すると共に、テレビジョン受信機５に報知する。

テレビジョン受信機５のＨＤＭＩ端子に接続されたスティックＰＣ５１のプライベートＩＰアドレスは、表示部１２に表示された設定メニューに対する操作部１３への使用者２００の操作により、予め記憶部１１に登録されている。テレビジョン受信機５がＢｌｕｅｔｏｏｔｈにて電話機１ａと接続される場合は、上記と同様の設定メニューに対する使用者２００の操作により、予めペアリング情報が記憶部１１に登録されている。従って、制御部１０は、登録されたテレビジョン受信機５にスムーズに接続することができる。

以下では、上述した電話機１ａの動作を、それを示すフローチャートを用いて説明する。図３は、着信に応答して電話回線を通信中に移行させる制御部１０の処理手順を示すフローチャートである。図４は、配信サーバ４から配信された学習モデルＸ１を記憶する制御部１０の処理手順を示すフローチャートである。図５は、実施形態１に係る電話機１ａで特殊詐欺に係る音声を検出してその旨を報知する制御部１０の処理手順を示すフローチャートである。図６は、実施形態１に係る学習モデルＸ１の内容例を示す模式図である。図７は、実施形態１に係る電話機１ａによる報知の一例を示す説明図である。

図３の処理は、通話中でない時に適時起動される。図４の処理は一定周期（例えば１秒毎）で起動される。また図５の処理は、通話中に一定周期（例えば０．０１秒毎）で起動されるが、起動周期がこれらに限定されるものではない。

電話機１ａにて図３の処理が起動された場合、制御部１０は、有線通信部１６が着信を検出したか否かを判定し（Ｓ１）、着信を検出しない場合（Ｓ１：ＮＯ）、着信を検出するまで待機する。有線通信部１６は、例えば電話回線の極性反転を伴う１６Ｈｚのリンガを検知することにより、着信を検出する。

着信を検出した場合（Ｓ１：ＹＥＳ）、制御部１０は、不図示のフックスイッチからの信号に基づいて送受話器１５がオフフックされたか否かを判定し（Ｓ２）、オフフックされない場合（Ｓ２：ＮＯ）、オフフックされるまで待機する。送受話器１５がオフフックされた場合（Ｓ２：ＹＥＳ）、制御部１０は、有線通信部１６により着信応答する（Ｓ３）、具体的には、電話回線の直流ループを閉結する。これにより、電話回線の状態が通話中に移行する。

その後、制御部１０は、送受話器１５がオンフックされたか否かを判定し（Ｓ４）、オンフックされない場合（Ｓ４：ＮＯ）、固定電話網Ｎｆから切断されたか否かを判定する（Ｓ５）。固定電話網Ｎｆからの切断の検知は、例えば、電話回線の極性が一定時間だけ反転する転極パルスを検知することによって行われる。固定電話網Ｎｆから切断されない場合（Ｓ５：ＮＯ）、制御部１０は、ステップＳ４，Ｓ５の処理を繰り返すために、ステップＳ４に処理を移す。

ステップＳ４で送受話器１５がオンフックされた場合（Ｓ４：ＹＥＳ）、又はステップＳ５で固定電話網Ｎｆから切断された場合（Ｓ５：ＹＥＳ）、制御部１０は、有線通信部１６に着信終了させて（Ｓ６）、図３の処理を終了する。具体的には、電話回線の直流ループを開放する。これにより、通話が終了して電話回線が空き状態に移行する。

次に、図４の処理が起動された場合、制御部１０は、配信サーバ４からの配信通知が有るか否かを判定し（Ｓ７）、配信通知が無い場合（Ｓ７：ＮＯ）、特段の処理を行わずに図４の処理を終了する。

配信サーバ４からの配信通知が有る場合（Ｓ７：ＹＥＳ）、制御部１０は、配信サーバ４から学習モデルＸ１をダウンロードして（Ｓ８）、記憶部１１の記憶領域１１ａに記憶し（Ｓ９）、図４の処理を終了する。これにより、学習モデルＸ１の内容が更新される。

次に図５の処理が起動された場合、制御部１０は、有線通信部１６を介して取得されて記憶部１１に記憶された一定区間（ここでは０．０１秒）の音声を取得し（Ｓ１１）、取得した音声の周波数スペクトル（周波数成分の強度）を特徴量として抽出する（Ｓ１２）。抽出された特徴量は、例えば少なくとも最新の１１区間分程度が記憶部１１に記憶される。

次いで、制御部１０は、例えば過去１０区間及び現在の区間について抽出した特徴量（即ち、過去のある区間と前後５区間の特徴量）を纏めて学習モデルＸ１に入力し（Ｓ１３）、学習モデルＸ１から詐欺に係る音声の検出の有無情報を取得する（Ｓ１４：第１取得部に相当）。ステップＳ１３で入力される特徴量は、１１区間分の音声の特徴量が結合されたＮ次元の特徴ベクトルで表される。

ここで一旦図６に移って、上述のステップＳ１３，Ｓ１４で用いられる学習モデルＸ１は、連続する区間Ｔ１，Ｔ２，Ｔ３・・それぞれにて結合された音声のＮ次元の特徴ベクトル（特徴＿１〜特徴＿Ｎ）を入力とし、入力中に監視対象が存在する（即ち詐欺の検出有りの）確率及び監視対象が存在しない（即ち検出無しの）確率を出力とする。出力層の各出力ノードが出力する確率は０〜１．０の値であり、全ての出力ノードが出力する確率の合計は１．０である。ここでの監視対象は、特殊詐欺に係る音声である。

学習モデルＸ１は、監視対象を含む音声の時系列的な特徴ベクトルと、詐欺であるか否かを識別する情報とを含む教師データを入力した場合に、監視対象の検出の有無情報を出力するように学習されたモデルである。具体的には、特殊詐欺の事例に係る音声の特徴ベクトルに詐欺を示すラベルを付与して大量に収集し、収集した特徴ベクトルを学習モデルＸ１に順次入力して学習させる。一般の詐欺師ではない第三者の音声についても同様の特徴ベクトルに詐欺ではないことを示すラベルを付与して大量に収集し、学習モデルＸ１に学習させる。

学習モデルＸ１には、例えば、深層学習（ディープラーニング）によって学習された多層のリカレントニューラルネットワーク（ＲＮＮ：Recurrent Neural Network ）を用いることができる。ＲＮＮに代えて、他の機械学習で学習したものを用いてもよい。ＲＮＮは、入力層と出力層との間に中間層を備える。中間層は複数の全結合層を有し、全結合層の数は適宜決定できる。

入力層、中間層及び出力層それぞれには、複数のノードが存在する。各層のノードは、前後の層に存在するノードと所望の重み及びバイアスで結合されている。入力層に入力されたデータが中間層に入力された場合、重み及びバイアスを含む活性化関数を用いて、一の層の出力が算出され、算出された出力が次の層に入力される。この場合、時刻間の影響を考慮するために、ある時刻の中間層からの出力を次の時刻の中間層に伝えるためのパスが存在する。これにより、例えばある時刻の中間層は、同じ時刻の入力層からの入力に加えて、前の時刻の中間層からの入力をも受け取る。以下同様にして、出力層の出力が求められるまで中間層の出力が次々と他の層に伝達される。

図５に戻って、制御部１０は、取得した有無情報が監視対象の検出無しを示すか否かを判定し（Ｓ１５）、検出無しを示す場合（Ｓ１５：ＹＥＳ）、特段の処理を行わずに図５の処理を終了する。検出無しを示すか否かは、例えば検出無しの確率が０．６より大きいか否かを判定する。判定の閾値は０．６に限定されず、操作部１３を介して適宜設定されるものであってもよい。

有無情報が監視対象の検出無しを示さない場合（Ｓ１５：ＮＯ）、制御部１０は、詐欺に係る音声の検出の有無情報が詐欺の検出有りを示すか否かを更に判定する（Ｓ１６）。検出有りを示すか否かは、例えば検出有りの確率が０．６より大きいか否かを判定する。判定の閾値は０．６に限定されない。有無情報が詐欺の検出有りを示す場合（Ｓ１６：ＹＥＳ）、制御部１０は、表示部１２及びスピーカ１４により、詐欺の旨を報知する（Ｓ１７：報知部に相当）。送受話器１５の受話器により詐欺の旨が報知されるようにしてもよいし、送受話器１５の不図示のバイブレータを作動させてもよい。更に、電話機１ａの不図示の子機を呼び出して詐欺の旨を音声で報知するか、又は子機の充電スタンドの表示部に詐欺の旨を表示してもよい。

その後、制御部１０は、スティックＰＣ５１にテレビジョン受信機５の電源をオンさせてテレビジョン受信機５に接続し（Ｓ１８：第５接続部に相当）、テレビジョン受信機５の画面及びスピーカにより詐欺の旨を報知して（Ｓ１９：報知部に相当）、図５の処理を終了する。ステップＳ１７及びＳ１９での報知内容は、例えば図７に示すような「詐欺です！ご注意下さい」というものであるが、これに限定されるものではない。

なお、本実施形態１にあっては、配信サーバ４からダウンロードした学習モデルＸ１を用いて電話回線の通話中に特殊詐欺に係る音声を検出したが、自装置で学習した学習モデルＸ２を用いて電話回線の通話中に使用者２００の家族及び知人に係る音声を検出するようにしてもよい。使用者２００の家族及び知人に係る音声が検出された場合は、詐欺電話ではないと判定される。

学習モデルＸ２を学習させるには、例えば通話中に使用者２００が操作部１３を操作して学習モードに設定し、発信者が家族又は知人であるか否かを操作部１３で操作してラベリングすればよい。これを繰り返すことにより、電話回線の通話中に使用者２００の家族又は知人の音声を、学習モデルＸ２が正しく検出する確率を高めることができる。

以上のように本実施形態１によれば、電話回線からの着信による通話中の音声を、配信サーバ４から配信された学習モデルＸ１に入力して、特殊詐欺に係る音声の検出の有無情報を取得し、取得した有無情報に基づいて詐欺の旨を報知する。従って、適時更新される最新の学習モデルＸ１を用いたＡＩ技術で特殊詐欺に係る通話中の音声を認識して多角的に報知することができる。

また、実施形態１によれば、特殊詐欺に係る音声を検出した場合に、予め登録されたテレビジョン受信機５を起動して詐欺の旨を報知する。従って、通話中の電話が詐欺電話であることを、使用者２００により的確に報知することができる。

本実施形態１にあっては、通話中に詐欺に係る音声の検出有りの確率が一定の閾値を越えた場合に詐欺の旨を報知したが、報知する内容は詐欺に断定するものには限定されない。例えば、学習モデルＸ１が出力する詐欺の検出有りの確率そのものを表示部１２等に報知して、使用者２００に注意を促してもよい。

また、実施形態１にあっては、ＲＮＮを用いた学習モデルＸ１に音声の特徴量を入力した場合に詐欺に係る音声の検出の有無情報が出力されたが、ＲＮＮに代えてＬＳＴＭ（Long Short Term Memory ）を用いてもよい。図９は、ＬＳＴＭを用いた学習モデルＸ３の内容例を示す模式図である。ＬＳＴＭはＲＮＮの一種であり、予測対象時点より前の時系列データを入力として、対象時点の予測値を出力するニューラルネットワークである。学習モデルＸ３に入力される音声は、時系列的に取得された通話中の音声について形態素解析された表現要素の最小単位（形態素：Morpheme ）である。

学習モデルＸ３は、入力層、中間層、及び出力層を有する。入力層は、時系列に沿って各時点の音声の入力をそれぞれ受け付ける複数のニューロンを有する。出力層は、詐欺の予測値（確率）を出力するニューロンを有する。中間層は、入力層の各ニューロンへの入力値から予測値を演算するためのニューロンを有する。中間層のニューロンはＬＳＴＭＢｌｏｃｋと呼ばれ、過去の時点での入力値に関する中間層での演算結果を用いて次の時点での入力値に関する演算を行うことで、直近時点までの時系列データから次の時点の値を演算する。このような学習モデルＸ３の出力（詐欺の確率）が所定値以上の場合に詐欺の旨を報知すればよい。

なお、実施形態１にあっては、電話機１ａが特殊詐欺に対応する場合を例示したが、これに限定されるものではない。例えば、電話機１ａに迷惑電話（嫌がらせ電話を含む）があった場合、通話中の音声の特徴量をＡＩで解析して迷惑電話に係る音声を検出し、迷惑の旨を報知することができる。具体的には、迷惑に係る音声の検出の有無情報を出力する学習モデルを、配信サーバ４からダウンロードして記憶部１１の記憶領域に記憶しておき、この学習モデルに通話中の音声の特徴量を入力し、出力された有無情報に基づいて迷惑の旨を報知又は通知する。ここでの学習モデルの内容は図６に示すものと同様であり、出力の「詐欺」を「迷惑」に置き換えてある。学習方法については、迷惑電話の音声の特徴量に迷惑を示すラベルを付与して大量に収集し、収集した音声の特徴量を学習モデルに順次入力して学習させる。

また、実施形態１にあっては、テレビジョン受信機５に詐欺の旨を報知したが、例えば電話機１ａにカメラ（第２撮像部に相当）を備え、テレビジョン受信機５にハードディスク等の録画装置を接続しておき、詐欺又は迷惑の旨の報知と同時に、カメラで撮像した画像及び通話中の音声を、テレビジョン受信機５の録画装置に録画（第２録画部に相当）することができる。これにより、使用者２００が詐欺電話又は迷惑電話に応対する様子が録画装置に記録される。

更に、実施形態１にあっては、電話機１ａがＷｉ−Ｆｉ通信部１７を備えているが、電話機１ａが第４世代移動通信システム（いわゆる４Ｇ、将来的には５Ｇ）に対応する公衆無線通信部（第１接続部に相当）を更に備えていてもよい。これにより、４Ｇ又は５Ｇを介して詐欺の旨を報知することができる。なお、使用者２００がＷｉ−Ｆｉ又は４Ｇ若しくは５Ｇに対応する電話機を所有していない場合であっても、後述する実施形態７の図２４に示す構成により、使用者２００の携帯電話機に着信したときに、Ｗｉ−Ｆｉ又は４Ｇ若しくは５Ｇに対応する通信によって報知を行うことができる。

（実施形態２）
実施形態１は、着信時に発信元の地域名を表示しない形態であるのに対し、実施形態２は、着信時に電話機１ａに発信元の地域名を表示する形態である。実施形態２に係る電話機１ａ及び報知システム１００ａの構成は、実施形態１の場合と同様であるため、対応する箇所には同様の符号を付して図示及びその説明を省略する。

本実施形態２では、有線通信部１６がナンバーディスプレイの機能に対応しており、且つ、電話回線にナンバーディスプレイのオプションが付帯されているものとする。ナンバーディスプレイでは、固定電話網Ｎｆからのリンガによる呼び出し前に、起動信号が送られるので、これに応答することにより、発信者番号が通知される。

制御部１０は、発信者番号に対応する地域名のテーブルを記憶部１１に記憶している。例えば、市外局番の「０１１」は料金区域の「札幌」に、「０３」は「東京」に、「０６」は大阪に、それぞれ対応付けられている。制御部１０は、通知された発信者番号を記憶部１１に記憶したテーブルに基づいて地域名に変換し、変換した地域名を表示部１２に表示する。発信者番号の受信完了後は、固定電話網Ｎｆからリンガによる呼び出しが行われるので、実施形態１の図３に示す処理手順で着信に応答することとなる。

図８は、実施形態２に係る電話機１ａで発信者番号を取得して表示部１２に表示する制御部１０の処理手順を示すフローチャートである。図８の処理は、通話中でない時に適時起動される。

図８の処理が起動された場合、制御部１０は、固定電話網Ｎｆから情報受信端末起動信号を検出したか否かを判定し（Ｓ２１）、検出しない場合（Ｓ２１：ＮＯ）、同信号を検出するまで待機する。情報受信端末起動信号を検出した場合（Ｓ２１：ＹＥＳ）、制御部１０は、固定電話網Ｎｆに対し直流ループを閉結して一時応答を行う（Ｓ２２）。

その後、制御部１０は、固定電話網Ｎｆから送られるモデム信号を復調して発信者番号取得し（Ｓ２３）、取得完了時に直流ループ開放して受信完了とする（Ｓ２４）。次いで、制御部１０は、取得した発信者番号を地域の名称に変換し（Ｓ２５）、変換した地域の名称を表示部１２に表示して（Ｓ２６）、図８の処理を終了する。

以上のように本実施形態２によれば、電話回線からの着信があった場合に、発信者番号に対応する地域の名称を表示部１２に表示する。従って、使用者２００は、家族や知人が所在する地域から発信されて着信したか否かを確かめることができる。

なお、本実施形態２にあっては、電話機３０１の発信者番号に基づいて発信者が所在する地域名を表示部１２に表示したが、公衆電話からの発信について、将来的に発信元の番号が通知された場合は、発信元の地域名を表示部１２に表示してもよい。また、発信者の位置情報が通知される場合は、発信者が所在する正確な位置を表示してもよい。例えば、ＧＰＳ機能を有する電話機からの発信について、将来的に発信者の位置情報が通知された場合は、発信者の位置を表示部１２に表示することができる。

また、発信者番号が通知された場合、詐欺若しくは迷惑の旨を報知したとき又は使用者２００が不図示のボタンを押下したときに、発信者の番号を記憶部１１又は６１１の内部メモリ（番号記憶部に相当）に記憶することにより、同じ発信元からの次回以降の着信を拒否する（通話中に移行させないことに相当）ことができる。着信拒否した番号を表示部１２又は６１２に表示してもよいし、番号の表示を操作部１３又は６１３からの操作でオン／オフできるようにしてもよい。また、着信拒否した相手に対して、例えば記憶部１１又は６１１に予め記憶した「この電話は受けられません」等のアナウンスを返すようにしてもよい。このように記憶した発信者の番号を、使用者の家族又は知人の携帯電話機６２等に通知して、関係者の間で着信拒否する発信者番号を共有するようにしてもよい。

（実施形態３）
実施形態１は、詐欺の旨を自装置から報知すると共に、テレビジョン受信機５に報知する形態であるのに対し、実施形態３は、詐欺の旨を予め登録された携帯電話機及びセキュリティ会社の通信装置に報知する形態である。実施形態３に係る電話機１ａの構成は、実施形態１の図２に示すものと同様である。

図１０は、実施形態３に係る電話機１ａを含む報知システム１００ｂの構成例を示すブロック図である。報知システム１００ｂは、実施形態１の図１に示す報知システム１００ａと比較して、インターネットＮｉに接続された携帯電話網Ｎｒを介して携帯電話機６１（第１携帯端末装置に相当）及び６２（第２携帯端末装置に相当）の着信が可能になっている。更に、インターネットＮｉには、電話機１ａの使用者２００が契約するセキュリティ会社の通信装置７がルータ３３を介して接続されている。なお、アクセスポイント２１には、テレビジョン受信機５のＨＤＭＩ端子に接続されたスティックＰＣ５１が接続されていてもよい。図１０では、使用者２００及び詐欺師３００の図示を省略する（後述する他の実施形態についても同様）。

その他、実施形態１の図１及び図２に対応する箇所には同様の符号を付してその説明を省略する。

本実施形態３では、電話回線の通話中に特殊詐欺に係る音声を検出した場合、制御部１０は、実施形態１の場合と同様に、表示部１２及びスピーカ１４により詐欺の旨を報知する。制御部１０は、更に、予め登録された使用者２００本人の携帯電話機６１、使用者２００の家族、知人等の携帯電話機６２及びセキュリティ会社の通信装置７に対し、使用者２００に詐欺電話がかかっている旨をＳＭＳ（Short Message Service ）、ＳＮＳ（Social Networking Service ）等を用いたメッセージにより報知する。ＳＮＳ等のアプリは、予め記憶部１１にインストールされている。携帯電話機６１及び６２の電話番号及びメールアドレスは、表示部１２に表示された設定メニューに対する操作部１３への使用者２００の操作により、予め記憶部１１に登録されている。

以下では、上述した電話機１ａの動作を、それを示すフローチャートを用いて説明する。図１１は、実施形態３に係る電話機１ａで特殊詐欺に係る音声を検出してその旨を報知する制御部１０の処理手順を示すフローチャートである。図１２は、実施形態３に係る電話機１ａによる報知の一例を示す説明図である。図１１の処理は、通話中でない時に適時起動される。図１１に示すステップＳ３１からＳ３７までの処理は、実施形態１の図５に示すステップＳ１１からＳ１７までの処理と同様であるため、ここでの説明を省略する。

図１１の処理が起動された場合、制御部１０は、ステップＳ１１からＳ３７までの処理を実行した後に、予め登録された携帯電話機６１及び／又は６２に接続する（Ｓ４０：第１及び第２接続部に相当）。次いで、制御部１０は、例えばメッセージにより、本人、家族等が詐欺の電話中である旨を報知する（Ｓ４１：報知部に相当）。ここで報知される内容は、例えば図１２の上段に示すような「ご家族の方に詐欺電話がかかっています！ご注意下さい」というものであるが、これに限定されるものではない。

その後、制御部１０は、使用者２００が契約しているセキュリティ会社の通信装置７に接続する（Ｓ４２：第２接続部に相当）。次いで、制御部１０は、契約者が詐欺の電話中である旨を報知し（Ｓ４３：報知部に相当）、図１１の処理を終了する。ここで報知される内容は、例えば図１２の下段に示すような「契約者（山田太郎様）に詐欺電話がかかっています！対処が必要です」というものであるが、これに限定されるものではない。

以上のように本実施形態３によれば、特殊詐欺に係る音声を検出した場合に、使用者２００の携帯電話機６１に接続して詐欺の旨を報知する。従って、通話中の電話が詐欺電話であることを、使用者２００により的確に報知することができる。

また、実施形態３によれば、特殊詐欺に係る音声を検出した場合に、使用者２００の家族、知人等の携帯電話機６２及び使用者２００が契約するセキュリティ会社の通信装置７に接続して詐欺の旨を報知する。従って、使用者２００が通話中の電話が詐欺電話であることを、使用者２００の家族、知人及びセキュリティ会社に報知することができる。

なお、実施形態３にあっては、詐欺の旨を報知したが、実施形態１と同様に、迷惑の旨を報知することができる。

（実施形態４）
実施形態１は、電話回線の通話中に特殊詐欺に係る音声を検出した場合、詐欺の旨を報知する形態であった。これに対し、実施形態４は、使用者２００と来訪者の対話中に騙り詐欺に係る音声を検出した場合、又は使用者２００による来訪者への応対中に訪問詐欺に係る画像を検出した場合に、詐欺の旨を報知する形態である。

ここで言う騙り詐欺とは、販売員が職業を騙ったり、職業を暗示させるような言動や服装を用いて、商品を販売したり役務提供契約を締結することをいう。騙り詐欺には、例えば警察官を騙る訪問型の振り込め詐欺が含まれる。本実施形態４で検出される詐欺は、騙り詐欺に限定されず、対話中の音声に基づいて検出される詐欺であればよい。一方、訪問詐欺とは、住宅等の施設を訪問して騙り詐欺、訪問販売詐欺等の詐欺行為全般を行うことをいう。

図１３は、実施形態４に係る電話機１ｃを含む報知システム１００ｃの構成例を示すブロック図である。報知システム１００ｃは、実施形態１の図１に示す報知システム１００ａと比較して、使用者２００の住宅の出入口に設けられたワイヤレスマイク８（第１集音部に相当）のレシーバ８１が、電話機１ｃに接続されている。アクセスポイント２１には、上記住宅の出入口又は門に設けられたＷｉ−Ｆｉカメラ９（第１撮像部に相当）が接続されている。

ワイヤレスマイク８及びレシーバ８１に代えて、例えばインターホンのマイクロフォンが有線で電話機１ｃに接続されていてもよいし、Ｂｌｕｅｔｏｏｔｈにて他のワイヤレスマイクが接続されていてもよい。Ｗｉ−Ｆｉカメラ９に代えて、例えばインターホンのカメラが有線で電話機１ｃに接続されていてもよいし、Ｂｌｕｅｔｏｏｔｈにて他のカメラが接続されていてもよい。マイクロフォン及びカメラがＢｌｕｅｔｏｏｔｈにて電話機１ｃと接続される場合は、表示部１２に表示された設定メニューに対する操作部１３への使用者２００の操作により、予めペアリング情報が記憶部１１に登録されている。

図１４は、実施形態４に係る電話機１ｃの構成例を示すブロック図である。電話機１ｃは、実施形態１の図２に示す電話機１ａと比較してＵＳＢＩ／Ｆ１９１（第３接続部に相当）を備える。また、記憶部１１には、後述する学習モデルＹ（第２の学習モデルに相当）及びＺ（第３の学習モデルに相当）それぞれを記憶するための記憶領域１１ｂ（第２の記憶部に相当）及び１１ｃ（第３の記憶部に相当）が確保されている。

ＵＳＢＩ／Ｆ１９１は、ワイヤレスマイク８のレシーバ８１と接続するためのインタフェースである。制御部１０は、ＵＳＢＩ／Ｆ１９１及びレシーバ８１を介してワイヤレスマイク８からの音声を常時取得する。取得された最新の音声は、記憶部１１における不図示のバッファ領域に、少なくとも一定区間（例えば０．０１秒）分だけ記憶される。

本実施形態４では、制御部１０は、配信サーバ４から学習モデルＹ及びＺの配信が通知された場合、配信サーバ４から学習モデルＹ及びＺそれぞれをダウンロードして記憶領域１１ｂ及び１１ｃに記憶する。制御部１０は、使用者２００と来訪者の対話中にワイヤレスマイク８が集音した音声を記憶部１１を介して時系列的に取得し、取得した音声の特徴量を抽出し、抽出した特徴量に基づいて監視対象の音声をＡＩで認識する。騙り詐欺に係る音声を検出した場合、制御部１０は、実施形態１の場合と同様に、その旨を自装置から報知すると共に、テレビジョン受信機５に報知する。

制御部１０は、また、使用者２００による来訪者への応対中にＷｉ−Ｆｉカメラ９が撮像した画像をＷｉ−Ｆｉ通信部１７（第４接続部に相当）を介して時系列的に取得し、取得した画像から人の顔、人の姿等のオブジェクトの画像を抽出して正規化し、正規化した画像中の監視対象をＡＩで認識する。訪問詐欺に係る画像を検出した場合、制御部１０は、騙り詐欺に係る音声を検出した場合と同様に、詐欺の旨を報知する。

以下では、上述した電話機１ｃの動作を、それを示すフローチャートを用いて説明する。制御部１０が、配信サーバ４から学習モデルＹ及びＺそれぞれをダウンロードして記憶領域１１ｂ及び１１ｃに記憶する処理手順を示すフローチャートは、実施形態１の図４に示すものと同様であるので、図示を省略する。但し、ステップＳ８では、学習モデルＹ及びＺをダウンロードし、ステップＳ９では、記憶領域１１ｂ及び１１ｃにそれぞれ記憶するように読み替える。

実施形態４に係る電話機１ｃで騙り詐欺に係る音声を検出してその旨を報知する制御部１０の処理手順は、通話中であるか否かに関わらずに一定周期（例えば０．０１秒）で起動される点を除いて、実施形態１の図３にフローチャートで示すものと同様であるため、ここでの図示を省略する。但し、ステップＳ１１では、制御部１０がワイヤレスマイク８から取得して記憶部１１に記憶した一定区間の音声を取得するように読み替える。また、ステップＳ１３及びＳ１４（第２取得部に相当）では、学習モデルＹを用いるように読み替える。

学習モデルＹの内容例を示す模式図は、実施形態１の図６に示すものと同様である。学習方法については、騙り詐欺の事例に係る音声の特徴ベクトルに詐欺を示すラベルを付与して大量に収集し、収集した特徴ベクトルを学習モデルＹに順次入力して学習させる。一般の詐欺師ではない第三者の音声についても同様の特徴ベクトルに詐欺ではないことを示すラベルを付与して大量に収集し、学習モデルＹに学習させる。このようにして学習させた学習モデルＹは、実施形態１の場合と同様に配信サーバ４から配信されるので、制御部１０は、配信された学習モデルＹを記憶部１１の記憶領域１１ｂに記憶して逐次更新する。

図１５は、実施形態４に係る電話機１ｃで訪問詐欺に係る画像を検出してその旨を報知する制御部１０の処理手順を示すフローチャートである。図１６は、実施形態４に係る学習モデルＺの内容例を示す模式図である。図１５の処理は、電話回線の通話中であるか否かに関わらずに適時起動される。図１５に示すステップＳ５５からＳ５９までの処理は、実施形態１の図５に示すステップＳ１５からＳ１９までの処理と同様であるため、ここでの説明の大部分を省略する。

図１５の処理が起動された場合、制御部１０は、Ｗｉ−Ｆｉカメラ９から１フレーム分の画像を取得し（Ｓ５１）、取得した画像から人の顔、人の姿等のオブジェクトの画像を抽出して、一定のルールに基づく正規化を行う（Ｓ５２）。正規化された画像は、例えばＬ行Ｍ列（Ｌ，Ｍは２以上の自然数）の画素の集合である。次いで、制御部１０は、正規化したオブジェクトの画像を学習モデルＺに入力し（Ｓ５３）、学習モデルＺから詐欺に係る画像の検出の有無情報を取得する（Ｓ５４：第３取得部に相当）。

ここで一旦図１６に移って、上述のステップＳ５３，Ｓ５４で用いられる学習モデルＺは、時刻ｔ１，ｔ２，ｔ３・・それぞれにて正規化されたオブジェクトの画像を構成する各画素の画素値を入力とし、入力画像中に監視対象が存在する（即ち検出有りの）確率及び何れの監視対象も存在しない（即ち検出無しの）確率を出力とする。出力層の各出力ノードが出力する確率は０〜１．０の値であり、全ての出力ノードが出力する確率の合計は１．０である。ここでの監視対象は、訪問詐欺に係る画像である。

学習モデルＺは、時系列的に取得されて正規化されたオブジェクトの画像と、人を識別する情報とを含む教師データを入力した場合に、監視対象の検出の有無情報を出力するように学習されたモデルである。具体的には、詐欺を働こうとする人を撮像した画像に詐欺師を示すラベルを付与して大量に収集し、収集した画像を学習モデルＺに順次入力して学習させる。詐欺師以外の第三者についても同様の画像に詐欺師ではないことを示すラベルを付与して大量に収集し、学習モデルＺに学習させる。

学習モデルＹ及びＺには、例えば、深層学習によって学習された多層のリカレントニューラルネットワーク（ＲＮＮ）を用いることができる。ＲＮＮに代えて、他の機械学習で学習したものを用いてもよい。なお、学習モデルＺは、時点ｔ１，ｔ２，ｔ３・・それぞれにて１つの画像のＮ個の画素に基づいて監視対象の検出の有無情報を出力するものであってもよい。

図１５に戻って、制御部１０は、取得した有無情報が監視対象の検出無しを示すか否かを判定し（Ｓ５５）、検出無しを示す場合（Ｓ５５：ＹＥＳ）、特段の処理を行わずに図１５の処理を終了する。有無情報が監視対象の検出無しを示さない場合（Ｓ５５：ＮＯ）、制御部１０は、詐欺に係る画像の検出の有無情報が詐欺の検出有りを示すか否かを更に判定する（Ｓ５６）。以下の処理手順は、実施形態１の図５に示す場合と同様である。

以上のように本実施形態４によれば、使用者２００の住宅の出入口で集音した音声を、配信サーバ４から配信された学習モデルＹに入力して、騙り詐欺に係る音声の検出の有無情報を取得し、取得した有無情報に基づいて詐欺の旨を報知する。従って、適時更新される最新の学習モデルＹを用いたＡＩ技術で騙り詐欺に係る対話中の音声を認識して多角的に報知することができる。

また、実施形態４によれば、使用者２００の住宅の出入口又は門の周囲を撮像した画像を、配信サーバ４から配信された学習モデルＺに入力して、訪問詐欺に係る画像の検出の有無情報を取得し、取得した有無情報に基づいて詐欺の旨を報知する。従って、適時更新される最新の学習モデルＺを用いたＡＩ技術で訪問詐欺に係る画像を認識して多角的に報知することができる。

本実施形態４にあっては、使用者２００と来訪者の対話中に騙り詐欺に係る音声を検出した場合、又は使用者２００による来訪者への応対中に訪問詐欺に係る画像を検出した場合に、詐欺の旨を報知したが、これに限定されるものではない。例えば、使用者２００による来訪者への応対中に、騙り詐欺に係る音声を検出し、且つ訪問詐欺に係る画像を検出した場合に、詐欺の旨を報知してもよい。

なお、実施形態４にあっては、ワイヤレスマイク８で集音した音声の特徴量をＡＩで解析して詐欺に係る音声を検出したが、同音声の特徴量をＡＩで解析して迷惑対話に係る音声を検出し、その旨を報知することができる。この場合の学習モデルは、実施形態１で通話中に迷惑に係る音声を検出するのに用いた学習モデルと同等である。学習方法については、迷惑対話の音声の特徴量に迷惑を示すラベルを付与して大量に収集し、収集した音声の特徴量を学習モデルに順次入力して学習させる。

また、実施形態４にあっては、Ｗｉ−Ｆｉカメラ９で撮像した画像をＡＩで解析して詐欺に係る画像を検出したが、同画像をＡＩで解析して迷惑行為に係る画像を検出し、その旨を報知することができる。具体的には、迷惑に係る画像の検出の有無情報を出力する学習モデルを、配信サーバ４からダウンロードして記憶部１１の記憶領域に記憶しておき、この学習モデルにＷｉ−Ｆｉカメラ９から取得して正規化した画像を入力し、出力された有無情報に基づいて迷惑の旨を報知又は通知する。ここでの学習モデルの内容は図１６に示すものと同様であり、出力の「詐欺」を「迷惑」に置き換えてある。学習方法については、迷惑行為を撮像した画像に迷惑を示すラベルを付与して大量に収集し、収集した画像を学習モデルに順次入力して学習させる。

更に、実施形態４にあっては、訪問詐欺に係る画像を検出して詐欺の旨を報知したが、テレビジョン受信機５にハードディスク等の録画装置を接続しておき、詐欺又は迷惑の旨の報知と同時に、Ｗｉ−Ｆｉカメラ９で撮像した画像を、テレビジョン受信機５の録画装置に録画（第５接続部及び第１録画部に相当）することができる。これにより、使用者２００が詐欺師又は迷惑行為に応対する様子が録画装置に記録される。Ｗｉ−Ｆｉカメラ９が音声も集音する場合は、集音された音声を含めて録画装置に録画すればよい。

更に、実施形態４にあっては、訪問詐欺に係る画像を検出したが、使用者の住宅内を撮像するカメラ（第３撮像部に相当）で撮像した画像をＡＩで解析して空き巣や強盗（即ち犯罪者の侵入）に係る画像を検出し、その旨を報知（第３の報知部に相当）することができる。例えば、パトライト（登録商標）、ブザー又は照明によって報知してもよいし、使用者２００又はその家族の携帯電話機６１又は６２に通知してもよい。具体的には、犯罪者の侵入に係る画像の検出の有無情報を出力する第５の学習モデルを、配信サーバ４からダウンロードして記憶部１１の記憶領域（第５の記憶部に相当）に記憶しておき、上記カメラから取得して正規化した画像を第５の学習モデルに入力して出力を取得し（第５取得部に相当）、取得した有無情報に基づいて侵入があった旨を報知又は通知する。第５の学習モデルの内容は、図１６に示すものと同様であり、出力の「詐欺」を「侵入」に置き換えてある。学習方法については、施設に侵入する犯罪者を撮像した画像に侵入を示すラベルを付与して大量に収集し、収集した画像を第５の学習モデルに順次入力して学習させる。

（変形例）
実施形態４は、リカレントニューラルネットワーク（ＲＮＮ）を用いた学習モデルＺに２次元の画像データを時系列的に入力して訪問詐欺に係る画像を検出する形態であった。これに対し、変形例は、畳み込みニューラルネットワーク（ＣＮＮ：Convolutional Neural Network ）を用いた学習モデルに、時間軸を含む３次元の画像データを入力して訪問詐欺に係る画像を検出する形態である。

変形例に係る報知システム１００ｃ及び電話機１ｃの構成は、実施形態４の図１３及び図１４に示す構成と同様であるため、実施形態４に対応する箇所には同様の符号を付してその説明を省略する。

本変形例では、電話機１ｃの制御部１０の処理手順を、実施形態４の図１５に示すフローチャートを引用して説明する。具体的には、図１５のステップＳ５３の処理を以下の処理に置き換える。制御部１０は、ステップＳ５２で正規化したオブジェクトの画像を記憶部１１内のオブジェクトメモリに一時的に記憶し、最新のＫフレーム（Ｋは２以上の自然数）分の（即ち３次元の）オブジェクトの画像を学習モデルＺ２に入力する。ステップＳ５１，Ｓ５２及びステップＳ５４〜Ｓ５９の処理は変更する必要がない。

図１７は、変形例に係る学習モデルＺ２の内容例を示す模式図である。学習モデルＺ２は、Ｋフレーム分の３次元のオブジェクトの画像を構成する各画素の画素値を入力とし、入力画像中に監視対象が存在する（即ち検出有りの）確率及び何れの監視対象も存在しない（即ち検出無しの）確率を出力とする。学習モデルＺ２に対する最新のＫフレーム分のオブジェクトの画像の入力は、実行する時刻を小刻みにシフトさせながら繰り返される。出力層の各出力ノードが出力する確率は０〜１．０の値であり、全ての出力ノードが出力する確率の合計は１．０である。ここでの監視対象は、訪問詐欺に係る画像である。

学習モデルＺ２は、実施形態４の学習モデルＺと同様の教師データを用いて学習されるので、ここでの学習方法の説明を省略する。学習モデルＺ２は、実施形態４の学習モデルＺと同様に配信サーバ４から配信された場合に、記憶部１１の記憶領域１１ｃに記憶すればよい。

学習モデルＺ２には、深層学習（ディープラーニング）によって学習された多層のＣＮＮを用いることができる。ＣＮＮは、入力層と出力層との間に中間層を備える。中間層は、複数段からなる畳み込み層及びプーリング層、並びに最終段の全結合層を有する。全結合層の数は適宜決定できる。

入力層、中間層及び出力層それぞれには、複数のノードが存在する。各層のノードは、前後の層に存在するノードと一方向に所望の重み及びバイアスで結合されている。入力層に入力されたデータが中間層に入力された場合、重み及びバイアスを含む活性化関数を用いて、一の層の出力が算出され、算出された出力が後の層に入力される。以下同様にして、出力層の出力が求められるまで中間層の出力が次々と後の層に伝達される。この間に、時間軸上で離れたフレーム内のオブジェクトの画素についても畳み込み結合が行われるため、人の動作が認識されるようになる。

以上のように本変形例によれば、使用者２００の住宅の出入口又は門の周囲を撮像した画像を、配信サーバ４から配信された学習モデルＺ２に入力して、訪問詐欺に係る画像の検出の有無情報を取得し、取得した有無情報に基づいて詐欺の旨を報知する。従って、適時更新される最新の学習モデルＺ２を用いたＡＩ技術で訪問詐欺に係る画像を認識して多角的に報知することができる。

（実施形態５）
実施形態１は、電話回線の通話中に特殊詐欺に係る音声を検出した場合、詐欺の旨を報知する形態であった。これに対し、実施形態５は、電話機の周囲で介助を求める音声を検出した場合に、人の介助を要する旨を報知する形態である。実施形態５に係る報知システムの構成は、実施形態３の図１０に示す報知システム１００ｂと同様であるため、図示を省略する。

図１８は、実施形態５に係る電話機１ｄの構成例を示すブロック図である。電話機１ｄは、実施形態１の図２に示す電話機１ａと比較して周囲の音声を集音するマイクロフォン１９２（第２集音部に相当）を更に備える。また、記憶部１１には、後述する学習モデルＷ（第４の学習モデルに相当）を記憶するための記憶領域１１ｄ（第４の記憶部に相当）が確保されている。制御部１０は、マイクロフォン１９２からの音声を常時取得する。取得された最新の音声は、記憶部１１における不図示のバッファ領域に、少なくとも一定区間（例えば０．０１秒）分だけ記憶される。

本実施形態５では、制御部１０は、配信サーバ４から学習モデルＷの配信が通知された場合、配信サーバ４から学習モデルＷをダウンロードして記憶領域１１ｄに記憶する。制御部１０は、マイクロフォン１９２が集音した音声を記憶部１１を介して時系列的に取得し、取得した音声の特徴量を抽出し、抽出した特徴量に基づいて監視対象の音声をＡＩで認識する。介助を求める音声を検出した場合、制御部１０は、予め登録された使用者２００の家族又は知人の携帯電話機６２及びセキュリティ会社の通信装置７に対し、使用者２００が人の介助を要する旨を報知する。この報知は、例えば使用者２００が契約している介助サービス施設等に行ってもよい。

以下では、上述した電話機１ｄの動作を、それを示すフローチャートを用いて説明する。制御部１０が、配信サーバ４から学習モデルＷをダウンロードして記憶領域１１ｄに記憶する処理手順を示すフローチャートは、実施形態１の図４に示すものと同様であるので、図示を省略する。但し、ステップＳ８では、学習モデルＷをダウンロードし、ステップＳ９では、記憶領域１１ｄに記憶するように読み替える。

図１９は、実施形態５に係る電話機１ｄで介助を求める音声を検出してその旨を報知する制御部１０の処理手順を示すフローチャートである。図２０は、実施形態５に係る学習モデルＷの内容例を示す模式図である。図２１は、実施形態５に係る電話機１ｄによる報知の一例を示す説明図である。

図１９の処理は、電話回線の通話中であるか否かに関わらずに一定周期（例えば０．０１秒）で起動される。図１９に示すステップＳ６１からＳ６３までの処理は、実施形態１の図５に示すステップＳ１１からＳ１３までの処理と同様であるため、ここでの説明の一部を省略する。

図１９の処理が起動された場合、制御部１０は、記憶部１１に記憶された一定区間（ここでは０．０１秒）の音声を取得し（Ｓ６１）、取得した音声の周波数スペクトルを特徴量として抽出する（Ｓ６２）。次いで、制御部１０は、過去のある区間と前後５区間の特徴量を纏めて学習モデルＷに入力し（Ｓ６３）、学習モデルＷから介助を求める音声の検出の有無情報を取得する（Ｓ６４：第４取得部に相当）。

ここで一旦図２０に移って、上述のステップＳ６３，Ｓ６４で用いられる学習モデルＷは、連続する区間Ｔ１，Ｔ２，Ｔ３・・それぞれにて結合された音声のＮ次元の特徴ベクトル（特徴＿１〜特徴＿Ｎ）を入力とし、入力中に監視対象が存在する（即ち介助要の検出有りの）確率及び監視対象が存在しない（即ち検出無しの）確率を出力とする。ここでの監視対象は、介助を求める音声である。

学習モデルＷは、監視対象を含む音声の時系列的な特徴ベクトルと、介助を求めているか否かを識別する情報とを含む教師データを入力した場合に、監視対象の検出の有無情報を出力するように学習されたモデルである。具体的には、体調不良及び不安の訴え、何らかの援助の要請、並びに乳児の泣き声等を示す音声の特徴ベクトルに介助要を示すラベルを付与して大量に収集し、収集した特徴ベクトルを学習モデルＷに順次入力して学習させる。介助を求めていない第三者の音声についても同様の特徴ベクトルに救助要ではないことを示すラベルを付与して大量に収集し、学習モデルＷに学習させる。

図１９に戻って、制御部１０は、取得した有無情報が監視対象の検出無しを示すか否かを判定し（Ｓ６５）、検出無しを示す場合（Ｓ６５：ＹＥＳ）、特段の処理を行わずに図１９の処理を終了する。有無情報が監視対象の検出無しを示さない場合（Ｓ６５：ＮＯ）、制御部１０は、介助を求める音声の検出の有無情報が介助要の検出有りを示すか否かを更に判定する（Ｓ６６）。

有無情報が介助要の検出有りを示す場合（Ｓ６６：ＹＥＳ）、制御部１０は、予め登録された家族等の携帯電話機６２に接続する（Ｓ６７）。次いで、制御部１０は、例えばメッセージにより、本人、家族等が人の介助を要する旨を報知する（Ｓ６８：第２の報知部に相当）。ここで報知される内容は、例えば図２１の上段に示すような「ご家族の方に介助が必要です！対処して下さい」というものであるが、これに限定されるものではない。

その後、制御部１０は、使用者２００が契約しているセキュリティ会社の通信装置７に接続する（Ｓ６９）。次いで、制御部１０は、契約者が人の介助を要する旨を報知し（Ｓ７０：第２の報知部に相当）、図１９の処理を終了する。ここで報知される内容は、例えば図２１の下段に示すような「契約者（山田太郎様）に介助が必要です！対処して下さい」というものであるが、これに限定されるものではない。

以上のように本実施形態５によれば、電話機１ｄの周囲の音声を、配信サーバ４から配信された学習モデルＷに入力して、介助を求める音声の検出の有無情報を取得し、取得した有無情報に基づいて人の介助を要する旨を報知する。従って、適時更新される最新の学習モデルＷを用いたＡＩ技術で介助を求める使用者２００の音声を認識して多角的に報知することができる。

（実施形態６）
実施形態５は、電話機１ｄが周囲で介助を求める音声を検出した場合に、人の介助を要する旨を報知する形態であった。これに対し、実施形態６は、電話機とは別体のインテリジェントスピーカ４００が周囲で介助を求める音声を検出した場合に、人の介助を要する旨を報知する形態である。実施形態６に係る電話機１ａの構成は、実施形態１の図２に示すものと同様である。

図２２は、実施形態６に係る電話機１ａを含む報知システム１００ｄの構成例を示すブロック図である。報知システム１００ｄは、実施形態１の図１に示す報知システム１００ａと比較して、アクセスポイント２１にインテリジェントスピーカ４００が接続されている。また、インターネットＮｉには、電話機１ａの使用者２００が契約するセキュリティ会社の通信装置７がルータ３３を介して接続されている。更に、インターネットＮｉに接続された携帯電話網Ｎｒを介して携帯電話機６２の着信が可能になっている。なお、アクセスポイント２１には、テレビジョン受信機５のＨＤＭＩ端子に接続されたスティックＰＣ５１が接続されていてもよい。

図２３は、インテリジェントスピーカ４００の構成例を示すブロック図である。インテリジェントスピーカ４００は、制御部４１０、記憶部４１１、表示部４１２、操作部４１３、スピーカ４１４（音出力部に相当）、マイクロフォン４１５（集音部に相当）及びＷｉ−Ｆｉ通信部４１７（通信部に相当）を備える。

制御部４１０は、ＣＰＵ、ＧＰＵ等のプロセッサと、メモリ等を含む。制御部４１０は、プロセッサ、メモリ、記憶部４１１、Ｗｉ−Ｆｉ通信部４１７等を集積した１つのハードウェア（ＳｏＣ：System On a Chip ）として構成してもよい。制御部４１０は、記憶部４１１に記憶されている制御プログラム（不図示）に基づく制御を行う。

記憶部４１１は、例えばフラッシュメモリ等の不揮発性メモリを含む。記憶部４１１は、上記の制御プログラムを記憶する他、学習モデルＷ（第４の学習モデルに相当）を記憶するための記憶領域４１１ａ（学習記憶部に相当）が確保されている。

表示部４１２は、液晶ディスプレイ、有機ＥＬディスプレイ等の表示器であり、制御部４１０に制御されて各種の情報を表示する。操作部４１３は、ユーザによる操作を受け付けるためのインタフェースであり、物理ボタンで構成してもよいし、表示部４１２と一体化されたタッチパネルで構成してもよい。

スピーカ４１４は、使用者２００と対話するための音声を拡声する他、例えばインターネットＮｉからアクセスポイント２１及びＷｉ−Ｆｉ通信部４１７を介してダウンロードした音楽等を拡声する。マイクロフォン４１５は、使用者２００の音声を含む周囲の音声を集音するためのものである。集音された最新の音声は、記憶部４１１における不図示のバッファ領域に、少なくとも一定区間（例えば０．０１秒）分だけ記憶される。Ｗｉ−Ｆｉ通信部４１７は、Ｗｉ−Ｆｉ規格に準拠する無線通信によって無線ＬＡＮ２のアクセスポイント２１に接続するためのインタフェースである。

本実施形態６では、制御部４１０は、配信サーバ４から学習モデルＷの配信が通知された場合、配信サーバ４から学習モデルＷをダウンロードして記憶領域４１１ａに記憶する。制御部４１０は、また、マイクロフォン４１５が集音した音声を記憶部４１１を介して時系列的に取得し、取得した音声の特徴量を抽出し、抽出した特徴量に基づいて監視対象の音声をＡＩで認識する。介助を求める音声を検出した場合、制御部４１０は、予め登録された使用者２００の家族、知人等の携帯電話機６２及びセキュリティ会社の通信装置７に対し、使用者２００が人の介助を要する旨を報知する。

制御部４１０が、配信サーバ４から学習モデルＷをダウンロードして記憶領域４１１ａに記憶する処理手順を示すフローチャートは、実施形態１の図４に示すものと同様であるので、図示を省略する。但し、ステップＳ８では、学習モデルＷをダウンロードし、ステップＳ９では、記憶領域４１１ａに記憶するように読み替える。

制御部４１０が、介助を求める音声を検出してその旨を報知する（介助報知部に相当）処理手順を示すフローチャートは、実施形態５の図１９に示すものと同様であるので、図示を省略する。但し、ステップＳ６１では、記憶部４１１に記憶された一定区間（ここでは０．０１秒）の音声を取得し、ステップＳ６３及びＳ６４（取得部に相当）では、記憶領域４１１ａに記憶された学習モデルＷを用いるように読み替える。

なお、インテリジェントスピーカ４００が携帯電話機６２に接続するには、先ずインテリジェントスピーカ４００がインターネットＮｉ上の不図示のサーバに接続し、該サーバが携帯電話網Ｎｒに乗り入れて、予め登録された携帯電話機６２に着信するようにしておく必要がある。

以上のように本実施形態６によれば、インテリジェントスピーカ４００の周囲の音声を、配信サーバ４からインテリジェントスピーカ４００に配信された学習モデルＷに入力して、介助を求める音声の検出の有無情報を取得し、取得した有無情報に基づいて人の介助を要する旨を報知する。従って、適時更新される最新の学習モデルＷを用いたＡＩ技術で介助を求める使用者２００の音声を認識して多角的に報知することができる。

なお、実施形態５及び６にあっては、介助を求める音声を検出して報知したが、報知された使用者２００の家族等が、使用者２００の室内のＩＯＴ（Internet Of Things ）機器にアクセスして様々な操作が行えるようにしてもよい。例えば、エアコンの温度や湿度の設定、床暖房のオン／オフ、照明のオン／オフ、浴槽への給湯のオン／オフ、テレビジョン受信機の録画設定、自動掃除機のオン／オフ、洗濯機のオン／オフ、介助ロボットの作動、介護ロボットの作動等が行えることが好ましい。一般的には、実施形態３の図１０に示すアクセスポイント２１があれば、アクセスポイント２１にＷＩ−Ｆｉで接続されたＩＯＴ機器に対し、携帯電話機６１，６２からアクセスしてＩＯＴ機器の動作を制御することができる。

また、実施形態６にあっては、インテリジェントスピーカ４００で介助を求める音声を検出して報知したが、これを更に発展させてもよい。具体的には、いわゆるＡＩカメラを使用者２００の住宅の室内、玄関等に設置しておき、使用者２００又はその家族が、外出先から上記ＡＩカメラにアクセスして、室内、玄関等の様子を確認することができるようにしてもよい。一般的には、実施形態３の図１０に示すアクセスポイント２１があれば、アクセスポイント２１に接続されたＷｉ−Ｆｉカメラに対し、携帯電話機６１，６２からアクセスして室内等をモニタすることができる。

（実施形態７）
実施形態１及び３は、電話機１ａによる通話中に特殊詐欺に係る音声を検出した場合、詐欺の旨を報知する形態であった。これに対し、実施形態７は、携帯電話機６１による通話中に特殊詐欺に係る音声を検出した場合に、詐欺の旨を報知する形態である。

図２４は、実施形態７に係る携帯電話機６１を含む報知システム１００ｅの構成例を示すブロック図である。報知システム１００ｅは、実施形態１の図１に示す報知システム１００ａと比較して、電話機１ａが削除されている。また、固定電話網Ｎｆに接続された携帯電話網Ｎｒを介して携帯電話機６１及び６２の発着信が可能になっている。その他、実施形態１の図１に対応する箇所には同様の説明を付してその説明を省略する。

図２５は、実施形態７に係る携帯電話機６１の構成例を示すブロック図である。携帯電話機６１は、例えばスマートフォンであるが、タブレット端末、汎用のＰＣ、又はスマートウォッチ等のウェアラブルデバイスであってもよい。携帯電話機６１は、制御部６１０、記憶部６１１、表示部６１２、操作部６１３、スピーカ６１４、マイクロフォン６１５、Ｗｉ−Ｆｉ通信部６１７及び公衆無線通信部６１８を備える。操作部６１３は、表示部６１２と一体化されたタッチパネルであるが、これに限定されるものではない。

制御部６１０は、ＣＰＵ、ＧＰＵ等のプロセッサと、メモリ等を含む。制御部６１０は、プロセッサ、メモリ、記憶部６１１、Ｗｉ−Ｆｉ通信部６１７、公衆無線通信部６１８等を集積した１つのハードウェア（ＳｏＣ：System On a Chip ）として構成してもよい。制御部６１０は、記憶部６１１に記憶されているアプリプログラム６１１ａに基づく制御を行う。

記憶部６１１は、例えばフラッシュメモリ等の不揮発性メモリを含む。記憶部６１１は、アプリプログラム６１１ａを記憶する。アプリプログラム６１１ａがＷｅｂブラウザ機能を含んでもよいし、汎用のＷｅｂブラウザプログラムが別途記憶部６１１に記憶されていてもよい。アプリプログラム６１１ａは、記憶媒体６１９に記憶されたものを制御部６１０がＷｉ−Ｆｉ通信部６１７、公衆無線通信部６１８又は図示しない入出力部を介して読み出して記憶部６１１に複製したものであってもよい。

Ｗｉ−Ｆｉ通信部６１７は、Ｗｉ−Ｆｉ規格に準拠する無線通信によって無線ＬＡＮ２のアクセスポイント２１に接続するためのインタフェースである。公衆無線通信部６１８は、移動通信システムの規格に準拠する無線通信により、携帯電話網Ｎｒを介して無線電話の発着信及び通話を行うためのインタフェースである。通話中の最新の音声は、記憶部６１１における不図示のバッファ領域に、少なくとも一定区間（例えば０．０１秒）分だけ記憶される。

本実施形態７では、制御部６１０は、配信サーバ４から学習モデルＷの配信が通知された場合、配信サーバ４から学習モデルＸ１をダウンロードして記憶領域６１１ｂに記憶する。制御部６１０は、また、携帯電話網Ｎｒからの着信があった場合、通話中の音声を記憶部６１１を介して時系列的に取得し、取得した音声の特徴量を抽出し、抽出した特徴量に基づいて監視対象の音声をＡＩで認識する。特殊詐欺に係る音声を検出した場合、制御部６１０は、その旨を自装置から報知すると共に、テレビジョン受信機５及び携帯電話機６２に報知する。

制御部６１０が、配信サーバ４から学習モデルＸ１をダウンロードして記憶領域６１１ｂに記憶する処理手順を示すフローチャートは、実施形態１の図４に示すものと同様であるので、図示を省略する。但し、ステップＳ９では、記憶領域６１１ｂに記憶するように読み替える。

制御部６１０が、特殊詐欺に係る音声を検出してその旨を報知する処理手順を示すフローチャートは、実施形態１の図５のステップＳ１９の後に、実施形態３の図１１のステップＳ４０，Ｓ４１の処理を追加したものと同様であるので、図示を省略する。但し、図３のステップＳ１１では、記憶部６１１に記憶された一定区間（ここでは０．０１秒）の音声を取得し、ステップＳ１３及びＳ１４では、記憶領域６１１ｂに記憶された学習モデルＸ１を用いるように読み替える。また、ステップＳ１７では、表示部６１２及びスピーカ６１４により、詐欺の旨を報知するように読み替える。

以上のように本実施形態７によれば、配信サーバ４から配信された学習モデルＸ１に通話中の音声を入力して、特殊詐欺に係る音声の検出の有無情報を取得し、取得した有無情報に基づいて詐欺の旨を報知する。従って、適時更新される最新の学習モデルＸ１を用いたＡＩ技術で特殊詐欺に係る通話中の音声を認識して多角的に報知することができる。

また、実施形態７によれば、特殊詐欺に係る音声を検出した場合に、予め登録されたテレビジョン受信機５を起動して詐欺の旨を報知する。従って、通話中の電話が詐欺電話であることを、使用者２００により的確に報知することができる。

更に、実施形態７によれば、特殊詐欺に係る音声を検出した場合に、使用者２００の家族又は知人の携帯電話機６２に接続して詐欺の旨を報知する。従って、通話中の電話が詐欺電話であることが、使用者２００の家族又は知人に的確に報知することができる。

なお、実施形態７は、実施形態１及び３に係る電話機１ａを携帯電話機６１に置き換えた形態であるが、他の実施形態２及び４−６に係る電話機１ａ、１ｃ又は１ｄを携帯電話機６１に置き換えてもよい。

また、実施形態１から６に係る電話機１ａ、１ｃ又は１ｄにＭｉｒａｃａｓｔ（登録商標）、ＡｉｒＰｌａｙ（登録商標）、ＧｏｏｇｌｅＣａｓｔ（登録商標）等のワイヤレスディスプレイアダプタ機能を搭載してもよい。これにより、携帯電話機６１，６２等の携帯情報機器が表示画像及び音声をワイヤレスディスプレイアダプタ機能により無線化して伝送した場合に、電話機１ａ、１ｃ又は１ｄからテレビジョン受信機５等の映像機器に、携帯情報機器の表示画像及び音声を中継することができる。

例えば、携帯電話機６１，６２がＭｉｒａｃａｓｔの機能により無線化した表示画像及び音声の信号をＷｉ−Ｆｉｄｉｒｅｃｔで電話機１ａ、１ｃ又は１ｄに伝送した場合（外部装置から接続された場合に相当）、電話機１ａ、１ｃ又は１ｄは伝送された信号をＨＤＭＩ又はＢｌｕｅｔｏｏｔｈの通信部（第５接続部に相当）を介してテレビジョン受信機５に送信する。これにより、例えば、携帯電話機６１，６２を用いたテレビ電話又はＳＮＳの通信（Ｌｉｎｅ、メール等）において、テレビジョン受信機５を大画面のモニタとして利用することができる。

更に、実施形態１から６に係る電話機１ａ、１ｃ又は１ｄにＡＩスピーカを内蔵することができる。具体的には、電話機１ａ、１ｃ又は１ｄにマイクロフォン（第２集音部に相当）と、集音された音声を認識する音声認識部とを備えておき、音声認識部の認識結果に基づいて、無線ＬＡＮ２にＷｉ−Ｆｉで接続されたＩＯＴ機器を制御する（音声認識制御部に相当）。

更に、実施形態１から６に係る電話機１ａ、１ｃ又は１ｄに音声認識機能を搭載しておき、音声による操作が可能であるようにすることができる。具体的には、電話機１ａ、１ｃ又は１ｄにマイクロフォン（第２集音部に相当）と、集音された音声を認識する音声認識部とを備えておき、音声認識部の認識結果に基づいて、自装置を制御する（音声認識制御部に相当）。これにより、使用者２００が身体の不自由な場合であっても、音声により着信に応答してオフフックしたり、通話終了時にオンフックしたりすることができる。

更に、実施形態１から６に係る電話機１ａ、１ｃ若しくは１ｄに無線ＬＡＮ２を介して自治体等から災害情報がメール等によって通知された場合、又は実施形態７に係る携帯電話機６１に４Ｇ又は５Ｇを介して災害情報が通知された場合、通知された災害情報を、各電話機の表示部１２又は６１２に表示し、スピーカ１４又は６１４で拡声することができる。各電話機に通知された災害情報を、無線ＬＡＮ２を介してテレビジョン受信機５に表示及び拡声させることもできる。この場合、実施形態１と同様にテレビジョン受信機５の電源を自動的にオンさせ、詐欺又は迷惑の旨の報知と同様に災害情報を表示及び拡声させてもよいし、上述のワイヤレスディスプレイアダプタ機能により、通知された災害情報をテレビジョン受信機５に中継してもよい。テレビジョン受信機５で拡声される災害情報の音量を自動的にアップさせてもよい。災害情報が、テレビジョン受信機５に接続されたスティックＰＣ５１に無線ＬＡＮ２を介して通知される場合は、テレビジョン受信機５単体で災害情報を表示及び拡声させることができる。このような構成により、情報の取得に不慣れな老人等に積極的に災害情報を通知することができる。

更にまた、実施形態１から６に係る電話機１ａ、１ｃ又は１ｄに、種々のセンサやカメラ（室温センサ、湿度センサ、音センサ、人感センサ、動体検知センサ、暗視カメラ、首振り式のカメラ等）を搭載しておき、これらを用いた種々のアプリケーションに対応可能としておくことが好ましい。

更にまた、実施形態１から６で用いられるテレビジョン受信機５にチャット用のカメラ及びマイクロフォンを取り付けておき、スティックＰＣ５１及び無線ＬＡＮ２を介して遠方の医療機関との間でオンライン医療が可能となるようにすることができる。

今回開示された実施形態は、全ての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。また、各実施形態で記載されている技術的特徴は、お互いに組み合わせることが可能である。

１ａ、１ｃ、１ｄ電話機
１０制御部
１１記憶部
１１ａ、１１ｂ、１１ｃ、１１ｄ記憶領域
１２表示部
１４スピーカ
１６有線通信部
１７Ｗｉ−Ｆｉ通信部
１９１ＵＳＢＩ／Ｆ
１９２マイクロフォン
２無線ＬＡＮ
２１アクセスポイント
４配信サーバ
５テレビジョン受信機
５１スティックＰＣ
６１、６２携帯電話機
６１０制御部
６１１記憶部
６１１ａアプリプログラム
６１１ｂ記憶領域
６１５マイクロフォン
６１７Ｗｉ−Ｆｉ通信部
６１９記憶媒体
７通信装置
８１レシーバ
８ワイヤレスマイク
９Ｗｉ−Ｆｉカメラ
１００ａ、１００ｂ、１００ｃ、１００ｄ、１００ｅ報知システム
２００使用者
３００詐欺師
４００インテリジェントスピーカ
４１０制御部
４１１記憶部
４１１ａ記憶領域
４１４スピーカ
４１５マイクロフォン
４１７Ｗｉ−Ｆｉ通信部
Ｎｆ固定電話網
Ｎｉインターネット
Ｎｒ携帯電話網
Ｘ１、Ｘ２、Ｘ３、Ｙ、Ｚ、Ｚ２、Ｗ学習モデル

Claims

電話回線からの着信に応答して前記電話回線の状態を通話中に移行させる第１通信部と、
Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信する第２通信部と、
前記電話回線の使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続する第２接続部と、
通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する記憶部と、
前記記憶部に記憶した学習モデルに前記第１通信部を介して取得した通話中の音声を入力して出力された有無情報を取得する第１取得部と、
該第１取得部が取得した有無情報に基づいて、前記第２接続部が接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知する報知部と
を備え、
前記電話回線が設けられた施設の出入口における音声を集音する第１集音部に接続する第３接続部と、
対話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する第２の学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する第２の記憶部と、
該第２の記憶部に記憶した第２の学習モデルに前記第１集音部から取得した音声を入力して出力された有無情報を取得する第２取得部と
を更に備え、
前記報知部は、前記第２取得部が取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知するようにしてある電話機。
電話回線からの着信に応答して前記電話回線の状態を通話中に移行させる第１通信部と、
Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信する第２通信部と、
前記電話回線の使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続する第２接続部と、
通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する記憶部と、
前記記憶部に記憶した学習モデルに前記第１通信部を介して取得した通話中の音声を入力して出力された有無情報を取得する第１取得部と、
該第１取得部が取得した有無情報に基づいて、前記第２接続部が接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知する報知部と
を備え、
前記電話回線が設けられた施設の出入口の周囲を撮像する第１撮像部に接続する第４接続部と、
画像が入力された場合に詐欺又は迷惑に係る画像の検出の有無情報を出力する第３の学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する第３の記憶部と、
該第３の記憶部に記憶した第３の学習モデルに前記第１撮像部から取得した画像を入力して出力された有無情報を取得する第３取得部と、
を更に備え、
前記報知部は、前記第３取得部が取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知するようにしてある電話機。
電話回線からの着信に応答して前記電話回線の状態を通話中に移行させる第１通信部と、
Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信する第２通信部と、
前記電話回線の使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続する第２接続部と、
通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する記憶部と、
前記記憶部に記憶した学習モデルに前記第１通信部を介して取得した通話中の音声を入力して出力された有無情報を取得する第１取得部と、
該第１取得部が取得した有無情報に基づいて、前記第２接続部が接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知する報知部と、
を備え、
前記電話回線が設けられた施設の内部を撮像する第３撮像部に接続する第６接続部と、
画像が入力された場合に犯罪者の侵入に係る画像の検出の有無情報を出力する第５の学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する第５の記憶部と、
該第５の記憶部に記憶した第５の学習モデルに前記第３撮像部から取得した画像を入力して出力された有無情報を取得する第５取得部と、
該第５取得部が取得した有無情報に基づいて侵入の旨を報知する第３の報知部と
を更に備える電話機。
前記第３の報知部は、回転式赤色灯、ブザー又は照明器具を用いて報知する請求項３に記載の電話機。
登録された第１携帯端末装置に接続する第１接続部を備え、
前記報知部は、前記第１接続部が接続した第１携帯端末装置に詐欺又は迷惑の旨を報知する
請求項１から請求項４の何れか１項に記載の電話機。
前記第１通信部は、前記着信があった場合、発信者番号を取得するようにしてあり、
前記第１通信部が取得した発信者番号に基づいて、発信元が所在する地域の名称を表示する表示部を備える請求項１から請求項５の何れか１項に記載の電話機。
前記報知部が詐欺又は迷惑の旨を報知した場合、前記第１通信部が取得した発信者番号を記憶する番号記憶部を備え、
前記第１通信部は、前記着信があった場合、前記番号記憶部に記憶されている発信者番号を取得したときは、前記電話回線の状態を通話中に移行させない
請求項６に記載の電話機。
登録されたテレビジョン受信機に接続する第５接続部と、
前記報知部が、前記第３取得部が取得した有無情報に基づいて報知する場合、前記第１撮像部が撮像した画像を、前記テレビジョン受信機に接続された録画装置に録画させる第１録画部と
を備える請求項２に記載の電話機。
登録されたテレビジョン受信機に接続する第５接続部を備え、
前記報知部は、前記第５接続部が接続したテレビジョン受信機に詐欺又は迷惑の旨を報知する
請求項１から請求項７の何れか１項に記載の電話機。
周囲を撮像する第２撮像部と、
前記報知部が、前記第１取得部が取得した有無情報に基づいて報知する場合、前記第２撮像部が撮像した画像及び通話中の音声を、前記テレビジョン受信機に接続された録画装置に録画させる第２録画部と
を備える請求項９に記載の電話機。
前記第５接続部は、ＨＤＭＩ（登録商標）又はＢｌｕｅｔｏｏｔｈ（登録商標）にて前記テレビジョン受信機に接続し、
前記無線ＬＡＮを介して外部装置から接続された場合、前記外部装置から取得した画像信号を前記第５接続部を介して前記テレビジョン受信機に送信する
請求項９に記載の電話機。
音声が入力された場合に介助を求める音声の検出の有無情報を出力する第４の学習モデルを前記サーバから前記第２通信部を介してダウンロードして記憶する第４の記憶部と、
周囲の音声を集音する第２集音部と、
前記第４の記憶部に記憶した第４の学習モデルに前記第２集音部が集音した音声を入力して出力された有無情報を取得する第４取得部と、
該第４取得部が取得した有無情報に基づいて人の介助を要する旨を報知する第２の報知部と
を備える請求項１から請求項１１の何れか１項に記載の電話機。
周囲の音声を集音する第２集音部と、
該第２集音部が集音した音声を認識する音声認識部と、
該音声認識部が認識した結果に基づいて、自装置又は前記電話回線が設けられた施設内の機器若しくは設備の動作を制御する音声認識制御部と
を備える請求項１から請求項１１の何れか１項に記載の電話機。
前記電話回線が設けられた施設内の機器又は設備と無線又は赤外線で通信する第３通信部と、
前記無線ＬＡＮを介して外部装置から接続された場合、前記機器又は設備を制御する信号を前記外部装置から取得して無線信号又は赤外線信号に変換する変換部と
を備え、
該変換部が変換した無線信号又は赤外線信号を、前記第３通信部を介して送信する
請求項１から請求項１３の何れか１項に記載の電話機。
請求項１から１４の何れか１項に記載の電話機と、
周囲の音声を集音する集音部、
音声を出力する音出力部、
前記無線ＬＡＮを介して前記サーバと通信する通信部、
音声が入力された場合に介助を求める音声の検出の有無情報を出力する第４の学習モデルを前記サーバから前記通信部を介してダウンロードして記憶する学習記憶部、
該学習記憶部に記憶した第４の学習モデルに前記集音部が集音した音声を入力して出力された有無情報を取得する取得部及び
該取得部が取得した有無情報に基づいて人の介助を要する旨を報知する介助報知部
を有するインテリジェントスピーカと
を備える報知システム。
コンピュータに、
電話回線からの着信に応答して前記電話回線の状態を通話中に移行し、
Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信し、
前記電話回線の使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続し、
通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバからダウンロードして記憶し、
記憶した学習モデルに通話中に取得した音声を入力して出力された有無情報を取得し、
取得した有無情報に基づいて、接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知し、
前記電話回線が設けられた施設の出入口における音声を集音する第１集音部に更に接続し、
対話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する第２の学習モデルを前記サーバからダウンロードして更に記憶し、
記憶した第２の学習モデルに前記第１集音部から取得した音声を入力して出力された有無情報を更に取得し、
更に取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知する
処理を実行させるコンピュータプログラム。
コンピュータに、
電話回線からの着信に応答して前記電話回線の状態を通話中に移行し、
Ｗｉ−Ｆｉ規格に準拠する無線ＬＡＮを介してデータを配信するサーバと通信し、
前記電話回線の使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続し、
通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを前記サーバからダウンロードして記憶し、
記憶した学習モデルに通話中に取得した音声を入力して出力された有無情報を取得し、
取得した有無情報に基づいて、接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知し、
前記電話回線が設けられた施設の出入口の周囲を撮像する第１撮像部に更に接続し、
画像が入力された場合に詐欺又は迷惑に係る画像の検出の有無情報を出力する第３の学習モデルを前記サーバからダウンロードして更に記憶し、
記憶した第３の学習モデルに前記第１撮像部から取得した画像を入力して出力された有無情報を更に取得し、
更に取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知する
処理を実行させるコンピュータプログラム。
前記コンピュータに、
登録したテレビジョン受信機に接続し、
接続したテレビジョン受信機に詐欺又は迷惑の旨を報知する
処理を実行させる請求項１６又は請求項１７に記載のコンピュータプログラム。
スマートフォンに搭載されたコンピュータに、
通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを記憶してあり、
記憶してある学習モデルに通話中に取得した音声を入力して出力された有無情報を取得し、
前記スマートフォンの使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続し、
取得した有無情報に基づいて、接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知し、
前記スマートフォンの使用者に係る施設の出入口における音声を集音する第１集音部に更に接続し、
対話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する第２の学習モデルを更に記憶してあり、
記憶した第２の学習モデルに前記第１集音部から取得した音声を入力して出力された有無情報を更に取得し、
更に取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知する
処理を実行させるコンピュータプログラム。
スマートフォンに搭載されたコンピュータに、
通話中の音声が入力された場合に詐欺又は迷惑に係る音声の検出の有無情報を出力する学習モデルを記憶してあり、
記憶してある学習モデルに通話中に取得した音声を入力して出力された有無情報を取得し、
前記スマートフォンの使用者にセキュリティサービスを提供する事業者の通信装置及び登録された第２携帯端末装置の少なくとも一方に接続し、
取得した有無情報に基づいて、接続した通信装置及び第２携帯端末装置の少なくとも一方に詐欺又は迷惑の旨を報知し、
前記スマートフォンの使用者に係る施設の出入口の周囲を撮像する第１撮像部に更に接続し、
画像が入力された場合に詐欺又は迷惑に係る画像の検出の有無情報を出力する第３の学習モデルを更に記憶してあり、
記憶した第３の学習モデルに前記第１撮像部から取得した画像を入力して出力された有無情報を更に取得し、
更に取得した有無情報に基づいて、詐欺又は迷惑の旨を更に報知する
処理を実行させるコンピュータプログラム。