JP7036272B1 - データ収集システム、データ収集方法及びデータ収集装置 - Google Patents

データ収集システム、データ収集方法及びデータ収集装置 Download PDF

Info

Publication number
JP7036272B1
JP7036272B1 JP2021164964A JP2021164964A JP7036272B1 JP 7036272 B1 JP7036272 B1 JP 7036272B1 JP 2021164964 A JP2021164964 A JP 2021164964A JP 2021164964 A JP2021164964 A JP 2021164964A JP 7036272 B1 JP7036272 B1 JP 7036272B1
Authority
JP
Japan
Prior art keywords
data
occurrence
target transmission
condition
transmission amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021164964A
Other languages
English (en)
Other versions
JP2023055518A (ja
Inventor
大樹 横山
晃人 伊藤
亮 中林
達也 今村
智洋 金子
宏樹 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2021164964A priority Critical patent/JP7036272B1/ja
Application granted granted Critical
Publication of JP7036272B1 publication Critical patent/JP7036272B1/ja
Priority to CN202211206531.7A priority patent/CN115952467A/zh
Priority to US17/959,840 priority patent/US20230109079A1/en
Publication of JP2023055518A publication Critical patent/JP2023055518A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Selective Calling Equipment (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

【課題】データ取得装置から効率的にデータを収集することができるようにする。【解決手段】データ収集システムは、複数のクラスへの分類を行う機械学習モデルの学習に必要なデータをデータ取得装置10からデータ収集装置20へ収集する。データ収集システムは、機械学習モデルによって分類されるクラスのうち発生確率の低い低発生クラスの発生確率を条件毎に特定する発生確率特定部231と、データ取得装置からデータ収集装置への単位時間当たりの目標送信量を条件毎に設定する目標送信量設定部と、現在の条件を特定する条件特定部と、特定された現在の条件に対応する目標送信量に従って、データ取得装置からデータ収集装置へデータを送信させる送信制御部と、を有する。目標送信量設定部は、低発生クラスの発生確率が相対的に高い条件では、データ取得装置からデータ収集装置への単位時間当たりのデータ送信量が多くなるように、目標送信量を設定する。【選択図】図8

Description

本開示は、データ収集システム、データ収集方法及びデータ収集装置に関する。
スマートシティにおいて、そのコミュニティ内の複数の主体からデータを収集することが提案されている。特に、特許文献1では、異なる事業主体の情報システムから得られるデータには不確かさがあることから、斯かる不確かさを解消すべく、得られたデータを補正したデータを収集することが提案されている。
特開2013-069084号公報
ところで、スマートシティなどでは、スマートシティ内に位置する様々なデータ取得装置(例えば、監視カメラ、スマートシティ内の人の携帯端末など)において様々なデータが取得される。加えて、これらデータ取得装置と通信可能なサーバは、取得されたデータに基づいて、機械学習モデルに関する様々な処理(機械学習モデルの使用又は学習)を行う。
このような機械学習モデルに関する様々な処理を行うために、サーバはデータ取得装置からデータを受信する必要がある。しかしながら、データ取得装置によって取得されたデータが全てサーバに送信されてサーバのストレージ装置に記憶されると、ストレージ装置には多量のデータが記憶されることになり、よって記憶容量の非常に大きなストレージ装置が必要になる。
上記課題に鑑みて、本開示の目的は、データ取得装置から効率的にデータを収集することにある。
本開示の要旨は以下のとおりである。
(1)複数のクラスへの分類を行う機械学習モデルの学習に必要なデータをデータ取得装置からデータ収集装置へ収集するデータ収集システムであって、
前記機械学習モデルによって分類される全てのクラスのうち他のクラスに比べて相対的に発生確率の低い低発生クラスの発生確率を、前記データ取得装置によってデータが取得されたときの条件毎に特定する発生確率特定部と、
前記データ取得装置から前記データ収集装置への単位時間当たりの目標送信量を前記条件毎に設定する目標送信量設定部と、
前記データ取得装置によってデータが取得される現在の条件を特定する条件特定部と、
前記特定された現在の条件に対応する目標送信量に従って、前記データ取得装置から前記データ収集装置へデータを送信させる送信制御部と、を有し、
前記目標送信量設定部は、前記低発生クラスの発生確率が相対的に高い条件では、前記低発生クラスの発生確率が相対的に低い条件に比べて、前記データ取得装置から前記データ収集装置への単位時間当たりのデータ送信量が多くなるように、前記目標送信量を設定する、データ収集システム。
(2)前記目標送信量設定部は、前記低発生クラスの発生確率が高くなるほど、前記データ取得装置から前記データ収集装置への単位時間当たりのデータ送信量が多くなるように、単位時間当たりの目標送信量を設定する、上記(1)に記載のデータ収集システム。
(3)当該データ収集システムは、入力パラメータが少なくとも部分的に異なる複数の機械学習モデルの学習に必要なデータを収集し、
前記目標送信量設定部は、前記機械学習モデルのうち人間の健康に関する機械学習モデルについては、人間の健康に関しない機械学習モデルに比べて、低発生クラスの発生確率が同一の条件に対して前記単位時間当たりの目標送信量が多くなるように、前記単位時間当たりの目標送信量を設定する、上記(1)又は(2)に記載のデータ収集システム。
(4)前記機械学習モデルによって分類される全てのクラスのうち、他のクラスに比べて、相対的に発生確率の低い低発生クラスを特定する、クラス特定部を更に備える、上記(1)~(3)のいずれか1つに記載のデータ収集システム。
(5)前記データ収集装置が前記発生確率特定部と目標送信量設定部とを有し、前記データ取得装置が前記条件特定部と前記送信制御部とを有する、上記(1)~(4)のいずれか1つに記載のデータ収集システム。
(6)複数のクラスへの分類を行う機械学習モデルの学習に必要なデータをデータ取得装置からデータ収集装置へ収集するデータ収集方法であって、
前記機械学習モデルによって分類される全てのクラスのうち他のクラスに比べて相対的に発生確率の低い低発生クラスの発生確率を、前記データ取得装置によってデータが取得されたときの条件毎に特定することと、
前記低発生クラスの発生確率が相対的に高い条件では、前記低発生クラスの発生確率が相対的に低い条件に比べて、前記データ取得装置から前記データ収集装置への単位時間当たりのデータ送信量が多くなるように、前記データ取得装置から前記データ収集装置への単位時間当たりの目標送信量を前記条件毎に設定することと、
前記データ取得装置によってデータが取得される現在の条件を特定することと、
前記特定された現在の条件に対応する目標送信量に従って、前記データ取得装置から当該データ収集装置へデータを送信させることと、を有する、データ収集方法。
(7)複数のクラスへの分類を行う機械学習モデルの学習に必要なデータをデータ取得装置から収集するデータ収集装置であって、
前記機械学習モデルによって分類される全てのクラスのうち他のクラスに比べて相対的に発生確率の低い低発生クラスの発生確率を、前記データ取得装置によってデータが取得されたときの条件毎に特定する発生確率特定部と、
前記データ取得装置から前記データ収集装置への単位時間当たりの目標送信量を前記条件毎に設定する目標送信量設定部と、を有し、
前記目標送信量設定部は、前記低発生クラスの発生確率が相対的に高い条件では、前記低発生クラスの発生確率が相対的に低い条件に比べて、前記データ取得装置からの単位時間当たりのデータ送信量が多くなるように、前記目標送信量を設定し、
前記目標送信量設定部は、前記目標送信量設定部によって設定された前記条件毎の単位時間当たりの目標送信量を前記データ取得装置へ送信する、データ収集装置。
本開示によれば、データ取得装置から効率的にデータを収集することができるようになる。
図1は、機械学習システムの概略的な構成図である。 図2は、端末機器のハードウェア構成を概略的に示す図である。図 図3は、端末機器のプロセッサの機能ブロック図である。 図4は、サーバのハードウェア構成を概略的に示す図である。 図5は、サーバのプロセッサの機能ブロック図である。 図6は、各条件におけるユーザが熱中症に罹患する確率を示す図である。 図7は、各条件毎の目標送信頻度の設定例である。 図8は、機械学習モデルの学習処理の流れを示すシーケンス図である。 図9は、一つの変形例に係るサーバのプロセッサの、図5と同様な機能ブロック図である。 図10は、各条件における異常者が発生する確率を示す図である。 図11は、各条件毎の目標送信頻度の設定例である。
以下、図面を参照して実施形態について詳細に説明する。なお、以下の説明では、同様な構成要素には同一の参照番号を付す。
・第一実施形態
<機械学習システムの構成>
図1及び図2を参照して、第一実施形態に係る機械学習システム1の構成について説明する。図1は、機械学習システム1の概略的な構成図である。機械学習システム1は、サーバにおいて用いられる機械学習モデルを学習させる。また、機械学習システム1は、機械学習モデルの使用及び学習に必要なデータを収集するデータ収集システムとしても機能する。
図1に示したように、機械学習システム1は、複数の端末機器10と、端末機器10と通信可能なサーバ20とを有する。複数の端末機器10のそれぞれとサーバ20とは、光通信回線などで構成される通信ネットワーク4と、通信ネットワーク4にゲートウェイ(図示せず)を介して接続される無線基地局5とを介して、相互に通信可能に構成される。端末機器10と無線基地局5との通信としては、通信距離が長い種々の広域無線通信を用いることができ、例えば、3GPP、IEEEによって策定された4G、LTE、5G、WiMAX等の任意の通信規格に準拠した通信が用いられる。
特に、本実施形態では、サーバ20は、所定の対象エリア内に位置する端末機器10と通信する。対象エリアは、予め定められた境界によって囲まれた範囲であり、例えば、「ICT等の新技術を活用しつつ、マネジメント(計画、整備、管理・運営等)の高度化により、都市や地域の抱える諸課題の解決を行い、また新たな価値を創出し続ける、持続可能な都市や地域」として定義されるスマートシティである。サーバ20は、対象エリア外に位置する端末機器10と通信可能であってもよい。
端末機器10は、後述する機械学習モデルの使用又は学習に必要なデータを取得するデータ取得装置の一例である。特に、本実施形態では、端末機器10は、それぞれ個人に保持されて、端末機器10を保持している人の情報を取得する機器である。したがって、本実施形態では、端末機器10は、所定の対象エリア内の人の情報を取得する移動型データ取得装置として機能する。したがって、本実施形態では、端末機器10は、端末機器10を保持する個人の移動に伴って移動する。このため端末機器10を保持する個人が対象エリア内に移動すると、その個人によって保持された端末機器10も対象エリア内に移動することなる。逆に、端末機器10を保持する個人が対象エリア外へ移動すると、その個人によって保持された端末機器10も対象エリア外に移動することなる。
具体的には、本実施形態では、端末機器10は、例えば、時計型端末(スマートウォッチ)、リストバンド型端末、クリップ型端末、及びメガネ型端末(スマートグラス)などのウェアラブル端末、及び携帯端末を含む。斯かる端末機器は、例えば、携帯端末、ウェアラブル端末(スマートウォッチ、スマートグラスなど)を含む。斯かる端末機器は、例えば、対象エリア内のそれぞれの人の位置情報、バイタルサイン(体温、心拍数、血圧、呼吸数)、血中酸素濃度、血糖値など、各人の情報を取得する。
また、本実施形態では、端末機器10は、特に、時計型端末、及び時計型端末と近距離無線通信によって通信する携帯端末を含む。近距離無線通信としては、例えば、IEEE、ISO、IEC等によって策定された任意の通信規格(例えば、Bluetooth(登録商標)、ZigBee(登録商標))に準拠した通信が用いられる。
なお、端末機器10は、対象エリア内に固定された、移動不能な固定型データ取得装置を含んでもよい。固定型データ取得装置には、例えば、監視カメラなど、対象エリア内の任意の領域の画像や、その他の情報を取得する機器が含まれる。
図2は、端末機器10のハードウェア構成を概略的に示す図である。図2に示したように、端末機器10は、通信モジュール11と、センサ12と、入力装置13、出力装置14と、メモリ15と、プロセッサ16と、を有する。通信モジュール11、センサ12、入力装置13、出力装置14及びメモリ15は信号線を介してプロセッサ16に接続されている。
通信モジュール11は、他の機器と通信を行う通信部の一例である。通信モジュール11は、例えば、サーバ20と通信を行うための機器である。特に、通信モジュール11は、上述した広域無線通信により無線基地局5と通信する機器であり、よって通信モジュール11は無線基地局5及び通信ネットワーク4を介してサーバ20と通信する。
センサ12は、端末機器10の状況及び端末機器10の周りの状況に関する様々なパラメータを検出する検出器の一例である。特に、センサ12は、異なるパラメータを検出する複数の個別のセンサを有する。センサ12によって検出された各種パラメータの値は、信号線を介してプロセッサ16又はメモリ15に送信される。
具体的には、センサ12は、端末機器10の現在位置を検出するGNSS受信機を含む。また、センサ12は、端末機器10を保持しているユーザに関するパラメータを検出するセンサを含む。例えば、端末機器10が時計型端末(スマートウォッチ)である場合には、センサ12は、端末機器10を装着しているユーザの身体の状態に関するデータ(例えば、バイタルサイン(心拍数、体温、血圧及び呼吸数)、血中酸素濃度、心電図、血糖値、歩数、カロリー消費量、疲労度、睡眠状態等)を検出するセンサを含んでもよい。また、センサ12は、端末機器10の周りの環境データを検出するセンサを含んでもよい。例えば、端末機器10は、端末機器10の周りの画像を撮影するセンサや、端末機器10の周りの気温や湿度を検出するセンサを含んでもよい。
入力装置13は、端末機器10のユーザが入力を行うための装置である。具体的には、入力装置13は、タッチパネル、マイク、ボタン、ダイヤルなどを含む。入力装置13を介して入力された情報は、信号線を介してプロセッサ16又はメモリ15に送信される。
出力装置14は、端末機器10が出力を行うための装置である。具体的には、出力装置14は、ディスプレイ、スピーカなどを含む。出力装置14は、信号線を介してプロセッサ16から送信された指令に基づいて、出力を行う。例えば、ディスプレイは、プロセッサ16からの指令に基づいて画面上に画像を表示させ、スピーカは、プロセッサ16からの指令に基づいて音を出力する。
メモリ15は、は、例えば、揮発性の半導体メモリ(例えば、RAM)、不揮発性の半導体メモリ(例えば、ROM)等を有する。メモリ15は、プロセッサ16において各種処理を実行するためのコンピュータプログラムや、プロセッサ16によって各種処理が実行されるときに使用される各種データ等を記憶する。メモリ15は、例えば機械学習モデルを、具体的には機械学習モデルの構成及び学習パラメータ(例えば、後述する重みやバイアスなど)を記憶する。
プロセッサ16は、一つ又は複数のCPU(Central Processing Unit)及びその周辺回路を有する。プロセッサ16は、論理演算ユニット又は数値演算ユニットのような演算回路を更に有していてもよい。プロセッサ16は、メモリ15に記憶されたコンピュータプログラムに基づいて、各種処理を実行する。端末機器10のプロセッサ16によって実行される具体的な処理については後述する。
図3は、端末機器10のプロセッサ16の機能ブロック図である。図3に示したように、端末機器10のプロセッサ16は、データ取得部161と、モデル実行部162と、通知部163と、条件特定部164と、送信制御部165と、データ送信部166と、モデル更新部167と、を有する。端末機器10のプロセッサ16が有するこれら機能ブロックは、例えば、プロセッサ16上で動作するコンピュータプログラムにより実現される機能モジュールである。或いは、プロセッサ16が有するこれら機能ブロックは、プロセッサ16に設けられる専用の演算回路であってもよい。なお、これら各機能ブロックの詳細については、後述する。
サーバ20は、通信ネットワーク4を介して、複数の端末機器10と接続される。本実施形態では、サーバ20は、端末機器10において用いられる機械学習モデルを学習させる学習装置として機能する。また、サーバ20は、複数の端末機器10から、機械学習モデルの学習に必要なデータを収集するデータ収集装置としても機能する。
図4は、サーバ20のハードウェア構成を概略的に示す図である。サーバ20は、図4に示したように、通信モジュール21と、ストレージ装置22と、プロセッサ23とを備える。また、サーバ20は、キーボード及びマウスといった入力装置、及び、ディスプレイ及びスピーカといった出力装置を有していてもよい。
通信モジュール21は、サーバ20外の機器と通信を行う通信装置の一例である。通信モジュール21は、サーバ20を通信ネットワーク4に接続するためのインターフェース回路を備える。通信モジュール21は、通信ネットワーク4及び無線基地局5を介して、複数の端末機器10それぞれと通信可能に構成される。
ストレージ装置22は、データを記憶する記憶装置の一例である。ストレージ装置22は、例えば、ハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)又は光記録媒体を有する。また、ストレージ装置22は、揮発性の半導体メモリ(例えば、RAM)、不揮発性の半導体メモリ(例えば、ROM)等を有していてもよい。ストレージ装置22は、プロセッサ23によって各種処理を実行するためのコンピュータプログラム、及びプロセッサ23によって各種処理が実行されるときに使用される各種データを記憶する。特に、ストレージ装置22は、端末機器10から受信したデータ、及び機械学習モデルの学習に使用されるデータを記憶する。
プロセッサ23は、一つ又は複数のCPU及びその周辺回路を有する。プロセッサ23は、更にGPU、又は論理演算ユニット若しくは数値演算ユニットのような演算回路を有していてもよい。プロセッサ23は、ストレージ装置22に記憶されたコンピュータプログラムに基づいて、各種処理を実行する。サーバ20のプロセッサ23によって実行される具体的な処理については後述する。
図5は、サーバ20のプロセッサ23の機能ブロック図である。図5に示したように、プロセッサ23は、発生確率特定部231と、目標送信量設定部232と、データセット作成部233、学習部234と、モデル送信部235と、を有する。サーバ20のプロセッサ23が有するこれら機能ブロックは、例えば、プロセッサ23上で動作するコンピュータプログラムにより実現される機能モジュールである。或いは、プロセッサ23が有するこれら機能ブロックは、プロセッサ23に設けられる専用の演算回路であってもよい。
<機械学習モデル>
本実施形態では、端末機器10において所定の処理を行うときに、機械学習された機械学習モデルが用いられる。本実施形態では、機械学習モデルは、端末機器10のセンサ12から取得されたデータに基づいて、複数のクラスへの分類を行うモデルである。以下では、端末機器10のセンサ12から取得されたデータに基づいて、端末機器10を保持している人が熱中症に罹患するか否かを推定する(すなわち、熱中症に罹患することを表すクラスと、熱中症に罹患しないことを表すクラスとを分類する)機械学習モデルを例にとって説明する。
具体的には、本実施形態では、機械学習モデルには、端末機器10を保持しているユーザのバイタルサイン、血中酸素濃度及び心電図等のユーザの身体の状態に関するデータ、並びに端末機器10の周りの気温及び湿度などの環境データが入力パラメータとして入力される。端末機器10を保持しているユーザの身体に関するデータ及び環境データは、端末機器10のセンサ12から取得される。或いは、環境データは、センサ12からではなく、サーバ20から通信モジュール11を介して取得されてもよい。そして、機械学習モデルは、斯かる入力パラメータにデータが入力されると、端末機器10を保持しているユーザが熱中症に罹患するか否かを出力する。
機械学習モデルでは、様々な機械学習アルゴリズムを用いることができる。本実施形態では、機械学習モデルは、例えば、ニューラルネットワーク(NN)、サポートベクトルマシン(SVM)、決定木(DT)といった、教師あり学習によって学習されるモデルである。特に、本実施形態では、機械学習モデルは、ユーザの身体の状態に関するデータ及び環境データを時系列で入力パラメータとして入力する、リカレントニューラルネットワーク(RNN)モデルであるのが好ましい。
なお、機械学習モデルとしては、様々な入力パラメータ及び出力パラメータを有するモデルを用いることができる。入力パラメータは、端末機器10のセンサ12によって検出することができる様々なパラメータを含む。具体的には、本実施形態では、入力パラメータは、例えば、バイタルサイン(心拍数、体温、血圧及び呼吸数)、血中酸素濃度、心電図、血糖値、歩数、カロリー消費量、疲労度、睡眠状態、時刻、画像、動画等を含む。また、入力パラメータは、通信ネットワーク4を介してサーバ20から送信されるパラメータ(例えば、端末機器10の周りの気温、湿度、天気、風速等)を含んでもよい。加えて、出力パラメータは、ユーザの身体に関する様々なパラメータを含む。具体的には、出力パラメータは、例えば端末機器10を保持している人が低体温症にかかる確率等を含む。
本実施形態では、上述したような機械学習モデルの機械学習は、端末機器10ではなく、サーバ20で行われる。機械学習モデルは、学習用データセットを用いて学習される。学習用データセットは、入力パラメータとして使用されるデータと、このデータに対応する出力パラメータの値(正解値又は正解ラベル)とを含む。特に、本実施形態では、学習用データセットは、或る対象者についての端末機器10において取得された時系列のデータと、その対象者が熱中症に罹患したか否かのデータとを含む。例えば、上述したような、熱中症に罹患するか否かが出力パラメータである場合には、熱中症に罹患した人について作成された学習用データセットでは出力パラメータのうち熱中症に罹患することを表すクラスの値が1とされる。一方、熱中症に罹患しなかった人について作成された学習用データセットでは出力パラメータのうち熱中症に罹患しないことを表すクラスの値が1とされる。また、学習用データセットは、センサ12の出力値に前処理(欠損処理、正規化、標準化など)を行うことで生成されてもよい。
機械学習モデルの学習にあたっては、例えば、公知の任意の手法(例えば、誤差逆伝搬法)によって、機械学習モデルにおける学習パラメータ(NNの重みw及びバイアスbなど、学習によって値が更新されるパラメータ)が繰り返し更新される。学習パラメータは、例えば、機械学習モデルの出力値と学習用データセットに含まれる出力パラメータの正解値との差が小さくなるように、繰り返し更新される。この結果、機械学習モデルが学習され、学習済みの機械学習モデルが生成される。
<機械学習モデルの使用>
次に、図3を参照して、端末機器10における機械学習モデルを使用した処理について説明する。本実施形態では、端末機器10は、端末機器10のセンサ12によって検出された各種パラメータの値に基づいて、端末機器10を保持するユーザが熱中症に罹患するか否かを推定する。加えて、端末機器10は、熱中症に罹患すると判定されたときには熱中症になる危険性がある旨をユーザに通知する。端末機器10のプロセッサ16は、熱中症に罹患するか否かを推定するにあたって、データ取得部161と、モデル実行部162と、通知部163と、を用いる。
データ取得部161は、機械学習モデルの入力パラメータに関するデータを含むデータを取得する。具体的には、データ取得部161は、端末機器10のセンサ12によって検出された入力パラメータの値を取得する。本実施形態では、データ取得部161は、センサ12から、ユーザの体温、心拍数、血圧及び呼吸数等を取得する。また、データ取得部161は、通信モジュール11を介してサーバ20等の外部の装置から入力パラメータの値を取得してもよい。本実施形態では、サーバ20は、各端末機器10のセンサ12によって検出された現在位置を各端末機器10から受信すると、その位置の周りの現在の温度及び現在の湿度をその端末機器10に送信する。したがって、データ取得部161は、サーバ20から端末機器10の周りの気温及び湿度を取得する。データ取得部161は、取得したデータを、メモリ15に記憶させる。
データ取得部161によって機械学習モデルの入力パラメータの現在の値が取得されると、モデル実行部162は、取得した入力パラメータの値を機械学習モデルに入力して、出力パラメータの値を算出する。本実施形態では、モデル実行部162では、データ取得部161によって取得されたユーザの身体に関するデータ及び環境データが機械学習モデルに入力されると、ユーザが熱中症に罹患するか否かが出力される。
ここで、機械学習モデルを実行するためのプログラム及び機械学習モデルにおいて用いられる学習パラメータの値はメモリ15に記憶されている。したがって、モデル実行部162は、メモリ15に記憶されているプログラム及び学習パラメータの値を用いて、出力パラメータの値を算出する。
通知部163は、モデル実行部162によって算出された出力パラメータの値に基づいて、ユーザへの通知を行う。通知部163は、出力装置14を介してユーザへの通知を行う。具体的には、本実施形態では、通知部163は、モデル実行部162によってユーザが熱中症に罹患すると判定された場合には、出力装置14によってユーザへの通知を行う。この場合、通知部163は、例えば、ディスプレイ上に熱中症に関する警告を表示させてもよいし、スピーカから熱中症に関する警告音を発生させてもよい。
<機械学習モデルの学習>
次に、図3、図5~図8を参照して、各端末機器10のモデル実行部162において用いられる機械学習モデルの学習処理について説明する。本実施形態では、機械学習モデルの学習は、サーバ20において行われる。具体的には、端末機器10は、端末機器10において取得された学習用のデータをサーバ20へ送信する。サーバ20は、受信した学習用のデータを用いてサーバ20が機械学習モデルの学習を行うと共に学習済みの機械学習モデルを端末機器10へ送信する。そして、端末機器10は機械学習モデルを送信された学習済みのモデルに更新する。
ところで、機械学習モデルを学習させるにあたって、サーバ20には、端末機器10によって取得されたデータが送信される。しかしながら、端末機器10によって取得されたデータ全てがサーバ20に送信されてサーバ20のストレージ装置22に記憶されると、ストレージ装置22には多量のデータが記憶されることになる。したがって、記憶容量の非常に大きなストレージ装置22が必要になる。
一方、機械学習モデルによって分類されるクラスのうち、一部のクラスのみの発生確率が極端に低い場合がある。例えば、各端末機器10を保持するユーザが熱中症に罹患する確率は低い。このため、端末機器10から取得されたデータに基づいてユーザが熱中症に罹患するか否かを推定する機械学習モデルでは、熱中症に罹患することを表すクラスの発生確率は非常に低い。以下では、機械学習モデルによって分類される全てのクラスのうち他のクラスに比べて相対的に発生確率の低いクラスを、低発生クラスとも称する。
このような場合に、機械学習モデルを学習されるにあたって端末機器10にて取得された全てのデータを用いると、発生確率の高いクラスのデータが過剰になる。発生確率の高いクラスのデータが過剰になると、発生確率の低い低発生クラスのデータが相対的に極端に少なくなり、よって必ずしも推定精度の高い機械学習モデルを作成することはできない。このため、発生確率の高いクラスのデータ、すなわちユーザが熱中症に罹患しなかった場合のデータについては、必ずしも全てを使用しなくてもよい。
図6は、各条件におけるユーザが熱中症に罹患する確率を示す図である。特に、図6は、気温及び湿度によって定められる条件毎に、ユーザが熱中症に罹患する確率を示している。図6に示したように、気温が高いほど及び湿度が高いほどユーザが熱中症に罹患する確率が高くなる。一方で、気温が低い場合や湿度が低い場合にはユーザが熱中症に罹患する確率は低い。ただし、全般的に、ユーザが熱中症に罹患する確率は低い。したがって、ユーザが熱中症に罹患することを表すクラスは、相対的に発生確率の低い低発生クラスであるということができる。一方、ユーザが熱中症に罹患しないことを表すクラスは、相対的に発生確率の高いクラスであるということができる。
そこで、本実施形態では、サーバ20において、低発生クラスの発生確率に基づいて、端末機器10が取得したデータをサーバ20へ送信する送信頻度が設定される。低発生クラスが発生する確率が相対的に高い条件では、端末機器10が取得したデータをサーバ20へ送信する送信頻度が高くされる。したがって、ユーザが熱中症に罹患する確率が高い条件、例えば図6の例では気温及び湿度の高い条件では、端末機器10が取得したデータをサーバ20へ送信する送信頻度が高くされる。一方、低発生クラスが発生する確率が相対的に低い条件では、端末機器10が取得したデータをサーバ20へ送信する送信頻度が低くされる。したがって、ユーザが熱中症に罹患する確率が低い条件、例えば図6の例では気温及び湿度の低い条件では、端末機器10が取得したデータをサーバ20へ送信する送信頻度が低くされる。
図7は、各条件における低発生クラスの発生確率が図6に示した確率である場合における、各条件毎の目標送信頻度の設定例である。図7に示した例では、低発生クラスの発生確率に基づいて、端末機器10が取得したデータが三つの異なる送信頻度でサーバ20へ送信される。特に、図7に示した例では、ユーザが熱中症に罹患する確率が0.1%未満である条件においては、目標送信頻度はF1に設定される。また、ユーザが熱中症に罹患する確率が0.1%以上であって0.3%未満である条件においては、目標送信頻度はF1よりも高いF2に設定される。さらに、ユーザが熱中症に罹患する確率が。0.3%以上である条件においては、目標送信頻度はF2よりも高いF3に設定される。
このように、本実施形態では、低発生クラスの発生確率が相対的に高い条件では、低発生クラスの発生確率が相対的に低い条件に比べて、端末機器10からサーバ20への目標送信頻度が多くされる。すなわち、斯かる条件では、端末機器10からサーバ20への単位時間当たりのデータ送信量が多くされる。この結果、発生確率の低い低発生クラスのデータ送信の減少を抑えつつ、発生確率の高いクラスのデータ送信を減少させることができる。この結果、機械学習モデルの推定精度の低下を抑えつつ、ストレージ装置22に記憶されるデータ量を抑制することができ、よって端末機器10から効率的にデータを収集することができる。
次に、図3、図5及び図8を参照して、機械学習モデルの学習処理について具体的に説明する。
端末機器10のプロセッサ16は、機械学習モデルの学習を行うにあたって、データ取得部161と、条件特定部164と、送信制御部165と、データ送信部166と、モデル更新部167と、を用いる(図3参照)。また、サーバ20のプロセッサ23は、機械学習モデルの学習を行うにあたって、発生確率特定部231と、目標送信量設定部232と、データセット作成部233と、学習部234と、モデル送信部235とを用いる(図5参照)。
端末機器10の条件特定部164は、端末機器10のデータ取得部161によってデータが取得される現在の条件を特定する。上述したように、本実施形態では、条件毎に端末機器10からサーバ20への目標送信頻度が設定されるが、条件特定部164は現在の条件がこのうちのどの条件に該当するかを特定する。特に、本実施形態では、気温及び湿度によって定まる条件が、図7に示した複数の条件のうちどの条件に該当するのかが特定される。したがって、本実施形態では、データ取得部161によって取得された現在の気温及び湿度に基づいて、現在の条件を特定する。
端末機器10の送信制御部165は、端末機器10からサーバ20へのデータの送信を制御する。送信制御部165は、例えば、端末機器10からのデータの送信頻度を制御する。換言すると、送信制御部165、端末機器10が取得したデータのうちサーバ20へ送信するデータの割合を制御する。したがって、データの送信頻度が高く制御されているときには、例えば、端末機器10によって取得された全てのデータ(機械学習モデルに利用される全てのデータ)がサーバ20へ送信される。一方、データの送信頻度が低く制御されているときには、端末機器10によって取得されたデータのうち一部のデータ(機械学習モデルに利用されるデータのうち一部のデータ)がサーバ20へ送信される。
特に、本実施形態では、後述するように、目標送信量設定部232において、条件毎に目標送信頻度が設定されている。したがって、送信制御部165は、条件特定部164によって特定された現在の条件と、目標送信量設定部232において設定された各条件と目標送信頻度との関係とに基づいて、現在の条件に対応する目標送信頻度を設定する。そして、送信制御部165は、このようにして算出された目標送信頻度に従って、端末機器10からサーバ20へデータを送信させる。
端末機器10のデータ送信部166は、データ取得部161によって端末機器10のセンサ12から取得されたデータを、通信ネットワーク4を介してサーバ20に送信する。サーバ20に送信されるデータは、機械学習モデルを学習させるのに用いられるため、機械学習モデルの入力パラメータの値を含む。また、端末機器10のセンサ12によって出力パラメータの値が検出されている場合(例えば、機械学習モデルが入力パラメータの値から出力パラメータの将来の値を推定するようなモデルである場合)には、サーバ20に送信されるデータは、出力パラメータの値を含んでもよい。
特に、本実施形態では、データ送信部166は、送信制御部165からの指令に従って、サーバ20へデータを送信する。したがって、データ送信部166は、送信制御部165によって設定された目標送信頻度に従って、サーバ20へデータを送信する。
端末機器10のモデル更新部167は、上述したように、メモリ15に記憶されていたモデル実行部162によって使用される機械学習モデルを、モデル送信部235によって送信された機械学習モデルに更新する。
サーバ20の発生確率特定部231は、低発生クラスの発生確率を、端末機器10によってデータが取得される様々な条件毎(本実施形態では、気温及び湿度によって定まる条件毎)に特定する。各条件毎の低発生クラスの発生確率は、低発生クラスの発生情報に基づいて特定される。本実施形態では、各条件においてユーザが熱中症に罹患する確率は、各条件下で対象エリア内にいたユーザの数と、斯かるユーザのなかから熱中症に罹患したユーザの罹患情報とに基づいて特定される。
各条件下で対象エリアにいたユーザの数は、それぞれの条件において対象エリア内に位置する端末機器10の数に基づいて特定される。対象エリア内に位置する端末機器10の数は、例えば、サーバ20と通信した端末機器10のうち端末機器10が対象エリア内に位置することを示す位置情報を送信した端末機器10の数を数えることによって特定される。
各ユーザの熱中症罹患情報は、例えば、各端末機器10から送信される。具体的には、ユーザが熱中症に罹患した場合に、その情報がユーザ自身により入力装置13を介して端末機器10に入力される。端末機器10に入力された熱中症罹患情報は、そのときの気温及び湿度(罹患時の条件を表すパラメータ)と共に、通信ネットワーク4を介してサーバ20へ送信される。
或いは、ユーザの熱中症罹患情報は、例えば、医療機関等に配置された端末機器(図示せず)から送信される。具体的には、ユーザが熱中症に罹患した場合に、そのユーザを診療した医療機関により、その端末機器へ、ユーザが熱中症に罹患した情報が入力される。医療機関の端末機器において入力された熱中症罹患情報は、通信ネットワーク4を介してサーバ20へ送信される。また、サーバ20では、そのユーザが保持する端末機器10から過去に送信されたデータに基づいて、ユーザが熱中症に罹患したときの気温及び湿度(罹患時の条件を表すパラメータ)を取得する。
サーバ20の目標送信量設定部232は、端末機器10においてデータが取得される条件毎に(すなわち、気温及び湿度によって定まる条件毎に)、端末機器10からサーバ20への目標送信頻度を設定する。本実施形態では、目標送信量設定部232は、各条件における低発生クラスの発生確率が高くなるほどその条件における目標送信頻度が高くなるように、目標送信頻度を設定する。特に、本実施形態では、目標送信量設定部232は、図7に示したように、各条件においてユーザが熱中症に罹患する確率に応じて、F1、F2、F3の3段階で目標送信頻度を設定する。そして、本実施形態では、サーバ20は、設定した各条件毎の目標送信頻度を、端末機器10へ送信する。
なお、目標送信量設定部232は、各条件においてユーザが熱中症に罹患する確率に応じて、2段階で目標送信頻度を設定してもよい。この場合、例えば、熱中症に罹患する確率が0.1%未満の条件では相対的に目標送信頻度が遅く設定され、熱中症に罹患する確率が0.1%以上の条件では相対的に目標送信頻度が速く設定される。或いは、目標送信量設定部232は、各条件においてユーザが熱中症に罹患する確率に応じて、4段階以上の多段階で又は連続的に目標送信頻度を設定してもよい。いずれにせよ、本実施形態では、目標送信量設定部232は、低発生クラスの発生確率が相対的に高い条件では、低発生クラスの発生確率が相対的に低い条件に比べて、端末機器10からサーバ20への単位時間当たりのデータの目標送信頻度が高くなるように、目標送信頻度を条件毎に設定する。
サーバ20のデータセット作成部233は、機械学習モデルを学習させるのに用いられる学習用データセットを作成する。学習用データセットは、機械学習モデルの入力パラメータの実測値と、出力パラメータの正解値又は正解ラベルとを含む。例えば、本実施形態では、学習用データセットは、或るユーザの端末機器10によって取得された時系列のデータと、そのユーザの熱中症の罹患情報(正解ラベル)とを含む。
各ユーザの端末機器10によって取得された時系列のデータは、データ送信部166によって各端末機器10からサーバ20へ送信される。データセット作成部233は、学習用データセットを作成するにあたって、このようにして各端末機器10から送信されてきたデータを用いる。また、データセット作成部233は、学習用データセットを作成するにあたって、上述したように端末機器10又は医療機関の端末機器から送信された熱中症罹患情報を用いる。
サーバ20の学習部234は、学習用データセットを用いて、上述したような誤差逆伝播法などの手法により機械学習モデルを学習させる。具体的には、学習部234は、学習用データセットを用いて、機械学習モデルの学習パラメータの値を更新する。
サーバ20のモデル送信部235は、学習部234によって機械学習された学習済みの機械学習モデルを、通信ネットワーク4を介して、各端末機器10へ送信する。具体的には、学習部234による学習によって更新された学習パラメータの値を、各端末機器10へ送信する。
図8は、機械学習モデルの学習処理の流れを示すシーケンス図である。図8に示した学習処理は、端末機器10のプロセッサ16及びサーバ20のプロセッサ23において実行される。
本実施形態における学習処理では、図8に示したように、まず、サーバ20の発生確率特定部231が、低発生クラス(熱中症に罹患することを表すクラス)の発生確率を、各条件毎に(特に、温度及び湿度によって定まる条件毎に)特定する(ステップS11)。上述したように、発生確率特定部231は、過去に端末機器10から送信されたデータと、過去の熱中症罹患情報とに基づいて、発生確率を特定する。過去に端末機器10から送信されたデータ及び過去の熱中症罹患情報は、サーバ20のストレージ装置22に記憶されている。したがって、発生確率特定部231は、ストレージ装置22に記憶されたこれらデータ及び情報に基づいて、条件毎の発生確率を特定する。なお、本実施形態では、ステップS11の各条件毎の発生確率の特定は、一定の時間間隔毎に、又は一定量のデータがストレージ装置22に記憶される毎に行われる。
次いで、サーバ20の目標送信量設定部232は、ステップS11において特定された各条件毎の発生確率に基づいて、各条件毎に、目標送信頻度を設定する(ステップS12)。上述したように、本実施形態では、目標送信量設定部232は、低発生クラスの発生確率が高い条件ほど、その条件における目標送信頻度が高くなるように、目標送信頻度を設定する。なお、本実施形態では、ステップS12の目標送信頻度の設定は、ステップS11において条件毎の発生確率が特定される毎に行われる。
ステップS12において各条件毎の目標送信頻度が設定されると、目標送信量設定部232は、各条件毎の目標送信頻度を端末機器10へ送信する(ステップS13)。具体的には、目標送信量設定部232は、各条件と目標送信頻度との関係(例えば、図7に示したような関係)に関する情報を、端末機器10に送信する。特に、本実施形態では、目標送信量設定部232は、対象エリア内に位置する端末機器10に送信する。したがって、目標送信量設定部232は、ステップS12において目標送信頻度が設定されたときに、対象エリアに位置する端末機器10へ、各条件と目標送信頻度との関係に関する情報を送信する。加えて、目標送信量設定部232は、ステップS12において目標送信頻度が設定された後に対象エリア内に侵入した端末機器10へも、各条件と目標送信頻度との関係に関する情報を送信する。
一方、各端末機器10のデータ取得部161は、センサ12又はサーバ20から定期的に各種データを取得する(ステップS14)。本実施形態では、データ取得部161は、機械学習モデルの入力パラメータに関するデータ、及び現在の条件と特定するのに必要なデータ(本実施形態では、気温及び湿度)を取得する。
データ取得部161によってデータが取得されると、条件特定部164は、端末機器10のデータ取得部161によってデータが取得される現在の条件を特定する(ステップS15)。本実施形態では、データ取得部161は、ステップS14において取得されたデータに基づいて、現在の条件が図7に示した条件のうちどの条件に該当するかを特定する。
ステップS15において現在の条件が特定されると、送信制御部165は、目標送信頻度を算出する(ステップS16)。送信制御部165は、ステップS13において送信された各条件と目標送信頻度との関係に関する情報と、ステップS15において特定された現在の条件とに基づいて、端末機器10についての目標送信頻度を設定する。
このようにして目標送信頻度が設定されると、設定された目標送信頻度にて、データ送信部166がサーバ20へデータを送信する(ステップS17)。データ送信部166は、特に、データ取得部161によって取得されたデータのうち機械学習モデルに使用されるデータを送信する。サーバ20に送信されたデータは、サーバ20のストレージ装置22に記憶される。
データ送信部166によって送信されたデータがストレージ装置22に記憶されると、サーバ20のデータセット作成部233が学習用データセットを作成する(ステップS18)。データセット作成部233は、ストレージ装置22に記憶されたデータを入力パラメータとして用いて学習用データセットを作成する。また、データセット作成部233は、ユーザ自身によって端末機器10に入力された熱中症罹患情報又は医療機関の端末機器において入力された熱中症罹患情報を出力パラメータの正解値として用いて、学習用データセットを作成する。
ステップS18においてデータセット作成部233によって学習に必要な数の学習用データセットが作成されると、学習部234は、作成されたデータセットを用いて、機械学習モデルを学習させる(ステップS19)。機械学習モデルの学習は、上述したように誤差逆伝播法等、公知の手法によって行われる。
学習部234による機械学習モデルの学習が完了すると、モデル送信部235は、学習済みの機械学習モデルを、端末機器10へ送信する(ステップS20)。そして、端末機器10のモデル更新部167は、学習済みの機械学習モデルを受信すると、モデル実行部162によって使用される機械学習モデルを、サーバ20から送信されてきた機械学習モデルに更新する(ステップS21)。
<効果及び変形例>
本実施形態によれば、低発生クラスの発生確率が高い条件が成立している場合に、端末機器10から高い頻度でデータがサーバ20へ送信される。一方、低発生クラスの発生確率が高い条件が成立していない場合には、端末機器10から低い頻度でデータがサーバ20へ送信される。したがって、高い精度で学習するのに必要なデータについては高い頻度でサーバ20へ送信される。一方、高い精度で学習するのにそれほど必要でないデータについては低い頻度でサーバ20へ送信される。この結果、端末機器10からサーバ20への過剰なデータの送信を抑制しつつ、推定精度の高い機械学習モデルを作成することができるようになる。したがって、本実施形態によれば、端末機器10から効率的にデータを収集することができるようになる。
なお、上記実施形態では、送信制御部165は、低発生クラスの発生確率が相対的に高い条件では、低発生クラスの発生確率が相対的に低い条件に比べて、端末機器10からサーバ20への単位時間当たりのデータの目標送信頻度を高くしている。しかしながら、低発生クラスの発生確率が相対的に高い条件では、低発生クラスの発生確率が相対的に低い条件に比べて、端末機器10からサーバ20へ送信するデータを間引く量を減らして、端末機器10からサーバ20への単位時間当たりのデータ送信量を多くすることができれば、サーバ20へのデータの送信をどのように制御してもよい。例えば、送信制御部165は、データの送信頻度の代わりに、データの送信速度を制御してもよい。したがって、目標送信量設定部232は、低発生クラスの発生確率が相対的に高い条件では、低発生クラスの発生確率が相対的に低い条件に比べて、端末機器10からサーバ20への単位時間当たりのデータの目標送信量が多くなるように、単位時間当たりの目標送信量を条件毎に設定している。
また、上記実施形態では、熱中症に罹患するか否かを推定する機械学習モデルが用いられている。しかしながら、端末機器10のようなデータ取得装置によって取得されたデータに基づいて任意の出力パラメータの値を推定するモデルであれば、機械学習モデルとして如何なるモデルが用いられてもよい。したがって、機械学習モデルとして、例えば、監視カメラによって取得された画像データに基づいて、画像データ内の異常者(不審者や急病にかかった虞のある者、など)の発生の有無及びその位置を推定するモデル等が用いられてもよい。
加えて、上記実施形態では、機械学習モデルは端末機器10において使用される。しかしながら、機械学習モデルはサーバ20において使用されてもよい。この場合には、データ取得部161、モデル実行部162等が、サーバ20に設けられる。サーバ20のデータ取得部161は、端末機器10のセンサ12によって検出されたデータを通信ネットワーク4を介して端末機器10から取得する。そして、サーバ20のモデル実行部は、端末機器10から受信したデータを入力パラメータとして機械学習モデルに入力して、出力パラメータの値を算出し、算出した出力パラメータの値を端末機器10に送信する。また、この場合、送信制御部165は、機械学習モデルの学習に用いられるデータのみならず、機械学習モデルの実行に使用されるデータについても、端末機器10からの送信を制御してもよい。
また、上記実施形態では、機械学習モデルによって分類される全てのクラスのうち他のクラスに比べて相対的に発生確率の低い低発生クラスが予め特定されている。しかしながら、低発生クラスは、端末機器10から過去に送信されたデータ等に基づいて、サーバ20によって特定されてもよい。
図9は、第一実施形態の一つの変形例に係るサーバ20のプロセッサ23の、図5と同様な機能ブロック図である。図9に示したように、本変形例のプロセッサ23は、図5の機能ブロックに加えて、機械学習モデルによって分類される全てのクラスのうち、他のクラスに比べて、相対的に発生確率の低い低発生クラスを特定するクラス特定部236を更に備える。
クラス特定部236は、端末機器10によって送信された過去のデータに基づいて、機械学習モデルによって分類される全てのクラスの一定期間における発生確率を算出する。本変形では、具体的には、例えば、一定期間中にデータを受信した端末機器10の数と、そのうち熱中症罹患情報に紐づけられた端末機器10(ユーザ)の数とに基づいて、低発生クラスを特定する。そして、発生確率特定部231は、このようにして特定された低発生クラスの発生確率を条件毎に特定する。
また、上記実施形態では、条件特定部164及び送信制御部165が端末機器10に設けられている。したがって、現在の条件の特定及び目標送信頻度の設定は、端末機器10において行われている。しかしながら、条件特定部164及び送信制御部165はサーバ20に設けられてもよい。
この場合、端末機器10の現在の条件を特定するのに必要なデータは定期的に端末機器10からサーバ20へ送信される。サーバ20の条件特定部164は、このようにして端末機器10から送信されたデータに基づいて、その端末機器10の現在の条件を特定する。或いは、サーバ20の条件特定部164は、上述した図8のステップS17において過去に端末機器10から送信されたデータに基づいて、その端末機器10の現在の条件を特定してもよい。そして、サーバ20の送信制御部165は、条件特定部164によって特定された現在の条件に基づいて、その端末機器10における目標送信頻度を設定する。その後、送信制御部165は、このようにして設定した目標送信頻度を端末機器10へ送信する。端末機器10のデータ送信部166は、このようにして送信された目標送信頻度に従って、サーバ20へデータを送信する。
・第二実施形態
次に、図10~図11を参照して、第二実施形態に係る機械学習システム1について説明する。以下では、第一実施形態に係る機械学習システムと異なる点を中心に説明する。本実施形態では、サーバ20は、入力パラメータが少なくとも部分的に異なる複数の機械学習モデルの学習を行う。したがって、サーバは、斯かる複数の機械学習モデルの学習に必要なデータを収集する。サーバ20は、以下では、サーバ20が、熱中症に罹患するか否かを出力する第1機械学習モデルと、異常者が発生するか否かを出力する第2機械学習モデルとの学習を行う場合を例にとって説明する。
ところで、サーバ20が複数の機械学習モデルの学習を行う場合、サーバ20には全ての機械学習モデルの学習に必要なデータが送信される。したがって、サーバ20には多量のデータが送信され、サーバ20のストレージ装置22には多量のデータが記憶されることになる。したがって、記憶容量の非常に大きなストレージ装置22が必要になる。
一方で、機械学習モデルの学習により、基本的に、機械学習モデルによる推定精度が高くなる。したがって、機械学習モデルによる推定精度を高めるという観点からは、その機械学習モデルに関する多くのデータを収集することが好ましい。
ここで、機械学習モデルの必要性は、機械学習モデル毎に異なる。一般的に、人間の健康に関する機械学習モデルは、その他の機械学習モデルに比べてその必要性が高い。本実施形態では、熱中症に罹患するか否かを出力する第1機械学習モデルの必要性は、異常者の有無等を出力する第2機械学習モデルの必要性よりも高い。そこで、本実施形態では、人間の健康に関する第1機械学習モデルについては、人間の健康に関しない第2機械学習モデルに比べて、低発生クラスの発生確率が同一の条件において、端末機器10からの単位時間当たりのデータ送信量が多くなるようにしている。
図10は、各条件における異常者が発生する確率を示す図である。特に、図10は、時間帯及び場所(領域)によって定められる条件毎に、異常者が発生する確率を示している。図10から分かるように、如何なる条件においても、異常者が発生する確率は低い。したがって、異常者が発生することを表すクラスは、相対的に発生確率の低い低発生クラスであるということができる。一方、異常者が発生しないことを表すクラスは、相対的に発生確率の高いクラスであるということができる。
したがって、本実施形態においても、図7に示した例と同様に、各条件における低発生クラスの発生確率に応じて、条件毎の目標送信頻度が設定される。図11は、各条件における低発生クラスの発生確率が図6に示した確率である場合における、各条件毎の目標送信頻度の設定例である。図11に示したように、目標送信頻度を設定する目標送信量設定部232は、異常者が発生する確率が0.1%未満である条件においては、目標送信頻度をF1に設定する。また、目標送信量設定部232は、異常者が発生する確率が0.1%以上であって0.3%未満である条件においては、目標送信頻度をF1よりも高いF2’に設定する。さらに、目標送信量設定部232は、異常者が発生する確率が。0.3%以上である条件においては、目標送信頻度をF2’よりも高いF3’に設定する。
特に、本実施形態では、異常者の有無等を出力する第2機械学習モデルに関しては、人間の健康に関する第1機械学習モデルよりも、目標送信頻度が低く設定される。したがって、本実施形態では、第2機械学習モデルに関する目標送信頻度F1’は、第1機械学習モデルに関する対応の目標送信頻度F1よりも低く設定される。第2機械学習モデルに関する目標送信頻度F2’は、第1機械学習モデルに関する対応の目標送信頻度F2よりも低く設定される。同様に、本実施形態では、第2機械学習モデルに関する目標送信頻度F3’は、第1機械学習モデルに関する対応の目標送信頻度F3よりも低く設定される。
以上より、本実施形態では、目標送信量設定部232は、機械学習モデルのうち人間の健康に関する機械学習モデルについては、人間の健康に関しない機械学習モデルに比べて、低発生クラスの発生確率が同一の条件に対して単位時間当たりの目標送信量が多くなるように、単位時間当たりの目標送信量を設定する。これにより、人間の健康に関する機械学習モデルを早期に学習させ、早期に推定精度を高めることができるようになる。
なお、本実施形態では、第1機械学習モデルと第2機械学習モデルとの2つの機械学習モデルの学習がサーバ20で行われる。しかしながら、3つ以上の多数の機械学習モデルの学習がサーバ20で行われる場合についても、本実施形態のように、人間の健康に関係するか否かに基づいて目標送信量を変更することが可能である。
以上、本発明に係る好適な実施形態を説明したが、本発明はこれら実施形態に限定されるものではなく、特許請求の範囲の記載内で様々な修正及び変更を施すことができる。
1 機械学習システム
4 通信ネットワーク
5 無線基地局
10 端末機器
20 サーバ

Claims (7)

  1. 複数のクラスへの分類を行う機械学習モデルの学習に必要なデータをデータ取得装置からデータ収集装置へ収集するデータ収集システムであって、
    前記機械学習モデルによって分類される全てのクラスのうち他のクラスに比べて相対的に発生確率の低い低発生クラスの発生確率を、前記データ取得装置によってデータが取得されたときの条件毎に特定する発生確率特定部と、
    前記データ取得装置から前記データ収集装置への単位時間当たりの目標送信量を前記条件毎に設定する目標送信量設定部と、
    前記データ取得装置によってデータが取得される現在の条件を特定する条件特定部と、
    前記特定された現在の条件に対応する目標送信量に従って、前記データ取得装置から前記データ収集装置へデータを送信させる送信制御部と、を有し、
    前記目標送信量設定部は、前記低発生クラスの発生確率が相対的に高い条件では、前記低発生クラスの発生確率が相対的に低い条件に比べて、前記データ取得装置から前記データ収集装置への単位時間当たりのデータ送信量が多くなるように、前記目標送信量を設定する、データ収集システム。
  2. 前記目標送信量設定部は、前記低発生クラスの発生確率が高くなるほど、前記データ取得装置から前記データ収集装置への単位時間当たりのデータ送信量が多くなるように、単位時間当たりの目標送信量を設定する、請求項1に記載のデータ収集システム。
  3. 当該データ収集システムは、入力パラメータが少なくとも部分的に異なる複数の機械学習モデルの学習に必要なデータを収集し、
    前記目標送信量設定部は、前記機械学習モデルのうち人間の健康に関する機械学習モデルについては、人間の健康に関しない機械学習モデルに比べて、低発生クラスの発生確率が同一の条件に対して前記単位時間当たりの目標送信量が多くなるように、前記単位時間当たりの目標送信量を設定する、請求項1又は2に記載のデータ収集システム。
  4. 前記機械学習モデルによって分類される全てのクラスのうち、他のクラスに比べて、相対的に発生確率の低い低発生クラスを特定する、クラス特定部を更に備える、請求項1~3のいずれか1項に記載のデータ収集システム。
  5. 前記データ収集装置が前記発生確率特定部と目標送信量設定部とを有し、前記データ取得装置が前記条件特定部と前記送信制御部とを有する、請求項1~4のいずれか1項に記載のデータ収集システム。
  6. 複数のクラスへの分類を行う機械学習モデルの学習に必要なデータをデータ取得装置からデータ収集装置へ収集するデータ収集方法であって、
    発生確率特定部が、前記機械学習モデルによって分類される全てのクラスのうち他のクラスに比べて相対的に発生確率の低い低発生クラスの発生確率を、前記データ取得装置によってデータが取得されたときの条件毎に特定することと、
    目標送信量設定部が、前記低発生クラスの発生確率が相対的に高い条件では、前記低発生クラスの発生確率が相対的に低い条件に比べて、前記データ取得装置から前記データ収集装置への単位時間当たりのデータ送信量が多くなるように、前記データ取得装置から前記データ収集装置への単位時間当たりの目標送信量を前記条件毎に設定することと、
    条件特定部が、前記データ取得装置によってデータが取得される現在の条件を特定することと、
    送信制御部が、前記特定された現在の条件に対応する目標送信量に従って、前記データ取得装置から当該データ収集装置へデータを送信させることと、を有する、データ収集方法。
  7. 複数のクラスへの分類を行う機械学習モデルの学習に必要なデータをデータ取得装置から収集するデータ収集装置であって、
    前記機械学習モデルによって分類される全てのクラスのうち他のクラスに比べて相対的に発生確率の低い低発生クラスの発生確率を、前記データ取得装置によってデータが取得されたときの条件毎に特定する発生確率特定部と、
    前記データ取得装置から前記データ収集装置への単位時間当たりの目標送信量を前記条件毎に設定する目標送信量設定部と、を有し、
    前記目標送信量設定部は、前記低発生クラスの発生確率が相対的に高い条件では、前記低発生クラスの発生確率が相対的に低い条件に比べて、前記データ取得装置からの単位時間当たりのデータ送信量が多くなるように、前記目標送信量を設定し、
    前記目標送信量設定部は、前記目標送信量設定部によって設定された前記条件毎の単位時間当たりの目標送信量を前記データ取得装置へ送信する、データ収集装置。
JP2021164964A 2021-10-06 2021-10-06 データ収集システム、データ収集方法及びデータ収集装置 Active JP7036272B1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021164964A JP7036272B1 (ja) 2021-10-06 2021-10-06 データ収集システム、データ収集方法及びデータ収集装置
CN202211206531.7A CN115952467A (zh) 2021-10-06 2022-09-30 数据收集***、数据收集方法及数据收集装置
US17/959,840 US20230109079A1 (en) 2021-10-06 2022-10-04 Data collection system, data collection method. and data collection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021164964A JP7036272B1 (ja) 2021-10-06 2021-10-06 データ収集システム、データ収集方法及びデータ収集装置

Publications (2)

Publication Number Publication Date
JP7036272B1 true JP7036272B1 (ja) 2022-03-15
JP2023055518A JP2023055518A (ja) 2023-04-18

Family

ID=81213528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021164964A Active JP7036272B1 (ja) 2021-10-06 2021-10-06 データ収集システム、データ収集方法及びデータ収集装置

Country Status (3)

Country Link
US (1) US20230109079A1 (ja)
JP (1) JP7036272B1 (ja)
CN (1) CN115952467A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020153170A1 (ja) * 2019-01-22 2020-07-30 株式会社Nttドコモ 情報処理装置
JP2020194994A (ja) * 2019-05-24 2020-12-03 株式会社Screenホールディングス データ収集方法、学習方法、データ収集システムおよび学習システム
JP6885517B1 (ja) * 2020-03-17 2021-06-16 株式会社村田製作所 診断支援装置及びモデル生成装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020153170A1 (ja) * 2019-01-22 2020-07-30 株式会社Nttドコモ 情報処理装置
JP2020194994A (ja) * 2019-05-24 2020-12-03 株式会社Screenホールディングス データ収集方法、学習方法、データ収集システムおよび学習システム
JP6885517B1 (ja) * 2020-03-17 2021-06-16 株式会社村田製作所 診断支援装置及びモデル生成装置

Also Published As

Publication number Publication date
US20230109079A1 (en) 2023-04-06
JP2023055518A (ja) 2023-04-18
CN115952467A (zh) 2023-04-11

Similar Documents

Publication Publication Date Title
Deep et al. A survey on anomalous behavior detection for elderly care using dense-sensing networks
Alvarez et al. Behavior analysis through multimodal sensing for care of Parkinson’s and Alzheimer’s patients
US11504068B2 (en) Methods, systems, and media for predicting sensor measurement quality
US20210401378A1 (en) Health Monitoring Platform for Illness Detection
US10959645B2 (en) Methods and systems for locating patients in a facility
CN109077710B (zh) 自适应心率估计的方法、装置和***
US20210092219A1 (en) Apparatus and control method for recommending do-not-disturb mode based on context-awareness
CN112603327B (zh) 一种心电信号的检测方法、装置、终端以及存储介质
US20220013236A1 (en) Systems and methods for detecting early indications of illnesses
JP7036272B1 (ja) データ収集システム、データ収集方法及びデータ収集装置
JP7088397B1 (ja) データ収集システム、データ収集装置、データ取得装置及びデータ収集方法
US20230123815A1 (en) Stability scoring of individuals utilizing inertial sensor device
JP7040664B1 (ja) データ収集装置、データ取得装置及びデータ収集方法
JP2023077288A (ja) データ収集装置、データ収集方法、端末機器
JP7147942B1 (ja) データ収集装置、データ収集システム、データ収集方法
Petrović et al. Cloud-based health monitoring system based on commercial off-the-shelf hardware
US20240013914A1 (en) Determination apparatus
US20220409187A1 (en) Illness detection with menstrual cycle pattern analysis
Gendy et al. Future Prediction of Close Contacts in IoT-based Contact Tracing System using a New Real-Life Dataset
Mitra et al. Automatic Detection of Situational Context Using AI from Minimal Sensor Modality
Nanjundan et al. Edge Computing for Smart Disease Prediction Treatment Therapy
Wang et al. Eating Speed Measurement Using Wrist-Worn IMU Sensors in Free-Living Environments
KR20220017295A (ko) 행동 인지(activity recognition, AR)를 이용한 로케이션 히스토리 결정 장치 및 방법
KR20230084695A (ko) 스마트 밴드를 이용한 건강 상태 모니터링 시스템, 및 이를 이용한 모니터링 정보 제공 방법
KR20180108532A (ko) 응급 상태 탐지를 위한 이동 단말기 및 이의 제어 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211006

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20211006

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220214

R151 Written notification of patent or utility model registration

Ref document number: 7036272

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151