WO2022079833A1

WO2022079833A1 - 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム

Info

Publication number: WO2022079833A1
Application number: PCT/JP2020/038787
Authority: WO
Inventors: 理一工藤; 馨子高橋; 友規村上; 匡史岩渕; 陸大宮; 智明小川
Original assignee: 日本電信電話株式会社
Priority date: 2020-10-14
Filing date: 2020-10-14
Publication date: 2022-04-21
Also published as: JPWO2022079833A1; JP7505569B2

Abstract

端末装置および端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成部と、端末装置の無線通信に係る通信情報を生成する通信部と、環境情報、または環境情報および通信情報を入力情報として、ターゲット情報となる未来の通信情報の時間に対応する補助情報を生成して、補助情報または補助情報と入力情報に基づいて端末装置の無線通信に係る未来の時間の通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成部と、通信環境モデルを用いて、端末装置の通信情報を予測するモデル利用部とを有する。これにより、高精度に未来の通信情報を予測することができる。

Description

通信情報予測装置、通信情報予測方法、および通信情報予測プログラム

　本発明は、環境情報を用いて予測モデルを生成し、無線通信システムの未来の通信情報を予測する技術に関する。

　近年、様々な装置がインターネットにつながるＩｏＴ（Internet of Things）の実現が進んでおり、自動車、ドローン、建設機械車両など様々な機器が無線により接続されつつある。また、ＩＥＥＥ８０２．１１規格の無線ＬＡＮ（Local Area Network）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＬＴＥ（Long Term Evolution）や５Ｇによるセルラー通信、ＩｏＴ向けのＬＰＷＡ（Low Power Wide Area）通信、車通信に用いられるＥＴＣ（Electronic Toll Collection System）、ＶＩＣＳ（Vehicle Information and Communication System（登録商標））、ＡＲＩＢ－ＳＴＤ－Ｔ１０９など、多種多様な無線通信規格が展開され、様々な無線通信サービスが広く利用されている。

　しかしながら、無線通信サービスによっては、通信品質の要求条件を必ずしも満たすことができない、という問題がある。特に端末装置や周辺のオブジェクトが動く場合、アンテナの指向性や伝搬環境が変動するため、通信品質が大きな影響を受ける。例えば非特許文献１では、移動するロボットと基地局装置との間の距離情報を用いて無線通信の予測モデルを生成し、通信品質を予測する技術が検討されている。

C.J.Lowrance, A.P.Lauf,"An active and incremental learning framework for the online prediction of link quality in robot networks",Engineering Applications of Artificial Intelligence,77,pp.197-211,2019.

　無線通信システムでは、無線通信機能が搭載された端末装置の位置、姿勢および動きなどの端末装置の状態、端末装置周辺の静的または動的な物体、などにより、通信相手との間の電波伝搬環境が変化して通信品質が影響を受け、無線通信により実現されるサービスやシステムに大きな影響を及ぼすことがある。例えば、高い周波数を用いる場合は電波の直進性が強く、通信品質は電波伝搬環境の変化による影響を受けやすい。このため、端末装置の安定した通信や通信品質をより高度に管理するには、端末装置自身と端末装置の周辺環境による通信品質の変動に対する対策が必要である。

　この対策として、機械学習を用いた通信品質と環境情報の関係性をモデル化し、未来の通信品質を予測する技術は、良好な通信品質を維持する上で有用な手段の一つである。

　ところが、通信に関する情報は時間的な相関が低く、例えば１秒後の通信環境が全く異なる場合が少なくないため、通信品質や、通信品質を高めるための制御方法を高精度に予測することが難しいという課題がある。以下、通信品質や通信品質を高めるための通信や端末装置の制御情報を通信情報と定義する。

　上記課題に鑑み、本発明は、ターゲット情報となる未来の通信情報の時間に対応する補助情報を生成し、補助情報または補助情報と入力情報からターゲットとなる未来の時間の通信情報を出力する機械学習モデルを訓練して生成することにより、未来の通信情報の予測を高精度に行うことができる通信情報予測装置、通信情報予測方法、および通信情報予測プログラムを提供することを目的とする。

　本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測装置において、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成部と、前記端末装置の無線通信に係る通信情報を生成する通信部と、前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成部と、前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用部とを有することを特徴とする。

　また、本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測方法であって、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、前記端末装置の無線通信に係る通信情報を生成する通信処理と、前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理とを行うことを特徴とする。

　また、本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測するコンピュータで実行可能な通信情報予測プログラムであって、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、前記端末装置の無線通信に係る通信情報を生成する通信処理と、前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理とをコンピュータで実行することを特徴とする。

　本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムは、時間的に相関の高いパラメータを入力情報として補助情報を生成し、補助情報からターゲットとなる未来の時間の通信情報を出力する機械学習モデルを訓練して生成することにより、通信情報の予測を高精度に行うことができる。

無線通信システムの構成例を示す図である。通信情報に関するパラメータと環境情報に係るパラメータの関係を示す図である。通信環境モデル生成部を訓練する場合の構成例を示す図である。訓練時の通信環境モデルの一例を示す図である。利用時の通信環境モデルの一例を示す図である。自律移動ロボットの一例を示す図である。自律移動ロボットが認識する屋内マップとゴールの位置を示す図である。比較例の通信環境モデルの一例を示す図である。第１の構成の通信環境モデルの一例を示す図である。第２の構成の通信環境モデルの一例を示す図である。実証実験における性能評価の結果を示す図である。

　以下、図面を参照して本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムの実施形態について説明する。なお、以下に説明する実施形態は本発明の一例であり、本発明は以下の実施形態に制限されるものではない。

　図１は、無線通信システム１００の構成例を示す。無線通信システム１００は、基地局装置１０１、基地局装置１０１と無線通信を行うＭ台（Ｍは正の整数）の端末装置１０２（１）から１０２（Ｍ）で構成されている。ここで、Ｍ台の端末装置１０２（１）から１０２（Ｍ）に共通する説明を行う場合は、符号末尾の（番号）を省略して端末装置１０２と記載する。なお、端末装置１０２を構成する複数の同じブロックに対しても同様に記載する。

　図１の例では、基地局装置１０１およびＭ台の端末装置１０２の全てが本発明に係る通信情報予測装置としての機能を有し、通信情報の予測を行うための通信環境モデルを生成し、通信情報予測を行うことができる。

　なお、本実施形態では、基地局装置１０１を介してネットワークに接続する構成として説明するが、基地局装置１０１とは別にネットワークに接続可能な通信装置を有していてもよい。そして、端末装置１０２は、基地局装置１０１またはネットワークに接続可能な通信装置を介して、ネットワークに接続されたカメラやセンサを搭載する機器（基地局装置１０１を含むアクセスポイントや周辺路上の監視カメラなど）からカメラ情報やセンサ情報などの非通信情報を環境情報として収集することができる。また、端末装置１０２は、他の端末装置１０２と直接、通信を行って端末装置１０２に搭載されたカメラ／センサからカメラ情報やセンサ情報を収集してもよい。例えば端末装置１０２が自動車に搭載された通信装置の場合、車車間通信（車対車間の通信）により、カメラ情報やセンサ情報（位置情報などを含む）が収集される。このようにして、ターゲットとする基地局装置１０１と端末装置１０２との間の無線通信のモデルを機械学習により生成するための環境情報が収集される。そして、形成された通信環境モデルを用いて基地局装置１０１と端末装置１０２との間の通信情報の予測が行われる。

　特に、以降で説明する実施形態では、時間的な相関の高いパラメータを入力情報として一旦、補助情報を生成して機械学習を行うことにより、精度の高い通信情報の予測を行うことができる。ここで、補助情報は、未来の通信情報（例えば受信電力など）に対応する環境情報のパラメータであり、ターゲット情報の予測に利用可能な非通信情報である。

　（基地局装置１０１の構成例）
　図１において、基地局装置１０１は、ネットワークに接続する機能を有し、Ｍ台の端末装置１０２との間で無線通信を行う。基地局装置１０１は、ＮＷ部２０１、通信部２０２（１）から通信部２０２（Ｎ）、通信環境モデル生成部２０３、環境情報生成部２０４およびモデル利用部２０５を有する。

　ＮＷ部２０１は、外部のネットワークに接続するためのインターフェースである。基地局装置１０１は、ＮＷ部２０１を介して、外部のネットワークに接続されるカメラやセンサなどの装置からカメラ情報（撮影画像など）やセンサ情報（三次元レーザなど）を取得することができる。これらの情報は、基地局装置１０１に接続される端末装置１０２も取得可能である。

　通信部２０２は、通信部２０２（１）から通信部２０２（Ｎ）までのＮ個（Ｎは正の整数）を有し、複数の端末装置１０２との間で無線通信を行うことができる（通信処理）。また、通信部２０２は、無線通信に関係する通信情報を生成し、通信環境モデル生成部２０３およびモデル利用部２０５に出力する。通信情報は、例えば、受信信号電力、信号対雑音電力比（ＳＮＲ）、信号対干渉雑音電力比（ＳＩＮＲ）、ＲＳＳＩ（Received Signal Strength Indication）、ＲＳＲＱ（Received Signal Reference Quality）、パケット誤り率、到達ビット数、単位時間当たりの到達ビット数、ＭＣＳ（Modulation and Coding Scheme index）、再送回数、遅延時間、誤り訂正方式、通信システムの周波数、利用するリソースの帯域幅などの周波数条件、などである。さらに、これらの値の微分情報、これらの値から計算式を用いて算出される指標、これらの指標に影響を与えるシステムの設定項目などであってもよい。

　通信環境モデル生成部２０３は、環境情報生成部２０４が生成する環境情報と、通信部２０２（１）から通信部２０２（Ｎ）、通信部３０１（１）から通信部３０１（Ｍ）のうち少なくとも一つが生成する通信情報と、を用いて、通信情報を予測するための通信環境モデルを生成する（通信環境モデル生成処理）。なお、通信環境モデルの生成方法については後述する。

　環境情報生成部２０４は、装置環境に係る環境情報を生成する（環境情報生成処理）。環境情報は、端末装置１０２および基地局装置１０１の位置／姿勢／状態／動き／制御指令／端末装置１０２および基地局装置１０１またはネットワークを介して取得可能な機器のカメラ情報およびセンサ情報（物体の有無、サイズ、材質など様々な情報を含む）／構造物の動作／端末装置１０２およびネットワークの行動戦略、などの少なくとも一つの情報を含む。

　ここで、制御指令は、例えば、端末装置１０２が自律移動ロボットである場合、ロボット正面方向へのタイヤ回転指令、ロボットの回転指令などに対応する。また、端末装置１０２およびネットワークの行動戦略は、例えば、端末装置１０２やロボットの予定移動経路、端末装置１０２の電力モード、端末装置１０２が利用するアンテナ数、端末装置１０２へのＱｏＳ設定、ネットワークの経路設定、ネットワークの混雑状況、ネットワークにおけるルーティングルール、アプリケーションの設定、などである。

　さらに、環境情報は、端末装置１０２の所有者情報やタイプ（スマートフォンなどの携帯端末、自動車、ロボット、ドローンなど）の情報、入店者情報、自動車の移動履歴、など、通信環境モデルでターゲット情報を予測するために使えるのではないかと思われる全ての非通信情報を含む情報であってもよい。環境情報が多いほど、通信環境モデルの予測精度が向上する。

　モデル利用部２０５は、通信環境モデル生成部２０３により生成された通信環境モデルを用いて、ターゲット情報の出力、または報酬を最大化するような戦略情報の出力を行う（モデル利用処理）。例えば、端末装置１０２が自律移動ロボットの場合、受信電力を最大化することに報酬を設定し、報酬が高くなるようなＸ座標速度、Ｙ座標速度、回転指令などを戦略情報として出力することができる。なお、モデル利用部２０５の動作については後述する。

　このようにして、基地局装置１０１が通信情報予測装置として機能する場合、通信環境モデル生成部２０３は、環境情報生成部２０４から得られた環境情報と、通信部２０２から得られる通信情報と、を用いて、通信環境モデルを生成する。そして、モデル利用部２０５は、通信環境モデル生成部２０３が生成した通信環境モデルを用いて、通信情報を予測することができる。

　（端末装置１０２の構成例）
　端末装置１０２（１）から端末装置１０２（Ｍ）は、それぞれ基地局装置１０１との間で無線通信を行う。

　端末装置１０２は、通信部３０１、通信環境モデル生成部３０２、環境情報生成部３０３およびモデル利用部３０４を有する。

　通信部３０１は、基地局装置１０１の通信部２０２、または他の端末装置１０２との間で無線通信を行う（通信処理）。また、通信部３０１は、基地局装置１０１の通信部２０２と同様に、無線通信に関係する通信情報を生成し、通信環境モデル生成部３０２およびモデル利用部３０４に出力する。

　通信環境モデル生成部３０２は、基地局装置１０１の通信環境モデル生成部２０３と同様に、環境情報生成部３０３から得られた環境情報と、通信部３０１から得られる通信情報と、を用いて通信環境モデルを生成する（通信環境モデル生成処理）。

　環境情報生成部３０３は、基地局装置１０１の環境情報生成部２０４と同様に、環境情報を生成する（環境情報生成処理）。なお、通信環境モデルの生成方法については後述する。

　モデル利用部３０４は、基地局装置１０１のモデル利用部２０５と同様に、通信環境モデル生成部３０２により生成された通信環境モデルを用いて、ターゲット情報の出力、または報酬を最大化するような戦略情報の出力を行う（モデル利用処理）。

　このようにして、端末装置１０２が通信情報予測装置として機能する場合、通信環境モデル生成部３０２は、環境情報生成部３０３から得られた環境情報と、通信部３０１から得られる通信情報と、を用いて、通信環境モデルを生成する。そして、モデル利用部３０４は、通信環境モデル生成部３０２が生成した通信環境モデルを用いて、通信情報を予測することができる。

　ここで、上述の説明では、基地局装置１０１と端末装置１０２とに分けて説明したが、基地局装置１０１と端末装置１０２との間で機能を分担してもよい。例えば、通信環境モデル生成部２０３で生成された通信環境モデルを各端末装置１０２のモデル利用部３０４が利用するようにしてもよい。

　（通信環境モデル生成部）
　次に、基地局装置１０１の通信環境モデル生成部２０３および端末装置１０２の通信環境モデル生成部３０２について詳しく説明する。なお、ここでは、基地局装置１０１の通信環境モデル生成部２０３として説明するが、端末装置１０２の通信環境モデル生成部３０２についても基本的な動作は同じである。

　基地局装置１０１の通信環境モデル生成部２０３は、複数の端末装置１０２との間の無線通信における通信情報および環境情報を収集して多くの訓練データを用いることができるので、端末装置１０２の通信環境モデル生成部３０２よりも望ましい。しかし、端末装置１０２ごとに最適化されたモデルとなるように転移学習やファインチューニングなどの技術で調整することが可能である。

　通信環境モデルは、環境情報、または、環境情報および通信情報を入力情報として、同じ時間または未来の時間におけるターゲット情報を出力するように、生成されるモデルである。通信環境モデルは、出力の値が高精度となるように、生成されてもよいし、出力値とは異なるあるパラメータを最大化するように強化学習により生成されてもよい。

　例えば、未来の時間の受信電力を通信環境モデルにより出力する場合には、未来の時間の受信電力をターゲット情報のパラメータとして訓練データを形成し、通信環境モデルの出力となる受信電力の予測値と実際の受信電力との誤差が少なくなるように、通信環境モデルが生成される。あるいは、端末装置１０２が自律移動ロボットである場合、受信電力を最大化するように、ロボットのＸ座標速度、Ｙ座標位置速度、回転指令を出力させるために、強化学習により、受信電力を最大化することに報酬を設定し、報酬が高くなるようなＸ座標速度、Ｙ座標速度、回転指令を出力するように通信環境モデルが生成される。

　通信環境モデルをできるだけ多くの訓練データにより生成するためには、できるだけ共通して利用できるデータを増やして、モデルの生成を行う方が高い特性が得られると想定される。一方、通信システムは一般に広い帯域幅が利用可能であり、その中の周波数チャネルの利用方法も通信システムにより様々なものが存在する。通信システムの設定値ごとに独立の通信環境モデルを生成すれば、訓練に要するデータ量が十分に得られないなどの問題が生じる。従って、できるだけ多くのデータを用いた共通の通信環境モデルとすることが望ましい。

　図２は、通信情報に関するパラメータと環境情報に係るパラメータの関係を示す。図２において、縦軸は時間を示し、ｔ_－ＮはＮスロット過去の時間、ｔ_０は現在、ｔ_ＭはＭスロット未来の時間を表す。ここで、スロットとは、任意の時間幅での区切りを表し、無線通信のシンボル間隔と考えてもよいし、環境情報が得られる周期と考えてもよい。

　図２に示すように、一般に、環境情報は時間的な相関が高いが、通信情報は時間的な相関が低い。映像や位置情報などの環境情報は、物理的な環境における情報なので時間的な相関が高い。例えば１秒間で物体が動作する範囲は限られているため、現在と過去の情報から１秒後の映像や物体の位置などの状態を高精度に予測することが可能である。

　一方、受信電力などの通信情報は、１秒後の通信環境が全く異なるものになることが少なくない。例えば、移動する端末装置の通信状態が伝搬特性の変動などにより急激に悪化することがある。このため、実際の無線通信システムでは、パイロット信号を使ったチャネル情報の取得をマイクロ秒オーダーの短い間隔で実施しており、数十ミリ秒未来の時間の通信情報の予測は困難となる。

　このように、未来の通信情報に関するパラメータを予測するアルゴリズムでは、先ず時間的に相関の高いパラメータを用いて未来の予測すべき時間における情報を生成した後、当該情報を通信情報に変換することが有効であると考えられる。

　そこで、本実施形態では、時間的に相関の高いパラメータを用いて補助情報を一旦生成し、補助情報を用いて通信情報を予測する通信環境モデルを生成する。

　図２において、未来の時間ｔ_Ｍにおける通信情報に関するパラメータを予測するために、現在および過去の通信情報を用いた場合、時間的な相関が低いので、推定精度が低くなるという問題がある。

　このため、本実施形態では、未来の時間ｔ_Ｍにおける通信情報を得るために、現在時間ｔ_０から未来の時間ｔ_Ｍの間の任意の時間の環境情報または通信情報を補助情報として生成し、さらに生成した補助情報を用いて、時間ｔ_Ｍにおける通信情報に関するパラメータを予測することにより、推定精度を高めることができる。

　図３は、通信環境モデル生成部２０３を訓練する場合の構成例を示す。なお、ここでは、基地局装置１０１の通信環境モデル生成部２０３として説明するが、端末装置１０２の通信環境モデル生成部３０２の場合も同様である。

　モデル訓練時には、通信環境モデル生成部２０３は、訓練データを用いて、通信環境モデル４０１を生成する。訓練データは、入力情報、ターゲット情報および補助情報からなる。入力情報は、環境情報のみ、または環境情報および通信情報の両方からなる。ターゲット情報は、通信情報または通信情報のパラメータを最大化する制御に関するパラメータからなる。制御に関するパラメータとは、端末装置１０２の動き、基地局装置１０１の動き、物理層からアプリケーション層までのＯＳＩ参照モデルにおけるモード／通信宛先／通信経路／通信方式などの制御、電波伝搬環境に影響を与える構造物／メタマテリアル／誘電体の位置・動き・設定の制御、などが挙げられる。補助情報は、ターゲットとなる出力と同じ時間の情報である環境情報と通信情報の中から選択された任意のパラメータからなる。

　ここで、入力情報は、通信環境モデル４０１の利用時にも入力され、ターゲット情報を出力するために必要な情報である。また、補助情報は、訓練時には入力されるが、通信環境モデル４０１の利用時には入力されず、通信環境モデル生成部２０３の内部で用いられる情報である。

　なお、入力情報として、図２で説明したように、時間的な相関が高い環境情報の使用が想定される。通信情報は時間的な相関が低い傾向にあるが、時間的な相関が高い通信情報のパラメータを選択して入力情報として用いてもよい。例えば、過去の時間ｔ_Ｎと現在の時間ｔ_０との間隔が短い場合、通信情報の時間的な相関はある程度得られる考えることができる。

　このようにして、通信環境モデル生成部２０３（または通信環境モデル生成部３０２）は、通信環境モデル４０１を生成することができる。

　図４は、訓練時の通信環境モデル４０１の一例を示す。図４において、訓練データとして、利用時に用いる入力情報と、利用時には入力されないがモデルの訓練に利用する補助情報と、利用時に出力するターゲット情報を、教師データとして利用する。なお、機械学習アルゴリズムとして、ニューラルネットワーク、決定木、ランダムフォレスト、など任意のアルゴリズムが利用可能である。

　図４において、通信環境モデル４０１は、第１の機械学習ブロック５０１および第２の機械学習ブロック５０２を有する。なお、第１の機械学習ブロック５０１および第２の機械学習ブロック５０２は、それぞれ複数具備されていてもよい。

　第１の機械学習ブロック５０１は、入力情報が入力されると、予め決められた機械学習のアルゴリズムを用い、補助情報を含む情報を出力する。訓練時には、第１の機械学習ブロック５０１から出力された補助情報は、補助情報出力５０３において、既知の訓練データの補助情報と比較される。例えば第１の機械学習ブロック５０１から出力される補助情報と、訓練データの補助情報との誤差（例えばＭＳＥ（Mean square error））を求め、より精度の高い補助情報が出力されるように、第１の機械学習ブロック５０１内のアルゴリズムの係数が更新される。このようにして、第１の機械学習ブロック５０１は、より精度の高い補助情報が得られるように訓練される。この補助情報は、ターゲット情報が対応する未来の時間の環境情報とすることで、第２の機械学習ブロック５０２は、補助情報とターゲット情報の時間差の小さい関係性を学習できる。つまり、入力情報に含まれる時間ｔ_０までの環境情報を用い、同じ種類の情報であるが、それより未来の時間ｔ_Ｆの環境情報を補助情報として用いることができる。この場合、訓練データは、入力信号の少なくとも一部の時系列データを、時間的に未来にシフトしたものを補助情報として用いることができるため、時系列で訓練データが得られている場合、同じデータから入力情報と補助情報を得ることができるメリットもある。

　第２の機械学習ブロック５０２は、第１の機械学習ブロック５０１が補助情報出力５０３を介して出力する補助情報を少なくとも含む入力情報に基づいて、ターゲット情報を出力する。なお、第２の機械学習ブロック５０２は、補助情報に加えて、第１の機械学習ブロック５０１を介して入力情報を入力するようにしてもよい。訓練時には、第２の機械学習ブロック５０２から出力されたターゲット情報は、ターゲット情報出力５０４において、既知の訓練データのターゲット情報と比較される。例えば第２の機械学習ブロック５０２から出力されるターゲット情報と、訓練データのターゲット情報との誤差（例えばＭＳＥ）を求め、より精度の高いターゲット情報が出力されるように、第２の機械学習ブロック５０２内のアルゴリズムの係数が更新される。このようにして、第２の機械学習ブロック５０２は、より精度の高いターゲット情報が得られるように訓練される。

　なお、第１の機械学習ブロック５０１および第２の機械学習ブロック５０２がニューラルネットワークで構成されている場合には、補助情報やターゲット情報に対する誤差に基づいて、それぞれバックプロパゲーションにより、ニューラルネットワーク内の係数（重みおよびバイアス）が更新され、第１の機械学習ブロック５０１および第２の機械学習ブロック５０２がより正確な補助情報およびターゲット情報を出力できるように訓練される。このとき、ターゲット情報に対するバックプロパゲーションは、第１の機械学習ブロック５０１と第２の機械学習ブロック５０２の両方の係数を更新するように訓練してもよいし、第２の機械学習ブロック５０２のみを訓練するようにしてもよい。

　このように、機械学習ブロックの係数を更新することにより、図２で説明した時間的な相関の低い通信情報からターゲット情報を出力するのではなく、第１の機械学習ブロック５０１により、ターゲット情報と同じ時間軸（ｔ_０）における環境情報や通信情報を補助情報として用い、補助情報を高精度に入力情報から生成できるように通信環境モデル４０１を訓練することが可能である。これにより、ターゲット情報の精度が向上され、強化学習による訓練で設定された通信情報の任意のパラメータを最大化するようなターゲット情報の出力が可能になる。

　図５は、利用時の通信環境モデル４０１の一例を示す。通信環境モデル生成部２０３は、図４で説明した訓練時とは異なり、入力情報を入力してターゲット情報を出力する。

　図５において、通信環境モデル４０１は、第１の機械学習ブロック５０１および第２の機械学習ブロック５０２を有する。なお、第１の機械学習ブロック５０１および第２の機械学習ブロック５０２は、それぞれ複数具備されていてもよい。

　第１の機械学習ブロック５０１は、図４の訓練時とは異なり、入力情報から補助情報を生成し、補助情報を第２の機械学習ブロック５０２に出力する。ここで、補助情報は、図４に示した訓練時に強化学習された精度の高い補助情報である。

　第２の機械学習ブロック５０２は、第１の機械学習ブロック５０１から出力される補助情報を少なくとも含む入力に基づいて、ターゲット情報を出力する。ここで、ターゲット情報は、図４に示した訓練時に強化学習された精度の高いターゲット情報である。

　このようにして、通信環境モデル４０１は、通信情報の予測を精度高く行うことができる。特に、ターゲット情報と同じ時間における環境情報や通信情報を補助情報として用い、補助情報を高精度に入力情報から生成できるように訓練された通信環境モデルを用いるので、精度の高いターゲット情報を得ることができる。

　［実証実験］
　実施形態の効果を実証するために行った実験とその結果について説明する。

　実験に用いた移動する端末装置１０２は、パルス状に発光するレーザー照射に対する散乱）を用いたリモートセンシング技術の一つであるＬＩＤＡＲ（"Light Detection and Ranging"または"Laser Imaging Detection and Ranging"）を搭載した自律移動ロボットである。自律移動ロボットは、ＬＩＤＡＲにより、自己の位置情報、向き情報、オドメトリ情報、及び制御指令情報を端末情報として収集することができる。

　また、無線通信はＩＥＥＥ８０２．１１ａｃ規格の無線ＬＡＮを用い、０．２秒間に通信するビット量をスループットとして計測し、性能を評価するものとする。

　図６は、自律移動ロボットの一例を示す。図６において、横軸はｘ－ａｘｉｓ［ｍ］、縦軸はｙ－ａｘｉｓ［ｍ］の二次元平面を示し、時刻τにおける自律移動ロボットの位置は（ｘ［τ］、ｙ［τ］）である。自己の位置情報は、オドメトリ情報とＬＩＤＡＲの測定結果から、Ｒｏｂｏｔ　ＯＳのＡＭＣＬ（Adaptive Monte Carlo Localization）のアルゴリズムにより計算される。向きは、ロボット分野の座標系で用いられるクォータニオンにより、｛ｋｚ［τ］、ｗ［τ］｝＝｛ｓｉｎ（θ［τ］／２）、ｃｏｓ（θ［τ］／２）｝で表される。また、ロボットのタイヤの回転から検出されるロボットの正面方向に対する速度や回転速度などのオドメトリ情報、ロボット正面方向へ対応するタイヤ回転指令、ロボットの回転に対応する指令などの制御指令情報、などの特徴量として、オドメトリ（Ｖｘ［τ］、Ｖ_θ［τ］）、制御指令情報（Ｏｘ［τ］、Ｏ_θ［τ］）を用いることができる。後述の自律移動ロボットを用いた実証実験では、（ｘ［τ］、ｙ［τ］、ｋｚ［τ］、ｗ［τ］、Ｖｘ［τ］、Ｖ_θ［τ］、Ｏｘ［τ］、Ｏ_θ［τ］）の合計８つの特徴量のうち、すべての特徴量（８つの特徴量）を入力情報として使用する場合と、オドメトリおよび制御指令情報を除く（Ｘ［τ］、Ｙ［τ］、ｋｚ［τ］、ｗ［τ］）の４つの特徴量を入力情報として使用する場合とについて行う。

　さらに、通信情報はＲＳＳＩとスループットとを用い、ＲＳＳＩは１０ｍｓごとに取得し、０．２秒のタイムスロット内のＲＳＳＩの中央値をγ_ａｖｅ［τ］、分散値をγ_ｓｔｄ［τ］、スループットをＣ［τ］とする。

　ここで、実証実験における環境情報は、ロボットから得られる、位置（Ｘ軸、Ｙ軸）、向き、オドメトリ（自己位置推定）（Ｘ軸上の速度、Ｙ軸上の速度、回転速度）、制御指令情報（ロボット正面方向へのタイヤ回転指令、ロボットの回転指令）、および過去のスループット（現在から過去２秒まで）を用いる。

　また、時間方向には１０サンプルのパラメータを用いるので、入力情報は、パラメータが４つの場合は４×１０＝４０、パラメータが８つの場合は８×１０＝８０となる。出力情報（ターゲット情報）は、現在時間ｔ_０の１．２秒後から２秒後までを０．２秒間ウィンドウで規格化したスループットＣ［ｔ_Ｍ－４］、Ｃ［ｔ_Ｍ－３］、Ｃ［ｔ_Ｍ－２］、Ｃ［ｔ_Ｍ－１］、Ｃ［ｔ_Ｍ］を予測する。ここで、ｔ_Ｍ＝ｔ_０＋２［ｓｅｃ］、ｔ_Ｍ－１＝ｔ_０＋１．８［ｓｅｃ］、ｔ_Ｍ－２＝ｔ_０＋１．６［ｓｅｃ］、ｔ_Ｍ－３＝ｔ_０＋１．４［ｓｅｃ］、ｔ_Ｍ－４＝ｔ_０＋１．２［ｓｅｃ］である。

　また、訓練時には、出力されるターゲット情報のスループットＣ［ｔ_Ｍ－４］からＣ［ｔ_Ｍ］と、既知の訓練データのスループットＣ［ｔ_Ｍ－４］からＣ［ｔ_Ｍ］とを比較して誤差を算出し、誤差が最小になるように逆伝播により機械学習ブロックの係数が更新される。

　なお、後述のＲ２スコアで評価するスループットＣ_ｉは、（Ｃ［ｔ_Ｍ－４］＋Ｃ［ｔ_Ｍ－３］＋Ｃ［ｔ_Ｍ－２］＋Ｃ［ｔ_Ｍ－１］＋Ｃ［ｔ_Ｍ］）／５として評価する。

　図７は、自律移動ロボットが認識する屋内マップとゴールの位置を示す。図７に示すように、ロボットは、設置された１１３個のゴールの中から一つを選択して、自律移動を続ける。そして、ロボットが選択されたゴールの周辺３０ｃｍに入れば、次のゴールを再設定して、ロボットは次のゴールに向かうように設計されている。

　実証実験では、深層学習により通信環境モデルを生成するため、前述の入力情報およびターゲット情報のいずれも、およそ－１から＋１の分布となるように前処理を行っている。また、予測精度は、式（１）に示すＲ２スコアにより評価する。

　ここで、Ｃ_ｉはスループットの実測値、^Ｃ_ｉは機械学習による予測値、ｎはサンプル数、ｉはサンプル番号、Ｃ_ａｖｅはスループットの予測値をそれぞれ表す。

　Ｒ２スコアは機械学習による通信環境モデルがどの程度の精度でデータを予測できるかを表し、一般に、Ｒ２スコアが０．６以上で正常にモデル化ができていることを示し、Ｒ２スコアが０．７の場合はモデルの精度が高いことを示す。

　図８は、比較例の通信環境モデルの一例を示す。比較例は、従来方式の通信環境モデルであり、リカレントニューラルネットワーク（ＲＮＮ）と全結合層３層を用いて構成した通信環境モデルの例を示す。

　図８において、環境情報（８つのパラメータ）と通信情報（２つのパラメータ）の入力情報がＲＮＮに入力される。入力情報は、過去２秒間に０．２秒ごとの１０のタイミングのパラメータを用いる。つまり、現在時間ｔ_０から０．２秒ごとの過去の時間ｔ_０－０．２秒、ｔ_０－０．４秒、ｔ_０－０．６秒、ｔ_０－０．８秒、ｔ_０－１．０秒、ｔ_０－１．２秒、ｔ_０－１．４秒、ｔ_０－１．６秒、ｔ_０－１．８秒、の１０のタイミングのパラメータを用いる。また、ＲＮＮは、ＧＲＵ（Gated Recurrent Unit）を用い、隠れ層を１、隠れ層の次元を３５とする。

　また、全結合層は、入力３５および出力３５の層が２つと、入力３５および出力１の層が１つとで構成され、ターゲット情報を出力する。なお、全結合層の間にＲｅＬＵ（Rectified Linear Unit）による活性化層が用いられる。

　図９は、本実施形態に係る第１の構成の通信環境モデル４０１の一例を示す。図９に示す第１の構成の通信環境モデル４０１は、ＲＮＮと全結合層３層を基本構造とする第１の機械学習ブロック５０１と第２の機械学習ブロック５０２とを有する。

　第１の機械学習ブロック５０１は、ＲＮＮとして隠れ層が１、隠れ層の次元が３５のＧＲＵを用い、入力３５で出力３５の層が２つ、入力３５で出力Ｍ（Ｍは正の整数）の層が１つ、を有する全結合層３層で構成され、ターゲット情報の時間ｔ_０に対応するＭ個の補助情報を出力する。

　第２の機械学習ブロック５０２は、ＲＮＮとして隠れ層が１、隠れ層の次元が３５のＧＲＵを用い、入力３５で出力３５の層が２つ、入力３５で出力１の層が１つ、を有する全結合層３層で構成され、ターゲット情報を出力する。

　ここで、先に述べたように、訓練時には、第１の機械学習ブロック５０１の出力となる補助情報が訓練データに含まれるように構成する。そして、出力される補助情報と、教師データの補助情報とを比較して、誤差が最小となるように、第１の機械学習ブロック５０１のニューラルネットワークの係数を更新することにより、補助情報の精度が高められる。

　また、実証実験の入力情報は、先に述べたように、（Ｘ［τ］、Ｙ［τ］、ｋｚ［τ］、ｗ［τ］）の４つの場合と、（Ｘ［τ］、Ｙ［τ］、ｋｚ［τ］、ｗ［τ］、Ｖｘ［τ］、Ｖ_θ［τ］、Ｏｘ［τ］、Ｏ_θ［τ］）の８つの場合と、を想定する。

　また、補助情報出力は、（Ｘ［ｔ］、Ｙ［ｔ］、ｋｚ［ｔ］、ｗ［ｔ］、Ｖｘ［ｔ］、Ｖ_θ［ｔ］、γ_ａｖｅ［ｔ］、γ_ｓｔｄ［ｔ］、Ｃ［ｔ］）の１１の係数を８つの時間（ｔ_Ｍ－７、ｔ_Ｍ－６、・・・、ｔ_Ｍ）のサンプル分だけ生成される。つまり、補助情報出力は、ｔ_Ｍ－７、ｔ_Ｍ－６、・・・、ｔ_Ｍの時間に対応し、１１×８＝８８の補助情報が出力される。

　このようにして得られる補助情報出力の時系列データは、さらに第２の機械学習ブロック５０２のＲＮＮ（ＧＲＵ）に入力され、全結合層３層からターゲット情報が出力される。第２の機械学習ブロック５０２から出力されるターゲット情報は、現在時間ｔ_０の１．２秒後から２秒後までを０．２秒間ウィンドウで規格化したスループットＣ［ｔ_Ｍ－４］、Ｃ［ｔ_Ｍ－３］、Ｃ［ｔ_Ｍ－２］、Ｃ［ｔ_Ｍ－１］、Ｃ［ｔ_Ｍ］となる。ここで、ｔ_Ｍ＝ｔ_０＋２［ｓｅｃ］、ｔ_Ｍ－１＝ｔ_０＋１．８［ｓｅｃ］、ｔ_Ｍ－２＝ｔ_０＋１．６［ｓｅｃ］、ｔ_Ｍ－３＝ｔ_０＋１．４［ｓｅｃ］、ｔ_Ｍ－４＝ｔ_０＋１．２［ｓｅｃ］である。

　訓練時には、８８の補助情報と、５つの出力情報（ターゲット情報）と、対応する訓練データのターゲット情報とを比較して、誤差が最小になるように逆伝播を実施し、第１の機械学習ブロック５０１のニューラルネットワークの係数を更新することにより、補助情報の精度が高められる。

　図１０は、本実施形態に係る第２の構成の通信環境モデル４０１の一例を示す。図１０に示す第２の構成の通信環境モデル４０１は、ＲＮＮと全結合層３層を基本構造とする第１の機械学習ブロック５０１と第２の機械学習ブロック５０２とを有する。

　第１の機械学習ブロック５０１は、図９の第１の構成と同じ構成であり、ＲＮＮとして隠れ層が１、隠れ層の次元が３５のＧＲＵを用い、入力３５で出力３５の層が２つ、入力３５で出力Ｍ（Ｍは正の整数）の層が１つ、を有する全結合層３層で構成され、ターゲット情報の時間ｔ_０に対応するＭ個の第１の補助情報を出力する。

　第２の機械学習ブロック５０２は、図９の第１の構成と少し異なり、第２の機械学習ブロック５０２の中に第２’の機械学習ブロック５０２’を有する。第２’の機械学習ブロック５０２’は、入力３５で出力３５の層が２つ、入力３５で出力１の層が１つ、を有する全結合層３層で構成され、第２の補助情報を出力する。そして、第２の補助情報は、入力３７で出力３５の層が１つ、入力３５で出力３５の層が１つ、入力３５で出力１の層が１つ、を有する全結合層３層にＧＲＵの出力とともに入力され、ターゲット情報が出力される。

　図１０の第２の構成においても、実証実験の入力情報は、先に述べたように、（Ｘ［τ］、Ｙ［τ］、ｋｚ［τ］、ｗ［τ］）の４つの場合と、（Ｘ［τ］、Ｙ［τ］、ｋｚ［τ］、ｗ［τ］、Ｖｘ［τ］、Ｖ_θ［τ］、Ｏｘ［τ］、Ｏ_θ［τ］）の８つの場合と、を想定する。

　また、第１の補助情報の出力は、（Ｘ［ｔ］、Ｙ［ｔ］、ｋｚ［ｔ］、ｗ［ｔ］、Ｖｘ［ｔ］、Ｖ_θ［ｔ］）の８つの係数を８つの時間（ｔ_Ｍ－７、ｔ_Ｍ－６、・・・、ｔ_Ｍ）のサンプル分だけ生成される。つまり、第１の補助情報の出力は、ｔ_Ｍ－７、ｔ_Ｍ－６、・・・、ｔ_Ｍの時間に対応し、８×８＝６４の補助情報が出力される。

　図１０の第２の構成では、入力情報を非通信情報である環境情報と通信情報とに分けて扱い、先ず時間的に相関の高い環境情報を未来の時間（時間ｔ_Ｍ－７からｔ_Ｍまで）の環境情報（第１の補助情報）に変換する。そして、未来の時間の第１の補助情報から、同じ時間の第２の補助情報として通信情報（γ_ａｖｅ［ｔ］、γ_ｓｔｄ［ｔ］、Ｃ［ｔ］）を出力するようにすることで、環境情報と通信情報とを時間的に相関の高い特徴量同士として訓練が実施可能である。これにより、第１の構成に比べて、ターゲット情報の精度が向上する。なお、第２の補助情報の出力は、ｔ_Ｍ－４、ｔ_Ｍ－３、・・・、ｔ_Ｍの出力時間と同様に５サンプルとする。第１の補助情報を入力する第２の機械学習ブロック５０２の出力と、第２’の機械学習ブロック５０２’が出力する第２の補助情報とに基づいて、全結合層で最後の予測が行われ、ターゲット情報が出力される。

　なお、実証実験において、第２の機械学習ブロック５０２から出力されるターゲット情報は、現在時間ｔ_０の１．２秒後から２秒後までを０．２秒間ウィンドウで規格化したスループットＣ［ｔ_Ｍ－４］、Ｃ［ｔ_Ｍ－３］、Ｃ［ｔ_Ｍ－２］、Ｃ［ｔ_Ｍ－１］、Ｃ［ｔ_Ｍ］となる。ここで、ｔ_Ｍ＝ｔ_０＋２［ｓｅｃ］、ｔ_Ｍ－１＝ｔ_０＋１．８［ｓｅｃ］、ｔ_Ｍ－２＝ｔ_０＋１．６［ｓｅｃ］、ｔ_Ｍ－３＝ｔ_０＋１．４［ｓｅｃ］、ｔ_Ｍ－４＝ｔ_０＋１．２［ｓｅｃ］である。

　訓練時には、６４の第１の補助情報と、５つ時間の３つの特徴量に対する１５の第２の補助情報と、最終出力の５つのターゲット情報との合計８４の出力情報と、この出力情報に対応する訓練データの情報とを比較して誤差が最小になるように逆伝播を実施し、各機械学習ブロックの係数が更新される。

　本実施形態の副次的な効果は、第１の機械学習ブロック５０１の入力情報を変更しても、第１の補助情報の出力を予め決めておけば、第２の機械学習ブロック５０２を共通に使用できることである。つまり、予測に使用できる情報が、端末装置１０２によってバラバラであったとしても、第１の機械学習ブロック５０１の第１の補助情報の出力内容を予め決めておくことで、各端末装置１０２は同じ補助情報が出力できる第１の機械学習ブロック５０１をそれぞれ有していればよい。つまり、第２の機械学習ブロック５０２は他の端末装置１０２と同じものが使える。

　図１１は、実証実験における性能評価の結果を示す。なお、実証実験では、先に説明した実証実験で取得された１００時間分のデータに基づいて訓練を行った後、別に用意したテスト用の６時間分のデータセットにより、１秒後から２秒後までの規格化されたスループットが得られた。

　図１１において、入力情報として（Ｘ［ｔ］、Ｙ［ｔ］、ｋｚ［ｔ］、ｗ［ｔ］）の４種の特徴量を入力した場合、従来方法のＲ２スコアが０．６３３９５であるのに対して、本実施形態に係る第１の構成方法のＲ２スコアは０．６４１７９２、第２の構成方法のＲ２スコアは０．６４３３８であり、Ｒ２スコアは、従来方法＜第１の構成方法＜第２の構成方法の順に改善されていることが確認できる。

　同様に、入力情報として（Ｘ［ｔ］、Ｙ［ｔ］、ｋｚ［ｔ］、ｗ［ｔ］、Ｖｘ［ｔ］、Ｖ_θ［ｔ］、Ｏｘ［ｔ］、Ｏ_θ［ｔ］）の８種の特徴量を入力した場合、従来方法のＲ２スコアが０．６４５６９であるのに対して、本実施形態に係る第１の構成方法のＲ２スコアは０．６５６０９７、第２の構成方法のＲ２スコアは０．６５９６４であり、Ｒ２スコアは、従来方法＜第１の構成方法＜第２の構成方法の順に改善されていることが確認できる。

　（他の実現形態）
　ここで、上述した各実施形態における基地局装置１０１または端末装置１０２の各ブロックまたは一部のブロックを構成要素として行う処理をコンピュータで実行するようにしてもよい。その場合、各ブロックまたは一部のブロックが行う処理を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませて、コンピュータに実行させるようにしてもよい。

　なお、「コンピュータ」とは、ＯＳや周辺機器等のハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵または外部に接続されるハードディスク等の記憶装置である。

　さらに「コンピュータで読み取り可能な記録媒体」は、インターネット等のネットワークや電話回線等の通信回線を介して取得されるプログラムを含み、短時間だけ保持されるプログラム、動的に保持されるプログラム、なども含まれる。

　また、サーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものを含んでもよい。また、プログラムは、前述した構成要素の一部を実現するためのものであってもよく、さらに前述した構成要素をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。

　また、プログラムは、ＰＬＤ（Programmable Logic Device）やＦＰＧＡ（Field Programmable Gate Array）等のハードウェアを用いて実現されるものであってもよい。

　以上説明したように、本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムは、時間的に相関の高いパラメータを入力情報として補助情報を生成し、補助情報からターゲットとなる未来の通信情報を出力する機械学習モデルを訓練して生成することにより、通信情報の予測を高精度に行うことができる。

　なお、本発明の実施形態について図面を参照して説明してきたが、具体的な構成は上述の実施形態に限られるものではなく、本発明の基本的な特徴を逸脱しない範囲の設計等も含まれる。

１００・・・無線通信システム；１０１・・・基地局装置；１０２・・・端末装置；２０１・・・ＮＷ部；２０２・・・通信部；２０３・・・通信環境モデル生成部；２０４・・・環境情報生成部；２０５・・・モデル利用部；３０１・・・通信部；３０２・・・通信環境モデル生成部；３０３・・・環境情報生成部；３０４・・・モデル利用部；４０１・・・通信環境モデル；５０１・・・第１の機械学習ブロック；５０２・・・第２の機械学習ブロック；５０２’・・・第２’の機械学習ブロック；５０３・・・補助情報出力；５０４・・・ターゲット情報出力

Claims

　移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測装置において、
　前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成部と、
　前記端末装置の無線通信に係る通信情報を生成する通信部と、
　前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成部と、
　前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用部と
　を有することを特徴とする通信情報予測装置。
　請求項１記載の通信情報予測装置において、
　前記環境情報は、前記端末装置および前記端末装置の無線通信先の装置の位置、姿勢、状態、動き、制御指令、前記端末装置またはネットワークに接続されたカメラおよびセンサの情報、端末やネットワークの行動戦略に関する情報、の少なくとも一つの情報を含む
　ことを特徴とする通信情報予測装置。
　請求項１または請求項２に記載の通信情報予測装置において、
　前記通信環境モデル生成部は、
　前記入力情報、補助情報、およびターゲット情報を教師データとして用い、入力情報を通信環境モデルに入力した際に生成される補助情報の出力とターゲット情報の出力を、前記教師データの補助情報とターゲット情報と比較して、その間の誤差から、より精度の高い前記補助情報と前記ターゲット情報を生成するように機械学習ブロックの係数を更新する訓練を行って、前記通信環境モデルを生成する
　ことを特徴とする通信情報予測装置。
　請求項３に記載の通信情報予測装置において、
　前記補助情報は、前記入力情報の少なくとも一部の情報の時間的に未来に対応するものを含むこととする
　ことを特徴とする通信情報予測装置。
　請求項１から請求項４のいずれか一項に記載の通信情報予測装置において、
　前記通信環境モデルは、
　異なる前記入力情報に対して、ターゲット情報の未来の時間に対応する環境情報を、前記補助情報として出力する第１の機械学習ブロックと、
　前記補助情報または前記補助情報と入力情報から、未来の時間の前記通信情報をターゲット情報として生成する第２の機械学習ブロックと
　を有することを特徴とする通信情報予測装置。
　請求項５に記載の通信情報予測装置において、
　前記第２の機械学習ブロックは、
　非通信情報である前記環境情報と前記通信情報とに分けて扱い、未来の時間の前記通信情報を第２の補助情報として出力する機械学習ブロックを有する
　ことを特徴とする通信情報予測装置。
　移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測方法であって、
　前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、
　前記端末装置の無線通信に係る通信情報を生成する通信処理と、
　前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、
　前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理と
　を行うことを特徴とする通信情報予測方法。
　移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測するコンピュータで実行可能な通信情報予測プログラムであって、
　前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、
　前記端末装置の無線通信に係る通信情報を生成する通信処理と、
　前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、
　前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理と
　をコンピュータで実行することを特徴とする通信情報予測プログラム。