JP7505569B2 - 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム - Google Patents

通信情報予測装置、通信情報予測方法、および通信情報予測プログラム Download PDF

Info

Publication number
JP7505569B2
JP7505569B2 JP2022556754A JP2022556754A JP7505569B2 JP 7505569 B2 JP7505569 B2 JP 7505569B2 JP 2022556754 A JP2022556754 A JP 2022556754A JP 2022556754 A JP2022556754 A JP 2022556754A JP 7505569 B2 JP7505569 B2 JP 7505569B2
Authority
JP
Japan
Prior art keywords
information
communication
auxiliary
input
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022556754A
Other languages
English (en)
Other versions
JPWO2022079833A1 (ja
Inventor
理一 工藤
馨子 高橋
友規 村上
匡史 岩渕
陸 大宮
智明 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2022079833A1 publication Critical patent/JPWO2022079833A1/ja
Application granted granted Critical
Publication of JP7505569B2 publication Critical patent/JP7505569B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/18Network planning tools
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W64/00Locating users or terminals or network equipment for network management purposes, e.g. mobility management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

本発明は、環境情報を用いて予測モデルを生成し、無線通信システムの未来の通信情報を予測する技術に関する。
近年、様々な装置がインターネットにつながるIoT(Internet of Things)の実現が進んでおり、自動車、ドローン、建設機械車両など様々な機器が無線により接続されつつある。また、IEEE802.11規格の無線LAN(Local Area Network)、Bluetooth(登録商標)、LTE(Long Term Evolution)や5Gによるセルラー通信、IoT向けのLPWA(Low Power Wide Area)通信、車通信に用いられるETC(Electronic Toll Collection System)、VICS(Vehicle Information and Communication System(登録商標))、ARIB-STD-T109など、多種多様な無線通信規格が展開され、様々な無線通信サービスが広く利用されている。
しかしながら、無線通信サービスによっては、通信品質の要求条件を必ずしも満たすことができない、という問題がある。特に端末装置や周辺のオブジェクトが動く場合、アンテナの指向性や伝搬環境が変動するため、通信品質が大きな影響を受ける。例えば非特許文献1では、移動するロボットと基地局装置との間の距離情報を用いて無線通信の予測モデルを生成し、通信品質を予測する技術が検討されている。
C.J.Lowrance, A.P.Lauf,"An active and incremental learning framework for the online prediction of link quality in robot networks",Engineering Applications of Artificial Intelligence,77,pp.197-211,2019.
無線通信システムでは、無線通信機能が搭載された端末装置の位置、姿勢および動きなどの端末装置の状態、端末装置周辺の静的または動的な物体、などにより、通信相手との間の電波伝搬環境が変化して通信品質が影響を受け、無線通信により実現されるサービスやシステムに大きな影響を及ぼすことがある。例えば、高い周波数を用いる場合は電波の直進性が強く、通信品質は電波伝搬環境の変化による影響を受けやすい。このため、端末装置の安定した通信や通信品質をより高度に管理するには、端末装置自身と端末装置の周辺環境による通信品質の変動に対する対策が必要である。
この対策として、機械学習を用いた通信品質と環境情報の関係性をモデル化し、未来の通信品質を予測する技術は、良好な通信品質を維持する上で有用な手段の一つである。
ところが、通信に関する情報は時間的な相関が低く、例えば1秒後の通信環境が全く異なる場合が少なくないため、通信品質や、通信品質を高めるための制御方法を高精度に予測することが難しいという課題がある。以下、通信品質や通信品質を高めるための通信や端末装置の制御情報を通信情報と定義する。
上記課題に鑑み、本発明は、ターゲット情報となる未来の通信情報の時間に対応する補助情報を生成し、補助情報または補助情報と入力情報からターゲットとなる未来の時間の通信情報を出力する機械学習モデルを訓練して生成することにより、未来の通信情報の予測を高精度に行うことができる通信情報予測装置、通信情報予測方法、および通信情報予測プログラムを提供することを目的とする。
本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測装置において、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成部と、前記端末装置の無線通信に係る通信情報を生成する通信部と、前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成部と、前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用部とを有することを特徴とする。
また、本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測方法であって、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、前記端末装置の無線通信に係る通信情報を生成する通信処理と、前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理とを行うことを特徴とする。
また、本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測するコンピュータで実行可能な通信情報予測プログラムであって、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、前記端末装置の無線通信に係る通信情報を生成する通信処理と、前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理とをコンピュータで実行することを特徴とする。
本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムは、時間的に相関の高いパラメータを入力情報として補助情報を生成し、補助情報からターゲットとなる未来の時間の通信情報を出力する機械学習モデルを訓練して生成することにより、通信情報の予測を高精度に行うことができる。
無線通信システムの構成例を示す図である。 通信情報に関するパラメータと環境情報に係るパラメータの関係を示す図である。 通信環境モデル生成部を訓練する場合の構成例を示す図である。 訓練時の通信環境モデルの一例を示す図である。 利用時の通信環境モデルの一例を示す図である。 自律移動ロボットの一例を示す図である。 自律移動ロボットが認識する屋内マップとゴールの位置を示す図である。 比較例の通信環境モデルの一例を示す図である。 第1の構成の通信環境モデルの一例を示す図である。 第2の構成の通信環境モデルの一例を示す図である。 実証実験における性能評価の結果を示す図である。
以下、図面を参照して本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムの実施形態について説明する。なお、以下に説明する実施形態は本発明の一例であり、本発明は以下の実施形態に制限されるものではない。
図1は、無線通信システム100の構成例を示す。無線通信システム100は、基地局装置101、基地局装置101と無線通信を行うM台(Mは正の整数)の端末装置102(1)から102(M)で構成されている。ここで、M台の端末装置102(1)から102(M)に共通する説明を行う場合は、符号末尾の(番号)を省略して端末装置102と記載する。なお、端末装置102を構成する複数の同じブロックに対しても同様に記載する。
図1の例では、基地局装置101およびM台の端末装置102の全てが本発明に係る通信情報予測装置としての機能を有し、通信情報の予測を行うための通信環境モデルを生成し、通信情報予測を行うことができる。
なお、本実施形態では、基地局装置101を介してネットワークに接続する構成として説明するが、基地局装置101とは別にネットワークに接続可能な通信装置を有していてもよい。そして、端末装置102は、基地局装置101またはネットワークに接続可能な通信装置を介して、ネットワークに接続されたカメラやセンサを搭載する機器(基地局装置101を含むアクセスポイントや周辺路上の監視カメラなど)からカメラ情報やセンサ情報などの非通信情報を環境情報として収集することができる。また、端末装置102は、他の端末装置102と直接、通信を行って端末装置102に搭載されたカメラ/センサからカメラ情報やセンサ情報を収集してもよい。例えば端末装置102が自動車に搭載された通信装置の場合、車車間通信(車対車間の通信)により、カメラ情報やセンサ情報(位置情報などを含む)が収集される。このようにして、ターゲットとする基地局装置101と端末装置102との間の無線通信のモデルを機械学習により生成するための環境情報が収集される。そして、形成された通信環境モデルを用いて基地局装置101と端末装置102との間の通信情報の予測が行われる。
特に、以降で説明する実施形態では、時間的な相関の高いパラメータを入力情報として一旦、補助情報を生成して機械学習を行うことにより、精度の高い通信情報の予測を行うことができる。ここで、補助情報は、未来の通信情報(例えば受信電力など)に対応する環境情報のパラメータであり、ターゲット情報の予測に利用可能な非通信情報である。
(基地局装置101の構成例)
図1において、基地局装置101は、ネットワークに接続する機能を有し、M台の端末装置102との間で無線通信を行う。基地局装置101は、NW部201、通信部202(1)から通信部202(N)、通信環境モデル生成部203、環境情報生成部204およびモデル利用部205を有する。
NW部201は、外部のネットワークに接続するためのインターフェースである。基地局装置101は、NW部201を介して、外部のネットワークに接続されるカメラやセンサなどの装置からカメラ情報(撮影画像など)やセンサ情報(三次元レーザなど)を取得することができる。これらの情報は、基地局装置101に接続される端末装置102も取得可能である。
通信部202は、通信部202(1)から通信部202(N)までのN個(Nは正の整数)を有し、複数の端末装置102との間で無線通信を行うことができる(通信処理)。また、通信部202は、無線通信に関係する通信情報を生成し、通信環境モデル生成部203およびモデル利用部205に出力する。通信情報は、例えば、受信信号電力、信号対雑音電力比(SNR)、信号対干渉雑音電力比(SINR)、RSSI(Received Signal Strength Indication)、RSRQ(Received Signal Reference Quality)、パケット誤り率、到達ビット数、単位時間当たりの到達ビット数、MCS(Modulation and Coding Scheme index)、再送回数、遅延時間、誤り訂正方式、通信システムの周波数、利用するリソースの帯域幅などの周波数条件、などである。さらに、これらの値の微分情報、これらの値から計算式を用いて算出される指標、これらの指標に影響を与えるシステムの設定項目などであってもよい。
通信環境モデル生成部203は、環境情報生成部204が生成する環境情報と、通信部202(1)から通信部202(N)、通信部301(1)から通信部301(M)のうち少なくとも一つが生成する通信情報と、を用いて、通信情報を予測するための通信環境モデルを生成する(通信環境モデル生成処理)。なお、通信環境モデルの生成方法については後述する。
環境情報生成部204は、装置環境に係る環境情報を生成する(環境情報生成処理)。環境情報は、端末装置102および基地局装置101の位置/姿勢/状態/動き/制御指令/端末装置102および基地局装置101またはネットワークを介して取得可能な機器のカメラ情報およびセンサ情報(物体の有無、サイズ、材質など様々な情報を含む)/構造物の動作/端末装置102およびネットワークの行動戦略、などの少なくとも一つの情報を含む。
ここで、制御指令は、例えば、端末装置102が自律移動ロボットである場合、ロボット正面方向へのタイヤ回転指令、ロボットの回転指令などに対応する。また、端末装置102およびネットワークの行動戦略は、例えば、端末装置102やロボットの予定移動経路、端末装置102の電力モード、端末装置102が利用するアンテナ数、端末装置102へのQoS設定、ネットワークの経路設定、ネットワークの混雑状況、ネットワークにおけるルーティングルール、アプリケーションの設定、などである。
さらに、環境情報は、端末装置102の所有者情報やタイプ(スマートフォンなどの携帯端末、自動車、ロボット、ドローンなど)の情報、入店者情報、自動車の移動履歴、など、通信環境モデルでターゲット情報を予測するために使えるのではないかと思われる全ての非通信情報を含む情報であってもよい。環境情報が多いほど、通信環境モデルの予測精度が向上する。
モデル利用部205は、通信環境モデル生成部203により生成された通信環境モデルを用いて、ターゲット情報の出力、または報酬を最大化するような戦略情報の出力を行う(モデル利用処理)。例えば、端末装置102が自律移動ロボットの場合、受信電力を最大化することに報酬を設定し、報酬が高くなるようなX座標速度、Y座標速度、回転指令などを戦略情報として出力することができる。なお、モデル利用部205の動作については後述する。
このようにして、基地局装置101が通信情報予測装置として機能する場合、通信環境モデル生成部203は、環境情報生成部204から得られた環境情報と、通信部202から得られる通信情報と、を用いて、通信環境モデルを生成する。そして、モデル利用部205は、通信環境モデル生成部203が生成した通信環境モデルを用いて、通信情報を予測することができる。
(端末装置102の構成例)
端末装置102(1)から端末装置102(M)は、それぞれ基地局装置101との間で無線通信を行う。
端末装置102は、通信部301、通信環境モデル生成部302、環境情報生成部303およびモデル利用部304を有する。
通信部301は、基地局装置101の通信部202、または他の端末装置102との間で無線通信を行う(通信処理)。また、通信部301は、基地局装置101の通信部202と同様に、無線通信に関係する通信情報を生成し、通信環境モデル生成部302およびモデル利用部304に出力する。
通信環境モデル生成部302は、基地局装置101の通信環境モデル生成部203と同様に、環境情報生成部303から得られた環境情報と、通信部301から得られる通信情報と、を用いて通信環境モデルを生成する(通信環境モデル生成処理)。
環境情報生成部303は、基地局装置101の環境情報生成部204と同様に、環境情報を生成する(環境情報生成処理)。なお、通信環境モデルの生成方法については後述する。
モデル利用部304は、基地局装置101のモデル利用部205と同様に、通信環境モデル生成部302により生成された通信環境モデルを用いて、ターゲット情報の出力、または報酬を最大化するような戦略情報の出力を行う(モデル利用処理)。
このようにして、端末装置102が通信情報予測装置として機能する場合、通信環境モデル生成部302は、環境情報生成部303から得られた環境情報と、通信部301から得られる通信情報と、を用いて、通信環境モデルを生成する。そして、モデル利用部304は、通信環境モデル生成部302が生成した通信環境モデルを用いて、通信情報を予測することができる。
ここで、上述の説明では、基地局装置101と端末装置102とに分けて説明したが、基地局装置101と端末装置102との間で機能を分担してもよい。例えば、通信環境モデル生成部203で生成された通信環境モデルを各端末装置102のモデル利用部304が利用するようにしてもよい。
(通信環境モデル生成部)
次に、基地局装置101の通信環境モデル生成部203および端末装置102の通信環境モデル生成部302について詳しく説明する。なお、ここでは、基地局装置101の通信環境モデル生成部203として説明するが、端末装置102の通信環境モデル生成部302についても基本的な動作は同じである。
基地局装置101の通信環境モデル生成部203は、複数の端末装置102との間の無線通信における通信情報および環境情報を収集して多くの訓練データを用いることができるので、端末装置102の通信環境モデル生成部302よりも望ましい。しかし、端末装置102ごとに最適化されたモデルとなるように転移学習やファインチューニングなどの技術で調整することが可能である。
通信環境モデルは、環境情報、または、環境情報および通信情報を入力情報として、同じ時間または未来の時間におけるターゲット情報を出力するように、生成されるモデルである。通信環境モデルは、出力の値が高精度となるように、生成されてもよいし、出力値とは異なるあるパラメータを最大化するように強化学習により生成されてもよい。
例えば、未来の時間の受信電力を通信環境モデルにより出力する場合には、未来の時間の受信電力をターゲット情報のパラメータとして訓練データを形成し、通信環境モデルの出力となる受信電力の予測値と実際の受信電力との誤差が少なくなるように、通信環境モデルが生成される。あるいは、端末装置102が自律移動ロボットである場合、受信電力を最大化するように、ロボットのX座標速度、Y座標位置速度、回転指令を出力させるために、強化学習により、受信電力を最大化することに報酬を設定し、報酬が高くなるようなX座標速度、Y座標速度、回転指令を出力するように通信環境モデルが生成される。
通信環境モデルをできるだけ多くの訓練データにより生成するためには、できるだけ共通して利用できるデータを増やして、モデルの生成を行う方が高い特性が得られると想定される。一方、通信システムは一般に広い帯域幅が利用可能であり、その中の周波数チャネルの利用方法も通信システムにより様々なものが存在する。通信システムの設定値ごとに独立の通信環境モデルを生成すれば、訓練に要するデータ量が十分に得られないなどの問題が生じる。従って、できるだけ多くのデータを用いた共通の通信環境モデルとすることが望ましい。
図2は、通信情報に関するパラメータと環境情報に係るパラメータの関係を示す。図2において、縦軸は時間を示し、t-NはNスロット過去の時間、tは現在、tはMスロット未来の時間を表す。ここで、スロットとは、任意の時間幅での区切りを表し、無線通信のシンボル間隔と考えてもよいし、環境情報が得られる周期と考えてもよい。
図2に示すように、一般に、環境情報は時間的な相関が高いが、通信情報は時間的な相関が低い。映像や位置情報などの環境情報は、物理的な環境における情報なので時間的な相関が高い。例えば1秒間で物体が動作する範囲は限られているため、現在と過去の情報から1秒後の映像や物体の位置などの状態を高精度に予測することが可能である。
一方、受信電力などの通信情報は、1秒後の通信環境が全く異なるものになることが少なくない。例えば、移動する端末装置の通信状態が伝搬特性の変動などにより急激に悪化することがある。このため、実際の無線通信システムでは、パイロット信号を使ったチャネル情報の取得をマイクロ秒オーダーの短い間隔で実施しており、数十ミリ秒未来の時間の通信情報の予測は困難となる。
このように、未来の通信情報に関するパラメータを予測するアルゴリズムでは、先ず時間的に相関の高いパラメータを用いて未来の予測すべき時間における情報を生成した後、当該情報を通信情報に変換することが有効であると考えられる。
そこで、本実施形態では、時間的に相関の高いパラメータを用いて補助情報を一旦生成し、補助情報を用いて通信情報を予測する通信環境モデルを生成する。
図2において、未来の時間tにおける通信情報に関するパラメータを予測するために、現在および過去の通信情報を用いた場合、時間的な相関が低いので、推定精度が低くなるという問題がある。
このため、本実施形態では、未来の時間tにおける通信情報を得るために、現在時間tから未来の時間tの間の任意の時間の環境情報または通信情報を補助情報として生成し、さらに生成した補助情報を用いて、時間tにおける通信情報に関するパラメータを予測することにより、推定精度を高めることができる。
図3は、通信環境モデル生成部203を訓練する場合の構成例を示す。なお、ここでは、基地局装置101の通信環境モデル生成部203として説明するが、端末装置102の通信環境モデル生成部302の場合も同様である。
モデル訓練時には、通信環境モデル生成部203は、訓練データを用いて、通信環境モデル401を生成する。訓練データは、入力情報、ターゲット情報および補助情報からなる。入力情報は、環境情報のみ、または環境情報および通信情報の両方からなる。ターゲット情報は、通信情報または通信情報のパラメータを最大化する制御に関するパラメータからなる。制御に関するパラメータとは、端末装置102の動き、基地局装置101の動き、物理層からアプリケーション層までのOSI参照モデルにおけるモード/通信宛先/通信経路/通信方式などの制御、電波伝搬環境に影響を与える構造物/メタマテリアル/誘電体の位置・動き・設定の制御、などが挙げられる。補助情報は、ターゲットとなる出力と同じ時間の情報である環境情報と通信情報の中から選択された任意のパラメータからなる。
ここで、入力情報は、通信環境モデル401の利用時にも入力され、ターゲット情報を出力するために必要な情報である。また、補助情報は、訓練時には入力されるが、通信環境モデル401の利用時には入力されず、通信環境モデル生成部203の内部で用いられる情報である。
なお、入力情報として、図2で説明したように、時間的な相関が高い環境情報の使用が想定される。通信情報は時間的な相関が低い傾向にあるが、時間的な相関が高い通信情報のパラメータを選択して入力情報として用いてもよい。例えば、過去の時間tと現在の時間tとの間隔が短い場合、通信情報の時間的な相関はある程度得られる考えることができる。
このようにして、通信環境モデル生成部203(または通信環境モデル生成部302)は、通信環境モデル401を生成することができる。
図4は、訓練時の通信環境モデル401の一例を示す。図4において、訓練データとして、利用時に用いる入力情報と、利用時には入力されないがモデルの訓練に利用する補助情報と、利用時に出力するターゲット情報を、教師データとして利用する。なお、機械学習アルゴリズムとして、ニューラルネットワーク、決定木、ランダムフォレスト、など任意のアルゴリズムが利用可能である。
図4において、通信環境モデル401は、第1の機械学習ブロック501および第2の機械学習ブロック502を有する。なお、第1の機械学習ブロック501および第2の機械学習ブロック502は、それぞれ複数具備されていてもよい。
第1の機械学習ブロック501は、入力情報が入力されると、予め決められた機械学習のアルゴリズムを用い、補助情報を含む情報を出力する。訓練時には、第1の機械学習ブロック501から出力された補助情報は、補助情報出力503において、既知の訓練データの補助情報と比較される。例えば第1の機械学習ブロック501から出力される補助情報と、訓練データの補助情報との誤差(例えばMSE(Mean square error))を求め、より精度の高い補助情報が出力されるように、第1の機械学習ブロック501内のアルゴリズムの係数が更新される。このようにして、第1の機械学習ブロック501は、より精度の高い補助情報が得られるように訓練される。この補助情報は、ターゲット情報が対応する未来の時間の環境情報とすることで、第2の機械学習ブロック502は、補助情報とターゲット情報の時間差の小さい関係性を学習できる。つまり、入力情報に含まれる時間tまでの環境情報を用い、同じ種類の情報であるが、それより未来の時間tの環境情報を補助情報として用いることができる。この場合、訓練データは、入力信号の少なくとも一部の時系列データを、時間的に未来にシフトしたものを補助情報として用いることができるため、時系列で訓練データが得られている場合、同じデータから入力情報と補助情報を得ることができるメリットもある。
第2の機械学習ブロック502は、第1の機械学習ブロック501が補助情報出力503を介して出力する補助情報を少なくとも含む入力情報に基づいて、ターゲット情報を出力する。なお、第2の機械学習ブロック502は、補助情報に加えて、第1の機械学習ブロック501を介して入力情報を入力するようにしてもよい。訓練時には、第2の機械学習ブロック502から出力されたターゲット情報は、ターゲット情報出力504において、既知の訓練データのターゲット情報と比較される。例えば第2の機械学習ブロック502から出力されるターゲット情報と、訓練データのターゲット情報との誤差(例えばMSE)を求め、より精度の高いターゲット情報が出力されるように、第2の機械学習ブロック502内のアルゴリズムの係数が更新される。このようにして、第2の機械学習ブロック502は、より精度の高いターゲット情報が得られるように訓練される。
なお、第1の機械学習ブロック501および第2の機械学習ブロック502がニューラルネットワークで構成されている場合には、補助情報やターゲット情報に対する誤差に基づいて、それぞれバックプロパゲーションにより、ニューラルネットワーク内の係数(重みおよびバイアス)が更新され、第1の機械学習ブロック501および第2の機械学習ブロック502がより正確な補助情報およびターゲット情報を出力できるように訓練される。このとき、ターゲット情報に対するバックプロパゲーションは、第1の機械学習ブロック501と第2の機械学習ブロック502の両方の係数を更新するように訓練してもよいし、第2の機械学習ブロック502のみを訓練するようにしてもよい。
このように、機械学習ブロックの係数を更新することにより、図2で説明した時間的な相関の低い通信情報からターゲット情報を出力するのではなく、第1の機械学習ブロック501により、ターゲット情報と同じ時間軸(t)における環境情報や通信情報を補助情報として用い、補助情報を高精度に入力情報から生成できるように通信環境モデル401を訓練することが可能である。これにより、ターゲット情報の精度が向上され、強化学習による訓練で設定された通信情報の任意のパラメータを最大化するようなターゲット情報の出力が可能になる。
図5は、利用時の通信環境モデル401の一例を示す。通信環境モデル生成部203は、図4で説明した訓練時とは異なり、入力情報を入力してターゲット情報を出力する。
図5において、通信環境モデル401は、第1の機械学習ブロック501および第2の機械学習ブロック502を有する。なお、第1の機械学習ブロック501および第2の機械学習ブロック502は、それぞれ複数具備されていてもよい。
第1の機械学習ブロック501は、図4の訓練時とは異なり、入力情報から補助情報を生成し、補助情報を第2の機械学習ブロック502に出力する。ここで、補助情報は、図4に示した訓練時に強化学習された精度の高い補助情報である。
第2の機械学習ブロック502は、第1の機械学習ブロック501から出力される補助情報を少なくとも含む入力に基づいて、ターゲット情報を出力する。ここで、ターゲット情報は、図4に示した訓練時に強化学習された精度の高いターゲット情報である。
このようにして、通信環境モデル401は、通信情報の予測を精度高く行うことができる。特に、ターゲット情報と同じ時間における環境情報や通信情報を補助情報として用い、補助情報を高精度に入力情報から生成できるように訓練された通信環境モデルを用いるので、精度の高いターゲット情報を得ることができる。
[実証実験]
実施形態の効果を実証するために行った実験とその結果について説明する。
実験に用いた移動する端末装置102は、パルス状に発光するレーザー照射に対する散乱)を用いたリモートセンシング技術の一つであるLIDAR("Light Detection and Ranging"または"Laser Imaging Detection and Ranging")を搭載した自律移動ロボットである。自律移動ロボットは、LIDARにより、自己の位置情報、向き情報、オドメトリ情報、及び制御指令情報を端末情報として収集することができる。
また、無線通信はIEEE802.11ac規格の無線LANを用い、0.2秒間に通信するビット量をスループットとして計測し、性能を評価するものとする。
図6は、自律移動ロボットの一例を示す。図6において、横軸はx-axis[m]、縦軸はy-axis[m]の二次元平面を示し、時刻τにおける自律移動ロボットの位置は(x[τ]、y[τ])である。自己の位置情報は、オドメトリ情報とLIDARの測定結果から、Robot OSのAMCL(Adaptive Monte Carlo Localization)のアルゴリズムにより計算される。向きは、ロボット分野の座標系で用いられるクォータニオンにより、{kz[τ]、w[τ]}={sin(θ[τ]/2)、cos(θ[τ]/2)}で表される。また、ロボットのタイヤの回転から検出されるロボットの正面方向に対する速度や回転速度などのオドメトリ情報、ロボット正面方向へ対応するタイヤ回転指令、ロボットの回転に対応する指令などの制御指令情報、などの特徴量として、オドメトリ(Vx[τ]、Vθ[τ])、制御指令情報(Ox[τ]、Oθ[τ])を用いることができる。後述の自律移動ロボットを用いた実証実験では、(x[τ]、y[τ]、kz[τ]、w[τ]、Vx[τ]、Vθ[τ]、Ox[τ]、Oθ[τ])の合計8つの特徴量のうち、すべての特徴量(8つの特徴量)を入力情報として使用する場合と、オドメトリおよび制御指令情報を除く(X[τ]、Y[τ]、kz[τ]、w[τ])の4つの特徴量を入力情報として使用する場合とについて行う。
さらに、通信情報はRSSIとスループットとを用い、RSSIは10msごとに取得し、0.2秒のタイムスロット内のRSSIの中央値をγave[τ]、分散値をγstd[τ]、スループットをC[τ]とする。
ここで、実証実験における環境情報は、ロボットから得られる、位置(X軸、Y軸)、向き、オドメトリ(自己位置推定)(X軸上の速度、Y軸上の速度、回転速度)、制御指令情報(ロボット正面方向へのタイヤ回転指令、ロボットの回転指令)、および過去のスループット(現在から過去2秒まで)を用いる。
また、時間方向には10サンプルのパラメータを用いるので、入力情報は、パラメータが4つの場合は4×10=40、パラメータが8つの場合は8×10=80となる。出力情報(ターゲット情報)は、現在時間tの1.2秒後から2秒後までを0.2秒間ウィンドウで規格化したスループットC[t-4]、C[t-3]、C[t-2]、C[t-1]、C[t]を予測する。ここで、t=t+2[sec]、t-1=t+1.8[sec]、t-2=t+1.6[sec]、t-3=t+1.4[sec]、t-4=t+1.2[sec]である。
また、訓練時には、出力されるターゲット情報のスループットC[t-4]からC[t]と、既知の訓練データのスループットC[t-4]からC[t]とを比較して誤差を算出し、誤差が最小になるように逆伝播により機械学習ブロックの係数が更新される。
なお、後述のR2スコアで評価するスループットCは、(C[t-4]+C[t-3]+C[t-2]+C[t-1]+C[t])/5として評価する。
図7は、自律移動ロボットが認識する屋内マップとゴールの位置を示す。図7に示すように、ロボットは、設置された113個のゴールの中から一つを選択して、自律移動を続ける。そして、ロボットが選択されたゴールの周辺30cmに入れば、次のゴールを再設定して、ロボットは次のゴールに向かうように設計されている。
実証実験では、深層学習により通信環境モデルを生成するため、前述の入力情報およびターゲット情報のいずれも、およそ-1から+1の分布となるように前処理を行っている。また、予測精度は、式(1)に示すR2スコアにより評価する。
Figure 0007505569000001
ここで、Cはスループットの実測値、^Cは機械学習による予測値、nはサンプル数、iはサンプル番号、Caveはスループットの予測値をそれぞれ表す。
R2スコアは機械学習による通信環境モデルがどの程度の精度でデータを予測できるかを表し、一般に、R2スコアが0.6以上で正常にモデル化ができていることを示し、R2スコアが0.7の場合はモデルの精度が高いことを示す。
図8は、比較例の通信環境モデルの一例を示す。比較例は、従来方式の通信環境モデルであり、リカレントニューラルネットワーク(RNN)と全結合層3層を用いて構成した通信環境モデルの例を示す。
図8において、環境情報(8つのパラメータ)と通信情報(2つのパラメータ)の入力情報がRNNに入力される。入力情報は、過去2秒間に0.2秒ごとの10のタイミングのパラメータを用いる。つまり、現在時間tから0.2秒ごとの過去の時間t-0.2秒、t-0.4秒、t-0.6秒、t-0.8秒、t-1.0秒、t-1.2秒、t-1.4秒、t-1.6秒、t-1.8秒、の10のタイミングのパラメータを用いる。また、RNNは、GRU(Gated Recurrent Unit)を用い、隠れ層を1、隠れ層の次元を35とする。
また、全結合層は、入力35および出力35の層が2つと、入力35および出力1の層が1つとで構成され、ターゲット情報を出力する。なお、全結合層の間にReLU(Rectified Linear Unit)による活性化層が用いられる。
図9は、本実施形態に係る第1の構成の通信環境モデル401の一例を示す。図9に示す第1の構成の通信環境モデル401は、RNNと全結合層3層を基本構造とする第1の機械学習ブロック501と第2の機械学習ブロック502とを有する。
第1の機械学習ブロック501は、RNNとして隠れ層が1、隠れ層の次元が35のGRUを用い、入力35で出力35の層が2つ、入力35で出力M(Mは正の整数)の層が1つ、を有する全結合層3層で構成され、ターゲット情報の時間tに対応するM個の補助情報を出力する。
第2の機械学習ブロック502は、RNNとして隠れ層が1、隠れ層の次元が35のGRUを用い、入力35で出力35の層が2つ、入力35で出力1の層が1つ、を有する全結合層3層で構成され、ターゲット情報を出力する。
ここで、先に述べたように、訓練時には、第1の機械学習ブロック501の出力となる補助情報が訓練データに含まれるように構成する。そして、出力される補助情報と、教師データの補助情報とを比較して、誤差が最小となるように、第1の機械学習ブロック501のニューラルネットワークの係数を更新することにより、補助情報の精度が高められる。
また、実証実験の入力情報は、先に述べたように、(X[τ]、Y[τ]、kz[τ]、w[τ])の4つの場合と、(X[τ]、Y[τ]、kz[τ]、w[τ]、Vx[τ]、Vθ[τ]、Ox[τ]、Oθ[τ])の8つの場合と、を想定する。
また、補助情報出力は、(X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]、γave[t]、γstd[t]、C[t])の11の係数を8つの時間(tM-7、tM-6、・・・、t)のサンプル分だけ生成される。つまり、補助情報出力は、tM-7、tM-6、・・・、tの時間に対応し、11×8=88の補助情報が出力される。
このようにして得られる補助情報出力の時系列データは、さらに第2の機械学習ブロック502のRNN(GRU)に入力され、全結合層3層からターゲット情報が出力される。第2の機械学習ブロック502から出力されるターゲット情報は、現在時間tの1.2秒後から2秒後までを0.2秒間ウィンドウで規格化したスループットC[tM-4]、C[tM-3]、C[tM-2]、C[tM-1]、C[t]となる。ここで、t=t+2[sec]、tM-1=t+1.8[sec]、tM-2=t+1.6[sec]、tM-3=t+1.4[sec]、tM-4=t+1.2[sec]である。
訓練時には、88の補助情報と、5つの出力情報(ターゲット情報)と、対応する訓練データのターゲット情報とを比較して、誤差が最小になるように逆伝播を実施し、第1の機械学習ブロック501のニューラルネットワークの係数を更新することにより、補助情報の精度が高められる。
図10は、本実施形態に係る第2の構成の通信環境モデル401の一例を示す。図10に示す第2の構成の通信環境モデル401は、RNNと全結合層3層を基本構造とする第1の機械学習ブロック501と第2の機械学習ブロック502とを有する。
第1の機械学習ブロック501は、図9の第1の構成と同じ構成であり、RNNとして隠れ層が1、隠れ層の次元が35のGRUを用い、入力35で出力35の層が2つ、入力35で出力M(Mは正の整数)の層が1つ、を有する全結合層3層で構成され、ターゲット情報の時間tに対応するM個の第1の補助情報を出力する。
第2の機械学習ブロック502は、図9の第1の構成と少し異なり、第2の機械学習ブロック502の中に第2’の機械学習ブロック502’を有する。第2’の機械学習ブロック502’は、入力35で出力35の層が2つ、入力35で出力1の層が1つ、を有する全結合層3層で構成され、第2の補助情報を出力する。そして、第2の補助情報は、入力37で出力35の層が1つ、入力35で出力35の層が1つ、入力35で出力1の層が1つ、を有する全結合層3層にGRUの出力とともに入力され、ターゲット情報が出力される。
図10の第2の構成においても、実証実験の入力情報は、先に述べたように、(X[τ]、Y[τ]、kz[τ]、w[τ])の4つの場合と、(X[τ]、Y[τ]、kz[τ]、w[τ]、Vx[τ]、Vθ[τ]、Ox[τ]、Oθ[τ])の8つの場合と、を想定する。
また、第1の補助情報の出力は、(X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t])の8つの係数を8つの時間(tM-7、tM-6、・・・、t)のサンプル分だけ生成される。つまり、第1の補助情報の出力は、tM-7、tM-6、・・・、tの時間に対応し、8×8=64の補助情報が出力される。
図10の第2の構成では、入力情報を非通信情報である環境情報と通信情報とに分けて扱い、先ず時間的に相関の高い環境情報を未来の時間(時間tM-7からtまで)の環境情報(第1の補助情報)に変換する。そして、未来の時間の第1の補助情報から、同じ時間の第2の補助情報として通信情報(γave[t]、γstd[t]、C[t])を出力するようにすることで、環境情報と通信情報とを時間的に相関の高い特徴量同士として訓練が実施可能である。これにより、第1の構成に比べて、ターゲット情報の精度が向上する。なお、第2の補助情報の出力は、tM-4、tM-3、・・・、tの出力時間と同様に5サンプルとする。第1の補助情報を入力する第2の機械学習ブロック502の出力と、第2’の機械学習ブロック502’が出力する第2の補助情報とに基づいて、全結合層で最後の予測が行われ、ターゲット情報が出力される。
なお、実証実験において、第2の機械学習ブロック502から出力されるターゲット情報は、現在時間tの1.2秒後から2秒後までを0.2秒間ウィンドウで規格化したスループットC[tM-4]、C[tM-3]、C[tM-2]、C[tM-1]、C[t]となる。ここで、t=t+2[sec]、tM-1=t+1.8[sec]、tM-2=t+1.6[sec]、tM-3=t+1.4[sec]、tM-4=t+1.2[sec]である。
訓練時には、64の第1の補助情報と、5つ時間の3つの特徴量に対する15の第2の補助情報と、最終出力の5つのターゲット情報との合計84の出力情報と、この出力情報に対応する訓練データの情報とを比較して誤差が最小になるように逆伝播を実施し、各機械学習ブロックの係数が更新される。
本実施形態の副次的な効果は、第1の機械学習ブロック501の入力情報を変更しても、第1の補助情報の出力を予め決めておけば、第2の機械学習ブロック502を共通に使用できることである。つまり、予測に使用できる情報が、端末装置102によってバラバラであったとしても、第1の機械学習ブロック501の第1の補助情報の出力内容を予め決めておくことで、各端末装置102は同じ補助情報が出力できる第1の機械学習ブロック501をそれぞれ有していればよい。つまり、第2の機械学習ブロック502は他の端末装置102と同じものが使える。
図11は、実証実験における性能評価の結果を示す。なお、実証実験では、先に説明した実証実験で取得された100時間分のデータに基づいて訓練を行った後、別に用意したテスト用の6時間分のデータセットにより、1秒後から2秒後までの規格化されたスループットが得られた。
図11において、入力情報として(X[t]、Y[t]、kz[t]、w[t])の4種の特徴量を入力した場合、従来方法のR2スコアが0.63395であるのに対して、本実施形態に係る第1の構成方法のR2スコアは0.641792、第2の構成方法のR2スコアは0.64338であり、R2スコアは、従来方法<第1の構成方法<第2の構成方法の順に改善されていることが確認できる。
同様に、入力情報として(X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]、Ox[t]、Oθ[t])の8種の特徴量を入力した場合、従来方法のR2スコアが0.64569であるのに対して、本実施形態に係る第1の構成方法のR2スコアは0.656097、第2の構成方法のR2スコアは0.65964であり、R2スコアは、従来方法<第1の構成方法<第2の構成方法の順に改善されていることが確認できる。
(他の実現形態)
ここで、上述した各実施形態における基地局装置101または端末装置102の各ブロックまたは一部のブロックを構成要素として行う処理をコンピュータで実行するようにしてもよい。その場合、各ブロックまたは一部のブロックが行う処理を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませて、コンピュータに実行させるようにしてもよい。
なお、「コンピュータ」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵または外部に接続されるハードディスク等の記憶装置である。
さらに「コンピュータで読み取り可能な記録媒体」は、インターネット等のネットワークや電話回線等の通信回線を介して取得されるプログラムを含み、短時間だけ保持されるプログラム、動的に保持されるプログラム、なども含まれる。
また、サーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものを含んでもよい。また、プログラムは、前述した構成要素の一部を実現するためのものであってもよく、さらに前述した構成要素をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。
また、プログラムは、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
以上説明したように、本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムは、時間的に相関の高いパラメータを入力情報として補助情報を生成し、補助情報からターゲットとなる未来の通信情報を出力する機械学習モデルを訓練して生成することにより、通信情報の予測を高精度に行うことができる。
なお、本発明の実施形態について図面を参照して説明してきたが、具体的な構成は上述の実施形態に限られるものではなく、本発明の基本的な特徴を逸脱しない範囲の設計等も含まれる。
100・・・無線通信システム;101・・・基地局装置;102・・・端末装置;201・・・NW部;202・・・通信部;203・・・通信環境モデル生成部;204・・・環境情報生成部;205・・・モデル利用部;301・・・通信部;302・・・通信環境モデル生成部;303・・・環境情報生成部;304・・・モデル利用部;401・・・通信環境モデル;501・・・第1の機械学習ブロック;502・・・第2の機械学習ブロック;502’・・・第2’の機械学習ブロック;503・・・補助情報出力;504・・・ターゲット情報出力

Claims (8)

  1. 移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測装置において、
    前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成部と、
    前記端末装置の無線通信に係る通信情報を生成する通信部と、
    前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成部と、
    前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用部と
    を有し、
    前記通信環境モデルは、
    異なる前記入力情報に対して、ターゲット情報の未来の時間に対応する環境情報を、前記補助情報として出力する第1の機械学習ブロックと、
    前記補助情報または前記補助情報と入力情報から、未来の時間の前記通信情報をターゲット情報として生成する第2の機械学習ブロックと
    を有することを特徴とする通信情報予測装置。
  2. 請求項に記載の通信情報予測装置において、
    前記通信環境モデル生成部は、
    前記入力情報、および前記補助情報を教師データとして用い、前記入力情報を前記第1の機械学習ブロックに入力した際に生成される前記補助情報の出力を、前記教師データの補助情報と比較して、その間の誤差から、より精度の高い前記補助情報を生成するように前記第1の機械学習ブロックの係数を更新する訓練を行い、かつ、
    前記補助情報または前記補助情報と前記入力情報、および前記ターゲット情報を教師データとして用い、前記補助情報または前記補助情報と前記入力情報を前記第2の機械学習ブロックに入力した際に生成される前記ターゲット情報の出力を、前記教師データのターゲット情報と比較して、その間の誤差から、より精度の高い前記ターゲット情報を生成するように前記第2の機械学習ブロックの係数を更新する訓練を行って、前記通信環境モデルを生成する
    ことを特徴とする通信情報予測装置。
  3. 請求項に記載の通信情報予測装置において、
    前記補助情報は、前記入力情報の少なくとも一部の情報の時間的に未来に対応するものを含むこととする
    ことを特徴とする通信情報予測装置。
  4. 請求項1から請求項3のいずれか一項に記載の通信情報予測装置において、
    前記第2の機械学習ブロックは、
    非通信情報である前記環境情報と前記通信情報とに分けて扱い、未来の時間の前記通信情報を第2の補助情報として出力する機械学習ブロックを有する
    ことを特徴とする通信情報予測装置。
  5. 移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測方法であって、
    前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、
    前記端末装置の無線通信に係る通信情報を生成する通信処理と、
    前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、
    前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理と
    を行い、
    前記通信環境モデルは、
    異なる前記入力情報に対して、ターゲット情報の未来の時間に対応する環境情報を、前記補助情報として出力する第1の機械学習ブロックと、
    前記補助情報または前記補助情報と入力情報から、未来の時間の前記通信情報をターゲット情報として生成する第2の機械学習ブロックと
    を有することを特徴とする通信情報予測方法。
  6. 請求項5に記載の通信情報予測方法において、
    前記通信環境モデル生成処理では、
    前記入力情報、および前記補助情報を教師データとして用い、前記入力情報を前記第1の機械学習ブロックに入力した際に生成される前記補助情報の出力を、前記教師データの補助情報と比較して、その間の誤差から、より精度の高い前記補助情報を生成するように前記第1の機械学習ブロックの係数を更新する訓練を行い、かつ、
    前記補助情報または前記補助情報と前記入力情報、および前記ターゲット情報を教師データとして用い、前記補助情報または前記補助情報と前記入力情報を前記第2の機械学習ブロックに入力した際に生成される前記ターゲット情報の出力を、前記教師データのターゲット情報と比較して、その間の誤差から、より精度の高い前記ターゲット情報を生成するように前記第2の機械学習ブロックの係数を更新する訓練を行って、前記通信環境モデルを生成する
    ことを特徴とする通信情報予測方法。
  7. 移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測するコンピュータで実行可能な通信情報予測プログラムであって、
    前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、
    前記端末装置の無線通信に係る通信情報を生成する通信処理と、
    前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、
    前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理と
    をコンピュータで実行し、
    前記通信環境モデルは、
    異なる前記入力情報に対して、ターゲット情報の未来の時間に対応する環境情報を、前記補助情報として出力する第1の機械学習ブロックと、
    前記補助情報または前記補助情報と入力情報から、未来の時間の前記通信情報をターゲット情報として生成する第2の機械学習ブロックと
    を有することを特徴とする通信情報予測プログラム。
  8. 請求項7に記載の通信情報予測プログラムにおいて、
    前記通信環境モデル生成処理では、
    前記入力情報、および前記補助情報を教師データとして用い、前記入力情報を前記第1の機械学習ブロックに入力した際に生成される前記補助情報の出力を、前記教師データの補助情報と比較して、その間の誤差から、より精度の高い前記補助情報を生成するように前記第1の機械学習ブロックの係数を更新する訓練を行い、かつ、
    前記補助情報または前記補助情報と前記入力情報、および前記ターゲット情報を教師データとして用い、前記補助情報または前記補助情報と前記入力情報を前記第2の機械学習ブロックに入力した際に生成される前記ターゲット情報の出力を、前記教師データのターゲット情報と比較して、その間の誤差から、より精度の高い前記ターゲット情報を生成するように前記第2の機械学習ブロックの係数を更新する訓練を行って、前記通信環境モデルを生成する
    ことを特徴とする通信情報予測プログラム。
JP2022556754A 2020-10-14 2020-10-14 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム Active JP7505569B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/038787 WO2022079833A1 (ja) 2020-10-14 2020-10-14 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム

Publications (2)

Publication Number Publication Date
JPWO2022079833A1 JPWO2022079833A1 (ja) 2022-04-21
JP7505569B2 true JP7505569B2 (ja) 2024-06-25

Family

ID=81208953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022556754A Active JP7505569B2 (ja) 2020-10-14 2020-10-14 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム

Country Status (2)

Country Link
JP (1) JP7505569B2 (ja)
WO (1) WO2022079833A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018026728A (ja) 2016-08-10 2018-02-15 Kddi株式会社 通信品質予測装置、ロボット、通信品質予測方法、及びプログラム
JP2020144720A (ja) 2019-03-08 2020-09-10 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018026728A (ja) 2016-08-10 2018-02-15 Kddi株式会社 通信品質予測装置、ロボット、通信品質予測方法、及びプログラム
JP2020144720A (ja) 2019-03-08 2020-09-10 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
工藤 理一,機械学習が切り開くスマートコネクテッドデバイスによる次世代無線通信システムの可能性,電子情報通信学会技術研究報告 Vol.119 No.183,日本,一般社団法人電子情報通信学会,2019年08月20日
工藤 理一,移動ロボットによる無線LAN通信品質予測,電子情報通信学会技術研究報告 Vol.119 No.406,日本,一般社団法人電子情報通信学会,2020年01月23日

Also Published As

Publication number Publication date
WO2022079833A1 (ja) 2022-04-21
JPWO2022079833A1 (ja) 2022-04-21

Similar Documents

Publication Publication Date Title
Thrane et al. Deep learning-based signal strength prediction using geographical images and expert knowledge
Zhan et al. Energy minimization for cellular-connected UAV: From optimization to deep reinforcement learning
US12028788B2 (en) Communication system and base station
US12034495B2 (en) System, device, method and program that predict communication quality
US11234141B2 (en) Parameter selection for network communication links using reinforcement learning
US20220352995A1 (en) Communication system and terminal
US11576057B2 (en) Operation of sectorized communications from aerospace platforms using reinforcement learning
Ali et al. Orientation-assisted beam management for beyond 5G systems
Marasinghe et al. LiDAR aided human blockage prediction for 6G
Lin et al. Reinforcement learning based UAV trajectory and power control against jamming
WO2016001473A1 (en) System and method for radio and other parameter estimation based on maps
Fontanesi et al. A transfer learning approach for UAV path design with connectivity outage constraint
JP7505569B2 (ja) 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム
JP7439948B2 (ja) 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム
CN116669089A (zh) 经由信道聚合预测服务质量
Salem et al. Data-driven Integrated Sensing and Communication: Recent Advances, Challenges, and Future Prospects
JP7439947B2 (ja) 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム
Al Saadi et al. Ground Level Mobile Signal Prediction Using Higher Altitude UAV Measurements and ANN
Lee et al. Deep Reinforcement Learning for Time Allocation and Directional Transmission in Joint Radar-Communication
US11916612B2 (en) Mobile terminal and communication quality prediction method
JP7502682B2 (ja) 情報出力システム、情報出力方法、推定装置、およびプログラム
Ali et al. A Comprehensive Review of Radio Signal Propagation Prediction for Terrestrial Wireless Communication Systems
Yapar et al. On the Effective Usage of Priors in RSS-based Localization
Nikolov Adaptive Uplink Data Rate Prediction and NetworkSelection in a Vehicular Mobile Channel
Zhang Data Harvesting and Path Planning in UAV-aided Internet-of-Things Wireless Networks with Reinforcement Learning: KTH Thesis Report

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240527