WO2022079833A1 - 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム - Google Patents

通信情報予測装置、通信情報予測方法、および通信情報予測プログラム Download PDF

Info

Publication number
WO2022079833A1
WO2022079833A1 PCT/JP2020/038787 JP2020038787W WO2022079833A1 WO 2022079833 A1 WO2022079833 A1 WO 2022079833A1 JP 2020038787 W JP2020038787 W JP 2020038787W WO 2022079833 A1 WO2022079833 A1 WO 2022079833A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
communication
terminal device
environment model
auxiliary
Prior art date
Application number
PCT/JP2020/038787
Other languages
English (en)
French (fr)
Inventor
理一 工藤
馨子 高橋
友規 村上
匡史 岩渕
陸 大宮
智明 小川
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to PCT/JP2020/038787 priority Critical patent/WO2022079833A1/ja
Priority to JP2022556754A priority patent/JP7505569B2/ja
Publication of WO2022079833A1 publication Critical patent/WO2022079833A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/18Network planning tools
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W64/00Locating users or terminals or network equipment for network management purposes, e.g. mobility management

Definitions

  • the present invention relates to a technique for generating a prediction model using environmental information and predicting future communication information of a wireless communication system.
  • IoT Internet of Things
  • Bluetooth registered trademark
  • LTE LongTermEvolution
  • 5G cellular communication LPWA (Low Power Wide Area) communication for IoT
  • vehicle communication A wide variety of wireless communication standards such as ETC (Electronic Toll Collection System), VICS (Vehicle Information and Communication System (registered trademark)), and ARIB-STD-T109 have been developed, and various wireless communication services are widely used.
  • Non-Patent Document 1 a technique of generating a prediction model of wireless communication using distance information between a moving robot and a base station device and predicting communication quality is studied.
  • radio wave propagation with a communication partner depends on the position of the terminal device equipped with a wireless communication function, the state of the terminal device such as posture and movement, and static or dynamic objects around the terminal device.
  • the environment may change and communication quality may be affected, which may have a significant impact on the services and systems realized by wireless communication.
  • the straightness of the radio wave is strong, and the communication quality is easily affected by changes in the radio wave propagation environment. Therefore, in order to manage the stable communication and communication quality of the terminal device to a higher degree, it is necessary to take measures against the fluctuation of the communication quality due to the terminal device itself and the surrounding environment of the terminal device.
  • the technique of modeling the relationship between communication quality and environmental information using machine learning and predicting future communication quality is one of the useful means for maintaining good communication quality.
  • communication information communication information.
  • the present invention is a machine that generates auxiliary information corresponding to the time of future communication information as target information, and outputs communication information of the target future time from auxiliary information or auxiliary information and input information. It is an object of the present invention to provide a communication information prediction device, a communication information prediction method, and a communication information prediction program capable of predicting future communication information with high accuracy by training and generating a learning model.
  • the present invention is a communication information prediction device that generates a communication environment model related to wireless communication of a mobile terminal device and predicts communication information of the terminal device, at least one of the terminal device and the wireless communication destination device of the terminal device.
  • An environment information generation unit that generates environmental information related to the device environment, a communication unit that generates communication information related to wireless communication of the terminal device, and the environment information, or the environment information and the communication information as input information.
  • a communication environment that generates auxiliary information corresponding to the time of the target information and outputs the communication information of the future time related to the wireless communication of the terminal device as the target information based on the auxiliary information or the auxiliary information and the input information. It is characterized by having a communication environment model generation unit that generates a model and a model utilization unit that predicts communication information of the terminal device using the communication environment model.
  • the present invention is a communication information prediction method for generating a communication environment model related to wireless communication of a mobile terminal device and predicting communication information of the terminal device, and is a wireless communication destination of the terminal device and the terminal device.
  • Environmental information generation processing that generates environmental information related to at least one device environment of the device, communication processing that generates communication information related to wireless communication of the terminal device, and the environmental information, or the environmental information and the communication information.
  • As input information auxiliary information corresponding to the time of the target information is generated, and the communication information of the future time related to the wireless communication of the terminal device is used as the target information based on the auxiliary information or the auxiliary information and the input information. It is characterized by performing a communication environment model generation process for generating an output communication environment model and a model utilization process for predicting communication information of the terminal device using the communication environment model.
  • the present invention is a communication information prediction program that can be executed by a computer that generates a communication environment model related to wireless communication of a mobile terminal device and predicts communication information of the terminal device, and is the terminal device and the terminal.
  • Environmental information generation processing that generates environmental information related to the environment of at least one of the wireless communication destination devices of the device, communication processing that generates communication information related to wireless communication of the terminal device, and the environmental information or the environmental information.
  • auxiliary information corresponding to the time of the target information is generated, and the communication of the future time related to the wireless communication of the terminal device based on the auxiliary information or the auxiliary information and the input information. It is characterized by executing a communication environment model generation process for generating a communication environment model that outputs information as target information and a model utilization process for predicting communication information of the terminal device using the communication environment model on a computer. do.
  • the communication information prediction device, the communication information prediction method, and the communication information prediction program according to the present invention generate auxiliary information using parameters with high temporal correlation as input information, and the communication information of the future time to be the target from the auxiliary information.
  • auxiliary information using parameters with high temporal correlation as input information, and the communication information of the future time to be the target from the auxiliary information.
  • FIG. 1 shows a configuration example of the wireless communication system 100.
  • the wireless communication system 100 is composed of M units (M is a positive integer) of terminal devices 102 (1) to 102 (M) that perform wireless communication with the base station device 101 and the base station device 101.
  • M is a positive integer
  • terminal devices 102 (1) to 102 (M) that perform wireless communication with the base station device 101 and the base station device 101.
  • the terminal device 102 is described by omitting the (number) at the end of the code. The same applies to a plurality of the same blocks constituting the terminal device 102.
  • all of the base station device 101 and the M terminal devices 102 have a function as the communication information prediction device according to the present invention, and generate a communication environment model for predicting communication information. Communication information can be predicted.
  • the configuration of connecting to the network via the base station device 101 will be described, but a communication device capable of connecting to the network may be provided separately from the base station device 101.
  • the terminal device 102 is a device (access point including the base station device 101 or a monitoring camera on a peripheral road) equipped with a camera or a sensor connected to the network via the base station device 101 or a communication device connectable to the network.
  • Non-communication information such as camera information and sensor information can be collected as environmental information.
  • the terminal device 102 may directly communicate with another terminal device 102 to collect camera information and sensor information from the camera / sensor mounted on the terminal device 102.
  • the terminal device 102 is a communication device mounted on an automobile
  • camera information and sensor information are collected by vehicle-to-vehicle communication (vehicle-to-vehicle communication).
  • vehicle-to-vehicle communication vehicle-to-vehicle communication
  • environmental information for generating a model of wireless communication between the target base station device 101 and the terminal device 102 by machine learning is collected.
  • the communication information between the base station device 101 and the terminal device 102 is predicted using the formed communication environment model.
  • the auxiliary information is a parameter of environmental information corresponding to future communication information (for example, received power), and is non-communication information that can be used for predicting target information.
  • the base station device 101 has a function of connecting to a network and performs wireless communication with M terminal devices 102.
  • the base station apparatus 101 includes a NW unit 201, a communication unit 202 (1) to a communication unit 202 (N), a communication environment model generation unit 203, an environment information generation unit 204, and a model utilization unit 205.
  • the NW unit 201 is an interface for connecting to an external network.
  • the base station device 101 can acquire camera information (photographed image, etc.) and sensor information (three-dimensional laser, etc.) from a device such as a camera or sensor connected to an external network via the NW unit 201. This information can also be acquired by the terminal device 102 connected to the base station device 101.
  • the communication unit 202 has N numbers (N is a positive integer) from the communication unit 202 (1) to the communication unit 202 (N), and can perform wireless communication with a plurality of terminal devices 102 (N). Communication processing). Further, the communication unit 202 generates communication information related to wireless communication and outputs it to the communication environment model generation unit 203 and the model utilization unit 205. Communication information includes, for example, received signal power, signal-to-noise power ratio (SNR), signal-to-noise power ratio (SINR), RSSI (ReceivedSignalStrengthIndication), RSRQ (ReceivedSignalReferenceQuality), packet error rate, and arrival.
  • SNR signal-to-noise power ratio
  • SINR signal-to-noise power ratio
  • RSSI ReceiveivedSignalStrengthIndication
  • RSRQ ReceivedSignalReferenceQuality
  • the communication environment model generation unit 203 includes at least one of the environment information generated by the environment information generation unit 204, the communication unit 202 (1) to the communication unit 202 (N), and the communication unit 301 (1) to the communication unit 301 (M). Using the communication information generated by one, a communication environment model for predicting the communication information is generated (communication environment model generation process). The method of generating the communication environment model will be described later.
  • the environmental information generation unit 204 generates environmental information related to the device environment (environmental information generation processing).
  • Environmental information includes camera information and sensor information (of an object) of a device that can be acquired via the position / attitude / state / movement / control command / terminal device 102 of the terminal device 102 and the base station device 101 or the base station device 101 or a network. Includes at least one piece of information such as (including various information such as presence / absence, size, material) / operation of structure / action strategy of terminal device 102 and network.
  • control command corresponds to, for example, when the terminal device 102 is an autonomous mobile robot, a tire rotation command in the front direction of the robot, a rotation command of the robot, and the like.
  • action strategies of the terminal device 102 and the network include, for example, the planned movement route of the terminal device 102 and the robot, the power mode of the terminal device 102, the number of antennas used by the terminal device 102, the QoS setting to the terminal device 102, and the network. Route settings, network congestion status, network routing rules, application settings, etc.
  • the environmental information is target information in the communication environment model, such as owner information and type information (mobile terminals such as smartphones, automobiles, robots, drones, etc.), store occupant information, automobile movement history, etc. of the terminal device 102. It may be information including all non-communication information that may be used to predict. The more environmental information there is, the better the prediction accuracy of the communication environment model.
  • the model utilization unit 205 outputs target information or strategic information that maximizes the reward by using the communication environment model generated by the communication environment model generation unit 203 (model utilization processing). For example, when the terminal device 102 is an autonomous mobile robot, it is possible to set a reward for maximizing the received power and output X-coordinate speed, Y-coordinate speed, rotation command, etc. that increase the reward as strategic information. can. The operation of the model utilization unit 205 will be described later.
  • the communication environment model generation unit 203 includes the environmental information obtained from the environment information generation unit 204, the communication information obtained from the communication unit 202, and the communication information. To generate a communication environment model using. Then, the model utilization unit 205 can predict the communication information by using the communication environment model generated by the communication environment model generation unit 203.
  • the terminal device 102 (1) to the terminal device 102 (M) each perform wireless communication with the base station device 101.
  • the terminal device 102 has a communication unit 301, a communication environment model generation unit 302, an environment information generation unit 303, and a model utilization unit 304.
  • the communication unit 301 performs wireless communication with the communication unit 202 of the base station device 101 or another terminal device 102 (communication processing). Further, the communication unit 301 generates communication information related to wireless communication and outputs it to the communication environment model generation unit 302 and the model utilization unit 304, similarly to the communication unit 202 of the base station apparatus 101.
  • the communication environment model generation unit 302 communicates using the environment information obtained from the environment information generation unit 303 and the communication information obtained from the communication unit 301. Generate an environment model (communication environment model generation process).
  • the environmental information generation unit 303 generates environmental information (environmental information generation processing) in the same manner as the environmental information generation unit 204 of the base station apparatus 101. The method of generating the communication environment model will be described later.
  • the model utilization unit 304 uses the communication environment model generated by the communication environment model generation unit 302 to output target information or maximize the reward. Output information (model usage process).
  • the communication environment model generation unit 302 can obtain the environmental information obtained from the environment information generation unit 303 and the communication information obtained from the communication unit 301. Use to generate a communication environment model. Then, the model utilization unit 304 can predict the communication information by using the communication environment model generated by the communication environment model generation unit 302.
  • the base station device 101 and the terminal device 102 have been described separately, but the functions may be shared between the base station device 101 and the terminal device 102.
  • the communication environment model generated by the communication environment model generation unit 203 may be used by the model utilization unit 304 of each terminal device 102.
  • the communication environment model generation unit 203 of the base station device 101 can collect communication information and environment information in wireless communication with a plurality of terminal devices 102 and use a lot of training data, the communication of the terminal device 102 can be used. It is preferable to the environment model generator 302. However, it is possible to adjust by techniques such as transfer learning and fine tuning so that the model is optimized for each terminal device 102.
  • the communication environment model is a model generated so as to output environmental information or target information at the same time or future time by using environmental information and communication information as input information.
  • the communication environment model may be generated so that the output value is highly accurate, or may be generated by reinforcement learning so as to maximize a certain parameter different from the output value.
  • the training data is formed by using the received power of the future time as the parameter of the target information, and the predicted value of the received power that is the output of the communication environment model is used.
  • the communication environment model is generated so that the error from the actual received power is small.
  • the terminal device 102 is an autonomous mobile robot
  • the received power is maximized by enhanced learning in order to output the X-coordinate speed, Y-coordinate position speed, and rotation command of the robot so as to maximize the received power.
  • a communication environment model is generated so as to set a reward for the robot and output an X-coordinate velocity, a Y-coordinate velocity, and a rotation command so as to increase the reward.
  • FIG. 2 shows the relationship between the parameters related to communication information and the parameters related to environmental information.
  • the vertical axis represents time
  • t ⁇ N represents the time in the N slot past
  • t 0 represents the present
  • t M represents the time in the future of the M slot.
  • the slot represents a delimiter in an arbitrary time width, and may be considered as a symbol interval for wireless communication or a cycle in which environmental information can be obtained.
  • environmental information has a high temporal correlation, but communication information has a low temporal correlation.
  • Environmental information such as video and location information has a high temporal correlation because it is information in the physical environment. For example, since the range in which the object operates in one second is limited, it is possible to predict the state such as the image and the position of the object one second later from the current and past information with high accuracy.
  • communication information such as received power often has a completely different communication environment after 1 second.
  • the communication state of a moving terminal device may deteriorate sharply due to fluctuations in propagation characteristics or the like.
  • channel information is acquired using a pilot signal at short intervals on the order of microseconds, and it becomes difficult to predict communication information in a time of several tens of milliseconds in the future.
  • auxiliary information is once generated using parameters with high temporal correlation, and a communication environment model that predicts communication information is generated using the auxiliary information.
  • FIG. 3 shows a configuration example when training the communication environment model generation unit 203.
  • the description is given here as the communication environment model generation unit 203 of the base station device 101, the same applies to the communication environment model generation unit 302 of the terminal device 102.
  • Training data consists of input information, target information and auxiliary information.
  • the input information consists of only environmental information or both environmental information and communication information.
  • the target information consists of communication information or control-related parameters that maximize the parameters of the communication information.
  • the control parameters affect the movement of the terminal device 102, the movement of the base station device 101, the control of the mode / communication destination / communication path / communication method, etc. in the OSI reference model from the physical layer to the application layer, and the radio wave propagation environment. Control of the position, movement, and setting of the given structure / metamaterial / dielectric, etc. can be mentioned.
  • Auxiliary information consists of arbitrary parameters selected from environmental information and communication information, which are information at the same time as the target output.
  • the input information is input even when the communication environment model 401 is used, and is necessary information for outputting the target information.
  • the auxiliary information is input at the time of training, but is not input at the time of using the communication environment model 401, and is information used inside the communication environment model generation unit 203.
  • the input information As described with reference to FIG. 2, it is assumed that environmental information having a high temporal correlation is used. Communication information tends to have a low temporal correlation, but parameters of communication information having a high temporal correlation may be selected and used as input information. For example, when the interval between the past time t N and the current time t 0 is short, it can be considered that a temporal correlation of communication information can be obtained to some extent.
  • the communication environment model generation unit 203 (or the communication environment model generation unit 302) can generate the communication environment model 401.
  • FIG. 4 shows an example of the communication environment model 401 during training.
  • training data input information used at the time of use, auxiliary information that is not input at the time of use but is used for training the model, and target information output at the time of use are used as teacher data.
  • a machine learning algorithm any algorithm such as a neural network, a decision tree, or a random forest can be used.
  • the communication environment model 401 has a first machine learning block 501 and a second machine learning block 502.
  • a plurality of first machine learning blocks 501 and a plurality of second machine learning blocks 502 may be provided.
  • the first machine learning block 501 When the input information is input, the first machine learning block 501 outputs information including auxiliary information by using a predetermined machine learning algorithm.
  • the auxiliary information output from the first machine learning block 501 is compared with the auxiliary information of known training data in the auxiliary information output 503. For example, the error (for example, MSE (Mean square error)) between the auxiliary information output from the first machine learning block 501 and the auxiliary information of the training data is obtained, and the auxiliary information with higher accuracy is output.
  • the coefficient of the algorithm in the machine learning block 501 of 1 is updated. In this way, the first machine learning block 501 is trained to obtain more accurate auxiliary information.
  • this auxiliary information is the environmental information of the future time corresponding to the target information
  • the second machine learning block 502 can learn the relationship between the auxiliary information and the target information with a small time difference. That is, the environmental information up to the time t 0 included in the input information is used, and although it is the same type of information, the environmental information at the time t F in the future can be used as the auxiliary information.
  • the training data at least a part of the time-series data of the input signal, which is shifted in time to the future, can be used as auxiliary information. There is also the merit of being able to obtain input information and auxiliary information from the data.
  • the second machine learning block 502 outputs the target information based on the input information including at least the auxiliary information output by the first machine learning block 501 via the auxiliary information output 503.
  • the second machine learning block 502 may input input information via the first machine learning block 501 in addition to the auxiliary information.
  • the target information output from the second machine learning block 502 is compared with the target information of known training data in the target information output 504. For example, the error (for example, MSE) between the target information output from the second machine learning block 502 and the target information of the training data is obtained, and the second machine learning block is output so that the target information with higher accuracy is output.
  • the coefficient of the algorithm in 502 is updated. In this way, the second machine learning block 502 is trained to obtain more accurate target information.
  • the first machine learning block 501 and the second machine learning block 502 are configured by the neural network, they are in the neural network by backpropagation based on the error with respect to the auxiliary information and the target information, respectively.
  • the coefficients (weights and biases) are updated and the first machine learning block 501 and the second machine learning block 502 are trained to output more accurate auxiliary and target information.
  • the back propagation for the target information may be trained to update the coefficients of both the first machine learning block 501 and the second machine learning block 502, or only the second machine learning block 502. May be trained.
  • the target information is not output from the communication information having a low temporal correlation described in FIG. 2, but the target information and the target information are obtained by the first machine learning block 501. It is possible to train the communication environment model 401 so that the auxiliary information can be generated from the input information with high accuracy by using the environmental information and the communication information on the same time axis (t 0 ) as the auxiliary information. This improves the accuracy of the target information and makes it possible to output the target information that maximizes any parameter of the communication information set in the training by reinforcement learning.
  • FIG. 5 shows an example of the communication environment model 401 at the time of use.
  • the communication environment model generation unit 203 inputs input information and outputs target information, unlike the training time described with reference to FIG.
  • the communication environment model 401 has a first machine learning block 501 and a second machine learning block 502.
  • a plurality of first machine learning blocks 501 and a plurality of second machine learning blocks 502 may be provided.
  • the first machine learning block 501 generates auxiliary information from the input information and outputs the auxiliary information to the second machine learning block 502.
  • the auxiliary information is highly accurate auxiliary information that was reinforcement-learned at the time of training shown in FIG.
  • the second machine learning block 502 outputs the target information based on the input including at least the auxiliary information output from the first machine learning block 501.
  • the target information is highly accurate target information that was reinforcement-learned during the training shown in FIG.
  • the communication environment model 401 can predict communication information with high accuracy.
  • the environment information and communication information at the same time as the target information are used as auxiliary information, and the communication environment model trained so that the auxiliary information can be generated from the input information with high accuracy is used, so that highly accurate target information can be obtained. Can be done.
  • the mobile terminal device 102 used in the experiment uses LIDAR ("Light Detection and Ringing” or “Laser Imaging Detection and Ringing”), which is one of the remote sensing technologies using pulsed laser irradiation (scattering). It is an on-board autonomous mobile robot.
  • the autonomous mobile robot can collect its own position information, orientation information, odometry information, and control command information as terminal information by using LIDAR.
  • wireless communication uses a wireless LAN of the IEEE802.11ac standard, and the amount of bits communicated in 0.2 seconds is measured as a throughput to evaluate the performance.
  • FIG. 6 shows an example of an autonomous mobile robot.
  • the horizontal axis represents a two-dimensional plane of x-axis [m] and the vertical axis represents y-axis [m], and the position of the autonomous mobile robot at time ⁇ is (x [ ⁇ ], y [ ⁇ ]).
  • the self-position information is calculated by the algorithm of AMCL (Adaptive Monte Carlo Localization) of Robot OS from the odometry information and the measurement result of LIDAR.
  • AMCL Adaptive Monte Carlo Localization
  • odometry information such as speed and rotation speed with respect to the front direction of the robot detected from the rotation of the robot tire, tire rotation command corresponding to the front direction of the robot, control command information such as a command corresponding to the rotation of the robot, etc.
  • odometry Vx [ ⁇ ], V ⁇ [ ⁇ ]
  • control command information Ox [ ⁇ ], O ⁇ [ ⁇ ]
  • communication information uses RSSI and throughput
  • RSSI is acquired every 10 ms
  • the median RSSI in the 0.2 second time slot is ⁇ ave [ ⁇ ]
  • the dispersion value is ⁇ std [ ⁇ ]
  • the throughput Let be C [ ⁇ ].
  • the environmental information in the demonstration experiment is the position (X-axis, Y-axis), orientation, odometry (self-position estimation) (velocity on X-axis, velocity on Y-axis, rotational velocity) and control obtained from the robot.
  • Command information tire rotation command in the front direction of the robot, rotation command of the robot
  • past throughput from the present to the past 2 seconds
  • the output information (target information) is the throughput C [t M -4], C [t M -3], which is standardized by a window for 0.2 seconds from 1.2 seconds to 2 seconds after the current time t 0 .
  • t M t 0 + 2 [sec]
  • t M -1 t 0 + 1.8 [sec]
  • t M -2 t 0 + 1.6 [sec]
  • t M -3 t 0 + 1. 4 [sec]
  • t M -4 t 0 + 1.2 [sec].
  • the throughputs of the output target information C [t M -4] to C [t M ] are compared with the throughputs of known training data C [t M -4] to C [t M ].
  • the error is calculated and the coefficient of the machine learning block is updated by back propagation so that the error is minimized.
  • the throughput Ci evaluated by the R2 score described later is (C [t M -4] + C [t M -3] + C [t M -2] + C [t M -1] + C [t M ]) / Evaluate as 5.
  • FIG. 7 shows an indoor map recognized by an autonomous mobile robot and the position of a goal.
  • the robot selects one of the 113 goals set and continues autonomous movement. Then, when the robot enters 30 cm around the selected goal, the next goal is reset and the robot is designed to move toward the next goal.
  • both the above-mentioned input information and target information are preprocessed so that the distribution is approximately -1 to +1. Further, the prediction accuracy is evaluated by the R2 score shown in the equation (1).
  • C i is the measured value of the throughput
  • ⁇ C i is the predicted value by machine learning
  • n is the number of samples
  • i is the sample number
  • Ave is the predicted value of the throughput.
  • the R2 score indicates the accuracy with which the communication environment model by machine learning can predict the data. Generally, when the R2 score is 0.6 or more, it indicates that the modeling is successful, and the R2 score is 0. In the case of 7, it means that the accuracy of the model is high.
  • FIG. 8 shows an example of a communication environment model of a comparative example.
  • a comparative example is a conventional communication environment model, and shows an example of a communication environment model configured by using a recurrent neural network (RNN) and three fully connected layers.
  • RNN recurrent neural network
  • input information of environment information (8 parameters) and communication information (2 parameters) is input to the RNN.
  • the input information uses 10 timing parameters every 0.2 seconds in the last 2 seconds. That is, the past time every 0.2 seconds from the current time t 0-0.2 seconds, t 0-0.4 seconds, t 0-0.6 seconds, t 0-0.8 seconds, t 0
  • the 10 timing parameters of -1.0 seconds, t 0-1.2 seconds, t 0-1.4 seconds , t 0-1.6 seconds, and t 0-1.8 seconds are used.
  • the RNN uses a GRU (Gated Recurrent Unit), the hidden layer is 1, and the dimension of the hidden layer is 35.
  • GRU Gate Recurrent Unit
  • the fully connected layer is composed of two layers of input 35 and output 35 and one layer of input 35 and output 1, and outputs target information.
  • An activation layer by ReLU Rectified Linear Unit
  • ReLU Rectified Linear Unit
  • FIG. 9 shows an example of the communication environment model 401 of the first configuration according to the present embodiment.
  • the communication environment model 401 of the first configuration shown in FIG. 9 has a first machine learning block 501 and a second machine learning block 502 having an RNN and three fully connected layers as a basic structure.
  • the first machine learning block 501 uses a GRU having a hidden layer of 1 and a hidden layer dimension of 35 as RNNs, two layers of output 35 at input 35, and output M at input 35 (M is a positive integer). It is composed of three fully connected layers having one layer, and outputs M auxiliary information corresponding to the time t 0 of the target information.
  • the second machine learning block 502 uses a GRU having 1 hidden layer and 35 hidden layer dimensions as the RNN, and has two layers with an output of 35 at the input 35 and one layer with an output of 1 at the input 35. It is composed of three fully connected layers and outputs target information.
  • the training data is configured to include auxiliary information that is the output of the first machine learning block 501. Then, the accuracy of the auxiliary information is improved by comparing the output auxiliary information with the auxiliary information of the teacher data and updating the coefficient of the neural network of the first machine learning block 501 so that the error is minimized. Is enhanced.
  • the input information of the demonstration experiment is the four cases of (X [ ⁇ ], Y [ ⁇ ], kz [ ⁇ ], w [ ⁇ ]) and (X [ ⁇ ], Y. Eight cases of [ ⁇ ], kz [ ⁇ ], w [ ⁇ ], Vx [ ⁇ ], V ⁇ [ ⁇ ], Ox [ ⁇ ], O ⁇ [ ⁇ ]) are assumed.
  • the time-series data of the auxiliary information output thus obtained is further input to the RNN (GRU) of the second machine learning block 502, and the target information is output from the three fully connected layers.
  • the target information output from the second machine learning block 502 is the throughput C [t M-4 ], C, which is normalized by a window for 0.2 seconds from 1.2 seconds to 2 seconds after the current time t 0 . It becomes [t M-3 ], C [t M-2 ], C [t M-1 ], and C [t M ].
  • t M t 0 + 2 [sec]
  • t M-1 t 0 +1.8 [sec]
  • t M-2 t 0 + 1.6 [sec]
  • t M-3 t 0 + 1. 4 [sec]
  • t M-4 t 0 + 1.2 [sec].
  • auxiliary information, 5 output information (target information), and the target information of the corresponding training data are compared, back propagation is performed so as to minimize the error, and the first machine learning is performed.
  • back propagation is performed so as to minimize the error, and the first machine learning is performed.
  • FIG. 10 shows an example of the communication environment model 401 of the second configuration according to the present embodiment.
  • the communication environment model 401 having the second configuration shown in FIG. 10 has a first machine learning block 501 and a second machine learning block 502 having an RNN and three fully connected layers as a basic structure.
  • the first machine learning block 501 has the same configuration as the first configuration of FIG. 9, uses a GRU having 1 hidden layer and 35 hidden layer dimensions as RNNs, and has two layers with an input of 35 and an output of 35. , Is composed of three fully connected layers having one output M (M is a positive integer) at the input 35, and outputs M first auxiliary information corresponding to the time t 0 of the target information. ..
  • the second machine learning block 502 has a second machine learning block 502'in the second machine learning block 502, which is slightly different from the first configuration of FIG.
  • the second'machine learning block 502' is composed of three fully connected layers having two layers of output 35 at input 35 and one layer of output 1 at input 35, and provides second auxiliary information. Output.
  • the second auxiliary information is the three fully connected layers having one layer of output 35 at input 37, one layer of output 35 at input 35, and one layer of output 1 at input 35. It is input together with the output of GRU, and the target information is output.
  • the input information of the demonstration experiment is the four cases of (X [ ⁇ ], Y [ ⁇ ], kz [ ⁇ ], w [ ⁇ ]) as described above. , (X [ ⁇ ], Y [ ⁇ ], kz [ ⁇ ], w [ ⁇ ], Vx [ ⁇ ], V ⁇ [ ⁇ ], Ox [ ⁇ ], O ⁇ [ ⁇ ]) Is assumed.
  • the input information is treated separately as the non-communication information environment information and the communication information, and the environment information having a high time correlation is first treated in the future time (time t M-7 to t M ). (Up to) to the environmental information (first auxiliary information). Then, the communication information ( ⁇ ave [t], ⁇ std [t], C [t]) is output as the second auxiliary information of the same time from the first auxiliary information of the future time. , It is possible to carry out training by using environmental information and communication information as features with high temporal correlation. As a result, the accuracy of the target information is improved as compared with the first configuration.
  • the output of the second auxiliary information shall be 5 samples as in the output time of t M-4 , t M-3 , ..., T M. Based on the output of the second machine learning block 502 that inputs the first auxiliary information and the second auxiliary information output by the second'machine learning block 502', the final prediction is made in the fully connected layer. The target information is output.
  • the target information output from the second machine learning block 502 is a throughput C [t] standardized in a 0.2 second window from 1.2 seconds to 2 seconds after the current time t0 . M-4 ], C [t M-3 ], C [t M-2 ], C [t M-1 ], C [t M ].
  • t M t 0 + 2 [sec]
  • t M-1 t 0 +1.8 [sec]
  • t M-2 t 0 + 1.6 [sec]
  • t M-3 t 0 + 1. 4 [sec]
  • t M-4 t 0 + 1.2 [sec].
  • a total of 84 output information including 64 first auxiliary information, 15 second auxiliary information for 3 features of 5 hours, and 5 target information of the final output, and this output information Backpropagation is performed so that the error is minimized by comparing with the information of the corresponding training data, and the coefficient of each machine learning block is updated.
  • the secondary effect of this embodiment is that even if the input information of the first machine learning block 501 is changed, the second machine learning block 502 is common if the output of the first auxiliary information is determined in advance. It can be used for. That is, even if the information that can be used for prediction is different depending on the terminal device 102, the output contents of the first auxiliary information of the first machine learning block 501 are determined in advance, so that each terminal device 102 is the same. It suffices to have a first machine learning block 501 capable of outputting auxiliary information. That is, the second machine learning block 502 can be the same as the other terminal device 102.
  • FIG. 11 shows the results of performance evaluation in the demonstration experiment.
  • the data set for 6 hours for the test prepared separately is used from 1 second to 2 seconds. A later standardized throughput was obtained.
  • the R2 score of the conventional method is 0.63395.
  • the R2 score of the first configuration method according to the present embodiment is 0.641792
  • the R2 score of the second configuration method is 0.64338
  • the R2 score is the conventional method ⁇ first configuration method. ⁇ It can be confirmed that the improvements are made in the order of the second configuration method.
  • the R2 score of the conventional method is 0.64569
  • the R2 score of the first configuration method according to the present embodiment is 0.656097, which is the second configuration method.
  • the R2 score is 0.65964, and it can be confirmed that the R2 score is improved in the order of the conventional method ⁇ first configuration method ⁇ second configuration method.
  • a computer may execute a process in which each block or a part of the blocks of the base station device 101 or the terminal device 102 in each of the above-described embodiments is used as a component.
  • a program for realizing the processing performed by each block or a part of the blocks is recorded on a computer-readable recording medium, and the program recorded on this recording medium is read by the computer system so that the computer can read the program. You may let it run.
  • the "computer” includes hardware such as an OS and peripheral devices.
  • the "computer-readable recording medium” is a portable medium such as a flexible disk, a magneto-optical disk, a ROM, or a CD-ROM, or a storage device such as a hard disk built in or externally connected to a computer system.
  • the "computer-readable recording medium” includes programs acquired via a network such as the Internet or a communication line such as a telephone line, and is a program that is retained only for a short time, a program that is dynamically retained, and the like. Is also included.
  • the program may include a memory that holds a program for a certain period of time, such as a volatile memory inside a computer system that is a server or a client.
  • the program may be for realizing a part of the above-mentioned components, and may be realized by combining the above-mentioned components with a program already recorded in the computer system. good.
  • program may be realized by using hardware such as PLD (Programmable Logic Device) or FPGA (Field Programmable Gate Array).
  • the communication information prediction device, the communication information prediction method, and the communication information prediction program according to the present invention generate auxiliary information using parameters with high temporal correlation as input information, and become a target from the auxiliary information.
  • auxiliary information using parameters with high temporal correlation as input information, and become a target from the auxiliary information.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

端末装置および端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成部と、端末装置の無線通信に係る通信情報を生成する通信部と、環境情報、または環境情報および通信情報を入力情報として、ターゲット情報となる未来の通信情報の時間に対応する補助情報を生成して、補助情報または補助情報と入力情報に基づいて端末装置の無線通信に係る未来の時間の通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成部と、通信環境モデルを用いて、端末装置の通信情報を予測するモデル利用部とを有する。これにより、高精度に未来の通信情報を予測することができる。

Description

通信情報予測装置、通信情報予測方法、および通信情報予測プログラム
 本発明は、環境情報を用いて予測モデルを生成し、無線通信システムの未来の通信情報を予測する技術に関する。
 近年、様々な装置がインターネットにつながるIoT(Internet of Things)の実現が進んでおり、自動車、ドローン、建設機械車両など様々な機器が無線により接続されつつある。また、IEEE802.11規格の無線LAN(Local Area Network)、Bluetooth(登録商標)、LTE(Long Term Evolution)や5Gによるセルラー通信、IoT向けのLPWA(Low Power Wide Area)通信、車通信に用いられるETC(Electronic Toll Collection System)、VICS(Vehicle Information and Communication System(登録商標))、ARIB-STD-T109など、多種多様な無線通信規格が展開され、様々な無線通信サービスが広く利用されている。
 しかしながら、無線通信サービスによっては、通信品質の要求条件を必ずしも満たすことができない、という問題がある。特に端末装置や周辺のオブジェクトが動く場合、アンテナの指向性や伝搬環境が変動するため、通信品質が大きな影響を受ける。例えば非特許文献1では、移動するロボットと基地局装置との間の距離情報を用いて無線通信の予測モデルを生成し、通信品質を予測する技術が検討されている。
C.J.Lowrance, A.P.Lauf,"An active and incremental learning framework for the online prediction of link quality in robot networks",Engineering Applications of Artificial Intelligence,77,pp.197-211,2019.
 無線通信システムでは、無線通信機能が搭載された端末装置の位置、姿勢および動きなどの端末装置の状態、端末装置周辺の静的または動的な物体、などにより、通信相手との間の電波伝搬環境が変化して通信品質が影響を受け、無線通信により実現されるサービスやシステムに大きな影響を及ぼすことがある。例えば、高い周波数を用いる場合は電波の直進性が強く、通信品質は電波伝搬環境の変化による影響を受けやすい。このため、端末装置の安定した通信や通信品質をより高度に管理するには、端末装置自身と端末装置の周辺環境による通信品質の変動に対する対策が必要である。
 この対策として、機械学習を用いた通信品質と環境情報の関係性をモデル化し、未来の通信品質を予測する技術は、良好な通信品質を維持する上で有用な手段の一つである。
 ところが、通信に関する情報は時間的な相関が低く、例えば1秒後の通信環境が全く異なる場合が少なくないため、通信品質や、通信品質を高めるための制御方法を高精度に予測することが難しいという課題がある。以下、通信品質や通信品質を高めるための通信や端末装置の制御情報を通信情報と定義する。
 上記課題に鑑み、本発明は、ターゲット情報となる未来の通信情報の時間に対応する補助情報を生成し、補助情報または補助情報と入力情報からターゲットとなる未来の時間の通信情報を出力する機械学習モデルを訓練して生成することにより、未来の通信情報の予測を高精度に行うことができる通信情報予測装置、通信情報予測方法、および通信情報予測プログラムを提供することを目的とする。
 本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測装置において、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成部と、前記端末装置の無線通信に係る通信情報を生成する通信部と、前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成部と、前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用部とを有することを特徴とする。
 また、本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測方法であって、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、前記端末装置の無線通信に係る通信情報を生成する通信処理と、前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理とを行うことを特徴とする。
 また、本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測するコンピュータで実行可能な通信情報予測プログラムであって、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、前記端末装置の無線通信に係る通信情報を生成する通信処理と、前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理とをコンピュータで実行することを特徴とする。
 本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムは、時間的に相関の高いパラメータを入力情報として補助情報を生成し、補助情報からターゲットとなる未来の時間の通信情報を出力する機械学習モデルを訓練して生成することにより、通信情報の予測を高精度に行うことができる。
無線通信システムの構成例を示す図である。 通信情報に関するパラメータと環境情報に係るパラメータの関係を示す図である。 通信環境モデル生成部を訓練する場合の構成例を示す図である。 訓練時の通信環境モデルの一例を示す図である。 利用時の通信環境モデルの一例を示す図である。 自律移動ロボットの一例を示す図である。 自律移動ロボットが認識する屋内マップとゴールの位置を示す図である。 比較例の通信環境モデルの一例を示す図である。 第1の構成の通信環境モデルの一例を示す図である。 第2の構成の通信環境モデルの一例を示す図である。 実証実験における性能評価の結果を示す図である。
 以下、図面を参照して本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムの実施形態について説明する。なお、以下に説明する実施形態は本発明の一例であり、本発明は以下の実施形態に制限されるものではない。
 図1は、無線通信システム100の構成例を示す。無線通信システム100は、基地局装置101、基地局装置101と無線通信を行うM台(Mは正の整数)の端末装置102(1)から102(M)で構成されている。ここで、M台の端末装置102(1)から102(M)に共通する説明を行う場合は、符号末尾の(番号)を省略して端末装置102と記載する。なお、端末装置102を構成する複数の同じブロックに対しても同様に記載する。
 図1の例では、基地局装置101およびM台の端末装置102の全てが本発明に係る通信情報予測装置としての機能を有し、通信情報の予測を行うための通信環境モデルを生成し、通信情報予測を行うことができる。
 なお、本実施形態では、基地局装置101を介してネットワークに接続する構成として説明するが、基地局装置101とは別にネットワークに接続可能な通信装置を有していてもよい。そして、端末装置102は、基地局装置101またはネットワークに接続可能な通信装置を介して、ネットワークに接続されたカメラやセンサを搭載する機器(基地局装置101を含むアクセスポイントや周辺路上の監視カメラなど)からカメラ情報やセンサ情報などの非通信情報を環境情報として収集することができる。また、端末装置102は、他の端末装置102と直接、通信を行って端末装置102に搭載されたカメラ/センサからカメラ情報やセンサ情報を収集してもよい。例えば端末装置102が自動車に搭載された通信装置の場合、車車間通信(車対車間の通信)により、カメラ情報やセンサ情報(位置情報などを含む)が収集される。このようにして、ターゲットとする基地局装置101と端末装置102との間の無線通信のモデルを機械学習により生成するための環境情報が収集される。そして、形成された通信環境モデルを用いて基地局装置101と端末装置102との間の通信情報の予測が行われる。
 特に、以降で説明する実施形態では、時間的な相関の高いパラメータを入力情報として一旦、補助情報を生成して機械学習を行うことにより、精度の高い通信情報の予測を行うことができる。ここで、補助情報は、未来の通信情報(例えば受信電力など)に対応する環境情報のパラメータであり、ターゲット情報の予測に利用可能な非通信情報である。
 (基地局装置101の構成例)
 図1において、基地局装置101は、ネットワークに接続する機能を有し、M台の端末装置102との間で無線通信を行う。基地局装置101は、NW部201、通信部202(1)から通信部202(N)、通信環境モデル生成部203、環境情報生成部204およびモデル利用部205を有する。
 NW部201は、外部のネットワークに接続するためのインターフェースである。基地局装置101は、NW部201を介して、外部のネットワークに接続されるカメラやセンサなどの装置からカメラ情報(撮影画像など)やセンサ情報(三次元レーザなど)を取得することができる。これらの情報は、基地局装置101に接続される端末装置102も取得可能である。
 通信部202は、通信部202(1)から通信部202(N)までのN個(Nは正の整数)を有し、複数の端末装置102との間で無線通信を行うことができる(通信処理)。また、通信部202は、無線通信に関係する通信情報を生成し、通信環境モデル生成部203およびモデル利用部205に出力する。通信情報は、例えば、受信信号電力、信号対雑音電力比(SNR)、信号対干渉雑音電力比(SINR)、RSSI(Received Signal Strength Indication)、RSRQ(Received Signal Reference Quality)、パケット誤り率、到達ビット数、単位時間当たりの到達ビット数、MCS(Modulation and Coding Scheme index)、再送回数、遅延時間、誤り訂正方式、通信システムの周波数、利用するリソースの帯域幅などの周波数条件、などである。さらに、これらの値の微分情報、これらの値から計算式を用いて算出される指標、これらの指標に影響を与えるシステムの設定項目などであってもよい。
 通信環境モデル生成部203は、環境情報生成部204が生成する環境情報と、通信部202(1)から通信部202(N)、通信部301(1)から通信部301(M)のうち少なくとも一つが生成する通信情報と、を用いて、通信情報を予測するための通信環境モデルを生成する(通信環境モデル生成処理)。なお、通信環境モデルの生成方法については後述する。
 環境情報生成部204は、装置環境に係る環境情報を生成する(環境情報生成処理)。環境情報は、端末装置102および基地局装置101の位置/姿勢/状態/動き/制御指令/端末装置102および基地局装置101またはネットワークを介して取得可能な機器のカメラ情報およびセンサ情報(物体の有無、サイズ、材質など様々な情報を含む)/構造物の動作/端末装置102およびネットワークの行動戦略、などの少なくとも一つの情報を含む。
 ここで、制御指令は、例えば、端末装置102が自律移動ロボットである場合、ロボット正面方向へのタイヤ回転指令、ロボットの回転指令などに対応する。また、端末装置102およびネットワークの行動戦略は、例えば、端末装置102やロボットの予定移動経路、端末装置102の電力モード、端末装置102が利用するアンテナ数、端末装置102へのQoS設定、ネットワークの経路設定、ネットワークの混雑状況、ネットワークにおけるルーティングルール、アプリケーションの設定、などである。
 さらに、環境情報は、端末装置102の所有者情報やタイプ(スマートフォンなどの携帯端末、自動車、ロボット、ドローンなど)の情報、入店者情報、自動車の移動履歴、など、通信環境モデルでターゲット情報を予測するために使えるのではないかと思われる全ての非通信情報を含む情報であってもよい。環境情報が多いほど、通信環境モデルの予測精度が向上する。
 モデル利用部205は、通信環境モデル生成部203により生成された通信環境モデルを用いて、ターゲット情報の出力、または報酬を最大化するような戦略情報の出力を行う(モデル利用処理)。例えば、端末装置102が自律移動ロボットの場合、受信電力を最大化することに報酬を設定し、報酬が高くなるようなX座標速度、Y座標速度、回転指令などを戦略情報として出力することができる。なお、モデル利用部205の動作については後述する。
 このようにして、基地局装置101が通信情報予測装置として機能する場合、通信環境モデル生成部203は、環境情報生成部204から得られた環境情報と、通信部202から得られる通信情報と、を用いて、通信環境モデルを生成する。そして、モデル利用部205は、通信環境モデル生成部203が生成した通信環境モデルを用いて、通信情報を予測することができる。
 (端末装置102の構成例)
 端末装置102(1)から端末装置102(M)は、それぞれ基地局装置101との間で無線通信を行う。
 端末装置102は、通信部301、通信環境モデル生成部302、環境情報生成部303およびモデル利用部304を有する。
 通信部301は、基地局装置101の通信部202、または他の端末装置102との間で無線通信を行う(通信処理)。また、通信部301は、基地局装置101の通信部202と同様に、無線通信に関係する通信情報を生成し、通信環境モデル生成部302およびモデル利用部304に出力する。
 通信環境モデル生成部302は、基地局装置101の通信環境モデル生成部203と同様に、環境情報生成部303から得られた環境情報と、通信部301から得られる通信情報と、を用いて通信環境モデルを生成する(通信環境モデル生成処理)。
 環境情報生成部303は、基地局装置101の環境情報生成部204と同様に、環境情報を生成する(環境情報生成処理)。なお、通信環境モデルの生成方法については後述する。
 モデル利用部304は、基地局装置101のモデル利用部205と同様に、通信環境モデル生成部302により生成された通信環境モデルを用いて、ターゲット情報の出力、または報酬を最大化するような戦略情報の出力を行う(モデル利用処理)。
 このようにして、端末装置102が通信情報予測装置として機能する場合、通信環境モデル生成部302は、環境情報生成部303から得られた環境情報と、通信部301から得られる通信情報と、を用いて、通信環境モデルを生成する。そして、モデル利用部304は、通信環境モデル生成部302が生成した通信環境モデルを用いて、通信情報を予測することができる。
 ここで、上述の説明では、基地局装置101と端末装置102とに分けて説明したが、基地局装置101と端末装置102との間で機能を分担してもよい。例えば、通信環境モデル生成部203で生成された通信環境モデルを各端末装置102のモデル利用部304が利用するようにしてもよい。
 (通信環境モデル生成部)
 次に、基地局装置101の通信環境モデル生成部203および端末装置102の通信環境モデル生成部302について詳しく説明する。なお、ここでは、基地局装置101の通信環境モデル生成部203として説明するが、端末装置102の通信環境モデル生成部302についても基本的な動作は同じである。
 基地局装置101の通信環境モデル生成部203は、複数の端末装置102との間の無線通信における通信情報および環境情報を収集して多くの訓練データを用いることができるので、端末装置102の通信環境モデル生成部302よりも望ましい。しかし、端末装置102ごとに最適化されたモデルとなるように転移学習やファインチューニングなどの技術で調整することが可能である。
 通信環境モデルは、環境情報、または、環境情報および通信情報を入力情報として、同じ時間または未来の時間におけるターゲット情報を出力するように、生成されるモデルである。通信環境モデルは、出力の値が高精度となるように、生成されてもよいし、出力値とは異なるあるパラメータを最大化するように強化学習により生成されてもよい。
 例えば、未来の時間の受信電力を通信環境モデルにより出力する場合には、未来の時間の受信電力をターゲット情報のパラメータとして訓練データを形成し、通信環境モデルの出力となる受信電力の予測値と実際の受信電力との誤差が少なくなるように、通信環境モデルが生成される。あるいは、端末装置102が自律移動ロボットである場合、受信電力を最大化するように、ロボットのX座標速度、Y座標位置速度、回転指令を出力させるために、強化学習により、受信電力を最大化することに報酬を設定し、報酬が高くなるようなX座標速度、Y座標速度、回転指令を出力するように通信環境モデルが生成される。
 通信環境モデルをできるだけ多くの訓練データにより生成するためには、できるだけ共通して利用できるデータを増やして、モデルの生成を行う方が高い特性が得られると想定される。一方、通信システムは一般に広い帯域幅が利用可能であり、その中の周波数チャネルの利用方法も通信システムにより様々なものが存在する。通信システムの設定値ごとに独立の通信環境モデルを生成すれば、訓練に要するデータ量が十分に得られないなどの問題が生じる。従って、できるだけ多くのデータを用いた共通の通信環境モデルとすることが望ましい。
 図2は、通信情報に関するパラメータと環境情報に係るパラメータの関係を示す。図2において、縦軸は時間を示し、t-NはNスロット過去の時間、tは現在、tはMスロット未来の時間を表す。ここで、スロットとは、任意の時間幅での区切りを表し、無線通信のシンボル間隔と考えてもよいし、環境情報が得られる周期と考えてもよい。
 図2に示すように、一般に、環境情報は時間的な相関が高いが、通信情報は時間的な相関が低い。映像や位置情報などの環境情報は、物理的な環境における情報なので時間的な相関が高い。例えば1秒間で物体が動作する範囲は限られているため、現在と過去の情報から1秒後の映像や物体の位置などの状態を高精度に予測することが可能である。
 一方、受信電力などの通信情報は、1秒後の通信環境が全く異なるものになることが少なくない。例えば、移動する端末装置の通信状態が伝搬特性の変動などにより急激に悪化することがある。このため、実際の無線通信システムでは、パイロット信号を使ったチャネル情報の取得をマイクロ秒オーダーの短い間隔で実施しており、数十ミリ秒未来の時間の通信情報の予測は困難となる。
 このように、未来の通信情報に関するパラメータを予測するアルゴリズムでは、先ず時間的に相関の高いパラメータを用いて未来の予測すべき時間における情報を生成した後、当該情報を通信情報に変換することが有効であると考えられる。
 そこで、本実施形態では、時間的に相関の高いパラメータを用いて補助情報を一旦生成し、補助情報を用いて通信情報を予測する通信環境モデルを生成する。
 図2において、未来の時間tにおける通信情報に関するパラメータを予測するために、現在および過去の通信情報を用いた場合、時間的な相関が低いので、推定精度が低くなるという問題がある。
 このため、本実施形態では、未来の時間tにおける通信情報を得るために、現在時間tから未来の時間tの間の任意の時間の環境情報または通信情報を補助情報として生成し、さらに生成した補助情報を用いて、時間tにおける通信情報に関するパラメータを予測することにより、推定精度を高めることができる。
 図3は、通信環境モデル生成部203を訓練する場合の構成例を示す。なお、ここでは、基地局装置101の通信環境モデル生成部203として説明するが、端末装置102の通信環境モデル生成部302の場合も同様である。
 モデル訓練時には、通信環境モデル生成部203は、訓練データを用いて、通信環境モデル401を生成する。訓練データは、入力情報、ターゲット情報および補助情報からなる。入力情報は、環境情報のみ、または環境情報および通信情報の両方からなる。ターゲット情報は、通信情報または通信情報のパラメータを最大化する制御に関するパラメータからなる。制御に関するパラメータとは、端末装置102の動き、基地局装置101の動き、物理層からアプリケーション層までのOSI参照モデルにおけるモード/通信宛先/通信経路/通信方式などの制御、電波伝搬環境に影響を与える構造物/メタマテリアル/誘電体の位置・動き・設定の制御、などが挙げられる。補助情報は、ターゲットとなる出力と同じ時間の情報である環境情報と通信情報の中から選択された任意のパラメータからなる。
 ここで、入力情報は、通信環境モデル401の利用時にも入力され、ターゲット情報を出力するために必要な情報である。また、補助情報は、訓練時には入力されるが、通信環境モデル401の利用時には入力されず、通信環境モデル生成部203の内部で用いられる情報である。
 なお、入力情報として、図2で説明したように、時間的な相関が高い環境情報の使用が想定される。通信情報は時間的な相関が低い傾向にあるが、時間的な相関が高い通信情報のパラメータを選択して入力情報として用いてもよい。例えば、過去の時間tと現在の時間tとの間隔が短い場合、通信情報の時間的な相関はある程度得られる考えることができる。
 このようにして、通信環境モデル生成部203(または通信環境モデル生成部302)は、通信環境モデル401を生成することができる。
 図4は、訓練時の通信環境モデル401の一例を示す。図4において、訓練データとして、利用時に用いる入力情報と、利用時には入力されないがモデルの訓練に利用する補助情報と、利用時に出力するターゲット情報を、教師データとして利用する。なお、機械学習アルゴリズムとして、ニューラルネットワーク、決定木、ランダムフォレスト、など任意のアルゴリズムが利用可能である。
 図4において、通信環境モデル401は、第1の機械学習ブロック501および第2の機械学習ブロック502を有する。なお、第1の機械学習ブロック501および第2の機械学習ブロック502は、それぞれ複数具備されていてもよい。
 第1の機械学習ブロック501は、入力情報が入力されると、予め決められた機械学習のアルゴリズムを用い、補助情報を含む情報を出力する。訓練時には、第1の機械学習ブロック501から出力された補助情報は、補助情報出力503において、既知の訓練データの補助情報と比較される。例えば第1の機械学習ブロック501から出力される補助情報と、訓練データの補助情報との誤差(例えばMSE(Mean square error))を求め、より精度の高い補助情報が出力されるように、第1の機械学習ブロック501内のアルゴリズムの係数が更新される。このようにして、第1の機械学習ブロック501は、より精度の高い補助情報が得られるように訓練される。この補助情報は、ターゲット情報が対応する未来の時間の環境情報とすることで、第2の機械学習ブロック502は、補助情報とターゲット情報の時間差の小さい関係性を学習できる。つまり、入力情報に含まれる時間tまでの環境情報を用い、同じ種類の情報であるが、それより未来の時間tの環境情報を補助情報として用いることができる。この場合、訓練データは、入力信号の少なくとも一部の時系列データを、時間的に未来にシフトしたものを補助情報として用いることができるため、時系列で訓練データが得られている場合、同じデータから入力情報と補助情報を得ることができるメリットもある。
 第2の機械学習ブロック502は、第1の機械学習ブロック501が補助情報出力503を介して出力する補助情報を少なくとも含む入力情報に基づいて、ターゲット情報を出力する。なお、第2の機械学習ブロック502は、補助情報に加えて、第1の機械学習ブロック501を介して入力情報を入力するようにしてもよい。訓練時には、第2の機械学習ブロック502から出力されたターゲット情報は、ターゲット情報出力504において、既知の訓練データのターゲット情報と比較される。例えば第2の機械学習ブロック502から出力されるターゲット情報と、訓練データのターゲット情報との誤差(例えばMSE)を求め、より精度の高いターゲット情報が出力されるように、第2の機械学習ブロック502内のアルゴリズムの係数が更新される。このようにして、第2の機械学習ブロック502は、より精度の高いターゲット情報が得られるように訓練される。
 なお、第1の機械学習ブロック501および第2の機械学習ブロック502がニューラルネットワークで構成されている場合には、補助情報やターゲット情報に対する誤差に基づいて、それぞれバックプロパゲーションにより、ニューラルネットワーク内の係数(重みおよびバイアス)が更新され、第1の機械学習ブロック501および第2の機械学習ブロック502がより正確な補助情報およびターゲット情報を出力できるように訓練される。このとき、ターゲット情報に対するバックプロパゲーションは、第1の機械学習ブロック501と第2の機械学習ブロック502の両方の係数を更新するように訓練してもよいし、第2の機械学習ブロック502のみを訓練するようにしてもよい。
 このように、機械学習ブロックの係数を更新することにより、図2で説明した時間的な相関の低い通信情報からターゲット情報を出力するのではなく、第1の機械学習ブロック501により、ターゲット情報と同じ時間軸(t)における環境情報や通信情報を補助情報として用い、補助情報を高精度に入力情報から生成できるように通信環境モデル401を訓練することが可能である。これにより、ターゲット情報の精度が向上され、強化学習による訓練で設定された通信情報の任意のパラメータを最大化するようなターゲット情報の出力が可能になる。
 図5は、利用時の通信環境モデル401の一例を示す。通信環境モデル生成部203は、図4で説明した訓練時とは異なり、入力情報を入力してターゲット情報を出力する。
 図5において、通信環境モデル401は、第1の機械学習ブロック501および第2の機械学習ブロック502を有する。なお、第1の機械学習ブロック501および第2の機械学習ブロック502は、それぞれ複数具備されていてもよい。
 第1の機械学習ブロック501は、図4の訓練時とは異なり、入力情報から補助情報を生成し、補助情報を第2の機械学習ブロック502に出力する。ここで、補助情報は、図4に示した訓練時に強化学習された精度の高い補助情報である。
 第2の機械学習ブロック502は、第1の機械学習ブロック501から出力される補助情報を少なくとも含む入力に基づいて、ターゲット情報を出力する。ここで、ターゲット情報は、図4に示した訓練時に強化学習された精度の高いターゲット情報である。
 このようにして、通信環境モデル401は、通信情報の予測を精度高く行うことができる。特に、ターゲット情報と同じ時間における環境情報や通信情報を補助情報として用い、補助情報を高精度に入力情報から生成できるように訓練された通信環境モデルを用いるので、精度の高いターゲット情報を得ることができる。
 [実証実験]
 実施形態の効果を実証するために行った実験とその結果について説明する。
 実験に用いた移動する端末装置102は、パルス状に発光するレーザー照射に対する散乱)を用いたリモートセンシング技術の一つであるLIDAR("Light Detection and Ranging"または"Laser Imaging Detection and Ranging")を搭載した自律移動ロボットである。自律移動ロボットは、LIDARにより、自己の位置情報、向き情報、オドメトリ情報、及び制御指令情報を端末情報として収集することができる。
 また、無線通信はIEEE802.11ac規格の無線LANを用い、0.2秒間に通信するビット量をスループットとして計測し、性能を評価するものとする。
 図6は、自律移動ロボットの一例を示す。図6において、横軸はx-axis[m]、縦軸はy-axis[m]の二次元平面を示し、時刻τにおける自律移動ロボットの位置は(x[τ]、y[τ])である。自己の位置情報は、オドメトリ情報とLIDARの測定結果から、Robot OSのAMCL(Adaptive Monte Carlo Localization)のアルゴリズムにより計算される。向きは、ロボット分野の座標系で用いられるクォータニオンにより、{kz[τ]、w[τ]}={sin(θ[τ]/2)、cos(θ[τ]/2)}で表される。また、ロボットのタイヤの回転から検出されるロボットの正面方向に対する速度や回転速度などのオドメトリ情報、ロボット正面方向へ対応するタイヤ回転指令、ロボットの回転に対応する指令などの制御指令情報、などの特徴量として、オドメトリ(Vx[τ]、Vθ[τ])、制御指令情報(Ox[τ]、Oθ[τ])を用いることができる。後述の自律移動ロボットを用いた実証実験では、(x[τ]、y[τ]、kz[τ]、w[τ]、Vx[τ]、Vθ[τ]、Ox[τ]、Oθ[τ])の合計8つの特徴量のうち、すべての特徴量(8つの特徴量)を入力情報として使用する場合と、オドメトリおよび制御指令情報を除く(X[τ]、Y[τ]、kz[τ]、w[τ])の4つの特徴量を入力情報として使用する場合とについて行う。
 さらに、通信情報はRSSIとスループットとを用い、RSSIは10msごとに取得し、0.2秒のタイムスロット内のRSSIの中央値をγave[τ]、分散値をγstd[τ]、スループットをC[τ]とする。
 ここで、実証実験における環境情報は、ロボットから得られる、位置(X軸、Y軸)、向き、オドメトリ(自己位置推定)(X軸上の速度、Y軸上の速度、回転速度)、制御指令情報(ロボット正面方向へのタイヤ回転指令、ロボットの回転指令)、および過去のスループット(現在から過去2秒まで)を用いる。
 また、時間方向には10サンプルのパラメータを用いるので、入力情報は、パラメータが4つの場合は4×10=40、パラメータが8つの場合は8×10=80となる。出力情報(ターゲット情報)は、現在時間tの1.2秒後から2秒後までを0.2秒間ウィンドウで規格化したスループットC[t-4]、C[t-3]、C[t-2]、C[t-1]、C[t]を予測する。ここで、t=t+2[sec]、t-1=t+1.8[sec]、t-2=t+1.6[sec]、t-3=t+1.4[sec]、t-4=t+1.2[sec]である。
 また、訓練時には、出力されるターゲット情報のスループットC[t-4]からC[t]と、既知の訓練データのスループットC[t-4]からC[t]とを比較して誤差を算出し、誤差が最小になるように逆伝播により機械学習ブロックの係数が更新される。
 なお、後述のR2スコアで評価するスループットCは、(C[t-4]+C[t-3]+C[t-2]+C[t-1]+C[t])/5として評価する。
 図7は、自律移動ロボットが認識する屋内マップとゴールの位置を示す。図7に示すように、ロボットは、設置された113個のゴールの中から一つを選択して、自律移動を続ける。そして、ロボットが選択されたゴールの周辺30cmに入れば、次のゴールを再設定して、ロボットは次のゴールに向かうように設計されている。
 実証実験では、深層学習により通信環境モデルを生成するため、前述の入力情報およびターゲット情報のいずれも、およそ-1から+1の分布となるように前処理を行っている。また、予測精度は、式(1)に示すR2スコアにより評価する。
Figure JPOXMLDOC01-appb-M000001
 ここで、Cはスループットの実測値、^Cは機械学習による予測値、nはサンプル数、iはサンプル番号、Caveはスループットの予測値をそれぞれ表す。
 R2スコアは機械学習による通信環境モデルがどの程度の精度でデータを予測できるかを表し、一般に、R2スコアが0.6以上で正常にモデル化ができていることを示し、R2スコアが0.7の場合はモデルの精度が高いことを示す。
 図8は、比較例の通信環境モデルの一例を示す。比較例は、従来方式の通信環境モデルであり、リカレントニューラルネットワーク(RNN)と全結合層3層を用いて構成した通信環境モデルの例を示す。
 図8において、環境情報(8つのパラメータ)と通信情報(2つのパラメータ)の入力情報がRNNに入力される。入力情報は、過去2秒間に0.2秒ごとの10のタイミングのパラメータを用いる。つまり、現在時間tから0.2秒ごとの過去の時間t-0.2秒、t-0.4秒、t-0.6秒、t-0.8秒、t-1.0秒、t-1.2秒、t-1.4秒、t-1.6秒、t-1.8秒、の10のタイミングのパラメータを用いる。また、RNNは、GRU(Gated Recurrent Unit)を用い、隠れ層を1、隠れ層の次元を35とする。
 また、全結合層は、入力35および出力35の層が2つと、入力35および出力1の層が1つとで構成され、ターゲット情報を出力する。なお、全結合層の間にReLU(Rectified Linear Unit)による活性化層が用いられる。
 図9は、本実施形態に係る第1の構成の通信環境モデル401の一例を示す。図9に示す第1の構成の通信環境モデル401は、RNNと全結合層3層を基本構造とする第1の機械学習ブロック501と第2の機械学習ブロック502とを有する。
 第1の機械学習ブロック501は、RNNとして隠れ層が1、隠れ層の次元が35のGRUを用い、入力35で出力35の層が2つ、入力35で出力M(Mは正の整数)の層が1つ、を有する全結合層3層で構成され、ターゲット情報の時間tに対応するM個の補助情報を出力する。
 第2の機械学習ブロック502は、RNNとして隠れ層が1、隠れ層の次元が35のGRUを用い、入力35で出力35の層が2つ、入力35で出力1の層が1つ、を有する全結合層3層で構成され、ターゲット情報を出力する。
 ここで、先に述べたように、訓練時には、第1の機械学習ブロック501の出力となる補助情報が訓練データに含まれるように構成する。そして、出力される補助情報と、教師データの補助情報とを比較して、誤差が最小となるように、第1の機械学習ブロック501のニューラルネットワークの係数を更新することにより、補助情報の精度が高められる。
 また、実証実験の入力情報は、先に述べたように、(X[τ]、Y[τ]、kz[τ]、w[τ])の4つの場合と、(X[τ]、Y[τ]、kz[τ]、w[τ]、Vx[τ]、Vθ[τ]、Ox[τ]、Oθ[τ])の8つの場合と、を想定する。
 また、補助情報出力は、(X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]、γave[t]、γstd[t]、C[t])の11の係数を8つの時間(tM-7、tM-6、・・・、t)のサンプル分だけ生成される。つまり、補助情報出力は、tM-7、tM-6、・・・、tの時間に対応し、11×8=88の補助情報が出力される。
 このようにして得られる補助情報出力の時系列データは、さらに第2の機械学習ブロック502のRNN(GRU)に入力され、全結合層3層からターゲット情報が出力される。第2の機械学習ブロック502から出力されるターゲット情報は、現在時間tの1.2秒後から2秒後までを0.2秒間ウィンドウで規格化したスループットC[tM-4]、C[tM-3]、C[tM-2]、C[tM-1]、C[t]となる。ここで、t=t+2[sec]、tM-1=t+1.8[sec]、tM-2=t+1.6[sec]、tM-3=t+1.4[sec]、tM-4=t+1.2[sec]である。
 訓練時には、88の補助情報と、5つの出力情報(ターゲット情報)と、対応する訓練データのターゲット情報とを比較して、誤差が最小になるように逆伝播を実施し、第1の機械学習ブロック501のニューラルネットワークの係数を更新することにより、補助情報の精度が高められる。
 図10は、本実施形態に係る第2の構成の通信環境モデル401の一例を示す。図10に示す第2の構成の通信環境モデル401は、RNNと全結合層3層を基本構造とする第1の機械学習ブロック501と第2の機械学習ブロック502とを有する。
 第1の機械学習ブロック501は、図9の第1の構成と同じ構成であり、RNNとして隠れ層が1、隠れ層の次元が35のGRUを用い、入力35で出力35の層が2つ、入力35で出力M(Mは正の整数)の層が1つ、を有する全結合層3層で構成され、ターゲット情報の時間tに対応するM個の第1の補助情報を出力する。
 第2の機械学習ブロック502は、図9の第1の構成と少し異なり、第2の機械学習ブロック502の中に第2’の機械学習ブロック502’を有する。第2’の機械学習ブロック502’は、入力35で出力35の層が2つ、入力35で出力1の層が1つ、を有する全結合層3層で構成され、第2の補助情報を出力する。そして、第2の補助情報は、入力37で出力35の層が1つ、入力35で出力35の層が1つ、入力35で出力1の層が1つ、を有する全結合層3層にGRUの出力とともに入力され、ターゲット情報が出力される。
 図10の第2の構成においても、実証実験の入力情報は、先に述べたように、(X[τ]、Y[τ]、kz[τ]、w[τ])の4つの場合と、(X[τ]、Y[τ]、kz[τ]、w[τ]、Vx[τ]、Vθ[τ]、Ox[τ]、Oθ[τ])の8つの場合と、を想定する。
 また、第1の補助情報の出力は、(X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t])の8つの係数を8つの時間(tM-7、tM-6、・・・、t)のサンプル分だけ生成される。つまり、第1の補助情報の出力は、tM-7、tM-6、・・・、tの時間に対応し、8×8=64の補助情報が出力される。
 図10の第2の構成では、入力情報を非通信情報である環境情報と通信情報とに分けて扱い、先ず時間的に相関の高い環境情報を未来の時間(時間tM-7からtまで)の環境情報(第1の補助情報)に変換する。そして、未来の時間の第1の補助情報から、同じ時間の第2の補助情報として通信情報(γave[t]、γstd[t]、C[t])を出力するようにすることで、環境情報と通信情報とを時間的に相関の高い特徴量同士として訓練が実施可能である。これにより、第1の構成に比べて、ターゲット情報の精度が向上する。なお、第2の補助情報の出力は、tM-4、tM-3、・・・、tの出力時間と同様に5サンプルとする。第1の補助情報を入力する第2の機械学習ブロック502の出力と、第2’の機械学習ブロック502’が出力する第2の補助情報とに基づいて、全結合層で最後の予測が行われ、ターゲット情報が出力される。
 なお、実証実験において、第2の機械学習ブロック502から出力されるターゲット情報は、現在時間tの1.2秒後から2秒後までを0.2秒間ウィンドウで規格化したスループットC[tM-4]、C[tM-3]、C[tM-2]、C[tM-1]、C[t]となる。ここで、t=t+2[sec]、tM-1=t+1.8[sec]、tM-2=t+1.6[sec]、tM-3=t+1.4[sec]、tM-4=t+1.2[sec]である。
 訓練時には、64の第1の補助情報と、5つ時間の3つの特徴量に対する15の第2の補助情報と、最終出力の5つのターゲット情報との合計84の出力情報と、この出力情報に対応する訓練データの情報とを比較して誤差が最小になるように逆伝播を実施し、各機械学習ブロックの係数が更新される。
 本実施形態の副次的な効果は、第1の機械学習ブロック501の入力情報を変更しても、第1の補助情報の出力を予め決めておけば、第2の機械学習ブロック502を共通に使用できることである。つまり、予測に使用できる情報が、端末装置102によってバラバラであったとしても、第1の機械学習ブロック501の第1の補助情報の出力内容を予め決めておくことで、各端末装置102は同じ補助情報が出力できる第1の機械学習ブロック501をそれぞれ有していればよい。つまり、第2の機械学習ブロック502は他の端末装置102と同じものが使える。
 図11は、実証実験における性能評価の結果を示す。なお、実証実験では、先に説明した実証実験で取得された100時間分のデータに基づいて訓練を行った後、別に用意したテスト用の6時間分のデータセットにより、1秒後から2秒後までの規格化されたスループットが得られた。
 図11において、入力情報として(X[t]、Y[t]、kz[t]、w[t])の4種の特徴量を入力した場合、従来方法のR2スコアが0.63395であるのに対して、本実施形態に係る第1の構成方法のR2スコアは0.641792、第2の構成方法のR2スコアは0.64338であり、R2スコアは、従来方法<第1の構成方法<第2の構成方法の順に改善されていることが確認できる。
 同様に、入力情報として(X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]、Ox[t]、Oθ[t])の8種の特徴量を入力した場合、従来方法のR2スコアが0.64569であるのに対して、本実施形態に係る第1の構成方法のR2スコアは0.656097、第2の構成方法のR2スコアは0.65964であり、R2スコアは、従来方法<第1の構成方法<第2の構成方法の順に改善されていることが確認できる。
 (他の実現形態)
 ここで、上述した各実施形態における基地局装置101または端末装置102の各ブロックまたは一部のブロックを構成要素として行う処理をコンピュータで実行するようにしてもよい。その場合、各ブロックまたは一部のブロックが行う処理を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませて、コンピュータに実行させるようにしてもよい。
 なお、「コンピュータ」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵または外部に接続されるハードディスク等の記憶装置である。
 さらに「コンピュータで読み取り可能な記録媒体」は、インターネット等のネットワークや電話回線等の通信回線を介して取得されるプログラムを含み、短時間だけ保持されるプログラム、動的に保持されるプログラム、なども含まれる。
 また、サーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものを含んでもよい。また、プログラムは、前述した構成要素の一部を実現するためのものであってもよく、さらに前述した構成要素をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。
 また、プログラムは、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
 以上説明したように、本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムは、時間的に相関の高いパラメータを入力情報として補助情報を生成し、補助情報からターゲットとなる未来の通信情報を出力する機械学習モデルを訓練して生成することにより、通信情報の予測を高精度に行うことができる。
 なお、本発明の実施形態について図面を参照して説明してきたが、具体的な構成は上述の実施形態に限られるものではなく、本発明の基本的な特徴を逸脱しない範囲の設計等も含まれる。
100・・・無線通信システム;101・・・基地局装置;102・・・端末装置;201・・・NW部;202・・・通信部;203・・・通信環境モデル生成部;204・・・環境情報生成部;205・・・モデル利用部;301・・・通信部;302・・・通信環境モデル生成部;303・・・環境情報生成部;304・・・モデル利用部;401・・・通信環境モデル;501・・・第1の機械学習ブロック;502・・・第2の機械学習ブロック;502’・・・第2’の機械学習ブロック;503・・・補助情報出力;504・・・ターゲット情報出力

Claims (8)

  1.  移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測装置において、
     前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成部と、
     前記端末装置の無線通信に係る通信情報を生成する通信部と、
     前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成部と、
     前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用部と
     を有することを特徴とする通信情報予測装置。
  2.  請求項1記載の通信情報予測装置において、
     前記環境情報は、前記端末装置および前記端末装置の無線通信先の装置の位置、姿勢、状態、動き、制御指令、前記端末装置またはネットワークに接続されたカメラおよびセンサの情報、端末やネットワークの行動戦略に関する情報、の少なくとも一つの情報を含む
     ことを特徴とする通信情報予測装置。
  3.  請求項1または請求項2に記載の通信情報予測装置において、
     前記通信環境モデル生成部は、
     前記入力情報、補助情報、およびターゲット情報を教師データとして用い、入力情報を通信環境モデルに入力した際に生成される補助情報の出力とターゲット情報の出力を、前記教師データの補助情報とターゲット情報と比較して、その間の誤差から、より精度の高い前記補助情報と前記ターゲット情報を生成するように機械学習ブロックの係数を更新する訓練を行って、前記通信環境モデルを生成する
     ことを特徴とする通信情報予測装置。
  4.  請求項3に記載の通信情報予測装置において、
     前記補助情報は、前記入力情報の少なくとも一部の情報の時間的に未来に対応するものを含むこととする
     ことを特徴とする通信情報予測装置。
  5.  請求項1から請求項4のいずれか一項に記載の通信情報予測装置において、
     前記通信環境モデルは、
     異なる前記入力情報に対して、ターゲット情報の未来の時間に対応する環境情報を、前記補助情報として出力する第1の機械学習ブロックと、
     前記補助情報または前記補助情報と入力情報から、未来の時間の前記通信情報をターゲット情報として生成する第2の機械学習ブロックと
     を有することを特徴とする通信情報予測装置。
  6.  請求項5に記載の通信情報予測装置において、
     前記第2の機械学習ブロックは、
     非通信情報である前記環境情報と前記通信情報とに分けて扱い、未来の時間の前記通信情報を第2の補助情報として出力する機械学習ブロックを有する
     ことを特徴とする通信情報予測装置。
  7.  移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測方法であって、
     前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、
     前記端末装置の無線通信に係る通信情報を生成する通信処理と、
     前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、
     前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理と
     を行うことを特徴とする通信情報予測方法。
  8.  移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測するコンピュータで実行可能な通信情報予測プログラムであって、
     前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、
     前記端末装置の無線通信に係る通信情報を生成する通信処理と、
     前記環境情報、または前記環境情報および前記通信情報を入力情報として、ターゲット情報の時間に対応する補助情報を生成して、前記補助情報または前記補助情報と入力情報に基づいて前記端末装置の無線通信に係る未来の時間の前記通信情報をターゲット情報として出力する通信環境モデルを生成する通信環境モデル生成処理と、
     前記通信環境モデルを用いて、前記端末装置の通信情報を予測するモデル利用処理と
     をコンピュータで実行することを特徴とする通信情報予測プログラム。
PCT/JP2020/038787 2020-10-14 2020-10-14 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム WO2022079833A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2020/038787 WO2022079833A1 (ja) 2020-10-14 2020-10-14 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム
JP2022556754A JP7505569B2 (ja) 2020-10-14 2020-10-14 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/038787 WO2022079833A1 (ja) 2020-10-14 2020-10-14 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム

Publications (1)

Publication Number Publication Date
WO2022079833A1 true WO2022079833A1 (ja) 2022-04-21

Family

ID=81208953

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/038787 WO2022079833A1 (ja) 2020-10-14 2020-10-14 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム

Country Status (2)

Country Link
JP (1) JP7505569B2 (ja)
WO (1) WO2022079833A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018026728A (ja) * 2016-08-10 2018-02-15 Kddi株式会社 通信品質予測装置、ロボット、通信品質予測方法、及びプログラム
JP2020144720A (ja) * 2019-03-08 2020-09-10 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018026728A (ja) * 2016-08-10 2018-02-15 Kddi株式会社 通信品質予測装置、ロボット、通信品質予測方法、及びプログラム
JP2020144720A (ja) * 2019-03-08 2020-09-10 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RIICHI KUDO, KAORUKO TAKAHASHI, TAKESHI INOUE, KOHEI MIZUNO: "Possibility of next-generation wireless communication system by smart connected device opened by machine learning [Potentiality of machine learning based next generation wireless communication systems for smart connected devices]", IEICE TECHNICAL REPORT, vol. 119, no. 183 (CQ2019-72), 20 August 2019 (2019-08-20), JP, pages 79 - 84, XP009536989 *
RIICHI KUDO, MATTHEW COCHRANE, KAORUKO TAKAHASHI, TAKESHI INOUE, KOHEI MIZUNO: "Wireless link quality prediction of the locomotion robot in wireless LAN systems", IEICE TECHNICAL REPORT, vol. 119, no. 406 (SeMI2019-103), 23 January 2020 (2020-01-23), JP, pages 23 - 28, XP009536988 *

Also Published As

Publication number Publication date
JPWO2022079833A1 (ja) 2022-04-21
JP7505569B2 (ja) 2024-06-25

Similar Documents

Publication Publication Date Title
Huang et al. Deep reinforcement learning for UAV navigation through massive MIMO technique
US20220210622A1 (en) Communication system and base station
US20230079581A1 (en) System, device, method and program that predict communication quality
Callegaro et al. Optimal edge computing for infrastructure-assisted UAV systems
US11234141B2 (en) Parameter selection for network communication links using reinforcement learning
US20220352995A1 (en) Communication system and terminal
Luo et al. A two-step environment-learning-based method for optimal UAV deployment
Lin et al. Reinforcement learning based UAV trajectory and power control against jamming
Wang et al. Learning-based UAV trajectory optimization with collision avoidance and connectivity constraints
Lee et al. Intelligent resource allocation in joint radar-communication with graph neural networks
Salehi et al. Multiverse at the edge: interacting real world and digital twins for wireless beamforming
Khalek et al. Advances in Machine Learning-Driven Cognitive Radio for Wireless Networks: A Survey
Razi et al. Predictive routing for wireless networks: Robotics-based test and evaluation platform
WO2022079833A1 (ja) 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム
WO2022079834A1 (ja) 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム
Salem et al. Data-driven Integrated Sensing and Communication: Recent Advances, Challenges, and Future Prospects
CN116669089A (zh) 经由信道聚合预测服务质量
WO2022079832A1 (ja) 通信情報予測装置、通信情報予測方法、および通信情報予測プログラム
WO2022118472A1 (ja) 情報処理装置、情報処理方法、およびプログラム
EP3461166A1 (en) A method to classify a neighbor in an ad-hoc network, a classification device, a vehicle comprising a classification device and a computer program
Ma et al. Communications and high-precision positioning (chp2): Secure traffic and resource management using reinforcement learning
Petrolo et al. ASTRO: A system for off-grid networked drone sensing missions
Lee et al. Deep Reinforcement Learning for Time Allocation and Directional Transmission in Joint Radar-Communication
Singh et al. Minimizing ground risk in cellular-connected drone corridors with mmwave links
WO2021064848A1 (ja) 移動端末及び通信品質予測方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20957662

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022556754

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20957662

Country of ref document: EP

Kind code of ref document: A1