WO2023286884A1 - 무선 통신 시스템에서 신호를 송수신하는 방법 및 장치 - Google Patents

무선 통신 시스템에서 신호를 송수신하는 방법 및 장치 Download PDF

Info

Publication number
WO2023286884A1
WO2023286884A1 PCT/KR2021/008944 KR2021008944W WO2023286884A1 WO 2023286884 A1 WO2023286884 A1 WO 2023286884A1 KR 2021008944 W KR2021008944 W KR 2021008944W WO 2023286884 A1 WO2023286884 A1 WO 2023286884A1
Authority
WO
WIPO (PCT)
Prior art keywords
irs
information
index information
base station
terminal
Prior art date
Application number
PCT/KR2021/008944
Other languages
English (en)
French (fr)
Inventor
오재기
박재용
하업성
김성진
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020237038812A priority Critical patent/KR20240026441A/ko
Priority to PCT/KR2021/008944 priority patent/WO2023286884A1/ko
Publication of WO2023286884A1 publication Critical patent/WO2023286884A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems
    • H04B7/0456Selection of precoding matrices or codebooks, e.g. using matrices antenna weighting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station

Definitions

  • the following description relates to a wireless communication system, and relates to a method and apparatus for transmitting and receiving signals between a terminal and a base station in a wireless communication system.
  • a terminal and a base station may provide a method and apparatus for transmitting and receiving signals by controlling a radio channel environment through an intelligent reflect surface (IRS).
  • IIRS intelligent reflect surface
  • a wireless access system is widely deployed to provide various types of communication services such as voice and data.
  • a wireless access system is a multiple access system capable of supporting communication with multiple users by sharing available system resources (bandwidth, transmission power, etc.).
  • Examples of the multiple access system include a code division multiple access (CDMA) system, a frequency division multiple access (FDMA) system, a time division multiple access (TDMA) system, an orthogonal frequency division multiple access (OFDMA) system, and a single carrier frequency (SC-FDMA) system. division multiple access) system.
  • CDMA code division multiple access
  • FDMA frequency division multiple access
  • TDMA time division multiple access
  • OFDMA orthogonal frequency division multiple access
  • SC-FDMA single carrier frequency division multiple access
  • eMBB enhanced mobile broadband
  • RAT radio access technology
  • MTC massive Machine Type Communications
  • the present disclosure may provide a method and apparatus for transmitting and receiving signals in a wireless communication system.
  • the present disclosure may provide a method for transmitting and receiving signals between a terminal and a base station using an intelligent reflector in a wireless communication system.
  • the present disclosure may provide a method for transmitting and receiving signals between a terminal and a base station based on a smart radio environment (SRE) in a wireless communication system.
  • SRE smart radio environment
  • the present disclosure may provide a method for controlling a passive intelligent reflector based on an artificial intelligence system in a wireless communication system.
  • the present disclosure may provide a method for transmitting and receiving signals between a terminal and a base station by controlling a passive intelligent reflector in a wireless communication system.
  • a method of operating a terminal in a wireless communication system transmitting first index information related to an intelligent reflect surface (IRS) control value to an IRS, a reference to which a first beamforming is applied from a base station Receiving a signal through an IRS, obtaining at least one of compensation value information and channel state information based on the received reference signal, first index information through at least one of the compensation value information and channel state information Updating to the second index information, transmitting the updated second index information to the IRS, and receiving a reference signal to which the second beamforming is applied from the base station through the IRS based on the updated second index information.
  • IRS intelligent reflect surface
  • a method for operating a base station in a wireless communication system transmitting a reference signal to which a first beamforming is applied to a terminal through an IRS, a first updated index information through an IRS 2 Receiving index information and transmitting the reference signal to which the second beamforming is applied to the terminal through the IRS, wherein the terminal transmits the first index information related to the IRS control value to the IRS, and the first beamforming Obtaining at least one of compensation value information and channel state information through the applied reference signal, updating the first index information to second index information through at least one of the compensation value information and channel state information, and Index information may be transmitted to the IRS.
  • the processor transmits first index information related to an IRS control value to the IRS through the transceiver,
  • the reference signal to which the first beamforming is applied is received from the base station through the transceiver through the IRS, at least one of compensation value information and channel state information is obtained based on the received reference signal, and compensation value information and channel state information are obtained.
  • Updating the first index information to the second index information through at least one of, transmitting the updated second index information to the IRS, and based on the updated second index information, a reference to which the second beamforming is applied from the base station.
  • a signal may be received through the IRS.
  • a base station of a wireless communication system includes a transceiver and a processor connected to the transceiver, and the processor transmits a reference signal to which a first beamforming is applied to a terminal through an IRS through the transceiver. and receives second index information updated from the first index information through the IRS through the transceiver, and transmits a reference signal to which the second beamforming is applied through the transceiver to the terminal through the IRS.
  • Transmits related first index information to the IRS obtains at least one of compensation value information and channel state information through a reference signal to which the first beamforming is applied, and uses at least one of the compensation value information and channel state information
  • the first index information may be updated with second index information, and the second index information may be transmitted to the IRS.
  • the at least one processor includes an IRS control value and Transmits related first index information to the IRS, receives a reference signal to which the first beamforming is applied from the base station through the IRS, and obtains at least one of compensation value information and channel state information based on the received reference signal, , update the first index information to the second index information through at least one of compensation value information and channel state information, transmit the updated second index information to the IRS, and base station based on the updated second index information
  • a reference signal to which the second beamforming is applied may be received through the IRS.
  • a non-transitory computer-readable medium storing at least one instruction, executable by a processor It includes at least one command, wherein the at least one command transmits first index information related to the IRS control value to the IRS, receives a reference signal to which the first beamforming is applied from the base station through the IRS, and receives the Obtaining at least one of compensation value information and channel state information based on the reference signal, updating the first index information to second index information through at least one of the compensation value information and the channel state information, and 2 index information may be transmitted to the IRS, and based on the updated second index information, a reference signal to which the second beamforming is applied may be received from the base station through the IRS.
  • the following items may be commonly applied to the above-described base station, terminal, device, and computer recording medium.
  • an IRS control value may be determined based on index information, and each phase value within an IRS element may be determined based on the determined IRS control value.
  • index information is information generated through a codebook based on a set of IRS direction vectors, and the index information may consist of a first factor based on an IRS azimuth and a second factor based on an IRS elevation angle.
  • a terminal receives a reference signal for initial value setting from a base station, and transmits channel state information and location information of the terminal obtained through the received reference signal for initial value setting to the base station.
  • Feedback and the terminal may receive artificial intelligence initial value information derived based on the location information of the terminal and the channel state information received by the base station from the base station.
  • the terminal may further receive candidate set information related to the index information from the base station.
  • the terminal may derive first index information based on the received artificial intelligence initial value information and candidate set information.
  • the base station may determine the first beamforming based on the location of the IRS when performing initial configuration with the IRS.
  • the IRS when the IRS updates the first index information to the second index information, the IRS transmits a radio environment change completion signal including the second index information to the base station, and the base station Second beamforming may be determined based on the 2 index information.
  • the terminal includes an artificial intelligence beam selector, and the artificial intelligence beam selector updates first index information to second index information through at least one of compensation value information and channel state information can do.
  • the artificial intelligence beam selector converts first index information into second index information based on any one of a multi-armed bandit (MAB) artificial intelligence (AI) learning model and a reinforcement learning learning model.
  • MAB multi-armed bandit
  • AI artificial intelligence
  • the artificial intelligence beam selector updates the first index information to the second index information based on the MAB AI learning model
  • the second index information is obtained through learning based on compensation value information.
  • Second index information may be acquired through learning based on state information and compensation value information.
  • the terminal includes an IRS performance measurer, and the IRS performance measurer may generate compensation value information using channel related information obtained through a reference signal.
  • Embodiments based on the present disclosure may provide a method for transmitting and receiving signals between a terminal and a base station using an intelligent reflector.
  • Embodiments based on the present disclosure may provide a method for transmitting and receiving signals between a terminal and a base station based on an intelligent radio channel environment.
  • Embodiments based on the present disclosure may provide a method for controlling a passive intelligent reflector based on an artificial intelligence system.
  • Embodiments based on the present disclosure may provide a method for transmitting and receiving signals between a terminal and a base station by controlling a passive intelligent reflector.
  • Effects obtainable in the embodiments of the present disclosure are not limited to the above-mentioned effects, and other effects not mentioned are technical fields to which the technical configuration of the present disclosure is applied from the description of the following embodiments of the present disclosure. can be clearly derived and understood by those skilled in the art. That is, unintended effects according to implementing the configuration described in the present disclosure may also be derived by those skilled in the art from the embodiments of the present disclosure.
  • FIG. 1 is a diagram illustrating an example of a communication system applicable to the present disclosure.
  • FIG. 2 is a diagram illustrating an example of a wireless device applicable to the present disclosure.
  • FIG. 3 is a diagram illustrating another example of a wireless device applicable to the present disclosure.
  • FIG. 4 is a diagram illustrating an example of a portable device applicable to the present disclosure.
  • FIG. 5 is a diagram illustrating an example of a vehicle or autonomous vehicle applicable to the present disclosure.
  • AI Artificial Intelligence
  • FIG. 7 is a diagram showing an example of a communication structure that can be provided in a 6G system applicable to the present disclosure.
  • FIG. 8 is a diagram showing an electromagnetic spectrum applicable to the present disclosure.
  • FIG. 9 is a diagram illustrating a radio channel environment according to an embodiment of the present disclosure.
  • FIG. 10 is a diagram illustrating an intelligent wireless environment according to an embodiment of the present disclosure.
  • FIG. 11 is a diagram illustrating an existing radio channel environment and an intelligent radio channel environment according to an embodiment of the present disclosure.
  • FIG. 12 is a diagram illustrating a method of performing optimization in an intelligent radio channel environment according to an embodiment of the present disclosure.
  • FIG. 13 is a diagram illustrating a confidence interval according to an embodiment of the present disclosure.
  • FIG. 14 is a diagram illustrating a method of performing optimization in a passive-based intelligent wireless channel environment according to an embodiment of the present disclosure.
  • 15 is a diagram illustrating a signal flow between a base station, a terminal, and an IRS to configure an optimized intelligent wireless environment (SRE) according to an embodiment of the present disclosure.
  • SRE optimized intelligent wireless environment
  • 16 is a diagram illustrating a signal flow between a base station, an IRS, and a terminal when an artificial intelligence beam selector is implemented in a terminal according to an embodiment of the present disclosure.
  • 17 may be a flowchart illustrating a method of setting an optimized intelligent wireless environment according to an embodiment of the present disclosure.
  • 18 is a diagram showing the structure of an SRE artificial intelligence system using reinforcement learning according to an embodiment of the present disclosure.
  • FIG. 19 may be a diagram in which components of an environment are further subdivided based on FIG. 18 .
  • 20 is a diagram illustrating use blocks of a terminal and a base station among environmental components in an artificial intelligence beam selector according to an embodiment of the present disclosure.
  • 21 is a diagram showing the structure of an artificial intelligence beam selector according to an embodiment of the present disclosure.
  • FIG. 22 is a diagram illustrating a method of implementing an artificial intelligence beam selector through MAB AI according to an embodiment of the present disclosure.
  • FIG. 23 is a diagram illustrating a method of implementing an artificial intelligence beam selector through reinforcement learning according to an embodiment of the present disclosure.
  • 24 is a diagram showing total regret using a greedy method according to an embodiment of the present disclosure.
  • FIG 25 shows the structure of an IRS performance measurer according to an embodiment of the present invention.
  • 26 is a diagram illustrating a method of setting an artificial intelligence initial value according to an embodiment of the present disclosure.
  • 27 may be a case where an artificial intelligence beam selector is implemented in a terminal according to an embodiment of the present disclosure.
  • FIG. 28 is a diagram showing the structure of an SRE artificial intelligence system including an artificial intelligence initial value setter according to an embodiment of the present disclosure.
  • 29 is a diagram showing an example of an artificial intelligence coding initial value setter applicable to the present disclosure.
  • FIG. 30 is a diagram illustrating a method of performing wireless environment optimization based on an artificial intelligence system according to an embodiment of the present disclosure.
  • each component or feature may be considered optional unless explicitly stated otherwise.
  • Each component or feature may be implemented in a form not combined with other components or features.
  • an embodiment of the present disclosure may be configured by combining some elements and/or features. The order of operations described in the embodiments of the present disclosure may be changed. Some components or features of one embodiment may be included in another embodiment, or may be replaced with corresponding components or features of another embodiment.
  • a base station has meaning as a terminal node of a network that directly communicates with a mobile station.
  • a specific operation described as being performed by a base station in this document may be performed by an upper node of the base station in some cases.
  • the 'base station' is a term such as a fixed station, Node B, eNode B, gNode B, ng-eNB, advanced base station (ABS), or access point. can be replaced by
  • a terminal includes a user equipment (UE), a mobile station (MS), a subscriber station (SS), a mobile subscriber station (MSS), It may be replaced with terms such as mobile terminal or advanced mobile station (AMS).
  • UE user equipment
  • MS mobile station
  • SS subscriber station
  • MSS mobile subscriber station
  • AMS advanced mobile station
  • the transmitting end refers to a fixed and/or mobile node providing data service or voice service
  • the receiving end refers to a fixed and/or mobile node receiving data service or voice service. Therefore, in the case of uplink, the mobile station can be a transmitter and the base station can be a receiver. Similarly, in the case of downlink, the mobile station may be a receiving end and the base station may be a transmitting end.
  • Embodiments of the present disclosure are wireless access systems, such as an IEEE 802.xx system, a 3rd Generation Partnership Project (3GPP) system, a 3GPP Long Term Evolution (LTE) system, a 3GPP 5G (5th generation) NR (New Radio) system, and a 3GPP2 system. It may be supported by at least one disclosed standard document, and in particular, the embodiments of the present disclosure are supported by 3GPP technical specification (TS) 38.211, 3GPP TS 38.212, 3GPP TS 38.213, 3GPP TS 38.321 and 3GPP TS 38.331 documents It can be.
  • 3GPP technical specification TS 38.211, 3GPP TS 38.212, 3GPP TS 38.213, 3GPP TS 38.321 and 3GPP TS 38.331 documents It can be.
  • embodiments of the present disclosure may be applied to other wireless access systems, and are not limited to the above-described systems.
  • it may also be applicable to a system applied after the 3GPP 5G NR system, and is not limited to a specific system.
  • CDMA code division multiple access
  • FDMA frequency division multiple access
  • TDMA time division multiple access
  • OFDMA orthogonal frequency division multiple access
  • SC-FDMA single carrier frequency division multiple access
  • LTE is 3GPP TS 36.xxx Release 8 or later
  • LTE technology after 3GPP TS 36.xxx Release 10 is referred to as LTE-A
  • xxx Release 13 may be referred to as LTE-A pro.
  • 3GPP NR may mean technology after TS 38.xxx Release 15.
  • 3GPP 6G may mean technology after TS Release 17 and/or Release 18.
  • "xxx" means a standard document detail number.
  • LTE/NR/6G may be collectively referred to as a 3GPP system.
  • FIG. 1 is a diagram illustrating an example of a communication system applied to the present disclosure.
  • a communication system 100 applied to the present disclosure includes a wireless device, a base station, and a network.
  • the wireless device means a device that performs communication using a radio access technology (eg, 5G NR, LTE), and may be referred to as a communication/wireless/5G device.
  • the wireless device includes a robot 100a, a vehicle 100b-1 and 100b-2, an extended reality (XR) device 100c, a hand-held device 100d, and a home appliance. appliance) 100e, Internet of Thing (IoT) device 100f, and artificial intelligence (AI) device/server 100g.
  • a radio access technology eg, 5G NR, LTE
  • XR extended reality
  • IoT Internet of Thing
  • AI artificial intelligence
  • the vehicle may include a vehicle equipped with a wireless communication function, an autonomous vehicle, a vehicle capable of performing inter-vehicle communication, and the like.
  • the vehicles 100b-1 and 100b-2 may include an unmanned aerial vehicle (UAV) (eg, a drone).
  • UAV unmanned aerial vehicle
  • the XR device 100c includes augmented reality (AR)/virtual reality (VR)/mixed reality (MR) devices, and includes a head-mounted device (HMD), a head-up display (HUD) installed in a vehicle, a television, It may be implemented in the form of smart phones, computers, wearable devices, home appliances, digital signage, vehicles, robots, and the like.
  • the mobile device 100d may include a smart phone, a smart pad, a wearable device (eg, a smart watch, a smart glass), a computer (eg, a laptop computer), and the like.
  • the home appliance 100e may include a TV, a refrigerator, a washing machine, and the like.
  • the IoT device 100f may include a sensor, a smart meter, and the like.
  • the base station 120 and the network 130 may also be implemented as a wireless device, and a specific wireless device 120a may operate as a base station/network node to other wireless devices.
  • the wireless devices 100a to 100f may be connected to the network 130 through the base station 120 .
  • AI technology may be applied to the wireless devices 100a to 100f, and the wireless devices 100a to 100f may be connected to the AI server 100g through the network 130.
  • the network 130 may be configured using a 3G network, a 4G (eg LTE) network, or a 5G (eg NR) network.
  • the wireless devices 100a to 100f may communicate with each other through the base station 120/network 130, but communicate directly without going through the base station 120/network 130 (e.g., sidelink communication). You may.
  • the vehicles 100b-1 and 100b-2 may perform direct communication (eg, vehicle to vehicle (V2V)/vehicle to everything (V2X) communication).
  • the IoT device 100f eg, sensor
  • the IoT device 100f may directly communicate with other IoT devices (eg, sensor) or other wireless devices 100a to 100f.
  • FIG. 2 is a diagram illustrating an example of a wireless device applicable to the present disclosure.
  • a first wireless device 200a and a second wireless device 200b may transmit and receive radio signals through various wireless access technologies (eg, LTE and NR).
  • ⁇ the first wireless device 200a, the second wireless device 200b ⁇ denotes the ⁇ wireless device 100x and the base station 120 ⁇ of FIG. 1 and/or the ⁇ wireless device 100x and the wireless device 100x.
  • can correspond.
  • the first wireless device 200a includes one or more processors 202a and one or more memories 204a, and may further include one or more transceivers 206a and/or one or more antennas 208a.
  • the processor 202a controls the memory 204a and/or the transceiver 206a and may be configured to implement the descriptions, functions, procedures, suggestions, methods and/or operational flow diagrams disclosed herein.
  • the processor 202a may process information in the memory 204a to generate first information/signal, and transmit a radio signal including the first information/signal through the transceiver 206a.
  • the processor 202a may receive a radio signal including the second information/signal through the transceiver 206a and store information obtained from signal processing of the second information/signal in the memory 204a.
  • the memory 204a may be connected to the processor 202a and may store various information related to the operation of the processor 202a.
  • memory 204a may perform some or all of the processes controlled by processor 202a, or instructions for performing the descriptions, functions, procedures, suggestions, methods, and/or flowcharts of operations disclosed herein. It may store software codes including them.
  • the processor 202a and the memory 204a may be part of a communication modem/circuit/chip designed to implement a wireless communication technology (eg, LTE, NR).
  • the transceiver 206a may be coupled to the processor 202a and may transmit and/or receive wireless signals through one or more antennas 208a.
  • the transceiver 206a may include a transmitter and/or a receiver.
  • the transceiver 206a may be used interchangeably with a radio frequency (RF) unit.
  • RF radio frequency
  • a wireless device may mean a communication modem/circuit/chip.
  • the second wireless device 200b includes one or more processors 202b, one or more memories 204b, and may further include one or more transceivers 206b and/or one or more antennas 208b.
  • the processor 202b controls the memory 204b and/or the transceiver 206b and may be configured to implement the descriptions, functions, procedures, suggestions, methods and/or operational flow diagrams disclosed herein.
  • the processor 202b may process information in the memory 204b to generate third information/signal, and transmit a radio signal including the third information/signal through the transceiver 206b.
  • the processor 202b may receive a radio signal including the fourth information/signal through the transceiver 206b and store information obtained from signal processing of the fourth information/signal in the memory 204b.
  • the memory 204b may be connected to the processor 202b and may store various information related to the operation of the processor 202b.
  • the memory 204b may perform some or all of the processes controlled by the processor 202b, or instructions for performing the descriptions, functions, procedures, suggestions, methods, and/or flowcharts of operations disclosed herein. It may store software codes including them.
  • the processor 202b and the memory 204b may be part of a communication modem/circuit/chip designed to implement a wireless communication technology (eg, LTE, NR).
  • the transceiver 206b may be coupled to the processor 202b and may transmit and/or receive wireless signals through one or more antennas 208b.
  • the transceiver 206b may include a transmitter and/or a receiver.
  • the transceiver 206b may be used interchangeably with an RF unit.
  • a wireless device may mean a communication modem/circuit/chip.
  • one or more protocol layers may be implemented by one or more processors 202a, 202b.
  • the one or more processors 202a and 202b may include one or more layers (eg, PHY (physical), MAC (media access control), RLC (radio link control), PDCP (packet data convergence protocol), RRC (radio resource) control) and functional layers such as service data adaptation protocol (SDAP).
  • One or more processors 202a, 202b may generate one or more protocol data units (PDUs) and/or one or more service data units (SDUs) according to the descriptions, functions, procedures, proposals, methods, and/or operational flow charts disclosed herein.
  • PDUs protocol data units
  • SDUs service data units
  • processors 202a, 202b may generate messages, control information, data or information according to the descriptions, functions, procedures, proposals, methods and/or operational flow diagrams disclosed herein.
  • One or more processors 202a, 202b generate PDUs, SDUs, messages, control information, data or signals (eg, baseband signals) containing information according to the functions, procedures, proposals and/or methods disclosed herein , may be provided to one or more transceivers 206a and 206b.
  • One or more processors 202a, 202b may receive signals (eg, baseband signals) from one or more transceivers 206a, 206b, and descriptions, functions, procedures, suggestions, methods, and/or flowcharts of operations disclosed herein PDUs, SDUs, messages, control information, data or information can be obtained according to these.
  • signals eg, baseband signals
  • One or more processors 202a, 202b may be referred to as a controller, microcontroller, microprocessor or microcomputer.
  • One or more processors 202a, 202b may be implemented by hardware, firmware, software, or a combination thereof.
  • ASICs application specific integrated circuits
  • DSPs digital signal processors
  • DSPDs digital signal processing devices
  • PLDs programmable logic devices
  • FPGAs field programmable gate arrays
  • firmware or software may be implemented using firmware or software, and the firmware or software may be implemented to include modules, procedures, functions, and the like.
  • Firmware or software configured to perform the descriptions, functions, procedures, proposals, methods and/or operational flow charts disclosed in this document may be included in one or more processors 202a or 202b or stored in one or more memories 204a or 204b. It can be driven by the above processors 202a and 202b.
  • the descriptions, functions, procedures, suggestions, methods and/or operational flow charts disclosed in this document may be implemented using firmware or software in the form of codes, instructions and/or sets of instructions.
  • One or more memories 204a, 204b may be coupled to one or more processors 202a, 202b and may store various types of data, signals, messages, information, programs, codes, instructions and/or instructions.
  • One or more memories 204a, 204b may include read only memory (ROM), random access memory (RAM), erasable programmable read only memory (EPROM), flash memory, hard drive, registers, cache memory, computer readable storage media, and/or It may consist of a combination of these.
  • One or more memories 204a, 204b may be located internally and/or externally to one or more processors 202a, 202b.
  • one or more memories 204a, 204b may be connected to one or more processors 202a, 202b through various technologies such as wired or wireless connections.
  • One or more transceivers 206a, 206b may transmit user data, control information, radio signals/channels, etc. referred to in the methods and/or operational flow charts of this document to one or more other devices.
  • One or more transceivers 206a, 206b may receive user data, control information, radio signals/channels, etc. referred to in descriptions, functions, procedures, proposals, methods and/or operational flow charts, etc. disclosed herein from one or more other devices. there is.
  • one or more transceivers 206a and 206b may be connected to one or more processors 202a and 202b and transmit and receive radio signals.
  • one or more processors 202a, 202b may control one or more transceivers 206a, 206b to transmit user data, control information, or radio signals to one or more other devices.
  • one or more processors 202a, 202b may control one or more transceivers 206a, 206b to receive user data, control information, or radio signals from one or more other devices.
  • one or more transceivers 206a, 206b may be coupled to one or more antennas 208a, 208b, and one or more transceivers 206a, 206b may be connected to one or more antennas 208a, 208b to achieve the descriptions, functions disclosed in this document.
  • one or more antennas may be a plurality of physical antennas or a plurality of logical antennas (eg, antenna ports).
  • One or more transceivers (206a, 206b) in order to process the received user data, control information, radio signal / channel, etc. using one or more processors (202a, 202b), the received radio signal / channel, etc. in the RF band signal It can be converted into a baseband signal.
  • One or more transceivers 206a and 206b may convert user data, control information, and radio signals/channels processed by one or more processors 202a and 202b from baseband signals to RF band signals.
  • one or more transceivers 206a, 206b may include (analog) oscillators and/or filters.
  • FIG. 3 is a diagram illustrating another example of a wireless device applied to the present disclosure.
  • a wireless device 300 corresponds to the wireless devices 200a and 200b of FIG. 2, and includes various elements, components, units/units, and/or modules. ) can be configured.
  • the wireless device 300 may include a communication unit 310, a control unit 320, a memory unit 330, and an additional element 340.
  • the communication unit may include communication circuitry 312 and transceiver(s) 314 .
  • communication circuitry 312 may include one or more processors 202a, 202b of FIG. 2 and/or one or more memories 204a, 204b.
  • transceiver(s) 314 may include one or more transceivers 206a, 206b of FIG.
  • the control unit 320 is electrically connected to the communication unit 310, the memory unit 330, and the additional element 340 and controls overall operations of the wireless device. For example, the control unit 320 may control electrical/mechanical operations of the wireless device based on programs/codes/commands/information stored in the memory unit 330. In addition, the controller 320 transmits the information stored in the memory unit 330 to the outside (eg, another communication device) through the communication unit 310 through a wireless/wired interface, or transmits the information stored in the memory unit 330 to the outside (eg, another communication device) through the communication unit 310. Information received through a wireless/wired interface from other communication devices) may be stored in the memory unit 330 .
  • the additional element 340 may be configured in various ways according to the type of wireless device.
  • the additional element 340 may include at least one of a power unit/battery, an input/output unit, a driving unit, and a computing unit.
  • the wireless device 300 may be a robot (FIG. 1, 100a), a vehicle (FIG. 1, 100b-1, 100b-2), an XR device (FIG. 1, 100c), a mobile device (FIG. 1, 100d) ), home appliances (FIG. 1, 100e), IoT devices (FIG.
  • Wireless devices can be mobile or used in a fixed location depending on the use-case/service.
  • various elements, components, units/units, and/or modules in the wireless device 300 may be entirely interconnected through a wired interface or at least partially connected wirelessly through the communication unit 310 .
  • the control unit 320 and the communication unit 310 are connected by wire, and the control unit 320 and the first units (eg, 130 and 140) are connected wirelessly through the communication unit 310.
  • each element, component, unit/unit, and/or module within wireless device 300 may further include one or more elements.
  • the control unit 320 may be composed of one or more processor sets.
  • control unit 320 may include a set of a communication control processor, an application processor, an electronic control unit (ECU), a graphic processing processor, a memory control processor, and the like.
  • memory unit 330 may include RAM, dynamic RAM (DRAM), ROM, flash memory, volatile memory, non-volatile memory, and/or combinations thereof. can be configured.
  • FIG. 4 is a diagram illustrating an example of a portable device applied to the present disclosure.
  • a portable device may include a smart phone, a smart pad, a wearable device (eg, smart watch, smart glasses), and a portable computer (eg, a laptop computer).
  • a mobile device may be referred to as a mobile station (MS), a user terminal (UT), a mobile subscriber station (MSS), a subscriber station (SS), an advanced mobile station (AMS), or a wireless terminal (WT).
  • MS mobile station
  • UT user terminal
  • MSS mobile subscriber station
  • SS subscriber station
  • AMS advanced mobile station
  • WT wireless terminal
  • a portable device 400 includes an antenna unit 408, a communication unit 410, a control unit 420, a memory unit 430, a power supply unit 440a, an interface unit 440b, and an input/output unit 440c. ) may be included.
  • the antenna unit 408 may be configured as part of the communication unit 410 .
  • Blocks 410 to 430/440a to 440c respectively correspond to blocks 310 to 330/340 of FIG. 3 .
  • the communication unit 410 may transmit/receive signals (eg, data, control signals, etc.) with other wireless devices and base stations.
  • the controller 420 may perform various operations by controlling components of the portable device 400 .
  • the controller 420 may include an application processor (AP).
  • the memory unit 430 may store data/parameters/programs/codes/commands necessary for driving the portable device 400 . Also, the memory unit 430 may store input/output data/information.
  • the power supply unit 440a supplies power to the portable device 400 and may include a wired/wireless charging circuit, a battery, and the like.
  • the interface unit 440b may support connection between the portable device 400 and other external devices.
  • the interface unit 440b may include various ports (eg, audio input/output ports and video input/output ports) for connection with external devices.
  • the input/output unit 440c may receive or output image information/signal, audio information/signal, data, and/or information input from a user.
  • the input/output unit 440c may include a camera, a microphone, a user input unit, a display unit 440d, a speaker, and/or a haptic module.
  • the input/output unit 440c acquires information/signals (eg, touch, text, voice, image, video) input from the user, and the acquired information/signals are stored in the memory unit 430.
  • the communication unit 410 may convert the information/signal stored in the memory into a wireless signal, and directly transmit the converted wireless signal to another wireless device or to a base station.
  • the communication unit 410 may receive a radio signal from another wireless device or base station and then restore the received radio signal to original information/signal. After the restored information/signal is stored in the memory unit 430, it may be output in various forms (eg, text, voice, image, video, or haptic) through the input/output unit 440c.
  • FIG. 5 is a diagram illustrating an example of a vehicle or autonomous vehicle to which the present disclosure applies.
  • a vehicle or an autonomous vehicle may be implemented as a mobile robot, vehicle, train, manned/unmanned aerial vehicle (AV), ship, etc., and is not limited to a vehicle type.
  • AV unmanned aerial vehicle
  • a vehicle or autonomous vehicle 500 includes an antenna unit 508, a communication unit 510, a control unit 520, a driving unit 540a, a power supply unit 540b, a sensor unit 540c, and an autonomous driving unit.
  • a portion 540d may be included.
  • the antenna unit 550 may be configured as a part of the communication unit 510 .
  • Blocks 510/530/540a to 540d respectively correspond to blocks 410/430/440 of FIG. 4 .
  • the communication unit 510 may transmit/receive signals (eg, data, control signals, etc.) with external devices such as other vehicles, base stations (eg, base stations, roadside base units, etc.), servers, and the like.
  • the controller 520 may perform various operations by controlling elements of the vehicle or autonomous vehicle 500 .
  • the controller 520 may include an electronic control unit (ECU).
  • ECU electronice control unit
  • AI devices include TVs, projectors, smartphones, PCs, laptops, digital broadcasting terminals, tablet PCs, wearable devices, set-top boxes (STBs), radios, washing machines, refrigerators, digital signage, robots, vehicles, etc. It may be implemented as a device or a movable device.
  • the AI device 600 includes a communication unit 610, a control unit 620, a memory unit 630, an input/output unit 640a/640b, a running processor unit 640c, and a sensor unit 640d.
  • a communication unit 610 can include a communication unit 610, a control unit 620, a memory unit 630, an input/output unit 640a/640b, a running processor unit 640c, and a sensor unit 640d.
  • Blocks 910 to 930/940a to 940d may respectively correspond to blocks 310 to 330/340 of FIG. 3 .
  • the communication unit 610 communicates wired and wireless signals (eg, sensor information, user data) with external devices such as other AI devices (eg, FIG. 1, 100x, 120, and 140) or AI servers (Fig. input, learning model, control signal, etc.) can be transmitted and received. To this end, the communication unit 610 may transmit information in the memory unit 630 to an external device or transmit a signal received from the external device to the memory unit 630 .
  • external devices eg, sensor information, user data
  • AI devices eg, FIG. 1, 100x, 120, and 140
  • AI servers Fig. input, learning model, control signal, etc.
  • the controller 620 may determine at least one executable operation of the AI device 600 based on information determined or generated using a data analysis algorithm or a machine learning algorithm. And, the controller 620 may perform the determined operation by controlling components of the AI device 600 . For example, the control unit 620 may request, retrieve, receive, or utilize data from the learning processor unit 640c or the memory unit 630, and may perform a predicted operation among at least one feasible operation or one determined to be desirable. Components of the AI device 600 may be controlled to execute an operation. In addition, the control unit 920 collects history information including user feedback on the operation contents or operation of the AI device 600 and stores it in the memory unit 630 or the running processor unit 640c, or the AI server ( 1, 140) can be transmitted to an external device. The collected history information can be used to update the learning model.
  • the memory unit 630 may store data supporting various functions of the AI device 600 .
  • the memory unit 630 may store data obtained from the input unit 640a, data obtained from the communication unit 610, output data of the learning processor unit 640c, and data obtained from the sensing unit 640.
  • the memory unit 930 may store control information and/or software codes required for operation/execution of the control unit 620 .
  • the input unit 640a may obtain various types of data from the outside of the AI device 600.
  • the input unit 620 may obtain learning data for model learning and input data to which the learning model is to be applied.
  • the input unit 640a may include a camera, a microphone, and/or a user input unit.
  • the output unit 640b may generate an output related to sight, hearing, or touch.
  • the output unit 640b may include a display unit, a speaker, and/or a haptic module.
  • the sensing unit 640 may obtain at least one of internal information of the AI device 600, surrounding environment information of the AI device 600, and user information by using various sensors.
  • the sensing unit 640 may include a proximity sensor, an illuminance sensor, an acceleration sensor, a magnetic sensor, a gyro sensor, an inertial sensor, an RGB sensor, an IR sensor, a fingerprint recognition sensor, an ultrasonic sensor, an optical sensor, a microphone, and/or a radar. there is.
  • the learning processor unit 640c may learn a model composed of an artificial neural network using learning data.
  • the running processor unit 640c may perform AI processing together with the running processor unit of the AI server (FIG. 1, 140).
  • the learning processor unit 640c may process information received from an external device through the communication unit 610 and/or information stored in the memory unit 630 .
  • the output value of the learning processor unit 940c may be transmitted to an external device through the communication unit 610 and/or stored in the memory unit 630.
  • 6G (radio communications) systems are characterized by (i) very high data rates per device, (ii) very large number of connected devices, (iii) global connectivity, (iv) very low latency, (v) battery- It aims to lower energy consumption of battery-free IoT devices, (vi) ultra-reliable connectivity, and (vii) connected intelligence with machine learning capabilities.
  • the vision of the 6G system can be four aspects such as “intelligent connectivity”, “deep connectivity”, “holographic connectivity”, and “ubiquitous connectivity”, and the 6G system can satisfy the requirements shown in Table 1 below. That is, Table 1 is a table showing the requirements of the 6G system.
  • the 6G system is enhanced mobile broadband (eMBB), ultra-reliable low latency communications (URLLC), mMTC (massive machine type communications), AI integrated communication, tactile Internet (tactile internet), high throughput, high network capacity, high energy efficiency, low backhaul and access network congestion and improved data security ( can have key factors such as enhanced data security.
  • eMBB enhanced mobile broadband
  • URLLC ultra-reliable low latency communications
  • mMTC massive machine type communications
  • AI integrated communication e.g., AI integrated communication
  • tactile Internet tactile internet
  • high throughput high network capacity
  • high energy efficiency high backhaul and access network congestion
  • improved data security can have key factors such as enhanced data security.
  • FIG. 7 is a diagram illustrating an example of a communication structure that can be provided in a 6G system applicable to the present disclosure.
  • a 6G system is expected to have 50 times higher simultaneous wireless communication connectivity than a 5G wireless communication system.
  • URLLC a key feature of 5G, is expected to become a more mainstream technology by providing end-to-end latency of less than 1 ms in 6G communications.
  • the 6G system will have much better volume spectral efficiency, unlike the frequently used area spectral efficiency.
  • 6G systems can provide very long battery life and advanced battery technology for energy harvesting, so mobile devices in 6G systems may not need to be charged separately.
  • AI The most important and newly introduced technology for the 6G system is AI.
  • AI was not involved in the 4G system.
  • 5G systems will support partial or very limited AI.
  • the 6G system will be AI-enabled for full automation.
  • Advances in machine learning will create more intelligent networks for real-time communication in 6G.
  • Introducing AI in communications can simplify and enhance real-time data transmission.
  • AI can use a plethora of analytics to determine how complex target tasks are performed. In other words, AI can increase efficiency and reduce processing delays.
  • AI can also play an important role in machine-to-machine, machine-to-human and human-to-machine communications.
  • AI can be a rapid communication in the brain computer interface (BCI).
  • BCI brain computer interface
  • AI-based communication systems can be supported by metamaterials, intelligent structures, intelligent networks, intelligent devices, intelligent cognitive radios, self-sustaining wireless networks, and machine learning.
  • AI-based physical layer transmission means applying a signal processing and communication mechanism based on an AI driver rather than a traditional communication framework in fundamental signal processing and communication mechanisms. For example, deep learning-based channel coding and decoding, deep learning-based signal estimation and detection, deep learning-based multiple input multiple output (MIMO) mechanism, It may include AI-based resource scheduling and allocation.
  • MIMO multiple input multiple output
  • Machine learning may be used for channel estimation and channel tracking, and may be used for power allocation, interference cancellation, and the like in a downlink (DL) physical layer. Machine learning can also be used for antenna selection, power control, symbol detection, and the like in a MIMO system.
  • DL downlink
  • AI algorithms based on deep learning require a lot of training data to optimize training parameters.
  • a lot of training data is used offline. This is because static training on training data in a specific channel environment may cause a contradiction between dynamic characteristics and diversity of a radio channel.
  • Machine learning refers to a set of actions that train a machine to create a machine that can do tasks that humans can or cannot do.
  • Machine learning requires data and a running model.
  • data learning methods can be largely classified into three types: supervised learning, unsupervised learning, and reinforcement learning.
  • Neural network training is aimed at minimizing errors in the output.
  • Neural network learning repeatedly inputs training data to the neural network, calculates the output of the neural network for the training data and the error of the target, and backpropagates the error of the neural network from the output layer of the neural network to the input layer in a direction to reduce the error. ) to update the weight of each node in the neural network.
  • Supervised learning uses training data in which correct answers are labeled in the learning data, and unsupervised learning may not have correct answers labeled in the learning data. That is, for example, learning data in the case of supervised learning related to data classification may be data in which each learning data is labeled with a category. Labeled training data is input to the neural network, and an error may be calculated by comparing the output (category) of the neural network and the label of the training data. The calculated error is back-propagated in a reverse direction (ie, from the output layer to the input layer) in the neural network, and the connection weight of each node of each layer of the neural network may be updated according to the back-propagation.
  • a reverse direction ie, from the output layer to the input layer
  • the amount of change in the connection weight of each updated node may be determined according to a learning rate.
  • the neural network's computation of input data and backpropagation of errors can constitute a learning cycle (epoch).
  • the learning rate may be applied differently according to the number of iterations of the learning cycle of the neural network. For example, a high learning rate is used in the early stages of neural network learning to increase efficiency by allowing the neural network to quickly achieve a certain level of performance, and a low learning rate can be used in the late stage to increase accuracy.
  • the learning method may vary depending on the characteristics of the data. For example, in a case where the purpose of the receiver is to accurately predict data transmitted by the transmitter in a communication system, it is preferable to perform learning using supervised learning rather than unsupervised learning or reinforcement learning.
  • the learning model corresponds to the human brain, and the most basic linear model can be considered. ) is called
  • the neural network cord used as a learning method is largely divided into deep neural networks (DNN), convolutional deep neural networks (CNN), and recurrent boltzmann machine (RNN). and this learning model can be applied.
  • DNN deep neural networks
  • CNN convolutional deep neural networks
  • RNN recurrent boltzmann machine
  • THz communication can be applied in 6G systems.
  • the data transmission rate can be increased by increasing the bandwidth. This can be done using sub-THz communication with wide bandwidth and applying advanced massive MIMO technology.
  • THz waves also known as sub-millimeter radiation
  • THz waves generally represent a frequency band between 0.1 THz and 10 THz with corresponding wavelengths in the range of 0.03 mm-3 mm.
  • the 100 GHz-300 GHz band range (sub THz band) is considered a major part of the THz band for cellular communications. Adding to the sub-THz band mmWave band will increase 6G cellular communications capacity.
  • 300 GHz-3 THz is in the far infrared (IR) frequency band.
  • the 300 GHz-3 THz band is part of the broad band, but is at the border of the wide band, just behind the RF band. Thus, this 300 GHz to 3 THz band exhibits similarities to RF.
  • THz communications include (i) widely available bandwidth to support very high data rates, and (ii) high path loss at high frequencies (highly directional antennas are indispensable).
  • the narrow beamwidth produced by the highly directional antenna reduces interference.
  • the small wavelength of the THz signal allows a much larger number of antenna elements to be incorporated into devices and BSs operating in this band. This enables advanced adaptive array technology to overcome range limitations.
  • the artificial intelligence system can be used to adjust the radio channel environment using the IRS, which will also be described later.
  • the current wireless communication technology can be controlled through end-point optimization that adapts to the channel environment (H). For example, when optimization is performed in a transmitter and a receiver, the transmitter and receiver adjust at least one of beamforming, power control, and adaptive modulation according to the channel environment (H) between the transmitter and the receiver to increase transmission efficiency.
  • H channel environment
  • the channel environment may be random, uncontrolled, and naturally fixed. That is, in the existing communication system, a method of controlling each end point to be optimized for the channel environment while the channel environment is fixed may be performed. Therefore, the transmitter and the receiver have no choice but to perform optimization to adapt to the channel and transmit/receive data through this optimization.
  • NLOS non-line of sight
  • 6G THz 6G THz
  • an intelligent reflector can be used as a factor capable of controlling a wireless channel like a transceiver.
  • a factor for a radio channel may be added as a factor used to optimize wireless communication transmission.
  • a factor for a radio channel may be added as a factor used to optimize wireless communication transmission.
  • the optimization process may be complicated.
  • the passive-based intelligent reflector overcomes the limitations of channel information acquisition Describe how to do it.
  • a new communication system e.g. 6G
  • MBRLLC Mobile Broadband Reliable Low Latency Communication
  • mURLLC Massive Ultra-Reliable, Low Latency communications
  • HCS Human-Centric Services
  • 3CLS Convergence of Communications, Computing, Control, Localization, and Sensing
  • relays are currently used to increase coverage of base station cells and support for shadow areas.
  • the method using a repeater may increase transmission efficiency, but may additionally generate interference signals for other users. Therefore, a limitation may occur in terms of overall communication resource efficiency.
  • the use of a relay requires high additional cost and energy, and it may not be easy to manage complex and mixed interference signals.
  • spectrum efficiency may be reduced by using a half duplex method, and space utilization and aesthetics may also be affected.
  • the wireless channel environment can be adjusted using an intelligent reflector (IRS).
  • IIRS intelligent reflector
  • the transmitter and receiver can perform optimization together to provide a solution that can overcome Shannon's channel capacity limit in a smart radio environment, which will be described later.
  • the corresponding value may have a dependency on the optimization of the transceiver, and thus complexity may increase.
  • the AO (Alternating Optimization) algorithm used for optimization may be repeatedly performed until convergence, and may impose a burden on all channels to be measured.
  • a method for performing optimization in an intelligent wireless environment with a passive-based intelligent reflector and an artificial intelligence system are described in consideration of the above points.
  • Table 2 may be terms in consideration of the following and above, and based on this, a method for performing optimization in an intelligent wireless environment with a passive-based intelligent reflector and an artificial intelligence system are described.
  • a radio channel environment H is naturally fixed and may be in a random state that cannot be controlled. Accordingly, the transmitter 910 and the receiver 920 can find an optimized transmission/reception method by adapting to the channel.
  • the transmitter 910 and the receiver 920 may measure a channel state through a signal (eg, a reference signal), and may be controlled to perform optimization based on the measured channel state.
  • a signal eg, a reference signal
  • Equation 1 may represent the capacity limit of Shannon. At this time, even if the transmission signal P is increased by applying precoding and processing in Equation 1, there may be a limit to increasing the channel capacity if the size of the channel
  • Equation 1 In a state where the radio channel environment is fixed, there may be a limit to increasing the channel capacity based on Equation 1.
  • an intelligent reflector IMS
  • multiple paths can be secured between the transmitter 910 and the receiver 920, and the aforementioned channel
  • FIG. 10 is a diagram illustrating an intelligent wireless environment according to an embodiment of the present disclosure.
  • may be a factor for optimization. More specifically, in FIG. 9 described above, optimization may be performed in the transmitter 910 and the receiver 920 based on “max ⁇ f(Tx, Rx) ⁇ ” as the end point optimization, which is as described above. . However, in FIG. 10 , optimization may be performed in the transmitter 1010 and the receiver 1020 based on “max ⁇ f(Tx, Rx, H) ⁇ ” as the end point optimization. That is, in an intelligent wireless environment, a channel
  • the existing radio channel environment may be P1.
  • the intelligent wireless channel environment may be P2.
  • the receiving end may receive the y signal.
  • the probability of P1 is fixed in the existing radio channel environment, and the receiving end (Decoder) can transmit feedback to the transmitting end through measurement of the transmitted signal.
  • the transmitting end may perform optimization to adapt to the radio channel environment through the feedback of the receiving end.
  • the receiving end may measure a channel quality indicator (CQI) of the transmission signal based on the reference signal transmitted by the transmitting end and provide feedback thereof.
  • the transmitting end may perform communication by adjusting a modulation coding scheme (MCS) based on the feedbacked information and providing information about the modulation coding scheme to the receiving end.
  • CQI channel quality indicator
  • MCS modulation coding scheme
  • the radio channel environment P2 is recognized and the radio channel environment can be changed through IRS control.
  • the receiving end may measure the received transmission signal and transmit a feedback thereof to the transmitting end. That is, the transmitter may perform optimization by receiving feedback information based on IRS control and feedback information of the receiver. At this time, the transmitter may change the radio channel environment by adjusting the IRS, and optimization may be performed in consideration of the radio channel environment and the transmitter.
  • FIG. 12 is a diagram illustrating a method of performing optimization in an intelligent radio channel environment according to an embodiment of the present disclosure.
  • an IRS 1220 may exist between a base station 1210 and a terminal 1230 in an intelligent radio channel environment.
  • a signal transmitted by the base station 1210 may have a path directly transmitted to the terminal 1230 and a path reflected by the IRS 1220 and transmitted. That is, in an intelligent radio channel environment, a radio channel (G) between the base station 1210 and the IRS 1220 and a radio channel between the IRS 1220 and the terminal 1230 ( ) and a direct radio channel between the base station 1210 and the terminal 1230 ( ) may exist.
  • G radio channel
  • a radio channel (G) between the base station 1210 and the IRS 1220 and a radio channel between the IRS 1220 and the terminal 1230 ( ) can be changed. Accordingly, optimization in an intelligent radio channel environment may be performed in consideration of the above-described radio channel environment.
  • the base station 1210 transmits a signal to terminal k 1230
  • the base station transmission beamforming vector for terminal k 1230 is , the signal transmitted to the terminal k (1230) is and receive noise can be
  • the signal received from the base station 1210 based on the environment in which the terminal k 1230 uses the IRS 1220 may be as shown in Equation 2 below, and each channel may be as shown in Table 3 below.
  • the signal-to-noise ratio (SNR) received by terminal k 1230 may be expressed as Equation 3 below.
  • transmit beamforming of terminal k 1230 in consideration of maximum-rate transmission in MIMO May be the same as Equation 5 below.
  • the IRS control value ⁇ can be determined by arithmetic.
  • an alternating optimization (AO) algorithm may be used to solve the aforementioned optimization problem.
  • the AO algorithm uses channel information ( , , G) may be a method of determining a trust region for each IRS element, and may be as shown in FIG. 13.
  • a binary decision is repeatedly performed until the value of the objective function converges. can be obtained.
  • the IRS may repeat the above-described operation to find an optimized value for each of the above-described IRS elements.
  • the AO (Alternating Optimization) algorithm needs to be repeated until convergence.
  • complexity and computational complexity may increase.
  • complexity and amount of calculation may increase according to the number M of antennas of the base station and the number N of IRS elements, and there may be a limit to calculating them.
  • measurement values of all channels including IRS may be required, and considering the above, there may be limitations in optimization.
  • FIG. 14 is a diagram illustrating a method of performing optimization in a passive-based intelligent wireless channel environment according to an embodiment of the present disclosure.
  • an IRS equipped with an active sensor may obtain channel information by sensing a signal transmitted from a base station.
  • a passive IRS without an active sensor may transmit a signal transmitted from a base station to a terminal based on a reflector structure, but may not perform sensing. Therefore, a passive IRS without an active sensor may be less expensive to install than an IRS with an active sensor, and based on this, the possibility of utilization may be high.
  • the passive-based IRS does not have an active sensor, it is necessary to supplement insufficient channel information with artificial intelligence. That is, channel information that can be measured by an active sensor needs to be acquired through artificial intelligence.
  • the optimized IRS control value may be derived based on artificial intelligence without being affected by the number M of base station antennas and the number N of IRS elements, which will be described later.
  • a channel G between the base station 1410 and the IRS 1420 may be a channel without position change in a line of sight (LoS) environment. Therefore, the base station 1410 performs transmit beamforming on channel G. can be recognized and managed in advance.
  • the artificial intelligence beam selector 1440 may select an optimized IRS control value ⁇ and transmit the selected information to an IRS controller 1450.
  • the artificial intelligence beam selector 1440 may be a component that selects an optimized beam based on the SRE artificial intelligence system.
  • the artificial intelligence beam selector 1440 may be implemented in the base station 1410. That is, the artificial intelligence beam selector 1440 operating based on the SRE artificial intelligence system may be implemented and operated in the base station 1410. As another example, the artificial intelligence beam selector 1440 may be implemented in association with the IRS controller 1450. As another example, the artificial intelligence beam selector 1440 may be implemented and operated in the terminal 1430. As another example, the artificial intelligence beam selector 1440 may be implemented through a cloud or a separate device separately from the base station 1410, and may not be limited to a specific form.
  • the artificial intelligence beam selector 1440 may be a configuration that performs optimized beam selection based on the SRE artificial intelligence system, and among the base station 1410, the IRS controller 1450, the terminal 1430, and a separate device/cloud It may be implemented based on at least one, and may not be limited to a specific form.
  • the IRS controller 1450 uses the corresponding value ⁇ as the IRS ( 1420) can be controlled.
  • the base station 1410 based on the IRS control value described above in the IRS 1420 can be transmitted.
  • the terminal 1430 may receive the reference signal transmitted by the base station 1410 through the IRS 1420. After that, the terminal 1430 may obtain a reward value (Reward) due to the IRS control value ⁇ based on the reference signal and measure channel information. At this time, the terminal 1430 provides the compensation value and measured channel information ( ) to the base station 1410.
  • the terminal 1430 provides indicator information (eg SNR, ) may be acquired and transmitted to the base station 1410.
  • the base station 1410 may learn the artificial intelligence system based on the feedback information transmitted from the terminal 1430.
  • the base station 1410 may perform learning through the artificial intelligence beam selector 1450.
  • the base station 1410 may transfer feedback information received from the terminal 1430 to perform learning.
  • the terminal 1430 may directly perform learning through a compensation value and channel information obtained through a reference signal.
  • the artificial intelligence beam selector 1450 uses state information as the control value of the current IRS 1420 and channel information. can be used.
  • the base station 1410 transmits beamforming optimized in a new wireless environment through the optimized IRS control value ⁇ .
  • can be computed and applied. may be calculated using artificial intelligence or a beam management method used in 5G NR may be applied, and may not be limited to a specific form.
  • 15 is a diagram illustrating a signal flow between a base station, a terminal, and an IRS to configure an optimized intelligent wireless environment (SRE) according to an embodiment of the present disclosure.
  • SRE optimized intelligent wireless environment
  • the base station 1510 performs transmit beamforming for channel G as described above.
  • the base station 1510 and the IRS 1520 when the base station 1510 and the IRS 1520 perform initial configuration, may be measured through a measuring device or a mobile device, and may be preset as a measurement value.
  • the base station 1510 and the IRS 1520 periodically use a low power/low cost sensor. can be measured, and based on the measured value can be updated periodically. For example, for Maximum Transmit Rate (MRT) Can be derived as shown in Equation 7 below.
  • MRT Maximum Transmit Rate
  • the base station 1510 and the IRS 1520 do not measure channel G, can support For example, may be determined as one of values supported based on beam management or beam sweeping used in a wireless communication system (eg NR).
  • the IRS 1520 may provide channel status information (CSI) feedback to the base station 1510, through which value can be determined. After that, the base station 1510 A reference signal applied with may be transmitted to the IRS 1520.
  • the control value of the IRS may be determined based on an artificial intelligence beam selector.
  • the artificial intelligence beam selector may be associated with the IRS controller, but may not be limited thereto.
  • the IRS 1520 may separately receive information related to the IRS control value, which will be described later.
  • the artificial intelligence beam selector is the phase change value for each element of the IRS.
  • the state information is the control value of the current IRS 1520 and channel information.
  • the IRS 1520 may be set to the phase value predicted by the artificial intelligence beam selector.
  • the base station 1510 is The reference signal to which is applied ( ) to the IRS 1520, and the terminal 1530 transmits a reference signal via the IRS 1520.
  • the terminal 1530 receives a reference signal It is possible to measure a reward value (reward) based on.
  • the terminal 1530 may have an IRS performance measurer, and a compensation value may be measured through the IRS performance measurer.
  • the compensation value is the signal-to-noise ratio of the IRS channel Mean Squared Error
  • the terminal 1530 may acquire channel state information by performing measurement on a reference signal. After that, the terminal 1530 may feed back the compensation value and channel state information.
  • the artificial intelligence beam selector may be learned through an IRS phase value, a reward value, and measured channel information. For example, learning may be repeated depending on whether a reward value or a predicted phase value converges. At this time, the artificial intelligence beam selector can remove repetition by using a model learned through initial transfer learning.
  • the IRS 1520 may transmit an environment change completion signal to the base station 1510 based on learning of the artificial intelligence beam selector. Thereafter, the base station 1510 transmits a reference signal to the terminal 1530 to obtain channel state information, determines and applies transmit beamforming optimized in the newly changed environment, and performs communication with the terminal 1530.
  • 16 is a diagram illustrating a signal flow between a base station, an IRS, and a terminal when an artificial intelligence beam selector is implemented in a terminal according to an embodiment of the present disclosure.
  • an artificial intelligence beam selector may be implemented in a terminal 1630. That is, as described above, the artificial intelligence beam selector may be implemented not only in the base station 1610, the IRS 1620, and a separate cloud/device but also in the terminal 1630.
  • an artificial intelligence beam selector implemented in the terminal 1630 may determine an IRS control value.
  • the terminal 1630 is an index indicating the elevation angle and azimuth angle of the beam direction of the IRS control based on the channel information measured through the artificial intelligence beam selector and the current IRS control value (or initial value). can decide At this time, the UE 1630 may deliver the determined index information to the IRS 1620.
  • the IRS 1620 receives the index information ( ), it is possible to determine the above-described phase value. After that, the base station 1610 The reference signal to which is applied ( ) to the IRS 1620, and the terminal 1630 transmits a reference signal via the IRS 1620. can receive After that, the terminal 1630 is a reference signal It is possible to measure a reward value (reward) based on.
  • the terminal 1630 may have an IRS performance measurer, and a compensation value may be measured through the IRS performance measurer.
  • the compensation value is the signal-to-noise ratio of the IRS channel Mean Squared Error However, other types of channel related information may also be included.
  • the terminal 1630 may acquire channel state information by performing measurement on a reference signal.
  • the artificial intelligence beam selector of the terminal 1630 may perform learning based on the compensation value and the channel state information. Here, learning may be repeated until convergence.
  • the artificial intelligence beam selector can update the IRS control value, and an index indicating the elevation angle and azimuth angle of the beam direction of the IRS control based on the compensation value, channel state information, and the current IRS control value. can be updated.
  • the terminal 1630 may transmit the updated index information to the IRS 1620.
  • the IRS transmits an environment change completion signal to the base station 1610 based on the IRS control value, and the base station 1610 may obtain channel state information by sending a reference signal to the terminal 1630. Through this, the base station 1610 can perform communication with the terminal 1630 by determining and applying transmit beamforming optimized in the newly changed environment.
  • 17 may be a flowchart illustrating a method of setting an optimized intelligent wireless environment according to an embodiment of the present disclosure.
  • the channel estimation step is a beamforming vector transmitted from the base station to the IRS based on the channel information G of the base station-IRS (BS-IRS).
  • BS-IRS base station-IRS
  • the base station and the IRS may perform initial configuration for channel G based on the location of the IRS.
  • the base station and the IRS transmit beamforming through artificial intelligence without channel measurement. can decide Also, as an example, channel G may be periodically checked based on the low power sensor, as described above. That is, the base station transmits beamforming to the IRS (transmit beamforming) can be recognized and managed in advance.
  • the terminal may receive a signal from the base station in order for the terminal to acquire the above-described compensation value and channel estimation information through the IRS performance measurer.
  • the base station may transmit the signal to the terminal by transferring the signal to the IRS, and beamforming may be essential for this.
  • the environment change step may be a step of finding and applying an optimal IRS control value using an artificial intelligence beam selector.
  • the base station transmits the beamforming vector pre-calculated through the above-described channel estimation step.
  • a reference signal applied with may be delivered to the IRS. For example, the signal between the base station and the IRS If it is sufficiently large even without applying , the signal can be transmitted without the above-described process.
  • the artificial intelligence beam selector operating based on the SRE artificial intelligence system controls the control value for each element of the passive intelligent judge board (IRS).
  • IRS passive intelligent judge board
  • the artificial intelligence beam selector is supervised learning, such as AO (alternating optimization) optimization or SDR (software defined radio) optimization Learning can be performed with the control value acquired through the algorithm.
  • the artificial intelligence beam selector may not exceed the performance of the algorithm used.
  • the artificial intelligence beam selector can quickly estimate a predicted value through a pre-learned learning model.
  • the artificial intelligence beam selector may obtain a prediction value through unsupervised reinforcement learning, obtain a corresponding reward value, and continuously update the learning model through learning. For example, the artificial intelligence beam selector may repeat learning until a compensation value or prediction value converges.
  • the artificial intelligence beam selector can reduce the number of iterations through transfer learning or by continuously updating the model.
  • the environment change step may end when the base station receives an environment change completion signal.
  • the base station transmits a reference signal to the terminal to optimize the environment in the new environment.
  • the base station transmit beamforming A reference signal may be generated by applying (S1740) and transmitted to the terminal through the IRS.
  • the terminal is the actual channel state information measured through the reference signal (effective channel state information) ⁇ G+ and the compensation value R may be transmitted to the artificial intelligence beam selector.
  • the artificial intelligence beam selector may be provided in a base station, an IRS, a terminal, or a cloud/device as described above.
  • the terminal may transmit an index value for controlling the IRS to the IRS by applying a compensation value and channel state information, as described above.
  • the terminal may transmit the compensation value and channel state information to the base station.
  • the artificial intelligence beam selector may perform learning based on the compensation value and channel state information received from the terminal (S1750).
  • learning may be continuously performed until convergence (S1756), and the convergence Based on the value, the base station may obtain environment change completion information.
  • the base station optimizes the given environment based on the received environment change completion information. It is possible to determine and perform communication.
  • the artificial intelligence beam selector can express a beam to be set in the form of a codebook and simplify an artificial intelligence model.
  • the direction vector function representing the array response vector in the reception direction can be expressed as in Equation 8 below.
  • N is the size of the array (antenna or IRS element), and w may be a phase difference between the antennas or IRS elements.
  • the reception response vector for the signal received by the IRS from the base station based on beamforming may be expressed as a direction vector function u( ⁇ ,N) as shown in Equation 9 below.
  • Equation 9 the azimuth of the IRS, is the elevation angle, Wow May be the number of horizontal and vertical IRS elements, respectively, may represent the Kronecker product.
  • the transmission response vector of the IRS It can also be expressed as a direction vector function u( ⁇ ,N), and can be expressed as Equation 10 below.
  • a transmission signal to which transmission beamforming is applied for the signal through the IRS can be expressed as in Equation 11 below.
  • Equation 11 is the pass gain of the BS-IRS channel, May be the pass gain of the IRS-UE channel.
  • Equation 12 since u( ⁇ ,N) is a function with a period of 2, It can be expressed as can be expressed as
  • the optimal beamforming vector v of the IRS that maximizes the received signal SNR is , and can be expressed as the Kronecker product of the direction vector function u( ⁇ ,N) of the azimuth and elevation angles.
  • the IRS control value may be managed in the form of an azimuth angle and an elevation angle, and control values according to each direction may be managed in a codebook.
  • codebook is a set of IRS direction vectors, respectively in the horizontal and vertical directions can have the size of
  • j ⁇ J is an index of a direction vector
  • J may be a total representable direction vector.
  • J is a value representing the number of beams used in the horizontal and vertical directions, respectively in the horizontal and vertical directions. may be expressed differently.
  • the beam set in the final artificial intelligence beam selector may be equal to Equation 14 based on Equation 13 below.
  • the artificial intelligence beam selector can express the beam as described above through the codebook, and through this, the artificial intelligence model can be simplified.
  • FIG. 18 is a diagram showing the structure of an SRE artificial intelligence system using reinforcement learning according to an embodiment of the present disclosure
  • FIG. 19 is a more subdivided environment component based on FIG. 18 It may be a single drawing.
  • the artificial intelligence beam selector based on the SRE artificial intelligence system may perform learning based on reinforcement learning.
  • reinforcement learning may consist of two inputs and one output. State information (state) and reward value (reward) can be used as inputs, and agent actions can be selected as outputs.
  • reinforcement learning may be multi-armed bandit (MAB), and in the case of MAB, state information may not be used, but is not limited thereto.
  • an action as an output may be an operation in which an IRS controller operates to select a beam providing an optimal communication environment to a terminal.
  • the artificial intelligence beam selector may obtain a reward value for an action and changed state information from the environment and use them for learning.
  • the artificial intelligence beam selector may repeat an operation of selecting an action again based on an input after learning.
  • the artificial intelligence beam selector may be a method of determining each state, reward, and action in consideration of environmental components.
  • the environment may include not only a channel environment through which signals are transmitted, but also an environment between a base station, a terminal, and an IRS for measuring compensation and channel conditions.
  • State is a factor received from the environment, and the horizontal and vertical indexes of the previously selected beam selector ( ) can be used.
  • the terminal measures channel information ( ) can be added to the State.
  • the channel information is a measured value or an indirect indicator (CQI, SNR, ), and the state may be as shown in Equation 15 below.
  • an action is to select an index of a codebook representing a beam direction vector of the IRS, and finally, phase shift values of each IRS element may be applied.
  • the action of the artificial intelligence beam selector may be as shown in Equation 16 below.
  • the action value is a value configured based on the codebook through the IRS direction vector generator, and what is actually selected in the selection artificial intelligence may be the index of the azimuth angle and elevation angle of the direction vector.
  • the reward value (Reward) may be a value measured by the terminal and a resultant value of a control value selected by the IRS. For example, if a block received from the terminal is added to the IRS, it can be directly received, but the cost of the IRS may increase. Accordingly, the IRS may obtain a compensation value from the base station based on information transmitted from the terminal to the base station, but may not be limited thereto. Also, as an example, the reward value (Reward) may be determined in consideration of other purposes of use.
  • the terminal may include an IRS performance measurer as described above. However, as an example, when the IRS performance measurer is not passed, the compensation value may be channel-related information measured by the UE based on the reference signal as shown in Equation 17.
  • FIG. 20 is a diagram illustrating use blocks of a terminal and a base station among environmental components in an artificial intelligence beam selector according to an embodiment of the present disclosure.
  • a base station may generate and transmit a reference signal through a radio channel.
  • the terminal may obtain a reference signal generated from the base station through the IRS and measure the reference signal to determine channel state information and compensation value information.
  • the channel state information may include information about a result of directly measuring a channel and indirect information related to a channel, and may not be limited to a specific form.
  • the environmental component may be considered not only the IRS but also the operation of the base station and the terminal, and is not limited to the above-described embodiment.
  • FIG. 21 is a diagram showing the structure of an artificial intelligence beam selector according to an embodiment of the present disclosure.
  • an artificial intelligence beam selector may be divided into a selection artificial intelligence and an IRS generator.
  • the artificial intelligence beam selector may derive a value such as Equation 18 below through state information and a reward value based on reinforcement learning, and derive the above-described action value based on this.
  • selection artificial intelligence can play a role of learning and predicting IRS control values to configure an optimal wireless environment.
  • selection artificial intelligence may be implemented through reinforcement learning or MAB as described above, but may not be limited thereto.
  • the IRS direction vector generator may generate a control value for each element based on the codebook.
  • selection artificial intelligence since selection artificial intelligence is learned in the form of an index of a codebook, the dimension of state information (state) and action (action) can be reduced. Therefore, it may be advantageous in terms of model size, complexity, and convergence speed compared to the learning method for each device. Based on the foregoing, it is possible to generate an optimized IRS control value without being greatly affected by the number M of base station antennas and the number N of IRS elements.
  • FIG. 22 is a diagram illustrating a method of implementing an artificial intelligence beam selector through MAB AI according to an embodiment of the present disclosure.
  • selection artificial intelligence (AI beam selector) using MAB AI using Thompson sampling can be largely divided into a learning unit and a selection unit.
  • the learning unit may update the Thomson sampling parameters ( ⁇ , ⁇ ) for the previous action i based on the reward value.
  • learning of ⁇ and ⁇ according to the compensation value may be as shown in Equation 19 below.
  • the selector may select an index of a beam direction having the largest value among sampled values by applying the accumulated Thomson sampling parameters ⁇ and ⁇ to a beta distribution.
  • ⁇ selected in FIG. 22 may be passed to the IRS direction vector generator.
  • the IRS direction vector generator is an index indicating the direction for the azimuth and elevation angles based on the above-described values ( ) can be used individually.
  • the equation for the beta distribution may be as shown in Equation 20 below.
  • FIG. 23 is a diagram illustrating a method of implementing an artificial intelligence beam selector through reinforcement learning according to an embodiment of the present disclosure.
  • selection artificial intelligence artificial intelligence beam selector
  • reinforcement learning may be composed of a reinforcement learning model and a beam direction adjuster that adjusts a beam direction with a selected action.
  • the selection artificial intelligence based on the above-described MAB AI
  • learning is performed based on reward values without state information, but the reinforcement learning model can perform learning through reward values and state information.
  • the MAB AI contrast state information is further used, the computation of the learning model may increase.
  • selection artificial intelligence directly directs the action to the beam direction ⁇ ) ⁇ for each azimuth and elevation direction ⁇ , ⁇ ⁇ .
  • selection artificial intelligence AI beam selector
  • reinforcement learning takes into account the case of having sufficient hardware specifications and direct beam direction ⁇ ⁇ may also be selected, and is not limited to the above-described embodiment.
  • the previous direction value index in the beam rudder The reinforcement learning model selected ⁇ , ⁇ ⁇ by applying , and finally It may be possible to generate and pass it to the intelligent reflective surface generator, and may not be limited to a specific form.
  • the reinforcement learning model has a learning part and a selection part, just like selection artificial intelligence (or artificial intelligence beam selector) using MAB AI, and can predict the next action at the same time as learning.
  • learning may be performed through Q-Learning based on Equation 21 below during reinforcement learning, and a specific action-value may be as shown in Equation 21 below.
  • the policy selected in Q-Learning is the current state. An action having the largest action-value in may be as shown in Equation 22 below.
  • an issue regarding Exploration and Exploitation control may occur in reinforcement learning.
  • Exploration may utilize a behavior sampled from multiple behaviors to obtain a better reward value.
  • Exploitation can utilize already recognized information based on repetitive actions.
  • proper control of Exploration and Exploitation may be required to achieve optimal performance, and an e-greedy method may be performed, which may be as shown in FIG. 24 .
  • e-greedy may be a method of executing Exploration with a predetermined probability. For example, referring to FIG. 24 , total registry can be improved by e-greedy compared to the greedy method that only exploits.
  • decaying e-greedy may be used as a method of approaching Total Regret logarithmically over time, but may not be limited to a specific form.
  • Equation 23 is an equation representing decaying e-greedy, where c is a constant, and
  • Exploration and Exploitation control can be further optimized using MAB (Multi Arm Bandit).
  • MAB Multi Arm Bandit
  • UMB Upper Confidence Bound
  • TS Thompson Sampling
  • Equation 24 below may be an expression for an action based on UCB, and Equation 15 may be Upper Confidence.
  • Upper Confidence is the number of actions It is set to be inversely proportional to , so that more opportunities are given to actions that are not selected. Based on the foregoing, the opportunity may be halved over time.
  • Thompson sampling is implemented through a beta distribution based on the above, and is simpler than UCB and can easily control Exploration and Exploitation.
  • FIG. 25 illustrates the structure of an IRS performance measurer according to an embodiment of the present disclosure.
  • the IRS performance measurer may perform at least one of standardization/normalization, batching, and weight applicator functions.
  • the IRS performance measurer can calculate SNR, channel gain, MSE, and spectral efficiency based on the reference signal from the base station, as well as measure energy charging using other monitoring systems.
  • each piece of measurement information may be an area of various values.
  • the standardization/normalization block may standardize or normalize values of various areas of measurement information in consideration of respective weights.
  • the batching block plays a role of accumulating such measurement information at regular intervals, and can also perform normalization for each accumulation.
  • the weight application block may express the final output value by applying a weight to each metric. For example, in a receiver in which spectral efficiency is important, a weight of spectral efficiency measurement may be set high.
  • the IRS performance measurer may generate a compensation value in the form of integrating measurement information after processing.
  • the IRS performance measurer may generate a compensation value by individually separating measurement information, and may not be limited to a specific embodiment.
  • 26 is a diagram illustrating a method of setting an artificial intelligence initial value according to an embodiment of the present disclosure.
  • an artificial intelligence initial value may be set based on an artificial intelligence beam selector operation.
  • the base station 2610 may transmit a reference signal to the terminal 2630.
  • the terminal 2630 may perform measurement using the reference signal and obtain channel state information between the base station 2610 and the terminal 2630 based on the measurement.
  • the terminal 2630 may transmit channel state information and location information of the terminal to the base station 2610.
  • the base station 2610 may set an AI initial value through an artificial intelligence initial value setter based on the received channel state information and location information of the terminal.
  • the artificial intelligence initial value setter may be implemented in a device other than the base station 2610 or a cloud.
  • the base station 2610 may transmit channel state information and location information received from the terminal 2630 to the artificial intelligence initial value setter, and obtain artificial intelligence initial value information from the artificial intelligence initial value setter.
  • the artificial intelligence initial value information is the initial value of the selection artificial intelligence used in the artificial intelligence beam selector (Thompson Sampling: , ) may be included.
  • the artificial intelligence initial value information is the above-described Thomson sampling parameter and state information ( ), and is not limited to the above-described embodiment.
  • the base station 2610 may transmit artificial intelligence initial value information and candidate set information to the IRS 2620.
  • candidate set information may be index set information of a defined beam direction codebook.
  • the candidate set information may be information about the codebook itself.
  • the codebook may be a set of beam direction vectors used differently from a precoding matrix codebook used in multi input multi output (MIMO). That is, a beam direction vector used for candidate sets may be a space of an action selected in an artificial intelligence model.
  • reinforcement learning or MAB AI can quickly perform convergence for learning and reduce the amount of computation.
  • the artificial intelligence beam selector may be connected to the IRS controller.
  • the IRS controller or AI server may initialize the artificial intelligence beam selector that operates by MAB AI (Thompson Sampling) or reinforcement learning through the above-mentioned information received. Subsequent operations may be the same as those of FIG. 15 described above.
  • the base station 2610 may transmit a reference signal to the terminal 2630 as described above, and acquire artificial intelligence initial value information through an artificial intelligence initial value setter through channel state information and location information of the terminal. Thereafter, the base station 2610 may operate as described above after reflecting the above-described artificial intelligence initial value information to the artificial intelligence beam selector.
  • FIG. 27 may be a case where an artificial intelligence beam selector is implemented in a terminal according to an embodiment of the present disclosure.
  • the base station 2710 may obtain channel state information and location information from the terminal 2730 through a reference signal as in FIG. can be the same
  • the base station may transmit the artificial intelligence initial value information and candidate set information described above in FIG. 26 to the terminal 2730 in which the artificial intelligence beam selector is implemented.
  • the terminal 2730 may apply the information received from the base station 2710 to the artificial intelligence beam selector, and subsequent operations may be the same as those of FIG. 16 described above.
  • FIG. 28 is a diagram showing the structure of an SRE artificial intelligence system including an artificial intelligence initial value setter according to an embodiment of the present disclosure.
  • the artificial intelligence initial value setter may set the initial weight value of the selected artificial intelligence in the artificial intelligence beam selector as in the above-described FIGS. 26 and 27.
  • the artificial intelligence initial value setter may update weights of models that have completed operations.
  • the updated weight value may be used as an initial value of MAB AI or an initial state of reinforcement learning, and may not be limited to a specific form.
  • the artificial intelligence initial value setter may be designed in the form of a predictor in the form of supervised learning.
  • the initial value can be set and transmitted to the artificial intelligence beam selector.
  • prediction may be performed in consideration of the channel environment (eg SNR) and location information of the terminal.
  • , BLER, , , location information and channel information are stored, and can be used as learning data during transfer learning of the AI initial value setter.
  • the artificial intelligence coding initial value setter may set an initial value in consideration of location information and a channel environment (signal-to-noise ratio, SNR) of a transmitter.
  • SNR signal-to-noise ratio
  • the artificial intelligence coding initial value setter may create candidate sets for the generation matrix in order of performance.
  • Candidate sets may be generated differently depending on the channel environment. These candidate sets can be defined in the form of codebooks.
  • the receiver may transmit a codebook set to be used by the transmitter in the form of an index. In addition, the receiver may directly transmit the codebook to be used by the transmitter.
  • the artificial intelligence coding initial value setter is an initial value as well as a candidate set. , can be set and transmitted to the receiver. At this time, it can be predicted in consideration of the channel environment and location information of the terminal. After communication ends, , , BLER, , , location information, and channel information can be stored and used as learning data when re-training the artificial intelligence coding initial value setter.
  • FIG. 30 is a diagram illustrating a method of performing wireless environment optimization based on an artificial intelligence system according to an embodiment of the present disclosure.
  • the terminal may transmit first index information related to the IRS control value to the IRS (S3010).
  • the IRS control value may be determined based on the first index information.
  • each phase value in the IRS element may be determined based on the IRS control value determined as described above, as described above.
  • the aforementioned first index information may be information generated through a codebook based on an IRS direction vector set.
  • the first index information may include a first factor based on the IRS azimuth and a second factor based on the IRS elevation, as described above.
  • the artificial intelligence beam selector may be included in the terminal.
  • the above-described first index information may be determined based on the artificial intelligence beam selector of the terminal, and the determined first index information may be transmitted to the IRS.
  • the terminal and the base station may set an initial value applied to the artificial intelligence beam selector. More specifically, the terminal may receive a reference signal for initial value setting from the base station. After that, the terminal can obtain channel state information through a reference signal for setting an initial value. The terminal may feed back the acquired channel state information and location information of the terminal to the base station.
  • the base station may include an artificial intelligence initial value setter. The base station may derive an artificial intelligence initial value based on the artificial intelligence initial value setter and transmit information about it to the terminal. Also, as an example, the terminal may further receive candidate set information related to the index information transmitted to the IRS, as described above. The terminal may derive the above-described first index information through learning based on the received artificial intelligence initial value information and candidate set information.
  • the terminal may receive the reference signal to which the first beamforming is applied from the base station through the IRS.
  • the base station Beamforming can be determined. That is, the information on the first beamforming may be information recognized and managed by the base station in advance.
  • the terminal may acquire at least one of compensation value information and channel state information through a reference signal transmitted by applying the first beamforming from the base station.
  • the terminal may update the first index information to the second index information through at least one of compensation value information and channel state information (S3040).
  • the terminal transmits the updated second index information to the IRS.
  • the terminal may include an artificial intelligence beam selector, as described above.
  • the artificial intelligence beam selector may update the above-described first index information to second index information through at least one of compensation value information and channel state information.
  • the artificial intelligence beam selector may update the first index information to the second index information based on any one of the above-described MAB AI learning model and the reinforcement learning model.
  • the artificial intelligence beam selector updates the first index information to the second index information based on the MAB AI learning model
  • the second index information may be obtained through learning based on compensation value information.
  • the artificial intelligence beam selector updates the first index information to the second index information based on the reinforcement learning learning model
  • state information is set based on the first index information
  • state information and compensation value information The second index information may be obtained through learning based on .
  • the above-described compensation value may be obtained through an IRS performance measurer.
  • the terminal includes an IRS performance measurer, and the IRS performance measurer may generate compensation value information using channel related information obtained through a reference signal, as described above.
  • the terminal may receive a reference signal to which the second beamforming is applied from the base station based on the updated second index information through the IRS (S3060).
  • the IRS converts the first index information into second index information.
  • the IRS may transmit a radio environment change completion signal including the second index information to the base station.
  • the base station may determine the above-described second beamforming based on the second index information and apply it to reference signal transmission.
  • Embodiments of the present disclosure may be applied to various wireless access systems.
  • various wireless access systems there is a 3rd Generation Partnership Project (3GPP) or 3GPP2 system.
  • 3GPP 3rd Generation Partnership Project
  • 3GPP2 3rd Generation Partnership Project2
  • Embodiments of the present disclosure may be applied not only to the various wireless access systems, but also to all technical fields to which the various wireless access systems are applied. Furthermore, the proposed method can be applied to mmWave and THz communication systems using ultra-high frequency bands.
  • embodiments of the present disclosure may be applied to various applications such as free-running vehicles and drones.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Quality & Reliability (AREA)
  • Electromagnetism (AREA)

Abstract

본 개시에서는 무선 통신 시스템에서 단말 동작 방법을 제공할 수 있다. 단말 동작 방법은 IRS 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하는 단계, 기지국으로부터 제 1 빔포밍이 적용된 참조신호를 IRS를 통해 수신하는 단계, 수신한 참조신호에 기초하여 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하는 단계, 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나를 통해 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하는 단계, 업데이트된 제 2 인덱스 정보를 IRS로 전송하는 단계 및 업데이트된 제 2 인덱스 정보에 기초하여 기지국으로부터 제 2 빔포밍이 적용된 참조신호를 IRS를 통해 수신하는 단계를 포함할 수 있다.

Description

무선 통신 시스템에서 신호를 송수신하는 방법 및 장치
이하의 설명은 무선 통신 시스템에 대한 것으로, 무선 통신 시스템에서 단말 및 기지국이 신호를 송수신하는 방법 및 장치에 대한 것이다.
특히, 단말과 기지국은 지능형 반사 표면(Intelligent Reflect Surface, IRS)을 통해 무선 채널 환경을 제어하여 신호를 송수신하는 방법 및 장치를 제공할 수 있다.
무선 접속 시스템이 음성이나 데이터 등과 같은 다양한 종류의 통신 서비스를 제공하기 위해 광범위하게 전개되고 있다. 일반적으로 무선 접속 시스템은 가용한 시스템 자원(대역폭, 전송 파워 등)을 공유하여 다중 사용자와의 통신을 지원할 수 있는 다중 접속(multiple access) 시스템이다. 다중 접속 시스템의 예들로는 CDMA(code division multiple access) 시스템, FDMA(frequency division multiple access) 시스템, TDMA(time division multiple access) 시스템, OFDMA(orthogonal frequency division multiple access) 시스템, SC-FDMA(single carrier frequency division multiple access) 시스템 등이 있다.
특히, 많은 통신 기기들이 큰 통신 용량을 요구하게 됨에 따라 기존 RAT (radio access technology)에 비해 향상된 모바일 브로드밴드(enhanced mobile broadband, eMBB) 통신 기술이 제안되고 있다. 또한 다수의 기기 및 사물들을 연결하여 언제 어디서나 다양한 서비스를 제공하는 매시브 MTC (Machine Type Communications) 뿐만 아니라 신뢰성 (reliability) 및 지연(latency) 민감한 서비스/UE를 고려한 통신 시스템이 제안되고 있다. 이를 위한 다양한 기술 구성들이 제안되고 있다.
본 개시는 무선 통신 시스템에서 신호를 송수신하는 방법 및 장치를 제공할 수 있다.
본 개시는 무선 통신 시스템에서 지능형 반사판을 이용하여 단말과 기지국이 신호를 송수신하는 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 지능형 무선 채널 환경(Smart Radio Environment, SRE)에 기초하여 단말과 기지국이 신호를 송수신하는 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 인공지능 시스템에 기초하여 수동형 지능형 반사판을 제어하는 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 수동형 지능형 반사판을 제어하여 단말과 기지국이 신호를 송수신하는 방법을 제공할 수 있다.
본 개시에서 이루고자 하는 기술적 목적들은 이상에서 언급한 사항들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 이하 설명할 본 개시의 실시 예들로부터 본 개시의 기술 구성이 적용되는 기술분야에서 통상의 지식을 가진 자에 의해 고려될 수 있다.
본 개시의 일 예로서, 무선 통신 시스템에서 단말 동작 방법에 있어서, 지능형 반사판(Intelligent Reflect Surface, IRS) 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하는 단계, 기지국으로부터 제 1 빔포밍이 적용된 참조신호를 IRS를 통해 수신하는 단계, 수신한 참조신호에 기초하여 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하는 단계, 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나를 통해 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하는 단계, 업데이트된 제 2 인덱스 정보를 IRS로 전송하는 단계 및 업데이트된 제 2 인덱스 정보에 기초하여 기지국으로부터 제 2 빔포밍이 적용된 참조신호를 IRS를 통해 수신하는 단계를 포함할 수 있다.
또한, 본 개시의 일 실시예에 따라, 무선 통신 시스템에서 기지국 동작 방법에 있어서, 제 1 빔포밍이 적용된 참조신호를 IRS를 통해 단말로 전송하는 단계, IRS를 통해 제 1 인덱스 정보에서 업데이트된 제 2 인덱스 정보를 수신하는 단계 및 제 2 빔포밍이 적용된 참조신호를 IRS를 통해 단말로 전송하는 단계를 포함하되, 단말은 IRS 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하고, 제 1 빔포밍이 적용된 참조신호를 통해 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하고, 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나를 통해 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하고, 제 2 인덱스 정보를 IRS로 전송할 수 있다.
또한, 본 개시의 일 실시예에 따라, 무선 통신 시스템의 단말에 있어서, 송수신기 및 송수신기와 연결된 프로세서를 포함하고, 프로세서는, 송수신기를 통해 IRS 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하고, 송수신기를 통해 기지국으로부터 제 1 빔포밍이 적용된 참조신호를 IRS를 통해 수신하고, 수신한 참조신호에 기초하여 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하고, 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나를 통해 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하고, 업데이트된 제 2 인덱스 정보를 IRS로 전송하고, 및 업데이트된 제 2 인덱스 정보에 기초하여 기지국으로부터 제 2 빔포밍이 적용된 참조신호를 IRS를 통해 수신할 수 있다.
또한, 본 개시의 일 실시예에 따라, 무선 통신 시스템의 기지국에 있어서, 송수신기 및 송수신기와 연결된 프로세서를 포함하고, 프로세서는, 송수신기를 통해 제 1 빔포밍이 적용된 참조신호를 IRS를 통해 단말로 전송하고, 송수신기를 통해 IRS를 통해 제 1 인덱스 정보에서 업데이트된 제 2 인덱스 정보를 수신하고, 및 송수신기를 통해 제 2 빔포밍이 적용된 참조신호를 IRS를 통해 단말로 전송하되, 단말은 IRS 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하고, 제 1 빔포밍이 적용된 참조신호를 통해 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하고, 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나를 통해 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하고, 제 2 인덱스 정보를 IRS로 전송할 수 있다.
또한, 본 개시의 일 실시예에 따라, 적어도 하나의 메모리 및 적어도 하나의 메모리들과 기능적으로 연결되어 있는 적어도 하나의 프로세서를 포함하는 장치에 있어서, 적어도 하나의 프로세서는 장치가, IRS 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하고, 기지국으로부터 제 1 빔포밍이 적용된 참조신호를 IRS를 통해 수신하고, 수신한 참조신호에 기초하여 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하고, 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나를 통해 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하고, 업데이트된 제 2 인덱스 정보를 IRS로 전송하고, 및 업데이트된 제 2 인덱스 정보에 기초하여 기지국으로부터 제 2 빔포밍이 적용된 참조신호를 IRS를 통해 수신할 수 있다.
또한, 본 개시의 일 실시예에 따라, 적어도 하나의 명령어(instructions)을 저장하는 비-일시적인(non-transitory) 컴퓨터 판독 가능 매체(computer-readable medium)에 있어서, 프로세서에 의해 실행 가능한(executable) 적어도 하나의 명령어를 포함하며, 적어도 하나의 명령어는, 장치가 IRS 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하고, 기지국으로부터 제 1 빔포밍이 적용된 참조신호를 IRS를 통해 수신하고, 수신한 참조신호에 기초하여 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하고, 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나를 통해 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하고, 업데이트된 제 2 인덱스 정보를 IRS로 전송하고, 및 업데이트된 제 2 인덱스 정보에 기초하여 기지국으로부터 제 2 빔포밍이 적용된 참조신호를 IRS를 통해 수신할 수 있다.
다음의 사항들은 상술한 기지국, 단말, 장치 및 컴퓨터 기록 매체에 공통으로 적용될 수 있다.
또한, 본 개시의 일 실시예에 따라, IRS 제어 값은 인덱스 정보에 기초하여 결정되고, 결정된 IRS 제어 값에 기초하여 IRS 소자(element) 내의 각각의 위상 값이 결정될 수 있다.
또한, 본 개시의 일 실시예에 따라, 인덱스 정보는 IRS 방향벡터 집합에 기초한 코드북을 통해 생성되는 정보이며, 인덱스 정보는 IRS 방위각에 기초한 제 1 인자 및 IRS 고도각에 기초한 제 2 인자로 구성될 수 있다.
또한, 본 개시의 일 실시예에 따라, 단말은 기지국으로부터 초기 값 설정을 위한 참조신호를 수신하고, 수신한 초기 값 설정을 위한 참조신호를 통해 획득한 채널 상태 정보 및 단말의 위치 정보를 기지국으로 피드백하고, 단말은 기지국이 수신한 채널 상태 정보 및 단말의 위치 정보에 기초하여 도출한 인공지능 초기 값 정보를 기지국으로부터 수신할 수 있다.
또한, 본 개시의 일 실시예에 따라, 단말은 인덱스 정보와 관련된 후보 집합 정보를 기지국으로부터 더 수신할 수 있다.
또한, 본 개시의 일 실시예에 따라, 단말은 수신한 인공지능 초기 값 정보 및 후보 집합 정보에 기초하여 제 1 인덱스 정보를 도출할 수 있다.
또한, 본 개시의 일 실시예에 따라, 기지국은 IRS와 초기 설정을 수행할 때 IRS의 위치에 기초하여 제 1 빔포밍을 결정할 수 있다.
또한, 본 개시의 일 실시예에 따라, IRS가 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하는 경우, IRS는 기지국으로 제 2 인덱스 정보를 포함하는 무선환경 변경 완료 신호를 전송하고, 기지국은 제 2 인덱스 정보에 기초하여 제 2 빔포밍을 결정할 수 있다.
또한, 본 개시의 일 실시예에 따라, 단말은 인공지능 빔 선택기를 포함하고, 인공지능 빔 선택기는 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나를 통해 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트할 수 있다.
또한, 본 개시의 일 실시예에 따라, 인공지능 빔 선택기는 MAB(multi-armed bandit) AI(artificial intelligence) 학습모델 또는 강화학습 학습모델 중 어느 하나에 기초하여 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트할 수 있다.
또한, 본 개시의 일 실시예에 따라, 인공지능 빔 선택기가 MAB AI 학습모델에 기초하여 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하는 경우, 보상 값 정보에 기초한 학습을 통해 제 2 인덱스 정보를 획득할 수 있다.
또한, 본 개시의 일 실시예에 따라, 인공지능 빔 선택기가 강화학습 학습모델에 기초하여 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하는 경우, 제 1 인덱스 정보에 기초하여 상태 정보가 설정되고, 상태 정보 및 보상 값 정보에 기초한 학습을 통해 제 2 인덱스 정보를 획득할 수 있다.
또한, 본 개시의 일 실시예에 따라, 단말은 IRS 성능 측정기를 포함하고, IRS 성능 측정기는 참조신호를 통해 획득되는 채널 관련 정보를 이용하여 보상 값 정보를 생성할 수 있다.
상술한 본 개시의 양태들은 본 개시의 바람직한 실시예들 중 일부에 불과하며, 본 개시의 기술적 특징들이 반영된 다양한 실시예들이 당해 기술분야의 통상적인 지식을 가진 자에 의해 이하 상술할 본 개시의 상세한 설명을 기반으로 도출되고 이해될 수 있다.
본 개시에 기초한 실시예들에 의해 하기와 같은 효과가 있을 수 있다.
본 개시에 기초한 실시예들에서 지능형 반사판을 이용하여 단말과 기지국이 신호를 송수신하는 방법을 제공할 수 있다.
본 개시에 기초한 실시예들에서 지능형 무선 채널 환경에 기초하여 단말과 기지국이 신호를 송수신하는 방법을 제공할 수 있다.
본 개시에 기초한 실시예들에서 인공지능 시스템에 기초하여 수동형 지능형 반사판을 제어하는 방법을 제공할 수 있다.
본 개시에 기초한 실시예들에서 수동형 지능형 반사판을 제어하여 단말과 기지국이 신호를 송수신하는 방법을 제공할 수 있다.
본 개시의 실시 예들에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 이하의 본 개시의 실시 예들에 대한 기재로부터 본 개시의 기술 구성이 적용되는 기술분야에서 통상의 지식을 가진 자에게 명확하게 도출되고 이해될 수 있다. 즉, 본 개시에서 서술하는 구성을 실시함에 따른 의도하지 않은 효과들 역시 본 개시의 실시 예들로부터 당해 기술분야의 통상의 지식을 가진 자에 의해 도출될 수 있다.
이하에 첨부되는 도면들은 본 개시에 관한 이해를 돕기 위한 것으로, 상세한 설명과 함께 본 개시에 대한 실시 예들을 제공할 수 있다. 다만, 본 개시의 기술적 특징이 특정 도면에 한정되는 것은 아니며, 각 도면에서 개시하는 특징들은 서로 조합되어 새로운 실시 예로 구성될 수 있다. 각 도면에서의 참조 번호(reference numerals)들은 구조적 구성요소(structural elements)를 의미할 수 있다.
도 1은 본 개시에 적용 가능한 통신 시스템 예시를 나타낸 도면이다.
도 2는 본 개시에 적용 가능한 무선 기기의 예시를 나타낸 도면이다.
도 3은 본 개시에 적용 가능한 무선 기기의 다른 예시를 나타낸 도면이다.
도 4는 본 개시에 적용 가능한 휴대 기기의 예시를 나타낸 도면이다.
도 5는 본 개시에 적용 가능한 차량 또는 자율 주행 차량의 예시를 나타낸 도면이다.
도 6은 본 개시에 적용 가능한 AI(Artificial Intelligence)의 예시를 나타낸 도면이다.
도 7은 본 개시에 적용 가능한 6G 시스템에서 제공 가능한 통신 구조의 일례를 나타낸 도면이다.
도 8은 본 개시에 적용 가능한 전자기 스펙트럼을 나타낸 도면이다.
도 9는 본 개시의 일 실시예에 따라 무선 채널 환경을 나타낸 도면이다.
도 10은 본 개시의 일 실시예에 따라 지능형 무선 환경을 나타낸 도면이다.
도 11은 본 개시의 일 실시예에 따라, 기존 무선 채널 환경 및 지능형 무선 채널 환경을 나타낸 도면이다.
도 12는 본 개시의 일 실시예에 따라 지능형 무선 채널 환경에서 최적화를 수행하는 방법을 나타낸 도면이다.
도 13은 본 개시의 일 실시예에 따라 신뢰 구간을 나타낸 도면이다.
도 14는 본 개시의 일 실시예에 따라 수동형 기반 지능형 무선 채널 환경에서 최적화를 수행하는 방법을 나타낸 도면이다.
도 15는 본 개시의 일 실시예에 따라 최적화된 지능형 무선 환경(SRE)를 설정하기 위해 기지국, 단말 및 IRS 상호 간의 신호 흐름을 나타낸 도면이다.
도 16은 본 개시의 일 실시예에 따라 단말에 인공지능 빔 선택기가 구현되는 경우에 기지국, IRS 및 단말 상호 간의 신호 흐름을 나타낸 도면이다.
도 17은 본 개시의 일 실시예에 따라 최적화된 지능형 무선환경을 설정하는 방법을 나타낸 순서도일 수 있다.
도 18은 본 개시의 일 실시예에 따라 강화학습을 사용하여 SRE 인공지능 시스템 구조를 나타낸 도면이다.
도 19는 도 18에 기초하여 환경(environment)의 구성요소를 좀 더 세분화한 도면일 수 있다.
도 20은 본 개시의 일 실시예에 따라 인공지능 빔 선택기에서 환경구성 요소 중 단말과 기지국의 사용 블록을 도시화한 도면이다.
도 21은 본 개시의 일 실시예에 따라 인공지능 빔 선택기의 구조를 나타낸 도면이다.
도 22는 본 개시의 일 실시예에 따라 MAB AI를 통해 인공지능 빔 선택기를 구현하는 방법을 나타낸 도면이다.
도 23은 본 개시의 일 실시예에 따라 강화학습을 통해 인공지능 빔 선택기를 구현하는 방법을 나타낸 도면이다.
도 24는 본 개시의 일 실시예에 따라 greedy 방법을 사용하여 total regret을 나타낸 도면이다.
도 25는 본 개의 일 실시예에 따라, IRS 성능 측정기의 구조를 나타내고 있다.
도 26은 본 개시의 일 실시예에 따라 인공지능 초기 값을 설정하는 방법을 나타낸 도면이다.
도 27은 본 개시의 일 실시예에 따라 인공지능 빔 선택기가 단말에 구현된 경우일 수 있다.
도 28은 본 개시의 일 실시예에 따라 인공지능 초기 값 설정기가 포함된 SRE 인공지능 시스템 구조를 나타낸 도면이다.
도 29는 본 개시에 적용 가능한 인공지능 코딩 초기값 설정기의 일례를 나타낸 도면이다.
도 30은 본 개시의 일 실시예에 따라 인공지능 시스템에 기초하여 무선환경 최적화를 수행하는 방법을 나타낸 도면이다.
이하의 실시 예들은 본 개시의 구성요소들과 특징들을 소정 형태로 결합한 것들이다. 각 구성요소 또는 특징은 별도의 명시적 언급이 없는 한 선택적인 것으로 고려될 수 있다. 각 구성요소 또는 특징은 다른 구성요소나 특징과 결합되지 않은 형태로 실시될 수 있다. 또한, 일부 구성요소들 및/또는 특징들을 결합하여 본 개시의 실시 예를 구성할 수도 있다. 본 개시의 실시 예들에서 설명되는 동작들의 순서는 변경될 수 있다. 어느 실시 예의 일부 구성이나 특징은 다른 실시 예에 포함될 수 있고, 또는 다른 실시 예의 대응하는 구성 또는 특징과 교체될 수 있다.
도면에 대한 설명에서, 본 개시의 요지를 흐릴 수 있는 절차 또는 단계 등은 기술하지 않았으며, 당업자의 수준에서 이해할 수 있을 정도의 절차 또는 단계는 또한 기술하지 아니하였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함(comprising 또는 including)"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사 관련어는 본 개시를 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.
본 명세서에서 본 개시의 실시예들은 기지국과 이동국 간의 데이터 송수신 관계를 중심으로 설명되었다. 여기서, 기지국은 이동국과 직접적으로 통신을 수행하는 네트워크의 종단 노드(terminal node)로서의 의미가 있다. 본 문서에서 기지국에 의해 수행되는 것으로 설명된 특정 동작은 경우에 따라서는 기지국의 상위 노드(upper node)에 의해 수행될 수도 있다.
즉, 기지국을 포함하는 다수의 네트워크 노드들(network nodes)로 이루어지는 네트워크에서 이동국과의 통신을 위해 수행되는 다양한 동작들은 기지국 또는 기지국 이외의 다른 네트워크 노드들에 의해 수행될 수 있다. 이때, '기지국'은 고정국(fixed station), Node B, eNB(eNode B), gNB(gNode B), ng-eNB, 발전된 기지국(advanced base station, ABS) 또는 억세스 포인트(access point) 등의 용어에 의해 대체될 수 있다.
또한, 본 개시의 실시 예들에서 단말(terminal)은 사용자 기기(user equipment, UE), 이동국(mobile station, MS), 가입자국(subscriber station, SS), 이동 가입자 단말(mobile subscriber station, MSS), 이동 단말(mobile terminal) 또는 발전된 이동 단말(advanced mobile station, AMS) 등의 용어로 대체될 수 있다.
또한, 송신단은 데이터 서비스 또는 음성 서비스를 제공하는 고정 및/또는 이동 노드를 말하고, 수신단은 데이터 서비스 또는 음성 서비스를 수신하는 고정 및/또는 이동 노드를 의미한다. 따라서, 상향링크의 경우, 이동국이 송신단이 되고, 기지국이 수신단이 될 수 있다. 마찬가지로, 하향링크의 경우, 이동국이 수신단이 되고, 기지국이 송신단이 될 수 있다.
본 개시의 실시 예들은 무선 접속 시스템들인 IEEE 802.xx 시스템, 3GPP(3rd Generation Partnership Project) 시스템, 3GPP LTE(Long Term Evolution) 시스템, 3GPP 5G(5th generation) NR(New Radio) 시스템 및 3GPP2 시스템 중 적어도 하나에 개시된 표준 문서들에 의해 뒷받침될 수 있으며, 특히, 본 개시의 실시 예들은 3GPP TS(technical specification) 38.211, 3GPP TS 38.212, 3GPP TS 38.213, 3GPP TS 38.321 및 3GPP TS 38.331 문서들에 의해 뒷받침 될 수 있다.
또한, 본 개시의 실시 예들은 다른 무선 접속 시스템에도 적용될 수 있으며, 상술한 시스템으로 한정되는 것은 아니다. 일 예로, 3GPP 5G NR 시스템 이후에 적용되는 시스템에 대해서도 적용 가능할 수 있으며, 특정 시스템에 한정되지 않는다.
즉, 본 개시의 실시 예들 중 설명하지 않은 자명한 단계들 또는 부분들은 상기 문서들을 참조하여 설명될 수 있다. 또한, 본 문서에서 개시하고 있는 모든 용어들은 상기 표준 문서에 의해 설명될 수 있다.
이하, 본 개시에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 본 개시의 예시적인 실시 형태를 설명하고자 하는 것이며, 본 개시의 기술 구성이 실시될 수 있는 유일한 실시형태를 나타내고자 하는 것이 아니다.
또한, 본 개시의 실시 예들에서 사용되는 특정 용어들은 본 개시의 이해를 돕기 위해서 제공된 것이며, 이러한 특정 용어의 사용은 본 개시의 기술적 사상을 벗어나지 않는 범위에서 다른 형태로 변경될 수 있다.
이하의 기술은 CDMA(code division multiple access), FDMA(frequency division multiple access), TDMA(time division multiple access), OFDMA(orthogonal frequency division multiple access), SC-FDMA(single carrier frequency division multiple access) 등과 같은 다양한 무선 접속 시스템에 적용될 수 있다.
하기에서는 이하 설명을 명확하게 하기 위해, 3GPP 통신 시스템(e.g.(예, LTE, NR 등)을 기반으로 설명하지만 본 발명의 기술적 사상이 이에 제한되는 것은 아니다. LTE는 3GPP TS 36.xxx Release 8 이후의 기술을 의미할 수 있다. 세부적으로, 3GPP TS 36.xxx Release 10 이후의 LTE 기술은 LTE-A로 지칭되고, 3GPP TS 36.xxx Release 13 이후의 LTE 기술은 LTE-A pro로 지칭될 수 있다. 3GPP NR은 TS 38.xxx Release 15 이후의 기술을 의미할 수 있다. 3GPP 6G는 TS Release 17 및/또는 Release 18 이후의 기술을 의미할 수 있다. "xxx"는 표준 문서 세부 번호를 의미한다. LTE/NR/6G는 3GPP 시스템으로 통칭될 수 있다.
본 개시에 사용된 배경기술, 용어, 약어 등에 관해서는 본 발명 이전에 공개된 표준 문서에 기재된 사항을 참조할 수 있다. 일 예로, 36.xxx 및 38.xxx 표준 문서를 참조할 수 있다.
본 개시에 적용 가능한 통신 시스템
이로 제한되는 것은 아니지만, 본 문서에 개시된 본 개시의 다양한 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 기기들 간에 무선 통신/연결(예, 5G)을 필요로 하는 다양한 분야에 적용될 수 있다.
이하, 도면을 참조하여 보다 구체적으로 예시한다. 이하의 도면/설명에서 동일한 도면 부호는 다르게 기술하지 않는 한, 동일하거나 대응되는 하드웨어 블록, 소프트웨어 블록 또는 기능 블록을 예시할 수 있다.
도 1은 본 개시에 적용되는 통신 시스템 예시를 도시한 도면이다.
도 1을 참조하면, 본 개시에 적용되는 통신 시스템(100)은 무선 기기, 기지국 및 네트워크를 포함한다. 여기서, 무선 기기는 무선 접속 기술(예, 5G NR, LTE)을 이용하여 통신을 수행하는 기기를 의미하며, 통신/무선/5G 기기로 지칭될 수 있다. 이로 제한되는 것은 아니지만, 무선 기기는 로봇(100a), 차량(100b-1, 100b-2), XR(extended reality) 기기(100c), 휴대 기기(hand-held device)(100d), 가전(home appliance)(100e), IoT(Internet of Thing) 기기(100f), AI(artificial intelligence) 기기/서버(100g)를 포함할 수 있다. 예를 들어, 차량은 무선 통신 기능이 구비된 차량, 자율 주행 차량, 차량간 통신을 수행할 수 있는 차량 등을 포함할 수 있다. 여기서, 차량(100b-1, 100b-2)은 UAV(unmanned aerial vehicle)(예, 드론)를 포함할 수 있다. XR 기기(100c)는 AR(augmented reality)/VR(virtual reality)/MR(mixed reality) 기기를 포함하며, HMD(head-mounted device), 차량에 구비된 HUD(head-up display), 텔레비전, 스마트폰, 컴퓨터, 웨어러블 디바이스, 가전 기기, 디지털 사이니지(signage), 차량, 로봇 등의 형태로 구현될 수 있다. 휴대 기기(100d)는 스마트폰, 스마트패드, 웨어러블 기기(예, 스마트워치, 스마트글래스), 컴퓨터(예, 노트북 등) 등을 포함할 수 있다. 가전(100e)은 TV, 냉장고, 세탁기 등을 포함할 수 있다. IoT 기기(100f)는 센서, 스마트 미터 등을 포함할 수 있다. 예를 들어, 기지국(120), 네트워크(130)는 무선 기기로도 구현될 수 있으며, 특정 무선 기기(120a)는 다른 무선 기기에게 기지국/네트워크 노드로 동작할 수도 있다.
무선 기기(100a~100f)는 기지국(120)을 통해 네트워크(130)와 연결될 수 있다. 무선 기기(100a~100f)에는 AI 기술이 적용될 수 있으며, 무선 기기(100a~100f)는 네트워크(130)를 통해 AI 서버(100g)와 연결될 수 있다. 네트워크(130)는 3G 네트워크, 4G(예, LTE) 네트워크 또는 5G(예, NR) 네트워크 등을 이용하여 구성될 수 있다. 무선 기기(100a~100f)는 기지국(120)/네트워크(130)를 통해 서로 통신할 수도 있지만, 기지국(120)/네트워크(130)를 통하지 않고 직접 통신(예, 사이드링크 통신(sidelink communication))할 수도 있다. 예를 들어, 차량들(100b-1, 100b-2)은 직접 통신(예, V2V(vehicle to vehicle)/V2X(vehicle to everything) communication)을 할 수 있다. 또한, IoT 기기(100f)(예, 센서)는 다른 IoT 기기(예, 센서) 또는 다른 무선 기기(100a~100f)와 직접 통신을 할 수 있다.
본 개시에 적용 가능한 통신 시스템
도 2는 본 개시에 적용될 수 있는 무선 기기의 예시를 도시한 도면이다.
도 2를 참조하면, 제1 무선 기기(200a)와 제2 무선 기기(200b)는 다양한 무선 접속 기술(예, LTE, NR)을 통해 무선 신호를 송수신할 수 있다. 여기서, {제1 무선 기기(200a), 제2 무선 기기(200b)}은 도 1의 {무선 기기(100x), 기지국(120)} 및/또는 {무선 기기(100x), 무선 기기(100x)}에 대응할 수 있다.
제1 무선 기기(200a)는 하나 이상의 프로세서(202a) 및 하나 이상의 메모리(204a)를 포함하며, 추가적으로 하나 이상의 송수신기(206a) 및/또는 하나 이상의 안테나(208a)을 더 포함할 수 있다. 프로세서(202a)는 메모리(204a) 및/또는 송수신기(206a)를 제어하며, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 구현하도록 구성될 수 있다. 예를 들어, 프로세서(202a)는 메모리(204a) 내의 정보를 처리하여 제1 정보/신호를 생성한 뒤, 송수신기(206a)을 통해 제1 정보/신호를 포함하는 무선 신호를 전송할 수 있다. 또한, 프로세서(202a)는 송수신기(206a)를 통해 제2 정보/신호를 포함하는 무선 신호를 수신한 뒤, 제2 정보/신호의 신호 처리로부터 얻은 정보를 메모리(204a)에 저장할 수 있다. 메모리(204a)는 프로세서(202a)와 연결될 수 있고, 프로세서(202a)의 동작과 관련한 다양한 정보를 저장할 수 있다. 예를 들어, 메모리(204a)는 프로세서(202a)에 의해 제어되는 프로세스들 중 일부 또는 전부를 수행하거나, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 수행하기 위한 명령들을 포함하는 소프트웨어 코드를 저장할 수 있다. 여기서, 프로세서(202a)와 메모리(204a)는 무선 통신 기술(예, LTE, NR)을 구현하도록 설계된 통신 모뎀/회로/칩의 일부일 수 있다. 송수신기(206a)는 프로세서(202a)와 연결될 수 있고, 하나 이상의 안테나(208a)를 통해 무선 신호를 송신 및/또는 수신할 수 있다. 송수신기(206a)는 송신기 및/또는 수신기를 포함할 수 있다. 송수신기(206a)는 RF(radio frequency) 유닛과 혼용될 수 있다. 본 개시에서 무선 기기는 통신 모뎀/회로/칩을 의미할 수도 있다.
제2 무선 기기(200b)는 하나 이상의 프로세서(202b), 하나 이상의 메모리(204b)를 포함하며, 추가적으로 하나 이상의 송수신기(206b) 및/또는 하나 이상의 안테나(208b)를 더 포함할 수 있다. 프로세서(202b)는 메모리(204b) 및/또는 송수신기(206b)를 제어하며, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 구현하도록 구성될 수 있다. 예를 들어, 프로세서(202b)는 메모리(204b) 내의 정보를 처리하여 제3 정보/신호를 생성한 뒤, 송수신기(206b)를 통해 제3 정보/신호를 포함하는 무선 신호를 전송할 수 있다. 또한, 프로세서(202b)는 송수신기(206b)를 통해 제4 정보/신호를 포함하는 무선 신호를 수신한 뒤, 제4 정보/신호의 신호 처리로부터 얻은 정보를 메모리(204b)에 저장할 수 있다. 메모리(204b)는 프로세서(202b)와 연결될 수 있고, 프로세서(202b)의 동작과 관련한 다양한 정보를 저장할 수 있다. 예를 들어, 메모리(204b)는 프로세서(202b)에 의해 제어되는 프로세스들 중 일부 또는 전부를 수행하거나, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 수행하기 위한 명령들을 포함하는 소프트웨어 코드를 저장할 수 있다. 여기서, 프로세서(202b)와 메모리(204b)는 무선 통신 기술(예, LTE, NR)을 구현하도록 설계된 통신 모뎀/회로/칩의 일부일 수 있다. 송수신기(206b)는 프로세서(202b)와 연결될 수 있고, 하나 이상의 안테나(208b)를 통해 무선 신호를 송신 및/또는 수신할 수 있다. 송수신기(206b)는 송신기 및/또는 수신기를 포함할 수 있다 송수신기(206b)는 RF 유닛과 혼용될 수 있다. 본 개시에서 무선 기기는 통신 모뎀/회로/칩을 의미할 수도 있다.
이하, 무선 기기(200a, 200b)의 하드웨어 요소에 대해 보다 구체적으로 설명한다. 이로 제한되는 것은 아니지만, 하나 이상의 프로토콜 계층이 하나 이상의 프로세서(202a, 202b)에 의해 구현될 수 있다. 예를 들어, 하나 이상의 프로세서(202a, 202b)는 하나 이상의 계층(예, PHY(physical), MAC(media access control), RLC(radio link control), PDCP(packet data convergence protocol), RRC(radio resource control), SDAP(service data adaptation protocol)와 같은 기능적 계층)을 구현할 수 있다. 하나 이상의 프로세서(202a, 202b)는 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 하나 이상의 PDU(Protocol Data Unit) 및/또는 하나 이상의 SDU(service data unit)를 생성할 수 있다. 하나 이상의 프로세서(202a, 202b)는 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 메시지, 제어정보, 데이터 또는 정보를 생성할 수 있다. 하나 이상의 프로세서(202a, 202b)는 본 문서에 개시된 기능, 절차, 제안 및/또는 방법에 따라 PDU, SDU, 메시지, 제어정보, 데이터 또는 정보를 포함하는 신호(예, 베이스밴드 신호)를 생성하여, 하나 이상의 송수신기(206a, 206b)에게 제공할 수 있다. 하나 이상의 프로세서(202a, 202b)는 하나 이상의 송수신기(206a, 206b)로부터 신호(예, 베이스밴드 신호)를 수신할 수 있고, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 PDU, SDU, 메시지, 제어정보, 데이터 또는 정보를 획득할 수 있다.
하나 이상의 프로세서(202a, 202b)는 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 마이크로 컴퓨터로 지칭될 수 있다. 하나 이상의 프로세서(202a, 202b)는 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 조합에 의해 구현될 수 있다. 일 예로, 하나 이상의 ASIC(application specific integrated circuit), 하나 이상의 DSP(digital signal processor), 하나 이상의 DSPD(digital signal processing device), 하나 이상의 PLD(programmable logic device) 또는 하나 이상의 FPGA(field programmable gate arrays)가 하나 이상의 프로세서(202a, 202b)에 포함될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 펌웨어 또는 소프트웨어를 사용하여 구현될 수 있고, 펌웨어 또는 소프트웨어는 모듈, 절차, 기능 등을 포함하도록 구현될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 수행하도록 설정된 펌웨어 또는 소프트웨어는 하나 이상의 프로세서(202a, 202b)에 포함되거나, 하나 이상의 메모리(204a, 204b)에 저장되어 하나 이상의 프로세서(202a, 202b)에 의해 구동될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 코드, 명령어 및/또는 명령어의 집합 형태로 펌웨어 또는 소프트웨어를 사용하여 구현될 수 있다.
하나 이상의 메모리(204a, 204b)는 하나 이상의 프로세서(202a, 202b)와 연결될 수 있고, 다양한 형태의 데이터, 신호, 메시지, 정보, 프로그램, 코드, 지시 및/또는 명령을 저장할 수 있다. 하나 이상의 메모리(204a, 204b)는 ROM(read only memory), RAM(random access memory), EPROM(erasable programmable read only memory), 플래시 메모리, 하드 드라이브, 레지스터, 캐쉬 메모리, 컴퓨터 판독 저장 매체 및/또는 이들의 조합으로 구성될 수 있다. 하나 이상의 메모리(204a, 204b)는 하나 이상의 프로세서(202a, 202b)의 내부 및/또는 외부에 위치할 수 있다. 또한, 하나 이상의 메모리(204a, 204b)는 유선 또는 무선 연결과 같은 다양한 기술을 통해 하나 이상의 프로세서(202a, 202b)와 연결될 수 있다.
하나 이상의 송수신기(206a, 206b)는 하나 이상의 다른 장치에게 본 문서의 방법들 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 전송할 수 있다. 하나 이상의 송수신기(206a, 206b)는 하나 이상의 다른 장치로부터 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 수신할 수 있다. 예를 들어, 하나 이상의 송수신기(206a, 206b)는 하나 이상의 프로세서(202a, 202b)와 연결될 수 있고, 무선 신호를 송수신할 수 있다. 예를 들어, 하나 이상의 프로세서(202a, 202b)는 하나 이상의 송수신기(206a, 206b)가 하나 이상의 다른 장치에게 사용자 데이터, 제어 정보 또는 무선 신호를 전송하도록 제어할 수 있다. 또한, 하나 이상의 프로세서(202a, 202b)는 하나 이상의 송수신기(206a, 206b)가 하나 이상의 다른 장치로부터 사용자 데이터, 제어 정보 또는 무선 신호를 수신하도록 제어할 수 있다. 또한, 하나 이상의 송수신기(206a, 206b)는 하나 이상의 안테나(208a, 208b)와 연결될 수 있고, 하나 이상의 송수신기(206a, 206b)는 하나 이상의 안테나(208a, 208b)를 통해 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 송수신하도록 설정될 수 있다. 본 문서에서, 하나 이상의 안테나는 복수의 물리 안테나이거나, 복수의 논리 안테나(예, 안테나 포트)일 수 있다. 하나 이상의 송수신기(206a, 206b)는 수신된 사용자 데이터, 제어 정보, 무선 신호/채널 등을 하나 이상의 프로세서(202a, 202b)를 이용하여 처리하기 위해, 수신된 무선 신호/채널 등을 RF 밴드 신호에서 베이스밴드 신호로 변환(Convert)할 수 있다. 하나 이상의 송수신기(206a, 206b)는 하나 이상의 프로세서(202a, 202b)를 이용하여 처리된 사용자 데이터, 제어 정보, 무선 신호/채널 등을 베이스밴드 신호에서 RF 밴드 신호로 변환할 수 있다. 이를 위하여, 하나 이상의 송수신기(206a, 206b)는 (아날로그) 오실레이터 및/또는 필터를 포함할 수 있다.
본 개시에 적용 가능한 무선 기기 구조
도 3은 본 개시에 적용되는 무선 기기의 다른 예시를 도시한 도면이다.
도 3을 참조하면, 무선 기기(300)는 도 2의 무선 기기(200a, 200b)에 대응하며, 다양한 요소(element), 성분(component), 유닛/부(unit), 및/또는 모듈(module)로 구성될 수 있다. 예를 들어, 무선 기기(300)는 통신부(310), 제어부(320), 메모리부(330) 및 추가 요소(340)를 포함할 수 있다. 통신부는 통신 회로(312) 및 송수신기(들)(314)을 포함할 수 있다. 예를 들어, 통신 회로(312)는 도 2의 하나 이상의 프로세서(202a, 202b) 및/또는 하나 이상의 메모리(204a, 204b)를 포함할 수 있다. 예를 들어, 송수신기(들)(314)는 도 2의 하나 이상의 송수신기(206a, 206b) 및/또는 하나 이상의 안테나(208a, 208b)을 포함할 수 있다. 제어부(320)는 통신부(310), 메모리부(330) 및 추가 요소(340)와 전기적으로 연결되며 무선 기기의 제반 동작을 제어한다. 예를 들어, 제어부(320)는 메모리부(330)에 저장된 프로그램/코드/명령/정보에 기반하여 무선 기기의 전기적/기계적 동작을 제어할 수 있다. 또한, 제어부(320)는 메모리부(330)에 저장된 정보를 통신부(310)을 통해 외부(예, 다른 통신 기기)로 무선/유선 인터페이스를 통해 전송하거나, 통신부(310)를 통해 외부(예, 다른 통신 기기)로부터 무선/유선 인터페이스를 통해 수신된 정보를 메모리부(330)에 저장할 수 있다.
추가 요소(340)는 무선 기기의 종류에 따라 다양하게 구성될 수 있다. 예를 들어, 추가 요소(340)는 파워 유닛/배터리, 입출력부(input/output unit), 구동부 및 컴퓨팅부 중 적어도 하나를 포함할 수 있다. 이로 제한되는 것은 아니지만, 무선 기기(300)는 로봇(도 1, 100a), 차량(도 1, 100b-1, 100b-2), XR 기기(도 1, 100c), 휴대 기기(도 1, 100d), 가전(도 1, 100e), IoT 기기(도 1, 100f), 디지털 방송용 단말, 홀로그램 장치, 공공 안전 장치, MTC 장치, 의료 장치, 핀테크 장치(또는 금융 장치), 보안 장치, 기후/환경 장치, AI 서버/기기(도 1, 140), 기지국(도 1, 120), 네트워크 노드 등의 형태로 구현될 수 있다. 무선 기기는 사용-예/서비스에 따라 이동 가능하거나 고정된 장소에서 사용될 수 있다.
도 3에서 무선 기기(300) 내의 다양한 요소, 성분, 유닛/부, 및/또는 모듈은 전체가 유선 인터페이스를 통해 상호 연결되거나, 적어도 일부가 통신부(310)를 통해 무선으로 연결될 수 있다. 예를 들어, 무선 기기(300) 내에서 제어부(320)와 통신부(310)는 유선으로 연결되며, 제어부(320)와 제1 유닛(예, 130, 140)은 통신부(310)를 통해 무선으로 연결될 수 있다. 또한, 무선 기기(300) 내의 각 요소, 성분, 유닛/부, 및/또는 모듈은 하나 이상의 요소를 더 포함할 수 있다. 예를 들어, 제어부(320)는 하나 이상의 프로세서 집합으로 구성될 수 있다. 예를 들어, 제어부(320)는 통신 제어 프로세서, 어플리케이션 프로세서(application processor), ECU(electronic control unit), 그래픽 처리 프로세서, 메모리 제어 프로세서 등의 집합으로 구성될 수 있다. 다른 예로, 메모리부(330)는 RAM, DRAM(dynamic RAM), ROM, 플래시 메모리(flash memory), 휘발성 메모리(volatile memory), 비-휘발성 메모리(non-volatile memory) 및/또는 이들의 조합으로 구성될 수 있다.
본 개시가 적용 가능한 휴대 기기
도 4는 본 개시에 적용되는 휴대 기기의 예시를 도시한 도면이다.
도 4는 본 개시에 적용되는 휴대 기기를 예시한다. 휴대 기기는 스마트폰, 스마트패드, 웨어러블 기기(예, 스마트 워치, 스마트 글래스), 휴대용 컴퓨터(예, 노트북 등)을 포함할 수 있다. 휴대 기기는 MS(mobile station), UT(user terminal), MSS(mobile subscriber station), SS(subscriber station), AMS(advanced mobile station) 또는 WT(wireless terminal)로 지칭될 수 있다.
도 4를 참조하면, 휴대 기기(400)는 안테나부(408), 통신부(410), 제어부(420), 메모리부(430), 전원공급부(440a), 인터페이스부(440b) 및 입출력부(440c)를 포함할 수 있다. 안테나부(408)는 통신부(410)의 일부로 구성될 수 있다. 블록 410~430/440a~440c는 각각 도 3의 블록 310~330/340에 대응한다.
통신부(410)는 다른 무선 기기, 기지국들과 신호(예, 데이터, 제어 신호 등)를 송수신할 수 있다. 제어부(420)는 휴대 기기(400)의 구성 요소들을 제어하여 다양한 동작을 수행할 수 있다. 제어부(420)는 AP(application processor)를 포함할 수 있다. 메모리부(430)는 휴대 기기(400)의 구동에 필요한 데이터/파라미터/프로그램/코드/명령을 저장할 수 있다. 또한, 메모리부(430)는 입/출력되는 데이터/정보 등을 저장할 수 있다. 전원공급부(440a)는 휴대 기기(400)에게 전원을 공급하며, 유/무선 충전 회로, 배터리 등을 포함할 수 있다. 인터페이스부(440b)는 휴대 기기(400)와 다른 외부 기기의 연결을 지원할 수 있다. 인터페이스부(440b)는 외부 기기와의 연결을 위한 다양한 포트(예, 오디오 입/출력 포트, 비디오 입/출력 포트)를 포함할 수 있다. 입출력부(440c)는 영상 정보/신호, 오디오 정보/신호, 데이터, 및/또는 사용자로부터 입력되는 정보를 입력 받거나 출력할 수 있다. 입출력부(440c)는 카메라, 마이크로폰, 사용자 입력부, 디스플레이부(440d), 스피커 및/또는 햅틱 모듈 등을 포함할 수 있다.
일 예로, 데이터 통신의 경우, 입출력부(440c)는 사용자로부터 입력된 정보/신호(예, 터치, 문자, 음성, 이미지, 비디오)를 획득하며, 획득된 정보/신호는 메모리부(430)에 저장될 수 있다. 통신부(410)는 메모리에 저장된 정보/신호를 무선 신호로 변환하고, 변환된 무선 신호를 다른 무선 기기에게 직접 전송하거나 기지국에게 전송할 수 있다. 또한, 통신부(410)는 다른 무선 기기 또는 기지국으로부터 무선 신호를 수신한 뒤, 수신된 무선 신호를 원래의 정보/신호로 복원할 수 있다. 복원된 정보/신호는 메모리부(430)에 저장된 뒤, 입출력부(440c)를 통해 다양한 형태(예, 문자, 음성, 이미지, 비디오, 햅틱)로 출력될 수 있다.
본 개시가 적용 가능한 무선 기기 종류
도 5는 본 개시에 적용되는 차량 또는 자율 주행 차량의 예시를 도시한 도면이다.
도 5는 본 개시에 적용되는 차량 또는 자율 주행 차량을 예시한다. 차량 또는 자율 주행 차량은 이동형 로봇, 차량, 기차, 유/무인 비행체(aerial vehicle, AV), 선박 등으로 구현될 수 있으며, 차량의 형태로 한정되는 것은 아니다.
도 5를 참조하면, 차량 또는 자율 주행 차량(500)은 안테나부(508), 통신부(510), 제어부(520), 구동부(540a), 전원공급부(540b), 센서부(540c) 및 자율 주행부(540d)를 포함할 수 있다. 안테나부(550)는 통신부(510)의 일부로 구성될 수 있다. 블록 510/530/540a~540d는 각각 도 4의 블록 410/430/440에 대응한다.
통신부(510)는 다른 차량, 기지국(예, 기지국, 노변 기지국(road side unit) 등), 서버 등의 외부 기기들과 신호(예, 데이터, 제어 신호 등)를 송수신할 수 있다. 제어부(520)는 차량 또는 자율 주행 차량(500)의 요소들을 제어하여 다양한 동작을 수행할 수 있다. 제어부(520)는 ECU(electronic control unit)를 포함할 수 있다.
도 6은 본 개시에 적용되는 AI 기기의 예시를 도시한 도면이다. 일 예로, AI 기기는 TV, 프로젝터, 스마트폰, PC, 노트북, 디지털방송용 단말기, 태블릿 PC, 웨어러블 장치, 셋톱박스(STB), 라디오, 세탁기, 냉장고, 디지털 사이니지, 로봇, 차량 등과 같은, 고정형 기기 또는 이동 가능한 기기 등으로 구현될 수 있다.
도 6을 참조하면, AI 기기(600)는 통신부(610), 제어부(620), 메모리부(630), 입/출력부(640a/640b), 러닝 프로세서부(640c) 및 센서부(640d)를 포함할 수 있다. 블록 910~930/940a~940d는 각각 도 3의 블록 310~330/340에 대응할 수 있다.
통신부(610)는 유무선 통신 기술을 이용하여 다른 AI 기기(예, 도 1, 100x, 120, 140)나 AI 서버(도 1, 140) 등의 외부 기기들과 유무선 신호(예, 센서 정보, 사용자 입력, 학습 모델, 제어 신호 등)를 송수신할 수 있다. 이를 위해, 통신부(610)는 메모리부(630) 내의 정보를 외부 기기로 전송하거나, 외부 기기로부터 수신된 신호를 메모리부(630)로 전달할 수 있다.
제어부(620)는 데이터 분석 알고리즘 또는 머신 러닝 알고리즘을 사용하여 결정되거나 생성된 정보에 기초하여, AI 기기(600)의 적어도 하나의 실행 가능한 동작을 결정할 수 있다. 그리고, 제어부(620)는 AI 기기(600)의 구성 요소들을 제어하여 결정된 동작을 수행할 수 있다. 예를 들어, 제어부(620)는 러닝 프로세서부(640c) 또는 메모리부(630)의 데이터를 요청, 검색, 수신 또는 활용할 수 있고, 적어도 하나의 실행 가능한 동작 중 예측되는 동작이나, 바람직한 것으로 판단되는 동작을 실행하도록 AI 기기(600)의 구성 요소들을 제어할 수 있다. 또한, 제어부(920)는 AI 장치(600)의 동작 내용이나 동작에 대한 사용자의 피드백 등을 포함하는 이력 정보를 수집하여 메모리부(630) 또는 러닝 프로세서부(640c)에 저장하거나, AI 서버(도 1, 140) 등의 외부 장치에 전송할 수 있다. 수집된 이력 정보는 학습 모델을 갱신하는데 이용될 수 있다.
메모리부(630)는 AI 기기(600)의 다양한 기능을 지원하는 데이터를 저장할 수 있다. 예를 들어, 메모리부(630)는 입력부(640a)로부터 얻은 데이터, 통신부(610)로부터 얻은 데이터, 러닝 프로세서부(640c)의 출력 데이터, 및 센싱부(640)로부터 얻은 데이터를 저장할 수 있다. 또한, 메모리부(930)는 제어부(620)의 동작/실행에 필요한 제어 정보 및/또는 소프트웨어 코드를 저장할 수 있다.
입력부(640a)는 AI 기기(600)의 외부로부터 다양한 종류의 데이터를 획득할 수 있다. 예를 들어, 입력부(620)는 모델 학습을 위한 학습 데이터, 및 학습 모델이 적용될 입력 데이터 등을 획득할 수 있다. 입력부(640a)는 카메라, 마이크로폰 및/또는 사용자 입력부 등을 포함할 수 있다. 출력부(640b)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시킬 수 있다. 출력부(640b)는 디스플레이부, 스피커 및/또는 햅틱 모듈 등을 포함할 수 있다. 센싱부(640)는 다양한 센서들을 이용하여 AI 기기(600)의 내부 정보, AI 기기(600)의 주변 환경 정보 및 사용자 정보 중 적어도 하나를 얻을 수 있다. 센싱부(640)는 근접 센서, 조도 센서, 가속도 센서, 자기 센서, 자이로 센서, 관성 센서, RGB 센서, IR 센서, 지문 인식 센서, 초음파 센서, 광 센서, 마이크로폰 및/또는 레이더 등을 포함할 수 있다.
러닝 프로세서부(640c)는 학습 데이터를 이용하여 인공 신경망으로 구성된 모델을 학습시킬 수 있다. 러닝 프로세서부(640c)는 AI 서버(도 1, 140)의 러닝 프로세서부와 함께 AI 프로세싱을 수행할 수 있다. 러닝 프로세서부(640c)는 통신부(610)를 통해 외부 기기로부터 수신된 정보, 및/또는 메모리부(630)에 저장된 정보를 처리할 수 있다. 또한, 러닝 프로세서부(940c)의 출력 값은 통신부(610)를 통해 외부 기기로 전송되거나/되고, 메모리부(630)에 저장될 수 있다.
6G 통신 시스템
6G (무선통신) 시스템은 (i) 디바이스 당 매우 높은 데이터 속도, (ii) 매우 많은 수의 연결된 디바이스들, (iii) 글로벌 연결성(global connectivity), (iv) 매우 낮은 지연, (v) 배터리-프리(battery-free) IoT 디바이스들의 에너지 소비를 낮추고, (vi) 초고신뢰성 연결, (vii) 머신 러닝 능력을 가지는 연결된 지능 등에 목적이 있다. 6G 시스템의 비젼은 “intelligent connectivity”, “deep connectivity”, “holographic connectivity”, “ubiquitous connectivity”와 같은 4가지 측면일 수 있으며, 6G 시스템은 하기 표 1과 같은 요구 사항을 만족시킬 수 있다. 즉, 표 1은 6G 시스템의 요구 사항을 나타낸 표이다.
Figure PCTKR2021008944-appb-img-000001
이때, 6G 시스템은 향상된 모바일 브로드밴드(enhanced mobile broadband, eMBB), 초-저지연 통신(ultra-reliable low latency communications, URLLC), mMTC (massive machine type communications), AI 통합 통신(AI integrated communication), 촉각 인터넷(tactile internet), 높은 스루풋(high throughput), 높은 네트워크 능력(high network capacity), 높은 에너지 효율(high energy efficiency), 낮은 백홀 및 접근 네트워크 혼잡(low backhaul and access network congestion) 및 향상된 데이터 보안(enhanced data security)과 같은 핵심 요소(key factor)들을 가질 수 있다.
도 7은 본 개시에 적용 가능한 6G 시스템에서 제공 가능한 통신 구조의 일례를 도시한 도면이다.
도 7을 참조하면, 6G 시스템은 5G 무선통신 시스템보다 50배 더 높은 동시 무선통신 연결성을 가질 것으로 예상된다. 5G의 핵심 요소(key feature)인 URLLC는 6G 통신에서 1ms보다 적은 단-대-단(end-to-end) 지연을 제공함으로써 보다 더 주요한 기술이 될 것으로 예상된다. 이때, 6G 시스템은 자주 사용되는 영역 스펙트럼 효율과 달리 체적 스펙트럼 효율이 훨씬 우수할 것이다. 6G 시스템은 매우 긴 배터리 수명과 에너지 수확을 위한 고급 배터리 기술을 제공할 수 있어, 6G 시스템에서 모바일 디바이스들은 별도로 충전될 필요가 없을 수 있다.
6G 시스템의 핵심 구현 기술
- 인공 지능(artificial Intelligence, AI)
6G 시스템에 가장 중요하며, 새로 도입될 기술은 AI이다. 4G 시스템에는 AI가 관여하지 않았다. 5G 시스템은 부분 또는 매우 제한된 AI를 지원할 것이다. 그러나, 6G 시스템은 완전히 자동화를 위해 AI가 지원될 것이다. 머신 러닝의 발전은 6G에서 실시간 통신을 위해 보다 지능적인 네트워크를 만들 것이다. 통신에 AI를 도입하면 실시간 데이터 전송이 간소화되고 향상될 수 있다. AI는 수많은 분석을 사용하여 복잡한 대상 작업이 수행되는 방식을 결정할 수 있다. 즉, AI는 효율성을 높이고 처리 지연을 줄일 수 있다.
핸드 오버, 네트워크 선택, 자원 스케줄링과 같은 시간 소모적인 작업은 AI를 사용함으로써 즉시 수행될 수 있다. AI는 M2M, 기계-대-인간 및 인간-대-기계 통신에서도 중요한 역할을 할 수 있다. 또한, AI는 BCI(brain computer interface)에서 신속한 통신이 될 수 있다. AI 기반 통신 시스템은 메타 물질, 지능형 구조, 지능형 네트워크, 지능형 장치, 지능형 인지 라디오(radio), 자체 유지 무선 네트워크 및 머신 러닝에 의해 지원될 수 있다.
최근 AI를 무선 통신 시스템과 통합하려고 하는 시도들이 나타나고 있으나, 이는 어플리케이션 계층(application layer), 네트워크 계층(network layer) 특히, 딥 러닝은 무선 자원 관리 및 할당(wireless resource management and allocation) 분야에 집중되어 왔다. 그러나, 이러한 연구는 점점 MAC 계층 및 물리 계층으로 발전하고 있으며, 특히 물리계층에서 딥 러닝을 무선 전송(wireless transmission)과 결합하고자 하는 시도들이 나타나고 있다. AI 기반의 물리계층 전송은, 근본적인 신호 처리 및 통신 메커니즘에 있어서, 전통적인 통신 프레임워크가 아니라 AI 드라이버에 기초한 신호 처리 및 통신 메커니즘을 적용하는 것을 의미한다. 예를 들어, 딥러닝 기반의 채널 코딩 및 디코딩(channel coding and decoding), 딥러닝 기반의 신호 추정(estimation) 및 검출(detection), 딥러닝 기반의 MIMO(multiple input multiple output) 매커니즘(mechanism), AI 기반의 자원 스케줄링(scheduling) 및 할당(allocation) 등을 포함할 수 있다.
머신 러닝은 채널 추정 및 채널 트래킹을 위해 사용될 수 있으며, DL(downlink)의 물리 계층(physical layer)에서 전력 할당(power allocation), 간섭 제거(interference cancellation) 등에 사용될 수 있다. 또한, 머신 러닝은 MIMO 시스템에서 안테나 선택, 전력 제어(power control), 심볼 검출(symbol detection) 등에도 사용될 수 있다.
그러나 물리계층에서의 전송을 위한 DNN의 적용은 아래와 같은 문제점이 있을 수 있다.
딥러닝 기반의 AI 알고리즘은 훈련 파라미터를 최적화하기 위해 수많은 훈련 데이터가 필요하다. 그러나 특정 채널 환경에서의 데이터를 훈련 데이터로 획득하는데 있어서의 한계로 인해, 오프라인 상에서 많은 훈련 데이터를 사용한다. 이는 특정 채널 환경에서 훈련 데이터에 대한 정적 훈련(static training)은, 무선 채널의 동적 특성 및 다이버시티(diversity) 사이에 모순(contradiction)이 생길 수 있다.
또한, 현재 딥 러닝은 주로 실제 신호(real signal)을 대상으로 한다. 그러나, 무선 통신의 물리 계층의 신호들은 복소 신호(complex signal)이다. 무선 통신 신호의 특성을 매칭시키기 위해 복소(complex) 도메인 신호의 검출하는 신경망(neural network)에 대한 연구가 더 필요하다.
이하, 머신 러닝에 대해 보다 구체적으로 살펴본다.
머신 러닝은 사람이 할 수 있거나 혹은 하기 어려운 작업을 대신해낼 수 있는 기계를 만들어 내기 위해 기계를 학습시키는 일련의 동작을 의미한다. 머신 러닝을 위해서는 데이터와 러닝 모델이 필요하다. 머신 러닝에서 데이터의 학습 방법은 크게 3가지 즉, 지도 학습(supervised learning), 비지도 학습(unsupervised learning) 그리고 강화 학습(reinforcement learning)으로 구분될 수 있다.
신경망 학습은 출력의 오류를 최소화하기 위한 것이다. 신경망 학습은 반복적으로 학습 데이터를 신경망에 입력시키고 학습 데이터에 대한 신경망의 출력과 타겟의 에러를 계산하고, 에러를 줄이기 위한 방향으로 신경망의 에러를 신경망의 출력 레이어에서부터 입력 레이어 방향으로 역전파(backpropagation) 하여 신경망의 각 노드의 가중치를 업데이트하는 과정이다.
지도 학습은 학습 데이터에 정답이 라벨링된 학습 데이터를 사용하며 비지도 학습은 학습 데이터에 정답이 라벨링되어 있지 않을 수 있다. 즉, 예를 들어 데이터 분류에 관한 지도 학습의 경우의 학습 데이터는 학습 데이터 각각에 카테고리가 라벨링된 데이터 일 수 있다. 라벨링된 학습 데이터가 신경망에 입력되고 신경망의 출력(카테고리)과 학습 데이터의 라벨을 비교하여 오차(error)가 계산될 수 있다. 계산된 오차는 신경망에서 역방향(즉, 출력 레이어에서 입력 레이어 방향)으로 역전파 되며, 역전파에 따라 신경망의 각 레이어의 각 노드들의 연결 가중치가 업데이트 될 수 있다. 업데이트 되는 각 노드의 연결 가중치는 학습률(learning rate)에 따라 변화량이 결정될 수 있다. 입력 데이터에 대한 신경망의 계산과 에러의 역전파는 학습 사이클(epoch)을 구성할 수 있다. 학습률은 신경망의 학습 사이클의 반복 횟수에 따라 상이하게 적용될 수 있다. 예를 들어, 신경망의 학습 초기에는 높은 학습률을 사용하여 신경망이 빠르게 일정 수준의 성능을 확보하도록 하여 효율성을 높이고, 학습 후기에는 낮은 학습률을 사용하여 정확도를 높일 수 있다
데이터의 특징에 따라 학습 방법은 달라질 수 있다. 예를 들어, 통신 시스템 상에서 송신단에서 전송한 데이터를 수신단에서 정확하게 예측하는 것을 목적으로 하는 경우, 비지도 학습 또는 강화 학습 보다는 지도 학습을 이용하여 학습을 수행하는 것이 바람직하다.
러닝 모델은 인간의 뇌에 해당하는 것으로서, 가장 기본적인 선형 모델을 생각할 수 있으나, 인공 신경망(artificial neural networks)와 같은 복잡성이 높은 신경망 구조를 러닝 모델로 사용하는 머신 러닝의 패러다임을 딥러닝(deep learning)이라 한다.
학습(learning) 방식으로 사용하는 신경망 코어(neural network cord)는 크게 심층 신경망(deep neural networks, DNN), 합성곱 신경망(convolutional deep neural networks, CNN), 순환 신경망(recurrent boltzmann machine, RNN) 방식이 있으며, 이러한 러닝 모델이 적용될 수 있다.
THz(Terahertz) 통신
6G 시스템에서 THz 통신이 적용될 수 있다. 일 예로, 데이터 전송률은 대역폭을 늘려 높일 수 있다. 이것은 넓은 대역폭으로 sub-THz 통신을 사용하고, 진보된 대규모 MIMO 기술을 적용하여 수행될 수 있다.
도 8은 본 개시에 적용 가능한 전자기 스펙트럼을 도시한 도면이다. 일 예로, 도 8을 참조하면, 밀리미터 이하의 방사선으로도 알려진 THz파는 일반적으로 0.03mm-3mm 범위의 해당 파장을 가진 0.1THz와 10THz 사이의 주파수 대역을 나타낸다. 100GHz-300GHz 대역 범위(Sub THz 대역)는 셀룰러 통신을 위한 THz 대역의 주요 부분으로 간주된다. Sub-THz 대역 mmWave 대역에 추가하면 6G 셀룰러 통신 용량은 늘어난다. 정의된 THz 대역 중 300GHz-3THz는 원적외선 (IR) 주파수 대역에 있다. 300GHz-3THz 대역은 광 대역의 일부이지만 광 대역의 경계에 있으며, RF 대역 바로 뒤에 있다. 따라서, 이 300 GHz 내지 3 THz 대역은 RF와 유사성을 나타낸다.
THz 통신의 주요 특성은 (i) 매우 높은 데이터 전송률을 지원하기 위해 광범위하게 사용 가능한 대역폭, (ii) 고주파에서 발생하는 높은 경로 손실 (고 지향성 안테나는 필수 불가결)을 포함한다. 높은 지향성 안테나에서 생성된 좁은 빔 폭은 간섭을 줄인다. THz 신호의 작은 파장은 훨씬 더 많은 수의 안테나 소자가 이 대역에서 동작하는 장치 및 BS에 통합될 수 있게 한다. 이를 통해 범위 제한을 극복할 수 있는 고급 적응형 배열 기술을 사용할 수 있다.
하기에서 는 수동형 지능형 반사판(Intelligent Reflect Surface, IRS)을 사용하여 무선 채널 환경을 조절하는 방법에 대해 서술한다. 여기서, 인공지능 시스템은 IRS를 이용하는 무선 채널 환경을 조절하기 위해 사용될 수 있으며, 이에 대해서도 후술한다.
일 예로, 현재의 무선 통신기술은 채널 환경(H)에 적응하는 앤드 포인트 최적화를 통해 제어될 수 있다. 일 예로, 송신기 및 수신기에서 최적화를 수행하는 경우, 송신기와 수신기는 빔포밍, 전력 제어 및 적응적 모듈레이션 중 적어도 어느 하나를 송신기와 수신기 사이의 채널 환경(H)에 맞춰서 조절하여 전송 효율을 증대시킬 수 있다.
이때, 채널 환경은 랜덤하고 제어되지 않으며 자연적으로 고정된 상태일 수 있다. 즉, 기존 통신 시스템에서는 채널 환경은 고정된 상태에서 채널 환경에 최적화되도록 각각의 앤드 포인트를 제어하는 방식을 수행될 수 있었다. 따라서, 송신기 및 수신기는 채널에 적응하도록 최적화를 수행하고, 이를 통해 데이터를 송수신할 수밖에 없다. 이때, 음영지역에서의 NLOS(non-line of sight)의 환경이나 6G THz와 같이 신호 손실이 크고 다중경로가 존재하기 어려운 환경에서는 앤드 포인트의 최적화만으로는 샤논의 채널용량 한계(Shannon’s Capacity Limit)를 극복하기 어려울 수 있으며, 이를 통해 원하는 요구사항만큼의 스루풋을 기대하기 어려울 수 있다.
상술한 점을 고려하여, 새로운 통신 시스템에서는 지능형 무선환경(Smart Radio Environment)에 기초하여 통신이 수행될 수 있다. 이때, 지능형 무선 환경에서는 지능형 반사판(IRS)를 사용하여 무선 채널을 송수신기와 같이 제어할 수 있는 인자로 사용할 수 있다.
즉, 무선 통신 전송을 최적화하기 위해 사용되는 인자로 무선 채널에 대한 인자가 추가될 수 있다. 이를 통해, 기존 통신 시스템에서 해결 불가능한 문제로써 채널을 재설정하거나 샤논의 채널용량 한계의 극복이 가능할 수 있다. 다만, 지능형 무선환경에서 지능형 반사판(IRS)으로 인해 추가된 채널의 측정과 지능형 반사판(IRS)을 송수신기와 같이 동시에 고려해서 최적화 할 필요성이 있으며, 이에 따라 최적화 과정이 복잡해질 수 있다.
일 예로, 현재의 무선통신기술 한계와 함께 지능형 무선환경에서 적용되는 AO(Alternating Optimization) 알고리즘을 사용하여 IRS를 제어하는데 한계가 존재할 수 있으며, 하기에서는 수동형 기반 지능형 반사판에서 채널 정보 획득의 한계를 극복하기 위한 방법에 대해 서술한다.
보다 상세하게는, 기존 통신 시스템에서는 고정된 무선 채널 환경에서 송신기 및 수신기의 제어를 통해 샤논의 채널용량 한계에 근접하는 방식을 통해 동작할 수 있었다. 다만, 음영지역과 같이 열악한 NLOS 환경에서는 채널 용량의 한계로 인해 송수신이 거의 불가능할 수 있다. 일 예로, NLOS 채널환경에서 송신기는 전력을 증가시켜 채널 용량의 한계를 개선할 수 있지만, 그만큼 잡음과 간섭의 크기도 같이 증가할 수 있다. 이때, 6G THz 환경처럼 신호 손실이 크고 다중 경로가 존재하기 어려운 환경에서는 송신기 및 수신기의 최적화만으로는 샤논의 채널용량 한계를 극복하는데 한계가 존재할 수 있다.
여기서, 일 예로, 새로운 통신 시스템(e.g. 6G)에서는 새로운 서비스로써 MBRLLC(Mobile Broadband Reliable Low Latency Communication), mURLLC(Massive Ultra-Reliable, Low Latency communications), HCS(Human-Centric Services) 및 3CLS(Convergence of Communications, Computing, Control, Localization, and Sensing)의 서비스를 제공하기 위한 요구사항이 만족될 필요성이 있으며, 이를 위해 지능형 무선환경에 기초한 통신이 필요할 수 있다.
또한, 일 예로, 기지국 셀의 커버리지 증대 및 음영지역에 대한 지원을 위해 현재 많은 중계기(Relay)를 사용하고 있다. 다만, 중계기를 이용하는 방식은 전송 효율을 증대시킬 수 있으나, 다른 사용자에 대한 간섭신호를 추가적으로 발생 시킬 수 있다. 따라서, 전체적인 통신자원 효율면에서 한계가 발생할 수 있다. 또한, 중계기(Relay)의 사용은 또한 높은 추가비용과 에너지가 필요하고, 복잡하고 혼재된 간섭 신호 관리가 용이하지 않을 수 있다. 또한, 일 예로, 반 이중 방식(Half Duplex)을 사용함으로써 스펙트럼 효율성이 감소할 수 있으며, 공간 활용면이나 심미적으로도 영향을 줄 수 있다.
반면, 지능형 무선환경에서는 지능형 반사판(IRS)를 사용하여 무선채널환경을 조절할 수 있다. 동시에 송신기 및 수신기는 최적화를 함께 수행하여 지능형 무선환경(Smart Radio Environment)에서 샤논의 채널용량 한계의 극복할 수 있는 해결책을 제공할 수 있으며, 이에 대해서는 후술한다.
다만, 기존에 기지국과 단말 간의 채널 이외에, 기지국-IRS, IRS-단말간의 채널도 고려할 필요성이 있다. 또한, 기존에는 송수신기만 환경에 맞춰 최적화하면 충분하지만, 지능형 무선환경(Smart Radio Environment)에서는 지능형 반사판(IRS)도 같이 제어해야 될 필요성이 있다.
또한, 해당 값은 송수신기의 최적화와 의존성을 가질 수 있으며, 이에 따라 복잡성이 증가할 수 있다. 여기서, 최적화를 위해 사용되는 AO(Alternating Optimization) 알고리즘은 수렴될 때가지 반복적으로 수행될 수 있으며, 모든 채널들이 측정되어야 하는 부담을 줄 수 있다. 하기에서는 상술한 점을 고려하여 수동형 기반 지능형 반사판으로 지능형 무선환경에서 최적화를 수행하는 방법 및 인공지능 시스템에 대해 서술한다.
또한, 일 예로, 표 2는 하기 및 상술한 바를 고려한 용어일 수 있으며, 하기에서는 이에 기초하여 수동형 기반 지능형 반사판으로 지능형 무선환경에서 최적화를 수행하는 방법 및 인공지능 시스템에 대해 서술한다.
Figure PCTKR2021008944-appb-img-000002
도 9는 본 개시의 일 실시예에 따라 무선 채널 환경을 나타낸 도면이다. 도 9를 참조하면, 기존 통신 시스템에서 무선 채널 환경(H)는 자연적으로 고정되어 있고, 제어할 수 없는 랜덤한 상태일 수 있다. 따라서, 송신기(910) 및 수신기(920)는 채널에 적응하여 최적화된 송수신 방법을 찾을 수 있다. 송신기(910)와 수신기(920)는 신호(e.g. 참조신호)를 통해 채널 상태를 측정하고, 측정된 채널 상태에 기초하여 최적화가 수행되도록 제어될 수 있다. 다만, 상술한 바와 같이 테라헤르츠 환경과 같이 신호 손실이 크고 다중 경로 적용이 어려운 경우 및 음영지역과 같이 NLOS 환경에서는 데이터 전송에 한계가 존재할 수 있다. 일 예로, 하기 수학식 1은 샤논의 용량 한계를 나타낼 수 있다. 이때, 수학식 1에서 송신 신호 P에 프리코딩 및 가공을 적용하여 증대 시키더라도 채널 |H|의 크기가 작으면 채널 용량을 증대시키는 것에 한계가 존재할 수 있다.
무선 채널 환경이 고정된 상태에서는 수학식 1에 기초하여 채널 용량을 증대시키는데 한계가 존재할 수 있다. 이때, 지능형 반사판(IRS)을 사용하면 송신기(910)와 수신기(920) 사이에서 다중 경로를 확보할 수 있으며, 상술한 채널 |H|를 증대시킬 수 있다. 즉, 지능형 무선환경에서 지능현 반사판에 기초하여 무선 채널 환경은 조절 가능한 인자일 수 있으며, 이를 통해 채널 용량을 증대시킬 수 있다.
Figure PCTKR2021008944-appb-img-000003
일 예로, 도 10은 본 개시의 일 실시예에 따라 지능형 무선 환경을 나타낸 도면이다. 도 10을 참조하면, 지능형 무선 채널 환경에서 무선 채널 |H|는 최적화를 위한 인자일 수 있다. 보다 상세하게는, 상술한 도 9에서는 앤드 포인트 최적화로써 “max{f(Tx, Rx)}”에 기초하여 송신기(910) 및 수신기(920)에서 최적화가 수행될 수 있으며, 이는 상술한 바와 같다. 다만, 도 10에서는 앤드 포인트 최적화로써 “max{f(Tx, Rx, H)}”에 기초하여 송신기(1010) 및 수신기(1020)에서 최적화가 수행될 수 있다. 즉, 지능형 무선 환경에서는 지능형 반사판에 기초하여 채널 |H|가 최적화를 위한 인자로써 사용될 수 있다.
도 11은 본 개시의 일 실시예에 따라, 기존 무선 채널 환경 및 지능형 무선 채널 환경을 나타낸 도면이다. 일 예로, 도 11(a)를 참조하면, 기존 무선 채널 환경은 P1일 수 있다. 또한, 도 11(b)를 참조하면, 지능형 무선 채널 환경은 P2일 수 있다. 이때, 도 11(a) 및 도 11(b)에서 각각 x 신호가 송신단에서 무선 채널을 통해 전송되는 경우, 수신단은 y 신호를 수신할 수 있다. 이때, 기존 무선 채널 환경에서 P1의 확률은 고정되어 있으며 수신단(Decoder)은 송신 신호에 대한 측정을 통해 송신단으로 피드백을 전송할 수 있다. 송신단은 수신단의 피드백을 통해 무선 채널 환경에 적응할 수 있도록 최적화를 수행할 수 있다. 보다 구체적인 일 예로, 수신단은 송신단이 전송한 참조신호에 기초하여 송신신호에 대한 CQI(Channel Quality Indicator)를 측정하고, 이를 피드백 할 수 있다. 송신단은 피드백된 정보에 기초하여 MCS(modulation coding scheme)을 조절하고, 이에 대한 정보를 수신단에 제공하여 통신을 수행할 수 있다.
반면, 도 11(b)를 참조하면, 지능형 무선 채널 환경에서는 무선 채널 환경 P2가 인식되고, IRS 제어를 통해 무선 채널 환경을 변경시킬 수 있다. 이와 동시에, 수신단은 수신한 송신 신호에 대한 측정을 수행하고, 이에 대한 피드백을 송신단으로 전송할 수 있다. 즉, 송신단은 IRS 제어에 기초한 피드백 정보 및 수신단의 피드백 정보를 수신하여 최적화를 수행할 수 있다. 이때, 송신단은 IRS를 조절하여 무선 채널 환경을 변경시킬 수 있으며, 무선 채널 환경과 송신단을 고려한 최적화가 수행될 수 있다.
보다 상세하게는, 도 12는 본 개시의 일 실시예에 따라 지능형 무선 채널 환경에서 최적화를 수행하는 방법을 나타낸 도면이다. 도 12를 참조하면, 지능형 무선 채널 환경에서 기지국(1210) 및 단말(1230) 사이에는 IRS(1220)가 존재할 수 있다. 일 예로, 기지국(1210)이 전송하는 신호는 단말(1230)로 직접 전송되는 경로 및 IRS(1220)에 반사되어 전송되는 경로가 존재할 수 있다. 즉, 지능형 무선 채널 환경에서는 기지국(1210)과 IRS(1220) 간 무선 채널(G), IRS(1220)와 단말(1230) 간 무선 채널(
Figure PCTKR2021008944-appb-img-000004
) 및 기지국(1210)과 단말(1230) 간 직접 무선 채널(
Figure PCTKR2021008944-appb-img-000005
)이 존재할 수 있다. 여기서, IRS(1220)의 제어에 기초하여 기지국(1210)과 IRS(1220) 간 무선 채널(G) 및 IRS(1220)와 단말(1230) 간 무선 채널(
Figure PCTKR2021008944-appb-img-000006
)이 변경될 수 있다. 따라서, 지능형 무선 채널 환경에서 최적화는 상술한 무선 채널 환경을 고려하여 최적화가 수행될 수 있다.
보다 상세하게는, 기지국(1210)이 단말 k(1230)에게 신호를 전송하는 경우, 단말 k(1230)를 위한 기지국 송신 빔포밍 벡터는
Figure PCTKR2021008944-appb-img-000007
, 단말 k(1230)에게 전송하는 신호는
Figure PCTKR2021008944-appb-img-000008
및 수신 잡음이
Figure PCTKR2021008944-appb-img-000009
일 수 있다. 이때, 단말 k(1230)가 IRS(1220)를 사용하는 환경에 기초하여 기지국(1210)으로부터 수신하는 신호는 하기 수학식 2와 같을 수 있으며, 각각의 채널에 대해서는 하기 표 3과 같을 수 있다.
Figure PCTKR2021008944-appb-img-000010
Figure PCTKR2021008944-appb-img-000011
여기서, 단말 k(1230)가 수신한 신호 대 잡음비(signal noise ratio, SNR)은 하기 수학식 3과 같을 수 있다.
Figure PCTKR2021008944-appb-img-000012
따라서 수신 SNR을 최적화하기 위한 지능형 무선환경(SRE)을 구성하는 경우, 하기 수학식 4와 같이 IRS의 제어와 전송 빔포밍(Transmit Beamforming)을 설정하는 경우일 수 있다.
Figure PCTKR2021008944-appb-img-000013
이때, MIMO에서 최대율 전송(Maximum-Rate Transmit)을 고려하여 단말 k(1230)의 전송 빔포밍(Transmit Beamforming)
Figure PCTKR2021008944-appb-img-000014
는 하기 수학식 5와 같을 수 있다.
Figure PCTKR2021008944-appb-img-000015
여기서,
Figure PCTKR2021008944-appb-img-000016
는 IRS에서 최대 전송 파워일 수 있고,
Figure PCTKR2021008944-appb-img-000017
및 Φ 를 최적화하는 수식에
Figure PCTKR2021008944-appb-img-000018
를 대입하면 최적화는 하기 수학식 6과 같을 수 있다.
Figure PCTKR2021008944-appb-img-000019
이때, IRS 제어 값 Φ 를 결정하면,
Figure PCTKR2021008944-appb-img-000020
를 연산에 의해 결정할 수 있다. 여기서, 상술한 최적화 문제를 해결하기 위한 AO(Alternating Optimization) 알고리즘이 사용될 수 있다. 일 예로, AO 알고리즘은 채널정보(
Figure PCTKR2021008944-appb-img-000021
,
Figure PCTKR2021008944-appb-img-000022
, G) 를 이용하여 IRS 요소 별로 신뢰 구간(Trust region)을 결정하는 방법일 수 있으며, 도 13과 같을 수 있다. 또한, 목적 함수의 값(Objective Value)이 수렴할 때까지 반복적으로 바이너리 결정(binary decision)을 수행하고, 이를 통해
Figure PCTKR2021008944-appb-img-000023
을 구할 수 있다. 여기서, 수렴 값의 상위 한계 값(upper bound)은 이상적인 IRS(Ideal IRS)인 경우,
Figure PCTKR2021008944-appb-img-000024
=1일 수 있다. 이때, 일 예로, 도 12에서 IRS는 상술한 IRS 요소별로 최적화된 값을 찾기 위해 상술한 동작을 반복할 수 있다.
여기서, AO(Alternating Optimization) 알고리즘은 수렴할 때까지 반복할 필요성이 있다. 또한, IRS 요소별로 각각의 최적화 값을 도출해야 하므로 복잡도가 커지고 연산량이 증가할 수 있다. 이때, 기지국의 안테나 수 M 및 IRS 요수 수 N에 따라 복잡도 및 연산량이 증가할 수 있으며, 이를 계산하는데 한계가 존재할 수 있다. 또한, AO(Alternating Optimization) 알고리즘을 최적화하는 경우, IRS가 포함된 모든 채널들의 측정 값이 필요할 수 있으며, 상술한 바를 고려하면 최적화에 한계가 존재할 수 있다.
도 14는 본 개시의 일 실시예에 따라 수동형 기반 지능형 무선 채널 환경에서 최적화를 수행하는 방법을 나타낸 도면이다.
상술한 바와 같이, 지능형 무선 채널 환경에서 IRS에 기초하여 채널에 대한 최적화를 수행하는 경우, AO(Alternating Optimization) 알고리즘의 반복성과 IRS 소자(Element)에 따라 연산량이 기하급수적으로 증가할 수 있다. 또한, 일 예로, 지능형 무선 채널 환경에서는 IRS가 포함된 모든 채널 정보를 측정해야 할 필요성이 있으며, 이에 따라 복잡성이 증가할 수 있다.
하기에서는 IRS로써 능동센서가 없는 단순한 구조의 IRS를 사용하는 방법에 대해 서술한다. 일 예로, 능동센서가 구비된 IRS는 기지국으로부터 전송되는 신호를 센싱하여 채널 정보를 획득할 수 있다. 반면, 능동센서가 없는 수동형 IRS는 기지국으로부터 전송되는 신호를 반사판 구조에 기초하여 단말로 전송할 뿐, 센싱은 수행하지 않을 수 있다. 따라서, 능동센서가 없는 수동형 IRS는 능동센서를 구비한 IRS 대비 설치 및 비용이 적을 수 있으며, 이에 기초하여 활용 가능성이 높을 수 있다.
다만, 수동형 기반 IRS는 능동센서가 구비되지 않기 때문에 부족한 채널 정보를 인공지능으로 보완할 필요성이 있다. 즉, 능동센서에 의해 측정될 수 있는 채널 정보는 인공지능을 통해 획득될 필요성이 있다. 일 예로, 최적화된 IRS 제어 값은 기지국 안테나 수 M과 IRS 소자(Element) 수 N에 영향을 받지 않고, 인공지능에 기초하여 도출될 수 있으며, 이에 대해서 후술한다.
구체적인 일 예로, 도 14를 참조하면, 기지국(1410)과 IRS(1420) 사이의 채널 G는 LoS(Line of Sight) 환경의 위치 변화가 없는 채널일 수 있다. 따라서, 기지국(1410)은 채널 G에 대한 전송 빔포밍(Transmit Beamforming)
Figure PCTKR2021008944-appb-img-000025
를 사전에 인지하고 관리할 수 있다. 일 예로, 인공지능 빔 선택기(1440)는 최적화된 IRS 제어 값 Φ를 선택하고, 선택된 정보를 IRS 제어기(IRS Controller, 1450)로 전달하는 구성일 수 있다. 일 예로, 인공지능 빔 선택기(1440)는 SRE 인공지능 시스템에 기초하여 최적화된 빔을 선택하는 구성일 수 있다.
일 예로, 인공지능 빔 선택기(1440)는 기지국(1410)에서 구현될 수 있다. 즉, SRE 인공지능 시스템에 기초하여 동작하는 인공지능 빔 선택기(1440)는 기지국(1410)에 구현되어 동작할 수 있다. 또 다른 일 예로, 인공지능 빔 선택기(1440)는 IRS 제어기(1450)와 연계되어 구현될 수 있다. 또 다른 일 예로, 인공지능 빔 선택기(1440)는 단말(1430)에 구현되어 동작할 수 있다. 또 다른 일 예로, 인공지능 빔 선택기(1440)는 기지국(1410)과 별도로 클라우드 또는 별도의 디바이스를 통해 구현될 수 있으며, 특정 형태로 한정되는 것은 아닐 수 있다.
즉, 인공지능 빔 선택기(1440)는 SRE 인공지능 시스템에 기초하여 최적화된 빔 선택을 수행하는 구성일 수 있으며 기지국(1410), IRS 제어기(1450), 단말(1430) 및 별도의 디바이스/클라우드 중 적어도 어느 하나에 기초하여 구현될 수 있으며, 특정 형태로 한정되는 것은 아닐 수 있다.
인공지능 빔 선택시(1440)가 상술한 바와 같이 최적화된 IRS 제어 값 Φ를 선택하고, 이에 대한 정보를 IRS 제어기(1450)로 전달한 경우, IRS 제어기(1450)는 해당 값(Φ)으로 IRS(1420)를 제어할 수 있다. 이때, 기지국(1410)은 IRS(1420)에 상술한 IRS 제어 값에 기초하여
Figure PCTKR2021008944-appb-img-000026
가 적용된 를 전송할 수 있다. 이때, 단말(1430)은 IRS(1420)를 통해 기지국(1410)이 전송하는 참조신호를 수신할 수 있다. 그 후, 단말(1430)은 참조신호에 기초하여 IRS 제어 값 Φ 로 인한 보상 값(Reward)을 획득하고, 채널 정보를 측정할 수 있다. 이때, 단말(1430)은 보상 값과 측정된 채널 정보(
Figure PCTKR2021008944-appb-img-000027
)를 기지국(1410)으로 전달할 수 있다. 또 다른 일 예로, 단말(1430)은 IRS 제어 값 Φ 로 인한 보상 값(Reward)과 채널 정보를 간접적으로 나타내는 지표 정보(e.g. SNR,
Figure PCTKR2021008944-appb-img-000028
)를 획득하고, 기지국(1410)으로 전달할 수 있다. 그 후, 기지국(1410)은 단말(1430)로부터 전달받은 피드백 정보에 기초하여 인공지능 시스템을 학습할 수 있다. 일 예로, 인공지능 빔 선택기(1450)가 기지국(1410)에 직접 구비된 경우, 기지국(1410)은 인공지능 빔 선택기(1450)를 통해 학습을 수행할 수 있다. 또 다른 일 예로, 인공지능 빔 선택기(1450)가 별도의 클라우드 또는 디바이스로 존재하는 경우, 기지국(1410)은 단말(1430)로부터 수신한 피드백 정보를 전달하여 학습을 수행하도록 할 수 있다. 또 다른 일 예로, 단말(1430)에 인공지능 빔 선택시(1450)가 구현된 경우, 단말(1430)은 참조신호를 통해 획득한 보상 값 및 채널 정보를 통해 직접 학습을 수행할 수 있다.
여기서, 인공지능 빔 선택기(1450)가 상태 정보를 이용하는 강화학습(reinforce learning)으로 구현된 경우, 인공지능 빔 선택기(1450)는 상태 정보로 현재의 IRS(1420)의 제어 값과 채널정보
Figure PCTKR2021008944-appb-img-000029
를 사용할 수 있다. 인공지능 빔 선택기(1450)가 최적화된 IRS 제어 값 Φ에 대한 설정을 완료한 경우, 기지국(1410)은 최적화된 IRS 제어 값 Φ를 통해 새로운 무선환경에서 최적화된 전송 빔포밍(Transmit Beamforming)
Figure PCTKR2021008944-appb-img-000030
를 연산하고, 적용할 수 있다.
Figure PCTKR2021008944-appb-img-000031
는 인공지능을 활용하여 연산되거나 5G NR에서 사용하고 있는 빔 관리 방식이 적용될 수 있으며, 특정 형태로 한정되는 것은 아닐 수 있다.
도 15는 본 개시의 일 실시예에 따라 최적화된 지능형 무선 환경(SRE)를 설정하기 위해 기지국, 단말 및 IRS 상호 간의 신호 흐름을 나타낸 도면이다.
일 예로, 도 15를 참조하면, 기지국(1510)은 상술한 바와 같이 채널 G에 대한 전송 빔포밍(Transmit Beamforming)
Figure PCTKR2021008944-appb-img-000032
를 사전에 인지하고, 관리할 수 있다. 보다 구체적인 일 예로, 기지국(1510)과 IRS(1520)가 초기 설정을 수행하는 경우,
Figure PCTKR2021008944-appb-img-000033
는 측정 장비나 이동성이 가능한 장치를 통해 측정될 수 있으며, 측정 값으로 기 설정될 수 있다. 또 다른 일 예로, 기지국(1510)과 IRS(1520)는 저전력/저비용 센서를 통해 주기적으로
Figure PCTKR2021008944-appb-img-000034
를 측정할 수 있으며, 측정된 값에 기초하여
Figure PCTKR2021008944-appb-img-000035
를 주기적으로 업데이트할 수 있다. 일 예로, MRT(Maximum Transmit Rate)를 위한
Figure PCTKR2021008944-appb-img-000036
는 하기 수학식 7과 같이 도출될 수 있다.
Figure PCTKR2021008944-appb-img-000037
또 다른 일 예로, 기지국(1510)과 IRS(1520)는 채널 G를 측정하지 않고,
Figure PCTKR2021008944-appb-img-000038
를 지원할 수 있다. 일 예로,
Figure PCTKR2021008944-appb-img-000039
는 무선 통신 시스템(e.g. NR)에서 사용되는 빔 관리 또는 빔 스위핑에 기초하여 지원되는 값 중 어느 하나로 결정될 수 있다. 일 예로, IRS(1520)는 기지국(1510)으로 CSI(channel status information) 피드백을 제공할 수 있으며, 이를 통해
Figure PCTKR2021008944-appb-img-000040
값이 결정될 수 있다. 그 후, 기지국(1510)은
Figure PCTKR2021008944-appb-img-000041
가 적용된 참조신호를 IRS(1520)로 전송할 수 있다. 여기서, IRS의 제어 값은 인공지능 빔 선택기에 기초하여 결정될 수 있다. 일 예로, 도 15에서는 인공지능 빔 선택기가 IRS 제어기와 연계된 경우일 수 있으나, 이에 한정되는 것은 아닐 수 있다. 일 예로, 인공지능 빔 선택기가 기지국(1510)이나 단말(1520) 또는 다른 디바이스/클라우드에 위치하는 경우, IRS(1520)는 IRS 제어 값 관련 정보를 별도로 수신할 수 있으며, 이에 대해서는 후술한다.
여기서, 인공지능 빔 선택기는 IRS의 소자(Element)별 위상 변화 값
Figure PCTKR2021008944-appb-img-000042
를 선택할 수 있다. 일 예로, 인공지능 빔 선택기가 상태정보를 이용하는 강화학습인 경우, 상태정보는 현재 IRS(1520)의 제어 값과 채널정보
Figure PCTKR2021008944-appb-img-000043
를 포함할 수 있다. 그 후, IRS(1520)는 인공지능 빔 선택기에서 예측한 위상 값으로 설정될 수 있다. 기지국(1510)은
Figure PCTKR2021008944-appb-img-000044
가 적용된 참조신호(
Figure PCTKR2021008944-appb-img-000045
)를 IRS(1520)로 전달하고, 단말(1530)은 IRS(1520)를 경유한 참조신호
Figure PCTKR2021008944-appb-img-000046
를 수신할 수 있다. 그 후, 단말(1530)은 참조신호
Figure PCTKR2021008944-appb-img-000047
에 기초하여 보상 값(reward)를 측정할 수 있다. 일 예로, 단말(1530)은 IRS 성능 측정기를 구비할 수 있으며, 이를 통해 보상 값을 측정할 수 있다. 보상 값은 IRS 채널의 신호대 잡음비
Figure PCTKR2021008944-appb-img-000048
나 평균제곱에러
Figure PCTKR2021008944-appb-img-000049
일 수 있으나, 다른 형태의 채널 관련 정보도 포함할 수 있다. 또한, 단말(1530)은 참조신호에 대한 측정을 수행하여 채널 상태 정보를 획득할 수 있다. 그 후, 단말(1530)은 보상 값 및 채널 상태 정보를 피드백 할 수 있다. 여기서, 인공지능 빔 선택기는 IRS 위상 값과 보상 값(reward) 및 측정한 채널정보를 통해 학습될 수 있다. 일 예로, 보상 값(reward)이나 예측된 위상 값의 수렴여부에 따라 학습이 반복될 수 있다. 이때, 인공지능 빔 선택기는 초기 전이학습을 통해 학습된 모델을 사용함으로써 반복성을 제거할 수 있다.
그 후, IRS(1520)는 인공지능 빔 선택기의 학습에 기초하여 환경 변경 완료신호를 기지국(1510)에 전달할 수 있다. 그 후, 기지국(1510)은 단말(1530)에 참조신호를 보내서 채널상태정보를 획득하고, 새롭게 변경된 환경에서 최적화된 전달 빔포밍(transmit beamforming) 결정하고 적용하여 단말(1530)과 통신을 수행할 수 있다.
도 16은 본 개시의 일 실시예에 따라 단말에 인공지능 빔 선택기가 구현되는 경우에 기지국, IRS 및 단말 상호 간의 신호 흐름을 나타낸 도면이다.
도 16을 참조하면, 인공지능 빔 선택기는 단말(1630)에 구현될 수 있다. 즉, 상술한 바와 같이, 인공지능 빔 선택기는 기지국(1610), IRS(1620) 및 별도의 클라우드/디바이스뿐만 아니라 단말(1630)에도 구현될 수 있다. 일 예로, 단말(1630)에 구현된 인공지능 빔 선택기는 IRS 제어 값을 결정할 수 있다. 일 예로, 단말(1630)은 인공지능 빔 선택기를 통해 측정한 채널 정보와 현재 IRS 제어 값(또는 초기 값)을 기반으로 IRS 제어의 빔 방향의 고도각, 방위각을 나타내는 인덱스
Figure PCTKR2021008944-appb-img-000050
를 결정할 수 있다. 이때, 단말(1630)은 결정된 인덱스 정보를 IRS(1620)로 전달할 수 있다. IRS(1620)는 수신한 인덱스 정보(
Figure PCTKR2021008944-appb-img-000051
)를 통해 상술한 위상 값을 결정할 수 있다. 그 후, 기지국(1610)은
Figure PCTKR2021008944-appb-img-000052
가 적용된 참조신호(
Figure PCTKR2021008944-appb-img-000053
)를 IRS(1620)로 전달하고, 단말(1630)은 IRS(1620)를 경유한 참조신호
Figure PCTKR2021008944-appb-img-000054
를 수신할 수 있다. 그 후, 단말(1630)은 참조신호
Figure PCTKR2021008944-appb-img-000055
에 기초하여 보상 값(reward)를 측정할 수 있다. 일 예로, 단말(1630)은 IRS 성능 측정기를 구비할 수 있으며, 이를 통해 보상 값을 측정할 수 있다. 보상 값은 IRS 채널의 신호대 잡음비
Figure PCTKR2021008944-appb-img-000056
나 평균제곱에러
Figure PCTKR2021008944-appb-img-000057
일 수 있으나, 다른 형태의 채널 관련 정보도 포함할 수 있다. 또한, 단말(1630)은 참조신호에 대한 측정을 수행하여 채널 상태 정보를 획득할 수 있다. 그 후, 단말(1630)의 인공지능 빔 선택기는 보상 값 및 채널 상태 정보에 기초하여 학습을 수행할 수 있다. 여기서, 학습은 수렴할 때까지 반복될 수 있다. 이를 통해, 인공지능 빔 선택기는 IRS 제어 값을 업데이트할 수 있으며, 보상 값과 채널 상태 정보 및 현재 IRS 제어 값을 기반으로 IRS 제어의 빔 방향의 고도각, 방위각을 나타내는 인덱스
Figure PCTKR2021008944-appb-img-000058
가 업데이트될 수 있다. 그 후, 단말(1630)은 업데이트된 인덱스 정보를 IRS(1620)로 전달할 수 있다. IRS는 IRS 제어 값에 기초하여 환경변경 완료 신호를 기지국(1610)으로 전송하고, 기지국(1610)은 단말(1630)에 참조신호를 보내서 채널 상태 정보를 획득할 수 있다. 이를 통해, 기지국(1610)은 새롭게 변경된 환경에서 최적화된 전달 빔포밍(transmit beamforming)을 결정하고 적용하여 단말(1630)과 통신을 수행할 수 있다.
도 17은 본 개시의 일 실시예에 따라 최적화된 지능형 무선환경을 설정하는 방법을 나타낸 순서도일 수 있다.
도 17을 참조하면, 상술한 도 15 및 도 16에 기초하여 최적화된 지능형 무선환경을 설정하는 방법일 수 있다. 여기서, 채널추정 단계는 기지국-IRS(BS-IRS)의 채널정보 G기반으로 기지국에서 IRS로 전달 빔포밍 벡터
Figure PCTKR2021008944-appb-img-000059
를 설정하는 동작일 수 있다.(S1710) 일 예로, 상술한 바와 같이, 기지국과 IRS가 초기 설정을 수행하는 경우, 기지국과 IRS는 IRS의 위치에 기초하여 채널 G에 대한 초기 설정을 수행할 있다. 또 다른 일 예로, 기지국과 IRS는 채널 측정없이 인공지능을 통해 전송 빔포밍(transmit beamforming)
Figure PCTKR2021008944-appb-img-000060
를 결정할 수 있다. 또한, 일 예로, 저전력 센서에 기초하여 주기적으로 채널 G가 확인될 수 있으며, 이는 상술한 바와 같다. 즉, 기지국은 IRS로 전송하는 전송 빔포밍(transmit beamforming)
Figure PCTKR2021008944-appb-img-000061
를 사전에 인지하고, 관리할 수 있다. 이때, 단말이 IRS 성능 측정기를 통해 상술한 보상 값 및 채널 추정 정보를 획득하기 위해서 단말은 기지국으로부터 신호를 수신할 수 있다. 기지국은 신호를 IRS로 전달하여 단말로 전송할 수 있으며, 이를 위해 빔포밍이 필수적일 수 있다.
또한, 환경변경 단계는 인공지능 빔 선택기를 사용하여 최적의 IRS 제어 값을 찾고 적용하는 단계일 수 있다. 여기서, 기지국은 상술한 채널 추정 단계를 통해 기 연산한 전달 빔포밍 벡터
Figure PCTKR2021008944-appb-img-000062
를 적용한 참조신호를 IRS로 전달할 수 있다. 일 예로, 기지국과 IRS간 신호가
Figure PCTKR2021008944-appb-img-000063
를 적용하지 않아도 충분히 큰 경우라면 상술한 과정없이 신호가 전달될 수 있다.
그 후, SRE 인공지능 시스템에 기초하여 동작하는 인공지능 빔 선택기는 수동형 지능형판사판(IRS)의 소자(Element)별 제어 값
Figure PCTKR2021008944-appb-img-000064
를 생성하여(S1720), IRS에 제어 값을 적용할 수 있다.(S1730) 이때, 인공지능 빔 선택기는 지도학습(supervisor learning)으로써 AO(alternating optimization) 최적화나 SDR(software Defined Radio)과 같은 최적화 알고리즘을 통해 획득한 제어 값으로 학습을 수행할 수 있다. 다만, 인공지능 빔 선택기는 사용한 알고리즘의 성능을 넘지 못할 수 있다. 또 다른 일 예로, 인공지능 빔 선택기는 기 학습된 학습 모델을 통해서 빠르게 예측 값을 추정할 수 있다.
또 다른 일 예로, 인공지능 빔 선택기는 비지도학습인 강화학습을 통해 예측 값을 획득하고, 그에 따른 보상 값(reward)을 획득하여 학습모델을 학습을 통해 지속적으로 업데이트할 수 있다. 일 예로, 인공지능 빔 선택기는 보상 값 또는 예측 값이 수렴될 때까지 학습을 반복할 수 있다. 여기서, 인공지능 빔 선택기는 전이학습을 통해서 또는 모델을 지속적으로 업데이트하면서 반복 횟수를 줄일 수 있다. 그 후, 환경변경 단계는 기지국이 환경변경 완료 신호를 전달받음으로써 종료될 수 있다.
구체적인 일 예로, 환경적응 단계는 기지국이 단말에 참조신호를 전달하여 새로운 환경에서 최적화된
Figure PCTKR2021008944-appb-img-000065
를 찾는 과정일 수 있다. 일 예로, 기지국은 전송 빔포밍
Figure PCTKR2021008944-appb-img-000066
를 적용하여 참조신호를 생성하고(S1740), 이를 IRS를 통해 단말로 전송할 수 있다. 단말은 참조신호를 통해 측정한 실제 채널상태정보(effective channel state information)인
Figure PCTKR2021008944-appb-img-000067
ΦG+
Figure PCTKR2021008944-appb-img-000068
및 보상 값 R을 인공지능 빔 선택기에 전달할 수 있다. 여기서, 일 예로, 인공지능 빔 선택기는 상술한 바와 같이, 기지국, IRS, 단말 또는 클라우드/디바이스에 구비될 수 있다. 일 예로, 인공지능 빔 선택기가 단말에 구현된 경우, 단말은 보상 값 및 채널상태 정보를 적용하여 IRS를 제어하기 위한 인덱스 값을 IRS로 전송할 수 있으며, 이는 상술한 바와 같다. 또 다른 일 예로, 인공지능 빔 선택기가 기지국에 구현된 경우, 단말은 보상 값 및 채널상태 정보를 기지국으로 전달할 수 있다. 이때, 인공지능 빔 선택기는 단말로부터 수신한 보상 값 및 채널상태 정보에 기초하여 학습을 수행할 수 있다.(S1750) 여기서, 학습은 수렴될 때까지 지속적으로 수행될 수 있으며(S1756), 수렴된 값에 기초하여 기지국은 환경변경 완료 정보를 획득할 수 있다.(S1770)그 후, 기지국은 전달받은 환경변경 완료 정보에 기초하여 주어진 환경을 최적화하는
Figure PCTKR2021008944-appb-img-000069
를 결정하고 통신을 수행할 수 있다.(S1780) 일 예로, 기지국이 환경을 최적화하는
Figure PCTKR2021008944-appb-img-000070
를 결정하는 경우, 기지국은 무선 통신 시스템(e.g. NR)에서 사용하는 빔 관리 또는 빔 스위핑 방식에 기초하여
Figure PCTKR2021008944-appb-img-000071
=
Figure PCTKR2021008944-appb-img-000072
와 같은 방법을 사용할 수 있다.
구체적인 일 예로, 인공지능 빔 선택기는 설정하는 빔을 코드북 형태로 표현하고, 인공지능 모델을 단순화 할 수 있다. 여기서, 수신 방향으로 배열 응답벡터를 표시한 방향벡터 함수는 하기 수학식 8과 같이 표현 가능할 수 있다.
Figure PCTKR2021008944-appb-img-000073
수학식 8에서 N은 배열(안테나 또는 IRS 소자)의 크기이며, w는 안테나 또는 IRS 소자 사이의 위상 차일 수 있다.
일 예로, IRS가 빔포밍에 기초하여 기지국으로부터 전달받은 신호에 대한 수신 응답벡터
Figure PCTKR2021008944-appb-img-000074
는 하기 수학식 9와 같이 방향벡터 함수 u(ω,N)으로 표현이 가능할 수 있다.
Figure PCTKR2021008944-appb-img-000075
수학식 9에서
Figure PCTKR2021008944-appb-img-000076
는 IRS의 방위각,
Figure PCTKR2021008944-appb-img-000077
은 고도각이며,
Figure PCTKR2021008944-appb-img-000078
Figure PCTKR2021008944-appb-img-000079
는 각각 IRS 요소의 가로 및 세로의 개수일 수 있고,
Figure PCTKR2021008944-appb-img-000080
는 크로네커 곱을 나타낼 수 있다. 또한, IRS의 송신 응답벡터
Figure PCTKR2021008944-appb-img-000081
도 방향벡터 함수 u(ω,N)로 표현될 수 있으며, 하기 수학식 10과 같을 수 있다.
Figure PCTKR2021008944-appb-img-000082
또한, 전송 빔포밍이 적용된 송신신호
Figure PCTKR2021008944-appb-img-000083
에 대해 IRS를 통한 신호는 하기 수학식 11과 같이 표현될 수 있다.
Figure PCTKR2021008944-appb-img-000084
수학식 11에서
Figure PCTKR2021008944-appb-img-000085
는 BS-IRS 채널의 패스 게인이고,
Figure PCTKR2021008944-appb-img-000086
는 IRS-UE 채널의 패스 게인일 수 있다. 또한, Φ는 IRS 소자의 위상 값 행렬로써 Φ=diag(v),
Figure PCTKR2021008944-appb-img-000087
로 표현될 수 있다. 또한,
Figure PCTKR2021008944-appb-img-000088
로서 ⊙는 아르마르 곱으로 행렬의 소자 간 곱을 나타낼 수 있으며, 수학식 12와 같을 수 있다.
Figure PCTKR2021008944-appb-img-000089
수학식 12에서 u(ω,N)은 주기가 2인 함수이기 때문에
Figure PCTKR2021008944-appb-img-000090
로 표현이 가능할 수 있으며,
Figure PCTKR2021008944-appb-img-000091
로 표현될 수 있다.
또한, 수신신호 SNR을 최대로 만드는 IRS의 최적 빔포밍 벡터 v 는
Figure PCTKR2021008944-appb-img-000092
이며 방위각과 고도각의 방향벡터 함수 u(ω,N) 의 크로네커 곱으로 표현할 수 있다.
즉, IRS 제어 값은 방위각과 고도각의 형태로 관리될 수 있으며, 각각의 방향에 따른 제어 값은 코드북으로 관리될 수 있다. 일 예로, 코드북
Figure PCTKR2021008944-appb-img-000093
은 IRS 방향벡터의 집합이며, 가로 및 세로 방향에서 각각
Figure PCTKR2021008944-appb-img-000094
의 크기를 가질 수 있다. 또한, j ∈J 로 방향벡터의 인덱스이며, J는 총 나타낼 수 있는 방향 벡터일 수 있다. 일 예로, J는 가로 세로 방향의 사용하는 빔의 개수를 표현하는 값으로, 가로 및 세로 방향으로 각각
Figure PCTKR2021008944-appb-img-000095
으로 다르게 표현이 가능할 수 있다.
여기서, 최종 인공지능 빔 선택기에서 설정되는 빔은 하기 수학식 13에 기초하여 수학식 14와 같을 수 있다.
Figure PCTKR2021008944-appb-img-000096
Figure PCTKR2021008944-appb-img-000097
즉, 인공지능 빔 선택기는 코드북을 통해 빔을 상술한 바와 같이 표현할 수 있으며, 이를 통해 인공지능 모델은 단순화할 수 있다.
또한, 일 예로, 도 18은 본 개시의 일 실시예에 따라 강화학습을 사용하여 SRE 인공지능 시스템 구조를 나타낸 도면이고, 도 19는 도 18에 기초하여 환경(environment)의 구성요소를 좀 더 세분화한 도면일 수 있다.
보다 상세하게는, 도 18을 참조하면, SRE 인공지능 시스템에 기초하여 인공지능 빔 선택기는 강화학습에 기초하여 학습을 수행할 수 있다. 이때, 일 예로, 강화학습은 두 개의 입력과 한 개의 출력으로 구성될 수 있다. 입력은 상태 정보(state)와 보상 값(reward)이 사용될 수 있으며, 출력은 에이전트 행동(action)을 선택할 수 있다. 여기서, 일 예로, 강화학습은 MAB(multi-armed bandit)일 수 있으며, MAB의 경우 상태 정보를 사용하지 않을 수 있으나, 이에 한정되는 것은 아니다. 또한, 출력으로 행동(Action)은 IRS 제어기가 동작하여 단말에게 최적의 통신 환경을 제공하는 빔을 선택하는 동작일 수 있다. 일 예로, 인공지능 빔 선택기는 환경으로부터 행동(Action)에 대한 보상 값과 변경된 상태 정보를 획득하여 학습에 사용할 수 있다. 또한, 인공지능 빔 선택기는 학습 후 입력에 기초하여 다시 행동(action)을 선택하는 동작을 반복할 수 있다.
여기서, 도 19를 참조하면, 인공지능 빔 선택기가 환경의 구성요소를 고려하여 각각의 상태, 보상, 행동을 결정하는 방법일 수 있다. 여기서, 일 예로, 환경은 신호가 전달되는 채널환경 뿐만 아니라, 보상과 채널 상태를 측정하기 위한 기지국, 단말 및 IRS 상호 간의 환경도 고려될 수 있다. 구체적인 일 예로, 상태(State)는 환경으로부터 받는 인자로 직전에 선택했던 빔 선택기의 가로 및 세로 인덱스 (
Figure PCTKR2021008944-appb-img-000098
)를 사용할 수 있다. 또한, 일 예로, IRS 제어 값에 대한 환경의 변화를 상태(State)에 반영하기 위해서 단말은 측정한 채널 정보(
Figure PCTKR2021008944-appb-img-000099
)를 상태(State)에 추가할 수 있다. 여기서, 채널정보는 측정된 값이거나 채널을 나타내는 간접적인 지표(CQI, SNR,
Figure PCTKR2021008944-appb-img-000100
)로 대체 될 수 있으며, 상태는 하기 수학식 15와 같을 수 있다.
Figure PCTKR2021008944-appb-img-000101
또한, 행동(action)은 IRS의 빔 방향 벡터를 나타내는 코드북의 인덱스를 선택하는 것이며, 최종적으로는 IRS 각 소자의 위상 천이 값들이 적용될 수 있다. 상술한 바에 기초하여 인공지능 빔 선택기의 행동(action)은 하기 수학식 16과 같을 수 있다.
Figure PCTKR2021008944-appb-img-000102
여기서, 행동 값은 IRS 방향 벡터 생성기를 통해서 코드북 기반으로 구성된 값으로 실제로 선택 인공지능에서 선택하는 것은 방향벡터의 방위각과 고도각의 인덱스일 수 있다. 또한, 일 예로, 보상 값(Reward)은 단말이 측정한 값으로 IRS가 선택한 제어 값에 대한 결과 값일 수 있다. 일 예로, IRS에 단말로부터 수신하는 블록을 추가한다면 직접 받을 수 있지만, IRS의 비용이 증가할 수 있다. 따라서, IRS는 단말이 기지국으로 전송한 정보에 기초하여 기지국으로부터 보상 값을 획득할 수 있으나, 이에 한정되는 것은 아닐 수 있다. 또한, 일 예로, 보상 값(Reward)은 다른 사용 목적을 고려하여 결정될 수 있다. 또한, 일 예로, 단말은 상술한 바와 같이, IRS 성능 측정기를 포함할 수 있다. 다만, 일 예로, IRS 성능 측정기를 거치지 않았을 때 보상 값은 수학식 17과 같이 단말이 참조신호에 기초하여 측정된 채널 관련 정보일 수 있다.
Figure PCTKR2021008944-appb-img-000103
또한, 일 예로, 도 20은 본 개시의 일 실시예에 따라 인공지능 빔 선택기에서 환경구성 요소 중 단말과 기지국의 사용 블록을 도시화한 도면이다. 일 예로, 도 20을 참조하면, 기지국은 무선채널을 통해 참조신호를 생성하여 전달할 수 있다. 또한, 단말은 기지국으로부터 생성된 참조신호를 IRS를 통해 획득하고, 참조신호를 측정하여 채널 상태 정보 및 보상 값 정보를 결정할 수 있다. 일 예로, 채널 상태 정보는 채널을 직접 측정한 결과에 대한 정보 및 채널 관련 간접 정보를 포함할 수 있으며, 특정 형태로 한정되는 것은 아닐 수 있다. 여기서, 환경 구성요소는 IRS뿐만 아니라 기지국과 단말의 동작까지 고려될 수 있으며, 상술한 실시예로 한정되지 않는다.
또한, 일 예로, 도 21은 본 개시의 일 실시예에 따라 인공지능 빔 선택기의 구조를 나타낸 도면이다. 일 예로, 인공지능 빔 선택기는 선택 인공지능과 IRS 생성기로 구분될 수 있다. 일 예로, 인공지능 빔 선택기는 강화학습에 기초하여 상태 정보와 보상 값을 통해 하기 수학식 18과 같은 값을 도출하고, 이에 기초하여 상술한 행동(action) 값을 도출할 수 있다.
Figure PCTKR2021008944-appb-img-000104
보다 상세하게는, 선택인공지능은 최적의 무선환경을 구성하기 위해 IRS 제어 값을 학습하고 예측하는 역할을 수행할 수 있다. 여기서, 선택인공지능은 상술한 바와 같이 강화학습 또는 MAB를 통해서 구현이 가능할 수 있으나, 이에 한정되는 것은 아닐 수 있다. 또한, IRS 방향 벡터 생성기는 코드북을 기반으로 각각의 소자별 제어 값을 생성할 수 있다. 즉, 선택인공지능은 코드북의 인덱스로 형태로 학습되기 때문에 상태 정보(state)와 행동(action)의 차원을 줄일 수 있다. 따라서, 각각의 소자별 학습 방식보다 모델 크기나 복잡도 및 수렴 속도에서 유리할 수 있다. 상술한 바에 기초하여 기지국 안테나 수 M과 IRS의 소자 수 N은 크게 영향을 받지 않고 최적화된 IRS 제어 값을 생성할 수 있다.
또한, 일 예로, 도 22는 본 개시의 일 실시예에 따라 MAB AI를 통해 인공지능 빔 선택기를 구현하는 방법을 나타낸 도면이다. 일 예로, 도 22를 참조하면, 톰슨 샘플링(thompson sampling)을 사용한 MAB AI를 사용하는 선택인공지능(인공지능 빔 선택기)은 크게 학습부와 선택부로 구분될 수 있다. 이때, 학습부는 보상 값(reward)을 기반으로 직전 행동(action) i에 대한 톰슨 샘플링 파라미터 (α, β)를 갱신할 수 있다. 여기서, 보상 값에 따른 α, β의 학습은 하기 수학식 19와 같을 수 있다.
Figure PCTKR2021008944-appb-img-000105
여기서,
Figure PCTKR2021008944-appb-img-000106
는 기준이 되는 보상 값으로써, 단말의 IRS 성능 측정기의 보상 형태에 따라 상이하게 설정될 수 있다. 또한, 선택부는 누적된 톰슨 샘플링 파라미터 α, β를 베타 분포(beta distribution)에 적용하여 샘플링한 값 중 가장 큰 값을 가지는 빔 방향의 인덱스를 선택하도록 할 수 있다. 일 예로, 도 22에서 선택된 {
Figure PCTKR2021008944-appb-img-000107
는 IRS 방향벡터 생성기에 전달될 수 있다. IRS 방향벡터 생성기는 상술한 값에 기초하여 방위각과 고도각에 대한 방향을 나타내는 인덱스(
Figure PCTKR2021008944-appb-img-000108
)를 개별적으로 선택하는 방식을 사용할 수 있다. 또 다른 일 예로, IRS 방향벡터 생성기는
Figure PCTKR2021008944-appb-img-000109
=(
Figure PCTKR2021008944-appb-img-000110
)와 같이 고도각과 방위각을 합쳐서 새로운 인덱스
Figure PCTKR2021008944-appb-img-000111
를 사용하여 선택하는 방식을 통해 선택을 수행할 수 있다. 일 예로, 베타 분포에 대한 수학식은 하기 수학식 20과 같을 수 있다.
Figure PCTKR2021008944-appb-img-000112
또한, 일 예로, 도 23은 본 개시의 일 실시예에 따라 강화학습을 통해 인공지능 빔 선택기를 구현하는 방법을 나타낸 도면이다. 일 예로, 강화학습을 사용한 선택인공지능(인공지능 빔 선택기)은 강화학습 모델과 선택한 행동(action)으로 빔 방향을 조절하는 빔 방향 조정기로 구성될 수 있다. 여기서, 상술한 MAB AI에 기초한 선택인공지능에서는 상태 정보(state)이 없이 보상 값에 기초하여 학습이 수행될 있으나, 강화학습 모델은 보상 값 및 상태 정보를 통해 학습을 수행할 수 있다. 이때, MAB AI 대비 상태 정보를 더 이용하기 때문에 학습모델의 연산이 증가할 수 있다. 상술한 점을 고려하여, 선택인공지능(인공지능 빔 선택기)은 행동(action)을 직접적으로 빔 방향 {
Figure PCTKR2021008944-appb-img-000113
)}을 선택하도록 하지 않고, 각 방위각 및 고도각 방향별로 {±
Figure PCTKR2021008944-appb-img-000114
Figure PCTKR2021008944-appb-img-000115
}를 선택하도록 구성될 수 있다. 다만, 일 예로, 강화학습에 기초한 선택인공지능(인공지능 빔 선택기)은 충분한 하드웨어 사양을 구비한 경우를 고려하여 직접 빔 방향 {
Figure PCTKR2021008944-appb-img-000116
}를 선택하도록 하는 것도 가능할 수 있으며, 상술한 실시예로 한정되지 않는다. 또 다른 일 예로, 빔 방향 조정기에서 이전 방향 값 인덱스
Figure PCTKR2021008944-appb-img-000117
,
Figure PCTKR2021008944-appb-img-000118
에 강화학습 모델이 선택한 {±
Figure PCTKR2021008944-appb-img-000119
Figure PCTKR2021008944-appb-img-000120
}를 적용하여
Figure PCTKR2021008944-appb-img-000121
,
Figure PCTKR2021008944-appb-img-000122
를 생성하고, 최종적으로
Figure PCTKR2021008944-appb-img-000123
를 생성하여 지능형반사표면 생성기에 전달하는 것도 가능할 수 있으며, 특정 형태로 한정되는 것은 아닐 수 있다.
여기서, 강화학습 모델은 MAB AI를 사용한 선택인공지능(또는 인공지능 빔 선택기)과 마찬가지로 학습부와 선택부로 되어 있고, 학습과 동시에 다음 행동을 예측할 수 있다. 이때, 일 예로, 강화학습 중 하기 수학식 21에 기초하여 Q-Learning을 통해 학습이 수행될 수 있으며, 구체적인 행동 값(action-value)은 하기 수학식 21과 같을 수 있다. 또한, Q-Learning에서 선택하는 정책은 현재의 상태 현재의 상태
Figure PCTKR2021008944-appb-img-000124
에서 가장 큰 행동 값(action-value)를 가지는 행동은 하기 수학식 22와 같을 수 있다.
Figure PCTKR2021008944-appb-img-000125
Figure PCTKR2021008944-appb-img-000126
또한, 일 예로, 강화학습에는 Exploration과 Exploitation에 조절에 대한 이슈가 발생할 수 있다. 이때, Exploration은 더 나은 보상 값을 획득하기 위해 복수의 행동들에서 샘플링된 동작을 활용할 수 있다. 반면, Exploitation은 반복적인 행동에 기초하여 이미 인지하고 있는 정보를 활용할 수 있다. 이때, 일 예로, 강화학습에서는 최적의 성능을 발휘하기 위해서는 Exploration과 Exploitation의 적절한 조절이 필요할 수 있으며, e-greedy 방법을 수행할 수 있으며, 이는 도 24과 같을 수 있다. 이때, e-greedy는 정해진 확률로 Exploration을 실행하는 방법일 수 있다. 일 예로, 도 24을 참조하면, e-greedy에 의해 Exploitation만 하는 greedy 방법보다 Total Regret이 개선될 수 있다. 또한, 시간에 따라 대수적(logarithm)으로 Total Regret을 근접시키는 방법으로 decaying e-greedy를 사용할 수 있으나, 특정 형태로 한정되는 것은 아닐 수 있다.
일 예로, 하기 수학식 23은 decaying e-greedy를 나타낸 수식으로 c는 상수이고, |A| 는 Action Space의 크기이고,
Figure PCTKR2021008944-appb-img-000127
는 시간에 따른 e-greedy로서 시간에 따라 그리고 최소 Regret의 제곱에 반비례하여 감소되어질 수 있다.
Figure PCTKR2021008944-appb-img-000128
또한, 일 예로, Exploration과 Exploitation에 조절은 MAB(Multi Arm Bandit)를 사용하여 좀더 최적화 될 수 있다. 일 예로, UCB(Upper Confidence Bound)이나 TS(Thompson Sampling)이 적용될 수 있으며, 특정 형태로 한정되는 것은 아닐 수 있다.
이때, 하기 수학식 24는 UCB에 기초하여 행동에 대한 식일 수 있으며, 수학식 15는 Upper Confidence일 수 있다. 이때, Upper Confidence는 Action이 나온 횟수
Figure PCTKR2021008944-appb-img-000129
와 반비례하도록 설정되어 선택되지 못한 행동들에 대해서 더 많은 기회가 주어지도록 할 수 있다. 상술한 바에 기초하여 기회는 시간에 따라 반감될 수 있다.
일 예로, 톰슨 샘플링(Thompson Sampling)은 상술한 바에 기초하여 베타 분포를 통해서 구현된 것으로 UCB보다 더 간단하고, 쉽게 Exploration과 Exploitation을 조절할 수 있다.
Figure PCTKR2021008944-appb-img-000130
Figure PCTKR2021008944-appb-img-000131
또 다른 일 예로, 도 25는 본 개의 일 실시예에 따라, IRS 성능 측정기의 구조를 나타내고 있다. 일 예로, IRS 성능 측정기는 표준화/정규화, Batching 및 가중치 적용기 기능 중 적어도 어느 하나를 수행할 수 있다. 이때, IRS 성능 측정기는 기지국으로부터 참조신호를 바탕으로 SNR, Channel Gain, MSE, Spectral Efficiency를 계산할 뿐만 아니라, 다른 모니터링 시스템을 이용하여 Energy Charging 등을 측정할 수 있다. 여기서, 각각의 측정 정보들은 다양한 값의 영역일 수 있다.
따라서, 표준화/정규화 블록은 각각의 가중치를 고려하여 측정 정보들의 다양한 영역의 값을 표준화하거나 정규화 할 수 있다. 또한, Batching 블록은 이러한 측정 정보들을 일정한 주기로 누적하는 역할을 수행하고, 각 누적에 대한 정규화도 같이 수행할 수 있다. 또한, 일 예로, 가중치 적용 블록은 각 측정지표들에 대한 가중치를 적용하여 최충 출력 값을 표현할 수 있다. 일 예로, Spectral Efficiency가 중요한 수신기에서는 Spectral Efficiency 측정의 가중치를 높게 설정할 수 있다. 이때, IRS 성능 측정기는 측정 정보들을 가공 후 통합한 형태로 보상 값을 생성할 수 있다. 또 다른 일 예로, IRS 성능 측정기는 측정 정보들을 개별적으로 분리해서 보상 값을 생성할 수 있으며, 특정 실시예로 한정되는 것은 아닐 수 있다.
도 26은 본 개시의 일 실시예에 따라 인공지능 초기 값을 설정하는 방법을 나타낸 도면이다.
도 26을 참조하면, 인공지능 빔 선택기 동작에 기초하여 인공지능 초기 값이 설정될 수 있다. 일 예로, 기지국(2610)은 참조신호를 단말(2630)로 전달할 수 있다. 단말(2630)은 참조신호를 이용하여 측정을 수행하고, 측정에 기초하여 기지국(2610)과 단말(2630) 사이의 채널상태 정보를 획득할 수 있다. 그 후, 단말(2630)은 채널상태 정보와 단말의 위치정보를 기지국(2610)으로 전달할 수 있다. 이때, 기지국(2610)은 수신한 채널상태 정보 및 단말의 위치 정보에 기초하여 인공지능 초기 값 설정기를 통해 인공지능 초기 값을 설정할 수 있다.
또 다른 일 예로, 인공지능 초기 값 설정기는 기지국(2610)이 아닌 다른 디바이스나 클라우드에 구현될 수 있다. 이때, 기지국(2610)은 단말(2630)로부터 수신한 채널상태 정보 및 위치 정보를 인공지능 초기 값 설정기로 전송하고, 인공지능 초기 값 설정기로부터 인공지능 초기 값 정보를 획득할 수 있다. 여기서, 인공지능 초기 값 정보는 인공지능 빔 선택기에서 사용되는 선택 인공지능의 초기 값 (Thompson Sampling:
Figure PCTKR2021008944-appb-img-000132
,
Figure PCTKR2021008944-appb-img-000133
)을 포함할 수 있다. 또한, 일 예로, 학습모델이 강화학습인 경우, 인공지능 초기 값 정보는 상술한 톰슨 샘플링 파라미터 및 상태 정보(
Figure PCTKR2021008944-appb-img-000134
)를 더 포함할 수 있으며, 상술한 실시예로 한정되지 않는다.
그 후, 기지국(2610)은 인공지능 초기 값 정보와 후보집합(candidates) 정보를 IRS(2620)로 전송할 수 있다. 이때, 일 예로, 후보집합(candidates) 정보는 정의된 빔 방향 코드북의 인덱스 집합 정보일 수 있다. 또 다른 일 예로, 후보집합 정보는 코드북 자체에 대한 정보일 수 있다. 일 예로, 코드북은 MIMO(multi input multi output)에서 사용되는 프리코딩 메트릭스 코드북과 상이하게 사용되는 빔 방향 벡터의 집합일 수 있다. 즉, 후보 집합(candidates)에 사용되는 빔 방향 벡터는 인공지능 모델에서 선택되는 행동(action)의 크기(space)일 수 있다. 이때, 후보 집합을 통해 강화학습 또는 MAB AI는 학습에 대한 수렴을 빠르게 수행할 수 있으며, 연산량도 줄일 수 있다.
도 26에서는 인공지능 빔 선택기가 IRS 제어기와 연결된 경우일 수 있다. 이때, IRS 제어기 또는 AI 서버는 수신한 상술한 정보를 통해 MAB AI(Thompson Sampling) 또는 강화학습으로 동작하는 인공지능 빔 선택기를 초기화할 수 있다. 이후 동작은 상술한 도 15와 같을 수 있다.
또 다른 일 예로, 인공지능 빔 선택기가 기지국(2610)에 구현된 경우를 고려할 수 있다. 이때, 기지국(2610)은 상술한 바와 같이 단말(2630)로 참조신호를 전송하고, 채널상태 정보 및 단말의 위치 정보를 통해 인공지능 초기 값 설정기를 통해 인공지능 초기 값 정보를 획득할 수 있다. 그 후, 기지국(2610)은 인공지능 빔 선택기에 상술한 인공지능 초기 값 정보를 반영한 후 상술한 바와 같이 동작할 수 있다.
또 다른 일 예로, 도 27은 본 개시의 일 실시예에 따라 인공지능 빔 선택기가 단말에 구현된 경우일 수 있다. 일 예로, 기지국(2710)은 도 26과 동일하게 참조신호를 통해 단말(2730)로부터 채널상태 정보 및 위치 정보를 획득하고, 이에 기초하여 인공지능 초기 값 정보를 획득할 수 있으며, 이는 도 26과 동일할 수 있다. 이때, 일 예로, 기지국은 도 26에서 상술한 인공지능 초기 값 정보 및 후보 집합 정보를 인공지능 빔 선택기가 구현된 단말(2730)로 전송할 수 있다. 그 후, 단말(2730)은 기지국(2710)으로부터 수신한 정보를 인공지능 빔 선택기에 적용할 수 있으며, 이후 동작은 상술한 도 16과 같을 수 있다.
또한, 일 예로, 도 28은 본 개시의 일 실시예에 따라 인공지능 초기 값 설정기가 포함된 SRE 인공지능 시스템 구조를 나타낸 도면이다. 도 28을 참조하면, 인공지능 초기 값 설정기는 상술한 도 26 및 도 27처럼 인공지능 빔 선택기 내의 선택 인공지능의 초기 가중치 값을 설정할 수 있다. 또한, 일 예로, 인공지능 초기 값 설정기는 동작 완료한 모델의 가중치를 갱신할 수 있다. 일 예로, 갱신된 가중치 값은 MAB AI의 초기 값 또는 강화학습의 초기 상태로 사용될 수 있으며, 특정 형태로 한정되는 것은 아닐 수 있다.
또한, 일 예로, 인공지능 초기 값 설정기는 지도학습의 형태인 예측기 형태로 설계될 수 있다. 일 예로, 톰슨 샘플링의 경우, 초기값
Figure PCTKR2021008944-appb-img-000135
,
Figure PCTKR2021008944-appb-img-000136
을 설정하여 인공지능 빔 선택기에 전송할 수 있다. 이때, 채널환경(e.g. SNR)과 단말의 위치정보를 고려해서 예측이 수행될 수 있다. 또한, 통신 종료 후
Figure PCTKR2021008944-appb-img-000137
,
Figure PCTKR2021008944-appb-img-000138
, BLER,
Figure PCTKR2021008944-appb-img-000139
,
Figure PCTKR2021008944-appb-img-000140
, 위치정보 및 채널정보를 저장하고, 인공지능 초기값 설정기의 전이학습시 학습 데이터로 사용할 수 있다.
도 29는 본 개시에 적용 가능한 인공지능 코딩 초기값 설정기의 일례를 나타낸 도면이다. 도 29를 참고하면, 인공지능 코딩 초기값 설정기는 송신기의 위치정보 및 채널환경(signal-to-noise ratio, SNR)을 고려하여 초기값을 설정할 수 있다.
선형 블록 코드의 크기가 큰 경우에 많은 생성행렬의 조합이 존재하기 때문에, 너무 많은 생성행렬을 고려하면 단말/기지국에 과도한 로드(load)가 발생할 수 있으며, 안정화에 많은 시간이 소요될 수 있다. 다만, 통신채널환경에 따라 모든 생성행렬에 대한 기 학습(pre-training)을 실시하여 초기값
Figure PCTKR2021008944-appb-img-000141
,
Figure PCTKR2021008944-appb-img-000142
를 확보함으로써, 로드가 감소될 수 있다. 일 예로, 성능은 하기 수학식 26과 같을 수 있다.
Figure PCTKR2021008944-appb-img-000143
이때, 인공지능 코딩 초기값 설정기는 성능이 높은 순서대로 생성행렬에 대한 후보집합들(candidates)을 만들 수 있다. 후보집합은 채널환경에 따라 각각 다르게 생성될 수 있다. 이러한 후보집합들을 코드북(codebook)들의 형태로 정의할 수 있다. 수신기는 송신기가 사용할 코드북 집합을 인덱스 형태로 전달할 수 있다. 또한, 수신기는 송신기가 사용할 코드북을 직접 전송할 수도 있다.
인공지능 코딩 초기값 설정기는 후보집합 뿐 아니라 초기값
Figure PCTKR2021008944-appb-img-000144
,
Figure PCTKR2021008944-appb-img-000145
을 설정하여 수신기로 전송할 수 있다. 이 때, 채널환경과 단말의 위치정보를 고려해서 예측할 수 있다. 통신 종료 후,
Figure PCTKR2021008944-appb-img-000146
,
Figure PCTKR2021008944-appb-img-000147
, BLER,
Figure PCTKR2021008944-appb-img-000148
,
Figure PCTKR2021008944-appb-img-000149
, 위치정보, 채널정보를 저장하여 인공지능 코딩 초기값 설정기를 다시 트레이닝(re-training)할 때, 학습 데이터로 사용할 수 있다.
도 30은 본 개시의 일 실시예에 따라 인공지능 시스템에 기초하여 무선환경 최적화를 수행하는 방법을 나타낸 도면이다.
도 30을 참조하면, 단말은 IRS 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송할 수 있다.(S3010) 이때, 일 예로, IRS 제어 값은 제 1 인덱스 정보에 기초하여 결정될 수 있다. 여기서, IRS 소자 내의 각각의 위상 값은 상술한 바와 같이 결정된 IRS 제어 값에 기초하여 결정될 수 있으며, 이는 상술한 바와 같다. 또한, 일 예로, 상술한 제 1 인덱스 정보는 IRS 방향벡터 집합에 기초한 코드북을 통해 생성되는 정보일 수 있다. 일 예로, 제 1 인덱스 정보는 IRS 방위각에 기초한 제 1 인자 및 IRS 고도각에 기초한 제 2 인자로 구성될 수 있으며, 이는 상술한 바와 같다.
이때, 인공지능 빔 선택기는 단말에 포함될 수 있다. 일 예로, 상술한 제 1 인덱스 정보는 단말의 인공지능 빔 선택기에 기초하여 결정되고, 결정된 제 1 인덱스 정보가 IRS로 전달될 수 있다.
여기서, 일 예로, 단말과 기지국은 인공지능 빔 선택기에 적용되는 초기 값을 설정할 수 있다. 보다 상세하게는, 단말은 기지국으로부터 초기 값 설정을 위한 참조신호를 수신할 수 있다. 그 후, 단말은 초기 값 설정을 위한 참조신호를 통해 채널 상태 정보를 획득할 수 있다. 단말은 획득한 채널 상태 정보 및 단말의 위치 정보를 기지국으로 피드백 할 수 있다. 이때, 기지국은 인공지능 초기 값 설정기를 포함할 수 있다. 기지국은 인공지능 초기 값 설정기에 기초하여 인공지능 초기 값을 도출하고, 이에 대한 정보를 단말로 전송할 수 있다. 또한, 일 예로, 단말은 IRS로 전송하는 인덱스 정보와 관련된 후보 집합 정보를 더 수신할 수 있으며, 이는 상술한 바와 같다. 단말은 수신한 인공지능 초기 값 정보 및 후보 집합 정보에 기초하여 상술한 제1 인덱스 정보를 학습을 통해 도출할 수 있다.
그 후, 단말은 기지국으로부터 제 1 빔포밍이 적용된 참조신호를 IRS를 통해 수신할 수 있다.(S3020) 이때, 일 예로, 기지국은 IRS와 초기 설정을 수행할 때 IRS의 위치에 기초하여 제 1 빔포밍을 결정할 수 있다. 즉, 제 1 빔포밍에 대한 정보는 기지국이 사전에 인지하고 관리하는 정보일 수 있다.
다음으로, 단말은 기지국으로부터 제 1 빔포밍이 적용되어 전송된 참조신호를 통해 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득할 수 있다. 다음으로, 단말은 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나를 통해 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트할 수 있다.(S3040) 그 후, 단말은 업데이트된 제 2 인덱스 정보를 IRS로 전송할 수 있다.(S3050) 일 예로, 단말은 인공지능 빔 선택기를 포함할 수 있으며, 이는 상술한 바와 같다. 여기서, 인공지능 빔 선택기는 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나를 통해 상술한 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트할 수 있다. 일 예로, 인공지능 빔 선택기는 상술한 MAB AI 학습모델 또는 강화학습 학습모델 중 어느 하나에 기초하여 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트할 수 있다. 일 예로, 인공지능 빔 선택기가 MAB AI 학습모델에 기초하여 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하는 경우, 보상 값 정보에 기초한 학습을 통해 제 2 인덱스 정보가 획득될 수 있다.
또 다른 일 예로, 인공지능 빔 선택기가 강화학습 학습모델에 기초하여 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하는 경우, 제 1 인덱스 정보에 기초하여 상태 정보가 설정되고, 상태 정보 및 보상 값 정보에 기초한 학습을 통해 제 2 인덱스 정보가 획득될 수 있다.
여기서, 상술한 보상 값은 IRS 성능 측정기를 통해 획득될 수 있다. 일 예로, 단말은 IRS 성능 측정기를 포함하고, IRS 성능 측정기는 참조신호를 통해 획득되는 채널 관련 정보를 이용하여 보상 값 정보를 생성할 수 있으며, 이는 상술한 바와 같다.
다음으로, 단말은 업데이트된 제 2 인덱스 정보에 기초하여 기지국으로부터 제 2 빔포밍이 적용된 참조신호를 IRS를 통해 수신할 수 있다.(S3060) 이때, IRS가 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하는 경우, IRS는 기지국으로 제 2 인덱스 정보를 포함하는 무선환경 변경 완료 신호를 전송할 수 있다. 기지국은 제 2 인덱스 정보에 기초하여 상술한 제 2 빔포밍을 결정하고, 참조신호 전송에 적용할 수 있다.
상기 설명한 제안 방식에 대한 일례들 또한 본 개시의 구현 방법들 중 하나로 포함될 수 있으므로, 일종의 제안 방식들로 간주될 수 있음은 명백한 사실이다. 또한, 상기 설명한 제안 방식들은 독립적으로 구현될 수도 있지만, 일부 제안 방식들의 조합 (또는 병합) 형태로 구현될 수도 있다. 상기 제안 방법들의 적용 여부 정보 (또는 상기 제안 방법들의 규칙들에 대한 정보)는 기지국이 단말에게 사전에 정의된 시그널 (예: 물리 계층 시그널 또는 상위 계층 시그널)을 통해서 알려주도록 규칙이 정의될 수 가 있다.
본 개시는 본 개시에서 서술하는 기술적 아이디어 및 필수적 특징을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 개시의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 개시의 등가적 범위 내에서의 모든 변경은 본 개시의 범위에 포함된다. 또한, 특허청구범위에서 명시적인 인용 관계가 있지 않은 청구항들을 결합하여 실시 예를 구성하거나 출원 후의 보정에 의해 새로운 청구항으로 포함할 수 있다.
본 개시의 실시 예들은 다양한 무선접속 시스템에 적용될 수 있다. 다양한 무선접속 시스템들의 일례로서, 3GPP(3rd Generation Partnership Project) 또는 3GPP2 시스템 등이 있다.
본 개시의 실시 예들은 상기 다양한 무선접속 시스템뿐 아니라, 상기 다양한 무선접속 시스템을 응용한 모든 기술 분야에 적용될 수 있다. 나아가, 제안한 방법은 초고주파 대역을 이용하는 mmWave, THz 통신 시스템에도 적용될 수 있다.
추가적으로, 본 개시의 실시예들은 자유 주행 차량, 드론 등 다양한 애플리케이션에도 적용될 수 있다.

Claims (18)

  1. 무선 통신 시스템에서 단말 동작 방법에 있어서,
    지능형 반사판(Intelligent Reflect Surface, IRS) 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하는 단계;
    기지국으로부터 제 1 빔포밍이 적용된 참조신호를 상기 IRS를 통해 수신하는 단계;
    상기 수신한 참조신호에 기초하여 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하는 단계;
    상기 보상 값 정보 및 상기 채널 상태 정보 중 적어도 어느 하나를 통해 상기 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하는 단계;
    상기 업데이트된 제 2 인덱스 정보를 상기 IRS로 전송하는 단계; 및
    상기 업데이트된 제 2 인덱스 정보에 기초하여 상기 기지국으로부터 제 2 빔포밍이 적용된 참조신호를 상기 IRS를 통해 수신하는 단계;를 포함하는, 단말 동작 방법.
  2. 제 1 항에 있어서,
    상기 IRS 제어 값은 인덱스 정보에 기초하여 결정되고,
    상기 결정된 IRS 제어 값에 기초하여 IRS 소자(element) 내의 각각의 위상 값이 결정되는, 단말 동작 방법.
  3. 제 2 항에 있어서,
    상기 인덱스 정보는 IRS 방향벡터 집합에 기초한 코드북을 통해 생성되는 정보이며,
    상기 인덱스 정보는 IRS 방위각에 기초한 제 1 인자 및 IRS 고도각에 기초한 제 2 인자로 구성되는, 단말 동작 방법.
  4. 제 1 항에 있어서,
    상기 단말은 상기 기지국으로부터 초기 값 설정을 위한 참조신호를 수신하고, 상기 수신한 초기 값 설정을 위한 참조신호를 통해 획득한 채널 상태 정보 및 단말의 위치 정보를 상기 기지국으로 피드백하고,
    상기 단말은 상기 기지국이 상기 수신한 채널 상태 정보 및 상기 단말의 위치 정보에 기초하여 도출한 인공지능 초기 값 정보를 상기 기지국으로부터 수신하는, 단말 동작 방법.
  5. 제 4 항에 있어서,
    상기 단말은 인덱스 정보와 관련된 후보 집합 정보를 상기 기지국으로부터 더 수신하는, 단말 동작 방법.
  6. 제 5 항에 있어서,
    상기 단말은 상기 수신한 인공지능 초기 값 정보 및 상기 후보 집합 정보에 기초하여 상기 제 1 인덱스 정보를 도출하는, 단말 동작 방법.
  7. 제 1 항에 있어서,
    상기 기지국은 상기 IRS와 초기 설정을 수행할 때 상기 IRS의 위치에 기초하여 상기 제 1 빔포밍을 결정하는, 단말 동작 방법.
  8. 제 7 항에 있어서,
    상기 IRS가 상기 제 1 인덱스 정보를 상기 제 2 인덱스 정보로 업데이트하는 경우, 상기 IRS는 상기 기지국으로 상기 제 2 인덱스 정보를 포함하는 무선환경 변경 완료 신호를 전송하고,
    상기 기지국은 상기 제 2 인덱스 정보에 기초하여 상기 제 2 빔포밍을 결정하는, 단말 동작 방법.
  9. 제 1 항에 있어서,
    상기 단말은 인공지능 빔 선택기를 포함하고,
    상기 인공지능 빔 선택기는 상기 보상 값 정보 및 상기 채널 상태 정보 중 적어도 어느 하나를 통해 상기 제 1 인덱스 정보를 상기 제 2 인덱스 정보로 업데이트하는, 단말 동작 방법.
  10. 제 9 항에 있어서,
    상기 인공지능 빔 선택기는 MAB(multi-armed bandit) AI(artificial intelligence) 학습모델 또는 강화학습 학습모델 중 어느 하나에 기초하여 상기 제 1 인덱스 정보를 상기 제 2 인덱스 정보로 업데이트하는, 단말 동작 방법.
  11. 제 10 항에 있어서,
    상기 인공지능 빔 선택기가 상기 MAB AI 학습모델에 기초하여 상기 제 1 인덱스 정보를 상기 제 2 인덱스 정보로 업데이트하는 경우, 상기 보상 값 정보에 기초한 학습을 통해 상기 제 2 인덱스 정보를 획득하는, 단말 동작 방법.
  12. 제 10 항에 있어서,
    상기 인공지능 빔 선택기가 상기 강화학습 학습모델에 기초하여 상기 제 1 인덱스 정보를 상기 제 2 인덱스 정보로 업데이트하는 경우, 상기 제 1 인덱스 정보에 기초하여 상태 정보가 설정되고, 상기 상태 정보 및 상기 보상 값 정보에 기초한 학습을 통해 상기 제 2 인덱스 정보를 획득하는, 단말 동작 방법.
  13. 제 1 항에 있어서,
    상기 단말은 IRS 성능 측정기를 포함하고,
    상기 IRS 성능 측정기는 참조신호를 통해 획득되는 채널 관련 정보를 이용하여 상기 보상 값 정보를 생성하는, 단말 동작 방법.
  14. 무선 통신 시스템에서 기지국 동작 방법에 있어서,
    제 1 빔포밍이 적용된 참조신호를 IRS를 통해 단말로 전송하는 단계;
    상기 IRS를 통해 제 1 인덱스 정보에서 업데이트된 제 2 인덱스 정보를 수신하는 단계; 및
    제 2 빔포밍이 적용된 참조신호를 상기 IRS를 통해 상기 단말로 전송하는 단계;를 포함하되,
    상기 단말은 IRS 제어 값과 관련된 제 1 인덱스 정보를 상기 IRS로 전송하고, 상기 제 1 빔포밍이 적용된 참조신호를 통해 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하고, 상기 보상 값 정보 및 상기 채널 상태 정보 중 적어도 어느 하나를 통해 상기 제 1 인덱스 정보를 상기 제 2 인덱스 정보로 업데이트하고, 상기 제 2 인덱스 정보를 상기 IRS로 전송하는, 기지국 동작 방법.
  15. 무선 통신 시스템의 단말에 있어서,
    송수신기; 및
    상기 송수신기와 연결된 프로세서를 포함하고,
    상기 프로세서는,
    상기 송수신기를 통해 IRS 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하고,
    상기 송수신기를 통해 기지국으로부터 제 1 빔포밍이 적용된 참조신호를 상기 IRS를 통해 수신하고,
    상기 수신한 참조신호에 기초하여 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하고,
    상기 보상 값 정보 및 상기 채널 상태 정보 중 적어도 어느 하나를 통해 상기 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하고,
    상기 업데이트된 제 2 인덱스 정보를 상기 IRS로 전송하고, 및
    상기 업데이트된 제 2 인덱스 정보에 기초하여 상기 기지국으로부터 제 2 빔포밍이 적용된 참조신호를 상기 IRS를 통해 수신하는, 단말.
  16. 무선 통신 시스템의 기지국에 있어서,
    송수신기; 및
    상기 송수신기와 연결된 프로세서를 포함하고,
    상기 프로세서는,
    상기 송수신기를 통해 제 1 빔포밍이 적용된 참조신호를 IRS를 통해 단말로 전송하고,
    상기 송수신기를 통해 상기 IRS를 통해 제 1 인덱스 정보에서 업데이트된 제 2 인덱스 정보를 수신하고, 및
    상기 송수신기를 통해 제 2 빔포밍이 적용된 참조신호를 상기 IRS를 통해 상기 단말로 전송하되,
    상기 단말은 IRS 제어 값과 관련된 제 1 인덱스 정보를 상기 IRS로 전송하고, 상기 제 1 빔포밍이 적용된 참조신호를 통해 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하고, 상기 보상 값 정보 및 상기 채널 상태 정보 중 적어도 어느 하나를 통해 상기 제 1 인덱스 정보를 상기 제 2 인덱스 정보로 업데이트하고, 상기 제 2 인덱스 정보를 상기 IRS로 전송하는, 기지국.
  17. 적어도 하나의 메모리 및 상기 적어도 하나의 메모리들과 기능적으로 연결되어 있는 적어도 하나의 프로세서를 포함하는 장치에 있어서,
    상기 적어도 하나의 프로세서는 상기 장치가,
    IRS 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하고,
    기지국으로부터 제 1 빔포밍이 적용된 참조신호를 상기 IRS를 통해 수신하고,
    상기 수신한 참조신호에 기초하여 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하고,
    상기 보상 값 정보 및 상기 채널 상태 정보 중 적어도 어느 하나를 통해 상기 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하고,
    상기 업데이트된 제 2 인덱스 정보를 상기 IRS로 전송하고, 및
    상기 업데이트된 제 2 인덱스 정보에 기초하여 상기 기지국으로부터 제 2 빔포밍이 적용된 참조신호를 상기 IRS를 통해 수신하는, 장치.
  18. 적어도 하나의 명령어(instructions)을 저장하는 비-일시적인(non-transitory) 컴퓨터 판독 가능 매체(computer-readable medium)에 있어서,
    프로세서에 의해 실행 가능한(executable) 상기 적어도 하나의 명령어를 포함하며,
    상기 적어도 하나의 명령어는,
    상기 장치가 IRS 제어 값과 관련된 제 1 인덱스 정보를 IRS로 전송하고,
    기지국으로부터 제 1 빔포밍이 적용된 참조신호를 상기 IRS를 통해 수신하고,
    상기 수신한 참조신호에 기초하여 보상 값 정보 및 채널 상태 정보 중 적어도 어느 하나 이상을 획득하고,
    상기 보상 값 정보 및 상기 채널 상태 정보 중 적어도 어느 하나를 통해 상기 제 1 인덱스 정보를 제 2 인덱스 정보로 업데이트하고,
    상기 업데이트된 제 2 인덱스 정보를 상기 IRS로 전송하고, 및
    상기 업데이트된 제 2 인덱스 정보에 기초하여 상기 기지국으로부터 제 2 빔포밍이 적용된 참조신호를 상기 IRS를 통해 수신하는, 컴퓨터 판독 가능 매체.
PCT/KR2021/008944 2021-07-13 2021-07-13 무선 통신 시스템에서 신호를 송수신하는 방법 및 장치 WO2023286884A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020237038812A KR20240026441A (ko) 2021-07-13 2021-07-13 무선 통신 시스템에서 신호를 송수신하는 방법 및 장치
PCT/KR2021/008944 WO2023286884A1 (ko) 2021-07-13 2021-07-13 무선 통신 시스템에서 신호를 송수신하는 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2021/008944 WO2023286884A1 (ko) 2021-07-13 2021-07-13 무선 통신 시스템에서 신호를 송수신하는 방법 및 장치

Publications (1)

Publication Number Publication Date
WO2023286884A1 true WO2023286884A1 (ko) 2023-01-19

Family

ID=84920345

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/008944 WO2023286884A1 (ko) 2021-07-13 2021-07-13 무선 통신 시스템에서 신호를 송수신하는 방법 및 장치

Country Status (2)

Country Link
KR (1) KR20240026441A (ko)
WO (1) WO2023286884A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111050276A (zh) * 2019-12-23 2020-04-21 华中科技大学 基于角度信息的irs辅助通信***的优化方法及设备
CN111181615A (zh) * 2019-11-29 2020-05-19 广东工业大学 一种基于智能反射面的多小区无线通信方法
US20210126359A1 (en) * 2019-10-28 2021-04-29 Research & Business Foundation Sungkyunkwan University Data processing method and apparatus with wireless communication system including intelligent reflecting surface

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210126359A1 (en) * 2019-10-28 2021-04-29 Research & Business Foundation Sungkyunkwan University Data processing method and apparatus with wireless communication system including intelligent reflecting surface
CN111181615A (zh) * 2019-11-29 2020-05-19 广东工业大学 一种基于智能反射面的多小区无线通信方法
CN111050276A (zh) * 2019-12-23 2020-04-21 华中科技大学 基于角度信息的irs辅助通信***的优化方法及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HELIN YANG; ZEHUI XIONG; JUN ZHAO; DUSIT NIYATO; LIANG XIAO; QINGQING WU: "Deep Reinforcement Learning Based Intelligent Reflecting Surface for Secure Wireless Communications", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 1 January 1900 (1900-01-01), 201 Olin Library Cornell University Ithaca, NY 14853 , XP081844701, DOI: 10.1109/TWC.2020.3024860 *
QURRAT-UL-AIN NADEEM; ABLA KAMMOUN; ANAS CHAABAN; MEROUANE DEBBAH; MOHAMED-SLIM ALOUINI: "Intelligent Reflecting Surface Assisted Wireless Communication: Modeling and Channel Estimation", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 6 June 2019 (2019-06-06), 201 Olin Library Cornell University Ithaca, NY 14853 , XP081557801 *

Also Published As

Publication number Publication date
KR20240026441A (ko) 2024-02-28

Similar Documents

Publication Publication Date Title
WO2022039295A1 (ko) 무선 통신 시스템에서 하향링크를 전처리하는 방법 및 이를 위한 장치
WO2022250221A1 (ko) 무선 통신 시스템에서 신호 전송 방법 및 장치
WO2022050468A1 (ko) 무선 통신 시스템에서 연합학습을 수행하는 방법 및 이를 위한 장치
WO2022045399A1 (ko) 선택적 가중치 전송에 기반한 연합 학습 방법 및 그 단말
WO2022139230A1 (ko) 무선 통신 시스템에서 스플릿 포인트를 조정하는 방법 및 장치
WO2023286884A1 (ko) 무선 통신 시스템에서 신호를 송수신하는 방법 및 장치
WO2022092859A1 (ko) 무선 통신 시스템에서 스플릿 포인트 조정을 위한 장치 및 방법
WO2022045377A1 (ko) 무선 통신 시스템에서 단말 및 기지국의 신호 송수신 방법 및 장치
WO2022260189A1 (ko) 무선 통신 시스템에서 신호를 송수신하는 방법 및 장치
WO2022039302A1 (ko) 무선 통신 시스템에서 심층 신경망의 연산을 제어하는 방법 및 이를 위한 장치
WO2022050444A1 (ko) 연합학습을 위한 통신방법 및 이를 수행하는 디바이스
WO2023027321A1 (ko) 무선 통신 시스템에서 신호 송수신 방법 및 장치
WO2024071459A1 (ko) 무선 통신 시스템에서 신호 송수신 방법 및 장치
WO2024034694A1 (ko) 무선 통신 시스템에서 신호를 송수신하기 위한 방법 및 장치
WO2023008614A1 (ko) 무선 통신 시스템에서 공간 위상 천이 빔을 통해 신호를 전송하는 방법 및 장치
WO2022231084A1 (ko) 무선 통신 시스템에서 신호 전송 방법 및 장치
WO2024122694A1 (ko) 무선 통신 시스템에서 수신기에 대한 학습을 수행하기 위한 장치 및 방법
WO2023113282A1 (ko) 무선 통신 시스템에서 송수신기 모델에 대한 온라인 학습을 수행하기 위한 장치 및 방법
WO2024117275A1 (ko) 무선 통신 시스템에서 다양한 신호들을 이용하여 공동 통신 및 센싱 동작을 수행하기 위한 장치 및 방법
WO2024010112A1 (ko) 무선 통신 시스템에서 채널을 추정하기 위한 장치 및 방법
WO2024122667A1 (ko) 무선 통신 시스템에서 앙상블 모델 기반의 수신기에 대한 학습을 수행하기 위한 장치 및 방법
WO2023277218A1 (ko) 무선 통신 시스템에서 반사판을 통해 신호를 전송하는 방법 및 장치
WO2023219192A1 (ko) 무선 통신 시스템에서 지능형 반사 평면에 관련된 채널을 추정하기 위한 장치 및 방법
WO2024019184A1 (ko) 무선 통신 시스템에서 송수신기 모델에 대한 학습을 수행하기 위한 장치 및 방법
WO2023042941A1 (ko) 무선 통신 시스템에서 신호 전송 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21950232

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE