JP2022534603A - 通信システムにおける学習 - Google Patents

通信システムにおける学習 Download PDF

Info

Publication number
JP2022534603A
JP2022534603A JP2021570832A JP2021570832A JP2022534603A JP 2022534603 A JP2022534603 A JP 2022534603A JP 2021570832 A JP2021570832 A JP 2021570832A JP 2021570832 A JP2021570832 A JP 2021570832A JP 2022534603 A JP2022534603 A JP 2022534603A
Authority
JP
Japan
Prior art keywords
transmission system
parameters
symbols
transmitter
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021570832A
Other languages
English (en)
Other versions
JP7307199B2 (ja
Inventor
ホイディス,ジャコブ
アイ・アウディア,ファイサル
シュタルク,マクシミリアン
Original Assignee
ノキア テクノロジーズ オサケユイチア
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ノキア テクノロジーズ オサケユイチア filed Critical ノキア テクノロジーズ オサケユイチア
Publication of JP2022534603A publication Critical patent/JP2022534603A/ja
Application granted granted Critical
Publication of JP7307199B2 publication Critical patent/JP7307199B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • H04L27/32Carrier systems characterised by combinations of two or more of the types covered by groups H04L27/02, H04L27/10, H04L27/18 or H04L27/26
    • H04L27/34Amplitude- and phase-modulated carrier systems, e.g. quadrature-amplitude modulated carrier systems
    • H04L27/3405Modifications of the signal space to increase the efficiency of transmission, e.g. reduction of the bit error rate, bandwidth, or average power
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/0202Channel estimation
    • H04L25/0224Channel estimation using sounding signals
    • H04L25/0228Channel estimation using sounding signals with direct estimation from sounding signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/0202Channel estimation
    • H04L25/0212Channel estimation of impulse response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/0264Arrangements for coupling to transmission lines
    • H04L25/0266Arrangements for providing Galvanic isolation, e.g. by means of magnetic or capacitive coupling
    • H04L25/0268Arrangements for providing Galvanic isolation, e.g. by means of magnetic or capacitive coupling with modulation and subsequent demodulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L25/03165Arrangements for removing intersymbol interference using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L5/00Arrangements affording multiple use of the transmission path
    • H04L5/003Arrangements for allocating sub-channels of the transmission path
    • H04L5/0048Allocation of pilot signals, i.e. of signals known to the receiver
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L2025/03592Adaptation methods
    • H04L2025/03598Algorithms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L2025/03592Adaptation methods
    • H04L2025/03745Timing of adaptation
    • H04L2025/03764Timing of adaptation only during predefined intervals
    • H04L2025/0377Timing of adaptation only during predefined intervals during the reception of training signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Power Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

送信機、チャネル、および受信機を有する伝送システムの訓練可能なパラメータを初期化することと;微分可能な分布関数に基づいて訓練シンボルを生成することと;変調された訓練シンボルを訓練モードでチャネル上で受信機に送信することと;生成された訓練シンボルおよび伝送システムの受信機で受信された変調された訓練シンボルに基づいて損失関数を生成することと;損失関数を最小化するために伝送システムの更新されたパラメータを生成することとを含む装置、方法およびコンピュータプログラムが記載されている。

Description

本明細書は、通信システムにおける学習に関する。
単純な通信システムには、送信機、伝送路、および受信機が含まれる。送信機から受信機へのデータ伝送に使用される通信方式の選択は、このような通信システムのエンド・トゥ・エンドの性能に大きな影響を与える可能性がある。これまでにも開発は行われてきたが、この分野ではさらなる発展の余地が残されている。
第1の態様では、本明細書は、装置であって:伝送システムの訓練可能なパラメータを(例えば、ランダムに、または、チャネル情報に基づいてなどの何らかの他の方法で)初期化するための手段であって、伝送システムが、送信機、チャネル、および受信機を含み、送信機が、1つ以上の入力(例えば、データビットまたはデータストリーム)を1つ以上のデータシンボルに変換するための送信機アルゴリズム(例えば、ニューラルネットワークとして実現される)と、前記データシンボルを変調方式に従って送信シンボルに変換するための変調器とを含み、伝送システムの訓練可能なパラメータが、個々のデータシンボルが送信機アルゴリズムによって出力される確率を定義する確率関数(例えば、本明細書に記載されているように確率的シェイピングを実現する)を含む、初期化するための手段と;分布関数に基づいて訓練シンボルを生成するための手段と;訓練モードで、変調された訓練シンボルを、チャネル上で受信機に送信するための手段と;生成された訓練シンボルと、伝送システムの受信機で受信された変調された訓練シンボルとに基づいて、損失関数を生成するための手段と;損失関数を最小化するために、(例えば、機械学習原理を使用して例えばニューラルネットワークを更新することによって)伝送システムの更新されたパラメータを生成するための手段であって、伝送システムの更新されたパラメータを生成することは、送信機アルゴリズムのパラメータを更新することを含む、手段と;第1の条件に到達するまで、訓練シンボルを生成すること、損失関数を生成すること、および伝送システムのパラメータを更新することを繰り返すための手段とを含み、分布関数が微分可能である、装置を記載する。データシンボルは、有限で離散的なシンボルの集合であってもよい。データシンボルは、送信機のコンステレーションポイントに対応していてもよい。確率関数は、微分できない離散的な関数であってもよい(訓練中に微分可能な近似(分布関数)に置き換えられてもよい)。微分可能な分布関数に基づいて訓練シンボルを生成することで、パラメータの訓練中にバックプロパゲーションを使用することができる場合がある。
訓練アルゴリズムのパラメータを更新することは、確率関数を訓練することを含んでもよい。また、前記パラメータを更新することは、変調器のコンステレーションなど、他のパラメータを更新することを含んでもよい。
分布関数は、確率関数の近似であってもよい。例えば、分布関数は、確率関数の微分可能な近似であってもよい(この確率関数は、離散的で微分可能でなく(non-differentiable)てもよい)。
訓練シンボルは、ガンベルソフトマックス再パラメータ化を用いるなど、ガンベルソフトマックスアルゴリズムによって生成されてもよい。
送信シンボル(および訓練モードにおける訓練シンボル)は、前記変調器によって実施される変調方式の固定コンステレーション位置に対応していてもよい。あるいは、送信シンボル(および訓練モードにおける訓練シンボル)は、前記変調器によって実施される変調方式の可変コンステレーション位置に対応していてもよく、伝送システムの訓練可能なパラメータは、前記変調方式のコンステレーションポイント位置を含む。
受信機は、動作モードで前記チャネル上で送信される前記送信シンボルを受信し、訓練モードでチャネル上で送信される前記変調された訓練シンボルを受信するように構成されてもよい。
伝送システムの更新されたパラメータを生成することは、訓練可能な受信機アルゴリズムのパラメータを更新することを含んでもよい。したがって、例えば、伝送システムのエンド・トゥ・エンドの訓練が提供されてもよい。
いくつかの実施形態は、伝送システムの生成された更新されたパラメータを用いて、伝送システムの訓練可能なパラメータを更新するための手段を含んでもよい。例えば、送信機パラメータは、訓練モードで更新され、その後、送信機アルゴリズムに配備されてもよい。送信機システムの訓練可能なパラメータは:送信機アルゴリズムの訓練可能なパラメータ;変調器の訓練可能なパラメータ;および受信機の訓練可能なパラメータのうちの1つ以上を含んでいてもよい。
確率関数および分布関数は、伝送システムのチャネル情報(信号対雑音比など)に少なくとも部分的に依存していてもよい。
いくつかの実施形態では、第1の条件は、定義された性能レベルを含む。代わりに、またはそれに加えて、第1の条件は、定義された反復回数を含んでもよい。
送信機アルゴリズムは、動作モードにおいてルックアップテーブルとして実現されてもよい。
損失関数は、ブロックエラーレート、ビットエラーレート、相互情報、およびカテゴリクロスエントロピーのうちの1つ以上に関連していてもよい。
伝送システムの更新されたパラメータを生成するための手段は、訓練モードで使用されるシンボル近似値のバッチサイズおよび学習率のうちの1つ以上を最適化してもよい。
伝送システムの更新されたパラメータを生成するための手段は、確率的勾配降下法(または何らかの他のバックプロパゲーションアルゴリズム)を用いて前記パラメータを更新してもよい。
送信機は、前記送信機アルゴリズムを実施するように構成された送信機ニューラルネットワークを含んでいてもよい。受信機アルゴリズムは、受信機ニューラルネットワークを含んでいてもよい。
前記手段は:少なくとも1つのプロセッサと;コンピュータプログラムコードを含む少なくとも1つのメモリとを含んでいてもよく、少なくとも1つのメモリおよびコンピュータプログラムは、少なくとも1つのプロセッサを用いて、装置の性能を引き起こすように構成されている。
第2の態様では、本明細書は、方法であって:伝送システムの訓練可能なパラメータを初期化することであって、伝送システムが、送信機、チャネル、および受信機を含み、送信機が、1つ以上の入力を1つ以上のデータシンボルに変換するための送信機アルゴリズムと、前記データシンボルを変調方式に従って送信シンボルに変換するための変調器とを含み、伝送システムの訓練可能なパラメータが、個々のデータシンボルが送信機アルゴリズムによって出力される確率を定義する確率関数を含む、ことと;分布関数に基づいて訓練シンボルを生成することと;訓練モードで、変調された訓練シンボルを、チャネル上で受信機に送信することと;生成された訓練シンボルと、伝送システムの受信機で受信された変調された訓練シンボルとに基づいて、損失関数を生成することと;損失関数を最小化するために、伝送システムの更新されたパラメータを生成すし、伝送システムの更新されたパラメータを生成することは、送信機アルゴリズムのパラメータを更新することを含むことと;第1の条件に到達するまで、訓練シンボルを生成すること、損失関数を生成すること、および伝送システムのパラメータを更新することを繰り返すこととを含み、分布関数が微分可能である、方法を記載する。
訓練シンボルは、ガンベルソフトマックスアルゴリズムによって生成されてもよい。
送信シンボルは、前記変調器によって実施される変調方式の固定コンステレーション位置に対応してもよい。あるいは、送信シンボルは、前記変調器によって実施される変調方式の可変コンステレーション位置に対応していてもよく、伝送システムの訓練可能なパラメータは、前記変調方式のコンステレーションポイント位置を含んでいる。
伝送システムの更新されたパラメータを生成することは、訓練可能な受信機アルゴリズムのパラメータを更新することを含んでもよい。
いくつかの実施形態は、伝送システムの生成された更新されたパラメータを用いて、伝送システムの訓練可能なパラメータを更新するステップを含む。送信機システムの前記訓練可能なパラメータは:送信機アルゴリズムの訓練可能なパラメータ;変調器の訓練可能なパラメータ;および受信機の訓練可能なパラメータのうちの1つ以上を含んでもよい。
確率関数および分布関数は、伝送システムのチャネル情報に少なくとも部分的に依存していてもよい。
第2の態様は、上述した第1の態様の少なくともいくつかの特徴をさらに含んでいてもよい。
第3の態様では、本明細書は、第2の態様を参照して説明したような任意の方法を行うように構成された装置を説明する。
第4の態様では、本明細書は、第2の態様の方法によって作成されたルックアップテーブルまたはアレイを含むワークプロダクトを説明する。
第5の態様では、本明細書は、コンピューティング装置によって実行されると、コンピューティング装置に第3または第4の態様を参照して説明したような任意の方法を行わせるコンピュータ可読命令を説明する。
第6の態様では、本明細書は、コンピュータ可読媒体であって、少なくとも以下のこと:伝送システムの訓練可能なパラメータを初期化することであって、伝送システムが、送信機、チャネル、および受信機を含み、送信機が、1つ以上の入力を1つ以上のデータシンボルに変換するための送信機アルゴリズムと、前記データシンボルを変調方式に従って送信シンボルに変換するための変調器とを含み、伝送システムの訓練可能なパラメータが、個々のデータシンボルが送信機アルゴリズムによって出力される確率を定義する確率関数を含む、ことと;分布関数に基づいて訓練シンボルを生成することと;訓練モードで、変調されたシンボルを、チャネル上で受信機に送信することと;生成されたシンボルと、伝送システムの受信機で受信された変調されたシンボルとに基づいて、損失関数を生成することと;損失関数を最小化するために、伝送システムの更新されたパラメータを生成し、伝送システムの更新されたパラメータを生成することは、送信機アルゴリズムのパラメータを更新することを含むことと;第1の条件に到達するまで、シンボル近似値を生成すること、損失関数を生成すること、および伝送システムのパラメータを更新することを繰り返すこととを行うためのプログラム命令を記憶し、分布関数が微分可能である、コンピュータ可読媒体を記載する。
第7の態様では、本明細書は、コンピュータプログラムであって、装置に少なくとも以下のこと:伝送システムの訓練可能なパラメータを初期化することであって、伝送システムが、送信機、チャネル、および受信機を含み、送信機が、1つ以上の入力を1つ以上のデータシンボルに変換するための送信機アルゴリズムと、前記データシンボルを変調方式に従って送信シンボルに変換するための変調器とを含み、伝送システムの訓練可能なパラメータが、個々のデータシンボルが送信機アルゴリズムによって出力される確率を定義する確率関数を含む、ことと;分布関数に基づいて訓練シンボルを生成することと;訓練モードで、変調されたシンボルを、チャネル上で受信機に送信することと;生成されたシンボルと、伝送システムの受信機で受信された変調されたシンボルとに基づいて、損失関数を生成することと;損失関数を最小化するために、伝送システムの更新されたパラメータを生成し、伝送システムの更新されたパラメータを生成することは、送信機アルゴリズムのパラメータを更新することを含むことと;第1の条件に到達するまで、シンボル近似値を生成すること、損失関数を生成すること、および伝送システムのパラメータを更新することを繰り返すこととを行わせるための命令を含み、分布関数が微分可能である、コンピュータプログラムを記載する。
第8の態様では、本明細書は、装置であって、少なくとも1つのプロセッサと、コンピュータプログラムコードを含む少なくとも1つのメモリとを備え、コンピュータプログラムコードは、少なくとも1つのプロセッサによって実行されたときに、装置に:伝送システムの訓練可能なパラメータを初期化させ、伝送システムが、送信機、チャネル、および受信機を含み、送信機が、1つ以上の入力を1つ以上のデータシンボルに変換するための送信機アルゴリズムと、前記データシンボルを変調方式に従って送信シンボルに変換するための変調器とを含み、伝送システムの訓練可能なパラメータが、個々のデータシンボルが送信機アルゴリズムによって出力される確率を定義する確率関数を含んでおり;分布関数に基づいて訓練シンボルを生成させ;訓練モードで、変調されたシンボルを、チャネル上で受信機に送信させ;生成されたシンボルと、伝送システムの受信機で受信された変調されたシンボルとに基づいて、損失関数を生成させ;損失関数を最小化するために、伝送システムの更新されたパラメータを生成させ、;第1の条件に到達するまで、シンボル近似値を生成すること、損失関数を生成すること、および伝送システムのパラメータを更新することを繰り返すこととをさせ、分布関数が微分可能であり、伝送システムの更新されたパラメータを生成することは、送信機アルゴリズムのパラメータを更新することを含む、装置を記載する。
第9の態様では、本明細書は、装置であって:伝送システムの訓練可能なパラメータを(例えば、ランダムに、または、チャネル情報に基づいてなどの何らかの他の方法で)初期化するための初期化モジュールであって、伝送システムが、送信機、チャネル、および受信機を含み、送信機が、1つ以上の入力(例えば、データビットまたはデータストリーム)を1つ以上のデータシンボルに変換するための送信機アルゴリズム(例えば、ニューラルネットワークとして実現される)と、前記データシンボルを変調方式に従って送信シンボルに変換するための変調器とを含み、伝送システムの訓練可能なパラメータが、個々のデータシンボルが送信機アルゴリズムによって出力される確率を定義する確率関数(例えば、本明細書に記載されているように確率的シェイピングを実現する)を含む、初期化モジュールと;分布関数に基づいて訓練シンボルを生成する訓練モジュール(シェイピングデバイスのような)と;訓練モードで、変調された訓練シンボルを、チャネル上で受信機に送信するための送信機と;生成された訓練シンボルと、伝送システムの受信機で受信された変調された訓練シンボルとに基づいて、損失関数を生成するためのプロセッサと;損失関数を最小化するために、(例えば、機械学習原理を使用して例えばニューラルネットワークを更新することによって)伝送システムの更新されたパラメータを生成するための更新モジュールと;第1の条件に到達するまで、訓練シンボルを生成すること、損失関数を生成すること、および伝送システムのパラメータを更新することを繰り返す制御モジュールとを含み、分布関数が微分可能であり、伝送システムの更新されたパラメータを生成することは、送信機アルゴリズムのパラメータを更新することを含む、装置を記載する。データシンボルは、有限で離散的なシンボルの集合であってもよい。データシンボルは、送信機のコンステレーションポイントに対応していてもよい。確率関数は、微分できない離散的な関数であってもよい(訓練中に微分可能な近似値(分布関数)に置き換えられてもよい)。
次に、例示的な実施形態について、非限定的な例として、以下の概略図面を参照しながら説明する。
例示的な実施形態による例示的なエンド・トゥ・エンドの通信システムのブロック図である。 図1の通信システムで使用される可能性のある例示的な送信機のブロック図である。 図1の通信システムで使用される可能性のある例示的な受信機のブロック図である。 例示的な実施形態による伝送システムのブロック図である。 例示的な実施形態による送信機のブロック図である。 例示的な実施形態による例示的な受信モジュールのブロック図である。 例示的な実施形態によるアルゴリズムを示すフローチャートである。 例示的な実施形態によるシステムの構成要素のブロック図である。 コンピュータによって走らされると実施形態による動作を行うコンピュータ可読コードを記憶したリムーバブルメモリユニットである有体媒体を示す図である。 コンピュータによって走らされると実施形態による動作を行うコンピュータ可読コードを記憶したコンパクトディスク(CD)である有体媒体を示す図である。
本発明の様々な実施形態に求められる保護の範囲は、独立請求項によって定められている。独立請求項の範囲に該当しない明細書に記載された実施形態および特徴がもしあれば、本発明の様々な実施形態を理解するのに有用な例として解釈されるべきである。
本明細書および図面において、同様の参照符号は、全体を通して同様の要素を指す。
図1は、例示的な実施形態による、総称的に参照符号1で示される例示的なエンド・トゥ・エンド通信システムのブロック図である。システム1は、送信機2と、チャネル4と、受信機6とを含む。システムレベルで見ると、システム1は、送信機2への入力で受信した入力ビット(b)を、受信機6の出力で出力ビット
Figure 2022534603000002
に変換する。より具体的には、送信機2は、チャネル4上での送信のために入力ビット(b)を送信シンボル(x)に変換し、受信機6は、チャネル4から受信したシンボル(y)から出力ビット
Figure 2022534603000003
を生成する。
図2は、上述した通信システム1で使用することができる例示的な送信機2のブロック図である。図2に示すように、送信機2は、ビット・トゥ・シンボルモジュール12と変調器14とを含む。ビット・トゥ・シンボルモジュール12は、入力データビット(b)を受信し、それらのビットを送信用のデータシンボル(s)に変換する。例えば、入力データビット(b)は、データストリームの形態をとっていてもよく、そのデータストリームは、ビット・トゥ・シンボルモジュール12によって送信用にパッケージ化される。変調器14は、変調方式に従って、データシンボルを送信シンボル(x)に変換する。そして、送信シンボルは、チャネル4上で送信され、受信されたシンボル(y)として受信機6に受信される。
図3は、上述した通信システム1で使用され得る例示的な受信機6のブロック図である。図3に示すように、受信機6は、復調器22およびデマッパーモジュール24を含む。復調器22は、受信したシンボル(y)をシンボル確率pΦ(s│y)に変換し、デマッパー24は、シンボル確率をビット確率p(b│y)に変換する。
変調器14(および復調器22)の実現には、多くの変調技術が使用され得る。これらには、搬送波信号の振幅が送信される信号に基づいて変更される振幅シフトキーイング(ASK)、および搬送波信号の位相が送信される信号に基づいて変更される位相シフトキーイング(PSK)が含まれる。一例として、直交位相シフトキーイング(QPSK)は、4つの可能な搬送波位相シフト(例えば、0、+90度、180度、-90度)のうち1つを選択して、2つのビットを一度に変調する位相シフトキーイングの一形態である。このような搬送波の位相と振幅は、複素平面上のコンステレーション位置として表されることが多い。当業者であれば、他にも多くの適切な変調技術を認識するであろう。
通信システム1のような情報を送信するために使用される変調方式の選択は、そのような通信システムのエンド・トゥ・エンドの性能に影響を与える。さらに、そのような変調方式は、最適化されてもよい。
多数のコンステレーションポイントを有する通信方式(振幅および/または位相シフトキーイング変調方式など)については、複素平面におけるこのようなコンステレーションポイントの場所が最適化されてもよい。代替的に、または追加で、そのようなコンステレーションポイントが使用される相対的な周波数が最適化されてもよい。これらの方法は、本明細書では、それぞれ幾何学的シェイピングおよび確率的シェイピングと呼ばれる。
図4は、例示的な実施形態による、総称的に参照符号30で示される伝送システムのブロック図である。伝送システム30は、送信機32、チャネル34、および受信機36を含む(これらは、上述の送信機2、チャネル4、および受信機6といくつかの類似点を有する)。
図4に示すように、送信機32は、ビット・トゥ・シンボルモジュール37(上述のビット・トゥ・シンボルモジュール12と同様のもの)と、変調器38(変調器14と同様のもの)と、シェイピングデバイス39とを含む。受信機36は、復調器40(復調器22と同様のもの)と、デマッパーモジュール41(デマッパーモジュール24と同様のもの)とを含む。
以下でさらに論じるように、送信機32は、ビットの入力ストリームを送信シンボルにマッピングする。送信機は、ニューラルネットワーク(または、訓練可能なパラメータを有する何らかの他の関数)を含む。
ビット・トゥ・シンボルモジュール37は、b=[b,...,b]で示されるサイズNの入来ビットシーケンスを受信し、シンボルsの発生頻度がシェイピングデバイス39によって提供される確率分布pθ(s)に対応するように、そのビットシーケンスをハイパーシンボルs∈Sにマッピングする。ここで、S={1,...,K}は、ハイパーシンボルの有限で離散的な集合である。ハイパーシンボルsは変調器38に提供され、変調器38はsを複素送信シンボル
Figure 2022534603000004
にマッピングするが、ここでMはチャネルの使用数である。
システム30のチャネル34は、複素送信シンボル
Figure 2022534603000005
を受け取り、
Figure 2022534603000006
にプールされたM個の受信されたサンプルを出力する。おそらく知られていない遷移確率p(y│x)は、チャネル34の入出力関係を記述する。
システム30の受信機36は、チャネル34によって生成されたM個のサンプルのシーケンス
Figure 2022534603000007
で動作する。受信機36の復調器40は、受信したシンボルをシンボル確率pΦ(s│y)にマッピングし、デマッパーモジュール41は、ビット確率p(b│y)を出力する。
図5は、例示的な実施形態による、総称的に参照符号50で示される送信機のブロック図である。送信機50は、上述した送信機32の一例であり;特に、送信機50は、上述した送信機32を訓練するための例示的な構成を示している。
送信機50は、例示的な実施形態による、ビット・トゥ・シンボルモジュール37、変調器38、およびシェイピングデバイス39を含む。シェイピングデバイス39は、送信機50の訓練中に使用されてもよい。以下でさらに説明するように、通常の動作モードでは、シェイピングデバイス39は、例えば、適切な設定を提供するルックアップテーブルで置き換えられてもよい。
変調器38は、埋め込みモジュール52、正規化モジュール54、および実数複素数変換モジュール56を含む。シェイピングデバイス39は、パラメータモジュール60、サミングモジュール62、ガンベルサンプラ63、ソフトマックスモジュール64、ソフトマックスτモジュール65、およびストレートスルー推定器66を含む。
ビット・トゥ・シンボルモジュール37は、入来ビットbをハイパーシンボルsにマッピングする。このマッピングは、シンボルが使用される頻度が所与の確率分布pθ(s)に一致するように実施される。確率分布pθ(s)は、以下でさらに論じるように、シェイピングモジュール39によって生成される。
ビット・トゥ・シンボルモジュール37は、いくつかの方法で実現することができる。一例として、定数構成分布マッチング(CCDM)アプローチが使用されてもよい。CCDMは、N個のビットのベクトルをN個のシンボルのベクトルにマッピングすることを含み、ここで、NおよびNは典型的に大きな数である。サイズNのシンボルのすべての可能なベクトルの集合から、シンボルが望ましい目標確率で近似的に出現するようなものを選択する。これらの選択されたベクトルが集合Gを形成する。Nが大きければ大きいほど、目標確率の近似値が良好になる。Nは、N≦log|G|となるようにしなければならない。そして、サイズNのビットのベクトルを、算術符号化を用いてGからシンボルのベクトルにマッピングする。
詳細は以下で論じるが、バックプロパゲーションなどの機械学習原理を用いてシステム50を訓練することが望まれる場合もある。ビット・トゥ・シンボルモジュール37によって行われる演算は、離散的で微分可能でない関数であり、したがって、機械学習で使用される多くの訓練技術は適用できない。
シェイピングデバイス39は、パラメータθ(または任意の他の訓練可能な関数)を有するニューラルネットワークとして実現されてもよい。図5に示唆されているように、シェイピングデバイス39は、ストレートスルーのガンベルソフトマックス再パラメータ化技法を利用してもよい。ガンベルソフトマックス技法は、任意の離散的な確率分布pθ(s)のサンプルs∈Sは、
Figure 2022534603000008
によって近似的にサンプリングすることができるとしている。
ここで、
Figure 2022534603000009
であり、i∈Sのgはガンベル(0,1)分布からのサンプルであり、i∈Sの{z}はパラメータθを有する訓練可能なニューラルネットワークによって計算された、いわゆるロジット(例えば、正規化されていない確率の対数であり、ソフトマックス関数はこのプロセスを逆にする)である。(パラメータτについては以下でさらに論じる。)
分布pθ(s)は、pθ=softmax(z)によってロジットから取得することができる。システム50では、ロジットを生成するニューラルネットワークのアーキテクチャの例が描かれている。この例では、ロジットが直接訓練されているため、θ=zとなっている。なお、他のアーキテクチャも可能である。例えば、ロジットは、ニューラルネットワークによってチャネル情報(信号対雑音比など)から計算され得る。
θを最適化することで、分布pθ(s)を最適化する。
上記(1)式において、softmax演算子の代わりにargmax演算子を用いれば、正確な分布pθ(s)からのサンプリングが可能となる。argmaxの出力は、ワンホット表現、すなわち、1つの要素を1に設定し、他の要素を0に設定したベクトルに変換される。1に設定された要素のインデックスがargmaxの出力に対応する。しかし、argmax演算子は微分可能ではないため、通常の確率的勾配降下法(SGD)または同様のバックプロパゲーション法によるpθ(s)の最適化を阻む。argmax演算子の微分可能な近似として、ソフトマックス関数を使用することができる。正のパラメータτは、生成されたサンプル
Figure 2022534603000010
の分布が正確な分布pθ(s)からどの程度大きく逸脱するかを制御する。τを低い値に設定すると、より良い近似値が可能になるが、ソフトマックスτ層の鋭さが増し、勾配のバックプロパゲーションがより困難になるため、訓練がより難しくなる。ソフトマックス関数の欠点は、ワンホットベクトルの近似値しか出力しないことである。訓練時に変調器の入力が常に真のワンホットベクトルであることを保証するために、ソフトマックスの出力がストレートスルー推定器66に供給されることができる。ストレートスルー推定器は、(最大の要素を1に、その他の要素をすべて0に等しく設定することによって)その入力を最も近い真のワンホットベクトルに離散化する非常に単純なユニットであるが、バックプロパゲーションを行う際にはスキップすることができる(つまり、離散化は無視される)。
確率的勾配降下法は、バックプロパゲーティング勾配に基づいて、訓練可能なパラメータを最適化しようとするものである。上述の構成では、提案されたサンプリングデバイスのみが訓練可能であり、ビット・トゥ・シンボルモジュール37は訓練可能ではないので、訓練時と配備時には異なるサブモジュールがアクティブになる。これは、システム50のスイッチ58によって描かれている。
訓練中には、訓練可能なシェイピングデバイス39がアクティブであり、ハイパーシンボルsはこのデバイスによって生成される。情報レートを最大化する分布pθ(s)を学習するために、バックプロパゲーティング勾配の流れが訓練可能なデバイスに供給され、それに応じてパラメータθが更新される。訓練が完了すると、学習された分布pθ(s)がビット・トゥ・シンボルモジュール37に供給され、スイッチ58が「評価」に設定される。このように、配備時には、今度はシンボルがビット・トゥ・シンボルモジュール37によって生成され、ビット・トゥ・シンボルモジュール37は、入来ビットストリームを学習された頻度pθ(s)を有するハイパーシンボルにマッピングする。上述したように、このような構成は、ルックアップテーブルまたは何らかの同様のモジュールによって実現されてもよい。
変調器38は、シンボルsを複素平面上のコンステレーションポイントxにマッピングする。これらのポイントの実際の場所は、固定されることも、pθ(s)と共同で最適化されることもできる。コンステレーションも学習される場合、変調器38は、訓練可能なパラメータ(または他の任意の学習可能な関数)を有するニューラルネットワークとして実現することができ、Gψで示される。訓練可能な変調器の例示的なアーキテクチャが図5に示されており、これは、次元K×2Mの埋め込み層52と、何らかの電力制約、例えば
Figure 2022534603000011
を保証するために、学習された分布pθ(s)を第2の入力としてとる正規化層54とを含む。最後に、実数複素数変換モジュール56が、2M個の実数出力をM個の複素数チャネルシンボルにマッピングする。当業者は、変調器38の代替的な実施形態(特に、コンステレーションポイントの場所が固定されている場合)を認識するであろう。
システム30および50は、エンド・トゥ・エンド学習を用いて訓練されてもよい。このアプローチでは、送信機32、チャネル34、および受信機36は、単一のニューラルネットワークとして実現されてもよく、エンド・トゥ・エンドシステムは、入力および出力を再構築するように訓練される。いくつかの実施形態では、差動チャネルモデルが利用可能であると仮定することができる。例えば、適切なチャネルモデルが利用できない場合などには、代替的な実施形態も可能である。
エンド・トゥ・エンドの訓練により、ニューラルネットワーク(または何らかの他の訓練可能な関数)として実現された、パラメータΦを有する訓練可能な受信機rΦが提供されてもよい。
図6は、例示的な実施形態による、総称的に参照符号70で示される例示的な受信モジュールのブロック図である。受信モジュール70は、複素数実数変換モジュール71と、第1の密(dense)層72と、第2の密層73と、ソフトマックス層74とを含む。システム70に2つの密層を設けることは例示に過ぎず;任意の数の密層を設けることが可能である。
複素数実数変換モジュール71は、受信したベクトル
Figure 2022534603000012
を実数値に変換する。これは、例えば、サンプルの実数部と虚数部を連結して、
Figure 2022534603000013
の値をとるベクトルを得ることによって行うことができる。
このようにして得られたベクトルは、密層72および73に供給され、これらの密層は、異なる活性化関数(例えば、ReLU、tanh、シグモイド、線形など)を有することができる。ソフトマックス層の最後の層は、|S|出力次元を有し、ソフトマックス活性化関数を利用して、離散的な確率質量関数pθ(s│y)を生成するが、その要素は、シンボルsが送信された確率として解釈することができる。
(確率的シェイピングに関連する)訓練可能な関数θ、(コンステレーション位置または幾何学的シェイピングに関連する)φ、および(受信機に関連する)Φの1つ以上を決定するために、確率的勾配降下法(またはなんらかの類似のアルゴリズム)が行われる。最小化される可能な損失関数は、シンボルのエントロピーを差し引いたクロスエントロピー(CE)損失関数である:
Figure 2022534603000014
式(3)では、シンボルsとチャネル出力yのすべての実現値に対して期待値をとっている。独立同一分布(i.i.d.)の実現値を仮定すると、損失関数は:
Figure 2022534603000015
によって推定できる。
ここで、Bはバッチサイズ(すなわち、損失を近似するために使用される訓練例の数)を表している。なお、変調器が固定されたコンステレーションを有すると仮定される場合、最適化はφに対して行われないであろう。
図7は、例示的な実施形態による、総称的に参照符号80で示されるアルゴリズムを示すフローチャートである。
アルゴリズム80は、動作81から始まり、伝送システム(図4および図5を参照して以上で論じた伝送システムなど)の訓練可能なパラメータが初期化される。初期化は多くの形態をとることができ、例えば、初期化は、訓練可能なパラメータをランダムに(または擬似ランダムに)あるいは何らかの任意の方法で設定してもよく;代わりに、訓練可能なパラメータを事前定義された開始点に設定してもよく、または何らかのアルゴリズムに従って(例えば、信号対雑音比などの伝送システムのチャネル情報に基づいて)定義してもよい。
パラメータの初期化は、パラメータモジュール60によって実施されてもよい。パラメータモジュール60は、例えば、個々のデータシンボル(例えば、送信機のコンステレーションポイント)が送信機アルゴリズムによって出力される確率を定義する初期確率関数を設定してもよい。確率関数は離散的な関数であり、直接的に微分可能ではない。
アルゴリズムは動作82に移行し、そこでは訓練シンボルが分布関数に基づいて生成され、分布関数は微分可能である。分布関数は、確率関数の近似(例えば、微分可能な近似)であってもよい。上述したように、確率関数は、典型的には離散的で非微分的な確率関数であり、これは、機械学習プロセスでしばしば採用されるバックプロパゲーション技術(以下でさらに論じる)には寄与しない。したがって、微分可能でない確率関数は、訓練中に微分近似で置き換えられてもよい。
訓練シンボルは、ガンベルソフトマックスアルゴリズムによって生成されてもよい(以上で論じたガンベルソフトマックス再パラメータ化を使用するなど)。訓練モードにおいてシェイピングデバイス39によって生成されるような、訓練シンボルは、変調器38に提供され、変調された訓練シンボルは、チャネル34上で受信機36に送信される。
以上で論じたように、(訓練モードにおける)訓練シンボルは、変調器38によって実施される変調方式の固定コンステレーション位置に対応することができる。同様に、(通常動作モードにおける)送信シンボルは、固定コンステレーション位置に対応してもよい。
あるいは、訓練モードにおける訓練シンボル(および通常動作モードにおける送信シンボル)は、前記変調器38によって実施される変調方式の可変コンステレーション位置に対応していてもよい。さらに、伝送システムの訓練可能なパラメータは、前記変調方式のコンステレーションポイント位置を含んでいてもよい。
動作82において生成され、前記チャネル上で送信されたシンボルは、受信機36によって受信される。
動作83では、生成された訓練シンボルと、伝送システムの受信機で受信された変調された訓練シンボルとに基づいて、損失関数が生成される。損失関数は、多くの異なる形態をとることができる。例えば、損失関数は、ブロックエラーレート、ビットエラーレート、相互情報およびカテゴリクロスエントロピーのうちの1つ以上に関連していてもよい。
動作84では、損失関数を最小化するために、伝送システムのパラメータが更新され、そこで伝送システムの更新されたパラメータを生成することは、(例えば、機械学習原理を使用して例えばニューラルネットワークを更新することによって)送信機アルゴリズムのパラメータを更新することを含む。伝送システムの更新されたパラメータを生成することは、以上で論じた確率関数を訓練することを含んでもよい。したがって、例えば、ビットエラーレート(または何らかの他のエラー関数)が最小になるように確率的シェイピングを設定するために、確率関数が訓練されてもよい。また、変調器のコンステレーション位置など、他のパラメータが更新されてもよい。
訓練可能な送信機アルゴリズムを更新することに加えて、動作84で伝送システムの更新されたパラメータを生成することは、訓練可能な受信機アルゴリズムのパラメータを更新すること(それによって、伝送システムのエンド・トゥ・エンドの訓練を実施すること)を含んでもよい。
動作85では、アルゴリズム80が完了したかどうかが決定される。そうであれば、アルゴリズムは動作86で終了し;そうでなければ、アルゴリズムは、動作82から85が繰り返されるように動作82に戻る(すなわち、訓練シンボルの生成および送信、損失関数の生成および伝送システムのパラメータの更新が繰り返される)。
アルゴリズムは、ある条件に達したときに(動作85で)完了したとみなされることがある。このような条件は、様々な形態をとることができる。例えば、定義された性能レベルに到達するまで、動作82から85を繰り返してもよい。あるいは、またはそれに加えて、定義された数の反復が完了するまで、動作82から85を繰り返してもよい。
また、訓練に使用されるシンボル近似値のバッチサイズBおよび/または学習率(および、選択されるSGDバリアントの可能な他のパラメータ、例えば、ADAM、RMSProp、Momentum)は、アルゴリズム80の最適化パラメータとなり得ることに留意すべきである。
訓練が完了したら、伝送システムの訓練可能なパラメータを配備することができる。これには、伝送システムの生成された更新されたパラメータを使用して、伝送システムの訓練可能なパラメータを更新することが含まれ得る。さらに、送信機システムの訓練可能なパラメータは:送信機アルゴリズムの訓練可能なパラメータ、変調器の訓練可能なパラメータ、および受信機の訓練可能なパラメータのうちの1つ以上を含んでいてもよい。
上述の例示的な実施形態には、多くの変更が可能である。例えば、伝送システム30および50のエンド・トゥ・エンドの訓練は、強化学習の原理を活用することにより、関連するチャネルモードの知識がなくても、また、微分可能なチャネルモードを必要とせずに行うことができる。さらに、生成的敵対的ネットワークの原理を利用して、微分可能なチャネルモデルを学習することもできる。このようなモデルが学習されると、学習されたチャネルモデルを微分可能なチャネルモデルとして使用して、エンド・トゥ・エンドの学習を行うことができる。
完全を期すために、図8は、(例えば、送信機または受信機ニューラルネットワークといった)以前に説明されたモジュールの1つ以上の構成要素の概略図であり、これらは、これ以後、総称的に処理システム110と呼ばれる。処理システム110は、プロセッサ112、プロセッサの近くに結合され、RAM124およびROM122で構成されたメモリ114、ならびに、任意選択で、ハードウェアキー120およびディスプレイ128を有することもできる。処理システム110は、ネットワークへの接続のための、例えば、有線でもワイヤレスでもよいモデムといった、1つ以上のネットワークインターフェース118を含んでもよい。
プロセッサ112は、他の構成要素のそれぞれに、その動作を制御するために接続される。
メモリ114は、不揮発性メモリ、ハードディスクドライブ(HDD)、またはソリッドステートドライブ(SSD)を含んでもよい。メモリ114のROM122は、他のものの中でも、オペレーティングシステム125を記憶し、ソフトウェアアプリケーション126を記憶してもよい。メモリ114のRAM124は、データの一時的な記憶のためにプロセッサ112によって使用される。オペレーティングシステム125は、プロセッサによって実行されると、アルゴリズム80の態様を実施するコードを含んでもよい。
プロセッサ112は、任意の適切な形態であってもよい。例えば、これは、1つのマイクロコントローラ、複数のマイクロコントローラ、1つのプロセッサ、または複数のプロセッサであってもよい。
処理システム110は、スタンドアロンコンピュータ、サーバ、コンソール、またはそのネットワークであってもよい。
いくつかの実施形態において、処理システム110は、また、外部ソフトウェアアプリケーションと関連付けられてもよい。これらは、リモートサーバデバイスに記憶されたアプリケーションであってもよく、リモートサーバデバイス上で部分的または排他的に走ってもよい。これらのアプリケーションは、クラウドホスト型アプリケーションと称され得る。処理システム110は、リモートサーバデバイスに記憶されたソフトウェアアプリケーションを利用するために、リモートサーバデバイスと通信してもよい。
図9aおよび図9bは、コンピュータによって走らされると、上述の実施形態による方法を行ってもよいコンピュータ可読コードを記憶する、それぞれ、取外し可能メモリユニット165およびコンパクトディスク(CD)168である有体的媒体を示す。取外し可能メモリユニット165は、コンピュータ可読コードを記憶する内部メモリ166を有する、例えばUSBメモリスティックといった、メモリスティックであってもよい。メモリ166は、コネクタ167を介してコンピュータシステムによってアクセスされてもよい。CD168は、CD-ROMまたはDVDまたは類似のものであってもよい。有体ストレージ媒体の他の形態が、使用されてもよい。
本発明の実施形態は、ソフトウェア、ハードウェア、アプリケーションロジック、または、ソフトウェア、ハードウェア、およびアプリケーションロジックの組合せで実施されてもよい。ソフトウェア、アプリケーションロジック、および/またはハードウェアは、メモリ、または任意のコンピュータ媒体に常駐してもよい。例示的な実施形態において、アプリケーションロジック、ソフトウェア、または命令セットは、様々な従来のコンピュータ可読媒体のうちの任意の1つで維持される。本文書の文脈において、「メモリ」または「コンピュータ可読媒体」は、コンピュータなどの命令実行システム、装置、もしくはデバイスによって、または、これらとともに使用するために、命令を含めること、記憶すること、通信すること、伝搬させること、または輸送することができる任意の非一時的媒体または手段であってもよい。
適切な場合、「コンピュータ可読ストレージ媒体」、「コンピュータプログラム製品」、「有体的に具現化されたコンピュータプログラム」等、または「プロセッサ」もしくは「処理回路」等への言及は、シングル/マルチプロセッサアーキテクチャおよびシーケンサ/並列アーキテクチャなどの異なるアーキテクチャを有するコンピュータだけでなく、フィールドプログラマブルゲートアレイFPGA、特定用途向け集積回路ASIC、信号処理デバイス、および他のデバイスなどの特殊回路も包含するものと理解されたい。コンピュータプログラム、命令、コード、等への言及は、固定機能デバイス、ゲートアレイ、プログラマブルロジックデバイス、等のためのプロセッサ、または構成された設定もしくは構成設定のための命令として、ハードウェアデバイスのプログラム可能コンテンツなどの、プログラム可能プロセッサファームウェアのためのソフトウェアを表現するものと理解されたい。
本出願において使用されるように、用語「回路」は:(a)ハードウェアのみの回路での実現(アナログおよび/またはデジタル回路だけでの実現など)、ならびに、(b)(適用できる場合):(i)プロセッサの組合せ、または、(ii)サーバなどの装置に様々な機能を行わせるように一緒に機能するプロセッサ/ソフトウェアの一部(デジタルシグナルプロセッサを含む)、ソフトウェア、およびメモリ、などの回路とソフトウェア(および/またはファームウェア)の組合せ、ならびに、(c)ソフトウェアまたはファームウェアが物理的に存在しなくても、動作のためにソフトウェアまたはファームウェアを必要とするマイクロプロセッサまたはマイクロプロセッサの一部などの回路、のすべてを指す。
必要に応じて、本明細書において論じられる異なる機能は、互いに異なる順序で、および/または同時に行われてもよい。さらに、必要に応じて、上述の機能の1つ以上は任意選択であってもよく、または、組み合わされてもよい。同様に、図7の流れ図は単なる例であり、そこに描写された様々な動作は、省略されること、並び替えられること、および/または組み合わされることが行われてもよいということも理解されよう。
上述の例示的な実施形態は、純粋に例証的なものであり、本発明の範囲を限定するものではないということが理解されよう。他の変形形態および変更形態は、本明細書を読めば当業者には明らかであろう。
その上、本出願の開示は、本明細書において明示的または非明示的に開示されたいずれかの新規な特徴、もしくは、特徴のいずれかの新規な組合せ、または、そのいずれかの一般化を含むものと理解されたく、本出願、またはそこから派生するいずれかの出願の審査中、いずれかのこのような特徴、および/またはこのような特徴の組合せを含めるために、新しい請求項が策定されることもある。
本発明の様々な態様が、独立請求項の中で提示されるが、本発明の他の態様は、特許請求の範囲において明示的に提示された組合せだけではなく、独立請求項の特徴とともに、記述された実施形態および/または従属請求項からの特徴の他の組合せを含む。
上記は様々な例を記述するが、これらの記述は、限定的な意味で考えられるべきではないということも、本明細書において留意されたい。むしろ、添付の特許請求の範囲に規定されるように、本発明の範囲から逸脱することなく行われてもよい、いくつかの変形形態および変更形態がある。

Claims (27)

  1. 装置であって、
    伝送システムの訓練可能なパラメータを初期化するための手段であって、伝送システムが、送信機、チャネル、および受信機を含み、送信機が、1つ以上の入力を1つ以上のデータシンボルに変換するための送信機アルゴリズムと、前記データシンボルを変調方式に従って送信シンボルに変換するための変調器とを含み、伝送システムの訓練可能なパラメータが、個々のデータシンボルが送信機アルゴリズムによって出力される確率を定義する確率関数を含む、初期化するための手段と、
    分布関数に基づいて訓練シンボルを生成するための手段と、
    訓練モードで、変調された訓練シンボルを、チャネル上で受信機に送信するための手段と、
    生成された訓練シンボルと、伝送システムの受信機で受信された変調された訓練シンボルとに基づいて、損失関数を生成するための手段と、
    損失関数を最小化するために、伝送システムの更新されたパラメータを生成するための手段であって、伝送システムの更新されたパラメータを生成することは、送信機アルゴリズムのパラメータを更新することを含む、手段と、
    第1の条件に到達するまで、訓練シンボルを生成すること、損失関数を生成すること、および伝送システムのパラメータを更新することを繰り返すための手段と
    を含み、
    分布関数が微分可能である、装置。
  2. 分布関数が、確率関数の近似である、請求項1に記載の装置。
  3. 訓練シンボルが、ガンベルソフトマックスアルゴリズムによって生成される、請求項1または2に記載の装置。
  4. 前記送信シンボルが、前記変調器によって実施される変調方式の固定されたコンステレーション位置に対応する、請求項1から3のいずれか一項に記載の装置。
  5. 前記送信シンボルが、前記変調器によって実施される変調方式の可変コンステレーション位置に対応しており、伝送システムの訓練可能なパラメータが、前記変調方式のコンステレーションポイント位置を含む、請求項1から3のいずれか一項に記載の装置。
  6. 受信機が、動作モードで前記チャネル上で送信される前記送信シンボルを受信し、訓練モードでチャネル上で送信される前記変調された訓練シンボルを受信するように構成されている、請求項1から5のいずれか一項に記載の装置。
  7. 伝送システムの更新されたパラメータを生成することが、訓練可能な受信機アルゴリズムのパラメータを更新することを含む、請求項1から6のいずれか一項に記載の装置。
  8. 伝送システムの生成された更新されたパラメータを用いて、伝送システムの訓練可能なパラメータを更新するための手段をさらに含む、請求項1から7のいずれか一項に記載の装置。
  9. 送信機システムの訓練可能なパラメータが、送信機アルゴリズムの訓練可能なパラメータ、変調器の訓練可能なパラメータ、および受信機の訓練可能なパラメータのうちの1つ以上を含む、請求項8に記載の装置。
  10. 確率関数および分布関数が、伝送システムのチャネル情報に少なくとも部分的に依存する、請求項1から9のいずれか一項に記載の装置。
  11. 第1の条件が、定義された性能レベルを含む、請求項1から10のいずれか一項に記載の装置。
  12. 第1の条件が、定義された反復回数を含む、請求項1から11のいずれか一項に記載の装置。
  13. 前記送信機アルゴリズムが、動作モードにおいてルックアップテーブルとして実現されている、請求項1から12のいずれか一項に記載の装置。
  14. 損失関数が、ブロックエラーレート、ビットエラーレート、相互情報およびカテゴリカルクロスエントロピーのうちの1つ以上に関連する、請求項1から13のいずれか一項に記載の装置。
  15. 伝送システムの更新されたパラメータを生成するための手段が、訓練モードで使用されるシンボル近似値のバッチサイズおよび学習率のうちの1つ以上を最適化する、請求項1から14のいずれか一項に記載の装置。
  16. 伝送システムの更新されたパラメータを生成する前記手段が、確率的勾配降下法を用いて前記パラメータを更新する、請求項1から15のいずれか一項に記載の装置。
  17. 送信機が、前記送信機アルゴリズムを実施するように構成された送信機ニューラルネットワークを含む、請求項1から16のいずれか一項に記載の装置。
  18. 手段が、
    少なくとも1つのプロセッサと、
    コンピュータプログラムコードを含む少なくとも1つのメモリとを含み、
    少なくとも1つのメモリおよびコンピュータプログラムが、少なくとも1つのプロセッサを用いて、装置の性能を引き起こすように構成されている、請求項1から17のいずれか一項に記載の装置。
  19. 方法であって、
    伝送システムの訓練可能なパラメータを初期化することであって、伝送システムが、送信機、チャネル、および受信機を含み、送信機が、1つ以上の入力を1つ以上のデータシンボルに変換するための送信機アルゴリズムと、前記データシンボルを変調方式に従って送信シンボルに変換するための変調器とを含み、伝送システムの訓練可能なパラメータが、個々のデータシンボルが送信機アルゴリズムによって出力される確率を定義する確率関数を含む、ことと、
    分布関数に基づいて訓練シンボルを生成することと、
    訓練モードで、変調された訓練シンボルを、チャネル上で受信機に送信することと、
    生成された訓練シンボルと、伝送システムの受信機で受信された変調された訓練シンボルとに基づいて、損失関数を生成することと、
    損失関数を最小化するために、伝送システムの更新されたパラメータを生成し、伝送システムの更新されたパラメータを生成することは、送信機アルゴリズムのパラメータを更新することを含むことと、
    第1の条件に到達するまで、訓練シンボルを生成すること、損失関数を生成すること、および伝送システムのパラメータを更新することを繰り返すことと
    を含み、
    分布関数が微分可能である、方法。
  20. 訓練シンボルが、ガンベルソフトマックスアルゴリズムによって生成される、請求項19に記載の方法。
  21. 前記送信シンボルが、前記変調器によって実施される変調方式の固定されたコンステレーション位置に対応するか、または、
    前記送信シンボルが、前記変調器によって実施される変調方式の可変コンステレーション位置に対応し、伝送システムの訓練可能なパラメータが、前記変調方式のコンステレーションポイント位置を含む、請求項19または20に記載の方法。
  22. 伝送システムの更新されたパラメータを生成することが、訓練可能な受信機アルゴリズムのパラメータを更新することを含む、請求項19から21のいずれか一項に記載の方法。
  23. 伝送システムの生成された更新されたパラメータを用いて、伝送システムの訓練可能なパラメータを更新することをさらに含む、請求項19から22のいずれか一項に記載の方法。
  24. 送信機システムの訓練可能なパラメータが、送信機アルゴリズムの訓練可能なパラメータ、変調器の訓練可能なパラメータ、および受信機の訓練可能なパラメータのうちの1つ以上を含む、請求項23に記載の方法。
  25. 確率関数および分布関数が、伝送システムのチャネル情報に少なくとも部分的に依存する、請求項19から24のいずれか一項に記載の方法。
  26. 請求項19から25のいずれか一項に記載の方法によって作成された、ルックアップテーブルまたはアレイを含む、ワークプロダクト。
  27. コンピュータプログラムであって、装置に少なくとも以下のこと、
    伝送システムの訓練可能なパラメータを初期化することであって、伝送システムが、送信機、チャネル、および受信機を含み、送信機が、1つ以上の入力を1つ以上のデータシンボルに変換するための送信機アルゴリズムと、前記データシンボルを変調方式に従って送信シンボルに変換するための変調器とを含み、伝送システムの訓練可能なパラメータが、個々のデータシンボルが送信機アルゴリズムによって出力される確率を定義する確率関数を含む、ことと、
    分布関数に基づいて訓練シンボルを生成することと、
    訓練モードで、変調されたシンボルを、チャネル上で受信機に送信することと、
    生成されたシンボルと、伝送システムの受信機で受信された変調されたシンボルとに基づいて、損失関数を生成することと、
    損失関数を最小化するために、伝送システムの更新されたパラメータを生成し、伝送システムの更新されたパラメータを生成することは、送信機アルゴリズムのパラメータを更新することを含むことと、
    第1の条件に到達するまで、シンボル近似値を生成すること、損失関数を生成すること、および伝送システムのパラメータを更新することを繰り返すことと
    を行わせるための命令を含み、
    分布関数が微分可能である、コンピュータプログラム。
JP2021570832A 2019-05-30 2019-05-30 通信システムにおける学習 Active JP7307199B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2019/064146 WO2020239232A1 (en) 2019-05-30 2019-05-30 Learning in communication systems

Publications (2)

Publication Number Publication Date
JP2022534603A true JP2022534603A (ja) 2022-08-02
JP7307199B2 JP7307199B2 (ja) 2023-07-11

Family

ID=66793959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021570832A Active JP7307199B2 (ja) 2019-05-30 2019-05-30 通信システムにおける学習

Country Status (6)

Country Link
US (1) US11750436B2 (ja)
EP (1) EP3977655B1 (ja)
JP (1) JP7307199B2 (ja)
KR (1) KR102620551B1 (ja)
CN (1) CN113906704A (ja)
WO (1) WO2020239232A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3824606A1 (en) * 2018-07-20 2021-05-26 Nokia Technologies Oy Learning in communication systems by updating of parameters in a receiving algorithm
EP3852326B1 (en) 2020-01-15 2022-06-29 Nokia Technologies Oy Transmitter
WO2021151477A1 (en) * 2020-01-29 2021-08-05 Nokia Technologies Oy A receiver for a communication system
CN113193925B (zh) * 2021-02-09 2023-08-11 中国人民解放军战略支援部队信息工程大学 一种通信***的优化处理方法、装置及电子设备
WO2023138763A1 (en) * 2022-01-19 2023-07-27 Nokia Technologies Oy Signal transmission based on transformed signal constellation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019080988A1 (en) * 2017-10-23 2019-05-02 Nokia Technologies Oy END-TO-END LEARNING IN COMMUNICATION SYSTEMS
WO2019080987A1 (en) * 2017-10-23 2019-05-02 Nokia Technologies Oy END-TO-END LEARNING IN COMMUNICATION SYSTEMS

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001069046A (ja) * 1999-08-30 2001-03-16 Fujitsu Ltd 送受信システムおよび受信装置
US20090310707A1 (en) * 2008-06-17 2009-12-17 Jung-Fu Cheng Transmitter and method for transmitting soft pilot symbols in a digital communication system
CN108615044A (zh) * 2016-12-12 2018-10-02 腾讯科技(深圳)有限公司 一种分类模型训练的方法、数据分类的方法及装置
CN106951783B (zh) * 2017-03-31 2021-06-01 国家电网公司 一种基于深度神经网络的伪装入侵检测方法及装置
KR102563752B1 (ko) * 2017-09-29 2023-08-04 삼성전자주식회사 뉴럴 네트워크를 위한 트레이닝 방법, 뉴럴 네트워크를 이용한 인식 방법 및 그 장치들
US10439287B2 (en) * 2017-12-21 2019-10-08 Nxgen Partners Ip, Llc Full duplex using OAM
CN112236782A (zh) * 2018-04-03 2021-01-15 诺基亚技术有限公司 通信***中的端到端学习
CN109474352B (zh) * 2018-12-24 2021-07-06 三亚哈尔滨工程大学南海创新发展基地 一种基于深度学习的水声正交频分复用通信方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019080988A1 (en) * 2017-10-23 2019-05-02 Nokia Technologies Oy END-TO-END LEARNING IN COMMUNICATION SYSTEMS
WO2019080987A1 (en) * 2017-10-23 2019-05-02 Nokia Technologies Oy END-TO-END LEARNING IN COMMUNICATION SYSTEMS

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ERIC JANG ET AL.: "CATEGORICAL REPARAMETERIZATION WITH GUMBEL-SOFTMAX", ARXIV MACHINE LEARNING (STAT.ML), JPN6022052889, 3 November 2016 (2016-11-03), ISSN: 0004943614 *
FAYCAL AIT AOUDIA ET AL.: "End-to-End Learning of Communications Systems Without a Channel Model", 2018 52ND ASILOMAR CONFERENCE ON SIGNALS, SYSTEMS, AND COMPUTERS, JPN6022052890, 21 February 2019 (2019-02-21), pages 298 - 303, ISSN: 0004943613 *

Also Published As

Publication number Publication date
KR102620551B1 (ko) 2024-01-03
CN113906704A (zh) 2022-01-07
US11750436B2 (en) 2023-09-05
WO2020239232A1 (en) 2020-12-03
US20220247614A1 (en) 2022-08-04
KR20220010565A (ko) 2022-01-25
EP3977655B1 (en) 2023-04-26
EP3977655A1 (en) 2022-04-06
JP7307199B2 (ja) 2023-07-11

Similar Documents

Publication Publication Date Title
JP7307199B2 (ja) 通信システムにおける学習
US11575547B2 (en) Data transmission network configuration
O’Shea et al. Approximating the void: Learning stochastic channel models from observation with variational generative adversarial networks
O'Shea et al. Physical layer communications system design over-the-air using adversarial networks
Stark et al. Joint learning of geometric and probabilistic constellation shaping
US11082264B2 (en) Learning in communication systems
US11556799B2 (en) Channel modelling in a data transmission system
CN111512323A (zh) 自适应无线通信的学习与部署
EP3418821B1 (en) Method and device for configuring a data transmission system
KR102494797B1 (ko) 통신 시스템들에서의 단-대-단 학습
WO2019080988A1 (en) END-TO-END LEARNING IN COMMUNICATION SYSTEMS
Morocho-Cayamcela et al. Accelerating wireless channel autoencoders for short coherence-time communications
CN113748626A (zh) 通信***中的迭代检测
CN115804068A (zh) 使用狄利克雷过程优化通信信道的容量的方法、***及计算机程序
EP4173243A1 (en) Training in communication systems
CN114026827A (zh) 发送器算法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221213

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230629

R150 Certificate of patent or registration of utility model

Ref document number: 7307199

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150