CN110892422A - 对光子储层计算***的训练 - Google Patents

对光子储层计算***的训练 Download PDF

Info

Publication number
CN110892422A
CN110892422A CN201880036058.8A CN201880036058A CN110892422A CN 110892422 A CN110892422 A CN 110892422A CN 201880036058 A CN201880036058 A CN 201880036058A CN 110892422 A CN110892422 A CN 110892422A
Authority
CN
China
Prior art keywords
reservoir
computing system
signal
weighting
optical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880036058.8A
Other languages
English (en)
Other versions
CN110892422B (zh
Inventor
P·比安斯特曼
A·卡通巴
J·海瓦尔特
J·当布尔
M·弗赖伯格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universiteit Gent
Interuniversitair Microelektronica Centrum vzw IMEC
Original Assignee
Universiteit Gent
Interuniversitair Microelektronica Centrum vzw IMEC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universiteit Gent, Interuniversitair Microelektronica Centrum vzw IMEC filed Critical Universiteit Gent
Publication of CN110892422A publication Critical patent/CN110892422A/zh
Application granted granted Critical
Publication of CN110892422B publication Critical patent/CN110892422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G02OPTICS
    • G02FOPTICAL DEVICES OR ARRANGEMENTS FOR THE CONTROL OF LIGHT BY MODIFICATION OF THE OPTICAL PROPERTIES OF THE MEDIA OF THE ELEMENTS INVOLVED THEREIN; NON-LINEAR OPTICS; FREQUENCY-CHANGING OF LIGHT; OPTICAL LOGIC ELEMENTS; OPTICAL ANALOGUE/DIGITAL CONVERTERS
    • G02F3/00Optical logic elements; Optical bistable devices
    • G02F3/02Optical bistable devices
    • G02F3/028Optical bistable devices based on self electro-optic effect devices [SEED]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/067Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using optical means
    • G06N3/0675Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using optical means using electro-optical, acousto-optical or opto-electronic means
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B6/00Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
    • G02B6/10Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type
    • G02B6/12Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type of the integrated circuit kind
    • G02B6/122Basic optical elements, e.g. light-guiding paths
    • G02B6/1228Tapered waveguides, e.g. integrated spot-size transformers
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B6/00Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
    • G02B6/10Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type
    • G02B6/12Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type of the integrated circuit kind
    • G02B6/122Basic optical elements, e.g. light-guiding paths
    • G02B6/125Bends, branchings or intersections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Optics & Photonics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Neurology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Nonlinear Science (AREA)
  • Power Engineering (AREA)
  • Optical Integrated Circuits (AREA)
  • Optical Modulation, Optical Deflection, Nonlinear Optics, Optical Demodulation, Optical Logic Elements (AREA)

Abstract

描述了一种光子储层计算***。该***被配置用于:传播至少一个光学信号以在输出通道中产生所得辐射信号。该光子储层计算***进一步包括:用于对来自输出通道的信号进行加权的加权元件,以及用于光学地检测来自输出通道的信号的至少一个光学检测器。该***被适配用于:通过光学检测器的输出来估计来自输出通道的信号。

Description

对光子储层计算***的训练
发明领域
本发明涉及光学储层计算的领域。更具体而言,本发明涉及用于训练和使用具有光学读出的光学光子储层计算***的方法和***。
发明背景
机器学习领域旨在教导计算机***如何对先前未见的数据执行复杂的任务,而无需对其进行明确编程。此类任务的示例是分类、回归或模式识别。可用机器学习技术的库是全面的。
对于每种应用必须选择最恰适的技术,这取决于该应用的特定要求。一类重要的技术是所谓的人工神经网络,它由互连神经元的网络组成。该理念基于人脑结构以及人脑如何处理信息。神经网络的一个子类(被称为递归神经网络(RNN))通过在神经元之间创建定向互连循环而将存储的概念引入网络。由于训练这些网络相当困难,因此提出了储层计算(RC)作为简化RNN训练的方法。然而,最近RC已作为解决各种复杂问题的计算范例而获得普及。已表明,RC在例如语音识别和时间序列预测上表现非常良好。
RC实现通常是基于软件的并依赖串行算法来对整个网络的信号传播和操纵进行仿真。该工作流的串行特征限制了速度和功率效率:对大型储层或大量输入序列进行仿真既是时间密集的又非常消耗功率。利用储层的固有并行性质的想法触发了对可行硬件实现技术的兴趣。迄今已提出了硬件中各种各样的RC实现。一种有趣的候选技术必然是光子领域,其导致光子储层计算(PRC)的概念。光作为信息载体的最重要优点在于光学信号非常高的载波频率、其固有并行性以及能够以低损耗在介电材料上携带光学信号的事实。使用光学信号因此实现更快(并且强并行的)信息处理并且有希望比电子实现的功耗要低。为了节省功率,K.Vandoorne等人在自然通信(Nature Communications)5(2014)3541中给出了无源PRC实现,该无源PRC实现利用光栅耦合器、MMI和延迟。可惜的是,这些组件在储层中引入了严重损耗,这限制了储层的大小(即,神经元数目)。更具体而言,由于涉及Y划分器/组合器的网络结构,每次两条路径在节点中汇聚,就因基础物理学而损耗平均50%的光,这些光被辐射出去并且因此损耗,如图2中所示。网络越大,就遇到越多这些组合器,这意味着信息快速衰减并且不能到达网络的另一端。例如,在如由Vandoorne等人在Nat.Commun.(自然通信)5(2014)3541中描述的***中,即使网络包含20个节点,也仅能够测量这些节点中的12个节点,因为对于其他节点,功率已下降超过本底噪声。
由于储层可以执行的任务的复杂度取决于组成该储层的神经元数目,这些损耗也限制了可以执行的任务的复杂度,并且因此仍有改进的空间。
发明概述
本发明的各实施例的目的是提供具有完全光学读出的高效光子储层计算方法和***。
本发明的各实施例的优点在于***允许升级到大量的节点,这是因为可以获取高效处理。
根据本发明的各实施例的优点在于,可以利用不需要确切知晓***状态、而是能够通过使用特定的训练样本多次以高效方式重构***状态的训练方法。
本发明的各实施例的优点在于提供了使用极少功率的读出结构,从而得到高效***。
本发明的各实施例的优点在于pn结仅使用非常小的功率,即,对应于漏泄电流的功率。
本发明的各实施例的优点在于,所需要的光电二极管数目可以较小或者甚至限制于一个,从而得到包括有限数目组件的***。
根据本发明的各实施例的优点在于可以利用公知的硅光子技术,从而得到用于制造***的公知处理方法。
本发明涉及一种光子储层计算***,该光子储层计算***包括多个输出通道并且被配置用于传播至少一个光学信号以产生所得辐射信号,该光子储层计算***进一步包括:
用于对来自输出通道的信号进行加权的加权元件,以及
用于进行光学检测的至少一个光学检测器,
该***被适配用于:通过该至少一个光学检测器的输出来估计来自输出通道的信号。
在一些实施例中,该光子储层计算***可以是无源光子储层计算***,但是在储层中具有有源元件的***也在所要求保护的发明的范围内。
在一些实施例中,该光子储层计算***可包括经由光学互连件互连的多个离散节点,以供在各节点之间传播至少一个光学信号以产生所得辐射信号。在其他实施例中,该光子储层计算***可基于混沌储层。
本发明的各实施例的优点在于获取高效的读出,从而允许对光子储层计算***的更高效使用。
该***可包括训练模块,该训练模块用于确定***中不同输出通道的功率以及***中不同通道之间的相位差。
训练模块可被配置用于:在训练数据上迭代若干次,同时根据预定模式经由加权元件设置权重。
该***可被适配用于:通过在训练数据上进行最多3F-2次迭代来估计经加权所得辐射信号的幅度和相位,其中F是输出通道的数目。
加权元件可被适配用于对所得辐射信号进行加权,并且该至少一个光学检测器可被适配用于:在信号已在光学域中被加权之后光学地检测经加权所得辐射信号的组合,该***被适配用于估计经加权所得辐射信号。
在一些实施例中,光学检测器可以是大面积光学检测器,但各实施例不限于此。
光学检测器可被配置用于对经加权所得辐射信号执行非线性操作。
执行非线性操作可包括:在对经加权所得辐射信号求和之前取该经加权所得辐射信号的幂。
加权元件可包括用于对所得辐射信号进行加权的反向偏置的pn结。
该至少一个光学检测器可包括用于在每个输出通道中光学地检测所得辐射信号的多个光学检测器,并且加权元件被适配用于在电子域中对光学地检测到的所得信号进行加权。该***可被适配用于:对在电子域中加权的光学地检测到的所得信号进行求和。
训练模块可被配置用于获取训练数据,其中加权系数通过相继进行以下操作来选择:将一个加权系数选择为等于1(任意单位)、同时将所有其他加权系数设置为0,以及将两个加权系数选择为非零、同时将所有其他加权系数设置为0。
在一些实施例中,该***可包括经由光学互连件互连的多个离散节点,以供在各节点之间传播至少一个光学信号以产生所得辐射信号。
该***可包括至少一个多模结,其被配置用于使用锥形部分连接至少三个多模波导,其中该锥形部分不是完全绝热的。
如上所述的根据各实施例的***还可包括光子储层计算***的特征:该光子储层计算***包括基于光学多模波导的结构,该结构包括多个离散节点以及在各节点之间的多个无源多模波导互连件以供在各节点之间传播至少一个光子信号,其中每个离散节点被适配用于在其连接到的无源多模波导互连件上无源地中继该至少一个光子波,其中该基于光学波导的结构包括至少一个多模结,其被配置用于使用锥形部分连接至少三个多模波导,其中该锥形部分不是完全绝热的。
在连接有三个波导的情形中,多模结可被称为多模Y结。本发明的各实施例的优点在于,由于所涉及波导的多模态,因此在波导结构中以较高阶模式转换的一部分辐射仍然在该波导结构中被引导并且因此未丢失。本发明的各实施例的优点在于获取具有更大自由度(例如是否个体地读出每种模式)的更丰富***。这可以得到更好的分类性能。本发明的各实施例的优点在于,如果锥形部分提供朝向输出波导的不太平滑的演化,则并非所有功率将保留在相同模式内,而是可以将功率散射到所支持的(引导)模式。以此方式,辐射以及对应功率未被散射出该结构。
本发明的各实施例的优点在于提供紧凑的解决方案。
本发明的各实施例的优点在于提供显示出大的拓扑自由度以及良好速度的***。
本发明的各实施例的优点在于提供可以大规模实现的高效***。
当在本发明的各实施例中提及多个节点时,指的是至少2个节点,有利地至少3个节点,更有利地至少5个节点。
节点可被配置用于:经由多模结在光子储层计算***中执行该多次划分和/或组合,这些多模结被配置用于使用非完全绝热的锥形部分连接至少三个多模波导。
本发明的各实施例的优点在于可以获取更高的效率。此外要注意,小的效率增加得到总体大的增益,这是由于波的组合和划分发生多次,即,在根据本发明的各实施例的光学计算储层中通常使用一系列划分器和或组合器。
多模结可以是用于连接三个多模波导的多模Y结。
波导可具有例如至少500nm的宽度,有利地至少1000nm。波导的宽度可因变于所使用的波长来选择,以使得这些波导支持引导多种模式。本发明的各实施例的优点在于,通过使用更宽的波导,支持多种引导模式。
锥形长度可在2μm至2.5μm之间。锥形长度可因变于所使用的波长来选择,以使得这些波导支持引导多种模式。
可以调谐绝热性的其他参数例如是锥形宽度以及在划分器的情形中传出波导之间的角度或在组合器的情形中传入波导之间的角度。
基于光学波导的结构可被配置用于在光学域中对所得辐射信号执行加权,并且其中,该***被配置用于使用多模Y结来组合经加权信号,这些多模Y结被配置用于使用锥形部分连接三个波导,其中该锥形部分不是完全绝热的。本发明的各实施例的优点在于提供了使用极少功率的读出结构,从而得到高效***。
然而,根据本发明的各实施例的***不限于此,并且还可以例如在单模储层、其他光子储层等等中实现。
在一些实施例中,该***可包括混沌储层。
要注意,训练模块和加权***以及对应方法不限于光子储层计算***,而是可以被更宽泛地应用于诸如基于光子波的计算***之类的光子计算***。
替换地,连续相位调谐也可以在训练模块中用于提取加权系数。
该***可包括硅光子储层。根据本发明的各实施例的优点在于可以利用公知的硅光子技术,从而得到用于制造***的公知处理方法。在所附独立和从属权利要求中阐述了本发明的特定和优选方面。来自从属权利要求的特征可以与独立权利要求的特征以及其他从属权利要求的特征恰适地组合,而不仅仅是如在权利要求中明确阐述的。
参考下文描述的(诸)实施例,本发明的这些和其他方面将变得显而易见并得以阐明。
附图简述
图1解说了如在根据本发明的各实施例中可以使用的储层计算***和用于训练输出的附连模块。
图2是用作划分器和组合器的不同Y结的示意图,从而解说了现有技术以及根据本发明的各实施例的特征。
图3解说了根据本发明的实施例的储层计算***效率的波长依赖性。
图4解说了根据本发明的实施例的针对不同节点多模与单模相比减少的损耗。
图5示出了根据本发明的各实施例的具有完全光学读出的储层计算***的示意表示。在所示的实施例中,每个光学输出信号由实现权重的光学调制器(OM)来调制。光学输出随后被发送到光电二极管,在该处所有信号被求和并且随后被转换为最终电输出信号。
图6解说了根据本发明的实施例的针对使用复值岭回归的基线办法的因变于输入信号比特率的比特误差率。在所示的示例中,分类器已被训练成对4×4光子涡流(swirl)储层执行3比特报头识别(模式101)。在10个不同储层上对结果取平均并且最小可检测误差率是10-3
图7解说了根据本发明的实施例的针对黑盒办法、CMA-ES的因变于输入信号比特率的比特误差率。示出了基线办法以供比较。在所示的示例中,分类器已被训练成对4×4光子涡流储层执行3比特报头识别(模式101)。在10个不同储层上对结果取平均并且最小可检测误差率是10-3
图8示出了根据本发明的实施例的针对CMA-ES的因变于在训练数据上的迭代的比特误差率。在所示的示例中,分类器已被训练成对4×4光子涡流储层执行3比特报头识别(模式101)。在10个不同储层上对结果取平均并且最小可检测误差率是10-3
图9示出了根据本发明的实施例的针对3比特报头识别任务(模式101)的比特误差率,该比特误差率因变于添加到储层波导的均匀分布相位噪声的增大范围。读出已使用在4×4光子涡流上的复值岭回归进行训练。所示数据在100个每数据点随机噪声实例上取平均,这已被应用于10个不同的初始储层。最小可检测比特误差率是10-3
图10示出了如可以在本发明的实施例中使用的模观察规程,其中一个权重被设置为1并且所有其余权重被设置为0,籍此可观察输出是对应储层状态的模的平方。
图11示出了如可以在本发明的实施例中使用的相位估计规程,其中两个权重被设置为1,而其余权重被设置为0。这在输出端获取经求和状态的幂,从而允许经由和幂(sumpower)与例如使用图10中所示技术获取的个体状态的幂的关系来计算突出显示通道的状态之间的自变量(相位角)。
图12示出了根据本发明的实施例的针对非线性反演的因变于输入信号比特率的比特误差率。示出了基线和CMA-ES办法以供比较。在所示的示例中,分类器已被训练成对4×4光子涡流储层执行3比特报头识别(模式101)。在10个不同储层上对结果取平均并且最小可检测误差率是10-3
权利要求中的任何附图标记不应被解释为限制范围。
在不同的附图中,相同的附图标记指代相同或相似的元件。
解说性实施例的详细描述
将关于特定实施例并且参照某些附图来描述本发明,但是本发明不限于此,而仅由权利要求书来限定。所描述的附图仅是示意性且非限制性的。在附图中,出于解说性目的,可将要素中的一些尺寸放大且不按比例绘制。尺寸和相对尺寸不对应于对本发明实践的实际缩减。
此外,说明书中和权利要求中的术语第一、第二等等用于在类似的要素之间进行区分,并且不一定用于在时间上、空间上、以排名或任何其他方式来描述顺序。应当理解,如此使用的术语在适当的情况下是可互换的并且本文中所描述的本发明的实施例与本文中所描述或图示的相比能够以其他顺序来进行操作。
另外,说明书和权利要求书中的术语顶部、下方等等被用于描述性目的而不一定用于描述相对位置。应当理解,如此使用的术语在合适情况下是互换的,并且本文中所描述的本发明的实施例能够以除了本文描述或图示的取向的之外的其他取向来操作。
应当注意,权利要求中使用的术语“包括”不应被解释为限定于其后列出的装置;它并不排除其他要素或步骤。因此,该术语应被解释为指定如所提到的所陈述的特征、整数、步骤或组件的存在,但不排除一个或多个其他特征、整数、步骤或组件、或其群组的存在或添加。因此,表述“一种包括装置A和B的设备”的范围不应当被限制于仅由组件A和B构成的设备。这意味着对于本发明,该设备的仅有的相关组件是A和B。
贯穿本说明书对“一个实施例”或“实施例”的引用意指结合该实施例描述的特定的特征、结构或特性被包括在本发明的至少一个实施例中。因此,短语“在一个实施例中”或“在实施例中”贯穿本说明书在各个地方的出现并不一定全部指代同一实施例,而是可以指代同一实施例。此外,在一个或多个实施例中,如从本公开中对本领域普通技术人员将是显而易见的,特定的特征、结构或特性可以用任何合适的方式进行组合。
类似地,应当领会,在本发明的示例性实施例的描述中,出于精简本公开和辅助对各个发明性方面中的一个或多个的理解的目的,本发明的各个特征有时被一起编组在单个实施例、附图或其描述中。然而,这种公开的方法不应被解释为反映所要求保护的本发明需要比每项权利要求中所明确记载的更多特征的意图。相反,如所附权利要求反映的,各发明性方面存在比单个前述公开的实施例的全部特征更少的特征。因此,详细描述所附的权利要求由此被明确并入本详细描述中,其中每一项权利要求本身代表本发明的单独的实施例。
此外,如将由本领域技术人员所理解的,尽管本文中所描述的一些实施例包括其他实施例中所包括的一些特征但不包括其他实施例中所包括的其他特征,但是不同实施例的特征的组合旨在落在本发明的范围内,并且形成不同实施例。例如,在所附的权利要求书中,所要求保护的实施例中的任何实施例均可以任何组合来使用。
在本文中所提供的描述中,阐述了众多具体细节。然而要理解,可以在没有这些具体细节的情况下实践本发明的实施例。在其他实例中,未详细示出公知的方法、结构和技术,以免混淆对本描述的理解。
当在本发明的各实施例中提及Y结时,指的是三端口器件,该三端口器件被设计成:将第一端口(输入端口)的导波对称地或非对称地划分成其他两个端口(输出端口)的导波,或者将两个端口(输入端口)的导波组合成第三端口(输出端口)的导波。此外,单模Y结被称为上述Y结,其中输入和输出端口由仅引导包括一个单模的波的波导制成。相比之下,多模Y结被称为上述Y结,其中至少一个端口包含支持包括不仅一种模式的导波的波导。然而要注意,在本发明的其他实施例中,储层可以基于混沌储层,并且因此本发明还涉及没有Y结的实施例。
当在本发明的各实施例中提及非完全绝热平滑锥形或锥形部分时,指的是在长度尺度上改变其形状的与绝热理论不兼容的平滑锥形结构。这意味着,波导模式被显著混合,例如,被限定在接地状态(基模)的大量能量被转换成较高阶模式的激励,反之亦然。该过程可包括辐射损耗并且通常具有比绝热锥形部分低的转换效率,从而产生接近100%(例如,大于98%)的单模转换效率。非完全锥形因此可具有小于98%(例如,小于95%)的转换效率。然而要注意,在本发明的其他实施例中,储层可以基于混沌储层,并且因此本发明还涉及没有锥形部分的实施例。
在第一方面,本发明涉及一种光子储层计算***。该光子储层计算***被适配用于:传播至少一个光学信号以在输出通道中产生所得辐射信号。在一些实施例中,储层计算***可包括经由光学互连件互连的多个离散节点,以供在各节点之间传播至少一个光学信号来产生所得辐射信号。在其他实施例中,储层可以是混沌储层,而不存在离散节点。根据本发明的各实施例,该光子储层计算***进一步包括:用于对来自输出通道的信号进行加权的加权元件,以及用于光学地检测来自输出通道的信号的至少一个光学检测器。该***被适配用于:通过该至少一个光学检测器的输出来估计来自输出通道的信号。在一些实施例中,加权元件被适配用于对所得辐射信号进行加权,并且该至少一个光学检测器被适配用于:在信号已在光学域中被加权之后光学地检测经加权所得辐射信号的组合。以此方式,该***被适配用于提供完全光学读出。后者是有利的,因为它提供非常高效的读出并且不需要首先将信号转换到电子域中。根据本发明的各实施例的***被适配用于:通过大面积光学检测器的输出来估计经加权的所得辐射信号。
在一些其他实施例中,该至少一个光学检测器包括用于在每个输出通道中光学地检测所得辐射信号的多个光学检测器,并且加权元件被适配用于在电子域中对光学地检测到的所得信号进行加权。
在一些实施例中,该光子储层计算***包括训练模块,该训练模块用于确定***中不同输出通道的功率以及***中不同通道之间的相位差。该***可被适配用于:通过在训练数据上进行最多3F-2次迭代来估计经加权所得辐射信号的幅度和相位,其中F是输出通道的数目。
在一些实施例中,训练模块还被配置用于:在训练数据上迭代若干次,同时根据预定模式经由加权元件设置权重。
在一些实施例中,光学检测器可被配置用于对经加权所得辐射信号执行非线性操作。执行非线性操作可包括:在对经加权所得辐射信号进行求和之前取该经加权所得辐射信号的幂。
在一些实施例中,加权元件可包括用于对所得辐射信号进行加权的反向偏置的pn结。在其他实施例中,加权可发生在检测器之后的模拟电子器件中。
在一些实施例中,训练模块可被配置用于获取训练数据,其中加权系数通过相继进行以下操作来选择:将一个加权系数选择为等于1(任意单位),同时将所有其他加权系数设置为0,从而允许确定强度;以及将两个加权系数选择为非零,同时将所有其他加权系数设置为0,从而在与强度测量相结合时允许确定相位。
在一些实施例中,训练模块和加权***还可与光子储层计算***的特征相组合,该光子储层计算***包括多个离散节点和各节点之间的多个无源多模波导互连件以供在各节点之间传播该至少一个光子信号。进一步的特征可对应于下面描述的***特征。多个节点可以指至少2个节点,例如,至少3个节点。每个离散节点被适配用于:在连接到的无源波导互连件上无源地中继该至少一个光子信号。在一个实施例中,基于光学波导的结构可包括至少一个多模结,其被配置用于使用锥形部分连接至少三个波导,其中该锥形部分不是完全绝热的。在三个波导之间的连接的情形中,结可以是Y结。更一般而言,结可被称为N×M耦合器,其中N和M彼此不同。取决于是输入数目还是输出数目更大,耦合器可被称为组合器或划分器。
通过解说的方式,本发明的各实施例不限于此,将参照图1和图2进一步描述标准和可任选特征,图1示出了储层计算***1的示意图,图2示出了如用于在储层1内部的节点12位置处划分和组合光信号的Y结31、32、33的通用形状。虽然在本描述中将使用Y结来解释本发明的各实施例的特征和优点,但本发明不限于此,由此还可使用更通用的N×M耦合器,如上面还指示的。
图1展示了由输入信号携带的信息如何被储层***1处理,以及储层***1的读出机制21作为训练模块2的一部分用于推导出输出信号22。
图1中所示示例的储层计算***1被构想为经由多模波导13互连的一组节点12。多模波导13可以按任何合适的方式来制造。在当前示例中,多模波导13被实现在硅芯片上并且通常宽度可大于500nm,理想情况下,如果这些多模波导13在1300nm左右的波长下操作,则它们的宽度大于或等于1000nm。波导的宽度通常可以是确定波导的多模行为的因素之一。要注意,多模波导可在任何适当的材料平台中被实现为诸如例如半导体波导(诸如Si、SiN)、聚合物波导(如SU8)、玻璃基板等等。
储层计算***的节点12可被布置在规则网格上,如图1中所示,但各实施例不限于此,并且还可使用不规则网格。储层***1包含的节点12越多,该储层***1记住过去信号的容量以及因此其计算和预测能力就越好。在多模波导13内部作为框选引导模式穿过储层计算***1的光学信号遇到多个节点12,这些节点12重复地重新组合、划分光学信号并且因此将它们重定向到新的方向。现有技术***中重复的组合动作的缺点在于信号在跨越若干个节点12之后经受的固有损耗,从而快速降至本底噪声水平,在该处由信号携带的所有信息丢失。在输入功率不完全同相的情况下,当单模50/50划分器31用单模321中的相干光反向操作以用作信号组合器32时,该损耗是该单模50/50划分器31的固有特性。图2的上方两幅图中解说了单模划分器和单模组合器的示例。在现有技术***中平均50%的信号功率在这种通路中损耗,因为一部分经组合信号在输出端构成较高模322,这是未引导的并且因此辐射掉了。本发明的各实施例通过引入多模结33作为位于储层***1的节点12处的划分器和/或组合器,以使得发生的损耗减少来改善总体储层***性能。后者将在下文参照图2进一步描述。
在图2中,下方的图解说了多模组合器的示例,其中示出了多模信号的组合。结33不是完全绝热的,并且输入和输出波导也是多模的。这些除了基本波导模式331、334之外还支持一个或多个更高阶模332、333。
再次参照图1,储层计算***1接收一个或多个辐射输入信号11,这些信号11随时间变化并将经编码信息传达到器件外部。辐射输入信号11可以是经调制的自由空间耦合光波或经调制的光纤耦合光学模。所有辐射输入信号11被注入到一个或多个储层节点12中,例如通过多个平面外光栅耦合器元件或单个平面外光栅耦合元件继以划分传入辐射信号11的一系列Y结33。输入信号在高维特征空间中表示,该高维特征空间被给出为在一个或多个储层节点12处存在并提取的场的集合14。当储层计算***1的状态随时间演化时,原始输入信号11在整个储层***1上扩展,从而经历多次组合和划分事件。鉴于在这些事件中的每次事件之后保留在储层1内部的总光学信号功率量增加,结合多模波导使用多模Y结33是有利的。本发明的各实施例的优点在于,即使储层1中的远程节点121也可以变得可测量,而它们在先前储层***中由于沿这些路径行进的辐射信号经历的过强损耗而不可测量。经提取的光学信号14被路由到训练模块2中并被训练模块2修改。
根据本发明的各实施例,***在读出级21包括加权方案,其完全在光学域中实现。这具有降低假如读出机制21是完全电子的情况下该读出机制21将招致的复杂度和成本的优点。
经提取的光学信号14中的一个或多个光学信号通过例如首先衰减或放大信号幅度来乘以复权重。在一个特定示例中,衰减信号幅度是通过解谐微环腔211的降低的透射率并通过随后在线性移相器区域212中施加相移来获取的。在两种情形中,多模波导的有效折射率可以根据由反向偏置的pn结内部的场诱发的折射率变化来改变。反向偏置的pn结具有相对于基于加热器的相移解决方案低得多的静态功耗的优点。加热器连续汲取电流,而反向偏置的pn结仅经受微小的漏泄电流。有利地,所有经加权读出信号213被组合成单个输出信号22。类似于在储层***1中使用多模Y结33,该组合步骤可以通过例如多模Y结33或锥形部分的级联214发生以减少由于辐射模式引起的损耗。如果读出级21的加权方案是完全电子的,则组合步骤214也可以是完全电子的(例如,电子扇入),但其他实现可以是优选的。在问题的期望输出需要在电子域中表示的情形中,输出信号22应当被转换到电子域中。这可以通过光电二极管来实现,该光电二极管覆盖组合级214末端的最后的宽多模波导。同时,光电二极管将实现将电磁场强度映射为功率值的非线性信号变换。对于储层计算***的某些应用而言需要非线性行为。
如上面提到的,上述示例参照基于多模波导的储层,但可以经必要的修改应用于使用混沌储层的本发明的各实施例。
传统的储层计算训练办法假定从储层***1提取的所有光学信号14是可观察且已知的。本发明的各实施例避免了该附加要求,从而得到仅具有一个需要观察的输出信号22的简化训练模块2。这是通过间接确定经提取储层状态14来实现的,在训练序列11被多次呈现给储层***1的情况下这是可能的。每次重复训练样本11,复权重可以如下所述地改变,从而解说应用权重的有利示例,各实施例不限于此。更新可以是例如在相同输入信号被呈现几次(例如,3次)之后进行的更新。
通过使所有幅度控制权重211尽可能接近零来关闭这些权重。随后激活单个幅度控制权重211(例如,第一个),并使其尽可能接近1。输出信号22随后与对应的读出辐射信号14直接相关,该关系是光检测器的非线性平方范数运算,该光检测器将电场强度转换成其对应的功率值(如果必要的话,可以通过校准考虑检测器的非理想传递特性)。随后在除了第二加权元素之外的所有加权元素被关闭的情况下重复该规程,依此类推。
在第二步骤中,所有经提取的光学储层输出信号14之间的相对相位差通过一次选择这些信号中的两个信号并使其打开、而使其余信号处于关闭或零状态来确定。由光检测器输出22给出的功率值被记录。连同对经提取储层信号14的幅度值的先前提取,该第二测量步骤允许提取两个有源储层输出信号14之间的相对相位差。最后,为了能够求解π相移,执行在相同两个输入通道中具有两个不同非零输入信号的第三测量。用第二对权重来重复这三次测量的步骤,依此类推。
确定储层输出状态14的该规程具有比许多暴力黑盒优化技术更快的优点。替代数百或数千的迭代步骤,前述方法仅需要O(3n)次重复,其中n是经提取储层状态14的数目。
如上面提到的,该规程经过主表征步骤,该步骤对光检测器的非线性响应量以及pn结的电压相移曲线进行量化。
通过解说的方式,讨论了本发明的实施例的示例,在使用多模Y结的优化来解说的本示例中,示出了可以与根据本发明的各实施例的计算储层联用的***的标准和可任选特征和优点,但各实施例不限于此。在本示例中,对于标准设计套件Y结(Ipkiss),多模Y结的优化基于以输入光学功率的百分比损耗来测量的性能结果,该损耗是波导宽度和锥形长度的函数。这是通过使用Lumerical MODE solutions软件进行数值仿真以在Y结器件用作划分器或组合器时对该Y结器件响应进行仿真来实现的。为此,选择varFDTD方法,选取5级精度的自动非均匀网格划分策略,并应用共形变体1网格精化。在该示例中,波长被设置为1300nm,并使用围绕220nm高硅波导结构的折射率为1.4469的氧化硅包层,该包层具有根据Lumerical材料数据库中的Palik模型的材料参数,但设置和材料不限于当前选择。对结构进行仿真并发现多模***的小增益,即减少的损耗。尽管效率增益看似适中,但它受益于储层***1内部的多个节点传递,因此呈指数放大。结果,本发明实现具有更多节点的更大储层***、设计拓扑中的极大自由度、以及更好的计算性能。
通过改变所使用波导和结的宽度,研究了划分器以及组合器的多模引导效果。通过增加所使用波导和结的宽度,将引导更多模。在600nm宽度下,前两种模(即,基模和一阶模)被强引导。存在第三种模式,但被不太强地引导。前三种模在800nm的宽度下被很好地引导,但现在第四种模(即,具有1.46的有效折射率和1.4469的包层折射率的三阶模式)被较弱地引导。1000nm宽的波导的情况已进一步朝向四个良好引导的模以及具有有效折射率1.4495的几乎未被引导的第五模(即,四阶模)演化。具有1200nm的宽度的最后设计更好地引导该四阶模,并且尚不支持五阶模。
由此针对具有不同宽度(600nm至1200nm)的波导和结的不同结构对损耗进行仿真。所获取的结果表明,对于较宽的波导和结,损耗显著小于较小的波导和结。后者解说了使用多种模式的积极效果,因为这些较宽的设计支持多种模式。基于这些积极结果,执行进一步的优化。
还研究了锥形设计对功率损耗的影响。在本例中,使用1μm宽度的波导设计来优化锥形长度。针对锥形长度为0.1μm、1μm、2μm和2.5μm的组合器执行了仿真。
在下表中示出了针对组合器的结果。SE由此是指单激励,而DE是指双激励。
锥形长度 透射率SE 损耗SE 透射率DE 损耗DE
0.1μm 53% 47% 58% 42%
1μm 56% 44% 60% 40%
2μm 61% 39% 63% 37%
2.5μm 55% 45% 61% 39%
组合器的相关模的非相干组合
(基本、一阶、二阶、三阶TE模)
表1
锥形长度 透射率SE 损耗SE 透射率DE 损耗DE
0.1μm 49% 51% 68% 32%
1μm 57% 43% 63% 37%
2μm 82% 18% 89% 11%
2.5μm 77% 23% 81% 19%
组合器的相关模的相干组合
(基本、一阶、二阶、三阶TE模)
表2
如所预期的,优化已得到较低的损耗。通过将原始的0.1_m锥形长度与其他锥形长度进行比较可以看出这一点。损耗的降低在2.0μm至2.5μm之间饱和。此后,损耗再次略有增加。这可以解释如下。通过使锥形更长,向锥形部分中的模提供更多时间以平滑地向输出模式收敛,而不会使锥形更加绝热并且由此破坏多模方案中不太绝热Y结的有益效果。因此,在锥形长度2.0到2.5μm之间达到最佳:锥形足够长以在最大程度上减少不希望的损耗,而不会损耗太多绝热性。在除此之外的一侧,损耗仍因锥形设计而被减小,但绝热性开始提高太多,从而导致有益效果降低,并且由此导致更多辐射损耗和散射出的光。在除此平衡点之外的另一侧,获取绝热性非常弱的锥形,以至于它不会抵消损耗,而是甚至对损耗有贡献。换言之,尽管可以执行进一步的优化,但仿真结果已经示出组合器(都在非相干组合模式源的情形中)的仅为39%(单激励)和37%(双激励)的平均损耗,这比当前储层中的MMI(50%的损耗)能提供的损耗要好得多。要注意,这些值和操作模式专用于此处研究的特定设计,并且对于其他设计可以不同。
还评估了所使用的波长对储层***效率的依赖性。对于经建模的简化Y结,利用S参数来评估波长对结构行为的影响。图3解说了因变于波长的Y结的(复)S参数的绝对值平方,其中使用1μm宽的波导并且锥形长度为2μm。使用基模作为输入。从1280nm到1320nm(这是在中心频率1300nm附近的区间)对波长进行扫掠。这些绝对值平方是对应于每个S参数的功率流的度量。可以看出,测量结果与基本平坦的曲线相对应(几乎水平取向),从而解说了波长对储层***的性能没有重要影响。本发明的各实施例的优点在于所使用波长的变化不会引起***性能的很大变化。这与使用例如波长相关性大得多的定向耦合器的其它办法形成对比。
在另一实验中,对基于单模结和波导的储层与基于多模结和波导的储层之间的总损耗进行了比较。由此要注意,求解任务的性能没有显著不同,但发生的损耗显著不同。在图4中,指示了十六个节点储层的功率水平,由此比较了单模和多模储层。针对1比特延迟的XOR(异或)任务示出了将多模储层中每个节点的功率除以单模储层中相同节点的功率的功率比。由于第一节点被用作输入,因此它的功率未改变,并且它的功率比等于1。除了节点1和2之外,所有节点显然具有高于水平线的功率比,该水平线指示比率等于1之处。这意味着在多模储层的所有那些节点中测得更多的功率。
在第二方面,本发明涉及一种光子储层计算方法。该方法包括后文描述的以下步骤。在储层***的至少一个输出端接收一个或多个输入信号。通过在时间上变化的光波中直接耦合或采用换能元件根据一个或多个输入信号来调制光子波,可以接收输入信号。在储层***内部传播该一个或多个输入信号的经延迟和重新加权版本,其中一个或多个多模Y结可以在储层节点位置充当划分器或组合器,这些多模Y结以功率高效的方式中继沿多模波导行进的传入和传出光学储层信号。传播的另一示例可以通过混沌储层。
该方法进一步包括:在储层***的节点位置探测该储层***的一个或多个特定激励状态,并将它们路由到训练模块。该方法还包括:在训练模块的读出部分中对一个或多个探测的储层输出信号应用线性加权方案。加权方案能够改变相应一个或多个光学信号14的幅度211和相位212。将读出级213的该一个或多个经修改光学信号组合成单个输出信号22,例如,通过多模Y结33的级联214或通过锥形多模波导的合并部分214,但不限于此。以非线性方式映射输出信号22,例如,通过光检测器元件将复值光学信号转换成实值电功率水平的动作。以受监督方式训练读出权重211、212,以使输出信号22与针对特定任务的期望教导信号相匹配。将该一个或多个探测到的储层状态14重构为至学习算法的必需输入。该重构是通过进行以下操作来实现的:同时观察输出信号22并多次呈现该一个或多个输入信号11,一次激活单个权重211并将其驱动为打开状态“1”,使其余权重保留在关闭状态“0”,以及通过激活权重对,将它们驱动为打开状态“1”,或更一般地非零状态,同时使所有其他权重保留在关闭状态“0”。该最后步骤发生两次,以解除π的简并性(degeneracy)。
通过解说的方式,本发明的各实施例不限于此,讨论了光子储层计算***的训练的示例以及读出操作的示例,从而解说了本发明的各实施例的标准和可任选特征。讨论了这种训练算法的若干种选项,并提出了一种解决方案,其中可以通过恰适地设置读出权重、同时在预定义的输入序列上迭代来观察储层的复合状态。
因此,期望在光学域而不是电子域中执行对信号的求和。使用这种集成光学读出,仅需要接收所有光学信号的加权和的单个光检测器。直接的低功率光学加权元件可以采用反向偏置的pn结或非易失性光学加权元件的形式。图5解说了完全光学集成读出的概念。
然而,通过采用这种集成光学读出,失去了对光子储层状态的直接可观察性。然而,为了使用经典的线性读出训练算法(诸如岭回归和其他最小二乘法),观察所有状态是强制性的。要注意,对每个储层节点使用单独的高速光检测器(其仅在训练期间用于观察状态)不被视为良好的解决方案,这是由于高速光检测器在芯片占用面积方面往往很昂贵,并且由于权重是复值信号上的复值权重,因此将需要复杂的相干检测器来测量状态的强度及其相位。还要注意,使用光子电路仿真软件基于对虚拟储层行为的仿真来训练权重(其将显然具有对所有节点的完全可观察性)不会得到直接的解决方案。器件的制造容差使得两个名义上相同的波导的传播相位可能完全不同,从而阻止了将使用理想化仿真储层训练的权重成功传递到实际硬件。
在本示例中,评估了在没有完全状态可观察性的情况下用于训练集成光子储层的若干办法。对具有集成光学读出的光子储层的行为进行仿真,并训练这些储层的仿真读出以执行3比特报头识别。通过比较在宽泛范围的输入信号比特率上实现的比特误差率来评估这些办法。
在本示例中,通过运行预定输入序列若干次、同时恰适设置读出权重,仅使用最终光电二极管来估计储层的复值状态。随后将估计的复合状态用于数字计算机上的经典训练算法,并且所得权重可以被编程在实际读出上。
首先,讨论所使用的方法。比较在宽泛范围的输入信号比特率上实现的的仿真储层的比特误差率。用集成光学读出来训练仿真光子储层的读出权重,以执行3比特报头识别任务。仿真设置建立在由Katumba等人在Congnitive Computation(认知计算)卷9(3)2017年第307-314页的“A multiple input strategy to efficient integrated phtotnicreservoir computing(用于高效集成光子储层计算的多输入策略)”中描述的设置上,但在训练之前未将所有储层节点上的功率转换到电子域中。替代地,假定集成光学读出直接对本质上复值的储层的光学信号进行操作。
如Fiers等人在J.Opt.Soc.Am.B(美国光学学会杂志)29(5)(2012)第896-900页中的“Time-domain and frequency-domain modeling of nonlinear optical componentsat the circuit-level using a node-based approach(使用基于节点的办法对电路级的非线性光学组件进行时域和频域建模)”中描述的Caphe被用于对与集成4×4光子储层相对应的光学电路进行仿真,该光子储层使用由Vandoorne等人在Nature Communications(自然通信)5(3541)(2014)中的“Experimental demonstration of reservoir computing ona silicon photonics chip(对硅光子芯片上的储层计算的实验演示)”中所描述的涡流架构。每个比特周期对强度调制的输入信号进行24次二次采样,使用一阶巴特沃斯低通滤波器进行平滑,并使用Caphe对光学集成涡流电路的响应进行仿真。获取每个涡流节点的经采样复输出信号作为结果,该结果标示在特定时刻该节点处的光学信号的幅度和相位。在每个储层节点处采样的复光学信号被布置为复状态节点矩阵X∈C,并且集成光学输出通过计算该矩阵与表示复光学权重的复权重向量w之间的内积来进行仿真。所得复值信号被馈送到有噪声的光检测器模型中,以获取集成光子储层的电输出信号。该输出功率信号在(相应输入信号的)每个比特周期的中间进行采样并进行阈值化,以获取干净的二进制输出比特序列。阈值T被置于输出信号y[n]的信号范围的中间
T=min(y[n])+(max(y[n])-min(y[n]))/2 (1)
储层的光学读出被仿真为:
y=σ(Xw) (2)
其中X∈CNxF是复储层状态的矩阵,其包含在集成光子储层的F个输出通道出现的复信号的N个样本。w∈CFx1是保持集成光学读出的复权重的向量。
σ(a):Cn→Rn是由光检测器实现的从光学域到电子域的映射。Katumba等人在Cognitive Computation(认知计算)卷9(3)2017第307–314页中的“A multiple inputstrategy to efficient integrated photonic reservoir computing(用于高效集成光子储层计算的多输入策略)”的光检测器模型被用于所有仿真和实验。该模型将经采样复信号的电流计算为:
i(a)=R|a|2 (3)
其中R是光检测器的响应率。为了计及检测器的有限带宽,将四阶巴特沃斯低通滤波器应用于i。之后,将具有方差
Figure BDA0002295924870000201
的零均值高斯噪声添加到后续输出。方差
Figure BDA0002295924870000202
被计算为:
Figure BDA0002295924870000203
其中q是基本粒子电荷,B是光检测器的带宽,
Figure BDA0002295924870000204
是光电流,<Id〉是暗电流,kB是玻尔兹曼常数,T是温度,并且RL是光检测器的负载阻抗。在所使用的仿真中使用如下设置:R=0.5,B=25GHz,〈Id〉=0.1nA,T=300K并且RL=1MΩ。
仿真储层中任何两个相连节点之间的延迟时间被固定为62.5ps,并且假定波导损耗是相当悲观的3dB/cm。输入信号通过节点5、6、9和10被注入到储层中,其中节点索引从左到右逐行排序。先前已经发现这种输入节点配置在性能和布线工作之间形成良好折衷,如Katumba等人在Congnitive Computation(认知计算)卷9(3)2017第307-314页中的“Amultiple input strategy to efficient integrated photonic reservoir computing(用于高效集成光子储层计算的多输入策略)”中所描述的。
如前面提到的,强度调制被用于将比特模式编码为发送给仿真储层的光学信号。初步实验已表明,向输入信号添加小的偏置对***的整体性能是有益的(与简单地使幅度能量增加偏置的两倍形成对比)。因此,即使当零被编码在输入信号中时,比较小的恒定量的功率也被注入到储层中。更详细而言,总功率p=0.1瓦特被注入在4个输入节点上,其中0.08瓦特专用于幅度,而0.02瓦特专用于偏置。假定在输入比特信号中符号1和0的出现概率相等,则平均信号功率总计达0.08W*0.5+0.02W=0.06W。
由于寻求找到一种在宽泛动态范围上都良好地工作的训练算法,因此通过训练由在宽泛范围的比特率上的输入信号激发的集成光子储层来评估分类器的性能。输入信号的比特率在1至31Gbps之间以1Gbps的步长被扫掠。使用报头识别任务作为评估分类器性能的机器学习任务。每当在输入信号中出现某个寻求的报头比特序列,就预期储层在输出端呈现1,否则呈现0。更精确地,给定输入信号u[n]和预定义的报头比特模式h[n],理想的期望信号d理想[n]被定义为
Figure BDA0002295924870000211
其中上面的标示是艾弗森括号符号标示,其被定义为:
Figure BDA0002295924870000212
并且M是以比特计的h[n]长度。在该文献中,M=3并且h[n]=δ[n]+δ[(n-2)],其中δ标示狄拉克δ函数,并且由此寻找的报头比特模式是“101”。
储层读出使用理想期望信号的经修改版本来训练:
d[n]=d理想[n].p (7)
其中再次p=0.1W,这是输入信号的最大可达功率。10000个随机比特被随机生成为训练数据以及10000个随机比特的测试数据。为了计及制造差异,一般而言,每个储层用相同的训练和测试输入仿真10次,但节点之间的波导以及将输入信号馈送到节点的波导的随机相位配置不同。
随后针对每个实例训练仿真读出的输出权重。
为了比较经训练分类器的性能,使用比特误差率〈BER〉。BER被定义为:
Figure BDA0002295924870000213
其中yT[n]是储层的经二次采样阈值化输出信号,并且d理想[n]再次是理想期望信号。在具有10000比特测试数据的情况下,具有约90%置信度水平的最小可检测比特误差率是10-3
现在关注复值岭回归技术。
再次考虑如上文介绍的集成光子读出的模型,其被定义为:
y=σ(Xw) (9)
其中X∈CNxF是复储层状态的矩阵,其包含在集成光子储层的F个输出通道出现的复信号的N个样本。w∈CFx1是保持集成光学读出的复权重的向量。σ(a):Cn→Rn是由读出的光检测器实现的映射。
与经典的储层读出相反,该模型的读出权重不在储层的非线性检测器函数之后,而是在它之前。这意味着该模型的点积X w的任何结果都将通过该非线性函数传递。因此,如果以经典方式使用岭回归来训练读出权重,则状态和读出权重的期望乘积向量d将通过检测器输出函数进行变换。更详细而言,如果将w训练为:
w=(XHX+α2I)-1XHd (10)
其中α∈R是正则化强度,并且I∈RFxF是单位矩阵。假定w是理想的,
σ(Xw)=σ(d) (11)
因此,在模型输出端获得:
y=σ(Xw)=σ(d) (12)
由于模型优选地输出d而不是σ(d),因此需要找到读出非线性度
Figure BDA0002295924870000225
的近似反演来对σ求逆,以使得:
Figure BDA0002295924870000221
因此w被训练为:
Figure BDA0002295924870000222
如果为简单起见忽略Katumba等人的检测器模型的带限低通滤波器,则该检测器模型可以被近似为闭合形式的函数:
σ(a)=R|a|2+n (15)
再次,R标示光检测器的响应率,并且n是噪声向量。可以看到,σ(a)不能精确地求逆,这主要是由于采用了a的绝对值,并且还由于添加的未知噪声向量。然而,可以将上述检测器函数的逆近似为:
Figure BDA0002295924870000223
通过这样做,使平方差的和最小化,
Figure BDA0002295924870000224
其中行向量用X的索引n标示为x(n)。虽然该办法由于无法观察到芯片上的光学信号的事实而显然无法在实际器件上使用,但它与经典的实值训练办法的相似性使其成为用作评估和比较实际集成储层的新颖训练办法的基线的合适候选。每当引用该基线时,将其明确地称为复值岭回归。每当使用复值岭回归来训练分类器时,就使用5倍交叉验证来找到合适的正则化参数α以获取最佳训练结果。
通过针对3比特报头识别任务上的不同输入信号比特率训练集成光子储层来评估该基线的性能。图6示出了所实现的比特误差率。
可以看到,所提出的基线对于所考虑范围的较低端的比特率良好地工作。
由于无法观察到集成光子储层的状态,因此直接办法是使用黑盒优化办法来训练读出。在这些办法中,CMA-ES似乎是合适的候选,因为它通常很好地处理非凸搜索空间,由于在复域中执行优化而针对该问题很可能出现该非凸搜索空间。集成光子储层可以使用CMA-ES通过以下操作来训练:将由该该算法建议的候选值传递到储层的读出权重,向储层呈现训练比特序列,从储层的后续输出计算所选损耗函数,并将该误差测量反馈回到CMA-ES算法。
该算法遍历损耗函数空间,从而建议使损耗函数最小化的新候选。复权重向量w∈C的实部和虚部被编码成以下实值向量,之后被移交给CMA-ES算法:
Figure BDA0002295924870000231
将逆变换应用于由该算法建议的权重向量,之后将这些权重向量设置为读出。该算法用零向量w′0=0初始化,并在10-5与102之间以步长10在初始方差上执行扫掠。如推荐的,群体大小被设置为
Figure BDA0002295924870000232
注意,通过交叉验证初始方差和群体大小可能达成更好的结果,由于CMA-ES通常很长的训练时间而抑制该交叉验证。作为目标函数,平方差的和被最小化:
Figure BDA0002295924870000233
通过训练3比特报头识别任务上具有不同输入信号比特率的集成光子储层来评估CMA-ES的性能。图7示出了所得到的误差率(结果在10个不同储层上取平均)。
可以看到,对于宽泛范围的所考虑比特率,CMA-ES达到10-3的最小可检测比特误差率。它比所提出的基线更良好地工作,并且因此原则上能够训练集成光子储层。然而,由于CMA-ES通常涉及大量训练时间并且需要对输入数据的多次迭代,因此运行附加实验来研究其收敛行为。
使用CMA-ES对光子储层进行仿真和训练,其中在每次迭代中记录误差率。结果再次在由10Gbps比特率驱动的10个仿真储层上取平均,以获取图8中看到的图表。
该实验的结果表明,在CMA-ES达到令人满意的结果之前,需要呈现完整输入训练序列约1000次。为了获取大众市场成熟性,在实际硬件上的短训练过程对于器件而言是强制性的,因此大幅减少在输入上的必要迭代次数的方法是必要的。由于独立的CMA-ES训练收敛太慢,因此有希望的替代方案是在仿真中对模型进行预训练,并在实际器件上使用CMAES对其进行精化以加快训练过程。
如下所述测试了这种预训练-再训练办法的可行性。如已经提到的,由于集成光子储层的制造容差,不可能利用完全可观察性在仿真中训练储层并且随后将经训练的权重向量传递到硬件。然而,作为该办法的可能扩展,预训练-再训练技术是有希望的替代方案。此处,还首先使用数字计算机上的仿真虚拟储层来训练读出权重。在将权重向量传递到实际硬件之后,使用黑盒优化算法对权重进行精化。然而,这种办法仅在可以确保对实际集成电路进行再训练的算法由于使用基于预训练的初始化而收敛得显著更快时才可行。鉴于预期储层之间的相位变化很大,执行实验以评估预训练-再训练办法的可行性。这是通过使用复值岭回归训练具有集成读出的仿真储层的权重来完成的。输入信号的比特率被选择成使得达到10-3的最小可检测比特误差率,即5Gbps。随后,在对储层的输入和连接波导添加均匀分布的相位噪声η~
Figure BDA0002295924870000241
的同时,对储层进行重新仿真。先前训练的读出权重向量随后被重新应用于新仿真的储层,并记录所得到的比特误差率。针对0到π之间的一组范围b执行上述规程(添加噪声,用先前训练的权重向量解决任务,记录所实现的BER),并针对b的每个值重复该规程10次。为了也计及不同的初始配置,将上述整个规程重复10次,从而为具有不同随机相位配置的10个储层训练10个不同的读出权重向量。因此,在示出结果的图9中,每个数据点总共10个经训练的权重向量被应用于100个仿真储层。
可以看出,对于所选的设置,对于非常少量的随机相位噪声,比特误差率已经增加了两个量级,这似乎使预训练-再训练办法具有挑战性。因此,进一步寻求截然不同的办法,其中通过可用的光检测器来估计储层的状态,以在数字计算机上从实际状态训练权重向量。该权重向量随后可以被传递回硬件,在该硬件处不会预期显著的误差增大。
再次考虑如上面介绍的集成光学读出的模型,其被定义为:
y=σ(Xw) (20)
并考虑光检测器函数的闭合形式近似:
σ(a)=R|a|2+n (21)
以及上面介绍的其近似取逆:
Figure BDA0002295924870000251
当不能直接观察储层状态矩阵|X|时,可以使用
Figure BDA0002295924870000252
来估计该储层状态矩阵|X|。实际上,更仔细地观察式20,可以看到,可以通过对输入权重向量w的恰适选择来观察状态矩阵X的幂。
Figure BDA0002295924870000253
如果选择w(式23)作为权重向量并呈现在集成光子储层的输入的输入信号u[n]中,
y=σ(x1)=R|x1|2+n (24)
则获取y(式24)作为集成读出的输出,其中x1是状态矩阵的第一列。由于可以观察R|x1|2+n,因此可以估计x1的模|X1|:
x1=|x1|exp(jarg(x1)) (25)
如果忽略n,假定R已知,则可以将
Figure BDA0002295924870000261
应用于y并将|X1|估计为:
Figure BDA0002295924870000262
由于上述运算是对光检测器的非线性的近似取逆,因此该方法被称为非线性反演(nonlinearity inversion)。针对读出的每个通道/状态矩阵的列重复该规程,能够估计状态矩阵|X|中的各状态值的模。关于解说请参见图10。然而,为了调谐集成光学读出的权重,还需要与|X|的自变量(相位)有关的信息。与状态有关的绝对相位信息一旦通过光检测器就丢失。然而,仅对各状态之间的相对相位感兴趣,因为它们影响读出的输出和。
考虑在特定时刻t处的两个给定复状态值x(t,k)和x(t,l),具有模Pk和Pl及其和的模Pkl:Pklexp(jφkl)=+Pkexp(jφk)+Plexp(jφl)。它们的相对相位差
Figure BDA0002295924870000263
的绝对值可以使用以下相位估计公式来计算:
Figure BDA0002295924870000264
由于在对于任何给定输入x在区间[-π,π]上存在两个可能解的意义上arccos(x)是单射的事实,使用式27只能找到绝对值
Figure BDA0002295924870000265
Figure BDA0002295924870000266
的符号仍然未知。为了解决该问题,用不同的值Pkl和P’kl执行两次对
Figure BDA0002295924870000267
的该估计。Pkl如前文所示进行计算,而相位差π/2被添加到状态k以使得:
Figure BDA0002295924870000268
通过对
Figure BDA0002295924870000269
Figure BDA00022959248700002610
(式29)的估计进行比较,
Figure BDA00022959248700002611
可以推断出
Figure BDA00022959248700002612
的符号。
Figure BDA00022959248700002613
关于解说请参见图11。
|Pkexp(jφk)+Plexp(jφl)|=|Pk+Plexp(jφkl)| (31)
Figure BDA0002295924870000271
由于式31以及由此式32,可以挑选特定状态x(t,k)作为基准状态,并确定该状态x(t,k)的值与每个其他状态x(t,q)的值之间的相对相位
Figure BDA0002295924870000272
在以此方式估计了每个储层状态之后,可以应用复值岭回归以找到储层的最佳权重。
总之,在呈现相同输入3F-2次之后(其中F是输出通道的数目),即使仅有单个检测器,也能够测量F个输出通道中的每个通道的完整复杂时间演化。
该信息随后可被用于在软件中的单个轮次中计算所需的权重。如上面讨论的,3F-2次测量与使用CMA-ES通常所需的测量相比要少得多。另外,与黑盒优化技术形成对比,它还是确定性数字,其中对于黑盒优化技术难以事先确定将需要多少次迭代。
在实验中,通过根据估计规程在读出模型中设置权重向量的相应行来对非线性反演规程的重复测量进行仿真。对于权重向量的每个设置,都应用完整的读出模型。来自检测器的对应输出信号被收集,并且输出信号中小于0的任何样本(这可能由于噪声或光检测器的限带滤波器的振荡而发生)用0替换。
之后使用式22、27和30来估计X。再次训练在3比特报头识别任务上各节点之间具有输入比特率的集成光子储层,以评估所提出方法的性能。图12示出了因变于输入信号比特率的比特误差率。
非线性反演办法的性能仅比CMA-ES办法稍差,而比复值岭回归基线稍好。尤其是后一事实是引人注目的,因为非线性反演办法是在对基线所使用的状态的估计上操作的。
对此现象的可能解释是,由检测器模型在估计步骤中引入的噪声充当用于训练的附加正则化项。简而言之,由于非线性反演显示出仅比CMA-ES稍差的性能,同时需要对输入数据的显著更少次数(3F-2=3×16-2=46次)的迭代,因此它似乎是用于已研究的集成光子储层的训练办法之中最合适的。。
上述示例解说了根据本发明的实施例的用于训练此类储层的成功方法,该训练方法被称为非线性反演。它解说了本发明的各实施例可以经由通过在集成光子储层的输出端的单个光检测器估计储层状态来从本质上解决集成光子储层状态的有限可观察性的问题。该方法基于在训练数据上迭代若干次、同时根据特定模式设置权重。记录的输出信号允许在训练数据上的3F-2次迭代内估计储层状态的幅度和相位。
已表明,该方法与需要完全可观察性的经典训练办法类似地执行。虽然CMA-ES黑盒算法在任务性能方面仍然稍好,但该方法需要在输入数据上显著更少的迭代。可以得出结论,非线性反演允许训练集成光子储层。

Claims (14)

1.一种光子储层计算***,所述光子储层计算***包括多个输出通道并且被配置用于:传播至少一个光学信号以在所述输出通道中产生所得辐射信号,所述光子储层计算***进一步包括:
用于对来自所述输出通道的信号进行加权的加权元件,以及
用于光学地检测来自所述输出通道的信号的至少一个光学检测器,
所述***被适配用于:通过所述至少一个光学检测器的输出来估计来自所述输出通道的信号。
2.如权利要求1所述的光子储层计算***,其特征在于,所述***包括训练模块,所述训练模块用于确定所述***中不同输出通道的功率以及所述***中不同输出通道之间的相位差。
3.如权利要求2所述的光子储层计算***,其特征在于,所述训练模块被配置用于:在训练数据上迭代若干次,同时根据预定模式经由所述加权元件设置权重。
4.如前述权利要求中任一项所述的光子储层计算***,其特征在于,所述***被适配用于:通过在所述训练数据上进行最多3F-2次迭代来估计来自所述输出通道的信号的幅度和相位,其中F是输出通道的数目。
5.如前述权利要求中任一项所述的光子储层计算***,其特征在于,所述加权元件被适配用于对所得辐射信号进行加权,并且其中,所述至少一个光学检测器被适配用于:在所述信号已在光学域中被加权之后光学地检测所述经加权所得辐射信号的组合,所述***被适配用于估计所述经加权所得辐射信号。
6.如前述权利要求中任一项所述的光子储层计算***,其特征在于,所述至少一个光学检测器是大面积光学检测器,所述大面积光学检测器被配置用于对所述经加权所得辐射信号执行非线性操作。
7.如权利要求4所述的光子储层计算***,其特征在于,执行非线性操作包括:在对所述经加权所得辐射信号进行求和之前取所述经加权所得辐射信号的幂。
8.如前述权利要求中任一项所述的光子储层计算***,其特征在于,所述加权元件包括用于对所得辐射信号进行加权的反向偏置的pn结。
9.如权利要求1至4中任一项所述的光子储层计算***,其特征在于,所述至少一个光学检测器包括用于在每个输出通道中光学地检测所得辐射信号的多个光学检测器,并且所述加权元件被适配用于在电子域中对所述光学地检测到的所得信号进行加权。
10.如权利要求9所述的光子储层计算***,其特征在于,所述***被适配用于对在电子域中加权的所述光学地检测到的所得信号进行求和。
11.如从属于权利要求2的前述权利要求中任一项所述的光子储层计算***,其特征在于,所述训练模块被配置用于获取训练数据,其中加权系数是通过相继进行以下操作来选择的:将一个加权系数选择为等于1(任意单位)、同时将所有其它加权系数设置为0,以及将两个加权系数选择为非零、同时将所有其它加权系数设置为0。
12.如前述权利要求中任一项所述的光子储层计算***,其特征在于,所述***包括硅光子储层。
13.如前述权利要求中任一项所述的光子储层计算***,其特征在于,所述***包括经由光学互连件互连的多个离散节点,以供在各节点之间传播至少一个光学信号以产生所得辐射信号。
14.如权利要求1至12中任一项所述的光子储层计算***,其特征在于,所述***包括混沌储层。
CN201880036058.8A 2017-05-29 2018-05-26 对光子储层计算***的训练 Active CN110892422B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17173169 2017-05-29
EP17173169.8 2017-05-29
PCT/EP2018/063857 WO2018219839A1 (en) 2017-05-29 2018-05-26 Training of photonic reservoir computing systems

Publications (2)

Publication Number Publication Date
CN110892422A true CN110892422A (zh) 2020-03-17
CN110892422B CN110892422B (zh) 2024-07-19

Family

ID=59070404

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201880035939.8A Pending CN110709866A (zh) 2017-05-29 2018-05-26 多模储层
CN201880036058.8A Active CN110892422B (zh) 2017-05-29 2018-05-26 对光子储层计算***的训练

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201880035939.8A Pending CN110709866A (zh) 2017-05-29 2018-05-26 多模储层

Country Status (5)

Country Link
US (2) US11650479B2 (zh)
EP (2) EP3631694B1 (zh)
JP (1) JP7115691B2 (zh)
CN (2) CN110709866A (zh)
WO (2) WO2018219838A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117270100A (zh) * 2023-09-14 2023-12-22 之江实验室 一种实现储备池循环网络的单片光子集成芯片

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113076981A (zh) * 2017-06-30 2021-07-06 华为技术有限公司 数据处理方法及装置
EP3588211A1 (de) * 2018-06-27 2020-01-01 Siemens Aktiengesellschaft Steuereinrichtung zum steuern eines technischen systems und verfahren zum konfigurieren der steuereinrichtung
CN110247299B (zh) * 2019-05-22 2021-02-23 上海大学 一种并行双光反馈半导体激光器储备池计算***
US11681908B2 (en) 2019-09-13 2023-06-20 International Business Machines Corporation Quantum state classifier using reservoir computing
CN115136070A (zh) * 2020-02-21 2022-09-30 根特大学 Mach-Zehnder调制器
WO2021216282A1 (en) * 2020-04-21 2021-10-28 University Of Washington Phase-change metasurface for programmable waveguide mode conversion
CN113343814B (zh) * 2021-05-31 2022-06-14 太原理工大学 一种基于单节点光子储备池计算的手写数字图像识别方法
WO2023285636A1 (en) 2021-07-15 2023-01-19 Universiteit Gent Photonic integrated signal processing device
EP4304110A1 (en) 2022-07-07 2024-01-10 Universiteit Gent Photonic machine learning based signal recovery in self-coherent detectors
EP4384939A1 (de) * 2022-11-03 2024-06-19 AMO GmbH Photonischer reservoircomputer

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010197532A (ja) * 2009-02-24 2010-09-09 National Institute Of Advanced Industrial Science & Technology 全光信号処理デバイス
US20120071333A1 (en) * 2010-07-26 2012-03-22 Tampere University Of Technology Uses of systems with degrees of freedom poised between fully quantum and fully classical states
CN103581080A (zh) * 2013-10-28 2014-02-12 温州大学 基于储备池计算的复数域多值通信信号盲检测方法
EP2821942A2 (en) * 2013-07-05 2015-01-07 Universiteit Gent Reservoir computing using passive optical systems
US9501738B1 (en) * 2012-08-16 2016-11-22 Sandia Corporation Cellular computational platform and neurally inspired elements thereof
US20170116515A1 (en) * 2015-10-26 2017-04-27 International Business Machines Corporation Tunable optical neuromorphic network

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5180911A (en) * 1991-09-03 1993-01-19 Harbor Branch Oceanographic Institution, Inc. Parameter measurement systems and methods having a neural network comprising parameter output means
HUP0000532A2 (hu) * 2000-02-07 2002-03-28 Optilink Ab Eljárás és rendszer információ rögzítésére holografikus kártyán
GB0114140D0 (en) * 2001-06-11 2001-08-01 Kymata Ltd Arrayed waveguide grating with reduced chromatic dispersion
CN102203692B (zh) * 2008-10-31 2015-07-15 惠普开发有限公司 优先化的光学仲裁***
US9830555B2 (en) * 2013-07-09 2017-11-28 The Board Of Trustees Of The Leland Stanford Junior University Computation using a network of optical parametric oscillators
US9354039B2 (en) * 2014-06-06 2016-05-31 Massachusetts Institute Of Technology Methods, systems, and apparatus for programmable quantum photonic processing
US10268232B2 (en) * 2016-06-02 2019-04-23 Massachusetts Institute Of Technology Apparatus and methods for optical neural network
US10031287B1 (en) * 2017-02-02 2018-07-24 International Business Machines Corporation Waveguide architecture for photonic neural component with multiplexed optical signals on inter-node waveguides

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010197532A (ja) * 2009-02-24 2010-09-09 National Institute Of Advanced Industrial Science & Technology 全光信号処理デバイス
US20120071333A1 (en) * 2010-07-26 2012-03-22 Tampere University Of Technology Uses of systems with degrees of freedom poised between fully quantum and fully classical states
US9501738B1 (en) * 2012-08-16 2016-11-22 Sandia Corporation Cellular computational platform and neurally inspired elements thereof
EP2821942A2 (en) * 2013-07-05 2015-01-07 Universiteit Gent Reservoir computing using passive optical systems
CN103581080A (zh) * 2013-10-28 2014-02-12 温州大学 基于储备池计算的复数域多值通信信号盲检测方法
US20170116515A1 (en) * 2015-10-26 2017-04-27 International Business Machines Corporation Tunable optical neuromorphic network

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANDREW KATUMBA ET AL.: "A Multiple-Input Strategy to Efficient Integrated Photonic Reservoir Computing", pages 307 - 314 *
GUY VAN DER SANDE ET AL.: "Advances in photonic reservoir computing", vol. 6, no. 6, pages 561 - 576 *
赵清春等: "混沌光子储备池计算研究进展", 《激光与光电子学进展》, 31 December 2013 (2013-12-31), pages 1 - 7 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117270100A (zh) * 2023-09-14 2023-12-22 之江实验室 一种实现储备池循环网络的单片光子集成芯片
CN117270100B (zh) * 2023-09-14 2024-07-23 之江实验室 一种实现储备池循环网络的单片光子集成芯片

Also Published As

Publication number Publication date
JP2020524835A (ja) 2020-08-20
US20200410370A1 (en) 2020-12-31
US11681201B2 (en) 2023-06-20
CN110709866A (zh) 2020-01-17
US11650479B2 (en) 2023-05-16
CN110892422B (zh) 2024-07-19
JP7115691B2 (ja) 2022-08-09
EP3631694A1 (en) 2020-04-08
EP3631694B1 (en) 2023-11-29
WO2018219838A1 (en) 2018-12-06
US20200249543A1 (en) 2020-08-06
WO2018219839A1 (en) 2018-12-06
EP3631695A1 (en) 2020-04-08

Similar Documents

Publication Publication Date Title
CN110892422B (zh) 对光子储层计算***的训练
US10359272B2 (en) Programmable photonic processing
TWI831932B (zh) 混合類比-數位處理器及該處理器中執行的方法
CN113853563B (zh) 用于高斯玻色子采样的装置和方法
Katumba et al. A multiple-input strategy to efficient integrated photonic reservoir computing
TWI819368B (zh) 光電計算系統
CN113159307A (zh) 光电计算***
Freiberger et al. Training passive photonic reservoirs with integrated optical readout
CN113496281A (zh) 光电计算***
CN112823359A (zh) 光电计算***
Cem et al. Data-driven modeling of Mach-Zehnder interferometer-based optical matrix multipliers
Héeroux et al. Optoelectronic reservoir computing with VCSEL
Ou et al. Hypermultiplexed Integrated Tensor Optical Processor
Teng et al. A High-Stability All-Optical Nonlinear Activator for Optical Computing
Sturm et al. Scalable Coherent Optical Crossbar Architecture using PCM for AI Acceleration
Filipovich Training Deep Neural Networks and Solving Differential Equations using Neuromorphic Photonics
Varri et al. Noise-Resilient Photonic Analog Neural Networks
Chen Tolerate Thermal and Process Variations for Photonic Systems
Zhao et al. Physics-Aware Predictive Models for Tunable Photonics Devices
Jiang et al. Silicon photonics enabled universal cross-scale tensor processing on chip
Biasi et al. Experimental Demonstration of a Photonic Extreme Learning Machine with an Array of Microresonators
Héroux et al. Time delay reservoir computing with VCSEL
Gouda Ring-based architectures for photonic information
Coen et al. Coupled waveguides geometry retrieval using neural networks
Gaur et al. Information Processing in Hybrid Photonic Electrical Reservoir Computing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant