CN112749617A - 通过聚集父实例确定输出信号 - Google Patents
通过聚集父实例确定输出信号 Download PDFInfo
- Publication number
- CN112749617A CN112749617A CN202011179188.2A CN202011179188A CN112749617A CN 112749617 A CN112749617 A CN 112749617A CN 202011179188 A CN202011179188 A CN 202011179188A CN 112749617 A CN112749617 A CN 112749617A
- Authority
- CN
- China
- Prior art keywords
- function
- instance
- training
- instances
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004931 aggregating effect Effects 0.000 title claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 238
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000012544 monitoring process Methods 0.000 claims abstract description 32
- 238000005259 measurement Methods 0.000 claims abstract description 25
- 238000009826 distribution Methods 0.000 claims description 45
- 230000002776 aggregation Effects 0.000 claims description 30
- 238000004220 aggregation Methods 0.000 claims description 30
- 238000005070 sampling Methods 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 description 256
- 238000013528 artificial neural network Methods 0.000 description 23
- 238000004891 communication Methods 0.000 description 8
- 238000013500 data storage Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000004751 neurological system process Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013531 bayesian neural network Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229920001746 electroactive polymer Polymers 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/027—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Automation & Control Theory (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Image Analysis (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
通过聚集父实例确定输出信号。本发明涉及一种训练用于在控制或监视在环境中操作的物理***中使用的函数的计算机实现的方法(600)。该函数将包括传感器测量的输入实例映射到输出信号。该函数通过参数集合来被参数化,参数集合包括多个参考实例的表示。给定训练输入实例,多个参考实例被标识为类似于训练输入实例,并且它们的表示和/或输出信号被聚集成训练输入实例的聚集潜在表示。基于该聚集潜在表示,确定针对训练输入实例的输出信号,该输出信号与训练输出信号进行比较以导出训练信号。根据训练信号调整至少参考实例的表示,从而获得不包括在训练数据集中的参考实例。
Description
发明领域
本发明涉及一种训练用于在控制或监视在环境中操作的物理***中使用的函数的计算机实现的方法以及对应的***。本发明进一步涉及一种应用控制或监视在环境中操作的物理***的函数的计算机实现的方法以及对应的***。本发明进一步涉及一种计算机可读介质。
发明背景
预测任务频繁地出现在计算机视觉中。例如,例如对于自主汽车的自主设备控制取决于基于可靠分类的决策。由机器学习***做出的预测的问题之一是,对其中***被很好训练的情况的预测与对其中***未被很好训练的情况的预测之间经常几乎不存在区别。例如,考虑被训练用来对路标进行分类的神经网络。如果网络呈现有一个新的、先前没有见过的路标,那么神经网络将很可能做出一个自信的且可能正确的分类。然而,如果向神经网络呈现有用于训练的图像分布之外的图像,比如猫的图像,则已知的神经网络倾向于仍然自信地预测图像的路标。这尤其在诸如自动驾驶汽车之类的安全关键的应用中是不合期望的行为,其中人们也期望关于预测的准确的不确定性估计。例如,因此存在对于机器学习***的需要,当呈现有这样的图像时该机器学习***优雅地失败。例如,对于数据分布之外的点,预测可能回落到默认值或接近默认值。
贝叶斯神经网络已经试图向神经网络赋予建模不确定性的能力。他们在网络的权重之上假设一个先验分布,并且通过推断,他们可以表示他们在后验分布中的不确定性。然而,将贝叶斯神经网络应用于自动驾驶汽车或其他实际应用中的尝试受到选择导致令人满意的准确性的先验的困难所阻碍。一个原因是理解参数与数据的相互作用是一项不简单的任务。结果,通常采用先验用于计算方便和易处理性。此外,由于高维数和后验复杂性,对于神经网络权重的推断非常复杂。
作为对上面方案的替代方案,在C. Louizos等人的论文“The Functional NeuralProcess”中(在https://arxiv.org/abs/1906.08324处可获得并且通过引用并入本文中),提出了一族可交换的随机过程,称为功能性神经过程(Functional Neural Processes,FNP)。FNP通过学习在给定数据集中点的潜在表示顶上的依赖关系图,对函数之上的分布进行建模。具体地,选择训练数据集的点的随机子集作为参考集合,并且函数之上的概率分布基于那些点。这样,在没有明确地对潜在的全局参数之上的先验分布进行假设的情况下获得了贝叶斯模型;替代地,在给定数据集的关系结构之上采用先验。对新点的预测是经由它们的后验预测分布进行的。
发明内容
根据本发明的第一方面,如权利要求1所限定的,提出了一种训练用于在控制或监视在环境中操作的物理***中使用的函数的计算机实现的方法。根据本发明的另一方面,如权利要求10所限定的,提出了一种应用用于控制或监视在环境中操作的物理***的函数的计算机实现的方法。根据另一方面,如权利要求13所限定的,提出了一种用于训练在控制或监视在环境中操作的物理***中使用的函数的***。根据另外的方面,如权利要求14所限定的,提出了一种用于应用控制或监视在环境中操作的物理***的函数的***。根据本发明的一个方面,提供了如权利要求15所限定的计算机可读介质。
各种实施例涉及用于确定输出信号的函数,该输出信号用于在控制或监视在环境中操作的物理***中使用。这样的函数所应用于的输入实例典型地包括一个或多个传感器测量,例如,测量物理***本身和/或环境的物理特性。例如,这样的函数可以应用于用于监视车辆发动机的监视***中,例如以对传入的传感器测量执行分类或回归任务,基于所述传入的传感器测量,可以进行监视。例如,可以检测到异常,或者可以预测到物理量将超过某个预定义的阈值,例如,过高的温度或排放值。作为另外的示例,如本文中描述的函数的输出信号可以用在自主设备的控制***中,所述自主设备诸如是自主或半自主车辆。例如,车辆控制***可以基于对车辆处于碰撞危险的危险对象等等进行分类来引起车辆制动。例如,传感器测量可以包括例如由安装在汽车中的相机或外部相机拍摄的相机图像,例如,用于控制车辆的路边相机的图像。
各种实施例采用函数,所述函数使它们针对输入实例的输出信号基于关于多个参考实例的信息。数个(或多个)参考实例典型地比训练数据集的大小小得多,例如为该大小的至多1%或至多0.1%。例如,参考实例的数量可以为至多100、至多或至少250、或者至多或至少1000。训练数据集可以包括至少10000个训练实例、至少50000个训练实例等。
基于例如根据相似性函数确定的输入实例与多个参考实例之间的相似性,可以将多个参考实例标识为与输入实例相似。然后可以考虑关于那些参考实例的信息来确定输出信号。例如,传感器读数的分类可以基于相似的参考传感器读数的分类。用于确定实例之间相似性的相似性函数和/或用于基于参考实例确定输出信号的函数可以是可训练函数,该可训练函数例如通过当训练函数时学习的参数来被参数化。被考虑的来自父实例的信息可以包括父实例本身或从它们导出的信息,例如,父实例的潜在表示和/或参考输出信号。
在各种实施例中,该函数可以是随机函数,而不是确定性函数。这样的函数不仅可以用于获得输出信号(例如分类或预测),而且还可以用于获得输出信号的置信度值。当函数的输出信号用于在物理环境中实现任何类型的动作时,这样的置信度值尤其有用。例如,诸如自动驾驶车辆或医疗决策支持***之类的***可以当置信度值未能超过给定阈值时避免做出自动决策。在这样的设置中,将参考实例考虑在内的函数特别有用,因为对参考实例的相似性提供了有用的反馈来作为这样的置信度值的基础。例如,可以在训练数据集的区域中提供高置信度输出信号,在该区域中可获得相对大量的一致训练输入和输出信号。然而,使用参考实例还对于确定性函数而言可以是有用的,例如,在其中对于那些参考输入的输出信号提供输入/输出关系的代表性视图的情况下,可以从该代表性视图中高效地推断针对其他输入的输出信号。
如发明人所意识到的,当在实践中应用经训练的函数时,重要的是例如出于准确性原因,使用适当的参考实例集合。例如,从训练数据集中取得一个子集作为参考集合将是可能的,但如果这样做了,则所选的参考实例可能彼此相对相似。结果,在这样的情况下,参考实例可能包含冗余信息,使得可能需要相对大的参考实例集合来获得给定的准确性,或者,给定一定量的参考实例,准确性可能不是最佳的。另一方面,在这样的情况下,数据分布的不太频繁的变化可能在参考集合中表现不足。
然而,有趣的是,发明人设想了一种比通过从训练数据集中随机选择获得参考实例更好的方式。事实上,发明人意识到,根本不需要从训练数据集中选择参考实例:相反,多个参考实例的表示可以作为被训练函数的参数来学习。在训练期间,用于训练输入实例的函数的输出信号可以被获得,并且与该训练输入的训练输出信号进行比较,以导出训练信号。例如,可以确定在输出信号与训练输出信号之间的差异;或者,如果函数提供概率分布作为输出信号,则可以根据该概率分布确定训练输出信号被采样的可能性。因此,训练信号可以指示该函数在训练实例上执行得有多好。根据该训练信号,可以调整参考实例的一些或所有表示。例如,训练可以包括例如在梯度下降型更新步骤中可能地与函数的其他参数相组合来重复地调整参考实例的表示。在经调整的参考实例不包括在训练数据集中、而是替代地在训练期间被确定作为参数的意义上,经调整的参考实例典型地是合成的。
通过训练确定参考实例,可以获得更具代表性和优化的参考实例集合。例如,在其中存在许多具有变化的训练输出信号的训练输入实例的输入空间区域中,可以放置相对大量的参考实例,使得在使用中,足够的相关父实例可获得作为函数输出的基础。另一方面,在其中训练输出信号一致的输入空间的区域中,具有较小量的参考实例可能就足够了。例如,具有一致输出信号的若干个训练实例的集群可以由单个参考实例来表示,其不需要是现实的训练实例,并且其事实上甚至不需要表示真实感的训练示例。有趣的是,通过基于结果所得函数的性能来调整参考实例的表示,可以自动确定最适合用于当前函数的参考实例。因此,可以获得模型的例如准确性的性能方面的增加。从另一个方式来看它,给定期望的性能水平,该水平可以使用更少的参考实例来实现,例如,可能需要更少的存储器和/或更少的计算能力来实现性能水平。
有趣的是,训练这些改进的函数的计算开销量仍然可以是相对适度的。因为发明人意识到参考实例可以是合成的,例如不需要从训练数据集中被选择,可以使用高效的训练技术、例如基于连续优化的技术来确定参考实例。当将从训练数据集中选择参考实例时,进行最优选择将有效地导致离散优化问题,该离散优化问题将难以解决,甚至难以近似。相比之下,可以使用连续优化来优化合成参考实例,例如,通过迭代更新参考实例以优化目标函数,例如损失函数,该损失函数在训练输入实例的确定输出信号与对应的训练输出信号之间的差异中增加。因此,如先前所讨论的,合成实例的使用可以不仅允许获得更好的参考实例集合,而且还允许与试图找到训练数据集的合适子集相比,以更高效的方式获得参考实例集合。
有趣的是,通过上面的措施,可以考虑训练数据集中的不确定性,而不必学习在神经网络的大量权重的可能星座(constellation)之上的分布,如在现有技术中有时看到的。可以避免不得不在这样的权重之上选择准确的先验分布,这当存在许多权重时尤其困难,并且难以看出权重分布的特定选择对于总体模型意味着什么。还执行进行推断的困难任务,例如训练模型和取得后验,可以避免在这些之上的许多权重。相比之下,例如潜在表示和内核的相似性函数可能不太复杂得多,并且在这种情况下提供有意义的先验通常更可行得多。
在各种实施例中,改进的训练函数的使用不仅仅包括获得以改进的方式训练的函数,例如,如上面所讨论的,但是也以不同的方式应用该函数。例如,函数的使用可以包括在函数的相似性函数的潜在空间中获得参考实例的表示,而不是获得参考实例本身。替代地或附加地,函数的使用可以包括通过使用输出函数为所标识的父实例确定函数的输出信号来确定输入实例的聚集潜在表示。下面更详细地讨论对训练函数被使用的方式的修改的这些和其他示例。
从输入实例中确定输出信号的函数可以置于各种实际用途中。典型地,输入实例包括在物理环境中测量的传感器数据,例如,图像数据、视频数据、雷达数据、激光雷达数据、超声波数据、运动传感器数据等。该函数可以被配置为对输入实例执行例如回归或分类任务,以获得输出信号。基于所确定的输出信号,可以确定控制信号以在其中测量了传感器数据的物理环境中实现动作。
例如,该函数可以应用于如本领域已知的计算机控制的***中。这样的***典型地包括以下各项或以其他方式具有对以下各项的访问:用以获得环境的测量的一个或多个传感器,以及用以执行影响环境的动作的一个或多个致动器。该***的处理器子***可以基于传感器测量、至少部分地基于如本文中描述的函数的输出信号来确定动作。计算机控制的***包括机器人***,其中机器人可以例如在外部设备或嵌入式控制器的控制之下自动执行一个或多个任务。可以由计算机控制的***的另外示例是车辆及其部件、家用器具、电动工具、制造机器、个人助理、访问控制***、无人机、纳米机器人和加热控制***。
作为分类任务的具体示例,该函数可以用在例如机器人或自动驾驶车辆之类的自主代理的感知模块中,以执行例如在相机图像或其他类型的传感器输入中对检测到的对象的分类。作为回归任务的示例,该函数可以用于基于一个或多个其他物理量来估计复杂***的一个或多个物理量,例如,用于基于各种输入和校准参数预测车辆发动机的排放。
有趣的是,除了输出信号之外,还可以确定输出信号的置信度值,如本文中所讨论的。这在自动驾驶车辆、医疗决策支持***、自动质量控制***等中特别有用。例如,在分类的情况下,例如预测熵之类的置信度值可以表述:函数是否认为输入很可能来自特定类,其例如由低熵指示;或者函数是否不确定,例如它认为所有的类都是同等可能的,其例如由高熵指示。在回归的情况下,置信度值可以指示其中输出信号很可能位于的置信区间。特别地,置信度值可以指示输入实例不是来自与用于训练函数的训练数据集相同的分布或域。置信度值可以以各种方式用于控制信号中,例如,***可以避免当不确定时做出自动决策,可以以安全模式操作,或咨询人类。
在各种实施例中,训练函数也用于生成训练数据,例如以细化在相同训练数据集上训练的另外的模型。例如,基于来自训练数据集的实例或其扰动,可以确定函数的输出信号。然后可以在这些实例和确定的输出信号上训练另外的机器学习模型。这样,可以在针对其难以获得训练数据的情形的数据集和/或更大的数据集上训练另外的机器学习模型,所述情形例如是危险的交通情形、罕见的天气和/或交通状况组合等,从而导致更好的机器可学习模型,而无需执行进一步的实际物理测量。此外,经训练的另外机器学习模型可以应用于实际输入实例,其中可以实现增加的准确性。类似地,经训练的函数可以用于主动学习***中,其中如本文中描述的那样确定的置信度值被用作对于获取另外数据的决策的基础。
如所讨论的,在各种实施例中,关于所标识的父实例的信息被聚集到输入实例的聚集潜在表示中。典型地,该信息包括所标识的父实例的参考输出信号。因为父实例典型地是不来自训练数据集的合成参考实例,所以这样的参考输出信号典型地也不来自训练数据集。存在仍然可以获得这样的参考输出信号所用的若干种方式。
可选地,参考实例的参考输出信号连同参考实例本身的表示一起被包括在参数集合中,并且作为训练函数的部分被学习。例如,参考实例的表示及其输出信号二者可以根据训练信号来被调整。这样,可以自动优化参考输出信号,以提供结果所得函数的最佳性能。
可选地,至少一些参考实例的参考输出信号不作为参数集合的部分被存储,但是当需要时被确定。特别地,当确定输入实例的输出信号时,可以为被标识为输入实例的父实例的参考实例确定参考输出信号。如本发明人所意识到的,由于不存在对于合成参考实例可用的基本事实,因此它们的参考输出信号可以相对于参考实例本身在很大程度上是冗余的,并且因此通过避免将它们存储在参数集合中,可以改进效率并避免过度拟合。
在其中相似性函数是如别处更详细描述的随机函数的实施例中,当应用模型时确定参考输出信号而不是将它们存储为参数是特别有益的。这是因为它允许将关于参考输出信号的不确定性考虑在内:输出信号的不同样本可以基于不同的参考输出信号,根据它们的不确定性进行采样。因此,将该不确定性考虑在内可以因此导致输出信号的更准确分布和/或可以减少由输出信号针对其不确定的参考输入引起的失真效应。
可选地,为了确定参考实例的参考输出信号,可以应用函数本身,包括例如确定实例的父实例,并且将它们聚集到针对的聚集潜在表示中,并且基于该聚集潜在表示使用输出函数确定参考输出信号。当聚集的父代以包括这些父代的参考输出信号时是可能的。这些参考输出信号可以通过应用该函数来依次确定。例如,可以对多个参考点上的非循环有向图进行采样,第一参考节点与第二参考实例之间的图的边指示第一参考实例被标识为第二参考实例的父代,基于如该图所指示的参考实例的父实例的参考输出信号来确定参考实例的参考输出信号。
可选地,父实例的父代的表示在不包括的那些父代的参考输出信号的情况下被聚集。因此,可以对参考输出信号进行采样,而不需要首先对它们父代的参考输出信号进行采样。这尤其有益,因为它允许当对输出信号进行采样时应用更多的并行性。这可能显著地改进性能,尤其是在训练期间。仍然,在一点的潜在表示依赖于其他相关点(例如父代)的意义上,可以获得结构化后验近似。
参考实例可以以各种方式表示在参数集合中。在实施例中,一些或所有参考实例简单地包含在参数集合中;换言之,参考实例以输入实例的形式被存储,函数可以应用于所述输入实例。这允许与常规训练的函数的最大兼容性,例如,如果参考实例和对应的参考输出信号二者存储在参数集合中,则应用常规训练的函数的技术可以在很少改变的情况下被应用。
可选地,一些或所有参考实例在参数集合中被表示为用于标识父实例的相似性函数的潜在空间的元素。例如,相似性函数可以被配置为通过比较实例的潜在表示来确定相似性,在这种情况下,参考实例可以借助于该潜在表示来表示在参数集合中。然而,没有必要使用被用于最终执行该比较的潜在表示,例如,也可以使用参考实例与用于比较的表示之间的中间潜在表示。如发明人所意识到的,这样的潜在表示的使用大大减少了训练模型的参数数量,并且从而降低了过度拟合的风险。这也可以使训练更高效,例如,当应用该模型时,可能需要更少的迭代,并且减少所需的存储和计算资源量。
可选地,该函数被配置为通过根据可训练函数确定输入实例在潜在空间中的潜在表示并且将所述潜在表示与参考实例在潜在空间中的表示进行比较,来确定输入实例与参考实例之间的相似性。例如,可以利用可训练的神经网络来确定潜在表示,该比较由内核函数来执行,所述内核函数例如是诸如di-graphon内核之类的本质上已知的内核函数。如上面所解释的,使用潜在表示来执行该比较不仅可以提供比较实例的高效且有效可训练的方式,而且还允许参考实例由它们在参数集合中的潜在表示来表示。
可选地,该函数被配置为通过将关于相应标识的父实例的信息映射到父实例的相应潜在表示中并且将相应潜在表示彼此组合例如作为总和,或者通过使用可训练的递归神经网络单元,来确定输入实例的聚集潜在表示。如在别处所讨论的,关于被聚集的父实例的信息可以包括父实例本身、例如来自相似性函数的父实例的潜在表示、和/或对应于参考实例的参考输出信号。例如通过使用一个或多个编码器,每个编码器对关于父实例的一些或全部信息进行编码,父实例映射到潜在表示的方式本身可以被学习。
可选地,该函数可以被配置为使用可训练输出函数来确定输出信号。可以使用用于分类(例如两级或多级分类)和/或回归(例如单维或多维)的常规可训练函数。例如,用于分类的随机输出函数可以输出多个输出标签和多个对应的输出概率,从所述多个输出标签和多个对应的输出概率可以对输出信号进行采样和/或计算置信度值。
可选地,相似性函数和/或聚集函数和/或输出函数是被配置为输出概率分布的参数的随机函数。例如,在提供参考实例是另一个实例的父代的概率的意义上,相似性函数可以被视为随机函数。由于这些子函数提供概率分布,因此总体训练函数可以是随机函数。输出信号的样本可以通过从相应子函数中进行采样来获得。例如,从输入实例开始,可以对父实例进行采样,基于该采样可以对聚集潜在表示进行采样,基于该采样可以对输出信号进行采样。为了增加准确性,可以取得输出信号的多个采样并且对其取平均。基于多个这样的样本,可以确定输入实例的置信度值。如果输出函数是随机的,那么也可以基于输出函数返回的概率分布参数来导出置信度值,尽管这典型地仍然要多次进行,以考虑其他函数的随机性。通常,概率分布可以是离散的或连续的。例如,函数可以返回:可以根据正态分布从中对连续输出信号进行采样的平均值和标准偏差、或者可以根据伯努利分布从中对二进制输出信号进行采样的概率值。
可选地,相似性函数和/或聚集函数和/或输出函数包括神经网络。神经网络也称为人工神经网络。示例包括深度神经网络和卷积神经网络。例如,相似性函数和/或聚集函数可以包括用于确定潜在表示的神经网络。要学习的参数集合可以包括神经网络节点的权重。例如,神经网络的层数可以是至少5或至少10,并且节点和/或权重的数量可以是至少1000或至少10000。可以使用各种已知的神经网络架构和其他类型的机器可学习模型。从训练效率的视角来看,使用适合基于梯度的优化的模型是有益的,该模型例如在其参数集合中是连续的和/或可微分的。
可选地,基于训练数据集初始化多个参考实例的表示。贯穿全文讨论各种初始化策略,例如,取得训练实例的随机子集,或k-均值聚类中心。在任何情况下,与如对于可学习函数的参数将是常规的随机初始化参考实例相比,基于训练数据集对它们进行专门初始化可以极大加速收敛,并且有助于达到代表性的参考实例集合。
可选地,参数集合进一步包括相似性函数和/或聚集函数和/或输出函数的参数。训练可以进一步包括根据训练信号调整相似性函数和/或聚集函数和/或输出函数的参数。一般而言,函数的至少一些其他部分连同参考实例集合一起被训练。例如,训练可以包括多次迭代,其中在第一次迭代子集中训练参数集合,并且在第二次迭代子集中训练相似性函数和/或聚集函数和/或输出函数,第一子集和第二子集在多次迭代中时间上交错。可能的是使用相同的训练信号来更新参考实例集合和该函数的其他参数,但是也可能的是使用单独的训练信号。参考实例也可以以不同于函数的其他参数的速率来学习。还可能的是在已经学习了一些或所有其他参数之后学习参考实例,例如,可以通过将从训练数据集选择的参考实例细化成性能更好的合成实例来改进常规学习的函数。
为了执行参考实例和/或其他参数的训练,可以使用本领域本质上已知的训练方法。典型地,使用诸如随机梯度下降之类的随机方案、例如使用如在以下文献中公开的亚当优化器来执行训练:Kingma和Ba“Adam: A Method for Stochastic Optimization”(在https://arxiv.org/abs/1412.6980处可获得并且通过引用并入本文中)。如已知的,这样的优化方法可以是启发式的和/或达到局部最优。特别地,在各种实施例中,目标函数被优化,目标函数包括证据下限(evidence lower bound,ELBO)损失,梯度下降用于更新待训练函数的一些或所有参数。例如,在随机输出函数的情况下,证据下限可以基于根据由输出函数返回的概率分布来获得对应于训练输入的训练输出信号的可能性。可以在逐个实例的基础上或以(小)批量执行训练,(小)批量例如具有至多或至少64个实例或者至多或至少256个实例。
本领域技术人员将领会,本发明的上面提及的实施例、实现和/或可选方面中的两个或更多个可以以任何被认为有用的方式进行组合。
基于本说明书,本领域技术人员可以对任何***和/或任何计算机可读介质实行修改和变型,所述修改和变型对应于所描述的对应计算机实现的方法的修改和变型。
附图说明
本发明的这些和其它方面将从实施例和附图中清楚,并且进一步参考实施例并且参考附图来被阐述,所述实施例在以下描述中作为示例被描述,在所述附图中:
图1示出了用于训练在控制或监视在环境中操作的物理***中使用的函数的***,
图2示出了用于应用控制或监视在环境中操作的物理***的函数的***;
图3示出了可训练函数的详细示例,其中参考实例在训练期间不根据训练信号进行调整;
图4a示出了可训练函数的详细示例,其中参考实例被包括在训练参数集合中,并且计算参考输出信号;
图4b示出了可训练函数的详细示例,其中参考实例的潜在表示被包括在训练参数集合中,并且参考输出信号被计算;
图5a示出了可训练函数的详细示例,其中参考实例和参考输出信号被包括在训练参数集合中;
图5b示出了可训练函数的详细示例,其中参考实例的潜在表示被包括在训练参数集合中;
图6示出了训练用于在控制或监视在环境中操作的物理***中使用的函数的计算机实现的方法;
图7示出了应用用于控制或监视在环境中操作的物理***的函数的计算机实现的方法;
图8示出了包括数据的计算机可读介质。
应该注意,各图纯粹是图解性的并且不按比例绘制。在各图中,与已经描述的元素相对应的元素可以具有相同的参考标号。
具体实施方式
图1示出了用于训练在控制或监视在环境中操作的物理***中使用的函数的***100。该函数可以将包括一个或多个传感器测量的输入实例映射到输出信号,以供在所述控制或监视中使用。该函数可以由参数集合030来参数化。参数集合可以包括多个参考实例的表示。***100可以包括数据接口120和处理器子***140,数据接口120和处理器子***140可以经由数据通信121进行内部通信。数据接口120可以用于访问训练数据集030以训练该函数。训练数据集可以包括多个训练输入实例和对应的训练输出信号。数据接口120也可以用于访问函数的参数集合040。由***100训练的参数集合040可以用于例如通过图2的***200根据本文中描述的方法将输入实例映射到输出信号。
处理器子***140可以被配置为在***100的操作期间并且使用数据接口120来访问数据030、040。例如,如图1中所示,数据接口120可以提供对外部数据存储装置021的访问122,外部数据存储装置021可以包括所述数据030、040。替代地,数据030、040可以从作为***100的部分的内部数据存储装置中访问。替代地,数据030、040可以经由网络从另一实体、例如图2的***200接收。一般而言,数据接口120可以采取各种形式,诸如到局域网或者例如因特网的广域网的网络接口、到内部或外部数据存储装置的存储接口等。数据存储装置021可以采取任何已知的和合适的形式。
处理器子***140可以被配置为在***100的操作期间并且使用数据接口120来训练该函数。
为了训练该函数,处理器子***140可以被配置为从训练数据集030中为训练输入实例确定该函数的输出信号。为了确定该输出信号,处理器子***140可以被配置为基于根据相似性函数确定的在训练输入实例与多个参考实例之间的相似性,将多个参考实例中的数个参考实例标识为训练输入实例的父实例。为了确定输出信号,处理器子***140可以进一步被配置为基于使用聚集函数的所标识父实例的聚集表示和/或参考输出信号来确定训练输入实例的聚集潜在表示。为了确定输出信号,处理器子***140可以进一步被配置为使用输出函数基于训练输入的聚集潜在表示来确定输出信号。
为了训练该函数,处理器子***140可以进一步被配置为通过将训练输入实例的确定输出信号与训练输入实例的训练输出信号进行比较来导出训练信号。处理器子***140可以根据训练信号进一步调整至少参考实例的表示,从而获得不包括在训练数据集中的参考实例。
作为可选组件,***100可以包括图像输入接口或任何其他类型的输入接口(在该图中未示出),用于从诸如相机的一个或多个传感器获得传感器数据。训练数据集030的一些或所有训练输入实例或输出信号可以至少部分基于获得的传感器数据。例如,相机可以被配置为捕获图像数据124,处理器子***140被配置为基于经由数据通信123从输入接口160获得的图像数据124来确定训练数据集030的训练输入实例。输入接口可以被配置用于各种类型的传感器信号,例如,视频信号、雷达/激光雷达信号、超声波信号等。在图2中进一步讨论传感器。
***100的操作的各种细节和方面、包括其可选方面将参考图4a、图4b、图5a、图5b进一步阐述。
一般而言,***100可以被体现为单个设备或装置或者被体现在单个设备或装置中,所述单个设备或装置诸如工作站(例如基于膝上型或台式的工作站)或服务器。设备或装置可以包括执行适当软件的一个或多个微处理器。例如,处理器子***可以通过单个中央处理单元(CPU)、而且还通过这样的CPU和/或其它类型的处理单元的***或组合来被体现。软件可能已被下载和/或存储在对应的存储器中,所述对应的存储器例如诸如RAM的易失性存储器,或诸如闪速存储器的非易失性存储器。替代地,***的功能单元(例如数据接口和处理器子***)可以以可编程逻辑的形式、例如作为现场可编程门阵列(FPGA)和/或图形处理单元(GPU)而实现在设备或装置中。一般而言,可以以电路的形式实现***的每个功能单元。注意到,***100也可以以分布式方式实现,例如牵涉到不同的设备或装置、诸如例如以云计算的形式的分布式服务器。
图2示出了用于应用控制或监视在环境中操作的物理***的函数的***100。该函数可以将包括一个或多个传感器测量的输入实例映射到输出信号,以供在所述控制或监视中使用。该函数可以由参数集合来参数化。参数集合可以包括多个参考实例的表示。***200可以包括数据接口220和处理器子***240,该数据接口220和处理器子***240可以经由数据通信221进行内部通信。数据接口220可以用于访问函数的参数集合040。可以例如通过图1的***100根据本文中描述的方法获得参数集合。***200可以执行训练本身,例如,***100和***200可以组合成单个***。
处理器子***240可以被配置为在***200的操作期间并且使用数据接口220来访问数据040。例如,如图2中所示,数据接口220可以提供对外部数据存储装置022的访问222,外部数据存储装置022可以包括所述数据040。替代地,可以从作为***200的部分的内部数据存储装置中访问数据040。替代地,可以经由网络从另一个实体接收数据040。一般而言,数据接口220可以采取各种形式,诸如到局域网或者例如因特网的广域网的网络接口、到内部或外部数据存储装置的存储接口等。数据存储装置022可以采取任何已知的和合适的形式。
处理器子***240可以被配置为在***200的操作期间并且使用数据接口220来获得输入实例。例如,可以经由传感器接口获得输入实例,如也在下面讨论的。处理器子***240可以进一步被配置为基于使用相似性函数确定的在输入实例与多个参考实例之间的相似性,将多个参考实例中的数个参考实例标识为输入实例的父实例。处理器子***240可以进一步被配置为基于使用聚集函数对表示所标识的父实例的数据进行聚集来确定输入实例的聚集潜在表示。处理器子***240可以进一步被配置为使用输出函数基于输入实例的聚集潜在表示来确定输出信号。处理器子***240可以进一步被配置为例如以本质上已知的方式基于输出信号来控制或监视物理***。可选地,参考实例的表示可以包括在相似性函数的潜在空间中的参考实例的表示。可选地,确定聚集潜在表示可以包括使用输出函数为所标识的父实例确定函数的输出信号。
***200可以包括图像输入接口260或用于获得一个或多个传感器测量224的任何其他类型的传感器接口,传感器测量来自一个或多个传感器,诸如相机072。在下文中,出于解释的目的,讨论了单个传感器。处理器子***240可以被配置为从传感器数据224中确定该函数应用于的输入实例。通常,传感器数据224表示***200和/或***与其交互的环境082的一个或多个物理量。例如,相机可以被配置为捕获图像数据224,处理器子***240被配置为例如通过特征提取基于经由数据通信223从输入接口260获得的图像数据224来确定输入实例。输入接口可以被配置用于各种类型的传感器信号,例如,视频信号、雷达/激光雷达信号、超声波信号等。传感器接口260也可以从别处、例如从数据存储装置或网络位置访问传感器数据。传感器接口260可以具有任何合适的形式,包括但不限于低级通信接口,例如基于I2C或SPI数据通信,但是还包括数据存储接口,诸如存储器接口或持久存储接口,或者个域网、局域网或广域网接口,诸如蓝牙、ZigBee或Wi-Fi接口,或者以太网或光纤接口。传感器可以是***200的部分。
作为可选组件,***200可以包括致动器接口280,用于向一个或多个致动器(未示出)提供致动器数据226,使得一个或多个致动器实现***200的环境082中的动作。致动器接口260可以经由数据通信225与处理器子***240进行内部通信。为了便于解释,下面讨论单个致动器。例如,***200可以是自主设备的组件,其中处理器子***被配置为基于所确定的输出信号来确定用于控制自主设备的控制数据。例如,致动器可以是电动、液压、气动、热、磁和/或机械致动器。具体但非限制性的示例包括电动机、电活性聚合物、液压缸、压电致动器、气动致动器、伺服机构、螺线管、步进电动机等。致动器可以是***200的部分。
***200的操作的各种细节和方面、包括其可选方面将参考图4a、图4b、图5a、图5b进一步阐述。
一般而言,***200可以被体现为单个设备或装置或者被体现在单个设备或装置中,所述单个设备或装置诸如工作站(例如基于膝上型或台式的工作站)或服务器。设备或装置可以包括执行适当软件的一个或多个微处理器。例如,处理器子***可以通过单个中央处理单元(CPU)、而且还通过这样的CPU和/或其它类型的处理单元的***或组合来被体现。软件可能已被下载和/或存储在对应的存储器中,所述对应的存储器例如诸如RAM的易失性存储器,或诸如闪速存储器的非易失性存储器。替代地,***的功能单元(例如数据接口和处理器子***)可以以可编程逻辑的形式、例如作为现场可编程门阵列(FPGA)和/或图形处理单元(GPU)而实现在设备或装置中。一般而言,可以以电路的形式实现***的每个功能单元。注意到,***200也可以以分布式方式实现,例如牵涉到不同的设备或装置、诸如例如以云计算的形式的分布式服务器。
图3示出了可训练函数的详细示例。该函数将输入实例映射到输出信号。在该示例中,参考实例在训练期间不根据训练信号进行调整,例如,它们是在训练函数之前从训练数据集中随机选择的。该示例是基于在C. Louizos等人的“The Functional NeuralProcess”中讨论的技术,并且该论文中讨论的各种实现选择也可以在这里应用。例如,如在图4a、图4b、图5a、图5b中,当根据训练信号调整参考实例时,关于该图解释的许多方面也适用。
该图中示出的是输入实例x* 315。该函数的目标是为输入实例x*确定输出信号y*355。输入实例x*示出有实心框,以指示它不是由函数确定的,而是在其他地方、例如从其中应用该函数的***的另一个组件获得的。输出信号y*的时尚风格(dashing style)指示它被确定为函数的输出。典型地,输入实例x*包括传感器数据,特别是图像。输入实例x*典型地是多值的,例如,包括至少10个值、至少50个值或至少100个值。
为了将输入实例x*映射到输出信号y*,该示例中的函数使用参考实例的集合XR310和对应参考输出信号的集合YR 350作为附加输入。参考实例XR和输出信号YR是从训练数据集中随机选择的函数的示例输入和输出信号。如参考输入XR和参考输出YR的实线框所指示的,它们是外部获得的。通过考虑关于与输入实例x*相似的参考输入XR的信息,可以获得更准确的输出信号y*。
为了从输入实例x*和参考输入XR、YR计算输出信号y*,计算各种中间值,如由虚线框UR 320、u* 325、GRR 330、GR* 335、ZR 340和z* 345所指示的。中间值典型地使用可训练函数来计算,可训练函数的参数是基于训练数据集来训练的。用于根据输入计算中间值以及根据中间值计算输出信号y*的函数在它们输出它们的输出值的概率分布参数的意义上可以是随机函数。
具体地,在该示例中,从输入实例x*,使用可训练表示函数在潜在空间中计算潜在表示u*。根据参考实例XR,类似地,使用相同的可训练表示函数,在相同的潜在空间中计算潜在表示UR。该潜在空间贯穿全文可以被称为“依赖空间”,因为它包含关于各种实例之间的依赖结构的信息,如将在下面进一步解释。潜在空间表示典型地是例如包括至少10个值或至少50个值的向量。从数学上讲,我们可以将该可训练表示函数的应用标示为和,其中标示输入实例的潜在空间表示;标示参考实例的潜在空间表示;并且标示用于计算潜在空间表示的可训练函数(例如神经网络)的参数。例如,可训练表示函数可以计算高斯分布的均值和方差、德尔塔峰值分布的值或潜在空间表示的概率分布的其他参数。对于该表示,如同贯穿全文使用的其他可训练函数,可以使用适合于该函数的输入实例类型的任何可训练函数。例如,可以例如针对图像使用各种神经网络架构,诸如卷积型神经网络。
在根据该示例的函数中,通过利用由实例之间的有向无环图(DAG)建模的依赖结构,参考输入实例被考虑用于输入实例x*。图的节点表示实例,并且从节点到节点的边指示节点是节点的父实例。该图是模型的潜在变量,对该模型执行推断。通过让两个实例被连接的概率由它们在上面讨论的潜在空间上的相似性来管控,该相似性如例如由内核函数来测量,可以限定在这样的图之上的分布。父代身份可以限于参考实例XR,例如随机选择的训练实例集合。例如当使用模型时的输入实例x*和当训练模型时的训练输入实例之类的所有其他实例可以被建模为仅将参考实例作为父代。该图在图中示出为参考输入实例XR之间的DAG GRR,以及从参考实例到非参考实例的二分有向图GR*,例如当应用模型时的输入实例x*和当训练模型时的非参考训练实例集合。
因此,当将模型应用于输入实例x*时,可以比较训练实例的潜在表示UR和输入实例的潜在表示u*。因此,参考实例UR的多个参考实例可以被标识为输入实例的父实例,如由XR与x*之间的二分有向图GR*所标示的。从数学上讲,图GR*可以确定为,其中标示用于比较潜在空间表示的函数参数(如果有的话)。例如,根据伯努利分布,图中可以存在边具有取决于相似性的概率。
取决于输入数据的特定类型,可以执行各种类型的比较。例如,对于图像可以使用距离测量、例如L2度量。如果输入数据包括其他数据,则可以包括合适的其他距离度量。例如,在实施例中,输入数据包括多个传感器的传感器数据。对于温度,可以使用温差,对于压力,可以使用压差等。然而,温度和压力数据可以适当缩放,以考虑其中它们在建模***中出现的不同尺度。多个距离度量可以例如通过被可能加权的平方和来被组合成单个距离。可以使用内核函数来执行比较。例如,可以使用di-graphon内核,di-graphon内核的长度尺度参数可以包括在参数集合中,本发明发现内核工作得良好。
图GRR 基于相同的参数可以确定为。在图GRR的情况下,根据拓扑排序,仅当第一实例在第二实例之前时,第一参考实例才可以被标识为第二参考实例的父实例。这样,可以避免图GRR中的循环。例如,拓扑排序可以根据的无参数标量投影来被定义,例如当时。作为示例,函数可以被定义为 ,其中每个单独的可以是单调函数,例如标准正态分布的对数CDF。在这种情况下,当单独地针对所有维度在之下人们都具有时,人们可以保证。从数学上讲,图GRR的这样的定义可以标示为:
在该示例中,通过基于使用聚集函数在图GR*中被标识的父实例的聚集表示和/或参考输出信号,为输入实例x*确定聚集潜在表示z* 345,可以考虑在图GR*中被标识为父实例的参考实例。从数学上讲,这可以被标示为,其中作为聚集函数的可训练参数。作为具体的示例,聚集函数可以例如使用一个或多个神经网络将关于相应标识的父实例的信息映射到父实例的相应潜在表示中,并且将相应潜在表示彼此组合例如作为总和,或者通过使用可训练的递归神经网络单元。例如,例如在随机函数的情况下使用每维度的独立高斯分布,可以通过聚集被应用在父代上的相应可训练子函数来计算z*的相应分量。
其中指示哪些参考实例是输入实例x*的父实例;和是通过相应的参数来被参数化的向量值函数,其中在中的陪域变换参考实例和参考输出信号。可以是利用的归一化常数,例如,它对应于点的父代数量的倒数,当点没有父代时,利用一个额外的小来避免被零除。类似地,参考实例XR的聚集潜在表示ZR可以根据依据图GRR的相同聚集函数从父参考实例XR和它们的参考输出信号YR获得。
基于输入实例x*的聚集潜在表示z*,可以使用输出函数、例如神经网络来确定可训练函数的输出信号y*。例如,从数学上讲,,其中作为输出函数的可训练参数。类似于以上,例如,可以返回输出信号的单个值或者概率分布的参数,例如一元或多元高斯分布的均值和标准偏差等。输出信号也可以是向量值的。
在各种情况下,可以为输出信号y*确定置信度值。例如,返回的标准偏差可以为输出函数提供这样的置信度得分,但是典型地对多个输出信号进行采样,从而还考虑相似性函数和/或聚集函数的随机性。基于这样的采样,例如,可以确定多个标签的多个输出概率。例如,如果输入是路标,则指示可以通过模型来识别的每个可能路标的概率的向量可以被确定。如果一个特定的输出、例如特定的路标被自信地识别,则一个概率将是高的,并且其余的概率将是低的、例如接近零。如果没有特定的输出被自信地识别,则许多或所有的概率将近似相等。因此,可以通过测量输出信号离均匀有多近来导出输出信号中的置信度:离均匀越近是越不自信的,并且离均匀越远是越自信的。输出信号中的置信度可以以各种方式反映在数字中;一种方式是进行此以计算生成概率的熵。
在该特定示例中,由于参考实例XR来自训练数据集,因此基本事实参考输出信号YR也是可用的,并且可以与将函数应用于参考实例的结果进行比较,如在参考实例的聚集潜在表示ZR与参考输出信号YR之间的虚线所指示。还基于该训练信号,可以细化参数、、、。然而,参考实例XR和基本事实标签YR在训练期间保持不变。
如可以看到的,在该数学实现中,来自ZR的参考实例的潜在表示以其父代、的输入和输出为条件。然而,这没有引入循环依赖关系,因为如所讨论的,依赖关系图 是非循环的。对于在之下的根节点,父代集合为空。在这样的情况下,上面公式中与数据相关的先验变得与数据无关。特别是,可以观察到
图4a示出了将输入实例映射到输出信号的可训练函数的另一个详细示例。该示例基于图3和也适用于此处的图3的许多实现选择。不像在图3中,然而,在该示例中,参考实例XR是在训练期间被细化的函数的参数。参考实例XR可以基于训练数据集来初始化,但是仍然由于细化,在训练之后,参考实例典型地不再是来自训练数据集的实例,而是被训练来最优地将输入实例映射到输出信号的合成实例。
在该示例中,参考输出信号YR 450不是函数的参数,如在稍后更详细讨论。也可能的是将参考输出信号作为函数的参数,但是发明人意识到计算它们替代地具有若干个优点。一个是较小的大小,由于减少的参数数量。在随机设置中,按照需要计算参考输出信号允许捕获它们的不确定性,例如以根据它们的可变性进行采样,并且可以降低过度拟合的风险。
在该示例中,类似于图3,输入实例x* 415可能随机地被映射到输出信号y* 455。为此,对参考实例集合XR 410进行使用。有趣的是,在该示例中,参考实例是函数的可训练参数。还示出的是对应于参考输入的参考输出信号YR 450。如下面所解释的,在该示例中,这些参考输出信号不被包括在可训练函数的参数集合中,而是替代地按照需要来确定它们。
输入实例x*的输出信号y*如下被确定。基于根据相似性函数确定的在训练输入实例与多个参考实例之间的相似性,多个参考实例XR中的数个参考实例被标识为训练输入实例的父实例。在该示例中,类似于图3,在输入实例x*与参考实例XR之间的相似性是通过根据可训练函数确定x*在潜在空间中的潜在表示u* 425、并且将该潜在表示u*与参考实例的潜在空间表示UR 420进行比较来确定的。父实例在这里被表示为图GR* 435,其具有在所标识的父实例与输入实例之间的边。
类似于图3,基于所标识的父实例,可以基于聚集父实例XR和/或对应的参考输出信号YR来确定输入实例x*的聚集潜在表示z* 445。例如,如针对图3所描述的,基于聚集潜在表示z*,可以使用输出函数来确定函数的输出信号y*。当执行聚集时,不绝对需要包括参考输出信号YR;然而,包括YR通常促进学习,因为YR是父实例的表示,其用与应该针对输入实例x*所确定的相同格式。然而,由于所标识的父实例的参考输出信号YR不包括在可训练函数的参数中,因此需要确定它们。
从数学上讲,参考输出信号YR的确定可以标示为。例如,在随机会话中,参考输出信号可以以概率分布参数的形式从相应的聚集潜在表示中确定。例如,参数可以是例如对于回归任务而言的高斯分布的均值和方差,或者是例如对于分类任务而言的分类分布的概率。例如,分类分布的概率可以被确定为聚集潜在表示的softmax变换。可以使用也被用于从其聚集潜在表示z*确定输出信号y*的相同输出函数从它们的聚集潜在表示来确定参考输出信号。
在各种实施例中,为了改进易处理性,应用了对上面的模型的变分近似。特别地,当确定输入实例x*的父实例P的聚集潜在表示时,有趣的是,该聚集表示可以基于P本身的父实例的表示,而不是基于P的父代的参考输出信号YR。该类型的近似特别有益,因为它可以产生结构化的后验近似,而同时仍然允许并行采样,这与用于先验的顺序过程相反。
例如,在变分近似中,参考实例的潜在表示ZR可以基于参考实例本身(或者来自UR的用于确定相似性的潜在表示)及其父实例,例如:
这里,可以使用与上面相同的因子分解,并且对于除了Z项之外的所有项,权重可以在模型与近似之间共享。
各种其他近似也是可能的。例如,可以应用例如的平均场近似,其也允许并行采样但不再结构化。另一个选项是例如的结构化平均场近似,其更具结构性,但可以使用顺序采样。另一个可能性是使用父代的输出信号用于训练输入实例但不用于参考实例的结构化平均场近似,例如 。这样,可以对参考输入实例的输出信号并行采样,并且给定参考输入实例的输出信号,可以对训练输入实例并行采样。用来近似也是可能的。
当在训练数据集上训练函数时,根据上面的模型确定的训练实例的输出信号可以与训练输出信号进行比较,从而获得可以用于调整一些或所有可训练参数的训练信号。例如,确定训练信号可以包括评估训练数据集上的ELBO(证据下限)损失,基于该ELBO(证据下限)损失,例如通过小批量梯度下降,可以更新函数的参数以减少损失。例如,由上面的变分近似结果所得的ELBO可以是:
特别地,注意到上面ELBO的评估包括从后验进行采样和在采样点处对先验的评估。有趣的是,这两者可以是并行化的。可能仅顺序地执行从先验进行采样。
基于诸如上面ELBO的训练信号的训练典型地以迭代的方式——例如以至少五次、至少十次或至少100次迭代——来进行。在迭代中,可以根据训练信号调整函数的一些或所有参数。例如,在迭代中,参考实例XR可以连同相似性函数和/或聚集函数和/或输出函数的参数一起被调整。尽管典型地使用相同的损失来更新参考实例和其他参数,但对于它们而言不必要在相同迭代中被更新。例如,在各种实施例中,使用交替学习时间表,其中,在一个或多个第一迭代中,调整表示XR,并且在与第一迭代交错的一个或多个其他第二迭代中,调整可训练函数的其他参数。此外,表示XR的学习速率可以不同于其他参数的学习速率。
在训练的开始处,参考实例XR可以以各种方式初始化,例如随机初始化。有趣的是,还可能的是通过基于训练数据集初始化参考实例XR来帮助学习。在实施例中,参考实例被初始化为训练数据集的随机子集。在实施例中,初始化参考实例包括将例如k-means的聚类算法应用于一些或所有训练实例,并且将结果所得的聚类中心用作初始参考实例。例如,还可能的是使用k-medoids来代替k-means。在实施例中,初始参考实例可以是从决定性点过程(DPP)或k-DPP中采样的。例如,内核可以用在DPP或k-DPP中,其具有被限定在用于确定相似性的潜在表示UR的空间中的特征。参考实例的数量通常是预先确定的,但是这不是必需的,例如在DPP或k-DPP的情况下,参考实例的数量可以是随机的。
当应用该函数时,作为具体的示例,下面的后验预测分布可以用于确定输出信号y*:
在该示例中,出于性能原因,将变分近似应用于与参考实例XR相关的术语。然而,这是不需要的。此外,变分近似也可以应用于与输入实例相关的项,但是由于这只是单个实例,应用该近似的预期性能改进较小,因此在上面的示例中没有这样做。如从上面的公式可以看到的,典型地,预测分布不依赖于训练实例、。实际上,根据给定参考实例的训练数据和输出信号、,这里假定输入实例是有条件的i.i.d。
图4b示出了将输入实例映射到输出信号的可训练函数的另一个详细示例。该示例是基于图4a的示例,并且这里讨论的大多数选项也适用于这里。然而与图4a的差异在于,参考实例不是通过包括参考实例本身、而是通过在相似性函数的潜在空间中包括参考实例的潜在空间表示UR 422而被表示在可训练函数的参数集合中。如发明人所意识到的,潜在表示小得多,但仍然包含足够的信息来评估可训练的函数。这不仅在使用期间、而且还在训练期间可能导致性能改进:需要学习的参数数量可能更小,从而改进训练速度并且降低过度拟合的风险。
代替于训练函数来确定参考实例,可以训练函数来确定潜在空间表示UR。在各种实施例中,参考实例本身在函数的训练或使用期间从未被明确确定。事实上,潜在表示甚至不一定需要对可能的输入实例编码,例如,可能的是,对于UR中给定的潜在空间表示,不存在映射到该潜在表示的输入实例。在该示例中,潜在空间表示UR在应用相似性函数的空间中,但是这也不是必需的,例如,潜在空间表示可以在从实例到用于确定相似性的潜在空间表示的映射的中间潜在空间中。
例如,类似于图4a,输入实例x* 417可以被映射到输出信号y* 457。为此,基于根据相似性函数确定的在训练输入实例与多个参考实例之间的相似性,多个参考实例中的数个参考实例GR* 437可以被标识为输入实例x*的父实例。
在该示例中,为了确定相似性,潜在空间中的输入实例x*的潜在表示u* 427可以被确定,并且与参考实例的潜在空间表示UR 422进行比较。在该示例中,参考实例的潜在表示UR不是从参考实例中确定的,而是替代地作为训练函数的参数直接包括的。
已经标识了父实例GR*,可以基于使用聚集函数的所标识父实例的聚集表示和/或参考输出信号来确定输入实例x*的聚集潜在表示z* 447。被聚集的所标识父实例的表示可以是潜在表示UR,其可选地与参考输出信号YR 452相组合,例如,如有向无环图GRR 432所指示,该参考输出信号YR 452是使用父代的相应聚集潜在表示ZR 442为父代实例确定的。这可以类似于针对图4a所描述的内容,除了当图4a的示例使用参考实例XR时,使用的是参考实例的潜在表示UR。基于输入实例x*的聚集潜在表示z*,可以使用输出函数来确定输出信号y*。
例如,该函数可以在数学上如下描述:
如在图4a中,在各种实施例中,可以应用后验的近似来改进计算的易处理性。使用潜在表示作为参数的这样的近似的示例是:
在这种情况下,在训练期间要优化的证据下限可以是:
也可以相应地适应后验预测分布。如较早前所讨论的,对后验进行近似的各种方式是可能的,并且可以在这里应用。
在各种实施例中,参考实例在参数集合中被表示为概率分布的参数以用于对它们的潜在空间表示进行采样,例如,对于高斯分布的。如上面所讨论的,为了当确定图GRR时避免循环,可以采用潜在表示UR的部分排序。如发明人所意识到的,在随机情况下,如果潜在表示作为参数是固定的,则因此部分排序也是固定的,从而减小了生成图GRR中的随机性的量。通过将潜在空间表示参数化为概率分布的参数,可以增加随机性以避免使参考实例的部分排序固定。
图5a示出了将输入实例映射到输出信号的可训练函数的进一步详细示例。该示例再次是基于图4a的示例,其中差异在于,不仅参考实例XR 510、而且还有参考输出信号YR550被包括在函数的学习参数集合中。尽管计算参考输出信号在如上面所讨论的许多设置中可能是有利的,但是通过提供更容易且更高效来评估的模型,包括参考输出信号YR在某些情形下也可以有帮助。例如,可能不再需要确定在参考实例之间的父代子代关系。
在该示例中,对于输入实例x* 515,输出信号y* 555被确定。类似于图4a和别处,基于根据相似性函数确定的在训练输入实例与多个参考实例之间的相似性,多个参考实例XR中的数个参考实例可以被标识为输入实例x*的父实例,如图GR* 535所指示。具体地,如图中所示,潜在空间中的输入实例x*的表示u* 525可以被确定,并且与潜在空间中的参考实例的表示UR 520进行比较。
同样在这种情况下,可以基于使用聚集函数的所标识父实例的聚集表示XR和/或参考输出信号YR来确定输入实例x*的聚集潜在表示z* 545,如图4a中所做的。可以基于聚集潜在表示z*来确定输出信号y*。
然而,在这种情况下,由于参考输出信号YR被包括在参数集合中,因此不需要计算它们来确定y*。相反,参考输出信号YR被包括在参数集合中,并且相应地可以基于将用于训练输入实例的输出信号y*与训练输出信号进行比较而根据训练信号进行调整。特别地,在训练期间也可能不需要从参考实例XR确定参考输出信号YR。可以确定参考输出信号YR,以使要学习的函数的准确性最大化,并且不一定要与参考实例XR上的函数输出最佳匹配。
作为例证,这里可以使用以下边际可能性:
图5b中示出了另外的变体。该变体类似于图5a的变体,但是这里,代替于参考实例本身,相似性函数的潜在空间中的参考实例的潜在表示UR 522被包括在参数集合中。否则,该变体可以以与图5a的变体相同的方式工作:给定输入实例x* 517,基于也用于潜在表示UR的潜在空间中的输入实例x*的潜在表示u* 527,多个参考实例可以被标识为父实例,如图GR* 537所指示。基于所标识的父实例,可以确定聚集潜在表示z* 547,基于该聚集潜在表示z* 547可以确定输出信号y* 557。
然而,在这种情况下,潜在表示UR被聚集、而不是参考实例本身,可能地连同参考输出信号YR 552。如在图4b中,优点包括更好的性能和降低的过度拟合风险。例如,在这种情况下,可以使用以下边际可能性:
图6示出了训练用于在控制或监视在环境中操作的物理***中使用的函数的计算机实现的方法600的框图。该函数可以将包括一个或多个传感器测量的输入实例映射到输出信号,以供在所述控制或监视中使用。该函数可以通过参数集合来被参数化。参数集合可以包括多个参考实例的表示。方法600可以对应于图1的***100的操作。然而,这不是限制,因为也可以使用另一***、装置或设备来执行方法600。
方法600可以包括,在题为“访问训练数据集”的操作中,访问610用于训练函数的训练数据集。训练数据集可以包括多个训练输入实例和对应的训练输出信号。
方法600可以包括例如通过在一次或多次迭代中迭代执行下面讨论的步骤620-640来训练函数。
为了训练该函数,方法600可以包括在题为“确定输出”的操作中,为训练输入实例确定620该函数的输出信号。为了确定输出信号,方法600可以包括,在题为“标识父代”的操作中,基于根据相似性函数确定的在训练输入实例与多个参考实例之间的相似性,将多个参考实例中的数个参考实例标识622为训练输入实例的父代实例。为了确定输出信号,方法600可以进一步包括,在题为“聚集父代信息”的操作中,基于使用聚集函数的所标识父实例的聚集表示和/或参考输出信号,确定624训练输入实例的聚集潜在表示。为了确定输出信号,方法600可以进一步包括,在题为“基于聚集确定输出”的操作中,使用输出函数基于训练输入的聚集潜在表示来确定626输出信号。
为了训练该函数,方法600可以进一步包括,在题为“导出训练信号”的操作中,通过将训练输入实例的确定输出信号与训练输入实例的训练输出信号进行比较来导出630训练信号。为了训练该函数,方法600可以进一步包括,在题为“调整参考实例”的操作中,根据训练信号调整640至少参考实例的表示,从而获得不包括在训练数据集中的参考实例。
图7示出了应用控制或监视在环境中操作的物理***的函数的计算机实现的方法700的框图。该函数可以将包括一个或多个传感器测量的输入实例映射到输出信号,以供在所述控制或监视中使用。该函数可以通过参数集合来被参数化。参数集合可以包括多个参考实例的表示。方法700可以对应于图2的***200的操作。然而,这不是限制,因为也可以使用另一***、装置或设备来执行方法700。
方法700可以包括,在题为“访问参数”的操作中,访问710函数的参数集合。方法700可以包括,在题为“获得输入实例”的操作中,获得720输入实例。该获得可以包括获得一个或多个传感器测量,传感器测量是一个或多个传感器的传感器测量。方法700可以包括,在题为“标识父代”的操作中,基于使用相似性函数确定的在输入实例与多个参考实例之间的相似性,将多个参考实例中的数个参考实例标识730为输入实例的父代实例。
方法700可以包括,在题为“聚集父代信息”的操作中,基于使用聚集函数对表示所标识的父实例的数据进行聚集,确定740输入实例的聚集潜在表示。方法700可以包括,在题为“基于聚集确定输出”的操作中,使用输出函数基于输入实例的聚集潜在表示来确定750输出信号。方法700可以包括,在题为“控制物理***”的操作中,基于输出信号控制760物理***,和/或在题为“监视物理***”的操作中,基于输出信号监视770物理***。
这里,参考实例的表示包括参考实例在相似性函数的潜在空间中的表示,和/或确定聚集潜在表示包括使用输出函数为所标识的父实例确定函数的输出信号。
方法600和方法700可以组合,例如,方法700可以根据方法600在访问函数的参数以将它们应用于输入实例之前确定函数的参数。
将领会,一般而言,图6的方法600和图7的方法700的操作可以以例如连续地、同时地或其组合的任何合适次序来执行,其在适用的情况下例如通过输入/输出关系受制于必要的特定次序。
(一个或多个)方法可以在计算机上实现为计算机实现的方法、专用硬件或二者的组合。如还在图6中图示的,例如可执行代码的用于计算机的指令可以例如以一系列810机器可读物理标记的形式和/或作为一系列具有不同的电(例如磁性)或光学属性或值的元件而存储在计算机可读介质800上。可执行代码可以以暂时性或非暂时性的方式存储。计算机可读介质的示例包括存储器设备、光学存储设备、集成电路、服务器、在线软件等。图8示出了光盘800。替代地,计算机可读介质800可以包括暂时性或非暂时性数据810,其表示将输入实例映射到输出信号的函数的参数集合,以供在本文中描述的计算机实现的方法中使用,参数集合包括多个参考实例的表示,其中参考实例的表示包括相似性函数的潜在空间中的参考实例的表示和/或参考实例的表示不包括参考实例的函数的参考输出信号。
示例、实施例或可选特征——无论是否被指示为非限制性的——都不要被理解为对如要求保护的本发明进行限制。
应当注意到,以上提及的实施例说明而不是限制本发明,并且本领域技术人员将能够在不偏离所附权利要求书的范围的情况下设计许多替代的实施例。在权利要求书中,被置于括号之间的任何参考标记不应被解释为限制权利要求。使用动词“包括”及其变位不排除存在除了在权利要求中所陈述的那些元素或阶段之外的元素或阶段。在元素之前的冠词“一”或“一个”不排除存在多个这样的元素。诸如“……中的至少一个”之类的表述当在元素列表或群组之前的时候表示从该列表或群组中选择全部元素或元素的任何子集。例如,表述“A、B和C中的至少一个”应当被理解为包括仅A、仅B、仅C、A和B二者、A和C二者、B和C二者或者全部A、B和C。本发明可以借助于包括若干不同元件的硬件、以及借助于合适编程的计算机来被实现。在列举了若干构件的设备权利要求中,这些构件中的若干个可以通过硬件的同一项来体现。仅有的事实即在相互不同的从属权利要求中记载了某些措施不指示这些措施的组合不能被有利地使用。
Claims (15)
1.一种训练用于在控制或监视在环境中操作的物理***中使用的函数的计算机实现的方法(600),所述函数将包括一个或多个传感器测量的输入实例映射到输出信号,以供在所述控制或监视中使用,所述函数通过参数集合来被参数化,参数集合包括多个参考实例的表示,所述方法包括:
-访问(610)用于训练所述函数的训练数据集,训练数据集包括多个训练输入实例和对应的训练输出信号;
-通过以下各项来训练所述函数:
-为训练输入实例确定(620)所述函数的输出信号,包括:
-基于根据相似性函数确定的在训练输入实例与所述多个参考实例之间的相似性,将所述多个参考实例中的数个参考实例标识(622)为训练输入实例的父实例;
-基于使用聚集函数的所标识父实例的聚集表示和/或参考输出信号,确定(624)训练输入实例的聚集潜在表示;和
-使用输出函数基于训练输入的聚集潜在表示来确定(626)输出信号;
-通过将训练输入实例的确定输出信号与训练输入实例的训练输出信号进行比较来导出(630)训练信号;
-根据训练信号调整(640)至少参考实例的表示,从而获得不包括在训练数据集中的参考实例。
2.根据权利要求1所述的方法(600),其中为训练输入实例确定所述函数的输出信号包括为所标识的父实例确定所述函数的参考输出信号。
3.根据权利要求2所述的方法(600),其中为所标识的父实例确定所述函数的参考输出信号包括确定所述实例的聚集潜在表示,所述聚集潜在表示是基于使用聚集函数对所述实例的所标识父实例的表示进行聚集来计算的。
4.根据前述权利要求中任一项所述的方法(600),其中参考实例的表示包括参考实例和/或参考实例在相似性函数的潜在空间中的表示。
5.根据前述权利要求中任一项所述的方法(600),包括通过根据可训练函数确定训练输入实例在潜在空间中的潜在表示并且将所述潜在表示与参考实例在潜在空间中的表示进行比较,来确定在训练输入实例与参考实例之间的相似性。
6.根据前述权利要求中任一项所述的方法(600),其中相似性函数和/或聚集函数和/或输出函数是被配置为输出概率分布的参数的随机函数。
7.根据前述权利要求中任一项所述的方法(600),包括基于训练数据集初始化所述多个参考实例的表示。
8.根据前述权利要求中任一项所述的方法(600),其中参数集合进一步包括相似性函数和/或聚集函数和/或输出函数的参数,所述训练进一步包括根据训练信号调整相似性函数和/或聚集函数和/或输出函数的参数。
9.根据前述权利要求中任一项所述的方法(600),其中训练输入实例包括图像。
10.一种应用用于控制或监视在环境中操作的物理***的函数的计算机实现的方法(700),所述函数将包括一个或多个传感器测量的输入实例映射到输出信号,以供在所述控制或监视中使用,所述函数通过参数集合来被参数化,参数集合包括多个参考实例的表示,所述方法包括:
-访问(710)所述函数的参数集合;
-获得(720)输入实例,包括获得所述一个或多个传感器测量,传感器测量是一个或多个传感器的传感器测量;
-基于使用相似性函数确定的在输入实例与所述多个参考实例之间的相似性,将所述多个参考实例中的数个参考实例标识(730)为输入实例的父实例;
-基于使用聚集函数对表示所标识的父实例的数据进行聚集,确定(740)输入实例的聚集潜在表示;
-使用输出函数基于输入实例的聚集潜在表示来确定(750)输出信号;和
-基于输出信号控制(760)或监视(770)物理***,
其中参考实例的表示包括参考实例在相似性函数的潜在空间中的表示,和/或确定聚集潜在表示包括使用输出函数为所标识的父实例确定所述函数的输出信号。
11.根据权利要求10所述的方法(700),其中物理***是自主设备,并且其中输出信号是用于控制自主设备的控制信号。
12.根据权利要求10或11所述的方法(700),包括基于对多个输出信号进行采样和/或确定输出信号的概率分布来确定输入实例的函数的置信度值。
13.一种用于训练在控制或监视在环境中操作的物理***中使用的函数的***(100),所述函数将包括一个或多个传感器测量的输入实例映射到输出信号,以供在所述控制或监视中使用,所述函数通过参数集合来被参数化,参数集合包括多个参考实例的表示,所述***包括:
-数据接口(120),其用于访问用于训练所述函数的训练数据集(030)并且用于访问所述函数的参数集合(040),训练数据集包括多个训练输入实例和对应的训练输出信号;
-处理器接口(140),其被配置为通过以下各项训练所述函数:
-通过以下各项为训练输入实例确定所述函数的输出信号:
-基于根据相似性函数确定的在训练输入实例与所述多个参考实例之间的相似性,将所述多个参考实例中的数个参考实例标识为训练输入实例的父实例;
-基于使用聚集函数的所标识父实例的聚集表示和/或参考输出信号,确定训练输入实例的聚集潜在表示;和
-使用输出函数基于训练输入的聚集潜在表示来确定输出信号;
-通过将训练输入实例的确定输出信号与训练输入实例的训练输出信号进行比较来导出训练信号;
-根据训练信号调整至少参考实例的表示,从而获得不包括在训练数据集中的参考实例。
14.一种用于应用控制或监视在环境中操作的物理***的函数的***(200),所述函数将包括一个或多个传感器测量的输入实例映射到输出信号,以供在所述控制或监视中使用,所述函数通过参数集合来被参数化,参数集合包括多个参考实例的表示,所述***包括:
-数据接口(220),用于访问所述函数的参数(040);
-传感器接口(260),用于获得所述一个或多个传感器测量,传感器测量是一个或多个传感器的传感器测量;
-处理器子***(240),其被配置为:
-通过经由传感器接口获得所述一个或多个传感器测量来获得输入实例(223);
-基于使用相似性函数确定的在输入实例与所述多个参考实例之间的相似性,将所述多个参考实例中的数个参考实例标识为输入实例的父实例;
-基于使用聚集函数对表示所标识父实例的数据进行聚集,确定输入实例的聚集潜在表示;
-使用输出函数基于输入实例的聚集潜在表示确定输出信号;和
-基于输出信号控制或监视物理***,
其中参考实例的表示包括参考实例在相似性函数的潜在空间中的表示,和/或确定聚集潜在表示包括使用输出函数为所标识的父实例确定所述函数的输出信号。
15.一种计算机可读介质(800),包括表示以下各项中的一个或多个的暂时性或非暂时性数据(810):
-指令,当由处理器***执行时,使得处理器***执行根据权利要求1和/或10的计算机实现的方法;和/或
-将输入实例映射到输出信号的函数的参数集合,以供在根据权利要求10的计算机实现的方法中使用,参数集合包括多个参考实例的表示,其中参考实例的表示包括参考实例在相似性函数的潜在空间中的表示,和/或参考实例的表示不包括参考实例的函数的参考输出信号。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19206119 | 2019-10-30 | ||
EP19206119.0 | 2019-10-30 | ||
EP19206484.8A EP3816865A1 (en) | 2019-10-30 | 2019-10-31 | Determining an output by aggregating parent instances |
EP19206484.8 | 2019-10-31 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112749617A true CN112749617A (zh) | 2021-05-04 |
Family
ID=68392868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011179188.2A Pending CN112749617A (zh) | 2019-10-30 | 2020-10-29 | 通过聚集父实例确定输出信号 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210133567A1 (zh) |
EP (1) | EP3816865A1 (zh) |
CN (1) | CN112749617A (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11531886B2 (en) * | 2019-11-26 | 2022-12-20 | The Royal Institution For The Advancement Of Learning/Mcgill University | Bayesian graph convolutional neural networks |
CN115034361A (zh) * | 2022-06-02 | 2022-09-09 | 苏州大学 | 一种基于ics-bp神经网络的传感器物理量回归方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3865056A1 (en) * | 2012-09-14 | 2021-08-18 | InteraXon Inc. | Systems and methods for collecting, analyzing, and sharing bio-signal and non-bio-signal data |
US10824941B2 (en) * | 2015-12-23 | 2020-11-03 | The Toronto-Dominion Bank | End-to-end deep collaborative filtering |
US10943148B2 (en) * | 2016-12-02 | 2021-03-09 | Apple Inc. | Inspection neural network for assessing neural network reliability |
EP3596663B1 (en) * | 2017-05-19 | 2024-06-12 | Deepmind Technologies Limited | Neural network system |
US11537868B2 (en) * | 2017-11-13 | 2022-12-27 | Lyft, Inc. | Generation and update of HD maps using data from heterogeneous sources |
WO2019155065A1 (en) * | 2018-02-09 | 2019-08-15 | Deepmind Technologies Limited | Neural network systems implementing conditional neural processes for efficient learning |
US11487791B2 (en) * | 2019-03-29 | 2022-11-01 | Microsoft Technology Licensing, Llc | Latent feature extraction from a network graph |
US11315038B2 (en) * | 2019-05-16 | 2022-04-26 | International Business Machines Corporation | Method to measure similarity of datasets for given AI task |
KR20210039598A (ko) * | 2019-10-02 | 2021-04-12 | 삼성전자주식회사 | 응답 추론 방법 및 장치 |
-
2019
- 2019-10-31 EP EP19206484.8A patent/EP3816865A1/en active Pending
-
2020
- 2020-10-26 US US17/080,365 patent/US20210133567A1/en active Pending
- 2020-10-29 CN CN202011179188.2A patent/CN112749617A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3816865A1 (en) | 2021-05-05 |
US20210133567A1 (en) | 2021-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3722894B1 (en) | Control and monitoring of physical system based on trained bayesian neural network | |
US20200394506A1 (en) | Machine learning system | |
CN113361680B (zh) | 一种神经网络架构搜索方法、装置、设备及介质 | |
US20210394784A1 (en) | Making time-series predictions using a trained decoder model | |
US20210365781A1 (en) | Classification model calibration | |
EP3745309A1 (en) | Training a generative adversarial network | |
US11605026B2 (en) | Methods and systems for support policy learning | |
JP7474446B2 (ja) | マルチラベル予測に適したニューラルネットワークの射影層 | |
WO2021016358A1 (en) | Cross-modality image generation | |
CN112749617A (zh) | 通过聚集父实例确定输出信号 | |
JP2020191088A (ja) | 半定値計画問題を解く層を有するニューラルネットワーク | |
CN111830822A (zh) | 配置与环境交互的*** | |
KR20220004933A (ko) | 비단사적 변환을 포함하는 이미지 분류기 | |
WO2021119282A1 (en) | Hyper-opinion classification using a neural network | |
EP3764284A1 (en) | Adapting a base classifier to novel classes | |
CN116258865A (zh) | 使用机器学习的图像量化 | |
US11804034B2 (en) | Training a function to respond predictably to differences | |
US20220036181A1 (en) | System and method for training a neural ode network | |
WO2022243329A1 (en) | Safe control/monitoring of a computer-controlled system | |
US20220343143A1 (en) | Method for generating an adapted task graph | |
US20240020535A1 (en) | Method for estimating model uncertainties with the aid of a neural network and an architecture of the neural network | |
Jiang et al. | Robust linear-complexity approach to full SLAM problems: Stochastic variational Bayes inference | |
US20230306234A1 (en) | Method for assessing model uncertainties with the aid of a neural network and an architecture of the neural network | |
JP7171520B2 (ja) | 機械学習システム | |
EP3796220A1 (en) | Training a generator based on a confidence score provided by a discriminator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |