CN111524557A

CN111524557A - 基于人工智能的逆合成预测方法、装置、设备及存储介质

Info

Publication number: CN111524557A
Application number: CN202010332227.1A
Authority: CN
Inventors: 赵沛霖; 于洋; 黄俊洲
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-04-24
Filing date: 2020-04-24
Publication date: 2020-08-11
Anticipated expiration: 2040-04-24
Also published as: CN111524557B

Abstract

本申请实施例公开了一种基于人工智能的逆合成预测方法、装置、设备及存储介质，其中该方法包括：获取产物分子的图结构以及该产物分子中原子的属性特征；通过图神经网络模型，至少根据该产物分子的图结构和该产物分子中原子的属性特征，预测该产物分子中的断裂化学键；基于该断裂化学键对该产物分子进行断键处理，得到至少一个合成子；通过序列学习模型至少根据逆合成反应类型对应的字符串、产物分子对应的字符串以及至少一个合成子对应的字符串，预测反应物分子。该方法能够有效提高有机化合物逆合成反应的预测精度，使得有机化合物逆合成反应预测过程更易可视化，且更具可解释性。

Description

基于人工智能的逆合成预测方法、装置、设备及存储介质

技术领域

本申请涉及人工智能(Artificial Intelligence,AI)技术领域，尤其涉及一种有机化合物分子的逆合成预测方法、装置、设备及存储介质。

背景技术

如今，在材料、农业、环境和医疗科学等领域，新的有机化合物起到了越来越重要的作用。给定一个新的有机化合物，相关技术人员需要确定该有机化合物的合成路径，才能高效准确地生产该有机化合物；可见，针对给定有机化合物快速准确地确定其合成路径，是一项非常重要的工作。对于给定有机化合物推出其对应的反应物的过程，被称为逆合成反应。

近年来，随着人工智能技术的兴起和快速发展，逆合成反应预测开始逐渐被视为一个深度学习问题加以解决。具体的，由于分子可以被表达为唯一确定的字符串，如简化分子线性输入规范(Simplified molecular input line entry specification，SMILES)，因此，可以将产物分子和反应物分子均转换为对应的SMILES字符串，相应地，逆合成反应预测可被视为，从产物SMILES字符串到反应物SMILES字符串的序列预测过程。目前基于序列学习的逆合成预测方法主要包括Seq2Seq方法和SCROP方法。

经本申请发明人研究发现，上述逆合成反应预测方法虽然能够通过序列学习模型，根据产物SMILES字符串预测反应物SMILES字符串，但是这些序列学习模型普遍无法从SMILES字符串中捕捉到分子的图结构信息，而分子的图结构信息在逆合成预测过程中往往具有十分重要的作用。综上，目前的逆合成预测方法的预测精度仍有待提高。

发明内容

本申请实施例提供了一种基于人工智能的逆合成预测方法、装置、设备及存储介质，能够有效地提高逆合成反应的预测精度。

有鉴于此，本申请第一方面提供了一种基于人工智能的逆合成预测方法，所述方法包括：

获取产物分子的图结构以及所述产物分子中原子的属性特征，所述产物分子为有机化合物分子；

通过图神经网络模型，至少根据所述产物分子的图结构和所述产物分子中原子的属性特征，预测所述产物分子中的断裂化学键；

基于所述断裂化学键对所述产物分子进行断键处理，得到至少一个合成子；

通过序列学习模型，至少根据逆合成反应类型对应的字符串、所述产物分子对应的字符串以及所述至少一个合成子对应的字符串，预测反应物分子。

本申请第二方面提供了一种基于人工智能的逆合成预测装置，所述装置包括：

获取模块，用于获取产物分子的图结构以及所述产物分子中原子的属性特征，所述产物分子为有机化合物分子；

第一预测模块，用于通过图神经网络模型，至少根据所述产物分子的图结构和所述产物分子中原子的属性特征，预测所述产物分子中的断裂化学键；

断键模块，用于基于所述断裂化学键对所述产物分子进行断键处理，得到至少一个合成子；

第二预测模块，用于通过序列学习模型，至少根据逆合成反应类型对应的字符串、所述产物分子对应的字符串以及所述至少一个合成子对应的字符串，预测反应物分子。

本申请第三方面提供了一种设备，所述设备包括处理器以及存储器：

所述存储器用于存储计算机程序；

所述处理器用于根据所述计算机程序，执行如上述第一方面所述的基于人工智能的逆合成预测方法的步骤。

本申请第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行上述第一方面所述的基于人工智能的逆合成预测方法的步骤。

本申请第五方面提供了一种包括指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行上述第一方面所述的基于人工智能的逆合成预测方法的步骤。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请实施例提供了一种基于人工智能的逆合成预测方法，该方法在基于产物分子(即有机化合物分子)预测反应物分子的过程中，先通过图神经网络(Graph NeuralNetworks，GNN)模型根据产物分子的图结构和该产物分子中原子的属性特征，预测该产物分子中的潜在断键位置；然后，基于所预测的潜在断键位置对产物分子进行断键处理，得到该产物分子的合成子；进而，通过序列学习模型根据逆合成反应类型、产物分子以及上述合成子各自对应的字符串，预测逆合成反应的反应物分子。相比相关技术中仅通过序列学习模型根据产物分子对应的字符串预测反应物分子的实现方式，本申请实施例提供的方法在有机化合物逆合成反应预测过程中，不仅利用了产物分子的字符串信息，还通过图神经网络模型将对于逆合成反应预测具有较高参考价值的分子图结构信息融入到了预测过程中，如此，能够在一定程度上提高有机化合物逆合成反应的预测准确度；此外，本申请实施例提供的方法先通过图神经网络模型预测断键位置，再通过序列学习模型补全断键处理后的合成子，这种处理方式使得有机化合物逆合成反应的预测过程更易于可视化，且极具可解释性。

附图说明

图1为本申请实施例提供的逆合成预测方法的应用场景示意图；

图2为本申请实施例提供的逆合成预测方法的流程示意图；

图3为本申请实施例提供的图神经网络模型的训练方法的流程示意图；

图4为本申请实施例提供的序列学习模型的训练方法的流程示意图；

图5为本申请实施例提供的逆合成预测方法中第一阶段的实现架构图；

图6为本申请实施例提供的逆合成预测方法中第二阶段的实现架构图；

图7为本申请实施例提供的一种逆合成预测装置的结构示意图；

图8为本申请实施例提供的另一种逆合成预测装置的结构示意图；

图9为本申请实施例提供的又一种逆合成预测装置的结构示意图；

图10为本申请实施例提供的服务器的结构示意图；

图11为本申请实施例提供的终端设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

其中，机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

本申请实施例提供的方案涉及人工智能的逆合成预测技术，具体通过如下实施例进行说明。

相关技术中的有机化合物逆合成反应预测方法，通常利用序列学习模型根据产物分子对应的字符串预测反应物分子。此类逆合成反应预测方法中应用的序列学习模型，难以捕捉对于逆合成反应预测较为重要的分子图结构信息，因此，导致预测准确度往往不够理想。

针对上述相关技术存在的问题，本申请实施例提供了一种基于人工智能的逆合成预测方法，该方法能够在有机化合物逆合成反应预测过程中有效地利用产物分子的图结构信息，提高逆合成反应的预测准确度。

具体的，在本申请实施例提供的基于人工智能的逆合成预测方法中，先获取产物分子(即有机化合物分子)的图结构以及该产物分子中原子的属性特征；然后，通过预先训练好的图神经网络模型，根据该产物分子的图结构和该产物分子中原子的属性特征，预测该产物分子中的断裂化学键；接着，基于所预测的断裂化学键对产物分子进行断键处理，得到该产物分子的至少一个合成子；进而，通过预先训练好的序列学习模型，根据逆合成反应类型对应的字符串、产物分子对应的字符串以及至少一个合成子对应的字符串，预测逆合成反应的反应物分子。

相比相关技术中仅通过序列学习模型根据产物分子对应的字符串预测反应物分子的实现方式，本申请实施例提供的方法在有机化合物逆合成反应预测过程中，不仅利用了产物分子的字符串信息，还通过图神经网络模型将对于逆合成反应预测较为重要的分子图结构信息融入到了预测过程中，如此，能够在一定程度上提高有机化合物逆合成反应预测的准确度。此外，本申请实施例提供的方法先通过图神经网络模型预测断键位置，再通过序列学习模型补全断键处理后的合成子，这种处理方式使得有机化合物逆合成反应的预测过程更易于可视化，且极具可解释性。

应理解，在实际应用中，本申请实施例提供的基于人工智能的逆合成预测方法可以应用于能够支持神经网络模型运行的电子设备，如终端设备、服务器等。其中，终端设备可以为计算机、智能手机、平板电脑、个人数字助理(Personal Digital Assistant，PDA)等。服务器可以为应用服务器，也可以为Web服务器；在实际部署时，该服务器可以为独立服务器，也可以为集群服务器或者云服务器。

为了便于理解本申请实施例提供的技术方案，下面以本申请实施例提供的基于人工智能的逆合成预测方法应用于终端设备和服务器交互的场景为例，对该基于人工智能的逆合成预测方法的应用场景进行示例性介绍。

参见图1，图1为本申请实施例提供的逆合成预测方法的应用场景示意图。如图1所示，该应用场景中包括终端设备110和服务器120，终端设备110和服务120通过网络通信。其中，终端设备110用于向服务器120提供有机化合物逆合成反应预测所需的基础信息，如产物分子信息(包括产物分子的图结构、产物分子中原子的属性特征、产物分子对应的字符串等)和逆合成反应类型信息(如逆合成反应类型对应的字符串等)等。服务器120用于执行本申请实施例提供的逆合成预测方法，基于终端设备110提供的基础信息预测逆合成反应的反应物分子。

具体实现时，终端设备110通过网络将逆合成反应预测所需的基础信息传输至服务器120后，服务器120可以先调用预先训练好的图神经网络模型121，根据产物分子的图结构和产物分子中原子的属性特征，预测该产物分子中潜在的断键位置，即预测该产物分子中断裂可能性较高的化学键作为断裂化学键。然后，服务器120可以基于图神经网络模型预测出的断裂化学键，对产物分子进行断键处理122，得到该产物分子的若干合成子。进而，服务器120可以调用预先训练好的序列学习模型123，根据逆合成反应类型对应的字符串、产物分子对应的字符串以及上述合成子对应的字符串，预测出逆合成反应的反应物分子，并通过网络将预测的反应物分子传输给终端设备110。

需要说明的是，在实际应用中，图神经网络模型121预测断裂化学键时，除了可以利用产物分子的图结构和产物分子中原子的属性特征外，还可以利用该产物分子中化学键的属性特征、逆合成反应类型的特征等，本申请在此不对图神经网络模型121预测断裂化学键时利用的信息做任何限定。

此外，序列学习模型123预测反应物分子时，除了可以利用逆合成反应类型对应的字符串、产物分子对应的字符串以及各合成子各自对应的字符串外，还可以利用产物分子的图结构信息和各合成子的图结构信息对输入的序列信息(即字符串信息)进行增强，本申请在此也不对序列学习模型123预测反应物分子时利用的信息做任何限定。

应理解，上述终端设备110向服务器120提供的基础信息仅为示例，在实际应用中，终端设备110可以向服务器120提供更少或更多的基础信息，例如，终端设备110可以仅向服务器120提供产物分子式，进而由服务器120自身基于该产物分子式确定逆合成反应预测过程中所需的其它信息，在此不对终端设备110向服务器120提供的基础信息做任何限定。

应理解，图1所示的应用场景仅为示例，在实际应用中，可以由终端设备独立执行本申请实施例提供的逆合成预测方法，也可以由服务器独立执行本申请实施例提供的逆合成预测方法，还可以由终端设备和服务器配合执行本申请实施例提供的逆合成预测方法，在此不对本申请实施例提供的逆合成预测方法的应用场景做任何限定。

下面通过实施例对本申请提供的基于人工智能的逆合成预测方法进行详细介绍。

参见图2，图2为本申请实施例提供的逆合成预测方法的流程示意图。为了便于描述，下述实施例以服务器作为执行主体为例进行描述。如图2所示，该逆合成预测方法包括以下步骤：

步骤201：获取产物分子的图结构以及所述产物分子中原子的属性特征，所述产物分子为有机化合物分子。

在本申请实施例提供的技术方案中，服务器针对有机化合物分子(即产物分子)进行逆合成反应预测，确定对应的反应物分子时，需要获取该产物分子的图结构和该产物分子中原子的属性特征。

其中，产物分子的图结构可以是将产物分子按照预定顺序转换得到的唯一确定的图结构；例如，可以将产物分子中的每个原子视为一个点，将产物分子中的每个化学键视为一条边，从该角度出发，将产物分子转换为一个邻接矩阵A∈R^n×n表示该产物分子的图结构，n为该产物分子中原子的个数。

其中，产物分子中原子的属性特征由该产物分子中每个原子的特征向量组成；具体的，可以针对产物分子中的每个原子提取一个特征向量，该特征向量是基于与其对应的原子的关键特征确定的，其能够表示该原子的原始属性；假设原子的特征向量长度为d，产物分子中包括的原子个数为n，则可以利用特征矩阵X∈R^n×d表示产物分子中原子的属性特征，X的每一行对应产物分子中一个原子的特征向量。

示例性的，在实际应用中，针对产物分子中的每个原子，可以基于以下任意一种或多种关键特征确定该原子的特征向量：

原子类型：该原子的原子序数(指元素在周期表中按次序排列的序号)；

联键个数：该原子所属的不同的化学键的个数；

形式电荷：分配给产物分子中的该原子的电荷；

手性：是指一个分子不能与其镜像相重合，如人们的双手，左手与互成镜像的右手不重合；

连接氢原子数：该原子连接的氢原子个数；

原子杂化：sp、sp2、sp3、sp3d或者sp3d2；

芳香性：能够表征该原子是否在芳香环体系内；

原子重量：该原子的重量；

高频反应中心特征：一个原子是否具备高频反应中心特征，取决于包含该原子的分子子图是否为高频反应中心；高频反应中心是指从逆合成训练集的产物中抽取出来的、经常出现反应的中心；

反应类型：逆合成反应的化学反应类型也可以作为原子的一个特征。

应理解，在实际应用中，除了可以根据上述关键特征确定产物分子中每个原子的特征向量外，还可以根据其他能够反映原子属性的特征，确定原子的特征向量。

可选的，为了进一步确保后续图神经网络模型能够准确地预测产物分子中潜在的断键位置，服务器除了可以获取产物分子的图结构和产物分子中原子的属性特征外，服务器还可以获取该产物分子中化学键的属性特征，以便后续利用图神经网络模型预测断裂化学键时，可以综合参考该产物分子中的化学键的属性特征，更准确地预测产物分子中断裂化学键。

其中，产物分子中化学键的属性特征由该产物分子中每个化学键的特征向量组成；具体的，可以针对产物分子中的每个化学键提取一个特征向量，该特征向量是基于与其对应的化学键的关键特征确定的，其能够表示该化学键的原始属性；假设化学键的特征向量长度为p，产物分子中包括的化学键个数为m，则可以利用特征矩阵Z∈R^m×p表示该产物分子中化学键的属性特征，Z的每一行对应产物分子中一个化学键的特征向量。

示例性的，在实际应用中，针对产物分子中的每个化学键，可以基于以下任意一种或多种关键特征确定该化学键的特征向量：

键类型：表示该化学键所属的类型，如单键、双键、三键、芳香键等等；

共轭特征：表示该化学键是否共轭；

环键特征：表示该化学键是否为环键的一部分；

分子立体化学特征：无手性因素、手性因素任意、或双键的立体化学等。

应理解，在实际应用中，除了可以根据上述关键特征确定产物分子中每个化学键的特征向量外，还可以根据其他能够反映化学键属性的特征，确定化学键的特征向量。

在一种可能的实现方式中，服务器可以与其它设备(如终端设备、服务器等)交互，从其它设备处获取上述产物分子的图结构、产物分子中原子的属性特征和产物分子中化学键的属性特征。即，可以由其它设备预先针对待进行逆合成反应预测的产物分子，确定对应的图结构、原子的属性特征和化学键的属性特征，进而，将所确定的图结构、原子的属性特征和化学键的属性特征提供给服务器，由该服务器基于该图结构、原子的属性特征和化学键的属性特征，进行逆合成反应预测。

在另一种可能的实现方式中，服务器自身可以针对待进行逆合成反应预测的产物分子，确定对应的图结构、原子的属性特征和化学键的属性特征，进而基于自身确定的图结构、原子的属性特征和化学键的属性特征，进行逆合成反应预测。

应理解，在实际应用中，服务器还可以通过其它方式获取产物分子的图结构、产物分子中原子的属性特征和产物分子中化学键的属性特征，本申请在此不对服务器获取这些信息的方式做任何限定。

步骤202：通过图神经网络模型，至少根据所述产物分子的图结构和所述产物分子中原子的属性特征，预测所述产物分子中的断裂化学键。

服务器获取到产物分子的图结构和产物分子中原子的属性特征后，可以将该产物分子的图结构和该产物分子中原子的属性特征输入预先训练好的图神经网络模型，该图神经网络模型对输入的图结构和原子的属性特征进行相应地分析处理，可以确定该产物分子中潜在的断键位置，即确定该产物分子中断裂可能性较高的化学键作为断裂化学键。

在一种可能的实现方式中，服务器可以通过图神经网络模型，根据产物分子的图结构和产物分子中原子的属性特征，预测该产物分子中每个化学键的断裂概率；进而，确定化学键断裂概率大于预设阈值的化学键，作为上述断裂化学键。

具体的，图神经网络模型可以根据产物分子的图结构和产物分子中原子的属性特征，预测该产物分子中每个化学键的断裂概率；以图神经网络模型为图注意力模型(GraphAttention Networks，GAT)为例，服务器可以通过GAT将输入的原始特征映射为高级特征，如式(1)所示：

H＝f(X,A；θ) (1)

其中，X为输入的产物分子中原子的属性特征，A为输入的产物分子的图结构，θ为GAT模型的参数(预先基于训练样本学习得到的)；H∈R^n×b为GAT基于输入的原始特征映射得到的高级特征，其中每一行对应产物分子中一个原子的高级特征向量，n为产物分子中原子的个数，b为高级特征向量的维度(通常由人工设置)。

得到H后，GAT可以进一步预测产物分子中每个化学键在逆合成反应中断裂的概率，具体可以通过式(2)预测原子x_i和原子x_j之间的化学键(x_i,x_j)断裂的概率：

其中，c_ij表示化学键(x_i,x_j)的断裂概率，w∈R^2b，[h_i,h_j]表示高级特征h_i和高级特征h_j的串联，高级特征h_i为H中原子x_i的高级特征向量，高级特征h_j为H中原子x_j的高级特征向量。对于产物分子的图结构中不存在的(x_i,x_j)，此处不需要预测对应的断裂概率。

图神经网络模型经上述过程确定出产物分子中每个化学键的断裂概率c_ij后，输出所确定的每个化学键的断裂概率c_ij；进而，服务器可以针对每个化学键的断裂概率c_ij判断其是否大于预设阈值(如0.5等)，若是，则确定该断裂概率c_ij对应的化学键为产物分子中的断裂化学键。

在另一种可能的实现方式中，为了进一步提高断裂化学键预测的准确度，服务器可以通过图神经网络模型，根据产物分子的图结构和产物分子中原子的属性特征，预测该产物分子中每个化学键的断裂概率以及该产物分子中的化学键断裂个数；进而，对该产物分子中每个化学键的断裂概率进行降序排序，确定其中排序靠前的化学键断裂个数的断裂概率对应的化学键，作为上述断裂化学键。

具体的，图神经网络模型可以根据产物分子的图结构和产物分子中原子的属性特征，预测该产物分子中每个化学键的断裂概率以及该产物分子中的化学键断裂个数；仍以图神经网络模型为GAT为例，服务器可以通过GAT将输入的原始特征映射为高级特征，如式(3)所示：

H＝f(X,A；θ) (3)

得到H后，GAT可以进一步预测该产物分子在逆合成反应中可能断裂的化学键的个数，具体可以先通过式(4)预测各种断裂键个数的概率：

其中，a表示一种断裂键个数对应的发生概率，W∈R^(N+1)×b，N表示训练集中最大的断裂键数；h_i为H中原子x_i的高级特征向量，相应地，GAT模型可以通过式(5)预测产物分子中的化学键断裂个数k：

k＝argmax_j a_j-1 (5)

例如，假设a₂为上述概率a集合中最大的元素，则产物分子中的化学键断裂个数k＝2-1＝1。

此外，GAT还需要预测产物分子中每个化学键在逆合成反应中断裂的概率，具体可以通过式(6)预测原子x_i和原子x_j之间的化学键(x_i,x_j)断裂的概率：

图神经网络模型经上述过程确定出产物分子中每个化学键的断裂概率c_ij和产物分子中的化学键断裂个数k后，输出所确定的每个化学键的断裂概率c_ij和化学键断裂个数k；进而，服务器可以针对各个化学键的断裂概率c_ij进行降序排序，进而确定排序靠前的k个断裂概率对应的化学键，为产物分子中的断裂化学键。

本申请发明人利用公开数据集USPTO_50K对上述两种实现方式进行试验，发现采用第二种实现方式预测断裂化学键相比采用第一种实现方式预测断裂化学键具有更高的精度。具体的，采用第一种实现方式在公开数据集USPTO_50K上预测断裂化学键的精度为74％，采用第二种实现方式在公开数据集USPTO_50K上预测断裂化学键的精度为86％。

需要说明的是，若服务器在步骤201中获取了产物分子中化学键的属性特征Z，则在步骤202中利用的图神经网络模型应为能够兼容处理化学键属性特征Z的图神经网络，如消息传递神经网络(Message Passing Neural Networks，MPNN)模型等。

在这种情况下，服务器可以通过该图神经网络模型，根据产物分子的图结构、产物分子中原子的属性特征和产物分子中化学键的属性特征，预测该产物分子中的断裂化学键。例如，图神经网络模型可以预测产物分子中每个化学键的断裂概率，进而由服务器确定断裂概率大于预设阈值的化学键作为断裂化学键；又例如，图神经网络模型可以预测产物分子中每个化学键的断裂概率和产物分子中的化学键断裂个数，进而由服务器确定断裂概率最高的前化学键断裂个数的化学键作为断裂化学键。

应理解，上述图神经网络模型可以为任意一种图神经网络，在此不对本申请中应用的图神经网络模型做具体限定。

步骤203：基于所述断裂化学键对所述产物分子进行断键处理，得到至少一个合成子。

服务器通过图神经网络模型预测出产物分子中的断裂化学键后，可以基于预测出的断裂化学键对产物分子进行断键处理，从而得到该产物分子的合成子。通常情况下，对产物分子进行断键处理可能得到一个合成子，也可能得到多个合成子，本申请在此不对所得到的合成子数量做任何限定。

步骤204：通过序列学习模型，至少根据逆合成反应类型对应的字符串、所述产物分子对应的字符串以及所述至少一个合成子对应的字符串，预测反应物分子。

服务器基于图神经网络模型预测出的断裂化学键，对产物分子进行断键处理得到合成子后，可以确定逆合成反应类型对应的字符串、产物分子对应的字符串以及在步骤203中得到的各合成子各自对应的字符串。进而，服务器将逆合成反应类型对应的字符串、产物分子对应的字符串和各合成子各自对应的字符串，输入预先训练好的序列学习模型，序列学习模型对逆合成反应类型对应的字符串、产物分子对应的字符串和各合成子各自对应的字符串进行相应的分析处理，可以预测出反应物分子对应的字符串，转换该反应物分子对应的字符串即可得到逆合成反应的反应物分子。

具体实现时，服务器可以先组合逆合成反应类型对应的字符串、产物分子对应的字符串以及合成子对应的字符串，得到待处理字符串。每种反应类型可以被相应地表示为一个字符串RXN，例如第i种反应类型可以利用字符串RXN_i表示；每个产物分子可以被相应地表示为一个SMILES字符串，记作Product；每个合成子可以被相应地表示为一个SMILES字符串，记作Synthon。

假设经步骤203的断键处理得到两个合成子，这两个合成子各自对应的SMILES字符串分别为Synthon1和Synthon2，此时可以通过式(7)将逆合成反应类型对应的字符串RXN_i、产物分子对应的字符串Product以及合成子对应的字符串Synthon1和Synthon2组合起来，得到待处理字符串U：

U＝<RXN_i>Product<LINK>Sython1.Synthon2 (7)

然后，通过序列学习模型根据待处理字符串U预测目标字符串S，此处的序列学习模型可以为各种类型的序列学习模型，如长短期记忆网络(Long Short-Term Memory，LSTM)模型、Transformer模型等等。以使用的序列学习模型为Transformer模型为例，Transformer模型可以通过式(8)对待处理字符串U进行处理得到目标字符串S：

S＝g(U；φ) (8)

其中，g表示Transformer网络，φ表示Transformer网络的参数，目标字符串S为序列学习模型预测的所有反应物的SMILES字符串。

序列学习模型确定出目标字符串S后，服务器可以基于该目标字符串S中的分隔符，将该目标字符串S拆分为至少一个目标子字符串，进而将该目标子字符串转换为对应的反应物分子。通常情况下，序列学习模型预测出的目标字符串S中串联有所有反应物分子各自对应的字符串，因此，需要基于该目标字符串S中的分隔符(如“.”)对该目标字符串S进行拆分，得到多段SMILES字符串，每段字符串分别对应一个反应物分子。

可选的，为了进一步提高反应物分子预测的准确性，可以在利用序列学习模型预测反应物分子的过程中综合参考产物分子和合成子的图结构信息，利用产物分子和合成子的图结构信息对输入的序列信息(即字符串信息)进行增强。即，服务器对产物分子进行断键处理得到至少一个合成子后，可以相应地确定这至少一个合成子的图结构，进而通过序列学习模型，根据产物分子的图结构、至少一个合成子的图结构以及逆合成反应类型对应的字符串、产物分子对应的字符串和至少一个合成子对应的字符串，预测逆合成反应的反应物分子。

具体的，服务器可以将合成子按照预定顺序转换为唯一确定的图结构，得到合成子的图结构；进而，将在步骤201中获取的产物分子的图结构、该合成子的图结构以及逆合成反应类型对应的字符串、产物分子对应的字符串和合成子对应的字符串均输入序列学习模型，该序列学习模型对输入的产物分子的图结构、合成子的图结构以及逆合成反应类型对应的字符串、产物分子对应的字符串和合成子对应的字符串进行相应的分析处理，预测出逆合成反应的反应物分子。

本申请实施例提供的逆合成预测方法在有机化合物逆合成反应预测过程中，不仅利用了产物分子的字符串信息，还通过图神经网络模型将对于有机化合物逆合成反应预测具有较高参考价值的分子图结构信息融入到了预测过程中，如此，能够在一定程度上提高有机化合物逆合成反应的预测准确度；此外，本申请实施例提供的方法先通过图神经网络模型预测断键位置，再通过序列学习模型补全断键处理后的合成子，这种处理方式使得有机化合物逆合成反应的预测过程更易于可视化，且极具可解释性。

本申请实施例还提供了一种图神经网络模型的训练方法，下面通过实施例对该图神经网络模型的训练方法进行详细介绍。

参见图3，图3为本申请实施例提供的图神经网络模型的训练方法的流程示意图。为了便于描述，下述实施例以服务器作为执行主体为例进行描述。如图3所示，该图神经网络模型的训练方法包括以下步骤：

步骤301：获取第一训练样本；所述第一训练样本包括样本产物分子的图结构、所述样本产物分子中原子的属性特征和所述样本产物分子中的真实断裂化学键，所述样本产物分子为有机化合物分子。

服务器对待训练的图神经网络模型进行训练之前，通常需要先获取多个第一训练样本，每个第一训练样本中包括样本产物分子的图结构、样本产物分子中原子的属性特征和样本产物分子中的真实断裂化学键。

其中，样本产物分子的图结构是将样本产物分子按照预定顺序转换得到的唯一确定的图结构，例如，可以将样本产物分子按照预定顺序转换为邻接矩阵A∈R^n×n，作为该样本产物分子的图结构，n为该样本产物分子中原子的个数。样本产物分子中原子的属性特征由该样本产物分子中每个原子的特征向量组成，具体确定原子的特征向量的方式已在图2所示实施例的步骤201中进行了详细的介绍，此处不再赘述；假设原子的特征向量长度为d，样本产物分子中原子的个数为n，则可以利用特征矩阵X∈R^n×d表示该样本产物分子中原子的属性特征。样本产物分子中的真实断裂化学键可以通过配置标签的形式表达，例如，针对样本产物分子中真实断裂的化学键可以配置标签“1”，针对样本产物分子中除真实断裂的化学键以外的其它化学键可以配置标签“0”。

可选的，若待训练的图神经网络模型在预测断裂化学键的过程中，能够综合参考产物分子中化学键的属性特征，则第一训练样本中还可以包括样本产物分子中化学键的属性特征。该样本产物分子中化学键的属性特征由该样本产物分子中每个化学键的特征向量组成，具体确定化学键的特征向量的方式已在图2所示实施例的步骤201中进行了详细的介绍，此处不再赘述；假设化学键的特征向量长度为p，样本产物分子中化学键的个数为m，则可以利用特征矩阵Z∈R^m×p表示该样本产物分子中化学键的属性特征。

可选的，若待训练的图神经网络模型能够预测产物分子中的化学键断裂个数，则第一训练样本中还可以包括样本产物分子中真实的化学键断裂个数。

步骤302：通过待训练的图神经网络模型，根据所述第一训练样本中的所述样本产物分子的图结构和所述样本产物分子中原子的属性特征，确定所述样本产物分子中每个化学键的预测断裂概率。

服务器获取到第一训练样本后，可以将第一训练样本中样本产物分子的图结构和样本产物分子中原子的属性特征输入待训练的图神经网络模型，该待训练的图神经网络模型对输入的样本产物分子的图结构和样本产物分子中原子的属性特征进行相应的分析处理后，可以确定该样本产物分子中每个化学键的预测断裂概率。

应理解，此处待训练的图神经网络模型可以为任意一种图神经网络模型，如GAT、MPNN等等，在此不对该待训练的图神经网络模型做任何限定。

在一种可能的实现方式中，待训练的图神经网络模型可以仅用于预测产物分子中每个化学键的断裂概率。假设待训练的图神经网络模型为GAT，该待训练的GAT可以通过式(9)，将输入的样本产物分子的图结构A和样本产物分子中原子的属性特征X映射为高级特征：

H＝f(X,A；θ) (9)

其中，H∈R^n×b为待训练的GAT基于输入的样本产物分子的图结构A和样本产物分子中原子的属性特征X映射得到的高级特征，其中每一行对应样本产物分子中一个原子的高级特征向量，n为样本产物分子中原子的个数，b为高级特征向量的维度(通常由人工设置)；θ为待训练的GAT中的参数。

得到H后，待训练的GAT可以进一步预测样本产物分子中每个化学键在逆合成反应中断裂的概率，具体可以通过式(10)确定原子x_i和原子x_j之间的化学键(x_i,x_j)的预测断裂概率：

其中，c_ij表示化学键(x_i,x_j)的预测断裂概率，w∈R^2b，[h_i,h_j]表示高级特征h_i和高级特征h_j的串联，高级特征h_i为H中原子x_i的高级特征向量，高级特征h_j为H中原子x_j的高级特征向量。对于样本产物分子的图结构中不存在的(x_i,x_j)，此处不需要确定对应的预测断裂概率。

在另一种可能的实现方式中，待训练的图神经网络模型可以用于预测产物分子中每个化学键的断裂概率和产物分子中的化学键断裂个数。仍假设待训练的图神经网络模型为GAT，利用第一训练样本对该待训练的GAT进行训练时，该待训练的GAT确定样本产物分子中每个化学键的预测断裂概率的方式与上一种实现方式相同。

该待训练的GAT确定样本产物分子中预测的化学键断裂个数时，可以在上一种实现方式的基础上通过式(12)和式(13)实现，具体的，待训练的GAT可以先通过式(12)预测样本产物分子中各种断裂键个数的概率：

其中，a表示一种断裂键个数对应的发生概率，W∈R^(N+1)×b，N表示预设的最大断裂键数；h_i为H中原子x_i的高级特征向量。

进而，待训练的GAT可以基于式(12)的计算结果，通过式(13)确定样本产物分子中预测的化学键断裂个数k：

k＝argmax_j a_j-1 (13)

例如，假设a₂为上述概率a集合中最大的元素，则样本产物分子中预测的化学键断裂个数k＝2-1＝1。

需要说明的是，若第一训练样本中还包括样本产物分子中化学键的属性特征，则上述待训练的图神经网络模型应为能够兼容处理化学键属性特征Z的图神经网络，如MPNN模型等。并且，训练该待训练的图神经网络模型时，还需要将第一训练样本包括的样本产物分子中化学键的属性特征，输入该待训练的图神经网络模型，以使该待训练的图神经网络模型学习化学键的属性特征。

步骤303：根据所述样本产物分子中每个化学键的预测断裂概率和所述样本产物分子中的真实断裂化学键，确定第一目标损失函数。

待训练的图神经网络模型对输入的样本产物分子的图结构和样本产物分子中原子的属性特征进行相应地处理后，输出该样本产物分子中每个化学键的预测断裂概率。进而，服务器可以根据该样本产物分子中每个化学键的预测断裂概率以及第一训练样本中该样本产物分子中的真实断裂化学键，确定第一目标损失函数。

在待训练的图神经网络模型仅确定样本产物分子中每个化学键的预测断裂概率的情况下，构建的第一目标损失函数可以如式(14)所示：

其中，N为训练使用的第一训练样本的总数，s为当前使用的第一训练样本的索引，

为待训练的图神经网络模型确定的样本产物分子中化学键(x_i,x_j)的预测断裂概率，

为第一训练样本中包括的用于表征样本产物分子中化学键(x_i,x_j)是否会断裂的真实标签(会断裂为1，不会断裂为0)，l可以为任意合适的损失函数，如交叉熵损失函数等。

在待训练的图神经网络模型既可以确定样本产物分子中每个化学键的预测断裂概率，又可以确定样本产物分子中预测的化学键断裂个数的情况下，构建的第一目标损失函数可以如式(15)所示：

其中，N为训练使用的第一训练样本的总数，s为当前使用的第一训练样本的索引，k为待训练的图神经网络模型确定的样本产物分子中预测的化学键断裂个数，

为样本产物分子中真实的化学键断裂个数，

为第一训练样本中包括的用于表征样本产物分子中化学键(x_i,x_j)是否会断裂的真实标签(会断裂为1，不会断裂为0)，l₁和l₂可以为任意合适的损失函数，如交叉熵损失函数等。

应理解，上述式(14)和(15)所示的第一目标损失函数仅为示例，在实际应用中，还可以采用其他函数形式作为第一目标损失函数，本申请在此不对第一目标损失函数的具体形式做任何限定。

步骤304：基于所述第一目标损失函数，训练所述待训练的图神经网络模型。

服务器可以通过优化上述第一目标损失函数，不断地更新该待训练的图神经网络模型的参数，以达到对该待训练的图神经网络模型进行训练的目的。待该待训练的图神经网络模型满足训练结束条件，如断裂化学键的预测误差小于预设阈值、训练次数达到预设训练次数等，可以认为已完成对于该图神经网络模型的训练。

本申请实施例中的图神经网络模型，可以基于产物分子的图结构信息和产物分子中原子的属性特征，较为准确地预测该产物分子中潜在的断键位置；如此，将分子图结构信息有效地融入有机化合物逆合成反应预测的过程中，提高了有机化合物逆合成反应预测的准确度。并且，先预测产物分子中潜在的断键位置，有助于实现有机化合物逆合成反应预测过程的可视化，使得有机化合物逆合成反应预测过程更具可解释性。

本申请实施例还提供了一种序列学习模型的训练方法，下面通过实施例对该序列学习模型的训练方法进行详细介绍。

参见图4，图4为本申请实施例提供的序列学习模型的训练方法的流程示意图。为了便于描述，下述实施例以服务器作为执行主体为例进行描述。如图4所示，该序列学习模型的训练方法包括以下步骤：

步骤401：获取第二训练样本；所述第二训练样本包括对应于同一逆合成反应的第一字符串和第二字符串，所述第一字符串是组合所述逆合成反应类型对应的字符串、样本产物分子对应的字符串以及所述样本产物分子的合成子对应的字符串得到的，所述第二字符串是组合所述逆合成反应的反应物分子对应的字符串得到的，所述样本产物分子为有机化合物分子。

服务器对待训练的序列学习模型进行训练之前，通常需要先获取多个第二训练样本，每个第二训练样本包括对应于同一逆合成反应的第一字符串和第二字符串，其中，第一字符串是组合该逆合成反应类型对应字符串、样本产物分子对应的字符串以及该样本产物分子的合成子对应的字符串得到的，第二字符串是组合该逆合成反应的反应物分子对应的字符串得到的。

具体的，每种反应类型可以被相应地表示为一个字符串RXN，例如第i种反应类型可以利用字符串RXN_i表示；每个产物分子可以被相应地表示为一个SMILES字符串，记作Product；每个合成子可以被相应地表示为一个SMILES字符串，记作Synthon；每个合成子对应的分子(即反应物分子)也可以被相应地表示为一个SMILES字符串，记作Reactant。

假设样本产物分子的合成子有两个，这两个合成子各自对应的字符串分别为Synthon1和Synthon2，此时可以通过式(16)将逆合成反应类型对应的字符串RXN_i、样本产物分子对应的字符串Product以及样本产物分子的合成子对应的字符串Synthon1和Synthon2组合起来，得到第二训练样本中的第一字符串U：

U＝<RXN_i>Product<LINK>Sython1.Synthon2 (16)

假设样本产物分子对应的正确的反应物分子有两个，这两个反应物分子对应的字符串分别为Reactant1和Reactant2，此时可以通过式(17)将这两个反应物分子对应的字符串Reactant1和Reactant2组合起来，得到第二训练样本中的第二字符串V：

V＝Reactant1.Reactant2 (17)

此时，即可利用第一字符串U和第二字符串V组成第二训练样本(U,V)。

可选的，为了进一步提高待训练的序列学习模型的鲁棒性，还可以在第二训练样本中融入利用图神经网络模型针对样本产物分子预测的合成子的相关信息。即可以在第二训练样本中添加对应于同一逆合成反应的第三字符串，该第三字符串是组合逆合成反应类型对应的字符串、样本产物分子对应的字符串和预测合成子对应的字符串得到的，该预测合成子是基于图神经网络模型根据样本产物分子的图结构和样本产物分子中原子的属性特征预测得到的。

具体的，可以先利用图神经网络模型对样本产物分子的图结构和样本产物分子中原子的属性特征进行处理，确定该样本产物分子的断裂化学键，然后，基于该断裂化学键对该样本产物分子进行断键处理得到预测合成子，进而将该预测合成子转换为对应的SMILES字符串。

假设针对第二训练样本中的样本产物分子进行上述处理得到三个预测合成子，这三个预测合成子各自对应的字符串分别为

和

此时可以通过式(18)将逆合成反应类型对应的字符串RXN_i、样本产物分子对应的字符串Product以及上述预测合成子对应的字符串

和

组合起来，得到第二训练样本中的第三字符串

此时，即可利用第一字符串U、第二字符串V和第三字符串

组成第二训练样本

步骤402：通过待训练的序列学习模型，根据所述第二训练样本中的所述第一字符串，确定第一反应物预测字符串。

服务器获取到第二训练样本后，可以将第二训练样本中的第一字符串输入待训练的序列学习模型，该待训练的序列学习模型对输入的第一字符串进行相应的分析处理后，可以确定对应的第一反应物预测字符串。

应理解，此处待训练的序列学习模型可以为任意一种序列学习模型，如LSTM、Transformer等等，在此不对该待训练的序列学习模型做任何限定。

以待训练的序列模型为Transformer模型为例，将第一字符串U输入该待训练的Transformer模型后，该待训练的Transformer模型可以通过式(19)对该第一字符串U进行处理得到第一反应物预测字符串S：

S＝g(U；φ) (19)

其中，g表示待训练的Transformer模型，φ表示该Transformer模型的参数，第一反应物预测字符串S为Transformer模型预测的所有反应物的SMILES字符串。

若第二训练样本中还包括第三字符串，则服务器还需要通过待训练的序列学习模型，根据该第三字符串确定第二反应物预测字符串。具体的，仍以待训练的序列模型为Transformer模型为例，将第三字符串

输入该待训练的Transformer模型后，该待训练的Transformer模型可以通过式(20)对该第三字符串

进行处理得到第二反应物预测字符串

其中，g表示待训练的Transformer模型，φ表示该Transformer模型的参数，第二反应物预测字符串

为Transformer模型预测的所有反应物的SMILES字符串。

步骤403：根据所述第一反应物预测字符串与所述第二训练样本中的所述第二字符串之间的误差，确定第二目标损失函数。

待训练的序列学习模型对输入的第一字符串进行相应地处理后，输出第一反应物预测字符串。进而，服务器可以确定该第一反应物预测字符串相对于第二训练样本中第二字符串存在的误差，并基于此确定第二目标损失函数。

在第二训练样本中仅包括第一字符串和第二字符串的情况下，服务器构建的第二目标损失函数可以如式(21)所示：

其中，N为训练使用的第二训练样本的总数，s为当前使用的第二训练样本的索引，S^s为待训练的序列学习模型基于第一字符串U确定的第一反应物预测字符串，V^s为第二训练样本中的第二字符串，l可以为任意合适的损失函数，如负的似然函数等。

在第二训练样本中包括第一字符串、第二字符串和第三字符串，并在步骤402中利用待训练的序列学习模型基于第三字符串确定了第二反应物预测字符串的情况下，服务器可以根据第一反应物预测字符串与第二训练样本中第二字符串之间的误差、以及该第二反应物预测字符串与第二训练样本中第二字符串之间的误差，确定该第二目标损失函数。具体的，服务器构建的第二目标损失函数可以如式(22)所示：

其中，N为训练使用的第二训练样本的总数，s为当前使用的第二训练样本的索引，S^s为待训练的序列学习模型基于第一字符串U确定的第一反应物预测字符串，

为待训练的序列学习模型基于第三字符串

确定的第二反应物预测字符串，V^s为第二训练样本中的第二字符串，l可以为任意合适的损失函数，如负的似然函数等。

应理解，上述式(21)和(22)所示的第二目标损失函数仅为示例，在实际应用中，还可以采用其他函数形式作为第二目标损失函数，本申请在此不对第二目标损失函数的具体形式做任何限定。

本申请发明人利用公开数据集USPTO_50K对通过上述两种方式(训练样本中不包括第三字符串的方式称为第一种方式，训练样本中包括第三字符串的方式称为第二种方式)训练得到的序列学习模型进行测试，发现基于第一种方式训练得到的序列学习模型实现本申请实施例提供的逆合成预测方法，逆合成预测精度为63％，基于第二种方式训练得到的序列学习模型实现本申请实施例提供的逆合成预测方法，逆合成预测精度为70％，可见，训练序列学习模型时融合第三字符串能够有效地提升逆合成预测精度。

步骤404：基于所述第二目标损失函数，训练所述待训练的序列学习模型。

服务器可以通过优化上述第二目标损失函数，不断地更新该待训练的序列学习模型的参数，以达到对该待训练的序列学习模型进行训练的目的。待该待训练的序列学习模型满足训练结束条件，如反应物分子的预测误差小于预设阈值、训练次数达到预设训练次数等，可以认为已完成对于该序列学习模型的训练。

本申请实施例中的序列学习模型，可以基于逆合成反应类型对应的字符串、产物分子对应的字符串和合成子对应的字符串，较为准确地预测反应物分子；在图神经网络模型引入了分子图结构的信息的基础上，可以协同辅助提高有机化合物逆合成反应预测的准确度。

为了便于进一步理解本申请实施例提供的基于人工智能的逆合成预测方法，下面结合图5和图6，对本申请实施例提供的基于人工智能的逆合成预测方法做整体示例性介绍。

本申请实施例提供的逆合成预测方法的整体流程主要分为两个阶段。其中，第一阶段用于预测产物分子中的潜在断键位置，并对产物分子进行断键处理得到合成子；第二阶段用于利用产物分子的信息补全合成子，从而得到逆合成反应的反应物分子。

图5为上述第一阶段的实现架构示意图。如图5所示，图神经网络模型501为第一阶段利用的模型，其输入包括产物分子的图结构502和该产物分子中原子的属性特征503，产物分子中原子的属性特征503是根据该产物分子中每个原子的关键特征确定的。可选的，图神经网络模型501的输入还可以包括产物分子中化学键的属性特征504和逆合成反应的反应类型特征505，产物分子中化学键的属性特征504是根据该产物分子中每个化学键的关键特征确定的，在不知道逆合成反应的反应类型的情况下，可以将反应类型特征505设置为0。

图神经网络模型501可以根据输入的信息，预测产物分子中每个化学键的断裂概率以及该产物分子中的断裂化学键个数；假设图神经网络模型501预测该产物分子中的断裂化学键个数为k，那么所预测的产物分子中的断裂化学键应为断裂概率最高的前k个化学键。进而，基于这k个断裂化学键对产物分子进行断键处理，相应地得到若干合成子。

图6为上述第二阶段的实现架构示意图。如图6所示，合成子到分子(Synthon toMolecule，Syn2Mol)模型601为第二阶段利用的模型，该Syn2Mol模型601可以为任意一种序列学习模型。其输入包括逆合成反应类型对应的字符串602、产物分子对应的SMILES字符串603和上述合成子对应的SMILES字符串604。可选的，Syn2Mol模型601的输入还可以包括产物分子的图结构和合成子的图结构。

Syn2Mol模型601可以根据输入的信息相应地对合成子进行补全，得到反应物分子对应的SMILES字符串，进而，可以将反应物分子对应的SMILES字符串转换为对应的反应物分子，如此完成逆合成反应的预测。

针对上文描述的基于人工智能的逆合成预测方法，本申请还提供了对应的基于人工智能的逆合成预测装置，以使上述逆合成预测方法在实际中得以应用和实现。

参见图7，图7是与上文图2所示的基于人工智能的逆合成预测方法对应的一种逆合成预测装置700的结构示意图，该逆合成预测装置包括：

获取模块701，用于获取产物分子的图结构以及所述产物分子中原子的属性特征，所述产物分子为有机化合物分子；

第一预测模块702，用于通过图神经网络模型，至少根据所述产物分子的图结构和所述产物分子中原子的属性特征，预测所述产物分子中的断裂化学键；

断键模块703，用于基于所述断裂化学键对所述产物分子进行断键处理，得到至少一个合成子；

第二预测模块704，用于通过序列学习模型，至少根据逆合成反应类型对应的字符串、所述产物分子对应的字符串以及所述至少一个合成子对应的字符串，预测反应物分子。

可选的，在图7所示的逆合成预测装置的基础上，所述第一预测模块702具体用于：

通过所述图神经网络模型，至少根据所述产物分子的图结构和所述产物分子中原子的属性特征，预测所述产物分子中每个化学键的断裂概率以及所述产物分子中的化学键断裂个数；

对所述产物分子中每个化学键的断裂概率进行降序排序，确定排序靠前的所述化学键断裂个数的断裂概率对应的化学键，作为所述断裂化学键。

通过所述图神经网络模型，至少根据所述产物分子的图结构和所述产物分子中原子的属性特征，预测所述产物分子中每个化学键的断裂概率；

确定断裂概率大于预设阈值的化学键，作为所述断裂化学键。

可选的，在图7所示的逆合成预测装置的基础上，所述获取模块701还用于：获取所述产物分子中化学键的属性特征；

则所述第一预测模块702具体用于：

通过所述图神经网络模型，根据所述产物分子的图结构、所述产物分子中原子的属性特征和所述产物分子中化学键的属性特征，预测所述产物分子中的断裂化学键。

可选的，在图7所示的逆合成预测装置的基础上，所述产物分子中原子的属性特征包括以下任意一种或多种：

原子类型、联键个数、形式电荷、手性、连接氢原子数、原子杂化、芳香性、原子重量、高频反应中心特征、逆合成反应类型；

所述产物分子中化学键的属性特征包括以下任意一种或多种：

键类型、共轭特征、环键特征、分子立体化学特征。

可选的，在图7所示的逆合成预测装置的基础上，所述第二预测模块704具体用于：

组合所述逆合成反应类型对应的字符串、所述产物分子对应的字符串以及所述至少一个合成子对应的字符串，得到待处理字符串；

通过所述序列学习模型，根据所述待处理字符串预测目标字符串；

基于所述目标字符串中的分隔符，将所述目标字符串划分为至少一个目标子字符串；

将所述目标子字符串转换为对应的所述反应物分子。

确定所述至少一个合成子的图结构；

通过所述序列学习模型，根据所述产物分子的图结构、所述至少一个合成子的图结构以及所述逆合成反应类型对应的字符串、所述产物分子对应的字符串和所述至少一个合成子对应的字符串，预测所述反应物分子。

可选的，在图7所示的逆合成预测装置的基础上，参见图8，图8为本申请实施例提供的另一种逆合成预测装置800的结构示意图。如图8所示，该逆合成预测装置800还包括：第一训练模块801，所述第一训练模块801用于：

获取第一训练样本；所述第一训练样本包括样本产物分子的图结构、所述样本产物分子中原子的属性特征和所述样本产物分子中的真实断裂化学键，所述样本产物分子为有机化合物分子；

通过待训练的图神经网络模型，根据所述第一训练样本中的所述样本产物分子的图结构和所述样本产物分子中原子的属性特征，确定所述样本产物分子中每个化学键的预测断裂概率；

根据所述样本产物分子中每个化学键的预测断裂概率和所述样本产物分子中的真实断裂化学键，确定第一目标损失函数；

基于所述第一目标损失函数，训练所述待训练的图神经网络模型。

可选的，在图7所示的逆合成预测装置的基础上，参见图9，图9为本申请实施例提供的另一种逆合成预测装置900的结构示意图。如图9所示，该逆合成预测装置900还包括：第二训练模块901，所述第二训练模块901用于：

获取第二训练样本；所述第二训练样本包括对应于同一逆合成反应的第一字符串和第二字符串，所述第一字符串是组合所述逆合成反应类型对应的字符串、样本产物分子对应的字符串以及所述样本产物分子的合成子对应的字符串得到的，所述第二字符串是组合所述逆合成反应的反应物分子对应的字符串得到的，所述样本产物分子为有机化合物分子；

通过待训练的序列学习模型，根据所述第二训练样本中的所述第一字符串，确定第一反应物预测字符串；

根据所述第一反应物预测字符串与所述第二训练样本中的所述第二字符串之间的误差，确定第二目标损失函数；

基于所述第二目标损失函数，训练所述待训练的序列学习模型。

可选的，在图9所示的逆合成预测装置的基础上，所述第二训练样本还包括：对应于所述逆合成反应的第三字符串，所述第三字符串是组合所述逆合成反应类型对应的字符串、所述样本产物分子对应的字符串以及预测合成子对应的字符串得到的，所述预测合成子是基于所述图神经网络模型根据所述样本产物分子的图结构和所述样本产物分子中原子的属性特征预测得到的；

则所述第二训练模块901具体用于：

通过所述待训练的序列学习模型，根据所述第二训练样本中的所述第三字符串，确定第二反应物预测字符串；

根据所述第一反应物预测字符串与所述第二训练样本中的所述第二字符串之间的误差、以及所述第二反应物预测字符串与所述第二训练样本中的所述第二字符串之间的误差，确定所述第二目标损失函数。

本申请实施例提供的逆合成预测装置在逆合成反应预测过程中，不仅利用了产物分子的字符串信息，还通过图神经网络模型将对于有机化合物逆合成反应预测具有较高参考价值的分子图结构信息融入到了预测过程中，如此，能够在一定程度上提高有机化合物逆合成反应的预测准确度；此外，本申请实施例提供的装置先通过图神经网络模型预测断键位置，再通过序列学习模型补全断键处理后的合成子，这种处理方式使得有机化合物逆合成反应的预测过程更易于可视化，且极具可解释性。

本申请实施例还提供了一种用于进行预测逆合成反应的设备，该设备具体可以为服务器和终端设备，下面将从硬件实体化的角度对本申请实施例提供的服务器和终端设备进行介绍。

参见图10，图10为本申请实施例提供的一种服务器1000的结构示意图。该服务器1000可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(central processing units，CPU)1022(例如，一个或一个以上处理器)和存储器1032，一个或一个以上存储应用程序1042或数据1044的存储介质1030(例如一个或一个以上海量存储设备)。其中，存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1022可以设置为与存储介质1030通信，在服务器1000上执行存储介质1030中的一系列指令操作。

服务器1000还可以包括一个或一个以上电源1026，一个或一个以上有线或无线网络接口1050，一个或一个以上输入输出接口1058，和/或，一个或一个以上操作***1041，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由服务器所执行的步骤可以基于该图10所示的服务器结构。

其中，CPU 1022用于执行如下步骤：

可选的，CPU 1022还可以用于执行本申请实施例提供的基于人工智能的逆合成预测方法的任意一种实现方式的步骤。

参见图11，图11为本申请实施例提供的一种终端设备的结构示意图。为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端可以为包括智能手机、计算机、平板电脑、个人数字助理等任意终端设备，以终端为计算机为例：

图11示出的是与本申请实施例提供的终端相关的计算机的部分结构的框图。参考图11，计算机包括：射频(Radio Frequency，RF)电路1111、存储器1120、输入单元1130、显示单元1140、传感器1150、音频电路1160、无线保真(wireless fidelity，WiFi)模块1170、处理器1180、以及电源1190等部件。本领域技术人员可以理解，图11中示出的计算机结构并不构成对计算机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

存储器1120可用于存储软件程序以及模块，处理器1180通过运行存储在存储器1120的软件程序以及模块，从而执行计算机的各种功能应用以及数据处理。存储器1120可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1120可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器1180是计算机的控制中心，利用各种接口和线路连接整个计算机的各个部分，通过运行或执行存储在存储器1120内的软件程序和/或模块，以及调用存储在存储器1120内的数据，执行计算机的各种功能和处理数据，从而对计算机进行整体监控。可选的，处理器1180可包括一个或多个处理单元；优选的，处理器1180可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1180中。

在本申请实施例中，该终端所包括的处理器1180还具有以下功能：

可选的，所述处理器1180还用于执行本申请实施例提供的基于人工智能的逆合成预测方法的任意一种实现方式的步骤。

本申请实施例还提供一种计算机可读存储介质，用于存储计算机程序，该计算机程序用于执行前述各个实施例所述的一种基于人工智能的逆合成预测方法中的任意一种实施方式。

本申请实施例还提供一种包括指令的计算机程序产品，当其在计算机上运行时，使得计算机执行前述各个实施例所述的一种基于人工智能的逆合成预测方法中的任意一种实施方式。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文全称：Read-OnlyMemory，英文缩写：ROM)、随机存取存储器(英文全称：Random Access Memory，英文缩写：RAM)、磁碟或者光盘等各种可以存储计算机程序的介质。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种基于人工智能的逆合成预测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述通过图神经网络模型，至少根据所述产物分子的图结构和所述产物分子中原子的属性特征，预测所述产物分子中的断裂化学键，包括：

3.根据权利要求1所述的方法，其特征在于，所述通过图神经网络模型，至少根据所述产物分子的图结构和所述产物分子中原子的属性特征，预测所述产物分子中的断裂化学键，包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：

获取所述产物分子中化学键的属性特征；

则所述通过图神经网络模型，至少根据所述产物分子的图结构和所述产物分子中原子的属性特征，预测所述产物分子中的断裂化学键，包括：

5.根据权利要求4所述的方法，其特征在于，所述产物分子中原子的属性特征包括以下任意一种或多种：

键类型、共轭特征、环键特征、分子立体化学特征。

6.根据权利要求1所述的方法，其特征在于，所述通过序列学习模型，至少根据逆合成反应类型对应的字符串、所述产物分子对应的字符串以及所述至少一个合成子对应的字符串，预测反应物分子，包括：

将所述目标子字符串转换为对应的所述反应物分子。

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

确定所述至少一个合成子的图结构；

则所述通过序列学习模型，至少根据逆合成反应类型对应的字符串、所述产物分子对应的字符串以及所述至少一个合成子对应的字符串，预测反应物分子，包括：

8.根据权利要求1所述的方法，其特征在于，通过以下方式训练所述图神经网络模型：

9.根据权利要求1所述的方法，其特征在于，通过以下方式训练所述序列学习模型：

10.根据权利要求9所述的方法，其特征在于，所述第二训练样本还包括：对应于所述逆合成反应的第三字符串，所述第三字符串是组合所述逆合成反应类型对应的字符串、所述样本产物分子对应的字符串以及预测合成子对应的字符串得到的，所述预测合成子是基于所述图神经网络模型根据所述样本产物分子的图结构和所述样本产物分子中原子的属性特征预测得到的；

所述方法还包括：

则所述根据所述第一反应物预测字符串与所述第二训练样本中的所述第二字符串之间的误差，确定第二目标损失函数，包括：

11.一种基于人工智能的逆合成预测装置，其特征在于，所述装置包括：

12.根据权利要求11所述的装置，其特征在于，所述第一预测模块具体用于：

13.根据权利要求11所述的装置，其特征在于，所述第二预测模块具体用于：

将所述目标子字符串转换为对应的所述反应物分子。

14.一种设备，其特征在于，所述设备包括处理器及存储器；

所述存储器用于存储计算机程序；

所述处理器用于根据所述计算机程序执行权利要求1至10中任一项所述的基于人工智能的逆合成预测方法。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行权利要求1至10中任一项所述的基于人工智能的逆合成预测方法。