CN113707236B - 基于图神经网络的药物小分子性质预测方法、装置及设备 - Google Patents

基于图神经网络的药物小分子性质预测方法、装置及设备 Download PDF

Info

Publication number
CN113707236B
CN113707236B CN202111005476.0A CN202111005476A CN113707236B CN 113707236 B CN113707236 B CN 113707236B CN 202111005476 A CN202111005476 A CN 202111005476A CN 113707236 B CN113707236 B CN 113707236B
Authority
CN
China
Prior art keywords
molecular
feature vector
small molecule
neural network
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111005476.0A
Other languages
English (en)
Other versions
CN113707236A (zh
Inventor
王俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111005476.0A priority Critical patent/CN113707236B/zh
Publication of CN113707236A publication Critical patent/CN113707236A/zh
Priority to PCT/CN2022/071440 priority patent/WO2023029352A1/zh
Application granted granted Critical
Publication of CN113707236B publication Critical patent/CN113707236B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于图神经网络的药物小分子性质预测方法、装置及设备,涉及人工智能技术领域,可解决目前对药物小分子性质预测的效率较低、准确度不高的技术问题。其中方法包括:依据目标药物小分子的化学分子结构生成分子图结构,以及依据所述目标药物小分子的官能团中间结构生成分子子图结构;利用目标图神经网络模型确定所述分子图结构对应的第一特征向量,以及所述分子子图结构对应的第二特征向量;根据所述第一特征向量和所述第二特征向量构建第三特征向量,并将所述第三特征向量输入训练完成的性质预测模型中,得到所述目标药物小分子的性质预测结果。本申请适用于基于人工智能技术,实现对药物小分子性质的智能化预测。

Description

基于图神经网络的药物小分子性质预测方法、装置及设备
技术领域
本申请涉及人工智能技术领域,尤其涉及到一种基于图神经网络的药物小分子性质预测方法、装置及设备。
背景技术
多环药物小分子是近20年来药物化学领域热点,因为多环结构在提高药理活性和选择性,完善成药性上效果显著,并且兼顾了与靶标结合的微观结构和药代动力学所需求的宏观性质。临床上的多环药物小分子大部分由12~20个原子构成的环肽或内酯,主要用于治疗感染、炎性和肿瘤等疾病,有口服和注射等剂型。多环药物小分子的性质预测,对于进一步提高药物发现中深度学习的潜力至关重要。
传统的多环药物小分子的性质预测方法使用了特征工程,即生成和使用特定问题的分子描述符,如分子指纹、源自量子化学、物理化学和微分拓扑的描述符等,进而通过使用分子描述符(包括1D/2D/3D/高维描述符,比如分子量等物理化学性质)作为输入特征,进行定量构效关系或构效关系(QSAR/QSPR)建模。
然而,这种大量使用分子描述符的建模方法的算法模型预测表现极大取决于人工制作的特征或预定义的描述符。在进行特征工程方面费时费力的同时,在这些体系结构的特征提取过程中,既未考虑也未充分使用内部结构信息,导致较复杂的多环药物小分子的性质预测准确度不高。
发明内容
有鉴于此,本申请提供了一种基于图神经网络的药物小分子性质预测方法、装置及设备,可用于解决目前对药物小分子性质预测的效率较低、准确度不高的技术问题。
根据本申请的一个方面,提供了一种基于图神经网络的药物小分子性质预测方法,该方法包括:
依据目标药物小分子的化学分子结构生成分子图结构,以及依据所述目标药物小分子的官能团中间结构生成分子子图结构;
利用目标图神经网络模型确定所述分子图结构对应的第一特征向量,以及所述分子子图结构对应的第二特征向量;
根据所述第一特征向量和所述第二特征向量构建第三特征向量,并将所述第三特征向量输入训练完成的性质预测模型中,得到所述目标药物小分子的性质预测结果。
根据本申请的另一个方面,提供了一种基于图神经网络的药物小分子性质预测装置,该装置包括:
生成模块,用于依据目标药物小分子的化学分子结构生成分子图结构,以及依据所述目标药物小分子的官能团中间结构生成分子子图结构;
第一确定模块,用于利用目标图神经网络模型确定所述分子图结构对应的第一特征向量,以及所述分子子图结构对应的第二特征向量;
第二确定模块,用于根据所述第一特征向量和所述第二特征向量构建第三特征向量,并将所述第三特征向量输入训练完成的性质预测模型中,得到所述目标药物小分子的性质预测结果。
根据本申请的又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述基于图神经网络的药物小分子性质预测方法。
根据本申请的再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于图神经网络的药物小分子性质预测方法。
借由上述技术方案,本申请提供的一种基于图神经网络的药物小分子性质预测方法、装置及设备,与目前基于描述符的药物小分子性质预测方式相比,本申请可首先生成目标药物小分子的分子图结构和分子子图结构,进而将分子图结构和分子子图结构分别输入目标图神经网络模型,分别确定得到目标药物小分子的第一特征向量以及第二特征向量;进而利用第一特征向量和第二特征向量构建第三特征向量,并将第三特征向量输入训练完成的性质预测模型中,即可确定得到目标药物小分子的性质预测结果。通过本申请中的技术方案,对于包含多环的药物分子,在考虑分子图结构的同时,还引入子图这种介于原子和分子之间的官能团结构信息,结合图神经网络模型,综合多尺度的分子表达实现多环药物小分子的性质预测,可以高效学习到关于药物分子的关键图表示信息,捕捉到不同图数据中的通用结构规律,进而赋予性质预测任务上更好的拟合能力,比传统的分子指纹、描述符等方式具有更好的预测表现,进而能够保证多环药物小分子的性质预测精准度。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本地申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种基于图神经网络的药物小分子性质预测方法的流程示意图;
图2示出了本申请实施例提供的另一种基于图神经网络的药物小分子性质预测方法的流程示意图;
图3示出了本申请实施例提供的一种基于图神经网络的药物小分子性质预测的原理示意图;
图4示出了本申请实施例提供的一种基于图神经网络的药物小分子性质预测装置的结构示意图;
图5示出了本申请实施例提供的另一种基于图神经网络的药物小分子性质预测装置的结构示意图。
具体实施方式
本申请实施例可以基于人工智能技术实现对药物小分子性质的预测。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
下文将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合。
针对目前对药物小分子性质预测的效率较低、准确度不高的技术问题,本申请提供了一种基于图神经网络的药物小分子性质预测方法,如图1所示,该方法包括:
101、依据目标药物小分子的化学分子结构生成分子图结构,以及依据目标药物小分子的官能团中间结构生成分子子图结构。
其中,目标药物小分子为待进行性质预测分析的多环小分子;官能团中间结构为将多环小分子对应化学分子结构中的苯环,用官能团表达后得到的介于原子尺度以及分子尺度之间的结构,官能团中间结构包含化学分子结构中的原官能团以及苯环转化后的新官能团。官能团是介于原子和分子尺度之间的中间尺度,是决定有机化合物的化学性质的原子或原子团。常见官能团包括羟基、羧基、醚键、醛基、羰基等。有机化学反应主要发生在官能团上,官能团对有一种符合一定规律的官能团中间结构。有机物的性质起决定作用,-X、-OH、-CHO、-COOH、-NO2、-SO3H、-NH2、RCO-,这些官能团就决定了有机物中的卤代烃、醇或酚、醛、羧酸、硝基化合物或亚硝酸酯、磺酸类有机物、胺类、酰胺类的化学性质。
鉴于准确预测药物的性质对药物研发至关重要。由于传统的实验方法受到通量和成本的限制,因此发展有效的机器学习方法对药物性质预测具有重要的意义。目前多于多环药物小分子的中间尺度的子图信息挖掘不足,使得模型预测准确率有限。因此,为了准确预测药物分子性质以促进药物研发过程,本申请提出了结合基于图神经网络模型,综合多尺度的分子表达来实现多环药物小分子的性质预测。实验结果表明模型具有较好的预测能力,相对传统的全连接神经网络,以及单一尺度(不包含子图尺度信息提取)预测模型,都具有优于上述各种方法的潜力。
在具体的应用场景中,在执行本实施例步骤之前,可预先提取出目标药物小分子的化学分子结构,进而依据化学分子结构生成官能团中间结构。鉴于苯环就是一个特殊的官能团,但如果要从原子尺度开始学习,图神经网络模型可能需要转几层才能得到苯环的功能信息,那为什么不直接告诉模型这是个苯环?因此,再次可创新地增加了一个官能团尺度的单元级别来显式地直接提取中中间尺度的信息,以更好地实现对分子的表示学习和性质预测。故在本实施例中,在依据化学分子结构生成官能团中间结构时,可将化学分子结构中的苯环替换为官能团,进而得到包含化学分子结构中的原官能团以及苯环转化后的新官能团构建的官能团中间结构。
对于本实施例,可将药物小分子中的每个原子表示为分子图结构中的一个节点(node),原子之间的作用力用节点之间的边(edge)表示。节点可以携带不同的信息从而表达不同的原子符号,而边(edge)也可以携带不同的信息,从而表达不同的作用力方式,这样就把化学分子的化学分子结构用计算机中的分子图结构来表示。相应的,可依据目标药物小分子的官能团中间结构进一步生成分子子图结构,在分子子图结构中,每个节点表示一个官能团,官能团之间的相互作用用节点之间的边表示。通过增加一个官能团尺度的单元级别来显式地直接提取中间尺度的信息,可以更好地实现对分子的表示学习和性质预测。
对于本申请的执行主体可为用于对药物小分子性质预测的装置,可配置在客户端侧或服务端侧,可预先生成目标药物小分子的分子图结构和分子子图结构后,进而将分子图结构和分子子图结构分别输入目标图神经网络模型,分别确定得到目标药物小分子的第一特征向量以及第二特征向量;最后利用第一特征向量和第二特征向量构建得到第三特征向量,并将第三特征向量输入训练完成的性质预测模型中,确定出目标药物小分子的性质预测结果。
102、利用目标图神经网络模型确定分子图结构对应的第一特征向量,以及分子子图结构对应的第二特征向量。
对于本实施例,可应用于图神经网络(Graph Neural Networks,GNN)实现对目标药物小分子的第一特征向量以及第二特征向量的提取。图神经网络(GNN)是深度学***均池化等方式,可以获得整个图的信息向量表示。
在对图神经网络应用前,需要结合任务场景对图神经网络进行预训练。一般情况下,若有充足的数据和标签,可以通过有监督学习的方式对图神经网络进行预训练。但是在现实生活中,常常有大量的数据而仅仅有少量的标签,而标注数据需要耗费大量的精力,若直接丢掉这些未标注的数据也很可惜。因此可为这些未标注数据“造标签”,当然这些标签和学习任务的最终标签不一样,否则也不用模型学习了。例如,想用图神经网络做图上节点的分类,然而有标签的节点很少,这时候可以设计一些其他任务,比如利用图神经网络预测节点的度,节点的度信息可以简单的统计得到,通过这样的学习,希望图神经网络能够学习到每个节点在图结构中的局部信息,而这些信息对于最终的节点分类任务是有帮助的。在上面的例子中,节点的标签是最终想要预测的标签,而节点的度是造出来的标签。通过使用图神经网络预测节点的度,可以得到:1)适用于节点度预测的节点embedding;2)适用于节点度预测任务的图神经网络的权重矩阵。然后可以将节点embedding接到分类器中并使用有标签的数据进行分类学习;直接在图神经网络上使用有标签的数据继续训练,调整权重矩阵,以得到适用于节点分类任务的模型。
相应的,本申请中,为了通过图网络学习分子级别表示,可从大规模无标注数据中创造伪标签作为监督信号,利用此构造监督信号,对模型进行有监督学习,从而有效地学习到数据中的潜在特征和信息。故在执行本实施例步骤之前,作为一种优选方式,实施例步骤具体可以包括:获取未标记图数据集和第一标记图数据集,第一标记图数据集的训练任务与预设性质预测任务不同;将未标记图数据集作为训练样本,通过对预设的图神经网络模型进行训练,调整图神经网络模型的参数,得到第一图神经网络模型;将第一标记图数据集作为训练样本,通过对第一图神经网络模型进行训练,调整第一图神经网络模型的参数,得到第二图神经网络模型;将预设性质预测任务对应的第二标记图数据集作为训练样本,通过对第二图神经网络模型进行训练,调整第二图神经网络模型的参数,得到目标图神经网络模型。由于在得到第一图神经网络模型之后、得到应用于待应用场景的图神经网络之前,将第一标记图数据集作为训练样本,通过对第一图神经网络模型进行训练,调整第一图神经网络模型的参数,所得到的第二图神经网络模型学习到了如何对标记图数据这一形式的图数据进行基础的数据处理、分析等规律。再采用第二标记图数据作为训练样本,对第二图神经网络模型进行训练时,使得第二图神经网络模型能够快速地对第二标记图数据进行处理和分析,从而进一步提高了模型训练的效率,并优化了训练得到的图神经网络的质量。
其中,在上述基于训练样本对图神经网络模型进行训练,并调整图神经网络模型的参数时,可从图数据的邻接矩阵中,随机掩盖(mask)掉约15%比例的节点或者节点的连接关系,来扰动原图的完整性(例如原始分子图数据有20个原子节点,随机从中掩盖掉15%左右的3个节点,邻接矩阵也相应扰动变换),通过此方式来构造学习目标,让模型通过学习预测被掩盖的节点或节点连接关系的方式,来学习图数据的节点的紧凑的信息表达。如果模型能够较好的预测出被掩盖的节点或者节点属性,说明模型已经学到了关于数据的基本知识,后续学习其他的后续任务时,能够获得更好的表现。
相应的,对于本实施例,在训练得到目标图神经网络模型后,可将目标药物小分子的分子图结构输入目标图神经网络模型,得到对应分子尺度下的第一特征向量;此外,还可将目标药物小分子的官能团中间结构输入目标图神经网络模型,得到对应中间尺度下的第二特征向量,以便利用第一特征向量和第二特征向量构建目标药物小分子的多尺度分子表达。
103、根据第一特征向量和第二特征向量构建第三特征向量,并将第三特征向量输入训练完成的性质预测模型中,得到目标药物小分子的性质预测结果。
其中,性质预测模型可对应现有神经网络模型中的任意一种,例如可为线性回归模型、决策树模型、神经网络模型、支持向量机模型、隐马尔可夫模型等,在本申请中不进行具体的限定;性质预测结果具体可包括靶标结合性质预测、活性预测、毒性预测、功效预测、水溶性预测、不良反应预测、针对某一疾病的治疗效果预测等预测中的一种或多种,具体可根据实际应用预测场景进行性质预测类型的设定,在本方案中不进行具体的限定。需要说明的的是,在执行本实施例步骤之前,需要预先利用标签样本对性质预测模型进行训练,以便利用训练完成的性质预测模型实现对目标药物小分子的性质预测。
对于本实施例,在基于实施例步骤102确定得到目标药物小分子对应分子尺度下的第一特征向量以及中间尺度下的第二特征向量后,可通过融合第一特征向量和第二特征向量,将融合得到的第三特征向量输入训练完成的性质预测模型中,确定得到目标药物小分子的性质预测结果。
通过本实施例中基于图神经网络的药物小分子性质预测方法,可首先生成目标药物小分子的分子图结构和分子子图结构,进而将分子图结构和分子子图结构分别输入目标图神经网络模型,分别确定得到目标药物小分子的第一特征向量以及第二特征向量;进而利用第一特征向量和第二特征向量构建第三特征向量,并将第三特征向量输入训练完成的性质预测模型中,即可确定得到目标药物小分子的性质预测结果。通过本申请中的技术方案,对于包含多环的药物分子,在考虑分子图结构的同时,还引入子图这种介于原子和分子之间的官能团结构信息,结合图神经网络模型,综合多尺度的分子表达实现多环药物小分子的性质预测,可以高效学习到关于药物分子的关键图表示信息,捕捉到不同图数据中的通用结构规律,进而赋予性质预测任务上更好的拟合能力,比传统的分子指纹、描述符等方式具有更好的预测表现,进而能够保证多环药物小分子的性质预测精准度。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例中的具体实施过程,提供了另一种基于图神经网络的药物小分子性质预测方法,如图2所示,该方法包括:
201、依据目标药物小分子的化学分子结构生成分子图结构,以及依据目标药物小分子的官能团中间结构生成分子子图结构。
作为一种优选方式,实施例步骤201具体可以包括:获取目标药物小分子的化学分子结构,将化学分子结构中的原子确定为分子图结构中的节点,将化学分子结构中的原子连接关系确定为分子图结构中的边,生成目标药物小分子的分子图结构;获取目标小分子的官能团中间结构,将官能团中间结构中的官能团确定为分子子图结构中的节点,将官能团中间结构中的官能团连接关系确定为分子子图结构中的边,生成目标药物小分子关于中间尺度的分子子图结构。
202、将分子图结构和分子图结构中携带的邻接矩阵、属性信息输入目标图神经网络模型,获取分子图结构中各个节点的节点隐向量。
对于本实施例,在执行本实施例步骤之前,需要对图神经网络模型进行预训练,进而利用预训练完成的目标图神经网络模型确定分子图结构中各个节点的节点隐向量。其中,具体的预训练过程与实施例步骤102中的预训练过程相同,再次不再赘述。
其中,邻接矩阵为表示节点连接关系构成的n*n矩阵,在邻接矩阵中有连接关系的元素表示为1,没有连接关系的元素为0,n为目标小分子包含的节点个数;属性信息可包括原子的节点初始特征向量以及边初始特征向量。节点初始特征向量是按照第一预设向量生成规则生成的,其中,第一预设向量生成规则可参见表1所示,节点初始特征向量可为由6位化学键个数+5位形式电荷+4位原子手性+5位绑定的氢原子个数+5位原子轨道混成+1位芳香性+1位原子质量构成的27位特征向量。边初始特征向量是按照第二预设向量生成规则生成的,其中,第二预设向量生成规则可参见表2所示,边初始特征向量可为由4位化学键类型+1位共轭性+1位在环中+6位立体性构成的12位特征向量。
表1
表2
对于本实施例,可将分子图结构和分子图结构中携带的邻接矩阵、属性信息输入目标图神经网络模型,利用目标图神经网络模型的迭代学习,得到分子图结构中各个节点的节点隐向量。
特别地,目标图神经网络模型学习的主要过程是通过迭代对图数据中节点的邻居信息进行聚合和更新。在一次迭代中,每一个节点通过聚合邻居节点的特征及自己在上一层的特征来更新自己的信息,通常也会对聚合后的信息进行非线性变换。通过堆叠多层网络,每个节点可以获取到相应跳数内的邻居节点信息。
其中,图神经网络模型的学习以节点消息传递的方式理解的话,涉及到两个过程,信息传递(message passing)阶段和读出(readout)阶段。信息传递阶段就是前向传播阶段,该阶段循环运行T个steps,并通过信息函数Mt获取信息,通过更新函数Ut更新节点。
信息函数Mt和更新函数Ut的公式特征描述为:
其中,evw表示从节点v到w的边的特征向量。
读出(readout)阶段计算一个特征向量用于整个图的表示(representation),使用函数R实现,函数R的公式特征描述为:
其中表示整个时间step数,其中的函数Mt,Ut和R可以使用不同的模型设置,如图卷积网络(Graph Convolutional Network,GCN)、注意力模型(Graph Attention,GAT)等。
目标图神经网络模型对分子表示学***衡不再变化。于是,有了每个节点的最终稳定的特征向量,相比于原始的节点特征向量,每个节点最终的特征向量还包含了其邻居节点和整个图的信息(例如,化学分子中的某些原子节点,假设其对分子的某项性质的贡献最大,在最终的特征向量中就会有相应的更特异的表达)。
203、利用各个节点的节点隐向量生成目标药物小分子的第一特征向量。
对于本实施例,在基于实施例步骤202确定出分子图结构中各个节点的节点隐向量后,可进一步依据各个节点的节点隐向量获得整个分子结构图的信息向量表示(如通过原子节点的特征,和原子之间的连边化学键信息,抽取出整个分子化合物的分子级别的信息表示)。作为一种优选方式,实施例步骤203具体可以包括:计算节点隐向量的隐向量平均值,将隐向量平均值确定为目标药物小分子的第一特征向量;或,在节点隐向量提取对应隐向量值最大的第一节点隐向量,将第一节点隐向量确定为第一特征向量。
204、将分子子图结构输入目标图神经网络模型,确定目标药物小分子的第二特征向量。
对于本实施例,在执行本实施例步骤之前,同样需要对图神经网络模型进行预训练,进而利用预训练完成的目标图神经网络模型确定分子图结构中各个节点的节点隐向量。其中,具体的预训练过程与实施例步骤102中的预训练过程相同,再次不再赘述。需要说明的是,本申请对实施例步骤202-203中的第一特征向量的确定过程与本实施例步骤中第二特征向量的确定过程不做具体执行顺序的限定,可优先执行其中任一确定过程。
205、根据第一特征向量和第二特征向量构建第三特征向量,并将第三特征向量输入训练完成的性质预测模型中,得到目标药物小分子的性质预测结果。
在具体的应用场景中,在执行本实施例步骤之前,实施例步骤具体还包括:将与目标药物小分子对应预设性质预测任务匹配的样本特征向量作为训练样本,训练预设的性质预测模型;计算性质预测模型的损失函数,在损失函数小于预设阈值时,判定性质预测模型训练完成。其中,损失函数用于表示性质预测模型的预测结果相对于样本标记结果的预测误差,预设阈值取值在0到1之间,用于表示性质预测模型的训练精度,预设阈值越接近于1,表示性质预测模型的训练精度越高,预设阈值的具体数值可根据实际应用场景进行设定,在此不作具体的限定。性质预测模型可对应现有神经网络模型中的任意一种,例如可为线性回归模型、决策树模型、神经网络模型、支持向量机模型、隐马尔可夫模型等,可根据实际应用需求进行适应性选取,在本申请中不进行具体的限定。
相应的,对于本实施例,作为一种优选方式,实施例步骤205具体可以包括:按照预设向量拼接规则对第一特征向量和第二特征向量进行向量拼接处理,得到第三特征向量;将第三特征向量作为输入特征,输入训练完成的性质预测模型中,获取目标药物小分子的性质预测结果。其中,预设向量拼接规则可包括:将第一特征向量拼接在第二特征向量之后,得到第三特征向量;或,将第二特征向量拼接在第一特征向量之后,得到第三特征向量;或,将第一特征向量和第二特征向量相加,得到第三特征向量等。
对于本申请,基于图神经网络的药物小分子性质预测过程可参见图3所示的基于图神经网络的药物小分子性质预测的原理示意图,对于同一多环目标药物小分子,可首先在原子尺度,依据目标药物小分子的化学分子结构生成分子图结构,以及在官能团尺度,依据目标药物小分子的官能团中间结构生成分子子图结构,其中,官能团中间结构是将多环小分子对应化学分子结构中的苯环,用官能团表达后得到的介于原子尺度以及分子尺度之间的结构,官能团中间结构包含化学分子结构中的原官能团以及苯环转化后的新官能团;进而利用目标图神经网络模型(Graph Neural Networks,GNN)确定所述分子图结构对应的第一特征向量,以及所述分子子图结构对应的第二特征向量;最后根据第一特征向量和所述第二特征向量构建得到多尺度表达的第三特征向量,并将所述第三特征向量输入训练完成的性质预测模型中,即可确定出所述目标药物小分子的性质预测结果。
借由上述基于图神经网络的药物小分子性质预测方法,可首先生成目标药物小分子的分子图结构和分子子图结构,进而将分子图结构和分子子图结构分别输入目标图神经网络模型,分别确定得到目标药物小分子的第一特征向量以及第二特征向量;进而利用第一特征向量和第二特征向量构建第三特征向量,并将第三特征向量输入训练完成的性质预测模型中,即可确定得到目标药物小分子的性质预测结果。通过本申请中的技术方案,对于包含多环的药物分子,在考虑分子图结构的同时,还引入子图这种介于原子和分子之间的官能团结构信息,结合图神经网络模型,综合多尺度的分子表达实现多环药物小分子的性质预测,可以高效学习到关于药物分子的关键图表示信息,捕捉到不同图数据中的通用结构规律,进而赋予性质预测任务上更好的拟合能力,比传统的分子指纹、描述符等方式具有更好的预测表现,进而能够保证多环药物小分子的性质预测精准度。此外,基于图神经网络结合分子的拓扑结构信息学习,只需要相对少量的有标签数据即可获得良好的精度结果,使原来的手工调参、依靠机器学习工程师和专家的方式,转变到可适用于大规模、可复制的智能化工业拓展的方式,进而能够提高药物小分子的性质预测效率,节省预测成本。
进一步的,作为图1和图2所示方法的具体实现,本申请实施例提供了一种基于图神经网络的药物小分子性质预测装置,如图4所示,该装置包括:生成模块31、第一确定模块32、第二确定模块33;
生成模块31,可用于依据目标药物小分子的化学分子结构生成分子图结构,以及依据目标药物小分子的官能团中间结构生成分子子图结构;
第一确定模块32,可用于利用目标图神经网络模型确定分子图结构对应的第一特征向量,以及分子子图结构对应的第二特征向量;
第二确定模块33,可用于根据第一特征向量和第二特征向量构建第三特征向量,并将第三特征向量输入训练完成的性质预测模型中,得到目标药物小分子的性质预测结果。
在具体的应用场景中,生成模块31,具体可用于获取目标药物小分子的化学分子结构,将化学分子结构中的原子确定为分子图结构中的节点,将化学分子结构中的原子连接关系确定为分子图结构中的边,生成目标药物小分子的分子图结构;获取目标小分子的官能团中间结构,将官能团中间结构中的官能团确定为分子子图结构中的节点,将官能团中间结构中的官能团连接关系确定为分子子图结构中的边,生成目标药物小分子关于中间尺度的分子子图结构。
相应的,为了通过对图神经网络模型的预训练,得到目标图神经网络模型,如图5所示,该装置还包括:获取模块34、第一训练模块35、第二训练模块36、第三训练模块37;
获取模块34,可用于获取未标记图数据集和第一标记图数据集,第一标记图数据集的训练任务与预设性质预测任务不同;
第一训练模块35,可用于将未标记图数据集作为训练样本,通过对预设的图神经网络模型进行训练,调整图神经网络模型的参数,得到第一图神经网络模型;
第二训练模块36,可用于将第一标记图数据集作为训练样本,通过对第一图神经网络模型进行训练,调整第一图神经网络模型的参数,得到第二图神经网络模型;
第三训练模块37,可用于将预设性质预测任务对应的第二标记图数据集作为训练样本,通过对第二图神经网络模型进行训练,调整第二图神经网络模型的参数,得到目标图神经网络模型。
在具体的应用场景中,分子图结构中携带有邻接矩阵以及属性信息,属性信息包含节点初始特征向量和边初始特征向量,其中,节点初始特征向量和边初始特征向量是依据预设向量生成规则确定的;相应的,第一确定模块32,具体可用于将分子图结构、邻接矩阵和属性信息输入目标图神经网络模型,获取分子图结构中各个节点的节点隐向量;利用各个节点的节点隐向量生成目标药物小分子的第一特征向量;将分子子图结构输入目标图神经网络模型,确定目标药物小分子的第二特征向量。
相应的,在利用各个节点的节点隐向量生成目标药物小分子的第一特征向量时,第一确定模块32,具体可用于计算节点隐向量的隐向量平均值,将隐向量平均值确定为目标药物小分子的第一特征向量;或,在节点隐向量提取对应隐向量值最大的第一节点隐向量,将第一节点隐向量确定为第一特征向量。
在具体的应用场景中,第二确定模块33,具体可用于按照预设向量拼接规则对第一特征向量和第二特征向量进行向量拼接处理,得到第三特征向量;将第三特征向量作为输入特征,输入训练完成的性质预测模型中,获取目标药物小分子的性质预测结果。
相应的,为了预先对性质预测模型进行训练,如图5所示,该装置还包括:第四训练模块38、计算模块39;
第四训练模块38,可用于将与目标药物小分子对应预设性质预测任务匹配的样本特征向量作为训练样本,训练预设的性质预测模型;
计算模块39,可用于计算性质预测模型的损失函数,在损失函数小于预设阈值时,判定性质预测模型训练完成。
需要说明的是,本实施例提供的一种基于图神经网络的药物小分子性质预测装置所涉及各功能单元的其他相应描述,可以参考图1至图2的对应描述,在此不再赘述。
基于上述如图1至图2所示方法,相应的,本实施例还提供了一种存储介质,存储介质具体可为易失性或非易失性,其上存储有计算机可读指令,该可读指令被处理器执行时实现上述如图1至图2所示的基于图神经网络的药物小分子性质预测方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景的方法。
基于上述如图1至图2所示的方法和图4、图5所示的虚拟装置实施例,为了实现上述目的,本实施例还提供了一种计算机设备,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1至图2所示的基于图神经网络的药物小分子性质预测方法。
可选的,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作***、网络通信模块。操作***是管理上述计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。
通过应用本申请的技术方案,与目前现有技术相比,本申请可首先生成目标药物小分子的分子图结构和分子子图结构,进而将分子图结构和分子子图结构分别输入目标图神经网络模型,分别确定得到目标药物小分子的第一特征向量以及第二特征向量;进而利用第一特征向量和第二特征向量构建第三特征向量,并将第三特征向量输入训练完成的性质预测模型中,即可确定得到目标药物小分子的性质预测结果。通过本申请中的技术方案,对于包含多环的药物分子,在考虑分子图结构的同时,还引入子图这种介于原子和分子之间的官能团结构信息,结合图神经网络模型,综合多尺度的分子表达实现多环药物小分子的性质预测,可以高效学习到关于药物分子的关键图表示信息,捕捉到不同图数据中的通用结构规律,进而赋予性质预测任务上更好的拟合能力,比传统的分子指纹、描述符等方式具有更好的预测表现,进而能够保证多环药物小分子的性质预测精准度。此外,基于图神经网络结合分子的拓扑结构信息学习,只需要相对少量的有标签数据即可获得良好的精度结果,使原来的手工调参、依靠机器学习工程师和专家的方式,转变到可适用于大规模、可复制的智能化工业拓展的方式,进而能够提高药物小分子的性质预测效率,节省预测成本。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (8)

1.一种基于图神经网络的药物小分子性质预测方法,其特征在于,包括:
依据目标药物小分子的化学分子结构生成分子图结构,以及依据所述目标药物小分子的官能团中间结构生成分子子图结构,包括:获取目标药物小分子的化学分子结构,将所述化学分子结构中的原子确定为所述分子图结构中的节点,将所述化学分子结构中的原子连接关系确定为所述分子图结构中的边,生成所述目标药物小分子的分子图结构;
获取所述目标药物小分子的官能团中间结构,将所述官能团中间结构中的官能团确定为所述分子子图结构中的节点,将所述官能团中间结构中的官能团连接关系确定为所述分子子图结构中的边,生成所述目标药物小分子关于中间尺度的分子子图结构,其中,所述官能团中间结构是将所述目标药物小分子对应化学分子结构中的苯环,用官能团表达后得到的介于原子尺度以及分子尺度之间的结构,所述官能团中间结构包含化学分子结构中的原官能团以及苯环转化后的新官能团;
利用目标图神经网络模型确定所述分子图结构对应的第一特征向量,以及所述分子子图结构对应的第二特征向量,其中,所述分子图结构中携带有邻接矩阵以及属性信息,所述属性信息包含节点初始特征向量和边初始特征向量,所述节点初始特征向量和所述边初始特征向量是依据预设向量生成规则确定的;
所述利用目标图神经网络模型确定所述分子图结构对应的第一特征向量,以及所述分子子图结构对应的第二特征向量,包括:
将所述分子图结构、所述邻接矩阵和所述属性信息输入目标图神经网络模型,获取所述分子图结构中各个节点的节点隐向量;
利用所述各个节点的节点隐向量生成所述目标药物小分子的第一特征向量;
将所述分子子图结构输入所述目标图神经网络模型,确定所述目标药物小分子的第二特征向量;
根据所述第一特征向量和所述第二特征向量构建第三特征向量,并将所述第三特征向量输入训练完成的性质预测模型中,得到所述目标药物小分子的性质预测结果。
2.根据权利要求1所述的方法,其特征在于,在利用目标图神经网络模型确定所述分子图结构对应的第一特征向量,以及所述分子子图结构对应的第二特征向量之前,包括:
获取未标记图数据集和第一标记图数据集,所述第一标记图数据集的训练任务与预设性质预测任务不同;
将所述未标记图数据集作为训练样本,通过对预设的图神经网络模型进行训练,调整所述图神经网络模型的参数,得到第一图神经网络模型;
将所述第一标记图数据集作为训练样本,通过对所述第一图神经网络模型进行训练,调整所述第一图神经网络模型的参数,得到第二图神经网络模型;
将所述预设性质预测任务对应的第二标记图数据集作为训练样本,通过对所述第二图神经网络模型进行训练,调整所述第二图神经网络模型的参数,得到目标图神经网络模型。
3.根据权利要求1所述的方法,其特征在于,所述利用所述各个节点的节点隐向量生成所述目标药物小分子的第一特征向量,包括:
计算所述节点隐向量的隐向量平均值,将所述隐向量平均值确定为所述目标药物小分子的第一特征向量;或,
在所述节点隐向量提取对应隐向量值最大的第一节点隐向量,将所述第一节点隐向量确定为所述第一特征向量。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征向量和所述第二特征向量构建第三特征向量,并将所述第三特征向量输入训练完成的性质预测模型中,得到所述目标药物小分子的性质预测结果,包括:
按照预设向量拼接规则对所述第一特征向量和所述第二特征向量进行向量拼接处理,得到第三特征向量;
将所述第三特征向量作为输入特征,输入训练完成的性质预测模型中,获取所述目标药物小分子的性质预测结果。
5.根据权利要求1所述的方法,其特征在于,在根据所述第一特征向量和所述第二特征向量构建第三特征向量,并将所述第三特征向量输入训练完成的性质预测模型中,确定所述目标药物小分子的性质预测结果之前,所述方法还包括:
将与所述目标药物小分子对应预设性质预测任务匹配的样本特征向量作为训练样本,训练预设的性质预测模型;
计算所述性质预测模型的损失函数,在所述损失函数小于预设阈值时,判定所述性质预测模型训练完成。
6.一种基于图神经网络的药物小分子性质预测装置,其特征在于,包括:
生成模块,用于依据目标药物小分子的化学分子结构生成分子图结构,以及依据所述目标药物小分子的官能团中间结构生成分子子图结构,包括:获取目标药物小分子的化学分子结构,将所述化学分子结构中的原子确定为所述分子图结构中的节点,将所述化学分子结构中的原子连接关系确定为所述分子图结构中的边,生成所述目标药物小分子的分子图结构;
获取所述目标药物小分子的官能团中间结构,将所述官能团中间结构中的官能团确定为所述分子子图结构中的节点,将所述官能团中间结构中的官能团连接关系确定为所述分子子图结构中的边,生成所述目标药物小分子关于中间尺度的分子子图结构,其中,所述官能团中间结构是将所述目标药物小分子对应化学分子结构中的苯环,用官能团表达后得到的介于原子尺度以及分子尺度之间的结构,所述官能团中间结构包含化学分子结构中的原官能团以及苯环转化后的新官能团;
第一确定模块,用于利用目标图神经网络模型确定所述分子图结构对应的第一特征向量,以及所述分子子图结构对应的第二特征向量,其中,所述分子图结构中携带有邻接矩阵以及属性信息,所述属性信息包含节点初始特征向量和边初始特征向量,所述节点初始特征向量和所述边初始特征向量是依据预设向量生成规则确定的;
所述利用目标图神经网络模型确定所述分子图结构对应的第一特征向量,以及所述分子子图结构对应的第二特征向量,包括:
将所述分子图结构、所述邻接矩阵和所述属性信息输入目标图神经网络模型,获取所述分子图结构中各个节点的节点隐向量;
利用所述各个节点的节点隐向量生成所述目标药物小分子的第一特征向量;
将所述分子子图结构输入所述目标图神经网络模型,确定所述目标药物小分子的第二特征向量;
第二确定模块,用于根据所述第一特征向量和所述第二特征向量构建第三特征向量,并将所述第三特征向量输入训练完成的性质预测模型中,得到所述目标药物小分子的性质预测结果。
7.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至5中任一项所述的基于图神经网络的药物小分子性质预测方法。
8.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至5中任一项所述的基于图神经网络的药物小分子性质预测方法。
CN202111005476.0A 2021-08-30 2021-08-30 基于图神经网络的药物小分子性质预测方法、装置及设备 Active CN113707236B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111005476.0A CN113707236B (zh) 2021-08-30 2021-08-30 基于图神经网络的药物小分子性质预测方法、装置及设备
PCT/CN2022/071440 WO2023029352A1 (zh) 2021-08-30 2022-01-11 基于图神经网络的药物小分子性质预测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111005476.0A CN113707236B (zh) 2021-08-30 2021-08-30 基于图神经网络的药物小分子性质预测方法、装置及设备

Publications (2)

Publication Number Publication Date
CN113707236A CN113707236A (zh) 2021-11-26
CN113707236B true CN113707236B (zh) 2024-05-14

Family

ID=78656947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111005476.0A Active CN113707236B (zh) 2021-08-30 2021-08-30 基于图神经网络的药物小分子性质预测方法、装置及设备

Country Status (2)

Country Link
CN (1) CN113707236B (zh)
WO (1) WO2023029352A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113707236B (zh) * 2021-08-30 2024-05-14 平安科技(深圳)有限公司 基于图神经网络的药物小分子性质预测方法、装置及设备
WO2023115343A1 (zh) * 2021-12-21 2023-06-29 深圳晶泰科技有限公司 数据处理方法、装置、模型训练方法和预测自由能方法
CN114496302A (zh) * 2021-12-29 2022-05-13 深圳云天励飞技术股份有限公司 药物适应症的预测方法及相关设备
CN114358202A (zh) * 2022-01-11 2022-04-15 平安科技(深圳)有限公司 基于药物分子图像分类的信息推送方法及装置
CN114386694B (zh) * 2022-01-11 2024-02-23 平安科技(深圳)有限公司 基于对比学习的药物分子性质预测方法、装置及设备
CN115274008A (zh) * 2022-08-08 2022-11-01 苏州创腾软件有限公司 基于图神经网络的分子性质预测方法和***
CN116189809B (zh) * 2023-01-06 2024-01-09 东南大学 一种基于对抗攻击的药物分子重要节点预测方法
CN116705195B (zh) * 2023-06-07 2024-03-26 之江实验室 基于矢量量化的图神经网络的药物性质预测方法和装置
CN117612633B (zh) * 2024-01-23 2024-04-09 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种药物分子性质预测方法
CN118072861B (zh) * 2024-04-17 2024-07-23 烟台国工智能科技有限公司 一种基于多模态特征融合的分子优化方法、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428848A (zh) * 2019-09-05 2020-07-17 中国海洋大学 基于自编码器和3阶图卷积的分子智能设计方法
CN111816252A (zh) * 2020-07-21 2020-10-23 腾讯科技(深圳)有限公司 一种药物筛选方法、装置及电子设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019018780A1 (en) * 2017-07-20 2019-01-24 The University Of North Carolina At Chapel Hill NON-TRANSIENT COMPUTER-READABLE METHODS, SYSTEMS, AND MEDIA FOR THE AUTOMATED DESIGN OF MOLECULES HAVING DESIRED PROPERTIES USING ARTIFICIAL INTELLIGENCE
US10923214B2 (en) * 2017-09-07 2021-02-16 Accutar Biotechnology Inc. Neural network for predicting drug property
US11727282B2 (en) * 2018-03-05 2023-08-15 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods for spatial graph convolutions with applications to drug discovery and molecular simulation
CN109033738B (zh) * 2018-07-09 2022-01-11 湖南大学 一种基于深度学习的药物活性预测方法
CN111933225B (zh) * 2020-09-27 2021-01-05 平安科技(深圳)有限公司 药物分类方法、装置、终端设备以及存储介质
CN113011282A (zh) * 2021-02-26 2021-06-22 腾讯科技(深圳)有限公司 图数据处理方法、装置、电子设备及计算机存储介质
CN113241128B (zh) * 2021-04-29 2022-05-13 天津大学 基于分子空间位置编码注意力神经网络模型的分子性质预测方法
CN113299354B (zh) * 2021-05-14 2023-06-30 中山大学 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
CN113707236B (zh) * 2021-08-30 2024-05-14 平安科技(深圳)有限公司 基于图神经网络的药物小分子性质预测方法、装置及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428848A (zh) * 2019-09-05 2020-07-17 中国海洋大学 基于自编码器和3阶图卷积的分子智能设计方法
CN111816252A (zh) * 2020-07-21 2020-10-23 腾讯科技(深圳)有限公司 一种药物筛选方法、装置及电子设备

Also Published As

Publication number Publication date
WO2023029352A1 (zh) 2023-03-09
CN113707236A (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN113707236B (zh) 基于图神经网络的药物小分子性质预测方法、装置及设备
CN113707235B (zh) 基于自监督学习的药物小分子性质预测方法、装置及设备
CN114386694B (zh) 基于对比学习的药物分子性质预测方法、装置及设备
Wang et al. Exploiting ontology graph for predicting sparsely annotated gene function
He et al. A generalization of vit/mlp-mixer to graphs
CN113393911A (zh) 一种基于深度学习的配体化合物快速预筛选模型
CN111627494A (zh) 基于多维特征的蛋白质性质预测方法、装置和计算设备
CN116417093A (zh) 一种结合Transformer和图神经网络的药物靶标相互作用预测方法
CN115148302A (zh) 一种基于图神经网络与多任务学习的化合物性质预测方法
Liu et al. RBCN: Rectified binary convolutional networks for enhancing the performance of 1-bit DCNNs
Wang et al. G-DipC: an improved feature representation method for short sequences to predict the type of cargo in cell-penetrating peptides
Liu et al. Multispectral scene classification via cross-modal knowledge distillation
CN114613450A (zh) 药物分子的性质预测方法、装置、存储介质及计算机设备
Bhardwaj et al. Computational biology in the lens of CNN
Liu et al. Efficient pyramid context encoding and feature embedding for semantic segmentation
CN109784404A (zh) 一种融合标签信息的多标签分类原型***及方法
CN117321692A (zh) 用于从分子图生成任务相关的结构嵌入的方法和***
CN111259176B (zh) 融合有监督信息的基于矩阵分解的跨模态哈希检索方法
CN116705192A (zh) 基于深度学习的药物虚拟筛选方法及装置
CN116978464A (zh) 数据处理方法、装置、设备以及介质
CN115862767A (zh) 基于图学习的抗lrrk2小分子药物预测和筛选方法
Wang et al. Sparse imbalanced drug-target interaction prediction via heterogeneous data augmentation and node similarity
CN116092577A (zh) 一种基于多源异质信息聚合的蛋白质功能预测方法
Peng et al. Pocket-specific 3d molecule generation by fragment-based autoregressive diffusion models
Xue et al. Fast and unsupervised neural architecture evolution for visual representation learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant