CN111429977A - 一种新的基于图结构注意力的分子相似性搜索算法 - Google Patents
一种新的基于图结构注意力的分子相似性搜索算法 Download PDFInfo
- Publication number
- CN111429977A CN111429977A CN201910839118.6A CN201910839118A CN111429977A CN 111429977 A CN111429977 A CN 111429977A CN 201910839118 A CN201910839118 A CN 201910839118A CN 111429977 A CN111429977 A CN 111429977A
- Authority
- CN
- China
- Prior art keywords
- molecular
- similarity
- graph
- molecules
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010845 search algorithm Methods 0.000 title claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 30
- 239000013598 vector Substances 0.000 claims abstract description 30
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 230000007246 mechanism Effects 0.000 claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 3
- 230000001537 neural effect Effects 0.000 claims description 2
- 239000000126 substance Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- QWTDNUCVQCZILF-UHFFFAOYSA-N isopentane Chemical compound CCC(C)C QWTDNUCVQCZILF-UHFFFAOYSA-N 0.000 description 4
- CRSOQBOWXPBRES-UHFFFAOYSA-N neopentane Chemical compound CC(C)(C)C CRSOQBOWXPBRES-UHFFFAOYSA-N 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- AFABGHUZZDYHJO-UHFFFAOYSA-N dimethyl butane Natural products CCCC(C)C AFABGHUZZDYHJO-UHFFFAOYSA-N 0.000 description 2
- 238000007876 drug discovery Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000003041 virtual screening Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Physics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种新的基于图结构注意力的分子相似性搜索算法,包括如下步骤:步骤1、使用相似分子作为预训练数据,通过图卷积神经网络将相似分子表达为分子图的格式,在图卷积神经网络中引入了注意力机制,将分子图转换为特征向量;步骤2、通过训练得到公式中的参数,得到相似性计算公式;步骤3、采用步骤1的方法,将新的分子表达为新分子图的格式,并将新的分子图转换为新的特征向量,通过相似性计算公式进行相似性计算,得到相似性得分,借此,本发明具有在保证了搜索广泛性的同时,提高了分子相似性计算的准确度的优点。
Description
技术领域
本发明属于分子相似性搜索领域,特别涉及一种新的基于图结构注意力的分子相似性搜索算法。
背景技术
目前,随着信息技术的快速发展,计算机在药物发掘领域中信息化手段扮演的角色越来越重要。近年来人工智能的发展,为药物发掘工作带来了更多的可能性。分子相似性搜索是药物小分子发掘工程中一项重要的技术,它为许多现有的虚拟筛选技术奠定了理论基础,在发掘药物小分子的过程中,通过已知小分子搜索相似性的小分子是一种常用的筛选手段。
在化学分析中,基于相似性的物化性质分析、相似相溶原理等等都是以
“具有相似结构的化合物一般也具有相似的物理化学性质”为基础。分子相似性作为化学信息学中的最重要的主题之一,是指两个分子或化合物在结构上的相似程度。基于计算机模拟的筛选方法在很大程度上可以归结于对小分子理化特征和结构信息的提取、分析和比较。进行筛选操作的基础便是首先将化合物分子转换成为一种机器可以识别的表示形式。现有的许多相似度计算方法并非直接作用于分子的原始表示形式,而是首先需要将化合物分子的理化特性与结构信息用分子描述符的形式表示出来,因为只有这样才能使用物理或者数学模型对分子的特征进行评价和比较。目前,在药学研究领域每年都会有数量庞大的不同分子描述符被报道。
在计算化学领域,相似系数法是比较常用的一种方法,利用相似系数如先行代码,最大相似邻接关系法,股本距离等计算分子相似程度。现在常用的谷本距离是先将分子用分子指纹的方式表达出来,在计算分子指纹的谷本系数。分子指纹常用的如ECFP4是二进制格式的2D分子结构的表征。通过分子指纹之间的重叠来计算分子之间的结构相似性,2D指纹方法由于其计算效率和有效性而成为基于2D相似性的虚拟筛选的选择方法,广泛使用的谷本系数公式。
但是,现有技术的第一个主要缺点是分子指纹种类很多,两个数据集的分子指纹不能拿来直接用,给实验计算造成了一定难度,限制了大批量计算时的计算速度。
从搜索方法来看,现在的分子检索方法都是基于相似结构的搜索方法,在搜索分子时,需要保留查询分子所需要的生物活性,作为搜索模板,但去除其中的缺点。但是由于分子数据库中的数据量十分巨大,一个分子需要进行指数大小的增量实验,这就使运算时间大大增加,限制了使用形状识别方法的速度。由于我们想要覆盖更大的搜索空间,尽可能地覆盖生物相关的化学空间,提高寻找到可能分子的可能性。因此,尽可能快的筛选分子数据库是非常重要的。
发明内容
本发明提出一种新的基于图结构注意力的分子相似性搜索算法,能够在保证了搜索广泛性的同时,提高了分子相似性计算的准确度。
本发明的技术方案是这样实现的:一种新的基于图结构注意力的分子相似性搜索算法,包括如下步骤:
步骤1、使用相似分子作为预训练数据,通过图卷积神经网络将相似分子表达为分子图的格式,在图卷积神经网络中引入了注意力机制,将分子图转换为特征向量;
步骤2、通过训练得到公式中的参数,得到相似性计算公式;
步骤3、采用步骤1的方法,将新的分子表达为新分子图的格式,并将新的分子图转换为新的特征向量,通过相似性计算公式进行相似性计算,得到相似性得分。
作为一种优选的实施方式,图卷积神经网络将卷积核设置为:
H(l+1)=σ(AH(l)W(l))
H(l+1):表示节点在第1层的特征表达;
σ():表示激活函数;
A:表示邻接矩阵;
W(l):表示第1层的卷积权重。
作为一种优选的实施方式,特征向量使用余弦相似性计算分子的相似度,并将其结果作为训练数据,通过训练得到所述相似性计算公式,其余弦相似性计算的公式为:
其中,A,B代表两个相似分子提取出的特征向量,Ai,Bi分别代表两个向量中的各分量。
作为一种优选的实施方式,在相似性计算公式中引入分子指纹的计算结果,其公式为:
其中,k是相似策略的编号,wk是策略k的权重,simk是第k个策略计算的相似度结果。
作为一种优选的实施方式,引入分子指纹的计算结果后,采用梯度下降算法,优化得出E最小的权向量,计算过程为:
w←w+Δw
实际计算中:
其中η为学***方和,是关于权重向量w的函数。
作为一种优选的实施方式,步骤2中训练之前,需要确定神经网格的输入以及正负样本,将下载得到的分子转变为使用相同smiles格式的分子数据,之后将smiles格式的分子转为分子图,采用相同的标准,同时保留分子的理化性质存储在数据库中,作为测定的验证信息使用,使用rdkit中的股本距离方法,对分子的分子指纹进行计算,得到的得分作为训练时的训练数据,验证分子相似程度以及算法的效果。
作为一种优选的实施方式,步骤3中设定相似性得分的阈值为0.8。
采用了上述技术方案后,本发明的有益效果是:
1、本专利使用的方法较传统的方法相比,由于使用的分子描述符是图结构的分子数据,可以将不同分子数据库的数据转化为同一种通用的结构,这样在搜索时就可以使用多个数据库的数据,保证了搜索的广泛性。
2、另外,在计算方法上看,本专利使用的计算方法使用分子性质的相似程度来训练算法,提高了分子相似性计算的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的构成框图;
图2为异戊烷和新戊烷的结构示意图;
图3为节点特征示意图;
图4为multi-head attention的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据图1至图4所示,一种新的基于图结构注意力的分子相似性搜索算法的中心是相似性计算公式,它通过使用相似分子作为预训练数据,训练得到公式中的参数。使用训练得到的公式对输入的分子图进行相似性计算,得到两个分子相似性得分。
使用现有的方法将分子图转为特征向量,在本方法内对现有的算法进行改造,在转换过程中引入了注意力机制,将原子间的互相作用记录在特征向量中。本算法的核心是对图卷积技术的充分利用,由于化学分子图的特殊性,使用一般常用的卷积神经网络效果不佳,所以使用图卷积及神经网络处理就有天然的优势。
由于分子的数据特征,并不是简单的二维结构,在计算机应用是并不能简单的使用卷积神经网络来处理分子数据。而对于分子数据的特殊性,将分子数据看为一个图结构数据,能很好的处理这个问题。
每个节点都有自己的特征信息。比如在化合物分子图中,顶点对应化合物的原子,边对应于化学键,顶点用相应原子的种类标记,边用键的类型标记。原子的电荷数、种类、分子量等信息都能够被用来计算化学性质,而不同的原子都被存储在本节点中。对于特定的任务,允许忽略任何标签。
图谱中的每个节点都具有分子的结构信息。对于在计算化学里,作为一种用来处理分子数据的描述符,想要保证计算的准确性就必须要考虑到分子同分异构、手性等特性,所以必须要保存完整的结构信息。而分子图的定义能够区分结构异构体,例如具有相同分子式但非同构图的化合物如异戊烷和新戊烷,如图2所示,虽然在分子式上看两者一样,但是在图结构上看是完全不一样的。
图卷积神经网络(Graph Convolutional Network)是一种能对图数据进行深度学习的方法。将卷积核设置为:
H(l+1)=σ(AH(l)W(l))
H(l+1)表示节点在第l层的特征表达,其中σ()表示激活函数,A表示邻接矩阵,W(l)表示第l层的卷积权重。例如,现假设原子2的邻接原子由1,3和4号,则结点状态的更新式如下:
在图卷卷积神经网络中,第一步是将分子表达为分子图的格式,将分子中对化学性质起重要作用的原子、官能团、侧链等用节点表示,将节点特征信息保存在节点中,经过变换后发送给邻居节点,对节点的特征信息进行抽取变换。然后节点将邻居节点的特征信息收集到一起,融合节点的局部结构信息,进行信息融合。在对收集到信息进行提取,一般经过几层的特征提取,就可以提取到整个分子的特征表达。
该卷积过程意味着所用的原子特征将和相同的卷积权重相乘,相加后作为激活函数的输入,而激活函数的输出则表示当前节点的新状态信息。这样做的优点在于:
1、卷积核的权重参数比较少;
2、更新式中,用拉普拉斯矩阵进行变换,计算复杂度为O(n);
3、卷积核具有很好的空间定位性,特别的,设K为卷积核的感知域,也就是说每次卷积会将中心定点K-hop邻点上的feature进行加权求和,权系数α_k;
4、训练是端对端训练,可以同时对节点特征和结构信息进行学习,适用性更广。
另外,分子图学习策略上,为了使图卷积神经网络解决不同大小输入的问题,首先从图中选择一个固定的节点序列,确定图的中心原子,再对序列中的每个节点,收集固定大小的邻域集合,以不同的半径汇集周围邻接节点的信息,在对当前的邻域进行规范化,作为卷积层的输入,覆盖图的大部分信息,再将得到的向量输入进下一层做进一步的处理。
人类视觉***在识别物体时,通过快速扫描全局图像,获取需要重点关注的目标区域,就是我们通常所说的焦点,通过的重点区域投入更更多的注意力资源,获得更多的信息,在长久的自然进化中,人类的注意力机制极大地提高了人类对视觉信息处理的速度和准确性。深度学习中的注意力机制就是借鉴了人类选择性视觉注意力机制,也是从众多信息中选择需要重点关注的信息,并进行相应的处理。
为了使模型可以学习分子中各个原子间的关系,在图卷积中引入注意力机制,与一般的图卷积不同,使用注意力机制替代了图卷积中固定的标准化操作。如图3所示对第n层节点特征做更新并得到n+1层节点特征,首先对n层节点嵌入进行先行变换,之后计算节点间的原始注意力分数。拼接两个节点的嵌入结果,并对拼接好的嵌入加入一个科学系的权重向量做点积,通过激活函数引入注意力。最后通过softmax操作得到注意力权重。与此相同,之后再对邻接节点的所有节点的特征做基于注意力的加权求和。
如图4所示,我们发现multi-head attention非常有益于稳定self-attention的学习过程,可参考论文Attention is all you need,即,该层的操作被独立复制k次(每个replica有不同的参数),并且输出是按特征聚集的(通常通过连接或添加)。
本发明中引入了注意力机制,主要用于增强模型对分子中原子间的性质,使用注意力机制代替了图卷积中固定的标准化操作,首先对分子中的原子节点采用自注意力模型,通过只允许节点i关注邻域节点来学习图结构,之后再使用softmax函数对这些系数进行归一化,以便在不同邻域之间进行选择,此外,由于multi-head attention对于稳定自注意力模型的学习的帮助十分大,即特定层的操作被独立复制k次,最后的输出是按特征聚集的。
当引入注意力机制到图卷积模型之后,可以通过新的注意力图卷积层自动学习不用邻居节点的重要性,可以加快模型的训练速度,提高准确性。
在训练之前,需要确定神经网络的输入以及正负样本。首先,由于小分子数据库的种类多种多样,描述分子时采用的数据结构会有些许不同,为了保证训练的一致性,需要对分子数据进行相应的处理。将下载得到的分子转变为使用相同smiles格式的分子数据,之后将smiles格式的分子转为分子图,采用相同的标准,同时保留分子的理化性质存储在数据库中,作为测定的验证信息使用,使用rdkit中的股本距离方法,对分子的分子指纹进行计算,得到的得分作为训练时的训练数据,验证分子相似程度以及算法的效果。
使用训练的得到的分子图特征向量,再使用余弦相似性计算分子的相似度。余弦相似性是指通过计算两个向量的夹角来度量它们之间的相似性。余弦值的范围从-1到1,两个向量夹角为0°时余弦值为1,夹角为90°时余弦值为0,方向完全相反时余弦值为-1,通常情况下,余弦相似度用于正空间上,得到的值通常在0到1之间,公式为:
其中,A,B代表两个分子经模型提取出的特征向量,Ai,Bi分别代表两个向量中的各分量。
之后,将余弦相似性的结果作为训练数据,训练得到相似度计算公式模型,在模型中引入分子指纹的计算结果,提高计算准确性。公式如下:
其中,k是相似策略的编号,wk是策略k的权重,simk是第k个策略计算的相似度结果。
引入分子指纹的计算结果后,采用梯度下降算法,优化得出E最小的权向量,计算过程为::
w←w+Δw
实际计算中,
其中η为学***方和,是关于权重向量w的函数。
为了验证算法的可行性,使用100对已经验证过的分子对进行验证,该数据集来自2014年,Pedro Franco等人发表在《Journal of Cheminformatics》上的论文,作者邀请了143名专家,从DrugBank中挑选了100对分子,请专家判断是否两个分子式相似的,然后统计结果,同时在表中记录两个分子使用ECFP4指纹计算的Tanimoto系数。最终经过模型的处理,便可以得到两个分子相似的分数。为了确保最终得到分数是准确的,本发明将阈值设置为0.8,也就是当分子相似性打分值大于0.8时,就确认其属于相似,反之不属于。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种新的基于图结构注意力的分子相似性搜索算法,其特征在于,包括如下步骤:
步骤1、使用相似分子作为预训练数据,通过图卷积神经网络将相似分子表达为分子图的格式,在图卷积神经网络中引入了注意力机制,将分子图转换为特征向量;
步骤2、通过训练得到公式中的参数,得到相似性计算公式;
步骤3、采用步骤1的方法,将新的分子表达为新分子图的格式,并将新的分子图转换为新的特征向量,通过相似性计算公式进行相似性计算,得到相似性得分。
2.根据权利要求1所述的一种新的基于图结构注意力的分子相似性搜索算法,其特征在于,所述步骤1中图卷积神经网络将卷积核设置为:
H(l+1)=σ(AH(l)W(l))
H(l+1):表示节点在第1层的特征表达;
σ():表示激活函数;
A:表示邻接矩阵;
W(l):表示第1层的卷积权重。
6.根据权利要求1所述的一种新的基于图结构注意力的分子相似性搜索算法,其特征在于,所述步骤2中训练之前,需要确定神经网格的输入以及正负样本,将下载得到的分子转变为使用相同smiles格式的分子数据,之后将smiles格式的分子转为分子图,采用相同的标准,同时保留分子的理化性质存储在数据库中,作为测定的验证信息使用,使用rdkit中的股本距离方法,对分子的分子指纹进行计算,得到的得分作为训练时的训练数据,验证分子相似程度以及算法的效果。
7.根据权利要求1所述的一种新的基于图结构注意力的分子相似性搜索算法,其特征在于,所述步骤3中设定相似性得分的阈值为0.8。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910839118.6A CN111429977B (zh) | 2019-09-05 | 2019-09-05 | 一种新的基于图结构注意力的分子相似性搜索算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910839118.6A CN111429977B (zh) | 2019-09-05 | 2019-09-05 | 一种新的基于图结构注意力的分子相似性搜索算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111429977A true CN111429977A (zh) | 2020-07-17 |
CN111429977B CN111429977B (zh) | 2024-02-13 |
Family
ID=71546803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910839118.6A Active CN111429977B (zh) | 2019-09-05 | 2019-09-05 | 一种新的基于图结构注意力的分子相似性搜索算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111429977B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111755078A (zh) * | 2020-07-30 | 2020-10-09 | 腾讯科技(深圳)有限公司 | 药物分子属性确定方法、装置及存储介质 |
CN111916143A (zh) * | 2020-07-27 | 2020-11-10 | 西安电子科技大学 | 基于多样子结构特征融合的分子活性预测方法 |
CN111949792A (zh) * | 2020-08-13 | 2020-11-17 | 电子科技大学 | 一种基于深度学习的药物关系抽取方法 |
CN112132223A (zh) * | 2020-09-27 | 2020-12-25 | 腾讯科技(深圳)有限公司 | 图池化方法、装置、设备以及存储介质 |
WO2023134061A1 (zh) * | 2022-01-11 | 2023-07-20 | 平安科技(深圳)有限公司 | 基于人工智能的药物特征信息确定方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016142285A1 (en) * | 2015-03-06 | 2016-09-15 | Thomson Licensing | Method and apparatus for image search using sparsifying analysis operators |
CN106649423A (zh) * | 2016-06-23 | 2017-05-10 | 新乡学院 | 一种基于内容相关度的检索模型计算方法 |
CN106709277A (zh) * | 2016-11-21 | 2017-05-24 | 南京邮电大学 | 基于文本挖掘的g蛋白偶联受体药物靶标分子的向量生成方法 |
CN107709576A (zh) * | 2015-04-13 | 2018-02-16 | 优比欧迈公司 | 用于神经***健康问题的微生物组来源的诊断和治疗的方法及*** |
CN108205613A (zh) * | 2017-12-11 | 2018-06-26 | 华南理工大学 | 一种化合物分子间相似度的计算方法及***与它们的应用 |
CN108875298A (zh) * | 2018-06-07 | 2018-11-23 | 北京计算科学研究中心 | 基于分子形状匹配的药物筛选方法 |
CN109389055A (zh) * | 2018-09-21 | 2019-02-26 | 西安电子科技大学 | 基于混合卷积和注意力机制的视频分类方法 |
CN109712678A (zh) * | 2018-12-12 | 2019-05-03 | 中国人民解放军军事科学院军事医学研究院 | 关系预测方法、装置及电子设备 |
CN109791797A (zh) * | 2016-12-05 | 2019-05-21 | 智慧芽信息科技(苏州)有限公司 | 在大数据库中根据化学结构相似性搜索和显示可用信息的***、装置和方法 |
-
2019
- 2019-09-05 CN CN201910839118.6A patent/CN111429977B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016142285A1 (en) * | 2015-03-06 | 2016-09-15 | Thomson Licensing | Method and apparatus for image search using sparsifying analysis operators |
CN107709576A (zh) * | 2015-04-13 | 2018-02-16 | 优比欧迈公司 | 用于神经***健康问题的微生物组来源的诊断和治疗的方法及*** |
CN106649423A (zh) * | 2016-06-23 | 2017-05-10 | 新乡学院 | 一种基于内容相关度的检索模型计算方法 |
CN106709277A (zh) * | 2016-11-21 | 2017-05-24 | 南京邮电大学 | 基于文本挖掘的g蛋白偶联受体药物靶标分子的向量生成方法 |
CN109791797A (zh) * | 2016-12-05 | 2019-05-21 | 智慧芽信息科技(苏州)有限公司 | 在大数据库中根据化学结构相似性搜索和显示可用信息的***、装置和方法 |
CN108205613A (zh) * | 2017-12-11 | 2018-06-26 | 华南理工大学 | 一种化合物分子间相似度的计算方法及***与它们的应用 |
CN108875298A (zh) * | 2018-06-07 | 2018-11-23 | 北京计算科学研究中心 | 基于分子形状匹配的药物筛选方法 |
CN109389055A (zh) * | 2018-09-21 | 2019-02-26 | 西安电子科技大学 | 基于混合卷积和注意力机制的视频分类方法 |
CN109712678A (zh) * | 2018-12-12 | 2019-05-03 | 中国人民解放军军事科学院军事医学研究院 | 关系预测方法、装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
申龙斌,李臻,魏志强,刘昊: "一种改进的图像场景识别算法", 中国海洋大学学报 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111916143A (zh) * | 2020-07-27 | 2020-11-10 | 西安电子科技大学 | 基于多样子结构特征融合的分子活性预测方法 |
CN111916143B (zh) * | 2020-07-27 | 2023-07-28 | 西安电子科技大学 | 基于多样子结构特征融合的分子活性预测方法 |
CN111755078A (zh) * | 2020-07-30 | 2020-10-09 | 腾讯科技(深圳)有限公司 | 药物分子属性确定方法、装置及存储介质 |
CN111755078B (zh) * | 2020-07-30 | 2022-09-23 | 腾讯科技(深圳)有限公司 | 药物分子属性确定方法、装置及存储介质 |
CN111949792A (zh) * | 2020-08-13 | 2020-11-17 | 电子科技大学 | 一种基于深度学习的药物关系抽取方法 |
CN111949792B (zh) * | 2020-08-13 | 2022-05-31 | 电子科技大学 | 一种基于深度学习的药物关系抽取方法 |
CN112132223A (zh) * | 2020-09-27 | 2020-12-25 | 腾讯科技(深圳)有限公司 | 图池化方法、装置、设备以及存储介质 |
CN112132223B (zh) * | 2020-09-27 | 2024-02-27 | 腾讯科技(深圳)有限公司 | 图池化方法、装置、设备以及存储介质 |
WO2023134061A1 (zh) * | 2022-01-11 | 2023-07-20 | 平安科技(深圳)有限公司 | 基于人工智能的药物特征信息确定方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111429977B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111429977B (zh) | 一种新的基于图结构注意力的分子相似性搜索算法 | |
CN113327644B (zh) | 一种基于图与序列的深度嵌入学习的药物-靶标相互作用预测方法 | |
CN111291556B (zh) | 基于实体义项的字和词特征融合的中文实体关系抽取方法 | |
CN116503676B (zh) | 一种基于知识蒸馏小样本增量学习的图片分类方法及*** | |
CN110993037A (zh) | 一种基于多视图分类模型的蛋白质活性预测装置 | |
CN117076931B (zh) | 一种基于条件扩散模型的时间序列数据预测方法和*** | |
CN116704137B (zh) | 一种海上石油钻井平台点云深度学习逆向建模方法 | |
CN113095158A (zh) | 一种基于对抗生成网络的笔迹生成方法及装置 | |
CN115995293A (zh) | 一种环状rna和疾病关联预测方法 | |
Wei et al. | Semi-supervised neural architecture search for hyperspectral imagery classification method with dynamic feature clustering | |
CN109492770A (zh) | 一种基于个性化关系排序的属性网络嵌入方法 | |
CN116883746A (zh) | 一种基于分区池化超图神经网络的图节点分类方法 | |
CN116978464A (zh) | 数据处理方法、装置、设备以及介质 | |
Zha et al. | Recognizing plans by learning embeddings from observed action distributions | |
CN113887653B (zh) | 一种基于三元网络的紧耦合弱监督学习的定位方法及*** | |
CN113807366B (zh) | 一种基于深度学习的点云关键点提取方法 | |
CN114862588A (zh) | 一种面向区块链交易行为的异常检测方法 | |
Fan et al. | A Graph‐based One‐Shot Learning Method for Point Cloud Recognition | |
CN112015854A (zh) | 一种基于自组织映射神经网络的异构数据属性关联算法 | |
CN114625871B (zh) | 一种基于注意力位置联合编码的三元组分类方法 | |
CN117133116B (zh) | 一种基于时空关联网络的交通流预测方法及*** | |
Puente et al. | Predicting COVID-19 Cases using Deep LSTM and CNN Models | |
Fan et al. | Remote Sensing Urban Green Space Layout and Site Selection Based on Lightweight Expansion Convolutional Method | |
CN116311280B (zh) | 基于图注意力网络的电子公文主题标引方法及*** | |
Zeng et al. | SSCRL: fine-grained object retrieval with switched shifted centralized ranking loss |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |