CN111243659A - 一种基于药物多维相似度的药物交互作用预测方法 - Google Patents

一种基于药物多维相似度的药物交互作用预测方法 Download PDF

Info

Publication number
CN111243659A
CN111243659A CN201811441665.0A CN201811441665A CN111243659A CN 111243659 A CN111243659 A CN 111243659A CN 201811441665 A CN201811441665 A CN 201811441665A CN 111243659 A CN111243659 A CN 111243659A
Authority
CN
China
Prior art keywords
drug
similarity
target
pair
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811441665.0A
Other languages
English (en)
Other versions
CN111243659B (zh
Inventor
陈迪
朴海龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Institute of Chemical Physics of CAS
Original Assignee
Dalian Institute of Chemical Physics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Institute of Chemical Physics of CAS filed Critical Dalian Institute of Chemical Physics of CAS
Priority to CN201811441665.0A priority Critical patent/CN111243659B/zh
Priority claimed from CN201811441665.0A external-priority patent/CN111243659B/zh
Publication of CN111243659A publication Critical patent/CN111243659A/zh
Application granted granted Critical
Publication of CN111243659B publication Critical patent/CN111243659B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于药物多维相似度的药物交互作用预测方法,该方法包括:基于药物在化合物分子描述符、药物靶标、ATC编码、通路及靶标在蛋白质交互作用网络中邻居节点多个方面的特性计算两个药物间的多维度相似性;基于所述多维度药物相似性特征构建基于马氏距离的SVM分类器用于区分协同、拮抗、独立的药物交互作用。

Description

一种基于药物多维相似度的药物交互作用预测方法
技术领域
本发明涉及生物信息学领域,特别涉及利用计算机技术预测药物交互作用的领域。
背景技术
传统药物研发主要针对作用于单一靶标的单一化合物,而复杂疾病往往对应着复杂的生物过程,一对一的药物-靶标作用模式在很多疾病的治疗中无法达到显著疗效。临床发现合理的药物联用不仅可以提高药物疗效,还可以降低毒副作用,为复杂疾病的治疗提供了新方式:组合药物。组合药物由两种或者两种以上活性药物成分组成,不同成分通常作用于不同靶标,调控不同病理过程,以较低的量达到更高疗效并且降低药物毒副作用。目前,组合药物正愈来愈多地用于复杂疾病,如:癌症、艾滋病、高血压、肺结核等疾病的治疗中。
不同于随机组合的药物,组合药物的不同药物间存在着协同交互作用。协同交互的药物组合具有有增效减毒的作用,即药物组合产生的药效大于各个药物单独使用时产生的药效的加和。与之对应的另外一种药物交互作用为拮抗交互,拮抗交互的药物组合会降低疗效,增加药物毒副作用。无论拮抗交互还是协同交互,药物间均存在着药理、药代方面的关联关系。针对复杂疾病的治疗,合理设计组合药物,有效地利用协同交互的药物组合同时避免拮抗交互的药物组合,将极大提高疾病的治疗效果。
现有的组合药物主要来自于临床经验,而药物组合的情况随着药物个数呈指数级增加,其组合***的问题使得临床或实验研究几乎无法实现。因此,发展有效的计算机预测方法成为组合药物发现研究的必然趋势,通过计算预测出药物组合的类型,能够为实验研究提供指导,有利于组合药物研发工作的推进。
目前,已有研究者提出了多种计算方法用于分析药物组合或药物交互作用。其中一种比较常用的方法是基于药物间各种类型的相似性度量构建分类模型。例如,Zou等分析药物靶标在蛋白质交互作用 (Protein Protein Interaction:PPI)网络中的邻近社区的拓扑特性及相关基因本体(Gene Ontology:GO)语义相似性,构建SVM分类器,从而对药物组合是否可以作为有效的组合药物进行预测。然而,仅仅通过药物靶标间的特性分析药物组合,会忽略很多药物相关信息。 Gottlieb等则考虑了更为全面的药物特性,整合利用药物ATC编码、药物靶标在PPI网络上的距离、靶标的GO术语、靶标序列、化合物结构、药物副作用、配体结构共7个不同方面的药物相似度度量,构建药物交互作用分类模型。但是,现有的分类模型存在一些局限,其一是没有考虑到不同药物在通路方面的关联关系,而有效的组合药物通常是通过干预相关联的通路实现协同增效的作用。其二,这些分类模型主要针对有无交互作用或者是否作为组合药物进行分类,这两种模型均没有对协同交互和拮抗交互进行很好的区分。
在分类器的构建方面,针对于高维特征的数据集通常需要先通过特征的降维,再进行分类。2008年,向世明等提出一种马氏距离矩阵的启发式学习方法,学习获得的马氏距离矩阵用于分类和聚类方法中可以有效提高原有方法的精度,这种降维的方法为预测药物交互作用的类别提供有利参考。
发明内容
(一)要解决的技术问题
本发明的目的在于提出一种基于药物多维相似度的药物交互作用预测方法,整合药物多个方面特性计算药物相似性,并构建基于马氏距离的SVM分类器对协同、拮抗以及独立三种类型的药物交互作用进行分类。
(二)技术方案
为了解决上述技术问题,本发明提供了一种基于药物多维相似度的药物交互作用预测包括:
一、基于所述多维度药物相似性特征构建基于马氏距离的SVM 分类器;
步骤1:获取已知药物交互作用类型的药物对;
步骤2:计算药物对间的多维度药物相似性;
步骤3:基于多维度药物相似性度量及药物交互作用已知类别学习马氏距离变换矩阵;
步骤4:基于马氏距离变换的数据,构建三类别药物交互作用的 SVM分类器。
二、基于上述构建好的SVM分类器预测任意多个候选药物中每两个药物间的相互作用;
针对多个候选药物中任意两种DrugBank数据库内具有靶标、二维结构及ATC编码信息的药物,基于步骤2相同方法计算两个药物间的多维相似度;基于步骤3已经获得的马氏距离矩阵对多维相似度进行数据变换后带入步骤4内的分类器,获得这两个药物属于每一种药物相互作用类型的概率值,其中三类药物相互作用对应概率值的和为 1,且利用概率值最大的药物相互作用类别作为预测获得的药物相互作用类别),即输入的两个药物属于协同、拮抗、独立中一种药物交互作用类型。
所述步骤2包括以下步骤:
步骤21:基于药物的分子描述符计算药物相似性;
步骤22:基于药物的二维结构计算药物相似性;
步骤23:基于药物靶标计算药物相似性;
步骤24:基于药物ATC编码计算药物相似性;
步骤25:基于药物靶标所在通路计算药物相似性;
步骤26:基于药物靶标在蛋白质交互作用网络中邻居节点计算药物相似性;
步骤27:整合基于不同特性的药物相似性度量结果获得多维度药物相似性。
所述步骤3包括以下步骤:
步骤31:构建Must-links矩阵Ls(i,j):
Figure BDA0001884830720000031
其中pairi、pairj表示两对不同的药物交互作用对,(pairi,pairj)∈S 表示pairi、pairj两个药物对属于相同的药物交互作用类型。上述公式的含义表示当药物对pairi与pairj属于相同的药物交互作用类型时,矩阵中第i行、第j列的内容为1,否则为0;
构建Cannot-links矩阵Ld(i,j):
Figure BDA0001884830720000041
其中(pairi,pairj)∈D表示pairi、pairj两个药物对是属于不同类型的药物交互上述公式的含义表示当药物对pairi与pairj属于相同的药物交互作用类型时,矩阵中第i行、第j列的内容为0,否则为1;
步骤32:基于Ls、Ld分别计算协方差矩阵
Figure BDA0001884830720000042
其中X为药物交互作用对特征描述矩阵,每一列对应一个药物交互作用对,每一行对应一种相似性度量结果;
步骤33:利用马氏距离学习方法学习马氏距离转换矩阵
Figure BDA0001884830720000043
所述步骤4包括:
步骤41:对原始数据进行马氏距离变换处理:X'=W*TX;
步骤42:基于马氏距离变换后的数据集,构建针对药物交互作用分类的SVM分类器。
(三)有益效果
本发明提出的一种基于药物多维相似度的药物交互作用预测方法,通过整合药物在分子描述符、二维结构、靶标、ATC编码、通路以及靶标在蛋白质交互作用网络中邻居节点多个方面的相似性度量来全面描述药物间的关联关系,为药物交互作用的分类及机理阐释提供基础;基于马氏距离的SVM分类器可以提高分类器精读,并可靠预测出药物对属于不同类型药物交互作用的概率。
附图说明
图1是本发明的一种基于药物多维相似度的药物交互作用预测方法的示意图;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
一、基于所述多维度药物相似性特征构建基于马氏距离的SVM 分类器;
图1是本发明所提供的一种基于药物多维相似度的药物交互作用预测方法的示意图。如图1所示,本发明提供一种对协同、拮抗及独立三种不同类型的药物交互作用的进行预测的方法,其中,独立的药物交互作用是指不具有协同或拮抗交互作用的两个药物间的交互作用类型。图1中从上到下依次给出了四个步骤:具体内容包括:
步骤1:不同类型药物交互作用的获取步骤;
所述步骤1主要是为后续分类模型提供训练和测试样本,为保证样本平衡性和可计算性,仅收集相同数目的协同、拮抗及独立药物交互作用对,并且保证其中所有药物的二维结构数据、靶标、ATC编码信息均是已知的。
步骤2:药物多维度相似性的计算步骤;
所述步骤从药物的分子描述符、二维结构、靶标、ATC编码、通路以及靶标在蛋白质交互作用网络中邻居节点多个方面来计算药物间的相似性,全面描述药物间的关联关系,为药物交互作用的分类和机理阐释提供基础。
步骤3:马氏距离矩阵的学习步骤;
所述步骤为了提高分类性能,根据样本数据学习马氏距离转换矩阵以保证属于相同药物交互作用类型的药物对在马氏距离空间内尽量近,而不同类型的药物对在马氏距离空间内的距离尽量远。
步骤4:基于马氏距离的SVM分类器构建步骤;
所述步骤利用马氏距离转换矩阵对原始数据进行转换,基于转换后的数据训练和测试SVM分类器,从而提高分类精度。
二、基于上述构建好的SVM分类器预测任意多个候选药物中每两个药物间的相互作用;
针对多个候选药物中任意两种DrugBank数据库内具有靶标、二维结构及ATC编码信息的药物,基于步骤2相同方法计算两个药物间的多维相似度;基于步骤3已经获得的马氏距离矩阵对多维相似度进行数据变换后带入步骤4内的分类器,获得这两个药物属于每一种药物相互作用类型的概率值,其中三类药物相互作用对应概率值的和为 1,且利用概率值最大的药物相互作用类别作为预测获得的药物相互作用类别),即输入的两个药物属于协同、拮抗、独立中一种药物交互作用类型。
以下对上述所涉及的各个步骤进行详细阐述。
步骤1:不同类型药物交互作用的获取步骤;
所述步骤1包括如下步骤:
步骤11:从DCDB数据库中获取药物二维结构、靶标、ATC 编码均已知的药物对179个,作为协同药物交互作用对集合,包括如:阿米替林与利眠宁、拉帕替尼与拓扑替康等;
步骤12:从DrugBank数据库中的药物交互作用中随机选取药物二维结构、靶标、ATC编码均已知的具有拮抗作用的药物对179个,作为拮抗药物交互作用对集合;包括如:他克莫司与伊马替尼、伏立诺他与氯丙嗪等
步骤13:从DrugBank药物中随机抽取既不属于DCDB数据库也不属于DrugBank药物交互作用记录药物对179对,并且保证其中每一个药物的二维结构、靶标、ATC编码可以从DrugBank数据库中获得,以此作为独立的药物交互作用对集合;包括如:安普那韦与赛克罗奇、异戊巴比妥与雷沙吉兰等
其中,所有采集的药物均是DrugBank与DCDB数据库中记录的药物,并且保证每种药物的二维结构、靶标及ATC编码是已知的,其二维结构是通过DrugBank数据库sdf文件进行描述的,其靶标集合来自于DrugBank数据库和DCDB数据库,并基于药物靶标对应的Entrez Gene ID进行统一化标注,药物ATC编码来自于DrugBank数据库。
所述步骤2包括如下步骤:
步骤21:基于药物的分子描述符计算药物相似性;
分子描述符从多个角度描述小分子化合物的化学特性。以药物二维结构为输入,基于CDK(The Chemistry Development Kit)工具包中分子描述符计算模块(cdk.qsar.descriptors.molecular)计算每个小分子药物的分子描述符,去除那些在90%以上的分子中都为0或者无法计算的分子描述符,最后获得共112维的分子描述符。计算三类药物交互作用对集合中每一对药物中两个药物分子描述符间的相似性 MDsS如下:
Figure BDA0001884830720000071
其中,d1、d2代表任意药物对中的两种药物,MD1 d至MDn d表示药物d的n个不同分子描述符。
步骤22:基于药物的二维结构计算药物相似性;
相似化合物结构的药物通常具有相似的药理学、药代学特性。利用CDK工具中cdk.fingerprint模块,获得药物二维结构计算化合物的指纹图谱,并利用cdk.similarity.Tanimoto模块计算基于Tanimoto系数的两个药物间的指纹图谱相似性。
步骤23:基于药物靶标计算药物相似性;
所述步骤23具体包括:
步骤231:利用DrugBank数据库获得药物的靶标集合;
步骤232:基于两个药物共享靶标占靶标并集的比例计算药物相似性geneS1;
Figure BDA0001884830720000072
其中d1、d2代表任意两个药物,Td表示药物d的靶标集合;
步骤233:基于药物靶标的基因本体(Gene Ontology:GO)语义相似性计算药物相似性;
其中,利用Python中安装的pyGS2包获得每个药物对中两个药物靶标集合分别对应的GO集合,并通过pyGS2包中GS2函数计算这两个GO集合间的平均语义相似性,记为geneS2;
步骤234:基于靶标在蛋白质交互作用网络中的最短路径长度计算药物相似性geneS3:
Figure BDA0001884830720000081
其中,Td1、Td2分布代表药物d1、d2的靶标集合,t1、t2分别为靶标集合中任意一个成员,d(t1,t2)表示靶标t1、t2在PPI网络中的最短路径长度,这里PPI网络下载自HPRD数据库,最短路径长度是基于 Python中network包的shortest_path_length函数计算获得。
步骤24:基于药物ATC编码计算药物相似性;
解剖学治疗学及化学分类***,简称ATC(Anatomical Therapeutic Chemical)***,是世界卫生组织对药品的官方分类***,该***包含5个药品级别,根据药物作用的器官及治疗化学特性进行分类编码。两个药物ATC编码在第k个级别上的相似性atcSk的定义如下:
atcSk(d1,d2)=|atck(d1)∩atck(d2)|/|atck(d1)∪atck(d2)|
其中atck(d)表示药物d在ATC***第k个级别上的所有ATC编码。由于每个药物对应于5个级别的编码,因此两个药物的ATC编码相似性定义如下:
Figure BDA0001884830720000082
步骤25:基于药物靶标所在通路计算药物相似性;
利用药物靶标所在通路间的关联性来度量药物间的相似性。根据药物对应的靶标对所有已知通路的影响来描述药物的通路作用,通过比对不同药物通路作用的相似程度描述通路相似性。
所述步骤25具体包括:
步骤251:利用KEGG数据库,获得其中所有人类对应的通路信息,在此基础上为每个药物定义一个通路图谱为
Figure BDA0001884830720000083
其中N表示KEGG数据库中所有通路的个数,
Figure BDA0001884830720000084
是药物d的靶标集合在第i个通路上的得分,i为1-N间的整数;
步骤252:基于药物的靶标和通路包含蛋白质间重叠比例计算计算第一种形式的
Figure BDA0001884830720000091
其中Td表示药物d的靶标, Psi表示第i个通路中包含的蛋白质,在此基础上计算每个药物的通路图谱;
步骤253:基于药物的靶标的GO术语和通路的GO术语间的 GO相似性计算第二种形式的pd i,其中利用PyGS2包获得药物d的靶标集合对应的GO术语集合及通路i内所有蛋白对应的GO术语集合,并计算两个GO术语集合见平均语义相似度,获得pd i,在此基础上计算每个药物的通路图谱;
步骤254:在计算得到每个药物的通路图谱以后,通过计算两个药物通路图谱间的Pearson关联系数来表征药物间的相似性。对应两种不同的pd i计算方法,可以计算得到两维的基于通路相似性的度量。
步骤26:基于药物靶标在蛋白质交互作用网络中的邻居节点计算药物相似性;
研究表明组合药物的作用机制同药物靶标在PPI网络中的邻居节点密切相关,本发明基于PPI网络获得每个药物的靶标集在PPI网络中的邻居节点,并以邻居节点为基础计算相似性。
优选地,所述步骤26包括:
步骤261:基于HPRD数据库中记录的PPI,确定药物靶标在PPI 网络中的邻居节点;
步骤262:将步骤232中靶标集合Td1、Td2替换为邻居节点集合 Neid1与Neid2,计算一种基于靶标邻居节点共享比例的药物相似性,记为neiS1:
Figure BDA0001884830720000092
步骤263:利用Python中安装的PyGS2包获取邻居节点集合Neid1与Neid2对应的GO集合,并通过pyGS2包中GS2函数计算两个GO 集合间的平均语义相似性,获得一种基于靶标邻居节点GO相似性的药物相似性,记为neiS2;
步骤264:将步骤234中靶标集合Td1、Td2替换为邻居节点集合 Neid1与Neid2,采用步骤234相同计算方法计算获得一种基于靶标邻居节点间最短路径长度的药物相似性度量,记为neiS3:
Figure BDA0001884830720000101
其中,t1、t2分别为邻居节点集合中任意一个成员,d(t1,t2)表示 t1、t2在PPI网络中的最短路径长度。
步骤265:将步骤25中靶标集合Td替换为邻居节点集合Neid,采用步骤25中两种计算方式分别计算获得另外两种基于靶标邻居节点通路关联的药物相似性度量,分别记为neiS4、neiS5。
步骤27:整合步骤21至步骤26的药物相似性度量结果获得124 维的多维度药物相似性;
其中包括112维的分子描述符相似度,1维的二维结构相似度, 3维靶标相似度,1维的ATC相似度,2维药物通路相似度,5维的靶标邻居节点相似度,共124维相似度。
步骤3:基于多维度药物相似性度量及药物交互作用已知类别学习马氏距离变换矩阵;
所述步骤3包括如下步骤:
步骤31:构建Must-links矩阵Ls(i,j):
Figure BDA0001884830720000102
其中pairi、pairj表示两对不同的药物交互作用对,(pairi,pairj)∈S 表示pairi、pairj两个药物对属于相同的药物交互作用类型(协同、拮抗或独立)。上述公式的含义表示当药物对pairi与pairj属于相同的药物交互作用类型时,矩阵中第i行、第j列的内容为1,否则为0;
构建Cannot-links矩阵Ld(i,j):
Figure BDA0001884830720000103
其中(pairi,pairj)∈D表示pairi,pairj两个药物对是属于不同类型的药物交互上述公式的含义表示当药物对pairi与pairj属于相同的药物交互作用类型时,矩阵中第i行、第j列的内容为0,否则为1;
步骤32:基于Ls、Ld分别计算协方差矩阵
Figure BDA0001884830720000111
Figure BDA0001884830720000112
其中X为药物交互作用对特征描述矩阵,每一列对应一个药物交互作用对,每一行对应一种相似性度量结果,XT表示矩阵X 的转置;
步骤33:利用马氏距离学习方法学习马氏距离转换矩阵
Figure BDA0001884830720000113
其中,tr表示矩阵的迹,W*是使得
Figure BDA0001884830720000114
具有最大值的W矩阵,其满足W的转置(WT)与W的矩阵之积为单位矩阵(WTW=I)。
步骤4:基于马氏距离变换的数据,构建三类别药物交互作用的 SVM分类器;
所述步骤4包括:
步骤41:对原始数据进行马氏距离变换处理:X'=W*TX,利用转换后的矩阵代替原始数据进行后续分析;
步骤42:利用python中sklearn包,基于X’及其中每一列药物对所属的药物交互作用类别,构建针对三种药物交互作用类别的SVM 分类器。
实施例
发明人将一种基于药物多维相似度的药物交互作用预测方法用于对脑中风相关药物中的药物交互作用分析中,候选脑中风药物8种 (包括双嘧达莫、阿司匹林、阿加曲班、氯吡格雷、达比加群酯、噻氯匹啶、华法令、西洛他唑),脑中风相关药物41种(包括阿替洛尔、西拉普利、环丝氨酸等),获得包含至少一种脑中风药物的药物对组合8*(8-1)/2+8*41=356对,实施效果如下:
利用本发明构建的基于马氏距离的SVM分类器预测所有脑中风相关药物对属于不同交互类别的概率,并根据概率值对每个类别相应结构进行排序。结果显示,两种具有确切协同交互作用的药物对组合(阿司匹林和氯吡格雷、双嘧达莫和阿司匹林)均排在前11位,且前11位中另外还有两对药物组合在相关文献中证实具有协同作用 (表1);而排名前10的拮抗交互作用中有7组药物对组合(双嘧达莫和噻吗洛尔、氯吡格雷和依他普仑、依他普仑和噻氯匹定、卡维地洛和噻氯匹定、氯吡格雷和罗匹尼罗、双嘧达莫和美托洛尔、双嘧达莫和依他普仑)的拮抗作用已经记录于数据库或者药物相关网站中 (表2)。该实施例表明了本发明提出的一种基于药物多维相似度的药物交互作用预测方法的有效性,即能够将已知的协同交互作用和拮抗交互作用识别出来。
表1.脑中风相关的协同药物交互作用排序
Figure BDA0001884830720000121
表2.脑中风相关的拮抗药物交互作用排序
排名 药物1 药物2 拮抗交互的概率
1 双嘧达莫 噻吗洛尔 0.963587695
2 氯吡格雷 依他普仑 0.956255907
3 依他普仑 噻氯匹定 0.948348315
4 卡维地洛 噻氯匹定 0.944879595
5 氯吡格雷 罗匹尼罗 0.902465643
6 双嘧达莫 美托洛尔 0.885249271
7 双嘧达莫 罗匹尼罗 0.883119422
8 罗匹尼罗 噻氯匹定 0.877290588
9 双嘧达莫 依他普仑 0.85500597
10 阿加曲班 喹那普利 0.841249238
表3.脑中风相关独立交互药物作用排序
排名 药物1 药物2 独立交互的概率
1 达比加群酯 吉非贝齐 0.59
2 达比加群酯 辛伐他汀 0.56
3 环丝氨酸 达比加群酯 0.56
4 达比加群酯 赖诺普利 0.55
5 西洛他唑 环丝氨酸 0.54
6 达比加群酯 福辛普利 0.54
7 达比加群酯 罗匹尼罗 0.54
8 卡维地洛 达比加群酯 0.53
9 双嘧达莫 米诺环素 0.53
10 达比加群酯 洛伐他汀 0.53
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于药物多维相似度的药物交互作用预测方法,该方法包括:
一、基于所述多维度药物相似性特征构建基于马氏距离的SVM分类器;
步骤1:获取已知药物交互作用类型的药物对;
步骤2:计算每对药物中不同药物间的多维度相似性;
步骤3:基于多维度药物相似性度量及药物交互作用已知类别学习马氏距离变换矩阵;
步骤4:基于马氏距离变换后的数据,构建三类别药物交互作用的SVM分类器;
二、基于上述构建好的SVM分类器预测任意多个(2个以上)候选药物中每两个药物间的相互作用;
针对多个候选药物中任意两种DrugBank数据库内具有靶标、二维结构及ATC编码信息的药物,基于步骤2相同方法计算两个药物间的多维相似度;基于步骤3已经获得的马氏距离矩阵对多维相似度进行数据变换后带入步骤4内的分类器,获得这两个药物属于每一种药物相互作用类型的概率值,其中三类药物相互作用对应概率值的和为1,且利用概率值最大的药物相互作用类别作为预测获得的药物相互作用类别,即输入的两个药物属于协同、拮抗、独立中一种药物交互作用类型。
2.如权利要求1所述的预测方法,其特征在于:
已知药物交互作用的药物对来源于如下数据库:
-DCDB数据库中药物靶标均已知的协同药物对至少100对;
-从DrugBank数据库中的药物交互作用中随机选取的拮抗药物对至少100对;
-从DrugBank药物中随机产生的不属于DCDB数据库及DrugBank药物交互作用的独立药物对至少100对;
-保证三类药物交互作用数目相等。
3.如权利要求1所述的预测方法,其特征在于,所述步骤2多维度药物相似性计算包括以下步骤:
步骤21:基于药物的分子描述符计算药物相似性;
步骤22:基于药物的二维结构计算药物相似性;
步骤23:基于药物靶标计算药物相似性;
步骤24:基于药物ATC编码计算药物相似性;
步骤25:基于药物靶标所在通路计算药物相似性;
步骤26:基于药物靶标在蛋白质交互作用网络中邻居节点计算药物相似性;
步骤27:整合基于不同特性的药物相似性度量结果获得124维的多维度药物相似性。
4.如权利要求3所述的预测方法,其特征在于,所述步骤21中分子描述符相似性计算如下:
Figure FDA0001884830710000021
其中,d1、d2代表任意两个药物,MD1 d至MDn d表示药物d的n个不同分子描述符。
5.如权利要求3所述的预测方法,其特征在于,所述步骤23包括以下步骤:
步骤231:利用DrugBank数据库获得药物的靶标集合;
步骤232:基于两个药物共享靶标占靶标并集的比例计算药物相似性geneS1;
Figure FDA0001884830710000022
其中d1、d2代表任意两个药物,Td表示药物d的靶标集合;
步骤233:基于药物靶标的基因本体(Gene Ontology:GO)语义相似性计算药物相似性,其中,利用Python的pyGS2包获得药物靶标集合对应的GO集合,并通过pyGS2包计算GO语义相似性,记为geneS2;
步骤234:基于靶标在蛋白质交互作用网络中的最短路径长度计算药物相似性geneS3:
Figure FDA0001884830710000023
其中,Td1、Td2分布代表药物d1、d2的靶标集合,t1、t2分别为靶标集合中任意一个成员,d(t1,t2)表示靶标t1、t2在PPI网络中的最短路径长度。
6.如权利要求3所述的预测方法,其特征在于,所述步骤25包括以下步骤:
步骤251:利用KEGG数据库,获得其中所有人类对应的通路信息,在此基础上为每个药物定义一个通路图谱为
Figure FDA0001884830710000031
其中N表示KEGG数据库中所有通路的个数,
Figure FDA0001884830710000032
是药物d的靶标集合在第i个通路上的得分;
步骤252:基于药物的靶标和通路包含蛋白质间重叠比例计算计算第一种形式的Pd i
Figure FDA0001884830710000033
其中Td表示药物d的靶标,Psi表示第i个通路中包含的蛋白质,在此基础上计算每个药物的通路图谱;
步骤253:基于药物的靶标的GO术语和通路GO术语间的GO相似性计算第一种形式的Pd i,在此基础上计算每个药物的通路图谱;
步骤254:针对计算获得的两种不同形式的通路图谱,基于Pearson关联系数计算两个药物通路图谱间的相似性。
7.如权利要求3所述的预测方法,其特征在于,所述步骤26包括以下步骤:
步骤261:基于HPRD数据库中记录的PPI,确定药物靶标在PPI网络中的邻居节点;
步骤262:将步骤232中靶标集合Td1、Td2替换为邻居节点集合Neid1与Neid2,计算一种基于靶标邻居节点共享比例的药物相似性;
步骤263:利用PyGS2包获取邻居节点集合Neid1与Neid2对应的GO集合,并计算两个GO集合间的平均语义相似性,获得一种基于靶标邻居节点GO相似性的药物相似性;
步骤264:将步骤234中靶标集合Td1、Td2替换为邻居节点集合Neid1与Neid2,采用步骤234相同计算方法计算获得一种基于靶标邻居节点间最短路径长度的药物相似性度量;
步骤265:将步骤25中靶标集合Td替换为邻居节点集合Neid,采用步骤25中两种计算方式分别计算获得另外两种基于靶标邻居节点通路关联的药物相似性度量。
8.如权利要求3所述的预测方法,其特征在于,所述步骤27中124维的多维相似度包括:
112维的分子描述符相似度,1维的二维结构相似度,3维靶标相似度,1维的ATC相似度,2维药物通路相似度,5维的靶标邻居节点相似度。
9.如权利要求1所述的预测方法,其特征在于,所述步骤3包括以下步骤:
步骤31:构建Must-links矩阵Ls(i,j):
Figure FDA0001884830710000041
其中pairi、pairj表示两对不同的药物交互作用对,(pairi,pairj)∈S表示pairi、pairj两个药物对属于相同的药物交互作用类型。上述公式的含义表示当药物对pairi与pairj属于相同的药物交互作用类型时,矩阵中第i行、第j列的内容为1,否则为0;
构建Cannot-links矩阵Ld(i,j):
Figure FDA0001884830710000042
其中(pairi,pairj)∈D表示pairi、pairj两个药物对是属于不同类型的药物交互上述公式的含义表示当药物对pairi与pairj属于相同的药物交互作用类型时,矩阵中第i行、第j列的内容为0,否则为1;
步骤32:基于Ls、Ld分别计算协方差矩阵
Figure FDA0001884830710000043
其中X为药物交互作用对特征描述矩阵,每一列对应一个药物交互作用对,每一行对应一种相似性度量结果;
步骤33:利用马氏距离学习方法学习马氏距离转换矩阵
Figure FDA0001884830710000051
其中,tr表示矩阵的迹,W*是使得
Figure FDA0001884830710000052
具有最大值的W矩阵,其满足W的转置(WT)与W的矩阵之积为单位矩阵(WTW=I)。
10.如权利要求1所述的方法,其特征在于,所述步骤4包括以下步骤:
步骤41:对原始数据进行马氏距离变换处理:X'=W*TX;
步骤42:利用变换后的数据集构建三种药物交互作用类别的SVM分类器,即构建基于马氏距离的SVM分类器。
CN201811441665.0A 2018-11-29 一种基于药物多维相似度的药物交互作用预测方法 Active CN111243659B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811441665.0A CN111243659B (zh) 2018-11-29 一种基于药物多维相似度的药物交互作用预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811441665.0A CN111243659B (zh) 2018-11-29 一种基于药物多维相似度的药物交互作用预测方法

Publications (2)

Publication Number Publication Date
CN111243659A true CN111243659A (zh) 2020-06-05
CN111243659B CN111243659B (zh) 2024-06-04

Family

ID=

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112133367A (zh) * 2020-08-17 2020-12-25 中南大学 药物与靶点间的相互作用关系预测方法及装置
CN112927766A (zh) * 2021-03-29 2021-06-08 天士力国际基因网络药物创新中心有限公司 一种疾病组合药物筛选的方法
CN114974408A (zh) * 2022-05-26 2022-08-30 浙江大学 药物互作用预测模型的构建方法、预测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065066A (zh) * 2013-01-22 2013-04-24 四川大学 基于药物组合网络的药物联合作用预测方法
CN103902848A (zh) * 2012-12-28 2014-07-02 深圳先进技术研究院 基于药物相互作用相似性识别药物靶标的***及方法
US20150242752A1 (en) * 2012-10-01 2015-08-27 Japan Science And Technology Agency Approval prediction apparatus, approval prediction method, and computer program product

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150242752A1 (en) * 2012-10-01 2015-08-27 Japan Science And Technology Agency Approval prediction apparatus, approval prediction method, and computer program product
CN103902848A (zh) * 2012-12-28 2014-07-02 深圳先进技术研究院 基于药物相互作用相似性识别药物靶标的***及方法
CN103065066A (zh) * 2013-01-22 2013-04-24 四川大学 基于药物组合网络的药物联合作用预测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112133367A (zh) * 2020-08-17 2020-12-25 中南大学 药物与靶点间的相互作用关系预测方法及装置
CN112927766A (zh) * 2021-03-29 2021-06-08 天士力国际基因网络药物创新中心有限公司 一种疾病组合药物筛选的方法
CN112927766B (zh) * 2021-03-29 2022-11-01 天士力国际基因网络药物创新中心有限公司 一种疾病组合药物筛选的方法
CN114974408A (zh) * 2022-05-26 2022-08-30 浙江大学 药物互作用预测模型的构建方法、预测方法及装置

Similar Documents

Publication Publication Date Title
Lee et al. Novel deep learning model for more accurate prediction of drug-drug interaction effects
Zhang et al. A novel heterogeneous network-based method for drug response prediction in cancer cell lines
Staszak et al. Machine learning in drug design: Use of artificial intelligence to explore the chemical structure–biological activity relationship
Hung Gene set/pathway enrichment analysis
CN112053742A (zh) 分子靶标蛋白的筛选方法、装置、计算机设备和存储介质
Wei et al. HobPre: accurate prediction of human oral bioavailability for small molecules
CN108899086A (zh) 一种基于机器学习通过血液样本诊断骨关节炎亚型的***
Chen et al. Prediction of drug’s Anatomical Therapeutic Chemical (ATC) code by integrating drug–domain network
Montero-Torres et al. Non-stochastic quadratic fingerprints and LDA-based QSAR models in hit and lead generation through virtual screening: theoretical and experimental assessment of a promising method for the discovery of new antimalarial compounds
Chen et al. Gene selection with multiple ordering criteria
Athar et al. First protein drug target’s appraisal of lead-likeness descriptors to unfold the intervening chemical space
Akhter et al. mrelief: A reward penalty based feature subset selection considering data overlapping problem
McGarry et al. RESKO: repositioning drugs by using side effects and knowledge from ontologies
Wang et al. Crosstalk analysis of dysregulated pathways in preeclampsia
Zhang et al. Network motif-based identification of breast cancer susceptibility genes
Cope et al. MergeMaid: R tools for merging and cross-study validation of gene expression data
CN111243659B (zh) 一种基于药物多维相似度的药物交互作用预测方法
CN111243659A (zh) 一种基于药物多维相似度的药物交互作用预测方法
CN115691751A (zh) 一种基于诊疗经验和智能学习的中药组方筛选方法及***
Chen et al. Knowledge-guided multi-scale independent component analysis for biomarker identification
CN112071439B (zh) 药物副作用关系预测方法、***、计算机设备和存储介质
CN111477287B (zh) 一种药物靶点预测方法、装置、设备及介质
CN112259175B (zh) 一种irak1激酶抑制剂的虚拟筛选方法
Tian et al. A longitudinal feature selection method identifies relevant genes to distinguish complicated injury and uncomplicated injury over time
Numcharoenpinij et al. Predicting synergistic drug interaction with dnn and gat

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant