CN113077840B - 基于药效团与alpha-碳特征的金属酶活性位点对比方法 - Google Patents

基于药效团与alpha-碳特征的金属酶活性位点对比方法 Download PDF

Info

Publication number
CN113077840B
CN113077840B CN202110428076.4A CN202110428076A CN113077840B CN 113077840 B CN113077840 B CN 113077840B CN 202110428076 A CN202110428076 A CN 202110428076A CN 113077840 B CN113077840 B CN 113077840B
Authority
CN
China
Prior art keywords
metalloenzyme
active site
pharmacophore
alpha
carbon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110428076.4A
Other languages
English (en)
Other versions
CN113077840A (zh
Inventor
李国菠
李�根
戴青青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202110428076.4A priority Critical patent/CN113077840B/zh
Publication of CN113077840A publication Critical patent/CN113077840A/zh
Application granted granted Critical
Publication of CN113077840B publication Critical patent/CN113077840B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs

Landscapes

  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medical Informatics (AREA)
  • Medicinal Chemistry (AREA)
  • Computing Systems (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

基于药效团与alpha‑碳特征的金属酶活性位点对比方法。收集大量的金属酶晶体结构构建金属酶信息库,针对每个金属酶基于金属离子和溶剂可及性原理识别其活性位点,根据活性位点的表面原子与表面氨基酸构建药效团特征模型与alpha‑碳特征模型,将靶标金属酶与金属酶信息库中的活性位点特征模型进行相似性对比与晶体结构叠合,综合考虑相似性打分和叠合结构特征,输出与靶标金属酶活性位点相似的其他金属酶。本发明综合考虑活性位点的药效团特征与结构特征,准确、全面地表征金属酶活性位点信息;在获得活性位点相似性结果的同时,对金属酶晶体结构进行叠合,获得与靶标金属酶的相似金属酶,可视化的分析更为充分详尽,为靶标金属酶的药物发现提供更多线索。

Description

基于药效团与alpha-碳特征的金属酶活性位点对比方法
技术领域
本发明涉及计算机辅助药物分子设计领域,特别涉及一种基于金属酶活性位点的识别与特征提取进行相似性对比的新方法。具体是一种基于药效团与alpha-碳特征的金属酶活性位点对比方法。
背景技术
靶向金属酶的药物设计和发现往往得益于对其结构信息和催化机制的了解。由于金属酶有其独特的、相对复杂的催化活性位点,即含金属离子的活性位点,分析和比较金属酶活性位点对于开发新型、特异性的金属酶抑制剂具有十分重要的意义。比较金属酶活性位点也能对蛋白质功能预测、药物再利用和抑制剂选择性研究等提供参考与帮助。目前已经发展了许多分析和比较蛋白质活性位点的方法及程序。此类方法通常先基于靶标蛋白质结构识别其活性位点的空间位置,然后对活性位点氨基酸进行特征分析与提取,再基于特定的数据形式进行建模,最后进行活性位点模型之间的对比,以确定不同金属酶活性位点之间的相似性。
目前发展的分析和比较蛋白质活性位点的方法及程序,在活性位点识别、表征和相似度对比算法上都存在差异。活性位点识别常用的方法可分为几何法、能量法和进化法。其中应用最广泛的基于几何原理识别活性位点,此类方法利用蛋白质的表面原子来寻找结构中潜在的空腔,以定位活性位点。相比于能量法与进化法,基于几何的活性位点识别方法具有计算速度快、适用性强的优点。活性位点的特征提取可以基于氨基酸的alpha-碳原子、官能团或者三维网格点,以多种不同的数据类型来表示,包括图像模型、向量、晶格、指纹图谱、云状几何、点状几何、体积几何和分布图等。其中最常见的表示方法是由alpha-碳原子或官能团中心构成的三维图像模型,它可以准确地表示活性位点的结构特征与物理化学特征,包含最全面、详细的相关信息;它还可以转化为其他类型的数据,以突出某些方面的特征。在活性位点的对比中,目前应用最广泛的算法是团检测和几何哈希算法,它们的本质都是求得最大公共子图,在三维图像模型、向量、晶格等以坐标点为基础的活性位点表示方法中均可使用。虽然目前的方法在特征表示和计算精度/效率方面都有自己的优势,但很少考虑到金属酶在活性位点所包含的金属离子特征,这使得这些方法在应用于金属酶时很难达到预期的效果。因此,目前还需要发展新的针对金属酶的活性位点识别与对比方法,准确把握并分析金属活性位点特征,从而为靶向金属酶的药物发现提供有效工具与手段。
发明内容:
本发明的目的是:提供一种新的金属酶活性位点对比方法。该方法能够基于金属酶几何特征识别其活性位点,充分分析并提取活性位点的结构与药效团特征,并与其他金属酶的活性位点特征进行相似性对比。
本发明的基本思路是:收集大量的金属酶晶体结构,针对每个金属酶基于金属离子和溶剂可及性原理识别其活性位点,并根据活性位点的表面原子与表面氨基酸构建药效团特征模型与alpha-碳特征模型,将靶标金属酶与其他金属酶的活性位点特征模型进行相似性对比与晶体结构叠合,综合考虑相似性打分和叠合结构特征,输出与靶标金属酶活性位点相似的其他金属酶。这种思路的基本理论是基于:1)基于溶剂可及性原理识别蛋白质活性位点具有很好的普适性,结合金属离子信息则能够充分适用于金属酶,进一步提高对金属酶活性位点识别的准确率;2)基于药效团特征与alpha-碳特征两个角度构建活性位点特征模型,能够综合考虑活性位点的药效团特征与结构特征,准确、全面地表征金属酶活性位点信息;3)在对特征模型进行相似性对比的同时,也对金属酶晶体结构进行叠合,这样不仅能获得与靶标金属酶的相似金属酶,还能对两者的活性位点特征进行更充分、详尽的可视化分析,为靶标金属酶的药物发现提供更多线索。
本发明的目的是这样达到的:收集大量的金属酶晶体结构构建金属酶信息库,对于靶标金属酶基于金属离子和溶剂可及性原理识别其活性位点,并分析、提取活性位点特征信息构建药效团特征模型和alpha-碳特征模型;随后将靶标金属酶活性位点特征模型与金属酶信息库中活性位点特征模型进行相似性对比,并基于对比结果进行晶体结构叠合;最后综合考虑相似性打分和结构叠合特征分析,获得与靶标金属酶活性位点相似的其他金属酶。
金属酶活性位点对比按照如下进行:
(1)首先基于蛋白质晶体结构数据库,基于金属离子配位体系相关知识,收集所有的金属酶晶体结构,建立金属酶信息库;
(2)根据金属酶信息库,基于金属离子与溶剂可及性原理,识别每个金属酶的活性位点信息;
(3)基于活性位点的表面原子与表面氨基酸分别构建药效团特征模型与alpha-碳特征模型;
(4)采用基于四元组的最佳匹配方法,使用两种特征模型计算靶标金属酶活性位点与金属酶信息库中所有金属酶活性位点的相似性,输出相似性分数与相似的特征模型;
(5)基于靶标金属酶与其他金属酶的相似性对晶体结构进行叠合,输出旋转叠合后的相似金属酶晶体结构。
药物靶标预测的具体步骤是:
金属酶活性位点对比的具体步骤是:
(1)金属酶信息库的构建:
从蛋白质晶体结构PDB数据库中收集所有的蛋白质晶体结构,使用金属酶判断程序自动判断是否属于金属酶,基于筛选获得的金属酶晶体结构构建金属酶信息库;
(2)金属酶活性位点的识别:
根据上述收集的金属酶信息库,基于金属离子与溶剂可及性原理,识别每个金属酶的活性位点信息。其流程是:首先,分析并定位到结构中的金属离子,以此为中心建立规则的笛卡尔晶格;然后,基于溶剂可及性原理对每个晶格点进行分析与聚类,将满足条件的晶格点类定义为活性位点;最后,分析活性位点内的氨基酸获得表面原子与表面氨基酸信息;
(3)活性位点特征模型的构建:
根据上述识别的活性位点表面原子和表面氨基酸信息,利用自主研发的程序,分别构建药效团特征模型与alpha-碳特征模型:基于表面原子,利用自主研发的程序分析8种可能的药效团特征,并基于对综合作用贡献、相互作用范围、金属配位重要性和氢键主侧链为特征赋予4种不同的权重值,构建成药效团特征模型,存储为.phore格式文件;基于表面氨基酸,将分为5类的氨基酸上的alpha-碳原子定义为alpha特征,结合金属与辅因子作用特征和设有权重值的金属配位特征,构建成alpha-碳特征模型,存储为.atoms格式文件;
(4)靶标金属酶活性位点与其他金属酶活性位点的相似性计算:
对于药效团特征模型和alpha-碳特征模型,都采用基于四元组的最佳匹配方法进行相似性对比,根据匹配的特征球数量与重叠体积,分别计算对应的相似性分数,存储为.score格式文件。
基于药效团特征模型的相似性分数Pscore按照以下公式(I)进行计算:
Figure BDA0003030312470000041
公式(I)中Pscore是基于药效团特征模型对比的相似性值;Vphore是参考和对比模型的匹配药效团对的最大重叠体积(公式(II)),Vrp和Vcp分别表示参考模型和对比模型的药效团特征的体积,基于匹配对数部分的系数k1设置为2,Nphore是匹配特征对的个数,Nrp和Nep分别是参考和对比模型的特征点的个数。
Figure BDA0003030312470000042
Figure BDA0003030312470000043
Vphore
Figure BDA0003030312470000044
的计算公式如下所示,其中Wi是药效团特征的基本权重参数,Ai是基于金属配位设立的权重;λi是基于氢键特征在主链和侧链上的权重;σ是基于特征相互作用范围的权重值;q是一个单位四元数,描述在药效团叠合期间的旋转和平移;
Figure BDA0003030312470000045
表示两个匹配的药效团特征方向之间的角度对打分的影响;PY表示药效团模型Y的原始坐标值。
基于alpha-碳特征模型的相似性分数Ascore按照以下公式(IV)进行计算
Figure BDA0003030312470000046
公式(IV)中Ascore是基于alpha-碳特征模型对比的相似性值;Vcarbon是参考和对比模型的匹配特征对的最大重叠体积(公式(V)),Vrc和Vqo分别表示参考模型和对比模型的特征的体积,基于匹配对数部分的系数k2设置为2,Ncarbon是匹配特征对的个数,Nrc和Nao分别是参考和对比模型的特征点的个数。
Figure BDA0003030312470000051
Figure BDA0003030312470000052
Vcareon与c的计算公式如上所示,其中Wi是alpha-碳特征的基本权重参数,q是一个单位四元数,描述在药效团叠合期间的旋转和平移,c表示两个匹配的alpha-碳特征方向之间的角度对打分的影响,PY表示alpha-碳模型Y的原始坐标值;
(5)基于活性位点相似性的金属酶晶体结构叠合:
基于靶标金属酶与其他金属酶的相似性比对结果对晶体结构进行叠合,输出旋转叠合后的相似金属酶晶体结构,同时使用PyMOL软件查看叠合后的晶体结构。
所述在步骤(1)根据收集的金属酶晶体结构,利用金属酶判断程序自动构建金属酶信息库,其金属酶判断程序流程是:首先,检查此结构中是否有金属离子存在,包括Zn、Mg、Ca、Fe、Na、Mn、K、Ni、Cu、Co、Cd、Al、Rh、Pd、Li和Ti等;然后,检查金属离子周围3埃以内的氨基酸,是否存在3个以上的重原子(O、N、S)与金属形成稳定的配位体系;随后,将此配位体系与MetalPDB数据库报道的金属配位模型进行匹配,寻找最佳的匹配模型,即RMSD<0.7;最后,进一步检查该金属离子是否存在配位空位,如果存在,则将此蛋白质定义为金属酶。
所述在步骤(2)基于金属离子与溶剂可及性原理,识别每个金属酶的活性位点信息,其流程是:首先,分析并定位到结构中存在金属空位的金属离子,以此为中心建立规则的边长为40埃的笛卡尔晶格,格点间距设为0.5埃,所有晶格点属性值初值设为0;然后,将晶格点和原子的范德华半径之和作为判断标准,检测每个晶格点与其最近的蛋白质原子是否碰撞,将产生碰撞的晶格点标记为溶剂不可及,属性值设为-1;随后,沿着笛卡尔晶格的X、Y、Z轴和四条体对角线轴逐个分析每个晶格点的溶剂可及性,如果一个晶格点位于两个溶剂不可及的晶格点中间,则认为其处于蛋白空腔内,将其属性值加1;进一步对溶剂可及的晶格点进行聚类,满足溶剂可及性属性值≥3,晶格点聚类数量≥300,且与金属离子之间的最短距离在8埃以内的晶格点类被定义为活性位点;最后,分析活性位点内与金属离子距离在8埃以内的所有晶格点,将其距离最近的非氢蛋白质原子定义为表面原子,表面原子所在氨基酸定义为表面氨基酸。
所述在步骤(3)分别构建药效团特征模型与alpha-碳特征模型,其流程是:构建药效团特征模型的流程是:首先,基于表面原子,分析8种蛋白质与配体的药效团特征,包括金属配位、金属与辅因子作用、氢键供体、氢键受体、正电中心、负电中心、π-π相互作用和疏水相互作用等;然后为8种药效团特征赋予共4项权重值,基于药效团特征对综合作用模式的贡献,为不同的药效团特征赋予相应的权重W,金属配位、金属与辅因子作用、正电中心和负电中心特征具有最高的1.5权重值,氢键供体和氢键受体有较低的1.2权重值,π-π相互作用和疏水相互作用的权重值则分别为1和0.5;随后,为特征球半径设立权重σ,π-π相互作用和疏水相互作用的权重值设为0.7,其他特征均为1,权重越小,特征球越大;进一步最重要的金属配位特征设立权重A,值设为2,其他特征均为1;最后,为主链上的氢键特征设立权重λ为1.5,侧链上的氢键特征和其他特征均为1;利用以上步骤,对每个金属酶结构进行分析,构建药效团特征模型,将其存储为.phore格式文件。
构建alpha-碳特征模型的流程是:首先,根据物理化学性质和结构特点,将20种氨基酸为5个类型:脂肪族疏水性氨基酸、芳香环疏水性氨基酸、带负电的氨基酸、带正电的氨基酸和其他极性侧链氨基酸;然后,基于活性位点表面氨基酸获取对应的alpha-碳原子定义为alpha-碳特征;随后,根据金属离子与辅因子相关信息定义金属配位特征和金属与辅因子作用特征,并将金属配位特征的权重W设为2,其他特征均为1;利用以上步骤,对每个金属酶结构进行分析,综合活性位点的alpha-碳原子信息、坐标、氨基酸编号、氨基酸分类、权重值等构建alpha-碳特征模型,将其存储为.atoms格式文件。
所述20种氨基酸中,脂肪族疏水性氨基酸含:丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、缬氨酸和脯氨酸;芳香环疏水性氨基酸含:苯丙氨酸、色氨酸和酪氨酸;带负电的氨基酸含:天冬氨酸和谷氨酸;带正电的氨基酸含:精氨酸、组氨酸和甘氨酸;其他极性侧链氨基酸含:天冬酰胺、半胱氨酸、谷氨酰胺、丝氨酸和苏氨酸。
本发明的积极效果是:建立了首个金属酶活性位点识别与对比方法,能够准确识别靶标金属酶的活性位点,并从结构特征和药效团特征两个角度评价靶标金属酶活性位点与其他金属酶活性位点的相似性。通过金属酶判断程序、构建药效团特征模型与alpha-碳特征模型程序,赋予本发明的金属酶活性位点对比方法有三个突出的特点,一是始终以活性位点金属离子为核心,结合MetalPDB的金属配位模型与溶剂可及性原理,能够准确地识别活性位点信息;二是采用了药效团特征和alpha-碳特征两种不同的表示形式,更全面地表征活性位点信息,而且基于不同特征的内在特性和对相互作用的贡献,我们还为不同特征赋予了多层权重值和方向,弥补了金属活性位点特异性和几何特征缺失的问题,为后续的活性位点对比提供更多依据;三是基于本发明的生成的特征模型或者叠合后的金属酶结构,能够使用PyMOL软件查看叠合后的晶体结构。同时,还可以通过自主研发的MeCOM-Plugin插件可视化,对活性位点的特征能够有更直观的研究与分析。
附图说明
图1是本发明基于药效团与alpha-碳特征的金属酶活性位点对比方法工作流程图。
图2是本发明药效团特征模型和alpha-碳特征模型的举例说明。
图3是本发明基于药效团相似性结果叠合晶体结构的举例说明。
具体实施方式
附图1描述了基于药效团与alpha-碳特征的金属酶活性位点对比方法工作流程。输入靶标金属酶的晶体结构,基于金属中心结合溶剂可及性原理识别其活性位点,获得位点的表面原子与表面氨基酸,并根据活性位点信息构建对应的药效团特征模型和alpha-碳特征模型;随后与金属信息库中其他金属酶活性位点的特征模型进行相似性对比,根据特征模型的匹配结果分别计算得到基于药效团特征的相似性分数Pscore和基于alpha-碳特征的相似性分数Ascore,并根据相似性结果将靶标金属酶与相似金属酶的晶体结构进行叠合;综合Pscore与Ascore对所有相似的金属酶进行排序,结合对叠合结构的作用特征分析,最终给出与输入金属酶活性位点相似的其他金属酶列表。
实现该流程的具体步骤是:
(1)金属酶信息库的构建:
从蛋白质晶体结构PDB数据库中收集截止2020年12月31日所有的蛋白质晶体结构数据,总计171977个;从MetalPDB数据库获得共17种金属配位模型,基于金属酶定义与金属配位模型,使用金属酶判断程序程序自动筛选获得了共16866个金属酶晶体结构。其流程是:首先,检查此结构中是否有金属离子存在,包括Zn、Mg、Ca、Fe、Na、Mn、K、Ni、Cu、Co、Cd、Al、Rh、Pd、Li和Ti等;然后,检查金属离子周围3埃以内的氨基酸,是否存在3个以上的重原子(O、N、S)与金属形成稳定的配位体系;随后,将此配位体系与MetalPDB数据库报道的金属配位模型进行匹配,寻找最佳的匹配模型,即RMSD<0.7;最后,进一步检查该金属离子是否存在配位空位,如果存在,则将此蛋白质定义为金属酶。
(2)金属酶活性位点的识别:
根据上述收集的金属酶信息库,基于金属离子与溶剂可及性原理,识别每个金属酶的活性位点信息。其流程是:首先,分析并定位到结构中存在金属空位的金属离子,以此为中心建立规则的笛卡尔晶格,参考已有方法的参数设置,将晶格边长设为40埃,格点间距设为0.5埃,所有晶格点属性值初始化为0;然后,检测每个晶格点与其最近的蛋白质原子之间的距离,如果小于晶格点与该原子的范德华半径之和,则将此晶格点标记为溶剂不可及,属性值设为-1;随后,基于溶剂可及性原理沿着笛卡尔晶格的X、Y、Z轴和四条体对角线轴逐个分析每个晶格点,如果一个晶格点位于两个溶剂不可及的晶格点中间,则认为其处于蛋白空腔内,将其属性值加1;进一步对溶剂可及的晶格点进行聚类,满足溶剂可及性属性值≥3,晶格点聚类数量≥300,且与金属离子之间的最短距离在8埃以内的晶格点类被定义为活性位点;最后,分析活性位点内与金属离子距离在8埃以内的所有晶格点,将其距离最近的非氢蛋白质原子定义为表面原子,表面原子所在氨基酸定义为表面氨基酸。
(3)活性位点特征模型的构建:
根据上述识别的活性位点表面原子和表面氨基酸信息,分别构建药效团特征模型与alpha-碳特征模型。构建药效团特征模型的流程是:首先,基于表面原子,分析8种蛋白质与配体的相互作用特征,包括金属配位、金属与辅因子作用、氢键供体、氢键受体、正电中心、负电中心、π-π相互作用和疏水相互作用等;然后基于相互作用特征对综合作用模式的贡献,为不同的相互作用特征赋予相应的权重W,金属配位、金属与辅因子作用、正电中心和负电中心特征具有最高的1.5权重值,氢键供体和氢键受体有较低的1.2权重值,π-π相互作用和疏水相互作用的权重值则分别为1和0.5;随后,基于相互作用特征的作用范围,为特征球半径设立权重σ,权重越小,特征球越大,π-π相互作用和疏水相互作用的权重值设为0.7,其他特征均为1;进一步单独为最重要的金属配位特征设立权重A,值设为2,其他特征均为1;最后,鉴于氨基酸主链与侧链对氢键作用的影响,设立权重λ,主链上的氢键特征权重值为1.5,其他特征均为1;利用以上步骤,对每个金属酶结构进行分析,活性位点对应的表面原子编号、坐标、氨基酸编号、4项权重值等信息构成了药效团特征模型,将其存储为.phore格式文件。
构建alpha-碳特征模型的流程是:首先,根据物理化学性质和结构特点,将20种氨基酸为5个类型:脂肪族氨基酸:疏水性丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、缬氨酸和脯氨酸;芳香环疏水性氨基酸:苯丙氨酸、色氨酸和酪氨酸;带负电的氨基酸:天冬氨酸和谷氨酸;带正电的氨基酸:精氨酸、组氨酸和甘氨酸和其他极性侧链氨基酸:天冬酰胺、半胱氨酸、谷氨酰胺、丝氨酸和苏氨酸。然后,基于活性位点表面氨基酸获取对应的alpha-碳原子定义为alpha-碳特征;随后,根据金属离子与辅因子相关信息定义金属配位特征和金属与辅因子作用特征,并将金属配位特征的权重W设为2,其他特征均为1;利用以上步骤,对每个金属酶结构进行分析,综合活性位点的alpha-碳原子信息、坐标、氨基酸编号、氨基酸分类、权重值等构建alpha-碳特征模型,将其存储为.atoms格式文件。附图2举例说明了生成的一个药效团特征模型(左)和一个alpha-碳特征模型(右)。不同的药效团特征球具有不同的颜色与半径,便于区别与对比;所有的alpha-碳特征球则具有相同的颜色与半径。图2中也给出了此晶体结构中的配体结构,便于对比说明本方法对金属酶活性位点识别的准确性与对特征信息提取的全面性。
(4)靶标金属酶活性位点与其他金属酶活性位点的相似性计算
对于药效团特征模型和alpha-碳特征模型,都采用基于四元组的最佳匹配方法进行相似性对比。首先,将模型中的金属配位特征与其他任意三个特征组成一个四元组;然后,将参考模型中所有的四元组与对比模型中所有的四元组进行对比与叠合;随后,基于相似度最高的匹配结果,进一步对四元组特征之外的其他特征进行对比与匹配;最后,获得两个模型整体上的最佳匹配结果。根据匹配的特征球数量与重叠体积,计算对应的相似性分数,存储为.score格式文件。
基于药效团特征模型的相似性分数Pscore按照以下公式(I)进行计算:
Figure BDA0003030312470000091
公式(I)中Pscore是基于药效团特征模型对比的相似性值;Vphore是参考和对比模型的匹配药效团对的最大重叠体积(公式(II)),Vrp和Vap分别表示参考模型和对比模型的药效团特征的体积,基于匹配对数部分的系数k1设置为2,Nphore是匹配特征对的个数,Nrp和Nap分别是参考和对比模型的特征点的个数。
Figure BDA0003030312470000101
Figure BDA0003030312470000102
Vphore
Figure BDA0003030312470000106
的计算公式如下所示,其中Wi是药效团特征的基本权重参数,Ai是基于金属配位设立的权重;λi是基于氢键特征在主链和侧链上的权重;σ是基于特征相互作用范围的权重值;q是一个单位四元数,描述在药效团叠合期间的旋转和平移;
Figure BDA0003030312470000107
表示两个匹配的药效团特征方向之间的角度对打分的影响;PY表示药效团模型Y的原始坐标值。
基于alpha-碳特征模型的相似性分数Ascore按照以下公式(IV)进行计算
Figure BDA0003030312470000103
公式(IV)中Ascore是基于alpha-碳特征模型对比的相似性值;Vcarbon是参考和对比模型的匹配特征对的最大重叠体积(公式(V)),Vrc和Vqo分别表示参考模型和对比模型的特征的体积,基于匹配对数部分的系数k2设置为2,Ncarbon是匹配特征对的个数,Nrc和Nao分别是参考和对比模型的特征点的个数。
Figure BDA0003030312470000104
Figure BDA0003030312470000105
Voarkon与c的计算公式如上所示,其中Wi是alpha-碳特征的基本权重参数,q是一个单位四元数,描述在药效团叠合期间的旋转和平移,c表示两个匹配的alpha-碳特征方向之间的角度对打分的影响,PY表示alpha-碳模型Y的原始坐标值。
(5)基于活性位点相似性的金属酶晶体结构叠合
基于靶标金属酶与其他金属酶的相似性比对结果对晶体结构进行叠合,输出旋转叠合后的相似金属酶晶体结构,使用PyMOL软件可以查看叠合后的晶体结构。若使用自主研发的MeCOM-Plugin插件还可以进行可视化分析。
附图3给出了一个基于药效团相似性结果叠合晶体结构的实例。相似的两个金属酶二级结构分别表示为青色与黄色,图中的多个特征球为两个金属酶相似的药效团特征。
通过以上步骤,对于靶标金属酶,该基于药效团特征与alpha-碳特征的活性位点对比方法将根据相似性分数和可视化分析对金属酶信息库中所有与之相似的金属酶进行综合排序,输出与靶标金属酶在药效团特征和结构特征上相似性最高的一批金属酶,从而促进苗头/先导化合物的发现。此方法将为金属酶底物机制与抑制剂作用机制研究提供信息,为靶向金属酶的抑制剂设计提供有力工具。

Claims (6)

1.一种基于药效团与alpha-碳特征的金属酶活性位点对比方法,其特征在于:收集大量的金属酶晶体结构,针对每个金属酶基于金属离子和溶剂可及性原理识别其活性位点,并根据活性位点的表面原子与表面氨基酸构建药效团特征模型与alpha-碳特征模型,将靶标金属酶与其他金属酶的活性位点特征模型进行相似性对比与晶体结构叠合,综合考虑相似性打分和叠合结构特征,输出与靶标金属酶活性位点相似的其他金属酶;
金属酶活性位点对比按照如下进行:
(1)首先基于蛋白质晶体结构数据库,基于金属离子配位体系相关知识,收集所有的金属酶晶体结构,建立金属酶信息库;
(2)根据金属酶信息库,基于金属离子与溶剂可及性原理,识别每个金属酶的活性位点信息;
(3)基于活性位点的表面原子与表面氨基酸分别构建药效团特征模型与alpha-碳特征模型;
(4)采用基于四元组的最佳匹配方法,使用两种活性位点特征模型计算靶标金属酶活性位点与金属酶信息库中所有金属酶活性位点的相似性,输出相似性分数与相似的特征模型;
(5)基于靶标金属酶与其他金属酶的相似性对晶体结构进行叠合,输出旋转叠合后的相似金属酶晶体结构。
2.如权利要求1所述的基于药效团与alpha-碳特征的金属酶活性位点对比方法,其特征在于:
金属酶活性位点对比的具体步骤是:
(1)金属酶信息库的构建:
从蛋白质晶体结构PDB数据库中收集所有的蛋白质晶体结构,使用金属酶判断程序自动判断是否属于金属酶,基于筛选获得的金属酶晶体结构构建金属酶信息库;
(2)金属酶活性位点的识别:
根据上述收集的金属酶信息库,基于金属离子与溶剂可及性原理,识别每个金属酶的活性位点信息,其流程是:首先,分析并定位到结构中的金属离子,以此为中心建立规则的笛卡尔晶格;然后,基于溶剂可及性原理对每个晶格点进行分析与聚类,将满足条件的晶格点类定义为活性位点;最后,分析活性位点内的氨基酸获得表面原子与表面氨基酸信息;
(3)两种活性位点特征模型的构建:
根据上述识别的活性位点表面原子和表面氨基酸信息,分别构建药效团特征模型与alpha-碳特征模型;基于表面原子,分析8种可能的药效团特征,并基于对综合作用贡献、相互作用范围、金属配位重要性和氢键主侧链为特征赋予4种不同的权重值,构建成药效团特征模型,存储为.phore格式文件;基于表面氨基酸,将分为5类的氨基酸上的alpha-碳原子定义为alpha特征,结合金属与辅因子作用特征和设有权重值的金属配位特征,构建成alpha-碳特征模型,存储为.atoms格式文件;
(4)靶标金属酶活性位点与其他金属酶活性位点的相似性计算:
对于药效团特征模型和alpha-碳特征模型,都采用基于四元组的最佳匹配方法进行相似性对比,根据匹配的特征球数量与重叠体积,分别计算对应的相似性分数,存储为.score格式文件;
基于药效团特征模型的相似性分数Pscore按照以下公式(I)进行计算:
Figure FDA0003974960580000021
公式(I)中Pscore是基于药效团特征模型对比的相似性值;Vphore是参考和对比模型的匹配药效团对的最大重叠体积公式(II),Vrp和Vap分别表示参考模型和对比模型的药效团特征的体积,基于匹配对数部分的系数k1设置为2,Nphore是匹配特征对的个数,Nrp和Nap分别是参考和对比模型的特征点的个数;
Figure FDA0003974960580000022
Figure FDA0003974960580000023
Vphore
Figure FDA0003974960580000024
的计算公式如上所示,其中Wi是药效团特征的基本权重参数,Ai是基于金属配位设立的权重;λi是基于氢键特征在主链和侧链上的权重;σ是基于特征相互作用范围的权重值;q是一个单位四元数,描述在药效团叠合期间的旋转和平移;
Figure FDA0003974960580000025
表示两个匹配的药效团特征方向之间的角度对打分的影响;PY表示药效团模型Y的原始坐标值;
基于alpha-碳特征模型的相似性分数Ascore按照以下公式(IV)进行计算
Figure FDA0003974960580000031
公式(IV)中Ascore是基于alpha-碳特征模型对比的相似分数;Vcarbon是参考和对比模型的匹配特征对的最大重叠体积公式(V),Vrc和Vac分别表示参考模型和对比模型的特征的体积,基于匹配对数部分的系数k2设置为2,Ncarbon是匹配特征对的个数,Nrc和Nac分别是参考和对比模型的特征点的个数;
Figure FDA0003974960580000032
Figure FDA0003974960580000033
Vcarbon与c的计算公式如上所示,其中Wai是alpha-碳特征的基本权重参数,q是一个单位四元数,描述在药效团叠合期间的旋转和平移,c表示两个匹配的alpha-碳特征方向之间的角度对打分的影响,PYa表示alpha-碳模型Ya的原始坐标值;
(5)基于活性位点相似性的金属酶晶体结构叠合:
基于靶标金属酶与其他金属酶的相似性比对结果对晶体结构进行叠合,输出旋转叠合后的相似金属酶晶体结构,同时使用PyMOL软件查看叠合后的晶体结构。
3.如权利要求2所述的金属酶活性位点对比方法,其特征在于:
在所述步骤(1)中,使用金属酶判断程序自动判断,构建金属酶信息库,其金属酶判断程序流程是:首先,检查此结构中是否有金属离子存在,包括Zn、Mg、Ca、Fe、Na、Mn、K、Ni、Cu、Co、Cd、Al、Rh、Pd、Li和Ti;然后,检查金属离子周围3埃以内的氨基酸,是否存在3个以上的O、N、S重原子与金属形成稳定的配位体系;随后,将此配位体系与MetalPDB数据库报道的金属配位模型进行匹配,寻找最佳的匹配模型,即RMSD<0.7;最后,进一步检查该金属离子是否存在配位空位,如果存在,则将此蛋白质定义为金属酶。
4.如权利要求2所述的金属酶活性位点对比方法,其特征在于:在所述步骤(2)基于金属离子与溶剂可及性原理,识别每个金属酶的活性位点信息,其流程是:首先,分析并定位到结构中存在金属空位的金属离子,以此为中心建立规则的笛卡尔晶格,参考已有方法的参数设置,将晶格边长设为40埃,格点间距设为0.5埃,所有晶格点属性值初始化为0;然后,检测每个晶格点与其最近的蛋白质原子之间的距离,如果小于晶格点与该原子的范德华半径之和,则将此晶格点标记为溶剂不可及,属性值设为-1;随后,基于溶剂可及性原理沿着笛卡尔晶格的X、Y、Z轴和四条体对角线轴逐个分析每个晶格点,如果一个晶格点位于两个溶剂不可及的晶格点中间,则认为其处于蛋白空腔内,将其属性值加1;进一步对溶剂可及的晶格点进行聚类,满足溶剂可及性属性值≥3,晶格点聚类数量≥300,且与金属离子之间的最短距离在8埃以内的晶格点类被定义为活性位点;最后,分析活性位点内与金属离子距离在8埃以内的所有晶格点,将其距离最近的非氢蛋白质原子定义为表面原子,表面原子所在氨基酸定义为表面氨基酸。
5.如权利要求2所述的金属酶活性位点对比方法,其特征在于:在所述步骤(3),分别构建药效团特征模型与alpha-碳特征模型,其流程是:构建药效团特征模型的流程是:首先,基于表面原子,利用自主研发的程序,分析8种蛋白质与配体的相互作用特征,包括金属配位、金属与辅因子作用、氢键供体、氢键受体、正电中心、负电中心、π-π相互作用和疏水相互作用;然后基于相互作用特征对综合作用模式的贡献,为不同的相互作用特征赋予相应的权重W,金属配位、金属与辅因子作用、正电中心和负电中心特征具有最高的1.5权重值,氢键供体和氢键受体有较低的1.2权重值,π-π相互作用和疏水相互作用的权重值则分别为1和0.5;随后,设立为基于特征相互作用范围的权重值σ,权重越小,特征球越大,π-π相互作用和疏水相互作用的权重值设为0.7,其他特征均为1;进一步单独为最重要的金属配位特征设立权重A,值设为2,其他特征均为1;最后,鉴于氨基酸主链与侧链对氢键作用的影响,设立权重λ,主链上的氢键特征权重值为1.5,其他特征均为1;利用以上步骤,对每个金属酶结构进行分析,活性位点对应的表面原子编号、坐标、氨基酸编号、4项权重值信息构成了药效团特征模型,将其存储为.phore格式文件;
构建alpha-碳特征模型的流程是:首先,根据物理化学性质和结构特点,将20种氨基酸分为5个类型:脂肪族疏水性氨基酸、芳香环疏水性氨基酸、带负电的氨基酸、带正电的氨基酸和其他极性侧链氨基酸;然后,基于活性位点表面氨基酸获取对应的alpha-碳原子定义为alpha-碳特征;随后,根据金属离子与辅因子相关信息定义金属配位特征和金属与辅因子作用特征,并将金属配位特征的权重值设为2,其他特征均为1;利用以上步骤,对每个金属酶结构进行分析,综合活性位点的alpha-碳原子信息、坐标、氨基酸编号、氨基酸分类、权重值构建alpha-碳特征模型,将其存储为.atoms格式文件。
6.如权利要求5所述的金属酶活性位点对比方法,其特征在于:所述20种氨基酸中,脂肪族疏水性氨基酸含:丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、缬氨酸、甘氨酸和脯氨酸;芳香环疏水性氨基酸含:苯丙氨酸、色氨酸和酪氨酸;带负电的氨基酸含:天冬氨酸和谷氨酸;带正电的氨基酸含:精氨酸、组氨酸和赖氨酸;其他极性侧链氨基酸含:天冬酰胺、半胱氨酸、谷氨酰胺、丝氨酸和苏氨酸。
CN202110428076.4A 2021-04-21 2021-04-21 基于药效团与alpha-碳特征的金属酶活性位点对比方法 Active CN113077840B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110428076.4A CN113077840B (zh) 2021-04-21 2021-04-21 基于药效团与alpha-碳特征的金属酶活性位点对比方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110428076.4A CN113077840B (zh) 2021-04-21 2021-04-21 基于药效团与alpha-碳特征的金属酶活性位点对比方法

Publications (2)

Publication Number Publication Date
CN113077840A CN113077840A (zh) 2021-07-06
CN113077840B true CN113077840B (zh) 2023-01-31

Family

ID=76618179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110428076.4A Active CN113077840B (zh) 2021-04-21 2021-04-21 基于药效团与alpha-碳特征的金属酶活性位点对比方法

Country Status (1)

Country Link
CN (1) CN113077840B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101443353A (zh) * 2006-03-15 2009-05-27 Csir公司 谷氨酰胺合成酶活性的调节
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测***的构建和预测方法
WO2018222778A1 (en) * 2017-05-30 2018-12-06 The Johns Hopkins University Prostate-specific membrane antigen targeted high-affinity agents for endoradiotherapy of prostate cancer
CN110148438A (zh) * 2019-04-12 2019-08-20 中山大学 一种基于最优几何匹配的锌酶对接方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090241221A1 (en) * 2008-03-19 2009-09-24 Jose Alberto Fernandez-Pol Tandem reapeat dna constructs producing proteins that attack plant pathogenic viruses, fungi, and bacteria by disrupting transcription factors essential for replication thereof in plants
EP3329037B1 (en) * 2015-07-28 2023-10-18 Yeda Research and Development Co. Ltd. Stable proteins and methods for designing same
CN107038348B (zh) * 2017-05-04 2020-03-10 四川大学 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101443353A (zh) * 2006-03-15 2009-05-27 Csir公司 谷氨酰胺合成酶活性的调节
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测***的构建和预测方法
WO2018222778A1 (en) * 2017-05-30 2018-12-06 The Johns Hopkins University Prostate-specific membrane antigen targeted high-affinity agents for endoradiotherapy of prostate cancer
CN110148438A (zh) * 2019-04-12 2019-08-20 中山大学 一种基于最优几何匹配的锌酶对接方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
靶向金属酶的金属结合药效基团研究进展;李根,等;《药学进展》;20200925;第44卷(第9期);第667-680页 *

Also Published As

Publication number Publication date
CN113077840A (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
Brook et al. Collaborative grasp planning with multiple object representations
CN107038348B (zh) 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法
Fariselli et al. Prediction of disulfide connectivity in proteins
JP5251080B2 (ja) 物体認識方法
CN110986956B (zh) 一种基于改进的蒙特卡洛算法的自主学习全局定位方法
Aloy et al. Modelling repressor proteins docking to DNA
Poirrette et al. Comparison of protein surfaces using a genetic algorithm
CN109255815B (zh) 一种基于零阶球谐函数的物体检测与识别方法
CN113077840B (zh) 基于药效团与alpha-碳特征的金属酶活性位点对比方法
Zhang et al. Identification of key features of CNS drugs based on SVM and Greedy Algorithm
Yang et al. UNI-GBSA: An automatic workflow to perform mm/gb (pb) sa calculations for virtual screening
CN110148438B (zh) 一种基于最优几何匹配的锌酶对接方法
CN103778182B (zh) 一种快速图形相似度判别方法
CN116604212A (zh) 一种基于面阵结构光的机器人焊缝识别方法和***
CN111180021A (zh) 一种蛋白质结构势能函数的预测方法
Dong et al. Pose estimation of components in 3c products based on point cloud registration
CN107103356B (zh) 基于动态粒子蜜蜂算法的群机器人搜索方法
Wang et al. New deep neural networks for protein model evaluation
JP2001143072A (ja) 物体形状識別装置
Fukazawa et al. Extraction of feature values using protein molecular surface data and prediction of significant spot for preferential binding of ligands
Bock et al. Effective labeling of molecular surface points for cavity detection and location of putative binding sites
Douguet et al. SENSAAS (SENsitive Surface As A Shape): utilizing open-source algorithms for 3D point cloud alignment of molecules
Qin et al. Similarity analysis of 3D structures of proteins based tile-CNN
Wang et al. Fully flexible molecular alignment enables accurate ligand structure modelling
Inhester Mining of Interaction Geometries in Collections of Protein Structures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant