CN109903818B - 基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法 - Google Patents
基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法 Download PDFInfo
- Publication number
- CN109903818B CN109903818B CN201910129727.2A CN201910129727A CN109903818B CN 109903818 B CN109903818 B CN 109903818B CN 201910129727 A CN201910129727 A CN 201910129727A CN 109903818 B CN109903818 B CN 109903818B
- Authority
- CN
- China
- Prior art keywords
- protonation state
- protonation
- simulation
- molecular dynamics
- constant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/20—Protein or domain folding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Chemical & Material Sciences (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
Abstract
本发明属于分子动力学领域,具体涉及一种基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法,计算参考化合物的ΔGelec,ref;根据模拟目标pH值设置合理的初始质子化状态;进行恒定pH的分子动力学模拟,限制蛋白质主链原子的位置;将质子化状态比例大于99%或者小于1%的氨基酸残基设置为不滴定,其它氨基酸残基滴定,进行常规恒定pH分子动力学模拟,将质子化状态比例大于90%或者小于10%的氨基酸残基设置为不滴定,其它氨基酸残基滴定,分别在pH‑0.5、pH‑0.2、pH、pH+0.2、pH+0.5的条件下进行恒定pH的分子动力学模拟;拟合Hill方程得出最终pKa;质子化状态可由pKa确定。本发明经过多个环节循序确定质子化状态,更快收敛,结果更准确。
Description
技术领域
本发明属于分子动力学领域,具体涉及一种基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法。
背景技术
分子动力学(MD)模拟是生物分子领域用来研究蛋白质的结构和功能的重要工具之一。对于生物体中的蛋白质,其结构和功能强烈依赖于其所处的pH环境。这种依赖主要是由可滴定氨基酸的主要质子化状态随着pH变化发生改变(主要是酸性和碱性氨基酸的侧链)引起的。这些残基的质子化状态对于蛋白体系的稳定性,蛋白体系与周围环境的相互作用,以及依赖于特定质子化状态的酸碱催化或者亲核反应的催化机制都有着深远影响。
目前确定质子化状态主要有基于经验的方法比如H++或者PROPKA,和基于动力学模拟的方法,比如恒定pH的分子动力学模拟。前者快速但是相对准确性较低,后者准确性相对较高但是较耗时。
恒定pH的分子动力学模拟在常规分子动力学模拟的基础上加入蒙特卡洛采样(MC),实现了从一套固定质子化状态的MD对构象和动量采样,结合贯穿整个MD过程中对固定构象使用MC对质子化状态进行采样。在MC采样这一步,随机选择一个滴定残基和它的新的质子化状态,这一质子化或者去质子化过程的转变自由能根据如下公式计算得到:
其中kB是玻尔兹曼常数,T 是温度,pH 是指定的溶液 pH,pKa,ref是合适的参考化合物的pKa,ΔGelec是蛋白中滴定基团计算的自由能的静电项,ΔGelec,ref是参考化合物质子化状态转变自由能的静电项。这里引入一个已知pKa的参考化合物来计算。
由于在实际应用过程中,蛋白质中某些残基的瞬时pKa与其构象有着高度的相关性,二者相互影响。常规恒定pH方法模拟中蛋白质构象波动范围比常规MD大,因此模拟中会出现蛋白质局限在错误的质子化状态和相对高能的构象中的现象。
发明内容
为了更好地控制模拟的发展方向和提高结果的准确性,本发明提出了一套基于AMBER中的离散的恒定pH的分子动力学模拟方法来准确确定蛋白中质子化状态的流程方法。
具体技术方案为:
基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法,包括以下步骤:
(1)计算参考化合物的ΔGelec,ref
AMBER定义了蛋白质中几种常见氨基酸残基参考化合物,如果模拟体系中有未定义的,需自行定义。
使用热力学积分方法计算参考化合物在GB溶剂化模型中可能质子化状态相互转变的自由能ΔG,则初步的ΔGelec,ref由ΔG-pKaRTln10给出;
为了给出一个较准确的ΔGelec,ref,需要对其进行校正:根据Henderson–Hasselbalch (HH)方程,在pH等于pKa时,质子化比例与去质子化比例相等。进行一个简单的常规CpHMD模拟,模拟参数设置应该与后面模拟尽量一致。设置模拟pH为参考化合物pKa,根据推导校正公式为ΔGelec,ref(校正后)=ΔGelec,ref(校正前)-lnK, 其中K为模拟中去质子化状态与质子化状态的比例:使用校正后的ΔGelec,ref对参考化合物在pH为pKa条件下模拟,其质子化状态与去质子化状态比例应该为1:1,否则需继续校正。
若参考化合物有多种质子化状态则需定义每种可能的质子化状态转变及其对应的ΔGelec,ref。
(2)根据模拟目标pH值设置合理的初始质子化状态。在目标pH值下限制蛋白中所有重原子的位置,进行一定时间的恒定pH的分子动力学模拟,统计模拟中所有可滴定氨基酸的质子化状态比例,将优势的质子化状态作为下一步初始的质子化状态。
(3)进行一定时间常规的恒定pH的分子动力学模拟,限制蛋白质主链原子的位置。统计模拟中所有滴定氨基酸的质子化状态比例,将质子化状态比例大于99%或者小于1%的氨基酸残基设置为不滴定,其质子化状态设置为占比多的质子化转改,其它氨基酸残基滴定,作为下一步的初始质子化状态。
(4)进行一定时间的常规恒定pH分子动力学模拟。统计模拟中所有滴定氨基酸的质子化状态比例,将质子化状态比例大于90%或者小于10%的氨基酸残基设置为不滴定,其它氨基酸残基滴定,作为下一步的初始质子化状态。
(5)分别在pH-0.5、 pH-0.2、 pH、 pH+0.2、pH+0.5的条件下进行恒定pH的分子动力学模拟。统计模拟中所有滴定氨基酸的随pH变化的质子化状态比例,拟合Hill方程得出最终pKa。质子化状态可由pKa确定。
本发明提供的基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法,具有以下技术优势:
(1)给出了计算参考化合物ΔGelec,ref的校正方法。
(2)对于蛋白质中含有可滴定氨基酸较多的情况,常规恒定pH的分子动力学模拟方法非常耗时,收敛较慢。该方法经过多个环节循序确定质子化状态,后面滴定的氨基酸越来越少,计算耗时越来越短,相对更快收敛。
(3)确定质子化状态的氨基酸越来越多,滴定的氨基酸越来越少,结果更准确。
具体实施方式
结合实施例说明本发明的具体技术方案。
由于蛋白质中氨基酸的质子化状态很难通过实验测定,下面通过对比文献中其它研究的结果来说明其益处。
神经毒剂沙林与乙酰胆碱酯酶共价结合的复合物与小分子解毒剂HI6结合结构,其PDB编号为2WHP。已有大量文献对该结构进行研究,目的为了阐明HI6解毒的机理以及设计更高效的解毒剂。该蛋白质结构共含有548个氨基酸,模拟中滴定的氨基酸有天冬氨酸、谷氨酸、组氨酸、赖氨酸、酪氨酸。最近的一篇文献(Driant, T.; Nachon, F.; Ollivier,C.; Renard, P. Y.; Derat, E., On the Influence of the Protonation States ofActive Site Residues on AChE Reactivation: A QM/MM Approach. Chembiochem 2017,18 (7), 666-675.)指出解毒反应依赖于质子化的谷氨酸202,以及组氨酸447,而肟类解毒剂应为去质子化。在目标pH值为7的条件下,本实施例使用常规恒定pH的分子动力学模拟无法模拟出文中的质子化状态,而使用改进的恒定pH的分子动力学模拟流程得到了与文献一致的结果。
表1
上表1中method 1是常规恒定pH分子动力学模拟的结果,method 2是本发明的流程。其它未在上表中显示的可滴定氨基酸均为常规质子化状态,即酸性氨基酸为去质子化,碱性氨基酸为质子化。可以看到method 2的pKa计算更接近于文献中报道的质子化状态。
Claims (2)
1.基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法,其特征在于,包括以下步骤:
(1)计算参考化合物的ΔGelec,ref;使用热力学积分方法计算参考化合物在GB溶剂化模型中可能质子化状态相互转变的自由能ΔG,则初步的ΔGelec,ref由ΔG-pKaRTln10给出;
若参考化合物有多种质子化状态则需定义每种可能的质子化状态转变及其对应的ΔGelec,ref;
(2)根据模拟目标pH值设置合理的初始质子化状态;在目标pH值下限制蛋白质中所有重原子的位置,进行一定时间的恒定pH的分子动力学模拟,统计模拟中所有可滴定氨基酸的质子化状态比例,将优势的质子化状态作为下一步初始的质子化状态;
(3)进行一定时间常规的恒定pH的分子动力学模拟,限制蛋白质主链原子的位置;统计模拟中所有滴定氨基酸的质子化状态比例,将质子化状态比例大于99%或者小于1%的氨基酸残基设置为不滴定,其质子化状态设置为占比多的质子化转改,其它氨基酸残基滴定,作为下一步的初始质子化状态;
(4)进行一定时间常规的恒定pH的分子动力学模拟;统计模拟中所有滴定氨基酸的质子化状态比例,将质子化状态比例大于90%或者小于10%的氨基酸残基设置为不滴定,其它氨基酸残基滴定,作为下一步的初始质子化状态;
(5)分别在pH-0.5、pH-0.2、pH、 pH+0.2、pH+0.5的条件下进行恒定pH的分子动力学模拟;统计模拟中所有滴定氨基酸的随pH变化的质子化状态比例,拟合Hill方程得出最终pKa;质子化状态可由pKa确定。
2.根据权利要求1所述的基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法,其特征在于,所述的步骤(1)中的ΔGelec,ref进行校正:根据Henderson–Hasselbalch方程,在pH等于pKa时,质子化比例与去质子化比例相等;进行常规CpHMD模拟,模拟参数设置与后面模拟尽量一致;设置模拟pH为参考化合物pKa,根据推导校正公式为:
ΔGelec,ref(校正后)=ΔGelec,ref(校正前)-lnK;
其中K为模拟中去质子化状态与质子化状态的比例;
使用校正后的ΔGelec,ref对参考化合物在pH为pKa条件下模拟,其质子化状态与去质子化状态比例为1:1,否则需继续校正。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910129727.2A CN109903818B (zh) | 2019-02-21 | 2019-02-21 | 基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法 |
US16/740,504 US20200273544A1 (en) | 2019-02-21 | 2020-01-13 | Method for determining protonation states of protein on basis of constant-ph molecular dynamics simulation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910129727.2A CN109903818B (zh) | 2019-02-21 | 2019-02-21 | 基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109903818A CN109903818A (zh) | 2019-06-18 |
CN109903818B true CN109903818B (zh) | 2022-03-18 |
Family
ID=66945177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910129727.2A Active CN109903818B (zh) | 2019-02-21 | 2019-02-21 | 基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20200273544A1 (zh) |
CN (1) | CN109903818B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023102688A1 (zh) * | 2021-12-06 | 2023-06-15 | 深圳晶泰科技有限公司 | 酸度系数确定方法、装置、设备及计算机可读存储介质 |
WO2023123288A1 (zh) * | 2021-12-30 | 2023-07-06 | 深圳晶泰科技有限公司 | 相对结合自由能贡献的确定方法、装置及存储介质 |
CN114360663B (zh) * | 2021-12-30 | 2024-07-02 | 深圳晶泰科技有限公司 | 相对结合自由能贡献的确定方法、装置及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102099809A (zh) * | 2008-06-20 | 2011-06-15 | 诺华公司 | 识别蛋白质中大分子结合区域和易聚集区域的方法及其用途 |
CN105787292A (zh) * | 2014-12-18 | 2016-07-20 | 中国科学院大连化学物理研究所 | 蛋白质折叠的并行预测方法 |
CN106537151A (zh) * | 2014-07-18 | 2017-03-22 | 萨默费尼根有限公司 | 使用质子转移反应的蛋白质或多肽的混合物的质谱法的方法 |
CN108623652A (zh) * | 2018-03-13 | 2018-10-09 | 广西科学院 | 一种蛋白质热稳定性改造的方法及其在普鲁兰酶中的应用 |
CN108804869A (zh) * | 2018-05-04 | 2018-11-13 | 深圳晶泰科技有限公司 | 基于神经网络的分子结构和化学反应能量函数构建方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003021258A1 (en) * | 2001-08-30 | 2003-03-13 | Board Of Regents, The University Of Texas System | Ensemble-based analysis of the ph-dependence of stability of proteins |
US20040148105A1 (en) * | 2002-10-03 | 2004-07-29 | Northeastern University | Computational method for predicting protein interaction sites |
US7904283B2 (en) * | 2003-05-13 | 2011-03-08 | The Penn State Research Foundation | Quantum mechanics based method for scoring protein-ligand interactions |
-
2019
- 2019-02-21 CN CN201910129727.2A patent/CN109903818B/zh active Active
-
2020
- 2020-01-13 US US16/740,504 patent/US20200273544A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102099809A (zh) * | 2008-06-20 | 2011-06-15 | 诺华公司 | 识别蛋白质中大分子结合区域和易聚集区域的方法及其用途 |
CN106537151A (zh) * | 2014-07-18 | 2017-03-22 | 萨默费尼根有限公司 | 使用质子转移反应的蛋白质或多肽的混合物的质谱法的方法 |
CN105787292A (zh) * | 2014-12-18 | 2016-07-20 | 中国科学院大连化学物理研究所 | 蛋白质折叠的并行预测方法 |
CN108623652A (zh) * | 2018-03-13 | 2018-10-09 | 广西科学院 | 一种蛋白质热稳定性改造的方法及其在普鲁兰酶中的应用 |
CN108804869A (zh) * | 2018-05-04 | 2018-11-13 | 深圳晶泰科技有限公司 | 基于神经网络的分子结构和化学反应能量函数构建方法 |
Non-Patent Citations (1)
Title |
---|
染色质免疫沉淀-测序:全基因组范围研究 蛋白质-DNA相互作用的新技术;梁芳,马健等;《生物化学与生物物理进展》;20131231;正文第1-12页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109903818A (zh) | 2019-06-18 |
US20200273544A1 (en) | 2020-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109903818B (zh) | 基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法 | |
Potel et al. | Widespread bacterial protein histidine phosphorylation revealed by mass spectrometry-based proteomics | |
Lewis et al. | Potentiometric determination of ionizations at the active site of papain | |
Cecchi | Ion pairing chromatography | |
Mosier et al. | Metabolites associated with adaptation of microorganisms to an acidophilic, metal-rich environment identified by stable-isotope-enabled metabolomics | |
Liem-Nguyen et al. | Thermodynamic stability of mercury (II) complexes formed with environmentally relevant low-molecular-mass thiols studied by competing ligand exchange and density functional theory | |
Toya et al. | Direct measurement of isotopomer of intracellular metabolites using capillary electrophoresis time-of-flight mass spectrometry for efficient metabolic flux analysis | |
Morgner et al. | Subunit mass fingerprinting of mitochondrial complex I | |
Perlova et al. | Retention time prediction using the model of liquid chromatography of biomacromolecules at critical conditions in LC‐MS phosphopeptide analysis | |
Ren et al. | Metabolomics study of metabolic variations in enterotoxigenic Escherichia coli-infected piglets | |
Kang et al. | Analysis of nitrated proteins in Saccharomyces cerevisiae involved in mating signal transduction | |
Visendi et al. | An efficient approach to BAC based assembly of complex genomes | |
Karadzic et al. | Chemical cross‐linking, mass spectrometry, and in silico modeling of proteasomal 20 S core particles of the haloarchaeon H aloferax volcanii | |
Breitwieser et al. | IsobarPTM: A software tool for the quantitative analysis of post-translationally modified proteins | |
Desai et al. | FluxPyt: a Python-based free and open-source software for 13C-metabolic flux analyses | |
WO2020034615A1 (zh) | 基于恒定pH分子动力学模拟的蛋白质质子化状态确定方法 | |
Yang et al. | Numerical bias estimation for mass spectrometric mass isotopomer analysis | |
Srivastava et al. | Unique hepatic cytosolic arginase evolved independently in ureogenic freshwater air-breathing teleost, Heteropneustes fossilis | |
Sajadi | Complex bilding behavior of L-tryptophan and related amino acids, a comparative investigation | |
Han et al. | Determination of ultra-trace cobalt in water samples by graphite furnace atomic absorption spectrometry after cloud point extraction using 2-(5-bromo-2-pyridylazo)-5-dimethylaminoaniline as the chelating agent | |
Liu et al. | Proteome-wide analysis of protein alterations in response to aristolochic acids in rat kidney and liver tissues | |
Palacios-Pérez et al. | A Proposal of the Ur-proteome | |
Cruzeiro et al. | High-performance molecular dynamics at constant pH and constant redox potential using AMBER | |
Han et al. | Monitoring cellular phosphorylation signaling pathways into chromatin and down to the gene level | |
Tong et al. | Robustness analysis of a constraint-based metabolic model links cell growth and proteomics of Thermoanaerobacter tengcongensis under temperature perturbation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 3 / F, Shunfeng industrial building, No.2 Hongliu Road, Fubao community, Fubao street, Futian District, Shenzhen City, Guangdong Province Applicant after: Shenzhen Jingtai Technology Co.,Ltd. Address before: 518000 4th floor, No.9 Hualian Industrial Zone, Xinshi community, Dalang street, Longhua District, Shenzhen City, Guangdong Province Applicant before: Shenzhen Jingtai Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |