CN106415562B - 膜蛋白质的热稳定化突变体预测装置、热稳定化突变体预测方法、以及程序 - Google Patents
膜蛋白质的热稳定化突变体预测装置、热稳定化突变体预测方法、以及程序 Download PDFInfo
- Publication number
- CN106415562B CN106415562B CN201580033500.8A CN201580033500A CN106415562B CN 106415562 B CN106415562 B CN 106415562B CN 201580033500 A CN201580033500 A CN 201580033500A CN 106415562 B CN106415562 B CN 106415562B
- Authority
- CN
- China
- Prior art keywords
- change
- amino acid
- entropy
- formation
- solvation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/107—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M1/00—Apparatus for enzymology or microbiology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12M—APPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
- C12M1/00—Apparatus for enzymology or microbiology
- C12M1/34—Measuring or testing with condition measuring or sensing means, e.g. colony counters
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/20—Protein or domain folding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Evolutionary Biology (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Sustainable Development (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Peptides Or Proteins (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供一种热稳定化突变体预测装置,其预测将膜蛋白质的各氨基酸残基置换为所有的氨基酸而得的1个残基突变体的立体结构,计算膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变,基于膜蛋白质的溶剂化熵变与氨基酸突变体的溶剂化熵变的差,选取使之发生热稳定化的氨基酸突变体的候选。
Description
技术领域
本发明涉及膜蛋白质的热稳定化突变体预测装置、热稳定化突变体预测方法、以及程序。
背景技术
膜蛋白质占由基因组编码的全部蛋白质的30%,在信号传递、物质运输、生物体能量产生·转换等细胞功能方面起到重要的作用。另外,同时,由于市售的药品的60%左右作用于膜蛋白质,因此在创制新药时也是重要的靶标。特别是,激素或神经递质等作为受体的G蛋白偶联受体(GPCR)形成约800种的家族成员,估计有280种左右是创制新药靶标。
近年来已经发现,为了设计、改良副作用少而效果高的药剂,基于成为医药靶标的蛋白质的立体结构的医药分子设计(SBDD)是有效的。但是,GPCR存在有(1)热稳定性低而难以大量生产、(2)用于结晶化的亲水性表面少而难以结晶化的问题,直到2007年还没有获得人类GPCR的详细结构。
2007年,如非专利文献1中记载所示,B.Kobilka和R.Stevens等人在人类肾上腺素受体的细胞内第三环上融合T4溶菌酶(T4L),由此使受体热稳定化,同时扩大了亲水性表面,利用被称作脂质中间相法的方法进行结晶化,成功地进行了X射线晶体结构解析。如此所述,GPCR的(2)结晶化难的问题可以通过使用T4L融合或抗体来克服,然而对于(1)热稳定性低而难以大量生产的问题仍未充分解决,GPCR的9成以上还不能大量生产。
此处,专利文献1等中,公开了如下的StaR(注册商标)技术,即,为了提高热稳定性,将GPCR的各氨基酸包罗在内地置换为丙氨酸,利用实验研究了带来热稳定性的提高的突变部位,利用这些突变部位的组合大幅度提高热稳定性而进行晶体结构解析,利用GPCR的结构彼此相似对其他种类的GPCR也提高了热稳定性。
现有技术文献
专利文献
专利文献1:日本特表2011-505800号公报
非专利文献
非专利文献1:Vadim Cherezov,Daniel M.Rosenbaum,Michael A.Hanson,SorenG.F.Rasmussen,Foon Sun Thian,Tong Sun Kobilka,Hee-Jung Choi,Peter Kuhn,William I.Weis,Brian K.Kobilka,Raymond C.Stevens,“High-Resolution CrystalStructure of an Engineered Humanβ2-Adrenergic G Protein-Coupled Receptor”,Science 2007,Vol.318no.5854pp.1258-1265
发明内容
发明所要解决的问题
但是,就StaR(注册商标)技术而言,存在有如下的问题,即,需要借助实验的网罗性解析,因此丙氨酸以外的其他氨基酸置换的效果不明,另外,为了进行针对GPCR等其他膜蛋白质的新的相同的解析,需要花费相当多的时间和劳力。
本发明是鉴于上述问题而完成的,其目的在于,提供可以利用计算机预测膜蛋白质中使之发生热稳定化的氨基酸突变的热稳定化突变体预测装置、热稳定化突变体预测方法、以及程序。
用于解决问题的方法
为了达成此种目的,本发明的热稳定化突变体预测装置的特征在于,是预测使膜蛋白质发生热稳定化的氨基酸突变体的候选的、具备存储部和控制部的热稳定化突变体预测装置,上述存储部存储上述膜蛋白质的氨基酸序列,上述控制部具备:突变导入机构,其将氨基酸突变导入上述膜蛋白质的上述氨基酸序列,由此生成上述氨基酸突变体的氨基酸序列;计算机构,其对于上述膜蛋白质及上述各氨基酸突变体,计算伴随着基于上述氨基酸序列的结构最佳化的膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变;和候选选取机构,基于上述膜蛋白质的上述溶剂化熵变与上述氨基酸突变体的上述溶剂化熵变的差,选取上述使之发生热稳定化的氨基酸突变体的候选。
另外,本发明的热稳定化突变体预测装置的特征在于,在上述记载的热稳定化突变体预测装置中,上述计算机构还对于上述膜蛋白质及上述各氨基酸突变体,计算伴随着基于上述氨基酸序列的上述结构最佳化的上述膜贯穿部位的、从上述一级结构形成到上述三级结构形成的能量变化或从上述二级结构形成到上述三级结构形成的能量变化,上述候选选取机构基于作为在上述膜蛋白质的上述能量变化与上述氨基酸突变体的上述能量变化的差、以及上述膜蛋白质的上述溶剂化熵变与上述氨基酸突变体的上述溶剂化熵变的差上乘以绝对温度而得的值之和的变化量,选取上述使之发生热稳定化的氨基酸突变体的候选。
另外,本发明的热稳定化突变体预测装置的特征在于,在上述记载的热稳定化突变体预测装置中,上述计算机构使用基于排除体积、露出表面积、露出表面的平均曲率的积分值、以及露出表面的高斯曲率的积分值的4个几何学指标的形态计测学的表现与积分方程式论的综合型方法论,计算上述溶剂化熵变。
另外,本发明的热稳定化突变体预测装置的特征在于,在上述记载的热稳定化突变体预测装置中,上述存储部还存储上述膜蛋白质的结构数据,上述计算机构基于上述氨基酸序列及上述结构数据进行结构最佳化。
另外,本发明的热稳定化突变体预测装置的特征在于,在上述记载的热稳定化突变体预测装置中,上述计算机构首先将上述膜蛋白质的重原子固定而进行最小化,然后,将Cα碳及Cβ碳固定而进行最小化,最后,不固定地进行最小化,由此在分阶段地去掉约束的同时进行上述结构最佳化。
另外,本发明的热稳定化突变体预测装置的特征在于,在上述记载的热稳定化突变体预测装置中,上述计算机构中,作为上述溶剂化熵变计算在进行上述结构最佳化后取出上述膜贯穿部位而得的上述三级结构的溶剂化熵、与拆分该三级结构而得的上述二级结构的溶剂化熵的变化。
另外,本发明的热稳定化突变体预测装置的特征在于,在上述记载的热稳定化突变体预测装置中,上述计算机构中,作为上述溶剂化熵变计算在取出上述膜贯穿部位后进行上述结构最佳化而得的上述三级结构的溶剂化熵、与拆分所取出的该膜贯穿部位后进行上述结构最佳化而得的上述二级结构的溶剂化熵的变化。
另外,本发明的热稳定化突变体预测装置的特征在于,在上述记载的热稳定化突变体预测装置中,上述计算机构中,作为上述溶剂化熵变计算在进行上述结构最佳化后取出上述膜贯穿部位而得的上述三级结构的溶剂化熵、与取出上述膜贯穿部位并拆分该膜贯穿部位后进行上述结构最佳化而得的上述二级结构的溶剂化熵的变化。
另外,本发明的热稳定化突变体预测装置的特征在于,在上述记载的热稳定化突变体预测装置中,上述计算机构中,作为上述溶剂化熵变计算在进行上述结构最佳化后取出上述膜贯穿部位而得的上述三级结构的溶剂化熵、与取出上述膜贯穿部位并伸展该膜贯穿部位后进行上述结构最佳化而得的上述一级结构的溶剂化熵的变化。
另外,本发明的热稳定化突变体预测装置的特征在于,在上述记载的热稳定化突变体预测装置中,上述计算机构中,作为上述溶剂化熵变计算在取出上述膜贯穿部位后进行上述结构最佳化而得的上述三级结构的溶剂化熵、与取出上述膜贯穿部位并拆分该膜贯穿部位而伸展后进行上述结构最佳化而得的上述一级结构的溶剂化熵的变化。
另外,本发明涉及一种热稳定化突变体预测方法,其特征在于,是在具备存储膜蛋白质的氨基酸序列的存储部和控制部的计算机中执行的、预测上述使膜蛋白质发生热稳定化的氨基酸突变体的候选的热稳定化突变体预测方法,包括:突变导入步骤,将氨基酸突变导入上述膜蛋白质的上述氨基酸序列,由此生成上述氨基酸突变体的氨基酸序列;计算步骤,对于上述膜蛋白质及上述各氨基酸突变体,计算伴随着基于上述氨基酸序列的结构最佳化的膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变;和候选选取步骤,基于上述膜蛋白质的上述溶剂化熵变与上述氨基酸突变体的上述溶剂化熵变的差,选取上述使之发生热稳定化的氨基酸突变体的候选。
另外,本发明涉及一种程序,其特征在于,是用于使上述具备存储膜蛋白质的氨基酸序列的存储部和控制部的计算机执行用于预测使膜蛋白质发生热稳定化的氨基酸突变体的候选的程序,使计算机执行:突变导入步骤,将氨基酸突变导入上述膜蛋白质的上述氨基酸序列,由此生成上述氨基酸突变体的氨基酸序列;计算步骤,对于上述膜蛋白质及上述各氨基酸突变体,计算伴随着基于上述氨基酸序列的结构最佳化的膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变;和候选选取步骤,基于上述膜蛋白质的上述溶剂化熵变与上述氨基酸突变体的上述溶剂化熵变的差,选取上述使之发生热稳定化的氨基酸突变体的候选。
另外,本发明涉及一种记录介质,其特征在于,记录有上述记载的程序。
发明效果
根据本发明,存储膜蛋白质的氨基酸序列,并将氨基酸突变导入膜蛋白质的氨基酸序列,由此生成氨基酸突变体的氨基酸序列,对于膜蛋白质及各氨基酸突变体,计算伴随着基于氨基酸序列的结构最佳化的膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变,基于膜蛋白质的溶剂化熵变与氨基酸突变体的溶剂化熵变的差,选取使之发生热稳定化的氨基酸突变体的候选,因此可以起到可以利用计算机(in silico)预测膜蛋白质中使之发生热稳定化的氨基酸突变的效果。
另外,由于本发明使用基于排除体积、露出表面积、露出表面的平均曲率的积分值、以及露出表面的高斯曲率的积分值的4个几何学指标的形态计测学的表现与积分方程式论的综合型方法论,来计算溶剂化熵变,因此能够起到可以通过在形态计测学上将溶质的形态简化处置而高速地计算溶剂化熵的效果。
另外,由于本发明还存储膜蛋白质的结构数据,并基于氨基酸序列及结构数据进行结构最佳化,因此能够起到可以利用已知的结构数据准确地实现结构的最佳化的效果。
另外,由于本发明首先将膜蛋白质的重原子固定而最小化,然后,将Cα碳及Cβ碳固定而最小化,最后,不固定地进行最小化,由此在分阶段地去掉约束的同时进行结构最佳化,因此能够起到可以获得精度更好的预测结构的效果。
另外,由于本发明中作为溶剂化熵变计算在进行结构最佳化后取出膜贯穿部而得的三级结构的溶剂化熵、与拆分该三级结构而得的二级结构的溶剂化熵的变化,因此能够起到可以获得预测准确率较高的结果(作为一个实施例为5/11)的效果。
另外,由于本发明中作为溶剂化熵变计算在取出膜贯穿部位后进行结构最佳化而得的三级结构的溶剂化熵、与拆分所取出的该膜贯穿部位后进行结构最佳化而得的二级结构的溶剂化熵的变化,因此能够起到可以获得预测准确率高的结果(作为一个实施例为1/4)。
另外,由于本发明中作为溶剂化熵变计算在进行结构最佳化后取出膜贯穿部位而得的三级结构的溶剂化熵、与取出膜贯穿部位并拆分该膜贯穿部位后进行结构最佳化而得的二级结构的溶剂化熵的变化,因此能够起到可以获得预测准确率高的结果(作为一个实施例为3/11)的效果。
另外,由于本发明中作为溶剂化熵变计算在进行结构最佳化后取出膜贯穿部位而得的三级结构的溶剂化熵、与取出膜贯穿部位并伸展该膜贯穿部位后进行结构最佳化而得的一级结构的溶剂化熵的变化,因此能够起到可以获得预测准确率高的结果(作为一个实施例为5/11)的效果。
另外,由于本发明中作为溶剂化熵变计算在取出膜贯穿部位后进行结构最佳化而得的三级结构的溶剂化熵、与取出膜贯穿部位并拆分该膜贯穿部位而伸展后进行结构最佳化而得的一级结构的溶剂化熵的变化,因此能够起到可以获得预测准确率高的结果(作为一个实施例为2/4)的效果。
附图说明
图1是热力学循环(T0=298K)中的N原子为给体、O原子为受体时的图。
图2是热力学循环(T0=298K)中的N原子为给体、O原子为受体时的图。
图3是示意性地表示脂质双层膜层中的磷脂分子的旋转、扩散、翻转、弯曲的运动的图。
图4是示意性地表示烃基和球状溶质的半径之和R的图。伴随着具有15种直径的球状溶质的***,可以获得15种(R,S)的组。
图5是表示针对膜蛋白质的立体结构形成的两阶段模型的图。
图6是表示由2个结构单元构成的GlyCophorinA(GpA)的天然结构(NS)、和利用复制交换蒙特卡洛模拟产生的伪结构的图。
图7是对于GpA的天然结构(NS)和15000个伪结构在横轴绘制与正解结构的最小平方偏差、在纵轴绘制无量纲化了的自由能量差的图。
图8是对于GpA的天然结构(NS)和15000个伪结构在横轴绘制与正解结构的最小平方偏差、在纵轴绘制无量纲化了的能量成分差的图。
图9是对于GpA的天然结构(NS)和15000个伪结构在横轴绘制与正解结构的最小平方偏差、在纵轴绘制熵成分(溶剂化熵)差的图。
图10是表示应用本实施方式的本热稳定化突变体预测装置100的一例的方框图,仅示意性地表示了该构成中与本实施方式有关的部分。
图11是表示利用热稳定化突变体预测装置100执行的处理的一例的流程图。
图12是示意性地表示本实施方式的热稳定化突变体预测装置100的、膜蛋白质的溶剂化熵变-ΔSw和氨基酸突变体的溶剂化熵变-ΔSm的计算方法的图。
图13是表示方式2、3的拆分螺旋后进行结构最佳化的样子的图。
图14是表示方式4、5的将螺旋伸展至一级结构而得的结构的例子的图。
图15是表示本实施方式的方式1~5中共同的步骤的流程图。
图16是表示方式1的处理例的流程图。
图17是表示方式2的处理例的流程图。
图18是表示方式3的处理例的流程图。
图19是表示方式4的处理例的流程图。
图20是表示方式5的处理例的流程图。
图21是表示针对实验中发生稳定化的将第88个残基的苏氨酸置换为谷氨酸的突变体的利用方式1~5所得的计算结果(-ΔΔS)的图。
图22是表示针对实验中发生稳定化(热变性温度升高8℃)的将第91个残基的丝氨酸置换为精氨酸的突变体的利用方式1~5所得的计算结果-ΔΔS的图。
图23是表示针对实验中发生不稳定化的将第245个残基的半胱氨酸置换为色氨酸的突变体的利用方式1~5所得的计算结果-ΔΔS的图。
图24是表示针对实验中发生不稳定化的将第51个残基的丙氨酸置换为色氨酸的突变体的利用方式1~5所得的计算结果-ΔΔS的图。
图25是表示针对实验中发生不稳定化的将第239个残基的缬氨酸置换为精氨酸的突变体的利用方式1~5所得的计算结果-ΔΔS的图。
图26是对5种氨基酸突变预测利用方式1~5得到的热稳定化突变体的结果的表。
图27是表示方式1的-ΔΔS的计算结果的图表。
图28是表示方式2的-ΔΔS的计算结果的图表。
图29是表示方式3的-ΔΔS的计算结果的图表。
图30是表示方式4的-ΔΔS的计算结果的图表。
图31是表示方式5的-ΔΔS的计算结果的图表。
图32是对各氨基酸突变预测利用方式1~5得到的热稳定化突变体的结果的表。
图33是表示利用热稳定化突变体预测装置执行的处理的一例的流程图。
图34是表示形成一个分子内氢键时的能量降低的值的图。
图35是表示Λ的处理例的流程图。
图36是表示预测结果的一例的图。
图37是表示对S91R计算的方式1~5的ΔΔF的值的图。
图38是表示对S91K计算的方式1~5的ΔΔF的值的图。
图39是表示对L85R计算的方式1~5的ΔΔF的值的图。
图40是表示对N280R计算的方式1~5的ΔΔF的值的图。
图41是表示对N181K计算的方式1~5的ΔΔF的值的图。
图42是表示预测结果的一例的图。
图43是表示对S91R计算的方式1~5的-ΔΔS的值的图。
图44是表示对S91K计算的方式1~5的-ΔΔS的值的图。
图45是表示对L85R计算的方式1~5的-ΔΔS的值的图。
图46是表示对N280R计算的方式1~5的-ΔΔS的值的图。
图47是表示对N181K计算的方式1~5的-ΔΔS的值的图。
具体实施方式
以下,基于附图对本发明的热稳定化突变体预测装置、热稳定化突变体预测方法、以及程序的实施方式进行详细说明。而且,本发明并不受该实施方式限定。
[本实施方式的概要]
以下,为了说明本发明的实施方式的概要,首先对本申请发明人等所开发的形态计测学的表现和积分方程式论的综合型方法论进行说明,其后,对本实施方式的概要、构成及处理等进行详细说明。
[综合型方法论]
本申请发明人等以因水分子的并进移动而引起的熵效应作为主要着眼点,利用独自开发的液体的统计力学理论与形态计测学的方法的综合型方法论,成功地提供了水溶液中的蛋白质的热变性的图像。
本实施方式中,应用该综合型方法论,以因构成磷脂分子的疏水链的CH、CH2、CH3基团(可以将它们的集合视为溶剂)的并进移动而引起的熵效应作为主要着眼点,目的在于,在理论上预测由氨基酸置换造成的膜蛋白质的溶剂化熵的变化。此处,膜蛋白质用的自由能量函数F由下式表示。
F=-TS+Λ
(T:绝对温度、S:熵成分、Λ:能量成分)
将上述的式子除以kBT0(kB:玻尔兹曼常数,T0=298K)而无量纲化,如果设定T=T0,则形成下式。
F/(kBT0)=-S/kB+Λ/(kBT0)
此处,图1及图2是热力学循环(T0=298K)中的N原子为给体、O原子为受体时的图。如图1所示,以完全伸展的结构(完全不具有分子内氢键)为基准,计算“伴随着分子内氢键形成的能量降低=分子内氢键数*D”。
此处,D是形成1个分子内氢键时的能量降低的值。另外,D也可以是甲酰胺在非极性溶剂中形成1条氢键时产生的能量降低值(例如-14kBT0等)。
例如,也可以如图2所示,以完全伸展的结构(完全不具有分子内氢键)为基准,计算“伴随着分子内氢键形成的能量降低=分子内氢键数*(-14kBT0)”。此处,-14kBT0是甲酰胺在非极性溶剂中形成1条氢键时产生的能量降低值。
此后,研究主链-主链、主链-侧链、侧链-侧链间的所有给体和受体,计数分子内氢键数,计算“Λ=伴随着分子内氢键形成的能量降低(负)”。而且,假定为蛋白质分子内的范德华引力相互作用的获得与蛋白质-磷脂间的范德华引力相互作用的丧失相抵消。此处,图3是示意性地表示出脂质双层膜层中的磷脂分子的旋转、扩散、翻转、弯曲的运动的图(参考:东京大学生命科学结构化中心/生命科学网络LS-EDI生命科学教育用图像集《脂质双层的性质》URL:http://Csls-db.C.u-tokyo.aC.jp/searCh/detail?image_repository_id=696)。
如图3所示,当由于磷脂的剧烈热运动而引起的蛋白质向膜内的***时,就会发生熵的损失。而且,熵以磷脂分子的烃基集团的并进配置熵为代表。损失的大小以立体结构的函数表示,损失尽可能变小的立体结构会稳定化。此处,将S设为伴随着***的烃基集团的并进配置熵损失(负)。
在将磷脂分子的烃基集团视为溶剂的情况下,S就成为溶剂化熵(将固定为某个立体结构的溶质***溶剂中时产生的溶剂的熵损失:负的量)。
本实施方式中,在计算溶剂化熵S时,可以使用本申请发明人等设计出的形态计测学的表现与积分方程式论的综合型方法论,实现高速的运算。
就形态计测学的表现而言,对于溶质的立体结构,可以基于4个几何学指标(排除体积V、露出表面积A、露出表面的平均曲率的积分值X、以及露出表面的高斯曲率的积分值Y),计算溶剂化熵。即,溶剂化熵S的表现式由以下的线性组合表示。
S/kB=C1V+C2A+C3X+C4Y
此处,排除空间是“溶剂分子的中心不能进入的空间”,排除空间的体积为排除体积V,排除空间的表面积为露出表面积A。排除空间也是具有各种半径的球的结合体,来自于半径r的球的对X、Y的贡献如下所示。
“对X的贡献=在平均曲率1/r上乘以该球的露出表面积ξ而得的值;
对Y的贡献=在高斯曲率1/r2上乘以ξ而得的值“。
而且,根据形态计测学,由于4个形态指标的系数C1、C2、C3、C4不依赖于溶质的几何学的特性,因此可以利用简化了的形态(例如球)进行处理。由此,可以作为将形态简化了的球来理解,计算伴随着具有各种直径的球状溶质的***的熵损失。本实施方式中,使用积分方程式论,将烃基集团作为刚体球溶剂加以模型化而进行计算。根据对于球状溶质的形态计测学的表现,得到以下的式子。
S/kB=C1(4πR3/3)+C2(4πR2)+C3(4πR)+C4(4π),
R=(dU+dS)/2
此处,dS为溶剂分子直径,dU为球状(刚体球)溶质直径。使用积分方程式论计算多个具有不同直径(在0<dU≤30dS的范围内为15种左右)的孤立刚体球溶质的S,应用上述的式子利用最小2乘法来确定C1~C4。一旦确定了C1~C4,就可以对具有任意的立体结构的蛋白质使用这些系数。即,只要计算V、A、X、Y就可以立即根据式子得到S。其中,C1~C4在很大程度上依赖于溶剂的种类、热力学条件(温度、压力等)。
此处,图4是示意性地表示烃基与球状溶质的半径之和R的图。例如,伴随着具有15种直径的球状溶质的***,可以得到15种(R,S)的组。
如果将溶质设为蛋白质,对所有构成原子(H、C、N、O、S)的直径和x、y、z-坐标进行使用了上述4个几何学指标的计算,则利用上述的统计力学理论与形态计测学的方法的综合型方法论,对每1个立体结构,用标准的工作站也可以高速地(1秒以内)计算S。如果与利用考虑了复杂的多原子结构的三维积分方程式论计算的情况相比,则计算时间为大约万分之一,误差小于±5%,即使将Λ的计算也包括在内,自由能量函数F的计算本身也在1秒以内结束。
如上所述,通过将针对水溶液中的蛋白质开发出的综合型方法论应用于膜蛋白质,可以实现处理负荷小的高速的运算。此处,对积分方程式论进行概述。
积分方程式论中,从***的分配函数出发,在定义各种分布函数(相关函数)的同时,导出在它们之间成立的关系式。是只要涉及平衡结构·物性就可以实现与计算机模拟相同水平的解析的方法。由于以无限大的***作为对象,对无限个微观状态取物理量的平均,因此不会有“***尺寸有可能过小;无法避免统计误差”等问题。
在由单一成分构成的大体积溶剂的情况下,如果以温度、数密度、溶剂分子间的相互作用势作为输入数据,在数值上求解在分布函数间成立的关系式,则可以得到表示溶剂的微观结构、宏观性质的各种热力学量(也可以扩展到由多成分构成的溶剂)。
也可以解析溶质的溶剂和特性(溶质附近的溶剂的微观结构;溶剂化的热力学量)。此处,所谓溶剂化的热力学量,是将溶质(使立体结构固定)***溶剂中时产生的热力学量的变化。在刚体球系或林纳德-琼斯流体之类的单纯的溶剂的情况下,可以直接处置具有任意的形状·多原子结构的溶质(三维积分方程式论)。在溶剂化的热力学量的计算中,与计算机模拟相比,积分方程式论的一方更优越,然而在求解基本式的情况下要求相当多的数学、数值分析学的操作,因此在本实施方式中,利用与上述形态计测学的指标的综合来解决该计算。
[本实施方式的概要]
下面,对本实施方式的概要进行说明。
首先,本实施方式制成将膜蛋白质的各氨基酸残基置换为Gly和Pro以外的全部氨基酸的氨基酸突变体的氨基酸序列。例如,通过将氨基酸突变导入野生型的膜蛋白质,可以得到突变体的膜蛋白质。而且,氨基酸突变也可以是在原来的氨基酸序列中缺失、置换或添加了1个或多个氨基酸的氨基酸序列。
另外,本实施方式也可以制成将膜蛋白质的各氨基酸残基置换为包括Gly和Pro在内的全部氨基酸的氨基酸突变体的氨基酸序列。
然后,本实施方式对各氨基酸突变体,分别计算伴随着基于氨基酸序列的结构最佳化的膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变-ΔS或从二级结构形成到三级结构形成的溶剂化熵变-ΔS。此处,图5是表示针对膜蛋白质的立体结构形成的两阶段模型的图(参考:Curr.opin.struCt.biol.2011,21:460-466)。
阶段1涉及膜蛋白质从一级结构形成二级结的阶段。更具体而言,α螺旋的结构单元在膜内被单独地稳定化,形成尽可能多的分子内氢键结构(步骤1)。而且,脂质双层膜层中,与β折叠相比α螺旋的一方更有利。
阶段2涉及膜蛋白质在膜内从二级结构形成三级结构的阶段。更具体而言,进行α螺旋等结构单元间的侧链的填充(步骤2)。本实施方式可以求从一级结构形成经过阶段1、2直到三级结构形成的溶剂化熵变,也可以求从二级结构形成经过阶段2直到三级结构形成的溶剂化熵变。此处,图6是表示由2个结构单元构成的GlyCophorinA(GpA)的天然结构(NS)、和利用复制交换蒙特卡洛模拟产生的伪结构的图。下段的结构是从图示的视点观看上段的结构时的图。如图6所示,虽然作为二级结构的α螺旋结构自身是相同的结构,然而三级结构中的α螺旋之间的位置关系不同。
此后,基于膜蛋白质野生型的溶剂化熵变-ΔSw与氨基酸突变体的溶剂化熵变-ΔSm的差-ΔΔS,选取使之发生热稳定化的氨基酸突变体的候选。此处,图7是对于GpA的天然结构(NS)和15000个伪结构在横轴绘制与正解结构的最小平方偏差、在纵轴绘制无量纲化了的自由能量差的图。
如图7所示,天然结构中自由能量F取得最小值。图8是对于GpA的天然结构(NS)和15000个伪结构在横轴绘制与正解结构的最小平方偏差、在纵轴绘制无量纲化了的能量成分差的图。
如图8所示,天然结构中,由于在结构单元间没有形成分子内氢键,因此比天然结构更有利的伪结构(虚线长方形内的点)作为假阳性存在有多个。此处,图9是对于GpA的天然结构(NS)和15000个伪结构在横轴绘制与正解结构的最小平方偏差、在纵轴绘制熵成分(溶剂化熵)差的图。
如图9所示,可知如果基于作为本实施方式的指标的溶剂化熵变的差,则不会检测出假阳性,可以准确地选取正解结构。这是因为,天然结构中,以使烃基集团的熵最大的方式进行结构单元间的侧链的填充。
以上为本实施方式的概要。下面,对用于利用计算机实现上述的本发明的实施方式的装置构成、处理的详细例子,详细说明如下。
[热稳定化突变体预测装置的构成]
下面,参照图10对本实施方式的热稳定化突变体预测装置100的构成进行说明。图10是表示应用本实施方式的本热稳定化突变体预测装置100的一例的方框图,仅示意性地表示出该构成中的与本实施方式有关的部分。
如图10所示,本实施方式的热稳定化突变体预测装置100大致上至少具备控制部102和存储部106,在本实施方式中,还具备输入输出控制界面部108和通信控制界面部104。此处,控制部102是统括性地控制热稳定化突变体预测装置100的整体的CPU等。另外,通信控制界面部104是连接于与通信线路等连接的路由器等通信装置(未图示)的界面,输入输出控制界面部108是连接于输入部114、输出部116的界面。另外,存储部106是存放各种数据库、表格等的装置。这些热稳定化突变体预测装置100的各部被可以借助任意的通信路通信地连接。此外,该热稳定化突变体预测装置100被可以借助路由器等通信装置及专用线等有线或无线的通信线路与网络300通信地连接。
存放于存储部106的各种数据库、表格(结构文件106a、序列文件106b等)是固定磁盘装置等存储器机构。例如,存储部106存放各种处理中所用的各种程序、表格、文件、数据库、以及网页等。
这些存储部106的各构成要素当中,结构文件106a是存储膜蛋白质的结构数据的结构数据存储机构。结构文件106a也可以存储经由输入部114输入的进行了晶体结构解析的膜蛋白质的结构数据等。而且,结构文件106a中的结构数据也可以包含二维空间、三维空间中的各原子的坐标等。
另外,序列文件106b是存储膜蛋白质的序列数据的序列数据存储机构。序列文件106b也可以存储经由输入部114输入的膜蛋白质的序列数据等。
图10中,输入输出控制界面部108进行输入部114、输出部116的控制。此处,作为输出部116,除了可以使用监视器(包括家用电视)以外,还可以使用扬声器(而且,以下有时将输出部116记作监视器)。另外,作为输入部114,可以使用键盘、鼠标、以及麦克风等。
另外,图10中,控制部102具有用于存放OS(Operating System)等控制程序、规定各种处理步骤等的程序、以及所需数据的内部存储器。此后,控制部102利用这些程序等进行用于执行各种处理的信息处理。就功能概念而言,控制部102具备突变导入部102a、计算部102b、以及候选选取部102c。
其中,如图10所示,突变导入部102a是通过将氨基酸突变导入膜蛋白质的各氨基酸序列而生成氨基酸突变体(以下简称为“突变体”)的氨基酸序列的突变导入机构。此处,突变导入部102a也可以作为突变体生成相对于原来的氨基酸序列缺失、置换、或添加了1个或多个氨基酸的氨基酸序列。
另外,计算部102b是对膜蛋白质野生型及各突变体计算伴随着基于氨基酸序列的结构最佳化的膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变-ΔSw、-ΔSm的计算机构。另外,计算部102b可以使用基于排除体积V、露出表面积A、露出表面的平均曲率的积分值X、以及露出表面的高斯曲率的积分值Y的4个几何学指标的形态计测学的表现与积分方程式论的综合型方法论,计算溶剂化熵。
此处,对于结构最佳化,计算部102b可以不仅基于存储于序列文件106b中的氨基酸序列,而且还基于存储于结构文件106a中的结构数据进行结构最佳化。另外,计算部102b可以首先将膜蛋白质的重原子固定而进行最小化,然后,将Cα碳及Cβ碳固定而进行最小化,最后,不固定地进行最小化,由此在分阶段地去掉约束的同时进行结构最佳化。除此以外,计算部102b也可以使用像Modeller等那样其他的结构最佳化法来进行结构最佳化。
此处,计算部102b也可以利用以下的方式1~方式5中的任意一种方式来计算溶剂化熵变。
方式1:在进行结构最佳化后取出膜贯穿部位而得的三级结构的溶剂化熵与拆分三级结构而得的二级结构的溶剂化熵的变化
方式2:在取出膜贯穿部位后进行结构最佳化而得的三级结构的溶剂化熵与拆分所取出的该膜贯穿部位后进行结构最佳化而得的二级结构的溶剂化熵的变化
方式3:在进行结构最佳化后取出膜贯穿部位而得的三级结构的溶剂化熵与取出膜贯穿部位并拆分该膜贯穿部位后进行结构最佳化而得的二级结构的溶剂化熵的变化
方式4:在进行结构最佳化后取出膜贯穿部位而得的三级结构的溶剂化熵与取出膜贯穿部位并伸展该膜贯穿部位后进行结构最佳化而得的一级结构的溶剂化熵的变化
方式5:在取出膜贯穿部位后进行结构最佳化而得的三级结构的溶剂化熵与取出膜贯穿部位并拆分该膜贯穿部位并伸展后进行结构最佳化而得的一级结构的溶剂化熵的变化
另外,候选选取部102c是基于膜蛋白质野生型的溶剂化熵变-ΔSw与突变体的溶剂化熵变-ΔSm的差-ΔΔS(=-ΔSw-(-ΔSm))来选取使之发生热稳定化的突变体的候选的候选选取机构。例如,候选选取部102c可以判定在-ΔΔS为负的值时发生热稳定化,在-ΔΔS为正时发生热不稳定化。作为一例,候选选取部102c可以选取-ΔΔS为给定值以下的突变体作为使之发生热稳定化的突变体的候选。而且,以下,列举出各记号与其意味的对应关系。
S:(某个结构的)溶剂化熵
-ΔS:(从某个结构向其他结构的)溶剂化熵变
-ΔΔS:(突变前的蛋白质与突变体之间的)溶剂化熵变的差
以上是本实施方式的热稳定化突变体预测装置100的构成的一例。而且,热稳定化突变体预测装置100也可以借助网络300与外部***200连接。该情况下,通信控制界面部104进行热稳定化突变体预测装置100与网络300(或路由器等通信装置)之间的通信控制。即,通信控制界面部104具有借助通信线路与其他终端进行数据通信的功能。另外,网络300具有将热稳定化突变体预测装置100与外部***200相互连接的功能,例如为互联网等。
另外,外部***200借助网络300与热稳定化突变体预测装置100相互连接,具有向涉及结构数据或序列数据、参数、模拟结果数据等各种数据的外部数据库、或所连接的信息处理装置提供用于执行热稳定化突变体预测方法的程序等的功能。
此处,外部***200也可以作为WEB服务器或ASP服务器等构成。另外,外部***200的硬件构成一般可以利用市售的工作站、个人计算机等信息处理装置及其附属装置来构成。另外,外部***200的各功能由外部***200的硬件构成中的CPU、磁盘装置、存储器装置、输入装置、输出装置、通信控制装置等及控制它们的程序等来实现。
以上内容可以结束本实施方式的构成的说明。
[热稳定化突变体预测装置100的处理]
下面,对于如此构成的本实施方式的热稳定化突变体预测装置100的处理的一例,参照附图详细说明如下。
首先,参照图11对利用热稳定化突变体预测装置100执行的处理的一例进行说明。图11是表示利用热稳定化突变体预测装置100执行的处理的一例的流程图。
如图11所示,首先,突变导入部102a通过将氨基酸突变导入存储于序列文件106b中的膜蛋白质的氨基酸序列,而生成突变体Mt的氨基酸序列(步骤SA-1)。例如,突变导入部102a也可以生成缺失了1个氨基酸、置换了1个氨基酸、添加了1个氨基酸等导入了氨基酸突变的突变体Mt。
此后,计算部102b对膜蛋白质野生型Wt及各突变体Mt,计算伴随着基于氨基酸序列的结构最佳化的膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变-ΔSw、-ΔSm(步骤SA-2)。而且,计算部102b也可以利用后述的方式1~5中的任意一种方式来计算溶剂化熵的变化。另外,计算部102b也可以使用基于排除体积V、露出表面积A、露出表面的平均曲率的积分值X、以及露出表面的高斯曲率的积分值Y的4个几何学指标的形态计测学的表现与积分方程式论的综合型方法论,来计算溶剂化熵。此处,对于结构最佳化,计算部102b不仅可以基于存储于序列文件106b中的氨基酸序列来进行结构最佳化,而且还可以基于存储于结构文件106a中的结构数据来进行结构最佳化。另外,计算部102b可以首先将膜蛋白质的重原子固定而进行最小化,然后,将Cα碳及Cβ碳固定而进行最小化,最后,不固定地进行最小化,由此在分阶段地去掉约束的同时进行结构最佳化。
此后,候选选取部102c计算膜蛋白质野生型Wt的溶剂化熵变-ΔSw与突变体Mt的溶剂化熵变-ΔSm的差-ΔΔS(=-ΔSw-(-ΔSm))(步骤SA-3)。
此后,候选选取部102c基于计算出的差-ΔΔS,选取使之发生热稳定化的突变体Mt的候选(步骤SA-4)。例如,候选选取部102c也可以判定在-ΔΔS为负的值时发生热稳定化,在-ΔΔS为正时发生热不稳定化。作为一例,候选选取部102c可以选取-ΔΔS为给定的阈值以下的突变体Mt作为使之发生热稳定化的突变体Mt的候选。
以上是本实施方式的热稳定化突变体预测装置100的处理的一例。
[5种方式]
下面,以上述的处理为基础,参照图12~图32,对具体的5种方式1~5的处理的详情说明如下。图12是示意性地表示出本实施方式的热稳定化突变体预测装置100的、膜蛋白质野生型Wt的溶剂化熵变-ΔSw、和突变体Mt的溶剂化熵变-ΔSm的计算方法的图。
作为代表例,如图12所示,对于膜蛋白质野生型Wt和突变体Mt,分别作为溶剂化熵变求出将α螺旋之间拆分的状态与堆积的状态之间的溶剂化熵的差-ΔS。求出这些膜蛋白质野生型Wt的溶剂化熵变-ΔSw与突变体Mt的溶剂化熵变-ΔSm的差-ΔΔS(=-ΔSw-(-ΔSm))。
具体而言,计算部102b可以利用以下的方式1~5中的任意一个方式来进行溶剂化熵的变化。
方式1是求出在进行结构最佳化后取出膜贯穿部位而得的三级结构的溶剂化熵S与拆分三级结构而得的二级结构的溶剂化熵S的变化-ΔS的方法。如此所述,方式1中,不考虑拆分了的螺旋的侧链的再填充。
方式2是求出在取出膜贯穿部位后进行结构最佳化而得的三级结构的溶剂化熵S与将所取出的该膜贯穿部位拆分后进行结构最佳化而得的二级结构的溶剂化熵S的变化-ΔS的方法。图13是表示将方式2、3的螺旋拆分后进行结构最佳化的样子的图。
方式3是求出在进行结构最佳化后取出膜贯穿部位而得的三级结构的溶剂化熵S与取出膜贯穿部位并拆分该膜贯穿部位后进行结构最佳化而得的二级结构的溶剂化熵S的变化-ΔS的方法。如图13所示,方式2、3进行拆分了的螺旋各自的结构最佳化,考虑了侧链的再填充。
方式4是求出在进行结构最佳化后取出膜贯穿部位而得的三级结构的溶剂化熵S与取出膜贯穿部位并伸展该膜贯穿部位后进行结构最佳化而得的一级结构的溶剂化熵S的变化-ΔS的方法。图14是表示方式4、5的将螺旋伸展至一级结构的结构的例子的图。
方式5是求出在取出膜贯穿部位后进行结构最佳化而得的三级结构的溶剂化熵S与取出膜贯穿部位并拆分该膜贯穿部位而伸展后进行结构最佳化而得的一级结构的溶剂化熵S的变化-ΔS的方法。如图14所示,方式4、5中,也考虑两阶段模型中的阶段1的伴随着螺旋形成的熵变。另外,方式1、3、4中在将堆积了的结构最小化时,也考虑环结构。以下,对方式1~5的更具体的流程例进行详细说明。
此处,图15是表示本实施方式的方式1~5中共同的步骤的流程图。而且,本实施例中,将来自于人的腺苷A2a受体的晶体结构(PDB Code;3vg9)作为野生型Wt使用。作为随后详述的方式1~5中共同的处理,如图15所示,计算部102b作为一例使用CHARMM程序及MMTSB程序,对A2aR的晶体结构进行加氢(以后,将该结构称作结构<1>)。以下对方式1~5的独立流程进行说明。图16是表示方式1的处理例的流程图。
[方式1]
如图16所示,首先,对野生型Wt的结构<1>,计算部102b使用CHARMM程序,依照将膜蛋白质的重原子固定而进行最小化、将Cα碳及Cβ碳固定而进行最小化、不固定而进行最小化的顺序,在分阶段地去掉约束的同时进行结构最佳化(步骤S1-1)。而且,以下将该处理简称为“结构的最佳化”。
然后,计算部102b仅将膜贯穿部位取出,计算其溶剂化熵(-Sw)(步骤S1-2)。
此后,计算部102b计算拆分各个螺旋而得的结构的溶剂化熵的总和(-S’w)(步骤S1-3)。
此后,计算部102b计算伴随着螺旋的堆积的熵变-ΔSw=-Sw-(-S’w)(步骤S1-4)。
另一方面,对突变体Mt,突变导入部102a基于存储于序列文件106b中的序列数据,置换结构<1>的氨基酸残基(步骤S1-a)。
此后,计算部102b进行结构的最佳化(步骤S1-b)。
此后,计算部102b仅将膜贯穿部位取出,计算溶剂化熵(-Sm)(步骤S1-c)。
此后,计算部102b计算拆分各个螺旋而得的结构的溶剂化熵的总和(-S’m)(步骤S1-d)。
此后,计算部102b计算伴随着螺旋的堆积的熵变-ΔSm=-Sm-(-S’m)(步骤S1-e)。
根据以上的结果,计算部102b可以计算作为野生型Wt的熵变-ΔSw与突变型的熵变-ΔSm的差的、伴随着氨基酸置换的熵变-ΔΔS=-ΔSm-(-ΔSw)。
[方式2]
图17是表示方式2的处理例的流程图。如图17所示,首先,对于野生型Wt的结构<1>,计算部102b仅将结构<1>的膜贯穿部位(称作结构<2>)取出(步骤S2-1)。
然后,计算部102b进行结构的最佳化,计算其溶剂化熵(-Sw)(步骤S2-2)。
此后,计算部102b拆分结构<2>的螺旋(步骤S2-3)。
此后,计算部102b进行各个螺旋的结构的最佳化,计算溶剂化熵的总和(-S’w)(步骤S2-4)。
此后,计算部102b计算伴随着螺旋的堆积的熵变-ΔSw=-Sw-(-S’w)(步骤S2-5)。
另一方面,对于突变体Mt,突变导入部102a置换结构<2>的氨基酸残基(将该结构设为结构<3>)(步骤S2-a)。
此后,计算部102b进行结构的最佳化,计算其溶剂化熵(-Sm)(步骤S2-b)。
此后,计算部102b拆分结构<3>的螺旋(步骤S2-c)。
此后,计算部102b进行各个螺旋的结构的最佳化,计算溶剂化熵的总和(-S’m)(步骤S2-d)。
此后,计算部102b计算伴随着螺旋的堆积的熵变-ΔSm=-Sm-(-S’m)(步骤S2-e)。
根据以上的结果,计算部102b可以计算作为野生型Wt的熵变-ΔSw与突变型的熵变-ΔSm的差的、伴随着氨基酸置换的熵变-ΔΔS=-ΔSm-(-ΔSw)。
[方式3]
图18是表示方式3的处理例的流程图。如图18所示,首先,对于野生型Wt的结构<1>,计算部102b进行结构<1>的结构的最佳化(步骤S3-1)。
然后,计算部102b仅将膜贯穿部位取出,计算其溶剂化熵(-Sw)(步骤S3-2)。
此后,计算部102b取出结构<1>的膜贯穿部位,拆分螺旋结构(步骤S3-3)。
此后,计算部102b进行各个螺旋的结构的最佳化,计算溶剂化熵的总和(-S’w)(步骤S3-4)。
此后,计算伴随着螺旋的堆积的熵变-ΔSw=-Sw-(-S’w)(步骤S3-5)。
另一方面,对于突变体Mt,突变导入部102a置换结构<1>的氨基酸残基(将该结构设为结构<4>)(步骤S3-a)。
此后,计算部102b进行结构<4>的结构的最佳化(步骤S3-b)。
此后,计算部102b仅将膜贯穿部位取出,计算其溶剂化熵(-Sm)(步骤S3-c)。
此后,计算部102b仅将结构<4>的膜贯穿部位取出,拆分螺旋结构(步骤S3-d)。
此后,计算部102b进行各个螺旋的结构的最佳化,计算溶剂化熵的总和(-S’m)(步骤S3-e)。
此后,计算部102b计算伴随着螺旋的堆积的熵变-ΔSm=-Sm-(-S’m)(步骤S3-f)。
根据以上的结果,计算部102b可以计算作为野生型Wt的熵变-ΔSw与突变型的熵变-ΔSm的差的、伴随着氨基酸置换的熵变-ΔΔS=-ΔSm-(-ΔSw)。
[方式4]
图19是表示方式4的处理例的流程图。如图19所示,首先,对于野生型Wt的结构<1>,计算部102b进行结构<1>的结构的最佳化(步骤S4-1)。
然后,计算部102b仅将膜贯穿部位取出,计算其溶剂化熵(-Sw)(步骤S4-2)。
此后,计算部102b取出结构<1>的膜贯穿部位,制成完全伸展开的结构(步骤S4-3)。
此后,计算部102b进行各个伸展开的结构的最佳化,计算溶剂化熵的总和(-S’w)(步骤S4-4)。
此后,计算部102b计算相对于伸展开的结构而言的伴随着螺旋形成及堆积的熵变-ΔSw=-Sw-(-S’w)(步骤S4-5)。
另一方面,对于突变体Mt,突变导入部102a置换结构<1>的氨基酸残基(将该结构设为结构<4>)(步骤S4-a)。
此后,计算部102b进行结构<4>的结构的最佳化(步骤S4-b)。
此后,计算部102b仅将膜贯穿部位取出,计算其溶剂化熵(-Sm)(步骤S4-c)。
此后,计算部102b仅将结构<4>的膜贯穿部位取出,制成完全伸展开的结构(步骤S4-d)。
此后,计算部102b进行各个伸展开的结构的最佳化,计算溶剂化熵的总和(-S’m)(步骤S4-e)。
此后,计算部102b计算相对于伸展开的结构而言的伴随着螺旋形成及堆积的熵变-ΔSm=-Sm-(-S’m)(步骤S4-f)。
根据以上的结果,计算部102b可以计算作为野生型Wt的熵变-ΔSw与突变型的熵变-ΔSm的差的、伴随着氨基酸置换的熵变-ΔΔS=-ΔSm-(-ΔSw)。
[方式5]
图20是表示方式5的处理例的流程图。如图20所示,首先,对于野生型Wt的结构<1>,计算部102b仅将结构<1>的膜贯穿部位(称作结构<2>)取出(步骤S5-1)。
然后,计算部102b进行结构的最佳化,计算其溶剂化熵(-Sw)(步骤S5-2)。
此后,计算部102b拆分结构<2>的螺旋,制成完全伸展开的结构(步骤S5-3)。
此后,计算部102b进行各个伸展开的结构的最佳化,计算溶剂化熵的总和(-S’w)(步骤S5-4)。
此后,计算部102b计算相对于伸展开的结构而言的伴随着螺旋形成及堆积的熵变-ΔSw=-Sw-(-S’w)(步骤S5-5)。
另一方面,对于突变体Mt,突变导入部102a置换结构<2>的氨基酸残基(步骤S5-a)。
此后,计算部102b进行结构<3>的结构的最佳化,计算其溶剂化熵(-Sm)(步骤S5-b)。
此后,计算部102b拆分结构<3>的螺旋,制成完全伸展开的结构(步骤S5-c)。
此后,计算部102b进行各个伸展开的结构的最佳化,计算溶剂化熵的总和(-S’m)(步骤S5-d)。
此后,计算部102b计算相对于伸展开的结构的伴随着螺旋形成及堆积的熵变-ΔSm=-Sm-(-S’m)(步骤S5-e)。
根据以上的结果,计算部102b可以计算作为野生型Wt的熵变-ΔSw与突变型的熵变-ΔSm的差的、伴随着氨基酸置换的熵变-ΔΔS=-ΔSm-(-ΔSw)。
[与实验结果的比较]
对于已知会因置换而发生稳定化或不稳定化的5种氨基酸突变,研究了由方式1~5造成的热稳定化突变体的预测结果。图21是表示对于实验中发生稳定化的将第88个残基的苏氨酸置换为谷氨酸的突变体的利用方式1~5得到的计算结果(-ΔΔS)的图。
如图21所示,方式1、2、5中,形成负的数而成功地完成预测。图22是表示对于实验中发生稳定化(热变性温度升高8℃)的将第91个残基的丝氨酸置换为精氨酸的突变体的利用方式1~5得到的计算结果-ΔΔS的图。
如图22所示,全都形成负的数,在所有方式中成功地完成预测。即使是置换为其他的氨基酸,也可以期待发生稳定化。图23是对于实验中发生不稳定化的将第245个残基的半胱氨酸置换为色氨酸的突变体的利用方式1~5得到的计算结果-ΔΔS的图。
如图23所示,方式1中,预测为会发生稳定化。其他方式中,预测为会被不稳定化。图24是表示对于实验中发生不稳定化的将第51个残基的丙氨酸置换为色氨酸的突变体的利用方式1~5的计算结果-ΔΔS的图。
如图24所示,方式1中预测为会发生稳定化。但是,由于该置换,在受体的折叠过程中产生问题,可以认为是因为无法变为所预测的折叠后的结构。图25是表示对于实验中发生不稳定化的将第239个残基的缬氨酸置换为精氨酸的突变体的利用方式1~5得到的计算结果-ΔΔS的图。
如图25所示,在所有的方式中预测失败。图26是对于5种氨基酸突变利用方式1~5得到的热稳定化突变体的预测结果的表。○标记表示预测成功,×标记表示预测失败。另外,减号表示稳定化,加号表示不稳定化。
如图26所示,对于5种氨基酸突变,方式5的预测成功率高。另外,例如在将方式1和2组合、两者都得出稳定(负的数)的结果的情况下,可以作为稳定化突变体候选预测。
然后,对根据StaR(注册商标)技术的Tate等人的实验结果已知热稳定效果的突变体组研究了方式1~5的预测结果。Tate等人根据丙氨酸扫描的实验结果,报告了17处发生稳定化的氨基酸置换。对该结果和利用方式1~5计算出的-ΔΔS的值进行了比较。图27~图31是各个方式1~5的-ΔΔS的计算结果的图表。图32是对于各氨基酸突变利用方式1~5得到的热稳定化突变体的预测结果的表。○标记表示预测成功,×标记表示预测失败,空白栏表示从计算中去掉。另外,减号表示稳定化,加号表示不稳定化。而且,G114A、G118A、G123A、G152A等将甘氨酸置换为丙氨酸的情况由于结构的自由度大幅度改变,因此可以认为膜的熵效应以外的影响、即结构熵的影响大,因而从计算中去掉,设为空白栏。另外,P149A、E151A残基是无法获得晶体结构的环部分,因此从计算中去掉,设为空白栏。H075A、T119A、K122A、A203L、A204L、A231L、L235A是膜外的氨基酸残基,因此在取出膜贯穿部位后进行置换的方式2和5中属于计算外,所以设为空白栏。
如图27~图32所示,可以认为适合使用方式1或方式4。另外,对于T088A,根据实验结果,是稳定性大幅度提高的置换,利用方式1~5的哪个计算方式都可以预测会发生稳定化。因而,如果选择利用方式1~5的哪个计算方式都可以预测会发生稳定化的置换,则可以期待能够预测出稳定性大幅度提高的突变体。
[实施例]
另外,参照图1、以及图33至图47,对本实施方式的热稳定化突变体预测装置100的实施例进行说明。图33是表示利用热稳定化突变体预测装置100执行的处理的一例的流程图。
如图33所示,首先,突变导入部102a通过对存储于序列文件106b中的膜蛋白质野生型Wt的氨基酸序列导入氨基酸突变,而生成突变体Mt的氨基酸序列(步骤SB-1)。例如,突变导入部102a也可以生成导入了缺失1个氨基酸、置换1个氨基酸、添加1个氨基酸等氨基酸突变的突变体Mt。
此后,计算部102b对于膜蛋白质野生型Wt及各突变体Mt,计算伴随着基于氨基酸序列的结构最佳化的膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变-ΔSw、-ΔSm,对于膜蛋白质野生型Wt及各突变体Mt,计算伴随着基于氨基酸序列的结构最佳化的膜贯穿部位的、从一级结构形成到三级结构形成或从二级结构形成到三级结构形成的能量变化ΔΛw、ΔΛm(步骤SB-2)。
而且,计算部102b也可以利用前述的方式1~5中的任意一个方式计算溶剂化熵的变化。另外,计算部102b也可以使用基于排除体积V、露出表面积A、露出表面的平均曲率的积分值X、以及露出表面的高斯曲率的积分值Y的4个几何学指标的形态计测学的表现与积分方程式论的综合型方法论,来计算溶剂化熵。
此处,对于结构最佳化,计算部102b不仅可以基于存储于序列文件106b中的氨基酸序列,而且还可以基于存储于结构文件106a中的结构数据进行结构最佳化。另外,计算部102b可以首先将膜蛋白质的重原子固定而进行最小化,然后,将Cα碳及Cβ碳固定而进行最小化,最后,不固定地进行最小化,由此在分阶段地去掉约束的同时进行结构最佳化。
此处,参照图1、图34、以及图35对本实施例的能量计算的一例进行说明。图34是表示形成一个分子内氢键时的能量降低的值的图。
本实施例中,膜蛋白质用的自由能量函数F由下式表示。
F=-TS+Λ
(T:绝对温度、S:熵成分、Λ:能量成分)
将上述的式子除以kBT0(kB:玻尔兹曼常数,T0=298K)而无量纲化,如果设定T=T0,则形成下式。
F/(kBT0)=-S/kB+Λ/(kBT0)
此处,如图1所示,本实施例中,以完全伸展开的结构(完全不具有分子内氢键)为基准,计算“伴随着分子内氢键形成的能量降低=分子内氢键数*D”。此处,D是形成1个分子内氢键时的能量降低的值。
另外,如图34所示,D在给体与受体的原子的中心间距离小于的情况下,设为D0(即,提供D0的能量降低),在中心间距离为以上且小于的情况下,设为从0到D0直线性减少的值(即,提供直线性减少了的能量降低),在中心间距离为以上的情况下,设为0(即,不提供能量降低)。此处,本实施例中,D0也可以是-4kBT。
此后,研究主链-主链、主链-侧链、侧链-侧链间的所有给体和受体,分别计算D,取得其总和,由此计算出“Λ=伴随着分子内氢键形成的能量降低(负)”。而且,假定为蛋白质分子内的范德华引力相互作用的获得与蛋白质-磷脂间的范德华引力相互作用的丧失相互抵消。
此处,参照图35,对本实施例的Λ的计算步骤的一例进行说明。图35是表示Λ的处理例的流程图。
如图35所示,首先,计算部102b进行膜蛋白质野生型Wt的结构<1>的结构的最佳化(步骤S6-1)。
然后,计算部102b仅将膜贯穿(间入)部位取出,计算其能量(Λw)(步骤S6-2)。
此后,计算部102b取出结构<1>的膜贯穿部位,取得假想地认为完全伸展的结构(Λ’w=0)(步骤S6-3)。
此后,计算部102b计算相对于假想地认为完全伸展的结构(Λ’w=0)而言的伴随着螺旋形成及堆积的能量变化ΔΛw=Λw-Λ’w(步骤S6-4)。
另一方面,对于突变体Mt,突变导入部102a置换结构<1>的氨基酸残基(将该结构设为结构<4>)(步骤S6-a)。
此后,计算部102b进行结构<4>的结构的最佳化(步骤S6-b)。
此后,计算部102b仅将膜贯穿部位取出,计算其能量(Λm)(步骤S6-c)。
此后,计算部102b取出结构<4>的膜贯穿部位,取得假想地认为完全伸展的结构(Λ’m=0)(步骤S6-d)。
此后,计算部102b计算相对于假想地认为完全伸展的结构(Λ’m=0)而言的伴随着螺旋形成及堆积的能量变化ΔΛm=Λm-Λ’m(步骤S6-e)。
根据以上的结果,计算部102b可以计算出作为膜蛋白质野生型Wt的能量变化ΔΛw与突变型的能量变化ΔΛm的差的、由折叠造成的能量降低的伴随着氨基酸置换的能量变化量ΔΔΛ=ΔΛm-ΔΛw。
回到图33,候选选取部102c计算膜蛋白质野生型Wt的溶剂化熵变-ΔSw与突变体Mt的溶剂化熵变-ΔSm的差-ΔΔS(=-ΔSw-(-ΔSm)),并计算膜蛋白质野生型Wt的能量变化ΔΛw与突变体Mt的能量变化ΔΛm的差ΔΔΛ(=ΔΛw-ΔΛm)(步骤SB-3)。
此后,候选选取部102c基于作为所计算出的ΔΔΛ与-TΔΔS的和的ΔΔF,选取使之发生热稳定化的突变体Mt的候选(步骤SB-4)。例如,候选选取部102c可以判定在ΔΔF(由折叠造成的体系的自由能量降低的伴随着氨基酸置换的变化量)为负的值的情况下发生热稳定化,在ΔΔF为正的情况下发生热不稳定化。作为一例,候选选取部102c可以选取ΔΔF为给定的阈值以下的突变体Mt作为使之发生热稳定化的突变体Mt的候选。
此处,参照图36至图47,对本实施的预测结果的一例进行说明。图36是表示预测结果的一例的图。图37是表示对S91R计算的方式1~5的ΔΔF的值的图。图38是表示对S91K计算的方式1~5的ΔΔF的值的图。图39是表示对L85R计算的方式1~5的ΔΔF的值的图。图40是表示对N280R计算的方式1~5的ΔΔF的值的图。图41是表示对N181K计算的方式1~5的ΔΔF的值的图。图42是表示预测结果的一例的图。图43是表示对S91R计算的方式1~5的-ΔΔS的值的图。图44是表示对S91K计算的方式1~5的-ΔΔS的值的图。图45是表示对L85R计算的方式1~5的-ΔΔS的值的图。图46是表示对N280R计算的方式1~5的-ΔΔS的值的图。图47是表示对N181K计算的方式1~5的-ΔΔS的值的图。
首先,在使用Modeller进行的全氨基酸置换当中,在基于方式1计算出的ΔΔF的值中,从小的值起依次选取5个氨基酸置换(S91R、S91K、L85R、N280R、N181K)作为预测稳定化的氨基酸置换。
此后,如图36所示,在本实施例中,使用本热稳定化突变体预测方法,对这5个氨基酸置换计算ΔΔF的值(图37~图41),取得使用了方式1到方式5的任意一个方式时的预测结果(稳定化(-)或不稳定化(+))。
即,如图36所示,本实施例中,无论是使用了方式1到方式5的哪个方式时,相对于这5个氨基酸置换的ΔΔF的值都是负的值,预测为使之发生稳定化的突变体(图36的方式1到方式5的列中所示的(-))。
此后,对这5个氨基酸置换进行验证实验,在实验上进行是否发生稳定化的确认,其结果是,如图36所示,在这5个氨基酸置换当中的3个氨基酸置换中在实际中可以确认稳定化(图36的左端的列中所示的(-)),无论使用方式1到方式5的哪个方式,都可以得到预测成功率60%的结果。
此外,如图42所示,本实施例中,使用本热稳定化突变体预测方法,对这5个氨基酸置换计算了-ΔΔS的值(图43~图47),其结果是,取得了使用方式1到方式5的任意一个方式时的预测结果(稳定化(-)或不稳定化(+))。
即,如图42所示,本实施例中,无论使用方式1到方式5的哪个方式时,相对于这5个氨基酸置换的-ΔΔS的值都是负的值,预测为使之发生稳定化的突变体(图42的方式1到方式5的列中所示的(-))。
此后,对这5个氨基酸置换进行验证实验,在实验上进行了是否发生稳定化的确认,其结果是,如图42所示,在这5个氨基酸置换当中的3个氨基酸置换中在实际中可以确认稳定化(图42的左端的列中所示的(-)),如果仅从熵的观点考虑,则无论使用方式1到方式5的哪个方式,都可以得到预测成功率60%的结果。
如此所述,可知在本实施例中,无论是进行使用了-ΔΔS的热稳定化突变体预测,还是进行使用了ΔΔF的热稳定化突变体预测,都可以得到高的预测成功率。
[其他实施方式]
虽然此前对本发明的实施方式进行了说明,然而本发明也可以在上述的实施方式以外,在技术方案的范围中记载的技术思想的范围内利用各种不同的实施方式来实施。
例如,虽然以热稳定化突变体预测装置100以独立式(stand alone)的形态进行处理的情况作为一例进行了说明,然而热稳定化突变体预测装置100也可以根据来自客户端的要求进行处理,并将该处理结果返回该客户端。
另外,也可以将实施方式中说明的各处理中的作为自动进行的处理说明的处理的全部或一部分手动地进行,或者将作为手动地进行的处理说明的处理的全部或一部分利用公知的方法自动地进行。
除此以外,对于上述文献中或附图中给出的处理步骤、控制步骤、包括具体的名称、各处理的登记数据或检索条件等参数的信息、画面例、数据库构成,除了特别记述的情况以外可以任意变更。
另外,对于热稳定化突变体预测装置100,图示的各构成要素是功能概念上的构成要素,不一定需要在实际中如图所示地构成。
例如,对于热稳定化突变体预测装置100的各装置所具备的处理功能,特别是利用控制部102进行的各处理功能,也可以将其全部或任意的一部分利用CPU(CentralProCessing Unit)及由该CPU解释执行的程序来实现,另外,也可以作为基于布线逻辑的硬件来实现。而且,程序记录于后述的记录介质中,根据需要由热稳定化突变体预测装置100机械式地读取。即,在ROM或HD等存储部106等中,作为OS(Operating System)记录有用于协同地对CPU提供命令、进行各种处理的计算机程序。该计算机程序通过加载到RAM中而执行,与CPU协同地构成控制部。
另外,该计算机程序也可以存储于借助任意的网络300与热稳定化突变体预测装置100连接的应用程序服务器中,根据需要可以下载其全部或一部分。
另外,也可以将本发明的程序存放在计算机能够读取的记录介质中,另外,也可以作为程序产品构成。此处,该所谓“记录介质”,包括存储卡、USB存储器、SD卡、软盘、光磁盘、ROM、EPROM、EEPROM、CD-ROM、MO、DVD、以及Blu-ray(注册商标)DisC等任意的“可搬用的物理介质”。
另外,所谓“程序”,是利用任意的语言或记述方法记述的数据处理方法,无论是源代码还是二进制包等形式均可。而且,“程序”不一定限于单一地构成的程序,也包括作为多个模块或库分散构成的程序、与以OS(Operating System)为代表的其他程序协同地实现该功能的程序。而且,对于实施方式中所示的各装置中用于读取记录介质的具体的构成、读取步骤、或读取后的安装步骤等,可以使用周知的构成、步骤。
存放于存储部106中的各种数据库等(结构文件106a、序列文件106b等)是RAM、ROM等存储器装置、硬盘等固定磁盘装置、软盘、以及光盘等存储机构,存放各种处理或网站提供中所用的各种程序、表格、数据库、以及网页用文件等。
另外,热稳定化突变体预测装置100可以作为已知的个人计算机、工作站等信息处理装置来构成,另外,也可以在该信息处理装置中连接任意的周边装置来构成。另外,热稳定化突变体预测装置100也可以通过在该信息处理装置中安装实现本发明的方法的软件(包括程序、数据等)来实现。
此外,装置的分散、合并的具体形态并不限于图示的形态,可以将其全部或一部分根据各种的添加等、或根据功能负荷,以任意的单位在功能上或实体上分散、合并地构成。即,可以将上述的实施方式任意地组合实施,也可以将实施方式选择性地实施。
产业上的可利用性
如上说明所示,根据本发明,可以提供在将伸长法应用于二维系、三维系时也可以抑制计算时间的延长的热稳定化突变体预测装置、热稳定化突变体预测方法、以及程序,因此在新型物质探索、医疗、制药、创制新药、化学的研究、生物学研究、临床检查等各种领域中极为有用。
符号的说明
100 热稳定化突变体预测装置,
102 控制部,
102a 突变导入部,
102b 计算部,
102c 候选选取部,
104 通信控制界面部,
106 存储部,
106a 结构文件,
106b 序列文件,
108 输入输出控制界面部,
114 输入部,
116 输出部,
200 外部***,
300 网络
Claims (16)
1.一种预测装置,其预测由氨基酸置换造成的膜蛋白质的溶剂化熵的变化,其具备存储部和控制部,其中,
所述存储部存储所述膜蛋白质的氨基酸序列,和
所述控制部具备:
突变导入机构,其将氨基酸突变导入所述膜蛋白质的所述氨基酸序列,由此生成氨基酸突变体的氨基酸序列;和
计算机构,其对于各氨基酸突变体,计算膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变;
其中所述计算机构通过下式计算溶剂化熵S:
S/kB=C1V+C2A+C3X+C4Y,
其中kB为玻尔兹曼常数,V为排除体积V,A为露出表面积,X为露出表面的平均曲率的积分值,和Y为露出表面的高斯曲率的积分值Y,
其中应用下式利用最小2乘法确定C1、C2、C3和C4:
S'/kB=C1(4πR3/3)+C2(4πR2)+C3(4πR)+C4(4π),
其中kB为玻尔兹曼常数,R=(dU+dS)/2,其中dS为溶剂分子直径,dU为球状刚体球溶质直径,和其中S'为使用积分方程式论计算的具有多个不同直径的孤立刚体球溶质的溶剂化熵。
2.根据权利要求1所述的预测装置,其中,
所述计算机构还对于所述膜蛋白计算所述膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变。
3.根据权利要求1或2所述的预测装置,其特征在于,
所述存储部还存储所述膜蛋白质的结构数据,和
所述计算机构基于所述氨基酸序列及所述结构数据进行结构最佳化。
4.根据权利要求1或2所述的预测装置,其特征在于,
所述计算机构首先将所述膜蛋白质的重原子固定而进行最小化,然后将Cα碳及Cβ碳固定而进行最小化,最后,不固定地进行最小化,由此在分阶段地去掉约束的同时进行结构最佳化。
5.根据权利要求1或2所述的预测装置,其特征在于,
所述计算机构将在进行结构最佳化后取出所述膜贯穿部位而得的所述三级结构的溶剂化熵、与拆分该三级结构而得的所述二级结构的溶剂化熵的变化作为所述溶剂化熵变进行计算。
6.根据权利要求1或2所述的预测装置,其特征在于,
所述计算机构将在取出所述膜贯穿部位后进行结构最佳化而得的所述三级结构的溶剂化熵、与拆分所取出的该膜贯穿部位后进行结构最佳化而得的所述二级结构的溶剂化熵的变化作为所述溶剂化熵变进行计算。
7.根据权利要求1或2所述的预测装置,其特征在于,
所述计算机构将在进行结构最佳化后取出所述膜贯穿部位而得的所述三级结构的溶剂化熵、与取出所述膜贯穿部位并拆分该膜贯穿部位后进行结构最佳化而得的所述二级结构的溶剂化熵的变化作为所述溶剂化熵变进行计算。
8.根据权利要求1或2所述的预测装置,其特征在于,
所述计算机构将在进行结构最佳化后取出所述膜贯穿部位而得的所述三级结构的溶剂化熵、与取出所述膜贯穿部位并伸展该膜贯穿部位后进行结构最佳化而得的所述一级结构的溶剂化熵的变化作为所述溶剂化熵变进行计算。
9.根据权利要求1或2所述的预测装置,其特征在于,
所述计算机构将在取出所述膜贯穿部位后进行结构最佳化而得的所述三级结构的溶剂化熵、与取出所述膜贯穿部位并拆分该膜贯穿部位并伸展后进行结构最佳化而得的所述一级结构的溶剂化熵的变化作为所述溶剂化熵变进行计算。
10.根据权利要求1或2所述的预测装置,其中所述控制部还具备:
候选选取机构,其基于所述膜蛋白质的所述溶剂化熵变与氨基酸突变体的所述溶剂化熵变的差值,选取使之发生热稳定化的氨基酸突变体的候选,如果所述差值为负值,则将氨基酸突变体选取为使之发生热稳定化的氨基酸突变体的候选。
11.根据权利要求10所述的预测装置,其中
所述候选选取机构基于所述膜蛋白质的所述溶剂化熵变与氨基酸突变体的所述溶剂化熵变的差值,选取使之发生热稳定化的氨基酸突变体的候选,如果所述差值为等于或小于给定值,则将氨基酸突变体选取为使之发生热稳定化的氨基酸突变体的候选。
12.根据权利要求11所述的预测装置,其中
所述计算机构还对于所述膜蛋白质及各氨基酸突变体,计算伴随着基于所述氨基酸序列的结构最佳化的所述膜贯穿部位的、从所述一级结构形成到所述三级结构形成的能量变化或从所述二级结构形成到所述三级结构形成的能量变化,和
所述候选选取机构基于作为在所述膜蛋白质的所述能量变化与氨基酸突变体的所述能量变化的差、以及所述膜蛋白质的所述溶剂化熵变与氨基酸突变体的所述溶剂化熵变的差上乘以绝对温度而得的值之和的变化量,选取使之发生热稳定化的氨基酸突变体的候选。
13.一种预测方法,其预测由氨基酸置换造成的膜蛋白质的溶剂化熵的变化,其在具备存储膜蛋白质的氨基酸序列的存储部和控制部的计算机中执行,
所述预测方法包括:
突变导入步骤,将氨基酸突变导入所述膜蛋白质的所述氨基酸序列,由此生成氨基酸突变体的氨基酸序列;和
计算步骤,其对于各氨基酸突变体,计算伴随着膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变;
其中通过下式计算溶剂化熵S:
S/kB=C1V+C2A+C3X+C4Y,
其中kB为玻尔兹曼常数,V为排除体积V,A为露出表面积,X为露出表面的平均曲率的积分值,和Y为露出表面的高斯曲率的积分值Y,
其中应用下式利用最小2乘法确定C1、C2、C3和C4:
S'/kB=C1(4πR3/3)+C2(4πR2)+C3(4πR)+C4(4π),
其中kB为玻尔兹曼常数,R=(dU+dS)/2,其中dS为溶剂分子直径,dU为球状刚体球溶质直径,和其中S'为使用积分方程式论计算的具有多个不同直径的孤立刚体球溶质的溶剂化熵。
14.根据权利要求13所述的预测方法,其中所述计算步骤包括对于所述膜蛋白计算从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变。
15.一种计算机可读取的记录介质,其特征在于,记录下述用于计算机执行的程序,
所述程序是用于使具备存储膜蛋白质的氨基酸序列的存储部和控制部的计算机执行用于预测由氨基酸置换造成的膜蛋白质的溶剂化熵的变化的程序,具有下述步骤:
突变导入步骤,将氨基酸突变导入所述膜蛋白质的所述氨基酸序列,由此生成氨基酸突变体的氨基酸序列;和
计算步骤,其对于各氨基酸突变体,计算伴随着膜贯穿部位的、从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变;
其中通过下式计算溶剂化熵S:
S/kB=C1V+C2A+C3X+C4Y,
其中kB为玻尔兹曼常数,V为排除体积V,A为露出表面积,X为露出表面的平均曲率的积分值,和Y为露出表面的高斯曲率的积分值Y,
其中应用下式利用最小2乘法确定C1、C2、C3和C4:
S'/kB=C1(4πR3/3)+C2(4πR2)+C3(4πR)+C4(4π),
其中kB为玻尔兹曼常数,R=(dU+dS)/2,其中dS为溶剂分子直径,dU为球状刚体球溶质直径,和其中S'为使用积分方程式论计算的具有多个不同直径的孤立刚体球溶质的溶剂化熵。
16.根据权利要求15的计算机可读取的记录介质,其中所述计算步骤包括对于所述膜蛋白计算从一级结构形成到三级结构形成的溶剂化熵变或从二级结构形成到三级结构形成的溶剂化熵变。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014-130560 | 2014-06-25 | ||
JP2014130560 | 2014-06-25 | ||
PCT/JP2015/068277 WO2015199162A1 (ja) | 2014-06-25 | 2015-06-24 | 膜タンパク質の熱安定化変異体予測装置、熱安定化変異体予測方法、および、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106415562A CN106415562A (zh) | 2017-02-15 |
CN106415562B true CN106415562B (zh) | 2019-12-10 |
Family
ID=54938240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580033500.8A Active CN106415562B (zh) | 2014-06-25 | 2015-06-24 | 膜蛋白质的热稳定化突变体预测装置、热稳定化突变体预测方法、以及程序 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20170212982A1 (zh) |
EP (1) | EP3163481B1 (zh) |
JP (2) | JP6359656B2 (zh) |
CN (1) | CN106415562B (zh) |
WO (1) | WO2015199162A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014115339A1 (ja) * | 2013-01-23 | 2014-07-31 | 分子設計フロンティア株式会社 | 溶液中の生体高分子の構造揺らぎとダイナミクスを記述する方程式 |
CN106709274A (zh) * | 2017-02-27 | 2017-05-24 | 新疆大学 | 一种通过熵变分析生物功能基因在其生长发育中协同调控物理机制的方法 |
JP2022512637A (ja) * | 2018-10-11 | 2022-02-07 | バークレー ライツ,インコーポレイテッド | 最適化タンパク質生成の同定のためのシステム及び方法並びにそのためのキット |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1602487A (zh) * | 2001-12-10 | 2005-03-30 | 富士通株式会社 | 蛋白质立体结构的预测装置及其预测方法 |
CN1691958A (zh) * | 2002-08-16 | 2005-11-02 | 舍林股份公司 | 用于基因治疗的eNOS突变体 |
CN103087145A (zh) * | 2013-02-20 | 2013-05-08 | 福州大学 | 一种基于理性设计的蛋白质分子热稳定性改造方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2315143A1 (en) * | 1999-11-03 | 2011-04-27 | AlgoNomics N.V. | Apparatus and method for structure-based prediction of amino acid sequences |
DK2342220T3 (da) * | 2008-10-06 | 2021-08-09 | Univ British Columbia | Metoder og systemer til forudsigelse af misfoldede proteinepitoper |
JP2010134514A (ja) * | 2008-12-02 | 2010-06-17 | Panasonic Corp | タンパク質立体構造予測法 |
EP2622524A4 (en) * | 2010-09-30 | 2014-12-24 | Zymeworks Inc | SIMPLIFICATION OF REST RELATIONS IN A PROTEIN DESIGN |
JP5704386B2 (ja) * | 2010-10-12 | 2015-04-22 | 日本電気株式会社 | タンパク質分子のアミノ酸置換部位選択装置、置換アミノ酸選択装置、アミノ酸置換部位選択方法、置換アミノ酸選択方法、プログラムおよび記録媒体 |
-
2015
- 2015-06-24 WO PCT/JP2015/068277 patent/WO2015199162A1/ja active Application Filing
- 2015-06-24 EP EP15812344.8A patent/EP3163481B1/en active Active
- 2015-06-24 US US15/321,414 patent/US20170212982A1/en not_active Abandoned
- 2015-06-24 JP JP2016529643A patent/JP6359656B2/ja active Active
- 2015-06-24 CN CN201580033500.8A patent/CN106415562B/zh active Active
-
2018
- 2018-05-18 JP JP2018096317A patent/JP6533324B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1602487A (zh) * | 2001-12-10 | 2005-03-30 | 富士通株式会社 | 蛋白质立体结构的预测装置及其预测方法 |
CN100501726C (zh) * | 2001-12-10 | 2009-06-17 | 富士通株式会社 | 蛋白质立体结构的预测装置及其预测方法 |
CN1691958A (zh) * | 2002-08-16 | 2005-11-02 | 舍林股份公司 | 用于基因治疗的eNOS突变体 |
CN103087145A (zh) * | 2013-02-20 | 2013-05-08 | 福州大学 | 一种基于理性设计的蛋白质分子热稳定性改造方法 |
Non-Patent Citations (1)
Title |
---|
Prediction of the mutation-induced change in thermodynamic stabilities ofmembrane proteins from free energy simulations;Hwangseo Park et al.;《BIOPHYSICAL CHEMISTRY》;20050422;第191-197页 * |
Also Published As
Publication number | Publication date |
---|---|
US20170212982A1 (en) | 2017-07-27 |
EP3163481B1 (en) | 2019-05-01 |
EP3163481A4 (en) | 2018-02-07 |
JP6359656B2 (ja) | 2018-07-18 |
CN106415562A (zh) | 2017-02-15 |
EP3163481A1 (en) | 2017-05-03 |
JPWO2015199162A1 (ja) | 2017-04-20 |
JP6533324B2 (ja) | 2019-06-19 |
JP2018160255A (ja) | 2018-10-11 |
WO2015199162A1 (ja) | 2015-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tama et al. | Building‐block approach for determining low‐frequency normal modes of macromolecules | |
Vanommeslaeghe et al. | CHARMM additive and polarizable force fields for biophysics and computer-aided drug design | |
Kurcinski et al. | Flexible docking of peptides to proteins using CABS‐dock | |
Saunders et al. | Coarse-graining methods for computational biology | |
Feig et al. | Implicit solvation based on generalized Born theory in different dielectric environments | |
Jambeck et al. | Update to the general amber force field for small solutes with an emphasis on free energies of hydration | |
Yu et al. | Semi-automated optimization of the CHARMM36 lipid force field to include explicit treatment of long-range dispersion | |
CN106415562B (zh) | 膜蛋白质的热稳定化突变体预测装置、热稳定化突变体预测方法、以及程序 | |
Lindert et al. | EM-fold: De novo folding of α-helical proteins guided by intermediate-resolution electron microscopy density maps | |
Panahi et al. | Dynamic heterogeneous dielectric generalized born (DHDGB): an implicit membrane model with a dynamically varying bilayer thickness | |
Norgaard et al. | Experimental parameterization of an energy function for the simulation of unfolded proteins | |
Coluzza et al. | Design and folding of colloidal patchy polymers | |
Thorpe et al. | Exploration of transferability in multiscale coarse-grained peptide models | |
Geist et al. | Replica-based protein structure sampling methods II: advanced hybrid solvent TIGER2hs | |
Ge et al. | A benchmark of electrostatic method performance in relative binding free energy calculations | |
Parks et al. | A pseudobond parametrization for improved electrostatics in quantum mechanical/molecular mechanical simulations of enzymes | |
Ayres et al. | Modeling sequence-dependent peptide fluctuations in immunologic recognition | |
Bravi | Development and use of machine learning algorithms in vaccine target selection | |
Biggin et al. | Molecular dynamics simulations of membrane proteins | |
Jansen et al. | phbuilder: a tool for efficiently setting up constant pH molecular dynamics simulations in GROMACS | |
Mukherjee et al. | Genome-wide protein structure prediction | |
Aggarwal et al. | Nonuniform elastic properties of macromolecules and effect of prestrain on their continuum nature | |
Glass et al. | Coarse-grained molecular dynamics simulations of membrane proteins: a practical guide | |
Oakes et al. | Combining Structural Data with Computational Methodologies to Investigate Structure–Function Relationships in TRP Channels | |
Tang et al. | Systematic dissociation pathway searches guided by principal component modes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |