KR20190030365A - Protein-ligand docking prediction method using quantum mechanics calculation and solvation effect - Google Patents

Protein-ligand docking prediction method using quantum mechanics calculation and solvation effect Download PDF

Info

Publication number
KR20190030365A
KR20190030365A KR1020170117720A KR20170117720A KR20190030365A KR 20190030365 A KR20190030365 A KR 20190030365A KR 1020170117720 A KR1020170117720 A KR 1020170117720A KR 20170117720 A KR20170117720 A KR 20170117720A KR 20190030365 A KR20190030365 A KR 20190030365A
Authority
KR
South Korea
Prior art keywords
docking
ligand
protein
quantum mechanical
pose
Prior art date
Application number
KR1020170117720A
Other languages
Korean (ko)
Other versions
KR102174746B1 (en
Inventor
조은성
김민섭
Original Assignee
고려대학교 세종산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 세종산학협력단 filed Critical 고려대학교 세종산학협력단
Priority to KR1020170117720A priority Critical patent/KR102174746B1/en
Publication of KR20190030365A publication Critical patent/KR20190030365A/en
Application granted granted Critical
Publication of KR102174746B1 publication Critical patent/KR102174746B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/72Assays involving receptors, cell surface antigens or cell surface determinants for hormones
    • G01N2333/726G protein coupled receptor, e.g. TSHR-thyrotropin-receptor, LH/hCG receptor, FSH

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Evolutionary Biology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Data Mining & Analysis (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Abstract

The present invention relates to a method for predicting a protein-ligand docking structure using quantum mechanical calculation and the solvation effect. More particularly, the present invention relates to a docking protocol based on quantum mechanics/molecular dynamics calculations using atomic charges existing in a quantum mechanical domain derived from quantum mechanics calculations under an implicit solvent model environment. According to the present invention, more precise modeling is possible compared to exiting docking methods, by using the atomic charge in the quantum mechanical region derived from consideration of the solvation effect in the quantum mechanical calculation.

Description

양자역학 계산과 용매화 효과를 이용한 단백질-리간드 도킹 구조의 예측방법{Protein-ligand docking prediction method using quantum mechanics calculation and solvation effect}[0001] The present invention relates to a method for predicting a protein-ligand docking structure using a quantum mechanical calculation and a solvation effect,

본 발명은 양자역학 계산과 용매화 효과를 이용한 단백질-리간드 도킹 구조의 예측방법에 관한 것으로서, 보다 상세하게는 묵시적 용매(implicit solvent) 모델 환경하에서 양자역학 계산을 통해 도출된 양자역학 영역에 존재하는 원자 전하를 이용하는 양자역학/분자역학 계산에 기초한 도킹 프로토콜에 관한 것이다.The present invention relates to a method for predicting a protein-ligand docking structure using quantum mechanical calculation and solvation effect, and more particularly, to a method for predicting a protein-ligand docking structure in a quantum mechanical region derived from quantum mechanics calculation under an implicit solvent model environment To docking protocols based on quantum mechanics / molecular dynamics calculations using atomic charges.

단백질 도킹 알고리즘(protein docking algorithms)은 단백질과 작은 분자 사이의 상호작용을 시뮬레이션하기 위해 설계되므로 이를 통해 단백질-리간드 복합체의 결합 구조를 예측할 수 있다. 일반적으로, 도킹 프로그램은 효소의 활성 사이트에 결합되는 저해제(inhibitor)의 결합 모드를 결정하는데 사용된다. 단백질 구조가 주어지면, 도킹(docking)은 화합물을 스크리닝 하기 위한 강력한 툴이 될 수 있으므로, 상기 도킹은 컴퓨터를 이용한 약물 디자인 분야에서 필수적 요소가 되고 있다.Protein docking algorithms are designed to simulate the interaction between proteins and small molecules, so that the binding structure of protein-ligand complexes can be predicted. Generally, a docking program is used to determine the binding mode of an inhibitor that binds to the active site of the enzyme. Given the protein structure, docking can be a powerful tool for screening compounds, making the docking an essential element in the field of drug design using computers.

단백질과 리간드의 결합 현상의 시뮬레이션은 2 가지 주된 요소를 필요로 한다. 단백질-리간드 복합체의 배좌공간(conformational space)을 스캔하는 배좌 검색(conformational search)은 지난 수년간 도킹 프로그램에서 시행되어온 수많은 알고리듬들을 포함한다. 이러한 예들은, 빠른 구조 매칭(fast shape matching), 유전 알고리즘(genetic algorithms), 모사 담금(simulated annealing), Monte Carlo 시뮬레이션(Monte Carlo simulation) 등을 포함한다. 도킹의 다른 한 요소는 찾아낸 단백질-리간드의 결합형태들에 가능성의 순서로 점수를 매기는 스코어링(scoring)이다. 상기 스코어링을 위하여 단백질과 리간드 사이의 원자적 상호작용에 대한 구체적인 묘사가 필요하다. 상기 스코어링은 생성된 포즈(pose)에 대하여 순위를 매기기 위하여 통상적으로 보조 스코어링 요소들을 이용한 역장(force field)에 기초한 분자역학적 계산을 이용한다. 스코어링은 하기 세가지 카테고리로 분류할 수 있다: 실험적(empirical), 지식-기반(knowledge-based), 및 물리학-기반(physicsbased). 이들 중, 물리학-기반 스코어링은 주요소로서 에너지 함수들을 사용한다. 이러한 에너지 함수는 우선적으로 역장에 기초하므로 양자 효과를 고려할 수가 없다. 도킹에 있어서 양자 효과에 대한 고려가 중요한 경우들이 있는데, 그 중 하나는 전자 전달이 발생하는 경우이다. 이러한 현상이 관찰될 수 있는 예로서 생물학적프로세스 중에 많은 예들이 있는데, 금속단백질(metalloprotein)의 경우, 전하 이동이 리간드와 금속 원자 사이뿐만 아니라 단백질과 금속 원자 사이에서도 일어날 수 있다. 따라서, 이들 단백질들에 대한 도킹에 있어서 양자역학적(quantum mechanical, QM) 계산을 포함시키는 것이 필수적인 것으로 보인다.Simulation of protein and ligand binding requires two main factors. Conformational searches that scan the conformational space of protein-ligand complexes include numerous algorithms that have been performed in the docking program over the last few years. These examples include fast shape matching, genetic algorithms, simulated annealing, Monte Carlo simulation, and the like. Another element of the docking is the scoring of the binding forms of the protein-ligands found in order of probability. A specific description of the atomic interaction between protein and ligand is needed for this scoring. The scoring typically utilizes molecular field calculations based on a force field using secondary scoring elements to rank the generated pose. Scoring can be broken down into three categories: empirical, knowledge-based, and physics-based. Of these, physics-based scoring uses energy functions as a major factor. This energy function is based on the force field preferentially, so quantum effects can not be considered. Consideration of the quantum effect in docking is important, one of which is when electron transfer occurs. As an example where this phenomenon may be observed, there are many examples in biological processes, in the case of metalloproteins, charge transfer can occur between ligands and metal atoms as well as between proteins and metal atoms. Therefore, it seems essential to include quantum mechanical (QM) calculations in docking for these proteins.

한편, G 단백질-결합 수용체 (G protein-coupled receptors, GPCR)는 약물 발견 분야에서 유망한 표적이다. 그들은 크고 다양한 단백질 군을 형성하며 포유동물에서 거의 800여 종이 존재한다(T. K. Bjarnadottir, D. E. Gloriam, S. H. Hellstrand, H. Kristiansson, R. Fredriksson and H. B. Schioth, Genomics, 2006, 88, 263-273.). 인체에서 GPCR은 모든 기관계에서 기능하며 많은 생리적 과정에서 세포 표면 신호 전달 단백질의 역할을 한다. 이러한 이유로 GPCR은 암, 중추 신경계 장애, 심장 기능 장애, 당뇨병, 비만, 염증 및 통증과 같은 수많은 인간 질병과 관련이 있다(D. Filmore, Mod. Drug Discovery, 2004, 7, 24-28.). GPCR의 유비쿼터스 및 질병 관련 특징은 신약 개발에 상당한 기회를 제공한다(M. C. Lagerstrom and H. B. Schioth, Nat. Rev. Drug Discovery, 2008, 7, 542.). 현재 GPCR 표적 약품은 실제로 FDA 승인 의약품의 26 %와 처방된 모든 의약품의 40 %의 시장 점유율을 포함하는 등 시장에서 가장 잘 팔리는 약물 중 하나이다. GPCR에 작용하는 약물의 대표적인 예로는 Clarinex (Schering-Plough), Zyprexa (Eli Lilly), Neurontin (Pfizer), Cozaar (Merck & Co), Zantac (GlaxoSmithKline) 및 Zelnorm (Novartis)이 있다(J. P. Overington, B. Al-Lazikani and A. L. Hopkins, Nat. Rev. Drug Discovery, 2006, 5, 993-996.).On the other hand, G protein-coupled receptors (GPCRs) are promising targets in drug discovery. They form large and diverse protein groups and there are nearly 800 species in mammals (T. K. Bjarnadottir, D. E. Gloriam, S. H. Hellstrand, H. Kristiansson, R. Fredriksson and H. B. Schioth, Genomics, 2006, 88, 263-273.). In humans, GPCRs function in all organ systems and serve as cell surface signaling proteins in many physiological processes. For this reason GPCRs are associated with numerous human diseases such as cancer, central nervous system disorders, cardiac dysfunction, diabetes, obesity, inflammation and pain (D. Filmore, Mod. Drug Discovery, 2004, 7, 24-28.). The ubiquitous and disease-related characteristics of GPCRs provide significant opportunities for the development of new drugs (M. C. Lagerstrom and H. B. Schioth, Nat. Rev. Drug Discovery, 2008, 7, 542.). Currently, the GPCR target drug is one of the best-selling drugs on the market, including 26% of FDA-approved drugs and 40% of all prescription drugs. Representative examples of drugs that act on GPCRs include Clarinex (Schering-Plow), Zyprexa (Eli Lilly), Neurontin (Pfizer), Cozaar (Merck & Co), Zantac (GlaxoSmithKline) and Zelnorm Al-Lazikani and AL Hopkins, Nat. Rev. Drug Discovery, 2006, 5, 993-996).

이처럼, GPCRs가 약물 개발 분야에서 많은 가능성을 제시하지만, 소수의 GPCR 멤버만이 현재 약물의 표적으로 이용되고 있다(R. Lappano and M. Maggiolini, Nat. Rev. Drug Discovery, 2011, 10, 47-60.). 불과 몇 년 전까지 CR을 목표로 한 구조 기반 약물 설계 (SBDD)의 가장 큰 장애물은 GPCR의 고해상도 원자 구조의 부족이었다. 그러나 이러한 문제는 Lefkowitz와 Kobilka의 노벨 수상에 의해 완화되었으며, 이는 새로운 해결된 GPCR 구조의 발전을 촉발시켰다. 한편, 최근의 GPCR 모델링 경쟁에서 분명했던 GPCR 구조 예측 분야에서도 상당한 발전이 있었다(I. Kufareva, V. Katritch, R. C. Stevens and R. Abagyan, Structure, 2014, 22, 1120-1139.).As such, although GPCRs present many possibilities in the field of drug development, only a few GPCR members are currently used as targets for drugs (R. Lappano and M. Maggiolini, Nat. Rev. Drug Discovery, 2011, 10, 47- 60.). Only a few years ago, the biggest obstacle to the CR-based structure-based drug design (SBDD) was the lack of high-resolution atomic structures in GPCRs. This problem, however, was alleviated by Lefkowitz and Kobilka's Nobel Prize, which triggered the development of a new resolved GPCR structure. On the other hand, there has been considerable progress in predicting the GPCR structure predicted in the recent GPCR modeling competition (I. Kufareva, V. Katritch, R. C. Stevens and R. Abagyan, Structure, 2014, 22, 1120-1139).

해결된 GPCR 구조가 점점 커지면서, GPCR을 표적으로 한 구조 기반 약물 설계가 실행 가능해졌다(M. Congreve, C. J. Langmead, J. S. Mason and F. H. Marshall, J. Med. Chem., 2011, 54, 4283-4311.). SBDD에서는 계산 방법을 사용하여 표적 단백질의 구조 정보를 활용한다(A. C. Anderson, Chem. Biol., 2003, 10, 787-797.). 도킹은 SBDD에서 사용되는 주요 계산 방법 중 하나이다. 그것은 연구자들이 결합 모드와 친화성을 예측함으로써 사실상 화합물의 라이브러리를 스크리닝 할 수 있게 하고, 이로써 리드 화합물을 얻기 위한 합성 시간 및 비용을 절감할 수 있게 한다다(T. Lengauer and M. Rarey, Curr. Opin. Struct. Biol., 1996, 6, 402-406.).As the solved GPCR structure grows larger, structure-based drug design targeting GPCRs becomes feasible (M. Congreve, CJ Langmead, JS Mason and FH Marshall, J. Med. Chem., 2011, 54, 4283-4311. ). SBDD utilizes the structural information of target proteins using computational methods (A. C. Anderson, Chem. Biol., 2003, 10, 787-797). Docking is one of the main computational methods used in SBDD. It allows researchers to virtually screen libraries of compounds by predicting binding modes and affinities, thereby reducing the synthesis time and cost for obtaining lead compounds (T. Lengauer and M. Rarey, Curr. Opin. Struct. Biol., 1996, 6, 402-406.).

그러나 종래의 도킹 프로그램은 GPCR에 적용할 때 몇 가지 문제를 나타낼 수 있다. 일반적으로 사용되는 도킹 프로그램인 글라이드 (Glide)를 사용하는 최근 GPCR 도킹 평가 보고서에 따르면(T. Beuming and W. Sherman, J. Chem. Inf. Model., 2012, 52, 3263-3277.), 성공률이 70 %를 넘지만 여러 GPCR에서 문제를 일으킬 수 있다. 유연한 용매 노출 그룹을 가진 아데노신 A2A, ZM241385 및 XAC의 경우 글라이드는 올바른 바인딩 포즈를 찾을 수 없었다. A2A의 도킹 오류는 유도된 도킹 또는 결합 사이트 물 분자 포함 전략을 사용하여 해결되었지만(V. Katritch, V. P. Jaakola, J. R. Lane, J. Lin, A. P. IJzerman, M. Yeager, I. Kufareva, R. C. Stevens and R. Abagyan, J. Med. Chem., 2010, 53, 1799-1809.), 이러한 솔루션은 보편적으로 적용할 수 없다는 문제가 있다.However, a conventional docking program may exhibit some problems when applied to a GPCR. According to a recent GPCR docking evaluation report using a commonly used docking program Glide (T. Beuming and W. Sherman, J. Chem. Inf. Model., 2012, 52, 3263-3277) Exceeding 70% can cause problems with multiple GPCRs. For adenosine A2A, ZM241385 and XAC with a flexible solvent exposure group, Glide could not find a correct binding pose. A2A docking errors were solved using an induced docking or binding site water molecule inclusion strategy (V. Katritch, VP Jaakola, JR Lane, J. Lin, AP IJzerman, M. Yeager, I. Kufareva, RC Stevens and R Abagyan, J. Med. Chem., 2010, 53, 1799-1809.), There is a problem that these solutions are not universally applicable.

GPCR의 알로스테릭 조절인자는 orthosteric 약물에 비해 선택성과 독성 가능성이 낮아 최근 몇 년간 주목을 받아왔다(L. T. May, K. Leach, P. M. Sexton and A. Christopoulos, Annu. Rev. Pharmacol. Toxicol., 2007, 47, 1-51.). 그러나 알로스테릭 결합 부위는 orthosteric 결합 부위보다 용매에 더 노출되어있는 경향이 있기 때문에 현재의 도킹 방법이 잘 작동하는지는 분명하지 않다(A. C. Kruse, A. M. Ring, A. Manglik, J. X. Hu, K. Hu, K. Eitel, H.Hubner, E. Pardon,C.Valant, P.M. Sexton,A.Christopoulos, C. C. Felder, P. Gmeiner, J. Steyaert, W. I. Weis, K. C. Garcia, J. Wess and B. K. Kobilka, Nature, 2013, 504, 101-106.).Allosteric modulators of GPCRs have been noted in recent years for their low selectivity and toxicity potential compared to orthosteric drugs (LT May, K. Leach, PM Sexton and A. Christopoulos, Annu. Rev. Pharmacol. , 47, 1-51.). However, it is not clear whether the current docking method works well because the allosteric binding site tends to be more exposed to the solvent than the orthosteric binding site (AC Kruse, AM Ring, A. Manglik, JX Hu, K. Hu K. Eitel, H. Hubner, E. Pardon, C. Valant, PM Sexton, A. Christopoulos, CC Felder, P. Gmeiner, J. Steyaert, WI Weis, K. Garcia, J. Wess and BK Kobilka, 2013, 504, 101-106.).

본 발명은 용매에 노출된 리간드 영역으로 인해 종래 도킹 방법의 정확성이 떨어질 수 있다는 문제점을 해결하기 위해 안출된 것으로, 본 발명에서는 양자역학 계산 시 용매화 효과를 함께 고려함으로써 보다 정확한 모델링이 가능한 단백질-리간드 도킹 구조의 예측 방법을 제공하고자 한다.The present invention has been made in order to solve the problem that the accuracy of the conventional docking method may be lowered due to the ligand region exposed to the solvent. In the present invention, since the solvation effect is taken into account in the quantum mechanical calculation, To provide a method of predicting the ligand docking structure.

본 발명은 상기 과제를 해결하기 위하여, 묵시적 용매(implicit solvent) 모델 환경하에서 미리 정의된 양자역학 영역(QM region)에 대한 양자역학 계산을 통해 상기 양자역학 영역에 존재하는 단백질 잔기와 리간드의 원자 전하를 계산하는 단계; 및 상기 계산된 원자 전하를 이용하여 도킹을 수행하는 단계;를 포함하는 단백질-리간드 도킹구조의 예측방법을 제공한다.In order to solve the above-described problems, the present invention proposes a method of quantitatively calculating a quantum mechanical property of a quantum mechanical region (QM region) in an implicit solvent model environment, ; And performing docking using the calculated atomic charge. The present invention also provides a method for predicting a protein-ligand docking structure comprising:

또한, 본 발명은 (a) 선택된 단백질-리간드 세트에 대하여 역장(force-field)-기초 도킹을 수행하여 다수의 포즈(pose)를 생성하는 단계; 및 (b) 상기 생성된 다수의 포즈에 대하여 묵시적 용매화(implicit) 모델 환경하에서 미리 정의된 양자역학 영역에 대한 양자역학 계산을 통해 가장 안정한 포즈를 선택하는 단계;를 포함하는 단백질-리간드 도킹구조의 예측방법을 제공한다.The present invention also provides a method for detecting a protein-ligand set comprising: (a) performing a force-field-based docking on a selected set of protein-ligands to generate a plurality of pauses; And (b) selecting the most stable pose through quantum computation for a predefined quantum mechanical region in an implicit model environment for the generated plurality of poses. .

본 발명에 따르면, 양자역학 계산 시 용매화 효과를 고려하여 도출된 양자역학 영역의 원자 전하를 이용함으로써 기존 도킹 방법에 의한 경우보다 정확한 모델링이 가능하다. According to the present invention, more precise modeling is possible by using the atomic charge in the quantum mechanical region derived from consideration of the solvation effect in the quantum mechanical calculation.

도 1은 GPCR 결정에서 용매에 노출된 리간드를 나타낸 도면이다. 해당 PDB 코드 및 리간드 이름은 각 리간드 아래에 표시되었으며, 리간드의 용매 노출 부분은 파란색 점선 원으로 표시되었다.
도 2는 ZM241385 및 카페인과 각각 복합체를 이루는 2개의 A2A 아데노신 수용체 공결정을 비교한 도면이다. (A)는 ZM241385-A2AR 복합체를 나타내며, 용매에 노출된 페놀 그룹 (황색 점선 원)은 결합 부위의 세포 외 입구에 위치한다. (B)는 카페인-A2AR 복합체를 나타내며, 카페인은 전체 리간드가 결합 부위의 깊숙이 자리 잡고 있음에도 불구하고 부분적으로 용매에 노출되어 있다.
도 3은 GPCR 표적에 대한 본 발명에 따른 용매화 QM/MM(Solvation QM / MM) 도킹 방법의 개념을 나타낸 도면이다. 본 발명에서 결합 부위의 리간드 원자 및 주변 잔기는 QM 영역으로, 나머지는 MM 영역으로, 세포 외 영역은 묵시적 용매(implicit solvent) 모델로 처리된다.
도 4는 종래 글라이드(Glide) 도킹 방법, QM/MM 도킹 방법 및 본 발명에 따른 Solvation QM/MM 도킹 방법을 이용한 ZM241385의 결합 모드 예측 및 리간드의 원자 전하(녹색- 결정 포즈, 보라색-예측 포즈)를 나타낸다. 이때, 노란색 삼각형은 페놀 그룹의 위치를 나타낸다. (A)는 글라이드 도킹 결과 및 전계 필드 전하를, (B)는 QM/MM 도킹 결과 및 QM/MM 방법으로 계산 된 ESP 전하를, (C)는 Solvation QM/MM 도킹 결과 및 ESP 전하를 나타낸다.
도 5는 종래 글라이드(Glide) 도킹 방법, 용매화 스코어링 방법(Solvation scoring), QM/MM 도킹 방법 및 본 발명에 따른 Solvation QM/MM 도킹 방법을 이용한 LY2119620 결합 모드 예측 결과(녹색- 결정 포즈, 보라색-예측 포즈)를 나타낸다. (A)는 글라이드 도킹 결과를, (B)는 용매화 스코어링 결과를, (C)는 QM/MM 도킹 결과를, (D)는 Solvation QM/MM 도킹 결과를 나타낸다.
도 6은 4MBS 및 4MQS의 도킹된 포즈를 나타낸다(녹색- 결정 포즈, 보라색-예측 포즈).
Figure 1 shows a ligand exposed to a solvent in a GPCR crystal. The corresponding PDB code and ligand name are shown below each ligand and the solvent exposed portion of the ligand is indicated by a blue dotted circle.
Figure 2 compares two A2A adenosine receptor co-crystals complexed with ZM241385 and caffeine, respectively. (A) represents the ZM241385-A2AR complex, and the phenol group (yellow dotted circle) exposed to the solvent is located at the extracellular entrance of the binding site. (B) represents a caffeine-A2AR complex, and caffeine is partially exposed to solvents, although the entire ligand is deeply embedded in the binding site.
3 is a diagram illustrating a concept of a solvated QM / MM docking method according to the present invention for a GPCR target. In the present invention, ligand atoms and surrounding residues at the binding site are treated in the QM region, the remainder in the MM region, and the extracellular domain in the implicit solvent model.
FIG. 4 is a graph showing the coupling mode prediction of ZM241385 and the atomic charge (green-crystal pose, purple-predicting pose) of the ligand using the conventional Glide docking method, QM / MM docking method and Solvation QM / . Here, the yellow triangle represents the position of the phenol group. (A) shows the result of the glide docking and the electric field field charge, (B) shows the ESP charge calculated by the QM / MM docking result and QM / MM method, and (C) shows the Solvation QM / MM docking result and ESP charge.
FIG. 5 is a graph showing the result of the LY2119620 binding mode prediction (green-crystal pose, purple color) using the conventional Glide docking method, Solvation scoring method, QM / MM docking method and Solvation QM / - prediction pose). (A) shows the results of the glide docking, (B) shows the solvation scoring result, (C) shows the QM / MM docking result, and (D) shows the Solvation QM / MM docking result.
Figure 6 shows the docked poses of 4MBS and 4MQS (green-crystal pose, purple-prediction pose).

이하, 본 발명을 보다 상세하게 설명한다.Hereinafter, the present invention will be described in more detail.

본원에서 사용되는 대부분의 용어는 당업자가 인지할 수 있을 것이지만, 그럼에도 불구하고 다음의 정의는 본 발명의 이해를 돕기 위해 제시된다. 그러나 명시적으로 정의되지 않은 경우, 용어는 당업자에 의해 당시에 받아들여지는 의미를 택함으로써 해석되어야 한다.Although most terms used herein will be appreciated by those skilled in the art, the following definitions are nevertheless set forth to aid in the understanding of the present invention. However, where not explicitly defined, the term should be interpreted by the person skilled in the art by taking the meanings at the time.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification, when an element is referred to as " comprising ", it means that it can include other elements as well, without excluding other elements unless specifically stated otherwise.

본 명세서에서 사용되는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본 발명의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다.The terms " about ", " substantially ", etc. used to the extent that they are used herein are intended to be taken to mean an approximation of, or approximation to, the numerical values of manufacturing and material tolerances inherent in the meanings mentioned, Accurate or absolute numbers are used to help prevent unauthorized exploitation by unauthorized intruders of the referenced disclosure.

"도킹(docking)" 이란 일반적으로 리셉터(예컨대, 단백질)와 후보 리간드 결합의 계산적(computational) 시뮬레이션을 의미한다. 분자 모델링 분야에 있어서, 도킹은 두 개의 분자가 서로 결합하여 안정된 복합체를 형성하는 경우, 제 1 분자의 제 2 분자에 대한 바람직한 배향(orientation)을 예측하는 방법으로 이용된다.&Quot; Docking " generally refers to a computational simulation of a receptor (e. G., Protein) and candidate ligand binding. In the field of molecular modeling, docking is used as a method of predicting the preferred orientation of a first molecule to a second molecule when two molecules bind to each other to form a stable complex.

"포즈(pose)" 는 도킹에 의하여 생성되는 후보 결합 모드를 의미한다.&Quot; Pose " means a candidate combining mode generated by docking.

"스코어링(scoring)" 이란, 계산 화학 및 분자 모델링 분야에 있어서, 도킹된 후 두 개의 분자 사이에 생성되는 특정 포즈의 순위를 평가하는 프로세스를 의미한다.&Quot; Scoring " refers to the process of evaluating the ranking of a particular pose generated between two molecules after being docked, in the field of computational chemistry and molecular modeling.

본 발명은 묵시적 용매(implicit solvent) 모델 환경하에서 미리 정의된 양자역학 영역(QM region)에 대한 양자역학 계산을 통해 상기 양자역학 영역에 존재하는 단백질 잔기와 리간드의 원자 전하를 계산하는 단계; 및 상기 계산된 원자 전하를 이용하여 도킹을 수행하는 단계;를 포함하는 단백질-리간드 도킹구조의 예측방법을 제공한다.The present invention relates to a method for quantitatively analyzing quantum dynamics, comprising: calculating the atomic charge of a protein residue and a ligand present in the quantum mechanical region through quantum mechanical calculation for a predefined quantum mechanical region (QM region) under an implicit solvent model environment; And performing docking using the calculated atomic charge. The present invention also provides a method for predicting a protein-ligand docking structure comprising:

이때, 상기 양자역학 영역은 단백질과 리간드의 결합 부위(binding site)의 단백질 잔기와 리간드를 포함하는 것으로 정의될 수 있으며, 더욱 바람직하게는 상기 리간드 및 결합 부위에서 5 Å이내의 범위의 단백질 잔기를 포함하는 것으로 정의될 수 있다.At this time, the quantum mechanical region may be defined to include a protein residue and a ligand at a binding site of a protein and a ligand, more preferably a protein residue within a range of 5 Å at the ligand and binding site And the like.

또한, 본 발명에 사용된 묵시적 용매(implicit solvent) 모델은 잠재적으로 용매가 존재하는 환경을 제공할 수 있는 모델이라면 반드시 이에 제한되는 것은 아니지만, 바람직하게는 Poisson Boltzmann(PB) 용매 모델일 수 있다.Also, the implicit solvent model used in the present invention may preferably be a Poisson Boltzmann (PB) solvent model, although not necessarily limited to a model capable of providing an environment in which a solvent is potentially present.

또한, 본 발명의 도킹구조 예측 대상이 되는 상기 단백질은 용매에 노출된 리간드 영역을 가질 수 있는 단백질이라면 모두 가능하며, 예를 들어 상기 단백질은 G 단백질-결합 수용체(G protein-coupled receptor, GPCR)일 수 있다.For example, the protein may be a G protein-coupled receptor (GPCR), a G protein-coupled receptor (GPCR), or the like. Lt; / RTI >

또한, 본 발명은 (a) 선택된 단백질-리간드 세트에 대하여 역장(force-field)-기초 도킹을 수행하여 다수의 포즈(pose)를 생성하는 단계; 및 (b) 상기 생성된 다수의 포즈에 대하여 묵시적 용매화(implicit) 모델 환경하에서 미리 정의된 양자역학 영역에 대한 양자역학 계산을 통해 가장 안정한 포즈를 선택하는 단계;를 포함하는 단백질-리간드 도킹구조의 예측방법을 제공한다.The present invention also provides a method for detecting a protein-ligand set comprising: (a) performing a force-field-based docking on a selected set of protein-ligands to generate a plurality of pauses; And (b) selecting the most stable pose through quantum computation for a predefined quantum mechanical region in an implicit model environment for the generated plurality of poses. .

이때, 상기 (a) 단계에서, 포즈의 다양성을 보증하기 위하여 일정 범위 내에 유사한 포즈가 없도록 클러스터링 파라미터를 설정하는 것을 포함하는 것일 수 있으나, 이에 제한되는 것은 아니다. 예컨대, 초기 생성 포즈에서 서로의 배위에서 1.5 Å RMSD 이내에 유사한 포즈가 없도록 클러스터링 파라미터를 세팅할 수 있다.In this case, in the step (a), the clustering parameter may be set such that there is no similar pose within a certain range in order to guarantee diversity of poses, but the present invention is not limited thereto. For example, the clustering parameters may be set such that there is no similar pose within 1.5 A RMSD in each other's co-ordinates in the initial creation pose.

상기 (b) 단계의 양자역학 계산은 묵시적 용매화(implicit) 모델 환경하에서양자역학 영역에 존재하는 단백질 잔기와 리간드의 원자 전하를 계산하는 것일 수 있다. 또한, 상기 (b) 단계는 반데르발스 에너지 및 상기 계산된 원자 전하로부터 도출된 단백질과 리간드 사이의 정전기 인력을 기반으로 가장 안정한 포즈를 선택할 수 있다.The quantum mechanical calculation of step (b) may be to calculate the atomic charge of a protein residue and a ligand present in a quantum mechanical region under an implicit modeling environment. Also, the step (b) may select the most stable pose based on the van der Waals energy and the electrostatic attraction between the ligand and the protein derived from the calculated atomic charge.

또한, 상기 (b) 단계에서, 속박된(constrained) 단백질 원자에 대한 기하학적 구조(geometry) 최적화를 짧게 반복 수행하는 것일 수 있으나, 이에 제한되지 않는다. 예컨대, 상기 기하학적 구조 최적화는 5회 이하로 반복 수행함으로써 최적화를 수행하면서도 계산 비용을 크게 증가시키지 않을 수 있다.In addition, in the step (b), the geometry optimization for constrained protein atoms may be performed briefly and repeatedly, but the present invention is not limited thereto. For example, the geometric optimization may be repeatedly performed no more than 5 times to perform the optimization while not significantly increasing the calculation cost.

또한, 상기 양자역학 영역은 단백질과 리간드의 결합 부위(binding site)의 단백질 잔기와 리간드를 포함하는 것으로 정의될 수 있으며, 더욱 바람직하게는 상기 리간드 및 결합 부위에서 5 Å이내의 범위의 단백질 잔기를 포함하는 것으로 정의될 수 있다.In addition, the quantum mechanical region may be defined to include a protein residue and a ligand at a binding site of a protein and a ligand, more preferably a protein residue within a range of 5 Å at the ligand and binding site And the like.

이하에서는 바람직한 실시예 등을 들어 본 발명을 더욱 상세하게 설명한다. 그러나 이들 실시예 등은 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 범위가 이에 의하여 제한되지 않는다는 것은 당업계의 통상의 지식을 가진 자에게 자명할 것이다.Hereinafter, the present invention will be described in more detail with reference to preferred embodiments and the like. It will be apparent to those skilled in the art, however, that these examples are provided for further illustrating the present invention and that the scope of the present invention is not limited thereto.

GPCRGPCR 도킹 평가 세트 Docking evaluation set

본원의 상기 방법을 입증하기 위해, 2013 년까지 밝혀진 GPCR-리간드 복합체의 모든 원자 구조를 포함하는 GPCR 도킹 평가 세트를 사용하였다(표 1). RCSB Protein Data Bank 웹 사이트 (http://www.rcsb.org)에서 수집한 구조는 다음과 같다: 베타2 아드레날린 수용체(Beta2 adrenergic receptor), 베타1 아드레날린 수용체(Beta1 Adrenergic receptor), 알파2 아데노신 수용체(Alpha2 Adenosine receptor), 도파민 수용체 3(Dopamine Receptor 3), 히스타민 수용체 1(Histamine receptor 1), M3 무스카린성 아세틸콜린 수용체(M3 muscarinic acetylcholine receptor), 오피오이드 수용체(opioid receptor), 노시셉틴/오파 닌 FQ 수용체(Nociceptin/orphanin FQ receptor), 프로테아제 활성 수용체 1(protease-activated receptor 1), M2 무스카린성 아세틸콜린 수용체(M2 muscarinic acetylcholine receptor), 스핑고신 1-포스페이트 수용체(Sphingosine 1-phosphate receptor), 코르티코 트로핀 방출 인자 수용체 1(corticotropin-releasing factor receptor 1), SMO 수용체(smoothened receptor), 5-하이드록시트립타민 수용체(5-hydroxytryptamine receptor) 및 CCR5 케모카인 수용체(CCR5 Chemokine receptor).To demonstrate this method of the present invention, a set of GPCR docking evaluations including all the atomic structures of the GPCR-ligand complex revealed until 2013 was used (Table 1). The structures collected at the RCSB Protein Data Bank website (http://www.rcsb.org) are as follows: Beta 2 adrenergic receptor, Beta 1 adrenergic receptor, Alpha 2 adenosine receptor (M3 muscarinic acetylcholine receptor), opioid receptor, nociceptin / opanin, alpha 3 adrenoceptor, alpha 2 adenosine receptor, Dopamine Receptor 3, Histamine receptor 1, M3 muscarinic acetylcholine receptor, The FQ receptor (Nociceptin / orphanin FQ receptor), the protease-activated receptor 1, the M2 muscarinic acetylcholine receptor, the Sphingosine 1-phosphate receptor, Corticotropin-releasing factor receptor 1, SMO receptor (smoothened receptor), 5-hydroxytryptamine receptor r) and the CCR5 chemokine receptor.

Figure pat00001
Figure pat00001

결합 부위에서 리간드 또는 유효하지 않은 구조와 공유 결합을 갖는 Rhodopsin 수용체 및 몇몇 GPCR은 평가 세트에서 제외하였다. 글라이드의 구조 검색 알고리즘인 ConfGen은(K. S. Watts, P. Dalal, R. B. Murphy, W. Sherman, R. A. Friesner and J. C. Shelley, J. Chem. Inf. Model., 2010, 50, 534-546.), UK-432097 및 IT1t에 대한 생물 활성 배열을 생성 할 수 없다고 보고하였으며, 따라서 그들의 착물 3QAK 및 3ODU는 도킹 평가 세트에서 제외하였다. PDB에서 동일한 공결정의 여러 항목의 경우, 중첩되는 복잡한 구조의 각 그룹에서 하나만을 선택하였다. 수집된 모든 구조물은 도킹을 위해 Schrodinger Suite의 Protein Preparation Wizard 모듈로 처리하였다(Protein Preparation Wizard, Schro¨dinger, LLC, New York, NY, 2014.). 이 모듈은 정확한 bond order를 할당하고 정확한 pKa 값에 대한 Epik 계산을 기반으로 한 수소를 첨가한다(M. H. M. Olsson, C. R. Sondergaard, M. Rostkowski and J. H. Jensen, J. Chem. Theory Comput., 2011, 7, 525-537.). 모듈의 Protein Assignment 유틸리티는(Protein Assignment utility, Schro¨dinger, LLC, New York, NY, 2014.) His 잔기의 양성자화 상태 및 호변이성체, Asn, Gln 및 His 잔기에 대한 “flip” 지정, Asp, Glu, Tyr 및 Lys 잔기의 양성자화 상태를 포함하여 결정 구조의 구조적 모호성을 해결하였다. 네이티브 리간드를 제외한 헤테로겐 (HET) 분자는 제거되고 누락된 곁사슬이 채워졌으며 그 방향은 프라임 (Prime)에 의해 최적화되었다(Prime, version 3.8, Schro¨dinger, LLC, New York, NY, 2014.). 제한된 최소화(Restrained minimization)는 첨가된 수소만을 완화시키기 위해 OPLS 2005 force field에 Impact를 사용하여 수행하였다(version 6.5, Schro¨dinger, LLC, New York, NY, 2014.).Rhodopsin receptors and some GPCRs with ligands or covalent bonds with the ineffective structure at the binding site were excluded from the evaluation set. ConfGen, a glide structure search algorithm (KS Watts, P. Dalal, RB Murphy, W. Sherman, RA Friesner and JC Shelley, J. Chem. Inf. Model., 2010, 50, 534-546) 432097 and IT1t, so their complex 3QAK and 3ODU were excluded from the docking evaluation set. For multiple items of the same decision in the PDB, only one was selected for each group of overlapping complex structures. All structures collected were processed with the Protein Preparation Wizard module of the Schrodinger Suite for docking (Protein Preparation Wizard, Schroedinger, LLC, New York, NY, 2014.). This module allocates the correct bond order and adds hydrogen based on the Epik calculation for the correct pKa value (MHM Olsson, CR Sondergaard, M. Rostkowski and JH Jensen, J. Chem. Theory Comput., 2011, 7, 525-537.). The module's Protein Assignment utility (Protein Assignment utility, Schroedinger, LLC, New York, NY, 2014.) specifies the protonation state and tautomer of His residues, the "flip" designation for Asn, Gln and His residues, The structural ambiguity of the crystal structure, including the protonation state of Glu, Tyr and Lys residues, has been resolved. The HeteroGene (HET) molecule, with the exception of the native ligand, was removed and the missing side-chain was filled and its orientation was optimized by Prime (Prime, version 3.8, Schroedinger, LLC, New York, NY, . Restrained minimization was performed using Impact on the OPLS 2005 force field (version 6.5, Schroedinger, LLC, New York, NY, 2014.) to mitigate only the added hydrogen.

도킹 방법How to dock

도킹을 위해, 본 실시예의 전반에 걸쳐 글라이드 5.7(R. A. Friesner, J. L. Banks, R. B. Murphy, T. A. Halgren, J. J. Klicic, D. T. Mainz, M. P. Repasky, E. H. Knoll, M. Shelley, J. K. Perry, D. E. Shaw, P. Francis and P. S. Shenkin, J. Med. Chem., 2004, 47, 1739-1749.)을 이용하였다. 주어진 단백질-리간드 복합체의 포즈(pose)의 예측을 생성하기 위해서뿐만 아니라, 초기-포즈-생성 프로그램(initial-pose-generating program)으로서 Glide를 사용하였다. QM/MM 계산을 Glide에 의해 생성된 포즈 상에서 실행하였다. 본 실시예를 위해 수행된 모든 도킹 실행을 위해, Glide의 표준 정밀도(standard precision; SP) 모드를 사용하였다. Glide는 리간드 포즈를 생성하고 일련의 계층적 필터를 통해 포즈를 취하고 에너지 기반 및 경험적 기능을 모두 포함하는 스코어링 함수를 사용하여 평가한다. 첫 번째 단계에서, 개량(refinement)을 위해 초기 생성으로부터 각각 리간드 도킹에 대하여 5000 개 포즈를 유지하였다. 개량 후 에너지 최소화를 위해 그리드(grid)를 사용하여 400 개의 포즈를 유지하고 GlideScore라는 스코어링 함수를 사용하여 점수를 매겼다. Glide에서는 OPLS 2005 force field partial charge를 사용하여 리간드 차지를 할당한다. For docking, Glide 5.7 (RA Friesner, JL Banks, RB Murphy, TA Halgren, JJ Klicic, DT Mainz, MP Repasky, EH Knoll, M. Shelley, JK Perry, DE Shaw, P. Francis and PS Shenkin, J. Med. Chem., 2004, 47, 1739-1749. Glide was used as an initial-pose-generating program as well as to generate a prediction of the pose of a given protein-ligand complex. The QM / MM calculation was performed on the pose generated by Glide. For all docking runs performed for this embodiment, Glide's standard precision (SP) mode was used. Glide generates a ligand pose, poses through a series of hierarchical filters, and is scored using a scoring function that includes both energy-based and empirical functions. In the first step, 5,000 poses were maintained for each ligand dock from initial production for refinement. To improve energy minimization, we used a grid to maintain 400 poses and scored using a scoring function called GlideScore. Glide uses the OPLS 2005 force field partial charge to assign ligand charge.

용매화Solvation 스코어링Scoring 방법( Way( SolvationSolvation scoring method) scoring method)

도킹 시 용매화 효과를 고려하기 위하여, MacroModel의 Embrace 모듈을 사용하였다(MacroModel, version 10.6, Schro¨dinger, LLC, New York, NY, 2014.). Embrace는 GB/SA 연속체 용매화 모델을 사용하여 복합체와 분리된 수용체 및 리간드의 분자 역학에 의해 리간드-수용체 결합 에너지를 계산한다. 이 방법을 리간드-수용체 복합체에 적용하기 전에, 먼저 도킹을 수행하고 다양한 리간드 형태를 생성시켰다. Glide를 사용하여 도킹 초기 단계에서 10,000개의 초기 포즈를 생성하고 1.5 Å의 RMSD로 클러스터링 하였다. 결과적으로, 각 리간드에 대해 가능한 10 가지 리간드 포즈를 준비하였다. 클러스터링 후 Embrace를 사용하여 대표적인 포즈의 점수 및 순위를 매겼다. Embrace 계산은 에너지 차이 모드에서 실행하였다. 이 모드에서 수용체, 리간드 및 복합체의 에너지는 용매 환경에서 OPLS 2005 force field와 별도로 계산되며 에너지 차이는 방정식 (ㅿE = E complex-E ligand-E protein)을 사용하여 계산되었다. 용매화의 모든 효과가 이 모드에 포함되었으며, ㅿE에 의한 최고 순위 포즈가 최종 예측으로 선정되었다. To consider the solvation effect in docking, we used the Embrace module of MacroModel (MacroModel, version 10.6, Schroedinger, LLC, New York, NY, 2014.). Embrace calculates the ligand-receptor binding energy by the molecular dynamics of receptors and ligands separated from the complexes using the plume model for the GB / SA continuum. Prior to applying this method to the ligand-receptor complex, docking was first performed and various ligand forms were generated. Glide was used to generate 10,000 initial poses at the early stage of docking and clustered to RMSD of 1.5 Å. As a result, 10 possible ligand pods were prepared for each ligand. After clustering, we used Embrace to score and rank representative poses. Embrace calculations were performed in energy difference mode. In this mode, the energy of the receptor, ligand and complex was calculated separately from the OPLS 2005 force field in the solvent environment and the energy difference was calculated using the equation (E = E complex - E ligand - E protein ). All effects of solvation were included in this mode, and the highest pose by E was chosen as the final prediction.

QMQM /MM 도킹 프로토콜/ MM Docking Protocol

QM/MM 도킹 프로토콜은 종래 문헌에서 보고한 초기 QM/MM 도킹 방법과 유사하며, 고정된 전계 필드 전하 대신 도킹을 위해 QM/MM으로 계산된 부분 전하를 사용한다(A. E. Cho, V. Guallar, B. J. Berne and R. Friesner, J. Comput. Chem., 2005, 26, 915-931.). QM/MM을 위해 QM 지역에 Jaguar를(Jaguar, version 8.6, Schro¨dinger, LLC, New York, NY, 2014.), MM 지역에 Impact(version 6.5, Schro¨dinger, LLC, New York, NY, 2014.)를 결합한 Q-Site를 사용하였다. QSite는 MM 및 QM 영역 간의 결합이 정전기 삽입에 의해 모델링되는 덧셈 방식을 기반으로 한다(D. Bakowies and W. Thiel, J. Phys. Chem., 1996, 100, 10580-10594.). MM과 QM 지역 사이의 본드를 잘라내기 위해 frozen orbital method를 사용한다(QSite, version 6.5, Schro¨dinger, LLC, New York, NY, 2014.). 리간드와 리간드의 5 ÅA 이내의 측쇄를 포함하는 주변 수용체 영역을 QM 영역으로 정의하고, 나머지는 모두 MM 영역으로 정의하였다. QM 영역의 경우 B3LYP 하이브리드 기능 및 6-31G ** 기본 세트와 함께 밀도 기능 이론 (DFT)이 사용되었다. OPLS 2005 force field는 MM 계산에 사용되었다. QM/MM 계산 후, 정전 전위(electrostatic potential, ESP) 피팅을 사용하여 QM 영역 원자의 부분 전하를 계산하였다. The QM / MM docking protocol is similar to the earlier QM / MM docking method reported in the prior art and uses partial charges calculated by QM / MM for docking instead of fixed field field charges (AE Cho, V. Guallar, BJ Berne and R. Friesner, J. Comput. Chem., 2005, 26, 915-931.). (Jaguar, version 8.6, Schroedinger, LLC, New York, NY, 2014.) in the QM area for QM / MM, Impact (version 6.5, Schroedinger, LLC, New York, NY, 2014.) was used. QSite is based on the addition method in which the coupling between MM and QM regions is modeled by static insertion (D. Bakowies and W. Thiel, J. Phys. Chem., 1996, 100, 10580-10594.). Use the frozen orbital method to cut the bond between MM and QM regions (QSite, version 6.5, Schroedinger, LLC, New York, NY, 2014.). The peripheral receptor region including the side chain within 5 Å of the ligand and the ligand is defined as a QM region, and the rest are defined as the MM region. For the QM region, Density Functional Theory (DFT) was used with the B3LYP hybrid function and the 6-31G ** basic set. The OPLS 2005 force field was used for the MM calculation. After the QM / MM calculation, the partial charge of the QM region atoms was calculated using an electrostatic potential (ESP) fitting.

용매화Solvation QMQM /MM 도킹 프로토콜(/ MM Docking Protocol ( solvationsolvation QMQM /MM docking protocol)/ MM docking protocol)

본 발명에 따른 용매화 QM/MM 도킹의 경우, Poisson Boltzmann (PB) 솔버를 사용하여 QM/MM 계산에서 용매화 효과를 추가하였다. 이 묵시적 용매 모델에서 QSite는 먼저 기상의 QM 영역에 대한 ESP 전하를 계산하고 이를 PB 솔버로 전달하며, 이 솔버는 용매 유전체 연속체에 의해 생성된 전기장으로 전하를 다시 보정한다. 이러한 반복 과정을 분자에 대한 용매화 자유 에너지가 수렴할 때까지 계속 수행하였으며, 에너지의 변화가 5 X 105 hartree보다 작을 때 반복을 종료하였다. 부분 전하 계산 후, 리간드와 수용체에 대한 구조 파일의 전하 값을 이 값으로 대체하고 이를 글라이드가 재도킹 계산에 사용하도록 하였다.For the solvated QM / MM docking according to the present invention, the solvation effect was added in the QM / MM calculation using a Poisson Boltzmann (PB) solver. In this implicit solvent model, QSite first calculates the ESP charge for the QM region of the gas phase and conveys it to the PB solver, which solves the charge back to the electric field created by the solvent dielectric continuum. This repeated process was continued until the solvation free energy for the molecule converged, and the iteration was terminated when the energy change was less than 5 × 10 5 hartree. After calculating the partial charge, the charge value of the structural file for the ligand and acceptor was replaced by this value, which was used for the calculation of the re-docking of the glide.

실용적인 useful 용매화Solvation QMQM /MM 도킹 프로토콜(Practical / MM Docking Protocol (Practical solvationsolvation QMQM /MM docking protocol)/ MM docking protocol)

고유(native) 리간드 포즈에 대한 지식이 없는 실제 산업 환경에서 본 발명에 따른 solvation QM/MM 도킹 프로토콜을 적용하기 위해, 종래 개발된 QM/MM 도킹 프로토콜의 이전 버전에서 보고된 SOF (survival of the fittest) 알고리즘을 통합하였다(A. E. Cho, V. Guallar, B. J. Berne and R. Friesner, J. Comput. Chem., 2005, 26, 915-931.). 이 프로토콜에서는 실제 타겟에서 고유 리간드 포즈를 사용할 수 없기 때문에 먼저 정규 글라이드 SP로 최대 10개의 포즈를 생성한 다음 각 포즈에서 QM/MM 기반 원자 전하 피팅을 수행하였다. 이러한 새로운 원자량 세트를 사용하여 이후의 도킹 계산 라운드를 수행하였다. 포즈 예측 결과로부터 정전기-반데르발스 에너지(electrostatic-van der Waals energies)를 기반으로 최상의 포즈를 선택하였다.In order to apply the solvation QM / MM docking protocol according to the present invention in a real industrial environment without knowledge of the native ligand pose, a survival of the fittest (SOF) reported in a previous version of the conventionally developed QM / MM docking protocol (AE Cho, V. Guallar, BJ Berne and R. Friesner, J. Comput. Chem., 2005, 26, 915-931). Since no unique ligand pose can be used in the actual target in this protocol, we first create up to 10 pose with regular glide SP and then perform QM / MM based atomic charge fitting at each pose. A subsequent docking calculation round was performed using this new set of atomic quantities. From the pose prediction results, the best pose was chosen based on electrostatic-van der Waals energies.

결과 및 고찰Results and Discussion

기존의 도킹 프로그램을 사용한 재도킹 테스트Test re-docking using existing docking programs

먼저, 기존의 도킹 프로그램이 GPCR에서 얼마나 잘 수행하는지 확인하기 위해 공결정(co-crystal) 리간드를 수용체에 다시 연결하고 예측과 결정 구조를 비교함으로써 GPCR 도킹 평가 세트에 대한 재도킹 테스트를 수행하였다. 표 2에는 재도킹 결과인 RMSD (원자 포지션의 평균 제곱근 편차) 값을 나타내었다. 일반적으로 도킹 테스트에서 2 Å RMSD는 성공적인 도킹을 위한 기준으로 널리 사용된다. 동일한 기준에서 Glide는 40개 중 32개에 대하여 리간드 바인딩 포즈를 예측하는데 성공했으며, 27 개의 경우는 1 Å 미만이었다. 그러나 실패한 사례의 RMSD는 오히려 높은 2.33-9.66 Å의 범위에 있었다. 4AMI, 3EML, 3UZA 및 3PBL의 경우, RMSD 값은 5 Å 이상이었고, 이는 예측 된 리간드 결합 포즈가 완전히 잘못된 방향 또는 잘못된 위치에 있음을 의미한다. 또한, 글라이드는 경우에 따라 서로 다른 리간드가 있는 동일한 수용체에 대해 일관된 도킹 결과를 나타내지 않았다. 특히, A2AR의 경우 NECA를 사용한 RMSD는 0.254 Å였으며 ZM241385는 8.976 Å이었다. 다른 예로는 b1AR이 있는데, bucindolol이 재도킹 테스트에서 최악의 결과(9.661 Å)를 보인 반면에 다른 리간드는 성공한 것으로 나타났다. 이를 통해 종래 도킹 방법의 실패 원인을 분석하여 도킹 방법을 개선할 필요성이 있음을 확인하였다.First, we performed a re-docking test on the GPCR docking evaluation set by reconnecting the co-crystal ligand to the receptor and comparing the prediction and decision structure to see how well the existing docking program performs in the GPCR. Table 2 shows the RMSD (mean square deviation of atomic position) as a result of re-docking. In general, 2 Å RMSD in docking tests is widely used as a basis for successful docking. On the same basis, Glide succeeded in predicting ligand binding pose for 32 out of 40, with 27 cases less than 1 Å. However, the RMSD of the failed cases was in the higher range of 2.33-9.66 Å. For 4AMI, 3EML, 3UZA, and 3PBL, the RMSD value was above 5 A, indicating that the predicted ligand binding pose was in the wrong or wrong position. In addition, Glide did not show consistent docking results for the same receptors with different ligands in some cases. In particular, for A2AR, the RMSD using NECA was 0.254 Å and the ZM241385 was 8.976 Å. Another example is b1AR, where bucindolol showed the worst result (9.661 Å) in the redocking test, while the other ligand succeeded. It is confirmed that there is a need to improve the docking method by analyzing the cause of failure of the conventional docking method.

Figure pat00002
Figure pat00002

GPCR에서From the GPCR 도킹 실패의 원인  Cause of docking failure

도킹 프로세스는 '검색'및 '스코어링'단계로 나눌 수 있다. 재도킹 테스트에서 검색 검색 알고리즘이 모든 GPCR 테스트 세트(데이터는 표시되지 않음)에 적어도 하나의 정확한 리간드 포즈(RMSD 2 Å 미만)를 생성함을 관찰하였으나, 그러나 스코어링 함수는 실패한 경우에서 가장 좋은 점수를 얻은 올바른 포즈를 선택할 수 없었다. 문제의 원인을 찾기 위해, 실패한 경우의 리간드가 일반적으로 결정에 용매가 노출된 부분을 가지고 있다는 사실에 주목하였다(도 1).The docking process can be divided into a 'search' and a 'scoring' phase. In the re-docking test, the search search algorithm observed that it generated at least one exact ligand pose (less than RMSD 2 Å) in all GPCR test sets (data not shown), but the scoring function, however, I could not pick the right pose I got. In order to find the cause of the problem, it has been noted that the ligand in the case of failure generally has a portion of the solvent exposed to the crystal (Fig. 1).

글라이드는 용매 효과를 고려하지 않기 때문에 용매에 노출된 리간드 영역이 정확한 도킹을 방해하는 요소가 될 수 있다. 재도킹 결과를 살펴보면 이를 확인할 수 있는데, 구체적으로 글라이드는 A2A에 대한 리간드 중 용매에 노출된 부분이 없는 아데노신, NECA 및 T4E에 대해 올바른 바인딩 포즈를 예측할 수 있지만 용매가 노출된 부분을 갖는 ZM241385 및 XAC에는 적합하지 않았다. 또한, b1AR 리간드 중에서 bucindolol은 용매에 노출된 부분을 가지며 또한 글라이드가 올바른 결합 자세를 예측하지 못한 유일한 것으로 나타났다.Since glide does not take into account the solvent effect, the ligand region exposed to the solvent may be an obstacle to accurate docking. Specifically, Glide can predict the correct binding pose for adenosine, NECA and T4E that are free of solvent exposed portions of the ligand to A2A, but ZM241385 and XAC with solvent exposed moieties Lt; / RTI > In addition, among the b1AR ligands, bucindolol has a portion exposed to the solvent, and the glide is the only one that does not predict correct bonding posture.

리간드가 GPCR 결합 부위에서 용매에 노출된 부분을 갖는 방법을 이해하기 위해, 카페인 및 ZM241385와 복합체를 이루는 두 개의 A2A 아데노신 수용체의 공결정을 분석하였다. ZM241385의 결합 포즈에서, 용매에 노출된 페놀기는 결합 부위의 입구에 위치하며, 결합 부위와 세포외 용매는 접촉한다(도 2A). 카페인의 결합 포즈에서, 전체 리간드가 깊은 결합 부위에 있지만 (도 2B), 여전히 용매에 부분적으로 노출되어 있다. 카페인의 후자의 경우는 세포외 용매가 막 영역 내부에 위치함에도 불구하고 결합 부위의 더 깊은 부분에 접근할 수 있음을 보여준다. 이 2가지 예는 A2A 아데노신 수용체가 넓고 개방된 결합 부위를 가지고 있으며 이는 세포외 영역의 물 분자에 의해 쉽게 접근할 수 있음을 보여준다. 아데노신, NECA 및 T4E는 결합 부위의 더 깊은 부분에만 고정되어 있을 뿐만 아니라 유도된 보정 효과에 의한 구조 변화를 거친 세포외 루프에 의해 용매로부터 보호되기 때문에 예외이다. 이 특징은 A2AR에만 국한된 것이 아니며 GPCR의 일반적인 7TM 구조에서 기인한다. 또한, A2AR와 같은 클래스 A GPCR의 경우, 알로스테릭 결합 부위는 세포외 영역 근처에서 발견되어 용매에 더 많이 접근할 수 있게 한다. 다른 종류의 GPCR의 경우, orthosteric 및 allosteric binding sites는 나선 번들의 중심이나 세포외 루프 영역에서 발견될 수 있다(P. J. Conn, A. Christopoulos and C. W. Lindsley, Nat. Rev. Drug Discovery, 2009, 8, 41-54.).To understand how the ligand has a solvent exposed portion at the GPCR binding site, the co-crystals of two A2A adenosine receptors complexed with caffeine and ZM241385 were analyzed. In the binding pose of ZM241385, the phenolic groups exposed to the solvent are located at the entrance of the binding site, and the binding site and the extracellular solvent are in contact (Fig. 2A). In the binding pose of caffeine, the entire ligand is at a deep binding site (Fig. 2B), but is still partially exposed to the solvent. The latter case of caffeine shows that the extracellular solvent is accessible to the deeper part of the binding site, even though it is located within the membrane area. These two examples show that the A2A adenosine receptor has a broad and open binding site and is easily accessible by the water molecules in the extracellular domain. Adenosine, NECA and T4E are anchored not only at the deeper part of the binding site, but also because they are protected from the solvent by an extracellular loop that undergoes structural changes due to the induced correction effect. This feature is not limited to the A2AR but is attributed to the general 7TM architecture of the GPCR. Also, for Class A GPCRs such as A2AR, the allosteric binding site is found near the extracellular region, allowing more access to the solvent. For other types of GPCRs, orthosteric and allosteric binding sites can be found in the center of the spiral bundle or in the extracellular loop region (PJ Conn, A. Christopoulos and CW Lindsley, Nat. Rev. Drug Discovery, 2009, 8, 41 -54.).

용매화Solvation 효과 포함 :  Effects include: 용매화Solvation 에너지  energy 리스코어링Rescoring (( solvationsolvation energy re-scoring) energy re-scoring)

Glide SP에 의해 생성 및 스코어링된 포즈를 리스코어링 하는데에 묵시적 용매화 에너지를 사용하는 리스코어링 기법을 테스트하였다. 이 방법으로 생성된 리도킹 결과의 RMSD 값은 표 2에 나타내었다. 이 리스코어링 체계를 사용할 때 향상된점은 기껏해야 증분(incremental)이다. 글라이드 SP의 모든 성공 사례가 리스코어링 기법에 의해 중단되지는 않았지만 글라이드 SP의 실패 사례가 성공으로 돌아가지도 않았다. 주목할만한 유일한 사례는 RMSD 값이 9.661에서 2.914로 감소한 4AMI인데, 이는 용매 효과를 포함함으로써 예측된 포즈가 적어도 올바른 방향으로 있음을 나타내는 것이다.We tested the recourse technique using implicit solvation energy to recourse poses generated and scored by Glide SP. The RMSD values of the resulting re-docking results are shown in Table 2. The improvement in using this recourse system is at most incremental. Although all successes of the Glide SP were not interrupted by the recourse technique, the failure of Glide SP did not succeed. The only notable case is the 4AMI, where the RMSD value is reduced from 9.661 to 2.914, indicating that the predicted pose is at least in the right direction by including the solvent effect.

극성화Polarization (polarization) 효과 고려 : Consider the polarization effect: QMQM /MM 도킹/ MM docking

GPCR의 막 부분과 비교하여, 세포외 루프를 포함하여 용매가 노출된 표면은 상대적으로 극성이 높고 전하를 띈 아미노산이 많다. 또한 extra-cellular loop2 (ECL2)는 종종 리간드 상호 작용에 참여한다. 따라서 도킹을 위해 이 영역의 원자에 올바른 원자 전하를 사용하는 것이 중요하다. 이것은 어떤식으로든 극성화 효과를 통합해야 한다는 것을 의미한다. 예전의 연구에서, DFT 기반 QM/MM 계산을 통합하는 도킹 프로토콜이 광범위한 목표에 대해 상당히 효과적 일 수 있다는 것을 보여주었다(J. Y. Chung, J. M. Hah and A. E. Cho, J. Chem. Inf. Model., 2009, 49, 2382-2387.). 그 연구에서, 리간드의 원자 전하는 QM 계산을 사용하여 재계산된 후 역장(force field)에서 오는 고정된 전하 대신에 도킹에 사용되었다. 본 실시예에서는 확장된 QM 영역과 함게 동일한 절차를 사용하였다. 이 QM 계산된 전하가 가져올 수 있는 차이의 양을 확인하기 위해 네이티브 포즈에서의 역장 전하 및 QM 전하로 계산된 리간드와 수용체 사이의 정전 에너지를 비교하였다. Glide에서 Ecvdw는 Coulombic과 vanderWaals 에너지의 합이다. 그러나 본 프로토콜에서는 전하를 변화시킴으로써 정전기 에너지만 영향을 받았고 vanderWaals 에너지는 영향을 받지 않았다. 두 경우의 Ecvdw 값은 표 3에 나타내었다.Compared with the membrane portion of the GPCR, the surface of the solvent, including the extracellular loops, has a relatively high polarity and a large number of charged amino acids. Extra-cellular loop2 (ECL2) also often participates in ligand interactions. Therefore, it is important to use the correct atomic charge for atoms in this region for docking. This means that you have to integrate the polarizing effect in any way. Previous studies have shown that a docking protocol incorporating DFT-based QM / MM calculations can be quite effective for a wide range of goals (JY Chung, JM Hah and AE Cho, J. Chem. Inf. Model., 2009, 49, 2382-2387.). In that study, the atomic charge of the ligand was recalculated using the QM calculation and then used for docking instead of the fixed charge coming from the force field. In this embodiment, the same procedure is used with the extended QM region. To determine the amount of difference this QM calculated charge can bring, the electrostatic energy between the ligand and the receptor calculated by the inverse field charge and QM charge in the native pose was compared. In Glide, Ecvdw is the sum of Coulombic and vanderWaals energy. However, in this protocol, only the static energy was affected by changing the charge and the vanderWaals energy was not affected. The Ecvdw values in both cases are shown in Table 3.

Figure pat00003
Figure pat00003

표에서 분명히 알 수 있듯이 Ecvdw 값은 대부분의 경우 크게 다르다: 23개의 사례에서 10 kcal mol-1 이상이었다. 이것은 GPCR의 결합 부위에서 극성화 효과가 상당함을 의미한다. 테스트 세트의 QM / MM 도킹 결과는 표 2에 나타내었다. QM/MM 도킹으로 성공률은 1.12 Å RMSD와 함께 평균 90%로, 일반 글라이드 및 용매포함 도킹보다 훨씬 뛰어난 결과를 나타내었다. QM/MM 도킹은 용매에 노출된 리간드의 경우인 3RFM, 3UZA, 3PBL 및 4DJH에 대한 바인딩 포즈를 성공적으로 예측하였다. 그러나 QM/MM 도킹은 여전히 3EML, 3REY, 4AMI 및 4MQT에 대한 바인딩 포즈 예측을 향상시킬 수 없었다. 표 3에서 Ecvdw 값은 3EML과 3REY의 경우에만 소량 차이가 있음을 알 수 있다. 이 경우 QM/MM 계산으로 설명할 수 있는 극성화 효과가 별로 없다는 결론을 내릴 수 있다. 그러나 4AMI와 4MQT의 경우 Ecvdw 에너지는 상당한 차이가 있었다. 극성화 효과의 보정이 결합 포즈 예측을 향상시킬 수 없는 이유를 설명하기 위해, 이 복합체의 리간드가 용매에 상당 부분이 노출된 부분을 가지고 있음에 주목하였다. QM/MM 계산은 물에 의한 용매화가 없는 단백질에 대해 수행되었으며 이러한 경우에 오류를 확실히 유발하였다. 이러한 결과들을 통해 QM/MM 계산시 용매화 효과를 포함시키는 것이 필수적임을 확인할 수 있었다.As can be seen in the table, the Ecvdw values are largely different in most cases: over 23 kcal mol -1 . This means that the polarizing effect is significant at the binding site of the GPCR. The results of the QM / MM docking of the test set are shown in Table 2. With QM / MM docking, the success rate was 90%, with 1.12 Å RMSD, much better than dipping with common glide and solvent. The QM / MM docking successfully predicted the binding poses for 3RFM, 3UZA, 3PBL and 4DJH in the case of solvent exposed ligands. However, the QM / MM docking could still not improve the binding pose prediction for 3EML, 3REY, 4AMI and 4MQT. In Table 3, it can be seen that the Ecvdw value is small only in the case of 3EML and 3REY. In this case, we can conclude that there is little polarizing effect that can be explained by the QM / MM calculation. However, Ecvdw energy was significantly different between 4AMI and 4MQT. In order to explain why the correction of the polarizing effect can not improve the binding pose prediction, it has been noted that the ligand of this complex has a substantial portion of the solvent exposed. The QM / MM calculations were performed on proteins that were not solvated by water, and in this case they certainly caused errors. From these results, it was confirmed that it is necessary to include the solvation effect in the QM / MM calculation.

용매화Solvation QMQM /MM 도킹(/ MM docking SolvationSolvation QMQM /MM docking)/ MM docking)

GPCR 타겟에 대한 본 발명에 따른 새로운 도킹 방법의 핵심 개념은 용매화 및 극성화 효과 (도 3)를 포함하여 도킹에서 "환경적으로 정확한 전하"를 사용해야 한다는 것이다. 환경적으로 정확한 전하는 역장(force field) 매개 변수에서 벗어나 용매 및 극소량의 극성화된 잔기의 환경에 부합하는 원자 전하이다. 본 발명에서는 묵시적 용매와 함께 QM/MM 계산을 통해 전술한 개념을 구현하였다. "용매화 QM/MM 도킹"이라고 불리는 본 발명에서, QM 영역은 전술한 바와 같이 결합 부위의 리간드 원자와 주변 잔기를 포함한다.A key concept of the new docking method according to the present invention for GPCR targets is to use " environmentally accurate charge " in the docking, including solvation and polarizing effects (Figure 3). The environmentally correct charge is an atomic charge that deviates from the force field parameter and fits into the environment of solvents and very small amounts of polarized residues. In the present invention, the above-described concept is implemented through the QM / MM calculation together with the implicit solvent. In the present invention referred to as " solvated QM / MM docking ", the QM region includes ligand atoms and surrounding moieties at the binding site as described above.

이전의 몇몇 연구는 리간드 도킹에서 교량 용매화 모델 및 QM/MM 계산에 대한 QM/MM-GB/SA(Generalized Born/Surface Area)( K. Wichapong, A. Rohe, C. Platzer, I. Slynko, F. Erdmann, M. Schmidt and W. Sippl, J. Chem. Inf. Model., 2014, 54, 881-893.) 또는 QM/MM-PB/SA(Poisson-Boltzmann/Surface Area)( S. A. Hayik, N. Liao and K. M. Merz, J. Chem. Theory Comput., 2008, 4, 1200-1207.) 접근법을 사용하였다. 이러한 접근법에서 용매화 효과는 GB/SA 또는 PB/SA 에너지 계산 후 도킹 (리스코어링) 처리로 통합된다. 대조적으로, 본 발명의 방법은 리간드 및 결합 부위 단백질 원자에 대해 보다 정확한 원자 전하를 발생시킬 수 있도록 QM/MM 에너지 계산 단계에서의 용매화를 고려하며 이를 통해 도킹 스테이지 자체에서 정확한 포즈를 찾을 수 있는 더 나은 기회를 제공한다.Some previous studies have shown that the QM / MM-GB / SA (Generalized Born / Surface Area) (K. Wichapong, A. Rohe, C. Platzer, I. Slynko, MM / PB-SA (Poisson-Boltzmann / Surface Area) (SA Hayik, M.S., J. Schmidt and W. Sippl, J. Chem. Inf. N. Liao and KM Merz, J. Chem. Theory Comput., 2008, 4, 1200-1207). In this approach, the solvation effect is integrated into the docking (recounting) process after GB / SA or PB / SA energy calculations. In contrast, the method of the present invention considers solvation at the QM / MM energy calculation stage so as to generate more accurate atomic charges for the ligand and binding site protein atoms, thereby enabling accurate pose detection at the docking stage itself Provide a better opportunity.

본 발명에 따른 방법은 동일한 GPCR 도킹 평가 테스트 세트 (표 2)에서 테스트되었다. 예측된 모든 결합 포즈에 대한 RMSD 값은 2 Å 미만이었고 평균값은 0.776 Å이었다. The method according to the present invention was tested in the same GPCR docking evaluation test set (Table 2). The RMSD values for all predicted binding poses were less than 2 Å and the mean value was 0.776 Å.

용매화 효과를 고려하지 않은 QM/MM 도킹을 사용한 실패 사례인 3EML, 3REY, 4AMI 및 4MQT의 경우, 본 발명에 따른 방법을 이용할 경우 RMSD 값이 6.335에서 0.546, 3.996에서 1.223, 2.924에서 0.489, 3.100에서 1.507로 각각 감소하였다. 즉, 본 발명에 따른 용매화 QM/MM 도킹은 Glide 및 QM/MM 도킹에 의한 올바른 예측을 유지하면서 용매화 효과가 중요 할 수 있는 복합체에 대하여 올바른 예측을 제공할 수 있음을 확인하였다. For the 3EML, 3REY, 4AMI and 4MQT failure cases using the QM / MM docking that does not consider the solvation effect, the RMSD values were 6.335 to 0.546, 3.996 to 1.223, 2.924 to 0.489, and 3.100 To 1.507, respectively. That is, it has been confirmed that the solvated QM / MM docking according to the present invention can provide correct prediction for complexes where solvation effects may be important while maintaining correct prediction by Glide and QM / MM docking.

3EML 도킹 결과는 이러한 각 효과의 기여도를 잘 보여준다(도 4). 글라이드 도킹은 3EML에 대해 8.976 Å의 RMSD를 나타내었다. 예측된 포즈는 원래 포즈의 반대 방향에 있었다. 용매화 효과를 고려하지 않은 QM/MM 도킹은 코어 링 그룹과 고유 포즈와 같은 위치에 있는 푸릴 그룹과의 결합 부위에서 리간드의 올바른 방향을 예측하였다. 리간드의 이 부분에 더 잘 맞는 원자 전하 세트를 가짐으로써 도킹 포즈의 방향이 올바른 방향으로 인도된 것으로 결론지을 수 있다. 그러나 용매에 노출 된 페놀 그룹에는 여전히 고유 포즈로부터의 이탈이 존재하였다. 세포외 영역을 가리키는 대신 QM/MM 도킹으로 예측된 포즈는 His278과 수소 결합을 형성하는 이 작용기를 가졌다. QM/MM 도킹에 대한 6.355 Å의 RMSD가 이 오류의 원인이었으며, 본 발명에 따른 용매화 QM/MM 도킹을 수행할 경우 이 오류가 수정되며 RMSD 값은 0.546 Å로 크게 감소됨을 확인하였다. 결합 부위가 용매에 노출된 ECL 영역 근처의 알로스테릭성인 4MQT의 경우에도 유사한 결과가 관찰되었다(도 5).The 3EML docking results illustrate the contribution of each of these effects (Figure 4). Glide docking showed an RMSD of 8.976 ANGSTROM for 3 EML. The predicted pose was in the opposite direction of the original pose. QM / MM docking without consideration of solvation effect predicted the correct orientation of the ligand at the binding site with the furyl group at the positions such as the core ring group and the intrinsic pose. It can be concluded that the direction of the docking pose is directed in the correct direction by having a set of atomic charges that better fits this part of the ligand. However, the phenol groups exposed to the solvent were still deviating from the inherent pose. The pose predicted by QM / MM docking instead of extracellular domain had this functional group to form a hydrogen bond with His278. The RMSD of 6.355 Å for the QM / MM docking was the cause of this error, and it was confirmed that this error was corrected when the solvated QM / MM docking according to the present invention was performed and the RMSD value was greatly reduced to 0.546 Å. A similar result was observed for the allosteric 4MQT near the ECL region where the binding site was exposed to the solvent (Figure 5).

결론적으로, 전술한 2가지 사례에 대한 성공적인 예측을 통해 본 발명에 따른 용매화 QM/MM 도킹이 여러 유형의 결합 부위를 포함하는 모든 클래스의 GPCR 타겟에 효과적으로 적용될 수 있음을 확인하였다. In conclusion, successful prediction of the above two cases confirmed that the solvated QM / MM docking according to the present invention can be effectively applied to all classes of GPCR targets including several types of binding sites.

진공상Vacuum phase QMQM 도킹(Gas phase  Docking QMQM docking) docking)

리간드 원자의 극성화에 대한 결합 부위 단백질 원자의 환경 효과의 중요성을 입증하기 위해, 진공상의 리간드에 대한 QM 계산을 수행하고 QM/MM 도킹과 동일한 프로토콜을 따랐다. 이 방법으로 계산된 전하는 분자 모양에서 오는 리간드의 자기-극성화(self-polarization) 효과를 반영하지만 주변 단백질 원자에 의해 나타나는 극성화 효과를 놓치게 된다. 진공 위상 QM 도킹이라고 명명된 이 프로토콜은 글라이드 도킹과 비교하여 약 0.06 Å로 약간 개선된 평균 RMSD를 나타내었으며 성공률 면에서는 실제로 글라이드보다 하나 더 실패하였다. 전반적으로 진공상 QM 도킹은 본 발명에 따른 용매화 QM/MM 도킹의 성능과 일치하지 않았으며, 이를 통해 리간드 원자의 극성화를 고려할 때 환경적 영향을 고려해야한다는 것을 명확하게 보여주었다.To demonstrate the importance of the environmental effects of binding site protein atoms on the polarization of ligand atoms, QM calculations were performed on the vacuum ligands and the same protocol as QM / MM docking was followed. The charge calculated by this method reflects the self-polarization effect of the ligand coming from the molecular shape, but it misses the polarizing effect caused by the surrounding protein atoms. This protocol, termed vacuum phase QM docking, showed a slightly improved average RMSD of about 0.06 A compared to glide docking, and in terms of success rate, it actually failed one more than Glide. Overall, the vacuum phase QM docking did not coincide with the performance of the solvated QM / MM docking according to the present invention, which clearly showed that the environmental effects should be taken into account when polarizing the ligand atoms.

실용적인 useful 용매화Solvation QMQM /MM 도킹 프로토콜(practical / MM docking protocol solvationsolvation QMQM /MM docking protocol)/ MM docking protocol)

전술한 QM/MM 도킹 방법들은 결정 구조의 고유 포즈를 이용하여 수행되었다. 그러나 실제 약물 발견 분야에서 도킹 방법은 고유 포즈 없이 새로운 리간드의 결합 모드를 예측할 수 있어야 한다. 이에, 본 발명에서는 SOF (survival of the fittest) 알고리즘(A. E. Cho, V. Guallar, B. J. Berne and R. Friesner, J. Comput. Chem., 2005, 26, 915-931.)을 본 발명에 따른 용매화 QM/MM 도킹에 구현하였으며(이 프로토콜은 'SolvQMDock'이라 칭함), GPCR 도킹 평가 세트 (표 4)에서 테스트하였다. The QM / MM docking methods described above were performed using a unique pose of the crystal structure. However, in practical drug discovery, the docking method must be able to predict the binding mode of a new ligand without a unique pose. Therefore, in the present invention, the survival of the fittest algorithm (AE Cho, V. Guallar, BJ Berne and R. Friesner, J. Comput. Chem., 2005, 26, 915-931) Plated QM / MM docking (this protocol is called 'SolvQMDock') and tested in the GPCR docking evaluation set (Table 4).

Figure pat00004
Figure pat00004

SolvQMDock 과정에서 생성된 10 개의 리간드 포즈는 광범위한 리간드 RMSD 값을 커버하며, 용매화 QM/MM 방법에 의해 계산된 charge 값은 그에 따라 달라진다. 또한, 이 중간 포즈에서 계산된 묵시적인 용매화 에너지도 변화하지만, 이 효과는 전하 값에 포함된다는 점에 유의해야한다. 전하 값 중 일부는 비현실적인 것처럼 보일 수 있지만 결국 중요한 정전기 전위 표면(electrostatic potential surface)이라는 것을 명심해야 한다. SolvQMDock에서는 이러한 전하 값으로 도킹의 두 번째 라운드를 수행하였으며, 따라서 극성화 및 용매화 효과는 정확한 포즈를 찾기 위해 계산되었다. 고유 리간드를 이용한 용매화 QM/MM 도킹의 결과와 비교할 때, SolvQMDock에 의한 평균 RMSD 값은 0.776 Å에서 약간 증가하였다. 그러나 새로운 방법은 Glide 도킹보다 GPCR 표적에서 더 잘 수행되었는데, 평균 RMSD는 1.735 Å이었다. 2 개의 GPCR 복합체(4MQS 및 4MBS)의 경우, 2 Å 이상의 RMSD 값을 나타내었다. 두 경우 모두 링 배열의 예측에서 실패한 반면 전체 리간드의 일반적인 방향은 정확히 예측하였다(도 6). 이 두 가지 경우를 제외하고 SolvQMDock은 실제 약물 발견 환경에서 정확한 도킹 예측 능력을 나타내었다.The ten ligand poses generated in the SolvQMDock process cover a wide range of ligand RMSD values, and the charge values calculated by the solvated QM / MM method vary accordingly. It should also be noted that although the implicit solvation energy calculated in this intermediate pose also changes, this effect is included in the charge value. Some of the charge values may seem impractical, but it is important to remember that they are important electrostatic potential surfaces. SolvQMDock performed the second round of docking with these charge values, so polarizing and solvating effects were calculated to find the correct poses. Compared with the results of solvated QM / MM docking with unique ligands, the average RMSD value by SolvQMDock slightly increased from 0.776 Å. However, the new method was better performed on the GPCR target than the Glide docking, with an average RMSD of 1.735 Å. For two GPCR complexes (4MQS and 4MBS), the RMSD values were greater than 2 Å. Both cases failed to predict the ring arrangement, but the general direction of the total ligand was precisely predicted (Figure 6). Except for these two cases, SolvQMDock showed accurate docking predictability in the actual drug discovery environment.

SolvQMDock은 리간드 원자뿐만 아니라 결합 부위의 일부 단백질 원자를 포함하는 영역에 QM 계산을 포함하기 때문에 계산적으로 까다롭다. 용매화 단계 QM/MM 계산은 용매화물에서의 QM 계산이 기상 단계에서의 계산보다 2배 더 많이 걸리므로 상황을 더욱 악화시킨다. 일반적인 GPCR 복합체의 경우 단일 Intel Xeon X5650 @ 2.67GHz 프로세서에서 solvation QM / MM 도킹 계산이 약 7시간이 걸렸다. QM/MM 계산 단계 이전에 생성된 리간드 포즈에 의한 병렬 처리는 이 시간을 거의 10 배로 줄였다. 그러나 이 프로토콜은 아마도 가상 리간드 스크리닝보다는 리드 최적화 과정에 적합할 것으로 보여진다.SolvQMDock is computationally demanding because it involves QM calculations in regions containing ligand atoms as well as some protein atoms in binding sites. The solvation phase QM / MM calculations make the situation worse because the QM calculations in solvates take twice as much as the calculations at the meteorological stage. For a typical GPCR complex, solvation QM / MM docking calculations took about 7 hours on a single Intel Xeon X5650 @ 2.67GHz processor. The parallel processing by the ligand pose generated before the QM / MM calculation step reduced this time by almost 10 times. However, this protocol is likely to be more suitable for lead optimization than virtual ligand screening.

결론conclusion

본 발명에서는 QM/MM 계산에 묵시적 용매 모델을 결합한 새로운 도킹 전략을 제시하였다. 본 발명의 주요 목적은 GPCR 표적에 대해 높은 신뢰성과 정확성을 가지고 수행하는 새로운 도킹 방법을 제안하는 것이다. 대부분의 GPCR은 용매에 접근 가능한 결합 부위를 가지고 있기 때문에 용매 및 극성화 효과를 포함하면 GPCR 표적의 도킹 성능이 향상될 것으로 기대된다. 따라서 본 발명에서는 묵시적 용매 모델을 사용하여 용매화 에너지 계산과 함께 QM/MM 계산을 사용하여 결합 부위 부근의 리간드 및 측쇄의 원자의 부분 전하의 재패러미터화를 수행하였다.In the present invention, a new docking strategy combining an implicit solvent model with the QM / MM calculation is presented. A primary object of the present invention is to propose a new docking method which performs with high reliability and accuracy on the GPCR target. Since most GPCRs have a solvent accessible binding site, docking performance of GPCR targets is expected to be improved if they include solvent and polarizing effects. Thus, in the present invention, reparameterization of the partial charges of the ligand and side chain atoms near the binding site was performed using the QM / MM calculation together with the solvation energy calculation using the implicit solvent model.

40개의 GPCR 복합체 세트에 대한 도킹 정확도 테스트를 수행하여 네 가지 방법(글라이드 SP, 용매화 에너지 리스코어링, 고유 포즈로 QM/MM 도킹 및 고유 포즈로 용매화 QM/MM 도킹)을 비교하였다. 이 테스트에서 용매화 에너지 리스코어링 ㅂ방법은 기존의 도킹 프로그램인 Glide보다 약간 향상된 결과를 보여주었다. 반면 QM/MM 도킹은 80%의 케이스 성공률을 보인 글라이드에 비해 90 %의 케이스 성공률을 나타내어 훨씬 뛰어난 결과를 보여주었다. QM/MM 도킹에 실패한 사례를 분석한 결과 용매에 노출된 부분이 잘못된 형태로 존재할 것으로 예측되었다. 따라서 본 발명에서는 용매화 QM/MM 도킹 방법을 적용하였으며, 이를 통해 오류가 수정되었으며 성공률은 100 %로 나타났다. Docking accuracy tests were performed on the set of 40 GPCR complexes to compare four methods: Glide SP, Solvation Energy Recall, QM / MM Docking with Unique Pose, and Solvent QM / MM Docking with Unique Pose. In this test, the solvation energy recalling method showed slightly better results than the existing docking program Glide. The QM / MM docking, on the other hand, showed a much better result with a case success rate of 90% compared to Glide with 80% case success rate. Analysis of the failure of the QM / MM docking revealed that the exposed parts of the solvent were in the wrong form. Therefore, in the present invention, the solvated QM / MM docking method was applied, and the error was corrected and the success rate was 100%.

그러나 실제 약물 발견 환경에서 용매화 QM/MM 도킹 방법을 이용하기 위해서는 고유 포즈에 대한 지식을 필요로 하지 않는 알고리즘이 필요하다. 이를 위해 SOF 알고리즘을 solvation QM/MM 도킹에 통합하고 결과 프로토콜을 SolvQMDock으로 작성하였으며, GPCR 복합체의 동일한 세트에서 테스트하였다. 이 테스트의 성공률은 95%로, GPCR 타겟에 유용하게 사용될 수 있음을 확인하였다.However, to use the solvated QM / MM docking method in an actual drug discovery environment, an algorithm that does not require knowledge of the unique pose is required. To do this, the SOF algorithm was integrated into the solvation QM / MM docking, the resulting protocol was written in SolvQMDock, and tested on the same set of GPCR complexes. The success rate of this test was 95%, confirming that it could be useful for GPCR targets.

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.It will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the spirit or scope of the invention as defined in the appended claims. It will be understood that the invention may be varied and varied without departing from the scope of the invention.

Claims (10)

묵시적 용매(implicit solvent) 모델 환경하에서 미리 정의된 양자역학 영역(QM region)에 대한 양자역학 계산을 통해 상기 양자역학 영역에 존재하는 단백질 잔기와 리간드의 원자 전하를 계산하는 단계; 및
상기 계산된 원자 전하를 이용하여 도킹을 수행하는 단계;를 포함하는 단백질-리간드 도킹구조의 예측방법.
Computing the atomic charge of a protein residue and a ligand present in the quantum mechanical region through quantum mechanical calculation for a predefined quantum mechanical region (QM region) under an implicit solvent model environment; And
And performing docking using the calculated atomic charge to predict the protein-ligand docking structure.
제1항에 있어서,
상기 양자역학 영역은 단백질과 리간드의 결합 부위(binding site)의 단백질 잔기와 리간드를 포함하는 것을 특징으로 하는 단백질-리간드 도킹구조의 예측방법.
The method according to claim 1,
Wherein the quantum mechanical region comprises a protein residue and a ligand at a binding site of a protein and a ligand.
제2항에 있어서,
상기 양자역학 영역은 상기 리간드 및 결합 부위에서 5 Å이내의 범위의 단백질 잔기를 포함하는 것을 특징으로 하는 단백질-리간드 도킹구조의 예측방법.
3. The method of claim 2,
Wherein the quantum mechanical region comprises protein residues in the range of 5 < RTI ID = 0.0 > A < / RTI > at the ligand and binding site.
제1항에 있어서,
상기 묵시적 용매 모델은 Poisson Boltzmann(PB) 용매 모델인 것을 특징으로 하는 단백질-리간드 도킹구조의 예측방법.
The method according to claim 1,
Wherein the implicit solvent model is a Poisson Boltzmann (PB) solvent model.
제1항에 있어서,
상기 단백질은 G 단백질-결합 수용체(G protein-coupled receptor, GPCR)인 것을 특징으로 하는 단백질-리간드 도킹구조의 예측방법.
The method according to claim 1,
Wherein the protein is a G protein-coupled receptor (GPCR).
(a) 선택된 단백질-리간드 세트에 대하여 역장(force-field)-기초 도킹을 수행하여 다수의 포즈(pose)를 생성하는 단계; 및
(b) 상기 생성된 다수의 포즈에 대하여 묵시적 용매화(implicit) 모델 환경하에서 미리 정의된 양자역학 영역에 대한 양자역학 계산을 통해 가장 안정한 포즈를 선택하는 단계;를 포함하는 단백질-리간드 도킹구조의 예측방법.
(a) performing a force-field-based docking on a selected set of protein-ligands to generate a plurality of pauses; And
and (b) selecting the most stable pose through quantum computation for a predefined quantum mechanical region in an implicit model environment for the generated plurality of poses. Prediction method.
제6항에 있어서,
상기 (a) 단계에서, 포즈의 다양성을 보증하기 위하여 일정 범위 내에 유사한 포즈가 없도록 클러스터링 파라미터를 설정하는 것을 포함하는 것을 특징으로 하는 단백질-리간드 도킹구조의 예측방법.
The method according to claim 6,
The method of predicting a protein-ligand docking structure according to claim 1, wherein in the step (a), clustering parameters are set so that there is no similar pose within a certain range in order to guarantee diversity of pose.
제6항에 있어서,
상기 (b) 단계의 양자역학 계산은 양자역학 영역에 존재하는 단백질 잔기와 리간드의 원자 전하를 계산하는 것을 특징으로 하는 단백질-리간드 도킹구조의 예측방법.
The method according to claim 6,
Wherein the quantum mechanical calculation of step (b) comprises calculating the atomic charge of a protein residue and a ligand existing in a quantum mechanical region.
제8항에 있어서,
상기 (b) 단계에서, 반데르발스 에너지 및 상기 계산된 원자 전하로부터 도출된 단백질과 리간드 사이의 정전기 인력을 기반으로 가장 안정한 포즈를 선택하는 것을 특징으로 하는 단백질-리간드 도킹구조의 예측방법.
9. The method of claim 8,
Wherein in the step (b), the most stable pose is selected based on the van der Waals energy and the electrostatic attraction between the ligand and the protein derived from the calculated atomic charge.
제6항에 있어서,
상기 (b) 단계에서, 속박된(constrained) 단백질 원자에 대한 기하학적 구조(geometry) 최적화를 5회 이하로 반복 수행하는 것을 특징으로 하는 단백질-리간드 도킹구조의 예측방법.
The method according to claim 6,
Ligand docking structure, wherein in step (b) geometry optimization for constrained protein atoms is repeated no more than 5 times.
KR1020170117720A 2017-09-14 2017-09-14 Protein-ligand docking prediction method using quantum mechanics calculation and solvation effect KR102174746B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170117720A KR102174746B1 (en) 2017-09-14 2017-09-14 Protein-ligand docking prediction method using quantum mechanics calculation and solvation effect

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170117720A KR102174746B1 (en) 2017-09-14 2017-09-14 Protein-ligand docking prediction method using quantum mechanics calculation and solvation effect

Publications (2)

Publication Number Publication Date
KR20190030365A true KR20190030365A (en) 2019-03-22
KR102174746B1 KR102174746B1 (en) 2020-11-05

Family

ID=65949629

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170117720A KR102174746B1 (en) 2017-09-14 2017-09-14 Protein-ligand docking prediction method using quantum mechanics calculation and solvation effect

Country Status (1)

Country Link
KR (1) KR102174746B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114446383A (en) * 2022-01-24 2022-05-06 电子科技大学 Quantum computation-based ligand-protein interaction prediction method

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
D. Bartuzi 외, "Recent Advances and Applications of Molecular Docking to G Protein-Coupled Receptors", Molecules 22, 340, 2017.02.22.* *
H. Watanabe 외, "Incorporation of solvation effects into the fragment molecular orbital calculations with the Poisson-Boltzmann equation", Chemical Physics Letters 500, pp.116-119, 2010.10.21.* *
M. Nowosielski 외, "The MM2QM Tool for Combining Docking, Molecular Dynamics, Molecular Mechanics, and Quantum Mechanics", J. of Computational Chemistry, 34, pp.750-756, 2013.* *
U. Ryde, "Ligand-Binding Affinity Estimates Supported by Quantum-Mechanical Methods", Chemical Reviews, 116, pp.5520-5566, 2016.04.14.* *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114446383A (en) * 2022-01-24 2022-05-06 电子科技大学 Quantum computation-based ligand-protein interaction prediction method
CN114446383B (en) * 2022-01-24 2023-04-21 电子科技大学 Quantum calculation-based ligand-protein interaction prediction method

Also Published As

Publication number Publication date
KR102174746B1 (en) 2020-11-05

Similar Documents

Publication Publication Date Title
Gilson et al. Calculation of protein-ligand binding affinities
Cournia et al. Relative binding free energy calculations in drug discovery: recent advances and practical considerations
Huang et al. Ensemble docking of multiple protein structures: considering protein structural variations in molecular docking
Wang et al. Flexible ligand docking: a multistep strategy approach
Yuriev et al. Improvements, trends, and new ideas in molecular docking: 2012–2013 in review
De Bakker et al. Ab initio construction of polypeptide fragments: Accuracy of loop decoy discrimination by an all‐atom statistical potential and the AMBER force field with the Generalized Born solvation model
Kellogg et al. Role of conformational sampling in computing mutation‐induced changes in protein structure and stability
Lang et al. DOCK 6: Combining techniques to model RNA–small molecule complexes
Chen et al. Modeling protein− ligand binding by mining minima
Zhu et al. Refining homology models by combining replica‐exchange molecular dynamics and statistical potentials
Lenselink et al. Selecting an optimal number of binding site waters to improve virtual screening enrichments against the adenosine A2A receptor
Haider et al. Combining solvent thermodynamic profiles with functionality maps of the Hsp90 binding site to predict the displacement of water molecules
Wahl et al. Assessing the predictive power of relative binding free energy calculations for test cases involving displacement of binding site water molecules
Kim et al. Incorporating QM and solvation into docking for applications to GPCR targets
Li et al. Discovery of novel checkpoint kinase 1 inhibitors by virtual screening based on multiple crystal structures
Kurkcuoglu et al. Pre‐and post‐docking sampling of conformational changes using ClustENM and HADDOCK for protein‐protein and protein‐DNA systems
Motta et al. Modeling binding with large conformational changes: key points in ensemble-docking approaches
Andér et al. Ligand binding to the voltage-gated Kv1. 5 potassium channel in the open state—docking and computer simulations of a homology model
Lagarias et al. Discovery of novel adenosine receptor antagonists through a combined structure-and ligand-based approach followed by molecular dynamics investigation of ligand binding mode
Beuming et al. Docking and virtual screening strategies for GPCR drug discovery
Sabbadin et al. Perturbation of fluid dynamics properties of water molecules during G protein-coupled receptor–ligand recognition: the human A2A adenosine receptor as a key study
Májek et al. A coarse‐grained potential for fold recognition and molecular dynamics simulations of proteins
Kim et al. Prediction of the Three‐Dimensional Structure for the Rat Urotensin II Receptor, and Comparison of the Antagonist Binding Sites and Binding Selectivity between Human and Rat Receptors from Atomistic Simulations
Xiang et al. Prediction of side‐chain conformations on protein surfaces
Paulsen et al. Evaluation of free energy calculations for the prioritization of macrocycle synthesis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right