JP7277378B2 - 化合物を同定するための方法 - Google Patents
化合物を同定するための方法 Download PDFInfo
- Publication number
- JP7277378B2 JP7277378B2 JP2019556665A JP2019556665A JP7277378B2 JP 7277378 B2 JP7277378 B2 JP 7277378B2 JP 2019556665 A JP2019556665 A JP 2019556665A JP 2019556665 A JP2019556665 A JP 2019556665A JP 7277378 B2 JP7277378 B2 JP 7277378B2
- Authority
- JP
- Japan
- Prior art keywords
- findings
- binding
- binding interaction
- compound
- target protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1089—Design, preparation, screening or analysis of libraries using computer algorithms
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/10—Libraries containing peptides or polypeptides, or derivatives thereof
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/64—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Evolutionary Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Pharmacology & Pharmacy (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioethics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Evolutionary Computation (AREA)
Description
バーチャルスクリーニング法は、所与の標的に利用可能なスクリーニング選択肢を拡大することが可能であり、最適化の成功の可能性を増大させうる。バーチャルスクリーニングは、最適化のための出発点として使用される、複数の足場を同定するための、迅速かつ廉価な方法でありうる。バーチャルスクリーニングは一般に、バーチャルデータをもたらすのに、公知の実験データとの比較に依拠するので、使用される、実験により決定されたデータセットのサイズにより、能力が限定される。したがって、従来のハイスループットスクリーニング法を置きかえるために、コンピュータによる予測において十分な信頼度をもたらすように、ロバストなコンピュータ法を極めて大規模なデータセットと組み合わせた方法が必要とされている。
(a)候補化合物のセットを表現するフィジカルコンピューティングデバイス内で、標的タンパク質についての、複数の結合相互作用知見を提供する工程であって、
複数の結合相互作用知見のうちの少なくとも90%が、標的タンパク質と、化合物の識別をコード化するヌクレオチドタグを含む化合物との結合相互作用を表現する
工程と;
(b)複数の結合相互作用知見を使用して、候補化合物について推定される結合相互作用を生成するのにコンピューティングデバイスを使用する工程と;
(c)最大推定結合相互作用により表示しランク付けすることが可能な候補化合物リストについての出力を得る工程と
を含む方法を実装するように、フィジカルコンピューティングデバイスを方向付けるための、実行可能な命令をその上に記憶させた、コンピュータ可読媒体を提供する。
(a)候補化合物のセットを表現するフィジカルコンピューティングデバイス内で、標的タンパク質についての、複数の結合相互作用知見を提供する工程であって、
複数の結合相互作用知見のうちの少なくとも90%が、標的タンパク質と、化合物の識別をコード化するヌクレオチドタグを含む化合物との結合相互作用を表現する
工程と;
(b)複数の結合相互作用知見を使用して、候補化合物について推定される結合相互作用を生成するのにコンピューティングデバイスを使用する工程と;
(c)最大推定結合相互作用により表示しランク付けすることが可能な候補化合物リストについての出力を得る工程と
を含む方法を実装するように、デバイスを方向付けるための、実行可能な命令によりプログラムされたフィジカルコンピューティングデバイスを提供する。
本明細書で使用される「信頼性スコア」とは、候補化合物と、推定値を作成するのに利用されるデータセット内の1つまたは1つより多い化合物との構造的類似性に基づき、候補化合物について推定される結合相互作用の信頼度を指し示す計算を指す。
本発明は、化学的実体、1つまたは1つより多いタグ、ならびに第1の化学的実体、および1つまたは1つより多いタグと作動的に関連するヘッドピースを含む、コード化される化学的実体を利用する方法を特徴とする。下記では、化学的実体、ヘッドピース、タグ、連結、および二官能性スペーサーについてさらに記載する。
本発明の方法において利用されるコード化化合物(例えば、低分子)は、1つまたは1つより多いビルディングブロックを含むことが可能であり、任意選択で、1つまたは1つより多い足場を含む。
コード化される化学的実体内では、ヘッドピースは、各化学的実体を、そのコード化オリゴヌクレオチドタグに、作動的に連結する。一般に、ヘッドピースは、さらに誘導体化されうる、少なくとも2つの官能基を有する、出発オリゴヌクレオチドであり、第1の官能基は、第1の化学的実体(またはその構成要素)を、ヘッドピースに作動的に連結し、第2の官能基は、1つまたは1つより多いタグを、ヘッドピースに作動的に連結する。二官能性のスペーサーを、任意選択で、ヘッドピースと、化学的実体との間のスペーシング部分として使用することができる。
本明細書で記載されるオリゴヌクレオチドタグ(例えば、タグまたはヘッドピースの部分またはテールピースの部分)を使用して、分子、化学的実体の部分、構成要素(例えば、足場またはビルディングブロック)の付加、ライブラリー内のヘッドピース、ライブラリーの識別、1つまたは1つより多いライブラリーメンバーの使用(例えば、ライブラリーのアリコート内のメンバーの使用)、および/またはライブラリーメンバーの由来(例えば、由来配列の使用による)など、任意の有用な情報をコード化することができる。
本発明の連結は、情報をコード化するオリゴヌクレオチドの間(例えば、ヘッドピースとタグとの間、2つのタグの間、またはタグとテールピースとの間など)に存在する。例示的連結は、ホスホジエステル、ホスホネート、およびホスホロチオエートを含む。一部の実施形態では、ポリメラーゼは、1つまたは1つより多い連結を通して、読み取る能力または移動する能力が低減される。ある特定の実施形態では、化学結合は、一リン酸基および/またはヒドロキシル基、光反応基、挿入部分、架橋オリゴヌクレオチド、または可逆性の共反応基などの化学反応基のうちの1つまたは1つより多いものを含む。
ヘッドピースと、化学的実体との間の二官能性スペーサーを変動させて、適切なスペーシング部分をもたらし、かつ/またはヘッドピースの、有機溶媒中溶解度を増大させることができる。ヘッドピースを、低分子ライブラリーとカップリングさせうる、多種多様なスペーサーが市販されている。スペーサーは、典型的に、直鎖状鎖または分枝状鎖からなり、C1~10のアルキル、原子1~10個のヘテロアルキル、C2~10のアルケニル、C2~10のアルキニル、C5~10のアリール、原子3~20個の環式系もしくは多環式系、ホスホジエステル、ペプチド、オリゴ糖、オリゴヌクレオチド、オリゴマー、ポリマー、またはポリアルキルグリコール(例えば、-(CH2CH2O)nCH2CH2-[ここで、nは、1~50の整数である]などのポリエチレングリコール基)またはこれらの組合せを含みうる。
本発明は、アセンブルされたタグ配列の配列と、化学的実体の構造単位(またはビルディングブロック)の配列との間で、コード化関係を確立しうるように、複合体のヌクレオチド配列を決定することを含む方法を特徴とする。特に、化学的実体の識別および/または履歴を、オリゴヌクレオチド内の塩基の配列から推定することができる。この方法を使用すると、多様な化学的実体またはメンバー(例えば、低分子またはペプチド)を含むライブラリーを、特定のタグ配列でアドレス指定することができる。
本発明の方法は、オリゴヌクレオチドタグによりコード化される、多様な数の化学的実体を有するライブラリーを利用しうる。ビルディングブロックおよびコード化DNAタグの例は、そのビルディングブロックおよびタグが、本明細書に参照により援用される、米国特許出願公開第2007/0224607号において見出される。
例えば、Kdを決定することにより、化合物の、タンパク質への結合を決定するための、複数の確立された技術的方法が存在する。化合物の、標的タンパク質への結合を検出または定量化するための方法は、例えば、吸光度、蛍光、ラマン散乱、リン発光、発光、ルシフェラーゼアッセイ、および放射能を含む。例示的技法は、表面プラズモン共鳴(SPR)および蛍光偏光(FP)を含む。SPRは、化合物が、この金属表面上に固定化されているタンパク質に結合するときの、金属表面の反射率の変化を測定するのに対し、FPは、入射光の偏光喪失を使用して、化合物について、それがタンパク質に結合したときのタンブリング速度の変化を測定する。一部の実施形態では、本発明の方法を使用して、標的タンパク質に結合することが予測される候補化合物の結合を、実験により決定するのに、これらの方法を使用することができる。
標的タンパク質(例えば、哺乳動物標的タンパク質もしくは真菌標的タンパク質などの真核生物標的タンパク質、または細菌標的タンパク質などの原核生物標的タンパク質)とは、疾患状態または疾患状態の症候を媒介するタンパク質である。こうして、所望の治療効果は、その活性をモジュレートすること(阻害するか、または増大させること)により達成することができる。
TBX19、TBX2、TBX20、TBX21、TBX4、TBX5、AR、ESR1、ESRRA、ESRRB、ESRRG、HNF4A、NR2C2、NR2E1、NR2F1、NR2F6、NR3C1、NR3C2、NR4A2、RARA、RARB、RARG、RORA、RXRA、RXRB、RXRG、THRA、THRB、VDR、GATA3、GATA4、またはGATA5、またはC-myc、Max、Stat3、アンドロゲン受容体、C-Jun、C-Fox、N-Myc、L-Myc、MITF、Hif-1アルファ、Hif-2アルファ、Bcl6、E2F1、NF-カッパB、Stat5、またはER(coact)によりコード化される転写因子などの転写因子である。ある特定の実施形態では、標的タンパク質は、TrkA、P2Y14、mPEGS、ASK1、ALK、Bcl-2、BCL-XL、mSIN1、RORγt、IL17RA、eIF4E、TLR7R、PCSK9、IgER、CD40、CD40L、Shn-3、TNFR1、TNFR2、IL31RA、OSMR、IL12β1、2、タウ、FASN、KCTD6、KCTD9、Raptor、Rictor、RALGAPA、RALGAPB、アネキシンファミリーメンバー、BCOR、NCOR、ベータカテニン、AAC11、PLD1、PLD2、Frizzled 7、RaLP、,MLL-1、Myb、Ezh2、RhoGD 12、EGFR、CTLA4R、GCGC(coact)、AdiponectinR2、GPR81、IMPDH2、IL-4R、IL-13R、IL-1R、IL2-R、IL-6R、IL-22R、TNF-R、TLR4、Nrlp3、またはOTRである。
データの収集および統計の生成
一部の実施形態では、本発明バーチャルスクリーニング法における工程は、標的タンパク質に対する、DNAコード化ライブラリー選択実験(例えば、アフィニティーベースの実験)に由来するデータの収集を伴う。選択データを、DNA配列として読み出し、次いで、統計学的に読出し、例えば、配列カウントへと集約する。統計への集約は、一般的なコード化化合物、例えば、DNAによりコード化される推定化学構造(インスタンスレベル)、またはこのコード化された化学反応の、部分的亜構造(モノシントン、ジシントン、またはトリシントンのレベル)を群分けすることに基づく。化合物または部分的化合物が、標的に結合するのかどうか(結合剤であるのかどうか)の決定は、1つまたは1つより多い選択条件から、シーケンシングにより導出される統計についてのカットオフ値を使用して下す。真の、基底をなす低分子/タンパク質結合を反映する、有意な統計を収集するために、選択条件1つ当たり数百万~数千万(なおまたは数億)の配列を使用する。
当該技術分野では、機械学習法が公知であり、例えば、非限定的な機械学習法は、ナイーブベイズ、ランダムフォレスト、決定木、サポートベクターマシン、ニューラルネット、およびディープラーニングを含む。
本発明の一部の実施形態では、分子表現を使用して、推定される結合計算を生成する。分子表現は、例えば、トポロジカル表現、静電表現、幾何学表現、または量子化学表現を含む。トポロジカル表現は、原子、特徴または官能基、およびそれらの接続性(例えば、フィンガープリント、接続表、分子接続性、および/または分子グラフ表現)に基づきうる。静電表現は、例えば、表面電子情報を含む。幾何学表現は、例えば、ファーマコフォア、ファーマコフォアフィンガープリント、形状ベースのフィンガープリント、および/または原子、特徴、もしくは官能基を使用する3D分子座標である。一部の実施形態では、量子化学表現を使用する。一部の実施形態では、電子的分子表現は、化学フィンガープリントである。
一部の実施形態では、生成されるモデルは、候補化合物が、陽性もしくは陰性であることを指し示す二値スコア、または候補化合物が、活性/結合について陽性もしくは陰性である可能性についての、モデルの評価を指し示す確率スコア(例えば、0~1)をもたらすであろう。次いで、この値を使用して、所与の分子についての選択/不選択の判定(二値の場合)を下すか、または候補化合物(確率スコア)の優先順位決定のために情報を提供することができる。
ライブラリーのセットに由来する可溶型エポキシドヒドロラーゼ(sEH)についての選択データを使用して、いくつかの機械学習モデル(ランダムフォレスト、ナイーブベイズ、またはニューラルネットワーク)のうちの1つをトレーニングし、次いで、これを使用して、同じ標的に対するトレーニングセット内に含まれなかったライブラリーに由来する分子の選択行動を予測した。トレーニングセット内で使用されるライブラリーは、25,844,065個の化合物を伴う、直鎖状ペプチドライブラリー、3,976,320個の化合物を伴う、3サイクルのピラゾールライブラリー、5,079,459個の化合物を伴う、2サイクルのピリジンライブラリー、および1,511,399,304個の化合物を伴う、4サイクルのマクロサイクルライブラリーを含んだ。予測セット内で使用されるライブラリーは、221,580,000個の化合物を伴う、3サイクルの直鎖状ペプチドライブラリー、285,917,292個の化合物を伴う、3サイクルのピリジンライブラリー、および1,622,820個の化合物を伴う、2サイクルのベンズイミダゾールライブラリーを含んだ。
sEHについて、実施例1と同じライブラリーからの選択データを、機械学習アルゴリズム(RF、MLP、ディープラーニング)と共に使用して、モデルをトレーニングし、かつ、作製し、これを使用して、DNAコード化ライブラリー内で見出されない分子の活性を予測した。例えば、データをフィードし、従来のハイスループットスクリーニング(HTS)実験(すなわち、10K~1Mの分子におけるロボットテスト)において調べた分子の活性を予測しうるモデルを作製する。10,000~100,000またはこれより多い分子による初期リストから、リスト(例えば、数百個の化合物)を生成するためのフィルターとして、モデルによる予測を適用する。目標は、最終的なリストが、初期セット内で見出される、基調となる活性分子率を超えて、大幅(10倍~100倍)にエンリッチされるように、この短いリスト内で分子を同定することである。
予測の最適化
所与の1つまたは複数の標的について、HTSデータの既知のセットが存在する。高予測率を達成するために、複数のパラメータ設定について調べる。実際、高予測率は、HTS結果に対する予測への微調整の結果である。次いで、HTSを使用して、適用可能性を確認することにより、モデルを使用して、新規の化合物または既存の化合物(例えば、市販の化合物ライブラリーまたは既存の私製の化合物ライブラリー)を予測することができる。次いで、ランダム試料の基調の活性率に関わらない、予測セット内の高活性分子率、例えば、1%または10%より多い活性分子を期待して、これらの分子を調べることができる。
予測の最適化
所与の標的に対する選択であるが、異なる条件(例えば、異なるタンパク質断片、突然変異体、アイソフォームを使用する条件、近縁の標的を使用する条件、公知の低分子競合体を使用する条件など)下の選択に由来するデータを使用して、モデルをトレーニングするのに使用されるトレーニングセット内で、陽性データの規定を、さらに精緻化する。
予測の最適化
数十~数百のタンパク質標的、突然変異体、アイソフォームなどに対する選択に由来するデータを、マシン学習モデルをトレーニングするための陽性例または陰性例を規定するために、一連のさらなるデータ列として使用する。
当業者には、本発明の範囲および精神から逸脱しない限りにおいて、記載された本発明の方法およびシステムの、多様な改変および変更が明らかであろう。具体的な、所望の実施形態との関係で、本発明について記載してきたが、特許請求される本発明は、このような具体的実施形態に、不当に限定されるべきではないことを理解されたい。実際、本発明を実行するための、記載された方式の、多様な改変であって、医学、薬理学の分野、または関連分野における当業者に明らかな改変は、本発明の範囲内にあることを意図する。
Claims (32)
- (a)候補化合物のセットを表現するフィジカルコンピューティングデバイス内で、標的タンパク質についての、複数の結合相互作用知見を提供する工程であって、
それぞれの結合相互作用知見が、実験により決定された、標的タンパク質とトレーニングセット化合物との間の結合相互作用または結合相互作用の欠如であり、それぞれのトレーニングセット化合物は、トレーニングセット化合物の識別をコード化するヌクレオチドタグを含み、複数の結合相互作用知見のうちの少なくとも90%が、標的タンパク質とトレーニングセット化合物との結合相互作用を表現し、さらに複数の結合相互作用知見が少なくとも250,000の結合相互作用知見を含む
工程と;
(b)機械学習アルゴリズムおよび工程(a)の複数の結合相互作用知見を用いてモデルをトレーニングする工程と;
(c)標的タンパク質と候補化合物のセットとの間の推定結合相互作用を生成するのにコンピューティングデバイスおよび工程(b)のモデルを使用する工程であって、候補化合物がトレーニングセット化合物と異なる工程と;
(d)推定結合相互作用により表示しランク付けされる候補化合物のリストを出力する工程と
を含む、コンピューターに実装される、標的タンパク質と候補化合物のセットとの間の結合相互作用を同定およびランク付けするための方法。 - 複数の結合相互作用知見が、少なくとも100万の結合相互作用知見を含む、請求項1に記載の方法。
- 複数の結合相互作用知見のうちの少なくとも95%が、標的タンパク質と、化合物の識別をコード化するヌクレオチドタグを含むトレーニングセット化合物との結合相互作用を表現する、請求項1または2に記載の方法。
- 複数の結合相互作用知見のうちの少なくとも99%が、標的タンパク質と、化合物の識別をコード化するヌクレオチドタグを含むトレーニングセット化合物との結合相互作用を表現する、請求項1から3のいずれか一項に記載の方法。
- 化合物の識別をコード化するヌクレオチドタグを含む複数のトレーニングセット化合物を、標的タンパク質と同時に接触させることにより、複数の結合相互作用知見のうちの少なくとも50%が決定された、請求項1から4のいずれか一項に記載の方法。
- 1つまたは1つより多いさらなる標的タンパク質について、1つまたは1つより多いさらなる複数の結合相互作用知見を提供することをさらに含み、さらなる複数の結合相互作用知見のうちの少なくとも50%が、さらなる標的タンパク質と、トレーニングセット化合物との結合相互作用を表現し、かつ、さらなる標的タンパク質が標的タンパク質の突然変異体またはアイソフォームである、請求項1から5のいずれか一項に記載の方法。
- 候補化合物リストが、1つまたは1つより多いさらなる標的タンパク質にわたる標的タンパク質に対する、候補化合物の選択性により表示しランク付けすることが可能である、請求項6に記載の方法。
- 1つまたは1つより多いさらなる標的タンパク質が、標的タンパク質の突然変異体である、請求項6または7に記載の方法。
- 1つまたは1つより多いネガティブコントロール実験について、1つまたは1つより多いさらなる複数の結合相互作用知見を提供することをさらに含み、さらなる複数の結合相互作用知見のうちの少なくとも50%が、標的タンパク質とのトレーニングセット化合物のネガティブコントロール実験を表現する、請求項1から8のいずれか一項に記載の方法。
- インターネットを介して、またはディスプレイデバイスへと、候補化合物リストを送信することをさらに含む、請求項1から9のいずれか一項に記載の方法。
- フィジカルコンピューティングデバイスが、インターネットを介してアクセスおよび操作される、請求項1から10のいずれか一項に記載の方法。
- 化学構造比較を使用して、推定される結合相互作用を生成する、請求項1から11のいずれか一項に記載の方法。
- 化学構造比較が、分子表現を利用する、請求項12に記載の方法。
- 分子表現が、化学フィンガープリントを含む、請求項13に記載の方法。
- 化学フィンガープリント分析が、ECFP6、FCFP6、ECFP4、MACCS、またはMorgan/Circular Fingerprintsである、請求項14に記載の方法。
- 候補化合物について推定される結合相互作用の各々の信頼性スコアを生成することをさらに含み、信頼性スコアが、候補化合物と、標的タンパク質についての複数の結合相互作用からの1つまたは1つより多い化合物との化学構造比較を使用して生成される、請求項1から15のいずれか一項に記載の方法。
- 信頼性スコアが、主成分分析を用いて生成される、請求項16に記載の方法。
- 候補化合物リストが、候補化合物について推定される結合相互作用の信頼性スコアにより表示しランク付けすることが可能である、請求項16または17に記載の方法。
- 候補化合物のセットについて、1つまたは1つより多い特性知見を提供することをさらに含む、請求項1から18のいずれか一項に記載の方法。
- 1つまたは1つより多い特性知見が、分子量および/またはclogPを含む、請求項19に記載の方法。
- 1つまたは1つより多い特性知見を利用して、推定される結合相互作用を生成する、請求項19または20に記載の方法。
- 候補化合物リストが、1つまたは1つより多い特性知見により表示しランク付けすることが可能である、請求項19から21のいずれか一項に記載の方法。
- (e)候補化合物のうちの1つまたは1つより多くを、候補化合物リストから合成することをさらに含む、請求項1から22のいずれか一項に記載の方法。
- 1つまたは1つより多い、合成された候補化合物を、標的タンパク質と接触させて、1つまたは1つより多い実験結合相互作用を決定することをさらに含む、請求項23に記載の方法。
- (a)候補化合物のセットを表現するフィジカルコンピューティングデバイス内で、標的タンパク質についての、複数の結合相互作用知見を提供する工程であって、
それぞれの結合相互作用知見が、実験により決定された、標的タンパク質とトレーニングセット化合物との間の結合相互作用または結合相互作用の欠如であり、それぞれのトレーニングセット化合物は、トレーニングセット化合物の識別をコード化するヌクレオチドタグを含み、複数の結合相互作用知見のうちの少なくとも90%が、標的タンパク質とトレーニングセット化合物との結合相互作用を表現し、さらに複数の結合相互作用知見が少なくとも250,000の結合相互作用知見を含む
工程と;
(b)機械学習アルゴリズムおよび工程(a)の複数の結合相互作用知見を用いてモデルをトレーニングする工程と;
(c)標的タンパク質と候補化合物のセットとの間の推定結合相互作用を生成するのにコンピューティングデバイスおよび工程(b)のモデルを使用する工程であって、候補化合物がトレーニングセット化合物と異なる工程と;
(d)推定結合相互作用により表示しランク付けされる候補化合物のリストを出力する工程と
を含む標的タンパク質と候補化合物のセットとの間の結合相互作用を同定およびランク付けするための方法を実装するように、フィジカルコンピューティングデバイスを方向付けるための、実行可能な命令をその上に記憶させた、コンピュータ可読媒体。 - 候補化合物のセットの表現を有するフィジカルコンピューティングデバイスであって、
(a)候補化合物のセットを表現するフィジカルコンピューティングデバイス内で、標的タンパク質についての、複数の結合相互作用知見を提供する工程であって、
それぞれの結合相互作用知見が、実験により決定された、標的タンパク質とトレーニングセット化合物との間の結合相互作用または結合相互作用の欠如であり、それぞれのトレーニングセット化合物は、トレーニングセット化合物の識別をコード化するヌクレオチドタグを含み、複数の結合相互作用知見のうちの少なくとも90%が、標的タンパク質とトレーニングセット化合物との結合相互作用を表現し、さらに複数の結合相互作用知見が少なくとも250,000の結合相互作用知見を含む
工程と;
(b)機械学習アルゴリズムおよび工程(a)の複数の結合相互作用知見を用いてモデルをトレーニングする工程と;
(c)標的タンパク質と候補化合物のセットとの間の推定結合相互作用を生成するのにコンピューティングデバイスおよび工程(b)のモデルを使用する工程であって、候補化合物がトレーニングセット化合物と異なる工程と;
(d)推定結合相互作用により表示しランク付けされる候補化合物のリストを出力する工程と
を含む標的タンパク質と候補化合物のセットとの間の結合相互作用を同定およびランク付けするための方法を実装するように、デバイスを方向付けるための、実行可能な命令によりプログラムされたフィジカルコンピューティングデバイス。 - 複数の結合相互作用知見が、少なくとも200万の結合相互作用知見を含む、請求項1から24のいずれか一項に記載の方法。
- 複数の結合相互作用知見が、少なくとも500万の結合相互作用知見を含む、請求項1から24および27のいずれか一項に記載の方法。
- 複数の結合相互作用知見が、少なくとも1000万の結合相互作用知見を含む、請求項1から24、27および28のいずれか一項に記載の方法。
- 複数の結合相互作用知見が、少なくとも2500万の結合相互作用知見を含む、請求項1から24および27から29のいずれか一項に記載の方法。
- 工程(b)が、ジシントン化合物解析を含む、請求項1から24および27から30のいずれか一項に記載の方法。
- 工程(c)が、ジシントン化合物解析を含む、請求項1から24および27から31のいずれか一項に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023076466A JP2023113620A (ja) | 2017-04-18 | 2023-05-08 | 化合物を同定するための方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762486692P | 2017-04-18 | 2017-04-18 | |
US62/486,692 | 2017-04-18 | ||
PCT/US2018/028050 WO2018195134A1 (en) | 2017-04-18 | 2018-04-18 | Methods for identifying compounds |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023076466A Division JP2023113620A (ja) | 2017-04-18 | 2023-05-08 | 化合物を同定するための方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020518898A JP2020518898A (ja) | 2020-06-25 |
JP7277378B2 true JP7277378B2 (ja) | 2023-05-18 |
Family
ID=63856100
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019556665A Active JP7277378B2 (ja) | 2017-04-18 | 2018-04-18 | 化合物を同定するための方法 |
JP2023076466A Pending JP2023113620A (ja) | 2017-04-18 | 2023-05-08 | 化合物を同定するための方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023076466A Pending JP2023113620A (ja) | 2017-04-18 | 2023-05-08 | 化合物を同定するための方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20200143903A1 (ja) |
EP (1) | EP3612545A4 (ja) |
JP (2) | JP7277378B2 (ja) |
CN (1) | CN110730822B (ja) |
AU (2) | AU2018256367A1 (ja) |
BR (1) | BR112019021786A2 (ja) |
EA (1) | EA201992476A1 (ja) |
MA (1) | MA51864A (ja) |
WO (1) | WO2018195134A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2020290510A1 (en) * | 2019-06-12 | 2022-02-03 | Quantum-Si Incorporated | Techniques for protein identification using machine learning and related systems and methods |
US20210303762A1 (en) * | 2020-03-31 | 2021-09-30 | International Business Machines Corporation | Expert-in-the-loop ai for materials discovery |
CN111863120B (zh) * | 2020-06-28 | 2022-05-13 | 深圳晶泰科技有限公司 | 晶体复合物的药物虚拟筛选***及方法 |
CN112086145B (zh) * | 2020-09-02 | 2024-04-16 | 腾讯科技(深圳)有限公司 | 一种化合物活性预测方法、装置、电子设备和存储介质 |
WO2023069592A1 (en) * | 2021-10-21 | 2023-04-27 | Google Llc | Multi-label neural architecture for modeling dna-encoded libraries data |
WO2023239720A1 (en) * | 2022-06-06 | 2023-12-14 | The Trustees Of Indiana University | Method of predicting ms/ms spectra and properties of chemical compounds |
US20240177012A1 (en) * | 2022-11-29 | 2024-05-30 | Insitro, Inc. | Molecular Docking-Enabled Modeling of DNA-Encoded Libraries |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001507675A (ja) | 1996-11-04 | 2001-06-12 | 3―ディメンショナル ファーマシューティカルズ インコーポレイテッド | 所望の特性を有する化合物を識別するシステム、方法、コンピュータ・プログラム製品 |
JP2005526518A (ja) | 2002-05-20 | 2005-09-08 | アブマクシス,インコーポレイティド | タンパク質ライブラリーのinsilico作成と選択 |
WO2006078228A1 (en) | 2002-09-16 | 2006-07-27 | Plexxikon, Inc. | Methods for the design of molecular scaffolds and ligands |
JP2015529449A (ja) | 2012-07-13 | 2015-10-08 | エックス−ケム インコーポレイテッド | ポリメラーゼによって読み取れないコードオリゴヌクレオチドリンケージを有するdnaコード化ライブラリー |
WO2016109423A1 (en) | 2014-12-30 | 2016-07-07 | X-Chem, Inc. | Methods for tagging dna-encoded libraries |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040010376A1 (en) * | 2001-04-17 | 2004-01-15 | Peizhi Luo | Generation and selection of protein library in silico |
CN105659087B (zh) * | 2013-06-13 | 2019-09-17 | 比奥德赛公司 | 筛选靶向靶生物实体的候选生物实体的方法 |
TW201629069A (zh) * | 2015-01-09 | 2016-08-16 | 霍普驅動生物科技股份有限公司 | 參與協同結合之化合物及其用途 |
-
2018
- 2018-04-18 WO PCT/US2018/028050 patent/WO2018195134A1/en unknown
- 2018-04-18 EA EA201992476A patent/EA201992476A1/ru unknown
- 2018-04-18 JP JP2019556665A patent/JP7277378B2/ja active Active
- 2018-04-18 BR BR112019021786A patent/BR112019021786A2/pt unknown
- 2018-04-18 MA MA051864A patent/MA51864A/fr unknown
- 2018-04-18 CN CN201880040438.9A patent/CN110730822B/zh active Active
- 2018-04-18 AU AU2018256367A patent/AU2018256367A1/en not_active Abandoned
- 2018-04-18 US US16/606,325 patent/US20200143903A1/en active Pending
- 2018-04-18 EP EP18788378.0A patent/EP3612545A4/en active Pending
-
2023
- 2023-05-08 JP JP2023076466A patent/JP2023113620A/ja active Pending
- 2023-07-18 AU AU2023206117A patent/AU2023206117A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001507675A (ja) | 1996-11-04 | 2001-06-12 | 3―ディメンショナル ファーマシューティカルズ インコーポレイテッド | 所望の特性を有する化合物を識別するシステム、方法、コンピュータ・プログラム製品 |
JP2005526518A (ja) | 2002-05-20 | 2005-09-08 | アブマクシス,インコーポレイティド | タンパク質ライブラリーのinsilico作成と選択 |
WO2006078228A1 (en) | 2002-09-16 | 2006-07-27 | Plexxikon, Inc. | Methods for the design of molecular scaffolds and ligands |
JP2015529449A (ja) | 2012-07-13 | 2015-10-08 | エックス−ケム インコーポレイテッド | ポリメラーゼによって読み取れないコードオリゴヌクレオチドリンケージを有するdnaコード化ライブラリー |
WO2016109423A1 (en) | 2014-12-30 | 2016-07-07 | X-Chem, Inc. | Methods for tagging dna-encoded libraries |
Non-Patent Citations (2)
Title |
---|
Santiago Vilar、ほか6名,Computational Drug Target Screening through Protein Interaction Profiles,SCIENTIFIC REPORTS [ONLINE],2016年11月15日,p.1-13,[検索日:2022/6/13],[URL:https://www.nature.ccom/articles/srep36969.pdf] |
Willy Decurtins、ほか7名,Automated screening for small organic ligands using DNA-encoded chemical libraries,Nature Protocols [ONLINE],第11巻,第4号,2016年04月30日,p.764-780(p.1-40),[検索日:2022/6/13],[URL:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6126613/pdf/emss-79202.pdf] |
Also Published As
Publication number | Publication date |
---|---|
EP3612545A4 (en) | 2021-01-13 |
AU2023206117A1 (en) | 2023-08-10 |
AU2018256367A1 (en) | 2019-11-28 |
EA201992476A1 (ru) | 2020-02-25 |
MA51864A (fr) | 2020-02-26 |
JP2020518898A (ja) | 2020-06-25 |
EP3612545A1 (en) | 2020-02-26 |
US20200143903A1 (en) | 2020-05-07 |
WO2018195134A1 (en) | 2018-10-25 |
CN110730822B (zh) | 2024-03-08 |
BR112019021786A2 (pt) | 2020-05-05 |
JP2023113620A (ja) | 2023-08-16 |
CN110730822A (zh) | 2020-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7277378B2 (ja) | 化合物を同定するための方法 | |
JP7057348B2 (ja) | 蛍光in situ配列決定を用いた単一アッセイに生体分子の検出を組み合わせる方法 | |
CN108368540B (zh) | 研究核酸的方法 | |
Boyle et al. | High-throughput biochemical profiling reveals sequence determinants of dCas9 off-target binding and unbinding | |
She et al. | Comprehensive and quantitative mapping of RNA–protein interactions across a transcribed eukaryotic genome | |
Jain et al. | Rules of RNA specificity of hnRNP A1 revealed by global and quantitative analysis of its affinity distribution | |
Minajigi et al. | A comprehensive Xist interactome reveals cohesin repulsion and an RNA-directed chromosome conformation | |
Metzker | Sequencing technologies—the next generation | |
Brenner et al. | Gene expression analysis by massively parallel signature sequencing (MPSS) on microbead arrays | |
Clark et al. | Design, synthesis and selection of DNA-encoded small-molecule libraries | |
AU2021261918A1 (en) | High-Throughput Single-Cell Transcriptome Libraries and Methods of Making and of Using | |
US20180340939A1 (en) | Multiplex analysis of single cell constituents | |
Ray et al. | Custom DNA microarrays reveal diverse binding preferences of proteins and small molecules to thousands of G-quadruplexes | |
KR20210134598A (ko) | 고-처리량 단일-핵 및 단일-세포 라이브러리 및 이의 제조 및 사용 방법 | |
US20200109446A1 (en) | Chip hybridized association-mapping platform and methods of use | |
Schneider et al. | Recording binding information directly into DNA-Encoded libraries using terminal deoxynucleotidyl transferase | |
Vaknin et al. | Molecular and experimental tools to design synthetic enhancers | |
US20210171937A1 (en) | Methods and compositions for protein and peptide sequencing | |
US20170312727A1 (en) | Analysis method on the basis of an array | |
Drees et al. | High-throughput selection and characterisation of aptamers on optical next-generation sequencers | |
Wang et al. | Comparative Study of DNA Barcode Integrity Evaluation Approaches in the Early-Stage Development of DNA-Compatible Chemical Transformation | |
EA042768B1 (ru) | Способы идентификации соединений | |
Rath et al. | Programmable design of functional ribonucleoprotein complexes | |
Philpott et al. | Highly accurate barcode and UMI error correction using dual nucleotide dimer blocks allows direct single-cell nanopore transcriptome sequencing | |
US20230016731A1 (en) | Affinity purification sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220621 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220921 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230307 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230508 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7277378 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |