KR102270554B1 - 폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 dna-코딩된 라이브러리 - Google Patents

폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 dna-코딩된 라이브러리 Download PDF

Info

Publication number
KR102270554B1
KR102270554B1 KR1020207023473A KR20207023473A KR102270554B1 KR 102270554 B1 KR102270554 B1 KR 102270554B1 KR 1020207023473 A KR1020207023473 A KR 1020207023473A KR 20207023473 A KR20207023473 A KR 20207023473A KR 102270554 B1 KR102270554 B1 KR 102270554B1
Authority
KR
South Korea
Prior art keywords
oligonucleotide
linkage
tag
nucleotides
group
Prior art date
Application number
KR1020207023473A
Other languages
English (en)
Other versions
KR20200100206A (ko
Inventor
안토니 디. 키프
알렉산더 리토브치크
매튜 에이. 클라크
Original Assignee
엑스-켐, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=49916571&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR102270554(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 엑스-켐, 인크. filed Critical 엑스-켐, 인크.
Publication of KR20200100206A publication Critical patent/KR20200100206A/ko
Application granted granted Critical
Publication of KR102270554B1 publication Critical patent/KR102270554B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1044Preparation or screening of libraries displayed on scaffold proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Saccharide Compounds (AREA)

Abstract

본 발명은 올리고뉴클레오티드-코딩된 라이브러리의 복합체 및 이러한 라이브러리를 태깅 및 사용하는 방법에 관한 것이다. 특히, 올리고뉴클레오티드 및 방법은 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 적어도 하나의 연결을 갖는 복합체를 포함할 수 있다.

Description

폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 DNA-코딩된 라이브러리 {DNA-ENCODED LIBRARIES HAVING ENCODING OLIGONUCLEOTIDE LINKAGES NOT READABLE BY POLYMERASES}
관련 출원에 대한 상호 참조
본원은 2012년 7월 13일에 출원된 미국 가출원 번호 61/671,406을 우선권 주장하며, 이는 그 전문이 본원에 참고로 포함된다.
일반적으로, 본 발명은 화합물의 DNA-코딩된 라이브러리, 및 이러한 라이브러리를 사용 및 생성하는 방법에 관한 것이다. 본 발명은 또한 이러한 라이브러리에 사용하기 위한 조성물에 관한 것이다.
DNA-코딩된 조합 라이브러리는 약물 발견에 있어서 많은 이점을 제공한다. 이들 라이브러리는 신속하게 스크리닝되고 조사될 수 있는 수많은 다양한 화합물을 제공할 수 있다. 복잡성을 추가로 증가시키기 위해, 발견 과정의 다양한 단계가 프로그램화되고 자동화될 수 있다. 이들 단계는 빌딩 블록을 원자 또는 다원자 스캐폴드에 부가하기 위한 다단계, 스플릿(split)-및-풀(pool) 합성의 사용, 및 합성 단계 및 빌딩 블록을 둘 다 코딩하는 올리고뉴클레오티드 태그를 부가하기 위한 효소적 및/또는 화학적 라이게이션의 사용을 포함한다.
이러한 이익에도 불구하고, 매우 크거나 복잡한 라이브러리가 합성되고 디컨볼루션되어야 하는 경우에는 많은 문제들이 제기될 수 있다. 라이브러리의 크기가 증가함에 따라, 강력하고 신속한 방법론을 사용하여 코딩 올리고뉴클레오티드 태그 라이게이션의 높은 수율을 제공하기 위한 개선된 방법이 필요할 수 있다. 다양한 반응 조건 하에서 라이브러리를 생성하기 위해서는 안정적인 올리고뉴클레오티드 구축물, 예컨대 높은 pH 및 승온 조건 하에서 안정적인 구축물이 유익할 것이다. 태그의 디컨볼루션을 단순화하기 위해, 태그의 서열은 DNA- 또는 RNA-의존성 폴리머라제에 의해 인식될 수 있고, 이로써 태그 집단의 집단통계는 주형-의존성 중합 및 서열 결정에 의해 결정될 수 있다. 이들 유익한 속성을 모두 갖는 라이브러리를 생성할 때 어려움이 제기될 수 있다. 따라서, 올리고뉴클레오티드-코딩된 라이브러리에서 소형 화합물을 스크리닝하고 확인하는 보다 강력하고 개선된 방법에 대한 필요성이 존재한다.
본 발명은 DNA-코딩된 라이브러리에서 사용하기 위한 복합체를 특징으로 하며, 여기서 이들 복합체는 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 하나 이상의 연결을 갖는다. 코딩된 영역 (예를 들어, 헤드피스, 하나 이상의 태그 및/또는 테일피스)의 아이덴티티를 발견하기 위해, 연결은 폴리머라제에 노출되기 이전에 역전되거나 또는 대안적으로 폴리머라제에 의해 우회된다. 이러한 연결은 태그의 모든 서열 정보는 포획할 수 없지만 (예를 들어, 본원에 기재된 바와 같은 예컨대 5'- 또는 3'-연결부 내), 태그의 코딩 서열 정보는 포획하는 임의의 유용한 방식으로 우회될 수 있다. 이러한 연결은 미스-태깅 발생률을 낮추고, 복합체 및 라이브러리 제조에 사용되는 연결의 수 및 종류를 확대하고, DNA-코딩된 복합체를 생성 및 스크리닝하는 비-효소적 방법을 제공할 수 있다. 이들 복합체 및 방법의 추가의 이점이 본원에 기재된다.
따라서, 한 측면에서, 본 발명은 하나 이상의 스캐폴드 또는 하나 이상의 빌딩 블록을 포함하는 화학 물질; 하나 이상의 스캐폴드 또는 빌딩 블록 중 적어도 하나의 아이덴티티를 코딩하는 제1 올리고뉴클레오티드 태그; 및 제1 관능기 및 제2 관능기를 가지며, 여기서 제1 관능기는 화학 물질과 작동가능하게 회합되고, 제2 관능기는 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 제1 연결을 통해 제1 태그와 작동가능하게 회합되는 것인 헤드피스를 포함하는 복합체를 특징으로 한다.
또 다른 측면에서, 본 발명은 하나 이상의 스캐폴드 또는 하나 이상의 빌딩 블록을 포함하는 화학 물질; n-1개의 연결을 가지며, 여기서 n은 1 내지 약 10의 정수이고, 각각의 연결은 2개의 인접한 태그 사이에 존재하고, 각각의 태그는 하나 이상의 스캐폴드 또는 빌딩 블록 중 적어도 하나의 아이덴티티를 코딩하는 것인 n개의 올리고뉴클레오티드 태그; 및 화학 물질과 작동가능하게 회합되는 제1 관능기 및 제1 연결을 통해 n개의 태그 중 적어도 하나와 작동가능하게 회합되는 제2 관능기를 갖는 헤드피스를 포함하며, 여기서 폴리머라제는 제1 연결 및 n-1개의 연결 중 적어도 하나를 판독 또는 전위하는 감소된 능력을 갖는 것인 복합체를 특징으로 한다.
일부 실시양태에서, n은 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 1 내지 12, 1 내지 15, 1 내지 18, 1 내지 20, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 2 내지 12, 2 내지 15, 2 내지 18, 2 내지 20, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 3 내지 12, 3 내지 15, 3 내지 18, 3 내지 20, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 4 내지 12, 4 내지 15, 4 내지 18 또는 4 내지 20이다.
일부 실시양태에서, 폴리머라제는 적어도 약 10% (예를 들어, 대조군과 비교하여 약 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 심지어 100%)의 제1 연결 및 n-1개의 연결을 판독 또는 전위하는 감소된 능력을 갖는다. 특정한 실시양태에서, 폴리머라제는 약 10% 내지 약 100%의 제1 연결 및 n-1개의 연결을 판독 또는 전위하는 감소된 능력을 갖는다 (예를 들어, 대조군과 비교하여 (예를 들어, 연결이 결여된 대조군 올리고뉴클레오티드와 비교하여) 20% 내지 100%, 25% 내지 100%, 50% 내지 100%, 75% 내지 100%, 90% 내지 100%, 95% 내지 100%, 10% 내지 95%, 20% 내지 95%, 25% 내지 95%, 50% 내지 95%, 75% 내지 95%, 90% 내지 95%, 10% 내지 90%, 20% 내지 90%, 25% 내지 90%, 50% 내지 90% 또는 75% 내지 90%).
일부 실시양태에서, 하나 이상의 태그는 하나 이상의 태그의 5'-말단에서의 5'-연결부 및 하나 이상의 태그의 3'-말단에서의 3'-연결부를 포함한다. 특정한 실시양태에서, 각각의 5'-연결부 및/또는 각각의 3'-연결부는 동일한 서열을 포함한다. 다른 실시양태에서, 각각의 5'-연결부 및/또는 각각의 3'-연결부는 상이한 서열을 포함한다.
일부 실시양태에서, 제1 연결 및/또는 n-1개의 연결은 적어도 약 3 옹스트롬 길이 (예를 들어, 적어도 약 5, 8, 10, 15, 20, 30, 35, 40, 50, 60, 65 또는 70 옹스트롬)이다. 일부 실시양태에서, 제1 연결 및/또는 n-1개의 연결은 약 30 옹스트롬 길이 미만 (예를 들어, 약 25, 20, 15 또는 10 옹스트롬 미만)이다.
일부 실시양태에서, DNA 폴리머라제 및/또는 RNA 폴리머라제 (예를 들어, 본원에 기재된 바와 같음)는 제1 연결 및/또는 n-1개의 연결을 판독 또는 전위하는 감소된 능력을 갖는다.
일부 실시양태에서, 약 10% (예를 들어, 약 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%) 미만의 제1 연결 및 n-1개의 연결은 효소적 연결을 포함한다. 일부 실시양태에서, 제1 연결 및 n-1개의 연결은 0% 내지 90%의 효소적 연결 (예를 들어, 약 0% 내지 40%, 0% 내지 45%, 0% 내지 50%, 0% 내지 55%, 0% 내지 60%, 0% 내지 65%, 0% 내지 70%, 0% 내지 75%, 0% 내지 80%, 0% 내지 85%, 0% 내지 90%, 0% 내지 95%, 0% 내지 96%, 0% 내지 97%, 0% 내지 98%, 0% 내지 99%, 5% 내지 40%, 5% 내지 45%, 5% 내지 50%, 5% 내지 55%, 5% 내지 60%, 5% 내지 65%, 5% 내지 70%, 5% 내지 75%, 5% 내지 80%, 5% 내지 85%, 5% 내지 90%, 5% 내지 95%, 5% 내지 96%, 5% 내지 97%, 5% 내지 98%, 5% 내지 99%, 10% 내지 40%, 10% 내지 45%, 10% 내지 50%, 10% 내지 55%, 10% 내지 60%, 10% 내지 65%, 10% 내지 70%, 10% 내지 75%, 10% 내지 80%, 10% 내지 85%, 10% 내지 90%, 10% 내지 95%, 10% 내지 96%, 10% 내지 97%, 10% 내지 98%, 10% 내지 99%, 15% 내지 40%, 15% 내지 45%, 15% 내지 50%, 15% 내지 55%, 15% 내지 60%, 15% 내지 65%, 15% 내지 70%, 15% 내지 75%, 15% 내지 80%, 15% 내지 85%, 15% 내지 90%, 15% 내지 95%, 15% 내지 96%, 15% 내지 97%, 15% 내지 98%, 15% 내지 99%, 20% 내지 40%, 20% 내지 45%, 20% 내지 50%, 20% 내지 55%, 20% 내지 60%, 20% 내지 65%, 20% 내지 70%, 20% 내지 75%, 20% 내지 80%, 20% 내지 85%, 20% 내지 90%, 20% 내지 95%, 20% 내지 96%, 20% 내지 97%, 20% 내지 98% 또는 20% 내지 99%)을 포함한다.
일부 실시양태에서, 제1 연결 및/또는 n-1개의 연결은 화학적 연결 (예를 들어, 화학-반응성 기, 광-반응성 기, 삽입성 모이어티 또는 교차-연결 올리고뉴클레오티드)을 포함한다. 특정한 실시양태에서, 적어도 1개 (예를 들어, 2개, 3개, 4개, 5개 또는 그 초과)의 화학-반응성 기, 광-반응성 기 또는 삽입성 모이어티는 태그의 5'-말단에서의 또는 그에 근접한 5'-연결부 및/또는 태그의 3'-말단에서의 또는 그에 근접한 3'-연결부에 존재한다. 다른 실시양태에서, 5'-연결부의 적어도 하나의 서열은 인접한 3'-연결부의 서열에 대해 상보적이거나 또는 동일하거나 또는 충분히 유사하여 상보적 올리고뉴클레오티드에의 혼성화를 가능하게 한다. 일부 실시양태에서, 적어도 10% (예를 들어, 약 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 심지어 100%)의 제1 연결 및/또는 n-1개의 연결은 화학적 연결이다. 다른 실시양태에서, 약 10% 내지 약 100%의 제1 연결 및 n-1개의 연결 (예를 들어, 20% 내지 100%, 25% 내지 100%, 50% 내지 100%, 75% 내지 100%, 90% 내지 100%, 95% 내지 100%, 10% 내지 95%, 20% 내지 95%, 25% 내지 95%, 50% 내지 95%, 75% 내지 95%, 90% 내지 95%, 10% 내지 90%, 20% 내지 90%, 25% 내지 90%, 50% 내지 90% 또는 75% 내지 90%)은 화학적 연결이다.
일부 실시양태에서, 화학-반응성 기는 임의로 치환된 알키닐 기 및 임의로 치환된 아지도 기의 쌍; 4 π-전자계를 갖는 임의로 치환된 디엔 및 2 π-전자계를 갖는 임의로 치환된 친디엔체 또는 임의로 치환된 친헤테로디엔체의 쌍; 친핵체 및 변형 헤테로시클릴 친전자체의 쌍; 임의로 치환된 아미노 기 및 알데히드 또는 케톤 기의 쌍; 임의로 치환된 아미노 기 및 카르복실산 기의 쌍; 임의로 치환된 히드라진 및 알데히드 또는 케톤 기의 쌍; 임의로 치환된 히드록실아민 및 알데히드 또는 케톤 기의 쌍; 친핵체 및 임의로 치환된 알킬 할라이드의 쌍; 백금 착물; 알킬화제; 또는 푸란-변형된 뉴클레오티드 (예를 들어, 본원에 기재된 임의의 것)로부터 선택된다.
일부 실시양태에서, 광-반응성 기는 삽입성 모이어티, 프소랄렌 유도체, 임의로 치환된 시아노비닐카르바졸 기 (예를 들어, 3-시아노비닐카르바졸 기, 예컨대 3-시아노비닐카르바졸-1'-β-데옥시리보시드-5'-트리포스페이트), 임의로 치환된 비닐카르바졸 기 (예를 들어, 본원에 기재된 바와 같은 아미도비닐카르바졸 기, 카르복시비닐카르바졸 기 또는 C2-7 알콕시카르보닐비닐카르바졸 기), 임의로 치환된 시아노비닐 기, 임의로 치환된 아크릴아미드 기, 임의로 치환된 디아지린 기, 임의로 치환된 벤조페논 또는 임의로 치환된 아지드 기 (예를 들어, 본원에 기재된 임의의 것)를 포함한다.
일부 실시양태에서, 삽입성 모이어티는 프소랄렌 유도체 (예를 들어, 프소랄렌, 8-메톡시프소랄렌 또는 4-히드록시메틸-4,5,8-트리메틸-프소랄렌 (HMT-프소랄렌)), 알칼로이드 유도체 (예를 들어, 베르베린, 팔마틴, 코랄린, 상귀나린 (예를 들어, 그의 이미늄 또는 알칸올아민 형태, 또는 아리스톨로락탐-β-D-글루코시드), 에티듐 양이온 (예를 들어, 브로민화에티듐), 아크리딘 유도체 (예를 들어, 프로플라빈, 아크리플라빈 또는 암사크린), 안트라시클린 유도체 (예를 들어, 독소루비신, 에피루비신, 다우노루비신 (다우노마이신), 이다루비신 및 아클라루비신) 또는 탈리도미드이다.
일부 실시양태에서, 화학적 연결은 교차-연결 올리고뉴클레오티드를 포함하며, 여기서 교차-연결 올리고뉴클레오티드의 5'-말단에서의 적어도 5개의 뉴클레오티드 서열은 하나 이상의 태그의 3'-말단에서의 적어도 5개의 뉴클레오티드 서열에 대해 상보적이거나 또는 동일하거나 또는 충분히 유사하여 상보적 올리고뉴클레오티드에의 혼성화를 가능하게 하며, 교차-연결 올리고뉴클레오티드의 3'-말단에서의 적어도 5개의 뉴클레오티드 서열은 하나 이상의 태그의 5'-말단에서의 적어도 5개의 뉴클레오티드 서열에 대해 상보적이거나 또는 동일하거나 또는 충분히 유사하여 상보적 올리고뉴클레오티드에의 혼성화를 가능하게 한다. 특정한 실시양태에서, 하나 이상의 태그의 3'-말단은 3'-연결부를 포함한다. 특정한 실시양태에서, 하나 이상의 태그의 5'-말단은 5'-연결부를 포함한다.
일부 실시양태에서, 교차-연결 올리고뉴클레오티드의 5'-말단 및/또는 3'-말단은 가역적 공-반응성 기 (예를 들어, 본원에 기재된 바와 같은 시아노비닐카르바졸 기, 시아노비닐 기, 아크릴아미드 기, 티올 기 또는 비닐 술폰 기)를 포함한다.
일부 실시양태에서, 3'-연결부 및/또는 5'-연결부는 가역적 공-반응성 기 (예를 들어, 본원에 기재된 바와 같은 시아노비닐카르바졸 기, 시아노비닐 기, 아크릴아미드 기, 티올 기 또는 비닐 술폰 기)를 포함한다.
일부 실시양태에서, 화학 물질은 이관능성 스페이서 (예를 들어, 본원에 기재된 임의의 것)를 통해 헤드피스에 작동가능하게 회합된다. 다른 실시양태에서, 화학 물질은 헤드피스에 공유적으로 부착된다. 특정한 실시양태에서, 헤드피스는 이중-가닥 올리고뉴클레오티드, 단일-가닥 올리고뉴클레오티드 또는 헤어핀 올리고뉴클레오티드로 이루어진 군으로부터 선택되는 올리고뉴클레오티드를 포함한다. 일부 실시양태에서, 헤드피스는 프라이머-결합 영역을 포함한다.
본원에 기재된 임의의 실시양태에서, 복합체 또는 방법은 하나 이상의 제1 라이브러리-확인 태그(들), 사용 태그(들) 및/또는 기원 태그(들)를 추가로 포함한다. 일부 실시양태에서, 복합체 또는 방법은 2 내지 20개의 태그 (예를 들어, 2 내지 10개의 빌딩 블록 또는 스캐폴드 태그, 1개의 제1 라이브러리-확인 태그, 1개의 임의적인 사용 태그 및 1개의 기원 태그)를 포함한다. 일부 실시양태에서, 복합체 또는 방법은 5 내지 75개의 뉴클레오티드 (예를 들어, 본원에 기재된 바와 같은 예컨대 약 40 또는 50개의 뉴클레오티드)를 포함한다.
본원에 기재된 임의의 실시양태에서, 개별 태그 세트 내에서의 각각의 태그는 거의 동일한 질량을 포함한다.
본원에 기재된 임의의 실시양태에서, 복합체는 RNA, DNA, 변형된 DNA 및/또는 변형된 RNA (예를 들어, 본원에 기재된 바와 같은 동일한 올리고뉴클레오티드 내에서의 PNA, LNA, GNA, TNA 또는 그의 혼합물)를 포함한다.
본원에 기재된 임의의 실시양태에서, 복합체 또는 방법은 테일피스를 추가로 포함한다.
또 다른 측면에서, 본 발명은 본원에 기재된 하나 이상의 복합체를 포함하는 라이브러리를 특징으로 한다. 일부 실시양태에서, 라이브러리는 다수의 헤드피스를 포함한다. 다른 실시양태에서, 다수의 헤드피스의 각각의 헤드피스는 동일한 서열 영역 (예를 들어, 프라이머-결합 영역) 및 상이한 코딩 영역 (예를 들어, 라이브러리의 사용, 라이브러리의 기원, 라이브러리의 아이덴티티, 라이브러리의 히스토리, 연결, 스페이서, 또는 제1 성분의 부가를 코딩하는 제1 태그, 또는 혼성화, 증폭 또는 서열분석 기술을 용이하게 하는 올리고뉴클레오티드 서열)을 포함한다. 특정한 실시양태에서, 라이브러리는 약 102 내지 1020개의 복합체 (예를 들어, 약 102 내지 103, 102 내지 104, 102 내지 105, 102 내지 106, 102 내지 107, 102 내지 108, 102 내지 109, 102 내지 1010, 102 내지 1011, 102 내지 1012, 102 내지 1013, 102 내지 1014, 102 내지 1015, 102 내지 1016, 102 내지 1017, 102 내지 1018, 102 내지 1019, 104 내지 105, 104 내지 106, 104 내지 107, 104 내지 108, 104 내지 109, 104 내지 1010, 104 내지 1011, 104 내지 1012, 104 내지 1013, 104 내지 1014, 104 내지 1015, 104 내지 1016, 104 내지 1017, 104 내지 1018, 104 내지 1019, 104 내지 1020, 105 내지 106, 105 내지 107, 105 내지 108, 105 내지 109, 105 내지 1010, 105 내지 1011, 105 내지 1012, 105 내지 1013, 105 내지 1014, 105 내지 1015, 105 내지 1016, 105 내지 1017, 105 내지 1018, 105 내지 1019 또는 105 내지 1020개의 복합체)를 포함한다. 일부 실시양태에서, 각각의 복합체는 상이하다.
또 다른 측면에서, 본 발명은 코딩된 화학 물질을 포함하는 제1 라이브러리를 태깅하는 방법이며, 상기 방법은 (a) 제1 관능기 및 제2 관능기를 갖는 헤드피스를 제공하는 단계 (예를 들어, 여기서 헤드피스는 정보를 임의로 코딩함); (b) 헤드피스의 제1 관능기를 화학 물질의 제1 성분에 결합시키며, 여기서 헤드피스는 제1 성분에 직접적으로 연결되거나 또는 헤드피스는 이관능성 스페이서에 의해 제1 성분에 간접접으로 연결되는 것인 단계; 및 (c) 헤드피스의 제2 관능기를 제1 연결을 통해 제1 올리고뉴클레오티드 태그에 결합시켜 복합체를 형성하며, 여기서 폴리머라제는 제1 연결을 판독 또는 전위하는 감소된 능력을 갖는 것인 단계를 포함하며; 여기서 단계 (b) 및 (c)는 임의의 순서로 수행될 수 있고, 제1 태그는 단계 (b)의 결합 반응을 코딩하는 것이며, 이에 의해 태깅된 라이브러리를 제공하는 방법을 특징으로 한다.
또 다른 측면에서, 본 발명은 코딩된 화학 물질을 포함하는 제1 라이브러리를 태깅하는 방법이며, 상기 방법은 (a) 제1 관능기 및 제2 관능기를 갖는 헤드피스를 제공하는 단계 (예를 들어, 여기서 헤드피스는 정보를 임의로 코딩함); (b) 헤드피스의 제1 관능기를 화학 물질의 제1 성분에 결합시키며, 여기서 헤드피스는 제1 성분에 직접적으로 연결되거나 또는 헤드피스는 이관능성 스페이서에 의해 제1 성분에 간접적으로 연결되는 것인 단계; (c) 헤드피스의 제2 관능기를 제1 연결을 통해 제1 올리고뉴클레오티드 태그에 결합시키는 단계; (d) 화학 물질의 nc개의 추가의 성분을 결합시키며, 여기서 nc는 1 내지 10의 정수인 단계; 및 (e) nt개의 연결을 갖는 nt개의 추가의 올리고뉴클레오티드 태그를 결합시켜 복합체를 형성하며, 여기서 nt는 1 내지 10의 정수이고, 각각의 연결은 2개의 인접한 태그 사이에 존재하고, 각각의 태그는 성분 중 적어도 하나의 아이덴티티를 코딩하는 것인 단계를 포함하며; 여기서 폴리머라제는 제1 연결 및 nt개의 연결 중 적어도 하나를 판독 또는 전위하는 감소된 능력을 갖고; 단계 (b) 및 (c)는 임의의 순서로 수행될 수 있고, 제1 태그는 단계 (b)의 결합 반응을 코딩하고; 단계 (d) 및 (e)는 임의의 순서로 수행될 수 있고, 각각의 추가의 태그는 단계 (d)의 각각의 추가의 성분의 결합 반응을 코딩하는 것이며, 이에 의해 태깅된 라이브러리를 제공하는 방법을 특징으로 한다.
일부 실시양태에서, nc 및 nt는 각각 독립적으로 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 1 내지 12, 1 내지 15, 1 내지 18, 1 내지 20, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 2 내지 12, 2 내지 15, 2 내지 18, 2 내지 20, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 3 내지 12, 3 내지 15, 3 내지 18, 3 내지 20, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 4 내지 12, 4 내지 15, 4 내지 18 또는 4 내지 20의 정수이다.
일부 실시양태에서, 폴리머라제는 적어도 약 10%의 제1 연결 및 nt개의 연결 (예를 들어, 대조군과 비교하여, 약 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 심지어 100%의 제1 연결 및 nt개의 연결)을 판독 또는 전위하는 감소된 능력을 갖는다. 특정한 실시양태에서, 제1 연결 및 nt개의 연결을 판독 또는 전위하는 감소된 능력은 약 10 내지 약 100% (예를 들어, 대조군과 비교하여 (예를 들어, 연결이 결여된 대조군 올리고뉴클레오티드와 비교하여) 20% 내지 100%, 25% 내지 100%, 50% 내지 100%, 75% 내지 100%, 90% 내지 100%, 95% 내지 100%, 10% 내지 95%, 20% 내지 95%, 25% 내지 95%, 50% 내지 95%, 75% 내지 95%, 90% 내지 95%, 10% 내지 90%, 20% 내지 90%, 25% 내지 90%, 50% 내지 90% 또는 75% 내지 90%)이다.
일부 실시양태에서, 제1 성분 및/또는 추가의 성분은 스캐폴드 또는 빌딩 블록을 포함한다.
일부 실시양태에서, 단계 (b)는 헤드피스를 이관능성 스페이서를 통해 제1 성분에 간접적으로 결합시키는 것을 포함한다.
일부 실시양태에서, 방법은 사용 태그, 기원 태그 및/또는 제1 라이브러리-확인 태그를 복합체에 결합시키는 것을 추가로 포함한다. 특정한 실시양태에서, 방법은 제2 라이브러리를 제공하는 것 및 제1 라이브러리와 제2 라이브러리를 조합하는 것을 추가로 포함한다. 일부 실시양태에서, 방법은 테일피스를 복합체에 결합시키는 것을 추가로 포함한다.
일부 실시양태에서, 결합 단계는 화학-반응성 기, 광-반응성 기, 삽입성 모이어티 또는 교차-연결 올리고뉴클레오티드 (예를 들어, 본원의 복합체 중 임의의 것에 대해 본원에 기재된 바와 같은 것)를 포함한다. 특정한 실시양태에서, 방법은 하나 이상의 단계에서 스플릿-및-풀 합성을 수행하는 것, 하나 이상의 복합체를 분리하는 것 및/또는 하나 이상의 복합체를 정제하는 것을 추가로 포함한다.
본원에 기재된 임의의 방법에서, 방법은 본원에 기재된 임의의 복합체 또는 본원에 기재된 임의의 라이브러리를 생성한다.
또 다른 측면에서, 본 발명은 다수의 화학 물질을 스크리닝하는 방법이며, 상기 방법은 (a) 본원에 기재된 임의의 복합체 및/또는 본원에 기재된 라이브러리와 표적을 접촉시키는 단계; 및 (b) 대조군과 비교하여 표적에 대해 미리 결정된 특성을 갖는 하나 이상의 복합체를 선택함으로써 화학 물질을 스크리닝하는 단계를 포함하는 방법을 특징으로 한다.
일부 실시양태에서, 미리 결정된 특성은 대조군과 비교하여 표적 (예를 들어, 본원에 기재된 바와 같은 생물학적 표적)에 대한 증가된 결합을 포함한다.
일부 실시양태에서, 단계 (a) 이전에, 하나 이상의 릴레이 프라이머를 상기 복합체와 어닐링시키며, 여기서 상기 하나 이상의 릴레이 프라이머는 상기 제1 연결 및/또는 n-1개의 연결에 걸쳐있는 것인 작업; 폴리머라제를 사용하여 상기 릴레이 프라이머를 연장시켜 올리고뉴클레오티드 단편을 생성하는 작업; 및 상기 올리고뉴클레오티드 단편을 라이게이션시켜 주형을 생성하는 작업으로 이루어진 목록으로부터 선택되는 하나 이상의 작업을 수행한다.
또 다른 측면에서, 본 발명은 본원에 기재된 임의의 복합체의 뉴클레오티드 서열을 결정하는 방법이며, 상기 방법은 (a) 하나 이상의 릴레이 프라이머를 복합체와 어닐링시키며, 여기서 하나 이상의 릴레이 프라이머는 제1 연결 및/또는 n-1개의 연결에 걸쳐있는 것인 단계; (b) 폴리머라제를 사용하여 릴레이 프라이머를 연장시켜 올리고뉴클레오티드 단편을 생성하는 단계; (c) 올리고뉴클레오티드 단편을 라이게이션시켜 주형을 생성하는 단계; (d) 폴리머라제 연쇄 반응에 의해 주형을 임의로 증폭시켜 증폭된 믹스를 생성하는 단계; 및 (e) 임의로 증폭된 믹스를 서열분석하여 복합체의 서열을 결정하는 단계를 포함하는 방법을 특징으로 한다.
일부 실시양태에서, 복합체는 하나 이상의 태그의 5'-말단에서의 5'-연결부 및 하나 이상의 태그의 3'-말단에서의 3'-연결부를 포함하고, 하나 이상의 릴레이 프라이머 각각은 인접한 5'- 및 3'-연결부에 혼성화한다. 특정한 실시양태에서, 각각의 5'-연결부는 동일한 서열을 포함하고/거나, 각각의 3'-연결부는 동일한 서열을 포함한다. 일부 실시양태에서, 5'-연결부의 적어도 하나의 서열은 인접한 3'-연결부의 서열에 대해 상보적이거나 (예를 들어, 혼성화 조건 하에서 5'- 및 3'-연결부 사이에 듀플렉스를 형성함) 또는 동일하거나 또는 충분히 유사하여 상보적 올리고뉴클레오티드에의 혼성화를 가능하게 한다. 추가 실시양태에서, 방법은 5'-연결부를 인접한 3'-연결부에 혼성화시키는 것을 포함한다. 일부 실시양태에서, 5'- 및 3'-연결부 사이의 특정 접합부에 대한 각각의 릴레이 프라이머 (예를 들어, 그에 의해 3-헬릭스 접합부를 형성함)는 동일한 서열을 포함한다.
또 다른 측면에서, 본 발명은 본원에 기재된 임의의 복합체의 뉴클레오티드 서열을 결정하는 방법이며, 상기 방법은 (a) 화학적 연결을 포함하는 복합체를 제공하며, 여기서 화학적 연결은 2개의 인접한 태그 사이의 접합부에 걸쳐있고 하나 이상의 가역적 공-반응성 기를 통해 2개의 인접한 태그와 작동가능하게 회합되는 교차-연결 올리고뉴클레오티드인 단계; (b) 교차-연결 올리고뉴클레오티드 (예를 들어, 본원에 기재된 임의의 것)를 방출시켜 주형을 생성하는 단계; (c) 폴리머라제 연쇄 반응에 의해 주형을 임의로 증폭시켜 증폭된 믹스를 생성하는 단계; 및 (d) 임의로 증폭된 믹스를 서열분석하여 복합체의 서열을 결정하는 단계를 포함하는 방법을 특징으로 한다. 일부 실시양태에서, 교차-연결 올리고뉴클레오티드의 부분은 2개의 인접한 태그의 말단에 혼성화하여 2개의 인접한 태그 사이에 닉 또는 갭을 생성한다.
추가 실시양태에서, 방법은 단계 (b) 이전에 화학적 과정 또는 효소적 과정 (예를 들어, 5'-인산화)을 사용하여 태그를 라이게이션시키는 것을 포함한다.
일부 실시양태에서, 방법은 임의적인 증폭 단계 또는 서열분석 단계 이전에 주형을 복구하는 단계를 추가로 포함한다. 특정한 실시양태에서, 복구 단계는 제1 연결 및/또는 n-1개의 연결 중 적어도 하나를 폴리머라제에 의해 판독 또는 전위될 수 있는 복구된 연결이 되도록 변형시키는 것을 포함한다. 일부 실시양태에서, 폴리머라제는 복구된 연결을 (예를 들어, 대조군, 예컨대 복구되지 않은 제1 연결 및 n-1개의 연결을 갖는 대조군 올리고뉴클레오티드와 비교하여) 적어도 50% (예를 들어, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 심지어 100%) 판독 또는 전위할 수 있다. 특정한 실시양태에서, 폴리머라제는 복구된 연결을 약 10% 내지 약 100% (예를 들어, 대조군과 비교하여 (예를 들어, 복구되지 않은 제1 연결 및 n-1개의 연결을 갖는 대조군 올리고뉴클레오티드와 비교하여) 20% 내지 100%, 25% 내지 100%, 50% 내지 100%, 75% 내지 100%, 90% 내지 100%, 95% 내지 100%, 10% 내지 95%, 20% 내지 95%, 25% 내지 95%, 50% 내지 95%, 75% 내지 95%, 90% 내지 95%, 10% 내지 90%, 20% 내지 90%, 25% 내지 90%, 50% 내지 90% 및 75% 내지 90%) 판독 또는 전위할 수 있다. 특정한 실시양태에서, 복구 단계는 주형에 복구 효소 (예를 들어, 본원에 기재된 바와 같은 포토리아제, 글리코실라제, 엔도뉴클레아제, Flap 엔도뉴클레아제, 아퓨린/아피리미딘 (AP) 엔도뉴클레아제, 폴리 ADP 리보스 폴리머라제 또는 메틸트랜스퍼라제)를 제공하는 것을 포함한다.
임의의 상기 실시양태에서, 방법 또는 복합체는 단일-가닥 분자만을 포함할 수 있으며, 여기서 헤드피스, 제1 태그 및/또는 하나 이상의 추가의 태그는 단일-가닥이다.
임의의 상기 실시양태에서, 방법은 본원에 기재된 바와 같이, 라이브러리를 다양화하거나 또는 라이브러리의 구성원을 조사하는 하나 이상의 임의적인 단계를 추가로 포함한다. 일부 실시양태에서, 방법은 관심 치료 단백질에 결합하거나 그를 불활성화시키는 소형 약물-유사 라이브러리 구성원을 확인하는 것을 추가로 포함한다. 다른 실시양태에서, 방법은 라이브러리의 적어도 하나의 구성원이 표적에 결합하는데 적합한 조건 하에서 라이브러리의 구성원을 생물학적 표적과 접촉시키는 단계, 표적에 결합하지 않은 하나 이상의 라이브러리 구성원을 제거하는 단계, 및 표적에 회합된 하나 이상의 올리고뉴클레오티드 태그를 분석하는 단계를 추가로 포함한다.
본원에 기재된 바와 같은, 단일-가닥 분자의 사용은 많은 이익을 가질 수 있다. 따라서, 본원에 기재된 임의의 실시양태에서, 방법 및 복합체는 하나 이상의 이중-가닥 분자 (예를 들어, 이중-가닥 헤드피스 또는 이중-가닥 태그)를 포함하는 방법과 비교하여 질량이 감소되고/거나, 용해도가 증가되고/거나 (예를 들어, 유기 용매 중), 비용이 감소되고/거나, 반응성이 증가되고/거나, 표적 접근가능성이 증가되고/거나, 유체역학적 반경이 감소되고/거나, 분석적 평가의 정확도가 증가된 헤드피스, 하나 이상의 태그, 복합체, 화학 물질, 분자, 또는 태깅된 라이브러리의 임의의 구성원을 포함한다. 일부 실시양태에서, 한 세트의 태그 내의 각각의 태그 (예를 들어, 제1 태그 또는 후속 태그 (존재하는 경우))는 거의 동일한 질량을 갖는다 (예를 들어, 각각의 태그는 2개 또는 그 초과의 태그 사이의 평균 질량으로부터 약 +/- 10%의 질량을 가짐). 특정한 실시양태에서, 태그는 이중-가닥 태그 (예를 들어, 약 15,000 달톤 미만, 약 14,000 달톤, 약 13,000 달톤 또는 약 12,000 달톤의 질량을 갖는 이중-가닥 태그)와 비교하여 감소된 질량 (예를 들어, 약 15,000 달톤, 약 14,000 달톤, 약 13,000 달톤, 약 12,000 달톤, 약 11,000 달톤, 약 10,000 달톤, 약 9,000 달톤, 약 8,000 달톤, 약 7,500 달톤, 약 7,000 달톤, 약 6,000 달톤, 약 6,500 달톤, 약 5,000 달톤, 약 5,500 달톤, 약 4,000 달톤, 약 4,500 달톤 또는 약 3,000 달톤)을 갖는다. 다른 실시양태에서, 태그는 이중-가닥 태그 (예를 들어, 약 20개 뉴클레오티드 미만, 약 19개 뉴클레오티드 미만, 약 18개 뉴클레오티드 미만, 약 17개 뉴클레오티드 미만, 약 16개 뉴클레오티드 미만, 약 15개 뉴클레오티드 미만, 약 14개 뉴클레오티드 미만, 약 13개 뉴클레오티드 미만, 약 12개 뉴클레오티드 미만, 약 11개 뉴클레오티드 미만, 약 10개 뉴클레오티드 미만, 약 9개 뉴클레오티드 미만, 약 8개 뉴클레오티드 미만 또는 약 7개 뉴클레오티드 미만의 길이를 갖는 이중-가닥 태그)와 비교하여 감소된 길이를 갖는다. 일부 실시양태에서, 라이브러리의 하나 이상의 태그 또는 구성원은 (예를 들어, 선택 단계, 예컨대 크기 배제 크로마토그래피를 사용한 선택 동안) 프라이머-결합 영역 및/또는 불변 영역이 결여되어 있다. 일부 실시양태에서, 라이브러리의 하나 이상의 태그 또는 구성원은 감소된 불변 영역 (예를 들어, 약 30개 뉴클레오티드 미만, 약 25개 뉴클레오티드 미만, 약 20개 뉴클레오티드 미만, 약 19개 뉴클레오티드 미만, 약 18개 뉴클레오티드 미만, 약 17개 뉴클레오티드 미만, 약 16개 뉴클레오티드 미만, 약 15개 뉴클레오티드 미만, 약 14개 뉴클레오티드 미만, 약 13개 뉴클레오티드 미만, 약 12개 뉴클레오티드 미만, 약 11개 뉴클레오티드 미만, 약 10개 뉴클레오티드 미만, 약 9개 뉴클레오티드 미만, 약 8개 뉴클레오티드 미만 또는 약 7개 뉴클레오티드 미만의 길이)을 갖는다. 다른 실시양태에서, 방법은 분자, 화학 물질의 부분, 단계의 결합 반응 (예를 들어, 화학적 또는 효소적 라이게이션) 또는 라이브러리의 아이덴티티를 코딩하는 헤드피스를 포함하며, 여기서 코딩 헤드피스는 이러한 정보를 코딩하기 위해 추가의 태그를 필요로 하지 않는다.
임의의 상기 실시양태에서, 올리고뉴클레오티드 (예를 들어, 헤드피스, 제1 태그 및/또는 하나 이상의 추가의 태그 (존재하는 경우))는 라이브러리의 아이덴티티를 코딩한다. 일부 실시양태에서, 올리고뉴클레오티드 (예를 들어, 헤드피스, 제1 태그 및/또는 하나 이상의 추가의 태그 (존재하는 경우))는 제1 라이브러리-확인 서열을 포함하며, 여기서 서열은 제1 라이브러리의 아이덴티티를 코딩한다. 특정한 실시양태에서, 올리고뉴클레오티드는 제1 라이브러리-확인 태그이다. 일부 실시양태에서, 방법은 제1 라이브러리-확인 태그를 제공하며, 여기서 태그는 제1 라이브러리를 코딩하는 서열을 포함하는 것인 단계 및/또는 제1 라이브러리-확인 태그를 복합체에 결합시키는 단계를 포함한다. 일부 실시양태에서, 방법은 제2 라이브러리를 제공하는 단계 및 제1 라이브러리를 제2 라이브러리와 조합하는 단계를 포함한다. 추가 실시양태에서, 방법은 제2 라이브러리-확인 태그를 제공하는 것을 포함하며, 여기서 태그는 제2 라이브러리를 코딩하는 서열을 포함한다. 일부 실시양태에서, 2개 초과의 라이브러리가 조합된다 (예를 들어, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 라이브러리).
임의의 상기 실시양태에서, 코딩된 정보는 하나 이상의 태그 또는 하나 초과의 태그의 조합에서 제공된다. 일부 실시양태에서, 코딩된 정보는 하나 초과의 태그 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 태그)에 의해 제시된다. 일부 실시양태에서, 코딩된 정보는 하나 초과의 태그에 의해 제시되며, 여기서 모든 코딩 태그는 코딩 서열 내에 함유된다 (예를 들어, 정보를 코딩하기 위해 특정 태그 조합을 사용하는 것에 의함). 일부 실시양태에서, 코딩된 정보는 하나 초과의 태그에 의해 제시되며, 여기서 모두 미만의 코딩 태그는 코딩 서열 내에 함유된다 (예를 들어, 개별 코딩 서열 내에서 코딩하기 위해 하나 초과의 개별 태그의 한 세트로부터 하나의 태그를 사용하는 것에 의함). 일부 실시양태에서, 코딩된 정보는 직교형으로 제시되며, 여기서 코딩된 정보는 하나 초과의 태그와 개별 라이브러리 구성원 내에 함유되어 있는 모두 미만의 코딩 정보의 조합에 의해 제시되어, 하나 초과의 상응하는 라이브러리 구성원은 코딩된 정보의 디컨볼루션을 위해 서열분석될 필요가 있다. 일부 실시양태에서, 하나 초과의 화학적 빌딩 블록은 단일 태그에 의해 제시된다 (예를 들어, 라세미 빌딩 블록의 경우에, 예컨대 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 빌딩 블록이 단일 태그에 의해 제시됨).
임의의 상기 실시양태에서, 올리고뉴클레오티드 (예를 들어, 헤드피스 및/또는 하나 이상의 빌딩 블록)는 라이브러리의 구성원의 사용 (예를 들어, 본원에 기재된 바와 같은 선택 단계 또는 결합 단계에서의 사용)을 코딩한다. 일부 실시양태에서, 올리고뉴클레오티드 (예를 들어, 헤드피스, 제1 태그 및/또는 하나 이상의 추가의 태그 (존재하는 경우))는 사용 서열을 포함하며, 여기서 서열은 하나 이상의 단계 (예를 들어, 선택 단계 및/또는 결합 단계)에서 라이브러리 내의 구성원의 하위세트의 사용을 코딩한다. 특정한 실시양태에서, 올리고뉴클레오티드는 사용 서열을 포함하는 사용 태그이다. 일부 실시양태에서, 올리고뉴클레오티드 (예를 들어, 헤드피스 및/또는 하나 이상의 올리고뉴클레오티드 태그)는 라이브러리 (예를 들어, 라이브러리의 특정한 일부 내의 것)의 구성원의 기원을 코딩한다. 일부 실시양태에서, 올리고뉴클레오티드 (예를 들어, 헤드피스, 제1 태그 및/또는 하나 이상의 추가의 태그 (존재하는 경우))는 기원 서열 (예를 들어, 약 10, 9, 8, 7 또는 6개의 뉴클레오티드의 길이를 갖는 무작위 또는 축중성 서열)을 포함하며, 여기서 서열은 라이브러리의 다른 구성원과 비교하여, 라이브러리 내의 구성원의 기원을 코딩한다. 특정한 실시양태에서, 올리고뉴클레오티드는 기원 서열을 포함하는 기원 태그이다. 일부 실시양태에서, 방법은 사용 태그 및/또는 기원 태그를 복합체에 연결, 결합 또는 작동가능하게 회합시키는 것을 추가로 포함한다.
본원의 임의의 실시양태에서, 방법, 조성물 및 복합체는 테일피스를 임의로 포함하며, 여기서 테일피스는 본원에 기재된 바와 같은 하나 이상의 라이브러리-확인 서열, 사용 서열 또는 기원 서열을 포함한다. 특정한 실시양태에서, 방법은 테일피스 (예를 들어, 하나 이상의 라이브러리-확인 서열, 사용 서열 또는 기원 서열을 포함하는 것)을 복합체에 연결, 결합 또는 작동가능하게 회합시키는 것을 추가로 포함한다.
임의의 상기 실시양태에서, 방법, 조성물 및 복합체 또는 그의 부분 (예를 들어, 헤드피스, 제1 태그 및/또는 하나 이상의 추가의 태그 (존재하는 경우))은 반-, 감소된- 또는 비-수성 (예를 들어, 유기) 조건 중에서 용해도를 지지하는 변형을 포함한다. 일부 실시양태에서, 이관능성 스페이서, 헤드피스 또는 하나 이상의 태그는 유기 조건 중에서 상기 DNA-코딩된 화학적 라이브러리의 구성원의 용해도를 증가시키기 위해 변형된다. 일부 실시양태에서, 변형은 하나 이상의 알킬 쇄, 폴리에틸렌 글리콜 단위, 양전하를 갖는 분지형 종 또는 소수성 고리 구조이다. 일부 실시양태에서, 변형은 소수성 모이어티를 갖는 하나 이상의 변형된 뉴클레오티드 (예를 들어, T 또는 C 염기의 C5 위치에서 지방족 쇄로 변형된 것, 예컨대 5'-디메톡시트리틸-N4-디이소부틸아미노메틸리덴-5-(1-프로피닐)-2'-데옥시시티딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 5'-디메톡시트리틸-5-(1-프로피닐)-2'-데옥시우리딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 5'-디메톡시트리틸-5-플루오로-2'-데옥시우리딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 및 5'-디메톡시트리틸-5-(피렌-1-일-에티닐)-2'-데옥시우리딘 또는 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트) 또는 소수성 모이어티를 갖는 삽입물 (예를 들어, 아조벤젠)을 포함한다. 일부 실시양태에서, 라이브러리의 구성원은 약 1.0 내지 약 2.5 (예를 들어, 약 1.0 내지 약 1.5, 약 1.0 내지 약 2.0, 약 1.3 내지 약 1.5, 약 1.3 내지 약 2.0, 약 1.3 내지 약 2.5, 약 1.5 내지 약 2.0, 약 1.5 내지 약 2.5 또는 약 2.0 내지 약 2.5)의 옥탄올:물 계수를 갖는다.
임의의 상기 실시양태에서, 헤드피스, 테일피스, 제1 태그, 하나 이상의 추가의 태그, 라이브러리-확인 태그, 사용 태그, 및/또는 기원 태그는, 존재하는 경우에, 약 5 내지 약 75개 뉴클레오티드 (예를 들어, 5 내지 7개 뉴클레오티드, 5 내지 8개 뉴클레오티드, 5 내지 9개 뉴클레오티드, 5 내지 10개 뉴클레오티드, 5 내지 11개 뉴클레오티드, 5 내지 12개 뉴클레오티드, 5 내지 13개 뉴클레오티드, 5 내지 14개 뉴클레오티드, 5 내지 15개 뉴클레오티드, 5 내지 16개 뉴클레오티드, 5 내지 17개 뉴클레오티드, 5 내지 18개 뉴클레오티드, 5 내지 19개 뉴클레오티드, 5 내지 20개 뉴클레오티드, 5 내지 30개 뉴클레오티드, 5 내지 40개 뉴클레오티드, 5 내지 50개 뉴클레오티드, 5 내지 60개 뉴클레오티드, 5 내지 70개 뉴클레오티드, 6 내지 7개 뉴클레오티드, 6 내지 8개 뉴클레오티드, 6 내지 9개 뉴클레오티드, 6 내지 10개 뉴클레오티드, 6 내지 11개 뉴클레오티드, 6 내지 12개 뉴클레오티드, 6 내지 13개 뉴클레오티드, 6 내지 14개 뉴클레오티드, 6 내지 15개 뉴클레오티드, 6 내지 16개 뉴클레오티드, 6 내지 17개 뉴클레오티드, 6 내지 18개 뉴클레오티드, 6 내지 19개 뉴클레오티드, 6 내지 20개 뉴클레오티드, 7 내지 8개 뉴클레오티드, 7 내지 9개 뉴클레오티드, 7 내지 10개 뉴클레오티드, 7 내지 11개 뉴클레오티드, 7 내지 12개 뉴클레오티드, 7 내지 13개 뉴클레오티드, 7 내지 14개 뉴클레오티드, 7 내지 15개 뉴클레오티드, 7 내지 16개 뉴클레오티드, 7 내지 17개 뉴클레오티드, 7 내지 18개 뉴클레오티드, 7 내지 19개 뉴클레오티드, 7 내지 20개 뉴클레오티드, 8 내지 9개 뉴클레오티드, 8 내지 10개 뉴클레오티드, 8 내지 11개 뉴클레오티드, 8 내지 12개 뉴클레오티드, 8 내지 13개 뉴클레오티드, 8 내지 14개 뉴클레오티드, 8 내지 15개 뉴클레오티드, 8 내지 16개 뉴클레오티드, 8 내지 17개 뉴클레오티드, 8 내지 18개 뉴클레오티드, 8 내지 19개 뉴클레오티드, 8 내지 20개 뉴클레오티드, 9 내지 10개 뉴클레오티드, 9 내지 11개 뉴클레오티드, 9 내지 12개 뉴클레오티드, 9 내지 13개 뉴클레오티드, 9 내지 14개 뉴클레오티드, 9 내지 15개 뉴클레오티드, 9 내지 16개 뉴클레오티드, 9 내지 17개 뉴클레오티드, 9 내지 18개 뉴클레오티드, 9 내지 19개 뉴클레오티드, 9 내지 20개 뉴클레오티드, 10 내지 11개 뉴클레오티드, 10 내지 12개 뉴클레오티드, 10 내지 13개 뉴클레오티드, 10 내지 14개 뉴클레오티드, 10 내지 15개 뉴클레오티드, 10 내지 16개 뉴클레오티드, 10 내지 17개 뉴클레오티드, 10 내지 18개 뉴클레오티드, 10 내지 19개 뉴클레오티드, 10 내지 20개 뉴클레오티드, 10 내지 30개 뉴클레오티드, 10 내지 40개 뉴클레오티드, 10 내지 50개 뉴클레오티드, 10 내지 60개 뉴클레오티드, 10 내지 70개 뉴클레오티드, 10 내지 75개 뉴클레오티드, 11 내지 12개 뉴클레오티드, 11 내지 13개 뉴클레오티드, 11 내지 14개 뉴클레오티드, 11 내지 15개 뉴클레오티드, 11 내지 16개 뉴클레오티드, 11 내지 17개 뉴클레오티드, 11 내지 18개 뉴클레오티드, 11 내지 19개 뉴클레오티드, 11 내지 20개 뉴클레오티드, 12 내지 13개 뉴클레오티드, 12 내지 14개 뉴클레오티드, 12 내지 15개 뉴클레오티드, 12 내지 16개 뉴클레오티드, 12 내지 17개 뉴클레오티드, 12 내지 18개 뉴클레오티드, 12 내지 19개 뉴클레오티드, 12 내지 20개 뉴클레오티드, 13 내지 14개 뉴클레오티드, 13 내지 15개 뉴클레오티드, 13 내지 16개 뉴클레오티드, 13 내지 17개 뉴클레오티드, 13 내지 18개 뉴클레오티드, 13 내지 19개 뉴클레오티드, 13 내지 20개 뉴클레오티드, 14 내지 15개 뉴클레오티드, 14 내지 16개 뉴클레오티드, 14 내지 17개 뉴클레오티드, 14 내지 18개 뉴클레오티드, 14 내지 19개 뉴클레오티드, 14 내지 20개 뉴클레오티드, 15 내지 16개 뉴클레오티드, 15 내지 17개 뉴클레오티드, 15 내지 18개 뉴클레오티드, 15 내지 19개 뉴클레오티드, 15 내지 20개 뉴클레오티드, 16 내지 17개 뉴클레오티드, 16 내지 18개 뉴클레오티드, 16 내지 19개 뉴클레오티드, 16 내지 20개 뉴클레오티드, 17 내지 18개 뉴클레오티드, 17 내지 19개 뉴클레오티드, 17 내지 20개 뉴클레오티드, 18 내지 19개 뉴클레오티드, 18 내지 20개 뉴클레오티드, 19 내지 20개 뉴클레오티드, 20 내지 30개 뉴클레오티드, 20 내지 40개 뉴클레오티드, 20 내지 50개 뉴클레오티드, 20 내지 60개 뉴클레오티드, 20 내지 70개 뉴클레오티드, 20 내지 75개 뉴클레오티드, 30 내지 40개 뉴클레오티드, 30 내지 50개 뉴클레오티드, 30 내지 60개 뉴클레오티드, 30 내지 70개 뉴클레오티드, 30 내지 75개 뉴클레오티드, 40 내지 50개 뉴클레오티드, 40 내지 60개 뉴클레오티드, 40 내지 70개 뉴클레오티드, 40 내지 75개 뉴클레오티드, 50 내지 60개 뉴클레오티드, 50 내지 70개 뉴클레오티드, 50 내지 75개 뉴클레오티드, 60 내지 70개 뉴클레오티드, 60 내지 75개 뉴클레오티드 및 70 내지 75개 뉴클레오티드)를 포함할 수 있다. 특정한 실시양태에서, 헤드피스, 제1 태그, 제2 태그, 하나 이상의 추가의 태그, 라이브러리-확인 태그, 사용 태그 및/또는 기원 태그는, 존재하는 경우에, 20개 뉴클레오티드 미만 (예를 들어, 19개 뉴클레오티드 미만, 18개 뉴클레오티드 미만, 17개 뉴클레오티드 미만, 16개 뉴클레오티드 미만, 15개 뉴클레오티드 미만, 14개 뉴클레오티드 미만, 13개 뉴클레오티드 미만, 12개 뉴클레오티드 미만, 11개 뉴클레오티드 미만, 10개 뉴클레오티드 미만, 9개 뉴클레오티드 미만, 8개 뉴클레오티드 미만 또는 7개 뉴클레오티드 미만)의 길이를 갖는다.
임의의 상기 실시양태에서, 코딩 서열 (예를 들어, 헤드피스, 테일피스, 제1 태그, 하나 이상의 추가의 태그, 라이브러리-확인 태그, 사용 태그 및/또는 기원 태그 (존재하는 경우))은 20개 초과의 뉴클레오티드 (예를 들어, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75개 뉴클레오티드 초과)를 포함할 수 있다.
정의
"2'-치환된 뉴클레오티드"는 리보스의 2'-위치에서 치환을 갖는 뉴클레오티드 염기를 의미한다.
"약"은 언급된 값의 +/- 10%를 의미한다.
"이관능성"은 2개의 화학적 모이어티의 결합을 가능하게 하는 2개의 반응성 기를 갖는다는 것을 의미한다.
"이관능성 스페이서"는 화학 물질 및 복합체의 코딩 정보의 결합을 가능하게 하는 2개의 반응성 기를 갖는 스페이싱 모이어티를 의미한다. 하나의 비제한적 예에서, 이관능성 스페이서는 화학 물질과 태그 사이에 제공된다. 또 다른 비제한적 예에서, 이관능성 스페이서는 화학 물질과 헤드피스 사이에 제공된다. 예시적인 이관능성 스페이서가 본원에 제공된다.
"결합"은 공유 결합 또는 비공유 결합에 의한 부착을 의미한다. 비공유 결합은 반 데르 발스의 힘, 수소 결합, 이온 결합, 포획 또는 물리적 캡슐화, 흡수, 흡착 및/또는 다른 분자간 힘에 의해 형성된 것을 포함한다. 결합은 임의의 유용한 수단에 의해, 예컨대 효소적 결합 (예를 들어, 효소적 연결을 제공하는 효소적 라이게이션)에 의해 또는 화학적 결합 (예를 들어, 화학적 연결을 제공하는 화학적 라이게이션)에 의해 달성될 수 있다.
"빌딩 블록"은 화학 물질의 구조 단위를 의미하며, 여기서 단위는 다른 화학적 구조 단위에 직접적으로 연결되거나 또는 스캐폴드를 통해 간접적으로 연결된다. 화학 물질이 중합체 또는 올리고머인 경우에, 빌딩 블록은 중합체 또는 올리고머의 단량체 단위이다. 빌딩 블록은 하나 이상의 다른 빌딩 블록 또는 스캐폴드의 추가를 가능하게 하는 하나 이상의 다양성 노드를 가질 수 있다. 대부분의 경우에, 각각의 다양성 노드는 하나 이상의 빌딩 블록 또는 스캐폴드와 반응하여 화학 물질을 형성할 수 있는 관능기이다. 일반적으로, 빌딩 블록은 적어도 2개의 다양성 노드 (또는 반응성 관능기)를 갖지만, 일부 빌딩 블록은 1개의 다양성 노드 (또는 반응성 관능기)를 가질 수 있다. 대안적으로, 코딩된 화학 또는 결합 단계는 수개의 화학적 성분 (예를 들어, 다-성분 축합 반응 또는 다-단계 과정)을 포함할 수 있다. 2개의 상이한 빌딩 블록 상의 반응성 기는 상보적이어야 하며, 즉 함께 반응하여 공유 결합 또는 비공유 결합을 형성할 수 있어야 한다.
"화학 물질"은 하나 이상의 빌딩 블록 및 임의로 하나 이상의 스캐폴드를 포함하는 화합물을 의미한다. 화학 물질은 하나 이상의 목적하는 특성, 예를 들어 생물학적 표적에 대한 결합능, 용해도, 수소 결합 공여자 및 수용자의 이용가능성, 결합의 회전 자유도, 양전하, 음전하 등을 갖도록 설계 또는 구축된 임의의 소형 분자 또는 펩티드 약물 또는 약물 후보일 수 있다. 특정 실시양태에서, 화학 물질은 이관능성 또는 삼관능성 (그 초과) 물질로서 추가로 반응할 수 있다.
"화학-반응성 기"는 모듈식 반응에 관여하여 연결을 생성하는 반응성 기를 의미한다. 예시적인 반응 및 반응성 기는 본원에 기재된 바와 같은, 임의로 치환된 알키닐 기 및 임의로 치환된 아지도 기의 쌍과의 후이스겐(Huisgen) 1,3-쌍극자 고리화첨가 반응; 4 π-전자계를 갖는 임의로 치환된 디엔 및 2 π-전자계를 갖는 임의로 치환된 친디엔체 또는 임의로 치환된 친헤테로디엔체의 쌍과의 딜스-아더 반응; 친핵체 및 변형 헤테로시클릴 친전자체와의 개환 반응; 포스포로티오에이트 기 및 아이오도 기와의 스플린트 라이게이션 반응; 및 알데히드 기 및 아미노 기와의 환원성 아미노화 반응으로부터 선택되는 것을 포함한다.
"상보적"은 본원에 기재된 바와 같이 혼성화하여 이차 구조 (핵산 분자의 듀플렉스 또는 이중-가닥 부분)를 형성할 수 있는 서열을 의미한다. 상보성은 완전할 필요는 없지만, 1, 2, 3 또는 그 초과의 뉴클레오티드에서 하나 이상의 미스매치를 포함할 수 있다. 예를 들어, 상보적 서열은 왓슨-크릭(Watson-Crick) 염기쌍 규칙 (예를 들어, G와 C, A와 T 또는 A와 U) 또는 다른 수소 결합 모티프 (예를 들어, 디아미노퓨린과 T, 5-메틸 C와 G, 2-티오티미딘과 A, 이노신과 C, 슈도이소시토신과 G)에 따라 수소 결합을 형성할 수 있는 핵염기를 함유할 수 있다. 서열 및 그의 상보적 서열은 동일한 올리고뉴클레오티드 내 또는 상이한 올리고뉴클레오티드 내에 존재할 수 있다.
"복합체" 또는 "라이게이션된 복합체"는 공유 결합 또는 비공유 결합에 의해 화학 물질 및/또는 하나 이상의 올리고뉴클레오티드 태그와 작동가능하게 회합된 헤드피스를 의미한다. 복합체는 화학 물질과 헤드피스 사이에 이관능성 스페이서를 임의로 포함할 수 있다.
화학 물질의 "성분"은 스캐폴드 또는 빌딩 블록을 의미한다.
올리고뉴클레오티드 태그의 "연결부"는 고정된 서열을 갖는 5'- 또는 3'-말단에서의 또는 그에 근접한 태그의 부분을 의미한다. 5'-연결부는 올리고뉴클레오티드의 5'-말단에 또는 그에 근접하여 위치하고, 3'-연결부는 올리고뉴클레오티드의 3'-말단에 또는 그에 근접하여 위치한다. 복합체 내에 존재하는 경우에, 각각의 5'-연결부는 동일하거나 상이할 수 있으며, 각각의 3'-연결부는 동일하거나 상이할 수 있다. 하나 초과의 태그를 갖는 예시적인 비제한적 복합체에서, 각각의 태그는 5'-연결부 및 3'-연결부를 포함할 수 있으며, 여기서 각각의 5'-연결부는 동일한 서열을 갖고 각각의 3'-연결부는 동일한 서열을 갖는다 (예를 들어, 여기서 5'-연결부의 서열은 3'-연결부의 서열과 동일하거나 상이할 수 있음). 또 다른 예시적인 비제한적 복합체에서, 5'-연결부의 서열은 본원에 기재된 바와 같이 3'-연결부의 서열에 상보적으로 설계된다 (예를 들어, 5'- 및 3'-연결부 사이에의 혼성화를 가능하게 하도록). 연결부는 연결 (예를 들어, 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 연결, 예컨대 화학적 연결)을 가능하게 하는 1개 이상의 기를 임의로 포함할 수 있다.
"불변" 또는 "고정된 불변" 서열은 정보를 코딩하지 않는 올리고뉴클레오티드 서열을 의미한다. 불변 서열을 갖는 비제한적인 예시적 복합체의 부분은 프라이머-결합 영역, 5'-연결부 또는 3'-연결부를 포함한다. 본 발명의 헤드피스는 정보를 코딩할 수 있거나 (따라서, 태그) 또는 대안적으로 정보를 코딩할 수 없다 (따라서, 불변 서열). 유사하게, 본 발명의 테일피스는 정보를 코딩할 수 있거나 또는 코딩할 수 없다.
"교차-연결 올리고뉴클레오티드"는 본원에 기재된 바와 같이 복합체 내의 2개의 인접한 태그 사이의 특정한 접합부에 작동가능하게 회합된 올리고뉴클레오티드를 의미한다. 비제한적 예에서, 교차-연결 올리고뉴클레오티드의 하나의 말단은 제1 태그의 3'-연결부에 혼성화하고, 교차-연결 올리고뉴클레오티드의 다른 말단은 제1 태그에 인접한 제2 태그의 5'-연결부에 혼성화한다. 교차-연결 올리고뉴클레오티드의 예시적인 비제한적 실시양태는 인접한 태그 또는 인접한 태그의 연결부와 작동가능하게 회합된 하나 이상의 반응성 기 (예를 들어, 화학-반응성 기, 광-반응성 기, 삽입성 모이어티 또는 가역적 공-반응성 기 또는 본원에 기재된 임의의 것)를 갖는 것을 포함한다.
"다양성 노드"는 또 다른 빌딩 블록의 부가를 가능하게 하는 스캐폴드 또는 빌딩 블록 내의 위치의 관능기를 의미한다.
"헤드피스"는 화학 물질의 성분 및 태그에 작동가능하게 연결된 라이브러리 합성을 위한 화학 구조, 예를 들어 출발 올리고뉴클레오티드를 의미한다. 임의로 헤드피스는 뉴클레오티드를 거의 또는 전혀 함유하지 않을 수 있지만, 작동가능하게 회합될 수 있는 지점을 제공할 수 있다. 임의로, 이관능성 스페이서는 헤드피스를 성분에 연결시킨다.
"혼성화하다"는 다양한 엄격성 조건 하에서 상보적 올리고뉴클레오티드들 또는 그의 부분들 사이에 쌍을 이루어 이중-가닥 분자를 형성하는 것을 의미한다. (예를 들어, 문헌 [Wahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507] 참조.) 예를 들어, 고 엄격성 혼성화는 통상적으로 약 750 mM NaCl 및 75 mM 시트르산삼나트륨 미만, 약 500 mM NaCl 및 50 mM 시트르산삼나트륨 미만, 또는 약 250 mM NaCl 및 25 mM 시트르산삼나트륨 미만의 염 농도에 의해 달성될 수 있다. 저 엄격성 혼성화는 유기 용매, 예를 들어 포름아미드의 부재로 달성될 수 있는 반면에, 고 엄격성 혼성화는 적어도 약 35% 포름아미드 또는 적어도 약 50% 포름아미드의 존재로 달성될 수 있다. 고 엄격성 혼성화 온도 조건은 통상적으로 적어도 약 30℃, 37℃ 또는 42℃의 온도를 포함할 것이다. 추가의 파라미터, 예컨대 혼성화 시간, 세제, 예를 들어 소듐 도데실 술페이트 (SDS)의 농도, 및 운반 DNA의 포함 또는 배제를 변화시키는 것은 통상의 기술자에게 널리 공지되어 있다. 다양한 수준의 엄격성이 이러한 다양한 조건들을 필요에 따라 조합함으로써 달성된다. 한 실시양태에서, 혼성화는 30℃에서, 750 mM NaCl, 75 mM 시트르산삼나트륨 및 1% SDS 중에서 이루어질 것이다. 대안적 실시양태에서, 혼성화는 37℃에서, 500 mM NaCl, 50 mM 시트르산삼나트륨, 1% SDS, 35% 포름아미드 및 100 μg/ml의 변성 연어 정자 DNA (ssDNA) 중에서 이루어질 것이다. 추가의 대안적 실시양태에서, 혼성화는 42℃에서, 250 mM NaCl, 25 mM 시트르산삼나트륨, 1% SDS, 50% 포름아미드, 및 200 μg/ml의 ssDNA 중에서 이루어질 것이다. 이들 조건에 대한 유용한 변화는 통상의 기술자에게 용이하게 이해될 것이다.
대부분의 적용에 있어서, 혼성화 후의 세척 단계도 또한 엄격성을 변화시킬 것이다. 세척 엄격성 조건은 염 농도 및 온도에 의해 규정될 수 있다. 상기와 같이, 세척 엄격성은 염 농도를 감소시킴으로써 또는 온도를 증가시킴으로써 증가될 수 있다. 예를 들어, 세척 단계를 위한 고 엄격성 염 농도는, 예를 들어 약 30 mM NaCl 및 3 mM 시트르산삼나트륨 미만, 또는 약 15 mM NaCl 및 1.5 mM 시트르산삼나트륨 미만일 수 있다. 세척 단계를 위한 고 엄격성 온도 조건은 통상적으로, 예를 들어 적어도 약 25℃, 42℃ 또는 68℃의 온도를 포함할 것이다. 한 실시양태에서, 세척 단계는 25℃에서, 30 mM NaCl, 3 mM 시트르산삼나트륨 및 0.1% SDS 중에서 이루어질 것이다. 대안적 실시양태에서, 세척 단계는 42℃에서, 15 mM NaCl, 1.5 mM 시트르산삼나트륨 및 0.1% SDS 중에서 이루어질 것이다. 추가의 대안적 실시양태에서, 세척 단계는 68℃에서, 15 mM NaCl, 1.5 mM 시트르산삼나트륨 및 0.1% SDS 중에서 이루어질 것이다. 이들 조건에 대한 추가의 변화는 통상의 기술자에게 용이하게 이해될 것이다. 혼성화 기술은 통상의 기술자에게 널리 공지되어 있고, 예를 들어 문헌 [Benton and Davis (Science 196:180, 1977); Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975); Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001); Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York); 및 Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New York]에 기재되어 있다.
"삽입성 모이어티"는 2개 또는 그 초과의 뉴클레오티드 사이에 모이어티를 포함시키는 반응성 기를 의미한다. 비제한적 예에서, 삽입성 모이어티는 하나 이상의 뉴클레오티드와 반응하여 듀플렉스 또는 트리플렉스 올리고뉴클레오티드들 사이에 가닥간 또는 가닥내 교차-연결을 형성한다. 예시적인 비제한적 삽입성 모이어티가 본원에 기재되어 있다.
"접합부"는 복합체 내의 2개의 인접한 태그 사이의 닉 (뉴클레오티드내 결합의 결여) 또는 갭 (하나 이상의 뉴클레오티드의 결여)을 의미한다. 접합부는 또한 2개의 인접한 태그 내에 존재하는 2개의 인접한 연결부 사이 (예를 들어, 제1 태그의 3'-연결부 및 제1 태그에 인접한 제2 태그의 5'-연결부 사이)일 수 있다.
"라이브러리"는 분자 또는 화학 물질의 집합을 의미한다. 임의로, 분자 또는 화학 물질은 분자 또는 화학 물질의 부분을 코딩하는 하나 이상의 올리고뉴클레오티드에 결합된다.
"연결"은 2개 이상의 화학 구조를 작동가능하게 회합시키는 것을 가능하게 하는 화학적 연결 실체를 의미하며, 여기서 연결은 헤드피스와 하나 이상의 태그 사이, 2개의 태그 사이, 또는 태그와 테일피스 사이에 존재한다. 화학적 연결 실체는 2개의 관능기 사이의 비-공유 결합 (예를 들어, 본원에 기재된 바와 같음), 공유 결합 또는 반응 산물일 수 있다. "화학적 연결"은 2개의 관능기 사이의 비-효소적, 화학적 반응에 의해 형성된 연결을 의미한다. 예시적인 비제한적 관능기는 화학-반응성 기, 광-반응성 기, 삽입성 모이어티, 또는 교차-연결 올리고뉴클레오티드 (예를 들어, 본원에 기재된 바와 같음)를 포함한다. "효소적 연결"은 효소에 의해 형성된 뉴클레오티드간 또는 뉴클레오시드간 연결을 의미한다. 예시적인 비제한적 효소는 키나제, 폴리머라제, 리가제 또는 그의 조합을 포함한다. "폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는" 연결은, 올리고뉴클레오티드 주형 내에 존재하는 경우에, 연결이 결여된 대조군 올리고뉴클레오티드와 비교하여 폴리머라제에 의해 감소된 양의 신장 및/또는 증폭된 산물을 제공하는 연결을 의미한다. 이러한 연결을 결정하는 예시적인 비제한적 방법은 PCR 분석 (예를 들어, 정량적 PCR), RT-PCR 분석, 액체 크로마토그래피-질량 분광측정법, 서열 집단통계, 또는 다른 방법에 의해 평가되는 바와 같은 프라이머 연장을 포함한다. 예시적인 비제한적 폴리머라제는 DNA 폴리머라제 및 RNA 폴리머라제, 예컨대 DNA 폴리머라제 I, DNA 폴리머라제 II, DNA 폴리머라제 III, DNA 폴리머라제 VI, Taq DNA 폴리머라제, 딥 벤트알(Deep VentR)™ DNA 폴리머라제 (고-충실도 고온성 DNA 폴리머라제, 뉴잉글랜드 바이오랩스(New England Biolabs)로부터 입수가능함), T7 DNA 폴리머라제, T4 DNA 폴리머라제, RNA 폴리머라제 I, RNA 폴리머라제 II, RNA 폴리머라제 III 또는 T7 RNA 폴리머라제를 포함한다.
"다가 양이온"은 1개 초과의 리간드 또는 음이온과 1개 초과의 결합을 형성할 수 있는 양이온을 의미한다. 다가 양이온은 이온 복합체 또는 배위 복합체를 형성할 수 있다. 예시적인 다가 양이온은 알칼리 토금속 (예를 들어, 마그네슘) 및 전이 금속 (예를 들어, 망가니즈 (II) 또는 코발트 (III))으로부터의 것, 및 하나 이상의 음이온 및/또는 하나 이상의 1가 또는 여러자리 리간드에 임의로 결합하는 것, 예컨대 클로라이드, 아민 및/또는 에틸렌디아민을 포함한다.
"올리고뉴클레오티드"는 5'-말단, 3'-말단, 및 5'-말단과 3'-말단 사이의 내부 위치에 하나 이상의 뉴클레오티드를 갖는 뉴클레오티드의 중합체를 의미한다. 올리고뉴클레오티드는, 합성되어 염기-쌍 인식에 사용될 수 있는, 관련 기술분야에 공지되어 있는 DNA, RNA 또는 그의 임의의 유도체를 포함할 수 있다. 올리고뉴클레오티드는 인접한 염기를 가져야 하는 것은 아니지만, 링커 모이어티에 의해 산재되어 있을 수 있다. 올리고뉴클레오티드 중합체 및 뉴클레오티드 (예를 들어, 변형된 DNA 또는 RNA)는 천연 염기 (예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신, 데옥시시티딘, 이노신 또는 디아미노 퓨린), 염기 유사체 (예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, C5-프로피닐시티딘, C5-프로피닐우리딘, C5-브로모우리딘, C5-플루오로우리딘, C5-아이오도우리딘, C5-메틸시티딘, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌 및 2-티오시티딘), 변형된 염기 (예를 들어, 2'-치환된 뉴클레오티드, 예컨대 2'-O-메틸화 염기 및 2'-플루오로 염기), 삽입된 염기, 변형된 당 (예를 들어, 2'-플루오로리보스; 리보스; 2'-데옥시리보스; 아라비노스; 헥소스; 안히드로헥시톨; 알트리톨; 만니톨; 시클로헥사닐; 시클로헥세닐; 또한 포스포르아미데이트 백본을 갖는 모르폴리노; 잠금 핵산 (예를 들어, 리보스의 2'-히드록실이 C1-6 알킬렌 또는 C1-6 헤테로알킬렌 가교에 의해 동일한 리보스 당의 4'-탄소에 연결되며, 여기서 예시적인 가교는 메틸렌, 프로필렌, 에테르 또는 아미노 가교를 포함하는 것인 LNA); 글리콜 핵산 (리보스가 포스포디에스테르 결합에 부착된 글리콜 단위에 의해 대체된 것인 GNA, 예를 들어 R-GNA 또는 S-GNA); 트레오스 핵산 (리보스가 α-L-트레오푸라노실-(3'→2')로 대체된 것인 TNA); 및/또는 리보스 내 산소의 대체 (예를 들어, S, Se 또는 알킬렌, 예컨대 메틸렌 또는 에틸렌에 의함), 변형된 백본 (예를 들어, 2-아미노-에틸-글리신 연결이 리보스 및 포스포디에스테르 백본을 대체한 것인 펩티드 핵산 (PNA)) 및/또는 변형된 포스페이트 기 (예를 들어, 포스포로티오에이트, 5'-N-포스포르아미다이트, 포스포로셀레네이트, 보라노포스페이트, 보라노포스페이트 에스테르, 수소 포스포네이트, 포스포르아미데이트, 포스포로디아미데이트, 알킬 또는 아릴 포스포네이트, 포스포트리에스테르, 가교된 포스포르아미데이트, 가교된 포스포로티오에이트 및 가교된 메틸렌-포스포네이트)를 포함할 수 있다. 올리고뉴클레오티드는 단일-가닥 (예를 들어, 헤어핀), 이중-가닥일 수 있거나, 또는 다른 2차 또는 3차 구조 (예를 들어, 줄기-루프 구조, 이중 나선, 트리플렉스, 쿼드로플렉스 등)를 보유할 수 있다.
"작동가능하게 연결된" 또는 "작동가능하게 회합된"은 2개 이상의 화학 구조가 직접적으로 또는 간접적으로 함께 연결됨으로써, 일어날 것으로 예상되는 다양한 조작을 통해서도 연결된 상태 그대로 유지되는 것을 의미한다. 전형적으로, 화학 물질 및 헤드피스는 간접적인 방식으로 (예를 들어, 적절한 스페이서를 통해 공유적으로) 작동가능하게 회합된다. 예를 들어, 스페이서는 화학 물질에 대한 부착 부위 및 헤드피스에 대한 부착 부위를 갖는 이관능성 모이어티일 수 있다.
"광-반응성 기"는 자외, 가시 또는 적외 방사선의 흡수에 의해 유발되는 반응에 참여하여 연결을 생성하는 반응성 기를 의미한다. 예시적인 비제한적 광-반응성 기가 본원에 기재되어 있다.
"보호기"는 올리고뉴클레오티드-코딩된 라이브러리를 제조, 태깅 또는 사용하는 하나 이상의 결합 단계 동안 바람직하지 않은 반응에 대해 올리고뉴클레오티드의 3'-말단 또는 5'-말단을 보호하거나, 또는 화학 물질, 스캐폴드 또는 빌딩 블록의 하나 이상의 관능기를 보호하도록 하는 기를 의미한다. 통상적으로 사용되는 보호기는 문헌 [Greene, "Protective Groups in Organic Synthesis," 4th Edition (John Wiley & Sons, New York, 2007)]에 개시되어 있고, 이는 본원에 참조로 포함된다. 올리고뉴클레오티드에 대한 예시적인 보호기는 비가역적 보호기, 예컨대 디데옥시뉴클레오티드 및 디데옥시뉴클레오시드 (ddNTP 또는 ddN), 및 보다 바람직하게는, 히드록실 기에 대한 가역적 보호기, 예컨대 에스테르 기 (예를 들어, O-(α-메톡시에틸)에스테르, O-이소발레릴 에스테르 및 O-레불리닐 에스테르), 트리틸 기 (예를 들어, 디메톡시트리틸 및 모노메톡시트리틸), 크산테닐 기 (예를 들어, 9-페닐크산텐-9-일 및 9-(p-메톡시페닐)크산텐-9-일), 아실 기 (예를 들어, 페녹시아세틸 및 아세틸) 및 실릴 기 (예를 들어, t-부틸디메틸실릴)를 포함한다. 화학 물질, 스캐폴드 및 빌딩 블록에 대한 예시적인 비제한적 보호기는 합성 절차 동안 바람직하지 않은 반응에 대해 아미노 기를 보호하기 위한 N-보호기 (예를 들어, 아실; 아릴로일; 카르바밀 기, 예컨대 포르밀, 아세틸, 프로피오닐, 피발로일, t-부틸아세틸, 2-클로로아세틸, 2-브로모아세틸, 트리플루오로아세틸, 트리클로로아세틸, 프탈릴, o-니트로페녹시아세틸, α-클로로부티릴, 벤조일, 4-클로로벤조일, 4-브로모벤조일, 4-니트로벤조일, 및 키랄 보조기, 예컨대 보호 또는 탈보호된 D, L 또는 D,L-아미노산, 예컨대 알라닌, 류신, 페닐알라닌 등; 술포닐-함유 기, 예컨대 벤젠술포닐, p-톨루엔술포닐 등; 카르바메이트 형성기, 예컨대 벤질옥시카르보닐, p-클로로벤질옥시카르보닐, p-메톡시벤질옥시카르보닐, p-니트로벤질옥시카르보닐, 2-니트로벤질옥시카르보닐, p-브로모벤질옥시카르보닐, 3,4-디메톡시벤질옥시카르보닐, 3,5 디메톡시벤질 옥시카르보닐, 2,4-디메톡시벤질옥시카르보닐, 4 메톡시벤질옥시카르보닐, 2-니트로-4,5-디메톡시벤질옥시카르보닐, 3,4,5 트리메톡시벤질옥시카르보닐, 1-(p-비페닐릴)-1-메틸에톡시카르보닐, α,α-디메틸-3,5 디메톡시벤질옥시카르보닐, 벤즈히드릴옥시 카르보닐, t-부틸옥시카르보닐, 디이소프로필메톡시카르보닐, 이소프로필옥시카르보닐, 에톡시카르보닐, 메톡시카르보닐, 알릴옥시카르보닐, 2,2,2,-트리클로로에톡시카르보닐, 페녹시카르보닐, 4-니트로페녹시 카르보닐, 플루오레닐-9-메톡시카르보닐, 시클로펜틸옥시카르보닐, 아다만틸옥시카르보닐, 시클로헥실옥시카르보닐, 페닐티오카르보닐 등; 알크아릴 기, 예컨대 벤질, 트리페닐메틸, 벤질옥시메틸 등; 및 실릴 기, 예컨대 트리메틸실릴 등; 여기서 바람직한 N-보호기는 포르밀, 아세틸, 벤조일, 피발로일, t-부틸아세틸, 알라닐, 페닐술포닐, 벤질, t-부틸옥시카르보닐 (Boc), 및 벤질옥시카르보닐 (Cbz)임); 합성 절차 동안 바람직하지 않은 반응에 대해 히드록실 기를 보호하기 위한 O-보호기 (예를 들어, 알킬카르보닐 기, 예컨대 아실, 아세틸, 피발로일 등; 임의로 치환된 아릴카르보닐 기, 예컨대 벤조일; 실릴 기, 예컨대 트리메틸실릴 (TMS), tert-부틸디메틸실릴 (TBDMS), 트리-이소-프로필실릴옥시메틸 (TOM), 트리이소프로필실릴 (TIPS) 등; 이러한 메틸, 메톡시메틸, 테트라히드로피라닐, 벤질, p-메톡시벤질, 트리틸 등의 히드록실을 갖는 에테르-형성기; 알콕시카르보닐, 예컨대 메톡시카르보닐, 에톡시카르보닐, 이소프로폭시카르보닐, n-이소프로폭시카르보닐, n-부틸옥시카르보닐, 이소부틸옥시카르보닐, sec-부틸옥시카르보닐, t-부틸옥시카르보닐, 2-에틸헥실옥시카르보닐, 시클로헥실옥시카르보닐, 메틸옥시카르보닐 등; 알콕시알콕시카르보닐 기, 예컨대 메톡시메톡시카르보닐, 에톡시메톡시카르보닐, 2-메톡시에톡시카르보닐, 2-에톡시에톡시카르보닐, 2-부톡시에톡시카르보닐, 2-메톡시에톡시메톡시카르보닐, 알릴옥시카르보닐, 프로파르길옥시카르보닐, 2-부텐옥시카르보닐, 3-메틸-2-부텐옥시카르보닐 등; 할로알콕시카르보닐, 예컨대 2-클로로에톡시카르보닐, 2-클로로에톡시카르보닐, 2,2,2-트리클로로에톡시카르보닐 등; 임의로 치환된 아릴알콕시카르보닐 기, 예컨대 벤질옥시카르보닐, p-메톡시벤질옥시카르보닐, p-메톡시벤질옥시카르보닐, p-니트로벤질옥시카르보닐, 2,4-디니트로벤질옥시카르보닐, 3,5-디메틸벤질옥시카르보닐, p-클로로벤질옥시카르보닐, p-브로모벤질옥시-카르보닐 등; 및 임의로 치환된 아릴옥시카르보닐 기, 예컨대 페녹시카르보닐, p-니트로페녹시카르보닐, o-니트로페녹시카르보닐, 2,4-디니트로페녹시카르보닐, p-메틸-페녹시카르보닐, m-메틸페녹시카르보닐, o-브로모페녹시카르보닐, 3,5-디메틸페녹시카르보닐, p-클로로페녹시카르보닐, 2-클로로-4-니트로페녹시-카르보닐 등); 카르보닐-보호기 (예를 들어, 아세탈 및 케탈 기, 예컨대 디메틸 아세탈, 1,3-디옥솔란 등; 아시랄 기; 및 디티안 기, 예컨대 1,3-디티안, 1,3-디티올란 등); 카르복실산-보호기 (예를 들어, 에스테르 기, 예컨대 메틸 에스테르, 벤질 에스테르, t-부틸 에스테르, 오르토에스테르 등; 실릴 기, 예컨대 트리메틸실릴, 뿐만 아니라 본원에 기재된 임의의 것; 및 옥사졸린 기); 및 포스페이트-보호기 (예를 들어, 임의로 치환된 에스테르 기, 예컨대 메틸 에스테르, 이소프로필 에스테르, 2-시아노에틸 에스테르, 알릴 에스테르, t-부틸 에스테르, 벤질 에스테르, 플루오레닐메틸 에스테르, 2-(트리메틸실릴)에틸 에스테르, 2-(메틸술포닐)에틸 에스테르, 2,2,2-트리클로로에틸 에스테르, 3',5'-디메톡시벤조인 에스테르, p-히드록시페나실 에스테르 등)를 포함한다.
올리고뉴클레오티드의 말단에 "근접" 또는 "근접한"은 다른 나머지 말단보다 언급된 말단에 인접하거나 가까운 것을 의미한다. 예를 들어, 올리고뉴클레오티드의 3'-말단에 근접한 모이어티 또는 기는 5'-말단보다 3'-말단에 인접하거나 가깝다. 특정한 실시양태에서, 올리고뉴클레오티드의 3'-말단에 근접한 모이어티 또는 기는 3'-말단으로부터의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15개 또는 그 초과의 뉴클레오티드이다. 다른 실시양태에서, 올리고뉴클레오티드의 5'-말단에 근접한 모이어티 또는 기는 5'-말단으로부터의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15개 또는 그 초과의 뉴클레오티드이다.
"정제하는 것"은 연속 단계에서 사용하고자 하는 화학적 또는 생물학적 작용제의 활성을 감소시킬 수 있는, 반응 혼합물 중에 존재하는 임의의 미반응 산물 또는 임의의 작용제를 제거하는 것을 의미한다. 정제하는 것은 제거하고자 하는 미반응 산물 또는 시약의 크로마토그래피 분리, 전기영동 분리, 및 침전을 하나 이상 포함할 수 있다.
"가역적 공-반응성 기"는 가역 반응에 참여하는 반응성 기를 의미한다. 예시적인 비제한적 반응성 기는, 특정한 흡수 방사선에 노출되었을 때 광-반응성 기 사이에 연결을 생성하고, 상이한, 특정한 흡수 방사선에 노출되었을 때 형성된 연결이 절단되는 광-반응성 기 (예를 들어, 시아노비닐카르바졸 기, 시아노비닐 기 및 아크릴아미드 기)를 포함한다. 또 다른 예시적인 비제한적 반응성 기는 가역적으로 환원 또는 산화될 수 있는 산화환원-반응성 기 (예를 들어, 티올 기)를 포함한다.
"스캐폴드"는 특정한 특이 기하구조로 하나 이상의 다양성 노드를 나타내는 화학적 모이어티를 의미한다. 다양성 노드는 전형적으로는 라이브러리 합성 동안 스캐폴드에 부착되지만, 일부 경우에서 하나의 다양성 노드는 라이브러리 합성 이전에 스캐폴드에 부착될 수 있다 (예를 들어, 하나 이상의 빌딩 블록 및/또는 하나 이상의 태그의 부가). 일부 실시양태에서, 스캐폴드는 유도체화됨으로써 라이브러리 합성 동안 직교형으로 탈보호될 수 있고, 이어서 상이한 다양성 노드와 반응할 수 있다.
"소분자" 약물 또는 "소분자" 약물 후보는 분자량이 약 1,000 달톤 미만인 분자를 의미한다. 소분자는 (예를 들어, 화합물 라이브러리 또는 천연 공급원으로부터) 단리되거나 또는 공지된 화합물의 유도체화에 의해 수득된 유기 또는 무기물일 수 있다.
"실질적 동일성" 또는 "실질적으로 동일한"은 각각 참조 서열과 동일한 폴리펩티드 또는 폴리뉴클레오티드 서열을 갖거나, 또는 2개의 서열을 최적으로 정렬했을 때 참조 서열 내의 상응하는 위치에서 각각 동일한 아미노산 잔기 또는 뉴클레오티드를 명시된 백분율로 갖는 폴리펩티드 또는 폴리뉴클레오티드 서열을 의미한다. 예를 들어, 참조 서열과 "실질적으로 동일한" 아미노산 서열은 참조 아미노산 서열과 적어도 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는다. 폴리펩티드의 경우에, 비교 서열의 길이는 일반적으로 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 인접 아미노산, 보다 바람직하게는 적어도 25, 50, 75, 90, 100, 150, 200, 250, 300 또는 350개의 인접 아미노산, 및 가장 바람직하게는 전장 아미노산 서열일 것이다. 핵산의 경우에, 비교 서열의 길이는 일반적으로 적어도 5개의 인접 뉴클레오티드, 바람직하게는 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 뉴클레오티드, 및 가장 바람직하게는 전장 뉴클레오티드 서열일 것이다. 서열 동일성은 디폴트 설정된 서열 분석 소프트웨어 (예를 들어, 미국 53705 위스콘신주 매디슨 유니버시티 애비뉴 1710 위스콘신 대학교 바이오테크놀로지 센터 제네틱스 컴퓨터 그룹의 서열 분석 소프트웨어 패키지)를 사용하여 측정될 수 있다. 이러한 소프트웨어는 다양한 치환, 결실 및 다른 변형에 상동성 정도를 할당함으로써 유사한 서열을 매칭시킬 수 있다.
"태그" 또는 "올리고뉴클레오티드 태그"는 정보를 코딩하는 적어도 일부인 라이브러리의 올리고뉴클레오티드 부분을 의미한다. 이러한 정보의 비제한적 예는 성분 (즉 각각 스캐폴드 태그 또는 빌딩 블록 태그에서와 같은 스캐폴드 또는 빌딩 블록), 라이브러리 내 헤드피스, 라이브러리의 아이덴티티 (즉 아이덴티티 태그에서와 같음), 라이브러리의 사용 (즉 사용 태그에서와 같음), 및/또는 라이브러리 구성원의 기원 (즉 기원 태그에서와 같음)의 부가 (예를 들어, 결합 반응에 의함)를 포함한다.
"테일피스"는 모든 선행 태그의 부가 이후에 복합체에 부착되고, 라이브러리의 아이덴티티, 라이브러리의 사용 및/또는 라이브러리 구성원의 기원을 코딩하는 라이브러리의 올리고뉴클레오티드 부분을 의미한다.
"프라이머"는 올리고뉴클레오티드 주형에 어닐링된 다음 폴리머라제에 의해 주형-의존적 방식으로 연장될 수 있는 올리고뉴클레오티드를 의미한다.
"릴레이 프라이머"는 프라이머가 혼성화되는 주형의 영역 내에 판독 또는 전위하는 폴리머라제의 능력을 감소시키는 적어도 하나의 뉴클레오티드간 연결을 함유하는 올리고뉴클레오티드 주형에 어닐링할 수 있는 올리고뉴클레오티드를 의미한다. 혼성화시, 하나 이상의 릴레이 프라이머는 폴리머라제에 의해 주형 의존적 방식으로 연장가능하다.
본원에 사용된 "재조합"은 적어도 2개의 별개의 혼성화 이벤트의 결과로서 폴리머라제 산물의 생성을 의미한다.
본 발명의 다른 특징 및 이점은 하기 상세한 설명 및 특허청구범위로부터 명백할 것이다.
도 1a-1b는 예시적인 복합체를 제시한다. 도 1a는 (5'에서 3' 방향으로) 화학 물질 (별표), 고정된 불변 서열 (예를 들어, 헤드피스)에 이어 3개의 가변 코딩 서열 (예를 들어, 3개의 태그), 및 또 다른 고정된 불변 서열 (예를 들어, 테일피스)을 가지며, 여기서 고정된 불변 서열과 가변 코딩 서열 사이의 연결은 판독가능한 것인 복합체를 제시한다. 복합체는 프라이머와 함께 폴리머라제를 사용하여 (복합체의 3'-말단에 혼성화됨) 추가로 연장될 수 있고, PCR에 의해 임의로 증폭될 수 있고, 서열분석될 수 있다. 도 1b는 판독불가능한 연결을 갖는 복합체를 제시한다. 복합체는 (5'에서 3' 방향으로) 화학 물질 (별표), 고정된 불변 서열 (예를 들어, 헤드피스)에 이어 3개의 가변 코딩 서열 (예를 들어, 3개의 태그), 및 또 다른 고정된 불변 서열 (예를 들어, 테일피스)을 가지며, 여기서 고정된 불변 서열과 가변 코딩 서열 사이의 연결은 판독불가능하다. 각각의 가변 코딩 서열은 고정된 불변 서열인 5'-연결부 및 3'-연결부를 포함한다. 연결이 판독불가능하기 때문에, 연결에 걸쳐있고 폴리머라제에 의해 연장되어 올리고뉴클레오티드 단편의 형성을 가능하게 하는 릴레이 프라이머가 사용된다. 단편은 이어서 리가제를 사용하여 라이게이션되고, PCR에 의해 임의로 증폭되고, 서열분석된다. 판독 과정 (예를 들어, 임의적인 연장, 라이게이션, 임의적인 증폭 및 서열분석)은 선택 이후에 임의로 완전하게 수행될 수 있다. 대안적으로, 판독 과정의 임의적인 연장 및 라이게이션 일부는 선택 이전에 수행될 수 있다.
도 2는 프소랄렌에 의해 형성된 판독불가능한 연결을 갖는 예시적인 복합체를 제시한다. 개략도는 (5'에서 3' 방향으로) 가변 코딩 서열, 3'-연결부, 5'-연결부 및 또 다른 가변 코딩 서열을 제공한다. 3'-연결부 및 5'-연결부는 혼성화하여 듀플렉스를 형성하고, 프소랄렌 (삽입성, 광-반응성 모이어티)은 5'- 및 3'-연결부 사이에 판독불가능한 연결을 형성한다. 릴레이 프라이머는 5'- 및 3'-연결부에 혼성화하고, 판독불가능한 연결에 걸쳐서 존재한다. 복합체의 판독가능한 부분 (예를 들어, 가변 코딩 서열)은 폴리머라제에 의해 연장되어 올리고뉴클레오티드 단편을 형성한다. 단편 및 릴레이 프라이머는 리가제를 사용하여 라이게이션되고, PCR에 의해 임의로 증폭되고, 서열분석된다. 판독 과정 (예를 들어, 연장, 라이게이션, 임의적인 증폭 및 서열분석)은 선택 이후에 임의로 완전하게 수행될 수 있다. 대안적으로, 판독 과정의 연장 및 라이게이션 일부는 선택 이전에 수행될 수 있다.
도 3은 교차-연결 올리고뉴클레오티드에 의해 형성된 판독불가능한 연결을 갖는 예시적인 복합체를 제시한다. 상부 개략도에서, 복합체는 (5'에서 3' 방향으로) 화학 물질 (별표), 고정된 불변 서열 (예를 들어, 헤드피스), 가역적 공-반응성 기를 통해 교차-연결된 (예를 들어, 약 366 nm에서 교차-연결된 시아노비닐카르바졸 기, X로 표시된 교차-연결) 교차-연결 올리고뉴클레오티드에 이어, 5'- 및 3'-말단에서 고정된 불변 서열을 갖는 가변 코딩 서열 (예를 들어, 5'- 및 3'-연결부를 갖는 태그)을 포함한다. 교차-연결 올리고뉴클레오티드 및 가변 코딩 서열의 조합은 3회 더 반복된다. 이어서, 최종 교차-연결 올리고뉴클레오티드 및 또 다른 고정된 불변 서열 (예를 들어, 테일피스)이 이어진다. 교차-연결은 X로 표시된다. 다음으로, 복합체는 화학적 과정 및/또는 효소적 과정 (예를 들어, 리가제 및 임의로 키나제)에 의해 반응되어 태그를 라이게이션한다. 다음으로, 교차-연결 올리고뉴클레오티드를 방출시켜 주형을 형성한다 (예를 들어, 약 312 nm에서의 흡수 사용). 마지막으로, 주형을 PCR에 의해 임의로 증폭시키고 서열분석한다. 판독 과정 (예를 들어, 임의적인 키나제 단계, 라이게이션, 임의적인 증폭 및 서열분석)은 선택 이후에 임의로 완전하게 수행될 수 있다. 대안적으로, 판독 과정의 임의적인 키나제 단계 및 라이게이션 단계는 선택 이전에 수행될 수 있다.
도 4는 가역적 공-반응성 기 (시아노비닐카르바졸 기 및 티미딘의 쌍)에 의한 예시적인 가역 반응을 제시하며, 이들 기의 사용은 교차-연결 올리고뉴클레오티드와 올리고뉴클레오티드 태그의 고정된 불변 서열 사이에 교차-연결의 형성을 가능하게 한다. 가역적 공-반응성 기 (X 및 X'에 의해 표시됨)는 3'-연결부, 5'-연결부 및 교차-연결 올리고뉴클레오티드에 존재한다.
도 5는 2개의 시아노비닐 카르바졸 변형을 함유하는 올리고뉴클레오티드 CNVKJ, CNVK2_P_태그B, CNVK_2_NP_태그B 및 CNVK2_태그A를 제시한다.
도 6은 올리고뉴클레오티드 CNVKJ, CNVK2_P_태그B 및 CNVK2_태그A의 광화학적 교차-연결의 산물의 전기영동의 결과를 제시한다.
도 7은 정제된 CNVK2_P_태그B 및 CNVK2_태그A의 LCMS를 제시한다.
도 8은 출발 이중_CNVK_주형의 회수의 LCMS를 제시한다.
도 9는 CNVK2_P_태그B, CNVK2_태그A 및 CNVKJ 복합체의 T4 DNA 리가제 처리의 LCMS를 제시한다.
도 10은 CNVK2_NP_태그B와 CNVK2_태그A 및 CNVKJ의 광화학적으로 교차-연결된 비-인산화 모델 태그 쌍의 인산화-라이게이션 반응의 LCMS 결과를 제시한다.
도 11은 5'-말단에서 C2-프소랄렌에 의해 변형된 올리고뉴클레오티드 5PSO2_A9_TA 및 올리고뉴클레오티드 PSO_HP_A9_TCT를 제시한다.
도 12는 5'-말단에서 C2-프소랄렌에 의해 변형된 올리고뉴클레오티드 5PSO2_A9_TA 및 올리고뉴클레오티드 PSO_HP_A9_TCT의 하나의 태깅 이벤트를 모델링하기 위해 스템 내의 프소랄렌을 사용한 광화학적 올리고뉴클레오티드 교차-연결의 LCMS를 제시한다.
도 13은 올리고뉴클레오티드 태그1_PsoCVU 및 스플린트C_PsoC2 및 올리고뉴클레오티드 5PSOC2_A9_GA (5'-말단에서 C2 프소랄렌에 의해 변형된 것)를 제시한다.
도 14는 프소랄렌 광라이게이션의 개략도를 제시한다.
도 15는 프소랄렌 광라이게이션의 시간-경과 겔을 제시한다.
도 16은 5PsoC2_A9_GA 및 태그1_PsoCVU의 광라이게이션된 접합체의 LCMS를 제시한다.
도 17은 5'-비오티닐화 올리고뉴클레오티드 5Bio_태그_PsoCVU 및 5'-프소랄렌 올리고뉴클레오티드 5PsoC2_A9_GA를 스플린트 올리고뉴클레오티드 스플린트C_PsoC2와 함께 제시한다.
도 18은 프소랄렌-티미딘 광화학적으로 라이게이션된 올리고뉴클레오티드 접합체 (Bio_Pso)의 LCMS를 제시한다.
도 19는 말단 및 비-말단 프라이머 연장 및 라이게이션을 사용하여 Bio_Pso로부터 생성된 cDNA의 LCMS를 제시한다.
도 20은 말단 및 비-말단 프라이머 연장을 사용하여 Bio_Pso로부터 생성된 비-라이게이션 대조군 cDNA의 LCMS를 제시한다.
도 21은 올리고뉴클레오티드 CVU_G 및 CVU_A 및 올리고뉴클레오티드 태그1_PsoCVU, 스플린트C_CVU 및 스플린트A_CVU를 제시한다.
도 22는 조사된 5'-5-(카르복시)비닐-2'-데옥시우리딘과 3'-티미딘 사이에 형성된 광화학적 라이게이션 접합부의 구조를 제시한다.
도 23은 365 nm에서의 CVU 광라이게이션의 시간-경과 겔을 제시한다.
도 24는 CVU_G와 태그1_PsoCVU의 광화학적 라이게이션 산물의 LCMS를 제시한다.
도 25는 카르복시비닐 우리딘-티미딘 광화학적으로-라이게이션된 올리고뉴클레오티드 접합체 (Bio_CVU)의 LCMS를 제시한다.
도 26은 Bio_CVU 주형 마이너스 단일 dA 뉴클레오티드의 LCMS를 제시한다.
도 27은 올리고뉴클레오티드 S_IDTN3 및 S_IDT알킨을 제시한다.
도 28은 S_IDTN3 및 S_IDT알킨의 겔 정제된 접합체의 LCMS 분석을 제시한다.
도 29는 TKR_중심 및 S_IDTN3 올리고 및 5'-디벤조-시클로옥틴 (DBCO)-변형된 올리고 TKR_DBCO_S를 제시한다.
도 30은 TKR_DBCO_S와 TKR_중심 사이의 구리-무함유 클릭 반응의 LCMS 시간 경과를 제시한다.
도 31은 2cl_s 접합체의 LCMS를 제시한다.
도 32는 접합체_클릭_S 및 접합체_클릭_L을 제시한다.
도 33은 eP스플린트(ePsplint)의 존재 및 부재 하에서의 딥 벤트 (엑소-) 폴리머라제에 의한 접합체_클릭_L 및 접합체_클릭_S의 스플린트-의존성-재조합-매개 cDNA 생성/PCR 증폭을 제시한다. 24 사이클, 200 pM 출발 접합체 농도. 1 - 마커; 2 - 주형 없음; 3 - 주형 없음+eP스플린트; 4 - 접합체_클릭_S; 5 - 접합체_클릭_S+eP스플린트; 6 - 접합체_클릭_L; 5 - 접합체_클릭_L+eP스플린트.
도 34는 스플린트-의존성-재조합-매개 cDNA 생성/PCR 증폭의 제안된 메카니즘을 제시한다.
도 35는 유리 용액 중에서 개별적으로 및 함께 혼합하여 수행한, 딥 벤트 엑소-폴리머라제에 의한 접합체_클릭_S 및 접합체_클릭_L의 스플린트-의존성-재조합-매개 cDNA 생성/PCR 증폭을 제시한다. 모든 반응에는 eP스플린트가 보충되었다. 1 - 마커; 2 - 주형 없음; 3 - 접합체_클릭_S; 4 - 접합체_클릭_L; 5 - 접합체_클릭_S 및 접합체_클릭_L.
도 36은 태그 회합 (코딩된 정보)의 결과적인 셔플링 (손실)을 갖는, 유리 용액 중에서의 스플린트-의존성-재조합-매개 cDNA 생성/PCR 증폭 산물의 가능한 재조합 메카니즘을 제시한다.
도 37은 다음과 같은 조건 하에 유리 용액 중에서 및 유화된 수성 구획 중에서의 딥 벤트 (엑소-) 폴리머라제에 의한 접합체_클릭_S 및 접합체_클릭_L 혼합물의 재조합-매개 cDNA 생성/PCR 증폭을 제시한다: 35 사이클 동안 94℃에서 30초, 52℃에서 30초 및 72℃에서 60초, 및 초기 접합체 농도 5pM; 1 - 마커; 2 - 유리 용액, 3 - 유화된 수성 구획.
도 38은 TKR_S 및 TKR_L 접합체 및 그의 LCMS 트레이스를 제시한다.
도 39는 TKR_S 및 TKR_L의 딥 벤트 (엑소-) 폴리머라제 반복-의존성-재조합-매개 cDNA 생성/PCR 증폭을 제시한다. 1 - 마커, 2 - 주형 없음, 3 - TKR_S, 4- TKR_L, 5- TKR L 및 TKR_S. 조건: 10x 써모폴(Thermopol) 완충제 5 uL; 각각의 전방향 및 역방향 프라이머의 10 uM 용액 2.5 uL; 10 mM dNTP 믹스 (NEB) 2.5 uL; 각각의 접합체 또는 그의 1:1 혼합물의 최종 농도 40 pM, 딥 벤트 (엑소-) 폴리머라제 2.5 uL 및 50 uL까지 물. 반응은 다음과 같이 21회 사이클링하였다: 94℃에서 30초, 52℃에서 30초 및 72℃에서 60초.
도 40은 유리 용액 중에서의 혼합된 TKR_S 및 TKR_L의 반복-의존성-재조합-매개 cDNA 생성/PCR 증폭의 클로닝된 증폭 산물로부터 유래된 서열 데이터를 제시한다.
도 41은 TKR_2_클릭_S 및 TKR_2_클릭_L 접합체 및 그의 LCMS 트레이스를 제시한다.
도 42는 유리 용액 중에서의 2_클릭_S 및 2_클릭_L의 딥 벤트 (엑소-) 폴리머라제 반복-의존성-재조합-매개 cDNA 생성/PCR 증폭을 제시한다. 1 - 마커; 2 - 주형 대조군 없음; 3 - 2_클릭_S; 4 - 2_클릭_L; 5 - 2_클릭_S 및 2_클릭_L의 1:1 혼합물. 조건: 10x 써모폴 완충제 5 uL; 각각의 전방향 및 역방향 프라이머의 10 uM 용액 2.5 uL; 10 mM dNTP 믹스 (NEB) 2.5 uL; 각각의 접합체 또는 그의 1:1 혼합물의 최종 농도 40 pM, 딥 벤트 (엑소-) 폴리머라제 2.5 uL 및 50 uL까지 물. 반응은 다음과 같이 22회 사이클링하였다: 94℃에서 30초, 52℃에서 30초 및 72℃에서 60초.
도 43은 유리 용액 중에서의 TKR_2_클릭_S 및 TKR_2_클릭_L 혼합물의 반복-의존성-재조합-매개 cDNA 생성/PCR 증폭 산물의 클로닝된 증폭 산물로부터 유래된 서열 데이터를 제시한다.
본 발명자들은 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 적어도 하나의 연결 (예를 들어, 화학적 연결)을 갖는 복합체를 개발하였다. 태그 라이브러리가 폴리머라제의 판독가능성에 의해 제약을 받지 않게 하는 것은 사용가능한 태깅 방법의 범위를 매우 확대한다. 가능한 비제한적 이점은 태그 및/또는 라이브러리 구성원의 감소된 질량; 다양한 반응 조건에서의 (예를 들어, 화학 물질 및 태그 합성 둘 다에 적합한 수성 및/또는 유기 조건에서의) 라이브러리 구성원의 증가된 용해도; 증가된 안정성 (예를 들어, 수성 및/또는 유기 반응 조건에서; 이러한 올리고뉴클레오티드 태그 및 연결은 이러한 연결이 없는 태그에 비해 특정한 반응 조건에 대해 보다 저항성일 수 있음); 감소된 비용 (예를 들어, 고가 효소 시약의 사용의 감소); 증가된 사용 용이성 (예를 들어, 시아노비닐카르바졸 교차-연결의 사용은 넓은 5.5-9.5의 pH 범위에 걸쳐서 이루어지고, 이는 복합체의 화학 물질-부분을 형성하는데 적합한 반응 조건 하에 교차-연결을 가능하게 함); 감소된 수의 반응 단계 및 감소된 시약(들)의 사용 (예를 들어, 예컨대 수천개의 개별적인 소형 분취액이 독립적으로 처리될 것을 필요로 하는 조합 스플릿 반응 동안의 완충제 교환 단계; 침전 단계 또는 pH-변형 단계의 감소된 사용); 증가된 충실도 (예를 들어, 미스-태깅 이벤트의 발생 빈도를 감소시키기 위해 혼성화-매개 방법이 사용되는 경우); 및 화학 물질을 형성하는 반응 조건과의 증가된 상용성 (예를 들어, 직교형 관능기의 사용을 가능하게 함, 여기서 스플릿/믹스-후 단계(들) 동안에는 발생하지 않을 독특한 태깅 화학 (예를 들어, UV 조사의 사용)이 사용될 수 있으며, 이는 또한 미스-태깅 이벤트의 빈도를 감소시킬 것임)을 포함한다.
이러한 연결은 폴리머라제에 의한 감소된 판독능을 가질 수 있기 때문에, 본 발명자들은 또한 이러한 복합체의 서열분석을 가능하게 하는 방법을 개발하였다. 이들 방법은 연결에 걸쳐있는 릴레이 프라이머의 사용 및/또는 방출가능한 교차-연결 올리고뉴클레오티드의 사용을 포함한다. 이들 복합체 및 방법은, 특정한 태그와 특정한 화학 반응 또는 빌딩 블록 사이의 코딩된 관계를 확립함으로써 선택가능한 화학 물질의 다양한 라이브러리를 생성하기 위해 사용될 수 있다. 하나 이상의 화학 물질을 확인하기 위해, 확립된 관계를 사용하여 올리고뉴클레오티드 태그를 증폭, 클로닝, 서열분석 및 상호관련시킬 수 있다. 이들 복합체의 라이브러리를 생성하고 태깅하는 방법은 하기에 상세하게 기재된다.
복합체
본 발명은 화학 물질, 하나 이상의 태그, 및 상기 화학 물질 및 하나 이상의 태그와 작동가능하게 회합된 헤드피스를 포함하는 복합체를 특징으로 한다. 헤드피스와 태그 사이 또는 2개의 태그 사이의 연결 중 적어도 하나는 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 연결이다. 화학 물질, 헤드피스, 태그, 연결 및 이관능성 스페이서가 하기에 추가로 기재된다.
화학 물질
본 발명의 화학 물질 또는 구성원 (예를 들어, 소형 분자 또는 펩티드)은 하나 이상의 빌딩 블록을 포함할 수 있고, 임의로 하나 이상의 스캐폴드를 포함할 수 있다.
스캐폴드 S는 단일 원자 또는 분자 스캐폴드일 수 있다. 예시적인 단일 원자 스캐폴드는 탄소 원자, 붕소 원자, 질소 원자 또는 인 원자 등을 포함한다. 예시적인 다원자 스캐폴드는 시클로알킬 기, 시클로알케닐 기, 헤테로시클로알킬 기, 헤테로시클로알케닐 기, 아릴 기 또는 헤테로아릴 기를 포함한다. 헤테로아릴 스캐폴드의 특정한 실시양태는 트리아진, 예컨대 1,3,5-트리아진, 1,2,3-트리아진 또는 1,2,4-트리아진; 피리미딘; 피라진; 피리다진; 푸란; 피롤; 피롤린; 피롤리딘; 옥사졸; 피라졸; 이속사졸; 피란; 피리딘; 인돌; 인다졸; 또는 퓨린을 포함한다.
스캐폴드 S는 임의의 유용한 방법에 의해 태그에 작동가능하게 연결될 수 있다. 한 예에서, S는 헤드피스에 직접적으로 연결된 트리아진이다. 이러한 예시적인 스캐폴드를 수득하기 위해, 트리클로로트리아진 (즉, 3개의 염소를 갖는 트리아진의 염소화 전구체)을 헤드피스의 친핵성 기와 반응시킨다. 이러한 방법을 사용하여 S는 치환에 이용가능한 염소가 있는 3개의 위치를 가지며, 여기서 2개의 위치는 다양성 노드로 이용가능하고, 1개의 위치는 헤드피스에 부착된다. 다음으로, 빌딩 블록 An을 스캐폴드의 다양성 노드에 부가하고, 빌딩 블록 An을 코딩하는 태그 An ("태그 An")을 헤드피스에 라이게이션시키며, 여기서 이들 2 단계는 임의의 순서로 수행될 수 있다. 이어서, 빌딩 블록 Bn을 남은 다양성 노드에 부가하고, 빌딩 블록 Bn을 코딩하는 태그 Bn을 태그 An의 말단에 라이게이션시킨다. 또 다른 예에서, S는 태그에 작동가능하게 연결된 트리아진이며, 여기서 트리클로로트리아진은 태그의 PEG, 지방족 또는 방향족 링커의 친핵성 기 (예를 들어, 아미노 기)와 반응한다. 빌딩 블록 및 회합된 태그는 본원에 기재된 바와 같이 부가될 수 있다.
또 다른 예에서, S는 빌딩 블록 An에 작동가능하게 연결된 트리아진이다. 이러한 스캐폴드를 수득하기 위해, 2개의 다양성 노드 (예를 들어, 친전자성 기 및 친핵성 기, 예컨대 Fmoc-아미노산)를 갖는 빌딩 블록 An을 링커의 친핵성 기 (예를 들어, 헤드피스에 부착된 PEG, 지방족 또는 방향족 링커의 말단 기)와 반응시킨다. 이어서, 트리클로로트리아진을 빌딩 블록 An의 친핵성 기와 반응시킨다. 이러한 방법을 사용하여, S의 모든 3개의 염소 위치는 빌딩 블록에 대한 다양성 노드로서 사용된다. 본원에 기재된 바와 같이, 추가의 빌딩 블록 및 태그를 부가할 수 있고, 추가의 스캐폴드 Sn을 부가할 수 있다.
예시적인 빌딩 블록 An은, 예를 들어 아미노산 (예를 들어, 알파-, 베타-, 감마-, 델타- 및 엡실론-아미노산, 뿐만 아니라 천연 및 비천연 아미노산의 유도체), 아민과의 화학적-반응성 반응물 (예를 들어, 아지드 또는 알킨 쇄), 또는 티올 반응물 또는 그의 조합을 포함한다. 빌딩 블록 An의 선택은, 예를 들어 링커에 사용되는 반응성 기의 성질, 스캐폴드 모이어티의 성질 및 화학적 합성에 사용되는 용매에 따라 달라진다.
예시적인 빌딩 블록 Bn 및 Cn는 화학 물질의 임의의 유용한 구조 단위, 예컨대 임의로 치환된 방향족 기 (예를 들어, 임의로 치환된 페닐 또는 벤질), 임의로 치환된 헤테로시클릴 기 (예를 들어, 임의로 치환된 퀴놀리닐, 이소퀴놀리닐, 인돌릴, 이소인돌릴, 아자인돌릴, 벤즈이미다졸릴, 아자벤즈이미다졸릴, 벤즈이속사졸릴, 피리디닐, 피페리딜 또는 피롤리디닐), 임의로 치환된 알킬 기 (예를 들어, 임의로 치환된 선형 또는 분지형 C1-6 알킬 기 또는 임의로 치환된 C1-6 아미노알킬 기), 또는 임의로 치환된 카르보시클릴 기 (예를 들어, 임의로 치환된 시클로프로필, 시클로헥실 또는 시클로헥세닐)를 포함한다. 특히 유용한 빌딩 블록 Bn 및 Cn은, 반응성 기이거나 또는 반응성 기를 형성하도록 화학적으로 변형될 수 있는 하나 또는 임의적인 치환기를 갖는 임의로 치환된 기 (예를 들어, 본원에 기재된 임의의 것)와 같은, 하나 이상의 반응성 기를 갖는 것을 포함한다. 예시적인 반응성 기는 하나 이상의 아민 (-NR2, 여기서 각각의 R은 독립적으로 H 또는 임의로 치환된 C1-6 알킬임), 히드록시, 알콕시 (-OR, 여기서 R은 임의로 치환된 C1-6 알킬, 예컨대 메톡시임), 카르복시 (-COOH), 아미드 또는 화학적-반응성 치환기를 포함한다. 예를 들어, 태그 Bn 또는 Cn에 제한 부위를 도입시킬 수 있으며, 여기서 복합체는 PCR 및 상응하는 제한 효소 중 하나에 의한 제한 소화를 수행함으로써 확인될 수 있다.
헤드피스
라이브러리에서, 헤드피스는 각각의 화학 물질을 그의 코딩 올리고뉴클레오티드 태그에 작동가능하게 연결시킨다. 일반적으로, 헤드피스는 추가로 유도체화될 수 있는 2개의 관능기를 갖는 출발 올리고뉴클레오티드이며, 여기서 제1 관능기는 화학 물질 (또는 그의 성분)을 헤드피스에 작동가능하게 연결시키고, 제2 관능기는 하나 이상의 태그를 헤드피스에 작동가능하게 연결시킨다. 이관능성 스페이서는 헤드피스와 화학 물질 사이의 스페이싱 모이어티로서 임의로 사용될 수 있다.
헤드피스의 관능기는 화학 물질의 성분과의 공유 결합 및 태그와의 또 다른 공유 결합을 형성하는데 사용될 수 있다. 성분은 다양성 노드를 갖는 스캐폴드 또는 빌딩 블록과 같은 소분자의 임의의 일부일 수 있다. 대안적으로, 헤드피스는 관능기 (예를 들어, 히드록실, 아민, 카르복실, 술프히드릴, 알키닐, 아지도 또는 포스페이트 기)로 종결되는 스페이서 (즉, 라이브러리에서 형성하고자 하는 소분자로부터 헤드피스를 분리시키는 스페이싱 모이어티)를 제공하기 위해 유도체화될 수 있고, 관능기는 화학 물질의 성분과 공유적 연결을 형성하는데 사용된다. 스페이서는 헤드피스의 5'-말단, 내부 위치 중 하나, 또는 3'-말단에 부착될 수 있다. 스페이서가 내부 위치 중 하나에 부착되는 경우에, 스페이서는 유도체화된 염기 (예를 들어, 우리딘의 C5 위치)에 작동가능하게 연결될 수 있거나, 또는 관련 기술분야에 공지된 표준 기술을 사용하여 올리고뉴클레오티드 내에 내부적으로 배치될 수 있다. 예시적인 스페이서가 본원에 기재되어 있다.
헤드피스는 임의의 유용한 구조를 가질 수 있다. 헤드피스는, 예를 들어 1 내지 100개 뉴클레오티드 길이, 바람직하게는 5 내지 20개 뉴클레오티드 길이, 및 가장 바람직하게는 5 내지 15개 뉴클레오티드 길이일 수 있다. 헤드피스는 단일-가닥 또는 이중-가닥일 수 있고, 본원에 기재된 바와 같은 천연 또는 변형된 뉴클레오티드로 이루어질 수 있다. 예를 들어, 화학적 모이어티는 헤드피스의 3'-말단 또는 5'-말단에 작동가능하게 연결될 수 있다. 특정한 실시양태에서, 헤드피스는 서열 내의 상보적 염기에 의해 형성된 헤어핀 구조를 포함한다. 예를 들어, 화학적 모이어티는 헤드피스의 내부 위치, 3'-말단 또는 5'-말단에 작동가능하게 연결될 수 있다.
일반적으로, 헤드피스는 5'- 또는 3'-말단 상에 중합, 효소적 라이게이션 또는 화학 반응에 의해 올리고뉴클레오티드 태그 결합을 가능하게 하는 비-자기-상보적 서열을 포함한다. 헤드피스는 올리고뉴클레오티드 태그의 라이게이션 및 임의적인 정제 및 인산화 단계를 가능하게 할 수 있다. 마지막 태그의 부가 후에, 추가의 어댑터 서열을 마지막 태그의 5'-말단에 부가할 수 있다. 예시적인 어댑터 서열은 프라이머-결합 서열 또는 표지 (예를 들어, 비오틴)를 갖는 서열을 포함한다. 많은 빌딩 블록 및 상응하는 태그가 사용되는 경우에 (예를 들어, 100개), 필요한 개수의 태그를 생성하기 위해 올리고뉴클레오티드 합성 단계 동안 믹스-및-스플릿 전략을 사용할 수 있다. DNA 합성을 위한 이러한 믹스-및-스플릿 전략은 관련 기술분야에 공지되어 있다. 생성된 라이브러리 구성원은 관심 표적(들)에 대한 결합 실체의 선택 이후에 PCR에 의해 증폭될 수 있다.
헤드피스 또는 복합체는 하나 이상의 프라이머-결합 서열을 임의로 포함할 수 있다. 예를 들어, 헤드피스는 헤어핀의 루프 영역에 증폭을 위한 프라이머-결합 영역으로서 역할을 하는 서열을 가지며, 여기서 프라이머-결합 영역은 헤드피스 내의 서열보다 그의 상보적인 프라이머 (예를 들어, 플랭킹 식별자 영역을 포함할 수 있음)에 대해 더 높은 용융 온도를 갖는다. 다른 실시양태에서, 복합체는 하나 이상의 빌딩 블록을 코딩하는 하나 이상의 태그의 각 측면에 (예를 들어, PCR 반응을 가능하게 하는) 2개의 프라이머-결합 서열을 포함한다. 대안적으로, 헤드피스는 5'- 또는 3'-말단에 1개의 프라이머-결합 서열을 함유할 수 있다. 다른 실시양태에서, 헤드피스는 헤어핀이고 루프 영역은 프라이머-결합 부위를 형성하거나, 또는 프라이머-결합 부위는 루프의 3' 측의 헤드피스에 대한 올리고뉴클레오티드의 혼성화를 통해 도입된다. 헤드피스의 3'-말단에 상동성인 영역을 함유하고 그의 5'-말단에서 (예를 들어, PCR 반응을 가능하게 하는) 프라이머-결합 영역을 운반하는 프라이머 올리고뉴클레오티드는 헤드피스에 혼성화될 수 있고, 빌딩 블록 또는 빌딩 블록의 부가를 코딩하는 태그를 함유할 수 있다. 프라이머 올리고뉴클레오티드는 생물정보학 분석을 위해 포함된 추가의 정보, 예컨대 무작위화된 뉴클레오티드의 영역, 예를 들어 2 내지 16개 뉴클레오티드 길이를 함유할 수 있다.
헤드피스는 임의의 유용한 방법에 의해 달성될 수 있는 헤어핀 구조를 임의로 포함할 수 있다. 예를 들어, 헤드피스는 예컨대 왓슨-크릭 DNA 염기 쌍형성 (예를 들어, 아데닌-티민 및 구아닌-시토신)에 의해 및/또는 워블 염기 쌍형성 (예를 들어, 구아닌-우라실, 이노신-우라실, 이노신-아데닌 및 이노신-시토신)에 의해 분자간 염기 쌍형성 파트너를 형성하는 상보적인 염기를 포함할 수 있다. 또 다른 예에서, 헤드피스는 비변형된 뉴클레오티드와 비교하여 더 높은 친화도 듀플렉스 형성을 형성할 수 있는 변형되거나 치환된 뉴클레오티드를 포함할 수 있으며, 이러한 변형되거나 치환된 뉴클레오티드는 관련 기술분야에 공지되어 있다. 또 다른 예에서, 헤드피스는 헤어핀 구조를 형성하기 위한 하나 이상의 교차-연결된 염기를 포함한다. 예를 들어, 단일 가닥 내의 염기 또는 상이한 이중 가닥 내의 염기는, 예를 들어 프소랄렌을 사용함으로써 교차-연결될 수 있다.
헤드피스 또는 복합체는 검출을 가능하게 하는 하나 이상의 표지를 임의로 포함할 수 있다. 예를 들어, 헤드피스, 하나 이상의 올리고뉴클레오티드 태그 및/또는 하나 이상의 프라이머 서열은 동위원소, 방사성영상화제, 마커, 트레이서, 형광 표지 (예를 들어, 로다민 또는 플루오레세인), 화학발광 표지, 양자 점 및 리포터 분자 (예를 들어, 비오틴 또는 his-태그)를 포함할 수 있다.
다른 실시양태에서, 헤드피스 또는 태그는 반-, 감소된- 또는 비-수성 (예를 들어, 유기) 조건 하에서 용해도를 지지하도록 변형될 수 있다. 예를 들어, 그의 상보적인 염기에 수소 결합할 수 있는 능력은 유의하게 방해하지 않으면서, T 또는 C 염기의 C5 위치를 지방족 쇄로 변형시킴으로써 헤드피스 또는 태그의 뉴클레오티드 염기를 보다 소수성이 되게 할 수 있다. 예시적인 변형되거나 치환된 뉴클레오티드는 5'-디메톡시트리틸-N4-디이소부틸아미노메틸리덴-5-(1-프로피닐)-2'-데옥시시티딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 5'-디메톡시트리틸-5-(1-프로피닐)-2'-데옥시우리딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 5'-디메톡시트리틸-5-플루오로-2'-데옥시우리딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 및 5'-디메톡시트리틸-5-(피렌-1-일-에티닐)-2'-데옥시우리딘 또는 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트이다.
또한, 헤드피스 올리고뉴클레오티드는 유기 용매 중에서의 용해도를 증진시키는 변형으로 산재될 수 있다. 예를 들어, 아조벤젠 포스포르아미다이트는 헤드피스 설계 내로 소수성 모이어티를 도입할 수 있다. 소수성 아미다이트의 헤드피스 내로의 이러한 삽입은 분자 내의 어디에서나 이루어질 수 있다. 그러나, 삽입은, 선택이 완료된 직후의 라이브러리 합성 또는 후속 PCR 동안, 또는 태그 디컨볼루션에 사용되는 경우에 마이크로어레이 분석 동안, 추가의 DNA 태그를 사용하는 후속 태깅을 방해할 수 없다. 본원에 기재된 헤드피스 설계에의 이러한 부가는 헤드피스를, 예를 들어 15%, 25%, 30%, 50%, 75%, 90%, 95%, 98%, 99% 또는 100% 유기 용매 중에서 용해되게 할 것이다. 따라서, 헤드피스 설계에의 소수성 잔기의 부가는 헤드피스가 올리고뉴클레오티드 태깅에 대해 적격이 되게 하면서, 반- 또는 비-수성 (예를 들어, 유기) 조건에서의 용해도가 개선되게 한다. 추가로, 라이브러리에 후속해서 도입된 DNA 태그는 T 또는 C 염기의 C5 위치에서 또한 변형될 수 있으며, 이로써 이들은 또한 라이브러리 합성의 후속 단계에서 라이브러리를 보다 소수성이 되게 하고 유기 용매 중에서 보다 가용성이 되게 한다.
특정한 실시양태에서, 헤드피스 및 제1 태그는 동일한 실체일 수 있으며, 즉 다수의 헤드피스-태그 실체는 공통 부분 (예를 들어, 프라이머-결합 영역)은 모두 공유하고 또 다른 부분 (예를 들어, 코딩 영역)은 모두 상이하게 구축될 수 있다. 이들은 "스플릿" 단계에서 사용될 수 있고, 코딩한 이벤트가 발생한 이후에 풀링될 수 있다.
특정한 실시양태에서, 헤드피스는 예를 들어, 예컨대 특정 라이브러리와 관련된 특정한 서열을 사용하는 것에 의해 제1 스플릿(들) 단계를 코딩하는 서열 또는 라이브러리의 아이덴티티를 코딩하는 서열을 포함함으로써 정보를 코딩할 수 있다.
올리고뉴클레오티드 태그
본원에 기재된 올리고뉴클레오티드 태그 (예를 들어, 태그 또는 헤드피스의 부분 또는 테일피스의 부분)는 임의의 유용한 정보, 예컨대 분자, 화학 물질의 부분, 성분 (예를 들어, 스캐폴드 또는 빌딩 블록)의 부가, 라이브러리의 헤드피스, 라이브러리의 아이덴티티, 하나 이상의 라이브러리 구성원의 사용 (예를 들어, 라이브러리의 분취액에서의 구성원의 사용), 및/또는 라이브러리 구성원의 기원 (예를 들어, 기원 서열의 사용에 의함)을 코딩하는데 사용될 수 있다.
올리고뉴클레오티드의 임의의 서열은 임의의 정보를 코딩하는데 사용될 수 있다. 따라서, 1개의 올리고뉴클레오티드 서열은 2종 이상의 정보를 코딩하거나 또는 1종 이상의 정보를 또한 코딩하는 출발 올리고뉴클레오티드를 제공하기 위한 것과 같은 1종 초과의 목적을 제공할 수 있다. 예를 들어, 제1 태그는 제1 빌딩 블록의 부가, 뿐만 아니라 라이브러리의 확인을 코딩할 수 있다. 또 다른 예에서, 화학 물질을 태그에 작동가능하게 연결시키는 출발 올리고뉴클레오티드를 제공하기 위해 헤드피스가 사용될 수 있으며, 여기서 헤드피스는 라이브러리의 아이덴티티를 코딩하는 서열 (즉, 라이브러리-확인 서열)을 추가로 포함한다. 따라서, 본원에 기재된 임의의 정보는 분리된 올리고뉴클레오티드 태그 내에 코딩될 수 있거나, 또는 동일한 올리고뉴클레오티드 서열 (예를 들어, 올리고뉴클레오티드 태그, 예컨대 태그 또는 헤드피스) 내에 조합 및 코딩될 수 있다.
빌딩 블록 서열은 빌딩 블록의 아이덴티티 및/또는 빌딩 블록으로 수행되는 결합 반응의 유형을 코딩한다. 이러한 빌딩 블록 서열은 태그에 포함되어 있으며, 여기서 태그는 하기 기재되는 하나 이상의 서열 유형 (예를 들어, 라이브러리-확인 서열, 사용 서열 및/또는 기원 서열)을 임의로 포함할 수 있다.
라이브러리-확인 서열은 특정한 라이브러리의 아이덴티티를 코딩한다. 2개 이상의 라이브러리의 혼합을 가능하게 하기 위해, 라이브러리 구성원은 예컨대 라이브러리-확인 태그 (즉, 라이브러리-확인 서열을 포함하는 올리고뉴클레오티드)에, 라이게이션된 태그에, 헤드피스 서열의 일부에, 또는 테일피스 서열에 하나 이상의 라이브러리-확인 서열을 함유할 수 있다. 이들 라이브러리-확인 서열은 코딩 관계를 추론하는데 사용될 수 있으며, 여기서 태그의 서열은 번역되고, 화학적 (합성) 히스토리 정보와 상호관련된다. 따라서, 이들 라이브러리-확인 서열은 선택, 증폭, 정제, 서열분석 등을 위해 2개 이상의 라이브러리가 함께 혼합되게 한다.
사용 서열은 라이브러리의 개별 분취액 내의 하나 이상의 라이브러리 구성원의 히스토리 (즉, 사용)를 코딩한다. 예를 들어, 분리된 분취액은 상이한 반응 조건, 빌딩 블록 및/또는 선택 단계로 처리될 수 있다. 특히, 이러한 서열을 사용하여 이러한 분취액을 확인하고 그의 히스토리 (사용)를 추론할 수 있으며, 그에 의해 선택, 증폭, 정제, 서열분석 등을 위해 샘플을 함께 혼합시키고자 하는 목적으로 히스토리 (사용)가 상이한 동일한 라이브러리의 분취액을 함께 혼합하는 것이 가능하다 (예를 들어, 별개의 선택 실험). 이들 사용 서열은 헤드피스, 테일피스, 태그, 사용 태그 (즉, 사용 서열을 포함하는 올리고뉴클레오티드), 또는 본원에 기재된 임의의 다른 태그 (예를 들어, 라이브러리-확인 태그 또는 기원 태그)에 포함될 수 있다.
기원 서열은 라이브러리 구성원의 기원을 코딩하는 임의의 유용한 길이 (예를 들어, 약 6개 올리고뉴클레오티드)의 축중성 (무작위, 확률적으로-산출된) 올리고뉴클레오티드 서열이다. 이러한 서열은 모든 측면에서 그 외에는 동일한 라이브러리 구성원을 서열 정보에 의해 구분가능한 실체로 확률적으로 세분하는 역할을 하며, 이로써 고유한 전구체 주형 (예를 들어, 선택된 라이브러리 구성원)으로부터 유래된 증폭 산물의 관찰은 동일한 전구체 주형 (예를 들어, 선택된 라이브러리 구성원)으로부터 유래된 다중 증폭 산물에 대한 관찰과 구분될 수 있다. 예를 들어, 라이브러리 형성 이후 및 선택 단계 이전에, 각 라이브러리 구성원은 예컨대 기원 태그에서 상이한 기원 서열을 포함할 수 있다. 선택 이후에, 선택된 라이브러리 구성원을 증폭하여 증폭 산물을 생성할 수 있고, (예를 들어 기원 태그 내에) 기원 서열을 포함할 것으로 예상되는 라이브러리 구성원의 부분을 관찰할 수 있고, 각각의 다른 라이브러리 구성원 내의 기원 서열과 비교할 수 있다. 기원 서열은 축중성이기 때문에, 각각의 라이브러리 구성원의 각각의 증폭 산물은 상이한 기원 서열을 가질 것이다. 그러나, 증폭 산물에서의 동일한 기원 서열의 관찰은 동일한 주형 분자로부터 유래된 다중 앰플리콘을 나타낼 수 있다. 증폭후와는 대조적으로, 증폭 이전에 코딩 태그 집단의 통계 및 집단통계를 결정하는 것을 목적으로 하는 경우에, 기원 태그가 사용될 수 있다. 이들 기원 서열은 헤드피스, 테일피스, 태그, 기원 태그 (즉 기원 서열을 포함하는 올리고뉴클레오티드), 또는 본원에 기재된 임의의 다른 태그 (예를 들어, 라이브러리-확인 태그 또는 사용 태그)에 포함될 수 있다.
본원에 기재된 서열 유형 중 임의의 것이 헤드피스에 포함될 수 있다. 예를 들어, 헤드피스는 하나 이상의 빌딩 블록 서열, 라이브러리-확인 서열, 사용 서열 또는 기원 서열을 포함할 수 있다.
본원에 기재된 이들 서열 중 임의의 것이 테일피스에 포함될 수 있다. 예를 들어, 테일피스는 하나 이상의 라이브러리-확인 서열, 사용 서열 또는 기원 서열을 포함할 수 있다.
본원에 기재된 태그 중 임의의 것은 고정된 서열을 갖는 5'- 또는 3'-말단에서의 또는 그에 근접한 연결부를 포함할 수 있다. 연결부는 반응성 기 (예를 들어, 화학-반응성 기 또는 광-반응성 기)를 제공함으로써 또는 연결을 가능하게 하는 작용제 (예를 들어, 연결부(들) 또는 교차-연결 올리고뉴클레오티드 내의 삽입성 모이어티 또는 가역적 반응성 기의 작용제)를 위한 부위를 제공함으로써 연결 (예를 들어, 화학적 연결)의 형성을 용이하게 한다. 각각의 5'-연결부는 동일하거나 상이할 수 있고, 각각의 3'-연결부는 동일하거나 상이할 수 있다. 하나 초과의 태그를 갖는 예시적인 비제한적 복합체에서, 각각의 태그는 5'-연결부 및 3'-연결부를 포함할 수 있으며, 여기서 각각의 5'-연결부는 동일한 서열을 갖고, 각각의 3'-연결부는 동일한 서열을 갖는다 (예를 들어, 여기서 5'-연결부의 서열은 3'-연결부의 서열과 동일하거나 상이할 수 있음). 연결부는 하나 이상의 연결을 위해 사용될 수 있는 서열을 제공한다. 릴레이 프라이머의 결합 또는 교차-연결 올리고뉴클레오티드의 혼성화를 가능하게 하기 위해, 연결부는 연결 (예를 들어, 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 연결, 예컨대 화학적 연결)을 가능하게 하는 하나 이상의 관능기를 포함할 수 있다.
이들 서열은 올리고뉴클레오티드에 대해 본원에 기재된 임의의 변형, 예컨대 유기 용매 중의 용해도를 증진시키거나 (예를 들어, 예컨대 헤드피스에 대해 본원에 기재된 임의의 것), 천연 포스포디에스테르 연결의 유사체 (예를 들어, 포스포로티오에이트 유사체)를 제공하거나, 또는 하나 이상의 비-천연 올리고뉴클레오티드 (예를 들어, 2'-치환된 뉴클레오티드, 예컨대 2'-O-메틸화 뉴클레오티드 및 2'-플루오로 뉴클레오티드, 또는 본원에 기재된 임의의 것)를 제공하는 하나 이상의 변형을 포함할 수 있다.
이들 서열은 올리고뉴클레오티드에 대해 본원에 기재된 임의의 특징을 포함할 수 있다. 예를 들어, 이들 서열은 20개 미만의 뉴클레오티드인 태그 (예를 들어, 본원에 기재된 바와 같음)에 포함될 수 있다. 다른 예에서, 이들 서열 중 하나 이상을 포함하는 태그는 거의 동일한 질량을 갖거나 (예를 들어, 각각의 태그는 특정 가변성을 코딩하는 특정 세트 내에서의 태그 사이의 평균 질량에서 약 +/-10%인 질량을 갖거나); 프라이머-결합 (예를 들어, 불변) 영역이 결여되어 있거나; 불변 영역이 결여되어 있거나; 감소된 길이 (예를 들어 30개 뉴클레오티드 미만, 25개 뉴클레오티드 미만, 20개 뉴클레오티드 미만, 19개 뉴클레오티드 미만, 18개 뉴클레오티드 미만, 17개 뉴클레오티드 미만, 16개 뉴클레오티드 미만, 15개 뉴클레오티드 미만, 14개 뉴클레오티드 미만, 13개 뉴클레오티드 미만, 12개 뉴클레오티드 미만, 11개 뉴클레오티드 미만, 10개 뉴클레오티드 미만, 9개 뉴클레오티드 미만, 8개 뉴클레오티드 미만 또는 7개 뉴클레오티드 미만의 길이)의 불변 영역을 갖는다.
이러한 길이의 라이브러리 및 올리고뉴클레오티드를 서열분석하는 전략은, 판독 충실도 또는 서열분석 심도를 각각 증가시키기 위해 연접 또는 연계 전략을 임의로 포함할 수 있다. 특히, 프라이머-결합 영역이 결여되어 있는 코딩된 라이브러리의 선택은, 문헌 [Jarosch et al., Nucleic Acids Res. 34: e86 (2006)]에 기재된 바와 같이 SELEX에 대한 문헌에 기재되어 있으며, 상기 문헌은 본원에 참조로 포함된다. 예를 들어, 라이브러리 구성원은 복합체의 5'-말단에 제1 어댑터 서열 및 복합체의 3'-말단에 제2 어댑터 서열을 포함하도록 (예를 들어, 선택 단계 이후에) 변형될 수 있으며, 여기서 제1 서열은 제2 서열에 실질적으로 상보적이고, 듀플렉스를 형성한다. 수율을 추가로 개선시키기 위해 2개의 고정된 현수 뉴클레오티드 (예를 들어, CC)가 5'-말단에 부가된다. 특정한 실시양태에서, 제1 어댑터 서열은 5'-GTGCTGC-3' (서열 1)이고, 제2 어댑터 서열은 5'-GCAGCACCC-3' (서열 2)이다.
연결
본 발명의 연결은 정보를 코딩하는 올리고뉴클레오티드들 사이 (예를 들어, 예컨대 헤드피스와 태그 사이, 2개의 태그 사이 또는 태그와 테일피스 사이)에 존재하며, 여기서 이러한 연결은 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 임의의 연결을 포함한다. 예시적인 연결은 하나 이상의 화학-반응성 기, 광-반응성 기, 삽입성 모이어티, 교차-연결 올리고뉴클레오티드 또는 가역적 공-반응성 기를 비롯한 화학적 연결을 포함한다.
연결은 폴리머라제가 그 연결을 판독 또는 전위하는 감소된 능력을 갖는지 여부를 결정하기 위해 시험될 수 있다. 이러한 능력은 임의의 유용한 방법, 예컨대 액체 크로마토그래피-질량 분광측정법, RT-PCR 분석, 서열 집단통계 및/또는 PCR 분석에 의해 시험될 수 있다.
특정한 실시양태에서, 화학적 라이게이션은 연결을 제공하기 위한 하나 이상의 화학-반응성 쌍의 사용을 포함한다. 예시적인 화학-반응성 쌍은 후이스겐 1,3-쌍극자 고리화첨가 반응을 통해 트리아졸을 형성하는 임의로 치환된 알키닐 기 및 임의로 치환된 아지도 기를 포함하는 쌍; 딜스-알더 반응을 통해 시클로알케닐을 형성하는 4 π-전자계를 갖는 임의로 치환된 디엔 (예를 들어, 임의로 치환된 1,3-불포화 화합물, 예컨대 임의로 치환된 1,3-부타디엔, 1-메톡시-3-트리메틸실릴옥시-1,3-부타디엔, 시클로펜타디엔, 시클로헥사디엔 또는 푸란) 및 2 π-전자계를 갖는 임의로 치환된 친디엔체 또는 임의로 치환된 친헤테로디엔체 (예를 들어, 임의로 치환된 알케닐 기 또는 임의로 치환된 알키닐 기)를 포함하는 쌍; 개환 반응을 통해 헤테로알킬을 형성하는 친핵체 (예를 들어, 임의로 치환된 아민 또는 임의로 치환된 티올) 및 변형 헤테로시클릴 친전자체 (예를 들어, 임의로 치환된 에폭시드, 아지리딘, 아지리디늄 이온 또는 에피술포늄 이온)를 포함하는 쌍; 예컨대 5'-아이오도 dT를 함유하는 올리고뉴클레오티드와 3'-포스포로티오에이트 올리고뉴클레오티드의 스플린트된 라이게이션에서와 같은 포스포로티오에이트 기 및 아이오도 기를 포함하는 쌍; 상업적으로 입수가능한 3'-글리세릴-변형된 올리고뉴클레오티드를 산화시키는 것에 의해 임의로 수득될 수 있는 3'-알데히드-변형된 올리고뉴클레오티드 및 5'-아미노 올리고뉴클레오티드를 포함하는 쌍 (즉 환원성 아미노화 반응에서), 또는 5'-히드라지도 올리고뉴클레오티드의 반응에서와 같은 임의로 치환된 아미노 기 및 알데히드 기 또는 케톤 기를 포함하는 쌍; 임의로 치환된 아미노 기 및 카르복실산 기 또는 티올 기의 쌍 (예를 들어, 숙신이미딜 트랜스-4-(말레이미딜메틸)시클로헥산-1-카르복실레이트 (SMCC) 또는 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 (EDAC)의 사용을 수반하거나 수반하지 않음); 임의로 치환된 히드라진 및 알데히드 또는 케톤 기의 쌍; 임의로 치환된 히드록실아민 및 알데히드 또는 케톤 기의 쌍; 또는 친핵체 및 임의로 치환된 알킬 할라이드의 쌍이다.
백금 착물, 알킬화제 또는 푸란-변형된 뉴클레오티드는 가닥간 또는 가닥내 연결을 형성하기 위한 화학-반응성 기로서 또한 사용될 수 있다. 이러한 작용제는 2개의 올리고뉴클레오티드들 사이에 사용될 수 있고, 교차-연결 올리고뉴클레오티드 내에 임의로 존재할 수 있다.
예시적인 비제한적 백금 착물은 시스플라틴 (예를 들어, GG 가닥내 연결을 형성하는 시스-디암민디클로로백금(II)), 트랜스플라틴 (예를 들어, GXG 가닥간 연결을 형성하는 트랜스-디암민디클로로백금(II), 여기서 X는 임의의 뉴클레오티드일 수 있음), 카르보플라틴, 피콜락틴 (ZD0473), 오르마플라틴, 또는 예를 들어 GC, CG, AG 또는 GG 연결을 형성하는 옥살리플라틴을 포함한다. 이들 연결 중 임의의 것은 가닥간 또는 가닥내 연결일 수 있다.
예시적인 비제한적 알킬화제는 질소 머스타드 (예를 들어, GG 연결을 형성하는 메클로레타민), 클로람부실, 멜팔란, 시클로포스파미드, 시클로포스파미드의 전구약물 형태 (예를 들어, 4-히드로퍼옥시시클로포스파미드 및 이포스파미드), 1,3-비스(2-클로로에틸)-1-니트로소우레아 (BCNU, 카르무스틴), 아지리딘 (예를 들어, GG 또는 AG 연결을 형성하는 미토마이신 C, 트리에틸렌멜라민 또는 트리에틸렌티오포스포르아미드 (티오-테파)), 헥사메틸멜라민, 알킬 술포네이트 (예를 들어, GG 연결을 형성하는 부술판) 또는 니트로소우레아 (예를 들어, GG 또는 CG 연결을 형성하는 2-클로로에틸니트로소우레아, 예컨대 카르무스틴 (BCNU), 클로로조토신, 로무스틴 (CCNU) 및 세무스틴 (메틸-CCNU))을 포함한다. 이들 연결 중 임의의 것은 가닥간 또는 가닥내 연결일 수 있다.
푸란-변형된 뉴클레오티드가 또한 연결을 형성하는데 사용될 수 있다. 계내 산화 시 (예를 들어, N-브로모숙신이미드 (NBS)에 의함), 푸란 모이어티는 상보적인 염기와 반응하여 가닥간 연결을 형성하는 반응성 옥소-에날 유도체를 형성한다. 일부 실시양태에서, 푸란-변형된 뉴클레오티드는 상보적인 A 또는 C 뉴클레오티드와 함께 연결을 형성한다. 예시적인 비제한적 푸란-변형된 뉴클레오티드는 임의의 2'-(푸란-2-일)프로파노일아미노-변형된 뉴클레오티드; 또는 2-(푸란-2-일)에틸 글리콜 핵산의 비-시클릭, 변형된 뉴클레오티드를 포함한다.
광-반응성 기가 또한 반응성 기로서 사용될 수 있다. 예시적인 비제한적 광-반응성 기는 삽입성 모이어티, 프소랄렌 유도체 (예를 들어, 프소랄렌, HMT-프소랄렌 또는 8-메톡시프소랄렌), 임의로 치환된 시아노비닐카르바졸 기, 임의로 치환된 비닐카르바졸 기, 임의로 치환된 시아노비닐 기, 임의로 치환된 아크릴아미드 기, 임의로 치환된 디아지린 기, 임의로 치환된 벤조페논 (예를 들어, 4-벤조일벤조산 또는 벤조페논 이소티오시아네이트의 숙신이미딜 에스테르), 임의로 치환된 5-(카르복시)비닐-우리딘 기 (예를 들어, 5-(카르복시)비닐-2'-데옥시우리딘) 또는 임의로 치환된 아지드 기 (예를 들어, 아릴 아지드 또는 할로겐화 아릴 아지드, 예컨대 4-아지도-2,3,5,6-테트라플루오로벤조산 (ATFB)의 숙신이미딜 에스테르)를 포함한다.
삽입성 모이어티가 또한 반응성 기로서 사용될 수 있다. 예시적인 비제한적 삽입성 모이어티는 프소랄렌 유도체, 알칼로이드 유도체 (예를 들어, 베르베린, 팔마틴, 코랄린, 상귀나린 (예를 들어, 이미늄 또는 그의 알칸올아민 형태) 또는 아리스톨로락탐-β-D-글루코시드), 에티듐 양이온 (예를 들어, 브로민화에티듐), 아크리딘 유도체 (예를 들어, 프로플라빈, 아크리플라빈 또는 암사크린), 안트라시클린 유도체 (예를 들어, 독소루비신, 에피루비신, 다우노루비신 (다우노마이신), 이다루비신 및 아클라루비신) 또는 탈리도미드를 포함한다.
교차-연결 올리고뉴클레오티드의 경우에, 가닥간 또는 가닥내 연결을 형성하기 위해 임의의 유용한 반응성 기 (예를 들어, 본원에 기재된 것)가 또한 사용될 수 있다. 예시적인 반응성 기는 화학-반응성 기, 광-반응성 기, 삽입성 모이어티, 및 가역적 공-반응성 기를 포함한다. 교차-연결 올리고뉴클레오티드와 함께 사용하기 위한 교차-연결 작용제는, 제한없이, 알킬화제 (예를 들어, 본원에 기재된 바와 같음), 시스플라틴 (시스-디암민디클로로백금(II)), 트랜스-디암민디클로로백금(II), 프소랄렌, HMT-프소랄렌, 8-메톡시프소랄렌, 푸란-변형된 뉴클레오티드, 2-플루오로-데옥시이노신 (2-F-dI), 5-브로모-디옥시시토신 (5-Br-dC), 5-브로모 데옥시우리딘 (5-Br-dU), 5-아이오도-디옥시시토신 (5-I-dC), 5-아이오도-데옥시우리딘 (5-I-dU), 숙신이미딜 트랜스-4-(말레이미딜메틸)시클로헥산-1-카르복실레이트, SMCC, EDAC 또는 숙신이미딜 아세틸티오아세테이트 (SATA)를 포함한다.
올리고뉴클레오티드는 다양한 티올 반응성 기, 예컨대 말레이미드, 할로겐, 아이오도아세트아미드와 반응할 수 있는 티올 모이어티를 함유하도록 또한 변형될 수 있고, 따라서 2개의 교차-연결 올리고뉴클레오티드로 사용될 수 있다. 티올 기는 올리고뉴클레오티드의 5'- 또는 3'- 말단에 연결될 수 있다.
듀플렉스 올리고뉴클레오티드 사이에서 피리미딘 (예를 들어, 티미딘) 위치에서의 가닥간 교차-연결을 위해, 삽입성, 광-반응성 모이어티 프소랄렌이 선택될 수 있다. 프소랄렌은 듀플렉스 내로 삽입되고, 자외선 (약 254 nm) 조사시 피리미딘과, 우세하게는 5'-TpA 부위에서 공유적 가닥간 교차-연결을 형성한다. 프소랄렌 모이어티는 변형된 올리고뉴클레오티드에 공유적으로 부착될 수 있다 (예를 들어, 알칸 쇄, 예컨대 C1-10 알킬 또는 폴리에틸렌 글리콜 기, 예컨대 -(CH2CH2O)nCH2CH2-에 의함, 여기서 n은 1 내지 50의 정수임). 예시적인 프소랄렌 유도체가 또한 사용될 수 있으며, 여기서 비제한적 유도체는 4'-(히드록시에톡시메틸)-4,5',8-트리메틸프소랄렌 (HMT-프소랄렌) 및 8-메톡시프소랄렌을 포함한다.
연결을 도입하기 위해 다양한 교차-연결 올리고뉴클레오티드 부분이 변형될 수 있다. 예를 들어, 2개의 인접한 올리고뉴클레오티드를 연결시키는데 올리고뉴클레오티드 내의 말단 포스포로티오에이트가 또한 사용될 수 있다. 올리고뉴클레오티드 내의 교차-링커 변형으로서 할로겐화 우라실/시토신이 또한 사용될 수 있다. 예를 들어, 2-플루오로-데옥시이노신 (2-F-dI) 변형된 올리고뉴클레오티드는 디술피드-함유 디아민 또는 티오프로필아민과 반응하여 디술피드 연결을 형성할 수 있다.
하기 기재된 바와 같이, 가역적 공-반응성 기는 시아노비닐카르바졸 기, 시아노비닐 기, 아크릴아미드 기, 티올 기 또는 술포닐에틸 티오에테르로부터 선택되는 것을 포함한다. 상보적 가닥 내의 피리미딘 염기 (예를 들어, 시토신, 티민 및 우라실, 뿐만 아니라 그의 변형된 염기)에의 교차-연결을 위해 임의로 치환된 시아노비닐카르바졸 (CNV) 기가 또한 올리고뉴클레오티드 내에서 사용될 수 있다. CNV 기는 366 nm에서의 조사 시 인접한 피리미딘 염기와의 [2+2] 고리화첨가를 촉진하여, 가닥간 교차-연결시킨다. 312 nm에서의 조사는 교차-연결을 역전시키고, 따라서 올리고뉴클레오티드 가닥의 가역적 교차-연결 방법을 제공한다. 비제한적 CNV 기는 3-시아노비닐카르바졸이며, 이는 카르복시비닐카르바졸 뉴클레오티드로서 (예를 들어, 3-카르복시비닐카르바졸-1'-β-데옥시리보시드-5'-트리포스페이트로서) 포함될 수 있다.
CNV 기는 반응성 시아노 기를 또 다른 반응성 기로 대체하여 임의로 치환된 비닐카르바졸 기를 제공하기 위해 변형될 수 있다. 비닐카르바졸 기를 위한 예시적인 비제한적 반응성 기는 -CONRN1RN2의 아미드 기를 포함하며, 여기서 각각의 RN1 및 RN2는 동일하거나 상이하고, 독립적으로 H 및 C1-6 알킬, 예를 들어, -CONH2; 카르복실 기 -CO2H; 또는 C2-7 알콕시카르보닐 기 (예를 들어, 메톡시카르보닐)이다. 또한, 반응성 기는 비닐 기의 알파 또는 베타 탄소 상에 위치할 수 있다. 예시적인 비닐카르바졸 기는 본원에 기재된 바와 같은 시아노비닐카르바졸 기; 아미도비닐카르바졸 기 (예를 들어, 아미도비닐카르바졸 뉴클레오티드, 예컨대 3-아미도비닐카르바졸-1'-β-데옥시리보시드-5'-트리포스페이트); 카르복시비닐카르바졸 기 (예를 들어, 카르복시비닐카르바졸 뉴클레오티드, 예컨대 3-카르복시비닐카르바졸-1'-β-데옥시리보시드-5'-트리포스페이트); 및 C2-7 알콕시카르보닐비닐카르바졸 기 (예를 들어, 알콕시카르보닐비닐카르바졸 뉴클레오티드, 예컨대 3-메톡시카르보닐비닐카르바졸-1'-β-데옥시리보시드-5'-트리포스페이트)를 포함한다. 추가의 임의로 치환된 비닐카르바졸 기 및 이러한 기를 갖는 뉴클레오티드가 미국 특허 번호 7,972,792 및 문헌 [Yoshimura and Fujimoto, Org. Lett. 10:3227-3230 (2008)]의 화학식에서 제공되며, 상기 문헌은 그 전문이 본원에 참조로 포함된다.
다른 가역적 반응성 기는 디술피드를 형성하는 티올 기 및 또 다른 티올 기, 뿐만 아니라 술포닐에틸 티오에테르를 형성하는 티올 기 및 비닐 술폰 기를 포함한다. 티올-티올 기는 비스-((N-아이오도아세틸)피페라지닐)술폰로다민과의 반응에 의해 형성되는 연결을 임의로 포함할 수 있다. 다른 가역적 반응성 기 (예를 들어, 예컨대 일부 광-반응성 기)는 임의로 치환된 벤조페논 기를 포함한다. 비제한적 예는 벤조페논 우라실 (BPU)이며, 이는 BPU-함유 올리고뉴클레오티드 듀플렉스의 가닥간 교차-연결의 부위- 및 서열-선택적 형성에 사용될 수 있다. 이러한 교차-연결은 가열시 역전되어, 2개의 올리고뉴클레오티드 가닥의 가역적 교차-연결 방법을 제공할 수 있다.
다른 실시양태에서, 화학적 라이게이션은 예를 들어 선택후 PCR 분석 및 서열분석을 위해 포스포디에스테르 결합의 유사체를 도입하는 것을 포함한다. 예시적인 포스포디에스테르의 유사체는 포스포로티오에이트 연결 (예를 들어, 포스포로티오에이트 기 및 이탈기, 예컨대 아이오도 기의 사용에 의해 도입된 것과 같음), 포스포르아미드 연결, 또는 포스포로디티오에이트 연결 (예를 들어, 포스포로디티오에이트 기 및 이탈기, 예컨대 아이오도 기의 사용에 의해 도입된 것과 같음)을 포함한다.
본원에 기재된 임의의 기의 경우에 (예를 들어, 화학-반응성 기, 광-반응성 기, 삽입성 모이어티, 교차-연결 올리고뉴클레오티드 또는 가역적 공-반응성 기), 기는 올리고뉴클레오티드의 말단에 또는 그에 근접하여 또는 5'-와 3'-말단 사이에 혼입될 수 있다. 또한, 1개 이상의 기가 각각의 올리고뉴클레오티드 내에 존재할 수 있다. 반응성 기의 쌍이 요구되는 경우에, 올리고뉴클레오티드는 기의 쌍 사이의 반응을 용이하게 하도록 설계될 수 있다. 피리미딘 염기와 공-반응하는 시아노카르바졸 기의 비제한적 예에서, 제1 올리고뉴클레오티드는 5'-말단에 또는 그에 근접하여 시아노카르바졸 기를 포함하도록 설계될 수 있다. 이러한 예에서, 제2 올리고뉴클레오티드는 제1 올리고뉴클레오티드와 상보적이도록, 그리고 제1 및 제2 올리고뉴클레오티드가 혼성화될 경우에 시아노비닐카르바졸 기와 정렬되는 위치에서 공-반응성 피리미딘 염기를 포함하도록 설계될 수 있다. 본원의 기 중 임의의 것과 하나 이상의 기를 갖는 올리고뉴클레오티드 중 임의의 것은 기들 사이의 반응이 하나 이상의 연결의 형성을 용이하게 하도록 설계될 수 있다.
이관능성 스페이서
헤드피스와 화학 물질 사이의 이관능성 스페이서는 적절한 스페이싱 모이어티를 제공하기 위해 및/또는 유기 용매 중에서의 헤드피스의 용해도를 증가시키기 위해 달라질 수 있다. 헤드피스와 소분자 라이브러리를 커플링시킬 수 있는 매우 다양한 스페이서가 상업적으로 입수가능하다. 스페이서는 전형적으로 선형 또는 분지형 쇄로 이루어지고, C1-10 알킬, 1 내지 10개의 원자의 헤테로알킬, C2-10 알케닐, C2-10 알키닐, C5-10 아릴, 3 내지 20개 원자의 시클릭 또는 폴리시클릭계, 포스포디에스테르, 펩티드, 올리고사카라이드, 올리고뉴클레오티드, 올리고머, 중합체 또는 폴리 알킬 글리콜 (예를 들어, 폴리 에틸렌 글리콜, 예컨대 -(CH2CH2O)nCH2CH2-, 여기서 n은 1 내지 50의 정수임) 또는 그의 조합을 포함할 수 있다.
이관능성 스페이서는 라이브러리의 헤드피스와 화학 물질 사이에 적절한 스페이싱 모이어티를 제공할 수 있다. 특정 실시양태에서, 이관능성 스페이서는 3개의 부분을 포함한다. 부분 1은 DNA와 공유 결합을 형성하는 반응성 기, 예컨대 예를 들어, DNA 상의 아미노기 (예를 들어, 아미노-변형된 dT)와 반응하도록 N-히드록시 숙신이미드 (NHS) 에스테르에 의해 바람직하게 활성화된 카르복실산, (표준 올리고뉴클레오티드 화학에 의해 달성되는) 단일-가닥 헤드피스의 5' 또는 3'-말단을 변형시키는 아미다이트, 화학-반응성 쌍 (예를 들어, Cu(I) 촉매의 존재 하의 아지도-알킨 고리화첨가, 또는 본원에 기재된 임의의 것), 또는 티올 반응성 기일 수 있다. 부분 2는 또한 화학 물질, 각각의 빌딩 블록 An 또는 스캐폴드와 공유 결합을 형성하는 반응성 기일 수 있다. 이러한 반응성 기는 예를 들어 아민, 티올, 아지드 또는 알킨일 수 있다. 부분 3은 부분 1과 2 사이에 도입된, 가변 길이의 화학적 불활성 스페이싱 모이어티일 수 있다. 이러한 스페이싱 모이어티는 에틸렌 글리콜 단위의 쇄 (예를 들어, 상이한 길이의 PEG), 알칸, 알켄, 폴리엔 쇄 또는 펩디드 쇄일 수 있다. 스페이서는 유기 용매 중에서의 헤드피스의 용해도를 개선시키기 위한 소수성 모이어티 (예컨대 예를 들어, 벤젠 고리), 뿐만 아니라 라이브러리 검출 목적으로 사용되는 형광 모이어티 (예를 들어 플루오레세인 또는 Cy-3)를 포함하는 분지 또는 삽입물을 함유할 수 있다. 헤드피스 설계 내의 소수성 잔기는 유기 용매 중에서의 라이브러리 합성을 용이하게 하기 위해 스페이서 설계에 따라 달라질 수 있다. 예를 들어, 헤드피스 및 스페이서 조합은 옥탄올:물 계수 (Poct)가 예를 들어 1.0 내지 2.5인 적절한 잔기를 갖도록 설계된다.
스페이서는 주어진 소분자 라이브러리 설계에 대해 실험적으로 선택될 수 있고, 이로써 라이브러리는 유기 용매, 예를 들어 15%, 25%, 30%, 50%, 75%, 90%, 95%, 98%, 99% 또는 100% 유기 용매 중에서 합성될 수 있다. 스페이서는 유기 용매 중에 헤드피스를 가용화시키는 적절한 쇄 길이를 선택하기 위해 라이브러리 합성 이전에 모델 반응을 사용하여 다르게 할 수 있다. 예시적인 스페이서는 알킬 쇄 길이가 증가된 것, 폴리 에틸렌 글리콜 단위가 증가된 것, (헤드피스 상의 포스페이트 음전하를 중화시키는) 양전하를 포함하는 분지형 종을 갖는 것 또는 소수성 양이 증가된 것 (예를 들어, 벤젠 고리 구조의 부가)을 포함한다.
상업적으로 입수가능한 스페이서의 예는 아미노-카르복실산 스페이서, 예컨대 펩티드인 것 (예를 들어, Z-Gly-Gly-Gly-Osu (N-알파-벤질옥시카르보닐-(글리신)3-N-숙신이미딜 에스테르) 또는 Z-Gly-Gly-Gly-Gly-Gly-Gly-Osu (N-알파-벤질옥시카르보닐-(글리신)6-N-숙신이미딜 에스테르, 서열 3)), PEG (예를 들어, Fmoc-아미노PEG200O-NHS 또는 아미노-PEG (12-24)-NHS), 또는 알칸 산 쇄 (예를 들어, Boc-ε-아미노카프로산-Osu); 화학-반응성 쌍 스페이서, 예컨대 펩티드 모이어티 (예를 들어, 아지도호모알라닌-Gly-Gly-Gly-OSu (서열 4) 또는 프로파르길글리신-Gly-Gly-Gly-OSu (서열 5)), PEG (예를 들어, 아지도-PEG-NHS), 또는 알칸 산 쇄 모이어티 (예를 들어, 5-아지도펜탄산, (S)-2-(아지도메틸)-1-Boc-피롤리딘, 4-아지도아닐린 또는 4-아지도-부탄-1-산 N-히드록시숙신이미드 에스테르)와 함께 조합된, 본원에 기재된 화학-반응성 쌍; 티올-반응성 스페이서, 예컨대 PEG인 것 (예를 들어, SM(PEG)n NHS-PEG-말레이미드), 알칸 쇄 (예를 들어, 3-(피리딘-2-일디술파닐)-프로피온산-Osu 또는 술포숙신이미딜 6-(3'-[2-피리딜디티오]-프로피온아미도)헥사노에이트)); 및 올리고뉴클레오티드 합성을 위한 아미다이트, 예컨대 아미노 개질제 (예를 들어, 6-(트리플루오로아세틸아미노)-헥실-(2-시아노에틸)-(N,N-디이소프로필)-포스포르아미다이트), 티올 개질제 (예를 들어, S-트리틸-6-메르캅토헥실-1-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트 또는 화학-반응성 쌍 개질제 (예를 들어, 6-헥신-1-일-(2-시아노에틸)-(N,N-디이소프로필)-포스포르아미다이트, 3-디메톡시트리틸옥시-2-(3-(3-프로파르길옥시프로판아미도)프로판아미도)프로필-1-O-숙시노일, 장쇄 알킬아미노 CPG 또는 4-아지도-부탄-1-산 N-히드록시숙신이미드 에스테르))를 포함한다. 추가의 스페이서가 관련 기술분야에 공지되어 있으며, 라이브러리 합성 동안 사용될 수 있는 것은 5'-O-디메톡시트리틸-1',2'-디데옥시리보스-3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 9-O-디메톡시트리틸-트리에틸렌 글리콜, 1-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 3-(4,4'-디메톡시트리틸옥시)프로필-1-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 및 18-O-디메톡시트리틸 헥사에틸렌글리콜, 1-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트를 포함하나, 이에 제한되지는 않는다. 본원의 스페이서 중 임의의 것은 직렬로 하나의 또 다른 것에 상이한 조합으로 부가되어 상이한 목적하는 길이의 스페이서를 생성할 수 있다.
스페이서는 또한 분지형일 수 있으며, 여기서 분지형 스페이서는 관련 기술분야에 널리 공지되어 있고, 예는 대칭 또는 비대칭 더블러 또는 대칭 트레블러로 이루어질 수 있다. 예를 들어, 문헌 [Newcome et al., Dendritic Molecules: Concepts, Synthesis, Perspectives, VCH Publishers (1996); Boussif et al., Proc. Natl. Acad. Sci. USA 92:7297-7301 (1995); 및 Jansen et al., Science 266:1226 (1994)]을 참조한다.
효소적 라이게이션 및 화학적 라이게이션 기술
스캐폴드, 빌딩 블록, 스페이서, 연결, 태그 및/또는 헤드피스를 부가하여 복합체를 생성하는데 다양한 라이게이션 기술이 사용될 수 있다. 따라서, 본원에 기재된 결합 단계 중 임의의 것은 임의의 유용한 라이게이션 기술, 예컨대 효소적 라이게이션 및/또는 화학적 라이게이션을 포함할 수 있다. 이들 결합 단계는 하나 이상의 태그의 헤드피스 또는 복합체에의 부가; 스페이서의 헤드피스에의 부가; 및 하나 이상의 스캐폴드 또는 빌딩 블록의 헤드피스 또는 복합체에의 부가를 포함할 수 있다. 특정한 실시양태에서, 임의의 올리고뉴클레오티드에 대해 사용되는 라이게이션 기술은 전사 및/또는 역전사되어 라이브러리의 디코딩을 가능하게 하거나 또는 하나 이상의 DNA 또는 RNA 폴리머라제에 의한 주형-의존성 중합을 가능하게 할 수 있는 생성된 산물을 제공한다.
일반적으로, 효소적 라이게이션은 전사 및/또는 역전사될 수 있는 천연 포스포디에스테르 결합을 갖는 올리고뉴클레오티드를 생성한다. 효소 라이게이션의 예시적인 방법이 본원에 제공되고, 하나 이상의 RNA 또는 DNA 리가제, 예컨대 T4 RNA 리가제, T4 DNA 리가제, 써클리가제(CircLigase)™ ssDNA 리가제, 써클리가제™ II ssDNA 리가제 및 써모파지(ThermoPhage)™ ssDNA 리가제 (프로카자임 리미티드(Prokazyme Ltd.), 아이슬랜드 레이캬비크)의 사용을 포함한다.
화학적 라이게이션이 또한 전사 또는 역전사될 수 있는 올리고뉴클레오티드를 생성하는데 사용될 수 있다. 전사 또는 역전사될 수 있는 올리고뉴클레오티드를 제공하는 화학적 라이게이션 기술의 효능은 시험될 필요가 있을 수 있다. 이러한 효능은 임의의 유용한 방법, 예컨대 액체 크로마토그래피-질량 분광측정법, RT-PCR 분석 및/또는 PCR 분석에 의해 시험될 수 있다. 특정한 실시양태에서, 화학적 라이게이션은 전사 또는 역전사될 수 있는 스페이싱 모이어티를 제공하기 위해 하나 이상의 화학-반응성 쌍의 사용을 포함한다. 특히, 화학-반응성 쌍에 적합한 반응은 라이게이션 과정에 바람직한 후보이다 (Kolb et al., Angew. Chem. Int. Ed., 40:2004-2021 (2001); Van der Eycken et al., QSAR Comb. Sci., 26:1115-1326 (2007)). 한 실시양태에서, 라이게이션된 올리고뉴클레오티드는 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 연결, 예를 들어 "판독불가능한" 연결을 함유한다.
효소적 라이게이션 또는 화학적 라이게이션을 촉진시키기 위한 반응 조건
본원에 기재된 방법은 헤드피스와 태그 사이 또는 2개의 태그 사이의 효소적 또는 화학적 라이게이션을 촉진시키는 하나 이상의 반응 조건을 포함할 수 있다. 이들 반응 조건은 본원에 기재된 바와 같은, 태그내 변형된 뉴클레오티드를 사용하는 것; 길이가 상이한 공여자 태그 및 수용자 태그를 사용하고, 태그의 농도를 달리하는 것; 상이한 유형의 리가제, 뿐만 아니라 그의 조합 (예를 들어, 써클리가제™ DNA 리가제 및/또는 T4 RNA 리가제)을 사용하고, 그의 농도를 달리하는 것; 분자량이 상이한 폴리 에틸렌 글리콜 (PEG)을 사용하고, 그의 농도를 달리하는 것; 비-PEG 집중화제 (예를 들어, 베타인 또는 소 혈청 알부민)의 사용; 라이게이션 온도 및 지속시간을 달리하는 것; ATP, Co(NH3)6Cl3 및 효모 무기 피로포스페이트를 비롯한, 다양한 작용제의 농도를 달리하는 것; 효소적으로 또는 화학적으로 인산화된 올리고뉴클레오티드 태그를 사용하는 것; 3'-보호된 태그를 사용하는 것; 및 프리아데닐화된 태그를 사용하는 것을 포함한다. 이들 반응 조건은 화학적 라이게이션을 또한 포함한다.
헤드피스 및/또는 태그는 하나 이상의 변형되거나 치환된 뉴클레오티드를 포함할 수 있다. 바람직한 실시양태에서, 헤드피스 및/또는 태그는 효소적 라이게이션을 촉진시키는 하나 이상의 변형되거나 치환된 뉴클레오티드, 예컨대 2'-O-메틸 뉴클레오티드 (예를 들어, 2'-O-메틸 구아닌 또는 2'-O-메틸 우라실), 2'-플루오로 뉴클레오티드, 또는 라이게이션에 대해 기질로서 사용되는 임의의 다른 변형된 뉴클레오티드를 포함한다. 대안적으로, 헤드피스 및/또는 태그는 화학적 라이게이션을 지지하는 하나 이상의 화학적 반응성 기 (예를 들어, 임의로 치환된 알키닐 기 및 임의로 치환된 아지도 기)를 포함하도록 변형된다. 임의로, 태그 올리고뉴클레오티드는 양쪽 말단에서 화학적 반응성 기로 관능화되고, 임의로 이들 말단 중 하나는 보호되고, 이로써 기는 독립적으로 어드레싱될 수 있고 부반응은 감소될 수 있다 (예를 들어, 중합 부반응 감소).
효소적 라이게이션은 하나 이상의 리가제를 포함할 수 있다. 예시적인 리가제는 써클리가제™ ssDNA 리가제 (에피센터 바이오테크놀로지스(EPICENTRE Biotechnologies) 위스콘신주 매디슨), 써클리가제™ II ssDNA 리가제 (또한 에피센터 바이오테크놀로지스의 것), 써모파지™ ssDNA 리가제 (프로카자임 리미티드, 아이슬란드 레이캬비크), T4 RNA 리가제 및 T4 DNA 리가제를 포함한다. 바람직한 실시양태에서, 라이게이션은 RNA 리가제, 또는 RNA 리가제 및 DNA 리가제의 조합을 사용하는 것을 포함한다. 라이게이션은 하나 이상의 리가제와 함께 조합하여 하나 이상의 가용성 다가 양이온, 예컨대 Co(NH3)6Cl3을 추가로 포함할 수 있다.
라이게이션 단계 전후에, 복합체는 3가지 이유로 정제될 수 있다. 첫째, 교차-반응을 야기할 수 있고 코딩 과정에 "잡음"을 도입할 수 있는 미반응 헤드피스 또는 태그를 제거하기 위해 복합체가 정제될 수 있다. 둘째, 리가제의 라이게이션 활성을 억제시키거나 저하시킬 수 있는 임의의 시약 또는 미반응 출발 물질을 제거하기 위해 복합체가 정제될 수 있다. 예를 들어, 포스페이트는 라이게이션 활성을 저하시킬 수 있다. 셋째, 화학적 또는 라이게이션 단계에 도입되는 실체는 후속 화학적 또는 라이게이션 단계가 수행될 수 있도록 하기 위해서 제거되어야 할 필요가 있을 수 있다. 복합체를 정제하는 방법은 본원에 기재되어 있다.
효소적 및 화학적 라이게이션은 평균 분자량이 300 달톤 초과 (예를 들어, 600 달톤 초과, 3,000 달톤, 4,000 달톤 또는 4,500 달톤)인 폴리 에틸렌 글리콜을 포함할 수 있다. 특정한 실시양태에서, 폴리 에틸렌 글리콜의 평균 분자량은 약 3,000 달톤 내지 9,000 달톤 (예를 들어, 3,000 달톤 내지 8,000 달톤, 3,000 달톤 내지 7,000 달톤, 3,000 달톤 내지 6,000 달톤 및 3,000 달톤 내지 5,000 달톤)이다. 바람직한 실시양태에서, 폴리 에틸렌 글리콜의 평균 분자량은 약 3,000 달톤 내지 약 6,000 달톤 (예를 들어, 3,300 달톤 내지 4,500 달톤, 3,300 달톤 내지 5,000 달톤, 3,300 달톤 내지 5,500 달톤, 3,300 달톤 내지 6,000 달톤, 3,500 달톤 내지 4,500 달톤, 3,500 달톤 내지 5,000 달톤, 3,500 달톤 내지 5,500 달톤 및 3,500 달톤 내지 6,000 달톤, 예컨대 4,600 달톤)이다. 폴리 에틸렌 글리콜은 임의의 유용한 양으로, 예컨대 약 25% (w/v) 내지 약 35% (w/v), 예컨대 30% (w/v)로 존재할 수 있다.
본 발명의 바람직한 실시양태에서, 태그는 하기 개략화된 라이게이션 프로토콜을 사용하여 단일-가닥 올리고뉴클레오티드를 단일-가닥 올리고뉴클레오티드에 라이게이션시키는 것에 의해 장착된다: 헤드피스: 25 μM (5' 말단: 5'-모노포스포/2'-OMe G, 개재 뉴클레오티드: 2'-데옥시, 및 3' 말단: 2'-차단/3'-차단); 태그: 25 μM (5'-말단: 2'-OMe/5'-OH G, 개재 뉴클레오티드: 2'-데옥시, 및 3'-말단: 3'-OH/2'-OMe); Co(NH3)6Cl3: 1 mM; PEG 4600: 30% (w/v); T4 RNA 리가제 (프로메가(Promega)): 1.5 단위/μl; 효모 무기 피로포스파타제: 0.0025 단위/μl; 트리스: 50 mM; MgCl2: 10 mM; ATP: 1 mM; pH: 7.5; 및 물:균형. 추가 실시양태에서, 프로토콜은 37℃에서 20시간 동안 인큐베이션을 포함한다. 실제 라이브러리 구축의 목적으로, 보다 고농도의 헤드피스, 태그 및/또는 리가제가 사용될 수 있으며, 이들 농도에 대한 이러한 변형은 통상의 기술자에게 자명할 것이다. 화학적 라이게이션 방법론은, 폴리머라제가 작동가능하게-회합된 연결을 판독 또는 전위할 수 있는지 여부와 관계없이, 2개의 코딩 태그를 작동가능하게 회합시킬 수 있는 임의의 화학적 방법을 포함할 수 있다.
복합체의 뉴클레오티드 서열을 결정하는 방법
본 방법은 복합체의 뉴클레오티드 서열을 결정하는 방법을 특징으로 하며, 이로써 태그의 서열과 화학 물질의 구조 단위 (또는 빌딩 블록) 사이의 코딩 관계가 확립될 수 있다. 특히, 화학 물질의 아이덴티티 및/또는 히스토리는 올리고뉴클레오티드의 염기 서열로부터 추론될 수 있다. 이러한 방법을 사용하여 다양한 화학 물질 또는 구성원 (예를 들어, 소형 분자 또는 펩티드)을 포함하는 라이브러리를 특정한 태그 서열로 어드레싱할 수 있다.
도 1-4는 복합체의 뉴클레오티드 서열을 결정하는 다양한 예시적인 방법을 제공한다. 이들 도면은 판독불가능한 연결에 걸쳐있게 하고/거나 교차-연결 올리고뉴클레오티드를 방출시키는 예시적인 방법을 제공하며, 이는 올리고뉴클레오티드 주형이 형성되게 한다.
도 1b는 릴레이 프라이머를 사용하는 예시적인 방법을 제공한다. 특히, 릴레이 프라이머는 고정된 불변 서열 부분 (예를 들어, 5'- 및 3'-연결부)에 혼성화하며, 여기서 각각의 릴레이 프라이머 서열은 동일하거나 상이할 수 있다. 릴레이 프라이머는 판독불가능한 연결에 걸쳐있고, 복합체의 판독가능한 부분 (즉 코딩 서열, 예를 들어 하나 이상의 태그)을 따라 연장이 진행되어 올리고뉴클레오티드 단편을 생성한다. 이어서, 릴레이 프라이머 및 단편은 라이게이션되어 주형을 형성할 수 있고, 이는 임의로 증폭 및 서열분석될 수 있다.
도 2-4는 예시적인 판독불가능한 연결을 제공한다. 도 2는 인접한 5'- 및 3'-연결부에 의해 형성된 듀플렉스 내에서 반응하는 프소랄렌에 의해 형성된 연결을 제공한다. 도 3은 인접한 5'- 및 3'-연결부에 혼성화하는 교차-연결된 올리고뉴클레오티드에 의해 형성된 연결을 제공한다.
본원에 기재된 연결 중 임의의 것은 가역적이거나 또는 비가역적일 수 있다. 가역적 연결은 광-반응성 연결 (예를 들어, 도 4에서와 같은, 시아노비닐카르바졸 기 및 티미딘) 및 산화환원 연결을 포함한다. 추가의 연결이 본원에 기재되어 있다.
대안적 실시양태에서, "판독불가능한" 연결은 판독가능한 또는 적어도 전위가능한 연결을 생성하기 위해 효소적으로 복구될 수 있다. 효소적 복구 과정은 통상의 기술자에게 널리 공지되어 있고, 피리미딘 (예를 들어, 티미딘) 이량체 복구 메카니즘 (예를 들어, 포토리아제 또는 글리코실라제 (예를 들어, T4 피리미딘 이량체 글리코실라제 (PDG))를 사용하는 것), 염기 절제 복구 메카니즘 (예를 들어, 글리코실라제, 아퓨린/아피리미딘 (AP) 엔도뉴클레아제, Flap 엔도뉴클레아제 또는 폴리 ADP 리보스 폴리머라제 (예를 들어, 인간 아퓨린/아피리미딘 (AP) 엔도뉴클레아제, APE 1; 엔도뉴클레아제 III (Nth) 단백질; 엔도뉴클레아제 IV; 엔도뉴클레아제 V; 포름아미도피리미딘 [fapy]-DNA 글리코실라제 (Fpg); 인간 8-옥소구아닌 글리코실라제 1 (α 이소형) (hOGG1); 인간 엔도뉴클레아제 VIII-유사 1 (hNEIL1); 우라실-DNA 글리코실라제 (UDG); 인간 단일-가닥 선택적 일관능성 우라실 DNA 글리코실라제 (SMUG1); 및 인간 알킬아데닌 DNA 글리코실라제 (hAAG))를 사용하는 것, 이는 복구를 위해 하나 이상의 엔도뉴클레아제, DNA 또는 RNA 폴리머라제 및/또는 리가제와 임의로 조합될 수 있음), 메틸화 복구 메카니즘 (예를 들어, 메틸 구아닌 메틸트랜스퍼라제를 사용하는 것), AP 복구 메카니즘 (예를 들어, 아퓨린/아피리미딘 (AP) 엔도뉴클레아제 (예를 들어, APE 1; 엔도뉴클레아제 III; 엔도뉴클레아제 IV; 엔도뉴클레아제 V; Fpg; hOGG1; 및 hNEIL1)를 사용하는 것, 이는 복구를 위해 하나 이상의 엔도뉴클레아제, DNA 또는 RNA 폴리머라제 및/또는 리가제와 임의로 조합될 수 있음), 뉴클레오티드 절제 복구 메카니즘 (예를 들어, 절제 복구 교차-상보적 단백질 또는 절제 뉴클레아제를 사용하는 것, 이는 복구를 위해 하나 이상의 엔도뉴클레아제, DNA 또는 RNA 폴리머라제 및/또는 리가제와 임의로 조합될 수 있음), 및 미스매치 복구 메카니즘 (예를 들어, 엔도뉴클레아제 (예를 들어, T7 엔도뉴클레아제 I; MutS, MutH, 및/또는 MutL)를 사용하는 것, 이는 복구를 위해 하나 이상의 엑소뉴클레아제, 엔도뉴클레아제, 헬리카제, DNA 또는 RNA 폴리머라제 및/또는 리가제와 임의로 조합될 수 있음)을 포함하나 이에 제한되지는 않는다. 이들 복구 메카니즘 유형을 용이하게 제공하기 위해 상업적 효소 혼합물, 예를 들어 Taq DNA 리가제, 엔도뉴클레아제 IV, Bst DNA 폴리머라제, Fpg, 우라실-DNA 글리코실라제 (UDG), T4 PDG (T4 엔도뉴클레아제 V) 및 엔도뉴클레아제 VIII을 포함하는 PreCR® 복구 믹스 (뉴잉글랜드 바이오랩스 인크.(New England Biolabs Inc.), 매사추세츠주 입스위치)가 이용가능하다.
코딩된 라이브러리를 태깅하는 방법
본 방법은 올리고뉴클레오티드 태그를 화학 물질과 작동가능하게 회합시키는 방법을 특징으로 하며, 이로써 태그 서열과 화학 물질의 구조 단위 (또는 빌딩 블록) 사이의 코딩 관계가 확립될 수 있다. 특히, 화학 물질의 아이덴티티 및/또는 히스토리는 올리고뉴클레오티드의 염기 서열로부터 추론될 수 있다. 이러한 방법을 사용하여 다양한 화학 물질 또는 구성원 (예를 들어, 소형 분자 또는 펩티드)을 포함하는 라이브러리를 특정한 태그 서열로 코딩할 수 있다.
일반적으로, 이들 방법은 화학적으로 구현될 수 있는 적어도 하나의 관능기 및 단일 가닥 올리고뉴클레오티드가 결합 (또는 라이게이션)될 수 있는 적어도 하나의 관능기를 갖는 헤드피스의 사용을 포함한다. 결합은 임의의 유용한 수단, 예컨대 효소적 결합 (예를 들어, RNA 리가제 및/또는 DNA 리가제 중 하나 이상에 의한 라이게이션)에 의해 또는 화학적 결합에 의해 (예를 들어, 2개의 관능기, 예컨대 친핵체 및 이탈기 사이의 치환 반응에 의해) 이루어질 수 있다.
라이브러리 내에 다수의 화학 물질을 생성하기 위해, 헤드피스를 함유하는 용액을 다중 분취액으로 나눈 후, 이를 다수의 물리적으로 분리된 구획, 예컨대 멀티웰 플레이트의 웰에 배치시킬 수 있다. 일반적으로, 이는 "스플릿" 단계이다. 각각의 구획 또는 웰 내에서, 각 분취액 내의 단일-가닥 태그를 사용하여 연속적인 화학 반응 및 라이게이션 단계를 수행한다. 화학 반응 조건과 단일-가닥 태그의 서열 사이의 관계를 기록한다. 반응 및 라이게이션 단계는 임의의 순서로 수행될 수 있다. 이어서, 반응되고 라이게이션된 분취액을 조합하거나 또는 "풀링하고", 이 시점에서 임의로 정제를 수행할 수 있다. 이들 스플릿 및 풀 단계를 임의로 반복할 수 있다.
다음으로, 본원에 기재된 바와 같이, 특정한 특징 또는 기능에 대해 라이브러리를 시험하고/거나 선택할 수 있다. 예를 들어, 태깅된 화학 물질의 혼합물을, 제1 집단은 특정한 생물학적 표적에 결합하고 제2 집단은 그렇지 않은 (예를 들어, 음성 선택 또는 양성 선택에 의함) 적어도 2개의 집단으로 분리할 수 있다. 이어서, 제1 집단을 (예를 들어, 칼럼 상에서 용리시켜 관심 표적을 제공하거나 또는 분취액을 관심 표적과 인큐베이션시키는 것에 의해) 선택적으로 포획할 수 있고, 임의로, 예컨대 임의적인 세척, 정제, 음성 선택, 양성 선택 또는 분리 단계를 통해 추가로 분석하거나 시험할 수 있다.
마지막으로, 선택된 집단 내의 하나 이상의 구성원 (또는 화학 물질)의 화학적 히스토리는 작동가능하게 연결된 올리고뉴클레오티드의 서열에 의해 결정될 수 있다. 서열과 특정한 빌딩 블록을 상호관련시켜볼 때, 이러한 방법은 선택된 특징 (예를 들어, 표적 단백질에 결합하여 치료 효과를 도출하는 경향의 증가)을 사용하여 라이브러리의 개별 구성원을 확인할 수 있다. 이어서 추가의 시험 및 최적화를 위해, 그의 회합된 올리고뉴클레오티드 태그를 사용하거나 또는 사용하지 않고 확인된 라이브러리 구성원을 합성함으로써 후보 치료 화합물을 제조할 수 있다.
본원에 기재된 방법은 라이브러리를 다양화하거나 또는 라이브러리의 구성원을 조사하기 위해 임의의 개수의 임의적인 단계를 포함할 수 있다. 본원에 기재된 임의의 태깅 방법을 위해, 연속적인 "n"개의 태그는 추가의 "n"개의 라이게이션, 분리 및/또는 인산화 단계에 의해 부가될 수 있다. 예시적인 임의적 단계는 하나 이상의 제한 엔도뉴클레아제를 사용한 라이브러리 구성원-회합된 코딩 올리고뉴클레오티드의 제한; 예를 들어, 임의의 복구 효소, 예컨대 본원에 기재된 것에 의한 회합된 코딩 올리고뉴클레오티드의 복구; 예를 들어 증폭 및 서열분석을 위한 프라이밍 서열을 제공하거나 또는 서열의 고정화를 위한 표지, 예컨대 비오틴을 제공하는 하나 이상의 어댑터 서열과 같은 하나 이상의 어댑터 서열의, 라이브러리 구성원-회합된 코딩 올리고뉴클레오티드의 말단 중 하나 또는 양쪽에의 라이게이션; 역전사효소, 전사효소 또는 또 다른 주형-의존성 폴리머라제를 사용한 복합체 내의 어셈블리된 태그의 역전사 또는 전사에 이어 임의로 역전사; 예를 들어 PCR을 사용한 복합체 내의 어셈블리된 태그의 증폭; 예를 들어 박테리아 형질전환의 사용, 에멀젼 형성, 희석, 표면 포획 기술 등에 의한 복합체 내의 어셈블리된 태그의 하나 이상의 집단의 클론 단리물 생성; 예를 들어 뉴클레오티드의 주형-의존성 중합을 위한 주형으로서 클론 단리물을 사용함으로써 복합체 내의 어셈블리된 태그의 하나 이상의 집단의 클론 단리물의 증폭; 및 예를 들어 형광 표지된 뉴클레오티드와 함께 주형-의존성 중합을 위한 주형으로서 클론 단리물을 사용함으로써 복합체 내의 어셈블리된 태그의 하나 이상의 집단의 클론 단리물의 서열 결정을 포함한다. 올리고뉴클레오티드 태그를 증폭시키고 서열분석하는 추가의 방법은 본원에 기재되어 있다.
이들 방법을 사용하여, 예를 들어 선택 단계에서 특정한 특징 또는 기능을 갖는 임의의 수의 화학 물질을 확인 및 발견할 수 있다. 라이브러리 내의 목적하는 기능을 갖는 구성원 또는 관련 구성원 중 적어도 하나를 동시에 풍부화시키면서, 라이브러리를 적어도 2개의 부분으로 나누기 위한 기준으로서 목적하는 특징 또는 기능이 사용될 수 있다. 특정한 실시양태에서, 방법은 관심 치료 단백질에 결합하거나 그를 불활성화시키는 소형 약물-유사 라이브러리 구성원을 확인하는 것을 포함한다. 또 다른 실시양태에서, 규정된 화학적 조건 하에서 선택된 빌딩 블록의 반응을 통해 하나 이상의 분자가 특정한 단백질에 대한 치료제로서의 유용성을 가질 수 있는 다수의 분자의 조합 (또는 분자의 라이브러리)을 생성할 수 있도록, 화학 반응 순서를 설계하고 빌딩 블록 세트를 선택한다. 예를 들어, 화학 반응 및 빌딩 블록은 통상적으로 키나제 억제제에 존재하는 구조적 기를 갖는 라이브러리를 생성하도록 선택된다. 이들 경우 중 임의의 경우에서, 올리고뉴클레오티드 태그는 라이브러리 구성원의 화학적 히스토리를 코딩하고, 각각의 경우에 화학적 가능성의 집합체는 임의의 특정한 태그 조합에 의해 제시될 수 있다.
한 실시양태에서, 적어도 하나의 라이브러리의 구성원이 표적에 결합하는데 적합한 조건 하에서 화학 물질의 라이브러리 또는 그의 부분을 생물학적 표적과 접촉시킨 후, 표적에 결합하지 않은 라이브러리 구성원을 제거하고, 표적과 회합된 하나 이상의 올리고뉴클레오티드 태그를 분석한다. 이러한 방법은 관련 기술분야에 공지된 방법에 의해 태그를 증폭시키는 것을 임의로 포함할 수 있다. 예시적인 생물학적 표적은 효소 (예를 들어, 키나제, 포스파타제, 메틸라제, 데메틸라제, 프로테아제 및 DNA 복구 효소), 단백질:단백질 상호작용에 수반되는 단백질 (예를 들어, 수용체에 대한 리간드), 수용체 표적 (예를 들어, GPCR 및 RTK), 이온 채널, 박테리아, 바이러스, 기생충, DNA, RNA, 프리온 및 탄수화물을 포함한다.
또 다른 실시양태에서, 표적에 결합한 화학 물질을 증폭시키지 않지만 직접 분석한다. 예시적인 분석 방법은 소실 공명 광 결정 분석을 비롯한 마이크로어레이 분석; (예를 들어, his-태그를 사용하는 것에 의한) 태그를 디컨볼루션하는 비드-기반 방법; 무-표지 광 결정 바이오센서 분석 (예를 들어, 매사추세츠주 워번의 SRU 바이오시스템즈 인크.(SRU Biosystems, Inc.)로부터의 바인드(BIND)® 판독기); 또는 (예를 들어 태그의 라이브러리에 존재하는 서열에 상보적인 고정된 올리고뉴클레오티드의 어레이를 사용하는 것에 의한) 혼성화-기반 접근법을 포함한다.
또한, 화학-반응성 쌍 (또는 관능기)은 고체상 올리고뉴클레오티드 합성 방식에 용이하게 포함될 수 있고, 올리고뉴클레오티드의 효율적인 화학적 라이게이션을 지지할 것이다. 또한, 생성된 라이게이션된 올리고뉴클레오티드는 하나 이상의 폴리머라제를 사용하는 주형-의존성 중합을 위한 주형으로서의 역할을 할 수 있다. 따라서, 코딩된 라이브러리를 태깅하기 위한 본원에 기재된 결합 단계 중 임의의 단계는 효소적 라이게이션 및/또는 화학적 라이게이션 기술 중 하나 이상을 포함하도록 변형될 수 있다. 예시적인 라이게이션 기술은 효소 라이게이션, 예컨대 하나 이상의 RNA 리가제 및/또는 DNA 리가제의 사용; 및 화학적 라이게이션, 예컨대 화학-반응성 쌍 (예를 들어, 임의로 치환된 알키닐 및 아지도 관능기를 포함하는 쌍)의 사용을 포함한다.
또한, 하나 이상의 라이브러리는 스플릿-및-믹스 단계에서 조합될 수 있다. 2개 이상의 라이브러리의 혼합을 가능하게 하기 위해, 라이브러리 구성원은 본원에 기재된 바와 같이, 예컨대 라이브러리-확인 태그 내에, 라이게이션된 태그 내에 또는 헤드피스 서열의 일부로서 하나 이상의 라이브러리-확인 서열을 함유할 수 있다.
감소된 질량을 갖는 방법
단일-가닥 코딩 전략에 대한 동기의 대부분은 이중-가닥 태그와 비교하여 감소된 단일-가닥 태그의 질량으로부터 발생한다. 감소된 질량은 잠재적으로 용해도 증가, 비용 감소, 반응성 증가, 표적 접근가능성 증가, 유체역학적 반경 감소, 분석 평가의 정확도 증가 등을 비롯한 여러 이점을 부여한다. 단일-가닥 태깅 방법론을 사용하는 것에 더하여, 하기 중 하나 이상의 사용을 포함함으로써 추가로 질량의 감소를 달성할 수 있다: 감소된 길이를 갖는 하나 이상의 태그, 일정한 질량 태그 세트, 코딩 헤드피스, 프라이머-결합 영역 및/또는 불변 영역이 결여된 라이브러리의 하나 이상의 구성원, 감소된 불변 영역을 갖는 라이브러리의 하나 이상의 구성원 또는 본원에 기재된 임의의 다른 방법론.
라이브러리 내의 구성원의 질량을 최소화하기 위해, 하나 이상의 태그의 길이를, 예컨대 각 스플릿 크기를 코딩할 정도로 가능한 짧은 길이로 감소시킬 수 있다. 특히, 태그는 20개 미만의 뉴클레오티드 (예를 들어, 19개 미만의 뉴클레오티드, 18개 미만의 뉴클레오티드, 17개 미만의 뉴클레오티드, 16개 미만의 뉴클레오티드, 15개 미만의 뉴클레오티드, 14개 미만의 뉴클레오티드, 13개 미만의 뉴클레오티드, 12개 미만의 뉴클레오티드, 11개 미만의 뉴클레오티드, 10개 미만의 뉴클레오티드, 9개 미만의 뉴클레오티드, 8개 미만의 뉴클레오티드 또는 7개 미만의 뉴클레오티드)일 수 있다. 하기 실시예에 기재된 바와 같이, 보다 짧은 태그 (예를 들어, 약 10개 또는 그 미만의 뉴클레오티드)가 태그 라이게이션에 사용될 수 있다.
일정한 질량 전략이 또한 사용될 수 있으며, 이는 라이브러리 합성 동안 분석에 도움이 될 수 있다. 또한, 일정한 질량 태그 세트는 모든 단일 오류 발생 (예를 들어, 서열의 오판독으로부터 또는 태그의 화학적 또는 효소적 라이게이션로부터 발생된 오류) 및 대부분의 다중 오류 발생의 인식을 가능하게 할 수 있다. 일정한 질량 단일-가닥 태그 세트의 길이와 코딩 능력 사이의 관계 (예를 들어, 특정 빌딩 블록 스플릿 크기 또는 라이브러리 아이덴티티 등을 지지하는 최소 길이)는 하기 표 1에 요약되어 있다. 따라서, 일정한 질량 태그 세트의 사용은 라이브러리 형성 동안 오류 인식은 유지하면서, 유익한 코딩 능력을 제공하는데 사용될 수 있다.
<표 1>
Figure 112020085359590-pat00001
라이브러리에서 질량을 최소화하기 위해, 헤드피스를 화학적 모이어티 및 태그를 연결시키는데 뿐만 아니라, 특정한 라이브러리의 아이덴티티 또는 특정한 단계를 코딩하는데 사용할 수 있다. 예를 들어, 헤드피스는 예컨대 특정 라이브러리와 관련된 특정한 서열을 사용함으로써 제1 스플릿(들) 또는 라이브러리의 아이덴티티를 코딩하는 다수의 헤드피스와 같이 정보를 코딩할 수 있다.
또한, DNA-코딩된 화학 물질의 라이브러리로부터 프라이머-결합 (예를 들어 불변) 영역은 선택 단계(들) 동안 배제될 수 있다. 이어서, 이들 영역은 선택 이후에, 예를 들어 단일-가닥 라이게이션에 의해 부가될 수 있다. 하나의 예시적인 전략은 본원에 기재된 바와 같이, 코딩 올리고뉴클레오티드의 5'-말단에 화학 물질을 제공하는 단계, 임의의 유용한 특정한 특징 또는 기능에 기초하여 특정한 화학 물질을 선택하는 단계, 및 프라이머-결합 서열을 포함하고 하나 이상의 태그, 예를 들어 "사용" 태그, "기원" 태그 등을 임의로 함유할 수 있는 코딩 올리고뉴클레오티드의 3'-말단에 테일피스 올리고뉴클레오티드를 라이게이션시키는 단계를 포함할 것이다. 이어서, 이러한 프라이머-결합 서열은 주형-의존성 중합을 개시하여 선택된 라이브러리 구성원에 상보적인 cDNA (또는 cRNA)를 생성하는데 사용될 수 있다. 이어서, cDNA 또는 cRNA는 그의 3'-말단에서 프라이머-결합 서열을 함유하는 올리고뉴클레오티드에 라이게이션될 것이고, 코딩 정보는 프라이머-결합 서열에 의해 양 측면에 플랭킹되므로, 올리고뉴클레오티드는 예컨대 본원에 기재된 임의의 확립된 접근법을 사용하여 서열분석될 수 있고/거나 증폭될 수 있다.
질량은 코딩 태그를 분리하는 하나 이상의 불변 서열을 생략하거나 또는 그의 크기를 감소시킴으로써 추가로 최소화될 수 있다. 단일-가닥 라이게이션은 라이게이션되는 말단 사이에 또는 이들 말단과 스플린트 사이에 어떤 상보적인 관계도 필요로 하지 않는다. 따라서, 효소적 라이게이션을 지지하는 어떤 고정 서열도 필요하지 않다. 태그 사이의 짧은 고정 영역이 태그의 정보 분석 또는 다른 인실리코 디컨볼루션 과정에 유용할 수 있다.
라이브러리 내에 화학 물질을 코딩하는 방법
본 발명의 방법은 올리고뉴클레오티드 태그에 의해 코딩되는 다양한 개수의 화학 물질을 갖는 라이브러리를 합성하는데 사용될 수 있다. 빌딩 블록 및 코딩 DNA 태그의 예는 미국 특허 출원 공개 번호 2007/0224607에서 발견되며, 이는 본원에 참조로 포함된다.
각각의 화학 물질은 하나 이상의 빌딩 블록 및 임의로 스캐폴드로부터 형성된다. 스캐폴드는 특정한 기하학적형태로 하나 이상의 다양성 노드를 제공하는 역할을 한다 (예를 들어, 트리아진은 헤테로아릴 고리 또는 선형 기하학적형태 주변에 공간적으로 배열된 3개의 노드를 제공함).
빌딩 블록 및 그의 코딩 태그는 직접적으로 또는 (예를 들어, 스페이서를 통해) 간접적으로 헤드피스에 부가되어 복합체를 형성할 수 있다. 헤드피스가 스페이서를 포함하는 경우에, 빌딩 블록 또는 스캐폴드는 스페이서의 말단에 부가된다. 스페이서가 존재하지 않는 경우에, 빌딩 블록은 헤드피스에 직접적으로 부가될 수 있거나, 또는 빌딩 블록 그 자체가 헤드피스의 관능기와 반응하는 스페이서를 포함할 수 있다. 예시적인 스페이서 및 헤드피스가 본원에 기재되어 있다.
스캐폴드는 임의의 유용한 방식으로 부가될 수 있다. 예를 들어, 스캐폴드는 스페이서 또는 헤드피스의 말단에 부가될 수 있고, 연속적인 빌딩 블록은 스캐폴드의 이용가능한 다양성 노드에 부가될 수 있다. 또 다른 예에서, 빌딩 블록 An 은 먼저 스페이서 또는 헤드피스에 부가된 다음, 스캐폴드 S의 다양성 노드는 빌딩 블록 An의 관능기와 반응한다. 특정한 스캐폴드를 코딩하는 올리고뉴클레오티드 태그는 헤드피스 또는 복합체에 임의로 부가될 수 있다. 예를 들어, Sn은 n개의 반응 용기 내의 복합체에 부가되고 (여기서 n은 1 초과의 정수임), 태그 Sn (즉, 태그 S1, S2, ... Sn-1, Sn)은 복합체의 관능기에 결합된다.
빌딩 블록은 다중의 합성 단계에 첨가될 수 있다. 예를 들어, 부착된 스페이서를 임의로 갖는 헤드피스의 분취액을 n개의 반응 용기로 분리한다 (여기서 n은 2 이상의 정수임). 제1 단계에서, 빌딩 블록 An을 각각의 n개의 반응 용기에 첨가하고 (즉, 빌딩 블록 A1, A2, ... An-1, An을 반응 용기 1, 2, ... n-1, n에 첨가함), 여기서 n은 정수이며 각각의 빌딩 블록 An은 고유하다. 제2 단계에서, 스캐폴드 S를 각각의 반응 용기에 첨가하여 An-S 복합체를 형성한다. 임의로, 스캐폴드 Sn을 각각의 반응 용기에 첨가하여 An-Sn 복합체를 형성할 수 있으며, 여기서 n은 2 초과의 정수이고, 각각의 스캐폴드 Sn은 고유할 수 있다. 제3 단계에서, 빌딩 블록 Bn을 An-S 복합체를 함유하는 각각의 n개의 반응 용기에 첨가하고 (즉, 빌딩 블록 B1, B2, ... Bn-1, Bn을 A1-S, A2-S, ... An-1-S, An-S 복합체를 함유하는 반응 용기 1, 2, ... n-1, n에 첨가함), 여기서 각각의 빌딩 블록 Bn은 고유하다. 추가의 단계에서, 빌딩 블록 Cn을 Bn-An-S 복합체를 함유하는 각각의 n개의 반응 용기에 첨가할 수 있으며 (즉, 빌딩 블록 C1, C2, ... Cn-1, Cn을 B1-A1-S ... Bn-An-S 복합체를 함유하는 반응 용기 1, 2, ... n-1, n에 첨가함), 여기서 각각의 빌딩 블록 Cn은 고유하다. 생성된 라이브러리는 n3개의 태그를 갖는 n3개의 복합체를 가질 것이다. 이러한 방식으로, 추가의 합성 단계를 사용하여 추가의 빌딩 블록에 결합시킴으로써 라이브러리를 추가로 다양화할 수 있다.
라이브러리를 형성한 후, 생성된 복합체를 임의로 정제하고, 중합 또는 예를 들어 테일피스에 대한 라이게이션 반응을 수행할 수 있다. 이러한 일반적인 전략은 추가의 다양성 노드 및 빌딩 블록 (예를 들어, D, E, F 등)을 포함하도록 확대될 수 있다. 예를 들어, 제1 다양성 노드는 빌딩 블록 및/또는 S와 반응하고, 올리고뉴클레오티드 태그에 의해 코딩된다. 이어서, 추가의 빌딩 블록은 생성된 복합체와 반응하고, 후속 다양성 노드는 추가의 빌딩 블록에 의해 유도체화되며, 이는 중합 또는 라이게이션 반응에 사용되는 프라이머에 의해 코딩된다.
코딩된 라이브러리를 형성하기 위해, 각각의 합성 단계 전후에 올리고뉴클레오티드 태그를 복합체에 부가한다. 예를 들어, 각각의 반응 용기에의 빌딩 블록 An의 첨가 전후에 태그 An을 헤드피스의 관능기에 결합시킨다 (즉, 태그 A1, A2, ... An-1, An을 헤드피스를 함유하는 반응 용기 1, 2, ... n-1, n에 첨가함). 각각의 태그 An은 각각의 고유한 빌딩 블록 An과 상호관련된 특징적 서열을 가지며, 태그 An의 서열을 결정하는 것은 빌딩 블록 An의 화학 구조를 제공한다. 이러한 방식으로, 추가의 태그를 사용하여 추가의 빌딩 블록 또는 추가의 스캐폴드를 코딩한다.
추가로, 복합체에 부가된 마지막 태그는 프라이머-결합 서열을 포함할 수 있거나, 또는 (예컨대, 라이게이션에 의한) 프라이머-결합 서열의 결합을 가능하게 하는 관능기를 제공할 수 있다. 프라이머-결합 서열은 복합체의 올리고뉴클레오티드 태그를 증폭시키고/거나 서열분석하는데 사용될 수 있다. 예시적인 증폭 및 서열분석 방법은 폴리머라제 연쇄 반응 (PCR), 선형 쇄 증폭 (LCR), 롤링 써클 증폭 (RCA) 또는 관련 기술분야에 공지된 핵산 서열을 증폭 또는 결정하는 임의의 다른 방법을 포함한다.
이들 방법을 사용함으로써, 다수의 코딩된 화학 물질을 갖는 대형 라이브러리를 형성할 수 있다. 예를 들어, 헤드피스를 스페이서 및 1,000개의 상이한 변이체를 포함하는 (즉, n = 1,000) 빌딩 블록 An과 반응시킨다. 각각의 빌딩 블록 An에 대해, DNA 태그 An은 헤드피스에 라이게이션되거나 또는 프라이머 연장된다. 이들 반응은 1,000-웰 플레이트 또는 10 x 100 웰 플레이트에서 수행될 수 있다. 모든 반응을 풀링하고, 임의로 정제하고, 제2 플레이트 세트로 스플릿할 수 있다. 다음으로, 1,000개의 상이한 변이체를 또한 포함하는 빌딩 블록 Bn을 사용하여 동일한 절차를 수행할 수 있다. DNA 태그 Bn을 An-헤드피스 복합체에 라이게이션시킬 수 있고, 모든 반응을 풀링할 수 있다. 생성된 라이브러리는 1,000,000개의 상이한 태그 조합에 의해 태깅된 1,000 x 1,000개의 An x Bn 조합 (즉, 1,000,000개의 화합물)을 포함한다. 동일한 접근법을 확장시켜 빌딩 블록 Cn, Dn, En 등을 부가시킬 수 있다. 이어서, 생성된 라이브러리를 사용하여 표적에 결합하는 화합물을 확인할 수 있다. DNA 태그의 PCR 및 서열분석에 의해 라이브러리에 결합하는 화학 물질의 구조를 임의로 평가함으로써 풍부화된 화합물을 확인할 수 있다.
각각의 빌딩 블록의 부가 이후 태깅을 피하기 위해 또는 풀링 (또는 혼합)을 피하기 위해 이러한 방법을 변형시킬 수 있다. 예를 들어, 방법은 빌딩 블록 An을 n개의 반응 용기 (여기서, n은 1 초과의 정수임)에 첨가하고 동일한 빌딩 블록 B1을 각각의 반응 웰에 첨가하는 것에 의해 변형될 수 있다. 여기서, B1은 각각의 화학 물질에 대해 동일하며, 따라서 이러한 빌딩 블록을 코딩하는 올리고뉴클레오티드 태그는 필요하지 않다. 빌딩 블록을 첨가한 후, 복합체를 풀링시킬 수 있거나 또는 풀링시키지 않을 수 있다. 예를 들어, 마지막 빌딩 블록 첨가 단계 이후에 라이브러리를 풀링시키지 않고, 풀을 개별적으로 스크리닝하여 표적에 결합하는 화합물(들)을 확인한다. 합성 후 모든 반응의 풀링을 피하기 위해, 예를 들어 바인드® 판독기 (SRU 바이오시스템즈, 인크.로부터의 것)를 사용하여 고처리량 포맷으로 (예를 들어, 384 웰 플레이트 및 1,536 웰 플레이트) 센서 표면 상에서의 결합을 모니터링할 수 있다. 예를 들어, 빌딩 블록 An은 DNA 태그 An으로 코딩될 수 있고, 빌딩 블록 Bn은 웰 플레이트 내의 그의 위치에 의해 코딩될 수 있다. 이어서, 후보 화합물은 (예를 들어, 또한 SRU 바이오시스템즈, 인크.에서 입수가능한 바인드® 바이오센서를 사용하거나 또는 ELISA 검정을 사용하는) 결합 검정을 사용하고, 서열분석, 마이크로어레이 분석 및/또는 제한 소화 분석에 의해 An 태그를 분석함으로써 확인할 수 있다. 이러한 분석은 목적하는 분자를 생성하는 빌딩 블록 An 및 Bn의 조합을 확인가능하게 한다.
증폭 방법은 유중수 에멀젼을 형성하여 다수의 수성 마이크로반응기를 생성하는 것을 임의로 포함할 수 있다. 반응 조건 (예를 들어, 복합체의 농도 및 마이크로반응기의 크기)은 평균적으로 화합물 라이브러리의 적어도 하나의 구성원을 갖는 마이크로반응기를 제공하도록 조정될 수 있다. 각 마이크로반응기는 표적, 복합체 또는 복합체의 부분 (예를 들어, 하나 이상의 태그)에 결합 및/또는 표적에 결합할 수 있는 단일 비드, 및 핵산 증폭을 수행하기 위한 하나 이상의 필요 시약을 갖는 증폭 반응 용액을 또한 함유할 수 있다. 마이크로반응기 내에서 태그를 증폭시킨 후, 마이크로반응기 내에서 증폭된 태그의 카피를 비드에 결합시키고, 임의의 유용한 방법에 의해 코팅된 비드를 확인할 수 있다.
일단 관심 표적에 결합하는 빌딩 블록을 제1 라이브러리로부터 확인하고 나면, 반복적인 방식으로 제2 라이브러리를 제조할 수 있다. 예를 들어, 본원에 기재된 바와 같이, 1 또는 2개의 추가의 다양성 노드를 부가할 수 있고, 제2 라이브러리를 생성하고 샘플링한다. 이러한 과정은 목적하는 분자 특성 및 제약 특성을 갖는 분자를 생성하는데 필요한 횟수만큼 반복할 수 있다.
다양한 라이게이션 기술을 사용하여 스캐폴드, 빌딩 블록, 스페이서, 연결 및 태그를 부가할 수 있다. 따라서, 본원에 기재된 결합 단계 중 임의의 단계는 임의의 유용한 라이게이션 기술 또는 기술들을 포함할 수 있다. 예시적인 라이게이션 기술은 본원에 기재된 바와 같은 효소적 라이게이션, 예컨대 하나 이상의 RNA 리가제 및/또는 DNA 리가제의 사용; 및 본원에 기재된 바와 같은 화학적 라이게이션, 예컨대 화학-반응성 쌍의 사용을 포함한다.
실시예 1
복합체를 위한 일반적 전략
본 발명의 복합체는 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 하나 이상의 연결을 포함하도록 형성될 수 있다. 예를 들어, 복합체는 (5'에서 3' 방향으로) 화학 물질 (별표), 고정된 불변 서열 (예를 들어, 헤드피스)에 이어 3개의 가변 코딩 서열 (예를 들어, 3개의 태그), 및 또 다른 고정된 불변 서열 (예를 들어, 테일피스)을 포함하도록 형성될 수 있으며, 여기서 고정된 불변 서열과 가변 코딩 서열 사이의 연결은 판독불가능할 수 있다 (도 1b).
판독불가능한 연결은 임의의 유용한 모이어티 또는 관능기에 의해 형성될 수 있다. 비제한적 예는 5'- 및 3'-연결부 사이에 판독불가능한 연결을 형성할 수 있는 프소랄렌이다 (도 2).
판독불가능한 연결은 시아노비닐카르바졸 기의 가역적 공-반응성 기를 갖는 교차-연결 올리고뉴클레오티드에 의해 형성될 수 있다. 복합체는 (5'에서 3' 방향으로) 화학 물질 (별표), 고정된 불변 서열 (예를 들어, 헤드피스), 시아노비닐카르바졸 기의 가역적 공-반응성 기를 통해 교차-연결된 (약 366 nm에서 교차-연결됨, X로 표시) 교차-연결 올리고뉴클레오티드 및 그에 이어 5'- 및 3'-말단에서 고정된 불변 서열을 갖는 가변 코딩 서열 (예를 들어, 5'- 및 3'-연결부를 갖는 태그)을 포함할 수 있다 (도 3). 가역적 공-반응성 기 (시아노비닐카르바졸 기 및 티미딘의 쌍)에 의한 예시적인 가역적 반응은 3'-연결부, 5'-연결부 및 교차-연결 올리고뉴클레오티드에서 존재할 수 있다 (도 4). 다른 판독불가능한 연결은 복구 효소(들)의 사용에 의해 디컨볼루션되게 할 수 있다.
판독 또는 디컨볼루션 과정의 일부로서, 복합체를 화학적 과정 및/또는 효소적 과정 (예를 들어, 리가제 및 임의로 키나제)으로 반응시켜 태그를 라이게이션시킬 수 있다. 인접한 태그 사이의 접합부가 닉인 경우에, 리가제를 사용하여 태그를 라이게이션시킬 수 있다. 임의로, 키나제를 사용하여 말단 5'-히드록실 기를 포스페이트 기로 전환시킬 수 있다. 인접한 태그 사이의 접합부가 하나 이상의 뉴클레오티드에 의한 연장을 필요로 하는 갭일 경우에, 폴리머라제를 사용하여 갭을 건너 연장시킨 후 태그를 라이게이션시킬 수 있다 (임의로 키나제를 포함함). 임의로 폴리머라제는 감소된 가닥-치환 활성을 갖는다. 다음으로, 교차-연결 올리고뉴클레오티드를 방출시켜 주형을 형성한다 (예를 들어, 약 312 nm에서의 조사를 사용함). 마지막으로, PCR에 의해 주형을 임의로 증폭시키고 서열분석한다.
이들 복합체 중 임의의 복합체의 경우에, 각각의 가변 코딩 서열은 고정된 불변 서열인 5'-연결부 및 3'-연결부를 임의로 포함할 수 있다. 연결이 판독불가능하기 때문에, 릴레이 프라이머를 사용하여 연결에 걸쳐있게 하고 폴리머라제에 의한 연장을 가능하게 하여, 올리고뉴클레오티드 단편을 형성할 수 있다. 이어서 리가제를 사용하여 단편을 라이게이션시킬 수 있고, PCR에 의해 임의로 증폭시키고 서열분석할 수 있다.
대안적으로, 판독불가능한 연결의 각 측면의 코딩 서열을 재조합-매개 과정을 사용하여 단일 cDNA 서열로 카피할 수 있으며, 여기서 재조합 이벤트는 동일한 조상 주형 서열로부터 유래된 서열에 대해 우세하게 일어난다. 이러한 메카니즘은 태그 회합 정보를 보존하고, 유래된 서열 데이터로부터 이들 회합을 추론가능하게 한다. 재조합-유발 cDNA를 위한 주형이 될 수 있는 판독불가능한 연결을 생성하는 하나의 가능한 방법은 연결의 각 측면에 반복 상동 영역을 확립하는 것이다.
실시예 2
하나의 태깅 이벤트를 모델링하기 위한, 시아노비닐 카르바졸을 사용한 광화학적 올리고뉴클레오티드 교차-연결
2개의 시아노비닐 카르바졸 변형을 함유하는 올리고뉴클레오티드 CNVKJ를 니혼 테크노 서비스(Nihon Techno Service) (일본)로부터 수득하였다 (도 5). 올리고뉴클레오티드 CNVK2_P_태그B, CNVK2_NP_태그B 및 CNVK2_태그A는 인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies) (IDT) (아이오와주)로부터 수득하였다. 각각의 올리고뉴클레오티드를 물 중에 1 mM의 농도로 용해시켰다.
광화학적 교차-연결 조건은 다음과 같았다: 올리고뉴클레오티드 CNVKJ, CNVK2_P_태그B 및 CNVK2_태그A를 1.5 mL 천연 색상 폴리프로필렌 마이크로원심분리 튜브 (피셔 사이언티픽(Fisher Scientific), 02-682-550) 내에서 20 uL 또는 50 uL 분취액으로 500 mM 포스페이트 완충제 (pH 7.0) 중의 각각 100 uM의 등몰 비로 혼합하였다. 이어서 각각의 반응에 UVL-21 (4 와트) 램프 (95-0018-02) (울트라 바이올렛 프로덕츠(Ultra Violet Products), 캘리포니아주)를 사용하여 365 nm로 4℃에서 2시간 동안 조사하였다. 이어서 반응 산물을 10% 변성 PAAG 상에서의 전기영동 뿐만 아니라 LCMS (써모 피셔 사이언티픽(Thermo Fisher Scientific))에 의해 분석하였다 (도 6). 관찰된 MW가 16,894 Da (계산치 16,890 Da)인 광화학적으로 교차-연결된 올리고뉴클레오티드 접합체로 70%를 초과하는 출발 물질이 전환되었다. 동일한 교차-연결 반응을 500 mM 포스페이트 완충제 (pH 5.5) 또는 500 mM 보레이트 완충제 (pH 9.5) 중에서 수행하였을 때, 유사한 결과 및 수율이 관찰되었다.
광화학적으로 교차-연결된 CNVK2_P_태그B, CNVK2_태그A 및 CNVKJ의 올리고뉴클레오티드 접합체를 10% 변성 PAAG 상에서 정제하고, 1.5 mL 천연 색상 폴리프로필렌 마이크로원심분리 튜브 (피셔 사이언티픽, 02-682-550) 내에서 50 uL 분취액을 스펙트롤린(Spectroline) E-시리즈 EB-160C (6 와트) 램프 (스펙트로닉스 코포레이션(Spectronics Corp.), 뉴욕주)를 사용하여 312 nm에서 1시간 동안 (80℃에서) 조사하면서 80℃에서 가열하여 탈-교차연결시켰다. 산물을 LCMS에 의해 분석하였다. 반응은 비변경된 출발 올리고뉴클레오티드 모델 태그 CNVK2_P_태그B (관찰치 MW 6,578 Da (계산치 6,579 Da)) 및 CNVK2_태그A (관찰치 MW 5,558 Da (계산치 5,558 Da))를 정량적으로 산출하였다 (도 7).
다중 CNVK-함유 교차-연결된 올리고뉴클레오티드의 해리를 연구하기 위해, 본 발명자들은 상기 프로토콜을 개조하여 단일 올리고뉴클레오티드, 이중_CNVK_주형 (AAAAAAGTCGTGACACGTCGGAAAAAAAAAAAACGGTGACACGGTCGAAAAAA, IDT (아이오와주))에 광화학적으로 교차연결된 2개의 CNVK 올리고, CNVKJ 및 스플린트_14_CNVK (스플린트_14_CNVK는 바이오서치 테크놀로지스(Biosearch Technologies, 캘리포니아주)에 의해 합성된 CGAXCGTGTCAXCG이며, 여기서 X는 CNVK임)를 갖는 복합체를 제조하였다. 이 복합체를 LCMS에 의해 분석하였다: 관찰치 MW 25,079 Da (계산치 25,055 Da). 이어서, 이것을 다시 상기 기재된 바와 같이 물 중에 100 uM 농도로 용해시키고, UV 312 nm에 의해 80℃에서 1시간 동안 조사하였다. 산물을 LCMS에 의해 분석하여 출발 이중_CNVK_주형의 회수를 발견하였다: 관찰치 MW 16,492 Da (계산치 16,492 Da) (도 8).
실시예 3
광화학적으로 교차-연결된 태그로부터 서열 정보의 회수를 모델링하기 위한, 시아노비닐카르바졸 광화학적으로 교차-연결된 올리고뉴클레오티드의 라이게이션 및 광화학적 탈-교차-연결
실시예 2에 기재된 바와 같이 CNVK2_P_태그B, CNVK2_태그A 및 CNVKJ의 복합체를 제조하고, 광화학적으로 교차-연결시키고, 겔-정제하였다.
광화학적으로 교차-연결된 모델 태그 쌍을 1x T4 DNA 리가제 완충제 (NEB, 매사추세츠주) 중에 용해시키고, T4 DNA 리가제 (NEB, 매사추세츠주)와 함께 37℃에서 1시간 동안 인큐베이션하였다. 이어서 이 반응 산물을 실시예 2에 기재된 바와 같이 탈교차-연결시키고, 변성 겔 전기영동 및 LCMS에 의해 분석하였다 (도 9). 라이게이션 반응 산물이 높은 수율로 관찰되었다 (관찰치 MW 12,119 Da (계산치 12,119 Da)).
상응하는 광화학적으로 교차-연결된 비-인산화 모델 태그 쌍 CNVK2_NP_태그B와 CNVK2_태그A 및 CNVKJ를 또한 상기 기재된 바와 같이 제조하였다. 이러한 복합체의 LCMS 분석으로 관찰치 MW가 16,503 Da인 것으로 밝혀졌다 (계산치 16,499 Da, 도 10). 광화학적으로 교차-연결된 복합체를 1x T4 리가제 완충제 (NEB) 중에 용해시키고, T4 폴리뉴클레오티드 키나제 및 T4 DNA 리가제 (NEB)의 혼합물과 함께 37℃에서 1시간 동안 인큐베이션하였다. 이러한 커플링된 인산화-라이게이션 반응 산물을 이어서, 실시예 2에 기재된 바와 같이 UV로 312 nm에서 80℃에서 1시간 동안 조사하여 광화학적으로 탈교차-연결시켰다. 이러한 인산화-라이게이션 반응 산물을 변성 겔 전기영동 및 LCMS에 의해 관찰하여, 관찰치 MW가 11,894 Da인 것으로 밝혀졌다 (계산치 MW 11,896 Da (라이게이션된 산물의 5' 말단에서 추가의 인산화)) (도 10).
실시예 4
하나의 태깅 이벤트를 모델링하기 위한, 스템 내에서 프소랄렌을 사용한 광화학적 올리고뉴클레오티드 교차-연결
5'-말단에서 C2-프소랄렌으로 변형된 올리고뉴클레오티드 5PSO2_A9_TA를 바이오리서치 (캘리포니아주)로부터 수득하였다 (도 11). 올리고뉴클레오티드 PSO_HP_A9_TCT는 IDT (아이오와주)로부터 수득하였다 (도 11). 올리고뉴클레오티드 둘 다를 500 mM 포스페이트 완충제 (pH 7.0) 중에 각각 0.5 mM 농도로 용해시키고, 95℃로 가열한 후 실온으로 냉각시켜 어닐링시켰다. 이어서 반응을 UVL-21 콤팩트 UV 램프 (UVP)를 사용하여 30분 동안 4℃에서 UV 광으로 365 nm로 조사하였다. 산물을 LCMS에 의해 분석하였다. 본 발명자들은 관찰치 MW가 17,643 Da (계산치 MW 17,643.4 Da, 도 12 참조)인 광화학적으로 교차-연결된 산물의 신속한 형성을 관찰하였다.
실시예 5
하나의 태깅 이벤트를 모델링하기 위한, 프소랄렌을 사용한 광화학적 올리고뉴클레오티드 라이게이션
올리고뉴클레오티드 태그1_PsoCVU 및 스플린트C_PsoC2를 IDT (아이오와주)로부터 수득하였다 (도 13). 올리고뉴클레오티드 5PSOC2_A9_GA (5'-말단에서 C2 프소랄렌으로 변형된 것)는 바이오리서치 (캘리포니아주)로부터 수득하였다 (도 13).
태그1_PsoCVU 및 5PSOC2_A9_GA의 광화학적으로 라이게이션된 올리고뉴클레오티드 접합체를 다음과 같이 제조하였다. 광라이게이션은 제1 및 제2 올리고뉴클레오티드 둘 다와 혼성화하고 그의 반응성 말단이 함께-위치하도록 설계된 제3 올리고뉴클레오티드의 존재 하에, 하나의 올리고뉴클레오티드의 5'-프소랄렌 피론 모이어티를 제2 올리고뉴클레오티드의 3' 티미딘과 광화학적 반응시키는 것에 의해 달성된다 (도 14).
광화학 라이게이션 조건은 다음과 같았다: 올리고뉴클레오티드 5PsoC2_A9_GA (최종 1 mM) 및 태그1_PsoCVU (최종 1.1 mM) 및 스플린트C_PsoC2 (최종 1.1 mM)를 1.5 mL 천연 색상 폴리프로필렌 마이크로원심분리 튜브 (피셔 사이언티픽, 02-682-550) 내에서 500 mM 포스페이트 완충제 (pH 7.0) 중의 10 uL 광라이게이션 반응으로 조합시켰다. 반응 혼합물을 먼저 95℃로 가열한 다음 실온으로 천천히 냉각시켰다. 이어서 반응을 UVL-21 콤팩트 UV 램프 (UVP)를 사용하여 4℃에서 UV 광으로 365 nm로 조사하였다. 시간-경과에 따라 분취액 1 uL를 취하고, 15% TBE/8M 우레아 변성 폴리아크릴아미드 겔 상에서 분석하였다 (도 15). 겔을 가시화하고, 형광 TLC 플레이트의 UV 쉐도잉을 사용하여 촬영하였다. 광라이게이션된 5PsoC2_A9_GA 및 태그1_PsoCVU의 접합체가 높은 수율로 형성되었다. 24시간 후, 수율은 대략 90%였다 (도 15).
24-시간 샘플을 LCMS에 의해 분석하였다 (도 16). 주요 LC 피크는 관찰치 MW가 15,252.4 Da (계산치 MW는 15,243.1 Da)으로, 5PsoC2_A9_GA 및 태그1_PsoCVU의 광라이게이션된 접합체와 상응하였다.
실시예 6
단일 태깅 이벤트의 판독을 모델링하기 위한, 말단 프라이머 연장, 비-말단 프라이머 연장 및 라이게이션을 사용한 비-폴리머라제-판독가능한 광화학적으로-라이게이션된 프소랄렌-접합 모델 태그로부터의 cDNA 생성
다음과 같은 2개의 모델 태그 올리고뉴클레오티드를 사용하여 실시예 5에 기재된 것과 유사한 방법을 사용하여 프소랄렌-티미딘 광화학적으로 라이게이션된 올리고뉴클레오티드 접합체 (Bio_Pso)를 생성하였다: 5'-비오티닐화 올리고뉴클레오티드 5Bio_태그_PsoCVU 및 5'-프소랄렌 올리고뉴클레오티드 5PsoC2_A9_GA와 함께 스플린트 올리고뉴클레오티드 스플린트C_PsoC2, 3종의 올리고뉴클레오티드는 모두 IDT (아이오와주)로부터 수득하였고, 도 17에 제시한다. 반응 24시간 후에, Bio_Pso를 10% TBE-우레아 변성 PAAG 상에서 정제하고, LCMS에 의해 분석하여, 산물의 관찰치 MW가 15,834.0 Da인 것으로 밝혀내었다 (계산치 MW 15,812.7 Da) (도 18).
프소랄렌-티미딘 광화학적으로 라이게이션된 올리고뉴클레오티드 접합체 Bio_Pso를 주형으로 사용하여 T4 DNA 폴리머라제 (NEB, 매사추세츠주)에 의한 말단 올리고뉴클레오티드 프라이머 (FAM프라이머) 및 비-말단 올리고뉴클레오티드 프라이머 (포스-스플린트C_PsoC2) 둘 다의 효소적 연장에 의해 cDNA를 생성하였다. 포스-스플린트C_PsoC2는 T4 PNK (NEB, 매사추세츠주)를 사용하여 스플린트C_PsoC2의 5'-인산화에 의해 생성하였다. 각각의 dNTP 1 mM 및 T4 DNA 폴리머라제 (NEB, 매사추세츠주) 10 uL가 보충된 1x T4 DNA 리가제 완충제 (NEB, 매사추세츠주) 중에 FAM프라이머, 포스-스플린트C_PsoC2 및 Bio_Pso를 각각 10 uM 함유하는 100 uL 반응에서 cDNA 생성을 수행하였다. 반응 혼합물을 37℃에서 1시간 동안 인큐베이션한 다음 0.5 mM ATP 및 5 uL T4 DNA 리가제 (2,000 u/ul, NEB, 매사추세츠주)를 보충하고, 이어서 또 다시 37℃에서 1시간 동안 인큐베이션하였다.
이어서 반응 혼합물을 스트렙타비딘-코팅된 디나비즈(DynaBeads) M280 (인비트로젠(Invitrogen), 실온에서 1시간 동안 PBS로 사전-세척된 것) 200 uL와 함께 인큐베이션하고, 비드를 1mL PBS로 세척하고, 산물을 35 uL 100 mM NaOH로 용리시켰다. 이어서 1 M 트리스 HCl (pH 7.0) 5 uL를 첨가하여 용리액을 중화시키고, LCMS에 의해 분석하였다.
495nm에서 검출된, 생성된 산물의 LCMS 분석은 대략 50%의 FAM프라이머가 Bio_Pso 주형에 상보적인 전장 서열 마이너스 단일 dA 뉴클레오티드로 연장되었음을 보여주었다 (관찰치 MW 15,170 Da, 예상되는 전장 MW 15,458 Da). 나머지 FAM프라이머의 대부분은 광화학적 라이게이션 접합부까지 연장되었다 (관찰치 MW 11,154 Da, 계산치 MW 11,154 Da) (도 19).
상기 기재된 cDNA-생성을 리가제 효소의 첨가없이 수행할 경우에, 전장 상보적 서열 (마이너스 단일 dA)은 관찰되지 않았다 (도 20).
실시예 7
하나의 태깅 이벤트를 모델링하기 위한, 카르복시비닐 우리딘을 사용한 광화학적 올리고뉴클레오티드 라이게이션
올리고뉴클레오티드 CVU_G 및 CVU_A를 트리링크 (캘리포니아주)에 의해 합성하였다 (도 21). 올리고뉴클레오티드 둘 다를 5-(카르복시)비닐-2'-데옥시우리딘으로 5'-변형시켰다 (도 21). 올리고뉴클레오티드 태그1_PsoCVU, 스플린트C_CVU 및 스플린트A_CVU는 IDT DNA (아이오와주)로부터 수득하였다 (도 21).
조사된 5'-5-(카르복시)비닐-2'-데옥시우리딘과 3'-티미딘 사이에 형성된 광화학적 라이게이션 접합부의 구조를 도 22에 제시한다.
1.5 ml 천연 색상 폴리프로필렌 마이크로원심분리 튜브 (피셔 사이언티픽, 02-682-550) 내에서 1 mM CVU_G, 1.1 mM 태그1_PsoCVU 및 1.1 mM 스플린트C_CVU를 500 mM 인산나트륨 완충제 (pH 7.0) 중에 용해시켜 10 uL 광화학적 라이게이션 반응 혼합물을 생성하였다. 반응 혼합물을 95℃로 가열한 다음 실온으로 천천히 냉각시켰다. 이어서 반응을 UVL-21 콤팩트 UV 램프 (UVP)를 사용하여 4℃에서 24시간 동안 UV 광에 의해 365 nm로 조사하였다. 시간-경과에 따라 분취액 1 uL를 취하고, 15% TBE/ 8M 우레아 변성 폴리아크릴아미드 겔 상에서 전기영동하였다 (도 23). 겔을 가시화하고, 형광 TLC 플레이트의 UV 쉐도잉에 의해 촬영하였다. 조사 24시간 후, 90% 초과의 CVU_G 올리고뉴클레오티드가 광화학적으로 라이게이션되었다.
24-시간 샘플을 LCMS에 의해 분석하였다 (도 24). 주요 피크는 CVU_G와 태그1_PsoCVU의 광화학적 라이게이션 산물에 상응하였다. 관찰치 MW는 15,260.6 Da이었다 (계산치 MW 15,238.7 Da).
실시예 8
단일 태깅 이벤트의 판독을 모델링하기 위한, 말단 프라이머 연장, 비-말단 프라이머 연장 및 라이게이션을 사용한 비-폴리머라제-판독가능한 광화학적으로-라이게이션된 카르복시비닐 우리딘-접합 모델 태그로부터의 cDNA 생성
다음과 같은 2개의 모델 태그 올리고뉴클레오티드를 사용하여 실시예 7에 기재된 것과 유사한 방법을 사용하여 카르복시비닐 우리딘-티미딘 광화학적으로-라이게이션된 올리고뉴클레오티드 접합체 (Bio_CVU)를 생성하였다: 5'-5-카르복시비닐 우리딘 올리고뉴클레오티드 5'-CVU_A 및 5'-비오티닐화 올리고뉴클레오티드 5Bio_Tag_PsoCVU와 함께 스플린트 올리고뉴클레오티드 스플린트A_CVU, 3종의 올리고뉴클레오티드는 모두 IDT (아이오와주)로부터 수득하였고, 도 21 및 25에 제시한다. 반응 산물을 실시예 6에 기재된 바와 같이 겔-정제하였고, LCMS 분석으로 산물의 관찰치 MW가 15,811.8 Da인 것으로 밝혀졌다 (계산치 MW 15,792.3 Da) (도 25).
카르복시비닐 우리딘-티미딘 광화학적으로-라이게이션된 올리고뉴클레오티드 접합체 Bio_CVU를 주형으로 사용하여 T4 DNA 폴리머라제 (NEB, 매사추세츠주)에 의한 말단 올리고뉴클레오티드 프라이머 (FAM프라이머) 및 비-말단 올리고뉴클레오티드 프라이머 (포스-스플린트A_CVU) 둘 다의 효소적 연장에 의해 cDNA를 생성하였다. 포스-스플린트A_CVU는 T4 PNK (NEB, 매사추세츠주)를 사용하여 스플린트A_CVU의 5'-인산화에 의해 생성하였다. 각각의 dNTP 1 mM 및 T4 DNA 폴리머라제 (NEB, 매사추세츠주) 10 uL가 보충된 1x T4 DNA 리가제 완충제 (NEB, 매사추세츠주) 중에 FAM프라이머, 포스-스플린트A_CVU 및 Bio_CVU를 각각 10 uM 함유하는 100 uL 반응에서 cDNA 생성을 수행하였다. 반응 혼합물을 37℃에서 1시간 동안 인큐베이션한 다음 0.5 mM ATP 및 5 uL T4 DNA 리가제 (2,000 u/ul, NEB, 매사추세츠주)를 보충하고, 이어서 또 다시 37℃에서 1시간 동안 인큐베이션하였다.
이어서 반응 혼합물을 스트렙타비딘-코팅된 디나비즈 M280 (인비트로젠, 실온에서 1시간 동안 PBS로 사전-세척된 것) 200 uL와 함께 인큐베이션하고, 비드를 1mL PBS로 세척하고, 산물을 35 uL 100 mM NaOH로 용리시켰다. 이어서 1 M 트리스 HCl (pH 7.0) 5 uL를 첨가하여 용리액을 중화시키고, LCMS에 의해 분석하였다.
495nm에서 검출된, 생성된 산물의 LCMS 분석은 대략 80%의 FAM프라이머가 Bio_CVU 주형에 상보적인 전장 서열 마이너스 단일 dA 뉴클레오티드로 연장되었음을 보여주었다 (관찰치 MW 15,176 Da, 계산치 전장 MW 15,458 Da). 나머지 FAM프라이머의 대부분은 광화학적 라이게이션 접합부 이전의 3개의 뉴클레오티드까지 연장되었다 (관찰치 MW 10,560 Da, 계산치 MW 10,559 Da) (도 26).
상기 기재된 cDNA-생성을 리가제 효소의 첨가없이 수행할 경우에, 전장 상보적 서열 (마이너스 단일 dA)은 관찰되지 않았다.
실시예 9
하나의 태깅 이벤트를 모델링하기 위한, 비-폴리머라제-판독가능한 클릭-접합을 사용한 올리고뉴클레오티드 라이게이션
올리고뉴클레오티드 S_IDTN3 S_IDT알킨을 IDT (아이오와주)로부터 수득하였다 (도 27). 올리고뉴클레오티드 S_IDTN3의 3'-아지드 변형은 IDT 독점적 변형이다 (3' IDT 아지드 변형/3아지드N/ (MW 350)).
/3아지드N/ 변형을 함유하는 올리고뉴클레오티드를 HPLC-정제하였다.
헥시닐 변형을 함유하는 올리고뉴클레오티드를 탈염시키고, 추가의 정제없이 사용하였다.
이들 모델 태그의 클릭-접합은 다음과 같은 Cu (I) 촉매화 3+1 아지도 알킨 고리화첨가에 의해 달성되었다:
원액을 다음과 같이 제조하였다: DMF 중 Cu(OAc)2.H2O (FW 181.6), 10 mM; H2O 중 아스코르브산나트륨 (FW 198.1), 20 mM 및 DMF 중 트리스-(벤질트리아졸릴메틸)아민 (TBTA) (FW 530.6), 10 mM. 에펜도르프 튜브에 10 uL pH 7.0 포스페이트 완충제 (500 mM 수용액), 10 uL S_IDT알킨 (1 mM 수용액, 10 nmol, 1 당량) 및 10 uL S-IDTN3 (1 mM 수용액, 10 nmol, 1 몰 당량)을 첨가하였다. 이 용액에 5 uL Cu_프리-믹스 (Cu(OAc)2 2 몰 당량, 아스코르브산 나트륨 4 몰 당량, TBTA 1 몰 당량)를 첨가하였다. 반응을 밤새 실온에서 인큐베이션하였다. 산물을 LCMS (써모)에 의해 분석하고 (도 28), MW가 26,304.8 Da인 것으로 확인되었다 (계산치: 26311.2 Da). 접합체를 10% PAAG/8M 우레아를 사용하여 전기영동에 의해 추가로 정제하였다. 이러한 접합 산물을 접합체_클릭_S로 명명하였다.
실시예 10
한 쌍의 직교형 태깅 이벤트를 모델링하기 위한, 한 쌍의 직교형 비-폴리머라제-판독가능한 클릭-접합을 사용한 올리고뉴클레오티드 라이게이션
TKR_중심 및 S_IDTN3 올리고를 IDT로부터 수득하였다 (도 29). 5'-디벤조-시클로옥틴 (DBCO)-변형된 올리고 TKR_DBCO_S는 바이오서치 테크놀로지스 (캘리포니아주)로부터 수득하였다 (도 29).
첫번째로, 시클로옥틴-기재 구리-무함유 클릭 반응을 사용하여 TKR_중심 및 TKR_DBCO_S와 함께 클릭 접합을 수행하였다. 등몰량의 각각의 올리고뉴클레오티드 (1 mM 수용액 10 uL)를 0.2M 인산나트륨 완충제 (pH 7.0) 중에서 함께 혼합하였다. 반응 진행을 LCMS에 의해 모니터링하였다. 반응은 30 내지 60분 내에 완료되었고, 순수 접합체가 90%를 초과하여 수득되었다. MS는 MW가 25,336 Da임을 나타내었다 (계산치 25,341.8 Da) (도 30).
두번째로, 실시예 9에 기재된 Cu (I) 촉매화 클릭 절차를 사용하여 TKR_중심 및 TKR_DBCO_S의 접합 산물과 S_IDTN3 사이의 클릭 접합을 수행하였다. 생성된 최종 접합체, 2cl_S를 10% TBE/8M 우레아 폴리아크릴아미드 겔 상에서 정제하고, LCMS (써모)에 의해 분석하여, 2cl_S에 대해 예상되는 분자량이 38578.1 Da인 것으로 밝혀내었다 (계산치 38560.4 Da) (도 31).
실시예 11
화학적으로 접합된 태그로부터 서열 정보의 판독을 모델링하기 위한, 유리 용액 및 유화된 수성 액적 중에서 비-말단-프라이머-매개 재조합을 사용한 비-폴리머라제-판독가능한 클릭-접합된 모델 태그로부터 유래된 cDNA의 PCR-증폭
접합체_클릭_S (도 32)를 실시예 9에 기재된 바와 같이 S_IDTN3 및 S_IDT알킨의 접합에 의해 제조하였다.
접합체_클릭_L (도 32)은 실시예 10에 기재된 접합 프로토콜과 유사하게, L_IDTN3: TGCGGTCTAACTGTCTAGGCACTTGTTCGTTTGCCAGTGTGAGGAATGAACAGG/3아지드N/ 및 L_IDT알킨: /5헥시닐/TACCGAATTGCCTTCCTCGTACAGTTCTAAGGCGCTTGGACACCACTTCAATCGGGTGCTATGCTT (IDT, 아이오와주)의 접합에 의해 제조하였다. 겔 정제 이후 LCMS로 MW가 37,582.6 Da임을 확인하였다 (계산치 37,584.4 Da).
정방향 프라이머: TGCGGTCTAACTGTCTA, 역방향 프라이머: AAG CATAGCACCCGATT 및 eP스플린트: GGCAATTCGGTACCTGTTCATTCC를 비롯한 올리고데옥시뉴클레오티드 프라이머를 (IDT, 아이오와주)로부터 수득하였다.
접합체 접합체_클릭_L 및 접합체_클릭_S를 각각 1 nM로 희석시키고, 딥 벤트 (엑소-) DNA 폴리머라제 (NEB, 매사추세츠주)를 사용하는 스플린트-의존성-재조합-매개 cDNA 생성/PCR 증폭을 위한 주형으로서 사용하였다. 50 uL 딥 벤트 (엑소-) 반응은 다음과 같이 준비하였다: 10x 써모폴 완충제 5 uL; 각각의 정방향 및 역방향 프라이머 10 uM 용액 2.5 uL, 100 nM eP스플린트 프라이머 1 uL; 10 mM dNTP 믹스 (NEB) 2.5 uL; 각각의 접합체 또는 그의 1:1 혼합물 2 nM 5 uL, 딥 벤트 (엑소-) 2.5 uL 및 50 uL까지 물. 반응을 다음과 같이 24회 사이클링하였다: 94℃에서 30초, 52℃에서 30초 및 72℃에서 60초.
접합체_클릭_L 또는 접합체_클릭_S 접합체를 양 말단 프라이머 및 스플린트 프라이머 "eP스플린트"의 존재 하에 유리 용액 중에서 개별적으로 증폭시킨 다음 전기영동에 의해 평가했을 때, 각각은 주형의 길이와 상호관련된 이동성을 갖는 단일 산물로 생성되었다 (도 33의 레인 5 및 7). 스플린트 프라이머 "eP스플린트"의 부재 하에서의 유사한 증폭은 산물을 생성하지 않았다 (도 33의 레인 4 및 6). 이는 딥 벤트 (엑소-) 폴리머라제에 의한 양 접합체의 스플린트-의존성-재조합-매개 cDNA 생성/PCR 증폭이 eP스플린트 프라이머의 존재에 의존적임을 시사한다 (도 33). 이러한 재조합 및 증폭에 대한 가능한 메카니즘을 도 34에 제시한다.
양 말단 프라이머 및 스플린트 프라이머 "eP스플린트"의 존재 하에 유리 용액 중에서 접합체_클릭_L 및 접합체_클릭_S 접합체를 둘 다 혼합하고 함께 증폭시킨 다음 전기영동에 의해 평가했을 때, 각각의 주형의 길이와 상호관련된 이동성 뿐만 아니라 각각의 주형 사이의 중간 길이와 상호관련된 이동성을 갖는 상이한-이동성 산물의 래더가 생성되었다 (도 35의 레인 5). 이러한 재조합 및 증폭에 대한 가능한 메카니즘을 도 36에 제시한다.
양 말단 프라이머 및 스플린트 프라이머 "eP스플린트"의 존재 하에 유중수 에멀젼 중에서 접합체_클릭_L 및 접합체_클릭_S 접합체를 둘 다 에멀젼 액적에 비해 낮은 농도의 접합체로 혼합하고 함께 증폭시킨 다음 전기영동에 의해 평가했을 때, 각각의 주형의 길이와 상호관련된 이동성을 갖는 한 쌍의 산물이 관찰되었다 (도 37의 레인 3). 에멀젼 액적은 개별 마이크로반응기로서 작용하고, 그 안에서 단리된 개별 접합체를 증폭시켰다. 오일/계면활성제 상은 4.5% (vol/vol) 스팬(Span) 80 (플루카(Fluka), cat#85548), 0.4% (vol/vol) 트윈 80 (시그마(Sigma), cat#S-8074) 및 0.05% (vol/vol) 트리톤(Triton) X-100 (시그마, cat# T-9284)을 경질 미네랄 오일 (시그마, cat# M-3516) 중에서 혼합하여 제조하였다. 수성 상 (50 uL)은 10x 써모폴 완충제 5 uL; 각각의 10 uM 프라이머 용액 2.5 uL, 100 nM eP스플린트 프라이머 1 uL; 10 mM dNTP 믹스 (NEB) 2.5 uL; DVexo- (NEB) 2.5 uL, BSA (NEB) 2.5 uL 및 50 uL까지 물을 혼합하여 제조하였다. 접합체 접합체_클릭_L 및 접합체_클릭_S의 1:1 혼합물을 반응에 최종 농도 5 pM으로 첨가하였다. 이어서 수성 상 50 uL에 비-수성 상 150 uL를 첨가하고, 5분 동안 볼텍싱하여 유화시켰다. 재조합/증폭 과정은 다음과 같이 수행하였다: 32 사이클 동안 94℃에서 30초, 52℃에서 30초 및 72℃에서 60초.
스플린트-의존성-재조합-매개 cDNA 생성/PCR 증폭 후에, 에멀젼을 21,000g에서 20분 동안 마이크로원심분리하여 파괴한 다음, 비-수성 상을 제거하고, 수성 상 및 중간상을 클로로포름으로 추출하였다. 이어서 수성 상을 천연 전기영동 (4% 아가로스 미니겔, 인비트로젠, 캘리포니아주)에 의해 평가하였다.
에멀젼-구획화된 스플린트-의존성-재조합-매개 cDNA 생성/PCR 증폭의 결과는 셔플링된 PCR 산물의 형성 정도가 유의하게 감소되거나 또는 존재하지 않음을 나타내었다 (도 37, 레인 3).
실시예 12
단일 태깅 이벤트의 판독을 모델링하기 위한, 유리 용액 중에서 반복-상동성-매개-재조합을 사용한 비-폴리머라제-판독가능한 클릭-접합된 모델 태그로부터 유래된 cDNA의 PCR 증폭
단일 비-폴리머라제-판독가능한 클릭-접합 연결을 각각 함유하는 2개의 접합체, TKR_S 및 TKR_L (도 38)을 실시예 9에 기재된 Cu(I) 촉매화 고리화첨가 및 프로토콜을 사용하여 3'-아지도-변형된-올리고뉴클레오티드 및 5'-헥시닐-변형된-올리고뉴클레오티드 사이에 형성시켰다. TKR_S 및 TKR-L은 비-폴리머라제-판독가능한 연결에 플랭킹된 중복된 12-mer GGAATGAACAGG 서열을 각각 함유한다. TKR_S는 하기 2개의 IDT DNA 올리고뉴클레오티드, TKR_S_N3: TGCGGTCTAACTGTCTAGTTCACCTTCTCCGGAATGAACAGG/3아지도N/ (또한 실시예 9에서는 S_IDTN3로 지칭됨) 및 TKR_S_Hex: /5'-헥시닐/GGAATGAACAGGGCCTGATTGAAGCAATCGGGTGCTATGCTT를 접합시키는 것에 의해 제조하였고, 한편 TKR_L은 2개의 IDT DNA 올리고뉴클레오티드 TKR_L_N3: TGCGGTCTAACTGTCTAGGCACTTGTTCGTTTGCCAGTGTGATGGACACCACTTGGAATGAACAGG/3아지드N/ 및 TKR_L_Hex: /5'헥시닐/GGAATGAACAGGGGAATGAACAGGTTCCTCGTACAGTTCTAAGGCGCTCAATCGGGTGCTATGCTT를 접합시켜 제조하였다. 접합체를 둘 다 변성 조건 하에 PAGE-정제하고, LCMS에 의해 분석하여 TKR_S의 분자량: 26,447.5 Da (26,449.2 Da 계산치) 및 TKR_L의 분자량 37,582.6 Da (37,584.4 계산치)을 밝혀내었다.
2개의 접합체를 각각 1 nM로 희석시키고, 정방향 프라이머 TGCGGTCTAACTGTCTA 및 역방향 프라이머 AAGCATAGCACCCGATT (IDT)를 사용하는 유리 용액 중에서의 딥 벤트 (엑소-) DNA 폴리머라제 (NEB)에 의한 반복-의존성-재조합-매개 cDNA 생성/PCR 증폭에 사용하였다.
딥 벤트 (엑소-) DNA 폴리머라제 (NEB)를 사용하여 반복-의존성-재조합-매개 cDNA 생성/PCR 증폭 반응을 수행하였다. 10x 써모폴 완충제 5 uL; 각각의 정방향 및 역방향 프라이머 10 uM 용액 2.5 uL; 10 mM dNTP 믹스 (NEB) 2.5 uL; 각각의 접합체 또는 그의 1:1 혼합물의 최종 농도 40 pM, 딥 벤트 (엑소-) 폴리머라제 2.5 uL 및 최종 부피 50 uL까지 물. 반응을 다음과 같이 22회 열적 사이클링하였다: 94℃에서 30초, 52℃에서 30초 및 72℃에서 60초.
산물을 4% 아가로스 미니겔 (인비트로젠) 상에 가시화하였다 (도 39).
딥 벤트 (엑소-) 폴리머라제 반복-의존성-재조합-매개 cDNA 생성/PCR 증폭 반응은 각각의 개별적으로 증폭된 접합체로부터 유래된 다량의 앰플리콘을 생성하였다 (도 39, 레인 3 및 4). 동일한 조건 하에서의 접합체의 혼합물의 증폭은 임의의 중간체-길이 증폭 산물을 생성하지 않았다 (도 39, 레인 5). 이들 증폭 산물에서 태그 회합 (코딩된 정보)의 셔플링의 결여 (손실)을 추가로 확인하기 위해, 본 발명자들은 함께-증폭된 TKR_S 및 TKR_L 혼합물로부터 유래된 증폭 산물을 클로닝 및 서열분석하였다. 이들 서열 데이터는 함께-증폭된 접합체로부터 유래된 증폭 산물에서 모델 태그 쌍의 셔플링의 완전한 결여를 확인시켜주었다 (도 40).
실시예 13
한 쌍의 태깅 이벤트의 판독을 모델링하기 위한, 유리 용액 중에서 반복-상동성-매개-재조합을 사용한, 판독불가능한 2회-클릭-접합된 태그로부터 유래된 cDNA의 PCR 증폭
각각 2개의 판독불가능한 클릭 접합 연결을 함유하고, 각각 상이한 12-mer 반복 서열 (GAAGGCGTTATG-클릭-GAAGGCGTTATG) 및 (GGAATGAACAGG-클릭-GGAATGAACAGG)에 의해 각각 플랭킹되어 있는 2개의 접합체, 2_cl_S 및 2_cl_L (도 41)을 실시예 10에 기재된 것과 유사한 2-단계 절차로 제조하였다.
첫번째로, 시클로옥틴-기재 구리-무함유 클릭 반응을 사용하여 TKR_중심: /5'-헥시닐/GGAATGAACAGGGTAAGCTGGAGTGAAGGCGTTATG/3아지드N/ (IDT) 및 TKR_DBCO_S: (DBCO)GAAGGCGTTATGTCCGTACTCTTGCAATCGGGTGCTATGCTT 또는 TKR_DBCO_L (DBCO)GAAGGCGTTATGTGATATCCGTGGTGTCGTGAGTTCCAATCGGGTGCTATGCTT 사이에 접합을 수행하였다. DBCO-함유 올리고뉴클레오티드는 둘 다 바이오서치(Biosearch) (캘리포니아주)로부터 수득하였고, DBCO는 5'-디벤조-시클로옥틴 변형으로 이를 위한 포스포르아미다이트 시약은 글렌 리서치(Glen Research) (버지니아주)로부터 입수가능하다. 이들 접합의 산물을 각각 TKR_S_N3 및 TKR_L_N3으로 명명하였다.
*두번째로, Cu (I) 촉매화 클릭 반응을 사용하여 제1 접합의 산물, TKR_S_N3 및 TKR_L_N3 사이에 접합을 수행하였다. 생성된 접합체, TKR_2_클릭_S 및 TKR_2_클릭_L (도 41)을 10% TBE/8M 우레아 폴리아크릴아미드 겔 상에서의 전기영동을 사용하여 정제하고, LCMS (써모)에 의해 분석하여, TKR_2_클릭_S에 대해 예상되는 분자량이 38,578.1 Da (38,560.4 Da 계산치)이고, TKR_2_클릭_L에 대해서는 49,913.3 Da (49,916.7 Da 계산치)인 것으로 밝혀내었다 (도 41).
2개의 접합체를 각각 1 nM로 희석시키고, 딥 벤트 (엑소-) 폴리머라제 (NEB)에 의한 반복-의존성-재조합-매개 cDNA 생성/PCR 증폭에 사용하였다. 증폭을 위해 전방향 프라이머 TGCGGTCTAACTGTCTA 및 역방향 프라이머 AAGCATAGCACCCGATT (IDT DNA)를 10x 써모폴 완충제 5 uL; 각각의 전방향 및 역방향 프라이머 10 uM 용액 2.5 uL; 10 mM dNTP 믹스 (NEB) 2.5 uL; 각각의 접합체 또는 그의 1:1 혼합물의 최종 농도 40 pM, 딥 벤트 (엑소-) 폴리머라제 2.5 uL 및 50 uL까지 물과 함께 사용하였다. 반응을 다음과 같이 22회 열적 사이클링하였다: 94℃에서 30초, 52℃에서 30초 및 72℃에서 60초. 증폭 산물을 4% 아가로스 미니겔 (인비트로젠) 상에 가시화하였다.
딥 벤트 (엑소-) 폴리머라제 반복-의존성-재조합-매개 cDNA 생성/PCR 증폭 반응은 각각의 개별적으로 증폭된 접합체로부터 유래된 다량의 앰플리콘을 생성하였다 (도 42, 레인 3 및 4). 동일한 조건 하에서의 접합체의 혼합물의 증폭은 임의의 중간체-길이 증폭 산물을 생성하지 않았다 (도 42, 레인 5). 이들 증폭 산물에서 태그 회합 (코딩된 정보)의 셔플링의 결여 (손실)를 추가로 확인하기 위해, 본 발명자들은 함께-증폭된 TKR_2_클릭_S 및 TKR_2_클릭_L 혼합물로부터 유래된 증폭 산물을 클로닝 및 서열분석하였다. 이들 서열 데이터는 함께-증폭된 접합체로부터 유래된 증폭 산물에서 모델 태그 쌍의 셔플링의 완전한 결여를 확인시켜주었다 (도 43).
다른 실시양태
본 명세서에서 언급된 모든 간행물, 특허 출원 및 특허는 본원에 참조로 포함된다.
본 발명에 기재된 방법 및 시스템에 대한 다양한 변형 및 변경이 본 발명의 범위 및 취지를 벗어나지 않으면서 통상의 기술자에게 명백할 것이다. 본 발명이 구체적인 바람직한 실시양태와 관련하여 기재되었기는 하지만, 청구되는 발명은 이러한 구체적인 실시양태로 과도하게 한정되어서는 안된다는 것을 이해해야 한다. 실제로, 의약 분야, 약리학 분야 또는 관련 분야의 통상의 기술자에게 명백한 본 발명의 기재된 수행 방식의 다양한 변형은 본 발명의 범위에 속하는 것으로 의도된다.
SEQUENCE LISTING <110> X-Chem, Inc. <120> DNA-ENCODED LIBRARIES HAVING ENCODING OLIGONUCLEOTIDE LINKAGES NOT READABLE BY POLYMERASES <130> 50719-021WO2 <140> PCT/US2013/050303 <141> 2013-07-12 <150> 61/671,406 <151> 2012-07-13 <160> 41 <170> PatentIn version 3.5 <210> 1 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 1 gtgctgc 7 <210> 2 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 2 gcagcaccc 9 <210> 3 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa is N-alpha-benzyloxycarbonyl-(Glycine)3-N-succinimidyl ester) <220> <221> MISC_FEATURE <222> (8)..(8) <223> Xaa is OSU (N-succinimidyl ester) <400> 3 Xaa Gly Gly Gly Gly Gly Gly Xaa 1 5 <210> 4 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa is azidohomoalanine <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa is OSu (N-succinimidyl ester) <400> 4 Xaa Gly Gly Gly Xaa 1 5 <210> 5 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa is propargylglycine <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa is Osu (N-succinimidyl ester) <400> 5 Xaa Gly Gly Gly Xaa 1 5 <210> 6 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa is an (N-alpha-benzyloxycarbonyl-(Glycine)3-N-succinimidyl ester <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa is OSu (N-succinimidyl ester) <400> 6 Xaa Gly Gly Gly Xaa 1 5 <210> 7 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (4)..(4) <223> n is CNVK <220> <221> misc_feature <222> (12)..(12) <223> n is CNVK <400> 7 cgancgtgtc ancg 14 <210> 8 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 8 aaaaaagtcg tgacacgtcg gaaaaaaaaa aaacggtgac acggtcgaaa aaa 53 <210> 9 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (55)..(55) <223> n is a 3'-azide (WHS esther) <400> 9 tgcggtctaa ctgtctaggc acttgttcgt ttgccagtgt gaggaatgaa caggn 55 <210> 10 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5'-hexynyl <400> 10 ntaccgaatt gccttcctcg tacagttcta aggcgcttgg acaccacttc aatcgggtgc 60 tatgctt 67 <210> 11 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 11 tgcggtctaa ctgtcta 17 <210> 12 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 12 aagcatagca cccgatt 17 <210> 13 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 13 ggcaattcgg tacctgttca ttcc 24 <210> 14 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 14 ggaatgaaca gg 12 <210> 15 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (43)..(43) <223> n is a 3'-azide (WHS Esther) <400> 15 tgcggtctaa ctgtctagtt caccttctcc ggaatgaaca ggn 43 <210> 16 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5'-Hexynyl <400> 16 nggaatgaac agggcctgat tgaagcaatc gggtgctatg ctt 43 <210> 17 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (67)..(67) <223> n is a 3'-azide (WHS Ester) <400> 17 tgcggtctaa ctgtctaggc acttgttcgt ttgccagtgt gatggacacc acttggaatg 60 aacaggn 67 <210> 18 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5'-Hexynyl <400> 18 nggaatgaac aggggaatga acaggttcct cgtacagttc taaggcgctc aatcgggtgc 60 tatgctt 67 <210> 19 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 19 tgcggtctaa ctgtcta 17 <210> 20 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5'-Hexynyl <220> <221> misc_feature <222> (38)..(38) <223> n is a 3'-azide (WHS Ester) <400> 20 nggaatgaac agggtaagct ggagtgaagg cgttatgn 38 <210> 21 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5'-dibenzo-cyclooctyne <400> 21 ngaaggcgtt atgtccgtac tcttgcaatc gggtgctatg ctt 43 <210> 22 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5'-dibenzo-cyclooctyne <400> 22 ngaaggcgtt atgtgatatc cgtggtgtcg tgagttccaa tcgggtgcta tgctt 55 <210> 23 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 23 aaaaaaaaaa gtcgtgac 18 <210> 24 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 24 acgtcggtaa aaaaaaaaa 19 <210> 25 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> Cyanovinylcarbozole (CNVK) <220> <221> misc_feature <222> (1)..(1) <223> n is Cyanovinylcarbozole (CNVK) <220> <221> misc_feature <222> (15)..(15) <223> Cyanovinylcarbozole (CNVK) <400> 25 ncgacgtgtc acgan 15 <210> 26 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5' Psoralen (C2-linked) <220> <221> misc_feature <222> (1)..(1) <223> n is a 5' Psoralen (C2) <400> 26 ntagcggatg caaaaaaaaa ggcgagcttg cgtactg 37 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 27 aaaaaaaaag catccgctct 20 <210> 28 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5' Psoralen (C2-linked) <400> 28 ngagcggatg caaaaaaaaa ggcgagcttg cgtactg 37 <210> 29 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 29 tccgctcgac ctgag 15 <210> 30 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 30 aaaaactcag gt 12 <210> 31 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5' biotin <400> 31 naaaaactca ggt 13 <210> 32 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 32 tccgctcgac ctgag 15 <210> 33 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 56-FAM-Phosphoramidite <400> 33 nagtacgcaa gctcgc 16 <210> 34 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a monophosphate <400> 34 ntccgctcga cctgag 16 <210> 35 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 35 tccgctcaac ctgag 15 <210> 36 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 36 tccgcttaac ctgag 15 <210> 37 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5-(Carboxy)vinyl-2'-deoxyuridine <400> 37 ngagcggatg caaaaaaaaa ggcgagcttg cgtactg 37 <210> 38 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5-(Carboxy)vinyl-2'-deoxyuridine <400> 38 naagcggatg caaaaaaaaa ggcgagcttg cgtactg 37 <210> 39 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (43)..(43) <223> n is a, c, g, or t <220> <221> misc_feature <222> (47)..(47) <223> n is a 3'-azide (WHS Ester) <400> 39 tgcggtctaa ctgtctagtt caccttctcc ggaatgaaca ggn 43 <210> 40 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> n is a 5'-Hexyynyl <400> 40 ntaccgaatt gccgcctgat tgaagcaatc gggtgctatg ctt 43 <210> 41 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (43)..(43) <223> n is a 3'-azide (WHS Ester) <400> 41 tgcggtctaa ctgtctagtt caccttctcc ggaatgaaca ggn 43

Claims (48)

  1. (i) 하나 이상의 스캐폴드 또는 하나 이상의 빌딩 블록을 포함하는 화합물;
    (ii) 상기 화합물에 결합된 올리고뉴클레오티드 헤드피스;
    (iii) 적어도 하나의 상기 스캐폴드 또는 빌딩 블록의 아이덴티티를 코딩하는 올리고뉴클레오티드 태그; 및
    (iv) 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 연결
    을 포함하는 코딩된 화합물의 뉴클레오티드 서열을 결정하는 방법으로서,
    상기 연결은 화학-반응성 기, 광-반응성 기, 삽입성 모이어티 또는 교차-연결 올리고뉴클레오티드를 포함하는 화학적 연결이고;
    상기 올리고뉴클레오티드 헤드피스는 상기 연결을 통해 올리고뉴클레오티드에 결합되며,
    상기 방법은
    (a) 하나 이상의 릴레이 프라이머를 상기 코딩된 화합물과 어닐링시키며, 여기서 상기 하나 이상의 릴레이 프라이머는 상기 연결에 걸쳐 있는 단계;
    (b) 폴리머라제를 사용하여 상기 릴레이 프라이머를 연장시켜 올리고뉴클레오티드 단편을 생성하는 단계;
    (c) 상기 올리고뉴클레오티드 단편을 라이게이션시켜 주형을 생성하는 단계;
    (d) 폴리머라제 연쇄 반응에 의해 상기 주형을 증폭시켜 증폭된 믹스를 생성하는 단계; 및
    (e) 상기 증폭된 믹스를 서열분석하여 상기 코딩된 화합물의 서열을 결정하는 단계
    를 포함하는 것인 방법.
  2. (i) 하나 이상의 스캐폴드 또는 하나 이상의 빌딩 블록을 포함하는 화합물;
    (ii) 상기 화합물에 결합된 올리고뉴클레오티드 헤드피스 및 적어도 하나의 상기 스캐폴드 또는 빌딩 블록의 아이덴티티를 코딩하는 올리고뉴클레오티드 태그;
    (iii) 적어도 하나의 상기 스캐폴드 또는 빌딩 블록의 아이덴티티를 코딩하는 추가의 올리고뉴클레오티드 태그; 및
    (iv) 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 연결
    을 포함하는 코딩된 화합물의 뉴클레오티드 서열을 결정하는 방법으로서,
    상기 연결은 화학-반응성 기, 광-반응성 기, 삽입성 모이어티 또는 교차-연결 올리고뉴클레오티드를 포함하는 화학적 연결이고;
    상기 올리고뉴클레오티드 태그는 상기 연결을 통해 추가의 올리고뉴클레오티드 태그에 결합되며,
    상기 방법은
    (a) 하나 이상의 릴레이 프라이머를 상기 코딩된 화합물과 어닐링시키며, 여기서 상기 하나 이상의 릴레이 프라이머는 상기 연결에 걸쳐 있고;
    (b) 폴리머라제를 사용하여 상기 릴레이 프라이머를 연장시켜 올리고뉴클레오티드 단편을 생성하는 단계;
    (c) 상기 올리고뉴클레오티드 단편을 라이게이션시켜 주형을 생성하는 단계;
    (d) 폴리머라제 연쇄 반응에 의해 상기 주형을 증폭시켜 증폭된 믹스를 생성하는 단계; 및
    (e) 상기 증폭된 믹스를 서열분석하여 상기 코딩된 화합물의 서열을 결정하는 단계
    를 포함하는 것인 방법.
  3. 제1항 또는 제2항에 있어서, 상기 화합물이 하나 이상의 태그의 5'-말단에서의 5'-연결부 및 하나 이상의 태그의 3'-말단에서의 3'-연결부를 포함하고, 여기서 각각의 상기 하나 이상의 릴레이 프라이머는 인접한 5'- 및 3'-연결부에 혼성화하는 것인 방법.
  4. 제3항에 있어서, 각각의 5'-연결부가 동일한 서열을 포함하는 것인 방법.
  5. 제4항에 있어서, 각각의 3'-연결부가 동일한 서열을 포함하는 것인 방법.
  6. 제3항에 있어서, 적어도 하나의 상기 5'-연결부의 서열이 인접한 3'-연결부의 서열에 대해 상보적이거나 또는 동일하거나 또는 충분히 유사하여 별개의 혼성화 이벤트에서 접합부의 각 측면 상의 동일한 상보적 올리고뉴클레오티드에의 혼성화를 가능하게 하는 것인 방법.
  7. 제6항에 있어서, 상기 5'-연결부를 상기 인접한 3'-연결부에 혼성화하는 단계를 추가로 포함하는 방법.
  8. 제1항 또는 제2항에 있어서, 5'- 및 3'-연결부 사이의 특정 접합부에 대한 각각의 릴레이 프라이머가 동일한 서열을 포함하는 것인 방법.
  9. 제1항 또는 제2항에 있어서, 적어도 하나의 화학-반응성 기, 광-반응성 기 또는 삽입성 모이어티가 상기 태그의 5'-말단에서의 또는 그에 근접한 5'-연결부 및/또는 상기 태그의 3'-말단에서의 또는 그에 근접한 3'-연결부에 존재하는 것인 방법.
  10. 제9항에 있어서, 적어도 하나의 상기 5'-연결부의 서열이 인접한 3'-연결부의 서열에 대해 상보적이거나 또는 동일하거나 또는 충분히 유사하여 별개의 혼성화 이벤트에서 접합부의 각 측면 상의 동일한 상보적 올리고뉴클레오티드에의 혼성화를 가능하게 하는 것인 방법.
  11. 제1항 또는 제2항에 있어서, 상기 화학적 연결은 치환되거나 치환되지 않은 알키닐 기 및 치환되거나 치환되지 않은 아지도 기의 쌍; 4 π-전자계를 갖는 치환되거나 치환되지 않은 디엔 및 2 π-전자계를 갖는 치환되거나 치환되지 않은 친디엔체 또는 치환되거나 치환되지 않은 친헤테로디엔체의 쌍; 친핵체 및 변형 헤테로시클릴 친전자체의 쌍; 치환되거나 치환되지 않은 아미노 기 및 알데히드 또는 케톤 기의 쌍; 치환되거나 치환되지 않은 아미노 기 및 카르복실산 기의 쌍; 치환되거나 치환되지 않은 히드라진 및 알데히드 또는 케톤 기의 쌍; 치환되거나 치환되지 않은 히드록실아민 및 알데히드 또는 케톤 기의 쌍; 친핵체 및 치환되거나 치환되지 않은 알킬 할라이드의 쌍; 백금 착물; 알킬화제; 또는 푸란-변형된 뉴클레오티드로부터 선택되는 화학-반응성 기를 포함하는 것인 방법.
  12. 제1항에 있어서, 상기 화학적 연결은 치환되거나 치환되지 않은 시아노비닐카르바졸 기, 치환되거나 치환되지 않은 비닐카르바졸 기, 치환되거나 치환되지 않은 시아노비닐 기, 치환되거나 치환되지 않은 아크릴아미드 기, 치환되거나 치환되지 않은 디아지린 기, 치환되거나 치환되지 않은 벤조페논, 치환되거나 치환되지 않은 5-(카르복시)비닐-우리딘 기, 또는 치환되거나 치환되지 않은 아지드 기로부터 선택되는 광-반응성 기를 포함하는 것인 방법.
  13. 제1항 또는 제2항에 있어서, 상기 화학적 연결은 알칼로이드 유도체, 에티듐 양이온, 아크리딘 유도체, 안트라시클린 유도체 또는 탈리도미드로부터 선택되는 삽입성 모이어티를 포함하는 것인 방법.
  14. 제1항 또는 제2항에 있어서, 상기 화학적 연결이 교차-연결 올리고뉴클레오티드를 포함하고, 여기서 상기 교차-연결 올리고뉴클레오티드의 5'-말단에서의 적어도 5개의 뉴클레오티드 서열은 하나 이상의 태그의 3'-말단에서의 적어도 5개의 뉴클레오티드 서열에 대해 상보적이며, 상기 교차-연결 올리고뉴클레오티드의 3'-말단에서의 적어도 5개의 뉴클레오티드 서열은 하나 이상의 태그의 5'-말단에서의 적어도 5개의 뉴클레오티드 서열에 대해 상보적인 것인 방법.
  15. 제14항에 있어서, 하나 이상의 태그의 3'-말단이 3'-연결부를 포함하는 것인 방법.
  16. 제14항에 있어서, 하나 이상의 태그의 5'-말단이 5'-연결부를 포함하는 것인 방법.
  17. 제14항에 있어서, 상기 교차-연결 올리고뉴클레오티드의 5'-말단 및/또는 3'-말단이 가역적 공-반응성 기를 포함하는 것인 방법.
  18. 제17항에 있어서, 상기 가역적 공-반응성 기는 시아노비닐카르바졸 기, 시아노비닐 기, 아크릴아미드 기, 티올 기 또는 비닐 술폰 기인 방법.
  19. 제1항 또는 제2항에 있어서, 상기 화합물이 이관능성 스페이서를 통해 상기 헤드피스에 작동가능하게 회합되는 것인 방법.
  20. 제1항 또는 제2항에 있어서, 상기 화합물이 상기 헤드피스에 공유적으로 부착되는 것인 방법.
  21. 제1항 또는 제2항에 있어서, 상기 헤드피스가 이중-가닥 올리고뉴클레오티드, 단일-가닥 올리고뉴클레오티드 또는 헤어핀 올리고뉴클레오티드를 포함하는 것인 방법.
  22. 제21항에 있어서, 상기 헤드피스가 프라이머-결합 영역을 포함하는 것인 방법.
  23. 제1항 또는 제2항에 있어서, 제1 라이브러리-확인 태그, 사용 태그, 및/또는 기원 태그를 추가로 포함하는 방법.
  24. 제1항 또는 제2항에 있어서, 상기 화합물이 2 내지 20개의 올리고뉴클레오티드 태그를 포함하는 것인 방법.
  25. 제1항 또는 제2항에 있어서, 각각의 올리고뉴클레오티드 태그가 5 내지 75개의 뉴클레오티드를 포함하는 것인 방법.
  26. 제1항 또는 제2항에 있어서, 각각의 올리고뉴클레오티드 태그가 거의 동일한 질량을 포함하는 것인 방법.
  27. 제1항 또는 제2항에 있어서, 상기 화합물이 RNA, DNA, 변형된 DNA, 및/또는 변형된 RNA를 포함하는 것인 방법.
  28. 제27항에 있어서, 상기 변형된 DNA 또는 변형된 RNA가 동일한 올리고뉴클레오티드 내에서의 PNA, LNA, GNA, TNA, 또는 이들의 혼합물인 방법.
  29. 제1항 또는 제2항에 있어서, 상기 화합물이 테일피스를 추가로 포함하는 것인 방법.
  30. (i) 하나 이상의 스캐폴드 또는 하나 이상의 빌딩 블록을 포함하는 화합물;
    (ii) 상기 화합물에 결합된 올리고뉴클레오티드 헤드피스;
    (iii) 적어도 하나의 상기 스캐폴드 또는 빌딩 블록의 아이덴티티를 코딩하는 올리고뉴클레오티드 태그; 및
    (iv) 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 연결
    을 포함하는 코딩된 화합물의 뉴클레오티드 서열을 결정하는 방법으로서,
    상기 연결은 상기 올리고뉴클레오티드 태그와 추가의 올리고뉴클레오티드 태그 사이의 접합부에 걸쳐있는 교차-연결 올리고뉴클레오티드를 포함하는 화학적 연결이고;
    상기 연결은 하나 이상의 가역적 공-반응성 기를 통해 올리고뉴클레오티드 태그에 결합되며;
    상기 연결은 하나 이상의 가역적 공-반응성 기를 통해 추가의 올리고뉴클레오티드 태그에 결합되고,
    각각의 가역적 공-반응성 기는, 독립적으로, 시아노비닐카르바졸 기, 시아노비닐 기, 아크릴아미드 기, 티올 기 또는 비닐 술폰 기이며,
    상기 방법은
    (a) 코딩된 화합물을 제공하는 단계;
    (b) 화학적 과정 또는 효소적 과정을 사용하여 올리고뉴클레오티드 헤드피스와 올리고뉴클레오티드 태그를 라이게이션시키는 단계;
    (c) 교차-연결 올리고뉴클레오티드를 방출시켜 주형을 생성하는 단계;
    (d) 폴리머라제 연쇄 반응에 의해 상기 주형을 증폭시켜 증폭된 믹스를 생성하는 단계; 및
    (e) 상기 증폭된 믹스를 서열분석하여 상기 코딩된 화합물의 서열을 결정하는 단계
    를 포함하는 것인 방법.
  31. (i) 하나 이상의 스캐폴드 또는 하나 이상의 빌딩 블록을 포함하는 화합물;
    (ii) 상기 화합물에 결합된 올리고뉴클레오티드 헤드피스 및 적어도 하나의 상기 스캐폴드 또는 빌딩 블록의 아이덴티티를 코딩하는 올리고뉴클레오티드 태그;
    (iii) 적어도 하나의 상기 스캐폴드 또는 빌딩 블록의 아이덴티티를 코딩하는 추가의 올리고뉴클레오티드 태그; 및
    (iv) 폴리머라제가 판독 또는 전위하는 감소된 능력을 갖게 하는 연결
    을 포함하는 코딩된 화합물의 뉴클레오티드 서열을 결정하는 방법으로서,
    상기 연결은 상기 올리고뉴클레오티드 태그와 추가의 올리고뉴클레오티드 태그 사이의 접합부에 걸쳐있는 교차-연결 올리고뉴클레오티드를 포함하는 화학적 연결이고;
    상기 연결은 하나 이상의 가역적 공-반응성 기를 통해 올리고뉴클레오티드 태그에 결합되며;
    상기 연결은 하나 이상의 가역적 공-반응성 기를 통해 추가의 올리고뉴클레오티드 태그에 결합되고,
    각각의 가역적 공-반응성 기는, 독립적으로, 시아노비닐카르바졸 기, 시아노비닐 기, 아크릴아미드 기, 티올 기 또는 비닐 술폰 기이며,
    상기 방법은
    (a) 코딩된 화합물을 제공하는 단계;
    (b) 화학적 과정 또는 효소적 과정을 사용하여 올리고뉴클레오티드 태그와 추가의 올리고뉴클레오티드 태그를 라이게이션시키는 단계;
    (c) 교차-연결 올리고뉴클레오티드를 방출시켜 주형을 생성하는 단계;
    (d) 폴리머라제 연쇄 반응에 의해 상기 주형을 증폭시켜 증폭된 믹스를 생성하는 단계; 및
    (e) 상기 증폭된 믹스를 서열분석하여 상기 코딩된 화합물의 서열을 결정하는 단계
    를 포함하는 것인 방법.
  32. 제30항 또는 제31항에 있어서, 화학적 과정 또는 효소적 과정이 5'-인산화를 포함하는 것인 방법.
  33. 제30항 또는 제31항에 있어서, 증폭 단계 또는 서열분석 단계 이전에 주형을 복구하는 단계를 추가로 포함하는 방법.
  34. 제33항에 있어서, 복구 단계가 폴리머라제에 의해 판독 또는 전위될 수 있는 복구된 연결이 되도록 연결을 변형시키는 것을 포함하는 것인 방법.
  35. 제34항에 있어서, 상기 폴리머라제가 복구된 연결의 적어도 90% 판독 또는 전위할 수 있는 것인 방법.
  36. 제33항에 있어서, 복구 단계가 주형에 복구 효소를 제공하는 것을 포함하는 것인 방법.
  37. 제36항에 있어서, 복구효소가 포토리아제, 글리코실라제, 엔도뉴클레아제, Flap 엔도뉴클레아제, 아퓨린/아피리미딘 (AP) 엔도뉴클레아제, 폴리 ADP 리보스 폴리머라제 또는 메틸트랜스퍼라제인 방법.
  38. 제30항 또는 제31항에 있어서, 상기 화합물이 이관능성 스페이서를 통해 올리고뉴클레오티드 헤드피스에 작동가능하게 회합되는 것인 방법.
  39. 제30항 또는 제31항에 있어서, 상기 화합물이 올리고뉴클레오티드 헤드피스에 공유적으로 부착되는 것인 방법.
  40. 제30항 또는 제31항에 있어서, 상기 올리고뉴클레오티드 헤드피스가 이중-가닥 올리고뉴클레오티드, 단일-가닥 올리고뉴클레오티드 또는 헤어핀 올리고뉴클레오티드를 포함하는 것인 방법.
  41. 제40항에 있어서, 올리고뉴클레오티드 헤드피스가 프라이머-결합 영역을 포함하는 것인 방법.
  42. 제30항 또는 제31항에 있어서, 제1 라이브러리-확인 태그, 사용 태그, 및/또는 기원 태그를 추가로 포함하는 방법.
  43. 제30항 또는 제31항에 있어서, 상기 코딩된 화합물이 2 내지 20개의 올리고뉴클레오티드 태그를 포함하는 것인 방법.
  44. 제30항 또는 제31항에 있어서, 각각의 올리고뉴클레오티드 태그가 5 내지 75개의 뉴클레오티드를 포함하는 것인 방법.
  45. 제30항 또는 제31항에 있어서, 각각의 올리고뉴클레오티드 태그가 거의 동일한 질량을 포함하는 것인 방법.
  46. 제30항 또는 제31항에 있어서, 상기 코딩된 화합물이 RNA, DNA, 변형된 DNA, 및/또는 변형된 RNA를 포함하는 것인 방법.
  47. 제46항에 있어서, 상기 변형된 DNA 또는 변형된 RNA가 동일한 올리고뉴클레오티드 내에서의 PNA, LNA, GNA, TNA, 또는 이들의 혼합물인 방법.
  48. 제30항 또는 제31항에 있어서, 상기 코딩된 화합물이 테일피스를 추가로 포함하는 것인 방법.
KR1020207023473A 2012-07-13 2013-07-12 폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 dna-코딩된 라이브러리 KR102270554B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261671406P 2012-07-13 2012-07-13
US61/671,406 2012-07-13
PCT/US2013/050303 WO2014012010A1 (en) 2012-07-13 2013-07-12 Dna-encoded libraries having encoding oligonucleotide linkages not readable by polymerases
KR1020157002779A KR102146721B1 (ko) 2012-07-13 2013-07-12 폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 dna-코딩된 라이브러리

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020157002779A Division KR102146721B1 (ko) 2012-07-13 2013-07-12 폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 dna-코딩된 라이브러리

Publications (2)

Publication Number Publication Date
KR20200100206A KR20200100206A (ko) 2020-08-25
KR102270554B1 true KR102270554B1 (ko) 2021-06-28

Family

ID=49916571

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020207023473A KR102270554B1 (ko) 2012-07-13 2013-07-12 폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 dna-코딩된 라이브러리
KR1020157002779A KR102146721B1 (ko) 2012-07-13 2013-07-12 폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 dna-코딩된 라이브러리

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020157002779A KR102146721B1 (ko) 2012-07-13 2013-07-12 폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 dna-코딩된 라이브러리

Country Status (16)

Country Link
US (1) US11674135B2 (ko)
EP (3) EP2872680B1 (ko)
JP (3) JP6426604B2 (ko)
KR (2) KR102270554B1 (ko)
CN (2) CN104685115A (ko)
AU (3) AU2013289993B2 (ko)
CA (1) CA2879018A1 (ko)
DK (2) DK2872680T3 (ko)
EA (2) EA034141B1 (ko)
ES (2) ES2855137T3 (ko)
IL (1) IL236633B (ko)
MX (1) MX2015000598A (ko)
NZ (3) NZ739931A (ko)
SG (2) SG11201500250VA (ko)
WO (1) WO2014012010A1 (ko)
ZA (2) ZA201500328B (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102091207B1 (ko) 2009-02-13 2020-03-20 엑스-켐, 인크. Dna―코딩된 라이브러리의 생성 및 스크리닝 방법
EA032438B1 (ru) 2011-09-07 2019-05-31 Икс-Чем, Инк. Способы мечения днк-кодированных библиотек
NZ739931A (en) 2012-07-13 2019-08-30 X Chem Inc Dna-encoded libraries having encoding oligonucleotide linkages not readable by polymerases
GB201322692D0 (en) 2013-12-20 2014-02-05 Philochem Ag Production of encoded chemical libraries
EP4219710A3 (en) 2014-08-01 2023-08-16 Dovetail Genomics, LLC Tagging nucleic acids for sequence assembly
MA41298A (fr) * 2014-12-30 2017-11-07 X Chem Inc Procédés de marquage de banques codées par de l'adn
AU2016220135B2 (en) 2015-02-17 2021-07-29 Dovetail Genomics Llc Nucleic acid sequence assembly
GB2554572B (en) 2015-03-26 2021-06-23 Dovetail Genomics Llc Physical linkage preservation in DNA storage
WO2016165621A1 (zh) * 2015-04-14 2016-10-20 成都先导药物开发有限公司 一种固相合成dna编码化合物库的方法
EP3365445B1 (en) 2015-10-19 2023-05-31 Dovetail Genomics, LLC Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
WO2017100343A1 (en) 2015-12-07 2017-06-15 Arc Bio, Llc Methods and compositions for the making and using of guide nucleic acids
KR20180116377A (ko) 2016-02-23 2018-10-24 더브테일 제노믹스 엘엘씨 게놈 어셈블리를 위한 페이징된 판독 세트의 생성 및 반수체형 페이징
EP3455356B1 (en) 2016-05-13 2021-08-04 Dovetail Genomics LLC Recovering long-range linkage information from preserved samples
EP3472376A4 (en) 2016-06-16 2019-12-18 Richard Edward Watts DIRECTED AND RECORDED COMBINATORY SYNTHESIS OF OLIGONUCLEOTIDES OF CODED PROBE MOLECULES
US11198903B2 (en) * 2016-09-15 2021-12-14 Roche Molecular Systems, Inc. Methods for performing multiplexed real-time PCR
CN107130300A (zh) * 2016-10-08 2017-09-05 深圳劲宇生物科技有限公司 一种dna编码分子库的合成方法及dna模板
CN110730822B (zh) * 2017-04-18 2024-03-08 X-化学有限公司 鉴定化合物的方法
EP3619340A4 (en) 2017-05-02 2021-01-20 Haystack Sciences Corporation MOLECULES FOR THE VERIFICATION OF OLIGONUCLEOTIDE DIRECTED COMBINATIONAL SYNTHESIS AND METHOD OF MANUFACTURING AND USING THEREOF
CN111094565B (zh) * 2017-06-07 2024-02-06 阿克生物公司 指导核酸的产生和用途
CN111295444A (zh) * 2017-09-25 2020-06-16 哈斯达克科学公司 用于寡核苷酸指导的组合化学的多项式编码
JP7264206B2 (ja) * 2020-09-30 2023-04-25 株式会社三洋物産 遊技機

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010094036A1 (en) 2009-02-13 2010-08-19 X-Chem, Inc. Methods of creating and screening dna-encoded libraries

Family Cites Families (154)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5292967A (en) 1976-01-30 1977-08-04 Hanshin Diesel Works Separated matter accummulation takeout device for centrifugal separators
EP0260032B1 (en) 1986-09-08 1994-01-26 Ajinomoto Co., Inc. Compounds for the cleavage at a specific position of RNA, oligomers employed for the formation of said compounds, and starting materials for the synthesis of said oligomers
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
US5025388A (en) 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US5670633A (en) 1990-01-11 1997-09-23 Isis Pharmaceuticals, Inc. Sugar modified oligonucleotides that detect and modulate gene expression
US6005087A (en) 1995-06-06 1999-12-21 Isis Pharmaceuticals, Inc. 2'-modified oligonucleotides
US5723289A (en) 1990-06-11 1998-03-03 Nexstar Pharmaceuticals, Inc. Parallel selex
US5639603A (en) 1991-09-18 1997-06-17 Affymax Technologies N.V. Synthesizing and screening molecular diversity
WO1993006121A1 (en) 1991-09-18 1993-04-01 Affymax Technologies N.V. Method of synthesizing diverse collections of oligomers
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US5633360A (en) 1992-04-14 1997-05-27 Gilead Sciences, Inc. Oligonucleotide analogs capable of passive cell membrane permeation
HUT72495A (en) 1992-10-01 1996-05-28 Cold Spring Harbor Lab Complex combinatorial chemical libraries encoded with tags
US6503759B1 (en) 1992-10-01 2003-01-07 The Trustees Of Columbia University In The City Of New York Complex combinatorial chemical libraries encoded with tags
US5807683A (en) 1992-11-19 1998-09-15 Combichem, Inc. Combinatorial libraries and methods for their use
US5681943A (en) 1993-04-12 1997-10-28 Northwestern University Method for covalently linking adjacent oligonucleotides
ATE246702T1 (de) 1993-04-12 2003-08-15 Univ Northwestern Verfahren zur darstellung von oligonukleotiden
AU686186B2 (en) 1993-05-27 1998-02-05 Aventisub Ii Inc. Topologically segregated, encoded solid phase libraries
US5840485A (en) 1993-05-27 1998-11-24 Selectide Corporation Topologically segregated, encoded solid phase libraries
AU7323194A (en) 1993-07-02 1995-01-24 Lynx Therapeutics, Inc. Synthesis of branched nucleic acids
US5571903A (en) 1993-07-09 1996-11-05 Lynx Therapeutics, Inc. Auto-ligating oligonucleotide compounds
US6087186A (en) 1993-07-16 2000-07-11 Irori Methods and apparatus for synthesizing labeled combinatorial chemistry libraries
GB9315847D0 (en) 1993-07-30 1993-09-15 Isis Innovation Tag reagent and assay method
AU7390994A (en) 1993-08-25 1995-03-21 Symbicom Aktiebolag Molecular modelling and drug design
US5658782A (en) 1993-10-20 1997-08-19 State Of Oregon, Acting By And Through The Oregon State Board Of Higher Education On Behalf Of The Oregon Health Sciences University A Non-Profit Organization Amino acid transporters and uses
GB2298863B (en) 1993-11-02 1998-03-11 Affymax Tech Nv Apparatus and process for the synthesis of diverse compounds especially for generating and screening compound libraries
US6117976A (en) 1993-11-04 2000-09-12 Medical Research Council Manufacture and use of polypeptides tagged using binding molecules
EP0736103A4 (en) 1993-12-17 1999-07-28 Roger S Cubicciotti NUCLEOTIDE-DIRECTED ASSEMBLY OF MEDICAMENTS AND BIMOLECULAR AND MULTIMOLECULAR SYSTEMS
US6936477B2 (en) 1994-04-13 2005-08-30 The Trustees Of Columbia University In The City Of New York Complex combinatorial chemical libraries encoded with tags
JPH08268A (ja) 1994-06-16 1996-01-09 Koichi Nishigaki 連結した2本鎖dnaの製造方法
US5525734A (en) 1994-06-22 1996-06-11 Affymax Technologies N.V. Methods for synthesizing diverse collections of pyrrolidine compounds
US5525735A (en) 1994-06-22 1996-06-11 Affymax Technologies Nv Methods for synthesizing diverse collections of pyrrolidine compounds
MX9700725A (es) 1994-07-26 1997-05-31 Scripps Research Inst Coleccion combinatoria soluble.
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
USRE43097E1 (en) 1994-10-13 2012-01-10 Illumina, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US6654505B2 (en) 1994-10-13 2003-11-25 Lynx Therapeutics, Inc. System and apparatus for sequential processing of analytes
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5780613A (en) 1995-08-01 1998-07-14 Northwestern University Covalent lock for self-assembled oligonucleotide constructs
DE19646372C1 (de) 1995-11-11 1997-06-19 Evotec Biosystems Gmbh Genotyp und Phänotyp koppelnde Verbindung
US5763175A (en) 1995-11-17 1998-06-09 Lynx Therapeutics, Inc. Simultaneous sequencing of tagged polynucleotides
US5780231A (en) 1995-11-17 1998-07-14 Lynx Therapeutics, Inc. DNA extension and analysis with rolling primers
US5962228A (en) 1995-11-17 1999-10-05 Lynx Therapeutics, Inc. DNA extension and analysis with rolling primers
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US5846839A (en) 1995-12-22 1998-12-08 Glaxo Group Limited Methods for hard-tagging an encoded synthetic library
US6027890A (en) 1996-01-23 2000-02-22 Rapigene, Inc. Methods and compositions for enhancing sensitivity in the analysis of biological-based assays
DE19642751A1 (de) 1996-10-16 1998-04-23 Deutsches Krebsforsch Saccharid-Bibliothek
JP3692542B2 (ja) 1997-01-21 2005-09-07 ザ ジェネラル ホスピタル コーポレーション Rna−蛋白質の融合体を用いた蛋白質の選抜
US5888737A (en) 1997-04-15 1999-03-30 Lynx Therapeutics, Inc. Adaptor-based sequence analysis
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
CA2291180A1 (en) 1997-05-23 1998-11-26 Lynx Therapeutics, Inc. System and apparatus for sequential processing of analytes
US20020034732A1 (en) 1997-07-30 2002-03-21 Daniel J. Capon Compositions and methods for determining anti-viral drug susceptibility and resistance and anti-viral drug screening
WO1999010485A1 (en) 1997-08-29 1999-03-04 Selective Genetics, Inc. Methods using phage display for selecting internalizing ligands for gene delivery
US6607878B2 (en) 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
DE19928591A1 (de) 1998-06-22 1999-12-23 Roxana Havlina Herstellung von Polymeren aus nukleotidischen und/oder nicht-nukleotidischen Bausteinen auf enzymatischem Weg
US6846655B1 (en) 1998-06-29 2005-01-25 Phylos, Inc. Methods for generating highly diverse libraries
AU6502599A (en) 1998-10-05 2000-04-26 Lynx Therapeutics, Inc. Enzymatic synthesis of oligonucleotide tags
US7479472B1 (en) 1998-10-19 2009-01-20 The Board Of Trustees Of The Leland Stanford Junior University DNA-templated combinatorial library chemistry
US5942609A (en) 1998-11-12 1999-08-24 The Porkin-Elmer Corporation Ligation assembly and detection of polynucleotides on solid-support
DE69935248T2 (de) 1998-12-02 2007-11-08 Adnexus Therapeutics, Inc., Waltham Dna-protein fusionen sowie anwendungen derselben
US6087112A (en) 1998-12-30 2000-07-11 Oligos Etc. Inc. Arrays with modified oligonucleotide and polynucleotide compositions
US7033753B1 (en) 1999-01-15 2006-04-25 University Of Rochester Compositions and methods for nonenzymatic ligation of oligonucleotides and detection of genetic polymorphisms
EP1208219A1 (en) 1999-04-08 2002-05-29 Pavel Sergeev Synthesis of biologically active compounds in cells
DE60032235T2 (de) 1999-04-30 2007-11-15 Cyclops Genome Sciences Ltd., West Kirby Ribonukleinsäurederivate
US7270969B2 (en) 1999-05-05 2007-09-18 Phylogica Limited Methods of constructing and screening diverse expression libraries
WO2001016352A1 (en) 1999-08-27 2001-03-08 Phylos, Inc. Methods for encoding and sorting in vitro translated proteins
AU7703400A (en) 1999-09-14 2001-04-17 Xenoport, Inc. Substrates and screening methods for transport proteins
JP2003511362A (ja) 1999-10-04 2003-03-25 ユニバーシティー オブ メディシン アンド デンティストリー オブ ニュー ジャージー 新規カルバメートおよび尿素類
US6844324B1 (en) 1999-11-12 2005-01-18 Massachusetts Institute Of Technology Modular peptide mediated intracellular delivery system and uses therefore
WO2001062772A2 (en) 2000-02-23 2001-08-30 Xenoport, Inc. Self-encoded combinatorial synthesis of compound multiplets
US6936467B2 (en) 2000-03-27 2005-08-30 University Of Delaware Targeted chromosomal genomic alterations with modified single stranded oligonucleotides
US7998673B2 (en) 2000-03-29 2011-08-16 Lgc Limited Hybridisation beacon and method of rapid sequence detection and discrimination
US6479262B1 (en) 2000-05-16 2002-11-12 Hercules, Incorporated Solid phase enzymatic assembly of polynucleotides
US6994963B1 (en) 2000-07-10 2006-02-07 Ambion, Inc. Methods for recombinatorial nucleic acid synthesis
US20020072887A1 (en) 2000-08-18 2002-06-13 Sandor Szalma Interaction fingerprint annotations from protein structure models
US6627748B1 (en) 2000-09-11 2003-09-30 The Trustees Of Columbia University In The City Of New York Combinatorial fluorescence energy transfer tags and their applications for multiplex genetic analyses
EP1331572B1 (en) 2000-09-20 2012-08-08 ARKRAY, Inc. Client support system
CA2427109A1 (en) 2000-10-27 2002-05-02 Research Development Foundation In vitro selection of signaling aptamers
JP2002315577A (ja) 2000-11-14 2002-10-29 Gencom Co 核酸ライブラリーの作製方法
US20030049616A1 (en) 2001-01-08 2003-03-13 Sydney Brenner Enzymatic synthesis of oligonucleotide tags
PT1423400E (pt) 2001-03-19 2006-12-29 Harvard College Evolução de nova função molecular
US20060234231A1 (en) 2001-06-20 2006-10-19 Nuevolution A/S Microarrays displaying encoded molecules
RU2004101289A (ru) 2001-06-20 2005-07-10 Нуэволюшн А/С (Dk) Способ синтеза молекулы на матрице
US7727713B2 (en) 2001-06-20 2010-06-01 Nuevolution A/S Templated molecules and methods for using such molecules
US20030143561A1 (en) 2001-06-20 2003-07-31 Nuevolution A/S Nucleoside derivatives for library preparation
DK1483585T3 (da) 2002-03-08 2009-06-22 Eidgenoess Tech Hochschule Kodede, selvsamlende kemiske biblioteker (ESACHEL)
DE60324778D1 (de) 2002-03-15 2009-01-02 Nuevolution As Eine verbesserte methode zur synthese von matritzenabhängigen molekülen
AU2003253069A1 (en) 2002-03-15 2003-09-29 Nuevolution A/S A building block forming a c-c bond upon reaction
WO2003078446A2 (en) 2002-03-15 2003-09-25 Nuevolution A/S A building block forming a c-c or a c-hetero atom bond upon reaction
US20060166197A1 (en) 2002-03-15 2006-07-27 Gouliaev Alex H Building block capable of transferring a functional entity
EP1487848A2 (en) 2002-03-15 2004-12-22 Nuevolution A/S A building block forming a c=c double bond upon reaction
AU2003240436A1 (en) 2002-06-20 2004-01-06 Nuevolution A/S Microarrays displaying encoded molecules
WO2004010101A2 (en) 2002-07-18 2004-01-29 The Board Of Trustees Of The Leland Stanford Junior University Detection of chemical ligation using fluorescence quenching leaving groups
AU2003242516A1 (en) 2002-07-23 2004-02-09 Nuevolution A/S Gene shuffling by template switching
EP1539980B1 (en) 2002-08-01 2016-02-17 Nuevolution A/S Library of complexes comprising small non-peptide molecules and double-stranded oligonucleotides identifying the molecules
WO2004016767A2 (en) 2002-08-19 2004-02-26 The President And Fellows Of Harvard College Evolving new molecular function
WO2004024929A2 (en) 2002-09-12 2004-03-25 Nuevolution A/S Proximity-aided synthesis of templated molecules
CN106337046B (zh) 2002-10-30 2021-03-23 纽韦卢森公司 合成双功能复合物的方法
EP2175019A3 (en) 2002-12-19 2011-04-06 Nuevolution A/S Quasirandom structure and function guided synthesis methods
EP1597394A2 (en) 2003-02-21 2005-11-23 Nuevolution A/S A method for obtaining structural information about an encoded molecule
EP1597395A2 (en) 2003-02-21 2005-11-23 Nuevolution A/S Method for producing second-generation library
DE602004019764D1 (de) 2003-03-20 2009-04-16 Nuevolution As Ligationsvermittelnde codierung von kleinen molekülen
EP1652123A2 (en) 2003-07-03 2006-05-03 Biogen Idec MA Inc. STRUCTURAL INTERACTION FINGERPRINT (SIFt)
CN1836050A (zh) 2003-07-07 2006-09-20 单细胞***公司 发夹标记的探针及其使用方法
EP1533385A1 (en) 2003-09-05 2005-05-25 Nuevolution A/S Templated compounds for generation of encoded molecules and directional methods using such compounds
WO2005026686A2 (en) 2003-09-09 2005-03-24 Compass Genetics, Llc Multiplexed analytical platform
ATE447626T1 (de) 2003-09-18 2009-11-15 Nuevolution As Methode zur gewinnung struktureller informationen kodierter moleküle und zur selektion von verbindungen
WO2005050224A2 (en) 2003-11-13 2005-06-02 Epitome Biosystems Inc. Small molecule and peptide arrays and uses thereof
US7972994B2 (en) 2003-12-17 2011-07-05 Glaxosmithkline Llc Methods for synthesis of encoded libraries
EP2366705A1 (en) 2003-12-17 2011-09-21 Praecis Pharmaceuticals Incorporated Methods for synthesis of encoded libraries
AU2005214329A1 (en) 2004-02-12 2005-09-01 Population Genetics Technologies Ltd Genetic analysis by sequence-specific sorting
EP1723255B1 (en) 2004-02-17 2010-12-29 Nuevolution A/S Method for enrichment involving elimination by mismatch hybridisation
US7704925B2 (en) 2004-03-22 2010-04-27 Nuevolution A/S Ligational encoding using building block oligonucleotides
US7405287B2 (en) 2004-08-03 2008-07-29 Board Of Regents, The University Of Texas System Method of treating a cancer
US7745614B2 (en) 2004-09-03 2010-06-29 The Board Of Trustees Of The Leland Stanford Junior University Universal linker compositions for the release or transfer of chemical agents from a polynucleotide
WO2006047791A2 (en) 2004-10-27 2006-05-04 The Board Of Trustees Of The Leland Stanford Junior University Dna-templated combinatorial library device and method for use
DE602005012139D1 (de) 2004-11-08 2009-02-12 Vipergen Aps Strukturelle nukleinsäure-geführte chemische synthese
ATE420170T1 (de) 2004-11-22 2009-01-15 Peter Birk Rasmussen Matrizengerichtete split-and-mix-synthese von bibliotheken kleiner moleküle
CA2591582A1 (en) 2004-12-17 2006-06-22 Dynavax Technologies Corporation Methods and compositions for induction or promotion of immune tolerance
WO2006079061A2 (en) 2005-01-21 2006-07-27 President And Fellows Of Harvard College Free reactant use in nucleic acid-templated synthesis
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US7407757B2 (en) 2005-02-10 2008-08-05 Population Genetics Technologies Genetic analysis by sequence-specific sorting
WO2006099604A2 (en) 2005-03-16 2006-09-21 Compass Genetics, Llc Methods and compositions for assay readouts on multiple analytical platforms
RS51868B (en) 2005-06-09 2012-02-29 Praecis Pharmacueuticals Inc. PROCEDURES FOR SYNTHESIS OF CODED LIBRARIES
US20090035824A1 (en) 2005-06-17 2009-02-05 Liu David R Nucleic acid-templated chemistry in organic solvents
CA2616404A1 (en) 2005-07-26 2007-02-01 Oregon Health & Science University Nanoparticle probes for capture, sorting and placement of targets
US20090005256A1 (en) 2005-07-29 2009-01-01 Bittker Joshua A Analysis of Encoded Chemical Libraries
CA2624634A1 (en) * 2005-10-03 2007-04-12 Applera Corporation Compositions, methods, and kits for amplifying nucleic acids
AU2006309096B2 (en) 2005-10-28 2013-07-04 Glaxosmithkline Llc Methods for identifying compounds of interest using encoded libraries
PT3305900T (pt) 2005-12-01 2021-10-27 Nuevolution As Métodos de codificação enzimática para síntese eficaz de bibliotecas grandes
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
WO2007124758A1 (en) 2006-05-03 2007-11-08 Vipergen Aps A method for preparing compounds by nucleic acid directed synthesis
WO2008050661A1 (fr) 2006-10-26 2008-05-02 Sumitomo Chemical Company, Limited Procédé servant à produire un cristal de complexe asymétrique du cuivre
CN101219219B (zh) 2007-01-10 2013-02-13 北京普罗吉生物科技发展有限公司 包含血管抑素或其片段的复合物、其制备方法及应用
ATE516371T1 (de) 2007-10-22 2011-07-15 Lgc Ltd Oligonukleotide und deren verwendungen
JP4940311B2 (ja) * 2007-11-19 2012-05-30 国立大学法人北陸先端科学技術大学院大学 光クロスリンク能を有する光応答性人工ヌクレオチド
WO2009077173A2 (en) * 2007-12-19 2009-06-25 Philochem Ag Dna-encoded chemical libraries
US20120107840A1 (en) 2008-04-09 2012-05-03 Sru Biosystems, Inc Methods for Label Free Testing of Cells
JP4814904B2 (ja) 2008-04-16 2011-11-16 国立大学法人北陸先端科学技術大学院大学 核酸類の配列選択的な精製方法
JP5774474B2 (ja) 2008-05-02 2015-09-09 エピセンター テクノロジーズ コーポレーションEpicentre Technologies Corporation Rnaへの選択的な5’ライゲーションによるタグの付加
TW201011006A (en) 2008-06-16 2010-03-16 Nuevolution As IAP binding compounds
KR20110036638A (ko) 2008-07-25 2011-04-07 리차드 더블유. 와그너 단백질 스크리닝 방법
EP2391639A1 (en) 2009-01-30 2011-12-07 Oxford Nanopore Technologies Limited Enzyme mutant
AU2010213497A1 (en) 2009-02-13 2011-08-25 X-Body, Inc. Identification of nucleic acid delivery vehicles using DNA display
EP2396430B1 (en) 2009-02-16 2013-05-01 Epicentre Technologies Corporation Template-independent ligation of single-stranded dna
EP2464755B1 (en) 2009-11-05 2016-03-09 Epicentre Technologies Corporation Methods and kits for 3'-end-tagging of rna
DE102009058769A1 (de) 2009-12-16 2011-06-22 MagForce Nanotechnologies AG, 10589 Temperaturabhängige Aktivierung von katalytischen Nukleinsäuren zur kontrollierten Wirkstofffreisetzung
US20110237535A1 (en) 2010-03-26 2011-09-29 Sru Biosystems, Inc. Use of Induced Pluripotent Cells and other Cells for Screening Compound Libraries
EP3540059A1 (en) 2010-04-16 2019-09-18 Nuevolution A/S Bi-functional complexes and methods for making and using such complexes
EP2686349B1 (en) 2011-03-15 2020-12-09 X-Body, Inc. Antibody screening methods
EA032438B1 (ru) * 2011-09-07 2019-05-31 Икс-Чем, Инк. Способы мечения днк-кодированных библиотек
NZ739931A (en) 2012-07-13 2019-08-30 X Chem Inc Dna-encoded libraries having encoding oligonucleotide linkages not readable by polymerases
CN104520456A (zh) * 2012-08-10 2015-04-15 新日铁住金株式会社 钛合金材料
GB201322692D0 (en) 2013-12-20 2014-02-05 Philochem Ag Production of encoded chemical libraries

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010094036A1 (en) 2009-02-13 2010-08-19 X-Chem, Inc. Methods of creating and screening dna-encoded libraries

Also Published As

Publication number Publication date
ZA201900255B (en) 2022-04-28
JP6906492B2 (ja) 2021-07-21
EA201992285A1 (ru) 2020-05-31
SG11201500250VA (en) 2015-03-30
DK3392338T3 (da) 2021-02-01
MX2015000598A (es) 2016-01-12
EP2872680A4 (en) 2016-01-27
WO2014012010A1 (en) 2014-01-16
US11674135B2 (en) 2023-06-13
AU2018202665B2 (en) 2020-06-25
NZ744078A (en) 2020-02-28
EP3392338B1 (en) 2020-12-09
CN110257493A (zh) 2019-09-20
SG10201907347YA (en) 2019-09-27
KR102146721B1 (ko) 2020-08-21
AU2013289993B2 (en) 2018-05-10
ES2675167T3 (es) 2018-07-09
ZA201500328B (en) 2019-06-26
AU2018202665A1 (en) 2018-05-10
EP2872680B1 (en) 2018-04-04
EP3392338A1 (en) 2018-10-24
ES2855137T3 (es) 2021-09-23
NZ703766A (en) 2018-03-23
AU2013289993A1 (en) 2015-02-26
IL236633B (en) 2022-07-01
IL236633A0 (en) 2015-02-26
CA2879018A1 (en) 2014-01-16
EA201590195A1 (ru) 2015-05-29
NZ739931A (en) 2019-08-30
US20150211002A1 (en) 2015-07-30
JP2019030324A (ja) 2019-02-28
EA034141B1 (ru) 2020-01-09
EP3851529A1 (en) 2021-07-21
JP6426604B2 (ja) 2018-11-21
EP2872680A1 (en) 2015-05-20
JP2015529449A (ja) 2015-10-08
KR20200100206A (ko) 2020-08-25
DK2872680T3 (en) 2018-07-09
KR20150030260A (ko) 2015-03-19
AU2020239663A1 (en) 2020-10-15
JP2021167326A (ja) 2021-10-21
CN104685115A (zh) 2015-06-03

Similar Documents

Publication Publication Date Title
KR102270554B1 (ko) 폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 dna-코딩된 라이브러리
KR102124613B1 (ko) Dna-코딩된 라이브러리에 태그부착하는 방법
CN107428795B (zh) 用于标记dna编码文库的方法
EA028985B1 (ru) Способ идентификации соединений в составе библиотек, кодируемых днк
NZ733158A (en) Methods for tagging dna-encoded libraries
NZ722289B2 (en) Methods for tagging dna-encoded libraries

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant