KR20180048682A - Dna 샘플의 분석을 위한 프로브 세트 및 이의 사용 방법 - Google Patents

Dna 샘플의 분석을 위한 프로브 세트 및 이의 사용 방법 Download PDF

Info

Publication number
KR20180048682A
KR20180048682A KR1020187006545A KR20187006545A KR20180048682A KR 20180048682 A KR20180048682 A KR 20180048682A KR 1020187006545 A KR1020187006545 A KR 1020187006545A KR 20187006545 A KR20187006545 A KR 20187006545A KR 20180048682 A KR20180048682 A KR 20180048682A
Authority
KR
South Korea
Prior art keywords
sequence
probe
oligonucleotide
sequences
oligonucleotides
Prior art date
Application number
KR1020187006545A
Other languages
English (en)
Inventor
카를 오스카 프레드릭 달
올레프 존 에릭손
필립 카르손
프레드릭 로스
Original Assignee
바나디스 다이아그노스틱스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바나디스 다이아그노스틱스 filed Critical 바나디스 다이아그노스틱스
Publication of KR20180048682A publication Critical patent/KR20180048682A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/682Signal amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/125Rolling circle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/131Allele specific probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2561/00Nucleic acid detection characterised by assay method
    • C12Q2561/125Ligase Detection Reaction [LDR]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 개시내용은 프로브 시스템, 그 중에서도 특히, 핵산 샘플을 분석하기 위한 프로브 시스템을 제공한다. 몇몇 실시형태에 있어서, 프로브 시스템은 서열 B의 식별자 올리고뉴클레오타이드의 세트; 식 X'-A'-B'-Z'의 스플린트 올리고뉴클레오타이드의 세트로서, 서열 A'는 게놈 단편에 상보적이고, 서열 B'는 식별자 올리고뉴클레오타이드의 세트의 적어도 하나의 구성원에 상보적인, 상기 스플린트 올리고뉴클레오타이드의 세트; 및 X 및 Z를 포함하는 하나 이상의 프로브 서열을 포함할 수 있다. 각각의 스플린트 올리고뉴클레오타이드는 프로브 서열, 식별자 올리고뉴클레오타이드의 세트의 구성원 및 게놈 단편에 혼성화될 수 있고, 이로써 식 X-A-B-Z의 결찰 가능한 복합체를 생성한다. 예를 들면, 프로브 시스템은 무세포 DNA에서 염색체 이수성을 식별하는데 사용될 수 있다.

Description

DNA 샘플의 분석을 위한 프로브 세트 및 이의 사용 방법
상호-참조
본 출원은 2015년 9월 18일자로 출원된 가특허 출원 제62/220,746호의 유익을 주장하고, 이 출원은 그 전문이 본 명세서에 참고로 포함된다.
무세포 DNA(cell free DNA: "cfDNA")는 분석되어 다양한 암, 이식 실패 또는 성공, 염증성 질환, 감염성 질환 및 태아 이수성을 포함한 다양한 질환 및 병태의 치료에 대한 반응의 예후, 진단 또는 예측을 제공할 수 있다.
무세포 태아 DNA(Cell-free fetal DNA: cffDNA)는 임신 여성의 혈액에 존재한다. 이러한 발견은 임신 여성으로부터의 혈액 샘플을 사용하여 태아의 비침습성 태아기 검사(non-invasive prenatal testing: NIPT)를 수행하는 가능성을 야기하였다. 침습성 태아기 검사(예를 들면, 양수천자 또는 융모막 추출(chorionic villi sampling: CVS))은 모체에게 스트레스가 많고, 일부는 이러한 절차가 유산의 위험성을 증가시킬 수 있다고 믿는다. NIPT는 다운 증후군(삼염색체성 염색체 21), 파타우 증후군(삼염색체성 13), 및 에드워드 증후군(삼염색체성 18)을 포함한 다양한 유전적 결함에 관한 정보를 제공할 수 있다. 이러한 방법은 거짓 양성이 불필요한 의료 절차를 야기할 수 있고, 거짓 음성이 임산부에게 이용 가능한 의료적 선택의 이해를 주지 않을 수 있기 때문에 매우 견고하여야 한다.
비침습성 태아기 검사를 임상적 규모에서 실시하는 것과 연관된 많은 기술적 장애물이 존재한다. 예를 들면, 많은 NIPT 노력은 특정한 서열(예를 들면, 염색체 21로부터의 서열)에서 복제 수 변화를 확인하는 cffDNA의 분석에 집중하였다. 그러나, 이러한 방법은, 부분적으로, 혈액 샘플 중의 cfDNA의 광대한 대부분이 기원에서 모체의 것이고, 다수의 경우 아주 소량(예를 들면, 평균 ~10%으로 약 3%까지 낮아짐)만이 태아로부터의 것이기 때문에 견고한 방식으로 실시되기가 어렵다. 예를 들면, 태아에서 염색체(예를 들면, 염색체 21)의 여분의 복제의 존재 또는 부재는 염색체 21에 상응하는 서열의 복제수와 상염색체성 염색체에 상응하는 서열의 복제 수를 비교함으로써 결정될 수 있다. 이러한 방법이 매력적으로 들리는 반면, 이들은 모체 혈액 중의 모체 DNA에 대한 태아 DNA의 분획 농도가 3%만큼 낮을 수 있기 때문에 사실 도전적인 일이다. 이와 같이, 모체 혈류 중에 있는 염색체 21에 상응하는 모든 1000 서열에 있어서, 이들 서열의 적은 백분율(예를 들면, 태아 분획이 3%인 경우 30 서열)만이 태아로부터 나온 것이다. 따라서, 태아의 염색체의 여분의 복제는 모체 혈류 중의 그 염색체에 상응하는 서열의 수의 상대적으로 적은 증가를 야기할 뿐일 것이다. 예를 들면, 태아 분획이 4인 경우, 태아 삼염색체성 21은 모체 혈류 중의 염색체 21에 상응하는 단편(fragment)의 수의 겨우 1.5% 증가를 야기할 것이다. 이러한 문제점의 결과로서, 통계적 엄격함은 복제 수 차이(예를 들면, 적어도 1,000 및 때때로 적어도 5,000 또는 그 이상의 서열)를 갖는 것으로 의심되는 염색체 영역에 상응하는 상당수의 서열을 계수하고, 그 수를 복제 수 차이를 갖지 않는 것으로 의심되는 또 다른 염색체 영역의 유사한 수와 비교함으로써 오직 달성될 수 있다. 일정하고 정확하게 단편을 계수할 수 있는 것이 많은 NIPT 방법의 성공에 있어서 가장 중요하다.
일부 NIPT 방법은 중합효소 연쇄 반응(polymerase chain reaction: PCR)을 사용하여 DNA를 증폭시킨다. PCR은 널리 사용되지만, 결과의 정확성에 부정적인 영향을 미칠 수 있는 다양한 제한으로 어려움을 겪는다. PCR은 서열 아티팩트를 도입할 수 있고, 샘플에 증폭 바이어스를 생성할 수 있다. PCR 서열 아티팩트는 PCR 반응에 의해 PCR 증폭된 생성물의 DNA 서열 내로 도입되는 오류이다. PCR 서열 아티팩트는 다양한 사건에 의해, 예를 들면, 키메라 분자(예를 들면, 말단에 결합된 DNA의 2개의 상이한 조각)의 형성, 이형듀플렉스 DNA(예를 들면, 서로 상이한 2개의 DNA 분자의 혼성화)의 형성 및 증폭 효소(예를 들면, DNA 주형에 대하여 일치하지 않는 뉴클레오타이드를 대체하는 Taq DNA 중합효소)에 의해 만들어진 오류에 의해 유발될 수 있다. PCR로부터의 서열 바이어스는 기원 샘플과 비교된 PCR 생성물의 분포의 스큐잉이다. PCR 서열 바이어스는 다양한 사건, 예를 들면, 주형의 증폭 효율의 내재적인 차이 또는 DNA 주형의 셀프-어닐링으로 인한 증폭의 억제에 의해 유발될 수 있다. PCR 오류는 상이한 DNA 분자의 동일하지 않은 증폭을 야기하여, 증폭된 샘플이 기원 샘플을 더 이상 나타내지 않는다. PCR은 또한 환경으로부터의 외인성 DNA 오염에 악명 높게 민감하다. PCR 동안 DNA의 지수 증폭으로 인하여, 심지어 PCR 반응에서 외인성 DNA 오염의 매우 소량이 매우 부정확한 결과를 야기할 수 있다. 외인성 DNA 오염은 공기 중에 떠다니는 에어로졸화된 작은 방울로부터 도입될 수 있거나, 오염된 장치로부터 반응 내로 옮겨질 수 있다.
모체 혈액 중의 cfDNA를 분석하는 회전환 증폭(rolling-circle amplification: RCA)의 사용은 PCR과 연관된 다수의 문제를 회피한다. 그러나, RCA 산물은 통계적 견고성을 제공하는 방식으로 정량하는 것이 매우 쉽지 않다. 실시 수준에서, RCA 반응에서 생성물의 절대 수가 통계적 견고성을 제공하는데 충분하게 높을 수 있음에도 불구하고, 상이한 RCA 산물은 상이한 효율로 증폭되고 검출될 수 있고, 이와 같이, 수십, 수백 또는 수천의 RCA 산물을 일정하게 검출하는 것은 고르게 도전적이었다.
핵산 샘플을 분석하는 프로브 시스템이 그 중에서도 특히 기재된다. 프로브는 이들이 상이한 좌위(예를 들면, 상이한 염색체)로부터의 게놈 DNA의 표적 단편("표적 서열" 또는 단지 "단편"으로도 지칭됨)에 결찰되어 환형 DNA 분자를 제조할 수 있는 방식으로 디자인될 수 있다. 환형 DNA 분자는, 심지어 이들이 염색체로부터의 단편을 함유하는 경우에도, 모두 동일한 "골격(backbone)" 서열을 함유한다. 추가로, 몇몇 실시형태에 있어서, 동일한 좌위로부터의 단편을 함유하는 모든 환형 DNA 분자는 동일한 좌위-특이적 식별자 서열(locus-specific identifier sequence), 즉, 좌위-특이적 바코드를 함유한다. 이들 실시형태에 있어서, 환형 DNA 분자는 골격에서 서열에 혼성화되는 프라이머를 사용하여 증폭될 수 있고, 이로부터의 클로닝된 단편이 유도되는 자위는 좌위-특이적 식별자 서열에 혼성화되는 표지된 올리고뉴클레오타이드에 RCA 산물을 혼성화함으로써 검출될 수 있다. 명백하게도, 방법의 이러한 실시형태는 다중 좌위-특이적 식별자 서열 및 이들 서열에 혼성화되는 구별 가능하게 표지된 올리고뉴클레오타이드를 사용하여 복합적일 수 있다. 모든 환형 생성물이 동일한 골격을 갖고, 클로닝된 단편의 서열 및 좌위-특이적 바코드만이 서로 상이하기 때문에, 일정하게 증폭된 이들 생성물로부터 증폭된 RCA 산물, 및 상응하는 이들 RCA 산물에 대한 좌위는 정확하게 검출될 수 있다. 프로브 시스템을 사용하는 방법뿐만 이날 이를 실시하는 키트가 또한 제공된다.
하기 더욱 상세하게 논의될 것인 바와 같이, 특정한 경우에 방법은 태아를 가진 임신 여성으로부터의 cfDNA 샘플을 사용하여 태아에서 염색체 이상(예를 들면, 삼염색체성 21)을 검출하는데 사용될 수 있다.
핵산 샘플을 분석하는 프로브 시스템이 제공된다. 몇몇 실시형태에 있어서, 프로브 시스템은, (a) 서열 B의 식별자 올리고뉴클레오타이드(identifier oligonucleotide)의 세트; (b) 식 X'-A'-B'-Z'의 스플린트 올리고뉴클레오타이드(splint oligonucleotide)의 세트로서, 여기서, 상기 세트 내에서: (i) 서열 A' 및 B'는 다양하고, (ii) 서열 X' 및 Z'는 서로 상이하며, 가변적이지 않고; 각각의 스플린트 올리고뉴클레오타이드 내에서: (i) 서열 A'는 핵산 샘플의 게놈 단편에 상보적이고, (ii) 서열 B'는 식별자 올리고뉴클레오타이드의 세트의 적어도 하나의 구성원에 상보적인, 상기 스플린트 올리고뉴클레오타이드의 세트; 및 (c) X 및 Z를 포함하는 하나 이상의 프로브 서열로서, 서열 X 및 Z가 가변적이지 않고, 서열 X' 및 Z'에 혼성화되는, 상기 하나 이상의 프로브 서열을 포함할 수 있되; 여기서 각각의 스플린트 올리고뉴클레오타이드는 (i) 프로브 서열, (ii) 식별자 올리고뉴클레오타이드의 세트의 구성원 및 (iii) 게놈 단편에 혼성화될 수 있고, 이로써 식 X-A-B-Z의 결찰 가능한 복합체를 생성한다. 몇몇 실시형태에 있어서, 상이한 식별자 올리고뉴클레오타이드 및 이들의 상보성 서열 B'는 상이한 염색체, 예를 들면, 염색체 21, 18 및 13을 식별한다.
몇몇 실시형태에 있어서, 식별자 올리고뉴클레오타이드의 세트는 적어도 2개(예를 들면, 2개, 3개 또는 4개 또는 그 이상)의 상이한 B 서열 식별자 올리고뉴클레오타이드를 포함할 수 있고, 스플린트 올리고뉴클레오타이드의 세트 내에서, 적어도 100개의 상이한 A' 서열 및 적어도 2개의 상이한 식별자 올리고뉴클레오타이드에 상보적인 적어도 2개의 상이한 B' 서열이 존재한다.
몇몇 실시형태에 있어서, 각각의 식별자 올리고뉴클레오타이드 또는 스플린트 올리고뉴클레오타이드 내의 상기 각각의 식별자 올리고뉴클레오타이드의 상보적 B' 서열은 게놈 단편에 상응할 수 있다.
몇몇 실시형태에 있어서, 각각의 식별자 올리고뉴클레오타이드 또는 스플린트 올리고뉴클레오타이드 내의 상기 각각의 식별자 올리고뉴클레오타이드의 상보적 B' 서열은 게놈 단편이 유도되는 게놈에서 좌위를 지시(indicate)할 수 있다.
몇몇 실시형태에 있어서, 각각의 식별자 올리고뉴클레오타이드 또는 스플린트 올리고뉴클레오타이드 내의 상기 각각의 식별자 올리고뉴클레오타이드의 상보적 B' 서열은 게놈 단편이 유도되는 염색체를 지시할 수 있다.
몇몇 실시형태에 있어서, 게놈 단편은 포유동물 게놈으로부터 유래된 것이다.
몇몇 실시형태에 있어서, 각각의 식별자 올리고뉴클레오타이드 또는 스플린트 올리고뉴클레오타이드 내의 상기 각각의 식별자 올리고뉴클레오타이드의 상보적 B' 서열은 염색체 21, 염색체 18 및 염색체 13 중 하나 이상을 식별할 수 있다.
몇몇 실시형태에 있어서, 게놈 단편은 제한 단편(restriction fragment)일 수 있다.
몇몇 실시형태에 있어서, (c)의 하나 이상의 프로브 서열은 서열 Y를 포함하는 올리고뉴클레오타이드를 추가로 포함할 수 있고, 여기서 결찰 가능한 복합체는 선형이다.
몇몇 실시형태에 있어서, 프로브 시스템은 (c)의 하나 이상의 프로브에 혼성화되는 한 쌍의 PCR 프라이머를 추가로 포함할 수 있다.
몇몇 실시형태에 있어서, (c)의 하나 이상의 프로브 서열은 식 X-Y-Z의 골격 프로브를 포함할 수 있고, 여기서 Y는 결찰 가능한 복합체가 식 X-A-B-Z-Y의 환형 결찰 가능한 복합체인 올리고뉴클레오타이드 서열을 포함하고, 여기서 서열 Y는 서열 X 및 Z에 결합한다.
몇몇 실시형태에 있어서, 프로브 시스템은 골격 프로브에서 서열에 혼성화되는 회전환 증폭 프라이머를 추가로 포함할 수 있다.
몇몇 실시형태에 있어서, 프로브 시스템은 (A) 서열을 골격 프로브에 혼성화시키는 회전환 증폭 프라이머; 및 (B) 4개 이하의 구별 가능하게 표지된 검출 올리고뉴클레오타이드로서, 각각의 구별 가능하게 표지된 검출 올리고뉴클레오타이드가 B' 서열에 혼성화되는 올리고뉴클레오타이드를 추가로 포함할 수 있다.
샘플 분석 방법이 또한 제공된다. 몇몇 실시형태에 있어서, 방법은 (a) 상기 요약된 프로브 시스템의 임의의 실시형태를 게놈 단편을 포함하는 시험 게놈 샘플과 혼성화하여 식 X-A-B-Z의 결찰 가능한 복합체를 생성시키는 단계; (b) 결찰 가능한 복합체를 결찰시켜 식 X-A-B-Z의 산물 DNA 분자를 생성시키는 단계; 및 (c) 서열 B의 각각의 좌위 식별자에 상응하는 산물 DNA 분자를 계수하는 단계를 포함할 수 있다.
몇몇 실시형태에 있어서, 계수는 산물 DNA 분자, 또는 이의 증폭 산물을 서열결정하여 서열 판독물을 생성시키고, B의 각각의 서열 또는 이의 상보물을 포함하는 서열 판독물의 수를 계수함으로써 수행될 수 있다.
몇몇 실시형태에 있어서, 산물 DNA 분자는 환형일 수 있고, 계수는 회전환 증폭에 의해 산물 DNA 분자를 증폭시키고, B의 각각의 서열 또는 이의 상보물을 포함하는 증폭 산물의 수를 계수하는 것을 포함할 수 있다. 이들 실시형태에 있어서, 방법은 서열 B'에 혼성화되는 구별 가능하게 표지된 프로브를 사용하여 RCA 산물을 표지화하는 것을 포함할 수 있고, 계수는 각각의 구별 가능한 표지에 대한 RCA 산물의 수를 계수함으로써 수행된다.
몇몇 실시형태에 있어서, 방법은 i. RCA 산물을 평평한 지지체 위에 침착하는 단계; 및 ii. 지지체의 면적 내의 개별적인 표지된 RCA 산물의 수를 계수하는 단계를 포함할 수 있다. 이들 실시형태에 있어서, 지지체는, 예를 들면, 유리 슬라이드 또는 다공성 투명 모세관 막일 수 있다.
몇몇 실시형태에 있어서, B의 상이한 서열 및 이의 상보성 서열 B'는 상이한 염색체를 식별하고, 방법은 B 또는 B'의 제1 서열을 포함하는 산물 DNA 분자의 수를 B 또는 B'의 제2 서열을 포함하는 산물 DNA 분자의 수와 비교하여 게놈 샘플이 이수성을 갖는지의 여부를 결정하는 것을 추가로 포함한다.
몇몇 실시형태에 있어서, 방법은 단계 (c)의 계수 결과를 하나 이상의 참조 샘플로부터 수득된 계수 결과와 비교하는 것을 포함할 수 있다.
몇몇 실시형태에 있어서, 시험 게놈 샘플은 질환 또는 병태가 의심되거나 이의 위험성이 있는 환자로부터의 것일 수 있고, 단계 (c)의 계수 결과는 환자, 또는 이의 태아가 질환 또는 병태를 갖는지의 여부의 지시를 제공한다.
몇몇 실시형태에 있어서, 질환 또는 병태는 암, 감염성 질환, 염증성 질환, 이식 거부반응(transplant rejection) 또는 삼염색체성을 포함할 수 있다.
몇몇 실시형태에 있어서, 단편은 제한 단편이다.
숙련가는 하기 기재된 도면이 오직 예시의 목적을 위한 것임을 이해할 것이다. 도면은 본 발명의 교시의 범위를 어떠한 방식으로도 제한하는 것을 의도하지 않는다.
도 1은 본 발명의 프로브 시스템의 일부 특징을 도식적으로 도시한다.
도 2는 서열 B가 어떻게 서열 A의 좌위를 식별하는 것을 제공하는지를 도식적으로 도시한다.
도 3은 몇몇 예시적인 프로브 시스템 구성을 도식적으로 도시한다.
도 4는 대상 방법의 실시형태의 몇몇 특징을 도식적으로 도시한다.
도 5는 대상 방법의 하나의 실시의 몇몇 특징을 도식적으로 도시한다.
도 6은 프로브 시스템의 디자인을 도식적으로 도시한다.
도 7은 2개의 상이한 프로브 시스템을 사용하여 수득된 데이터를 나타낸다.
도 8은 임상 샘플의 분석으로부터 수득된 데이터를 나타낸다.
정의
예시적인 실시형태를 더욱 상세하게 설명하기 전에, 설명에서 사용되는 용어의 의미 및 범위를 설명하고 정의하기 위하여 하기 정의를 기재한다.
수적인 범위는 범위를 정의하는 숫자를 포함한다. 달리 지시되지 않는 한, 각각 핵산은 5'에서 3' 방향으로 좌에서 우로 쓰여지고; 아미노산 서열은 아미노에서 카복시 방향으로 좌에서 우로 쓰여진다.
달리 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어는 본 발명이 속한 분야의 숙련가에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 문헌[Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 2D ED., John Wiley and Sons, New York(1994)], 및 [Hale & Markham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, N.Y.(1991)]은 본 명세서에서 사용된 다수의 용어의 일반적인 의미를 숙련가에게 제공한다. 그래도, 특정한 용어는 명확성의 추구 및 참조의 용이함을 위하여 하기 정의된다.
본 명세서 및 첨부된 청구범위에서 사용되는 바와 같이, 단수형 "한", "하나의", 및 "그"는 내용이 달리 명백하게 지시하지 않는 한, 복수의 지시대상을 포함하는 것을 주의하여야 한다. 예를 들면, 용어 "프라이머"는 하나 이상의 프라이머, 즉, 한 개의 프라이머 및 여러 개의 프라이머를 지칭한다. 청구항은 임의의 선택적 요소를 배제하도록 작성될 수 있다는 것을 추가로 주의한다. 이와 같이, 이러한 설명은 청구항 요소의 열거와 관련하여 "오로지", "오직" 등으로서 이러한 배제적인 용어의 사용, 또는 "부정적인" 제한의 사용에 대하여 선행 근거를 제공함을 의도한다.
용어 "뉴클레오타이드"는 공지된 퓨린 및 피리미딘뿐만 아니라 변형된 다른 헤테로사이클릭 염기를 함유하는 이들 모이어티를 포함하는 것을 의도한다. 이러한 변형은 메틸화된 퓨린 또는 피리미딘, 아실화된 퓨린 또는 피리미딘, 알킬화된 리보스 또는 다른 헤테로사이클을 포함한다. 추가로, 용어 "뉴클레오타이드"는 합텐 또는 형광 표지를 함유하는 이들 모이어티를 포함하고, 통상적인 리보스 및 데옥시리보스 당뿐만 아니라 다른 당도 함유할 수 있다. 변형된 뉴클레오사이드 또는 뉴클레오타이드는 또한 에터, 아민 등으로 작용화된 당 모이어티 위의 변형을 포함하고, 예를 들면, 여기서 하나 이상의 하이드록실기는 수소 원자 또는 지방족기로 대체된다.
용어 "핵산" 및 "폴리뉴클레오타이드"는 본 명세서에서 임의의 길이의 중합체, 예를 들면, 약 2개 초과의 염기, 약 10개 초과의 염기, 약 100개 초과의 염기, 약 500개 초과의 염기, 1000개 초과의 염기, 최대 약 10,000개 이상의 염기로 구성된 뉴클레오타이드, 예를 들면, 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드를 설명하는데 상호교환적으로 사용되고, 효소적으로 또는 합성적으로(예를 들면, 미국 특허 제5,948,902호 및 그 안에 기재된 참조에 기재된 바와 같은 PNA) 제조될 수 있고, 이는 2개의 천연 발생 핵산의 것과 동일한 서열 특이적 방식으로 천연 발생 핵산과 혼성화될 수 있고, 예를 들면, 왓슨-크릭 염기쌍 상호작용에 참여할 수 있다. 천연 발생 뉴클레오타이드는 구아닌, 시토신, 아데닌, 티민, 유라실(각각 G, C, A, T 및 U)을 포함한다. DNA 및 RNA는 각각 데옥시리보스 및 리보스 당 골격을 갖는 반면, PNA의 골격은 펩티드 결합에 의해 연결된 반복되는 N-(2-아미노에틸)-글리신 단위로 구성된다. PNA에서 다양한 퓨린 및 피리미딘 염기는 메틸렌 카보닐 결합에 의해 골격에 연결된다. 접근 불가능한 RNA로도 종종 지칭되는 잠긴 핵산(LNA)은 변형된 RNA 뉴클레오타이드이다. LNA 뉴클레오타이드의 리보스 모이어티는 2' 산소 및 4' 탄소의 여분의 브릿지 연결에 의해 변형된다. 브릿지는 3'-엔도(North) 형태로 리보스를 "잠그고", 이는 종종 A-형 듀플렉스로 발견된다. LNA 뉴클레오타이드는 목적할 때마다 올리고뉴클레오타이드에서 DNA 또는 RNA 잔기와 혼합될 수 있다. 용어 "비구조화 핵산", 또는 "UNA"는 감소된 안정성으로 서로 결합된 비천연 뉴클레오타이드를 함유하는 핵산이다. 예를 들면, 비구조화 핵산은 G' 잔기 및 C' 잔기를 함유할 수 있고, 여기서 이들 잔기는 서로 감소된 안정성의 염기쌍인 G 및 C의 비천연 발생 형태, 즉, 유사체에 상응하지만 각각 천연 발생 C 및 G 잔기와의 염기쌍에 대한 능력을 보유한다. 비구조화 핵산은 UNA의 설명에 대하여 본 명세서에서 참조로서 포함된 제US20050233340호에 기재되어 있다.
본 명세서에서 사용되는 용어 "올리고뉴클레오타이드"는 길이가 약 2 내지 200개의 뉴클레오타이드, 500개의 뉴클레오타이드 이하인 뉴클레오타이드의 단일 가닥 다량체를 나타낸다. 올리고뉴클레오타이드는 합성일 수 있거나 효소적으로 만들어질 수 있고, 몇몇 실시형태에 있어서, 길이가 30 내지 150개의 뉴클레오타이드이다. 올리고뉴클레오타이드는 리보뉴클레오타이드 단량체(즉, 올리고리보뉴클레오타이드일 수 있음) 또는 데옥시리보뉴클레오타이드 단량체를 함유할 수 있다. 올리고뉴클레오타이드는, 예를 들면, 길이가 10 내지 20, 21 내지 30, 31 내지 40, 41 내지 50, 51 내지 60, 61 내지 70, 71 내지 80, 80 내지 100, 100 내지 150 또는 150 내지 200개의 뉴클레오타이드일 수 있다.
본 명세서에서 사용되는 용어 "프라이머"는 핵산 가닥에 상보적인 프라이머 연장 생성물의 합성이 유도되는 조건하에, 즉, 뉴클레오타이드 및 유도제, 예를 들면, DNA 중합효소의 존재하에 적합한 온도 및 pH에서 발생하는 경우, 합성의 개시점으로서 작용할 수 있는 올리고뉴클레오타이드를 의미한다. 프라이머는 단일 가닥일 수 있고, 유도제의 존재하에 목적하는 연장 생성물의 합성을 프라이밍하는데 충분한 길이여야 한다. 프라이머의 정확한 길이는 온도, 프라이머의 공급원 및 방법의 사용을 포함한 많은 인자에 따라 좌우될 것이다. 예를 들면, 진단 응용분야에 있어서, 표적 서열 또는 단편의 복합도에 따라, 올리고뉴클레오타이드 프라이머는 더 적은 뉴클레오타이드를 함유할 수 있음에도 불구하고 전형적으로 15 내지 25 이상의 뉴클레오타이드를 함유한다. 프라이머는 본 명세서에서 특정한 표적 DNA 서열의 상이한 가닥에 실질적으로 상보적인 것으로 선택된다. 이는 프라이머가 이들의 각각의 가닥과 혼성화되는데 충분하게 상보적이어야 한다는 것을 의미한다. 따라서, 프라이머 서열은 주형의 정확한 서열을 반영할 필요가 없다. 예를 들면, 비상보적 뉴클레오타이드 단편은 프라이머 서열의 나머지가 가닥에 상보적인 프라이머의 5' 말단에 부착될 수 있다. 대안적으로, 비상보적 염기 또는 더 긴 서열은 프라이머 내에 배치될 수 있고, 단 프라이머 서열은 이와 혼성화되고, 이로써 연장 생성물의 합성에 대한 주형을 형성하는 가닥의 서열과 충분히 상보성을 갖는다.
용어 "혼성화" 또는 "혼성화하다"는 제2 상보성 핵산 가닥과 정상적인 혼성화 조건하에 핵산 가닥이 어닐링하고 동형듀플렉스 또는 이형듀플렉스인 안정한 듀플렉스를 형성하고, 동일한 정상적인 혼성화 조건하에 관련이 없는 핵산 분자와 안정한 듀플렉스를 형성하지 않는 과정을 의미한다. 듀플렉스의 형성은 혼성화 반응에서 2개의 상보성 핵산 가닥을 어닐링함으로써 달성된다. 혼성화 반응은 혼성화 반응이 발생하는 혼성화 조건의 조절에 의해 매우 특이적으로 만들어질 수 있고(종종 혼성화 엄격함으로도 지칭됨), 따라서, 달리 2개의 핵산 가닥이 실질적으로 또는 완전하게 상보적인 특이적인 서열에서 특정한 수의 뉴클레오타이드를 함유하지 않는 한, 2개의 핵산 가닥 사이의 혼성화가 안정한 듀플렉스, 예를 들면, 정상 엄격한 조건하에 이중-가닥화의 영역을 보유하는 듀플렉스를 형성하지 않는다. "정상 혼성화 또는 정상 엄격한 조건"은 임의의 제공된 혼성화 반응에 대하여 용이하게 결정된다. 예를 들면, 문헌[Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York], 또는 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press]을 참조한다. 본 명세서에서 사용되는 용어 "혼성화함" 또는 "혼성화"는 핵산 가닥이 염기쌍 형성을 통해 상보적인 가닥과 결합하는 임의의 공정을 의미한다.
핵산은 2개의 서열이 중간 내지 매우 엄격한 혼성화 및 세척 조건하에 서로 특이적으로 혼성화하는 경우, 참조 핵산 서열에 "선택적으로 혼성화할 수 있는" 것으로 간주된다. 중간 내지 매우 엄격한 혼성화 조건은 공지되어 있다(예를 들면, 문헌[Ausubel, et al., Short Protocols in Molecular Biology, 3rd ed., Wiley & Sons 1995] 및 [Sambrook et al., Molecular Cloning: A Laboratory Manual, 제3 Edition, 2001 Cold Spring Harbor, N.Y.] 참조). 매우 엄격한 조건의 하나의 예는 약 42C에서 50% 폼아마이드, 5X SSC, 5X 덴하르트 용액, 0.5% SDS 및 100 ug/ml 변성된 캐리어 DNA 중에서 혼성화 후, 2X SSC 및 0.5% SDS 중에서 실온에서 2회 및 0.1 X SSC 및 0.5% SDS 중에서 42℃에서 추가의 횟수의 세척을 포함한다.
본 명세서에서 사용되는 용어 "바코드 서열" 또는 "분자 바코드"는 a) 반응에서 폴리뉴클레오타이드의 공급원을 식별 및/또는 추적하고/하거나, b) 초기 분자가 몇회 서열결정되는지 계수(예를 들면, 샘플 중의 실질적으로 모든 분자가 상이한 서열로 태깅된 다음, 샘플이 증폭되는 경우)하는데 사용되는 뉴클레오타이드의 고유한 서열을 의미한다. 바코드 서열은 5'-말단, 3'-말단 또는 올리고뉴클레오타이드의 중간에 있을 수 있다. 바코드 서열은 크기와 조성이 매우 다양할 수 있고; 하기 참조는 특정한 실시형태에 적절한 바코드 서열의 세트를 선택하는데 지침을 제공한다: 문헌[Casbon(Nuc. Acids Res. 2011, 22 e81)], 미국 특허 제5,635,400호(Brenner); 문헌[Brenner et al, Proc. Natl. Acad. Sci., 97: 1665-1670(2000)]; 문헌[Shoemaker et al, Nature Genetics, 14: 450-456(1996)]; 문헌[Morris et al, European patent publication 0799897A1]; 미국 특허 제5,981,179호(Wallace) 등. 특정한 실시형태에서, 바코드 서열은 4 내지 36개의 뉴클레오타이드, 또는 6 내지 30개의 뉴클레오타이드, 또는 8 내지 20개의 뉴클레오타이드 범위의 길이를 가질 수 있다.
용어 "서열결정"은 폴리뉴클레오타이드의 적어도 10개의 연속적인 뉴클레오타이드의 식별(예를 들면, 적어도 20, 적어도 50, 적어도 100 또는 적어도 200개 이상의 연속적인 뉴클레오타이드의 식별)이 수득되는 방법을 의미한다.
용어 "차세대 서열결정"은, 예를 들면, 일루미나(Illumina), 라이프 테크놀로지스(Life Technologies), 및 로슈(Roche) 등에 의해 현재 이용되는 소위 평행한 합성을 통한 서열결정(sequencing-by-synthesis) 또는 결찰을 통한 서열결정(sequencing-by-ligation) 플랫폼을 의미한다. 차세대 서열결정 방법은 또한 나노포어 서열결정 방법 또는 전자-검출 기반의 방법, 예를 들면, 라이프 테크놀로지스에 의해 상품화된 이온 토렌트(Ion Torrent) 기술을 포함할 수 있다.
본 명세서에서 사용되는 용어 "듀플렉스," 또는 "듀플렉스화된"은 염기쌍 형성된, 즉, 함께 혼성화된 2개의 상보성 폴리뉴클레오타이드를 나타낸다.
용어 "결정", "측정", "평가", "사정", "검정", 및 "분석"은 본 명세서에서 상호교환적으로 사용되어 측정 형태를 의미하고, 요소가 존재하거나 존재하지 않는지의 여부를 결정하는 것을 포함한다. 이들 용어는 정량적 및/또는 정성적 측정을 포함한다. 평가는 상대적이거나 절대적일 수 있다.
본 명세서에서 사용되는 용어 "친화성 태그"는 친화성 태그가 부착된 분자를 친화성 태그를 함유하지 않은 다른 분자로부터 분리하는데 사용될 수 있는 잔기를 의미한다. "친화성 태그"는 특이적 결합 쌍, 즉, 하나의 분자라 다른 분자에 화학적 또는 물리적 수단을 통해 특이적으로 결합하는 2개의 분자의 구성원이다. "포획제(capture agent)"라고 본 명세서에서 지칭되는 특이적 결합 쌍의 상보적 구성원은 (예를 들면, 크로마토그래피 지지체, 비드 또는 평평한 표면에) 고정화되어 친화성 태그에 특이적으로 결합하는 친화성 크로마토그래피 지지체를 제조한다. 다시 말해서, "친화성 태그"는 "포획제"에 결합될 수 있고, 여기서 친화성 태그는 포획제에 특이적으로 결합하고, 이로써 친화성 태그를 함유하지 않은 다른 분자로부터 친화성 태그가 부착된 분자를 분리하는 것을 촉진한다.
본 명세서에서 사용되는 용어 "바이오틴 모이어티"는 바이오틴 또는 바이오틴 유사체, 예를 들면, 데스티오바이오틴, 옥시바이오틴, 2'-이미노바이오틴, 디아미노바이오틴, 바이오틴 설폭사이드, 바이오시틴 등을 포함하는 친화성 제제를 의미한다. 바이오틴 모이어티는 적어도 10-8M의 친화성으로 스트렙타비딘에 결합한다. 바이오틴 친화성 제제는 또한 링커, 예를 들면, -LC-바이오틴, -LC-LC-바이오틴, -SLC-바이오틴 또는 -PEGn-바이오틴을 포함할 수 있고, 여기서 n은 3 내지 12이다.
본 명세서에서 사용되는 용어 "말단 뉴클레오타이드"는 핵산 분자의 5' 또는 3' 말단의 뉴클레오타이드를 의미한다. 핵산 분자는 이중 가닥 형태(즉, 듀플렉스화된) 또는 단일 가닥 형태일 수 있다.
본 명세서에서 사용되는 용어 "결찰"은 제1 DNA 분자의 5' 말단의 말단 뉴클레오타이드를 제2 DNA 분자의 3' 말단의 말단 뉴클레오타이드에 효소적으로 촉진된 결합을 의미한다.
용어 "복수", "세트" 및 "집단"은 상호 교환적으로 사용되어 적어도 2개의 구성원을 함유하는 어떤 것을 의미한다. 특정한 경우, 복수는 적어도 10, 적어도 100, 적어도 100, 적어도 10,000, 적어도 100,000, 적어도 106, 적어도 107, 적어도 108 또는 적어도 109 또는 그 이상의 구성원을 가질 수 있다.
용어 "소화"는 핵산이 제한 효소에 의해 절단되는 공정을 지시하는 것을 의도한다. 핵산을 소화하기 위하여, 제한 효소 및 제한 효소에 대한 인식 부위를 함유한 핵산은 제한 효소가 작동하는데 적합한 조건하에 접촉된다. 상업적으로 이용 가능한 제한 효소의 활성에 적합한 조건은 공지되어 있고, 구입 시 이들 효소와 함께 제공된다.
"올리고뉴클레오타이드 결합 부위"는 표적 폴리뉴클레오타이드 또는 단편에서 올리고뉴클레오타이드가 혼성화되는 부위를 의미한다. 올리고뉴클레오타이드가 프라이머에 대한 결합 부위를 "제공하는" 경우, 프라이머는 그 올리고뉴클레오타이드 또는 이의 상보물에 혼성화될 수 있다.
본 명세서에서 사용되는 용어 "분리"는 두 요소의 (예를 들면, 크기 또는 친화성 등에 의한) 물리적 분리뿐만 아니라 하나의 요소를 분해하여 다른 것을 온전히 남기는 것을 의미한다.
본 명세서에서 사용되는 용어 "참조 염색체 영역"은 공지된 뉴클레오타이드 서열의 염색체 영역, 예를 들면, 서열이 NCBI의 진뱅크(Genbank) 데이터베이스 또는 다른 데이터베이스에 수탁된 염색체 영역을 의미한다.
본 명세서에서 사용되는 용어 "가닥"은 공유 결합, 예를 들면, 포스포다이에스터 결합에 의해 함께 공유적으로 연결된 뉴클레오타이드로 만들어진 핵산을 의미한다.
세포에서, DNA는 일반적으로 이중 가닥 형태로 존재하고, 이와 같이, 본 명세서에서 "상부(top)" 및 "하부(bottom)" 가닥으로 지칭되는 핵산의 2개의 상보성 가닥을 갖는다. 특정한 경우, 염색체 영역의 상보성 가닥은 "플러스" 및 "마이너스" 가닥, "제1" 및 "제2" 가닥, "코딩" 및 "비코딩" 가닥, "왓슨" 및 "크릭" 가닥 또는 "센스" 및 "안티센스" 가닥으로 지칭될 수 있다. 하나의 가닥의 상부 또는 하부 가닥으로서의 배정은 임의적이고, 임의의 특정한 방향, 기능 또는 구조를 암시하지 않는다. 몇몇 예시적인 포유동물 염색체 영역의 제1 가닥의 뉴클레오타이드 서열(예를 들면, BAC, 어셈블리, 염색체 등)이 공지되어 있고, 예를 들면, NCBI의 진뱅크 데이터베이스에서 찾을 수 있다.
본 명세서에서 사용되는 용어 "상부 가닥"은 핵산 두 가닥 모두가 아닌 하나의 핵산 가닥을 의미한다. 올리고뉴클레오타이드 또는 프라이머가 "상부 가닥에만" 결합하거나 어닐링하는 경우, 이는 한 가닥에만 결합하고 다른 것에는 결합하지 않는다. 본 명세서에서 사용되는 용어 "하부 가닥"은 "상부 가닥"에 상보적인 가닥을 의미한다. 올리고뉴클레오타이드가 "하나의 가닥에만" 결합하거나 어닐링하는 경우, 이는 하나의 가닥에만 결합하고, 예를 들면, 제1 또는 제2 가닥에 결합하고 다른 것에는 결합하지만 않는다.
용어 "공유적 연결"은 2개의 분리된 분자 사이, 예를 들면, 이중 가닥의 핵산의 상부 및 하부 가닥 사이의 공유 결합의 생성을 의미한다. 결찰은 공유적 연결의 한 유형이다.
본 명세서에서 사용되는 용어 "변성"은 적합한 변성 조건에 듀플렉스를 놓음으로써 핵산 듀플렉스의 염기쌍의 적어도 일부분의 분리를 의미한다. 변성 조건은 당해 분야에 잘 공지되어 있다. 하나의 실시형태에 있어서, 핵산 듀플렉스를 변성시키기 위하여, 듀플렉스의 용융 온도를 초과하는 온도에 듀플렉스를 노출시키고, 이로써 듀플렉스의 한 가닥을 다른 것으로부터 방출시킬 수 있다. 특정한 실시형태에 있어서, 핵산은 적어도 90℃의 온도에 적합한 시간의 양(예를 들면, 적어도 30초, 30분 이하) 동안 노출함으로써 변성될 수 있다. 핵산은 또한 화학적으로(예를 들면, 우레아 또는 NaOH를 사용하여) 변성될 수 있다.
본 명세서에서 사용되는 용어 "표지"은 검출 가능한(바람직하게는 정량 가능한) 효과를 제공하는데 사용될 수 있고, 핵산 또는 단백질에 부착될 수 있는 임의의 원자 또는 분자를 의미한다. 표지는 염료 및 방사성표지, 예를 들면, 32P; 결합 모이어티, 예를 들면, 바이오틴; 합텐, 예를 들면, 디곡시게닌; 발광, 인광 또는 형광 모이어티; 및 단독, 또는 형광 공명 에너지 전이(FRET)에 의한 방출 스펙트럼을 억제하거나 이동시킬 수 있는 모이어티와 조합으로서의 형광 염료를 포함하지만 이에 한정되지 않는다. 표지는 형광성, 방사성활성, 비색법, 중량법, X선 회절 또는 흡수, 자성, 효소 활성 등에 의해 검출 가능한 신호를 제공할 수 있다. 표지는 하전된 모이어티(양 또는 음 전하)일 수 있거나, 대안적으로, 중성 전하일 수 있다. 표지는 서열 포함 표지가 검출 가능한 것이라면 핵산 또는 단백질 서열을 포함하거나 이로 구성될 수 있다.
본 명세서에서 사용되는 용어 "표지된 올리고뉴클레오타이드" 및 "표지된 프로브"는 친화성 태그(예를 들면, 바이오틴 모이어티)를 갖는 올리고뉴클레오타이드, 분리 또는 검출이 가능한 원자 또는 그룹(예를 들면, 브로모-데옥시유리딘, 또는 상이한 밀도를 부여하는 콜로이드성 금 입자)에 의해 변형된 올리고뉴클레오타이드, 및 광학적으로 검출 가능한 표지(예를 들면, 형광 또는 다른 유형의 발광 표지)에 의해 변형된 올리고뉴클레오타이드를 의미한다. 오직 천연 발생 뉴클레오타이드만을 함유한 올리고뉴클레오타이드는 표지된 올리고뉴클레오타이드가 아니다.
본 명세서에서 사용되는 용어 "연장"은 중합효소를 사용하는 뉴클레오타이드의 첨가에 의한 프라이머의 연장을 의미한다. 핵산에 어닐링되는 프라이머가 연장되는 경우, 핵산은 연장 반응에 대한 주형으로서 작용한다.
"제1 및 제2 올리고뉴클레오타이드를 단편의 각각의 말단에 결찰시킴"이라는 구에서 본 명세서에서 사용되는 용어 "각각의 말단"은 하나의 올리고뉴클레오타이드가 단편의 하나의 말단에 첨가되고, 또 다른 올리고뉴클레오타이드는 표적 단편의 다른 말단에 첨가되는 것을 의미하는 것을 의도한다.
서로 결찰에 의해 인접한 2개의 올리고뉴클레오타이드 서열의 문맥에서 본 명세서에서 사용되는 용어 "결찰을 통해 인접한"은 2개의 올리고뉴클레오타이드 사이에 개입된 뉴클레오타이드가 존재하지 않고 이들이 서로 결찰될 수 있는 것을 의미한다.
본 명세서에서 사용되는 용어 "스플린트 올리고뉴클레오타이드"는 도 1에 도시된 바와 같이, 2개 이상의 다른 폴리뉴클레오타이드에 혼성화되는 경우, 서로 바로 옆에 있는 폴리뉴클레오타이드 위치에 "스플린트"로서 작용하는 올리고뉴클레오타이드를 의미한다.
본 명세서에서 사용되는 용어 "환형 핵산 분자"는 자유 3' 또는 5' 말단을 갖지 않는 폐쇄된 환의 형태인 가닥을 의미한다.
본 명세서에서 사용되는 용어 "상응하는" 및 문법적 등가물, 예를 들면, "상응함"은 용어가 지칭하는 요소 사이의 특이적인 관계를 의미한다. 예를 들면, 게놈 중의 서열에 상응하는 RCA는 게놈 중의 서열과 동일한 뉴클레오타이드 서열을 함유한다.
본 명세서에 기재된 특정한 폴리뉴클레오타이드는 식(예를 들면, "X'-A'-B'-Z'")에 의해 지칭될 수 있다. 달리 지시되지 않는 한, 식에 의해 정의된 폴리뉴클레오타이드는 5'로부터 3'으로의 방향 또는 5'로부터 3'으로의 방향을 지향할 수 있다. 예를 들면, 식 "X'-A'-B'-Z'"에 의해 정의된 폴리뉴클레오타이드는 "5'-X'-A'-B'-Z'-3'" 또는 "3'-X'-A'-B'-Z'-5'"일 수 있다. 식의 성분, 예를 들면, "A", "X" 및 "B" 등은 폴리뉴클레오타이드 사이의 뉴클레오타이드의 개별적으로 정의 가능한 서열을 의미하고, 여기서 맥락으로부터 암시되지 않는 한(예를 들면, 특정한 식의 "결찰 가능한" 복합체의 경우), 서열은 식에 의해 기재된 폴리뉴클레오타이드가 단일 분자가 되도록 함께 공유적으로 연결된다. 많은 경우, 식의 성분은 단일 분자에서 서로 바로 인접해 있다. 통상적으로, 식에서 나타낸 서열의 상보체는 서열 "A"의 상보체가 "A'"가 되도록 프라임(')으로 지시될 것이다. 게다가, 문맥에서 달리 지시되거나 암시되지 않는 한, 식에 의해 정의된 폴리뉴클레오타이드는 이의 3' 말단, 이의 5' 말단 또는 3' 및 5' 말단 둘 다에 추가의 서열, 프라이머 결합 부위, 분자 바코드, 프로모터, 또는 스페이서 등을 가질 수 있다. 식에 의해 정의된 폴리뉴클레오타이드가 환형인 것으로 기재되는 경우, 이들 분자의 말단은 직접적으로 또는 간접적으로 함께 결합한다. 예를 들면, 식 X-A-B-Z-Y의 환형 복합체의 경우, 분자의 5' 말단은 분자의 3' 말단에 직접적으로 또는 간접적으로 결합되어 환을 생성한다. 명백하게도, 폴리뉴클레오타이드의 다양한 성분 서열(예를 들면, A, B, C, X, Y, Z, 등)은 독립적으로, 이들이 목적하는 기능(예를 들면, 또 다른 서열에 혼성화)을 수행할 수 있는 한, 임의의 목적하는 길이일 것이다. 예를 들면, 폴리뉴클레오타이드의 다양한 성분 서열은 독립적으로 8 내지 80개의 뉴클레오타이드, 예를 들면, 10 내지 50개의 뉴클레오타이드 또는 12 내지 30개의 뉴클레오타이드 범위의 길이를 가질 수 있다.
용어 "결찰 가능한 복합체", 예를 들면, 도 1에 도시된 바와 같이, 식 X-A-B-Z의 것은 다양한 올리고뉴클레오타이드가 서로(환형 또는 선형 형태의) 결찰을 통해 인접하고, 스플린트 올리고뉴클레오타이드에 의해 함께 유지된 복합체를 의미한다.
용어 "결찰 가능한 환형 복합체", 예를 들면, 식 X-A-B-Z-Y의 것은 다양한 올리고뉴클레오타이드가 서로 환형으로 결찰을 통해 인접하고, 스플린트 올리고뉴클레오타이드에 의해 함께 유지된 환형 복합체를 의미한다.
본 명세서에서 사용되는 용어 "좌위" 및 "게놈 좌위"는 게놈, 예를 들면, 동물 또는 식물 게놈, 예를 들면, 인간, 원숭이, 래트, 어류 또는 곤충 또는 식물의 게놈의 정의된 영역을 의미한다. 좌위는 100 kb만큼 ?裏? 염색체의 영역일 수 있고, 염색체 팔(arm) 또는 전체 염색체만큼 길 수 있다.
용어 "제1 좌위" 및 "제2 좌위"는 상이한 좌위, 즉, 게놈의 상이한 영역, 예를 들면, 상이한 염색체 팔 또는 상이한 염색체를 의미한다.
용어 "좌위의 단편"은 특정한 좌위의 정의된 단편의 집단(제한 효소를 사용하거나, CAS9와 같은 RNA-안내된 엔도뉴클레아제를 재프로그래밍함으로써 제조될 수 있음)을 의미한다. 좌위의 모든 단편이 분석될 필요는 없다. 다양한 게놈의 서열이 공개되었기 때문에, 좌위의 단편에 혼성화되는 올리고뉴클레오타이드의 디자인은 정례화되어 있다.
용어 "단편에 상보적인"은 단편의 가닥(상부 또는 하부 가닥)에 상보적인 서열을 의미한다.
본 명세서에서 사용되는 용어 "게놈 서열"은 게놈 중에 발생하는 서열을 의미한다.
가변적인 2개 이상의 핵산 서열의 맥락에서 용어 "가변적"(variable)은 서로 뉴클레오타이드의 상이한 서열을 갖는 둘 이상의 핵산을 의미한다. 다시 말해서, 집단의 폴리뉴클레오타이드가 가변적 서열을 갖거나 특정한 서열이 "다양한" 경우, 집단의 폴리뉴클레오타이드 분자의 뉴클레오타이드 서열은 분자 간에 다양하다. 용어 "가변적"은 집단의 모든 분자가 집단의 다른 분자와 상이한 서열을 갖는 것이 요구되는 것으로 읽혀서는 안 된다.
2개의 핵산(예를 들면, 서열 A 및 A')이 "상보적인" 경우, 이들은 엄격한 조건하에 서로 혼성화된다. 많은 경우, 상보적인 2개의 서열은 상보성의 적어도 10, 예를 들면, 적어도 12, 적어도 15, 적어도 20 또는 적어도 25개의 뉴클레오타이드를 갖고, 특정한 경우, 1, 2 또는 3개의 비상보성 염기를 가질 수 있다.
좌위를 식별하는 서열의 맥락에서 용어 "식별하다"는 분자 바코드가 좌위에 고유한 것을 의미한다. 이러한 서열은 좌위 그 자신으로부터 유래된 것이 아니고, 분석되는 좌위의 단편에 첨가되고 좌위로 이루어진 군으로부터 선택된 것인 이들 단편을 식별하는, 일반적으로 분석되는 샘플 중에 존재하지 않는 서열을 갖는, 분자 바코드이다. 예를 들면, 제1 좌위로부터의 단편이 제1 식별자 서열에 결찰되고, 제2 좌위로부터의 단편이 제2 식별자 서열에 결찰되는 경우, 이들 단편의 공급원(이들에 상응하는 좌위)은 이들 단편에 결찰된 식별자 서열을 검출함으로써 결정될 수 있다.
역전된 방향으로 다른 서열에 혼성화되는 2개의 서열의 맥락에서 용어 "역전된 방향"은 도 3B의 상부에 설명되는 바와 같이 말단이 서로 마주하는 방식으로 하나의 서열의 5' 및 3' 말단이 다른 것에 혼성화되는 구조를 의미한다.
본 명세서에서 사용되는 용어 "회전환 증폭" 또는 요약해서 "RCA"는 가닥-치환 중합효소를 사용하는 환형 핵산 주형의 선형 연쇄 복제를 생성하는 등온선 증폭을 의미한다. RCA는 분자 생물학 분야에 잘 공지되어 있고, 본 명세서에 참조로서 포함되는 문헌[Lizardi et al(Nat. Genet. 1998 19:225-232)], [Schweitzer et al(Proc. Natl. Acad. Sci. 2000 97:10113-10119)], [Wiltshire et al(Clin. Chem. 2000 46:1990-1993)] 및 [Schweitzer et al(Curr. Opin. Biotech 2001 12:21-27)]을 포함하지만 이에 한정되지 않는 다양한 문헌에 기재되어 있다.
본 명세서에서 사용되는 용어 "회전환 증폭 산물"은 회전환 증폭 반응의 연쇄 생성물을 의미한다. 본 명세서에서 사용되는 용어 "형광 표지된 회전환 증폭 산물"은, 예를 들면, 형광 표지된 올리고뉴클레오타이드를 회전환 증폭 산물에 혼성화하거나, 다른 수단에 의해(예를 들면, 형광 뉴클레오타이드를 증폭 동안 생성물 내에 혼입함으로써) 형광 표지된 회전환 증폭 산물을 의미한다.
지지체 영역 또는 이미지 영역의 맥락에서 본 명세서에서 사용되는 용어 "영역"은 인접 또는 비인접 영역을 의미한다. 예를 들면, 방법이 영역 내의 표지된 RCA 산물의 수를 계수하는 것을 포함하는 경우, RCA 산물이 계수되는 영역은 단일, 인접 공간 또는 다중 비인접 공간일 수 있다.
본 명세서에서 사용되는 용어 "이미징"은 대상의 표면으로부터의 광학 신호를 검출하고 위치와 연관된 데이터(즉, "픽셀")로서 저장하는 공정을 의미한다. 대상의 디지털 이미지는 이 데이터로부터 재구성될 수 있다. 지지체의 영역은 단일 이미지 또는 하나 이상의 이미지를 사용하여 이미징될 수 있다.
본 명세서에서 사용되는 용어 "개별적인 표지된 RCA 산물"은 표지된 개별적인 RCA 분자를 의미한다.
본 명세서에서 사용되는 용어 "계수"는 더 큰 수집물에서 개별적인 대상의 수를 측정하는 것을 의미한다. "계수"는 (복수의 대상으로부터의 공통의 신호가 아닌) 복수의 개별적인 대상으로부터의 개별적인 신호를 검출하고, 개별적인 신호를 계수함으로써 복수의 얼마나 많은 대상이 존재하는지를 측정하는 것을 필요로 한다. 본 발명의 방법의 맥락에서, "계수"는 신호의 어레이에서 개별적인 신호의 수를 측정함으로써 수행된다.
RCA 산물의 어레이에 관하여 본 명세서에서 사용되는 용어 "어레이"는 평평한 표면 위의 단일 RCA 산물의 수집물을 의미하고, 여기서 RCA 산물은 표면의 면 위에서 (어레이가 진정 무작위인 경우, 푸아송 분포에 의해 허용되는 정도로) 서로 공간적으로 분리되어 있다. "무작위" 어레이는 요소, 예를 들면, RCA 산물이 미리 결정되지 않은 위치에서 기질의 표면 위에 분포하는 어레이이다. 일부 경우, 무작위 어레이 위의 RCA 산물의 분포는 예를 들면, 무작위 어레이의 RCA 산물 사이의 거리 분포가 푸아송 분포에 의해 근사치에 접근하도록 푸아송 통계에 의해 기재될 수 있다.
용어의 다른 정의가 명세서 전체에서 나타날 수 있다.
예시적인 실시형태의 설명
다양한 실시형태를 설명하기 전에, 본 개시내용의 교시는 기재된 특정한 실시형태로 제한되지 않으며, 물론, 이와 같이 다양할 수 있다는 것이 이해된다. 또한, 본 발명의 교시의 범위는 첨부된 청구범위에 의해서만 제한될 것이기 때문에, 본 명세서에서 사용된 용어는 특정한 실시형태만을 설명하기 위한 목적을 위한 것이고 제한되는 것을 의도하지 않는다는 것이 이해된다.
본 명세서에 사용된 섹션 제목은 오직 조직화 목적을 위한 것이고 기재된 대상물을 어떠한 방식으로도 제한하는 것으로 해석되지 않는다. 본 발명의 교시가 다양한 실시형태와 함께 기재되지만, 본 발명의 교시는 이러한 실시형태로 제한되는 것을 의도하지 않는다. 대조적으로, 본 발명의 교시는 당해 분야의 숙련가에게 명백할 것인 다양한 대체물, 변형물, 및 등가물을 포함한다.
달리 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어는 본 개시내용이 속한 분야의 숙련가에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 본 명세서에 기재된 것들과 유사하거나 동일한 임의의 방법 및 물질이 또한 본 발명의 교시의 실시 또는 시험에서 사용될 수 있음에도 불구하고, 몇몇 예시적인 방법 및 물질이 이제 설명된다.
임의의 문헌의 인용은 제출일 전에 이의 기재내용에 대한 것이고, 본 발명의 청구범위가 선행 발명 때문에 이러한 문헌을 선행하는 자격을 갖지 않는다는 인정으로서 해석되어서는 안 된다. 추가로, 제공된 공개 일자는 독립적으로 확인될 수 있는 실제 공개 일자와 상이할 수 있다.
본 개시내용을 읽은 당해 분야의 숙련가에게 명백하게도, 본 명세서에 기재되고 설명된 각각의 개별적인 실시형태는 본 발명의 교시의 범위 또는 취지를 벗어나지 않고 임의의 다른 몇몇 실시형태의 특징과 용이하게 분리되거나 조합될 수 있는 개별적인 구성분 및 특징을 갖는다. 임의의 기재된 방법은 기재된 사건 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.
본 명세서에 언급된 모든 특허 및 문헌은 이러한 특허 및 문헌 내에 기재된 모든 서열을 포함하여 참조로서 명백하게 포함된다.
프로브 조성물
프로브 시스템의 몇몇 실시형태는 (a) 서열 B의 식별자 올리고뉴클레오타이드의 세트; (b) 식 X'-A'-B'-Z'의 스플린트 올리고뉴클레오타이드의 세트로서, 여기서, 세트 내에서: (i) 서열 A' 및 B'는 다양하고, (ii) 서열 X' 및 Z'는 서로 상이하며, 가변적이지 않고; 각각의 스플린트 올리고뉴클레오타이드 내에서: (i) 서열 A'는 핵산 샘플의 게놈 단편에 상보적이고, (ii) 서열 B'는 식별자 올리고뉴클레오타이드의 세트의 적어도 하나의 구성원에 상보적인, 상기 스플린트 올리고뉴클레오타이드의 세트; 및 (c) X 및 Z를 포함하는 하나 이상의 프로브 서열로서, 서열 X 및 Z가 가변적이지 않고, 서열 X' 및 Z'에 혼성화되는, 상기 하나 이상의 프로브 서열을 포함할 수 있되; 여기서 각각의 스플린트 올리고뉴클레오타이드는 (i) 프로브 서열, (ii) 식별자 올리고뉴클레오타이드의 세트의 구성원 및 (iii) 게놈 단편에 혼성화될 수 있고, 이로써 식 X-A-B-Z의 결찰 가능한 복합체를 생성한다. 하기 더욱 상세하게 설명될 것인 바와 같이, 상이한 식별자 올리고뉴클레오타이드 및 이들의 상보성 서열 B'는 상이한 염색체, 예를 들면, 염색체 21, 18 및 13을 식별한다.
도 1은 식 X-A-B-Z의 결찰 가능한 복합체를 나타내고, 이의 구조는 본 발명의 프로브 시스템을 특징으로 한다. 도 1에 도시된 바와 같이, 복합체에서 서열 X, A, B 및 Z는 서로 결찰을 통해 인접하고, 스플린트 올리고뉴클레오타이드에 의해 위치가 유지된다. 도 1에 기재된 바와 같이, 서열 A는 게놈의 표적 단편(예를 들면, 제한 단편의 가닥)이고, 서열 B는 이로부터 인접한 서열 A가 유래되는 좌위(예를 들면, 염색체 위의 특정한 영역, 특정한 염색체 팔 또는 특정한 염색체 등)을 식별한다. 서열 A와 B 사이의 관계는 도 2에 설명되고, 이는 다양한 게놈 단편(A1 내지 A6)에 혼성화된 단순한 프로브 세트를 설명한다. 도 2에 도시된 바와 같이, (서열 A1, A2, 및 A3의) 상부 3개의 복합체의 게놈 단편은 제1 좌위(예를 들면, 염색체 21)로부터의 것이고, (서열 A4, A5, 및 A6의) 하부 3개의 복합체의 게놈 단편은 제2 좌위(예를 들면, 염색체 18)로부터의 것이다. 상부 3개의 복합체의 게놈 단편이 유래되는 좌위는 단일 서열(B1)에 의해 식별되고, 하부 3개의 복합체의 게놈 단편이 유래되는 좌위는 상이한 서열(B2)에 의해 식별된다. 서열 X 및 Z는 모든 예시된 복합체에서 동일하다.
명백하게도, 스플린트 올리고뉴클레오타이드의 세트는 목적하는 바와 같이 복합체일 수 있고, 몇몇 실시형태에 있어서, 서열 A'는 적어도 100, 적어도 1,000, 적어도 5,000, 적어도 10,000 또는 적어도 50,000 이상의 복합도를 가질 수 있고, 이는 스플린트 올리고뉴클레오타이드가, 집합적으로, 게놈 DNA의 적어도 100, 적어도 1,000, 적어도 5,000, 적어도 10,000 또는 적어도 50,000 이상의 단편에 혼성화될 수 있다는 것을 의미한다. 스플린트 올리고뉴클레오타이드의 세트에서 서열 B'는 좌위 식별자로서 단순하게 제공되기 때문에 훨씬 덜 다양할 수 있다. 이와 같이, 스플린트 올리고뉴클레오타이드의 세트에서, 서열 B'가 몇몇 실시에 있어서 적어도 10, 적어도 100 또는 적어도 1000의 복합도를 가질 수 있음에도 불구하고, 서열 B'는 적어도 2, 예를 들면, 3 또는 4의 복합도를 가질 수 있다. 명백하게도, 서열 B'가 서열 B에 상보적이기 때문에, 좌위-특이적 올리고뉴클레오타이드의 세트의 복합도는 서열 B'의 복합도와 동일할 수 있다. 예를 들면, 3개의 식별자 올리고뉴클레오타이드가 존재하는 경우, 3개의 상이한 B' 서열이 존재할 수 있다. 세트에서 스플린트 올리고뉴클레오타이드의 수는 좌위의 길이 및 표적 단편의 수에 따라 크게 다양할 수 있다. 몇몇 실시형태에 있어서, 스플린트 올리고뉴클레오타이드의 각각의 세트는 적어도 10, 적어도 50, 적어도 100, 적어도 500, 적어도 1,000, 적어도 5,000, 적어도 10,000 또는 적어도 50,000 상이한 스플린트 올리고뉴클레오타이드를 함유할 수 있다.
예를 들면, 몇몇 실시형태에 있어서, 스플린트 올리고뉴클레오타이드의 세트는 하기를 함유할 수 있다: (i) 제1 좌위의 상이한 단편(예를 들면, 염색체 21의 단편 또는, 예를 들면, A1,X의 세트, x=1-100+)에 상보적인, 최소 100 A' 서열을 함유하는 스플린트 올리고뉴클레오타이드의 제1 하위-집단, 예를 들면, A1, X'의 세트, x=1-100+, 여기서 스플린트 올리고뉴클레오타이드의 각각의 이러한 하위-집단은 동일한 B' 서열, 예를 들면, B1'을 갖고; (ii) 제2 좌위의 상이한 단편(예를 들면, 염색체 18의 단편 또는 예를 들면, A2 X의 세트, x=1-100+)에 상보적인, 최소 100 A' 서열을 함유하는 스플린트 올리고뉴클레오타이드의 제2 하위-집단, 예를 들면, A2, X'의 세트, x=1-100+, 여기서 스플린트 올리고뉴클레오타이드의 각각의 이러한 하위-집단은 동일한 B' 서열, 예를 들면, B2'를 갖고, 이는 제1(또는 임의의 다른) 하위집단의 B' 서열과 상이하고; (iii) 제3 좌위의 상이한 단편(예를 들면, 염색체 18의 단편 또는, 예를 들면, A3 X의 세트, x=1-100+)에 상보적인, 최소 100 A' 서열을 함유하는 스플린트 올리고뉴클레오타이드의 제3 하위-집단, 예를 들면, A3,X'의 세트, x=1-100+, 여기서 스플린트 올리고뉴클레오타이드의 각각의 이러한 하위-집단은 동일한 B' 서열, 예를 들면, B3'를 갖고, 이는 임의의 다른 하위집단의 B' 서열과 상이하고; (iv) 제4 좌위의 상이한 단편(예를 들면, 또 다른 염색체의 단편 또는, 예를 들면, A4, X의 세트, x=1-100+)에 상보적인, 최소 100 A' 서열을 함유하는 스플린트 올리고뉴클레오타이드의 임의의 제4 하위-집단, 예를 들면, A4 X'의 세트, x=1-100+, 여기서 스플린트 올리고뉴클레오타이드의 각각의 이러한 하위-집단은 B' 서열, 예를 들면, B4'를 갖고, 이는 임의의 다른 하위집단의 B' 서열과 상이하다.
도 3에 도시된 바와 같이, 프로브 시스템은 이것이 어떻게 사용될 것인지에 따라 다양한 상이한 방식으로 구성될 수 있다. 예를 들면, 도 3A, C 및 D에 도시된 바와 같이, 서열 X 및 Z는 상이한 분자 중에 있을 수 있고, 그 결과, 결찰 가능한 복합체는 선형이다. 이들 실시형태에 있어서, 서열 X 및 Y를 함유하는 하나 이상의 프로브는 서열 X를 포함하는 제1 올리고뉴클레오타이드 및 서열 Y를 포함하는 제2 올리고뉴클레오타이드를 포함할 수 있다. 이들 실시형태에 있어서, 제1 및 제2 올리고뉴클레오타이드는 도 1A에 도시된 바와 같이 꼬리가 있을 필요는 없다. 이들 실시형태에 있어서, 결찰 후, 결찰 생성물은, 예를 들면, 서열 X 및 Z에 혼성화되는 논의된 PCR 프라이머를 사용하여 증폭될 수 있다. 몇몇 실시형태(도 3C 및 D에 도시된 바와 같음)에 있어서, 제1 및/또는 제2 올리고뉴클레오타이드는 그 자신이 꼬리르 가져 프라이머 결합 부위를 제공하여 증폭 및 계수를 촉진할 수 있다. 몇몇 실시형태에 있어서, 꼬리는 원래 결찰 생성물의 수를 이들 분자가 증폭되고 서열결정된 후에 계수할 수 있도록 하는 분자 인덱서(예를 들면, 무작위 서열)을 가질 수 있다. 대안적인 실시형태에 있어서, 도 3B에 도시된 바와 같이, 서열 X 및 Y를 함유하는 하나 이상의 프로브는 식 X-Y-Z의 단일 골격 프로브일 수 있다. 이들 실시형태에 있어서, 도시되는 바와 같이, 결찰 가능한 복합체는 식 X-A-B-Z-Y의 환형 결찰 가능한 복합체이고, 여기서 서열 Y는 서열 X 및 Z에 결합한다. 도 3E에 도시된 또 다른 실시형태에 있어서, 서열 X 및 Z를 함유하는 하나 이상의 프로브는 스플린트 올리고뉴클레오타이드 그 자신의 부분일 수 있다. 이들 실시형태에 있어서, 결찰 생성물은 도 3E에 도시된 바와 같이 "아령" 모양일 수 있다.
이들 실시형태에 있어서, 프로브 시스템은 서열 X 및 Z를 포함하는 하나 이상의 프로브에 혼성화되고, 이로써 결찰 생성물의 중심 부분(즉, 서열 A 및 B를 함유하는 부분)이 증폭되도록 허용하는 쌍의 PCR 프라이머를 추가로 포함할 수 있다. 몇몇 실시형태에 있어서, 예를 들면, 도 3B에 도시된 실시형태에 있어서, 프로브 시스템은 골격 프로브에서 서열에 혼성화되고, 이로써 회전환 증폭에 의한 이들의 생성물의 증폭을 촉진하는 회전환 증폭 프라이머를 추가로 포함할 수 있다. 몇몇 실시형태에 있어서, 프로브 시스템은 서열을 골격 프로브, 및 4개 이하의 구별 가능하게 표지된 올리고뉴클레오타이드에 혼성화시키는 회전환 증폭 프라이머를 포함할 수 있고, 여기서 각각의 구별 가능한 표지된 올리고뉴클레오타이드는 서열 B'의 상보체에 혼성화된다. 이는 하기 더 상세히 설명될 것이다.
이와 같이, 프로브 시스템의 몇몇 실시형태는 스플린트 올리고뉴클레오타이드, 골격 프로브, 및 하나 이상의 좌위-특이적 올리고뉴클레오타이드를 포함할 수 있다. 프로브 시스템은 또한 하나 이상의 증폭 프라이머, 예를 들면, 골격 프로브의 서열을 혼성화시키는 회전환 증폭 프라이머 또는 골격 프로브의 부위에 혼성화되는 한 쌍의 PCR 프라이머, 및 임의로, 좌위-특이적 올리고뉴클레오타이드의 상보체에 혼성화되는 하나 이상의 표지된 프로브를 포함할 수 있다.
상기 기재된 바와 같이, 서열 A'는 세트의 상이한 구성원 사이에서 다양하고, A'의 서열은 각각 게놈의 상이한 표적 단편에 상보적인 것으로 디자인된다. A'의 서열은 독립적으로 길이 및 서열이 다양할 수 있고, 몇몇 경우, 표적 단편의 길이 및 서열에 따라, 길이가 8 내지 80개의 뉴클레오타이드, 예를 들면, 10 내지 60개의 뉴클레오타이드 범위일 수 있다. 서열 B'는 인접한 단편이 유래되는 좌위(예를 들면, 특정한 염색체, 예를 들면, 염색체 18 또는 21 등)를 식별한다. 서열 B'는 임의의 적합한 길이일 수 있지만, 몇몇 실시형태에 있어서, 이는 길이가 8 내지 30개의 뉴클레오타이드 범위이다. 임의의 단일 검정 내에서, 서열 X' 및 Z'는 서로 상이하거나 가변적이 않다. 서열 X' 및 Z'는 임의의 적합한 길이일 수 있지만, 몇몇 실시형태에 있어서, 이들은 더 길거나 짧은 서열이 사용될 수 있음에도 불구하고 독립적으로 길이가 8 내지 30개의 뉴클레오타이드 범위이다. 스플린트 올리고뉴클레오타이드의 전체 길이는 50 내지 200개의 뉴클레오타이드 범위일 수 있다. 몇몇 실시형태에 있어서, 스플린트 올리고뉴클레오타이드는 바이오틴화되고, 이로써 결찰 생성물(하기 논의됨)이 증폭 전에 다른 생성물로부터 단리되고, 비결찰되도록 한다. 명백하게도, 서열 X 및 Z(임의의 적합한 길이일 수 있지만, 몇몇 실시형태에 있어서, 이들은 독립적으로 길이가 8 내지 30개의 뉴클레오타이드 범위임)는 가변적이지 않고, 서열 X' 및 Z'에 혼성화된다. 좌위-특이적 올리고뉴클레오타이드는, 다시, 임의의 적합한 길이, 예를 들면, 8 내지 30개의 뉴클레오타이드 범위의 길이일 수 있는 서열 B의 것이다.
상기 기재된 바와 같이, 상기 기재된 프로브 시스템을 사용하여 제조된 복합체는 선형 또는 환형(도 3에 도시된 바와 같음)일 수 있다. 도 4는 도 3B에 도시된 환형 실시형태의 특징 중 일부를 도시한다.
도 4에 도시된 바와 같이, 몇몇 실시형태에 있어서, 프로브 시스템은 (5'로부터 3'으로 또는 3'으로부터 5'로의 방향일 수 있는 식 X'-A'-B'-Z'의) 스플린트 올리고뉴클레오타이드의 세트(2), 식 X-Y-Z의 골격 프로브(6), 여기서 서열 X 및 Z는 가변적이고, 역전된 방향으로 서열 X' 및 Z'에 혼성화되고(즉, 도시된 바와 같이, 골격의 말단이 서로를 향하도록), 서열 B의 좌위-특이적 올리고뉴클레오타이드의 세트(8)를 포함할 수 있다. 골격 프로브에서 서열 Y는 임의의 편리한 길이, 예를 들면, 20 내지 100개의 뉴클레오타이드일 수 있다. 골격 프로브(6)의 전체 길이는 50 내지 300개의 뉴클레오타이드 범위의 길이일 수 있거나, 특정한 경우, 더 길 수 있다.
도 4에 도시된 바와 같이, 프로브 세트는 다양한 올리고뉴클레오타이드가 게놈 단편과 혼성화되어 결찰 가능한 환형 복합체의 제1 세트(10)(즉, 골격 프로브(6)의 말단, 좌위-특이적 올리고뉴클레오타이드(8) 및 게놈 단편(4)이 서로 결찰을 통해 인접하고, 스플린트 올리고뉴클레오타이드(2)에 의해 서로 결찰을 통해 인접하게 유지되는 복합체)를 제조할 수 있다는 것을 특징으로 한다. 예시화된 예에서 도시된 바와 같이, 골격 프로브(6), 좌위-특이적 올리고뉴클레오타이드(8) 및 단편(4)은 제1 스플린트 올리고뉴클레오타이드(2)에 혼성화되어 식 X-A-B-Z-Y의 결찰 가능한 환형 복합체 세트(10)를 생성하고, 여기서 서열 Y는 서열 X 및 Z에 결합된다. 이러한 결찰 가능한 환형 복합체 세트(10)에 존재하는 단편(4)은 적어도 2, 적어도 5, 적어도 10, 또는 적어도 50 이상의 상이한 좌위(예를 들면, 상이한 염색체)로부터의 것일 수 있고, 좌위 이로부터 인접한 단편이 유래되는 좌위(예를 들면, 특정한 염색체)의 식별은 좌위-특이적 올리고뉴클레오타이드(8)에 의해 제공되고, 이는 각각의 좌위에 대하여 동일한 서열이다. 이러한 예시에서, 서열 A 및 A'(상이한 게놈 단편의 서열에 상응함)는 다양하고, B 및 B'(좌위 식별자)는 다양하고, 서열 X, Y 및 Z는 다양하지 않다.
하기 더욱 상세하게 기재될 것인 바와 같이, 이러한 실시형태에 있어서, 프로브 시스템(스플린트 올리고뉴클레오타이드의 제1 세트(2), 골격 프로브(6) 및 좌위-특이적 올리고뉴클레오타이드(8)를 포함함)은 도시된 바와 같이 게놈(4)의 단편을 포함하는 샘플과 혼성화되어 식 X-A-B-Z-Y의 결찰 가능한 환형 복합체의 제1 세트(10)를 제조할 수 있다. 식 X-A-B-Z-Y의 환형 DNA 분자의 제1 세트(12)를 제조하는 결찰 가능한 환형 복합체의 결찰 후, 환형 DNA 분자의 제1 세트는 회전환 증폭(RCA)에 의해 증폭되어 RCA 산물의 제1 세트(16)를 제조할 수 있다. RCA는 도 4에 도시된 바와 같이 골격 프로브(6)에서 서열을 혼성화하는 회전환 증폭 프라이머(14), 또는 결찰된 단편의 측면에 배치되는 부위에 혼성화되는 PCR 프라이머를 사용하여 수행될 수 있다. 이와 같이, 특정한 실시형태에 있어서, 프로브 시스템은 골격 프로브(6)에서 서열을 혼성화하는 회전환 증폭 프라이머(14), 또는 결찰된 단편의 측면에 배치되는 부위에 혼성화되는 한 쌍의 PCR 프라이머를 추가로 포함할 수 있다. RCA 후, 특정한 RCA 산물(16) 중의 클로닝된 단편의 "공급원"(즉, 이로부터 클로닝된 게놈 단편이 유래되는 좌위, 예를 들면, 특정한 염색체)은 그 후 제1 표지된 올리고뉴클레오타이드(18)를 서열 B의 상보체(즉, B')에 혼성화함으로써, 또는 서열결정에 의해 결정될 수 있다. 명백하게도, 표지된 올리고뉴클레오타이드(18)는 서열 B의 적어도 일부를 포함할 수 있다. 이와 같이, 특정한 실시형태에 있어서, 프로브 시스템은 제1 좌위-특이적 올리고뉴클레오타이드(8)의 상보체에 혼성화되는 표지된 올리고뉴클레오타이드를 추가로 포함할 수 있다.
명백하게도, 2개 이상의 상이한 좌위로부터의 서열이 동일한 반응에서 검출되는 경우, 프로브 시스템은 각각의 좌위 식별자 B에 대하여 추가의 구별 가능하게 표지된 올리고뉴클레오타이드를 포함할 수 있고, 따라서 RCA 산물의 두 세트는 모두 동시에 식별될 수 있다. 이들 실시형태에 있어서, 프로브 시스템은 4개 이하의 구별 가능하게 표지된 올리고뉴클레오타이드(예를 들면, B1, B2, B3, B4)를 추가로 포함할 수 있고, 여기서 각각의 구별 가능한 표지된 올리고뉴클레오타이드는 서열 B'의 상보체(예를 들면, B1', B2', B3', B4')에 혼성화된다.
명백하게도, 스플린트 올리고뉴클레오타이드가 혼성화되는 단편은 게놈이 분석되는 제한 단편이다. 추가로, 상기 기재된 임의의 프로브, 올리고뉴클레오타이드, 또는 프라이머(예를 들면, 골격 프로브)는 각각의 환형 DNA 분자가 클로닝된 단편과 바코드의 조합에 의해 구별될 수 있고, 이로써, 심지어 분자가 증폭된 후에도, 얼마나 많은 초기 분자가 서열결정되는지 계수할 수 있게 해주는 분자 바코드(예를 들면, 인덱싱 서열, 예를 들면, 무작위 또는 반무작위 서열)를 함유할 수 있다(예를 들면, 문헌[Casbon et al] 참조).
방법
또한 (a) 상기 기재된 프로브 시스템을 게놈의 단편을 포함하는 시험 게놈 샘플과 혼성화하여 식 X-A-B-Z의 결찰 가능한 복합체를 생성시키는 단계; (b) 결찰 가능한 복합체를 결찰시켜 식 X-A-B-Z의 산물 DNA 분자를 생성시키는 단계; 및 (c) 서열 B의 각각의 좌위 식별자에 상응하는 산물 DNA 분자를 계수하는 단계를 포함하는 방법이 본 명세서에 제공된다. 몇몇 실시형태에 있어서, 계수는 산물 DNA 분자, 또는 이의 증폭 산물을 서열결정하여 서열 판독물을 생성시키고, B의 각각의 서열을 포함하는 서열 판독물의 수를 계수함으로써 수행될 수 있다.
산물 DNA 분자가 환형인 실시형태에 있어서, 계수는 회전환 증폭에 의하여 산물 DNA 분자를 증폭하는 것, 및 B의 각각의 서열을 포함하는 증폭 산물의 수를 계수하는 것을 포함할 수 있다. 이들 실시형태에 있어서, 방법은 서열 B에 혼성화되는 구별 가능하게 표지된 프로브를 사용하여 RCA 산물을 표지화하는 것을 포함할 수 있고, 계수는 각각의 구별 가능한 표지에 있어서 RCA 산물의 수를 계수함으로써 수행된다. 이러한 방법의 하나의 실시의 일반적인 원리는 도 4에 도시된다. 명백하게도, 스플린트 올리고뉴클레오타이드가 혼성화되는 단편은 (독립적으로) 분석되는 게놈의 상부 또는 하부 가닥 제한 단편일 수 있다. 이들 단편은 하나 이상의 제한 효소(예를 들면, 4개의 염기 인식 서열을 갖는 효소의 조합)에 의해 게놈을 소화시킨 다음, 소화된 샘플을 변성시킴으로써 발생될 수 있다. 이와 같이, 클로닝되는 단편은 정의된 말단을 갖고, 이로써 스플린트 올리고뉴클레오타이드의 디자인이 이들 단편을 클로닝하도록 한다. 정의된 말단을 갖는 단편을 발생시키는 다른 방식이 존재한다(예를 들면, 플랩 엔도뉴클레아제, 엑소뉴클레아제, 갭-필 등을 사용하는 방법).
상기 지시된 바와 같이, 도 5에 도시된 바와 같이, 이러한 방법은 다중화되어 2개 이상의 상이한 좌위를 분석하는 방식을 제공할 수 있다. 도 5를 참조하여, 게놈 DNA의 단편을 함유하는 샘플(40)은 a) (i) 상기 기재된 바와 같은 스플린트 프로브의 제1 세트; (ii) 상기 기재된 바와 같은 제1-좌위 특이적 올리고뉴클레오타이드; (iii) 상기 기재된 바와 같은 스플린트 프로브의 제2 세트; (iv) 상기 기재된 바와 같은 제2 좌위-특이적 올리고뉴클레오타이드; 및 (v) 상기 기재된 바와 같은 골격 프로브를 포함하는 프로브 시스템(42)과 혼성화되어 식 X-A-B-Z-Y의 결찰 가능한 환형 복합체의 제1 세트(제1 좌위로부터의 단편, 예를 들면, 제1 염색체뿐만 아니라 제2 좌위로부터의 단편, 예를 들면, 제2 염색체를 함유함)를 포함하는 혼합물(44)을 제조할 수 있다. 그 다음, 방법은 (b) 결찰 가능한 환형 복합체를 결찰시켜 환형 DNA 분자의 혼합물(46)(환형 DNA 분자의 제1 및 제2 세트를 함유함)을 제조하고, 샘플을 엑소뉴클레아제로 처리하여 선형 핵산 분자를 제거하는 단계 후, (c) 골격 프로브에 혼성화되는 단일 프라이머를 사용하여 환형 DNA 분자(46)를 회전환 증폭에 의해 증폭시켜 RCA 산물(48)을 제조하는 단계를 포함한다. 각각의 RCA 산물 내에 함유된 각각의 단편으로부터의 좌위는 각각의 생성물에 존재하는 좌위-특이적 올리고뉴클레오타이드의 상보체에 혼성화되는 RCA 산물을 구별 가능하게 표지된 제1 및 제2 올리고뉴클레오타이드 프로브에 혼성화함으로써 식별되어 표지된 샘플(50)을 제조할 수 있다. 이들 실시형태에 있어서, 방법은 (d) (i) 제1 좌위 식별자 서열에 혼성화되는 표지된 프로브를 사용하여 제1 좌위로부터의 단편을 함유하는 RCA 산물 및 (ii) 제2 좌위 식별자 서열에 혼성화되는 표지된 프로브를 사용하여 제2 좌위로부터의 단편을 함유하는 RCA 산물을 개별적으로 검출하는 단계를 포함할 수 있고, 여기서 표지된 프로브는 구별 가능하게 표지된다. 상기 기재된 바와 같이, 결찰 후, 스플린트 올리고뉴클레오타이드가 바이오틴화되는 경우, 환형 생성물은, 예를 들면, 스트렙타비딘 비드를 사용하여, 결찰되지 않은 생성물로부터 단리될 수 있다. 다른 경우에, 결찰된 샘플을 엑소뉴클레아제로 처리하여 반응으로부터의 선형 DNA 분자를 제거할 수 있다. 이러한 원리를 확장하여 임의의 수의 좌위(예를 들면, 3개, 4개, 10개 이하 또는 100개 이하 또는 그 이상의 좌위)에 대하여 제조된 결찰 생성물의 수를 계수할 수 있다.
몇몇 실시형태에 있어서, 검출 단계 (d)는 (i) RCA 산물을 지지체 위에 침착시키는 단계; 및 (ii) 지지체의 영역 내에서 하나의 표지로 표지된 개별적인 표지된 RCA 산물의 수 및 또 다른 표지로 표지된 개별적인 표지된 RCA 산물의 수를 개별적으로 계수하는 단계를 포함할 수 있다. 이해될 것인 바와 같이, 표지된 올리고뉴클레오타이드의 혼성화는 RCA 산물이 지지체 위에 분포되기 전에, 또는 RCA 산물이 지지체 위에 분포된 후에 수행될 수 있다.
다시 말해서, 각각의 좌위에 상응하는 회전환 증폭 산물의 수는, 예를 들면, 지지체(슬라이드 또는 다공성 막)의 표면 위에 RCA 산물을 분포시키고, 표지된 올리고뉴클레오타이드(예를 들면, 형광 표지된 올리고뉴클레오타이드)를 사용하여 RCA 산물을 혼성화시킨 다음, 예를 들면, 형광 리더를 사용하여, 지지체의 영역 내의 개별적인 신호의 수를 계수함으로써 추정될 수 있다. 표지화는 지지체 위에 분포된 생성물 전후에 수행될 수 있고, 각각의 RCA 산물이 동일한 서열의 수천개의 복제를 함유하기 때문에, 표지된 올리고뉴클레오타이드에 대한 수천개의 결합 분위가 존재하여야 하고, 이로써 신호를 증가시킨다. 다중화 실시형태(예를 들면, RCA 산물이 계수되는 2개의 상이한 좌위에 상응하는 경우)에 있어서, 하나의 좌위에 상응하는 RCA 산물은 하나의 형광단으로 표지화될 수 있고, 또 다른 좌위에 상응하는 RCA 산물은 상이한 형광단으로 표지화될 수 있고, 이로써 상이한 RCA 산물은 개별적으로 계수될 수 있다.
특정한 실시형태에 있어서, 방법은 (a) 다공성 투명 모세관 막을 통해 회전환 증폭(RCA) 생성물을 함유하는 액체 샘플을 여과시키고, 이로써 RCA 산물을 농축시키고, RCA 산물의 어레이를 막 위에 제조하는 단계; (b) 단계 (a) 전 또는 후에 RCA 산물을 형광 표지화하는 단계; 및 (c) 막의 영역 내에서 개별적인 표지된 RCA 산물의 수를 계수하고, 이로써 샘플에서 표지된 RCA 산물의 수의 추정치를 제공하는 단계를 포함할 수 있다. 몇몇 실시형태에 있어서, 다공성 투명 모세관 막은 다공성 양극 산화알루미늄 막일 수 있다. 이들 실시형태에 있어서, 표지화 단계 (b)는 단계 (a) 전 또는 후에 형광 표지된 올리고뉴클레오타이드를 RCA 산물에 혼성화함으로써 수행될 수 있다. 특정한 실시형태에 있어서, 방법은 막의 영역을 이미징하여 하나 이상의 이미지를 제조하는 것 및 하나 이상의 이미지 내의 개별적인 표지된 RCA 산물의 수를 계수하는 것을 포함할 수 있다. 이러한 방법의 예는 2016년 5월 2일자로 출원된 제PCT/IB2016/052495호에 기재되고, 이는 본 명세서에 참조로서 포함된다.
많은 응용분야(예를 들면, cfDNA 분석에 의한 비침습성 태아기 진단)에서, 특정한 염색체(예를 들면, 염색체 21)에 상응하는 단편의 수가 정확하고 편향되지 않게 측정될 필요가 있기 때문에, 개별적인 RCA 산물로부터의 신호를 정량화하는 것은 유의미하다. 전형적인 분석 방법은 몇몇 서열이 다른 것보다 훨씬 높은 효율로 증폭되는 매우 편향된 절차인 잘 알려진 PCR을 사용한다. 이는 PCR-기반의 전략을 많은 진단상의 노력에 있어서 비실용적으로 만든다.
특정한 실시형태에 있어서, 샘플은 RCA 산물의 다중 집단(예를 들면, RCA 산물의 2, 3 또는 4개 이상의 집단, 예를 들면, 표지된 RCA 산물의 제1 집단 및 RCA 산물의 제2 집단)을 함유할 수 있고, RCA 산물의 상이한 집단은 구별 가능하게 표지화되고, 이는, 심지어 집단이 혼합된 경우에도, RCA 산물 표지의 각각의 집단의 개별적인 구성원이 독립적으로 검출되고 계수될 수 있다는 것을 의미한다. 대상 방법에서 유용한 적합한 구별 가능한 형광 표지 쌍은, 예를 들면, Cy-3 및 Cy-5(Amersham Inc., 미국 뉴저지주 피스카타웨이 소재), Quasar 570 및 Quasar 670(Biosearch Technology, 미국 캘리포니아주 노바토 소재), Alexafluor555 및 Alexafluor647(Molecular Probes, 미국 오리건주 유진 소재), BODIPY V-1002 및 BODIPY V1005(Molecular Probes, 미국 오리건주 유진 소재), POPO-3 및 TOTO-3(Molecular Probes, 미국 오리건주 유진 소재), 및 POPRO3 TOPRO3(Molecular Probes, 미국 오리건주 유진 소재)를 포함한다. 추가로 적합한 구별 가능한 검출 가능한 표지는, 예를 들면, 문헌[Kricka et al.(Ann Clin Biochem. 39:114-29, 2002)]에서 찾을 수 있다. 예를 들면, RCA 산물은 ATTO, ALEXA, CY, 또는 이량체 시아닌 염료, 예를 들면, YOYO, TOTO 등의 임의의 조합으로 표지화될 수 있다. 다른 표지가 또한 사용될 수 있다.
몇몇 경우에, RCA 산물의 집단은 이를 다중 표지로 표지화하고, 이로써 다중화의 가능성을 증가시킴으로써 구별 가능하게 표지화될 수 있다. 예를 들면, 몇몇 경우에 집단은 2개의 구별 가능한 염료(예를 들면, Cy3 및 Cy5)로 표지화될 수 있고, 이는 판독 시 개별적인 염료(예를 들면, Cy3 또는 Cy5)로 표지된 집단과 구별가능할 것이다. 몇몇 실시형태에 있어서, RCA 산물의 제1 집단은 표지된 RCA 산물의 "시험" 집단을 나타내고, RCA 산물의 제2 집단은 제1 RCA 산물의 수가 비교될 수 있는 RCA 산물의 "참조" 집단을 나타낸다. 예를 들면, 몇몇 실시형태에 있어서, RCA 산물의 제1 집단은 제1 염색체 영역(예를 들면, 제1 염색체, 예를 들면, 염색체 21)에 상응할 수 있고, RCA 산물의 제2 집단은 제2 염색체 영역(예를 들면, 제2 염색체, 예를 들면, 염색체 13 또는 18 또는 제1 염색체의 상이한 영역)에 상응할 수 있고, RCA 산물의 제1 집단 및 RCA 산물의 제2 집단의 수를 계수하고 비교하여 영역의 복제 수에서의 차이가 존재하는지의 여부(시험 영역의 중복 또는 결실이 존재하는 것을 지시함)를 결정할 수 있다. 몇몇 실시형태에 있어서, 샘플은 적어도 RCA 산물의 제1 집단 및 RCA 산물의 제2 집단을 함유하고, 여기서 표지된 RCA 산물의 제1 및 제2 집단은 표지화 단계(단계 (b))에서 구별 가능하게 표지된다. 이들 실시형태에 있어서, 방법은 막의 영역 내의 제1 표지된 RCA 산물의 수를 계수하고, 막의 영역(동일한 영역 또는 상이한 영역) 내의 제2 표지된 RCA 산물을 계수하고, 이로써 샘플 중의 RCA 산물의 제1 및 제2 집단의 수의 추정치를 제공하는 것을 포함한다. 이러한 실시형태는 샘플 중의 제1 RCA 산물의 수와 샘플 중의 제2 RCA 산물의 수를 비교하는 것을 추가로 포함할 수 있다.
방법의 몇몇 이들 실시형태에 있어서, 방법은 표지된 RCA 산물의 제1 및 제2 집단을 이미징하여 하나 이상의 이미지(예를 들면, 각각 제1 이미지 및 제2 이미지)를 제조하고, 임의로, (i) 하나 이상의 이미지 내의 표지된 RCA 산물의 수를 계수하고, 이로써 샘플 중의 표지된 RCA 산물의 제1 및 제2 집단의 수의 추정치를 제공하는 단계를 포함할 수 있다. 표지된 RCA 산물의 제1 및 제2 집단은 공지된 방법을 사용하여(예를 들면, 적절한 필터 등을 사용하여) 개별적으로 검출될 수 있다. 방법의 이들 실시형태는 샘플 중의 제1 표지된 RCA 산물의 수를 샘플 중의 제2 표지된 RCA 산물의 수와 비교하는 것을 추가로 포함할 수 있다. 방법의 이러한 단계는 막의 영역 내의 제1 집단 중의 적어도 1,000개(예를 들면, 적어도 5,000, 적어도 10,000, 적어도 20,000,적어도 50,000, 적어도 100,000, 적어도 500,000개 내지 1M 또는 그 이상)의 표지된 RCA 산물, 적어도 1,000개(예를 들면, 적어도 5,000, 적어도 10,000, 적어도 20,000 또는 적어도 50,000, 적어도 100,000, 적어도 500,000개 내지 1M 또는 그 이상)의 표지된 RCA 산물을 계수하고, 이로써 복제 수에서의 차이가 통계적 엄격함으로 불릴 수 있다는 것을 보장하는 것을 포함할 수 있다.
대안적인 실시형태에 있어서, DNA 분자에서 클로닝된 단편(및 임의로, 환형 DNA 분자의 임의의 인덱싱 서열)은 이들 서열의 측면에 배치된 부위에 혼성화되거나 이와 동일한 PCR 프라이머를 사용하여 PCR에 의해 증폭될 수 있다. 이러한 실시형태에 있어서, PCR 생성물은 프라이머를 사용하여 증폭될 수 있다. 이러한 실시형태에 있어서, 생성물의 양은 임의의 적합한 qPCR 검정, 예컨대, TaqMan 검정 등에 의해 정량화될 수 있다. 또 다른 실시형태에 있어서, 생성물은 서열결정될 수 있다(증폭과 함께 또는 증폭 없이). 이들 실시형태에 있어서, 각각의 좌위에 상응하는 환형 분자의 양은 좌위에 상응하는 서열 판독물의 수를 계수함(예를 들면, 얼마나 많은 서열 판독물이 특정한 좌위-특이적 바코드 서열을 갖는지를 계수함)으로써 추정될 수 있다. 몇몇 실시형태에 있어서, 인덱싱 서열이 사용되는 경우, 각각의 좌위에 상응하는 환형 분자의 수는 얼마나 많은 상이한 분자 바코드 서열이 각각의 좌위-특이적 바코드 서열과 연관되는지를 측정함으로써 계수될 수 있다.
명백하게도, 이러한 실시형태에 있어서, 사용된 프라이머는, 예를 들면, 일루미나 가역적 터미네이터 방법, 로슈 파이로서열결정 방법(454), 결찰에 의한 라이프 테크놀로지스 서열결정(SOLiD 플랫폼) 또는 라이프 테크놀로지스 이온 토렌트(Ion Torrent) 플랫폼에서 사용과 혼화성인 서열을 함유할 수 있다. 이러한 방법의 예는 하기 참조에 기재된다: 각각의 단계에 대한 모든 출발 생성물, 시약, 및 최종 생성물을 포함한 방법의 일반적인 설명 및 방법의 특정한 단계에 대하여 참조로서 포함되는 문헌[Margulies et al(Nature 2005 437: 376-80)]; [Ronaghi et al(Analytical Biochemistry 1996 242: 84-9)]; [Shendure(Science 2005 309: 1728)]; [Imelfort et al(Brief Bioinform. 2009 10:609-18)]; [Fox et al(Methods Mol Biol. 2009;553:79-108)]; [Appleby et al(Methods Mol Biol. 2009;513:19-39)] 및 [Morozova(Genomics. 2008 92:255-64)].
시험 게놈 샘플은 질환 또는 병태가 의심되거나 이의 위험성을 갖는 환자로부터의 것일 수 있고, 단계 (c)의 결과로서 환자, 또는 이의 태아가 질환 또는 병태를 갖지는 여부를 지시한다. 몇몇 실시형태에 있어서, 질환 또는 병태는 암, 감염성 질환, 염증성 질환, 이식 거부반응 또는 염색체 결함, 예를 들면, 삼염색체성일 수 있다.
상기 기재된 바와 같이, 몇몇 경우에 이러한 방법을 사용하여 분석되는 샘플은 혈액으로부터, 예를 들면, 임신 여성의 혈액으로부터 수득된 cfDNA의 샘플일 수 있다. 이들 실시형태에 있어서, 방법은, 예를 들면, 발달 중인 태아에서 염색체 이상을 검출하거나(상기 기재된 바와 같이), 샘플 중의 태아 DNA의 분획을 계산하는데 사용될 수 있다.
방법을 사용하여 검출할 수 있는 예시적인 복제 수 이상은 삼염색체성 21, 삼염색체성 13, 삼염색체성 18, 삼염색체성 16, XXY, XYY, XXX, 일염색체성 X, 일염색체성 21, 일염색체성 22, 일염색체성 16, 및 일염색체성 15를 포함하지만 이에 한정되지 않는다. 본 발명의 방법을 사용하여 검출할 수 있는 추가의 복제 수 이상은 하기 표에 열거된다.
염색체 이상 및 질환 연관성
X: XO(터너 증후군)
Y: XXY(클라인펠터 증후군)
Y: XYY(이중 Y 증후군)
Y: XXX(삼염색체성 X 증후군)
Y: XXXX(4X 증후군)
Y: Xp21 결실(뒤시엔느/베커 증후군, 선천성 신근 저형성증, 만성 육아종 질환)
Y: Xp22 결실(스테로이드 설파타제 결핍증)
Y: Xq26 결실(X-연관 림프증식성 질환)
1: 1p 체성(신경아세포종)
1: 일염색체성(신경아세포종)
1: 삼염색체성(신경아세포종)
2: 일염색체성(성장 지연, 발달 및 정신 지연, 및 작은 신체적 이상)
2: 삼염색체성 2q(성장 지연, 발달 및 정신 지연, 및 작은 신체적 이상)
3: 일염색체성(비호지킨 림프종)
3: 삼염색체성 체성(비호지킨 림프종)
4: 일염색체성(급성 비림프구성 백혈병(ANLL))
4: 삼염색체성 체성(급성 비림프구성 백혈병(ANLL))
5: 5p(묘성 증후군; 르준 증후군)
5: 5q 체성(골수형성이상 증후군)
5: 일염색체성(골수형성이상 증후군)
5: 삼염색체성(골수형성이상 증후군)
6: 일염색체성(투명세포 육종)
6: 삼염색체성 체성(투명세포 육종)
7: 7q11.23 결실(윌리엄 증후군)
7: 일염색체성(소아의 일염색체성 7 증후군; 체성: 신장 피질 선종; 골수형성이상 증후군)
7: 삼염색체성(소아의 일염색체성 7 증후군; 체성: 신장 피질 선종; 골수형성이상 증후군)
8: 8q24.1 결실(랑거-기에돈 증후군)
8: 일염색체성(골수형성이상 증후군; 와카니 증후군; 체성: 만성 골수성 백혈병)
8: 삼염색체성(골수형성이상 증후군; 와카니 증후군; 체성: 만성 골수성 백혈병)
9: 일염색체성 9p(알피 증후군)
9: 일염색체성 9p(레토르 증후군)
9: 부분적 삼염색체성(레토르 증후군)
9: 삼염색체성(완전한 삼염색체성 9 증후군; 모자이크 삼염색체성 9 증후군)
10: 일염색체성(ALL 또는 ANLL)
10: 삼염색체성 체성(ALL 또는 ANLL)
11: 11p-(무홍채증; 빌름스 종양)
11: 11q-(야콥센 증후군)
11: 일염색체성(병에 걸린 골수 계통(ANLL, MDS))
11: 삼염색체성 체성(병에 걸린 골수 계통(ANLL, MDS))
12: 일염색체성(CLL, 청소년 과립막 세포 종양(JGCT))
12: 삼염색체성 체성(CLL, 청소년 과립막 세포 종양(JGCT))
13: 13q-(13q-증후군; 오르벨리 증후군)
13: 13q14 결실(망막아종)
13: 일염색체성(파타우 증후군)
13: 삼염색체성(파타우 증후군)
14: 일염색체성(골수 장애(MDS, ANLL, 비정형 CML)
14: 삼염색체성 체성(골수 장애(MDS, ANLL, 비정형 CML)
15: 15q11-q13 결실(프라더-윌리, 앤젤맨스 증후군)
15: 일염색체성(프라더-윌리, 앤젤맨스 증후군)
15: 삼염색체성 체성(병에 걸린 골수 및 림프 계통, 예를 들면, MDS, ANLL, ALL, CLL)
16: 16q13.3 결실(루벤스타인-테이비)
16: 일염색체성(유두상 신장 세포 암종(악성))
16: 삼염색체성 체성(유두상 신장 세포 암종(악성))
17: 17p-체성(골수 악성종양에서 17p 증후군)
17: 17q11.2 결실(스미스-마제니스)
17: 17q13.3(밀러-디커)
17: 일염색체성(신장 피질 선종)
17: 삼염색체성 체성(신장 피질 선종)
17: 17p11.2-12(샤르코-마리-투쓰 증후군 1형; HNPP)
17: 삼염색체성(샤르코-마리-투쓰 증후군 1형; HNPP)
18: 18p-(18p 부분적 일염색체성 증후군 또는 그로시 라미 티에프리 증후군)
18: 18q-(그로시 라미 살몬 란드리 증후군)
18: 일염색체성(에드워드 증후군)
18: 삼염색체성(에드워드 증후군)
19: 일염색체성(에드워드 증후군)
19: 삼염색체성(에드워드 증후군)
20: 20p-(삼염색체성 20p 증후군)
20: 20p11.2-12 결실(알라질)
20: 20q-(체성: MDS, ANLL, 진성다혈구증, 만성 호중구 백혈병)
20: 일염색체성(유두상 신장 세포 암종(악성))
20: 삼염색체성 체성(유두상 신장 세포 암종(악성))
21: 일염색체성(다운 증후군)
21: 삼염색체성(다운 증후군)
22: 22q11.2 결실(디조지 증후군, 구개심장안면 증후군, 뿔줄기 기형 안면 증후군, 상염색체성 우세 Opitz G/BBB 증후군, 케일러 심안면 증후군)
22: 일염색체성(완전한 삼염색체성 22 증후군)
22: 삼염색체성(완전한 삼염색체성 22 증후군)
본 명세서에 기재된 방법은 식물, 동물(예를 들면, 파충류, 포유동물, 곤출, 벌레, 어류 등), 조직 샘플, 박테리아, 진균류(예를 들면, 효모), 파지, 바이러스, 사체 조직, 고고학/고대 샘플 등을 포함하지만 이에 한정되지 않는 사실상 임의의 유기체로부터의 게놈 DNA를 분석하는데 사용될 수 있다. 특정한 실시형태에 있어서, 방법에서 사용되는 게놈 DNA는 포유동물로부터 유래될 수 있고, 특정한 실시형태에 있어서 포유동물은 인간이다. 예시적인 실시형태에 있어서, 게놈 샘플은 포유동물 세포, 예를 들면, 인간, 마우스, 래트, 또는 원숭이 세포로부터의 게놈 DNA를 함유할 수 있다. 샘플은 배양된 세포 또는 임상 샘플의 세포, 예를 들면, 조직 생검, 긁힘 또는 세척 또는 법의학 샘플의 세포(즉, 범죄 현장에서 수집된 샘플의 세포)로부터 만들어질 수 있다. 특정한 실시형태에 있어서, 핵산 샘플은 생물학적 샘플, 예를 들면, 세포, 조직, 체액, 및 대변으로부터 수득될 수 있다. 흥미있는 체액은 혈액, 혈청, 혈장, 타액, 점액, 가래, 뇌척수액, 흉수, 눈물, 락탈 도관 유체, 림프, 객담, 뇌척수액, 활액, 뇨, 양수 및 정액을 포함하지만 이에 한정되지 않는다. 특정한 실시형태에 있어서, 샘플은 대상체, 예를 들면, 인간으로부터 수득될 수 있다. 몇몇 실시형태에 있어서, 분석되는 샘플은 혈액, 예를 들면, 임신 여성의 혈액으로부터 수득된 cfDNA의 샘플일 수 있다.
예를 들면, 몇몇 실시형태에 있어서, DNA의 샘플을 수득할 수 있고, 샘플을 하나 이상의 제한 효소(또는 RNA-안내된 엔도뉴클레아제, 예를 들면, cas9)로 소화시켜 예측 가능한 단편(이의 중앙 크기는 20-100 염기 범위일 수 있음)을 생성할 수 있다. 상기 기재된 방법은 소화된 DNA에서 수행될 수 있고, 본 명세서에 기재된 방법을 사용하여 하나의 좌위(예를 들면, 하나의 염색체)에 상응하는 단편의 수를 또 다른 좌위(예를 들면, 또 다른 염색체)에 상응하는 단편의 수와 비교할 수 있다. 기재된 바와 같이, 방법은 질환 또는 병태와 연관되는 복제 수 차이, 예를 들면, 염색체 이수성을 식별하는데 사용될 수 있다.
상기 기재된 바와 같이, 몇몇 경우에 분석된 샘플은 혈액으로부터, 예를 들면, 임신 여성의 혈액으로부터 수득된 cfDNA의 샘플일 수 있다. 이들 실시형태에 있어서, 방법은, 예를 들면, 발달 중인 태아에서 염색체 이상을 검출하거나 샘플 중의 태아 DNA의 분획을 계산하는데 사용될 수 있다.
키트
또한 상기 기재된 바와 같은 대상 방법을 실시하기 위한 키트가 본 개시내용에 의해 제공된다. 특정한 실시형태에 있어서, 키트는, (a) 식 X'-A'-B'-Z'의 스플린트 올리고뉴클레오타이드의 세트로서, 여기서, 세트 내에서: (i) 서열 A' 및 B'는 다양하고, (ii) 서열 X' 및 Z'는 서로 상이하며, 가변적이지 않고; 각각의 분자 내에서: (i) 서열 A'는 게놈 단편에 상보적이고, (ii) 서열 B'는 이로부터 인접한 A' 서열을 혼성화하는 게놈 단편이 유래되는 좌위를 식별하는, 상기 스플린트 올리고뉴클레오타이드의 세트; (b) X 및 Z를 포함하는 하나 이상의 프로브 서열로서, 서열 X 및 Z가 가변적이지 않고, 서열 X' 및 Z'에 혼성화되는, 상기 하나 이상의 프로브 서열; 및 (c) 서열 B의 좌위-특이적 올리고뉴클레오타이드의 세트를 포함할 수 있되; (a)의 각각의 스플린트 올리고뉴클레오타이드는 (i) (b)의 프로브 서열; (ii) (c)의 좌위-특이적 올리고뉴클레오타이드; 및 (iii) (a)의 게놈 단편에 혼성화되어 식 X-A-B-Z의 결찰 가능한 복합체를 생성할 수 있고, 여기서 서열 B는 인접한 서열 A의 좌위를 식별한다. 몇몇 실시형태에 있어서, (b)의 하나 이상의 프로브는 서열 X를 포함하는 제1 올리고뉴클레오타이드 및 서열 Y를 포함하는 제2 올리고뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 키트는 서열 X 및 Y를 포함하는 하나 이상의 프로브에 혼성화되는 한 쌍의 PCR 프라이머를 추가로 포함할 수 있다. 특정한 실시형태에 있어서, (b)의 하나 이상의 프로브는 식 X-Y-Z의 골격 프로브이고, 결찰 가능한 복합체는 식 X-A-B-Z-Y의 환형 결찰 가능한 복합체이고, 여기서 서열 Y는 서열 X 및 Z에 결합하고, 서열 B는 인접한 서열 A의 좌위를 식별한다. 이들 실시형태에 있어서, 키트는 골격 프로브에서 서열에 혼성화되는 회전환 증폭 프라이머를 추가로 포함할 수 있다. 이들 실시형태에 있어서, 키트는 복수의 구별 가능하게 표지된 올리고뉴클레오타이드를 포함할 수 있고, 각각의 구별 가능한 표지된 올리고뉴클레오타이드는 B' 서열의 상보체에 혼성화된다. 키트는 회전환 증폭을 수행하기 위하여 리가제 및/또는 가닥-대체 중합효소를 추가로 함유할 수 있다.
키트의 다양한 구성요소는 개별적인 용기 내에 존재할 수 있거나, 특정한 혼화성 구성요소(예를 들면, 스플린트 프로브의 제1 및 제2 세트 및 제1 및 제2 좌위-특이적 프로브)는 목적하는 경우 단일 용기에 미리 조합될 수 있다.
상기 언급된 구성요소 이외에, 대상 키트는 대상 방법을 실시하기 위한 키트의 구성요소의 사용에 대한 설명서를 추가로 포함할 수 있다.
실시예
하기 실시예는 당해 분야의 숙련가에게 본 발명을 어떻게 제조하고 사용하는지에 대한 추가의 기재내용 및 설명을 제공하기 위하여 기재되고, 이는 본 발명자가 본 발명으로 간주하는 것의 범위를 제한하는 것을 의도하지 않거나, 이들이 하기 실험이 수행된 모든 또는 유일한 실험이라는 것을 나타내는 것을 의도하지 않는다.
실시예 I
방법을 입증하는 초기 데이터
이 실험의 목적은 염색체-특이적인 골격 올리고뉴클레오타이드를 사용하는 방법(예를 들면, 제WO2015083001호 및 제WO2015083002호에 기재된 바와 같이, 제1 염색체, 예를 들면, 염색체 21로부터의 단편을 캡처하기 위하여 사용된 골격 올리고뉴클레오타이드는 제2 염색체, 예를 들면, 염색체 18로부터의 단편을 캡처하는데 사용된 골격 올리고뉴클레오타이드와 상이함)과 시험된 모든 염색체에 대하여 동일한 골격 올리고뉴클레오타이드를 사용하는 방법을 비교하는 것이다. 이것은 도 6에 설명된다. 도시된 바와 같이, "신규한" 디자인에서, 클로닝된 단편의 공급원은 표적 단편과 동일한 환형 생성물로 클로닝되는 염색체-특이적 서열(예를 들면, A 또는 B)을 사용하여 결정된다. 신규한 방법에서, 단일 골격 올리고뉴클레오타이드가 사용되고(선행 방법에서의 다중 골격 올리고뉴클레오타이드와 비교), 모든 염색체로부터 클로닝된 단편은 동일한 RCA 프라이머 또는 PCR 프라이머의 단일 쌍을 사용하여 증폭될 수 있다.
세포주 DNA(10 ng)를 소화 변성시키고, "종래" 및 "신규한" 프로브 디자인에 혼성화시켰다. 혼성화 및 결찰 후, 결찰 반응에 엑소뉴클레아제 처리를 수행하여 용액 중의 임의의 비환형화된 DNA를 제거하였다. 남은 환형 생성물은 RCA 반응에서 주형 역할을 하고, 이는 환형 생성물의 연쇄물 복제를 생성하였다. 이들 RCA 산물을 "스플린트" 서열에 상보적인 형광 표지된 올리고뉴클레오타이드로 표지화하고, 검출을 위하여 고체 지지체 상에 침착시켰다.
임신 여성으로부터의 13개의 cfDNA 샘플에 상기 기재된 바와 동일한 반응을 수행하였다.
모든 반응에 있어서, 개별적인 목적물(RCA 산물)의 수를 각각의 색으로 계수하였다. 색에서의 수의 비율 A/B를 각각의 샘플에 대하여 계산하고, 변동 계수를 검정의 정확도의 척도로서 계산하였다. 낮은 변동 계수는 낮은 태아 분획을 갖는 샘플의 정확한 측정을 가능하게 한다. 이는 삼염색체성 21 세포주 샘플의 낮은 스파이크-인(spike-in) 양을 함유하는 샘플을 첨가함으로써 설명되었다.
도 7에 도시된 데이터에 따르면, 신규한 디자인은 세포주 DNA 및 cfDNA 둘 다에 대하여 더 낮은 CV를 발생시키고, 염색체 이상이 있는 태아 DNA의 더 정확한 측정을 가능하게 한다.
임의의 특정한 이론과 결부되는 것을 원하지 않지만, 이 방법은 샘플 중의 불순물에 대하여 덜 민감할 수 있는 것으로 생각된다.
실시예 II
임상 샘플의 분석
삼염색체성 21의 태아를 가진 26명의 정상 임신 개인 및 4명의 개인으로부터의 cfDNA 샘플을 제조하였다. 각각의 환자로부터의 혈액(10 ml)을 원심분리하여 적혈구 및 연막으로부터 혈장을 분리하였다. 상응하는 혈장(대략 3 내지 5 ml/환자)에 비드-기반 DNA 추출 프로토콜을 수행하여 버퍼 50 ul 중에 희석된 추출된 cfDNA를 수득하였다.
그 다음, cfDNA에 상기 본 명세서에 기재된 방법을 수행하고, 형광 현미경을 사용하는 회전환 생성물의 디지털 계수에 의해 분석하였다. 모든 4개의 양성 경우를 3초과의 z-스코어에 대하여 검출하였다. 정상 샘플의 CV는 높은 검정 정확성을 증명하는 0.49%로 계산하였다.

Claims (25)

  1. 핵산 샘플을 분석하기 위한 프로브 시스템으로서,
    (a) 서열 B의 식별자 올리고뉴클레오타이드(identifier oligonucleotide)의 세트;
    (b) 식 X'-A'-B'-Z'의 스플린트 올리고뉴클레오타이드(splint oligonucleotide)의 세트로서,
    상기 세트 내에서: (i) 서열 A' 및 B'는 다양하고, (ii) 서열 X'와 Z'는 서로 상이하며, 가변적이지 않고;
    각각의 스플린트 올리고뉴클레오타이드 내에서: (i) 서열 A'는 상기 핵산 샘플의 게놈 단편(genomic fragment)에 상보적이고, (ii) 서열 B'는 상기 식별자 올리고뉴클레오타이드의 세트의 적어도 하나의 구성원에 상보적인, 상기 스플린트 올리고뉴클레오타이드의 세트; 및
    (c) X 및 Z를 포함하는 하나 이상의 프로브 서열로서, 서열 X 및 Z가 가변적이지 않고, 서열 X' 및 Z'에 혼성화되는, 상기 하나 이상의 프로브 서열을 포함하되;
    각각의 스플린트 올리고뉴클레오타이드는 (i) 상기 프로브 서열, (ii) 상기 식별자 올리고뉴클레오타이드의 세트의 구성원 및 (iii) 상기 게놈 단편에 혼성화될 수 있고, 이로써 식 X-A-B-Z의 결찰 가능한 복합체를 생성시키는, 프로브 시스템.
  2. 제1항에 있어서, 상기 식별자 올리고뉴클레오타이드의 세트가 적어도 2개의 상이한 B 서열 식별자 올리고뉴클레오타이드를 포함하고, 상기 스플린트 올리고뉴클레오타이드의 세트 내에, 적어도 100개의 상이한 A' 서열; 및 적어도 2개의 상이한 식별자 올리고뉴클레오타이드에 상보적인 적어도 2개의 상이한 B' 서열이 존재하는, 프로브 시스템.
  3. 제1항 또는 제2항에 있어서, 각각의 식별자 올리고뉴클레오타이드 또는 스플린트 올리고뉴클레오타이드 내의 상기 각각의 식별자 올리고뉴클레오타이드의 상보적 B' 서열이 상기 게놈 단편에 상응하는, 프로브 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 각각의 식별자 올리고뉴클레오타이드 또는 스플린트 올리고뉴클레오타이드 내의 상기 각각의 식별자 올리고뉴클레오타이드의 상보적 B' 서열이 상기 게놈 단편이 유래된 게놈 내 좌위를 지시하는(indicate), 프로브 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 각각의 식별자 올리고뉴클레오타이드 또는 스플린트 올리고뉴클레오타이드 내의 상기 각각의 상기 식별자 올리고뉴클레오타이드의 상보적 B' 서열이 상기 게놈 단편이 유래된 염색체를 지시하는, 프로브 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 게놈 단편이 포유동물 게놈으로부터 유래된 것인, 프로브 시스템.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 각각의 식별자 올리고뉴클레오타이드 또는 스플린트 올리고뉴클레오타이드 내의 상기 각각의 식별자 올리고뉴클레오타이드의 상보적 B' 서열이 염색체 21, 염색체 18 및 염색체 13 중 하나 이상을 식별하는, 프로브 시스템.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 게놈 단편이 제한 단편(restriction fragment)인, 프로브 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, (c)의 상기 하나 이상의 프로브 서열이 서열 Y를 포함하는 올리고뉴클레오타이드를 추가로 포함하고, 그리고 상기 결찰 가능한 복합체가 선형인, 프로브 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, (c)의 상기 하나 이상의 프로브에 혼성화되는 한 쌍의 PCR 프라이머를 더 포함하는, 프로브 시스템.
  11. 제1항 내지 제8항 중 어느 한 항에 있어서, (c)의 상기 하나 이상의 프로브 서열이 식 X-Y-Z의 골격 프로브를 포함하되, Y는 올리고뉴클레오타이드 서열을 포함하므로, 상기 결찰 가능한 복합체가 식 X-A-B-Z-Y의 환형 결찰 가능한 복합체이고, 서열 Y는 서열 X 및 Z에 결합하는, 프로브 시스템.
  12. 제11항에 있어서, 상기 골격 프로브의 서열에 혼성화되는 회전환 증폭 프라이머(rolling circle amplification primer)를 더 포함하는, 프로브 시스템.
  13. 제11항에 있어서,
    (A) 서열을 상기 골격 프로브에 혼성화시키는 회전환 증폭 프라이머; 및
    (B) 최대 4개의 구별 가능하게 표지된 검출 올리고뉴클레오타이드로서, 각각이 B' 서열에 혼성화되는, 상기 4개의 구별 가능한 표지된 검출 올리고뉴클레오타이드를 더 포함하는, 프로브 시스템.
  14. 방법으로서,
    (a) 제1항 내지 제13항 중 어느 한 항의 프로브 시스템을 게놈 단편을 포함하는 시험 게놈 샘플과 혼성화시켜, 식 X-A-B-Z의 결찰 가능한 복합체를 생성시키는 단계;
    (b) 상기 결찰 가능한 복합체를 결찰시켜 식 X-A-B-Z의 산물 DNA 분자를 생성시키는 단계; 및
    (c) 서열 B의 각각의 좌위 식별자에 상응하는 상기 산물 DNA 분자를 계수(counting)하는 단계를 포함하는, 방법.
  15. 제14항에 있어서, 상기 계수하는 단계가 산물 DNA 분자, 또는 이의 증폭 산물을 서열결정하여 서열 판독물을 생성시키고, B의 각각의 서열 또는 이의 상보물을 포함하는 서열 판독물의 수를 계수함으로써 수행되는, 방법.
  16. 제14항에 있어서, 상기 산물 DNA 분자가 환형이고, 상기 계수하는 단계가 상기 산물 DNA 분자를 회전환 증폭에 의해 증폭시키고, 그리고 B의 각각의 서열 또는 이의 상보물을 포함하는 증폭 산물의 수를 계수하는 것을 포함하는, 방법.
  17. 제16항에 있어서, 상기 방법이 서열 B'에 혼성화되는 구별 가능하게 표지된 프로브를 사용하여 상기 RCA 산물을 표지화하는 것을 포함하고, 상기 계수하는 단계가 각각의 구별 가능한 표지에 대하여 상기 RCA 산물의 수를 계수함으로써 수행되는, 방법.
  18. 제17항에 있어서, 상기 방법이 i. 상기 RCA 산물을 평평한 지지체 상에 침착시키는 단계; 및 ii. 상기 지지체의 영역 내의 개별적인 표지된 상기 RCA 산물의 수를 계수하는 단계를 더 포함하는, 방법.
  19. 제18항에 있어서, 상기 지지체가 유리 슬라이드인, 방법.
  20. 제18항에 있어서, 상기 지지체가 다공성 투명 모세관 막인, 방법.
  21. 제14항 내지 제20항 중 어느 한 항에 있어서, 상기 B의 상이한 서열 및 이들의 상보적 서열 B'가 상이한 염색체를 식별하고, 상기 방법이 B 또는 B' 중 어느 한쪽의 제1 서열을 포함하는 상기 산물 DNA 분자의 수를 B 또는 B' 중 어느 한쪽의 제2 서열을 포함하는 상기 산물 DNA 분자의 수와 비교하여 상기 게놈 샘플이 이수성을 갖는지의 여부를 결정하는 단계를 더 포함하는, 방법.
  22. 제14항 내지 제21항 중 어느 한 항에 있어서, 상기 방법이 단계 (c)의 계수 결과를 하나 이상의 참조 샘플로부터 수득된 계수 결과와 비교하는 단계를 포함하는, 방법.
  23. 제14항 내지 제22항 중 어느 한 항에 있어서, 상기 시험 게놈 샘플이 질환 또는 병태가 의심되거나 이의 위험성이 있는 환자로부터 유래된 것이고, 단계 (c)의 계수 결과가 상기 환자 또는 이의 태아가 상기 질환 또는 병태를 갖는지의 여부의 지시를 제공하는, 방법.
  24. 제23항에 있어서, 상기 질환 또는 병태가 암, 감염성 질환, 염증성 질환, 이식 거부반응(transplant rejection) 또는 삼염색체성인, 방법.
  25. 제14항 내지 제24항 중 어느 한 항에 있어서, 상기 단편이 제한 단편인, 방법.
KR1020187006545A 2015-09-18 2016-09-16 Dna 샘플의 분석을 위한 프로브 세트 및 이의 사용 방법 KR20180048682A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562220746P 2015-09-18 2015-09-18
US62/220,746 2015-09-18
PCT/IB2016/055558 WO2017046775A1 (en) 2015-09-18 2016-09-16 Probe set for analyzing a dna sample and method for using the same

Publications (1)

Publication Number Publication Date
KR20180048682A true KR20180048682A (ko) 2018-05-10

Family

ID=56990688

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187006545A KR20180048682A (ko) 2015-09-18 2016-09-16 Dna 샘플의 분석을 위한 프로브 세트 및 이의 사용 방법

Country Status (13)

Country Link
US (4) US10508300B2 (ko)
EP (2) EP3350342B1 (ko)
JP (1) JP6785839B2 (ko)
KR (1) KR20180048682A (ko)
CN (2) CN111154754B (ko)
AU (2) AU2016325100B2 (ko)
BR (1) BR112018001686A2 (ko)
CA (1) CA2993914A1 (ko)
DK (1) DK3350342T3 (ko)
ES (2) ES2788737T3 (ko)
PL (1) PL3350342T3 (ko)
RU (1) RU2753883C2 (ko)
WO (1) WO2017046775A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180048682A (ko) 2015-09-18 2018-05-10 바나디스 다이아그노스틱스 Dna 샘플의 분석을 위한 프로브 세트 및 이의 사용 방법
US11046995B2 (en) * 2016-08-16 2021-06-29 The Regents Of The University Of California Method for finding low abundance sequences by hybridization (FLASH)
CN109234388B (zh) * 2017-07-04 2021-09-14 深圳华大生命科学研究院 用于dna高甲基化区域富集的试剂、富集方法及应用
US11117128B2 (en) 2017-08-25 2021-09-14 Vanadis Diagnostics Ab Filtration device
WO2019067567A1 (en) * 2017-09-26 2019-04-04 Juno Diagnostics, Inc. DEVICES, SYSTEMS AND METHODS FOR BIOMARKER ANALYSIS
EP3775272A4 (en) 2018-04-02 2021-12-29 Progenity, Inc. Methods, systems, and compositions for counting nucleic acid molecules
CN112867801A (zh) * 2018-11-30 2021-05-28 Illumina公司 使用单一测定分析多种分析物
WO2020206170A1 (en) 2019-04-02 2020-10-08 Progenity, Inc. Methods, systems, and compositions for counting nucleic acid molecules
CN114540348B (zh) * 2021-03-17 2023-06-30 浙江农林大学 毛竹寡核苷酸探针

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
JP2003535599A (ja) 2000-06-06 2003-12-02 ティーエム バイオサイエンス コーポレイション 核酸の捕捉部とその使用
US6573051B2 (en) 2001-03-09 2003-06-03 Molecular Staging, Inc. Open circle probes with intramolecular stem structures
DE60231543D1 (de) 2001-11-19 2009-04-23 Parallele Bioscience Inc Multiplex-oligonukleotidaddition und zielamplifikation
AU2003298672A1 (en) 2002-11-19 2005-01-28 Singulex, Inc. Detection of target molecules through interaction with probes
EP1573009B1 (en) 2002-12-18 2011-09-21 Third Wave Technologies, Inc. Detection of small nucleic acids
EP1680517B1 (en) 2003-11-04 2010-03-31 Applied Biosystems, LLC Concatameric ligation products: compositions, methods and kits for same
US20050233340A1 (en) 2004-04-20 2005-10-20 Barrett Michael T Methods and compositions for assessing CpG methylation
SE0401270D0 (sv) 2004-05-18 2004-05-18 Fredrik Dahl Method for amplifying specific nucleic acids in parallel
US20070087355A1 (en) 2005-10-14 2007-04-19 Barrett Michael T Comparative genomic hybridization assays and compositions for practicing the same
JP4989493B2 (ja) 2006-01-20 2012-08-01 オリンパス株式会社 分子内プローブによる核酸配列の検出方法
US7862999B2 (en) * 2007-01-17 2011-01-04 Affymetrix, Inc. Multiplex targeted amplification using flap nuclease
US20090061424A1 (en) 2007-08-30 2009-03-05 Sigma-Aldrich Company Universal ligation array for analyzing gene expression or genomic variations
US20090156412A1 (en) * 2007-12-17 2009-06-18 Helicos Biosciences Corporation Surface-capture of target nucleic acids
WO2010117829A2 (en) * 2009-03-31 2010-10-14 The United States Of America As Represented By The Secretary Department Of Health And Human Services Differentially expressed micrornas as biomarkers for the diagnosis and treatment of sjögren's syndrome
GB0912909D0 (en) 2009-07-23 2009-08-26 Olink Genomics Ab Probes for specific analysis of nucleic acids
US20140186827A1 (en) * 2010-05-14 2014-07-03 Fluidigm, Inc. Assays for the detection of genotype, mutations, and/or aneuploidy
WO2012003374A2 (en) * 2010-07-02 2012-01-05 The Board Of Trustees Of The Leland Stanford Junior University Targeted sequencing library preparation by genomic dna circularization
US20120034603A1 (en) * 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
IN2013MN00522A (ko) * 2010-09-24 2015-05-29 Univ Leland Stanford Junior
US10131947B2 (en) * 2011-01-25 2018-11-20 Ariosa Diagnostics, Inc. Noninvasive detection of fetal aneuploidy in egg donor pregnancies
WO2012142591A2 (en) * 2011-04-14 2012-10-18 The Regents Of The University Of Colorado Compositions, methods and uses for multiplex protein sequence activity relationship mapping
GB2492042B (en) 2011-05-11 2020-04-15 Agilent Technologies Inc Selector probes for nucleic acid analysis comprising at each end a non-adjacent target specific region
CN102344961B (zh) * 2011-09-30 2015-12-09 北京康旭医学检验所有限公司 一种经济的应用大规模平行测序技术检验多目标多基因的方法
CN104093854A (zh) 2011-12-02 2014-10-08 凯杰有限公司 表征组合物中的rna的方法和试剂盒
EP2653559A1 (en) 2012-04-20 2013-10-23 Samsung Electronics Co., Ltd Polynucleotide and use thereof
EP2929048B1 (en) * 2012-12-06 2017-12-13 Agilent Technologies, Inc. Restriction enzyme-free target enrichment
US10150960B2 (en) * 2013-02-26 2018-12-11 Agilent Technologies, Inc. C-probe libraries for DNA target enrichment
US10017820B2 (en) * 2013-03-05 2018-07-10 Agilent Technologies, Inc. Detection of genomic rearrangements by sequence capture
CN104099409B (zh) * 2013-03-05 2020-07-17 安捷伦科技有限公司 长fish探针的合成
JP2016513461A (ja) 2013-03-12 2016-05-16 カウンシル,インコーポレーテッド 出生前遺伝子分析システム及び方法
GB2520763A (en) 2013-12-02 2015-06-03 Vanadis Diagnostics Ab Nucleic acid probe and method of detecting genomic fragments
GB2520765A (en) * 2013-12-02 2015-06-03 Vanadis Diagnostics Ab Multiplex detection of nucleic acids
US10174383B2 (en) * 2014-08-13 2019-01-08 Vanadis Diagnostics Method of estimating the amount of a methylated locus in a sample
GB201507376D0 (en) * 2015-04-30 2015-06-17 Vanadis Diagnostics Ab Use of a porous transparent capillary membrane for counting rolling circle amplification products
KR20180048682A (ko) 2015-09-18 2018-05-10 바나디스 다이아그노스틱스 Dna 샘플의 분석을 위한 프로브 세트 및 이의 사용 방법

Also Published As

Publication number Publication date
US20200071744A1 (en) 2020-03-05
PL3350342T3 (pl) 2020-08-24
ES2963242T3 (es) 2024-03-25
CN106536735B (zh) 2020-01-14
DK3350342T3 (da) 2020-04-27
EP3670671A1 (en) 2020-06-24
EP3670671B1 (en) 2023-07-26
CA2993914A1 (en) 2017-03-23
EP3350342A1 (en) 2018-07-25
RU2753883C2 (ru) 2021-08-24
RU2018113795A (ru) 2019-10-18
US11591639B2 (en) 2023-02-28
US20230159991A1 (en) 2023-05-25
BR112018001686A2 (pt) 2018-09-18
JP6785839B2 (ja) 2020-11-18
WO2017046775A1 (en) 2017-03-23
ES2788737T3 (es) 2020-10-22
CN111154754B (zh) 2024-02-02
US20210024976A1 (en) 2021-01-28
EP3350342B1 (en) 2020-02-19
AU2022202491A1 (en) 2022-05-12
RU2018113795A3 (ko) 2020-02-03
JP2018527915A (ja) 2018-09-27
AU2016325100B2 (en) 2022-01-20
AU2016325100A1 (en) 2018-02-01
CN106536735A (zh) 2017-03-22
US20170081702A1 (en) 2017-03-23
EP3670671C0 (en) 2023-07-26
CN111154754A (zh) 2020-05-15
US10508300B2 (en) 2019-12-17
US10822640B2 (en) 2020-11-03

Similar Documents

Publication Publication Date Title
US11591639B2 (en) Probe set for analyzing a DNA sample and method for using the same
US10711269B2 (en) Method for making an asymmetrically-tagged sequencing library
CN105026577B (zh) 通过序列捕获检测基因组重排
WO2018195217A1 (en) Compositions and methods for library construction and sequence analysis
WO2014114189A1 (en) Methods and compositions for detecting target snp
AU2006226873B2 (en) Nucleic acid detection
JP7152599B2 (ja) 塩基配列決定のためのモジュール式およびコンビナトリアル核酸試料調製のためのシステムおよび方法
CN112996921B (zh) 包含内部5’-5’连接的5’衔接子
JP2022521209A (ja) 改良された核酸標的濃縮および関連方法

Legal Events

Date Code Title Description
E902 Notification of reason for refusal