KR20210116863A - 시료를 분류할 수 있는 AptaSSN 선정 방법 및 장치, 이에 결합하는 분자 동정 방법 및 장치, AptaSSN 집단을 이용한 표적분자 분석 방법 및 장치, 그리고 생물학적 의미 결정지원 시스템 - Google Patents

시료를 분류할 수 있는 AptaSSN 선정 방법 및 장치, 이에 결합하는 분자 동정 방법 및 장치, AptaSSN 집단을 이용한 표적분자 분석 방법 및 장치, 그리고 생물학적 의미 결정지원 시스템 Download PDF

Info

Publication number
KR20210116863A
KR20210116863A KR1020200032963A KR20200032963A KR20210116863A KR 20210116863 A KR20210116863 A KR 20210116863A KR 1020200032963 A KR1020200032963 A KR 1020200032963A KR 20200032963 A KR20200032963 A KR 20200032963A KR 20210116863 A KR20210116863 A KR 20210116863A
Authority
KR
South Korea
Prior art keywords
aptassn
complex
fss
ssn
sample
Prior art date
Application number
KR1020200032963A
Other languages
English (en)
Inventor
김성천
Original Assignee
김성천
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김성천 filed Critical 김성천
Priority to KR1020200032963A priority Critical patent/KR20210116863A/ko
Publication of KR20210116863A publication Critical patent/KR20210116863A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/115Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/205Aptamer

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Library & Information Science (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 다양한 유형의 분자로 구성된 시료를 구성하는 분자집단에 결합하는 AptaSSN 집단 및 이에 결합하는 분자집단을 개발하며, 시료를 분류할 수 있는 AptaSSN 선정, 다중 AptaSSN-기반 다중 분석, 표적분자 분석 및 생물학적 의미 결정지원 시스템의 성능을 향상시키기 위하여 설계된 방법, 시약, 키트 및 장치에 관한 것이다.

Description

시료를 분류할 수 있는 AptaSSN 선정 방법 및 장치, 이에 결합하는 분자 동정 방법 및 장치, AptaSSN 집단을 이용한 표적분자 분석 방법 및 장치, 그리고 생물학적 의미 결정지원 시스템{AptaSSN selection method and apparatus for classifying a sample, molecular identification method and apparatus coupled thereto, target molecule analysis method and apparatus using AptaSSN population, and biological meaning determination support system}
본 발명은 다양한 유형의 분자로 이루어진 시료를 구성하는 분자(M)집단을 분석하여 바이오마커 및 AptaSSN(분자결합 단일가닥핵산)을 동시에 개발하며, 다중 AptaSSN-기반 분석법의 성능을 향상시키기 위하여 설계된 방법, 시약, 키트 및 장치 그리고 내부정도관리 및 생물학적 의미 결정지원 시스템에 관한 것이다. 이러한 방법은 바이오마커의 발굴 및 연구를 위한 도구의 설계와 개발 및 치료법의 개발뿐만 아니라 진단적 적용에 널리 유용하다.
다양한 유형의 분자로 구성된 시료에 있는 분자(M)집단에 유의한 결합 차이가 있는 단일가닥핵산(SSN) 집단 선정 및 이에 상응하는 분자 동정, 특정 분자에 대한 압타머 개발 및 다중 AptaSSN-기반 분자 정량에 관한 분석법은 과학적 연구 및 건강관리 분야에서 중요한 도구이다.
다양한 유형의 분자로 구성된 시료를 구성하는 분자집단을 대상으로 결합 SSN의 개발은 한국 특허 등록번호 10-0923048 및 한국 특허 출원번호 10-2017-0145181이 있다. 다중 압타머 집단과 분자집단을 접촉하여 형성되는 복합체에서 용출된 압타머 집단의 분석은 질량분석기, QPCR, 고체지지체 상에 고정된 하나 또는 그 이상의 압타머를 고정한 마이크로어레이, 압타머에 대한 상보적 염기서열을 고정한 마이크로어레이 및 NGS 장비를 포함하는 다양한 핵산분석 기술을 이용한다.
상기 압타머는 각각 매우 특이적인 방식과 매우 높은 친화력으로 분자에 결합할 수 있다. 일단 압타머 집단이 시료와 접촉하면, 압타머들은 시료 내에 존재하는 각각의 분자들에 결합하고, 그것에 의하여 시료 내 분자들의 부재, 존재, 양 및/또는 농도를 측정할 수 있다.
상기 결합 SSN 선정, 표적분자 동정, 압타머 개발 및 AptaSSN 다중 분석법은 용액-기반 분자 상호작용 및 반응 혼합물의 특정 성분을 제거하도록 설계된 분리 단계 및 M-AptaSSN 복합체를 분리하는 동안 검출될 분자들로부터 시료의 성분을 분리하기 위하여 하나 또는 그 이상의 특이적인 포획 단계 그리고 압타머 다중 분석 및 이를 이용한 생물학적 의미 결정지원 시스템에서 내부 정도관리 기술이 필요하다.
본 발명에서 다양한 유형의 분자로 구성된 시료에 있는 분자집단에 유의한 결합 차이가 있는 AptaSSN 1종류 이상을 선정하기 위한, 임의의 염기서열로 이루어진 부위에 제1 태그가 있는 SSN 라이브러리를 제공한다.
본 발명은 다양한 유형의 분자로 이루어진 시료의 분자집단에 유의한 결합차이가 있는 AptaSSN 선정은 비-특이적 결합으로 인해 발생하는 AptaSSN로부터 진짜(true) AptaSSN만을 효율적으로 확보하는 방법 및 장치를 제공한다.
본 발명은 다양한 유형의 분자집단으로 이루어진 시료를 구성하는 분자에 유의한 결합차이가 있는 AptaSSN 선정 및 특정 분자에 대한 압타머 개발에 있어서 비-특이적 결합의 주요 원인 중 하나는 예상치 못한 비표적/SSN 상호작용 및 SSN/SSN 상호작용의 가능성을 최소화하는 방법 및 장치를 제공한다.
본 발명은 AptaSSN 다중 분석방법에서 생물학적 시료의 커다란 dynamic와 complexity로 인해 다양한 세척 과정으로 백그라운드 시그널을 제거하고 표적/AptaSSN 상호 작용을 유지하면서 발생하는 진짜 시그널을 분석할 수 있도록 극미량 성분도 감지할 수 있는 우수한 민감도와 특이도를 갖는 AptaSSN 다중 분석방법 및 장치 그리고 이에 대한 내부정도관리 방법 및 장치를 제공한다.
본 발명은 다양한 유형의 분자로 이루어진 시료를 구성하는 분자집단에 대한 분자데이터를 이용하여 상기 시료를 생물학적 의미 기준으로 분류하는 내부정도관리 및 생물학적 의미 결정지원 시스템을 제공한다.
본 발명은 시료를 구성하는 분자집단에 유의한 결합차이가 있는 AptaSSN 및 이에 상응하는 표적분자 동정과 분석 그리고, AptaSSN 다중 분석 방법의 성능을 향상시키도록 설계된 방법, 장치, 시약 및 키트를 포함한다. 개시된 방법, 장치, 시약 및 키트는 백그라운드 시그널을 감소시키거나 제거함으로써 시료에 있는 분자의 검출 및/또는 정량화를 위한 고 민감도의 분석법을 제공한다.
단수 형태는 달리 그 내용을 명확하게 지시하지 않는 한 복수의 뜻을 포함하며, "적어도 하나" 및 "하나 또는 그 이상"과 상호 교환적으로 사용된다. 따라서, "압타머"에 대한 언급은 압타머의 혼합물 등을 포함한다.
"결합하다" 및 그것들의 임의의 변형은 태그와 포획성분간의 상호작용 또는 복합체 형성으로 인해, 예를 들어, 주어진 복합체 형성 또는 반응 조건하에서 태그-포획성분 복합체로부터 시료의 비결합된 성분과 같은 "미결합된" 분자의 해리를 가능하도록 충분히 안정한 복합체를 형성하는 것을 말한다.
태그 및 포획성분은 특이도가 있어 상호작용하고 결합함으로써 서로 직접적으로 결합할 수 있다. 태그 및 포획성분은 또한 복합체 형성이 링커에 의해 매개되는 경우와 같이 서로 간접적으로 결합될 수 있다.
본 발명에서는 시료를 구성하는 복수의 분자를 사용하여 분자와 특이적으로 결합하는 “단일가닥핵산(분자결합 SSN, AptaSSN)”와 기존 공지된 다양한 SELEX 방법에 의해 개발된 "증폭이 가능한 구조인 압타머"를 분자 상에 원하는 작용을 하는 비자연발생적 핵산을 칭하기 위하여 상호 교환적으로 사용될 수 있으며, 이들을 총칭하여 “AptaSSN”이라고 하였다. 원하는 작용은 분자와 결합, 분자를 촉매적으로 변화시키는 것, 분자 또는 분자의 기능 활성을 변형하거나 변경하는 방법으로 분자과 반응시키는 것, 분자에 공유적으로 결합하는 것 및 분자와 다른 분자 사이에서의 반응을 용이하게 하는 것을 포함하나 이로 한정되는 것은 아니다.
상기 작용은 왓슨/크릭 염기쌍(Watson/Crick base pairing) 또는 삼중 나선 형성(triple helix formation)과는 관계없는 메커니즘을 통하여 핵산 리간드와 결합하는 폴리뉴클레오티드와는 다른 삼차원 화학구조인 분자와 같은 분자에 대한 특이적 결합 친화력이며, 여기에서 압타머는 분자에 얽매여 있는 공지의 생리학적 기능을 가지는 핵산은 아니다.
주어진 분자에 대한 압타머는 압타머가 분자의 리간드인 경우, (a) 분자와 후보 혼합물을 접촉시키는 것, 여기에서 상기 후보 혼합물에서 다른 핵산과는 상대적으로 분자에 대하여 증가된 친화력을 가지는 핵산은 후보 혼합물의 나머지로부터 분리될 수 있고; (b) 후보 혼합물의 나머지로부터 증가된 친화력의 핵산을 분리하는 것; 및 (c) 분자의 압타머가 확인되어야 하는 리간드가 풍부한(ligand-enriched) 핵산 혼합물을 얻기 위하여 증가된 친화력의 핵산을 증폭시키는 것을 포함하는 방법에 의하여, 핵산의 후보 혼합물로부터 확인되는 핵산을 포함한다.
친화 상호작용(affinity interaction)은 정도의 문제이지만, 그것의 분자에 대한 압타머의 "특이적 결합 친화력"은 압타머가 일반적으로 혼합물 또는 시료에 있는 다른 비분자 성분에 그것이 결합하는 것보다 더 높은 정도의 친화력으로 그것의 분자에 결합한다는 것을 의미하는 것으로 인식된다.
압타머(Aptamer)는 임의의 적절한 수의 뉴클레오티드를 포함할 수 있다. 서로 다른 압타머들은 같거나 다른 수의 뉴클레오티드를 가질 수 있다. 압타머들은 DNA 또는 RNA일 수 있고, 단일가닥(single stranded), 이중가닥(double stranded) 이거나 이중가닥 또는 삼중가닥(triple stranded) 영역을 포함할 수 있다. 압타머들은 원하는 염기가 변형된 뉴클레오티드의 임의의 조합을 가지도록 설계될 수 있다.
압타머는 SELEX 방법을 포함한 임의의 공지의 방법을 사용하여 확인될 수 있다. 예를 들어, 미국 특허등록번호제 5,475,096("Nucleic Acid Ligands") 참조. 일단 확인되면, 압타머는 화학적 합성 방법 및 효소적 합성 방법을 포함하는 임의의 공지의 방법에 따라 제조되거나 합성될 수 있다.
본 발명에서 생물학적 시료들 및 다른 시료를 구성하는 분자에 유의하게 결합된 양에서 차이가 있는 결합 SSN 및 이에 상응하는 분자 동정, 특정 분자에 대한 압타머 개발 그리고, AptaSSN 다중 분석법에서 "M-SSN 복합체" 또는 "M-AptaSSN 복합체"는 SSN 또는 AptaSSN와 표적 분자의 상호작용에 의해 형성된 비공유적 복합체를 지칭하기 위해 본 발명에서 상호 교환적으로 사용되었다. "M-AptaSSN 복합체"는 하나 이상의 이러한 복합체의 세트를 말한다. "M-SSN 복합체" 또는 M-AptaSSN 복합체는 일반적으로 주위 조건의 변화, 예를 들어, 온도의 증가, 염 농도의 증가 또는 변성제의 첨가에 의해 전환되거나 해리될 수 있다. 즉, “결합 SSN”와 “압타머” 그리고 “분자”와 ‘표적“은 본 발명에서 상호 교환적으로 사용할 수 있다.
압타머와 표적분자의 비공유적 복합체가 제공된다면, 여기에서 상기 압타머는 약 100 nM 미만인 분자에 대한 Kd를 가지며, 여기에서 (복합체의 반감기:t1/2로 주어지는) 상기 분자로부터 압타머의 해리율은 약 30분 이상이고/이거나; 여기에서 상기 압타머의 핵산 서열에 있는 하나, 여러 개 또는 모든 피리미딘은 염기의 5-위치에서 변경된다.
압타머는 사실상 임의의 크기를 가지는 임의의 화학적 또는 생물학적 분자로 확인될 수 있으므로, 사실상 임의의 크기를 가지는 임의의 화학적 또는 생물학적 분자는 적절한 표적이 될 수 있다. 표적은 또한 표적과 AptaSSN 간의 상호 작용의 가능성 또는 세기를 강화시키기 위해 변경될 수 있다. 분자는 또한 상기에 기재된 것과 같이 태그를 포함하도록 변경될 수 있다. 예시적 구현에서, 분자는 단백질이다. SELEX 분자가 펩티드인 방법에 대한 미국 특허등록번호 제6,376,190호("Modified SELEX Processes Without Purified Protein")를 참조하라.
"비특이적 복합체"는 압타머와 표적 분자를 제외한 두 개 또는 그 이상의 비표적 분자간의 비-공유적 결합을 말한다. 비특이적 복합체는 압타머와 비표적 분자간의 친화성 상호 작용을 기반으로 선택되는 것이 아니라 압타머와 비표적 분자간의 상호작용을 나타내는 것이므로, 비특이적 복합체의 구성 성분들은 평균적으로 서로 더욱 낮은 친화력을 나타낼 것이며, 압타머와 비표적 분자보다 상대적으로 높은 해리율을 가질 것이다. 비특이적 복합체는 압타머와 비표적, 압타머와 다른 압타머, 경쟁자와 비표적, 경쟁자와 표적, 압타머와 경쟁자 및 분자와 비분자간에 형성된 복합체뿐만 아니라, 압타머, 분자, 비표적자, 표면 및 경쟁자의 고차원적 응집체를 포함한다.
"비-표적 분자" 및 "비-표적"은 AptaSSN와 비특이적인 복합체를 형성할 수 있는 시료 내에 포함된 분자를 말하는 것으로 상호교환적으로 사용된다. 제1 AptaSSN에 대한 비-표적는 제2 AptaSSN에 대한 표적이 될 수 있음을 확인할 수 있을 것이다. 마찬가지로, 제1 AptaSSN에 대한 표적은 제2 AptaSSN에 대한 비-표적이 될 수 있다.
"뉴클레오티드(nucleotide)는 리보뉴클레오티드(ribonucleotide) 또는 디옥시리보뉴클레오티드(deoxyribonucleotide) 또는 그것들의 변경된 형태뿐만 아니라 그것들의 유사체(analog)를 칭한다. 뉴클레오티드는 퓨린(purines)(예를 들어, 아데닌(adenine), 하이포크산틴(hypoxanthine), 구아닌(guanine) 및 그것들의 유도체 및 유사체)뿐만 아니라 피리미딘(pyrimidines)(예를 들어, 시토신(cytosine), 우라실(uracil), 티민(thymine) 및 그것들의 유도체 및 유사체)를 포함하는 종류들을 포함한다.
"핵산(nucleic acid)", "올리고뉴클레오티드(oligonucleotide)" 및 "폴리뉴클레오티드(polynucleotide)는 뉴클레오티드의 중합체를 칭하기 위하여 상호교환적으로 사용되며, DNA, RNA, DNA/RNA 하이브리드 및 이러한 종류의 핵산, 올리고뉴클레오티드 및 폴리뉴클레오티드의 변경들을 포함하고, 여기에서 임의의 위치에서 뉴클레오티드 유닛에 대한 다양한 독립체 또는 부분들의 결합도 포함된다. "폴리뉴클레오티드(polynucleotide)", "올리고뉴클레오티드(oligonucleotide)" 및 "핵산(nucleic acid)"은 이중가닥 또는 단일가닥 분자뿐만 아니라 다중 가닥(즉, 삼중-나선) 분자도 포함한다. 핵산, 올리고뉴클레오티드 및 폴리뉴클레오티드는 용어 압타머보다 더 넓은 용어이므로, 상기 용어 핵산, 올리고뉴클레오티드 및 폴리뉴클레오티드는 압타머인 뉴클레오티드의 중합체는 포함하지만, 상기 용어 핵산, 올리고뉴클레오티드 및 폴리뉴클레오티드는 압타머로 한정되지는 않는다.
“단일가닥핵산 라이브러리”는 임의의 염기서열로 구성된 단일가닥핵산(single stranded nucleic acid, SSN)을 최소한 포함하는 SSN 집단으로 임의의 염기서열을 구성하는 염기의 수가 40인 경우 약 1024의 염기서열이 생길 수 있어 높은 다양성을 유지할 수 있다.
“분자”, "표적분자", 및 "표적"은 시료에 존재할 수 있는 임의의 관심 분자를 칭하기 위하여 본 발명에서 상호 교환적으로 사용된다. "관심 분자"는 예를 들어, 단백질의 경우에 아미노산 서열에서의 경미한 변화, 이황화 결합 형성(disulfide bond formation), 글리코실화(glycosylation), 지질화(lipidation), 아세틸화(acetylation), 인산화(phosphorylation), 또는 분자의 본질(identity)을 실질적으로 변경시키지 않는 표지 성분(labeling component)과의 결합과 같은 임의의 다른 조작(manipulation) 또는 변경(modification)과 같은 특정 분자의 임의의 경미한 변화(minor variation)를 포함한다. 대M인 분자 또는 M은 핵산(nucleic acids)를 제외한 단백질(proteins), 폴리펩티드(polypeptides), 탄수화물(carbohydrates), 지질(lipids), 다당류(polysaccharides), 당단백(glycoproteins), 호르몬(hormones), 수용체(receptors), 항원(antigens), 항체(antibodies), 애피바디(affibodies), 항체 모방체(antibody mimics), 바이러스(viruses), 병원체(antibody mimics), 독성 분자(toxic substances), 기질(substrates), 대사분자(metabolites), 전이상태 유사체(transition state analogs), 보조인자(cofoactors), 억제제(inhibitors), 약물(drugs), 염료(dyes), 영양분(nutrients), 성장 인자(growth factors), 세포(cells), 조직(tissues) 및 임의의 앞서 말한 것들의 임의의 단편 또는 부분을 포함한다.
"폴리펩티드", "펩티드" 및 "단백질"은 임의의 길이를 가지는 아미노산의 폴리머를 말하는 것으로 본 발명에서 상호교환적으로 사용된다. 상기 폴리머는 직선이거나 분지될 수 있고, 변경된 아미노산을 포함할 수 있으며, 비-아미노산에 의해 중단될 수 있다. 상기 용어들은 또한 자연적으로 변경되거나 예를 들어, 이황화 결합 형성(disulfide bond formation), 당화(glycosylation), 지질화(lipidation), 아세틸화(acetylation), 인산화(phosphorylation) 또는 표지된 성분과의 결합과 같은 임의의 다른 조작 또는 변경과 같은 조정에 의한 아미노산 폴리머를 포함한다. 또한 정의 내에는 예를 들어, 당업계에 공지된 다른 변경뿐만 아니라 아미노산(예를 들어, 비천연 아미노산 등을 포함)의 하나 또는 그 이상의 유사물을 포함하는 폴리펩티드도 포함된다. 폴리펩티드는 단일 사슬 또는 결합된 사슬일 수 있다.
"분자데이터"는 복수의 분자로 구성된 시료의 모든 측정가능한 특징의 실질적인 정보를 말한다. 이런 특징 또는 변수는 이것으로 제한되는 것은 아니지만 세포 집단 및 이들의 관련 하나 이상의 분자의 수준, 하나 이상의 용해성 인자의 수준, 하나 이상의 기타 분자의 수준, 유전자형 정보, 유전자 발현 수준 및 유전자 돌연변이를 포함한다. 이런 특징 또는 변수는 모든 시간별 데이터 및 현재 데이터를 포함한다. 예를 들면, 유기체의 완성된 분자데이터는 과거의 모든 시점에서 이런 특징 모두 뿐만 아니라 현시점에서 모든 측정가능한 특징을 포함한다.
"용해성 인자" 는 세포 집단 또는 세포 관련 분자가 아닌 생물학적 시료 또는 조직의 임의의 측정 가능한 구성성분을 의미한다. 용해성 인자는, 이것으로 제한되는 것은 아니지만, 용해성 단백질, 탄수화물, 지질, 당단백질, 스테로이드, 금속성, 무기성, 이온성, 유기금속성 종을 포함한 기타 소분자, 및 사이토카인 및 용해성 수용체와 같은 상기 성분의 임의의 착물 항체와 항원 및 임의의 것과 착화된 약물이 포함된다. 용해성 인자는 사이토카인, 항체, 급성기 단백질 등과 같은 자기유래의 것 및 화학약품, 감염성 질환의 생산물, 장내 세균과 동물군과 같은 외래의 것일 수 있다. 용해성 인자는 유기체 의해 생산된 내재성일 수 있고 또는 바이러스, 약물 또는 환경적인 독소와 같은 외인성일 수 있다. 용해성 인자는 프로스타글라딘, 비타민, 대사산물(예를 들면, 철, 설탕, 아미노산 등)과 같은 소분자 화합물일 수 있다.
본 발명은 시료에 대한 분자데이터, 이런 분자데이터를 얻기 위한 방법 및 바이오마커를 동정하는 것을 포함하여 이런 분자데이터를 이용하기 위한 방법을 제공한다.
"시료"는 임의의 분자, 용액 또는 다수의 분자를 포함하는 혼합물을 말하며, 적어도 하나의 분자를 포함할 수 있다. 상기 시료는 하기에 정의된 것과 같은 생물학적 시료와, 예를 들어, 오염되거나 오염된 가능성이 있는 물 및 공업폐수와 같은 환경 또는 독물 검사를 위하여 사용될 수 있는 시료를 포함한다. 시료는 또한 최종 생성물, 중간 생성물 또는 예를 들어, 제조 공정과 같은 준비하는 과정에서의 부산물일 수 있다. 시료는 생물 또는 어떤 다른 공급원(예를 들어, 환경 또는 공업원)으로부터 얻어진 분자, 용액 또는 혼합물이 첨가된 임의의 적절한 분석 매질, 완충액 또는 희석제를 포함할 수 있다.
"생물학적 시료"는 생물로부터 얻어진 임의의 분자, 용액 또는 혼합물을 말한다. 이것은 (전혈(whole blood), 백혈구(leukocyte), 말초혈액 단핵세포(peripheral blood mononuclear cells), 혈장 및 혈청을 포함하는) 혈액, 가래(sputum), 입김(breath), 소변(urine), 정액(semen), 침(saliva), 뇌막액(meningeal fluid), 양수(amniotic fluid), 선액(glandular fluid), 림프액(lymph fluid), 유두 흡인물(nipple aspirate), 기관지 흡인물(bronchial aspirate), 활액(synovial fluid), 관절 흡인물(joint aspirate), 세포, 세포 추출물 및 뇌척수액(cerebrospinal fluid)을 포함한다. 이것은 또한 대M으로 앞서 말한 모든 것들의 분리된 단편들을 포함한다. 상기 용어 "생물학적 시료"는 또한 예를 들어, 대변 시료, 조직 시료 또는 조직 생검과 같은 것으로부터의 분자, 용액 또는 균질화된 고형 분자를 포함하는 혼합물을 포함한다. 상기 용어 "생물학적 시료"는 또한 조직 처리, 세포 처리, 세균 처리 또는 바이러스 처리 또는 무세포 생물학적 시스템(cell free biological system)(예를 들어, IVTT)으로부터 유래된 분자, 용액 또는 혼합물을 포함한다.
실험 시료, “비교 시료”는 대조 시료와 비교될 수 있다. "대조 시료"는 본 발명에서 다수의 분자를 함유하며 적어도 하나의 분자를 포함한다고 알려져 있는 임의의 분자, 용액 또는 혼합물을 말한다. 대조 시료 내에 존재하는 임의의 M의 정확한 양 또는 농도 또한 잘 알려져 있을 수 있다. 대조 시료와 비교 시료를 합하여 “분석 시료”라고 지칭하였다. 상기 용어 대조 시료는 본 발명에 정의된 바와 같은 생물학적 시료 및 예를 들어, 오염되거나 오염되었을 가능성이 있는 물 및 공업폐수와 같은 환경 또는 독소 테스트를 위해 사용될 수 있는 시료를 포함한다. 대조 시료는 또한 최종 산물, 중간 산물 또는 제조 공정, 예를 들어 준비 과정의 부산물일 수 있다. 대조 시료는 생물 또는 다른 어떤 공급원(예를 들어, 환경원 또는 공업원)으로부터 얻어진 분자, 용액 또는 혼합물에 첨가될 수 있는 임의의 적절한 분석 배지, 버퍼 또는 희석제를 포함할 수 있다.
“생물학적 의미”는 (a) 상기 시료 또는 시료를 채취한 사람의 생리적인 변화를 의미하고, 상기 임상검사 값에 상응하여 예방, 진단, 치료, 완화와 처치의 건강관리를 목적으로 의사 결정(Decision Making)을 하는 과정에 필요한 정보이거나, (b) 질병이나 다른 상태를 진단, 치료, 완화, 처치, 예방을 목적으로 생물학적 의미에 관한 의사 결정(Decision Making)을 하는 과정을 지원하는 “분류”, “점수”, “지수”를 의미하고, 생물학적 의미가 결정된 시료 또는 시료를 채취한 사람의 임상 정보(Clinical Information) 및 상기 생산된 다중의 분자 값들을 수집한 후, 통계학적 기법 또는 기계학습알고리즘을 이용하여 상기 수집한 정보들로부터 질환을 추론 또는 판별할 수 있도록 생산된 특이적 결과이다.
본 발명은 생물학적 시료들 및 다른 시료를 구성하는 분자집단에 유의하게 결합하는 양의 차이가 있어 시료를 분류할 수 있는 SSN 선정 방법을 제공한다.
도 1은 임의의 염기서열 영역을 포함하는 출발 라이브러리로부터 제조된 단일가닥핵산(SSN) 라이브러리로 다양한 유형의 분자로 구성된 시료에 있는 분자집단에 특이적이고 유의하게 결합하는 양의 차이가 있는 단일가닥핵산(SSN) 집단 및 이에 상응하는 분자를 선정하는 방법을 제시하는 도면이다.
출발 라이브러리에서 제조된 SSN에 제1 태그를 부가한 단일가닥핵산와,현탁 상태 제1 고체지지체(FSS)를 사용한 SSN-FSS 복합체 라이브러리를 제조하여 분자를 포획하여 제1 분리를 한다, 상기 수확한 복합체의 분자에 제2 태그를 부가하여 고정 상태 제2 고체지지체와 복합체를 형성한다. 상기 형성된 복합체를 제2 분리하여 용출된 결합 SSN을 증폭하는 선택 및 증폭 단계를 반복하며 추가적으로 분석 단계를 포함하는 방법으로 실시할 수 있다.
본 발명은 도 1에 제시한 바와 같은, 상기 분자데이터 생산 기술로 Nontarget Proteomics를 실시하면서 동시에 바이오마커 및 리간드 개발 방법을 제공할 수 있다.
도 2는 AptaSSN 집단으로 Target Proteomics를 실시하여 바이오마커 개발 방법을 제공하는 도면이다.
도 3은 다양한 유형의 분자로 구성된 시료를 대상으로 한 AptaSSN 다중 분석은 제조된 AptaSSN 집단에 제1 태그를 부가하여 현탁 상태 제1 고체지지체(FSS)를 사용한 AptaSSN-FSS 복합체 라이브러리를 제조하는 도면이다. 상기 제조한 복합체로 분자을 포획하여 제1 분리를 한다, 상기 수확한 복합체의 분자에 제2 태그를 부가하여 고정 상태 제2 고체지지체(SSS)와 복합체를 형성한다. 상기 형성된 복합체를 제2 분리하고 결합 AptaSSN을 용출하고 이를 증폭하는 분석 단계를 포함하는 방법으로 실시할 수 있다.
Ⅰ. AptaSSN의 선정
1. 출발 라이브러리
본 명세서에서 임의의 염기서열로 이루어진 단일가닥핵산 집단을 “출발 라이브러리”라고 하였다.
본 발명에서 출발 라이브러리는 기 공지된 방법으로 유기합성하거나, 핵산을 최소한 포함하는 생물학적 시료에서 추출된 핵산 집단일 수도 있다. 핵산 집단의 추출은 핵산의 종류 즉, DNA 와 RNA에 따라 다르게 하는데, 공지된 방법으로 실시할 수 있다(Maniatis, Tom, E. F. Fritsch, and Joseph Sambrook. Molecular Cloning: A Laboratory Manual. Cold Spring Harbor, N.Y.: Cold Spring Harbor Laboratory, 1982.).
본 명세서에서 용어 “핵산”은 DNA (gDNA 및 cDNA) 그리고 RNA 분자를 포괄적으로 포함하는 의미를 갖으며, 핵산에서 기본 구성 단위인 뉴클레오타이드는 자연의 뉴클레오타이드뿐만 아니라, 당 또는 염기 부위가 변형된 유사체 (analogue)도 포함할 수 있다(Scheit, Nucleotide Analogs, John Wiley, New York(1980); Uhlman 및 Peyman, Chemical Reviews, 90:543-584(1990)).
상기 핵산 집단은 유전자 또는 그의 단편, DNA, mRNA, rRNA, tRNA 및 다른 비-코딩(non-coding) RNA에서 유래하는 genomic DNA와 cDNA를 포함하는 군에서 선택되어진 어느 하나로부터 공지된 방법으로 단일가닥핵산 라이브러리를 제조할 수 있다.
본 발명에서 다양한 유형의 분자집단으로 구성된 시료에 있는 핵산 집단을 분석하기 위한 출발 라이브러리는 생물학적 시료에서 공지된 방법으로 추출된 핵산 집단으로부터 절편화 과정으로 제조할 수 있다. 상기 절편화 방법은 공지된 물리적인 방법과 생물학적인 방법으로 수행할 수 있다(Maniatis, Tom, E. F. Fritsch, and Joseph Sambrook. Molecular Cloning: A Laboratory Manual. Cold Spring Harbor, N.Y.: Cold Spring Harbor Laboratory, 1982.).
도 4는 상기 핵산 분자를 제외한 분자 유형에 대한 출발 라이브러리에 대한 도면이다.
출발 라이브러리의 구조는 구조식(1)은 고정서열-임의의 염기서열-고정서열 구조체(구조식 1)이거나 임의의 염기서열 구조체(구조식 2)인 단일가닥핵산(SSN), 올리고뉴클레오타이드 집단이다.
5'-5' 고정서열(C1)-가변서열-3' 고정서열(C2)-3' (구조식 1)
5'-가변서열-3' (구조식 2)
본 발명에서 상기 출발 단일가닥핵산은 무작위 서열과 효율적인 증폭에 필요한 고정 상태서열을 포함할 수 있다. 통상적으로, 상기 출발 단일가닥핵산은 15∼60 개의 무작위 뉴클레오티드로 이루어진 내부 영역의 측면에 존재하는 5' 말단 고정서열(C1) 및 3' 말단 고정서열(C2)을 가질 수 있다.
상기 출발 단일가닥핵산으로부터 단일가닥(Single strand: SS) 또는 이중가닥(Double strand: DS) 라이브러리, RNA 라이브러리, 결합 SSN 라이브러리, 균등 또는 차등 결합 SSN 라이브러리를 제조할 수 있다.
상기 출발 단일가닥핵산의 가변서열은 전형적으로 분자에 대해 각각의 분자 결합 부위를 제공하고, 이 가변서열은 완전하게 무작위화되거나(즉, 임의의 위치에서 염기를 찾을 가능성은 4개 중 1개이다) 부분적으로 무작위화(즉, 임의의 위치에서 염기를 찾을 가능성은 1 및 100 퍼센트 사이의 임의의 레벨에서 선택될 수 있다)될 수 있다. 상기 양쪽의 고정 서열의 사이에 다양성이 있는 가변서열의 임의의 염기서열이 최소 15개 이상에서 100개 이하로 존재하는 올리고뉴클레오티드이다.
상기 출발 단일가닥핵산의 가변서열을 구성하는 무작위 서열을 합성하기 위한, 모두 4종의 뉴클레오티드 혼합물을 합성 과정중의 각 뉴클레오티드 부가 단계에 첨가하여, 뉴클레오티드가 무작위로 혼입될 수 있도록 한다. 상기 올리고뉴클레오티드는 변형 또는 비변형 DNA, RNA 또는 DNA/RNA 하이브리드일 수 있다. 상기 무작위 단일가닥핵산은 전부 무작위 서열이거나 부분적으로 무작위 서열을 포함할 수도 있다. 부분적으로 무작위 서열은 각각의 부가 단계에서 4가지 뉴클레오티드를 상이한 몰 비로 첨가함으로써 제조할 수 있다. 통상적으로, 상기 단일가닥핵산은 15∼60 개의 무작위 뉴클레오티드로 이루어진 내부 영역의 측면에 존재하는 일정한 5' 및 3' 고정 상태서열을 가진다.
무작위 뉴클레오티드는 화학적 합성 및 무작위 절단된 세포내 핵산의 크기별 선별을 포함한 다수의 방법으로 생산할 수 있다. 핵산 내 서열 변이는 또한 선별/증폭 과정을 반복 실시하기 이전 또는 도중에 돌연변이 유발법으로 도입하거나 또는 증가시킬 수 있다. 올리고뉴클레오티드의 무작위 서열부분은 임의의 길이를 가질 수 있으며, 리보뉴클레오티드-데옥시리보뉴클레오티드를 포함할 수 있고, 또한 변형 또는 비-천연 뉴클레오티드 또는 뉴클레오티드 유사체를 포함할 수 있다.
무작위 올리고뉴클레오티드는 해당 업계에 널리 공지된 고상 올리고뉴클레오티드 합성 기술을 이용하여 포스포디에스테르-결합 뉴클레오티드로부터 합성할 수 있다. 무작위 올리고뉴클레오티드는 트리에스테르 합성 방법과 같은 용액상 방법을 이용하여 합성할 수도 있다. 자동화된 DNA 합성 장비를 사용하여 수행한 통상의 합성 결과, 1014~ 1016개(대부분의 셀렉스 실험에 사용하기에 충분한 수)의 개별 분자들이 생산된다. 서열 디자인에 있어서 무작위 서열의 충분히 거대한 영역은 각각의 합성 분자이 독특한 서열을 나타낼 가능성을 높여준다.
전형적으로, 상기 <구조식 1>의 고정서열은 하기에 기재된 증폭 단계에 도움을 주거나, 상기 출발 라이브러리에서 단일가닥핵산의 주어진 구조적 배열의 가능성을 강화시키기 위해 선택되어진다.
상기 <구조식 1>의 고정서열은 사전선별용으로 혼입된 집단에 존재하는 올리고뉴클레오티드에 공통된 서열로서, 예를 들어 이하에 설명되어 있는 CpG 모티프, PCR 프라이머에 대한 혼성화 부위, RNA 중합효소(예, T3, T4, T7 및 SP6)에 대한 프로모터 서열, 제한 부위 또는 단일중합체 서열, 예를 들어 폴리 A 또는 폴리 T 트랙, 촉매 중심부, 친화성 컬럼에 선별 결합하는 부위 및 관심 올리고뉴클레오티드의 클로닝-서열 결정을 촉진하는 기타 서열 등이 있다.
상기 <구조식 1>의 고정서열은 전 염기서열의 절반 정도 차지하고 있다. 이런 일정한 서열은 임의의 염기서열을 갖는 가변서열과 비특이적 상호작용을 하여 올리고뉴클레오티드 라이브러리의 복잡성을 제한하는 경우가 발생한다.
상기 문제를 극복하기 위해, 유기합성 등 다양한 방법에 의해 제작되는 고정 상태서열이 없는 출발 단일가닥핵산으로 이루어진 라이브러리를 이용하여 표적분자에 대한 결합 SSN을 개발하는 기술인 “primer free” 셀렉스(selex) 기술이 제안되고 있으며 <구조식 2> 구조이다.
본 발명에서 제안하고 있는 차등 또는 균등 공정에는 고정 서열이 요구됨으로, 이를 위해 “primer free” 셀렉스 결과 산물의 출발 단일가닥핵산에 인위적으로 상기 공정이 가능한 염기서열을 부가하여 필요한 공정을 수행할 수 있다.
본 발명은 <구조식 1>의 5'고정서열(C1)과 3'고정서열(C2)을 <구조식 2> 구조의 올리고뉴클레오티드에 부가 반응하여 상기 <구조식 1> 구조의 단일가닥핵산(SSN), 올리고뉴클레오티드로 이루어진 라이브러리로 제조할 수도 있다.
본 발명에서는 <구조식 2> 출발 라이브러리와 시료를 구성하는 분자집단을 접촉시켜 형성된 M-결합 SSN 복합체 집단서 분리된 결합 SSN 라이브러리의 결합 SSN에 <구조식 1>의 5'고정 서열(C1)의 염기서열과 3'고정 서열(C2)의 염기서열로 제작된 올리고뉴클레오티드를 부가하여 결합 SSN 라이브러리를 제작할 수 있다.
본 발명에서 상기 <구조식 1>의 출발 단일가닥핵산의 5' 말단 부위는 5'고정 상태서열, 및 3' 말단 부위는 3'고정 서열로 구성되며 상기 고정서열은 PCR 공정이 가능하도록 프라이머가 상보적으로 결합할 수 있는 위치를 제공할 수 있도록 제조되어야 한다.
도 5는 상기 출발 단일가닥핵산 구조 <구조식 1>로부터 DS 올리고뉴클레오티드 라이브러리 제조를 위한 프라이머에 대한 도면이다.
도 5에 제시한바와 같이, 상기 출발 단일가닥핵산 구조 <구조식 1>의 5' 및 3'고정서열은 DS 올리고뉴클레오티드 라이브러리의 제조 공정에 필수적인 프라이머 쌍(DS 프라이머 C1과 C2')이다.
도 6은 SSN 라이브러리 제조를 위한 프라이머에 대한 도면이다.
도 6을 참조하면, RNA 올리고뉴클레오티드 라이브러리 제조의 주형인 DS 올리고뉴클레오티드의 제조에 필수적인 프라이머 쌍(T7 프라이머와 DS 프라이머 C2')와 같다.
본 발명에서 상기 출발 라이브러리에서 제조된 단일가닥핵산 라이브러리는 중앙영역의 의임의 염기서열과 양족 말단 고정서열로 이루어진 단일가닥핵산과 상기 양쪽 말단에서 선택되어진 어느 하나에 제1 태그가 있는 단일가닥핵산을 제공한다.
바람직하게, 본 발명에서는 RNA SSN 라이브러리 제조의 경우, 상기 단일가닥핵산 라이브러리를 DS 프라이머 C2'와 T7 프로모터 염기서열과 5'고정서열을 포함하는 T7 프라이머를 이용한 PCR 공정으로 DS DNA 라이브러리를 제조하고 생체외 전사반응으로 RNA SSN 라이브러리를 제조할 수 있다.
바람직하게, 본 발명에서 RNA SSN 라이브러리에서 DS DNA 라이브러리 제조의 경우, DS 프라이머 C2'를 이용하여 역전사하여 cDNA를 제조하고 DS 프라이머 C1과 C2'를 사용하여 PCR 공정으로 DS DNA를 제조할 수 있다.
상기에서 제조된 단일가닥핵산 라이브러리와 분자집단으로 구성된 생물학적 시료가 접촉하여 제조된 결합 SSN 라이브러리는 다양성과 dynamic range가 너무 높아, 생물학적 시료에서 많은 어려움이 있다.
상기 문제들을 극복하기 위하여, 생물학 시료에 대해 제조된 결합 SSN 라이브러리를 구성하는 결합 SSN들의 출현빈도를 일정하게 하는 균등화(normalization) 공정, 대조군과 시험군에 대한 결합 SSN 라이브러리에서 어느 한 군에 차등적으로 존재하는 결합 SSN 집단을 선정하는 차등화(differential screening) 공정 및 대조군과 시험군에 대한 결합 SSN 라이브러리에서 어느 한 군에 차등적으로 존재하는 결합 SSN 집단을 선정하고 균등화하는 Suppression Subtractive Hybridization 공정을 실시할 수 있다.
도 7, 도 8과 도 9는 상기 결합 SSN 라이브러리에서 균등(normalization, Curr Protoc Mol Biol. 2010 Apr;Chapter 5:Unit 5.12.1-27.), 차등(differential screening, Biotechniques. 1997 Dec;23(6):1084-6.) 및 Suppression Subtractive Hybridization(Proc. Natl. Acad. Sci. USA Vol. 93, pp. 6025-6030, June 1996) 과정을 수행하는 테스터 제조는 라이게인션 방법과 PCR 방법으로 실시할 수 있으며, 이에 필요한 프라이머와 아댑터에 대한 도면이다.
도 7와 도 8을 참조하면, AptaSSN 라이브러리의 균등, 차등 및 suppression subtractive hybridization 과정을 상기 PCR 방법으로 실시할 경우 상기 AptaSSN은 균등, 차등과 suppression subtractive hybridization 과정에 필요한 프라이머 쌍의 결합위치를 제공할 수 있어야 한다.
상기 PCR 방법은 상기 DS 프라이머 C1과 C2'에 특정서열을 부가하여 제작된 프라이머(테스터1에 대한 특정서열 프라이머 T1-1/T1-2 그리고 테스터2에 대한 특정서열 프라이머 T2-1/T2-2) 그리고 상기 DS 플라이머 C1과 C2'를 상황에 따라 사용하여 테스터1과 테스터2를 제조할 수 있다.
도 9을 참조하면, AptaSSN 라이브러리의 균등, 차등 및 suppression subtractive hybridization 과정을 수행하는 라이게이션 방법은 특정서열을 포함하는 아댑터를 시험시료의 DS DNA AptaSSN에 라이게이션하여 테스터1과 테스터2를 제조할 수 있다.
상기 라이게이션 또는 PCR 방법에 의한 테스터 제조에 사용되는 특정서열은 SS 올리고뉴클레오티드의 양쪽 말단에 ITR(Inverted Terminal Repeats)가 있으며 그 ITR 사이에 특정부위에 상응하고 ITR보다 길이가 짧은 프라이머를 사용한 상기 SS 올리고뉴클레오티드의 PCR 증폭을 억제하는 역할을 할 수도 있다, PS(PCR suppression, PCR 억제)의 원리는 올리고뉴클레오티드가 머리핀 모양을 채택하도록 설계하는 것이다. PS는 원하는 서열의 증폭을 허용하고 원치 않는 서열의 증폭을 동시에 억제한다. PS 용 팬 손잡이 형 줄기-루프(stem-loop) 올리고뉴클레오티드 구조는 긴 GC가 풍부한 특정서열을 SS 올리고뉴클레오티드에 연결함으로써 제작할 수 있다.
2. 단일가닥핵산 라이브러리
도 10는 다양한 유형의 분자가 있는 시료에서 핵산 및/또는 단백질 등의 특정 유형의 분자집단과 SSN 라이브러리로부터 결합 SSN, 실험군과 대조군에 대한 결합 SSN 프로파일, 차등결합 SSN 평가 및 선정과 표적분자의 동정 방법을 제공하는 도면이다.
본 발명에서 상기 출발 라이브러리에서 제조된 단일가닥핵산 라이브러리는 중앙영역의 의임의 염기서열과 양족 말단 고정서열로 이루어진 단일가닥핵산과 상기 양쪽 말단에서 선택되어진 어느 하나에 제1 태그가 있는 단일가닥핵산을 제공한다.
상기 출발 라이브러리에서 SSN 라이브러리를 하기와 같이 제조할 수 있다. 본 발명에서는 상기 <구조식 1> 또는 <구조식 2> 구조의 출발 라이브러리에서 SSN 라이브러리를 제조하는 방법을 제공한다.
<구조식 1>의 출발 단일가닥핵산으로 이루어진 출발 라이브러리에서 SSN 라이브러리를 효소학적인 방법으로 제조하는 방법을 다음과 같다. 상기 출발 라이브러리는 일반적인 유기합성 방법으로 합성하여 사용할 수도 있다.
본 발명에 사용하는 상기 <구조식 1>인 출발 단일가닥핵산으로 이루어진 출발 라이브러리로부터 SS RNA 또는 SS DNA 라이브러리를 제조할 수 있다.
바람직하게, 도 4의 <구조식 1> 구조인 출발 단일가닥핵산으로 이루어진 출발 라이브러리로부터 SS RNA 라이브러리 제조방법은, 단일가닥핵산을 주형으로 하여 상기 T7 프라이머 P3 및 상기 DS 프라이머 C2'로 PCR를 수행하여 T7 프로모터가 있는 이중가닥 DNA 절편을 제조한다. 상기 제조된 이중가닥 DNA 절편을 주형으로 생체외 전사하여 SS RNA 올리고뉴클레오티드를 제조하고 3‘말단에 태그를 부착함으로써 상기 염기서열 구조체(1)인 SS RNA 라이브러리를 얻을 수 있다.
바람직하게, 도 4의 <구조식 1> 구조인 SS DNA 라이브러리 제조의 경우는 상기 DS 프라이머 C1과 C2'를 이용하여 One way-PCR 공정을 실시하여 SS DNA 올리고뉴클레오티드를 얻고 3‘말단에 바이오틴을 부착함으로써 SS DNA라이브러리를 제조하거나 상기 DS 프라이머 C1과 C2'에서 어느 한 프라이머 말단에 바이오틴을 결합시켜-PCR 공정을 실시하여 상기 염기서열 구조체(2)인 SS DNA 라이브러리를 제조할 수도 있다.
DNA 또는 RNA Polymerase는 야생형(wild type) 또는 돌연변이형(mutant type)에서 목적에 따라 선택할 수 있다.
상기 SSN 라이브러리를 구성하는 올리고뉴클레오티드를 제조하기 위한, 모두 4종의 뉴클레오티드 또는 변형된 뉴클레오티드 혼합물을 합성 과정 중의 각 뉴클레오티드 부가 단계에 첨가하여, SSN 라이브러리의 SSN의 가변서열에는 변형된 염기를 포함하는 뉴클레오티드를 포함한다. 어떤 변형된 SSN를 상기에 언급된 방법, 장치 및 키트 모두에서 사용할 수 있다. 변형된 염기를 가진 뉴클레오티드를 포함하는 SS 올리고뉴클레오티드는 자연적으로 발생하는 뉴클레오티드(즉, 변형되지 않은 뉴클레오티드)를 포함하는 표준 SS 올리고뉴클레오티드의 성질과는 많이 다르다. 뉴클레오티드의 변형 방법은 아미드 결합의 사용을 포함한다. 그러나 다른 적절한 변형 방법이 사용될 수 있다.
변형된 SSN 구조는 표준 염기쌍 모델에 의하여 예상된 구조와 전적으로 일치하지 않는다. 이러한 현상은 SS 올리고뉴클레오티드의 측정된 녹는점이 모델에 의하여 예상된 녹는점과 일치하지 않는다는 점으로 짐작할 수 있다. 공지된 바와 같이, SSN의 측정된 녹는점과 예상된 녹는점 사이의 연관성이 없다. 평균적으로, 계산된 녹는점(Tm)는 측정된 Tm보다 6℃ 더 낮다. 측정된 녹는 점은 이들 변형된 뉴클레오티드를 포함하는 SS 올리고뉴클레오티드가 보다 더 안정하고, 신규한 제2 구조를 갖는 것으로 예견되며, 그 가능성이 존재한다. 변형된 뉴클레오티드를 SSN 라이브러리를 생산하는 데에 사용할 때, 분자에 대한 SS 올리고뉴클레오티드가 더 잘 분리된다. 여기에 기재한 바와 같이, "변형된 핵산"은 하나 또는 그 이상의 뉴클레오티드를 포함하는 핵산 서열을 가리킨다. 본 발명은 변형 뉴클레오티드를 포함하는 단일가닥핵산으로 실시할 수도 있다.
뉴클레오티드의 화학적 변형은 2'-위치의 당 변형, 5-위치의 피리미딘 변형(예를 들어, 5-(N-벤질카복시아미 드)-2'-데옥시우리딘, 5-(N-이소부틸카복시아미드)-2'-데옥시우리딘, 5-(N-[2-(1H-인돌-3일)에틸]카복시아미 드)-2'-데옥시우리딘, 5-(N-[1-(3-트리메틸암모늄)프로필]카복시아미드)-2'-데옥시우리딘 클로라이드, 5-(N-나프틸카복시아미드)-2'-데옥시우리딘, 또는 5-(N-[1-(2,3-디하이드록시프로필)]카복시아미드)-2'-데옥시우리딘), 8-위치의 퓨린 변형, 엑소시클릭 아민(exocyclic amines)에서의 변형, 4-티오우리딘의 치환, 5-브로모- 또는 5-아이오도-우라실(5-iodo-uracil)의 치환, 기본골격 변형, 메틸화, 이소베이스 이소시티딘(isobases isocytidine) 및 이소구아니딘(isoguanidine) 등과 같은 비정상적 염기쌍 조합(unusual base-pairing combinations)을 단독 또는 조합하여 포함할 수 있다. 변형은 또한 캡핑(capping) 또는 페길화(pegylation)과 같은 3' 및 5' 변형을 포함할 수 있다.
다른 변형은 유사체와 함께 하나 또는 그 이상의 자연적으로 생성되는 뉴클레오티드의 치환, 비전하 결합(uncharged linkage)을 갖는 메틸 포스페이트(methyl phosphonates), 포스포트리에스테르(phosphotriesters), 포스포아미데이트(phosphoamidates), 및 카바메이트(carbamate) 등과, 전하 결합(charged linkage)된 포스포로시오에이트(phosphorothioates), 포스포로디시오에이트(phosphorodithioates) 등과, 인터컬레이터(intercalators)를 포함하는 아크리딘(acridine), 솔라렌(psoralen) 등과, 킬레이터를 포함하는 금속, 방사선 금속, 붕소, 산화금속 등과, 알킬레이터를 포함하는 것 및 개질 결합된 알파 아노머(alpha anomeric) 핵산 등과 같은 뉴클레오티드간 변형을 포함한다. 또한, 당에 보통 존재하는 임의의 하이드록실기는 포스포네이트기(phosphonate group) 또는 포스페이트기(phosphate group)에 의해 치환될 수 있고 표준 보호기에 의해 보호될 수 있거나 추가적인 뉴클레오티드 또는 고체지지체에 부가적인 결합을 만들기 위해 활성화될 수 있다.
5' 및 3' 말단의 OH기는 인산화될 수 있거나, 아민, 약 1 내지 약 20개의 탄소 원자로부터의 유기 캡핑기 부분(organic capping group moieties), 또는 약 1 내지 약 20 개의 폴리에틸렌 글리콜(PEG) 폴리머들 또는 다른 친수성 또는 소수성 생물학적 또는 합성 폴리머들 로부터의 유기 캡핑기 부분으로 치환될 수 있다. 만일 존재한다면, 뉴클레오티드 구조는 폴리머 조합 전 또는 후에 변형될 수 있다. 뉴클레오티드의 서열은 비뉴클레오티드 성분에 의해 중단될 수 있다. 폴리뉴클레오티드는 중합 후에 성분의 라벨링과 함께 접합에 의한 것과 같이 더 변형될 수 있다.
올리고뉴클레오티드는 또한 2'-O-메틸-(2'-O-methyl-), 2'-O-알릴(2'-O-allyl), 2'-[0072] 플루오로-(2'-fluoro-) 또는 2'-아지도-리보오스(2'-azido-ribose), 카보시클릭 당 유사체(carbocyclic sugar analogs), α-아노메릭 당(α-anomeric sugars), 아라비노스, 자일로스 또는 리소오스(lyxoses)와 같은 에피메릭 당(epimeric sugars), 피라노오스 당(pyranose sugars), 퓨라노오스 당(furanose sugars), 세도헵툴로오스(sedoheptuloses), 아시클릭유사체(acyclic analogs) 및 메틸 리보사이드와 같은 염기 결여 뉴클레오티드 유사체(abasic nucleotide analogs)를 포함하는 당업자에게 일반적으로 잘 알려져 있는 리보오스 또는 데옥시리보오스의 유사체 형태를 포함할 수 있다.
상기에 언급한 바와 같이, 하나 또는 그 이상의 포스포디에스테르 결합들은 대체가능한 연결기(alternative linking group)로 대체될 수 있다. 이러한 대안적 연결기들은 포스페이트가 P(O)S("티오에이트(thioate)"), P(S)S("디티오에이트(dithioate)"), (O)NR2("아미데이트(amidate)"), P(O)R, P(O)OR', CO 또는 CH2("포름아세탈(formacetal)")로 대체되고, 각 R 또는 R'는 독립적으로 H 이거나 에테르(-O-) 결합, 아릴, 알케닐, 시클로알킬, 시클로알케닐 또는 아랄딜(araldyl)을 선택적으로 포함하는 치환되거나 비치환된 알킬(1-20C)이다.
폴리뉴클레오티드의 모든 결합이 동일할 필요는 없다. 당, 퓨린 및 피리미딘의 유사한 형태의 치환은 예를 들어, 폴리아미드 기본골격과 같은 대체적 기본골격 구조와 같이 최종 생성물을 설계하는데 유리할 수 있다.
3. 결합 SSN 선정
*도 10을 참조하면, 본 발명에서 다양한 유형의 분자로 구성된 시료에 있는 특정 유형의 분자집단에 결합하는 SSN 개발을 위해, 다양한 분자로 구성된 시료와 임의의 염기서열로 구성된 SSN 라이브러리를 접촉시켜 형성되는 M-SSN 복합체 집단로부터 결합 SSN 집단을 분리하여 핵산분석기술로 분석하고 실험시료와 대조시료의 분석결과를 비교하여 두 시료 사이에 유의하게 있는 양적인 차이가 있는 SSN을 결정하며, 연속하여 상기 결정된 SSN을 이용하여 상응하는 분자가 있는 시료로 이에 결합하는 분자를 분리, 동정할 수 있다.
상기 분자집단은 이종 분자로 되거나 동종 분자로 구성될 수 있으며 생물학적 시료를 구성하는 분자집단은 높은 다양성 및 커다란 dynamic range가 있다. 따라서 생물학적 시료에 대한 결합 SSN 라이브러리는 정상화, 차등화 및 Suppression Subtractive Hybridization 공정을 수행할 수 있다.
본 발명에서 특정 동종 분자로 이루어진 분자집단을 사용하여 특정 분자에 결합하는 압타머를 개발하는 방법을 제공한다.
도 10을 참조하면, 본 발명에서 시료를 구성하는 분자집단에 결합하는 SSN 집단 개발은 상기 SSN에 제1 태그가 부가된 염기서열 구조체, SSN-FSS 복합체 라이브러리 형성, 포획, 제1 분리, 제2 태그의 부가, 제2 분리 및 용출로 구성된 선택 및 증폭의 반복 단계 그리고 동정 단계를 포함하는 방법으로 실시할 수 있다.
임의의 염기서열로 구성된 단일가닥핵산(SSN) 라이브러리를 구성하는 특정 SSN은 특정 분자에 대한 높은 친화력과 특이도를 가질 수 있다.
상기 SSN 라이브러리를 구성하는 SSN은 제1 포획 성분과 결합 가능한 제1 태그를 가질 수 있다. SSN 라이브러리는 변형된 뉴클레오타이드로 이루어진 임의의 염기서열로 이루어진 SSN 라이브러리이고 제1 태그는 바이오틴(biotin)일 수 있다. 본 발명은 제1 태그를 포함하는 SSN 라이브러리를 제공한다.
분자에 대하여 특이적인 친화력이 있고 제1 태그를 포함하는 SSN 라이브러리는 시료와 함께 평형화되기에 앞서 반응 용액에서 현탁 상태 제1 고체지지체(FSS)의 제1 포획 성분에 접촉하여, SSN-FSS 복합체 라이브러리를 형성한다.
상기 FSS는 다이나비즈 마이원 스트렙타비딘 C1(DynaBeads MyOne Streptavidin C1)과 같은 마그네틱 비드(magnetic bead)이고, 제1 포획 성분은 스트렙타비딘이다.
상기 현탁 상태 SSN-FSS 복합체 라이브러리의 형성은 SSN와 FSS를 접촉시키고, 상기 SSN에 포함된 제1 태그와 상기 현탁 상태 FSS의 제1 포획 성분이 직접적으로 또는 간접적으로 결합시킴으로써 달성된다.
현상 상태로 있는 SSN-FSS 복합체 라이브러리 형성 후, SSN/SSN 응집체를 제거하기 위해 pH 11로 완충된 용액으로 세척함으로써 분석 백그라운드를 감소시킨다.
준비된 시료를 구성하는 분자에 대하여 특이적인 친화력을 가지고 있으며, 현탁 상태 SSN-FSS 복합체 라이브러리와 접촉하여, 현탁상태 M-SSN-FSS 복합체 집단이 형성될 수 있으며 이를 ‘제1 반응 용액’이라 지칭하였다.
본 발명의 또 다른 방법은 시료에 있는 분자에 특이적인 결합 친화력이 있으며, 제1 포획 성분에 친화력이 있는 제1 태그를 포함하는 SSN와 시료가 접촉하여, 상기 시료에 있는 분자로부터 M-SSN 복합체가 형성되고 현탁 상태 혼합물을 제조할 수 있으며, 상기 혼합물에 제1 포획 성분을 포함한 FSS을 첨가하여, 제1 태그가 제1 포획 성분과 결합하여 현탁 상태 M-SSN-FSS 복합체가 형성되는 제1 반응 용액을 제조한다.
상기 제1 반응 용액에서 현탁 상태 상기 M-SSN-FSS 복합체와 자유 SSN-FSS 복합체는 동시에 분리될 수 있다.
현탁 상태 상기 M-SSN-FSS 복합체와 자유 SSN-FSS 복합체는 제1 반응 용액의 잔여물로부터 분리되고, 제1 반응 용액 내에서 상기 M-SSN-FSS 복합체와 자유 SSN-FSS 복합체를 제외한 모든 다른 분자들, 즉 FSS에 결합하지 않은 혼합물의 성분들이 제거된다.
상기 제1 분리에 이어서 임의의 현탁 상태 자유 SSN-FSS 복합체와 함께 분리된 현탁 상태 M-SSN-FSS 복합체는 적절한 방법을 사용하여 분리된다.
본 발명의 제1 분리는 상기 제1 반응 용액으로부터의 상기 현탁 상태 M-SSN-FSS 복합체와 자유 SSN-FSS 복합체의 분리에 의해 완료된다.
상기 분리는 현탁 상태 M-SSN-FSS 복합체와 자유 SSN-FSS 복합체의 원심분리 또는 자석을 이용한 마그네틱 비드 수확 방법에 의해 달성된다. 상기 M-SSN-FSS 복합체는 분석법에서 추후 사용하기 위하여 용출은 되거나 수집될 수 있고, 또는 분석법의 나머지 단계들을 수행하기 위하여 SSS와 접촉될 수 있다.
상기 제1 반응 용액은 선택적으로 엄격한 세척용액 방법을 사용할 수 있다. 상기 엄격한 세척용액 방법은 SSN와 분자들 사이의 임의의 비특이적 결합을 감소키는데 도움을 준다. 10 mM 덱스트란 설페이트(dextran sulfate)가 M-SSN 복합체에 첨가되며, 상기 혼합물은 약 15분간 처리된다. 다른 경쟁자들(competitor)은 경쟁 핵산들을 포함하나 이에 한정되는 것은 아니다. 상기 엄격한 세척용액은 10 mM 덱스트란 설페이트의 존재하에서 제1 분리를 수행함으로써 개시된다. 상기 엄격한 세척용액은 평형결합 단계 후, 제2 분리 전 수행된다. 상기 엄격한 세척용액은 희석에 의해 수행된다.
상기 현탁 상태 M-SSN-FSS 복합체의 M에 제2 태그를 도입하는 시약으로 처리된다. 상기 분자는 단백질 또는 펩티드이고, 상기 분자에 NHS-PEG 4-바이오틴을 처리함으로써 바이오틴 부가할 수 있으며 이를 ‘제2 반응 용액’이라고 하였다.
상기 분자에 도입된 제2 태그는 제1 태그와 동일하거나 서로 다를 수 있다. 상기 제2 태그가 상기 제1 태그와 동일하다면, 상기 현탁 상태 FSS에 있는 자유 제1 포획 성분은 이 태그 단계의 개시에 앞서 차단될 수 있다. 상기 SSN-FSS 복합체는 분자 태그의 개시에 앞서 자유 바이오틴으로 세척된다.
현탁 상태 자유 SSN-FSS 복합체를 제거하기 위하여 수행된다. 제2 분리에 사용되는 제2 태그는 현탁 상태 M-SSN-FSS 복합체의 분자에 첨가될 수 있다. 제2 태그는 제2 분리의 시작에 앞서 분석의 다른 지점에 있는 분자에 첨가될 수 있다.
제2 분리는 현탁 상태 자유 SSN-FSS 복합체와 제2 태그된 M-SSN-FSS 복합체를 포함하는 제2 반응 용액으로부터의 현탁 상태 제2 태그된 M-SSN-FSS 복합체의 수확에 의해 완료된다(제2 분리 단계).
상기 현탁 상태 제2 태그를 포함하는 M-SSN-FSS 복합체를 포함하는 제2 반응 용액은 고정 SSS와 접촉되며, 상기 SSS는 M-SSN-FSS 복합체의 제2 태그에 높은 친화력과 특이도가 있으며, SSS의 표면에 부착된 제2의 포획 성분을 가진다.
상기 분자에 도입된 상기 제2 태그는 제1 태그와 동일하거나 서로 다를 수 있다. 만일 상기 제2 태그가 제1 태그와 동일하다면, 상기 FSS의 제1 포획 성분은 이 태그 단계의 개시에 앞서 차단될 수 있다. 상기 M-SSN-FSS 복합체는 분자 태그의 개시에 앞서 자유 바이오틴으로 세척하였다.
상기 SSS는 마이크로역가 플레이트(microtiter plate)의 다이나비즈 마이원 스트렙타비딘 C1(DynaBeads MyOne Streptavidin C1)과 같은 마그네틱 비드(magnetic bead)가 고정된 웰 표면이고, 제2 포획 성분은 스트렙타비딘이다.
상기 제2 분리는 현탁 상태 자유 SSN-FSS 복합체를 제거하기 위하여 수행하였다. 상기 기술한 바와 같이, 상기 제2 분리에 사용된 제2 태그는 분자에 첨가될 수 있는 반면, 상기 제2 태그는 제2 분리의 시작에 앞서 분석법에서의 다른 시점에서 분자에 첨가할 수 있다.
상기 제1 반응 용액은 제2 포획 성분이 있고 반응구의 표면에 고정된 SSS와 접촉하여 제2 반응 용액을 형성하고, 상기 고정 상태 SSS의 제2 포획 성분은 상기 현탁 상태 M-SSN-FSS 복합체의 분자에 있는 제2 태그와 높은 친화력과 특이도로 결합할 수 있다.
본 발명의 고정 상태 SSS는 미세적가 플레이트(microtiter plate)의 DynaBeads MyOne Streptavidin C1과 같은 마그네틱 비드가 코팅된 웰 표면이고, 상기 제2 포획 성분은 스트렙타비딘이다. 상기 코팅된 마그네틱 비드는 상기 제2 반응 용액의 분리된 성분들의 분리를 위한 편리한 방법을 제공한다.
제2 반응 용액에 상기 현탁 상태 M-SSN-FSS 복합체의 분자에 있는 제2 태그는 상기 고정 상태 SSS의 제2 포획 성분과 상호작용으로 결합하여 고정 상태 SSS-M-SSN-FSS 복합체를 형성한다.
상기 고정 상태 SSS-M-SSN-FSS 복합체는 글리세롤을 포함하지만 이에 한정되지 않는 유기 용매를 포함하는 버퍼를 포함하는 완충 용액으로 상기 고정 상태 SSS-M-SSN-FSS 복합체를 세척함으로써 혼합물의 잔여물로부터 분리된다.
제2 분리를 실시한 후, 상기 플레이드의 웰에서 액체를 피펫으로 조심스럽게 제거하고, 25%의 Propylene Glycol 또는 30% glycerol을 보충한 300ul의 완충액 PB1으로 세척하였다. 웰을 300ul의 SB17T 완충액으로 5번 세척하고, 최종 세척액을 제거한다.
상기 튜브를 원심분리하여 액체를 제거하고 튜브는 10mM 글리세린이 보충된 300ul의 SB17T 완충액으로 세척한다. 1mM 덱스트란 황산을 보충한 100ul의 SB17T 완충액을 첨가한다.
복합체 해리 속도가 느린 서열을 우선적으로 선택하기 위해 하기와 같은 엄격한 세척용액(Kinetic challenge)을 실시하였다. 이것은 고정 상태 SSS-M-SSN-FSS 복합체 용액에 2-5 라운드에서 포획 15분전에 SB17T를 20배, 6-7 라운드에서 포획 60분전에 SB17T를 400배, 8라운드에서 포획 60분전에 10 mM 덱스트란 설페이트를 함유하는 SB17T를 400배로 부가하여 달성하였다.
셀렉스가 종결되고 분석을 위한 용출 단계는 100ul의 CAPSO 용출 완충액을 첨가하고 상기 고정 상태 SSS-M-SSN-FSS 복합체를 5분 동안 흔들면서 수행한다. 상기 플레이트의 웰에서 90ul의 용액을 수작업으로 10uL 중화 완충용액을 담고 있는 PCR 플레이트의 웰들에 옮겨 SSN-FSS 집단을 확보한다.
또는, 상기 고정된 SSS-M-SSN-FSS 복합체 집단이 있는 플레이트의 웰을 5분 동안 가열하여 결합 SSN를 용출할 수도 있다.
라운드가 종결된 후, 분석을 위한 용출 단계는 상기 고정 상태 SSS-M-SSN-FSS 복합체의 SSN는 소디움 퍼클로레이트(sodium perchlorate), 리튬 클로라이드(lithium chloride), 소디움 클로라이드(sodium chloride) 및 마그네슘 클로라이드(magnesium chloride)를 포함하지만 이로 한정되지 않는 군으로부터의 카오트로픽 염(chaotropic salt)을 포함하는 버퍼, 높은 온도 또는 높거나 낮은 pH를 사용하여 M-SSN 복합체 또는 결합 SSN 집단을 선택적으로 용출하였다.
상기 용출된 결합 SSN 집단으로부터 증폭된 SSN 집단을 제작하여 첫 단계부터 상기 고정 상태 SSS-M-SSN-FSS 복합체로부터 결합 SSN 용출 단계를 1회 이상을 반복하여 실시한다.
궁극적으로 용출된 SSN 집단은 다양한 핵산분석기술로 분석할 수 있다. 다양한 분자 또는 동일한 분자로 이루어진 시료에 대해 상기 단계들을 수행한 후 최종회에서 얻은 용출된 SSN 집단을 NGS 장비로 분석하여 생산된 염기서열을 분석하여 특정 시료에 대한 리드의 종류와 출현빈도를 결정한다.
본 발명은 (a) 상기 염기서열 구조체(1)인 SSN 라이브러리와 시료에 있는 분자(M)집단이 M-SSN 복합체를 형성하는 단계; (b) 상기 M-SSN 복합체를 상기 유기용매가 있는 완충용액 및 상기 엄격한 세척용액 방법로 이루어진 군에서 선택되어진 어느 하나 이상으로 세척하는 단계; (c) 상기 세척한 및 M-SSN 복합체에서 분리된 단일가닥핵산 집단으로 상기 (a) 단계 와 (b)를 반복하여 실시하는 단계; 및 (d) 상기 (c) 단계에서 얻은 세척한 M-SSN 복합체에서 단일가닥핵산 집단을 분석하는 단계;를 포함하는 것을 특징으로 하는 결합 단일가닥핵산 집단을 선정할 수 있다.
바람직하게, 상기 (a) 단계 전에 상기 시료에 있는 분자집단을 고체지지체에 결합하는 단계를 더 포함할 수도 있다.
본 발명에서 “결합 SSN”는 분자와 결합할 수 있는 올리고뉴클레오티드를 의미하며 압타머를 최소한 포함하는 의미이다.
본 발명에 따라 상기 결합 SSN은 분석시료인 하나 또는 그 이상으로 이루어진 시험시료 집단과 대조시료 집단 간의 양적 차이가 있는 분자집단에 대한 정보를 생산할 수 있는 리간드라고 할 수 있다.
본 발명에서 상기 결합 SSN과 분자 복합체 집단에서 분리되는 결합 SSN 집단 또는 분자집단을 다양한 기술로 분석할 수 있다. 상기 분석결과는 결합 SSN 집단의 염기서열 및 출현빈도 또는 분자집단의 확인 및 출현빈도는 시료를 구성하는 분자와 결합하는 결합 SSN 집단과 분자집단의 양태를 반영하는 분자데이터인 “결합 프로파일”을 생성할 수 있다. 상기 결합 SSN을 분석하여 생산된 결합프로파일은 “결합 SSN 프로파일”, 분자를 분석하여 생산된 결합프로파일은 “분자 프로파일”이라고 하였다.
본 발명에서 생물학적 의미있는 결합 SSN과 표적분자의 선정은 사전에 결합 SSN과 표적분자에 대한 정보가 전혀 없이 상기 분자집단으로 구성된 시료들로 구성된 분석시료군을 대상으로 각각 시료와 결합 SSN 라이브러리를 반응시켜 형성된 복합체 집단에서 분리된 결합 SSN 집단 또는 분자집단을 상기 기술한 다양한 방법으로 존재양상에 대한 프로파일을 생성할 수 있다.
상기 생물학적 의미 결정지원 시스템에 상기 결합 SSN 집단과 표적분자집단에 대한 참조 데이터베이스를 구축한다. 상기 참조 데이터베이스는 결합 SSN의 염기서열과 표적분자가 미확인 경우, 염기서열이 확인되었으나 표적분자는 미확인인 경우, 염기서열과 표적분자가 다 확인된 경우로 나누어 구축할 수 있다.
상기 SSN의 <구조식 1>에서 가변영역 그리고 5′와 3′ 고정영역으로 참조데이터베이스를 구성한다. 상기 염기서열이 미확인된 SSN 라이브러리와 시료를 구성하는 분자집단이 형성된 복합체 집단에서 분리된 결합 SSN 집단의 경우에 이는 필수적이다.
알고리즘의 동작 과정을 간단히 설명하면 다음과 같다. 상기 분리된 SSN 집단의 NGS 결과는 Fastaq 형식의 리드 데이터로 생산되며 이를 본 발명의 시스템에 용이하게 사용할 수 있는 문서 양식으로 전환시킨다.
본 발명에서 상기 복합체에서 제조된 결합 SSN 라이브러리를 구성하는 결합 SSN의 염기서열 및 출현빈도를 결정하는 방법을 제공한다.
바람직하게, 첫 번째 단계에서는 적절한 문서양식으로 전환된 리드 데이터를 참조 데이터베이스를 구성하는 단계로, 상기 전환된 리드의 염기서열을 출발 라이브러리 구조의 <구조식 1>에 있는 5‘와 3’ 고정영역의 염기서열과 가변영역의 염서열의 수에 매핑시킨 후, 상기에서 두 고정영역의 염기서열 및 가변영역의 염기의 수가 100% 일치하는 염기서열을 갖는 전환된 리드를 하나의 결합 SSN을 확인한다. 상기와 같이 확인된 결합 SSN의 염기서열로 구성된 참조 데이터베이스를 구축한다.
두 번째, 상기 구축된 참조 데이터베이스를 구성하는 결합 SSN의 염기서열의 2개의 고정영역의 염기서열과 가변영역과 비교하여 전환된 리드 데이터의 특성을 분석하는 단계로, 우선, 결합 SSN 별 2개의 고정영역과 가변영역의 염기서열을 비교하여 일치하는 전환된 리드의 빈도를 측정하여 상응하는 결합 SSN의 출현빈도를 결정하고, 다음 결합 SSN의 가변영역과 비교하여 일치하는 전환된 리드의 빈도를 분석하여 결합 SSN의 빈도를 추정한다. 즉, 고정영역과 전환된 리드의 염기서열 분석으로 결합한 SSN의 종류 및 출현빈도를 예측하는 것이 가능하며, 여기에서 예측된 결합 SSN의 구조가 다음 단계의 결합 SSN 구조로 사용된다.
상기와 같은 방법으로 본 발명의 SSN 라이브러리와 시료를 구성하는 분자집단이 반응하여 형성된 복합체 집단으로부터 분리된 결합 SSN 라이브러리를 구성할 수 있다. 즉, 제조된 결합 SSN 라이브러리에 대해 <구조식 1>의 고정영역과 가변영역을 분석하여 결합 SSN의 종류와 출현빈도를 결정하는 것이 가능하다. 상기 분리된 결합 SSN 라이브러리를 구성하는 결합 SSN의 염기서열과 출현빈도를 결정하여 분자데이터, 결합프로파일을 생산할 수 있다.
본 발명에서 염기서열이 미확인된 SSN 라이브러리를 이용하여 특정 시료를 구성하는 분자집단에 대한 분자데이터, 결합프로파일을 제조할 수 있다.
본 발명에서는 기본적으로 참조 시퀀스로서 선정된 결합 SSN의 염기서열을 사용하여 참조데이터베이스를 구축할 수도 있다. 상기 염기서열이 확인된 결합 SSN 집단과 시료를 구성하는 분자집단이 형성하는 복합체 집단에서 분리된 결합 SSN 집단의 경우에 주로 사용된다.
상기 분리된 결합 SSN 집단의 NGS 결과인 Fastaq 형식의 리드 데이터를 전환시켜 추가적인 분석이 가능하도록 해야 한다. 첫 번째 단계에서는 상기 전환된 리드 데이터를 결합 SSN 참조 데이터베이스에 매핑 시킨 후, 참조 데이터베이스의 결합 SSN의 고정영역과 가변영역에 매핑된 전환된 리드 데이터의 특성을 분석한다. 즉, 전환된 리드 데이터에 결합 SSN의 2개의 고정영역의 존재유무 그리고 가변영역 길이와 유사도를 확인한다. 이어서 전환된 리드 데이터의 고정서열 사이 부위에 있는 염기서열과 결합 SSN별 가변영역마다 매핑된 전환된 리드 데이터의 출현빈도를 측정하여, 리드 데이터에서 결합 SSN의 종류와 출현빈도를 데이터를 제작한다. 즉, 고정영역의 매핑과 가변영역의 분석으로 리드 데이터에 있는 결합 SSN의 종류와 출현빈도를 결정하여 분자데이터, 결합프로파일을 생산하는 것이 가능하며 여기에서 결정된 결합 SSN의 구조가 다음 단계의 결합 SSN 구조로 사용된다. 또는 상기 과정으로 염기서열을 알고 있는 결합 SSN 집단을 이용하여 특정 시료를 구성하는 분자집단에 대한 결합 SSN의 종류와 출현빈도를 결정하여 분자데이터, 결합프로파일을 제조할 수 있다.
본 발명에서 분석시료 집단을 구성하는 시료의 분자집단에 대해 생산된 대규모 분자데이터, 결합프로파일으로 집단 간에 유의하게 존재 양상이 상이한 분자집단과 이에 결합하는 결합 SSN 집단을 선정 및 평가하는 정량상의 차별적 스크리닝 기술을 제공할 수 있다. 상기 분자데이터 제조에 필요한 원 데이터를 생산하는 방법은 하기에 기술하였다.
상기 생물학 시료들의 생물학적 상태(생물학적 의미), 예를 들어 질병군 및 비질병군을 기준으로 데이터베이스를 구축하여 다양한 통계적인 방법으로 상기 두 군을 대표하는 특징(Feature) 선정 단계를 수행한다.
상기 선정된 특징을 사용하여 구축된 데이터베이스 평가 방법으로 선정된 특징과 생물학적 상태의 연관성을 감독형 기계학습으로 평가할 수 있다.
바람직하게, 본 발명에서 분석한 시료에 대한 분석결과로부터 하나의 데이터베이스로 구축하고 상기 분석결과로부터 데이터베이스를 비감독형 기계학습으로 세분화할 수 있는 특징을 선정하는 방법을 실시할 수도 있다. 선정된 특징에 대한 새로운 생물학적 의미를 부여할 수도 있다.
상기 반복 단계의 최종회에 있는 포획 단계에서 수확한 M-SSN-FSS 복합체의 분자 그리고 상기 선정된 결합 SSN과 시료를 구성하는 분자로부터 형성된 M-SSN-FSS 복합체의 분자를 질량분석기로 동정할 수도 있다(동정 단계).
상기 분석하는 방법으로 시료를 구성하는 다양한 분자집단에 특이적으로 결합하고 유의하게 결합하는 양에서 차이가 있는 결합 SSN 집단 선정 및 이에 상응하는 분자집단을 동정할 수 있다.
Ⅱ. AptaSSN의 다중 분석
본 발명에서 상기 <Ⅰ> 항의 방법으로 개발된 “결합 SSN” 및 기존 SELEX 방법으로 개발되고 증폭이 가능한 구조를 갖는 압타머(Aptamer)을 총칭하여 “AptaSSN”이라고 하였다.
다양한 방법들이 시료를 구성하는 분자집단에 유의한 결합차이가 있는 AptaSSN 및 이에 상응하는 분자 동정, 특정 분자에 대한 압타머 개발, 단일 분자 및 단일 AptaSSN에 관하여 기술하고 있다. 다양한 유형의 분자집단으로 구성된 시료 내에 있는 복수의 분자와 AptaSSN 집단을 접촉시킴으로써 검출되고/되거나 분석될 수 있는 그러한 다중 AptaSSN를 사용하여, 복수의 분자들의 동시 검출 및/또는 분석을 제공할 수 있는 다중 포맷에서 수행될 수 있으며, 각각의 AptaSSN는 (즉, 다중 포맷에서) 특정분자에 대해 특이적인 친화력이 있어 가능한 다중 분석 방법이다.
본 발명은 존재할 수 있는 복수 분자의 분석을 위한 AptaSSN 다중 분석법을 수행하기 위한 향상된 방법을 제공하며, 여기에서 기술된 분자 및 방법들은 전반적인 분석 성능을 향상시키는데 사용될 수 있다.
단일 분석물 테스트 또는 시료의 다중 분석을 수행하기 위하여 시료에 있는 복수의 분자를 동시에 분석하기 위하여 2개, 10개, 100개, 1000개 또는 그 이상의 압타머 또는 결합 AptaSSN의 사용을 포함할 수 있다. 다수의 AptaSSN들이 시료에 도입되고, 기술된 분석법들 중 어느 것이 수행될 수 있다.
본 발명은 제시한 도 3을 참조하면, 분자집단으로 구성된 시료와 AptaSSN 집단을 접촉하여, 형성되는 M-AptaSSN 복합체 집단로부터 분리된 AptaSSN 집단을 핵산분석기술로 분석하고 실험시료, 비교시료와 대조시료의 분석결과를 비교하여 두 시료 사이에 생물학적 의미를 결정하는 AptaSSN 다중 분석을 실시할 수 있다.
1. M-AptaSSN 복합체의 형성
본 발명의 AptaSSN 다중 분석법에서 AptaSSN는 분자에 대한 높은 친화력과 특이도 및 제1 태그를 가지도록 제공된다. 상기 AptaSSN는 자연 또는 변형 뉴클레오티드로 구성된 압타머일 수 있다. 상기 제1 태그는 포획에 앞서 분석법에서 어느 때라도 첨가된다. 이 제1 태그는 바이오틴이다.
분자에 대하여 특이적인 친화력이 있고 제1 태그를 포함하는 AptaSSN는 시료와 함께 평형화되기에 앞서 반응 용액에서 현탁 상태 제1 고체지지체(FSS)의 제1 포획 성분에 접촉하여, AptaSSN-FSS 복합체를 형성한다. 상기 현탁 상태 AptaSSN-FSS 복합체의 형성은 AptaSSN와 FSS를 접촉시키고, 상기 AptaSSN에 포함된 제1 태그와 상기 현탁 상태 FSS의 제1 포획 성분이 직접적으로 또는 간접적으로 결합시킴으로써 달성된다.
상기 FSS는 다이나비즈 마이원 스트렙타비딘 C1(DynaBeads MyOne Streptavidin C1)과 같은 마그네틱 비드(magnetic bead)이고, 제1 포획 성분은 스트렙타비딘이다.
상기 반응용액에 있는 AptaSSN-FSS 복합체룰 pH 11로 완충된 용액을 이용한 세척은 AptaSSN/AptaSSN 응집체를 제거하고, 그것에 의하여 분석 백그라운드는 제거된다.
그 후 준비된 시료들은 각각의 분자에 대하여 특이적인 친화력이 있고 현탁 상태 AptaSSN-FSS 복합체와 접촉하여, 시료가 표적분자를 포함한다면, 현탁 상태 M-AptaSSN-FSS 복합체를 시료와 함께 제1 반응 용액에서 형성된다.
본 발명의 다른 실시례에서, 표적에 특이적인 결합 친화력이 있으며, 제1 포획 성분에 친화력이 있는 제1 태그를 포함한 AptaSSN과 시료가 접촉하여, 상기 표적이 상기 시료 안에 존재한다면 M-AptaSSN 복합체를 포함하는 반응 혼합물을 제조하는 단계; 및 상기 제조된 반응 혼합물에 현탁 상태로 있고 제1 포획 성분이 있는 현탁 상태 제1 고체지지체(FSS)를 첨가하여, 상기 M-AptaSSN 복합체의 AptaSSN에 있는 제1 태그와 상기 FSS에 있는 제1 포획 성분이 결합하여, 현탁 상태 M-AptaSSN-FSS 복합체가 형성되는 제1 반응 용액을 제조할 수 있다.
상기 현탁 상태 M-AptaSSN-FSS 복합체와 자유 AptaSSN-FSS 복합체는 제1 반응 용액의 다른 혼합물로부터 분리되고, 상기 제1 반응 용액에서 결합하지 않은 혼합물의 성분들이 제거된다. 분리 후, 현탁 상태 임의의 자유 AptaSSN-FSS 복합체와 함께 M-AptaSSN-FSS 복합체는 수확된다.
본 발명의 제1 분리는 상기 제1 반응 용액으로부터의 상기 현탁 상태 M-AptaSSN-FSS 복합체와 자유 AptaSSN-FSS 복합체의 분리에 의해 완료된다. 상기 제1 분리는 현탁 상태 M-AptaSSN-FSS 복합체와 자유 AptaSSN-FSS 복합체의 원심분리 또는 자석을 이용한 마그네틱 비드 수확 방법에 의해 달성된다. 상기 M-AptaSSN-FSS 복합체는 분석법에서 추후 사용하기 위하여 용출이 되거나 수집될 수 있고, 또는 분석법의 나머지 단계들을 수행하기 위하여 고정 상태 SSS와 접촉될 수 있다.
상기 제1 반응 용액은 선택적으로 엄격한 세척용액(kinetic challenge)될 수 있다. 상기 엄격한 세척용액은 AptaSSN와 비표적 사이의 임의의 비특이적 결합을 감소시키는데 도움을 준다. 10 mM 덱스트란 설페이트(dextran sulfate)가 제1 반응 용액에 첨가하고 약 15분간 처리한다. 다른 경쟁자들(competitor)은 경쟁 핵산들을 포함하나 이에 한정되는 것은 아니다. 상기 엄격한 세척용액은 10 mM 덱스트란 설페이트의 존재하에서 시작하였다. 상기 엄격한 세척용액은 제2 분리 전 추가적으로 수행될 수 있으며 희석에 의해 수행된다.
본 발명에서, 엄격한 세척용액은 분석법의 특이도를 증가시키고 비특이적 결합을 감소시키기 위하여 사용될 수 있다. 비특이적 결합의 추가적인 감소는 시료와 경쟁자의 전처리(pre-incubation) 또는 평형 결합하는 동안 혼합물에 경쟁자를 추가함으로써 달성될 수 있다.
본 발명의 현탁 상태 M-AptaSSN-FSS 복합체의 분자 성분에 제2 태그를 도입하는 시약으로 처리된다. 상기 표적은 단백질 또는 펩티드이며, 상기 분자는 NHS-PEO4-바이오틴으로 처리함으로써 바이오틴이 부가된다.
상기 분자에 도입된 제2 태그는 제1 태그와 동일하거나 서로 다를 수 있다. 상기 제2 태그가 상기 제1 태그와 동일하다면, 상기 현탁 상태 FSS에 있는 자유 제1 포획 성분은 이 태그 단계의 개시에 앞서 차단될 수 있다. 상기 AptaSSN-FSS 복합체는 분자 태그의 개시에 앞서 자유 바이오틴으로 세척된다. 표적의 태그는 제2 분리의 시작에 앞서 분석법에서의 임의의 다른 시점에서 수행될 수도 있다.
제2 분리는 현탁 상태 자유 AptaSSN-FSS 복합체를 제거하기 위하여 수행된다. 상기 기술한 바와 같이, 상기 제2 분리에 사용된 제2 태그는 분자에 첨가될 수 있는 반면, 상기 제2 태그는 제2 분리의 시작에 앞서 분석법에서의 다른 시점에서 분자에 첨가될 수 있다.
상기 현탁 상태 M-AptaSSN-FSS 복합체 등이 있는 제1 반응 용액을 제2 포획 성분이 고정된 반응구의 표면을 갖고 있는 SSS인 플레이트의 웰에 첨가하여 제2 반응 용액을 제조하며, 상기 SSS의 제2 포획 성분은 상기 현탁 상태 M-AptaSSN-FSS 복합체의 분자에 있는 제2 태그와 높은 친화력과 특이도로 결합할 수 있다.
본 발명의 고정 상태 SSS는 microtiter plate의 DynaBeads MyOne Streptavidin C1과 같은 마그네틱 비드가 코팅된 웰 표면이고, 상기 제2 포획 성분은 스트렙타비딘이다. 상기 코팅된 마그네틱 비드는 상기 제2 반응 용액의 분리된 성분들의 분리를 위한 편리한 방법을 제공한다.
제2 반응 용액에 상기 현탁 상태 M-AptaSSN-FSS 복합체의 분자에 있는 제2 태그는 상기 고정 상태 SSS의 제2 포획 성분과 상호작용으로 결합하여 고정 상태 SSS-M-AptaSSN-FSS 복합체를 형성한다.
상기 고정 상태 SSS-M-AptaSSN-FSS 복합체는 글리세롤을 포함하지만 이에 한정되지 않는 유기 용매를 포함하는 버퍼를 포함하는 완충 용액으로 상기 고정 상태 SSS-M-AptaSSN-FSS 복합체를 세척함으로써 혼합물의 잔여물로부터 분리된다.
상기 고정 상태 SSS-M-AptaSSN-FSS 복합체에 있는 AptaSSN는 소디움 퍼클로레이트 및 리튬 클로라이드를 포함하지만 이에 한정되지 않는 군으로부터 카오트로픽염을 포함하는 버퍼, 높은 온도, pH를 사용하여 상기 고정 상태 SSS-M-AptaSSN-FSS 복합체로부터 선택적으로 용출된다.
본 발명은 (a) 상기 AptaSign 집단과 시료에 있는 분자(M)집단이 M-AptaSSN 복합체를 형성하는 단계; (b) 상기 형성된 M-AptaSSN 복합체를 상기 유기용매가 있는 완충용액 및 상기 엄격한 세척용액(Kinetic challenge)로 이루어진 군에서 선택되어진 어느 하나 이상으로 세척하는 단계; 및 (c) 상기 세척한 M-AptaSSN 복합체에서 단일가닥핵산 집단을 분석하는 단계;를 포함하여 AptaSSN 집단을 이용하여 분자 검사를 할 수도 있다.
바람직하게, 상기 (a) 단계 전에 상기 시료에 있는 분자집단을 고체지지체에 결합하는 단계를 더 포함할 수도 있다.
본 발명에서 시료들에서 유의하게 결합된 양에서 차이가 있는 AptaSSN 및 이에 상응하는 분자 동정, 특정 분자에 대한 압타머 개발 그리고, 다중 AptaSSN-기반 분석법에서 두 가지의 문제가 있다.
첫 번째로, AptaSSN/AptaSSN의 상호작용이 분석 백그라운드의 주된 근원과 다중 능력(multiplex capacity)에 대한 잠재적인 제한한다.
두 번째로, 시료 매트릭스(주로 혈청 및 혈장)는 스트렙타비딘-치환된 매트릭스 상에 비오티닐화된 압타머의 고정을 저해한다.
본 발명은 이들 문제 모두를 감소시키고/시키거나 제거하는 주요 기술을 제공한다.
첫 번째 방법은 AptaSSN의 태그와 FSS의 포획성분이 현탁 상태에서 AptaSSN-FSS 복합체 형성을 수행한다. 반응 혼합물에서 AptaSSN에 있는 바이오틴 부위와 현탁 상태 FSS인 스트렙타비딘 비드가 접촉하여, 현탁 상태 AptaSSN-FSS 복합체를 형성한다. 상기 복합체 형성은 AptaSSN의 상호작용을 감소하는 조건에서 형성될 수 있게 하며, 또한 상호작용하고 있는 AptaSSN의 방해, 매우 강건한 바이오틴-스트렙타비딘 상호작용 및 결합하고 있지 않은 모든 AptaSSN의 분리를 위해서, 엄격한 세척(카오트로픽 염과 함께)으로 가능하게 한다. 이것은 분석하는 동안에 있는 AptaSSN 응집체의 수를 감소시키며 - 어떤 검출 가능한 빈도를 가지는 응집체들은 바이오틴 부분을 보유하거나, 바이오틴 부가가 될 수 있다.
상기 AptaSSN는 "태그(tag)"가 되도록 효소 또는 링커를 사용하여 바이오틴 부가할 수 있다. 복합체 형성은 AptaSSN에 바이오틴이 부가된 후 비드-결합 형태로 결합될 수 있기 때문에 매우 높은 다중 능력을 지원할 것으로 보이므로, AptaSSN가 상호작용하고 응집할 수 있는 조건을 우회하게 된다.
M-AptaSSN-FSS 복합체를 제조하는 제1 반응 용액에서 AptaSSN 흡착의 필요성을 없도록 하여, 일정한 농도이상의 제1 반응 용액에서도 정량적인 복합체 형성을 할 수 있다. 10%의 농도의 과정 또는 더 최근 시험에서 사용된 5%의 농도의 과정보다는 적어도 40% v/v 까지, 혹은 이를 포함하여 더 높은 농도의 혈장 또는 혈청의 사용을 가능하게 하며, 그것에 의하여 분석법의 전반적인 강건성(robustness)이 증가할 뿐 아니라 민감도도 대략 4배 내지 8배 증가한다.
두 번째 방법은 매질의 유전상수(dielectric constant)를 줄이기 위한 분리의 세척 버퍼에 글리세롤 등을 포함한 유기용매 중 어느 하나를 포함한다. 세척 버퍼에 유기용매의 첨가는 AptaSSN의 포스포디에스테르 골격(phosphodiester backbone)의 유사 전하 반발(like-charge repulsion)을 효과적으로 강화하므로, 백그라운드를 야기하는 상호작용을 하는 AptaSSN의 해리를 촉진한다. 상기 유기용매는 AptaSSN의 경향과 상반되므로, 백그라운드를 줄이고 다중 능력을 증가시킨다. 이와 같은 첨가는 심지어 5% v/v 혈장 또는 혈청에서도 쉽게 검출 가능하며, 5 ~ 10%의 혈장 또는 혈청 농도에도 분석이 가능할 만큼 분석 민감도를 향상시킨다.
세 번째 방법은 제2 분리 동안 용출을 위한 중성 pH에서의 카오트로픽염의 사용을 포함한다. 높은 pH(10)에서의 소디움 클로라이드(sodium chloride)의 사용을 포함하는 선행 방법들은 단백질/AptaSSN 상호작용뿐만 아니라 혼성화 및 AptaSSN/AptaSSN 상호작용을 방해한다. 상기 언급한 바와 같이, 혼성화에서 AptaSSN/AptaSSN 상호작용은 분석법의 백그라운드의 원인이 된다.
중성 pH에서 소디움 퍼클로레이트, 리튬 클로라이드, 소디움 클로라이드 및 마그네슘 클로라이드를 포함하지만 이에 한정되지 않는 카오트로픽염은 혼성화에서 AptaSSN/AptaSSN 상호작용을 지원하지만, 압타머/단백질 상호작용은 방해한다. 최종적인 결론은 분석 민감도의 상승과 함께 (약 10배) 현저하게 감소된 백그라운드이다.
본 발명에서 시료를 구성하는 분자집단에 결합하는 AptaSSN 및 이에 상응하는 분자 동정, 특정 분자에 대한 압타머 개발 그리고, AptaSSN 다중 분석법에서 "분리"는 시료로부터의 하나 또는 그 이상의 다른 분자의 분리, 농축 또는 제거를 말한다. 분리는 민감도를 증가시키고/증가시키거나 백그라운드(background)를 감소시키는 데 사용될 수 있다.
상기 분리는 "M-AptaSSN-FSS 복합체"가 형성된 경우, 임의의 단계 후에 또는 매 단계 후에 도입될 수 있다. 분리는 또한 "M-AptaSSN-FSS 복합체" 와 시료의 다른 성분 간에 별도로 존재하는 크기의 차이 또는 다른 특이적 특성에 의존한다. 분리는 AptaSSN 또는 분자와의 특이적 상호작용을 통하여 달성될 수 있다. 분리는 또한 AptaSSN, 분자 또는 M-AptaSSN-FSS 복합체의 물리적 또는 생화학적 특성에 기초하여 달성될 수 있다.
상기 AptaSSN/AptaSSN 상호작용은 시료를 구성하는 분자집단과 상호작용, 압타머 개발 그리고, AptaSSN 다중 분석법에 있어서 백그라운드의 원인이다. 본 발명에서 시료를 구성하는 복수의 분자에 유의하게 결합된 양에서 차이가 있는 AptaSSN 및 이에 상응하는 분자 동정, 특정 분자에 대한 압타머 개발 그리고, AptaSSN 다중 분석법에서 DNA-DNA 및 RNA-RNA 상호작용을 감소시키는 시약은 염기서열에 기초한다. AptaSSN 자체 구조의 상호작용은 AptaSSN의 제2 및 3차 구조를 결정하기 때문에, 염기서열에 기초한 구조에 영향을 주는 시약은 압타머 폴딩(folding)에 영향을 끼치지 않아, 그것의 대응하는 분자에 결합하는 다중 분석법에서 백그라운드 시그널을 실질적으로 감소시키는 것으로 기대할 수 없다.
본 발명에서 시료를 구성하는 분자집단에 유의하게 결합된 양에서 차이가 있는 AptaSSN 및 이에 상응하는 분자 동정, 특정 분자에 대한 압타머 개발 그리고, AptaSSN 다중 분석법에서, 많은 단계들이 백그라운드 시그널이 혼재될 수 있는 시료 또는 분석 시약DM로부터 특이적인 M-AptaSSN 복합체를 분리하도록 설계되어 있다. 이들 단계를 실시함에도 불구하고, 백그라운드는 여전히 이들 형태의 분석법에서 문제이다.
본 발명에서 시료를 구성하는 분자집단에 유의하게 결합된 양에서 차이가 있는 AptaSSN 및 이에 상응하는 분자 동정, 특정 분자에 대한 압타머 개발 그리고, 다중 AptaSSN-기반 분석법에 있어서 백그라운드는 경험적으로 처리될 수 있거나, 더 나은 접근법은 백그라운드의 근원을 확인하고 백그라운드를 야기하는 상호작용을 제거하는 것이다.
2. M-AptaSSN 복합체에서 용출된 AptaSSN 집단의 분석
본 발명은 상기 형성된 M-AptaSSN 복합체에 있는 AptaSSN 분리 단계에서 고정 상태 SSS-M-AptaSSN-FSS 복합체에서 다양한 방법으로 용출된 AptaSSN 집단을 얻을 수 있다. 상기 용출된 AptaSSN 분석하는 방법으로 분자에 특이적으로 결합하거나 유의하게 결합하는 양이 차이가 있는 AptaSSN 집단 및 이에 상응하는 분자를 동정할 수 있다. 상기 용출된 AptaSSN 집단을 분석하는 방법으로 분자가 포함된 시료에 대해 단일 분석물 테스트 또는 시료의 다중 분석을 수행할 수 있다. 상기 용출된 AptaSSN 집단을 측정하기 위하여 임의의 적절한 다중 핵산 검출 방법이 사용될 수 있다.
상기 용출된 AptaSSN 집단은 차세대 시퀀싱(next-generation sequencing), DNA 마이크로어레이 혼성화(DNA microarray hybridizatioin), Q-PCR, 질량 분석법(mass spectroscopy), 인베이더 분석법(Invader assay) 등과 같은 임의의 적절한 핵산 검출 방법에 의해 검출되고, 선택적으로 분석된다. 이들 검출 방법은 하기에 더 상세하게 기술하였다.
다양한 유형의 분자 또는 동일한 분자로 이루어진 시료에 대해 상기 단계들을 수행한 후 최종회에서 얻은 용출된 AptaSSN을 NGS 장비로 분석하여 생산된 염기서열을 분석하여 특정 시료에 대한 리드의 종류와 출현빈도를 결정한다.
상기 시료들의 생물학적 상태(생물학적 의미), 예를 들어 질병군, 비질병군를 기준으로 데이터베이스를 구축하여 다양한 통계적인 방법으로 상기 두 군을 대표하는 특징(Feature) 선정 단계를 수행한다.
상기 선정된 특징을 사용하여 구축된 데이터베이스 평가 방법으로 선정된 특징과 생물학적 상태의 연관성을 평가할 수 있다.
본 발명에서 분석한 시료에 대한 분석결과로부터 하나의 데이터베이스로 구축하고 상기 분석결과로부터 데이터베이스를 세분화할 수 있는 특징을 선정하는 방법을 실시할 수도 있다. 선정된 특징에 대한 새로운 생물학적 의미를 부여할 수도 있다.
상기 AptaSSN 라이브러리와 분자집단으로 이루어진 시료를 반응시켜 형성된 복합체에서 분리되는 AptaSSN 집단의 염기서열 및 출현빈도는 차세대 염기서열 방법으로 결정할 수 있다.
도 11은 AptaSSN 특이적 프라이머와 NGS 라이브러리 제작용 프라이머를 결합하여 제조한 AptaSSN 집단의 NGS 라이브러리 제작용 FXRP 프라이머를 제작하는 도면이다.
상기 FXRP 프라이머를 사용하여 상기 형성된 복합체 집단에서 분리된 AptaSSN을 증폭할 뿐만 아니라, NGS를 이용한 서열분석으로 AptaSSN을 분석할 수 있다.
사용하는 AptaSSN의 고정서열에 특이적으로 결합하는 염기서열과 NGS 라이브러리를 제작하는 데 필수적인 인덱스 프라이머 및 시퀀싱 프라이머를 모두 포함하는 FXRP 프라이머를 제작하여 NGS용 라이브러리 제작을 수행하였다. 그 결과 한 번의 PCR 및 정제 과정을 통해 NGS용 라이브러리를 제작할 수 있음을 확인하였다.
즉, 본 발명에서는 상기 FXRP 프라이머를 이용하여 NGS용 라이브러리를 제작한 결과, 기존의 방법에 비해 훨씬 간단하고 빠르게 NGS 용 라이브러리를 제작할 수 있다는 것을 확인할 수 있었다.
상기 AptaSSN 라이브러리와 분자집단으로 이루어진 시료를 반응시켜 형성된 복합체에서 용출되는 AptaSSN 집단는 P5(Ion A) 과 P7(Ion P1) Sequencing adaptors를 PCR-방법을 이용한 부가반응을 수행하여 Ion Torrent 차세대 시퀀싱 (NGS)을 위해 준비하였다.
시료를 단일 시퀀싱 실행으로 다중화할 수 있도록 정방향 프라이머를 통해 시료마다 고유한 8개 염기서열 기본 바코드를 포함시켰다. 정방향 프라이머(5'-P5 Adaptor-기본 바코드-SELEX primer-3')는 다음과 같이 설계되었다.
5'-ATAT-CCATCTCATCCCTGCGTGTCTCCGACTCAG-XXXXXXXX-CCACGCTGGGTGGGTC-3'
역방향 프라이머 (5'-P7 Adaptor-SELEX primer-3')는 다음과 같이 설계되었다.
5'-TTTTTTTT-CCTCTCTATGGGCAGTCGGTGAT-CTCTTTCTCTTCTCTCTTTCTCC-3'
시료를 30 사이클 동안 PCR에 의해 증폭시키고, 생성물을 Pico Green Assay (Invitrogen)에 의해 정량화하고 등몰 농도에서 단일 혼합물로 조합 하였다. 상기 제조된 NGS 라이브러리를 Amicon Ultra 0.5 컬럼 (Millipore, 미국)에서 추가로 농축시켰다. 최종 샘플을 Ion Torrent PGM 318 칩 시퀀싱 실행 (Thermo Fisher Scientific, 미국)을 하였다.
도 11을 참조하면, 제1 시퀀싱 서열(P5), 기본 바코드 및 정방향 프라이머로 구성된 정방향(F) FXRP 프라이머 그리고 제2 시퀀싱 서열(P7) 및 역방향 프라이머로 구성된 역방향(R) FXRP 프라이머를 포함하는 AptaSSN NGS 라이브러리 제작용 프라이머 세트에 관한 것이다.
바람직하게, 상기 정방향 프라이머는 단일가닥핵산의 5‘ 고정서열과 상기 역방향 프라이머는 3’ 고정서열의 상보적인 서열에 해당된다.
상기 AptaSSN 라이브러리를 이용하여 염기서열이 미확인된 차등 결합 AptaSSN 집단의 선정방법은 상기 라이브러리를 구성하는 AptaSSN 집단의 염기서열 및 출현빈도를 분석하여 시험시료 및 대조시료 집단에 대한 데이터베이스를 구축하여 통계학적인 방법으로 두 집단 사이에 차등적으로 존재하는 결합 AptaSSN 집단을 선정하는 방법을 구현할 수 있다.
도 12는 상기 차등결합 AptaSSN 집단의 선정을 위한 시료를 구성하는 분자집단과 AptaSSN 집단으로부터 M-AptaSSN 복합체을 형성하고 용출한 AptaSSN의 염기서열을 NGS로 결정하는 단계(a)와 용출한 AptaSSN에 대한 분자데이터인, 결합프로파일의 생산 및 분석하는 방법(b)에 대한 도면이다.
도 12을 참조하면, 상기 라이브러리에서 특정시료를 구성하는 분자집단과 형성된 복합체에서 분리된 AptaSSN 집단의 염기서열과 출현빈도, 생산을 목적으로 시퀀싱 라이브러리는 (a) 분석시료를 구성하는 분자집단과 선정된 AptaSSN 집단을 반응시켜 분자와 AptaSSN 복합체 집단을 형성하는 단계, (b) 상기 형성된 복합체 집단으로부터 AptaSSN 집단을 분리하는 단계, 및 (c) 상기 분리된 AptaSSN 집단으로부터 시쿼싱 라이브러리를 구축하는 단계를 포함하는 것으로 구성할 수 있다. 
상기 분자와 AptaSSN 복합체 집단을 제조하는 방법과 공정은, 분자와 AptaSSN의 결합 특이성과 친화도를 고려하여 설계할 수 있으며 AptaSSN 라이브러리 제조 과정을 참조할 수 있다.
다른 실시례로, 상기 다양한 반응용액 및 조건에서 형성되는 시료를 구성하는 분자와 AptaSSN 복합체 집단의 분리는 다양한 방법으로 수행할 수 있다(도 13).
(ⅰ) 시료를 구성하는 분자집단을 고체지지체, 비드의 구조체에 고정하여 AptaSSN 집단과 접촉시켜 형성된 고체지지체에 부착된 분자와 AptaSSN 복합체 집단을 고체지지체를 수확함으로써 분자와 AptaSSN 복합체 집단을 분리하는 방법(도 13 a), (ⅱ) 시료를 구성하는 분자집단을 고체지지체, 나이트로셀룰로즈와 나일론의 구조체에 고정하여 AptaSSN 집단과 접촉시켜 형성된 고체지지체에 부착된 분자와 AptaSSN 복합체 집단을 고체지지체를 수확함으로써 분자와 AptaSSN 복합체 집단을 분리하는 방법(도 13 b), (ⅲ) 시료를 구성하는 분자와 AptaSSN 라이브러리를 접촉시킨 후 모세관 전기영동을 수행하고 M-AptaSSN 복합체 집단과 미결합 분자 또는 미결합 AptaSSN를 분리하는 모세관 전기영동 방법, (ⅳ) 시료를 구성하는 분자와 AptaSSN 라이브러리를 접촉시킨 후 나이트로셀룰로즈와 나일론의 구조체에 처리하여 여과시켜 M-AptaSSN 집단을 수확하는 여과법 및 (ⅴ) 분자집단으로 이루어진 시료, AptaSSN 라이브러리와 그래핀의 반응혼합물에서 AptaSSN과 그래피 복합체가 제거된 M-AptaSSN 복합체 집단 분석 방법 등으로 수행할 수 있다.
상기와 같이 복합체로부터 AptaSSN 집단을 분리하고 이를 대상으로 공지된 방법으로 시쿼싱 라이브러리를 제조할 수 있다.
상기 시쿼싱 라이브러리는 분자집단 분석에 사용하는 모든 AptaSSN들이 동일한 고정서열이 있다면 이를 이용하여 시쿼싱 라이브러리를 제조할 수 있다.
본 발명은 또한, 상기 시쿼싱 라이브러리 제조는 먼저, 상기 용출된 RNA AptaSSN 집단을 대상으로 수행하는 역전사를 상기 FXRP 프라이머로 NGS 라이브러리를 제조하여 달성할 수 있다. 본 단계는 상기 결합 AptaSSN NGS 라이브러리 제작용 FXRP 프라이머 세트의 조합을 이용하여 상기 분리된 결합 AptaSSN을 증폭하고 증폭된 산물을 정제하여, 라이브러리 집단링(library pooling)하는 과정이다.
시퀀싱 라이브러리가 구축된 후, 얻은 시퀀싱 라이브러리를 시퀀서에 적용한다. 시퀀싱을 위한 방법 및 장치는 연쇄종료법(Sanger 방법)을 포함하지만, 특별히 이러한 예로 제한되지 않으며, 고 처리량 시퀀싱 방법(high-throughput sequencing method)이 바람직하다. 따라서, 이러한 장치들의 딥 시퀀싱과 고 처리량인 특징을 이용함으로써, 효율을 더욱 개선할 수 있고, 통계 시험 등의 시퀀싱 데이터를 이용한 후속 분석을 정밀하고 정확하게 더욱 개선할 수 있다. 고 처리량 시퀀싱 방법은 차세대 시퀀싱 기술 또는 단일 시퀀싱 기술을 포함하지만, 이러한 예로 제한되지는 않는다.
상기 제조된 라이브러리를 사용하여 시험시료 및 대조시료 집단의 분자와 상기 라이브러리를 구성하는 AptaSSN의 결합 양태를 검사하여 이에 대한 데이터베이스를 구축하여 시험시료 및 대조시료 집단에서 생물학적 의미가 있는 AptaSSN 집단을 선정할 수 있으며 또한, 선정되고 염기서열이 결정된 AptaSSN을 이용하여 분자를 분리하여 동정하는 방법을 제시할 수 있다.
본 발명에 따른 AptaSSN 집단의 염기서열 및 출현빈도 분석방법은, 상기 제조된 AptaSSN 라이브러리를 구성하는 AptaSSN 집단을 대상으로 차세대염기서열결정(Next Generation Sequecing: NGS) 과정을 포함한다. 상기 NGS는 칩(Chip)기반 그리고 PCR 기반 페어드엔드(paired end)형식으로 전장유전체를 조각내고, 상기 조각을 화학적인 반응(hybridzation)에 기초하여 초고속으로 시퀀싱을 수행하는 기술을 의미한다.
차세대염기서열결정(Metzker ML, Sequencing technologies-the next generation. Nat Rev Genet. 2010 Jan; 11(1):31-46)은 Illumina-Solexa(GATM, Hiseq 2000TM, 등), ABISolid 및 Roche-454 (파이로시퀀싱) 시퀀싱 플랫폼을 포함하지만, 이러한 예로 제한되지 않으며, 단일 시퀀싱 플랫폼(기술)은, Helicos Company의 True Single Molecule DNA 시퀀싱, Pacific Biosciences Company의 SMRTTM, 및 Oxford Nanopore Technologies의 노나포어 시퀀싱 기술등을 포함하지만, 이러한 예들로 제한되지 않는다. 시퀀싱 기술이 점진적으로 발전함에 따라, 통상의 기술자라면 모든 핵산 시퀀싱에 사용될 수 있는 다른 시퀀싱 방법들일 수도 있다.
시그널 강도(signal intensity)는 올리고(oligo)와 같은 DNA 조각이 칩에 붙어있는 DNA 조각에 결합된 형태를 스케너로 읽으면 결합 및 염기의 특징에 따라 색 및 강도가 측정되는 값을 말한다. 시퀀싱 회수(sequencing folds)는 시퀀싱을 수행하는 회수를 의미하는 것으로 10x로 시퀀싱을 하는 것이 일반적이나, 20x를 하면 보통 정도의 결과가 나오고, 40x 배수로 시퀀싱을 수행할 수도 있다.
차세대 염기서열 분석장치(Next Generation sequencer)는 기존 Sanger 방식의 염기서열분석과 비교할 때, 몇 주가 걸리던 DNA 라이브러리 제작 및 박테리아 클로닝 과정을 몇 시간의 중합효소 연쇄반응 증폭으로 대체하였으며, 수개의 모세관 어레이(capillary array)에서 이루어지던 병행 염기서열 분석(parallel sequencing)은 수십만 개의 클론(clone)을 동시에 시퀀싱할 수 있다. 또한, 다수의 염기서열 분석 결과물을 산출이 가능하여 고 처리량 염기서열 분석법(high-throughput sequencing)으로 불리며, 이러한 높은 밀도의 병행 염기서열 분석(parallel sequencing)은 많은 표적분자를 동시에 검출하기에 효과적이다. 하지만, 라이브러리 제작을 위한 중합효소 연쇄반응도중 생겨나는 편향현상으로 인하여 소량으로 있는 표적분자는 많은 양으로 있는 표적분자에 의하여 묻혀버리는 현상이 생긴다. 실제 임상 시료는 표적분자이 극소량으로 존재하는 경우가 많기 때문에, 기존의 방법으로는 극소량의 표적분자의 검출이 어려운 문제점이 있다. 상기 문제점을 해결하기 위해, NGS sequencing의 depth(read 수)를 높여 한계수치를 높이는 방법으로 해결할 수도 있다.
상기 선정되고 염기서열이 결정된 AptaSSN 집단의 평가는 시험시료 및 대조시료의 분자와 AptaSSN 복합체 집단에 있는 AptaSSN의 정량화 공정은 Q-PCR, MS 및 혼성화, 차세대염기서열결정(Next Generation sequecing: NGS)로 이루어지는 군으로부터 선택되는 방법을 이용하여 검출되고 선택적으로 하는 정량화할 수 있다.
상기 선정된 AptaSSN의 염기서열을 기초하여 상기 Q-PCR 공정은 TaqMan PCR, PCR 동안의 삽입성 형광 염료(intercalating fluorescent dye), 또는 PCR 동안의 분자 비콘(molecular beacon)을 사용하여 수행할 수도 있으며, 상기 혼성화 공정은 상기 결합 AptaSSN 또는 상기 결합 AptaSSN의 증폭산물이 포착포획성분와 결합하는 것이다.
상기 핵산분석방법은 NGS, 바이오칩 기술, PCR 기반 분석 기술 등이 있으며 이중에 선택되어지는 하나로 분석하는 내용이다. 각각 서로 다른 분석물(analyte)을 인식하고 선택적으로 다수의 결합 AptaSSN들이 시료에 도입되고, 임의의 상기에 기재된 검정법들이 수행될 수 있다. AptaSSN들을 분리한 후, 분리된 서로 다른 AptaSSN들을 측정하기 위하여 임의의 적절한 다중 핵산 검출 방법이 적용될 수 있다. 고체표면 상에 개별적으로 배열된 상보적 포획성분에 대한 혼성화에 의해 달성될 수 있으며 각각의 서로 다른 AptaSSN들이 질량 분석법을 사용하여 분자량에 기초하여 검출될 수 있다. 각각의 서로 다른 AptaSSN들은 모세관 전기영동(capillary electrophoresis)에서, 겔에서 또는 액체 크로마토그래피에서와 같은 전기영동도(electrophoretic mobility)에 기초하여 검출될 수 있다. 고유의 PCR 포획성분은 QPCR을 사용한 각각의 서로 다른 AptaSSN을 정량화하기 위해 사용될 수 있다. 다른 실시예에서, 각각의 서로 다른 결합 AptaSSN들은 질량 분석법을 사용한 분자량에 기초하여 검출될 수 있다.
상기 NGS를 이용하는 방법이 유용하나, 부가적으로 시험시료 및 대조시료에서 AptaSSN 집단을 처리하여 상기 시료들에 결합하는 두개의 서로 다른 포획성분들을 제조하여 분석할 수도 있다. 하나의 포획성분은 Cy3 염료를 가질 수 있고, 다른 하나는 Cy5 염료이다. 예로서 시험시료 및 대조시료에 동일한 AptaSSN 집단을 반응시키고. 각각의 시료는 동일한 방법으로 개별적으로 처리된다. 상기 시료들은 균일하게 혼합될 수 있고, 검정의 나머지 단계들이 수행될 수 있다. 시험시료 및 대조시료간의 임의의 다른 발현(즉, 시료 내 분자의 서로 다른 양 또는 농도)의 직접적 비교는 개별적으로 각각의 표지 시약으로부터의 시그널을 측정함으로써 가능하다. 이방법은 임의의 다른 검정법 내로 통합될 수 있다. 게다가, 형광 염료의 사용을 포함하는 서로 다른 염료를 사용하는 것에 더하여, 서로 다른 각각의 포획성분들로부터 시그널을 구별하기 위하여 다른 표지가 사용될 수 있다. 각각의 시료에서 사용된 AptaSSN들은 서로 다른 염색시약을 가질 수 있다. 이 방법은 판독이 QPCR 또는 혼성화 어레이인 경우에 유용하다.
본 명세서는 또한 AptaSSN 복합체로부터 검정 성분의 분리를 용이하게 하고, 검출 및/또는 정량을 위하여 AptaSSN을 분리할 수 있게 하는 M-AptaSSN 복합체를 기재한다.
전술한 방법으로 상기 제조한 AptaSSN과 시료를 구성하는 분자집단의 분자 복합체 집단에서 생성되는 AptaSSN 프로파일을 구성하는 정보를 분석하여 AptaSSN 기반으로 상기 시료 집단을 분류할 수도 있다.
상기 제조한 AptaSSN 라이브러리와 분석시료 집단을 구성하는 각각 시료를 반응시켜 형성된 복합체 집단에서 분리된 AptaSSN 집단을 분석하여 생산되는 상기 시료의 프로파일을 수집하여 분석시료에 대한 프로파일 자료 모두를 수집할 수 있다.
상기 수집된 모든 시료의 정보를 시료의 생물학적 의미에 따라 데이터베이스를 구축하고 특징선택(feature selection)하고 상기 구축된 데이터베이스를 선정된 특징을 사용한 기계학습언어 중 감독(supervised) 학습으로 생물학적 의미와 연관이 있는 AptaSSN 집단을 선정할 수 있다.
상기 수집된 시료의 정보에서 특징선택을 하고 선택되어진 특징, AptaSSN을 사용하여 기계학습언어중 비감독(nonsupervised) 학습으로 상기 시료 집단을 분류할 수도 있다.
Ⅲ. AptaSSN을 이용한 표적분자의 분석기술
상기 AptaSSN 집단은 출발 라이브러리로부터 제조된 AptaSSN 라이브러리 또는 상기 AptaSSN 라이브러리로부터 제조되는 균등 또는 차등결합 AptaSSN 라이브러리 그리고 기존 SELEX 방법으로 개발된 압타머 및 SOMAmer를 포함하는 AptaSSN 집단일 수 있다. 상기 AptaSSN 집단은 먼저 포집하고 정제하기 위해 바이오틴이 부가될 수도 있다.
도 14은 단일가닥핵산 라이브러리와 시료에 있는 분자집단에 유의하게 결합의 양적 차이가 있는 AptaSSN 집단을 선정하여 각각에 결합하는 표적분자를 규명하는 방법에 대한 도면이다.
도 14에 제시한 바와 같이, 본 발명의 AptaSSN 집단을 이용하여 특이적으로 결합하는 분자를 분리하고 이 복합체를 PAGE-SDS 젤에서 전기영동을 하여 단백질 밴드를 확인한다. 확인된 단백질 밴드를 절단하여 단백질을 추출한 후, MALTI TOF-TOF로 단백질을 동정하는 단계를 통해, 본 발명에 따라 제조된 AptaSSN에 특이적으로 결합하는 분자를 확인할 수 있다.
도 15는 분석하고자하는 시료에 있는 분자집단에 대해 AptaSSN 집단을 사용하여 하향식(a) 및 상향식(b) proteomic 연구에 대한 도면이다.
도 15 a에 제시한 바와 같이, 상기 염기서열이 미획인되거나 확인된 AptaSSN 집단은 미지와 기지인 단백질 집단으로 구성된 시료를 비교 분석할 수 있는 이상적인 리간드로 시료를 구성하는 복잡한 단백질 집단과 반응시켜 복합체를 형성할 수 있다. 상기 형성된 복합체로부터 분리된 AptaSSN 집단 또는 단백질 집단을 분석하여 단백질 집단의 존재 양상을 결정할 수 있다.
MS(Mass Spectrometry)에 의한 단백질의 ‘하향식(Top-down)’ ‘발견(Discovary)’ 또는 ‘비표적(Nontargted) 프로테오믹스는 한정된 시료에서 미지 또는 기지의 손상되지 않은 단백질에 대한 측정 결과를 비교분석으로 대표적인 기술인 MALDI(matrix-assisted laser desorption ionization) 및 SELDI-TOF(surface enhanced laser desorption-time of flight)는 단백질 프로파일을 제공하지만 단백질 식별을 제공하지 않는다. 이러한 하향식 분석에 사용되는 고체상 추출(Solid phase extraction, SPE)은 시료에서 손상되지 않은 단백질 정제를 위한 빠르고 효율적인 방법이며, 단백질의 상대적으로 작은 부분 집합이 추출되고 이어서 검출된다.
상기 AptaSSN 집단과 시료를 구성하는 분자집단을 반응시켜 형성되는 복합체 집단을 포집하고 정제하여 얻은 단백질 집단을 상기 발견 프로테오믹스 기술로 분석할 수 있다.
손상되지 않은 단백질 분석과는 대조적으로, 단백질 혼합물의 단백질 분해 처리 후 얻은 펩티드 혼합물의 분석은 '상향식(bottom-up)', '탄환(shot-gun)' 또는 ‘표적(targeted)’ 프로테오믹스라고 한다. '상향식(Bottom-up)' 프로테오믹스 연구는 일반적으로 단백질 식별을 제공하는 검색 기반 실험을 위해 구현되며 적절한 실험 설계를 통해 상대적인 절대 단백질 정량 측정을 제공할 수도 있다.
도 15 b를 참조하면, 분석하고자하는 시료에 있는 분자집단에서 AptaSSN 집단으로 분리한 단백질 추출물에 대한 용액 기반 단백질 분해와 제1원 (1D) SDS-PAGE 분리, 연속 겔 영역의 절제 및 각 겔 영역에서 단백질 분해를 수반하는 GeLC(one-dimensional sodium dodecyl sulfate-polyacrylamide gel electrophoresis 다음에 liquid chromatography을 실시하는 기술) 분석이며 구체적으로 살펴보면 *?* 단백질 분해, *?* 크로마토그래피 펩티드 분리, *?* 펩티드 직렬 MS, *?* 펩티드 식별 및 *?* 단백질 어셈블리에 대한 데이터베이스 검색 등을 포함한 구성이다.
본 발명에서 미지 및 기지의 단백질 집단을 최소한 포함하는 시료와 상기 선정된 AptaSSN 집단을 혼합하여 복합체를 제조한다. 제조된 복합체에서 단백질 집단을 추출하여 분리한 후, 상기 상향식 프로테오믹스의 단백질 분해 효소 처리를 수행할 수도 있다. 상기 AptaSSN의 한쪽 끝을 작용기로 변형시켜 상응하는 작용기가 있는 비드에 링커를 사용하여 연결시켜 AptaSSN-비드 컨쥬케이트(conjugate)를 공지된 방법으로 용이하게 제조할 수 있다. 단백질 혼합물과 상기 제조된 AptaSSN-비드 컨쥬케이트(conjugate)을 반응시켜 공지된 방법으로 형성된 복합체를 분리 정제하는 과정으로 단백질을 추출하며 상기 단백질 분해 효소 처리를 수행한다.
본 발명은 시료 처리량뿐만 아니라 향상된 민감도와 특이성에 대한 필요성 때문에 생물학적 시료에서 LC-MS와 함께 AptaSSN 친화력을 사용하여 분석물을 추출할 수도 있다.
AptaSSN 친화력을 이용한 단백질 추출은 다양한 포맷의 시료 준비에 사용될 수 있다. AptaSSN 포집은 선택되어진 하나의 단백질 또는 단백질 군의 결합부위에 대한 AptaSSN의 분자 인식을 바탕으로 한 추출을 의미한다. AptaSSN은 트립신 펩티드에 의해 분해되지 아니한다. 대안으로 표적 분자를 분리하는 데 사용하기 위해 AptaSSN 친화성 전략을 사용하여 가장 풍부한 단백질을 제거할 수도 있다. 시료 준비 수단으로서의 AptaSSN 기반 접근법은 오프 라인, 온 비드, 칼럼, 온라인 및 인라인 비드 트랩과 같은 서로 다른 중복 형식으로 사용할 수 있다.
상기 단백질 분해 효소 처리를 수행하고 얻은 펩티드 혼합물은 다음과 같이 분리할 수 있다. 일반적으로 MS 단백질을 확인하고 측정하기 전에 절제된 겔 밴드의 단백질과 같은 펩티드 혼합물을 I-D 액체 크로마토그래피(LC)로 분리할 수 *?**?*있다. 2D-LC는 조직 또는 세포 단백질과 같은 복합 펩티드 혼합물의 분획에 사용된다. 첫 번째 차원은 전형적으로 펩티드 pI 또는 고 pH 용매에서의 소수성에 기초한 펩티드를 분리한다. 두 번째 차원 분리는 일반적으로 낮은 pH 용매에서 펩티드 소수성을 기반으로 하며 컬럼 팁과 MS 오리피스 사이의 MS-ESI 인터페이스로 '인라인'으로 수행된다. 덜 일반적인 접근법에서, 두 번째 차원의 LC 용리액은 LC MALDI-TOF 분석을 위한 금속판 또는 표적으로 향하게 된다.
상기에서 분리된 펩티드 혼합물에 대한 탠덤 MS에 의해 상기 분리된 펩티드의 질량 스펙트럼은 상향식 실험에서 단백질 확인에 사용할 수 있다. 프로그램 특정 알고리즘은 이론적으로 유도된 펩티드 단편 패턴과 실험 펩티드 데이터를 비교한다. 잠재적인 펩티드 데이타베이스 일치는 랭킹, 득점 및 보고 단계로 진행된다. 가장 높은 득점 펩티드는 복잡한 혼합물(단백질 어셈블리)에 존재하는 유추된 단백질의 목록을 생성하는 데 사용된다. Parsimonious protein assembly를 사용하여 가장 적은 수의 단백질도 검출된 펩티드의 확인으로 가능하다. 데이터베이스 검색 알고리즘의 변형은 데이터베이스 검색을 위한 다수의 상용 및 오픈 소스 검색 프로그램이 있으며, 각각 고유한 펩티드 후보 스코어링 스킴(schemes) 및 단백질 추론 방법이 있다. 단백질 당 하나 이상의 펩티드가 일치한다는 것은 표본에서 단백질의 검출에 대한 충분한 증거이다.
본 발명에서는 제조된 차등결합 AptaSSN 집단을 이용하여 기존 상향식 프로테오믹스 기술의 분석능력을 향상시킬 수 있다.
분석하고자하는 단백질들을 포함하는 시료에서 단백질 혼합물을 추출하고 선정되는 AptaSSN 집단과 반응시켜 표적 단백질 집단을 포집하여 분리하며 프로테아제로 소화시켜 펩티드 혼합물을 만든다. 그런 다음 펩티드 혼합물을 마이크로 모세관 컬럼에 직접 로딩하고 펩티드를 소수성 및 전하로 분리한다. 펩티드가 컬럼에서 용리됨에 따라 탠덤 질량 분석의 첫 단계에서 m/z에 의해 이온화되고 분리된다. 선택되어진 이온은 분열을 유도하기 위해 충돌 유도된 해리 또는 다른 프로세스를 거친다. 대전된 단편은 탠덤 질량 분광계의 두 번째 단계에서 분리된다.
각 펩티드의 단편화 질량 스펙트럼의 "지문"은 상업적으로 이용 가능한 소프트웨어(예: MASCOT)로 서열 데이터베이스를 검색함으로써 유래된 단백질을 확인하는데 사용된다. 서열 데이터베이스의 예로 Genpept 데이터베이스 나 PIR 데이터베이스가 있다. 데이터베이스 검색 후 각 펩티드 - 스펙트럼 일치(PSM)는 타당성을 평가할 필요가 있다. 이 분석을 통해 다양한 생물 시스템을 프로파일링할 수 있다.
SRM은 탠덤 질량 분석기의 첫 단계에서 특정 질량의 이온을 선택하는 탠덤 질량 분석법에 사용되는 방법이고 제2 질량 분석기 단계에서 전구체 이온의 단편화 반응의 이온 생성물이 선택, 검출된다.
SRM은 질량 분광 분석법에 의해 분자 정량 proteomics에 사용될 수 있다. 예를 들어, 전기분무 소스(electrospray source)에서 이온화한 후, 펩티드 전구체를 우선 분리하여 대부분 의도된 종의 실질적인 이온 집단을 얻는다. 그런 다음이 집단을 파편화하여 신호 이온이 시료의 펩티드 존재량을 나타내는 생성 이온을 산출한다. 이 실험은 triple quadrupole mass spectrometers에서 수행될 수 있다. 농도 기준으로서 복합 매트릭스에 대한 중-표지된 펩티드 (예 : D, 13C 또는 15N)와 동위 원소 표지를 사용하여, SRM은 네이티브의 가벼운 펩티드의 절대 정량 (즉, 세포 당 카피 수)을 제공할 수 있는 보정 곡선을 구성하고, 그 부모 단백질을 확장하는 데 사용될 수 있다.
SRM은 a) SRM 전이의 특이성을 확인하거나 b) 표준 MS 분석의 검출 한계 이하의 특이적인 번역후 변형을 검출하는 펩티드의 완전한 제품 이온 스캔을 유발하는 방법으로 사용되어왔다. SRM은 매우 민감하고 재현성있는 질량 분광기 기반의 단백질 분자 탐지 플랫폼 (SAFE-SRM)으로 개발되었으며 SRM 기반의 새로운 파이프 라인은 임상 프로테오믹스 응용 분야에서 주요 장점을 가지고 있다. 전통적인 SRM 파이프 라인에 비해 훨씬 더 우수한 결과를 보였으며 ELISA와 같은 항체 기반 단백질 바이오마커 진단 방법보다 획기적으로 개선된 진단 성능을 보여주었다.
SWATH-MS 접근법은 재현성, 선형 동적 범위 및 민감도는 현재 단백질 정량화에 대한 황금 표준 접근법인 SRM과 유사하여 구체화된 펩티드 중심 스코어링과 결합된 DIA가 대규모의 포괄적이고 재현 가능한 프로테오믹스에 적합하다.
분석하고자하는 단백질들을 포함하는 시료에서 단백질 혼합물을 추출하고 선정되는 AptaSSN 집단과 반응시켜 표적 단백질 집단을 포집하여 분리하며 단백질 분해 효소를 처리하여 확보한 펩티드 혼합물을 고성능 액체 크로마토그래피와 함께 질량분석기로 분석하여 다양한 검색엔진으로 펩티드를 확인하고 상기 포획 분리된 단백질 집단의 구성 단백질들을 식별할 수 있으며, 이를 AptaSSN기반 Shotgun Proteomics이라고 하였다.
도 15 b에 제시한 바와 같이, 본 발명의 SRM에 AptaSSN을 이용한 단백질 포집을 포함하는 방법과 기존 SRM 분석법은 서로 다른 성능 프로파일을 보일 수 있다. 본 발명의 AptaSSN 추출과 LC-MS 검출을 결합하면 민감도와 용량이 증가할 수 있다. 본 발명의 M 단백질 집단을 포집하는 AptaSSN 포맷은 농축 및 정제를 허용하여 MS의 감도 한계를 향상시킬 수 있다. LC-MS 시스템의 또 다른 병목은 용량 제한과 LC에 대한 직교성으로 인해 LC 사이클 시간을 줄이고 MS에 도입된 간섭을 줄임으로써 검출 한계를 향상시켜 더 높은 처리량을 허용할 수 있는 본 발명의 AptaSSN의 선택성이다. 한편, 이런 AptaSSN을 사용한 MS는 기존의 면역 측정법에 비해 우수한 특이성을 부여할 수도 있다.
본 발명의 상기 AptaSSN에 의한 단백질 포집과 SRM의 결합전략은 기존 다양한 분석 기술의 한계가 있는 번역 후 변형(PTM) 또는 이소형과 같은 매우 유사한 단백질 간의 차이점을 분석할 수도 있다. 그러나, PTM이 결합부위 상에 있거나 그렇지 않으면 AptaSSN 추출 친화성에 영향을 미치는다면, 이것은 물론 AptaSSN 선택성의 특이성의 중요성을 강조하는 AptaSSN 포집의 효과가 LC-MS 방법에 영향을 미칠 수 있다.
전술한 방법으로 분자집단으로 이루어진 시료 집단에서 각각 시료의 분자와 AptaSSN 복합체에서 생성되는 분자 프로파일을 구성하는 정보를 분석하여 분자 기반으로 상기 시료 집단을 분류할 수도 있다.
상기 분석시료 집단을 구성하는 각각 시료와 상기 제조한 AptaSSN 라이브러리를 반응시켜 형성된 복합체 집단에서 분리된 분자집단을 분석하여 생산되는 분자 프로파일을 수집하여 분석시료에 대한 프로파일 자료 모두를 수집할 수 있다.
상기 수집된 모든 시료의 정보를 시료의 생물학적 의미에 따라 데이터베이스를 구축하고 특징선택(feature selection)하고 상기 구축된 데이터베이스를 선정된 특징, 분자집단을 사용한 기계학습언어 중 감독형(supervised) 알고리즘으로 생물학적 의미와 연관이 있는 분자집단을 선정할 수 있다.
상기 수집된 시료의 정보에서 특징선택을 하고 선택되어진 특징, 분자집단을 사용하여 기계학습언어중 비감독형(nonsupervised) 알고리즘으로 상기 시료 집단을 그룹화할 수도 있다.
Ⅳ. 키트
본 키트는 AptaSSN 다중 분석에 한정된 것이 아니며, 다양한 유형의 분자로 구성된 시료를 구성하는 분자집단에 유의한 결합차이가 있는 AptaSSN 선정, 분자 분석 및 특정 분자의 압타머 개발에 대한 키트도 새로이 제공할 수 있다.
본 발명 시료를 AptaSSN 다중 분석하기 위하여 임의의 본 발명에 개시된 방법을 알맞게 수행하는데 유용한 키트에 관한 것이다.
본 발명의 다목적성을 강화시키기 위하여, 시약은 시약의 비율이 상기 방법 및 분석의 실질적인 최적화를 제공하도록 동일 또는 개별 용기에 패키지된 조합으로 제공될 수 있다.
이 시약들은 각각의 개별 용기에 담겨질 수 있거나, 여러 시약들이 시약의 교차 반응성 및 시약의 안정성에 따라 하나 또는 그 이상의 용기에서 화합될 수 있다.
키트는 적어도 하나의 태그된 AptaSSN 및 각각 적어도 하나의 포획제를 포함하는 하나 또는 그 이상의 고체지지체를 포함하는 조합이다.
상기 키트는 또한 세척, 시료 제조 시약 등뿐만 아니라 시료 희석을 위한 완충된 수성 매질(aqueous midium)과 같은 세척 용액도 포함할 수 있다. 상기 키트는 일반적으로 분자의 변형 또는 유도체화를 통하여 제2 태그를 도입하는 데 유용한 시약을 더 포함할 수 있다.
게다가, 상기 키트는 분석 방법 동안 바람직한 엄격한 세척용액을 수행하는 데 적합한 시약을 포함할 수 있다.
키트 내 다양한 시약의 상대적인 양은 분석 중에 발생할 필요가 있는 반응을 실절적으로 최적화시키고, 또한 분석의 민감도를 실질적으로 최적화시키는 시약의 농도를 제공하기 위해 매우 달라질 수 있다.
적절한 환경 하에서, 키트 내의 하나 또는 그 이상의 시약들은 첨가제를 포함하는 일반적으로는 감압하에 동결건조된 건조 분말로서 제공될 수 있고, 이것의 용해는 본 발명에 따른 방법 또는 분석법을 수행하기에 적절한 농도를 가지는 시약 용액을 제공할 것이다.
상기 키트는 본 발명에 기재된 것과 같은 임의의 방법에 따른 설명서를 더 포함할 수 있다.
시료에 존재할 수 있는 하나 또는 그 이상의 분자의 검출 및/또는 정량을 위한 키트는 분자에 대하여 특이적인 친화력과 제1 포획성분에 결합 가능한 제1 태그가 있는 적어도 하나의 압타머, 및 제1 포획성분이 있는 FSS를 포함한다. 여기에서 상기 제1 포획성분은 압타머 상의 제1 태그와 결합할 수 있다.
게다가, 상기에 기재된 임의의 키트는 키트의 검출 방법 동안에 엄격한 세척용액의 수행을 위한 시약 및 분자를 포함할 수 있다.
"제1 분리"는 제1 반응용액으로부터 현탁상태 M-AptaSSN-FSS 복합체와 동시에 함께 AptaSSN-FSS 복합체의 분리를 말한다. 제1 분리의 목적은 제1 반응용액으로부터 현탁상태 AptaSSN-FSS 복합체에 결합되지 않은 시료 내의 모든 성분들을 실질적으로 제거하기 위한 것이다.
다수의 이러한 성분들을 제거하는 것은 제2 분리를 위해 사용된 분자 태그 단계로부터 비표적 분자를 제거함으로써 분자 태그 효율을 향상시킬 것이며, 분석 백그라운드를 낮출 것이다.
태그 단계는 AptaSSN에 제1 태그를 붙이는 것에 의해 분석 전, 분석을 준비하는 동안 또는 분석하는 동안에 부착된다. 상기 제1 태그는 제1 포획성분과 결합 가능한 제1 태그이다. 제1 태그된 AptaSSN는 FSS에 포획될 수 있고, 여기에서 상기 FSS는 제1 태그에 적절한 제1 포획성분을 포함한다. 상기 FSS 그 후 임의의 원치않는 분자들을 제거하기 위하여 시료와 평형화되기에 앞서 본 발명에 기술된 바와 같이 세척될 수 있다.
"제2 분리"는 분자의 포획에 기초한 제2 반응용액으로부터 고정상태 SSS-M-AptaSSN-FSS 복합체의 분리를 말한다. 제2 분리의 목적은 검출 및 선택적 정량화에 앞서 제2 반응용액으로부터 현탁상태 자유 AptaSSN-FSS 복합체를 제거하기 위한 것이다. 제2 반응용액으로부터 현탁상태 자유 AptaSSN-FSS 복합체를 제거하는 것은 임의의 적절한 핵산 검출 기술에 의해 고정상태 SSS-M-AptaSSN-FSS 복합체에 포함된 AptaSSN의 검출을 가능하게 한다.
검출 및 선택적 정량화를 위하여 Q-PCR을 사용할 때, 제2 반응용액으로 부터 현탁상태 자유 AptaSSN-FSS 복합체의 제거는 고정상태 SSS-M-AptaSSN-FSS 복합체에 포함된 AptaSSN를 사용한 표적분자의 정확한 검출 및 정량화를 할 수도 있다.
상기 분자는 단백질 또는 펩티드이고, 자유 AptaSSN-FSS 복합체는 표적 단백질을 포함하는 시료 내로 혼입하여 제1 반응용액을 제조할 수 있는 시약을 사용하여 제1 반응용액에는 현탁상태 M-AptaSSN-FSS 복합체와 미반응 자유 AptaSSN-FSS 복합체가 있고, 시료의 나머지로부터 현탁상태 M-AptaSSN-FSS 복합체와 미반응 자유 AptaSSN-FSS 복합체를 분리할 수 있다.
제2 태그된 M-AptaSSN-FSS 복합체는 고정상태 SSS에 고정화될 수 있다. 현탁상태 자유 AptaSSN-FSS 복합체로부터 상기 고정상태 SSS-M-AptaSSN-FSS 복합체의 분리를 가능하게 한다. 이러한 제2 태그는 표적 단백질을 대상으로 진행되며, 바이오틴 부분을 포함할 수 있다.
제2 태그는 세척되고 현탁상태 M-AptaSSN-FSS 복합체의 분자에 제2 태그를 화학적으로 부착시키는 것에 의해 분석 전, 분석을 준비하는 동안, 또는 분석하는 동안 단백질(또는 펩티드)에 부착된다. 제2 태그는 바이오틴일 수 있다.
상기 SSS는 제2 태그에 적절한 제2 포획성분을 포함한다. 세척되고 현탁상태 제2 테깅된 M-AptaSSN-FSS 복합체는 상기 고정상태 SSS의 제2 포획성분에 포획될 수 있다.
현탁상태 제2 태그된 M-AptaSSN-FSS 복합체와 AptaSSN-FSS 복합체는 함께 혼합물을 고정 상태 SSS이 포함된 혼합물로 이송하여 제2 반응용액을 형성할 수 있다. 그 후 제2 반응용액에서는 자유 AptaSSN-FSS 복합체는 현상 상태로 있는 반면, 상기 제2 태그된 M-AptaSSN-FSS 복합체는 SSS의 제2 포획성분과 분자의 제2 태그가 결합 상호작용으로 고정상태 SSS-M-AptaSSN-FSS 복합체를 형성한다. 그 후에 세척단계로 제2 반응용액으로부터 현탁상태 자유 AptaSSN-FSS 복합체를 제거할 수 있다.
상기 고정상태 SSS-M-AptaSSN-FSS 복합체는 그 후 유기용매를 포함하는 완충용액 및 염(salts) 및/또는 세제(detergents)를 함유하는 염 및/또는 세제를 포함하는 완충용액을 포함하는 다양한 완충용액으로 세척된다.
상기 고정상태 SSS-M-AptaSSN-FSS 복합체로부터 AptaSSN-FSS는 AptaSSN/분자의 상호작용을 파괴하는 임의의 방법에 의해 방출될 수 있다. 이것은 비공유적으로 결합된 M-AptaSSN 복합체를 해리하는 고농도의 염 버퍼로 지지체에 결합된 M-AptaSSN 복합체의 세척을 통하여 달성될 수 있다. 용출된 자유 AptaSSN는 수집되고 검출된다. 높거나 낮은 pH는 M-AptaSSN 복합체를 파괴하는데 사용될 수 있고 높은 온도도 M-AptaSSN 복합체를 해리하는데 사용될 수 있다. 임의의 상기 방법들의 조합이 사용될 수 있다.
본 발명의 압타머는 포획 성분에 AptaSSN(그것에 결합된 임의의 분자)를 부착하거나 고정화시키기 위한 수단을 제공하는 성분을 말하는 "태그(tag)"를 더 포함할 수 있다. "태그"는 "포획 성분(capture element)"과 결합할 수 있는 부분이다.
상기 태그는 임의의 적절한 방법에 의해 AptaSSN에 부착되거나 포함될 수 있다. 상기 태그는 AptaSSN가 고체지지체에 부착된 포획성분 또는 수용체와 직접적 또는 간접적으로 결합할 수 있도록 한다. 상기 포획성분은 전형적으로 태그와 그것의 상호작용에 매우 특이적이고, 그 다음의 처리 단계 또는 과정 동안 결합을 유지하도록 선택(또는 설계)된다.
태그는 고체지지체 상의 공간적으로 정의된 곳에 M-AptaSSN 복합체를 위치시킬 수 있다. 따라서, 서로 다른 태그들은 서로 다른 M-AptaSSN 공유결합 복합체를 고체지지체 상의 서로 다른 공간적으로 정의된 곳에 위치시킬 수 있다.
태그는 폴리뉴클레오티드(polynucleotide), 폴리펩티드(polypeptide), 펩티드 핵산(peptide nucleic acid), 잠금 핵산(locked nucleic acid), 올리고당(oligosaccharide), 다당(polysaccharide), 항체(antibody), 애피바디(affibody), 항체 모조체(antibody mimic), 세포 수용체(cell receptor), 리간드(ligand), 지질(lipid), 바이오틴(biotin), 폴리히스티딘(polyhistidine), 또는 이러한 구조들의 임의의 단편 또는 유도체, 앞서 기재한 것들의 임의의 조합 또는 특이성을 가지도록 설계되거나 특이성을 가지고 결합하도록 만들거나 특이성을 가지고 결합될 수 있는 포획 성분(또는 하기에 기재된 것과 같은 링커 분자)일 수 있다.
상기 태그는 바이오틴기(biotin group)이고, 상기 포획 성분은 아비딘(avidin), 스트렙타비딘(streptavidin), 뉴트라비딘(neutravidin), 엑스트라비딘(extravidin) 또는 스트렙타비딘(streptavidin)과 같은 바이오틴 결합 단백질이다. 바이오틴은 합성하는 동안에 압타머 내로 쉽게 혼합되며, 스트렙타비딘 비드는 쉽게 입수 가능하므로, 이 조합은 알맞게 사용될 수 있다.
상기 태그는 폴리히스티딘(polyhistidine)이고, 상기 포획성분은 니켈(nickel), 코발트(cobalt), 철(iron)과 같은 금속 이온 또는 니트릴로트리아세트산(nitrilotriacetic acid; NTA)과 킬레이트될 때 폴리-히스티딘과 배위 화합물(coordination compound)을 형성할 수 있는 임의의 다른 금속 이온과 킬레이트화된 니트릴로트리아세트산이다.
상기 태그는 상보적 폴리뉴클레오티드 서열을 포함하는 포획 성분과 직접적으로 혼성화되도록 설계된 폴리뉴클레오티드이다. 이 경우에서, 태그는 때때로 "서열 태그(sequence tag)"로서 말해지고, 상기 포획성분은 일반적으로 "포획성분(probe)"로서 말해진다. 상기 태그는 일반적으로 구성되며, 상기 혼성화 반응은 상기 태그가 상기 포획성분의 완벽한 상보체(complement) 이외의 포획성분와 혼성화되지 않도록 하기 위한 조건하에서 수행된다. 이것은 각각의 태그/포획성분 조합이 고유의 서열을 가질 수 있도록 다중 분석 포맷의 설계를 가능하게 한다.
태그는 그것 자체 또는 태그에 부착되거나 그것이 태그의 일부분인 압타머와 분자 내적으로(intermolecularly) 상호작용하지 않도록 구성된다. 압타머를 선정하기 위하여 SELEX를 사용한다면, 상기 태그는 SELEX 전 또는 후에 압타머에 추가될 수 있다.
상기 태그는 SELEX 후 압타머의 5' 말단 상 또는 3' 말단 상에 포함된다. 상기 태그는 SELEX 후 변경 공정에서 압타머의 3' 및 5' 말단 모두에 포함될 수 있다. 상기 태그는 압타머의 내부 분절(internal segment)일 수 있다.
상기 태그는 압타머 자체의 일부분인 뉴클레오티드를 포함한다. 만약 압타머를 확인하기 위하여 SELEX를 사용한다면, 상기 압타머는 압타머에 따라 달라지는 뉴클레오티드 서열, 즉 가변 영역에 의해 3'-고정 말단으로부터 분리된 5'-고정 말단을 포함한다. 상기 태그는 고정 말단에 내재하는 뉴클레오티드를 포함하는 전체 고정말단 또는 고정 말단의 임의의 부분과 같은, 압타머의 고정 말단에 포함된 임의의 적절한 수의 뉴클레오티드를 포함할 수 있다.
상기 태그는 포획성분와 직접적으로 결합할 수 있고 포획성분에 공유적으로 결합되며, 그것에 의하여 압타머는 고체지지체의 표면에 공유적으로 결합된다.
상기 태그는 링커 분자를 통하여 포획성분와 간접적으로 결합된다. 상기 태그는 링커 분자의 특정 영역 또는 성분에 대해 상보적인 폴리뉴클레오티드 서열을 포함할 수 있다. 상기 태그는 일반적으로 구성되고, 상기 혼성화 반응은 링커 분자에 포함된 폴리뉴클레오티드 서열 이외의 폴리뉴클레오티드 서열과 혼성화되지 않도록 수행된다.
만약 태그가 폴리뉴클레오티드를 포함한다면, 상기 폴리뉴클레오티드는 임의의 적절한 수의 뉴클레오티드를 포함할 수 있다. 상기 태그는 적어도 약 10개의 뉴클레오티드를 포함한다. 상기 태그는 약 10개 내지 약 45개의 뉴클레오티드를 포함한다. 상기 태그는 적어도 약 30개의 뉴클레오티드를 포함한다. 폴리뉴클레오티드를 포함하는 서로 다른 태그들은 동일한 수의 뉴클레오티드 또는 서로 다른 수의 뉴클레오티드를 포함할 수 있다.
상기 태그 성분은 고체지지체 상의 포획성분과의 특이적 상호작용에 대한 기능성 및 태그의 포획성분 결합 성분에 부착된 분자를 해리하는 것에 대한 기능성을 포함하므로 두 가지 기능을 가진다. 상기 태그의 포획성분 결합 성분을 해리하기 위한 수단은 화학적 수단, 광화학적 수단 또는 사용될 특정 태그에 따라 다른 수단을 포함한다.
"포획성분(capture element)"은 태그와 직접적 또는 간접적으로 결합하도록 형성된 분자를 말한다. 포획성분은 태그와 직접적 또는 간접적으로 결합시킴으로써 태그가 고체지지체에 부착된 부분을 고정시킬 수 있는 한 형태의 분자 또는 한 형태의 복합-분자(multi-molecular) 구조의 복제 세트이다.
포획성분은 하나 이상의 이러한 분자 세트를 말한다. 포획성분은 폴리뉴클레오티드, 폴리펩티드, 펩티드 핵산, 잠금 핵산, 올리고당, 다당, 항체, 애피바디, 항체 모조체, 세포 수용체, 리간드, 지질, 이러한 구조의 임의의 단편 또는 유도체, 앞서 기재한 것들의 임의의 조합 또는 특이성을 가지도록 설계되거나 특이성을 가지고 결합하도록 형성되거나 그렇지 않으면 특이성을 가지고 결합될 수 있는 태그(또는 링커 분자)를 가진 임의의 다른 구조일 수 있다. 포획 성분은 임의의 적절한 방법에 의해 공유적 또는 비공유적으로 고체지지체에 부착될 수 있다.
포획성분은 일반적으로 폴리뉴클레오티드 서열을 말한다. 상기 포획성분은 폴리뉴클레오티드 태그 서열에 대하여 상보적인 서열을 가지는 폴리뉴클레오티드를 포함한다. 상기 포획성분 서열은 일반적으로 구성되며, 혼성화 반응은 포획성분이 상보적 서열을 포함하는 포획성분에 대한 태그 이외의 뉴클레오티드 서열과 혼성화되지 않도록 하기 위한 조건 하에서 수행된다(즉, 포획성분은 일반적으로 구성되며, 상기 혼성화 반응은 포획성분이 서로 다른 태그 또는 AptaSSN와 혼성화되지 않도록 하기 위한 조건 하에서 수행된다).
상기 포획성분은 예를 들어, 링커 분자를 통하여 태그와 간접적으로 결합한다. 상기 포획성분은 링커 분자의 특정 영역 또는 성분에 대하여 상보적인 폴리뉴클레오티드 서열을 포함할 수 있다.
상기 포획성분은 일반적으로 구성되며, 상기 혼성화 반응은 포획성분이 링커 분자 내에 포함된 폴리뉴클레오티드 서열 이외의 폴리뉴클레오티드 서열과 혼성화되지 않도록 하기 위한 조건 하에서 수행된다.
*만일 포획성분이 폴리뉴클레오티드를 포함한다면, 상기 폴리뉴클레오티드는 임의의 적절한 수의 뉴클레오티드를 포함할 수 있다. 포획성분은 적어도 약 10개의 뉴클레오티드를 포함한다. 포획성분은 약 10개 내지 약 45개의 뉴클레오티드를 포함한다. 포획성분은 적어도 약 30개의 뉴클레오티드를 포함한다. 폴리뉴클레오티드를 포함하는 서로 다른 포획성분은 동일한 수의 뉴클레오티드 또는 서로 다른 수의 뉴클레오티드를 포함할 수 있다.
상기 포획성분은 폴리뉴클레오티드 태그와의 특이적 상호작용에 대한 기능성 및 포획성분와 AptaSSN가 동시에 방출되도록 하기 위하여 고체지지체로부터 포획성분를 분리하기 위한 기능성을 포함하므로 두 가지 기능을 가진다. 고체지지체로부터 포획성분를 해리하기 위한 수단은 화학적 수단, 사용될 특정 포획 포획성분에 따라 다른 수단을 포함한다.
특정 태그와 포획 성분 한 쌍 간의 상호작용의 상호간 특성 때문에, 태그는 다른 구현에서 포획 성분으로서 사용될 수 있고, 포획 성분은 다른 구현에서 태그로서 사용될 수 있다. 바이오틴 태그를 이용한 AptaSSN는 일 구현에서 고체지지체에 부착된 스트렙타비딘으로 포획될 수 있는 반면, 스트렙타비딘 태그를 이용한 AptaSSN는 고체지지체에 부착된 바이오틴으로 포획될 수 있다.
링커(linker)는 두 개의 작용기 또는 분자 구조를 연결하는 데 사용하는 분자 구조이다. "스페이싱 링커(spacing linker)" 또는 더욱 간단하게는 "스페이서(spacer)"는 AptaSSN 내의 두 개의 서로 다른 작용기 사이에 간격(separation or spacing)을 제공하는 양성 원자(benign atom)의 그룹을 말한다. 또는 그것은 비공유적 상호작용이 깨지거나 파괴될 수 있는 두 개 또는 그 이상의 분자(본 발명에서 "혼성화 링커(hybridization linker)"로 칭함)를 포함할 수 있다.
개개의 기능성의 방해를 방지하기 위하여 다른 것들로부터 어떤 작용기를 공간적으로 분리할 필요가 있다. 충분한 공간적 분리를 제공하는 비간섭 부위(non-interfering moiety)를 가지는 이러한 기를 분리하는 것이 바람직하다. 어떤 구현에서, "스페이싱 링커"는 표지 기능성을 모두 가지는 AptaSSN 내로 도입된다.
스페이싱 링커는 합성하는 동안에 AptaSSN 내로 도입되며, 3, 6, 9. 12 및 18개의 탄소 원자 길이의 지방족 탄소 사슬(aliphatic carbon chain), 1, 3 및 9개의 에틸렌 글리콜 유닛 길이의 폴리에틸렌 글리콜사슬(polyethylene glycol chain), 또는 테트라하이드로퓨란 부분(d스페이서(dSpacer)라고 칭함(Glenn Research)) 또는 앞서 말한 것의 임의의 조합 또는 임의의 다른 구조 또는 포스포디에스테르 골격에 따라 길이를 첨가하기 위하여 설계되거나 구성될 수 있는 화학적 성분을 포함하지만 이로 제한되지 않는 다수의 포스포아미다이트 스페이서(phosphoamidite spacers)로 구성될 수 있다.
상기 스페이싱 링커는 폴리 dT, dA, dG, 또는 dC 또는 폴리 U, A, G 또는 C와 같은 폴리뉴클레오티드 또는 앞서 말한 것의 임의의 조합을 포함한다. 다른 구현에서, 스페이서는 하나 또는 그 이상의 어베이식 리보오스 또는 데옥시리보오스 부분을 포함한다. 이러한 서열들은 그것들이 AptaSSN의 구조 또는 기능을 방해하지 않도록 설계된다.
"혼성화 링커(Hybridization linker)"는 화학적 또는 물리적 방법을 통하여 비공유적 상호작용이 깨지거나 파괴될 수 있는 두 개 또는 그 이상의 분자를 포함하는 링커를 말한다. 혼성화 링커는 AptaSSN를 태그에 연결하기 위해 사용된다. 혼성화 링커는 (예를 들어, 친화 분석법에서) AptaSSN와 바이오틴 간의 연결(connection) 연결을 만들기 위하여 임의의 기재된 분석법에서 사용될 수 있다.
혼성화 링커는 비공유 결합을 형성하기 위하여 혼성화되는 두 개의 핵산을 포함한다. 일 구현에서, 혼성화 링크를 형성하는 핵산 중의 하나는 AptaSSN 그 자체의 부위일 수 있고, 다른 핵산은 그것의 부위에 상보적인 핵산일 수 있다. 방출은 (여전히 분석법과의 친화성을 유지하고 있는) 핵산 듀플렉스(duplex)를 파괴시키기 위한 임의의 적절한 메커니즘에 의해 달성될 수 있다. 혼성화 링커 분자는 임의의 적절한 구조를 가질 수 있고, 하나 또는 그 이상의 폴리뉴클레오티드, 폴리펩티드, 펩티드 핵산, 잠금 핵산(locked nucleic acid), 올리고당, 다당류, 항체, 애피바디, 항체 모조체 또는 단편, 수용체, 리간드, 지질, 이러한 구조들의 임의의 단편 또는 유도체, 앞서 기재한 것들의 임의의 조합 또는 방출가능한 구조를 형성하도록 설계되거나 구성될 수 있는 임의의 다른 구조 또는 화학 성분을 포함하는, 임의의 적절한 성분을 포함할 수 있다.
상기 태그는 적절한 수의 뉴클레오티드로 이루어지는 적어도 하나의 폴리뉴클레오티드로 이루어진다. 링커 분자의 폴리뉴클레오티드 성분은 적어도 약 10개의 뉴클레오티드를 포함한다. 링커 분자의 폴리뉴클레오티드 성분은 약 10개 내지 약 45개의 뉴클레오티드를 포함한다.
링커 분자의 폴리뉴클레오티드 성분은 적어도 약 30개의 뉴클레오티드를 포함한다. 링커 분자들은 동일한 수의 뉴클레오티드 또는 서로 다른 수의 뉴클레오티드를 가지는 폴리뉴클레오티드 성분을 포함할 수 있다.
"고체지지체(solid support)"는 분자이 공유결합 또는 비공유결합을 통하여 직접 또는 간접적으로 부착될 수 있는 표면을 가지는 임의의 기질(substrate)을 말한다. 본 발명의 고체지지체의 형태는 입자 또는 반응구의 표면 등이며, 본 발명에서 제1 고체지지체(FSS)의 형태는 고정된 제1 포획 성분을 반응용액에 현탁 상태로 노출시키는 입자 또는 제1 고체지지체(SSS)의 형태는 고정된 제2 포획 성분을 반응용액에 고정된 상태로 노출시키는 반응구의 표면이 있을 수 있다.
상기 고체지지체는 표면에 부착되는 포획 성분 또는 포획성분에 대하여 물리학적 지지체를 제공할 수 있는 임의의 기질 분자(substrate material)을 포함할 수 있다.
상기 분자는 일반적으로 표면에 대한 포획 성분 또는 포획성분의 부착에 관련된 조건 및 분석법의 수행 동안에 겪게 되는 임의의 후속 처리, 조작 또는 공정을 견딜 수 있다.
고체지지체용으로 사용된 분자는 단순한 것에서부터 복잡한 것에 이르기까지 임의의 다양한 구성을 취할 수 있다. 상기 고체지지체는 긴 조각(strip), 판(plate), 원반(disk), 봉(rod), 입자(particle), 비드(bead), 튜브(tube), 웰(well)(미세역가(microtiter)) 등을 포함하는 다수의 형태 중 하나를 가질 수 있다.
상기 분자는 자연적으로 생성된 분자, 합성물 또는 자연적으로 생성된 분자의 변형일 수 있다. 적절한 고체지지체 분자는 실리콘 와퍼 칩(silicon wafer chip), 그래파이트(graphite), 거울 표면(mirrored sruface), 라미네이트(laminates), 막(membranes), 세라믹(ceramics), 플라스틱(plastics)(예를 들어, 폴리(비닐클로라이드)(poly(vinyl chloride), 시클로-올레핀 공중합체(cyclo-olefin copolymer), 아가로스 겔(agarose gel) 또는 비드(beads), 폴리아크릴아마이드(polyacrylamide), 폴리아크릴레이트(polyacrylate), 폴리에틸렌(polyethylene), 폴리프로필렌(polypropylene), 폴리(4-메틸부텐)(poly(4-methylbutene), 폴리스티렌(polystyrene), 폴리메타크릴레이트(polymethacrylate), 폴리(에틸렌 테레프탈레이트)(poly(ethlene terephthalate), 폴리테트라플루오로에틸렌(polytetrafluoroethylene)(PTFE 또는 테플론(Teflon)®), 나일론(nylon), 폴리(비닐 부티레이트)(poly(vinyl butyrate)와 같은 폴리머를 포함), 게르마늄(germanium), 갈륨 비소(gallium arsenide), 금, 은, 랑그뮈어-블로제트 막(langmuir Blodgett films), 유동형 칩(flow through chip) 등을 포함할 수 있으며, 그것들 자체 또는 다른 분자들과 함께 사용된다.
실리카를 포함하며, 생체 유리(bioglass)로서 이용할 수 있는 유리를 더 포함하는, 유리와 같은 부가적인 단단한(rigid) 재료가 고려될 수 있다. 사용될 수 있는 다른 분자는 조절 공극 유리 비드(controlled pore glass beads), 가교결합된 비디드 세파로스® (crossslinked beaded Sepharose®) 또는 아가로스 수지(agarose resins), 또는 가교결합된 비스-아크릴아미드(bisacrylamide) 및 아자락톤(azalactone)의 공중합체와 같은 다공성 분자를 포함한다. 다른 비드는 나노입자(nanoparticles), 폴리머 비드(polymer beads), 고체 핵 비드(solid core beads), 상자성 비드(paramagnetic beads) 또는 마이크로비드(microbeads)를 포함한다. 예를 들어, 표면상에 통합된 임의의 아미노, 카복실, 티올 또는 하이드록실 작용기와 같은 하나 또는 그 이상의 작용기를 가질 수 있는 당업계에 잘 알려져 있는 임의의 다른 분자 또한 고려된다.
상기 고체지지체는 다공성(porous) 또는 비다공성(non-porous), 자성(magnetic), 상자성(paramagnetic) 또는 비자성(nonmagnetic), 다분산성(polydisperse) 또는 단분산성(monodisperse), 친수성(hydrophilic) 또는 소수성(hydrophobic)일 수 있다. 상기 고체지지체는 또한 (컬럼 매트릭스에서와 같은) 꽉 찬(closely-packed) 또는 꽉 차있지 않은(loosely-packed) 입자의 겔 또는 슬러리의 형태일 수 있다.
부착된 포획 성분과 고체지지체는 시료 혼합물로부터 태그된 M-AptaSSN 복합체 또는 M-AptaSSN 공유결합 복합체를 포획하는데 사용된다. 태그가 비이오틴 부분일 때, 상기 고체지지체는 스트렙타비딘으로 코팅된 비드 또는 다이나비즈 M-280 스트렙타비딘(Dynabeads M-280 streptavidin), 다이나비즈 마이원 스트렙타비딘(Dynabeads MyOne streptavidin), 다이나비즈 M-270 스트렙타비딘(Dynabeads M-270 streptavidin; Invitrogen), 스트렙타비딘 아가로오스 레진(Streptavidin Agarose Resin; Pierce), 스트렙타비딘 울트라링크 레진(Streptavidin Ultralink Resin), 마그나빈드 스트렙타비딘 비즈(MagnaBind Streptavidin Beads; Thermo Scientific), 바이오매그 스트렙타비딘(BioMag Streptavidin), 프로매그 스트렙타비딘(ProMag Streptavidin), 실리카 스트렙타비딘(Silica Streptavidin; Bangs Laboratories), 스트렙타비딘 세파로오스 하이퍼포먼스(Streptavidin Sepharose High Performance; GE Healthcare), 스트렙타비딘 폴리스티렌 마이크로스피어(Streptavidin Polystyrene Microspheres; Microspheres-Nanospheres), 스트렙타비딘 코팅된 폴리스티렌 입자(Streptavidin Coated Polystyrene Particles; Spherotech) 또는 포획 바이오틴-태그된 분자에 대하여 당업자에 의해 일반적으로 사용되는 임의의 다른 스트렙타비딘 코팅된 비드 또는 레진일 수 있다.
시료에 있는 분자집단과 AptaSSN 집단이 복합체를 형성할 경우, "경쟁 분자(competitor molecule)" 및 "경쟁자(competitor)"는 예를 들어, 비표적 분자가 AptaSSN에 비특이적으로 재결합을 형성하는 것을 방지하기 위하여 비표적 분자와 비특이적 복합체를 형성할 수 있는 임의의 분자를 말하는 것으로 상호 교환적으로 사용된다. "경쟁 분자" 또는 "경쟁자"는 하나 이상의 이러한 분자 세트를 말한다. 경쟁 분자는 올리고뉴클레오티드, 다중 음이온(예를 들어, 헤파린, 청어의 정자 DNA, 단일가닥의 연어 정자 DNA 및 폴리덱스트란(예를 들어, 덱스트란 설페이트)), 비염기성 포스포디에스테르 폴리머(abasic phosphodiester polymers), dNTPs 및 피로포스페이트(pyrophosphate)를 포함한다.
상기 제1 분리 및 제2 분리 전에 유기용매가 있는 세척용액을 사용 및/또는 엄격한 세척용액 방법으로 세척할 수 있다. 경쟁자를 사용하는 엄격한 세척용액의 경우에 있어서, 상기 경쟁자는 AptaSSN가 비표적 분자에 비특이적으로 재결합을 형성하는 것을 방지하기 위하여 자유 AptaSSN 또는 단백질과 비특이적 복합체를 형성할 수 있는 임의의 분자일 수 있다. 이러한 경쟁 분자는 다중 양이온 스페르민(spermine), 스페르미딘(spermidine), 폴리라이신(polylysine) 및 폴리아르기닌(polyarginine)) 및 아미노산(아르기닌 및 라이신))일 수 있다.
경쟁자가 엄격한 세척용액으로서 사용될 때, 시료에 존재하는 총 단백질 또는 총 AptaSSN의 예상되는 농도에 비례하여 꽤 높은 농도가 사용된다. 10mM의 덱스트란 설페이트가 엄격한 세척용액에서 경쟁자로서 사용된다.
상기 엄격한 세척용액은 M-AptaSSN 복합체의 해리 속도를 현저하게 증가시키지 않는 결합 버퍼 또는 다른 임의의 용액을 이용하여 시료를 희석시킴으로써 수행된다. 상기 희석은 약 2X, 약 3X, 약 4X, 약 5X 또는 임의의 적절한 차수의 희석일 수 있다.
엄격한 세척용액으로서 희석이 사용될 경우, 희석의 양은 초기 시료 용량 및 복합체의 현저한 손실을 초래하지 않는 최종(희석된) 용량으로부터 M-AptaSSN 복합체를 회수하는 것의 바람직함의 관점에서 실행할 만큼 높은 것이 선택되어진다.
상기 엄격한 세척용액은 시료 희석의 효과 및 경쟁자를 도입하는 효과가 동시에 이루어지는 그런 방식으로 수행된다. 시료는 많은 경쟁자들과 함께 희석될 수 있다. 이들 두 가지의 엄격한 세척용액 전략을 조합하는 것은 하나의 전략을 사용하여 달성될 수 있는 것보다 더욱 효과적인 엄격한 세척용액을 제공할 수 있다. 상기 희석은 약 2X, 약 3X, 약 4X, 약 5X 또는 임의의 적절한 차수의 희석일 수 있고, 상기 경쟁자는 10 mM 덱스트란 설페이트이다.
상기 엄격한 세척용액은 M-AptaSSN 복합체를 포함하는 혼합물을 희석하는 것, 상기 M-AptaSSN 복합체를 포함하는 혼합물에 경쟁자를 첨가하는 것 및 비특이적 복합체의 측정 레벨에 대한 M-AptaSSN 복합체의 측정 레벨의 비율이 증가하는 그러한 시간 동안 M-AptaSSN 복합체를 포함하는 혼합물을 처리하는 것을 포함한다.
상기 고정상태 SSS-M-AptaSSN-FSS 복합체로부터 AptaSSN-FSS는 AptaSSN/분자의 상호작용을 파괴하는 임의의 방법에 의해 방출될 수 있다. 이것은 비공유적으로 결합된 M-AptaSSN 복합체를 해리하는 고농도의 염 버퍼로 지지체에 결합된 M-AptaSSN 복합체의 세척을 통하여 달성될 수 있다. 용출된 자유 AptaSSN는 수집되고 검출된다. 높거나 낮은 pH는 M-AptaSSN 복합체를 파괴하는데 사용될 수 있고 높은 온도도 M-AptaSSN 복합체를 해리하는데 사용될 수 있다. 임의의 상기 방법들의 조합이 사용될 수 있다.
Ⅴ. AptaSSN 유체 자성 비드 장치
본 발명 AptaSSN 선정, AptaSSN 다중 분석, 특정 분자의 압타머 개발, 표적분자 분석을 하기 위하여 임의의 본 발명에 개시된 방법을 알맞게 수행하는데 유용한 장치에 관한 것이다.
도 16은 본 발명의 AptaSSN 유체 자성 비드 장치(1000)에 대한 모식도이다.
구체적으로 살펴보면, 본 장치는 다양한 유형의 분자로 구성된 시료를 구성하는 분자집단에 유의한 결합차이가 있는 AptaSSN 선정, AptaSSN 다중 분석, 특정 분자의 압타머 개발 그리고 표적분자의 분석에 대한 AptaSSN 유체 자성 비드 장치(1000)를 새로이 제공할 수도 있다.
본 발명의 AptaSSN 유체 자성 비드 장치(1000)는 제1 주입구(1110) 및 제2 주입구(1120)로 이루어진 군에서 선택되어진 어느 하나 이상으로 이루어진 주입부(1100), 유동채널(1200) 및 밸브부(1300)로 구성될 수 있다.
상기 유동채널(1200)에는 제1 반응구(1211) 및 제2 반응구(1212)로 이루어진 군에서 선택되어진 어느 하나 이상으로 이루어진 반응부(1210), 배출부(1220) 및 포집부(1230)으로 이루어진 군에서 선택되어진 어느 하나 이상이 순차적으로 위치하며, 자기력 인가부(1213)는 상기 제2 반응구(1212)에 구비될 수 있다. 상기 유동채널(1200)은 자기력 인가부(1213)에 탈부착이 가능하도록 설치할 수도 있다.
상기 주입부(1100)에는 반응에 필요한 물질이면 특별한 제한 없이 주입될 수 있지만, 펌프로 구성된 제1 주입구(1110)와 제2 주입구(1120)으로 이루어진 군에서 선택되어진 어느 하나 이상으로 구성될 수 있다. 상기 제1 주입구는 여러 시약병으로 구성된 제1 시약병(1130)과 제2 주입구는 여러 시약병으로 구성된 제2 시약병(1140)과 연결될 수 있다.
바람직하게는 제1 주입구(1110)에 분자(M)집단으로 구성된 시료 용액, 제1 태그가 있는 단일가닥핵산(SSN) 라이브러리 용액, 제1 포획성분이 있는 제1 고체지지체(FSS) 용액, 제2 태그 용액, 반응용액 및 용출용액로 이루어지는 군에서 선택되어진 어느 하나 이상의 물질이 주입될 수 있다.
제2 주입구(1120)에는 공기, 증류수, 세척용액 및 용출용액으로 이루어지는 군에서 선택되어진 어느 하나 이상의 물질이 주입될 수 있으며, 상기 분자(M)는 동일한 물질이거나 상이한 물질로 구성될 수 있다.
상기 주입부(1100)를 통해 주입된 시료는 반응을 끝낸 시료가 주입될 수도 있지만, 바람직하게는 상기 반응부(1200)에서 반응할 수 있다. 상기 반응부(1200)는 제1 반응구(1210)와 제2 반응구(1220)로 이루어진 군에서 선택되어진 어느 하나 이상으로 구성될 수 있다.
상기 유동채널(1200)을 구성하는 상기 반응부(1210)는 상기 제1 주입구(1110)에서 선정된 용액들이 제1 반응구(1211)에 주입되고, 시료를 구성하는 분자(M), 제1 태그가 있는 단일가닥핵산 및 제1 포획성분과 자성이 있는 제1 고체지지체(FSS)에 의한 M-SSN-FSS 복합체를 형성되고 세척하여, 다시 제2 반응구로 이송하고 상기 복합체의 분자(M)에 제2 태그를 부가할 수 있다.
상기 제1 반응구(1211)에서 형성된 혼합용액은 바람직하게는 상기 시료를 구성하는 분자(M), 제1태그가 있는 결합 단일가닥핵산(SSN) 및 상기 제1 포획 성분이 있는 고체지지체(FSS)로부터 형성하는 M-SSN-FSS복합체를 포함할 수 있다. 상기 FSS는 바람직하게 자성입자를 포함할 수 있다. 바람직하게 제1 반응구(1211)의 부피는 약 50ml일 수도 있다.
상기 제2 주입구(1120)로부터 상기 제1 반응구(1211)에 세척용액이 주입되고 일정한 흐름으로 공기압을 주입하면서 세척할 수도 있다.
상기 유동채널(1200)의 반응부(1210)의 제2 반응구(1212)에는 바람직하게는 자기력 인가부(1213)가 위치할 수 있다. 바람직하게 제2 반응구(1212)의 부피는 약 1ml일 수 있다.
상기 밸브는 유동채널(1200)에서 다양한 용액의 이동과 저장을 조절하며, 상기 제1 주입구(1110)와 제1 반응구(1211) 사이에 위치한 제1 밸브(1310), 제2 주입구(1120)와 제1 반응구(1211)사이에 위치한 제2 밸브(1320), 제1 반응구(1211)와 제2 반응구(1212) 사이l에 위치한 제2 밸브(1330), 제2 반응구(1212)와 배출부(1220) 사이에 위치란 제4 밸브(1340) 및 제2 반응구(1212)와 포집부(1230) 사이에 위치한 제5 밸브(1350)으로 구성된 군에서 선택되어진 어느 하나 이상으로 수 있다. 바람직하게 밸브는 압력밸브를 사용할 수 있다.
분자집단을 포함하는 시료 용액, 제1 태그가 있는 AptaSSN 용액, 제1 포획성분과 자성물질이 있는 용액, 반응용액, 세척용액, 증류수, 제2 태그가 있는 용액 및 용출용액을 포함하는 군에서 선택되어진 어느 하나 이상의 용액은 주입부(1100)에 의하여 유동채널(1200)에 위치한 밸브의 조절로 적절한 용도에 부합하는 반응부(1210)에 배분되고 다시 밸브의 조절로 배출부(1220) 및 포집부(1230)으로 이동 및 저장할 수 있다.
다음으로 자기장을 인가하여 자성입자에 인력을 가한다. 이는 자성입자에 인력을 가하여 자성입자들이 제거되지 않도록 하기 위함이다. 상기 혼합용액 성분에서 자성입자는 자성이 있는 FSS 및 M-SSN-FSS 복합체이다. 상기 제2 반응구 내에 존재하는 자성입자에 인력을 가하기 위하여 예를 들면 자기장을 발생하는 영구자석, 전자석 또는 자기장을 발생시킬 수 있는 자기장 발생장치 등이 사용될 수 있다.
자기장을 인가하기 위하여 영구자석이 사용되는 경우에는 상기 제2 반응구(1212)와 근접된 위치에 영구자석(1213)을 배치함으로써 상기 제2 반응구(1212)에 자기장이 인가되도록 할 수 있고, 상기 반응구(1212)와 영구자석(1213) 사이의 거리를 멀리함으로써 상기 반응구(1212)에 자기장이 인가되지 않도록 할 수 있다.
자기장을 인가하기 위하여 전자석(1213)이 사용되는 경우에는 전자석(1213)에 전류를 공급하거나 전류가 공급되지 않도록 함으로써 상기 제2 반응구(1212)에 자기장을 인가하도록 하거나 자기장이 인가되지 않도록 할 수 있다.
자기장을 인가하기 위하여 자기장 발생장치(1213)가 사용되는 경우에는 자기장 발생장치(1213)의 온/오프를 통하여 상기 제2 반응구(1212)에 자기장을 인가하도록 하거나 자기장이 인가되지 않도록 할 수 있다.
상기 반응구(1212)내로 자기장이 인가되는 경우 자기장의 영향에 의하여 자성입자에 인력이 작용할 수 있고, 상기 반응구 내의 상기 FSS 그리고 상기 M-SSN-FSS 복합체 중 하나 이상에는 인력이 작용할 수 있다.
이에 반하여 시료를 구성하는 미결합 분자 및 제1 태그가 있는 SSN 중 하나 이상에는 인력이 작용하지 않게 된다.
자기장에 의한 인력이 작용하는 상태에서 시료를 구성하는 미결합 분자 및 제1 태그가 있는 SSN 중 하나 이상을 제거한다.
상기 제2 반응구(1212)에 용액을 공급하여 자기장에 의하여 인력이 중단된 상태에서 시료를 구성하는 미결합 분자 및 자유상태인 제1 태그가 있는 SSN 가 상기 제2 반응구 내부로 공급되는 용액과 함께 상기 제2 반응구(1212)에서 배출부(1220)로 배출될 수 있다. 이는 자기장에 의하여 인력이 중단된 상태에서 주입부(1100)의 펌프에 의한 공기압에 의하여 시료를 구성하는 미결합 분자 및 제1 태그가 있는 SSN는 상기 배출부(1220)로 배출되는 용액과 함께 배출되기 때문이다.
제거 과정이 완료되면, 상기 제2 반응구(1212) 내에는 상기는 FSS 및 M-SSN-FSS 복합체가 존재할 수 있다. 상기 자기력 인가부(1213)는 바람직하게는 인가된 자기력에 의하여 상기 자성이 있는 FSS와 M-SSN-FSS 복합체를 포집할 수 있다.
다음으로, 제2 반응구(1212)에 있는 상기 FSS 및 M-SSN-FSS 복합체로 이루어진 혼합용액을 대상으로 제2 태그를 부가할 수 있다. 제2 태그에는 관능기가 있어 M-SSN-FSS 복합체의 분자에 부가될 수 있다. 부가 반응이 종결된 후, 자기장 의하여 인력을 인가하여 세척용액을 부가하여 세척한 후, 펌프(1100)에 의한 공기압으로 과잉 반응물을 포함하는 세척용액을 제거할 수 있다.
다음으로, 자기장에 의하여 인력의 중단 상태에서 상기 FSS 그리고 제2 태그가 부가된 M-SSN-FSS 복합체가 있는 용액은 주입부(1100)의 펌프에 의한 공기압에 의하여 상기 제2 포획성분이 있는 포집부(1230)로 이송되고, 상기 포집부의 표면에 있는 제2 포획성분에 있는 제2 고체지지체(SSS)에 의하여 상기 제2 태그가 부가된 M-SSN-FSS 복합체는 SSS-M-SSN-FSS 복합체를 형성하여 포집할 수 있다.
제1 주입구(1110)로부터 제2 태그가 있는 용액이 주입되고, 제2 반응구(1212)에 있는 M-SSN-FSS 복합체의 분자에 제2 태그를 부가할 수 있다. 바람직하게 상기 제2 태그는 NHS 기(succinimidyl group)가 있는 바이오틴(NHS-biotin)일 수도 있다. 추가적으로 NHS-dye 일종인 Alexa Fluor 568 NHS Ester를 함께 반응할 수도 있다.
상기 제2 반응구(1212)에 있는 제2 태그가 부착된 M-SSN-FSS 복합체를 자기장이 인가된 상태에서 세척할 수 있으며, 자기장 인가가 중단된 상태에 FSS 및 제2 태그가 부착된 M-SSN-FSS 복합체 용액을 포집부(1230)로 이송할 수 있다.
상기 유동채널(1200)은 상기 자기력 인가부에 의해 수집되지 않은 나머지 미반응시료를 배출할 수 있는 미반응시료 배출부(1220)는 상기 자기력 인가부(1213)와 상기 포집부(1230) 사이에 위치할 수 있다.
상기 미반응 시료 배출을 위한 유체흐름을 제어하기 위해서는 밸브부(1300)는 제1 밸브(1310), 제2 밸브(1320), 제3 밸브(1330), 제4 밸브(1340) 및 제5 밸브(1350)로 구성할 수 있으며, 공기압 밸브 등 마이크로 밸브를 사용하는 것이 바람직하다.
상기 배출부(1220)를 통해 미반응 시료가 배출되고 나면 상기 자기력 인가부(1213)에 의하여 수집되었던 상기 FSS와 상기 M-SSN-FSS 복합체가 자기력의 인가 중단에 의하여 다시 상기 유동채널(1200)을 통해 제2 반응구(1212)에 포집된 상태를 유지할 수 있다.
한편 상기 포집부(1230)는 특별한 제한이 있는 것은 아니지만 바람직하게는 복수 개의 분리홀 집단이 배열되어 이루어지는 플레이트(plate), 튜브 및 유리 슬라이드로 이루어진 군에서 선택되어진 어느 하나 이상일 수 있으며, 제2 포획성분을 포함하는 제2 고체 지지체(SSS)가 있을 수 있다.
바람직하게, 분리홀 집단이 배열되는 경우, 상기 포집부(1230)에서 다양한 시료에서 기원하는 결합 단일가닥핵산 풀의 동시 분리가 가능하게 된다.
상기 포집부(1230)는 제2 포획성분이 있는 제2 고체지지대(SSS)이 있어, FSS 및 제2 태그가 부착된 M-SSN-FSS 복합체 용액에서 제2 태그가 부착된 M-SSN-FSS 복합체만을 포집하여 SSS-M-SSN-FSS 복합체를 형성할 수 있다. 상기 혼합용액에 세척용액을 부가하여 미반응물질을 제거할 수 있어 순도 높은 상기 SSS-M-SSN-FSS 복합체만을 분리 및 검출할 수도 있다. 바람직하게 제2 고체 지지체(SSS)에 있는 제2 포획성분은 아비딘(avidin)일 수 있다.
상기 포집부(1230)는 바람직하게는 제2 포획성분을 포함하는 제2 고체 지지체(SSS)를 포함하는 오목한 홈 또는 유리 슬라이드로 이루어질 수 있으며, 상기 오목한 홈은 상기 제2 고체지지체(SSS)의 제2 포획성분으로 상기 제2 태그가 부가된 M-SSN-FSS 복합체를 포집하여 SSS-M-SSN-FSS 복합체를 형성할 수 있다.
상기 포집부(1230)는 바람직하게 시료를 구성하는 분자(M), 결합 단일가닥핵산(SSN), 제1 고체지지체(FSS) 및 제2 고체지지체(SSS)간에 형성된 복합체 즉, SSS-M-SSN-FSS 복합체에 용출용액에 의하여 단일가닥핵산(SSN)을 포함하는 복합체를 용출할 수 있다,
상기 유동채널(1200)의 재료는 유동용액의 흐름을 방해하지 않는 고분자 물질이면 특별한 제한 없이 사용할 수 있지만, 바람직하게 상기 유동채널은 미세유체 칩, 파우치(pouch) 타입 및 튜브로 구성된 군에서 선택되는 어느 하나일 수도 있다. 바람직하게, 상기 유동채널(1200)은 자기력 인가부(1213)에 탈부착이 가능하도록 설치할 수 있다.
본 발명의 유동채널 파우치(1230)는 상기 반응부를 구성하는 폐쇄적 단일 유동채널로 가요성 플라스틱 필름 또는 폴리 에스테르, 폴리에틸렌 테레 프탈레이트 (PET), 폴리 카보네이트, 폴리 프로필렌, 폴리 메틸 메타 크릴 레이트, 혼합물, 배합물과같은 다른 가요성 물질의 2 개의 층으로 형성될 수 있다. 이들 층은 압출, 플라즈마 증착 및 적층을 포함하는 당 업계에 공지된 임의의 프로세스에 의해 제조될 수 있다. 예를 들어, 각 층은 함께 적층된 단일 유형 또는 둘 이상의 유형의 물질의 하나 또는 그 이상의 층으로 구성될 수 있다. 알루미늄 박판을 가진 금속박 또는 플라스틱도 사용할 수 있다.
구체적으로 살펴보면, 코폴리머 접착 층(copolymer adhesive layer)을 포함하는 폴리에스터/폴리프로필렌(polyester/polypropylene) 필름 두 장에 열 용접된 사출 금형된 폴리프로필렌(injection molded polypropylene)로 구성될 수 있다. 필름 시트는 가열된 플레이트를 사용하여 함께 접착되어 제1 반응구(1211) 및 제2 반응구(1212)를 위한 공간을 포함하는 영역을 포함하는 유동채널(1200)의 패턴을 형성한다.
상기 주입구(1100)에 여러 가지의 성분들이 혼합된 용액을 주입된 후, 정밀펌프에 의하여 시료가 제1 반응구(1211) 및 제2 반응구(1212)로 이루어진 반응부(1210), 배출부(1220) 및 포집부(1230)로 이루어진 유체 채널(1200)로 유동되기 시작한다. 이때, 유동채널(1200)을 통한 유동이 압력점(pressure node)들이 모인 선을 수직 또는 일정한 각도로 통과하도록 하되 이러한 압력점 선들이 유동 방향에 다수 배치되도록 채널을 구성할 수 있다.
유동채널(1200)은 적어도 하나 이상의 절곡부를 가지도록 형성될 수 있다. 즉, 유동채널(1200)은 유동 방향이 수직하게 절곡되도록 다수의 절곡부를 가질 수 있다.
또한, 유동채널(1200)은 지그재그 형상 또는 구불구불한 형상 등으로 형성되어 유동 방향에 대하여 다수의 압력점 선들이 배치될 수 있다.
혼합용액을 구성하는 성분들이 유체 유동과 함께 이동하다가 압력점 선을 통과할 때 혼합용액 성분들은 압력점에 머물거나 정지되도록 하는 주입부(1100)에서 발생하는 펌프에서 가압되는 공기압에 의한 힘을 받게 된다. 이러한 공기압은 혼합용액 성분의 크기에 비례하기 때문에 자성이 있는 FSS 및 M-SSN-FSS 복합체에 작용되는 힘은 매우 작아 혼합용액 성분을 정지시키는 데에는 한계가 있지만 적어도 미세한 규모의 유동 저항을 극복할 수 있다.
따라서, 혼합용액 성분이 다수의 압력점 선을 통과하도록 배치한 유동채널(1200)을 통한 유동의 경우, 하나의 M-SSN-FSS 및 FSS 입자가 경험하는 축적된 총 유동저항은 유동채널의 전 구간을 통과하는 동안 무시할 수 없는 크기이거나 매우 괄목할 만한 크기가 됨으로 주입부의 공기압은 필수적일 수 있다.
이와 같이 샘플이 주입구에서 투입된 후 유체 출구까지 도달하는 시간을 리텐션 시간(retension time)이라 하며, 입자 크기별 리텐션 타임의 차이를 이용하여 샘플을 분리할 수 있게 된다. 이와 같이 분리된 입자를 유체 출구의 전단에 설치된 검출부에서 광원 및 광스펙트럼 분석기(photospectrometer)를 이용하여 입자별 광특성 곡선을 얻을 수 있으며, 이를 통해 입자의 크기 또는 형상을 구분할 수 있다.
유동 채널(1200) 내를 흐르는 유체에 포함된 혼합용액 성분은 크기, 변형능, 밀도 등에 따라 압력점에 집중되어 모이는 정도가 다른데, 이를 이용하여 혼합용액 성분을 속성별로 분리할 수 있다. 보다 상세하게는, 크기가 상대적으로 큰 혼합용액 성분이 크기가 작은 혼합용액 성분에 비해 압력점에 더 잘 모이게 되므로, 유체의 유동을 따라 흐르다가 만나게 되는 압력점 지점에서 크기가 상대적으로 큰 성분은 작은 성분에 비해 상대적으로 긴 시간을 지체하게 된다.
혼합용액 성분의 속성에 따라 혼합용액 성분이 유동 채널(1200)을 빠져나가는 시간에 있어서 차이가 유발되고, 혼합용액 성분이 유체 출구로 빠져나오는 시간의 차이에 따라 혼합용액 성분을 분리할 수도 있다. 혼합용액 성분의 속성별 분리 이후 유체 출구 쪽으로 흘러나오는 혼합용액 성분을 검출하기 위한 검출부로서 광원 및 광스펙트럼 분석기(photospectrometer) 등을 이용하여 시간에 따라 신호를 검출할 수 있다.
그러므로 본 발명에 따른 AptaSSN 유체 자성 비드 장치(1000)를 이용하여 순도 높은 상기 자성 SSS-M-SSN-FSS 복합체만을 분리 및 검출해 내고 이를 통해 상기 시료를 구성하는 분자를 분석하게 되면 보다 정확하고 민감하며 신뢰성 높은 분석을 달성할 수 있다.
상기 분자(M)집단으로 구성된 시료 용액, 상기 SSN 라이브러리 용액 및 상기 FSS 용액으로 이루어진 혼합용액에서부터 상기 SSN을 포함하는 물질 집단을 용출하는 장치는 도 16에 제시된 AptaSSN 유체 자성 비드 장치(1000)일 수 있다.
상기 SSN을 포함하는 물질 집단을 용출하는 목적으로 사용하는 상기 AptaSSN 유체 자성 비드 장치(1000)의 운영은 (a) 상기 제1 주입구(1110)로부터 상기 분자(M)집단으로 구성된 시료 용액, 상기 SSN 라이브러리 용액 및 상기 FSS 용액이 주입되고, 상기 제1 반응구(1211)에서 상기 시료를 구성하는 분자(M)집단, 상기 SSN의 제1 태그 및 상기 FSS의 제1 포획성분이 반응하여 M-SSN-FSS 복합체가 형성되는 제1 혼합용액을 제조하는 단계; (b) 상기 제2 주입구(1120)로부터 세척용액이 주입되고, 상기 제1 반응구(1211)에서 제1 혼합용액에 있는 형성된 M-SSN-FSS 복합체를 세척하여 상기 SSN과 비특이적 결합을 하거나 결합되지 않은 하나 또는 그 이상의 혼합물의 성분을 상기 배출부(1220)로 제거하는 제1 분리 단계; (c) 상기 제1 주입구(1110)로부터 상기 제2 태그 용액이 주입되고, 상기 제2 반응구(1212)에서 상기 제1 분리된 M-SSN-FSS 복합체의 분자(M)로부터 제2 태그-M-SSN-FSS 복합체를 형성하는 제2 태그의 부착 단계; (d) 상기 제2 반응구(1212)로부터 상기 제2 태그-M-SSN-FSS 복합체 용액이 주입되고, 상기 포집부(1230)에 있는 SSS의 제2 포획성분 및 상기 제2 태그-M-SSN-FSS 복합체의 제2 태그가 반응하여 SSS-M-SSN-FSS 복합체가 형성되는 제2 혼합용액을 제조하는 단계; (e) 상기 제2 주입구(1120)로부터 상기 세척용액이 주입되고, 상기 포집부(1230)에 있는 제2 혼합용액에서 형성된 SSS-M-SSN-FSS 복합체를 세척하여, 상기 제2 포획성분과 결합하지 않은 하나 또는 그 이상의 혼합물의 성분을 제거하는 제2 분리 단계; (f) 상기 제1 주입구로부터 용출용액이 주입되고, 상기 포집부에 있는 제2 분리된 SSS-M-SSN-FSS 복합체로부터 상기 SSN를 포함하는 물질 집단을 용출하는 단계; (g) 상기 용출된 SSN을 포함하는 물질 집단으로부터 증폭된 SSN 집단을 제작하거나, 또는 추가적으로 (a) 단계부터 (f) 단계를 1 라운드 이상을 반복하여 실시하는 단계; 및 (h) 상기 (f) 단계에서 포집부에서 용출된 SSN을 포함하는 물질 집단을 수집하는 단계;를 포함할 수 있다.
상기 분자(M)집단으로 구성된 시료 용액, 상기 제1 태그가 있는 선정된 AptaSSN 집단 용액 및 상기 FSS 용액으로 이루어진 혼합용액에서부터 분자집단을 용출하는 장치는 도 16에 제시된 AptaSSN 유체 자성 비드 장치(1000)일 수 있다.
상기 표적분자 용출 목적으로 사용하는 AptaSSN 유체 자성 비드 장치(1000)의 운영은 (a) 상기 제1 주입구(1110)로부터 상기 분자(M)집단으로 구성된 시료 용액, 상기 제1 태그가 있는 선정된 AptaSSN 집단 용액 및 상기 FSS 용액이 주입되고, 상기 제1 반응구(1211)에서 상기 시료를 구성하는 분자(M)집단, 상기 AptaSSN의 제1 태그 및 상기 FSS의 제1 포획성분이 반응하여 M-AptaSSN-FSS 복합체가 형성되는 제3 혼합용액을 제조하는 단계; (b) 상기 제2 주입구(1120)로부터 세척용액이 주입되고, 상기 제1 반응구(1211)에서 제3 혼합용액에 있는 형성된 M-AptaSSN-FSS 복합체를 세척하여 상기 AptaSSN과 비특이적 결합을 하거나 결합되지 않은 하나 또는 그 이상의 혼합물의 성분을 상기 배출부(1220)로 제거하는 분리 단계; 및 (c) 제1 반응구(1211)에서 상기 포집부(1230)로 이송된 M-AptaSSN-FSS 복합체에 용출용액이 제1 주입구(1110)로부터 주입되고 상기 분자(M)집단을 용출하는 단계; 를 포함할 수도 있다.
상기 분자(M)집단으로 구성된 시료 용액, 상기 AptaSSN 집단 용액 및 상기 FSS 용액으로 이루어진 혼합용액에서부터 상기 시료를 구성하는 분자집단에 결합하는 AptaSSN 집단을 용출하는 장치는 도 16에 제시된 AptaSSN 유체 자성 비드 장치(1000)일 수 있다.
상기 AptaSSN 용출 목적으로 AptaSSN 유체 자성 비드 장치(1000)의 운영은 (a) 상기 제1 주입구(1110)로부터 상기 분자(M)집단으로 구성된 시료 용액, 상기 AptaSSN 집단 용액 및 상기 FSS 용액이 주입되고, 상기 제1 반응구(1211)에서 상기 시료를 구성하는 분자(M)집단, 상기 AptaSSN의 제1 태그 및 상기 FSS의 제1 포획성분이 반응하여 M-AptaSSN-FSS 복합체가 형성되는 제4 혼합용액을 제조하는 단계; (b) 상기 제2 주입구(1120)로부터 세척용액이 주입되고, 상기 제1 반응구(1211)에서 제4 혼합용액에 있는 형성된 M-AptaSSN-FSS 복합체를 세척하여 상기 AptaSSN과 비특이적 결합을 하거나 결합되지 않은 하나 또는 그 이상의 혼합물의 성분을 상기 배출부(1220)로 제거하는 제3 분리 단계; (c) 상기 제1 주입구(1110)로부터 상기 제2 태그 용액이 주입되고, 상기 제2 반응구(1212)에 있는 M-AptaSSN-FSS 복합체의 분자(M)에 제2 태그를 부가하는 단계; (d) 상기 제2 반응구(1212)로부터 주입된 상기 제2 태그가 부가된 M-AptaSSN-FSS 복합체와 상기 포집부(1230)에 있는 SSS의 제2 포획성분이 접촉하여 SSS-M-AptaSSN-FSS 복합체가 형성되는 제5 혼합용액을 제조하는 단계; (e) 상기 제2 주입구(1120)로부터 상기 세척용액이 주입되고, 상기 포집부(1230)에 있는 제5 혼합용액에서 형성된 SSS-M-AptaSSN-FSS 복합체를 세척하여, 상기 제2 포획성분과 결합하지 않은 하나 또는 그 이상의 혼합물의 성분을 제거하는 제4 분리 단계; 및 (f) 상기 제1 주입구(1110)로부터 용출용액이 주입되고, 상기 포집부(1230)에 있는 제2 분리된 SSS-M-AptaSSN-FSS 복합체로부터 상기 AptaSSN을 포함하는 물질 집단을 용출하는 단계; 를 포함할 수 있다.
본 발명의 표적분자 검사 유체 자성 비드 장치는 도 16에 제시된 AptaSSN 용출 유체 자성 비드 장치(1000)에 분석장치를 추가하여 제조할 수 있다.
상기 분석장치는 현미경, 핵산 분석장치, 분광 분석장치, 형광물질 분석장치 및 전기신호 분석장치로 이루어진 군에서 선택되어진 어느 하나 이상일 수 있다.
본 발명의 하나의 목적은 단백질 시그널을 AptaSSN 시그널로 전환하는 것이다. 그 결과, 수집되고/검출된 AptaSSN의 양은 시료에서의 분자의 양에 대하여 결합된 분자의 양을 나타내며, 그 양에 직접적으로 비례할 수 있다.
다수의 검출 도식이 제2 분리 후에 고체지지체로부터 M-AptaSSN 복합체를 용출하지 않고 사용될 수 있다.
많은 검출 방법들이 검출에 앞서 AptaSSN 내로 혼입될 외재적 표지(explicit label)를 필요로 한다. 형광(fluorescent) 또는 화학발광(chemiluminescent) 염료와 같은 표지들은 핵산 합성을 위한 표준 기술을 사용하여 합성하는 동안 또는 합성한 후에 AptaSSN 내로 혼입될 수 있다. 방사성 표지(radioactive labels)는 적절한 시약을 사용하는 표준 효소 반응을 이용하여 합성하는 동안 또는 합성한 후에 혼입될 수 있다. 표지는 또한 캐치-2 분리 및 당업자에게 잘 알려진 다양한 효소적 기술을 사용하는 것에 의한 용출 후에 일어난다.
상기에 언급된 표지와 함께 프라이머를 사용하는 PCR은 표지를 용출된 AptaSSN의 증폭 산물 내로 혼입시킬 것이다. 정량을 위한 겔 기술을 사용할 때, 서로 다른 크기의 질량 표지(mass labels)도 PCR을 사용하여 혼입될 수 있다.
이 질량 표지들은 또한 부가적인 다중화 능력을 위하여 서로 다른 형광 또는 화학발광 염료를 포함한다. 표지들은 합성하는 동안 또는 합성한 후에 AptaSSN 내로 혼입된 특정 태그를 사용함으로써 AptaSSN에 간접적으로 첨가될 수 있고, 그 후 태그와 결합하고 표지를 운반하는 포획성분를 첨가한다.
상기 표지들은 비색형 판독을 위한 표준 분석법에서 사용되는 효소뿐만 아니라 상기에 기재된 것들을 포함한다. 이들 효소는 효소 기질과 함께 작용하며, 예를 들어 호스래디쉬 퍼록시다아제(horseradish peroxidase, HRP) 및 알칼리 포스파타아제(alkaline phosphatase, AP)와 같은 효소를 포함한다. 표지는 또한 전기화학적 검출을 위한 전기화학적 작용기인 분자 또는 화합물을 포함할 수 있다.
상기 AptaSSN는 시료와 접촉하기에 앞서 32P와 같은 방사성 동위원소로 상기에 기재된 것과 같이 표지될 수 있다. 4개의 기본 분석법 중 임의의 하나와 상기에 기재된 것과 같은 그것들의 변형을 사용하는 AptaSSN 검출은 분석법의 마지막에서 고체지지체 상의 방사능을 정량함으로써 간단히 달성될 수 있다. 방사능 수치는 원 시료에서의 M의 양에 직접적으로 비례할 것이다.
시료에 접촉하기 전, 형광 염료로 AptaSSN를 표지하는 것은 고체지지체 상에서 직접적으로 간단히 형광 판독을 할 수 있게 한다. 화학발광 표지 또는 양자점이 AptaSSN 용출을 필요로 하지 않는 고체지지체로부터의 직접적인 판독을 위해 유사하게 사용될 수 있다.
고체지지체로부터 AptaSSN를 용출시키거나 M-AptaSSN 공유결합 복합체를 방출시킴으로써, 부가적인 검출 도식이 상기에 기재된 것들에 더하여 사용될 수 있다. 방출된 AptaSSN는은 PAGE 겔 상에 넣어질 수 있고, SYBR 골드와 같은 핵산 염색으로 검출되고 선택적으로 정량될 수 있다. 대안적으로, 방출된 AptaSSN는 상기에 기재된 것과 같이 AptaSSN 내에 혼입된 형광 표지를 사용하는 모세관 겔 전기영동(capillary gel electrophoresis; CGE)을 사용하여 검출되고 정량될 수 있다. 다른 검출 도식은 SYBR 그린을 사용하여 용출된 AptaSSN를 검출하고 정량하기 위하여 정량적 PCR을 사용한다. 대안적으로, 인베이더® DNA 분석법(Invader® DNA assay)이 용출된 AptaSSN를 검출하고 정량하기 위하여 사용될 수 있다. 다른 대안적인 검출 도식은 차세대 시퀀싱을 사용한다.
M-AptaSSN 복합체의 양 또는 농도는 증폭 과정 중에 "분자 비콘(molecular beacon)"을 사용하여 검출된다. 분자 비콘은 헤어핀 루프 안으로 접힌 특정 핵산 포획성분이며, 헤어핀이 형성될 때 형광단(fluorophore)에 의해 시그널이 거의 생성되지 않거나 생성되지 않도록, 헤어핀 구조의 하나의 말단에는 플루오르를 함유하고 다른 하나의 말단에는 퀀쳐(quencher)를 함유한다. 상기 루프 서열은 표적 폴리뉴클레오티드 서열에 특이적이며, AptaSSN 서열과 혼성화하자마자 헤어핀이 펼쳐지기 때문에 형광 시그널을 생성한다.
2개 또는 3개, 또는 5개 또는 10개 이상의 각각의 AptaSSN를 검출하고 정량하기 위하여, 여전히 고체지지체에 결합되어 있는 적은 수의 AptaSSN의 다중 검출을 위하여, 서로 다른 여기(excitation)/방출(emission) 스펙트럼을 가지는 형광 염료가 사용될 수 있다. 유사하게는, 서로 다른 크기의 양자점이 다중 판독을 위해 사용될 수 있다.
상기 양자점은 고체지지체로부터 자유 AptaSSN를 분리시킨 후 도입될 수 있다. 양자점에 부착된 AptaSSN 특이적 혼성화 서열을 사용함으로써, 2, 3, 5 및 10개 이상의 AptaSSN들에 대한 다중화된 판독을 수행할 수 있다. 32P, 125I, 3H, 13C 및 35S와 같은 개별적으로 검출될 수 있는 서로 다른 방사성 동위원소로 서로 다른 AptaSSN를 표지하는 것 또한 제한된 다중 판독을 위해 사용될 수 있다.
제2 고체지지체(SSS)로부터 방출된 AptaSSN의 다중 검출을 위하여, 상기에 기재된 것과 같이 각각 AptaSSN 내로 혼입된 단일 형광 염료가 AptaSSN 레벨의 정량에 따라 AptaSSN의 서열을 확인할 수 있게 하는 정량 방법으로 사용될 수 있다. 방법은 차세대 시퀀싱, DNA 칩 혼성화, 마이크로-비드 혼성화 및 CGE 분석을 포함하지만 이에 한정되지 않는다.
AptaSSN 용액은 정량 전에 증폭되고 선택적으로 태그될 수 있다. 표준 PCR 증폭은 제2 고체지지체(SSS)로부터 용출된 AptaSSN 용액과 함께 사용될 수 있다. 이러한 증폭은 DNA 어레이 혼성화, 마이크로-비드 혼성화 및 CGE 판독에 앞서 사용될 수 있다.
M-AptaSSN 복합체(또는 M-AptaSSN 공유결합 복합체)는 Q-PCR을 사용하여 검출되고/되거나 정량화된다. 본 발명에 사용된 것으로서, "Q-PCR"은 분석의 결과가 양으로 계산되는(quantitative), 즉 분석법이 시료 내에 존재하는 AptaSSN의 양 또는 농도를 정량할 수 있는 방법과 제한된 조건 하에서 수행된 PCR 반응을 말한다.
시료 내의 M-AptaSSN 복합체의 양 또는 농도는 TaqMan® PCR을 사용하여 측정된다. 이 기술은 일반적으로 표적화된 서열로부터 시그널을 발생시키기 위하여 올리고뉴클레오티드 복제 효소의 5'-3' 엑소뉴클레아제(exonuclease) 활성에 의존한다.
TaqMan 포획성분은 중합효소 연쇄반응(polymerase chain reaction; PCR)을 이용하여 증폭된 AptaSSN 서열과 같은 시그널을 발생시키기 위하여, 정량화될 AptaSSN의 서열에 기초하여 선택되고, 6-카복시플로오레세인(6-carboxyfluorescein)과 같은 5'-말단 형광단, 6-카복시테트라메틸플루오레세인(6-carboxytetramethylfluorescein)과 같은 3'-말단 퀀쳐(quencher)를 포함한다.
폴리머라아제가 AptaSSN 서열을 복제함에 따라, 엑소뉴클레아제 활성이 PCR 프라이머로부터 하부(downstream)에서 어닐링된 포획성분로부터 형광단을 유리시킴으로서 시그널을 발생시킨다. 복제 산물(replicative product)로서 증가된 시그널이 생산된다. PCR 산물의 양은 AptaSSN의 시작 농도뿐만 아니라 수행된 복제 주기의 수 모두에 좌우된다.
M-AptaSSN 복합체의 양 또는 농도는 복제 공정 동안 삽입성 형광 염료(intercalating fluorescent dye)를 사용하여 측정된다. 예를 들어, SYBR® 그린(SYBR® green)과 같은 삽입성 염료는 단일가닥 DNA의 존재 하에서 생성된 형광 시그널에 비해 이중가닥 DNA의 존재 하에서 큰 형광 시그널을 생성한다. 이중가닥 DNA 산물이 PCR 동안에 형성되는 것과 같이, 염료에 의해 생성된 시그널도 증가한다. 생성된 시그널의 크기는 PCR 주기 및 AptaSSN의 시작 농도 모두에 의존한다.
M-AptaSSN 복합체는 질량 분석기를 사용하여 검출되고/되거나 정량된다. 고유한 질량 태그는 상기에 기재된 효소적 기술을 사용하여 도입될 수 있다. 질량 분석기의 판독을 위하여 검출 표지는 필요하지 않으며, 그보다는 질량 그 자체가 당업자들에게 일반적으로 사용되는 기술을 사용하여 확인하는 데 사용되며, 질량 분석기를 분석하는 동안에 생성된 질량 피크(mass peak) 아래의 위치와 영역에 기초하여 정량화된다. 질량 분석법을 사용하는 예는 세퀴놈(Sequinom)에 의해 개발된 MassARRAY® 시스템이다.
본 발명의 NGS 기술을 사용한 M-AptaSSN 복합체의 AptaSSN의 분석 기술은 상기 복합체에서 분리한 AptaSSN에 대해 NGS 라이브러리를 제조하여 NGS 장비에 런닝한다. 생성된 FASTAQ 파일을 AptaSSN 염기서열과 비교하여 AptaSSN 염기서열과 동일한 리드의 종류를 결정하고 그의 출현빈도를 산정하여 AptaSSN 프로파일을 생산하는 방법이다.
본 발명에 개시된 방법들 중 어느 하나의 하나 또는 그 이상의 단계를 수행하기 위하여 컴퓨터 프로그램이 사용될 수 있다. 본 발명 명세서의 다른 양상은 컴퓨터 내로 로딩될 때 본 발명에 기재된 임의의 방법의 실행을 수행하거나 돕는 컴퓨터 프로그램을 가지는 컴퓨터 판독 가능한 저장 매체(computer readable storage medium)를 포함하는 컴퓨터 프로그램 제품이다.
Ⅵ. 다양한 유형의 분자로부터 분자데이터 생산
본 발명은 다양한 유형의 분자집단으로 구성된 생물학적 시료에 있는 핵산 및 단백질을 NGS 기술로 동시에 분석하는 방법을 제공한다.
도 17은 시료를 구성하는 핵산과 단백질을 동시에 분석하여 핵산 데이터 및 단백질 데이터를 생산하는 과정을 제공하는 도면이다.
상기 핵산 데이터는 mRNA 및 miRNA 등을 포함하는 RNA 정보와 유전자의 구조적 변이, 메칠화 및 SNP 등을 포함하는 DNA 정보를 포함한다.
본 발명은 다양한 유형의 분자집단으로 구성된 시료의 다중화 분석을 위한 방법, 기구, 키트 및 시약을 제공하며, 여기에서 시료 내의 다양한 유형의 분자집단은 동시에 검출되고/되거나 정량화될 수 있다. 궁극적으로, 이 방법 및 시약들은 다양한 유형의 분자 농도(예를 들어, 시료 내의 단백질 분자 농도)를 임의의 다양한 핵산 검출 및 정량 방법에 의해 검출되고 정량될 수 있는 핵산 농도로 전환시킬 수 있다. 상기 단백질 분자에 대응하는 핵산 농도로 효과적으로 전환되면, 그후 시그널을 증가시키기 위한 표준 핵산 증폭 및 검출 단계를 사용할 수 있다. 본 명세서는 시료의 다중분석을 위한 방법을 제공한다. 본 명세서에 따른 방법은 시험관 내(in vitro)에서 수행될 수 있다.
본 발명에서 NGS(Next Generation Sequencing)를 이용한 단백질을 분석하는 방법은 본 명세서에서 잘 설명하고 있다. 일반적으로 NGS은 칩(Chip)기반 그리고 PCR기반 페어드엔드(paired end)형식으로 전장 유전체를 조각내고, 상기 조각을 혼성화(hybridization)에 기초하여 초고속으로 시퀀싱을 수행하는 기술로 유전체에 대해 많은 정보를 생산하는 방법은 공지되고 있다.
NGS 기술로 인구집단에서 2~5%의 서로 다른 대립유전자가 있을 수 있는 유전형질 정보인 염기다형성(SNP: Single Nucleotide Polymorphism)와 염기다형성의 결과로 야생형(Wild type) 아미노산이 변형된 형태인 돌연변이(amino acid mutation)를 신속하게 분석할 수 있다. WGS(Whole Genome Sequencing)은 NGS에 의한 전장 유전체 시퀀싱을 10X, 20X, 40X형식으로 여러 배수로 인간게놈을 읽는 방법이고 WES(Whole Exome Sequencing)는 위의 WGS중에서 단백질 생성에 관여하는 유전자 부위만 염기서열 결정을 하는 것이며 TS(Target seqencing)는 위의 WGS중에서 표적 단백질 생성에 관여하는 유전자 부위만 시퀸싱을 하는 기술이다. 따라서, WGS > WES > TS의 데이터크기가 생성된다. 그러나, 작은 부위이기 때문에 많은 샘플을 시퀀싱할 수 있는 장점이 있다. MET(Methylation) 리드는 유전자의 DNA methylation 측정을 위한 시퀀싱 기술이고, RNA 리드는 유전자의 발현, 즉 DNA transcriptome을 위한 시퀀싱 기술이다. SV(structural variation)는 변이중에서 insertion, inversion, translocation 등에 의하여 생기는 염색체의 큰 단위(DNA segment)에서 생기는 변이로 이에 대한 정보도 NGS로 생산할 수 있다.
바람직하게, NGS 기술을 이용하여 단백질 및 핵산 데이터를 동시에 생산하는 과정은 다음과 같다.
먼저, 표적 핵산들의 염기서열과 표적 단백질에 대한 AptaSSN의 염기서열로 참조서열(reference sequences)를 구축한다. 본 실시례에서 1149개의 AptaSSN의 염기서열과 표적 핵산의 염기서열로 참조서열을 구축할 수 있다.
두 번째로, 다양한 유형의 분자집단으로 구성된 시료에 있는 단백질 분자(M)로부터 분석할 시료를 준비한다. 본 발명의 <Ⅱ. AptaSSN의 다중 분석> 항을 참조하여 시료에 있는 단백질 분자집단과 AptaSSN 집단을 접촉시키고 형성된 M-AptaSSN 복합체 집단을 분리한다. 또는 상기 준비된 생체시료에 있는 단백질 분자를 NC 디스크에 부착하고 반응용액에서 AptaSSN 집단을 접촉시키고 형성된 M-AptaSSN 복합체 집단을 세척용액으로 세척하여 미결합하거나 비특이적 결합 AptaSSN을 제거하고 디스크를 분리한다. 디스크에 부착된 시료를 구성하는 분자집단과 결합하는 AptaSSN 집단을 준비할 수 있다.
세 번째로, 다양한 유형의 분자집단으로 구성된 시료에 있는 핵산을 분석하여 핵산 데이터를 생산하기 위한 선행요소로 표적 유전자를 증폭하는 과정에 사용되는 올리고뉴클레오티드 디자인이다. 특정 온도에서 어닐링할 수 있는 최적의 길이를 가진 mTAS(multiple target loci assembly sequencing) 올리고뉴클레오티드를 제작하기 위해, 본 발명자들은 컴퓨터 프로그램인 Perl-mTAS를 이용하였다. 올리고뉴클레오티드 포획성분은 타겟-특이적 서열(타겟 혼성화 뉴클레오타이드 서열) 및 5’-플랭킹 어셈블리 스페이서 서열(오버래핑 서열)로부터 제작한다. 모든 포획성분들은 거의 25 bp였으며 Tm 60℃에서 어닐링한다.
각 타겟 게놈 유전자 위치(genomic locus)를 위해, SNP 위치를 포함하는 7 bp의 갭(gap)이 존재하도록(즉, SNP 위치의 좌측, 3 bp; SNP 위치, 1 bp; 및 SNP 위치의 우측, 3 bp) 디자인한다. 디자인의 용이성을 더 하기 위하여 갭의 간격은 0-3 bp로 조절할 수 있다. 비록 어셈블리 스페이서 서열이 임의적으로 제조될 지라도, 어셈블리 서열상에 존재하는 어닐링 부위는 올리고뉴클레오티드 간의 중첩 부위(overlapping regions)에 대한 온도를 계산하기 위해 가장 가까운 인접 방법(nearest neighbor methods)에 기반하여 결정할 수 있다.
생체시료를 나누어 핵산 시료를 분리할 시료에서 공지된 방법으로 핵산시료를 준비하여 -20℃에 보관할 수 있다. -20℃에 보관되어 있는 gDNA를 사용하여 NGS 라이브러리를 제작할 수 있다.
시료에서 분리된 총 RNA에 대한 상기 NGS 라이브러리 제작은 Ion Ampliseq Library Kit 2.0 (Life technologies사, 미국)를 사용하여 제작할 수 있다. 시퀀싱 특정서열과 바코드가 결합된 증폭산물은 45 ㎕의 AMPure XP 용액을 첨가하여 세척하고 Agilent DNA 1000 chip을 이용하여 정량화하여 스쿼싱 라이브러리를 제작하였다.
혈청시료에서 1.5ml씩 샘플링 하여 상온에서 10,000g로 5분간 원심분리하여 세포를 회수한다. 회수된 세포를 RNeasy Plus Mini Kit (Qiagen사, 독일)을 이용하여 총 RNA를 추출하였다. 추출된 RNA의 농도와 질(quality)은 NanoDropTM 1000 spectrophotometer(NanoDrop Technologies 사, 미국)를 이용하여 260nm와 280nm에서 측정하여 결정하였다.
샘플에서의 RNA로부터 제조된 cDNA 라이브러리에서 대량 동시 기술을 이용하여 서열분석이 수행할 수 있다. 제조업자의 지시에 따라 또는 약간 변형하여 예를 들어 mRNA-seq Sample preparation Kit(Illumina사, 미국)를 사용하여 cDNA라이브러리를 합성할 수 있다.
인간혈청시료에서 얻은 소형 RNA 서열과 genome-wide miRNA를 분석, 비교할 수 있다. mirVAna miRNA isolation kit(Ambion 사, 미국)를 사용하여, 혈청시료로 부터 소형 RNA는 먼저, 총 RNA를 추출하였고, Illumina library preparation protocol(Illumina 사, 미국)에 따라 miRNA 라이브러리를 준비할 수도 있다. 정제된 miRNA 라이브러리는 Agilent DNA 1000 chip을 이용하여 정량화하여 NGS 라이브러리를 제작하였다.
제작된 NGS 라이브러리가 시퀀싱에 사용될 수 있는가를 확인하기 위하여 Agilent Bioanalyzer 2100(Agilent 사, 미국) 기기를 사용하여 High Sensitivity chip을 이용하여 제작된 라이브러리의 길이와 양을 측정하였고, 길이는 100 내지 300bp, 양은 100 pmol/l 이상인 조건에 만족하는 라이브러리를 시퀀싱에 사용하였다. High Sensitivity chip을 이용한 라이브러리 정도관리를 하였다.
각 시료 별로 통합되고 해당 시료의 바코드 서열이 부착된 PCR 산물은 Qubit fluorometer(Invitrogen 사, 미국)로 정량할 수 있다. 상기 PCR 산물을 NGS 시퀀서에 처리하여 염기서열 결정을 수행할 수 있다.
본 발명은 상기 분획된 생체시료에서 분리한 핵산 시료에 대한 NGS 라이브러리와 상기 분리한 M-AptaSSN 복합체 집단에 대한 NGS 라이브러리을 혼합하여 NGS 라이브러리를 제작하거나, 각기 따로 제작한 NGS 라이브러리의 염기서열을 결정할 수도 있다. 상기 제작된 NGS 라이브러리를 구성하는 핵산의 염기서열을 상기 참조서열을 비교분석하여 출현빈도를 결정하였다.
상기 결정된 시퀀스 라이브러리를 구성하는 핵산의 출현빈도는 표적분자인 핵산 및 단백질의 정보를 반영하고 있어 분석결과를 이용하여 핵산시료의 핵산과 생체시료를 구성하는 표적분자를 분석할 수 있다.
Ⅶ. 내부 정도관리 및 생물학 의미 결정지원 시스템
본 발명은 다양한 유형의 분자로 이루어진 시료의 다중화 분석을 위한 방법, 기구, 키트 및 시약을 제공하며, 여기에서 다양한 유형의 분자로 구성된 시료에 있는 분자집단을 동시에 검출되고/되거나 분석할 수 있다.
궁극적으로, 이 방법 및 시약들은 시료를 구성하는 복수 분자 농도(예를 들어, 시료에 있는 복수 단백질 농도)를 임의의 복수 리간드를 이용한 검출 및 분석 방법으로 검출되고 분석하여 복수 표적분자를 분석할 수 있다. 상기 복수 표적 분자를 리간드를 이용한 분석 기술 그리고 PCR 기술 및 혼성화 기술을 포함하는 핵산분석기술로 상기 복수 분자에 결합하는 각각 복수 리간드 농도로 효과적으로 전환되면, 그후 시그널을 증가시키기 위한 증폭 및 검출 단계를 사용할 수 있다. 본 명세서는 시료의 다중분석을 위한 방법을 제공한다. 본 명세서에 따른 방법은 시험관 내(in vitro)에서 수행될 수 있다.
상기 분자는 단백질(proteins), 폴리펩티드(polypeptides), 핵산(nucleic acid), 폴리뉴클레오티드(polynucleotide), 탄수화물(carbohydrates), 다당류(polysaccharides), 당단백(glycoproteins), 호르몬(hormones), 수용체(receptors), 항원(antigens), 항체(antibodies), 바이러스(viruses), 기질(substrates), 대사분자(metabolites), 전이상태 유사체(transition state analogs), 보조인자(cofoactors), 억제제(inhibitors), 약물(drugs), 염료(dyes), 영양분(nutrients), 성장 인자(growth factors), 조직(tissues) 및 규제 약물(controlled substance)로 이루어진 군으로부터 선택되는 것이다.
본 발명은 내부 정도관리 및 생물학적 의미 결정지원 시스템의 구조도와 운영 단계를 제공한다.
도 18는 내부 정도관리 및 생물학 의미 결정지원 시스템(1)의 장치에 대한 도면이다.
도 18을 참조하면, 내부 정도관리 및 생물학 의미 결정지원 시스템(1)의 장치는 (a) 시료를 구성하는 복수의 분자에 대해 분자데이터를 생산하는 분자데이터 생산 모듈(100); (b) 상기 생산된 분자데이터가 있는 시료들을 생물학적 의미를 기준으로 구축된 분자데이터베이스에서 선정된 정도관리분자데이터를 사용하여 상기 시료의 분자 정보에 대해 내부 정도관리하는 내부정도관리 모듈(200); 및 (c) 상기 분자데이터베이스와 상기 분자데이터베이스에서 선정된 분류분자데이터와 상기 분자데이터베이스를 학습하여 획득한 예측모델을 사용하여 특정 시료의 분자데이터에 대해 생물학적 의미 결정지원을 하는 생물학적 의미 결정지원 모듈(300);를 포함할 수 있다.
본 발명의 내부 정도관리 및 생물학 의미 결정지원 시스템(1)의 운용 방법은 (a) 상기 분자데이터 생산 모듈(10)이 상기 시료에서 분자데이터를 생산하는 단계; (b) 상기 내부정도관리 모듈(20)이 상기 데이터베이스에서 선정된 정도관리분자데이터로 상기 분자데이터 생산 모듈(10)에서 생산된 시료의 분자데이터에 대해 내부 정도관리를 실시하여 유효 분자데이터를 선정하는 단계; 및 (c) 상기 생물학적 의미 결정지원 모듈(300)은 상기 데이터베이스에서 선정된 분류분자데이터와 상기 데이터베이스를 학습하여 획득한 예측모델로 상기 내부정도관리 모듈(200)에서 입력되는 유효 분자데이터를 분석하여 생물학적 의미 결정지원을 실시하는 단계;를 포함할 수 있다.
1. 분자데이터 생산 모듈
본 발명에서 내부 정도관리 및 생물학 의미 결정지원 시스템(1)의 분자데이터 생산 모듈(100)은 분자의 유형에 따라 달리 할 수 있으며, 동일한 유형의 분자라도 다양한 방법 및 장치가 있어, 본 발명에서 언급되는 내용에 제한되는 것은 아니다. 분자가 핵산인 경우는 염기서열 결정 방법, PCR 방법 및 혼성화 방법 등이 있으며 이를 기초한 다양한 장치들이 있다. 단백질 경우는 항체 및 압타머를 포함하는 리간드를 이용한 방법 및 MS 방법 등을 활용한 다양한 장치들이 있다. 상기 방법 및 장치를 본 발명의 분자데이터 모듈(100)로 사용할 수도 있다.
도 19은 다양한 유형의 분자로 이루어진 시료에 있는 분자집단에서 분자데이터를 생산하는 구성에 대한 도면이다.
도 19을 참조하면, AptaSSN 집단을 이용한 생물학적 의미 결정지원시스템(1)를 구성하는 분자데이터 생산 모듈(100)의 장치는
(a) 분석시료를 구성하는 분자집단과 AptaSSN 집단이 접촉하여 형성된 M-AptaSSN-FSS 복합체를 제1 분리하는 제1 반응구(101); (b) 상기 제1 분리된 복합체 집단에서부터 SSS-M-AptaSSN-FSS 집단을 제2 분리하는 제2 반응구(102); (c) 상기 제2 분리된 복합체에서 용출된 AptaSSN 집단을 상기 분리된 AptaSSN 집단으로부터 제조된 NGS 라이브러리를 제조하고 상기 제조된 NGS 라이브러리에서부터 NGS 원데이터를 생성하는 NGS 시쿼서(103); 및 (d) 상기 NGS 원데이터를 전처리하고 참조서열(104)과 비교하여 결합 프로파일을 생성 분석하는 비교모듈(105);를 포함하여 구성할 수 있다.
상기 분자 데이터 생산 모듈(100)의 제1 반응구(101)과 제2 반응구(102)로 이루어진 모듈은 도 16에 제시한 AptaSSN 유체 자성 비드 장치(1000)를 사용할 수도 있다.
상기 반응구(102) 및 NGS 시쿼서(103)는 프로테오믹스 분석구로 대체할 수도 있다.
본 발명에서 분자데이터 생산 모듈(100)에서 AptaSSN 집단으로 시료에 있는 분자집단에 대한 분자데이터를 생산하는 방법은 (a) 분자데이터 생산모듈(100)을 구성하는 제1 반응구(101)에서 시료에 있는 분자집단과 AptaSSN 집단이 혼합한 용액에서 접촉하여 형성된 M-AptaSSN-FSS 복합체를 제1 분리하는 단계; (b) 상기 분리된 M-AptaSSN-FSS 복합체를 제2 반응구(102)로 이송하여 형성된 SSS-M-AptaSSN-FSS 집단을 제2 분리하는 단계; (c) 제2 분리된 복합체에서 용출된 AptaSSN-FSS 집단 또는 AptaSSN 집단을 NGS 시퀀서(103)로 염기서열을 결정하는 단계; (d) 비교모듈(105)에서 기구축된 참조서열(104)와 상기 결정된 NGS 염기서열을 비교하여 AptaSSN의 종류와 출현빈도로 이루어진 분자데이터, 프로파일을 생성하는 단계; 및 (e) 상기 생산된 분자데이터를 평가 시료는 내부 정도관리 모듈(200) 또는 학습 시료는 생물학적 의미 결정지원 모듈(300)에 입력하는 단계;를 포함할 수 있다.
2. 분자데이터의 내부정도관리
본 발명의 내부 정도관리 및 생물학적 의미 결정지원 시스템(1)을 구성하는 내부정도관리 모듈(200)은 상기 분자데이터 생산 모듈(100)에서 특정 시료를 구성하는 분자집단에 대한 분자데이터의 품질을 확보하기 위해서 내부 정도관리를 수행할 수 있다.
도 19은 분자데이터의 통계적 내부 정도관리 모듈(200)의 구성을 설명하기 위한 도면이다.
도 19을 참조하면, 분자데이터의 통계적 내부정도관리 모듈의 장치는 입력 모듈(201), 제어 모듈(202), 디스플레이 모듈(204), 저장 모듈(205)를 포함하고, 제어 모듈(202)는 인터페이스 제공 모듈(203)를 포함할 수 있다. 입력 모듈(201)는 도 18에서 설명한 데이터 입력단계가 구현되는 것으로서, 사용자가 입력할 수 있는 입력장치 또는 네트워크나 데이터 전송 등에 의한 입력이 가능할 수 있다. 제어 모듈(202)는 데이터 분석단계가 구현되는 것으로서, 중앙처리장치에 의해 논리적, 수학적 연산이 가능하다. 디스플레이 모듈(204)는 데이터 분석결과 또는 조회 출력단계에서 출력되는 데이터가 디스플레이되며, 정도관리 데이터를 포함한 데이터 분석결과 등을 사용자가 인식할 수 있도록 표시하는 장치이다. 저장 모듈(205)는 정도관리 데이터를 포함한 데이터 분석결과가 저장되는 곳으로서, 데이터베이스로 구현될 수 있으며, 데이터의 읽기와 쓰기가 가능한 장치이다. 인터페이스 제공 모듈(204)는 디스플레이와 같은 출력장치에 데이터를 출력함과 동시에 사용자의 입력을 유도하는 수단을 제공한다. 인터페이스 제공 모듈(204)는 제어 모듈(202)와 일체로 구현될 수도 있으며, 별도의 수단으로 구현될 수도 있다.
분자데이터의 통계적 내부 정도관리의 결과 관리 방법은 내부 정도관리 데이터를 입력받는 데이터 입력단계, 기 설정된 평가기준에 따라 내부 정도관리 데이터를 분석하는 데이터 분석단계, 데이터 분석결과를 디스플레이에 출력하고, 사용자로부터 데이터 분석결과에 따른 특이사항 또는 조치사항 데이터를 입력받을 수 있는 인터페이스를 제공하는 인터페이스 제공단계, 내부 정도관리 데이터, 데이터 분석결과 및 조치사항 데이터를 데이터베이스에 저장하는 데이터 저장단계 및 사용자가 입력한 조회기간의 분자데이터 생산 모듈(100) 또는 분자데이터에 대한 내부 정도관리 데이터, 데이터 분석결과, 조치사항 데이터 중 어느 하나 이상에 내부 정도관리 데이터의 평균, 표준편차 및 변동계수 중 어느 하나 이상을 포함시켜 출력하는 조회 출력단계를 포함한다.
상기 내부 정도관리 모듈(200)의 운영 방법은 (a) 상기 분자데이터가 있는 학습 시료들을 생물학적 의미를 기준으로 구축된 학습 데이터베이스에서 정도관리분자(데이터)를 선정하는 단계; (b) 상기 분자데이터 생산 모듈(100)에서 입력되는 평가 시료의 분자데이터를 상기 선정된 정도관리분자로 내부 정도관리하는 단계; (c) 상기 내부 정도관리한 분자데이터가 있는 시료의 내부 정도관리 결과를 출력하는 단계; 및 (d)상기 내부 정도관리된 유효 분자데이터가 있는 시료를 생물학적 의미 결정지원 모듈(300)에 입력하는 단계;를 포함할 수 있다.
본 명세서에서 개시하는 분자데이터의 통계적 내부 정도관리 방법 및 그 장치에 의해 방대한 양의 분자데이터를 효율적으로 관리할 수 있고, 분자의 오류를 용이하게 확인하여 조치를 취할 수 있도록 함으로써 신뢰할 수 있는 검사결과를 확보할 수 있다.
상기 내부 정도관리 모듈은 상기 분자데이터가 있는 시료들을 생물학적 의미를 기준으로 구축된 학습 데이터베이스에서 정도관리분자(데이터)를 선정해야 한다.
상기 선정된 정도관리분자(데이터)의 역할은 분자데이터 생산 모듈(10)에서 생산된 데이터가 목표한 값에 도달했는지는 확인하여 분석의 품질을 확보할 있게 해준다. 상기 선정된 정도관리분자 데이터 또한 목표 값이 있어야 하며, 이러한 허용범위치를 얻기 위해서 반복 실험, Lab간 비교, 실험자간 비교 등을 통해 정확도, 민감도, 특이도 등의 성능지표와 측정치의 목표 값을 산출해내야 한다. 또한 정도관리분자 데이터는 분석시 측정값의 변화가 적어야 한다.
본 발명의 AptaSSN 다중검사의 내부정도관리는 검사 수행에서 발생하는 분석오차 중에서 부정밀성(imprecision)의 크기를 정도관리분자의 반복 측정과 통계분석을 이용하여 객관적인 지표로 계량화하고 최종적으로는 분석 결과의 정밀성에 극대화하는 것을 목적으로 한다. 특히, NGS를 사용하는 경우에 특별히 고려해야 한다.
본 발명의 내부정도관리를 위해서는 우선 적절한 정도관리분자를 선정하는 것이 매우 중요하다. 임상검사 정도관리 가이드라인과 미국의 CLIA 지침 C24-A3 정량적 측정법의 통계적 정도관리의 권고사항에서는 분자의 기질(matrix), 안정성, 농도 설정 여부, 분석 범위, 비용 등을 고려하여 적합한 정도관리분자를 선정하도록 할 수 있다.
선별 검사를 실시하는 경우는 정상 범위의 검체가 대부분일지라도 이상 결과를 발견할 수 있도록 고농도나 저농도의 내부정도관리 분자를 반드시 포함해야만 이상 결과의 발생과 종류를 검출할 수 있다. 본 발명에서는 최소한 2가지 농도 이상의, 임상적으로 중요한 농도를 포함하는 내부정도관리 분자를 선정하도록 할 수 있다.
내부정도관리 분자 선정은 상기 분자데이터 생산 모듈(10)에서 생산한 측정값의 변화가 적은 내부정도관리 분자의 선정을 위해 정밀성을 확보할 수 있는 분자를 선별한다. 본 발명에서는 정밀성 높은 AptaSSN을 확보하기 위해 변동계수(Coefficient of Variation) 방법을 사용한다.
구체적으로 살펴보면, 생물학적 의미에 기준하여 분석시료를 실험 시료와 대조시료로 학습 데이터베이스를 구축하는데, 상기 시료에 대해 분자데이터 생산 모듈(100)에서 생산된 분자데이터를 적절한 데이터 포맷으로 전환하여 학습 데이터베이스를 구축할 수 있다.
상기 구축된 학습 데이터베이스 기준으로 통계수치 산출한다. 상기 구축된 학습 데이터베이스를 구성하는 모든 시료에 대한 분자데이터, 프로파일을 구성하는 특징의 측정치별 평균, 표준편차 및 변동계수(Coefficient of Variation; 식 1)를 계산한다.
변동계수 = 표준편차 / 평균 - (식 1)
상기 변동계수를 오름차순으로 정렬하고 정렬된 변동계수 상위 1%(1149개 압타머 중 12개)를 선택한다. 선택되어진 12개의 분자를 평균을 기준으로 오름차순으로 정렬한다. 평균으로 정렬된 분자를 3개의 구간으로 나눈다. (각 구간별 압타머 4개). 각 구간별 선택되어진 분자는 정도관리시 사용할 수 있다.
정도관리분자의 자체 허용범위를 설정해야 한다. 내부정도관리분자의 허용범위는 최소한 20일 동안, 최적의 동일한 조건에서 반복적으로 측정된 결과의 실제 평균과 표준편차를 구하여 자체 허용범위를 설정해서 사용할 수도 있다.
내부정도관리의 목적은 검사 중에 발생할 수 있는 분석오차(analytical error)를 사전에 발견을 위한 것으로 분석오차에는 무작위오차(random error)와 계통오차(systematic error)가 있다.
내부정도관리에 대한 결과 해석은 적절한 규칙을 이용하여 가능하면 위양성과 위음성을 감소시킬 수 있는 방법을 혼합하여 사용할 수 있다. 내부정도관리 해석에 주로 사용되는 방법들은 Levey-Jennings Control Chart(레비제닝스 관리도)와 Westgard multirules 기술(웨스트가드 다중 규칙)이 이 가장 대표인 방법이라고 할 수 있다.
Westgard multirules에 사용되는 정도관리 원칙에는 다양한 원칙들이 있다. 이 중에서 가장 중요한 점은 계통적 오차와 우발적 오차를 찾을 수 있는 원칙을 적용하여야 한다.
검사 결과의 신뢰성을 유지함에 있어 필요한 오류 검출율을 유지하며 낮은 위거부율(false rejection)을 유지할 수 있다면 단 하나의 원칙을 사용할 수도 있다. 12s 원칙은 높은 위거부율을 가지고 있어 일반적으로 적용하기에 어려움이 있으므로 상대적으로 낮은 위거부율을 가진 12.5s, 13s, 13.5s와 같은 방법을 사용할 수 있다. 만약 의학적으로 중요한 오류 검출율을 90% 이상 유지할 수 있다면 단 한 개의 원칙을 사용할 수도 있으며 이는 자동화가 완벽히 이루어지고 정밀성이 높은 기기에 적용할 수 있을 것이다. 그러나 폐기율을 최소화하거나 원가 절감을 위한 방법으로서 12s 원칙을 사용하는 것은 지양하여야 한다. 만약 단 한 개의 원칙을 사용하고자 한다면 오류 검출율 90% 이상, 위거부율 5% 미만의 목표를 설정한 후에 적합한 원칙을 적용하는 방법이 타당할 것이다.
본 발명은 통계적 정도관리를 실시함에 있어 계통적 오차와 무작위 오차를 검출할 수 있는 원칙들을 제시하였다. 각 검사에 적합한 원칙을 선택적으로 선정하여 적용하는 것이 적합하다.
사용되는 통계적 정도관리분자의 숫자에 따라 적용되는 원칙을 다르게 할 수 있다. 그러나 임상화학 관련 검사에서 사용되는 통계적 정도관리분자의 수는 보편적으로 정상과 비정상 농도를 가진 2가지를 사용하고 있으므로 이를 참고하여 적합한 원칙을 적용할 수 있다.
검사를 무한대로 반복하면 측정값은 평균과 표준편차를 가지는 정규분포를 이루며, 무작위오차는 평균은 같지만 표준편차가 증가한 오차이며, 게통오차는 표준편차는 같지만 평균이 이동한 오차로 정의할 수 있다
웨스트가드 다중 규칙은 레비제닝스 관리도를 보완하여 위거부율이 낮으면서 오차발견율은 높도록 고안되었다. 이 방법은 정도관리분자의 측정값을 누적하여 여러가지 관리 규칙에 따라 반정량적으로 평가한다.
사용되는 정도관리분자의 수가 2, 4, 8개인 경우, 통상적인 원칙인 12s/22s/R4s/4s/10x을 사용할 수 있지만, 정도관리분자의 수가 3 혹은 6개인 경우에는 3의 배수가 적용되는 원칙인 13s/2 of 32s/R4s/31s/12x 와 같은 원칙을 사용할 수 있다. 이러한 원칙들은 동일한 분자 농도하에서만 적용하는 것이 아니라 분자 간, 검사 횟수 간에도 적용하여 다시 한번 오류를 찾을 수도 있다.
참고할 수 있는 지침으로는 CLSI EP9-A3: 환자 검체를 이용한 검사법 비교 및 바이어스 추정, CLSI EP26-A: 시약 관리번호 간 변이에 따른 사용자 평가, CLSI EP31 동일 의료기관 내에서 환자 결과의 동등성 검증(CLSI C54-A가 변경됨) 등이 있다.
정도관리분자를 이용한 내부정도관리는 검체를 분석하기 전에 반드시 시행되어야 하며, 검사 조건이 변경될 수 있는 모든 시약의 교체 후, 장비의 주요 유지 보수 또는 검사 결과에 영향을 미칠 수 있는 주요 부품의 교체 이후에도 수행해야 한다.
분자데이터의 통계적 내부 정도관리의 결과 관리 방법은 내부 정도관리 데이터를 입력받는 데이터 입력단계, 기 설정된 평가기준에 따라 내부 정도관리 데이터를 분석하는 데이터 분석단계, 데이터 분석결과를 디스플레이에 출력하고, 사용자로부터 데이터 분석결과에 따른 특이사항 또는 조치사항 데이터를 입력받을 수 있는 인터페이스를 제공하는 인터페이스 제공단계, 내부 정도관리 데이터, 데이터 분석결과 및 조치사항 데이터를 데이터베이스에 저장하는 데이터 저장단계 및 사용자가 입력한 조회기간의 분자데이터 생산 모듈(100) 또는 분자데이터에 대한 내부 정도관리 데이터, 데이터 분석결과, 조치사항 데이터 중 어느 하나 이상에 내부 정도관리 데이터의 평균, 표준편차 및 변동계수 중 어느 하나 이상을 포함시켜 출력하는 조회 출력단계를 포함한다.
내부 정도관리 데이터는 사용자가 직접 입력하거나 데이터 저장수단 또는 검사장비로부터 네트워크를 통해 전송되어 입력될 수 있다. 정도관리 데이터는 분자데이터 생산을 위한 장비, 시약, 기구, 온도 등 전반적인 내용이 포함될 수 있다.
입력된 내부 정도관리 데이터는 기 설정된 평가기준에 따라 분석이 수행된다. 여기서 내부 정도관리 데이터에 대한 기 설정된 평가기준은 Westgard에 의한 정도관리 데이터의 해석 및 그에 관한 룰(rule)을 포함할 수 있다. 기 설정된 평가기준은 인터페이스 제공단계를 통해 정도관리분자의 기준 값 허용 범위치를 변경할 수 있도록 할 수 있다.
데이터 분석결과는 디스플레이를 통해 사용자에게 출력되고, 사용자는 정도관리 데이터와 함께 데이터 분석결과를 검토하여 특이사항의 내용 또는 사용자가 취하여야 할 일련의 조치사항을 입력한다. 이러한 입력 인터페이스는 기 설정된 평가기준에 따라 표시된 정도관리 데이터를 사용자가 클릭하는 경우 팝업의 형태로 디스플레이에 출력될 수 있도록 사용자 인터페이스를 구현할 수 있다.
정도관리 데이터, 데이터 분석결과 및 조치사항 데이터는 데이터베이스에 저장되어 사용자의 요청에 따라 다양한 분류 형식 및 포멧으로 출력될 수 있다.
조회 출력단계)는 사용자가 입력한 조회기간의 의료장비 또는 콘트롤 물질에 대한 내부 정도관리 데이터, 데이터 분석결과, 조치사항 데이터 중 어느 하나 이상에 내부 정도관리 데이터의 평균, 표준편차 및 변동계수 중 어느 하나 이상을 포함시켜 출력한다. 사용자의 결과 조회 입력에 따라 조회기간에 대해 실제 측정값과 이들의 통계치를 기 설정된 기준값 허용 범위치와 비교함으로써, 검사결과의 오류를 용이하게 확인할 수 있다.
조회 출력단계는 내부 정도관리 데이터의 평균, 표준편차 및 변동계수에 대응하는 자체 검사실의 랩타겟(Lab Target) 데이터, 타 검사실의 동종 데이터, 전월에 측정한 내부 정도관리 데이터 또는 제조사에서 제공하는 데이터 중 어느 하나 이상에 대한 각각의 평균, 표준편차 및 변동계수를 함께 출력할 수 있다. 여기서, 동종 데이터는 동종 장비, 동일 검사방법 또는 동일 시약 등에 대한 내부 정도관리 데이터를 포함할 수 있다.
조회기간을 설정하고, 분자데이터 생산 모듈을 구성하는 장비명과 내부 정도관리분자을 선택하면 일자별 등록된 데이터가 출력된다. 여기에 내부 정도관리분자 허용범위 중 어느 하나 이상을 선택하면 측정된 데이터와 선택되어진 내부 정도관리분자를 대비할 수 있는 결과를 출력한다. 내부 정도관리분자 허용범위에는 자체 검사실의 랩타겟 내부 정도관리 데이터(Lab Target), 타 검사실의 동종 데이터(Peer Group), 전월에 측정한 내부 정도관리 데이터(전월비교) 또는 제조사에서 제공하는 내부 정도관리 데이터(제조사 Target)를 포함할 수 있도록 함으로써, 이들과 선택적으로 비교하는 것이 가능하다. 동종 데이터는 동종 장비, 동일 검사방법 또는 동일 시약에 대한 내부 정도관리 데이터를 포함하는 것으로서, 이를 통해 타 검사실에서 동종의 장비에서의 결과, 동일한 검사방법에 따른 결과 또는 동일한 시약을 사용하였을 때의 결과 등의 데이터와 비교할 수 있도록 함으로써 실제 측정된 데이터의 오류여부를 용이하게 확인할 수 있다.
당월에 실제 측정된 데이터는 측정된 데이터의 통계값인 평균(Mean), 표준편차(SD) 및 변동계수(CV)로 계산될 수 있으며, 출력되는 결과에서는 자체 검사실의 랩타겟 내부 정도관리 데이터(Lab Target), 타 검사실의 동종 내부 정도관리 데이터(Peer Group), 전월에 측정한 내부 정도관리 데이터(전월비교) 또는 제조사에서 제공하는 내부 정도관리 데이터(제조사 Target)에 대한 평균, 표준편차, 변동계수를 함께 출력함으로써, 당월 실제 측정된 데이터에서의 오류를 통계적인 방법을 통해 용이하게 확인할 수 있으며, 조회기간 내의 변화 추이도 확인할 수 있게 된다. 인터페이스 제공단계는 내부 정도관리 데이터 중 기 설정된 평가기준을 초과하는 내부 정도관리 데이터의 포함여부를 입력받을 수 있는 인터페이스를 제공함으로써, 이를 통계치에 반영시킬 수 있다.
조회 출력단계는 조회기간에 따라 복수의 의료검사항목, 의료장비, 정도관리물질 중 어느 하나 이상에 따른 내부 정도관리 데이터를 그래프 또는 표의 형태로 출력하고, 조회기간에 대한 내부 정도관리 데이터의 평균, 표준편차 및 변동계수 중 어느 하나 이상을 포함하여 출력할 수 있다.
조회기간을 선택한 후 복수의 분자데이터를 구성하는 특징(표적분자) 항목 중 하나 이상을 선택하고, 분석 장비 및 정도관리분자를 선택하면, 선택되어진 특징 항목에 대한 결과치가 그래프와 통계치로 출력된다. 분자데이터를 구성하는 특징(표적분자) 항목에 대한 결과값이 출력된 것이 도시되었다.
특히, 이러한 데이터들에 대한 통계치(Mean, SD, CV)를 함께 출력하도록 선택할 수 있으며, 이를 통해 월별 추이를 그래프와 통계치를 통해 동시에 확인함으로서 문제의 원인이 정도관리 물질, 시약, 의료장비, 검사자의 문제인지를 확인하고 대책을 마련하는데 용이하다.
한편, 통계치 중 가장 유용한 통계치는 CV인데 이 결과치 월별추이를 볼 때 수치가 큰 변화를 보였으면 해당 월의 검사결과의 재현성을 확인하므로써 문제를 확인해 볼 수 있다. CV에 대한 월별 누적 결과 그래프를 출력함으로써 월별추이를 보다 용이하게 확인하도록 할 수 있다. 분자데이터의 정도관리 방법은 컴퓨터로 읽을 수 있는 기록 매체로 구성될 수 있다.
컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 매체를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는, RAM, ROM, CD-ROM, 자기 테이프, 광 데이터 저장장치, 플로피 디스크 등이 있으며, 인터넷을 통한 전송, 캐리어 웨이브 형태로 구현될 수도 있다.
또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 기록 방법을 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의하여 용이하게 추론될 수 있다.
또한, 분자데이터의 정도관리 방법은 의료검사 데이터의 정도관리 장치로 구현될 수 있다. 즉, 분자데이터의 정도관리 방법 또는 분자데이터의 정도관리 방법이 컴퓨터로 읽을 수 있는 기록 매체로 구성되어 하드웨어에 구현될 수 있다.
3. 분자데이터의 생물학적 의미 분석
내부 정도관리 및 생물학적 의미 결장지원 시스템에는 오믹스 기술에서 생산되는 분자데이터의 품질을 확보하기 위한 정도관리분자 그리고 분자데이터로 구성된 학습 데이터베이스를 기반으로 예측모델을 생성하여 특정 시료를 분류하기 위해 분류분자가 필요하다.
도 21는 생물학적 의미 결정지원 모듈(300)의 구성에 대한 도면이다.
도 21을 참조하면, 상기 생물학적 의미 결정지원 모듈(300)은 NGS 시퀀서인 입력장치에서 NGS 실험데이터가 운영체계 소프트웨어(301)에 의해 관리되는 입력모듈(302), 분석모듈(303), 시각화모듈(304)와 출력모듈(305)을 통해 분석결과가 출력장치(306)로 출력되고 메모리(308)할 수 있으며 전반적인 관리는 켄트롤러(307)에서 수행된다.
도 22은 생물학적 의미 결정지원 모듈(300)에서 실시하는 학습과 평가에 대한 도면이다.
도 22을 참조하면, 상기 생물학적 의미 결정지원 시스템(1)를 구성하는 생물학적 의미 결정지원 모듈(300)은 학습 시료에 있는 분자데이터인 결합프로파일 생성 및 저장, 학습 데이터베이스 구축, 정규화, 분류 특징 추출, 학습, 그리고 마지막 평가 시료에 있는 유효 분자데이터를 분류의 6개의 주요 단계로 구성된다.
상기 생물학적 의미 결정지원 모듈(300)은 상기 생물학적 의미 결정 과정으로 시료의 분자데이터인 결합프로파일 분석 결과를 기초하여, 생물학적 의미기반 학습 데이터베이스에 대한 특정 시료의 유사도를 분류기로 결정할 수도 있다. 상기 생물학적 의미기반 학습 데이터베이스를 구성하는 결합프로파일을 참조하여 특정 시료(또는 사용자)의 생물학적 의미를 결정하는 것이다. 즉, 본 발명에서 제시하는 AptaSSN 또는 분자 분석기술을 구현하는 입력장치로 대량의 생체정보를 생산하여 상기 생물학적 의미 결정지원 시스템(1)를 이용하여 사용자를 분류할 수도 있다.
상기 결합프로파일을 구성하는 AptaSSN의 정보를 다변량 분석을 하여 학습 데이터베이스에서 시험시료 및 대조시료의 성질을 잘 대변할 수 있는 특징, 결합 SSN을 통계학적으로 선정한 후, 선정된 AptaSSN들의 패턴을 계층 클러스터링(Hierarchical Clustering, HC) 및 인공신경망(Artificial Neural Network, ANN) 등의 방법으로 생물학적 분석에 기여하는 정도를 분석에 사용할 수 있다. 본 발명에서 이를 수행하는 프로그램 AptaCDSS를 개발하였다.
상기 프로그램 AptaCDSS는 AptaSSN, 특징 선택과 평가를 수행할 수 있다. 이런 과정을 통해 확보하고 생물학적 의미의 분석에 기여하는 AptaSSN을 선정하였으며 평가 기능에서 기계학습을 이용한 분류기(classifier)로 학습한 산물들에서 선정된 학습산물 프로그램 AptaDx와 분류의 판단기준인 임계(cutoff) 값을 이용하여 특정 시료를 분류할 수 있다.
1) 분자데이터 생성 및 저장
NGS 시퀀서인 입력장치에서 생산된 NGS 실험 데이터(리드 데이터)는 초기에는 실제 실험을 수행한 특정 연구 집단에서만 액세스 가능하다. 비교모듈(106 또는 205)은 상기 NGS 장비에서 생산된 fastaq 양식인 NGS 실험 데이터를 본 발명에서 개발한 표준 포맷으로 변환하고, 로그값으로 전환하여 결합프로파일을 생성하고 이들을 데이터 저장소를 구축하여 저장하였다.
본 발명에서는 NGS 실험 데이터는 기존 연구결과로부터 참조시퀀스(결합 SSN 데이터)를 개인별, 플랫폼 별, 질병 별로 수집한다.
상기 비교모듈에서 전처리는 상기 NGS 실험 데이터가 전환되어 저장소에 수집, 저장된 원시 데이터는 입력으로 사용하기 전에 처리되는 내용을 의미한다. 입력 데이터가 잡음이 있거나 불완전하거나 일관성이 없어 이 단계는 대부분의 자료에서 필요하다. 사전 처리에는 정리, 변환, 축소 등과 같은 데이터 관련 작업이 포함된다.
*시료를 구성하는 분자집단에 대한 결합프로파일에 대한 NGS 실험 데이터는 전환되어 저장소에 저장된 후, 다음과 같이 처리된다. 첫 번째 단계에서는 fastaq 형식에서 전환된 리드 데이터를 참조데이터베이스를 구성하는 단일가닥핵산의 구조식 <구조식 1>의 고정영역과 가변영역의 염기서열에 매핑 시킨 후, 상기 각 고정영역과 가변영역에 매핑된 전환된 리드 데이터의 특성을 다음과 같은 방식으로 분석한다. 우선, 참조 데이터베이스를 구성하는 결합 SSN 별 가변 영역마다 매핑된 리드 데이터의 양을 측정하고, 다음 가변 영역에 매핑된 리드 데이터 중 고정영역이 있는 리드 데이터의 패턴과 양을 분석하여 결합 SSN 패턴과 양을 추정한다. 즉, 고정영역이 있는 리드 데이터의 패턴 분석과 가변영역에 의하여 결합 SSN의 종류를 결정하는 것이 가능하며, 여기에서 결정된 결합 SSN의 구조가 결합 SSN 구조이다. 상기 전환된 리드 데이터를 참조데이터베이스를 구성하는 결합 SSN들로 분류되고 각각의 양이 결정되며 특정 분자집단으로 이루어진 시료에 결합 결합 SSN 프로파일이 생성된 것이다.
2) 학습 데이터베이스의 구축
상기 입력모듈(302)의 생물학적 의미기반 학습 데이터베이스 구축은 분석대상 시료집단을 분자집단으로 이루어진 시료에서 생산된 결합프로파일을 생물학적 의미에 따라 학습 데이터베이스를 구축한다.
본 발명에서 각각 시료에 대한 결합 SSN 라이브러리의 시퀀싱 결과, 결합프로파일을 분석 시료군의 생물학적 의미에 따라 학습 데이터베이스를 구분하여 나눌 수도 있다.
*상기 결합프로파일은 시료를 구성하는 분자와 결합 SSN 복합체 집단에서 분리된 결합 SSN의 시퀀싱 결과로 염기서열집단이며 이를 분석하여 염기서열과 출현빈도로 표현된다.
바람직하게는, 생물학적 의미가 있는 시료들을 통계적으로 유의한 시료 집단을 수집하여 생물학적 의미를 기초하여 학습 데이터베이스를 구축한 후 통계적으로 구성된 데이터베이스들 간에 비교하거나 각각 구성 데이터베이스를 대표할 수 있는 유의한 결합 SSN을 결정할 수도 있다.
3) 정규화
입력모듈(302)의 학습 데이터베이스를 구성하는 시료에 대한 존재양상 측정 및 정규화는 전환된 리드 데이터를 참조 데이터베이스를 구성하는 모든 결합 SSN 구조에 동시 매핑 시킨 후, 다음 각 결합 SSN에 매핑된 가변영역 영역별 결합 SSN의 수를 측정, 비교하여 각 결합 SSN의 발현량을 추정한다. 그러나 가변영역에 매핑된 결합 SSN 수를 비교하는 경우, 동일한 시료내에서 매핑된 결합 SSN 수를 정규화할 수도 있다. 상기 결과를 학습 데이터베이스로 구축할 수 있다.
상기 학습 데이터베이스에 있는 결합 SSN 데이터 분석을 위한 시각적 분석인 리드 분석 도구를 크게 2 개의 모듈로 구성한다. 첫 번째 모듈은 NGS에서 생성되는 FASTAQ (filtered raw data) 데이터를 단일가닥핵산의 <구조식1> 구조에 염기서열을 정렬하여 coverage 데이터, 결합 SSN 분석 정보를 추출(call), 저장하는 기능을 담당한다. 두 번째 모듈은 첫 번째 모듈에 의하여 추출된 분석 데이터를 참조 데이터베이스를 구성하는 결합 SSN별 또는 가변영역별로 비교하여 분석 결과를 사용자에게 제공하는 기능을 담당한다.
마지막으로 세 번째 모듈에서는 첫 번째 모듈과 두 번째 모듈의 결과를 상호 보완하여 발현된 모든 결합 SSN의 종류와 양을 보고하게 된다.
본 발명은 참조분자(reference material)과 학습데이터베이스를 구성하는 결합 SSN을 사용하여 즉, 분자집단으로 이루어진 시료에 참조분자를 첨가한 시험구를 분석하여 얻은 상기 참조분자의 출현빈도와 분자량으로 출현빈도를 알고 있는 결합 SSN에 상응하는 분자를 정량화할 수도 있으며 한 시료에서 분석한 결합 SSN의 출현빈도를 보정할 수도 있고 분석시료 집단을 구성하는 시료들 간에 정규화에 사용할 수도 있다. 
참조분자 사용에 무관하게 분류 알고리즘을 적용하기 전에는 동일한 시료 내에서 원데이터를 정규화하는 전처리 작업이 필수적이다. 이것을 Feature Scaling이라고 하며 R에서는 scale이라는 함수로 적용해볼 수 있다. Feature Scaling는 다음과 같다.
a) 리스케일링으로써 측정값들의 범위를 0~1이나 -1~+1로 변환한다(식 2).
Figure pat00001
- (식 2)
b) 표준화 Standardization는 데이터 값과 평균의 오차를 표준편차로 나누어주는 것이다. 이러한 과정을 통해서 다차원 값들을 비교, 분석하기 쉽게 만들어 준다(식 3).
Figure pat00002
- (식 3)
학습데이터베이스를 구성하는 많은 시료들의 데이터의 분류에 있어 시료들 간의 정규화, 즉 데이터의 범위를 일치시키거나 분포를 유사하게 만들어 주는 등의 작업은 꼭 필요한 일로 평균값을 이용한 정규화, 중간값을 이용한 정규화와 Quantile 정규화가 있다.
평균값을 이용한 정규화
학습데이터베이스를 구성하는 데이터의 평균값을 “0”으로 하는 정규화는 일반적으로 원래의 데이터의 값의 분포가 '정규분포'임을 가정하는 경우이나, 그렇지는 않은 경우에도 적용할 수도 있다. 기본적인 아이디어는 평균에 해당하는 값은 “0”으로, 그리고 평균에서 멀어질수록 큰 값을 지정하는 것이다. 다음은 분산으로 나누는 단계로, 값의 분포가 작은 경우에서 1 차이와 값의 분포가 매우 큰 경우에 1 차이는 분명 다른 경우이므로 분산으로 나눔으로써 원래 분포의 퍼짐에 의한 효과를 상쇄할 수 있다. 데이터에서 평균을 뺀 이후 표준편차로 나누어주는 작업을 z-transformation이라고 하며, z-transformation은 데이터의 normal 분포를 가정하지 않는다. 평균값으로 정규화된 값은 다음과 같이 표현할 수 있겠다(식 4, 5 와 6).
Figure pat00003
- (식 4)
Figure pat00004
- (식 5)
Figure pat00005
- (식 6)
중간값을 이용한 정규화
중간값을 이용한 정규화는 평균을 이용한 정규화의 절차와 거의 유사하나 데이터에서 값을 빼줄 때 (즉, 위의 식(1)에서) 데이터의 평균 대신 중간값을 사용하는 것이다. 중간값을 이용한 정규화는 데이터에 너무 튀는 값(이상치, outlier)이 있을 때 적당한 방법이다. 데이터의 중간값은 평균과는 달리 이상치에 영향을 받지 않는 성질이 있다. 평균이 아닌 중간값을 사용하는 이유는, 데이터에 너무 튀는 값, 즉 이상치가 있는 경우에는 이상치에 의해 과평가된 평균값을 얻을 수 있다. 특히 데이터의 값이 작은 수로 나누어서 만들어지는 경우 자주 발생하는데, 분모가 너무 작으면 나누기를 한 결과 값이 급격히 커져 원래의 평균보다 큰 평균값을 얻을 수 있어, 정규화시킨 값이 작게 된다. 데이터의 중간값(median)이란 N 개의 데이터를 오름차순으로 정렬하였을 때 [N/2]에 위치하는 데이터의 값을 의미한다. 만약 N 이 홀수이면 N = 2k + 1 로 표시되는 자연수 k 에 대하여 k+1 번째 큰 값이 중간값이 되고, 만약 N 이 짝수라면 중간값을 결정하는 몇 가지 옵션이 존재하는데, 주로 N = 2k 를 만족하는 k에 대하여 k-1, k+1 번째로 큰 수의 평균을 중간값으로 사용한다. 이렇게 중간값을 구한 후 위의 식 1에서 E(d) 대신 그 중간값을 빼주면서 처리하면 중간값을 이용한 정규화가 된다.
Quantile 정규화
Quantile 정규화는 p quantile 데이터를 오름차순으로 정렬하였을 때 p*data number에 해당하는 데이터를 말한다. quantile이 유용하게 사용되는 경우는, 주어진 분포가 가정하고 있는 분포와 유사한 것인지를 판단하는 Q-Q plot이다. 흔히 말하는 '상위 몇 %' 에 해당하는 값이 quantile과 비슷한 의미이다.
Q-Q 정규화란 여러 데이터 set의 분포를 비슷하게 만들어 주는 작업으로, 두 data set D1과 D2가 있을 때, D1과 D2를 오름차순으로 정렬하였을 때 p%에 위치하는 데이터는 모두 같은 값을 갖도록 해 주는 방법이 quantile 정규화이다. D1, ..., DN 인 N 개의 data set이 있을 때, 각 data set의 p%에 위치하는 데이터의 값을 교정하는 작업이 quantile 정규화이다. 각 data set이 서로 다른 noise에 의하여 분포의 전체 위치가 변할 가능성이 있는 경우 다음의 순서로 실시한다.
i) N개의 각 데이터를 오름차순으로 정렬한다; ii) 정렬된 데이터의 각 i 번째 데이터를 N 차원 상의 unit diagonal 직선으로 교정한다; iii) 전환된 데이터을 원래의 위치로 배치한다.
데이터를 unit diagonal로 교정하는 단계 ii)는 제2원에 대해서 생각해 보면 (1,1)인 직선, N 차원에서 생각해 보면 (1, 1, ..., 1) 인 직선으로 데이터들을 교정한다는 의미이고, 교정하는 값은 주로 평균값을 사용한다. 그렇게 하여 새로운 값이 할당되면, 그 값을 원 데이터에서 원래의 값의 위치로 옮겨준다.
정렬된 데이터에서, 정렬된 순위가 같은 데이터들이 같은 값을 갖도록 하고, 다시 데이터들만 따로 선정한다. 새로운 값은, 정렬된 순위에 해당하는 데이터들의 '평균값'으로 설정한다. 이렇게 설정된 새로운 값으로 원래의 값들을 대체한다. 다시, 변환된 값의 이전 값이 원 데이터의 순위로 지금 변환시킨 값들을 위치시킨다. 이것은 즉, 변하기 전의 데이터의 값이 변한 후의 데이터의 값으로 대체되는 것을 의미한다. 따라서 결과적으로 최종 데이터이다. 데이터를 각각 오름차순 정렬하여 같은 순위에 해당하는 데이터를 좌표상에 찍는 Q-Q plot 을 그려 보면 quantile 정규화의 효과를 쉽게 알 수 있다.
4) 특징선택
상기 분석모듈(303)은 상기 학습데이터베이스를 구성하는 분자데이터, 결합프로파일의 많은 특징에서 하나 또는 그 이상의 분자에서 중요변수를 찾아 차원을 축소하거나 특성의 변형을 통해 주요 분자들을 찾아내는 특징 선택(Feature Selection) 또는 특징 추출(Feature extraction) 절차를 수행한다.
특징선택의 기능은 입력을 최대한 표현할 수 있도록 상대적인 정보가 있는 도메인별 측정이다. 분류를 위해서는 대부분의 관련 기능을 원시 데이터에서 추출해야 한다. 본 발명은 많은 특징을 지닌 입력 데이터에 대한 분류 문제, 관련 특징선택 방법으로 일반적으로 사용되는 3 가지 특징선택 알고리즘은 ANOVA, PCA, Random Forest 등이 있다.
본 발명에 따른 AptaSSN을 이용한 분석기술은 동일하거나 또는 유사한 정도의 정밀도로 생채분자집단의 생물학적 의미를 분석할 수만 있다면 분석하는 AptaSSN의 수를 상기 특징선택 방법으로 작게 하는 것이 분석의 효율성 측면에서 바람직하다고 할 수 있다.
분자의 생물학적 의미 분석에 대한 각각의 AptaSSN들의 기여도를 분석하고, 분자의 생물학적 의미를 분석할 수 있는 범위 내에서, 분석된 기여도에 기초하여 AptaSSN들을 상기 특징선택 방법으로 선정함으로써 본 발명의 AptaSSN들의 수를 감소시키는 단계를 더 포함할 수 있다.
상기 특징선택 방법으로 선정된 상기 AptaSSN 집단을 합성하여 상기 AptaSSN 집단 분석을 포함하는 방법으로 시료에 포함된 분자들의 생물학적 의미를 분석하기 위해, 상기 AptaSSN과 분자들의 분자데이터, 결합 프로파일을 생성하는 것에 사용할 수 있는 AptaSSN 집단을 제공할 수 있다.
바람직하게, 상기 AptaSSN을 이용한 다중 분자 분석방법을 통해 얻어진 축적된 분석결과로부터, 상기 다중 분자의 생물학적 의미의 분석에 기여하는 특이적인 AptaSSN들을 특징선택 방법으로 결정하는 것을 특징으로 하는 AptaSSN을 이용한 다중 분자 분석방법을 제공한다.
또한, 선정된 차등결합 AptaSSN 집단을 이용하여 생물학적 의미가 있는 집단을 구성하는 시료들의 프로파일을 생성하고 데이터베이스를 구축하여 상기 특징선택 방법으로 각각의 집단을 대표하는 특징을 결정하여 특정 시료가 어느 집단과 유사한 지를 구분하는 목적으로 시료를 구성하는 분자집단에 결합한 AptaSSN 집단에서 생성된 프로파일을 사용할 수 있다.
상기 AptaSSNaCDSS에서 T-검정 기법으로 양성과 음성을 구분리 수 있는 특징 집단, AptaSSN 집단을 선정하였다. T-검정 결과로 유의확률(p-Value)을 구해, 통상적으로 유의수준이 5% 내지 1%와 같거나 작으면 귀무가설을 기각한다.
AptaSSNaCDSS에서 T-검정 기법은 다음과 같다. 유의수준(significance level) 기준은 미리 설정된 값으로써 관측된 유의수준을 판정시 기준 값으로 사용된다. 통상적으로 5% 내지 1%의 값이 사용된다.
Figure pat00006
p-값 ≤ a : 유의수준 a 에서 H0 기각 (통계적으로 유의하다.)
Figure pat00007
p-값 > a : 유의수준 a 에서 H0 기각 못함 (통계적으로 유의하지 않다.)
T-검정의 식은 다음과 같다(식 7, 8 과 9).
T-value = (Difference between group means)/(variability of groups)
Figure pat00008
- (식 7)
Figure pat00009
: 샘플 T의 평균,
Figure pat00010
: 샘플 C의 평균,
Figure pat00011
: 표준 에러(Standard error)
Formula for the standard error of the difference between the means.
Figure pat00012
- (식 8)
Figure pat00013
: T 샘플의 값,
Figure pat00014
: C 샘플의 값,
Figure pat00015
: T 샘플의 크기,
Figure pat00016
: C 샘플의 크기
즉,
Figure pat00017
- (식 9)
AptaSSNaCDSS에서 T-검정 기법으로 양성과 음성을 구분할 수 있는 선정된 특징, AptaSSN에 대하여 계산된 P-value 및 통계 수치 등은 확인하고 선별된 특징에 대한 값 (질병군/비질병군)에 대한 수치의 그래프를 확인할 수 있다.
선정된 특징 평가는 일차적으로 HC(H 기법으로 하였으며 개별 개체들을 순차적, 계층적으로 유사한 개체 내지 그룹과 통합하여 군집화를 수행하는 알고리즘이다. 개체들이 결합되는 순서를 나타내는 트리형태의 구조인 덴드로그램(Dendrogram)으로 구현되어 K-평균 군집화(K-means Clustering)와 달리 군집 수를 사전에 정하지 않아도 학습을 수행할 수 있다. 덴드로그램을 생성한 후 적절한 수준에서 트리를 자르면 전체 데이터를 몇 개 군집으로 나눌 수 있게 된다. HC는 모든 개체들 간 거리(distance)나 유사도(similarity)가 다양한 방법으로 계산할 수 있다.
두 클러스터의 중심점(centroid)를 정의한 다음 두 중심점의 거리를 클러스터간의 거리로 정의하는 centroid 방법(식 10)이 있으며,
d(u,v)=∥cu*?*cv∥2 - (식 10)
여기에서 cu와 cv는 각각 두 클러스터 u 와 v의 중심점이다.
클러스터 u 의 모든 데이터 i 와 클러스터 v의 모든 데이터 j의 모든 조합에 대해 거리를 측정해서 최소값을 구한다. 최소 거리(Nearest Point) 방법(식 11)이라 한다.
d(u,v)=min(dist(u[i],v[j])) - (식 11)
클러스터 u의 모든 데이터 i와 클러스터 v의 모든 데이터 j의 모든 조합에 대해 거리를 측정한 후 가장 큰 값을 구한다. Farthest Point Algorithm 또는 Voor Hees Algorithm이라 한다(식 12).
d(u,v)=max(dist(u[i],v[j])) - (식 12)
클러스터 u의 모든 데이터 i와 클러스터 v의 모든 데이터 j의 모든 조합에 대해 거리를 측정한 후 평균을 구하는 average 방법이 있다(식 13). |u|와 |v|는 각각 두 클러스터의 원소의 갯수를 뜻한다.
d(u,v)=∑ijd(u[i],v[j])|u||v| - (식 13)
선정된 특징 평가는 일차적으로 HC 기법으로 실시하며, 질병군과 비질병군에 대한 상관도는 덴드로그램에서 확인할 수 있다 또한, 거리를 체크하면 각 특징간의 상관도를 확인하여 선정된 특징을 평가하였다. 추가적으로 데이터베이스의 각 결합프로파일들은 클러스터링된 결과를 이용하여 원하는 시료가 어느 군에 속하는지 알 수 있다. 직접 입력을 체크하여 수치를 작성하거나, 특정 시료에 상응하는 파일 (NAP 확장자)을 로팅하고 클러스터링된 데이터베이스 중에서 로팅된 특정 시료와 유사한 집단이 어떤 집단인지에 대한 클러스터링 기능을 사용할 수 있다.
5) 학습
상기 분석모듈(303)의 기계학습은 인공 지능의 많은 부분 중 하나로서 특별히 프로그래밍하지 않고 학습할 수 있는 능력을 부여하고 문제를 해결하기 위한 지침에 관계없이 허용 가능한 양의 데이터로 모델을 구성하여 솔루션의 가치있는 예측을 산출할 수 있다. 결과적으로, 기계학습은 다양한 방법을 사용하여 적응함으로써 학습 데이터베이스를 학습하고 경험으로부터 결과를 향상시키는 다양한 모델을 제시할 수 있다. 기계 학습에는 감독 학습(supervised learning), 비감독 학습(unsupervised learning) 및 반감독 학습(semi-supervised learning) 등이 있다.
감독 학습은 입력 변수와 출력 변수가 이미 결정되고 학습 알고리즘이 입력을 출력에 매핑하는 방법을 학습한다. 즉, 감독 학습 알고리즘은 주어진 입력 x와 원하는 출력 y를 예측하여 예측을 수정함으로써 학습한다. 현재, Linear Regression (LR), K-nearest Neighbors (KNN), support vector machine, decision trees, Naive Bayes classifier 선형 회귀 분석 (LR), K- 가장 가까운 이웃 (KNN), 인공신경망, 인공지능망, 지원 벡터 머신, 의사 결정 트리, Naive Bayes 분류기와 같은 여러 감독 학습 알고리즘이 있다.
비감독 학습은 학습 데이터베이스를 구성하는 데이터가 해당 출력 변수의 정보를 포함하지 않는다. 비감독 학습의 주요 목표는 분포에서 의미있는 패턴을 찾거나 기본 구조를 모델링하여 입력 데이터에 대한 이해를 높인다. 감독 학습과는 달리 학습 프로세스를 제어하는 *?**?*"정답"이나 감독자가 없어 비감독이라고 한다. 알고리즘은 데이터를 해석하기 위해 자신만의 연결을 만들고 새로운 구조를 발견할 수 있다. 비감독 학습의 가장 일반적인 사용은 클러스터 분석이다.
반감독 학습은 감독 학습과 비감독 학습 사이에 배치되며 레이블이 붙은 데이터와 레이블이 없는 데이터에 대한 함수 추정이 포함된다. 반감독 학습의 주요 목표는 비감독 학습을 사용하여 레이블이 없는 데이터에 대한 예측을 하고 이러한 데이터를 감독 학습에 제공하여 새로운 데이터를 예측하는 것이다.
상기 특정선택 과정을 수행한 후, 선택되어진 특징으로 상기 감독 학습으로 학습데이터베이스를 학습하여 상기 분자데이터, 결합프로파일 집단을 구축 데이터베이스로 분류하거나 비감독 학습으로 학습하여 분석시료 집단을 분류하며 상기 학습을 저장하여 특정 결합프로파일이 특정 집단으로 분류할 수 있는 정도를 예측하는 분류기(classifier)를 제조할 수 있다.
학습은 상기 구축된 학습 데이터베이스와 특징선택을 수행한 후, 학습을 수행하여 예측 모델을 생성하는 분류기(classifier)는 선택되어진 특질들을 사용하여 학습 대상 시료 집단을 각 클래스 별로 구분하는 절차로 상기 특징선택 방법으로 선정된 AptaSSN의 평가하는 절차일 수 있으며 이의 평가결과는 10 fold cross validation으로 정확도를 평가할 수도 있다.
본 발명에서 분류기는 인공신경망(Artificial Neural Network)을 사용하였는데, 입력과 출력에 따라 행동을 결정하는 특성 때문에 패턴인식, 함수근사, 분류기법 등 다양한 분야에서 응용되고 있다. 인공신경망은 그 구조는 여러 개의 층(layers), 노드(nodes), 신경망간 연결 가중치로 구성된다. 본 발명에 사용하는 신경망 층간 연결방식은 전향(Feed-forward)방식이다. 입력패턴에 따라 각 노드에 대한 신경망 연결 가중치와 활성화 함수를 이용하여 출력값을 산출하였다. 생성된 결합정보를 통하여 어떤 일을 처리했을 때 추정한 값과 실제 결과 값이 상이한 경우, 산출된 값을 실제 결과 값과 비교하면서 오차를 줄이는 과정을 반복해서 찾아내는 방식이다.
NGS 시퀀서와 NAPConverter로 생성된 대량의 결합프로파일 데이터를 상기 특징선택 과정으로 선정된 특징 집단, AptaSSN 집단을 사례 기반 기계 학습 추론 시스템에 기반한 프로그램을 이용하여 학습함으로써 보다 정확한 평가할 수 있다.
선정된 특징 집단의 학습은 인공신경망(Artificial Neural Network) 알고리즘으로 구현되는 AptaSSNaCDSS 프로그램이며 구현된 인공신경망의 구조는 아래 <구조도 1>과 같다.
<구조도 1>
Figure pat00018
인공신경망의 입력 레이어(Input layer)의 압타머 특징은 T-검정으로 통해 선정된 압타머의 값이 입력된다. 인공신경망의 은닉층(Hindden layer)는 10개의 노드를 사용한다. 인공신경망의 출력 레이어(output layer)는 2개의 노드를 사용한다. 2개의 노드는 각각 루게릭병의 양성 값과 양성 값을 나타낸다.
AptaSSNaCDSS 에 구현된 forward propagation는 식 14이며 아래와 같다.
Figure pat00019
- (식 14)
인공신경망은 다음 함수로 표현된다.
Figure pat00020
- (식 15)
Figure pat00021
- (식 16)
식 15은 입력층에서 은닉층으로 가는 과장을 나타내며, 각 은닉층의 노드 수만큼 반복하여 계산한다. 여기서 은닉층의 활성함수로 Sigmoid를 사용하였다. 식 16는 은닉층에서 출력층으로 가는 과정을 나타내며, 각 출력층의 노드 수만큼 반복하여 계산한다. 여기서 출력층의 활성함수로 Sigmoid를 사용하였다.
인공신경망의 학습은 Back propagation 과정을 거처야 하며, 이때 손실 함수(Back propagation rule)를 이용한다. 손실 함수는 다음과 같이 표현된다(식 17).
Figure pat00022
- (식 17)
위 식 (15)을 사용하여 네트워크의 가중치를 조정하여 실제 출력을 목표 출력에 가깝게 만들어 각 출력 뉴런과 네트워크 전체의 오차를 최소화한다. 그리고 인공신경망 학습은 다음 식과 같다(식 18).
Figure pat00023
- (식 18)
본 발명의 AptaCDSS은 상기 인공신경망 알고리즘이 적용되어 있으며, 크게 2 단계로 나누어 진행할 수 있다. 인공신경망 학습 및 평가 단계로 나누어 실행하였다.
상기 결합프로파일로 구성된 질병군과 비질병군에 대한 학습 데이터베이스(DB)를 불러오는 DB파일 로드를 수행한다. NAP 파일의 특징 집단이 AptaSSN 레퍼런스의 출현 빈도수의 값이 정규 분포에 가깝게 수치를 변하도록 하는 로그 전환 작업을 수행한다. NAP 파일의 특징인 AptaSSN 레퍼런스의 데이터의 범위 및 분포를 유사하게 만들어 주는 정규화를 수행한다. NAP 파일에서 DB를 잘 구분할 수 있는 AptaSSN 집단, 특징 집단을 선정하는 특징선택을 수행한다. 구축된 학습 데이터베이스에서 선정된 특징 집단, AptaSSN 집단을 인공신경망(Artificial Neural Network, MLP) 알고리즘을 이용하여 학습을 하고, 구성된 DB의 성능을 확인하는 10-Fold cross validation (인공신경망 학습 평가)한다. 구축된 학습 데이터베이스의 인공신경망의 학습 결과를 MOD 형식의 파일로 저장하는 MOD 파일 저장을 수행한다(MOD: 학습결과를 저장한 파일을 뜻한다.).
특정 시료를 상기 개발된 AptaCDSS 프로그램으로 상기 생물학적 의미기반으로 구축된 학습 db를 학습 과정으로 생산되는 값을 유사도라고 하였다. 특정시료의 유사도로 시료를 상기 구축된 특정 DB로 분류하는 기준, cutoff(임계) 값은 상기 AptaCDSS 프로그램의 학습한 결과를 평가하는 10-Fold cross validation 과정에서 생성되는 MOD 파일에 따른 ROC 커브를 이용하여 결정하였다.
상기 학습의 평가 방법인 10-Fold cross validation은 전 학습 세트를 10개의 부분 집합으로 구분하고 9개의 부분 집합을 합하여 학습하고 형성된 학습산물(MOD 파일)로 남아 있는 한 개의 부분집합을 평가하는 과정을 실시한다. 이와 같은 과정을 10회를 실시하여 확보된 10개의 MOD 파일이며 이들을 이용하여 선정된 특징에 의한 학습 세트의 구분 능력 및 예측 능력을 평가할 수 있다. 본 발명에서는 학습 세트를 구성하는 90% 시료를 학습하여 확보한 MOD 파일로 나머지 10% 한 개의 부분 집합을 평가하여 얻은 민감도와 특이도를 이용하여 ROC(receiver operating characteristic) 커브를 작성하여 판단 기준인 특정 유사도로 임계값을 결정하였다. 전체적으로 10개의 MOD 파일에 대한 10개의 임계값을 얻을 수 있으며, 가장 우수한 임상적인 민감도와 특이도가 있는 MOD 파일을 AptaDx 프로그램으로 한다.
Receiver Operating Characteristic(ROC) 곡선은 그 식별 임계값이 변화함에 따라 2 진 분류기 시스템의 진단 능력을 나타내는 그래프이다. 이진 분류기에는 결과가 양수 (p)와 음수 (n)로 분류되는 두 가지 클래스 예측 문제(이진 분류)로 네 가지 가능한 결과가 있다. 실제 값이 p이고 예측 결과가 p일 때 TP(True Positive), 실제 값이 p일 때 예측 결과가 n일 때 FN(False Negative)라고 한다. 그러나 실제 값이 n이고 예측 결과가 p일 때는 FP(False Positive), 반대로 예측 결과와 실제 값이 모두 n일 때 TN(true negative)이 발생한다.
ROC 곡선은 여러 가지 임계값 설정에서 FPR(False Positive Rate)에 대한 실제 TPR(True Positive Rate)을 플롯하여 작성한다. TPR은 기계학습에서 민감도 또는 탐지 확률이며, FPR(False Positive Rate)은 오경보 확률로 [1- 특이성]으로 계산할 수 있다. 일반적으로 민감도 및 특이도 모두에 대한 확률 분포가 알려진 경우 y 축상에 민감도의 누적 분포 함수에서 임계 값까지의 확률 분포 아래 영역 대 x 축상의 [1- 특이성]의 누적 분포 함수를 플로팅하여 ROC 곡선을 생성할 수 있다.
ROC는 기준이 변경될 때 두 가지 작동 특성 (TPR 및 FPR)을 비교하기 때문에 상대적 작동 특성 곡선이라고도 한다. 분류 모델(분류자 또는 진단)은 특정 클래스/그룹 간의 매핑으로 분류기 또는 진단 결과는 실제 값 (연속 출력) 일 수 있으며, 이 경우 클래스 간의 분류기 경계는 임계값에 의해 결정된다. 또는 클래스 중 하나를 나타내는 개별 클래스 레이블이 될 수 있다.
가능한 가장 좋은 예측 방법은 100% 민감도와 100% 특이성을 나타내는 ROC 공간의 왼쪽 위 모서리 또는 좌표 (0,1)에 포인트를 생성한다. (0,1) 점은 완벽한 분류라고도 한다. 랜덤한 추측은 (양과 음의 기본 속도에 관계없이) 왼쪽 아래부터 오른쪽 위 모서리까지 대각선 (차별없는 선)을 따라 점을 부여한다. 랜덤 추측의 직관적인 예는 동전을 뒤집는 것이다. 표본의 크기가 증가함에 따라 무작위 분류기의 ROC 점은 대각선 방향으로 향하게 된다. 균형 잡힌 동전의 경우, 포인트 (0.5, 0.5)가 된다.
대각선은 ROC 공간을 나눈다. 대각선 위의 점은 좋은 분류 결과를 나타낸다 (무작위보다 낫다). 선 아래의 점은 나쁜 결과를 나타낸다 (임의의 것보다 나쁨). 일관되게 나쁜 예측 인자의 출력은 좋은 예측 인자를 얻기 위해 단순히 반전될 수 있다.
그래서 ROC curve는 X,Y가 둘다 [0,1]의 범위이고, (0,0) 에서 (1,1)을 잇는 곡선이다. 이때 ROC 커브의 면적이 1에 가까울수록 (즉 왼쪽위 꼭지점에 다가갈수록) 좋은 성능이다. 그리고 면적은 즉, AUC는 0.5~1의 범위를 갖는다(0.5면 성능이 전혀 없음. 1이면 최고의 성능). AUC(AUROC (the Area Under a ROC Curve))는 ROC 커브의 밑면적을 구한 값이며 이 값이 1에 가까울수록 성능이 좋다. 1로 예측하는 기준을 쉽게 잡으면 민감도는 높아진다. 그대신 모든 경우를 1이라고 하므로 따라서 특이도가 낮아진다. 그러므로 이 두 값이 둘다 1에 가까워야 의미가 있다. 그래서 ROC커브를 그릴 때 특이도를 1-특이도를 X축에 놓고, Y축에 민감도를 놓는다. 그러면 x=0일 때 y가 1이면 가장 최고의 성능이고, 점점 우측 아래로 갈수록, 즉 특이도가 감소하는 속도에 비해 얼마나 빠르게 민감도가 증가하는지를 나타낸다. 만약 AUC = 0.5라면, 특이도가 감소하는 딱 그만큼 민감도가 증가하는 것으로, 즉 어떤 기준으로 잡아도 민감도와 특이도를 동시에 높일 수 있는 지점이 없다는 것이다. AUC가 0.5라면, 특이도가 1일때 민감도는 0, 특이도가 0일때 민감도는 1이되는 비율이 정확하게 trade off 관계로, 두 값의 합이 항상 1이다. 그러므로 AUC값은 전체적인 민감도와 특이도의 상관 관계를 보여줄 수 있어 매우 편리한 성능 척도에 기준이다.
예를 들어, 질병이 있는 사람과 건강한 사람들의 혈액 단백질 수치가 정상적으로 각각 2g/dL과 1g/dL로 정의될 수 있다. 의학적 검사는 혈액 시료에서 특정 단백질의 수준을 측정하고 질병을 나타내는 것으로 특정 임계값 이상으로 분류할 수 있다. 실험자는 임계값을 조정할 수 있으며 이는 다시 FPR을 변경한다. 임계값을 높이면 FNR이 줄어들고 곡선에서의 왼쪽 움직임과 일치한다. 곡선의 실제 모양은 두 분포가 얼마나 겹쳐져 있는지에 따라 결정된다.
상기 분석대상 시료 집단은 생물학적 의미에 기초하여 데이터베이스를 구분리 수 있으며 그 구성 최소규모는 30례 이상일 수 있다.
본 발명은 미지 또는 기지의 분자들로 이루어진 생체시료에서 상응하는 분자 각각의 양태에 기초하여 생산되는 결합프로파일을 시료 집단에 대한 생물학적 의미를 기초한 데이터베이스와 상기 특징선택 방법으로 AptaSSN 집단과 분자집단을 선정하고 상기 기계학습언어를 이용하여 학습하는 과정으로 선정된 AptaSSN 집단과 분자집단을 평가하여 바이오마커 개발에 유용하게 사용할 수 있다.
6) 분류
상기 분석모듈(303)의 분류는 상기 구축된 학습 데이터베이스에 대해 특징선택을 수행한 후, 학습을 수행하여 예측 모델을 생성하는 상기 분류기를 실행하여 얻은 최적화 예측모델, AptaDx로 선택되어진 특징들로 평가 대상 특정 시료(또는 사용자)를 각 클래스별로 구분하는 절차로 상기 특징선택 방법으로 선정된 AptaSSN으로 사용자의 클래스를 예측하는 절차일 수 있다.
상기 수집된 모든 시료의 생체정보를 시료의 생물학적 의미에 따라 학습 데이터베이스를 구축하고 상기 특징선택을 실시하고 상기 구축된 학습 데이터베이스를 선정된 특징을 사용한 감독학습으로 생물학적 의미와 연관이 있는 AptaSSN 집단을 평가할 수 있다.
또한, 상기 수집된 시료의 생체정보에서 특징선택을 하고 선택되어진 특징을 사용하여 비감독학습으로 상기 시료 집단을 분류할 수도 있다.
상기 생물학적 의미 결정은 시료의 분자 결합프로파일 분석 결과를 기초하여, 생물학적 의미기반 학습 데이터베이스에 대한 특정 시료의 유사도를 분류기로 결정할 수도 있다. 상기 생물학적 의미기반 학습 데이터베이스를 구성하는 결합프로파일을 참조하여 특정 시료(또는 사용자)의 생물학적 의미를 결정하는 것이다. 즉, 본 발명에서 제시하는 AptaSSN 또는 분자 분석기술을 사용하여 대량의 생체정보를 생산하여 상기 분류기를 이용하여 사용자를 분류할 수 있다.
보다 구체적으로, 본 발명은 병리 조건과 건강한 상태의 시료에 적용하여 각각의 시료에 특이적으로 결합하고 생물학적 의미의 분석에 기여하는 AptaSSN 집단 및 분자집단을 선정할 수 있다. 생물학적 의미의 분석에 기여하는 AptaSSN 집단과 분자집단의 학습 및 분류는 비교하기를 원하는 두 가지 이상의 생리학의 상태를 분석할 수 있는 근거를 제공한다. 따라서 본 발명에 의하면, 새로운 치료 표적이나 진단 도구의 발견에 유용하게 사용될 가능성을 가진다.
7) 내부정도관리 및 생물학적 의미 결정지원 시스템
내부 정도관리 및 생물학적 의미 결장지원 시스템에는 오믹스 기술에서 생산되는 분자데이터의 품질을 확보하기 위한 정도관리분자 그리고 분자데이터로 구성된 학습 데이터베이스를 기반으로 예측모델을 생성하여 특정 시료를 분류하기 위해 분류분자가 필요하다.
본 발명의 목적은, 상기 AptaSSN을 이용한 분류는 생물학적 의미에 따라 구분된 학습 데이터베이스의 각각 시료를 구성하는 분자집단과 AptaSSN 집단의 결합 자료 데이터베이스를 구축한 후, 생물학적 의미의 분석에 기여하는 AptaSSN 집단으로 특정 시료의 분류 과정을 적용함으로써, 목적하는 시험시료 및 대조시료에 대한 분석 효율이 향상되고, 생물학적 의미의 분석에 기여하는 AptaSSN의 분류 방법을 제공할 수 있다.
내부 정도관리 및 생물학적 의미 결장지원 시스템 (1)은 상기 <Ⅱ. AptaSSN의 다중 분석> 항의 내용을 참조하여, (a) 시료에 있는 분자집단과 AptaSSN 집단이 혼합하여 형성된 복합체에서 용출된 AptaSSN 집단을 NGS 시퀀서로 염기서열을 결정하는 단위(도 12의 a); 및 (b) 상기 생산된 NGS 염기서열을 분자데이터, 결합프로파일로 전환하는 단위(도 12의 b)를 포함하는 분자데이터 생산 모듈(100); (c) 상기 <Ⅴ. 2>항의 내용을 참조하여, 상기 구축된 학습 데이터베이스로부터 선정된 내부정도관리분자데이터로 평가 대상 시료에 있는 분자데이터를 내부정도관리하는 내부정도관리 모듈(200); 및 (d) 상기 <Ⅴ. 3>항의 내용을 참조하여, 상기 생산된 분자데이터의 수집과 저장, 학습 데이터베이스의 구축, 전처리, 분류 특징 추출, 학습 및 마지막 내부 정도관리된 유효 시료를 하는 분류의 6개의 주요 단계를 포함하는 생물학적 의미 결정지원 모듈(300);를 포함하여 구성할 수도 있다.
본 발명에서 상기 AptaSSN 라이브러리를 사용하여 생산된 생물학적 의미기반 학습 데이터베이스를 구성하는 시료의 분자데이터를 학습하여 개발된 상기 분류기로 시료 또는 시료를 제공한 환자를 우수한 능력으로 분류하는 AptaSSN 집단을 선정, 평가하고 이에 상응하는 분자집단을 분리할 수 있다.
본 발명은 시료를 구성하는 분자집단을 동시에 분석하여 고차원의 특징을 갖는 방대한 양의 데이터를 생산할 수 있으며 상기 데이터로부터 세포, 조직이나 질병에 관련된 다양한 생물학적 정보를 예측하는 방법 및 장비를 제공하고자한다.
본 발명은 상기 분자데이터가 있는 시료를 대상으로 생물학적 의미를 결정하는 내부정도관리 및 생물학적 의미 결정지원시스템(1)을 제공할 수 있다. 상기 내부정도관리 및 생물학적 의미 결정지원시스템(1)은 상기 생물학적 의미의 결정에 기여하는 AptaSSN 집단과 표적분자집단을 선정하고 평가하는 시스템과 동일할 수도 있다.
상기 내부정도관리 및 생물학적 의미 결정지원시스템(1)에서 제공되는 생물학적 의미 값은 질병이나 다른 상태를 진단, 치료, 완화, 처치, 예방을 목적으로 생물학적 의미에 관한 의사 결정(Decision Making)을 하는 과정을 지원하는 “분류”, “점수”, “지수”를 의미하고, 생물학적 의미가 결정된 시료 또는 시료를 채취한 사람의 임상 정보(Clinical Information) 및 상기 하나 이상의 분자 값들을 수집한 후, 통계학적 기법 또는 기계학습 알고리즘을 이용하여 상기 수집한 정보들로부터 질환을 추론 또는 판별할 수 있도록 하는 생산된 특이적 결과일 수도 있다.
본 발명에서 AptaSSN에 의해 생산되는 결합프로파일 데이터에 대한 생물적인 의미의 기준에 따라 유용한 AptaSSN을 결정할 수도 있으며 그 생물학적 의미는 예시적으로 진단이지만 이에만 국한된 것이 아니다.
상기 분석시료 집단에 대한 생물학적 의미 분석에 기여하는 AptaSSN을 결정하는 일렬의 공정으로 결정된 차등결합 AptaSSN 집단을 이용하여 각각에 상응하는 표적단백질을 분리 정제, 동정하여 바이오마커 발견을 할 수 있다.
분자집단으로 이루어진 시료 집단에서 각각 시료의 분자집단과 AptaSSN 집단의 복합체에서 생성되는 결합프로파일을 구성하는 정보를 분석하여 분자 기반으로 상기 시료 집단을 분류할 수도 있다. 비감독(Nonsurpervised) 학습을 사용하여 구현할 수 있다.
본 명세서에 기술된 방법들에 따라 선정된 AptaSSN은 특정분자와의 해리상수(Kd)가 2.0x10-9미만이고 상기 해리상수와 다른 분자 해리상수의 비 즉, 특이도가 5이상인 핵산인 압타머들을 포함하고 있으며 상기 AptaSSN는 바이오마커의 개발, 진단 및 치료 방법 범주내에서 유용하다.
상기 생산되는 결합프로파일을 가지고 학습을 수행하여 생물학적 의미 결정 지원 모델을 생성하는 모듈은 선택되어진 특징들을 적합한 분류기를 통해 생물학적 의미에 대한 각 클래스 별로 분류하는 절차이다.
상기 생물학적 의미는 상기 시료 또는 시료를 채취한 사람의 생리적인 변화를 의미하고, 상기 임상검사 값에 상응하여 예방, 진단, 치료, 완화와 처치의 건강관리를 목적으로 의사 결정(Decision Making)을 하는 과정에 필요한 정보일 수도 있다.
상기 시료의 분자집단에 대한 결합프로파일에 기초하여 생물학적 의미 결정 방법은 특정 시료와 생물학적 의미기반 데이터베이스의 유사도일 수도 있으며 상기 생물학적 의미기반 데이터베이스를 구성하는 시료들의 임상 정보를 참조하여 생물학적 의미를 결정할 수도 있다. 보다 구체적으로 살펴보면, 병리 조건과 건강 조건의 시료의 다중의 분자에 특이적으로 결합하고 상기에서 결정된 생물학적 의미의 분석에 기여하는 AptaSSN을 이용하여 검사 시료가 병리 조건과 건강 조건인지를 분류할 수 있다. 
본 발명에 따른 AptaSSN 제조방법은 생물공학, 의학, 생물학 그리고 생화학의 분야에 응용된다. 본 발명의 응용은 인간 건강 상태, 동물 및 식물 관리에 최종적인 목적이 있다. 본 발명은 바이오마커 개발, 치료 수단과 진단 목적의 분자를 식별하기 위해 다중의 생물학적인 생체시료(예, 시험시료와 대조시료) 각각에 결합하는 AptaSSN 라이브러리를 비교분석하여 선택적인 AptaSSN을 개발하고 이에 결합하는 분자를 이용하여 생물학적인 시료를 식별함으로써 가능하다.
진단 또는 검정 장치, 예를 들면, 하나 또는 그 이상의 그 장치의 고상 표면에 고정된 AptaSSN을 가진 칼럼, 테스트 스트립 또는 바이오칩 또한 제공된다. 상기 장치의 표면에 점착 유지된 M-AptaSSN 복합체를 형성하는 고상 표면과 접촉하는 표적분자에 AptaSSN이 결합되도록 위치할 수 있어서 표적을 포획하고 검출하도록 해 주며, 선별적으로 표적을 정량할 수 있다. (동일하거나 다를 수 있는) 일렬의 AptaSSN은 상기 한 장치에 제공될 수 있다.
다양한 유형의 분자로 구성된 시료에 있는 분자집단에 대한 AptaSSN의 결합이 표적분자 및 AptaSSN의 연장된 상호작용의 존재, 부재, 함량 혹은 농도를 검출하고, 표적을 검출하는데 용이하도록 하는데 사용될 수 있는 진단 방법에 유용한 것이다. 유사한 이점이 차등 AptaSSN이 시험관내(in vitro) 또는 생체내(in vivo) 조영 방법에 사용될 경우 제공될 수 있다. AptaSSN과 M의 연장된 상호관계 또한 상기 연장된 상호관계가 예를 들어 표적분자 또는 하위 신호전달 단계반응(downstream signaling cascade)을 보다 길게 활성화 혹은 억제함으로써 개선된 치료 효과를 제공한다.
본 발명에 기재된 임의의 방법의 제품이고, 즉 테스트 장소에서 평가될 수 있는 분석결과이거나, 만일 원한다면 그것은 평가 및 원격지(remote location)에 있는 관계자와의 의사소통을 위하여 다른 장소로 이송될 수 있다. 본 발명에 사용된 것으로서, "원격지(remote location)"는 결과가 얻어진 곳과 물리적으로 다른 장소를 말한다. 따라서, 상기 결과는 서로 다른 방, 서로 다른 빌딩, 서로 다른 도시의 일부, 서로 다른 도시 등으로 보내질 수 있다. 데이터는 예를 들어, 팩스, 우편, 일일배달(overnight delivery), 이메일, ftp, 보이스 메일 등과 같은 임의의 적절한 수단에 의해 전달될 수 있다.
정보를 "전달(Communicating)"하는 것은 적절한 전달 경로(예를 들면, 사설 또는 공중 네트워크)를 통하여 전자 시그널로서 정보를 나타내는 데이터의 전달을 말한다. 아이템을 "전송(Forwarding)"하는 것은 아이템을 물리적으로 또는 (가능하다면) 다른 방법으로 수송하는 것이든 간에, 한 장소에서 다음 장소로 아이템을 이송하는 임의의 수단을 말하고, 최소한 데이터인 경우에는, 그 데이터를 이송하거나 의사소통하는 매체를 물리적으로 수송하는 것을 포함한다.
본 발명의 권리범위는 위에서 설명된 실시예에 한정되지 않고 청구범위에 기재된 바에 의해 정의되며, 본 발명의 기술분야에서 통상의 지식을 가진 자가 청구범위에 기재된 권리범위 내에서 다양한 변형과 개작을 할 수 있다는 것은 자명하다.
*본 발명은 분자집단으로 이루어진 시료를 보다 효율적으로 분석할 수 있고 생물학적 의미의 분석에 기여하는 바이오마커 및 리간드를 동시에 개발하는 방법, 장치 및 그들의 용도를 제공한다. 본 발명에 따른 방법 및 장치는 바이오마커의 발굴 및 연구를 위한 도구의 설계와 개발 및 AptaSSN-기반 치료법의 개발뿐만 아니라 진단적 적용에 널리 유용하다.
도 1은 임의의 염기서열을 포함하는 출발 라이브러리로부터 제조된 단일가닥핵산(SSN) 라이브러리로 다양한 유형의 생체분자로 구성된 시료에 있는 생체분자(BM) 집단에 특이적이고 유의하게 결합하는 양의 차이가 있는 단일가닥핵산(SSN) 집단 및 이에 상응하는 분자를 선정하는 방법을 제시하는 도면이고,
도 2는 결합 SSN 집단으로 생체분자집단으로 이루어진 시료로부터 표적분자를 분리, 동정하는 방법을 제시하는 도면이고,
도 3은 다양한 유형의 분자로 구성된 시료를 대상으로 한 AptaSSN 다중 분석은 제조된 AptaSSN 집단에 제1 태그를 부가하여 현탁 상태 제1 고체지지체(FSS)를 사용한 AptaSSN-FSS 복합체 라이브러리를 제조한다. 상기 제조한 복합체로 분자을 포획하여 제1 분리를 한다, 상기 수확한 복합체의 분자에 제2 태그를 부가하여 고정 상태 제2 고체지지체(SSS)와 복합체를 형성한다. 상기 형성된 복합체를 제2 분리하고 결합 AptaSSN을 용출하고 이를 증폭하는 분석 단계를 포함하는 방법으로 실시할 수 있다.
도 4는 출발 단일가닥핵산의 구조로 고정영역-가변영역-고정영역으로 구성된 출발 단일가닥핵산의 구조에 대한 도면이고,
도 5는 출발 라이브러리를 주형으로부터 DS 올리고뉴클레오티드 라이브러리 제조를 위한 프라이머이고,
도 6는 RNA SSN 라이브러리 제조의 주형인 DS 올리고뉴클레오티드의 제조에 필수적인 프라이머 쌍(T7 프라이머와 DS 프라이머 C2')DP 대한 도면이고,
도 7은 결합 SSN 라이브러리의 균등 또는 차등 공정을 상기 PCR 방법으로 실시할 경우 상기 결합 SSN은 차등와 균등 공정에 필요한 프라이머 쌍의 결합위치를 제공하는 한 도면이고,
도 8은 결합 SSN 라이브러리의 균등 또는 차등 공정을 상기 PCR 방법으로 실시할 경우 상기 결합 SSN은 차등와 균등 공정에 필요한 프라이머 쌍의 결합위치를 제공하는 다른 예시에 대한 도면이고,
도 9는 결합 SSN 라이브러리의 균등와 차등 공정을 수행하는 라이게이션 방법은 특정서열을 포함하며 시험시료의 DS DNA 결합 SSN에 라이게이션하여 테스터1과 테스터2를 제조하는아댑터에 대한 도면이고,
도 10은 시료에 있는 분자집단과 SSN 라이브러리로부터 결합 SSN, 실험군과 대조군에 대한 결합 SSN 프로파일, 차등결합 SSN 평가 및 선정과 표적분자의 동정을 목적으로 먼저, 상기 출발 핵산 라이브러리에서 SSN 라이브러리를 제조하는 예시적인 도면이고,
도 11은 사용하는 AptaSSN 특이적 프라이머와 NGS 라이브러리 제작용 프라이머를 결합하여 제조한 AptaSSN 집단의 NGS 라이브러리 제작용 FXRP 프라이머를 제작하는 도면이고,
도 12는 차등결합 AptaSSN 집단의 선정을 위한 분자 데이터인, 결합프로파일, 즉 상기 라이브러리에서 특정시료를 구성하는 분자집단과 형성된 복합체에서 분리된 AptaSSN 집단의 염기서열과 출현빈도, 생산을 목적으로 분석시료를 구성하는 분자집단과 선정된 AptaSSN 집단을 반응시켜 분자와 AptaSSN 복합체 집단을 형성하며 상기 형성된 복합체 집단으로부터 AptaSSN 집단을 분리하는 공정에 대한 도면 (a) 및 상기 분리된 AptaSSN 집단으로부터 시쿼싱 라이브러리를 구축하는 공정에 대한 도면(b)이고,
도 13은 SSN-FSS 비드 집단(a) 또는 nitrocellolose disc(b)을 이용하여 분석대상 시료들에 대한 결합프로파일을 생성하고 생물학적 의미를 기준으로 데이터베이스를 구축하는 도면이고,
도 14는 시료를 구성하는 복수 집단에 유의하게 결합의 양적 차이가 있는 AptaSSN 집단을 확보하여 그 특징을 규명하고 이에 결합하는 분자를 규명하는 방법으로, 결합 SSN에 결합하는 분자를 분리, 동정하는 방법은 제시하고 있으며 결합 SSN들을 이용하여 특이적으로 결합하는 분자를 분리하고 이 복합체를 PAGE-SDS 젤에서 전기영동을 하여 단백질 표적밴드를 확인한다. 확인된 단백질 밴드를 절단하여 단백질을 추출한 후, MALTITOF-TOF로 단백질을 동정하는 단계를 통해, 결합 SSN에 특이적으로 결합하는 분자를 확인하는 과정을 도식하는 도면이고,
도 15는 시료에 있는 분자집단에서 결합 SSN 결합(a) 및 AptaSSN 집단(b)으로 획득한 단백질 추출물의 용액 기반 단백질 분해 소화과 단백질의 제1원 (1D) SDS-PAGE 분리, 연속 겔 영역의 절제 및 각 겔 영역에서 단백질의 단백질 분해 소화를 수반하는 GeLC(one-dimensional sodium dodecyl sulfate-polyacrylamide gel electrophoresis 다음에 liquid chromatography을 실시하는 기술) 분석에 대한 도면이고,
도 16은 AptaSSN 유체 자성 비드 장치에 대한 도면이고,
도 17은 NGS 기술을 이용하여 단백질 및 핵산 데이터를 동시에 생산하는 과정에 대한 도면이고,
도 18은 내부 정도관리 및 생물학적 의미 결정 지원시스템(1)의 구성에 대한 도면이고,
도 19는 분자데이터 생산 모듈(100)의 구성에 대한 도면이고,
도 20은 내부정도관리 모듈(200)의 구성에 대한 도면이고,
도 21은 생물학적 의미 결정지원 모듈(300)의 구성에 대한 도면이고,
도 22는 생물학적 의미 결정지원 모듈(300)에서 실시하는 학습과 평가의 단계에 대한 도면이고,
도 23은 Agilent DNA 1000 Kit 및 Bioanalyzer를 사용하여 제작한 NGS 용하여 라이브러리의 크기 및 완결성은 확인한 결과에 대한 도면이고,
도 24는 시험시료에서 준비된 결합 SSN 라이브러리와 대조시료에서 준비된 결합 SSN 라이브러리를 구성하는 5395개의 결합 SSN의 염기서열과 출현빈도의 비율을 비교한 도면이고,
도 25는 생물학적 의미 결정지원 모듈(300)에서 선정된 특징으로 계층 클러스터링한 결과에 대한 도면이고,
도 26은 생물학적 의미 결정지원 모듈(300)에서 선정된 특징의 분포에 대한 도면이고,
도 27은 일련번호 768 결합 SSN의 시험시료인 소세포폐암 환자의 혈청과 대조시료인 비소세포폐암 환자의 혈청에 대한 결합정도를 평가한 결과, 소세포폐암 환자의 혈청에만 특이적으로 반응한 결과에 대한 도면이고,
도 28은 생물학적 의미 결정지원 모듈(300)의 입력모듈(302)은 생물학적 의미를 기준으로 따라 구축된 폐암유무 학습세트 DB과 평기세트 DB를 구축하고 먼저, 학습세트 DB에 대한 시료내는 Min-Max Normalization, 시료간에는 Qauntile Normalization을 실시하였으며, 정규화된 DB에 대해 one-way ANOVA를 실시하여 특징선택을 실시하여 분류분자(특징) 집단을 선정하였으며 선택되어진 분류특징 집단의 분포에 대한 도면이고,
도 29은 선택되어진 분류특징 집단의 일차 평가로 학습 시료에 대해 클러스터링 기법으로 분석한 결과에 대한 도면이고,
도 30는 선택되어진 분류특징 집단의 이차 평가로 기계학습 분류기를 사용하여 학습하고 10-fold cross validation 방법으로 평가한 결과에 대한 도면이다.
하기의 예는 단지 실례를 목적으로 제공되며, 첨부된 청구항에 정의된 본 발명의 범위를 제한하는 것은 아니다.
앞서 말한 것들은 다양한 구현들 및 예시들에 관하여 명세서를 설명한 것이다. 어떠한 특정 구현, 예시 또는 특정 구현 또는 예시의 구성 요소도 청구항의 어떤 중요한, 필요한 또는 필수 구성 요소 또는 특징으로서 구성될 수 없다.
다양한 변형 및 치환이 하기의 청구항에 기재된 것과 같은 명세서의 범위를 벗어나지 않는 기재된 실시예로 만들어질 수 있다. 도면과 실시예를 포함하는 명세서는 제한적인 것보다는 설명하기 위한 수단으로 간주되며, 모든 이러한 변형 및 치환은 명세서의 범위 내에 포함되는 것으로 의도된다. 따라서, 본 명세서의 범위는 실시예에 의해서라기 보다는 첨부된 청구항 및 그것들의 법적 동등물에 의해 결정될 수 있다. 예를 들어, 임의의 방법 또는 제법 청구항에 기술된 단계들은 임의의 실행가능한 순서로 실행될 수 있으며, 임의의 실시예, 예시 또는 청구항에 존재하는 순서로 제한되지 않는다.
실시예
구입한 시약
HEPES, NaCl, KCl, EDTA, EGTA, MgCl2 및 Tween-20은 Fisher Biosciences(미국)로부터 구입하였다. 8000 분자량의 덱스트란 설페이트 나트륨 염(Dextran sulfate sodium salt (DxSO4))을 Sigma-Aldrich 사(미국)로부터 구입하고, 교환기로 적어도 20시간 동안 탈이온수에 대해 투석하였다.
KOD EX DNA 중합 효소는 Merk사(미국)로부터 구입하였다.
염화 테트라 메틸 암모늄(Tetramethylammonium chloride) 및 CAPSO(3-(Cyclohexylamino)-2-hydroxy-1-propanesulfonic acid)는 Sigma-Aldrich에서 구입하였고 streptavidin phycoerythrin (SAPE)은 Moss Inc.(미국)에서 구입하였다. 4-(2-아미노에틸)-벤젠술포닐플루오라이드 염산염 및 4-(2-Aminoethyl)-benzenesulfonylfluoride hydrochloride(AEBSF)은 Gold Biotechnology(미국)에서 구입하였다. Streptavidin으로 코팅된 96- 웰 플레이트(피어스 스트렙타비딘 코팅 플레이트 HBC, 투명 96-웰, 제품 번호 15500 또는 15501)는 Thermo Scientific 사(미국)로부터 구입하였다. NHS-PEG4-바이오틴(EZ-Link NHS-PEG4-Biotin, 제품 번호 21329)은 Thermo Scientific 에서 구입하여 무수 DMSO에 용해시킨 후 일회용 분취 량으로 동결 보관하였다. 효모 tRNA(Life Technologies사, 미국)를 사용하였다.
변형 DNA SSN 라이브러리에서 결합 SSN 집단의 선정은 dT대신에 소마로직 사(미국)에서 구입한 5-(N-benzyl carboxamide)-2-deoxyuridine (Bn-dU) 5-(N- 벤질카르복스아미드)-2-데옥시우리딘(Bn-dU) 또는 5-[N-(1-naphthylmethyl)carboxamide]-2-deoxyuridine (Nap-dU) 5-[N-(1-나프틸메틸) 카르복스아미드]-2-데옥시우리딘 (Nap-dU)으로 이루어진 무작위 40개의 염기로 구성된 변형 DNA SSN 라이브러리를 사용하였다.
모든 C5 위치 변형된 시티딘 (dC) 및 우리딘(dU) 트리포스페이트 (변형된 dNTP) 및 포스포르아미다이트는 이전에 보고된 바와 같이 합성되었다. PCR 등급 천연 뉴클레오티드 트리포스페이트 dATP, dTTP, dCTP 및 dGTP는 Thermo Fisher Scientific으로부터 수득 하였다.
출발 라이브러리 그리고 정방향 및 역방향 프라이머를 주문 합성하였다(TriLink BioTechnologies, 미국).
버퍼
완충액 SB18은 NaOH로 pH 7.5로 조정된 40 mM HEPES, 101 mM NaCl, 5 mM KCl, 5 mM MgCl2 및 0.05 % (v/v) Tween 20로 구성된다. 완충액 SB17은 1mM trisodium EDTA가 첨가된 SB18이다.
완충액 PB1은 NaOH로 pH 7.5로 조정된 10 mM HEPES, 101 mM NaCl, 5 mM KCl, 5 mM MgCl2, 1 mM trisodium EDTA 및 0.05 % (v/v) Tween-20으로 구성된다.
CAPSO 용출 완충액은 100 mM CAPSO pH 7.5 및 1M NaCl로 구성된다. 중화 완충액은 500 mM HEPES, 500 mM HCl 및 0.05 % (v / v) Tween-20로 구성된다. 달리 언급하지 않으면, 모든 단계는 상온에서 실시되었다.
시료 준비
생물적인 정의가 명확한 시료를 서울아산병원(IRB 승인번호: 2015-0607)에서 수집하여 본 발명에 사용하였다. 본 발명에 사용한 혈청은 폐암 및 비폐암 폐질환자에서 채혈한 혈액에서 추출하였다.
시료를 제조하기 위해, 전혈을 레드 탑 튜브(red top tube)에 보관하여야 한다. 전혈을 채취한 후, 혈액이 30분 동안 응고하도록 테스트 튜브를 상온에서 온전하게 처리한다. 이후, 냉장 원심 분리기에서 10분 동안 1,000 내지 2,000xg으로 원심분리하여 혈청과 혈전을 분리한다. 원심분리후, 상층부의 혈청을 즉시 청결한 튜브로 이동한다. 시료는 처리 과정에서 2 내지 8°C 온도로 유지한다. 혈청이 현장에서 분석되지 않으면, 상기 혈청을 즉시 소량 시료로 분주하여 영하 20°C 이하에서 저장한다. 냉-해동 주기는 많은 혈청 성분에 치명적이므로 피하는 것이 중요하다. 용혈성, 황달성, 또는 고지혈성 시료는 특정 테스트를 무효화할 수 있다.
실시례 1. 출발 단일가닥핵산 및 프라이머 구조
도 4에 제시한 바처럼, 분자집단으로 이루어진 생체시료(시험시료 및 대조시료)와 반응시킬 SSN 라이브러리 제조를 위한, 상기 <구조식 1>구조의 출발 라이브러리(염기서열 1) (무작위 단일가닥핵산들)를 제조를 하였다(한국, 바이오니아).
먼저 상기 <구조식 1> 구조의 출발 라이브러리를 구성하는 단일가닥핵산(염기서열 1)는 도 4에 도시 된 바와 같이, SSN를 5'-5'고정서열-가변서열-3'고정서열-3'으로 구성하였다.
상기 <구조식 1> 구조의 SSN 염기서열:
5'-CCACGCTGGGTGGGTCN 40 GGACAAAGAGAGAAGAGAAAGAG-3' (염기서열 I)
(여기에서 밑줄 친 염기배열은 출발 라이브러리의 고정된 부위이며, 가변서열인 40개 염기의 N40은 각 위치에 A, G, T, C 등의 염기들이 같은 농도로 존재함을 의미한다.)
도 5와 도6을 참조하면, 상기 출발 라이브러리를 주형으로 하여 PCR 방법로 DS DNA 라이브러리를 제조할 수 있다. 이때 사용되는 프라이머는 도2와 도3에 도식된 바와 같이, DS 프라이머 C1는 <구조식 1>의 5'고정서열의 염기서열(염기서열 2)이고, T7 프라이머 T7 (염기서열 3)는 <구조식 1>의 5'고정서열과 박테리오파지 T7의 RNA 폴리머아제를 위해 프로모터 염기서열의 융합서열(염기서열 3)이며, DS 프라이머 C2'는 <구조식 1>의 3'고정서열의 상보적인 서열이다
DS 프라이머 C1:
5'-CCACGCTGGGTGGGTC- 3' (염기서열 2)
T7 프라이머 T1:
5´-TAATACGACTCACTATAGGGCCACGCTGGGTGGGTC-3´ (염기서열 3)
DS 프라이머 C2':
5'-CTCTTTCTCTTCTCTCTTTCTCC-3' (염기서열 4)
상기와 같이 제조된 <구조식 1>구조의 출발 라이브러리를 주형으로 상기 T7 프라이머 T1 및 상기 DS 프라이머 C2'로 PCR (Polymerase Chain Reaction) 공정을 통해 T7 프로모터가 있는 DS DNA(염기서열 5)는 아래와 같으며 하기 PCR 산물(염기서열 4)로 생체외 전사를 하여 제조된 SS RNA 라이브러리를 제조할 수 있다.
상기 프라이머로 PCR 산물의 염기서열:
5´-TAATACGACTCACTATAGGGCCACGCTGGGTGGGTCN 40 GGACAAAGAGAGAAGAGAAAGAG-3' (염기서열 5)
상기 제조된 SS RNA 라이브러리 또는 상기 제조된 SS RNA 라이브러리가 시료를 구성하는 분자를 접촉하여 형성된 M-결합 SSN 복합체 집단에서 분리된 단일가닥 RNA 집단을 대상으로 역전사하여 cDNA를 제조하고 이를 주형으로 PCR하여 이중가닥 DNA 라이브러리를 제작할 수 있다. 상기 과정에서 역전사의 priming 역할을 하는 DS 프라이머 C2' 및 역전사 산물 cDNA 대상으로 PCR에 이용되는 상기 DS 프라이머 C1 및 DS 프라이머 C2'이다.
실시례 2. 변형 RNA SSN 라이브러리 제조
본 실시례에서 생체시료(시험시료 및 대조시료)를 구성하는 분자집단과 반응할 SSN 라이브러리는 변형된 뉴클레오티드인 2'-F-치환 피리미딘을 포함하는 RNA 라이브러리인 바, 실시예1에서 제조된 <구조식 I> 구조의 출발 라이브러리리 및 프라이머들을 이용하여 PCR 및 생체외 전사 방법으로 제조하였다.
PCR은 1,000pmoles 출발 라이브러리, 2,500pmoles DS프라이머 쌍(T7 프라이머 T1, DS 프라이머 C2')을 50mM KCl, 10mM Tris-Cl (pH 8.3), 3mM MgCl2, 0.5mM dNTP(dATP, dCTP, dGTP, 및 dTTP), 0.1U Taq DNA Polymerase (Perkin-Elmer 사, 미국)에서 PCR를 수행한 후, QIAquick-spin PCR 정제 칼럼(QIAGEN Inc., Chatsworth Calif.)으로 정제하였다. T7 프로모터가 있는 DS DNA를 제조하였다.
상기 제조된 DS DNA를 이용하여 2'-F-치환 피리미딘을 포함하는 무작위 변형된 SS RNA 라이브러리는 Durascribe T7 Transcription Kit (EPICENTRE, USA)로 생체외 전사를 수행하여 합성하고 정제하여 제조하였다. 200pmoles DS DNA 전사체, 40mM Tris-Cl (pH 8.0), 12mM MgCl2, 5mM DTT, 1mM spermidine, 0.002% Triton X-100, 4% PEG 8000, 5U T7 RNA Polymerase 그리고 1mM (ATP, GTP) 및 3mM (2'F-CTP, 2'F-UTP)를 37℃에서 6 ~ 12시간 반응시킨 후, Bio-Spin 6 크로마토그래피 칼럼(Bio-Rad Laboratories 사, 미국)으로 정제한 후, UV 스펙트로미터를 이용하여 정제된 핵산의 양 및 그 순수도를 분석하였다.
실시례 3. 변형 RNA 결합 SSN 집단 선정
3-1. SSN-FSS 라이브러리 제조
1) 제1 태그가 부가된 SSN 라이브러리 제조
얼음에 30% PEG와 DMSO를 제외한 모든 키트 구성 요소를 해동하였다. 실온에서 DMSO를 해동시키고 30% PEG를 37℃에서 5 ~ 10분 동안 가열하여 부피가 액체일 때까지 가온시켰다. 가열 블록을 85℃로 조정하였다.
5μL의 SSN 라이브러리를 미세원심분리 튜브에 옮겼다. 85℃에서 3-5 분 동안 SSN 라이브러리를 가열한 후, 얼음에 즉시 SSN 라이브러리를 놓았다. SSN 라이브러리는 2 차 구조를 완화시키기 위해 가열해야 할 수도 있다. 또한 ~ 25 % DMSO의 존재 하에서 SSN 라이브러리를 가열하면 중요한 제2 구조를 갖는 SSN 라이브러리의 효율이 증가할 수도 있다.
표 1에 열거된 순서대로 성분을 첨가하여 대조 시스템 또는 시험용 SSN 라이브러리에 대한 표지 반응을 준비하였다.
SSN 라이브러리에 제1 태그 부가 반응
Component Volume (μL) Final Concentration (Amount)
Nuclease-free Water 3 ---
10X RNA Ligase Reaction Buffer 3 1X
RNase Inhibitor 1 1.33U/μL (40U)
SSN Library 5 1.67μM (50pmol)
Biotinylated Cytidine (Bis)phosphate 1 33.3μM (1nmol)
T4 RNA Ligase 2 1.33U/μL (40U)
30% PEG 15 15%
Total 30 ---
30% PEG는 추가된 마지막 시약이며 조심스럽게 반응 혼합물에 30% PEG를 피펫으로 추가 후 새로운 피펫 팁을 사용하여 연결 반응을 혼합하였다.
염기서열 구조체(1)인 SSN 라이브러리에 대해 16℃에서 2시간 동안 반응하였다. 라이게이션은 효율성을 높이기 위해 밤새 처리가 필요할 수 있다. 70 μl의 nuclease-free water를 라이게이션 반응에 첨가하였다.
100μl의 클로로포름:이소아밀 알코올을 각 반응물에 첨가하여 RNA 리가제를 추출하였다. 혼합물을 가볍게 섞은 다음 미세 원심분리기에서 고속에서 2-3 분간 원심분리하여 상을 분리하였다. 조심스럽게 상단 (수용액층)을 취하여 새로운 튜브로 옮겼다. SSN 라이브러리에 대한 바이오틴(biotin)를 부가하여 염기서열 구조체(2)인 Biotin-SSN 라이브러리를 제조하였다.
각 Biotin-SSN 라이브러리의 스톡 농도는 4 nM이었다. Biotin-SSN 라이브러리 스톡 믹스를 SB17 완충액으로 4 배 희석시키고 95℃에서 5 분간 가열한 후 사용 전에 15 분 동안 37℃로 냉각시켰다. 스트렙타비딘 비드를 사용하기 전에 150 mL 완충액 PB1로 2 회 세척 하였다.
2) SSN-FSS 라이브러리 제조
1xSB17, Tw(40 mM HEPES, 102 mM NaCl, 1mM EDTA, 5mM MgCl2, 5 mM KCl, 0.05% Tween-20)에 녹인 133μL의 현탁 상태 제1 고체지지체(FSS), Streptavidin-Coupled Dynabeads(Thermo Fisher Scientific, 미국)를 튜브에 넣었다. 대략 1.1x Bio-SSN 라이브러리(모든 AptaSSN가 3' 말단에 바이오틴 부분을 포함한다)을 볼텍싱하여 해동시켰다.
1.1x Biotin-SSN 라이브러리를 그 후 10분간 끓이고, 30초 동안 볼텍싱하여 20분간 수조(water bath)에서 20℃로 냉각하여, 100 μL의 1.1x Bio-SSN 라이브러리를 상기 Streptavidin-Coupled Dynabeads가 있는 튜브에 첨가하였다. 상기 혼합물을 빛으로부터 보호하고, 850 rpm으로 설정된 셰이커 상에서 20분간 25℃에서 처리하여 Bio-SSN 라이브러리의 제1 태그 바이오틴 부분과 FSS, Streptavidin-Coupled Dynabeads의 제1 포획성분 avidin 부분이 반응하여 형성된 현탁 상태 SSN-FSS 라이브러리를 제조하였다.
상기 현탁 상태 SSN-FSS 라이브러리가 있는 튜브를 원심분리하여 용액을 제거하였다. 190μL의 1x CAPS 전세척 버퍼(50 mM CAPS, 1 mM EDTA, 0.05% Tw-20, pH 11.0)를 첨가하고, 상기 현탁 상태 SSN-FSS 라이브러리를 흔들면서 1분간 처리하였다. 상기 CAPS 세척 용액을 그 후 원심분리를 통해 제거하였다. 상기 CAPS 세척을 그 후 한번 더 반복하였다.
상기 현탁 상태 SSN-FSS 라이브러리가 있는 튜브에 190μL의 1xSX17, Tw를 첨가하고, 상기 현탁 상태 SSN-FSS 라이브러리를 흔들면서 1분간 처리하였다. 1xSB17, Tw를 그 후 원심분리에 의해 제거하였다. 추가로 190μL의 1xSX17, Tw를 참가하고, 상기 현탁 상태 SSN-FSS 라이브러리를 흔들면서 1분간 처리하였다. 1xSB17, Tw는 그 후 원심분리(1000x g에서 1분)에 의해 제거하였다.
상기 현탁 상태 SSN-FSS 라이브러리가 있는 튜브에 150μL의 보관 버퍼(storage buffer)(150 mM NaCl, 40 mM HEPES, 1 mM EDTA, 0.02% sodium azide, 0.05% Tween-20)를 첨가하여 현탁 상태 SSN-FSS 비드 라이브러리를 정제하였다. 상기 튜브를 조심스럽게 밀봉하여 사용할 때까지 4℃의 어두운 곳에 보관하였다.
이들 용액을 영하 20°C에서 장기 보관하였다. 분석하는 날, 각 현탁 상태 SSN-FSS 라이브러리는 10분 동안 37°C에서 해동하여 10분 동안 끓는 수조에 두고 20분 동안 25°C로 식혀서, 각 단계 사이에 활발한 혼합이 일어났다.
가열-냉각 후, 각각의 2x 현탁 상태 SSN-FSS 라이브러리 55ul을 수작업으로 96-웰 PCR 플레이트에 피펫팅하고 튜브를 호일로 밀봉하였다.
3-2. 분석시료 준비
영하 80°에서 보관된 동결 100% 혈청 시료를 5분 동안 25°C의 수조에 넣었다. 해동한 시료를 얼음위에 두어 천천히 와류가 일도록 두고 이후 다시 얼음위에 두었다.
혈청(100㎕ 분취량에서 -80℃로 저장됨)을 25℃ 수조에서 10 분 동안 해동시킨 다음, 시료 희석 전에 얼음에 저장하였다. 시료를 8 초 동안 가볍게 볼텍싱하여 혼합하였다. 0.6 mM MgCl2, 1 mM Trisodium EDTA, 0.8 mM AEBSF 및 사용하는 SSN 농도의 5배의 효모 tRNA이 보충된 0.94x SB17에 희석하여 6 % 혈청 시료 용액을 제조하였다. SB17에서 6 % 혈청 스톡 용액의 일부를 10 배 희석하여 0.6 % 혈청 스톡을 만들었다. 6 % 및 0.6 %의 스톡은 각각 높은 및 낮은 농도의 분석 물을 검출하는데 사용된다.
20ul 피펫을 사용하여 3ul 시료를 96-웰 PCR 튜브에 넣은 후, 각 튜브에는 적정 시료 희석액 72ul(1xSB17, 0.02% 트윈-20)을 넣어 4% 시료 용액(최종 2x)을 준비하였다. 여러 번 피펫팅하여 시료들을 혼합한 후, 4% 시료 용액 4ul을 이동시켜 적정 시료 희석 용액 76ul과 혼합하여 0.2% 시료 용액(최종 2x)을 얻었다. 마지막으로, 0.2% 시료 용액 6ul을 이동시켜 시료 희석액 54ul와 혼합하여, 0.02% 시료 용액(최종 2x)을 얻었다. 시료 희석 용액을 준비한 후, 각 시료 55ul을 평형 결합을 위해 새 PCR 튜브에 넣었다.
2%, 0.1% 및 0.01% 혈청 위한 현탁 상태 SSN-FSS 비드 라이브러리를 1xSB17(40mM HEPES, 102mM NaCl, 5mM KCl, 5mM MgCl2, 1mM EDTA), 0.05% 트윈-20에서 2x 농도로 제조하였다.
3-3. SSN-FSS 라이브러리와 시료 반응
상기 55ul의 현탁 상태 가열-냉각 SSN-FSS 라이브러리 용액을 부피 55ul의 적정 시료 희석 용액이 있는 튜브에 첨가하였다. 분자집단으로 구성된 시료와 현탁 상태 SSN-FSS 라이브러리를 피펫팅하여 혼합하고 호일 커버로 밀봉하였다. 이후 상기 튜브를 3 시간 30분 동안 37°C의 처리기에 복합체의 형성 반응을 진행하여 SSN의 제1태그와 FSS 비드에 있는 제1 포획성분이 결합한 현탁 상태 M-SSN-FSS 복합체의 형성 반응을 수행하였다.
복합체 형성 반응 후, 상기 반응 혼합액 100ul이 있는 튜브를 자석이 있는 스탠드에 놓아두거나, 원심분리하여 용액 층을 피펫으로 조심스럽게 제거하였다. 상기 튜브는 1mM 덱스트란 황산과 500uM 바이오틴을 보충한 300ul의 완충액 PB1으로 4번 세척하였다. 이후 튜브를 300ul의 완충액 PB1으로 3번 더 세척하여 M-SSN-FSS 복합체 집단을 제조하였다.
3-4. 결합 SSN 집단 선정
상기 M-SSN-FSS 복합체 집단이 있는 튜브에 완충액 PB1에서 새로 준비한 1mM NHS-PEG4-바이오틴 용액 150uL을 첨가하여 5분 동안 흔들면서 처리하여, 제2 태그를 현탁 상태 M-SSN-FSS 복합체의 분자에 바이오틴을 부가하였다.
상기 튜브를 원심분리하여 액체는 흡인하여 제거하고 튜브는 10mM 글리세린이 보충된 300ul의 완충액 PB1으로 8번 세척하였다. 1mM 덱스트란 황산을 보충한 100ul의 완충액 PB1을 첨가하였다.
상기 튜브에 있는 현탁 상태 제2 태그가 부가된 M-SSN-FSS 복합체 집단이 들어 있는 완충액을 제2 고체지지체(SSS), 스트렙타비딘이 코팅된 플레이트의 웰에 옮겼다. 상기 현탁 상태 M-SSN-FSS의 제2태그와 플레이트에 고정된 제2 포획성분이 결합하는 제2 분리는 10분 동안 800 rpm 및 상온의 서모믹서에서 실시하여 고정 상태 SSS-M-SSN-FSS 복합체를 제조하였다.
제2 분리를 실시한 후, 상기 플레이드의 웰에서 액체를 피펫으로 조심스럽게 제거하고, 25%의 Propylene Glycol or 30% glycerol을 보충한 300ul의 완충액 PB1으로 8번 세척하였다. 웰을 300ul의 SB17T 완충액으로 5번 세척하고, 최종 세척액을 흡인하였다.
상기 튜브를 원심분리하여 액체는 흡인하여 제거하고 튜브는 10mM 글리세린이 보충된 300ul의 SB17T 완충액으로 8번 세척하였다. 1mM 덱스트란 황산을 보충한 100ul의 SB17T 완충액을 첨가하였다.
복합체 해리 속도가 느린 서열을 우선적으로 선택하기 위해 하기와 같은 엄격한 세척용액 방법을 실시하였다. 이것은 고정 상태 SSS-M-SSN-FSS 복합체 용액에 2-5 라운드에서 포획 15분전에 SB17T를 20배, 6-7 라운드에서 포획 60분전에 SB17T를 400배, 8라운드에서 포획 60분전에 10 mM 덱스트란 설페이트를 함유하는 SB17T를 400배로 부가하여 달성하였다.
100ul의 CAPSO 용출 완충액을 첨가하고 상기 고정 상태 SSS-M-SSN-FSS 복합체를 5분 동안 흔들면서 용출하였다. 상기 플레이트의 웰에서 90ul의 용액을 수작업으로 10uL 중화 완충용액을 담고 있는 PCR 플레이트의 웰들에 옮겨 SSN-FSS 집단을 확보하였다. 또는, 상기 고정된 SSS-M-SSN-FSS 복합체 집단이 있는 플레이트의 웰을 5분 동안 가열하여 결합 SSN를 용출하였다.
도 1에 제시한 바처럼, 상기 <실시례 1>항에 기초하여 상기 결합 SSN 집단을 대상으로 RT-PCR을 실시하는 증폭단계를 수행하였다. 상기 고정된 SSS-M-SSN-FSS 복합체 집단에 있는 SSN를 대상으로 DS 프라이머 C2'로 priming하여 역전사(RT)하여 cDNA를 제조하고 T7 프라이머 T1와 DS 프라이머 C2' 쌍을 사용하여 PCR을 수행하였다.
상기 <실시례 2>항에 기초하여 상기 T7 프로모터가 있는 증폭산물인 DNA 주형을 대상으로 체외전사를 수행하여 결합 SSN 라이브러리를 제조하였다.
상기 제조한 결합 SSN 라이브러리를 대상으로 상기 <실시례 3-1항>의 염기서열 구조체(1)인 SSN-FSS 라이브러리 제조에서 제1 태그 부가부터 <실시례 3-4항>의 결합 SSN 집단 제조까지의 선택과정을 수행할 수 있다.
상기의 선택과 증폭 과정을 다수회 반복하여 결합 SSN 라이브러리를 제조할 수도 있다.
생물학적인 생체시료에 결합하는 결합 SSN 라이브러리는 생체시료에 포함된 분자의 다양성을 있는 그대로 반영하여야 하는 것이 이상적임으로, 1회의 선택과 증폭만을 수행하는 대신 세척단계를 다양화하여 생물학적인 시료의 다양성을 잘 반영하는 결합 SSN 라이브러리를 제조하였다. 상기 시험시료 및 대조시료에서 제조된 라이브러리를 전자는 시험시료의 M-SSN 및 후자는 대조시료의 M-SSN 라이브러리라 지칭하였다.
상기 세척한 복합체에 있는 SSN를 대상으로 DS 프라이머 C2'로 priming하여 역전사(RT)하여 cDNA를 제조하고 DS 프라이머 C1와 DS 프라이머 C2' 쌍을 사용하여 PCR을 수행하여 혈청단백질에 결합하는 SSN 집단에 대한 DNA 집단을 증폭 제작하였다. 상기 확보한 PCR 산물은 시퀀스 라이브러리 제작 목적 핵산 시료이다.
실시례 4. 변형 RNA 결합 SSN의 염기서열 및 출현빈도 결정
상서 제조된 결합 SSN 라이브러리 또는 차등과 균등 공정으로 제조된 결합 SSN 라이브러리를 구성하는 결합 SSN들을 도 17의 분자데이터 생산 모듈(100)의 NGS 스퀀서(104)로 fastaq 파일을 생성하고 비교모듈(106)를 구성하는 NAPConverter 프로그램으로 결합 SSN의 염기서열 및 출현빈도, 결합프로파일을 결정하였다.
도 19의 의 분자데이터 생산 모듈(100)의 제1 반응구(101)와 분리구(102)에서 확보한 변형 RNA, 결합 SSN 집단을 주형으로 제2 반응구(103)에서 도 11에 제시한 FXRP 프라이머로 RT-PCR하여 NGS 라이브러리를 제작하여 얻은 DNA 집단을 대상으로 Ion Torrent (104, ThermoFisher 사)를 사용하여 분석하였다. 
도 11을 참조하여, 상기 단일가닥핵산 라이브러리와 분자집단으로 이루어진 시료를 반응시켜 형성된 복합체에서 용출되는 결합 SSN 집단 또는 상기 AptaSSN 라이브러리와 분자집단으로 이루어진 시료를 반응시켜 형성된 복합체에서 용출되는 AptaSSN 집단은 P5(Ion A) 과 P7(Ion P1) Sequencing adaptors를 PCR-방법을 이용한 부가반응을 수행하여 Ion Torrent 차세대 시퀀싱 (NGS)을 위해 준비하였다.
시료를 단일 시퀀싱 실행으로 다중화할 수 있도록 정방향 프라이머를 통해 시료마다 고유한 8개 염기서열 기본 바코드를 포함시켰다. FX(정방향) 프라이머(5'-P5 Adaptor-기본 바코드-SELEX primer-3')는 다음과 같이 설계되었다.
5'-ATAT-CCATCTCATCCCTGCGTGTCTCCGACTCAG-XXXXXXXX-CCACGCTGGGTGGGTC-3'
RP(역방향) 프라이머(5'-P7 Adaptor-SELEX primer-3')는 다음과 같이 설계되었다.
5'-TTTTTTTT-CCTCTCTATGGGCAGTCGGTGAT-CTCTTTCTCTTCTCTCTTTCTCC-3'
제2 반응구(103)에서 반응을 구체적으로 살펴보면 다음과 같다. 상기 실시례에서 확보한 변형 RNA인 결합 SSN 집단 용액 36 ㎕ 을 따서 0.2 ㎖ PCR 튜브로 옮긴다. 0.2 ㎖ PCR 튜브에 옮긴 반응액 36 ㎕에 5X RT buffer 10 ㎕, Reverse primer 1 ㎕를 첨가하였다. 65℃에서 5분 반응시킨 후, 상온에서 10분간 반응시켰다. 추가적으로 10mM dNTP 2 ㎕, M-MLV RTase 1 ㎕ (200 u/㎕) 첨가하고 37℃에서 30분, 95℃ 5분간 반응시켰다.
RT 반응이 끝난 산물 50 ㎕중 4 ㎕를 주형으로 표 2의 시약을 첨가하였다.
PCR 혼합물
성분 부피(㎕)
RT 산물 4
10X Pfu reaction buffer 5
10mM each dNTP 1
Primer mixture(Forward+Reverse) 4
D.W. 35.5
Pfu enzyme 0.5
Total 50
PCR을 표 3의 PCR cycle program에 따라 수행하였다. 만약 다음 과정을 바로 진행하지 않을 경우에는 냉장(5±5℃) 보관하거나 장기보관 시 -20℃ 이하에서 보관한다.
PCR cycle program
순서 단계 온도 시간 사이클
1 Pre-denaturation 95℃ 2분 -
2 Denaturation 95℃ 20초 12사이클
3 Annealing 56℃ 30초
4 Extension 72℃ 1분
5 Post-extension 72℃ 5분 -
상기 PCR 산물은 Qubit fluorometer(Invitrogen 사)로 정량하였다. 반응이 끝난 PCR 산물을 1.5 ㎖ 튜브에 옮겨 담는다. 시료 용량의 1.8 배 (90 ㎕)의 HiAccu 비드를 시료에 넣어주고 3~5회 피펫팅하여 DNA와 비드가 잘 섞이도록 하고, 스핀-다운한 후 5분간 실온에서 반응시킨다. 스핀-다운후, magnetic rack에 시료가 들어있는 튜브를 장착하고 3분간 둔다. 비드 펫렛을 제외한 나머지 상층액을 제거한다. Magnetic rack에 장착된 시료 튜브에 70% 에탄올 300 ㎕를 넣어준다. 30초간 실온에서 반응시킨 후, 튜브를 천천히 돌려주며 골고루 세척이 되도록 2회 반복하며 Pellet이 흩어지지 않도록 주의하면서 상층액을 제거한다. 상기 세척 과정을 한번 더 반복한다. 남아있는 에탄올을 완전히 제거하기 위해 스핀-다운한 후, magnetic rack에 다시 장착하고 남아있는 에탄올을 조심스럽게 제거한다. Magnetic rack에서 시료 튜브의 뚜껑을 열어놓은 채 비드를 건조 시킨다. 이 때 3~5분 이상 뚜껑을 열어놓지 않도록 한다. Magnetic rack에서 튜브를 뺀 후, Nuclease Free Water 21 ㎕를 넣어 3~5회 피펫팅하고 DNA가 잘 분리될 수 있도록 10초 동안 혼합하였다. 스핀-다운한 후, magnetic rack에 튜브를 장착하고 1분 정도 기다린 후, 상층액이 투명해지면 새로 준비한 1.5 ㎖ 튜브에 상층액을 18 ㎕를 덜어서 옮겨 NGS 라이브러리를 준비하였다.
준비된 라이브러리 산물을 Qubit(Invitrogen 사)의 메뉴얼에 따라 Qubit dsDNA HS Reagent으로 농도를 측정하였다. NGS 반응을 위해 최소 100 pmole의 농도가 필요하며, 이 농도가 확보되지 않을 경우 결과를 신뢰할 수 없다. 또한, 라이브러리의 크기 및 완결성은 Bioanalyzer(Agilent 사)의 메뉴얼에 따라 Agilent DNA 1000 Kit(Agilent 사)를 이용하여 확인하고 그 결과를 기록하였다(도 23).
상기 제조된 NGS 라이브러리를 Amicon Ultra 0.5 컬럼 (Millipore)에서 추가로 농축시켰다. 최종 샘플을 Ion Torrent PGM 318 칩 시퀀싱 실행 (Thermo Fisher Scientific)을 하였다.
도 19의 분자데이터 생산 모듈(100)을 구성하는 Ion S5 XL Sequencer(104) 실행은 제작사의 메뉴얼에 따라, 먼저, 운영 계획을 수립 및 변수 설정을 실시하고 Ion Chef system 세팅과 운영을 하였다. Ion Chef 라이브러리 시료 튜브에 희석한 각각의 라이브러리를 25 ㎕씩 주입하였다. 2개의 라이브러리 시료 튜브의 뚜껑을 열고 25 ㎕씩 희석된 각각의 라이브러리를 시약 카드리지의 A 위치, B 위치에 로팅하였다. 장비를 세업한 후 반응시켰다. 반응이 완료되면 chip을 Ion Chef 장비에서 분리하여 즉시 염기서열 과정을 진행한다. Ion Chef system chip 로팅 과정이 끝나기 약 40분전에 Ion S5 Sequencer 또는 Ion S5 XL Sequencer를 초기화시켰다.
Ion S5 초기화를 진행하고 염기서열 결정을 시작하였다. 염기서열 결정이 완료되면, 자동으로 정제 절차가 진행되고 정제가 완료되면 메인 화면으로 돌아오게 된다. NGS 라이브러리의 염기서열 분석결과는 Torrent Browser에서 확인하였다.
상기 염기서열분석 결과는 Ion Torrent(104, ThermoFisher 사) 소프트웨어 품질 분석을 한 것이다. 결합 SSN을 이용한 시료에 결합프로파일은 추가적으로 내부적으로 개발된 소프트웨어인 NAPConverter(106)를 사용하여 다운 스트림 분석을 수행하여 생성하였다.
도 19의 분자데이터 생산 모듈(100)의 비교모듈(106)를 구성하는 NAPConverter는 크게 아래 5가지 프로세스에 따라 분석을 하여 NAP파일을 생성한다. 먼저, FASTAQ 파일을 분석하여 퀄리티가 낮은 시퀀스를 제거하는 작업인 Qaulity filter 공정을 수행한다.
상기 NAPConverter(106)의 Matching 단계는 도 11를 참조하면, 참조서열(105)에 있는 단일가닥핵산의 <구조식 1> 구조에서 5‘고정서열(16 bp), 가변서열(40 bp) 및 3’ 고정서열(23 bp)를 포함하는 서열의 79 염기 쌍 (bp)의 패턴을 기준으로 비교하는 과정으로 상기 패턴과 일치하지 않는 임의의 서열을 제외하였다. 패턴 매칭 동안 각 고정 상태서열에서 하나의 불일치는 허용하였다. 고정 상태서열 서열은 다운 스트림 분석을 위해 40 bp의 가변서열 서열만 남기고, 필터링 후에 제외하였다. 역방향 보충 태그는 순방향 서열 태그와 결합하였다. 또한 참조서열(105)에는 염기서열이 알려진 결합 SSN 집단으로도 구성할 수 있다.
상기 단계가 적용된 FASTAQ 파일을 분석하여 고정 상태서열의 염기서열이 유지된 리드만 남도록 검사하는 작업을 수행한다. 상기 단계가 적용된 FASTAQ 파일을 분석하여 리드의 염기서열 길이를 검사하는 작업을 수행한다. 상기 단계가 적용된 FASTAQ 파일을 분석한 염기서열에 대해 참조서열 DB(105)와 비교하고 동일한 서열이 없으면 새로운 결합 SSN 서열로 분류하는 작업을 수행한다. 모든 염기서열의 분류를 상기와 같이 수행하면서 각각의 결합 SSN의 출현빈도를 증가시키는 round enrichment analysis 방법으로 계산하여 NAP 파일을 생성한다.
비교모듈(106)의 NAPConverter의 Matching 단계 및 카운트 라운드 결과로 상기 라이브러리를 구성하는 특정한 결합 SSN의 염기서열 및 출현빈도를 결정하여 NAP파일, 결합프로파일을 완성하였다. 선정되는 결합 SSN 라이브러리 당 15,000,000 ~ 18,000,000 시퀀스를 분석하였다.
마지막으로, 시험시료에서 준비된 결합 SSN 라이브러리와 대조시료에서 준비된 결합 SSN 라이브러리를 구성하는 5395개의 결합 SSN의 염기서열과 출현빈도의 비율을 비교하였다(도 23).
차등와 균등 공정으로 제작된 결합 SSN 라이브러리를 구성하는 결합 SSN 염기서열 분석은 상기 결합 SSN 라이브러리에서 결정된 결합 SSN 염기서열로 구축된 참조 염기 서열(reference sequences)과 시퀀스를 EBI 웹 사이트 (http://www.ebi.ac.uk/Tools/msa/clustalo/)에 있는 Omega Cluster로 클러스터링 분석하였다.
이상의 결과로 시험시료 및 대조시료를 비교 분석하거나 각각을 대표할 수 있는 결합 SSN은 총 1,149개를 결정하였다.
실시례 5. 변형 DNA 결합 SSN의 염기서열 및 출현빈도 결정
상기 출발 라이브러리에 대해 각 뉴클레오티드 (dA/dG/dC/dT)의 비율은 1:1:1:1 (각각 25 %)를 사용하여 PCR (Bio-Rad)에 의해 PCR을 증폭하여 프라이머 연장 반응의 주형으로 사용하였다.
상기 변형 DNA SSN 라이브러리의 구조는 중앙부위에 무작위 40 개의 염기(N40)가 있고 양쪽 말단 부위에 PCR 프라이밍 영역이 있는 (염기서열 1)이다.
상기 프라이머 연장 반응은 1X SQ20 완충액에 10 μM 주형, 12 μM 5' 바이오틴-프라이머, 0.5 mM 천연 또는 변형된 dNTP 및 0.25 U / mL KOD 폴리머라제 (exo-)를 첨가하여 진행하였다. DNA 폴리머라제를 첨가하기 전에 혼합물을 가열 냉각하고, 반응을 68 ℃에서 6-8 시간 동안 수행한 다음, 10 ℃에서 냉각시키고 이중체를 실온에서 2 시간 동안 일차 고체지지체(FSS)인 고용량 MyOne-streptavidin paramagnetic beads (Invitrogen, 카탈로그 번호 65001)에서 포획하여 변형 또는 변형되지 않은 무작위로 이중 DNA-FSS 복합체 라이브러리를 준비하였다.
상기 제조된 이중 DNA-FSS 복합체 라이브러리를 선택 완충액 (SBT : 40mM HEPES, pH 7.4; 102mM NaCl; 5mM KCl, 5mM MgCl2 0.05 % 트윈 20)로 수회 세척 하였다. 이어서, 비드를 5 분 동안 20mM NaOH에 현탁시켜 변형된 센스 가닥을 용리하였다. 용리용액은 700mM HCl, 180mM HEPES, pH 7.4, 0.45 % 트윈 20의 필요한 부피로 pH 7.4로 중화시킨 다음 Amicon Ultra-15 (Millipore) 원심 분리 필터로 약 250 μL의 잔류 부피로 농축하였다. 상기와 같이 변형 램덤 DNA SSN-FSS 복합체 라이브러리를 제조하였으며, 이를 “SSN-FSS 복합체”라고 하였다.
상기 <실시례 3-2>에서 준비된 시료, 복수의 단백질(M)으로 구성된 혈청과 ≥1000 pmol (~ 1015 개의 독특한 서열) 상기 제조된 SSN-FSS 복합체를 SB17T 완충액 (40mM HEPES, pH 7.5, 102mM NaCl, 5mM KCl, 5mM MgCl2, 1mM EDTA, 0.05 % 트윈 20)에서 혼합하여 M-SSN-FSS 복합체를 형성시켰으며, SB17T 완충용액으로 세척하여 미결합한 혈청단백질과 SSN-Biotin 복합체를 제거하였다.
상기 M-SSN-FSS 복합체 집단이 있는 튜브에 완충액 PB1에서 새로 준비한 1mM NHS-PEG4-바이오틴 용액 150uL을 첨가하여 5분 동안 흔들면서 처리하여, 제2 태그를 현탁 상태 M-SSN-FSS 복합체의 분자에 바이오틴을 부가하였다.
상기 형성된 M-SSN-FSS 복합체 집단은 제조업체의 프로토콜에 따라 NHS-PEG4-biotin (Thermo Scientific, Pittsburgh, PA, catalog no. 21329)와 라이신 잔기와 공유 결합에 의해 비오티닐화할 수 있다.
상기 형성된 M-SSN-FSS 복합체 집단(50㎕ 중 300pmol)을 SB17T 완충액 (40mM HEPES, pH 7.5, 102mM NaCl, 5mM KCl, 5mM MgCl2, 1mM EDTA, 0.05 % 트윈 20)이 있는 Sephadex G-25 MicroSpin 컬럼으로 교환하였다. NHS-PEG4-biotin을 30 μM이 되도록 첨가하고, 반응물을 4 ℃에서 16 시간 동안 인큐베이션하였다. 미 반응 NHS-PEG4-biotin을 Sephadex G-25 MicroSpin 컬럼으로 제거하였다.
상기 튜브에 있는 현탁 상태 제2 태그가 부가된 M-SSN-FSS 복합체 집단이 들어 있는 완충액을 제2 고체지지체(SSS), 스트렙타비딘이 코팅된 플레이트의 웰에 옮겼다. 상기 현탁 상태 M-SSN-FSS의 제2태그와 플레이트에 고정된 제2 포획성분이 결합하는 제2 분리는 10분 동안 800 rpm 및 상온의 서모믹서에서 실시하여 고정 상태 SSS-M-SSN-FSS 복합체를 제조하였다.
제2 분리를 실시한 후, 상기 플레이드의 웰에서 액체를 피펫으로 조심스럽게 제거하고, 25%의 Propylene Glycol or 30% glycerol을 보충한 300ul의 완충액 PB1으로 8번 세척하였다. 웰을 300ul의 SB17T 완충액으로 5번 세척하고, 최종 세척액을 흡인하였다.
상기 튜브를 원심분리하여 액체는 흡인하여 제거하고 튜브는 10mM 글리세린이 보충된 300ul의 SB17T 완충액으로 8번 세척하였다. 1mM 덱스트란 황산을 보충한 100ul의 SB17T 완충액을 첨가하였다.
복합체 해리 속도가 느린 서열을 우선적으로 선택하기 위해 하기와 같은 엄격한 세척용액(Kinetic challenge)을 실시하였다. 이것은 고정 상태 SSS-M-SSN-FSS 복합체 용액에 2-5 라운드에서 포획 15분전에 SB17T로 20배, 6-7 라운드에서 포획 60분전에 SB17T로 400배, 8라운드에서 포획 60분전에 10 mM 덱스트란 설페이트를 함유하는 SB17T로 400배 부가하여 달성하였다.
100ul의 CAPSO 용출 완충액을 첨가하고 상기 고정 상태 SSS-M-SSN-FSS 복합체를 5분 동안 흔들면서 용출하였다. 상기 플레이트의 웰에서 90ul의 용액을 수작업으로 10uL 중화 완충용액을 담고 있는 PCR 플레이트의 웰들에 옮겨 SSN-FSS 집단을 확보하였다.
상기 확보된 SSN-FSS 집단에 대해 각 천연 뉴클레오티드 (dA/dG/dC/dT)의 비율은 1:1:1:1 (각각 25 %)를 사용하여 PCR (Bio-Rad)에 의해 PCR을 증폭시켰다.
상기 증폭된 PCR 산물에 대한 프라이머 연장 반응은 1X SQ20 완충액 (120 mM Tris-HCl, pH 7.8; 10 mM KCl; 6 mM (NH4)2SO4 7 mM MgSO4, 0.1% Triton X-100 and 0.1 mg/mL BSA)에 10 μM 주형, 12 μM 5' 바이오틴-프라이머, 0.5 mM 천연 또는 변형된 dNTP 및 0.25 U / mL KOD 폴리머라제 (exo-)를 첨가하여 진행하였다. DNA 폴리머라제를 첨가하기 전에 혼합물을 가열 냉각하고, 프라이머 연장 반응을 68 ℃에서 6-8 시간 동안 수행하였다.
다음, 10 ℃에서 냉각시키고 프라이머 연장 반응 산물인 이중체를 실온에서 2 시간 동안 일차 고체지지체(FSS)인 고용량 MyOne-streptavidin paramagnetic beads (Invitrogen, 카탈로그 번호 65001) 또는 상자성 Dynabeads® MyOne™ Streptavidin C1 (Thermo Fisher Scientific)에서 포획하여 변형 또는 변형되지 않은 무작위로 DNA SSN-FSS 복합체 라이브러리를 준비하였으며, 이를 “SSN-FSS 복합체”라고 하였다.
프라이머 연장 반응으로 변형된 뉴클레오티드가 포함된 SSN-FSS 복합체를 제조하여 다음 라운드에 사용할 변형된 농축 SSN-FSS 복합체 라이브러리를 제조하였다.
6번째 라운드 후 선택한 상기 변형 DNA SSN 라이브러리와 분자집단으로 이루어진 시료를 반응시켜 형성된 복합체에서 용출되는 결합 SSN 집단 및 초기 출발 라이브러리는 Ion A 과 Ion P1 Sequencing adaptors를 PCR-방법을 이용한 부가반응을 수행하여 Ion Torrent 차세대 시퀀싱 (NGS)을 위해 준비할 수 있으며, 상기 <실시례 4> 항에 따라 실시하여 결합 SSN 집단을 분석하였다.
상서 제조된 결합 SSN 라이브러리 또는 차등과 균등 공정으로 제조된 결합 SSN 라이브러리를 구성하는 결합 SSN들을 도 18의 분자데이터 생산 모듈(100)의 NGS 스퀀서(104)로 fastaq 파일을 생성하고 비교모듈(106)를 구성하는 NAPConverter 프로그램으로 결합 SSN의 염기서열 및 출현빈도, 결합프로파일을 결정하였다.
도 19의 의 분자데이터 생산 모듈(100)의 제1 반응구(101)와 분리구(102)에서 확보한 변형 RNA, 결합 SSN 집단을 주형으로 제2 반응구(103)에서 도 11에 제시한 FXRP 프라이머로 RT-PCR하여 NGS 라이브러리를 제작하여 얻은 DNA 집단을 대상으로 Ion Torrent (104, ThermoFisher 사)를 사용하여 분석하였다. 
실시례 6. 차등 결합 SSN 선정 및 상응하는 표적분자 동정
특정 인간혈청 시험시료를 구성하는 분자에 결합하는 결합 SSN 라이브러리를 상기 NGS를 이용한 결합프로파일 분석 결과로 특정 결합 SSN 라이브러리에서 특정 결합프로파일과 혈청시료를 구성하는 특정 분자의 수와 상관관계가 있음을 알 수 있다.
본 발명의 특정 혈청시료를 구성하는 분자에 결합하는 결합 SSN 라이브러리를 구성하는 결합 SSN의 출현빈도를 반영하는 프로파일은 분자집단으로 구성된 특정 혈청시료의 분자 프로파일(양적인 상태를 종합화한 정보)이다.
도 12를 참조하면, 구체적인 실시과정은 다음과 같다. 먼저, 도 19의 분자데이터 생산 모듈(100)의 제1 반응구(101)에서 <실시례 3> 항에 따라 분자집단과 결합 SSN 집단이 반응한다. 분리구(102)에서 상기 형성된 복합체 집단에서 결합 SSN 집단을 분리하였다. 제2 반응구(103)에서 상기 분리된 올리고뉴클레오티드 집단에 대한 NGS 라이브러리를 제조하였다. NGS 시퀀서(104)에서 상기 제조된 NGS 라이브러리에서 생성된 염기서열이 분석된 정보를 FASTAQ로 저장한다. FASTA는 헤더와 read 단위의 분석된 염기서열 정보를 payload로 가진다. FASTAQ는 FASTA정보에 정확도(quality score) 정보가 추가된 파일 포맷을 의미한다. NGS 시퀀서에서 분석된 염기서열 정보는 FASTAQ로 저장하였고 이를 비교모듈(106)의 NAPConvertor를 이용하여 참조서열(105)과 비교하고 리드를 누적 계수하여 NAP 파일형식으로 변환하였다. NAP 파일은 FASTAQ 정보에서 결합 SSN(리드)의 염기서열과 리드의 출현빈도 즉, 결합프로파일이 저장된 파일 포맷을 의미한다. NAPConverter는 출현빈도를 측정값을 생성하기 위해 일련의 데이터 변환 과정과 리드의 출현빈도를 계산하여 결합프로파일인 NAP 파일을 생성한다.
분석대상 시료 집단에 대한 상기 결합프로파일을 생성하고 분석시료 집단의 생물학적 의미를 기준으로 결합프로파일 DB를 구축하고 구축된 DB를 잘 구분할 수 있는 특징 집단, 결합 SSN 집단을 선정하고 평가하였다.
다양한 혈청단백질에 결합하는 결합 SSN 집단(N=1,149)을 표 4의 폐암 혈청(N=10) 및 비폐암 폐질환자 혈청(N=22)에 반응시킨 후, 수확한 혈청단백질과 결합하는 결합 SSN 집단을 NGS로 결합 SSN의 염기서열을 결정하였다. NGS의 분석 결과를 NAPConvertor로 분석한 결합 SSN(리드)의 염기서열과 리드의 출현빈도를 사용하여 폐암 혈청(N=10) 및 비폐암 폐질환자 혈청(N=22) 시료로 구성된 데이터베이스(N=32)를 구축한다.
폐암과 비폐암 페질환자의 임상정보
폐암 비폐암 폐질환자
성별
남성 10 21
여성 0 1
나이
40~49 1 0
50~59 5 9
60~69 4 11
70~79 0 1
합계 10 22
상기 생산된 결합프로파일로 폐암 및 비폐암 폐질환자를 생물학적 의미 결정지원시스템(300)의 AptaCDSS 프로그램으로 선정된 특징, 결합 SSN의 분포는 도 25이다.
<실시례 3> 항을 참조하면, 상기에서 결정된 1149개의 결합 SSN으로 구성된 결합 SSN 집단을 분석대상 시료와 반응시킨 후 형성된 복합체 집단으로부터 분리된 결합 SSN 집단을 NGS 시퀀서로 분석하고 도 19의 분자데이터 생산 모듈(100)의 비교모듈(106)에서 NAPConverter로 결합프로파일을 생산하였다.
상기 선정된 특징에 의한 계층 클러스터링한 결과는 도 26이며, 도시된 바와 같이 폐암 및 비폐암 폐질환자들은 각각 독립된 클러스터를 형성하고 있음을 알 수 있어 분석 시료에 대한 결합프로파일로 환자들의 구분할 수 있음을 보여주고 있다.
생체시료를 구성하는 분자집단과 결합하는 결합 SSN 집단을 NGS를 실시하여 얻은 분자데이터 프로파일을 탐색 및 분석하여 시험시료인 폐암 및 비폐암 폐질환자 혈청단백질에 특이적으로 결합하는 생물학적 의미의 분석에 기여하는 차등 결합 SSN들을 선정할 수 있다.
이 중에 일련번호 768 결합 SSN의 시험시료인 폐암 환자의 혈청과 대조시료인 비폐암 폐질환자의 혈청에 대한 결합정도를 평가한 결과, 폐암 환자의 혈청에만 특이적으로 반응함을 알 수 있었다(도 27).
실험군별로 구성된 데이터베이스를 비교분석하여 유용한 스폿을 결정하고 이에 상응하는 생물학적 의미의 분석에 기여하는 결합 SSN을 조제하여 상응하는 단백질을 도 13을 참조하여, 분리하여 동정하였다.
선정된 결합 SSN 한쪽에 바이오틴(biotin)을 부착시키고 스트렙타비딘(streptavidin)과 반응시켜 얻은 복합체를 혈청시료와 반응시켜 혈청단백질-결합 SSN 복합체를 분리한 다음 전기 영동하여 형성되는 밴드를 분리하여 혈청단백질을 동정하였다. 선정된 SS올리고뉴클레오티드에 결합하는 단백질을 분리하여 MALDI-TOF-TOF 기기로 단백질의 아미노산서열을 결정할 수 있으며 결합 SSN과 결합하는 혈청단백질의 해리상수(Kd)가 20x10-9미만인 것을 "표적분자"라고 하였다.
실시예 7. 분자데이터 생산
본 발명의 도 18에 제시한 내부 정도관리 및 생물학적 의미 결정지원 시스템(1)은 분자데이터 생산 모듈(100), 내부 정도관리 모듈(200) 및 생물학적 의미 결정지원 모듈(300)을 포함할 수 있다. 상기 분자데이터 생산 모듈(100)은 다양한 유형의 분자로 구성된 시료에 있는 분자집단 또는 유전자의 발현은 당해 분야에 널리 공지된 다양한 기술에 의해 측정할 수 있다.
7-1. AptaSSN 다중 분석법
도 3은 바이오마커 식별을 위한 시료를 분석하는 AptaSSN 다중 분석법을 도해하였다. 본 발명에서는 AptaSSN는 정통적인 SELEX 방법으로 표적분자를 대상으로 선정된 AptaSSN 그리고 상기 시료를 구성하는 분자집단에 결합하는 SSN를 포함하고 있다. 본 발명에서는 AptaSSN와 결합 SSN을 상호 교환적인 의미로 사용하고 있다.
1) AptaSSN-FSS 집단 제조
2%, 0.1% 및 0.01% 혈청을 위한 AptaSSN 집단 용액은 1xSB17, 0.05% 트윈-20에서 2x 농도로 제조하였다. 상기 AptaSSN 집단 용액은 상기 실시례 4에서 결정된 1,149개의 결합 SSN, AptaSSN 집단을 사용하였다
이들 용액을 사용할 때까지 영하 20°C에서 보관하였다. 분석하기 직전에 AptaSSN 집단 용액은 10분 동안 37°C에서 해동하여 10분 동안 끓는 수조에 두고 20분 동안 25°C로 식혀서, 각 단계 사이에 활발한 혼합이 일어났다. 가열-냉각 후, 각각의 2x AptaSSN 집단 용액 55ul을 수작업으로 96-웰 PCR 튜브에 피펫팅하고 튜브를 호일로 밀봉하였다.
<AptaSSN 집단에 제1 태그 부가>
얼음에 30% PEG와 DMSO를 제외한 모든 키트 구성 요소를 해동하였다. 실온에서 DMSO를 해동시키고 30% PEG를 37℃에서 5 ~ 10분 동안 가열하여 부피가 액체일 때까지 가온시켰다. 가열 블록을 85℃로 조정하였다.
5μL의 AptaSSN 집단 용액을 미세원심분리 튜브에 옮겼다. 85℃에서 3-5 분 동안 AptaSSN 집단 용액을 가열한 후, 얼음에 즉시 AptaSSN 집단 용액을 놓았다. AptaSSN 스톡용액은 2 차 구조를 완화시키기 위해 가열할 수도 있다. 또한 ~ 25 % DMSO의 존재 하에서 AptaSSN 집단 용액을 가열하면 중요한 제2 구조를 갖는 AptaSSN 집단 용액의 효율이 증가할 수 있다.
표 5에 열거된 순서대로 성분을 첨가하여 대조 시스템 또는 시험용 AptaSSN 집단 용액에 대한 표지 반응을 준비하였다.
AptaSSN 용액의 제1 태그 부가 반응
Component Volume (μL) Final Concentration (Amount)
Nuclease-free Water 3 ---
10X RNA Ligase Reaction Buffer 3 1X
RNase Inhibitor 1 1.33U/μL (40U)
AptaSSN 용액 5 1.67μM (50pmol)
Biotinylated Cytidine (Bis)phosphate 1 33.3μM (1nmol)
T4 RNA Ligase 2 1.33U/μL (40U)
30% PEG 15 15%
Total 30 ---
30% PEG는 추가된 마지막 시약이며 조심스럽게 반응 혼합물에 30% PEG를 피펫으로 추가 후 새로운 피펫 팁을 사용하여 연결 반응을 혼합하였다.
상기 AptaSSN 용액에 대해 16℃에서 반응을 2시간 동안 처리하여 제1태그를 부가하여 Bio-SSN 라이브러리를 제조하였다. 라이게이션의 효율성을 높이기 위해 밤새 처리를 할 수 있다. 70 μl의 nuclease-free water를 라이게이션 반응에 첨가하였다.
100μl의 클로로포름:이소아밀 알코올을 각 반응물에 첨가하여 RNA 리가제를 추출하였다. 혼합물을 가볍게 섞은 다음 미세 원심분리기에서 고속에서 2-3 분간 원심분리하여 상을 분리하였다. 조심스럽게 상단(수용액층)을 취하여 새로운 튜브로 옮겼다. SSN 라이브러리에 대한 제1태그, 바이오틴(biotin)를 부가하여 Bio-SSN 라이브러리를 정제하였다.
각 Bio-AptaSSN 용액의 농도는 4 nM이었다. Bio-AptaSSN 용액을 SB17 완충액으로 4 배 희석시키고 95℃에서 5 분간 가열한 후 사용 전에 15 분 동안 37℃로 냉각시켰다. 현탁 상태 일차 고체지지체(FSS), 스트렙타비딘 비드를 사용하기 전에 150 mL 완충액 PB1로 2 회 세척 하였다.
<AptaSSN-FSS 집단 제조>
1xSB17, Tw(40 mM HEPES, 102 mM NaCl, 1mM EDTA, 5mM MgCl2, 5 mM KCl, 0.05% Tween-20)에 녹인 133μL의 현탁 상태 제1 고체지지체(FSS), Streptavidin-Coupled Dynabeads(Thermo Fisher Scientific, 미국)를 튜브에 넣었다. 대략 1.1x Bio-AptaSSN 용액 (모든 AptaSSN가 3' 말단에 바이오틴 부분을 포함한다)을 볼텍싱하여 해동시켰다.
1.1x Bio-AptaSSN 용액을 그 후 10분간 끓이고, 30초 동안 볼텍싱하여 20분간 수조(water bath)에서 20℃로 냉각하였다. 100 μL의 1.1x Bio-AptaSSN 용액을 상기 Streptavidin-Coupled Dynabeads가 있는 튜브에 첨가하였다. 상기 혼합물을 빛으로부터 보호하고, 850 rpm으로 설정된 셰이커 상에서 20분간 25℃에서 처리하여 Bio-SSN 라이브러리의 제1 태그 바이오틴 부분과 Streptavidin-Coupled Dynabeads의 제1 포획성분 avidin 부분이 반응하여 형성된 현탁 상태 AptaSSN-FSS 용액을 제조하였다.
상기 현탁 상태 AptaSSN-FSS 용액을 원심분리를 통해 용액을 제거하였다. 190μL의 1x CAPS 전세척 버퍼(50 mM CAPS, 1 mM EDTA, 0.05% Tw-20, pH 11.0)를 첨가하고, 상기 혼합물을 흔들면서 1분간 처리하였다. 상기 CAPS 세척 용액을 그 후 원심분리를 통해 제거하였다. 상기 CAPS로 세척하고 한 번 더 반복하였다.
190μL의 1xSX17, Tw를 첨가하고, 상기 혼합물을 흔들면서 1분간 처리하였다. 1xSB17, Tw를 원심분리에 의해 제거하였다. 추가로 190μL의 1xSX17, Tw를 참가하고, 상기 혼합물을 흔들면서 1분간 처리하였다. 1xSB17, Tw는 원심분리(1000x g에서 1분)에 의해 제거하였다. 1xSB17, Tw를 제거한 후에, 150μL의 보관 버퍼(storage buffer)(150 mM NaCl, 40 mM HEPES, 1 mM EDTA, 0.02% sodium azide, 0.05% Tween-20)를 첨가하여 현탁 상태 AptaSSN-FSS 비드 용액을 정제하였다.
상기 튜브를 조심스럽게 밀봉하여 사용할 때까지 4℃의 어두운 곳에 보관하였다. 2%, 0.1% 및 0.01% 혈청을 위한 현탁 상태 AptaSSN-FSS 용액을 1xSB17(40mM HEPES, 102mM NaCl, 5mM KCl, 5mM MgCl2, 1mM EDTA), 0.05% 트윈-20에서 2x 농도로 제조하였다.
이들 용액을 사용할 때까지 영하 20°C에서 보관하였다. 분석하는 날, 각 현탁 상태 AptaSSN-FSS 용액은 10분 동안 37°C에서 해동하여 10분 동안 끓는 수조에 두고 20분 동안 25°C로 식혀서, 각 단계 사이에 활발한 혼합이 일어났다. 가열-냉각 후, 각각의 현탁 상태 2x AptaSSN-FSS 용액 55ul을 수작업으로 96-웰 PCR 튜브에 피펫팅하고 튜브를 호일로 밀봉하였다.
2) AptaSSN 집단과 시료에 있는 분자집단의 반응
영하 80°에서 보관된 동결 100% 혈청 시료를 5분 동안 25°C의 수조에 넣었다. 해동한 시료를 얼음위에 두어 천천히 와류가 일도록 두고 이후 다시 얼음위에 두었다.
20ul 피펫을 사용하여 3ul 시료를 96-웰 PCR 튜브에 이동시킴으로써, 각 튜브에는 적정 시료 희석액 72ul(1xSB17, 0.02% 트윈-20)을 넣어 4% 시료용액(최종 2x)을 준비하였다. 여러 번 피펫팅하여 시료들을 혼합한 후, 4% 시료 용액 4ul을 취하여 적정 시료 희석액 76ul과 혼합하여 0.2% 시료용액(최종 2x)을 얻었다. 마지막으로, 0.2% 시료용액 6ul을 이동시켜 시료 희석액 54ul와 혼합하여, 0.02% 시료용액(최종 2x)을 얻었다. 시료 희석용액을 준비한 후, 각 시료 55ul을 평형 결합을 위해 새 PCR 튜브로 옮겼다.
상기 55ul의 가열-냉각 현탁 상태 AptaSSN-FSS 용액을 부피 55ul의 적정 시료 희석 용액이 있는 튜브에 첨가하였다. 분자집단으로 이루어진 시료와 AptaSSN-FSS 용액을 피펫팅하여 혼합하고 호일 커버로 밀봉하였다. 이후 상기 플레이트를 3시간 30분 동안 37°C의 처리 과정에서 평형 결합을 수행하여 시료에 있는 각각 분자와 각각 AptaSSN가 결합하여 현탁 상태 M-AptaSSN-FSS 복합체를 형성하도록 하였다.
상기 튜브를 자석이 있는 스탠드에 놓아두거나 원심분리하여 용액 층을 피펫으로 조심스럽게 제거하고, 수확한 M-AptaSSN-FSS 복합체가 있는 튜브는 1mM 덱스트란 황산과 500uM 바이오틴을 보충한 300ul의 완충액 PB1으로 4번 세척하였다. 이후 튜브를 300ul의 완충액 PB1으로 3번 더 세척하였다.
3) 용출된 AptaSSN 집단의 분석
완충액 PB1에서 새로 준비한 제2 태그가 있는 1mM NHS-PEG4-바이오틴 용액 150uL을 상기 세척한 튜브에 첨가하여 5분 동안 흔들면서 처리하여 제2 태그를 M-AptaSSN-FSS 비드 복합체의 단백질에 부가하였다.
상기 현탁 상태 제2 태그가 부가된 M-AptaSSN-FSS 비드 복합체가 있는 튜브를 원심분리하여 액체는 흡인하여 제거한 후, 튜브는 10mM 글리세린이 보충된 300ul의 완충액 PB1으로 8번 세척하였다. 1mM 덱스트란 설페이트를 보충한 100ul의 완충액 PB1을 첨가하였다.
상기 튜브에 있는 제2 태그가 M-AptaSSN-FSS 비드 복합체가 있는 완충액을 제2 포획성분이 있는 제2 고체지지체(SSS), 스트렙타비딘 코팅 플레이트의 웰에 피펫으로 옮겼다. 10분 동안 800rpm 및 상온의 서모믹서에서 실시하여 현탁 상태 M-AptaSSN-FSS 비드 복합체의 제2 태그와 고정 상태 SSS인 플레이트의 제2 포획성분이 결합하여 고정 상태 SSS-M-AptaSSN-FSS 비드 복합체를 형성하는 제2 분리를 수행하였다.
제2 분리를 실시한 후, 상기 플레이트의 웰에서 액체를 피펫으로 조심스럽게 제거하고, 25%의 플로필렌 글리콜 Propylene Glycol 또는 30% glycerol을 보충한 300ul의 완충액 PB1으로 8번 세척하였다. 웰을 300ul의 완충액 PB1으로 5번 세척하고, 최종 세척액을 흡인하였다. 100ul의 CAPSO 용출 완충액을 첨가하고 고정 상태 SSS-M-AptaSSN-FSS 비드복합체 집단으로부터 AptaSSN 집단을 5분 동안 흔들면서 용출하였다. 상기 플레이트의 웰에서 90ul의 시료를 수작업으로 10uL Neutralization buffer을 담고 있는 PCR 플레이트의 웰들에 옮겨 결합 AptaSSN 집단을 수확하였다. 또는, 상기 고정 상태 SSS-M-AptaSSN-FSS 비드복합체 집단이 있는 플레이트의 웰을 5분동안 가열하여 결합 AptaSSN를 용출할 수도 있다.
상기 <실시례 4>에 따라, 상기 고정 상태 SSS-M-AptaSSN-FSS 비드복합체 집단에서 용출된 AptaSSN 집단을 대상으로 DS 프라이머 C2'로 priming하여 역전사(RT)하여 cDNA를 제조하고 DS 프라이머 C1와 DS 프라이머 C2'를 사용하여 PCR을 수행하여 혈청단백질에 결합하는 AptaSSN 집단에 대한 DNA 집단을 증폭 제작하였다. 상기 확보한 PCR 산물은 시퀀스 라이브러리 제작 목적 핵산시료로 사용하였다. 상기 수확한 PCR 산물은 상기 <실시례 4>항과 동일한 과정으로 NGS 분석하였다.
상기 분자데이터 생산 모듈(100)에서 생산된 fastaq 자료를 NAP conveter로 전환된 문서를 내부정도관리 모듈(200)으로 입력할 수 있다.
NGS 장비에서 생산된 FASTAQ 자료를 NAF 전환기를 통하여 기 구축된 1,149 AptaSSN의 염기서열로 구축된 데이터베이스와 비교 분석하여 결합 SSG, AptaSSN의 종류와 출현빈도를 결정하였다.
상기 FASTAQ의 리드는 참조 염기서열로 이루어진 참조 데이터베이스와 일치률은 10~90%이고 바람직하게 40~60%이다.
AptaSSN 다중 검사법으로 생산된 AptaSSN의 종류와 출현빈도로 시료를 구성하는 분자집단을 분석할 수 있다. 시료에 있는 분자의 양은 사용한 AptaSSN가 결합하는 표적분자의 양과 밀접한 관계가 있고 상기 표적분자에 결합한 AptaSSN를 용출하여 NGS 장비로 용출된 AptaSSN를 염기서열 결정한 후 AptaSSN의 출현빈도를 결정하여, 이 출현빈도로부터 시료를 구성하는 분자집단의 양을 결정하였다.
7-2. mRNA 및 miRNA의 분자데이터
EDTA 혈액 샘플을 시험군 시료 및 대조군 시료로부터 수집하고, 수집 후 2시간 이내에 혈장에 대하여 프로세싱하였다. 혈액을 10℃에서 20분 동안 1,300 g로 원심분리하였다. 상청액 (혈장)을 원심분리 튜브로 옮긴 후, 이어서, 10℃에서 10분 동안 15,500 g로 제2 고속 원심분리 단계를 수행하여 세포 파편 및 단편을 제거하였다. 약 1 ml의 혈장을 냉동 바이알로 즉시 3 개의 300-400 μl 분취액으로 분취하고,액체 질소에서 급냉시키고, 사용시까지 -80℃에서 보관한 후 차후 분자데이터 생산 모델(10)으로 mRNA 및 miRNA 프로파일 분석을 위해 -70℃에 보관했다.
1) mRNA 및 miRNA 분석을 위한 RNA 분리
분석시료에서 총 RNA 분리는 MagMAx mirVana total RNA isolation kit 및 King Fisher Flex purification system(Thermo Scientific, 미국)을 사용하여 400 ㎕의 혈장으로부터 하였다. 회수된 최종 총 RNA는 5 내지 25 μg 범위이고 -70 ℃에서 저장되었다. 회수된 총 RNA가 있는 튜브에 1.5 부피의 무수 에탄올을 첨가하고, 혼합물을 miRNeasy Mini kit 칼럼(Qiagen 사, 독일)에 적용시켰다. 세척 후, miRNA를 30 ㎕의 RNase 무함유 물에서 용해시켰다. Agilent 2200 TapeStation 시스템 (Agilent Technologies, 미국)을 사용하여 순도 분석을 위해 각 분취량의 2-4μl를 따로 두고 Nanodrop ND-8000 기기 (Thermo Scientific, 미국)를 사용하여 RNA의 양과 순도를 평가했다. RNA의 순도, 농도 및 무결성을 테스트하여 시퀀싱을 위한 적격 샘플 (RIN, RNA Integrity Number) 값 ≥8.0, 28S / 18S ≥1.5; 기준 향상 없음; 5S 피크 정상)을 사용했는지 확인했다.
2) mRNA 분석을 위한 RNAseq 방법.
TruSeq Stranded mRNA Sample Prep Kit (Illumina, 미국)를 사용하여 cDNA 라이브러리를 제조하였다. 샘플 당 2,500 만 ~ 3,500 만 판독을 생성하는 Illumina 플랫폼에서 50 bp 페어드 엔드 및 스트랜드 특정 시퀀싱이 수행되었다. 상기 분자데이터 생산 모듈(10)에서 생산된 fastaq 자료를 NAP conveter로 전환된 문서를 내부정도관리 모듈(20)으로 입력할 수 있다.
3) miRNA 분석을 위한 RNAseq 방법.
1.5μg의 총 RNA를 취하여 NEBNext® Ultra™ Small RNA Sample Library Prep Kit for Illumina® (NEB, 미국)에 설명된 방법을 사용하여 소형 RNA 라이브러리를 구축했다. 라이브러리를 구축한 후, Qubit 2.0을 사용하여 라이브러리 농도를 테스트하고 1ng / μl로 조정하였다. 삽입물 크기는 Agilent 2100 바이오 분석기로 측정되었다. 제조된 NGS 라이브러리는 Illumina HiSeq2500을 사용하여 고 처리량 시퀀싱을 수행하였다. 라이브러리에서 샘플 당 천만 개의 리드가 생성되었다. 개발된 방법은 RNA 분획의 microRNA (miRNA) 부분을 크게 풍부하게 하도록 설계하였다.
도 18에 제시한 내부정도관리 및 생물학적 의미 결정지원 시스템(1)처럼, 상기 분자데이터 생산 모듈(100)에서 다양한 유형의 분자로 구성된 시료에 있는 핵산 또는 단백질에 대해 분자데이터를 생산할 수 있다. 상기 생산된 분자데이터가 있는 평가 시료는 내부정도관리 모듈(200)에 입력되고 내부 정도관리 규칙으로 정도관리하여 결정된 유효 분자데이터만 생물학적 의미 결정 지원 모듈(300)으로 입력될 수 있다.
실시례 8. 내부정도관리 및 생물학적 의미 결정지원 시스템
도 18의 내부정도관리 및 생물학적 의미 결정지원 시스템(1)은 분자데이터 생산 모듈(100), 내부정도관리 모듈(200) 및 생물학적 의미 결정지원 모듈(300)를 포함할 수 있다. 상기 분자데이터 생산 모듈(100)은 다양한 유형의 분자로 구성된 시료에 있는 분자집단 또는 유전자의 발현은 당해 분야에 널리 공지된 다양한 기술에 의해 측정할 수 있다.
혈청의 단백질 집단은 Dynamic range가 12 order 정도로 풍부도가 높은 단백질이 풍부도가 낮은 단백질의 분석을 저해할 수 있다. 시료 분석은 분석 변화를 최소화하기 위해, 3개 특징 QC 시료를 시료와 함께 측정하였다. 3 특징은 분석법의 검출 범위에서 단백질농도의 고레벨, 중레벨 및 저레벨을 나누어 분석시료를 희석방법으로 준비하였다.
본 발명에서 내부정도관리 분자의 역할은 분석 후 측정한 데이터가 목표한 값에 도달했는지는 확인하여 분석의 품질을 확보할 있게 해준다. 정도관리분자 또한 목표 값이 있어야 하며, 이러한 목표값을 얻기 위해서 반복 실험, Lab간 비교, 실험자간 비교 등을 통해 정확도, 민감도, 특이도 등의 성능지표와 측정치의 목표 값을 산출해내야 한다. 또한 내부정도관리 분자는 분석시 측정값의 변화가 적어야 한다.
1) 데이터베이스 확보
AptaSign 폐암 제품의 경우 실험군을 폐암으로 대조군을 비폐암 폐질환자로 하여 AptaSgin 분석 프로토콜에 따라 NGS 분석 후 생성된 생체정보를 자사 데이터 포맷으로 전환된 데이터가 확보가 필요하다.
2) 내부정도관리분자 선정
시료의 분자데이터를 구성하는 1149개의 AptaSSN 별 평균 및 표준편차를 구한다. 1149개의 AptaSSN별 변동계수(Coefficient of Variation)를 구한다.
변동계수를 오름차순으로 정렬한다. 정렬된 변동계수 상위 1%(1149개 AptaSSN 중 12개)를 선택한다. 선택되어진 12개의 AptaSSN를 평균을 기준으로 오름차순으로 정렬한다. 평균으로 정렬된 AptaSSN를 3개의 구간으로 나눈다(각 구간별 압타머 4개). 각 구간별 선택되어진 AptaSSN는 정도관리 검사시 사용한다.
3) 내부정도 관리방법
내부정도관리의 목적은 검사 중에 발생할 수 있는 분석오차(analytical error)를 사전에 발견위한 것으로 분석오차에는 무작위오차(random error)와 계통오차(systematic error)가 있다.
검사를 무한대로 반복하면 측정값은 평균과 표준편차를 가지는 정규분포를 이루며, 무작위오차는 평균은 같지만 표준편자차가 증가한 오차이며, 계통오차는 표준편차는 같지만 평균이 이동한 오차로 정의할 수 있다.
Westgard Multirules Control Chart은 Levey-Jennings Control Chart를 보완하여 위거부율이 낮으면서 오차발견율은 높도록 고안되었다. 이 방법은 정도관리물질의 측정값을 누적하여 여러가지 관리 규칙에 따라 반정량적으로 평가한다.
Levey Chart 사용하여 웨스트가드 다중규칙 적용시 정도관리분자 수 만큼 Levey Chart가 있어야 한다. 웨스트가드 멀티 룰 각 단계에서 요하는 기준을 Levey Chart에서 확인하고 샘플의 Reject여부를 판단한다.
내부정도관리분자 12개 선정을 위해 구축된 Database를 이용하여 평균과 표준편차를 구한다. 평균과 표준편차를 이용하여 %CV(Coefficient of variation) 산출한다. %CV값을 기준으로 값이 작은 내부정도관리분자 12개를 선정한다(전체 압타머의 1%를 사용).
내부정도관리분자 3개 구간 선정 후 선정된 12개의 내부정도관리분자에서 평균을 기준으로 3가지 구간으로 나눈다. 구간은 높음, 중간, 낮음 3개의 구간이며 각 구간에 4개의 내부정도관리분자가 선정된다.
<구조도 2>
Figure pat00024
<구조 2>를 참조하여, 먼저, 1:3S, 2of3:2S, R4S 및 3:1S 다중 규칙을 적용하여 내부정도관리분자 3개 구간 (높음, 중간, 낮음)별 선택한 내부정도관리 분자 사용하여 정도 관리하였으며 다음으로, 12X 규칙을 적용하여 내부정도관리분자 12개를 사용하여 정도관리하였다.
① 1:3S
1개의 기준분자 측정치가 평균에서 ±3SD의 한계를 벗어날 때 Rejection rule 적용(random error).
② 2of3:2S
3개의 기준분자 측정치 중 2개의 측정치가 같은 방향으로 +2SD 혹은 -2SD를 나타낼 때 Rejection rule 적용.
③ R4:1S
2개의 기준분자 측정치 중 1개의 측정치가 평균에서 ±2SD의 한계를 벗어나고, 다른 것은 -2SD의 한계를 벗어날 때 Rejection rule 적용 (random error).
④ 3:1S
3개의 기준분자 측정치가 연속적으로 평균치의 같은 방향인 +1SD 혹은 -1SD의 한계를 벗어날 때 Rejection rule 적용.
⑤ 12x
연속적으로 12개의 기준분자 측정치가 평균치의 한쪽 방향으로 떨어질 때 Rejection rule 적용.
도 20에서 제시하는 내부정도관리 모듈(200)는 상기 웨스트가드 다중 규칙 <구조도 2>을 구현하는 소프트웨어를 포함한다.
4) 생물학적 의미 결정
분자데이터가 있는 평가 시료의 생물학적 의미 결정은 도 18에 제시한 내부정도관리 및 생물학적 의미 결정지원시스템(1), 도 19에 제시한 분자데이터 생산 모듈(100), 도 20에 제시한 내부정도관리 모듈(200) 및 도 21에 제시한 생물학적 의미 결정지원(300)을 활용하였다.
바람직하게 학습 단계는, 상기 분자데이터 생산 모듈(100)는 상기 시료에 있는 핵산 또는 단백질 분자집단에 대한 NGS 시퀀서(104)에서 생산된 실험 데이터를 비교모듈(106)에서 분자데이터, 결합프로파일을 생산, 저장하고 생물학적 의미 결정지원시스템(300)에 입력하여 학습 데이터베이스를 구축한다. 상기 학습 데이터베이스를 이용하여 평가 시료의 평가에 필요한 한 내부정도관리분자, 분류분자 및 AptaDx를 선정한다.
분류 단계는, 상기 분자데이터 생산 모듈(100)이 평가시료를 분석하여 얻은 NGS시퀀서(104)에서 생산된 실험 데이터를 분석모듈(306)에 구축된 NAPConverter에 의해 전환된 분자데이터를 상기 내부정도관리 모듈(200)에 입력한다. 상기 내부정도관리 모듈(200)는 입력된 분자데이터를 내부정도관리하여 유효 판정된 시료의 분자데이터를 상기 생물학적 의미 결정 지원 모듈(300)에 입력한다. 상기 생물학적 의미 결정 지원 모듈(300)에 구축된 AptaDx 프로그램는 입력된 유효 분자데이터를 분석하여 시료 또는 시료를 제공한 유기체의 생물학적 상태를 예측, 분류한다.
생물적인 정의가 명확한 시료를 서울아산병원(IRB 승인번호: 2015-0607)에서 수집하여 본 실시례에 사용하였다. 본 실시례에 사용한 폐암관련 진단 시료의 임상정보는 표 6이다.
폐암과련 시료의 임상정보

학습 세트 평가 세트
폐암 대조구 폐암 대조구
시료 수 150 150 50 50
평균 나이 62.9 56.1 64.3 56.6
중앙값 평균 나이 63 56 65 56
남자 116 92 40 34
여자 34 58 10 16
Histopathology of NSCLC
Squamous cell carcinoma 62 18
Adenocarcinoma 61 20
NSCLC Stage I 32 10
Stage II 15 4
Stage III 30 11
Stage IV 46 13
Small cell lung cancer 27 12
SCLC LD 8 3
ED 19 9
Pneumonia 40 21
Tuberculosis 33 10
Benign mass 3 2
Etc 74 17
<학습 단계>
일차적으로, 표 6의 분석대상 시료에 대한 결합 프로파일를 폐암와 폐암이 아닌 폐질환로 구성된 폐암유무 표준 db를 구성하였다. 또한, 폐암시료를 소세포폐암과 비소세포폐암으로 구분하는 세부 db를 구축할 수 있고, 비소세포폐암은 세포유형에 따라 adeno 유형과 sqamous 유형을 나누는 db를 구축할 수 있으며, 병기에 따라 1과2기를 초기 유형으로, 3과 4기는 말기유형으로 구성된 db를 구축할 수 있다.
도 19에 제시한 분자데이터 생산 모듈(100)의 제1 반응구(101)에서 <실시례 7> 항 및 도 13을 참조하여, 상기 각각 혈청시료에 AptaSSN-FSS 비드를 첨가하고 단백질-AptaSSN 복합체 집단을 형성하였다(도 13 a). 또는 상기 각각 혈청시료를 nitrocellulose disc에 부착하고 단백질-AptaSSN 복합체 집단을 형성하였다(도 13 b). 상기 형성된 복합체에서 분리구(102)에서 분리한 AptaSSN 집단을 제2 반응구(103)에서 <실시례 4>항에 따라 NGS 라이브러리를 제조하고 NGS 시퀀서(104)에 처리하여 FASTAQ 파일을 생성하였다. 비교모듈(106)에서 참조서열(105)와 비교분석하여 상기 시료에 대한 분자데이터, 결합프로파일을 생성한 후, 생물학적 의미 결정지원 모듈(300)에 생물학적 의미에 따라 다양한 표준 db를 구축하였다.
도 21의 생물학적 의미 결정지원 모듈(300)의 입력모듈(302)은 생물학적 의미에 따라 구축된 폐암유무 학습세트 DB과 평기세트 DB를 구축하고 먼저, 학습세트 DB에 대한 시료내는 Min-Max Normalization, 시료간에는 Qauntile Normalization을 실시하였으며, 정규화된 DB에 대해 one-way Anova를 실시하여 특징선택을 실시하여 분류분자집단을 선정하였다. 선택되어진 특징 집단의 분포는 도 28이다.
선택되어진 특징 집단의 일차 평가는 클러스터링 기법으로 수행하였으며 그 결과는 도 29이다.
도 21의 생물학적 의미 결정지원 모듈(300)의 분석모듈(304)에서 학습세트의 결합프로파일에 대해 인공신경망(Artificial Neural Network)으로 이루어진 분류기로 학습하고 그 학습 결과, MOD 파일을 저장하여 평가할 수 있다. 평가는 10-flod cross validation로 실시하였으며 각각의 구간마다 임계값에 따른 ROC 커브, 임상적 민감도와 특이도를 산출하였다. 이 임계값은 본 시험방법의 기술적인 성능 특징은 고려하지 않고 임상적인 평가(최적인 민감도와 특이도를 유지하도록 결정함)을 기초하였으며 이 임계값은 독립적인 유효성 평가를 통해서 ROC 커브기법으로 결정하였다. 이상적인 임상적 민감도와 특이도를 유지할 수 있는 교육 산물, MOD 파일을 선정하여 AptaSSNaDx 프로그램이라고 하였고 평가세트를 구성하는 시료 결합프로파일을 분류하는 프로그램으로 사용하였다.
선택되어진 특징 집단의 이차 평가는 기계학습 분류기를 사용하여 학습하고 10-fold cross validation 방법으로 평가한 결과는 도 30이다.
도 29에 제시된 바와 같이, 상기 AptaCDSS 프로그램으로 학습한 결과를 평가한 결과는 10개의 구간에 대해 임계값, 임상적 특이도, 민감도 등이다. 상기 폐암유무 학습세트 db에 대한 이상적인 교육산물, MOD 파일은 임계값은 0.50, 민감도 1.0, 특이도 1.0를 보이는 1-9 fold의 교육산물, MOD 파일이며 이를 AptaDx 프로그램으로 하였다. 학습세트 분석시료의 결합프로파일을 AptaCDSS 프로그램으로 분석한 결과는 유사도로 표현된다.
<분류 단계>
도 20에 제시한 내부정도관리 모듈(200)에 구축된 내부정도관리 프로그램, 그리고 도 21에 제시한 생물학적 의미 결정지원 모듈(300)의 분석모듈(303)에 구축된 NAPConverter 및 AptaCDSS 프로그램 프로그램으로 상기 구축된 폐암유무 학습세트 DB에 대해 분류분자, 내부 정도관리분자 및 AptaDx 프로그램을 결정하였다.
도 20에 제시한 내부정도관리 모듈(200)은 학습 데이터베이스를 구성하는 시료에 있는 분자데이터에 대한 평균, 평균편차 및 변동계수를 사용하여 12개의 정도관리분자를 선정하였으며, 분석하고자하는 분자데이터에 상기 선정된 12개의 분자데이터를 이용한 Westgard Multirules Control Chart를 적용하는 소프트웨어를 포함하는 내부정도관리 모듈(200)으로 분자데이터 생산 모듈(100)에서 입력되는 시료에 있는 분자데이터를 내부정도관리하여 유효 분자데이터를 결정하였다.
도 20에 제시한 내부정도관리 모듈(200)에 포함된 Westgard Multirules Control Chart 구현 프로그램은 평가 세트 DB를 구성하는 시료에 있는 분자데이터를 분석하여 유효 시료를 결정하였으며 그 결과는 유효율이 100%이였다.
상기 AptaDx의 진단 순서는 다음과 같다. 학습세트 DB에 대한 인공신경망의 학습 결과가 저장된 MOD 형식의 파일을 정보를 읽어 인공신경망을 초기화를 진행한다. 즉 인공신경망을 이전에 학습된 상태로 설정하는 MOD 파일을 구동하였다. 상기 NAP 파일의 특징인 결합 SSN의 출현 빈도수의 값을 로그 값으로 전환하였다. 상기 전환된 NAP 파일의 특징인 결합 SSN의 데이터 범위와 분포를 min-max 정규화를 수행하였다. 또한, Quantile 정규화는 미실시하는 경우와 실시하는 경우로 나누고, 실시하는 경우 DB는 폐암 DB, 폐암이 아닌 폐질환 DB, 그리고 두 개의 DB를 합한 전 DB 즉, 3개의 DB에서 수행하였다. 진단을 원하는 평가세트 db 시료에 대한 결합프로파일은 4종류의 정규화된 NAP 파일에서 MOD 파일에 지정된 특징, 결합 SSN 집단의 값을 불러오는 과정을 실시하고 분석하였다. 따라서 특정시료에 대한 결합프로파일에 대해 4종류의 정규화 과정을 수행하여 4개의 분석결과가 산출되고 최종적인 결과는 3개 이상의 결과로 판정하였다.
검사결과로 양성 또는 음성에 해당 가능성을 나타내는 두 개의 결과 값이 출력된다. 출력된 값을 유사도라 하고, 양성 임계값을 0.5 값으로 하여 0.5 이상이면 양성 또는 0.5 이하이면 음성으로 판단한다.
양성≥ 임계값
음성< 임계값
상기 예측모델 AptaDx 프로그램으로 평가세트 시료를 분류한 결과는 표 7이며 임상적인 민감도는 98.0%이고 특이도는 100.0%이다.
평가 세트의 시료를 분석한 임상적 평가
질병 또는 상태 확진 결과 합계
폐암 폐암이 아닌 폐질환
본 연구에서 개발 기술 폐암 49 0 49
폐암은 아닌 폐질환자 1 50 51
합계 50 50 100
1: 내부정도관리 및 생물학적 의미 결정지원 시스템, 100: 분자데이터 생산 모듈, 101: 제1 반응구, 102: 제2 반응구, 103: 시퀀서, 104: 참조서열, 105: 비교모듈, 200: 내부정도관리 모듈, 201: 입력모듈, 202: 제어모듈, 203: 인터페이스 제공 모듈, 204: 디스플레이 모듈, 205: 저장모듈, 300: 생물학적 의미결정지원 모듈, 301: 운영체계 소프트웨어, 302: 입력모듈, 303: 분석모듈, 304: 시각화 모듈, 305: 출력모듈, 306: 출력장치, 307: 컨트롤러, 308: 메모리,
1000: AptaSSN 유체 자성비드 장치, 1100: 주입부, 1110: 제1 주입구, 1120: 제2 주입구, 1130: 제1 시약병, 1140: 제2 시약병, 1200: 유동채널, 1210: 반응구, 1211: 제1 반응구, 1212: 제2 반응구, 1213: 자기장 인가부, 1220: 배출부, 1230; 포집부, 1310: 제1 밸브, 1320: 제2 밸브, 1330: 제3 밸브, 1340: 제4 밸브, 1350: 제5 밸브

Claims (71)

  1. (a) 임의의 염기서열로 이루어진 중앙영역 및 고정서열로 이루어진 양쪽 말단영역을 포함하고,
    (b) 상기 양 말단에서 선택되어진 어느 한 말단에 제1 태그를 포함하며,
    (c) 하나 또는 그 이상 종류의 분자(M)집단으로 이루어진 시료에 결합하는 복수의 단일가닥핵산(SSN)을 포함하는 것을 특징으로 하는 단일가닥핵산 라이브러리.
  2. 제1항에 있어서, 상기 양쪽 말단영역의 고정서열은 상기 단일가닥핵산을 주형으로 PCR을 하기 위하여,
    (a) 정방향 프라이머의 염기서열과 동일한 염기서열을 5′ 말단 고정서열; 및
    (b) 역방향 프라이머의 염기서열과 상보적인 염기서열을 3′ 말단 고정서열;을 포함하는 것을 특징으로 하는 단일가닥핵산 라이브러리.
  3. 제1항에 있어서, 상기 단일가닥핵산은
    (a) 임의의 염기서열을 포함하는 DNA 올리고뉴클레오티드로 이루어진 출발 라이브러리; 및
    (b) 상기 단계 (a)의 DNA 올리고뉴클레오티드 라이브러리의 양쪽 말단에 고정서열을 포함하는 DNA 올리고뉴클레오티드로 이루어진 출발 라이브러리;를 포함하는 군에서 선택되어진 어느 한 출발 라이브러리로부터 합성하는 것을 특징으로 하는 단일가닥핵산 라이브러리.
  4. 제1항에 있어서, 상기 단일가닥핵산을 구성하는 뉴클레오티드는
    천연 및 변형된 뉴클레오티드로 이루어진 군에서 선정된 1종류 이상으로 구성되는 것을 특징으로 하는 단일가닥핵산 라이브러리.
  5. 제1항에 있어서, 상기 시료는
    생물학적 시료, 환경학적 시료, 화학 시료, 약제학적 시료, 음식 시료, 농업 시료 및 수의학적 시료를 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 단일가닥핵산 라이브러리.
  6. 제5항에 있어서, 상기 생물학적 시료는
    혈액(blood), 전혈(whole blood), 백혈구(leukocyte), 말초혈액 단핵세포(peripheral blood mononuclear cells), 혈장(plasma), 혈청(serum), 가래(sputum), 입김(breath), 소변(urine), 정액(semen), 침(saliva), 뇌막액(meningeal fluid), 양수(amniotic fluid), 선액(glandular fluid), 림프액(lymph fluid), 유두 흡인물(nipple aspirate), 기관지 흡인물(bronchial aspirate), 활액(synovial fluid), 관절 흡인물(joint aspirate), 바이러스(virus), 세균(bacteria), 세포(cell), 세포 추출물(cellular extract), 대변(stool), 조직(tissue), 조직 추출물(tissue extract), 조직 생검(tissue biopsy) 및 뇌척수액(cerebrospinal fluid)을 포함하는 군에서 선택되어진 생물학적 시료를 특징으로 하는 단일가닥핵산 라이브러리.
  7. 제1항에 있어서, 상기 분자(M)는
    단백질(proteins), 폴리펩티드(polypeptides), 탄수화물(carbohydrates), 다당류(polysaccharides), 당단백(glycoproteins), 호르몬(hormones), 수용체(receptors), 항원(antigens), 항체(antibodies), 바이러스(viruses), 기질(substrates), 대사분자(metabolites), 전이상태 유사체(transition state analogs), 보조인자(cofoactors), 억제제(inhibitors), 약물(drugs), 염료(dyes), 영양분(nutrients), 성장 인자(growth factors), 세균(bacteria), 조직(tissues) 및 규제 약물(controlled substance)을 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 단일가닥핵산 라이브러리.
  8. 제1항에 있어서, 상기 제1 태그는 제1 포획성분에 결합하는 물질로
    폴리뉴클레오티드(polynucleotide), 폴리펩티드(polypeptide), 펩티드핵산(peptide nucleic acid), 잠금 핵산(locked nucleic acid), 올리고당(oligosaccharide), 다당(polysaccharide), 항체(antibody), 애피바디(affibody), 항체 모조체(antibody mimic), 세포 수용체(cell receptor), 리간드(ligand), 지질(lipid), 바이오틴(biotin), 아비딘(avidin), 스트렙타비딘(streptavidin), 엑스트라비딘(extravidin), 뉴트라비딘(neutravidin), 스트렙타비딘(streptavidin), 금속(metal), 히스티딘(histidine) 및 이들 구조들 중 어느 하나의 임의의 부분을 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 단일가닥핵산 라이브러리.
  9. 제1항에 있어서, 상기 단일가닥핵산(SSN)은
    상기 복수 종류의 분자(M)집단으로 이루어진 시료와 접촉하여 M-SSN 복합체 집단을 형성하고,
    상기 M-SSN 복합체 집단을 구성하는 SSN의 시료간의 양적 차이를 이용하여 상기 시료의 생물학적 의미를 기준에 따라 상기 시료를 분류할 수 있도록 하는 AptaSSN 1종류 이상을 동시에 제공하는 M-SSN 복합체 집단을 제공하는 특징으로 하는 단일가닥핵산 라이브러리.
  10. 제1항에 있어서, 상기 생물학적 의미는
    (a) 상기 시료 또는 시료를 채취한 사람의 생리적인 변화를 의미하고, 상기 임상검사 값에 상응하여 예방, 진단, 치료, 완화와 처치의 건강관리를 목적으로 의사 결정(Decision Making)을 하는 과정에 필요한 정보이거나, 또는
    (b) 질병이나 다른 상태를 진단, 치료, 완화, 처치, 예방을 목적으로 생물학적 의미에 관한 의사 결정(Decision Making)을 하는 과정을 지원하는 “분류”, “점수”, “지수”를 의미하고, 상기 생물학적 의미가 결정된 시료 또는 시료를 채취한 사람의 임상 정보(Clinical Information) 및 상기 생산된 다중의 분자 값들을 수집한 후, 통계학적 기법 또는 기계학습알고리즘을 이용하여 상기 수집한 정보들로부터 질환을 추론 또는 판별할 수 있도록 생산된 특이적 결과;를 포함하는 것을 특징으로 하는 단일가닥핵산 라이브러리.
  11. 제1항 내지 제10항에 있어서,
    (a) 상기 출발 라이브러리에서 제조된 제1 태그가 있는 단일가닥핵산(SSN) 라이브러리와 제1 포획성분이 있는 제1 고체지지체(FSS)가 접촉하여, 상기 제1 태그와 상기 제1 포획 성분이 결합한 SSN-FSS 복합체를 제조하며, 상기 SSN-FSS 복합체와 분자(M)집단으로 구성된 시료가 접촉하여, 상기 분자와 결합한 SSN-FSS 복합체(M-SSN-FSS 복합체)를 형성하는 제1 혼합용액을 제조하는 하거나, 또는 상기 SSN 라이브러리와 분자집단으로 구성된 시료가 접촉하여, 상기 분자와 결합한 SSN 복합체(M-SSN 복합체)를 포함하는 혼합용액을 제조하며, 상기 제조된 혼합용액에 제1 고체지지체(FSS)를 첨가하고, 상기 M-SSN 복합체의 SSN에 있는 제1 태그와 상기 FSS에 있는 제1 포획성분이 결합하여, M-SSN-FSS 복합체가 형성되는 제1 혼합용액을 제조하는 단계;
    (b) 상기 제1 혼합용액에서 상기 SSN과 결합하지 않거나 비특이적 결합을 한 상기 제1 혼합용액의 성분을 해리시키기 위해, 하나 또는 그 이상의 세척용액으로 상기 M-SSN-FSS 복합체를 세척하여, 상기 SSN과 비특이적 결합을 하거나 결합되지 않은 하나 또는 그 이상의 혼합물의 성분을 제거하는 제1 분리 단계;
    (c) 제2 포획성분에 친화력이 있는 제2 태그 및 상기 제1 분리된 M-SSN-FSS 복합체의 분자(M)로부터 제2 태그-M-SSN-FSS 복합체를 형성하는 제2 태그의 부가 단계;
    (d) 상기 제2 태그가 부가된 M-SSN-FSS 복합체와 상기 제2 포획성분이 있는 제2 고체지지체(SSS)가 접촉하고, 상기 제2 태그와 상기 제2 포획성분이 결합하여, SSS-M-SSN-FSS 복합체가 형성되는 제2 혼합용액을 제조하는 단계;
    (e) 상기 제2 혼합용액에서 상기 제2 포획성분과 결합하지 않은 하나 또는 그 이상의 혼합물의 성분을 제거하는 제2 분리 단계;
    (f) 상기 제2 분리된 SSS-M-SSN-FSS 복합체로부터 SSN을 포함하는 물질 집단을 용출하는 단계;
    (g) 상기 용출된 SSN을 포함하는 물질 집단으로부터 증폭된 SSN 집단을 제작하거나, 또는 추가적으로 (a) 단계부터 (f) 단계를 1 라운드 이상을 반복하여 실시하는 단계; 및
    (h) 상기 (f) 단계에서 용출된 SSN을 포함하는 물질 집단을 분석하는 단계;를 포함하는 것을 특징으로 하는 AptaSSN 선정 방법.
  12. 제11항에 있어서,
    상기 제2 분리된 SSS-M-SSN-FSS 복합체로부터 상기 SSN을 포함하는 물질 집단을 용출하는 장치는 주입부(1100), 유동채널(1200) 및 밸브부(1300)로 이루어진 유체 구조체에 있어서,
    상기 주입부(1100)는 하나 이상의 주입구 및 시약병으로 구성되고, 분자(M)집단으로 구성된 시료 용액, 제1 태그가 있는 단일가닥핵산(SSN) 라이브러리 용액, 제1 포획성분이 있는 제1 고체지지체(FSS) 용액, 제2 태그 용액, 반응용액, 세척용액, 증류수, 공기 및 용출용액으로 이루어진 군에서 선택되어진 어느 하나 이상이 각각의 시약병들로부터 주입되며,
    상기 유동채널(1200)는 반응부(1210), 배출부(1220) 및 포집부(1230)으로 이루어진 군에서 선택되어진 어느 하나 이상이 순차적으로 위치하며,
    상기 반응부(1210)는 하나 이상의 반응구로 구성되고, 상기 M-SSN-FSS 복합체를 형성하고 세척하며, 상기 세척된 복합체의 분자(M)에 제2 태그를 부가하며,
    상기 포집부(1230)는 제2 포획성분이 있는 제2 고체지지체(SSS)를 포함하고 있고, 상기 SSS-M-SSN-FSS 복합체를 형성하고, 상기 용출용액에 의하여 SSS-M-SSN-FSS 복합체로부터 SSN를 포함하는 물질 집단을 용출하며,
    상기 밸브부(1300)는 상기 주입부(1100)에서 상기 용액을 상기 유동채널(1200)로 이동 및 저장이 가능하도록 하는 하나 이상의 밸브로 구성되며,
    상기 반응부(1210)에 자기력 인가부(1213)가 구비된 것을 특징으로 하는 AptaSSN 유체 자성 비드 장치(1000).
  13. 제12항에 있어서,
    상기 유동채널(1200)은 미세유체 칩, 파우치(pouch) 및 튜브로 구성된 군에서 선택되는 어느 하나 이상을 특징으로 하는 AptaSSN 유체 자성 비드 장치(1000).
  14. 제13항에 있어서, 상기 파우치(1200)는
    폴리에스테르, 폴리에틸렌 테레프탈레이트(PET), 폴리카보네이트, 폴리프로필렌, 폴리메틸메타크릴레이트 및 이들의 혼합물으로 이루어진 군에서 선택되어지는 어느 한 유연한 플라스틱 필름 또는 기타 유연한 재료로 제조하며,
    압출(extrusion), 플라즈마 침착(plasma deposition) 및 라미네이션(lamination)을 포함하는 공정(process)에서 선택되어진 어느 한 공정으로 제조하는 것을 특징으로 하는 AptaSSN 유체 자성 비드 장치(1000).
  15. 제12항 내지 제14항에 있어서,
    상기 유동채널은 자기력 인가부에 탈부착이 가능하도록 설치하는 것을 특징으로 하는 AptaSSN 유체 자성 비드 장치(1000).
  16. 제12항 내지 제15항에 있어서,
    제1 주입구(1110) 및 제2 주입구(1120)으로 구성된 상기 주입부(1100) 그리고 제1 반응구(1210) 및 제2 반응구(1220)으로 구성된 상기 반응부(1200)으로 이루어진 상기 AptaSSN 유체 자성 비드 장치(1000)의 운영은
    (a) 상기 제1 주입구(1110)로부터 상기 분자(M)집단으로 구성된 시료 용액, 상기 SSN 라이브러리 용액 및 상기 FSS 용액이 주입되고, 상기 반응부에서 상기 시료를 구성하는 분자(M)집단, 상기 SSN의 제1 태그 및 상기 FSS의 제1 포획성분이 반응하여 M-SSN-FSS 복합체가 형성되는 제1 혼합용액을 제조하는 단계;
    (b) 상기 제2 주입구(1120)로부터 세척용액이 주입되고, 상기 제1 반응구(1211)에서 제1 혼합용액에 있는 형성된 M-SSN-FSS 복합체를 세척하여 상기 SSN과 비특이적 결합을 하거나 결합되지 않은 하나 또는 그 이상의 혼합물의 성분을 상기 배출부(1220)로 제거하는 제1 분리 단계;
    (c) 상기 제1 주입구(1110)로부터 상기 제2 태그 용액이 주입되고, 상기 제2 반응구(1212)에서 상기 제1 분리된 M-SSN-FSS 복합체의 분자(M)로부터 제2 태그-M-SSN-FSS 복합체를 형성하는 제2 태그의 부가 단계;
    (d) 상기 제2 반응구(1212)로부터 상기 제2 태그-M-SSN-FSS 복합체 용액이 주입되고, 상기 포집부(1230)에 있는 SSS의 제2 포획성분 및 상기 제2 태그-M-SSN-FSS 복합체의 제2 태그가 반응하여 SSS-M-SSN-FSS 복합체가 형성되는 제2 혼합용액을 제조하는 단계;
    (e) 상기 제2 주입구(1120)로부터 상기 세척용액이 주입되고, 상기 포집부(1230)에 있는 제2 혼합용액에서 형성된 SSS-M-SSN-FSS 복합체를 세척하여, 상기 제2 포획성분과 결합하지 않은 하나 또는 그 이상의 혼합물의 성분을 제거하는 제2 분리 단계;
    (f) 상기 제1 주입구(1110)로부터 상기 용출용액이 주입되고, 상기 포집부(1230)에 있는 제2 분리된 SSS-M-SSN-FSS 복합체로부터 상기 SSN를 포함하는 물질 집단을 용출하는 단계;
    (g) 상기 용출된 SSN을 포함하는 물질 집단으로부터 증폭된 SSN 집단을 제작하거나, 또는 추가적으로 (a) 단계부터 (f) 단계를 1 라운드 이상을 반복하여 실시하는 단계; 및
    (h) 상기 (f) 단계에서 포집부(1230)에서 용출된 SSN을 포함하는 물질 집단을 수집하는 단계;를 포함하는 것을 특징으로 하는 AptaSSN 유체 자성 비드 장치(1000).
  17. 제11항 내지 제12항에 있어서, 상기 제2 태그는 제2 포획성분에 결합하는 물질로,
    폴리뉴클레오티드(polynucleotide), 폴리펩티드(polypeptide), 펩티드 핵산(peptide nucleic acid), 잠금 핵산(locked nucleic acid), 올리고당(oligosaccharide), 다당(polysaccharide), 항체(antibody), 애피바디(affibody), 항체 모조체(antibody mimic), 세포 수용체(cell receptor), 리간드(ligand), 지질(lipid), 바이오틴(biotin), 아비딘(avidin), 스트렙타비딘(streptavidin), 엑스트라비딘(extravidin), 뉴트라비딘(neutravidin), 스트렙타비딘(streptavidin), 금속(metal), 히스티딘(histidine) 및 이들 구조들 중 어느 하나의 임의의 부분을 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 AptaSSN 선정 방법.
  18. 제11항 내지 제13항에 있어서, 상기 제1 포획성분는 제1 태그에 결합하는 물질 또는 상기 제2 포획성분은 제2 태그에 결합하는 물질로
    폴리뉴클레오티드(polynucleotide), 폴리펩티드(polypeptide), 펩티드 핵산(peptide nucleic acid), 잠금 핵산(locked nucleic acid), 올리고당(oligosaccharide), 다당(polysaccharide), 항체(antibody), 애피바디(affibody), 항체 모조체(antibody mimic), 세포 수용체(cell receptor), 리간드(ligand), 지질(lipid), 바이오틴(biotin), 아비딘(avidin), 스트렙타비딘(streptavidin), 엑스트라비딘(extravidin), 뉴트라비딘(neutravidin), 스트렙타비딘(streptavidin), 금속(metal), 히스티딘(histidine) 및 이들 구조들 중 어느 하나의 임의의 부분을 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 AptaSSN 선정 방법.
  19. 제11항 내지 제13항에 있어서, 상기 제1 고체지지체(FSS) 또는 제2 고체지지체(SSS)는
    시클로-올레핀 공중합체 기질(cyclo-olefin copolymer substrate), 막(membrane), 플라스틱 기질(plastic substrate), 나일론(nylon), 랑그뮈어-블로제트 막(langmuir Blodgett films), 유리(glass), 게르마늄 기질(germanium substrate), 실리콘 기질(silicon substrate), 폴리테트라 플루오로에틸렌 기질(polytetrafluoroethylene substrate), 폴리스티렌 기질(polystyrene substrate), 갈륨 비소화물 기질(gallium arsenide substrate), 금 기질(gold substrate), 은 기질(silver substrate), 폴리머 비드(polymer bead), 아가로스 비드(agarose bead), 폴리스티렌 비드(polystyrene bead), 아크릴아미드 비드(acrylamide bead), 고체 핵 비드(solid core beads), 상자성 비드(paramagnetic beads), 유리 비드(glass bead), 마이크로비드(microbead), 나노입자(nanoparticle), 유리(glass), 게르마늄 기질(germanium substrate), 실리콘 기질(silicon substrate), 미세역가웰(microtitre well), 실리콘 와퍼 칩(silicon wafer chip) 또는 유동형 칩(flow through chip) 및 조절 공극 비드(controlled pore beads)을 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 AptaSSN 선정 방법.
  20. 제11항 내지 제13항에 있어서,
    (a) 상기 제1 혼합용액에서 상기 제1 포획 성분을 포함하는 제1 고체지지체(FSS); 및
    (b) 상기 제2 혼합용액에서 상기 제2 포획 성분을 포함하는 반응구의 표면 또는 고정될 수 있는 자성이 있는 제2 고체지지체(SSS);를 포함하는 것을 특징으로 하는 AptaSSN 선정 방법.
  21. 제11항에 있어서,
    상기 (b) 단계 및 (e) 단계를 포함하는 군에서 선택되어진 어느 한 단계 이상에서 세척용액은
    유기용매가 있는 세척용액 및 엄격한 세척용액을 포함하는 군에서 선택되어진 어느 한 용액 이상을 특징으로 하는 AptaSSN 선정 방법.
  22. 제21항에 있어서,
    상기 유기용매는 Propylene Glycol 및 glycerol를 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 AptaSSN 선정 방법.
  23. 제21항에 있어서, 상기 엄격한 세척용액을 사용하는 방법은
    (a) 상기 M-SSN-FSS 복합체 또는 상기 SSS-M-SSN-FSS 복합체를 포함하는 혼합용액을 희석하는 것;
    (b) 상기 M-SSN-FSS 복합체 또는 상기 SSS-M-SSN-FSS 복합체를 포함하는 혼합용액을에 경쟁자를 첨가하는 것; 및
    (c) 상기 M-SSN-FSS 복합체 또는 상기 SSS-M-SSN-FSS 복합체를 포함하는 혼합용액을 희석하고 경쟁자를 첨가하는 것으로 이루어지는 군으로부터 선택되어진 어느 하나 이상을 포함하는 것을 특징으로 하는 AptaSSN 선정 방법.
  24. 제23항에 있어서,
    상기 경쟁자는 올리고뉴클레오티드(oligonucleotide), 헤파린(heparin), 청어 정자 DNA(herring sperm DNA), 연어 정자 DNA(salmon sperm DNA), 덱스트란 설페이트(dextran sulfate), 다중 음이온(polyanion), 어베이식 포스포디에스테르 폴리머(abasic phosphodiester polymer), dNTP 및 피로포스페이트(pyrophophate)을 포함하는 군에서 선택되어진 하나 이상을 특징으로 하는 AptaSSN 선정 방법.
  25. 제11항에 있어서, 상기 세척은
    (a) 상기 SSS-M-SSN-FSS 복합체 용액에 추가 1 라운드부터 전 라운드의 50% 라운드까지는 분리 전에 완충용액을 수십 배로 부가하여 세척하는 단계;
    (b) 상기 (a) 단계부터 나머지 50% 라운드까지는 분리 전에 완충용액을 수백 배로 부가하여 세척하는 단계; 및
    (c) 최종 라운드에서는 분리 전에 덱스트란 설페이트를 함유하는 완충용액을 수백 배로 부가하여 세척하는 단계;를 포함하는 것을 특징으로 하는 AptaSSN 선정 방법.
  26. 제11항에 있어서, 단계 (f)에서 상기 제2 분리된 SSS-M-SSN-FSS 복합체로부터 SSN을 포함하는 물질 집단을 용출하는 단계에서 상기 용출용액은
    pH 방법, 온도 방법 및 카오트로픽염(chaotropic salts) 방법을 포함하는 군에서 선택되어진 어느 한 방법을 실시하는 용액을 특징으로 하는 AptaSSN 선정 방법.
  27. 제26항에 있어서, 상기 pH 방법은
    상기 복합체를 pH>9 또는 <5을 유지하는 용액으로 처리하는 방법을 특징으로 하는 AptaSSN 선정 방법.
  28. 제26항에 있어서, 상기 온도 방법은
    상기 복합체를 40~100℃를 유지하는 용액으로 처리하는 방법을 특징으로 하는 AptaSSN 선정 방법.
  29. 제26항에 있어서, 상기 카오트로픽염 방법은
    상기 복합체를 소디움 퍼클로레이트(sodium perchlorate), 리튬 클로라이드(lithium chloride), 마그네슘 클로라이드(magnesium chloride), 소디움 클로라이드(sodium chloride) 및 Guanidine-HCl을 포함하는 카오트로픽 염(chaotrophic salts)에서 선택되어진 어느 하나를 포함하는 용액으로 처리하는 방법을 특징으로 하는 AptaSSN 선정 방법.
  30. 제11항에 있어서, 상기 (f) 단계서 용출된 SSN을 포함하는 물질을 분석하는 방법은
    (a) 상기 분자집단으로 구성된 시료와 SSN 라이브러리로부터 형성된 복합체에서 용출된 SSN-FSS 복합체 집단 또는 결합 SSN 집단으로부터 NGS 라이브러리 제조하는 단계;
    (b) 상기 제조한 NGS 라이브러리를 NGS 장비로 염기서열을 결정하는 단계;
    (c) 상기 결정된 염기서열로부터 리드의 종류 및 출현빈도를 분석하는 단계;
    (d) 상기 분석한 리드의 종류 및 출현빈도가 있는 분석시료를 사용하여 데이터베이스를 구성하는 단계;
    (e) 상기 구축한 데이터베이스로부터 생물학적 의미가 있는 Feature, SSN을 선정하는 단계; 및
    (f) 상기 선정된 Feature, SSN을 사용하여 구축된 데이터베이스를 평가하는 단계;를 포함하는 것을 특징으로 하는 AptaSSN 선정 방법.
  31. 제30항에 있어서, 상기 (d) 단계의 데이터베이스 구성 및 (e) 단계의 특징선택은
    (a) 상기 시료의 생물학적 의미를 기준으로 분자데이터가 있는 분석시료를 2개 이상의 데이터베이스를 구성하고 감독형 기계학습언어로 한 특징선택; 및
    (b) 상기 분석한 분석 데이터가 있는 분석시료를 한 개의 데이터베이스를 구성하고 비감독형 기계학습언어로 한 특징선택;을 포함하는 군에서 선택되어진 어느 하나 이상을 실시하는 것을 특징으로 하는 AptaSSN 선정 방법.
  32. 제1항 내지 제31항에 있어서, 상기 선정되고 평가된 AptaSSN는
    진단 및 신약 목적 바이오마커에 대한 리간드로 사용하는 것을 특징으로 하는 AptaSSN 선정 방법.
  33. 제11항 내지 제32항에 있어서,
    (a) 상기 특정시료를 구성하는 분자집단에 대한 상기 AptaSSN 집단에 대한 균등화(normalization) 공정;
    (b) 상기 실험시료와 대조시료를 구성하는 분자집단에 대한 AptaSSN 집단에 대한 차등화(differential screening) 공정; 및
    (c) 상기 실험시료와 대조시료를 구성하는 분자집단에 대한 AptaSSN 집단에 대한 Suppression subtractive hybridization 공정;을 포함하는 군에서 선택되어진 어느 한 공정 이상을 추가적으로 실시하는 것을 특징으로 하는 AptaSSN 선정 방법.
  34. (a) 제11항에 있어서, 상기 (b) 단계에서 1차 분리된 M-SSN-FSS 복합체;
    (b) 제11항에 있어서, 상기 (e) 단계에서 2차 분리된 SSS-M-SSN-FSS 복합체; 및
    (c) 제11항 내지 제32항에 있어서, 상기 AptaSSN 집단과 시료를 구성하는 분자집단이 형성하는 복합체;를 포함하는 군에서 선택되어진 어느 한 복합체 이상 또는 이들로부터 분리한 분자집단을 질량분석기로 분석하는 것을 특징으로 하는 표적분자 분석 방법.
  35. 제1항 내지 제33항에서 개발되는 결합 SSN(AptaSSN) 및 상기 양 말단에 고정서열이 있는 압타머를 포함하는 군에서 선택되어진 어느 하나 이상의 단일가닥핵산; 및
    상기 고정서열에 의하여 동시에 증폭이 가능한 단일가닥핵산을 특징으로 하는 AptaSSN.
  36. (a) 상기 AptaSSN 집단에 제1 태그를 부가하는 단계;
    (b) 상기 하나 또는 그 이상 종류로 제1 태그가 있는 AptaSSN 집단과 제1 포획성분이 있는 제1 고체지지체(FSS)가 접촉하여, 상기 제1 태그와 상기 제1 포획 성분이 결합한 AptaSSN-FSS 복합체를 제조하며, 상기 AptaSSN-FSS 복합체와 분자(M)집단으로 구성된 시료가 접촉하여, 상기 분자와 결합한 AptaSSN-FSS 복합체(M-AptaSSN-FSS 복합체)를 형성하는 제3 혼합용액을 제조하는 하거나, 또는 상기 AptaSSN 집단과 분자집단으로 구성된 시료가 접촉하여, 상기 분자와 결합한 AptaSSN 복합체(M-AptaSSN 복합체)를 포함하는 반응 혼합물을 제조하며, 상기 제조된 반응 혼합물에 제1 고체지지체(FSS)를 첨가하고, 상기 M-AptaSSN 복합체의 AptaSSN에 있는 제1 태그와 상기 FSS에 있는 제1 포획성분이 결합하여, M-AptaSSN-FSS 복합체가 형성되는 제3 혼합용액을 제조하는 단계;
    (c) 상기 M-AptaSSNFSS 복합체를 세척하고 수확하는 단계;
    (d) 상기 수확된 M-AptaSSN-FSS 복합체로부터 분자집단을 용출하는 단계; 및
    (e) 상기 수확한 M-AptaSSN-FSS 복합체들 또는 상기 용출된 분자집단에 대해 질량분석기로 분석하는 단계;를 포함하는 것을 특징으로 하는 표적분자 분석 방법.
  37. 제36항에 있어서, 상기 (b) 단계 내지 (d) 단계를 실시하여 분자집단을 용출하는 장치는
    제12항 내지 제15항에 있는 AptaSSN 유체 자성 비드 장치(1000)를 사용하는 것을 특징으로 하는 표적분자 분석 방법.
  38. 제37항에 있어서,
    제1 주입구(1110) 및 제2 주입구(1120)으로 구성된 상기 주입부(1100) 그리고 제1 반응구(1210) 및 제2 반응구(1220)으로 구성된 상기 반응부(1200)으로 이루어진 상기 AptaSSN 유체 자성 비드 장치(1000)의 운영은
    (a) 상기 제1 주입구(1110)로부터 상기 분자(M)집단으로 구성된 시료 용액, 상기 제1 태그가 있는 선정된 AptaSSN 집단 용액 및 상기 FSS 용액이 주입되고, 상기 제1 반응구(1211)에서 상기 시료를 구성하는 분자(M)집단, 상기 AptaSSN의 제1 태그 및 상기 FSS의 제1 포획성분이 반응하여 M-AptaSSN-FSS 복합체가 형성되는 제3 혼합용액을 제조하는 단계;
    (b) 상기 제2 주입구(1120)로부터 세척용액이 주입되고, 상기 제2 반응구(1212)에서 제3 혼합용액에 있는 형성된 M-AptaSSN-FSS 복합체를 세척하여 상기 AptaSSN과 비특이적 결합을 하거나 결합되지 않은 하나 또는 그 이상의 혼합물의 성분을 상기 배출부(1220)로 제거하는 제3 분리 단계; 및
    (c) 상기 제2 반응구(1212)에서 상기 포집부(1220)로 이송된 M-AptaSSN-FSS 복합체에 용출용액이 제1 주입구(1110)로부터 주입되고 상기 분자(M)집단을 용출하는 단계; 를 포함하는 것을 특징으로 하는 AptaSSN 유체 자성 비드 장치.
  39. 제38항에 있어서,
    상기 제2 반응구(1212)에 있는 M-AptaSSN-FSS 복합체의 분자(M)에 제2 태그를 부가하고,
    상기 포집부(1230)는 표면에 있는 SSS의 제2 포획성분으로 M-AptaSSN-FSS 복합체를 포집하여 SSS-M-AptaSSN-FSS 복합체를 형성하고,
    상기 형성된 SSS-M-AptaSSN-FSS 복합체로부터 상기 분자(M)집단을 용출하는 것을 추가적으로 수행하는 것을 특징으로 하는 AptaSSN 유체 자성 비드 장치(1000).
  40. 제34항 및 제36항에 있어서, 상기 질량분석기는
    말디톱(MALDI; Matrix Assissted Laser Desorption Ionization)으로 이온화하고 Timeof-Flight (TOF), Quadrupole, Quardrupolar Ion Trap (QIT), Fourier Transform Ion Cyclotron Resonance (FT-ICR), Orbitrap을 포함하는 군에 선택되어진 어느 하나를 특징으로 하는 표적분자 분석 방법.
  41. (a) 표적분자(M)에 특이적인 결합 친화력이 있으며, 제1 포획성분에 친화력이 있는 제1 태그를 포함한 AptaSSN 집단과 제1 포획성분이 있는 제1 고체지지체(FSS)가 접촉하여, 상기 제1 태그와 상기 제1 포획성분이 결합한 AptaSSN-FSS 복합체를 제조하며, 상기 AptaSSN-FSS 복합체와 분자집단으로 구성된 시료가 접촉하여, 상기 표적분자가 상기 시료 안에 존재한다면 M-AptaSSN-FSS 복합체가 형성되는 제4 혼합용액을 제조하거나, 또는 표적분자(M)에 특이적인 결합 친화력이 있으며, 제1 포획성분에 친화력이 있는 제1 태그를 포함한 AptaSSN 집단과 시료가 접촉하여, 상기 표적분자가 상기 시료 안에 존재한다면 M-AptaSSN 복합체를 포함하는 반응 혼합물을 제조하며, 상기 제조된 반응 혼합물에 제1 포획성분이 있는 제1 고체지지체(FSS)를 첨가하고, 상기 M-AptaSSN 복합체의 AptaSSN에 있는 제1 태그와 상기 FSS의 제1 포획성분이 결합하여, M-AptaSSN-FSS 복합체가 형성되는 제4 혼합용액을 제조하는 단계;
    (b) 상기 제4 혼합용액에서 상기 AptaSSN과 결합하지 않거나 비특이적 결합을 한 상기 제4 혼합용액 성분을 해리시키기 위해, 하나 또는 그 이상의 용액으로 상기 M-AptaSSN-FSS 복합체를 세척하여, 상기 AptaSSN과 비특이적 결합을 하거나 결합되지 않은 하나 또는 그 이상의 혼합물의 성분을 제거하는 제1 분리 단계;
    (c) 상기 M-AptaSSN-FSS 복합체의 분자(M)에 제2 포획성분에 친화력을 가지는 제2 태그를 부가하는 단계;
    (d) 상기 제2 태그를 포함하는 M-AptaSSN-FSS 복합체와 상기 제2 포획성분이 있는 제2 고체지지체(SSS)가 접촉하여, 상기 제2 태그가 상기 제2 포획성분이 결합하여 SSS-M-AptaSSN-FSS 복합체가 형성되는 제5 혼합용액을 제조하는 단계;
    (e) 상기 제5 혼합용액에서 상기 제2 포획성분과 결합하지 않은 하나 또는 그 이상의 혼합물의 성분을 제거하는 제2 분리 단계; 및
    (f) 상기 SSS-M-AptaSSN-FSS 복합체로부터 상기 AptaSSN을 포함하는 물질 집단을 용출하는 단계; 및
    (g) 상기 용출된 AptaSSN을 포함하는 물질 집단의 AptaSSN을 분석하는 단계;를 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  42. 제41항에 있어서, 상기 (a) 단계 내지 (f) 단계를 실시하여 AptaSSN을 포함하는 물질 집단을 용출하는 장치는
    제12항 내지 제15항에 있는 AptaSSN 유체 자성 비드 장치(1000)를 사용하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  43. 제42항에 있어서,
    제1 주입구(1110) 및 제2 주입구(1120)으로 구성된 상기 주입부(1100) 그리고 제1 반응구(1210) 및 제2 반응구(1220)으로 구성된 상기 반응부(1200)으로 이루어진 상기 AptaSSN 유체 자성 비드 장치(1000)의 운영은
    (a) 상기 제1 주입구(1110)로부터 상기 분자(M)집단으로 구성된 시료 용액, 상기 AptaSSN 집단 용액 및 상기 FSS 용액이 주입되고, 상기 제1 반응구(1211)에서 상기 시료를 구성하는 분자(M)집단, 상기 AptaSSN의 제1 태그 및 상기 FSS의 제1 포획성분이 반응하여 M-AptaSSN-FSS 복합체가 형성되는 제4 혼합용액을 제조하는 단계;
    (b) 상기 제2 주입구(1120)로부터 세척용액이 주입되고, 상기 제1 반응부(1211)에서 제4 혼합용액에 있는 형성된 M-AptaSSN-FSS 복합체를 세척하여 상기 AptaSSN과 비특이적 결합을 하거나 결합되지 않은 하나 또는 그 이상의 혼합물의 성분을 상기 배출부(1220)로 제거하는 제4 분리 단계;
    (c) 상기 제1 주입구(1110)로부터 상기 제2 태그 용액이 주입되고, 상기 제2 반응구(1212)에 있는 M-AptaSSN-FSS 복합체의 분자(M)에 제2 태그를 부가하는 단계;
    (d) 상기 제2 반응구(1212)로부터 주입된 상기 제2 태그가 부가된 M-AptaSSN-FSS 복합체와 상기 포집부(1230)에 있는 SSS의 제2 포획성분이 접촉하여 SSS-M-AptaSSN-FSS 복합체가 형성되는 제5 혼합용액을 제조하는 단계;
    (e) 상기 제2 주입구(1120)로부터 상기 세척용액이 주입되고, 상기 포집부(1230)에 있는 제5 혼합용액에서 형성된 SSS-M-AptaSSN-FSS 복합체를 세척하여, 상기 제2 포획성분과 결합하지 않은 하나 또는 그 이상의 혼합물의 성분을 제거하는 제5 분리 단계; 및
    (f) 상기 제1 주입구(1110)로부터 용출용액이 주입되고, 상기 포집부(1230)에 있는 제2 분리된 SSS-M-AptaSSN-FSS 복합체로부터 상기 AptaSSN을 포함하는 물질 집단을 용출하는 단계;
    를 포함하는 것을 특징으로 하는 AptaSSN 유체 자성 비드 장치(1000).
  44. 제34항 내지 제43항에서, 상기 AptaSSN는
    검출가능한 부분(detectable moiety)을 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  45. 제44항에 있어서, 상기 검출가능한 부분은
    올리고뉴클레오티드, 염료(dye), 양자점(quantum dot), 방사성 표지(radiolabel), 전기화학적 작용기(electrochemical functional group) 및 효소(enzyme)와 검출가능한 효소 기질(detectable enzyme substrate)을 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  46. 제45항에 있어서, 상기 염료는
    형광 염료인 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  47. 제41항에 있어서, 상기 (b) 단계 및 (e) 단계에서 선택되어진 어느 한 단계 이상은
    유기용매가 있는 완충용액으로 세척하는 방법 및 엄격한 세척용액 방법을 포함하는 군에서 선택되어진 어느 한 방법 이상으로 실시하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  48. 제41항에 있어서, 상기 (f) 단계의 상기 AptaSSN-FSS 복합체 집단 또는 AptaSSN 집단의 용출 단계에서 사용하는 용출용액은
    pH 방법, 온도 방법 및 카오트로픽염(chaotropic salts) 방법을 포함하는 군에서 선택되어진 어느 한 방법으로 실시할 수 있는 용액을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  49. (a) 상기 AptaSSN 집단과 시료에 있는 분자(M)집단이 M-AptaSSN 복합체를 형성하는 단계;
    (b) 상기 형성된 M-AptaSSN 복합체를 유기용매가 있는 완충용액으로 세척하는 방법 및 엄격한 세척용액 방법으로 이루어진 군에서 선택되어진 어느 한 방법 이상으로 세척하는 단계; 및
    (c) 상기 세척한 M-AptaSSN 복합체에서 AptaSSN 집단을 분석하는 단계;를 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  50. 제49항에 있어서,
    상기 (a) 단계 전에 상기 시료에 있는 분자집단을 Nitrocellulose, polyvinylidene difluoride (PVDF) 및 nylon를 포함하는 군에서 선택되어진 어느 한 고체지지체에 결합하는 단계; 또는
    상기 (b) 단계 후에 모세관 전기영동하는 단계를 더 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  51. 제39항에 있어서, 상기 (g) 단계 또는 제48항에 있어서, (c) 단계의 상기 용출되는 AptaSSN을 포함하는 물질 집단의 AptaSSN의 분석은
    Q-PCR, 질량 분석기(mass spectroscopy), 차세대 시퀀싱(next-generation sequencing) 및 혼성화(hybridizatioin)로 이루어진 군으로부터 선택되어진 방법을 사용하여 검출되고 선택적으로 정량되는 방법을 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  52. 제51항에 있어서, 상기 Q-PCR 방법은,
    PCR 과정 동안에 TaqMan®PCR, 삽입성 형광 염료(intercalating fluorescent dye) 또는 PCR 과정동안에 분자 비콘(molecular beacon)을 사용한 방법을 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  53. 제51항에 있어서, 상기 질량분석기는
    말디톱(MALDI; Matrix Assissted Laser Desorption Ionization)으로 이온화하고 Timeof-Flight (TOF), Quadrupole, Quardrupolar Ion Trap (QIT), Fourier Transform Ion Cyclotron Resonance (FT-ICR), Orbitrap을 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  54. 제51항에 있어서, 상기 차세대 시퀀싱(next-generation sequencing) 방법은,
    (a) 분석하고자하는 AptaSSN의 염기서열로 데이터베이스를 구축하는 단계;
    (b) 상기 분자집단으로 구성된 시료와 AptaSSN 집단로부터 형성된 복합체에서 용출된 AptaSSN-FSS 복합체 집단 또는 용출된 AptaSSN 집단로부터 NGS 라이브러리를 제조하는 단계;
    (c) 상기 제조한 NGS 라이브러리를 NGS 장비로 염기서열을 결정하는 단계;
    (d) 상기 결정된 염기서열 자료를 상기 구축된 데이터베이스의 AptaSSN 염기서열과 비교 분석하여 상기 용출된 AptaSSN의 종류 ALC 출현빈도를 결정하는 단계; 및
    (e) 상기 분석된 AptaSSN의 종류 및 출현빈도를 사용하여 상기 시료를 구성하는 분자집단을 분석하는 단계;를 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  55. 제54항에 있어서,
    상기 AptaSSN의 출현빈도로부터 용출된 AptaSSN들의 프로파일을 결정하는 방법을 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  56. 제51항에 있어서, 상기 혼성화(hybridizatioin) 방법은,
    상기 제3 고체지지체에 상기 제2항의 (f) 단계에서 용출된 AptaSSN-FSS 복합체 집단, AptaSSN 또는 상기 AptaSSN의 증폭산물을 혼성화시키는 것을 포함하고, 상기 제3 고체지지체는 다수의 위치지정 가능한 특징(addressable feature)을 포함하며,
    상기 특징들 중 적어도 하나가 AptaSSN 내에 포함된 임의의 서열에 상보적인 그곳에 배치된 최소한의 포획성분을 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  57. 제39항에 있어서,
    상기 (b) 단계의 상기 M-AptaSSN-FSS 복합체 또는 (f) 단계의 상기 SSS-M-AptaSSN-FSS 복합체의 AptaSSN 부분을 검출함으로써 상기 분자를 검출하는 단계를 더 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 방법.
  58. (a) 시료에 있는 표적분자 집단에 대하여 특이적인 AptaSSN 집단;
    (b) 하나 또는 그 이상의 상기 고체지지체;
    (c) 하나 또는 그 이상의 상기 분리를 위한 시약 및 세척용액; 및
    (d) AptaSSN 복합체로부터 AptaSSN를 용출하기 위한 용출용액; 을 포함하는 것을 특징으로 하는 AptaSSN을 이용한 분자 분석 및 검사 키트.
  59. 제12항에 있어서, 상기 AptaSSN 유체 자성 비드 장치(1000)에 분석장치를 추가하는 것을 특징으로 하는 표적분자 검사 유체 자성 비드 장치.
  60. 제59항에 있어서,
    상기 분석장치는 현미경, 핵산 분석장치, 분광 분석장치, 형광물질 분석장치 및 전기신호 분석장치로 이루어진 군에서 선택되어진 어느 하나 이상을 특징으로 하는 표적분자 검사 유체 자성 비드 장치.
  61. (a) 다양한 유형의 분자집단으로 구성된 시료에 있는 분자집단에 대한 분자데이터를 생산하는 분자데이터 생산 모듈(100);
    (b) 상기 분자데이터 생산 모듈(100)에서 생산된 분자데이터가 있는 시료들을 생물학적 의미를 기준으로 구축된 학습 데이터베이스에서 선정된 내부정도관리 분자로 상기 평가 대상 시료의 분자데이터에 대해 내부정도관리하는 내부정도관리 모듈(200); 및
    (c) 상기 구축된 학습 데이터베이스에서 선정된 분류분자 및 상기 학습 데이터베이스를 학습하여 획득한 예측모델로 상기 내부정도관리 모듈(200)에서 입력되는 유효 분자데이터가 있는 특정 시료에 대해 생물학적 의미 결정지원을 하는 생물학적 의미 결정지원 모듈(300);를 포함하는 것을 특징으로 하는 내부정도관리 및 생물학적 의미 결정지원 시스템(1).
  62. 제61항에 있어서,
    (a) 상기 분자데이터 생산 모듈(100)이 상기 시료에 있는 분자집단에 대한 분자데이터를 생산하는 단계;
    (b) 상기 내부정도관리 모듈(200)이 상기 구축된 학습 데이터베이스에서 선정된 내부정도관리 분자데이터로 상기 분자데이터 생산 모듈(100)에서 입력되는 평가 대상 시료의 분자데이터에 대해 내부정도관리를 실시하여 유효 분자데이터를 선정하는 단계; 및
    (c) 상기 생물학적 의미 결정지원 모듈(300)이 상기 선정된 분류 분자데이터 및 상기 구축 학습 데이터베이스를 학습하여 획득한 예측모델로 상기 내부정도관리 모듈(200)에서 입력되는 유효 분자데이터를 분석하여 생물학적 의미 결정지원를 실시하는 단계;를 포함하는 것을 특징으로 하는 내부정도관리 및 생물학적 의미 결정지원 시스템(1).
  63. 제61항 내지 제62항에 있어서, 상기 분자데이터 생산 모듈(100)에서 분자데이터를 생산할 수 있는 분자는
    단백질(proteins), 폴리펩티드(polypeptides), 핵산(nucleic acid), 폴리뉴클레오티드(polynucleotide), 탄수화물(carbohydrates), 다당류(polysaccharides), 당단백(glycoproteins), 호르몬(hormones), 수용체(receptors), 항원(antigens), 항체(antibodies), 바이러스(viruses), 기질(substrates), 대사분자(metabolites), 전이상태 유사체(transition state analogs), 보조인자(cofoactors), 억제제(inhibitors), 약물(drugs), 염료(dyes), 영양분(nutrients), 성장 인자(growth factors), 세포, 단세포생물, 조직(tissues) 및 규제 약물(controlled substance)을 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 내부정도관리 및 생물학적 의미 결정지원 시스템(1).
  64. 제61항 내지 제63항에 있어서, 상기 내부정도관리 모듈(200)의 구성은
    (a) 상기 구축된 데이터베이스를 분석하여 1개 이상의 상기 내부정도관리 분자를 선정하는 모듈; 또는
    (b) 상기 선정된 1개 이상의 내부정도관리 분자; 및
    (c) 상기 분자데이터 생산 모듈(100)에서 입력되는 특정 시료의 분자데이터에 상기 선정된 내부정도관리 분자의 허용범위 여부를 확인하는 소프트웨어;를 포함하는 것을 특징으로 하는 내부정도관리 및 생물학적 의미 결정지원 시스템(1).
  65. 제61항 내지 제64항에 있어서, 상기 내부정도관리 분자의 선정은
    (a) 상기 구축된 데이터베이스를 구성하는 시료들의 분자데이터에 대한 평균과 표준편차를 계산하는 단계;
    (b) 상기 계산된 평균과 표준편차로 변동계수(Coefficient of Variation, CV)를 계산하여 1개 이상의 내부정도관리 분자를 선정하는 단계;
    (c) 상기 선정된 내부정도관리 분자들을 상기 평균값을 기준으로 그룹을 결정하는 단계; 및
    (d) 상기 결정된 그룹을 대표하는 내부정도관리 분자를 선정하는 단계;를 포함하는 것을 특징으로 하는 내부정도관리 및 생물학적 의미 결정지원 시스템(1).
  66. 제61항 내지 제65항에 있어서, 상기 내부정도관리 모듈(200)의 운영은
    (a) 상기 분자데이터 모듈(100)에서 입력되는 특정시료의 분자데이터에 대해 상기 선정된 내부정도관리 분자로 내부정도관리를 실시하여 유효 분자데이터를 결정하는 단계; 및
    (b) 상기 결정된 유효 분자데이터가 있는 특정시료를 생물학적 의미 결정지원 모듈(300)에 입력하는 단계;를 포함하는 것을 특징으로 하는 내부정도관리 및 생물학적 의미 결정지원 시스템(1).
  67. 제61항 내지 제66항에 있어서, 상기 내부정도관리는
    Levey-Jennings Control Chart(관리도)를 포함하는 단일규칙 관리도 및 Westgard Multirules 관리도를 포함하는 다중규칙 관리도를 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 내부정도관리 및 생물학적 의미 결정지원 시스템(1).
  68. 제61항 내지 제67항에 있어서, 상기 생물학적 의미 결정지원 모듈(300)의 구성은
    (a) 상기 구축된 데이터베이스를 분석하여 1개 이상의 분류분자를 선정하는 모듈; 또는
    (b) 상기 선정된 1개 이상의 분류분자; 및
    (c) 상기 데이터베이스 및 상기 선정된 분류 분자데이터를 대상으로 기계학습언어 군에서 선택되어진 어느 하나 이상으로 학습한 소프트웨어;를 포함하는 것을 특징으로 하는 내부정도관리 및 생물학적 의미 결정지원 시스템(1).
  69. 제61항 내지 제68에 있어서, 상기 분류분자의 선정은
    상기 분자데이터가 있는 시료들을 생물학적 의미를 기준으로 구축된 데이터베이스를 대상으로 ANOVA, PCA 및 Random Forest를 포함하는 군에서 선택되어진 어느 하나 이상을 실시하는 것을 특징으로 하는 내부 정도관리 및 생물학적 의미 결정지원 시스템(1).
  70. 제61항 내지 제69항에 있어서, 상기 생물학적 의미 결정지원 모듈(300)의 운영은
    (a) 상기 데이터베이스를 구성하는 시료에 있는 분자데이터로부터 1개 이상의 분류분자를 선정하는 단계;
    (b) 상기 데이터베이스 및 상기 선정된 분류분자데이터에 대해 예측모델을 학습하는 단계; 및
    (c) 상기 학습된 예측모델로 상기 모듈(200)에서 입력되는 특정 시료의 유효 분자데이터에 대한 분류분자데이터를 분석하여 생물학적 의미 결정지원을 실시하는 단계;를 포함하는 것을 특징으로 하는 내부 정도관리 및 생물학적 의미 결정지원 시스템(1).
  71. 제61항 내지 제70항에 있어서,
    상기 다양한 유형의 분자집단으로 구성된 시료에 있는 핵산 및 단백질 집단을 동시에 분석하는 분자데이터 생산 모듈(100)을 포함하는 것을 특징으로 하는 내부정도관리 및 생물학적 의미 결정지원 시스템(1).
KR1020200032963A 2020-03-18 2020-03-18 시료를 분류할 수 있는 AptaSSN 선정 방법 및 장치, 이에 결합하는 분자 동정 방법 및 장치, AptaSSN 집단을 이용한 표적분자 분석 방법 및 장치, 그리고 생물학적 의미 결정지원 시스템 KR20210116863A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200032963A KR20210116863A (ko) 2020-03-18 2020-03-18 시료를 분류할 수 있는 AptaSSN 선정 방법 및 장치, 이에 결합하는 분자 동정 방법 및 장치, AptaSSN 집단을 이용한 표적분자 분석 방법 및 장치, 그리고 생물학적 의미 결정지원 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200032963A KR20210116863A (ko) 2020-03-18 2020-03-18 시료를 분류할 수 있는 AptaSSN 선정 방법 및 장치, 이에 결합하는 분자 동정 방법 및 장치, AptaSSN 집단을 이용한 표적분자 분석 방법 및 장치, 그리고 생물학적 의미 결정지원 시스템

Publications (1)

Publication Number Publication Date
KR20210116863A true KR20210116863A (ko) 2021-09-28

Family

ID=77923132

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200032963A KR20210116863A (ko) 2020-03-18 2020-03-18 시료를 분류할 수 있는 AptaSSN 선정 방법 및 장치, 이에 결합하는 분자 동정 방법 및 장치, AptaSSN 집단을 이용한 표적분자 분석 방법 및 장치, 그리고 생물학적 의미 결정지원 시스템

Country Status (1)

Country Link
KR (1) KR20210116863A (ko)

Similar Documents

Publication Publication Date Title
US20210371914A1 (en) Methods and compositions for identifying or quantifying targets in a biological sample
US11732302B2 (en) Methods and systems for processing polynucleotides
JP6902073B2 (ja) 配列をアラインするための方法およびシステム
EP3978622B1 (en) Composition for processing polynucleotides
JP2022120007A (ja) 5-ヒドロキシメチル化無細胞系dnaをシーケンシングすることによる非侵襲性診断
WO2015058120A1 (en) Methods and systems for aligning sequences in the presence of repeating elements
CA2388738A1 (en) Data analysis and display system for ligation-based dna sequencing
KR102512168B1 (ko) 차세대서열결정법을 이용한 표적 단백질의 집단적 정량 방법과 그 용도
KR20180041331A (ko) 분자결합핵산 선정과 표적분자 동정 방법 및 키드, 그리고 그들의 용도
Oteng et al. High-efficiency enrichment enables identification of aptamers to circulating Plasmodium falciparum-infected erythrocytes
KR101829668B1 (ko) 생체분자와 단일가닥핵산의 결합정보를 생성하기 위한 기준물질 및 핵산칩, 이들의 제조방법 및 이들을 이용한 생체분자 분석방법 및 장치
KR20210116863A (ko) 시료를 분류할 수 있는 AptaSSN 선정 방법 및 장치, 이에 결합하는 분자 동정 방법 및 장치, AptaSSN 집단을 이용한 표적분자 분석 방법 및 장치, 그리고 생물학적 의미 결정지원 시스템
KR20210116862A (ko) 시료를 분류할 수 있는 결합 단일가닥핵산 선정 및 이에 결합하는 분자 동정 방법, AptaSSN 집단을 이용한 표적 분자 분석 방법 그리고 생물학적 의미 결정지원 시스템
EP3676846A1 (en) Site-specific noise model for targeted sequencing
KR102403628B1 (ko) 시료의 표적분자 집단에 대한 프로파일을 얻는 방법
KR20230129675A (ko) 결합올리고뉴클레오티드의 제조 및 용도
Gordon et al. Click-PD: A quantitative method for base-modified aptamer discovery
Gierahn et al. Seq-Well: A Portable, Low-cost Platform for Single-Cell RNA-Seq of Low-Input Samples
Ahmed et al. Enhanced framework for miRNA target prediction
Patil CHARACTERIZING NEXT-GENERATION SEQUENCING (NGS) PLATFORMS FOR MULTIPLEXED BIOSENSING AND APTAMER DISCOVERY: G-QUADRUPLEX APTAMERS AS A CASE STUDY