KR20140108177A - 유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치 - Google Patents

유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치 Download PDF

Info

Publication number
KR20140108177A
KR20140108177A KR1020140024262A KR20140024262A KR20140108177A KR 20140108177 A KR20140108177 A KR 20140108177A KR 1020140024262 A KR1020140024262 A KR 1020140024262A KR 20140024262 A KR20140024262 A KR 20140024262A KR 20140108177 A KR20140108177 A KR 20140108177A
Authority
KR
South Korea
Prior art keywords
score
analysis
present
sequence
chromosome
Prior art date
Application number
KR1020140024262A
Other languages
English (en)
Other versions
KR101614471B1 (ko
Inventor
박종화
김태형
김종수
박신기
Original Assignee
주식회사 테라젠이텍스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 테라젠이텍스 filed Critical 주식회사 테라젠이텍스
Publication of KR20140108177A publication Critical patent/KR20140108177A/ko
Application granted granted Critical
Publication of KR101614471B1 publication Critical patent/KR101614471B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 비침습적인 태아 기형 산전 진단 방법에 관한 것이다. 보다 구체적으로 본 발명은 산모의 혈액으로부터 추출한 게놈 DNA (genomic DNA)에 대한 시퀀싱(sequencing) 정보들을 분석하여 파라미터를 도출하고, 이를 이용하여 태아의 염색체 이수성(aneuploidy)을 정확히 판정함으로써 기형 여부를 진단하는 방법에 관한 것이다. 본 발명에 따른 진단 방법은 산모의 혈액 샘플을 이용하여 분석이 가능하다는 점에서 산모나 태아에게 해를 가하지 않으며 간편하다는 장점이 있다. 또한 적은 양의 태아 염색체로도 상당히 정확한 진단이 가능함을 확인하였다. 따라서 본 발명의 방법은 태아의 염색체 수 이상으로 인한 기형 여부를 조기에 판단할 수 있는 산전 진단 방법으로 유용하게 이용될 수 있다.

Description

유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치{Method and apparatus for diagnosing fetal chromosomal aneuploidy using genomic sequencing}
본 발명은 비침습적인 태아 기형 산전 진단 방법에 관한 것이다. 보다 구체적으로 본 발명은 산모의 혈액으로부터 추출한 게놈 DNA (genomic DNA)에 대한 시퀀싱(sequencing) 정보들을 분석하여 태아의 염색체 이수성(aneuploidy)을 정확히 판정함으로써 기형 여부를 진단하는 방법 및 이를 위한 장치에 관한 것이다.
'산전 진단'이란 태아가 태어나기 전 태아의 질병 유무를 판단 및 진단하는 과정을 말한다. 최근의 한 국내 통계자료에 따르면, 선천성 기형아가 전체 신생아의 약 3%에 이르며, 선천성 기형아 중 약 20%는 염색체 이상에 의한 것으로 보고되었다. 특히 널리 알려져 있는 다운증후군에 해당하는 기형아는 선천성 기형아의 약 26%에 이른다. 이러한 기형아 출산율의 증가와 여러 산전 진단 장비들의 개발로 인하여 산전 진단에 대한 관심은 날로 증가하고 있다. 특히, 만 35세 이상의 고령의 임산부, 염색체 이상이 있는 아이의 분만 경력이 있는 임산부, 부모 중 한 명에게서 염색체의 구조적 이상이 있는 경우, 유전질환의 가족력이 있는 경우, 신경관결손의 위험이 있는 경우, 모체혈청 선별검사와 초음파검사에서 태아기형이 의심되는 경우 등에는 산전 진단을 받을 필요가 있다.
산전 진단 방법은 크게 침습적 진단 방법과 비침습적 진단 방법으로 나누어 볼 수 있다. 침습적 진단 방법의 예로는, 임신 10 ~ 12주 사이에 시행하는 융모막검사(chorionic villi sampling, CVS), 임신 15 ~ 20주 사이에 면역분석법을 이용하여 양수 내 AFP의 농도를 측정함으로써 태아의 염색체를 분석하는 양수천자(amniocentesis), 임신 18 ~ 20주 사이에 초음파 유도하에 탯줄로부터 직접 태아 혈액을 추출하는 방법으로 시행하는 탯줄천자(cordocentesis) 방법 등이 있다. 그러나 위와 같은 침습적 진단 방법들은 검사 과정에서 태아에게 충격을 가하여 유산이나, 질병 또는 기형 등을 유발할 수 있으므로, 이러한 문제점들을 극복하기 위하여 비침습적 진단 방법들이 개발되고 있다. 예를 들어, 배아 착상 전 유전진단 방법은 체외수정에서 사용되는 분자유전학적 또는 세포유전학적 기술을 이용하여 자궁 내 착상 전 유전적 결함이 없는 배아를 선택하는 기술이다. 또한, 염색체 이수성(aneuploidy)을 신속히 진단하기 위한 QF-PCR (quantitative-fluorescent PCR) 형광 정량법은 염색체마다 특이적으로 존재하는 DNA의 짧은 염기서열 반복 표지자(short tandem repeats, STR)에 형광을 붙여 멀티플렉스(multiplex) PCR 법으로 증폭한 후 DNA 자동염기서열 분석기로 형광이 붙은 증폭된 DNA의 양을 측정하여 분석하는 신속 선별 검사방법이다. 또한, 복제수 변이(copy number change)를 찾아내기 위하여 유리 슬라이드 위에 맵핑한 DNA 서열(mapped DNA sequence)을 집적하여 검사하는 염색체 마이크로어레이 (chromosomal microarray, CMA) 방법 등이 알려져 있다.
한편, 시퀀싱 기술의 발달로 대규모의 유전체 정보를 해독하는 것이 가능해짐에 따라, 이러한 차세대 시퀀싱(Next-Generation Sequencing, NGS) 기술을 기반으로 한 유전체 분석 방법들이 산전 진단 영역에도 활용되고 있다. 특히, 모체의 혈액에는 태아의 유전체가 전체 유전체의 약 10% 수준으로 함유되어 있다는 사실이 알려져 있으며, 이를 이용하여 태아의 세포를 모체의 혈액에서 분리하여 그 염색체를 분석하려는 산전 진단 방법들이 알려져 있다. 이와 관련하여 대한민국특허출원 제2010-7003969호는 대규모 병렬 게놈 시퀀싱(massively parallel genomic sequencing)을 이용한 태아 염색체 이수성의 진단 방법에 관하여 개시하고 있다. 또한, 미국등록특허 제8195415호 역시 산모 혈액으로부터 수득한 DNA의 서열분석 결과를 각 염색체별로 특정 길이에 대해 맵핑(mapping)하여 정량분석하는 방법을 개시하고 있다. 상기 발명들은 대규모 병렬 게놈 서열분석 결과를 이용하여 태아 염색체 수의 이상을 판단한다는 점에서 본원 발명과 유사한 측면이 있지만, 구체적인 파라미터 값의 설정 방법에서 모두 본원 발명과는 차이가 있다.
본 발명은 산모의 혈액에 함유된 태아의 유전체를 이용하여 간편하게 태아의 염색체 이상 여부를 진단할 수 있는 방법 및 이를 위한 장치를 제공하는 것을 목적으로 한다.
상기한 목적을 달성하기 위하여, 본 발명은 정상 태아 및 염색체 이수성을 가진 태아를 임신한 산모들의 혈액으로부터 추출한 게놈 DNA (genomic DNA)를 분석하여 진단방법에 대한 파라미터 (GC 함량에 대한 Filter 및 Read Depth에 대한 Filter) 및 Z-score CutOff 값을 추출하고, 진단 대상인 피험자를 대상으로 상기 추출된 파라미터를 사용하여 나온 Z-score값에 대해 Z-score CutOff 값을 기준으로 이상 여부를 확인하여 태아의 염색체 이수성을 진단하는 방법을 제공한다.
구체적으로 상기 진단 방법은,
임신한 여성 피험자로부터 태아의 유전체를 포함하는 혈액 시료를 채취하는 단계;
상기 혈액 시료로부터 게놈 DNA (genomic DNA)를 추출하여 대규모 병렬 시퀀싱(massively parallel sequencing)을 수행하는 단계;
상기 시퀀싱한 리드(read) 서열들을 사람 참조(reference) 유전체에 맵핑(mapping)하는 단계;
상기 리드(read)들의 두께 분포(depth distribution)를 일정한 구간별로 확인하여 서열정보에 대한 신뢰도가 낮은 부분을 분석대상에서 제거하는 단계;
상기 제거하고 남은 서열 구간 부분에 대하여 추가로 GC 함량을 조사하여 신뢰도가 높은 부분을 분석 대상으로 설정하는 단계;
전체 상염색체(autosome)에 대하여 상기 분석 대상으로 설정된 구간들의 두께(depth) 값을 이용하여 하기 식에 따른 Z-score를 계산하는 단계,
Figure pat00001
;
상기 각 구간에 대하여 계산된 Z-score들에 대하여 각 염색체별로 평균값을 구하는 단계; 및
각 염색체별로 산출된 Z-score 평균값에 대하여 통계적 모델에 의한 Z-score CutOff 기준을 적용하여 ‘염색체 이상’여부를 판정하는 단계를 포함한다.
본 발명의 일실시예에 있어서, 상기 '구간'은 게놈 DNA 상에서 300kb 단위로 설정될 수 있다.
본 발명의 일실시예에 있어서, 상기 서열정보에 대한 신뢰도가 낮은 부분을 분석대상에서 제거하는 단계는, 미스매치(mismatch) 부분을 제거하는 방법, 여러 부위에 붙는 리드(read) 서열 부분을 제거하는 방법, PCR에서 중복적인 리드를 제거하는 방법들로 이루어진 군에서 선택될 수 있다.
본 발명의 일실시예에 있어서, 상기 GC 함량을 조사하여 신뢰도가 높은 부분을 분석 대상으로 설정하는 방법은, GC 함량을 조사하여 0.35 < GC 함량 < 0.45의 조건을 만족하는 서열 구간만 분석 대상으로 설정하는 방법으로 이루어질 수 있다.
본 발명의 일실시예에 있어서, 상기 진단 방법은 태아의 13번, 18번 및 21번 염색체로 이루어진 군에서 선택되는 어느 하나 이상의 염색체에 대한 이수성 여부를 진단하는 방법일 수 있다.
본 발명에 따른 진단 방법은 산모의 혈액 샘플을 이용하여 분석이 가능하다는 점에서 산모나 태아에게 해를 가하지 않으며 간편하다는 장점이 있다. 또한 적은 양의 태아 염색체로도 상당히 정확한 진단이 가능함을 확인하였다. 따라서 본 발명의 방법은 태아의 염색체 수 이상으로 인한 기형 여부를 조기에 판단할 수 있는 산전 진단 방법으로 유용하게 이용될 수 있다.
도 1은 본 발명의 진단 방법을 나타낸 흐름도이다.
도 2는 본 발명의 실시예에 따른 진단 방법의 3) 단계의 상세 흐름도이다.
도 3은 본 발명의 실시예에 따른 진단 방법의 1) 단계의 상세 흐름도이다.
도 4는 시퀀싱을 통해 생성된 데이터(Raw Data)에 대해 염기서열의 퀄리티(Base Quality) 및 염기서열들의 종류별 분포를 나타낸 플롯(plot)이다.
도 5는 본 발명의 일실시예에 따라, 300kb 구간으로 설정된 게놈 DNA에 대한 리드(read) 두께 분포(depth distribution)를 확인한 결과를 나타낸다.
도 6은 GC 함량을 분석한 결과이다. 왼쪽 도면은 전체 DNA 상의 분포를 나타낸 것이고, 오른쪽 그림은 빈도수가 높은 부분(진하게 나타나는 부분)을 확대한 것이다. 진하게 나타나는 부분이 빈도수가 높은 영역이다.
도 7은 본 발명의 일실시예에 따라, 300kb 구간으로 설정된 게놈 DNA에 대하여 본 발명의 방법으로 태아의 13번, 18번 및 21번 염색체에 대한 이수성을 판정하는 방법과 그 결과를 보여주는 그림이다.
도 8은 본 발명의 진단 방법의 정확성을 보여주는 표이다. 핵형분석을 통하여 진단된 태아에(염색체 18번 4명, 염색체 21번 7명) 대한 결과와 비교하였으며, 본 발명의 방법에 따라 진단한 결과 '염색체 이상(abnormal)'으로 판정된 수가 각각 염색체 18번 4명(100%), 염색체 21번 7명(100%) 이었으며, 정상으로 판정된 수가 74명(100%)로 진단되었다.
도 9는 본 발명의 진단 장치의 구성도이다.
본 발명은 정상 태아를 임신한 산모들의 혈액으로부터 추출한 게놈 DNA (genomic DNA)를 분석하여 태아의 염색체 이수성을 진단하는 방법에 관한 것으로서,
1) 임신한 여성 피험자로부터 채취된 혈액 시료에서 게놈 DNA (genomic DNA)를 추출하여 병렬 시퀀싱(massively parallel sequencing)을 수행하는 단계;
2) 시퀀싱된 리드(read) 서열들을 사람 참조(reference) 유전체에 맵핑(mapping)하는 단계;
3) 상기 리드(read) 서열들의 두께 분포(depth distribution) 및 GC 함량을 일정한 구간별로 확인하여 분석 대상으로 설정하는 단계;
4) 전체 상염색체(autosome)에 대하여 상기 분석 대상으로 설정된 구간들의 두께(depth) 값을 이용하여 하기 식에 따른 Z-score를 계산하는 단계
Figure pat00002
;
5) 상기 계산된 Z-score들에 대하여 각 염색체별로 평균값을 산출하는 단계;
6) 각 염색체별로 산출된 Z-score 평균값을 통계적 모델에 의한 Z-score CutOff 기준에 적용하여 ‘염색체 이상’ 여부를 판정하는 단계를 포함한다(도 1).
본 발명의 일실시예에 있어서, 상기 1)단계의 혈액 시료로부터 게놈 DNA (genomic DNA)를 추출하는 방법은 공지의 DNA 추출 방법이 널리 사용될 수 있다. 대규모 병렬 시퀀싱(massively parallel sequencing)을 수행하는 방법으로는 시료의 정성분석 및 정량분석을 통하여 정도관리 기준을 통과한 샘플에 대하여 라이브러리 제작을 한다. 라이브러리를 제작하는 방법은 정도관리 기준을 통과한 샘플에 대해 단편화를 시킨다. 정도관리 기준을 통과한 샘플에 대해 단편화되어 있는 gDNA에 End Repair Enzyme을 이용하여 end repair된 DNA를 다시 Agencourt AMPure XP bead를 이용하여 정제 한 뒤, Ion Xpress™ Barcode가 붙은 A adaptor와 Ion P1 Adapter를 ligation하고 Nick Repair Polymerase로 Adaptor와 gDNA의 빈부분을 채워준 다음 정제한다. adapter-ligated lirary를 증폭하고, 증폭된 샘플을 정제한 뒤 Bioanalyzer를 이용하여 품질검사 한다. 품질검사를 통과한 라이브러리는 Template prep을 위해 One-Touch2 기기를 이용하여 ISP를 제작한다. Sequencing을 위한 ISP가 제작되었으면 Sequencing 200kit V2를 Proton에 설치하고 PI chip에 만든 ISP를 로딩한다. chip을 기기에 위치 시킨 후 Chip Check을 수행하여 chip 및 시약에 문제가 없음을 확인하고, 염기서열 해독을 진행한다. Torrent Browser의 Monitor Tab에서 Loading, Live ISPs, Library ISPs가 정상적인지에 대해 확인한다.
상기 3)단계는, 3-1) 서열 정보에 대해 설정된 구간별로 분석 대상 여부를 검사하여, 부적합한 서열 구간으로 확인되는 서열 구간을 분석대상에서 제거하는 단계; 및 3-2) 남은 서열 구간 부분에 대하여 GC 함량을 조사하여 기준 범위에 해당하는 부분을 분석대상으로 설정하는 단계를 포함한다(도 2).
상기 3-1)단계는 리드(read)들의 두께 분포(depth distribution)를 일정한 구간별로 확인하여 서열정보에 대한 신뢰도가 낮은 부분을 분석대상에서 제거하는 단계로서, 이에 제한되는 것은 아니나, 본 발명의 일실시예에 있어서, 상기 구간은 300kb 단위로 설정될 수 있다 위와 같이 300kb로 설정한 이유는 염기서열 GC 비율을 이용하여 필터링하기 위함이며, 300kb 단위로 설정했을 때 염색체 내 두께(depth) 및 GC 비율의 집단을 형성할 수 있어 통계적인 분석에 용이하기 때문이다.
상기 3-1)단계에서 제거 대상의 서열 구간은 여러 군데(multi) 붙는 서열, PCR 중복 리드(PCR duplicated reads)가 포함될 수 있으며, 여러 군데(multi) 붙는 서열들을 제거하는 이유는 반복서열영역일 가능성이 크기 때문이며, 또 PCR duplication reads를 제거하는 이유는 시퀀싱을 하기 위해 증폭하는 과정이 필요한데 오류로 증폭이 더 많이 된 부분을 제거하기 위함이다. 또한, 반복이 많은 영역(high repeat region)은 두께(depth)가 높기 때문에 그 부분을 제거하기 위하여 80 percentile (각 값의 오름차순에서의 순서가 각 값의 개수에 대해 80%되는 부분) 되는 지점보다 높은 값들을 제거 하였고, 반대로 노이즈(noise)가 발생할 수 있는 부분을 제거하기 위하여 20 percentile(각 값의 오름차순에서의 순서가 각 값의 개수에 대해 20%되는 부분) 되는 지점보다 낮은 값들은 제거했고, 두께가 없는 부분은 N 영역(Region)이 대부분이기 때문에 분석에서 제외하였다. 통계적으로 분석하기 위해서는 어느 정도 편차가 고른 집단을 선택해야 유의한 결과가 나올 수 있다. 그러나 위의 경우는 너무 높게 나오는 부분이나 낮게 나오는 부분들이 평균이나 전체 값에 영향을 줄 수 있기 때문에 적당한 집단을 선택하기 위해 맵핑이 안 된 부분과 너무 높은 부분을 제거한 것이다.
본 발명의 일실시예에 있어서, 상기 3-2)단계는 제거하고 남은 서열 구간 부분에 대하여 GC 함량을 조사하여, 0.35 < GC 함량 < 0.45의 조건을 만족하는 서열 구간만 분석 대상으로 설정하는 방법으로 수행될 수 있다. 사람의 유전체의 GC 함량은 약 40%인 것으로 알려져 있으므로 사람의 GC 함량에 가까운 서열정보들만을 분석의 대상으로 함으로써 정확도를 높이기 위함이다.
상기 4) 단계는 전체 상염색체(autosome)에 대하여 상기 분석 대상으로 설정된 구간들의 두께(depth) 값을 이용하여 하기 식에 따른 Z-score를 설정하는 단계이다.
Figure pat00003

본 발명에 따른 상기 Z-score 값은 상염색체 전체를 대상으로 계산한 구간별 리드 두께(depth)의 평균 및 표준편차를 이용한 값이다. 즉, 전체 영역에 대해서 표준편차가 1이고, 평균이 0인 Z-score 집단을 만든 것이다. 따라서 모든 값에 대한 표준화를 수행한 것이다.
상기 본 발명에 따른 진단 방법은 태아의 13번, 18번 및 21번 염색체로 이루어진 군에서 선택되는 어느 하나 이상의 염색체에 대한 이수성 여부를 진단할 수 있다. 13번 염색체의 이상은 파타우 증후군(Patau syndrome)과 관련이 있다. 파타우 증후군은 태아 2만 ~ 2만 5천 명중 1명의 비율로 나타나며, 중추신경계 및 심장 등 중요 장기의 심한 선천성 기형을 나타내어 1년 이내 사망하는 것으로 알려져 있다. 18번 염색체 이상은 에드워즈 증후군(Edwards syndrome)과 관련이 있다. 에드워즈 증후군은 태아 8천 명당 1명꼴로 나타나며, 여아에게서 3~4배 정도 발생빈도가 높다. 여러 장기의 심한 기형 및 정신지체 장애를 나타내어 10주 이내 사망하는 것으로 알려져 있다. 21번 염색체 이상은 다운증후군(Down syndrome)과 관련이 있다. 800명 중 1명의 비율로 나타나며, 정신 지체, 신체 기형, 성장 장애 등의 증상을 나타낸다. 수명은 20세 ~ 30세 정도이다.
본 발명의 일실시예에 있어서, 상기 6) 단계는 염색체별로 산출된 Z-score 평균값으로 염색체 이상 여부를 판단하는 단계이며, 정규분포를 따른다고 가정할 수 없는 두 군(정상군, 염색체 이상군)은 평균을 통해 크기의 차이를 비교할 수 없기 때문에, 모수의 특성을 따지지 않는 비모수적인 방법인 순위합 검정 통계 모델(Mann-Whitney test)의 분석을 통하여 정상군의 Highest Z-score 값과 염색체 이상군의 Lowest Z-score 값의 차이로 설정된 Z-score 기준값(cutoff)을 적용하여, 기준값을 초과하는 경우 염색체 이상으로 판단하였다.
이하, 본 발명을 실시예에 의해 상세히 설명하기로 한다. 그러나 이들 실시예는 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
< 실시예 1> 산모의 혈액에서 추출한 gDNA 의 염기서열해독
임신 12주 이상의 산모 85명으로부터 혈액 5ml를 채혈한 뒤, 1-1) 이를 원심분리시켜 혈장(plasma)만 분리하였다. 1-2) 상기 분리된 혈장을 용해한 후 QIAGEN DNA 미니 키트를 사용하여 gDNA를 추출한 후, 1-3) Life tech사의 라이브러리 제작 가이드라인에 따라 라이브러리를 제작하고 IPS를 생성하였다. 1-4) 그 후 Sequencing 200kit V2를 Proton 기기에 설치하고 PI chip에 만든 IPS를 로딩하고 염기서열 해독을 하였다(도 3). 도 4는 본 발명의 실시예에서 시퀀싱을 통해 생성된 데이터(Raw Data)에 대해 염기서열의 퀄리티(Base Quality) 및 염기서열들의 종류별 분포를 나타낸 플롯(plot)이다.
< 실시예 2> 해독된 gDNA 서열의 참조 맵핑( reference mapping )
참조 맵핑(reference에 mapping)을 통하여 여러 군데(multi) 붙는 서열들은 제거하였고, PCR Duplication으로 인한 오류를 제거하기 위하여 같은 위치에 맵핑되는 서열들에 대해서는 PCR Duplication으로 가정하고 서열을 제거하였다. 표 1은 염기서열 해독한 결과에 대한 내용으로서 해독된 각 샘플별 해독된 염기서열들은 평균 7,478,574 Read가 생산이 되었고, 평균 총 생산된 염기서열의 수는 961,605,947 bp, 평균 총 mapping된 서열들의 수는 7,417,179 Read, 그에 대한 비율은 99.18%이다. 또한 참조 서열의 염기서열 개수에 비례하여 생산된 양은 참조서열의 염기서열의 개수를 1X로 가정하였을 때, 각 샘플별 평균 0.32X 염기서열을 생산하였다.
Figure pat00004
< 실시예 3> 구간별 리드 두께( depth ) 추출 및 GC 함량 계산
실제로 게놈(genome) 상에 리드들이 골고루 붙었는지 확인하기 위하여, 300kb 구간별 slide window 500bp로 리드의 두께(depth)를 추출하고, line plot으로 게놈 상의 두께 분포(depth distribution)를 확인하였다(도 5).
또한, GC bias를 확인하기 위하여, 사람 참조(reference) 서열을 이용하여 GC 함량을 계산하고 Scatter plot으로 나타내었다(도 6). 도 6에서 색이 진할수록 그 부분에 해당하는 빈도수(frequency)가 높다는 것을 의미한다. 보통 사람의 경우에는 GC 함량이 40%인 것으로 알려져 있기 때문에, GC 함량이 35 ~ 45%인 영역들을 선별하여 본 발명의 분석을 수행하였다.
추가로, 반복이 많은 영역(high repeat region)은 두께(depth)가 높기 때문에 그 부분을 제거하기 위하여 80 percentile (각 값의 오름차순에서의 순서가 각 값의 개수에 대해 80%되는 부분) 되는 지점보다 높은 값들을 제거 하였고, 반대로 분석에 대하여 노이즈(noise)가 발생할 수 있는 부분을 제거하기 위하여 20 percentile (각 값의 오름차순에서의 순서가 각 값의 개수에 대해 20%되는 부분) 되는 지점보다 낮은 값들은 제거하였다.
< 실시예 4> 본 발명의 Z- score 계산에 따른 진단결과
<4-1> 본 발명에 따른 Z- score 의 계산
300kb로 설정한 각 구간별 리드의 두께(depth)를 이용하여 상염색체(autosome) 전체의 평균값과 표준편차를 구한 후, 평균이 0, 표준편차가 1인 Z-score 집단을 만들었고, 각 염색체별로 Z-score의 평균값을 구하여 진단에 사용하였다(도 7). 도 7에서, 정규분포를 따른다고 가정할 수 없는 두 군(정상군, 염색체 이상군)은 평균을 통해 크기의 차이를 비교할 수 없기 때문에, 모수의 특성을 따지지 않는 비모수적인 방법인 순위합 검정 통계 모델인 Mann-Whitney test를 통하여 Z-score Cutoff를 추출하였고, 추출된 Z-score Cutoff보다 높은 값을 가지게 되면 ‘염색체 이상’으로 판단하였다. 이와 같은 설정은 순위합 통계 모델인 Mann-Whitney test를 통하여 선정된 값이므로, 정상군과 염색체 이상으로 확인된 환자의 수가 많아질수록 더욱 정확한 진단이 가능해 질 것이다. 다만, 본 발명의 실시예에서는 전체 샘플 수가 85이므로 이에 해당하는 값에 한해서이다.
<4-2> 진단결과
위와 같은 방법으로 27명의 피험자에 대하여 본 발명의 진단 방법을 테스트해 본 결과, 13번 염색체 수 이상(T13)에 대해서는 이상자가 없었기 때문에 판별을 할 수 없었고, 18번 염색체 수 이상(T18)에 대해서는 총 4명의 이상자 중 4명을 확진으로 진단하였다. 마지막으로 21번 염색체 수 이상(T21)은 총 7명의 이상자 중 7명을 확진 진단하였다(도 8).
위와 같은 결과들은 본 발명의 진단 방법이 염색체 분석 결과 리드의 두께(depth)가 낮은 경우에도 비교적 정확하게 염색체 이상을 판단할 수 있는 방법임을 보여준다. 이로써 본 발명의 방법을 통하여 태아 염색체 수와 관련된 산전 진단이 가능하다는 것을 확인하였다.
도 9는 본 발명에 따른 진단 장치의 구성도로 임신한 여성 피험자로부터 채취된 혈액 시료에서 게놈 DNA (genomic DNA)를 추출하여 병렬 시퀀싱(massively parallel sequencing)을 수행하는 시퀀싱부(10), 시퀀싱된 리드(read) 서열들을 사람 참조(reference) 유전체에 맵핑(mapping)하는 맵핑부(20), 상기 리드(read) 서열들의 두께 분포(depth distribution) 및 GC 함량을 일정한 구간별로 확인하여 분석 대상으로 설정하는 분석대상 설정부(30), 상기 분석 대상으로 설정된 구간들의 두께(depth) 값을 이용하여 Z-score 값을 산출하는 Z-score 산출부(40), 상기 산출된 Z-score들에 대하여 각 염색체별로 평균값을 산출하는 평균값 산출부(50) 및 각 염색체별로 산출된 Z-score 평균값을 확인하여 염색체 이상여부를 판단하는 판단부(60)를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
10 : 시퀀싱부
20 : 맵핑부
30 : 분석대상 설정부
40 : Z-score 산출부
50 : 평균값 산출부
60 : 판단부
100 : 진단 장치

Claims (10)

1) 임신한 여성 피험자로부터 채취된 혈액 시료에서 게놈 DNA (genomic DNA)를 추출하여 병렬 시퀀싱(massively parallel sequencing)을 수행하는 단계;
2) 시퀀싱된 리드(read) 서열들을 사람 참조(reference) 유전체에 맵핑(mapping)하는 단계;
3) 상기 리드(read) 서열들의 두께 분포(depth distribution) 및 GC 함량을 일정한 구간별로 확인하여 분석 대상으로 설정하는 단계;
4) 전체 상염색체(autosome)에 대하여 상기 분석 대상으로 설정된 구간들의 두께(depth) 값을 이용하여 하기 식에 따른 Z-score 값을 구하는 단계
Figure pat00005
;
5) 상기 Z-score 값에 대하여 각 염색체별로 Z-score 평균값을 산출하는 단계;
6) 각 염색체별로 산출된 Z-score 평균값을 확인하여 염색체 이상여부를 판단하는 단계를 포함하는 태아 염색체 이수성의 진단을 위한 정보제공방법.
제1항에 있어서,
상기 1) 단계는,
(a) 채취된 혈액을 원심분리하여 혈장을 분리하는 단계;
(b) 분리된 상기 혈장을 용해하여, gDNA를 추출하는 단계;
(c) 추출된 상기 gDNA에 대한 라이브러리를 제작하고 IPS를 생성하는 단계;
(d) 생성된 상기 IPS를 로딩하여, 염기서열을 해독하는 단계를 포함하는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 3) 단계의 상기 구간은 게놈 DNA 상에서 300kb 단위로 설정된 것을 특징으로 하는 방법.
제1항에 있어서,
상기 3) 단계는,
(a) 서열 정보에 대해 구간별로 분석 대상 여부를 검사하여, 부적합한 서열 구간으로 확인되는 서열 구간을 분석대상에서 제거하는 단계; 및
(b) 남은 서열 구간 부분에 대하여 GC 함량을 조사하여 기준 범위에 해당하는 부분을 분석대상으로 설정하는 단계를 포함하는 것을 특징으로 하는 방법.
제4항에 있어서,
상기 (a) 단계는,
미스매치(mismatch) 부분을 제거하는 방법, 여러 부위에 붙는 리드(read) 서열 부분을 제거하는 방법, PCR에서 중복적인 리드를 제거하는 방법들로 이루어진 군에서 선택되는 어느 하나 이상의 방법들로 수행되는 것을 특징으로 하는 방법.
제4항에 있어서,
상기 (a) 단계는,
반복이 많은 영역(high repeat region)에 대해서는 80 percentile 되는 지점보다 높은 값들을 분석대상에서 제거하고, 맵핑(mapping)이 적게 되는 영역에 대해서는 20 percentile 되는 지점보다 낮은 값들을 분석대상에서 제거하는 것을 특징으로 하는 방법.
제4항에 있어서,
상기 (b) 단계는
0.35 < GC 함량 < 0.45 을 만족하는 서열 구간만 분석 대상으로 설정하는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 6) 단계는,
순위합 검정 통계 모델인 Mann-Whitney test를 통하여 설정된 기준값(cutoff)을 적용하는 것을 특징으로 하는 방법.
제1항 내지 제8항 중의 어느 한 항에 있어서,
상기 방법은 태아의 13번, 18번 및 21번 염색체로 이루어진 군에서 선택되는 어느 하나 이상의 염색체에 대한 이수성 여부를 진단하기 위한 것을 특징으로 하는 방법.
임신한 여성 피험자로부터 채취된 혈액 시료에서 게놈 DNA (genomic DNA)를 추출하여 병렬 시퀀싱(massively parallel sequencing)을 수행하는 시퀀싱부;
시퀀싱된 리드(read) 서열들을 사람 참조(reference) 유전체에 맵핑(mapping)하는 맵핑부;
상기 리드(read) 서열들의 두께 분포(depth distribution) 및 GC 함량을 일정한 구간별로 확인하여 분석 대상으로 설정하는 분석대상 설정부;
상기 분석 대상으로 설정된 구간들의 두께(depth) 값을 이용하여 하기 Z-score를 산출하는 Z-score 산출부
Figure pat00006
;
상기 산출된 Z-score에 대하여 각 염색체별로 평균값을 산출하는 평균값 산출부; 및
각 염색체별로 산출된 Z-score 평균값을 확인하여 염색체 이상 여부를 판단하는 판단부를 포함하는 태아 염색체 이수성 진단 장치.
KR1020140024262A 2013-02-28 2014-02-28 유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치 KR101614471B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20130022254 2013-02-28
KR1020130022254 2013-02-28

Publications (2)

Publication Number Publication Date
KR20140108177A true KR20140108177A (ko) 2014-09-05
KR101614471B1 KR101614471B1 (ko) 2016-04-21

Family

ID=51428550

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140024262A KR101614471B1 (ko) 2013-02-28 2014-02-28 유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치

Country Status (2)

Country Link
KR (1) KR101614471B1 (ko)
WO (1) WO2014133369A1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101678959B1 (ko) 2015-12-08 2016-11-23 왕선주 태아의 유전학적 이상을 진단하기 위한 비침습적 진단시스템
KR101678962B1 (ko) * 2015-08-21 2016-12-06 이승재 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
WO2017023148A1 (ko) * 2015-08-06 2017-02-09 이원 다이애그노믹스 게놈센타(주) 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법
WO2017051996A1 (ko) * 2015-09-24 2017-03-30 에스케이텔레콤 주식회사 비침습적 태아 염색체 이수성 판별 방법
WO2017131359A1 (ko) * 2016-01-25 2017-08-03 지놈케어 주식회사 태아의 염색체이수성을 검출하는 방법
KR20170140107A (ko) * 2016-06-10 2017-12-20 이원다이애그노믹스(주) 다중 Z-score에 기반한 비침습적 산전 검사 방법 및 장치

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019128233A1 (zh) * 2017-12-29 2019-07-04 南京格致基因生物科技有限公司 ***的判断方法及***
KR102142914B1 (ko) * 2018-09-06 2020-08-11 이원다이애그노믹스(주) 모체 혈액 유래 무세포 dna 단편을 이용한 비침습적 산전 검사 방법
WO2020226528A1 (ru) * 2019-05-08 2020-11-12 Общество с ограниченной ответственностью "ГЕНОТЕК ИТ" Способ определения кариотипа плода беременной женщины
KR102319447B1 (ko) 2019-11-28 2021-10-29 주식회사 쓰리빌리언 Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2900927C (en) * 2007-07-23 2018-08-14 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using genomic sequencing
CA3069082C (en) * 2008-09-20 2022-03-22 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
US20110312503A1 (en) 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
SG191757A1 (en) 2011-06-29 2013-08-30 Bgi Health Service Co Ltd Noninvasive detection of fetal genetic abnormality

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017023148A1 (ko) * 2015-08-06 2017-02-09 이원 다이애그노믹스 게놈센타(주) 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법
US11339426B2 (en) 2015-08-06 2022-05-24 Eone Diagnomics Genome Center Co., Ltd. Method capable of differentiating fetal sex and fetal sex chromosome abnormality on various platforms
KR101678962B1 (ko) * 2015-08-21 2016-12-06 이승재 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
WO2017051996A1 (ko) * 2015-09-24 2017-03-30 에스케이텔레콤 주식회사 비침습적 태아 염색체 이수성 판별 방법
KR101678959B1 (ko) 2015-12-08 2016-11-23 왕선주 태아의 유전학적 이상을 진단하기 위한 비침습적 진단시스템
WO2017131359A1 (ko) * 2016-01-25 2017-08-03 지놈케어 주식회사 태아의 염색체이수성을 검출하는 방법
US11710565B2 (en) 2016-01-25 2023-07-25 Theragen Genomecare Co., Ltd. Method of detecting fetal chromosomal aneuploidy
KR20170140107A (ko) * 2016-06-10 2017-12-20 이원다이애그노믹스(주) 다중 Z-score에 기반한 비침습적 산전 검사 방법 및 장치

Also Published As

Publication number Publication date
WO2014133369A1 (ko) 2014-09-04
KR101614471B1 (ko) 2016-04-21

Similar Documents

Publication Publication Date Title
KR101614471B1 (ko) 유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치
US20170363628A1 (en) Means and methods for non-invasive diagnosis of chromosomal aneuploidy
KR102339760B1 (ko) 대규모 병렬 게놈 서열분석을 이용한 태아 염색체 이수성의 진단 방법
JP5938484B2 (ja) ゲノムのコピー数変異の有無を判断する方法、システム及びコンピューター読み取り可能な記憶媒体
KR102241051B1 (ko) 대량 동시 rna 서열분석에 의한 모체 혈장 전사물 분석
KR101801871B1 (ko) 산모의 혈청 dna를 이용한 태아의 단일유전자 유전변이의 예측방법
CN105844116B (zh) 测序数据的处理方法和处理装置
CN107949845A (zh) 能够在多个平台上区分胎儿性别和胎儿性染色体异常的新方法
US20190032125A1 (en) Method of detecting chromosomal abnormalities
KR101739535B1 (ko) 태아의 염색체이수성을 검출하는 방법
KR101678962B1 (ko) 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
EP3023504A1 (en) Method and device for detecting chromosomal aneuploidy
KR101881098B1 (ko) 태아의 염색체이수성을 검출하는 방법
KR101618032B1 (ko) 비침습적 태아 염색체 이상 검출방법
CN111321210B (zh) 一种无创产前检测胎儿是否患有遗传疾病的方法
KR102519739B1 (ko) 2단계 Z-score에 기반한 비침습적 산전 검사 방법 및 장치
RU2772912C1 (ru) Способ анализа митохондриальной ДНК для неинвазивного пренатального тестирования
US20170206310A1 (en) Noninvasive discrimination method and discrimination system of chromosomal heteroploidy of fetus
WO2015181718A1 (en) Method of prenatal diagnosis
Vinh A Method to Create NIPT Samples with Turner Disorder to Evaluate NIPT Algorithms
JP2024035014A (ja) 2種以上の検査を実施可能な遺伝学的解析方法
CN117230165A (zh) 一种无创产前检测胎儿染色体拷贝数异常的优化方法
TW201814289A (zh) 非侵入式胎兒性徵異常檢測系統及其方法與非侵入式胎兒性徵檢測系統及其方法

Legal Events

Date Code Title Description
A201 Request for examination
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20190320

Year of fee payment: 6