KR20200015913A - 미세부수체 불안정성을 결정하기 위한 시스템 및 방법 - Google Patents

미세부수체 불안정성을 결정하기 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20200015913A
KR20200015913A KR1020197038489A KR20197038489A KR20200015913A KR 20200015913 A KR20200015913 A KR 20200015913A KR 1020197038489 A KR1020197038489 A KR 1020197038489A KR 20197038489 A KR20197038489 A KR 20197038489A KR 20200015913 A KR20200015913 A KR 20200015913A
Authority
KR
South Korea
Prior art keywords
sample
microsatellite
interest
dataset
sequence data
Prior art date
Application number
KR1020197038489A
Other languages
English (en)
Other versions
KR102402002B1 (ko
Inventor
쉬러 장
알렉스 에스. 쏘
섀넌 캐플런
크리스티나 엠. 크루글리야크
스벤 빌케
Original Assignee
일루미나, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나, 인코포레이티드 filed Critical 일루미나, 인코포레이티드
Priority to KR1020227017139A priority Critical patent/KR102667912B1/ko
Publication of KR20200015913A publication Critical patent/KR20200015913A/ko
Application granted granted Critical
Publication of KR102402002B1 publication Critical patent/KR102402002B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/3004Arrangements for executing specific machine instructions to perform operations on memory
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Medicinal Chemistry (AREA)
  • Primary Health Care (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)

Abstract

미세부수체 불안정성을 결정하기 위한 기법이 본 명세서에 제시된다. 상기 기법은 관심 대상의 개별 샘플에 대한 가설적인 일치된 샘플을 대표하거나 이를 모방하는 기준 샘플 데이터세트를 생성하는 단계를 포함한다. 기준 샘플 데이터세트는 관심 대상의 샘플과 일치하지 않는 기준 정상 샘플의 세트로부터 생성될 수 있다. 일치된 샘플이 부족한 관심 대상의 샘플에 대해, 기준 샘플 데이터세트는 미세부수체 불안정성을 결정하도록 그리고 관심 대상의 샘플의 미세부수체 불안정성의 존재, 부재 도는 정도의 표시를 제공하도록 사용될 수 있다. 기준 샘플 데이터세트는 인종 집단 간의 변동의 높은 정도와 연관된 개별 미세부수체 영역이 여과되거나 마스킹되거나 그렇지 않으면 고려되지 않도록 생성될 수 있다.

Description

미세부수체 불안정성을 결정하기 위한 시스템 및 방법
관련 출원에 대한 상호 참조
본 출원은 미국 가출원 제62/587,350호(출원일: 2017년 11월 16일, 발명의 명칭: "MICROSATELLITE INSTABILITY ASSESSMENT TECHNIQUES")에 대한 우선권 및 이의 이익을 주장하고, 이의 개시내용은 모든 목적을 위해 본 명세서에 그 전문이 참고로 원용된다. 본 출원은 또한 미국 가출원 제62/652,151호(출원일: 2018년 4월 3일, 발명의 명칭: "MICROSATELLITE INSTABILITY ASSESSMENT TECHNIQUES WITH REDUCED BIAS")에 대한 우선권 및 이의 이익을 주장하고, 이의 개시내용은 모든 목적을 위해 본 명세서에 그 전문이 참고로 원용된다.
본 개시내용은 일반적으로 생물학적 샘플로부터 획득된 데이터, 예컨대 서열 데이터의 분야에 관한 것이다. 더 특히, 본 개시내용은 일치된 정상 샘플의 존재에 독립적인 생물학적 샘플의 서열 데이터의 분석을 통해 미세부수체 불안정성(microsatellite instability)을 평가하기 위한 기법에 관한 것이다.
유전자 서열분석(genetic sequencing)은 점점 더 중요한 유전자 조사 분야가 되어서, 진단학적 및 다른 분야에서 미래의 사용을 약속한다. 유전자 서열분석 데이터는, 다른 분야 중에서, 소정의 임상 결과와 연관된 유전자 돌연변이, 변형, 변이체 또는 다형을 확인하도록 사용될 수 있다. 예를 들어, 소정의 유전자 변이체는 양성 또는 음성의 질환 결과와 연관될 수 있다. 추가로, 시간에 걸친 또는 일치된 정상 샘플에 대한 대상체의 유전자 변화는 임상적으로 유용한 정보를 제공할 수 있다. 그러나, 일치된 정상 샘플은 모든 대상체에 대해 이용 가능하지 않을 수 있다.
본 개시내용은 관심 대상의 샘플(sample of interest)로부터의 서열 데이터를 이용하여 미세부수체 불안정성을 검출하고 규명하기 위한 개선된 기법을 제공한다. 본 명세서에 제공된 바대로, 미세부수체 불안정성은 게놈에 걸쳐 존재하는 짧은 연쇄 반복 서열(예를 들어, 1개 내지 6개의 염기 쌍 길이)인 미세부수체 반복 영역에서의 핵산 복제 오류의 존재를 의미할 수 있다. 게놈의 비번역된 영역에서 미세부수체 반복이 발생할 수 있는 한편, 미세부수체는 암호화 영역에 또한 존재할 수 있다. DNA 복제 동안, 미세부수체 불안정성을 가지는 세포는 DNA 복제 오류를 보수하지 못하고, 이는 결국 복제된 딸 가닥에서 프레임 시프트 돌연변이(frame-shift mutation)를 발생시킬 수 있다.
미세부수체 불안정성의 존재는 소정의 임상 병태와 연관될 수 있다. 예를 들어, 미세부수체 불안정성은, MLH1, PMS2, MSH2 및 MSH6과 같은 미스매치 보수 유전자의 생식선 돌연변이에 기초하여, 린치 증후군(Lynch Syndrome)이라 불리는 유전성 암 증후군의 특징이다. 미세부수체 불안정성 상태는 통상적으로 결장직장 및 자궁내막 종양과 같은 암 유형에서 양호한 생존율을 위한 독립적인 예후 인자로서 임상 실험실에서 평가된다. 추가로, 소정의 치료 프로토콜 또는 치료 옵션은 미세부수체 불안정성 고(microsatellite instability high: MSI-H) 지정을 갖거나 미스매치 보수 결핍(mismatch repair deficient: dMMR)인 고형 종양을 가지는 환자에 대해 니볼루맙 또는 펨브롤리주맙을 투여하기 위해 개시될 수 있다. 추가로, 치료 옵션은 본 명세서에 결정된 바대로 미세부수체 불안정성 점수마다 미세부수체 안정 지정을 가지는 고형 종양을 가지는 환자에 대해 펨브롤리주맙을 투여하지 않는 것일 수 있다. 또 다른 실시형태에서, MSI 타이핑(고, 저, 안정)은 환자가 애쥬번트 5-플루오로유라실(5-FU) 화학요법제로부터 이익을 얻을 수 있는지를 결정하도록 이용될 수 있다. 결장직장암 환자에 대해, 애쥬번트 5-플루오로유라실(5-FU) 화학요법은 MSI-H 환자에서 제한된 이익을 제공할 수 있다. 따라서, MSI-H 지정은 애쥬번트 5-플루오로유라실(5-FU) 화학요법제의 중단 또는 금기를 발생시킬 수 있다. 이러한 환자는 대신에 폴리닌산, 5-FU 및 옥살리플라틴이 제공될 수 있다. 또 다른 예에서, 환자의 MSI 유형은 면역요법 또는 화학요법이 제공되는지를 결정하도록 이용될 수 있다.
따라서, 본 명세서에 제공된 바대로, 관심 대상의 샘플의 서열 데이터는 관심 대상의 샘플에서 미세부수체 불안정성의 존재, 부재 및/또는 정도를 결정하도록 분석될 수 있다. 평가된 미세부수체 불안정성을 가지는 관심 대상의 샘플은 MSI-H, 미세부수체 불안정성 저(microsatellite instability low: MSI-L) 또는 미세부수체 안정(microsatellite stable: MSS)으로 지정될 수 있다. 관심 대상의 샘플은 종양 샘플일 수 있고, 미세부수체 불안정성 또는 안정성 지정은 추가 임상 정보를 제공할 수 있다. 그러므로, 본 기법은 암 환자에 대한 진단, 예후 및/또는 치료 프로토콜의 일부로서 또는 이들과 함께 이용될 수 있다.
소정의 실시형태에서, 본 기법은 일치된 정상 조직 샘플을 갖지 않는 관심 대상의 샘플의 평가를 허용한다. 본 명세서에 제공된 바대로, 관심 대상의 샘플에 대한 가설적인 일치된 정상 샘플을 나타내는, 기준 샘플 데이터세트가 생성될 수 있다. 기준 샘플 데이터세트는 보편적 일치된 정상 샘플로서 작용할 수 있다. 기준 샘플 데이터세트는 복수의 개체의 정상 조직의 서열 데이터로부터 생성된다. 종양 샘플이 시험될 때, 적절한 기준 샘플 데이터세트는 조직 유형, 샘플 오리지널 및 다른 인자에 기초하여 선택될 수 있다.
소정의 실시형태에서, 샘플을 제공하는 개체의 인종 배경에 독립적인 관심 대상의 샘플에 적용될 수 있는 보편적 일치된 정상 샘플을 생성하기 위해, 복수의 다인종 개체(즉, 복수의 상이한 인종 배경의 개체 포함)의 샘플로부터 형성된 기준 샘플 데이터세트는 인종 집단 간의 변동의 비교적 더 높은 수준을 가지는 미세부수체 부위에 대해 평가될 수 있다. 이러한 부위는 기준 샘플 데이터세트에서 제거되거나 마스킹될 수 있어서, 관심 대상의 샘플을 나타내는 전체 미세부수체 불안정성 점수를 생성하도록 이용된 분석으로부터 이 고도로 가변적인 부위를 제거한다. 이 방식에서, 미세부수체 불안정성의 결과로서가 아니라 인종 집단 간의 변동으로 인해 정상 샘플에서 가변적인 부위는 미세부수체 불안정성 점수로 잠재적으로 오류인 결과를 도입하지 않는다. 따라서, 본 기법은 일치된 정상이 없고 샘플의 인종 배경에 독립적인 샘플에 대한 더 정확한 미세부수체 불안정성 평가를 제공한다. 일 예에서, 본 기법은 인종 배경 확인 정보가 존재하지 않는 샘플에 대해 미세부수체 불안정성을 평가하기 위해 이용될 수 있다. 또 다른 예에서, 가설적인 일치된 정상으로 이용되고, 데이터세트로부터 여과된 인종 가변적인 미세부수체 영역으로 생성된 기준 샘플 데이터세트는 일반적으로 매우 다양한 샘플에 응용일 수 있어서, 관심 대상의 샘플을 제공하는 개체의 인종 배경에 기초한 적절한 기준 샘플의 추가 처리 단계 또는 선택을 제거한다.
일 실시형태에서, 각각의 개체에 상응하는 복수의 기준 생물학적 샘플로부터의 기준 서열 데이터를 획득하는 단계(각각의 기준 생물학적 샘플은 복수의 인종 집단 중 하나와 연관되고, 기준 서열 데이터는 복수의 미세부수체 영역에 대한 뉴클레오타이드 식별 정보를 포함함); 마이크로프로세서를 사용하여, 기준 서열 데이터를 분석하여서 복수의 기준 생물학적 샘플에 대한 복수의 미세부수체 영역의 각각에서의 분포를 결정하는 단계; 마이크로프로세서를 사용하여, 복수의 기준 생물학적 샘플에 대한 복수의 미세부수체 영역의 각각에서의 분포의 인종 집단 변동을 결정하는 단계(인종 집단 변동은 복수의 인종 집단의 다른 인종 집단에 비해 각각의 인종 집단과 연관된 기준 서열 데이터의 평가에 기초함); 한계치보다 낮은 인종 집단 변동을 가지는 분포를 가지는 복수의 미세부수체 영역의 인종 비편향된 미세부수체 영역을 결정하는 단계; 마이크로프로세서를 사용하여, 복수의 미세부수체 영역의 각각의 결정된 인종 비편향된 미세부수체 영역에서의 분포로부터의 기준 샘플 데이터세트를 생성하는 단계; 마이크로프로세서를 사용하여, 관심 대상의 샘플로부터의 서열 데이터와 기준 샘플 데이터세트의 비교에 기초하여 미세부수체 불안정성을 결정하는 단계(여기서, 관심 대상의 샘플은 관심 대상의 샘플과의 개체로부터의 일치된 정상 샘플을 사용하지 않고 개체의 종양 샘플로부터 유래됨); 및 결정된 미세부수체 불안정성에 기초한 치료 옵션에 대한 정보를 출력하는 단계를 포함하는, 미세부수체 불안정성을 처리하는 컴퓨터-구현 방법(computer-implemented method)이 제공된다.
또 다른 실시형태에서, 마이크로프로세서를 사용하여, 각각의 개체에 상응하는 복수의 기준 생물학적 샘플로부터의 게놈 기준 서열 데이터를 획득하는 단계; 기준 서열 데이터를 분석하여서 복수의 미세부수체 영역의 각각에서의 서열의 분포를 생성하는 단계; 복수의 기준 생물학적 샘플에 대한 복수의 미세부수체 영역의 각각에서의 분포의 인종 집단 변동을 결정하는 단계(인종 집단 변동은 게놈 서열 차이를 포함함); 복수의 미세부수체 영역의 각각에서의 인종 집단 변동에 기초하여 복수의 미세부수체 영역의 인종 편향된 미세부수체 영역을 확인하는 단계; 및 복수의 기준 생물학적 샘플의 기준 서열 데이터로부터의 인종 편향된 미세부수체 영역을 제거하거나 여과시킴으로써 기준 샘플 데이터세트를 생성하는 단계를 포함하는, 컴퓨터-구현 방법이 제공된다.
일 실시형태에서, 각각의 개체에 상응하는 복수의 기준 생물학적 샘플로부터의 기준 서열 데이터 및 복수의 미세부수체 영역에 대한 뉴클레오타이드 식별 정보를 포함하는 기준 서열 데이터를 획득하는 단계; 기준 서열 데이터를 분석하여서 복수의 미세부수체 영역의 각각에서 분포를 생성하는 단계; 복수의 미세부수체 영역의 각각에서의 분포로부터 기준 샘플 데이터세트를 생성하는 단계; 및 관심 대상의 샘플로부터의 서열 데이터와 기준 샘플 데이터세트의 비교에 기초하여 미세부수체 불안정성을 평가하기 위한 명령어를 제공하는 단계(관심 대상의 샘플은 개체의 종양 샘플로부터 유래되고, 관심 대상의 샘플과의 개체로부터의 일치된 정상 샘플은 이용 불가능함)를 포함하는 방법이 제공된다.
또 다른 실시형태에서, 프로세서; 및 메모리 저장 명령어를 포함하되, 명령어는, 프로세서에 의해 실행될 때, 프로세서로 하여금, 관심 대상의 샘플의 게놈 서열 데이터에 접근하게 하도록(서열 데이터는 복수의 미세부수체 영역에 대한 뉴클레오타이드 식별 정보를 포함함); 관심 대상의 샘플과 관련된 샘플 정보를 수신하도록; 샘플 정보에 기초하여 복수의 기준 샘플 데이터세트로부터 연관 기준 샘플 데이터세트를 선택하게 하도록(여기서, 각각의 기준 샘플 데이터세트는 복수의 미세부수체 영역에 대한 뉴클레오타이드 식별 정보로부터 그리고 복수의 개체로부터 생성됨); 관심 대상의 샘플로부터의 서열 데이터와 연관 기준 샘플 데이터세트의 비교에 기초하여 관심 대상의 샘플에 대한 미세부수체 불안정성을 분류하게 하도록; 그리고 분류에 기초하여 관심 대상의 샘플의 미세부수체 불안정성을 나타내는 표시를 제공하도록 하는, 시스템이 제공된다.
또 다른 실시형태에서, 프로세서; 및 프로세서에 의해 실행될 때, 프로세서가, 관심 대상의 샘플의 게놈 서열 데이터에 접근하도록(관심 대상의 샘플은 일치된 정상 샘플이 이용 불가능한 종양 샘플로부터 유래되고, 서열 데이터는 복수의 미세부수체 영역에 대한 뉴클레오타이드 식별 정보를 포함함); 관심 대상의 샘플에 대한 일치된 샘플 정보를 수신하도록; 그리고, 일치된 샘플 정보가 관심 대상의 샘플의 미세부수체 불안정성을 나타내는 제1 출력을 생성하도록 관심 대상의 샘플과의 일치된 정상 조직 샘플의 부재를 나타낼 때, 제1 미세부수체 분석 기법에 따라 서열 데이터를 분석하도록; 그리고, 일치된 샘플 정보가 관심 대상의 샘플의 미세부수체 불안정성을 나타내는 제2 출력을 생성하도록 관심 대상의 샘플과의 일치된 정상 조직 샘플의 존재를 나타낼 때, 제2 미세부수체 분석 기법에 따라 서열 데이터를 분석하도록 하는, 메모리 저장 명령어를 포함하는, 시스템이 제공된다.
또 다른 실시형태에서, 종양 샘플의 종양 서열 데이터를 획득하도록 구성된 서열분석 장치(sequencing device)가 제공된다. 상기 장치는 내부에 저장된 실행 가능한 어플리케이션 명령(application instruction)을 포함하는 메모리 장치; 및 메모리 장치에 저장된 어플리케이션 명령어를 실행하도록 구성된 프로세서를 포함한다. 어플리케이션 명령은 프로세서가 서열분석 장치로부터 종양 서열 데이터를 수신하도록; 종양 서열 데이터에서의 복수의 미세부수체 영역의 분포를 확인하도록; 종양 샘플이 일치된 정상 샘플과 연관되지 않는다는 것을 결정하도록; 기준 서열 데이터에 접근하도록; 종양 샘플의 분포와 기준 샘플 데이터세트의 기준 분포의 비교에 기초하여 종양 샘플의 미세부수체 불안정성 유형을 결정하도록; 그리고 종양 샘플이 미세부수체 불안정성 고 유형이라는 결정에 기초한 치료 옵션의 지표를 제공하도록 하는 명령어를 포함한다.
도 1은 본 기법에 따른 미세부수체 불안정성의 개략적 예시도;
도 2는 본 기법에 따른 서열분석 데이터를 획득하도록 구성된 서열분석 장치의 블록 다이어그램;
도 3은 본 기법에 따른 샘플의 미세부수체 불안정성을 평가하는 방법의 흐름 다이어그램;
도 4는 본 기법에 따른 일치된 또는 비일치된 관심 대상의 샘플에서 미세부수체 불안정성을 평가하기 위한 작업 흐름의 흐름 다이어그램;
도 5A는 결장직장 종양 조직 및 일치된 정상 샘플의 서열 데이터로부터 추출된 미세부수체 영역에 맵핑된 서열 판독의 예의 도식적 다이어그램;
도 5B 상부 패널은 미세부수체 불안정성 고(MSI-H) 샘플의 맵핑된 판독을 보여주고, 하부 패널은 MSI-H 샘플에서 종양 및 정상 샘플 둘 다에 대한 반복 단위 길이 분포를 나타낸 도면;
도 5C 상부 패널은 미세부수체 안정(MSS) 샘플의 맵핑된 판독을 보여주고, 하부 패널은 MSS 샘플에서 종양 및 정상 샘플 둘 다에 대한 반복 단위 길이 분포를 나타낸 도면;
도 6은 종양 단독 샘플(y축) 및 종양/정상 쌍(x축)에 대한 단일 미세부수체 부위에 대한 예측 정확성을 나타낸 도면;
도 7a는 종양/정상 쌍에 기초한 미세부수체 불안정성 점수의 박스플롯;
도 7b는 종양/정상 쌍에 대한 ROC 곡선;
도 7c는 종양 단독 샘플에 기초한 미세부수체 불안정성 점수의 박스플롯;
도 7d는 종양 단독 샘플에 대한 ROC 곡선;
도 7e는 MSS 샘플과 비교된 더 높은 비동의(nonsynonymous) 종양 돌연변이 부담(tumor mutational burden: TMB)을 가지는 MSI-H 샘플을 도시한 박스플롯;
도 8a는 몇몇 종양 샘플에 일치된 58개의 샘플 정상 결장직장암 기준 샘플 데이터세트를 사용한 다양한 조직 유형으로부터의 232개의 종양/정상 샘플에 대한 미세부수체 불안정성 점수의 박스플롯이고, 적색의 원의 부분은 MSI-PCR에 기초한 MSS로서 이전의 규명에 따른 MSI-H 상태에 대한 긍정 오류를 나타낸 도면;
도 8b는 58개의 샘플 일치된 정상 결장직장암 기준 샘플 데이터세트를 사용한 116개의 결장직장암 일치된 종양/정상 샘플에 대한 미세부수체 불안정성 점수의 박스플롯;
도 9는 58개의 샘플 정상 결장직장암 기준 샘플 데이터세트를 사용한 4개의 상이한 인종 집단(아프리카, 남아메리카, 동아시아 및 유럽) 중 하나와 연관된 개체로부터의 샘플을 포함하는 140개의 정상 샘플에 대한 미세부수체 불안정성 점수의 박스플롯;
도 10은 기준 샘플 데이터세트로부터의 인종 변동에 기초한 편향을 제거하기 위한 방법의 흐름 다이어그램;
도 11a는 기준 샘플 데이터세트에서 인종 변동을 평가하기 위해 사용된 140개의 샘플에서의 민족성의 분포를 나타낸 도면;
도 11b는 계산된 델타 Jensen Shannon 거리를 이용하여 기준 샘플 데이터세트에서 비교적 높은 인종 변동을 가지는 미세부수체 영역을 확인하기 위한 예시적인 기법으로부터의 결과를 나타낸 도면;
도 12는 분석 전에 기준 샘플 데이터세트로부터 여과된 비교적 높은 인종 변동을 가지는 확인된 미세부수체 영역을 갖는 58개의 샘플 정상 결장직장암 기준 샘플 데이터세트를 사용한 4개의 상이한 인종 집단(아프리카, 남아메리카, 동아시아 및 유럽) 중 하나와 연관된 개체로부터의 샘플을 포함하는 140개의 정상 샘플에 대한 미세부수체 불안정성 점수의 박스플롯;
도 13은 여과 후 58개의 샘플 정상 결장직장암 기준 샘플 데이터세트를 사용한 다양한 조직 유형으로부터의 232개의 종양/정상 샘플의 미세부수체 불안정성 점수의 박스플롯이고, 적색 원은 가능한 긍정 오류를 나타낸 도면;
도 14는 비교적 높은 인종 변동을 가지는 확인된 미세부수체 영역의 여과 전 및 후 기준 샘플 데이터세트로서의 58개의 비일치된 세포주 샘플을 사용한 4개의 상이한 인종 집단(아프리카, 남아메리카, 동아시아 및 유럽) 중 하나와 연관된 정상 샘플에 대한 미세부수체 불안정성 점수의 박스플롯;
도 15는 비일치된 세포주 샘플 기준 데이터세트와 정상 결장직장암 기준 샘플 데이터세트의 인종 다양성의 비교임;
도 16A는 비교적 높은 인종 변동을 가지는 확인된 미세부수체 영역의 여과 후 기준 샘플 데이터세트로서의 비일치된 세포주 샘플을 사용한 다양한 조직 유형으로부터의 232개의 종양/정상 샘플의 미세부수체 불안정성 점수의 박스플롯;
도 16B는 도 16A의 결과의 민감도 및 특이성을 나타낸 도면;
도 17은 78개의 결장직장암 샘플의 오리지널 및 반복 실행의 비교도;
도 18은 다양한 수의 샘플을 가지는 기준 샘플 데이터세트에 대한 MSI 점수 결과 상관관계를 나타낸 도면;
도 19는 다양한 수의 샘플을 가지는 기준 샘플 데이터세트에 대한 MSI 점수 결과 상관관계를 나타낸 도면;
도 20은 세포주의 상이한 적정 수준에 대한 MSI 점수를 나타낸 도면;
도 21은 4개의 MSI-H 세포주를 포함하는 46개의 세포주 샘플의 미세부수체 불안정성 점수의 박스플롯;
도 22는 본 개시내용의 실시형태에 따른 미세부수체 분석 기법을 이용한 Lovo 세포의 적정된 수준에 대한 검출 한계를 나타낸 도면;
도 23은 본 개시내용의 실시형태에 따른 미세부수체 분석 기법을 이용한 SW48 세포의 적정된 수준에 대한 검출 한계를 나타낸 도면;
도 24는 본 개시내용의 실시형태에 따른 개선된 및 더 엄격한 미세부수체 분석 기법을 이용한 Lovo 세포의 적정된 수준에 대한 검출 한계를 나타낸 도면; 및
도 25는 본 개시내용의 실시형태에 따른 개선된 및 더 엄격한 미세부수체 분석 기법을 이용한 SW48 세포의 적정된 수준에 대한 검출 한계를 나타낸 도면.
종양 샘플의 미세부수체 불안정성의 평가는 환자에 대한 잠재적인 예후 또는 치료 옵션에 대한 정보를 제공할 수 있다. 그러나, 임상 환경에서, 일치하는 정상 조직은 관심 대상의 샘플에 항상 이용 가능하지 않다. 예를 들어, 일치된 정상 샘플은 임상 실험, 병리학 기록보관서 및 레거시 바이오뱅크로부터의 인간 재료로 분석을 수행할 때 후향적 연구에서 대개 이용 불가능하다. 이들 경우에, 일치된 정상 샘플을 갖지 않는 종양 조직으로부터 미세부수체 불안정성을 확인하고/하거나 평가할 필요가 있다. 추가로, 생물학적 샘플로서 동일한 개체로부터 취한 일치된 정상 샘플을 사용하는 것은 소정의 도전을 제시한다. 예를 들어, 샘플 수집에서의 변동(샘플 품질, 선택된 조직 부위)은 기준 샘플이 진실로 정상 조직을 대표하지 않는다는 것을 의미할 수 있다. 또한, 모든 시험 샘플은 이용 가능한 일치된 조직 또는 서열분석에 대해 충분히 높은 품질의 일치된 조직을 갖지 않는다. 더 훨씬, 주어진 평가에 대한 관심 대상의 샘플은 다양한 인종 배경을 가지는 개체에 의해 제공될 수 있다. 이러한 다양성은 전체 집단에 걸쳐 치료 프로토콜의 효과를 나타내도록 연구에서 대개 바람직하다.
미세부수체 불안정성은 통상적으로 소정의 미세부수체의 PCR(MSI-PCR)(예를 들어, n = 5 또는 10개의 마커 사용), 이어서 PCR 앰플리콘을 분리시키기 위한 PCR 및 모세관 전기영동을 통한 단편 길이 분석에 의해 검출된다. MSI-PCR로, 각각의 개체 마커는 종양 마커가 일치된 정상 마커로부터 어떻게 이동하는지를 비교함으로써 평가된다. 즉, 불안정성은 정상과 종양 샘플 사이에 증폭된 대립유전자의 특징의 변화에 의해 검출된다. 미세부수체의 30% 초과가 이의 일치된 정상 샘플과 비교하여 종양 샘플에서 이동하는 경우, 종양 샘플은 MSI-고로 분류된다. 미세부수체의 10% 내지 20%가 이동하는 경우, 종양 샘플은 MSI-저로 분류된다. 미세부수체가 일치된 정상에 비해 이동하지 않는 경우, 종양 샘플은 미세부수체 안정으로 분류된다.
또 다른 예에서, 면역조직화학 분석(immunohistochemical analysis: IHC)은 미스매치 보수 결핍의 확인을 통해 미세부수체 불안정성을 가지는 샘플을 확인하도록 이용될 수 있다. 그러나, 미스매치 보수 IHC 및 미세부수체 불안정성은 항상 상관되지는 않는데, 왜냐하면 기능 유전자의 다른 손실이 미세부수체 불안정성 표현형(POLE)을 나타내는 샘플을 생성시키기 때문이다. 기능 유전자의 다른 손실로 인해 미세부수체 불안정성을 나타내는 샘플은 IHC를 이용하여 미스매치 보수 유전자에 대해 스크리닝할 때 확인되지 않을 것이다. 추가로, 미스매치 보수 유전자 MSH6에서의 돌연변이는 종양에서 더 약한 미세부수체 불안정성을 발생시키거나 발생시키지 않는 경향이 있다. 이러한 MSH6 경우는 미세부수체 불안정성 시험에 의해 놓칠 수 있지만, MSH6 돌연변이 스크리닝에 의해 검출 가능할 수 있다. 일반적으로, IHC는 단백질의 절두 또는 분해를 발생시키는 돌연변이에 대한 스크리닝에서 신뢰할만하다. 그러나, IHC는 미스센스 돌연변이로부터 흔히 생긴 돌연변이체 단백질과 야생형 폴리펩타이드 사이를 구별할 수 없다. MSI-PCR 및 다른 미세부수체 불안정성 평가 기법은 종양 DNA와 일치된 정상 샘플의 비교를 요한다. 추가로, 적은 수의 평가된 마커는 시험 민감도에 영향을 미칠 수 있다.
관심 대상의 샘플로부터 서열 데이터를 이용하는 미세부수체 불안정성을 결정하기 위한 기법이 본 명세서에 제공된다. 기법은, 일치된 정상 샘플이 관심 대상의 샘플에 대해 이용 가능하지 않더라도, 가설적인 일치된 정상 샘플로서 작용하는 기준 샘플 데이터세트에 대해서 샘플을 분석하는 것을 포함할 수 있다. 기준 샘플 데이터세트는 비일치된 정상 코호트로부터의 서열 데이터(즉, 관심 대상의 샘플이 생성되는 개체와 상이한 개체로부터의 서열 데이터)로부터 생성될 수 있다. 비일치된 정상 코호트는 관심 대상의 샘플에 대해 보편적 일치된 정상으로서 작용할 수 있다. 서열 데이터는 임의의 적합한 수의 미세부수체 마커에 대해 평가될 수 있다. 개시된 기법은 시험 샘플이 수득되는 개체로부터의 일치된 정상 샘플의 존재에 의존함이 없이 사용될 수 있는 기준 샘플 데이터세트를 제공한다. 개시된 기법은 또한 코호트에서의 인종 배경에서의 변동의 결과로서 비일치된 코호트 정상 샘플 간의 높은 변동을 가지는 미세부수체 영역에 대해 스크리닝되는 기준 샘플 데이터세트를 제공한다. 이 방식에서, 기준 샘플 데이터세트는 관심 대상의 샘플을 제공하는 개체의 인종 배경과 무관하게 임의의 관심 대상의 샘플에 대한 가설적인 일치된 정상으로서 작용한다. 이 방식에서, 샘플에서의 미세부수체 불안정성의 확인을 통한 샘플의 평가는 더 넓은 수의 샘플, 예를 들어, 다른 기법에 비해 일치된 정상이 없는 샘플로 확장될 수 있다. 추가로, 보편적 일치된 정상을 이용함으로써, 분석에서의 종양/정상 샘플의 미스매칭을 통한 사용자 오류에 대한 가능성은 감소한다. 즉, 보편적 정상이 많은 상이한 종양 샘플에 대해 동일한 샘플이므로, 이의 일치된 정상에 대한 종양 샘플의 배정오류의 가능성이 감소한다.
따라서, 개시된 기법은 일치된 샘플을 사용하지 않고 더 정확한 미세부수체 평가를 수월하게 한다. 보편적 또는 대표적인 비일치된 정상 샘플은 비일치된 기준 생물학적 샘플의 세트 또는 코호트를 사용하여 생성된다. 대표적인 비일치된 정상 샘플 정보는 개별 종양 샘플이 비교될 수 있는 정상 샘플로서 작용할 수 있는 실질상 기준을 나타낸다. 대표적인 비일치된 정상 샘플 정보는 비일치된 정상 샘플 정보가 생성되는 코호트에서의 인종 배경 변동의 결과로서 비교적 낮은 변동(예를 들어, 미리결정된 한계치보다 낮음)을 가지는 미세부수체 영역의 세트를 나타낸다.
이를 위해, 도 1은 비보수된 복제 오류에 의해 생긴 상이한 대립유전자를 가지는 영역으로서 표시된 미세부수체 불안정성의 개략적 예시이다. 예를 들어, 복제 동안 중합효소 부족의 결과로서, (예로서 가닥 12a로 표시된) 모 가닥은 N(n)의 서열을 가지는 미세부수체 영역(14)을 가질 수 있고, 여기서 n은 반복 모티프(16)의 수인 한편, 딸 가닥은 오류의 성질에 따라, 예를 들어, 가닥 12b에서처럼 N(n+1) 또는, 예를 들어, 가닥 12c에서처럼 N(n-1)의 서열을 가질 수 있고, 이는 미세부수체 영역에서의 상이한 길이의 대립유전자를 생성시킨다. 본 명세서에 제공된 바대로, 미세부수체 불안정성의 평가는 관심 대상의 샘플에 대한 대립유전자 분포와 일치된 정상, 이용 가능한 경우, 또는 대표적인 비일치된 정상 샘플에 대한 대립유전자 분포 간에 일탈이 있는지를 결정할 수 있다. 기재된 바대로, 가닥(12)의 분포는 미세부수체 영역(14)의 변동에 기초하여 변한다.
도 2는 미세부수체 불안정성을 평가하기 위해 사용되는 서열분석 데이터(예를 들어, 관심 대상의 샘플 서열분석 데이터, 비일치된 코호트 서열분석 데이터)를 획득하기 위한 도 1과 연결되어 사용될 수 있는 서열분석 장치(60)의 도식적 다이어그램이다. 서열 장치(60)는 임의의 서열분석 기법, 예컨대 미국 특허 공보 제2007/0166705호; 제2006/0188901호; 제2006/0240439호; 제2006/0281109호; 제2005/0100900호; 미국 특허 제7,057,026호; WO 제05/065814호; WO 제06/064199호; WO 제07/010,251호(이들의 개시내용은 본 명세서에 그 전문이 참고로 원용됨)에 기재된 합성에 의한 서열분석 방법을 도입한 것에 따라 실행될 수 있다. 대안적으로, 결찰에 의한 서열분석 기법은 서열분석 장치(60)에서 사용될 수 있다. 이러한 기법은 올리고뉴클레오타이드를 도입하고 이러한 올리고뉴클레오타이드의 도입을 확인하는 DNA 리가제를 사용하고, 미국 특허 제6,969,488호; 미국 특허 제6,172,218호; 및 미국 특허 제6,306,597호(이들의 개시내용은 본 명세서에 그 전문이 참고로 원용됨)에 기재되어 있다. 몇몇 실시형태는 나노기공 서열분석을 이용할 수 있고, 이로써 표적 핵산 가닥 또는 표적 핵산으로부터 핵산말단분해로 제거된 뉴클레오타이드는 나노기공을 통해 통과한다. 표적 핵산 또는 뉴클레오타이드가 나노기공을 통해 통과하면서, 염기의 각각의 유형은 기공의 전기 전도도의 변동을 측정함으로써 확인될 수 있다(미국 특허 제7,001,792호; Soni & Meller, Clin . Chem . 53, 1996-2001 (2007); Healy, Nanomed . 2, 459-481 (2007); 및 Cockroft, et al. J. Am. Chem. Soc . 130, 818-820 (2008)(이들의 개시내용은 본 명세서에 그 전문이 참고로 원용됨). 더 다른 실시형태는 연장 산물로의 뉴클레오타이드의 도입 시 방출되는 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출에 기초한 서열분석은 Ion Torrent(Guilford, CT, ThermoFisher의 Life Technologies 자회사)로부터 상업적으로 구입 가능한 전기 검출장치 및 연관 기법, 또는 US 제2009/0026082호 A1; US 제2009/0127589호 A1; US 제2010/0137143호 A1; 또는 US 제2010/0282617호 A1(이들의 각각은 본 명세서에 그 전문이 참고로 원용됨)에 기재된 서열분석 방법 및 시스템을 이용할 수 있다. 특정한 실시형태는 DNA 중합효소 활성의 실시간 모니터링을 수반하는 방법을 이용할 수 있다. 뉴클레오타이드 도입은 형광단 보유 중합효소와 γ-포스페이트 표지된 뉴클레오타이드 사이의 형광 공명 에너지 이동(fluorescence resonance energy transfer:FRET) 상호작용을 통해, 또는 예를 들어, 문헌[Levene et al. Science 299, 682-686 (2003); Lundquist et al. Opt. Lett . 33, 1026-1028 (2008); Korlach et al. Proc . Natl . Acad. Sci . USA 105, 1176-1181 (2008)](이들의 개시내용은 본 명세서에 그 전문이 참고로 원용됨)에 기재된 바와 같은 제로모드 도파관으로 검출될 수 있다. 다른 적합한 대안적인 기법은, 예를 들어, 형광성 인시츄 서열분석(fluorescent in situ sequencing: FISSEQ) 및 대량 병렬 서명 서열분석(Massively Parallel Signature Sequencing: MPSS)을 포함한다. 특정한 실시형태에서, 서열분석 장치(16)는 Illumina(캘리포니아주 라 졸라)로부터의 HiSeq, MiSeq 또는 HiScanSQ일 수 있다.
도시된 실시형태에서, 서열분석 장치(60)는 별개의 샘플 처리 장치(62) 및 연관 분석 장치(64)를 포함한다. 그러나, 기재된 바대로, 이것은 단일 장치로서 실행될 수 있다. 추가로, 분석 장치(64)는 지역적이거나 샘플 처리 장치(62)에 네트워킹될 수 있다. 도시된 실시형태에서, 생물학적 샘플은 서열 데이터를 생성하도록 영상화된 샘플 슬라이드(70)로서 샘플 처리 장치(62)로 로딩될 수 있다. 예를 들어, 시약은 영상화 모듈(72)에 의해 생성된 여기 빔에 반응하여 특정한 파장에서 생물학적 샘플 형광과 상호작용하고 이로써 영상화를 위한 방사선을 반송한다. 예를 들어, 형광성 성분은 성분의 상보성 분자에 혼성화하는 형광으로 태그화된 핵산 또는 중합효소를 사용하여 올리고뉴클레오타이드로 도입된 형광으로 태그화된 뉴클레오타이드에 의해 생성될 수 있다. 당업자에 의해 이해되는 것처럼, 샘플의 염료가 여기하는 파장 및 이들이 형광하는 파장은 특정 염료의 흡수 및 방출 스펙트럼에 따라 달라질 것이다. 이러한 반송된 방사선은 다이렉팅 광학장치(directing optics)를 통해 뒤로 전파할 수 있다. 이 레트로빔은 일반적으로 영상화 모듈(72)의 검출 광학장치를 향해 지향될 수 있다.
영상화 모듈 검출 광학장치는 임의의 적합한 기술에 기초할 수 있고, 예를 들어, 장치에서의 위치에 영향을 미치는 광자에 기초하여 화소화된 이미지 데이터를 생성하는 전하 결합 소자(charged coupled device: CCD) 센서일 수 있다. 그러나, 임의의 다양한 다른 검출장치, 예를 들어, 시간 지연 통합(time delay integration: TDI) 조작에 구성된 검출장치 어레이, 상보성 금속 산화물 반도체(complementary metal oxide semiconductor: CMOS) 검출장치, 애벌란시 광다이오드(avalanche photodiode: APD) 검출장치, Geiger-모드 광자 카운터, 또는 임의의 다른 적합한 검출장치(이들로 제한되지는 않음)를 또한 사용할 수 있다고 이해될 것이다. TDI 모드 검출은 미국 특허 제7,329,860호(본 명세서에 참고로 원용됨)에 기재된 바와 같은 라인 스캐닝과 커플링될 수 있다. 다른 유용한 검출장치는, 예를 들어, 다양한 핵산 서열분석 방법론의 맥락에서 본 명세서에서 이전에 제공된 참고문헌에 기재되어 있다.
영상화 모듈(72)은, 예를 들어, 프로세서(74)(예를 들어, 마이크로프로세서)를 통해 프로세서 제어에 있을 수 있고, 샘플 수취 장치(18)는 또한 I/O 컨트롤(76), 내부 버스(78), 비휘발 메모리(80), RAM(82) 및 임의의 다른 메모리 구조를 포함할 수 있어서, 메모리는 실행 가능한 명령, 및 도 2와 관련하여 기재된 것과 유사할 수 있는 다른 적합한 하드웨어 성분을 저장할 수 있다. 추가로, 연관 컴퓨터(20)는 또한 프로세서(84), I/O 컨트롤(86), 통신 모듈(84) 및 메모리 구성, 예를 들어 RAM(88) 및 비휘발 메모리(90)를 포함할 수 있어서, 메모리 구성은 실행 가능한 명령(92)을 저장할 수 있다. 하드웨어 성분은 디스플레이(96)에 또한 연결할 수 있는 내부 버스(94)에 의해 연결될 수 있다. 서열분석 장치가 일체형 장치로서 실행되는 실시형태에서, 소정의 중복 하드웨어 요소가 제거될 수 있다.
도 3은 미세부수체 불안정성을 평가하는 방법(100)의 흐름 다이어그램이다. 방법(100)의 단계는 표시된 바대로 사용자 및/또는 제공자에 의해 수행될 수 있다. 예를 들어, 사용자는 서열분석 장치의 최종 사용자, 예컨대 서열분석 장치의 소유자, 서열분석 장치의 계약자, 서열분석 장치의 사용자일 수 있다. 사용자는 하나 이상의 샘플에서 미세부수체 불안정성을 확인하는 것에 관심 있는 사용자일 수 있다. 제공자는 본 명세서에 제공된 바와 같은 보편적 일치된 정상 기준 서열의 제공자일 수 있다. 추가로, 소정의 실시형태에서, 사용자 및 제공자는 동일한 독립체일 수 있다. 즉, 미세부수체 평가는 보편적 일치된 정상 기준 서열의 제공자에 의해 수행될 수 있다.
단계 102에서, 관심 대상의 샘플은 획득되고, 서열분석을 위한 샘플 준비는 단계 104에서 발생한다. 샘플 준비는 샘플 유형(예를 들어, 액체 샘플, 고체 샘플, FFPE 샘플, 혈장 샘플)에 기초할 수 있다. 서열 데이터는 본 명세서에 제공된 바와 같은 서열분석 장치(60)를 사용하여 단계 106에서 획득될 수 있다. 다른 실시형태에서, 이전에 획득된 서열 데이터는 평가될 수 있다. 본 명세서에 제공된 바와 같은 생물학적 샘플 서열분석 데이터(즉, 관심 대상의 샘플, 대표적인 비일치된 정상 샘플, 일치된 정상 샘플)가 원시 데이터, 뉴클레오타이드 동일성을 제공하는 염기 콜 데이터(base call data), 또는 1차 또는 2차 분석을 통해 가는 데이터(서열 정렬 맵, 2진수 정렬 맵)의 형태일 수 있다고 이해되어야 한다.
분석 장치는, 디스플레이(96)를 통해, 본 명세서에 제공된 바와 같은 미세부수체 불안정성 평가 기법을 이용하여 서열분석 반응과 관련된 정보의 사용자 입력을 수월하게 하는 그래프 사용자 인터페이스를 제공할 수 있다. 예를 들어, 사용자는 서열분석 실행에서의 각각의 샘플의 명칭 또는 확인, 샘플 기원(즉, FFPE 샘플, 새로운 동결된 샘플, 세포주로부터 제조된 핵산), 서열 데이터를 획득하기 위해 사용된 서열분석 패널(즉, 서열분석 프로브의 세트), 및 관심 대상의 샘플의 조직 유형에 관한 입력을 제공할 수 있다. 사용자는 또한 일치된 정상 샘플이 이용 가능한지와 관련된 입력을 제공할 수 있다.
본 기법은 일치된 정상 샘플로부터의 서열분석 데이터 없이 단계 108에서의 생물학적 샘플(예를 들어, 종양 샘플)에서의 미세부수체 불안정성의 검출 또는 평가를 수월하게 한다. 따라서, 방법(100)은 단계 110에서 정상 코호트로부터의 서열 데이터를 획득한다. 소정의 실시형태에서, 생성 및 저장 후, 다수의 샘플의 코호트로부터 생성된 보편적 또는 대표적인 정상 샘플 서열 데이터는 상이한 및/또는 후속하는 시점에서 복수의 관심 대상의 샘플의 분석에서 이용된다. 사용자는 관심 대상의 샘플 특징에 따라 가장 밀접히 정렬되는 코호트에 기초하여 저장된 파일에 접근할 수 있다. 이를 위해, 다수의 상이한 정상 코호트 서열 데이터세트(112)는 획득될 수 있다. 상이한 정상 코호트 서열 데이터세트(112)는 상이한 샘플 유형(정상 FFPE 샘플, 새로운 동결된 샘플, 세포주로부터 제조된 핵산), 서열분석 패널, 조직 유형 등을 나타낼 수 있다. 정상 코호트 서열 데이터(112)는 조사된 각각의 미세부수체 영역에 대해 충분한 수의 사용 가능한 서열을 제공하도록 적합한 크기 코호트(적어도 10명의 개체, 적어도 20명의 개체, 적어도 50명의 개체)로부터 획득될 수 있다. 각각의 코호트에서의 개체(또는 상이한 개체를 대표하는 샘플)는 정상 코호트 서열 데이터(즉, 대표적인 정상 샘플 서열 데이터)를 획득하도록 사용될 수 있는 정상 세포 또는 조직으로부터의 샘플을 제공할 수 있다. 코호트는 관심 대상의 샘플에 일치되지 않은 개체를 나타내고, 즉 상이한 개체이다.
일 실시형태에서, 대표적인 비일치된 정상 샘플 서열 데이터는, 일단 생성되면, 특정한 샘플 준비 기법에 대해 고정된다. 즉, 대표적인 비일치된 정상 샘플 서열 데이터는 데이터가 생성되는 샘플의 유형과 연관된다. 상이한 대표적인 비일치된 정상 샘플 서열 데이터세트는 FFPE 샘플, 세포주, 새로운 동결물 등에 대해 생성될 수 있다. 추가로, 대표적인 비일치된 정상 샘플 서열 데이터세트는 단계 116에서 제공자에 의해 저장되고, 분석 패키지의 일부로서 사용자에게 전송될 수 있다. 분석 패키지는, 미세부수체 불안정성 분석이 제공자에 의해 개선되는 경우, 리모트 서버로부터 또한 업데이트를 받을 수 있다.
일 실시형태에서, 정상 코호트 서열 데이터는 복수의 개체로부터의 서열 데이터를 포함할 수 있다. 각각의 개별 서열은 각각의 개별 미세부수체 영역에서 소정의 품질 메트릭(예를 들어, 서열분석의 깊이)에 따라 평가될 수 있다. 예를 들어, 각각의 개별 서열의 서열 데이터는 개별 미세부수체 영역에서 적어도 미리 결정된 수(예를 들어, 20개)의 서열분석 판독이 있을 때에 오직 사용될 수 있다. 따라서, 각각의 개별 서열은 이용 가능한 서열분석 깊이에 따라 미세부수체 영역의 하위집단에서 합격하고 다른 것에 실패할 수 있다. 합격한 영역은 추가의 분석에 이용되는 한편, 실패한 영역은 마스킹되거나 사용되지 않는다. 품질 평가 후, 코호트의 개별 서열은 각각의 미세부수체 영역에서 분포를 생성하도록 풀링될 수 있다. 풀링된 정상 코호트의 분포는 가설적인 일치된 정상 샘플을 나타내는 기준 샘플 데이터세트로서 작용한다.
분석은 단계 120에서 미세부수체 불안정성 점수를 생성하도록 이용될 수 있다. 미세부수체 불안정성 점수는 관심 대상의 샘플과 기준 샘플 데이터세트 사이의 각각의 미세부수체 영역에서의 분포 간의 거리(즉, 통계학적 거리, Jensen-Shannon 거리)의 비교에 기초할 수 있다. 일 실시형태에서, 미세부수체 불안정성 점수는 한계치보다 높은 거리를 가지는 미세부수체 영역의 수에 기초하고, 여기서 더 긴 거리는 기준 샘플 데이터세트로부터의 더 큰 일탈을 나타내고, 미세부수체 영역의 전체 수에 비해 양의 점수와 연관된다. 양의 점수를 가지는 미리 결정된 수보다 높은 백분율(예를 들어, 5%)을 가지는 샘플은 미세부수체 불안정성을 가지는 것으로 분류될 수 있는 한편, 미리 결정된 수보다 낮은 백분율을 가지는 샘플은 미세부수체 안정으로 분류될 수 있다. 추가로, 미세부수체 불안정성은 백분율에 기초하여 높거나 낮은 것으로 지정될 수 있다.
미세부수체 불안정성 평가는 치료 프로토콜을 결정하기 위한 입력으로 임상의에게 제공될 수 있다. 최근 년에, 면역 관문 저해제는 다양한 암 유형을 치료하는 데 큰 가능성을 나타냈지만; 오직 환자의 일부가 면역요법제의 이 유형에 반응한다. 정량적 면역조직화학(IHC)에 의해 측정된 PD-L1 단백질 발현은 몇몇 면역 관문 저해제에 대해 FDA 허가된 동반 진단학적 또는 상보성 검정이다. 펨브롤리주맙(KEYTRUDA, Merck & Co.)은 미세부수체 불안정성 고(MSI-H) 또는 미스매치 보수 결핍(dMMR)을 가지는 고형 종양을 가지는 환자에게 제공될 수 있다.
도 4는 관심 대상의 샘플, 예를 들어 종양 샘플(150)에 대한 예시적인 작업 흐름을 나타낸다. 일치된 정상 샘플(154)이 이용 가능한 경우, 작업 흐름은 종양 샘플 서열 데이터(158)의 서열 분석(156) 및 정상 샘플 서열 데이터(162)의 서열 분석(160)으로 진행한다. 서열 데이터는 BAM 파일, 염기 콜 데이터, 이미지 데이터 등의 형태일 수 있다. 서열 분석은 일치된 정상 샘플 데이터가 비교에 대한 기초로서 사용되는 미세부수체 불안정성 분석 기법을 통해서일 수 있다(블록 164). 일치된 정상 샘플이 이용 가능하지 않는 경우, 작업 흐름은 적절한 비일치된 정상 코호트로부터의 기준 샘플 데이터세트를 사용하여 본 명세서에 제공된 바와 같은 미세부수체 불안정성 분석 기법을 통한 분석으로 진행한다(블록 166). 기법 둘 다는 종양 단독 미세부수체 불안정성 점수(168) 또는 종양/정상 미세부수체 불안정성 점수(170)인 미세부수체 불안정성 점수를 생성시킨다. 추가로, 일치된 샘플에 대해, 관심 대상의 샘플은 그럼에도 불구하고 품질 목적을 위해 일치된 분석과 비교하여 비일치된 분석 및 결과로 공급될 수 있다.
구체적인 실시형태에서, 서열분석 패널은 제공되어서 고형 종양과 연관된 170개의 유전자를 다룬다. 단일 뉴클레오타이드 변이체, 삽입-결실, 증폭, 스플라이스 변이체 및 융합을 포함하는 포획 돌연변이 변화로 설계되어서, 패널은 단일 서열분석 실행에서 동일한 FFPE 종양 샘플로부터의 DNA 및 RNA 변이체 둘 다를 표적화하도록 설계되었다. 103개의 미세부수체 유전좌위를 평가하는 패널의 수행은 53개의 결장암 샘플(MSI-PCR에 의해 결정된 바와 같은 28개의 MSI-H 및 25개의 MSS)을 사용하여 평가되고, 패널이 일치된 종양/정상 쌍과의 미세부수체 불안정성 상태에 대한 100% 일치율을 달성한다는 것을 나타냈다. 추가적으로, 미세부수체 불안정성 분석은 비일치된 종양 샘플에 사용될 수 있어서 MSI-PCR에 의해 불과 98% 일치율을 달성한다. 게다가, MSI-H 샘플은 결장 샘플의 이 코호트에서 MSS 샘플과 비교하여 유의미하게 더 높은 종양 돌연변이 부담을 갖는다. 요약하면, 미세부수체 표적화된 패널은 FFPE 종양 샘플로부터의 미세부수체 불안정성 상태를 정확하게 결정할 수 있다. 도 5, 도 6 및 도 7a-e는 실험으로부터의 결과를 나타낸다.
각각의 미세부수체 유전좌위에 대해, 미세부수체 반복의 플랭킹 서열은 영역에 맵핑된 판독에 의해 지지된 반복 단위의 수를 결정하도록 앵커링되었다. 후속하여, 반복 단위 길이의 분포는 각각의 부위의 미세부수체 불안정성 상태를 결정한다. 최종 미세부수체 불안정성 점수는 평가된 전체 부위의 수로 나눈 불안정한 미세부수체 부위의 수로 계산되었다. 도 5A는 2진수 정렬 맵 파일로부터 추출된 미세부수체 영역에 맵핑된 판독을 나타낸다. 상부 패널에서의 도 5B는 미세부수체 불안정성 고(MSI-H) 샘플의 맵핑된 판독을 나타내고, 하부 패널은 MSI-H 샘플에서의 종양 및 정상 샘플 둘 다에 대한 반복 단위 길이 분포를 나타낸다. 상부 패널에서의 도 5C는 미세부수체 안정(MSS) 샘플의 맵핑된 판독을 나타내고, 하부 패널은 MSS 샘플에서의 종양 및 정상 샘플 둘 다에 대한 반복 단위 길이 분포를 나타낸다. 도 6은 서열분석 패널의 103개의 부위의 각각에 대한 단일 미세부수체 영역 예측 값을 나타낸다. 단일 부위는 풀 패널에 비해 덜 정확하였다. 본 명세서에 제공된 바대로, 미세부수체 불안정성 점수를 생성하기 위해 본 기법에서 사용된 미세부수체 부위 또는 미세부수체 영역의 수는 1개 이상, 5개 이상, 50개 이상 또는 100개 이상일 수 있다. 소정의 실시형태에서, 본 기법은 미세부수체 불안정성 점수를 생성하도록 분석에서 1개 내지 20개, 5개 내지 20개, 5개 내지 50개, 10개 내지 20개, 10개 내지 50개, 또는 50개 내지 100개의 미세부수체 부위를 분석할 수 있다.
제공된 바대로, 기준 샘플 데이터세트에 대한 관심 대상의 샘플 사이의 Jensen-Shannon 거리가 결정되었다. d1인 기준 Jensen-Shannon 거리는 하기한 바대로 기준 샘플의 모든 쌍별 조합(BL_n, n = 1…N)에 대해 계산되었다:
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
d2인 시험 Jensen-Shannon 거리는 하기한 바대로 관심 대상의 샘플(T)과 기준 데이터세트의 각각의 샘플 사이에 계산되었다:
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
2의 Jensen-Shannon 거리 분포 사이의 비교는 d1 < d2(FDR < 0.05 및 d2 - d1 > 0.1)를 확립하도록 1측 t-시험을 통해 수행된다.
도 7a는 종양/정상 쌍에 기초한 미세부수체 불안정성 점수의 박스플롯이다. 도 7b는 종양/정상 쌍에 대한 ROC 곡선이다. 도 7c는 종양 단독 샘플에 기초한 미세부수체 불안정성 점수의 박스플롯이다. 도 7d는 종양 단독 샘플에 대한 ROC 곡선이다. 도 7e는 MSS 샘플과 비교된 더 높은 비동의 종양 돌연변이 부담(TMB)을 가지는 MSI-H 샘플을 나타내는 박스플롯이다.
도 8a는 몇몇 종양 샘플에 일치된 58개의 샘플 정상 결장직장암 기준 샘플 데이터세트를 사용한 다양한 조직 유형으로부터의 232개의 종양/정상 샘플에 대한 미세부수체 불안정성 점수의 박스플롯이다. 58개의 샘플 정상 결장직장암 기준 샘플 데이터세트는 하기 MSI-H 및 MSS CRC 샘플에 대해 일치된 정상 샘플로부터 생성되었다. 샘플은 MSI-PCR 결과로 92개의 쌍으로 일치된 종양 정상 쌍을 포함하였다: n = 140:
MSI-H 종양: n = 35 (32 CRC 및 3 UCEC)
MSS 종양: n = 57 (26 CRC 및 31 UCEC)
전체 시험 샘플 (92개의 종양 + 140개의 정상 = 232개의 샘플)
샘플은 MSI-PCR에 기초하여 MSI-H(n = 35), MSS(n = 54) 종양 또는 정상(n = 140)으로 규명되었다. 미세부수체 불안정성 점수는 본 명세서에 제공된 바대로 결정되었다. 결과가 일반적으로 MSI-PCR 결과에 따라 정렬되지만, 적색 원의 부분은 MSI 컷오프 점수에 기초한 MSI-H에 대한 긍정 오류를 나타낸다.
도 8b는 안정한 확인된 MSI 점수의 더 엄격한 그룹을 나타내는, 도 8a의 58개의 샘플 일치된 정상 결장직장암 기준 샘플 데이터세트를 사용한, 58개의 결장직장암 일치된 종양/정상 샘플에 대한 미세부수체 불안정성 점수의 박스플롯이다.
도 9는 140개의 정상 샘플에 대한 미세부수체 불안정성 점수의 박스플롯이고, 이로써 개체로부터의 샘플은 도 8a의 58개의 샘플 정상 결장직장암 기준 샘플 데이터세트를 사용하여 이의 연관된 인종 집단(아프리카, 남아메리카, 동아시아 및 유럽)으로 분리된다. 기재된 바대로, 미세부수체 불안정성 점수는 인종 집단 간에 변하고, 이는 기준 샘플 데이터세트로 존재하는 인종 편향에 대한 가능성을 나타낸다.
도 10은 기준 샘플 데이터세트로부터의 인종 변동에 기초한 편향을 제거하는 방법(200)의 흐름 다이어그램이다. 단계 202에서, 기준 샘플 서열 데이터는, 예를 들어, 본 명세서에 제공된 바와 같은 서열분석 장치(60)를 사용한 복수의 개체의 코호트의 기준 샘플로부터 획득될 수 있다. 복수의 개체는 특정한 인종 배경(예를 들어, 비제한적인 예에서 아프리카, 남아메리카, 동아시아 및 유럽)과 연관될 수 있다. 연관은 일 예에서 자가 보고에 기초할 수 있다. 다른 실시형태에서, 이전에 획득된 기준 샘플 서열 데이터는 접근될 수 있다. 단계 204에서, 기준 서열 데이터는 복수의 관심 대상의 미세부수체 영역의 각각에서 분포를 생성시키도록 분석된다. 초기 품질 관리 단계에서, 불충분한 판독 커버리지를 가지는 개별 기준 샘플로부터의 개별 미세부수체 영역(예를 들어, 특정한 미세부수체 영역의 20개 미만의 판독)에 대한 데이터는 기준 샘플 서열 데이터로부터 여과(예를 들어, 결실, 마스킹되거나, 그렇지 않으면 추가의 분석 단계에서 고려되지 않는 것으로 표시)될 수 있다.
단계 206에서, 복수의 기준 생물학적 샘플에 대한 복수의 미세부수체 영역의 각각에서의 분포(예를 들어, 대립유전자 분포)의 인종 집단 변동은 결정된다. 예를 들어, 인종 배경 정보가 이용 가능한 각각의 개별 기준 샘플 서열(예를 들어, 10개의 서열, 20개의 서열, 또는 이것 초과)에 대해, 서열 데이터는 분석에 대한 코호트에서 나타난 인종 집단 중 하나로 그룹화된다. 일반적으로 균등하게 분포될 수 있거나 코호트에서 불균등하게 분포될 수 있는 원하는 수의 인종 집단으로부터의 샘플의 유리한 혼합을 제공하도록 코호트가 선택될 수 있다는 것이 이해되어야 한다. 인종 변동은 제2 인종 집단과 연관된 샘플의 그룹의 서열 데이터의 제2 분포에 비해 제1 인종 집단과 연관된 샘플의 그룹의 서열 데이터의 제1 분포 간의 변동을 포함할 수 있다. (예를 들어, 임의의 품질 평가 후) 서열 데이터가 이용 가능한 각각의 개별 미세부수체 영역에서의 2개 이상의 인종 집단 간의 변동이 평가되도록 분포는 영역-대-영역 분포일 수 있다. 일 실시형태에서, 충분한 커버리지의 제1 품질 평가 후, 소정의 개별 미세부수체 영역은 샘플을 정량화하는 것의 낮은 수에 기초하여 인종 변동의 평가에 정량화하지 못할 수 있다. 즉, 상기 방법은 변동 평가에 정량화하도록 인종 집단마다 샘플(예를 들어, 충분한 품질의 또는 충분한 판독 커버리지를 가지는 5개 이상의 개별 샘플)의 컷오프를 포함할 수 있다.
단계 208에서, 복수의 미세부수체 영역의 인종 편향된 및/또는 비편향된 미세부수체 영역은 각각의 개체 인종 집단으로 분리된 기준 샘플의 그룹에 대한 복수의 미세부수체 영역의 각각에서의 인종 집단 변동에 기초하여 확인되었다. 일 실시형태에서, 특정한 인종 집단 내의 특정한 미세부수체 영역에 대한 미세부수체 영역 서열 데이터 분포의 변동의 측정치는 결정된다. 이 변동은 이후 또 다른 인종 집단의 변동과 비교된다. 이 변동은 이후 또 다른 인종 집단의 변동과 비교된다. 인종 집단 간의 변동에서의 비교적 큰 차이를 가지는 미세부수체 영역은 영역에 대한 내재된 인종 변동을 나타낼 수 있다. 변동은 본 명세서에 제공된 바와 같이 임의의 적합한 방법, 예를 들어, 범위, 평균, 변량 및/또는 표준 편차 또는 Jensen-Shannon 거리에 의해 평가될 수 있다. 이 분석이 각각의 미세부수체 영역에 대해 수행된 후, 한계치보다 높은 변동 메트릭을 가지는 영역은 높은 인종 편향 또는 변동을 가지는 것으로 확인될 수 있지만, 한계치보다 낮은 변동 메트릭을 가지는 영역은 낮은 또는 허용 가능한 인종 편향 또는 변동을 가지는 것으로 확인될 수 있다. 단계 210에서, 기준 샘플 데이터세트는 복수의 기준 생물학적 샘플의 기준 서열 데이터로부터 인종 편향된 미세부수체 영역을 제거/여과시킴으로써 기준 서열 데이터로부터 생성된다. 방법 200의 결과로서, 기준 샘플 데이터세트는 생성되고, 여기서 예를 들어, 서열분석된 미세부수체 영역의 일부는 인종 편향의 확인 때문에 추가의 분석으로부터 배제되었다. 남은 미세부수체 영역은 인종 배경과 관련된 편향에 덜 민감하다. 따라서, 기준 샘플 데이터세트는 더 튼튼하게 만들어지고, 넓은 범위의 관심 대상의 샘플에 가설적인 일치된 정상으로서 더 정확히 작용하도록 편향에 독립적이다.
도 11a는 기준 샘플 데이터세트에서의 인종 변동을 평가하기 위해 사용된 140개의 샘플에서의 인종의 분포를 나타낸다. 도 11b는 계산된 델타 Jensen Shannon 거리를 이용한 기준 샘플 데이터세트에서의 비교적 높은 인종 변동을 가지는 미세부수체 영역을 확인하는 것의 예시적인 기법으로부터의 결과를 나타낸다. 델타 Jensen Shannon 거리는 하기한 바대로 결정되었다:
JSD = 평균 (JSD간의) - 평균 (JSD내의)
각각의 미세부수체 영역에 대한 델타 Jensen Shannon 거리는 2개의 그룹 간의 평균 Jensen Shannon 거리 및 그룹 간의 평균 Jensen Shannon 거리의 측정치이다. 3개 이상의 그룹 간의 쌍별 비교가 수행될 수 있다. 기법은 각각의 인종 집단의 최소 5개의 샘플에 대한 적어도 20개의 지지 판독으로 175개의 부위(미세부수체 영역)를 평가하였다. 분석에 기초하여, 3개의 인종 집단 간의 쌍별 비교에 기초한 ≥0.1 ΔJSD를 가지는 44개의 부위는 높은 인종 변동을 가지는 것으로 확인되었다. 이 부위는 기준 샘플 데이터세트를 생성하도록 사용된 서열 데이터로부터 여과(예를 들어, 제거 또는 마스킹)되었다.
도 12는 분석 전 기준 샘플 데이터세트로부터 여과된 비교적 높은 인종 변동을 가지는 확인된 미세부수체 영역을 갖는 58개의 샘플 정상 결장직장암 기준 샘플 데이터세트를 사용한 4개의 상이한 인종 집단(아프리카, 서아메리카, 동아시아 및 유럽) 중 하나와 연관된 개체로부터의 샘플을 포함하는 140개의 정상 샘플에 대한 미세부수체 불안정성 점수의 박스플롯이다. 동일한 분석을 나타내지만, 확인된 미세부수체 영역으로부터 여과가 없는, 도 9와 비교하여, MSI 점수는 소정의 인종 집단에 대해 더 압축되고, 이는 비교적 높은 인종 변동 영역으로부터의 여과의 효과를 나타낸다.
도 13은 여과 후 58개의 샘플 정상 결장직장암 기준 샘플 데이터세트를 사용한 다양한 조직 유형으로부터의 232개의 종양/정상 샘플의 미세부수체 불안정성 점수의 박스플롯이고, 적색 원은 잠재적인 긍정 오류를 나타낸다. MSI-H 샘플은 일반적으로 여과 후 온전한 MSI 점수를 갖지만, 정상/MSS 샘플은 더 낮은 MSI 점수를 갖는다. 도 14는 비교적 높은 인종 변동을 가지는 확인된 미세부수체 영역의 여과 전 및 후 기준 샘플 데이터세트로서의 58개의 비일치된 세포주 샘플을 사용한 4개의 상이한 인종 집단(아프리카, 서아메리카, 동아시아 및 유럽) 중 하나와 연관된 정상 샘플에 대한 미세부수체 불안정성 점수의 박스플롯이다. 58개의 비일치된 세포주는 하기 인종 집단 분포로 10개의 IHW 및 48개의 코리엘(coriell) 라인을 포함하였다:
P_AFR (n=22) (아프리카)
P_AMR (n=25) (남아메리카)
P_EUR (n=8) (유럽)
P_EAS (n=3) (동아시아)
도 15는 비일치된 세포주 샘플 기준 데이터세트의 인종 다양성과 정상 결장직장암 기준 샘플 데이터세트의 비교이다. 세포주 기준 샘플은 FFPE 샘플과 유전자형을 공유하지 않고, 이것은 CRC 종양 샘플의 일부와 일치하였다. 세포주 기준 샘플 데이터세트는 진정한 비일치된 샘플을 나타낸다. 추가로, 세포주 기준 샘플 데이터세트는 일반적으로 원래의 기준치 또는 FFPE 샘플로부터의 상이한 인종 조성을 나타낸다.
도 16A는 비교적 높은 인종 변동을 가지는 확인된 미세부수체 영역의 여과 후 기준 샘플 데이터세트로서의 비일치된 세포주 샘플을 사용한 다양한 조직 유형으로부터의 232개의 종양/정상 샘플의 미세부수체 불안정성 점수의 박스플롯이다. 도 16B는 도 16A의 결과의 민감도 및 특이성을 나타낸다.
도 17은 78개의 결장직장암 샘플의 오리지널 및 반복 실행의 비교이다.
도 18 내지 도 19는 샘플의 다양한 수를 가지는 기준 샘플 데이터세트에 대한 MSI 점수 결과 상관관계를 나타낸다. 수행은 (현재의 232개의 시험 세트와 중첩하지 않는 71개의 샘플(58개의 세포주 + 13개의 FFPE 정상)로부터 무작위로 선택된) 랜덤 10개, 20개, 30개, 40개, 50개의 기준치 샘플로 시험되었다.
도 20은 세포주의 상이한 적정 수준에 대한 MSI 점수를 나타내고, 도 21은 4개의 MSI-H 세포주를 포함하는 46개의 세포주 샘플의 미세부수체 불안정성 점수의 박스플롯이다.
결과는 44개의 인종 특이적/편향된 부위의 차단이 성능을 개선한다는 것을 나타냈다. 추가로, 기준 샘플 데이터세트는 샘플 유형/인종 통제될 필요가 없다. 수행은 기준 샘플 데이터세트에서 n≥30 샘플로 튼튼하다.
이용 가능한 미세부수체 부위의 하위집단은 더 민감한 검출 한계를 개발하도록 이용 가능한 부위로부터 선택될 수 있다. MSI 부위 선택에서의 엄격성은 검출 한계를 개선할 수 있다. 도 22는 세포주 적정 및 미세부수체 안정성을 가지는 세포주로 적정된 Lovo 세포의 다양한 적정된 수준에 대한 MSI 점수의 연관 검출 한계를 나타낸다. 도 23은 세포주 적정 및 미세부수체 안정성을 가지는 세포주로 적정된 SW48 세포의 다양한 적정된 수준에 대한 연관 검출 한계를 나타낸다. 안정한 세포에서의 세포주의 적정의 모델은 종양 샘플에서 다른 세포와 혼합된 종양 세포의 존재를 모델링한다. 적정과 MSI의 검출의 소실 간의 도시된 상관관계는 100+개의 미세부수체 부위의 분포의 분석에 기초하고, 샘플에 대한 서열분석 깊이에 의해 제한된다. 검출 한계에서의 도시된 2.5% 또는 5% 적정이 고체 샘플에 대해 허용 가능할 수 있지만, 혈장(예를 들어, 혈장 DNA 부스러기)에서의 미세부수체 불안정성의 검출은 정확성에 대한 검출 하한을 수반할 수 있다.
그러나, 소정의 실시형태에서, 이용 가능한 미세부수체 부위의 품질 분석은 개선된 검출 한계를 달성하도록 더 높은 품질 또는 더 낮은 변동으로 부위의 하위집단의 선택을 수월하게 할 수 있다. 잠재적인 상이한 DNA 추출 방법, 기준치, 서열분석 깊이에 따라, 미세부수체 부위 품질은 샘플 유형(예를 들어, 고체 또는 FPE 대 액체)에 기초하여 변할 수 있다. 도 24는 미세부수체 안정성을 가지는 세포주로 적정된 Lovo 세포에 대한 개선된 검출 한계를 나타낸다. 도 25는 미세부수체 안정성을 가지는 세포주로 적정된 SW48 세포에 대한 개선된 검출 한계를 나타낸다. 도 24 내지 25는 130개의 이용 가능한 부위 중에서 도시된 실시예 16에서 오직 더 높은 품질 미세부수체 부위의 하위집단을 사용한 분석을 나타낸다. 기준 데이터세트의 부위는 기준 서열 데이터에서 평가된 바대로 각각의 개별 부위에서 가장 낮은 델타 분포로서 선택되었다. 따라서, 소정의 실시형태에서, 검출 한계는, 예를 들어, 델타 분포의 순위화를 이용하여 MSI 부위를 더 높은 품질 부위의 하위집단으로 제한하고, 가장 낮은 분포를 가지는 부위를 선택함으로써 5배 개선된다.
추가로, MSI 부위의 하위집단의 선택은 하나 이상의 사용자 입력 및/또는 샘플 유형에 기초할 수 있다. 샘플, 예컨대 고체 샘플에 대해, 모든 또는 대부분의 이용 가능한 MSI 부위를 사용하여 달성된 검출 한계는 충분할 수 있다. 따라서, 고체 샘플의 표시는 샘플이 혈장 또는 액체 샘플이라는 사용자 입력에 대한 것보다 이용 가능한 MSI 부위의 더 큰 하위집단을 사용하여 본 명세서에 제공된 바와 같은 분석을 개시시킬 수 있다. 추가로, 사용자는 서열분석 또는 분석 장치에서 엄격성 또는 검출 한계 환경을 입력할 수 있다.
개시된 실시형태의 기술 효과는 관심 대상의 비일치된 샘플에 대한 개선되고 더 정확한 미세부수체 불안정성 평가를 포함한다. 추가적인 기술 효과는 종양 단독 샘플의 분석을 위한 가설적인 일치된 정상 샘플로서 작용하는 기준 샘플 데이터세트의 개선된 생성을 포함한다. 관심 대상의 비일치된 샘플의 미세부수체 불안정성 점수를 결정하기 위해 이용된 개선된 기준 샘플 데이터세트는 높은 인종 집단간 변동으로 (예를 들어, 마스킹 또는 제거를 통해) 부위가 제거된다. 이 방식으로, 기준 샘플 데이터세트는 관심 대상의 비일치된 샘플과 연관된 개체의 인종 배경에 독립적인 가설적인 일치된 샘플로서 사용될 수 있어서, 미세부수체 불안정성 평가에 대한 가장 튼튼한 기법을 제공한다.
본 개시내용의 소정의 특징이 오직 본 명세서에서 예시되고 기재되어 있지만, 많은 변형 및 변화가 당업자에게 명확할 것이다. 따라서, 첨부된 청구항이 본 개시내용의 진정한 정신 내에 해당하면서 모든 이러한 변형 및 변화를 다루도록 의도된다고 이해되어야 한다.

Claims (26)

  1. 미세부수체 불안정성(microsatellite instability)을 결정하기 위한 시스템으로서,
    프로세서; 및
    메모리 저장 명령어를 포함하되, 상기 명령어는, 상기 프로세서에 의해 실행될 때, 상기 프로세서로 하여금,
    관심 대상의 샘플(sample of interest)의 게놈 서열 데이터에 접근하게 하되, 상기 관심 대상의 샘플은 일치된 정상 샘플이 이용 불가능한 종양 샘플로부터 유래되고, 상기 서열 데이터는 복수의 미세부수체 영역에 대한 뉴클레오타이드 식별 정보를 포함하고
    상기 관심 대상의 샘플과 관련된 샘플 정보를 수신하게 하고;
    상기 샘플 정보에 기초하여 복수의 기준 샘플 데이터세트로부터 연관 기준 샘플 데이터세트를 선택하게 하되, 각각의 기준 샘플 데이터세트는 상기 복수의 미세부수체 영역에 대한 뉴클레오타이드 식별 정보로부터 그리고 복수의 개체로부터 생성되며;
    상기 관심 대상의 샘플로부터의 서열 데이터와 상기 연관 기준 샘플 데이터세트의 비교에 기초하여 상기 관심 대상의 샘플에 대한 미세부수체 불안정성을 분류하게 하고; 그리고
    상기 분류에 기초하여 상기 관심 대상의 샘플의 미세부수체 불안정성을 나타내는 표시를 제공하게 하는, 시스템.
  2. 제1항에 있어서, 상기 샘플 정보는 관심 대상의 샘플 원본 정보를 포함하고, 상기 복수의 기준 샘플 데이터세트는 원본(origin)에 기초하여 서로 상이하고, 상기 연관 기준 샘플 데이터세트는 상기 관심 대상의 샘플 원본 정보와 상기 연관 기준 샘플 데이터세트의 원본 사이의 일치에 기초하여 선택되는, 시스템.
  3. 제1항 또는 제2항에 있어서, 상기 연관 기준 샘플 데이터세트는 복수의 개체로부터의 FFPE 샘플로부터 생성되고, 상기 관심 대상의 샘플은 FFPE 샘플인, 시스템.
  4. 제1항 또는 제2항에 있어서, 상기 연관 기준 샘플 데이터세트는 복수의 개체로부터의 새로운 동결된 샘플로부터 생성되고, 상기 관심 대상의 샘플은 새로운 동결된 샘플인, 시스템.
  5. 제1항 또는 제2항에 있어서, 상기 연관 기준 샘플 데이터세트는 복수의 개체로부터의 세포주로부터 생성되고, 상기 관심 대상의 샘플은 세포주인, 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 샘플 정보는 조직 유형 정보를 포함하고, 상기 복수의 기준 샘플 데이터세트는 조직 유형에 기초하여 서로 상이하고, 상기 연관 기준 샘플 데이터세트는 상기 조직 유형 정보와 상기 연관 기준 샘플 데이터세트의 조직 유형 사이의 일치에 기초하여 추가로 선택되는, 시스템.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 샘플 정보는 상기 서열 데이터를 생성하도록 사용된 서열분석 패널 정보(sequencing panel information)를 포함하고, 상기 복수의 기준 샘플 데이터세트는 상기 기준 샘플 데이터세트를 생성하도록 사용된 서열분석 패널에 기초하여 서로 상이하고, 상기 연관 기준 샘플 데이터세트는 상기 서열분석 패널 정보와 상기 연관 기준 샘플 데이터세트를 생성하도록 사용된 서열분석 패널 사이의 일치에 기초하여 추가로 선택되는, 시스템.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 연관 기준 샘플 데이터세트는 상기 복수의 개체로부터의 풀링된 데이터세트(pooled dataset)인, 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 복수의 기준 샘플 데이터세트는 상기 복수의 개체의 정상 조직으로부터 생성된, 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 관심 대상의 샘플은 상기 복수의 기준 샘플 데이터세트를 생성하도록 사용된 샘플과 일치하지 않는, 시스템.
  11. 컴퓨터-구현 방법(computer-implemented method)으로서,
    마이크로프로세서를 사용하여, 각각의 개체에 상응하는 복수의 기준 생물학적 샘플로부터의 게놈 기준 서열 데이터를 획득하는 단계;
    상기 기준 서열 데이터를 분석하여서 복수의 미세부수체 영역의 각각에서의 서열의 분포를 생성하는 단계;
    상기 복수의 기준 생물학적 샘플에 대한 상기 복수의 미세부수체 영역의 각각에서의 상기 분포의 인종 집단 변동을 결정하는 단계로서, 상기 인종 집단 변동은 게놈 서열 차이를 포함하는, 상기 결정하는 단계;
    상기 복수의 미세부수체 영역의 각각에서의 인종 집단 변동에 기초하여 상기 복수의 미세부수체 영역의 인종 편향된 미세부수체 영역을 확인하는 단계; 및
    상기 복수의 기준 생물학적 샘플의 기준 서열 데이터로부터 상기 인종 편향된 미세부수체 영역을 제거하거나 여과시킴으로써 기준 샘플 데이터세트를 생성하는 단계를 포함하는, 컴퓨터-구현 방법.
  12. 제11항에 있어서,
    각각의 개체에 상응하는 제2의 복수의 기준 생물학적 샘플로부터 제2 기준 서열 데이터를 획득하는 단계; 및
    상기 제2 기준 서열 데이터로부터 상기 인종 편향된 미세부수체 영역을 제거하여서 제2 기준 샘플 데이터세트를 생성하는 단계를 추가로 포함하는, 컴퓨터-구현 방법.
  13. 제11항 또는 제12항에 있어서, 상기 관심 대상의 샘플로부터의 서열 데이터와 상기 기준 샘플 데이터세트의 비교에 기초하여 미세부수체 불안정성을 평가하기 위한 명령어를 제공하는 단계를 추가로 포함하고,
    상기 관심 대상의 샘플은 개체의 종양 샘플로부터 유래되고, 상기 관심 대상의 샘플과의 상기 개체로부터의 일치된 정상 샘플은 이용 불가능한, 컴퓨터-구현 방법.
  14. 제11항 내지 제13항 중 어느 한 항에 있어서, 상기 복수의 기준 생물학적 샘플은 상기 개체로부터가 아닌 정상 조직으로부터 유래된, 컴퓨터-구현 방법.
  15. 종양 샘플의 종양 서열 데이터를 획득하도록 구성된 서열분석 장치(sequencing device)로서,
    내부에 저장된 실행 가능한 어플리케이션 명령(application instruction)을 포함하는 메모리 장치; 및
    상기 메모리 장치에 저장된 상기 어플리케이션 명령어를 실행하도록 구성된 프로세서를 포함하되, 상기 어플리케이션 명령은, 상기 프로세서로 하여금,
    상기 서열분석 장치로부터 상기 종양 서열 데이터를 수신하게 하고;
    상기 종양 서열 데이터에서의 복수의 미세부수체 영역의 분포를 확인하게 하고;
    상기 종양 샘플이 일치된 정상 샘플과 연관되지 않는다는 것을 결정하게 하고;
    기준 서열 데이터에 접근하게 하고;
    상기 종양 샘플의 분포와 상기 기준 샘플 데이터세트의 기준 분포의 비교에 기초하여 상기 종양 샘플의 미세부수체 불안정성 유형을 결정하게 하고; 그리고
    상기 종양 샘플이 미세부수체 불안정성 고(high) 유형이라는 결정에 기초한 치료 옵션의 지표를 제공하게 하는, 서열분석 장치.
  16. 제15항에 있어서, 상기 기준 데이터세트는 복수의 미세부수체 영역의 분포 데이터를 포함하고, 상기 분포의 비교에 기초하여 상기 종양 샘플의 미세부수체 불안정성 유형을 결정하는 것은 오직 상기 복수의 미세부수체 영역의 하위집단을 비교하는 것을 포함하는, 서열분석 장치.
  17. 제16항에 있어서, 상기 하위집단은 상기 종양 샘플의 샘플 유형에 기초하여 선택되는, 서열분석 장치.
  18. 제17항에 있어서, 상기 하위집단은 동결된 고형 종양 샘플 유형에 기초하여 선택된 제1 하위집단 및 혈장 종양 샘플 유형에 기초하여 선택된 제2 하위집단이고, 상기 제1 하위집단은 상기 제2 하위집단과 상이한, 서열분석 장치.
  19. 제17항 또는 제18항에 있어서, 상기 하위집단은 상기 종양 샘플의 암 유형에 기초하여 선택되는, 서열분석 장치.
  20. 제16항에 있어서, 상기 하위집단은 상기 복수의 미세부수체 영역의 개별 미세부수체 영역의 분포의 거리의 순위화에 기초하여 선택되는, 서열분석 장치.
  21. 제20항에 있어서, 상기 하위집단은 가장 낮은 분포 거리를 가지는 상기 복수의 미세부수체 영역의 개별 미세부수체 영역에 기초하여 선택되는, 서열분석 장치.
  22. 제21항에 있어서, 상기 하위집단은 상기 복수의 미세부수체 영역의 20% 미만을 나타내는, 서열분석 장치.
  23. 제16항 내지 제22항 중 어느 한 항에 있어서, 상기 어플리케이션 명령은, 상기 종양 샘플이 미세부수체 불안정성 안정(stable) 유형이라는 결정에 기초하여, 상기 프로세서가 상이한 치료 옵션의 지표를 제공하도록 하는 명령어를 포함하는, 서열분석 장치.
  24. 관심 대상의 샘플에서 미세부수체 불안정성을 검출하기 위한 컴퓨터-구현 방법으로서,
    관심 대상의 샘플의 서열 데이터를 제공하는 단계로서, 상기 관심 대상의 샘플은 일치된 정상 샘플이 이용 불가능한 종양 샘플로부터 유래되고, 상기 서열 데이터는 복수의 미세부수체 영역에 대한 뉴클레오타이드 식별 정보를 포함하는, 상기 서열 데이터를 제공하는 단계;
    상기 관심 대상의 샘플과 관련된 샘플 정보를 제공하는 단계;
    상기 샘플 정보에 기초하여 복수의 기준 샘플 데이터세트로부터 연관 기준 샘플 데이터세트를 선택하는 단계로서, 상기 기준 샘플 데이터세트의 각각은 상기 복수의 미세부수체 영역에 대한 뉴클레오타이드 식별 정보로부터 그리고 복수의 개체로부터 생성되는, 상기 선택하는 단계; 및
    상기 관심 대상의 샘플로부터의 서열 데이터와 상기 연관 기준 샘플 데이터세트의 비교에 기초하여 상기 관심 대상의 샘플의 미세부수체 불안정성을 평가하는 단계를 포함하는, 컴퓨터-구현 방법.
  25. 제24항에 있어서, 제1항 내지 제10항 중 어느 한 항에 따른 시스템 또는 제15항 내지 제23항 중 어느 한 항에 따른 서열분석 장치를 사용하는, 컴퓨터-구현 방법.
  26. 관심 대상의 샘플에서 미세부수체 불안정성을 검출하기 위한 그리고/또는 상기 관심 대상의 샘플에서 미세부수체 불안정성 유형을 결정하기 위한, 제1항 내지 제10항 중 어느 한 항에 따른 시스템 또는 제15항 내지 제23항 중 어느 한 항에 따른 서열분석 장치의 용도로서, 상기 샘플은 일치된 정상 샘플이 이용 불가능한 종양 샘플로부터 유래된, 용도.
KR1020197038489A 2017-11-16 2018-11-14 미세부수체 불안정성을 결정하기 위한 시스템 및 방법 KR102402002B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020227017139A KR102667912B1 (ko) 2017-11-16 2018-11-14 미세부수체 불안정성을 결정하기 위한 시스템 및 방법

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762587350P 2017-11-16 2017-11-16
US62/587,350 2017-11-16
US201862652151P 2018-04-03 2018-04-03
US62/652,151 2018-04-03
PCT/US2018/061067 WO2019099529A1 (en) 2017-11-16 2018-11-14 Systems and methods for determining microsatellite instability

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020227017139A Division KR102667912B1 (ko) 2017-11-16 2018-11-14 미세부수체 불안정성을 결정하기 위한 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20200015913A true KR20200015913A (ko) 2020-02-13
KR102402002B1 KR102402002B1 (ko) 2022-05-25

Family

ID=64572571

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020197038489A KR102402002B1 (ko) 2017-11-16 2018-11-14 미세부수체 불안정성을 결정하기 위한 시스템 및 방법
KR1020227017139A KR102667912B1 (ko) 2017-11-16 2018-11-14 미세부수체 불안정성을 결정하기 위한 시스템 및 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020227017139A KR102667912B1 (ko) 2017-11-16 2018-11-14 미세부수체 불안정성을 결정하기 위한 시스템 및 방법

Country Status (10)

Country Link
US (1) US20190156922A1 (ko)
EP (1) EP3711056A1 (ko)
JP (1) JP6955035B2 (ko)
KR (2) KR102402002B1 (ko)
CN (1) CN110800061A (ko)
AU (2) AU2018367488B2 (ko)
CA (1) CA3067422C (ko)
IL (1) IL271214B1 (ko)
NZ (1) NZ759171A (ko)
WO (1) WO2019099529A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022108385A1 (ko) * 2020-11-20 2022-05-27 국립암센터 종양세포충실도 보정을 통한 현미부수체 불안정성의 판정방법
WO2022124575A1 (ko) * 2020-12-07 2022-06-16 (주)디엑솜 현미부수체 지역의 서열 길이의 변동계수를 이용한 현미부수체 불안정성 진단방법

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190206513A1 (en) * 2017-12-29 2019-07-04 Grail, Inc. Microsatellite instability detection
CN114761580A (zh) * 2019-11-08 2022-07-15 生命技术公司 用于评估微卫星不稳定性的***和测定
US20210139950A1 (en) * 2019-11-08 2021-05-13 Life Technologies Corporation Microsatellite instability measurement
CN110910957B (zh) * 2019-12-31 2023-06-27 求臻医学科技(浙江)有限公司 一种基于单肿瘤样本高通量测序微卫星不稳定性探测位点筛选方法
KR20230023278A (ko) * 2021-08-10 2023-02-17 (주)디엑솜 현미부수체 지역의 서열 길이의 최대값과 최소값의 차이를 이용한 현미부수체 불안정성 진단방법
CN113744251B (zh) * 2021-09-07 2023-08-29 上海桐树生物科技有限公司 基于自注意力机制从病理图片预测微卫星不稳定性的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080096197A1 (en) * 2004-10-19 2008-04-24 Peter Findeisen Compounds and Methods for Assessment of Microsatellite Instability (Msi) Status
US20120295267A1 (en) * 2011-05-16 2012-11-22 Baylor Research Institute Detecting DNA Mismatch Repair-Deficient Colorectal Cancers
WO2017112738A1 (en) * 2015-12-22 2017-06-29 Myriad Genetics, Inc. Methods for measuring microsatellite instability

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
WO1998044151A1 (en) 1997-04-01 1998-10-08 Glaxo Group Limited Method of nucleic acid amplification
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
ES2550513T3 (es) 2002-08-23 2015-11-10 Illumina Cambridge Limited Nucleótidos modificados para secuenciación de polinucleótidos
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
EP3673986A1 (en) 2004-01-07 2020-07-01 Illumina Cambridge Limited Improvements in or relating to molecular arrays
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
JP4990886B2 (ja) 2005-05-10 2012-08-01 ソレックサ リミテッド 改良ポリメラーゼ
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7329860B2 (en) 2005-11-23 2008-02-12 Illumina, Inc. Confocal imaging methods and apparatus
EP2762872B1 (en) 2006-12-14 2015-09-16 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
BR112014025185B1 (pt) * 2012-04-10 2022-06-28 Vib Vzw Método de diagnóstico de estado de msi de um tumor, kit para realização do mesmo e método de avaliação de sensibilidade de células de câncer a tratamento com um inibidor de uma enzima de reparo de excisão de base de dna
CN107058551B (zh) * 2017-05-04 2020-03-31 北京诺禾致源科技股份有限公司 检测微卫星位点不稳定性的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080096197A1 (en) * 2004-10-19 2008-04-24 Peter Findeisen Compounds and Methods for Assessment of Microsatellite Instability (Msi) Status
US20120295267A1 (en) * 2011-05-16 2012-11-22 Baylor Research Institute Detecting DNA Mismatch Repair-Deficient Colorectal Cancers
WO2017112738A1 (en) * 2015-12-22 2017-06-29 Myriad Genetics, Inc. Methods for measuring microsatellite instability

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A. Umar 외, "Revised Bethesda Guidelines for Hereditary Nonpolyposis Colorectal Cancer (Lynch Syndrome) and Microsatellite Instability", JNCI Journal of the National Cancer Institute, 96(4). (2004.02.) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022108385A1 (ko) * 2020-11-20 2022-05-27 국립암센터 종양세포충실도 보정을 통한 현미부수체 불안정성의 판정방법
WO2022124575A1 (ko) * 2020-12-07 2022-06-16 (주)디엑솜 현미부수체 지역의 서열 길이의 변동계수를 이용한 현미부수체 불안정성 진단방법

Also Published As

Publication number Publication date
US20190156922A1 (en) 2019-05-23
WO2019099529A1 (en) 2019-05-23
AU2021282414A1 (en) 2021-12-23
CA3067422A1 (en) 2019-05-23
IL271214A (en) 2020-01-30
CA3067422C (en) 2023-08-29
NZ759171A (en) 2022-05-27
IL271214B1 (en) 2024-07-01
KR20220073859A (ko) 2022-06-03
EP3711056A1 (en) 2020-09-23
KR102402002B1 (ko) 2022-05-25
CN110800061A (zh) 2020-02-14
JP2020527337A (ja) 2020-09-10
AU2018367488B2 (en) 2021-09-16
KR102667912B1 (ko) 2024-05-21
JP6955035B2 (ja) 2021-10-27
AU2018367488A1 (en) 2019-12-12

Similar Documents

Publication Publication Date Title
KR102402002B1 (ko) 미세부수체 불안정성을 결정하기 위한 시스템 및 방법
CN112805563A (zh) 用于评估和/或治疗癌症的无细胞dna
KR102356323B1 (ko) 서열 변이체 콜에 대한 검증방법 및 시스템
CN109880910A (zh) 一种肿瘤突变负荷的检测位点组合、检测方法、检测试剂盒及***
CN111304303B (zh) 微卫星不稳定的预测方法及其应用
US20230040907A1 (en) Diagnostic assay for urine monitoring of bladder cancer
Terraf et al. Comprehensive assessment of germline pathogenic variant detection in tumor-only sequencing
AU2017360993A1 (en) Validation methods and systems for sequence variant calls
JP2019537095A (ja) 体細胞コピー数多型検出
AU2014348428B2 (en) Chromosomal assessment to diagnose urogenital malignancy in dogs
CN115298326A (zh) 用于癌症分析的方法和组合物
Kamath-Loeb et al. Accurate detection of subclonal variants in paired diagnosis-relapse acute myeloid leukemia samples by next generation Duplex Sequencing
NZ787685A (en) Systems and methods for determining microsatellite instability
Cheng et al. Personalized circulating tumor DNA detection to monitor immunotherapy efficacy and predict outcome in locally advanced or metastatic non‐small cell lung cancer
JP7274504B2 (ja) 多様度指数を確立することで腫瘍バリアント多様度を評価することによるがん予後診断の方法
KR20230044439A (ko) 미토콘드리아 dna 품질 관리
JP2023543763A (ja) バイオマーカー
WO2024137664A1 (en) Methods for detecting glioblastoma in extracellular vesicles
WO2024118500A2 (en) Methods for detecting and treating ovarian cancer
Morgan 14 Considerations in Estimating Genotype in Nutrigenetic Studies

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right